大容量数据高速备份方法研究

上传人:众众****夺宝 文档编号:205519768 上传时间:2023-04-29 格式:DOCX 页数:5 大小:14.20KB
收藏 版权申诉 举报 下载
大容量数据高速备份方法研究_第1页
第1页 / 共5页
大容量数据高速备份方法研究_第2页
第2页 / 共5页
大容量数据高速备份方法研究_第3页
第3页 / 共5页
资源描述:

《大容量数据高速备份方法研究》由会员分享,可在线阅读,更多相关《大容量数据高速备份方法研究(5页珍藏版)》请在装配图网上搜索。

1、大容量数据高速备份方法研究简要:摘 要: 随着社会信息化的高速开展,地理空间数据呈海量增长,给数据存储和管理带来了巨大的挑战。本文在对河北省地理信息数据存储现状研究的根底上,基于传统的 SAN 存储架构,摘 要: 随着社会信息化的高速开展,地理空间数据呈海量增长,给数据存储和管理带来了巨大的挑战。本文在对河北省地理信息数据存储现状研究的根底上,基于传统的 SAN 存储架构,制定了备份策略,开发了智能磁盘读写引擎,使用读写引擎整合数据,建立特征库,对重复数据采用镜像存储,实现了快速高效的数据备份,为大容量数据备份提供了切实可行的技术手段。本文源自科技风 发表时间:2022-02-19 ?科技风?

2、(半月刊)创刊于1988年,是经科技部和国家新闻出版总署批准的大型综合类科技期刊。成立至今,经过几十年开展,现设有北京、石家庄两个运营中心,业务范围涵盖期刊出版、网络传播、公关咨询、讲座培训、出版效劳等多个领域,聚合了大批相关领域的专家学者及一线专业工作人员,特别是在教育科技、科学学科和汽车科技领域有着广泛影响。关键词: 数据; 备份; 读写引擎; 研究1 绪论随着社会信息化的高速开展,人们每时每刻都在产生不可估量的信息数据,随着卫星导航技术和物联网技术的广泛应用,从空天地专业传感器扩展到物联网中无所不在的非专业传感器,数据获取传感器网形成庞大的空天地传感器资源,产生前所未有的时空大数据。特别

3、是卫星遥感大数据、城市实景地图、出行轨迹大数据等地理空间数据正呈海量增长,给数据存储和管理带来了巨大的挑战。数以 TB 级的数据备份需要超长时间,数据备份成为一件费时费力的事情,同时,经统计,在备份的数据中,重复的地理信息数据占了较大的比重,存储管理的本钱也随着数据的剧增急剧增加。网络备份系统的研究和开发,开始于 20 世纪 80 年代中期,目前国内被采用最多的备份策略主要有以下两种:( 1) 完全备份。即定期对全部数据进行完整备份。这种方法直观简单,缺点是所需时间长,所占磁盘存储空间大; 优点是恢复时间短,操作简便。2) 增量备份。即只备份上一次备份后增加和修改正的数据。由于没有重复的备份数

4、据,节省了磁盘空间和缩短了备份时间,缺点是一旦发生灾难,恢复数据比拟困难。目前河北省地理信息数据备份主要采用传统数据管理方式,以完全备份为主增量备份为辅,在数据管理和更新的过程中缺乏有效的技术手段,随着地理信息数据的不断增加,文件数量多,数据量大,在对数据进行上传、下载和查询的过程中需要消耗大量的时间本钱,严重影响了地理信息数据管理的工作效率。大容量数据高速备份方法研究,通过对地理信息数据的管理及存储现状的研究,标准了现有数据的存储模式,制定了数据存储方案,研发了适用于目前系统平台的文件智能存储系统,通过智能磁盘读写引擎,对现有的各种数据进行整合,在备份数据时对数据文件的特征进行分析,根据备份

5、数据的特征,自动采用不同的备份方案,应用重复数据检索技术,通过智能计算,将重复的大体积的文件,进行镜像存储,在存储系统中对重复的数据仅存储一个数据副本,对于副本以外的重复数据采用指向副本指针的方法来有效消除其他副本,加快拷贝速度,减少数据上传更新、下载和查询中的时间本钱,采用技术手段实现了对地理信息数据存储的有效管理。2 研究方法及内容2.1 研究对象省级地理信息数据主要包括卫星图像、遥感数据、三维激光扫描数据、倾斜摄影测量数据、三维模型、4D 产品、瓦片数据等地理信息数据,目前采用 SAN 存储架构( Storage Area Network 即“存储区域网络) ,存储于磁盘阵列和磁带库中,

6、这种架构是当前最成熟的集中存储系统,使用光纤存储交换机将存储设备和主机系统通过光纤连接起来,通过前端文件效劳器对 SAN 存储系统进行管理,存储的卫星图像、遥感数据等地理信息数据全部以 Windows 目录及文件的形式进行管理,采用本地复制和远程传输的手段对地理信息数据进行更新和管理。2.2 架构设计2.2.1 系统架构鉴于系统的使用、维护、升级、数据传输等相关情况,在程序架构上,采用 C/S 模式的基于网络的应用程序架构。效劳器采用稳定、高效的 Microsoft Windows 2022 操作系统作为平台,使用 DELPHI 语言描述系统业务逻辑。2.2.2 智能存储引擎设计根据数据文件的

7、特征,在文件拷贝的过程中,进行文件的特征分析,生成数据文件特征库,通过智能计算,将重复的大体 积 的 文 件,进 行 镜 像 存 储,加 快 拷 贝 速 度,节 省 时 间本钱。系统部署前对原有数据进行统一更新,并生成数据信息及数据特征库,初步生成系统信息库。后期对新数据更新时,需要和数据内已有数据内容进行比照分析,如系统内不存在内容相同的数据,那么对数据进行上传和记录更新操作。系统内存储内容相同的数据,数据不再进行上传操作,只生成相应的更新记录。2.3 软件功能智能存储系统主要解决文件存储过程中大文件重复存储的问题,利用先进的文件检测算法,快速识别重复文件,同时提高了文件的拷贝速度。具体功能

8、如下:存储管理: 接管操作系统磁盘文件管理功能。对磁盘文件进行扫描,建立文件指纹库。文件输入: 外部文件可通过拖拽或者复制粘帖方式拷贝进智能存储系统,并存储到磁盘。对于磁盘中存在的大文件,只建立链接,不重复存储。文件输出: 通过智能存储系统的导出功能将文件拷贝到其他存储介质,复原被链接的文件。用户管理: 管理员用户可以添加、修改、删除用户。日志管理: 记录用户的操作日志3 系统测试3.1 测试方法智能文件存储系统具有严格、详细的数据特征库,对数据文件的内容进行详细比照并生成特征库,确保数据文件在系统中的唯一性。在数据上传的过程中对数据进行比照分析,根据系统规那么和分析结果对上传数据采取不同的处

9、理方式。根据测试内容的测试项,分别对测试文件 1( 1.32GB) ,测试文件 2( 1.62MB) ,测试文件夹 1,测试文件夹 2( 含 70M 文件,主要测试在文件夹内的大文件是否可以按规那么处理) ,进行数据上传和导出功能测试,测试步骤如下:文件进行上传测试。在不同目录对文件进行上传测试。相同目录对文件进行上传测试。文件和数据指针文件进行导出测试。3.2 测试结果本次测试对智能文件存储系统的核心功能即数据处理功能进行了验证,主要验证结果如下: 1) 小于 10M 的文件处理功能。直接上传: 目录内无相同文件名的文件直接上传。覆盖上传: 目录内有相同文件名的文件做覆盖处理。 ( 2) 大

10、于 10M 的文件处理功能。直接上传: 系统内无相同数据特征的文件直接上传。生成指针文件: 系统内数据特征库进行比照,如有相同特征的文件不对真实文件进行上传,同时生成数据指针文件。实际文件: 直接进行导出。指针文件: 导出真实文件内容。与传统数据备份方式相比,本系统在原 SAN 存储框架的根底之上,引入了智能磁盘读写引擎,使用读写引擎将数据进行整合; 备份数据和文件数据分析同时进行,大大缩短了拷贝时间,增加了大容量数据备份效率; 同时,考虑到大容量地理信息数据种类繁杂重复较多的特点,系统平台对重复数据采用镜像存储,加快了存储速度,减少了时间本钱。比照传统平台单纯的存储和提取操作,本系统增加了条目记录功能,每次数据上传、更新、索引操作都会更新相应条目,使操作更加简洁、高效。4 结论大容量数据高速备份方法研究,为海量地理信息数据的备份提供了有效可行的技术方法,通过研究成果的应用,加快了地理信息数据存储和传输的速度,节约了时间本钱,在地理国情普查、根底测绘生产、数字城市建设、室内混合智能定位等重大工程中,有效地提高了海量数据的效劳效率; 同时,研究成果的应用,降低了存储空间,节约了设备购置本钱,提高了设备性能,促进地理信息更高效地为社会效劳。本课题的研究成果适用于海量数据的备份工作,在这个大数据的时代,可广泛推广至有需求的各行业,其应用前景广阔。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!