服务热线: 800-810-7388
MMC-ST系列,让飞行变得更简单。
MMC-ST系列,让飞行变得更简单。
MMC-ST系列,让飞行变得更简单。
MMC-ST系列,让飞行变得更简单。

DAR数据归档系统

随着数据爆炸性地增长及长时间累积,单位的关键业务系统积累了大量的历史数据,这些大量的历史数据使得这些系统变得越来越庞大,根据ZDNet的年度技术报告统计,2013年中国产生的数据总量超过0.8ZB(相当于8亿TB),2倍于2012年,相当于2009年全球的数据总量。预计到2020年,中国产生的数据总量将超过8.5ZB,而全球数据总量将超过45ZB。


为了应对爆发式的数据增长,北方数据公司提供了一种新的数据生命周期管理模式。对于非结构化数据,例如图片类型的文件进行OCR的识别,减少人工量;视频类型数据是做关键帧提取,提供在线预览功能,可以快速找到所需信息;文档类型的数据做全文筛选,利用智能算法,筛选出稳定关键词,并建立索引。同时,系统会对归档数据的元数据(属性信息)进行提取,有效的组织、分析和管理,存储到光盘库或者对象存储系统中。DAR系统对数据归档的整个过程进行监控和审计,帮助用户实现重要数据和历史数据的组织管理、资源共享、多级归档保存,提高生产系统的性能,适用于超大量的数据归档,如互联网AI数据归档、超算应用海量数据归档、HDFS产生的大量非结构化数据等。

DAR归档系统满足

数据的不断增长

随着大数据时代的来临,据IDC统计显示:企业中80%的数据都是非结构化数据,且数据每年都按指数增长60%。


管理成本和风险

数据大量产生的同时,也就意味着需要更多的存储空间。将大量重要、却又极少访问的数据文件存放在服务器中,既是对存储资源的浪费,又增加了数据丢失的风险。


法规遵从性

国家档案法规定,对于具有重要价值的电子文件,必须保存在耐久性好、脱机、一次擦写的载体中,并且一式3份,一份封存保管,一份供查阅使用,一份异地保存。


数据安全存储的“3-2-1”策略

“3-2-1”数据存储策略是国际存储界最新理念,可以简单归纳为:对于要长期存储的数据,至少要有 3 份拷贝,它们被存放在 2 种不同的物理介质上,其中1份必须是可移动的、离线的永久拷贝。


DAR归档系统典型应用

互联网AI应用

随着AI技术的产生,越来越多的互联网企业在利用AI技术便利的同时,产生了大量的非结构化数据,这些大量的数据具有非常重要的参考意义,需要做长期的保存,如果数据丢失将会对企业产生巨大损失。而常规的备份系统无法做到PB级的备份,且在使用数据时需要先恢复,然后再使用,恢复周期时间长。DAR归档系统可以做到海量数据的归档,后端存储支持蓝光光盘库、文件系统及阿里云等对象存储,在业务数据出现问题后,不用恢复,可以直接通过归档系统的查询窗口直接找到所需的数据,做到实时查看,无需恢复。


超算应用

超算是指超级计算机,目前中国有6座超算中心;是国家层面的战略意义,超算承担着大量的计算任务,数据以指数级增长。这些数据包含了极高的价值信息,对后续计算和测试及修正有很重要的意义。长期以来数据的管理理念,纸质信息的记录和数据保存有很大弊端,数据难以检索、信息比较分散、难以长久保存,数据的价值难以发挥。

DAR归档系统是一款分布式归档系统,给用户提供了透明的访问接口,把所有的非结构化数据利用大数据技术进行分析处理,做到信息全文检索、数据即查即用等特点,充分发挥数据的使用价值。


DAR归档系统特点 

SureSave DAR数据归档系统


实现重要数据保存副本,可以与业务系统无缝对接,将系统中产生的重要数据在归档系统中保存一份副本,即使在业务系统出现故障的情况下,也保证数据不丢失;

历史数据归档保存,将长期不使用或访问频率低的历史数据,迁移至归档系统,减轻业务系统的负担;

对归档的数据进行组织与管理,建立一套用户可透明访问的文件访问平台;

建立分级异质归档存储策略,采用蓝光光盘库作为数据归档介质,利用蓝光光盘保存时间长的特点,实现数据的长期保存,避免磁介质易损性。


全文检索

对Word、PDF、TXT等文档类型进行全文检索功能;不仅存储了信息,而且还有对全文数据进行词、字、段落等更深层次的编辑、加工的功能。


图片识别

采用OCR识别技术,可以自动提取图片要素,减轻工作量,减少重复劳动。例如计算机自动识别票据上的日期、帐号、金额等要素,通过银行事后监督系统与业务系统中的数据进行比较,完成传统的事后监督操作;配有印章验证系统后,自动将凭证图像中的印章与系统中预留的印鉴进行比较,完成印章的真伪识别。


视频剪辑

基于视频关键帧提取技术,视频片段微缩;节约用户的查询时间,快速了解视频内容。


文件预览

对特定格式支持文件在线预览无需下载,客户端只需要浏览器即可预览文件的内容。


数据安全

归档时可以通过设置归档数据的安全级别和组进行归档,如果设置非公开,则具有特殊权限的人,才可以查看到特殊权限的数据;可以设置归档数据的公开、私有、所属组,设置黑名单排除特定格式的归档数据,设置白名单仅归档特定格式的数据。保证归档的灵活性,也保证了数据的安全和隐私性。


数据恢复

归档系统对文件的属性,全部进行保存,作为归档的附属信息记录下来。当已经归档过的数据因为某些原因误删除了,可以通过归档系统把数据恢复出来,恢复过程仅对自己有权限的数据才能操作,无权限的数据无法恢复到本地。


应急接管

DAR归档系统不但充当着归档的角色,还担当着临时接管的角色。归档系统可根据现场环境,从归档角色快速切换到业务角色,应对业务突发状况。


异地容灾

大量非结构化数据,随着AI、超算产生的数据随指数级增长,这时异地容灾变的就非常重要。DAR归档系统通过在异地再建立一套归档系统,进一步提高数据的安全性。本地归档系统通过专用网络传输到异地的归档系统,实现异地归档容灾。


DAR归档系统优势

全文检索

智能算法分割数据

信息检索的彻底性

检索结果的准确性


图片识别

支持图像处理

图像文字识别

支持文字编辑


视频剪辑

支持在线播放

关键视频提取

快速了解视频内容

节约查询视频时间


在线预览

支持在线预览功能

客户端无需安装应用程序

支持常用的office文档在线预览


数据安全

归档数据权限和安全级别设置

设置白名单和黑名单增加归档灵活性

保证数据安全性和隐私性


数据恢复

归档数据信息全部保存

只能恢复有权限的数据

防止误删除保证数据完整性


应急接管

保证业务连续性

轻松应对突发状况

快速切换归档角色


异地容灾

异步队列系统

专用传输协议

保障数据安全


归档的价值

重要数据在归档系统保存完整的副本

给用户提供简单易用的文件访问平台

分布式部署,提高归档系统可持续性

长期不用的数据进行归档,减轻业务系统的压力




SureSave DAR归档系统

系统特性

系统架构

分布式集群架构

容量性能

多节点性能容量叠加,提供PB级容量与GB级带宽

客户端支持

Windows、Linux、

后端存储支持

蓝光光盘库、文件系统、阿里云等对象存储

软件特性

支持全文检索

图片识别技术

视频剪辑预览

支持文件预览

支持文件统计

支持文件恢复

支持应急接管

支持异地容灾

安全特性

日志审计

用户管理

缓存管理

数据校验

节点参数(每节点)

Node

处理器

Intel 4

缓存

8GB-192GB

标配主机接口

1×10GbE(可选GbE/Infiniband主机接口)

电源

800W 热插拔冗余电源

AC 100 - 240V,50Hz - 60Hz自适应

工作环境

温度:0℃ - 40℃

相对湿度:5% - 95%(非凝结环境)

尺寸(高x宽x深)mm

178 x 437 x 699

机架高度

4U

重量(不含硬盘及选件)

35kg


官方微信 手机云网站
友情链接
全球预订中心: 4006-971-972
 版权所有: ©2013 - 2016 无锡北方数据计算股份有限公司
犀牛云提供企业云服务