思为网络

+ 网站建设营销咨询:028-8608 0655
+ QQ咨询:361300450 19777182

热点文章

  • 2014年1月16日:中国网民规模突破6亿 互联网普及率达4
  • 微信公众号导航网站狂烧钱 塑造流量入口
  • 国内五大门户网站排名和竞争力:腾讯名列第一
  • 世界互联网大会:中国正从边缘成为主流
  • 俄罗斯搜索引擎Yandex:跟Google对着干
  • 苹果App Store将改革: 搜索加入竞价广告
  • 2014年7月全球搜索引擎市场:Google夺冠 份额被蚕食
  • 1.5亿元 莱茵体育收购中华网 继承china.com域名
  • 百度竞价排名整改--百度商业推广信息禁超页面30%
  • 2014年Q2中国搜索市场规模达147.3亿元 百度占81.
  • 2012年9月第一周国内搜索引擎网站排名:百度稳居第一
  • 京东的盈利困局:销售额飞速增长却持续亏损
  • 2016百度联盟峰会升级联盟贷 流量可变现还能贷款
  • B2B门户网站推广技巧
  • 谷歌应用商店Google Play下载量破150亿
  • 360搜索全面布局:地图搜索启用map.so.com域名
  • 阿里收购UC:在UC上花这么多钱划不划算?
  • 2013年美国移动广告市场规模将达72.9亿美元
  • IDC商美橙互联误屏蔽百度蜘蛛 致客户网站被K
  • CNNIC启动“姓名域名”方案 注册价比CN域名优惠
  • 艾瑞咨询:2011年中国B2C网站用户访问排名Top10
  • 国外案例告诉你:酒店O2O才是最好的家居卖场
  • 2013年1月首周国内域名网站Top15:万网居首 新网第二
  • 看淘宝商城如何过光棍节?
  • 百度去年净赚104亿 收入来源主要来自网络营销
  • 北京新网数码信息技术有限公司对于域名转出业务免费转移
  • 一寸数据一寸金 挖掘分析成未来趋势
  • 搜索引擎周回顾:佩奇说谷歌可爱不邪恶 李彦宏坚守搜索崇尚简单
  • 谷歌全球大小网站生存状况:处处被调查、制约
  • 淘宝商城占国内B2C市场近半份额
  • 大数据纷至沓来 数据保护“成人之美”

    来源:  时间:2012/10/8  点击:

      如果在百度谷歌去搜索“大数据”,你会发现,大数据包括三个V,第一个V数据量足够大;第二个V是指数据的种类非常多、结构复杂;第三个V则是对于数据的实时性要求非常高。所以,拥有大量的数据,能够快速将这些数据进行抽取,挖掘,分析,并且可供拥有者实时访问,调用,能够满足其实际需求,这就是大数据。

      大数据的出现与互联网的发展息息相关,从搜索引擎、社交网站到移动终端,互联网上的信息总量正以每年50%的增速不断膨胀,其中90%的信息来自近三年,包括每个月Facebook上分享的30亿条内容,每天12TB的Twitter信息,每天淘宝上超过30亿条店铺、商品浏览记录以及上千万的成交、收藏记录等等。据IDC统计,2011年全球所产生的数据总量是1.8ZB(10的21次方),如果把这些数据刻录到CD此片中门起摞起来的高度等于地球到月球的距离!

      大数据没有限定的数量,比如多少TB,或者EB的数据。若是中小企业用户,可能企业内部只有十几、二十几个人,那么十个TB对这个企业来说就是大数据了,所以大数据的概念因人而异。工信部十二五的物联网规划引人注意,其中包括海量级的数据存储,数据挖掘,图象视频的智能分析,以及信息感知和信息传输,这些规划提供了一个警示信号,即大数据是未来的发展方向,所以在此后的一段时间内,热门话题会是大数据、云存储、以及对象存储。这些都是在存储或者计算领域热门的话题。

      大数据——数据管理“令人不安”

      “大数据”是大势所趋。纵观整个数据市场,甚至存储市场,用户的数据量正呈现出爆炸式的增长态势。大概四、五年前,一个邮件系统用终端存储就可以满足一个中等规模企业的需要,数据量大概在30-50T。随着企业员工数量逐年增长,邮件系统的空间也呈爆炸式增长,由于人员沟通之间邮件更容易成为沟通的桥梁,邮件的附件越来越大,邮件系统的数据量亦随之水涨船高。现在该企业的数据量恐怕已增长到2.5PB甚至更多,需要添置一台存储设备或是几台储备设备做邮件系统,可见存储需求量增长之快。

      尽管大数据的产生多半是因为企业发展及数据产生的种类多元化这个“大环境”所致,但是面对这些快速增长的大数据所暴露出的问题还是让企业管理者们不安。到底该如何管理这些大数据?如何进行安全有效的保护?出现问题时怎样进行恢复?这些都是企业待解的难题。

      第一、在大数据愈演愈烈之时,对于企业来说,如何经济、高效访问数据值得探讨。并非购买了最高端的存储,更昂贵的备份存储就可以高枕无忧,如何经济、高效的访问数据才是企业目前需要研究的课题之一。通常情况下,按照数据被访问频率的高低,可以将这些大数据分为热数据和冷数据,热点数据放在昂贵的介质上没有任何异议,但是冷数据放在昂贵的介质上面则会导致IT建设成本上升,是一种浪费。所以如何将冷、热数据进行分层存储,既能优化存储系统的性能,又可以有效地降低存储系统的整体拥有成本,实现一举两得是企业的突破方向。

      第二,如何组织、检索、存储、处理分析这些大数据。最近开展的题为“大数据:商业领袖们的经验”的全球调查发现,稿营收企业的成功与明确的数据战略之间有着极强的关联性。大数据的时代迎面袭来,企业重视大数据的潜在价值只是一个良好的开始,如何应对海量数据在管理方面的挑战才是企业至关重要的策略之一。

      第三,数据备份。数据备份可谓“老生常谈”,大家一直在谈数据需要备份,备份是企业最后的保障、最后的一个利器,可以保护企业的系统依然有数据可用。10年前的“9.11”事件,早给过我们惨痛的教训:世贸中心中大约2/3企业因为未做数据备份而导致彻底倒闭。无独有偶,就在前不久前,雅虎日本服务器系统发生故障,导致近5700家企业数据丢失,除了小林制药这样日常进行数据备份的用户可以在几天之内恢复数据外,其他用户的数据绝无回复的可能,其损失可谓“惨重”。一个企业的数据信息决定着企业的生死存亡。但是今天,数据量的持续增长增加了备份和恢复的时间,是企业面临着严重的合规和宕机风险,数据备份却越来越困难。用户数据量越来越大,备份时间窗口又那么小,设备又是有限的,怎样快速把大数据中的核心数据抽取出来,保障企业数据信息能够适时进行恢复,成为企业CIO们共同考量的当务之急。

      第四、重复数据删除。由于存储经理们继续降低备份数据量,重复数据删除技术从而一度成为热门的技术,但尽管这个话题已经“风靡”了多年,近三、五年的时间大家都在讲重复数据的删除。基本上主流的厂商和用户能够接受的还是把带库删除。如周一到周五的数据一样,就把重复的数据删掉,以后每天把增量的数据保存。但是有一些厂家也提倡在线存储删除,这也可行。只是现在某些技术尚不完全成熟,所以现在的重复数据删除重点还是在备份领域涉猎较多。

      第五,如何节省电力、节约空间、节约成本等。面临数据爆炸式增长带来的问题,我们将怎么样节省电力、空间、成本呢?近几年企业在采购存储时,会发现存储硬件的成本在逐年走低。回顾过去,硬盘价格都是高高在上的,而现在不管是传统的机械硬盘还是SSD(固态硬盘)都开始变得越发“亲民”,而价格更低的同时容量却更高了。但是,对于很多企业来说,整体的存储成本却不降反升,原因就是存储的管理成本在逐年走高。因为大数据的接茬大涨需要大量的人力管理和维护,所以如何节约IT资源,减少IT人员的压力等也是现在企业需要考虑的因素。

      随着大数据时代的到来,数据信息日益重要,数据保护问题日渐突出,各种灾难性事件给用户敲醒很多警钟。数据保护,数据的容灾是非常重要的话题。以前的数据容灾,都是拿盘阵来做,从A复制到B,A坏了到B上去,是一个“有甚于无”的方案,属于一种保护机制。但是今天的企业要求更加完善的数据保护系统,很多企业已经开始完成了备份数据的容灾。所以,在备份数据方面企业会面临很多问题,比如生产系统一般都是在白天运行,或者高峰是在白天去运行,夜间可能有三、五个小时时间窗口,这些窗口怎样在最短时间之内把尽可能做的数据备份出来,是用户面临的问题。

      另外是灾难恢复。当发生灾难能否通过盘阵的方式、通过备份的方式恢复数据。现在很多企业非常关注的是,能否把分支机构也保护起来。例如,国美大中苏宁,这种零售企业,在全国每一个省都会有很小的数据中心或是小型机房。里面有独立的一些数据,这些数据能否集中备份到总部统一保护起来,以最低的成本保护这些“大数据”。

      最后就是恢复的时间问题。很多企业在考虑备份时往往会忽略这点,从而导致发生灾难或是意外事件时数据恢复时间过长,严重影响企业生产系统的正常运行。所以,大数据的挑战就是备份的窗口。

      大数据在给行业带来巨大商业价值的同时也带来了一系列的“疑难杂症”,面对这些大困惑,我们又该如何应对呢?

      谈到大数据,现在很多企业都有若干个分支机构,以前用户对分制机构进行保护的时候拿盘阵来做或者拿物理磁带通过汽车搬运到其他地方,这样做既增加人力又消费时间,而且效率很低,恢复起来效果也特别差。所以,大数据环境下的数据保护是一个非常完整的解决方案,譬如,企业拥有一个很小的分支机构,可能是一个分公司或者是其中一个站点。数据会很多,企业有可能各分机构也有一个虚拟带库设备,如果是很小的分支机构,有虚拟的带库设备,可以先备份当中,然后有这个设备自动的通过很窄的广域网复制到虚拟带库里面去。如果企业的数据中心没有这样的虚拟带库设备,要减少成本,而只有服务器,也没有任何问题,只要自动的把数据在源端进行重复数据的删除,删除完成以后,将这些重复数据删除以后的数据远端传到总部的数据中心,这样来实现数据保护,同时企业还可以再复制另外一份,从一个数据中心复制到另外一个数据中心,而且这个复制过程是不需要把数据做完整性恢复的。A到B传递数据的时候,已经把重复数据删掉传过去,但是对于重复数据删除1.0的技术来说,要把这一份数据传过去要恢复成完整的数据,以前需要有一个服务器,把所有的完整数据算出来以后才能够传到另外一个上面,现在企业需要做的只需要传递一份数据,而且是没有重复的,这会大大降低企业在数据保护上的成本。

      小结:

      在大数据时代,尽管这些快速增长的海量数据所引发的一系列蹩脚问题,足以让CIO们感到炙手可热,但是管理这些数据所带来的几多挑战并不能令人窒息。完整的数据保护解决方案或许能够成为“成人之美”的一剂良药。毕竟,实践是检验真理的唯一标准,这的确是不易之论……

    .
    Tags:     
    Web URL:http://www.sw996.com/article/news/20121008102415.html   收藏此文  打印此文
  • 上一篇:周鸿祎:手机和搜索是两场无法回避的战争
  • 下一篇:百度:免费午餐为哪般 挥金如土只为“端”
  • 相关文章列表

  • 《互联网新闻信息服务管理规定》全文发布,6月1日起施行
  • 李彦宏说要降维打击移动互联网 你恐慌了吗?
  • 2016百度联盟峰会升级联盟贷 流量可变现还能贷款
  • 苹果App Store将改革: 搜索加入竞价广告
  • 百度竞价排名整改--百度商业推广信息禁超页面30%
  • 1.5亿元 莱茵体育收购中华网 继承china.com域名
  • 世界互联网大会:中国正从边缘成为主流
  • 2014年7月全球搜索引擎市场:Google夺冠 份额被蚕食
  • 2014年Q2中国搜索市场规模达147.3亿元 百度占81.7%
  • 谷歌推出企业工具:整合搜索地图等服务
  • 阿里收购UC:在UC上花这么多钱划不划算?
  • “百度动物园”尝试O2O新模式 典当行业试水O2O
  • 国外案例告诉你:酒店O2O才是最好的家居卖场
  • 借力移动互联网 美国互联网公司再掀入华高潮
  • 新浪微博活跃度堪忧:仅5%用户发原创内容