大数据中的数据量大,就是指的

大数据中的数据量大,就是指的,第1张

数据据说来自阿尔文·托夫勒在20世纪70年代的著作《第三次浪潮》。全球知名咨询公司麦肯锡率先提出大数据时代的到来。麦肯锡表示,“数据已经渗透到每个行业和商业功能领域,成为重要的生产要素。人们对海量数据的挖掘和应用,预示着新一波生产力增长和消费者剩余的到来。”

目前有专业人士将大数据归纳为四个特征,即“4V”:体量大,数据量级从TB(1012字节)发展到PB甚至ZB,可以称之为海量、巨大甚至过度;可变,数据类型多样,多为网页、图片、视频、图像、位置信息等半结构化和非结构化数据信息;速度,数据流往往是高速实时数据流,往往需要快速连续的实时处理。处理工具也在快速进化,可能会涉及到软件工程和人工智能。低值密度(值)。以视频安防监控为例。在连续的监控流中,有巨大价值的数据流可能只有一两秒钟,最有价值的图像信息可能在360度全方位视频监控的“死角”被挖掘出来。

大数据有多大?例如,欧洲研究组织进行的核试验每秒可以产生40TB的数据。一组名为《互联网上的一天》的数据告诉我们,一天之内,互联网产生的所有内容可以刻成1.68亿张DVD;发出的邮件多达2940亿封,相当于美国两年的纸质信件数量;200万社区帖子,相当于《时代》周刊770年的写作量;售出的手机数量为37.8万部,高于全球每天出生的婴儿数量37.1万……到2012年,数据量已经从TB(1024GB=1TB)跃升到PB(1024TB=1PB)、EB(1024PB=1EB),甚至ZB(1024EB=1ZB)。随着计算机硬件成本、计算机内存成本的降低和超级集群计算机的出现,使得处理大规模复杂数据成为可能,从而产生结构化(股票交易数据)、半结构化(web日志)和非结构化(文本数据、音频数据、视频数据)的大数据。其中,非结构化数据占互联网数据总量的80%。

《大数据时代》的作者维克多·迈尔-勋伯格(Victor Mayer-schoenberg)说,“每个人都在谈论大数据。它有多大?说到zb字节有多少信息量?当我们说10的21次方是什么意思?这是什么意思?它是如何工作的?1987年,他还在上大学的时候,数据世界还没到30亿gb,2007年增长到3000亿gb,20年数据增长了100倍。如果追溯历史,上一次数据增长如此之快是因为印刷革命,用了50年才实现了数据增长的两倍。现在20年就实现了。”

根据IBM的研究,整个人类文明获得的所有数据中,有90%是在过去两年内产生的。到2020年,全球产生的数据量将达到现在的44倍。每天全球上传超过5亿张图片,每分钟分享20小时视频。然而,即使是人们每天创造的所有信息——包括语音通话、电子邮件和信息在内的各种通信,以及所有上传的图片、视频和音乐——也无法与人们每天创造的数字信息量相匹配。这一趋势将继续下去。

欢迎分享,转载请注明来源:聚客百科

原文地址: http://juke.outofmemory.cn/life/690495.html

()
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-07-11
下一篇 2022-07-11

发表评论

登录后才能评论

评论列表(0条)

保存