北京列举网 > 教育培训 > 电脑/网络 > 好程序员什么是大数据
北京
[切换城市]

好程序员什么是大数据

更新时间:2017-11-17 09:49:07 浏览次数:236次
区域: 北京 > 海淀 > 清河
类别:软件工程师培训
地址:海淀区宝盛里天丰利商城三层
  随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

  “大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。

  大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……

  截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。

  大数据数据转化率

  个案一

  做家具生产的厂家,通过大数据分析推广,微信,自媒体,实体店铺的数据统计,实现产品分类,那类产品比较好,那类产品不好,还通过大数据发掘出来上季度销售额比例占70%的新客户。通过大数据的使用,是上季度的销售额超过上半年的总额度。使工厂在逆境中实现盈利

  四大特征

  数据量大(Volume)

  个特征是数据量大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。

  类型繁多(Variety)

  第二个特征是数据类型繁多。包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。

  价值密度低(Value)

  第三个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。

  速度快时效高(Velocity)

  第四个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘显著的特征。

  既有的技术架构和路线,已经无法处理如此海量的数据,而对于相关组织来说,如果投入巨大采集的信息无法通过及时处理反馈有效信息,那将是得不偿失的。可以说,大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。
北京电脑/网络相关信息
办公软件培训
平谷-平谷城区
14小时前
办公软件培训
平谷-平谷城区
4月11日
办公软件培训
平谷-平谷城区
4月9日
办公软件培训
平谷-平谷城区
4月7日
4月1日
注册时间:2017年11月02日
UID:438687
---------- 认证信息 ----------
邮箱已认证 手机已认证
查看用户主页