大数据是什么?
9个回答
2021-03-25 · 大数据人才培养的机构
加米谷大数据科技
成都加米谷大数据科技有限公司是一家专注于大数据人才培养的机构。公司由来自华为、京东、星环、勤智等国内知名企业的多位技术大牛联合创办。面向社会提供大数据、人工智能等前沿技术的培训业务。
向TA提问
关注
展开全部
首先用一个调查数据来展示大数据的“大”。在2011年的时候,全世界的数据规模已经达到了1.8ZB,这个数据可能听起来不够具象化,通俗一点的来说,它可以填满575亿个32GB的iPad,而这些iPad可以在中国修建两座长城。仅仅经过大约十年左右,到2020年的时候,全球的数据已经达到了40ZB。而由人类自身所创造的这些数据已经超出了人类所力所能及处理的范畴。如何管理和使用这些数据,开始成为了一个新兴的领域,大数据也就随机出现。
大数据有四个特性,第一个就是高容量,也就是说一定要“大”,至于需要大到什么程度呢,就是要以TB往上走。第二个就是多样化,是区别于以往海量数据挖掘的最主要特征。它有两层含义,一是数据来源多样化,系统数据、设备日志、传感器、文件系统等等来源。二是数据结构多样化,这是核心特征!要包含结构化数据、非结构数据。
第三个是即时效性,基本上至少也要达到亿级数据一秒查询,做的比较好的可以达到千亿级数据一秒查询。这个特征几乎决定了传统技术架构无法满足要求,因此Hadoop架构的出现催化了大数据的发展,也是有人认为Hadoop就是大数据的原因。第四个是价值,数据一定要有价值、而后才能产生价值。就好比存商品的叫才能仓库,存垃圾的叫垃圾填满坑一样。没价值的数据就像一个垃圾填满坑,这也是为什么数据治理在大数据实施中非常重要的原因之一。
大数据有四个特性,第一个就是高容量,也就是说一定要“大”,至于需要大到什么程度呢,就是要以TB往上走。第二个就是多样化,是区别于以往海量数据挖掘的最主要特征。它有两层含义,一是数据来源多样化,系统数据、设备日志、传感器、文件系统等等来源。二是数据结构多样化,这是核心特征!要包含结构化数据、非结构数据。
第三个是即时效性,基本上至少也要达到亿级数据一秒查询,做的比较好的可以达到千亿级数据一秒查询。这个特征几乎决定了传统技术架构无法满足要求,因此Hadoop架构的出现催化了大数据的发展,也是有人认为Hadoop就是大数据的原因。第四个是价值,数据一定要有价值、而后才能产生价值。就好比存商品的叫才能仓库,存垃圾的叫垃圾填满坑一样。没价值的数据就像一个垃圾填满坑,这也是为什么数据治理在大数据实施中非常重要的原因之一。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
大数据是高速收集、处理海量、多样的数据,以提取出高价值信息的统计技术。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
挨踢行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量,高增长率和多样化的信息资产!
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询