大数据的定义是什么?
2023-04-03 · 百度认证:重庆猪八戒网络有限公司官方账号
“大数据”(Bigdata)是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
1. 数据量:大数据通常指的是海量的数据,其数量级可以达到PB(Petabyte)或EB(Exabyte)级别。
2. 多样性:大数据不仅包括结构化数据,还包括半结构化和非结构化的各种类型的数据,如文本、图像、音频、视频等。
3.时效性:大部分大数据都是实时产生并流动着的,需要及时采集、存储和分析。
4. 复杂性:大部分大数据都具有复杂性,需要通过高级算法和技术进行挖掘和分析。
5.价值性:通过对大数据进行挖掘和分析,可以发现其中蕴含的商业价值和科学价值,并为决策提供支持。
对于大数据的定义,不同的角度有不同的定义:
研究机构Gartner对大数据定义:
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡对大数据定义:
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
Sandalwood大数据研究机构的定义:
Sandalwood对大数据的定义是:大数据是数据的集合,相较于取样数据的局限性,大数据具有客观、普适性强、反应迅速的特征,同时大数据对于数据模型具有更高的要求,高标准化、高质量、优化流程的处理模型,才能从中找到蕴含的大价值。
如果向普通人解释大数据,可借由一个例子:
如果你知道全世界有多少个苹果,那么这是一个数据。但如果你知道全世界每个苹果的品种、产地、颜色、大小、甜度、光照度、成熟周期等等数百项甚至数千项数据内容,那这就是大数据。
广告 您可能关注的内容 |