在大数据时代,关系型数据库有哪些缺点
2个回答
2018-07-05 · 培养卓越DT工程师
关注
展开全部
大数据的发展存在一个节点,及互联网同步现实世界信息的占比,是否达到较为全面反映现实世界的运行规律。越过这个比率,研究大数据就会有价值,反之,研究大数据只会得到失真的结论。所以大数据存在虚拟化的最小值。
1)信号噪声增大
当审视数据当中的某个表象的时候,常常需要考虑这种表象是否是偶然产生的。如果这种表象看起来不太可能是随机产生的时候,就称“统计上显著的”。如果做足够多不同的相关性测试,偶然产生的结果就会淹没真实的发现。有很多办法可以解决上述的问题,然而在大数据中这种问题会更加严重。和一个小规模的数据集合相比,大数据的情况下有太多可以用作比较的标准。如果不做仔细的分析,那么真实的表象与虚假表象之比——相当于信号噪声比——很快就会趋近于0。
2)数据型“干草垛”
纳西姆.塔勒布(Nassim Taleb)提出:随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。在这个庞大的“干草垛”里,我们要找的那根针被越埋越深。大数据时代的特征之一就是,“重大”发现的数量被数据扩张带来的噪音所淹没。
3)直觉的价值
如果每个人都求助于数据,都利用大数据工具的话,那么不可预测性——例如人类的本能、冒险、意外甚至失误——也许将会成为差异的关键。如果真是这样的话,那么需要专门为人为因素辟出一席之地——即为直觉、常识、运气留出空间,以确保它们不会被数据和机器生成的答案挤走。
4)数据不懂社交
大脑在数学方面很差劲(请迅速心算一下437的平方根是多少),但是大脑懂得社会认知。人们擅长反射彼此的情绪状态,擅长侦测出不合作的行为,擅长用情绪为事物赋予价值。在社交关系的决策中,情感大于数据。
5)数据不懂背景
人们擅长讲述交织了多重原因和多重背景的故事。数据分析则不懂得如何叙事,也不懂得思维的浮现过程。即便是一部普通通的小说,数据分析也无法解释其中的思路。
6)数据偏爱潮流
当大量个体对某种流行产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。一些重要的(也是有收益的)产品在一开始就被数据摈弃了,仅仅因为它们的特异之处不为人所熟知。
7)褒贬分析的局限
褒贬分析只提供舆情的一个概览,它本身并不是 actionable insights。褒贬舆情太过抽象,不能提供有价值的情报。
8)理解为主,解释为辅
大数据是一种资源和一种工具。它的目的是告知,而不是解释。意在促进理解,但仍然会导致误解——关键在于人们对它的掌握程度。人们必须以一种不仅欣赏其力量,而且承认其局限的态度来接纳这种技术。
9)宜预测,不宜总结
大数据分析不宜做回顾,更适合做预测。
10)小决策和大决策
对于大批量的小决策,相关性是有用的,如亚马逊的个性化推荐。而对于小批量的大决策,因果性依然重要。大数据不是决策的唯一依据,只是依据之一。正确的决策必须综合各种信息来源
1)信号噪声增大
当审视数据当中的某个表象的时候,常常需要考虑这种表象是否是偶然产生的。如果这种表象看起来不太可能是随机产生的时候,就称“统计上显著的”。如果做足够多不同的相关性测试,偶然产生的结果就会淹没真实的发现。有很多办法可以解决上述的问题,然而在大数据中这种问题会更加严重。和一个小规模的数据集合相比,大数据的情况下有太多可以用作比较的标准。如果不做仔细的分析,那么真实的表象与虚假表象之比——相当于信号噪声比——很快就会趋近于0。
2)数据型“干草垛”
纳西姆.塔勒布(Nassim Taleb)提出:随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。在这个庞大的“干草垛”里,我们要找的那根针被越埋越深。大数据时代的特征之一就是,“重大”发现的数量被数据扩张带来的噪音所淹没。
3)直觉的价值
如果每个人都求助于数据,都利用大数据工具的话,那么不可预测性——例如人类的本能、冒险、意外甚至失误——也许将会成为差异的关键。如果真是这样的话,那么需要专门为人为因素辟出一席之地——即为直觉、常识、运气留出空间,以确保它们不会被数据和机器生成的答案挤走。
4)数据不懂社交
大脑在数学方面很差劲(请迅速心算一下437的平方根是多少),但是大脑懂得社会认知。人们擅长反射彼此的情绪状态,擅长侦测出不合作的行为,擅长用情绪为事物赋予价值。在社交关系的决策中,情感大于数据。
5)数据不懂背景
人们擅长讲述交织了多重原因和多重背景的故事。数据分析则不懂得如何叙事,也不懂得思维的浮现过程。即便是一部普通通的小说,数据分析也无法解释其中的思路。
6)数据偏爱潮流
当大量个体对某种流行产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。一些重要的(也是有收益的)产品在一开始就被数据摈弃了,仅仅因为它们的特异之处不为人所熟知。
7)褒贬分析的局限
褒贬分析只提供舆情的一个概览,它本身并不是 actionable insights。褒贬舆情太过抽象,不能提供有价值的情报。
8)理解为主,解释为辅
大数据是一种资源和一种工具。它的目的是告知,而不是解释。意在促进理解,但仍然会导致误解——关键在于人们对它的掌握程度。人们必须以一种不仅欣赏其力量,而且承认其局限的态度来接纳这种技术。
9)宜预测,不宜总结
大数据分析不宜做回顾,更适合做预测。
10)小决策和大决策
对于大批量的小决策,相关性是有用的,如亚马逊的个性化推荐。而对于小批量的大决策,因果性依然重要。大数据不是决策的唯一依据,只是依据之一。正确的决策必须综合各种信息来源
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
关系型数据库的主要特征
1)数据集中控制,在文件管理方法中,文件是分散的,每个用户或每种处理都有各自的文件,这些文件之间一般是没有联系的,因此,不能按照统一的方法来控制、维护和管理。而数据库则很好地克服了这一缺点,可以集中控制、维护和管理有关数据。
2)数据独立,数据库中的数据独立于应用程序,包括数据的物理独立性和逻辑独立性,给数据库的使用、调整、优化和进一步扩充提供了方便,提高了数据库应用系统的稳定性。
3)数据共享,数据库中的数据可以供多个用户使用,每个用户只与库中的一部分数据发生联系;用户数据可以重叠,用户可以同时存取数据而互不影响,大大提高了数据库的使用效率。
4)减少数据冗余,数据库中的数据不是面向应用,而是面向系统。数据统一定义、组织和存储,集中管理,避免了不必要的数据冗余,也提高了数据的一致性。
5)数据结构化,整个数据库按一定的结构形式构成,数据在记录内部和记录类型之间相互关联,用户可通过不同的路径存取数据。
6)统一的数据保护功能,在多用户共享数据资源的情况下,对用户使用数据有严格的检查,对数据库规定密码或存取权限,拒绝非法用户进入数据库,以确保数据的安全性、一致性和并发控制。
1)数据集中控制,在文件管理方法中,文件是分散的,每个用户或每种处理都有各自的文件,这些文件之间一般是没有联系的,因此,不能按照统一的方法来控制、维护和管理。而数据库则很好地克服了这一缺点,可以集中控制、维护和管理有关数据。
2)数据独立,数据库中的数据独立于应用程序,包括数据的物理独立性和逻辑独立性,给数据库的使用、调整、优化和进一步扩充提供了方便,提高了数据库应用系统的稳定性。
3)数据共享,数据库中的数据可以供多个用户使用,每个用户只与库中的一部分数据发生联系;用户数据可以重叠,用户可以同时存取数据而互不影响,大大提高了数据库的使用效率。
4)减少数据冗余,数据库中的数据不是面向应用,而是面向系统。数据统一定义、组织和存储,集中管理,避免了不必要的数据冗余,也提高了数据的一致性。
5)数据结构化,整个数据库按一定的结构形式构成,数据在记录内部和记录类型之间相互关联,用户可通过不同的路径存取数据。
6)统一的数据保护功能,在多用户共享数据资源的情况下,对用户使用数据有严格的检查,对数据库规定密码或存取权限,拒绝非法用户进入数据库,以确保数据的安全性、一致性和并发控制。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |