1、在大数据描述性分析应用阶段,应用的主要工作是()(8.5分)
1个回答
关注
展开全部
您好!在大数据描述性分析应用阶段,应用的主要工作包括:
- 数据采集:数据采集的意义在于真正了解数据的原始相貌,包含数据发生的时间、条件、格局、内容、长度、约束条件等。这会帮助大数据分析师更有针对性地控制数据生产和采集过程,避免因为违反数据采集规则导致的数据问题。同时,对数据采集逻辑的了解增加了数据分析师对数据的了解程度,尤其是数据中的异常变化。
- 数据存取:数据存取分为存储和提取两个部分。对于数据存储,大数据分析师需要了解数据存储内部的作业机制和流程。最核心的是,他们需要知道在原始数据基础上需要经过哪些加工处理,最终得到怎样的数据。
咨询记录 · 回答于2023-12-31
1、在大数据描述性分析应用阶段,应用的主要工作是()(8.5分)
在大数据描述性分析应用阶段,应用的主要工作是数据采集。数据采集的意义在于真正了解数据的原始相貌,包含数据发生的时间、条件、格局、内容、长度、约束条件等。这会帮助大数据分析师更有针对性地控制数据生产和采集过程,避免因为违反数据采集规则导致的数据问题。同时,对数据采集逻辑的了解增加了数据分析师对数据的了解程度,尤其是数据中的异常变化。
此外,数据存取也是大数据描述性分析应用阶段的重要工作。数据存取分为存储和提取两个部分。对于数据存储,大数据分析师需要了解数据存储内部的作业机制和流程。最核心的是,要知道在原始数据基础上需要经过哪些加工处理,最终得到怎样的数据。
# 数据提取
大数据分析师首先需求具有数据提取才能。
第一层是从单张数据库中按条件提取数据的才能。
第二层是把握跨库表提取数据的才能。
第三层是优化SQL句子,经过优化嵌套、挑选的逻辑层次和遍历次数等,减少个人时间糟蹋和系统资源消耗。
# 数据发掘
在这个阶段,大数据分析师要把握:
一是数据发掘、统计学、数学基本原理和知识。
二是熟练运用一门数据发掘东西,Python或R都是可选项。
三是需求了解常用的数据发掘算法以及每种算法的使用场景和优劣差异点。
# 数据分析
数据分析相关于数据发掘而言,更多的是偏向业务使用和解读。
当数据发掘算法得出结论后,怎么解说算法在结果、可信度、明显程度等方面关于业务的实践意义。
亲,您好,以上我为您解答的答案来源出自:百度知道