大数据有哪些常用的平台?
3个回答
展开全部
大数据有三个主要部分,分别是数学,统计学和计算机等学科。大数据基础知识往往决定了开发人员未来的成长高度,所以要重视基础知识的学习。
大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无法处理完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的各类技术。
扩展资料:
注意事项:
大数据的第一站就是收集和存储海量数据(公开/隐私)。现在每个人都是一个巨大的数据源,通过智能手机和个人笔记本释放出大量的个人行为信息。获取数据似乎已经变得越来越容易,数据收集这一模块最大的挑战在于获取海量数据的高速要求以及数据的全面性考虑。
传统商业智能在数据清洗处理的做法(ETL)是,把准确的数据放入定义好的格式中,通过基础的抽取统计生成高维度的数据,方便直接使用。然而大数据有个最突出的特征——数据非结构化或者半结构化。因为数据有可能是图片,二进制等等。数据清洗的最大挑战来了——如何转化处理大量非结构数据,便于分布式地计算分析。
参考资料来源:百度百科-大数据
美林数据技术股份有限公司
2023-08-27 广告
2023-08-27 广告
大数据分析软件有很多种,以下是一些常见的软件:1. Hadoop:一个开源分布式计算框架,用于处理和分析大规模数据。2. Spark:一个快速、通用的大数据分析引擎,支持Scala、Java、Python等多种编程语言。3. Hive:一个...
点击进入详情页
本回答由美林数据技术股份有限公司提供
2020-03-02 · 大数据人才培养的机构
加米谷大数据科技
成都加米谷大数据科技有限公司是一家专注于大数据人才培养的机构。公司由来自华为、京东、星环、勤智等国内知名企业的多位技术大牛联合创办。面向社会提供大数据、人工智能等前沿技术的培训业务。
向TA提问
关注
展开全部
大数据平台:是指以处理海量数据存储、计算和不间断流数据实时计算等场景为主的一套基础设施。
典型的包括Hadoop系列、Spark、Storm、Flink以及Flume/Kafka等集群。
典型的包括Hadoop系列、Spark、Storm、Flink以及Flume/Kafka等集群。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
常见的大数据平台有HDP,CDH和Apache的开源组件。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询