除了spark还有哪些大数据处理

 我来答

2个回答

#热议# 为什么说不要把裤子提到肚脐眼？

加米谷大数据科技
2019-01-24 · 大数据人才培养的机构

加米谷大数据科技

成都加米谷大数据科技有限公司是一家专注于大数据人才培养的机构。公司由来自华为、京东、星环、勤智等国内知名企业的多位技术大牛联合创办。面向社会提供大数据、人工智能等前沿技术的培训业务。

向TA提问

关注

展开全部

Hadoop

Apache开源组织的一个分布式计算框架，提供了一个分布式文件系统 (HDFS)、MapReduce分布式计算及统一资源管理框架（Yarn）的软件架构。

HBase

是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

kafka

Apache旗下的一个高性能，高吞吐量的分步式消息总线系统。

Storm

一个分布式的、容错的实时计算系统。使用Storm进行实时大数据分析。

Flink

可扩展的批处理和流式数据处理的数据处理平台，设计思想主要来源于Hadoop、MPP数据库、流式计算系统等，支持增量迭代计算。

Spark

专为大规模数据处理而设计的快速通用的计算引擎。

已赞过 已踩过<

评论收起

ZESTRON
2024-09-04 广告

在Dr. O.K. Wack Chemie GmbH，我们高度重视ZESTRON的表界面分析技术。该技术通过深入研究材料表面与界面的性质，为提升产品质量与可靠性提供了有力支持。ZESTRON的表界面分析不仅涵盖了相变化、化学反应、吸附与解吸... 点击进入详情页

本回答由ZESTRON提供

百度网友511545
2017-09-29 · 超过45用户采纳过TA的回答

知道小有建树答主

回答量：244

采纳率：0%

帮助的人：72.4万

我也去答题访问个人页

关注

展开全部

Hadoop包括MapReduce和HDFS，目前很火的Spark，如果说代替，只是会代替Hadoop中的MapReduce。Spark在任务调度和数据可靠性方面，确实比MapReduce要快很多，而且支持将数据缓存到内存中，下次查的时候直接基于内存访问。

Spark:
是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速, Spark 是一种与 Hadoop 
相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越，换句话说，Spark
启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。
Spark 是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架。与 Hadoop 不同，Spark 和 Scala 能够紧密集成，其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。
尽
管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Hadoop 的补充，可以在 Hadoop 
文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 
(Algorithms,Machines,and People Lab) 开发，可用来构建大型的、低延迟的数据分析应用程序。
虽然 Spark 与 Hadoop 有相似之处，但它提供了具有有用差异的一个新的集群计算框架。首先，Spark 
是为集群计算中的特定类型的工作负载而设计，即那些在并行操作之间重用工作数据集（比如机器学习算法）的工作负载。为了优化这些类型的工作负
载，Spark 引进了内存集群计算的概念，可在内存集群计算中将数据集缓存在内存中，以缩短访问延迟.
在大数据处理方面相信大家对hadoop已经耳熟能详，基于GoogleMap/Reduce来实现的Hadoop为开发者提供了map、reduce原
语，使并行批处理程序变得非常地简单和优美。Spark提供的数据集操作类型有很多种，不像Hadoop只提供了Map和Reduce两种操作。比如
map,filter, flatMap,sample, groupByKey, reduceByKey, union,join, 
cogroup,mapValues, 
sort,partionBy等多种操作类型，他们把这些操作称为Transformations。同时还提供Count,collect, 
reduce, lookup, 
save等多种actions。这些多种多样的数据集操作类型，给上层应用者提供了方便。各个处理节点之间的通信模型不再像Hadoop那样就是唯一的
Data Shuffle一种模式。用户可以命名，物化，控制中间结果的分区等。可以说编程模型比Hadoop更灵活.
-


本回答被提问者采纳






已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

人工智能数据采集和处理软件-数据数据采集和处理就用后羿采集器-小白神器

基于人工智能算法的新一代智能数据采集和处理，不需要配置采集规则，一键采集!导出采集结果没有数量限制~~~

www.houyicaiji.com广告

用Excel自动生成大数据excel处理软件

勤哲Excel服务器2024学习和下载。用Excel自动生成大数据excel处理软件及手机app.软博会金奖产品，适合于各行各业的管理人员使用。

除了spark还有哪些大数据处理

您可能关注的内容

其他类似问题

为你推荐：