hadoop能处理实时数据吗

比如我服务器每秒钟会受到很多很多上报来的日志文件,每个文件都不大,我要对它进行一些处理,这种情况适合用Hadoop吗?... 比如我服务器每秒钟会受到很多很多上报来的日志文件,每个文件都不大,我要对它进行一些处理,这种情况适合用Hadoop吗? 展开
 我来答
数据科学家V5
2013-11-05 · 超过36用户采纳过TA的回答
知道答主
回答量:96
采纳率:0%
帮助的人:45.6万
展开全部
如果你的软硬件配置较高,当然可以满足这种实时日志分析。
如果你要求在很短时间内返回你要的结果,可以采用大量并行Mapreduce计算来实现类似于推荐引擎的在操作。
但是你要控制好,对文件在HDFS上的操作。比如几个文件,或者多大的文件为一个处理包。不能每过来一个就处理,一直占用资源。
如果对实时要求没有那么高,可以采用离线分析的方法。
追问
就是说攒一定时间的日志文件~然后再进行处理是吗?
追答
嗯嗯,对的。 当然要看你主要对数据实时的要求了。
对于大多数反馈时间要求不是那么严苛的应用,应采用离线分析的方式,通过数据采集工具将日志数据导入专用的分析平台。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式