web+Hadoop遇到的一些问题,请大家帮助一下~,感激不尽~~~

我当前做一个web项目,底层用hadoophdfs存储数据,web服务器部署在了集群中的一台机器上。现在在做上传和下载,对于一个非集群内的客户端,通过访问这个web项目,... 我当前做一个web项目,底层用hadoop hdfs存储数据,web服务器部署在了集群中的一台机器上。现在在做上传和下载,对于一个非集群内的客户端,通过访问这个web项目,来将本地文件直接上传到hdfs,或者直接从hdfs下载到本地,都是直接通过访问这个web页面实现,应该怎么做呢?
因为集群外的机器虽然能访问得了web,但是本地却没有hadoop客户端,应该如何解决本地上传和下载呢?
展开
 我来答
滑过的板砖
2016-03-24 · TA获得超过270个赞
知道小有建树答主
回答量:305
采纳率:100%
帮助的人:183万
展开全部
hadoop提供API的,直接调用hadoop的api就行。你web服务器肯定是可以访问集群的,数据其实是在你的web服务器做了中转。你的web服务器对hadoop集群来说就是client,你就可以获取输出流,然后从web服务端写出就行了。
Majie1394
2016-03-23 · 超过36用户采纳过TA的回答
知道小有建树答主
回答量:62
采纳率:0%
帮助的人:57.3万
展开全部
是否可以使用代理,或者使用ICE服务接口来实现你说的功能?
更多追问追答
追问
能不能具体说说呢?
追答
  1. 代理的方式就是说读写请求发给代理服务器,代理服务程序会接受文件,并且将文件写到hdfs中,写文件可以是异步操作的,这样界面感觉会比较快些,读的话也类似;

  2. ICE服务跟web service差不多了,不过比web service更简单,走的协议也是比较底层的,所以效率更高,需要实现服务接口,客户端调用服务接口读写文件就好了。

另外补充一句,hdfs读写小文件性能不高的,大文件还可以(64MB或以上),hdfs读写千万级别的文件性能会降低的比较厉害。这个也是做系统时应该要考虑进去的~

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式