web+Hadoop遇到的一些问题,请大家帮助一下~,感激不尽~~~
我当前做一个web项目,底层用hadoophdfs存储数据,web服务器部署在了集群中的一台机器上。现在在做上传和下载,对于一个非集群内的客户端,通过访问这个web项目,...
我当前做一个web项目,底层用hadoop hdfs存储数据,web服务器部署在了集群中的一台机器上。现在在做上传和下载,对于一个非集群内的客户端,通过访问这个web项目,来将本地文件直接上传到hdfs,或者直接从hdfs下载到本地,都是直接通过访问这个web页面实现,应该怎么做呢?
因为集群外的机器虽然能访问得了web,但是本地却没有hadoop客户端,应该如何解决本地上传和下载呢? 展开
因为集群外的机器虽然能访问得了web,但是本地却没有hadoop客户端,应该如何解决本地上传和下载呢? 展开
展开全部
是否可以使用代理,或者使用ICE服务接口来实现你说的功能?
更多追问追答
追问
能不能具体说说呢?
追答
代理的方式就是说读写请求发给代理服务器,代理服务程序会接受文件,并且将文件写到hdfs中,写文件可以是异步操作的,这样界面感觉会比较快些,读的话也类似;
ICE服务跟web service差不多了,不过比web service更简单,走的协议也是比较底层的,所以效率更高,需要实现服务接口,客户端调用服务接口读写文件就好了。
另外补充一句,hdfs读写小文件性能不高的,大文件还可以(64MB或以上),hdfs读写千万级别的文件性能会降低的比较厉害。这个也是做系统时应该要考虑进去的~
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询