java 处理大量文档hashmap问题

本人要处理大批量文档，把每篇文档切分成词，存放到HashMap<String,HashMap<String,Integer>>()中，其中各部分表示HashMap<文档名... 本人要处理大批量文档，把每篇文档切分成词，存放到HashMap<String, HashMap<String,Integer>>()中，其中各部分表示 HashMap<文档名, HashMap<该文档中的每个词, 出现的次数>>().此为背景，当文档数为100个的时候，处理的很顺利，当文档数增加到1万以上的时候，只处理到三千个左右就不行了，JVM崩溃，提示如图所示，我猜想应该是hashmap存不了这么大的数据量，各位有谁懂提示什么意思？如果是hashmap存不了，那应该怎么弄，用数据库吗？求助展开

 我来答

2个回答

#热议# 空调使用不当可能引发哪些疾病？

疯狂的土豆派
2014-11-05 · 超过17用户采纳过TA的回答

知道答主

回答量：28

采纳率：0%

帮助的人：34.7万

我也去答题访问个人页

关注

展开全部

不是hashmap存不了这么多，是你内存不够，而且你这还是32位的系统，内存才那么点。
你想做这种分词完全走内存是不现实的，单独内存实现总有内存到达上限的时候，应该内存与磁盘（或数据库）结合使用，解析一定数量的文档，将分好的词存到磁盘上，释放内存，再读取。。。最后通过磁盘统一读取。
你可以参考下lucene的实现。

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

十五Vt
2014-11-05 · TA获得超过120个赞

知道小有建树答主

回答量：68

采纳率：0%

帮助的人：62.2万

我也去答题访问个人页

关注

展开全部

我觉得应该不至于处理不了，处理完一个文件后及时释放资源应该不会有什么问题，从你给的错误信息如果没有更详细的内容基本看不出来是什么问题。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

java 处理大量文档hashmap问题

其他类似问题

为你推荐：