java 如何高效判断数据是否重复

如题,从一个文件中读取几十万条数据,读取后判断这些数据在某一个字段上是否重复,如商户号商户名…………原来我是把读出来后的商户实体类实例和商户号以map的value和key... 如题,从一个文件中读取几十万条数据,读取后判断这些数据在某一个字段上是否重复,如
商户号 商户名 …………
原来我是把读出来后的商户实体类实例和商户号以map的value和key的形式保存起来,然后通过map.get方法判断同样key的数据是否存在,已达到判断是否重复的目的,问题是数据量太大,使用map效率太低,有没有什么判断数据是否重复的高效率的方法(约50W条数据),求解决方案
展开
 我来答
悲剧的星星
推荐于2017-09-10 · 超过21用户采纳过TA的回答
知道答主
回答量:77
采纳率:0%
帮助的人:29.3万
展开全部
一、这么大的数据量如果一次性放到一个Map中是否内存会使用过多,这是要考虑的,是否可以考虑批量处理呢?读取也可以用批量。
二、假如一次性放到一个MAP中,是否可以保存到数据库中,保存的时候肯定是用批量处理。
匿名用户
2012-11-12
展开全部
在普通方法里,map算是快的了。

你可以把这些数据扔到一个小数据库中,用sql找就很快了,数据库对这种要求支持很好的。

你不想用数据库,那你就用B-树吧
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
ldlzagg
2012-11-12 · TA获得超过134个赞
知道小有建树答主
回答量:409
采纳率:0%
帮助的人:62.3万
展开全部
我觉得用程序处理,再怎么快也不会有高效率,最好在使用这些数据时,先将数据导入数据库,用查询语句来处理,如distinct
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
yyhnick
2012-11-12
知道答主
回答量:20
采纳率:0%
帮助的人:12万
展开全部
可以用Set 去除重复
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
健康生活小PP
2012-11-12 · TA获得超过930个赞
知道小有建树答主
回答量:1217
采纳率:33%
帮助的人:433万
展开全部
为什么不从数据库语句下手呢……
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 3条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式