请教下如何用awk命令比对删除两个文本的重复数据

因为文本比较大,都有几十上百M。所以想说用awk处理会比较快。。。或者有什么工具处理比较快速的也可以... 因为文本比较大,都有几十上百M。所以想说用awk处理会比较快。。。
或者有什么工具处理比较快速的也可以
展开
 我来答
百度网友5311d79
2012-11-30 · TA获得超过1.9万个赞
知道大有可为答主
回答量:6356
采纳率:71%
帮助的人:3213万
展开全部
确认需求如下:
两个文本里每行都只有一个url地址。
a.txt里面的是全的,b.txt里面的全部是从a.txt里面提取出来的,即b是a的子集。
目的是要得到(a-b)这个集合。
要求用gawk.exe并能在XP下用。

实现:
gawk.exe "NR==FNR{a[$0]++} NR>FNR{c=0;for(i in a) if($0==i){c=1;break;} if(c==0)print $0}" b.txt a.txt
lishuaijuly
2012-11-29 · TA获得超过114个赞
知道答主
回答量:142
采纳率:0%
帮助的人:86.6万
展开全部
catfile2 |awk -F "\t" 'BEGIN{while (getline <"file1">0)a[$0]=1}{if(!($0 in a)) print }'
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
奉天乄团座
2012-11-29 · TA获得超过160个赞
知道小有建树答主
回答量:457
采纳率:0%
帮助的人:149万
展开全部
grep -Fv file1 file2 >不同的数据.txt
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式