python多个文本组合后去除重复项
有三个txt文件:a.txt、b.txt、c.txta.txt有4行数据以“\n”分隔行,即:北京天津南京上海b.txt有2行数据以“\n”分隔行,即:北京西安c.txt...
有三个txt文件:a.txt、b.txt、c.txt
a.txt有4行数据以“\n”分隔行,即:
北京
天津
南京
上海
b.txt有2行数据以“\n”分隔行,即:
北京
西安
c.txt有1行数据以“\n”分隔行,即:
南京
福州
我现在想合并将a.txt、b.txt、c.txt合并后去除原有7行数据中的重复数据,保留唯一值,并逐行输出到新的文件d.txt中,即:
北京
天津
南京
上海
西安
福州
请问该如何操作?
另外后续处理过程中可能要处理上万个txt文件,如何能够高效一点?我本来想:先合并两个去一次重复项,之后将结果与第三个合并之后再去一次重复项的。
谢谢。
我自己解决了,跑17000个极小的txt用了4分钟。 展开
a.txt有4行数据以“\n”分隔行,即:
北京
天津
南京
上海
b.txt有2行数据以“\n”分隔行,即:
北京
西安
c.txt有1行数据以“\n”分隔行,即:
南京
福州
我现在想合并将a.txt、b.txt、c.txt合并后去除原有7行数据中的重复数据,保留唯一值,并逐行输出到新的文件d.txt中,即:
北京
天津
南京
上海
西安
福州
请问该如何操作?
另外后续处理过程中可能要处理上万个txt文件,如何能够高效一点?我本来想:先合并两个去一次重复项,之后将结果与第三个合并之后再去一次重复项的。
谢谢。
我自己解决了,跑17000个极小的txt用了4分钟。 展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询