Python读取一个千万条记录的TXT文件,字段以逗号隔开,并以第一个字段生成MD5输出到第二个TXT文件
Python读取一个千万条记录的TXT文件,字段以逗号隔开,并以第一个字段生成MD5输出到第二个TXT文件(其余字段保留不变一起输出到第二个txt文件),请问这个程序该如...
Python读取一个千万条记录的TXT文件,字段以逗号隔开,并以第一个字段生成MD5输出到第二个TXT文件(其余字段保留不变一起输出到第二个txt文件),请问这个程序该如何写?用Excel处理太慢了,看到网上说python处理文本很快,请大神指教,谢谢!!
展开
2个回答
展开全部
import hashlib
in_file = open('in.txt','r');
out_file = open('out.txt','w');
m = hashlib.md5()
for line in in_file:
p = line.index(',');
t1 = line[0:p]
t2 = line[p:]
m.update(t1.encode("gb2312"))
out_file.write(m.hexdigest()+t2)
速度没试过,你可以自己试试看。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询