题目通过with open readlines来读取,得到的reviews是一个包含文件全部内容的list对象。
再通过正则表达式的sub方法替换掉指定的内容。
原题目变量reviews_substituted,从字面意思看,这个变量就是要用来替换的内容,这里值是None,也就是把找到的对应内容替换成None。
值为None时要对应空字符串,所以可以用str(reviews_substituted or '')转换。
我们可以先把list转成字符串。再替换,再写入。
import re
with open(u"c:/review_jieba.txt","r") as f:
reviews=f.readlines()
pattern="触摸屏"
repl="屏幕"
reviews_substituted=None
#-------列表转字符串-------------------------------------------
reviews=''.join(reviews)
#-------替换关键字-----------------------------------
regTex=str(pattern)+'|'+str(repl)
fRegex=re.compile(regTex)
reviews=fRegex.sub(str(reviews_substituted or ''),str(reviews))
#-------写入并替换文件-------------------------------------
with open(u"c:/review_jieba.txt","w") as f:
f.write(reviews)
2019-08-07 · 知道合伙人软件行家
if pattern in item:
re.sub(repl, pattern, 0)
2019-08-07
2元