Python怎么去除xml文档的元数据信息,如下图去除前两行和最后七行 ,只留下中间一段文本
1个回答
展开全部
import re
a = open('file.txt')
com = re.compile(r‘.+?<text>(.+?)</text>.+?’)
fin = com.findall(a)
print fin
a.close()
a = open('file.txt')
com = re.compile(r‘.+?<text>(.+?)</text>.+?’)
fin = com.findall(a)
print fin
a.close()
追答
这个报错是因为没有转格式,但是我转了后正则匹配不到,没找出为啥,所以用BS重新写了个,测试没问题,如下:
from BeautifulSoup import BeautifulSoup
import re
a = open('file.txt')
com = BeautifulSoup(a.read()).findAll('text')
for x in com:
print str(x.string)
a.close()
PS:记得装BeautifulSoup模块,要不肯定报错。
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询