python正则表达式读取xml文件中正文在“针对”。。“的问题”两个词汇之间的内容,并print出来

xml正文第一段的标签为<base:Paragraphsnum="0002"id="d1">该怎么写代码,越详细越好。代码详细完整加20分谢谢各位大神多个截取,不截取一次... xml正文第一段的标签为<base:Paragraphs num="0002" id="d1">
该怎么写代码,越详细越好。代码详细完整加20分
谢谢各位大神
多个截取,不截取一次
展开
 我来答
GTA小鸡
高粉答主

2018-07-25 · 醉心答题,欢迎关注
知道大有可为答主
回答量:2.6万
采纳率:78%
帮助的人:1.3亿
展开全部
import re
beg_tag = r'<base:Paragraphs num="0002" id="d1">'
body = xml[xml.find(beg_tag) + len(beg_tag):]
pattern = r'针对(.+?)的问题'
result = re.findall(pattern,body)
print(result)
更多追问追答
追问
请问您的
body = xml[xml.find(beg_tag) + len(beg_tag):]是执行了什么操作。。

pattern = r'针对(.+?)的问题' 中的 .+? 是啥意思。。
谢谢大佬
追答
body = xml[xml.find(beg_tag) + len(beg_tag):]
从xml文本中找到字符串出现的位置,截取该位置后面的内容作为body
'针对(.+?)的问题'
匹配"针对"和"的问题"之间的字符作为一个捕获组,匹配至少一个字符,以非贪婪模式匹配
百度网友c8c8fb385e
2018-07-25 · TA获得超过248个赞
知道小有建树答主
回答量:428
采纳率:62%
帮助的人:138万
展开全部
data = re.findall(r'针对\S+的问题',text)
"""text为xml文本"""
追问
请问您是怎么读取得文件。。

text=xml.dom.minidom.parse("test.xml")吗?
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式