python正则表达式读取xml文件中正文在“针对”。。“的问题”两个词汇之间的内容，并print出来

xml正文第一段的标签为<base:Paragraphsnum="0002"id="d1">该怎么写代码，越详细越好。代码详细完整加20分谢谢各位大神多个截取，不截取一次... xml正文第一段的标签为<base:Paragraphs num="0002" id="d1">
该怎么写代码，越详细越好。代码详细完整加20分
谢谢各位大神
多个截取，不截取一次展开

 我来答

2个回答

#热议# 发烧为什么不能用酒精擦身体来退烧？

GTA小鸡

高粉答主

2018-07-25 · 醉心答题，欢迎关注

知道大有可为答主

回答量：2.6万

采纳率：78%

帮助的人：1.3亿

我也去答题访问个人页

关注

展开全部

import re
beg_tag = r'<base:Paragraphs num="0002" id="d1">'
body = xml[xml.find(beg_tag) + len(beg_tag):]
pattern = r'针对(.+?)的问题'
result = re.findall(pattern,body)
print(result)

更多追问追答

追问

请问您的
body = xml[xml.find(beg_tag) + len(beg_tag):]是执行了什么操作。。

pattern = r'针对(.+?)的问题'  中的  .+? 是啥意思。。
谢谢大佬

追答

body = xml[xml.find(beg_tag) + len(beg_tag):]
从xml文本中找到字符串出现的位置，截取该位置后面的内容作为body
'针对(.+?)的问题'
匹配"针对"和"的问题"之间的字符作为一个捕获组，匹配至少一个字符，以非贪婪模式匹配

本回答由提问者推荐

已赞过 已踩过<

评论收起

百度网友c8c8fb385e
2018-07-25 · TA获得超过248个赞

知道小有建树答主

回答量：428

采纳率：62%

帮助的人：138万

我也去答题访问个人页

关注

展开全部

data = re.findall(r'针对\S+的问题',text)
"""text为xml文本"""

追问

请问您是怎么读取得文件。。

text=xml.dom.minidom.parse("test.xml")吗？

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python正则表达式读取xml文件中正文在“针对”。。“的问题”两个词汇之间的内容，并print出来

其他类似问题

为你推荐：