python正则表达式提取xml中的某字段之间的字符串,求大佬指教一下

如何在xml中提取*****(表示内容可选)+‘‘发明’/‘提出’/‘提供’+*****(表示内容可选))+’方法’/‘‘算法’*****(表示内容可选)+‘‘克服’/‘... 如何在xml中提取
***** (表示内容可选)+‘ ‘ 发明’/‘提出’/‘提供’+***** (表示内容可
选) )+’ 方法’/‘ ‘ 算法’
***** (表示内容可选)+‘ ‘ 克服’/‘具有’/*****/+***** (表示内容可选)
+‘缺陷’
***** (表示内容可选)+‘ ‘ 提升’/‘具有’/*****/+***** (表示内容可选)
+'性能'
中的***代表的文字
第一次做xml,实在不会。希望有大佬指教一下。谢谢
我采取的代码
import xml.dom.minidom
import re
#打开xml文档
dom = xml.dom.minidom.parse('test.xml')
#得到文档元素对象
root = dom.documentElement
cc=root.getElementsByTagName('base:Paragraphs')
c1=cc[0]
c11 = r'针对(.+?)的问题'
result = re.findall(c11,c1)
print(result)
展开
 我来答
GTA小鸡
高粉答主

2018-07-26 · 醉心答题,欢迎关注
知道大有可为答主
回答量:2.6万
采纳率:78%
帮助的人:1.3亿
展开全部
你要提取的关键词前后的内容,有没有固定的字数或者是明显的分隔符,如果没有那单靠正则表达式做不到,这已经涉及到NLP领域了。
更多追问追答
追问
。。错误纠正了。
大神能指导一下怎么提取多段正则表达式的循环提取吗
如题
追答
你能具体描述一下你的问题吗
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式