python正则表达式提取xml中的某字段之间的字符串,求大佬指教一下
如何在xml中提取*****(表示内容可选)+‘‘发明’/‘提出’/‘提供’+*****(表示内容可选))+’方法’/‘‘算法’*****(表示内容可选)+‘‘克服’/‘...
如何在xml中提取
***** (表示内容可选)+‘ ‘ 发明’/‘提出’/‘提供’+***** (表示内容可
选) )+’ 方法’/‘ ‘ 算法’
***** (表示内容可选)+‘ ‘ 克服’/‘具有’/*****/+***** (表示内容可选)
+‘缺陷’
***** (表示内容可选)+‘ ‘ 提升’/‘具有’/*****/+***** (表示内容可选)
+'性能'
中的***代表的文字
第一次做xml,实在不会。希望有大佬指教一下。谢谢
我采取的代码
import xml.dom.minidom
import re
#打开xml文档
dom = xml.dom.minidom.parse('test.xml')
#得到文档元素对象
root = dom.documentElement
cc=root.getElementsByTagName('base:Paragraphs')
c1=cc[0]
c11 = r'针对(.+?)的问题'
result = re.findall(c11,c1)
print(result) 展开
***** (表示内容可选)+‘ ‘ 发明’/‘提出’/‘提供’+***** (表示内容可
选) )+’ 方法’/‘ ‘ 算法’
***** (表示内容可选)+‘ ‘ 克服’/‘具有’/*****/+***** (表示内容可选)
+‘缺陷’
***** (表示内容可选)+‘ ‘ 提升’/‘具有’/*****/+***** (表示内容可选)
+'性能'
中的***代表的文字
第一次做xml,实在不会。希望有大佬指教一下。谢谢
我采取的代码
import xml.dom.minidom
import re
#打开xml文档
dom = xml.dom.minidom.parse('test.xml')
#得到文档元素对象
root = dom.documentElement
cc=root.getElementsByTagName('base:Paragraphs')
c1=cc[0]
c11 = r'针对(.+?)的问题'
result = re.findall(c11,c1)
print(result) 展开
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询