Python中如何用正则表达式获取指定内容
<span>男23岁(1993年3月)4年工作经验大专未婚</span>这个标签里面的"大专"这个内容如何用正则表达式匹配出来?注意上面的性别,年龄,工作经验都是会变的,...
<span>男 23岁(1993年3月) 4年工作经验 大专 未婚</span>这个标签里面的"大专"这个内容如何用正则表达式匹配出来?注意上面的性别,年龄,工作经验都是会变的,不是固定的。该如何写正则表达式呢里面html的空格无法显示出来因此附上一张图
展开
2个回答
展开全部
你要先学会分析网页,
截图截的太少了,你说内容都会变,却只放出这么多来,这样谁也写不出来。
只能写出固定的。
text="<span>男 23岁(1993年3月) 4年工作经验 大专 未婚</span>"
a=re.findall('工作经验 (.*?) 未婚',text,re.S)
print(a)
追问
因为文中相似的标签会很多,所以我通过class匹配到了唯一的一个标签这样只要匹配里面的内容就可以了。给的内容多反而你不好找。这是一份简历的HTML,我说的内容会变指的是,像有些简历有可能是女,年龄可能不是23岁啊,工作年限人家可能写1年啊之类的。之所以强调就是这个原因了
追答
网页地址是什么啊。我看一下。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询