python中如何通过关键字查找到指定的HTML标签

我要获取多分简历信息,但每份简历又有所不一样,没有唯一性不过有几个字是唯一的。我可不可以通过关键字来爬取指定的内容啊?如图:我想通过‘工作职责’这四个字找到下面的<td>... 我要获取多分简历信息,但每份简历又有所不一样,没有唯一性不过有几个字是唯一的。我可不可以通过关键字来爬取指定的内容啊?如图:我想通过‘工作职责’这四个字找到下面的<td>的所有文本,该如何获取呢 展开
 我来答
百度网友77b1c99
推荐于2018-05-10 · TA获得超过594个赞
知道小有建树答主
回答量:144
采纳率:0%
帮助的人:91.8万
展开全部

可以使用正则表达式的方法

正则表达式:工作职责:</th>\s+<td>(.+?)</td>


import re
content = "页面内容"
re_1 = re.search('工作职责:</th>\s+<td>(.+?)</td>', content)
if re_1:
    print re_1.group(1)
else:
    print "not find !"

因为正则表达式有中文 所以要保证你的内容与文本是一个编码

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式