Python中可以通过抓取HTML里的注释来获取指定的标签吗

我要抓取很多份简历,而且有些简历又稍微不一样,只有注释是唯一性的我想可不可通过抓取注释来获取我想要的指定内容。如图:我想获取<td>里面的所有文本。能获取到吗图片未完全显... 我要抓取很多份简历,而且有些简历又稍微不一样,只有注释是唯一性的我想可不可通过抓取注释来获取我想要的指定内容。如图:我想获取<td>里面的所有文本。能获取到吗
图片未完全显示完,
<td>负责完成代码的编写工作<br/>参与软件工程系统的设计...</td>
展开
 我来答
Strayyy
2016-07-27 · TA获得超过822个赞
知道小有建树答主
回答量:296
采纳率:75%
帮助的人:78.8万
展开全部
当然可以,你抓取成功的页面其实就是一个字符串,怎么处理字符串就不用说了吧
追问
# 工作描述
work_str = ""
work_code = work_str.decode('utf-8')

def attr(tag):
return work_code in tag.contents

table = soup.body.find_all(attr)
print table

是这样的吗?但是不行的,还忘大神指点一下啊
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式