
Python中可以通过抓取HTML里的注释来获取指定的标签吗
我要抓取很多份简历,而且有些简历又稍微不一样,只有注释是唯一性的我想可不可通过抓取注释来获取我想要的指定内容。如图:我想获取<td>里面的所有文本。能获取到吗图片未完全显...
我要抓取很多份简历,而且有些简历又稍微不一样,只有注释是唯一性的我想可不可通过抓取注释来获取我想要的指定内容。如图:我想获取<td>里面的所有文本。能获取到吗
图片未完全显示完,
<td>负责完成代码的编写工作<br/>参与软件工程系统的设计...</td> 展开
图片未完全显示完,
<td>负责完成代码的编写工作<br/>参与软件工程系统的设计...</td> 展开
1个回答
展开全部
当然可以,你抓取成功的页面其实就是一个字符串,怎么处理字符串就不用说了吧
追问
# 工作描述
work_str = ""
work_code = work_str.decode('utf-8')
def attr(tag):
return work_code in tag.contents
table = soup.body.find_all(attr)
print table
是这样的吗?但是不行的,还忘大神指点一下啊
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询