scrapy怎样用xpath提取一个页面的正文部分

 我来答
就烦条0o
2017-08-22 · 知道合伙人软件行家
就烦条0o
知道合伙人软件行家
采纳数:33315 获赞数:46492
从事多年系统运维,喜欢编写各种小程序和脚本。

向TA提问 私信TA
展开全部
这种可能包含<script>等标签内容
''.join(sel.xpath("//div[id='content']//text()").extract())
这种可能漏掉类似<span>等标签内容
''.join(sel.xpath("//div[id='content']//p/text()").extract())
这种差不多能获取到大部分你想要的了
''.join(sel.xpath("//div[id='content']//p//text()").extract())
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式