scrapy怎样用xpath提取一个页面的正文部分

 我来答

1个回答

#热议# 生活中有哪些实用的心理学知识？

就烦条0o
2017-08-22 · 知道合伙人软件行家

就烦条0o
知道合伙人软件行家

采纳数：33315 获赞数：46492

从事多年系统运维，喜欢编写各种小程序和脚本。

向TA提问私信TA

关注

展开全部

这种可能包含<script>等标签内容
''.join(sel.xpath("//div[id='content']//text()").extract())
这种可能漏掉类似<span>等标签内容
''.join(sel.xpath("//div[id='content']//p/text()").extract())
这种差不多能获取到大部分你想要的了
''.join(sel.xpath("//div[id='content']//p//text()").extract())

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

超级码客~2025版海量Javascript面试题+笔试题&答案

精编javascript 笔试题Web前端工程师面试#H5，CSS3，JavaScript，Vue，JQuery，Redux，WebpackBootstrap，TypeScript，微信小程序核心题集超3500题，一站式面试服务javascript 笔试题

www.chaojimake.cn广告

scrapy怎样用xpath提取一个页面的正文部分

您可能关注的内容

其他类似问题

为你推荐：