scrapy怎样用xpath提取一个页面的正文部分
1个回答
展开全部
这种可能包含<script>等标签内容
''.join(sel.xpath("//div[id='content']//text()").extract())
这种可能漏掉类似<span>等标签内容
''.join(sel.xpath("//div[id='content']//p/text()").extract())
这种差不多能获取到大部分你想要的了
''.join(sel.xpath("//div[id='content']//p//text()").extract())
''.join(sel.xpath("//div[id='content']//text()").extract())
这种可能漏掉类似<span>等标签内容
''.join(sel.xpath("//div[id='content']//p/text()").extract())
这种差不多能获取到大部分你想要的了
''.join(sel.xpath("//div[id='content']//p//text()").extract())
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询