xpath怎么抓取<div>下的所有<p>标签的文字
我想用xpath抓取所有<p>标签下的文字内容,获取内容1、内容2、和内容3例如:<divclass="top1"><p>内容1</p><p>内容2</p><p>内容3<...
我想用xpath抓取所有<p>标签下的文字内容,获取内容1、内容2、和内容3
例如:
<div class="top1">
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
使用 page.putField("message", page.getHtml().xpath("//div[@class='top1']//p/text()"));
只能获取第一个<p>标签,如何获取全部的内容
如果<p>标签下再加一层<span>又该如何获取,如:
<div class="top1">
<p>
<span>内容1</span>
</p>
<p>
<span>内容2</span>
</p>
<p>
<span>内容3</span>
</p>
</div> 展开
例如:
<div class="top1">
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
使用 page.putField("message", page.getHtml().xpath("//div[@class='top1']//p/text()"));
只能获取第一个<p>标签,如何获取全部的内容
如果<p>标签下再加一层<span>又该如何获取,如:
<div class="top1">
<p>
<span>内容1</span>
</p>
<p>
<span>内容2</span>
</p>
<p>
<span>内容3</span>
</p>
</div> 展开
4个回答
推荐于2016-09-01
展开全部
实现方法如下:
加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归;
string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"
string patten_p="<p>[\\s\\S]*</p>" 用组获取。
加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归;
string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"
string patten_p="<p>[\\s\\S]*</p>" 用组获取。
展开全部
是python吗?
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是
<div class="top1">
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
ehtml = etree.HTML(html)
strings = ehtml.xpath("//div[@class='top1']/p/text()")
这样应该就可以吧应该就是['内容1','内容2','内容3']
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是
<div class="top1">
<p>内容1</p>
<p>内容2</p>
<p>内容3</p>
</div>
ehtml = etree.HTML(html)
strings = ehtml.xpath("//div[@class='top1']/p/text()")
这样应该就可以吧应该就是['内容1','内容2','内容3']
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
用jquery做很简单, $(".top1 p").eq(0).html()
再加一个span的话$(".top1 p span").eq(0).html()
.eq()里面可以传个变量
再加一个span的话$(".top1 p span").eq(0).html()
.eq()里面可以传个变量
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
css/选择器分组就可以
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询