Python怎样获取XPath下的A标签的内容

 我来答

3个回答

#热议# 普通体检能查出癌症吗？

刺友互

高粉答主

2019-07-17 · 每个回答都超有意思的

知道答主

回答量：3979

采纳率：100%

帮助的人：69.8万

我也去答题访问个人页

关注

展开全部

1、在浏览器中打开网页。然后//div，就可以找到页面中的所有div了，因为//表示的是任意目录下查找。如图，页面有两个div，所以可以找到两个。

2、要查找类为a的div，可以在div后面用[@class="类名"]来指定，这样没有类名a的div就会被过滤掉，当然，还可以用id，把class改为[@id="id名"]即可。

3、用//,这样div下面的非a标签就会被跳过，直接去找a标签。

4、如果要获取a标签的href，那么可以获取到a标签后用/@href即可获得。

5、如果是获取文本的话，可以用text()这个方法，就会得到a标签里面的内容。

6、斜杠/表示的是获取子元素，比如div下面有两个子元素p，那么//div[2]/p获取的就是第二个div的子元素p。

已赞过 已踩过<

评论收起

飞喵某

高粉答主

2019-06-13 · 说的都是干货，快来关注

知道答主

回答量：631

采纳率：0%

帮助的人：29.1万

我也去答题访问个人页

关注

展开全部

1、首先打开jupyter notebook，在主界面的右边点击New，选择Python3新建一个Python文件：

2、然后首先引入lxml包，定义一段html文本，用etree中和HTML方法导入上述html文本，然后就可以用xpath定位A标签的内容了，定位用的的函数是text方法，最后把结果打印出来即可：

3、最后运行所有的cell中的代码，即可拿到A标签的内容了。以上就是Python获取XPath下的A标签的内容的方法演示：

本回答被网友采纳

已赞过 已踩过<

评论收起

哦_廿一
2017-06-30 · TA获得超过431个赞

知道小有建树答主

回答量：273

采纳率：91%

帮助的人：230万

我也去答题访问个人页

关注

展开全部

html = `
<div>
    <a href='www.some.com'><span>hello </span>world</a>
</div>
`
# 获取a标签下的文本
xpath("//a/text()") # world
# 获取a标签以及子标签中的内容
xpath("//a//text()") # hello world
# 获取a标签中的连接
xpath("//a/@href") #  www.some.com

本回答被提问者采纳

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

Python怎样获取XPath下的A标签的内容

其他类似问题

为你推荐：