如何用python的selenium提取页面所有资源加载的链接

 我来答

1个回答

#热议# 为什么说不要把裤子提到肚脐眼？

从空去听8
2017-09-13 · TA获得超过7438个赞

知道大有可为答主

回答量：6907

采纳率：93%

帮助的人：5457万

我也去答题访问个人页

关注

展开全部

最近需要写一个爬虫，逻辑上有一个环节是取得一个页面的所有资源加载链接（html5页面）
（ps：python下的确是是有个第三方包叫Ghost.py可以取得，但是尝试后效果并不好，估计是因为Ghost.py的webkit对html5的支持并不好。）
选择用selenium，但是没找到selenium的webdriver下取得所有资源加载链接的方法。
selenium包下有一个selenium模块。查看源码时看到有个get_all_links方法。但是一直没找到这个模块的用法。
最后，求解答。谢谢大家。

方法不成的话，就自己do it把：

all_links = browser.find_element_by_xpath('//a')
for a in all_links:
a.getAttribute('href')

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

Eagle-程序员的AI提效神器

eagle.capitalren.com

如何用python的selenium提取页面所有资源加载的链接

您可能关注的内容

其他类似问题

为你推荐：