如何用python爬取js动态生成内容的页面

 我来答

2个回答

#热议# 为什么说不要把裤子提到肚脐眼？

数阔八爪鱼采集器丨RPA机器人
2021-07-29 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面
js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

已赞过 已踩过<

评论收起

玩转数据处理
2016-07-05 · 数据处理,Python,dotnet

玩转数据处理

采纳数：1613 获赞数：3794

向TA提问私信TA

关注

展开全部

python 2.6 + selenium-2.53.6 + firefox45.0 + BeautifulSoup3.2.1
或者
python 2.6 + selenium-2.53.6 + phantomjs 2.1.1

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

学python需要什么软件_Kimi-AI写作-20W超长文本处理

kimi.moonshot.cn

如何用python爬取js动态生成内容的页面

您可能关注的内容

其他类似问题

为你推荐：