java爬虫怎么抓取js动态生成的内容

 我来答

3个回答

#热议# 生活中有哪些实用的心理学知识？

黑马程序员
2018-08-02 · 改变中国IT教育，我们正在行动

黑马程序员

黑马程序员为大学毕业后，有理想、有梦想，想从事IT行业的年轻人改变自己的命运。黑马程序员成就IT黑马

向TA提问

关注

展开全部

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。
1、有些页面元素被隐藏起来了->换selector解决
2、有些数据保存在js/json对象中->截取对应的串，分析解决
3、通过api接口调用->伪造请求获得数据
还有一个终极方法
4、使用phantomjs或者casperjs这种headless浏览器

已赞过 已踩过<

评论收起

匿名用户
2017-07-20

展开全部

如果评论是通过AJAX显示的，那么抓取有一定难度。你的爬虫需要能够解释JS，并解惑JS的内容。但如果你只针对少数的网站进行抓取，则可以针对这些网站开发专用的蜘蛛。人工分析其JS，从中找到其获取评论的AJAX接口，然后抓之。这样简单。还可以用爬虫操作一个浏览器，通过浏览器的接口获取其运行完成后的显示的内容

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

数阔八爪鱼采集器丨RPA机器人
2021-07-28 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

用nodejs+puppeteer，解析dom结构获取，或者直接观察返回数据的接口，看能不能直接调用

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

java爬虫怎么抓取js动态生成的内容

其他类似问题

为你推荐：