网络爬虫，列表中的分页是用js实现的，怎么获取上一页，下一页的url？ 20

比如这个网站：http://news.sohu.com/1/0903/61/subject212846158.shtml分页是调用js然后跳转，如果不处理爬虫只能爬一页信... 比如这个网站：http://news.sohu.com/1/0903/61/subject212846158.shtml 分页是调用js然后跳转，如果不处理爬虫只能爬一页信息，如何实现全部爬取？使用java语言~~ 展开

 我来答

5个回答

#热议# 为什么有人显老，有人显年轻？

Oo曉系类
2019-06-22

知道答主

回答量：3

采纳率：0%

帮助的人：2215

我也去答题访问个人页

关注

展开全部

这个比较简单,我看他的url有规律,所以比好弄

已赞过 已踩过<

评论收起

广州市魔书科技有限公司

广告2024-12-22

ppt生成、文本润色、翻译、文档阅读、写文案、写代码、写论文等API直连，集成12家知名企业大语言模型

chat.moshuai.co

pcy950
2018-07-18

知道答主

回答量：1

采纳率：0%

帮助的人：848

我也去答题访问个人页

关注

展开全部

你解决了吗能告诉一下怎么解决的吗

已赞过 已踩过<

评论收起

wuxixita
2014-08-20

知道答主

回答量：1

采纳率：0%

帮助的人：1342

我也去答题访问个人页

关注

展开全部

这个问题你解决了吗？能否交流一下，我也在做这个...

已赞过 已踩过<

评论收起

幸福丶小丑
2013-03-09 · 超过42用户采纳过TA的回答

知道小有建树答主

回答量：194

采纳率：100%

帮助的人：105万

我也去答题访问个人页

关注

展开全部

爬虫可以全部把网页信息下载下来，你是想得到js中的链接？

追问

自己写爬虫，如果分页直接是url那就能全爬下来，但如果是调用js代码，就无法直接爬到此页之外的其他页~想办法通过调用js等方法得到其他页的url，但是不会弄~~

追答

嗯？首先  提供一个home page ，你通过这个网址获取到该网页的所有内容，然后你在对该网页的内容进行处理，也就是说，你提取出来该网页中的所有链接，然后把这些链接放入一个未访问的链表中去，然后再对未访问链表进行逐个遍历，然后采用相同的方式，再获取内容，再解析、、、

本回答被网友采纳

已赞过 已踩过<

评论收起

匿名用户
2013-03-08

展开全部

有很多是AJAX的，客户端没解析JS的功能，别想全解决这样的问题

已赞过 已踩过<

评论收起

4条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

网页爬虫-数据采集就用后羿采集器-小白神器，一键采集

基于人工智能算法的新一代智能网页爬虫，不需要配置采集规则，一键采集!导出采集结果无数量限制~不要积分~~

www.houyicaiji.com广告

网站爬虫全能工程师2024 版 - 从入门到精通，实战特训

网站爬虫海量学习资源，200 多节精心录制的视频课程，100 余个真实企业案例剖析网站爬虫从入门到精通，全方位覆盖 Python 各个知识点与应用场景。

class.imooc.com广告

网络爬虫是什么意思-4.0Turbo-国内入口

ppt生成、文本润色、翻译、文档阅读、写文案、写代码、写论文等API直连，集成12家知名企业大语言模型

chat.moshuai.co广告

网络爬虫，列表中的分页是用js实现的，怎么获取上一页，下一页的url？ 20

您可能关注的内容

其他类似问题

为你推荐：