python如何用urllib抓取网页中表格的第二及后续页面 20

写了如下一个函数来获取网页中的数据,但是由于网页正文中的表格不管是第几页,URL都是统一的,所以每次请求得到的都是表格的第一页,想请教下html请求时是怎样通知serve... 写了如下一个函数来获取网页中的数据,但是由于网页正文中的表格不管是第几页,URL都是统一的,所以每次请求得到的都是表格的第一页,想请教下html请求时是怎样通知server端想获取的表格页数的,对应到下面的python函数中该如何修改才能访问到指定页面的内容呢?

import urllib.request

index_url = 'http://vol.stock.hexun.com/Stock/RankDetail.aspx?titType=4&stateType=down'

def get_video_page_urls():
req = urllib.request.urlopen(index_url)
page = req.read()
return page
展开
 我来答
chaoningwang
2014-12-28 · TA获得超过682个赞
知道小有建树答主
回答量:806
采纳率:83%
帮助的人:896万
展开全部

手边没现成代码,就不贴了,告诉你思路:

虽然url里看着地址都一样,其实是不一样的,需要F12分析后台代码;

然后有两种方式,

  1. 就是F12分析代码后爬取真实地址;

  2. 用py模拟敲击“下一页”。


具体代码都不麻烦,度娘很好找。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式