python如何爬取动态加载的网页数据,例如我的打工网企业链接(需要底部的加载更多才会显示) 50

 我来答
玩转数据处理
2016-05-24 · 数据处理,Python,dotnet
玩转数据处理
采纳数:1613 获赞数:3794

向TA提问 私信TA
展开全部
content=urllib.urlopen(url).read()
for x in ['LabelWageDes','LabelWorkDes','LabelEnterpriseDesc']:
pattern = re.compile(r'<span id="ctl00_ContentPlaceHolder1_'+x+'">(.*?)</span></div>')
for value in pattern.findall(content):
split_values = value.split('<br />')
for line in split_values:
print line
追问

不是这块,是这一块的里面的href(上次我是手动点那个加载一直到底部然后手动复制出来的),类似于百度图片那种到底就自动继续加载

追答
连接呢?
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式