python 怎样爬取网页所有链接 50

以网易官网为例,怎样爬取里面的所有url地址?坐等大神秒回~... 以网易官网为例,怎样爬取里面的所有url地址?坐等大神秒回~ 展开
 我来答
苍狼_白鹿
2015-08-30 · TA获得超过11.8万个赞
知道大有可为答主
回答量:1.9万
采纳率:82%
帮助的人:5454万
展开全部
给你贴一下我前一段时间回答的类似问题,用的soup,还有一个用的正则就不贴了,手机不太方便,如下。
import beautifulsoup
import urllib2

def main():

userMainUrl = "你要抓取的地址"
req = urllib2.Request(userMainUrl)
resp = urllib2.urlopen(req)
respHtml = resp.read()
foundLabel = respHtml.findAll("label")

finalL =foundLabel.string

print "biaoti=",finalL
if __name__=="__main__":

main();

PS:如果不会改的话追问一下,回头我用电脑给你写一份
追问
userMainUrl 这一句报错了,大神肿么办
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式