python爬虫怎么获取到的网站的所有url

 我来答

1个回答

#热议# 应届生在签三方时要注意什么？

要你子夜来来3521
2015-12-08 · TA获得超过4.9万个赞

知道大有可为答主

回答量：1.4万

采纳率：0%

帮助的人：8617万

我也去答题访问个人页

关注

展开全部

首先我们可以先获取要下载图片的整个页面信息。
getjpg.py
#coding=utf-8
import urllib

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

print html
　　Urllib 模块提供了读取web页面数据的接口，我们可以像读取本地文件一样读取www和ftp上的数据。首先，我们定义了一个getHtml()函数:
　　urllib.urlopen()方法用于打开一个URL地址。
　　read()方法用于读取URL上的数据，向getHtml()函数传递一个网址，并把整个页面下载下来。执行程序就会把整个网页打印输出。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python爬虫怎么获取到的网站的所有url

其他类似问题

为你推荐：