python 在爬虫中timeout设置超时有什么作用

#-*-coding:cp936-*-#Python2.7#xiaodengimporturllib,urllib2urllib.getproxies_registry=... # -*- coding: cp936 -*-
#Python 2.7
#xiaodeng
import urllib,urllib2
urllib.getproxies_registry=lambda:{}

request=urllib2.Request('http://www.qiushibaike.com/')
request.add_header("User-Agent","Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6")
try:
html=urllib2.urlopen(request,timeout=0.01).read()
print html
except Exception,e:
print str(e)

'''
返回结果如下：
>>>
<urlopen error timed out>
'''

如上爬虫中，增加一个timeout参数有什么作用呢？展开

 我来答

3个回答

#热议# 在购买新能源车时，要注意哪些？

老夭来了
2015-03-01 · 知道合伙人软件行家

老夭来了
知道合伙人软件行家

采纳数：1806 获赞数：8100

2008年从事软件开发，拥有多年的python，php，linux工作经验，发布过多个python，php的开源项目。

向TA提问私信TA

关注

展开全部

是为了防止url不可访问，或者响应速度太慢而造成的时间浪费。
比如，你要爬取1000个网站，如果有100个需要30s才能返回数据，你等待他们返回的话就需要3000s了，如果你设置10s超时，那么就能知道最长需要多久1000个可以爬完。

如果解决了您的问题请采纳！
如果未解决请继续追问

已赞过 已踩过<

评论收起

du瓶邪
2015-08-06 · TA获得超过2.4万个赞

知道大有可为答主

回答量：1.7万

采纳率：100%

帮助的人：2825万

我也去答题访问个人页

关注

展开全部

1、调用test函数超时监控，使用sleep模拟函数执行超时
2、引入signal模块，设置handler捕获超时信息，返回断言错误
3、alarm(3)，设置3秒闹钟，函数调用超时3秒则直接返回
4、捕获异常，打印超时信息
程序执行结果：
1 within time
2 within time
3 timeout
4 within time
5 within time
6 within time
7 timeout
8 within time
9 within time

已赞过 已踩过<

评论收起

qtflvay
2020-05-19

知道答主

回答量：20

采纳率：0%

帮助的人：7.6万

我也去答题访问个人页

关注

展开全部

防止网络很卡的时候，程序一直卡在这个地方没有反应，也不向下执行，可以看、

网页链接这个

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python 在爬虫中timeout设置超时有什么作用

其他类似问题

为你推荐：