用python爬虾米的主页为什么报错
importurllib2req=urllib2.Request('http://www.xiami.com/chart?spm=a1z1s.6843805.111092...
import urllib2
req = urllib2.Request('http://www.xiami.com/chart?spm=a1z1s.6843805.1110925385.2.Nom5U1')
response = urllib2.urlopen(req)
the_page = response.read()
print the_page
代码如上
但是第三行报错。说是urllib2.py这个文件里有错。请问哪不对了? 展开
req = urllib2.Request('http://www.xiami.com/chart?spm=a1z1s.6843805.1110925385.2.Nom5U1')
response = urllib2.urlopen(req)
the_page = response.read()
print the_page
代码如上
但是第三行报错。说是urllib2.py这个文件里有错。请问哪不对了? 展开
1个回答
展开全部
没有伪造一个httphead,所以虾米拒绝了,你用你的代码,把url换成百度,你会发现你的代码是可以的,所以说不是你的代码问题,是虾米比较特殊,所以试试这样改一下
import urllib2
http_headers = {'User-Agent':'Mozilla/5.0 (X11; Linux i686; rv:8.0) Gecko/20100101 Firefox/8.0'}
xiami ='http://www.xiami.com/chart?spm=a1z1s.6843805.1110925385.2.Nom5U1'
req = urllib2.Request(
url=xiami,
headers = http_headers
)
response = urllib2.urlopen(req)
the_page = response.read()
print the_page
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询