python爬虫,运行后没有反应?求助!
运行这个程序,根本没有反应?这是怎么回事?因为其他程序都没有问题,应该只是这一段代码有问题。请求帮忙看一下代码是这样的:#-*-coding:utf-8-*-import...
运行这个程序,根本没有反应?这是怎么回事?因为其他程序都没有问题,应该只是这一段代码有问题。
请求帮忙看一下
代码是这样的:
#-*- coding: utf-8 -*-
import urllib
import urllib2
import re
page=1
url="http://www.qiushibaike.com/hot/page/"+str(page)
user_agent="Mozilla/4.0(compatible; MSIE 5.5; Windows NT)"
headers={'User-Agent': user_agent}
try:
request=urllib2.Request(url,headers=headers)
response=urllib2.urlopen(request)
content=response.read().decode('utf-8')
pattern=re.compile('<div.*?author">.*?<a.*?<img.*?>(.*?)</a>.*?<div.*?'+
'content">(.*?)<!--(.*?)-->.*?</div>(.*?)<div class="stats.*?class="number">(.*?)</i>',re.S)
items=re.findall(pattern,content)
for item in items:
haveImg=re.search("img",item[3])
if not haveImg:
print item[0],itme[1],iten[2],item[4]
except urllib2.URLError, e:
if hasattr(e,'code'):
print e.code
if hasattr(e,'reason'):
print e.reason 展开
请求帮忙看一下
代码是这样的:
#-*- coding: utf-8 -*-
import urllib
import urllib2
import re
page=1
url="http://www.qiushibaike.com/hot/page/"+str(page)
user_agent="Mozilla/4.0(compatible; MSIE 5.5; Windows NT)"
headers={'User-Agent': user_agent}
try:
request=urllib2.Request(url,headers=headers)
response=urllib2.urlopen(request)
content=response.read().decode('utf-8')
pattern=re.compile('<div.*?author">.*?<a.*?<img.*?>(.*?)</a>.*?<div.*?'+
'content">(.*?)<!--(.*?)-->.*?</div>(.*?)<div class="stats.*?class="number">(.*?)</i>',re.S)
items=re.findall(pattern,content)
for item in items:
haveImg=re.search("img",item[3])
if not haveImg:
print item[0],itme[1],iten[2],item[4]
except urllib2.URLError, e:
if hasattr(e,'code'):
print e.code
if hasattr(e,'reason'):
print e.reason 展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询