python爬虫问题:这个IndexError到底错在哪里

>>>#coding=utf-8...importrequests>>>importre>>>#1、下载一个网页...url='http://www.jingcaiyue... >>> # coding=utf-8... import requests>>> import re>>> # 1、下载一个网页... url = 'http://www.jingcaiyuedu.com/book/368416.html'>>> # 2、模拟浏览器发送http请求... response = requests.get(url) # type: object>>> # 3、编码方式... response.encoding = 'utf-8'>>> # 4、得到源文件... html = response.text>>> # 小说名字... title = re.findall(r'<meta property="og:title" content=".*?"/>', html)[0]Traceback (most recent call last): File "<stdin>", line 2, in <module>IndexError: list index out of range>>> print(title)Traceback (most recent call last): File "<stdin>", line 1, in <module>NameError: name 'title' is not defined>>> 展开
 我来答
t8116189520
2019-06-25 · TA获得超过379个赞
知道小有建树答主
回答量:374
采纳率:73%
帮助的人:80.2万
展开全部
list index out of range 表示列表越界了,你这个[0]取列表中第1个元素,如果正则匹配的是空列表,就会报错!
另外你用正则findall之前最好先判断response.status_code是否为200,
追问
对的,被反爬了,没得到返回值
风驰电掣happy
2019-06-25 · TA获得超过136个赞
知道小有建树答主
回答量:226
采纳率:63%
帮助的人:81.5万
展开全部
估计你没爬到小说标题,你把title这行最后[0]给删掉,你估计是是个空列表
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式