Python3.70中etree.xpath使用问题
我的代码是这样的。'''Suxuan'''#-*-coding:utf-8-*-importrequestsfromlxmlimportetreedefget_page(...
我的代码是这样的。'''Su xuan'''#-*- coding: utf-8-*-import requestsfrom lxml import etreedef get_page(n): '''用伪浏览器的方式从网页上爬取所有的信息''' url = 'http://maoyan.com/board/4?offset={}'.format(n*10)#把网址赋值给一个URL的变量 header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebkit/537.36(KHTML,like Gecko) Chrome/68.0.3440.75 Safari/537.36'} r = requests.get(url,headers = header) #把访问之后的地址返回到变量r,并制作伪浏览器 return r.textdef parse(text): '''解析提取文本''' h = etree.HTML(text)#标准化text names = h.xpath ('//div[@class="movie-item-info"]/p[@class="name"/a/@title]')#用xpath整理提取 print(names)text = get_page(5)parse(text)可是总是出现下图的错误,有的人说是新的lxml不包括etree,可是我在cmd中from lxml import etree并没有报错。求大神给解决一下。。。
展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询