python怎样抓取网页中的文字和数字数据
2个回答
展开全部
以下代码在 py2 下运行通过:
import urllib2
req = urllib2.Request('https://www.baidu.com/') # 创建一个 Requset 对象
response = urllib2.urlopen(req) # 调用 urlopen
the_page = response.read() # 返回一个 response 对象 在 response 中调用 read()
print the_page
运行效果:
展开全部
通过xpath路径来定位到要提取的元素,在路径后面加上/text()可以提取该元素的文本,如果是要提取属性值,在路径后面加上/@属性名就可以。如果要只采集数字或者文字,可以使用正则来实现。比如数字的正字表达式:[0-9]+。希望可以帮到题主
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询