python怎样抓取网页中的文字和数字数据

 我来答

2个回答

#热议# 为什么有人显老，有人显年轻？

六锶尽念飘1e
2017-01-21 · TA获得超过1693个赞

知道大有可为答主

回答量：2034

采纳率：82%

帮助的人：1509万

我也去答题访问个人页

关注

展开全部

以下代码在 py2 下运行通过：

import urllib2

req = urllib2.Request('https://www.baidu.com/')  # 创建一个 Requset 对象
response = urllib2.urlopen(req)  # 调用 urlopen
the_page = response.read()  # 返回一个 response 对象 在 response 中调用 read()
print the_page

运行效果：

已赞过 已踩过<

评论收起

数阔八爪鱼采集器丨RPA机器人
2021-07-29 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

通过xpath路径来定位到要提取的元素，在路径后面加上/text()可以提取该元素的文本，如果是要提取属性值，在路径后面加上/@属性名就可以。如果要只采集数字或者文字，可以使用正则来实现。比如数字的正字表达式：[0-9]+。希望可以帮到题主

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python怎样抓取网页中的文字和数字数据

其他类似问题

为你推荐：