Python怎样抓取当前页面HTML内容?

在登录界面,登陆账号密码,还有验证码,当输入错误时网页HTML语句是<spanclass="tips"id="imgStatus"style="color:green;"... 在登录界面,登陆账号密码,还有验证码,当输入错误时网页HTML语句是
<span class="tips" id="imgStatus" style="color: green;">验证码错误</span>
输入正确时:
<span class="tips" id="imgStatus" style="color: green;">验证码输入正确</span>
我想在当前页面抓取html这条语句中的“验证码错误”“验证码输入正确”应该怎样去抓取?
我的想法是:
r = re.compile(r'">(.*?)\</span\>')
T = r.search(u'<span id="phoneCodestatus" style="color: green;">输入正确</span>').group(1)
F = r.search(u'<span id="phoneCodestatus" style="color: red;">验证码错误</span>').group(1)
是否正确?
展开
 我来答
CJJohn
2017-09-19 · Persistence is harder than eff...
CJJohn
采纳数:475 获赞数:1362

向TA提问 私信TA
展开全部
当然这样子也是可以的,不过通用点的方法是用beautifulsoup库去定位id=phoneCodestatus
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
就烦条0o
推荐于2017-09-19 · 知道合伙人软件行家
就烦条0o
知道合伙人软件行家
采纳数:33315 获赞数:46492
从事多年系统运维,喜欢编写各种小程序和脚本。

向TA提问 私信TA
展开全部
就是这个思路,用正则
你这个是正确的,不过有一点就是要处理一下异常 不然没有相应的内容会报错
追问
可是我不知道在运行脚本时怎样去抓取验证码输入正确这一条HTML语句,这个问题怎么解决?
来自:求助得到的回答
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式