python用re.findall获取网页全部符合要求的元素

如图,这是一段获取网页图片的代码,但是我不是要获取图片,最终目的是获取某一微博用户发布过所有微博的时间,微博时间的源代码是这样的:<aclass="time"target... 如图,这是一段获取网页图片的代码,但是我不是要获取图片,最终目的是获取某一微博用户发布过所有微博的时间,微博时间的源代码是这样的:
<a class="time" target="_blank" href="http://t.qq.com/p/t/460317005393443" rel="1422203163" from="6">昨天 00:26</a>
即获取class=time的所有元素,请问各位大神,我应该怎么改图上的语句才能实现功能呢,谢!
展开
 我来答
日TimE寸
2015-01-28 · TA获得超过9568个赞
知道大有可为答主
回答量:1358
采纳率:83%
帮助的人:482万
展开全部

关键在于查找时间的正则表达式,也就是程序中reg变量的字符串,你可以去了解一下

import re
s = """<a class="time" target="_blank" href="">昨天 00:26</a>
<a class="time" target="_blank" href="">今天 00:26</a>"""

def getTime(html):
   reg = r'<a class="time".*>(.*)</a>'
   timere = re.compile(reg)
   timelist = re.findall(timere,html)
   for t in timelist:
       print t
       
getTime(s)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式