python正则表达式 匹配<a>标签的title

<ahref="/p/2306334265"title="[吧务公告]多益吧开始可以发帖线下交易!!!"target="_blank"class="j_th_tit">[... <a href="/p/2306334265" title="[吧务公告] 多益吧开始可以发帖线下交易!!!" target="_blank" class="j_th_tit ">[吧务公告] 多益吧开始可以发帖线下交易!!!</a>
<span title="xxxx"></span>
只准匹配<a>标签中的title
而不准匹配<span title="xxxx"></span>这里的title
非常感谢啊!!!
展开
 我来答
yycgis
推荐于2018-03-19 · TA获得超过8267个赞
知道大有可为答主
回答量:6831
采纳率:63%
帮助的人:1589万
展开全部

解决方法如下:

  1. rex = r'<a.*? title="(.*?)".*?>.*?</a>'

  2. 补充一些正则表达式的知识:

    ## 总结
    ## ^ 匹配字符串的开始。
    ## $ 匹配字符串的结尾。
    ## \b 匹配一个单词的边界。
    ## \d 匹配任意数字。
    ## \D 匹配任意非数字字符。
    ## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。
    ## x* 匹配0次或者多次 x 字符。
    ## x+ 匹配1次或者多次 x 字符。
    ## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。
    ## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。
    ## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。
    ## 正则表达式中的点号通常意味着 “匹配任意单字符”
WM_THU
推荐于2017-11-27 · TA获得超过7164个赞
知道大有可为答主
回答量:4285
采纳率:80%
帮助的人:3928万
展开全部
rex = r'<a.*? title="(.*?)".*?>.*?</a>'

上面定义的字符串变量rex就是要求的正则表达式。

本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式