python正则表达式 匹配<a>标签的title
<ahref="/p/2306334265"title="[吧务公告]多益吧开始可以发帖线下交易!!!"target="_blank"class="j_th_tit">[...
<a href="/p/2306334265" title="[吧务公告] 多益吧开始可以发帖线下交易!!!" target="_blank" class="j_th_tit ">[吧务公告] 多益吧开始可以发帖线下交易!!!</a>
<span title="xxxx"></span>
只准匹配<a>标签中的title
而不准匹配<span title="xxxx"></span>这里的title
非常感谢啊!!! 展开
<span title="xxxx"></span>
只准匹配<a>标签中的title
而不准匹配<span title="xxxx"></span>这里的title
非常感谢啊!!! 展开
2个回答
展开全部
解决方法如下:
rex = r'<a.*? title="(.*?)".*?>.*?</a>'
补充一些正则表达式的知识:
## 总结
## ^ 匹配字符串的开始。
## $ 匹配字符串的结尾。
## \b 匹配一个单词的边界。
## \d 匹配任意数字。
## \D 匹配任意非数字字符。
## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。
## x* 匹配0次或者多次 x 字符。
## x+ 匹配1次或者多次 x 字符。
## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。
## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。
## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。
## 正则表达式中的点号通常意味着 “匹配任意单字符”
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询