Python用正则表达式匹配含有中文的字符串,匹配不到?
importres='<li><aclass="nav-first"href="/">首页<a/></li>'r=re.compile(u'(<li><a\s)+(cla...
import res = '<li><a class="nav-first" href="/">首 页 <a/></li>'r = re.compile(u'(<li><a\s)+(class=["].*?["])+(\shref=["].*?["])+([\u2e80-\uffff])')r.findall(s)请问问题出在什么地方?结果为空
展开
3个回答
展开全部
import re
s = '<li><a class="nav-first" href="/">首 页 <a/></li>'
r = re.findall(u'[\u2e80-\uffff].+?', s)
print(r)
输出结果:
['首 ', '页 ']
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
中文匹配正则表达式:[^\x00-\xff]
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询