Python用正则表达式匹配含有中文的字符串,匹配不到?

importres='<li><aclass="nav-first"href="/">首页<a/></li>'r=re.compile(u'(<li><a\s)+(cla... import res = '<li><a class="nav-first" href="/">首 页 <a/></li>'r = re.compile(u'(<li><a\s)+(class=["].*?["])+(\shref=["].*?["])+([\u2e80-\uffff])')r.findall(s)请问问题出在什么地方?结果为空 展开
 我来答
yinfengnong
2018-01-19 · TA获得超过5619个赞
知道大有可为答主
回答量:2344
采纳率:89%
帮助的人:2298万
展开全部

代码如下:

#coding=utf-8

import re
s = u'<li><a class="nav-first" href="/">首 页 </a></li>'
r = re.compile(u'<li><a\sclass="[^"]*"\shref="[^"]">(.*?)(?=</a></li>)')
ss = r.findall(s)
for str in ss:
    print str

运行结果:

追问

谢谢你的解答,按照你的匹配方式,未得出结果。

职业人和培训师
2018-01-19 · TA获得超过1399个赞
知道小有建树答主
回答量:428
采纳率:90%
帮助的人:111万
展开全部
import re

s = '<li><a class="nav-first" href="/">首 页 <a/></li>'
r = re.findall(u'[\u2e80-\uffff].+?', s)
print(r)

输出结果:
['首 ', '页 ']
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
玩转数据处理
2018-01-19 · 数据处理,Python,dotnet
玩转数据处理
采纳数:1613 获赞数:3794

向TA提问 私信TA
展开全部
中文匹配正则表达式:[^\x00-\xff]
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式