正则表达式匹配问题python

我如何提取中间的数字价格与文字:<spanclass="price">16000<spanclass="danwei"><spanclass="price">待定<spa... 我如何提取中间的数字价格与文字:<span class="price">16000<span class="danwei"><span class="price">待定<span class="danwei"> --------#################-------------
以下是我写的正则表达式:pattern = re.compile(r'<span class="price">(.*?)<span class=\"danwei">')
fwprices = re.search(pattern,fw)
------我写的表达式哪里错了?不会别乱说,谢谢,只是想学习
展开
 我来答
紫薇参星
科技发烧友

2018-11-15 · 有一些普通的科技小锦囊
知道大有可为答主
回答量:5983
采纳率:92%
帮助的人:3517万
展开全部

你写的正则表达式没有错,只是你用的Python函数re.search()只能匹配一次,如果要匹配多次需要用re.findall()函数,它返回一个list.改正后完整的Python程序如下

import re

fw = '<span class="price">16000<span class="danwei"><span class="price">待定<span class="danwei">'

pattern  = re.compile(r'<span class="price">(.*?)<span class=\"danwei">')

result = re.findall(pattern,fw)

print(result)

追问
我用的anaconda的spyder编译的,问题主要是:我写的表达式,把整个标签都给取了下来,包括标签,名属性等部分,我就一直不明白,就算我用search也没法将单独匹配的一个数值取出,能请教一下吗?
追答

re.search()函数返回的是与正则表达式匹配的第一个数据的对象match_obj,要用match_obj.group(1)取出第一捕获组的数据,因为你要的是价格price,所以要取第一捕获组的数据,下面是完整的Python代码

import re

fw = '<span class="price">16000<span class="danwei"><span class="price">待定<span class="danwei">'

pattern  = re.compile(r'<span class="price">(.*?)<span class=\"danwei">')

fwprices = re.search(pattern,fw)

print(fwprices.group(1))

帐号已注销
2018-11-15 · TA获得超过6600个赞
知道大有可为答主
回答量:7455
采纳率:31%
帮助的人:1101万
展开全部
方法一:解决这个问题,可以先匹配出来,再从匹配到的数据中再选择。方法二:
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式