如何获得使用BeautifulSoup只是两个指定标签之间的所有文本

 我来答
笑喘是病得抽
2017-07-20 · TA获得超过925个赞
知道大有可为答主
回答量:2140
采纳率:98%
帮助的人:2248万
展开全部
因为你的html不是合法的xml格式,标签没有成对出现,只能用html解析器

1
2
3
4
5
6
7
8

from bs4 import BeautifulSoup

s = """
</span><span style= 'font-size:12.0pt;color:#CC3399'>714659079qqcom 2014/09/10 10:14</span></p></div>
"""
soup = BeautifulSoup(s, "html.parser")
print soup
print soup.get_text()

如果你想用正则的话,只要把标签匹配掉就可以了

1
2
3
4
5
6
7
8

import re

s = """
</span><span style= 'font-size:12.0pt;color:#CC3399'>714659079qqcom 2014/09/10 10:14</span></p></div>
"""
dr = re.compile(r'<[^>]+>', re.S)
dd = dr.sub('', s)
print dd
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式