
Python正则表达式
Python正则表达式str="你好啊hellohi"想要的效果是过滤中文字符之间的多个空格"你好啊hellohi"...
Python正则表达式str=" 你好 啊hello hi "
想要的效果是过滤中文字符之间的多个空格
"你好啊hello hi" 展开
想要的效果是过滤中文字符之间的多个空格
"你好啊hello hi" 展开
2个回答
展开全部
>>> import re
>>> s=" 你好 啊hello hi
>>> s1=re.findall(r'[\u4e00-\u9fa5]\s[\u4e00-\u9fa5]',s)
>>> s2=re.sub(r'\s','',s1[0])
>>> s11=re.split(s1[0],s)
>>> s11.insert(1,s2)
>>> s3=''.join(s11)
>>> s3
' 你好啊hello hi '
两端的空格还没有删除,你可以在s11这个阶段删除空格
追问
你好,你的代码不通用呀,我需要的是过滤语料中,中文字符之间的所有空格
追答
你自己在试试,代码是通的,我才敲的!
中文中间的空格不是去除了吗?不会你的意思是只保留空格吧?那我就呵呵了
如果是一整片文章,这种处理方式当然不合适了!但原理相似,只不过是批量处理了!
自己发挥吧,只能帮你这么多
2017-08-16
展开全部
# encoding: UTF-8
import re
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
source = " 你 好 啊 hello hi "
usample=unicode(source,'utf8')
xx=u"((?<=[\u4e00-\u9fa5])\s+(?=[\u4e00-\u9fa5])|^\s+|\s+$)"
temp = re.sub(xx, '', usample);
print temp;
更多追问追答
追问
你好,你的代码结果是"你好啊 hello hi",而且我的是Python 3,满意给满分,谢谢
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |