Python 正则表达式 支持批量语料过滤中文字符之间的空格
- 你的回答被采纳后将获得:
- 系统奖励15(财富值+成长值)+难题奖励20(财富值+成长值)
1个回答
2017-08-16
展开全部
# encoding: UTF-8
import re
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
source = " 你 好 啊 hello hi "
usample=unicode(source,'utf8')
xx=u"((?<=[\u4e00-\u9fa5])\s+(?=[\u4e00-\u9fa5])|^\s+|\s+$)"
temp = re.sub(xx, '', usample);
print temp;
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询