Python的中文字符串遍历问题
Python怎么遍历中文字符串?#encoding=gbka='测试'foriina:printi这样打印的不是中文啊…...
Python怎么遍历中文字符串?
#encoding=gbk
a='测试'
for i in a:
print i
这样打印的不是中文啊… 展开
#encoding=gbk
a='测试'
for i in a:
print i
这样打印的不是中文啊… 展开
展开全部
首先一个,你这个'a'是什么编码?可能不是你所想的gbk
>>> a='测试'
>>> a
这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明是gbk。
另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:
>>> a[:3]
出来就是个测字
windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读。
还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。
>>> a='测试'
>>> a
这样试试看,如果出来是6个字(word),说明是utf-8,如果是4个字,说明是gbk。
另外,不管是utf-8还是gbk,都不能这样遍历,因为这里它会一个字一个字拿出来。虚拟机把a当成一个长度为len(a)的字符串了。
接下来是遍历问题。
linux的shell大都默认是utf-8,所以一个中文字符是三个字,所以要三个三个地读,你可以试下:
>>> a[:3]
出来就是个测字
windows的command的默认是cp936,也就是gbk,一个中文字符是两个字,所以两个字两个字地读。
还有另一种遍历的方法,把字符串转换成unicode,这样中文英文都是一个字,就可以用你的for i in a的方法遍历了。这个的好处是中文英文字符都是一个字,而utf-8和gbk里,英文字母只占一个字。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
楼上已经回答的很好了
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
向楼上的楼上学习来的。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询