新手,求教关于python3编码的问题
1、我用python3进行网站抓取,需要用到编码。a='周杰伦'print(a)b=a.encode('utf-8')print(b)这段代码,b是把a转成utf-8编码...
1、我用python3进行网站抓取,需要用到编码。a='周杰伦'print(a)b=a.encode('utf-8')print(b)这段代码,b是把a转成utf-8编码,那么a是什么编码?是Unicode编码???是不是python3底层默认就是Unicode编码
展开
展开全部
你做纤需要明白两个概念:
什么叫字符串、字节串
在Python中字符串是指一串可以展示在终端里、供人阅读的字符,至于字符采用什么编码并不重要,同样的文字,可能是用Unicode、UTF-8或GBK编码,但打印在终端中的内容相同,那么就认为是同一串字符串。而字节串是指将字符串通过某种编码转换得到的一串字节,同样一个字符串,使用不同的编码转换后得到的字节串可能完全不同。
什么叫encode、decode
encode中文为编码,顾名思义,是将字者胡兆符串以某种编码形式编码得到字节串的过程;相反,decode中文为解码,是将字节串以某种编码形式翻译得到字符串的过程。
a是一个字符串,它的内容是“周杰伦”这三个字,类型是str;b = a.encode('utf-8')是将a以utf-8形式编码得到的字节串,它的内容是“周杰伦”这三个字的utf-8编码首租,类型是bytes。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询