python 用requests获取网页源代码为什么中文显示错误
1个回答
2016-07-19
展开全部
应该是因为编码引起的问题,你可以先看你获取的页面的编码,然后获取后进行解码。 你也可以贴出你的程序和页面地址,这样大家才能帮助你。
text取到的是decode之后的内容,你这样处理肯定是会有问题的。 你可以通过requests.get(url).content获取binary内容自己手工decode。 url='百度音乐-听到极致' content = requests.get(url).content html = content.decode("utf8", "ignore")
你可以使用UNICODE函数进行转换MultiByteToWideChar 这个函数将ASC11转换成UNICODE 还有一种简单办法,如果用记事本打开时乱码你可以在文件头添加十六进制的数0XFEFF
text取到的是decode之后的内容,你这样处理肯定是会有问题的。 你可以通过requests.get(url).content获取binary内容自己手工decode。 url='百度音乐-听到极致' content = requests.get(url).content html = content.decode("utf8", "ignore")
你可以使用UNICODE函数进行转换MultiByteToWideChar 这个函数将ASC11转换成UNICODE 还有一种简单办法,如果用记事本打开时乱码你可以在文件头添加十六进制的数0XFEFF
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询