python爬虫爬取百度知道,怎么转换为utf-8
- 你的回答被采纳后将获得:
- 系统奖励15(财富值+成长值)+难题奖励20(财富值+成长值)
展开全部
请问是不是读出的文件显示乱码,如果是可以试一下下面的方法,我也是试了好久才成功的
在最上面加上重载
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
把你读出文件内容进行转码
.encode('GBK', 'ignore')
在最上面加上重载
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
把你读出文件内容进行转码
.encode('GBK', 'ignore')
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
TableDI
2024-07-18 广告
2024-07-18 广告
当我们谈到Python与Excel的拆分时,通常指的是使用Python的库来读取Excel文件中的数据,然后根据某种逻辑(如按行、按列、按特定值等)将数据拆分成多个部分或输出到新的Excel文件中。上海悉息信息科技有限公司在处理这类任务时,...
点击进入详情页
本回答由TableDI提供
展开全部
不要用
res=requests.get(url,headers=self.headers)
res.encoding="utf-8"
把utf-8改成gb2312
res.encoding="gb2312"
res=requests.get(url,headers=self.headers)
res.encoding="utf-8"
把utf-8改成gb2312
res.encoding="gb2312"
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2018-02-05
展开全部
= =百度知道的web不是本来就是utf-8的编码
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
使用decode() encode()
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2018-11-13
展开全部
工作原因接触过 .net,node.js,Python,go爬虫 ,Python 的scrapy 框架(618爬虫代理)基本上是无敌的
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询