java爬虫抓取网页内容出现乱码

网页有简体中文繁体中文我抓取回来的内容简体可以正常显示繁体就不行了原网页的编码是gb2312我的是utf-8请问我要这么解决这个问题... 网页有简体中文 繁体中文 我抓取回来的内容简体可以正常显示 繁体就不行了
原网页的编码是gb2312 我的是utf-8
请问我要这么解决这个问题
展开
 我来答
武帝噬魂
2016-09-03 · TA获得超过151个赞
知道小有建树答主
回答量:215
采纳率:69%
帮助的人:34万
展开全部
jsoup类似 取得网页的源码 根据head 读出编码格式
new String(source,'UTF8');
转换试试
追问
Jsoup 有API是可以根据网页编码读取内容的吗?
我咋没找到这个api方法

求大神写段代码指点下!
蜗牛46
2016-09-03 · TA获得超过1015个赞
知道小有建树答主
回答量:1176
采纳率:50%
帮助的人:658万
展开全部
那把你的也设置为gb2312就行了嘛
追问
那我再抓一个是UTF-8的呢?
追答
那就先要获取到网页的编码格式
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式