java爬虫抓取网页内容出现乱码

网页有简体中文繁体中文我抓取回来的内容简体可以正常显示繁体就不行了原网页的编码是gb2312我的是utf-8请问我要这么解决这个问题... 网页有简体中文繁体中文我抓取回来的内容简体可以正常显示繁体就不行了
原网页的编码是gb2312 我的是utf-8
请问我要这么解决这个问题展开

 我来答

2个回答

武帝噬魂
2016-09-03 · TA获得超过151个赞

知道小有建树答主

回答量：215

采纳率：69%

帮助的人：34万

关注

展开全部

jsoup类似取得网页的源码根据head 读出编码格式
new String（source，'UTF8'）;
转换试试

追问

Jsoup 有API是可以根据网页编码读取内容的吗？
我咋没找到这个api方法

求大神写段代码指点下！

本回答由提问者推荐

已赞过 已踩过<

评论收起

蜗牛46
2016-09-03 · TA获得超过1015个赞

知道小有建树答主

回答量：1176

采纳率：50%

帮助的人：658万

关注

展开全部

那把你的也设置为gb2312就行了嘛

追问

那我再抓一个是UTF-8的呢？

追答

那就先要获取到网页的编码格式

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

其他类似问题