
java爬虫抓取网页内容出现乱码
网页有简体中文繁体中文我抓取回来的内容简体可以正常显示繁体就不行了原网页的编码是gb2312我的是utf-8请问我要这么解决这个问题...
网页有简体中文 繁体中文 我抓取回来的内容简体可以正常显示 繁体就不行了
原网页的编码是gb2312 我的是utf-8
请问我要这么解决这个问题 展开
原网页的编码是gb2312 我的是utf-8
请问我要这么解决这个问题 展开
2个回答
展开全部
jsoup类似 取得网页的源码 根据head 读出编码格式
new String(source,'UTF8');
转换试试
new String(source,'UTF8');
转换试试
追问
Jsoup 有API是可以根据网页编码读取内容的吗?
我咋没找到这个api方法
求大神写段代码指点下!
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询