Java中做网络抓取demo用的Jsoup进行url解析如果链接中带中文就会出现乱码

比如在京东商城上用京东本身的站内搜索+自定义条件来定位商品,将字符串转换为utf-8格式,但是实际执行后商品名称会变成乱码~找资料有人说如果是参数的形式需要转换为gb23... 比如在京东商城上用京东本身的站内搜索+自定义条件来定位商品,将字符串转换为utf-8格式,但是实际执行后商品名称会变成乱码~找资料有人说如果是参数的形式需要转换为gb2312也试过了都不行。
String serchName=URLEncoder.encode("编程思想", "utf-8");
String url ="http://search.jd.com/Search?keyword="+serchName+"";
通过以上代码实现网页的定位,地址栏正常显示utf-8编码格式 和直接点击搜索一样,但是通过firebug调试看后台请求 里面并不是utf-8格式。
有没有知道如何处理这类问题的~
如上面url 解析后为:
http://search.jd.com/Search?keyword=%E7%BC%96%E7%A8%8B%E6%80%9D%E6%83%B3
通过Document doc = Jsoup.connect(url).get(); 获取网页
但是查询页面的条件确是乱码
展开
 我来答
召晗日66
2017-11-08
知道答主
回答量:2
采纳率:0%
帮助的人:1836
展开全部
哪是因为网页编码都是UTF_8的 你出现中文即是GBK的 所以需要转成UTF_8格式的字符串 就不会出现乱码了
百度网友7287170
2014-02-28 · 超过31用户采纳过TA的回答
知道答主
回答量:58
采纳率:0%
帮助的人:71.4万
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式