Java中做网络抓取demo用的Jsoup进行url解析如果链接中带中文就会出现乱码
比如在京东商城上用京东本身的站内搜索+自定义条件来定位商品,将字符串转换为utf-8格式,但是实际执行后商品名称会变成乱码~找资料有人说如果是参数的形式需要转换为gb23...
比如在京东商城上用京东本身的站内搜索+自定义条件来定位商品,将字符串转换为utf-8格式,但是实际执行后商品名称会变成乱码~找资料有人说如果是参数的形式需要转换为gb2312也试过了都不行。
String serchName=URLEncoder.encode("编程思想", "utf-8");
String url ="http://search.jd.com/Search?keyword="+serchName+"";
通过以上代码实现网页的定位,地址栏正常显示utf-8编码格式 和直接点击搜索一样,但是通过firebug调试看后台请求 里面并不是utf-8格式。
有没有知道如何处理这类问题的~
如上面url 解析后为:
http://search.jd.com/Search?keyword=%E7%BC%96%E7%A8%8B%E6%80%9D%E6%83%B3
通过Document doc = Jsoup.connect(url).get(); 获取网页
但是查询页面的条件确是乱码 展开
String serchName=URLEncoder.encode("编程思想", "utf-8");
String url ="http://search.jd.com/Search?keyword="+serchName+"";
通过以上代码实现网页的定位,地址栏正常显示utf-8编码格式 和直接点击搜索一样,但是通过firebug调试看后台请求 里面并不是utf-8格式。
有没有知道如何处理这类问题的~
如上面url 解析后为:
http://search.jd.com/Search?keyword=%E7%BC%96%E7%A8%8B%E6%80%9D%E6%83%B3
通过Document doc = Jsoup.connect(url).get(); 获取网页
但是查询页面的条件确是乱码 展开
2个回答
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询