采集页面内容是gb2312的,但是我想要utf8的,HTML页面怎么改
展开全部
一、如果被采集页面是你自己的,你可以改,那最好把那张页面改成utf-8
两处:1、头部HTML声明编码:
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
2、文档编码:把整个html代码用记事本打开,另存为,记得把编码选成utf-8
二、被采集页面如果不是你自己的,你没办法改到那张页面的编码
编码不统一就会出现乱码,你可以将数据先用js进行编码封装
比如:utf-8编码的值 = encodeURIComponent(其它编码的值)
例如:
var targetValue = encodeURIComponent(document.getElementById("sourceValue").value);
使用时用decodeURIComponent(utf-8编码的值)
例如:
var resultValue = decodeURIComponent(targetValue);
如果接收端是其它语言,例如Java
例如:
String result = UrlDencode.dencode(resultValue, "utf-8");
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询