采集页面内容是gb2312的,但是我想要utf8的,HTML页面怎么改

 我来答
若烟火依然
2014-02-25
知道答主
回答量:13
采纳率:0%
帮助的人:21.8万
展开全部

一、如果被采集页面是你自己的,你可以改,那最好把那张页面改成utf-8
 两处:1、头部HTML声明编码:

<meta http-equiv="content-type" content="text/html; charset=utf-8" />

2、文档编码:把整个html代码用记事本打开,另存为,记得把编码选成utf-8

二、被采集页面如果不是你自己的,你没办法改到那张页面的编码
编码不统一就会出现乱码,你可以将数据先用js进行编码封装
比如:utf-8编码的值 = encodeURIComponent(其它编码的值)
例如:

var targetValue = encodeURIComponent(document.getElementById("sourceValue").value);

使用时用decodeURIComponent(utf-8编码的值)
例如:

var resultValue = decodeURIComponent(targetValue);

如果接收端是其它语言,例如Java
例如:

String result = UrlDencode.dencode(resultValue, "utf-8");
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式