java 写入txt文件的中文乱码问题

我写了一个类似爬虫的程序,要将爬取的网页内容保存到本地的文本文件。写入之后用记事本打开为什么有的网页内容显示正常,有的网页中文出现乱码?下载网页源码的时候用的utf-8的... 我写了一个类似爬虫的程序,要将爬取的网页内容保存到本地的文本文件。
写入之后用记事本打开为什么有的网页内容显示正常,有的网页中文出现乱码?

下载网页源码的时候用的utf-8的编码,但是保存到java中字符串应该已经变成unicode的编码了,跟一般的java字符串没区别了吧??
而且我已经试过写入txt的时候改编码了,gbk,unicode,utf-8都试过!

然后我又用了字符串常量“你好”实验,gbk的时候是正常的。可是一写网页内容就不正常了!!是不是跟不同网页采用的编码有关啊??
我看到网页一般都是utf-8的编码啊。难道不同的网页有不同的编码??
展开
 我来答
山上的阿竹
2015-08-17 · TA获得超过463个赞
知道小有建树答主
回答量:513
采纳率:87%
帮助的人:135万
展开全部
原因是写入时使用的字符编码和期望的不一致导致的,因为JVM虚拟机启动时会因不同的参数使用不同的缺省字符编码。

解决办法:
如果你期望写到文件中的汉字是 GBK编码,可以:
1、写文件时,将字符串准换成 GBK编码的byte[], 如: myios.write( "汉字".getBytes("GBK"));
2、java 虚拟机启动时,增加 -DFile.encode=GBK 选项。
独脚镇天山
2012-08-07 · TA获得超过532个赞
知道小有建树答主
回答量:314
采纳率:0%
帮助的人:167万
展开全部
肯定是编码问题,要看网页用什么编码,写txt时也要用同样的编码。utf-8的用utf-8,gbk的用gbk
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
戚心镶AM
2015-08-08 · TA获得超过680个赞
知道小有建树答主
回答量:824
采纳率:0%
帮助的人:190万
展开全部
应该是java和你系统本身的编码字符集不匹配
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
a_storey
2012-08-07 · 超过13用户采纳过TA的回答
知道答主
回答量:44
采纳率:0%
帮助的人:32.5万
展开全部
java工作区统一编码。统一为utf-8
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
chenbaoji20010
2012-08-07 · 超过10用户采纳过TA的回答
知道答主
回答量:71
采纳率:0%
帮助的人:35.9万
展开全部
换编码
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 3条折叠回答
收起 更多回答(5)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式