java中什么是代码点？请解释下，谢谢。 30

 我来答

5个回答

#合辑# 机票是越早买越便宜吗？

yanzhoupuzhang
2012-07-14 · TA获得超过135个赞

知道答主

回答量：97

采纳率：0%

帮助的人：52.3万

我也去答题访问个人页

关注

展开全部

说白了一个代码点就是一个Unicode字符。代码单元就是代码点的集合。
字符视图
要了解字符集标准，您必须能区分三种不同的字符视图：

字符集（字符的抽象列表）。
作为带标量值的“代码点”的字符。
作为编码数据的字符。
字符集（字符的抽象列表）

嗯！我也是这么样认为的！

字符集是各种文字（包括拉丁文、西里尔文、中文、朝鲜语、日语、希伯来语和阿拉伯语）中所包含的字符的一个抽象列表，由一百多万个字符组成。字符集还包括其他符号，例如音符。

Unicode 和 GB18030 标准都具有字符集。当某个标准添加了新字符时，为了保持对等，另一个标准也将添加这些字符。

作为带标量值的“代码点”的字符

注意这第二个字符视图只适用于 Unicode，而不适用于 GB18030。
字符集中的每个字符都被分配到一个“代码点”。每个代码点都有一个特定的数值，称为标量值。该标量值通常用十六进制表示。

代码点存在于“代码空间”中。代码空间由许多标量值组成，这些值被划分在两个平面中：

基本多语种平面（64k 大小）。
在 Unicode 中，此下平面中的值的十六进制表示位于 U+0000 到 U+FFFF 的范围中。

辅助多语种平面（16 个 64k 大小的附加节）。
在 Unicode 中，此上平面中的值的十六进制表示位于 U+10000 到 U+10FFFF 的范围中。

所有可能的标量值的完整代码空间的大小为 17 * 64k（1,088,000 个可能值）。

作为编码数据的字符

每个编码形式将字符从字符集转换为编码数据。

在 GB18030 中，编码数据直接从字符集派生：标量值（作为字符集和编码数据之间的媒介）的概念只适用于 Unicode。

在 Unicode 中，通过向标量值应用某个算法来派生编码数据。

Unicode 定义了三种字符编码形式：

UTF-8
UTF-16
UTF-32
代码点和代码单元

在每种编码形式中，代码点被映射到一个或多个代码单元。

注意有关代码点的概述，请参见上一节字符视图。
“代码单元”是各个编码形式中的单个单元。代码单元的大小等效于特定编码的位数测量单位：

UTF-8 中的代码单元由 8 位组成。
UTF-16 中的代码单元由 16 位组成。
UTF-32 中的代码单元由 32 位组成。
GB18030 中的代码单元由 8 位组成。
每个代码点中的代码单元数

映射到代码点所需的代码单元数根据编码形式而有所不同：

UTF-8
在 UTF-8 中，因为代码单元较小的缘故，每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个、三个或四个代码单元。

UTF-16
UTF-16 的代码单元大小是 8 位代码单元的两倍。所以，标量值小于 U+10000 的代码点被编码到单个代码单元中。

对于标量值大于或等于 U+10000 的代码点，每个代码点需要两个代码单元。在 UTF-16 中，这些代码单元对有一个独特的术语：“Unicode 代理对”。

注意下面对 Unicode 代理对的支持进行了讨论。
UTF-32
UTF-32 中使用的 32 位代码单元足够大，每个代码点都可编码为单个代码单元。

GB18030
在 GB18030 中，因为代码单元较小的缘故，每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个或四个代码单元。

对 Unicode 代理对的支持

某些受 Unicode 支持的文字包含代码点的标量值大于或等于 U+10000 的字符。在 UTF-16 中，通过使用代理对来对这些代码点进行编码。

正确处理 Unicode 代理对非常重要。例如，当您在使用 UTF-16 编码的应用程序中处理文本时，如果要添加、删除或选择字符以进行剪切、复制或粘贴操作，文本光标必须将每个代码点作为单个文本字符导航。

参考资料： http://zhidao.baidu.com/question/187025749.html

已赞过 已踩过<

评论收起

安徽新华电脑专修学院
2018-10-25 · 百度知道合伙人官方认证企业

安徽新华电脑专修学院

安徽新华电脑专修学院始建于1988年，隶属于新华教育集团，是国家信息化教育示范基地、中国 IT 教育影响力品牌院校.

向TA提问

关注

展开全部

代码点(codepoint)：是指与一个编码表中的某个字符对应的代码值。

已赞过 已踩过<

评论收起

android0630
2012-07-14

知道答主

回答量：26

采纳率：0%

帮助的人：6.6万

我也去答题访问个人页

关注

展开全部

采用Debug运行的时候需要打代码点

已赞过 已踩过<

评论收起

Discovery92
2012-07-14

知道答主

回答量：72

采纳率：0%

帮助的人：51.5万

我也去答题访问个人页

关注

展开全部

就是代码。。

已赞过 已踩过<

评论收起

Leo分享
推荐于2017-11-28 · TA获得超过754个赞

知道小有建树答主

回答量：1405

采纳率：0%

帮助的人：767万

我也去答题访问个人页

关注

展开全部

代码点&代码单元，是从Unicode标准而来的术语，Unicode标准的核心是一个编码字符集，
它为每一个字符分配一个唯一数字。Unicode标准始终使用16进制数字，并且在书写时在前面加上U+，
如字符“A”的编码为“U+0041”。
代码点是指可用于编码字符集的数字。编码字符集定义一个有效的代码点范围，
但是并不一定将字符分配给所有这些代码点。有效的Unicode代码点范围是U+0000至U+10FFFF。
Unicode4.0将字符分配给一百多万个代码点中的96382个代码点。

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

2条折叠回答

更多回答（3）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

java中什么是代码点？请解释下，谢谢。 30

其他类似问题

为你推荐：