李珍宝的blog

李珍宝的BLOG

  IT博客 :: 首页 :: 联系 :: 聚合  :: 管理
  51 Posts :: 1 Stories :: 160 Comments :: 0 Trackbacks

中文编码标准及其兼容性
GB2312-80:80年出台,简体中文,收录文字6763个。别名euc-cn、区位码,代码页cp20936。
BIG5:繁体中文,收录文字13053个,代码页cp950。
GB 13000.1:等同于 ISO 10646.1,93年出台,包括简体、繁体、日文、朝鲜文。
GBK: 95年出台,收录文字21003个。包括简体、繁体、日文、朝鲜文。兼容gb2312,不兼容BIG5,收录了很多生僻字。代码页cp936。
GB18030-2000: 2000年出台的强制标准,2001年正式实行,收录文字27533个,有2字节和4字节的汉字,包括简体、繁体、少数民族文字,日文、朝鲜文。兼容GBK,不兼容BIG5。代码页cp54936。

GB18030-2005:2005年出台的标准

国际通用的编码:
Unicode:全球统一的字符编码,版本不断在更新中,每个版本会增加一些字符。存储格式可以是UCS-2或UCS-4。前者用2个字节表示一个字符,后者用4个字节。
UTF: unicode的一种编码形式,有UTF-7、UTF-8、UTF-16、UTF-32几个标准。UTF-8用途最广泛。UTF-8代码页cp65001


更详细的信息参考:http://blog.csdn.net/chc05/archive/2007/08/05/1726694.aspx  http://blog.csdn.net/fmddlmyy/archive/2007/11/05/1868313.aspx

posted on 2007-08-09 11:52 李珍宝 阅读(1196) 评论(0)  编辑 收藏 引用 所属分类: 软件
只有注册用户登录后才能发表评论。