中文编码标准及其兼容性
GB2312-80:80年出台,简体中文,收录文字6763个。别名euc-cn、区位码,代码页cp20936。
BIG5:繁体中文,收录文字13053个,代码页cp950。
GB 13000.1:等同于 ISO 10646.1,93年出台,包括简体、繁体、日文、朝鲜文。
GBK: 95年出台,收录文字21003个。包括简体、繁体、日文、朝鲜文。兼容gb2312,不兼容BIG5,收录了很多生僻字。代码页cp936。
GB18030-2000: 2000年出台的强制标准,2001年正式实行,收录文字27533个,有2字节和4字节的汉字,包括简体、繁体、少数民族文字,日文、朝鲜文。兼容GBK,不兼容BIG5。代码页cp54936。
GB18030-2005:2005年出台的标准
国际通用的编码:
Unicode:全球统一的字符编码,版本不断在更新中,每个版本会增加一些字符。存储格式可以是UCS-2或UCS-4。前者用2个字节表示一个字符,后者用4个字节。
UTF: unicode的一种编码形式,有UTF-7、UTF-8、UTF-16、UTF-32几个标准。UTF-8用途最广泛。UTF-8代码页cp65001
更详细的信息参考:http://blog.csdn.net/chc05/archive/2007/08/05/1726694.aspx http://blog.csdn.net/fmddlmyy/archive/2007/11/05/1868313.aspx