UTF-8: EF BB BF
UTF-16 : FF FE
UTF-16 big-endian: FE FF
UTF-32 little-endian: FF FE 00 00
UTF-32 big-endian: 00 00 FE FF
我的解决方案就是没必要为了那3个字节降低效率
而且那3个字节在我看来虽然不是必需的,但也许在某种情况也有用。比如生成后的文件可以通过BOM识别文件存储的格式...
你觉得呢?
BOM(Byte order Mark)是一个字符,它表明UNICODE文本的UTF-16,UTF-32的编码字节顺序(高字节低字节顺序)和编码方式(UTF-8,UTF-16,UTF-32, 其中UTF-8编码是字节顺序无关的)。
posted on 2006-08-13 15:43
汪杰 阅读(187)
评论(0) 编辑 收藏 引用