« 铁裤衩 | 首页 | Adonis »

IT民工

留言(1 条)

字符编码笔记:ASCII,Unicode和UTF-8 留言:

>需要注意的是,Unicode只是一个符号集,它只规定了符号的二进制>代码,却没有规定这个二进制代码应该如何存储。
>比如,汉字“严”的unicode是十六进制数4E25,转换成二进制数足>足有15位(100111000100101),也就是说这个符号的表示至少需>要2个字节。表示其他更大的符号,可能需要3个字节或者4个字节,甚>至更多。

有一点疑问,unicode编码使用2个字节也就是16位2进制数字来表示字符,那么在存储的时候,为什么会超过2个字节以上呢?
unicode所能定义的符号总共有65536个,而且里面的每一个符号都是用2个字节表示的,包括ascii码也都是在高位补零的,麻烦楼主解释一下