utf-8编码已经成为主流
今天,我在网上看到一张图,据说是来自Google内部的统计——世界上所有网页编码统计图。

第一眼看到这张图,我感到很振奋,utf-8编码终于成为了主流。
可是再看第二眼,顿时就泄气了。因为份额下降的是ASCII和ISO 8859-1这两类编码,而GB类的中文编码份额几乎保持不变。那样的话,utf-8编码份额的上升,其实没有多大实际意义,因为ASCII和ISO 8859-1本身就是同utf-8兼容的,转不转化无所谓。
GB类的中文编码,才是真正需要被淘汰的。除了最基本的ASCII码,它同所有其他编码都不兼容,为互联网应用带来无尽的麻烦。许多很简单的问题,就是因为要考虑语言转化,而变得无比麻烦。
可是,直到今天,我们国家主流的门户网站,全部都是GB2312编码,这让人无法理解。我怀疑是不是有什么法规,规定一定要这样做。如果真是这样,那么实在是太愚蠢了。
P.S.
想了解字符编码基本知识的朋友,可以参考我以前的笔记。
(完)
评论
22 说:
中文utf8也麻烦,还有unicode-8,unicode-16,unicode-32,ibm14401(不记得数字了,随便写个)什么的大字符集
即便是中文gb2312,实际上windows上的gb2312就是gbk
2008年05月06日 23:32 |
| 引用
LI Daobing 说:
iso8859-1 与 UTF-8 不兼容
2008年05月07日 08:38 |
| 引用
atlas 说:
那台湾的Big5和香港的编码与UTF兼容吗?
2008年05月07日 09:35 |
| 引用
aa 说:
2008年05月07日 10:38 |
| 引用
Ruan YiFeng 说:
big5也属于应该被淘汰的编码。
我写得不准确,应该是iso 8859-1与Unicode兼容。
2008年05月07日 11:36 |
| 引用
Fwolf 说:
隐约记得gb2312作为国标编码,是有规定要求在某些地方必需要使用的
(希望下一位来补充)
2008年05月07日 14:23 |
| 引用
donews 说:
阮先生能不能够处理一下多维新闻的全文RSS乱码问题。
我在第一时间就订阅了阮先生制作的多维和德国之声两个全文RSS。但现在发现多维RSS的乱码很严重,不知道有没有办法解决。
2008年05月07日 15:16 |
| 引用
... 说:
我猜。。。gb2312普及是因为dreamweaver默认设置的字符集就是这个。。。。
2008年05月07日 16:44 |
| 引用
Ruan YiFeng 说:
2008年05月07日 23:16 |
| 引用
Ruan YiFeng 说:
2008年05月07日 23:18 |
| 引用
伊水笑 说:
UTF-8的编码还是不错滴……
应该成为主流啊。
2008年05月08日 21:53 |
| 引用
clino 说:
gb 码至少有个好处,传输和存储所占的空间比 UTF8 会少一些
2008年05月09日 15:01 |
| 引用