« 巧用Photoshop进行科学研究 | 首页 | CSS中背景图片定位方法 »

utf-8编码已经成为主流


今天,我在网上看到一张图,据说是来自Google内部的统计——世界上所有网页编码统计图。

bg2008050601.gif

第一眼看到这张图,我感到很振奋,utf-8编码终于成为了主流。

可是再看第二眼,顿时就泄气了。因为份额下降的是ASCII和ISO 8859-1这两类编码,而GB类的中文编码份额几乎保持不变。那样的话,utf-8编码份额的上升,其实没有多大实际意义,因为ASCII和ISO 8859-1本身就是同utf-8兼容的,转不转化无所谓。

GB类的中文编码,才是真正需要被淘汰的。除了最基本的ASCII码,它同所有其他编码都不兼容,为互联网应用带来无尽的麻烦。许多很简单的问题,就是因为要考虑语言转化,而变得无比麻烦。

可是,直到今天,我们国家主流的门户网站,全部都是GB2312编码,这让人无法理解。我怀疑是不是有什么法规,规定一定要这样做。如果真是这样,那么实在是太愚蠢了。

P.S.

想了解字符编码基本知识的朋友,可以参考我以前的笔记

(完)

相关内容

  • 2008.05.03: Twine试用感想
    上一次,我写了《Freebase再研究》以后,徐廉之网友赠送了我一个Twine.com的加入邀请。
  • 2008.04.17: 谈谈263
    昨天,我吃惊地看到一条新闻《263上市首发申请未通过证监会审核》。我一直觉得这家公司离破产不远,没想到它居然还要上市。

随机文章

  • 2004.05.06: 关于对境外网站的屏蔽
    最近,国内对境外网站的屏蔽好像又加强了,许多我以前能访问的网站,现在都看不到,对我影响很大。使用代理服务器也不管用,典型的表现是网页刚显示了一点,然后浏览器立刻变成“该页无法显示”。 转贴一篇今天才看到的文章,原文写于2001年,对整个屏蔽机制有很准确的分析,并提出了一种解决办法。
  • 2007.06.03: 印度电影《皇家卫兵》(Eklavya)
    我一直以为所有的印度电影都是歌舞片,所以当我看到《皇家卫兵》时,我感到很惊讶,因为它是一部史诗片。

功能链接

广告(点击支持我)



评论

22 说:

中文utf8也麻烦,还有unicode-8,unicode-16,unicode-32,ibm14401(不记得数字了,随便写个)什么的大字符集

即便是中文gb2312,实际上windows上的gb2312就是gbk

LI Daobing 说:

iso8859-1 与 UTF-8 不兼容

atlas 说:

那台湾的Big5和香港的编码与UTF兼容吗?

aa 说:

引用atlas的发言:

那台湾的Big5和香港的编码与UTF兼容吗?

当然不,Big5是80年代的产物了,unicode是90年代的东西

Ruan YiFeng 说:

引用aa的发言:


当然不,Big5是80年代的产物了,unicode是90年代的东西

big5也属于应该被淘汰的编码。

引用LI Daobing的发言:

iso8859-1 与 UTF-8 不兼容

我写得不准确,应该是iso 8859-1与Unicode兼容。

Fwolf 说:

隐约记得gb2312作为国标编码,是有规定要求在某些地方必需要使用的
(希望下一位来补充)

donews 说:

阮先生能不能够处理一下多维新闻的全文RSS乱码问题。

我在第一时间就订阅了阮先生制作的多维和德国之声两个全文RSS。但现在发现多维RSS的乱码很严重,不知道有没有办法解决。

... 说:

我猜。。。gb2312普及是因为dreamweaver默认设置的字符集就是这个。。。。

Ruan YiFeng 说:

引用donews的发言:

阮先生能不能够处理一下多维新闻的全文RSS乱码问题。

我在第一时间就订阅了阮先生制作的多维和德国之声两个全文RSS。但现在发现多维RSS的乱码很严重,不知道有没有办法解决。

服务器端故障,暂时无法解决,也不知道会持续多久。很抱歉。

Ruan YiFeng 说:

引用Fwolf的发言:

隐约记得gb2312作为国标编码,是有规定要求在某些地方必需要使用的
(希望下一位来补充)

我记得有一篇文章里说,有关部门要求微软将GB编码作为默认中文编码,否则不允许windows简体中文版在国内上市。

伊水笑 说:

UTF-8的编码还是不错滴……
应该成为主流啊。

clino 说:

gb 码至少有个好处,传输和存储所占的空间比 UTF8 会少一些

我要发表看法