首页

Mark

个人主页: http://www.hi-mark.cn

留言(4 条)

从“山寨机”看手机的未来 留言:

这个么,老早想过了.但是手机平台和系统要开放还不知道什么时候.
手机这东西本来就应该是廉价货..现在花3000/4000多买个手机的真是让我觉得太不可思议了

utf-8编码已经成为主流 留言:


引用Ruan YiFeng的发言:

我记得有一篇文章里说,有关部门要求微软将GB编码作为默认中文编码,否则不允许windows简体中文版在国内上市。



有关GB18030编码来由的传说

简单说一下我对这段历史的理解吧,说错了欢迎大家指正。
1,GB2312是很老的东西了,早就发现不够用了。
2,94年(还是之前)国家推出了建议性标准gb13000,这个标准其实就是utf-8标准(除了名字,完全一样),同时也建议微软公司采纳。--(据说是1993年,GB13000,应该是ISO10646)
3,微软借口说gb18000还不成熟,为了取得中国市场的垄断地位,自己搞了一套汉字标准,于是它就随着win95和office之类的流行起来了,国家看生米已经煮成了熟饭,只好把这套标准定为国标GBK标准。--(其实只是指导性标准,并非强制性,GB18030是强制性标准)
4,微软到了99年(前后吧),又说GBK已经落伍了,现在流行utf-8标准,准备全盘转换成utf-8,这些把有关部门惹怒了。NND,当年我们推utf-8你说不成熟,自己搞了一套,现在赚得盆满钵满了又自己说要推utf-8了,你丫微软分明就没把政府放在眼里。
5,于是政府怒了,强制推行gb18030标准(这个标准前面兼容GBK,其他码位兼容utf-8),算是过渡标准吧。要求微软强制执行,否则产品不得在大陆买。于是基本搞死了微软的WindowsMe,差点搞死了Office2000(据说发行前几个月,微软除了改字符编码就没干其他什么事情)--(确实,WinMe是我认为的最差的Windows版本,而office2k也是前不着村,后不着店,前后兼容性都差)
6,由于以上历史原因,现在就是GB2312,GBK,GB18030,UTF-8并存了。
7,如果不是万恶的微软,我们早就用上UTF-8了。
8,所以说微软和政府关系一直很僵,不是说着玩的,微软太目中无政府了。
9,以上是我从其他地方看来的,可能记得不是太真切了,说的不对请大家指正。
【按】这是在水母Linux版上的讨论所引发的。只有用Linux的普通用户才会关心编码问题,因为选择太多了,选哪个好确实是个问题。从长远看,应该选 utf-8,可从一般使用角度来看,GBK足够也适合以前的文件现状,并且也可以同UTF-8编码的人交流,程序支持就是了。所以我目前还是用GBK。也许应该用Utf-8。香港政府倒是在推广ISO10646的,还有免费字体供应。


http://tech.it168.com/knowledgebase/Articles%5C1%5C5%5C5%5C155d3300879cd9a41b90c4d7ff8c1c1b.htm

utf-8编码已经成为主流 留言:


引用林海枫的发言:


UTF-8和UTF-16都是Unicode的编码方式,可以相互转换。gb2312也是国际编码,应该可以与Unicode完全兼容,换言之可以转换。
故对于中文网页来说,应该使用UTF-16, 这样空间占用最少,而且支持Unicode的浏览器都可以正确转换;我想gb2312也一样(但未证实)

因为对于中文网页,应使用UTF-16或gb2312,而不应该使用UTF-8

其实Unicode的编码方式有好几种,除了上面两种外。之所以有好几种,是根据不同语言文字的需要而提出的。


兄弟没开发过网站吧。还没听说谁用UTF-16做网页编码的——UTF-16不兼容ASCII,所以不可能作为网页传输编码。倒是GB18030比较适合中文网页——拉丁文是1字节,CJK基本都是2字节,生僻字4字节。

utf-8编码已经成为主流 留言:


引用我的大名的发言:


utf-8汉字多一字节也没什么吧?本来汉字就多,事实上,gb18030里双字节还不够用了,甚至有用更多字节的。而utf-16有字节序问题,utf-8则没有。
另外楼上有位朋友还扯到什么歧视上去了。这有点好笑了。人家英文有几个字母呀?难道你想所有汉字用一个字节来表示?



GB18030兼容GB2312,常用字都是双字节,只有生僻字采用4字节。而UTF-8汉字全部都是3字节。并且unicode在BMP上对汉字的确有“歧视”,不遵循汉字的习惯而是以老外的方式来组织。