汉字的数量:词涯七千

作者: 阮一峰

日期: 2006年4月28日

腾讯课堂 NEXT 学院

汉字的源头,如果追溯到西安半坡遗址出土的陶器上的符号,大概有6000多年历史了。已发现的符号有100多个,那么就算6000年多年前,汉字数量是100多。

接下来是3000多年前的甲骨文,那时汉字数量已经超过3000了。

以下是历代主要字书上的汉字数。

字书名 编者 字数 年代
《仓颉篇》 李斯 3300 秦代(约公元前220年)
《训纂篇》 扬雄 5340 汉代,公元1-5年
《续训篇》 班固 6180 汉代,公元60-70年
《说文解字》 许慎 10516(重文1163字) 汉代,公元100年
《广雅》 张揖 16150 汉代
《声类》 李登 11520 魏,230年
《字林》 吕忱 12824 晋,400年
《字统》 杨承庆 13734 北魏,500年
《玉篇》 顾野王 16917 南梁,534年
《切韵》 陆法言 12158 隋代,601年
《韵海境源》 颜真卿 26911 唐代,753年
《龙龛手鉴》 释行均 26430 辽代,997年
《广韵》 陈彭年 26194 宋代,1008年
《字汇》 梅膺祚 33179 明代,1615年
《正字通》 张自烈 33440 明代,1675年
《康熙字典》 陈廷敬 47043 清代,1716年
《大汉和辞典》 诸桥辙次 49964 1959年
《中文大辞典》 张其昀 49888 1971年
《新部首大字典》 王竹溪 51100 1988年
《汉语大字典》 徐中舒 53768 1990年
《中华字海》 冷玉龙 86000 1994年

汉字的总数虽然有几万个,但是平时用到的不到十分之一。

下面是《二十四史》的总字数和单字数。

书名 总字数 单字数 成书年代
《史记》 533505 5122 公元前93年
《汉书》 742298 5833 公元前83年
《三国志》 377803 4388 289年
《后汉书》 894020 6161 488年
《宋书》 811893 5842 488年
《南齐书》 299257 4962 514年
《魏书》 998329 5417 554年
《梁书》 294438 4937 636年
《陈书》 163382 4033 636年
《北齐书》 212506 4032 636年
《周书》 262659 4161 636年
《晋书》 1158126 5997 648年
《隋书》 701698 5592 656年
《南史》 677624 5376 659年
《北史》 1106543 6346 659年
《旧唐书》 2002600 6346 945年
《旧五代史》 790879 5109 979年
《新唐书》 1694794 6346 1060年
《新五代史》 291476 3909 1072年
《辽史》 296254 4071 1344年
《金史》 931070 5264 1344年
《宋史》 3980123 7389 1345年
《元史》 1611849 5854 1370年
《明史》 2802544 7124 1739年
《清史》 4514567 8080 1927年

即使写像《二十四史》这样最讲究文字的书,7000个汉字也够了。99.9%以上的中国人,识字量不到7000。日常阅读的话,3500个字就可以。

对比英语,简单会话只要1000个单词,但是达到主流社会的阅读水平,非得有20000以上的词汇量不可。因此,可能可以这样说,对于日常会话,英语的记忆负担小,对于复杂的阅读,汉字的记忆负担更小一些。

(完)

留言(12条)

不能这么比吧,单个方块字和单个单词,并不是相同的基准。如果再按照繁体字算的话,我认为大多数汉字的单字,记忆难度是要大大超过英文单词的。

引用icewanderer:不能这么比吧,单个方块字和单个单词,并不是相同的基准。

我也这么想,汉语的很多意义得用双音节词来表示——比方说,认识了“抽”和“象”,未必就明白“抽象”是什么意思。

看来每个朝代都有新的汉字诞生,能不能说一说一些我们日常使用汉字的出生日期呢,一定很有意思吧?

汉字的词量当然不比英语少,但是只要你认识其中每一个字,十有八九就可以猜出整个词的意思。英语就不行了。

何况英语也有很多词组和成语。认识一个take, 不等于认识take on, take off, take out……

所以,可能最终还是汉字的记忆负担比较小。

这是因为汉字里的“熵”小。

英语比较大。

汉字是最简洁的文字,识约900汉字即可读天下文。可惜的是,百年来,中国人自己放弃在汉字文化与学术的传优良统,削足适履,用西文的文法规则体系强加在中文身上,使中文成为半洋半中、似人似鬼的怪物。全球的人包括受蒙蔽的国人,都以为中文是世界上最难的文字。语言文字实验研究表明,外国人学会其母语的时间,掌握外文读写能力的时间,和咱们中国人掌握母语的时间,以及掌握中文读写的时间是相同的。要是中文难的话,外国就都是“愚蠢或笨人”了,实际当然不是,洋人也是聪明的,否则就不会有中国百年悲惨史了

还有一点,即是我们教育不发达。教育没有普及,使得教育发言权与学术发言权被某些拥有学术专制权力的中国的专家教授垄断了,教育和思想一旦形成垄断,老百姓就变得弱智了。

有利有弊吧,符号容易让人联想固然可以节约一定的学习投入,但是在交流的时候也会带来更多的歧义,在日常生活里歧义可以通过其它的多种手段来消除,但是在其它领域可能就麻烦一些了

原来是这个原因呢?
我说为什么自己学了近十几年英语,还笨得不会说几句象样的英语,而自己在上小学之前,汉语就说得能够应付日常生活了。呵呵,长见识了……
我还想请教一下,一锋兄是怎样学习英语的,可否赐教于众网友呢?尤其是象我这种大学都混出来了,而英语还奇臭的人。不知道三十岁左右的人再学习英语,如想学到可以看懂《中国日报》(英文版)而无任何障碍需要多长时间呢?用什么方法呢?先谢兄一声,谢谢!

引用石英钟的发言:

不知道三十岁左右的人再学习英语,如想学到可以看懂《中国日报》(英文版)而无任何障碍需要多长时间呢?用什么方法呢?

难度挺大,不过如果喜欢读英语小说的话,还有希望。

引用Ruan YiFeng的发言:
对比英语,要达到主流社会的阅读水平,非得有20000以上的词汇量不可。
叹息,我看我有7、8000不错了。。真的可以达到20000么。。

一个小问题:这里面单独列出了24史中每一部使用的汉字的个数,并没有告诉我们合在一起,用了多少字?

也没有告诉我们,这些字和现代常用汉字直接的重合率有多少。

这篇文章单独看,这些不是大问题。

但如果要把这篇文章作为 《统一规范汉字表》 包含 8300 个汉字足够的作证,就不是非常够了。

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接