« 赵丹《管得太具体 文艺没希望》 | 首页 | 老子说:知其雄,守其雌 »

汉字的数量:词涯七千


汉字的源头,如果追溯到西安半坡遗址出土的陶器上的符号,大概有6000多年历史了。已发现的符号有100多个。那么就算6000年多年前,汉字数量是100多。

接下来是3000多年前的甲骨文,那时汉字数量已经超过3000了。

以下是历代主要字书上的汉字数。

字书名 编者 字数 年代
《仓颉篇》 李斯 3300 秦代(约公元前220年)
《训纂篇》 扬雄 5340 汉代,公元1-5年
《续训篇》 班固 6180 汉代,公元60-70年
《说文解字》 许慎 10516(重文1163字) 汉代,公元100年
《广雅》 张揖 16150 汉代
《声类》 李登 11520 魏,230年
《字林》 吕忱 12824 晋,400年
《字统》 杨承庆 13734 北魏,500年
《玉篇》 顾野王 16917 南梁,534年
《切韵》 陆法言 12158 隋代,601年
《韵海境源》 颜真卿 26911 唐代,753年
《龙龛手鉴》 释行均 26430 辽代,997年
《广韵》 陈彭年 26194 宋代,1008年
《字汇》 梅膺祚 33179 明代,1615年
《正字通》 张自烈 33440 明代,1675年
《康熙字典》 陈廷敬 47043 清代,1716年
《大汉和辞典》 诸桥辙次 49964 1959年
《中文大辞典》 张其昀 49888 1971年
《新部首大字典》 王竹溪 51100 1988年
《汉语大字典》 徐中舒 53768 1990年
《中华字海》 冷玉龙 86000 1994年

汉字虽然有几万个,但是平时用到的不到十分之一。

下面是《二十四史》的总字数和单字数。

书名 总字数 单字数 成书年代
《史记》 533505 5122 公元前93年
《汉书》 742298 5833 公元前83年
《三国志》 377803 4388 289年
《后汉书》 894020 6161 488年
《宋书》 811893 5842 488年
《南齐书》 299257 4962 514年
《魏书》 998329 5417 554年
《梁书》 294438 4937 636年
《陈书》 163382 4033 636年
《北齐书》 212506 4032 636年
《周书》 262659 4161 636年
《晋书》 1158126 5997 648年
《隋书》 701698 5592 656年
《南史》 677624 5376 659年
《北史》 1106543 6346 659年
《旧唐书》 2002600 6346 945年
《旧五代史》 790879 5109 979年
《新唐书》 1694794 6346 1060年
《新五代史》 291476 3909 1072年
《辽史》 296254 4071 1344年
《金史》 931070 5264 1344年
《宋史》 3980123 7389 1345年
《元史》 1611849 5854 1370年
《明史》 2802544 7124 1739年
《清史》 4514567 8080 1927年

即使写像《二十四史》这样最讲究文字的书,7000个汉字也够了。99.9%以上的中国人,识字量不到7000。日常阅读的话,3500个字就可以。

对比英语,要达到主流社会的阅读水平,非得有20000以上的词汇量不可。可见,可能还是汉字的记忆负担小。

相关内容

随机文章

  • 2008.02.19: 1975年毛泽东主席与福特总统的会谈(一)
    上个星期,美国国务院公开了《1973-1976年美中关系文献》(Foreign Relations, Volume XVIII, China, 1973-1976),其中包括许多第一手的原始档案,现在可以在网上免费下载。
  • 2008.01.21: 关于Drupal软件
    如果自己搭建Blog,我们通常会考虑使用Wordpress或者MovableType。但是,现在我发现Drupal也是一个很好的选择。

功能链接

广告(点击支持我)



评论

icewanderer 说:

不能这么比吧,单个方块字和单个单词,并不是相同的基准。如果再按照繁体字算的话,我认为大多数汉字的单字,记忆难度是要大大超过英文单词的。

深夜的声音 说:

引用icewanderer:不能这么比吧,单个方块字和单个单词,并不是相同的基准。

我也这么想,汉语的很多意义得用双音节词来表示——比方说,认识了“抽”和“象”,未必就明白“抽象”是什么意思。

atlas 说:

看来每个朝代都有新的汉字诞生,能不能说一说一些我们日常使用汉字的出生日期呢,一定很有意思吧?

Ruan YiFeng 说:

汉字的词量当然不比英语少,但是只要你认识其中每一个字,十有八九就可以猜出整个词的意思。英语就不行了。

何况英语也有很多词组和成语。认识一个take, 不等于认识take on, take off, take out……

所以,可能最终还是汉字的记忆负担比较小。

fang danny 说:

这是因为汉字里的“熵”小。

英语比较大。

林待秋 说:

汉字是最简洁的文字,识约900汉字即可读天下文。可惜的是,百年来,中国人自己放弃在汉字文化与学术的传优良统,削足适履,用西文的文法规则体系强加在中文身上,使中文成为半洋半中、似人似鬼的怪物。全球的人包括受蒙蔽的国人,都以为中文是世界上最难的文字。语言文字实验研究表明,外国人学会其母语的时间,掌握外文读写能力的时间,和咱们中国人掌握母语的时间,以及掌握中文读写的时间是相同的。要是中文难的话,外国就都是“愚蠢或笨人”了,实际当然不是,洋人也是聪明的,否则就不会有中国百年悲惨史了

格鲁伯出版教育集团林待秋 说:

还有一点,即是我们教育不发达。教育没有普及,使得教育发言权与学术发言权被某些拥有学术专制权力的中国的专家教授垄断了,教育和思想一旦形成垄断,老百姓就变得弱智了。

harrz 说:

有利有弊吧,符号容易让人联想固然可以节约一定的学习投入,但是在交流的时候也会带来更多的歧义,在日常生活里歧义可以通过其它的多种手段来消除,但是在其它领域可能就麻烦一些了

我要发表看法