首页 >>
国学纵览 >>
5000个字是一般性社会应用的上限
5000个字是一般性社会应用的上限
发布时间:2012-08-29 23:20:04 编辑:gfhz 浏览次数:
王良辰先生的《金瓶梅》用字统计结果是一个很好的资料:
用字总数 4273
行 数 26192
总字符数 758681
标点符号数 126015
汉字总次数 632666
比 例 0.8339025
=============================
日 期 2007-05-06 22:10:26
班氏多年以来在自己的经验和研究分析中,一直认为现代汉语书报中使用的汉字数量为四千多(不包括个别特别生僻的字),后来又进一步认定在四千五百左右。
近期,经过与一批赞同及反对的网友的反复讨论,尤其是有女同车网友站在异见立场上的质疑及统计数据的科学性修正,至目前为止,班氏确定当用汉字为4800个。
附上其中两组参考数据:(由“有女同车”提供)
2、
笑傲江湖(上)累计字数 425145
笑傲江湖(下)累计字数 416396
四世同堂 累计字数 637428
三本书累计字数148万,用字4224个。
Total: 1478969glyphs and 4224 kinds of glyph
5、
王小波_黄金时代 累计字数 31799
王小波_白银时代 累计字数 36788
王朔_动物凶猛 累计字数 47837
王朔_过把瘾就死 累计字数 54155
檀香刑 累计字数 256416
中华人民共和国刑法 累计字数 56087
基督教圣经Bible 累计字数992468
(姚国华著)全球人文审思 累计字数 107277
八部书累计字数 160万,用字 4935个
Total: 1590744glyphs and 4935 kinds of glyph
另外,从词典覆盖方面去统计所用到的字数:
长沙教育学院冯子做了一个很有意义的统计,发现在现代汉语词典等近十万双字词组中,能组成两个以上双字词组的汉字为4330字,其中480为多音字。能组成三个以上双字词组的汉字为3522字。这个统计结果从“词”的角度再一次证明现代汉语基本上只需要使用约五千个字。
从以上多个方面的统计发现,冥冥中有一个上限。5000个字是明朝以来一般性社会应用的最高上限,无论哪一个作者,或哪一个具体领域,其用字量一般都没有超过5000(不包括字典、百科全书等罗列性的汇集),数字事实倾向于揭示这样一个客观规律:5000个基本语义单元是描述反映大千世界的一个最佳值,过少则语言贫乏,过多则不利于记忆和不便于使用。