汉字与信息储存

 

文字,是文明时代的标志,它本身既是一个民族智慧的结晶,又是传载文化信息的工具。世界最古老的文字有三种,即是巴比伦的楔形文字、埃及的图画文字和中国的方块字。这三种文字虽然都从图画发展而来,但中国文字的发展却是特殊的,在世界上许多民族都用拼音文字的时候,中国却独自应用了注音文字,表现了中国人与众不同的认知世界的方式。

文字本是有声语言的符号,任何语言都是人类运用器官神经感知事物信息的产物,当人们要用符号来表述这种信息以进行交流时,最初都是凭直觉描出对象的轮廓,因此各民族的语言文字最初都是形象符号集。由于各人感知上的差异,对对象取舍的精粗不一,这种形象符号又缺乏规律性和统一性,表述的信息得不到共识,就不能自由组合与交换。于是,文字便向准确化和通用化的方向演进,这种演进形成两大系统:一种是由各种音素组成,以明确的音位观念来表达认识,各音素之间界限分明,音节的结构比较复杂,这就是印欧语言即拼音文字,这种文字直接反映读音,书写容易,词的形态比较丰富。但它的不规则拼写和长词形,与人的瞬间记忆不能完全适应,语音的准确性要求高,作为信息处理的难度就大了;再一种是由字形表意与声音的结合而组成,这就是汉语。这种文字主要是以笔画拼构图形以表达意思,使形音有机融合,读音可以知义,所以又称方块字或注音文字。拼音文字纯是一种符号,汉字却是中华民族想象力的产物。

汉字看起来难学,真学起来未必很难,这种字只需要用少量的笔画即可构成表达全息形象的图形。它的基本笔画有横(包括提)、竖、撇、折、点(包括捺)五种。这五种基本笔画按照相离、相接、相交三种组合关系,构成成千上万的汉字。比如:一个撇笔和一个捺笔,用相离的组合关系,可构成“八”字,用相接的组合关系则构成“人”字或“入”字;再如田、由、申、甲四个字,都是按两个横笔、两个竖笔和一个折笔而构成。这种以最简单的笔画组成众多象形字的方法,构成的图形不易混淆,表述的信息却准确丰富,承载的信息量大而具有规律性。每一个字都富有文化的意蕴,国的古字是口与戈构成的“國”字,戈是兵器武力;口是人口,合起来就是用武力管理和保卫人口,这正是国家的职能。创造文字的先民,未必懂得国家是集团统治工具的原理,但这个字的出现,说明自从有了武力统治社会的现象以后,才产生“国”的概念,朴素地反映了国家产生的社会背景。所以汉字体现了中国人精细入微的观察力。

汉字举世无双的优点是容易储存信息,制造新名词。每一个字除了自身具有一定的意义外,还具有很强的造词能力。如“政”字,后面加上不同的字,就可以造出不同的词,如政界、政局、政客、政经、政策、政治、政事、政府、政情、政变、政论等等;又如“了不得”、“不得了”、“得不了”,三个同样的字不同的排列方法就可以表达三种完全不同的意思;再如社会与会社、事情与情事,在顺序上作改变就构成另一个词。因此中国文字最能追随语言和时代的发展,把旧字重新组合成新词术语,得到“生词熟字”的效果,如电影、电脑,积极、消极等名词都是用常用字来拼写的,不需要像拼音文字那样重造新的文字,因此中国文字具有极大的稳定性,在商代就有文字四千多,经过三千多年到现在常用字量也就六千多,其中常用字560个,常用字807个,次常用字为1033个,总共为2400个,这2400个字占一般书籍报刊用字的百分之九十九。而使用英语的民族,每一个普通成年人,一般至少使用二万和英语单词,有多少词就有需要多少字。我国的常用词条有44000多,只用了3700多字构成,号称集文字大成之作的《康熙字典》总共收字47000多,而英语单字据1975年出版的《美国百科全书》介绍已超过一百万,常用字有20000,比中国多十倍,汉字有一套独特的笔画顺序,由这套规则而发明的五笔字形汉字编码,把汉字分解为最基本的五种笔型单元,在通用键盘上,十分钟即可打出900字的文章,比英文输入还要快。

信息时代的到来,更加突出了汉字的优越性。21世纪新的电脑将采用声控系统,它将摒弃由字母编制的键盘,由于英语的英节多达10000个以上,而汉语只有400多音节,每个音节最多4个音素,因由美国语言学家盖利.吉宁斯在《世界语言》一书中对汉语的简洁性、准确性、严密性和先进性给予高度评价,认为正是中国人几千年的努力,才把“西文语法书里的种种麻烦抛个精光”,最后“只留下几千个单字和若干条效率极高的排字规则”。英国《新科技杂志》原主编,科技发明报道专家迈克.克鲁斯断言,不久的将来,汉语将充分发挥威力,到那时世界关于语言文字结构的研究中心有可能转移到中国。在20世纪初年的中国,人们由于愤慨中国科学技术的落后,力图摆脱文字的阻隔,向世界认同,曾经发出汉字拼音化的呼吁。曾几何时,中国的汉字即以强劲的生命力证明了它无穷的潜力。是电脑接受了汉字,而不是电脑改变了汉字。因此有人称它为电脑文字,表明它是人类中具有最佳的信息交换应用程序的语种。

汉字,有可能成为储存信息的第一文字,这不是梦!