世界的语言多样性
每种语言的祖语都是由拓荒者、农民、商人或进行征服的精锐部队带到该语言的现代流行区域的。多学科的研究正在查明它们各自的作用。据古希腊历史学家希罗多德报道,公元前七世纪埃及的一位法老Psamtik安排两个新生婴儿在隔离孤立状态下抚养直到他们最初的话能共同听到为止。他们最初的被记录下来的言词是ekos。该法老的抄写员发现bekos在弗里吉亚语(安纳托利亚的一种语言)中是表示面包的词。这些抄写员断定,弗里吉亚语是地球上的原始语言。不幸的是,这一怪诞的实验结果似乎成为后来的调查者的标准。到十九世纪,有关语言起源的推测已变得如此的空洞,以致巴黎语言学会从其所组织的讨论中取消了这一题目。今天,考古学、遗传学和语言学本身的进展,终于为世界的语言多样性的合理解释开辟了道路。这一问题的许多方面仍然处于高度争论之中,而且任何加以综合的尝试都可能仅仅是推测性的,但是语言演变过程的大致特征已经开始成为可识别的了。
历史给形成合理的假说提供了—个可靠的基础。在200多年间,语言学家已意识到,某些语言有着词汇、语法、构词法和语音使用上的相似性,因此它们必定是来自一个共同的祖语。语言学家把这些具有共同祖语的语言归属于一个语系之中。早期最著名的这种分类法是由威廉·琼斯爵士于1786年提出的。他是加尔各答高等法院的英国法官,他研究了梵语、希腊语、拉丁语、哥特语和波斯语之间的相互关系。共同的词汇和语法特征使琼斯联想到这些语言“出自于某一共同的祖语”。这一语系现在称之为印欧语系。
随后几代的语言学家改进完善了琼斯所使用的分析方法。印欧语系的研究导致了历史语言学这一学科的产生。现在,历史语言学系统地比较了属于同一语系的各语言。这种比较使得研究人员能构拟称为原始语的推测的祖语。
根据现代观察到的资料来推断祖藉情况的问题,同样出现于进化生物学中。生物学家按照惯例总是通过研究解剖和生理证据来试图构拟物种之间的遗传关系。最近几十年间,这种研究已扩展到分子一级。在这一级上,研究人员已能破译DNA中特定核昔酸顺序的遗传世系。在所有情况下,系统研究都能产生完全基于现代可观察信息的分类。这样的分类是表型的,即是基于整个外部特性的分类。分类单位的有关相似性通常可用谱系树的形式图解表示。 自从查尔斯·达尔文以来,包括历史语言学和古生物学在内的一些历史学科的大多数研究人员都趋向于把这样一种谱系树与导致现今情况的进化过程等同起来。换句语说,他们把表型树和系统发生树等同起来了。这种合并依据的是某些重要的假定。它们之中的一个最重要的假定,是进化变化的发生具有一个稳定而恒定的速率。随着时间的流逝,那些成为分隔的词形就会越来越彼此趋异,从而在词汇中出现新词。
有关变化具有相对稳定速率的假定是关键性的,因为有差别的变化速率模糊了分支情况。例如,可以认为,丹麦语是在英语和德语分开之前就分离出了。这样,真正的系统发生情况就是把英语和德语并为一支,而丹麦语为另一支。然而,如果德语和丹麦语很少变化,同时英语的变化又大得多,则语言学家在没有其它比较特征的情况下就可能错误地把德语和丹麦语置于一起并同英语分开。
另一个假定是,共享祖藉(而不是迫使趋同的那些主要因素)可以解释相似性。从语言角度来说,趋同发生在同时代的语言通过借用单词、短语和语法形态而彼此相互影响的情况下。北欧几乎普遍使用美国人的习语“O.K."就是趋同的一个例子。因为借用很少能影响语言的最基本要素,研究人员通常是可以识别出来的。在识别之时,问题在于要确立论证的标准。
在语言学这一学科范围内,寻找有关语言演变的普适观点的热情远不是无异议的。许多年来,已有可能在这一领域内的学者之间分辨出两个对立的思考学派:"区分派”(splitters)和“堆积派”(lumpers)。区分派往往强调使一些语言看来是不相关的差别,并往往将这些语言分成小的独立单元。区分派在他们排除虚假关系的工作中要求在语言之间未证明其存在一系列相似性和类同性之前决不能把这些语言归为一个语系。他们还坚持这些相似之处应用来构拟衍生出该推定语系的原始语。而另一方面堆积派则承认有一些标准能允许他们把许多语言归并成少数的语系。尽管某些堆积派人士也构拟原始语,而另一些人士则认为这一步骤是多余的。
不过,许多语系还是赢得了广泛的承认,其中有印欧语系;阿非罗亚细亚语系(从前称为闪—含语系),这是由闪语族和大多数北非语言所组成;以及乌拉尔语系,它包括芬兰语和匈牙利语。然而,其它一些分类的合理性远不是那么清楚的。
1963年,美国语言学家斯坦福大学的 J.H.格林伯格通过将非洲的诸语言分类成刚好四个显著的大语系:阿非罗--亚细亚语系,科依桑语系,尼日尔—科尔多凡语系和尼罗--撒哈拉语系,从而向着统一的观点前进了一大步。事实上,他并未采用许多语言学家所喜欢的比较方法来进行语言的历史构拟;而是通过一个涉及多方面分析的系统来进行研究。这种方法不是仅仅比较一对语言中的单词,而是同时分析许多语言中的一系列单词。
尽管区分派有着保留意见,格林伯格对非洲语言的分类仍为许多学者所采用。不久前,他又应用同一分析程序于美洲的语言,识别出三个重要语系或大语系[参看《科学》1993年第 3期 Joseph H. Greenberg和Merritt Ruhlen所著“士著美洲人的语言起源”一文]。它们中的两个—爱斯基摩—阿留申语系和纳德内语系—已得到了广泛的支持,尽管他的余下的一类—印第安语系(“Amerind”),它把绝大多数美洲士著人语言合并为一个大语系--在有时是尖锐甚至是发火的争论中受到广泛的批评。
有关这些大语系是否正确的问题,作为考古学家我宁愿暂且不予裁判,对于有主见的语言学家 Merritt Ruhlen(一位毫无疑问的堆积派人士)所主张的许多其他大语系也是一样。我只是对那些有争议的语系打上引号[参看地图],将它们的性质问题搁置起来以待确定,而去试图解决一个更具体的谜:现今的语言分布情况是怎样发生的?
最近几年,对上一问题答案的许多启示来自于两方面的考古学进展:一方面依靠我们所属物种的进化,另一方面依靠我们文化的发展。目前,对早期人科成员的了解要比20年前好得多。没有人怀疑,大约四、五百万年前,正是在非洲出现了南方古猿。大约距今160万年前,也是在非洲,进化出了我们所有人的祖先 直立人,他们散布到了亚洲和非洲,而且他们的化石和人工制品也发现在两个大陆上。我们自己所属的物种 智人,肯定是从直立人中分离出来的,而且在距今10万多年前就达到了其现代形态 现代智人( Homo。sapiens sapiens,也可译为“智人智人亚种”、“晚期智人”或“新人",有时甚至就称为“现代人” 译注)。大多数考古学家现在同意,现代智人出现的过程独—无二地发生在非洲。另—种理论认为,从直立人向智人过渡的过程不限于非洲;而是发生在更大的区域,包括亚洲(或许还有欧洲)在内。但是,基因证据在目前有利于“非洲起源”论。所以根据这一观点,我们可以设想,现代智人在大约10万年以前就在非洲出现了,然后再逐渐地扩散到旧大陆。到距今4万年时,现代人已移居到黎凡特(指地中海东部诸国家和岛屿,包括叙利亚、黎巴嫩、以色列、巴勒斯坦等在内的自希腊至埃及的地区— 译注)、南亚、欧洲、中亚、东亚、新几内亚和澳大利亚。或许早在距今 2万7千年前—不晚于距今 l万6千年前—亚洲的拓荒者就跨过白令海峡开始了在新大陆的拓居。我们一定会设想,所有这些人说一种语言或一些语言,即使我们可能对这些语言究竟象什么没有一个清晰的概念也是这样。
第二个新近的有关考古进展是对文化转变历程的强调。尤其是考古学家再也不愿意把早期人类文化中的每一个变化都解释成是某种不清楚的迁移的结果。他们不再把一种语言、一种文化和一个“民族”过份简单化地等同起来。如果要把迁移用来解释装饰艺术的改变、新宗教体系的出现或一种新语言的出现,则就一定要有这种联系的某些证据,以及对产生这种情况的经济和社会过程的了解。
一种语言可以通过以下四种主要过程而在一定区域内开始流行:无人居住区的最初拓殖;趋异(前面讨论过的);趋同(也是前面讨论过的);以及语言替换,通过它,一种语言被另一种新来的语言所取代了。如果从未发生过语言替换,则趋异就是语言变化的主要原因,而世界语言地图就会呈现出语言小单元的镶嵌图的形式。各语言就会显著不同于其相邻语言而被评列为一单独的语系,或者更准确地说为一孤立的语言。事实上,这种镶嵌形式在澳大利亚北部的士著语言中很显著,在这里,很多语系所占据的面积均很小。[而在澳大利亚的南部则仅有在使用的一个语系— 帕马尼荣( Pama— Nyungan)语系。对其异常宽广分布的原因目前尚不清楚。]上述类型的镶嵌分布情况在新几内亚的垦殖者中间也有发现。此外,当人们研究加利福尼亚州和南美洲部份地区的士著语地图时(眼下还是要暂时回避一下格林伯格的“印第安语系”的分类),往往也会得到类似的印象。在高加索语系中也有这种情况。
但是,世界语言图的大部分完全是另一种情况。全球的大部分区域都是被一些单个语系所占据,只有通过替换过程才能出现这种现象。对这种分布模式,我提出三个简单的原因。
首先,少数语系达到其现在的分布范围是通过精锐部队统治的影响而实现的。在这种模式中,入侵的少数民族控制了权力杠杆并且以贵族自居,它赋予了它的语言以显赫的威望,以致诱导本地人宁愿采用征服者的语言而不愿使用其母语。由于这样的少数民族接管意味着新来族群具有某种集中化的组织,所以这一假说只能应用于晚期史前时期或历史时期,这时已形成了高度等级化的社会。
例如,在华南,汉语仅仅在历史时期由于秦帝国的军事扩展才开始使用。拉丁语在欧洲许多地区的传播也符合这一规则。一些印欧语言通过伊朗、北印度和巴基斯坦这些地区所进行的扩散也是这样的,这可能要归之于公元前第二干纪游牧社会的兴起(指雅利安人的入侵印度—译注)。阿尔泰诸语言在中世纪时期开始在中亚占据统治地位,也是由于那时在马背上的战争席卷了该地区。
可是,大多数分布面积广的语系仍可看成是两种不同类型的人口散布的产物,尽管这两类散布也发生在距今约 l万年前的最后一次冰期结束之后。这些散布一方面涉及农业的产生,另一方面也涉及由于气候变化向无人居住区的侵入。晚近的与气候有关的人口散布趋向于向北纬54度以北的无人居住区移民,这些地区在更新世的最后一次寒冷时期是不适于居住的。现在居住着说爱斯基摩 阿留申语系诸语言的各民族的地区很可能仅仅在过去的几千年内第一次有人居住。乌拉尔 尤卡吉尔语系和楚克奇—堪察加语系的诸语言比爱斯基摩 阿留申诸语言还要更早就占有其现在的领域。
纳—德内语系诸语言的情况似乎要更为复杂。如同格林伯格所认为的那样,说纳—德内诸语言的人很可能在美洲最初有人居住之后很久但又是在说爱斯基摩—阿留申请语言的人之前来到北美的。我认为,他们的生活方式表现出对冻土环境的早期适应性。在更晚的时候,当气候或生态因素使该区变得不那么适于他们居住的时候,他们就往南迁徙了。某些说原始纳—德内语的人还侵入到远达亚利桑那州和新墨西哥州这些地方。被骑在马背上的行进所加强了的精锐部队的统治可以解释同这一语族有关的文化在北美大陆许多地区的存在。
在分布面积很广的语系的扩展过程中,最重要的一个因素看来是借助于农业扩展来实现语言的替换。该理论认为,一个语系是由生活在合有适于驯化的植物(或许还有动物)这一生态系统中的觅食者所说的单一口语而开始其扩展历程的。这些觅食者在定居生活中发展出养活他们的农业文化,从而有利于增加出生率、降低婴儿死亡率和增大食物生产的集约程度。在某些场合,可以作出如下推测,那些已驯化了的作物和牲口连同管理它们的技术都是适合于移植到一些新的生态小生境中的。在这些环境中,核心区域的语言或若干语言将随着驯化了的植物和动物一道传播。这些语言将随着农业人口在称为“居民扩散”(demic diffusion)的前进浪潮中缓慢迁移而传播。或者,农民的语言同新的农业经济—道可以被周围的。狩猎—采集者族群通过文比适应而被采用。这两种中机制的遗传效应是大为不同的。
目前,基本上认为:非洲班图诸语言(属于尼日尔—科尔多凡语系)的推广是由居民扩散来实现的。国立澳大利亚大学的 Peter Bellwood不仅对玻利尼西亚诸语言而且一般来说对南岛诸语言也作出厂同样的论证[参见《科学》1991年 ll期 Peter Bel]wood所著“南岛语系的扩散和语言的起源”一文。
我已经对欧洲的印欧诸语言相当详细地论证了这一情况[参见《科学》1990年2期 Colin Renfrew所著“印欧诸语言的起源”一文]。某些作者还论证了:在西北欧,这一过程更多地不是人口迁移而是文化适应;可是,如果情况的确如此的话,对语言的效果可能最终还是相同的。同样类似的论证可以推广于阿非罗—亚细亚诸语言,或许还有埃拉莫—达罗毗荼诸语言,还可以推广于亚洲境内阿尔泰诸语言的最初扩展。当然,这些阿尔泰语言,特别是突厥诸语言,是在更晚的时候由骑在马背上的游牧部族的精英统治带到遥远的地方的。
奥塔戈大学的 C.F.W.Higham最近提出,类似的论证可适用于东南亚的南亚语系诸语言(蒙达语和孟—高棉语)。这些语言的扩展与东南亚为稻的驯化中心有关。汉藏语系诸语言的扩展看来最初也是同黄河流域的粟和其它谷类植物的驯化有关,只是在更晚的时候才同稻的驯化有关。
自然,关于农业扩展这一语言替换的原因,还必须对每个例子加以详细的研究。这类研究也是当代考古学所能胜任的。事实上,一般来说已有可能确定所讨论的特定动植物驯化的故乡和驯化的大致年代以及引证农业扩展过程的资料记录。语言后果当然是一个推论问题,因为史前时期的语言并未在考古记录中留下任何痕迹。
农业扩展的年代使用放射性碳断代法越来越可以很好地确定,并且一般说来农业扩展的年代要比语言学家通常为所讨论语系的初期阶段所确定的时间要早。可是,语言断代的合理基础从未清楚地确定,还没有可靠的系统能用来对原始语言进行独立地断代。
至于那些由于人们末对较晚近的气候变化或农业革命或征服浪潮采取行动因而不可能扩散的语系又怎么样呢?这些在世界地图上呈点点滴滴零零碎碎散布的残留语言一定在很久以前在现代智人最初散布期间就达到了其现代分布范围。这些语系有非洲的柯伊桑语系和尼罗—撒哈拉语系;北高加索和南高加索的诸语言;巴斯克语;澳大利亚士著语;新几内亚的镶嵌的、或许彼此无关的诸语言(“印度—太平洋语系”);以及美洲的前纳—德内诸语言。最后一类是如此地庞大,以致毫无疑问包含有若干亚语系,它们的分布情况多半取决于包括农业扩展在内的随后发生的过程。
分子遗传学至少能检验地球上语言分布的总解释中的某些部分。使用这种方法的一个手段就是比较不同人类族群中的基因频率,并将这些数据转化成谱系树,其分支情况描绘了遗传距离。这样,人们就能看到亲缘关系对根据上述解释所提出的预言证实到何种程度。我们自己所属物种起源的非洲产生论,已得到了根据——些现生族群的核DNA取样所得出的谱系树的强有力的证实。
人类群体最初扩散到无人居住的地区显然会引起全基因转移。农业的扩展也只有在通过居民扩散来进行的情况下才会牵涉到显著的基因流动;那些通过文化适应过程而产生的农业扩展将只留下更微弱的基因流动痕迹。由于精锐部队的统治而引起的语言替换也只在很有限的规模上牵涉到基因流动;通常在这种情况下,迁移的是男性,以致对线粒体 DNA产生的影响将是最小的(线粒体 DNA只通过女性路线遗传)。
经过最仔细研究的实例是农业的扩展到欧洲。欧洲的地图表明,基因频率的地理分布有一个清楚的从东南到西北的梯度。纽约州立大学石溪分校的 Robert R. Sokal及其同事的最新统计研究为将这一梯度的大部分与来自安纳托利亚的农业的扩展相连系起来提供了可靠的证据。尽管这一相关关系支持了人口日益增加的农民群体将农业带到新地区的观点,但它还是不能证实这些农民所说的就是原始印欧方言中的某一种。
最近,伯杜瓦大学的统计学家Guido Barbujani进行了其它一些语系的比较分析,这些语系的分布情况可以用农业从黎凡特地区的扩展来解释(例如阿非罗—亚细亚语系,埃拉莫—达罗毗荼语系和初期阿尔泰语系),他发现了类似的相关性。更有说服力的研究工作是对太平洋区域进行的,在这一区域中玻利尼西亚诸语言的散布同遗传证据之间有着给人印象深刻的相关关系。尽管在此情况下,这种相关性并不出乎意料,因为玻利尼西亚人占据的是无人居住的鸟屿。所以他们的迁移既可看成是农业的扩展也可看成是初始的散布。
另一个来自非洲的支待证据得之于日内瓦大学的 Laurent Excofier及其同事所进行的研究工作。他们发现在血液样品中r球蛋白的各变体和说话者所说有关语系之间存在着高度的相关性。这点对阿非罗—亚细亚语系特别显著从而对本文概述的模式提供了支持。然而,对遗传数据与语言数据之间存在相关性的最坚定的鼓吹者是斯坦福大学医学院的 Luigi LucaCavalli— Sforza[参看《科学》1992年3期该作者所著“基因、民族与语言”一文]。他在一项雄心勃勃的实践中比较了具有世界水平的分子遗传数据所得出的谱系树和仅使用语言数据所确定的谱系树。他的研究结果表明,符合程度相当好。
迄今,我举为例证的都是不老于大约 l万年的语言亲缘关系。尽管这一向后的时间长度也比大多数语言学家选作研究的语言的向后时间长度为大,但我论证这一时间长度是合理的方法与其说是通过新的分类,还不如说是由于对已很好确立的语系提出了异乎寻常早的年代。现在沿着堆积派的道路稍微走得更远一点去注意诸如印第安语系和印度—太平洋语系这样一些内含更大的大语系的推测存在就是适合时宜的了。如果认为这些大语系都有其单独的原始语,则它们的起源很可能要远远超过距今2万年前。
或许最为著名的大语系是由两位俄罗斯学者所建立的,一位是已故的 Vladislav M. Illich— Svitych,另一位是海法大学的 Aharon B.Dolgopolsky。他们论证道,印欧语系、阿非罗—亚细亚语系、达罗毗荼语系、阿尔泰语系和乌拉尔语系可以一起归属于一个大语系之内,他们将此大语系称之为“乡土语”Nostratic,来自拉丁语 nostras,“我们的同胞”之意)大语系,此大语系来自于一种原始乡土语,推测原始乡土语是距今 l万5千年前后在中东所说的一种语言。(格林伯格确定了一个相似的大语系——“欧亚语”大语系,它不同于乡土语大语系之处是排除了达罗毗荼语系和阿非罗—亚细亚语系,但包括了爱斯基摩—阿留申语系和楚克奇—堪察加语系。)引人注目的是,这些大语系也显示出同遗传证据的可靠相关关系(正如Cavalli— Sforza所整理排列的那样)以及甚至同某些关于农业扩展的考古证据的可靠相关关系。
语言学的堆积派尚未能使他们的专业同行中的大多数与他们一致。然而,格林伯格的多方面分析方法依靠的是一套肯定会给非专业人员留下深刻印象的词汇证据。而且乡土语学派的确已着手使用历史语言构拟的比较方法。格林伯格由于忽略使用这一方法,而受到他的同事们的严厉批评。事实上,考古和遗传论据问堆积派的某些结论符合得很好。这些解释所取得的成功表明,在这一方向上再花时间和精力进行一些研究工作是值得的。
一些学者,特别是 Ruhlen,甚至认为在大语系之间,例如在印第安大语系和欧亚大语系之间,也存在着广泛得多的基础亲缘关系。这一假说主张,某些现代词形的确可证明是来自我们遥远的非洲祖先在其故乡所说的单一的、终极的原始语。这类主张很难加以检验而且会被大多数语言学家所拒绝。然而,对语言的一元发生说的论据并不同我们所属物种的非洲起源说的考古学、生物人类学、分子遗传学的证据相矛盾。
这些论据是很深的水,但它们好像在传播着真实历史过程的微光。这一设想得到了一些语言学家的研究成果的支持,例如加利福尼亚大学伯克利分校的 Johanna Nichols,她根据可能不会有任何亲缘关系的结构特征来分析语言。她新近对世界各语言的一个典型大样本所进行的饶有兴趣的结构类型学分析使她提出了世界诸语言产生的三个阶段,这同我在本文中提出的顺序是可以协调一致的。
她指出存在两类语言地区。“扩散带”是指由只有一种或二种语系所占据的广大地区;实例有欧洲(由印欧诸语言所占据)和北非(由阿非罗—亚细亚诸语言所占据)。“残留带”是较小的地区,不过每个残留带都含有若干已长期确立的语系;实例有高加索地区和新几内亚。Nichols还把扩散带看成是紧跟最末一次冰期结束之后的若干事件的结果;残留带一般说来是较早的若干初始扩散的残余。还有多得多的工作要作。尽管如此,但在考古证据、遗传证据和至少某些语言证据之间正在出现清楚的趋同现象。因此,一个新的大规模综合的概括性轮廓看来已在望了,这是一个可望在未来十年内不仅能阐明语言多样性而且能阐明基因和文化多样性的新综。