印欧语系的起源

作者:袁越

印欧语系的起源0

一个伟大的理论,往往能用在很多领域。比如,和爱因斯坦的相对论一样,达尔文的进化论也有狭义和广义之分。狭义进化论指的是生物进化理论,广义进化论的基本原理和狭义的相同,但应用涵盖要广得多,在很多领域都可以用到。

简单来说,任何一样东西,只要满足以下四个条件,就可以用进化论加以解释:一、可以复制自己;二、复制时偶尔会出现差错;三、不同的差错有不同的成活率;四、差错可以被继续复制下去。

显然,DNA分子是完全满足这四个条件的。除此之外,信息在人群中的传播也满足这四个条件,这就是为什么英国科普作家理查德·道金斯(Richard Dawkins)在《自私的基因》一书的最后一章里发明了“密母”这个新概念来形容信息的传播,他认为信息可以分成一个个难以分割的小单元,和基因很相似,密母(Meme)这个词就是在基因(Gene)的基础上生造出来的。

语言也是信息的一种,语言的演变史是否可以用生物进化的思路去研究呢?传统语言学家反对这种做法,但新一代研究者却早已迫不及待了。新西兰奥克兰大学(University of Auckland)计算机专家罗素·格雷(Russell Gray)教授和他领导的一个研究小组试图把遗传学的研究方法移植到语言学研究当中去,取得了革命性的突破。

语言学研究的热点之一就是印欧语系的起源问题。印欧语系是世界上使用人数最多的语系,广泛分布于欧洲、西亚和南亚地区。关于印欧语系的起源有两种理论:一种理论认为它起源于黑海北方的大草原(Pontic Steppes),大约在6000年前被一个名叫库尔干(Kurgan)的游牧民族带到了其他地方;另一种理论认为印欧语系起源于安纳托利亚(今土耳其),是在8000~9500年前伴随着农业的传播而散布到世界各地的。

前一派的主要论据来自动植物词汇,他们假设一种语言中如果出现了只在特定地区才有的动植物名称,比如“鲑鱼”和“山毛榉”之类,那么这种语言就很可能起源于该地。但是反对派则认为,因为气候变化等原因,古代动植物的分布情况很可能和现在大不相同,因此这个方法很不可靠。

那么,有没有可能运用遗传学分析中所使用的数学工具来研究语言的起源呢?众所周知,基于DNA顺序变化的数学分析法可以用来推测生命进化的顺序和时间,数学家们只要假定DNA突变的概率是固定的(很容易找到符合这个要求的DNA片段),就可以通过简单的数学计算分析出两种不同物种的共同祖先是谁,以及何时分家的。这样的分析程序已经发展了几十年,相当成熟。

2003年,格雷教授用这个方法分析了200个所有语言里都会有的词汇,比如“我”和“天空”等,然后将它们在各种语言中的变体用数学的语言加以定义,再输入到现成的遗传学分析程序中分析,得出结论说,印欧语系的各种语言分家的时间大约在7800~9800年前,符合第二种假说。

这篇论文发表在当年出版的《科学》(Science)杂志上,引起了很大争议。这个方法只分析出了语言分家的时间,得出的结论相当原始。格雷的学生昆汀·阿特金森(Quentin Atkinson)继承了老师的衣钵,采用流行病研究领域常用的一款分析软件,找出了印欧语系的确切诞生地。

在流行病学领域,很多时候需要医生们通过分析各地采集的样本,推断某种病菌或病毒源自哪里。这不光是遗传问题,还涉及地理学。比如,如果两个地方相隔很远,或者隔着一道山峰,病菌是很难直接传播过去的。因此,研究人员必须想办法把地理信息转变成计算机语言,和遗传信息混在一起进行分析。经过科学家多年努力,这种分析方法已经很成熟了,有了专门的分析软件。阿特金森仿照上次的方法,把语言的变化和地理数据同时输入到计算机中,得出的结论明显支持安纳托利亚起源说。

这篇文章发表在今年8月24日出版的《科学》杂志上。阿特金森对记者说,他采用的方法叫做贝叶斯种群地理研究法(Bayesian Phylogeographic Approaches),此法虽然很抽象,也很另类,但它正在得到越来越多的语言学家的支持,前景一片光明。(文 / 袁越) 科学科普印欧语系起源印欧语