​基因家谱

作者:袁越

(文 / 袁越)

​基因家谱0

俗话说,如果两人姓一个姓,500年前是一家。可惜这个说法很不可靠。一来某个姓氏可能有多个起源,二来很多人不姓父亲的姓。同理,家谱也不一定可靠,万一祖上某一辈有个私生子,后代们可就都不好说了。基因则不然,它是按照一定规律从祖先遗传下来的,这是人类最可靠的家谱。不过基因家谱上写的不是文字,而是DNA上的一个个碱基对。人类大约一共有30亿个碱基对,数量巨大。因此直到科学家发明了快速DNA测序的方法后,人们才慢慢开始读懂了基因家谱隐含的秘密。

去年有报道说现在世界上大约有1600万男人都是成吉思汗的后代,今年10月份的《美国人类遗传学杂志》又报道说大约有150万男性蒙古人都是努尔哈赤的爷爷觉昌安的后代。这两项结论都是依靠对Y染色体的DNA序列分析得出来的,因为人类的其他22对染色体会发生重组,也就是配对的染色体之间互相交换相应的DNA片断。这样一来,家谱分析工作就会变得相当复杂。但与Y染色体对应的是比它大得多的X染色体,两者之间没有基因重组,因此一个男人的Y染色体完全来自父亲,与母亲一方没有任何关系,分析起来就简单多了。

可是,Y染色体很小,隐藏的信息有限。有没有办法对其他染色体的家谱进行分析呢?办法很多。其中比较有趣,也比较容易理解的一种办法就是分析隐性致病基因。我们知道很多疾病都是由于基因突变所造成的,但人类有两套染色体,也就是说每个基因都有两个拷贝,一个坏了还能依靠另一个好的,只有当两个坏基因碰在一块的时候才是致命的。

单个基因的长度从几百碱基对到几万碱基对不等,基因上的很多位点都能够发生突变。比如有一种基因决定了人是否能尝到PTC的苦味。PTC是一种植物毒素,尝到苦味可以让人类避免误食这种有毒植物。这种基因目前已经发现了7种类型,最常见的两种类型占据了大部分人类的基因组,而其中比较罕见的4种类型只在非洲人当中才能找到。这说明PTC味觉基因的变异最早发生在非洲,其中的两种通过人类大迁徙(所谓“走出非洲”)而逐渐传遍了整个地球。这是“人类非洲起源假说”的又一个很好的例子。

那么,既然基因突变是随机发生的,怎么才能够证明一个变异是源自祖先,还是后代新发生的突变呢?这是通过分析DNA顺序来知道的。如果很多人的突变基因周围的DNA顺序都是一样的,那就说明这些人的突变基因来自同一个祖先。这段大家共有的相同顺序生物学上叫做“单型”(Haplotype),这就好比是祖先遗留下来的一个信物,一代一代传下来,而且只传自家人。分析“单型”比单独分析基因突变更有意义,比如,著名的“镰刀型贫血症”基因突变都发生在同一个DNA位点上,看似大家都源自同一个祖先。但该突变周围的DNA序列是不同的,调查发现世界上一共存在5个单型,分别分布在非洲和中亚地区,这说明人类在演化过程中一共有5个人各自发生了基因突变,并把这一突变遗传了下来。也就是说,如果你带有“镰刀型贫血症”的基因,你还得请科学家测出突变位点周围的DNA顺序,看看符合哪个单型,才能确定你的祖先到底是来自南非还是伊拉克。

单型的长短还可以用来推测出突变发生的年代。要想明白其原理,可以简单地把一对染色体想象成两副扑克牌,一副红桃一副黑桃,不过不是A到K,而是1到1亿。现在让一个不太熟练的人开始洗牌,第一代还能分清哪副是哪副,几代之后恐怕你就分不清了。假定一开始红桃那副牌里混进了一个梅花,第一次洗牌的时候梅花肯定还是被红桃包围着,越往后周围的红桃就越少。对于基因来说,每经过一次基因重组就等于洗一次牌,某个变异(梅花)周围的DNA顺序(红桃顺序)一直不变,这就是“单型”。而单型的长度越短,遗传的代数(洗牌次数)就越多。

上面提到的那个PTC变异的单型就很短,大约只有3万个碱基对。这说明这一变异发生的年代十分久远,据推算已经有10万年以上。除了非洲之外,世界其他地方没有独特的单型出现,这表明人类的祖先当初走出非洲后一直很团结,没有和沿路的其他人种发生过基因交流。

一句话,关于TPC单型的研究再一次表明整个人类都源自多年以前的一个非洲部落,大家不管肤色黑还是白,姓张还是姓史密斯,N年前其实都是一家人。■

上一篇: ​NBA的商务男装
下一篇: ​悲惨式竞争