

曹操家族:藏在DNA里的超时空生命记忆
作者:李翊( 2010 年6 月12 日,考古人员在河南安阳曹操高陵墓地内进行现场清理工作 )
人类的进化是可以在人类的DNA里留下痕迹的,DNA记载了人类的结构、信息,也同样是DNA,把这些信息代代相传。一个被普遍接受的理论认为,在传递过程中,DNA会发生微小的变化,经历的年代越久远,DNA变化的就越多。根据这个理论,比较不同物种的DNA,就可以了解不同物种之间的关系,比较同一个物种内不同的群体之间的DNA,就可以了解这些群体之间的关系。在安阳曹氏墓出现之前,复旦大学现代人类学教育部重点实验室正在东亚各民族基因调查的基础上,打算进一步深入到古代家族的基因调查。安阳曹氏墓的出现,对于复旦大学而言,给历史学和人类学联合课题组提供了两个重要的契机:第一,促成了历史学和分子生物学的深层次合作研究,建立了国内第一个以分子生物学为主要研究工具的历史人类学新学科;第二,加快了人类基因调查从以民族向以家族为对象的转变。曹氏墓的DNA鉴定,是这一重大转变的个案。而这种研究范本的最终建立,可以打通一条追寻中华民族融合形成史的路。
并非心血来潮的跨学科联姻
作为复旦大学历史系的一名教授,韩昇一直想寻求学科上新的突破。而2005年,还只是博士生的李辉所在的人类学实验室参与了一个名为“国际基因地理人类迁徙研究计划”的国际研究,李辉因此和历史系有过一些跨学科的合作,这引起了韩昇的关注。
“关于基因、分子生物学,我不懂,但是我很感兴趣。”韩昇在接受本刊记者采访时说。复旦大学人类学实验室创办人金力博士是这个领域的研究专家,他是全世界最早用基因技术做亲子鉴定的,他的实验室在古基因的提取研究和利用基因技术研究人类起源问题上都具有国际一流专业水准。“我们都觉得两个学科可以合作,但具体能做什么,那时并不清晰。”
“国际基因地理人类迁徙研究计划”是由全球15个顶级的人类学实验室共同协作,调查现代直立人的起源和分布,目标是画出一个人类‘谱系树’。就像一棵树那样,从根部到树干,到枝条,再细化到一片叶子,勾勒出现代人类走出非洲后的迁移路线。”李辉所在的现代人类学实验室,负责这项国际研究计划中东亚、东南亚地区的样本采集、分析、测试工作。
( 复旦大学历史系教授韩昇 )
李辉在接受本刊记者采访时说:“我们做的是人类遗传学的研究,我们研究的是人类基因的演变怎么使我们人和人有这么大差别,群体和群体有这些差别,什么时候以及为什么造成的。第一步要把人和人之间的关系搞清楚,就需要研究每个人之间的基因组有什么差别,这些差别的变化速度是怎么样的。这是一个计算分子钟的问题。我们现在把全世界各代表群体的DNA样本很精确地画在一棵大树上,每两个人之间都可以找到他们族群的节点。横向上我们找到很多标记来区分他们,纵向上我们要找到时间变化的速率,再来计算每个祖先的年代,找这个速率最关键的方法就是寻找一个大的家系来计算,这个家系必须是有家谱的。比如一个人是曹操的第75代孙,是从曹丕下来的,另一个人是曹操的第78代孙,是从曹植下来的,他们之间相差的代数是75+78,再看他们两个之间的基因差异,这个基因指的是Y染色体,看两个人各自积累了多少突变,除以他们的代数,我们就会知道他们的突变率是多少。以后再看没有家谱的人,我们就可以通过这个突变率算出来他们之间的时间跨度。这个家系怎么找呢?在国外是很难的,但是在中国相对容易,很多人会记家谱,但是很多家谱不靠谱。普通人的家谱不能用,因为时间比较短,都是从明清时代开始编的,而且很多人会编一个光宗耀祖的祖先。所以我们要找皇族的后代。”
李辉说,最早的突变速率是通过人和黑猩猩的比较计算出来的,人和黑猩猩有500万年的差别,Y染色体积累了多少突变一除就知道了,但是这只是一个粗的值,用它来估算有一定误差。
( 曹操之父曹嵩丧葬殓服“银缕玉衣”。安徽毫州董园村2 号墓出土 )
2009年12月27日,河南省文物考古研究所在安阳县安丰乡西高穴村抢救性发掘一座东汉大墓,出土的三具尸骨,其中男性遗骸测定年龄在60岁,另外两具为中年和青年女性遗骸。考古学家和历史学家根据古资料现场考证研究,认定这座东汉大墓为文献记载中的曹操高陵。消息一发表,立即在舆论界掀起轩然大波,引起对曹操墓真伪的争议。
“这个事情一出来,我们都感觉到机会来了。”韩昇说,“看这个墓的形制,确实是大墓。但具体是谁的墓?要准确回答这个问题,恰好是分子生物学的特长——用基因找人。从现代人的基因反推祖先,曹操是个很好的切入点。我们查看了全国人口普查数据,全国曹姓人口有770万人,这个规模不大不小。李唐能做么?假的比真的还多。秦始皇能做么?后代好像都被灭了。算来算去,曹操最好,不大不小,一方面做了好几代皇帝,有很多后代传下来,也没有太多赐姓,就算有部分赐姓,但是历史记载也很清楚;另一方面,他是一个英雄,但是民间他的口碑不是很好,没人会去冒充他。这样一来,曹家家谱的可靠性更有保证。”
( 严实 )
“这些有家谱自称是曹操后人的人在哪里?怎么保证我们采到这些家系的DNA呢?这些都需要历史学家来论证。这是历史学帮到遗传学。另外,遗传学做了这样的数据又可以帮到历史学,可以解决很多历史问题。”李辉说,首先是曹操的身世,曹操如果是曹参的后代,他是世族身份,既得利益者,那他为什么要提出唯才是举,打破贵族统治制度?这是有矛盾的。这一点历史上从来没有怀疑过。曹操从来不说自己的父亲是怎么领养的,但是他所有的政敌都在骂他,有的说他是夏侯家过继的,有的说他是捡的,这都是在抹黑他。曹操从来都没有反驳过,是不是他心虚?这都是有疑问的地方。历史学没法解决这样的问题,因为没有文献明确记载,但是遗传学可以把这些历史人物的关系理清楚。“能否找到明确的曹操DNA特征,从而分析曹操的身世,对曹操及汉魏历史的研究都有极为重要的意义。”
当舆论为“曹操墓”的真伪争论不休时,课题组检索基因数据库在20万个样本中,找到48个曹姓男性样本。李辉研究发现,48个样本来自三个方面:中原、东北和甘肃青海地区。对比其Y染色体,东北的类型多是M48+,而甘肃青海地区的类型非常杂,没有规律可循,中原的类型主要是M134+。从现有的十几个中原曹姓男性样本来看,李辉认为,其来源“极可能有规律可循”。
( 河南省固始县城关镇居民曹忠义家中珍藏的清乾隆年间的曹氏宗谱 )
2010年1月26日,复旦大学历史学系和现代人类学教育部重点实验室联合宣布,将利用复旦大学人类基因调查的先进科学手段,调查分析曹氏基因,进而给曹操墓真伪的研究提供科学的证据。
依托史料依据的基因测定
因为实验室基因数据库现代曹姓男性DNA样本太少,又没有可以作为标准的曹操家族DNA特征来作为骨骸验证的对照,遗传学无法就安阳大墓骨骸的身份做出判断。于是,2010年,课题组为曹操发了张“寻人贴”:寻找曹操的现代后裔,目的是追溯曹操的DNA特征类型。
在课题组看来,现代社会中,几乎每人都有自己的姓氏。一个人的姓氏不仅仅是简单的符号,还有着丰富的文化、历史、宗族背景。以血缘为脉络的姓氏记录着各家族甚至各民族的源流,常被用于寻根溯源、族群识别、婚姻关系等相关研究。数千年来大部分姓氏都从父传递,而人类基因组中的Y染色体更严格地遵循父系遗传,因此姓氏与Y染色体有很好的平行对应关系。随着Y染色体上众多遗传标记的发现,用Y染色体结合姓氏分析人类学问题的方法,在分子人类学领域发挥出重要作用。
“曹姓作为一个重要的姓氏,同时又具有不大不小的适当规模,被选择为第一个深入研究的姓氏,也开始了人类基因调查从民族分析向家族分析的转变,从史前时期向历史时期的迈进。”参与研究工作的博士后严实告诉本刊记者,“与姓氏不同,人类的Y染色体直接代表着父系遗传,永远是父子相传的,不会受到任何社会文化和自然因素的影响。人体内有23对染色体,其中22对常染色体中,每一对染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成‘混血’的效应,就是遗传学上说的重组。另一对性染色体包括X染色体和Y染色体。在女性体内,X染色体也是成对的,分别来自父母双方,所以也不能避免‘混血’的影响。而在男性体内,却只有一条来自母亲的X染色体和一条来自父亲的Y染色体,也就是说男性的Y染色体只能来源于父亲,所以人体性染色体的遗传方式决定了Y染色体遵从严格的父系遗传。因此,以现代分子生物学技术为基础,研究Y染色体主干的类型分布,是直接追溯群体或者家族父系起源的最佳方法,是验证祖先与后代的父系关联的关键手段。例如,在曹操的后人中分析Y染色体特征,我们就可以了解曹操本人的Y染色体特征。实际上,在一段有较为可信历史记录的时期内,整个家族的姓氏与父系遗传的关联是可以保证的,所以家族的姓氏往往与固定的Y染色体类型共同传递,紧密关联。”
那么如何找曹操的后代?修著家谱是中国人的传统,一些家谱甚至跨越3000年将现代人与其祖先相连,虽然它们的真实性还有待确认。上海图书馆是国内收藏家谱最多的图书馆,收藏的曹氏家谱达到118件。自从曹操墓发掘的消息公布以来,国内好几个地方又陆续出现了一批曹氏家谱,其中也有明确记载为曹操后裔者。因此,调查现存家谱,是了解曹氏族源及其分布情况的一条重要线索。
“研究家谱的学者大多知道,家谱的先世传说并不可靠。就以曹操为例,曹操和他的孙子曹髦对于自家先世的说法就不统一,越附会越远。对于今天调查曹操家族而言,曹氏家谱的起点,应该选择陈寿以来言之有据的传承,那就是始于汉代以来沛郡的曹氏。鉴于曹操家和曹参家早已混为一谈,后世制作的家谱几乎都据此叙述家世源流,故我们把曹参和曹操的后裔都纳入调查的范围。”韩昇说,他的工作就是将家谱所载世系同历史记载相比较,把比较可靠的家谱挑选出来,其中包含自称是曹操后裔的家谱。“把曹氏取样的面铺得广一些,多取一些样本,能够更加全面地反映出自古以来多支曹氏家族的基因状况,获得整体的把握。”韩昇说,“家谱调查反映出,与曹参或者曹操有关系的曹氏,大量分布于长江流域,与史料所见五胡十六国以后曹操家族迁居于江南的情况是吻合的。据此,我们大致确定了几处最接近曹操后裔的居住地,一是位于安徽、山东、河南、江苏四省的交界处,以安徽亳州为中心,这里是曹操政权的发源地,也是安阳汉墓被发现的地区;二是江东地区,包括安徽泾县、繁昌、歙县、绩溪,浙江的金华、东阳、绍兴、余姚、萧山和江西赣州等地;三是湖南等省沿江地区,如湖南兴化、郴州、益阳、长沙等地。曹操后裔在哪里,我们都抽一遍血就都可以验证了。”
“家谱拿过来的时候,我们先当真的,进行分析,如果做出来的结果Y染色体乱七八糟,和普通的曹姓一样,那就证明这是假的。如果Y染色体都一样,那也要看这是不是很常见的,如果汉族人中有一半都是这个类型,那也达不到统计学上的阈值。结果做下来,我们看到有6家一样。”李辉说。
课题组用Y染色体上的100个位点对全国各地曹姓79个家族的280个男性以及包括其他姓氏的446个男性志愿者进行Y染色体分类。根据家谱资料,15个曹姓家族宣称是曹操后代,他们中共有6种Y染色体类型,其中仅有一种类型是曹操的,而其他5种可能是由于收养、从母姓、非亲生等原因而引入的。这就需要通过分析不同类型在家族间的分布来确认哪个才最可能是曹操的Y染色体类型。
“我们把这些曹姓家族分成三类:宣称是曹操后代的、未宣称是曹操后代的、其他姓氏的普通对照人群。我们发现一种叫作O2*-M268的Y染色体类型是唯一在宣称是曹操后代的家族中显著高频出现的,这种类型来自辽宁铁岭、安徽舒城、安徽绩溪、江苏盐城、山东乳山和辽宁东港的6支曹姓家族,且在全国汉族人中都较为罕见。其祖先交汇点在1800至2000年前——正是曹操生活的年代。根据频率分布,我们估算O2*-M268属于曹操的可能性是92.71%。”不过,有没有可能这些曹操家谱都是伪造的,大家一起撒了个弥天大谎呢?课题组也估算了反概率,即出现6个家族都是相同的O2*-M268型,有多大的可能性?由于这些家族分布全国各地,也没有任何联络,所以他们如果来源不同而基因类型相同就只能是由巧合造成的。根据概率理论,6个分布在不同地域的曹姓家族同时是O2*-M268的概率大约为千万分之三,也就是几乎不可能。“对这6个家系所做的Y染色体全谱分析显示,其突变率,发生变化的速度很稳定,约每隔140年会产生一个差异点。到今天,曹丕和曹植两家系的后代相差都在13个点,也与其生活时代基本吻合。”李辉说。
而在其他曹姓家族中,Y染色体O3-002611型是出现频率最高的,也是在宣称曹参直系后裔的5个曹姓家族中唯一出现的类型。经统计分析,O3-002611是曹参Y染色体类型的可能性近于100%。
课题组由此得出结论:曹操的Y染色体类型与曹参并不一致,魏武帝曹操不可能是西汉开国大将、宰相曹参的后裔,DNA证据并不支持曹操的贵族身世。
虽然曹操的现代后裔DNA调查是将遗传学用于古代史研究的一个成功范例,但并没有最终探明曹操的身世之谜。曹操的政敌袁绍在攻曹的檄文中写道“父嵩乞丐携养”,说曹操的父亲是路边捡来的乞丐,关于曹操身世的各种说法由此流传。
在韩昇看来,曹操的祖父曹腾在东汉为宦官之首,位高权重,且出自谯县旧家,他的养子可以继承官爵封地,绝不会随便。按照当时过继承宗祧的基本原则,曹腾的养子,也就是曹操的父亲曹嵩,应该是从本宗他房中过继,除非本宗绝后等特殊情况。
但为了慎重起见,韩昇还是对此进行了史料考证。“曹操的儿子中,有6个过继承宗的例子,无一例外,均取兄弟之子。曹丕儿子中,有4个过继的例子,也全都来自兄弟之子。至于曹操第三、第四代中的过继事例,也毫无例外地来自本宗。据此可知,曹氏家族全部在本宗内部过继。以曹腾旧族出身,兄弟和睦的情况判断,曹嵩必定出自本宗。”
“研究进行到这里,课题组已经成功反推出曹操家族DNA,但如果不能和曹操家族的古DNA成功比对,其实还是存在逻辑漏洞的。”严实说,曹植的遗骸因为保存不善不知所终。2011年初,课题组找到亳州曹操家族墓群,在当地文物主管部门的支持下,进行古DNA鉴定。
曹氏宗族墓群是曹操家族一个规模宏大的墓群,主要包括元宝坑汉墓、董园汉墓、马园汉墓、袁牌坊汉墓、曹四孤堆、刘园孤堆、观音山孤堆等,曹操的祖父曹腾及父亲曹嵩的墓均在其中。这些墓葬大都发掘于上世纪70年代,大部分墓的墓主人还没有确定。其中元宝坑一号墓出土了许多铭文字砖,对考证墓主身份提供了一定线索。依据出土自元宝坑一号墓的一颗牙齿的磨损度推断墓主的年龄在50岁甚至55岁以上,由此判断墓主人最可能是曹腾之弟、曹操叔祖河间相曹鼎。课题组将一颗保存较好,表面还非常坚固的牙齿带回实验室,进行后续的古DNA实验。
“我们在牙齿的右下侧选取了约0.5平方厘米大小来打磨除去表面,再通过乙醇洗涤、紫外线照射来去除污染,之后钻孔,通过零下180摄氏度的液氮将钻孔取出的材料处理成粉末,再通过一系列的反应搜集提取DNA。这次我们成功扩增和检测了元宝坑牙齿的Y染色体上的12个微卫星位点,进而在我们数据库中进行比对得出其类型最可能是O2*-M268,与之前通过曹操现代后裔推定的曹操Y染色体类型一致。这一类型的曹氏很可能就源出安徽,并且由于曹魏政权的辉煌而经历过人口扩张。这也就说明了曹操之父是本宗过继,曹操是出自安徽亳州曹腾家族。”
“乞丐携养”不足信,那么,为什么会有出自夏侯氏之说呢?韩昇解释说,首先,这是曹操的政敌对他的人身攻击;其次,还应该注意一个重要的因素,那就是曹家和夏侯家都是谯县旧门,夏侯家出自西汉创业功臣夏侯婴,他们同属于刘邦创业元勋集团,并且一直居住在本籍地谯县,世代通婚,关系极其亲密。曹操的女儿清河公主嫁给夏侯惇的儿子,可知这种姻亲关系一直维持着。在西汉,曹家和夏侯家同为创业功臣,在曹魏政权下,夏侯家是国家栋梁,于公于私,都是亲上加亲,故旁人容易妄加推测。然而,清代学者何焯早在《义门读书记》中就指出曹操家和夏侯家不可能有相同的血缘关系,否则清河公主和夏侯懋的婚姻就成为兄妹婚,曹操不会这样做的。
从族群到家族
在严实看来,曹操Y染色体类型的确定,文科的学术意义远大于理科。“这一套研究方法早已经是成熟的,或者说是在已有框架下的。技术上,我们和国外的发展是同步的,不同在于国外文理合作得早。这次跨学科合作最大的意义是宣传和喊话,让公众、历史学家、考古学家知道生命科学家能帮他们做什么。”
Y染色体上的绝大部分是从父遗传且缺乏重组,所以可以通过研究历史人物现存后代的Y染色体来揭示历史人物之间的父系关系。近年来,国际上的成功例子有美国第三任总统托马斯·杰斐逊的私生子的确认、犹太教祭司的Y染色体单倍型的推定等。
而另一个有名的例子则是牛津大学人类基因研究所2003年开展的关于成吉思汗后代的基因研究,其结果显示,全世界有近1600万人,大约8%的亚洲人是成吉思汗的后裔,延续了一条完整顺畅的父系遗传链。这个基因研究所的布赖恩·赛克斯教授后来创办了一家“牛津后裔”研究公司,专为人们完善家谱、查找祖先提供帮助。其中,他实施的这项“成吉思汗后裔”基因测试的费用是195英镑(约合350美元),也就是说,如果你想知道自己和成吉思汗有没有血缘关系,花上195英镑就知道了。
不过,从分子人类学来看关于成吉思汗基因的研究,这是个并不严谨的实验。“他们把欧洲常见的R型当成了蒙古的C型。”严实说。
家族研究和族群研究是有区别的。“很多人的类型都不一样,族群研究只是算一个频率,根据这个频率来分析群体和群体之间有多大差别。家族要精确到人,而且是确切的,群体只是一个估算。”
家族的研究早期因为受制于技术手段比较难。严实说:“我们这个实验室成立于2002年4月份。因为技术的原因,早期做的是一代测序,一个样本只能测几十个点,只能做到1万多年前的精确度。而中国的历史是5000年以内的,有史可查是3000年以内的。”一代测序到二代测序是一套技术体系的革新,伴随着与之相关联的微量芯片技术、纳米技术、微量荧光技术、计算机技术快速发展,到2007年左右,二代测序技术开始普及。“2009年我到这个实验室之后,二代测序的技术开始使用在人类学的领域,这样几个G的数据都可以测试出来。现在我们可以通过高通量的技术测到一个人Y染色体的每一个突变。以前我们是根据已有的数据挑出一些点来测,这并不是随机的,通过这种方法我们只能分类,不能定时间。现在我们能把Y染色体整个测一遍,这是一个穷举的过程,相当于是随机的。比如两个样本比较,出现几个突变的位点,再根据突变率来计算这两个人的差距。”严实介绍,刚开始做曹操这个项目的时候,这个技术还不成熟,原来只能测Y染色体几十个位点,现在通过用二代测序对400万个碱基进行测序,已经发现4000多个可变位点,这样精度就提高了很多。以后的技术可以测到1000万个碱基左右的序列,基本就是Y染色体的可以检测的全序了。在目前已测的400万个碱基里,大约平均每250年会发生一个突变,如果两个现代人在这么大的范围总共差了12个点,这些点在传下来的两支都可能发生,那么这两个人的共祖时间大概会在1500年左右。
严实说,“我们之前做很多检测其实不是用来认定而是用来排除,我们用99%的概率都能把其他选项排除其实也接近认定了。比如我们做现代人,两个姓张的人来问我们是不是一家,比如17个SPR,只有一个点不一致,我们不能直接认定。如果我们使用二代测序把两个人的Y染色体测了全序,只差两个碱基的话我们才能说这两个人在几百年之内是亲戚。”
对于人类进化来讲,科学家最感兴趣的也最方便研究的是两条DNA,一个是男女都有、单纯来自母系的线粒体DNA,另一个是只有男性拥有的、单纯来自父系的Y染色体DNA。这两个DNA的变化相对较快,来源也非常清晰,不像其他的DNA,有可能来自父系,也可能来自母系,研究起来很不方便。“线粒体也可以做出一颗和Y染色体差不多的树,但是线粒体有几个问题,现代社会基本都是父系社会,姓氏都是跟着父亲走,母亲和你民族、姓氏可能是不一样的,这样就没有历史资料往前追溯。不像Y染色体,做出来的结论可以和民族、语言、姓氏来做比对。”严实说。东亚绝大多数民族是父系社会,同一个父系的子女生活在一起,经常形成同姓村,而女性在嫁娶时流动。这样,孩子的语言、民族属性等一般都是随父亲的,这也是Y染色体(父系)和民族关联更紧密,而线粒体(母系)和地理区域关联更紧密的原因。
实际上,Y染色体推测历史人物的深度还可以往更古老的年代推进。通过可靠的家谱信息可以重建跨度极大的家系,这样的家系可用来推断其遥远祖先的Y染色体单倍型,为解决历史悬案提供新途径。这样的大跨度家系对研究Y染色体的突变率及其进化机制也都有重要意义。
“普通男性来测试,想知道自己祖先是谁,不同年代的尺度不一样,追溯到五六万年前可能是一个走出非洲的人,追到五六千年正好是中国的几个超级祖先,追到两千年或许就是类似曹操这样的人物。”韩昇说。
(参考资料:韩昇:《曹操家族DNA调查的历史学基础》;王传超:《DNA揭开曹操身世之谜》;王传超、严实、侯铮、傅雯卿、熊墨淼、韩昇、金力、李辉:《Y染色体揭开曹操身世之谜》;王传超、严实、姚灿、黄修远、敖雪、王占峰、韩昇、金力、李辉:《曹操叔祖的古DNA结果与曹操后世子孙一致:对Y染色体解开曹操身世之谜的评论》)(文 / 李翊 阿润) 超时空DNA家族曹操生命记忆