奎克教授和他的基因组

作者:曹玲

(文 / 曹玲)

奎克教授和他的基因组0( 北京大学化学系教授黄岩谊 )

5万美元测一个基因组

奎克(Stephen Quake)教授的女儿患有严重的花生过敏,这给奎克的家庭带来很多不便,他们要随时随地留意食品的成分标签,外出旅行时也自己准备食物以防发生不测。据统计,美国有150万人受不同程度花生过敏的困扰,至于患有其他各类过敏症的人更是数以千万计。关于过敏症的原因,科学家们一直众说纷纭,奎克希望他的研究有助于解开过敏之谜。“我想知道我的基因组中有没有有效的信息来解释,为什么我的女儿患有严重的花生过敏,或者基因是否影响了我选择哪种生活方式?我对这些很感兴趣。”奎克教授在接受采访中告诉本刊记者。

他使用了一台叫做HeliScope的测序仪,由美国螺旋生物科学(Helicos BioSciences)公司开发,他也是公司的创始人之一。这台仪器类似冰箱大小,打开一扇门之后就是触摸控制屏,将等待测序的试剂放入上样槽内,按动运行按钮之后不用管它,数周后测序任务即可完成。奎克教授今年8月发表在《自然—生物技术》杂志上的文章称自己为“零号病人”,意思是自己是使用Helicos技术绘制基因组的第一人。

此次测序所用的花费只有5万美元,只需一台仪器和3个人就完成了若干年前的浩大工程。2000年,人类基因组计划启动,历时13年,耗资近30亿美元,动用了来自世界各国的数百名科学家才得以完成。这个数字意味着,大规模基因测序工作只能局限于在专业测序中心完成,供大型、昂贵的研究项目之用。而奎克的研究则把个人基因组测序的价钱从一架飞机降低到一辆中等豪华汽车,在实验室里就能完成。为此,他说:“这比半导体行业中的‘摩尔定律’发展更加迅速。”

“个人基因组测序变得廉价和简单是大势所趋。科学家得到的人类基因组编码越多,他们能发现的特殊基因和突变越多,所能读出的信息越多,比如为什么每个人都与众不同,疾病如何侵害我们,我们对药物有什么反应。”奎克告诉本刊记者。研究人员最终能够找到阿尔茨海默氏症、白血病、前列腺癌等疑难疾病的变异基因,制药公司也能设计出更有针对性的治疗药物,而医生则可以预测人们可能会得什么病,并提前预防治疗。等到测序价钱降到足够低时,每个人都可以获取一张写有自己基因组序列的光盘,医生会根据你对药物的敏感度和承受能力,设计出适合你自己的个性化医疗方案。

奎克教授和他的基因组1( 斯蒂芬·奎克 )

近水楼台先得月,奎克已经从自己的基因组中得到了喜忧参半的消息。坏消息是,他携带了一种和心脏病有关的罕见的突变,这意味着他可能会患上心脏病;好消息是,他对降低胆固醇的药物反应良好。此外,奎克一个调节生物钟的基因上存在有一个特定的单核苷酸多态性(SNP)。SNP是人类基因组的一种微小突变,DNA上的某个“字母”被另外一个字母取代了,比如AAG变成了ATG。把许多健康人和疾病患者的SNP结果放在一起,从SNP的分布状况就可以显示出致病基因的一些蛛丝马迹。2008年一项关于基因与性格的研究表明,存在这种特定SNP的人会比较乖僻。为此奎克开玩笑说,“根本不需要看基因组,问问我太太和系主任就知道我是什么样的人”。

“他是有点乖僻,倒也不是偏执,只是有时候好像显得不那么友好,很少和人漫无目的地聊天,一部分原因是珍惜时间,一部分原因是性格决定的。”北京大学工学院先进材料与纳米技术系黄岩谊研究员在接受采访中告诉本刊记者,他曾经作为博士后在奎克的实验室工作过一年,认为奎克是个惜时如命的人,思维活跃,有很多发明。2002年,年仅33岁的奎克就被《福布斯》杂志评为会改变人们生活的15位科学家之一。

奎克教授和他的基因组2

去年,奎克发明了一种产前检查唐氏综合征的办法,被《时代》周刊评为2008年十大医学进展之一。这种方法只需要提取少量孕妇的血液,就能从中找出在母亲血液内循环的非常微量的胎儿的DNA,从而进行检测。而以往的常规方法则是进行羊膜穿刺,提取羊水后进行检测。相比之下,新方法大大降低了母亲的痛苦和流产风险,在美国这个高龄产妇较多的国家有很大的应用价值。

至于女儿的疾病,奎克告诉本刊记者:“基因组可能无法找出答案。免疫系统具有这样一个有趣的特征:它能重排基因组。所有的免疫球蛋白(抗体)基因在B细胞和T细胞中重排,这其实是一个表观遗传学问题,我对这个问题非常感兴趣。我们春季在《科学》(Science)杂志上发表了一篇论文,描述了如何来测定一个模式生物(本研究中是斑马鱼)表达的所有抗体的序列。对免疫系统功能失常这些问题,我采用了一种更直接的表观遗传学的方法,不过也可能是经典遗传学会更有用些。”

接下来,他希望分析理解已经完成测序的3个与白血病和癌症有关的基因组,从中读出一些奥秘。

从一架飞机到一辆汽车

2003年,第一份人类基因组序列图谱公布,被称作“人类基因组序列”。事实上,这个计划测定的是一小群人基因组的混合体,这些被测者的姓名是保密的。但所有人的基因组99.9%的部分都是相同的,只有0.1%的不同,所以这份基因组图谱称得上是人类基因组的参考图。

人类基因组包含了无数秘密,它由30亿对核苷酸分子组成,每个核苷酸分子包含4种碱基(简写为A、C、G、T)中的一种。这4种碱基组成了遗传字母表,由它们编码的遗传信息就储存在DNA中,碱基通过精确的互补原则进行配对后,形成了我们所看到的阶梯状DNA结构。也正是由于互补配对原则,当我们沿着一条链阅读其中的碱基序列时,也就知道了另外一条链的序列信息。

长达30亿对碱基的基因组序列,分布于23条独立的染色体中。人类通常具有两套这样的染色体,共46条,一套来自父亲,一套来自母亲,两者间存在0.01%的差异,所以人的全基因组实际上应该包括60亿对碱基。这4种碱基之间只存在比纳米级别还微小的差异,如何区分它们之间的差别是一个棘手的问题。虽然可以通过扫描隧道显微镜这样的物理检测手段,但是数以亿计的碱基对主要还是依赖于化学方法来完成。

“桑格法测序被称为第一代测序技术,人类基因组计划就是使用的这种技术。”黄岩谊告诉本刊记者。这种技术是上世纪70年代,由弗雷德里克·桑格(Frederick Sanger)发明的,成为今天大部分测序方法的基础。在这种测序方法中,DNA需要经过多次复制,以制造出足够数量的DNA片断。在此复制过程最后,会得到许多长短不一的DNA片断,这些片断的末端会加上带有荧光标记的终止碱基。然后通过一种被称为“电泳”的技术,根据分子大小的不同将这些片段分离开来。最后,由荧光监测仪读出每个片断末端标记的荧光信号,并将荧光信号转化为原始链上对应的碱基序列。

桑格测序法发明数十年来,一直具有准确可靠的优点,但也给基因组测序贴上了数亿美元的价格标签,相当于一辆大型客机的价格,让研究者生畏。因此,以后改进的许多测序方法,都以提高测序速度、降低测序成本为目的。到了人类基因组计划的后期,技术开始显著进步。1998年,美国的科学怪人克雷格·文特(CraigVenter)领导的塞莱拉基因技术公司(Celera Genomics Corporation)开始着手进行独立的人类基因组测序工作,预算是3亿美元,只是人类基因组计划的一个零头。2000年,两个项目组同时完成了测序工作。

“随后出现了第二代测序技术,以3个美国公司为代表,分别是Illumina生物技术公司、罗氏旗下的454生命科学公司和应用生物系统公司(Applied Biosystems,ABI)。3个公司的方法都比较相似,用一个PCR为基础的扩增技术,通常都是利用荧光来读取信号。”黄岩谊介绍说。

2007年6月,美国贝勒医学院和454生命科学公司宣布,测出了詹姆斯·沃森(James Watson)的基因组,沃森是DNA双螺旋结构的发现者之一、人类基因组计划的前负责人。这一颇具象征意义的项目只用了3个月时间,被称为“第一个花费100万美元以下的个人基因组”。2007年9月,文特也把自己的基因组序列公之于众,供各种机构研究。当时的分析显示,他的耳朵可能产生湿耳垢,可能存在反社会行为的倾向,以及患老年痴呆症和心血管病的风险。

第二代测序技术的进展让人类基因组测序的费用降低到10万美元以下,这个数字还在不断降低。对单个DNA分子进行测序的第三代测序仪也加入到这场比赛中,让竞争更加激烈。此次奎克把绘制自己基因组的价格降低到5万美元,则被称为第三代单分子测序的开山之作。

“传统方法要把样品放大,第三代测序技术不需放大样本,它针对单个分子,只检测单个DNA片段。这种测序仪实际上是一台非常高级、快速的显微镜,它的自动化集成度很高,不会因为任何一步耽误时间。”黄岩谊告诉本刊记者。

在这个过程中,需要用特殊的试剂把DNA链切碎,每次只测一小段,平均能读出30多个碱基。而基因组有30亿个碱基,30多个只占亿分之一,接下来就要把基因组序列拼接出来。“比如你不知道‘滚滚长江东逝水’这个句子,你只是先读到了‘滚滚长江’,又读出‘长江东逝’,接着是‘东逝水’,结果你会拼出‘滚滚长江东逝水’这个句子。测序的两个重要部分在于,第一是硬件,如何读出信号,基于单分子测序的商业化方法有几种,每个方法都有优缺点,工作时要保证如何不产生缺失,同时又不会额外多加碱基上去。第二是软件,拼接基因组时软件要有特殊改造,要在数据分析上下工夫,奎克小组发展了新的软件以配合新的测序技术。硬件和软件的结合使得奎克的测序工作不到4个星期就完成了,而要有效地阐释序列,得到有意义的结果,还需要进一步的数据分析,这次奎克发表的文章在序列得到后,整理分析数据又花了几个月。”黄岩谊这样解释。

1000美元,你会不会测量             自己的基因组?

第三代测序技术使得“1000美元基因组计划”这个目标越来越近了。2004年,美国国家卫生研究院(NIH)提供“革命性基因组测序技术”项目的基金,向科学家发起了挑战:计划到2009年,达到每测定一个人的全基因组序列只花费10万美元的目标;到2014年,费用将降为1000美元。

2006年,美国的民间基金会(X-prize)提出了1000万美元的奖励,奖给首先能在10天之内测完100人的基因组的研究组,而且要求测定每人基因组的费用在1万美元以下。而为了让诱饵更吸引人,他们还开出另一个条件,倘若某个团队再多破解100人的基因组密码,将得到100万美元的额外奖励。这100人包括某些富有的捐赠者,以及微软的共同创办人保罗·艾伦(Paul Allen)和Google创办人赖利·佩吉(Larry Page)。X-Prize基金会之前曾赞助千万美元的太空竞赛,鼓励民间组织上太空,结果航空先驱布特·鲁坦(Burt Rutan)在2004年以宇宙飞船一号独得奖金。

重奖之下,必有勇夫。“基因测序领域的竞争非常激烈,这是一件好事,只有这样才能更好地提高技术水平,同时又让成本更快地降下来。以目前的情况来看,两三年之后应该有希望实现1000美元基因组计划。不过推广到医疗领域还需要一段时间,对此我比较乐观。”黄岩谊说。

目前,有一些公司已经推出“准个人基因族测序”的服务,“人类基因组中99.9%都是相同的,实际上那不同的0.1%是非常重要的,是研究人员的兴趣所在。人与人之间的不同,以及和遗传疾病相关的信息都隐藏在其中”。这些公司所推出的测序服务,关注的正是这些不同之处,“打比方来说,如果只想知道和乳腺癌相关的突变,就可以只扩增所需的DNA片段即可。但是全基因组是最终解决办法,这是为什么大家主要在这个领域工作的主要原因”。

黄岩谊告诉本刊记者,他已经打算在条件成熟后测量自己的基因组:“1000美元我肯定会去测,就算是1万美元我也可以接受,一半是好奇一半是出于健康考虑,这实在是太吸引人了,你可以结合自己的家族史提前得知自己得各种疾病的倾向。”

当黄岩谊和奎克讨论对自己的基因组测序得到什么结果这个问题时,奎克冲他一乐说:“我会死。”黄岩谊说:“不用测基因组我也知道你会死。”奎克说:“我知道我会以哪些方式死掉。”■ dna测序技术生物技术dna提取dna序列dna科学第二代dna测序技术科普碱基互补配对原则第三代测序技术奎克基因组教授