基因工程的新时代

作者:袁越

基因工程的新时代02014年11月9日,年度科学突破奖得主多娜(左)和卡朋特尔在颁奖典礼上

生物学的技术瓶颈

生命科学研究领域面临的最大问题是:发展速度太慢了!

这个领域的第一项重大突破发生在1953年,DNA双螺旋结构就是在这一年被发现的,从此人类掌握了生命密码,学会了如何阅读“生命之书”。20年后,也就是1973年,人类第一次成功地将一段外源基因导入大肠杆菌,学会了如何书写“生命之书”。自那之后的40年里,人类学会了如何修改高等动植物的“生命之书”,如何快速测定人类基因组序列,如何借助基因组技术预测遗传病的发生,如何利用基因序列分析技术来描绘古生物的进化史……这些成果看似精彩纷呈,但却鲜有真正惊世骇俗的重大突破。更重要的是,普通人的生活并没有因为这些新的发现而发生实质性的变化,绝大多数慢性疾病依然无法根治,农业依然耗时耗工并且污染环境,物种灭绝的速度反而越来越快了。

对比一下几乎在同一时间取得开创性突破的计算机领域,差异尤其醒目。

问题出在哪里呢?答案是:缺乏工具。生命现象极为复杂,本来就很难研究,作为生命蓝图的DNA更是一个极为特殊的分子,它极细,直径只有0.2纳米;又极长,一个人体细胞内的DNA完全展开后超过2米;它还十分脆弱,无论是物理方法还是化学方法都很难对其进行精确的操作,只能借助仿生学的手段,利用生物界已有的工具,才能完成这个重要而又艰巨的任务。

基因工程的新时代11953年,詹姆斯·沃森(左)和弗朗西斯·克里克共同发现了DNA双螺旋结构

这方面的一个经典案例就是多聚酶链式反应(PCR)。想象这样一种情况:你费尽千辛万苦拿到了犯罪嫌疑人留下的几个DNA分子,但因为数量太少,很难进行定性研究,必须将其扩增若干亿倍才行,你会怎么办呢?过去的办法是先用高温打开DNA双链,然后加入一小段引物,让它和其中的一条链相结合,最后加入DNA聚合酶,这个酶在引物的带领下复制出一条和原始DNA完全相同的新DNA分子,这就是PCR。这是个指数增长的过程,只要将同一过程循环几十次,就可以得到足够多的DNA分子了。问题在于第一步反应需要在极高的温度下进行,普通DNA聚合酶在这样的高温下会失活,所以每一轮循环开始前都必须重新添加新的酶,导致这个听上去很简单的PCR反应无论是材料成本还是时间成本都极为高昂,而且很容易出错,得出的结果也很不可靠,很难用于法医鉴定。

为了解决这个难题,很多科学家动了不少脑筋,试图改进现有的酶系统,使之能耐高温,但都无功而返。1983年,一位名叫加里穆里斯(Kary Mullis)的美国科学家灵机一动,为何不去大自然中寻找答案呢?于是他去了美国的黄石公园,从温泉中生活的细菌体内提取出一种耐热的DNA聚合酶,高温下不会失活,这样就不用每次都换新酶了。改进后的DNA聚合酶(Taq)不仅耐高温,而且准确性也大大提高。如今做一次PCR只需3~4个小时,成本也降到了10块钱以下,一名实验员一天可以做好几百次,误差率也大大降低,完全可以用于法医鉴定了。

基因工程的新时代2美国坦普尔大学病毒学家卡梅尔·卡里里(左)和同事们一起做HIV病毒清除实验

30年后的今天,我们可以毫不夸张地说,PCR技术几乎决定了生物学研究的走向。如果没有这项技术的话,今天大家耳熟能详的亲子鉴定、DNA法医、遗传病预测、转基因育种、遗传考古、流行病监测和基因治疗等等新技术都不太可能实现,生物学领域至少倒退20年。

PCR技术的发展史说明,生物学研究已经进入了技术瓶颈期。关于生命的理论已经积累得差不多了,所缺的就是技术。因为技术手段的不足,很多理论无法应用于实践,普通老百姓很难享受到生命科学带来的好处。

基因工程的新时代3美国科学家加里·穆里斯

就拿基因工程来说,谁都知道基因对于生命体来说非常重要,谁都明白基因工程技术有着巨大的潜力,但因为缺乏有效的工具,科学家们很难在一条DNA长链上准确地找到目标靶点,这就相当于为这项技术套上了沉重的锁链,严重阻碍了基因工程的商业化进程。

举个实例:最早的植物转基因育种是用“基因枪”导入外源基因的。顾名思义,这就是一种依靠物理方法把外源基因“打”入植物细胞的装置,这套装置的效率本身就很低,再加上被导入的DNA片段只能随机地整合到植物细胞的基因组当中,整合到哪个位置全凭运气,只有当整合的位置恰到好处,既不破坏原有的基因,又可以被植物细胞识别并发挥正常功能时,才能算成功了,这就是为什么植物的转基因实验难度是如此之高的原因,每转一个基因都需要重复成千上万次,然后再从中筛选出科学家所需要的品种,工作量超大。

DNA的定位问题困扰了科学家很多年,严重阻碍了生物学研究的发展。上世纪80~90年代发现的锌指核酸酶(Zinc Finger Nuclease)和类转录激活因子效应物核酸酶(TALEN)部分地解决了这个难题。这两种酶系统的原理很类似,都是利用蛋白质和核酸(DNA)之间的特异性结合来解决基因组的定位难题。但是蛋白质和核酸毕竟属于两类物质,两者之间的结合力相对较弱,而且结合方式很难预测,科学家们必须针对每一个DNA序列重新设计一个全新的酶,这就大大提高了实验的难度。

举个更通俗的例子。假设一名编辑要对一本牛津大辞典那么厚的书做个修改,在“星期二上午去了趟单位”这10个字后面加上一句话。在没有更好的办法之前,他唯一能做的事情就是一页一页地翻,凭借目力把这10个按照特定顺序连在一起的铅字给找出来。显然,这个方法一来很慢,二来目力毕竟不可靠,很容易出错,你有可能会被“星期三上午去了趟单位”或者“星期二下午去了趟单位”给骗了,不小心改错了地方。

当然了,这个方法虽然笨,但只要花得起时间还是能解决问题的。过去那种“基因枪”法就好比是随便选个地方补上那句话,然后期待你随机选中的那个位置正好是在“星期二上午去了趟单位”这10个字的后面,成功的概率可想而知。

显然,要想从根本上解决这个问题,唯一的办法就是改变检索方式。PCR的例子告诉我们,新的方式只能从现有的生物中去寻找。

从获得性免疫到新检索系统

故事要从1987年讲起,日本科学家在那一年发现大肠杆菌基因组中存在一个特殊结构,一段段重复序列之间连着一小段间隔DNA,后人称之为“成簇的规律间隔短回文重复序列”(Clustered Regularly Interspersed Short Palindromic Repeats,以下简称CRISPR)。这个CRISPR很像是一根烤串,重复序列就是中间的那根竹签,从头到尾都是一样的。间隔DNA就好像是插在竹签上的小肉块,羊肉、牛肉、板筋……每一块都各不相同。

后来的研究发现,大约有40%的细菌当中含有类似的CRISPR结构,古细菌当中这个比例更是高达90%以上。但是科学家们一直不知道这个CRISPR到底是干吗用的,直到2005年才有人发现那些间隔DNA顺序大都来自细菌病毒(比如噬菌体),这才意识到CRISPR很有可能是为了对付病毒感染而进化出来的防御机制,类似于一种原始的免疫系统。

后续实验证明了这个假说。原来,细菌和其他高等生物一样,也需要防范来自病毒的侵袭。为了实现这个目的,古细菌进化出了一套防御机制,每次有病毒入侵,细菌就将来犯之敌的DNA切成碎片,选取其中最典型的一个小片段作为标记物,整合到自己的基因组当中。随着入侵病毒的种类越来越多,这些标记物越积越多,这段DNA序列也越抻越长,就好像在一根竹签上不断添加小肉块一样,最终的结果就是CRISPR序列。

这个CRISPR序列很像是一本花名册,记录了所有来犯之敌的姓名和属性。这就好比说,假如来犯之敌是牛,就切一块牛肉下来作为标记,以此类推。如果这个敌人此后还敢再犯,细菌便可以迅速地从这个花名册中找出相应的标记物,将其“翻译”成相应的一小段RNA作为探针,和一个名叫Cas的DNA酶组成CRISPR-Cas系统,抵抗来犯之敌。这套CRISPR-Cas系统很像是一个“特勤二人组”,与CRISPR相对应的那一小段RNA好比是侦察兵,负责寻找目标,后面跟着的Cas酶好比是战斗队,专门负责杀敌,也就是把目标DNA一切为二。如果入侵的是DNA病毒的话,这就等于宣判了病毒的死刑。

这套系统和免疫接种非常相似,所以又被称为“细菌的获得性免疫系统”。不过,这个发现虽然很有趣,但毕竟属于微生物领域,貌似和老百姓的日常生活没什么关系,所以在微生物圈之外很少有人知道。

这个状况在2012年发生了根本的改变。事情源于2011年在波多黎各首都圣胡安(San Juan)召开的一次科学会议,就在这次会议上,来自瑞典于默奥大学(Umeá University)的曼纽尔卡朋特尔(Emmanuelle Charpentier)博士与来自美国加州大学伯克利分校(UC Berkeley)的詹妮弗多娜(Jennifer Doudna)博士相识了,两人都是微生物免疫领域的后起之秀,又都是女性,所以聊得很投机,当即决定建立长期合作关系,共享资源。

科学界像这样的事情经常发生,本也不足为奇,但巧的是两家实验室各有一位波兰研究员,两人居然都来自同一个波兰小镇,说同样的方言,于是她俩经常借助Skype网络打长途电话,相互交流想法,共享数据。思想的相互碰撞很快擦出了火花,一个伟大的想法浮出了水面。

原来,不同细菌的CRISPR-Cas系统各有不同之处,科学家们将已知的CRISPR-Cas系统分为三类,Ⅰ类和Ⅲ类都使用一个庞大的蛋白质集团作为DNA酶,但Ⅱ类系统的DNA酶只有一个相对简单的蛋白质,称为Cas9,链球菌(Streptococcus pyogenes )所使用的就是这样一个Ⅱ类系统。两家实验室的科研人员经过讨论后发现,只要对链球菌的CRISPR-Cas9系统进行一些修改,简化其中的RNA标识物,就可以制造出一个DNA切割系统,其标识物由一段只有20个字母长的RNA来担当,这就大大简化了基因工程的操作程序,准确性也将得到提高。

前文说过,以前的基因工程操作缺乏应手的工具,尤其是DNA定位非常困难,基因工程师们要么瞎猫碰死耗子,广种薄收,要么用蛋白质来作为DNA分子的标识物,但是蛋白质和DNA毕竟是两种不同的分子,两者之间相互作用的机理非常复杂,科学家们必须针对每一个DNA序列单独设计一个与之对应的标识蛋白质,难度大,成本高,耗时长,涉及此类蛋白标记物的基因工程实验往往需要耗费几个月甚至一年的时间才能出结果,严重影响了研究进度。

CRISPR-Cas9工具就不一样了,它用的是RNA作为标记物,而RNA和DNA都是核糖核酸,属于同一类分子,它们之间的相互作用机理简单明了,其规律早就被科学家们所掌握,完全不需要重新设计。除此之外,RNA分子的合成也比蛋白质要简单得多,而且已经做到了全自动化,一个高中毕业的实验员一天可以合成几百个,成本自然也就大大降低了。

如果用上文那个编辑来举例的话,CRISPR-Cas9就好比是计算机检索系统,依靠的不是编辑的目力,而是电脑的程序编码,无论是检索速度还是准确性都提高了好几个数量级。说起来新的检索系统并没有从理论上改变文学的本质,但实际上新系统一旦得到广泛应用,将把旧的文学形式彻底颠覆。

卡朋特尔和多娜将研究结果写成论文,发表在2012年8月17日出版的《科学》(Science )杂志上。该论文详细描述了CRISPR-Cas9系统工具的设计原理和制备过程,向全世界宣告了一种全新的基因工程工具的诞生。该论文一经发表立刻在生物圈引发了地震,大家立刻放下手里的工作,着手研究这套新系统的潜力。截至2014年10月,来自全世界生物科学领域的科学家们在短短的两年时间里发表了超过1000篇关于CRISPR-Cas9的论文,从各个方面对这套新系统在生物学和医学等领域的应用前景进行了初步探索。2014年11月28日出版的《科学》杂志再次发表了卡朋特尔和多娜联手撰写的一篇综述文章,对这两年里进行的新探索进行了梳理,总结了CRISPR-Cas9系统可能的应用范围,前景令人鼓舞。

基因工程的未来

因为其方便准确快捷廉价的特性,CRISPR-Cas9系统首先被应用到了遗传学研究领域,用于研究基因的功能。科学家们早就知道,要想知道某一基因到底是干吗用的,最好的办法就是把它去掉,或者让它失活,然后观察生物体发生了怎样的变化。这个“基因敲除法”(Gene Knockout)已经运用了很多年,取得了不少成果,但是因为老的基因敲除方法太过繁琐,准确性也不高,所以尚未完全普及开来。CRISPR-Cas9系统可以很方便地在任何物种的任何基因的任意位置切上一刀,这就相当于让这个(或多个)基因失去了活性。基因是生命的蓝图,如果全世界所有的生物学实验室都能够随心所欲地运用这项技术,生命科学领域一定会面临一次质的飞跃。

举例来说,“基因敲除法”经常被用于制造“基因敲除小鼠”(Knockout Mouse),这种小鼠是研究哺乳动物基因功能的绝佳实验材料。但因为老技术难度太高,制造出一只这样的基因敲除小鼠往往需要耗费数月甚至数年的时间。CRISPR-Cas9系统可以很轻松地切除任意基因,理论上完全可以代替旧的“基因敲除法”。总部位于美国圣路易斯的萨格实验室(SAGE Labs)是全世界第一个运用CRISPR-Cas9系统工具生产基因敲除小鼠的公司,这家公司只需一个多月的时间就可以按照客户的要求制造出一个特定基因被敲除的小鼠品系,大大提高了该领域的研究速度。

CRISPR-Cas9系统还可以用于医疗领域,方便科学家们制造出模拟人类疾病的细胞模型。比如,已知某些人类癌细胞的基因组发生了不止一处变化,甚至还有的癌变是由于染色体异位(Chromosomal Translocation)所导致的,如此大规模的基因重组很难用现有的基因操纵工具模拟出来。CRISPR-Cas9系统的出现解决了这个难题,迄今为止已经有人利用这套系统制造出了模拟染色体异位所导致的肺癌、骨癌和白血病细胞系,为科学家尽早研制出针对这几类癌症的新药提供了取之不尽的实验材料。

医学领域的科学家们不但需要能模拟疾病的细胞系,更希望得到模拟疾病的动物模型。此前用得最多的动物模型是小鼠,不但因为小鼠繁殖快,容易饲养,更因为科学家们掌握的基因工具大都只适用于小鼠。CRISPR-Cas9系统是一种普适的工具,效率非常高,完全可以被用于制造灵长类实验动物。灵长类动物显然要比小鼠更适合作为模型动物,但是饲养成本也比小鼠高得多,对于遗传操作准确性的要求非常高。比如,美国埃默里大学(Emory University)的遗传学家安东尼陈(Anthony Chan)曾经花了两年时间培育出5只易患亨廷顿氏症的猴子,成为全世界第一个实现这一目标的人。但由于他采用的传统方法准确性太低,其中3只猴子的基因出了问题,提前得了这个病,不得不在出生一个月后就被杀死,无法用于研究。如果采用CRISPR-Cas9系统的话,就不会出现上述问题了,这将为医学研究提供廉价而又接近完美的实验材料,极大地加快新药的开发速度。

基因敲除只是CRISPR-Cas9系统最基本的功能,如果将这套系统和DNA修复工具联合使用,将可以对任意基因进行随心所欲的修改。比如,如今大家耳熟能详的农作物转基因育种其实是一项难度很大的技术,只有少数顶尖实验室能够做到,这就是为什么转基因育种行业一直垄断在少数几家大企业手里的原因之一,广大中小企业受制于技术瓶颈和政治瓶颈,很难和大企业竞争。有了CRISPR-Cas9技术之后,任何一个有想法的人都可以进入这个行业,如果政治壁垒再被清除掉的话,农业领域将会发生一次和信息产业相媲美的大变革,农民们将会种上既高产又抗病又节省化肥的新型农作物。

当然了,普通读者最关心的很可能是医疗领域,尤其是基因治疗(Gene Therapy)。这种新疗法已经喊了将近30年,理论上早已没有障碍,问题就出在基因定位问题无法解决,操作难度太大。难怪CRISPR-Cas9系统一出现,立刻就被基因治疗领域的科学家们盯上了。就在2013年1月,也就是卡朋特尔和多娜在《科学》杂志上发表了那篇划时代论文之后不到4个月,就已经有三家实验室通过实验证明CRISPR-Cas9系统工具理论上完全可以用于治疗包括人类在内的哺乳动物的遗传病。

理论很快变成了现实。2014年6月,美国麻省理工学院(MIT)的研究人员报告说他们成功地利用CRISPR-Cas9技术治愈了小鼠的酪氨酸血症(Tyrosinemia)。这是一种较为罕见的遗传病,病鼠肝脏里的一种酶出了问题。研究人员从病鼠的尾巴处注入经过改良的CRISPR-Cas9,同时注入三种健康的基因模板。这套系统成功地在病鼠体内把患病肝细胞中的坏基因修复成为好基因,平均每250个坏细胞中就有一个被修好了。随着被修好的健康肝细胞的不断扩增,一个月后患病小鼠体内三分之一的患病肝细胞就被健康细胞代替了,这个比例已经高到足以让小鼠生产出足够多的好酶,治好了小鼠的遗传病。

两个月后,也就是2014年8月,科学圈又爆出一项惊人的成果。美国坦普尔大学(Temple University)的科学家利用CRISPR-Cas9技术成功地把隐藏在人类细胞核当中的HIV病毒清除掉了。众所周知,艾滋病之所以难以根治,就是因为HIV病毒把自身整合到人类基因组当中,使得人类自身的免疫系统无法识别,普通的抗病毒药物也很难奏效。坦普尔大学的病毒学家卡梅尔卡里里(Kamel Khalili)博士设计了一种CRISPR-Cas9系统,可以识别出人类基因组当中隐身的HIV病毒,并将其切断。卡里里博士利用这套系统成功地将体外培养的人类艾滋病细胞系彻底治愈,其中含有的所有HIV病毒都被清除掉了,无一漏网。

CRISPR-Cas9系统虽然只有两年的历史,却已经取得了如此辉煌的成绩,并显示出无与伦比的潜力,这就是为什么2014年的科学突破奖(Breakthrough Prize)授予了发明出这一系统的卡朋特尔和多娜博士,两人各获得了300万美元的奖金。这个科学突破奖是一群硅谷高科技新贵创立的奖项,其历史虽然不如诺贝尔奖悠久,但视角新颖,其权威性一点也不亚于诺贝尔。再加上该奖的奖金数量几乎是诺贝尔奖的三倍,所以它在科学圈里的地位已经超过了诺贝尔奖,成为大多数科学家们争相追逐的目标。

有了科学圈的肯定,商人们便闻风而动了。多娜博士早在2013年就联合了麻省理工学院的张峰(音译)等人,成立了第一家以研发基于CRISPR-Cas9平台的新药为目的的爱迪塔斯制药公司(Editas Medicine),这家总部设在美国波士顿的小公司刚一成立便获得了4300万美元风险投资,前景乐观。

2014年4月,总部位于瑞士巴塞尔的克里斯珀治疗公司(CRISPR Therapeutics)成立了,这家公司同样打算研发基于CRISPR-Cas9平台的新药,目前该公司已经获得了2500万美元风险投资。

一场基于CRISPR-Cas9系统的科研竞赛已经发枪,选手们早已上路了。

结语

平心而论,CRISPR-Cas9系统在理论上并没有什么重大突破,只是对现有的一项常规技术做出了改进而已。但是这项改进大大简化了基因工程领域的核心技术,无论是操作成本还是技术含量都被降至谷底,这就等于降低了门槛,实现了基因工程技术的民主化。计算机和信息技术领域的经验表明,一旦核心技术的门槛被降低到了某一阈值以下,必将引发该领域的一场大地震,其后果将是无法预测的。

让我们拭目以待吧。 生物技术dna提取DNAdnacrispr科学科普crispr-cas9生物学基因合成基因工程