

遗传病研究的新突破
作者:袁越人类的很多疾病都与遗传有关,但是要想判断出究竟是哪个基因导致了某种遗传病却是一件非常困难的事情。要知道,人类基因组有30亿个“字母”(碱基对),编码近2.3万个基因,每个基因至少编码一种蛋白质,这说明人类体内最多会有2.3万种不同的蛋白质在工作着。不但如此,目前大多数蛋白质的功能也都没有搞清,很难把它们与某种特定的遗传病联系在一起。另外,还有很多DNA序列虽然不编码任何蛋白质,但却控制着蛋白质的合成速度,出了问题同样非同小可。所以,科学家们往往只能通过收集大量病例来推测可能的致病基因,其过程很像是在碰运气,成功率极低。
遗传病研究领域的第一个突破发生在1949年,著名的美国化学家,诺贝尔奖双料得主莱纳斯·鲍林(Linus Pauling)博士及其同事们在《科学》杂志上发表文章指出,镰刀型贫血症的病因在于病人血红蛋白中的一个氨基酸发生了变化。这是人类第一次在蛋白质水平上弄清了一种遗传病的分子机理,从而可以很容易地从氨基酸的顺序倒推回去,找出那个致病的基因。
此后,遗传病研究领域发展迅猛,但大都基于同样的思路。换句话说,如果某种遗传病的分子机理尚未搞清,科学家们就束手无策了。另外,还有很多遗传病是由不止一个基因突变所导致的,这就进一步增加了破案的难度。
人类基因组全序列的测序成功给这个领域带来了新的曙光。科学家们希望通过测量病人的全部DNA序列,并和正常人对比,从而找到致病基因。问题在于基因组测序的成本太高了,目前虽然已经降到5万美元左右,但一般人还是做不起。所以,截止到去年底为止,全世界只有十几个人测出了自己的DNA全序列,其中大多数还都是科学界名人,为他们测序更多是具有象征意义,对遗传病的研究帮助不大。
今年情况终于有了转机。3月份,相继有两篇文章发表在顶尖杂志上,让人们看到了基因组全序列测序在遗传病研究领域的巨大潜力。第一篇文章发表在3月10日出版的《新英格兰医学杂志》上,该文作者詹姆斯·鲁普斯基(James Lupski)博士本人患有腓骨肌萎缩症(Charcot-Marie-Tooth Syndrome),这是一种比较常见的遗传病,患病率约为1/2500。此前科学家们已经找到了40个基因可能与此有关,但始终未能确诊。詹姆斯为此工作了几十年,仍然没有结果,于是他想到了全基因组测序,希望能找到突破口。
詹姆斯的父母都是健康人,夫妇俩一共生下了8个孩子,其中4个患病,4个健康,这样的家庭为遗传病研究创造了绝好的条件。研究人员测量了詹姆斯的全部DNA顺序,并和那40个可能的基因位点一一对比,发现SH3TC2基因最有可能是罪魁祸首。詹姆斯本人和他的另外3名患病的兄弟姐妹都带有两份变异了的SH3TC2基因拷贝,他的父母和那4位健康的兄弟姐妹则只携带一份变异了的SH3TC2基因拷贝,这个模式完全符合单基因隐形遗传病的基本特征,即患者必须同时携带两份致病基因才会生病。在综合考虑了其他一些证据后,研究人员认为腓骨肌萎缩症的病因几乎可以肯定是由于SH3TC2基因变异造成的。
第二篇论文发表在3月11日出版的《科学》杂志上,美国西雅图系统生物学研究所的一个研究小组找到了一个4口之家,两个孩子同时患上了米勒综合征(Miller Syndrome)和原发性纤毛运动障碍(Primary Ciliary Dyskinesia)这两种罕见的遗传病。这一次科学家们走得更远,把全家4口人的基因组序列全部测了出来。但是,由于科学界事先对这两种遗传病缺乏研究,最后只能把候选范围缩小到4个基因,再也无法进一步确诊了。
这是科学界第一次为一个家庭进行全基因组测序,从中得到了一个有趣的副产品。通过对两代人的基因顺序进行对比,科学家算出了人类基因组的突变率,即每一代人将会产生66个基因突变!正是这些随机的基因突变为遗传病的确诊带来了麻烦,因为绝大多数基因突变都是无害的,对人的健康没有任何影响。而科学家目前尚无能力判断到底哪些突变是有害的,哪些是无害的,所以,即使找到了基因突变,仍然无法做判断。
比如,第一篇论文的主角詹姆斯·鲁普斯基的SH3TC2基因发生了一个突变,在该基因的中间形成了一个终止符。通常情况下出现这类突变意味着该基因功能的彻底丧失,因为这就等于把蛋白质拦腰斩断了。但是通过分析詹姆斯的全部基因组序列,科学家们居然发现了120个这样的基因突变!其中大多数突变显然是中性的,否则詹姆斯恐怕早就夭折了。
从这个例子就可以看出,遗传病研究领域最大的问题还不是基因组测序,而是对基因功能的了解。如果不了解基因的工作方式,那么即使测出了基因序列也无法正确解读。解决这个问题的唯一办法就是尽可能多地积累数据,然后横向对比。好在科学家估计人类基因组全序列测序的成本将在不久的将来降到4000美元以下,到那时,相信很多遗传病的秘密就会迎刃而解了。■(文 / 袁越) 人类遗传病遗传病研究科学科普突破基因合成