寻找阿尔茨海默病的基因

【编者按】

自20世纪初阿尔茨海默病被命名以来,围绕它的发病根源出现了各种理论与假说:遗传说、β-淀粉样蛋白斑块说、3型糖尿病说、tau蛋白说、炎症说,相应的药物与疗法也层出不穷。到底哪个才是对的?《偷走心智的贼:阿尔茨海默病的故事》一书讲述了阿尔茨海默病被发现的源头,循着医学界峰回路转的研究过程,一直谈到今天的前沿现状,本文摘编自该书第四章《寻找阿尔茨海默病的基因》。

染色体存在于细胞核内。在显微镜下,它们就像一根根由缠绕的棉线组成的小棒子。那些棉线是长长的脱氧核糖核酸(DNA)链,所以简单地说,染色体就是紧密排列的DNA。DNA的完整定义可以写上好几页,但眼下知道一点就够了:DNA是一种分子,它指导蛋白质的生产,并由此决定生命形成和运行的方式。

每个人都有23对染色体——23对,共46条。在这23对染色体中,有1对是性染色体:X和Y。这对染色体决定了我们的性别:XX是女性,XY是男性。早发性阿尔茨海默病不只在一种性别中出现,说明这种“被诅咒”的遗传并不是由性染色体传播的。

其余22对染色体称为“常染色体”,在男性和女性体内是一样的。它们的编号从1到22。其中1号染色体是最大的一条,有着最长的DNA链。其余的编号越大体积越小。

孩子从母亲那里继承半数染色体,另外半数来自父亲。以1号染色体对为例,其中一条来自母亲,另一条来自父亲。如果一条染色体的缺陷就足以导致疾病,我们就说这种疾病是“常染色体显性”的;还有的疾病需要两条染色体都有缺陷才会发生,我们说这种疾病是“常染色体隐性”的。

根据其稳定的遗传模式判断,早发性阿尔茨海默病是常染色体显性的。对于出生在带病家庭的孩子来说,这是一个残酷的事实,因为他们得病的概率是稳定的50%。假设这种疾病存在于21号染色体对上,且一位母亲拥有一条有缺陷的21号染色体和一条健康的21号染色体,因为孩子必定会从母亲那里继承一条21号染色体,所以他有50%的可能会继承有缺陷的那条,从而遗传该病。如果有病的是他父亲,这个概率也是一样的。

多生孩子也不能改变这个概率。每孕育一个孩子,都是以同样50%的概率抛出了一枚硬币。每次的赌局都从头开始,多赌几轮并不能增加运气。而且早发性阿尔茨海默病的遗传是完全外显(fully penetrant)的,也就是说,只要一个孩子继承了缺陷,他就必然会发病。他的命运在出生的那一刻就注定了。由于这些原因,在一个人丁兴旺的家族中,只要有一个病人就能对子孙后代造成深远的涟漪效应。如果这些子孙还在一个联系紧密的社区内通婚,就像伏尔加德意志人那样,他们就会繁衍出庞大的疾病部落。

DNA可以写成一个由A、T、C、G四个字母组成的字符串,四个字母各表示一种碱基——腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鸟嘌呤(G),它们随机排列,形成一条DNA链。人类DNA的长度是30亿个碱基,任何两个人的碱基序列都不会完全相同,因此研究者先要排除许多无关的差异,然后才能指出真正的缺陷。要让这项任务具备可行性,他们必须挑选一名可能的“嫌犯”入手,不能光凭运气从染色体1号一直找到22号。

在人类的22对常染色体中,21号染色体嫌疑最大。这条染色体本来就与唐氏综合症有牵连,这是另一种遗传障碍,以智力残障、发育迟缓为特征,在美国每700名婴儿中就有1个病人。唐氏综合症的病因是出生时多出了一条21号染色体:常人只有两条,病人有三条。说它和阿尔茨海默病有关,是因为唐氏综合症患儿到中年时,几乎总会出现类似阿尔茨海默病的脑部病变(也就是斑块和原纤维)。他们中的许多人最终也会出现明显的类阿尔茨海默病症状,包括身体机能和性格的改变。可见,21号染色体上的某些缺陷也可能是造成阿尔茨海默病的元凶。20世纪80年代,这个假说吸引了全世界研究者的兴趣,他们仔细研究了这条小小的染色体,在其中寻找遗传的模式。

要明白他们找的是什么,我们先要了解一点关于性的知识。在有性生殖中,我们的身体会天然地追求最大程度的遗传多样性。染色体在由父母传给子女之前,会先经过一番混合与重组。母亲体内那些成对的染色体(比如1号染色体对的两条)是从她自己的父母那里分别继承来的,它们会相互交叉并交换DNA片段。这样混合之后,母亲再将一条染色体遗传给子女,因此子女实际上继承了外祖父和外祖母双方的染色体。父亲那边也是一样的情况。

不妨把这种基因重组想象成洗牌。我们洗牌、切牌之后,原先非常接近的牌更容易在同一叠上。DNA也是如此。原本在一条染色体上相互接近的DNA片段,在重组时也较容易待在一起,并一同遗传给子女。利用这个机制,研究者就能将已知的DNA作为标记,用它们在一条染色体上寻找未知的缺陷DNA了。如果患病者总会继承某个标记,那就说明缺陷DNA很可能就在附近。这种方法称为“连锁分析”(linkage analysis)。

虽然听上去合理,但其实连锁分析如同买彩票,是一种漫无方向的搜索,能找到什么全凭运气,它不是有目的地去寻找特定的对象。虽然21号染色体体积较小,却仍包含了4800万个碱基,并含有众多已知的标记。如果你不知道自己要找什么,就会耗费许多时间。幸运的是,就在许多研究者因为21号染色束手无策之时,其他人却在另外的方向上悄悄取得了进展。

当爱罗斯·阿尔茨海默初次在奥古斯特·德特尔的脑中看到斑块时,他也不知道自己在寻找什么,他将这些斑块称为“特殊物质的堆积”。20年后,比利时精神病学家保罗·迪夫里(Paul Divry)弄清了这些物质是什么:那是一种名叫“淀粉样蛋白”(amyloid)的蛋白。说老实话,这东西其实并不特殊。早在19世纪30年代,在植物中就发现了淀粉样蛋白,到19世纪50年代,人类的神经系统中也发现了它们。这个名称来自拉丁文的“amylum”,意为“淀粉”,因为淀粉样蛋白有着和淀粉一样的苍白如凝胶的外表。它还会在接触特定染料时被染成彩色,迪夫里就是靠这个特点来鉴别它的。

淀粉样蛋白虽然外表像淀粉一样无害,却很会捣乱。它能在心脏、肾脏、肝脏和脾脏等各个器官中堆积并造成破坏。在心脏中,淀粉样蛋白会僵化心肌,降低它的搏动能力,这可能会造成致命后果。由于它的这个阴暗本性,当迪夫里在阿尔茨海默病人脑中找到淀粉样蛋白时,他恍然大悟:想来这个捣乱分子也破坏了正常的脑组织,而这可能就是引起阿尔茨海默病的原因。

当然,除了淀粉样蛋白的坏名声之外,我们还需要其他证据来给它定罪,因为确切地说,“淀粉样蛋白”只是一个笼统的名词,用来称呼一类有褶皱的蛋白结构,并不是单指某种蛋白。许多蛋白都能形成淀粉样结构,而要更接近阿尔茨海默病斑块的本质,我们就需要确定这些蛋白的具体身份——这项任务又耗费了半个世纪的时光。淀粉样蛋白是相当顽固的,它不会轻易溶解,也很难提纯,要研究它并不容易。一直到1984年,加州大学圣迭戈分校的两位研究者才终于揭开了它的面纱。

这两位研究者是乔治·格列纳(George Glenner)和凯恩·王(Caine Wong),他们之所以能成功,和他们的攻坚计划大有关系。他们没有将目光放在阿尔茨海默病人脑神经元周围的斑块上,而是瞄准了脑血管里的斑块,这些斑块更易溶解,也更好分析。他们从这些斑块中分离出了两种蛋白,第一种取名为α,第二种取名为β。他们发现α是一种无关物质,于是在阿尔茨海默病人脑中堆积的那种恶名昭彰的物质,就被称作“β-淀粉样蛋白”。

应该指出,β-淀粉样蛋白并非外来入侵者。它会在脑中自然地产生,并发挥一些我们目前尚不理解的功能。正常情况下,它会被酶降解,或被送出脑进入血液循环。但要是得了阿尔茨海默病,它就会以某种方式留在脑中并结成斑块。

在分离出β-淀粉样蛋白之后,格列纳和王又迈进一步,开始确定构成它的氨基酸。氨基酸就像一粒粒细小的珠子,可以串在一起形成一根链条。如果氨基酸链变长(一般超过50粒珠子)并能保持稳定,就会形成一个蛋白。我们的身体使用 20种常见的氨基酸,将它们以不同的方式串联,从而形成身体所需的多种蛋白。

确定β-淀粉样蛋白的氨基酸构成很重要,因为氨基酸是由特定的DNA碱基生成或者说编码的。一旦确定氨基酸的种类,我们就能推出给β-淀粉样蛋白编码的DNA序列了。这段具有功能的DNA,就是人们通常所说的“基因”。找到这个基因,我们就可以进一步检测它是否在阿尔茨海默病人的脑中发生了突变。如果确实如此,那这个突变或许就是β-淀粉样蛋白在病人脑中堆积的原因,也就是他们患病的根源了!

然而,格列纳和王的发现却有些令人失望:原来β—淀粉样蛋白只是很短的一根链条,仅含有24个氨基酸,这个长度还不足以称为一个蛋白。因此,给它编码的DNA也不是一个“真正”的功能基因。不过这个发现也让研究者明白,β-淀粉样蛋白可能只是一个蛋白片段,是从某个更长的前体蛋白上切割下来的。

另外几支研究团队以格列纳和王的发现为线索,很快找到了那个完整的前体蛋白,它的长度约为700个氨基酸,这长度肯定是真蛋白了。而编码它的基因,即淀粉样前体蛋白(APP)基因,约有2100个用来编码的DNA碱基,正位于21号染色体上。前面已经说过,这条小小的染色体是阿尔茨海默病的最大嫌犯,因为唐氏综合症已经牵连了它。案情开始浮出水面了!接下来只需要对阿尔茨海默病人做个检测,看看他们的APP基因发生了怎样的突变,然后就可以找到他们受苦的原因了。

但是正当胜利就在眼前的时候,事情却慢慢停了下来。几年中,研究者检测了他们能够检测的所有病人,但是一个接着一个,病人的APP基因都显示正常。难道大费周章之后,这个基因竟不是元凶?!

幸好科学家是一群执着的人。他们仍坚持研究,终于迎来了突破。1991年2月,伦敦圣玛丽医院医学院的约翰·哈迪(John Hardy)和他的团队在两个早发性阿尔茨海默病家族中发现了一个APP突变。这是一个微小的突变,在APP基因的2000多个碱基中,只有一个从C变成了T。一旦这个突变被发现,研究者一下就知道该去哪里寻找了,他们跟着又在其他患者家族中发现了另外几个突变,有的就位于这个碱基上,还有的位于邻近的碱基。

但这个发现并没有引来人们的竞相庆祝。其他的研究者大多仍觉得灰心而困惑。他们查看各自的患者样本,还是没有找到任何突变。他们的心情变得沉重而多疑,他们在学术会议上互致同情,不知道自己究竟做错了什么。

终于,他们想明白了:既然这么多实验室都找不到APP基因的突变,既然这么多早发性患者脑中似乎都没有APP突变,那就说明APP或许不是致病的唯一基因。或许,还有另一个基因正等待着被发现,等待着另一个人来创造历史。这样的想法让之前的绝望和多疑变回了狂热,各支团队匆忙开展了更多连锁分析。这一次,21号染色体已不再是唯一的嫌犯了。这条短小的染色体已经被研究者像用细齿梳一样梳理了好几遍,可供发掘之处不多了。至于剩下的20条常染色体中要去哪里寻找,只能靠猜测。这是一片浩瀚的水域,但大家认为,只要继续垂钓,总有幸运儿会钓上大鱼的。

真的有人撞了大运。1992年10月,经过几年“垂钓”之后,华盛顿大学的杰拉德·舍伦贝格(Gerald Schellenberg)在14号染色体上发现了一个可疑的标记区域。舍伦贝格还没有找到具体是哪个基因,但他已经将九个早发性阿尔茨海默病家族关联到了这个区域上。相比APP突变只在少量家族中出现,舍伦贝格的发现预示着更大更好的结果。

在这之后仅过了一个月,就有另外三支团队公布了发现,他们都将早发性阿尔茨海默病关联到了14号染色体的这个区域上。三篇论文竟刊登在同一期的《自然·遗传学》(Nature Genetics)上,一篇紧挨着一篇。同样的发现能够重复,这显然是一个好兆头,说明这个发现是可靠的。但这也真够怪的:三支队伍分别出海,居然在同一时间捕到了同一条鱼。

暗地里流言四起,有说泄密的,有说盗用的,甚至有蓄意捣乱的说法。卷入这起事件核心的有多伦多大学的彼得·圣乔治-希斯洛普(Peter St George-Hyslop),是其中一支团队的负责人。

这场难分高下的竞赛只涉及14号染色体上的可疑区域,而位于这个区域上的具体基因和确切变异还没有找到。要想扳回一城,最好的办法就是找到它们,而不是一味指控和自哀。两年半后,圣乔治-希斯洛普做到了这一点。这一次,他的文章登上了《自然》主刊,并宣布了致病基因和它的突变——突变不止一个,而是有五个之多。这个基因被称作“PSEN1”,是“早老性痴呆”(presenile dementia)的缩写。

和研究APP突变时一样,研究者一旦知道了目标,就很快发现了其他PSEN1突变。到今天,他们发现的突变已超过150个。与APP突变相比,PSEN1突变要普遍得多。它们造成了70%的早发性阿尔茨海默病,而APP突变只造成了10%到15%。PSEN1突变还特别恶毒,它们会加快疾病进程,使患者在四五十岁就开始发病,有的甚至在30多岁。

就其本身而言,PSEN1基因的发现已经是一个胜利,但更令人鼓舞的是随之而来的认识:这个基因和我们对β-淀粉样蛋白的已有知识密切相关。回想一下之前说的:β-淀粉样蛋白只是一个片段,是从更长的淀粉样前体蛋白上切割下来的。这个切割并非自行发生,它需要酶来将前体蛋白剪短。在这里PSEN1基因就出场了:它参与编码了一种切割酶,名为“γ-分泌酶”(gamma—secretase)。当PSEN1基因发生突变时,γ-分泌酶也会跟着出错。它会对前体蛋白进行不正确的切割,制造出有害或冗余的β-淀粉样蛋白片段,这些片段又堆积成了阿尔茨海默病的斑块。

至此,线索都拼起来了,几近完美。

只是还缺了一块:检测发现,赖斯维希一家和他们的伏尔加德意志人同胞,并没有APP突变和PSEN1突变。

显然,还有一个基因未被捕获。很快,这个已知引起早发性阿尔茨海默病的最后一个基因也找到了,时间距PSEN1的发现还不到两个月。找到它的是我们的一个熟人:杰拉德·舍伦贝格,他之前曾在14号染色体上发现了可疑区域,但没有在这片区域上找到PSEN1基因。这一次,舍伦贝格将研究推进到底,他不仅将伏尔加德意志人关联到另一条染色体,即1号染色体上,还进一步锁定了罪魁祸首的基因。

祝贺并感谢每一位将早发性阿尔茨海默病基因钓出水面的研究者!他们取得了现代科学史上的杰出成就,这和他们的奉献与刻苦是分不开的。但是,当他们的工作创造了夸口的机会、登上了媒体头条,并成为了申请研究经费的跳板,他们的那些研究对象的成就却很少有人庆祝。我们只把那些对象看作病人、受害者和样本。我们没能认识到(至少是认识得不足)他们对于现代科学不可缺少的英勇努力。他们献出了自己的性命和身躯,只为了将来能出现他们无法享受的进步,要是没有这份勇气和志愿,我们绝不会取得今天的成功。

《偷走心智的贼:阿尔茨海默病的故事》,于涵著,高天羽译,广西师范大学出版社2022年7月。

读书推荐

读书导航