寻找阿尔茨海默病的基因

于涵 2022-10-19 来源：

【编者按】

自20世纪初阿尔茨海默病被命名以来，围绕它的发病根源出现了各种理论与假说：遗传说、β-淀粉样蛋白斑块说、3型糖尿病说、tau蛋白说、炎症说，相应的药物与疗法也层出不穷。到底哪个才是对的？《偷走心智的贼：阿尔茨海默病的故事》一书讲述了阿尔茨海默病被发现的源头，循着医学界峰回路转的研究过程，一直谈到今天的前沿现状，本文摘编自该书第四章《寻找阿尔茨海默病的基因》。

染色体存在于细胞核内。在显微镜下，它们就像一根根由缠绕的棉线组成的小棒子。那些棉线是长长的脱氧核糖核酸（DNA）链，所以简单地说，染色体就是紧密排列的DNA。DNA的完整定义可以写上好几页，但眼下知道一点就够了：DNA是一种分子，它指导蛋白质的生产，并由此决定生命形成和运行的方式。

每个人都有23对染色体——23对，共46条。在这23对染色体中，有1对是性染色体：X和Y。这对染色体决定了我们的性别：XX是女性，XY是男性。早发性阿尔茨海默病不只在一种性别中出现，说明这种“被诅咒”的遗传并不是由性染色体传播的。

其余22对染色体称为“常染色体”，在男性和女性体内是一样的。它们的编号从1到22。其中1号染色体是最大的一条，有着最长的DNA链。其余的编号越大体积越小。

孩子从母亲那里继承半数染色体，另外半数来自父亲。以1号染色体对为例，其中一条来自母亲，另一条来自父亲。如果一条染色体的缺陷就足以导致疾病，我们就说这种疾病是“常染色体显性”的；还有的疾病需要两条染色体都有缺陷才会发生，我们说这种疾病是“常染色体隐性”的。

根据其稳定的遗传模式判断，早发性阿尔茨海默病是常染色体显性的。对于出生在带病家庭的孩子来说，这是一个残酷的事实，因为他们得病的概率是稳定的50%。假设这种疾病存在于21号染色体对上，且一位母亲拥有一条有缺陷的21号染色体和一条健康的21号染色体，因为孩子必定会从母亲那里继承一条21号染色体，所以他有50%的可能会继承有缺陷的那条，从而遗传该病。如果有病的是他父亲，这个概率也是一样的。

多生孩子也不能改变这个概率。每孕育一个孩子，都是以同样50%的概率抛出了一枚硬币。每次的赌局都从头开始，多赌几轮并不能增加运气。而且早发性阿尔茨海默病的遗传是完全外显（fully penetrant）的，也就是说，只要一个孩子继承了缺陷，他就必然会发病。他的命运在出生的那一刻就注定了。由于这些原因，在一个人丁兴旺的家族中，只要有一个病人就能对子孙后代造成深远的涟漪效应。如果这些子孙还在一个联系紧密的社区内通婚，就像伏尔加德意志人那样，他们就会繁衍出庞大的疾病部落。

DNA可以写成一个由A、T、C、G四个字母组成的字符串，四个字母各表示一种碱基——腺嘌呤（A）、胸腺嘧啶（T）、胞嘧啶（C）和鸟嘌呤（G），它们随机排列，形成一条DNA链。人类DNA的长度是30亿个碱基，任何两个人的碱基序列都不会完全相同，因此研究者先要排除许多无关的差异，然后才能指出真正的缺陷。要让这项任务具备可行性，他们必须挑选一名可能的“嫌犯”入手，不能光凭运气从染色体1号一直找到22号。

在人类的22对常染色体中，21号染色体嫌疑最大。这条染色体本来就与唐氏综合症有牵连，这是另一种遗传障碍，以智力残障、发育迟缓为特征，在美国每700名婴儿中就有1个病人。唐氏综合症的病因是出生时多出了一条21号染色体：常人只有两条，病人有三条。说它和阿尔茨海默病有关，是因为唐氏综合症患儿到中年时，几乎总会出现类似阿尔茨海默病的脑部病变（也就是斑块和原纤维）。他们中的许多人最终也会出现明显的类阿尔茨海默病症状，包括身体机能和性格的改变。可见，21号染色体上的某些缺陷也可能是造成阿尔茨海默病的元凶。20世纪80年代，这个假说吸引了全世界研究者的兴趣，他们仔细研究了这条小小的染色体，在其中寻找遗传的模式。

要明白他们找的是什么，我们先要了解一点关于性的知识。在有性生殖中，我们的身体会天然地追求最大程度的遗传多样性。染色体在由父母传给子女之前，会先经过一番混合与重组。母亲体内那些成对的染色体（比如1号染色体对的两条）是从她自己的父母那里分别继承来的，它们会相互交叉并交换DNA片段。这样混合之后，母亲再将一条染色体遗传给子女，因此子女实际上继承了外祖父和外祖母双方的染色体。父亲那边也是一样的情况。

不妨把这种基因重组想象成洗牌。我们洗牌、切牌之后，原先非常接近的牌更容易在同一叠上。DNA也是如此。原本在一条染色体上相互接近的DNA片段，在重组时也较容易待在一起，并一同遗传给子女。利用这个机制，研究者就能将已知的DNA作为标记，用它们在一条染色体上寻找未知的缺陷DNA了。如果患病者总会继承某个标记，那就说明缺陷DNA很可能就在附近。这种方法称为“连锁分析”（linkage analysis）。

虽然听上去合理，但其实连锁分析如同买彩票，是一种漫无方向的搜索，能找到什么全凭运气，它不是有目的地去寻找特定的对象。虽然21号染色体体积较小，却仍包含了4800万个碱基，并含有众多已知的标记。如果你不知道自己要找什么，就会耗费许多时间。幸运的是，就在许多研究者因为21号染色束手无策之时，其他人却在另外的方向上悄悄取得了进展。

当爱罗斯·阿尔茨海默初次在奥古斯特·德特尔的脑中看到斑块时，他也不知道自己在寻找什么，他将这些斑块称为“特殊物质的堆积”。20年后，比利时精神病学家保罗·迪夫里（Paul Divry）弄清了这些物质是什么：那是一种名叫“淀粉样蛋白”（amyloid）的蛋白。说老实话，这东西其实并不特殊。早在19世纪30年代，在植物中就发现了淀粉样蛋白，到19世纪50年代，人类的神经系统中也发现了它们。这个名称来自拉丁文的“amylum”，意为“淀粉”，因为淀粉样蛋白有着和淀粉一样的苍白如凝胶的外表。它还会在接触特定染料时被染成彩色，迪夫里就是靠这个特点来鉴别它的。

淀粉样蛋白虽然外表像淀粉一样无害，却很会捣乱。它能在心脏、肾脏、肝脏和脾脏等各个器官中堆积并造成破坏。在心脏中，淀粉样蛋白会僵化心肌，降低它的搏动能力，这可能会造成致命后果。由于它的这个阴暗本性，当迪夫里在阿尔茨海默病人脑中找到淀粉样蛋白时，他恍然大悟：想来这个捣乱分子也破坏了正常的脑组织，而这可能就是引起阿尔茨海默病的原因。

当然，除了淀粉样蛋白的坏名声之外，我们还需要其他证据来给它定罪，因为确切地说，“淀粉样蛋白”只是一个笼统的名词，用来称呼一类有褶皱的蛋白结构，并不是单指某种蛋白。许多蛋白都能形成淀粉样结构，而要更接近阿尔茨海默病斑块的本质，我们就需要确定这些蛋白的具体身份——这项任务又耗费了半个世纪的时光。淀粉样蛋白是相当顽固的，它不会轻易溶解，也很难提纯，要研究它并不容易。一直到1984年，加州大学圣迭戈分校的两位研究者才终于揭开了它的面纱。

这两位研究者是乔治·格列纳（George Glenner）和凯恩·王（Caine Wong），他们之所以能成功，和他们的攻坚计划大有关系。他们没有将目光放在阿尔茨海默病人脑神经元周围的斑块上，而是瞄准了脑血管里的斑块，这些斑块更易溶解，也更好分析。他们从这些斑块中分离出了两种蛋白，第一种取名为α，第二种取名为β。他们发现α是一种无关物质，于是在阿尔茨海默病人脑中堆积的那种恶名昭彰的物质，就被称作“β-淀粉样蛋白”。

应该指出，β-淀粉样蛋白并非外来入侵者。它会在脑中自然地产生，并发挥一些我们目前尚不理解的功能。正常情况下，它会被酶降解，或被送出脑进入血液循环。但要是得了阿尔茨海默病，它就会以某种方式留在脑中并结成斑块。

在分离出β-淀粉样蛋白之后，格列纳和王又迈进一步，开始确定构成它的氨基酸。氨基酸就像一粒粒细小的珠子，可以串在一起形成一根链条。如果氨基酸链变长（一般超过50粒珠子）并能保持稳定，就会形成一个蛋白。我们的身体使用 20种常见的氨基酸，将它们以不同的方式串联，从而形成身体所需的多种蛋白。

确定β-淀粉样蛋白的氨基酸构成很重要，因为氨基酸是由特定的DNA碱基生成或者说编码的。一旦确定氨基酸的种类，我们就能推出给β-淀粉样蛋白编码的DNA序列了。这段具有功能的DNA，就是人们通常所说的“基因”。找到这个基因，我们就可以进一步检测它是否在阿尔茨海默病人的脑中发生了突变。如果确实如此，那这个突变或许就是β-淀粉样蛋白在病人脑中堆积的原因，也就是他们患病的根源了！

然而，格列纳和王的发现却有些令人失望：原来β—淀粉样蛋白只是很短的一根链条，仅含有24个氨基酸，这个长度还不足以称为一个蛋白。因此，给它编码的DNA也不是一个“真正”的功能基因。不过这个发现也让研究者明白，β-淀粉样蛋白可能只是一个蛋白片段，是从某个更长的前体蛋白上切割下来的。

另外几支研究团队以格列纳和王的发现为线索，很快找到了那个完整的前体蛋白，它的长度约为700个氨基酸，这长度肯定是真蛋白了。而编码它的基因，即淀粉样前体蛋白（APP）基因，约有2100个用来编码的DNA碱基，正位于21号染色体上。前面已经说过，这条小小的染色体是阿尔茨海默病的最大嫌犯，因为唐氏综合症已经牵连了它。案情开始浮出水面了！接下来只需要对阿尔茨海默病人做个检测，看看他们的APP基因发生了怎样的突变，然后就可以找到他们受苦的原因了。

但是正当胜利就在眼前的时候，事情却慢慢停了下来。几年中，研究者检测了他们能够检测的所有病人，但是一个接着一个，病人的APP基因都显示正常。难道大费周章之后，这个基因竟不是元凶？！

幸好科学家是一群执着的人。他们仍坚持研究，终于迎来了突破。1991年2月，伦敦圣玛丽医院医学院的约翰·哈迪（John Hardy）和他的团队在两个早发性阿尔茨海默病家族中发现了一个APP突变。这是一个微小的突变，在APP基因的2000多个碱基中，只有一个从C变成了T。一旦这个突变被发现，研究者一下就知道该去哪里寻找了，他们跟着又在其他患者家族中发现了另外几个突变，有的就位于这个碱基上，还有的位于邻近的碱基。

但这个发现并没有引来人们的竞相庆祝。其他的研究者大多仍觉得灰心而困惑。他们查看各自的患者样本，还是没有找到任何突变。他们的心情变得沉重而多疑，他们在学术会议上互致同情，不知道自己究竟做错了什么。

终于，他们想明白了：既然这么多实验室都找不到APP基因的突变，既然这么多早发性患者脑中似乎都没有APP突变，那就说明APP或许不是致病的唯一基因。或许，还有另一个基因正等待着被发现，等待着另一个人来创造历史。这样的想法让之前的绝望和多疑变回了狂热，各支团队匆忙开展了更多连锁分析。这一次，21号染色体已不再是唯一的嫌犯了。这条短小的染色体已经被研究者像用细齿梳一样梳理了好几遍，可供发掘之处不多了。至于剩下的20条常染色体中要去哪里寻找，只能靠猜测。这是一片浩瀚的水域，但大家认为，只要继续垂钓，总有幸运儿会钓上大鱼的。

真的有人撞了大运。1992年10月，经过几年“垂钓”之后，华盛顿大学的杰拉德·舍伦贝格（Gerald Schellenberg）在14号染色体上发现了一个可疑的标记区域。舍伦贝格还没有找到具体是哪个基因，但他已经将九个早发性阿尔茨海默病家族关联到了这个区域上。相比APP突变只在少量家族中出现，舍伦贝格的发现预示着更大更好的结果。

在这之后仅过了一个月，就有另外三支团队公布了发现，他们都将早发性阿尔茨海默病关联到了14号染色体的这个区域上。三篇论文竟刊登在同一期的《自然·遗传学》（Nature Genetics）上，一篇紧挨着一篇。同样的发现能够重复，这显然是一个好兆头，说明这个发现是可靠的。但这也真够怪的：三支队伍分别出海，居然在同一时间捕到了同一条鱼。

暗地里流言四起，有说泄密的，有说盗用的，甚至有蓄意捣乱的说法。卷入这起事件核心的有多伦多大学的彼得·圣乔治-希斯洛普（Peter St George-Hyslop），是其中一支团队的负责人。

这场难分高下的竞赛只涉及14号染色体上的可疑区域，而位于这个区域上的具体基因和确切变异还没有找到。要想扳回一城，最好的办法就是找到它们，而不是一味指控和自哀。两年半后，圣乔治-希斯洛普做到了这一点。这一次，他的文章登上了《自然》主刊，并宣布了致病基因和它的突变——突变不止一个，而是有五个之多。这个基因被称作“PSEN1”，是“早老性痴呆”（presenile dementia）的缩写。

和研究APP突变时一样，研究者一旦知道了目标，就很快发现了其他PSEN1突变。到今天，他们发现的突变已超过150个。与APP突变相比，PSEN1突变要普遍得多。它们造成了70%的早发性阿尔茨海默病，而APP突变只造成了10%到15%。PSEN1突变还特别恶毒，它们会加快疾病进程，使患者在四五十岁就开始发病，有的甚至在30多岁。

就其本身而言，PSEN1基因的发现已经是一个胜利，但更令人鼓舞的是随之而来的认识：这个基因和我们对β-淀粉样蛋白的已有知识密切相关。回想一下之前说的：β-淀粉样蛋白只是一个片段，是从更长的淀粉样前体蛋白上切割下来的。这个切割并非自行发生，它需要酶来将前体蛋白剪短。在这里PSEN1基因就出场了：它参与编码了一种切割酶，名为“γ-分泌酶”（gamma—secretase）。当PSEN1基因发生突变时，γ-分泌酶也会跟着出错。它会对前体蛋白进行不正确的切割，制造出有害或冗余的β-淀粉样蛋白片段，这些片段又堆积成了阿尔茨海默病的斑块。

至此，线索都拼起来了，几近完美。

只是还缺了一块：检测发现，赖斯维希一家和他们的伏尔加德意志人同胞，并没有APP突变和PSEN1突变。

显然，还有一个基因未被捕获。很快，这个已知引起早发性阿尔茨海默病的最后一个基因也找到了，时间距PSEN1的发现还不到两个月。找到它的是我们的一个熟人：杰拉德·舍伦贝格，他之前曾在14号染色体上发现了可疑区域，但没有在这片区域上找到PSEN1基因。这一次，舍伦贝格将研究推进到底，他不仅将伏尔加德意志人关联到另一条染色体，即1号染色体上，还进一步锁定了罪魁祸首的基因。

祝贺并感谢每一位将早发性阿尔茨海默病基因钓出水面的研究者！他们取得了现代科学史上的杰出成就，这和他们的奉献与刻苦是分不开的。但是，当他们的工作创造了夸口的机会、登上了媒体头条，并成为了申请研究经费的跳板，他们的那些研究对象的成就却很少有人庆祝。我们只把那些对象看作病人、受害者和样本。我们没能认识到（至少是认识得不足）他们对于现代科学不可缺少的英勇努力。他们献出了自己的性命和身躯，只为了将来能出现他们无法享受的进步，要是没有这份勇气和志愿，我们绝不会取得今天的成功。

《偷走心智的贼：阿尔茨海默病的故事》，于涵著，高天羽译，广西师范大学出版社2022年7月。

读书推荐