首页 / 专利库 / 生物工程 / 体外受精 / 与早老性痴呆病有关的基因序列和蛋白及其用途

与早老性痴呆病有关的基因序列和蛋白及其用途

阅读:793发布:2021-02-12

专利汇可以提供与早老性痴呆病有关的基因序列和蛋白及其用途专利检索,专利查询,专利分析的服务。并且本 发明 描述了两种人早衰素基因(PS-1和PS-2)的导致家族性早老性痴呆病的突变的鉴定、分离、测序和表征。还鉴定了小鼠、C.elegans和黑尾果蝇中的早衰素基因同系物。含有或衍生于早衰素的核酸和蛋白可用于筛选并诊断早老性痴呆病,用于鉴定并发展 治疗 早老性痴呆病的治疗方法,以及用于生产作为早老性痴呆病的模型的细胞系和转基因动物。,下面是与早老性痴呆病有关的基因序列和蛋白及其用途专利的具体信息内容。

1.含有一段核苷酸序列的分离的核酸,所述核苷酸序列编码选自正常 早衰素-1蛋白、突变早衰素-1蛋白、正常早衰素-2蛋白、突变早衰素-2蛋 白的蛋白。
2.权利要求1的分离的核酸,其中所述核酸编码正常早衰素-1蛋白, 其中所述核苷酸序列选自:
(1)编码含有SEQ ID NO:2的人早衰素-1基酸序列的蛋白的序 列;
(2)编码含有SEQ ID NO:4的人早衰素-1氨基酸序列的蛋白的序 列;
(3)编码含有SEQ ID NO:17的鼠早衰素-1氨基酸序列的蛋白的序 列;
(4)编码含有SEQ ID NO:2的氨基酸序列的蛋白的序列,其中用 丙氨酸取代残基257,并略除残基258-290;
(5)编码含有SEQ ID NO:4的氨基酸序列的蛋白的序列,其中用 丙氨酸取代残基253,并略除残基254-286;和
(6)编码正常早衰素-1蛋白并在严谨杂交条件下能够与(1)-(5) 的任何序列的互补序列杂交的序列。
3.权利要求1的分离的核酸,其中所述核酸编码突变早衰素-1蛋白,
其中所述核苷酸序列编码至少一种突变,该突变对应于选自下列的SEQ ID NO:2的突变:A79?、V82L、V96F、Y115H、M139T、 M139V、I143T、M146L、M146V、H163R、H163Y、L171P、 G209V、I211T、A231T、A246E、A260V、C263R、P264L、P267S、 E280A、E280G、A285V、L286V、Δ291-319、G384A、L392V和 C410Y;并且
其中所述核苷酸序列还对应于选自下列的核苷酸序列:
(1)编码含有SEQ ID NO:2的人早衰素-1氨基酸序列的蛋白的序 列;
(2)编码含有SEQ ID NO:4的人早衰素-1氨基酸序列的蛋白的序 列;
(3)编码含有SEQ ID NO:17的鼠早衰素-1氨基酸序列的蛋白的序 列;
(4)编码含有SEQ ID NO:2的氨基酸序列的蛋白的序列,其中用 丙氨酸取代残基257,并略除残基258-290;
(5)编码含有SEQ ID NO:4的氨基酸序列的蛋白的序列,其中用 丙氨酸取代残基253,并略除残基254-286;和
(6)编码正常早衰素-1蛋白并在严谨杂交条件下能够与(1)-(5) 的任何序列的互补序列杂交的序列。
4.权利要求1的分离的核酸,其中所述核酸编码突变早衰素-1蛋白,
其中所述核苷酸序列编码至少一种突变,该突变对应于选自M239V、 N141I和I420T的SEQ ID NO:19的突变;和
其中所述核苷酸序列还对应于选自下列的核苷酸序列:
(1)编码含有SEQ ID NO:2的人早衰素-1氨基酸序列的蛋白的序 列;
(2)编码含有SEQ ID NO:4的人早衰素-1氨基酸序列的蛋白的序 列;
(3)编码含有SEQ ID NO:17的鼠早衰素-1氨基酸序列的蛋白的序 列;
(4)编码含有SEQ ID NO:2的氨基酸序列的蛋白的序列,其中用 丙氨酸取代残基257,并略除残基258-290;
(5)编码含有SEQ ID NO:4的氨基酸序列的蛋白的序列,其中用 丙氨酸取代残基253,并略除残基254-286;和
(6)编码正常早衰素-1蛋白并在严谨杂交条件下能够与(1)-(5) 的任何序列的互补序列杂交的序列。
5.权利要求1的分离的核酸,其中所述核酸编码正常早衰素-2蛋白, 而且其中所述核苷酸序列选自:
(1)编码含有SEQ ID NO:19的人早衰素-2氨基酸序列的蛋白的序 列;
(2)编码含有SEQ ID NO:19的人早衰素-2氨基酸序列的蛋白的序 列,其中略除了残基263-296;
(3)编码正常早衰素-2蛋白并在严谨杂交条件下能够与(1)-(2) 的任一序列的互补序列杂交的序列。
6.权利要求1的分离的核酸,其中所述核酸编码突变早衰素-2蛋白,
其中所述核苷酸序列编码至少一种突变,该突变对应于选自M239V、 N141I和I420T的SEQ ID NO:19的突变;并且
其中所述核苷酸序列还对应于选自下列的核苷酸序列:
(1)编码含有SEQ ID NO:19的人早衰素-2氨基酸序列的蛋白的序 列;
(2)编码含有SEQ ID NO:19的人早衰素-2氨基酸序列的蛋白的序 列,其中略除了残基263-296;
(3)编码正常早衰素-2蛋白并在严谨杂交条件下能够与(1)-(2) 的任何序列的互补序列杂交的序列。
7.权利要求1的分离的核酸,其中所述核酸编码突变早衰素-2蛋白,
其中所述核苷酸序列编码至少一种突变,该突变对应于SEQ ID NO:2 的选自下列突变的突变:A79?、V82L、V96F、Y115H、M139T、 M139V、I143T、M146L、M146V、H163R、H163Y、L171P、 G209V、I211T、A231T、A246E、A260V、C263R、P264L、P267S、 E280A、E280G、A285V、L286V、Δ291-319、G384A、L392V和 C410Y;并且
其中所述核苷酸序列还对应于选自下列的核苷酸序列:
(1)编码含有SEQ ID NO:19的人早衰素-2氨基酸序列的蛋白的序 列;
(2)编码含有SEQ ID NO:19的人早衰素-2氨基酸序列的蛋白的序 列,其中略除残基263-296;
(3)编码正常早衰素-2蛋白并在严谨杂交条件下能够与(1)-(2) 的任何序列的互补序列杂交的序列。
8.一段分离的核酸,其含有至少10个连续核苷酸的核苷酸序列,所述 连续核苷酸选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、 SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO: 11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和任何这些序列的互补序列。
9.一段分离的核酸,其含有至少15个连续核苷酸的核苷酸序列,所述 连续核苷酸选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、 SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO: 11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和任何这些序列的互补序列。
10.一段分离的核酸,其含有至少20个连续核苷酸的核苷酸序列,所述 连续核苷酸选自:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、 SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO: 11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和任何这些序列的互补序列。
11.含有一段核苷酸序列的分离的核酸,所述核苷酸序列含有至少10 个来自插入质粒的早衰素的连续核苷酸,所述质粒选自:ATCC登记号 97214、ATCC登记号97508、ATCC登记号97124和ATCC登记号 97428。
12.含有一段核苷酸序列的分离的核酸,所述核苷酸序列编码早衰素蛋 白的至少一个功能结构域,所述早衰素蛋白选自:正常早衰素-1蛋白、突 变早衰素-1蛋白、正常早衰素-2蛋白、突变早衰素-2蛋白。
13.权利要求12的分离的核酸,其中所述功能结构域是对应于选自下列 结构域的早衰素-1功能结构域:早衰素-1的N-末端、TM1、TM1→2、 TM2、TM2→3、TM3、TM3→4、TM4、TM4→5、TM5、TM5→6、 TM6、TM6→7、TM7和C-末端结构域。
14.权利要求12的分离的核酸,其中所述功能结构域是对应于选自下列 结构域的早衰素-2功能结构域:早衰素-2的N-末端、TM1、TM1→2、 TM2、TM2→3、TM3、TM3→4、 TM4、TM4→5、TM5、TM5→6 TM6、TM6→7、TM7和C-末端结构域。
15.含有一段核苷酸序列的分离的核酸,所述核苷酸序列编码早衰素蛋 白的抗原决定基,所述早衰素蛋白选自:正常早衰素-1蛋白、突变早衰素 -1蛋白、正常早衰素-2蛋白、突变早衰素-2蛋白。  
16.权利要求15的分离的核酸,其中所述序列编码早衰素-1抗原决定 基,该抗原决定基对应于选自下列的早衰素-1抗原决定基:SEQ ID NO: 2的氨基酸残基27-44、28-61、46-48、50-60、65-71、 66-67、107-111、109-112、120-121、120-122、125- 126、155-160、185-189、214-223、218-221、220-230、 240-245、241-243、267-269、273-282、300-370、302 -310、311-325、332-342、346-359、372-382、400-410 和400-420。
17.权利要求15的分离的核酸,其中所述序列编码早衰素-2抗原决定 基,该抗原决定基对应于选自下列的早衰素-2抗原决定基:SEQ ID NO: 19的氨基酸残基25-45、50-63、70-75、114-120、127-132、 162-167、221-226、282-290、310-314、321-338、345 -352、380-390和430-435。
18.鉴定人早衰素基因的等位基因变体或异特异性同系物的方法,该方 法包括:
在严谨杂交条件下,选择能够与人早衰素基因序列杂交的核酸探针或引 物:
将所述探针或引物与核酸样品混合,所述样品含有对应于所述变体或同 系物的核酸;
检测所述探针或引物与对应于所述变体或同系物的核酸的杂交。
19.权利要求18的方法,其中所述样品含有选自人基因组DNA、人 mRNA和人cDNA的核酸样品。
20.权利要求18的方法,其中所述样品含有选自哺乳动物基因组 DNA、哺乳动物mRNA和哺乳动物cDNA的核酸样品。
21.权利要求18的方法,其中所述样品含有选自无脊椎动物基因组 DNA、无脊椎动物mRNA和无脊椎动物cDNA的核酸样品。
22.权利要求18的方法,其还包括分离对应于所述变体或同系物的核酸 的步骤。
23.权利要求18的方法,其中所述核酸是通过杂交鉴定的。
24.权利要求18的方法,其中所述核酸是通过PCR扩增鉴定的。
25.鉴定人早衰素基因的等位基因变体或异特异性同系物的方法,其包 括:
选择能够选择性结合人早衰素蛋白的抗体
将所述抗体与蛋白样品混合,所述样品含有对应于所述变体或同系物的 蛋白;
检测所述抗体与对应于所述变体或同系物的所述蛋白的结合。
26.权利要求25的方法,其中所述样品含有选自人蛋白、人融合蛋白和 其蛋白片段的蛋白样品。
27.权利要求25的方法,其中所述样品含有选自哺乳动物蛋白、哺乳动 物融合蛋白和其蛋白水解片段的核酸样品。
28.权利要求25的方法,其中所述样品含有选自无脊椎动物蛋白、无脊 椎动物融合蛋白和其蛋白水解片段的核酸样品。
29.权利要求25的方法,其还包括基本上纯化对应于变体或同系物的所 述蛋白的步骤。
30.含有人早衰素基因的等位基因变体或异特异性同系物的分离的核 酸。
31.编码人早衰素蛋白的等位基因变体或异特异性同系物的分离的核 酸。
32.权利要求31的分离的核酸,其中所述核酸编码人早衰素基因的黑尾 果蝇同系物。
33.权利要求32的分离的核酸,其中所述核酸含有选自下列的核苷酸序 列:
(1)编码含有SEQ ID NO:21的DmPS氨基酸序列的蛋白的序列;
(2)编码早衰素同系物蛋白并在严谨杂交条件下能够与(1)的互补 序列杂交的序列。
34.一段分离的核酸,其含有至少10个连续核苷酸的核苷酸序列,所述 连续核苷酸选自SEQ ID NO:21和与SEQ ID NO:21互补的序列。
35.含有包含权利要求1-34中任一权项的核苷酸序列的重组载体的 分离的核酸。
36.权利要求35的分离的核酸,其中所述载体是表达载体、而且所述早 衰素核苷酸序列与调节区可操作相连。
37.权利要求36的分离的核酸,其中所述表达载体可在哺乳动物细胞中 表达所述早衰素序列。
38.权利要求37的分离的核酸,其中所述细胞选自纤维细胞、肝、肾、 脾、骨髓和神经细胞。
39.权利要求37的分离的核酸,其中所述载体选自痘病毒、腺病毒、 反转录病毒、趋神经病毒和单纯疱疹。
40.权利要求36的分离的核酸,其中所述表达载体编码早衰素蛋白的至 少一个功能结构域,所述早衰素蛋白选自正常早衰素-1、突变早衰素-1、 正常早衰素-2和突变早衰素-2。
41.权利要求36的分离的核酸,其中所述载体还含有编码与所述早衰素 序列可操作相连的外源蛋白的序列,由此所述载体编码早衰素融合蛋白。
42.权利要求41的分离的核酸,其中所述外源蛋白选自lacZ、trpE、 麦芽糖结合蛋白、poly-His标记或谷胱甘肽-S-转移酶。
43.含有重组表达载体的分离的核酸,所述重组表达载体包含对应于早 衰素基因内源调节区的核苷酸序列。
44.权利要求43的分离的核酸,其中所述内源调节区与一标记基因可操 作相连。
45.用权利要求36-44中任一权项的表达载体转化的宿主细胞或其子 代。
46.权利要求45的宿主细胞,其中所述宿主细胞选自细菌细胞和酵母细 胞。
47.权利要求45的宿主细胞,其中所述宿主细胞选自胎细胞、胚胎干细 胞、受精卵、配子和种系细胞。
48.权利要求45的宿主细胞,其中所述细胞选自成纤维细胞、肝、肾、 脾、骨髓和神经细胞。
49.权利要求45的宿主细胞,其中所述细胞是无脊椎动物细胞
50.早老性痴呆病的一种非人动物模型,其中已用至少一种重组构建体 修饰了所述动物的基因组或其祖代,并且已将下列修饰导入所述构建体: (1)编码异特异性正常早衰素基因的至少一个功能结构域的核苷酸序列 的插入,(2)编码异特异性突变早衰素基因的至少一个功能结构域的核 苷酸序列的插入,(3)编码异特异性突变早衰素基因同种同系物的至少 一个功能结构域的核苷酸序列的插入,和(4)内源早衰素基因的失活。
51.权利要求50的动物,其中所述修饰是插入编码正常的人早衰素-1 基因的至少一个功能结构域的核苷酸序列。
52.权利要求50的动物,其中所述修饰是插入编码突变的人早衰素-1 基因的至少一个功能结构域的核苷酸序列。
53.权利要求50的动物,其中所述修饰是插入编码正常的人早衰素-2 基因的至少一个功能结构域的核苷酸序列。
54.权利要求50的动物,其中所述修饰是插入编码突变的人早衰素-2 基因的至少一个功能结构域的核苷酸序列。
55.权利要求50的动物,其中所述修饰是插入编码正常的或突变的人早 衰素蛋白的至少一个功能结构域的核苷酸序列。
56.权利要求50的动物,其中所述动物选自大鼠、小鼠、仓鼠、豚鼠、 兔、狗、猫、山羊、绵羊、猪和非人灵长类。
57.权利要求50的动物,其中所述动物是无脊椎动物。
58.一种生产早衰素蛋白的至少一个功能结构域的方法,其包括在适宜 的条件下培养权利要求45-49中任一权项的宿主细胞以通过表达所述核 酸来生产早衰素。
59.一种基本上纯的蛋白制品,所述蛋白选自正常早衰素-1蛋白、突变 早衰素-1蛋白、正常早衰素-2蛋白、突变早衰素-2蛋白。
60.权利要求59的基本上纯的制品,其中所述蛋白含有选自下列的正常 早衰素-1蛋白:
(1)含有SEQ ID NO:2的氨基酸序列的蛋白;
(2)含有SEQ ID NO:4的氨基酸序列的蛋白;
(3)含有SEQ ID NO:17的氨基酸序列的蛋白;
(4)含有SEQ ID NO:2的氨基酸序列的蛋白,其中用丙氨酸取代 残基257,并略除残基258-290;和
(5)含有SEQ ID NO:4的氨基酸序列的蛋白,其中用丙氨酸取代 残基253,并略除残基254-286。    
61.权利要求59的基本上纯的制品,其中所述蛋白含有包含至少一种突 变的突变早衰素-1蛋白,所述突变对应于选自下列突变的SEQ ID NO:2 的突变:A79?、V82L、V96F、Y115H、M139T、M139V、I143T、 M146L、M146V、H163R、H163Y、L171P、G209V、I211T、 A231T、A246E、A260V、C263R、P264L、P267S、E280A、 E280G、A285V、L286V、Δ291-319、G384A、L392V和C410Y; 并且
其中所述蛋白还对应于选自下列的氨基酸序列:
(1)SEQ ID NO:2的氨基酸序列;
(2)SEQ ID NO:4的氨基酸序列;
(3)SEQ ID NO:17的氨基酸序列;
(4)SEQ ID NO:2的氨基酸序列,其中用丙氨酸取代残基257, 并略除残基258-290;和
(5)SEQ ID NO:4的氨基酸序列,其中用丙氨酸取代残基253, 并略除残基254-286。
62.权利要求59的基本上纯的制品,其中所述蛋白含有选自下列的正常 早衰素-2蛋白:
(1)含有SEQ ID NO:19的氨基酸序列的蛋白;和
(2)含有SEQ ID NO:19的氨基酸序列的蛋白,其中略除了残基263 -296。
63.权利要求59的基本上纯的制品,其中所述蛋白含有包含至少一种突 变的突变早衰素-2蛋白,所述突变对应于选自M239V、N141I和I420T 的SEQ ID NO:19的突变;并且 
其中所述蛋白还对应于选自下列的氨基酸序列:
(1)SEQ ID NO:19的氨基酸序列;
(2)SEQ ID NO:19的氨基酸序列,其中略除了残基263-296。
64.一种基本上纯的多肽制品,其含有选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:17、SEQ ID NO:19和SEQ ID NO:21的至 少5个连续氨基酸残基的氨基酸序列。
65.一种基本上纯的多肽制品,其含有选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:17、SEQ ID NO:19和SEQ ID NO:21的至 少10个连续氨基酸残基的氨基酸序列。
66.一种基本上纯的多肽制品,其含有选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:17、SEQ ID NO:19和SEQ ID NO:21的至 少15个连续氨基酸残基的氨基酸序列。
67.一种基本上纯的多肽制品,其含有早衰素蛋白的至少一个功能结构 域,所述早衰素蛋白选自正常早衰素-1蛋白、突变早衰素-1蛋白、正常早 衰素-2蛋白、突变早衰素-2蛋白。
68.权利要求67的基本上纯的制品,其中所述功能结构域是对应于选 自下列结构域的早衰素-1功能结构域:早衰素-1的N-末端、TM1、 TM1→2、TM2、TM2→3、TM3、TM3→4、TM4、TM4→5、TM5、 TM5→6、TM6、TM6→7、TM7和C-末端结构域。
69.权利要求67的基本上纯的制品,其中所述功能结构域是对应于选 自下列结构域的早衰素-2功能结构域:早衰素-2的N-末端、TM1、 TM1→2、TM2、TM2→3、TM3、TM3→4、TM4、TM4→5、TM5、 TM5→6、TM6、TM6→7、TM7和C-末端结构域。
70.一种基本上纯的多肽制品,其含有早衰素蛋白的抗原决定基,所述 早衰素蛋白选自:正常早衰素-1蛋白、突变早衰素-1蛋白、正常早衰素-2 蛋白、突变早衰素-2蛋白。
71.权利要求70的基本上纯的制品,其中所述多肽含有早衰素-1抗原 决定基,该抗原决定基对应于选自下列的早衰素-1抗原决定基:SEQ ID NO:2的氨基酸残基27-44、28-61、46-48、50-60、65- 71、66-67、107-111、109-112、120-121、120-122、125 -126、155-160、185-189、214-223、218-221、220-230、 240-245、241-243、267-269、273-282、300-370、302 -310、311-325、332-342、346-359、372-382、400-410 和400-420。
72.权利要求70的基本上纯的制品,其中所述多肽含有早衰素-1抗原 决定基,该抗原决定基对应于选自下列的早衰素-1抗原决定基:SEQ ID NO:19的氨基酸残基25-45、50-63、70-75、114-120、127 -132、162-167、221-226、282-290、310-314、321-338、 345-352、380-390和430-435。
73.生产与早衰素选择性结合的抗体的方法,其包括如下步骤:
给动物施用致免疫有效量的早衰素免疫原;
使所述动物生产抗所述免疫原的抗体;和
从所述动物或其衍生的细胞培养物中得到所述抗体。
74.一种基本上纯的抗体制品,其与早衰素蛋白的抗原决定基选择性结 合,所述早衰素蛋白选自正常早衰素-1、突变早衰素-1、正常早衰素-2、 突变早衰素-2。
75.权利要求74的基本上纯的抗体制品,其中所述抗体选择性地结合突 变早衰素-1的抗原决定基,但不能结合正常早衰素-1蛋白。
76.权利要求74的基本上纯的抗体制品,其中所述抗体选择性地结合突 变早衰素-2的抗原决定基,但不能结合正常早衰素-2蛋白。
77.生产权利要求74-76中任一权项的抗体的细胞系。
78.鉴定可调节早衰素基因表达的化合物的方法,其包括:
将细胞与受试候选物接触,其中所述细胞包含与编码区可操作相连的早 衰素基因的调节区;和
检测所述编码区表达方面的变化。
79.权利要求78的方法,其中所述变化包括由所述编码区编码的mRNA 转录本水平的变化。
80.权利要求78的方法,其中所述变化包括由所述编码区编码的蛋白水 平的变化。
81.权利要求78的方法,其中所述变化是由所述编码区编码的蛋白的活 性的结果。
82.权利要求78的方法,其中所述编码区编码标记蛋白,所述标记蛋白 选自β半乳糖苷酶、磷酸酶、绿荧光蛋白和荧光素酶。
83.一种鉴定可选择性结合早衰素蛋白的化合物的方法,其包括如下步 骤:
提供含至少一种早衰素组分的制品;
将所述制品与包含至少一种候选化合物的样品接触;和
检测所述早衰素组分与所述候选化合物的结合。
84.权利要求83的方法,其中与所述早衰素组分的结合是通过选自下列 的试验来检测的:亲和层析、共免疫沉淀、生物分子相互作用试验和酵母 双杂交系统。
85.鉴定可调节早衰素活性的化合物的方法,其包括如下步骤:
提供表达正常或突变早衰素基因的细胞;
将所述细胞与至少一种候选化合物接触;和
检测所述活性的标记的变化。
86.权利要求85的方法,其中所述标记的测量表明带有表达的突变早衰 素基因的细胞与其它不带有表达的突变早衰素基因的相同细胞之间存在的 差异。
87.权利要求85的方法,其中所述变化包括选自下列的细胞生理学非特 异性标记的变化:pH、胞内、环AMP水平、GTP/GDP比率、磷脂酰 肌醇活性和蛋白磷酸化
88.权利要求85的方法,其中所述变化包括早衰素表达方面的变化。
89.权利要求85的方法,其中所述变化包括选自Ca2+、Na+和K+的离 子的细胞内浓度或流量方面的变化。
90.权利要求85的方法,其中所述变化包括细胞凋亡或细胞死亡的出现 或比率方面的变化。
91.权利要求85的方法,其中所述变化包括Aβ肽生产方面的变化。
92.权利要求85的方法,其中所述变化包括至少一种微管相关蛋白磷酸 化的变化。
93.权利要求85的方法,其中所述细胞是体外培养的细胞。
94.权利要求93的方法,其中所述细胞是权利要求45-49中任一权项 的转化的宿主细胞。
95.权利要求93的方法,其中从携带至少一种突变早衰素基因的宿主中 外植所述细胞。
96.权利要求93的方法,其中从权利要求50-57中任一权项的转基因 动物中外植所述细胞。
97.权利要求85的方法,其中所述细胞是活动物中的细胞。
98.权利要求97的方法,其中所述细胞是权利要求50-57中任一权项 的转基因动物的细胞。
99.权利要求85的方法,其中所述细胞是临床试验中的人类受试者的细 胞。
100.确定受试者是否带有突变早衰素基因的诊断方法,其包括如下步 骤:
提供所述受试者的生物样品;
在所述样品中检测突变早衰素核酸、突变早衰素蛋白或突变早衰素活 性。
101.权利要求100的方法,其中突变早衰素核酸是通过选自下列的试验 检测的:直接核苷酸测序、探针特异性杂交、限制酶消化和作图、PCR作 图、连接酶介导的PCR检测、RNase保护、电泳迁移率变动分析和化学错 配切割。
102.权利要求100的方法,其中突变早衰素蛋白是通过选自下列的试验 检测的:免疫试验、蛋白酶试验和电泳迁移率试验。
103.含有基本上纯的早衰素蛋白和可药用载体的药物制品。
104.含有可操作地编码早衰素蛋白的表达载体和可药用载体的药物制 品,其中所述表达载体可在人类受试者中表达所述早衰素蛋白。
105.含有可操作地编码早衰素反义序列的表达载体和可药用载体的药 物制品,其中所述表达载体可在人类受试者中表达所述早衰素反义序列。
106.含有基本上纯的抗体和可药用载体的药物制品,其中所述抗体选 择性地结合突变早衰素蛋白。
107.权利要求106的药物制品,其中所述制品基本上没有选择性结合正 常早衰素蛋白的抗体。
108.含有突变早衰素蛋白的基本上纯的抗原决定基制品的药物制品。
109.权利要求108的药物制品,其中所述制品基本上没有正常早衰素蛋 白的抗原决定基。
110.一种治疗携带突变早衰素基因的患者的方法,其包括给所述患者 施用治疗有效量的权利要求103-109中任一权项的药物制品。
111.权利要求110的方法,其中所述药物制品靶向选自下列的细胞类 型:心、脑、、肝、骨骼肌、肾、胰腺和神经细胞。

说明书全文

相关申请

本申请是1995年7月31日申请的美国申请系列08/509359的接续申 请,而08/509359是1995年6月28日申请的美国申请系列08/496841的接 续申请,08/431048是1995年4月28申请的美国申请系列08/431048的接 续申请,所有申请的题目均为“与早老性痴呆病有关的基因序列和蛋白及 其用途”(发明人:Peter H St.George-Hyslop,Johanna M.Rommens and Paul E.Fraser),所有申请均引入本文作为参考。

发明领域

本发明主要涉及与早老性痴呆病有关的神经病学和生理学功能失调。 更具体地说,本发明涉及鉴定、分离并克隆与早老性痴呆病有关的基因以 及其转录本、基因产物、有关的序列资料和相关基因。本发明还涉及检测 并诊断这些基因的正常和突变等位基因的载体的方法、涉及检测并诊断早 老性痴呆病的方法、涉及鉴定与早老性痴呆有关的或与早老性痴呆基因和 蛋白相互作用的基因和蛋白的方法、涉及筛选潜在的早老性痴呆病疗法的 方法、涉及治疗早老性痴呆病的方法,还涉及用于筛选并评估对治疗早老 性痴呆病有效的细胞系和动物模型。

发明背景

为了便于参考各种期刊文章,在本发明说明书后列出了所述文章。
早老性痴呆病(AD)是人中枢神经系统的衰退性紊乱,其特征在于 在中年到老年期间,有进行性记忆损伤,而且认识和智衰退(Katzman, 1986)。该病伴有神经病理学特征的出现,其中主要是出现了细胞外淀粉 样或衰老斑以及神经元的神经纤维衰退。该病的病因很复杂,尽管在某些 家族中,它是以常染色体显性特征遗传的。但是,甚至在AD的这些遗传 形式中,有至少三种不同的基因,它们赋予对该病的遗传敏感性(St. George-Hyslop等,1990)。在晚年发作的显著比例的病例中,阿扑脂蛋 白(ApoE)基因的ε4(C112R)等位基因多态性也与AD有关(Saunders 等,1993;Strittmatter等,1993)。同样,很小比例的在65岁前发作的 家族病例也与β-淀粉样前体蛋白(APP)基因的突变有关(Chartier- Harlin等,1991;Goate等,1991;Murrell等,1991;Karlinsky等, 1992;Mullan等,1992)。最近将与许多早期发作AD病例有关的第三 座位(AD3)定位在染色体14q24.3(Schellenberg等,1992; St.George-Hyslop等,1992;Van Broeckhoven等,1992)。
尽管染色体14q区携带了数个基因,所述基因可以作为与AD3有关的 突变位点的候选基因(例如cFOS,α-1-抗胰凝乳蛋白酶和组织蛋白酶G), 但是根据其在AD3区外的物理位置和/或在其相应的开放阅读框架中没有 突变而排除了这些候选基因中的大部分(Schellenberg等,1992;Van Broeckhoven等,1992;Rogaev等,1993;Wong等,1993)。
在早老性痴呆病的治疗和诊断方面,已经有一些研究和商业方法或策 略。公开的PCT申请WO94/23049描述了将高分子量YAC DNA转染到特 异性小鼠细胞中。用该方法分析了许多基因结合物。例如,转基因小鼠APP 基因的量可能会增加,这样模拟了在先天愚型综合征中普遍存在的三体性 状况,而且可以产生带有β-淀粉样变的动物模型,这种β-淀粉样变在 患有早老性痴呆病个体中普遍存在。公开的国际申请WO94 00569描述了 转基因非人动物,它们带有大量的转基因如含有人APP基因的转基因。所 述动物模型可作为人遗传病如早老性痴呆病的有用模型。
加拿大专利申请2096911描述了编码APP-裂解蛋白酶的核酸,它与 早老性痴呆病和先天愚型综合征有关。可以用从染色体19中分离的遗传物 质诊断早老性痴呆病。加拿大专利申请2071105描述了通过YAC核苷酸序 列来检测并治疗遗传性或获得性早老性痴呆病。用23CB10、28CA12和 26FF3鉴定了不同的YAC。
美国专利5297562描述了检测与染色体21的三体性有关的早老性痴呆 病。治疗包括降低染色体21三体性增殖的方法。加拿大专利申请2054302 描述了识别人脑细胞核蛋白的单克隆抗体,所述蛋白由染色体21编码,并 且所述抗体用于检测因早老性痴呆病或先天愚型综合征而引起的表达改 变。所述单克隆抗体对于由人染色体21编码的蛋白有特异性,并在人脑组 织的许多锥体细胞可以找到。
发明综述
本发明部分基于被称为早衰素-1(PS1)和早衰素-2(PS2)的两种哺乳动 物基因的鉴定、分离、克隆和测序。这两个基因和其相应的蛋白产物是高 度保守的基因家族,早衰素(presenilin)的成员,在其它哺乳动物(如小鼠、 大鼠)中有同源性或直向性,在无脊椎动物(如C.elegans,黑尾果蝇(D. melanogaster))中是直向的。这些基因中的突变与人类中家族性早老性痴 呆病的发生有关,而且可能也是其它疾病(如其它认识、智力、神经或生 理疾病如脑出血、精神分裂症抑郁症、精神发育不全和癫痫)的病因。 本发明公开提供了人PS1(hPS1)和人PS2(hPS2)基因的基因组和cDNA 核苷酸序列、鼠PS1同系物(mPS1),以及来自C.elegans(sel-12,SPE-4) 和黑尾果蝇(DmPS)的相关基因。本公开还提供了由这些基因编码的预 测的早衰素蛋白的基酸序列以及早衰素的结构特征,包括推测的功能结 构域和抗原决定基。还公开了是早老性痴呆病(AD)病因的早衰素中的 许多突变,并涉及所述蛋白的功能结构域。
因此,在一系列的实施方案中,本发明提供了分离的核酸,所述核酸包 括含有或衍生于早衰素基因的核苷酸序列,并且/或者所述核酸编码含有或 衍生于早衰素蛋白的多肽。本发明的早衰素序列包括具体公开的序列、这 些序列的剪接突变体、这些序列的等位基因突变体、同物异名序列和这些 序列的同源或直向突变体。因此,例如本发明提供了hPS1基因、hPS2基 因、mPS1基因和DmPS基因的基因组和cDNA序列。本发明还通过可常 规得到所述突变体的方法提供了等位基因变体和同源或直向序列。本发明 还通过公开许多具体的突变体序列以及通过可常规得到所述变体的方法而 具体提供了早衰素的突变体或致病变体。由于可将本发明核酸用于许多诊 断、治疗和重组应用中,所以还提供了早衰素序列的不同亚单位和早衰素 序列与异源序列的组合。例如为了用于等位基因特异性杂交筛选或PCR扩 增,提供了早衰素序列的亚单位包括有意和反义序列、正常的和突变序列、 以及内含子、外显子和非翻译序列。所述序列可含有少量在本文中公开或 能够得到的序列的连续核苷酸,但优选包括来自早衰素序列的至少8-10 个,更优选9-25个连续核苷酸。早衰素序列其它优选的亚单位包括编码 一个或多个早衰素蛋白功能结构域或抗原决定基的那些,特别是可包括正 常(野生型)或突变序列。本发明还提供了各种核酸构建体,其中将早衰 素序列(完整的或部分序列)与外源序列可操作相连以形成克隆载体、表 达载体、融合载体、转基因构建体等。因此,根据本发明的另一方面,还 提供了用于转化哺乳动物或无脊椎动物组织细胞的重组载体以便在细胞中 表达正常或突变早衰素序列。
在另一系列实施方案中,本发明提供了用本发明核酸之一转染或转化 的宿主细胞。转化所述细胞可以仅仅是为了增殖本发明的核酸构建体或转 化所述细胞以表达早衰素序列。可以将本发明的转化细胞用在检测中以鉴 定影响正常或突变早衰素表达的、与正常或突变早衰素蛋白相互作用、和/ 或调节或影响正常或突变蛋白功能的蛋白和/或其它化合物,或者以便生产 本发明早衰素蛋白、融合蛋白、功能结构域、抗原决定基和/或抗体。出于 治疗或其它原因,可以将转化的细胞植入到宿主(包括人)中。优选的宿 主细胞包括哺乳动物的来自神经元、成纤维细胞、骨髓、脾、器官型细胞 或混合的细胞培养物,以及细菌、酵母线虫、昆虫和其它无脊椎动物细 胞。为了下文所述用途,优选细胞包括胚干细胞、受精卵、配子和种系细 胞。
在另一系列的实施方案中,本发明提供了用于AD和与早衰素基因突 变有关的其它疾病或失调的转基因动物模型。所述动物可以是任何哺乳动 物,包括大鼠、小鼠、仓鼠、豚鼠、兔、狗、猫、山羊、绵羊、猪和非人 灵长动物。另外,也可以将无脊椎动物模型包括线虫和昆虫用于特定的应 用。通过标准转基因方法,包括用含有基因组或cDNA片段、小基因的载 体、同源重组载体、病毒插入载体等微注射、转染或胚干细胞、受精卵、 配子和种系细胞的其它转化形式可以产生动物模型。适宜的载体包括痘苗 病毒、腺病毒、腺相关病毒、反转录病毒、脂质体运输、神经营养型病毒 和单纯疱疹病毒。动物模型可包含含有或衍生于早衰素的转基因序列(包 括正常和突变序列、内含子、外显子和非翻译序列),和编码早衰素亚单 位如功能结构域的序列。所提供的主要动物模型包括:(1)其中已经将 正常人早衰素基因作为在外源或内源启动子调节下的附加基因,或作为小 基因或大基因组片段而重组导入动物基因组中的动物;其中通过同源重组 或基因导向而用正常人早衰素基因取代一个或两个拷贝的动物同源早衰素 基因的动物;和/或其中通过同源重组或基因导向而经编码人同系物的序列 的部分取代,已将一个或两个拷贝的动物同源早衰素基因之一重组“人源 化”的动物。(2)其中已经将突变人早衰素基因作为在外源或内源启动 子调节下的附加基因,或作为小基因或大基因组片段而重组导入动物基因 组中的动物;其中通过同源重组或基因导向而用突变人早衰素基因取代一 个或两个拷贝动物同源早衰素基因的动物;和/或其中通过同源重组或基因 导向而经编码突变人同系物的序列的部分取代,已将一个或两个拷贝的动 物同源早衰素基因之一重组“人源化”的动物。  (3)其中已经将突变动 物早衰素基因之一的突变体作为在外源或内源启动子调节下的附加基因, 并作为小基因或大基因组片段而重组导入动物基因组中的动物;其中通过 同源重组或基因导向而用动物早衰素基因之一的突变体取代一个或两拷贝 动物同源早衰素基因的动物。(4)其中通过同源重组或基因导向而部分 或全部缺失了一个或两个拷贝的动物早衰素基因之一,或通过外源序列的 同源重组或基因导向来完成插入或取代,从而使一个或两个拷贝的动物早 衰素基因之一失活的“剔除”动物。在优选实施方案中,AD的转基因小 鼠模型有一编码正常人PS1或PS2蛋白、编码人或鼠PS1或PS2蛋白的突 变体或人源化正常的或突变鼠PS1或PS2蛋白的转基因。
在另一系列实施方案中,本发明提供了基本上纯的含多肽的蛋白制 剂,所述多肽含有或衍生于早衰素蛋白。本发明的早衰素蛋白序列包括具 体公开的序列、因改变mRNA剪接而产生的这些序列的变体、这些序列的 等位基因变体和这些序列的同源或直向同源变体。因此,例如本发明提供 了hPS1蛋白、hPS2蛋白、mPS1蛋白和DmPS蛋白的氨基酸序列。本发 明还通过可以常规得到所述变体的方法,而提供了等位基因变体和同源或 直向同源蛋白。本发明还通过公开许多具体的突变体基因和通过可以得到 所述变体的方法而具体提供了早衰素的突变体或致病变体。由于可以将本 发明的蛋白用于各种诊断、治疗和重组应用,因此,还提供了各种早衰素 蛋白序列亚单位和早衰素蛋白序列与异源序列的组合。例如,为了用作免 疫原或用于结合试验,提供了早衰素蛋白序列的亚单位包括正常和突变体 序列。所述蛋白序列可含有少量在本文中公开或能够得到的序列的连续核 苷酸,但优选包括来自早衰素序列的至少8-10个,更优选9-25个连 续核苷酸。早衰素蛋白序列其它优选的亚单位包括相应于早衰素蛋白一个 或多个功能结构域或抗原决定基的那些,特别是可包括正常(野生型)或 突变体序列。本发明还提供了各种蛋白构建体,其中将完整的或子序列与 外源序列相连以形成融合蛋白等  根据这些实施方案,本发明还提供了生 产所有上述含有或衍生于早衰素的蛋白的方法。
在另一系列的实施方案中,本发明提供了多克隆和单克隆抗体的生产 方法和用途,所述抗体包括抗体片段,包括Fab片段,F(ab’)2和单链抗体 片段,它们可与早衰素或早衰素的特异性抗原决定基选择性结合。可以在 小鼠、兔、山羊或其它适宜动物中,或在培养的细胞如杂交瘤细胞系中生 产所述抗体。优选生产抗含早衰素序列至少4-8,优选至少9-15个连 续氨基酸残基的抗体。可将本发明抗体用于本文所述的各种诊断、治疗和 技术应用。
在另一系列的实施方案中,本发明提供了筛选或鉴定蛋白、小分子或 其它化合物的方法,这些物质能够诱导或抑制早衰素基因表达并诱导或抑 制蛋白(如PS1或PS2)。可用非转化细胞、固定的细胞系或重组细胞系 在体外,或用本文的转基因动物模型在体内完成所述试验。特别是,所述 试验可在mRNA表达增加或减少的基础上,检测PS1、PS2或其它早衰素 -相关基因或蛋白的表达是否有增加或减少,检测早衰素-相关蛋白产物 平是否有增加或降低,或在重组构建体中,与早衰素5’调节区可操作相 连的标记基因(β-半乳糖苷酶、绿荧光蛋白、磷酸酶或荧光素酶)的 表达水平是否有增加或降低。温育已知表达特定早衰素或转化后表达特定 早衰素的细胞,然后将一种或多种试验化合物加到培养基中。在经过使所 述化合物足以诱导早衰素表达的时间(如0-72小时)后,可用上述任何 技术检测建立在基本表达水平上的任何变化,在特别优选的实施方案中, 细胞是来自固定的细胞系如人成神经细胞瘤、胶质母细胞瘤或杂交瘤细胞 系或本发明的转化细胞。
在另一系列实施方案中,本发明提供了鉴定与早衰素结合或与之直接 相互作用的蛋白和其它化合物的方法。所述蛋白和化合物包括与早衰素体 内相互作用并因此为药物和治疗提供新靶的内源细胞组分,以及具有早衰 素结合能力并因此可作为候选药物的重组、合成和其它外源化合物。因此 在一系列的实施方案中,可筛选细胞溶解产物或组织匀浆物(如人脑匀桨 物、淋巴细胞溶解产物)以得到与正常或突变早衰素之一结合的蛋白或其 它化合物。另外,可就早衰素结合能力对任何外源化合物(天然和/或合成 的(如小分子或肽文库))进行筛选。在这些实施方案中,完成试验以检测 “早衰素组分”和一些其它部分之间的结合。在这些试验中的“早衰素组 分”可以是含有或衍生于正常或突变早衰素蛋白的多肽,包括早衰素功能 结构域或早衰素的抗原决定基或早衰素融合蛋白。用非特异性测量法(如 细胞内Ca2+的变化,GTP/GDP比率)或特异性测量法(如通过示差显示、 2D凝胶电泳、示差杂交或SAGE方法监测的Aβ肽生产变化或其它下游基 因表达方面的变化)可检测所述结合。优选方法涉及下列技术的改变: (1)通过亲和层析直接提取;(2)通过免疫沉淀共分离早衰素组合和 结合的蛋白;(3)生物分子相互作用(Biomolecular Interaction)试验 (BIAcore);和(4)酵母双杂交系统。
在另一系列的实施方案中,本发明提供了鉴定能够调节正常或突变早 衰素活性的蛋白、小分子和其它化合物的方法。使用正常细胞或动物,本 发明的转化细胞和转基因动物模型,或从携带正常或突变早衰素基因的受 试者得到的细胞,本发明以其影响早衰素表达、早衰素细胞内定位、细胞 内Ca2+、Na+、K+或其它离子水平或代谢、细胞凋亡或细胞死亡的发生 或速率、Aβ肽生产的水平或图谱、微管相关蛋白的磷酸化水平或其它区 别携带正常和突变早衰素序列的细胞的生物化学组织学或生理学标记为基 础,提供了鉴定所述化合物的方法。利用本发明的转基因动物,还以所述 化合物影响与早衰素中突变相关的行为、生理学或组织学表型的能力为基 础,提供了鉴定所述化合物的方法。
在另一系列的实施方案中,本发明提供了筛选与AD相关的早衰素等 位基因的载体、诊断AD患者、筛选并诊断相关的早衰和老年痴呆、精神 病如精神分裂症和抑郁症和神经学疾病如中和脑出血(这些疾病均与 PS1或PS2基因中的突变有关)的方法。通过以核酸(包括基因组和 mRNA/cDNA序列)、蛋白、和/或本文公开并能够得到的抗体为基础的方 法,包括设计用来检测正常早衰素活性丧失或增强和/或是否存在因突变早 衰素而赋予的特殊新活性的功能试验可完成筛选和/或诊断。因此,提供了 以早衰素蛋白为基础的筛选和诊断方法,所述方法可在电泳迁移率、蛋白 水解裂解图谱、各种氨基酸残基的摩尔比、与特异性抗体的结合能力方面, 检测突变体和正常早衰素之间的差异。另外,提供了以核酸(gDNA, cDNA或mRNA)为基础的筛选和诊断方法,所述方法可通过直接的核苷 酸测序、利用等位基因特异性寡核苷酸的杂交、限制酶消化和作图(如 RFLP,REF-SSCP),电泳迁移率(如SSCP,DGGE)、PCR图谱、 RNase保护、化学错配裂解、连接酶介导的检测以及各种其它方法来检测 核苷酸序列中的差异。还提供了其它方法来检测PS1、PS2、APP或与 PS1、PS2或APP反应的蛋白的不正常加工(如,异常磷酸化、糖基化、 糖化(glycation)酰胺化或蛋白水解裂解)在早衰素转录、翻译和翻译后 修饰方面的改变;早衰素基因产物的细胞内和细胞外运输方面的改变;或 早衰素的异常细胞内定位。根据这些实施方案,还提供了诊断试剂盒,所 述试剂盒含有上述诊断筛选所必需的试剂。
在另一系列的实施方案中,本发明提供了用于治疗早衰素-相关疾病 如AD的方法和药物制品。这些方法和药物是基于(1)施用正常PS1或 PS2蛋白,(2)用正常PS1或PS2基因进行基因治疗以补偿或取代突变 体基因,(3)以与突变体PS1或PS2基因的反义序列或“剔除”突变体 基因为基础的基因治疗,(4)以编码阻断或更正PS1或PS2突变体的有 害作用的蛋白的序列为基础的基因治疗,(5)以正常和/或突变体PS1或 PS2蛋白的抗体为基础的免疫治疗,或(6)小分子(药物),它们改变 PS1或PS2表达,阻断PS1或PS2的突变体形式与其它蛋白或配体之间的 异常相互作用,或通过改变突变体蛋白的结构,通过增强其代谢清除率或 通过抑制其功能而阻断突变体PS1或PS2蛋白的异常功能。
根据本发明的另一方面,可用本发明蛋白作为理论药物设计的启始点 以提供配体、治疗药物或其它类型的小化学分子。另外,可将用上述方法 鉴定小分子或其它化合物在理论药物设计中作为“先导药物”。
本发明特别公开的核苷酸和氨基酸序列标为SEQ ID NO:1-25。另 外,根据布达佩斯条约,已将本文公开的特定核酸的生物保藏物在ATCC (Rockville,MD)进行了保藏。这些保藏物包括保藏号97124(1995年 4月28日保藏),保藏号97508(1995年6月25日保藏),保藏号97214 (1995年6月28日保藏)和保藏号97428(1996年1月26日保藏)。
附图简述
图1:该图表示hPS1基因组DNA的结构。用实体黑影方框表示非编 码外显子。用空框表示编码外显子,用划阴影线的框表示其它剪接序列。 限制位点是:B=BamH;E=EcoRI;H=HindIII;N=NotI;P=PstI; V=PvuII;X=XbaI。在水平线上限制位点之间的不连续区域表示未确定的 基因组序列。用双向水平箭头表示含各外显子的克隆的基因组片段。提供 了基因组亚克隆的大小和个基因组序列的保藏号。
图2:该图表示推定PSI蛋白的疏水性图。该图是根据Kyte知 Doolittle(1982)的方法计算的。
图3:该图表示hPS1和mPS1蛋白序列的序列排列。垂直线表示相同 的氨基酸。
图4:该图表示hPS1和hPS2蛋白序列的序列排列。垂直线表示相同 的氨基酸。
图5:是PS1蛋白预测结构的示意图。罗数字表示跨膜结构域。用 星号表示推定的糖基化位点,磷酸化位点位于与两个酸性亲水环相同的膜 外表面。MAP激酶位点位于115残基,PKC位点位于114残基。FAD突 变位点用水平箭头表示。
图6:是PS2蛋白预测结构的示意图。罗马数字表示跨膜结构域。用 星号表示推定的糖基化位点,磷酸化位点位于与两个酸性亲水环相同的膜 外表面。FAD突变位点用水平箭头表示。
本发明的详细描述
I定义:
为了便于研究本发明不同的实施方案,理解在完成和使用本发明中所 用的各元件和组成,在描述和权利要求中所用的特定术语的定义如下:
早衰素。如本文没有进一步说明,术语“早衰素”指早衰素-1(PS1)和/ 或早衰素-2(PS2)基因/蛋白。具体地说,未修饰的术语“早衰素”指哺乳动 物PS1和/或PS2基因/蛋白,优选人PS1和/或PS2基因/蛋白。
早衰素-1基因。如本文所用,术语“早衰素-1基因”或“PS1基因” 指第一次公开并描述于美国申请08/431048(1995年4月28日申请), 以及后来描述于Sherrington等(1995)中的哺乳动物基因,包括任何等 位基因变体和异特异性的哺乳动物同系物。一种人早衰素-1(hPS1)cDNA序 列在本文中以SEQ ID NO:1公开。通过改变hPS1 mRNA转录本的剪接 而得到的另一人cDNA序列以SEQ ID NO:3公开。如下文所述,还发现 了另外的人类剪接变体,其中在某些转录本中,33个残基的编码区被剪接 掉。一种鼠同系物(mPS10的cDNA以SEQ ID NO:16公开。术语“早衰 素-i基因”或“PS1基因”主要指编码序列,但还可包括部分或全部侧调 节区和/或内含子。术语PS1具体指从cDNA或基因组DNA产生的人工或 重组基因,包括以剪接变体为基础的重组基因。也曾将早衰素-1基因称为 S1S2基因(如Sherrington等,1995)或早老性痴呆病相关的膜蛋白 (ARMP)基因(如美国申请08/431048,1995年4月28日申请)。
早衰素-1蛋白。如本文所用的,术语“早衰素-1蛋白”或“PS1蛋白” 指由PS1基因,包括等位基因变体和异特异性哺乳动物同系物编码的蛋 白。人早衰素-1(PS1)蛋白序列在本文中以SEQ ID NO:2公开。通过改变 hPS1mRNA转录本的剪接而得到的另一人PS1蛋白以SEQ ID NO:4公 开。如下文所述,还发现了另外的人剪接变体,其中在某些转录本中,33 个残基的编码区被剪接掉。这些变体也被本文的术语早衰素-1蛋白所包 括。鼠同系物(mPS1)的蛋白序列以SEQ ID NO:17公开。可通过重组细 胞或生物体生产所述蛋白,从天然组织或细胞系中可基本上纯化所述蛋 白,或用化学或酶学方法合成所述蛋白。因此,“早衰素-1蛋白”或“PS1 蛋白”包括糖基化的、部分糖基化的或非糖基化形式以及磷酸化、部分磷 酸化、非磷酸化的、硫酸化、部分硫酸化的或非硫酸化形式的蛋白。该术 语还包括PS1氨基酸序列的等位基因变体和其它功能等同物,包括生物活 性蛋白水解片段或其它片段。也曾将该蛋白称为S182蛋白或早老性痴呆病 相关的膜蛋白(ARMP)(如美国申请08/431048,1995年4月28日申 请)。
hPS1基因和/蛋白。如本文所用的,缩写“hPS1”指PS1基因和/或蛋 白的人等位基因变体。在本文中人PS1基因的cDNA序列以SEQ ID NO: 1和SEQ ID NO:3公开。相应的蛋白序列以SEQ ID NO:2和SEQ ID NO:4公开。还公开了各种等位基因变体包括有害突变体,而且可从下 文描述中得到所述变体。
mPS1基因和/或蛋白  如本文所述,缩写“mPS1”指PS1基因和/或 蛋白的鼠同系物和鼠等位基因变体。一种鼠PS1基因的cDNA序列以SEQ ID NO:16公开。相应的mPS1蛋白序列以SEQ ID NO:17公开。从下 文的描述中可以得到包括有害突变体的等位基因变体。
早衰素-2基因。如本文所用的,术语“早衰素-2基因”或“PS2基因” 指第一次在美国申请08/496841(1995年6月28日申请)中公开的,后 来在Rogaev等(1995)和Levy-Lahad等(1995)中描述的哺乳动物基 因,包括任何等位基因变体和异特异性哺乳动物同系物。本文以SEQ  ID NO:18公开了一种人早衰素-2(hPS1)cDNA序列。如下文所述,还发现 了其它的人剪接变体,其中在某些转录本中剪接掉了单个密码子或33个残 基的编码区。术语“早衰素-2基因”或“PS2基因”主要指编码序列,但 也可包括部分或全部侧调节区和/或内含子。术语PS2基因具体包括从 cDNA或基因组DNA产生的人工或重组基因,包括以剪接变体为基础的重 组基因。曾将早衰素-2基因称为E5-1基因(如Rogaev等,1995;美国申 请08/496841,1995年6月28日申请)或STM2基因(如Levy-Lahad等 1995)。
早衰素-2蛋白。如本文所用的,术语“早衰素-2蛋白”或“PS2蛋白” 指由PS2基因编码的蛋白,包括等位基因变体和异特异性哺乳动物同系 物。以SEQ ID NO:19公开了一种人早衰素-2(hPS2)蛋白。如下文所述, 还发现了其它人剪接变体,其中在某些转录本中剪接掉了单个残基或含33 个残基的区域。这些变体也被本文所用的术语早衰素-2蛋白所包括。通过 重组细胞或生物体可以生产所述蛋白,从天然组织或细胞系中可基本上纯 化所述蛋白,或用化学或酶学方法合成所述蛋白。因此,术语“早衰素-2 蛋白”或“PS2蛋白”包括糖基化、部分糖基化或非糖基化形式以及磷酸 化、部分磷酸化、非磷酸化、硫酸化、部分硫酸化或非硫酸化形式的蛋白。 该术语还包括PS2氨基酸序列的等位基因变体和其它功能等同物,包括生 物活性蛋白水解或其它片段。曾将早衰素-2基因称为E5-1蛋白(如Rogaev 等,1995;美国申请08/496841,1995年6月28日申请)或STM2蛋白 (Levy-Lahad等1995)。
hPS2基因和/或蛋白。如本文所用的,缩写“hPS2”指PS2基因/蛋白 的人同系物和人等位基因变体。本文以SEQ ID NO:18公开了人PS2基 因的一种cDNA序列。本文以SEQ ID NO:19公开了相应的hPS2蛋白序 列。公开了包括有害突变体的许多等位基因变体,而且从下文的描述中可 得到。
DmPS基因和/或蛋白。如本文所用的,编写“DmPS”指PS1和PS2 基因/蛋白的果蝇属同系物和等位基因变体。该定义包括在所述基因或蛋白 序列中的取代、插入或缺失不影响所述基因产物的基本功能的核酸和氨基 酸序列多态性。本文以SEQ ID NO:20公开了DmPS基因的一种cDNA 的核苷酸序列,并以SEQ ID NO:21公开了相应的氨基酸序列:术语 “DmPS”主要指编码序列,但也包括部分或全部的侧调节区和/或内含子
正常的。就本文所用的基因而言,术语“正常的”指编码正常蛋白的基 因。就本文所用的蛋白而言,术语“正常的”指可完成其常规或正常生理 作用,而且与致病的条件或状态无关或不是病因的蛋白。因此,如本文所 用的,术语“正常的”基本上是野生型的同义词。对于所给的基因或相应 的蛋白,可存在正常等位基因变体的多重性,它们之中没有一个与致病条 件或状态的发展有关。所述正常等位基因变体包括,但不限于其中一个或 多个核苷酸取代不会导致所编码的氨基酸序列发生改变的变体。
突变体。就本文的基因而言,术语“突变体”指编码突变体蛋白的基 因。就本文的蛋白而言,术语“突变体”指不能完成其常规或正常生理作 用,而且与致病的条件或状态相关或者是致病条件或状态的原因的蛋白。 因此,如本文所用的,术语“突变体”基本上是“功能失调”、“致病的”、 “病因的”和“有害的”的同义词。就本发明的早衰素基因和蛋白而言, 术语“突变体”指携带一个或多个核苷酸/氨基酸取代、插入和/或缺失的早 衰素基因,当所述基因在人类中表达时,会导致发生早老性痴呆病和/或其 它相关的遗传表型(如脑出血、精神发育迟缓、精神分裂症、精神病和抑 郁症)。该定义包括天然存在的各种突变,包括但不限于本文所公开的、 以及人为合成的或重组突变。当将术语“突变体”用于早衰素基因时,由 于遗传密码的简并性,既并不仅仅包括编码与本文公开或能够得到的正常 序列相同的序列变体;也不仅仅包括编码功能等同于正常早衰素蛋白的蛋 白的序列变体,尽管它们是编码不同的蛋白。
功能等同物。在本文描述基因序列和氨基酸序列时,术语“功能等同 物”指所列举的序列无需等同于以SEQ ID NO公开的特定序列,仅需提供 可在生物和/或化学上起到本文所公开序列的等同物的功能的序列。
基本纯的。在本文用于蛋白(包括抗体)或其它制品时,术语“基本 纯的”指所述化合物至少占制品的60%重(干重)。优选至少占制品的 75%,更优选占90%,最佳占至少99%(均以所述化合物重量计)。可 用任何适宜的方法如柱层析、凝胶电泳或HPLC分析测量纯度。
就包括抗体的蛋白而言,如果制品包括两种或多种所需的不同化合物 (如两种或多种抗体、免疫原、功能结构域或本发明的其它多肽),“基 本纯的”制品就指其中所有所需化合物的总重量(干重)至少占总干重的 60%。同样,对于所述含两种或多种所需化合物的制品而言,优选所述化 合物的总重量至少是制品总干重的75%,更优选至少90%,最佳为至少 99%。
分离的核酸。如本文所用的,“分离的核酸”是从在其所衍生于的生物 体的天然基因组中紧密相连(一个在5’末端,一个在3’末端)的序列中, 分离的核糖核酸、脱核糖核酸或含有多核苷酸序列的核酸类似物。因此, 该术语包括例如插入到载体、自主复制质粒或病毒或原核或真核生物基因 组DNA中的重组核酸;或以独立于其它序列的单独分子(如,用PCR或 限制内切酶处理产生的cDNA或基因组DNA片段)存在的重组核酸。该 术语还包括作为杂种基因一部分的重组DNA,所述杂种基因编码其它的 多肽序列和/或包括外源调节元件。
基本相同的序列。如本文所用的,“基本相同的”氨基酸序列是仅通 过保守氨基酸取代,如一种氨基酸被同类中的另一种所取代(如缬氨酸取 代甘氨酸,精氨酸取代赖氨酸等)或通过在不破坏所述蛋白功能(检测的, 如本文所述的)的氨基酸序列中的位置上进行非保守取代、缺失或插入而 产生的不同的氨基酸序列。优选在氨基酸水平上,所述序列与被比较的蛋 白或肽序列有至少85%,优选90%,最佳为95%的相同。对于核酸来说, 比较序列的长度通常至少50个核苷酸,优选至少60个核苷酸、更优选至 少70个核苷酸,最佳为110个核苷酸。如上所述,“基本相同的”核酸序 列编码基本相同的氨基酸序列。
转化的细胞。如本文所用的,“转化的细胞”是通过重组DNA技术, 已经导入了所需核酸分子的细胞(或导入到其祖代细胞中)。所需核酸通 常编码肽或蛋白。所述转化的细胞可表达所需的序列或可仅仅用于增殖所 述序列。本文所用的术语“转化的”包括导入外源核酸的任何方法,包括, 但不限于转化、转染、电穿孔、微注射、病毒介导的转染等。
可操作相连的。如本文所用的,当编码序列和调节区以可使编码序列 在调节区的影响或控制下进行表达或转录的方式共价相连时,则认为编码 序列和调节区是“可操作相连的”。如果需要将编码序列翻译成功能蛋白, 如果启动子功能的导入导致编码序列的转录,而且如果两个DNA序列之 间的连续性质不会(1)导致移码突变,(2)影响调节区指导编码序列 转录的能力或(3)影响相应RNA转录本翻译成蛋白的能力,则认为这两 个DNA序列是可操作相连的。因此,如果调节区能够影响DNA序列的转 录,以致可将所得的转录本翻译成所需的蛋白或多肽,则所述调节区是与 编码序列可操作相连的。
严谨杂交条件。严谨杂交条件是本领域专业人员能够理解的术语。对 于任何给定的核酸序列,严谨杂交条件是温度、离液序列高的酸、缓冲液 和离子强度可以使核酸序列与其互补序列杂交,而不与实质上不同序列进 行杂交的条件。构成“严谨”条件的精确条件取决于核酸序列的性质、所 述序列的长度和在其它非相同序列中所述序列的子序列出现的频率。通过 将杂交条件从发生非特异性杂交的严谨度水平改变到只发生特异性杂交的 水平,本领域专业人员无需过分试验,即可确定使给定序列仅与互补序列 杂交的条件。在Krause和Araoson(1991)中描述了所述严谨度条件的 适宜范围。根据序列的长度和共性,杂交条件可包括温度为20-65℃, 离子强度5x到0.1xSSC。高度严谨的杂交条件可包括温度为低达40- 42℃(当包含变性剂如甲酰胺时)或高达60-65℃,离子强度为0.1xSSC 低。但这些范围只是说明性的,根据靶序列的特性和可能的未来技术的发 展,可以比需要的更严谨。可用严谨度较低的条件以分离与给定序列实质 上相似的、等位基因或同源的核酸序列。
选择性结合。对本文抗体所用的,如果抗体识别并与靶结合,但实质 上不识别并结合包含所述靶的样品(如生物样品)中其它分子,就认为抗 体与靶是“选择性结合”。
II早衰素
本发明部分是基于发现了一个哺乳动物基因家族,当其突变时,所述 基因家族与早老性痴呆病的发生有关。下文将描述这些基因(称为早衰素 -1和早衰素-2)的发现以及这些基因、其蛋白产物、突变体的表征,和可 能的功能。还讨论了早衰素的无脊椎动物同系物,原因是它们可阐明早衰 素的功能并达到将其用于下文所述的各种实施方案的程度。
1分离人早衰素-1基因
AAD3区的遗传作图
Sherrington等(1995)描述了PS1基因(后来称为AD3基因或S182 基因)的最初的分离和表征。在开始将AD3基因区域定位于靠近无名的微 卫星标记D14S43和D14S53的14q24.3座位(Schellenberg等,1992; St.George-hyslop等,1992;Van Broeckhoven等,1992)后,用21个 系谱分离作为推定的常染色体显性特征的AD(St.George-Hyslop等, 1992)并用于研究18个来自14q24.3区的附加遗传标记的分离,所述区已 被编制成高密度的遗传连图(Weissenbach等,1992;Gyapay等, 1994)。以前公开的成对最大可能性分析证实了家族性早老性痴呆病 (FAD)和所有这些标记之间连锁的实际累加证据。但是许多支持与这些 标记连锁的遗传数据是来自6个大的早期发作系谱,FAD1(Nee等, 1983)、FAD2(Frommelt等,1991)、FAD3(Goudsmit等,1981; Pollen,1993)、FAD4(Foncin等,1985)、TORl.l(Bergamini, 1991)和603(Pericak-Vance等,1988),每个系谱提供了至少一个来 自14q24.3的常染色体无名遗传标记(St.George-Hyslop等,1992)。
为了从14q24.3的已知遗传标记座位更精确地确定AD3基因的位置, 通过直接检查原始单元型数据,来寻找重组界标,所述数据来自基因型受 影响的、与染色体14有确定连锁的6个系谱的成员。在这种特定的情况下, 这种选择性方法要除去来自死亡的、受影响成员以及来自大系谱的年龄较 大的无症状成员的重建基因型的数据,不考虑无确定连锁状态的小系谱。 但是,这种方法是很可靠的,因为它还避免了使用潜在的引人误解的基因 型数据,所述数据错误是因死亡的受影响成员(因无渊源而引起)的重建 基因型中的错误或取样错误或因包含了无关系谱而产生的。
在检查了受影响的受试者的单元型数据后,直接确定了其基因型的6 个大系谱的成员在D14S48和D14S53,以及D14S58和D14S63有必要的 重组子。在D14S53的单重组子(描述了FAD区的端粒界限)发生于FAD1 系谱中同样患AD的受试者中,以前曾发现这个家系的成员在位于D14S53 (包括S14S48)到端粒区域的数个其它标记有重组子(St.George-Hyslop 等,1992)。相反,在D14S258的单重组子(表示FAD区的着丝粒界限) 发生于FAD3系谱的的一个患病成员中,该患者也是在位于D14S258(包 括D14S63)到着丝粒之间的数个其它标记有重组子。通过在其它家族患 病成员中的疾病标准临床试验表明,两种重组子患者有明确的早老性痴呆 病症状,在D14S53着丝粒到D14S258端粒间隔内的多座位上,两种重组 子患者的基因型是指示性的而且是共分离的。
扩大单元型分析以包括6个大系谱死亡患者的重建基因型以及来自剩 余15个连锁概率小于0.95的系谱的数据时,在D14S53到D14S258的间 隔内的一个或多个标记座位上,检测到数个另外的重组子。因此,在3个 较大FAD系谱(FAD1、FAD2和其它相关家族)中死亡患者的重建基因 型中分别检测到一个另外的重组子,在5个较小FAD系谱的患者中检测到 8个另外的重组子。但是,尽管一些这样的重组子可正确地将AD3基因放 在更确定靶区内,但由于不可靠,还需要考虑这些潜在较近的“内重组子”, 这种不可靠不仅是由于上文讨论的原因,而且还因为它们为D14S53- D14S258间隔内的AD3基因提供了突变上不一致的位置。
B构建跨AD3区的物理重叠群
作为克隆AD3基因开始的步骤,构建克隆到酵母人工染色体载体、噬 菌体人工染色体载体和粘粒载体中的重叠基因组DNA片段的重叠群。利 用衍生于YAC克隆932c7和964f5的粘粒所进行的FISH作图研究表明, 最有可能携带AD3基因的间隔至少有5兆碱基大小。由于所述小共分离区 较大使得定位克隆方法难以操作,所以寻找其它的遗传指标,以便将AD3 基因的研究集中在D14S53和D14S258间隔内的一个或多个亚区。不论是 否将所述分析限于有早期FAD发作形式的那些系谱,还是推广到包括所有 系谱,D14S53和D14S258间隔之间标记的单元型分析不能从统计学上显 著说明FAD特征与任何这些标记上等位基因之间的连锁不平衡和/或等位 基因相关。如果我们的系谱来自不同的人种,得出这样的结果就不意外了。 但是,比较相似人种后代的系谱,对相似人种的不同系谱中分离的带病染 色体进行直接的单元型检查,表明有两个标记座位群。这些群中的第一个 位于D14S77(D14S786,D14S277和D14S268)到着丝粒,并且跨在 YAC78842中所含的0.95Mb物理间隔。第二个群位于D14S77(D14S43、 D14S273和D14S76)到端粒,并且跨交叠YAC克隆964c2,74163、 797d11和部分854f5所含的~1Mb物理间隔。在来自相同人种的至少2个 系谱中观察到相同的等位基因。由于分开方法,所以认为在物理成簇的标 记座位之一存在共有等位基因可能反映了各人种种群中,源建立者染色体 上PS1基因周围小物理区的共遗传。在正常高加索人种群中,各共有延伸 的单元型极为稀少,在染色体14q24.3跨相似遗传间隔的其它标记群上, 未观察到等位基因共享。
C候选基因的转录作图和分析
为了分离在两个重要间隔内编码的表达序列,使用包括固定、克隆的 直接筛选方法,以人基因组DNA作为杂交靶以回收来自一级互补DNA池 的转录序列,所述DNA池衍生于人脑mRNA(Rommens等,1993)。从这 些区中回收约900个大小为100-600碱基对的目的cDNA片段。将这些片 段与含基因组DNA的Southern印迹杂交,所述基因组DNA来自各重叠的 YAC克隆和人和其它哺乳动物的基因组DNA。这样鉴定了151个克隆的 亚单位,提供了进化保守和/或复合结构的证据,表明它们衍生于剪接的 mRNA。以物理图谱位置、交叉杂交和核苷酸序列为基础比较所述亚单位 内的克隆,并用于筛选用于较长cDNA的常规人脑cDNA文库。分离了至 少19个长度在1kb以上的独立cDNA克隆,然后排列成AD3区的部分转 录图谱。这些转录本中,只有3个对应于已经表征的基因(cFOS,二氢 硫辛酰胺琥珀酰转移酶和潜伏转化的生长因子结合蛋白2)。
D候选基因的回收
通过RT-PCR从mRNA回收各候选基因的开放阅读框架,所述mRNA 是从正常对照受试者尸体解剖后的脑组织和6个系谱患者的尸体解剖后的 脑组织或培养的成纤维细胞系中分离的,已确定所述6个系谱与染色体14 有关。然后用化学裂解和限制内切酶指纹单链序列构象多态性方法 (Saleeba和Cotton,1993;Liu和Sommer,1995),以及通过直接核苷 酸测序就序列差异对RT-PCR产物进行筛选。一种例外是,所有检测的基 因(尽管是所需的)均不含有患病受试者所特有的,或与所述疾病共分离 的序列改变。所述例外是克隆S182所表现的候选基因,该克隆含有在正常 受试者中未观察到的一系列核苷酸改变,而且预期在患病受试者中改变了 氨基酸序列。现已将相应于该克隆的基因命名为早衰素-1(PS1)。本文以SEQ ID NO:1和SEQ ID NO:3公开了两个PS1cDNA序列(表示下文所述 的可变剪接变体)。分别以SEQ ID NO:2和SEQ ID NO:4公开了相 应的推定的氨基酸序列。已将携带这些cDNA克隆的Bluescript质粒于1995 年4月28日保藏在ATCC,Rockville,Md,保藏号为97124和97508。 相应于SEQ ID NO:1和SEQ ID NO:2的序列也已保存在GenBank数 据库中,并可通过登录号#42110进行检索。
2分离鼠早衰素-1基因
用来自hPS1基因的标记人DNA探针,通过筛选小鼠cDNA文库,回 收人PS1基因的鼠同系物(mPS1)。用这种方法,回收了2kb的部分转录本 (代表该基因的3’末端)和代表5’末端的RT-PCR产物。对鼠同系物的共 有cDNA转录本进行测序表明与hPS1有实质性的氨基酸同一性。重要的 是(如下所述),在FAD系谱中突变的所有氨基酸在鼠同系物和正常人变 体之间是保守的。PS1基因的这种保守性表明在小鼠(mPS1)中存在直向同 源基因,现在通过用人PS1探针筛选基因组或cDNA文库,可以克隆其它 哺乳动物同系物或直向同系物(orthologues)。因此可以用相似的方法鉴 定并表征其它种中的PS1基因。本文以SEQ ID NO:16公开了mPS1 克隆的核酸序列和以SEQ ID NO:17公开了相应的氨基酸序列。已将两 个序列均保存在GenBank数据库并可以登录号#42177进行检索。
3分离人早衰素-2基因
已经分离了第二个人基因,现称为早衰素-2(PS2),并表明与PS1基因 有实质性的核苷酸和氨基酸同源性。Rogaev等(1995)首先详细描述了 该基因的分离。Levy-Lahad等(1995)也报道了用很相近的方法分离人 PS2基因(称为“STM2”),简而言之,用Altschul等(1990)的BLASTN 范例,通过PS1 cDNA的核苷酸序列检索数据库,可鉴定PS2基因。定位 了用登录号#T03796、R14600和R05907鉴定的用实质性同源性(p<1.0 e-100,在至少100个连续的碱基对范围内有97%以上的同一性)的3个表 达的序列标记位点(EST)。
从这些序列产生寡核苷酸引物并用于经反转录酶PCR(RT-PCR)产生 PCR产物。将这些短RT-PCR产物部分测序以确定其与数据库内序列的同 一性,然后用作杂交探针来筛选全长cDNA文库。从癌细胞cDNA文库 (Caco2)和人脑cDNA文库(E5-1,G1-1,cc54,cc32)中回收了大小为1 kb-2.3kb的数个不同的cDNA。这些克隆的核苷酸序列表明所有序列均是 相同转录本的衍生物。
用CEPH Mega YAC克隆的两个组群的杂交作图组,将编码所述转录 本的基因,PS2基因定位于人染色体1上,已将所述组群定位在重叠群物 理图谱(用FISH法将YAC克隆750g7,921d12定位到1q41;YAC免隆 787g12定位到1p36.1-p35)上。本文以SEQ ID NO:18公开了hPS2克 隆的核酸序列,以SEQ ID NO:19公开了相应的氨基酸序列。这两个序 列均已保存在GenBank数据库中,并可通过登录号#L44577检索。还已将 hPS2克隆的DNA序列掺入到载体中,并于1995年6月28日保藏在 ATCC,Rockvile,MD,保藏号为97214。
4 C.elegans和黑尾果蝇中同系物的鉴定
A C.elegans的SPE-4
用BLAST排列范例,将PS1的核酸和预期的PS1氨基酸序列与数据 库中的序列进行比较,表明与C.elegans精膜内在蛋白SPE-4有中等程度的 相似性(P=1.5e-25,在至少50个残基的三组范围内有24-37%同一性), 与数种其它跨膜蛋白包括哺乳动物嗜铬粒蛋白A和哺乳动物电压依赖性 通道蛋白的α亚单位(Altschul等,1990)的部分有很低的相似性。在推 定跨膜结构域之间的氨基酸序列相似性可偶然产生简单起因于有限数目的 疏水氨基酸的排列,但在PS1和SPE-4之间的数个亲水结构域也有延伸的 序列排列。认为推定的PS1蛋白和SPE-4有类似的大小(分别为467和465 个残基),如下文更详细描述的,并在最终预期的跨膜结构域前,含有至 少7个具有较大酸性结构域的跨膜结构域。PS1蛋白在N末端确实有较长 的预期亲水区。
BLASTP排列分析还检测了PS2和C.elegans SPE-4蛋白之间的显著同 源性(p=3.5e-26;在至少22个残基的5个结构域上,同一性=20-63%), 而且检测到与不同种的脑钠通道蛋白(αIII亚单位)和电压依赖性钙通道 蛋白的α亚单位(p=0.02;在至少35个残基的两个或多个结构域上有20- 28%的同一性)有弱同源性(Altschul等,1990)。这些排列与上述对 PS1基因描述的那些相似。
BC.elegans的Sel-12
发现来自C.elegans的461个残基的Sel-12蛋白与S182(SEQ ID NO:2)在460个氨基酸上有48%的序列同一性(Levitan和 Greenwald,1995)。还认为Sel-12蛋白有多个跨膜结构域。通过筛选Iin-12 获得功能突变(gain-of-function)抑制剂而鉴定了sel-12基因(登录号 U35660),并通过转化获救(Levitan和Greenwald,1995)而进行了克 隆。
C黑尾果蝇的DmPS
制备编码早衰素/sel12蛋白的高度保守区的丰余寡核苷酸,并用于鉴 定来自成年和胚胎黑尾果蝇的相关mRNA。对这些mRNA进行测序并表 明含有与人早衰素的推定氨基酸序列高度同源的开放阅读框架。将DmPS cDNA鉴定为SEQ ID NO:20。
该序列编码541个氨基酸的多肽(SEQ ID NO:21),与人早衰素 有约52%的同一性。
黑尾果蝇同系物的结构与具有至少7个推定跨膜结构域的人早衰素的 结构(用15的窗口值和1.5截止值的Kyte-Doolittle疏水性分析)相似。在 含541个氨基酸的ORF的克隆pds13中,至少检测到一个可变剪接形式, 而克隆pds7、pds14和pds1不含1300-1341的寡核苷酸。这种可变剪接会 使推定TM6→7环中的残基384上的Gly变成Ala,在较长ORF的密码子 399上,产生Glu残基的框内融合黑尾果蝇氨基酸序列和人基因之间的主 要差异是在N-末端的酸性亲水结构域和TM6→7环的酸性亲水部分。 TM6→7环周围的残基特别保守(残基220-313到451-524),表明 这些是功能重要的结构域。在人PS1或PS2中鉴定的突变并引起人FAD 的20个残基中的16个在黑尾果蝇同系物中是保守的。
将克隆的DmPS基因的DNA序列插入到Bluescript质粒中。于1996 年1月26日将该稳定的载体保藏在ATCC,Rockville,MD,保藏号为 97428。
5人早衰素基因的表征
AhPS1转录本和基因结构
PS1(S182)克隆与Northern印迹的杂交将脑和外周组织的许多区域 中广泛表达的转录本鉴定为主要的~2.8kb的转录本和少量的~7.5kb的转 录本(参见,Sherrington等,1995中的图2)。在脑的大部分区域和除 肝以外的外周组织中PS1的表达相当均匀,在肝中的转录很低。尽管~7.5kb 转录本的同一性不清楚,但两种观察结果表明~2.8kb的转录本代表该基因 的活性产物。PS1克隆与含不同鼠组织(包括脑)的mRNA的Northern 印迹的杂交只鉴定了一个大小等于~2.8kb人转录本的转录本。已将到目前 为止回收的所有较长的cDNA克隆(2.6-2.8kb),包括5’和3’UTR并产 生在Northern印迹上的~2.8kb带,全部定位于染色体14的相同物理区域。
从这些试验中,~7.5kb的转录本可代表少见的可变剪接的或~2.8kb 转录本的聚腺苷酸化异构体,或可代表与PS1同源的另一基因。筛选表达 高水平PS1和PS2的Caco2细胞cDNA文库中的长转录本。得到了两个不 同的克隆,GL40和B53。测序表明这两个克隆均含有相似的5’UTR和与 脑中短2.8kb转录本相同的ORF。
这两个克隆均含有不正常的长3’UTR。该长3’UTR表示使用了下游 更远的约3kb的另外的聚腺苷酸化位点。该长3’UTR含有许多导致回文结 构或茎-环结构的核苷酸序列基元。这些结构与mRNA的稳定性以及翻译 效率有关,这一观察结果的实用性在于它可能会产生重组表达构建体和/ 或转基因(其中除去了上游聚腺苷酸化位点),由此迫使使用下游聚腺苷 酸化位点和长3’UTR。在特定的情况下,这样可促进所选mRNA种的稳 定性,通过种系治疗或利用病毒载体如修饰的单纯疱疹病毒载体作为基因 治疗的形式,可利用优先翻译来改变靶细胞系或甚至体内脑中突变体与野 生型转录本的平衡。
hPS1基因跨至少60kb的基因组间隔,所述间隔在来自Roswell Park PAC文库的200kbPAC1克隆RPCI-154D12和来自Los Alamos染色体14 粘粒文库的3个重叠粘粒克隆57-H10、1-G9和24-D5内。PSI基因的转 录本含有来自13个外显子的RNA,它们是通过寡核苷酸和部分cDNA探 针的重复杂交以亚克隆PAC和粘粒克隆的限制片段以及通过直接将这些 亚克隆测序而鉴定的。外显子1-4含5’UTR,同时外显子1和2表示所述 转录本另外的5’末端。在外显子4-13内含有ORF,同时改变的剪接过程 导致去掉了外显子4的部分或外显子9的全部。外显子13还包括3’UTR。
除非另外说明,为了清楚和简洁起见,hPS1衍生核苷酸序列中的所 有核苷酸位置均使用SEQ ID NO:1(L42110)中的碱基编号,从外 显子1的hPS1 cDNA序列开始。在该cDNA中,将外显子1与外显子3 直接剪接,然后与外显子4-13剪接。在SEQ ID NO:1中,外显子1从 1位到113位核苷酸,外显子3从位置114到195,外显子4从位置196 到335,外显子5从位置336到586,外显子6从位置587到728,外显 子7从位置729到796,外显子8从位置797到1017,外显子9从位置 1018到1116,外显子10从位置1117到1203,外显子11从1204到1377, 外显子12从位置1378到1496,外显子13从位置1497到2765。同样, 除非另外说明,hPS1衍生的蛋白序列中的所有氨基酸位置均使用SEQ ID NO:2(SEQ ID NO:1的翻译产物)中的残基编号。
已经得到了外显子1-12的侧基因组序列,并列在SEQ ID NO:5 -14(登录号为L76518-L76527)中。还确定了外显子13的5’基因组 序列,并列于SEQ ID NO:15(登录号为L76528)。SEQ ID NO:5 -14还包括全部的外显子序列。但SEQ ID NO:15不包括外显子13的 3’末端。对应于外显子1和2的基因组序列位于以约240bp相隔的2.6kb BamHI-HindIII片段(SEQ ID NO:5)上。外显子3和4(含有ATG启 始密码子)位于一分开的3kb BamHI片段。尚未鉴定位于外显子2下游~850 bp处BamHI位点与外显子3上游~600bp处BamHI位点之间的内含子2 的完整序列,也未能通过使用来自BamHI位点侧的引物的PCR立即回收 所述完整序列,说明内含子2会很大。
外显子1和2周围的核苷酸序列(SEQ ID NO:5)分析表明在内含 子1中包含了许多含NotI限制位点的CpG二核苷酸。在内含子1和外显 子1的5’序列(SEQ ID NO:5)中,存在数个含多组激活剂蛋白-2(AP-2) 的推定转录调节蛋白的共有序列、信号传导因子和转录激活剂(STAT3) (Schindler和Darnell,1995)、γ激活剂序列(GAS或STAT1)、多 启始位点元件下游(MED)(Ince和Scotto,1995)和GC元件。两个推 定的TATA盒存在于外显子1的上游,在SEQ ID NO:5的bp925-933和 978-987,然后是两个推定的转录启始共有序列,SEQ ID NO:5的484 的bp1002-1007和1038-1043bp。相反,外显子2的紧接上游序列没有TATA 盒或CAP位点,但富集CpG岛。
图1列出了hPS1基因的结构组织示意图谱。用实体黑影方框表示非编 码外显子。用空框表示编码外显子,用划阴影线的框表示其它剪接序列。 限制位点是:B=BamH;E=EcoRI;H-HindIII;N=NotI;P=PstI; V=PvuII;X=XbaI。在水平线上限制位点之间的不连续区域表示未确定的 基因组序列。用双向水平箭头表示含各外显子的克隆的基因组片段。提供 了基因组亚克隆的大小和各基因组序列的保藏号。
以外显子1的上游290bp内和内含子1内的核苷酸序列为基础,DNA 二级结构的预测表明有数个回文结构,其稳定性大于16 kcal/mol。这些二 级结构分析还预测存在3个稳定的茎-环基元(在bp 1119-1129/1214- 1224;在bp 1387-1394/1462-1469;在bp1422-1429/1508-1515,均在SEQ ID NO:5中)和一个足以包含一核小体(~76bp)的环。所述茎-环结 构是含TATA基因的共同特征( Kollmar和Farnham,1993)。
在表1中总结了这些5’区中的特征。所有碱基位置均以SEQ ID NO: 5为参考。
在SEQ ID NO:1中,最长的预期的开放阅读框架编码SEQ ID NO: 2中467个氨基酸的蛋白。该开放阅读框架的启始密码子是位于TGA终止 密码子下游的第一个框内ATG。前两个框内ATG密码子的周围没有典型 的Kozak共有序列(Sherrington等,1995)。与其它没有典型的“强” 启始密码子的基因一样,人转录本的推定5’UTR富集GC。
B hPSl 5’UTR的可变转录和剪接
尽管前3个外显子和部分第4个外显子含有非翻译序列,但分析从人 海马cDNA文库(Stratagene,La Jolla CA)中和结肠腺癌细胞系 (J.Rommens的Caco2)分离的多全长cDNA克隆表明在大部分克隆中, 开始的序列来自外显子1,然后直接与外显子3剪接(登录号L42110, SEQ ID NO:1)。出现很少的情况是(9个克隆中的1个),开始转录 的序列来自外显子2,并与外显子3剪接(登录号L76517,SEQ ID NO: 3)。用外显子1中的引物分离的至少40个独立RT-PCR转录本的直接核 苷酸测序不能鉴定同时含外显子1和外显子2的任何克隆,最后,检查外 显子2上游的基因组序列,没有3’剪接位点序列。这些观察结果说明,外 显子2是真正的开始外显子,而不是在外显子1开始的转录本的可变剪接 形式或赝cDNA克隆。此外,由于从相同的单克隆Caco2细胞系得到了含 外显子2的克隆(cc44),所以,在相同的细胞中可能同时存在含外显子 1的转录本和含外显子2的转录本。
为了试验对以外显子1附近5’上游区的核苷酸序列为基础的转录启始 位点所作的预测,我们检测了3个含外显子1的独立“全长”cDNA克隆 (cc33、cc58和cc48)的5’末端序列和利用位于外显子3的反义引物, 通过引物延伸而回收的3个序列。在cDNA G40L中发现了最远的5’延 伸,其定位于含外显子1SEQ ID NO:5(L76518)的基因组序列中, 最接近转录启始位点的位置1214bp,因此,对应于SEQ ID NO:1的位 置-10。另外两个克隆(cNDA cc48和5’RACE产物#5),在基因序列 SEQ ID NO:5中的位置1259bp有共同的启始位点,它对应于SEQ ID NO:1的位置34。剩下的两个cDNA以及剩余的5’RACE克隆从外显子 1内更远的位置开始。5’RACE克隆#8开始于对应于SEQ ID NO:1中位 置1的1224bp。因此,这些克隆中,没有一个延伸到外显子1上游的CAP 位点。由于含来自外显子2的启始序列的转录本很少,因此,未进行相似 的启始位点研究。
C hPS1 ORF的可变剪接
除有不同启始序列的转录本外,分析从不同文库中回收的多cDNA克 隆还表明在PS1转录本中有两种影响ORF的变异。
其中第一个是没有外显子4的3’末端的12个核苷酸,SEQ ID NO:1 中的核苷酸324-335。这种情况产生于在核苷酸323后的外显子4剪接 代替了核苷酸335后的剪接。从所进外显子4的可变剪接产生的转录本不 编码SEQ ID NO:2中的氨基酸残基Val26-Arg27-Ser28-G1n29。在所检查 的所有组织中,从这两种外显子4的可变剪接而产生的转录本有大约相同 的频率。应注意,在到目前为止所检查的克隆中,鼠PS1转录本确实只含 有Ile26-Arg27-Ser28-Gln29的cDNA序列,而Val-Arg-Ser-Gln基元的序列 在人PS2中只是部分保守的,即Arg48-Ser49-Gln50(Rogaev等1995)。 这些观察结果均表明这些差异对于PS1发挥适当的功能没有重要影响。
影响ORF的第二种剪接变异会导致没有外显子9,在SEQ ID NO:1 中为1018到1116的核苷酸。分析从不同组织mRNA衍生的RT-PCR产物 表明脑(包括主要受AD影响的新大脑皮质区)和数种其它组织(肌肉、 心、、结肠)主要表达带外显子9的单个转录本。另一方面,白细胞(但 不是成淋巴细胞)也表达不含外显子9的较短形式。预测外显子9的剪接 变化将SEQ ID NO:2中257位的天冬氨酸残基变成了丙氨酸,去掉了接 下来的33残基,导致与外显子10编码的位置291的苏氨酸为起点的蛋白 的剩余部分形成框内融合。
D hPS2转录本
尚未完全表征包含人PS2基因的基因组DNA。然而,PS1和PS2基 因之间有许多相似之处是显而易见的。但是这两个基因的内含子/外显子界 限除TM6→7环外,似乎很相似或相同。
在许多组织(包括脑区)中,PS2 cDNA克隆与Northern印迹的总结 检测了~2.3kb的mRNA带,以及在肌肉、心肌和胰腺中的~2.6kb带。 除转录水平很高的胼胝体外,PS2的表达水平在脑的大部分区域是很低 的。在骨骼肌、心肌和胰腺中,PS2基因的表达水平比脑中相对要高,两 种转录本分别为~2.3kb和~2.6kb。这两种转录本明显不同于2.7kb的 PS1转录本,而且在高严谨度条件下,与PS1探针没有交叉杂交。将hPS2 等位基因的cDNA序列鉴定为SEQ ID NO:18(登录号L44577)。
所述PS2 cDNA共有核苷酸序列中的最长ORF预测了含448个氨基酸 的多肽(SEQ ID NO:19),从第一个相位内ATG密码子(在SEQ ID NO:18中的位置366--368,其周围是Kozak共有序列)开始编号。
象对PS1一样,分析来自数种组织(包括脑和肌肉)RNA的PS2 RT-PCR产物表明有两种可变的剪接变体,其中剪接出了相对较大的片段。 因此,以相对较低的频率生产转录本,其中PS2转录本(SEQ ID NO: 18)的核苷酸1152-1250(编码SEQ ID NO:19中的残基263-295) 被可变剪接。如下文所讨论的,所述剪接过程很接近于PS1外显子9的剪 接改变(Rogaev等,1995)。
在所有被检测的组织中,还发现了另一PS2 cDNA序列的剪接变体, 该变体没有SEQ ID NO:18中核苷酸1338-1340位GAA三联体。这种 剪接改变会删掉在325位氨基酸的Glu残基。
6早衰素蛋白的结构
A早衰素蛋白家族
现在讨论的早衰素是一个新的高度保守的膜内在蛋白家族,它们有共 同的结构基元、共同的剪接改变模式以及共同的与推定结构的结构域(存 在于许多无脊椎动物和脊椎动物细胞中)相关的突变区热点。用Hopp和 Woods算法分析人早衰素基因的预期氨基酸序列表明所述蛋白是多跨膜内 在蛋白如受体、通道蛋白或结构膜蛋白。在图2中列出了推定hPS1蛋白的 Kyte-Doolittle亲水性图。亲水图和结构分析表明这些蛋白具有约7个通过 亲水环分离的疏水跨膜结构域(称为TM1到TM7)根据在预测公式中所 用的参数,其它模型可预测最少5个,最多10个跨膜结构域。7个跨膜结 构域的存在是数种G-结合的受体蛋白的特征,但在其它蛋白(如通道蛋 白)中也可观察到。值得注意的是,没有可识别的信号肽,而且糖基化位 点少。
在图3中比较了hPS1和mPS1蛋白的氨基酸序列,在图4中比较了 hPS1和hPS2蛋白的序列。在这些图中,用直线表示相同的氨基酸残基。 用序列上或下的水平线表示7个推定的跨膜结构域。
该家族成员间的主要差异是在N-末端的亲水、酸性环结构域的氨基 酸序列,和早衰素蛋白推定TM6和TM7结构域之间(TM6→7环)。大 部分有hPS1外显子9编码的残基(在一些非神经组织中发生的剪接改变) 形成了推定TM6→7环的部分。另外,在hPS2中鉴定的相应改变的剪接变 体似乎编码TM6→7环的部分。这种亲水环的剪接改变以及该基因家族成 员之间环氨基酸序列的不同说明所述环是所述蛋白的重要功能结构域,而 且可给个体早衰素蛋白的生理学和致病相互作用赋予某些特异性。由于N -末端亲水结构域带有与TM6→7亲水酸性环相同的酸性电荷,在7个跨 膜结构域模型中,可能有与膜相同的方向,而且在早衰素之间是可变的, 所以这两个结构域在官能度上享有等同的或独立的方式(如相同或不同的 配体或功能特性)。因此,有可能N-末端也是所述蛋白的重要功能结构 域,而且可给个体早衰素蛋白的生理学和致病相互作用赋予某些特异性。
如下文详细讨论的,在TM1→2环和TM6→7环结构域周围的PS1和 PS2群的致病突变还说明,这些结构域是这些蛋白的功能结构域。图5和6 分别描述了PS1和PS2蛋白推定结构的示意图,在图上标明了已知的突变 位点。如图中所示,预测TM1→2连接序列位于与N-末端相反的膜一侧, 而且TM6→7也是这样,而且所示连接序列在跨膜联系中可能是很重要 的。在有早期发作的家族性AD(30-40岁)系谱中观察到的PS1 Y115H 突变和在可能使所述环去稳定的TM1/2螺旋中的其它突变支持这种观点。 TM1→2环相对较短(PS1:残基101-132;PS2:残基107-134), 使得对这些肽更适于进行常规的肽分析。7个PS1突变集中在约密码子82 到密码子146之间区域,该区域含有PS1中推定的第一跨膜结构域 (TM1)、TM1→2环和TM2结构域。同样,PS2上密码子141的突变 也位于TM2结构域。这些突变可能使TM1→2环和其在TM1和TM2中的 锚点不稳定。12个PS1突变导致改变了约密码子246和410之间的氨基 酸,这些密码子涉及TM6、TM6→7环和TM7结构域。这些突变可能修 饰了TM6→7环的结构或稳定性(直接或通过修饰TM6或TM7的构象)。
TM6→7环有重要功能的其它证据是在早衰素蛋白家族的不同成员的 TM6→7环中心部分(约氨基酸300-371)有序列趋异性。同样,由于 早衰素蛋白家族成员的N-末端序列也不相同,所以有可能轻微的序列差 异赋予各不同的早衰素蛋白以功能特异性,而保守序列使其具有相同的生 物活性。中心区域代表配体结合位点。如果是这样的话,在TM6→7区的 突变有可能修饰配体结合活性。在早衰素蛋白家族不同成员之间,TM6→7 环是保守的,这可能在相反膜表面代表了一个效应结构域。除外显子10 的剪接突变外,大部分其它(错义)突变在推定跨膜螺旋的相同表面上。 因此,可用这些结构域(如TM6→7环和TM1→2环)作为位点研制特异 性结合剂,以抑制患早老性痴呆病患者中早衰素蛋白的突变作用和/或恢复 所述蛋白的正常功能。
C.elegans SPE-4和PS1基因推定产物之间的相似性说明它们有相似的 活性。SPE-4蛋白可能与在精子发生过程中,毡状体-膜细胞器(FBMO) 复合物的形成和稳定有关。FBMO是特殊化高尔基体-衍生的细胞器,组 成了粘附于并部分围绕平行蛋白纤维复合物的膜结合的泡囊,而且可能与 可溶性和膜结合多肽的运输和贮存有关。在SPE-4中的突变破坏了FBMO 复合物,并抑制了精子发生因此,SPE-4的生理功能可能是稳定膜内在 出芽与融合过程之间的相互作用,或在精子发生过程中,稳定FBMO复合 物细胞内运输中膜与原纤维蛋白的相互作用。可没想早衰素的类似功能。 例如PS1可能在其它膜结合蛋白如βAPP的停靠中起作用,或如在高尔基 体或内体-溶酶体系统中,在蛋白运输过程中的膜结合小泡轴突运输和融合 出芽中起作用。如果这些假设是正确的话,那么所述突变会导致βAPP运 输和加工异常和/或与细胞骨架蛋白如微小管-相关蛋白Tau的相互作用异 常。βAPP和Tau在细胞内和细胞外的不正常沉积,事实上是早老性痴呆 病神经病学特征的内在原因。尽管在推定蛋白保守结构域内,高度保守残 基中PS1和PS2突变的位置表明它们是致病性的,但这些突变中至少有3 个本身是保守的,这与成年期疾病的发作相一致。由于到目前为止所观察 到的突变中,没有一个是预期会引起表达或功能完全丧失的缺失或无义突 变,所以我们不能预期这些突变是否会有显性功能获得作用,由此促进 βAPP的异常加工或抑制正常βAPP加工的显性获得功能作用。外显子10 剪接突变引起外显子9与外显子10的框内融合,而且可能对可改变细胞内 导向或配体结合的PS1蛋白有结构作用,或可能影响PS1的功能。
另一种可能性是PS1基因产物可能代表受体或通道蛋白。所述蛋白的 突变与脊椎动物(如人中的恶性高热、血过多性麻痹)和无脊椎动物 (C.elegans中的deg-l(d)突变)中数种其它显性神经性疾病有关。尽管这 些其它疾病的病理学与早老性痴呆病的不同,但在早老性痴呆病的离子通 道中也有功能失调。例如报道了在四-乙基铵敏感性l13ps钾通道和钙内环 境稳定方面的失调。从PS1与电压-依赖性钙通道蛋白α-ID亚单位之间的 弱同源性来看,跨膜钙流量的波动可能是特别相关的,而且培养细胞中细 胞内钙的增加会加重早老性痴呆病的生物化学特征,如Tau-微小管相关蛋 白磷酸化方面的改变和Aβ肽的生产增加。
B hPS1结构
如SEQ ID NO:2所示,人PS1蛋白的最大已知形式含有467个氨基 酸,而且预期的分子量为约51.37kDa。具有上述外显子4剪接改变的变 体(其中缺失了SEQ ID NO:2位置26-29的残基)少4个氨基酸,分子 量为约50.93kDa。同样,具有上述外显子9剪接改变的变体(其中缺失 了SEQ ID NO:2位置258-290的残基)少33个氨基酸,分子量近似为 47.74kDa。
在表2中列出了推定结构域的位置。再次提醒注意,残基位置的编号 参照SEQ ID NO:2,而且是近似的(即,±2个残基)。
在图5中列出了推定PS1结构的示意图。N-末端是高度亲水的,带 负电荷的结构域,有数个潜在的磷酸化结构域,然后接约19个残基的跨膜 疏水结构域(TM1),约32个残基的带电荷亲水环(TM1→2),其中 分布有短(1-15个残基)的亲水结构域(TM2→3到TM5→6)的5个 另外的疏水跨膜结构域(TM2到TM6),另一较大的酸性亲水带电荷的 环(TM6→7)和至少1个(TM7),可能是2个另外的疏水强的跨膜结 构域,这些结构在C-末端的极性结构域结束。
所述蛋白还含有许多潜在的磷酸化位点,其中之一是MAP激酶共有 位点,该位点还与正常Tau转变成神经纤维原缠结过程中Tau的超磷酸化 有关。所述共有序列可提供推定的元件,该元件将所述蛋白的活性与早老 性痴呆病的其它生物化学特征联系起来,因此,所述共有序列代表可能的 治疗靶。研究所述蛋白的结构表明有两个序列YTPF(SEQ ID NO:2中 的残基115-118)和STPE(SEQ ID NO:2中的残基353-356),它们 代表是MAP激酶共有序列的5/T-P基元。数个其它磷酸化位点与蛋白激酶 C(PKC)活性的共有序列共存。由于PKC活性与APP(与早老性痴呆 病有关)代谢中的差异有关,所以,在PS1蛋白和其同系物上的这些位点 也是靶治疗剂的位点。初步迹象表明,至少在转染的细胞中,PS1蛋白的 磷酸化程度很低,而PS2蛋白被显著磷酸化。至少对PS2而言,所述磷酸 化是通过与PKC无关的机制而发生在N-末端结构域中的丝氨酸残基 (Capell等,1996)。
应注意在外显子4末端的剪接改变,使得从N-末端结构域除去了4 个氨基酸,而且认为是除去了磷酸化共有序列。另外,外显子9的剪接改 变产生了PS1蛋白的截断异构体,其中去掉了TM6 C-末端的5个疏水残 基和紧接TM6的部分亲水带负电荷的TM6→7环。所述剪接改变异构体的 特征在于保留了N-末端到并包括SEQ ID NO:2位置256酪氨酸的序 列,将位置257的天冬氨酸变成丙氨酸,与从并包括酪氨酸291的蛋白的 C-末端部分剪接。所述剪接差异常常与所述蛋白的功能结构域相关。这 说明该疏水环(和具有相似氨基酸电荷的N-末端疏水环)是PS1产物的 活性功能结构域,因此是治疗的靶位点
C人PS2的结构
人PS1和PS2蛋白总共有63%的氨基酸同一性,而且有数个结构域 有基本完全相同。因此,如所预期的,疏水分析表明两种蛋白有相似的结 构组织。因此,认为这两种蛋白均有7个推定的疏水跨膜结构域,而且这 两种蛋白在N-末端和TM6与TM7之间均有较大的酸性亲水结构域。进 一步的相似性来自脑和肌肉RNA的RT-PCR产物的上述分析,所述分析表 明PS2转录本的核苷酸1153-1250有不同的剪接方式。这些核苷酸编码氨 基酸263-296,这些氨基酸位于推定PS2蛋白的TM6→7环结构域内并与 PS1剪接改变的氨基酸257-290有94%的同一性。
在表3中描述了hpS2蛋白的推定功能结构域的位置。应注意残基位置 指SEQ ID NO:19中的残基位置,而且所述位置是近似的(即,±2个残 基)。
图6中列出了推定PS2结构的示意图。在对应于TM1与TM6之间、 从TM7到PS1蛋白C-末端的数个蛋白结构域中,hPS1和hPS2之间的 相似性最大。PS1和PS2的主要不同之处在于其大小和带负电荷的亲水 TM6→7环的氨基酸序列,乙基N-末端亲水结构域的序列。
两种预期氨基酸序列之间最引人注目的差异在TM6→7亲水环(hPS1 的残基304-374;hPS2的310-355)中心部分的氨基酸序列和N- 末端的亲水结构域。同样,该结构域在鼠和人PS1基因之间的保守性较低 (同一性=47/60),而且与SPE-4的等同区域没有相似性。
7早衰素突变体
A PS1突变体
已经鉴定了PS1基因中引起几种典型的家族性早老性痴呆病的数个突 变体。这些突变体中的一个或其组合引起了这种形式的早老性痴呆病和数 种其它的神经性疾病。只要可导致预期氨基酸序列中的改变或可导致不正 常的转录本加工、水平或稳定性,所述突变可以是任何核苷酸序列取代、 插入或缺失。下文将描述核苷酸和/或氨基酸缺失或取代形式的具体致病突 变,但在其它家族中,也会发现其它突变。的确,在从8个不同系谱中开 始发现5种不同的错义突变(Sherrington等,1995)后,从来自其它遗 传性疾病的经验看(如与Ca2+超氧化物歧化酶基因中的突变有关的肌萎缩 性侧索硬化症),还会鉴定其它突变。这种预期因我们随后发现早衰素中 的其它突变(Rogaev等,1995)和其它人分相似发现(如,Cruts等, 1995;Campion等,1995)而得到证明,因此就本文PS1基因和蛋白而 言,术语“突变体”不限于这些特定的突变,而是解释为上述突变体。
直接对从与染色体14相关的6个大系谱患病成员中分离的包括2.8kb S182转录本的重叠RT-PCR产物进行测序,从而首先发现了在这6和系谱 中的5个错义突变。在各系谱中,这些突变与疾病共分离,但在来自与FAD 系谱相同人种的142个无关的神经正常受试者中不存在(284个独立的染 色体)。确定与AD3特征分离的物理间隔内的基因的位置,明确在6个系 谱中与疾病特征共分离的8个不同的错义突变与染色体14相关,而在284 个独立正常染色体中不存在这些突变的事实说明PS1基因是AD3座位。这 种假设的其它生物学证据是在FAD同种中的突变在进化中是高度保守的 (如hPS1对mPS1),所述突变定位于在其它脊椎动物和无脊椎动物同系 物中高度保守的所述蛋白的结构域,而且在脑的大部分区域,包括受AD 严重影响的区域中,PS1基因产物以高水平表达。
由于PS1基因的新发现,已经列出了与AD发生有关的许多其它突变。 表4对所述突变进行了表征。认为在PS1转录本的推定ORF中所观察到的 核苷酸缺失或取代改变在所述位置被编码的氨基酸。参考其在SEQ ID NO:1中的核苷酸位置和在SEQ ID NO:2中的其氨基酸位置,列出了 所述突变。“NA”表示未得到数据。
如下节将讨论的,还发现了许多PS2突变。在图4中列出了hPS1和 hPS2的序列比较,并说明这些致病突变是在PS2的区域中,这些区域在 PS1蛋白中是高度保守的。因此,预期在PS1蛋白中的相应突变也是致病 的,而且包括在本文提供并可得到的PS1突变体中。此外,推测在任何早 衰素基因保守区中所鉴定的任何致病突变代表其它共有所述保守区的早衰 素突变体。
令人感兴趣的是,突变260V、C263R、P264L、P267S、E280A、 E280G、A285V、L286V、Δ291-319、G384A、L392V和C410Y均发 生在或接近推定跨膜结构域TM6和TM7之间的酸性亲水环。还将这些突 变中的8个(260V、C263R、P264L、P267S、E280A、E280G、 A285V、L286V)定位在另外的剪接结构域(SEQ ID NO:2的残基257 -290)。
用代表成熟mRNAcDNA或基因组DNA的RT-PCR产物,可通过各 种方法(直接核苷酸测序、等位基因同源性寡核苷酸、连接聚合酶链反应、 SSCP、RFLP、新“DNA芯片(chip)”技术等)检测所有这些突变。
最后,应注意还发现了无明显有害作用的数种多态性。其中之一,SEQ ID NO:1中。863位核苷酸T→G改变引起TM4中的F205L多态性。其 它发生(在bp1700的C→A;在bp2603的G→A;bp2620缺失)在3’ UTR中。
B PS2突变体
PS1和PS2基因产物之间的强相似性表明了在少量其中遗传连锁研究排 除了染色体14、19和21的早期发作的AD系谱中,PS2基因可能是致病 突变的位点的可能性。用RT-PCR分离对应于8个系谱(患有早期发作的 FAD)患者的成淋巴细胞、成纤维细胞或尸体解剖后脑组织的PS2转录本 的cDNA,其中用直接测序研究排除了βAPP和PS1基因中的突变。
在所有4个延伸系谱的意大利人患者(Flo10)中,检查这些RT-PCR 产物在核苷酸1080的杂合A→G取代,所述意大利人患有早期发作的病理 学确定的FAD(50-70岁发作)。认为所述突变在TM5中的密码子239 引起了Met→Val错义。
在伏尔加日尔曼祖先相关系谱的患者(用细胞系AG09369、 AG09907、AG09952和AG09905,Coriell Institute,Camden NJ代表)中, 在TM中的密码子141发现了引起Asn→Ile取代的第二个突变(在核苷酸 787是A→T)。明显的是,一个患者(AG09907)的该突变是纯合的, 这与这些系谱的近亲交配特征相符。另外,该患者没有显著不同于N141 I 突变的杂合患者的临床形象。PS2基因突变不但在284个高加索人对照中 未发现,而且在患AD3型AD的系谱患者中也不存在。
认为这两种PS2突变均可引起PS1/PS2基因家族内高度保守的残基的 取代。
通过在碱基对1624中的T→C取代而使C-末端密码子420上发生 Ile→Thr的取代,从而产生了另外的PS2突变。在其它早期发现(45岁) 的家族AD病例中发现了该突变。
参考SEQ ID NO:18的核苷酸位置和SEQ ID NO:19中的氨基酸 位置,在表5中列出了这些hPS2突变。在表中的“NA”表示未得到数据
如在前节所讨论的,还发现了许多PS1突变。在图4中列出了hPS1 和hPS2序列的比较,表明这些致病突变位于PS1蛋白区域中,但所述区 域在PS2蛋白中是高度保守的。因此,认为在PS2中的相应突变是致病的, 而且包括在本文提供并可得到的PS2突变体中。此外,认为在任何早衰素 基因保守区中鉴定的任何致病突变代表共有所述保守区的其它早衰素的突 变体。
发现了其产物与PS1基因产物有基本的氨基酸和结构相似性的基因, 表明这些蛋白作为具有重叠功能的独立蛋白可能是功能相关的,但作为多 肽的物理相关亚单位或作为在相同途径中完成连续功能的独立蛋白,可能 具有稍微不同的比活性。
观察在患家族性AD患者的PS2蛋白保守结构域中的3个不同错义突 变后认为,可能与PS1基因中的那些一样,这些突变可能是AD的致病因 素。这一结论是很显然的,因为尽管与PS1基因突变相关的疾病表型(30 -50岁发作,持续10年)与PS2基突变相关的那些(40-70岁发作; 持续达20年)有极细微的差别,但总的相似性清楚地说明该基因家族成员 所包括的生物化学途径是至少早期发作AD的重要原因。在疾病表型中的 所述细微差别反映了在CNS中PS2转录本的表达水平较低,或可能反映了 PS2基因产物有不同的作用。
与PS1突变的作用相似,PS2发生突变时会使APP(淀粉样前体代 表)到Aβ肽的加工、Tau微管相关蛋白的超磷酸化产生异常,而且细胞 内钙的体内平衡失常。阻止这些异常相互作用为治疗AD提供了方法。
最后,在一正常个体中发现了至少一种核苷酸多态性,所述个体的 PS2cDNA在SEQ ID NO:18的bp626发生了T→C改变,但在所编码的 氨基酸序列中没有任何改变。
III优选实施方案
部分基于本文公开并描述的发现,提供了本发明的下列优选实施方 案。
1分离的核酸
在一系列的实施方案中,本发明提供了对应于或相关于本文所公开的 早衰素核酸序列的分离的核酸。如下文更全面讨论的,这些序列包括来自 人和其他哺乳动物的正常PS1和PS2序列、来自非哺乳动物如果蝇和 C.elegans的同源序列、可用作探针和PCR引物的这些序列的亚序列、早衰 素蛋白或对应于特定结构域或多态区的这些编码序列片段亚序列、对应于 早衰素基因片段的互补或反义序列、其中已将早衰素编码区与外源调节区 可操作相连的序列,以及融合到其他蛋白上的早衰素融合蛋白的编码序 列,所述其他蛋白用作表达标记、纯化“标记”或用于筛选和检测蛋白与 早衰素的相互作用
因此,在第一系列的实施方案中,提供了编码正常或突变体PS1和PS2 蛋白的分离的核酸序列。本文公开了所述核酸序列的实例。这些核酸可以 是基因组序列(如SEQ ID NO:5-15)或可以是cDNA序列(如SEQ ID NO:1、3、16和18)。另外,所述核酸可以是重组基因或“小基因”, 其中可将内含子和外显子以及局部顺式作用调节元件的所有或某些内含子 不同组合加工成增殖或表达构建体或载体。因此,例如本发明提供了核酸 序列,其中在DNA水平掺入本文所述的剪接改变变体,因此使包含这些 序列的细胞只在各剪接位置表达一种剪接变体。例如,可生产一重组基因, 其中将PS1基因的外显子1的3’末端(SEQ ID NO:5的bp1337)直接 与外显子3的5’末端(SEQ ID NO:6的bp 588)相连,以便只生产对 应于主要转录本的转录本。显然,人们可生产“强迫”剪接改变外显子2 和外显子3的重组基因。同样,可生产另外的重组基因,其中将PS1的外 显子4或外显子9剪接变体之一(或对应的PS2TM6→7剪接变体)掺入到 DNA中,以便使包含所述重组基因的细胞只表达这些变体之一。为了达到 减小重组早衰素基因的目的,可以用cDNA基因或从DNA构建体中除去 内含子和不翻译外显子的各种组合。最后,可生产其中5’UTR被改变,以 便必须从两个转录启始位点中的一个或另一个进行的重组基因。如下文所 述,所述构建体在鉴定可诱导或抑制早衰素表达的化合物中可以是特别有 用的。通过本文对早衰素基因的详细描述,现可得到这些实施方案的许多 变体。
除公开的早衰素序列外,本领域专业人员现在可以鉴定并分离代表早 衰素基因或cDNA的核酸,所述cDNA是公开序列的等位基因或异同源性 同系物。因此,本发明提供了对应于这些等位基因和同系物的分离的核酸, 以及通过本领域熟知的方法,从这些序列衍生的各种上述重组构建体。总 之、用探针或PCR引物本领域专业人员现在可以筛选基因组或cDNA制品 (包括从个体生物体(如人AD患者或其家族成员)制备的样品)以及细菌、 病毒、酵母或其它基因组或cDNA文库以鉴定等位基因或同源序列。由于 需要鉴定引起AD或其它疾病的其它早衰素基因突变,由于需要鉴定无致 病性的其它早衰素多态性并由于还需要产生用于研究AD并筛选潜在治疗 剂的各种动物模型,所以特别设想从其它制品或人核酸文库以及从包括大 鼠、小鼠、仓鼠、豚鼠、兔、狗、猫、山羊、绵羊、猪的动物和非人灵长 类的制品或文库中分离其它的早衰素序列。此外,来自酵母或无脊椎动物 包括C.elegans和其它线虫,以及果蝇和其他昆虫的早衰素同系物也有药物 筛选的用途。例如可以用携带突变早衰素同系物(或哺乳动物早衰素转基 因)(引起很快发生并容易记录的表型(如在数天后不正常的阴或眼发 育))的无脊椎动物筛选用于阻断突变体基因作用的药物。所述无脊椎动物 比较大的脊椎动物能够更迅速有效地进行大量筛选。在通过所述筛选发现 了提示化合物后,就可以在高等动物中对其进行检测。
利用相对短的早衰素基因序列,可以用标准杂交筛选或PCR技术(如 用于鉴定mPS1基因)以鉴定和/或分离等位基因和同源序列。根据靶序列 的性质、所用的方法和所需的特异性,所述序列可包含8个或更少的核苷 酸。未来技术的发展使得可使用甚至更短的序列。就目前技术而言,9- 50个核苷酸,而且约18-24个核苷酸的序列是优选的。这些序列可从本 文公开的序列中选出,或从本文可得到的其它等位基因或异特异性同系物 衍生。在检测mRNA或筛选cDNA文库时,优选使用来自编码序列(而不 是内含子)的探针和引物,避免了通常在剪接变体中被删除了的序列,除 非特别需要鉴定那些变体。认为早衰素的等位基因变体可以在严谨杂交条 件(如本文所定义的)下,与公开的序列杂交,而可用较低的严谨度鉴定 异特异性同系物。
在另一系列的实施方案中,本发明提供了包括早衰素序列亚序列或其 补体的分离的核酸。如上所述,在早衰素基因的等位基因和同源变体的鉴 定和分离中,所述序列有作为探针和PCR引物用途。在筛选和/或用于诊 断目的的个体基因型确定中,对应于早衰素多态性区域的亚序列(如上所 述)也有特别的用途。另外,如下文描述的,所述亚序列具有编码(1) 在融合蛋白中所含的早衰素蛋白的片段,(2)含有早衰素蛋白功能结构 域的用于结合研究的片段,(3)早衰素蛋白的片段,可用所述片段作为 免疫原以产生抗早衰素蛋白的抗体和(4)早衰素片段,所述片段用作早 衰素的竞争性抑制剂或模拟物以抑制或模拟其生理学功能。最后,所述亚 序列可编码或代表在生理条件下,与早衰素基因或早衰素mRNA转录本杂 交以抑制所述序列转录或翻译的互补或反义序列。因此,根据所需要的用 途,本发明提供了长度从8-10个核苷酸(如用作探针)到接近全长的早 衰素基因组或cDNA的早衰素基因的核酸亚序列。因此,本发明提供了分 离的核酸序列,所述核酸序列含有对应于早衰素基因的至少8-10个,优 选15个,更优选至少20个连续核苷酸的序列(如本文公开或的得到的) 或对应其补体的序列。但如上所述,根据不同的技术,可以使用较短的序 列。
在另一系列的实施方案中,本发明提供了核酸,其中具有或不含内含 子或如上所述重组工程的早衰素编码序列与内源或外源5’和/或3’调节区 可操作相连。本文详细描述了hPS1基因的内生调节区。用本发明的公开和 标准遗传技术(如PCR延伸,导向基因步查),本领域专业人员还可克隆 相应的hPS25’和/或3’内生调节区。同样,通过不过分的试验,可得到hPS1 和hPS2内源调节区的等位基因变体,以及来自其它哺乳动物同系物的内源 调节区。另外,内源调节区(即来自不同的同种基因的调节区或异特异性 调节区)可与早衰素编码序列可操作相连以便引导表达。适宜的5’调节区 包括启动子元件并还可包括其它元件如操纵子或增强子序列、核糖体结合 序列、RNA加帽序列等。所述调节区可选自控制原核和真核细胞、其病毒 的基因表达的序列和其组合。所述调节区包括,但不限于lac系统、trp系 统、tac系统,和trc系统;λ噬菌体的主要操纵子和启动子区;fd被膜蛋 白的控制区;SV40的早期和晚期启动子;从多瘤病毒、腺病毒、反转录 病毒、杆状病毒和猴病毒衍生的启动子;3-磷酸甘油酸激酶启动子;酵母 酸性磷酸酶启动子;酵母α因子启动子;在神经元或其它类型的细胞中表 达的其它真核基因的启动子元件;和其组合。特别是,可以选择可诱导或 可阻抑的调节元件(如β-半乳糖苷酶启动子)以便在用这些核酸转化的细 胞中进行可控制的和/或可操作的表达。另外,可将早衰素编码区与在多细 胞生物体中提供组织特异性表达的调节元件可操作相连。所述构建体对于 生产转基因生物体以便仅在适宜的组织中表达早衰素基因是特别有用的。 适宜调节区的选择在本领域专业人员的能力和判断能力范围内,而且所述 调节区的重组用途也是本领域熟知的。
在另一系列的实施方案中,本发明以融合蛋白的形式提供了编码所有 或部分早衰素蛋白的分离的核酸。在这些实施方案中,核酸调节区(内源 或外源的)与第一编码区可操作相连,所述第一编码区与第二编码区在框 内共价相连。所述第二编码区按需要可与一个或多个其它的编码区共价相 连,而最后一个编码区与终止密码子和按需要适宜的3’调节区(如多聚腺 苷酸化信号)相连。融合蛋白的早衰素序列可代表第一、第二或任何其它 编码区。所述早衰素序列可以是保守的或非保守的结构域并可放在融合蛋 白的任何编码区中。根据实践者的需要和判断能力选择融合蛋白的非早衰 素序列,但不受本发明的限制。但有用的非早衰素序列包括有助于鉴定或 纯化所得融合蛋白的短序列“标记”如抗原决定基或poly-His标记。另外, 非早衰素编码区可编码较大的蛋白或蛋白片段如有助于鉴定并纯化所述蛋 白的或在检测(如下文所述的那些)中有用的酶或结合蛋白。具体的早衰 素融合蛋白包括用于分离并纯化早衰素的poly-His和GST(谷胱甘肽S- 转移酶)融合蛋白,下文所述的用于鉴定其它蛋白的检测中的酵母双杂交 融合蛋白,所述其它蛋白与早衰素结合或相互作用。
在另一系列的实施方案中,本发明提供了重组DNA构建体形式的分 离的核酸,其中标记或报道基因(如β-半乳糖苷酶、荧光素酶)与早衰 素基因的5’调节区可操作相连以便在所述早衰素调节序列的控制下表达所 述标记基因。利用本文公开或可得到的早衰素调节区,包括来自人和其它 哺乳动物的PS1和PX2基因的调节区,本领域专业人员可以生产所述构建 体。如下文更详细讨论的,可以用所述分离的核酸生产用于鉴定化合物的 细胞、细胞系或转基因动物,所述化合物可直接或间接有差别地影响所述 早衰素的表达。
最后,当包含在载体中时,本发明分离的核酸包括上述任何序列。适 宜的载体包括所有类型的克隆载体和表达载体,包括质粒、噬菌粒、粘粒、 附加体等以及整合载体。所述载体可包含各种标记基因(如抗生素抗性或 敏感性基因),所述标记基因用于鉴定用其成功地转化了的细胞。另外, 所述载体可包含本发明核酸与之可操作相连的调节序列,和/或可包含编码 区以便本发明的核酸在与载体适宜相连后,以融合蛋白的形式被表达出 来。所述载体包括在酵母“双杂交体”中所用的载体、杆状病毒和噬菌体 展示系统。按照实践应用的需要选择载体以用于原核、真核或病毒表达。 例如,痘病毒载体或含SV40启动子的猴病毒载体(如pSV2)或单纯疱 疹病毒或腺相关病毒可用于转染哺乳动物细胞,包括培育或体内的神经 元,杆状病毒可用于转染昆虫细胞(如蝴蝶细胞)。现在市场上有许多不 同的载体而且是本领域熟知的,因此适宜载体的选择在本领域专业人员的 能力和判断能力范围内。
2基本纯的蛋白
本发明提供了基本纯的早衰素蛋白制品、早衰素蛋白片段和包括早衰 素和其片段的融合蛋白。如本文所述,所述蛋白、片段和融合蛋白在生产 抗正常或突变早衰素的抗体、鉴定早衰素结合蛋白以及诊断和治疗方法中 有效用。因此,根据所需要的用途,本发明提供了基本纯的含氨基酸序列 的蛋白或肽,所述氨基酸序列是完整早衰素蛋白的亚序列,而且长度从4 -10个氨基酸(如用作免疫原)或10-100个氨基酸(如用于结合试验) 到完整的早衰素蛋白。因此,本发明提供了基本纯的蛋白或肽,所述蛋白 或肽含有对应早衰素蛋白(如本文所公开或能够得到的)的至少4-5个、 优选6-10个,更优选至少50或100个连续氨基酸的序列。
用任何方法均可分离并纯化本发明的蛋白或肽,所述方法是以其蛋白 序列所揭示的性质为基础选择的。由于早衰素具有内在的或跨膜蛋白的特 性,所以可以分离其中一般来讲高度表达早衰素的细胞(如神经元、少突 神经胶质、肌肉、胰腺)的膜级分,然后通过例如去污剂溶解提取蛋白。 从用表达载体(如杆状病毒系统如pPbac和pMbac载体(Stratagene,LaJolla, CA));酵母表达系统(如pYESHIS Xpress载体(Invitrogen,San Diego, CA));真核表达系统如有恒定的组成性表达的pcDNA3(Invitrogen,San Diego,CA)或可诱导的LacSwitch(Stratagene,La Jolla,CA);或原核表达载 体如pKK233-3(Clontech,Palo Alto,CA)转化或转染的细胞中纯化早衰素蛋 白、融合蛋白或其片段。在蛋白或片段整合到重组细胞(如固定的人细胞 系或其它真核细胞)的内质网或质膜的过程中,可从膜级分中纯化所述蛋 白。另外,如果蛋白不适当地位于或聚集在重组细胞(如原核细胞)内的 包含体中,则可从溶解的细胞或从溶解的包含体中纯化所述蛋白。
用标准蛋白纯化方法可完成纯化,所述纯化方法包括,但不限于凝胶 过滤层析、离子交换层析、高效液相层析(RP-HPLC、离子交换HPLC、 大小排阻HpLC)、高效层析聚焦层析、疏水相互作用层析、免疫沉淀或 免疫亲和纯化、可以用电泳(如PAGE、SDS-PAGE)以分子量、电荷 特性和疏水性为基础,分离蛋白或肽。
通过产生融合蛋白可以很方便地纯化早衰素蛋白或其片段,所述融合 蛋白是将所需的早衰素序列与另一种肽如抗原决定基或poly-His标记(如 QIA表达载体,QIAGEN Corp.,Chatsworth,CA)或较大的蛋白(如利用 pGEX-27载体(Amrad,USA)的GST)或利用Green Lantern载体(GIBCO/BRL, Gaithersburg,MD)的荧光蛋白融合。可以表达融合蛋白,然后从原核或真 核细胞中回收,然后以融合载体序列为基础,用任何标准方法纯化。例如, 可用抗体,通过免疫亲和或免疫沉淀纯化融合蛋白,所述抗体抗融合蛋白 的非早衰素部分,在有poly-His标记的情况下,通过与镍柱亲和结合来纯 化。通过酶促裂解融合蛋白,可从融合蛋白中进一步纯化所需的早衰素蛋 白或片段。制备并使用所述纯化蛋白的融合构建体的方法是本领域已知 的,而且已经有用于该目的的数种市售试剂盒。从本发明的公开看,人们 能够使用含有早衰素的所述融合构建体。
3抗早衰素的抗体
本发明还提供了与早衰素蛋白或其片段选择性结合的抗体,以及制备 抗体的方法。特别重要的是,通过鉴定早衰素的功能结构域和与AD相关 的多态性区域,本发明提供了抗体和制备抗体的方法,所述抗体选择性地 结合并由此可鉴定和/或区分早衰素蛋白的正常和突变体(即致病)形式。 本发明的抗体具有作为实验室试剂的效用,所述试剂用于免疫纯化早衰 素、Western印迹鉴定表达早衰素的细胞或组织、免疫细胞化学或免疫荧 光技术以确定所述蛋白的亚细胞位置。另外,如下所述,还可用本发明的 抗体作为诊断工具以鉴定AD相关的早衰素等位基因的携带者,或作为治 疗工具来选择性地结合并抑制体内早衰素蛋白的致病形式。
可以用本发明的完整早衰素蛋白或任何早衰素表位生产本发明的抗 体,所述表位应是所述蛋白的特征或可使所述蛋白区别于其它宿主蛋白。 通过将来自早衰素序列的序列如4-10个氨基酸残基与来自相关宿主的蛋 白序列计算机数据库进行比较,可鉴定所述表位。优选从N-或C-末端, 或从连接所述蛋白跨膜结构域的环结构域中选择所述表位。特别是,期望 多态性N-末端区域,TM1→2环或TM6→7环有最大的诊断和治疗效 用。另一方面,期望抗高度保守结构域的抗体有最大的早衰素纯化或鉴定 效用。
用IBI Pustell程序,可将氨基酸残基位置鉴定为hPS1蛋白中的潜在抗 体位点,并可用于产生本发明的抗体。在表6中列出了这些位置(对应于 SEQ ID NO:2中的位置)。
当然,选择抗原决定基的其它方法是本领域已知的,因此,也可以使 用。另外,也可使用包括一些这些表位的较大的片段(如8-20或优选9 -15个残基)。例如,包括109-112表位的片段可含有残基107-114 或105-116。甚至包括如整个功能结构域或多功能结构域(如TM1、 TM1→2、TM2或TM6、TM6→7)的更大片段也是优选的。对于其它早 衰素蛋白(如对于mPS1或其它非人同系物,或对于PS2),可以选择同 系物位点。
用相同的IBI Pustell程序,可将氨基酸残基位置鉴定为hPS2蛋白中的 潜在抗体位点,并可用于产生本发明的抗体。在表7中列出了这些位置(对 应于SEQ ID NO:19中的位置)。
就PS1而言,当然选择抗原决定基的其它方法是本领域熟知的,而且 可以使用这些方法。另外,也可使用包括一些这些表位的较大的片段(如 8-20或优选9-15个残基)。例如,包括310-314表位的片段可含 有残基308-316或307-317。甚至包括如整个功能结构域或多功能结 构域(如TM1、TM1→2、TM2或TM6、TM6→7)的更大片段也是优 选的。对于其它早衰素蛋白(如对于mPS1或其它非人同系物,或对于 PS2),可以选择同系物位点。
从粗提取物(如高度表达所述蛋白的细胞的膜级分)、从来自天然或 重组表达蛋白或肽的细胞中基本纯化的蛋白或肽中可生产早衰素免疫原制 品作为短免疫原,通过化学肽合成方法也可生产所述制品。所述早衰素免 疫原可以是融合蛋白形式的,其中根据其辅助特性选择非早衰素区。如本 文所用的,应将早衰素免疫原定义为包含肽的制品,所述肽含有早衰素蛋 白(如本文共可和可得到的)的至少4-8,优选至少9-15个连续的氨 基酸残基。当然,根据所需的用途和未来的技术发展,较少的残基序列也 有效用。因此,用于产生抗早衰素抗体的早衰素衍生的序列应被视作早衰 素免疫原。
本发明的抗体可以是多克隆或单克隆的,或可以是抗体片段,包括Fab 片段、F(ab’)2、和单链抗体片段。另外,在用本发明的方法鉴定了有用的 抗体后,可产生包括上述任何抗体片段的重组抗体,以及以抗早衰素的非 人抗体为基础的人源化抗体。从本发明的公开,以及本文可得到的其它早 衰素的特征来看,本领域专业人员可通过任何本领域已知的标准方法生产 上述抗体。就抗体技术综述而言,参见Antibody Engineering:A Practical Guide,Borrebaek,ed.,W.H Freeman & Company,NY(1992),或Antibody Engineering,2nd Ed.,Borrebaek,ed.,Oxford University Press, Oxford(1995)。
总而言之,首先通过用在适宜载体中的早衰素免疫原免疫小鼠、兔、 山羊或其它适宜的动物可生产多克隆抗体。为了提高制品的免疫原性,可 将免疫原与载体蛋白结合或与佐剂(如弗氏佐剂)混合。尽管无需提醒, 但可以进行加强注射,在使体液反应发展了适宜的时间,优选数周后,从 动物中抽血,然后纯化血清以分离免疫球蛋白组分。
同样,总的来说,首先通过用在适宜载体中的早衰素免疫原免疫小鼠、 免、山羊或其它适宜的动物可生产单克隆抗-早衰素抗体。如上所述,可使 用载体蛋白或佐剂并推荐进行加强注射(如8-10周中的每2或3周)。 在使体液反应发展了适宜的时间后,杀死动物,取出其脾,然后重悬在例 如磷酸缓冲的盐(PBS)中。脾细胞作为淋巴细胞源,其中一些生产适宜 特异性的抗体。然后将这些细胞与无限增殖化细胞系(如骨髓瘤)融合, 在存在选择性试剂如HAT的条件下,将融合产物放到大量的组织培养孔 中。对所述孔进行系列筛选和重铺,每次筛选细胞均会得到有用的抗体。 通常,要进行数次筛选和重铺过程直到90%以上的孔含有抗体生产阳性的 单个克隆。用标准方法如利用Protem A Sepharose的亲和层析、通过离子 交换层析或通过这些技术的变体或组合,可纯化用所述克隆生产的单克隆 抗体。
可以用其它用于诊断和/或治疗用途的化合物或物质标记或结合本发 明的抗体。例如,可将其与放射性核素、荧光化合物或用于成像或治疗的 酶,或脂质体结合,所述脂质体用于将脂质体中所含的化合物导向到特定 的组织位置中。
4转化的细胞系
本发明还提供了用本发明核酸转化或转染的细胞或细胞系(原核和真 核的均可)以便克隆增殖这些核酸和/或表达由其编码的蛋白或肽。所述细 胞或细胞系在本发明核酸和蛋白的增殖和生产方面有效用,但如下文进一 步描述的,也可作为诊断和治疗试验的模型系统。如本文所用的,术语“转 化的细胞”包括不论是用转化、转染、注射或其它方法将本发明的任何核 酸导入到其中的任何细胞或任何细胞的子代。生产适宜载体、用那些载体 转化细胞以及鉴定转化体的的方法是本领域熟知的,而且在此仅简要综述 (参见例如Sambrook等(1989)分子克隆:实验室手册,第2版,冷泉 港实验室出版社,冷泉港实验室、纽约)。
用于生产本发明转化细胞的原核细胞包括埃希氏菌属(如大肠杆菌)、 假单胞菌属(如绿假单胞菌)和芽孢杆菌属(如枯草芽孢杆菌、嗜热脂 肪芽孢杆菌),以及许多其它本领域熟知并常用的细胞。原核细胞对于大 量生产本发明的蛋白或肽(如正常或突变早衰素、早衰素片段、早衰素融 合蛋白)是特别有用的,可以用含有各种表达载体系统的细菌细胞(如大 肠杆菌),所述载体系统包括例如含T7 RNA聚合酶/启动子系统、λ噬菌 体调节序列的质粒或M13噬菌体mGPI-2。用融合蛋白载体也可转化细菌 宿主,所述融合蛋白载体产生例如lacZ、trpE、麦芽糖结合蛋白、 poly- His标记或谷胱甘肽-S-转移酶融合蛋白。所有这些,以及许多其它原核表 达系统是本领域熟知的,而且市场上广为销售(如用于GST融合体的 pGEX-27(Amrad,USA))。
用于生产本发明转化细胞的真核细胞和细胞系包括哺乳动物细胞和细 胞系(如PC12、COS、CHO、成纤维细胞、骨髓瘤、神经母细胞瘤、 杂交瘤、人胚胎肾293、卵母细胞、胚胎干细胞)、昆虫细胞系(如用杆 状病毒载体如pPbac或pMbac(Stratagene,La Jolla,CA))、酵母(如用酵 母表达载体如pYESHIS(Invitrogen,CA))和真菌。真核细胞对于有些实施 方案是特别有用的,在所述实施方案中,要求早衰素蛋白或其功能片段完 成与正常或突变体蛋白相关的功能和/或进行细胞内相互作用。因此,例如 优选将被转化的真核细胞用作早衰素功能或相互作用的模型,而且筛选候 选治疗剂的试验优选使用转化的细胞。
为了完成在真核细胞中的表达,已经发展了许多载体,而且可以在市 场上买到,所述载体在人工启动子元件的调节下,可诱导(如LacSwitch 表达载体,Stratagene,La Jolla,CA)或同源(如pcDNA3载体,Invitrogen, Chatsworth,CA)表达早衰素核苷酸序列。所述启动子元件通常衍生于 CMV或SV40病毒基因,尽管也可使用其它在真核细胞中有活性的强启动 子元件来诱导早衰素核苷酸序列的转录。通常,这些载体还含有人工多聚 腺苷酸化序列和衍生于外源病毒基因序列或其它真核基因的3’UTR。此 外,在某些构建体中,在所述载体中还包含人工的、非编码可剪接内含子 或外显子以使所需核苷酸序列(在这种情况下,是早衰素序列)的表达增 强。这些表达系统通常可从市场上购买,有代表性的载体是如pcDNA3和 pZeoSV(Invitrogen,San Diego,CA)。已经成功地将后两种载体用于在转染 的COS、CHO和PCI2细胞中表达早衰素蛋白(Levesque等,1996)。 无数的市售和习惯设计的表达载体可从市场上购买,从而可在连续或暴露 于特定的外源刺激(如停用四环素或暴露于IPTG)后,在或多或少理想 类型的细胞中表达任何所需的早衰素转录本。
通过本领域熟知的各种方法,将载体导入到受体或“宿主”细胞中, 所述方法包括,但不限于磷酸钙转染、磷酸锶转染、DEAE葡聚糖转染、 电穿孔、脂转染(如Dosper Liposomal转染试剂,Boehringer Mannheim, Germany)、微注射、在微珠上射击插入、原生质融合或,对于病毒或噬 菌体载体来说,通过用重组病毒或噬菌体感染。
5转基因动物模型
本发明还提供了转基因非人动物模型的生产方法,所述动物模型用于 研究早老性痴呆病、筛选候选药物化合物、产生其中表达突变体或野生型 早衰素序列或使早衰素基因失活(如“剔除”缺失)的外植的哺乳动物CNS 细胞培养物(如,神经元、神经胶质、器官型或混合的细胞培养物)、已 经评估潜在的治疗效果。在本发明前,通过在血小板衍生的生长因子β受 体启动子元件(Gemes等,1995)的控制下,插入并过表达人淀粉样蛋 白前体基因的突变体形式,而建立在早老性痴呆病的部分动物模型。该突 变体(βAPP717,Val→Ile)接合的病理学表现和在携带高拷贝数的转基因 动物的脑中,淀粉样β肽沉积。在转基因动物脑中的这种变化与人AD中 所见到的很相似(Gemes等,1995)。但是,到目前为止,还不清楚这 些动物是否会变成痴呆者,但有一点共识是,现在可以在小鼠中再产生至 少某些AD的特征。
在本发明的动物模型中适用的动物包括,但不限于大鼠、小鼠、仓鼠、 豚鼠、兔、狗、猫、山羊、绵羊、猪和非人灵长类(如恒河猴、猩猩)。 对于初步的研究而言,由于其相对容易保持,而且生命期较短,所以转基 因啮齿类动物(如小鼠)是优选的。如上所述,对于某些研究而言,转基 因酵母或无脊椎动物(如线虫、昆虫)是优选的,因为它们可以更迅速地 生长,而且筛选费用低。但,转基因非人灵长类对于长期研究而言是优选 的,因为它们与人更相似,而且它们有较高的认知能力。
用本文公开并可得到的核酸,现在有数种方法可以产生早老性痴呆病 的转基因动物模型。因此,能够得到的动物包括(1)其中正常人早衰素 基因作为在内源或外源启动子元件的调节下的附加基因,并作为小基因或 大基因组片段已经被重组导入到动物基因组中的动物;其中已经通过同源 重组或基因导向用正常人早衰素基因取代一个或两拷贝的动物同源早衰素 基因;和/或其中经同源重组或基因导向,用编码人同系物的序列取代,而 将一个或两拷贝的动物同源早衰素基因进行重组“人源化”。将这些动物 用于评估转基因方法的作用,人或人化早衰素基因的导入或取代的作用。 (2)其中已经将突变(即致病的)人早衰素基因作为在外源或内源启动 子调节下的附加基因,或作为小基因或大基因组片段而重组导入动物基因 组中的动物;其中通过同源重组或基因导向而用突变人早衰素基因取代一 个或两拷贝动物同源早衰素基因的动物;和/或其中通过同源重组或基因导 向而经编码突变人同系物的序列的部分取代,已将一个或两个拷贝的动物 同源早衰素基因之一重组“人源化”的动物。将这些动物作为表现出某些 或全部(无论是在生物化学、病理学和/或行为水平上)携带一个或多个等 位基因的人特征的动物模型,所述等位基因对于早老性痴呆病或其它与早 衰素基因突变相关的疾病来说是致病性的。(3)其中已经将突变动物早 衰素基因(携带例如对应于或相似于人早衰素致病突变之一的特定突变) 之一的突变体作为在外源或内源启动子调节下的附加基因,或作为小基因 或大基因组片段而重组导入动物基因组中的动物;和/或其中通过同源重组 或基因导向而用动物早衰素基因(携带例如对应于或相似于人早衰素致病 突变之一的特定突变)之一的突变体取代一个或两拷贝动物同源早衰素基 因的动物。将这些动物作为表现出某些或全部(无论是在生物化学、病理 学和/或行为水平上)携带一个或多个等位基因的人特征的动物模型,所述 等位基因对于早老性痴呆病或其它与早衰素基因突变相关的疾病来说是致 病性的。(4)其中通过同源重组或基因导向而部分或全部缺失了一个或 两拷贝动物早衰素基因之一,或通过外源序列(如终止密码子,lox p位 点)的同源重组或基因导向来完成插入或取代,从而使一个或两拷贝动物 早衰素基因之一失活的“剔除”动物。所述动物是有用的动物模型,可用 来研究失去早衰素基因表达可能会产生的影响,评估功能的丢失对于继续 表达突变体形式是否是优选的,检测是否可恢复其它基因以取代突变早衰 素(如用PS2取代PS1)或干扰其它致AD基因(如APP或ApoE)的作 用。例如正常早衰素基因对于突变体APP基因实际表达成AD是必需的, 因此,转基因早衰素动物模型可用来说明所述多基因相互作用。
为了产生动物模型(如转基因小鼠),正常或突变早衰素基因(如正 常或突变hPS1、mPS1、hPS2、mPS2等),或编码早衰素的至少一个 功能结构域的突变重组核酸(如含有mPS1的重组构建体,其中已经用对 应人突变序列的核苷酸序列取代了所述mPS1)可通过用标准卵母细胞微 注射技术插入到种系或干细胞中,或转染或微注射到胚胎干细胞中。用这 些或相似方法生产的动物称为是转基因的。同样,如果需要失活或取代内 源早衰素基因,可使用利用胚胎干细胞的同源重组。用这些或相似方法生 产的动物称为“失效”  (失活)或“knock-in”  (取代)模型。
对于卵母细胞注射来说,可将一个或多拷贝的本发明重组DNA构建 体插入到刚刚受精的卵母细胞的前核中。然后将该卵母细胞再植入到假孕 的孵育母体中。通过分析DNA(如来自后代小鼠尾静脉)中是否存在插 入的重组转基因序列,在活的出生动物中筛选整合体。转基因可以是以 YAC、BAC、PAC形式注射的完整基因组序列或具有天然启动子或异源 启动子的其它染色体DNA片段、cDNA,或含所有编码区或发现对于最 佳表达所必需的其它元件的小基因。
也可以完成早期胚胎的反转录病毒注射以便插入本发明的重组DNA 构建体。用这种方法,可将转基因(如正常或突变hPS1或PS2序列)插 入到反转录病毒载体中,用所述反转录病毒载体在发育早期直接感染胚胎 (如小鼠或非人灵长类胚胎)以得到嵌合体,其中的一些会产生种系传递。
利用干细胞的同源重组可以筛选基因转移细胞以鉴定罕见的同源重组 事件。鉴定后,用其通过胚细胞注射来产生嵌合体,所得动物的比例将说 明从重组体系而进行的种系传递。如果要使早衰素基因失活,这种方法是 特别有用的。例如通过设计含来自mPS1外显子侧的可选择标记序列的 DNA片段,可以失活小鼠中的mPS1基因。同源重组会导致在外显子的中 部插入标记序列,从而引起mPS1基因失活和/或内部序列缺失。然后对个 体克隆进行DNA分析以识别同源重组事件。
产生转基因动物的技术和用于同源重组或基因导向的技术现已被广泛 接受和采用。例如对小鼠胚胎操作的实验室手册是生产转基因小鼠的详细 的标准实验室技术(Hogan等,1986)。为了产生转基因,通常将所需 的靶序列(如突变体或野生型早衰素序列)连接到位于一些启动子元件下 游的克隆位点,所述启动子元件要调节从早衰素序列进行的RNA表达。所 述早衰素序列下游,通常有人工多聚腺苷酸化序列。在已用于成功地产生 了模拟人遗传性神经变性疾病的动物的转基因模型中,尽管也可使用在中 枢神经系统细胞中指导表达的其它启动子元件,但最成功的启动子元件是 血小板衍生的生长因子受体β基因亚单位启动子和仓鼠朊病毒蛋白基因启 动子。产生转基因的另一种方法是用内源早衰素启动子和调节序列以驱动 早衰素转基因的表达。最后,可以用含完整早衰素基因和其适宜调节序列 的大基因组DNA片段如YAC产生转基因。已成功地将所述构建体用于在 转基因小鼠中人APP的表达(Lamb等,1993)。
通过导向内源早衰素基因以便通过同源重组改变内源早衰素序列也可 以产生动物模型。这些导向事件有除去内源序列(剔除)或改变内源序列 的作用,从而产生与人疾病有关的氨基酸改变或其它不正常序列(如更类 似人序列而不是源动物序列的序列)(在knock-in动物模型中)。有大量 的载体可达到此目的,从许多公司如GenomeSystems Inc.(St.Louis, Missouri,USA)可购买适宜来源的小鼠基因组DNA和其它待导向的动物 基因组。这些导向载体构建体的典型特征是2-4kb的基因组DNA与可选 择标记(如在称为“新霉素盒”的其自身启动子元件控制下的细菌新霉素 抗性基因)的5’相连。。然后将来自所需基因的第二DNA片段连接在新 霉素盒的下游,但在第二个选择性标记(如胸苷激酶)的上游。对DNA 片段进行选择以便通过在所述载体中所包含的序列之一,同源取代内源序 列,从而将突变体序列导入到靶动物的种系中。另外,可对序列进行选择 以缺失正常在新霉素盒周围,位于载体左右臂之间的序列。前者称为 knock-in,后者称为剔除。此外,还产生了无数的模型系统,特别是导向 剔除包括与神经变性疾病有关的基因(如Zheng等,1995导向缺失鼠APP 基因;Bueler等,1996导向缺失与成年发作的人CNS变性有关的鼠朊病 毒基因)。
最后,通过配子的化学或X-射线诱变,然后受精可产生转基因动物 的等同物,包括带有突变或失活早衰素基因的动物。用本文公开或可得到 的分离的核酸,本领域专业人员通过例如为检测突变体的直接测序RFLP、 PCR或杂交分析,或说明因剂量引起的一个等位基因丢失的Southern印迹 可以更迅速地筛选所得的子代。
6影响早衰素表达的药物的试验
在另一系列的实施方案中,本发明提供了鉴定能够诱导或抑制早衰素 基因和蛋白(如PS1或PS2)表述的小分子或其它化合物的试验。用非转 化细胞、无限增殖细胞系或重组细胞系在体外,或用本文能够得到的转基 因动物在体内完成所述试验。
特别是,以增加的或降低的mRNA表达(例如用本文公开并可得到的 核酸探针)、增加或降低水平的PS1、PS2或其它早衰素相关蛋白产物(例 如用本文公开并可得到的抗-早衰素抗体)、或增加或降低水平的在重组构 建体中与早衰素5’调节区可操作相连的标记基(如β半乳糖苷酶或荧光素 酶)表达为基础,所述试验可以检测PS1、PS2或其它早衰素-相关基因或 蛋白的表达是否有增加或降低。
因此,例如人们可以培养已知细胞以表达特定的早衰素,然后向培养 基中加入一种或多种试验化合物。在使所述化合物对早衰素的表达诱导或 抑制了足够的时间(如0-72小时)后,用上述和本领域熟知的任何技术 均可检测以确定的基线为基础,表达水平的变化。在特别优选的实施方案 中,所述细胞是来自无限增殖的细胞系如人成神经细胞瘤、成胶质细胞瘤 或杂交瘤细胞系。用本文公开并能够得到的核酸探针和/或抗体,检测早衰 素表达的改变,由此鉴定所述化合物是早衰素表达的诱导剂或阻遏剂,这 些只需要常规试验。
在特别优选的实施方案中,使用了重组试验,其中报道基因如β-半 乳糖苷酶、绿荧光蛋白、碱性磷酸酶或荧光素酶与早衰素的5’调节区可操 作相连。优选的载体包括Green Lanternl载体(GIBCO/BRL,Gaithersburg, MD)和the Great EScAPe pSEAP载体(Clontech,Palo Alto)。以本发明 公开的这些基因编码区为基础,本领域专业人员可以容易地分离并克隆本 文公开的hPS1调节区或其它早衰素调节区。报道基因和调节区在框内(或 在三个可能的阅读框架中的每一个中)相连以便可在早衰素调节元件的控 制下进行报道基因的转录和翻译。然后,将重组构建体导入任何适宜的细 胞类型中,尽管哺乳动物细胞是优选的,人细胞最佳。使被转化的细胞在 培养基中生长,确定报道基因的表达基线水平后,将待测化合物加到培养 基中。报道基因表达的易于检测为鉴定早衰素基因的诱导剂和阻遏剂提供 了迅速高效的检测方法。
用该方法鉴定的化合物在修饰PS1、PS2或其它早衰素相关基因的体 内表达方面有潜在的应用。还可以在本文公开并可得到的动物模型中进一 步检测这些化合物以鉴定体内作用最强的那些化合物。另外,如本文对具 有早衰素结合活性的小分子所述的,这些分子可作为“先导化合物”,例 如通过使所述化合物经连续修饰、分子定型以及在常规药物设计中所用的 其它方法来进一步开发药物。
7鉴定有早衰素结合能力的化合物
根据本发明,本领域专业人员可以实施新的筛选方法,以用于鉴定与 早衰素结合或与之相互作用的蛋白和其它化合物。所述蛋白和化合物包括 体内与早衰素相互作用,并因此为药物和治疗介入提供了新靶的内源细胞 组分,以及重组的、合成的和其它具有早衰素结合能力并因此可作为侯选 药物的内源组分。因此,在一系列的实施方案中,筛选细胞溶解产物或组 织匀浆物(如人脑匀浆物、淋巴细胞溶解产物)中与正常或突变早衰素之 一结合的蛋白或其它化合物。另外,可对任何不同的内源化合物,天然和 或合成的(如小分子或肽文库)进行筛选,以筛选其早衰素结合能力。在 本发明中,小分子是特别优选的,因为在口服给药后,它们很容易被吸收, 而且只有很小的潜在抗原决定基,和/或比大分子如核酸或蛋白更有可能跨 过血液脑障碍。本发明的方法是特别有用的,即可用它们鉴定选择性或优 先结合突变体形式的早衰素蛋白(而不是正常形式的)的分子,因此,它 们在治疗这种常染色体显性疾病的杂合患者方面有特别的效用。
由于尚不了解PS1和PS2的正常生理作用,因此结合正常、突变体或 这两种形式的早衰素的化合物在治疗和诊断方面有效用。例如只与正常早 衰素结合的化合物可作为其正常活性的增强剂,由此至少部分补偿在早老 性痴呆病患者中失去的或异常的突变早衰素形式的活性。结合正常和突变 体形式早衰素的化合物如果它们能够区别影响这两种形式的活性,从而消 除与正常功能的所有偏离,则它们也是有效用的。另外,阻断PS1或PS2 正常和突变体形式的活性比使疾病正常发展的生理和临床后果的严重程度 小,那么结合并抑制正常或突变体形式早衰素的化合物在治疗上也是有用 的,但优选鉴定与突变早衰素的结合亲和性高于与正常早衰素的(如至少 2-10倍高的Ka),而且选择性或优先抑制突变体形式的活性的化合物 用本文公开的任何技术,然后通过比较候选化合物与正常和突变体PS1或 PS2的结合亲和性,可鉴定所述化合物。
通过用仪器(如,BIAcore,LKB Pharmacia,Sweden)直接监测诸如所 述结合的荧光、分子量的变化或检测结合剂或早衰素在可溶相或在底物结 合相中的浓度,可监测结合早衰素(正常或突变体形式)的试剂的作用。
用上述方法鉴定后,以足以用于药物施用或试验的量(如μg或mg或 更大的量)生产侯选化合物,然后配制在可药用载体中(参见如Remington’s Pharmaceutical Sciences,Gennaro,A.,ed.,Mack Pub.,1990)。将这些 候选化合物施用于本发明的转化细胞、本发明的转基因动物模型、从动物 模型或人患者衍生的细胞系或早老性痴呆病患者。本发明公开并可得到的 动物模型对于进一步检测结合正常或突变早衰素的候选化合物的治疗效用 是特别有用的。
另外,在用上述方法鉴定后,所述候选化合物在新药物的设计和开发 中可作为“先导化合物”。例如如本领域熟知的,在开发新药的药物工业 中,连续修饰小分子(如用肽取代氨基酸残基,用肽或非肽化合物取代功 能基团)是标准方法。所述开发通常是从已知具有至少部分所需活性(如 PS1结合或阻断能力)的“先导化合物”开始的。具体地说,在鉴定了具 有至少某些所需活性(如早衰素活性的调节)的一种或多种化合物后,本 领域实践者就可通过所述分子的结构比较,了解哪些是先导化合物中应保 留的部分,哪些是在设计新候选化合物中可改变的部分。因此,本发明还 提供了鉴定先导化合物的方法,可对所述先导化合物进行连续修饰以产生 用于治疗早老性痴呆病的新候选化合物。然后检测这些新化合物的早衰素 结合或阻断(如在上述结合试验中)以及治疗效用(如在本文所述的动物 模型中)。可重复所述方法,直到鉴定出具有所需治疗活性和/或效用的化 合物。
在本发明的各系列实施方案中,可完成一种试验以检测“早衰素组分” 与某些其它部分之间的结合。特别有用的是系列试验,其中在结合试验中, 用突变体和正常早衰素组分检测仅与正常或仅与突变体形式早衰素有结合 能力的化合物  如下文更全面描述的,预期所述化合物具有最大的治疗效 用。在这些试验中的“早衰素组分”可以是完整的正常或突变体形式的早 衰素蛋白(如hPS1或hPS2变体),但不是必需的。如上所述,早衰素的 的具体功能结构域可作为不同的分子或融合蛋白的部分。例如,为了分离 与这些功能结构域相互作用的蛋白或化合物,用对应于这些区域的融合构 建体和/或合成的肽可完成筛选。因此,就PS2而言,可制备包含对应于约 氨基酸1-87(N-末端)、或269-387(TM6→7环)或任何其它所 需的保守结构域的序列的GST-融合肽。对于较短的功能结构域而言,可生 产对应于例如约氨基酸107-134(TM1→2环)的合成肽。同样,就PS1 而言,可制备包含对应于约氨基酸1-81(N-末端)、或266-410 (TM6→7环)或对应于例如约氨基酸101-131(TM1→2环)的合成 肽。显然,各种组合的融合蛋白和早衰素功能结构域是可能的,而且这些 仅仅是实例。另外,可以改变功能结构域以便有助于在试验中,例如通过 将促进所述结构域固定在底物上的反应性基团或氨基酸残基(如半胱氨 酸)(如通过巯基反应)导入到功能结构域中。因此,例如已经合成了含 其它C-未端半胱氨酸残基的PS1 TM1→2环片段(31-单体)。用该肽 产生用于亲和层析(Sulfo-link;Pierce)的亲和底物以分离用于微测序的 结合蛋白。同样用修饰的残基可生产其它功能结构域或抗原片段(参见例 如实施例10)
用本领域熟知的任何标准方法可以纯化并表征用这些方法鉴定的蛋白 或其它化合物。例如可利用电泳(如SDS-PAGE,2D PAGE)或层析 (如HPLC)技术纯化并分离蛋白,然后进行微测序。对于具有阻断的N -末端的蛋白,裂解(例如提供CNBr和/或胰蛋白酶)特定的结合蛋白以 释放肽片段。用HPLC的进一步纯化/表征和微测序和/或用常规方法进行的 质谱分析提供了有关所述阻断蛋白的内序列数据。对于非蛋白化合物,可 以用标准有机化学分析技术(如IR、NMR和质谱分析;功能基团分析; X-射线结晶学)确定其结构和特性。
用于筛选细胞溶解产物、组织匀浆物、或候选早衰素结合分子的小分 子文库的方法是本领域熟知的,而且根据本发明公开,可用来鉴定结合正 常或突变早衰素组分或调节早衰素活性的化合物,所述早衰素活性是用非 特异性测量(如细胞内Ca2+/GTP/GDP比率的改变)或通过特异性测量(如 Aβ肽生产的改变或通过示差显示、2D凝胶电泳、示差杂交或SAGE方法 可监测的其它下游基因表达方面的变化)来定义的。优选的方法包括有关 下列技术的改变:(1)通过亲和层析直接提取;(2)通过免疫沉淀共 分离早衰素组分和结合的蛋白;(3)生物分子相互作用试验 (BIAcore);和(4)酵母双杂交系统。下文将对这些和其它方面分别 进行讨论。
A亲和层析
根据本发明公开,可以用本领域熟知的各种亲和结合技术分离结合本 文公开或其它可得到的早衰素的蛋白或其它化合物。总之,可将早衰素组 分固定在底物(如柱式滤纸)上,将含待测化合物的溶液在允许进行结合 的条件下,与早衰素蛋白、融合蛋白或片段接触。然后用溶液洗涤底物以 除去未结合或结合弱的分子。然后第二次洗涤洗脱与固定的正常或突变早 衰素组分强结合的那些化合物。另外,可以固定待测化合物,然后将含一 种或多种早衰素组分的溶液与柱、滤纸或其它底物接触。桉上述可以确定 所述早衰素组分与待测化合物的结合能力,或用标记形式的早衰素组分(如 放射性标记的或化学发光结构域)更迅速地评估与底物-固定的化合物的结 合,另外,由于认为PS1和PS2均是膜相关蛋白,所以优选将早衰素蛋白、 融合蛋白或片段掺入到双分子脂膜(如脂质体)中以促进其适当的折叠。 当使用包含至少一种跨膜结构域的早衰素组分时,这是特别有用的。可将 所述早衰素-脂质体固定在底物(直接或通过脂质体膜中的另一组分)上, 从带有固定的待测化合物的底物上经过,或用于各种熟知的膜蛋白结合试 验中。另外,可从生产所运组分的细胞中分离在膜级分中的早衰素组分, 然后将所述膜级分用于结合试验。
B共免疫沉淀
另一种熟知的分离早衰素组分和其相关蛋白或其它化合物的技术是用 抗体直接免疫沉淀。已经用该方法例如成功地分离了许多突触小泡相关的 蛋白(Phizicky and Fields,1994)。因此,可以在允许结合的条件下,在 溶液中将正常或突变体、游离或膜结合的早衰素组分与候选化合物混合, 然后免疫沉淀所述早衰素组分,然后用上述标准技术鉴定与早衰素组分共 免疫沉淀的蛋白或其它化合物。用于免疫沉淀的主要技术见于例如Harlow and Lane,(1988)抗体:实验室手册,冷泉港出版社,冷泉港,纽约。
在该试验中所用的抗体(如本文所述和可得到的)可以是多克隆或单 克隆的,并包括不同的抗体片段(如Fab,F(ab’)2)以及单链抗体等。
C生物分子相互作用试验
另一种用于检测并分离结合蛋白的方法是由Pharmacia Biosensor开发 并在制造商(LKB Pharmacia,Sweden)方法中描述的生物分子相互作用 试验或“BIAcore”系统。根据本发明公开,本领域专业人员可以使用该 系统或基本等同物以鉴定具有早衰素结合能力的蛋白或其它化合物。 BIAcore系统使用亲和纯化的抗-GST抗体以便将GST-融合蛋白固定在传 感器芯片上。显然,可用其它融合蛋白或相应的抗体代替。所述传感器利 用作为光学现象的表面胞质团共振,可检测折射指数的变化。使所需组织 的匀浆物从上面经过固定的融合蛋白,蛋白-蛋白相互作用被记录为指数系 数的变化。可以用该系统确定结合动力学并评估然后观测到的结合作用是 否是生理学相关的。
D酵母双杂交系统
酵母“双杂交”系统利用了由两个物理上分开的、功能结构域(Phizicky and Fields,1994)组成的转录因子。最常用的是酵母GAL4转录激活因子, 它由DNA结合结构域和转录激活结构域组成。用两种不同的克隆载体产 生GAL4与编码潜在结合蛋白的基因融合的不同融合蛋白。所述融合蛋白 被共表达,导向到核中,如果发生相互作用,报道基因(如LacZ)的基因 就会产生可检测的表型。例如,可将Clontech  Matchmaker系统-2可与含 早衰素-GAL4结合结构域融合克隆的Clontech脑cDNA GAL4激活结构域 融合蛋白文库(Clontech,Palo Alto,CA)一起使用。根据本文的公开, 本领域专业人员现在可以生产各种早衰素融合蛋白,包括含有早衰素蛋白 的正常或突变体功能结构域的融合蛋白,以及筛选所述融合蛋白文库以鉴 定早衰素结合蛋白。
E其它方法
可将核苷酸序列和蛋白产物(包括这些核酸和其对应蛋白的突变体和 正常形式)与上述技术一起使用以分离其它相互作用的蛋白,并鉴定其表 达受正常早衰素序列过表达、正常早衰素序列表达不足或突变早衰素序列 表达影响的其它基因。鉴定这些相互作用的蛋白以及鉴定不论在何种突变 早衰素序列(例如)的情况下,其表达水平将被改变的其它基因,可鉴定 出其临床或病理学形式与所述疾病的致病机制直接相关的其它基因靶。具 体地说,可鉴定其本身是导致早老性痴呆病的其它突变位点,或本身可以 被治疗导向(如将其表达水平降到正常水平或药物学上可阻断其过表达作 用的水平)以作为这种病的潜在治疗方法的其它基因。具体地说,这些技 术依赖于PCR为基础的和/或杂交为基础的方法,以鉴定在两种不同条件 下差别表达的基因(表达正常早衰素的细胞系与表达突变早衰素序列的相 同类型的细胞相比)、这些技术包括示差显示、基因表达的系列分析 (SAGE)和蛋白2D-凝胶质谱和扣除杂交(参见Nowak,1995,和Kann, 1995)。
对于本领域专业人员显而易见的是,有许多筛选个体蛋白或其它化合 物,以及蛋白或其它化合物文库的方法(如噬菌体展示文库和来自 Stratagene,La Jolla,CA的克隆系统),从而可鉴定与正常或突变早衰素组 分结合的分子。所有这些方法均包括如下步骤:将正常或突变早衰素蛋白、 融合蛋白或片段与待测化合物混合,然后激活(如果需要的话),接着检 测结合的复合物。所有这些方法现在通过本发明公开的基本纯的早衰素、 基本纯的早衰素功能结构域片段、早衰素融合蛋白、早衰素抗体和制备和 使用它们的方法均是可实施的。
8鉴定调节早衰素活性的化合物的方法
在另一系列的实施方案中,本发明提供了鉴定化合物的方法,所述化 合物具有调节正常和突变早衰素的活性的能力。就所述系列实施方案所用 的,术语“活性”广义地包括基因和蛋白表达、早衰素蛋白翻译后加工、 运输和定位、以及任何功能活性(如酶促、受体-效应物、结合和通道), 以及任何这些的下游作用。早衰素可能是正常与内质网和/或高尔基体有关 的膜内在蛋白,而且可能有与APP转运和运输和/或调节细胞内钙水平有关 的功能。另外,已知早衰素突变与Aβ肽生产的增加、淀粉样斑的出现以 及神经纤维原缠结、认识功能降低和编程性(apoptitic)细胞死亡有关。 因此,利用本发明的转化细胞和转基因动物模型、从携带突变早衰素基因 的受试者得到的细胞或携带天然早衰素突变的动物或人类受试者,现在通 过检测一种或多种正常或突变早衰素表达的这些功能特征或表型的变化可 以筛选有治疗作用的候选药物和治疗方法。
因此,本发明提供了通过体内或体外将细胞与候选化合物接触,然后 检测与正常或突变早衰素活性相关的标记的变化,从而来筛选或检测调节 早衰素活性的蛋白、小分子或其它化合物的方法。与早衰素活性相关的标 记可以是任何可测量的与早衰素表达有关的生物化学、生理学、组织学和 或行为特征。具体地说,有用的标记包括任何可测量的生物化学、生理学、 组织学和/或行为特征,所述特征可将携带至少一种突变早衰素基因的细 胞、组织、动物或个体与其正常对应物区别开。另外,所述标记可以是任 何早衰素活性的特异性或非特异性测量结果。所述早衰素特异性测量结果 包括可用本发明核酸探针或抗体的早衰素表达的测量结果(如早衰素 mRNA或蛋白水平)。非特异性测量结果包括细胞生理学方面的变化,如 pH、细胞内钙、环AMP水平、GTP/GDP比率磷脂酰肌醇活性、蛋白磷 酸化等,可用仪器如Cytosensor microphysiometer(Molecular Devices Inc., United States)监测。通过检测其它基因表达的变化,也可以监测在其突变 体或正常形式中,早衰素活性的激活或抑制,所述其它基因是导致早老性 痴呆病的早衰素代谢途径特异性的。这些可通过如示差显示、示差杂交和 SAGE(基因表达的系列分析)、以及细胞溶解产物的2D凝胶电泳来监测 在各种情况下,通过在应用候选化合物之前和其后的情况,通过相同的研 究观察可确定表达水平不同的基因。此外,如在另外一处所述的,通过克 隆、核苷酸测序、氨基酸测序或质谱(参见Nowak,1995)可确定其表达 受候选化合物调节的具体基因。
总之,可将细胞与候选化合物接触,然后在适宜的时间后(如培养细 胞有最大生物化学测量结果的0-72小时),检测早衰素活性的标记,然 后与基值进行比较。所述基值在将细胞与候选化合物接触前测量或可以是 用其它试验确定的或本领域已知的外部基值。所述细胞可以是本发明的转 化细胞或来自动物或个体的外植物。具体地说,所述细胞可以是来自早衰 素突变携带者(如患早老性痴呆病的人患者)或本发明动物模型(携带突 变早衰素基因的转基因线虫或小鼠)的外植物。为了增强早衰素突变对Aβ 肽途径的影响,可用Aβ肽生产提高的转基因细胞或动物。优选细胞包括 来自神经组织如神经元、神经胶质或混合细胞培养物的细胞;和培养的成 纤维细胞、肝、肾、脾或骨髓的细胞。可将所述细胞在培养中体外与候选 化合物接触,或体内施用给活动物或人类受试者。对于给活动物或人类受 试者,可口服或通过任何适合于所述化合物的胃肠道外途径施用待测化合 物。对于人类受试者的临床试验,可在数月或数年内定期完成测量(如每 天、每周或每月)。
由于大部分早衰素突变的携带者均是杂合的(即携带一个正常的和一 个突变早衰素等位基因),所以可检测化合物调节正常以及突变早衰素活 性的能力,因此例如,提高正常早衰素功能的化合物可具有治疗早衰素相 关疾病如早老性痴呆病的效用。另外,由于在杂合个体中抑制同时正常和 突变早衰素的活性比相关疾病的发展的临床危害更小,因此,需要鉴定失 活或抑制所有形式早衰素的化合物。但优选,鉴定选择性或特异性失活或 抑制突变早衰素活性,而不破坏正常早衰素基因或蛋白的功能的化合物。
根据鉴定方法、表征和本文公开的早衰素基因和蛋白、早衰素核酸探 针和抗体、本发明的早衰素转化的细胞和转基因动物,本领域专业人员现 在可以完成许多检测候选化合物调节早衰素活性的试验。下文将详细讨论 特别优选和完成的实施方案。
A早衰素表达
在一系列实施方案中,用早衰素表达的具体测量结果筛选具有影响早 衰素活性的能力的候选化合物。因此,利用本文公开并可得到的早衰素核 酸和抗体,人们可以用mRNA水平或蛋白水平作为候选化合物调节早衰素 活性的能力的指标,用所述探针和抗体测量基因和蛋白的表达是本领域熟 知的,而且本文将另外讨论。特别令人感兴趣的是鉴定可改变早衰素不同 剪接变体的相对水平的化合物。许多例如与早老性痴呆病有关的早衰素突 变均位于推定的TM6→7环区域,所述环区域在某些外周组织(如白细胞) 中会发生剪接改变,因此可提高所述剪接过程的相对频率的化合物在预防 该区域突变的表达方面是有效的。
B细胞内定位
在另一系列的实施方案中,以其对早衰素原始和细胞内定位的作用为 基础,根据其调节早衰素活性的能力筛选化合物。用免疫细胞化学发现早 衰素定位于与内质网和高尔基体有关的膜结构中,而一种早衰素突变体 (H163R),但不是其它的,在未知功能的小胞质泡囊中可观察到。因此, 突变体和正常早衰素的定位差异可能说明了早衰素相关疾病的病因。可以 用本领域已知的标准技术检测早衰素的位置。通常这些技术施用本发明的 抗体,特别是选择性结合一种或多种突变早衰素,但不结合正常早衰素的 抗体。如本领域熟知的,可用任何不同的技术(如荧光或放射性标记、标 记的二级抗体、亲和素-生物素等)标记所述抗体以有助于肉眼观察所述早 衰素在细胞内的位置。如本领域已知的,用抗那些结构标记(如用于高尔 基体的TGN38,用于后-高尔基体运输小泡的运蛋白受体,用于脂质体 的LAMP2)的抗体可将早衰素其定位到特定的结构上,也可使用用于富 集不同细胞内膜结合细胞器(如脂质体、突触小体、高尔基体)的、来自 细胞溶解产物的纯化级分的Western印迹。另外,例如用电子显微镜和抗 所述结构域的抗体可检测跨细胞结构域的早衰素的不同结构域的相对方 向。
B离子调节/代谢
在另一系列的实施方案中,可以细胞内Ca2+、Na+、或K+水平或代谢 为基础,根据其调节早衰素活性的能力来筛选化合物。如上所述,早衰素 是可作用或相互作用于离子受体或离子通道的膜相关蛋白。因此,用膜片 钳、电压钳和对细胞内钙或跨膜电压敏感的荧光染料,通过测量离子通道 流量和/或跨膜电压或现流量,可根据其体内或体外调节早衰素相关钙或其 它离子代谢的能力来筛选化合物。也可通过测量二级信使如环AMP、 cGMP酪氨酸激酶、磷酸盐的激活,细胞内Ca2+水平的增加等也可检测离 子通道或受体功能。也可在人工膜系统中重建重组制备的蛋白以研究离子 通道传导,因此在所述研究中所用的细胞可含有人工膜或细胞。对表达内 源正常或突变早衰素的培养细胞可检测其离子调节或代谢方面的变化。可 对用载体转染的细胞完成所述研究,所述载体能够表达正常或突变体形式 的早衰素之一或早衰素之一的功能结构域。另外,为了在所述检测中增加 测量到的信号,可用编码通道蛋白的基因共转染细胞。例如可用正常或突 变早衰素序列和编码大鼠脑Na+β1亚单位、兔骨骼肌Ca2+β1亚单位、或大 鼠心K+β1亚单位的序列共转染非洲爪蟾属卵母细胞或大鼠肾细胞 (HEK293)。通过卵母细胞中2-微电极电压钳记录值或HEK293细胞中 的全细胞膜片钳记录值,可测量早衰素相关或早衰素介导的离子通道活性 方面的变化。
C细胞凋亡或细胞死亡
在另一系列的实施方案中,以其对早衰素相关或早衰素介导的细胞凋 亡或细胞死亡的作用为基础,根据其调节早衰素活性的能力筛选化合物。 因此,例如在培养基中确定细胞的细胞凋亡或细胞死亡基础速率,或在动 物模型或人类受试者尸体解剖后确定在特定年龄神经元损失的基础程度, 从而测量抑制细胞凋亡或细胞死亡的候选化合物的能力。通过标准显微镜 技术(如光学显微镜)可测量细胞死亡,或通过核形态学特征或产生核小 体的DNA片段图谱更特异性地测量细胞凋亡(参见如,Gavrieli等, 1992;Jacobson等,1993;Vito等,1996)。也可用TUNEL评估脑中 的细胞死亡(参见例如Lassmann等,1995)。在优选的实施方案中,根 据其在本发明转基因动物模型中抑制神经元损失的能力筛选化合物。例如 可用携带突变体人突变体小鼠或人源化突变体基因的转基因小鼠鉴定或评 估延迟或抑制了与早老性痴呆病相关的神经变性的化合物。最近有Games 等(1995)报道了携带突变体APP基因的相似的转基因小鼠模型。
D  Aβ肽生产
在另一系列的实施方案中,根据其在APP加工中,其调节早衰素相关 或早衰素介导之变化的能力来筛选化合物。在因APP加工中的差异而产生 的数个异构体中生产了Aβ肽。Aβ肽是βAPP的一个39-43个氨基酸的 衍生物,它在扩散的衰老斑和AD患者的血管中进行性沉积。在人脑中, Aβ肽在N-和C-末端均是异种的。但一些观察结果表明在残基42或43 终止的长尾Aβ肽(即Aβ1-42/43和Aβx-42/43)的截断形式在AD中比在 残基40终止的肽具有更重要的作用。因此,Aβ1-42/43和Aβx-42/43是衰 老斑和扩散斑早期的显著特征,而在残基40终止的肽(即Aβ1-40和 Aβx-40)与成熟斑(mature plaque)的亚型和淀粉样血管显著相关(参见如 Iwatsubo等,1995;Gravina等,1995;Tamaoka等,1995;Podlisny 等,1995)。此外,所述长末端异构体更倾向于原纤维形成,而且认为比 其Aβ1-40肽有更大神经毒性(Pike等,1993;Hilbich等,1991)。最 后,在与早期发作FAD有关的βAPP基因的密码子717所发生的错义突变 会导致在突变携带者的脑中,以及在患有了和症状发生前的携带者的外周 细胞和血浆中,在用βAPP717突变体cDNA转染的细胞系(Tamaoka等 1994;Suzuki等1994)中生产过量长尾Aβ。如下文实施例18所述,我 们现公开了长Aβ肽形式生产的增加也与早衰素基因中的突变有关。
因此,在一系列的实施方案中,本发明提供了根据其阻断或抑制表达 突变早衰素基因的细胞或转基因动物中Aβ肽长异构体生产增加的能力来 筛选候选化合物的方法。具体地说,本发明提供了所述方法,其中用本文 公开的方法转化的培养的哺乳动物细胞(如脑细胞或成纤维细胞),或其 中用本文公开的方法生产的转基因动物表达相对高水平的突变早衰素。按 需要,也可转化所述细胞或转基因动物以便以相对高的水平表达正常形式 的βAPP蛋白。
在所述系列的实施方案中,将候选化合物施用给所述细胞系或转基因 动物(如通过加到培养中的细胞培养基中;或通过口服或胃肠道外施用于 动物),然后在适宜的时间后(如细胞培养0-72小时,对于动物模型来 说是数天或数月),收集生物样品(如来自培养细胞的细胞培养上清液或 细胞溶解产物;来自动物的组织匀浆物或血浆),然后检测Aβ肽长异构 体的水平。可以以绝对的意义(如nMol/ml)或以相对意义(如长与短Aβ 肽异构体的比率)来确定所述肽的水平。用本领域已知的任何方法(如电 泳分离和测序)均可检测所述Aβ肽异构体,但优选用对长异构体有特异 性的抗体来确定绝对或相对水平的Aβ1-42/43或Aβx-42/43肽。特别是在 本发明的转基因动物模型中,可降低这些长Aβ肽异构体的绝对或相对水 平的候选药物或治疗方法在治疗早老性痴呆病或因早衰素突变或APP代谢 异常而引起的其它疾病中可能有治疗效用。
E微小管相关蛋白的磷酸化
在另一系列的实施方案中,通过评估所述化合物对微小管相关蛋白 (MAP,如Tau)磷酸化水平的影响,根据其调节早衰素活性的能力来 筛选候选化合物。在早老性痴呆病患者脑中,Tau和其它MAP的异常磷 酸化是本领域熟知的。因此,预防或抑制MAP异常磷酸化的化合物可在 治疗早衰素相关疾病如AD方面有效用。如上所述,可以使用来自正常或 突变体动物或受试者的细胞,或本发明的转化细胞系和动物模型。优选的 检测方法将使用用突变体人或人源化突变早衰素基因转化的细胞系或动物 模型。可确定在这些细胞中MAP的基础磷酸化状态,然后根据其预防、 抑制或逆转与突变体相关的超磷酸化作用的能力来试验候选化合物。通过 本领域已知的任何标准方法,可确定MAP的磷酸化状态,但优选使用选 择性结合磷酸化的或非磷酸化表位的抗体。抗Tau蛋白磷酸化表位的所述 抗体是本领域已知的(如ALZ50)。
9筛选并诊断早老性痴呆病
A一般的诊断方法
将本文公开或可得到的早衰素基因和基因产物,以及早衰素衍生的探 针、引物和抗体用于筛选与早老性痴呆病有关的等位基因的携带者,用于 诊断早老性痴呆病患者,以及用于筛选并诊断相关的早老和早老性痴呆、 精神病如精神分裂症和抑郁症,以及神经性病如中风和大脑出血,所有这 些症状都或多或少地出现在携带PS1或PS2基因或APP基因突变的人体 中。通过各种技术,用探针检测是否存在突变早衰素基因或蛋白就可常规 筛选有患早老性痴呆病危险的个体,如在家族系谱中有AD的那些,或以 前不知有此种危险的个体。通过以本文公开并可得到的核酸(包括基因组 和mRNA/cDNA序列)、蛋白和/或抗体为基础的方法,包括设计用来检测 正常早衰素活性衰竭或增强和/或是否存在由突变早衰素所赋予的特并性 新活性的功能检测方法,可诊断这些病的遗传病例。优选,所述方法和产 物是以人PS1或PS2核酸、蛋白或抗体(如本文公开或可得到的)为基础。 但对于本领域专业人员显而易见的是,甚至象人、小鼠、C.elegans和果蝇 这样各不相同的物种中,大部分PS1和PS2核苷酸和氨基酸序列具有明显 的进化保守性,使得本领域专业人员可利用所述非人早衰素同系物核酸、 蛋白和抗体,甚至直接应用到人或其它动物。因此,为了简短解释,但又 不限制本发明的范围,下列描述将集中于人PS1和PS2同系物的用途。但 应理解,来自其它种的同系物,包括本文公开的,对于许多目的来说是等 同的。
本领域专业人员可以理解,本发明诊断方法的选择会受到可得到的待 检生物样品性质和所需信息的性质的影响。例如PS1在脑组织中高水平表 达,但脑活检是侵害性的,而且昂贵的过程,特别是对于常规筛选来说。 但以显著高的水平表达PS1的其它组织可能有剪接改变(如淋巴细胞), 因此,来自所述细胞的PS1或蛋白可提供的资料较少。因此,以受试者的 基因组PS1 DNA为基础的检测是优选的,因为资料不依赖于剪接改变,而 且基本上任何成核细胞均可提供可以使用的样品。以其它早衰素(如hPS2, mPS1)为基础的诊断也要考虑相似的问题:组织的可获得性、在不同组 织中的表达水平以及因剪接改变而引起的不同的mRNA和蛋白产物。
B以蛋白为基础的筛选和诊断
当诊断是以早衰素蛋白为基础时,可以使用不同的方法。例如,通过 监测正常和突变体蛋白在电泳迁移率方面的差异,可进行诊断。所述方法 在鉴定突变体方面是特别有用的,在所述突变体中存在电荷取代,或其中 插入、缺失或取代导致所得蛋白的电泳迁移有显著的变化。另外,诊断可 以以正常和突变体蛋白蛋白水解图谱方面的差异、不同氨基酸残基摩尔比 方面的差异为基础,或通过说明基因产物功能发生改变的功能检测。
在优选的实施方案中,以蛋白为基础的诊断要利用抗体与正常和突变 早衰素蛋白(特别是hPS1或hPS2)结合能力方面的差异。所述诊断试验 可利用结合正常蛋白,但不结合突变体蛋白的抗体,或反之。特别是,可 使用多个单克隆抗体的检测,其中每个单克隆抗体均能结合突变体表位。 将抗突变体抗体在得自受试者的样品中的结合水平(通过例如放射性标 记、ELISA或化学发光肉眼观察)与结合对照样品的水平进行比较。另外, 可使用结合正常而不是突变早衰素的抗体,可以利用抗体结合水平的降低 将纯合正常个体与突变体杂合或纯合个体区别开。利用死前或尸检后得到 的CNS组织活检样品,所述抗体诊断可用于原位免疫组织化学,包括与这 些疾病如神经纤维原缠结和淀粉样斑相关的神经病理学结构,或可与液体 样品如脑脊液或外周组织如白细胞一起使用。
C以核酸为基础的筛选和诊断
当诊断试验是以来自样品的核酸为基础时,检测是以mRNA、cDNA 或基因组DNA为基础的。当使用来自样品的mRNA时,许多有关源组织 和剪接改变的可能性的考虑都适用。即,很少或没有表达转录本,除非选 择了或可得到适宜的组织源,剪接改变会使有些信息丢失或很难解释。但 我们已经表明(Sherrington等,1995;Rogaev,1995)在从白细胞和/或 皮肤成纤维细胞分离的mRNA/cDNA中,可以鉴定在PS1和PS2的 5’UTR、3’UTR、开放阅读框架和剪接位点中的突变。无论是检测 mRNA、cDNA还是基因组DNA,可以用本领域熟知的方法原位或体外 检测是否存在特定的序列(参见例如,Sambrook等,(1989)分子克隆:实 验室手册,第2版,冷泉港出版社,冷泉港,纽约)。但一般来说,可以 检测含有成核细胞的任何组织。
用于诊断的基因组DNA可从体细胞如血液中存在的那些、组织活检、 外科手术样品或尸检材料中得到。DNA可以分离并直接用于检测特定的 序列或在分析前通过聚合酶链反应(PCR)扩增。同样,也可以用RNA 或cDNA,可以用或不用PCR扩增。为了检测特异性核酸序列,可以使用 直接核苷酸测序、利用特异性寡核苷酸的杂交、限制酶消化和作图、PCR 作图、RNase保护以及各种其它方法。可以化学合成并放射性或非放射性 标记(如生物素标记、溴乙锭)特定序列特异性的寡核苷酸,然后与固定 在膜或其它固体支持物上的个体样品杂交(例如,通过点印迹或在电泳后 从凝胶中转移),或在溶液中杂交。然后用例如放射自显影、荧光测定法 或比色法肉眼观察是否存在靶序列。用高密度固定片上的已知序列的、 丰富的短寡核苷酸自动完成这些过程。
(1)适宜的探针和引物
无论是杂交、RNase保护、连接酶-介导的检测、PCR扩增还是本文 所述的且本领域熟知的任何其它标准方法,本文公开或可得到的各种早衰 素序列的亚序列均可用作探针和/或引物,这些序列或亚序列包括正常的早 衰素序列和有害的突变体序列。总之,有用的序列包括来自早衰素内含子、 外显子或内含子/外显子边界的至少8-9,更优选10-50,最佳为18 -24个连续核苷酸。根据靶序列、所需的特异性以及未来技术的发展,较 短的序列也可能有效用。因此,认为用于分离、克隆、扩增、鉴定或操作 早衰素序列的任何早衰素衍生的序列均可作为适宜的探针或引物。认为特 别有用的是包括来自其中已知存在致病突变的早衰素基因的核苷酸位置的 序列,或这些位置侧翼的序列。
(a)PS1探针和引物
如上所述,在人PS1基因中已鉴定了不同的致病突变。用从正常或突 变体PS1基因衍生的分离的核酸探针或引物,现在可以检测这些和其它PS1 突变。特别有用的是衍生于编码N-末端、TM1-TM2区和TM6-TM7 区的序列的探针或引物。但如上所述,已经检测到影响PS1蛋白其它区的 突变,而且用本文公开的方法,肯定可以检测到。因此本发明提供了对应 于PS1基因任何部分(包括内含子和5’及3’UTR)的正常和突变序列的分 离的核酸探针和引物,可以表明所述部分与早老性痴呆病的发展有关。
仅作为实例,而不是限制本发明,在筛选和诊断方法中可以使用从 C410Y周围hPS1 DNA片段衍生的探针和引物。所述突变至少在某些个体 中,是因SEQ ID NO:1位置1477中的A取代G而引起的。因此,用包 括该潜在突变位点的寡核苷酸探针或引物可以筛选来自个体外周血样品的 基因组DNA、mRNA或cDNA。对于该突变的杂交探针,可以使用跨该 突变位点(如SEQ ID N0:1的bp 1467-1487)的8-50,更优选18- 24个碱基的探针。如果与mRNA一起使用所述探针,当然所述探针应当与 mRNA互补,而且因此,对应于PS1基因的非编码链。若探针与基因组 DNA或cDNA一起使用,则探针可与任何一条链互补。为了用PCR方法 检测包含所述突变的序列,适宜的引物应包括衍生于突变两侧任一侧区域 的8-50,优选18-24个核苷酸长的序列,而且对应于1-1000bp, 但优选1-200bp的任何位置,从中除去了突变位点。是突变位点5’(在 编码链上)的PCR引物应对应PS1基因编码链的序列,而是突变位点3’ (在编码链上)的PCR引物应对应非编码链或反义链(如对应于SEQ ID NO:1的bp 1451-1468的5’引物,和对应于SEQ ID NO:14的719- 699补体的3’引物)。
对于其它PS1突变或一般的突变“热点”,可选择相似的引物。例如, M146L突变(在bp 684A→C)的5’PCR引物可含有对应于SEQ ID NO: 1的约bp 601-620的序列,而3’引物可对应于SEQ ID NO:8的约 bp1328-1309的补体。应注意该实施例使用了来自内含子和外显子两方面的 序列。而另一实施例,A246E突变(在bp985C→A)的适宜5’引物可含 有对应于SEQ ID NO:1约bp 907-925序列,或对应于SEQ ID NO:1 约bp 1010-990的补体的3引物序列。作为另一实施例,H163R突变 (SEQ ID NO:1的bp736或SEQ ID NO:9的bp 419 A→G)的5’引 物含有对应于SEQ ID NO:  9约bp354-375的序列,而3’引物对应于约 bp 581-559的补体。相似的,也可以使用内含子或外显子序列,例如生产 L286V突变(SEQ ID NO:1的bp 1104或SEQ ID NO:11的bp 398 C→G)的5’引物含有对应于SEQ ID NO:11约bp 249-268或SEQ ID NO:1约bp1020-1039的序列,而3’引物对应于SEQ ID NO:11约 bp510-491的补体。
还应注意,探针和引物可包括特定突变的核苷酸。因此,例如可生产 C410Y突变的含有对应于SEQ ID NO:1约bp 1468-1486的序列的杂交 探针或5’引物以筛选或扩增正常的等位基因,或对应于相同序列但bp 1477 改变了的(G→T)的探针或引物以筛选或扩增突变体等位基因。
(b)PS2探针和引物
上述对PS1探针和引物的相同的总考虑也适用PS2的探针和引物。特 别是,所述探针或引物可对应于内含子、外显子或内含子/外显子边界序 列,可对应于来自编码或非编码(反义)链的序列,而且可对应于正常或 突变体序列。
仅仅作为实施例,用对应于SEQ ID NO:18约bp 733-751的5’引物 和对应于SEQ ID NO:18约bp 846-829的3’引物,通过PCR扩增周围的 DNA片段可以筛选PS1 N141I突变。相似的,M239V突变(在bp 1080 A→G)的5’引物可含有对应于约bp 1009-1026的序列,而3’引物可对应 于SEQ ID NO: 18约bp 1118-1101的补体。作为另一实施例,用对应于 SEQ ID NO:18约bp 1576-1593的5’引物和对应于SEQ ID NO:18约 bp1721-1701补体的3’引物,通过PCR扩增基因组DNA,可以筛选I420T 突变周围区域的编码序列。例如然后可用野生型(如SEQ ID NO:18的 bp 1616-1632)和/或突变体(SEQ ID NO:18的bp1616-1632,在bp1624 T→C)序列的等位基因特异性寡核苷酸可检测该产物。
(2)杂交筛选
为了原位检测正常或突变体PS1、PS2或其它早衰素相关的核酸序 列,用标准技术可制备组织样品,然后与一种或多种上述探针接触,优选 的是标记的探针以便于检测,在只允许探针与高度或精确互补序列杂交的 严谨条件下,完成核酸杂交试验。由于到目前为止,大部分检测的PS1和 PS2突变是单核苷酸取代,因此需要高度严谨的杂交条件来将正常序列与 大多数的突变序列区别开。当已知受试者的早衰素基因型时,可选择相应 的探针。另外,可连续或组合使用针对不同突变体的探针。由于携带早衰 素突变体的个体是杂合的,也可使用正常序列的探针,通过结合量(如通 过放射性信号的密度)可将纯合正常个体与突变杂合体区别开。在另一种 改变中,在同时使用正常和突变体探针,但只标记了一种的情况下,可以 使用竞争性结合试验。
(3)限制酶切作图
序列改变还产生或破坏了偶然的限制识别位点,所述位点是通过使用 适宜的酶消化,然后凝胶印迹杂交而揭示的。通过其大小的增加或减少, 或通过增加或减少了相应的限制片段数,可检测携带所述位点(正常或突 变体)的DNA片段。可以与基因组DNA、mRNA或cDNA一起使用所述 限制片段长度多态性分析(RFLP)或限制酶切作图。在限制酶切前,用 上述引物,通过PCR可扩增早衰素序列,其中PCR产物长度可表明是否 存在特定限制位点,和/或在扩增后可进行限制酶切。通过任何常规方法(如 在存在溴乙锭时,在UV光下)肉眼观察早衰素片段。
仅仅作为实施例,应注意PS1 M146L突变(SEQ ID NO:1 bp684A→C)破坏了PsphI位点;H163R突变(bp736A→G)破坏了NlaIII 位点;A246E突变(bp 985C→A)产生了DdeI位点;L286V突变(bp 1104C→G)产生了PvuIII位点。以本文公开并可得到的正常和突变体序 列为基础,本领域专业人员很容易从众多市售限制酶中进行选择,完成限 制酶切作图分析以检测任何早衰素的突变。
(4)PCR作图
在另一系列的实施方案中,以PCR产物长度或PCR生产中的差异为 基础,可以检测单个碱基取代突变。因此,可以用跨突变位点或优选在突 变位点有3’末端的引物扩增来自受试者基因组DNA、mRNA或cDNA的 样品。预期在突变位点的错配以改变正常或突变体引物促进聚合酶链反应 的能力,由此产生正常与杂合和/或纯合早衰素突变体之间不同的产物图。 通过标准技术,如聚丙烯酰胺或琼脂糖凝胶电泳并用标记的探针肉眼观 察、溴乙锭等可以有区别地分离并检测正常和突变体基因的PCR产物。由 于可能产生非特异性引发或突变位点的连读,以及大部分突变体等位基因 的携带者均是杂合的,所以所述技术的能力可能不够。
(5)电泳迁移率
以DNA序列差异为基础的遗传试验也可以通过检测DNA、mRNA或 cDNA片段在凝胶中迁移率的改变来完成。通过单或双链DNA的高分辨凝 胶电泳或DNA异源双链在非变性凝胶电泳中迁移图谱的变化,可以肉眼 观察例如小序列缺失和插入。由于与mRNA或单链DNA二级结构相关的 单链构象多态性(SSCP),也可以用研究迁移率变动的方法来检测早衰 素突变或多态性。
(6)错配的化学裂解
利用错配的化学裂解(CCM)方法(参见例如Saleeba and Cotton,1993, 和其中的参考文献),也可以检测早衰素中的突变。用该技术,可将探针 (可达~1kb)与来自受试者的基因组DNA、cDNA或mRNA样品混合。 将样品和探针混合,然后放在可形成异源双链的条件下(如果需要的话)。 优选探针和样品核酸均是双链的,或将探针和样品一起经PCR扩增以确保 严生所有可能的错配异源双链。错配的T残基是四氧化锇反应性的,而错 配的C残基是羟胺反应性的。由于每个错配的A都伴有错配的T,每个错 配的G均伴有错配的C,探针和样品之间的任何核苷酸差异(包括小插入 或缺失)均会导致形成至少一个反应性异源双链。在用四氧化锇和/或羟胺 处理以修饰任何错配位点后,通过例如与哌啶反应,在任何修饰的错配位 点对混合物进行化学裂解。然后用标准技术如凝胶电泳分析混合物以检测 说明探针和样品之间错配的裂解产物。
(7)其它方法
以本文公开并可得到的早衰素序列为基础,检测早衰素突变的各种其 它方法对于本领域专业人员来说是显而易见的。根据本发明,任何这些技 术均是可以使用的。这些包括,但不限于核酸酶保护试验(S1或连接酶介 导的)、连接的PCR、变性梯度凝胶电泳(DGGE;残基例如Fischer and Lerman,1983)、与SSCP结合的限制核酸内切酶指纹法(REF-SSCP; 参见,Liu and Sommer,1995)等。
D其它筛选和诊断方法
由于疾病状态,在遗传病例的情况下,作为原发性疾病,和在非遗传 病例作为继发性疾病,可能会发生PS1、PS2、APP或与PS1、PS2或 APP反应的蛋白的异常加工。在身体组织或体液(如CSF或血液)中,可 检测为异常磷酸化、糖基化、糖化酰胺化或蛋白水解裂解产物。
通过观察在早衰素转录、翻译和翻译后修饰和加工中的改变以及在脑 和外周细胞中,早衰素基因细胞内和细胞外运输方面的改变也可以完成诊 断。所述改变包括早衰素信使RNA和/或蛋白数量分变化、磷酸化状态的 变化、异常细胞内定位/分布、异常细胞外分布等。所述试验包括:Northern 印迹(用早衰素特异性和非特异性核苷酸探针)、Western印迹和酶联免 疫测定(ELISA)(用早衰素或早衰素功能结构域特异性的抗体,包括各 种翻译后修饰状态,包括糖基化和磷酸化异构体)。可以对外周组织(如 血液细胞、血浆、培养的和其它成纤维细胞组织等)以及死前或尸检后得 到的CNS组织的活检以及脑脊液完成这些试验。所述试验也可包括原位杂 交和免疫组织化学(以便将信使RNA和蛋白定位于特定的亚细胞区室和/ 或与这些疾病如神经纤维原缠结和淀粉样斑相关的脑病理学结构内)。
E筛选和诊断试剂盒
根据本发明,还提供了诊断试剂盒,所述试剂盒包括市售诊断筛选所 必需的试剂。例如可提供包括抗体或多组抗体的试剂盒,所述抗体是一种 或多种突变体表位特异性的。特别是可用有利于肉眼观察结合的任何标准 方法标记这些抗体。另外,可提供其中含有寡核苷酸探针或PCR引物的试 剂盒,所述探针或引物用于检测和/或扩增突变体PS1、PS2或其它早衰素 相关核苷酸序列。此外,可以标记所述探针以便更容易检测特异性增加。 为了适用于上述各种诊断实施方案,可将在所述试剂盒中的寡核苷酸探针 或抗体固定在底物上,然后可提供适宜的对照。
10治疗方法
本发明现在提供了治疗因早衰素中的突变而引起的或可能被引起的疾 病的基础。如上所详细描述的,在hPS1和hPS2中的突变与早期发作的早 老性痴呆病的发展有关,因此,本发明特别涉及治疗诊断患有或有可能发 展早老性痴呆病的受试者的方法。但从PS1和PS2基因在各种组织中的表 达来看,很可能在这些座位上突变的影响应不限于脑,因此可能是除早老 性痴呆病以外的疾病的病因。因此,本发明还涉及早衰素基因和基因产物 中的突变、错表达、错代谢或其它遗传或获得性改变而引起的其它组织中 的疾病表现。另外,尽管早老性痴呆病表现为神经性疾病,但这种表现可 能是因早衰素中的突变引起的,所述突变首先影响其它器官组织(如肝), 然后释放出影响脑活性的因子,最终引起早老性痴呆病。因此,在考虑下 文所述的各种治疗方法中,应理解所述治疗可能是以脑以外的组织如心、 胎盘、肺、骨骼肌、肾和胰腺为靶的,而在这些组织中也表达PS1和/或 PS2。
不限于本发明的任何特定理论,与早衰素中突变相关的早老性痴呆病 的影响似乎是获得了新功能,或加速了正常功能,所述突变直接或间接引 起淀粉样前体蛋白(APP)不正常加工成Aβ肽,异常磷酸化体内稳定和/ 或脑中的异常细胞凋亡。所述的功能获得或功能加速模型与成年发作的症 状和早老性痴呆病的显性遗传一致。然而,尚未了解早衰素中突变可能产 生这些影响的机制。
已知APP可通过两种途径代谢。在第一种途径中,将APP传到高尔基 体网络,然后经包涵素包被的小泡进入分泌途径而进行代谢的。然后成熟 APP传到浆膜,在浆膜由α-secretase裂解以产生可溶的级分(Protease NexinII)加非淀粉样C-末端肽(Selkoe等,1995;Gandy等,1993)。 另外,成熟APP可进入核内体-脂质体途径,在该途径中,它要经β和γ- secretase裂解以产生Aβ肽。APP的Ap肽衍生物是神经毒性的(Selkoe 等,1994)。细胞的磷酸化状态确定了α-secretase(非产淀粉样)或Aβ 途径(产淀粉样途径)(Gandy等,1993)之间的相对平衡,而且通过佛 波醇酯、毒蕈碱激动剂和其它试剂可对所述磷酸化状态进行药物修饰。细 胞的磷酸化状态似乎是由作用于一种或多种高尔基体网络中的膜内在蛋白 的细胞溶质因子(特别是蛋白激酶C)而介导的。
不受本发明特定理论的任何限制,早衰素,特别是hPS1或hPS2(携 带蛋白激酶C的数个磷酸化共有序列)可能是膜内在蛋白,其磷酸化状态 确定了α-secretase与Aβ途径之间的相对平衡。因此PS1或PS2中的突变 会使其产物的结构和功能发生改变,从而导致与调节元件(如蛋白激酶C) 或与APP的相互作用出现问题,由此促进APP进入产淀粉样核内体-脂质 体途径。环境因素(如病毒、毒素或衰老)对PS1或PS2也有相似的影响。
同样不受本发明特定理论的任何限制,还应注意PS1和PS2蛋白都有 与人离子通道蛋白和受体基本同源的氨基酸序列。例如用Altschul等 (1990)的BLASTP范例,PS2蛋白与人钠通道α亚单位(E=0.18, P=0.16,在至少35个氨基酸残基的2个区内同一性=22-27%)基本同源。 其它疾病(如人中的恶性高热和高钾血性周期性瘫痪,以及C.elegans中的 机械性感觉神经元的变性)是由离子通道或受体蛋白中的突变而引起的。 因此PS1或PS2基因中的突变可能会影响相似的功能,并导致早老性痴呆 病和/或其它精神性和神经性疾病。
治疗早衰素相关疾病如AD的治疗方法是基于(1)施用正常PS1或 PS2蛋白,(2)用正常PS1或PS2进行基因治疗以补偿或取代突变基因, (3)以突变PS1或PS2基因的反义序列或“剔除”突变基因为基础的基 因治疗,(4)以编码阻断或改正PS1或PS2突变体有害作用的蛋白的序 列为基础的基因治疗,(5)以正常和/或突变体PS1或PS2蛋白的抗体 为基础的基因治疗,或(6)小分子(药物),它们改变PS1或PS2表达, 阻断PS1或PS2的突变体形式与其它蛋白或配体之间的异常相互作用,或 通过改变突变体蛋白的结构,通过增强其代谢清除或通过抑制其功能而阻 断突变体PS1或PS2的异常功能。
A蛋白治疗
通过用正常蛋白取代突变蛋白、通过调节突变蛋白的功能或通过提供 过量的正常蛋白以降低突变蛋白任何异常功能的影响,可以治疗早衰素相 关的早老性痴呆病或因早衰素突变而引起的其它疾病。
为了达到此目的,需要得到如本文所述和可得到的大量基本纯的PS1 蛋白或PS2蛋白,所述蛋白来自可表达所述蛋白的培养的细胞系统。用适 宜的包装或给药系统可将所述蛋白传递到患病的脑区或其它组织,包括如 通过脂质体介导而将蛋白传递到靶细胞。
B基因治疗
在一系列的实施方案中,可使用基因治疗,其中将正常拷贝的PS1基 因或PS2基因导入到患者体内以便在一种或多种不同类型的患病细胞中成 功地编码正常蛋白。必须将所述基因以可将其摄入并编码足够蛋白以通过 有效功能的形式传递到那些细胞中。因此,优选将重组基因与强启动子可 操作相连以便提供可补偿或out-compete突变体蛋白的高水平表达。如上所 述,重组构建体可含有内源或外源调节元件、可诱导或可阻遏调节元件或 组织特异性调节元件。
在另一系列的实施方案中,用重组构建体通过同源重组可用基因治疗 取代突变基因。重组构建体可含有正常拷贝的靶早衰素基因,其中在原位 更正缺陷或可含有导入终止密码子、错义突变或可消除突变基因功能的缺 失的“剔除”构建体。应注意在该方面,所述构建体在杂合个体中可同时 剔除正常和突变拷贝的靶早衰素基因,但总的早衰素基因功能的失去对个 体的不利影响比使所述疾病状态继续发展要小。
在另一系列的实施方案中,可以使用反义基因治疗。反义治疗的基础 是基因表述的序列特异性抑制可通过mRNA或DNA与互补反义链之间的 细胞内杂交而达到。然后杂种螺旋的形成会影响基因的转录和/或加工、运 输、靶早衰素mRNA的翻译和/或稳定性。反义治疗可利用各种方法,包 括施用反义寡核苷酸或反义寡核苷酸类似物(如具有硫代磷酸骨架的类似 物)或用反义RNA表达载体转染。另外,所述载体可包括外源或内源调节 区、可诱导或可阻遏调节元件、或组织特异性调节元件。
在另一系列的实施方案中,可以用基因治疗导入编码蛋白或肽的重组 构建体,所述蛋白或肽可阻断或更正因突变早衰素基因而引起的异常功 能。在一实施方案中,所述重组基因编码对应于早衰素突变结构域的肽, 发现所述突变结构域与另一细胞蛋白或其它细胞配体有不正常的相互作 用。因此,例如,如果发现突变体TM6→7结构域与特定细胞蛋白相互作 用,但相应的正常TM6→7结构域没有这种相互作用,则可用基因治疗提 供过量的与突变体蛋白竞争并抑制或阻断所述异常相互作用的突变体 TM6→7结构域。另外,用重组构建体可编码并表达与突变体有相互作用, 但与正常的早衰素没有相互作用的部分蛋白以便竞争,并由此抑制或阻断 不正常的相互作用。最后,在另一实施方案中,通过基因治疗,经插入第 二突变体蛋白,可获得相同的效果,所用的方法与在c.elegans中,通过插 入突变体转基因而更正“Degl(d)”和“Mec4(d)”突变的方法相似。
由于其可高效感染并可稳定的整合和表达,所以可以将反转录病毒载 体用于体细胞的基因治疗。但靶基因必须能够分裂,而且正常蛋白的表达 水平应很高,因为这种疾病是显性的。可将全长PS1或PS2基因,编码早 衰素的功能结构域或上述任何其它治疗肽的亚序列克隆到反转录病毒载体 中,从其内源启动子、从反转录病毒的长末端重复或从靶细胞(如神经元) 特异性的启动子开始转录。可以使用的其它病毒载体包括腺相关病毒、牛 痘病毒、牛乳头瘤病毒或疱疹病毒如EB病毒。
C免疫治疗
免疫治疗对于早老性痴呆病也是可行的。生产抗突变PS1或PS2(或 其部分)的抗体,然后施用给患者以结合或阻断突变体蛋白,并抑制其不 利的影响。同时,应促进正常蛋白产物的表达。另外,生产抗突变体或野 生型PS1或PS2与其相互作用配对物之间的特异性复合物的抗体。
另一种方法是刺激抗所需抗原的内源抗体的生产。给药应是以一次免 疫原制品或疫苗接种的形式。可将免疫原组合物制备成可注射制剂,制成 溶液或乳液。可将PS1或PS2蛋白或其它抗原与可药用与所述蛋白相容的 赋形剂混合。所述赋形剂可包括水、盐、右旋糖、甘油、乙醇和其组合。 免疫原组合物和疫苗还可含有附加物质如乳化剂或佐剂以增强效力。可通 过皮下或肌肉内注射胃肠道外施用免疫原组合物和疫苗。
以治疗有效的、保护性和致免疫量施用所述免疫原制品或疫苗。剂量 取决于给药途径,而且可随宿主的大小而变化。
D小分子治疗方法
如本文所述和可得到的,本发明提供了许多鉴定小分子或其它化合物 的方法,所述小分子或化合物可用于治疗早老性痴呆病或因早衰素中突变 而引起的其它疾病。因此,例如本发明提供了鉴定早衰素结合蛋白的方法, 特别是鉴定结合或与突变早衰素但不与正常早衰素相互作用的蛋白或其它 细胞组分的方法。本发明还提供了鉴定小分子的方法,可用所述小分子破 坏突变早衰素与所述蛋白或其它细胞组分之间的异常相互作用。
所述相互作用,包括突变体但不包括正常早衰素,不仅提供了用于了 解因早衰素中突变而扰乱的生物化学途径的资料,以及早老性痴呆病病 因,而且还为介入该病的病因提供了直接的治疗靶。通过鉴定这些蛋白并 分析这些相互作用,可以筛选或设计反作用或抑制所述相互作用的化合 物,因此可治疗这种不正常的相互作用。这些治疗可改变早衰素与这些配 对物之间的相互作用,改变相互作用蛋白的功能,改变相互作用配对物的 量或组织分布或表达,或改变早衰素本身的相似特性。
可以设计治疗方法以调节这些相互作用,并因此治疗早老性痴呆病以 及与PS1或PS2基因或其基因产物的获得性或遗传异常相关的其它疾病。 在暴露于治疗药物后,用对应于PS1基因、PS2基因或其它早衰素同系物 的合成肽或重组蛋白,通过标准药物动力学测量亲和性(Kd和Vmax 等),分析亲和性与这些相互作用的功能,就可以检测这些治疗方法的潜 在效力。检测涉及功能结构域如亲水环的任何相互作用的另一种方法是通 过原位杂交、免疫组织化学、Western印迹以及存在或不存在所述治疗药 物条件下的代谢脉冲追踪研究来监测细胞内运输和翻译后修饰。另一种方 法是监测“下游”事件的影响包括(i)APP及其产物细胞内代谢、运输和导 向的变化;(ii)第二信使过程如cAMP细胞内Ca2+,蛋白激酶活性等的变化。
如上所述,早衰素可能涉及APP代谢,早衰素的磷酸化状态对于α- secretase与APP加工的Aβ途径之间的平衡是至关重要的。用本发明的转 化细胞和动物模型,人们可以更好地理解这些途径和在早衰素突变体中发 生的异常事件。然后用所述知识,人们可设计治疗方法以逆转早衰素突变 体的不利影响。
为了治疗早老性痴呆病,例如通过化学或生物化学试剂(如药物、肽 和其它化合物)可改变PS1和/或的磷酸化状态,所述试剂可改变蛋白激酶 C和其它蛋白激酶的活性,或改变蛋白磷酸酶的活性,或将PS2可用性修 饰成翻译后被修饰的状态。激酶`磷酸酶与早衰素蛋白之间的相互作用, 以及早衰素与其它蛋白的相互作用涉及高尔基体网络内的APP运输,可对 其进行调节以减少高尔基体小泡向核内体-脂质体途径的运输,由此抑制 Aβ肽的生产。所进化合物将包括APP肽类似物、PS1、PS2和其它早衰 素同系物,以及其它相互作用蛋白、类脂、糖和促进PS1、PS2和/或其它 同系物进行差异糖基化的试剂;改变早衰素mRNA或蛋白生物半衰期的试 剂,包括抗体和反义寡核苷酸;以及作用于PS1和/或PS2转录的试剂。
通过监测PS1和/或PS2的转录、翻译和翻译后修饰(如磷酸化或糖基 化),以及PS1和/或PS2通过各种细胞内和细胞外区室的细胞内运输,可 了解这些试剂在细胞系和整个动物中的作用。用于这些的研究方法包括 Western和Northern印迹,用放射性标记的甲硫氨酸和ATP代谢标记(脉 冲追踪)后的免疫沉淀和免疫组织化学。用标准结合亲和性试验或利用抗 蛋白激酶C、APP、PS1、PS2或其它早衰素同系物的抗体的共沉淀和 Western印迹,通过检测与蛋白激酶C和/或APP相互作用的PS1和/或PS2 蛋白的相对结合亲和性和相对量的研究,也可检测这些试剂的作用。在暴 露于推定的治疗试剂之前和之后,通过用ELISA评估Aβ肽的生产,也可 检测这些试剂的作用(参见,如Huang等,1993)。在暴露于认为在早 老性痴呆病中有神经毒性的盐和/或Aβ肽后,通过评估细胞系的生存力 也可检测这些试剂的作用。最后,通过评估动物的认知功能,可检测这些 试剂的作用,所述动物携带在APP和/或其早衰素同系物的正常基因型,携 带人早衰素转基因(带有或不带有突变)或携带任何这些组合。
相似的,如上所述,早衰素可能涉及Ca2+作为受体或离子通道的Ca2+的调节。用本发明的转化细胞系和动物模型也可研究早衰素的所述作用。 基于这些结果,可产生用于早老性痴呆病的试验以检测异常受体或异常离 子通道功能,所述功能与早衰素基因和其产物或同系物基因之一和其产物 中的获得性或遗传性异常有关。用膜片钳、电压钳和细胞内钙或跨膜电压 敏感性的荧光染料,通过测量离子通道流量和/或跨膜电压或电流流量,可 在体内或体外完成所述试验。通过测量第二信使如环AMP的激活、cGMP 酪蛋白激酶、磷酸盐、细胞内Ca2+水平的增加等,也可检测离子通道或受 体功能缺乏。在人工膜系统中,也可重建重组制备的蛋白以研究离子通道 传导。通过分析其修饰异常离子通道的能力或通过分析早衰素基因中突变 而诱导的受体功能,可检测影响早老性痴呆病(由于PS1基因和PS2基因 中的获得性/遗传性缺陷;由于导致该疾病的其它途径中的缺陷如APP突 变;和由于环境因素)的治疗方法。通过其修饰离子通道的正常功能或早 衰素蛋白的受体能力,也可检测治疗方法。可以对表达内源正常或突变体 PS1基因/基因产物或PS2基因/基因产物的培养的细胞完成所述检测。所述 研究还可对用能够表达正常或突变体形式的早衰素之一、或早衰素之一的 功能结构域的载体转染的细胞完成所述研究。可设计用于早老性痴呆病的 治疗方法以修饰PS1基因或PS2基因的异常的离子通道或受体功能。所述 治疗可以是常规药物、肽、糖或类脂以及影响PS1或PS2基因产物的特性 的抗体或其它配体。所述治疗也可通过基因治疗直接取代PS1基因和/或 PS2基因来完成。在离子通道的情况下,用小基因(cDNA加启动子)或 基因组构建体可完成所述基因治疗,所述构建体携带早衰素基因的部分或 全部基因组DNA序列。也可用突变早衰素或同系物基因序列抵消早衰素 基因的遗传或获得性异常的影响,如最近完成的在C.elegans中Mec 4和 Deg 1的取代一样(Huang and Chalfie,1994)。所述治疗也可以涉及加强 一种同系物如PS2的受体或离子通道功能,以便有效地取代另一同系物突 变体形式的功能(如通过获得性或遗传缺陷而产生的PS1基因提供的缺陷 性)。使用基因治疗或蛋白取代治疗的标准技术,也可通过用反义寡核苷 酸阻断突变体PS1基因或突变体PS2基因的表达并协同使用正常PS1或 PS2基因取代进行治疗。
实施例
实施例1最小共分离区的遗传、物理“重叠区”和转录图谱的研究
用寡核苷酸探针,检索CEPHMegaYAC和RPCIPAC人总基因组DNA 文库,检测其中含来自染色体14q24.3的AD3区的基因组DNA片段,所 述探针是有关在遗传连锁研究中所用的12 SSR标记座位以及其它标记的 每个标记(Albertsen等;Chumakov等,1992;loannu等,1994)。在 重叠群上描述了各标记之间的遗传图距离,而且是得自公开的数据 (NIH/CEPH Collaborative Mapping Group,1992;Wang,1992;Weissenbach 等,1992;Gyapay等,1994)。用4种不同的方法,将各起始标记座位 的回收克隆排列成有序的部分重叠的克隆系列(“重叠群”)。首先,用 反向PCR(Riley等,1990)分离表示YAC插入片段的末端的序列,然 后与含DNA限制消化片段的Southern印迹组杂交以鉴定携带重叠序列的 其它YAC克隆,所述DNA来自从所有开始座位回收的YAC克隆。第二, 对各YAC进行Alu间PCR,在回收的YAC克隆池之间比较所得的带图谱 以鉴定携带重叠序列的其它克隆(Bellamne-Chartelot等,1992; Chumakov等,1992)。第三,为了提高Alu PCR指纹法的特异性,用 HaeIII或RsaI限制酶切YAC DNA,用Alu和LIH共有序列引物扩增限制 酶切产物,用聚丙烯酰胺凝胶电泳分辨所述产物。最后,在研究被转录序 列的过程中,会产生其它的STS,也可用这些STS鉴定重叠序列。除在携 带D14S52的YAC932C7和含D14S61的YAC746B4之间有单个不连续点 外,所得的重叠群是完整的。在所述重叠群中STS的物理图谱顺序与该区 域的遗传连锁图非常一致(NH/CEPH Collaborative Mapping Group, 1992;Wang and Weber,1992;Weissenbach等,1992;Gyapay等, 1994)。但正如遗传图谱一样,它不可能清楚地分辨D14S43/D14S71簇和 D14S76/D14S273簇中座位的相对顺序。PAC1克隆表明D14S277是 D14S268的端粒,而遗传图谱说明的顺序正好相反。此外,至少在一个YAC 克隆中,有些STS探针不能检测杂交图谱,而以最节俭的共有序列物理图 谱和遗传图谱为基础,已经认为所述克隆中含有所述STS。例如在 YAC788H12中没有D14S268(AFM265)和RSCAT7 STS。由于这些结 果是可再现的,而且数个不同的STS标记都会发生这种情况,因此,这些 结果很可能表明在YAC克隆之一中存在小的中间缺失。
实施例2染色体14q24.3标记的累计性两点优势分数
用100ng的基因组DNA,通过PCR确定各多态性微卫星标记座位的 基因型,所述DNA来自前述所有患和未患病系谱的成员(Weissenbach 等,1992;Gyapay等,1994)。用来自相同人种的spouses和其它神经 正常受试者确定各等位基因的正常种群频率,但显著不同于混合的高加索 种群的频率(Weissenbach等,1992;Gyapay等,1994)。最大置信度 计算值确认发作年龄的校正值,推测了来自公开的混合高加索受试者系列 的标记等位基因频率,以及估计的如前所述的AD3突变的等位基因频率为 1∶1000(St.George-Hyslop等,1992)。用相同标记等位基因频率,以及 仅从如前所述的患病系谱所得到的表型资料来重复所述分析,以确保在最 大置信度计算值中所用的估计的参数不会误导所述分析(St.George- Hyslop等,1992)。这些补充分析不会显著改变明显的支持连锁或所发现 的重组事件。
实施例3侧标记之间的单元型与FAD中的AD3一起分离
在14个早期发作的FAD系谱(系谱NIH2、MGH1、Torl.1、FAD4、 MEX1和FAD2)中,与AD3分离的染色体14的亲本拷贝上,着丝粒和 端粒侧标记之间延伸的单元型表明系谱特异性优势分数>3.00,D14S258 和D14S53之间的至少一个标记是这样。在相似人种的数个系谱中,带病 的分离染色体的两个区域中观察到部分相同的单元型。在A区,在D14S268 可见到共有的等位基因(“B”:等位基因大小=126bp,在普通高加索 人中的等位基因频率=0.04;“C”:大小=124bp,频率=0.38);D14S277 (“B”:大小=156bp,频率=0.19;“C”:大小=154bp,频率=0.33); RSCAT6(“D”:大小=111bp,频率0.25;“E”:大小=109bp,频率 =0.20;“F”:大小=107bp,频率=0.47)。在B区,在D14S43观察到 相同大小的等位基因(“A”:大小=193bp,频率=0.01;“D”大小=187 bp,频率0.12;“E”:大小=185bp,频率=0.26;“I”:大小=160bp, 频率=0.38);D14S273(“3”:大小=193bp,频率=0.38;“4”大 小=191bp,频率0.16;“5”:大小=189bp,频率=0.34;“6”:大小 =187bp,频率=0.02)和D14S76(“1”:大小=bp,频率=0.01;“5” 大小=bp,频率0.38;“6”:大小=bp,频率=0.07;“9”:大小=bp, 频率=0.38)。参见Sherrington等(1995)的详细描述。
实施例4从AD3间隔回收转录的序列
用直接杂交方法,回收在AD3间隔中编码的推定的转录序列,在所述 方法中将从人脑mRNA产生的短cDNA片段与固定的克隆基因组片段 (Rommens等,1993)杂交。以所得的短的推定转录序列作为探针以便 从人脑cDNA文库(Stratagene,La Jolla)中回收更长的转录本。通过分析 杂交图谱来确定源短克隆和所得的长cDNA克隆的物理位置,所述杂交图 谱是通过将探针与含一组EcoRI消化的总DNA样品的Southern印迹杂交 而产生的,所述DNA样品是从重叠群内的个体YAC克隆分离的。用自动 循环测序仪(Applied Biosystems Inc.,CA)确定各长cDNA克隆的核苷酸 序列,然后用blast算法(Altschul等,1990)与核苷酸和蛋白数据库中的其 它序列进行比较。转录序列的登记号为:L40391,L40392,L40393, L40394,L40395,L40396,L40397,L40398,L40399,L40400, L40401,L40402和40403。
买施例5用限制酶确定PS1基因中突变的位置
用PCR在基因组DNA中检测是否存在A246E突变(产生DdeI限制 位点),所述PCR利用基本上对应于SEQ ID NO:1的bp907-925的末端 标记引物和对应于SEQ ID NO:1的bp1010-990补体的未标记引物,以 便用100ng基因组DNA模板,2mM MgCl2,各10 pmol的引物,0.5UT 聚合酶,250uM dNTP进行30个循环扩增84bp的基因组外显子片段,每 循环含95℃×20秒,60℃×20秒,72℃×5秒。按照制造商的说明, 将产物与过量DdeI保温2小时,然后在6%非变性聚丙烯酰胺凝胶上分辨 并通过放射自显影肉眼观察。由于存在DdeI限制位点,所以从84bp片段 的裂解说明存在突变。所有FAD1系谱的患病成员和数个有危险的成员中 均携带有DdeI位点。应患而未患病者(年龄在70岁以上而未患病的个体) 及正常对照均不带有DdeI突变。
实施例6用等位基因特异性寡核苷酸确定PS1基因中突变的位置
用等位基因特异性寡核苷酸检测C410Y突变的存在。用对应于SEQ ID NO:1的bp 1451-1468的外显子序列引物和与SEQ ID NO:14的 bp719-699互补的反内含子序列引物,用上述条件,不同的是用2.5mM MgCl2,94℃×20秒,58℃×20秒和72℃×10秒的循环条件,来扩 增100ng的基因组DNA。用0.4M NaOH,25 mM EDTA稀释10倍来变性 所得的216bp的基因组片段,然后真空狭线印迹到复制尼龙膜上。48℃ 在5×SSC,5×Denhardt’s,0.5%SDS中,将末端标记的“野生型”引 物(对应于SEQ ID NO:1的bp1468-1486)和末端标记的“突变体” 引物(对应于相同序列但在位置1477有G→A的取代)与不同拷贝的狭线 印迹滤纸杂交1小时,然后在23℃,用2×SSC,在50℃用2×SSC连续 洗涤,接着暴露于X射线胶片。所有AD3和NIH2系谱的可检测患病成员 以及有危险的成员均有C410Y突变。用SSCP检测C410Y突变的努力表明 共同的内含子序列多态性有相同的SSCP迁移图谱。
实施例7Northern杂交表明在不同组织中PS1蛋白mRNA的表达
用标准方法如CsCl纯化,从外科手术得到的不同组织样品(包括心、 脑和胎盘的不同区域、肺、肝、骨骼肌、肾和胰腺)中分离总胞质RNA。 然后在甲凝胶上电泳RNA以便进行大小分级分离。制备硝酸纤维素膜, 然后将RNA转移到所述膜上。制备32P-标记的cDNA探针,然后加到膜中 以便使探针和RNA直接发生杂交。洗涤后,用塑料胶片缠绕膜,并放到含 X射线胶片的成像盒中。然后进行放射自显影以显影一到数天。通过与标 准RNA标记比较来确定大小。放射自显影的分析表明在3.0kb有一明显的 带(参见Sherrington等,1995的图2)。这些Northern印迹表明在所有 检测的组织中均有PS1基因的表达。
实施例8真核和原核表达载体系统
用不同类型的PS1核苷酸cDNA插入序列已得到适用于真核和原核表 达系统的构建体。第一种称为全长构建体,将完整的PS1 cDNA序列以正 确的方向插入到表达质粒中,并包括天然5’UTR和3’UTR序列以及完整 的开放阅读框架。所述开放阅读框架含有一核苷酸序列盒,所述盒可使野 生型开放阅读框架包含在表达系统中,或另外将单或组合的双突变插入到 所述开放阅读框架中。通过用酶NarI和PflmI从野生型开放阅读框架中除 去一限制酶切片段,然后用通过反转录酶PCR产生的相似片段取代之,所 述相似片段含有编码M146L突变或H163R突变的核苷酸序列。通过用酶 PflmI和NcoI裂解,可从开放阅读框架的野生型正常核苷酸序列中除去第 二个限制酶切片段,并用携带编码A246E突变、A260V突变、A285V突 变、L286V突变、L392V突变或C410Y突变的核苷酸序列的限制酶切片 段取代。通过将带有一个前种突变的NarI-PflmI片段与携带一个后种突变 的PflmI-NcoI片段相连可制备第三个变体,该变体带有M146L或H163R 突变与剩余突变之一串联的组合。
第二种cDNA插入片段,称为截断的构建体,是通过从全长野生型或 突变体cDNA序列中除去5’UTR和部分3’UTR而构建的。用含KpnI限制 位点(GGTAC/C)和小序列(GCCACC )的合成寡核苷酸取代5’UTR 序列以在PS1 ORF开始的ATG(SEQ ID NO:1的bp 249-267)产生Kozak 起始位点。用对应于SEQ IDNO:1的bp2568-2586的补体的寡核苷酸取 代3’UTR,所述寡核苷酸在5’末端有一人工EcoRI位点。然后通过将上述 突变序列插入到上述NarI-PflmI和PsImI-NcoI位点而制备该构建体的突变 变体。
第三种构建体包括衍生于克隆cc44的序列,其中外显子4的可变剪接 是得自于N-末端的4个残基(SEQ ID NO:3)的去除。
对于真核表达来说,将上述带有野生型和突变序列的这些不同cDNA 构建体克隆到表达载体pZeoSV中,其中通过限制消化已除去了SV60启动 子,并用pcDNA3(Invitrogen)CMV启动子元件取代。对于原核表达来 说,用谷胱甘肽S-转移酶(GST)融合载体pGEX-kg制备构建体。已 粘附到GST融合核苷酸序列上的插入片段是与上述携带正常开放阅读框 架核苷酸序列或上述单和双突变组合相同的核苷酸序列。这些GST构建体 可在原核系统中将部分或全长蛋白表达为突变体或野生型GST融合蛋 白,因此通过用凝血酶消化就可除去GST融合产物,从而纯化全长蛋白。 用GST融合载体可制备另一cDNA构建体,以便将对应于全长蛋白TM6 和TM7之间亲水酸性环的氨基酸序列生产为衍生物核苷酸序列或作为携 带A285V突变、L285V突变或L392V突变的突变序列。用对应于SEQ ID NO:1的bp1044-1061的、含有5’BamHI限制位点(G/GATCC)的5’ 寡核苷酸引物,和对应于SEQ ID NO:1的bp1476-1458的补体的、含有 5’EcoRI限制位点(G/AATTC)的3’引物,通过从适宜来源的RNA中回 收野生型或突变序列来完成。这样可将对应于在BamHI和EcoRI亲水酸性 环结构域的适宜突变或野生型核苷酸序列克隆在pGEX-KG载体中。
实施例9定位PS1基因中的其它突变
用表示成熟mRNA/cDNA序列或基因组DNA的RT-PCR产物,通过 各种方法(直接核苷酸测序、等位基因特异性寡核苷酸、连接聚合酶链反 应、SSCP、RFLPs)可检测PS1基因中的突变。对于A260V和A285V 突变,用相同的PCR引物和用于L286V突变的方法,可扩增携带外显子 的基因组DNA。
然后将PCR产物变性,并用上述用于C410Y突变的狭线印迹方法狭 线印迹复制到尼龙膜上。
在48℃,通过用对应于野生型序列(SEQ ID NO:1的bp1017- 1036)或突变序列(SEQ ID NO:1的bp1017-1036,在bp1027有C→T 的突变)的末端标记的等位基因特异性寡核苷酸杂交,然后在52℃用含 O.1%SDS的3×SSC缓冲液洗涤,将A260V突变记录在这些印迹上。按上 述将A285V突变记录在这些狭线印迹上,但在48℃用另外的野生型序列 (SEQ ID NO:1的bp1093-1111)或突变引物(SEQ ID NO:1的 bp1093-1111,在bp 1102有C→T的突变)的等位基因特异性寡核苷酸, 然后在52℃按上述洗涤,但洗涤溶液是2×SSC。
用调整PCR缓冲条件,除镁浓度是2mM,和循环体条件94℃×10 秒,56℃×20秒,和72℃×10秒,用引物(5’对应于SEQ ID NO: 14的bp439-456,而3’与SEQ ID NO:14的bp719-699互补)从基因组 DNA的外显子扩增来记录L392V突变。按对于C410Y所述,将所得的200 个碱基对的基因组片段变性,用狭线印迹复制到尼龙膜上。通过与野生型 末端标记的寡核苷酸(SEQ ID NO:1的bp1413-1431)或末端标记的突 变引物(SEQ ID NO:1的bp1413-1431,在bp 1422有C→G的突变) 在45℃示差杂交,然后用2×SSC在23℃,接着在68℃连续洗涤来表明 是否存在突变。
实施例10抗体生产
通过固相技术合成对应于部分PS1蛋白的肽抗原,然后通过反相高效 液压层析来纯化。经二硫键,将肽与匙孔_蓝蛋白(KLH)相连,所述二 硫键可能是通过在早衰素片段的C-末端加入半胱氨酸残基而制备的。在 该蛋白序列中,正常不会出现该附加的残基,而包含该残基仅仅是为了便 于与KLH分子相连。抗体所抗的特异性早衰素序列如下:
多克隆抗体#  hPS1抗原(SEQ ID NO:2)
1142         30-44
519          109-123
520          304-318
1143         346-360
这些序列被包含在PS1蛋白的特异性结构域内。例如残基30-44在 N-末端内,残基109-123在TM1→2环内,304-318和346-360 在大TM6→7环内。将这些结构域均暴露在含水介质内,而且这些结构域 可能与其它发展疾病表型至关重要的蛋白的结合。肽的选择是基于用IBI Pustell抗原性预测算法分析蛋白序列。
在弗氏佐剂中用各种肽抗原的肽-KLH复合物共免疫3种新西兰白 兔,隔7天进行加强注射。收集各肽的抗血清,合并,用硫酸铵IgG沉淀。 然后用与适宜肽结合的Sulfo-link琼脂糖(Pierce)亲和纯化抗体。要进行 这步最后的纯化以除去在免疫前或免疫后血清中存在的非特异性相互作用 的其它抗体。
用三种试验确定各抗体的特异性。首先,在脑匀浆物的Western印迹 上,检测与预测在早衰素-1近似大小的单显著带。第二,与携带适宜序列 的重组融合蛋白进行交叉反应。第三,用重组PS1或免疫肽预吸附,可特 异性阻断。
另外,已用两种不同的PS1肽谷胱甘肽S-转移酶(GST)融合蛋白 生产PS1抗体。第一种融合蛋白包括与GST融合的PS1的氨基酸1-81(N -末端)。第二种融合蛋白包括与GST融合的PS1的氨基酸266-410 (TM6→7环结构域)。通过将适宜的核苷酸序列插入到pGEX-2T表达质 粒(Amrad)中,可生产编码这些融合蛋白的构建体。所得的构建体包括 编码GST的序列和位于GST和PS1肽之间的凝血酶敏感性裂解位点。将 表达构建体转染到DH5α大肠杆菌中,用IPTG诱导融合蛋白的表达。溶 解细菌沉淀,通过在谷胱甘肽琼脂糖珠(Boehringer-Mannheim, Montreal)上进行一步亲和层析来纯化可溶性的GST-融合蛋白。用标准方 法,用GST-融合蛋白免疫小鼠以产生单克隆抗体。用纯化的早衰素片段 筛选从这些小鼠中得到的克隆。
另外,用凝血酶裂解GST-融合蛋白以释放PS1肽。用大小排阻层析纯 化释放的肽,然后用于免疫兔以产生多克隆抗血清。
用相似的方法,用包含早衰素-2的氨基酸1到87(N末端)或272 到390(TM6→TM7环)的核苷酸序列的构建体来制备GST融合蛋白, 然后用来产生抗那种蛋白的单克隆抗体。用凝血酶裂解PS2-GST融合蛋 白,用释放并纯化的肽免疫兔以制备多克隆抗血清。
实施例11鉴定PS2基因中的突变
用第一引物对和第二引物对从成淋巴细胞或冷冻尸检后脑组织的 RNA生产对应于PS2 ORF的RT-PCR产物,所述第一引物对的5’引物对应 于SEQ ID NO:18的bp478-496,3’引物与SEQ ID NO:18的bp1366- 1348互补,是一888bp的产物,第二引物对的5’引物对应于SEQ ID NO: 18的bp1083-1102,3’引物与SEQ ID NO:18的bp 1909-1892互补,是 一826bp的产物。用在10ml中250 mMol dNTPs,2.5 mM MgCl2,10 pMol寡核苷酸,94℃×20秒,58℃×20秒,72℃×45秒,经40个 循环完成PCR。用自动循环测序仪(ABI,Foster City,CA)确定PCR 产物的序列,通过直接观察和Factura(ver 1.2.0)和Sequence Navigator(ver 1.0.1b15)软件包扫描荧光层析谱中的杂合核苷酸取代(数据未列出)。
N141I突变的检测:在核苷酸787A→T取代产生BclI限制位点。用各 10pMol的寡核苷酸,从100ng基因组DNA扩增携带该突变的外显子,所 述寡核苷酸对应于SEQ ID NO:18的bp 733-751(末端标记的)和SEQ ID NO:18的bp846-829的补体(未标记的),PCR反应条件与下列用于 M239V突变的条件相似。按照制造商的方法,在10ml反应体积中用BclI (NEBL,Beverly,MA)限制酶切2ml的PCR产物,用非变性聚丙烯酰 胺凝胶电泳分辨所述产物。在带有野生型序列的受试者中,将114bp的PCR 产物裂解成68bp和46bp片段。突变序列裂解成53bp、46bp和15bp 的产物。
M239V突变的检测:在核苷酸1080A→G取代缺失了NlaIII限制位 点,使得可通过用各10 pMol的寡核苷酸,从100 ng基因组DNA扩增可 检测是否M239V突变,所述寡核苷酸对应于SEQ ID NO:18的bp1009- 1026和SEQ ID NO:18的bp1118-1101的补体。PCR条件是:0.5U Taq 聚合酶,250 mM dNTP,1mCi α32P-dCTP,1.5 mM MgCl2,10m1体积;30 个循环的94℃×30秒,58℃×20秒,72℃×20秒,以产生一110bp 产物。将2ml PCR产物稀释到10ml,用3 U NlaIII(NEBL,Beverly, MA)限制酶切3小时。用非变性聚丙烯酰胺凝胶电泳分辨所述产物,然 后通过放射自显影肉眼观察。正常受试者的裂解产物为55、35、15和6 bp,而突变体序列得到55、50和6bp的片段。
I420T突变的检测:与上述方法相似,用对应于SEQ ID NO:18的 bp1576-1593和SEQ ID NO:18的bp1721-1701的补体的引物对,通过 PCR扩增基因组DNA,可筛选I420T突变以产生一146碱基对的产物。 然后用野生型(如SEQ ID NO:18的bp1616-1632)和突变体(如SEQ ID NO:18 bp1616-1632,在bp1624有T→C的突变)序列等位基因特异性 的寡核苷酸检测该产物。
实施例12转基因小鼠
构建系列的野生型和突变体PS1和PS2基因以用于制备转基因小鼠。 用标准技术,通过克隆的cDNA cc33(PS1)和cc32(PS2)的定点诱变来产生 突变PS1和PS2基因。
用cDNA cc33和cc32及其突变体制备如实施例8所述的两种突变体 和野生型PS1和PS2 cDNA。第一种称为“全长”cDNA,通过EcoRI(PS1) 或PvuII(PS2)消化,从polyA前除去3’非翻译区的约200bp来制备。第二 种称为“截断的”cDNA,通过用ATG启始密码子5’的核糖体结合位点 (Kozak共有序列)取代5’非翻译区来制备。
将按上述制备的各种全长和截断的野生型和突变体PS1和PS2 cDNA 导入到一种或多种下列载体中,用所得的构建体作为生产转基因小鼠的基 因来源。
cos.TET表达载体:该载体衍生于含Syrian仓鼠PrP基因的粘粒克隆。 已经由Scott等(1992)和Hsiao等(1995)作了详细描述。将PS1和 PS2 cDNA(全长或截断的)插入到该载体中的SalI位点。最终构建体含 有插入cDNA侧的20kb的5’序列。该5’侧序列包含PrP基因启动子,50 bp的PrP基因5’非翻译区外显子,剪接供体位点,1kb内含子,剪接受体 位点,该位点邻接于PS1或PS2基因要插入的SalI位点。插入的cDNA 3’ 侧序列包含约8kb的含多聚腺苷酸化信号的PrP3’非翻译区片段。用 NotI(PS1)或FseI(PS2)消化该构建体释放出位于PrP启动子控制下的突变体 或野生型PS基因。将释放的片段进行凝胶纯化,然后用Hsiao等(1995) 的方法注射到受精小鼠卵的前核中。
血小板延生的生长因子受体β-亚单位构建体:来自人血小板的生长因 子受体β-亚单位启动子的3’末端的SalI(全长PS1 cDNA)或HindIII(截 断的PS1 cDNA、全长PS2 cDNA和截断的PS2 cDNA)与SV40 poly序列 5’末端的EcoRI位点之间导入PS cDNA,然后将完整的盒克隆到pZeoSV 载体(Invitrogen,San Diego,CA.)中。凝胶纯化通过ScaI/BamHI消化释 放的片段,然后用用Hsiao等(1995)的方法注射到受精小鼠卵的前核中。
人β-肌动蛋白构建体:将PS1和PS2 cDNA插入到pBAcGH的SalI位 点。通过所述插入而产生的构建体包含3.4Kb人β-肌动蛋白5’侧序列(人 β-肌动蛋白启动子、剪接的78bp人β-肌动蛋白5’非翻译外显子和内含子) 和PS1或PS2插入片段,其后为含数个内含子和外显子的2.2kb的人生长 因子激素基因组序列以及多聚腺苷酸化信号。用SfiI释放含PS的片段,凝 胶纯化,然后用用Hsiao等(1995)的方法注射到受精小鼠卵的前核中。
磷酸甘油酸激酶构建体:将PS1和PS2 cDNA导入到pKJ90载体中。 将该cDNA插入到人磷酸甘油酸激酶启动子下游的KpnI位点和磷酸甘油 酸激酶基因3’非翻译区上游的XbaI位点。用PvuII/HindII(PS1 cDNA)或 PvuII(PS2 cDNA)消化片段释放含PS的片段,然后凝胶纯化所述片段,如 上所述,注射到受精小鼠卵的前核中。
实施例13在真核细胞中表达重组PS1和PS2
用pcDNA3载体(Invitrogen,San Diego,CA.),在各种细胞类型(如 PC12、成神经细胞瘤、中国仓鼠卵巢和人胚胎肾293细胞)中表达重组 PS1和PS2。插入到该载体中的PS1和PS2 cDNA是与实施例8相同的全 长和截断的cDNA。
将这些cDNA插入到pcDNA 3的CMV启动子和牛生长因子激素多聚 腺苷酸化位点之间。高水平表达转基因。
另外,用pCMX载体在COS细胞中表达PS1和PX2。为了便于标记 并示踪早衰素蛋白的细胞内位置,将编码衍生于人c-myc抗体的11个氨基 酸的寡核苷酸(参见例如Evan等,1985)和由单克隆抗c-myc抗体MYC 1-9E10.2(Product CRL 1729,ATCC,Rockville,Md)作框内连接,紧接 在PS1和PS2开放阅读框架cDNA之前或之后。并制备了未标记的pCMX 构建体。将c-myc标记的构建体导入到pcDNA3,以转染CHO细胞。
用制造商的方法,用Lipofectamine(Gibco/BRL)瞬时和稳定转染这些构 建体。在48小时后,检测培养物的瞬时表达。用0.5mg/ml Geneticin(Gibco/BRL)筛选稳定转染的细胞系。
用上述抗早衰素抗体1142、519和520,通过Westem印迹检测转染 的PS蛋白的表达。总之,溶解培养的转染细胞(2%SDS,5mM EDTA, 1mg/ml亮抑蛋白酶肽和抑蛋白酶肽),通过Lowry法确定蛋白浓度。在 SDS-PAGE梯度凝胶(4-20%Novex )上分离蛋白,然后在恒定电压(50 伏),经2小时转移到PVDF(10mM CAPS)上。用脱脂奶(5%)经 1小时阻断非特异性结合。然后用两种兔多克隆抗体(在TBS中~1mg/ml, pH7.4)将蛋白检测12小时。用生物素化的山羊抗兔二级抗体鉴定早衰素 的交叉反应种类,用辣根过氧化物酶结合的三级链霉抗生物素蛋白、4-氯- 酚和过氧化氢可肉眼观察所述二级抗体。用上述抗早衰素抗体(以检测 早衰素肽抗原)和培养上清液(以检测myc-表位),通过Western印迹检 测c-myc标记的早衰素肽,所述上清液来自杂交瘤MYC1-9E10.2,以1∶ 10稀释用于Western印迹,以1∶3稀释用于免疫细胞化学。用不同的早 衰素抗体并通过myc-表位抗体(用于用含myc的质粒转染的细胞系)鉴定 50-60kDa的免疫反应主带。用一些早衰素抗体检测~10-19kDa和~ 70kDa的小带。
对于免疫细胞化学,用在Tris缓冲盐(TBS)中的4%甲醛固定转染 的细胞,用TBS加0.1%Triton充分洗涤,然后用3%阻断BSA非特异性 结合。用早衰素抗体(如上述抗体520和1142;通常为5-10mg/ml)检 测固定的细胞,洗涤并用FITC-或若丹明结合的山羊抗兔二级抗体进行肉 眼观察。对于c-myc-标记的早衰素构建体,将1∶3稀释的杂交瘤MYC 1-9E10.2上清液与抗小鼠二级抗体一起使用。用0.1%苯二胺(ICN)在90 %甘油中固定载玻片以保持荧光。用抗BIP(或抗钙联接蛋白)(StressGen, Victoria,B.C.)和麦胚凝集素(EY Labs,San Mateo,CA)分别作为内质网 和高尔基体的标记。用抗肌动蛋白(Sigma,St.Louis,Mo.)、抗淀粉样前 体蛋白(22C11,Boehringer Mannheim)和抗神经丝(NF-M特异性, Sigrna)在神经元细胞系NSC34中完成双免疫标记。这些免疫荧光研究表 明所述转染产物广泛分布在细胞内,特别是在核周围多是内质网和高尔基 体的特征,这与在非转染细胞中观察到的相似,但更密度更高,有时溢到 核膜内。在用myc标记的早衰素构建体瞬时转染的CHO和COS细胞中观 察到c-myc和PS表位的共免疫定位。
因此用免疫细胞化学、Northern印迹、Western印迹(用上述抗早衰 素抗体,用抗构建体中myc标记与3’或5’c-myc标记的单克隆抗体MYC 1-9E10.2)证实转染细胞中转染早衰素基因的Robust表达。
实施例14用亲和层析分离早衰素结合的蛋白
为了鉴定与早衰素生物化学功能有关的蛋白,用亲和层析分离PS1结 合的蛋白。用按照实施例8所述制备的含PS1 TM6→7环的GST-融合蛋白 检测人脑提取物,所述提取物是通过在生理盐水中用Polytron匀浆脑组织 而制备的。与谷胱甘肽-琼脂糖珠保温,通过预清除内源GST结合组分的 脑匀浆物来消除非特异性结合。然后将这些无GST匀浆物与GST-PS融合 蛋白一起保温以生产具有功能结合蛋白的所需复合物。用磷酸缓冲盐充分 洗涤后,用SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE;Tris-tricine梯度 凝胶4-20%)分别分离蛋白。除在50-60kDa有数个弱带外,在~14 和20kDa还观察到两个主带。
这些蛋白与TM6→7环之间相互作用的药理学修饰可用于治疗早老性 痴呆病。另外,在早衰素生物化学途径中可能起作用的这些蛋白可能是引 起早老性痴呆病的新交变位点。
实施例15用双杂交酵母系统分离早衰素结合的蛋白
为了鉴定与早衰素蛋白相互作用的蛋白,通过将编码PS1蛋白残基 266-409或PS2蛋白残基272-390的框内部分cDNA序列连接到载体的 EcoRI和BamHI位点而产生酵母表达质粒载体(pAS2-1,Clontech)。所 得的融合蛋白含有与PS1蛋白的TM6→7环或PS2蛋白的TM6→7环框内 相连的GAL4 DNA结合结构域。用Clontech Matchmaker酵母双杂交试剂 盒(Clontech)将这些表达载体与来自人脑cDNA:pACT文库的纯化质粒 DNA共转化到酵母中。用HIS抗性和βgal+活性来筛选与TM6→7环相互 作用的携带人脑cDNA的酵母克隆。再用环己酰胺(cyclohexamide)敏感性 筛选克隆,用PCR分离人脑cDNA插入片段,然后测序。按照制造商说明 的方法筛选阳性克隆,在6百万个起始转化体中,在HIS筛选后,得到200 个阳性克隆,在经βgal+颜色筛选后,得到42个克隆。这42个克隆中,有 数个(5-8个)代表相同基因的不同克隆。这表明这些相互作用是生物 学真实的而且是可重复的。
实施例16转基因C.elegans
通过微注射卵母细胞来得到转基因C.elegans。用载体pPD49.3 hsp 16-41和pPD49.3 hsp 16-2来达到此目的。先用前一种载体,生产其中导入 了正常hPS1基因或突变体(L392V)的转基因C.elegans。用上述人cDNA 探针cc32和抗体519、520和1142,通过在Northern印迹或Western印 迹上检测人cDNA的表达来检测转化的动物。制备载体和/或注射cis双突 变体hPS1基因(M146L和L392V)、正常hPS2基因和突变体(N141I) 基因。
实施例17克隆果蝇早衰素同系物,DmPS
根据公开的核苷酸序列数据,即以Trp为终止/开始的(如在PS1中的 残基Trp247和Trp404;在PS2中的Trp253和Trp385)早衰素/sel-12蛋 白的高度保守区设计丰余的寡核苷酸5’ctn ccn gar tgg acn gyc tgg(SEQ ID NO:22和5’rca ngc(agt)at ngt ngt rtt cca(SEQ ID NO:23)。从成年和胚胎黑 尾果蝇的mRNA,用这些引物进行RT-PCR(50ml体积,2mM MgCl,30 个循环的94℃×30秒,57℃×20秒,72℃×20秒)。然后94℃×1 秒,59℃×0.5秒和72℃×1秒的条件以及内部保守的丰余引物5’ttt ttt ctc gag acn gcn car gar aga aay ga(SEQ ID NO:24)和5’ttt ttt gga tcc tar aa(agt) atr aar tcn cc(SEQ ID NO:25)再扩增所述产物。将~600bp产物克隆到pBS 的BamHI和XhoI位点。将这些产物测序,并表明含有与人早衰素高度同 源的具有推定氨基酸序列的开放阅读框架。用该片段筛选常规的黑尾果蝇 cDNA/Zap文库(Stratagene,CA)以回收大小为~2-2.5kb的待测序的 6个独立cDNA克隆(克隆pds8,pds13,pds1,pds3,pds7和pds14)。最长 的ORF编码有541个氨基酸的多肽,该肽与人早衰素有52%的一致性。
实施例18 Aβ肽的长异构体的检测
组织病理学已确定有PS1或βAPP71突变的FAD;已知没有家族史 的零星AD;其它成年发作的神经变性性疾病(HD=遗传行慢性舞蹈病; ALS=肌萎缩性侧索硬化症);先天愚型(DS);和没有神经病征状的对 照的冷冻大脑皮质中,用99%甲酸,经69分钟(20℃)提取Aβ肽。200000 ×g离心20分钟后,将上清液与沉淀分离,然后稀释、中和并通过ELISA 检测。为了确定Aβ肽的量,使用了4种单克隆抗体。先用抗体BNT-77 (检测来自Aβ中心的表位)和抗体BAN-50(检测N-末端残基)结合 所有类型的Aβ,包括含有或不含有N-末端截短(BNT-77)或仅没有N -末端截短(BAN-50)的杂合形式。然后用另两种单克隆抗体区别Aβ 的不同C-末端形式,所述单克隆抗体检测终止于残基40的短尾Aβ(抗 体βA-27)或终止于残基42/43的长尾Aβ(抗体BC-05)。按前 述(Tamaoka等,1994;Suzuki等,1994)完成两位点ELISA。总之, 将100μg的标准肽或来自脑组织的上清液应用到用BNT-77抗体包被的 微滴定板上,然后在4℃保温24小时,用磷酸缓冲盐洗涤,然后与HRP -标记的BA-27和BC-05抗体,在4℃保温24小时。用前述TNB微 孔过氧化物酶系统,通过颜色显色来检测HRP活性。用配对的学生氏t试 验,比较诊断组之间的皮质Aβ水平。用Student-Newman-Keuls多重比较 试验,结合评估所有Aβ异构体的数据表明来自βAPP717和零星AD的受试 者的Aβ1-42水平与PS1突变情况的不同,但与对照相似。相反,当考 虑Aβx-42水平时,3组有显著不同:高(PS1和βAPP717AD),中等(零 星AD)和低(对照)。
具体地说,测量14个对照受试者(包括5个在40-50岁发作的患其 它神经变性性疾病的受试者)大脑皮质中不同Aβ异构体的浓度,表明只 有低浓度的短尾Aβ(Aβ1-40:0.06±0.02nmol/g湿组织±SEM; Aβx-40:=0.17±0.40)和长尾A β(Aβ1-42/43:0.35±0.17;Aβx- 42/43:1.17±0.80)这两种。相反,在有PS1突变的所有4个受试者的大 脑皮质中,长尾Aβ肽均有上升(Aβ1-42/43:6.54±2.0,p=0.05;Aβx- 42/43:23.91±4.00,p<0.01)。在有βAPP717突变的受试者(Aβ1-42/43: 2.03±1.04;Aβx-42/43:25.15±5.74)和有零星AD的受试者(Aβ1- 42/43:1.20±0.40,p=0.008;Aβx-42/43:14.45±2.81)的皮质中均检 测到长尾Aβ肽有相似的增加。在有PS1或βAPP717突变的受试者中,在 Aβ肽长尾异构体增加的同时,短尾Aβ肽异构体也有少量但不显著的增加 (如,Aβx-42/43:在PS1突变体中是3.08±1.31;在βAPP717突变体中 是1.56±0.07)。因此,长与短异构体的比率也显著增加。但是,在典型 零星AD的病例中,长尾Aβ肽异构体增加的同时,短尾Aβ肽异构体的增 加比前者要大得多(Aβ1-40:3.92±1.42;Aβx-42/43:16.60±5.88)。 与对照相比,短尾Aβ肽的这种增加在统计学上是显著的(对于Aβ1-40 和Aβx-42/43,p<0.03),但与PS1和βAPP717的情况相比,是边界统计 学显著的(p_0.05)。分析来自先天愚型成年患者的皮质样品表明,其图 谱与在零星AD中观察到的相似。
尽管本文详细描述了本发明的优选实施方案,但本领域专业人员应理 解,在未偏离本发明精神或权利要求范围内可进行各种改变。 表1     元件                位置   元件           位置  STAT1 (GAS)      34-46      611-619                   278-286    631-639                   431-439    1582-1590                   443-451    1965-1973                   495-503    2125-2133                   533-541  CAT盒                895-900                       975-982  TATA盒               925-933                       978-988  TFIID                578-581                       982-985  STAT3            36-43      737-744                   124-131    811-898                   429-436    1063-1070                   496-503    1686-1693                   533-540    1966-1973                   537-544    2104-2111                   632-639    2407-2414  TRXN(CAP)            1002-1007  启始                       1038-1043  GC盒                 1453-1460  (SP1)                       1454-1452  AP2,AP2-样          在序列中                       大量出现  NFIL6       611-620  1567-1576              890-899  1945-1954              1062-1071  MED1,MED1-样    1121-1126  1235-1240                   1126-1131  1716-1721
       表2 PS1结构域        近似位置 N-末端           1-81 TM1              82-100 TM1→2           101-132 TM2              133-154 TM2→3           155-163 TM3              164-183 TM3→4           184-194 TM4              195-212 TM4→5           213-220 TM5              221-238 TM5→6           239-243 TM6              244-262 TM6→7           263-407 TM7              408-428 C-末端           429-467
       表3 PS2结构域       近似位置 N-末端          1-87 TM1             88-106 TM1→2          107-134 TM2             135-160 TM2→3          161-169 TM3             170-189 TM3→4          190-200 TM4             201-218 TM4→5          219-224 TM5             225-244 TM5→6          245-249 TM6             250-268 TM6→7          269-387 TM7             388-409 C-末端          410-448
                                   表4
在SEQ ID NO:1  核苷酸变化  氨基酸变化  功能结构域  FAD的发作年龄
中的位置 1.  NA              NA          A79?       N-末端      64 2.  492             G→C        V82L        TM1         55 3.  NA              NA          V96F        TM1         NA 45  591             T→C        Y115H       TM1→2      37 5.  664             T→C        M139T       TM2         49 6.  NA              NA          M139V       TM2         40 7.  676             T→C        I143T       TM2         35 8.  684             A→C        M146L       TM2         45 9.  NA              NA          M146V       TM2         38 10. 736             A→G        H163R       TM2→3      50 11. NA              NA          H163Y       TM2→3      47 12. NA              NA          L171P       TM3         35 13. NA              NA          G209V       TM4         NA 14. NA              NA          I211T       TM4         NA 15. 939             G→A        A231T       TM5         52 16. 985             C→A        A246E       TM6         55 17. 1027            C→T        A260V       TM6         40 18. NA              NA          C263R       TM6→7      47 19. 1039            C→T        P264L       TM6→7      45 20. NA              NA          P267S       TM6→7      35 21. NA              NA          E280A       TM6→7      47 22. NA              NA          E280G       TM6→7      42 23. 1102            C→T        A285V       TM6→7      50 24. 1104            C→G        L286V       TM6→7      50 25. NA              缺失        Δ291-319   TM6→7      NA 26. 1399            G→C        G384A       TM6→7      35 27. 1422            C→G        L392V       TM6→7      25-40 28. 1477            C→A        2410y       TM7         43
                                       表5
在SEQ ID NO:18   核苷酸变化   氨基酸变化  功能结构域   FAD的发作年龄
中的位置 1.  787               A→T         N141I        TM2         50-65 2.  1080              A→G         M239V        TM5         50-70 3.  1624              T→C         IA20T        CC-末端     45
                            表6 28-61                           302-310 65-71                           311-325 109-112                         332-342 120-122                         346-359 218-221                         372-382 241-243                         400-410 267-269
                            表7 25-45                           282-290 50-63                           310-314 70-75                           321-338 114-120                         345-352 127-132                         380-390 162-167                         430-435 221-226
参考文献 Albertsen et al.(1990)Proc.Natl.Acad.Sci.(USA)87:4256- 4260. Altschul et al.(1990)J.Mol.Biol.215:403-410. Bellamme-Chartelot et al.(1992)cell 70:1059-1068. Bergamini et al.(1991)Acta Neurol.13:534-538. Brand and Perrimon(1993)Development 118:401-415. Bueler et al.(1996)Nature 356:577-582. Campion et al.,(1995)Hum.Molec.Genet. 4:2373-2377. Campos-Ortega and Jan(1991)Ann.Rev.Neurosci.14:399. Canadian Patent Application No.2,096,911 Canadian Patent Application No.2,071,105 Chartier-Harlin et al.(1991)Nature 353:844-846. Chumakov et al.(1992)Nature 359:380-387. Cruts et al.(1995)Hum.Molec.Genet..4:2363-2371. Davis(1996)Phvsiol.Reviews(in press). Evan et al.(1985)Mol.Cell Biol.5:3610-3616. Fischer and Lerman(1983)Proc.Natl.Acad.Sci.(USA)80:1579- 1583. Foncin et al.(1985)Rev.Neurol.(Paris)141:194-202. Frommelt et al.(1991) Alzheimer Dis.Assoc.Disorders 5:36-43. Games et al.(1995)Nature 373:523-527. Gandy et al.(1993) Gavrieli et al.(1992)J.Cell Biol.119:493-501. Goate et al.(1991)Nature 349:704-706. Goudsmit et al.(1981)J.Neurol.Sci.49:79-87. Gravina et al.(1995)J.Biol.Chem.270:7013-7016. Gyapay et al.(1994)Nature Genetics7:246-339. Hilbich et al.(1991)J.Mol.Biol.218:149-163. Hogan et al.(1986)Manipulating the Mouse Embrvo,Cold Spring Harbor Laboratory Press,
Cold Spring Harbor,New York. Hsiao et al.(1995)Neuron.(in press). Huang and Chalfie(1994) Huang et al.(1993) Ince and Scotto(1995)J.Biol.Chem.270:30249-30252. International Patent Applicaticn No.WO 94/23049 International  Patent Application No.WO 94/00569 Ioannu et al.(1994)Nature Genetics6:84-89. Iwatsubo et al.(1995)Ann.Neurol.37:294-299. Jacobson et al.(1993)Nature 361:365. Kahn(1995)Science270:369-370. Karlinsky et al.(1992)Neurology 42:1445-1453. Katzman(1986)N.Eng.J.Med.314:964-973. Kollmar and Farnham(1993)  Proc.Soc. Expt.Biol.Med.203:127- 137. Krause and Aaronson(1991)Methods in Enzvmologv,200:546-556. Kyte and Doolittle(1982)J.Mol.Biol.157:105 Lamb et al.(1993)Nature Genetics5:22-29 Lassmann et al.(1995)Acta Neuropathol.89:35. Levesque et al.(1996)in press. Levitan and Greenwald(1995)Nature 377:351-3S4. Liu and Sommer(1995)Biotechnigues18:470-477. Martin et al.(1995) NeuroReoort(in press). Mullan et al.(1992)Nature Genetics1:345-347. Murrell et al.(1991)Science 254:97-99. Nee et al.(1983) Arc.Neurol.40:203-208. NIH/CEPH Collaborative Mapping Group(1992)Science 258:67-86. Nowak(1995)Science270:363.71. Obermeir et al.(1994)Embo J.7:1585-1590. Pericak-Vance et al.(1988)Exp.Neurol.102:271-279. Phizicky and Fields(1994)Microbiol.Reviews 59:94-123. Pike et al.(1993)J.Neurosci.13:1676-1678. Podlisny et al.(1995)J.Biol.Chem.270:9564-9570. Pollen(1993)Hannah′s Heirs:The Ouest for the Genetic Origins of Alzheimer′s
Disease.Oxford University Press,Oxford. Querfurth et al.(1995)Molec.Brain Res.28:319-337. Riley et al.(1990)Nucl.Acid Res.18:2887-2890. Rogaev et al.(1993)Meurology43:2275-2279. Rogaev et al.(1995)Nature376:775-778. Rommens et al.(1993)Hum.Molec.Genet.2:901-907. Saieeba and Cetton(1993)Methods in Enzvmolccy217:286-295. Saunders et al.(1993)Neurology43:1467-1472/ Schellenberg et al.(1993)Am.J.Hum.Genet.53:619-628. Schellenberg et al.(1992)Science258:668-670. Scheuner et al.(1995)Soc.Neurosci.Abstr.21:1500. Schindler and Darnell(1995)Annu.Rev.Biochem.64:621-651. Scott et al.(1992) Selkoe et al.(1995) Selkoe et al.(1994) Sherrington et al.(1995)  Nature375:754-760. St.George-Hyslop et al.(1990)Nature347:194-197. St.George-Hyslop et al.(1994)Science263:537. Strittmatter et al.(1993)Proc.Matl.Acad.Sci.(USA)90:1977- 1981. Suzuki et al.(1994)Science 264:1336-1340. Tamaoka et al.(1994)J.Biol.Chem.269:32721-32724. Tamaoka et al.(1995)  Brain Res.679:151-156. United States Patent No.5,297,562 Van Broeckhoyen et al.(1992)  Nature Genetics 2:335-339. Vito et al.(1996)Science 271:521-525. Wang(1992)Genomics13:532-536. Weissenbach et al.(1992) Nature359:794-798. Wong et al.(1993)Neurosci.Lett.152:96-98. Zheng et al.(1995)Cell 81:525-531
                   序列表 (1)一般资料: (i)申请人
(A)名称:HSC研究和开发有限公司
(B)街道:555University Avenue
(C)城市:Toronto
(D)州: Ontario
(E)国家:加拿大
(F)邮政编码(ZIP):M5G1X8
(G)电话:(416)813-5982
(H)电传:(416)813-5085
(A)名称:THE GOVERNING COUNCIL OF THE UNIVERSITY OF TORONTO
(B)街道:106,Simcoe Hall,27King’s College Circle
(C)城市:Toronto
(D)州:Ontario
(E)国家:加拿大
(F)邮政编码(ZIP):M5S1A1
(G)电话:(416)978-7461
(H)电传:(416)978-1878
(A)名称:ST.GEORGE-HYSLOP,Peter H.
(B)街道:210Richview Avenue
(C)城市:Toronto
(D)州:Ontario
(E)国家:加拿大
(F)邮政编码(ZIP):M5P3G3
(A)名称:FRASER,Paul E.
(B)街道:611 Windermere Avenue
(C)城市:Toronto
(D)州:Ontario
(E)国家:加拿大
(F)邮政编码(ZIP):M6S3L9
(A)名称:ROMMENS,Johanna M.
(B)街道:105McCaul Street
(C)城市:Toronto
(D)州:Ontario
(E)国家:加拿大
(F)邮政编码(ZIP):M5T 2XT (ii)发明题目:与早老性痴呆病有关的基因序列和蛋白及其用途 (iii)序列数:25 (iv)相关地址:
(A)收件人:Sim & McBurney
(B)街道:330Universitv Avenue,6th Floor
(C)城市:Toronto
(D)州:Ontario
(E)国家:加拿大
(F)ZIP:M5G1R7 (v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:lBM PC兼容
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,Version#1.30 (vi)目前的申请资料:
(A)申请号:PCT/CA96/00263
(B)申请日:1996年4月29日
(C)分类号: (vii)在先申请资料:
(A)申请号:US08/509359
(B)申请日:1995年7月31日 (vii)在先申请资料:
(A)申请号:US08/496841
(B)申请日:1995年6月28日 (vii)在先申请资料:
(A)申请号:US08/431048
(B)申请日:1995年4月28日 (viii)代理人/代理资料:
(A)姓名:RAE,Patricia A.
(B)文献/文档号:7425-16 (ix)通信资料:
(A)电话:(416)595-1155
(B)电传:(416)595-1163 (2)SEQ ID NO:1的资料: (i)序列特征:
(A)长度:2765个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:CDS
(B)位置:249…1649 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…2675
(D)其它资料:/注=“hPSI-1” (xi)序列描述:SEQ ID NO:1: TGGGACAGGC AGCTCCGGGG TCCGCGGTTT CACATCGGAA ACAAAACAGC GGCTGGTCTG        60 GAAGGAACCT GAGCTACGAG CCGCGGCGGC AGCGGGGCGG CGGGGAAGCG TATACCTAAT       120 CTGGGAGCCT GCAAGTGACA ACAGCCTTTG CGGTCCTTAG ACAGCTTGGC CTGGAGGAGA       180 ACACATGAAA GAAAGAACCT CAAGAGGCTT TGTTTTCTGT GAAACAGTAT TTCTATACAG       240 TTGCTCCA ATG ACA GAG TTA CCT GCA CCG TTG TCC TAC TTC CAG AAT GCA        290
     Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala
       1               5                  10 CAG ATG TCT GAG GAC AAC CAC CTG AGC AAT ACT GTA CGT AGC CAG AAT         338 Gln Met Ser Glu Asp Asn His Leu Ser Asn Thr Val Arg Ser Gln Asn  15                  20                  25                  30 GAC AAT AGA GAA CGG CAG GAG CAC AAC GAC AGA CGG AGC CTT GGC CAC         386 Asp Asn Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His
             35                  40                  45 CCT GAG CCA TTA TCT AAT GGA CGA CCC CAG GGT AAC TCC CGG CAG GTG         434 Pro Glu Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val
         50                  55                  60 GTG GAG CAA GAT GAG GAA GAA GAT GAG GAG CTG ACA TTG AAA TAT GGC         482 Val Glu Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly
     65                  70                  75 GCC AAG CAT GTG ATC ATG CTC TTT GTC CCT GTG ACT CTC TGC ATG GTG         530 Ala Lys His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val
 80                  85                  90 GTG GTC GTG GCT ACC ATT AAG TCA GTC AGC TTT TAT ACC CGG AAG GAT         578 Val Val Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp  95                 100                 105                 110 GGG CAG CTA ATC TAT ACC CCA TTC ACA GAA GAT ACC GAG ACT GTG GGC         626 Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly
            115                 120                 125 CAG AGA GCC CTG CAC TCA ATT CTG AAT GCT GCC ATC ATG ATC AGT GTC         674 Gln Arg Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val
        130                 135                 140 ATT GTT GTC ATG ACT ATC CTC CTG GTG GTT CTG TAT AAA TAC AGG TGC         722 Ile Val Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys
    145                 150                 155 TAT AAG GTC ATC CAT GCC TGG CTT ATT ATA TCA TCT CTA TTG TTG CTG         770 Tyr Lys Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu
160                 165                 170 TTC TTT TTT TCA TTC ATT TAC TTG GGG GAA GTG TTT AAA ACC TAT AAC         818 Phe Phe Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn 175                 180                 185                 190 GTT GCT GTG GAC TAC ATT ACT GTT GCA CTC CTG ATC TGG AAT TTT GGT         866 Val Ala Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Phe Gly
            195                 200                 205 GTG GTG GGA ATG ATT TCC ATT CAC TGG AAA GGT CCA CTT CGA CTC CAG         914 Val Val Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln
        210                 215                 220 CAG GCA TAT CTC ATT ATG ATT AGT GCC CTC ATG GCC CTG GTG TTT ATC         962 Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile
    225                 230                 235 AAG TAC CTC CCT GAA TGG ACT GCG TGG CTC ATC TTG GCT GTG ATT TCA         1010 Lys Tyr Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser
240                 245                 250 GTA TAT GAT TTA GTG GCT GTT TTG TGT CCG AAA GGT CCA CTT CGT ATG         1058 Val Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met 255                 260                 265                 270 CTG GTT GAA ACA GCT CAG GAG AGA AAT GAA ACG CTT TTT CCA GCT CTC         1106 Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu
            275                 280                 285 ATT TAC TCC TCA ACA ATG GTG TGG TTG GTG AAT ATG GCA GAA GGA GAC         1154 Ile Tyr Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp
        290                 295                 300 CCG GAA GCT CAA AGG AGA GTA TCC AAA AAT TCC AAG TAT AAT GCA GAA         1202 Pro Glu Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu
    305                 310                 315 AGC ACA GAAAGG GAG TCA CAA GAC ACT GTT GCA GAG AAT GAT GAT GGC          1250 Ser Thr Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly
320                 325                 330 GGG TTC AGT GAG GAA TGG GAA GCC CAG AGG GAC AGT CAT CTA GGG CCT         1298 Gly Phe Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro 335                 340                 345                 350 CAT CGC TCT ACA CCT GAG TCA CGA GCT GCT GTC CAG GAA CTT TCC AGC         1346 His Arg Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser
            355                 360                 365 AGT ATC CTC GCT GGT GAA GAC CCA GAG GAA AGG GGA GTA AAA CTT GGA         1394 Ser Ile Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly
        370                 375                 380 Met Thr Glu Leu Pro Ala Pro Leu Sar Tyr Phe Gln Asn Ala Gln Met   1               5                  10                  15 Ser Glu Asp Asn His Leu Ser Asn Thr Val Arg Ser Gln Asn Asp Asn
         20                  25                  30 Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His Pro Glu
     35                  40                  45 Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val Glu
 S0                  55                  60 Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys  65                  70                  75                  80 His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val
             85                  90                  95 Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln
        100                 105                 110 Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg
    115                 120                 125 Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile Val
130                 135                 140 Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys 145                 150                 155                 160 Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe
            165                 170                 175 Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala
        180                 185                 190 Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Phe Gly Val Val
    195                 200                 205 Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala
210                 215                 220 Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr 225                 230                 235                 240 Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr
            245                 250                 255 Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val
        260                 265                 270 Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu Ile Tyr
    275                 280                 285 Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro Glu
290                 295                 300 Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr ASh Ala Glu Ser Thr 305                 310                 315                 320 Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly Gly Phe
            325                 330                 335 Ser Glu Glu Trp Glu Ala Cln Arg Asp Ser His Leu Gly Pro His Arg
        340                 345                 350 Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser Ile
    355                 360                 365 Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu Gly
370                 375                 380 TTG GGA GAT TTC ATT TTC TAC AGT GTT CTG GTT GGT AAA GCC TCA GCA        1442 Leu Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala
    385                 390                 395 ACA GCC AGT GGA GAC TGG AAC ACA ACC ATA GCC TGT TTC GTA GCC ATA        1490 Thr Ala Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile
400                 405                 410 TTA ATT GGT TTG TGC CTT ACA TTA TTA CTC CTT GCC ATT TTC AAG AAA        1538 Leu Ile Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys 415                 420                 425                 430 GCA TTG CCA GCT CTT CCA ATC TCC ATC ACC TTT GGG CTT GTT TTC TAC        1586 Ala Leu Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr
            435                 440                 445 TTT GCC ACA GAT TAT CTT GTA CAG CCT TTT ATG GAC CAA TTA GCA TTC        1634 Phe Ala Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe
        450                 455                 460 CAT CAA TTT TAT ATC TAGCATATTT GCGGTTAGAA TCCCATGGAT GTTTCTTCTT        1689 His Gln Phe Tyr Ile
    465 TGACTATAAC CAAATCTGGG GAGGACAAAG GTGATTTTCC TGTGTCCACA TCTAACAAAG      1749 TCAAGATTCC CGGCTGGACT TTTGCAGCTT CCTTCCAAGT CTTCCTGACC ACCTTGCACT      1809 ATTGGACTTT GGAAGGAGGT GCCTATAGAA AACGATTTTG AACATACTTC ATCGCAGTGG      1869 ACTGTGTCCC TCGGTGCAGA AACTACCAGA TTTGAGGGAC GAGGTCAAGG AGATATGATA      1929 GGCCCGGAAG TTGCTGTGCC CCATCAGCAG CTTGACGCGT GGTCACAGGA CGATTTCACT      1989 GACACTGCGA ACTCTCAGGA CTACCGGTTA CCAAGAGGTT AGGTGAAGTG GTTTAAACCA      2049 AACGGAACTC TTCATCTTAA ACTACACGTT GAAAATCAAC CCAATAATTC TGTATTAACT      2109 GAATTCTGAA CTTTTCAGGA GGTACTGTGA GGAAGAGCAG GCACCAGCAG CAGAATGGGG      2169 AATGGAGAGG TGGGCAGGGG TTCCAGCTTC CCTTTGATTT TTTGCTGCAG ACTCATCCTT      2229 TTTAAATGAG ACTTGTTTTC CCCTCTCTTT GAGTCAAGTC AAATATGTAG ATTGCCTTTG      2289 GCAATTCTTC TTCTCAAGCA CTGACACTCA TTACCGTCTG TGATTGCCAT TTCTTCCCAA      2349 GGCCAGTCTG AACCTGAGGT TGCTTTATCC TAAAAGTTTT AACCTCAGGT TCCAAATTCA      2409 GTAAATTTTG GAAACAGTAC AGCTATTTCT CATCAATTCT CTATCATGTT GAAGTCAAAT      2469 TTGGATTTTC CACCAAATTC TGAATTTGTA GACATACTTG TACGCTCACT TGCCCCCAGA      2529 TGCCTCCTCT GTCCTCATTC TTCTCTCCCA CACAAGCAGT CTTTTTCTAC AGCCAGTAAG      2589 GCAGCTCTGT CRTGGTAGCA GATGGTCCCA TTATTCTAGG GTCTTACTCT TTGTATGATG      2649 AAAAGAATGT GTTATGAATC GGTGCTGTCA GCCCTGCTGT CAGACCTTCT TCCACAGCAA      2709 ATGAGATGTA TGCCCAAAGC GGTAGAATTA AAGAAGAGTA AAATGGCTGT TGAAGC          2765 (2)SEQ ID NO:2的资料: (i)序列特征:
(A)长度:467个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:2: Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala 385                 390                 395                 400 Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile
            405                 410                 415 Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu
        420                 425                 430 Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala
    435                 440                 445 Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln
450                 455                 460 Phe Tyr Ile 465 (2)SEQ ID NO:3的资料: (i)序列特征:
(A)长度:3086个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:CDS
(B)位置:557…1945 (ix)特征:
(A)名称/关键字:misc特征
(B)位置:1…3086
(D)其它资料:/注=“hPS1-2” (xi)序列描述:SEQ ID NO:3: GAATTCGGCA CGAGGGAAAT GCTGTTTGCT CGAAGACGTC TCAGGGCGCA GGTGCCTTGG        60 GCCGGGATTA GTAGCCGTCT GAACTGGAGT GGAGTAGGAG AAAGAGGAAG CGTCTTGGGC        120 TGGGTCTGCT TGAGCAACTG GTGAAACTCC GCGCCTCACG CCCCGGGTGT GTCCTTGTCC        180 AGGGGCGACG AGCATTCTGG GCGAAGTCCG CACSCCTCTT GTTCGAGGCG GAAGACGGGG        240 TCTGATSCTT TCTCCTTGGT CGGGMCTGTC TCGAGGCATG CATGTCCAGT GACTCTTGTG        300 TTTGCTGCTG CTTCCCTCTC AGATTCTTCT CACCGTTGTG GTCAGCTCTG CTTTAGGCAT        360 ATTAATCCAT AGTGGAGGCT GGGATGGGTG AGAGAATTGA GGTGACTTTT CCATAATTCA        420 GACCTAATCT GGGAGCCTGC AAGTGACAAC AGCCTTTGCG GTCCTTAGAC AGCTTGGCCT        480 GGAGGAGAAC ACATGAAAGA AAGAACCTCA AGAGGCTTTG TTTTCTGTGA AACAGTATTT        540 CTATACAGTT GCTCCA ATG ACA GAG TTA CCT GCA CCG TTG TCC TAC TTC            589
              Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe
                1               5                  10 CAG AAT GCA CAG ATG TCT GAC GAC AAC CAC CTG AGC AAT ACT AAT GAC          637 Gln Asn Ala Gln Met Ser Glu Asp Asn His Leu Ser Asn Thr Asn Asp
         15                  20                  25 AAT AGA GAA CGG CAG GAG CAC AAC GAC AGA CGG AGC CTT GGC CAC CCT          685 Asn Arg Glu Arg Gln Glu His Asn Asp Arg Arg Ser Leu Gly His Pro
     30                  35                  40 GAG CCA TTA TCT AAT GGA CGA CCC CAG GGT AAC TCC CGG CAG GTG GTG          733 Glu Pro Leu Ser Asn Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val
 45                  50                  55 GAG CAA GAT GAG GAA GAA GAT GAG GAG CTG ACA TTG AAA TAT GGC GCC         781 Glu Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala  60                  65                  70                  75 AAG CAT GTG ATC ATG CTC TTT GTC CCT GTG ACT CTC TGC ATG GTG GTG         829 Lys His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val
             80                  85                  90 GTC GTG GCT ACC ATT AAG TCA GTC AGC TTT TAT ACC CGG AAG GAT GGG         877 Val Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly
         95                 100                 105 CAG CTA ATC TAT ACC CCA TTC ACA GAA GAT ACC GAG ACT GTG GGC CAG         925 Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln
    110                 115                 120 AGA GCC CTG CAC TCA ATT CTG AAT GCT GCC ATC ATG ATC AGT GTC ATT         973 Arg Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile
125                 130                 135 GTT GTC ATG ACT ATC CTC CTG GTG GTT CTG TAT AAA TAC AGG TGC TAT         1021 Val Val Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr 140                 145                 150                 155 AAG GTC ATC CAT GCC TGG CTT ATT ATA TCA TCT CTA TTG TTG CTG TTC         1069 Lys Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe
            160                 165                 170 TTT TTT TCA TTC ATT TAC TTG GGG GAA GTG TTT AAA ACC TAT AAC GTT         1117 Phe Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val
        175                 180                 185 GCT GTG GAC TAC ATT ACT GTT GCA CTC CTG ATC TGG AAT TTG GGT GTG         1165 Ala Val Asp Tyr Ile Thr Val Ala Leu Leu Ile Trp Asn Leu Gly Val
    190                 195                 200 GTG GGA ATG ATT TCC ATT CAC TGG AAA GGT CCA CTT CGA CTC CAG CAG         1213 Val Gly Met Ile Ser Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln
205                 210                 215 GCA TAT CTC ATT ATG ATT AGT GCC CTC ATG GCC CTG GTG TTT ATC AAG         1261 Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys 220                 225                 230                 235 TAC CTC CCT GAA TGG ACT GCG TGG CTC ATC TTG GCT GTG ATT TCA GTA         1309 Tyr Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val
            240                 245                 250 TAT GAT TTA GTG GCT GTT TTG TGT CCG AAA GGT CCA CTT CGT ATG CTG         1357 Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu
        255                 260                 265 GTT GAA ACA GCT CAG GAG AGA AAT GAA ACG CTT TTT CCA GCT CTC ATT         1405 Val Glu Thr Ala Gln Glu Arg Ash Glu Thr Leu Phe Pro Ala Leu Ile
    270                 275                 280 TAC TCC TCA ACA ATG GTG TGG TTG GTG AAT ATG GCA GAA GGA GAC CCG         1453 Tyr Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro
285                 290                 295 GAA GCT CAA AGG AGA GTA TCC AAA AAT TCC AAG TAT AAT GCA GAA AGC         1501 Glu Ala Gln Arg Arg Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu Ser 300                 305                 310                 315 ACA GAA AGG GAG TCA CAA GAC ACT GTT GCA GAG AAT GAT GAT GGC GGG         1549 Thr Glu Arg Glu Ser Gln Asp Thr Val Ala Glu Asn Asp Asp Gly Gly
            320                 325                 330 TTC AGT GAG GAA TGG GAA GCC CAG AGG GAC AGT CAT CTA GGG CCT CAT         1597 Phe Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro His
        335                 340                 345 CGC TCT ACA CCT GAG TCA CGA GCT GCT GTC CAG GAA CTT TCC AGC AGT        1645 Arg Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser
    350                 355                 360 ATC CTC GCT GGT GAA GAC CCA GAG GAA AGG GGA GTA AAA CTT GGA TTG        1693 Ile Leu Ala Gly Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu
365                 370                 375 GGA GAT TTC ATT TTC TAC AGT GTT CTG GTT GGT AAA GCC TCA GCA ACA        1741 Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr 380                 385                 390                 395 GCC AGT GGA GAC TGG AAC ACA ACC ATA GCC TGT TTC GTA GCC ATA TTA        1789 Ala Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu
            400                 405                 410 ATT GGT TTG TGC CTT ACA TTA TTA CTC CTT GCC ATT TTC AAG AAA GCA        1837 Ile Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala
        415                 420                 425 TTG CCA GCT CTT CCA ATC TCC ATC ACC TTT GGG CTT GTT TTC TAC TTT        1885 Leu Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe
    430                 435                 440 GCC ACA GAT TAT CTT GTA CAG CCT TTT ATG GAC CAA TTA GCA TTC CAT        1933 Ala Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His
445                 450                 455 CAA TTT TAT ATC TAGCATATTT GCGGTTAGAA TCCCATGGAT GTTTCTTCTT            1985 Gln Phe Tyr Ile 460 TGACTATAAC CAAATCTGGG GAGGACAAAG GTGATTTTCC TGTGTCCACA TCTAACAAAG      2045 TCAAGATTCC CGGCTGGACT TTTGCAGCTT CCTTCCAAGT CTTCCTGACC ACCTTGCACT      2105 ATTGGACTTT GGAAGGAGGT GCCTATAGAA AACGATTTTG AACATACTTC ATCGCAGTGG      2165 ACTGTGTCCT CGGTGCAGAA ACTACCAGAT TTGAGGGACG AGGTCAAGGA GATATGATAG      2225 GCCCGGAAGT TGCTGTGCCC CATCAGCAGC TTGACGCGTG GTCACAGGAC GATTTCACTG      2285 ACACTGCGAA CTCTCAGGAC TACCGGTTAC CAAGAGGTTA GGTGAAGTGG TTTAAACCAA      2345 ACGGAACTCT TCATCTTAAA CTACACGTTG AAAATCAACC CAATAATTCT GTATTAACTG      2405 AATTCTGAAC TTTTCAGGAG GTACTGTGAG GAAGAGCAGG CACCAGCAGC AGAATGGGGA      2465 ATGGAGAGGT GGGCAGGGGT TCCAGCTTCC CTTTGATTTT TTGCTGCAGA CTCATCCTTT      2525 TTAAATGAGA CTTGTTTTCC CCTCTCTTTG AGTCAAGTCA AATATGTAGA TGCCTTTGGC      2585 AATTCTTCTT CTCAAGCACT GACACTCATT ACCGTCTGTG ATTGCCATTT CTTCCCAAGG      2645 CCAGTCTGAA CCTGAGGTTG CTTTATCCTA AAAGTTTTAA CCTCAGGTTC CAAATTCAGT      2705 AAATTTTGGA AACAGTACAG CTATTTCTCA TCAATTCTCT ATCATGTTGA AGTCAAATTT      2765 GGATTTTCCA CCAAATTCTG AATTTGTAGA CATACTTGTA CGCTCACTTG CCCCAGATGC      2825 CTCCTCTGTC CTCATTCTTC TCTCCCACAC AAGCAGTCTT TTTCTACAGC CAGTAAGGCA      2885 GCTCTGTCGT GGTAGCAGAT GGTCCCACTT ATTCTAGGGT CTTACTCTTT GTATGATGAA      2945 AAGAATGTGT TATGAATCGG TGCTGTCAGC CCTGCTGTCA GACCTTCTTC CACAGCAAAT      3005 GAGATGTATG CCCAAAGCGG TAGAATTAAA GAAGAGTAAA ATGGCTGTTG AAGCAAAAAA      3065 AAAAAAAAAA AAAAAAAAAA A                                                3086 (2)SEQ ID NO:4的资料: (i)序列特征:
(A)长度:463个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:4: Met Thr Glu Leu Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala Gln Met   1               5                  l0                  15 Ser Glu Asp Asn His Leu Ser Asn Thr Asn Asp Asn Arg Glu Arg Gln
         20                  25                  30 Glu His Asn Asp Arg Arg Ser Leu Gly His Pro Glu Pro Leu Ser Asn
     35                  40                  45 Gly Arg Pro Gln Gly Asn Ser Arg Gln Val Val Glu Gln Asp Glu Glu
 50                  55                  60 Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys His Val Ile Met  65                  70                  75                  80 Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val Val Ala Thr Ile
             85                  90                  95 Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln Leu Ile Tyr Thr
        100                 105                 110 Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg Ala Leu His Ser
    115                 120                 125 Ile Leu Asn Ala Ala Ile Met Ile Ser Val Ile Val Val Met Thr Ile
130                 135                 140 Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys Val Ile His Ala 145                 150                 155                 160 Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe Phe Ser Phe Ile
            165                 170                 175 Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala Val Asp Tyr Ile
        180                 185                 190 Thr Val Ala Leu Leu Ile Trp Asn Leu Gly Val Val Gly Met Ile Ser
    195                 200                 205 Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala Tyr Leu Ile Met
210                 215                 220 Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp 225                 230                 235                 240 Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr Asp Leu Val Ala
            245                 250                 255 Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val Glu Thr Ala Gln
        260                 265                 270 Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu Ile Tyr Ser Ser Thr Met
    275                 280                 285 Val Trp Leu Val Asn Met Ala Glu Gly Asp Pro Glu Ala Gln Arg Arg
290                 295                 300 Val Ser Lys Asn Ser Lys Tyr Asn Ala Glu Ser Thr Glu Arg Glu Ser 305                 310                 315                 320 Gln Asp Thr Val Ala Glu Ash Asp Asp Gly Gly Phe Ser Glu Glu Trp
            325                 330                 335 Glu Ala Gln Arg Asp Ser His Leu Gly Pro His Arg Ser Thr Pro Glu
        340                 345                 350 Ser Arg Ala Ala Val Gln Glu Leu Ser Ser Ser Ile Leu Ala Gly Glu
    355                 360                 365 Asp Pro Glu Glu Arg GLy Val Lys Leu Gly Leu Gly Asp Phe Ile Phe
370                 375                 380 Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala Ser Gly Asp Trp 385                 390                 395                 400 Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile Gly Leu Cys Leu
            405                 410                 415 Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu Pro Ala Leu Pro
        420                 425                 430 Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala Thr Asp Tyr Leu
    435                 440                 445 Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln Phe Tyr Ile
450                 455                 460 (2)SEQ ID NO:5的资料: (i)序列特征:
(A)长度:2494个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…2494
(D)其它资料:/注=“1Ex1n2” (xi)序列描述:SEQ ID NO:5: AAGCTTTTGT GTGTAAAAAG TATTAGAATC TCATGTTTTT GAACAAGGTT GGCAGTGGGT       60 TGGGAGGAGG GATTGGAGAT TGATGCGATA GGAATGTGAA GGGATAGCTT GGGGTGGATT      120 TTATTTTTTA ATTTTAATTT TTATTTKTTG AGATGGAGTC TTGCTCTGTC TCCCAGGCTG      180 GAGTGCAGTG GTGTGATCTC AGCTCACGGG TTCAAGCGAT TCTCCTGCTG CAGCCTCCCG      240 AGTAGCTGGG ATTACAGGAG CGCGCCACCA CACCCGGNTA ATTTNNTTGT ATTTTTAGTA      300 GAGACGGGGT TTCACCATGT TGGGTTAGGC TGGTCTAGAA CTCCCAACCT CATGATCCGC      360 CTGCTTCGGC CTCCCAAAGT GCCGGAATTA CAGGCGTGAG CGACTGCACC CGGCCGCTTG      420 GGGGTGGATT TTTAAAGAAA CTTTAGAAGA ATGTAACTTG SCCAGATACC ATGTACCGTT      480 AATTTCATTT TCGGTTTTTK GAATACCCAT GTTTGACATT TMTCCGTTCA CCTTGATTAA      540 ATAAGGTAGT ATTCATTTTT TAGTTTTAGC TTTTGGATAT ATGTGTAAGT GTGGTATGCT      600 GTCTAATGAA TTAAGACAAT TGGTNCTKTC TTTACCCMAM ANCTGGACMA AGAGCAGGCA      660 AGATGCAAAA ATCAAGTGAC CCAGCAAACC AGACACATTT TCTGCTCTCA GCTAGCTTGC      720 CACCTAGAAA GACTGGTTGT CAAAGTTGGA GTCCAAGAAT CGCGGAGGAT GTTTAAAATG      780 CAGTTTCTCA GGTTCTCNCC ACCCACCAGA AGTTTTGATT CATTGAGTGG TGGGAGAGGG      840 CAGAGATATT TGCGATTTTA ACAGCATTCT CTTGATTGTG ATGCAGCTGG TTCSCAAATA      900 GGTACCCTAA AGAAATGACA GGTGTTAAAT TTAGGATGGC CATCGCTTGT ATGCCGGGAG      960 AAGCACACGC TGGGCCCAAT TTATATAGGG GCTTTCGTCC TCAGCTCGAG CARCCTCAGA    1020 ACCCCGACAA CCYACGCCAG CKCTCTGGCC GGATTCCTTC AGKTGGGGAA GSCCAGGTGG    1080 AGCTCTGGKT TCTCCCCGCA ATCGTTTCTC CAGGCCGGAG GCCCCGCCCC CTTCCTCCTG    1140 GCTCCTCCCC TCCTCCGTGG GCCGNCCGCC AACGACGCCA GAGCCGGAAA TGACGACAAC    1200 GGTGAGGGTT CTCGGGCGGG GCCTGGGACA GGCAGCTCCG GGGTCCGCGG TTTTCACATC    1260 GGAAACAAAA CAGCGGCTGG TCTGGAAGGA ACCTGAGCTA CGACCCGCGG CGGCAGCGGG    1320 GCGGCGGGGA AGCGTATGTG CGTGATGGGG AGTCCGGGCA AGCCAGGAAG GCACCGCGGA    1380 CATGGGCGGC CGCGGGCAGG GNCCGGNCCT TTGTGGCCGC CCGGGCCGCG AAGCCGGTGT    1440 CCTAAAAGAT GAGGGGCGGG GCGCGGCCGG TTGGGGCTGG GGAACCCCGT GTGGGAAACC    1500 AGGAGGGGCG GCCCGTTTCT CGGGCTTCGG GCGCGGCCGG GTGGAGAGAG ATTCCGGGGA    1560 GCCTTGGTCC GGAAATGCTG TTTGCTCGAA GACGTCTCAG GGCGCAGGTG CCTTGGGCCG    1620 GGATTAGTAG CCGTCTGAAC TGGAGTGGAG TAGGAGAAAG AGGAAGCGTC TTGGGCTGGG    1680 TCTGCTTGAG CAACTGGTGA AACTCCGCGC CTCACGCCCC GGGTGTGTCC TTGTCCAGGG    1740 GCGACGAGCA TTCTGGGCGA AGTCCGCACG CCTCTTGTTC GAGGCGGAAG ACGGGGTCTT    1800 GATGCTTTCT CCTTGGTCGG GACTGTCTCG AGGCATGCAT GTCCAGTGAC TCTTGTGTTT    1860 GCTGCTGCTT CCCTCTCAGA TTCTTCTCAC CGTTGTGGTC AGCTCTGCTT TAGGCATATT    1920 AATCCATAGT GGAGGCTGGG ATGGGTGAGA GAATTGAGGT GACTTTTCCA TAATTCAGGT    1980 GAGATGTGAT TAGAGTYCGG ATCCTNCGGT GGTGGCAGAG GCTTACCAAG AAACACTAAC    2040 GGGACATGGG AACCAATTGA GGATCCAGGG AATAAAGTGT GAAGTTGACT AGGAGGTTTT    2100 CAGTTTAAGA ACATGGCAGA GACATTCTCA GAAATAAGGA AGTTAGGAAG AAAGACCTGG    2160 TTTAGAGAGG AGGGCGAGGA AGTGGTTTGG AAGTGTCACT TTGGAAGTGC CAGCAGGTGA    2220 AAATGCCCTG TGAACAGGAC TGGAGCTGAA AACAGGAATC AATTCCATAG ATTTCCAGTT    2280 GATGTTGGAG CAGTGGAGAA GTCTAANCTA AGGAAGGGGA AGAGGAGGCC AAGCCAAACA    2340 CTTAGGAACA CTTNCNACGA GGGGGTGGAA GAAGAGCAAG GAGCCAGCTG AGGAGAATGA    2400 GTGTGGTTGG AGAACCACCA CAGCNCAGGG TCGCCAGANC TGAGGAAGGG GAGGGAAGCT    2460 TATCGAGKAM SGWCRACMKC GAGTTGGCAG GGAT                                2494 (2)SEQ ID NO:6的资料: (i)序列特征:
(A)长度:1117个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1117
(D)其它资料:/注=“1Ex3n4” (xi)序列描述:SEQ ID NO:6: GGATCCGCCC GCCTTGGCCT CCCAAAGTGC TGGGATTACA GGCATGAGCC ACCGCTCCTG     60 GCTGAGTCTG CGATTTCTTG CCAGCTCTAC CCAGTTGTGT CATCTTAAGC AAGTCACTGA    120 ACTTCTCTGG ATTCCCTTCT CCTNNWGTAA AATAAGNATG TTATCTGNCC NNCCTGCCTT    180 GGGCATTGTG ATAAGGATAA GATGACATTA TAGAATNTNG VAAAATTAAA AGCGCTAGAC      240 AAATGTTTTA ATGAAAATAT AAAGATTAGN TTGAGTTTGG GCCAGCATAG AAAAAGGAAT      300 GTTGAGAACA TTCCNTTAAG GATTACTCAA GCYCCCCTTT TGSTGKNWAA TCAGANNGTC      360 ATNNAMNTAT CNTNTGTGGG YTGAAAATGT TTGGTTGCCT CAGGCGGTTC CTACTTATTG      420 CTAAAGAGTC CTACCTTGAG CTTATAGTAA ATTTGTCAGT TAGTTGAAAG TCGTGACAAA      480 TTAATACATT CCTGGTTTAC AAATTGGTCT TATAAGTATT TGATTGGTNT AAATGNATTT      540 ACTAGGATTT AACTAACAAT GGATGACCTG GTGAAATCCT ATTTCAGACC TAATCTGGGA      600 GCCTGCAAGT GACAACAGCC TTTGCGGTCC TTAGACAGCT TGGCCTGGAG GAGAACACAT      660 GAAAGAAAGG TTTGWNTCTG NTTAWTGTAA TCTATGRAAG TGTTTTTWAT MACAGTATAA      720 TTGTMTGMAC AAAGTTCTGT TTTTCTTTCC CTTTNCAGAA CCTCAAGAGG CTTTGTTTTC      780 TGTGAAACAG TATTTCTATA CAGTTGCTCC AATGACAGAG TTACCTGCAC CGTTGTCCTA      840 CTTCCAGAAT GCACAGATGT CTGAGGACAA CCACCTGAGC AATACTGTAC GTAGCCAGGT      900 ACAGCGTCAG TYTTCNAAAC TGCCTYYGNC AGACTGGATT CACTTATCAT CTCCCCTCAC      960 CTCTGAGAAA TGCTGAGGGG GSTAGGNAGG GCTTTCTCTA CTTNACCACA TTTNATAATT     1020 ATTTTTGGGT GACCTTCAGC TGATCGCTGG GAGGGACACA GGGCTTNTTT AACACATAGG     1080 GTGTTGGATA CAGNCCCTCC CTAATTCACA TTTCANC                              1117 (2)SEQ ID NO:7的资料: (i)序列特征:
(A)长度:1727个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1727
(D)其它资料:/注=“1Ex5” (xi)序列描述:SEQ ID NO:7: GGATCCCTCC CCTTTTTAGA CCATACAAGG TAACTTCCGG ACGTTGCCAT GGCATCTGTA      60 AACTGTCATG GTGTTGGCGG GGAGTGTCTT TTAGCATGCT AATGTATTAT AATTAGCGTA     120 TAGTGAGCAG TGAGGATAAC CAGAGGTCAC TCTCCTCACC ATCTTGGTTT TGGTGGGTTT     180 TGGCCAGCTT CTTTATTGCA ACCAGTTTTA TCAGCAAGAT CTTTATGAGC TGTATCTTGT     240 GCTGACTTCC TATCTCATCC CGNAACTAAG AGTACCTAAC CTCCTGCAAA TTGMAGNCCA     300 GNAGGTCTTG GNCTTATTTN ACCCAGCCCC TATTCAARAT AGAGTNGYTC TTGGNCCAAA     360 CGCCYCTGAC ACAAGGATTT TAAAGTCTTA TTAATTAAGG TAAGATAGKT CCTTGSATAT     420 GTGGTCTGAA ATCACAGAAA GCTGAATTTG GAAAAAGGTG CTTGGASCTG CAGCCAGTAA     480 ACAAGTTTTC ATGCAGGTGT CAGTATTTAA GGTACATCTC AAAGGATAAG TACAATTGTG     540 TATGTTGGGA TGAACAGAGA GAATGGAGCA ANCCAAGACC CAGGTAAAAG AGAGGACCTG     600 AATGCCTTCA GTGAACAATG ATAGATAATC TAGACTTTTA AACTGCATAC TTCCTGTACA     660 TTGTTTTTTC TTGCTTCAGG TTTTTAGAAC TCATAGTGAC GGGTCTGTTG TTAATCCCAG     720 GTCTAACCGT TACCTTGATT CTGCTGAGAA TCTGATTTAC TGAAAATGTT TTTCTTGTGC     780 TTATAGAATG ACAATAGAGA ACGGCAGGAG CACAACGACA GACGGAGCCT TGGCCACCCT     840 GAGCCATTAT CTAATGGACG ACCCCAGGGT AACTCCCGGC AGGTGGTGGA GCAAGATGAG     900 GAAGAAGATG AGGAGCTGAC ATTGAAATAT GGCGCCAAGC ATGTGATCAT GCTCTTTGTC     960 CCTGTGACTC TCTGCATGGT GGTGGTCGTG GCTACCATTA AGTCAGTCAG CTTTTATACC     1020 CGGAAGGATG GGCAGCTGTA CGTATGAGTT TKGTTTTATT ATTCTCAAAS CCAGTGTGGC     1080 TTTTCTTTAC AGCATGTCAT CATCACCTTG AAGGCCTCTN CATTCAAGGG GCATGACTTA     1140 GCTGGAGAGC CCATCCTCTG TGATGGTCAG GAGCAGTTGA GAGANCGAGG GGTTATTACT     1200 TCATGTTTTA AGTGGAGAAA AGGAACACTG CAGAAGTATG TTTCCTGTAT GGTATTACTG     1260 GATAGGGCTG AAGTTATGCT GAATTGAACA CATAAATTCT TTTCCACCTC AGGGNCATTG     1320 GGCGCCCATT GNTCTTCTGC CTAGAATATT CTTTCCTTTN CTNACTTKGG NGGATTAAAT     1380 TCCTGTCATC CCCCTCCTCT TGGTGTTATA TATAAAGTNT TGGTGCCGCA AAAGAAGTAG     1440 CACTCGAATA TAAAATTTTC CTTTTAATTC TCAGCAAGGN AAGTTACTTC TATATAGAAG     1500 GGTGCACCCN TACAGATGGA ACAATGGCAA GCGCACATTT GGGACAAGGG AGGGGAAAGG     1560 GTTCTTATCC CTGACACACG TGGTCCCNGC TGNTGTGTNC TNCCCCCACT GANTAGGGTT     1620 AGACTGGACA GGCTTAAACT AATTCCAATT GGNTAATTTA AAGAGAATNA TGGGGTGAAT     1680 GCTTTGGGAG GAGTCAAGGA AGAGNAGGTA GNAGGTAACT TGAATGA                   1727 (2)SEQ ID NO:8的资料: (i)序列特征:
(A)长度:1883个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1883
(D)其它资料:/注=“1Ex6” (xi)序列描述:SEQ ID NO:8: CNCGTATAAA AGACCAACAT TGCCANCNAC AACCACAGGC AAGATCTTCT CCTACCTTCC     60 CCCNNGGTGT AATACCAAGT ATTCNCCAAT TTGTGATAAA CTTTCATTGG AAAGTGACCA     120 CCCTCCTTGG TTAATACATT GTCTGTGCCT GCTTTCACAC TACAGTAGCA CAGTTGAGTG     180 TTTGCCCTGG AGACCATATG ACCCATAGAG CTTAAAATAT TCAGTCTGGC TTTTTACAGA     240 GATGTTTCTG ACTTTGTTAA TAGAAAATCA ACCCAACTGG TTTAAATAAT GCACATACTT     300 TCTCTCTCAT AGAGTAGTGC AGAGGTAGNC AGTCCAGATT AGTASGGTGG CTTCACGTTC     360 ATCCAAGGAC TCAATCTCCT TCTTTCTTCT TTAGCTTCTA ACCTCTAGCT TACTTCAGGG     420 TCCAGGCTGG AGCCCTASCC TTCATTTCTG ACAGTAGGAA GGAGTAGGGG AGAAAAGAAC     480 ATAGGACATG TCAGCAGAAT TCTCTCCTTA GAAGTTCCAT ACACAACACA TCTCCCTAGA     540 AGTCATTGCC CTTACTTGTT CTCATAGCCA TCCTAAATAT AAGGGAGTCA GAAGTAAAGT     600 CTKKNTGGCT GGGAATATTG GCACCTGGAA TAAAAATGTT TTTCTGTGAA TGAGAAACAA     660 GGGGAAGATG GATATGTGAC ATTATCTTAA GACAACTCCA GTTGCAATTA CTCTGCAGAT     720 GAGAGGCACT AATTATAAGC CATATTACCT TTCTTCTGAC AACCACTTGT CAGCCCNCGT     780 GGTTTCTGTG GCAGAATCTG GTTCYATAMC AAGTTCCTAA TAANCTGTAS CCNAAAAAAT     840 TTGATGAGGT ATTATAATTA TTTCAATATA AAGCACCCAC TAGATGGAGC CAGTGTCTGC     900 TTCACATGTT AAGTCCTTCT TTCCATATGT TAGACATTTT CTTTGAAGCA ATTTTAGAGT     960 GTAGCTGTTT TTCTCAGGTT AAAAATTCTT AGCTAGGATT GGTGAGTTGG GGAAAAGTGA     1020 CTTATAAGAT NCGAATTGAA TTAAGAAAAA GAAAATTCTG TGTTGGAGGT GGTAATGTGG     1080 KTGGTGATCT YCATTAACAC TGANCTAGGG CTTTKGKGTT TGCTTTATTG TACAATCTAT     1140 ACCCCATTCA CAGAAGATAC CGAGACTGTG GGCCAGAGAG CCCTGCACTC AATTCTGAAT     1200 GCTGCCATCA TGATCAGTGT CATTGTTGTC ATGACTATCC TCCTGGTGGT TCTGTATAAA     1260 TACAGGTGCT ATAAGGTGAG CATGAGACAC AGATCTTTGN TTTCCACCCT GTTCTTCTTA     1320 TGGTTGGGTA TTCTTGTCAC AGTAACTTAA CTGATCTAGG AAAGAAAAAA TCTTTTGTCT     1330 TCTAGAGATA AGTTAATTTT TAGTTTTCTT CCTCCTCACT GTGGAACATT CAAAAAATAC     1440 AAAAAGGAAG CCAGGTGCAT GTGTAATGCC AGGCTCAGAG GCTGAGGCAG GAGGATCGCT     1500 TGGGCCCAGG AGTTCACAAG CAGCTTGGGC AACGTAGCAA GACCCTGCCT CTATTAAAGA     1560 AAACAAAAAA CAAATATTGG AAGTATTTTA TATGCATGGA ATCTATATGT CATGAAAAAA     1620 TTAGTGTAAA ATATATATAT TATGATTAGN TATCAAGATT TAGTGATAAT TTATGTTATT     1680 TTTGGATTTC AATGCCTTTT TAGGCCATTG TCTCAAMAAA TAAAAGCAGA AAACAAAAAA     1740 AGTTGTAACT GAAAAATAAA CATTTCCATA TAATAGCACA ATCTAAGTGG GTTTTTGNTT     1800 GTTTGTTTGN TTGTTGAAGC AGGGCCTTGC CCTNYCACCC AGGNTGGAGT GAAGTGCAGT     1860 GGCACGATTT TGGCTCACTG CAG                                             1883 (2)SEQ ID NO:9的资料: (i)序列特征:
(A)长度:823个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…823
(D)其它资料:/注=“1Ex7” (xi)序列描述:SEQ ID NO:9: CAGGAGTGGA CTAGGTAAAT GNAAGNTGTT TTAAAGAGAG ATGNGGNCNG GGACATAGTG     60 GTACACANCT GTAATGCTCA NCACTKATGG GGAGTACTGA AGGNGGNSGG ATCACTTGNG     120 GGTCNGGAAT NTGAGANCAG CCTGGGCAAN ATGGCGAAAC CCTGTCTCTA CTAAAAATAG     180 CCANAAWNWA GCCTAGCGTG GTGGCGCRCA CGCGTGGTTC CACCTACTCA GGAGGCNTAA     240 GCACGAGNAN TNCTTGAACC CAGGAGGCAG AGGNTGTGGT GARCTGAGAT CGTGCCACTG     300 CACTCCAGTC TGGGCGACMA AGTGAGACCC TGTCTCCNNN AAGAAAAAAA AAATCTGTAC     360 TTTTTAAGGG TTGTGGGACC TGTTAATTAT ATTGAAATGC TTCTYTTCTA GGTCATCCAT     420 GCCTGGCTTA TTATATCATC TCTATTGTTG CTGTTCTTTT TTTCATTCAT TTACTTGGGG     480 TAAGTTGTGA AATTTGGGGT CTGTCTTTCA GAATTAACTA CCTNNGTGCT GTGTAGCTAT     540 CATTTAAAGC CATGTACTTT GNTGATGAAT TACTCTGAAG TTTTAATTGT NTCCACATAT     600 AGGTCATACT TGGTATATAA AAGACTAGNC AGTATTACTA ATTGAGACAT TCTTCTGTNG     660 CTCCTNGCTT ATAATAAGTA GAACTGAAAG NAACTTAAGA CTACAGTTAA TTCTAAGCCT     720 TTGGGGAAGG ATTATATAGC CTTCTAGTAG GAAGTCTTGT GCNATCAGAA TGTTTNTAAA     780 GAAAGGGTNT CAAGGAATNG TATAAANACC AAAAATAATT GAT                       823 (2) SEQ ID NO:10的资料: (i)序列特征:
(A)长度:945个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…945
(D)其它资料:/注=“1 Ex8” (xi)序列描述:SEQ ID NO:10: GTTNTCCNAA CCAACTTAGG AGNTTGGACC TGGGRAAGAC CNACNTGATC TCCGGGAGGN     60 AAAGACTNCA GTTGAGCCGT GATTGCACCC ACTTTACTCC AAGCCTGGGC AACCAAAATG     120 AGACACTGGC TCCAAACACA AAAACAAAAA CAAAAAAAGA GTAAATTAAT TTANAGGGAA     180 GNATTAAATA AATAATAGCA CAGTTGATAT AGGTTATGGT AAAATTATAA AGGTGGGANA     240 TTAATATCTA ATGTTTGGGA GCCATCACAT TATTCTAAAT AATGTTTTGG TGGAAATTAT     300 TGTACATCTT TTAAAATCTG TGTAATTTTT TTTCAGGGAA GTGTTTAAAA CCTATAACGT     360 TGCTGTGGAC TACATTACTG TTGCACTCCT GATCTGGAAT TTTGGTGTGG TGGGAATGAT     420 TTCCATTCAC TGGAAAGGTC CACTTCGACT CCAGCAGGCA TATCTCATTA TGATTAGTGC     480 CCTCATGGCC CTGGTGTTTA TCAAGTACCT CCCTGAATGG ACTGCGTGGC TCATCTTGGC     540 TGTGATTTCA GTATATGGTA AAACCCAAGA CTGATAATTT GTTTGTCACA GGAATGCCCC     600 ACTGGAGTGT TTTCTTTCCT CATCTCTTTA TCTTGATTTA GAGAAAATGG TAACGTGTAC     660 ATCCCATAAC TCTTCAGTAA ATCATTAATT AGCTATAGTA ACTTTTTCAT TTGAAGATTT     720 CGGCTGGGCA TGGTAGCTCA TGCCTGTAAT CTTAGCACTT TGGGAGGCTG AGGCGGGCAG     780 ATCACCTAAG CCCAGAGTTC AAGACCAGCC TGGGCAACAT GGCAAAACCT CGTATCTACA     840 GAAAATACAA AAATTAGCCG GGCATGGTGG TGCACACCTG TAGTTCCAGC TACTTAGGAG     900 GCTGAGGTGG GAGGATCGAT TGATCCCAGG AGGTCAAGNC TGCAG                     945 (2)SEQ ID NO:11的资料: (i)序列特征:
(A)长度:540个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (xi)序列描述:SEQ ID NO:11:     CTGCAGCTTT CCTTTAAACT AGGAAGACTT GTTCCTATAC CCCAGTAACG ATACACTGTA     60 CACTAAGCAA ATAGCAGTCA AACCCAAATG AAATTTNTAC AGATGTTCTG TGTCATTTTA     120 TNTTGTTTAT GTTGTCTCCC CCACCCCCAC CAGTTCACCT GCCATTTATT TCATATTCAT     180 TCAACGTCTN NNTGTGTAAA AAGAGACAAA AAACATTAAA CTTTTTTCCT TCGTTAATTC     240 CTCCCTACCA CCCATTTACA AGTTTAGCCC ATACATTTTA TTAGATGTCT TTTATGTTTT     300 TCTTTTNCTA GATTTAGTGG CTGTTTTGTG TCCGAAAGGT CCACTTCGTA TGCTGGTTGA     360 AACAGCTCAG GAGAGAAATG AAACGCTTTT TCCAGCTCTC ATTTACTCCT GTAAGTATTT     420 GGAGAATGAT ATTGAATTAG TAATCAGNGT AGAATTTATC GGGAACTTGA AGANATGTNA     480 CTATGGCAAT TTCANGGNAC TTGTCTCATC TTAAATGANA GNATCCCTGG ACTCCTGNAG     540 (2)SEQ ID NO:12的资料: (i)序列特征:
(A)长度:509个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…509
(D)其它资料:/注=“1Ex10” (xi)序列描述:SEQ ID NO:12: CCCCGTCNAT GCATACTTTG TGTGTCCAGT GCTTACCTGG AATCCNGTCT TTCCCAACAG     60 CAACAATGGT GTGGTTGGTG AATATGGCAG AAGGAGACCC GGAAGCTCAA AGGAGAGTAT     120 CCAAAAATTC CAAGTATAAT GCAGAAAGTA GGTAACTYYY NTTAGATAMN ATCTTGATTT     180 TNCAGGGTCA CTGTTATAAG CTAACAGTAT AGNAATGTTT TTATCGTCTT TCTNKGGNCA     240 TAGACTCCTN KGAGAATCTC TTGAGAACTA TGATAATGCC CAGTAAATAC NCAGATAAGT     300 ATTTAAGGAG TNCAGATACT CAAANCCCAA CAATACNGTC AAAGCATCCT AGGTTAAGAC     360 AMCNCCCATT AAATACAGAA TACCAGCATG GAAAGGTTCA GGCTGAGGTT ATGATTGGGT     420 TTGGGTTTTG GGNNNGTTTT TTATAAGTCA TGATTTTAAA AAGAAAAAAT AAACTCTCTC     480 CAAACATGTA AAAGTAAGAA TCTCCTAAA                                       509
(2)SEQ ID NO:13的资料:
(i)序列特征:
(A)长度:1092个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1092
(D)其它资料:/注=“1Ex11” (xi)序列描述:SEQ ID NO:13: GTCTAGATAA GNCAACATTC AGGGGTAGAA GGGGACTGTT TATTTTTTCC TTTAGTCTCT     60 CTTAAAGAGT GAGAAAAATT TTCCCAGGAA TCCCGGTGGA CTTTGCTTCA CCACTCATAG     120 GTTCATACCA AGTTACAACC CCACAACCTT AGAGCTTTTG TTAGGAAGAG GCTTGGTGGG     180 ATTACCGTGC TTGGCTTGGC TTGGTCAGGA TTCACCACCA GAGTCATGTG GGAGGGGGTG     240 GGAACCCAAA CAATTCAGGA TTCTGCCCTC AGGAAATAAA GGAGAAAATA GCTGTTGGAT     300 AAACTACCAG CAGGCACTGC TACAGCCCAT GCTTTGTGGT TTAAGGGCCA GCTAGTTACA     360 ATGACAGCTA GTTACTGTTT CCATGTAATT TTCTTAAAGG TATTAAATTT TTCTAAATAT     420 TAGAGCTGTA ACTTCCACTT TCTCTTGAAG GCACAGAAAG GGAGTCACAA GACACTGTTG     480 CAGAGAATGA TGATGGCGGG TTCAGTGAGG AATGGGAAGC CCAGAGGGAC AGTCATCTAG     540 GGCCTCATCG CTCTACACCT GAGTCACGAG CTGCTGTCCA GGAACTTTCC AGCAGTATC      600 TCGCTGGTGA AGACCCAGAG GAAAGTATGT TCANTTCTCC ATNTTTCAAA GTCATGGATT     660 CCTTTAGGTA GCTACATTAT CAACCTTTTT GAGAATAAAA TGAATTGAGA GTGTTACAGT     720 CTAATTCTAT ATCACATGTA ACTTTTATTT GGATATATCA GTAATAGTGC TTTTTYNTTT     780 TTTTTTTTTT TTTTTTTTTT TTTTNGGNGA NAGAGTCTCG CTCTGTCGCC AGGTTGGAGT     840 GCAATGGTGC GATCTTGGCT CACTGAAAGC TCCACCNCCC GGGTTCAAGT GATTCTCCTG     900 CCTCAGCCNC CCAAGTAGNT GGGACTACAG GGGTGCGCCA CCACGCCTGG GATAATTTTG     960 GGNTTTTTAG TAGAGATGGC GTTTCACCAN CTTGGNGCAG GCTGGTCTTG GAACTCCTGA     1020 NATCATGATC TGCCTGCCTT AGCCTCCCCA AAGTGCTGGG ATTNCAGGGG TGAGCCACTG     1080 TTCCTGGGCC TC                                                         1092 (2)SEQ ID NO:14的资料: (i)序列特征:
(A)长度:1003个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1003
(D)其它资料:/注=“1Ex12” (xi)序列描述:SEQ ID NO:14: CTGCAGTGAG CCGAGATCAT GCTGCTGTAC TCCAGCCTGG GCCACAGAGC CAAACTCCAT     60 CTCCCAAAAA AAAAAAATAT TAATTAATAT GATNAAATGA TGCCTATCTC AGAATTCTTG     120 TAAGGATTTC TTAGKACAAG TGCTGGGTAT AAACTATANA TTCRATAGAT GNCGATTATT     180 ACTTAYTATT GTTATTGATA AATAACAGCA GCATCTACAG TTAAGACTCC AGAGTCAGTC     240 ACATAGAATC TGGNACTCCT ATTGTAGNAA ACCCCNMMAG AAAGAAAACA CAGCTGAAGC     300 CTAATTTTGT ATATCATTTA CTGACTTCTC TCATTCATTG TGGGGTTGAG TAGGGCAGTG     360 ATATTTTTGA ATTGTGAAAT CATANCAAAG AGTGACCAAC TTTTTAATAT TTGTAACCTT     420 TCCTTTTTAG GGGGAGTAAA ACTTGGATTG GGAGATTTCA TTTTCTACAG TGTTCTGGTT     480 GGTAAAGCCT CAGCAACAGC CAGTGGAGAC TGGAACACAA CCATAGCCTG TTTCGTAGCC     540 ATATTAATTG TMMSTATACA CTAATAAGAA TGTGTCAGAG CTCTTAATGT CMAAACTTTG     600 ATTACACAGT CCCTTTAAGG CAGTTCTGTT TTAACCCCAG GTGGGTTAAA TATTCCAGCT     660 ATCTGAGGAG CTTTTNGATA ATTGGACCTC ACCTTAGTAG TTCTCTACCC TGGCCACACA     720 TTAGAATCAC TTGGGAGCTT TTAAAACTGT AAGCTCTGCC CTGAGATATT CTTACTCAAT     780 TTAATTGTGT AGTTTTTAAA ATTCCCCAGG AAATTCTGGT ATTTCTGTTT AGGAACCGCT     840 GCCTCAAGCC TAGCAGCACA GATATGTAGG AAATTAGCTC TGTAAGGTTG GTCTTACAGG     900 GATAAACAGA TCCTTCCTTA GTCCCTGGAC TTAATCACTG AGAGTTTGGG TGGTGGTTTT     960 GGATTTAATG ACACAACCTG TAGCATGCAG TGTTACTTAA GAC                      1003 (2)SEQ ID NO:15的资料: (i)序列特征: 
(A)长度:736个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…736
(D)其它资料:/注=“1Ex13” (xi)序列描述:SEQ ID NO:15: GTCTTTCCCA TCTTCTCCAC AGGGTTTGTG CCTTACATTA TTACTCCTTG CCATTTTCAA     60 GAAAGCATTG CCAGCTCTTC CAATCTCCAT CACCTTTGGG CTTGTTTTCT ACTTTGCCAC     120 AGATTATCTT GTACAGCCTT TTATGGACCA ATTAGCATTC CATCAATTTT ATATCTAGCA     180 TATTTGCGGT TAGAATCCCA TGGATGTTTC TTCTTTGACT ATAACAAAAT CTGGGGAGGA     240 CAAAGGTGAT TTCCTGTGTC CACATCTAAC AAATCAAGAT CCCCGGCTGG ACTTTTGGAG     300 GTTCCTTCCA AGTCTTCCTG ACCACCTTGC ACTATTGGAC TTTGGAAGGA GGTGCCTATA     360 GAAAACGATT TTGAACATAC TTCATCGCAG TGGACTGTGT CCTCGGTGCA GAAACTACCA     420 GATTTGAGGG ACGAGGTCAA GGAGATATGA TAGGCCCGGA AGTTGCTGTG CCCCATCAGC     480 AGCTTGACGC GTGGTCACAG GACGATTTTC ACTGACACTG CGAACTCTCA GGACTACCGT     540 TACCAAGAGG TTAGGTGAAG TGGTTTAAAC CAAACGGAAC TCTTCATCTT AAACTACACG     600 TTGAAAATCA ACCCAATAAT TCTGTATTAA CTGAATTCTG AACTTTTCAG GAGGTACTGT     660 GAGGAAGAGC AGGCACCACC AGCAGAATGG GGAATGGAGA GGTGGGCAGG GGTTCCAGCT     720 TCCCTTTGAT TTTTTG                                                     736 (2)SEQ ID NO:16的资料: (i)序列特征:
(A)长度:1964个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:CDS
(B)位置:188…1588 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1964
(D)其它资料:/注=“mPS1” (xi)序列描述:SEQ ID NO:16: ACCANACANC GGCAGCTGAG GCGGAAACCT AGGCTGCGAG CCGGCCGCCC GGGCGCGGAG    60 AGAGAAGGAA CCAACACAAG ACAGCAGCCC TTCGAGGTCT TTAGGCAGCT TGGAGGAGAA    120 CACATGAGAG AAAGAATCCC AAGAGGTTTT GTTTTCTTTG AGAAGGTATT TCTGTCCAGC    180 TGCTCCA ATG ACA GAG ATA CCT GCA CCT TTG TCC TAC TTC CAG AAT GCC      229
    Met Thr Glu Ile Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala
      1               5                  10 CAG ATG TCT GAG GAC AGC CAC TCC AGC AGC GCC ATC CGG AGC CAG AAT      277 Gln Met Ser Glu Asp Ser His Ser Ser Ser Ala Ile Arg Ser Gln Asn  15                  20                  25                  30 GAC AGC CAA GAA CGG CAG CAG CAG CAT GAC AGG CAG AGA CTT GAC AAC      325 Asp ser Gln Glu Arg Gln Gln Gln His Asp Arg Gln Arg Leu Asp Asn
             35                  40                  45 CCT GAG CCA ATA TCT AAT GGG CGG CCC CAG AGT AAC TCA AGA CAG GTG      373 Pro Glu Pro Ile Ser Asn Gly Arg Pro Gln Ser Asn Ser Arg Gln Val
         50                  55                  60 GTG GAA CAA GAT GAG GAG GAA GAC GAA GAG CTG ACA TTG AAA TAT GGA      421 Val Glu Gln Asp Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly
     65                  70                  75 GCC AAG CAT GTC ATC ATG CTC TTT GTC CCC GTG ACC CTC TGC ATG GTC      469 Ala Lys His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val
 80                  85                  90 GTC GTC GTG GCC ACC ATC AAA TCA GTC AGC TTC TAT ACC CGG AAG GAC      517 Val Val Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp  95                 100                 105                 110 GGT CAG CTA ATC TAC ACC CCA TTC ACA GAA GAC ACT GAG ACT GTA GGC      565 Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly
            115                 120                 125 CAA AGA GCC CTG CAC TCG ATC CTG AAT GCG GCC ATC ATG ATC AGT GTC      613 Gln Arg Ala Leu His Ser Ile Leu Asn Ala Ala Ile Met Ile Ser Val
        130                 135                 140 ATT GTC ATT ATG ACC ATC CTC CTG GTG GTC CTG TAT AAA TAC AGG TGC      661 Ile Val Ile Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys
    145                 150                 155 TAC AAG GTC ATC CAC GCC TGG CTT ATT ATT TCA TCT CTG TTG TTG CTG      709 Tyr Lys Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu
160                 165                 170 TTC TTT TTT TCG TTC ATT TAC TTA GGG GAA GTA TTT AAG ACC TAC AAT      757 Phe Phe Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn 175                 180                 185                 190 GTC GCC GTG GAC TAC GTT ACA GTA GCA CTC CTA ATC TGG AAT TTT GGT      805 Val Ala Val Asp Tyr Val Thr Val Ala Leu Leu Ile Trp Asn Phe Gly
            195                 200                 205 GTG GTC GGG ATG ATT GCC ATC CAC TGG AAA GGC CCC CTT CGA CTG CAG      853 Val Val Gly Met Ile Ala Ile His Trp Lys Gly Pro Leu Arg Leu Gln
        210                 215                 220 CAG GCG TAT CTC ATT ATG ATC AGT GCC CTC ATG GCC CTG GTA TTT ATC      901 Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile
    225                 230                 235 AAG TAC CTC CCC GAA TGG ACC GCA TGG CTC ATC TTG GCT GTG ATT TCA       949 Lys Tyr Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser
240                 245                 250 GTA TAT GAT TTG GTG GCT GTT TTA TGT CCC AAA GGC CCA CTT CGT ATG       997 Val Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met 255                 260                 265                 270 CTG GTT GAA ACA GCT CAG GAA AGA AAT GAG ACT CTC TTT CCA GCT CTT       1045 Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Thr Leu Phe Pro Ala Leu
            275                 280                 285 ATC TAT TCC TCA ACA ATG GTG TGG TTG GTG AAT ATG GCT GAA GGA GAC       1093 Ile Tyr Ser Ser Thr Met Val Trp Leu Val Asn Met Ala Glu Gly Asp
        290                 295                 300 CCA GAA GCC CAA AGG AGG GTA CCC AAG AAC CCC AAG TAT AAC ACA CAA       1141 Pro Glu Ala Gln Arg Arg Val Pro Lys Asn Pro Lys Tyr Asn Thr Gln
    305                 310                 315 AGA GCG GAG AGA GAG ACA CAG GAC AGT GGT TCT GGG AAC GAT GAT GGT       l189 Arg Ala Glu Arg Glu Thr Gln Asp Ser Gly Ser Gly Asn Asp Asp Gly
320                 325                 330 GGC TTC AGT GAG GAG TGG GAG GCC CAA AGA GAC AGT CAC CTG GGG CCT       1237 Gly Phe Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro 335                 340                 345                 350 CAT CGC TCC ACT CCC GAG TCA AGA GCT GCT GTC CAG GAA CTT TCT GGG       1285 His Arg Ser Thr Prc Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Gly
            355                 360                 365 AGC ATT CTA ACG AGT GAA GAC CCG GAG GAA AGA GGA GTA AAA CTT GGA       1333 Ser Ile Leu Thr Ser Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly
        370                 375                 380 CTG GGA GAT TTC ATT TTC TAC AGT GTT CTG GTT GGT AAG GCC TCA GCA       1381 Leu Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala
    385                 390                 395 ACC GCC AGT GGA GAC TGG AAC ACA ACC ATA GCC TGC TTT GTA GCC ATA       1429 Thr Ala Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile
400                 405                 410 CTG ATC GGC CTG TGC CTT ACA TTA CTC CTG CTC GCC ATT TTC AAG AAA       1477 Leu Ile Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys 415                 420                 425                 430 GCG TTG CCA GCC CTC CCC ATC TCC ATC ACC TTC GGG CTC GTG TTC TAC       1525 Ala Leu Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr
            435                 440                 445 TTC GCC ACG GAT TAC CTT GTG CAG CCC TTC ATG GAC CAA CTT GCA TTC       1573 Phe Ala Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe
        450                 455                 460 CAT CAG TTT TAT ATC TAGCCTTTCT GCAGTTAGAA CATGGATGTT TCTTCTTTGA       1628 His Gln Phe Tyr Ile
    465 TTATCAAAAA CACAAAAACA GAGAGCAAGC CCGAGGAGGA GACTGGTGAC TTTCCTGTGT     1688 CCTCAGCTAA CAAAGGCAGG ACTCCAGCTG GACTTCTGCA GCTTCCTTCC GAGTCTCCCT     1748 AGCCACCCGC ACTACTGGAC TGTGGAAGGA AGCGTCTACA GAGGAACGGT TTCCAACATC     1808 CATCGCTGCA GCAGACGGTG TCCCTCAGTG ACTTGAGAGA CAAGGACAAG GAAATGTGCT     1868 GGGCCAAGGA GCTGCCGTGC TCTGCTAGCT TTGACCGTGG GCATGGAGAT TTACCCGCAC     1928 TGTGAACTCT CTAAGGTAAA CAAAGTGAGG TGAACC                               1964 (2)SEQ ID NO:17资料: (i)序列特征:
(A)长度:467个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:17: Met Thr Glu Ile Pro Ala Pro Leu Ser Tyr Phe Gln Asn Ala Gln Met   1               5                  10                  15 Ser Glu Asp Ser His Ser Ser Ser Ala Ile Arg Ser Gln Asn Asp Ser
         20                  25                  30 Gln Glu Arg Gln Gln Gln His Asp Arg Gln Arg Leu Asp Asn Pro Glu
     35                  40                  45 Pro Ile Ser Asn Gly Arg Pro Gln Ser Asn Ser Arg Gln Val Val Glu
 50                  55                  60 Gln AsP Glu Glu Glu Asp Glu Glu Leu Thr Leu Lys Tyr Gly Ala Lys  65                  70                  75                  90 His Val Ile Met Leu Phe Val Pro Val Thr Leu Cys Met Val Val Val
             85                  90                  95 Val Ala Thr Ile Lys Ser Val Ser Phe Tyr Thr Arg Lys Asp Gly Gln
        100                 105                 110   Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr Glu Thr Val Gly Gln Arg
    115                 120                 125 Ala Leu His Ser Ile Leu Ash Ala Ala Ile Met Ile Ser Val Ile Val
130                 135                 140 Ile Met Thr Ile Leu Leu Val Val Leu Tyr Lys Tyr Arg Cys Tyr Lys 145                 150                155                  160 Val Ile His Ala Trp Leu Ile Ile Ser Ser Leu Leu Leu Leu Phe Phe
            165                 170                 175 Phe Ser Phe Ile Tyr Leu Gly Glu Val Phe Lys Thr Tyr Asn Val Ala
        180                 185                 190 Val Asp Tyr Val Thr Val Ala Leu Leu Ile Trp Asn Phe Gly Val Val
    195                 200                 205 Gly Met Ile Ala Ile His Trp Lys Gly Pro Leu Arg Leu Gln Gln Ala
210                 215                 220 Tyr Leu Ile Met Ile Ser Ala Leu Met Ala Leu Val Phe Ile Lys Tyr 225                 230                 235                 240 Leu Pro Glu Trp Thr Ala Trp Leu Ile Leu Ala Val Ile Ser Val Tyr
            245                 250                 255 Asp Leu Val Ala Val Leu Cys Pro Lys Gly Pro Leu Arg Met Leu Val
        260                 265                 270 Glu Thr Ala Gln Glu Arg Asn GLu Thr Leu Phe Pro Ala Leu Ile Tyr
    275                 280                 285 Ser Ser Thr Met Val Trp Leu Val Ash Met Ala Glu Gly Asp Pro Glu
290                 295                 300 Ala Gln Arg Arg Val Pro Lys Asn Pro Lys Tyr Asn Thr Gln Arg Ala 305                 310                 315                 320 Glu Arg Glu Thr Gln Asp Ser Gly Ser Gly Asn Asp Asp Gly Gly Phe
            325                 330                 335 Ser Glu Glu Trp Glu Ala Gln Arg Asp Ser His Leu Gly Pro His Arg
        340                 345                 350 Ser Thr Pro Glu Ser Arg Ala Ala Val Gln Glu Leu Ser Gly Ser Ile
    355                 360                 365 Leu Thr Ser Glu Asp Pro Glu Glu Arg Gly Val Lys Leu Gly Leu Gly
370                 375                 360 Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ala Thr Ala 385                 390                 395                 400 Ser Gly Asp Trp Asn Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile
            405                 410                 415 Gly Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Phe Lys Lys Ala Leu
        420                 425                 430 Pro Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Val Phe Tyr Phe Ala
    435                 440                 445 Thr Asp Tyr Leu Val Gln Pro Phe Met Asp Gln Leu Ala Phe His Gln
450                 455                 460 Phe Tyr Ile 465 (2)SEQ ID NO:18的资料: (i)序列特征:
(A)长度:2229个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:CDS
(B)位置:366…1712 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…2226
(D)其它资料:/注=“hPS2” (xi)序列描述:SEQ ID NO:18: GAATTCGGCA CGAGGGCATT TCCAGCAGTG AGGAGACAGC CAGAAGCAAG CTTTTGGAGC      60 TGAAGGAACC TGAGACAGAA GCTAGTCCCC CCTCTGAATT TTACTGATGA AGAAACTGAG      120 GCCACAGAGC TAAAGTGACT TTTCCCAAGG TCGCCCAGCG AGGACGTGGG ACTTCTCAGA      180 CGTCAGGAGA GTGATGTGAG GGAGCTGTGT GACCATAGAA AGTGACGTGT TAAAAACCAG      240 CGCTGCCCTC TTTGAAAGCC AGGGAGCATC ATTCATTTAG CCTGCTGAGA AGAAGAAACC      300 AAGTGTCCGG GATTCAAGAC CTCTCTGCGG CCCCAAGTGT TCGTGGTGCT TCCAGAGGCA      360 GGGCT ATG CTC ACA TTC ATG GCC TCT GAC AGC GAG GAA GAA GTG TGT          407
  Met Leu Thr Phe Met Ala Ser Asp Ser Glu Glu Glu Val Cys
    1               5                  10 GAT GAG CGG ACG TCC CTA ATG TCG GCC GAG AGC CCC ACG CCG CGC TCC        455 Asp Glu Arg Thr Ser Leu Met Ser Ala Glu Ser Pro Thr Pro Arg Ser  15                  20                  25                  30 TGC CAG GAG GGC AGG CAG GGC CCA GAG GAT GGA GAG AAT ACT GCC CAG        503 Cys Gln Glu Gly Arg Gln Gly Pro Glu Asp Gly Glu Asn Thr Ala Gln
             35                  40                  45 TGG AGA AGC CAG GAG AAC GAG GAG GAC GGT GAG GAG GAC CCT GAC CGC       551 Trp Arg Ser Gln Glu Asn Glu Glu Asp Gly Glu Glu Asp Pro Asp Arg
         50                  55                  60 TAT GTC TGT AGT GGG GTT CCC GGG CGG CCG CCA GGC CTG GAG GAA GAG       599 Tyr Val Cys Ser Gly Val Pro Gly Arg Pro Pro Gly Leu Glu Glu Glu
     65                  70                  75 CTG ACC CTC AAA TAC GGA GCG AAG CAT GTG ATC ATG CTG TTT GTG CCT       647 Leu Thr Lau Lys Tyr Gly Ala Lys His Val Ile Met Leu Phe Val Pro
 80                  85                  90 GTC ACT CTG TGC ATG ATC GTG GTG GTA GCC ACC ATC AAG TCT GTG CGC       695 Val Thr Leu Cys Met Ile Val Val Val Ala Thr Ile Lys Ser Val Arg  95                 100                 105                 110 TTC TAC ACA GAG AAG AAT GGA CAG CTC ATC TAC ACG CCA TTC ACT GAG       743 Phe Tyr Thr Glu Lys Asn Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu
            115                 120                 125 GAC ACA CCC TCG GTG GGC CAG CGC CTC CTC AAC TCC GTG CTG AAC ACC       791 Asp Thr Pro Ser Val Gly Gln Arg Leu Leu Asn Ser Val Leu Asn Thr
        130                 135                 140 CTC ATC ATG ATC AGC GTC ATC GTG GTT ATG ACC ATC TTC TTG GTG GTG       839 Leu Ile Met Ile Ser Val Ile Val Val Met Thr Ile Phe Leu Val Val
    145                 150                 155 CTC TAC AAG TAC CGC TGC TAC AAC TTC ATC CAT GGC TGG TTG ATC ATG       887 Leu Tyr Lys Tyr Arg Cys Tyr Lys Phe Ile His Gly Trp Leu Ile Met
160                 165                 170 TCT TCA CTG ATG CTG CTG TTC CTC TTC ACC TAT ATC TAC CTT GGG GAA       935 Ser Ser Leu Met Leu Leu Phe Leu Phe Thr Tyr Ile Tyr Leu Gly Glu 175                 180                 185                 190 GTG CTC AAG ACC TAC AAT GTG GCC ATG GAC TAC CCC ACC CTC TTG CTG       983 Val Leu Lys Thr Tyr ASn Val Ala Met Asp Tyr Pro Thr Leu Leu Leu
            195                 200                 205 ACT GTC TGG AAC TTC GGG GCA GTG GGC ATG GTG TGC ATC CAC TGG AAG       1031 Thr Val Trp Asn Phe Gly Ala Val Gly MetVal Cys Ile His Trp Lys
        210                 215                220 GGC CCT CTG GTG CTG CAG CAG GCC TAC CTC ATC ATG ATC AGT GCG CTC       1079 Gly Pro Leu Val Leu Gln Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu
    225                 230                 235 ATG GCC CTA GTG TTC ATC AAG TAC CTC CCA GAG TGG TCC GCG TGG GTC       1127 Met Ala Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Ser Ala Trp Val
240                 245                 250 ATC CTG GGC GCC ATC TCT GTG TAT GAT CTC GTG GCT GTG CTG TGT CCC       1175 Ile Leu Gly Ala Ile Ser Val Tyr Asp Leu Val Ala Val Leu Cys Pro 255                 260                 265                 270 AAA GGG CCT CTG AGA ATG CTG GTA GAA ACT GCC CAG GAG AGA AAT GAG       1223 Lys Gly Pro Leu Arg Met Leu Val Glu Thr Ala Gln Glu Arg Asn Glu
            275                 280                 285 CCC ATA TTC CCT GCC CTG ATA TAC TCA TCT GCC ATG GTG TGG ACG GTT       1271 Pro Ile Phe Pro Ala Leu Ile Tyr Ser Ser Ala Met Val Trp Thr Val
        290                 295                 300 GGC ATG GCG AAG CTG GAC CCC TCC TCT CAG GGT GCC CTC CAG CTC CCC       1319 Gly Met Ala Lys Leu Asp Pro Ser Ser Gln Gly Ala Leu Gln Leu Pro
    305                 310                 315 TAC GAC CCG GAG ATG GAA GAA GAC TCC TAT GAC AGT TTT GGG GAG CCT       1367 Tyr Asp Pro Glu Met Glu Glu Asp Ser Tyr Asp Ser Phe Gly Glu Pro
320                 325                 330 TCA TAC CCC GAA GTC TTT GAG CCT CCC TTG ACT GGC TAC CCA GGG GAG       1415 Ser Tyr Pro Glu Val Phe Glu Pro Pro Leu Thr Gly Tyr Pro Gly Glu 335                 340                 345                 350 GAG CTG GAG GAA GAG GAG GAA AGG GGC GTG AAG CTT GGC CTC GGG GAC       1463 Glu Leu Glu Glu Glu Glu Glu Arg Gly Val Lys Leu Gly Leu Gly Asp
            355                 360                 365 TTC ATC TTC TAC AGT GTG CTG GTG GGC AAG GCG GCT GCC ACG GGC AGC       1511 Phe Tle Phe Tyr Ser Val Leu Val Gly Lys Ala Ala Ala Thr Gly Ser
        370                 375                 380 GGG GAC TGG AAT ACC ACG CTG GCC TGC TTC GTG GCC ATC CTC ATT GGC       1559 Gly Asp Trp Asn Thr Thr Leu Ala Cys Phe Val Ala Ile Leu Ile Gly
    385                 390                 395 TTG TGT CTG ACC CTC CTG CTG CTT GCT GTG TTC AAG AAG GCG CTG CCC       1607 Leu Cys Leu Thr Leu Leu Leu Leu Ala Val Phe Lys Lys Ala Leu Pro
400                 405                 410 GCC CTC CCC ATC TCC ATC ACG TTC GGG CTC ATC TTT TAC TTC TCC ACG       1655 Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Ile Phe Tyr Phe Ser Thr 415                 420                 425                 430 GAC AAC CTG GTG CGG CCG TTC ATG GAC ACC CTG GCC TCC CAT CAG CTC       1703 Asp Asn Leu Val Arg Pro Phe Met Asp Thr Leu Ala Ser His Gln Leu
            435                 440                 445 TAC ATC TGA GGGACATGGT GTGCCACAGG CTGCAAGCTG CAGGGAATTT               1752 Tyr Ile  * TCATTGGATG CAGTTGTATA GTTTTACACT CTAGTGCCAT ATATTTTTAA GACTTTTCTT     1812 TCCTTAAAAA ATAAAGTACG TGTTTACTTG GTGAGGAGGA GGCAGAACCA GCTCTTTGGT     1872 GCCAGCTGTT TCATCACCAG ACTTTGGCTC CCGCTTTGGG GAGCGCCTCG CTTCACGGAC     1932 AGGAAGCACA GCAGGTTTAT CCAGATGAAC TGAGAAGGTC AGATTAGGGT GGGGAGAAGA     1992 GCATCCGGCA TGAGGGCTGA GATGCCCAAA GAGTGTGCTC GGGAGTGGCC CCTGGCACCT     2052 GGGTGCTCTG GCTGGAGAGG AAAAGCCAGT TCCCTACGAG GAGTGTTCCC AATGCTTTGT     2112 CCATGATGTC CTTGTTATTT TATTNCCYTT ANAAACTGAN TCCTNTTNTT NTTDCGGCAG     2172 TCACMCTNCT GGGRAGTGGC TTAATAGTAA NATCAATAAA NAGNTGAGTC CTNTTAG        2229 (2)SEQ ID NO:19资料: (i)序列特征:
(A)长度:449个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:19: Met Leu Thr Phe Met Ala Ser Asp Ser Glu Glu Glu Val Cys Asp Glu   1               5                  10                  15 Arg Thr Ser Leu Met Ser Ala Glu Ser Pro Thr Pro Arg Ser Cys Gln
         20                  25                  30 Glu Gly Arg Gln Gly Pro Glu Asp Gly Glu Asn Thr Ala Gln Trp Arg
     35                  40                  45 Ser Gln Glu Asn Glu Glu Asp Gly Glu Glu Asp Pro Asp Arg Tyr Val
 5O                  55                  60 Cys Ser G1y Val Pro Gly Arg Pro Pro Gly Leu Glu Glu Glu Leu Thr  65                  70                  75                  80 Leu Lys Tyr Gly Ala Lys His Val Ile Met Leu Phe Val Pro Val Thr
             85                  90                  95 Leu Cys Met Ile Val Val Val Ala Thr Ile Lys Ser Val Arg Phe Tyr
        100                 105                 110 Thr Glu Lys Asn Gly Gln Leu Ile Tyr Thr Pro Phe Thr Glu Asp Thr
    115                 120                 125 Pro Ser Val Gly Gln Arg Leu Leu Asn Ser Val Leu Asn Thr Leu Ile
130                 135                140 Met Ile Ser Val Ile Val Val Met Thr Ile Phe Leu Val Val Leu Tyr 145                 150                 155                 160 Lys Tyr Arg Cys Tyr Lys Phe Ile His Gly Trp Leu Ile Met Ser Ser
            165                 170                 175 Leu Met Leu Leu Phe Leu Phe Thr Tyr Ile Tyr Leu Gly Glu Val Leu
        180                 185                 190 Lys Thr Tyr Asn Val Ala Met Asp Tyr Pro Thr Leu Leu Leu Thr Val
    195                 200                 205 Trp Ash Phe Gly Ala Val Gly Met Val Cys Ile His Trp Lys Gly Pro
210                 215                 220 Leu Val Leu Gln Gln Ala Tyr Leu Ile Met Ile Ser Ala Leu Met Ala 225                 230                 235                 240 Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Ser Ala Trp Val Ile Leu
            245                 250                 255 Gly Ala Ile Ser Val Tyr Asp Leu Val Ala Val Leu Cys Pro Lys Gly
        260                 265                 270 Pro Leu Arg Met Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Pro Ile
    275                 280                 285 Phe Pro Ala Leu Ile Tyr Ser Ser Ala Met Val Trp Thr Val Gly Met
290                 295                 300 Ala Lys Leu Asp Pro Ser Ser Gln Gly Ala Leu Gln Leu Pro Tyr Asp 305                 310                 315                 320 Pro Glu Met Glu Glu Asp Ser Tyr Asp Ser Phe Gly Glu Pro Ser Tyr
            325                 330                 335 Pro Glu Val Phe Glu Pro Pro Leu Thr Gly Tyr Pro Gly Glu Glu Leu
        340                 345                 350 Glu Glu Glu Glu Glu Arg Gly Val Lys Leu Gly Leu Gly Asp Phe Ile
    355                 360                 365 Phe Tyr Ser Val Leu Val Gly Lys Ala Ala Ala Thr Gly Ser Gly Asp
370                 375                 380 Trp Asn Thr Thr Leu Ala Cys Phe Val Ala Ile Leu Ile Gly Leu Cys 385                 390                 395                 400 Leu Thr Leu Leu Leu Leu Ala Val Phe Lys Lys Ala Leu Pro Ala Leu
            405                 410                 415 Pro Ile Ser Ile Thr Phe Gly Leu Ile Phe Tyr Phe Ser Thr Asp Asn
        420                 425                 430 Leu Val Arg Pro Phe Met Asp Thr Leu Ala Ser His Gln Leu Tyr Ile
    435                 440                 445 (2)SEQ ID NO:20的资料: (i)序列特征:
(A)长度:1895个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (ix)特征:
(A)名称/关键字:CDS
(B)位置:140…1762 (ix)特征:
(A)名称/关键字:misc_特征
(B)位置:1…1895
(D)其它资料:/注=“DmPS” (xi)序列描述:SEQ ID NO:20: TATATGAGTC GCTTTAAAAC AAAAGAAAGT TTTTACCAGC TACATTCCTT TGGTTTCCTT       60 AACTAAATCC CATCACACAA CTACGGCTTC GCAGGGGGAG GCGTCCAGCG CTACGGAGGC       120 GAACGAACGC ACACCACTG ATG GCT GCT GTC AAT CTC CAG GCT TCG TGC TCC        172
                 Met Ala Ala Val Asn Leu Gln Ala Ser Cys Ser
                   1               5                  10 TCC GGG CTC GCC TCT GAG GAT GAC GCC AAT GTG GGC AGC CAG ATA GGC         220 Ser Gly Leu Ala Ser Glu Asp Asp Ala Asn Val Gly Ser Gln Ile Gly
         15                  20                  25 GCG GCG GAG CGT TTG GAA CGA CCT CCA AGG CGG CAA CAG CAG CGG AAC         268 Ala Ala Glu Arg Leu Glu Arg Pro Pro Arg Arg Gln Gln Gln Arg Asn
     30                  35                  40 AAC TAC GGC TCC AGC AAT CAG GAT CAA CCG GAT GCT GCC ATA CTT GCT         316 Asn Tyr Gly Ser Sar Asn Gln Asp Gln Pro Asp Ala Ala Ile Leu Ala
 45                  50                  55 GTG CCC AAT GTG GTG ATG CGT GAA CCT TGT GGC TCG CGC CCT TCA AGA         364 Val Pro Asn Val Val Met Arg Glu Pro Cys Gly Ser Arg Pro Ser Arg  60                  65                  70                  75 CTG ACC GGT GGA GGA GGC GGC AGT GGT GGT CCG CCC ACA AAT GAA ATG         412 Leu Thr Gly Gly Gly Gly Gly Ser Gly Gly Pro Pro Thr Asn Glu Met
             80                  85                  90 GAG GAA GAG CAG GGC CTG AAA TAC GGG GCC CAG CAT GTG ATC AAG TTA         460 Glu Glu Glu Gln Gly Leu Lys Tyr Gly Ala Gln His Val Ile Lys Leu
         95                 100                 105 TTC GTC CCC GTC TCC CTT TGC ATG CIG GTA GTG GTG GCT ACC ATC AAC         508 Phe Val Pro Val Ser Leu Cys Met Leu Val Val Val Ala Thr Ile Asn
    110                 115                 120 TCC ATC AGC TTC TAC AAC AGC ACG GAT GTC TAT CTC CTC TAC ACA CCT         556 Ser Ile Ser Phe Tyr Asn Ser Thr Asp Val Tyr Leu Leu Tyr Thr Pro
125                 130                 135 TTC CAT GAA CAA TCG CCC GAG CCT AGT GTT AAG TTC TGG AGT GCC TTG         604 Phe His Glu Gln Ser Pro Glu Pro Ser Val Lys Phe Trp Ser Ala Leu 140                 145                 150                 155 GCG AAC TCC CTG ATC CTG ATG AGC GTG GTG GTG GTG ATG ACC TTT TTG         652 Ala Asn Ser Leu Ile Leu Met Ser Val Val Val Val Met Thr Phe Leu
            160                 165                 170 CTG ATT GTT TTG TAC AAG AAG CGT TGC TAT CGC ATC ATT CAC GGC TGG         700 Leu Ile Val Leu Tyr Lys Lys Arg Cys Tyr Arg Ile Ile His Gly Trp
        175                 180                 185 CTG ATT CTC TCC TCC TTC ATG TTG TTG TTC ATT TTT ACG TAC TTA TAT       748 Leu Ile Leu Ser Ser Phe Met Leu Leu Phe Ile Pha Thr Tyr Leu Tyr
    190                 195                 200 TTG GAA GAG CTT CTT CGC GCC TAT AAC ATA CCG ATG GAC TAC CCT ACT       796 Leu Glu Glu Leu Leu Arg Ala Tyr Asn Ile Pro Met Asp Tyr Pro Thr
205                 210                 215 GCA CTA CTG ATT ATG TGG AAC TTT GGA GTG GTC GGA ATG ATG TCC ATC       844 Ala Leu Leu Ile Met Trp Asn Phe Gly Val Val Gly Met Met Ser Ile 220                 225                 230                 235 CAT TGG CAG GGA CCT CTG CGG TTG CAG CAA GGA TAT CTC ATT TTC GTG       892 His Trp Gln Gly Pro Leu Arg Leu Gln Gln Gly Tyr Leu Ile Phe Val
            240                 245                 250 GCA GCC TTG ATG GCC TTG GTG TTC ATT AAA TAC CTG CCT GAA TGG ACT       940 Ala Ala Leu Met Ala Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Thr
        255                 260                 265 GCC TGG GCT GTA TTG GCT GCC ATT TCT ATT TGG GAT CTT ATT GCT GTC       988 Ala Trp Ala Val Leu Ala Ala Ile Ger Ile Trp Asp Leu Ile Ala Val
    270                 275                 280 CTT TCG CCA AGA GGA CCC CTC CGC ATT CTG GTG GAA ACG GCT CAG GAG       1036 Leu Ser Pro Arg Gly Pro Leu Arg Ile Leu Val Glu Thr Ala Gln Glu
285                 290                 295 CGA AAT GAG CAA ATC TTC CCC GCT CTG ATT TAT TCA TCC ACT GTC GTT       1084 Arg Asn Glu Gln Ile Phe Pro Ala Leu Ile Tyr Ser Ser Thr Val Val 300                 305                 310                 315 TAC GCA CTT GTA AAC ACT GTT ACG CCG GAG CAA TCG CAG GCC ACA GCT       1132 Tyr Ala Leu Val Asn Thr Val Thr Pro Gln Gln Ser Gln Ala Thr Ala
            320                 325                 330 TCC TCC TCG CCG TCG TCC AGC AAC TCC ACC ACA ACC ACG AGG GCC ACG       1180 Ser Ser Ser Pro Ser Ser Ser Asn Ser Thr Thr Thr Thr Arg Ala Thr
        335                 340                 345 CAG AAC TCG CTG GCT TCG CCA GAG GCA GCA GCG GCT AGT GGC CAA CGC       1228 Gln Asn Ser Leu Ala Ser Pro Glu Ala Ala Ala Ala Ser Gly Gln Arg
    350                 355                 360 ACA GGT AAC TCC CAT CCT CGA CAG AAT CAG CGG GAT GAC GGC AGT GTA       1276 Thr Gly Asn Ser His Pro Arg Gln Asn Gln Arg Asp Asp Gly Ser Val
    365             370                 375 CTG GCA ACT GAA GGT ATG CCA CTT GTG ACT TTT AAA AGC AAT TTG CGC       1324 Leu Ala Thr Glu Gly Met Pro Leu Val Thr Phe Lys Ser Asn Leu Arg 380                 385                 390                 395 GGA AAC GCT GAG GCT GCG GGT TTC ACG CAA GAG TGG TCA GCT AAC TTG       1372 Gly Asn Ala Glu Ala Ala Gly Phe Thr Gln Glu Trp Ser Ala Asn Leu
            400                 405                 410 AGC GAA CGT GTG GCT CGT CGC CAG ATT GAA GTT CAA AGT ACT CAG AGT       1420 5er Glu Arg Val Ala Arg Arg Gln Ile Glu Val Gln Ser Thr Gln Ser
        415                 420                 425 GGA AAC GCT CAG CGC TCC AAC GAG TAT AGG ACA GTA ACA GCT CCG GAT       1468 Gly Asn Ala Gln Arg Ser Asn Glu Tyr Arg Thr Val Thr Ala Pro Asp
    430                 435                 440 CAG AAT CAT CCG GAT GGG CAA GAA GAA CGT GGC ATA AAG CTT GGC CTC       1516 Gln Asn His Pro Asp Gly Gln Glu Glu Arg Gly Ile Lys Leu Gly Leu
445                 450                 455 GGC GAC TTC ATC TTC TAC TCG GTA TTA GTG GGC AAG GCC TCC AGC TAC       1564 Gly Asp Phe Ile Phe Tyr Ser Val Leu Val Gly Lys Ala Ser Ser Tyr 460                 465                 470                 475 GGC GAC TGG ACG ACC ACA ATC GCT TGC TTT GTG GCC ATC CTC ATT GGA      1612 Gly Asp Trp Thr Thr Thr Ile Ala Cys Phe Val Ala Ile Leu Ile Gly
            480                 485                 490 CTC TGC CTC ACT CTT CTG CTT CTG GCC ATT TGG CGC AAG GCG CTA CCC      1660 Leu Cys Leu Thr Leu Leu Leu Leu Ala Ile Trp Arg Lys Ala Leu Pro
        495                 500                 S05 GCC CTG CCC ATC TCA ATA ACG TTC GGA TTG ATA TTT TGC TTC GCC ACT      1708 Ala Leu Pro Ile Ser Ile Thr Phe Gly Leu Ile Phe Cys Phe Ala Thr
    510                 515                 520 AGT GCG GTG GTC AAG CCG TTC ATG GAG GAT CTA TCG GCC AAG CAG GTG      1756 Ser Ala Val Val Lys Pro Phe Met Glu Asp Leu Ser Ala Lys Gln Val
525                 530                 535 TTT ATA TAAACTTGAA AAGACAAGGA CACATCAAGT GTCTTACAGT ATCATAGTCT       1812 Phe Ile 540 AACAAAGCTT TTTGTAATCC AATTCTTTAT TTAACCAAAT GCATAGTAAC AACCTCGACT    1872 AAAAAAAAAA AAAAAAAAAA AAA                                            1895 (2)SEQ ID NO:21资料: (i)序列特征:
(A)长度:541个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:21: Met Ala Ala Val Asn Leu Gln Ala Ser Cys Ser Ser Gly Leu Ala Ser   1               5                  10                  15 Glu Asp Asp Ala Asn Val Gly Ser Gln Ile Gly Ala Ala Glu Arg Leu
         20                  25                  30 Glu Arg Pro Pro Arg Arg Gln Gln Gln Arg Asn Asn Tyr Gly Ser Ser
     35                  40                  45 Asn Gln Asp Gln Pro Asp Ala Ala Ile Leu Ala Val Pro Asn Val Val
 50                  55                  60 Met Arg Glu Pro Cys Gly Ser Arg Pro Ser Arg Lau Thr Gly Gly Gly  65                  70                  75                  80 Gly Gly Ser Gly Gly Pro Pro Thr Asn Glu Met Glu Glu Glu Gln Gly
             85                  90                  95 Leu Lys Tyr Gly Ala Gln His Val Ile Lys Leu Phe Val Pro Val Ser
        100                 105                 110 Leu Cys Met Leu Val Val Val Ala Thr Ile Asn Ser Ile Ser Phe Tyr
    115                 120                 125 Asn Ser Thr Asp Val Tyr Leu Leu Tyr Thr Pro Phe His Glu Gln Ser
130                 135                 140 Pro Glu Pro Ser Val Lys Phe Trp Ser Ala Leu Ala Asn Ser Leu Ile 145                 150                 155                 160 Leu Met Ser Val Val Val Val Met Thr Phe Leu Leu Ile Val Leu Tyr
            165                 170                 175 Lys Lys Arg Cys Tyr Arg Ile Ile His Gly Trp Leu Ile Leu Ser Ser
        180                 185                 190 Phe Met Leu Leu Phe Ile Phe Thr Tyr Leu Tyr Leu Glu Glu Leu Leu
    195                 200                 205 Arg Ala Tyr Asn Ile Pro Met Asp Tyr Pro Thr Ala Leu Leu Ile Met
210                 215                 220 Trp Asn Phe Gly Val Val Gly Met Met Ser Ile His Trp Gln Gly Pro 225                 230                 235                 240 Leu Arg Leu Gln Gln Gly Tyr Leu Ile Phe Val Ala Ala Leu Met Ala
             245                250                 255 Leu Val Phe Ile Lys Tyr Leu Pro Glu Trp Thr Ala Trp Ala Val Leu
        260                 265                 270 Ala Ala Ile Ser Ile Trp Asp Leu Ile Ala Val Leu Ser Pro Arg Gly
    275                 280                 285 Pro Leu Arg Ile Leu Val Glu Thr Ala Gln Glu Arg Asn Glu Gln Ile
290                 295                 300 Phe Pro Ala Leu Ile Tyr Ser Ser Thr Val Val Tyr Ala Leu Val Asn 305                 310                 315                 320 Thr Val Thr Pro Gln Gln Ser Gln Ala Thr Ala Ser Ser Ser Pro Ser
            325                 330                 335 Ser Ser Asn Ser Thr Thr Thr Thr Arg Ala Thr Gln Asn Ser Leu Ala
        340                 345                 350 Ser Pro Glu Ala Ala Ala Ala Ser Gly Gln Arg Thr Gly Asn Ser His
    355                 360                 365 Pro Arg Gln Asn Gln Arg Asp Asp Gly Ser Val Leu Ala Thr Glu Gly
370                 375                 380 Met Pro Leu Val Thr Phe Lys Ser Asn Leu Arg Gly Asn Ala Glu Ala 385                 390                 395                 400 Ala Gly Phe Thr Gln Glu Trp Ser Ala Asn Leu Ser Glu Arg Val Ala
            405                 410                 415 Arg Arg Gln Ile GIu Val Gln Ser Thr Gln Ser Gly Asn Ala Gln Arg
        420                 425                 430 Ser Asn Glu Tyr Arg Thr Val Thr Ala Pro Asp Gln Asn His Pro Asp
    435                 440                 445 Gly Gln Glu Glu Arg Gly Ile Lys Leu Gly Leu Gly Asp Phe Ile Phe
450                 455                 460 Tyr Ser Val Leu Val Gly Lys Ala Ser Ser Tyr Gly Asp Trp Thr Thr 465                 470                 475                 480 Thr Ile Ala Cys Phe Val Ala Ile Leu Ile Gly Leu Cys Leu Thr Leu
            485                 490                 495 Leu Leu Leu Ala Ile Trp Arg Lys Ala Leu Pro Ala Leu Pro Ile Ser
        500                 505                 510 Ile Thr Phe Gly Leu Ile Phe Cys Phe Ala Thr Ser Ala Val Val Lys
    515                 520                 525 Pro Phe Met Glu Asp Leu Ser Ala Lys Gln Val Phe Ile
530                 535                 540 (2)SEQ ID NO:22的资料: (i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (xi)序列描述:SEQ ID NO:22: CTNCCNGART GGACNGYCTG G                                               21 (2)SEQ ID NO:23的资料: (i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (xi)序列描述:SEQ ID NO:23: RCANGCDATN GTNGTRTTCC A                                               21 (2)SEQ ID NO:24的资料: (i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (xi)序列描述:SEQ ID NO:24: TTTTTTCTCG AGACNGCNCA RGARAGAAAY GA                                   32 (2)SEQ ID NO:25的资料: (i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性 (xi)序列描述:SEQ ID NO:25: TTTTTTGGAT CCTARAADAT RAARTCNCC                                       29
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈