本发明总地涉及活性分子,更具体地涉及通过使分子与自身聚集元件连接、融合 或其他方式相联,使得形成的嵌合分子自身装配成较高分子量的团聚体,从而来增强 分子的活性或将不同分子的活性组合起来的方法。本发明还涉及这些嵌合分子本身及 其在治疗、预防和化学加工应用中的用途。
用
生物化学或分子生物学技术来生产具有新的或增强的性质的
蛋白质是非常令 人感兴趣的。一种希望的性质是增强蛋白质的生物学活性,例如提高其循环
半衰期或 免疫原性。
现已用几种方法来增强蛋白质的生物活性,这些方法通常侧重于提高分子的大 小。一种提高蛋白质大小的方法是与另一蛋白质进行化学交联。例如,为了提高蛋白 质的免疫原性,用化学交联剂将感兴趣的
抗原与载体蛋白相偶联。载体的作用是非特 异性地刺激T辅助细胞活性,并将抗原引向抗原呈递细胞(例如专职的抗原呈递细胞 如树突状细胞),在该细胞中抗原经加工与主要组织相容性
复合体(MHC)中在细胞表面 呈递。
出于此目的,现已开发出几种载体系统。例如,通常将小的肽抗原与诸如破伤
风 类毒素(Mulleret al.,1982,Proc.Natl.Acad.Sci.U.S.A.79:569-573)、匙孔血蓝蛋白 (Bittle et al.,1982,Nature 298:30-33)、卵
白蛋白和抹香鲸肌球蛋白等蛋白载体偶联来 提高免疫反应。然而,载体可能会引发与肽抗原无关的强免疫
力,这可能会抑制二次 免疫接种时对肽
疫苗的免疫反应(Schutze et al.,J.Immunol.135:2319-2322)。
抗原输递系统也是基于具体的载体。例如,将预先形成的颗粒用作平台,在该平 台上可偶联和掺入抗原。基于蛋白体(Lowell等人,1988,Science 240:800-802)、免疫 刺激性复合体(Morein 1984,Nature 308:457-460)以及病毒颗粒如HBsAg (Neurath等 人,1989,Mol.Immunol.26:53-62)和轮状病毒内衣壳蛋白(Redmond等人,1991,Mol. Imnunol.28:269-278)的系统已经被开发出来。
还设计了其他载体系统,它们分别使用重组产生的能自己装配成病毒样颗粒 (VLP)或病毒核心样颗粒(CLP)的嵌合病毒衣壳蛋白或病毒核心蛋白。此类典型的嵌合 颗粒包括那些基于
酵母Ty蛋白(Kingsman和Kingsman 1988,Vacc.6:304-306), HBsAg(Valenzuela,1985,Bio/Tech7zol.3:323-326;美国
专利4,722,840;Delpeyroux 等人,1986,Science 233:472-475),乙型
肝炎核心抗原(Clarke H等人,Vaccines 88(Ed. H.Ginsberg,等人,1988)pp.127-131),脊髓灰质炎病毒衣壳蛋白(Burke等人,1988, Nature 332:81-82)或细小病毒衣壳蛋白(Brown等人,1994,Virology 198:477-488)以及
乳头瘤病毒L1和L2衣壳蛋白(美国专利5,618,536)的颗粒。然而,这些载体的用途 受到能插入结构蛋白中而不干扰颗粒的装配的抗原大小的限制。
另外如肽接头也已被用来增强两种或多种不同蛋白的组合的生物学活性。例如, 美国专利5,073,627描述了用肽接头来连接粒细胞-巨噬细胞集落刺激因子(GM-CSF) 蛋白分子与白介素-3(IL-3)蛋白分子形成融合蛋白,该蛋白比GM-CSF或IL-3单独或 组合时更具生物活性。然而,常规的肽接头是刚性的,不可屈曲的。因此,被连接的 蛋白质通常不能弯曲成所需的野生型蛋白质的生物活性构型,或者交联接头或载体蛋 白在空间上阻碍了生物学活性。
信号肽序列(也称为前导序列)是膜转运序列,其介导蛋白质分泌进入各种胞内区 室或胞外环境。通常,信号序列有大约15-35个残基,并由带正电荷的
氨基端、中央 疏
水性区域和羧基端的短氨基酸链组成。用于将蛋白质靶向特定
位置的信号序列已经 在原核和真核细胞中被发现。在细菌中,
噬菌体的主要和次要
外壳蛋白fd信号序列指 导这些蛋白质进入内膜。pBR322的β内酰胺酶蛋白被不同的信号序列引至周质间隙, 而外膜蛋白(如OmpA)被其他信号序列引至其分配的目的地。引导蛋白转运进入内质 网的真核信号序列包括人前胰岛素原、
牛生长
激素和果蝇粘着蛋白的那些信号序列。 这些序列的近N端是2-3个极性残基,在信号序列内有由疏水性氨基酸组成的疏水性 核心。没有发现有其他序列保守性(Lewin,B.,1994,Genes V,Oxford University Press,p. 290;Watson,M.,1984,Nucl.Acids.Res.12:5145-5164)。
生物膜转运已被用于从
转染或转化的细胞表达和输出蛋白质。通过在蛋白质的N 端加入信号序列,已经实现了诸如珠蛋白等通常留在胞质溶液中的蛋白质的分泌 (Lewin,B.,1994,同上)。如美国专利No.5,156,959所述(其公开了一种将基因产物输 出到革兰阴性菌生长培养基中的方法),将外来基因插入重组DNA构建物中来从细菌 细胞中表达和分泌。美国专利5,380,653描述了在芽孢杆菌属中生产胞内蛋白质的表 达载体和方法。美国专利5,712,114描述了用于分泌表达(尤其是从Hansenula polymorpha)的蛋白的重组DNA构建物,它利用了人前
胶原蛋白原(preprocollagen)α-1 蛋白的信号序列。
国际出版物WO97/35887描述了一种B细胞促分裂素前体及其在生产抗原特异性 催化性
抗体中的用途。该前体包含鸡蛋溶菌酶(HEL)的T细胞表面分子结合部分(H), 其侧面连接了一对来自Peptostreptococcus magnum蛋白L的免疫球蛋白结合结构域(L) 作为B细胞表面分子结合部分。LHL构建物对催化性B细胞的特异性作用由屏蔽该 免疫球蛋白结合结构域的抗原提供。催化切割抗原免疫球蛋白结合结构域外露,从而 将免疫球蛋白分子连接到B细胞表面,使得B细胞产生催化性抗体。为了重组产生促 分裂素前体,使OmpA信号肽与B细胞促分裂素前体融合,作为使前体靶向表达进 入细菌周质间隙的一种方式。然而,出人意料地发现所得的融合蛋白自己组装成较高 分子量的团聚体。利用OmpA信号肽的多聚能力设计了非特异性的与任何B细胞表 面的免疫球蛋白分子交联的B细胞促分裂素。该B细胞促分裂素是通过将OmpA信 号肽与蛋白L的免疫球蛋白结合结构域C端融合来构建得到的。
因此,信号序列基本上被用于蛋白表达系统。它们也被用作交联B细胞表面免疫 球蛋白分子的一种手段。然而,迄今为止并没有描述过用信号序列来增强分子的生物 活性(如延长的循环半衰期、较高的效价或增强的免疫原性)或将不同分子的各自活性 组合起来的报道。
发明概述
本发明一方面提供了一种增强感兴趣分子活性的方法,或将不同感兴趣分子的各 自活性组合起来的方法。这些方法通常包括将感兴趣的各个分子与自身聚集元件 (self-coalescing element)(SCE)连接、融合或以其他方式相连,其中自身聚集元件可从 膜转运序列(MTS)或其变体得到或衍生获得。该方法形成的嵌合分子靠SCE来和其他 此类分子聚集成较高分子量的团聚体,该团聚体的性质相对于未团聚的分子得到增强 或提高。
感兴趣的分子可以选自任何有机或无机化合物,但是其通常是
聚合物,典型的是 具有所需生物活性(包括酶活性、抗原活性或治疗活性)的多肽。因此,本发明也涉及 一种嵌合多肽,它包含上述广义上的SCE,该SCE与感兴趣的多肽融合、连接或以 其他方式相联,并在有利于团聚的条件下使各个嵌合分子与其他嵌合分子聚集成更高 级的聚集体。在一个有关的方面,本发明还扩大至包含分离的或纯化的多个此类嵌合 分子的高级团聚体。
本发明还扩大到生产本发明嵌合分子的方法。在某些实施方案中,嵌合分子用化 学合成方法产生。在另一些实施方案中,嵌合分子是通过使SCE与各个感兴趣的分子 化学融合来产生的。在还有一些实施方案中,嵌合分子是用重组方法产生的,在这一 方面,本发明还包括表达载体、宿主细胞、以及在宿主细胞或基因修饰的动物中产生 嵌合多肽的方法。
本发明还扩展至用本文描述的更高级的团聚体用于各种应用的方法,这些应用包 括化学、治疗和预防用途。在一个实施方案中,高级的团聚体仅包含相同或基本上相 似的感兴趣分子,从而使这种“均-团聚体(homo-aggregate)”能以与感兴趣的非团聚 的亲代分子相同的方式使用,尤其当需要有增加的生物活性时。例如,高级的团聚体 包含GM-CSF-SCE嵌合多肽,它的GM-CSF效价比非团聚的GM-CSF更高,它能用 于治疗下文所述的各种造血性
疾病。在另一实施方案中,高级团聚体包含两种或多种 不同的生物活性,其可用于产生由这些活性产物所产生的生物学效应。例如,可以构 建一对嵌合多肽,其中第一嵌合多肽包含白介素-2,第二嵌合多肽包含Fas配体。含 有这些嵌合多肽的高级的团聚体可用于靶向高亲和力IL-2R和Fas的某些白细胞或淋 巴瘤细胞,或刚激活的T细胞。包含多个不同嵌合多肽且需要这些嵌合多肽的活性组 合来实现生物效果的团聚体通常提高了产生生物效果的速度和/或效率,因为不同的感 兴趣多肽是非常靠近的。因此,含有两种或多种不同多肽的“异-团聚体”能表现出协 同作用特征,因此其表现出的活性比类似量的异团聚体中每个多肽在单独使用时的活 性高。
附图简述
图1是表示来自各种生物的膜转运氨基酸序列排列对比的示意图。
图2是表示细菌外膜蛋白对比的示意图。
序列简述
表A 序列编号 序列 长度 SEQ ID NO:1 式I 14亚基 SEQ ID NO:2 式II 3亚基 SEQ ID NO:3 式III 5亚基 SEQ ID NO:4 式IV 6亚基 SEQ ID NO:5 式V 4亚基 SEQ ID NO:6 式VI 4亚基 SEQ ID NO:7 式VII 16亚基 SEQ ID NO:8 式VHI 19亚基 SEQ ID NO:9 式IX 5亚基 序列编号 序列 长度 SEQ ID NO:10 式X 2亚基 SEQ ID NO:11 式XI 3亚基 SEQ ID NO:12 与P.69外膜蛋白前体有关的信号肽-百日咳博德 特氏菌-GenBank登录号AAA22980 34残基 SEQ ID NO:13 与主要外膜蛋白前体有关的信号肽-砂眼衣原体- GenBank登录号AAA23142 22残基 SEQ ID NO:14 与主要外膜蛋白(MONT)前体有关的信号肽-鹦鹉 热衣原体-GenBank登录号AAA23146 22残基 SEQ ID NO:15 与B12受体蛋白BtuB有关的信号肽-大肠杆菌- GenBank登录号AAA23524 20残基 SEQ ID NO:16 与外膜蛋白有关的信号肽-大肠杆菌-GenBank登 录号AAA24243 21残基 SEQ ID NO:17 与Pro-OmpF外膜蛋白有关的信号肽-大肠杆菌- GenBank登录号AAA24244 22残基 SEQ ID NO:18 与外膜蛋白X前体有关的信号肽-阴沟肠杆菌- GenBank登录号AAA24808 27残基 SEQ ID NO:19 与15kd肽聚糖相关外膜脂蛋白前体有关的信号肽 -流感嗜血菌-GenBank登录号AAA24938 24残基 SEQ ID NO:20 与PC蛋白前体有关的信号肽-流感嗜血菌- GenBank登录号AAA24940 23残基 SEQ ID NO:21 与外膜蛋白p1前体有关的信号肽-流感嗜血菌- GenBank登录号AAA24990 21残基 SEQ ID NO:22 与外膜蛋白前体有关的信号肽-流感嗜血菌- GenBank登录号AAA24993 20残基 SEQ ID NO:23 与主要外膜蛋白有关的信号肽-淋病奈瑟氏球菌- GenBank登录号AAA25458 22残基 SEQ ID NO:24 与脂蛋白I前体有关的信号肽-绿脓杆菌-GenBank 登录号AAA25880 24残基 SEQ ID NO:25 与孔蛋白F前体有关的信号肽-绿脓杆菌-GenBank 登录号AAA25973 24残基 SEQ ID NO:26 与外膜蛋白有关的信号肽-粘质沙雷氏菌-GenBank 25残基 序列编号 序列 长度 登录号AAA26566 SEQ ID NO:27 与丝氨酸蛋白酶前体有关的信号肽-粘质沙雷氏菌- GenBank登录号AAA26572 27残基 SEQ ID NO:28 与外膜蛋白前体II有关的信号肽-鼠伤寒沙
门氏菌 -GenBank登录号.AAA27169 21残基 SEQ ID NO:29 与阳离子外膜蛋白前体有关的信号肽-(gtg起始密 码子)-鼠伤寒沙门氏菌-GenBank登录号 AAA27170 20残基 SEQ ID NO:30 与
铁肠螯合素(ferrienterochelin)受体蛋白有关的信 号肽-大肠杆菌-GenBank登录号AAA65994 22残基 SEQ ID NO:31 与外膜蛋白A有关的信号肽-克隆载体 pINIIIompA3-GenBank登录号AAA82946 21残基 SEQ ID NO:32 与λ受体蛋白有关的信号肽-大肠杆菌-GenBank登 录号AAB59058 25残基 SEQ ID NO:33 与周质麦芽糖结合蛋白有关的信号肽-大肠杆菌- GenBank登录号AAB59056 26残基 SEQ ID NO:34 与Opal 1有关的信号肽-脑膜炎奈瑟球菌- GenBank登录号AAC44565 32残基 SEQ ID NO:35 与Opal 2有关的信号肽-脑膜炎奈瑟球菌- GenBank登录号AAC44566 26残基 SEQ ID NO:36 与H.8外膜蛋白前体有关的信号肽-淋病奈瑟氏球 菌-GenBank登录号P07211 21残基 SEQ ID NO:37 与免疫球蛋白A1蛋白酶前体有关的信号肽-(IgAl 蛋白酶)-流感嗜血菌-GenBank登录号P42782 25残基 SEQ ID NO:38 与外膜孔蛋白OmpC前体有关的信号肽-大肠杆 菌-GenBank登录号MMECPC 21残基 SEQ ID NO:39 与HrpA有关的信号肽-Ralstonia solanacearum- GenBank登录号CAB58261 16残基 SEQ ID NO:40 与推定的分泌蛋白有关的信号肽-天蓝色链霉菌 A3(2)-GenBank登录号CAB92608 23残基 SEQ ID NO:41 与外膜孔蛋白OmpF前体有关的信号肽-大肠杆 22残基 序列编号 序列 长度 菌-GenBank登录号MMECF SEQ ID NO:42 与ORF2a前体有关的信号肽-
马尔他布鲁氏菌- GenBank登录号AAA83993 22残基 SEQ ID NO:43 与IgA-特异性丝氨酸肽链内切酶前体有关的信号 肽-淋病奈瑟氏球菌-GenBank登录号AZNHG 27残基 SEQ ID NO:44 与麦芽糖孔蛋白前体(麦芽糖可诱导的孔蛋白)有关 的信号肽-大肠杆菌-GenBank登录号P02943 25残基 SEQ ID NO:45 与粘附和渗透蛋白前体有关的信号肽-流感嗜血菌- GenBank登录号P45387 25残基 SEQ ID NO:46 与粘附和渗透蛋白前体2有关的信号肽-流感嗜血 菌-GenBank登录号P44596 25残基 SEQ ID NO:47 与外膜蛋白F前体(孔蛋白OmpF)有关的信号肽- 大肠杆菌-GenBank登录号P02931 22残基 SEQ ID NO:48 与外膜蛋白C前体(孔蛋白OmpC)有关的信号肽- 大肠杆菌-GenBank登录号P06996 21残基 SEQ ID NO:49 与孔蛋白样蛋白BU359前体有关的信号肽- Buchnera aphidicola (Acyrthosiphon pisum)- GenBank登录号P57440 26残基 SEQ ID NO:50 与外膜蛋白C前体(孔蛋白OmpC)有关的信号肽- 鼠伤寒沙门氏菌-GenBank登录号052503 21残基 SEQ ID NO:51 与外膜孔蛋白E前体有关的信号肽-大肠杆菌- GenBank登录号P02932 23残基 SEQ ID NO:52 与外膜孔蛋白LC前体有关的信号肽-噬菌体PA- 2-GenBank登录号P07238 23残基 SEQ ID NO:53 与外膜孔蛋白OmpD前体有关的信号肽-鼠伤寒沙 门氏菌-GenBank登录号P37592 21残基 SEQ ID NO:54 与外膜蛋白2有关的信号肽-猪霍乱沙门氏菌伤寒 血清型-GenBank登录号Nu-456059 22残基 SEQ ID NO:55 与外膜蛋白S1有关的信号肽-猪霍乱沙门氏菌伤寒 血清型-GenBank登录号Nu-456554 22残基 SEQ ID NO:56 与外膜蛋白C有关的信号肽-猪霍乱沙门氏菌伤寒 22残基 序列编号 序列 长度 血清型-GenBank登录号Nu-456812 SEQ ID NO:57 与外膜蛋白F前体有关的信号肽-伤寒沙门氏菌- GenBank登录号Q56113 22残基 SEQ ID NO:58 与外膜孔蛋白E前体2有关的信号肽-伤寒沙门氏 菌-GenBank登录号Q56119 23残基 SEQ ID NO:59 与外膜蛋白1b(Ib;c)有关的信号肽-大肠杆菌 0157:H7 EDL933-GenBank登录号NP 288795 22残基 SEQ ID NO:60 与外膜蛋白C2有关信号肽-鼠疫耶尔森氏菌- GenBank登录号NP404809 22残基 SEQ ID NO:61 与外膜蛋白C,孔蛋白有关的信号肽-鼠疫耶尔森 氏菌-GenBank登录号NP404824 25残基 SEQ ID NO:62 与推定的外膜孔蛋白C蛋白有关的信号肽-鼠疫耶 尔森氏菌-GenBank登录号NP405004 23残基 SEQ ID NO:63 与外膜蛋白F前体有关的信号肽-猪霍乱沙门氏 菌伤寒血清型-GenBank登录号Nu-455485 23残基 SEQ ID NO:64 与外膜蛋白S2前体有关的信号肽-伤寒沙门氏菌- GenBank登录号Q56111 21残基 SEQ ID NO:65 与外膜蛋白S1前体有关的信号肽-伤寒沙门氏菌- GenBank登录号Q56110 21残基 SEQ ID NO:66 与外膜蛋白C前体有关的信号肽-伤寒沙门氏菌- GenBank登录号P09878 23残基 SEQ ID NO:67 与外膜蛋白A前体有关的信号肽-
肺炎克雷伯氏 菌-GenBank登录号JC6558 22残基 SEQ ID NO:68 与外膜蛋白(ompA)有关的信号肽-鼠伤寒沙门氏 菌-GenBank登录号CAA26037 22残基 SEQ ID NO:69 与OmpA蛋白有关的信号肽-产气肠杆菌- GenBank登录号CAA25062 22残基 SEQ ID NO:70 与外膜蛋白3a(11*;G;d)有关的信号肽-大肠杆 菌-GenBank登录号NP286832 22残基 SEQ ID NO:71 与外膜蛋白A前体2有关的信号肽-痢疾志贺氏 菌-GenBank登录号MMEBAD 22残基 序列编号 序列 长度 SEQ ID NO:72 与外膜蛋白ompA前体有关的信号肽-粘质沙雷 氏菌-GenBank登录号S07298 22残基 SEQ ID NO:73 与推定的外膜蛋白A有关的信号肽-胡萝卜软腐 欧文氏菌-GenBank登录号CAB57308 22残基 SEQ ID NO:74 与推定的外膜孔蛋白A蛋白有关的信号肽-鼠疫耶 尔森氏菌-GenBank登录号NP405026 22残基 SEQ ID NO:75 与OmpA有关的信号肽-多杀巴斯德氏菌- GenBank登录号AAK61593 22残基 SEQ ID NO:76 与外膜蛋白A前体3有关的信号肽-Buchnera sp. APS-GenBank登录号NP240151 22残基 SEQ ID NO:77 与OmpA2有关的信号肽-杜氏嗜血菌-GenBank登 录号AAB4927 25残基 SEQ ID NO:78 与外膜蛋白有关的信号肽-嗜血菌属-GenBank登录 号CAA07454 22残基 SEQ ID NO:79 与外膜蛋白A2有关的信号肽-枯草芽孢杆菌- GenBank登录号I39969 27残基 SEQ ID NO:80 与主要外膜蛋白有关的信号肽-杜氏嗜血菌- GenBank登录号AAB49273 25残基 SEQ ID NO:81 与假设蛋白有关的信号肽-弧菌属-GenBank登录 号CAC40971 22残基 SEQ ID NO:82 与外膜蛋白P5(ompA)有关的信号肽-流感嗜血菌 Rd-GenBank登录号Nu-439322 22残基 SEQ ID NO:83 与伞状(fimbrial)蛋白有关的信号肽-流感嗜血菌- GenBank登录号AAA24959 22残基 SEQ ID NO:84 与信号肽序列有关的信号肽-多杀巴斯德氏菌- GenBank登录号NP245723 22残基 SEQ ID NO:85 与外膜蛋白PomA有关的信号肽-Mannheimia haemolytica-GenBank登录号AAD53408 25残基 SEQ ID NO:86 与假设信号肽蛋白有关的信号肽-苜蓿中华根瘤菌- GenBank登录号Nu-385333 24残基 SEQ ID NO:87 与外膜蛋白34;Omp34有关的信号肽-伴放线放线 22残基 序列编号 序列 长度 杆菌-GenBank登录号AAC00068 SEQ ID NO:88 与US 5,284,768有关的信号肽-人工序列 22残基 SEQ ID NO:89 与US 5,712,114-1有关的信号肽-人工序列 22残基 SEQ ID NO:90 与US 5,712,114-2有关的信号肽-人工序列 22残基 SEQ ID NO:91 编码SEQ ID NO:3所示信号肽的核苷酸序列 102
碱基 SEQ ID NO:92 编码SEQ ID NO:4所示信号肽的核苷酸序列 66碱基 SEQ ID NO:93 编码SEQ ID NO:5所示信号肽的核苷酸序列 66碱基 SEQ ID NO:94 编码SEQ ID NO:6所示信号肽的核苷酸序列 60碱基 SEQ ID NO:95 编码SEQ ID NO:7所示信号肽的核苷酸序列 63碱基 SEQ ID NO:96 编码SEQ ID NO:8所示信号肽的核苷酸序列 66碱基 SEQ ID NO:97 编码SEQ ID NO:9所示信号肽的核苷酸序列 81碱基 SEQ ID NO:98 编码SEQ ID NO:10所示信号肽的核苷酸序列 72碱基 SEQ ID NO:99 编码SEQ ID NO:11所示信号肽的核苷酸序列 69碱基 SEQ ID NO:100 编码SEQ ID NO:12所示信号肽的核苷酸序列 66碱基 SEQ ID NO:101 编码SEQ ID NO:13所示信号肽的核苷酸序列 60碱基 SEQ ID NO:102 编码SEQ ID NO:14所示信号肽的核苷酸序列 66碱基 SEQ ID NO:103 编码SEQ ID NO:15所示信号肽的核苷酸序列 72碱基 SEQ ID NO:104 编码SEQ ID NO:16所示信号肽的核苷酸序列 72碱基 SEQ ID NO:105 编码SEQ ID NO:17所示信号肽的核苷酸序列 75碱基 SEQ ID NO:106 编码SEQ ID NO:18所示信号肽的核苷酸序列 81碱基 SEQ ID NO:107 编码SEQ ID NO:19所示信号肽的核苷酸序列 63碱基 SEQ ID NO:108 编码SEQ ID NO:20所示信号肽的核苷酸序列 60碱基 SEQ ID NO:109 编码SEQ ID NO:21所示信号肽的核苷酸序列 66碱基 SEQ ID NO:110 编码SEQ ID NO:22所示信号肽的核苷酸序列 63碱基 SEQ ID NO:111 编码SEQ ID NO:23所示信号肽的核苷酸序列 75碱基 SEQ ID NO:112 编码SEQ ID NO:24所示信号肽的核苷酸序列 78碱基 SEQ ID NO:113 编码SEQ ID NO:25所示信号肽的核苷酸序列 98碱基 SEQ ID NO:114 编码SEQ ID NO:26所示信号肽的核苷酸序列 78碱基 SEQ ID NO:115 编码SEQ ID NO:30所示信号肽的核苷酸序列 48碱基 SEQ ID NO:116 编码SEQ ID NO:31所示信号肽的核苷酸序列 69碱基 序列编号 序列 长度 SEQ ID NO:117 编码SEQ ID NO:33所示信号肽的核苷酸序列 66碱基 SEQ ID NO:118 编码SEQ ID NO:45所示信号肽的核苷酸序列 66碱基 SEQ ID NO:119 编码SEQ ID NO:46所示信号肽的核苷酸序列 66碱基 SEQ ID NO:120 编码SEQ ID NO:47所示信号肽的核苷酸序列 66碱基 SEQ ID NO:121 编码SEQ ID NO:50所示信号肽的核苷酸序列 66碱基 SEQ ID NO:122 编码SEQ ID NO:59所示信号肽的核苷酸序列 66碱基 SEQ ID NO:123 编码SEQ ID NO:60所示信号肽的核苷酸序列 66碱基 SEQ ID NO:124 编码SEQ ID NO:64所示信号肽的核苷酸序列 66碱基 SEQ ID NO:125 编码SEQ ID NO:66所示信号肽的核苷酸序列 66碱基 SEQ ID NO:126 编码SEQ ID NO:68所示信号肽的核苷酸序列 75碱基 SEQ ID NO:127 编码SEQ ID NO:69所示信号肽的核苷酸序列 66碱基 SEQ ID NO:128 编码SEQ ID NO:71所示信号肽的核苷酸序列 75碱基 SEQ ID NO:129 编码SEQ ID NO:72所示信号肽的核苷酸序列 84碱基 SEQ ID NO:130 编码SEQ ID NO:74所示信号肽的核苷酸序列 66碱基 SEQ ID NO:131 编码SEQ ID NO:76所示信号肽的核苷酸序列 75碱基 SEQ ID NO:132 编码SEQ ID NO:78所示信号肽的核苷酸序列 66碱基 SEQ ID NO:133 可移动的N-端SCE 36残基 SEQ ID NO:134 可移动的C-端SCE 36残基 SEQ ID NO:135 编码N-SCE的核酸序列 63碱基 SEQ ID NO:136 N-SCE 21残基 SEQ ID NO:137 编码SCE-C的核酸序列 63碱基 SEQ ID NO:138 SCE-C 21残基 SEQ ID NO:139 编码鼠GM-SCF的核酸序列 420碱基 SEQ ID NO:140 鼠GM-SCF的氨基酸序列 140残基 SEQ ID NO:141 编码人GM-CSF的核酸序列 429碱基 SEQ ID NO:142 人GM-CSF的氨基酸序列 143残基 SEQ ID NO:143 编码鼠IFN-β的核酸序列 543碱基 SEQ ID NO:144 鼠IFN-β的氨基酸序列 181残基 SEQ ID NO:145 编码人IFN-β的核酸序列 558碱基 SEQ ID NO:146 人IFN-β的氨基酸序列 186残基 序列编号 序列 长度 SEQ ID NO:147 编码鼠IL-1Ra的核酸序列 531碱基 SEQ ID NO:148 鼠IL-1Ra的氨基酸序列 177残基 SEQ ID NO:149 编码人IL-1Ra的核酸序列 528碱基 SEQ ID NO:150 人IL-1Ra的氨基酸序列 176残基 SEQ ID NO:151 编码鼠IL-2的核酸序列 504碱基 SEQ ID NO:152 鼠IL-2的氨基酸序列 152残基 SEQ ID NO:153 编码人IL-2的核酸序列 396碱基 SEQ ID NO:154 人IL-2的氨基酸序列 132残基 SEQ ID NO:155 编码鼠Fas配体的核酸序列 834碱基 SEQ ID NO:156 编码鼠Fas配体的氨基酸酸序列 278残基 SEQ ID NO:157 编码人Fas配体的核酸序列 840碱基 SEQ ID NO:158 人Fas配体的氨基酸序列 280残基 SEQ ID NO:159 编码HEL的核酸序列 438碱基 SEQ ID NO:160 HEL的氨基酸序列 146残基 SEQ ID NO:161 编码Flag标记物(尾序列,tag)的核酸序列 24碱基 SEQ ID NO:162 Flag标记物的氨基酸序列 8残基 SEQ ID NO:163 编码His标记物的核酸序列 18碱基 SEQ ID NO:164 His标记物的氨基酸序列 6残基 SEQ ID NO:165 编码Strep标记物的核酸序列 27碱基 SEQ ID NO:166 Strep标记物的氨基酸序列 9残基 SEQ ID NO:167 间隔臂(Spacer)1的氨基酸序列 5-55残基 SEQ ID NO:168 间隔臂2的氨基酸序列 3残基 SEQ ID NO:169 间隔臂3的氨基酸序列 5-55残基 SEQ ID NO:170 编码间隔臂1的核酸序列,n=0 15碱基 SEQ ID NO:171 间隔臂1的氨基酸序列,n=0 5残基 SEQ ID NO:172 编码间隔臂1的核酸序列,n=1 30碱基 SEQ ID NO:173 间隔臂1的氨基酸序列,n=1 10残基 SEQ ID NO:174 编码间隔臂1的核酸序列,n=2 45碱基 SEQ ID NO:175 间隔臂1的氨基酸序列,n=2 15残基 SEQ ID NO:176 编码间隔臂1的核酸序列,n≥3 60+碱基 序列编号 序列 长度 SEQ ID NO:177 编码间隔臂2的核酸序列 9碱基 SEQ ID NO:178 编码间隔臂3的核酸序列,n=0 15碱基 SEQ ID NO:179 间隔臂3的氨基酸序列,n=0 5残基 SEQ ID NO:180 编码间隔臂3的核酸序列,n=1 30碱基 SEQ ID NO:181 间隔臂3的氨基酸序列,n=1 10残基 SEQ ID NO:182 编码间隔臂3的核酸序列,n=2 45碱基 SEQ ID NO:183 间隔臂3的氨基酸序列,n=2 15残基 SEQ ID NO:184 编码间隔臂3的核酸序列,n≥3 60+碱基 SEQ ID NO:185 编码自身聚集性鼠GM-CSF嵌合构建物的核酸序 列 552碱基 SEQ ID NO:186 SEQ ID NO:185编码的氨基酸序列 182残基 SEQ ID NO:187 编码自身聚集性人GM-CSF嵌合构建物的核酸序 列 579碱基 SEQ ID NO:188 SEQ ID NO:187所编码的氨基酸序列 191残基 SEQ ID NO:189 编码自身聚集性鼠IFN-β嵌合构建物的核酸序列 732碱基 SEQ ID NO:190 SEQ ID NO:190所编码的氨基酸序列 242残基 SEQ ID NO:191 编码自身聚集性人IFN-β嵌合构建物的核酸序列 708碱基 SEQ ID NO:192 SEQ ID NO:191所编码的氨基酸序列 234残基 SEQ ID NO:193 编码自身聚集性鼠IL-1 Ra嵌合构建物的核酸序列 723碱基 SEQ ID NO:194 SEQ ID NO:193所编码的氨基酸序列 239残基 SEQ ID NO:195 编码自身聚集性人IL-1 Ra嵌合构建物的核酸序列 642碱基 SEQ ID NO:196 SEQ ID NO:195所编码的氨基酸序列 212残基 SEQ ID NO:197 编码自身聚集性鼠IL-2嵌合构建物的核酸序列 642碱基 SEQ ID NO:198 SEQ ID NO:197所编码的氨基酸序列 212残基 SEQ ID NO:199 编码自身聚集性人IL-2嵌合构建物的核酸序列 513碱基 SEQ ID NO:200 SEQ ID NO:199所编码的氨基酸序列 169残基 SEQ ID NO:201 编码自身聚集性鼠Fas-L嵌合构建物的核酸序列 960碱基 SEQ ID NO:202 SEQ ID NO:201所编码的氨基酸序列 318残基 SEQ ID NO:203 编码自身聚集性人Fas-L嵌合构建物的核酸序列 993碱基 SEQ ID NO:204 SEQ ID NO:203所编码的氨基酸序列 329残基 序列编号 序列 长度 SEQ ID NO:205 编码自身聚集性HEL嵌合构建物的核酸序列 633碱基 SEQ ID NO:206 SEQ ID NO:205所编码的氨基酸序列 209残基 SEQ ID NO:207 编码自身聚集性小鼠MCP-1的核酸序列 282碱基 SEQ ID NO:208 SEQ ID NO:207所编码的氨基酸序列 94残基 SEQ ID NO:209 编码自身聚集性人MCP-1的核酸序列 294碱基 SEQ ID NO:210 SEQ ID NO:209所编码的氨基酸序列 98残基 SEQ ID NO:211 编码自身聚集性鼠MCP-1嵌合构建物的核酸序列 402碱基 SEQ ID NO:212 SEQ ID NO:211所编码的氨基酸序列 132残基 SEQ ID NO:213 编码自身聚集性人MCP-1嵌合构建物的核酸序列 405碱基 SEQ ID NO:214 SEQ ID NO:213所编码的氨基酸序列 133残基 SEQ ID NO:215 NCE-2的氨基酸序列 20残基 SEQ ID NO:216 人ACTH嵌合肽的氨基酸序列 69残基 SEQ ID NO:217 鼠ACTH嵌合肽的氨基酸序列 65残基 SEQ ID NO:218 人αMSH嵌合肽的氨基酸序列 44残基 SEQ ID NO:219 人βMSH嵌合肽的氨基酸序列 47残基 SEQ ID NO:220 鼠βMSH嵌合肽的氨基酸序列 52残基 SEQ ID NO:221 人γMSH嵌合肽的氨基酸序列 37残基 SEQ ID NO:222 人血管紧张肽I嵌合肽的氨基酸序列 40残基 SEQ ID NO:223 人血管紧张肽II嵌合肽的氨基酸序列 39残基 SEQ ID NO:224 人血管紧张肽III嵌合肽的氨基酸序列 37残基 SEQ ID NO:225 人GHRH嵌合肽I的氨基酸序列 55残基 SEQ ID NO:226 人GHRH嵌合肽I的氨基酸序列 70残基 SEQ ID NO:227 鼠GHRH嵌合肽的氨基酸序列 67残基 SEQ ID NO:228 人IL-1β嵌合肽I的氨基酸序列 35残基 SEQ ID NO:229 人IL-1β嵌合肽II的氨基酸序列 60残基 SEQ ID NO:230 人IL-2嵌合肽I的氨基酸序列 38残基 SEQ ID NO:231 人IL-2嵌合肽II的氨基酸序列 44残基 SEQ ID NO:232 人IL-2嵌合肽III的氨基酸序列 41残基 SEQ ID NO:233 人TNF-α嵌合肽I的氨基酸序列 43残基 SEQ ID NO:234 人TNF-α嵌合肽II的氨基酸序列 52残基 序列编号 序列 长度 SEQ ID NO:235 人TNF-α嵌合肽III的氨基酸序列 46残基 SEQ ID NO:236 人Cys-BAFF-R嵌合肽I的氨基酸序列 54残基 SEQ ID NO:237 人Cys-BAFF-R嵌合肽的氨基酸序列 56残基 SEQ ID NO:238 人P55-TNF-R嵌合肽的氨基酸序列 42残基 SEQ ID NO:239 人P75-TNF-R嵌合肽的氨基酸序列 51残基 SEQ ID NO:240 人IL-6-R嵌合肽的氨基酸序列 43残基 SEQ ID NO:241 L-选择蛋白嵌合肽的氨基酸序列 47残基 SEQ ID NO:242 MUC-1嵌合肽的氨基酸序列 50残基 SEQ ID NO:243 卵白蛋白嵌合肽I的氨基酸序列 48残基 SEQ ID NO:244 卵白蛋白嵌合肽II的氨基酸序列 38残基 SEQ ID NO:245 HIV gp120嵌合肽I的氨基酸序列 51残基 SEQ ID NO:246 HIV gp120嵌合肽II的氨基酸序列 49残基 SEQ ID NO:247 HIV gp120嵌合肽的氨基酸序列 54残基 SEQ ID NO:248 HIV gp41嵌合肽的氨基酸序列 66残基
发明详述
1.定义
除非另有所述,本文所用的所有科技术语具有本发明所属领域技术人员所通常理 解的相同意思。虽然在实施或测试本发明时可采用与本文所述相似或等价的任何方法 和材料,但是本文描述了较佳的方法和材料。出于本发明的目的,下面对下述术语进 行定义。
本文所用的冠词“一”指语法上的一个或一个以上(即至少一个)。例如,“一个元 件”指一个元件或多个元件。
本文所用的术语“约”指相对于参照的数量、水平、数值、尺寸、大小或用量有 多达30%、较佳的20%、更佳的10%的变化的数量、水平、数值、尺寸、大小或用 量。
本文所用的术语“活性”描述的是非团聚的感兴趣分子的活性。因此,例如,如 果感兴趣分子的高级团聚体表现出非团聚分子的活性,则该团聚体有活性。
“双功能交联剂”指含有两个反应基团的
试剂,该试剂因而具有共价连接两个靶 基团的能力。交联剂中的反应基团通常属于功能团类,包括琥珀酰亚胺酯、马来酰亚 胺和卤代乙酰胺如碘代乙酰胺。
“生物活性
片段”指全长亲代多肽的片段,该片段保留了该多肽的活性。例如, 自身聚集元件的生物活性片段将与相同或足够相似的相容性相互聚集成更高级的团 聚体。本文所用的术语“生物活性片段”包括缺失突变体和小肽,例如有至少6,7,8,9, 10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30个毗连氨基酸,它 具有亲代多肽的活性。此类片段可通过施加标准的重组核酸技术或用常规的液相或固 相合成技术来获得。例如,可以参见如Blackwell Scientific Publications出版的 Nicholoson编著的题为《合成疫苗》出版物中Atherton和Shephard编的第9章“肽合 成”中所述的溶液合成或固相合成。或者,可通过
用例如endoLys-C,endoArg-C, endoGlu-C和葡萄球菌V8-蛋白酶等蛋白酶消化本发明的多肽来产生肽。消化的片段 可用例如高效液相层析(HPLC)技术来纯化。
在本
说明书中,除非另有需要,术语“包含”将被理解为包括所述的步骤或元件 或一组步骤或元件,但不排除任何其他的步骤或元件或一组步骤或元件。
“表达载体”指能指导载体所编码的蛋白质合成的任何自主遗传元件。这些表达 载体是本领域技术人员所知道的。
“对应于”指(a)多核苷酸具有的核苷酸序列与参照多核苷酸序列的全部或一部分 基本上相同或互补,或(b)多核苷酸编码的氨基酸序列与肽或蛋白质中的氨基酸序列相 同。该术语的范围还包括肽或多肽具有的氨基酸序列与参照肽或蛋白质中的氨基酸序 列基本相同。
“衍生物”指通过修饰(例如通过本领域所知道的与其他化学分子偶联或复合或 翻译后修饰技术)从
基础序列衍生得到的多肽。术语“衍生物”的范围还包括对亲代序 列作的变动,包括能提供功能性等价的分子的增加或缺失。
术语“有效量”就调节活性或治疗或预防疾病而言指以单剂或一系列剂量的部分 的形式,将该活性用量给予需要此调节、治疗或预防的个体,从而有效地调节该效果 或治疗或预防该疾病。有效量将根据待处理个体的健康和身体状况、待处理个体的分 类、组合物的配方、医学状况的评估以及其他相关因素而异。预计该有效量在常规试 验可确定的较宽范围内。
“双同功能交联剂”指含有相同反应基团的试剂,其主要用于连接相同的靶基团, 如两个巯基或两个氨基。
“双异功能交联剂”指含有不相似化学性质的反应基团的试剂,因而能在不同的 官能团之间形成交联。
“高级”指至少有10,12,15,20,25,50,75,100,150,200,300,400,500,600,700, 800,900,1000个分子的团聚体。
本文所用的“杂交”指互补核苷酸序列
配对产生DNA-DNA杂交体或DNA-RNA 杂交体。互补碱基序列是碱基配对原则所确定的相关的那些序列。在DNA中,A与 T配对,C与G配对。在RNA中,U与A配对,C与G配对。在这一方面,本文所 用的术语“匹配”和“错配”指互补核酸链中配对核苷酸的杂交潜力。匹配的核酸会 有效地杂交,如上述典型的A-T和G-C碱基配对。错配是其他核苷酸的组合,其不 能有效地杂交。
“分离的”指物质基本上或实质上与该物质天然状态下所通常伴随的组分相分 离。例如,本文所用的“分离的多核苷酸”指该多核苷酸从其天然状态下侧接的序列 相分离而纯化得到,例如DNA片段从通常毗邻该片段的序列中取出。或者,本文所 用的“分离的肽”或“分离的多肽”等指肽或多肽分子从其天然细胞环境中、尤其是 从其与其他细胞组分的连接中体外分离和/或纯化出来,即,它不伴有体内物质。
“标记基因”指赋予表达标记基因的细胞独特表型的基因,从而其能使转化的细 胞与没有该标记物的细胞相区分。可选择的标记基因赋予了一个特征,以便人们可根 据对选择性因素(例如
除草剂、抗生素、辐照、加热或其他破坏未转化细胞的处理)的 抗性来选择。可筛选的标记基因(或报道基因)(如β-葡糖苷酸酶、萤光素酶或未转化细 胞中不存在的其他酶活性)赋予了一个特征,人们能通过观察或测试,即通过“筛选” 来
鉴别转化的细胞。
本文所用的“膜转运序列”是能介导多肽运输入胞内区室或
定位或输出至胞外环 境的氨基酸序列。
“从……获得”指从特定来源中分离或衍生得到的样品,例如核酸抽提物或多肽 抽提物。例如,抽提物可以从含有膜转运序列的生物(例如但不局限于细菌、酵母和植 物,以及动物,包括
哺乳动物、
鸟类、爬行动物、鱼类和昆虫)直接分离得到。
本文所用的术语“寡核苷酸”指由多个核苷酸单元(脱
氧核糖核苷酸或核糖核苷 酸或其有关的结构变体或合成类似物)通过
磷酸二酯键连接组成的聚合物(或其有关的 结构变体或合成类似物)。因此,尽管术语“寡核苷酸”通常指具有天然存在的核苷酸 和其间连接的核苷酸聚合物,但是应当理解,该术语的范围也包括各种类似物,包括 但不局限于肽核酸(PNA)、氨基磷酸酯、硫代磷酸酯、磷酸甲酯、2-O-甲基核糖核酸 等。该分子的确切大小将根据具体应用而异。寡核苷酸的长度通常较短,通常约10- 30个核苷酸。尽管通常用“多核苷酸”或“核酸”指大的寡核苷酸,但是该术语指的 是具有任何长度的分子。
“操作性相连”指转录和翻译调控性核酸所处的位置相对于编码多肽的多核苷酸 而言使得该多核苷酸被转录且翻译成多肽。
本文所用的术语“对象”、“个体”或“患者”可互换,指需要治疗或预防的任何 对象,尤其是
脊椎动物对象,更具体的是哺乳动物对象。在本发明范围内的合适的脊 椎动物包括但不局限于灵长类、鸟类、鱼类、爬行动物类、
家畜(如
绵羊、母牛、马、 驴、猪)、实验室试验动物(如兔、小鼠、大鼠、豚鼠、仓鼠)、伴侣动物(如猫、狗)和 捕获的野生动物(如狐狸、鹿、野狗)。然而,应当理解上述术语不暗示着有症状存在。
“药学上可接受的载体”指固体或液体填充剂、稀释剂或包胶物质,它们能安全 地用于给患者局部或全身
给药。
本文所用的术语“多核苷酸”或“核酸”指mRNA、RNA、cRNA、cDNA或DNA。 该术语通常指长度大于30个核苷酸的寡核苷酸。
术语“寡核苷酸变体”和“变体”指表现出与参比的多核苷酸序列基本上序列相 同的多核苷酸,或与参比序列在下述定义的严谨条件下杂交的多核苷酸。这些术语还 包括其中有一个或多个核苷酸加入或缺失或被不同核苷酸取代的多核苷酸。在这一方 面,本领域技术人员熟知,可对参照多核苷酸作某些改动(包括突变、增加、缺失和取 代),但使改变的多核苷酸保留参照多核苷酸的生物功能或活性。术语“多核苷酸变体” 和“变体”还包括天然存在的等位基因变体。
本文的“多肽”、“肽”和“蛋白质”可互换使用,其指氨基酸残基的聚合物及其 变体和合成类似物。因此,这些术语也适用于其中有一个或多个氨基酸残基是合成的 非天然存在的氨基酸(例如对应于天然存在的氨基酸的化学类似物以及天然存在的氨 基酸聚合物)的氨基酸聚合物。
术语“多肽变体”指通过增加、缺失或置换而与参照多肽有至少一个氨基酸不同 的多肽。在某些实施方案中,多肽变体与参照多肽的不同在于有一个或多个保守或非 保守性置换。在某些方案中,所述多肽变体包含保守性置换。在这一方面,本领域技 术人员周知,某些氨基酸能变为具有相似性质的其他氨基酸而不改变多肽的活性本 质。多肽变异体还包括其中有一个或多个氨基酸加入或缺失或被不同氨基酸残基取代 的多肽。
“引物”指一寡核苷酸,当其与DNA链配对时,它能在合适的聚合剂存在下引 发引物延伸产物的合成。为了有最大的扩增效率,该引物宜为单链,但是也可以是双 链。引物应当足够长,以在聚合剂存在下引发延伸产物的合成。引物的长度取决于许 多因素,包括用途,所用
温度、模板反应条件、其他试剂和引物的来源。例如,根据 靶序列的复杂性,寡核苷酸引物通常含有15-35个或更多核苷酸残基,但是也可含有 较少的核苷酸残基。引物可以是大的多核苷酸,例如约35个核苷酸至数千碱基或更 多。可以选择与设计的模板序列“基本上互补”的引物,以发生杂交和作为合成起始 位点。“基本上互补”指引物与靶多核苷酸充分地互补足以进行杂交。较佳的是,引 物与待设计杂交的模板之间没有错配,但这不是必需的。例如,不互补的核苷酸残基 可以与引物的5′端结合,而引物序列其余部分与模板互补。或者,可将不互补的核苷 酸残基或一段不互补的核苷酸残基引入引物中,只要该引物序列与待杂交的模板序列 充分互补从而形成了便于引物延伸产物合成的模板。
“探针”指与另一分子的特定序列或亚序列或其他部分结合的分子。除非另有所 述,术语“探针”通常指通过互补碱基配对与另一多核苷酸(通常称为“靶多核苷酸”) 结合的多核苷酸探针。探针能结合与探针缺少完整序列互补性的靶多核苷酸,这取决 于杂交条件的严谨程度。探针可直接或间接标记。
术语“纯化的多肽”或“纯化的蛋白质”等指多肽或蛋白质基本上没有来自衍生 获得该蛋白的细胞或组织的细胞物质或其他污染性蛋白,或者当得自化学合成时,基 本上没有化学前体或其他化学物质。“基本上没有”指本发明的嵌合多肽制备物至少 是10%纯的。在某些方案中,嵌合多肽的制备物含有不到约30%、20%、10%、更 佳的是不到5%(干重)的非嵌合性多肽蛋白(本文也称为“污染性蛋白”)或化学前体或 非嵌合性多肽化学物质。本发明包括分离或纯化的至少有0.01、0.1、1.0和10毫克干 重的制备物。
本文所用的术语“重组多肽”指通过将核酸处理成非天然存在的形式而体外产生 的多核苷酸。例如,重组多核苷酸可以是表达载体的形式。通常,此类表达载体包括 与核苷酸序列操作性相连的转录和翻译调控核酸。
“重组多肽”指用重组技术(即通过重组体或合成的多核苷酸的表达)制成的多肽。 当用重组方法产生嵌合多肽或其生物活性部分,较佳的是它也是基本上没有培养基, 即培养基占蛋白质制备物的体积不到约20%,更佳的低于约10%,最佳的低于约5 %。
用于描述两种或多种多核苷酸或多肽之间序列关系的术语包括“参照序列”、“比 较窗口”、“序列相同性”、“序列相同百分数”和“基本上相同”。“参照序列”的长度 是至少12个、有时15-18个、通常至少25
单体单元(包括核苷酸和氨基酸残基)。由 于两个多核苷酸各自包含(1)在两个多核苷酸之间相似的序列(即只是完整多核苷酸序 列的一部分),和(2)两个多核苷酸之间不同的序列,通常在两个(或多个)多核苷酸之间 进行序列比较,其通常是在“比较窗口”内比较两个多核苷酸的序列,以鉴定和比较 局部区域的序列相似性。“比较窗口”指具有至少50个、通常为50-100个、更通常为 100-150个毗连位置的概念上的区段,在两个序列以最优方式排列对齐后,在比较窗 口内比较序列参照序列相同数量的毗连位置。对于两个序列的最优排列对齐,比较窗 口可含有比没有增加或减少的参照序列多或少(即空隙)大约20%或更少的残基。对于 比较窗口的序列最优对齐可用计算机执行的
算法(GAP,BESTFIT,FASTA,和TFASTA, Wisconsin Genetics Software Package Release 7.0,Genetics Computer Group,575 Science Drive Madison,WI,USA)或通过观察来进行,然后选出各种方法之一所产生的最佳对 齐(即导致在比较窗口内有最高百分数的同源性)。另外可参见例如由Altschul等人在 1997年Nucl.Acids Res.25:3389中公开的BLAST系列程序。关于序列分析的详细讨 论可见Ausubel等人″Current Protocols in Molecular Biology″,John Wiley & Sons Inc, 1994-1998,第15章单元19.3。
本文所用的术语“自身聚集”指预计能与相同的多肽以及自身聚集元件氨基酸序 列中高相似性(例如序列差异低于20%,更佳的低于10%)但非完全相同性的多肽聚集 的自身聚集元件。
“自身聚集元件”、“SCE”等指在与感兴趣分子偶联时能使分子与相同分子自身 聚集成高级团聚体的任何氨基酸序列。
本文所用的术语“序列相同性”指在比较窗口内二序列的核苷酸与核苷酸或氨基 酸与氨基酸的相同程度。因此,通过在比较窗口内比较两个最优对齐的序列,确定两 个序列中相同核酸碱基(例如A,T,C,G,I)或相同氨基酸残基(例如Ala,Pro,Ser,Thr, Gly,Val,Leu,Ile,Phe,Tyr,Trp,Lys,Arg,His,Asp,Glu,Asn,Gln,Cys和Met)产生的匹 配位置数量,将匹配位置数除以比较窗口内的位置总数(即窗口大小),将结果乘以100 得到序列相同性百分数,从而计算出序列相同性。出于本发明的目的,“序列相同性” 被理解为指通过DNASIS
计算机程序(Version 2.5 for windows;购自Hitachi Software engineering Co.,Ltd.,South San Francisco,California,USA)以
软件所附参考手册中标 准默认值计算出的“匹配百分数”。
“相似性”指相同的或构成如下表B所定义的保守性置换的氨基酸百分数。相似 性可用例如GAP(Deveraux et al.1984,Nucleic Acids Research 12,387-395)等序列比较 程度来确定。这样,长度与本文所述那些序列相似或基本上不同的序列可通过在对齐 中插入空隙来进行比较,这些空隙可用例如GAP所用的比较算法来确定。
本文所用的“严谨性”指杂交和洗涤过程期间的温度和离子强度条件,以及某些
有机溶剂的存在与否。严谨性越高,固定的靶核苷酸序列与洗涤后仍然与靶杂交的标 记的探针多核苷酸序列之间的互补性程度就越高。
“严谨的条件”指这样的温度和离子条件,在该条件下,只有具有很高互补率的 核苷酸序列才会杂交。所需严谨性取决于核苷酸序列,以及杂交和随后洗涤期间存在 的各组分,进行这些过程所用的时间。通常,为了使杂交速度最大,选择非严谨的杂 交条件;比
热解链温度(Tm)低大约20-25℃。Tm是50%特异性靶序列与完全互补的 探针在确定的离子强度和pH溶液中发生杂交时的温度。通常,若为了要求杂交序列 有至少大约85%核苷酸互补性,选择比Tm低大约5-15℃的高度严谨的洗涤条件。若 为了要求杂交序列有至少约70%的核苷酸互补性,选择中等严谨的洗涤条件,使温度 比Tm低15-30℃。高度容许性(低严谨性)洗涤条件可比Tm低50℃,从而使杂交序列 之间有高水平的错配。本领域技术人员会认识到,可改变杂交和洗涤阶段的其他物理 和化学参数,从而根据靶和探针序列之间特定同源性水平来影响所产生的检测杂交信 号的结果。其他严谨性条件的例子在3.3节中有所描述。
术语“转化”指通过导入外来或内源核酸来改变生物(如细菌、酵母或
植物)的基 因型。
本文所用的术语“转基因”指已经或即将以人工方法插入细胞(具体是活动物的 细胞)基因组的遗传物质。转基因用于转化细胞,意味着在掺入外源核酸(通常是DNA) 后细胞诱导产生了永久或临时性的遗传变化(有利的是永久的遗传变化)。永久的遗传 变化通常是通过将DNA导入细胞基因组来实现的。用于稳定整合的载体包括质粒、 逆转录病毒和其他动物病毒、YAC(酵母菌的人造
染色体)、BAC(细菌的人造染色体) 等。转基因宜从动物衍生获得,这些动物包括但不局限于脊椎动物,较佳的是哺乳动 物如啮齿类动物、人、非人灵长动物、羊、牛、
反刍动物、兔、猪、山羊、马、犬、 猫、鸟类等。
本文所用的术语“转基因的”指经遗传修饰的动物,该动物中的内源基因组通过 随机或定点整合外来基因或序列来得到补充或改变。
本发明的“转基因动物”可通过对动物种系的基因组进行实验室操作来产生。这 些经基因工程改造的动物可用几种方法来产生,包括通过人为介入将包含核酸(通常是 DNA)的“转基因”导入胚胎靶细胞或整合入动物的
体细胞和/或生殖细胞中。转基因 动物是通过导入转基因基因组发生改变的动物。
“载体”指从例如质粒、噬菌体、酵母或病毒衍生获得的多核苷酸分子,较佳的 是DNA分子,其中可插入或克隆入多核苷酸。载体宜含有一个或多个独特的限制性 位点,并能在确定的宿主细胞(包括靶细胞或组织或祖细胞或其组织)中自主复制,或 能整合入确定的宿主中,从而使克隆的序列能复制。因此,载体可以是自主复制性载 体,即载体可作为染色体外的实体而存在,能独立于染色体进行复制,例如线性或闭 合的圆形质粒、染色体外元件、极微染色体或人造染色体。载体可含有确保自身复制 的任何手段。或者,载体在导入宿主细胞后能整合到基因组中与其所整合的染色体一 起复制。载体系统可包含一个载体或质粒、两种或多种载体或质粒(其合起来含有待导 入宿主细胞基因组的总DNA)或转座子。载体的选择通常取决于载体与待导入载体的 宿主细胞的相容性。在本案中,载体宜为病毒或病毒衍生的载体,其在动物(较佳的是 哺乳动物)中具有功能。这些载体可从痘病毒、腺病毒或酵母菌衍生获得。载体还可包 括选择性标记物,例如可用于选择合适转化子的抗生素抗性基因。这些抗性基因的例 子是本领域技术人员所知道的,包括赋予对抗生素卡那霉素和G418(Geneticin_)抗性 的nptII基因和赋予对抗生素潮霉素B抗性的hph基因。
2.本发明的高级团聚体
本发明还扩展至除蛋白表达系统外的信号肽生物学的应用,并提供了不同的和实 用的用途,这些用途利用了信号肽的自身聚集性质。不希望受任何特定的理论或运作 模式的束缚,认为信号肽的主要疏水性质至少部分使得信号与其他同样的肽聚集成高 级多聚体或团聚体。因此,本发明提出信号肽的自团聚性质可广泛用于将多种相同或 不同分子聚集成具有新的或增强性质的高级团聚体。本发明的团聚体可用于各种用 途,包括下述的化学、治疗和预防用途。
在描述含有相同或基本相似的感兴趣分子的团聚体时,采用了前缀“同”。当将 “增强的活性”用于高级的均-团聚体时,其包括延长的半衰期(例如与天然存在的或 感兴趣亲代分子相比更长的半衰期)或较高的效能(例如相对于天然存在的或亲代分子 需要更小的量即可达到特定的活性水平)。增强的活性还包括上述活性的组合,例如高 级团聚体具有较高的效力且也表现出延长的半衰期。测定感兴趣分子的特定活性的试 验是本领域技术人员所熟知的。
信号肽的自身聚集性质也可用来使不同的感兴趣分子聚集成高级团聚体。在描述 含有一种以上感兴趣分子的团聚体时,使用前缀“异”。例如,异-团聚体包含两种或 多种感兴趣的分子,这些分子中的一个或多个与其余分子中的一个或多个不同。这样 的异团聚体可表现出感兴趣分子在未团聚时的活性总和。或者,异-团聚体可表现出协 同的特征,因此表现出的活性大于相同量的团聚体中每个感兴趣分子在单独使用时所 表现出的活性。
因此,本发明一方面提供了一种分离的或纯化的高级团聚体,它包含多个嵌合分 子,其中每个嵌合分子包含至少一个从膜转运序列或其变体获得或衍生得到的自身聚 集元件,该元件与感兴趣的分子融合、连接或以其他方式相连,其中所述或每个自身 聚集元件能在有利于团聚的条件下使各嵌合分子与其他嵌合分子聚集形成高级团聚 体。团聚体的至少一个嵌合分子宜与选自以下的嵌合分子不同:(I)B细胞激活融合蛋 白,其包含B细胞表面免疫球蛋白结合结构域和信号肽,其中前体的催化性产物能诱 导B细胞有丝分裂;或(2)包含蛋白L和ompA的融合蛋白(在美国专利6,521,741中有 所描述)。
团聚体的嵌合分子可以是相同的或不同的,就此而言,嵌合分子可含有相同或不 同的感兴趣,或相同或不同的自身聚集元件(SLE)。在较佳的方案中,感兴趣分子是 多肽,在这一点上,(1)术语“高级”意味着排除了已知的活性复合体中含多肽二聚体、 四聚体或其他少数多肽亚基的许多蛋白;(2)术语“高级团聚体”意味着排除了能在非 生理条件下形成的变性蛋白的随机团聚物;(3)术语“自身聚集(自身聚集)”指多肽与 具有相同氨基酸序列在本文所述条件下形成有序的团聚体的性质,其并不表示聚集会 在每一浓度或每种条件下自然发生。
2.1自身聚集元件
自身聚集元件(SCL)基本上由大约8-35个氨基酸残基、更佳的约15-30个氨基酸 残基组成,其中约60-95%、更佳的约70-90%的残基是小的或疏水性氨基酸残基或其
修改形式。一个或多个极性或带电荷的氨基酸残基紧密地位于毗邻SCE的一端或两端 处(例如在大约5个氨基酸残基内)。位于或毗邻于(例如在距离约2个氨基酸残基 内)SCE羧基端的小的氨基酸残基也是所希望的。这一保守性在例如图1中有所描述, 该图显示了来自各物种的不同膜转运氨基酸序列的排列对比结果。更显著的保守性显 示在图2中,该图显示了来自细菌外膜蛋白的膜转运氨基酸序列的排列对比结果。
在一个方案中,SCE用下式表示:
B1-X1[Xj]nX2X3X4X5[Xk]nX6[X1]nX7X8X9-Z1(I)[SEQ ID NO:1]
其中:B1没有,或是具有n个氨基酸残基的序列,其中n约为1-50,该序列包 含选自任何氨基酸残基的相同或不同氨基酸残基;
X1是疏水性的、小的、中性或碱性氨基酸残基或其修饰形式;
[Xj]n是具有n个氨基酸残基的序列,其中n为0-2,该序列中Xj包含选自任何 氨基酸残基的相同或不同氨基酸残基;
X2是疏水性的、小的或极性氨基酸残基或其修饰形式;
X3是疏水性的、小的或中性/极性氨基酸残基或其修饰形式;
X4是疏水性或小的氨基酸残基或其修饰形式;
X5是疏水性或小的氨基酸残基或其修饰形式;
[Xk]n是具有n个氨基酸残基的序列,其中n为4-6,且该序列中Xk包含相同或 不同的氨基酸残基,所述残基选自疏水性的、小的、极性或中性氨基酸残基或其修饰 形式;
X6是疏水性或小的氨基酸残基或其修饰形式;
[X1]n是具有n个氨基酸残基的序列,其中n为2-4,该序列中序列X1包含相同或 不同的氨基酸残基,所述残基选自疏水性的、小的或极性氨基酸残基或其修饰形式;
X7是疏水性的、小的、带电荷或中性/极性氨基酸残基或其修饰形式;
X8是中性/极性、带电荷的、疏水性的、或小的氨基酸残基或其修饰形式;
X9是任选的,当其存在时,其选自小的或带电荷的氨基酸残基或其修饰形式;和
Z1不存在,或是具有n个氨基酸残基的序列,其中n约为1-50,其中该序列包含 选自任何氨基酸残基的相同或不同氨基酸残基。
当B1存在时,宜为具有约1-20个氨基酸残基的序列。在此类方案中,B1用下 式表示:
B2J1[Xi]n(II)[SEQ ID NO:2]
其中:B2不存在,或是具有n个氨基酸残基的序列,其中n约为1-15,其中该 序列包含选自任何氨基酸残基的相同或不同氨基酸残基,条件是J1也存在;
J1不存在,或是疏水性的,带电荷的,中性/极性或小的氨基酸残基或其修饰形式, 条件是[Xi]n也存在;和
[Xi]n是具有n个氨基酸残基的序列,其中n为2-5,其中序列Xi包含选自任何 氨基酸残基的相同或不同氨基酸残基。
在一些方案中,J1是疏水性氨基酸残基,例如,J1选自Phe和Ile,或其修饰形式。 在其他方案中,J1是带电荷的氨基酸残基,典型的碱性氨基酸残基,例如,J1选自 His,Lys或Arg,或其修饰形式。在还有其他方案中,J1是中性/极性氨基酸残基,例 如,Asn,或其修饰形式。在还有其他方案中,J1是小的氨基酸残基,例如,J1选自 Ser或Thr,或其修饰形式。
在某些方案中,[Xi]n用下式表示:
O1O2O3O4O5(III)[SEQ ID NO:3]
其中:O1至O5中存在至少两个,其中:O1选自疏水性氨基酸残基,例如,O1 选自Leu或Ile或其修饰形式,带电荷的氨基酸残基,典型的是碱性氨基酸残基,如 Arg或其修饰形式,中性/极性氨基酸残基,例如Asn或其修饰形式,或小的氨基酸残 基,例如Ala或其修饰形式;
O2选自小的氨基酸残基,例如Thr或其修饰形式,或碱性氨基酸残基,例如Lys 或其修饰形式;
O3选自带电荷的(典型的是碱性)氨基酸残基,例如,O3选自Arg或Lys或其修饰 形式,中性/极性氨基酸残基,例如Asn或其修饰形式,疏水性氨基酸残基,例如, O3选自Ile,Val或Leu或其修饰形式,或小的氨基酸残基,例如Ala或其修饰形式;
O4选自带电荷的(典型的是碱性)氨基酸残基,例如,O4选自Arg或Lys或其修饰 形式,中性/极性氨基酸残基,例如O4选自Gln或Asn或其修饰形式,疏水性氨基酸 残基,例如O4选自Phe,Ile,Val或Leu或其修饰形式,或小的氨基酸残基,例如, O4选自Ala,Gly,Ser或Thr或其修饰形式;和
O5选自带电荷的(典型的是碱性)氨基酸残基,例如,O5选自Arg或Lys或其修饰 形式,中性/极性氨基酸残基,例如Asn或其修饰形式,疏水性氨基酸残基,例如O5 选自Phe,Ile,Val或Leu或其修饰形式,或小的氨基酸残基,例如O5选自Ala,Gly, Ser或Thr或其修饰形式。
在某些方案中,X1是疏水性氨基酸残基例如,X1选自Leu,Met,Phe,Ile或Val 或其修饰形式。在其他方案中,X1是小的氨基酸残基,例如X1选自Gly,Ala,Ser 或Thr或其修饰形式。在还有其他方案中,X1选自Cys,Lys或His,或其修饰形式。
在某些方案中,[Xj]n是单个氨基酸残基,其宜选自Ala,Arg,Asn或Val或其修 饰形式。在其他方案中,[Xj]n是具有两个氨基酸残基的序列,其中第一个氨基酸残基 宜选自Lys,Asp,Leu,Asn,Ala,Val或Phe或其修饰形式,第二个氨基酸残基宜 选自Ser,Ala,Lys,Gln,Asn或Leu或其修饰形式。
在某些方案中,X2是疏水性氨基酸残基,例如,X2选自Val,Leu,Tyr,Ile或 Phe或其修饰形式。在其他方案中,X2是小的氨基酸残基,例如,X2选自Pro,Ala, Gly,Ser或Thr或其修饰形式。在还有其他方案中,X2选自Asn或Arg或其修饰形 式。
在某些方案中,X3是小的氨基酸残基,例如,X3是Ala或其修饰形式。在其他 方案中,X3是疏水性氨基酸残基,例如,X3选自Met,Leu,Val,Ile或Phe或其修 饰形式。在还有其他方案中,X3是Cys或其修饰形式。
在某些方案中,X4是疏水性氨基酸残基,例如,X4选自Val,Leu,Ile或Trp或 其修饰形式。在其他方案中,X4是小的氨基酸残基,例如,X4选自Ala,Gly,Ser或 Thr或其修饰形式。
在某些方案中,X5是小的氨基酸残基,例如,X5选自Ala,Gly,Ser或Thr或其 修饰形式。在其他方案中,X5是疏水性氨基酸残基,例如,X5选自Leu,Phe,Val, Ile或其修饰形式。
在某些方案中,[Xk]n用下式表示:
B3O6O7O8O9B4(IV)[SEQ ID NO:4]
其中:B3选自小的氨基酸残基,例如Pro,Ala,Gly,Ser或Thr或其修饰形式, 疏水性氨基酸残基,例如Val或Leu或其修饰形式,或中性/极性氨基酸残基,例如 Cys或其修饰形式;
O6至O9中至少存在两个,其中:
O6选自小的氨基酸残基,例如O6选自Ala,Gly,Ser或Thr或其修饰形式,疏 水性氨基酸残基,例如O6选自Val,Leu,Ile或Met或其修饰形式,或中性/极性氨基 酸残基,例如Cys或其修饰形式;
O7选自小的氨基酸残基,例如O7选自Ala或Ser或其修饰形式,疏水性氨基酸 残基,例如Phe或其修饰形式,或中性/极性氨基酸残基,例如Asn或其修饰形式;
O8选自小的氨基酸残基,例如O8选自Thr,Ala或Ser或其修饰形式;或疏水性 氨基酸残基,例如O8选自Ile,Leu,Val,Met,Phe,Tyr或Trp或其修饰形式;
O9选自小的氨基酸残基,例如O9选自Pro,Ala,Gly,Ser或Thr或其修饰形式, 疏水性氨基酸残基,例如O9选自Ile,Leu,Val或Phe或其修饰形式,碱性氨基酸残 基,例如His或其修饰形式,或中性/极性氨基酸残基,例如Cys或其修饰形式;和
B4选自小的氨基酸残基,例如Ala,Ser或Thr或其修饰形式,或疏水性氨基酸 残基,例如Ile,Val,Leu,Met,Tyr或Phe或其修饰形式。
在某些方案中,X6是疏水性氨基酸残基,例如X6选自Leu,Val,Met或Tyr或 其修饰形式。在其他方案中,X6是小的氨基酸残基,例如X6选自Pro,Ala,Gly, Ser或Thr或其修饰形式;
在某些方案中,[X1]n用下式表示:B5O10O11O12(V)[SEQ ID NO:5]
其中:B5选自小的氨基酸残基,例如Pro,Ala,Gly,Ser或Thr或其修饰形式, 疏水性氨基酸残基,例如Ile,Leu,Val,Phe或Met或其修饰形式,或中性/极性氨基 酸残基,例如Gln或其修饰形式;
O10至O12中存在至少一个,其中:
O10选自小的氨基酸残基,例如O10选自Gly,Ala,Ser或Thr或其修饰形式,疏 水性氨基酸残基,例如O10选自Val,Leu,Met或Phe或其修饰形式,中性/极性氨基 酸残基,例如O10选自Cys,Asn或Gln或其修饰形式;
O11是小的氨基酸残基,例如Pro或其修饰形式;和
O12选自小的氨基酸残基,例如O12选自Ala,Gly,Ser或Thr或其修饰形式,疏 水性氨基酸残基,例如O12选自Ile,Leu,Val,Tyr或Trp或其修饰形式,或中性/极 性氨基酸残基,例如Cys或其修饰形式。
在某些方案中,X7是疏水性氨基酸残基,例如X7选自Leu,Ile,Val或Met或其 修饰形式。在其他方案中,X7是小的氨基酸残基,例如X7选自Pro,Ala,Gly,Ser 或Thr或其修饰形式。在还有其他方案中,X7是带电荷的氨基酸残基,例如X7选自 Asp或Arg或其修饰形式。在还有其他方案中,X7是中性/极性氨基酸残基,例如Asn 或其修饰形式。
在某些方案中,X8是中性/极性氨基酸残基,例如X8选自Gln,Asn或Cys或其 修饰形式。在其他方案中,X5是带电荷的氨基酸残基,例如X8选自His或Glu或其 修饰形式。在还有其他方案中,X8是疏水性氨基酸残基,例如X8选自Val,Met或 Trp或其修饰形式。在还有其他方案中,X8是小的氨基酸残基,例如X8选自Ala或 Ser或其修饰形式。
在某些方案中,X9是小的氨基酸残基,例如X9选自Ala,Gly,Ser或Thr或其 修饰形式。在其他方案中,X9是带电荷的氨基酸残基,更佳的是酸性氨基酸残基,例 如Glu或其修饰形式。
在某些方案中,Z1用下式表示:
J2J3J4Z2(VI)[SEQ ID NO:6]
其中:J2是小的氨基酸残基,例如Thr或其修饰形式;
J3不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,例如Lys或其 修饰形式,条件是J2也存在;
J4不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,例如Lys或其 修饰形式,条件是J3也存在;和
Z2不存在,或是具有n个氨基酸残基的序列,其中n为1-15,其中该序列包含选 自任何氨基酸残基的相同或不同氨基酸残基,条件是
J4也存在。
有利的是,Z1或Z2包含至少1,2,3,4,5个带电荷的氨基酸残基,其通常是(但 不排除是)碱性氨基酸残基。带电荷的氨基酸残基可相互毗邻,或由一个或多个其它(非 带电荷的)氨基酸残基隔开。
在另一方案中,SCE用下式表示:
B2J1[Xi]nX1[Xj]nX2X3X4X5[Xk]nX6[X1]nX7X8X9Z1(VII)[SEQ ID NO:7]
其中:B2、J1、[Xi]n、[Xj]n、[Xk]n、[X1]n、X1-9和Z1如上定义。
在还有一个方案中,SCE用下式表示:
B1-X1X2X3X4X5[Xm]nX6X7X8X9X10X11X12X13X14X15X16-Z1(VIII)[SEQ ID NO:8]
其中:B1不存在,或是具有n个氨基酸残基的序列,其中n约为1-5,其中序列 包含选自任何氨基酸残基的相同或不同氨基酸;
X1是疏水性氨基酸残基或其修饰形式;
X2是小的氨基酸残基或其修饰形式;
X3是疏水性氨基酸残基或其修饰形式;
X4选自疏水性或小的氨基酸残基或其修饰形式;
X5是疏水性氨基酸残基或其修饰形式;和
[Xm]n是具有n个氨基酸残基的序列,其中n为0-2,其中Xm包含相同或不同的 氨基酸残基,其选自疏水性或小的氨基酸残基或其修饰形式;
X6是小的或疏水性氨基酸残基或其修饰形式;
X7是疏水性或小的氨基酸残基或其修饰形式;
X8是疏水性或小的氨基酸残基或其修饰形式;
X9是疏水性或小的氨基酸残基或其修饰形式;
X10是疏水性的、小的或中性/极性氨基酸残基或其修饰形式;
X11是小的,疏水性的或中性/极性氨基酸残基或其修饰形式;
X12是小的氨基酸残基或其修饰形式;
X13是疏水性或小的氨基酸残基或其修饰形式;
X14是小的氨基酸残基或其修饰形式;
X15是中性/极性、酸性或疏水性氨基酸残基或其修饰形式;
X16是小的氨基酸残基或其修饰形式;和
Z1不存在,或是具有n个氨基酸残基的序列,其中n约为1-20,其中该序列包含 选自任何氨基酸残基的相同或不同氨基酸残基。
在某些方案中,当B1存在时,其用下式表示:
J1J2J3J4J5(IX)[SEQ ID NO:9]
其中:J1不存在,或是疏水性氨基酸残基,例如Met或其修饰形式,条件是J2 也存在;
J2不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,例如Lys,或 其修饰形式,条件是J3也存在;
J3不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,例如J3选自 Lys或Arg或其修饰形式,条件是J4也存在;
J4不存在,或选自小的氨基酸残基,例如T或其修饰形式,或带电荷的氨基酸残 基,典型的是碱性氨基酸残基,例如J4选自Lys或Arg或其修饰形式,或中性/极性 氨基酸残基,例如Gln或其修饰形式,条件是J5也存在;和
J5不存在,或选自小的氨基酸残基,例如J5选自Ala或Thr或其修饰形式,或疏 水性氨基酸残基,例如Leu或其修饰形式;
在某些方案中,X1选自Ile,Val或Leu或其修饰形式。在某些方案中,X2选自 Thr,Gly,或Ala或其修饰形式。在某些方案中,X3选自Ile或Leu或其修饰形式。 在某些方案中,X4是疏水性氨基酸残基,它宜选自Val或Trp或其修饰形式。在其他 方案中,X4是小的氨基酸残基,宜选自Ala,Ser或Thr或其修饰形式。在某些方案 中,X5选自Ile,Phe,或更典型的Val,或其修饰形式。
在某些方案中,[X1]n用下式表示:
J6J7(X)[SEQ ID NO:10]
其中:J6和J7至少存在一个,其中
J6选自疏水性氨基酸残基,例如Leu或其修饰形式,或小的氨基酸残基,例如 Gly或其修饰形式;和
J7选自小的氨基酸残基,例如Ser或其修饰形式,或疏水性氨基酸残基,例如Leu, 或其修饰形式。
在某些方案中,X6是小的氨基酸残基,它宜为Ala或其修饰形式。在其他方案中, X6是疏水性氨基酸残基,它宜选自Val或Leu,或其修饰形式。在某些方案中,X7是 小的氨基酸残基,它宜选自Ala,Gly或Thr或其修饰形式。在其他方案中,X7是Leu 或其修饰形式。在某些方案中,X8是疏水性氨基酸残基,宜选自Leu或Val或其修饰 形式。在其他方案中,X8是小的氨基酸残基,宜选自Ala或Ser或其修饰形式。在某 些方案中,X9是疏水性氨基酸残基,它宜选自Val或Leu或其修饰形式。在其他方案 中,X9是小的氨基酸残基,它宜选自Ala或Gly或其修饰形式。在某些方案中,X10 是Gln或其修饰形式。在其他方案中,X10是疏水性氨基酸残基,它宜为Ile,Val或 Phe,或其修饰形式。
在某些方案中,X11是小的氨基酸残基,它宜选自Pro,Ala或Thr或其修饰形式。 在其他方案中,X11是Phe或其修饰形式。在还有其他方案中,X11是Gln或其修饰形 式。在某些方案中,X12是小的氨基酸残基,它宜选自Ala,Ser或Thr或其修饰形式。 在某些方案中,X13是疏水性氨基酸残基,它宜选自Val,Ile或Met或其修饰形式。 在其他方案中,X13是小的氨基酸残基,例如Ala或其修饰形式。在某些方案中,X14 选自Pro或Ala,或其修饰形式。在某些方案中,X15是中性/极性氨基酸残基,例如 Gln或其修饰形式。在其他方案中,X15是酸性氨基酸残基,例如Asp或其修饰形式。 在还有其他方案中,X15是疏水性氨基酸残基,例如Leu或其修饰形式。在某些方案 中,X16是Ala或其修饰形式。
在某些方案中,Z1用下式表示:
J8J9J10(XI)[SEQ ID NO:11]
其中:J8是小的氨基酸残基,例如Thr,或其修饰形式;
J9不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,例如Lys或其 修饰形式,条件是J8也存在;和
J10不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,例如Lys,或 其修饰形式,条件是J9也存在。
SCE中的氨基酸可以由基因或其类似物或其D型异构体编码的那些。在本发明 范围内的化合物可通过以各种方式修饰所公开的式子来获得,并且同时保留了获得的 SCE的活性。例如,尽管这些化合物的氨基酸通常以天然的L型光学异构体形式存在, 但是一个或多个氨基酸(通常两个或更少,较佳的是一个氨基酸)可被D型光学异构体 取代,或者,包含SCE的分子中可有D,L-型外消旋混合物。在一个方案中,SCE的 形式是其中所有残基以D构型存在,从而赋予对蛋白酶活性的抗性,同时保留自身聚 集性质。所得的分子本身是含天然L-氨基酸的对映体。
用来描述SCE的命名按照常规实践,其中每个氨基酸残基的氨基置于左边,羧 基置于右边。在表示本发明所选具体方案的式子中,尽管没有具体显示,但是认为氨 基端(N-)和羧基端(C-)为其在生理pH值下所采用的形式,除非另有所述。在氨基酸结 构式中,每个残基通常用单字母命名表示,其根据下表对应于氨基酸的名称,该表中 还显示了每个残基的三字母命名。
表B:氨基酸缩写 氨基酸 单字母符号 三字母符号 氨基酸 单字母符号 三字母符号 丙氨酸 A Ala 亮氨酸 L Leu 精氨酸 R Arg 赖氨酸 K Lys 天冬酰胺 N Asn 甲硫氨酸 M Met 天冬氨酸 D Asp 苯丙氨酸 F Phe 半胱氨酸 C Cys 脯氨酸 P Pro 谷氨酰胺 Q Gln 丝氨酸 S Ser 谷氨酸 E Glu 苏氨酸 T Thr 甘氨酸 G His
色氨酸 W Trp 组氨酸 H Be 酪氨酸 Y Tyr 异亮氨酸 I 缬氨酸 V Val
本发明的SCE是肽或肽样化合物,其部分根据
指定类别的氨基酸残基来确定。 氨基酸残基通常可细分为以下几个主要的亚类:
酸性:由于在生理pH下丢失H离子,其残基具有负电荷,该残基被水溶液吸引, 因而当肽在生理pH下的水性介质中时,该氨基酸在此肽构型中力图处于表面位置。 具有酸性
侧链的氨基酸包括谷氨酸和天冬氨酸。
碱性:由于在生理pH下或在生理pH上下1或2个pH单位内(如组氨酸)与H离 子结合,其残基具有正电荷,该残基被水溶液吸引,因此当肽在生理pH下在水性介 质中时,其在含有该氨基酸的肽构型中力图处于表面位置。具有碱性侧链的氨基酸包 括精氨酸、赖氨酸和组氨酸。
带电荷:残基在生理pH下带电荷,因此包括具有酸性或碱性侧链的氨基酸(即谷 氨酸、天冬氨酸、精氨酸、赖氨酸和组氨酸)。
疏水性:残基在生理pH下不带电荷,因此残基被水溶液排斥,当肽在水性介质 中时,其在含有该氨基酸的肽构型中处于内部位置。具有疏水性侧链的氨基酸包括酪 氨酸、缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸和色氨酸。
中性/极性:残基在生理pH下不带电荷,但是残基没有被水溶液充分排斥,因此 当肽在水性介质中时,其在含有该氨基酸的肽构型中处于内部位置。具有中性/极性侧 链的氨基酸包括天冬酰胺、谷氨酰胺、半胱氨酸、组氨酸、丝氨酸和苏氨酸。
本说明书还将某些氨基酸表示成“小的”氨基酸,因为它的侧链并不大得足以赋 予疏水性,即便是没有极性基团。除了脯氨酸外,“小的”氨基酸是那些当至少一个 极性基团在侧链上时有四个或更少
碳原子的氨基酸,以及当侧链上没有极性基团时有 三个或更少碳原子的氨基酸。具有小侧链的氨基酸包括甘氨酸、丝氨酸、丙氨酸和苏 氨酸。基因编码的次级氨基酸脯氨酸是一个特殊的情况,因为已知其对肽链的二级构 型有影响。脯氨酸的结构与其它所有天然存在的氨基酸不同,因为它的侧链连接在α- 氨基的氮以及α-碳上。然而,一些氨基酸相似性矩阵(matrices)(例如Dayhoff等.(1978) A model of evolutionary change in proteins.Matrices for determining distance relationships In M.O.Dayhoff编,Atlas of protein sequence and structure,Vol.5,pp.345-358,National Biomedical Research Foundation,Washington DC;Gonnet等,1992,Science 256(5062): 144301445所公开的PAM120矩阵和PAM250矩阵)将脯氨酸包括在与甘氨酸、丝氨酸、 丙氨酸和苏氨酸相同的类别中。因此,出于本发明的目的,脯氨酸被分类为“小”的 氨基酸。
分类为极性或非极性所需的吸引或排斥程度是任意的,因此本发明具体考虑的氨 基酸已被分类为一类或另一类。大多数没有具体提到的氨基酸可根据已知的行为进行 分类。
氨基酸残基可进一步细分为环状或非环状、以及芳族或非芳族(这显然是根据残 基侧链取代基所作的分类)以及大的或小的。如果残基含有总共4个或更少碳原子(包 括羧基碳)且有额外的极性取代基,或含有总共3个或更少碳原子且没有额外的极性取 代基,则认为该残基是小的残基。当然,小的残基总是非芳族氨基酸。根据其结构性 质,氨基酸残基可分为两类或多类。
对于天然存在的蛋白质氨基酸,下表中列出了根据前述方案的亚分类。
表C:氨基酸亚类 亚类 氨基酸 酸性 碱性 带电荷 小 极性/中性 极性/大 疏水性 芳族 影响链取向的残基 天冬氨酸,谷氨酸 非环状:精氨酸,赖氨酸;环状:组氨酸 天冬氨酸,谷氨酸,精氨酸,赖氨酸,组氨酸 甘氨酸,丝氨酸,丙氨酸,苏氨酸,脯氨酸 天冬酰胺,组氨酸,谷氨酰胺,半胱氨酸,丝氨酸,苏氨酸 天冬酰胺,谷氨酰胺 酪氨酸,缬氨酸,异亮氨酸,亮氨酸,甲硫氨酸,苯丙氨酸, 色氨酸 色氨酸,酪氨酸,苯丙氨酸 甘氨酸和脯氨酸
SLE中包括的“修饰的”氨基酸是在基因翻译后经过加工(例如,加入甲基或通 过共价键衍生成其它取代基,或氧化或还原或其它共价修饰)的基因编码的氨基酸。得 到的修饰的氨基酸的分类由修饰形式的特征来确定。例如,如果通过使ε-氨基酰化来 修饰赖氨酸,则该修饰形式不会分类为“碱性”,而是归类为“极性/大”。
某些常见的氨基酸不是由遗传密码编码的,例如包括,β-丙氨酸(β-Ala),或其它 omega-氨基酸,如3-氨基丙酸,2,3-二氨基丙酸(2,3-diaP),4-氨基丁酸等,α-氨基异丁 酸(Aib),肌氨酸(Sar),鸟氨酸(Orn),瓜氨酸(Cit),t-丁基丙氨酸(t-BuA),t-丁基甘氨 酸(t-BuG),N-甲基异亮氨酸(N-MeIle),苯基甘氨酸(Phg),环己基丙氨酸(Cha),正亮 氨酸(Nle),2-
萘基丙氨酸(2-Nal);1,2,3,4-四氢异喹啉-3-
羧酸(Tic);P-2-噻吩基丙氨酸 (Thi);甲硫氨酸亚砜(MSO);和高精氨酸(Har)。它们也根据常规属于特别类别。
基于上述定义,Sar、β-Ala和Aib是小的;t-BuA,t-BuG,N-MeIle,Nle,Mvl,Cha, Phg,Nal,Thi和Tic是疏水性的;2,3-diaP,Orn和Har是碱性的;Cit,Acetyl Lys和MSO 是中性/极性/大的氨基酸。上述各种omega-氨基酸根据大小归类为小的(β-Ala和3-氨 基丙酸)或大的和疏水性的(其它所有)氨基酸。
对于基因编码的其它氨基酸的取代也包括在本发明范围内的SCE中,它们可根 据结构在该通用方案中进行分类。
在本发明的SCE中,一个或多个酰胺键(-CO-NH-)可任选地被其它键取代,这些 键是同配体如-CH2NH-,-CH2S-,-CH2CH2,-CH=CH-(顺式和反式),-COCH2-, -CH(OH)CH2-和-CH2SO-。这种取代可用本领域已知的方法来进行。下列参考文献描述了 含有这些替代性连接部分的肽类似物的制备:Spatola,A.F,Vega Data(March 1983), Vol.1,Issue 3,″肽骨架修饰(Peptide Backbone Modifications)″(综述);Spatola,A.F.,″氨 基酸肽和蛋白质的化学和生物化学性质(Chemistry and Biochemistry of Amino Acids Peptides and Proteins)″,B.Weinstein编,Marcel Dekker,New York,p.267(1983)(综述); Morley,J.S.,Trends Pharm Sci(1980)pp.463-468(综述);Hudson,D.,等人,Int J Pept Prot Res(1979)14:177-185(-CH2NH-,-CH2CH2-);Spatola,A.F.,等人,Life Sci(1986)38: 1243-1249(-CH2-S);Hann,M.M.,J Chem Soc Perkin Trans I(1982)307-314(-CH-CH-, 顺式和反式);Almiquist,R.G.,等人,J Med Chem(1980)23:1392-1398(-COCH2-); Jennings-White,C.,等人,Tetrahedron Lett(1982)23:2533(-COCH2-);Szelke,M.,等人, 欧洲专利
申请EP 45665(1982)CA:97:39405(1982)(-CH(OH)CH2-);Holladay,M.W., 等人,Tetrahedron Lett(1983)24:4401-4404(-C(OH)CH2-);和Hruby,V.J.,Life Sci (1982)31:189-199(-CH2-S-)。
SCE中的氨基酸,尤其是羧基端或氨基端的氨基酸,也可进行酰胺化、酰化修饰 或用能改变该化合物溶解性而不影响其活性的其它化学基团取代。
典型的SCE氨基酸序列包括任何天然存在的膜转运序列(MTS),其通常(但不是 绝对)选自能在生理条件下(如细胞内)团聚成高级团聚体的天然存在的信号序列或其 变体。天然存在的MTS可从任何合适的生物获得,其包括但不局限于细菌、分枝杆 菌、病毒、
原生动物、酵母、植物和动物如昆虫、鸟类、爬行动物、鱼类和哺乳动物。 较佳的,天然存在的MTS从细菌获得。有利的是,天然存在的MTS氨基酸序列选自 SEQ ID NO:12-90。在某些方案中,天然存在的MTS氨基酸序列选自SEQ ID NO:67, 68,69,70,71,72,73,74,75,76,77,78,79,80,81,83,84,85和87。
在其它方案中,SCE氨基酸序列包括MTS中负责团聚行为的那一部分。因此, 本发明涉及本发明MTS序列的生物活性片段。本领域技术人员知道有许多技术能产 生所述片段。例如,可通过氨基和/或羧基端缺失或内部缺失(例如通过酶促消化获得) 来产生参照MTS的片段。然后,使片段与感兴趣的多肽偶联,测试所产生的嵌合多 肽形成高级团聚体的能力。这类测试可采用提供分子量定性或定量测定结果的试验, 其包括但不局限于超离心、
电泳(如天然聚丙烯酰胺凝胶电泳)和大小分离(如凝胶过 滤、
超滤)。例如,高级团聚体可用在下文有更详细描述的大小排阻层析来测试。在另 一方案中,MTS片段的生物活性用以下方法进行测试:将一多核苷酸导入细胞,从该 多核苷酸能翻译产生含MTS片段和感兴趣多肽的嵌合多肽,然后检测高级团聚体的 存在,若存在则表明该片段是生物活性片段。
另外,SCE或其片段可与SEQ ID NO:12-90中的对应序列不同。因此,本发明 还涉及天然存在的或亲代SCE氨基酸序列或其生物活性片段的变异体,其中该变异体 因具有一个或多个氨基酸的加入、缺失或取代而与亲代序列不同。通常,变异体表现 出与例如SEQ ID NO:12-90中列出的任一亲代SCE序列有至少50%,55%,60%,65%, 70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%的相似 性。合适的是,该变异体与例如SEQ ID NO:12-90中列出的任一亲代SCE序列有至 少50%,55%,60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%, 97%,98%,99%的序列相同性。另外,包括在本发明内的序列与天然或亲代序列有1、 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个 氨基酸的增加、缺失或取代的不同,但是仍保留了自身聚集性质和赋予感兴趣分子形 成高级团聚体的能力。本发明的多肽包括由以下多核苷酸编码的多肽,即该多核苷酸 在严谨条件(较佳的为高度严谨条件)下与本发明的多核苷酸序列杂交或是其非编码链 杂交(如上所述)。在一个方案中,它有至少一个但是少于15、10、8、6、5、4、3、2 或1个氨基酸残基是不同的。在另一方案中,它与SEQ ID NO:12-90中的对应序列有 至少一个残基但是少于20%、15%、10%或5%的残基不同。(如果这一比较要求序列 的排列对齐应对比最高相似性,则因缺失、插入或错配和形成“环突出”的序列被认 为是不同的)。这些不同宜为非关键残基的不同或变化或是保守性取代。
“非关键”的氨基酸残基是这样一种残基,在SCE的野生型序列中它可以被改 变而不会丧失或实质上改变其自身聚集活性。这一改变基本上不改变自身聚集活性, 例如该活性至少是野生型活性的20%、40%、60%、70%、80%。“关键”的氨基酸 残基是这样一种残基,当其在SCE的野生型序列发生改变时,导致自身聚集活性的丧 失(低于野生型活性的20%)。从图1和图2所示SCE的序列比较来看,显然在这些图 中的SCE中,没有一个SCE的氨基酸残基是绝对保守的。因此,认为SCE的所有氨 基酸残基都可能改变,尤其是保守性氨基酸取代。
“保守性氨基酸取代”是指氨基酸残基被具有相似侧链的氨基酸残基取代。具有 相似侧链的氨基酸残基家族在
现有技术中已有定义,并且在上文表C中描述了某些分 类。较佳的变异体SCE是具有保守性氨基酸取代的那些变异体。保守取代的例子包括 下列:天冬氨酸-谷氨酸(作为酸性氨基酸);赖氨酸/精氨酸/组氨酸(作为碱性氨基酸); 丝氨酸/甘氨酸/丙氨酸/苏氨酸(作为小的氨基酸);亮氨酸/异亮氨酸、甲硫氨酸/缬氨酸、 丙氨酸/缬氨酸(作为疏水性氨基酸)。保守性氨基酸取代还包括基于侧链的分组。例如, 具有脂肪族侧链的一类氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有 脂肪族-羟基侧链的一类氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一类氨基酸是天 冬酰胺和谷氨酰胺;具有芳族侧链的一类氨基酸是苯丙氨酸、酪氨酸和苏氨酸;具有 碱性侧链的一类氨基酸是赖氨酸、精氨酸和组氨酸。具有含硫侧链的一类氨基酸是半 胱氨酸和甲硫氨酸。例如,可以合理地预计到用异亮氨酸或缬氨酸取代亮氨酸,用谷 氨酸取代天冬氨酸,用丝氨酸取代苏氨酸,或用结构相关的氨基酸取代相似氨基酸而 不会对所得多肽变异体的性质有主要影响。氨基酸变化是否产生功能性SCE很容易通 过测试SCE变体的特定聚集或团聚活性来确定。在下表D中列举性取代的题头下面, 显示了保守性取代。更佳的取代显示在题头“较佳的取代”的下面。在本发明范围内 的氨基酸残基通常是,在维持(a)取代区域肽骨架的结构、(b)分子在靶位点的电荷或疏 水性、或(c)侧链大小的情况下,通过选择没有显著改变其效果的取代来实现的。在导 入取代后,筛选具有生物活性的变异体。
表D:列举性和较佳的氨基酸取代
原始残基 典型的取代 较佳的取代 Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val Val,Leu,Ile Lys,Gln,Asn Gln,His,Lys,Arg Glu Ser Asn,His,Lys, Asp,Lys Pro Asn,Gln,Lys,Arg Leu,Val,Met,Ala,Phe,Norleu Norleu,Ile,Val,Met,Ala,Phe Arg,Gln,Asn Leu,Ile,Phe Leu,Val,Ile,Ala Gly Thr Ser Tyr Trp,Phe,Thr,Ser Ile,Leu,Met,Phe,Ala,Norleu Val Lys Gln Glu Ser Asn Asp Pro Arg Leu Ile Arg Leu Leu Gly Thr Ser Tyr Phe Leu
另外,用于保守性取代的相似氨基酸可根据侧链的特性分为三类。第一类包括谷 氨酸、天冬氨酸、精氨酸、赖氨酸、组氨酸,它们都具有带电荷侧链;第二类包括谷 氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、谷氨酰胺、天冬酰胺;第三类包括酪氨 酸、异亮氨酸、缬氨酸、丙氨酸、脯氨酸、苯丙氨酸、色氨酸、甲硫氨酸(如Zubay,G., Biochemistry,第三板,Wm.C.Brown Publishers(1993)所述)。
因此,SCE中预计的非关键氨基酸残基通常被相同侧链家族的另一氨基酸残基取 代。另外,在另一方案中,在SCE编码序列的全部或部分中可随机引入突变(例如通 过饱和诱变),筛选所得的突变体的自身聚集活性,以鉴别出保留活性的突变体。在诱 变该编码序列后,可重组表达编码的肽,确定肽的活性。
在另一方案中,SCE包括与SEQ ID NO:12-90中的对应序列有至少约50%,55%, 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94% 95%,96%,97%,98%或更 高相似性且具有自身聚集活性的氨基酸序列。
如图1和2所示,本发明的SCE之间具有许多共同的结构特征。术语“家族” 在指本发明的蛋白质和核酸分子时,它指具有共同结构域或基序且具有足够氨基酸或 核苷酸序列同源性(如本文所定义)的两种或多种蛋白质或核酸分子。这些家族成员可 以是天然或非天然存在的,可以来自相同或不同的种类。该家族的成员还可具有共同 的功能特征。
通过至少一个氨基酸残基的取代、加入或缺失而与亲代SCE序列不同的SCE变 异体序列可用本领域技术已知的液相或固相肽合成技术从头合成。或者,这些变异体 (包括天然存在的SCE序列的变异体)可通过常规诱变其编码序列获得。当然,为表达 变异体而在核苷酸序列中构建的突变必须保留编码序列的读框,并且宜不产生会杂交 而形成对mRNA翻译有不利影响的二级mRNA结构(如环或发夹)的互补区。尽管突 变位点可以预先确定,但是突变本身的特性不一定能预先确定。例如,为了选择在给 定位点的突变的最优性质,可在靶密码子中进行随机诱变,然后筛选表达的突变体的 自身聚集活性。
在一个方案中,可通过合成编码所需氨基酸残基且其侧端有能使其与天然序列片 段连接的限制性位点的方式在特定位置导入突变。在连接后,所得的重新构建的序列 编码了具有所需氨基酸插入、取代或缺失的突变体。另外,可用寡核苷酸定点诱变来 提供改变的核苷酸序列,该核苷酸序列具有根据需要的取代、缺失或插入而导致的特 定密码子变化。形成上述改变的典型方法公开在Walder等人.(1986,Gene 42:133); Bauer等人.(1985,Gene 37:73);Craik(1985,Bio Techniques Jan.12-19);Smith等人. (Genetic Engineering:Principles and Methods,Plenum Press,1981);和美国专利Nos. 4,518,584和4,737,462中。
在本发明的其它变化方案中,本发明的SCE氨基酸序列由一多核苷酸编码,该 多核苷酸在本文所述的严谨条件下与编码SEQ ID NO:12-90所述的SCE氨基酸序列的 核苷酸序列、或与这些序列互补的非编码链杂交。在较佳的方案中,SCE氨基酸序列 由一多核苷酸编码,该多核苷酸在本文所述的严谨条件下与SEQ ID NO:91-132中所 述的核苷酸序列杂交。本文所用的术语“在低严谨、中等严谨、高度严谨或极高严谨 条件下杂交”描述的是杂交和洗涤的条件。关于进行杂交反应的指南可见Ausubel等 人(1998,同上),第6.3.1-6.3.6节。该文献中还描述了水性和非水性的方法,两者均 可使用。
在一个方案中,本发明涉及在至少低严谨条件下与编码本发明SCE氨基酸序列 的参照多核苷酸杂交的多核苷酸。本文的低严谨条件包括至少约1%v/v至至少约15 %v/v甲酰胺,至少约1M至至少约2M的盐在42℃下杂交,和至少约1M至至少约 2M的盐在42℃下洗涤。低严谨条件还包括1%牛血清白蛋白(BSA),1mM EDTA,0.5 M NaHPO4(pH 7.2),7% SDS在65℃下杂交,和(i)2x SSC,0.1% SDS;或(ii)0.5% BSA, 1mM EDTA,40mM NaHPO4(pH 7.2),5% SDS在室温下洗涤。低严谨条件的一个方案 包括在6X
氯化钠/
柠檬酸钠(SSC)中约45℃下杂交,然后在0.2X SSC,0.1% SDS中至 少50℃下洗涤两次(对于低严谨条件洗涤温度可升高至55℃)。
在另一方案中,本发明涉及在至少中等严谨条件下与编码SCE的参照多核苷酸 杂交的多核苷酸。中等严谨条件包括至少约16%v/v至至少约30%v/v甲酰胺,至少 约0.5M至至少约0.9M的盐在42℃下杂交,和至少约0.1M至至少约0.2M的盐在55 ℃下洗涤。中等严谨条件还包括1%牛血清白蛋白(BSA),1mM EDTA,0.5M NaHPO4(pH 7.2),7% SDS在65℃下杂交,和(i)2x SSC,0.1% SDS;或(ii)0.5% BSA,1mM EDTA,40mM NaHPO4(pH 7.2),5% SDS在60-65℃下洗涤。中等严谨条件的一个方案 包括在6X SSC中约45℃下杂交,然后在0.2X SSC,0.1% SDS中60℃下洗涤一次或 多次。
在另一方案中,本发明涉及在高度严谨条件下与编码SCE的参照多核苷酸杂交 的多核苷酸。高严谨条件包括至少约31%v/v至至少约50%v/v甲酰胺,至少约0.01M 至至少约0.15M的盐在42℃下杂交,和约0.01M至约0.02M的盐在55℃下洗涤。高 度严谨条件还包括1%牛血清白蛋白(BSA),1mM EDTA,0.5M NaHPO4(pH 7.2),7% SDS在65℃下杂交,和(i)2x SSC,0.1% SDS;或(ii)0.5% BSA,1mM EDTA,40mM NaHPO4(pH 7.2),1% SDS在65℃以上的温度下洗涤。高度严谨条件的一个方案包括 在6X SSC中约45℃下杂交,然后在0.2X SSC,0.1% SDS中65℃下洗涤一次或多次。
在某些方案中,本发明的分离的核酸分子在极高严谨条件下杂交。极高严谨条件 的一个方案包括在0.5M磷酸钠、7%SDS中65℃下杂交,然后以0.2X SSC,0.1% SDS65 ℃洗涤一次或多次。
其它严谨条件是本领域熟知的,本领域技术人员知道可控制各种因素来优化杂交 的特异性。最终洗涤的严谨度的优化能确保高度的杂交。关于详细例子可参见Ausubel 等人(同上)2.10.1至2.10.16页和Sambrook等人(1989,同上)第1.101至1.104节。
尽管严谨洗涤通常在约42℃至68℃的温度下进行,本领域技术人员会理解其它 温度也适合严谨条件。对于DNA-DNA杂合体的形成,最高的杂交速度通常发生在低 于Tm大约20-25℃下。本领域技术人员熟知,Tm是解链温度,在该温度下两个互补 多核苷酸序列发生解离。估计Tm的方法是本领域所熟知的(见Ausubel等人,同上, 第2.10.8页)。
通常,完全匹配的DNA的Tm可近似地用下式来预计:
Tm=81.5+16.6(log10M)+0.41(% G+C)-0.63(%甲酰胺)-(600/长度)
其中:M是Na+的浓度,较佳的在0.01-0.4摩尔范围内;%G+C是鸟苷和胞苷碱 基之和在碱基总数中的百分数,其在30%-75%G+C范围内;%甲酰胺是甲酰胺体积 浓度的百分数;长度是DNA双链中碱基对的数目。
双链DNA的Tm每降低约1℃,随机错配碱基对数目增加1%。洗涤通常在Tm-15 ℃下进行(对于高度严谨而言)或在Tm-30℃下进行(对于中度严谨而言)。
在碱基对杂交程序中,使含有固定化DNA的膜(例如
硝酸纤维素膜或尼龙膜)在 含有标记探针的杂交缓冲液中(50%去离子甲酰胺、5x SSC、5x Denhardt′s溶液(0.1% 菲可,0.1%聚乙烯吡咯烷
酮和0.1牛血清白蛋白),0.1% SDS和200mg/mL变性鲑精 DNA)42℃下杂交过夜。然后对膜进行连续两次中等严谨的洗涤(即,以2x SSC,0.1% SDS在45℃下洗涤15分钟,然后用2x SSC,0.1% SDS在50℃下洗涤15分钟),然后 进行连续两次高度严谨的洗涤(即0.2x SSC,0.1% SDS在55℃下进行12分钟,然后用 0.2x SSC和0.1% SDS溶液在65-68℃下洗涤12分钟。
本发明还提供了分离的多核苷酸,它包含编码至少一个SCE氨基酸序列的核苷 酸序列,其中该多核苷酸的SCE编码部分全长与SEQ ID NO:91-132所列的编码SCE 的参照多核苷酸有至少约99%、至少约98%,至少约95%,至少约90%,至少约85%, 至少约80%,至少约75%,或至少约70%的相同性。可用本领域技术人员知道的任何 合适方法来筛选具有SCE性质的天然或人工序列。例如,可以用以下方法来测试天然 或人工序列形成高级团聚体的能力:将该序列与感兴趣的多肽偶联,然后在一提供定 性或定量的分子量测定结果的试验中测试如此产生的嵌合多肽的形成高级团聚体的 能力。合适的是,用下文有更详细描述的大小排阻层析来测试这些嵌合分子形式的高 级团聚。
2.2感兴趣的分子
感兴趣的分子可以选自任何化合物,包括有机和无机化合物。在某些方案中,感 兴趣的分子选自有机化合物,其包括但不局限于,药物(如抗生素、激素和治疗诸如癌 症、糖尿病、
炎症、心
血管疾病、性功能障碍、神经
精神病等疾病的药物)、
代谢物和 农用化学化合物如
杀虫剂和除草剂。通常,感兴趣的分子是有机聚合物,有利的是生 物来源的聚合物如多核苷酸或多肽。在此类方案中,感兴趣的分子是具有酶活性、治 疗活性或抗原性的多肽。因此,在该方案中,嵌合分子是嵌合的多肽,其包含与“感 兴趣的多肽”融合、连接或以其它方式结合的SCE。“嵌合多肽”指包含至少两种天 然不存在于一个蛋白中的不同多肽节段(结构域)的多肽。在较佳的方案中,每个结构 域赋予该多肽独特且有用的性质。编码嵌合多肽的多核苷酸可用常规DNA重组技术 来构建,以便合成、扩增和/或分离编码至少两种不同节段的多核苷酸并将它们连在一 起。例如参见Sambrook等人,Molecular Cloning-A Laboratory Manual,第二版,Cold Spring Harbor Press(1989);和Ausubel等人,Current Protocols in Molecular Biology, John Wiley & Sons,Inc.(1998)。
感兴趣的多肽可以选自在商业或实践中感兴趣的多肽,其包含了通常(但不绝对) 可由通用遗传密码的密码子编码的氨基酸序列。感兴趣的典型多肽包括:在化学上有 用的酶(例如用于选择性
水解环状仲醇或活化/未活化的酯的酯交换的酶)、在食物加工 上有用的酶(如
淀粉酶)或其它商用应用上有用的酶(
洗涤剂酶);在生物技术应用中有用 的酶,包括DNA和RNA聚合酶、内切核酸酶、外切核酸酶、肽酶、和其它DNA和 蛋白质修饰酶;能特异性结合感兴趣的组合物的多肽,例如作为其它多肽、类固醇、 糖类或其它生物学分子的胞内或细胞表面受体的多肽;包含抗原结合分子的至少一个 抗原结合结构域的多肽;包含配体结合蛋白的配体结合结构域(如细胞表面受体的配体 结合结构域)的多肽;金属结合蛋白(例如,铁蛋白(脱铁铁蛋白)、金属硫蛋白和其它金 属蛋白),它们可用于从含金属的溶液中分离/纯化金属以便回收金属或改正(remediate) 溶液;捕获光的蛋白(如用于光合成的结合色素的蛋白质);从
光谱上改变光的蛋白质 (如吸收一
波长的光并发射另一波长的光的光谱修饰肽);调控蛋白,如转录因子和翻 译因子;以及有治疗价值的多肽,如趋化因子、细胞因子、白介素、生长因子、干扰 素、代谢性多肽、免疫增强剂和免疫
抑制剂、血管生成性或抗血管生成性肽和抗原。
在一些方案中,感兴趣的多肽选自细胞因子、生长因子和激素,其包括但不局限 于:α-干扰素、β-干扰素、γ-干扰素、白介素-1、白介素-2、白介素-3、白介素-4、白 介素-5、白介素-6、白介素-7、白介素-8、白介素-9、白介素-10、白介素-11、白介素 -12、白介素-13、白介素-14、白介素-15、白介素-16、红细胞生成素、集落刺激因子 -1、粒细胞集落刺激因子、粒细胞-巨噬细胞集落刺激因子、白血病抑制因子、
肿瘤坏 死因子、淋巴毒素、血小板衍生的生长因子、
成纤维细胞生长因子、血管内皮细胞生 长因子、表皮生长因子、转化生长因子-β、转化生长因子-α、血小板生成素、干细胞 因子、制癌蛋白M、双调蛋白、Mullerian抑制物质、B细胞生长因子、巨噬细胞迁移 抑制因子、单核细胞化学吸引蛋白(例如MCP-1)、内皮生长抑素和制管张素及其激动 剂和拮抗剂。
在一些实施方案中,感兴趣的多肽是抗原,其可选自任何外来或自体的抗原,包 括但不局限于,病毒、细菌、原生动物、
微生物、肿瘤抗原以及自身或自体的抗原。 合适的病毒抗原衍生自人免疫
缺陷病毒(HIV)、乳头瘤病毒脊髓灰质炎病毒和流感病 毒、劳斯肉瘤病毒或导致脑炎的病毒如日本脑炎病毒、疱疹病毒包括但不局限于单纯 疱疹病毒和EB病毒、巨细胞病毒、细小病毒、或肝炎病毒(包括但不局限于甲肝、乙 肝和丙肝病毒)。有利的细菌抗原包括但不局限于,从奈瑟氏球菌属、脑膜炎球菌属、 嗜血杆菌属、沙门氏菌属、链球菌属、军团杆菌属和分枝杆菌属。合适的原生动物抗 原包括但不局限于从疟原虫属、血吸虫属、利什曼原虫属、锥虫属、弓形虫属和贾第 虫属衍生获得的那些。任何癌或肿瘤抗原均在本发明考虑之中。例如,该抗原可衍生 自黑色素瘤、肺癌、乳房癌、子
宫颈癌、
前列腺癌、结肠癌、胰癌、胃癌、膀胱癌、 肾癌、移植后淋巴增生疾病(PLTD)、Hodgkin淋巴瘤等。
在某些方案中,感兴趣的多肽是代谢性多肽,包括参与化合物生物转化(如吸收、 结合、摄取、分泌、分布、运输、加工、转变或降解)的多肽。例如,代谢性多肽包括 但不局限于药物代谢性多肽(如细胞色素P450(CYP)同种型、酯酶、酰基转移酶、乙酰 基转移酶、葡糖
醛酸(glucuronosyl)转移酶、葡糖醛酸糖苷酶、谷胱甘肽S-转移酶等)、 药物结合多肽(如血清白蛋白、α-酸性糖蛋白等)、鸟氨酸氨甲酰基转移酶、精氨酰琥 珀酸合成酶、谷氨酰胺合成酶、糖原合成酶、
葡萄糖-6-磷酸酶、
琥珀酸脱氢酶、葡糖 激酶、胰岛素、丙
酮酸激酶、乙酰CoA羧化酶、
脂肪酸合成酶、丙氨酸转氨酶、谷 氨酸脱氢酶、铁蛋白、低
密度脂蛋白(LDL)受体、P450酶或醇脱氢酶。
在另一方案中,感兴趣的分子是肽,其宜选自抗原性肽(包括T细胞表位、B细 胞表位)、衍生自细胞因子的具有细胞因子活性的肽、衍生自趋化因子的具有趋化因子 活性的肽、神经肽、抗炎性肽和能以聚集体形式阻断受体功能的受体配体肽。
在还有其它方案中,感兴趣的分子是激素,包括由各种内分泌性腺产生的由生物 体液(包括血液)携带至各种靶器官的起化学信使作用的微量物质,它们在脊椎动物中 调节各种生理和代谢活性。合适的激素包括生长激素如性激素、甲状腺激素、垂体激 素和黑素细胞刺激激素。例如,激素可以选自雌激素(例如雌二醇、雌酮、雌三醇、二 乙基己烯雌酚、炔雌醚、氯烯雌醚、乙炔雌二醇、美雌醇),抗雌激素(如克罗米酚、 他莫昔芬),黄体酮(如甲羟孕酮,炔诺酮,羟基黄体酮,炔诺孕酮),抗黄体酮(例如米非 司酮),雄激素(例如,睾丸激素、环戊丙酸睾丸甾酮、二氢睾酮、氟甲睾酮、炔羟雄 烯异唑、睾内酯),抗雄激素(例如,乙酸环丙孕酮、氟他米特)等。或者,激素可以选 自甲状腺激素(例如,三碘甲状腺氨酸(triiodothyronne)、甲状腺素、丙烷基硫尿嘧啶、 甲硫咪唑和iodixode)和肠胃激素(例如,胃泌素、胰高血糖素、分泌素、缩胆囊素、 胃抑制性肽、血管活性肠肽、P物质、胰高血糖素样免疫
反应性肽、促生长素抑制素、 铃蟾素(bombesin)、神经降压素等)。激素还可选自垂体激素(例如促肾上腺皮质激素、 sumutotropin、催产素、和血管加压素),以及肾上腺皮质激素(如,促肾上腺皮质素 (ACTH)、醛甾酮、皮质醇、肾上腺皮质甾酮、去氧皮质酮和脱氢异雄甾酮)。其它激 素包括强的松、倍他米松、vetamethasone、可的松、地塞米松、氟尼缩松、氢化可 的松、甲基强的松龙、乙酸帕拉米松、氢化泼尼松、去炎松、氟氢可的松等。
在还有其它方案中,感兴趣的分子与辅助分子相连或以其它方式相联,该辅助分 子具有与感兴趣分子不同的活性。在一些方案中,辅助分子的活性改善或减少了感兴 趣分子的不需要的活性(或
副作用)。例如,辅助分子可以是免疫刺激分子(例如美国专 利No.6,228,373和美国专利No.5,466,669中所述),或是免疫抑制分子(如美国专利 No.5,679,640中所述),这些辅助分子分别增强或减少了感兴趣分子处于团聚体形式 时的性能,从而在给予团聚体的动物体内产生了针对感兴趣分子的抗原特异性免疫反 应。
3.产生本发明的嵌合分子的方法
包含SCE和感兴趣分子的嵌合分子可用本领域技术人员已知的任何合适的技术 来生成。因此,本发明并不依赖也不涉及任何将SCE与感兴趣分子偶联的特定技术。
SCE与感兴趣分子的连接方式应使得SCE的自身聚集性质没有受到损害,且在 嵌合分子自身聚集成高级团聚体时,感兴趣的分子暴露在团聚体的外部,从而使该分 子与相互结合或相互作用的配对分子相互作用。SCE和感兴趣分子之间可加入一接头 或间隔臂,以使SCE在空间上与感兴趣的分子分开。接头或间隔臂分子的长度为大约 1至100个原子。在一些方案中,接头或间隔臂分子包含一个或多个氨基酸残基(例如 大约1-50个氨基酸残基,较佳的为1、2、3、4、5、6、7、8、10、15、20个氨基酸 残基)。这样的接头或间隔臂有利于感兴趣分子的合适折叠,以确保其在嵌合分子整个 与其它含SCE的嵌合分子形成团聚体时也保留所需的活性。SCE和感兴趣分子可以 采用任何次序,即,感兴趣的分子可以与SCE的氨基端或羧基端偶联。
合适的是,感兴趣的分子与SCE共价连接。共价连接可通过本领域技术人员已 知的任何合适方式来实现。例如,可用交联剂将多肽连接起来来制备嵌合多肽。这些 交联剂的例子包括碳化二亚胺,例如但不局限于1-环己基-3-(2-吗啉基(4-乙基)碳化二 亚胺(CMC)、1-乙基-3-(3-二甲基氨基丙基)碳化二亚胺(EDC)和1-乙基-3(4-氮鎓-4,4- 二甲基戊基)碳化二亚胺。此类中典型的交联剂选自1-环己基-3-(2-吗啉基(4-乙基)碳化 二亚胺、(1-乙基-3-(3-二甲基氨基丙基)碳化二亚胺(EDC)和1-乙基-3(4-氮鎓-4,4-二甲 基戊基)碳化二亚胺。其它合适的交联剂例子是溴化氰、戊二醛和琥珀酸酐。
通常,可采用许多双同功能剂中的任一种,这些双同功能剂包括双同功能的醛、 双同功能的环氧化物、双同功能的亚氨基酯、双同功能的N-羟基琥珀酰亚胺酯、双同 功能的马来酰亚胺、双同功能的卤代烷、双同功能的吡啶基二硫化物、双同功能的芳 基卤、双同功能的酰肼、双同功能的重氮衍生物和双同功能的光反应性化合物。另外 还有双异功能化合物,例如具有氨基反应性和巯基反应性基团的化合物,具有氨基反 应性和光反应性基团的化合物,和具有羰基反应性和巯基反应性基团的化合物。
双同功能剂是具有至少两个相同官能团的分子。试剂的官能团通常与蛋白质的一 个官能团(通常是氨基)反应。这些双同功能交联剂的具体例子包括双功能的N-羟基琥 珀酰亚胺酯二硫双(琥珀酰亚氨基丙酸酯)、双琥珀酰亚氨基辛二酸酯和双琥珀酰亚氨 基
酒石酸酯;双功能的亚氨基酯,己二酰亚氨酸二甲酯;庚二酰亚氨酸二甲酯,和辛 二酰亚氨酸二甲酯;双功能的巯基反应性交联物,1,4-二-[3′-(2′-吡啶基二硫)丙酰胺基]
丁烷、双马来酰亚氨基己烷和双-N-马来酰亚氨基-1,8-辛烷;双功能的芳基卤,1,5-二 氟-2,4-二硝基苯和4,4′-二氟-3,3′-二硝基苯基砜;双功能的光反应性试剂,如双-[b-(4- 叠氮基水杨酰胺基)乙基]二硫化物;双功能的醛类,甲醛、丙二醛、丁二醛、戊二醛 和己二醛;双功能的环氧化物,如1,4-丁二醇二缩水甘油醚,双功能的酰肼如
己二酸 二酰肼,碳酰肼和琥珀酸二酰肼;双功能的二氮鎓o-酰基
甲苯胺、重氮化的和双重氮 化的联苯胺;双功能的烷基卤,N,N′-亚乙基-双(碘代乙酰胺)、N,N′-六亚甲基-双(碘代 乙酰胺)、N,N′-十一亚甲基-双(碘代乙酰胺)乙基苄基卤和卤代芥子气,如α,α-二碘-p- 二甲苯磺酸和三(2-氯乙基)胺。用双同功能交联剂的方法是本领域技术人员所知道的。 例如,用戊二醛作为交联剂在例如Poznansky等人.(1984,Science,223:1304-1306)中 有所描述。用二酰氨酸酯作为交联剂在Wang等人(1977,Biochemistry,16:2937-2941) 中有所描述。
尽管出于形成本发明嵌合多肽的目的可使用双同功能交联剂,但是本领域技术人 员能理解,用这些试剂以一定次序连接不同蛋白质更为困难。在这一方面,在用双同 功能试剂连接第一蛋白和第二蛋白时,不能防止第一蛋白与第二蛋白相互连接。因此, 双异功能交联剂是较佳的,因为这样能控制反应的次序,并根据意愿组合蛋白质。因 此,双异功能试剂提供了连接两个多肽的更复杂的方法。这些试剂需要一个待连接分 子(下称为配对分子B)具有的反应性基团与另一分子(下称为配对分子A)中的不同,或 者要求两个官能团的一个在另一基团与配对分子A反应时被封闭或其反应性大大降 低。在形成异偶联物的典型两步方法中,配对分子A与双异功能试剂反应,形成衍生 的配对分子A。如果交联剂的未反应的官能团被封闭,则然后进行去保护。去保护后, 使配对分子B与衍生的配对分子A偶联,形成偶联物。在衍生处理步骤中,配对分 子A上的伯氨基与交联剂上的激活的羧酸根或亚胺酸根基团反应。交联剂另一端的反 应性巯基(thiol)或被封闭和激活的巯基分别与配对分子B上的亲
电子基团或反应性巯 基反应。当交联剂具有反应性巯基时,配对分子B上的亲电子集团宜为封闭和激活的 巯基、马来酰亚胺基或卤代亚甲基羰基(如溴代乙酰基或碘代乙酰基)基团。由于天然 生物大分子不含有这些亲电子体,所以必须通过另一衍生反应将其加入配对分子B 中。当交联剂具有被封闭的和激活的巯基时,与其反应的配对分子B上的巯基可以是 配对分子B所天然具有的。
双异功能试剂的一个例子是N-琥珀酰亚氨基3-(2-吡啶基硫代)丙酸酯 (SPDP)(Carlsson等人.,1978,Biochem.J.,173:723-737)。其它用于连接蛋白质的双异 功能试剂包括,例如,琥珀酰亚氨基4-(N-马来酰亚氨基甲基)环己烷-1-羧酸酯(SMCC) (Yoshitake等人.,1979,Eur.J.Biochem,101:395-399),2-亚氨基thiolane(IT)(Jue等人., 1978,Biochemistry,17:5399-5406),和S-乙酰基巯基琥珀酸酐(SAMSA)(Klotz和 Heiney,1962,Arch.Biochem.Biophys.,96:605-612)。这三种交联剂均优先与伯胺(如赖 氨酸侧链)反应,形成酰胺或脒基团,该基团通过1-3个碳原子长的短连接接头臂使巯 基与衍生的分子(如异源抗原)相连。
双异功能试剂的另一例子是N-琥珀酰亚氨基3-(2-吡啶基二硫)丁酸酯(SPDB) (Worrell等人.,1986,Anti-Cancer Drug Design,1:179-188),其结构与SPDP一样,只 是在硫原子α位有单个甲基侧链,其被封闭和被2-硫代吡啶激活。Thorpe等人.(1987, Cancer Research,47:5924-5931)描述的SMPT和SMBT在N-羟基琥珀酰亚胺激活的羧 基和封闭的巯基之间有苯甲基间隔臂;巯基和单甲基侧链均与间隔臂的脂肪族碳相 连。这些双异功能试剂比没有侧链的交联剂使二硫键的切断更不容易。
含有反应性二硫键的双异功能试剂的其它一些例子包括S-4-琥珀酰亚氨基氧代 羰基-α-甲基苄基
硫代硫酸钠、4-琥珀酰亚氨基氧羰基-α-甲基-(2-吡啶基二硫)甲苯。
反应性基团中具有与巯基反应的双键的双异功能试剂的例子包括上述的SMCC、 m-马来酰亚氨基苯
甲酸琥珀酰亚氨酯、3-(马来酰亚氨基)丙酸琥珀酰亚氨基酯、4-(p- 马来酰亚氨基苯基)丁酸硫代琥珀酰亚氨基酯、4-(N-马来酰亚氨基甲基环己烷-1-羧酸 琥珀酰亚氨基酯和马来酰亚氨基苯甲酰基-N-羟基琥珀酰亚胺酯(MBS)。在较佳的方案 中,MBS用于产生偶联物。
形成两种蛋白质的偶联物的其它双异功能试剂由例如Rodwell等人在美国专利 4,671,958和由Moreland等人在美国专利5,241,078中有所描述。
SCE和感兴趣分子的交联可通过还原性氨基化使羰基与氨基偶联、或羰基与酰肼 偶联。
或者,嵌合多肽可用例如Atherton和Shephard(同上)第九章中以及Roberge等人 (1995)中描述的溶液合成或固相合成来合成。本发明的肽可用本领域已知的溶液或固 相合成来合成。例如,下列文献中描述了广泛使用的Merrifield固相合成方法,包括 试验步骤:Stewart等人(1969,Solid Phase Peptide Synthesis,W.H.Freeman Co.,San Francisco);Merrifield(1963,JAm Chem Soc 85:2149);Meienhofer(1973,Int J Pept Pro Res 11:246);Barany和Merrifield(1980,in The Peptides,E.Gross和F.Meinenhofer编著, 第2卷,Academic Press,第3-285页)。合成可采用人工技术,或可用例如Applied BioSystems 431A型肽合成仪(Foster City,Calif.)或Biosearch SAM II型自动肽合成仪 (Biosearch,Inc.,San Rafael,Calif.)根据生产商提供的说明书手册和试剂和来全部自动 化合成。Cys残基之间的二硫键可通过如KCN在美国专利4,757,048第20栏所述的 对线性肽进行轻微的氧化来导入。
在另一方案中,用重组核酸为基础的方法来产生嵌合多肽。因此,本发明的另一 方面提供了一种分离的、合成的或重组多核苷酸,其包含编码嵌合多肽的核苷酸序列, 其中该多核苷酸包含编码至少一个如上所述的自身聚集元件(SCE)的第一核苷酸序 列,以及读框内相融合的编码至少一个感兴趣多肽的第二核苷酸序列。术语“读框内” 指当多核苷酸被转化入宿主细胞中后,细胞能将该多核苷酸序列转录和翻译成包含 SCE氨基酸序列和至少一个感兴趣多肽的单个多肽。例如,编码嵌合多肽的核酸分子 可用容易购得的设备来从头合成。DNA的依次合成在例如美国专利4,293,652中有所 描述。除了从头合成,还可采用重组技术,其包括使用限制性内切核酸酶来切割不同 的编码SCE的多核苷酸,和用连接酶将其与编码感兴趣分子的经切割的多核苷酸连接 在同一读框内。合适的重组技术在例如Ausubel等人(同上)和Sambrook等人(同上)的 有关章节中有所描述。合适的是,合成的多核苷酸宜用剪接法通过重叠延伸序列 (SOEing)来构建,例如在Horton等人(1990,Biotechniques 8(5):528-535;1995,Mol Biotechnol.3(2):93-99;和1997,Methods Mol Biol.67:141-149)中有所描述。然而,应 当注意,本发明既不取决于也不涉及构建合成构建物的任一特定技术。
认为核苷酸序列可以直接相连,或者,核苷酸序列可由其它密码子隔开。例如, 编码SCE氨基酸序列的核苷酸序列和编码至少一个感兴趣多肽的核苷酸序列之间还 可有额外的密码子,以便提供使SCE氨基酸序列和感兴趣多肽在空间上分开的接头氨 基酸序列。该接头有利于感兴趣多肽的合适折叠,以确保其在即便嵌合多肽整体与含 有SCE氨基酸序列的其它嵌合多肽形成团聚体时,仍保留所需的生物活性。在一些方 案中,尤其当感兴趣的多肽在其氨基端或紧靠氨基端处不包含带电荷氨基酸时,接头 宜包含1、2、3、4、5或更多个带电荷的、通常为碱性的氨基酸残基,以防止或减少 了SCE氨基酸序列在细胞内从嵌合多肽中切割下来的能力。较佳的是,这些带电荷的 氨基酸残基置于感兴趣多肽的氨基端或紧靠氨基端处(例如在氨基端的大约1、2、3、 4、5个氨基酸内)。另外,还可包括因克隆技术(如连接和限制性内切核酸酶消化、以 及将限制性内切核酸酶识别位点策略性地引入多核苷酸)而产生的额外的密码子。
多核苷酸的编码序列可以是任何次序,即,SCE氨基酸的编码序列可以在编码至 少一个感兴趣多肽的核苷酸序列的上游(5′)或下游(3′),从而使得SCE氨基酸序列在所 得嵌合多肽中位于至少一个感兴趣多肽的氨基端或羧基端。在较佳的实施方案中,编 码SCE的核苷酸序列位于编码至少一个感兴趣多肽的下游(3′)。在含有编码两种或多 种感兴趣多肽的序列的方案中,SCE编码序列可置于两个感兴趣多肽之间。
就这些序列本来不在上述重组多核苷酸内而言,应当理解,这些多核苷酸宜进一 步包含调控
调控序列,例如但不局限于与编码序列读框内融合位于编码序列上游(5′) 的翻译起始密码子,以及与编码序列读框内融合且位于编码序列下游(3′)的翻译终止密 码子。这些多核苷酸可用于在合适宿主细胞中表达重组嵌合多肽。例如,本发明的重 组嵌合多肽可用以下程序来制得,该程序包括下列步骤:(a)制备重组多核苷酸,该多 核苷酸包含的编码嵌合多肽的核苷酸序列,该嵌合多肽含有自身聚集元件以及与其相 融合的至少一个感兴趣多肽,其中核苷酸序列与一个或多个调控元件操作性相连;(b) 将重组多核苷酸导入合适的宿主细胞内;(c)培养宿主细胞,表达所述重组多核苷酸编 码的重组多肽;和(d)从细胞或细胞培养基中分离得到重组的嵌合多肽。因此,本发明 一部分涉及包含该重组多核苷酸的载体,以及包含该多核苷酸或载体的宿主细胞。这 些载体可用于扩增宿主细胞中的多核苷酸。较佳的载体包括表达载体,其含有合适的 调控元件以使编码的嵌合蛋白在已经转化或转染了该载体的宿主细胞中表达。表达载 体包括但不局限于,自身复制的染色体外的载体,如质粒,或是整合入宿主基因组中 的载体。调控元件通常是宿主细胞用于表达所适合的。对于各种宿主细胞而言,本领 域已知有众多类型的合适的表达载体和调控序列。通常,调控元件包括但不局限于启 动子序列、前导或信号序列、核糖体结合位点、转录起始和终止序列、翻译起始和终 止序列、增强子或激活子序列。本领域已知的组成型或可诱导的启动子也在本发明考 虑范围内。启动子可以是天然存在的启动子,或是将多个启动子的元件组合起来的杂 合启动子。
在一些方案中,表达载体含有可选择的标记基因,以便选择转化的或转染的宿主 细胞。选择基因是本领域技术人员所熟知的,其可因所用宿主细胞而异。
表达载体还包括融合配对物(通常由表达载体提供),这样,本发明的重组多肽可 表达为含有所述融合配对物的融合多肽。融合配对物的主要优点是它们有助于鉴别和 /或纯化所述融合多肽。为了表达所述融合多肽,需要将本发明的多核苷酸连接到表达 载体中,使融合配对物与多核苷酸的翻译读框相符。融合配对物的熟知例子包括,但 不局限于,谷胱甘肽-S-转移酶(GST)、人IgG Fc区、麦芽糖结合蛋白(MBP)和六组氨 酸(HIS6),它们特别可用于通过亲和层析来分离融合多肽。对于通过亲和层析来纯化 融合多肽而言,亲和层析的有关介质分别为与谷胱甘肽、直链淀粉和镍或铂偶联的树 脂。许多此类介质可以
试剂盒形式购得,例如和(HIS6)融合配对物一起使用的 QIAexpressTM系统(Qiagene),以及Pharmacia GST纯化系统。在较佳的方案中,重组 多核苷酸在市售载体pFLAG中表达(下文有更详细的描述)。本领域中熟知的另一融合 配对物是绿色
荧光蛋白(GFP)。该融合配对物作为荧
光标记,从而使得能用荧光显微 镜或流式细胞计数来鉴别本发明的融合多肽。在评价本发明的融合多肽的亚细胞定位 或分离表达本发明融合多肽的细胞时,GFP标记物是有用的。流式细胞计数方法(如 荧光激活细胞分拣(FACS))特别适用于后一用途。较佳的,融合配对物还具有蛋白酶(如 Xa因子或凝血酶)的切割位点,从而使得有关的蛋白酶能部分消化本发明的融合多肽 而释放出本发明的重组多肽。然后,可用随后的层析分离将释放出的多肽与融合配对 物分离。本发明的融合配对物其范围内还包括“表位标记物”,其通常是短的肽序列, 可获得针对该序列的特异性抗体。不难获得特异性单克隆抗体的表位标记物的熟知例 子包括cMyc、流感病毒、血细胞凝集素和FLAG标记物。
在另一方案中,多核苷酸包括与生物基因组中区域序列基本上同源的5′和3′侧接 区域,其能有助于多核苷酸通过同源重组导入基因组内。
重组多核苷酸可用包括转染和转化在内的任何合适的方法导入宿主细胞中,方法 的选择取决于所用的宿主细胞。因此,本发明另一方面提供了一种宿主细胞,该宿主
细胞转染或转化了编码本发明嵌合多肽的重组多核苷酸。该宿主细胞能产生本发明的 嵌合多肽,该嵌合多肽在有利于团聚的条件下在体外或体内和其它相同的嵌合多肽团 聚形成高级均-团聚体。在另一方案中,本发明还涉及经至少两个重组编码本发明嵌合 多肽的多核苷酸转化或转染的宿主细胞,其中至少两个多核苷酸编码相容的SCE氨基 酸序列和不同的感兴趣多肽。这些宿主细胞能产生至少两个本发明的嵌合多肽,这些 多肽能在有利于团聚的条件下在体外或体内相互团聚形成更高级的团聚体。这种异- 团聚体的优点是可用于提供多种抗原来增强宿主抵抗疾病的免疫能力,或为多步化学 反应的催化提供多种酶活性。“相容的”SCE氨基酸序列指SCE氨基酸序列是相同的 或充分相似,从而能相互团聚形成高级团聚体。有利的是,两种或多种感兴趣多肽在 高级团聚体中保留其天然的生物活性(如抗原性活性,结合活性;酶活性)。
用于表达的合适的宿主细胞可以是原核细胞或真核细胞。宿主细胞可以来自与衍 生获得该多核苷酸编码的SCE氨基酸序列相同领域(原核生物、动物、植物、
真菌、 原生生物等),或不同领域的生物。在较佳的方案中,宿主细胞来自与衍生获得多核苷 酸编码的SCE氨基酸序列的相同种属的生物。表达本发明多肽的一种较佳的宿主细胞 是细菌。所用的细菌可以是大肠杆菌。或者,宿主细胞可以是昆虫细胞,例如可用含 有杆状病毒表达系统的SF9细胞。
另一方面,本发明涉及包含上述宿主细胞的细胞培养物,其中该细胞表达上述多 核苷酸编码的嵌合多肽,且其中细胞培养物包括的细胞中嵌合多肽以高级团聚体形式 存在。
重组嵌合多肽可由本领域技术人员用例如以下文献中的标准程序来常规制得: Sambrook,等人,1989,尤其是第16和17节;Ausubel等人,(1994-1998),尤其是第10 和16章;以及Coligan等人,(1995-1997),尤其是第1、5和6章。
例如,这些多肽可通过培养含有上述重组多核苷酸的宿主细胞来制得。因此,在 另一方面,本发明涉及一种产生本文所述嵌合多肽的方法,该方法包括用至少一个本 发明的重组多核苷酸转化或转染细胞;使该细胞在导致至少一种嵌合多肽表达的条件 下生长。在较佳的方案中,该方法还包括从细胞或细胞生长培养基中分离出嵌合多肽 的步骤。
本发明还涉及伴有或不伴有天然蛋白糖基化的重组或合成的嵌合多肽。上述重组 多核苷酸在细菌(如大肠杆菌)内的表达提供了未糖基化的分子。具有无活性的N-糖基 化位点的功能突变型嵌合多肽变体可用寡核苷酸合成和连接方法或用定点诱变技术 来产生。这些多肽变体可用酵母表达系统以优良的得率和均一的、还原的碳水化合物 形式获得。真核蛋白中的N-糖基化位点的特征是有氨基酸三联体Asn-A1-Z,其中A1 是除Pro外的任何氨基酸,Z是Ser或Thr。在该序列中,天冬酰胺为碳水化合物的共 价连接提供了侧链氨基。该位点可通过用另一氨基酸替换Asn或残基Z、或除去Asn 或Z、或在A1和Z之间插入非Z的氨基酸、或在Asn和A1之间插入除Asn之外的 氨基酸来除去。
重组嵌合多肽还可用经基因修饰的动物(通常非人动物)来制得。因此,本发明涉 及经遗传修饰的动物,该动物表达编码本发明的嵌合分子的多核苷酸。遗传修饰通常 为转基因的形式,因此本发明的经遗传修饰的动物是转基因动物,其细胞中含有至少 一个转基因,该转基因包括了编码上述至少一个嵌合分子的多核苷酸,该多核苷酸与 调控元件(通常包括转录控制元件)操作性相连。转基因宜在动物体细胞内,但是也可 在生殖细胞内。转基因动物通常是哺乳动物,其可选自
啮齿目动物。在一些方案中, 转基因动物是小鼠,但大鼠也可用于特定用途。然而,应理解本发明并不局限于这些 种类。例如,转基因动物可以是山羊、
奶牛、绵羊、狗、豚鼠或鸡。
本发明的经基因修饰的动物可用任何手段获得。在一个方法中,制备核酸靶构建 物或载体,其含有两个接在转基因侧面的区域,该区域与动物基因组中某些部分充分 同源,因而能与这些部分经历同源重组。另外,用于随机整合的构建物不需要包括介 导重组的同源区。方便的是,构建物中包括了用于阳性和阴性选择的标记物,以选择 宿主细胞。靶DNA构建物通常被导入胚胎干细胞(ES)或胚胎干细胞系内。通过同源 重组产生具有基因修饰的细胞的方法是本领域已知的。
4.高级团聚体的产生
本发明还涉及一种产生高级团聚体的方法。该方法包括提供一嵌合分子,该分子 包含至少一个如本文所定义的SCE,该SCE与具有特定活性的感兴趣分子融合、连 接或以其它方式相联。嵌合分子中的至少一种SCE能在有利于团聚的条件下与另一嵌 合分子的SCE聚集,嵌合分子的团聚导致形成了活性比非团聚的感兴趣分子增强的高 级团聚体(即,均-团聚体)。在较佳的方案中,感兴趣分子是多肽,含有该多肽的高级 均-团聚体通过在宿主细胞内在有利于团聚的条件下表达该嵌合分子而产生。
在另一方案中,本发明提供了一种产生具有两种或多种不同活性的高级团聚体的 方法。该方法包括提供至少两种嵌合分子,其中各嵌合分子包含至少一个如本文所定 义的SCE,该SCE能与其它嵌合分子的SCE相容,且与感兴趣分子融合、连接或以 其它方式相联,而该感兴趣分子的活性与其它嵌合分子的另一感兴趣分子的活性不 同。第一和第二嵌合分子的SCE在有利于团聚的条件下相互共聚集,从而促进了这些 嵌合分子组装成具有上述不同活性的高级团聚体(即,异-团聚体)。在特别佳的方案中, 感兴趣分子是多肽,包含这些多肽的异-团聚体可通过使至少两个嵌合分子在宿主细胞 内在有利于团聚的条件下共同表达来产生。
上述方法还宜包括将高级团聚体从细胞或细胞的生长培养基中分离出来的步骤。
在一个方案中,每个含SCE和感兴趣多肽的嵌合蛋白在分开的、不同的宿主细 胞系统中产生,然后回收(分离和纯化)。蛋白以溶解形式或可溶形式回收。(对于随后 的团聚而言,完全纯化是有利的,但不是必须的。)然后,形成所需的两种或多种多肽 的混合物,使其处于允许团聚或聚合的条件下。这些条件包括生理条件,或可通过“接 种”蛋白团聚体、浓缩混合物以增加蛋白质的摩尔浓度、或改变
盐度、酸度或其它因 素来诱导团聚。所需的混合物可以是1∶1,或可取有利于一种嵌合蛋白的比例(例如 一个多肽与其结合或相互作用配对物的缔合常数比另一多肽低,而需要联合两者的活 性实现生物学作用)。不同的嵌合蛋白与接种物聚合且相互聚合,因为它们包含相容的 SEC结构域,最佳的是相同的SCE结构域。
在另一方案中,共同培养至少两种不同的宿主细胞系统,并使嵌合蛋白分泌到共 同的培养基中。蛋白可从培养基中共同纯化出来,或可不需要先纯化而直接置于有利 于团聚的条件下形成高级团聚体。
在还有一个方案中,将一个多核苷酸构建物或多个构建物上的两种或多种重组嵌 合多肽的转基因共转染到同一宿主细胞内。该宿主细胞产生了重组多肽,该重组多肽 在有利于团聚的条件下在体内形成高级团聚体。另外,两种重组多肽以可溶的形式回 收,并在体外置于有利于团聚的条件下以形成高级团聚体。
本发明的均-团聚体或异-团聚体的生物活性可用本领域技术人员已知的标准技术 来测定。例如,用团聚体给动物免疫接种,并评价诱导出的攻击该抗原的动物免疫细 胞是否在检测和破坏这些抗原的数量、活性和能力上是否增加,从而测试抗原性团聚 体的免疫原性。用标准测试测定免疫反应的强度,这些标准测试包括:用本领域已知 的手段直接测定周围血液淋巴细胞;自然杀伤细胞细胞毒性测试(例如参见Provinciali M.等人(1992,J.Immunol.Meth.155:19-24),
细胞增殖试验(例如参见Vollenweider,I. 和Groseurth,P.J.(1992,J.Immunol.Meth.149:133-135),免疫细胞和亚组的免疫试验 (例如参见,Loeffler,D.A.,等人(1992,Cytom.13:169-174);Rivoltini,L.,等人(1992, Can.Immunol.Immunother.34:241-251);或测试细胞介导的免疫力的
皮肤试验(例如参 见Chang,A.E.等人(1993,Cancer Res.53:1043-1050)。或者,可测定细胞因子团聚体 赋予细胞因子活性的能力,例如SCE-GM-CSF在体内刺激粒细胞和巨噬细胞增殖的 能力。该技术是本领域技术人员所熟知的。
5.用途
本发明还提供了本发明的高级团聚体的实践用途。适合的是,本发明考虑了高级 均-团聚体在各种应用中的用途,包括治疗、预防和化学加工上的用途。在此类用途的 一个方案中,均-团聚体包含用于治疗或预防特定疾病或病情的治疗性多肽。例如,治 疗性多肽可以是细胞因子,如粒细胞/巨噬细胞集落刺激因子(GM-CSF),它是刺激骨 髓细胞及其前体(尤其是嗜中性和嗜酸性粒细胞和单核细胞/巨噬细胞)存活、增殖、分 化和发挥功能的造血生长因子。GM-CSF可用于治疗各种造血疾病,包括骨髓抑制疾 病如获得性免疫缺陷综合征(AIDS)和感染性疾病。它还可用来治疗癌症如黑色素瘤。 根据本发明,由于高级GM-CSF团聚体具有增强的活性(如较高的效力和/或延长的循 环半衰期),其必须使用或给药的
频率减少,或获得有效剂量的使用或给药的量减少。 例如,治疗时与单用非团聚体形式GM-CSF相比,使造血祖细胞(如骨髓细胞)增殖、 分化和功能激活所需的团聚体的量要少。可根据本发明来形成均-团聚体的治疗上有用 的蛋白的其它例子是趋化因子蛋白,例如单核细胞化学吸引蛋白-1(MCP-1),它还可 用于
癌症治疗。
在另一方案中,均-团聚体包含具有酶活性、尤其是被认为在化学加工中有催化 价值的多肽。包含这些多肽的高级团聚体可用作实施化学加工的催化介质。
另外,本发明涉及高级异-团聚体的用途。在此种类型的一个方案中,高级异-团 聚体包含多个调节个体内免疫反应的抗原。这些多价免疫调节组合物可单独给予,或 和增强组合物效果的佐剂联合给予。在某些方案中,高级团聚体本质上是颗粒,因此 可有利地用来引导抗原呈递细胞(尤其是树突状细胞),以便将抗原高效地输送至这些 细胞的MHC I类和/或MHC II类通道中。在该方案中,经处理的树突状细胞诱导强的 免疫反应,并非常有效地产生抗原特异性CTL和T辅助细胞。可用本发明的团聚体 活化的其它抗原呈递细胞包括单核细胞、巨噬细胞、骨髓系细胞、B细胞、树突状细 胞或朗氏细胞。产生抗原活化的树突状细胞的方法在例如Steinman等人的美国专利 5,994,126中有所描述。
在另一方案中,高级异-团聚体包括含白介素-2(IL-2)的第一嵌合多肽和含Fas配 体的第二嵌合多肽。该高级团聚体可用于靶向某些白血病或淋巴瘤细胞或携带有高亲 和力IL-2R和Fas的刚激活的T细胞。
在另一方案中,产生了有次序的团聚体,其包含两种或多种酶,例如第一个酶催 化化学加工中的一个步骤,第二个酶催化第一酶促反应的代谢产物所参与的下游步 骤。由于第一反应产物和第二催化酶相互靠近,因此该团聚体通常提高了化学加工的 速度和/或效率。
根据前面的描述,医师和/或兽医显然能用高级团聚体来预防或治疗患者的许多 疾病或缺陷。因此,本发明另一方面还涉及一种药物组合物,它包含本发明的高级团 聚体以及药学上可接受的载体和/或稀释剂。用于治疗各种病情的团聚体的量当然取决 于待治疗的疾病的严重程度、所选的给药途径以及高级团聚体的特定活性或纯度,其 通常可由主治医师或兽医来确定。适合给药的药物组合物包含有效量的高级团聚体和 药学上可接受的载体。
本发明的组合物可以各种途径来给药,包括但不局限于肠胃外途径(例如注射, 包括但不局限于静脉内、动脉内、肌内、皮下注射;吸入,包括但不局限于支气管内、 鼻内或
口腔吸入;鼻内滴剂;外用)和肠胃内途径(例如口服,包括但不局限于饮食; 直肠)。
载体在所用剂量和浓度下对于接受者是无毒的。所用制剂可根据所选给药途径 (例如溶液、乳液、胶囊)而异。对于溶液或乳液,合适的载体包括,例如,水性或醇 性/水性溶液,乳液或悬浮液,包括盐水和缓冲介质。肠胃外载体可包括氯化钠溶液、 Ringer′s葡萄糖、葡萄糖和氯化钠、乳
酸化Ringer′s或固定的油。静脉内载体可包括各 种添加剂、
防腐剂、或体液、营养物或
电解质补充剂。通常参见Remington′s Pharmaceutical Science,第16版,Mack编,(1980)。对于吸入,化合物可以溶解并装 入合适的分配器中进行给药(例如
喷雾器、喷洒器或压力
气溶胶分配器)。融合蛋白可 单独或与其它药物或试剂(例如其它化疗剂、免疫系统增强剂)组合。
本发明还涉及免疫增强组合物,其包含本发明的高级团聚体以及任选的佐剂。有 效的佐剂例子包括但不局限于:氢氧化
铝、N-乙酰基-胞壁酰基-L-苏氨酰基-D-异谷氨 酰胺(thur-MDP)、N-乙酰基-正(nor)-胞壁酰基-L-丙氨酰基-D-异谷氨酰胺(CGP 11637, 也称为nor-MDP)、N-乙酰基胞壁酰基-L-丙氨酰基-D-异谷氨酰胺基-L-丙氨酸-2-(1′,2′- 二棕榈酰-sn-甘油-3-羟基磷酰氧)-乙胺(CGP 1983A,也称为MTP-PE)和RIBI(其含有 从细菌抽提出的三种组分,单磷脂A、海藻糖二霉菌酸酯和细胞壁骨架 (MPL+TDM+CWS),配制在2%鲨烯/吐温80乳液中)。例如,佐剂的效果可通过测定 给予组合物后产生的抗体量来确定,其中这些抗体针对经该组合物处理的细胞所呈递 的一种或多种抗原。另外,如果需要,免疫增强组合物可含有少量辅助物质如增强组 合物效果的润湿或乳化剂和/或pH缓冲剂。
如果需要,可将适合缓释或间歇释放的含免疫增强组合物的装置或组合物植入体 内或外用,以便将这些物质较缓慢地释放入体内。
免疫增强组合物可用常规方式通过注射(如皮下或肌内注射)来
肠胃外给药。适合 其它给药模式的额外制剂包括栓剂,在一些情况下是口服制剂。对于栓剂,传统的结 合剂和载体可包括,例如,聚亚烷基二醇或甘油三酸酯;这些栓剂可从含有0.5-10%、 较佳为1-2%的活性组分的混合物形成。口服制剂包括通常使用的赋形剂,例如药物 级甘露醇、乳糖、淀粉、碳酸镁等。这些组合物为溶液、悬浮液、片剂、丸剂、胶囊 剂、缓释制剂或粉末形式,其含有10-95%、较佳为25-70%的活性组分。
本发明还包括一种治疗和/或预防疾病或病情的方法,该方法包括将有效量的上 述组合物给予需要有此治疗的患者。疾病或病情可由如上所述的病原性生物或癌引 起,或可以是自身免疫疾病或变态疾病。
在一些方案中,本发明的免疫增强组合物适合用来治疗或预防癌症。可根据本发 明实践来适当治疗的癌症包括肺癌、乳房癌、卵巢癌、子
宫颈癌、结肠癌、头和颈癌、 胰癌、前列腺癌、胃癌、膀胱癌、肾癌、骨癌、肝癌、食管癌、脑癌、睾丸癌、子宫 癌、黑色素瘤和各种白血病和淋巴瘤。
在其它方案中,免疫增强组合物适合治疗或预防病毒、细菌或寄生虫感染。本发 明所考虑的
病毒感染包括,但不局限于,由HIV、肝炎病毒、流感病毒、日本脑炎病 毒、EB病毒和
呼吸道合胞病毒引起的感染。细菌感染包括,但不局限于,由奈瑟氏 菌属、脑膜炎球菌属、嗜血杆菌属、沙门氏菌属、链球菌属、军团杆菌属和分枝杆菌 属引起的感染。本发明所包括的寄生虫感染包括,但不局限于,由疟原虫属、血吸虫 属、利什曼原虫属、锥虫属、弓形虫属和贾第虫属引起的感染。
上述组合物或疫苗可以与剂型相容的方式给药,其量能在治疗上有效地缓解患者 的疾病或病情或能在预防上有效地防止患者发生该疾病或病情。在本发明中,给予患 者的剂量应当足以随时间在患者体内产生有益的反应,例如失血减少或停止。组合物 或疫苗的给药量将取决于待治疗的对象,包括其年龄、性别、体重和通常健康状况。 在这一方面,组合物或疫苗的确切给药量将取决于医师的判断。在确定治疗疾病或病 情中待给予的组合物或疫苗的有效量时,医师可以评价疾病或病情随时间的进展。无 论如何,本领域技术人员都很容易确定本发明的组合物或疫苗的合适剂量。
为了使本发明更容易理解和用于实践,下面将根据以下非限制性例子来描述特别 佳的实施方案。
实施例实施例1
可移动的OmpA信号肽构建物
包括生物活性多肽的感兴趣分子可通过含信号肽和可弯曲接头的可移动(portable) 构建物与各生物活性多肽的氨基端或羧基端共价连接来装配成高级团聚体。在该例子 中,信号肽接头包含序列MKKTAIAIAVALAGFATVAQAGGGGSGGGGSGGGGS*** [SEQ ID NO:133]或序列***GSSGSGGGGSGGGGSTAIAIAVALAGFATVAQATKK [SEQ ID NO:134]。SEQ ID NO:133的前21个氨基酸残基以及SEQ ID NO:134的后21 个氨基酸残基衍生自OmpA信号肽。这些序列的其余氨基酸残基代表了可弯曲的亲水 性接头的缩短版本,其通常用于例如单链抗体的产生。其它可弯曲的亲水性接头已有 报道并可用于该位置。标记***表示肽接头与生物活性多肽偶联所需的反应性基团(例 如卤代羧酸或酯,如碘代乙酰胺;亚胺如马来酰亚胺;乙烯基砜,或二硫化物)。
实施例2
重组或合成的SCE嵌合构建物的装配
出于描述的目的,通过将编码SCE的第一核苷酸序列和编码感兴趣肽或多肽的 第二核苷酸序列以及编码标记肽(又称标记物、尾肽)的第三核苷酸序列(其有助于构建 物的纯化)连接在同一读框内,装配得到重组或合成的嵌合构建物。第一和第二核苷酸 序列之间以及第二和第三核苷酸序列之间可任选地插入编码间隔臂的寡核苷酸,其在 翻译后将感兴趣多肽与SCE隔开,从而使得SCE序列基本上不干扰感兴趣多肽的合 适折叠。SCE可以连接在感兴趣多肽的N端或C端。该构建物编码的融合蛋白可用 以下通式归纳:
1. 和
2.
其中:N-SCE是MKKTAIAIAVALAGFATVAQA[SEQID NO:136];
SCE-C是TAIAIAVALAGFATVAQATKK[SEQ ID NO:138];
感兴趣多肽选自鼠或人GM-CSF[分别为SEQ ID NO:140和142],鼠或人IFN-β [分别为SEQ ID NO:144和146],鼠或人IL-IRa[分别为SEQ ID NO:148和150],鼠 或人IL-2[分别为SEQ ID NO:152和154],鼠或人Fas配体[分别为SEQ ID NO:156 和158],或HEL[SEQ ID NO:160],鼠或人MCP-1[分别为SEQ ID NO:208和210];
标记物选自Flag(DYKDDDDK[SEQ ID NO:162]),His(HHHHHH[SEQ ID NO: 164])或Strep(AWRHPQFGG[SEQ ID NO:166]);
间隔臂1是任选的,当其存在时,是GS(GGGGS)nGSS[SEQ ID NO:167],其中 n=0-10;
间隔臂2是任选的,当其存在时,是GSS[SEQ ID NO:168];和
间隔臂3是任选的,当其存在时,是GSSGS(GGGGS)n[SEQ ID NO:169],其中 n=0-10。
对于重组表达,涉及编码本发明嵌合分子的核酸构建物含有合适的翻译起始信号 (例如ATG)和终止信号(例如TAA),如果构建物的末端元件没有提供该信号的话。这 些构建物可以插入合适的表达载体(如pET-28a(+)载体,其可从Novagen市售购得) 用于重组表达构建物。
实施例3
自身聚集的鼠GM-CSF构建物
用表达下列核酸序列的合适的表达系统可产生自身聚集的鼠GM-CSF:
GGATCCGGTGGTGGTGGATCCGGCTCGAGTTGGCTGCAGAATTTACT TTTCCTGGGCATTGTGGTCTACAGCCTCTCAGCACCCACCCGCTCACCCATCACTGTCA CCCGGCCTTGGAAGCATGTAGAGGCCATCAAAGAAGCCCTGAACCTCCTGGATGACAT GCCTGTCACATTGAATGAAGAGGTAGAAGTCGTCTCTAACGAGTTCTCCTTCAAGAAG CTAACATGTGTGCAGACCCGCCTGAAGATATTCGAGCAGGGTCTACGGGGCAATTTCA CCAAACTCAAGGGCGCCTTGAACATGACAGCCAGCTACTACCAGACATACTGCCCCCC AACTCCGGAAACGGACTGTGAAACACAAGTTACCACCTATGCGGATTTCATAGACAGC CTTAAAACCTTTCTGACTGATATCCCCTTTGAATGCAAAAAACCAGTCCAAAAA GACTACAAGGACGATGACGACAAGTAATAA [SEQ ID NO:185]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=1, 正常字体的核苷酸编码鼠GM-CSF,有双划线的核苷酸编码间隔臂2,斜体字核苷酸 编码有助于纯化的FLAG标记物,粗体核苷酸是一对
串联的翻译终止密码子。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIAIAVALAGFATVAQAGSGGGGSGSSWLQNLLFLGIVVYSLSAPTRSPIT VTRPWKHVEAIKEALNLLDDMPVTLNEEVEVVSNEFSFKKLTCVQTRLKIFEQGLRGNFT KLKGALNMTASYYQTYCPPTPETDCETQVTTYADFIDSLKTFLTDIPFECKKPVQKGSSDY KDDDDK [SEQ ID NO:186]
实施例4
自身聚集的人GM-CSF构建物
用表达下列核酸序列的合适表达系统能产生自身聚集的人GM-CSF:
ATGGACTACAAGGACGATGACGACAAG TGGCTGCAGAGCCTGCT GCTCTTGGGCACTGTGGCCTGCAGCATCTCTGCACCCGCCCGCTCGCCCAGCCCCAGC ACGCAGCCCTGGGAGCATGTGAATGCCATCCAGGAGGCCCGGCGTCTCCTGAACCTGA GTAGAGACACTGCTGCTGAGATGAATGAAACAGTAGAAGTCATCTCAGAAATGTTTGA CCTCCAGGAGCCGACCTGCCTACAGACCCGCCTGGAGCTGTACAAGCAGGGCCTGCGG GGCAGCCTCACCAAGCTCAAGGGCCCCTTGACCATGATGGCCAGCCACTACAAGCAGC ACTGCCCTCCAACCCCGGAAACTTCCTGTGCAACCCAGATTATCACCTTTGAAAGTTTC AAAGAGAACCTGAAGGACTTTCTGCTTGTCATCCCCTTTGACTGCTGGGAGCCAGTCC AGGAG GGCTCGAGTGGATCCGGTGGTGGTGGTAGCGGTGGTGGTGGATCC
[SEQ ID NO:187]
其中粗体核苷酸是翻译起始密码子,斜体字核苷酸编码有助于纯化的Flag标记 物,有双划线的核苷酸编码间隔臂2,正常字体的核苷酸编码人GM-CSF,有下划线 的核苷酸编码间隔臂3,其中n=2,带方框的核苷酸编码SCE-C。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MDYKDDDDKGSSWLQSLLLLGTVACSISAPARSPSPSTQPWEHVNAIQEARRLL NLSRDTAAEMNETVEVISEMFDLQEPTCLQTRLELYKQGLRGSLTKLKGPLTMMASHYKQ HCPPTPETSCATQIITFESFKENLKDFLLVIPFDCWEPVQEGSSGSGGGGSGGGGSTAIAIAV ALAGFATVAQATKK [SEQ ID NO:188]
实施例5
自身聚集的鼠IFN-β构建物
用表达下列核酸序列的合适表达系统能产生自身聚集的鼠IFN-β:
ATGCATCATCATCATCATCAT AACAACAGGTGGATCCTCCACGCT GCGTTCCTGCTGTGCTTCTCCACCACAGCCCTCTCCATCAACTATAAGCAGCTCCAGCT CCAAGAAAGGACGAACATTCGGAAATGTCAGGAGCTCCTGGAGCAGCTGAATGGAAA GATCAACCTCACCTACAGGGCGGACTTCAAGATCCCTATGGAGATGACGGAGAAGAT GCAGAAGAGTTACACTGCCTTTGCCATCCAAGAGATGCTCCAGAATGTCTTTCTTGTCT TCAGAAACAATTTCTCCAGCACTGGGTGGAATGAGACTATTGTTGTACGTCTCCTGGA TGAACTCCACCAGCAGACAGTGTTTCTGAAGACAGTACTAGAGGAAAAGCAAGAGGA AAGATTGACGTGGGAGATGTCCTCAACTGCTCTCCACTTGAAGAGCTATTACTGGAGG GTGCAAAGGTACCTTAAACTCATGAAGTACAACAGCTACGCCTGGATGGTGGTCCGAG CAGAGATCTTCAGGAACTTTCTCATCATTCGAAGACTTACCAGAAACTTCCAAAAC GG CTCGAGTGGATCCGGTGGTGGTGGTAGCGGTGGTGGTGGTAGCGGTGGTGGTGGTAGC GGTGGTGGTGGTAGCGGTGGTGGTGGATCC [SEQ ID NO:189]
其中粗体核苷酸是翻译起始密码子,斜体字核苷酸编码有助于纯化的His标记物, 有双划线的核苷酸编码间隔臂2,正常字体的核苷酸编码鼠IFN-β,有下划线的核苷 酸编码间隔臂3,其中n=5,带方框的核苷酸编码SCE-C。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MHHHHHHGSSNNRWILHAAFLLCFSTTALSINYKQLQLQERTNIRKCQELLEQLN GKINLTYRADFKIPMEMTEKMQKSYTAFAIQEMLQNVFLVFRNNFSSTGWNETIVVRLLD ELHQQTVFLKTVLEEKQEERLTWEMSSTALHLKSYYWRVQRYLKLMKYNSYAWMVVR AEIFRNFLIIRRLTRNFQNGSSGSGGGGSGGGGSGGGGSGGGGSGGGGSTAIAIAVALAGF ATVAQATKK [SEQ ID NO:190]
实施例6
自身聚集的人IFN-β构建物
用表达下列核酸序列的合适表达系统能产生自身聚集的人IFN-β:
GGATCCGGTGGTGGTGGTAGCGGTGGTGGTGGATCCGGCTCGAGTA CCAACAAGTGTCTCCTCCAAATTGCTCTCCTGTTGTGCTTCTCCACTACAGCTCTTTCCA TGAGCTACAACTTGCTTGGATTCCTACAAAGAAGCAGCAATTTTCAGTGTCAGAAGCT CCTGTGGCAATTGAATGGGAGGCTTGAATATTGCCTCAAGGACAGGATGAACTTTGAC ATCCCTGAGGAGATTAAGCAGCTGCAGCAGTTCCAGAAGGAGGACGCCGCATTGACC ATCTATGAGATGCTCCAGAACATCTTTGCTATTTTCAGACAAGATTCATCTAGCACTGG CTGGAATGAGACTATTGTTGAGAACCTCCTGGCTAATGTCTATCATCAGATAAACCAT CTGAAGACAGTCCTGGAAGAAAAACTGGAGAAAGAAGATTTTACCAGGGGAAAACTC ATGAGCAGTCTGCACCTGAAAAGATATTATGGGAGGATTCTGCATTACCTGAAGGCCA AGGAGTACAGTCACTGTGCCTGGACCATAGTCAGAGTGGAAATCCTAAGGAACTTTTA CTTCATTAACAGACTTACAGGTTACCTCCGAAAC GCTTGGCGTCACCCGC AGTTCGGTGGTTAATAA [SEQ ID NO:191]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=2, 正常字体的核苷酸编码人IFN-β,有双划线的核苷酸编码间隔臂2,斜体字核苷酸编 码有助于纯化的Strep标记物,粗体核苷酸是一对串联的翻译终止密码子。
上述构建物的表达,例如,在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIAIAVALAGFATVAQAGSGGGGSGGGGSGSSTNKCLLQIALLLCFSTTAL SMSYNLLGFLQRSSNFQCQKLLWQLNGRLEYCLKDRMNFDIPEEIKQLQQFQKEDAALTI YEMLQNIFAIFRQDSSSTGWNETIVENLLANVYHQINHLKTVLEEKLEKEDFTRGKLMSSL HLKRYYGRILHYLKAKEYSHCAWTIVRVEILRNFYFINRLTGYLRNGSSAWRHPQFGG
[SEQ ID NO:192]
实施例7
自身聚集的鼠IL-IRa构建物
自身聚集的鼠IL-IRa用表达下列核酸序列的合适表达系统来产生:
GGATCCGGTGGTGGTGGTAGCGGTGGTGGTGGTAGCGGTGGTGGTG GTAGCGGTGGTGGTGGTAGCGGTGGTGGTGGATCCGGCTCGAGTGAAATCTGCTGGGG ACCCTACAGTCACCTAATCTCTCTCCTTCTCATCCTTCTGTTTCATTCAGAGGCAGCCTG CCGCCCTTCTGGGAAAAGACCCTGCAAGATGCAAGCCTTCAGAATCTGGGATACTAAC CAGAAGACCTTTTACCTGAGAAACAACCAGCTCATTGCTGGGTACTTACAAGGACCAA ATATCAAACTAGAAGAAAAGATAGACATGGTGCCTATTGACCTTCATAGTGTGTTCTT GGGCATCCACGGGGGCAAGCTGTGCCTGTCTTGTGCCAAGTCTGGAGATGATATCAAG CTCCAGCTGGAGGAAGTTAACATCACTGATCTGAGCAAGAACAAAGAAGAAGACAAG CGCTTTACCTTCATCCGCTCTGAGAAAGGCCCCACCACCAGCTTTGAGTCAGCTGCCTG TCCAGGATGGTTCCTCTGCACAACACTAGAGGCTGACCGTCCTGTGAGCCTCACCAAC ACACCGGAAGAGCCCCTTATAGTCACGAAGTTCTACTTCCAGGAAGACCAA GACTACAAGGACGATGACGACAAGTAATAA [SEQ ID NO:193]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=5, 正常字体的核苷酸编码鼠IL-1Ra,有双划线的核苷酸编码间隔臂2,斜体字核苷酸编 码有助于纯化的Flag标记物,粗体核苷酸是一对串联的翻译终止密码子。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIAIAVALAGFATVAQAGSGGGGSGGGGSGGGGSGGGGSGGGGSGSSEIC WGPYSHLISLLLILLFHSEAACRPSGKRPCKMQAFRIWDTNQKTFYLRNNQLIAGYLQGPN IKLEEKIDMVPIDLHSVFLGIHGGKLCLSCAKSGDDIKLQLEEVNITDLSKNKEEDKRFTFIR SEKGPTTSFESAACPGWFLCTTLEADRPVSLTNTPEEPLIVTKFYFQEDQGSSDYKDDDDK
[SEQ ID NO:194]
实施例8
自身聚集的人IL-1Ra构建物
自身聚集的人IL-1Ra用表达下列核酸序列的合适表达系统来产生:
ATGCATCATCATCATCATCAT GAAATCTGCAGAGGCCTCCGCAGT CACCTAATCACTCTCCTCCTCTTCCTGTTCCATTCAGAGACGATCTGCCGACCCTCTGG GAGAAAATCCAGCAAGATGCAAGCCTTCAGAATCTGGGATGTTAACCAGAAGACCTT CTATCTGAGGAACAACCAACTAGTTGCTGGATACTTGCAAGGACCAAATGTCAATTTA GAAGAAAAGATAGATGTGGTACCCATTGAGCCTCATGCTCTGTTCTTGGGAATCCATG GAGGGAAGATGTGCCTGTCCTGTGTCAAGTCTGGTGATGAGACCAGACTCCAGCTGGA GGCAGTTAACATCACTGACCTGAGCGAGAACAGAAAGCAGGACAAGCGCTTCGCCTT CATCCGCTCAGACAGCGGCCCCACCACCAGTTTTGAGTCTGCCGCCTGCCCCGGTTGG TTCCTCTGCACAGCGATGGAAGCTGACCAGCCCGTCAGCCTCACCAATATGCCTGACG AAGGCGTCATGGTCACCAAATTCTACTTCCAGGAGGACGAG GGCTCGAGTGGATCC
[SEQ ID NO:195]
其中粗体核苷酸是翻译起始密码子,斜体字核苷酸编码有助于纯化的His标记物, 有双划线的核苷酸编码间隔臂2,正常字体的核苷酸编码人IL-1Ra,有下划线的核苷 酸编码间隔臂3,其中n=0,带方框的核苷酸编码SCE-C。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MHHHHHHGSSEICRGLRSHLITLLLFLFHSETICRPSGRKSSKMQAFRIWDVNQKT FYLRNNQLVAGYLQGPNVNLEEKIDVVPIEPHALFLGIHGGKMCLSCVKSGDETRLQLEA VNITDLSENRKQDKRFAFIRSDSGPTTSFESAACPGWFLCTAMEADQPVSLTNMPDEGVM VTKFYFQEDEGSSGSTAIAIAVALAGFATVAQATKK [SEQ ID NO:196]
实施例9
自身聚集的鼠IL-2构建物
自身聚集的鼠IL-2用表达下列核酸序列的合适表达系统来产生:
ATGGCTTGGCGTCACCCGCAGTTCGGTGGT TACAGCATGCAGCT CGCATCCTGTGTCACATTGACACTTGTGCTCCTTGTCAACAGCGCACCCACTTCAAGCT CCACTTCAAGCTCTACAGCGGAAGCACAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC AGCAGCACCTGGAGCAGCTGTTGATGGACCTACAGGAGCTCCTGAGCAGGATGGAGA ATTACAGGAACCTGAAACTCCCCAGGATGCTCACCTTCAAATTTTACTTGCCCAAGCA GGCCACAGAATTGAAAGATCTTCAGTGCCTAGAAGATGAACTTGGACCTCTGCGGCAT GTTCTGGATTTGACTCAAAGCAAAAGCTTTCAATTGGAAGATGCTGAGAATTTCATCA GCAATATCAGAGTAACTGTTGTAAAACTAAAGGGCTCTGACAACACATTTGAGTGCCA ATTCGATGATGAGTCAGCAACTGTGGTGGACTTTCTGAGGAGATGGATAGCCTTCTGT CAAAGCATCATCTCAACAAGCCCTCAA GGCTCGAGTGGATCCGGTGGTGGTGGATCC
[SEQ ID NO:197]
其中粗体表示的核苷酸是翻译起始密码子,斜体字核苷酸编码有助于纯化的 Strep标记物,有双划线的核苷酸编码间隔臂2,正常字体的核苷酸编码鼠IL-2,有下 划线的核苷酸编码间隔臂3,其中n=1和带方框的核苷酸编码SCE-C。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MAWRHPQFGGGSSYSMQLASCVTLTLVLLVNSAPTSSSTSSSTAEAQQQQQQQQ QQQQHLEQLLMDLQELLSRMENYRNLKLPRMLTFKFYLPKQATELKDLQCLEDELGPLR HVLDLTQSKSFQLEDAENFISNIRVTVVKLKGSDNTFECQFDDESATVVDFLRRWIAFCQSI ISTSPQGSSGSGGGGSTAIAIAVALAGFATVAQATKK [SEQ ID NO:198]
实施例10
自身聚集的人IL-2构建物
自身聚集的人IL-2用表达下列核酸序列的合适表达系统来产生:
GGATCCGGCTCGAGTCCTACTTCAAGTTCTACAAAGAAAACACAGCT ACAACTGGAGCATTTACTGCTGGATTTACAGATGATTTTGAATGGAATTAATAATTAC AAGAATCCCAAACTCACCAGGATGCTCACATTTAAGTTTTACATGCCCAAGAAGGCCA CAGAACTGAAACATCTTCAGTGTCTAGAAGAAGAACTCAAACCTCTGAAGGAAGTGCT AAATTTAGCTCAAAGCAAAAACTTTCACTTAAGACCCAGGGACTTAATCAGCAATATC AACGTAATAGTTCTGGAACTAAAGGGATCTGAAACAACATTCATGTGTGAATATGCTG ATGAGACAGCAACCATTGTAGAATTTCTGAACAGATGGATTACCTTTTCTCAAAGCAT CATCTCAACACTGACT GACTACAAGGACGATGACGACAAGTAATAA
[SEQ ID NO 199]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=0, 正常字体的核苷酸编码人IL-2,有双划线的核苷酸编码间隔臂2,斜体字核苷酸编码 有助于纯化的Flag标记物,粗体核苷酸是一对串联的翻译终止密码子。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIAIAVALAGFATVAQAGSGSSPTSSSTKKTQLQLEHLLLDLQMILNGINN YKNPKLTRMLTFKFYMPKKATELKHLQCLEEELKPLKEVLNLAQSKNFHLRPRDLISNINV IVLELKGSETTFMCEYADETATIVEFLNRWITFSQSIISTLTGSSDYKDDDDK
[SEQ ID NO:200]]
实施例11
自身聚集的鼠Fas-L构建物
自身聚集的鼠Fas-配体用表达下列核酸序列的合适表达系统来产生:
GGATCCGGTGGTGGTGGATCCGGCTCGAGTCAGCAGCCCATGAATTA CCCATGTCCCCAGATCTTCTGGGTAGACAGCAGTGCCACTTCATCTTGGGCTCCTCCAG GGTCAGTTTTTCCCTGTCCATCTTGTGGGCCTAGAGGGCCGGACCAAAGGAGACCGCC ACCTCCACCACCACCTGTGTCACCACTACCACCGCCATCACAACCACTCCCACTGCCG CCACTGACCCCTCTAAAGAAGAAGGACCACAACACAAATCTGTGGCTACCGGTGGTAT TTTTCATGGTTCTGGTGGCTCTGGTTGGAATGGGATTAGGAATGTATCAGCTCTTCCAC CTGCAGAAGGAACTGGCAGAACTCCGTGAGTTCACCAACCAAAGCCTTAAAGTATCAT CTTTTGAAAAGCAAATAGCCAACCCCAGTACACCCTCTGAAAAAAAAGAGCCGAGGA GTGTGGCCCATTTAACAGGGAACCCCCACTCAAGGTCCATCCCTCTGGAATGGGAAGA CACATATGGAACCGCTCTGATCTCTGGAGTGAAGTATAAGAAAGGTGGCCTTGTGATC AACGAAACTGGGTTGTACTTCGTGTATTCCAAAGTATACTTCCGGGGTCAGTCTTGCA ACAACCAGCCCCTAAACCACAAGGTCTATATGAGGAACTCTAAGTATCCTGAGGATCT GGTGCTAATGGAGGAGAAGAGGTTGAACTACTGCACTACTGGACAGATATGGGCCCA CAGCAGCTACCTGGGGGCAGTATTCAATCTTACCAGTGCTGACCATTTATATGTCAAC ATATCTCAACTCTCTCTGATCAATTTTGAGGAATCTAAGACCTTTTTCGGCTTGTATAA GCTT CATCATCATCATCATCATTAATAA [SEQ ID NO:201]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=1, 正常字体的核苷酸编码鼠Fas-L,有双划线的核苷酸编码间隔臂2,斜体字核苷酸编码 有助于纯化的His标记物,粗体核苷酸是一对串联的翻译终止密码子。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIALAVALAGFATVAQAGSGGGGSGSSQQPMNYPCPQIFWVDSSATSSWA PPGSVFPCPSCGPRGPDQRRPPPPPPPVSPLPPPSQPLPLPPLTPLKKKDHNTNLWLPVVFFM VLVALVGMGLGMYQLFHLQKELAELREFTNQSLKVSSFEKQIANPSTPSEKKEPRSVAHLT GNPHSRSIPLEWEDTYGTALISGVKYKKGGLVINETGLYFVYSKVYFRGQSCNNQPLNHK VYMRNSKYPEDLVLMEEKRLNYCTTGQIWAHSSYLGAVFNLTSADHLYVNISQLSLINFE ESKTFFGLYKLGSSHHHHHH [SEQ ID NO:202]
实施例12
自身聚集的人Fas-L构建物
自身聚集的人Fas-配体用表达下列核酸序列的合适表达系统来产生:
ATGGCTTGGCGTCACCCGCAGTTCGGTGGT CAGCAGCCCTTCAA TTACCCATATCCCCAGATCTACTGGGTGGACAGCAGTGCCAGCTCTCCCTGGGCCCCTC CAGGCACAGTTCTTCCCTGTCCAACCTCTGTGCCCAGAAGGCCTGGTCAAAGGAGGCC ACCACCACCACCGCCACCGCCACCACTACCACCTCCGCCGCCGCCGCCACCACTGCCT CCACTACCGCTGCCACCCCTGAAGAAGAGAGGGAACCACAGCACAGGCCTGTGTCTCC TTGTGATGTTTTTCATGGTTCTGGTTGCCTTGGTAGGATTGGGCCTGGGGATGTTTCAG CTCTTCCACCTACAGAAGGAGCTGGCAGAACTCCGAGAGTCTACCAGCCAGATGCACA CAGCATCATCTTTGGAGAAGCAAATAGGCCACCCCAGTCCACCCCCTGAAAAAAAGG AGCTGAGGAAAGTGGCCCATTTAACAGGCAAGTCCAACTCAAGGTCCATGCCTCTGGA ATGGGAAGACACCTATGGAATTGTCCTGCTTTCTGGAGTGAAGTATAAGAAGGGTGGC CTTGTGATCAATGAAACTGGGCTGTACTTTGTATATTCCAAAGTATACTTCCGGGGTCA ATCTTGCAACAACCTGCCCCTGAGCCACAAGGTCTACATGAGGAACTCTAAGTATCCC CAGGATCTGGTGATGATGGAGGGGAAGATGATGAGCTACTGCACTACTGGGCAGATG TGGGCCCGCAGCAGCTACCTGGGGGCAGTGTTCAATCTTACCAGTGCTGATCATTTAT ATGTCAACGTATCTGAGCTCTCTCTGGTCAATTTTGAGGAATCTCAGACGTTTTTCGGC TTATATAAGCTC GGCTCGAGTGGATCCGGTGGTGGTGGTAGCGGTGGTGGTGGATCC
[SEQ ID NO:203]
其中粗体核苷酸是翻译起始密码子,斜体字核苷酸编码有助于纯化的Strep标记 物,有双划线的核苷酸编码间隔臂2,正常字体的核苷酸编码人Fas-L,有下划线的核 苷酸编码间隔臂3,其中n=2,带方框的核苷酸编码SCE-C。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MAWRHPQFGGGSSQQPFNYPYPQIYWVDSSASSPWAPPGTVLPCPTSVPRRPGQ RRPPPPPPPPPLPPPPPPPPLPPLPLPPLKKRGNHSTGLCLLVMFFMVLVALVGLGLGMFQLF HLQKELAELRESTSQMHTASSLEKQIGHPSPPPEKKELRKVAHLTGKSNSRSMPLEWEDTY GIVLLSGVKYKKGGLVINETGLYFVYSKVYFRGQSCNNLPLSHKVYMRNSKYPQDLVMM EGKMMSYCTTGQMWARSSYLGAVFNLTSADHLYVNVSELSLVNFEESQTFFGLYKLGSS GSGGGGSGGGGSTAIAIAVALAGFATVAQATKK [SEQ ID NO:204]
实施例13
鼠FasL和N-SCE和鼠IL-2和SCE-C来形成异-团聚体
用以下方法产生自身聚集的Fas-配体/IL-2异-团聚体:将含有实施例9和11所述 的核酸构建物的表达载体共同转染入细胞中(例如大肠杆菌、CHO细胞等),然后在链 霉亲和素柱和Ni-螯合柱上依次纯化表达的多肽产物,以确保只有异-团聚体被纯化。
在大肠杆菌中产生两种重组蛋白。纯化后,用超声处理/吐温20处理将已经形成 的N-SCE-鼠Fas-L和鼠IL-2-SCE-C的团聚体断裂,然后混合在一起以使其聚集。
实施例14
自身聚集的HEL构建物
自身聚集的HEL用表达下列核酸序列的合适表达系统来产生:
ATGGACTACAAGGACGATGACGACAAG AGGTCTTTGCTAATCTTG GTGCTTTGCTTCCTGCCCCTGGCTGCTCTGGGGAAAGTCTTTGGACGATGTGAGCTGGC AGCGGCTATGAAGCGTCACGGACTTGATAACTATCGGGGATACAGCCTGGGAAACTG GGTGTGTGTTGCAAAATTCGAGAGTAACTTCAACACCCAGGCTACAAACCGTAACACC GATGGGAGTACCGACTACGGAATCCTACAGATCAACAGCCGCTGGTGGTGCAACGAT GGCAGGACCCCAGGCTCCAGGAACCTGTGCAACATCCCGTGCTCAGCCCTGCTGAGCT CAGACATAACAGCGAGCGTGAACTGCGCGAAGAAGATCGTCAGCGATGGAAACGGCA TGAGCGCGTGGGTCGCCTGGCGCAACCGCTGCAAGGGTACCGACGTCCAGGCGTGGA TCAGAGGCTGCCGGCTG GGCTCGAGTGGATCCGGTGGTGGTGGTAGCGGTGGTGGTGG TAGCGGTGGTGGTGGTAGCGGTGGTGGTGGTAGCGGTGGTGGTGGATCC
[SEQ ID NO:205]
其中粗体核苷酸翻译终止密码子,斜体字核苷酸编码有助于纯化的Flag标记物, 有双划线的核苷酸编码间隔臂2,正常字体的核苷酸编码HEL,有下划线的核苷酸编 码间隔臂3,其中n=5,带方框的核苷酸编码SCE-C。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MDYKDDDDKGSSRSLLILVLCFLPLAALGKVFGRCELAAAMKRHGLDNYRGYS LGNWVCVAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALL SSDITASVNCAKKIVSDGNGMSAWVAWRNRCKGTDVQAWIRGCRLGSSGSGGGGSGGG GSGGGGSGGGGSGGGGSTAIAIAVALAGFATVAQATKK [SEQ ID NO:206]
实施例15
自身聚集的鼠MCP-1构建物
自身聚集的鼠MCP-1用表达下列核酸序列的合适表达系统来产生:
ATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCTGGTTTCGCTACCG TAGCGCAGGCCGGATCCGGCTCGAGTAAGATTTCCACACTTCTATGCCTCCTGCTCATA GCTACCACCATCAGTCCTCAGGTATTGGCTGGACCAGATGCGGTGAGCACCCCAGTCA CGTGCTGTTATAATGTTGTTAAGCAGAAGATTCACGTCCGGAAGCTGAAGAGCTACAG GAGAATCACAAGCAGCCAGTGTCCCCGGGAAGCTGTGATCTTCAGGACCATACTGGAT AAGGAGATCTGTGCTGACCCCAAGGAGAAGTGGGTTAAGAATTCCATAAACCACTTG GATAAGACGTCTCGAACGGGCTCGAGTGCTTGGCGTCACCCGCAGTTCGGTGGTTAAT AA [SEQ ID NO:211]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=0, 正常字体的核苷酸编码鼠MCP-1,有双划线的核苷酸编码间隔臂2,斜体字核苷酸编 码有助于纯化的Strep标记物,粗体核苷酸是一对串联的翻译终止密码子。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIAIAVALAGFATVAQAGSGSSKISTLLCLLLIATTISPQVLAGPDAVSTPV TCCYNVVKQKIHVRKLKSYRRIISSQCPREAVIFRTILDKEICADPKEKWVKNSINHLDKTS RTGSSAWRHPQFGG [SEQ ID NO:212]
实施例16
自身聚集的人MCP-1构建物
自身聚集的人MCP-1用表达下列核酸序列的合适表达系统来产生:
GGATCCGGCTCGAGTAAAGTCTCTGCCGCCCTTCTGTGCCTGCTGCT CATAGCAGCCACCTTCATTCCCCAAGGGCTCGCTCAGCCAGATGCAATCAATGCCCCA GTCACCTGCTGTTATAACTTCACCAATAGGAAGATCTCAGTGCAGAGGCTCGCGAGCT ATAGAAGAATCACCAGCAGCAAGTGTCCCAAAGAAGCTGTGATCTTCAAGACCATTGT GGCCAAGGAGATCTGTGCTGACCCCAAGCAGAAGTGGGTTCAGGATTCCATGGACCA CCTGGACAAGCAAACCCAAACTCCGAAGACT CATCATCATCATCATCATT AATAA [SEQ ID NO:213]
其中带方框的核苷酸编码N-SCE,有下划线的核苷酸编码间隔臂1,其中n=0, 正常字体的核苷酸编码人MCP-1,有双划线的核苷酸编码间隔臂2,斜体字核苷酸编 码有助于纯化的His标记物,粗体核苷酸是翻译终止密码子。
上述构建物的表达,例如在大肠杆菌中,产生了具有以下序列的多肽:
MKKTAIAIAVALAGFATVAQAGSGSSKVSAALLCLLLIAATFIPQGLAQPDAINAP VTCCYNFTNRKISVQRLASYRRITSSKCPKEAVIFKTIVAKEICADPKQKWVQDSMDHLDK QTQTPKTGSSHHHHHH [SEQ ID NO:214]
实施例17
化学合成的嵌合肽构建物
化学合成的嵌合肽构建物可用下列通式构建:
1. 和
2.
其中:
N-SCE2是KKTAIAIAVALAGFATVAQA[SEQ ID NO:215];
SCE-C如实施例2所定义;
间隔臂1和3如实施例2所定义;和
感兴趣的肽例如可选自代谢性肽、细胞因子肽、来自细胞因子受体的肽、效应肽 和抗原性肽。
实施例18
合成的自身聚集的人ACTH嵌合肽
自身聚集的人ACTH肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSSYSMEHFRWGKPVGKKRRPVKVY PNGAEDESAEAFPLEF [SEQ ID NO:216]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是人ACTH肽。
实施例19
合成的自身聚集的鼠ACTH嵌合肽
自身聚集的鼠ACTH肽根据下列氨基酸序列来化学合成:
SYSMEHFRWGKPVGKKRRPVKVYPNVAENESAEAFPLEF GSSGS [SEQ ID NO:217]
其中正常字体的残基是鼠ACTH肽,有下划线的残基是间隔臂1,其中n=0,带 方框的残基是SCE-C。
实施例20
合成的自身聚集的α-MSH嵌合肽
自身聚集的α-MSH肽根据下列氨基酸序列来化学合成:
SYSMEHFRWGKPV GSSGSGGGGS [SEQ ID NO:218]
其中正常字体的残基是鼠ACTH肽,有下划线的残基是间隔臂1,其中n=1, 带方框的残基是SCE-C。
实施例21
合成的自身聚集的人β-MSH嵌合肽
自身聚集的β-MSH肽根据下列氨基酸序列来化学合成:
GSGSSAEKKDEGPYRMEHFRWGSPPKD [SEQ ID NO:219]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=0,正常字 体的残基是人β-MSH肽。
实施例22
合成的合成的自身聚集的人β-MSH嵌合肽
自身聚集的β-MSH肽根据下列氨基酸序列来化学合成:
AEKDDGPYRVEHFRWSNPPKD GSSGSGGGGS [SEQ ID NO:220]
其中正常字体的残基是鼠β-MSH肽,有下划线的残基是间隔臂1,其中n=1,带 方框的残基是SCE-C。
实施例23
合成的自身聚集的γ-MSH嵌合肽
自身聚集的γ-MSH肽根据下列氨基酸序列来化学合成:
GSGSSYVMGHFRWDRFG [SEQ ID NO:221]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=0,正常字 体的残基是人γ-MSH肽。
实施例24
合成的自身聚集的血管紧张素I嵌合肽
自身聚集的血管紧张素I肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSDRVYIHPFHL [SEQ ID NO:222]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基血管紧张素I肽。
实施例25
合成的自身聚集的血管紧张素II嵌合肽
自身聚集的血管紧张素II肽根据下列氨基酸序列来化学合成:
DRVYIHPF GSSGSGGGGS [SEQ ID NO:223]
其中正常字体的残基血管紧张素III肽,有下划线的残基是间隔臂1,其中n=1, 带方框的残基是SCE-C。
实施例25
合成的自身聚集的血管紧张素III嵌合肽
自身聚集的血管紧张素III肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSRVYIHPF [SEQ ID NO:224]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基血管紧张素III肽。
实施例26
合成的自身聚集的人GHRH嵌合肽I
自身聚集的人生长激素释放激素(GHRH)肽根据下列氨基酸序列来化学合成: YFDAIFTNSYRKVLGQLSARKLLQDIMSR GSSGS [SEQ ID NO:225]
其中正常字体的残基是人GHRH肽,有下划线的残基是间隔臂1,其中n=0,带 方框的残基是SCE-C,其中GHRH肽第1位的Tyr被酰化,D异构型第2位的Phe 和第20位的Arg被酰胺化。
实施例27
合成的自身聚集的人GHRH嵌合肽II
自身聚集的人生长激素释放激素(GHRH)肽根据下列氨基酸序列来化学合成:
YADAIFTNSYRKVLGQLSARKLLQDIMSRQQGESNQERGARARL GSSGS [SEQ ID NO:226]
其中正常字体的残基是人GHRH肽,有下划线的残基是间隔臂1,其中n=0,带 方框的残基是SCE-C。
实施例28
合成的自身聚集的鼠GHRH嵌合肽
自身聚集的鼠生长激素释放激素(GHRH)肽根据下列氨基酸序列来化学合成:
GSGSSHVDAIFTTNYRKLLSQLYARKVIQDIMNKQ GERIQEQRARLS [SEQ ID NO:227]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=0,正常字 体的残基是鼠GHRH肽。
实施例29
合成的自身聚集的人IL-1β嵌合肽I
自身聚集的人IL-1β肽根据下列氨基酸序列来化学合成:
VQGEESNDK GSSGS [SEQ ID NO:228]
其中正常字体的残基是人IL-1β(aa 163-171)肽,有下划线的残基是间隔臂1,其 中n=0,带方框的残基是SCE-C。
实施例30
合成的自身聚集的人IL-1β嵌合肽II
自身聚集的人IL-1β肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSLKEKNLYLSCVLKDDKPTLQLESV DPKNYP [SEQ ID NO:229]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是人IL-1β(aa 178-207)肽。
实施例31
合成的自身聚集的人IL-2嵌合肽I
自身聚集的人IL-2肽根据下列氨基酸序列来化学合成:
GSGSSEYADETATIVEFL [SEQ ID NO:230]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=0,正常字 体的残基是来自人IL-2(126-138)的肽。
实施例32
合成的自身聚集的人IL-2嵌合肽II
自身聚集的人IL-2肽根据下列氨基酸序列来化学合成:
ILNGINNYKNPKL GSSGSGGGGS [SEQ ID NO:231]
其中正常字体的残基是来自人IL-2(44-56)的肽,有下划线的残基是间隔臂1,其 中n=1,带方框的残基是SCE-C。
实施例33
合成的自身聚集的人IL-2嵌合肽III
自身聚集的人IL-2肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSLTFKFYMPKKA [SEQ ID NO:232]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是来自人1L-2(60-70)的肽。
实施例34
合成的自身聚集的人TNF-α嵌合肽I
自身聚集的人TNF-α肽根据下列氨基酸序列来化学合成:
SPLAQAVRSSSR GSSGSGGGGS [SEQ ID NO:233]
其中正常字体的残基是来自人TNF-α(aa 71-82)的肽,有下划线的残基是间隔臂 1,其中n=1,带方框的残基是SCE-C。
实施例35
合成的自身聚集的人TNF-α嵌合肽II
自身聚集的人TNF-α肽根据下列氨基酸序列来化学合成:
GSGSSDKPVAHVVANPQAEGQLQWLNRRANAL [SEQ ID NO:234]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=0,正常字 体的残基是来自TNF-α(10-36)的肽。
实施例36
合成的自身聚集的人TNF-α嵌合肽III
自身聚集的人TNF-α肽根据下列氨基酸序列来化学合成:
RRANALLANGVELRD GSSGSGGGGS [SEQ ID NO:235]
其中正常字体的残基是来自TNF-α(31-45)的肽,有下划线的残基是间隔臂1,其 中n=1,带方框的残基是SCE-C。
实施例37
合成的自身聚集的人Cys-BAFF-R嵌合肽I
自身聚集的人Cys-BAFF受体肽根据下列氨基酸序列来化学合成: CLRGASSAEAPDGDKDAPEPLDK GSSGSGGGGS [SEQ ID NO:236]
其中正常字体的残基是来自人Cys-BAFF-R(aa 108-129)的肽,有下划线的残基是 间隔臂1,其中n=1,带方框的残基是SCE-C。
实施例38
合成的自身聚集的人Cvs-BAFF-R嵌合肽II
自身聚集的人Cys-BAFF受体肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSCHSVPVPATELGSTELVTTKTAGPE [SEQ ID NO:237]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是来自人Cys-BAFF-R(aa 159-183)的肽。
实施例39
合成的自身聚集的人P55-TNF-R嵌合肽
自身聚集的人P55-TNF受体肽根据下列氨基酸序列来化学合成:
GSGGGGSGSSLPQIENVKGTED [SEQ ID NO:238]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是来自人P55-TNF-R的肽。
实施例40
合成的自身聚集的人P75-TNF-R嵌合肽
自身聚集的人P75-TNF受体肽根据下列氨基酸序列来化学合成:
SMAPGAVHLPQPDRVYIHPF GSSGSGGGGS [SEQ ID NO:239]
其中正常字体的残基是来自人P75-TNF-R的肽,有下划线的残基是间隔臂1,其 中n=1,带方框的残基是SCE-C。
实施例41
合成的自身聚集的IL-6-R嵌合肽
自身聚集的人IL-6受体肽根据下列氨基酸序列来化学合成:
TSLPVQDSSSVP GSSGSGGGGS [SEQ ID NO:240]
其中正常字体的残基是来自人IL-6R的肽,有下划线的残基是间隔臂1,其中n= 1,带方框的残基是SCE-C。
实施例42
合成的自身聚集的L-选择蛋白嵌合肽
自身聚集的人L-选择蛋白肽根据下列氨基酸序列来化学合成:
GSGGGGSGGGGSGSSCQKLDKSFSMIK [SEQ ID NO:241]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=2,正常字 体的残基是来自人L-选择蛋白的肽。
实施例43
合成的自身聚集的MUC-1嵌合肽
自身聚集的人MUC-1(Mucin-1)肽可用于制备肿瘤抗原疫苗,其根据下列氨基酸 序列来化学合成:
GSGGGGSGSSGVTSAPDTRPAPGSTAPPAH [SEQ ID NO:242]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是人MUC-1肽。
实施例44
合成的自身聚集的卵白蛋白嵌合肽I
自身聚集的卵白蛋白(OVA)肽可用于制备免疫增强组合物,其根据下列氨基酸序 列来化学合成:
ISQAVHAAHAEINEAGR GSSGSGGGGS [SEQ ID NO:243]
其中正常字体的残基是OVA(aa 323-339)肽,有下划线的残基是间隔臂1,其中 n=1,带方框的残基是SCE-C。
实施例45
合成的自身聚集的卵白蛋白嵌合肽II
自身聚集的卵白蛋白(OVA)肽可用于制备免疫增强组合物,其根据下列氨基酸序 列来化学合成:
GSGGGGSGSSSIINFEKL [SEQ ID NO:244]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是OVA(aa 257-264)肽。
实施例46
合成的自身聚集的HIV gp120嵌合肽I
自身聚集的HIV gp120肽可用于制备免疫增强组合物,其根据下列氨基酸序列来 化学合成:
YNAKRKRIHIQRGPGRAFYTTKNII GSSGS [SEQ ID NO:245]
其中正常字体的残基是来自HIV gp120的肽,有下划线的残基是间隔臂1,其中 n=0,带方框的残基是SCE-C。
实施例47
合成的自身聚集的HIV gp120嵌合肽II
自身聚集的HIV gp120肽可用于制备免疫增强组合物,其根据下列氨基酸序列来 合成:
GSGSSNNTRKSIRIQRGPGRAFVTIGKIG [SEQ ID NO:246]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=0,正常字 体的残基是HIV gp120(aa 307-331)肽。
实施例48
合成的自身聚集的HIV gp120嵌合肽III
自身聚集的HIV gp120肽可用于制备免疫增强组合物,其根据下列氨基酸序列来 化学合成:
GSGGGGSGSSCGKIEPLGVAPTKAKRRVVQREKR [SEQ ID NO:247]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是HIV gp 120肽。
实施例49
合成的自身聚集的HIV gp41嵌合肽
自身聚集的HIV gp41肽可用于制备免疫增强组合物,其根据下列氨基酸序列来 化学合成:
GSGGGGSGSSRVTAIEKYLQDQARLNSWGCAFRQ VCHTTVPWVNDS-NH2 [SEQ ID NO:248]
其中带方框的残基是N-SCE2,有下划线的残基是间隔臂1,其中n=1,正常字 体的残基是HIV gp41肽。
本文所引用的每份专利、专利申请和出版物的公开内容均全部纳入本文作为参 考。
本文引用的任何文献均不应被理解为承认该文献可作为本申请的“现有技术”。
整篇说明书的目的是为了描述本发明的较佳方案,而不是将本发明限制到任一方 案或特征的具体组合。因此,本领域技术人员会认识到,根据本文公开内容,可对列 举的特定方案作各种修改和变化而不脱离本发明的范围。所有这些修改和变化均被包 括在所附
权利要求的范围内。
序列表<110> 西根控股有限公司(Scegen Pty Ltd)(所有国家,除美国)
F.科恩特金(Koentgen,Frank) (仅美国)
<120> 高分子量物质及其用途
<130> 2385978
<140> 未给予
<141> 2003-05-31
<150> USSN 60/384878
<151> 2002-05-31
<160> 248
<170> PatentIn version 3.2
<210> 1
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 式1
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa没有,或是具有n个氨基酸残基的序列,其中n约为1-50,其中该序列包含选自任何 氨基酸残基的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa疏水性的、小的、中性或碱性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa是具有n个氨基酸残基的序列,其中n为0-2,且其中该序列包含选自任何氨基酸残 基的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa是疏水性的、小的或极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa是疏水性的、小的或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa是具有n个氨基酸残基的序列,其中n为4-6,且其中序列包含相同或不同的氨基酸残 基,所述残基选自疏水性的、小的、极性或中性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa是具有n个氨基酸残基的序列,其中n为2-4,其中序列x1包含相同或不同的氨基酸 残基,所述残基选自疏水性的、小的或极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa是疏水性的、小的、带电荷或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa是中性/极性、带电荷的、疏水性的、或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa是任选的,当其存在时,其选自小的或带电荷的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n约为1-50,其中该序列包含选自任 何氨基酸残基的相同或不同氨基酸残基
<400> 1
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10
<210> 2
<211> 3
<212> PRT
<213> 人工序列
<220>
<223> 式2
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n约为1-15,其中该序列包含选自任 何氨基酸残基的相同或不同氨基酸残基,条件是第2位的Xaa也存在
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa不存在,或是疏水性的,带电荷的,中性/极性或小的氨基酸残基或其修饰形式,条件是 第3位的Xaa也存在;
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa是具有n个氨基酸残基的序列,其中n为2-5,其中该序列包含选自任何氨基酸残基的 相同或不同氨基酸残基
<400> 2
Xaa Xaa Xaa
1
<210> 3
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 式3
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa选自疏水性的、带电荷的(典型的是碱性)、中性/极性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa选自小的或碱性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa选自带电荷的(典型的是碱性)、中性/极性、疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa选自带电荷的(典型的是碱性)、中性/极性、疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa选自带电荷的(典型的是碱性)、中性/极性、疏水性或小的氨基酸残基或其修饰形式
<400> 3
Xaa Xaa Xaa Xaa Xaa
1 5
<210> 4
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 式4
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa选自小的、疏水性的或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa选自小的、疏水性的或中性/极性氨基酸残基或其修饰形式,或其不存在,条件是第3、 4、5位的至少两个Xaa存在
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa选自小的、疏水性的或中性/极性氨基酸残基或其修饰形式,或其不存在,条件是第2、 4、5位的至少两个Xaa存在
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa选自小的或疏水性氨基酸残基或其修饰形式,或其不存在,条件是第2、3、5位的至少 两个Xaa存在
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa选自小的、疏水性的、碱性或中性/极性氨基酸残基或其修饰形式,或其不存在,条件 是第2、3、4位的至少两个Xaa存在
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa选自小的或疏水性氨基酸残基或其修饰形式
<400> 4
Xaa Xaa Xaa Xaa Xaa Xaa
1 5
<210> 5
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 式5
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa选自小的、疏水性的、或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa选自小的、疏水性的或中性/极性氨基酸残基或其修饰形式,或其不存在,条件是第3 和4位的Xaa至少有一个存在
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa选自小的氨基酸残基或其修饰形式,或其不存在,条件是第2和4位的Xaa至少有一 个存在
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa选自小的、疏水性的或中性/极性氨基酸残基或其修饰形式,或其不存在,条件是第2 和3位的Xaa至少有一个存在
<400> 5
Xaa Xaa Xaa Xaa
1
<210> 6
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 式6
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa是小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa不存在,或是带电荷的氨基酸残基(典型的是碱性氨基酸残基)或其修饰形式,条件是第 1位的Xaa存在
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa不存在,或是带电荷的氨基酸残基(典型的是碱性氨基酸残基)或其修饰形式,条件是第 2位的Xaa存在
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n为1-15,其中该序列包含选自任何 氨基酸残基的相同或不同氨基酸残基,条件是第3位的Xaa存在
<400> 6
Xaa Xaa Xaa Xaa
1
<210> 7
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 式7
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n为约1-15个残基,其中该序列包含 选自任何氨基酸残基的相同或不同氨基酸残基,条件是第2位的Xaa存在
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa不存在,或是疏水性的、带电荷的、中性/极性或小的氨基酸残基或其修饰形式,条件 是第3位的Xaa存在
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa是具有n个氨基酸残基的序列,其中n为2-5个残基,其中该序列包含选自任何氨基 酸残基的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa是疏水性的、小的、中性或碱性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa具有n个氨基酸残基的序列,其中n为0-2个残基,其中该序列包含选自任何氨基酸 残基的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa是疏水性的、小的或极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa是疏水性的、小的或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa是具有n个氨基酸残基的序列,其中n为4-6个残基,其中序列包含选自疏水性、小 的、极性或中性氨基酸残基或其修饰形式的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa是具有n个氨基酸残基的序列,其中n为2-4个残基,其中序列包含选自疏水性的、 小的、或极性氨基酸残基或其修饰形式的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa是疏水性的、小的、带电荷的或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa是中性/极性、带电荷的、疏水性的、或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa是任选的,当其存在时,其选自小的或带电荷的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n为1-50个氨基酸残基,其中该序列 包含选自任何氨基酸残基的相同或不同氨基酸残基
<400> 7
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
<210> 8
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 式8
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n为1-5个氨基酸残基,其中序列包 含选自任何氨基酸残基的相同或不同氨基酸
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa是疏水性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa是小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa是疏水性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa选自疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa是疏水性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa是具有n个氨基酸残基的序列,其中n为0-2个残基,其中序列包含选自疏水性或小 的氨基酸残基或其修饰形式的相同或不同氨基酸残基
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa是小的或疏水性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa是疏水性的、小的或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa是小的、疏水性的或中性/极性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa是小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa是疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa是小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa是中性/极性、酸性或疏水性氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa是小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa不存在,或是具有n个氨基酸残基的序列,其中n为1-20个氨基酸残基,其中该序列 包含选自任何氨基酸残基的相同或不同氨基酸残基
<400> 8
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa
<210> 9
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 式9
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa不存在,或是疏水性氨基酸残基或其修饰形式,条件是第2位的Xaa也存在
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,或其修饰形式,条件是 第3位的Xaa也存在
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa不存在,或是带电荷的氨基酸残基,通常是碱性氨基酸残基,或其修饰形式,条件是第 4位的Xaa也存在
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa不存在,或是选自小的、带电荷的或中性/极性氨基酸残基或其修饰形式,条件是第5 位的Xaa也存在
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa不存在,或是选自小的或疏水性氨基酸残基或其修饰形式
<400> 9
Xaa Xaa Xaa Xaa Xaa
1 5
<210> 10
<211> 2
<212> PRT
<213> 人工序列
<220>
<223> 式10
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa不存在,条件是第2位的Xaa存在,或选自疏水性或小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa不存在,条件是第1位的Xaa存在,或其选自小的或疏水性氨基酸残基或其修饰形式
<400> 10
Xaa Xaa
1
<210> 11
<211> 3
<212> PRT
<213> 人工序列
<220>
<223> 式11
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa是小的氨基酸残基或其修饰形式
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,或其修饰形式,条件是 第1位的Xaa存在
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa不存在,或是带电荷的氨基酸残基,典型的是碱性氨基酸残基,或其修饰形式,条件是 第2位的Xaa存在
<400> 11
Xaa Xaa Xaa
1
<210> 12
<211> 34
<212> PRT
<213> 百日咳博德特氏菌(Bordetella pertussis)
<400> 12
Met Asn Met Ser Leu Ser Arg Ile Val Lys Ala Ala Pro Leu Arg Arg
1 5 10 15
Thr Thr Leu Ala Met Ala Leu Gly Ala Leu Gly Ala Ala Pro Ala Ala
20 25 30
His Ala
<210> 13
<211> 22
<212> PRT
<213> 砂眼衣原体(Chlamydia trachomatis)
<400> 13
Met Lys Lys Leu Leu Lys Ser Val Leu Val Phe Ala Ala Leu Ser Ser
1 5 10 15
Ala Ser Ser Leu Gln Ala
20
<210> 14
<211> 22
<212> PRT
<213> 鹦鹉热衣原体(Chlamydophila psittaci)
<400> 14
Met Lys Lys Leu Leu Lys Ser Ala Leu Leu Phe Ala Ala Thr Gly Ser
1 5 10 15
Ala Leu Ser Leu Gln Ala
20
<210> 15
<211> 20
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 15
Met Ile Lys Lys Ala Ser Leu Leu Thr Ala Cys Ser Val Thr Ala Phe
1 5 10 15
Ser Ala Trp Ala
20
<210> 16
<211> 21
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 16
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 17
<211> 22
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 17
Met Met Lys Arg Asn Ile Leu Ala Val Ile Val Pro Ala Leu Leu Val
1 5 10 15
Ala Gly Thr Ala Asn Ala
20
<210> 18
<211> 27
<212> PRT
<213> 阴沟肠杆菌(Enterobacter cloacae)
<400> 18
Met Lys Lys Ile Ala Cys Leu Ser Ala Leu Ala Ala Val Leu Ala Val
1 5 10 15
Ser Ala Gly Thr Ala Val Ala Ala Thr Ser Thr
20 25
<210> 19
<211> 24
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 19
Met Lys Lys Thr Asn Met Ala Leu Ala Leu Leu Val Ala Phe Ser Val
1 5 10 15
Thr Gly Cys Ala Asn Thr Asp Ile
20
<210> 20
<211> 23
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 20
Met Asn Lys Phe Val Lys Ser Leu Leu Val Ala Gly Ser Val Ala Ala
1 5 10 15
Leu Ala Ala Cys Ser Ser Ser
20
<210> 21
<211> 22
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 21
Met Lys Lys Phe Asn Gln Ser Leu Leu Ala Thr Ala Met Leu Leu Ala
1 5 10 15
Ala Gly Gly Ala Asn Ala
20
<210> 22
<211> 20
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 22
Met Lys Lys Thr Leu Ala Ala Leu Ile Val Gly Ala Phe Ala Ala Ser
1 5 10 15
Ala Ala Asn Ala
20
<210> 23
<211> 22
<212> PRT
<213> 淋病奈瑟氏球菌(Neisseria gonorrhoeae)
<400> 23
Met Lys Lys Ser Leu Ile Ala Leu Thr Leu Ala Ala Leu Pro Val Ala
1 5 10 15
Ala Met Ala Asp Val Thr
20
<210> 24
<211> 24
<212> PRT
<213>
铜绿假单胞菌(Pseudomonas aeruginosa)
<400> 24
Met Asn Asn Val Leu Lys Phe Ser Ala Leu Ala Leu Ala Ala Val Leu
1 5 10 15
Ala Thr Gly Cys Ser Ser His Ser
20
<210> 25
<211> 24
<212> PRT
<213> 铜绿假单胞菌(Pseudomonas aeruginosa)
<400> 25
Met Lys Leu Lys Asn Thr Leu Gly Val Val Ile Gly Ser Leu Val Ala
1 5 10 15
Ala Ser Ala Met Asn Ala Phe Ala
20
<210> 26
<211> 25
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<400> 26
Met Asn Arg Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser His
1 5 10 15
Ser Ala Gly Cys Ser Ser Asn Ala Lys
20 25
<210> 27
<211> 27
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<400> 27
Met Ile Leu Asn Lys Arg Leu Lys Leu Ala Tyr Cys Val Phe Leu Gly
1 5 10 15
Cys Tyr Gly Leu Ser Ile His Ser Ser Leu Ala
20 25
<210> 28
<211> 21
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 28
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 29
<211> 20
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 29
Met Lys Lys Trp Leu Leu Ala Ala Gly Leu Gly Leu Ala Met Val Thr
1 5 10 15
Ser Ala Gln Ala
20
<210> 30
<211> 22
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 30
Met Asn Lys Lys Ile His Ser Leu Ala Leu Leu Val Asn Leu Gly Ile
1 5 10 15
Tyr Gly Val Ala Gln Ala
20
<210> 31
<211> 21
<212> PRT
<213> pINIIIompA3克隆载体
<400> 31
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala
20
<210> 32
<211> 25
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 32
Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala
1 5 10 15
Gly Val Met Ser Ala Gln Ala Met Ala
20 25
<210> 33
<211> 26
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 33
Met Lys Ile Lys Thr Gly Ala Arg Ile Leu Ala Leu Ser Ala Leu Thr
1 5 10 15
Thr Met Met Phe Ser Ala Ser Ala Leu Ala
20 25
<210> 34
<211> 32
<212> PRT
<213> 脑膜炎奈瑟球菌(Neisseria meningitidis)
<400> 34
Lys Pro Ser Leu Leu Phe Ser Ser Leu Leu Phe Ser Ser Leu Leu Phe
1 5 10 15
Ser Ser Leu Leu Phe Ser Ser Leu Leu Phe Ser Ser Ala Ala Gln Ala
20 25 30
<210> 35
<211> 26
<212> PRT
<213> 脑膜炎奈瑟球菌(Neisseria meningitidis)
<400> 35
Lys Asn Leu Leu Phe Ser Ser Leu Leu Phe Ser Ser Leu Leu Phe Ser
1 5 10 15
Ser Leu Leu Phe Ser Ser Ala Ala Gln Ala
20 25
<210> 36
<211> 21
<212> PRT
<213> 淋病奈瑟氏球菌(Neisseria gonorrhoeae)
<400> 36
Met Lys Ala Tyr Leu Ala Leu Ile Ser Ala Ala Val Ile Gly Leu Ala
1 5 10 15
Ala Cys Ser Gln Glu
20
<210> 37
<211> 25
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 37
Met Leu Asn Lys Lys Phe Lys Leu Asn Phe Ile Ala Leu Thr Val Ala
1 5 10 15
Tyr Ala Leu Thr Pro Tyr Thr Glu Ala
20 25
<210> 38
<211> 21
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 38
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 39
<211> 16
<212> PRT
<213> Ralstonia solanacearum
<400> 39
Met Ala Ala Ala Leu Leu Leu Trp Thr Ala Gly Thr Val Cys Ala Ala
1 5 10 15
<210> 40
<211> 23
<212> PRT
<213> 桔色链霉菌(Streptomyces coelicolor A3(2))
<400> 40
Met His Asn Ser Arg Val Ala Val Leu Leu Thr Thr Ser Val Leu Thr
1 5 10 15
Ala Ala Ser Val Gly Val Ser
20
<210> 41
<211> 22
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 41
Met Met Lys Arg Asn Ile Leu Ala Val Ile Val Pro Ala Leu Leu Val
1 5 10 15
Ala Gly Thr Ala Asn Ala
20
<210> 42
<211> 22
<212> PRT
<213> 马尔他布鲁氏菌(Brucella melitensis biovar Abortus)
<400> 42
Met Asn Ile Lys Ser Leu Leu Leu Gly Ser Ala Ala Ala Leu Val Ala
1 5 10 15
Ala Ser Gly Ala Gln Ala
20
<210> 43
<211> 27
<212> PRT
<213> 淋病奈瑟氏球菌(Neisseria gonorrhoeae)
<400> 43
Met Lys Ala Lys Arg Phe Lys Ile Asn Ala Ile Ser Leu Ser Ile Phe
1 5 10 15
Leu Ala Tyr Ala Leu Thr Pro Tyr Ser Glu Ala
20 25
<210> 44
<211> 25
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 44
Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala
1 5 10 15
Gly Val Met Ser Ala Gln Ala Met Ala
20 25
<210> 45
<211> 25
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 45
Met Lys Lys Thr Val Phe Arg Leu Asn Phe Leu Thr Ala Cys Ile Ser
1 5 10 15
Leu Gly Ile Val Ser Gln Ala Trp Ala
20 25
<210> 46
<211> 25
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 46
Met Lys Lys Thr Val Phe Arg Leu Asn Phe Leu Thr Ala Cys Val Ser
1 5 10 15
Leu Gly Ile Ala Ser Gln Ala Trp Ala
20 25
<210> 47
<211> 22
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 47
Met Met Lys Arg Asn Ile Leu Ala Val Ile Val Pro Ala Leu Leu Val
1 5 10 15
Ala Gly Thr Ala Asn Ala
20
<210> 48
<211> 21
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 48
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 49
<211> 26
<212> PRT
<213>
蚜虫巴克纳氏菌(Buchnera aphidicola) (Acyrthosiphon pisum)
<400> 49
Met Thr Asn Arg Lys Ser Leu Ala Met Val Ile Pro Met Leu Leu Ala
1 5 10 15
Ala Ser Asn Gly Val Asn Ala Leu Glu Val
20 25
<210> 50
<211> 21
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 50
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 51
<211> 23
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 51
Met Lys Lys Ser Thr Leu Ala Leu Val Val Met Gly Ile Val Ala Ser
1 5 10 15
Ala Ser Val Gln Ala Ala Glu
20
<210> 52
<211> 23
<212> PRT
<213> 噬菌体PA-2
<400> 52
Met Lys Lys Leu Thr Val Ala Ile Ser Ala Val Ala Ala Ser Val Leu
1 5 10 15
Met Ala Met Ser Ala Gln Ala
20
<210> 53
<211> 21
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 53
Met Lys Leu Lys Leu Val Ala Val Ala Val Thr Ser Leu Leu Ala Ala
1 5 10 15
Gly Val Val Asn Ala
20
<210> 54
<211> 22
<212> PRT
<213> 猪霍乱沙门氏菌伤寒血清型(Salmonella enterica subsp.enterica serovar Typhi)
<400> 54
Met Lys Arg Lys Val Leu Ala Leu Val Ile Pro Ala Leu Leu Ala Ala
1 5 10 15
Gly Ala Ala His Ala Ala
20
<210> 55
<211> 22
<212> PRT
<213> 猪霍乱沙门氏菌伤寒血清型(Salmonella enterica subsp.enterica serovar Typhi)
<400> 55
Met Asn Arg Lys Val Leu Ala Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala Ala
20
<210> 56
<211> 22
<212> PRT
<213> 猪霍乱沙门氏菌伤寒血清型(Salmonella enterica subsp.enterica serovar Typhi)
<400> 56
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala Ala
20
<210> 57
<211> 22
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhi)
<400> 57
Met Met Lys Arg Lys Ile Leu Ala Ala Val Ile Pro Ala Leu Leu Ala
1 5 10 15
Ala Ala Thr Ala Asn Ala
20
<210> 58
<211> 23
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhi)
<400> 58
Met Asn Lys Ser Thr Leu Ala Ile Val Val Ser Ile Ile Ala Ser Ala
1 5 10 15
Ser Val His Ala Ala Glu Val
20
<210> 59
<211> 22
<212> PRT
<213> 大肠杆菌(Escherichia coli) O157:H7 EDL933
<400> 59
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala Ala
20
<210> 60
<211> 22
<212> PRT
<213> 鼠疫耶尔森氏菌(Yersinia pestis)
<400> 60
Met Lys Arg Asn Ile Leu Ala Ile Leu Ile Pro Thr Leu Leu Val Ala
1 5 10 15
Thr Thr Ser His Ala Ala
20
<210> 61
<211> 25
<212> PRT
<213> 鼠疫耶尔森氏菌(Yersinia pestis)
<400> 61
Met Ile Thr Met Lys Leu Arg Val Leu Ser Phe Ile Ile Pro Ala Leu
1 5 10 15
Leu Val Ala Gly Ser Ala Ser Ala Ala
20 25
<210> 62
<211> 23
<212> PRT
<213> 鼠疫耶尔森氏菌(Yersinia pestis)
<400> 62
Met Met Lys Arg Asn Ile Leu Ala Val Val Ile Pro Ala Leu Leu Ala
1 5 10 15
Ala Gly Ala Ala Asn Ala Ala
20
<210> 63
<211> 23
<212> PRT
<213> 猪霍乱沙门氏菌伤寒血清型(Salmonella enterica subsp.enterica serovar Typhi)
<400> 63
Met Met Lys Arg Lys Ile Leu Ala Ala Val Ile Pro Ala Leu Leu Ala
1 5 10 15
Ala Ala Thr Ala Asn Ala Ala
20
<210> 64
<211> 21
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhi)
<400> 64
Met Lys Arg Lys Val Leu Ala Leu Val Ile Pro Ala Leu Leu Ala Ala
1 5 10 15
Gly Ala Ala His Ala
20
<210> 65
<211> 21
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhi)
<400> 65
Met Asn Arg Lys Val Leu Ala Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala
20
<210> 66
<211> 23
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhi)
<400> 66
Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala
1 5 10 15
Gly Ala Ala Asn Ala Ala Glu
20
<210> 67
<211> 22
<212> PRT
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 67
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 68
<211> 22
<212> PRT
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 68
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 69
<211> 22
<212> PRT
<213> 产气肠杆菌(Enterobacter aerogenes)
<400> 69
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 70
<211> 22
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 70
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 71
<211> 22
<212> PRT
<213> 痢疾志贺氏菌(Shigella dysenteriae)
<400> 71
Met Lys Lys Thr Ala Ile Ala Ile Thr Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 72
<211> 22
<212> PRT
<213> 粘质沙雷氏菌(Serratia marcescens)
<400> 72
Met Lys Lys Thr Ala Ile Ala Leu Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 73
<211> 22
<212> PRT
<213> 胡萝卜软腐欧文氏菌(Pectobacterium carotovorum)
<400> 73
Met Lys Lys Thr Ala Ile Gly Leu Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 74
<211> 22
<212> PRT
<213> 鼠疫耶尔森氏菌(Yersinia pestis)
<400> 74
Met Lys Lys Thr Ala Ile Ala Leu Ala Val Ala Leu Val Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 75
<211> 22
<212> PRT
<213> 多杀巴斯德氏菌(Pasteurella multocida)
<400> 75
Met Lys Lys Thr Ala Ile Ala Leu Thr Ile Val Ala Leu Ala Val Ala
1 5 10 15
Ser Val Ala Gln Ala Ala
20
<210> 76
<211> 22
<212> PRT
<213> 巴克纳氏菌属(Buchnera sp.APS)
<400> 76
Met Lys Lys Arg Ala Leu Ala Ile Ala Phe Leu Leu Ala Ser Leu Ile
1 5 10 15
Pro Ser Ala Ala Gln Ala
20
<210> 77
<211> 25
<212> PRT
<213> 杜氏嗜血菌(Haemophilus ducreyi)
<400> 77
Met Lys Lys Thr Leu Val Thr Leu Ala Val Leu Ser Ala Thr Ala Val
1 5 10 15
Ala Thr Ala Ala Pro Gln Ala Asp Thr
20 25
<210> 78
<211> 22
<212> PRT
<213> 嗜血菌属(Haemophilus sp.)
<400> 78
Met Lys Lys Thr Ala Ile Thr Leu Val Val Ala Gly Leu Ala Ala Ala
1 5 10 15
Ser Ile Ala Gln Ala Ala
20
<210> 79
<211> 27
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 79
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ile Pro Ser Ser Thr
20 25
<210> 80
<211> 25
<212> PRT
<213> 杜氏嗜血菌(Haemophilus ducreyi)
<400> 80
Met Lys Lys Thr Leu Val Thr Leu Ser Val Leu Ser Ala Thr Ser Ala
1 5 10 15
Ala Phe Ala Ala Pro Asp Ala Asn Thr
20 25
<210> 81
<211> 22
<212> PRT
<213> 弧菌属(Vibrio sp.)
<400> 81
Met Lys Lys Gln Thr Leu Ala Leu Trp Val Gly Leu Val Leu Ala Gly
1 5 10 15
Gln Ala Ser Met Ala Leu
20
<210> 82
<211> 22
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae Rd)
<400> 82
Met Lys Lys Thr Ala Ile Ala Leu Val Val Ala Gly Leu Ala Ala Ala
1 5 10 15
Ser Val Ala Gln Ala Ala
20
<210> 83
<211> 22
<212> PRT
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 83
Met Lys Lys Thr Ala Ile Ala Leu Val Val Ala Gly Leu Ala Ala Ala
1 5 10 15
Ser Val Ala Gln Ala Ala
20
<210> 84
<211> 22
<212> PRT
<213> 多杀巴斯德氏菌(Pasteurella multocida)
<400> 84
Met Lys Lys Thr Ala Ile Ala Leu Thr Ile Ala Ala Leu Ala Ala Ala
1 5 10 15
Ser Val Ala Gln Ala Ala
20
<210> 85
<211> 25
<212> PRT
<213> Mannheimia haemolytica
<400> 85
Met Lys Lys Thr Leu Val Ala Leu Ala Val Leu Ser Ala Ala Ala Val
1 5 10 15
Ala Gln Ala Ala Pro Gln Ala Asn Thr
20 25
<210> 86
<211> 24
<212> PRT
<213> 苜蓿中华根瘤菌(Sinorhizobium meliloti)
<400> 86
Thr Ala Ile Ser Val Gly Val Ala Leu Thr Gly Met Ala Gly Met Ala
1 5 10 15
Phe Ala Asp Pro Trp Lys Asp Glu
20
<210> 87
<211> 22
<212> PRT
<213> 伴放线放线杆菌(Actinobacillus actinomycetemcomitans)
<400> 87
Met Lys Arg Thr Ala Ile Ala Leu Ala Ile Ala Gly Leu Ala Ala Ala
1 5 10 15
Thr Val Ala Gln Ala Ala
20
<210> 88
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 美国专利No.5,284,768中公开的信号肽
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> X=M和K之间的键,或选自遗传密码的20种氨基酸的氨基酸,或含有2、3、或4个氨基酸 的肽,每个氨基酸独立选自20种氨基酸
<400> 88
Met Xaa Lys Ser Thr Leu Leu Leu Leu Phe Leu Leu Leu Cys Leu Pro
1 5 10 15
Ser Trp Asn Ala Gly Ala
20
<210> 89
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 人工序列,美国专利No.5,712,114-1
<400> 89
Met Phe Ser Phe Val Asp Leu Arg Leu Leu Leu Leu Leu Ala Ala Thr
1 5 10 15
Ala Leu Leu Thr His Gly
20
<210> 90
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 人工序列,美国专利No.5,712,114-2
<400> 90
Met Ile Arg Leu Gly Ala Gln Ser Leu Val Leu Leu Thr Leu Leu Val
1 5 10 15
Ala Ala Val Leu Arg Cys
20
<210> 91
<211> 102
<212> DNA
<213> 百日咳博德特氏菌(Bordetella pertussis)
<400> 91
atgaacatgt ctctgtcacg cattgtcaag gcggcgcccc tgcgccgcac cacgctggcc 60
atggcgctgg gcgcgctggg cgccgccccg gcggcgcatg cc 102
<210> 92
<211> 66
<212> DNA
<213> 砂眼衣原体(Chlamydia trachomatis)
<400> 92
atgaaaaaac tcttgaaatc ggtattagtg tttgccgctt tgagttctgc ttcctccttg 60
caagct 66
<210> 93
<211> 66
<212> DNA
<213> 鹦鹉热衣原体(Chlamydia psittaci)
<400> 93
atgaaaaaac tcttgaaatc ggcattattg tttgccgcta cgggttccgc tctctcctta 60
caagcc 66
<210> 94
<211> 60
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 94
atgattaaaa aagcttccct gctgacggcg tgttccgtca cggcattttc cgcttgggca 60
<210> 95
<211> 63
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 95
atgaaagtta aagtactgtc cctcctggtc ccagctctgc tggtagcagg cgcagcaaac 60
gct 63
<210> 96
<211> 66
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 96
atgatgaagc gcaatattct ggcagtgatc gtccctgctc tgttagtagc aggtactgca 60
aacgct 66
<210> 97
<211> 81
<212> DNA
<213> 阴沟肠杆菌(Enterobacter cloacae)
<400> 97
atgaaaaaaa ttgcatgtct ttcagcactg gcagctgttc tggctgtttc cgcaggtacc 60
gctgtagcgg caacttctac t 81
<210> 98
<211> 72
<212> DNA
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 98
atgaaaaaaa caaatatggc attagcactg ttagttgctt ttagtgtaac tggttgtgca 60
aatactgata tt 72
<210> 99
<211> 69
<212> DNA
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 99
atgaacaaat ttgttaaatc attattagtt gcaggttctg tagctgcatt agcagcttgt 60
agttcatct 69
<210> 100
<211> 66
<212> DNA
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 100
atgaaaaaat ttaatcaatc tctattagca actgcaatgt tgttggctgc aggtggtgca 60
aatgcg 66
<210> 101
<211> 60
<212> DNA
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 101
atgaaaaaaa cacttgcagc attaatcgtt ggtgcattcg cagcttcagc agcaaacgca 60
<210> 102
<211> 66
<212> DNA
<213> 淋病奈瑟氏球菌(Neisseria gonorrhoeae)
<400> 102
atgaaaaaat ccctgattgc cctgactttg gcagcccttc ctgttgcagc aatggctgac 60
gttacc 66
<210> 103
<211> 72
<212> DNA
<213> 铜绿假单胞菌(Pseudomonas aeruginosa)
<400> 103
atgaacaacg ttctgaaatt ctctgctctg gctctggctg ctgttctggc caccggttgc 60
agcagccact cc 72
<210> 104
<211> 72
<212> DNA
<213> 铜绿假单胞菌(Pseudomonas aeruginosa)
<400> 104
atgaaactga agaacacctt aggcgttgtc atcggctcgc tggttgccgc ttcggcaatg 60
aacgccttcg cc 72
<210> 105
<211> 75
<212> DNA
<213> 粘质沙雷氏菌(Serratia marcescens)
<400> 105
atgaatcgta ctaaactggt actgggcgcg gtaatccttg gttcccactc tgctggctgc 60
tctagcaacg ctaaa 75
<210> 106
<211> 81
<212> DNA
<213> 粘质沙雷氏菌(Serratia marcescens)
<400> 106
atgatactta ataaaagatt gaagttagcg tattgcgttt ttctgggttg ttatggctta 60
tccattcatt cttctcttgc c 81
<210> 107
<211> 63
<212> DNA
<213> 伤寒沙门氏菌(Salmonella typhi)
<400> 107
atgaaagtta aagtactgtc cctcctggta ccagctctgc tggtggcggg cgcagcgaat 60
gcg 63
<210> 108
<211> 60
<212> DNA
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 108
gtgaaaaagt ggttattagc tgcaggtctt ggtttggcga tggtaacgtc cgcacaggct 60
<210> 109
<211> 66
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 109
atgaacaaga agattcattc cctggccttg ttggtcaatc tggggattta tggggtagcg 60
caggca 66
<210> 110
<211> 63
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 110
atgaaaaaga cagctatcgc gattgcagtg gcactggctg gtttcgctac cgtagcgcag 60
gcc 63
<210> 111
<211> 75
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 111
atgatgatta ctctgcgcaa acttcctctg gcggttgccg tcgcagcggg cgtaatgtct 60
gctcaggcaa tggct 75
<210> 112
<211> 78
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 112
atgaaaataa aaacaggtgc acgcatcctc gcattatccg cattaacgac gatgatgttt 60
tccgcctcgg ctctcgcc 78
<210> 113
<211> 98
<212> DNA
<213> 脑膜炎奈瑟球菌(Neisseria meningitidis)
<400> 113
aaaaaccttc tcttctcttc tcttctcttc tcttctcttc tcttctcttc tcttctcttc 60
tcttctcttc tcttctcttc tcttccgcag cgcaggcg 98
<210> 114
<211> 78
<212> DNA
<213> 脑膜炎奈瑟球菌(Neisseria meningitidis)
<400> 114
aaaaaccttc tcttctcttc tcttctcttc tcttctcttc tcttctcttc tcttctcttc 60
tcttccgcag cgcaggcg 78
<210> 115
<211> 48
<212> DNA
<213> Ralstonia solanacearum
<400> 115
atggccgccg cgctgctgct atggacggca ggcacggtct gcgccgcg 48
<210> 116
<211> 69
<212> DNA
<213> 桔色链霉菌(Streptomyces coelicolor)
<400> 116
atgcacaaca gccgcgtcgc agtgctcctc acgacgtccg tactgacggc cgcaagcgtt 60
ggcgtgagc 69
<210> 117
<211> 66
<212> DNA
<213> 马尔他布鲁氏菌(Brucella melitensis)
<400> 117
atgaacatca agagccttct ccttggctcc gctgcagctc tggttgcagc ttccggcgct 60
caggct 66
<210> 118
<211> 66
<212> DNA
<213> 肠沙门氏菌(Salmonella enterica)
<400> 118
atgaaaagaa aagtattggc acttgtcatc ccggctctgc tggctgctgg cgcagcacac 60
gccgct 66
<210> 119
<211> 66
<212> DNA
<213> 肠沙门氏菌(Salmonella enterica)
<400> 119
atgaacagaa aagttctggc actgcttgtc ccggcgttat tagtggcagg cgcagcaaat 60
gcggct 66
<210> 120
<211> 66
<212> DNA
<213> 肠沙门氏菌(Salmonella enterica)
<400> 120
atgaaagtta aagtactgtc cctcctggta ccagctctgc tggtggcggg cgcagcgaat 60
gcggct 66
<210> 121
<211> 66
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 121
atgaaagtta aagtactgtc cctcctggtc ccagctctgc tggtagcagg cgcagcaaac 60
gctgct 66
<210> 122
<211> 66
<212> DNA
<213> 伤寒沙门氏菌(Salmonella typhimurium)
<400> 122
atgaaaaaga cagctatcgc gattgcagtg gcactggctg gtttcgctac cgtagcgcag 60
gccgct 66
<210> 123
<211> 66
<212> DNA
<213> 产气肠杆菌(Enterobacter aerogenes)
<400> 123
atgaaaaaga cagctatcgc gattgcagtg gcactggctg gcttcgctac cgtagcgcag 60
gccgct 66
<210> 124
<211> 66
<212> DNA
<213> 胡萝卜软腐欧文氏菌(Erwinia carotovora)
<400> 124
atgaaaaaaa ccgcgatcgg tctggctgtc gcgctggctg gtttcgctac tgtggctcaa 60
gctgcg 66
<210> 125
<211> 66
<212> DNA
<213> 多杀巴斯德氏菌(Pasteurella multocida)
<400> 125
atgaaaaaaa cagcaattgc attgactatc gttgcactag ccgtggcttc agttgcacaa 60
gctgca 66
<210> 126
<211> 75
<212> DNA
<213> 杜氏嗜血菌(Haemophilus ducreyi)
<400> 126
atgaaaaaaa cattagttac attagctgta ttatcagcaa cagctgtagc gactgctgcg 60
ccacaagcgg atact 75
<210> 127
<211> 66
<212> DNA
<213> 嗜血菌属(Haemophilus sp.)
<400> 127
atgaaaaaaa ctgcaatcac attagtagtt gctggtttag cagcagcttc aatagctcaa 60
gcagct 66
<210> 128
<211> 75
<212> DNA
<213> 杜氏嗜血菌(Haemophilus ducreyi)
<400> 128
atgaaaaaaa cattagtcac attatccgta ttatctgcta caagcgcagc atttgctgca 60
ccagatgcca atacc 75
<210> 129
<211> 84
<212> DNA
<213> 弧菌属(Vibrio sp.)
<400> 129
atgaaaaaac agatgagaat gaaaaaacag actttagccc tgtgggtagg gcttgtgctg 60
gcgggtcagg catcaatggc gctg 84
<210> 130
<211> 66
<212> DNA
<213> 流感嗜血菌(Haemophilus influenzae)
<400> 130
atgaaaaaaa ctgcaatcgc attagtagtt gctggcttag cagcagcttc agtagctcaa 60
gcagct 66
<210> 131
<211> 75
<212> DNA
<213> 溶血巴斯德氏菌(Pasteurella haemolytica)
<400> 131
atgaaaaaaa cattagttgc attagcagta ttatcagcag ctgcagtagc tcaagcagct 60
ccacaagcta acact 75
<210> 132
<211> 66
<212> DNA
<213> 伴放线放线杆菌(Actinobacillus actinomycetemcomitans)
<400> 132
atgaaaagaa ctgcaatcgc attagctatc gctggtttag cagcagcaac agtagcacag 60
gcagca 66
<210> 133
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 可移动的N-端SCE
<400> 133
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
20 25 30
Gly Gly Gly Ser
35
<210> 134
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 可移动的C-端SCE
<400> 134
Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr
1 5 10 15
Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln
20 25 30
Ala Thr Lys Lys
35
<210> 135
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 编码N-SCE的核酸序列
<220>
<221> CDS
<222> (1)..(63)
<400> 135
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc 63
Thr Val Ala Gln Ala
20
<210> 136
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 编码N-SCE的核酸序列
<400> 136
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala
20
<210> 137
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 编码SCE-C的核酸序列
<220>
<221> CDS
<222> (1)..(63)
<400> 137
acc gct atc gcg att gca gtg gca ctg gct ggt ttc gct acc gta gcg 48
Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala
1 5 10 15
cag gcc aca aag aaa 63
Gln Ala Thr Lys Lys
20
<210> 138
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 编码SCE-C的核酸序列
<400> 138
Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala
1 5 10 15
Gln Ala Thr Lys Lys
20
<210> 139
<211> 420
<212> DNA
<213> 小鼠
<220>
<221> CDS
<222> (1)..(420)
<400> 139
tgg ctg cag aat tta ctt ttc ctg ggc att gtg gtc tac agc ctc tca 48
Trp Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu Ser
1 5 10 15
gca ccc acc cgc tca ccc atc act gtc acc cgg cct tgg aag cat gta 96
Ala Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His Val
20 25 30
gag gcc atc aaa gaa gcc ctg aac ctc ctg gat gac atg cct gtc aca 144
Glu Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val Thr
35 40 45
ttg aat gaa gag gta gaa gtc gtc tct aac gag ttc tcc ttc aag aag 192
Leu Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys Lys
50 55 60
cta aca tgt gtg cag acc cgc ctg aag ata ttc gag cag ggt cta cgg 240
Leu Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu Arg
65 70 75 80
ggc aat ttc acc aaa ctc aag ggc gcc ttg aac atg aca gcc agc tac 288
Gly Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser Tyr
85 90 95
tac cag aca tac tgc ccc cca act ccg gaa acg gac tgt gaa aca caa 336
Tyr Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr Gln
100 105 110
gtt acc acc tat gcg gat ttc ata gac agc ctt aaa acc ttt ctg act 384
Val Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu Thr
115 120 125
gat atc ccc ttt gaa tgc aaa aaa cca gtc caa aaa 420
Asp Ile Pro Phe Glu Cys Lys Lys Pro Val Gln Lys
130 135 140
<210> 140
<211> 140
<212> PRT
<213> 小鼠
<400> 140
Trp Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu Ser
1 5 10 15
Ala Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His Val
20 25 30
Glu Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val Thr
35 40 45
Leu Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys Lys
50 55 60
Leu Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu Arg
65 70 75 80
Gly Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser Tyr
85 90 95
Tyr Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr Gln
100 105 110
Val Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu Thr
115 120 125
Asp Ile Pro Phe Glu Cys Lys Lys Pro Val Gln Lys
130 135 140
<210> 141
<211> 429
<212> DNA
<213> 人
<220>
<221> CDS
<222> (1)..(429)
<400> 141
tgg ctg cag agc ctg ctg ctc ttg ggc act gtg gcc tgc agc atc tct 48
Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile Ser
1 5 10 15
gca ccc gcc cgc tcg ccc agc ccc agc acg cag ccc tgg gag cat gtg 96
Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His Val
20 25 30
aat gcc atc cag gag gcc cgg cgt ctc ctg aac ctg agt aga gac act 144
Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp Thr
35 40 45
gct gct gag atg aat gaa aca gta gaa gtc atc tca gaa atg ttt gac 192
Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe Asp
50 55 60
ctc cag gag ccg acc tgc cta cag acc cgc ctg gag ctg tac aag cag 240
Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys Gln
65 70 75 80
ggc ctg cgg ggc agc ctc acc aag ctc aag ggc ccc ttg acc atg atg 288
Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met Met
85 90 95
gcc agc cac tac aag cag cac tgc cct cca acc ccg gaa act tcc tgt 336
Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser Cys
100 105 110
gca acc cag att atc acc ttt gaa agt ttc aaa gag aac ctg aag gac 384
Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys Asp
115 120 125
ttt ctg ctt gtc atc ccc ttt gac tgc tgg gag cca gtc cag gag 429
Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu
130 135 140
<210> 142
<211> 143
<212> PRT
<213> 人
<400> 142
Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile Ser
1 5 10 15
Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His Val
20 25 30
Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp Thr
35 40 45
Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe Asp
50 55 60
Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys Gln
65 70 75 80
Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met Met
85 90 95
Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser Cys
100 105 110
Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys Asp
115 120 125
Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu
130 135 140
<210> 143
<211> 543
<212> DNA
<213> 小鼠
<220>
<221> CDS
<222> (1)..(543)
<400> 143
aac aac agg tgg atc ctc cac gct gcg ttc ctg ctg tgc ttc tcc acc 48
Asn Asn Arg Trp Ile Leu His Ala Ala Phe Leu Leu Cys Phe Ser Thr
1 5 10 15
aca gcc ctc tcc atc aac tat aag cag ctc cag ctc caa gaa agg acg 96
Thr Ala Leu Ser Ile Asn Tyr Lys Gln Leu Gln Leu Gln Glu Arg Thr
20 25 30
aac att cgg aaa tgt cag gag ctc ctg gag cag ctg aat gga aag atc 144
Asn Ile Arg Lys Cys Gln Glu Leu Leu Glu Gln Leu Asn Gly Lys Ile
35 40 45
aac ctc acc tac agg gcg gac ttc aag atc cct atg gag atg acg gag 192
Asn Leu Thr Tyr Arg Ala Asp Phe Lys Ile Pro Met Glu Met Thr Glu
50 55 60
aag atg cag aag agt tac act gcc ttt gcc atc caa gag atg ctc cag 240
Lys Met Gln Lys Ser Tyr Thr Ala Phe Ala Ile Gln Glu Met Leu Gln
65 70 75 80
aat gtc ttt ctt gtc ttc aga aac aat ttc tcc agc act ggg tgg aat 288
Asn Val Phe Leu Val Phe Arg Asn Asn Phe Ser Ser Thr Gly Trp Asn
85 90 95
gag act att gtt gta cgt ctc ctg gat gaa ctc cac cag cag aca gtg 336
Glu Thr Ile Val Val Arg Leu Leu Asp Glu Leu His Gln Gln Thr Val
100 105 110
ttt ctg aag aca gta cta gag gaa aag caa gag gaa aga ttg acg tgg 384
Phe Leu Lys Thr Val Leu Glu Glu Lys Gln Glu Glu Arg Leu Thr Trp
115 120 125
gag atg tcc tca act gct ctc cac ttg aag agc tat tac tgg agg gtg 432
Glu Met Ser Ser Thr Ala Leu His Leu Lys Ser Tyr Tyr Trp Arg Val
130 135 140
caa agg tac ctt aaa ctc atg aag tac aac agc tac gcc tgg atg gtg 480
Gln Arg Tyr Leu Lys Leu Met Lys Tyr Asn Ser Tyr Ala Trp Met Val
145 150 155 160
gtc cga gca gag atc ttc agg aac ttt ctc atc att cga aga ctt acc 528
Val Arg Ala Glu Ile Phe Arg Asn Phe Leu Ile Ile Arg Arg Leu Thr
165 170 175
aga aac ttc caa aac 543
Arg Asn Phe Gln Asn
180
<210> 144
<211> 181
<212> PRT
<213> 小鼠
<400> 144
Asn Asn Arg Trp Ile Leu His Ala Ala Phe Leu Leu Cys Phe Ser Thr
1 5 10 15
Thr Ala Leu Ser Ile Asn Tyr Lys Gln Leu Gln Leu Gln Glu Arg Thr
20 25 30
Asn Ile Arg Lys Cys Gln Glu Leu Leu Glu Gln Leu Asn Gly Lys Ile
35 40 45
Asn Leu Thr Tyr Arg Ala Asp Phe Lys Ile Pro Met Glu Met Thr Glu
50 55 60
Lys Met Gln Lys Ser Tyr Thr Ala Phe Ala Ile Gln Glu Met Leu Gln
65 70 75 80
Asn Val Phe Leu Val Phe Arg Asn Asn Phe Ser Ser Thr Gly Trp Asn
85 90 95
Glu Thr Ile Val Val Arg Leu Leu Asp Glu Leu His Gln Gln Thr Val
100 105 110
Phe Leu Lys Thr Val Leu Glu Glu Lys Gln Glu Glu Arg Leu Thr Trp
115 120 125
Glu Met Ser Ser Thr Ala Leu His Leu Lys Ser Tyr Tyr Trp Arg Val
130 135 140
Gln Arg Tyr Leu Lys Leu Met Lys Tyr Asn Ser Tyr Ala Trp Met Val
145 150 155 160
Val Arg Ala Glu Ile Phe Arg Asn Phe Leu Ile Ile Arg Arg Leu Thr
165 170 175
Arg Asn Phe Gln Asn
180
<210> 145
<211> 558
<212> DNA
<213> 人
<220>
<221> CDS
<222> (1)..(558)
<400> 145
acc aac aag tgt ctc ctc caa att gct ctc ctg ttg tgc ttc tcc act 48
Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser Thr
1 5 10 15
aca gct ctt tcc atg agc tac aac ttg ctt gga ttc cta caa aga agc 96
Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg Ser
20 25 30
agc aat ttt cag tgt cag aag ctc ctg tgg caa ttg aat ggg agg ctt 144
Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg Leu
35 40 45
gaa tat tgc ctc aag gac agg atg aac ttt gac atc cct gag gag att 192
Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile Pro Glu Glu Ile
50 55 60
aag cag ctg cag cag ttc cag aag gag gac gcc gca ttg acc atc tat 240
Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Leu Thr Ile Tyr
65 70 75 80
gag atg ctc cag aac atc ttt gct att ttc aga caa gat tca tct agc 288
Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser Ser
85 90 95
act ggc tgg aat gag act att gtt gag aac ctc ctg gct aat gtc tat 336
Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val Tyr
100 105 110
cat cag ata aac cat ctg aag aca gtc ctg gaa gaa aaa ctg gag aaa 384
His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu Lys
115 120 125
gaa gat ttt acc agg gga aaa ctc atg agc agt ctg cac ctg aaa aga 432
Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu His Leu Lys Arg
130 135 140
tat tat ggg agg att ctg cat tac ctg aag gcc aag gag tac agt cac 480
Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Tyr Ser His
145 150 155 160
tgt gcc tgg acc ata gtc aga gtg gaa atc cta agg aac ttt tac ttc 528
Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr Phe
165 170 175
att aac aga ctt aca ggt tac ctc cga aac 558
Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn
180 185
<210> 146
<211> 186
<212> PRT
<213> 人
<400> 146
Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser Thr
1 5 10 15
Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg Ser
20 25 30
Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg Leu
35 40 45
Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile Pro Glu Glu Ile
50 55 60
Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Leu Thr Ile Tyr
65 70 75 80
Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser Ser
85 90 95
Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val Tyr
100 105 110
His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu Lys
115 120 125
Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu His Leu Lys Arg
130 135 140
Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Tyr ser His
145 150 155 160
Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr Phe
165 170 175
Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn
180 185
<210> 147
<211> 531
<212> DNA
<213> 小鼠
<220>
<221> CDS
<222> (1)..(531)
<400> 147
gaa atc tgc tgg gga ccc tac agt cac cta atc tct ctc ctt ctc atc 48
Glu Ile Cys Trp Gly Pro Tyr Ser His Leu Ile Ser Leu Leu Leu Ile
1 5 10 15
ctt ctg ttt cat tca gag gca gcc tgc cgc cct tct ggg aaa aga ccc 96
Leu Leu Phe His Ser Glu Ala Ala Cys Arg Pro Ser Gly Lys Arg Pro
20 25 30
tgc aag atg caa gcc ttc aga atc tgg gat act aac cag aag acc ttt 144
Cys Lys Met Gln Ala Phe Arg Ile Trp Asp Thr Asn Gln Lys Thr Phe
35 40 45
tac ctg aga aac aac cag ctc att gct ggg tac tta caa gga cca aat 192
Tyr Leu Arg Asn Asn Gln Leu Ile Ala Gly Tyr Leu Gln Gly Pro Asn
50 55 60
atc aaa cta gaa gaa aag ata gac atg gtg cct att gac ctt cat agt 240
Ile Lys Leu Glu Glu Lys Ile Asp Met Val Pro Ile Asp Leu His Ser
65 70 75 80
gtg ttc ttg ggc atc cac ggg ggc aag ctg tgc ctg tct tgt gcc aag 288
Val Phe Leu Gly Ile His Gly Gly Lys Leu Cys Leu Ser Cys Ala Lys
85 90 95
tct gga gat gat atc aag ctc cag ctg gag gaa gtt aac atc act gat 336
Ser Gly Asp Asp Ile Lys Leu Gln Leu Glu Glu Val Asn Ile Thr Asp
100 105 110
ctg agc aag aac aaa gaa gaa gac aag cgc ttt acc ttc atc cgc tct 384
Leu Ser Lys Asn Lys Glu Glu Asp Lys Arg Phe Thr Phe Ile Arg Ser
115 120 125
gag aaa ggc ccc acc acc agc ttt gag tca gct gcc tgt cca gga tgg 432
Glu Lys Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp
130 135 140
ttc ctc tgc aca aca cta gag gct gac cgt cct gtg agc ctc acc aac 480
Phe Leu Cys Thr Thr Leu Glu Ala Asp Arg Pro Val Ser Leu Thr Asn
145 150 155 160
aca ccg gaa gag ccc ctt ata gtc acg aag ttc tac ttc cag gaa gac 528
Thr Pro Glu Glu Pro Leu Ile Val Thr Lys Phe Tyr Phe Gln Glu Asp
165 170 175
caa 531
Gln
<210> 148
<211> 177
<212> PRT
<213> 小鼠
<400> 148
Glu Ile Cys Trp Gly Pro Tyr Ser His Leu Ile Ser Leu Leu Leu Ile
1 5 10 15
Leu Leu Phe His Ser Glu Ala Ala Cys Arg Pro Ser Gly Lys Arg Pro
20 25 30
Cys Lys Met Gln Ala Phe Arg Ile Trp Asp Thr Asn Gln Lys Thr Phe
35 40 45
Tyr Leu Arg Asn Asn Gln Leu Ile Ala Gly Tyr Leu Gln Gly Pro Asn
50 55 60
Ile Lys Leu Glu Glu Lys Ile Asp Met Val Pro Ile Asp Leu His Ser
65 70 75 80
Val Phe Leu Gly Ile His Gly Gly Lys Leu Cys Leu Ser Cys Ala Lys
85 90 95
Ser Gly Asp Asp Ile Lys Leu Gln Leu Glu Glu Val Asn Ile Thr Asp
100 105 110
Leu Ser Lys Asn Lys Glu Glu Asp Lys Arg Phe Thr Phe Ile Arg Ser
115 120 125
Glu Lys Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp
130 135 140
Phe Leu Cys Thr Thr Leu Glu Ala Asp Arg Pro Val Ser Leu Thr Asn
145 150 155 160
Thr Pro Glu Glu Pro Leu Ile Val Thr Lys Phe Tyr Phe Gln Glu Asp
165 170 175
Gln
<210> 149
<211> 528
<212> DNA
<213>人
<220>
<221> CDS
<222> (1)..(528)
<400> 149
gaa atc tgc aga ggc ctc cgc agt cac cta atc act ctc ctc ctc ttc 48
Glu Ile Cys Arg Gly Leu Arg Ser His Leu Ile Thr Leu Leu Leu Phe
1 5 10 15
ctg ttc cat tca gag acg atc tgc cga ccc tct ggg aga aaa tcc agc 96
Leu Phe His Ser Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser
20 25 30
aag atg caa gcc ttc aga atc tgg gat gtt aac cag aag acc ttc tat 144
Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr
35 40 45
ctg agg aac aac caa cta gtt gct gga tac ttg caa gga cca aat gtc 192
Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val
50 55 60
aat tta gaa gaa aag ata gat gtg gta ccc att gag cct cat gct ctg 240
Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu
65 70 75 80
ttc ttg gga atc cat gga ggg aag atg tgc ctg tcc tgt gtc aag tct 288
Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser
85 90 95
ggt gat gag acc aga ctc cag ctg gag gca gtt aac atc act gac ctg 336
Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu
100 105 110
agc gag aac aga aag cag gac aag cgc ttc gcc ttc atc cgc tca gac 384
Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp
115 120 125
agc ggc ccc acc acc agt ttt gag tct gcc gcc tgc ccc ggt tgg ttc 432
Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe
130 135 140
ctc tgc aca gcg atg gaa gct gac cag ccc gtc agc ctc acc aat atg 480
Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met
145 150 155 160
cct gac gaa ggc gtc atg gtc acc aaa ttc tac ttc cag gag gac gag 528
Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
165 170 175
<210> 150
<211> 176
<212> PRT
<213> 人
<400> 150
Glu Ile Cys Arg Gly Leu Arg Ser His Leu Ile Thr Leu Leu Leu Phe
1 5 10 15
Leu Phe His Ser Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser
20 25 30
Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr
35 40 45
Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val
50 55 60
Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu
65 70 75 80
Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser
85 90 95
Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu
100 105 110
Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp
115 120 125
Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe
130 135 140
Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met
145 150 155 160
Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
165 170 175
<210> 151
<211> 504
<212> DNA
<213> 小鼠
<220>
<221> CDS
<222> (1)..(504)
<400> 151
tac agc atg cag ctc gca tcc tgt gtc aca ttg aca ctt gtg ctc ctt 48
Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu Leu
1 5 10 15
gtc aac agc gca ccc act tca agc tcc act tca agc tct aca gcg gaa 96
Val Asn Ser Ala Pro Thr Ser Ser Ser Thr Ser Ser Ser Thr Ala Glu
20 25 30
gca cag cag cag cag cag cag cag cag cag cag cag cag cac ctg gag 144
Ala Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Leu Glu
35 40 45
cag ctg ttg atg gac cta cag gag ctc ctg agc agg atg gag aat tac 192
Gln Leu Leu Met Asp Leu Gln Glu Leu Leu Ser Arg Met Glu Asn Tyr
50 55 60
agg aac ctg aaa ctc ccc agg atg ctc acc ttc aaa ttt tac ttg ccc 240
Arg Asn Leu Lys Leu Pro Arg Met Leu Thr Phe Lys Phe Tyr Leu Pro
65 70 75 80
aag cag gcc aca gaa ttg aaa gat ctt cag tgc cta gaa gat gaa ctt 288
Lys Gln Ala Thr Glu Leu Lys Asp Leu Gln Cys Leu Glu Asp Glu Leu
85 90 95
gga cct ctg cgg cat gtt ctg gat ttg act caa agc aaa agc ttt caa 336
Gly Pro Leu Arg His Val Leu Asp Leu Thr Gln Ser Lys Ser Phe Gln
100 105 110
ttg gaa gat gct gag aat ttc atc agc aat atc aga gta act gtt gta 384
Leu Glu Asp Ala Glu Asn Phe Ile Ser Asn Ile Arg Val Thr Val Val
115 120 125
aaa cta aag ggc tct gac aac aca ttt gag tgc caa ttc gat gat gag 432
Lys Leu Lys Gly Ser Asp Asn Thr Phe Glu Cys Gln Phe Asp Asp Glu
130 135 140
tca gca act gtg gtg gac ttt ctg agg aga tgg ata gcc ttc tgt caa 480
Ser Ala Thr Val Val Asp Phe Leu Arg Arg Trp Ile Ala Phe Cys Gln
145 150 155 160
agc atc atc tca aca agc cct caa 504
Ser Ile Ile Ser Thr Ser Pro Gln
165
<210> 152
<211> 168
<212> PRT
<213> 小鼠
<400> 152
Tyr Ser Met Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu Leu
1 5 10 15
Val Asn Ser Ala Pro Thr Ser Ser Ser Thr Ser Ser Ser Thr Ala Glu
20 25 30
Ala Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Leu Glu
35 40 45
Gln Leu Leu Met Asp Leu Gln Glu Leu Leu Ser Arg Met Glu Asn Tyr
50 55 60
Arg Asn Leu Lys Leu Pro Arg Met Leu Thr Phe Lys Phe Tyr Leu Pro
65 70 75 80
Lys Gln Ala Thr Glu Leu Lys Asp Leu Gln Cys Leu Glu Asp Glu Leu
85 90 95
Gly Pro Leu Arg His Val Leu Asp Leu Thr Gln Ser Lys Ser Phe Gln
100 105 110
Leu Glu Asp Ala Glu Asn Phe Ile Ser Asn Ile Arg Val Thr Val Val
115 120 125
Lys Leu Lys Gly Ser Asp Asn Thr Phe Glu Cys Gln Phe Asp Asp Glu
130 135 140
Ser Ala Thr Val Val Asp Phe Leu Arg Arg Trp Ile Ala Phe Cys Gln
145 150 155 160
Ser Ile Ile Ser Thr Ser Pro Gln
165
<210> 153
<211> 396
<212> DNA
<213> 人
<220>
<221> CDS
<222> (1)..(396)
<400> 153
cct act tca agt tct aca aag aaa aca cag cta caa ctg gag cat tta 48
Pro Thr Ser Ser Ser Thr Lys Lys Thr Gln Leu Gln Leu Glu His Leu
1 5 10 15
ctg ctg gat tta cag atg att ttg aat gga att aat aat tac aag aat 96
Leu Leu Asp Leu Gln Met Ile Leu Asn Gly Ile Asn Asn Tyr Lys Asn
20 25 30
ccc aaa ctc acc agg atg ctc aca ttt aag ttt tac atg ccc aag aag 144
Pro Lys Leu Thr Arg Met Leu Thr Phe Lys Phe Tyr Met Pro Lys Lys
35 40 45
gcc aca gaa ctg aaa cat ctt cag tgt cta gaa gaa gaa ctc aaa cct 192
Ala Thr Glu Leu Lys His Leu Gln Cys Leu Glu Glu Glu Leu Lys Pro
50 55 60
ctg aag gaa gtg cta aat tta gct caa agc aaa aac ttt cac tta aga 240
Leu Lys Glu Val Leu Asn Leu Ala Gln Ser Lys Asn Phe His Leu Arg
65 70 75 80
ccc agg gac tta atc agc aat atc aac gta ata gtt ctg gaa cta aag 288
Pro Arg Asp Leu Ile Ser Asn Ile Asn Val Ile Val Leu Glu Leu Lys
85 90 95
gga tct gaa aca aca ttc atg tgt gaa tat gct gat gag aca gca acc 336
Gly Ser Glu Thr Thr Phe Met Cys Glu Tyr Ala Asp Glu Thr Ala Thr
100 105 110
att gta gaa ttt ctg aac aga tgg att acc ttt tct caa agc atc atc 384
Ile Val Glu Phe Leu Asn Arg Trp Ile Thr Phe Ser Gln Ser Ile Ile
115 120 125
tca aca ctg act 396
Ser Thr Leu Thr
130
<210> 154
<211> 132
<212> PRT
<213> 人
<400> 154
Pro Thr Ser Ser Ser Thr Lys Lys Thr Gln Leu Gln Leu Glu His Leu
1 5 10 15
Leu Leu Asp Leu Gln Met Ile Leu Asn Gly Ile Asn Asn Tyr Lys Asn
20 25 30
Pro Lys Leu Thr Arg Met Leu Thr Phe Lys Phe Tyr Met Pro Lys Lys
35 40 45
Ala Thr Glu Leu Lys His Leu Gln Cys Leu Glu Glu Glu Leu Lys Pro
50 55 60
Leu Lys Glu Val Leu Asn Leu Ala Gln Ser Lys Asn Phe His Leu Arg
65 70 75 80
Pro Arg Asp Leu Ile Ser Asn Ile Asn Val Ile Val Leu Glu Leu Lys
85 90 95
Gly Ser Glu Thr Thr Phe Met Cys Glu Tyr Ala Asp Glu Thr Ala Thr
100 105 110
Ile Val Glu Phe Leu Asn Arg Trp Ile Thr Phe Ser Gln Ser Ile Ile
115 120 125
Ser Thr Leu Thr
130
<210> 155
<211> 834
<212> DNA
<213> 小鼠
<220>
<221> CDS
<222> (1)..(834)
<400> 155
cag cag ccc atg aat tac cca tgt ccc cag atc ttc tgg gta gac agc 48
Gln Gln Pro Met Asn Tyr Pro Cys Pro Gln Ile Phe Trp Val Asp Ser
1 5 10 15
agt gcc act tca tct tgg gct cct cca ggg tca gtt ttt ccc tgt cca 96
Ser Ala Thr Ser Ser Trp Ala Pro Pro Gly Ser Val Phe Pro Cys Pro
20 25 30
tct tgt ggg cct aga ggg ccg gac caa agg aga ccg cca cct cca cca 144
Ser Cys Gly Pro Arg Gly Pro Asp Gln Arg Arg Pro Pro Pro Pro Pro
35 40 45
cca cct gtg tca cca cta cca ccg cca tca caa cca ctc cca ctg ccg 192
Pro Pro Val Ser Pro Leu Pro Pro Pro Ser Gln Pro Leu Pro Leu Pro
50 55 60
cca ctg acc cct cta aag aag aag gac cac aac aca aat ctg tgg cta 240
Pro Leu Thr Pro Leu Lys Lys Lys Asp His Asn Thr Asn Leu Trp Leu
65 70 75 80
ccg gtg gta ttt ttc atg gtt ctg gtg gct ctg gtt gga atg gga tta 288
Pro Val Val Phe Phe Met Val Leu Val Ala Leu Val Gly Met Gly Leu
85 90 95
gga atg tat cag ctc ttc cac ctg cag aag gaa ctg gca gaa ctc cgt 336
Gly Met Tyr Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu Leu Arg
100 105 110
gag ttc acc aac caa agc ctt aaa gta tca tct ttt gaa aag caa ata 384
Glu Phe Thr Asn Gln Ser Leu Lys Val Ser Ser Phe Glu Lys Gln Ile
115 120 125
gcc aac ccc agt aca ccc tct gaa aaa aaa gag ccg agg agt gtg gcc 432
Ala Asn Pro Ser Thr Pro Ser Glu Lys Lys Glu Pro Arg Ser Val Ala
130 135 140
cat tta aca ggg aac ccc cac tca agg tcc atc cct ctg gaa tgg gaa 480
His Leu Thr Gly Asn Pro His Ser Arg Ser Ile Pro Leu Glu Trp Glu
145 150 155 160
gac aca tat gga acc gct ctg atc tct gga gtg aag tat aag aaa ggt 528
Asp Thr Tyr Gly Thr Ala Leu Ile Ser Gly Val Lys Tyr Lys Lys Gly
165 170 175
ggc ctt gtg atc aac gaa act ggg ttg tac ttc gtg tat tcc aaa gta 576
Gly Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser Lys Val
180 185 190
tac ttc cgg ggt cag tct tgc aac aac cag ccc cta aac cac aag gtc 624
Tyr Phe Arg Gly Gln Ser Cys Asn Asn Gln Pro Leu Asn His Lys Val
195 200 205
tat atg agg aac tct aag tat cct gag gat ctg gtg cta atg gag gag 672
Tyr Met Arg Asn Ser Lys Tyr Pro Glu Asp Leu Val Leu Met Glu Glu
210 215 220
aag agg ttg aac tac tgc act act gga cag ata tgg gcc cac agc agc 720
Lys Arg Leu Asn Tyr Cys Thr Thr Gly Gln Ile Trp Ala His Ser Ser
225 230 235 240
tac ctg ggg gca gta ttc aat ctt acc agt gct gac cat tta tat gtc 768
Tyr Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu Tyr Val
245 250 255
aac ata tct caa ctc tct ctg atc aat ttt gag gaa tct aag acc ttt 816
Asn Ile Ser Gln Leu Ser Leu Ile Asn Phe Glu Glu Ser Lys Thr Phe
260 265 270
ttc ggc ttg tat aag ctt 834
Phe Gly Leu Tyr Lys Leu
275
<210> 156
<211> 278
<212> PRT
<213> 小鼠
<400> 156
Gln Gln Pro Met Asn Tyr Pro Cys Pro Gln Ile Phe Trp Val Asp Ser
1 5 10 15
Ser Ala Thr Ser Ser Trp Ala Pro Pro Gly Ser Val Phe Pro Cys Pro
20 25 30
Ser Cys Gly Pro Arg Gly Pro Asp Gln Arg Arg Pro Pro Pro Pro Pro
35 40 45
Pro Pro Val Ser Pro Leu Pro Pro Pro Ser Gln Pro Leu Pro Leu Pro
50 55 60
Pro Leu Thr Pro Leu Lys Lys Lys Asp His Asn Thr Asn Leu Trp Leu
65 70 75 80
Pro Val Val Phe Phe Met Val Leu Val Ala Leu Val Gly Met Gly Leu
85 90 95
Gly Met Tyr Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu Leu Arg
100 105 110
Glu Phe Thr Asn Gln Ser Leu Lys Val Ser Ser Phe Glu Lys Gln Ile
115 120 125
Ala Asn Pro Ser Thr Pro Ser Glu Lys Lys Glu Pro Arg Ser Val Ala
130 135 140
His Leu Thr Gly Asn Pro His Ser Arg Ser Ile Pro Leu Glu Trp Glu
145 150 155 160
Asp Thr Tyr Gly Thr Ala Leu Ile Ser Gly Val Lys Tyr Lys Lys Gly
165 170 175
Gly Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser Lys Val
180 185 190
Tyr Phe Arg Gly Gln Ser Cys Asn Asn Gln Pro Leu Asn His Lys Val
195 200 205
Tyr Met Arg Asn Ser Lys Tyr Pro Glu Asp Leu Val Leu Met Glu Glu
210 215 220
Lys Arg Leu Asn Tyr Cys Thr Thr Gly Gln Ile Trp Ala His Ser Ser
225 230 235 240
Tyr Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu Tyr Val
245 250 255
Asn Ile Ser Gln Leu Ser Leu Ile Asn Phe Glu Glu Ser Lys Thr Phe
260 265 270
Phe Gly Leu Tyr Lys Leu
275
<210> 157
<211> 840
<212> DNA
<213> 人
<220>
<221> CDS
<222> (1)..(840)
<400> 157
cag cag ccc ttc aat tac cca tat ccc cag atc tac tgg gtg gac agc 48
Gln Gln Pro Phe Asn Tyr Pro Tyr Pro Gln Ile Tyr Trp Val Asp Ser
1 5 10 15
agt gcc agc tct ccc tgg gcc cct cca ggc aca gtt ctt ccc tgt cca 96
Ser Ala Ser Ser Pro Trp Ala Pro Pro Gly Thr Val Leu Pro Cys Pro
20 25 30
acc tct gtg ccc aga agg cct ggt caa agg agg cca cca cca cca ccg 144
Thr Ser Val Pro Arg Arg Pro Gly Gln Arg Arg Pro Pro Pro Pro Pro
35 40 45
cca ccg cca cca cta cca cct ccg ccg ccg ccg cca cca ctg cct cca 192
Pro Pro Pro Pro Leu Pro Pro Pro Pro Pro Pro Pro Pro Leu Pro Pro
50 55 60
cta ccg ctg cca ccc ctg aag aag aga ggg aac cac agc aca ggc ctg 240
Leu Pro Leu Pro Pro Leu Lys Lys Arg Gly Asn His Ser Thr Gly Leu
65 70 75 80
tgt ctc ctt gtg atg ttt ttc atg gtt ctg gtt gcc ttg gta gga ttg 288
Cys Leu Leu Val Met Phe Phe Met Val Leu Val Ala Leu Val Gly Leu
85 90 95
ggc ctg ggg atg ttt cag ctc ttc cac cta cag aag gag ctg gca gaa 336
Gly Leu Gly Met Phe Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu
100 105 110
ctc cga gag tct acc agc cag atg cac aca gca tca tct ttg gag aag 384
Leu Arg Glu Ser Thr Ser Gln Met His Thr Ala Ser Ser Leu Glu Lys
115 120 125
caa ata ggc cac ccc agt cca ccc cct gaa aaa aag gag ctg agg aaa 432
Gln Ile Gly His Pro Ser Pro Pro Pro Glu Lys Lys Glu Leu Arg Lys
130 135 140
gtg gcc cat tta aca ggc aag tcc aac tca agg tcc atg cct ctg gaa 480
Val Ala His Leu Thr Gly Lys Ser Asn Ser Arg Ser Met Pro Leu Glu
145 150 155 160
tgg gaa gac acc tat gga att gtc ctg ctt tct gga gtg aag tat aag 528
Trp Glu Asp Thr Tyr Gly Ile Val Leu Leu Ser Gly Val Lys Tyr Lys
165 170 175
aag ggt ggc ctt gtg atc aat gaa act ggg ctg tac ttt gta tat tcc 576
Lys Gly Gly Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser
180 185 190
aaa gta tac ttc cgg ggt caa tct tgc aac aac ctg ccc ctg agc cac 624
Lys Val Tyr Phe Arg Gly Gln Ser Cys Asn Asn Leu Pro Leu Ser His
195 200 205
aag gtc tac atg agg aac tct aag tat ccc cag gat ctg gtg atg atg 672
Lys Val Tyr Met Arg Asn Ser Lys Tyr Pro Gln Asp Leu Val Met Met
210 215 220
gag ggg aag atg atg agc tac tgc act act ggg cag atg tgg gcc cgc 720
Glu Gly Lys Met Met Ser Tyr Cys Thr Thr Gly Gln Met Trp Ala Arg
225 230 235 240
agc agc tac ctg ggg gca gtg ttc aat ctt acc agt gct gat cat tta 768
Ser Ser Tyr Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu
245 250 255
tat gtc aac gta tct gag ctc tct ctg gtc aat ttt gag gaa tct cag 816
Tyr Val Asn Val Ser Glu Leu Ser Leu Val Asn Phe Glu Glu Ser Gln
260 265 270
acg ttt ttc ggc tta tat aag ctc 840
Thr Phe Phe Gly Leu Tyr Lys Leu
275 280
<210> 158
<211> 280
<212> PRT
<213> 人
<400> 158
Gln Gln Pro Phe Asn Tyr Pro Tyr Pro Gln Ile Tyr Trp Val Asp Ser
1 5 10 15
Ser Ala Ser Ser Pro Trp Ala Pro Pro Gly Thr Val Leu Pro Cys Pro
20 25 30
Thr Ser Val Pro Arg Arg Pro Gly Gln Arg Arg Pro Pro Pro Pro Pro
35 40 45
Pro Pro Pro Pro Leu Pro Pro Pro Pro Pro Pro Pro Pro Leu Pro Pro
50 55 60
Leu Pro Leu Pro Pro Leu Lys Lys Arg Gly Asn His Ser Thr Gly Leu
65 70 75 80
Cys Leu Leu Val Met Phe Phe Met Val Leu Val Ala Leu Val Gly Leu
85 90 95
Gly Leu Gly Met Phe Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu
100 105 110
Leu Arg Glu Ser Thr Ser Gln Met His Thr Ala Ser Ser Leu Glu Lys
115 120 125
Gln Ile Gly His Pro Ser Pro Pro Pro Glu Lys Lys Glu Leu Arg Lys
130 135 140
Val Ala His Leu Thr Gly Lys Ser Asn Ser Arg Ser Met Pro Leu Glu
145 150 155 160
Trp Glu Asp Thr Tyr Gly Ile Val Leu Leu Ser Gly Val Lys Tyr Lys
165 170 175
Lys Gly Gly Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser
180 185 190
Lys Val Tyr Phe Arg Gly Gln Ser Cys Asn Asn Leu Pro Leu Ser His
195 200 205
Lys Val Tyr Met Arg Asn Ser Lys Tyr Pro Gln Asp Leu Val Met Met
210 215 220
Glu Gly Lys Met Met Ser Tyr Cys Thr Thr Gly Gln Met Trp Ala Arg
225 230 235 240
Ser Ser Tyr Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu
245 250 255
Tyr Val Asn Val Ser Glu Leu Ser Leu Val Asn Phe Glu Glu Ser Gln
260 265 270
Thr Phe Phe Gly Leu Tyr Lys Leu
275 280
<210> 159
<211> 438
<212> DNA
<213> 鸡
<220>
<221> CDS
<222> (1)..(438)
<400> 159
agg tct ttg cta atc ttg gtg ctt tgc ttc ctg ccc ctg gct gct ctg 48
Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala Leu
1 5 10 15
ggg aaa gtc ttt gga cga tgt gag ctg gca gcg gct atg aag cgt cac 96
Gly Lys Val Phe Gly Arg Cys Glu Leu Ala Ala Ala Met Lys Arg His
20 25 30
gga ctt gat aac tat cgg gga tac agc ctg gga aac tgg gtg tgt gtt 144
Gly Leu Asp Asn Tyr Arg Gly Tyr Ser Leu Gly Asn Trp Val Cys Val
35 40 45
gca aaa ttc gag agt aac ttc aac acc cag gct aca aac cgt aac acc 192
Ala Lys Phe Glu Ser Asn Phe Asn Thr Gln Ala Thr Asn Arg Asn Thr
50 55 60
gat ggg agt acc gac tac gga atc cta cag atc aac agc cgc tgg tgg 240
Asp Gly Ser Thr Asp Tyr Gly Ile Leu Gln Ile Asn Ser Arg Trp Trp
65 70 75 80
tgc aac gat ggc agg acc cca ggc tcc agg aac ctg tgc aac atc ccg 288
Cys Asn Asp Gly Arg Thr Pro Gly Ser Arg Asn Leu Cys Asn Ile Pro
85 90 95
tgc tca gcc ctg ctg agc tca gac ata aca gcg agc gtg aac tgc gcg 336
Cys Ser Ala Leu Leu Ser Ser Asp Ile Thr Ala Ser Val Asn Cys Ala
100 105 110
aag aag atc gtc agc gat gga aac ggc atg agc gcg tgg gtc gcc tgg 384
Lys Lys Ile Val Ser Asp Gly Asn Gly Met Ser Ala Trp Val Ala Trp
115 120 125
cgc aac cgc tgc aag ggt acc gac gtc cag gcg tgg atc aga ggc tgc 432
Arg Asn Arg Cys Lys Gly Thr Asp Val Gln Ala Trp Ile Arg Gly Cys
130 135 140
cgg ctg 438
Arg Leu
145
<210> 160
<211> 146
<212> PRT
<213> 鸡
<400> 160
Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala Leu
1 5 10 15
Gly Lys Val Phe Gly Arg Cys Glu Leu Ala Ala Ala Met Lys Arg His
20 25 30
Gly Leu Asp Asn Tyr Arg Gly Tyr Ser Leu Gly Asn Trp Val Cys Val
35 40 45
Ala Lys Phe Glu Ser Asn Phe Asn Thr Gln Ala Thr Asn Arg Asn Thr
50 55 60
Asp Gly Ser Thr Asp Tyr Gly Ile Leu Gln Ile Asn Ser Arg Trp Trp
65 70 75 80
Cys Asn Asp Gly Arg Thr Pro Gly Ser Arg Asn Leu Cys Asn Ile Pro
85 90 95
Cys Ser Ala Leu Leu Ser Ser Asp Ile Thr Ala Ser Val Asn Cys Ala
100 105 110
Lys Lys Ile Val Ser Asp Gly Asn Gly Met Ser Ala Trp Val Ala Trp
115 120 125
Arg Asn Arg Cys Lys Gly Thr Asp Val Gln Ala Trp Ile Arg Gly Cys
130 135 140
Arg Leu
145
<210> 161
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> Flag标记物
<220>
<221> CDS
<222> (1)..(24)
<400> 161
gac tac aag gac gat gac gac aag 24
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 162
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> Flag标记物
<400> 162
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 163
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> His标记物
<220>
<221> CDS
<222> (1)..(18)
<400> 163
cat cat cat cat cat cat 18
His His His His His His
1 5
<210> 164
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> His标记物
<400> 164
His His His His His His
1 5
<210> 165
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> Strep标记物
<220>
<221> CDS
<222> (1)..(27)
<400> 165
gct tgg cgt cac ccg cag ttc ggt ggt 27
Ala Trp Arg His Pro Gln Phe Gly Gly
1 5
<210> 166
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> Strep标记物
<400> 166
Ala Trp Arg His Pro Gln Phe Gly Gly
1 5
<210> 167
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂1
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa是(GGGGS)n,其中n=0-10
<400> 167
Gly Ser Xaa Gly Ser Ser
1 5
<210> 168
<211> 3
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂2
<400> 168
Gly Ser Ser
1
<210> 169
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂3
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa是(GGGGS)n,其中n=0-10
<400> 169
Gly Ser Ser Gly Ser Xaa
1 5
<210> 170
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂1,n=0
<220>
<221> CDS
<222> (1)..(15)
<400> 170
gga tcc ggc tcg agt 15
Gly Ser Gly Ser Ser
1 5
<210> 171
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂1,n=0
<400> 171
Gly Ser Gly Ser Ser
1 5
<210> 172
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂1,n=1
<220>
<221> CDS
<222> (1)..(30)
<400> 172
gga tcc ggt ggt ggt gga tcc ggc tcg agt 30
Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser
1 5 10
<210> 173
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂1,n=1
<400> 173
Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser
1 5 10
<210> 174
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂1,n=2
<220>
<221> CDS
<222> (1)..(45)
<400> 174
gga tcc ggt ggt ggt ggt agc ggt ggt ggt gga tcc ggc tcg agt 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser
1 5 10 15
<210> 175
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂1,n=2
<400> 175
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser
1 5 10 15
<210> 176
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂1,n是大于或等于3
<220>
<221> misc_feature
<222> (7)..(7)
<223> n=(ggtggtggtggtagc)n-1,其中第二个n大于或等于3
<400> 176
ggatccnggt ggtggtggat ccggctcgag t 31
<210> 177
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂2
<220>
<221> CDS
<222> (1)..(9)
<400> 177
ggc tcg agt 9
Gly Ser Ser
1
<210> 178
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂3,n=0
<220>
<221> CDS
<222> (1)..(15)
<400> 178
ggc tcg agt gga tcc 15
Gly Ser Ser Gly Ser
1 5
<210> 179
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂3,n=0
<400> 179
Gly Ser Ser Gly Ser
1 5
<210> 180
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂3,n=1
<220>
<221> CDS
<222> (1)..(30)
<400> 180
ggc tcg agt gga tcc ggt ggt ggt gga tcc 30
Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 181
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂3,n=1
<400> 181
Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 182
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂3,n=2
<220>
<221> CDS
<222> (1)..(45)
<400> 182
ggc tcg agt gga tcc ggt ggt ggt ggt agc ggt ggt ggt gga tcc 45
Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 183
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 间隔臂3,n=2
<400> 183
Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 184
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 间隔臂3,n大于或等于3
<220>
<221> misc_feature
<222> (16)..(16)
<223> n=(ggtggtggtggtagc)n-1,其中第二个n大于或等与3
<400> 184
ggctcgagtg gatccnggtg gtggtggatc c 31
<210> 185
<211> 552
<212> DNA
<213> 人工序列
<220>
<223> 鼠GM-CSF嵌合构建物
<220>
<221> CDS
<222> (1)..(546)
<400> 185
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggt ggt ggt gga tcc ggc tcg agt tgg 96
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Trp
20 25 30
ctg cag aat tta ctt ttc ctg ggc att gtg gtc tac agc ctc tca gca 144
Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu Ser Ala
35 40 45
ccc acc cgc tca ccc atc act gtc acc cgg cct tgg aag cat gta gag 192
Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His Val Glu
50 55 60
gcc atc aaa gaa gcc ctg aac ctc ctg gat gac atg cct gtc aca ttg 240
Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val Thr Leu
65 70 75 80
aat gaa gag gta gaa gtc gtc tct aac gag ttc tcc ttc aag aag cta 288
Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys Lys Leu
85 90 95
aca tgt gtg cag acc cgc ctg aag ata ttc gag cag ggt cta cgg ggc 336
Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu Arg Gly
100 105 110
aat ttc acc aaa ctc aag ggc gcc ttg aac atg aca gcc agc tac tac 384
Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser Tyr Tyr
115 120 125
cag aca tac tgc ccc cca act ccg gaa acg gac tgt gaa aca caa gtt 432
Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr Gln Val
130 135 140
acc acc tat gcg gat ttc ata gac agc ctt aaa acc ttt ctg act gat 480
Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu Thr Asp
145 150 155 160
atc ccc ttt gaa tgc aaa aaa cca gtc caa aaa ggc tcg agt gac tac 528
Ile Pro Phe Glu Cys Lys Lys Pro Val Gln Lys Gly Ser Ser Asp Tyr
165 170 175
aag gac gat gac gac aag taataa 552
Lys Asp Asp Asp Asp Lys
180
<210> 186
<211> 182
<212> PRT
<213> 人工序列
<220>
<223> 鼠GM-CSF嵌合构建物
<400> 186
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Trp
20 25 30
Leu Gln Asn Leu Leu Phe Leu Gly Ile Val Val Tyr Ser Leu Ser Ala
35 40 45
Pro Thr Arg Ser Pro Ile Thr Val Thr Arg Pro Trp Lys His Val Glu
50 55 60
Ala Ile Lys Glu Ala Leu Asn Leu Leu Asp Asp Met Pro Val Thr Leu
65 70 75 80
Asn Glu Glu Val Glu Val Val Ser Asn Glu Phe Ser Phe Lys Lys Leu
85 90 95
Thr Cys Val Gln Thr Arg Leu Lys Ile Phe Glu Gln Gly Leu Arg Gly
100 105 110
Asn Phe Thr Lys Leu Lys Gly Ala Leu Asn Met Thr Ala Ser Tyr Tyr
115 120 125
Gln Thr Tyr Cys Pro Pro Thr Pro Glu Thr Asp Cys Glu Thr Gln Val
130 135 140
Thr Thr Tyr Ala Asp Phe Ile Asp Ser Leu Lys Thr Phe Leu Thr Asp
145 150 155 160
Ile Pro Phe Glu Cys Lys Lys Pro Val Gln Lys Gly Ser Ser Asp Tyr
165 170 175
Lys Asp Asp Asp Asp Lys
180
<210> 187
<211> 579
<212> DNA
<213> 人工序列
<220>
<223> 人GM-CSF嵌合构建物
<220>
<221> CDS
<222> (1)..(573)
<400> 187
atg gac tac aag gac gat gac gac aag ggc tcg agt tgg ctg cag agc 48
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Trp Leu Gln Ser
1 5 10 15
ctg ctg ctc ttg ggc act gtg gcc tgc agc atc tct gca ccc gcc cgc 96
Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile Ser Ala Pro Ala Arg
20 25 30
tcg ccc agc ccc agc acg cag ccc tgg gag cat gtg aat gcc atc cag 144
Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His Val Asn Ala Ile Gln
35 40 45
gag gcc cgg cgt ctc ctg aac ctg agt aga gac act gct gct gag atg 192
Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp Thr Ala Ala Glu Met
50 55 60
aat gaa aca gta gaa gtc atc tca gaa atg ttt gac ctc cag gag ccg 240
Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe Asp Leu Gln Glu Pro
65 70 75 80
acc tgc cta cag acc cgc ctg gag ctg tac aag cag ggc ctg cgg ggc 288
Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys Gln Gly Leu Arg Gly
85 90 95
agc ctc acc aag ctc aag ggc ccc ttg acc atg atg gcc agc cac tac 336
Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met Met Ala Ser His Tyr
100 105 110
aag cag cac tgc cct cca acc ccg gaa act tcc tgt gca acc cag att 384
Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser Cys Ala Thr Gln Ile
115 120 125
atc acc ttt gaa agt ttc aaa gag aac ctg aag gac ttt ctg ctt gtc 432
Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys Asp Phe Leu Leu Val
130 135 140
atc ccc ttt gac tgc tgg gag cca gtc cag gag ggc tcg agt gga tcc 480
Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu Gly Ser Ser Gly Ser
145 150 155 160
ggt ggt ggt ggt agc ggt ggt ggt gga tcc acc gct atc gcg att gca 528
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala
165 170 175
gtg gca ctg gct ggt ttc gct acc gta gcg cag gcc aca aag aaa 573
Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
180 185 190
taataa 579
<210> 188
<211> 191
<212> PRT
<213> 人工序列
<220>
<223> 人GM-CSF嵌合构建物
<400> 188
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Trp Leu Gln Ser
1 5 10 15
Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile Ser Ala Pro Ala Arg
20 25 30
Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His Val Asn Ala Ile Gln
35 40 45
Glu Ala Arg Arg Leu Leu Asn Leu Ser Arg Asp Thr Ala Ala Glu Met
50 55 60
Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe Asp Leu Gln Glu Pro
65 70 75 80
Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys Gln Gly Leu Arg Gly
85 90 95
Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met Met Ala Ser His Tyr
100 105 110
Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser Cys Ala Thr Gln Ile
115 120 125
Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys Asp Phe Leu Leu Val
130 135 140
Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu Gly Ser Ser Gly Ser
145 150 155 160
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala
165 170 175
Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
180 185 190
<210> 189
<211> 732
<212> DNA
<213> 人工序列
<220>
<223> 鼠IFN-beta嵌合构建物
<220>
<221> CDS
<222> (1)..(726)
<400> 189
atg cat cat cat cat cat cat ggc tcg agt aac aac agg tgg atc ctc 48
Met His His His His His His Gly Ser Ser Asn Asn Arg Trp Ile Leu
1 5 10 15
cac gct gcg ttc ctg ctg tgc ttc tcc acc aca gcc ctc tcc atc aac 96
His Ala Ala Phe Leu Leu Cys Phe Ser Thr Thr Ala Leu Ser Ile Asn
20 25 30
tat aag cag ctc cag ctc caa gaa agg acg aac att cgg aaa tgt cag 144
Tyr Lys Gln Leu Gln Leu Gln Glu Arg Thr Asn Ile Arg Lys Cys Gln
35 40 45
gag ctc ctg gag cag ctg aat gga aag atc aac ctc acc tac agg gcg 192
Glu Leu Leu Glu Gln Leu Asn Gly Lys Ile Asn Leu Thr Tyr Arg Ala
50 55 60
gac ttc aag atc cct atg gag atg acg gag aag atg cag aag agt tac 240
Asp Phe Lys Ile Pro Met Glu Met Thr Glu Lys Met Gln Lys Ser Tyr
65 70 75 80
act gcc ttt gcc atc caa gag atg ctc cag aat gtc ttt ctt gtc ttc 288
Thr Ala Phe Ala Ile Gln Glu Met Leu Gln Asn Val Phe Leu Val Phe
85 90 95
aga aac aat ttc tcc agc act ggg tgg aat gag act att gtt gta cgt 336
Arg Asn Asn Phe Ser Ser Thr Gly Trp Asn Glu Thr Ile Val Val Arg
100 105 110
ctc ctg gat gaa ctc cac cag cag aca gtg ttt ctg aag aca gta cta 384
Leu Leu Asp Glu Leu His Gln Gln Thr Val Phe Leu Lys Thr Val Leu
115 120 125
gag gaa aag caa gag gaa aga ttg acg tgg gag atg tcc tca act gct 432
Glu Glu Lys Gln Glu Glu Arg Leu Thr Trp Glu Met Ser Ser Thr Ala
130 135 140
ctc cac ttg aag agc tat tac tgg agg gtg caa agg tac ctt aaa ctc 480
Leu His Leu Lys Ser Tyr Tyr Trp Arg Val Gln Arg Tyr Leu Lys Leu
145 150 155 160
atg aag tac aac agc tac gcc tgg atg gtg gtc cga gca gag atc ttc 528
Met Lys Tyr Asn Ser Tyr Ala Trp Met Val Val Arg Ala Glu Ile Phe
165 170 175
agg aac ttt ctc atc att cga aga ctt acc aga aac ttc caa aac ggc 576
Arg Asn Phe Leu Ile Ile Arg Arg Leu Thr Arg Asn Phe Gln Asn Gly
180 185 190
tcg agt gga tcc ggt ggt ggt ggt agc ggt ggt ggt ggt agc ggt ggt 624
Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
195 200 205
ggt ggt agc ggt ggt ggt ggt agc ggt ggt ggt gga tcc acc gct atc 672
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile
210 215 220
gcg att gca gtg gca ctg gct ggt ttc gct acc gta gcg cag gcc aca 720
Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr
225 230 235 240
aag aaa taataa 732
Lys Lys
<210> 190
<211> 242
<212> PRT
<213> 人工序列
<220>
<223> 鼠IFN-beta嵌合构建物
<400> 190
Met His His His His His His Gly Ser Ser Asn Asn Arg Trp Ile Leu
1 5 10 15
His Ala Ala Phe Leu Leu Cys Phe Ser Thr Thr Ala Leu Ser Ile Asn
20 25 30
Tyr Lys Gln Leu Gln Leu Gln Glu Arg Thr Asn Ile Arg Lys Cys Gln
35 40 45
Glu Leu Leu Glu Gln Leu Asn Gly Lys Ile Asn Leu Thr Tyr Arg Ala
50 55 60
Asp Phe Lys Ile Pro Met Glu Met Thr Glu Lys Met Gln Lys Ser Tyr
65 70 75 80
Thr Ala Phe Ala Ile Gln Glu Met Leu Gln Asn Val Phe Leu Val Phe
85 90 95
Arg Asn Asn Phe Ser Ser Thr Gly Trp Asn Glu Thr Ile Val Val Arg
100 105 110
Leu Leu Asp Glu Leu His Gln Gln Thr Val Phe Leu Lys Thr Val Leu
115 120 125
Glu Glu Lys Gln Glu Glu Arg Leu Thr Trp Glu Met Ser Ser Thr Ala
130 135 140
Leu His Leu Lys Ser Tyr Tyr Trp Arg Val Gln Arg Tyr Leu Lys Leu
145 150 155 160
Met Lys Tyr Asn Ser Tyr Ala Trp Met Val Val Arg Ala Glu Ile Phe
165 170 175
Arg Asn Phe Leu Ile Ile Arg Arg Leu Thr Arg Asn Phe Gln Asn Gly
180 185 190
Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
195 200 205
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile
210 215 220
Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr
225 230 235 240
Lys Lys
<210> 191
<211> 708
<212> DNA
<213> 人工序列
<220>
<223> 人IFN-beta嵌合构建物
<220>
<221> CDS
<222> (1)..(702)
<400> 191
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggt ggt ggt ggt agc ggt ggt ggt gga 96
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
tcc ggc tcg agt acc aac aag tgt ctc ctc caa att gct ctc ctg ttg 144
Ser Gly Ser Ser Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu
35 40 45
tgc ttc tcc act aca gct ctt tcc atg agc tac aac ttg ctt gga ttc 192
Cys Phe Ser Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe
50 55 60
cta caa aga agc agc aat ttt cag tgt cag aag ctc ctg tgg caa ttg 240
Leu Gln Arg Ser Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu
65 70 75 80
aat ggg agg ctt gaa tat tgc ctc aag gac agg atg aac ttt gac atc 288
Asn Gly Arg Leu Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile
85 90 95
cct gag gag att aag cag ctg cag cag ttc cag aag gag gac gcc gca 336
Pro Glu Glu Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala
100 105 110
ttg acc atc tat gag atg ctc cag aac atc ttt gct att ttc aga caa 384
Leu Thr Ile Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln
115 120 125
gat tca tct agc act ggc tgg aat gag act att gtt gag aac ctc ctg 432
Asp Ser Ser Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu
130 135 140
gct aat gtc tat cat cag ata aac cat ctg aag aca gtc ctg gaa gaa 480
Ala Asn Val Tyr His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu
145 150 155 160
aaa ctg gag aaa gaa gat ttt acc agg gga aaa ctc atg agc agt ctg 528
Lys Leu Glu Lys Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu
165 170 175
cac ctg aaa aga tat tat ggg agg att ctg cat tac ctg aag gcc aag 576
His Leu Lys Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys
180 185 190
gag tac agt cac tgt gcc tgg acc ata gtc aga gtg gaa atc cta agg 624
Glu Tyr Ser His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg
195 200 205
aac ttt tac ttc att aac aga ctt aca ggt tac ctc cga aac ggc tcg 672
Asn Phe Tyr Phe Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn Gly Ser
210 215 220
agt gct tgg cgt cac ccg cag ttc ggt ggt taataa 708
Ser Ala Trp Arg His Pro Gln Phe Gly Gly
225 230
<210> 192
<211> 234
<212> PRT
<213> 人工序列
<220>
<223> 人IFN-beta嵌合构建物
<400> 192
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Ser Ser Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu
35 40 45
Cys Phe Ser Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe
50 55 60
Leu Gln Arg Ser Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu
65 70 75 80
Asn Gly Arg Leu Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile
85 90 95
Pro Glu Glu Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala
100 105 110
Leu Thr Ile Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln
115 120 125
Asp Ser Ser Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu
130 135 140
Ala Asn Val Tyr His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu
145 150 155 160
Lys Leu Glu Lys Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu
165 170 175
His Leu Lys Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys
180 185 190
Glu Tyr Ser His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg
195 200 205
Asn Phe Tyr Phe Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn Gly Ser
210 215 220
Ser Ala Trp Arg His Pro Gln Phe Gly Gly
225 230
<210> 193
<211> 723
<212> DNA
<213> 人工序列
<220>
<223> 鼠IL-1Ra嵌合构建物
<220>
<221> CDS
<222> (1)..(717)
<400> 193
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggt ggt ggt ggt agc ggt ggt ggt ggt 96
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
agc ggt ggt ggt ggt agc ggt ggt ggt ggt agc ggt ggt ggt gga tcc 144
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
ggc tcg agt gaa atc tgc tgg gga ccc tac agt cac cta atc tct ctc 192
Gly Ser Ser Glu Ile Cys Trp Gly Pro Tyr Ser His Leu Ile Ser Leu
50 55 60
ctt ctc atc ctt ctg ttt cat tca gag gca gcc tgc cgc cct tct ggg 240
Leu Leu Ile Leu Leu Phe His Ser Glu Ala Ala Cys Arg Pro Ser Gly
65 70 75 80
aaa aga ccc tgc aag atg caa gcc ttc aga atc tgg gat act aac cag 288
Lys Arg Pro Cys Lys Met Gln Ala Phe Arg Ile Trp Asp Thr Asn Gln
85 90 95
aag acc ttt tac ctg aga aac aac cag ctc att gct ggg tac tta caa 336
Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu Ile Ala Gly Tyr Leu Gln
100 105 110
gga cca aat atc aaa cta gaa gaa aag ata gac atg gtg cct att gac 384
Gly Pro Asn Ile Lys Leu Glu Glu Lys Ile Asp Met Val Pro Ile Asp
115 120 125
ctt cat agt gtg ttc ttg ggc atc cac ggg ggc aag ctg tgc ctg tct 432
Leu His Ser Val Phe Leu Gly Ile His Gly Gly Lys Leu Cys Leu Ser
130 135 140
tgt gcc aag tct gga gat gat atc aag ctc cag ctg gag gaa gtt aac 480
Cys Ala Lys Ser Gly Asp Asp Ile Lys Leu Gln Leu Glu Glu Val Asn
145 150 155 160
atc act gat ctg agc aag aac aaa gaa gaa gac aag cgc ttt acc ttc 528
Ile Thr Asp Leu Ser Lys Asn Lys Glu Glu Asp Lys Arg Phe Thr Phe
165 170 175
atc cgc tct gag aaa ggc ccc acc acc agc ttt gag tca gct gcc tgt 576
Ile Arg Ser Glu Lys Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys
180 185 190
cca gga tgg ttc ctc tgc aca aca cta gag gct gac cgt cct gtg agc 624
Pro Gly Trp Phe Leu Cys Thr Thr Leu Glu Ala Asp Arg Pro Val Ser
195 200 205
ctc acc aac aca ccg gaa gag ccc ctt ata gtc acg aag ttc tac ttc 672
Leu Thr Asn Thr Pro Glu Glu Pro Leu Ile Val Thr Lys Phe Tyr Phe
210 215 220
cag gaa gac caa ggc tcg agt gac tac aag gac gat gac gac aag 717
Gln Glu Asp Gln Gly Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
225 230 235
taataa 723
<210> 194
<211> 239
<212> PRT
<213> 人工序列
<220>
<223> 鼠IL-1Ra嵌合构建物
<400> 194
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
20 25 30
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
Gly Ser Ser Glu Ile Cys Trp Gly Pro Tyr Ser His Leu Ile Ser Leu
50 55 60
Leu Leu Ile Leu Leu Phe His Ser Glu Ala Ala Cys Arg Pro Ser Gly
65 70 75 80
Lys Arg Pro Cys Lys Met Gln Ala Phe Arg Ile Trp Asp Thr Asn Gln
85 90 95
Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu Ile Ala Gly Tyr Leu Gln
100 105 110
Gly Pro Asn Ile Lys Leu Glu Glu Lys Ile Asp Met Val Pro Ile Asp
115 120 125
Leu His Ser Val Phe Leu Gly Ile His Gly Gly Lys Leu Cys Leu Ser
130 135 140
Cys Ala Lys Ser Gly Asp Asp Ile Lys Leu Gln Leu Glu Glu Val Asn
145 150 155 160
Ile Thr Asp Leu Ser Lys Asn Lys Glu Glu Asp Lys Arg Phe Thr Phe
165 170 175
Ile Arg Ser Glu Lys Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys
180 185 190
Pro Gly Trp Phe Leu Cys Thr Thr Leu Glu Ala Asp Arg Pro Val Ser
195 200 205
Leu Thr Asn Thr Pro Glu Glu Pro Leu Ile Val Thr Lys Phe Tyr Phe
210 215 220
Gln Glu Asp Gln Gly Ser Ser Asp Tyr Lys Asp Asp Asp Asp Lys
225 230 235
<210> 195
<211> 642
<212> DNA
<213> 人工序列
<220>
<223> 人IL-1Ra嵌合构建物
<220>
<221> CDS
<222> (1)..(636)
<400> 195
atg cat cat cat cat cat cat ggc tcg agt gaa atc tgc aga ggc ctc 48
Met His His His His His His Gly Ser Ser Glu Ile Cys Arg Gly Leu
1 5 10 15
cgc agt cac cta atc act ctc ctc ctc ttc ctg ttc cat tca gag acg 96
Arg Ser His Leu Ile Thr Leu Leu Leu Phe Leu Phe His Ser Glu Thr
20 25 30
atc tgc cga ccc tct ggg aga aaa tcc agc aag atg caa gcc ttc aga 144
Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser Lys Met Gln Ala Phe Arg
35 40 45
atc tgg gat gtt aac cag aag acc ttc tat ctg agg aac aac caa cta 192
Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu
50 55 60
gtt gct gga tac ttg caa gga cca aat gtc aat tta gaa gaa aag ata 240
Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn Leu Glu Glu Lys Ile
65 70 75 80
gat gtg gta ccc att gag cct cat gct ctg ttc ttg gga atc cat gga 288
Asp Val Val Pro Ile Glu Pro His Ala Leu Phe Leu Gly Ile His Gly
85 90 95
ggg aag atg tgc ctg tcc tgt gtc aag tct ggt gat gag acc aga ctc 336
Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly Asp Glu Thr Arg Leu
100 105 110
cag ctg gag gca gtt aac atc actgac ctg agc gag aac aga aag cag 384
Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser Glu Asn Arg Lys Gln
115 120 125
gac aag cgc ttc gcc ttc atc cgc tca gac agc ggc ccc acc acc agt 432
Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser Gly Pro Thr Thr Ser
130 135 140
ttt gag tct gcc gcc tgc ccc ggt tgg ttc ctc tgc aca gcg atg gaa 480
Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu Cys Thr Ala Met Glu
145 150 155 160
gct gac cag ccc gtc agc ctc acc aat atg cct gac gaa ggc gtc atg 528
Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro Asp Glu Gly Val Met
165 170 175
gtc acc aaa ttc tac ttc cag gag gac gag ggc tcg agt gga tcc acc 576
Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu Gly Ser Ser Gly Ser Thr
180 185 190
gct atc gcg att gca gtg gca ctg gct ggt ttc gct acc gta gcg cag 624
Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln
195 200 205
gcc aca aag aaa taataa 642
Ala Thr Lys Lys
210
<210> 196
<211> 212
<212> PRT
<213> 人工序列
<220>
<223> 人IL-1Ra嵌合构建物
<400> 196
Met His His His His His His Gly Ser Ser Glu Ile Cys Arg Gly Leu
1 5 10 15
Arg Ser His Leu Ile Thr Leu Leu Leu Phe Leu Phe His Ser Glu Thr
20 25 30
Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser Lys Met Gln Ala Phe Arg
35 40 45
Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu
50 55 60
Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn Leu Glu Glu Lys Ile
65 70 75 80
Asp Val Val Pro Ile Glu Pro His Ala Leu Phe Leu Gly Ile His Gly
85 90 95
Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly Asp Glu Thr Arg Leu
100 105 110
Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser Glu Asn Arg Lys Gln
115 120 125
Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser Gly Pro Thr Thr Ser
130 135 140
Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu Cys Thr Ala Met Glu
145 150 155 160
Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro Asp Glu Gly Val Met
165 170 175
Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu Gly Ser Ser Gly Ser Thr
180 185 190
Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln
195 200 205
Ala Thr Lys Lys
210
<210> 197
<211> 642
<212> DNA
<213> 人工序列
<220>
<223> 鼠IL-2嵌合构建物
<220>
<221> CDS
<222> (1)..(636)
<400> 197
atg gct tgg cgt cac ccg cag ttc ggt ggt ggc tcg agt tac agc atg 48
Met Ala Trp Arg His Pro Gln Phe Gly Gly Gly Ser Ser Tyr Ser Met
1 5 10 15
cag ctc gca tcc tgt gtc aca ttg aca ctt gtg ctc ctt gtc aac agc 96
Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu Leu Val Asn Ser
20 25 30
gca ccc act tca agc tcc act tca agc tct aca gcg gaa gca cag cag 144
Ala Pro Thr Ser Ser Ser Thr Ser Ser Ser Thr Ala Glu Ala Gln Gln
35 40 45
cag cag cag cag cag cag cag cag cag cag cac ctg gag cag ctg ttg 192
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Leu Glu Gln Leu Leu
50 55 60
atg gac cta cag gag ctc ctg agc agg atg gag aat tac agg aac ctg 240
Met Asp Leu Gln Glu Leu Leu Ser Arg Met Glu Asn Tyr Arg Asn Leu
65 70 75 80
aaa ctc ccc agg atg ctc acc ttc aaa ttt tac ttg ccc aag cag gcc 288
Lys Leu Pro Arg Met Leu Thr Phe Lys Phe Tyr Leu Pro Lys Gln Ala
85 90 95
aca gaa ttg aaa gat ctt cag tgc cta gaa gat gaa ctt gga cct ctg 336
Thr Glu Leu Lys Asp Leu Gln Cys Leu Glu Asp Glu Leu Gly Pro Leu
100 105 110
cgg cat gtt ctg gat ttg act caa agc aaa agc ttt caa ttg gaa gat 384
Arg His Val Leu Asp Leu Thr Gln Ser Lys Ser Phe Gln Leu Glu Asp
115 120 125
gct gag aat ttc atc agc aat atc aga gta act gtt gta aaa cta aag 432
Ala Glu Asn Phe Ile Ser Asn Ile Arg Val Thr Val Val Lys Leu Lys
130 135 140
ggc tct gac aac aca ttt gag tgc caa ttc gat gat gag tca gca act 480
Gly Ser Asp Asn Thr Phe Glu Cys Gln Phe Asp Asp Glu Ser Ala Thr
145 150 155 160
gtg gtg gac ttt ctg agg aga tgg ata gcc ttc tgt caa agc atc atc 528
Val Val Asp Phe Leu Arg Arg Trp Ile Ala Phe Cys Gln Ser Ile Ile
165 170 175
tca aca agc cct caa ggc tcg agt gga tcc ggt ggt ggt gga tcc acc 576
Ser Thr Ser Pro Gln Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Thr
180 185 190
gct atc gcg att gca gtg gca ctg gct ggt ttc gct acc gta gcg cag 624
Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln
195 200 205
gcc aca aag aaa taataa 642
Ala Thr Lys Lys
210
<210> 198
<211> 212
<212> PRT
<213> 人工序列
<220>
<223> 鼠IL-2嵌合构建物
<400> 198
Met Ala Trp Arg His Pro Gln Phe Gly Gly Gly Ser Ser Tyr Ser Met
1 5 10 15
Gln Leu Ala Ser Cys Val Thr Leu Thr Leu Val Leu Leu Val Asn Ser
20 25 30
Ala Pro Thr Ser Ser Ser Thr Ser Ser Ser Thr Ala Glu Ala Gln Gln
35 40 45
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Leu Glu Gln Leu Leu
50 55 60
Met Asp Leu Gln Glu Leu Leu Ser Arg Met Glu Asn Tyr Arg Asn Leu
65 70 75 80
Lys Leu Pro Arg Met Leu Thr Phe Lys Phe Tyr Leu Pro Lys Gln Ala
85 90 95
Thr Glu Leu Lys Asp Leu Gln Cys Leu Glu Asp Glu Leu Gly Pro Leu
100 105 110
Arg His Val Leu Asp Leu Thr Gln Ser Lys Ser Phe Gln Leu Glu Asp
115 120 125
Ala Glu Asn Phe Ile Ser Asn Ile Arg Val Thr Val Val Lys Leu Lys
130 135 140
Gly Ser Asp Asn Thr Phe Glu Cys Gln Phe Asp Asp Glu Ser Ala Thr
145 150 155 160
Val Val Asp Phe Leu Arg Arg Trp Ile Ala Phe Cys Gln Ser Ile Ile
165 170 175
Ser Thr Ser Pro Gln Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Thr
180 185 190
Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln
195 200 205
Ala Thr Lys Lys
210
<210> 199
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> 人IL-2嵌合构建物
<220>
<221> CDS
<222> (1)..(507)
<400> 199
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggc tcg agt cct act tca agt tct aca 96
Thr Val Ala Gln Ala Gly Ser Gly Ser Ser Pro Thr Ser Ser Ser Thr
20 25 30
aag aaa aca cag cta caa ctg gag cat tta ctg ctg gat tta cag atg 144
Lys Lys Thr Gln Leu Gln Leu Glu His Leu Leu Leu Asp Leu Gln Met
35 40 45
att ttg aat gga att aat aat tac aag aat ccc aaa ctc acc agg atg 192
Ile Leu Asn Gly Ile Asn Asn Tyr Lys Asn Pro Lys Leu Thr Arg Met
50 55 60
ctc aca ttt aag ttt tac atg ccc aag aag gcc aca gaa ctg aaa cat 240
Leu Thr Phe Lys Phe Tyr Met Pro Lys Lys Ala Thr Glu Leu Lys His
65 70 75 80
ctt cag tgt cta gaa gaa gaa ctc aaa cct ctg aag gaa gtg cra aat 288
Leu Gln Cys Leu Glu Glu Glu Leu Lys Pro Leu Lys Glu Val Leu Asn
85 90 95
tta gct caa agc aaa aac ttt cac tta aga ccc agg gac tta atc agc 336
Leu Ala Gln Ser Lys Asn Phe His Leu Arg Pro Arg Asp Leu Ile Ser
100 105 110
aat atc aac gta ata gtt ctg gaa cta aag gga tct gaa aca aca ttc 384
Asn Ile Asn Val Ile Val Leu Glu Leu Lys Gly Ser Glu Thr Thr Phe
115 120 125
atg tgt gaa tat gct gat gag aca gca acc att gta gaa ttt ctg aac 432
Met Cys Glu Tyr Ala Asp Glu Thr Ala Thr Ile Val Glu Phe Leu Asn
130 135 140
aga tgg att acc ttt tct caa agc atc atc tca aca ctg act ggc tcg 480
Arg Trp Ile Thr Phe Ser Gln Ser Ile Ile Ser Thr Leu Thr Gly Ser
145 150 155 160
agt gac tac aag gac gat gac gac aag taataa 513
Ser Asp Tyr Lys Asp Asp Asp Asp Lys
165
<210> 200
<211> 169
<212> PRT
<213> 人工序列
<220>
<223> 人IL-2嵌合构建物
<400> 200
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Ser Ser Pro Thr Ser Ser Ser Thr
20 25 30
Lys Lys Thr Gln Leu Gln Leu Glu His Leu Leu Leu Asp Leu Gln Met
35 40 45
Ile Leu Asn Gly Ile Asn Asn Tyr Lys Asn Pro Lys Leu Thr Arg Met
50 55 60
Leu Thr Phe Lys Phe Tyr Met Pro Lys Lys Ala Thr Glu Leu Lys His
65 70 75 80
Leu Gln Cys Leu Glu Glu Glu Leu Lys Pro Leu Lys Glu Val Leu Asn
85 90 95
Leu Ala Gln Ser Lys Asn Phe His Leu Arg Pro Arg Asp Leu Ile Ser
100 105 110
Asn Ile Asn Val Ile Val Leu Glu Leu Lys Gly Ser Glu Thr Thr Phe
115 120 125
Met Cys Glu Tyr Ala Asp Glu Thr Ala Thr Ile Val Glu Phe Leu Asn
130 135 140
Arg Trp Ile Thr Phe Ser Gln Ser Ile Ile Ser Thr Leu Thr Gly Ser
145 150 155 160
Ser Asp Tyr Lys Asp Asp Asp Asp Lys
165
<210> 201
<211> 960
<212> DNA
<213> 人工序列
<220>
<223> 鼠Fas-L嵌合构建物
<220>
<221> CDS
<222> (1)..(954)
<400> 201
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggt ggt ggt gga tcc ggc tcg agt cag 96
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Gln
20 25 30
cag ccc atg aat tac cca tgt ccc cag atc ttc tgg gta gac agc agt 144
Gln Pro Met Asn Tyr Pro Cys Pro Gln Ile Phe Trp Val Asp Ser Ser
35 40 45
gcc act tca tct tgg gct cct cca ggg tca gtt ttt ccc tgt cca tct 192
Ala Thr Ser Ser Trp Ala Pro Pro Gly Ser Val Phe Pro Cys Pro Ser
50 55 60
tgt ggg cct aga ggg ccg gac caa agg aga ccg cca cct cca cca cca 240
Cys Gly Pro Arg Gly Pro Asp Gln Arg Arg Pro Pro Pro Pro Pro Pro
65 70 75 80
cct gtg tca cca cta cca ccg cca tca caa cca ctc cca ctg ccg cca 288
Pro Val Ser Pro Leu Pro Pro Pro Ser Gln Pro Leu Pro Leu Pro Pro
85 90 95
ctg acc cct cta aag aag aag gac cac aac aca aat ctg tgg cta ccg 336
Leu Thr Pro Leu Lys Lys Lys Asp His Asn Thr Asn Leu Trp Leu Pro
100 105 110
gtg gta ttt ttc atg gtt ctg gtg gct ctg gtt gga atg gga tta gga 384
Val Val Phe Phe Met Val Leu Val Ala Leu Val Gly Met Gly Leu Gly
115 120 125
atg tat cag ctc ttc cac ctg cag aag gaa ctg gca gaa ctc cgt gag 432
Met Tyr Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu Leu Arg Glu
130 135 140
ttc acc aac caa agc ctt aaa gta tca tct ttt gaa aag caa ata gcc 480
Phe Thr Asn Gln Ser Leu Lys Val Ser Ser Phe Glu Lys Gln Ile Ala
145 150 155 160
aac ccc agt aca ccc tct gaa aaa aaa gag ccg agg agt gtg gcc cat 528
Asn Pro Ser Thr Pro Ser Glu Lys Lys Glu Pro Arg Ser Val Ala His
165 170 175
tta aca ggg aac ccc cac tca agg tcc atc cct ctg gaa tgg gaa gac 576
Leu Thr Gly Asn Pro His Ser Arg Ser Ile Pro Leu Glu Trp Glu Asp
180 185 190
aca tat gga acc gct ctg atc tct gga gtg aag tat aag aaa ggt ggc 624
Thr Tyr Gly Thr Ala Leu Ile Ser Gly Val Lys Tyr Lys Lys Gly Gly
195 200 205
ctt gtg atc aac gaa act ggg ttg tac ttc gtg tat tcc aaa gta tac 672
Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser Lys Val Tyr
210 215 220
ttc cgg ggt cag tct tgc aac aac cag ccc cta aac cac aag gtc tat 720
Phe Arg Gly Gln Ser Cys Asn Asn Gln Pro Leu Asn His Lys Val Tyr
225 230 235 240
atg agg aac tct aag tat cct gag gat ctg gtg cta atg gag gag aag 768
Met Arg Asn Ser Lys Tyr Pro Glu Asp Leu Val Leu Met Glu Glu Lys
245 250 255
agg ttg aac tac tgc act act gga cag ata tgg gcc cac agc agc tac 816
Arg Leu Asn Tyr Cys Thr Thr Gly Gln Ile Trp Ala His Ser Ser Tyr
260 265 270
ctg ggg gca gta ttc aat ctt acc agt gct gac cat tta tat gtc aac 864
Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu Tyr Val Asn
275 280 285
ata tct caa ctc tct ctg atc aat ttt gag gaa tct aag acc ttt ttc 912
Ile Ser Gln Leu Ser Leu Ile Asn Phe Glu Glu Ser Lys Thr Phe Phe
290 295 300
ggc ttg tat aag ctt ggc tcg agt cat cat cat cat cat cat taa taa 960
Gly Leu Tyr Lys Leu Gly Ser Ser His His His His His His
305 310 315
<210> 202
<211> 318
<212> PRT
<213> 人工序列
<220>
<223> 鼠Fas-L嵌合构建物
<400> 202
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Gln
20 25 30
Gln Pro Met Asn Tyr Pro Cys Pro Gln Ile Phe Trp Val Asp Ser Ser
35 40 45
Ala Thr Ser Ser Trp Ala Pro Pro Gly Ser Val Phe Pro Cys Pro Ser
50 55 60
Cys Gly Pro Arg Gly Pro Asp Gln Arg Arg Pro Pro Pro Pro Pro Pro
65 70 75 80
Pro Val Ser Pro Leu Pro Pro Pro Ser Gln Pro Leu Pro Leu Pro Pro
85 90 95
Leu Thr Pro Leu Lys Lys Lys Asp His Asn Thr Asn Leu Trp Leu Pro
100 105 110
Val Val Phe Phe Met Val Leu Val Ala Leu Val Gly Met Gly Leu Gly
115 120 125
Met Tyr Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu Leu Arg Glu
130 135 140
Phe Thr Asn Gln Ser Leu Lys Val Ser Ser Phe Glu Lys Gln Ile Ala
145 150 155 160
Asn Pro Ser Thr Pro Ser Glu Lys Lys Glu Pro Arg Ser Val Ala His
165 170 175
Leu Thr Gly Asn Pro His Ser Arg Ser Ile Pro Leu Glu Trp Glu Asp
180 185 190
Thr Tyr Gly Thr Ala Leu Ile Ser Gly Val Lys Tyr Lys Lys Gly Gly
195 200 205
Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser Lys Val Tyr
210 215 220
Phe Arg Gly Gln Ser Cys Asn Asn Gln Pro Leu Asn His Lys Val Tyr
225 230 235 240
Met Arg Asn Ser Lys Tyr Pro Glu Asp Leu Val Leu Met Glu Glu Lys
245 250 255
Arg Leu Asn Tyr Cys Thr Thr Gly Gln Ile Trp Ala His Ser Ser Tyr
260 265 270
Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu Tyr Val Asn
275 280 285
Ile Ser Gln Leu Ser Leu Ile Asn Phe Glu Glu Ser Lys Thr Phe Phe
290 295 300
Gly Leu Tyr Lys Leu Gly Ser Ser His His His His His His
305 310 315
<210> 203
<211> 993
<212> DNA
<213> 人工序列
<220>
<223> 人Fas-L嵌合构建物
<220>
<221> CDS
<222> (1)..(987)
<400> 203
atg gct tgg cgt cac ccg cag ttc ggt ggt ggc tcg agt cag cag ccc 48
Met Ala Trp Arg His Pro Gln Phe Gly Gly Gly Ser Ser Gln Gln Pro
1 5 10 15
ttc aat tac cca tat ccc cag atc tac tgg gtg gac agc agt gcc agc 96
Phe Asn Tyr Pro Tyr Pro Gln Ile Tyr Trp Val Asp Ser Ser Ala Ser
20 25 30
tct ccc tgg gcc cct cca ggc aca gtt ctt ccc tgt cca acc tct gtg 144
Ser Pro Trp Ala Pro Pro Gly Thr Val Leu Pro Cys Pro Thr Ser Val
35 40 45
ccc aga agg cct ggt caa agg agg cca cca cca cca ccg cca ccg cca 192
Pro Arg Arg Pro Gly Gln Arg Arg Pro Pro Pro Pro Pro Pro Pro Pro
50 55 60
cca cta cca cct ccg ccg ccg ccg cca cca ctg cctcca cta ccg ctg 240
Pro Leu Pro Pro Pro Pro Pro Pro Pro Pro Leu Pro Pro Leu Pro Leu
65 70 75 80
cca ccc ctg aag aag aga ggg aac cac agc aca ggc ctg tgt ctc ctt 288
Pro Pro Leu Lys Lys Arg Gly Asn His Ser Thr Gly Leu Cys Leu Leu
85 90 95
gtg atg ttt ttc atg gtt ctg gtt gcc ttg gta gga ttg ggc ctg ggg 336
Val Met Phe Phe Met Val Leu Val Ala Leu Val Gly Leu Gly Leu Gly
100 105 110
atg ttt cag ctc ttc cac cta cag aag gag ctg gca gaa ctc cga gag 384
Met Phe Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu Leu Arg Glu
115 120 125
tct acc agc cag atg cac aca gca tca tct ttg gag aag caa ata ggc 432
Ser Thr Ser Gln Met His Thr Ala Ser Ser Leu Glu Lys Gln Ile Gly
130 135 140
cac ccc agt cca ccc cct gaa aaa aag gag ctg agg aaa gtg gcc cat 480
His Pro Ser Pro Pro Pro Glu Lys Lys Glu Leu Arg Lys Val Ala His
145 150 155 160
tta aca ggc aag tcc aac tca agg tcc atg cct ctg gaa tgg gaa gac 528
Leu Thr Gly Lys Ser Asn Ser Arg Ser Met Pro Leu Glu Trp Glu Asp
165 170 175
acc tat gga att gtc ctg ctt tct gga gtg aag tat aag aag ggt ggc 576
Thr Tyr Gly Ile Val Leu Leu Ser Gly Val Lys Tyr Lys Lys Gly Gly
180 185 190
ctt gtg atc aat gaa act ggg ctg tac ttt gta tat tcc aaa gta tac 624
Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser Lys Val Tyr
195 200 205
ttc cgg ggt caa tct tgc aac aac ctg ccc ctg agc cac aag gtc tac 672
Phe Arg Gly Gln Ser Cys Asn Asn Leu Pro Leu Ser His Lys Val Tyr
210 215 220
atg agg aac tct aag tat ccc cag gat ctg gtg atg atg gag ggg aag 720
Met Arg Asn Ser Lys Tyr Pro Gln Asp Leu Val Met Met Glu Gly Lys
225 230 235 240
atg atg agc tac tgc act act ggg cag atg tgg gcc cgc agc agc tac 768
Met Met Ser Tyr Cys Thr Thr Gly Gln Met Trp Ala Arg Ser Ser Tyr
245 250 255
ctg ggg gca gtg ttc aat ctt acc agt gct gat cat tta tat gtc aac 816
Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu Tyr Val Asn
260 265 270
gta tct gag ctc tct ctg gtc aat ttt gag gaa tct cag acg ttt ttc 864
Val Ser Glu Leu Ser Leu Val Asn Phe Glu Glu Ser Gln Thr Phe Phe
275 280 285
ggc tta tat aag ctc ggc tcg agt gga tcc ggt ggt ggt ggt agc ggt 912
Gly Leu Tyr Lys Leu Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly
290 295 300
ggt ggt gga tcc acc gct atc gcg att gca gtg gca ctg gct ggt ttc 960
Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe
305 310 315 320
gct acc gta gcg cag gcc aca aag aaa taataa 993
Ala Thr Val Ala Gln Ala Thr Lys Lys
325
<210> 204
<211> 329
<212> PRT
<213> 人工序列
<220>
<223> 人Fas-L嵌合构建物
<400> 204
Met Ala Trp Arg His Pro Gln Phe Gly Gly Gly Ser Ser Gln Gln Pro
1 5 10 15
Phe Asn Tyr Pro Tyr Pro Gln Ile Tyr Trp Val Asp Ser Ser Ala Ser
20 25 30
Ser Pro Trp Ala Pro Pro Gly Thr Val Leu Pro Cys Pro Thr Ser Val
35 40 45
Pro Arg Arg Pro Gly Gln Arg Arg Pro Pro Pro Pro Pro Pro Pro Pro
50 55 60
Pro Leu Pro Pro Pro Pro Pro Pro Pro Pro Leu Pro Pro Leu Pro Leu
65 70 75 80
Pro Pro Leu Lys Lys Arg Gly Asn His Ser Thr Gly Leu Cys Leu Leu
85 90 95
Val Met Phe Phe Met Val Leu Val Ala Leu Val Gly Leu Gly Leu Gly
100 105 110
Met Phe Gln Leu Phe His Leu Gln Lys Glu Leu Ala Glu Leu Arg Glu
115 120 125
Ser Thr Ser Gln Met His Thr Ala Ser Ser Leu Glu Lys Gln Ile Gly
130 135 140
His Pro Ser Pro Pro Pro Glu Lys Lys Glu Leu Arg Lys Val Ala His
145 150 155 160
Leu Thr Gly Lys Ser Asn Ser Arg Ser Met Pro Leu Glu Trp Glu Asp
165 170 175
Thr Tyr Gly Ile Val Leu Leu Ser Gly Val Lys Tyr Lys Lys Gly Gly
180 185 190
Leu Val Ile Asn Glu Thr Gly Leu Tyr Phe Val Tyr Ser Lys Val Tyr
195 200 205
Phe Arg Gly Gln Ser Cys Asn Asn Leu Pro Leu Ser His Lys Val Tyr
210 215 220
Met Arg Asn Ser Lys Tyr Pro Gln Asp Leu Val Met Met Glu Gly Lys
225 230 235 240
Met Met Ser Tyr Cys Thr Thr Gly Gln Met Trp Ala Arg Ser Ser Tyr
245 250 255
Leu Gly Ala Val Phe Asn Leu Thr Ser Ala Asp His Leu Tyr Val Asn
260 265 270
Val Ser Glu Leu Ser Leu Val Asn Phe Glu Glu Ser Gln Thr Phe Phe
275 280 285
Gly Leu Tyr Lys Leu Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Gly
290 295 300
Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe
305 310 315 320
Ala Thr Val Ala Gln Ala Thr Lys Lys
325
<210> 205
<211> 633
<212> DNA
<213> 人工序列
<220>
<223> HEL嵌合构建物
<220>
<221> CDS
<222> (1)..(627)
<400> 205
atg gac tac aag gac gat gac gac aag ggc tcg agt agg tct ttg cta 48
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Arg Ser Leu Leu
1 5 10 15
atc ttg gtg ctt tgc ttc ctg ccc ctg gct gct ctg ggg aaa gtc ttt 96
Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala Leu Gly Lys Val Phe
20 25 30
gga cga tgt gag ctg gca gcg gct atg aag cgt cac gga ctt gat aac 144
Gly Arg Cys Glu Leu Ala Ala Ala Met Lys Arg His Gly Leu Asp Asn
35 40 45
tat cgg gga tac agc ctg gga aac tgg gtg tgt gtt gca aaa ttc gag 192
Tyr Arg Gly Tyr Ser Leu Gly Asn Trp Val Cys Val Ala Lys Phe Glu
50 55 60
agt aac ttc aac acc cag gct aca aac cgt aac acc gat ggg agt acc 240
Ser Asn Phe Asn Thr Gln Ala Thr Asn Arg Asn Thr Asp Gly Ser Thr
65 70 75 80
gac tac gga atc cta cag atc aac agc cgc tgg tgg tgc aac gat ggc 288
Asp Tyr Gly Ile Leu Gln Ile Asn Ser Arg Trp Trp Cys Asn Asp Gly
85 90 95
agg acc cca ggc tcc agg aac ctg tgc aac atc ccg tgc tca gcc ctg 336
Arg Thr Pro Gly Ser Arg Asn Leu Cys Asn Ile Pro Cys Ser Ala Leu
100 105 110
ctg agc tca gac ata aca gcg agc gtg aac tgc gcg aag aag atc gtc 384
Leu Ser Ser Asp Ile Thr Ala Ser Val Asn Cys Ala Lys Lys Ile Val
115 120 125
agc gat gga aac ggc atg agc gcg tgg gtc gcc tgg cgc aac cgc tgc 432
Ser Asp Gly Asn Gly Met Ser Ala Trp Val Ala Trp Arg Asn Arg Cys
130 135 140
aag ggt acc gac gtc cag gcg tgg atc aga ggc tgc cgg ctg ggc tcg 480
Lys Gly Thr Asp Val Gln Ala Trp Ile Arg Gly Cys Arg Leu Gly Ser
145 150 155 160
agt gga tcc ggt ggt ggt ggt agc ggt ggt ggt ggt agc ggt ggt ggt 528
Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
165 170 175
ggt agc ggt ggt ggt ggt agc ggt ggt ggt gga tcc acc gct atc gcg 576
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala
180 185 190
att gca gtg gca ctg gct ggt ttc gct acc gta gcg cag gcc aca aag 624
Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys
195 200 205
aaa taataa 633
Lys
<210> 206
<211> 209
<212> PRT
<213> 人工序列
<220>
<223> HEL嵌合构建物
<400> 206
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Arg Ser Leu Leu
1 5 10 15
Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala Leu Gly Lys Val Phe
20 25 30
Gly Arg Cys Glu Leu Ala Ala Ala Met Lys Arg His Gly Leu Asp Asn
35 40 45
Tyr Arg Gly Tyr Ser Leu Gly Asn Trp Val Cys Val Ala Lys Phe Glu
50 55 60
Ser Asn Phe Asn Thr Gln Ala Thr Asn Arg Asn Thr Asp Gly Ser Thr
65 70 75 80
Asp Tyr Gly Ile Leu Gln Ile Asn Ser Arg Trp Trp Cys Asn Asp Gly
85 90 95
Arg Thr Pro Gly Ser Arg Asn Leu Cys Asn Ile Pro Cys Ser Ala Leu
100 105 110
Leu Ser Ser Asp Ile Thr Ala Ser Val Asn Cys Ala Lys Lys Ile Val
115 120 125
Ser Asp Gly Asn Gly Met Ser Ala Trp Val Ala Trp Arg Asn Arg Cys
130 135 140
Lys Gly Thr Asp Val Gln Ala Trp Ile Arg Gly Cys Arg Leu Gly Ser
145 150 155 160
Ser Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
165 170 175
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala
180 185 190
Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys
195 200 205
Lys
<210> 207
<211> 282
<212> DNA
<213> 小鼠
<220>
<221> CDS
<222> (1)..(282)
<400> 207
aag att tcc aca ctt cta tgc ctc ctg ctc ata gct acc acc atc agt 48
Lys Ile Ser Thr Leu Leu Cys Leu Leu Leu Ile Ala Thr Thr Ile Ser
1 5 10 15
cct cag gta ttg gct gga cca gat gcg gtg agc acc cca gtc acg tgc 96
Pro Gln Val Leu Ala Gly Pro Asp Ala Val Ser Thr Pro Val Thr Cys
20 25 30
tgt tat aat gtt gtt aag cag aag att cac gtc cgg aag ctg aag agc 144
Cys Tyr Asn Val Val Lys Gln Lys Ile His Val Arg Lys Leu Lys Ser
35 40 45
tac agg aga atc aca agc agc cag tgt ccc cgg gaa gct gtg atc ttc 192
Tyr Arg Arg Ile Thr Ser Ser Gln Cys Pro Arg Glu Ala Val Ile Phe
50 55 60
agg acc ata ctg gat aag gag atc tgt gct gac ccc aag gag aag tgg 240
Arg Thr Ile Leu Asp Lys Glu Ile Cys Ala Asp Pro Lys Glu Lys Trp
65 70 75 80
gtt aag aat tcc ata aac cac ttg gat aag acg tct cga acg 282
Val Lys Asn Ser Ile Asn His Leu Asp Lys Thr Ser Arg Thr
85 90
<210> 208
<211> 94
<212> PRT
<213> 小鼠
<400> 208
Lys Ile Ser Thr Leu Leu Cys Leu Leu Leu Ile Ala Thr Thr Ile Ser
1 5 10 15
Pro Gln Val Leu Ala Gly Pro Asp Ala Val Ser Thr Pro Val Thr Cys
20 25 30
Cys Tyr Asn Val Val Lys Gln Lys Ile His Val Arg Lys Leu Lys Ser
35 40 45
Tyr Arg Arg Ile Thr Ser Ser Gln Cys Pro Arg Glu Ala Val Ile Phe
50 55 60
Arg Thr Ile Leu Asp Lys Glu Ile Cys Ala Asp Pro Lys Glu Lys Trp
65 70 75 80
Val Lys Asn Ser Ile Asn His Leu Asp Lys Thr Ser Arg Thr
85 90
<210> 209
<211> 294
<212> DNA
<213> 人
<220>
<221> CDS
<222> (1)..(294)
<400> 209
aaa gtc tct gcc gcc ctt ctg tgc ctg ctg ctc ata gca gcc acc ttc 48
Lys Val Ser Ala Ala Leu Leu Cys Leu Leu Leu Ile Ala Ala Thr Phe
1 5 10 15
att ccc caa ggg ctc gct cag cca gat gca atc aat gcc cca gtc acc 96
Ile Pro Gln Gly Leu Ala Gln Pro Asp Ala Ile Asn Ala Pro Val Thr
20 25 30
tgc tgt tat aac ttc acc aat agg aag atc tca gtg cag agg ctc gcg 144
Cys Cys Tyr Asn Phe Thr Asn Arg Lys Ile Ser Val Gln Arg Leu Ala
35 40 45
agc tat aga aga atc acc agc agc aag tgt ccc aaa gaa gct gtg atc 192
Ser Tyr Arg Arg Ile Thr Ser Ser Lys Cys Pro Lys Glu Ala Val Ile
50 55 60
ttc aag acc att gtg gcc aag gag atc tgt gct gac ccc aag cag aag 240
Phe Lys Thr Ile Val Ala Lys Glu Ile Cys Ala Asp Pro Lys Gln Lys
65 70 75 80
tgg gtt cag gat tcc atg gac cac ctg gac aag caa acc caa act ccg 288
Trp Val Gln Asp Ser Met Asp His Leu Asp Lys Gln Thr Gln Thr Pro
85 90 95
aag act 294
Lys Thr
<210> 210
<211> 98
<212> PRT
<213> 人
<400> 210
Lys Val Ser Ala Ala Leu Leu Cys Leu Leu Leu Ile Ala Ala Thr Phe
1 5 10 15
Ile Pro Gln Gly Leu Ala Gln Pro Asp Ala Ile Asn Ala Pro Val Thr
20 25 30
Cys Cys Tyr Asn Phe Thr Asn Arg Lys Ile Ser Val Gln Arg Leu Ala
35 40 45
Ser Tyr Arg Arg Ile Thr Ser Ser Lys Cys Pro Lys Glu Ala Val Ile
50 55 60
Phe Lys Thr Ile Val Ala Lys Glu Ile Cys Ala Asp Pro Lys Gln Lys
65 70 75 80
Trp Val Gln Asp Ser Met Asp His Leu Asp Lys Gln Thr Gln Thr Pro
85 90 95
Lys Thr
<210> 211
<211> 402
<212> DNA
<213> 人工序列
<220>
<223> 鼠MCP-1嵌合构建物
<220>
<221> CDS
<222> (1)..(396)
<400> 211
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggc tcg agt aag att tcc aca ctt cta 96
Thr Val Ala Gln Ala Gly Ser Gly Ser Ser Lys Ile Ser Thr Leu Leu
20 25 30
tgc ctc ctg ctc ata gct acc acc atc agt cct cag gta ttg gct gga 144
Cys Leu Leu Leu Ile Ala Thr Thr Ile Ser Pro Gln Val Leu Ala Gly
35 40 45
cca gat gcg gtg agc acc cca gtc acg tgc tgt tat aat gtt gtt aag 192
Pro Asp Ala Val Ser Thr Pro Val Thr Cys Cys Tyr Asn Val Val Lys
50 55 60
cag aag att cac gtc cgg aag ctg aag agc tac agg aga atc aca agc 240
Gln Lys Ile His Val Arg Lys Leu Lys Ser Tyr Arg Arg Ile Thr Ser
65 70 75 80
agc cag tgt ccc cgg gaa gct gtg atc ttc agg acc ata ctg gat aag 288
Ser Gln Cys Pro Arg Glu Ala Val Ile Phe Arg Thr Ile Leu Asp Lys
85 90 95
gag atc tgt gct gac ccc aag gag aag tgg gtt aag aat tcc ata aac 336
Glu Ile Cys Ala Asp Pro Lys Glu Lys Trp Val Lys Asn Ser Ile Asn
100 105 110
cac ttg gat aag acg tct cga acg ggc tcg agt gct tgg cgt cac ccg 384
His Leu Asp Lys Thr Ser Arg Thr Gly Ser Ser Ala Trp Arg His Pro
115 120 125
cag ttc ggt ggt taa taa 402
Gln Phe Gly Gly
130
<210> 212
<211> 132
<212> PRT
<213> 人工序列
<220>
<223> 鼠MCP-1嵌合构建物
<400> 212
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Ser Ser Lys Ile Ser Thr Leu Leu
20 25 30
Cys Leu Leu Leu Ile Ala Thr Thr Ile Ser Pro Gln Val Leu Ala Gly
35 40 45
Pro Asp Ala Val Ser Thr Pro Val Thr Cys Cys Tyr Asn Val Val Lys
50 55 60
Gln Lys Ile His Val Arg Lys Leu Lys Ser Tyr Arg Arg Ile Thr Ser
65 70 75 80
Ser Gln Cys Pro Arg Glu Ala Val Ile Phe Arg Thr Ile Leu Asp Lys
85 90 95
Glu Ile Cys Ala Asp Pro Lys Glu Lys Trp Val Lys Asn Ser Ile Asn
100 105 110
His Leu Asp Lys Thr Ser Arg Thr Gly Ser Ser Ala Trp Arg His Pro
115 120 125
Gln Phe Gly Gly
130
<210> 213
<211> 405
<212> DNA
<213> 人工序列
<220>
<223> 人MCP-1嵌合构建物
<220>
<221> CDS
<222> (1)..(399)
<400> 213
atg aaa aag aca gct atc gcg att gca gtg gca ctg gct ggt ttc gct 48
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
acc gta gcg cag gcc gga tcc ggc tcg agt aaa gtc tct gcc gcc ctt 96
Thr Val Ala Gln Ala Gly Ser Gly Ser Ser Lys Val Ser Ala Ala Leu
20 25 30
ctg tgc ctg ctg ctc ata gca gcc acc ttc att ccc caa ggg ctc gct 144
Leu Cys Leu Leu Leu Ile Ala Ala Thr Phe Ile Pro Gln Gly Leu Ala
35 40 45
cag cca gat gca atc aat gcc cca gtc acc tgc tgt tat aac ttc acc 192
Gln Pro Asp Ala Ile Asn Ala Pro Val Thr Cys Cys Tyr Asn Phe Thr
50 55 60
aat agg aag atc tca gtg cag agg ctc gcg agc tat aga aga atc acc 240
Asn Arg Lys Ile Ser Val Gln Arg Leu Ala Ser Tyr Arg Arg Ile Thr
65 70 75 80
agc agc aag tgt ccc aaa gaa gct gtg atc ttc aag acc att gtg gcc 288
Ser Ser Lys Cys Pro Lys Glu Ala Val Ile Phe Lys Thr Ile Val Ala
85 90 95
aag gag atc tgt gct gac ccc aag cag aag tgg gtt cag gat tcc atg 336
Lys Glu Ile Cys Ala Asp Pro Lys Gln Lys Trp Val Gln Asp Ser Met
100 105 110
gac cac ctg gac aag caa acc caa act ccg aag act ggc tcg agt cat 384
Asp His Leu Asp Lys Gln Thr Gln Thr Pro Lys Thr Gly Ser Ser His
115 120 125
cat cat cat cat cat taataa 405
His His His His His
130
<210> 214
<211> 133
<212> PRT
<213> 人工序列
<220>
<223> 人MCP-1嵌合构建物
<400> 214
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Gly Ser Gly Ser Ser Lys Val Ser Ala Ala Leu
20 25 30
Leu Cys Leu Leu Leu Ile Ala Ala Thr Phe Ile Pro Gln Gly Leu Ala
35 40 45
Gln Pro Asp Ala Ile Asn Ala Pro Val Thr Cys Cys Tyr Asn Phe Thr
50 55 60
Asn Arg Lys Ile Ser Val Gln Arg Leu Ala Ser Tyr Arg Arg Ile Thr
65 70 75 80
Ser Ser Lys Cys Pro Lys Glu Ala Val Ile Phe Lys Thr Ile Val Ala
85 90 95
Lys Glu Ile Cys Ala Asp Pro Lys Gln Lys Trp Val Gln Asp Ser Met
100 105 110
Asp His Leu Asp Lys Gln Thr Gln Thr Pro Lys Thr Gly Ser Ser His
115 120 125
His His His His His
130
<210> 215
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> N-SCE2
<400> 215
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala
20
<210> 216
<211> 69
<212> PRT
<213> 人工序列
<220>
<223> 人ACTH嵌合肽
<400> 216
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Ser Tyr
20 25 30
Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Lys Lys Arg Arg
35 40 45
Pro Val Lys Val Tyr Pro Asn Gly Ala Glu Asp Glu Ser Ala Glu Ala
50 55 60
Phe Pro Leu Glu Phe
65
<210> 217
<211> 65
<212> PRT
<213> 人工序列
<220>
<223> 鼠ACTH嵌合肽
<400> 217
Ser Tyr Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Lys Lys
1 5 10 15
Arg Arg Pro Val Lys Val Tyr Pro Asn Val Ala Glu Asn Glu Ser Ala
20 25 30
Glu Ala Phe Pro Leu Glu Phe Gly Ser Ser Gly Ser Thr Ala Ile Ala
35 40 45
Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys
50 55 60
Lys
65
<210> 218
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> 人αMSH嵌合肽
<400> 218
Ser Tyr Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Ser Ser
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu
20 25 30
Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
35 40
<210> 219
<211> 47
<212> PRT
<213> 人工序列
<220>
<223> 人beta MSH嵌合肽
<400> 219
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Ser Ser Ala Glu Lys Lys Asp Glu Gly
20 25 30
Pro Tyr Arg Met Glu His Phe Arg Trp Gly Ser Pro Pro Lys Asp
35 40 45
<210> 220
<211> 52
<212> PRT
<213> 人工序列
<220>
<223> 鼠beta MSH嵌合肽
<400> 220
Ala Glu Lys Asp Asp Gly Pro Tyr Arg Val Glu His Phe Arg Trp Ser
1 5 10 15
Asn Pro Pro Lys Asp Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Thr
20 25 30
Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln
35 40 45
Ala Thr Lys Lys
50
<210> 221
<211> 37
<212> PRT
<213> 人工序列
<220>
<223> 人gamma MSH嵌合肽
<400> 221
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Ser Ser Tyr Val Met Gly His Phe Arg
20 25 30
Trp Asp Arg Phe Gly
35
<210> 222
<211> 40
<212> PRT
<213> 人工序列
<220>
<223> 人血管紧张肽I嵌合肽
<400> 222
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Asp Arg
20 25 30
Val Tyr Ile His Pro Phe His Leu
35 40
<210> 223
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> 人血管紧张肽II嵌合肽
<400> 223
Asp Arg Val Tyr Ile His Pro Phe Gly Ser Ser Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
20 25 30
Val Ala Gln Ala Thr Lys Lys
35
<210> 224
<211> 37
<212> PRT
<213> 人工序列
<220>
<223> 人血管紧张肽III嵌合肽
<400> 224
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Arg Val
20 25 30
Tyr Ile His Pro Phe
35
<210> 225
<211> 55
<212> PRT
<213> 人工序列
<220>
<223> 人GHRH嵌合肽I
<220>
<221> MOD_RES
<222> (1)..(1)
<223> ACETYLATION
<220>
<221> MOD_RES
<222> (1)..(1)
<223> AMIDATION
<400> 225
Tyr Phe Asp Ala Ile Phe Thr Asn Ser Tyr Arg Lys Val Leu Gly Gln
1 5 10 15
Leu Ser Ala Arg Lys Leu Leu Gln Asp Ile Met Ser Arg Gly Ser Ser
20 25 30
Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
35 40 45
Val Ala Gln Ala Thr Lys Lys
50 55
<210> 226
<211> 70
<212> PRT
<213> 人工序列
<220>
<223> 人GHRH嵌合肽II
<400> 226
Tyr Ala Asp Ala Ile Phe Thr Asn Ser Tyr Arg Lys Val Leu Gly Gln
1 5 10 15
Leu Ser Ala Arg Lys Leu Leu Gln Asp Ile Met Ser Arg Gln Gln Gly
20 25 30
Glu Ser Asn Gln Glu Arg Gly Ala Arg Ala Arg Leu Gly Ser Ser Gly
35 40 45
Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val
50 55 60
Ala Gln Ala Thr Lys Lys
65 70
<210> 227
<211> 67
<212> PRT
<213> 人工序列
<220>
<223> 鼠GHRH嵌合肽
<400> 227
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Ser Ser His Val Asp Ala Ile Phe Thr
20 25 30
Thr Asn Tyr Arg Lys Leu Leu Ser Gln Leu Tyr Ala Arg Lys Val Ile
35 40 45
Gln Asp Ile Met Asn Lys Gln Gly Glu Arg Ile Gln Glu Gln Arg Ala
50 55 60
Arg Leu Ser
65
<210> 228
<211> 35
<212> PRT
<213> 人工序列
<220>
<223> 人IL-1 beta嵌合肽I
<400> 228
Val Gln Gly Glu Glu Ser Asn Asp Lys Gly Ser Ser Gly Ser Thr Ala
1 5 10 15
Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala
20 25 30
Thr Lys Lys
35
<210> 229
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 人IL-1 beta嵌合肽II
<400> 229
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Leu Lys
20 25 30
Glu Lys Asn Leu Tyr Leu Ser Cys Val Leu Lys Asp Asp Lys Pro Thr
35 40 45
Leu Gln Leu Glu Ser Val Asp Pro Lys Asn Tyr Pro
50 55 60
<210> 230
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> 人IL-2嵌合肽I
<400> 230
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Ser Ser Glu Tyr Ala Asp Glu Thr Ala
20 25 30
Thr Ile Val Glu Phe Leu
35
<210> 231
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> 人IL-2嵌合肽II
<400> 231
Ile Leu Asn Gly Ile Asn Asn Tyr Lys Asn Pro Lys Leu Gly Ser Ser
1 5 10 15
Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu
20 25 30
Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
35 40
<210> 232
<211> 41
<212> PRT
<213> 人工序列
<220>
<223> 人IL-2嵌合肽III
<400> 232
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Leu Thr
20 25 30
Phe Lys Phe Tyr Met Pro Lys Lys Ala
35 40
<210> 233
<211> 43
<212> PRT
<213> 人工序列
<220>
<223> 人TNF-α嵌合肽I
<400> 233
Ser Pro Leu Ala Gln Ala Val Arg Ser Ser Ser Arg Gly Ser Ser Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala
20 25 30
Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
35 40
<210> 234
<211> 52
<212> PRT
<213> 人工序列
<220>
<223> 人TNF-α嵌合肽II
<400> 234
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Ser Ser Asp Lys Pro Val Ala His Val
20 25 30
Val Ala Asn Pro Gln Ala Glu Gly Gln Leu Gln Trp Leu Asn Arg Arg
35 40 45
Ala Asn Ala Leu
50
<210> 235
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 人TNF-α嵌合肽III
<400> 235
Arg Arg Ala Asn Ala Leu Leu Ala Asn Gly Val Glu Leu Arg Asp Gly
1 5 10 15
Ser Ser Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val
20 25 30
Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
35 40 45
<210> 236
<211> 54
<212> PRT
<213> 人工序列
<220>
<223> 人Cys-BAFF-R嵌合肽I
<400> 236
Cys Leu Arg Gly Ala Ser Ser Ala Glu Ala Pro Asp Gly Asp Lys Asp
1 5 10 15
Ala Pro Glu Pro Leu Asp Lys Gly Ser Ser Gly Ser Gly Gly Gly Gly
20 25 30
Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val
35 40 45
Ala Gln Ala Thr Lys Lys
50
<210> 237
<211> 56
<212> PRT
<213> 人工序列
<220>
<223> 人Cys-BAFF-R嵌合肽II
<400> 237
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Cys His
20 25 30
Ser Val Pro Val Pro Ala Thr Glu Leu Gly Ser Thr Glu Leu Val Thr
35 40 45
Thr Lys Thr Ala Gly Pro Glu Gln
50 55
<210> 238
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> 人P55-TNF-R嵌合肽
<400> 238
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Leu Pro
20 25 30
Gln Ile Glu Asn Val Lys Gly Thr Glu Asp
35 40
<210> 239
<211> 51
<212> PRT
<213> 人工序列
<220>
<223> 人P75-TNF-R嵌合肽
<400> 239
Ser Met Ala Pro Gly Ala Val His Leu Pro Gln Pro Asp Arg Val Tyr
1 5 10 15
Ile His Pro Phe Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Thr Ala
20 25 30
Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala
35 40 45
Thr Lys Lys
50
<210> 240
<211> 43
<212> PRT
<213> 人工序列
<220>
<223> 人IL-6-R嵌合肽
<400> 240
Thr Ser Leu Pro Val Gln Asp Ser Ser Ser Val Pro Gly Ser Ser Gly
1 5 10 15
Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile Ala Val Ala Leu Ala
20 25 30
Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
35 40
<210> 241
<211> 47
<212> PRT
<213> 人工序列
<220>
<223> L-选择蛋白嵌合肽
<400> 241
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
Gly Ser Ser Cys Gln Lys Leu Asp Lys Ser Phe Ser Met Ile Lys
35 40 45
<210> 242
<211> 50
<212> PRT
<213> 人工序列
<220>
<223> MUC-1嵌合肽
<400> 242
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Gly Val
20 25 30
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
35 40 45
Ala His
50
<210> 243
<211> 48
<212> PRT
<213> 人工序列
<220>
<223> 卵白蛋白嵌合肽I
<400> 243
Ile Ser Gln Ala Val His Ala Ala His Ala Glu Ile Asn Glu Ala Gly
1 5 10 15
Arg Gly Ser Ser Gly Ser Gly Gly Gly Gly Ser Thr Ala Ile Ala Ile
20 25 30
Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala Thr Lys Lys
35 40 45
<210> 244
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> 卵白蛋白嵌合肽II
<400> 244
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Ser Ile
20 25 30
Ile Asn Phe Glu Lys Leu
35
<210> 245
<211> 51
<212> PRT
<213> 人工序列
<220>
<223> HIV gp120嵌合肽I
<400> 245
Tyr Asn Ala Lys Arg Lys Arg Ile His Ile Gln Arg Gly Pro Gly Arg
1 5 10 15
Ala Phe Tyr Thr Thr Lys Asn Ile Ile Gly Ser Ser Gly Ser Thr Ala
20 25 30
Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gln Ala
35 40 45
Thr Lys Lys
50
<210> 246
<211> 49
<212> PRT
<213> 人工序列
<220>
<223> HIV gp120嵌合肽II
<400> 246
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Ser Ser Asn Asn Thr Arg Lys Ser Ile
20 25 30
Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Gly Lys Ile
35 40 45
Gly
<210> 247
<211> 54
<212> PRT
<213> 人工序列
<220>
<223> HIV gp120嵌合肽III
<400> 247
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Cys Gly
20 25 30
Lys Ile Glu Pro Leu Gly Val Ala Pro Thr Lys Ala Lys Arg Arg Val
35 40 45
Val Gln Arg Glu Lys Arg
50
<210> 248
<211> 66
<212> PRT
<213> 人工序列
<220>
<223> HIV gp41嵌合肽
<220>
<221> MOD_RES
<222> (66)..(66)
<223> AMIDATION
<400> 248
Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala Thr
1 5 10 15
Val Ala Gln Ala Gly Ser Gly Gly Gly Gly Ser Gly Ser Ser Arg Val
20 25 30
Thr Ala Ile Glu Lys Tyr Leu Gln Asp Gln Ala Arg Leu Asn Ser Trp
35 40 45
Gly Cys Ala Phe Arg Gln Val Cys His Thr Thr Val Pro Trp Val Asn
50 55 60
Asp Ser
65