具有C型类凝集素结构域的支架结构的蛋白质组合文库

申请号 CN01821632.3 申请日 2001-12-13 公开(公告)号 CN1484698A 公开(公告)日 2004-03-24
申请人 伯瑞恩药物公司; 发明人 M·伊泽罗德特; T·L·霍尔泰特; N·J·H·格拉沃森; H·C·瑟格森;
摘要 本 发明 提供了一族含有CTLD(C型类凝集素结构域)的新颖的 蛋白质 文库,其中沿CTLD中的配基结合位点排列的内部多肽环区为完全或部分随机化的多肽区段所替代。选取四柄蛋白CTLD作为本发明优选实施方案的 框架 ,并且本发明公开了在产生和操作人和鼠四柄蛋白CTLD文库中有用的多种噬菌粒载体。利用重组fd 噬菌体 展示载体, 单体 及三聚体形式的四柄蛋白CTLD有效展示为完全功能形式的基因III融合体。通过在每轮富集中对富集的亚群进行筛选或选择并随后进行扩增,这样通过进行一或多轮富集就可很容易的从展示已对环区进行了随机化的CTLD的载体文库中分离对新配基具有 亲和性 的CTLD衍 生物 。相对于重组 抗体 衍生物,有效生产含有具有新结合特性的CTLD的蛋白产物在简单性、生产成本和效率以及制备和诊断或 治疗 应用方面提供了重要的优势,所述蛋白产物可通过如细菌表达或以单体、三聚体或多聚体形式进行的体外重折叠来制备。
权利要求

1.具有C型类凝集素结构域(CTLD)支架结构的蛋白质,该蛋白 质包含有模型CTLD的变体,其中α-螺旋和β-链以及连接区段保守到 CTLD的支架结构基本维持不变而仅仅通过基酸替代、缺失、插入 或它们的结合来进行环区改变的程度,前提为该蛋白质不是说明书表2 中所列的C型类凝集素蛋白或C型凝集素的任何已知的CTLD环衍生 物。
2.权利要求1的蛋白质,其中所述模型CTLD限定为具有与图1中 例示的二级结构排列相一致的3D结构,其特征为下列主要的二级结构 元件:
以β1、α1、α2、β2、β3、β4和β5的顺序序列排列的5个β-链和2个 α-螺旋,β-链排列在两个反向平行β-折叠片中,一个包含β1和β5,另 一个包含β2、β3和β4,
至少两个二硫桥,一个连接α1和β5,一个连接β3和连接β4与β5的 多肽区段,以及
由两多肽区段组成的环区,环区段A(LSA)连接β2和β3,一般包括 15-70个,或更为少见地包括5-14个氨基酸残基,环区段B(LSB)连 接β3和β4,一般包括5-12个,或更为少见地包括2-4个氨基酸残基。
3.权利要求1的蛋白质,其中模型CTLD限定为展示与以前认定的 CTLD族成员具有序列相似性,表现为有至少22%,优选至少25%, 更优选至少30%的氨基酸序列同一性,并且含有对确定保守的二硫桥 拓扑学所必需的半胱氨酸残基(也即CysI,CysII,CysIII和CysIV), 其中通过与图1中展示的CTLD汇总进行序列比对检验鉴定出由环区及 其侧翼β-链结构元件,鉴定出β2-和β3-链的序列定位,并通过将这些 序列与四残基共有序列β2cseq和β3cseq及一般定位在相对于保守的 CysIII残基为-6--2位点、更为少见地定位于-5--2位点的β4链区段、 以及与表1中阐明和说明书部分叙述的-5和-3位点处特征残基进行 对比而提供进一步的确证。
4.前述任一权利要求的蛋白质,其中模型CTLD的α-螺旋和/或β- 链和/或连接区段中多达10个,优选多达4个,以及更优选1或2个氨基 酸残基被替代、缺失或插入。
5.前述任一权利要求的蛋白质,其中在CTLD的支架结构基本保 持不变的情况下,因在编码CTLD的核苷酸序列中导入一或多个限制 性核酸内切酶识别位点以促进对部分或所有环区的切除以及改变后的 氨基酸序列的插入,从而在模型CTLD的β-链中进行了多达4个残基改 变。
6。前述任一权利要求的蛋白质,其中的模型CTLD为四柄蛋白的 CTLD。
7.权利要求6的蛋白质,其中的模型CTLD为人四柄蛋白的 CTLD,其包括其单体天然肽序列中的氨基酸残基59-180。
8.权利要求6的蛋白质,其中的模型CTLD为鼠四柄蛋白CTLD, 其包括其单体天然肽序列中的氨基酸残基59-180。
9.前述任一权利要求的蛋白质,其进一步包括CTLD变体的N-末 端和/或C-末端延伸。
10.权利要求9的蛋白质,其中该N-末端和/或C-末端延伸效应物、 酶、以及进一步的结合和/或多聚化功能。
11.权利要求9或10的蛋白质,其中该N-末端和/或C-末端延伸为 天然C型类凝集素蛋白或C型凝集素或缺乏功能性跨膜结构域的可溶 性变体的非CTLD部分。
12.前述任一权利要求的蛋白质,其为包含CTLD变体的模的多 聚体。
13.权利要求12的蛋白质,其衍生自天然四柄蛋白三聚体。
14.权利要求7的蛋白质,其衍生自通过对环区氨基酸序列进行改 变而具有SEQ IN NO:13中位点5Glu-位点185Val的氨基酸序列的多 肽htlec。
15.权利要求7的蛋白质,其衍生自通过对环区氨基酸序列进行改 变而具有SEQ IN NO:15中位点5Ala-位点141Val的氨基酸序列的多 肽htCTLD。
16.权利要求7的蛋白质,其衍生自通过对环区氨基酸序列进行改 变而具有SEQ IN NO:09中位点5Glu-位点185Val的氨基酸序列的多 肽hTN。
17.权利要求7的蛋白质,其衍生自通过对环区氨基酸序列进行改 变而具有SEQ IN NO:11中位点5Ala-位点141Val的氨基酸序列的多 肽hTN3。
18.权利要求8的蛋白质,其衍生自通过对环区氨基酸序列进行改 变而具有SEQ IN NO:36中位点5Glu-位点185Val的氨基酸序列的多 肽mtlec。
19.权利要求8的蛋白质,其衍生自通过对环区氨基酸序列进行改 变而具有SEQ IN NO:38中位点5Ala-位点141Val的氨基酸序列的多 肽mtCTLD。
20.具有C型类凝集素结构域(CTLD)的支架结构的蛋白的组合 文库,该蛋白包含模型CTLD变体,其中的α-螺旋和β-链保守到CTLD 的支架结构基本保持不变的程度,但CTLD的环区或部分环区进行了 针对氨基酸序列和/或氨基酸残基数的随机化。
21.权利要求20中的组合文库,其中所述模型CTLD限定为具有与 图1中例示的二级结构排列相一致的3D结构,其特征为有下列主要的二 级结构元件:
以β1、α1、α2、β2、β3、β4和β5的顺序依次排列的5个β-链和2个 α-螺旋,β-链排列在两个反向平行β-折叠片中,一个由β1和β5组成, 另一个由β2、β3和β4组成,
至少两个二硫桥,一个连接α1和β5,一个连接β3和连接β4与β5的 多肽区段,以及
由两多肽区段组成的环区,其中环区段A(LSA)连接β2和β3,一般 包括15-70个,或更为少见地包括5-14个氨基酸残基,环区段B(LSB) 连接β3和β4,一般包括5-12个,或更为少见地包括2-4个氨基酸残 基。
22.权利要求20中的组合文库,其中模型CTLD限定为展示与以前 认定的CTLD族成员具有序列相似性,表现为有至少22%,优选至少 25%,更优选至少30%的氨基酸序列同一性,并且含有对确定保守的 二硫桥拓扑学所必需的半胱氨酸残基(也即CysI,CysII,CysIII和 CysIV),其中通过与图1中展示的CTLD汇总进行序列比对检验鉴定出 环区及其侧翼β-链结构元件,鉴定出β2-和β3-链的序列定位,并通过 将这些序列与四残基共有序列β2cseq和β3cseq及一般定位在相对于 保守的CysIII残基为-6--2位点、更为少见地定位于-5--2位点的β4 链区段、以及表1中阐明和说明书部分叙述的-5和-3位点处特征残 基进行对比而提供进一步的确证。
23.前述权利要求20-22中任一权利要求中的包含CTLD变体的 蛋白的组合文库,其中对模型CTLD的α-螺旋和β-链和连接区段中多达 10个,优选多达4个,更优选1或2个氨基酸残基进行了替代、缺失或插 入。
24.前述权利要求20-23中任一项的包含CTLD变体的蛋白的组 合文库,其中在CTLD的支架结构基本保持不变的情况下,因在编码 CTLD的核苷酸序列中导入一或多个限制性核酸内切酶识别位点以促 进对部分或所有环区的切除以及改变后的氨基酸序列的插入,从而在 模型CTLD的β-链中进行了多达4个残基改变。
25.前述权利要求20-24中任一权利要求中的包括CTLD变体的 蛋白的组合文库,其中的模型CTLD为四柄蛋白的CTLD。
26.权利要求25的蛋白质组合文库,其中的模型CTLD为人四柄蛋 白的CTLD,其包括其单体天然肽序列中的氨基酸残基59-180。
27.权利要求25的蛋白质组合文库,其中的模型CTLD为鼠四柄蛋 白的CTLD,其包括其单体天然肽序列中的氨基酸残基59-180。
28.权利要求20-27的任一权利要求的蛋白质组合文库,其进一 步包括CTLD变体的N-末端和/或C-末端延伸。
29.权利要求28的蛋白质组合文库,其中该N-末端和/或C-末端延 伸包含效应物、酶、以及进一步的结合和/或多聚化功能。
30.权利要求28或29的蛋白质组合文库,其中该N-末端和/或C-末 端延伸为天然C型类凝集素蛋白或C型凝集素或其缺乏功能性跨膜结 构域的可溶性变体的非CTLD部分。
31.权利要求20-30的任一权利要求的蛋白质组合文库,其中所 述蛋白质为包含CTLD变体的模块的多聚体。
32.权利要求31的蛋白质组合文库,其中所述蛋白质衍生自天然 四柄蛋白三聚体。
33.权利要求27的蛋白质组合文库,其中所述蛋白质通过对环区 氨基酸序列和/或氨基酸残基数进行随机化而衍生自具有SEQ IN NO:13中位点5Glu-位点185Val的氨基酸序列的多肽htlec。
34.权利要求27的蛋白质组合文库,其中所述蛋白质通过对环区 氨基酸序列和/或氨基酸残基数进行随机化而衍生自具有SEQ IN NO:15中位点5Ala-位点141Val的氨基酸序列的多肽htCTLD。
35.权利要求27的蛋白质组合文库,其中所述蛋白质通过对环区 氨基酸序列和/或氨基酸残基数进行随机化而衍生自具有SEQ IN NO:09中位点5Glu-位点185Val的氨基酸序列的多肽hTN。
36.权利要求27的蛋白质组合文库,其中所述蛋白质通过对环区 氨基酸序列和/或氨基酸残基数进行随机化而衍生自具有SEQ IN NO:11中位点5Ala-位点141Val的氨基酸序列的多肽hTN3。
37.权利要求28的蛋白质组合文库,其中所述蛋白质通过对环区 氨基酸序列和/或氨基酸残基数进行随机化而衍生自具有SEQ IN NO:36中位点5Glu-位点185Val的氨基酸序列的肽mtlec。
38.权利要求28的蛋白质组合文库,其中所述蛋白质通过对环区 氨基酸序列和/或氨基酸残基数进行随机化而衍生自具有SEQ IN NO:38中位点5Ala-位点141Val的氨基酸序列的肽mtCTLD。
39.天然四柄蛋白的衍生物,其中对CTLD的α-螺旋和/或β-链和/ 或连接区段中多达10个,优选多达4个,更优选1或2个氨基酸残基进行 了替代、缺失或插入,前提是所述衍生物不是说明书表2中所列的(四 柄蛋白chTN)的任何已知CTLD环衍生物。
40.具有SEQ IN NO:13中位点5Glu-位点185Val的氨基酸序列 的人四柄蛋白衍生物,命名为htlec。
41.具有SEQ IN NO:15中位点5Ala-位点141Val的氨基酸序列 的人四柄蛋白衍生物,命名为htCTLD。
42.具有SEQ IN NO:09中的氨基酸序列的人四柄蛋白衍生物,命 名为PhTN。
43.具有SEQ IN NO:11中的氨基酸序列的人四柄蛋白衍生物,命 名为PhTN3。
44.具有SEQ IN NO:13中的氨基酸序列的人四柄蛋白衍生物,命 名为Phtlec。
45.具有SEQ IN NO:15中的氨基酸序列的人四柄蛋白衍生物,命 名为PhtCTLD。
46.具有SEQ IN NO:02中的氨基酸序列的人四柄蛋白衍生物,命 名为FX-htlec。
47.具有SEQ IN NO:04中的氨基酸序列的人四柄蛋白衍生物,命 名为FX-htCTLD。
48.具有SEQ IN NO:36中位点5Glu-位点185Val的氨基酸序列 的鼠四柄蛋白衍生物,命名为mtlec。
49.具有SEQ IN NO:38中位点5Ala-位点141Val的氨基酸序列 的鼠四柄蛋白衍生物,命名为mtCTLD。
50.具有SEQ IN NO:36中的氨基酸序列的鼠四柄蛋白衍生物,命 名为Pmtlec。
51.具有SEQ IN NO:38中的氨基酸序列的鼠四柄蛋白衍生物,命 名为PmtCTLD。
52.具有SEQ IN NO:29中的氨基酸序列的鼠四柄蛋白衍生物,命 名为FX-mtlec。
53.具有SEQ IN NO:31中的氨基酸序列的鼠四柄蛋白衍生物,命 名为FX-mtCTLD。
54.包含编码htlec插入区段、如SEQ ID NO:12中核苷酸20-562所 展示的核苷酸序列的核酸。
55.包含编码htCTLD插入区段、如SEQ ID NO:14中核苷酸20- 430所展示的核苷酸序列的核酸。
56.包含编码mtlec插入区段、如SEQ ID NO:35中核苷酸20-562 所展示的核苷酸序列的核酸。
57.包含编码mtCTLD插入区段、如SEQ ID NO:37中核苷酸20- 430所展示的核苷酸序列的核酸。
58.包含编码权利要求1-19中任一项的蛋白的核苷酸序列的核 酸。
59.编码权利要求20-38中任一项所述组合文库的蛋白的核酸文 库,其中共同组成该核酸文库的核酸组合中的成员能够在展示体系中 表达,而此展示体系能在可展示代表被展示表达产物特性的表型的实 体和它们相应的基因型间提供逻辑、物理或化学联系。
60.权利要求49中的核酸文库,其中所述展示体系可选自:
(I)噬菌体展示体系,如
(1)丝状噬菌体fd,其中的核酸文库插入到
(a)噬菌粒载体,
(b)噬菌体的病毒基因组
(c)以纯化的单或双链形式存在的纯化的病毒核酸,或
(2)噬菌体λ,其中文库插入到
(a)纯化的噬菌体λDNA,或
(b)λ噬菌体颗粒中的核酸;或
(II)病毒展示体系,其中核酸文库插入到真核病毒如杆状病毒的病毒 核酸中;或
(III)基于细胞的展示体系,其中核酸文库插入到或紧邻能够整合到 宿主基因组中或整合到能够在细胞中自身维持并表达且适于在下列细 胞的细胞表面进行细胞表面展示的染色体外元件的核酸载体中:
(a)细菌细胞,
(b)酵母细胞,或
(c)哺乳动物细胞;或
(IV)适于与核糖体相关联的展示的核酸实体,具有核酸文库插入 其中;或
(V)适于与质粒相关联的展示的质粒,具有核酸文库插入其中。
61.权利要求60中的核酸文库,其中噬菌粒载体为Amersham Pharmacia Biotech提供的载体″pCANTAB 5E″(编号为no.27-9401-01) 以与它们的“重组噬菌体抗体体系”结合应用。
62.权利要求1-19中任一权利要求的蛋白的制备方法,其中所述蛋 白质包含至少一或多个相同或不同的、已通过筛选或选择而从一或多 个CTLD文库中分离出来的具有新颖的环区序列的CTLD结构域。
63.权利要求62的蛋白质制备方法,其中通过诱变对至少一个 CTLD结构域进行了进一步修饰
64.权利要求62或63的蛋白质的制备方法,其中含有至少一个 CTLD结构域的蛋白通过化学或酶促偶联或交联而从两或更多个组件 组装成的。
65.权利要求20-38中任一权利要求的组合文库的制备方法,其包 含下列步骤:
1)将编码包含模型CTLD的蛋白的核酸插入到适当的载体中,
2)如果必要,通过定点诱变导入限制性核酸内切酶识别位点,该识 别位点适当的定位在位于编码CTLD环区或其部分的序列末端或附近 的序列中,
3)利用适当的限制性核酸内切酶切出编码环区或其部分的DNA区 段,
4)将DNA区段混合物连接到经限制性消化的载体上,及
5)诱导载体在适当培养基中表达具有CTLD的支架结构的随机化 蛋白。
66.适于制备权利要求20-38中任一项的组合文库的四柄蛋白衍 生物的构建方法,其中已经对编码四柄蛋白衍生物的核酸进行了修饰, 以在编码β2、β3或β4的核酸区段中、或在序列上游或下游距离属于 编码β2、β3或β4的核酸区段的任何核苷酸多达30个核苷酸中产生核 酸内切酶限制性位点。
67.编码四柄蛋白或其CLTD的支架结构基本保持的衍生物的核 苷酸序列用于通过对编码其CTLD环区的核酸序列的全部或部分进行 随机化而制备编码相关蛋白的核苷酸序列文库的用途。
68.权利要求67中的应用,其中核苷酸序列编码哺乳动物四柄蛋 白。
69.权利要求67中的应用,其中核苷酸序列编码人或鼠四柄蛋白。
70.权利要求67中的应用,其中核苷酸序列编码天然四柄蛋白衍 生物,所述衍生物的CTLD的α-螺旋和β-链和连接区段中多达10个,优 选多达4个,更优选1或2个氨基酸残基进行了替代、缺失或插入。
7l.权利要求67中的应用,其中核苷酸序列,如SEQ ID NO:12中 核苷酸20-562所展示的,编码了命名为htlec的人四柄蛋白衍生物。
72.权利要求67中的应用,其中核苷酸序列,如SEQ ID NO:14中 核苷酸20-430所展示的,编码了命名为htCTLD的人四柄蛋白衍生物。
73.权利要求67中的应用,其中核苷酸序列,如SEQ ID NO:35中 核苷酸20-562所展示的,编码了命名为mtlec的鼠四柄蛋白衍生物。
74.权利要求67中的应用,其中核苷酸序列,如SEQ ID NO:37中 核苷酸20-430所展示的,编码了命名为mtCTLD的鼠四柄蛋白衍生 物。
75.筛选权利要求20-38中任一权利要求的组合文库以获得与特 定靶的结合的方法,其包括下列步骤:
1)表达按照权利要求59-61中的任一权利要求的核酸文库以在展 示体系中展示蛋白质文库;
2)将展示的实体集合与适当标记的靶物质进行接触,其中期望分 离对该靶物质有亲和性的CTLD衍生物;
3)利用其上缀合或物理性吸附或附着有所述靶物质的标记作为载 体或其它亲和纯化形式,通过基于亲和性的选择性提取收获对该靶物 质显示亲和性的展示实体亚群,此方法在本领域中通常称为“亲和淘 选”,随后对该亚文库进行重扩增;
4)通过重复多轮淘选和重扩增分离越来越好的结合物,直至获得 少量的良好的候选结合物,
5)如果需要,以单克隆形式分离每个良好的候选结合物,并对其 进行普通的功能和结构定性,从而为最终筛选一或多个优选的产物克 隆作准备。
76.以想要的替代物种相容性框架方式使权利要求1-19任一项的 蛋白或选择自权利要求20-38任一项的组合文库并含有展示所需结合 性质的CTLD变体的蛋白质重定型的方法,包括利用PCR技术、定点 诱变或限制性酶消化而从编码该蛋白的核酸中切出编码替代环区多肽 及任何所需的单框架突变的核酸区段,以及将该核酸区段插入到含有 编码所要的替代CTLD框架之核酸序列的展示或蛋白表达载体中的适 当位点处。

说明书全文

发明领域

本发明描述了一体系,其与产生源自含有所谓的C型类凝集素结 构域(C-type lectin like domain,CTLD)的蛋白的配基结合蛋白单位 的随机化文库有关,并且其中的C型凝集素的糖识别域(carbohydrate recognition domain,CRD)代表了此族蛋白结构域的一个范例。

发明背景

C型类凝集素结构域(CTLD)是在从多种动物中分离的蛋白中 鉴定到的蛋白结构域族(综述参见Drickamer and Taylor(1993)and Drickamer(1999))。最初,CTLD结构域被鉴定为所谓的C型凝集素 (依赖型糖结合蛋白)普遍存在的结构域,并命名为“糖识别域” (“CRD“)。最近,逐渐发现该结构域为多种真核蛋白所共有,其中有 一些并不结合糖部分,因此将此规范的结构域命名为CTLD。
已经报道CTLD结合包括糖、脂、蛋白甚至在内的多种化合物 [Aspberg et al.(1997),Bettler et al.(1992),Ewart et al.(1998), Graversen et al.(1998),Mizumo et al.(1997),Sano et al.(1998),及 Tormo et al.(1999)]。在一些蛋白中只有一个拷贝的CTLD,而其它蛋 白中含有两到多个结构域拷贝。在生理功能单位中,常常可通过将单 拷贝CTLD组装成较大的结构,从而引起CTLD数目增加。
CTLD有约120个基酸残基,并且特征性的含有两或三个链内 二硫桥。虽然来自不同蛋白的CTLD间在氨基酸序列平的相似性相 对较低,但大量CTLD的3D结构是高度保守的,结构可变性基本上 限定于所谓的环区,常常限定于多达5个环。一些CTLD含有一或两 个钙结合位点,并且绝大多数与钙相互作用的侧链定位于环区。
在有3D结构信息可供利用的CTLD基础上,已经推断出规范的 CTLD的结构特征为7个主要的二级结构元件(也即5个β-链和两个 α-螺旋)以β1、α1、α2、β2、β3、β4和β5顺序存在(图1以及其中 给出的参考资料)。在所有已进行3D结构确定的CTLD中,β-链是以 两个反平行β-折叠片排列的,其中一个包括β1和β5,另一个包括β2、 β3和β4。额外的β-链β0常常位于序列中的β1之前,并且,若存在 的话,则形成与β1、β5-折叠片相整合的额外的链。此外,到目前为止, 在所有定性的CTLD中总能发现两个二硫桥,其中一个二硫桥连接α1 和β5(CI-CIV,图1),另一个二硫桥连接β3与连接β4和β5的多肽 区段(CII-CIII,图1)。在CTLD 3D结构中,这些保守的二级结构元件 为大量从核心中伸出的环形成致密的支架,而这些环在本文中统称为 环区。在CTLD的一级结构中,这些环组织成两个区段:环区段A (LSA)和环区段B(LSB)。LSA代表连接β2和β3的长多肽区段, 其常常缺乏规则的二级结构,含有多达4个环。LSB表示将β-链β3 和β4连接的多肽区段。已经证明,LSA中的残基与β4中的单残基一 起确定了包括四柄蛋白(tetranectin)的CTLD在内的多种CTLD的 Ca2+和配基结合位点。例如,包括单或多残基替代在内的诱变研究已 经证明,可利用CTLD结构域来对结合特异性、Ca2+灵敏性和/或亲和 性的变化进行调节[Weis and Drickamer(1996),Chiba et al.(1999), Graversen et al.(2000)]。
如上所指出的,CTLD间的整体序列相似性非常有限,这可通过 利用蛋白科学领域中通用的比对方法和分析工具将预期的CTLD序列 与图1中给出的进行了结构定性的CTLD组进行比较来进行评定。在 这样的比对中,一般预期CTLD中22-30%的残基与至少一个结构定 性的CTLD中的相应残基相同。图1中展示的序列比对是严格利用真 实的3D结构数据进行阐述的,因此,框架中相应的结构元件的多肽 区段也展示出强序列相似性这一事实提供了一组直接的且可很容易的 从序列比对中进行推断的序列-结构标记。
其表明,即使没有获得精确的3D结构信息的CTLD也可用作新 CTLD文库构建中的框架。在没有获得精确的3D结构信息的CTLD 基础上制备用于构建这样的新CTLD文库的原料所涉及的特定的附加 步骤如下:(1)将图1中的序列与新CTLD的序列进行排列;以及(2) 在序列比对的引导下确定框架结构元件的近似定位,观察是否需对序 列比对进行微小调整以保证在两个保守二硫桥(图1中的CI-CIV和 CII-CIII)形成中涉及的四个规范的半胱氨酸残基的精确比对。这些步骤 的主要目的是对位于与β2-、β3-和β4-链相对应的区段序列侧翼的新 CTLD的环区进行序列定位鉴定。为了提供进一步的指导,下表1中 以典型的四肽序列给出了29个真正的CTLD的序列分析结果、它们 的作为CTLD β2-和β3-链的组成部分的共有序列、β4-链的精确定位以 及阐明的序列特定。
                 表1 β2、β3和β4共有元件分析
CTLD      β2                   ---                           LSA                           ---                            β3      LSB          β4
IX-A      W I G L R W - - - Q G KVKQCNS E W S D G S S V S - - Y E N W I E - - - - - - - - A E S K T - - - - - - - - - - -  C L G L E KET D F R  K W V N I Y C
MGL       W I G L T D Q - - N G P - - W R W V D G T D F E K G F K N W A P - - - - - - - - L Q P D N W F G H G L G G G E D  C A H I T T G - - G  F W N D D V C
LIT       W I G L H D P K K N R R - - W H W S S G S L V S - - Y K S W G I - - - - - - - - G A P S S V N P - - - - - G Y -  C V S L TSS T G F Q  K W K D V P C
CHL       W I G L T D E N Q E G E - - W Q W V D G T D T R S S F T F W K E - - - - - - - - G E P N N R G F - - - - - N E D  C A H V W T S - - G  Q W N D V Y C
IGE-FCR   W I G L R N L D L K G E F I W V - - D G S H V D - - Y S N W A P - - - - - - - - G E P T S R S Q - - - - - G E D  C V M M R G S - - G  R W N D A F C
TCL-1     W I G L T D K D S E G T - - W K W V D G T P L T - - T A F W S T - - - - - - - - D E P N D G A V N - - - - G E D  C V S L Y YHTQPEF K  N W N D L A C
KUCR      W I G L T D Q G T E G N - - W R W V D G T P F DYVQS R R F W R K - - - - - - - - G Q P D W R H G N G E - - R E D  C V H L Q - - - - R  M W N D M A C
CD94      W I G L S Y S E E H T A - - W L W E N G S A L S Q - Y L S F E T - - - - - - - - - - - - F N T K N - - - - - - -  C I A Y N P N - - G  N A L D E S C
CPCP      W I G L N D R T I E G D F R W S - - D G H P M Q - - F E N W R P - - - - - - - - N Q P D N F F A A - - - - G E D  C V V M I W H E K G  E W N D V P C
PAP       W I G L H DPTQGTEPN G E G - W E W S S S D V M N - - Y F A W E R - - - - - - - - N - P S T I S S P G H - - - - -  C A S L S RST A F L  R W K D Y N C
NEU       W I G L N D R I V E Q D - - F Q W T D N T G L Q - - Y E N W R E - - - - - - - - N Q P D N F F A G - - - - G E D  C V V L V S H E I G  K W N D V P C
ESL       W I G I R K V N N V - - - - W V W - V G T Q K P L T EEAKN W A P - - - - - - - - G E P N N R Q K - - - - - D E D  C V E I YIKREKD V G  M W N D E R C
NKg2A     W I G V F R N S S H H P - - W V T M N G L A F K H E I K D S D N A - - - - - - - - - - - - - - - - - - - - E L N  C A V L Q V - - - N  R L K S A Q C
GP120     W M G L S D L N Q E G T - - W Q W V D G S PLL P S - FKQ Y W N R - - - - - - - - G E P N N V G - - - - - - E E D  C A E F S G N - - G -  W N D D K C
MMR       W I G L F R N V - E G T - - W L W I N N S P V S - - F V N W N T - - - - - - - - G D P S G E - - - - - - - R N D  C V A L H A S S - G  F W S N I H C
TN        W L G L N D M A A E G T - - - - W V D M T G A R I A Y K N W E T E I T - - - - - A Q P D G G K - - - - - - T E N  C A V L S G A A N G  K W F D K R C
SCGF      W L G V H D R R A E G L - - Y L F E N G Q R V S - - F F A W HRSPRPELGAQPSASPHPLSPDQ P N G G T - - - - - - L E N  C V A Q A S D D - G  S W W D H D C
PLC       W L G A S D L N I E G R - - W L W - E G Q R R M N - Y T N W S P - - - - - - - - G Q P D N A G G - - - - - I E H  C L E L RRD L G N Y  L W N D Y Q C
H1-ASR    W M G L H D - - Q N G P - - W K W V D G T D Y E T G F K N W R P - - - - - - - - E Q P D D W Y G H G L G G G E D  C A H F T D D - - G  R W N D D V C
IX-B      W M G L S N V W N Q C N - - W Q W S N A A M L R - - Y K A W A E - - - - - - - - E S Y - - - - - -  - - - - - - - C V Y F K S T N - N  K W R S R A C
LY49A     W V G L S Y D N K K K D - - W A W I D N R P S K L A L N T R K Y - - - - - - - - N I R D G G - - - - - - - - - -  C M L L S K T - - -  R L D N G N C
TU14      W V G A D N - L Q D G A Y N F N W N D G V S L P T D S D L W S P - - - - - - - - N E P S N P Q S W Q L - - - - -  C V Q I W S K Y - N  L L D D V G C
rSP-A     Y L G M I E D Q T P G D - - F H Y L D G A S V N - - Y T N W Y P - - - - - - - - G E P R G Q G - - - - - - K E K  C V E M Y T D - - G  T W N D R G C
BCON      Y L S M N D I S T E G R - - F T Y P T G E I L V - - Y S N W A D - - - - - - - - G E P N N S D E G Q - - - P E N  C V E I F P D - - G  K W N D V P C
BCL43     Y L S M N D I S K E G K - - F T Y P T G G S L D - - Y S N W A P - - - - - - - - G E P N N R A K D E G - - P E N  C L E I Y S D - - G  N W N D I E C
MBP-A     F L G I T D E V T E G Q - - F M Y V T G G R L T - - Y S N W K K - - - - - - - - D E P N D H G S - - - - - G E D  C V T I V D N - - G  L W N D I S C
SP-D      F L S M T D S K T E G K - - F T Y P T G E S L V - - Y S N W A P - - - - - - - - G E P N D D G G - - - - - S E D  C V E I F T N - - G  K W N D R A C
CL-L1     F I G V N D L E R E G Q - - Y M F T D N T P L Q N - Y S N W N E - - - - - - - - G E P S D P Y G - - - - - H E D  C V E M L S S - - G  R W N D T E C
DCIR      F V G L S D P - - E G Q R H W Q W V D Q T P - - - - Y NESSTFWHP - - - - - - - - R E P S D P N - - - - - - - E R  C V V L NFRKSPKRW G -  W N D V N C
注:LSA,环区段A;LSB,环区段B。
序列取自:Berglund and Petersen(1992)[TN,四柄蛋白]; Bertrand et al.(1996)[LIT,胰石蛋白];Mann et al.(2000)[MGL,鼠 巨噬细胞半乳糖凝集素,KUCR,Kupffer细胞受体,NEU,小鸡 neurocan,PLC,perlucin,H1-ASR,唾液酸糖蛋白受体];Mio et al. (1998)[CPCP,软骨蛋白多糖核心蛋白,IGE-FCR,IgE Fc受体,PAP, 与胰腺炎相关的蛋白,MMR,鼠巨噬细胞受体,NKG2,天然杀伤基团, SCGF,干细胞生长因子];Mizuno et al.(1997)[IX-A和B,IX/X因子结 合蛋白,MBP,甘露糖结合蛋白];Ohtani et al.(1999)[BCON,胶固 素,BCL43,牛CL43,CL-Ll,胶原凝集素肝1,SP-A,表面活性剂蛋白 A,SP-D,表面活性剂蛋白D];Poget et al.(1999)[ESL,内皮细胞选择 素,TU14,有被膜c型凝集素];Tormo et al.(1999)[CD94,CD94 NK 受体结构域,LY49A,LY49A NK受体结构域];Zhang et al.(2000) [CHL,小鸡肝脏凝集素,TCL-1,鳟鱼c型凝集素,GP120,HIV gp 120 结合性c型凝集素,DCIR,树突细胞免疫受体]
在29个β2-链中,
14个与共有序列WIGX相一致(其中12个为WIGL序列,1个 为WIGI序列,1个为WIGV序列);
3个与共有序列WLGX相一致(其中1个为WLGL序列,1个为 WLGV序列,1个为WLGA序列);
3个为WMGL序列;
3个与共有序列YLXM相一致(其中2个为YLSM序列,1个为 YLGM序列);
2个与共有序列WVGX相一致(其中1个为WVGL序列,而1个 为WVGA序列);以及
在该总汇中剩余的4个β2-链的序列分别为FLGI、FVGL、FIGV 和FLSM序列。
因此,我们得出结论,四残基β2共有序列(″β2cseq″)可表述如下:
残基1:芳香族残基,最优选Trp,次优选Phe,最次优选Tyr。
残基2:脂肪族或非极性残基,最优选Ile,次优选Leu或Met, 最次优选Val。
残基3:脂肪族或亲水残基,最优选Gly,最次优选Ser。
残基4:脂肪族或非极性残基,最优选Leu,次优选Met、Val或Ile。
相应的,β2共有序列总结如下:
β2cseq:( W,Y,F)-( I,L,V,M)-( G,S)-( L,M,V,I),
其中下划线残基表示在该序列位置上最经常发现的残基。
所有进行分析的29个β3-链是以对所有已知CTLD序列来讲经典 的CysII起始的,在29个β3-链中,
5个与共有序列CVXI相一致(其中3个为CVEI序列,1个为 CVTI序列,1个为CVQI序列);
4个与共有序列CVXM相一致(其中2个为CVEM序列,1个为 CVVM序列,1个为CVMM序列);
6个与共有序列CVXL相一致(其中2个为CVVL序列,2个为 CVSL序列,1个为CVHL序列,1个为CVAL序列);
3个与共有序列CAXL相一致(其中2个为CAVL序列,1个为 CASL序列);
2个与共有序列CAXF相一致(其中1个为CAHF序列,1个为 CAEF序列);
2个与共有序列CLXL相一致(其中1个为CLEL序列,1个为 CLGL序列);并且
在总汇中剩余的7个β3-链序列分别为CVYF、CVAQ、CAHV、 CAHI、CLEI、CIAY和CMLL序列。
因此,我们得出结论,四残基β3共有序列(″β3cseq″)可表述如下:
残基1:Cys,即CTLD的经典CysII残基
残基2:脂肪族或非极性残基,最优选Val,次优选Ala或Leu, 最次优选Ile或Met
残基3:最普遍的为芳香族或带电残基,最优选Glu。
残基4:最普遍的为脂肪族、非极性或芳香族残基,最优选Leu或 Ile,次优选Met或Phe,最次优选Tyr或Val。
相应的,β3共有序列总结如下:
β3cseq:( C)-( V,A,L,I,M)-( E,X)-( L,I,M,F,Y,V),
其中下划线残基指在该序列位置上最经常出现的残基。
从已知的CTLD(图1)的3D结构中观察到,β4-链最经常包含 在一级结构中定位于相对于所有已知CTLD的经典CysIII为-6--2位点 上的5个残基,较少包含定位于相对于所有已知CTLD的经典CysIII 为-5--2位点上的4个残基。定位在相对于CysIII为-3位的残基与定位 在此位点上的CTLD中的位点2钙离子的协调有关,此观点依据的是 如下观察结果:在表1中分析的29个CTLD序列中,其中27个CTLD 在此位点具有Asp残基或Asn残基,而两个CTLD在此位点具有Ser 残基。从已知的CTLD 3D结构中,我们也注意到,相对于CysIII残基 而定位于位点-5的残基与CTLD支架的疏水核心形成相关。此观点依 据的是如下观察结果:在分析的29个CTLD序列中,25个CTLD在 此位点上具有Trp残基,3个具有Leu残基,1个是Ala残基。进行 分析的29个CTLD中有18个CTLD序列在位置-4上具有Asn残基。 此外,29个β4-链区段中,有19个区段的前面都存在Gly残基。
相对于β4-链中经典的CysIII残基为位点-5、-4和-3上的29个中 央三残基基序中:
22个为序列WXD(18个为WND,2个为WKD,1个为WFD,1 个为WWD),
2个为序列WXN(1个为WVN,1个为WSN),
在分析中,剩余的5个基序(WRS,LDD,LDN,LKS和ALD)每个 均出现一次。
现在,我们发现,CTLD结构域族中的每个成员代表了一个构建 蛋白质文库的具有吸引的机会,利用筛选或选择方法就可从这些文 库中鉴定并分离对新配基靶具有亲和力的成员。可通过将其中CTLD 的环区被一或多个随机化多肽区段取代的CTLD框架结构相混合来构 建这些文库。
其中四柄蛋白或四柄蛋白的CTLD结构域用作支架的这样一个体 系尤其引起注意,这不仅仅是因为四柄蛋白原体的三聚复合体的稳定 性非常高(国际专利申请公开No.WO 98/56906 A2)。
四柄蛋白为从人血浆中分离并发现存在于某些组织的细胞外基质 中的三聚体糖蛋白[Holtet et al.(1997),Nielsen et al.(1997)]。已知四柄 蛋白可与钙、多糖复合体、纤溶酶原、纤维蛋白原/纤维蛋白以及脱辅 基脂蛋白(a)相结合。其与纤溶酶原和脱辅基脂蛋白(a)的相互作 用由其中所谓的kringle 4蛋白结构域介导。已知此相互作用对钙和赖 氨酸衍生物敏感[Graversen et al.(1998)]。
已经对人四柄蛋白基因进行了定性,并且对人和鼠四柄蛋白 cDNA克隆进行了分离。人和鼠成熟蛋白都包含有181个氨基酸残基 (图2)。在两个单独的研究中,独立的对完全长度的重组人四柄蛋白 和分离的四柄蛋白CTLD的3D结构进行了确定[Nielsen et al.(1997) 和Kastrup et al.(1998)]。四柄蛋白为两或可能三结构域蛋白,也即多 肽链的主要部分包括CTLD(氨基酸残基Gly53-Val181),而 Leu26-Lys52区编码可通过形成均聚的平行卷曲螺旋来控制蛋白质的 三聚作用的α-螺旋。Glu1-Glu25多肽区段含有多糖复合体结合位点 (Lys6-Lys15)[Lorentsen et al.(2000)],似乎有助于三聚体结构的稳定 [Holtet et al.(1997)]。已经证明,定位于环4中的两个氨基酸残基 Lys148和Glu150以及Asp165(定位于β4中)在纤溶酶原kringle 4的 结合中具有关键作用,而残基Ile140(环3中)、Lys166和Arg167(β4 中)具有一定的重要性[Graversen et al.(1998)]。已经证明,利用芳香 族残基替代Thr149(环4中)可显著增加四柄蛋白对kringle 4的亲和 力,并可将对纤溶酶原kringle 2的亲和力提高到与野生型四柄蛋白对 kringle 4的亲和力相当的水平上[Graversen et al.(2000)]。
发明目的
本发明的目的为提供产生有用的且具有能够高亲和性和高特异性 结合感兴趣物质的结合位点的有用蛋白产物的新且可实施的方法。
本发明描述了一种方法,其中这样的新的、有用的蛋白产物可通 过应用重组抗体领域中普遍应用的标准组合蛋白质化学方法产生随机 化蛋白组件组合文库来方便的获得,其中每个蛋白组件都含有与 CTLD的核心结构基本相同的核心结构。
天然CTLD中结合位点构型的变化表明,它们的共同核心结构能 够适应配基结合位点的基本不同的构型。因此,CTLD尤其适于用作 构建具有所需结合特性的新且有用的蛋白产物的基础。
就实际应用而言,新的人工CTLD蛋白产物可用于其中目前抗体 产物在技术生化检验体系或者体内或体外医学诊断检验体系中作为关 键试剂的应用中,或在治疗组合物中作为活性成分。
就其用作体外检验体系的成分而言,人工CTLD蛋白产物较抗体 衍生物优选,这是因为新蛋白产物中的每个结合位点都定位于单个结 构自主的蛋白结构域中。CTLD结构域对蛋白水解作用具有抗性,并 且在CTLD的N-或C-末端添加其它蛋白结构域对其稳定性及配基结 合位点的应用没有损害。因此,CTLD结合组件可便利的用作构建组 件分子装置的构件,所述装置例如是除了适当的报告分子如过化物 酶、磷酸酯酶或任何其它信号介导部分之外还存在有相同的或不同特 异性的复合CTLD的装置。
就用作用于体内诊断或治疗目的的组合物的必需成分的体内用途 而言,在人CTLD基础上构建的人工CTLD蛋白产物实际上与已经存 在于体内的相应的天然CTLD蛋白相同,因此预期其在患者体内的免 疫反应将相当低。单CTLD的质量约为最小的功能性抗体衍生物,即 单链Fv衍生物的一半,由于其可提供更好的组织穿透与分布,以及在 循环系统中有更短的半衰期,因此这种小尺寸在某些应用中是有利的。 CTLD蛋白的多价体,如相应于完全的四柄蛋白三聚体或进一步多聚 化的胶原凝集素,如甘露糖结合蛋白的形式,可提供增强的结合能力、 亲合性及更长的循环半衰期。
本发明的优选实施方案的一个特殊的优点源自哺乳动物四柄蛋 白,以鼠和人四柄蛋白为例,具有基本相同的结构这一事实。这种种 间保守性具有很高的应用重要性,因为其允许在如鼠和人四柄蛋白衍 生物间直接交换确定配基结合特异性的多肽区段。四柄蛋白衍生物间 物种遗传背景的温和交换的随意性与众所周知的实行鼠抗体衍生物″ 人源化″时相应形成了鲜明的对比。
本发明进一步的优点为:
有通用且简单的方法可用于将最初筛选的蛋白衍生物可靠地转化 为最终蛋白产物的可用性,无需重新定型,此最终产物即可在细菌(如 大肠杆菌)中进行小规模和大规模生产(国际专利公开No.WO 94/18227 A2)。
可通过简单且通用的方法在同一功能蛋白单位中包含多个相同的 或不同结合位点,因而使得可借助相互作用的亲合性利用甚至比较弱 的亲和力,或构建双-或异功能分子组合(国际专利申请公开No. WO 98/56906 A2)。
有可能在含有CTLD中的一或多个保存的金属结合位点的组合文 库中通过添加或去除二价金属离子(如钙离子)来调节结合。
发明简述
本发明提供了大量新颖且有用的蛋白,其中每个蛋白都具有C型 类凝集素结构域(CTLD)的支架结构,该蛋白包含有模型CTLD的 变体,其中α-螺旋和β-链以及连接区段比较保守,使得CTLD的支架 结构基本维持不变,而通过氨基酸替代、缺失、插入或它们的结合来 进行环区改变,前提为该蛋白不是下表2中所列的C型类凝集素蛋白 或C型凝集素的任何已知的CTLD环衍生物。
                    表2已知的β2、β3、β4、LSA和LSB CTLD衍生物
                    表2A:LSA衍生物(β2和β3共有元件标有下划线)
CTLD       Mut.                          LSA序列(单字母简写)                                                           参考文献
hTN  TND116A            W L G L N A M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K T E N  C A V L  Graversen et al.(1998)
     TNE120A            W L G L N D M A A A G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K T E N  C A V L  Graversen et al.(1998)
     TNK134A            W L G L N D M A A E G T W V D M T G A R I A Y A N W E T E I T A Q P D G G K T E N  C A V L  Graversen et al.(1998)
     TNI140A            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E A T A Q P D G G K T E N  C A V L  Graversen et al.(1998)
     TNQ143A            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A A P D G G K T E N  C A V L  Graversen et al.(1998)
     TND145A            W I G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P A G G K T E N  C A V L  Graversen et al.(1998)
     TNK148A            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G A T E N  C A V L  Graversen et al.(1998)
     TNK148M            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G M T E N  C A V L  Graversen et al.(2000)
     TNK148R            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G R T E N  C A V L  Graversen et al.(2000)
     TNT149F            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K F E N  C A V L  Graversen et al.(2000)
     TNT149M            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K M E N  C A V L  Graversen et al.(2000)
     TNT149R            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K R E N  C A V L  Graversen et al.(2000)
     TNT149Y            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K Y E N  C A V L  Graversen et al.(2000)
     TNE150A            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K T A N  C A V L  Graversen et al.(1998)
     TNE150D            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K T D N  C A V L  Graversen et al.(2000)
     TNE150Q            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K T Q N  C A V L  Graversen et al.(2000)
     TNN151A            W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K T E A  C A V L  Graversen et al.(1998) 
     TNK148R,T149Y     W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G R Y E N  C A V L  Graversen et al.(2000)
     TNT149Y,E150Q     W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K Y Q N  C A V L  Graversen et al.(2000)
     TNT149Y,D165N     W L G L N D M A A E G T W V D M T G A R I A Y K N W E T E I T A Q P D G G K Y E N  C A V L  Graversen et al.(2000)
rMBP QPD                  F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D H G S G E D  C V T I    Drickamer(1992)
     N187D                F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D E P D D H G S G E D  C V T I    Iobst et al.(1994)
     H189A                F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D E P N D A G S G E D  C V T I    Iobst et al.(1994)
     H189G                F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D E P N D G G S G E D  C V T I    Iobst et al.(1994)
     QPDW                 F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W G S G E D  C V T I    Iobst & Drickamer(1994)
     QPDWG             F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G HGLGG G E D  C V T I Iobst & Drickamer(1994)
     QPDWG/Y/A         F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W A G HGLGG G E D  C V T I Iobst & Drickamer(1994)
      QPDWG/Y/Q        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Q G HGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      QPDWG/G/A        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y A HGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      QPDWG/H/A        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G AGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      QPDWG/H/Q        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G QGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      QPDWG/H/E        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G EGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      QPDWG/H/Y        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G YGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      QPDWG/-/G        F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G HGL G G E D  C V T I  Iobst & Drickamer  (1994)
      QPDF                F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D F G S G E D  C V T I     Iobst & Drickamer  (1994)
      QPDFG            F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D F Y G HGLGG G E D  C V T I  Iobst & Drickamer  (1994)
      REGION 1           F L G I R K V N N V F M Y V T G G R L T Y S N W K K D E P N D H G S G E D  C V T I          Blanck et al.(1996)
      REGION 2         F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D E P N N R Q K D E D  C V T I        Blanck et al.(1996)
      RES.189          F L G I T D E V T E G Q F M Y V T G G R I T Y S N W K K D E P N D G G S G E D  C V T I        Torgersen et al.(1998)
      RES.197          F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D E P N D H G S G E D  C V E I        Torgersen et al.(1998)
      LOOP 3E       F L G I T D E V T E G Q F M Y V T G G R L T Y S N W A P G E P N D H G S G E D  C V T I           Torgersen et al.(1998)
      LOOP 3P       F L G I T D E V T E G Q F M Y V T G G R L T Y S N W A D N E P N D H G S G E D  C V T I           Torgersen et al.(1998)
      REGION 4      F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G HGLGG G E D  C V H I     Kolatkar et al.(1998)
      REGION 4′    F L G I T D E V T E G Q F M Y V T G G R L T Y S N W R P G Q P D D W Y G HGLGG G E D  C V H I     Kolatkar et al.(1998)
      QPDWG/QNG       F L G I T D Q N G Q F M Y V T G G R L T Y S N W K K D Q P D D W Y G HGLGG G E D  C V T I       Wragg & Drickamer(1999)
      QPDWG/QNGP      F L G I T D Q N G P F M Y V T G G R L T Y S N W K K D Q P D D W Y G HGLGG G E D  C V T I       Wragg & Drickamer(1999)
      MBP/CHL189       F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K E G E P N N R G S G E D  C V T I        Burrows et al.(1997)
      MBP/CHL192       F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K E G E P N N R G F N E D  C V T I        Burrows et al.(1997)
      MBP/CHL20B       F L G I T D E V T E G Q F M Y V T G G R L T Y S N W K E G E P N N R G F N E D  C A H V        Burrows et al.(1997)
rSP-A E195Q,R197D      Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G Q P D G Q G K E K  C V E M         McCormack et al.(1994)
      AM2               Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P R G Q G K E K  C V T I         Honma et al.(1997)
      AM3              Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P N D H G S G E D  C V T I        Honma et al.(1997)
      E195A             Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G A P R G Q G K E K  C V E M         McCormack et al.(1997)
      R197G             Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P G G Q G K E K  C V E M         McCormack et al.(1997)
      E202A             Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P R G Q G K A K  C V E M         McCormack et al.(1997)
      N187S             Y L G M I E D Q T P G D F H Y L D G A S V S Y T N W Y P G E P R G Q G K E K  C V E M         McCormack et al.(1997)
      R197A             Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P A G Q G K E K  C V E M         Pattanajitvilai et al.(1998)
      R197K             Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P K G Q G K E K  C V E M         Pattanajitvilai et al.(1998)
      R197H             Y L V M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P H G Q G K E K  C V E M         Pattanajitvilai et al.(1998)
      R197D                     Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P D G Q G K E K  C V E M      Pattanajitvilai et al.(1998)
      R197N                     Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P N G Q G K E K  C V E M      Pattanajitvilai et al.(1998)
      E195Q                     Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G Q P R G Q G K E K  C V E M      Tsunezawa et al.(1998)
      K201A                     Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P R G Q G A E K  C V E M      Tsunezawa et al.(1998)
      K203A                     Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P R G Q G K E A  C V E M      Tsunezawa et al.(1998)
      E197A,K201A,K203A       Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G A P R G Q G A E A  C V E M      Tsunezawa et al.(1998)
      ad3                      Y L G M I E D Q T P G D F H Y L D G A S V N Y T N W Y P G E P N N N G G A E N  C V E I     Sano et al.(1998)
      ad4                      Y L G M I E D Q T E G K F T Y P T G E A L V Y S N W A P G E P N N N G G A E N  C V E I     Sano et al.(1998)
      rat ama4                  Y L G M I E D Q T E G Q F M Y V T G G R L T Y S N W K K D E P R G Q G K E K  C V E M      Chiba et al.(1999)
hSP-A R199A                     Y V G L T E G P S P G D F R Y S D G T P V N Y T N W Y R G E P A G A G K E Q  C V E M      Tsunezawa et al.(1998)
      K201A                     Y V G L T E G P S P G D F R Y S D G T P V N Y T N W Y R G E P A G R G A E Q  C V E M      Tsunezawa et al.(1998)
      hum ama4                  Y V G L T E G P T E G Q F M Y V T G G R L T Y S N W K K D E P R G R G K E Q  C V E M      Chiba et al.(1999)
rSP-D E321Q,N323D             F L S M T D V G T E G K F T Y P T G E A L V Y S N W A P G Q P D N N G G A E N  C V E I     Ogasawara & Voelker(1995)
h-esl K67A                    W I G I R K V N N V W V W V G T Q A P L T E E A K N W A P G E P N N R Q K D E D  C V E I    Erbe et al.
      K74A                    W I G I R K V N N V W V W V G T Q K P L T E E A A N W A P G E P N N R Q K D E D  C V E I    Erbe et al.
      R84A,K86A              W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N A Q A D E D  C V E I    Erbe et al.
      R84A                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N A Q K D E D  C V E I    Kogan et al.(1995)
      R84K                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N K Q K D E D  C V E I    Kogan et al.(1995)
      R84K,D89G              W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N K Q K D E G  C V E I    Kogan et al.(1995)
      A77K                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W K P G E P N N R Q K D E D  C V E I    Kogan et al.(1995)
      A77K,P78K              W I G I R K V N N V W V W V G T Q K P L T E E A K N W K K G E P N N R Q K D E D  C V E I    Kogan et al.(1995)
      A77K,P78K,R84A        W I G I R K V N N V W V W V G T Q K P L T E E A K N W K K G E P N N A Q K D E D  C V E I    Kogan et al.(1995)
      D87E                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N R Q K E E D  C V E I    Kogan et al.(1995)
      D87N                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N R Q K N E D  C V E I    Kogan et al.(1995)
      D89N                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N R Q K D E N  C V E I    Kogan et al.(1995)
      D89E                    W I G I R K V N N V W V W V G T Q K P L T E E A K N W A P G E P N N R Q K D E E  C V E I    Kogan et al.(1995)
      A77K,E80Q,N82D        W I G I R K V N N V W V W V G T Q K P L T E E A K N W K P G Q P D N R Q K D E D  C V E I    Kogan et al.(1995)
h-psl A77K                    W I G I R K N N K T W T W V G T K K A L T N E A E N W K D N E P N N K R N N E D  C V E I    Revelle et al.(1996)
      A77K,E80D,N82D        W I G I R K N N K T W T W V G T K K A L T N E A E N W K D N Q P D N K R N N E D  C V E I    Revelle et aL.(1996)
MGR   2A/R                   WIGL T D Q N G P W R W V D G T D Y E K G F T H W R P K Q P D N W Y G H G L G G G E D  CAHF   Iobst & Drickamer(1996)
      2K/G                   WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P G Q P D N W Y G H G L G G G E D  CAHF   Iobst & Drickamer(1996)
      2A/R,2K/G             WIGL T D Q N G P W R W V D G T D Y E K G F T H W R P G Q P D N W Y G H G L G G G E D  CAHF   Iobst & Drickamer(1996)
       4F/I               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CAHI  Iobst & Drickamer(1996)
       4H/A               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CAAF  Iobst & Drickamer(1996)
       4H/E               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CAEF  Iobst & Drickamer(1996)
       4H/Q               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CAQF  Iobst & Drickamer(1996)
       4H/N               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CANF  Iobst & Drickamer(1996)
       4H/Y               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CAYF  Iobst & Drickamer(1996)
       4H/D               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CADF  Iobst & Drickamer(1996)
       4H/K               WIGL T D Q N G P W R W V D G T D Y E K G F T H W A P K Q P D N W Y G H G L G G G E D  CAYF  Iobst & Drickamer(1996)
       2A/R,2K/G,4H/A   WIGL T D Q N G P W R W V D G T D Y E K G F T H W R P G Q P D N W Y G H G L G G G E D  CAAF  Iobst & Drickamer(1996)
RHL    4H/A               WIGL T D Q N G P W K W V D G T D Y E T G F K N W R P G Q P D D W Y G H G L G G G E D  CAAF  Iobst & Drickamer(1996)
CHL    R173A              W I G L T D E N Q E G E W Q W V D G T D T R S S F T F W K E G E P N N A G F N E D  C A H V  Burrows et al.(1997)
       G174A              W L G L T D E N Q E G E W Q W V D G T D T R S S F T F W K E G E P N N R A F N E D  C A H V  Burrows et al.(1997)
       F175A              W I G L T D E N Q E G E W Q W V D G T D T R S S F T F W K E G E P N N R G A N E D  C A H V  Burrows et al.(1997)
       N176A              W I G L T D E N Q E G E W Q W V D G T D T R S S F T F W K E G E P N N R G F A E D  C A H V  Burrows et al.(1997)
  表2B:LSB衍生物(β3和β4共有元件由下划线表示)
CTLD   Mut.           LSB序列(单字母简写)                      参考文献
hTN   TNK163A        C A V L S G A A N G  A W F D K R C     Graversen et al.(1998)
      TNK166A        C A V L S G A A N G  K W F D A R C     Graversen et al.(1998)
      TNR167A        C A V L S G A A N G  K W F D K A C     Graversen et al.(1998)
      TNF164L        C A V L S G A A N G  K W L D K R C     Graversen et al.(1998)
      TND165A        C A V L S G A A N G  K W F A K R C     Graversen et al.(1998)
      TND165E        C A V L S G A A N G  K W F E K R C     Graversen et al.(2000)
      TND165N        C A V L S G A A N G  K W F N K R C     Graversen et al.(2000)
rMBP  I207V            C V T I V D N G  L W N D V S C       Iobst et al.(1994)
      I207L            C V T I V D N G  L W N D L S C       Iobst et al.(1994)
      I207A            C V T I V D N G  L W N D A S C       Iobst et al.(1994)
      I207E            C V T I V D N G  L W N D E S C       Torgensen et al.(1996)
      Region 4E  C V T I V Y I K R E K D N G  L W N D I S C Torgensen et al.(1996)
      Region 4P  C V T I V Y I K S P S D N G  L W N D I S C Torgensen et al.(1996)
      207VY            C V T I V D N G  L W N D V Y C       Burrows et al.(1997)
      β34             C A H V W T S G  Q W N D V Y C       Burrows et al.(1997)
h-esl Y94F        C V E I F I K R E K D V G  M W N D E R C  Kogan et al.(1995)
      Y94R        C V E I R I K R E K D V G  M W N D E R C  Kogan et al.(1995)
      Y94D        C V E I D I K R E K D V G  M W N D E R C  Kogan et al.(1995)
      Y94A        C V E I A I K R E K D V G  M W N D E R C  Kogan et al.(1995)
      Y94S        C V E I S I K R E K D V G  M W N D E R C  Kogan et al.(1995)
      E107D       C V E I Y I K R E K D V G  M W N D D R C  Kogan et al.(1995)
      E107A       C V E I Y I K R E K D V G  M W N D A R C  Kogan et al.(1995)
      E107N       C V E I Y I K R E K D V G  M W N D N R C  Kogan et al.(1995)
      E107K       C V E I Y I K R E K D V G  M W N D K R C  Kogan et al.(1995)
      E107Q       C V E I Y I K R E K D V G  M W N D Q R C  Kogan et al.(1995)
      R97D        C V E I Y I K D E K D V G  M W N D E R C  Revelle et al.(1996)
      R97S        C V E I Y I K S E K D V G  M W N D E R C  Revelle et al.(1996)
      R97E     C V E I Y I K E E K D V G  M W N D E R C  Revelle et al.(1996)
h-psl K96Q     C V E I Y I Q S P S A P G  M W N D E H C  Revelle et al.(1996)
      K96R     C V E I Y I R S P S A P G  M W N D E H C  Revelle et al.(1996)
      K96E     C V E I Y I E S P S A P G  M W N D E H C  Revelle et al.(1996)
      S97A     C V E I Y I K A P S A P G  M W N D E H C  Revelle et al.(1996)
      S97D     C V E I Y I K D P S A P G  M W N D E H C  Revelle et al.(1996)
      S97R     C V E I Y I K R P S A P G  M W N D E H C  Revelle et al.(1996)
      REK      C V E I Y I K R E K A P G  M W N D E H C  Revelle et al.(1996)
      S99D     C V E I Y I K S P D A P G  M W N D E H C  Revelle et al.(1996)
CHL   V191A         C A H V W T S G  Q W N D A Y C       Burrows et al.(1997)
      Y192A         C A H V W T S G  Q W N D V A C       Burrows et al.(1997)
     表2C:其它TN CTLD衍生物
CTLD    Mut.             序列(单字母代码)                参考文献
hTN   TNRl69A     S G A A N G K W F D K R C A D Q      Graversen et al.(1998)
      TNS85G        C I S R G G T L G T P Q T          Jaquinod et al.(1999)
         注:    hTN:人四柄蛋白;
                 rMBP: 大鼠甘露糖结合蛋白;
                 rSP-A:大鼠表面活性剂蛋白A;
                 hSP-A:人表面活性剂蛋白A;
                 rSP-D:大鼠表面活性剂蛋白D;
                 h-esl:人e-选择蛋白
                 h-psl:人p-选择蛋白
                 MGR:  巨噬细胞半乳糖受体
                 RHL:  大鼠肝凝集素
                 CHL:  鸡肝凝集素
正常的,利用具有与表1中例示的二级结构排列相一致的3D结 构定义模型CTLD,其特征为有下列主要的二级结构元件:
以β1、α1、α2、β2、β3、β4和β5的顺序依次排列的5个β-链和2个 α-螺旋,β-链排列在两个反向平行β-折叠片中,一个包含β1和β5,另 一个包含β2、β3和β4,
至少两个二硫桥,一个连接α1和β5,一个连接β3和连接β4与β5的 多肽区段,
由两多肽区段组成的环区,环区段A(LSA)连接β2和β3,一般包 括15-70个,更为少见地包括5-14个氨基酸残基,环区段B(LSB) 连接β3和β4,并且一般包括5-12个,更为少见地包括2-4个氨基 酸残基。
然而,没有获得精确的3D结构的CTLD也可用作模型CTLD, 这种CTLD限定为展示与以前认定的CTLD族成员具有序列相似性, 表现为有至少22%,优选至少25%,更优选至少30%的氨基酸序列 同一性,并且含有对确定保守的二硫桥拓扑学所必需的半胱氨酸残基 (也即CysI,CysII,CysIII和CysIV)。随后,可通过与图1中展示的CTLD 汇总进行序列比对检验来鉴定由环区段LSA和LSB组成的环区及其 侧翼β-链结构元件,鉴定出β2-和β3-链的序列定位,并通过将这些序 列与四残基共有序列β2cseq和β3cseq及一般定位在相对于保守的 CysIII残基为-6--2位点、更为少见地定位于-5--2位点的β4链区段、 以及表1中阐明和发明背景部分叙述的-5和-3位点处的特征残基进 行对比而提供进一步的确证。
同样的考虑适用于确定在模型CTLD中是否α-螺旋和β-链以及连 接区段足够保守而能使CTLD的支架结构基本维持不变。
比较理想的是在模型CTLD的α-螺旋和/或β-链和/或连接区段中 替代、缺失或插入多达10个,优选多达4个,更优选1或2个氨基酸残基。 特别的,虽然CTLD的支架结构基本保持不变可以因在编码CTLD的核 苷酸序列中导入一或多个限制性核酸内切酶识别位点而在模型CTLD 的β-链中进行多达4个残基的改变,所述识别位点可促进对部分或整个 环区的切除以及插入改变后的氨基酸序列,同时基本维持CTLD的支 架结构。
尤其感兴趣的是其中的模型CTLD为四柄蛋白的CTLD的蛋白 质。其CTLD可用作模型CTLD的众所周知的四柄蛋白为人四柄蛋白 和鼠四柄蛋白。因此,按照本发明,这些蛋白包含这些模型CTLD的 变体。
按照本发明的蛋白可包含CTLD变体的N-末端和/或C-末端延伸, 这样的延伸可含有如效应剂、酶、以及进一步的结合和/或多聚化功能。 特别的,该延伸可为天然C型类凝集素蛋白、C型凝集素或其缺乏功 能性跨膜结构域的可溶性变体的非CTLD部分。
按照本发明的蛋白也可为包含CTLD变体,如天然四柄蛋白三聚 体衍生物的部分的多聚体。
在一个优选方面中,本发明提供了具有C型类凝集素结构域 (CTLD)的支架结构的蛋白质组合文库,这些蛋白包含有其中的α- 螺旋和β-链保守到CTLD的支架结构基本保持不变的程度的模型 CTLD变体,但CTLD的环区或部分环区进行了针对氨基酸序列和/ 或氨基酸数目的随机化。
构成这样一个文库的蛋白包括按照本发明的上述蛋白进行定义的 模型CTLD的变体,这些变体可包括针对这些蛋白已经说明的改变。
特别的,按照本发明的组合文库可包括其中的模型CTLD为四柄 蛋白CTLD,如人四柄蛋白或鼠四柄蛋白CTLD的蛋白。
按照本发明的组合文库可由包含CTLD变体的N-末端和/或C-末 端延伸的蛋白组成,并且这些延伸可含有如效应物、酶以及进一步的 结合和/或多聚化功能。特别的,该延伸可为天然C型类凝集素蛋白或 C型凝集素或其缺乏功能性跨膜结构域的“可溶性”变体的非CTLD 部分。
按照本发明的组合文库也可由作为包含CTLD变体的部分的多聚 体,如天然四柄蛋白三聚体衍生物的蛋白质组成。
本发明也提供了天然四柄蛋白的衍生物以及编码这些衍生物的核 酸,所述衍生物中,其CTLD的α-螺旋和/或β-链和/或连接区段中有 多达10个,优选多达4个,以及更优选1或2个氨基酸残基发生替代、 缺失或插入。特定的衍生物源自SEQ ID No:02,04,09,11,13,15,29, 31,36和38;而包含编码特定四柄蛋白衍生物的核苷酸插入物的核酸源 自SEQ ID No:12,14,35和37。
本发明包括构建适于制备本发明中的组合文库的四柄蛋白衍生物 的方法,其中已经对编码四柄蛋白衍生物的核酸进行了修饰,以在编 码β2、β3或β4的核酸区段中或在属于编码β2、β3或β4的核酸区段 的任何核苷酸序列的上游或下游多达30个核苷酸处产生核酸内切酶 限制性位点。
本发明也包括编码四柄蛋白或其衍生物的核苷酸序列的应用,用 于通过对编码其CTLD环区的所有或部分核酸序列进行随机化而制备 编码相关蛋白的核苷酸序列的文库,其中四柄蛋白CTLD的支架结构 基本保持不变,
此外,本发明提供了包含任何编码本发明蛋白的核苷酸序列的核 酸。
特别的,本发明提供了编码本发明组合文库的蛋白的核酸文库, 其中一起构成该核酸文库的核酸组合中的成员能够在展示体系中表 达,而此展示体系能在可展示代表所展示表达产物的特性的表型的实 体和它们相应的基因型间提供逻辑、物理或化学的关系。
在这样的文库中,展示体系可选自:
(I)噬菌体展示体系如
(1)丝状噬菌体fd,其中的核酸文库插入到
(a)噬菌粒载体,
(b)噬菌体的病毒基因组
(c)以纯化的单或双链形式存在的纯化的病毒核酸,或
(2)噬菌体λ,其中文库插入到
(a)纯化的噬菌体λDNA,或
(b)λ噬菌体颗粒中的核酸;或
(II)病毒展示体系,其中核酸文库插入到真核病毒如杆状病毒的 病毒核酸中;或
(III)基于细胞的展示体系,其中核酸文库插入到或紧邻能够整 合到宿主基因组中或整合到能够在细胞中维持并表达自己且适于在下 列细胞的细胞表面进行细胞表面展示的染色体外元件的核酸载体中;
(a)细菌细胞,
(b)酵母细胞,或
(c)哺乳动物细胞;或
(IV)适于与核糖体相关联的展示的核酸实体,核酸文库插入其 中;或
(V)适于与质粒相关联的展示的质粒,核酸文库插入其中。
众所周知的且有用的展示体系为Amersham Pharmacia Biotech提 供的、具有噬菌粒载体″pCANTAB 5E″的“重组噬菌体抗体体系”(编 号为no.27-9401-01)
此外,本发明提供了制备本发明蛋白的方法,其中所述蛋白包含 至少一或多个相同或不同的、已通过筛选或选择而从一或多个CTLD 文库中分离出来的具有新颖的环区序列的CTLD结构域。可通过诱变 对至少一个这样的CTLD结构域进行进一步修饰;含有至少一个CTLD 结构域的蛋白可以是通过化学或酶促偶联或交联而从两或更多个组件 组装成的。
另外,本发明提供了制备本发明组合文库的方法,其包含下列步 骤:
1)将编码包含模型CTLD的蛋白的核酸插入到适当的载体中,
2)如果必要,通过定点诱变导入限制性核酸内切酶识别位点,该识 别位点适当的定位在位于或接近编码CTLD环区或其部分的序列末端 的序列中,
3)利用适当的限制性核酸内切酶切除编码环区或其部分的DNA区 段,
4)将DNA区段混合物连接到经限制性消化的载体上,及
5)诱导载体在适当培养基中表达具有CTLD的支架结构的随机化 蛋白。
在进一步的方面,本发明提供了筛选可与特定靶相结合的本发明 组合文库的方法,其包括下列步骤:
1)表达按照权利要求59-61中的任一权利要求的核酸文库以在展 示体系中展示蛋白质文库;
2)将展示的实体样品与适当标记的靶物质进行接触,其中期望分 离对该靶物质的CTLD衍生的展示亲和性;
3)利用其上缀合或物理性吸附或附着有所述靶物质的标记作为载 体或其它亲和纯化形式,通过基于亲和性的选择性提取收获对该靶物 质展示亲和性的展示实体亚群,此方法在本领域中通常称为“亲和淘 选(panning)”,随后对该亚文库进行重扩增;
4)通过重复多轮淘选和重扩增分离越来越好的结合物,直至获得 少量的良好的候选结合物,
5)如果需要,以单克隆形式分离每个良好的候选结合物,并对其 进行普通的功能和结构定性,从而为最终筛选一或多个优选的产物克 隆作准备。
在更进一步的方面中,本发明提供了以想要的替代物种相容性框 架方式使本发明蛋白或选择自本发明组合文库并含有展示所需结合性 质的CTLD变体的蛋白质重定型的方法,包括利用PCR技术、定点诱 变或限制性酶消化从编码该蛋白的核酸中切出编码替代环区多肽及任 何所需的单框架突变的核酸区段,以及将该核酸区段插入到含有编码 所要的替代CTLD框架之核酸序列的展示或蛋白表达载体中。
图表简述
图1展示了10个已知3D结构的CTLD的氨基酸序列比对。主要 的二级结构元件的序列定位指示在每一序列之上,依次以数字序号标 记,如″αN″指α-螺旋号N,而″βM″指β-链号M。
指出了CTLD的两个保守二硫桥形成中涉及的四个半胱氨酸并在 图中分别以″CI″,″CII″,″CIII″和″CIV″列举出来。这两个保守二硫桥分 别为CI-CIV和CII-CIII。
这10个C型凝集素为
hTN:  人四柄蛋白[Nielsen et al.(1997)];
MBP:  甘露糖结合蛋白[Weis et al.(1991);Sheriff et al.(1994)];
SP-D:  表面活性剂蛋白D[H kansson et al.(1999)];
LY49A: NK受体LY49A[Tormo et al.(1999)];
H1-ASR:唾液酸糖蛋白受体的H1亚单位[Meier et al.(2000)];
MMR-4:  巨噬细胞甘露糖受体结构域4[Feinberg et al.(2000)];
IX-A和IX-B:分别为凝血因子IX/X-结合蛋白结构域A
B[Mizuno et al.(1997)];
Lit:  胰石蛋白(lithostatine)[Bertrand et al.(1996)];
TU14: 有被膜的C型凝集素[Poget et al.(1999)]。
图2展示了成熟人和鼠四柄蛋白编码区的核苷酸和氨基酸序列比 对,其中指示出已知二级结构元件。
hTN:人四柄蛋白;核苷酸序列得自Berglund和Petersen(1992)。
mTN:鼠四柄蛋白;核苷酸序列得自S rensen et al.(1995)。 二级结构元件得自Nielsen et al.(1997)。
″α″指α-螺旋;″β″指β-链;″L″指环。
图3展示了人和鼠tlec编码区的核苷酸序列和氨基酸序列的比对。
htlec:源自hTN的序列;mtlec:源自mTN的序列。标出了Bgl II、 Kpn I和Mun I的限制性核酸内切酶位点。
图4展示了人和鼠tCTLD编码区的核苷酸序列和氨基酸序列的比 对。
htCTLD:源自hTN的序列;mtCTLD:源自mTN的序列。标出了 Bgl II、Kpn I和Mun I的限制性核酸内切酶位点。
图5展示了pT7H6FX-htlec表达质粒的略图。其中FX-htlec区段插 入到pT7H6[Christensen et al.(1991)]中Bam HI和Hind III克隆位点 间。
图6展示了利用pT7H6FX-htlec制备的H6FX-htlec融合蛋白的 FX-htlec部分的氨基酸序列(单字母代码)。
图7展示了pT7H6FX-htCTLD表达质粒的略图。其中FX-htCTLD 区段插入到pT7H6[Christensen et al.(1991)]中Bam HI和Hind III克 隆位点间。
图8展示了利用pT7H6FX-htCTLD制备的H6FX-htCTLD融合蛋 白的FX-htCTLD部分的氨基酸序列(单字母代码)。
图9展示了pPhTN噬菌粒的略图。其中PhTN区段插入到噬菌粒 pCANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01)中Sfi I和Not I限制性位点间。
图10展示了利用pPhTN制备的PhTN-gene III融合蛋白的PhTN 部分的氨基酸序列(单字母代码)。
图11展示了pPhTN3噬菌粒的略图。其中PhTN3区段插入到噬菌 粒pCANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01)中 Sfi I和Not I限制性位点间。
图12展示了利用pPhTN3制备的PhTN3-gene III融合蛋白的 PhTN3部分的氨基酸序列(单字母代码)。
图13展示了pPhtlec噬菌粒的略图。其中Phtlec区段插入到噬菌粒 pCANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01)中Sfi I和Not I限制性位点间。
图14展示了利用pPhtlec制备的Phtlec-gene III融合蛋白的Phtlec 部分的氨基酸序列(单字母编码)。
图15展示了pPhtCTLD噬菌粒的略图。其中PhtCTLD区段插入到 噬菌粒CANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01) 中Sfi I和Not I限制性位点间。
图16展示了利用pPhtCTLD制备的PhtCTLD-gene III融合蛋白的 PhtCTLD部分的氨基酸序列(单字母编码)。
图17展示了pUC-mtlec的略图。
图18展示了pT7H6FX-mtlec表达质粒的略图。其中FX-mtlec区段 插入到pT7H6[Christensen et al.(1991)]中Bam HI和Hind III克隆位 点间。
图19展示了利用pT7H6FX-mtlec制备的H6FX-mtlec融合蛋白的 FX-mtlec部分的氨基酸序列(单字母代码)。
图20展示了pT7H6FX-mtCTLD表达质粒的略图。其中 FX-mtCTLD区段插入到pT7H6[Christensen et al.(1991)]中Bam HI 和Hind III克隆位点间。
图21展示了利用pT7H6FX-mtCTLD制备的H6FX-mtCTLD融合 蛋白的FX-mtCTLD部分的氨基酸序列(单字母代码)。
图22展示了pPmtlec噬菌粒的略图。其中Pmtlec区段插入到噬菌 粒pCANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01)中 Sfi I和Not I限制性位点间。
图23展示了利用pPmtlec制备的Pmtlec-gene III融合蛋白的 Pmtlec部分的氨基酸序列(单字母代码)。
图24展示了pPmtCTLD噬菌粒的略图。其中PmtCTLD区段插入 到噬菌粒pCANTAB 5E(Amersham Pharmacia Biotech,代码 27-9401-01)中Sfi I和Not I限制性位点间。
图25展示了利用pPmtCTLD制备的PmtCTLD-gene III融合蛋白 的PmtCTLD部分的氨基酸序列(单字母代码)。
图26展示了对与抗四柄蛋白或BSA结合的Phtlec-、PhTN3-和 M13KO7辅助噬菌体进行的ELISA-type分析。Panel A:以3%脱脂乳/5 mM EDTA作为封闭剂进行分析。Panel B:以3%脱脂乳作为封闭剂 进行分析。
图27展示了对与纤溶酶原(Plg)和BSA结合的Phtlec-、PhTN3-及 M13KO7辅助噬菌体进行的ELISA-type分析。Panel A:以3%脱脂乳/5 mM EDTA作为封闭剂进行分析。Panel B:以3%脱脂乳作为封闭剂 进行分析。
图28展示了对选自第二轮筛选且与纤溶酶原(Plg)结合的B系列和 C系列多克隆群相比于背景的ELISA-type分析。
图29在ELISA-type检验中对从第三轮筛选中分离得到的12个克 隆中的噬菌体与母鸡卵白溶菌酶、人β2-微球蛋白和背景的结合进行分 析。
图30展示了利用pPrMBP制备的PrMBP-gene III融合蛋白的 PrMBP部分的氨基酸序列(单字母代码)。
图31展示了pPrMBP噬菌粒的略图。其中PrMBP区段插入到噬菌 粒pCANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01)中 Sfi I和Not I限制性位点间。
图32展示了利用pPhSP-D制备的PhSP-D-gene III融合蛋白的 PhSP-D部分的氨基酸序列(单字母编码)。
图33展示了pPhSP-D噬菌粒的略图。其中PhSP-D区段插入到噬菌 粒pCANTAB 5E(Amersham Pharmacia Biotech,代码27-9401-01)中 Sfi I和Not I限制性位点间。
图34.在ELISA-type检验中,对从#1系列第三轮筛选中分离得到 的48个克隆中的噬菌体与母鸡卵白溶菌酶和A-HA的结合进行分析。
图35.在ELISA-type检验中,对从#4系列第三轮筛选中分离得到 的48个克隆中的噬菌体与母鸡卵白溶菌酶和A-HA的结合进行分析。
发明详述
I.定义
术语“C型类凝集素蛋白”和“C型凝集素”指任何真核物种中 存在的、或在任何真核物种的基因组中编码的任何蛋白,这些蛋白含 有一或多个CTLD或含有结合糖配基的CTLD亚群即CRD的一或多 个结构域。此定义特定的包括膜附着的C型类凝集素蛋白和C型凝集 素、“可溶性”C型类凝集素蛋白和缺乏功能性跨膜结构域的C型凝集 素、其中一或多个氨基酸残基已通过体内糖基化作用或任何其它的合 成后修饰作用进行了改变的C型凝集素、以及通过对C型类凝集素蛋 白和C型凝集素进行化学修饰得到的任何产物。
在权利要求和整个说明书中,某些改变是通过参照CTLD结构域 或含有CTLD的蛋白的氨基酸残基号来定义的。视具体情况而定,氨 基酸编号开始于CTLD或者天然或人工的含有CTLD的蛋白产物的第 一个N-末端氨基酸,在每种情况下都要通过包含在本说明书上下文 中的明确的外部参考或内部参考数字对它们进行表示。
术语“氨基酸”和“氨基酸残基”指所有的天然L-α-氨基酸。此 定义包括正亮氨酸、氨酸和高半胱氨酸。这些氨基酸以单字母或三 字母命名来标出:
Asp D天冬氨酸              Ile I异亮氨酸
Thr T苏氨酸                Leu L亮氨酸
Ser S丝氨酸                Tyr Y酪氨酸
Glu E谷氨酸                Phe F苯丙氨酸
Pro P脯氨酸                His H组氨酸
Gly G甘氨酸                Lys K赖氨酸
Ala A丙氨酸                Arg R精氨酸
Cys C半胱氨酸              Trp W色氨酸
Val V缬氨酸                Gln Q谷氨酰胺
Met M蛋氨酸                Asn N天冬酰胺
Nle J正亮氨酸              Orn O鸟氨酸
Hcy U高半胱氨酸            Xxx X任何L-α-氨基酸。
可按照侧链的化学组成和特性对天然L-α-氨基酸进行分类。广泛 的将它们分为两类,带电荷和不带电荷。将这些组中的每个组分为更 小的亚组,以对这些氨基酸进行更精确的分类:
A.带电荷氨基酸
酸性氨基酸残基:Asp,Glu
性氨基酸残基:Lys,Arg,His,Orn
B.不带电荷的氨基酸
亲水性氨基酸残基:Ser,Thr,Asn,Gln
脂肪族氨基酸残基:Gly,Ala,Val,Leu,Ile,Nle
非极性氨基酸残基:Cys,Met,Pro,Hcy
芳香族氨基酸残基:Phe,Tyr,Trp
术语“氨基酸改变”和“改变”指CTLD氨基酸序列中的氨基酸 替代、缺失或插入或它们的任何结合。在本发明的CTLD变体中,这 样的改变是发生在CTLD氨基酸序列的一个或多个位点上。此处的替 代变体是那些去除了天然CTLD序列中的至少一个氨基酸残基及有插 入到其相同位置中的不同氨基酸的变体。这些替代可为分子中仅仅有 一个氨基酸替代的单替代,或它们也可为相同分子中具有一或多个氨 基酸替代的多重替代。
本文中,替代变体的命名包括字母、随后的数字、以及再后的字 母。第一个(最左端)字母指天然(未改变的)CTLD或含有CTLD 的蛋白中的氨基酸。数字表示进行氨基酸替代处的氨基酸位置,第二 个(最右端的)字母指用来替代天然氨基酸的氨基酸。如上所提及的, 视情况而定,编号从“1”开始,指CTLD或含有CTLD的蛋白的N -末端氨基酸序列。多重改变在命名中以逗号(,)分开,以便于对它 们进行阅读。
术语“编码……的核酸分子”、“编码……的DNA序列”以及“编 码……的DNA”指沿脱氧核糖核酸链的脱氧核糖核苷酸顺序或序列。 这些脱氧核糖核苷酸顺序确定了沿多肽链的氨基酸的顺序。因此DNA 序列编码了这些氨基酸序列。
术语“突变随机化的序列”、“随机化的多肽区段”、“随机化的氨 基酸序列”、“随机化的寡核苷酸”和“突变随机化的序列”以及文中 应用的任何类似术语指随机化序列、多肽或核酸,多肽或核酸序列或 区段的组合,其中一或多个序列位点上的氨基酸残基或核苷酸可能在 多肽或核酸组合的不同成员间有不同,这样每个序列位点上的氨基酸 残基或核苷酸属于可包括所有可能的氨基酸残基或核苷酸或它们的任 何限定亚群在内的一组氨基酸残基或核苷酸。该术语经常用于指各成 员间氨基酸残基或核苷酸数目都相同的组合,但也可用于指其中的每 个组合成员的氨基酸残基或核苷酸数目可为适当整数范围内的任何整 数的组合。
II.组合CTLD文库的构建和应用
在推定的结合组件或具有推定的酶活性的组件方面,已描述了用 于展示表型的几个体系。这些体系包括:噬菌体展示(如丝状噬菌体fd [Dunn(1996),Griffiths amd Duncan(1998),Marks et al.(1992)]、噬菌 体λ[Mikawa et al.(1996)])、在真核病毒(如杆状病毒[Ernst et al. (2000)])上展示、细胞展示(如在细菌细胞[Benhar et al.(2000)]、酵 母细胞[Boder and Wittrup(1997)]、及哺乳动物细胞[Whitehorn et al. (1995)]上展示)、与核糖体连接的展示[Schaffitzel et al.(1999)]以及与 质粒连接的展示[Gates et al.(1996)]。
噬菌体展示是表型展示和将此与表型相联系的最普通的方法。此 展示法是通过将编码支架蛋白或感兴趣的蛋白的阅读框架插入到表面 暴露的噬菌体蛋白的结构域内区段中实现的。已经证明丝状噬菌体 fd(如M13)对于此应用目的是最有用的。多肽、蛋白质结构域或蛋白 质最经常的插入到fd基因III蛋白的″输出″信号和结构域1间或插入 到fd-噬菌体基因III蛋白的结构域2和结构域3间的所谓铰链区中。 人抗体是新结合单位分离中最常用的蛋白,但也可应用其它蛋白和结 构域(如人生长激素[Bass et al.(1990)],碱性磷酸酶[McCafferty et al. (1991)],β-内酰胺酶抑制性蛋白[Huang et al.(2000)],及与细胞毒性T 淋巴细胞相关的抗原4[Hufton et al.(2000)]。
抗体经常以scFv或Fab融合蛋白的形式进行表达和递呈。已经应 用了三种策略。其中或者可将特定抗体用作产生抗原结合隙内的突变 随机化序列文库的支架[如Fuji et al.(1998)],或者将代表未免疫的宿 主[如Nissim et al.(1994)]或免疫后的宿主[如Cyr和Hudspeth(2000)] 中的抗体编码基因的大组合的文库克隆到fd噬菌体载体中。
制备用于产生CTLD文库的展示体系的一般方法基本包括:
(1)如果能够获得3D结构信息,则可通过参考选定的CTLD的 3D结构信息来确定环区的定位,或者如果不能获得3D结构信息,则 可通过与图1中的序列进行序列比对,并在对相应于上文也公开的β2 和β3共有序列元件及β4链特征的序列元件鉴定进行进一步确证的帮 助下确定β2-、β3-和β4链的序列定位;
(2)在先或并不先在编码β2、β3和β4的序列附近插入核酸内切酶 限制性位点的情况下在蛋白展示载体体系中对编码选定的CTLD的核 酸区段进行亚克隆;及
(3)利用从由大多数核酸区段组成的组合中随机选择的成员区段 替代编码选定的CTLD的环区的部分或全部的核酸区段,前者的核酸 区段在插入到编码接受框架的核酸环境中后将会利用随机选择的核酸 区段替代编码原始环区多肽区段的核酸区段。每个编码替代原始环区 段和整个环区的新多肽的克隆核酸区段将在其新序列中确定的阅读框 架中进行阅读。
利用任何普通的核酸分子克隆方法,例如适当设计的、其中化学 合成的核酸拷贝编辑到接受核酸中且不要求插入任何核酸内切酶限制 性位点的PCR操作来在特定位点将核酸区段插入到接受核酸中。可替 代性的,利用核酸分子克隆的标准方法,通过将适当的核酸内切酶限 制性位点工程化到可将适当设计的寡核苷酸区段插入其中的靶核酸 中,就可促进核酸区段的插入/切除作用。
显然的,从为方便起见已将限制性核酸内切酶位点插入其中的 CTLD文库中分离的有趣CTLD变体可含有突变的或额外的、并且不 仅不与原始CTLD中的残基一致、而且对维持CTLD变体有益的新亲 和性并不重要的氨基酸残基。如果需要,如需要尽可能使产物变成非 免疫原性时,可通过特定克隆中的回复突变或缺失对这些残基进行适 当的改变或去除。
通过在核酸区段化学合成的每一步中,使逐步合成法添加纯核苷 酸单体的预定组合或添加任何核苷酸单体组合的混合物,这样就可利 用普通的化学合成方法获得由多数核酸区段组成的组合。这样就可能 产生任何水平的序列简并性,包括从单个独特的核酸序列到最复杂混 合物其完全或不完全代表了4N的最大量的独特序列,其中N为序列中 的核苷酸数目。
替代性的,可通过对高分子量核酸组合物,如从任何生物体中提 取的基因组核酸进行化学、物理和酶法断裂,产生核酸区段混合物, 由此制备由多数核酸区段组成的复杂组合。如此处所描述的,为了使 这些核酸区段混合物能用于产生分子组合,一般要对起始切割步骤中 获得的粗区段混合物进行大小分级分离以获得适当分子量大小范围的 区段,而随后一般将这些区段连接到适当的连接体对上,该连接体对 设计成可促进大小限制性寡核苷酸区段的连接体包埋混合物插入到接 受核酸载体中。
为了促进四柄蛋白中CTLD组合文库的构建,在本发明的优选实 施方案中的模型CTLD中,设计定位在编码人和鼠四柄蛋白β2、β3 和β4的核酸序列附近的合适的限制性位点。发现可以制定一个下文详 述的设计策略,通过其可将相同的核酸内切酶限制性位点导入到两序 列中的相应位点,从而可很容易的从重组鼠CTLD中切出令人感兴趣 的环区变体并将环区变体正确插入到人四柄蛋白CTLD框架中,或相 反操作也可实现。
对编码成熟的人四柄蛋白的核苷酸序列进行的分析表明(图2), 在涉及编码的β2 Glu109、Ile110和Trp111残基在内的326-331 (AGATCT)位点处发现了限制性核酸内切酶Bgl II的识别位点,在涉 及编码的氨基酸残基Gly128和Ala129(定位在环2中的C末端)在内 的382-387(GGCGCC)位点处发现了限制性核酸内切酶Kas I的识别 位点。
在编码人四柄蛋白的核苷酸序列中通过定点诱变将G513突变成 A并将C514突变成T,可在其中导入定位在511-516位点间的Mun I 限制性核酸内切酶识别位点,在编码鼠四柄蛋白的核苷酸序列中将 G513突变成A,则可在其中定位在与人四柄蛋白中的Mun I位点相对 应的位点上导入Mun I限制性核酸内切酶位点,并且不影响编码启动 子的氨基酸序列。在编码鼠四柄蛋白的核苷酸序列中,通过定点诱变 获得的C327到G和G386到C的突变可在其中分别导入Bgl II和Kas I限制性核酸内切酶位点。此外,在编码鼠四柄蛋白的核苷酸序列中的 A325可突变为G。这三种突变可分别将Asn109替代为Glu,将Gly129 替代为Ala,从而影响编码的氨基酸序列。现在,已知限制性核酸内 切酶Kas I展示显著的位点倾向性,并且仅仅缓慢切割四柄蛋白编码 区。因此,优选的是用另一限制性核酸内切酶识别位点替代Kas I位 点(如限制性核酸内切酶Kpn I识别位点,识别序列为GGTACC)。图 3展示了得到的四柄蛋白衍生物、人四柄蛋白凝集素(htlec)和鼠四柄蛋 白凝集素(mtlec)的核苷酸和氨基酸序列。可很容易的将编码htlec和 mtlec启动子的核苷酸序列亚克隆到能够对相连接的核苷酸序列进行 蛋白展示的装置中(如噬菌粒载体)和亚克隆到设计来进行蛋白异源 表达的质粒中[如pT7H6,Christensen et al.(1991)]。也构建了其它仅 仅编码htlec或mtlec的突变CTLD(分别为htCTLD和mtCTLD)的衍 生物,并将它们亚克隆到噬菌粒载体和表达质粒中,图4中展示了这 些CTLD衍生物的核苷酸序列和氨基酸序列。
通过将随机化寡核苷酸连接到经适当限制性消化、编码htlec、 mtlec、htCTLD或mtCTLD衍生物的噬菌粒载体中,使在四柄蛋白和 CTLD衍生物组中存在共同的一套限制性核酸内切酶Bgl II、Kas I 或Kpn I、及Mun I识别位点,可用于产生在一或多个环中及包含凝 集素配基结合区的β4中的单残基位点上具有随机化氨基酸序列的蛋 白质文库。
在对特定靶(如真核细胞、病毒、细菌、特定蛋白、多糖、其它多 聚物、有机化合物等)进行多轮筛选后,可从特定噬菌体分离DNA, 确定编码配基结合区的区段的核苷酸序列,从噬菌粒DNA中切出并转 移到适当的衍生物表达载体中,用于所需产物的异源生产。优选在原 核细胞中进行的异源生产,因为已经报道了有效的四柄蛋白及其衍生 物的分离和重折叠方法(国际专利申请公开WO 94/18227 A2)。
以四柄蛋白作为支架结构,通过应用本发明的技术获得的特别的 优点为,鼠和人四柄蛋白支架的结构几乎是完全相同的,从而可在保 留功能性的情况下使环区在鼠和人四柄蛋白衍生物自由交换。在描述 的四柄蛋白衍生物载体体系中,可很容易的实现鼠和人框架间的环区 交换,并且,鉴于甚至在遗传水平上人和鼠序列间的高水平同源性, 预期此体系可延伸到包括在医学或兽医学方面相关的其它物种(如大 鼠、年龄大的和新出生的猴、狗、牛、绵羊、山羊等)。当从这些物种 中最终将四柄蛋白克隆出来并且/或进行了序列分析,那此策略延伸到 包括更多的物种就成为可能。
由于C型凝集素配基结合区代表了与抗体的抗原结合隙相比有所 不同的拓扑学单位,我们设想选定的结合特异性相对于抗体将会具有 不同的性质。此外,我们设想,在对糖基或多糖结合的特异性方面, 四柄蛋白衍生物相对于抗体会具有优势。在选择针对某些天然或合成 有机化合物的结合特异性方面,四柄蛋白衍生物也具有优势。
已知几种CTLD可结合钙离子,并且与其它配基的结合常常依赖 钙(例如C型凝集素的胶原凝集素族,其中结合在位点2中的钙离子直 接参与对糖配基的结合[Weis和Drickamer(1996)])或对钙敏感(如四 柄蛋白,其中钙离子的结合与原本已知和纤溶酶原kringle 4的结合相 关的多个侧链相关[Graversen et al.(1998)])。
C型类凝集素蛋白族特征性的钙离子结合位点包含定位在环1、 环4和β链4中的残基,并且依赖于脯氨酸残基(在结构中常常横跨 环3和环4)的存在,当进行结合时该残基肯定处于顺式构象。此外, 已知钙离子的结合可增强CTLD环区中的结构改变[Ng et al. (1998a,b)]。因此我们设想,可通过添加或去除二价金属离子(如钙离 子)来调节具有保留的CTLD金属结合位点的组合文库成员与特定靶 配基进行的结合,这是因为金属离子可直接参与结合(因为配基为竞 争性配基),或因为金属离子的结合增强了推定的结合位点内的结构重 排。
在产生具有非常高的结合亲和力的结合位点时,也可利用包括四 柄蛋白在内的C型凝集素和C型类凝集素蛋白家族的几个成员的三 聚性质,以及伴随的结合亲和力。
正如我们从上述公开内容中可领会的,本发明具有宽泛的范围和 宽应用领域。因此,仅仅以例解而不是限制来给出用来描述其多种实 施方案的下列实施例
实施例1
构建四柄蛋白来源的大肠杆菌表达质粒和噬菌粒
利用QuickChangeTM定点诱变试剂盒(Stratagene,La Jolla,CA) 并如操作指南所述进行操作,从表达质粒pT7H6-rTN 123[Holtet et al. (1997)]开始进行4个连续的系列定点诱变试验,构建了编码完全长度 H6FX-htlec融合蛋白的FX-htlec(SEQ ID NO:01)部分的表达质粒 pT7H6FX-htlec。由DNA Technology(Aarhus,Denmark)提供导入所 需突变的错配引物对。图5展示了获得的pT7H6FX-htlec表达质粒的 略图,并且SEQ ID NO:01给出了编码FX-htlec的插入区段的核苷酸 序列。图6展示了H6FX-htlec融合蛋白的FX-htlec部分的氨基酸序 列并在SEQ ID NO:02中给出。
通过扩增并亚克隆到质粒pT7H6中(也即以表达质粒 pT7H6-htlec为模板,在聚合酶链式反应中进行扩增,其它方面,如引 物、条件及亚克隆方法如构建表达质粒pT7H6TN3中所描述的)[Holtet et al.(1997)],构建了编码H6FX-htCTLD融合蛋白的FX-htCTLD (SEQ ID NO:03)部分的表达质粒pT7H6FX-htCTLD。图7展示了获 得的pT7H6FX-htCTLD表达质粒的略图,并且SEQ ID NO:03给出 了编码FX-htCTLD的插入区段的核苷酸序列。图8展示了 H6FX-htCTLD融合蛋白的FX-htCTLD部分的氨基酸序列并以SEQ ID NO:04给出。
利用标准方法,通过分别将从表达质粒pT7H6-rTN 123(利用寡 核苷酸引物5-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGC CACCAACCCAGAAGC-3’[SEQ ID NO:05]和5’-CCTGCGGCCG CCACGATCCCGAACTGG-3’[SEQ ID NO:06])和 pT7H6FX-htCTLD(利用寡核苷酸引物5’-CGGCTGAGCGGCCCA GCCGGCCATGGCCGCCCTGCAGACGGTC-3’[SEQ ID NO:07]和 5’-CCTGCGGCCGCCACGATCCCGAACTGG-3’[SEQ ID NO:06]) 扩增得到的并经Sfi I和Not I限制性消化的DNA区段连接到 Amersham Pharmacia Biotech提供(代码27-9401-01)的预先经Sfi I和 Not I切割的载体pCANTAB 5E中,构建了噬菌粒pPhTN和pPhTN3。 图9和图11分别给出了获得的pPhTN和pPhTN3噬菌粒的略图,并 且SEQ ID NO:08和SEQ ID NO:10分别给出了PhTN和PhTN3插入 区段的核苷酸序列。图10(SEQ ID NO:09)和图12(SEQ ID NO:11)分别 展示了PhTN和PhTN3插入区段编码的氨基酸序列。
利用标准方法,通过分别将从表达质粒pT7H6FX-htlec(利用寡核 苷酸引物5-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCC ACCAACCCAGAAGC-3’[SEQ ID NO:05]和5’-CCTGCGGCC- GCCACGATCCCGAACTGG-3’[SEQ ID NO:06])及 pT7H6FX-htCTLD(利用寡核苷酸引物5’-CGGCTGAGCGGCCC AGCCGGCCATGGCCGCCCTGCAGACGGTC-3’[SEQ ID NO:07] 和5’-CCTGCGGCCGCCACGATCCCGAACTGG-3’[SEQ ID NO:06])扩增得到的并经Sfi I和Not I限制性消化的DNA区段连接到 Amersham Pharmacia Biotech(代码27-9401-01)提供的预先经Sfi I和 Not I切割的载体pCANTAB 5E中,构建了噬菌粒pPhtlec和 pPhtCTLD。图13和15分别展示了获得的pPhtlec和pPhtCTLD噬 菌粒的略图,并且SEQ ID NO:12和SEQ ID NO:14分别给出了Phtlec 和PhtCTLD插入区段的核苷酸序列。图14(SEQ ID NO:13)和图16 (SEQ ID NO:15)分别展示了Phtlec和PhtCTLD插入区段编码的氨基 酸序列。
以下列方式,利用四个连续的DNA亚区段亚克隆,构建了含有相 应于鼠四柄蛋白衍生物mtlec(图3和SEQ ID NO:16)的核苷酸序列的 质粒克隆pUC-mtlec:首先,将两个寡核苷酸 5’-CGGAATTCGAGTCACCCACTCCCAAGGCCAAGAAGGCTGC AAATGCCAAGAAAGATTTGGTGAGCTCAAAGATGTTC-3’(SEQ ID NO:17)和5’-GCGGATCCAGGCCTGCTTCTCCTTCAGCAGG GCCACCTCCTGGGCCAGGACATCCATCCTGTTCTTGAGCTCC TCGAACATCTTTGAGCTCACC-3’(SEQ ID NO:18)退火,进行补平 反应后,利用限制性核酸内切酶Eco RI(GAATTC)和Bam HI (GGATCC)进行切割,将其连接到预先经Eco RI和Bam HI切割的 pUC18质粒DNA中。然后,将一对寡核苷酸5’-GCAGGCCTTA CAGACTGTGTGCCTGAAGGGCACCAAGGTGAACTTGAAGTG CCTCCTGGCCTTCACCCAACCGAAGACCTTCCATGAGGCGAG CGAG-3’(SEQ ID NO:19)和5’-CCGCATGCTTCGAACAGCG CCTCGTTCTCTAGCTCTGACTGCGGGGTGCCCAGCGTGCCCC CTTGCGAGATGCAGTCCTCGCTCGCCTCATGG-3’(SEQ ID NO:20)退火,进行补平反应后,利用限制性核酸内切酶Stu I (AGGCCT)和Sph I(GCATGC)进行切割,再连接到第一次连接产生 的预先经Stu I和Sph I切割的质粒中。接着,将寡核苷酸对 5’-GGTTCGAATACGCGCGCCACAGCGTGGGCAACGATGCGGA GATCTAAATGCTCCCAATTGC-3’(SEQ ID NO:21)和5’-CCAAGC TTCACAATGGCAAACTGGCAGATGTAGGGCAATTGGGAGCAT TTAGATC-3’(SEQ ID NO:22)退火,进行补平反应后,利用限制性核 酸内切酶BstBI(TTCGAA)和HindIII(AAGCTT)进行切割,再连接 到第二次连接产生的预先经BstB I和Hind III切割的质粒中。第四, 将寡核苷酸对5’-CGGAGATCTGGCTGGGCCTCAACGACATGG CCGCGGAAGGCGCCTGGGTGGACATGACCGGTACCCTCCTG GCCTACAAGAACTGG-3’(SEQ ID NO:23)和5’-GGGCAATTGAT CGCGGCATCGCTTGTCGAACCTCTTGCCGTTGGCTGCGCCAG ACAGGGCGGCGCAGTTCTCGGCTTTGCCGCCGTCGGGTTGC GTCGTGATCTCCGTCTCCCAGTTCTTGTAGGCCAGG-3’(SEQ ID NO:24)退火,进行补平反应后,利用限制性核酸内切酶Bgl II (AGATCT)和Mun I(CAATTG)进行切割,之后连接到第三次连接产 生的预先经Bgl II和Mun I切割的质粒中。图17展示了pUC-mtlec 质粒的略图,而SEQ ID NO:16给出了获得的Eco RI到Hind III插 入区段的核苷酸序列。
利用标准方法,通过将分别利用寡核苷酸引物对 5-CTGGGATCCATCCAGGGTCGCGAGTCACCCACTCCCAAGG- 3’(SEQ ID NO:25)和5’-CCGAAGCTTACACAATGGCAAACTG GC-3’(SEQ ID NO:26)及寡核苷酸引物对5’-CTGGGATCCATC CAGGGTCGCGCCTTACAGACTGTGGTC-3’(SEQ ID NO:27)和 5’-CCGAAGCTTACACAATGGCAAACTGGC-3’(SEQ ID NO:26)从 pUC-mtlec质粒扩增得到的经Bam HI和Hind III限制性消化的DNA 区段连接到预先经Bam HI和Hind III切割的pT7H6载体中,构建了 表达质粒pT7H6FX-mtlec和pT7H6FX-mtCTLD。图18和20分别展 示了表达质粒pT7H6FX-mtlec和pT7H6FX-mtCTLD的略图,并且 SEQ ID NO:28和SEQ ID NO:30分别给出了FX-mtlec和FX-mtCTLD 插入区段的核苷酸序列。图19(SEQ ID NO:29)和图21(SEQ ID NO:31)分别展示了融合蛋白H6FX-mtlec和H6FX-mtCTLD融合蛋白 的FX-mtlec和FX-mtCTLD部分的氨基酸序列。
利用标准方法,通过将经Sfi I和Not I限制性消化的DNA区段(分 别利用寡核苷酸引物对5’-CGGCTGAGCGGCCCAGCCGGCC ATGGCCGAGTCACCCACTCCCAAGG-3’[SEQ ID NO:32]和 5’-CCTGCGGCCGCCACGATCCCGAACTGG-3’[SEQ ID NO:33] 以及寡核苷酸引物对5’-CGGCTGAGCGGCCCAGCCGGCCATGG CCGCCTTACAGACTGTGGTC-3’[SEQ ID NO:34]和5’-CCTGC GGCCGCCACGATCCCGAACTGG-3’[SEQ ID NO:33]从 pUC-mtlec质粒扩增得到的)连接到Amersham Pharmacia Biotech (代码27-9401-01)提供的预先经Sfi I和Not I切割的载体pCANTAB 5E 中,构建了噬菌粒pPmtlec和pPmtCTLD。图22和24分别展示了 pPmtlec和pPmtCTLD质粒的略图,SEQ ID NO:35和SEQ ID NO:37 分别给出了Pmtlec和PmtCTLD插入区段的核苷酸序列。图23(SEQ ID NO:36)和图25(SEQ ID NO:38)分别展示了Pmtlec和PmtCTLD 插入编码的氨基酸序列。
实施例2
Phtlec和PhTN3在噬菌体上成功展示的证实
为了验证Phtlec和PhTN3 Gene III融合蛋白确实能够利用重组噬 菌体颗粒进行展示,所以将噬菌粒pPhtlec和pPhTN3(实施例1中描述 的)转化到大肠杆菌TG1细胞中,并且利用辅助噬菌体M13KO7感染来 制得重组噬菌体。利用聚乙二醇(PEG8000)沉淀对重组噬菌体进行分 离,并对Phtlec和PhTN3噬菌体制品及辅助噬菌体样品进行ELISA-型 “三明治”检验,其中Maxisorb(Nunc)多孔平板的孔首先在抗人四柄 蛋白和牛血清白蛋白(BSA)中孵育,并在脱脂乳或脱脂乳/EDTA中进行 封闭。简单来讲,在37℃下、添加有2%葡萄糖和100mg/L氨苄青霉 素的2×TY-培养基中培养pPhtlec和pPhTN3噬菌粒转化的TG1细胞培 养物,直至其A600达到0.5。到那时,向其中添加辅助噬菌体M13KO7 至浓度为5×109pfu/mL。在37℃下将培养物另外培养30分钟,随后离 心收获细胞,并将其重新悬浮到相同培养体积的、添加有50mg/L卡那 霉素和100mg/L氨苄青霉素的2×TY培养基中,并转移到新鲜的锥形瓶 中,在25℃下培养16小时。离心除去细胞,通过添加6mL冰冷的20% PEG8000、2.5M NaCl而从20mL培养上清液中使噬菌体沉淀出来。混 合后,使溶液在冰上放置1小时,并在4℃下离心以分离沉淀的噬菌体。 将噬菌体沉淀物重新悬浮在1mL 10mM tris-HCl pH8、1mM EDTA(TE)中,并在离心前孵育30min。将含有噬菌体的上清液转移到 新鲜试管中。在制备噬菌体样品的同时,利用1∶2000稀释的(70μL)兔 抗人四柄蛋白(DAKO A/S提供的多克隆抗体,代码A0371)或(70μL) BSA(10mg/mL)将Maxisorb平板各孔包被过夜。包被后利用PBS (2.68mM KCl,1.47mM KH2PO4,137mM NaCl,8.10mM Na2HPO4, pH7.4)冲洗孔三次,并在37℃下利用280μL添加3%脱脂乳的PBS或添 加3%脱脂乳、5mM EDTA的PBS封闭1小时。随后将抗四柄蛋白包被 的和BSA包被的孔与人Phtlec-、PhTN3-或辅助噬菌体样品共孵育1小 时,并随后利用添加有适当封闭剂的PBS缓冲液冲洗3次。在与缀合 HRP的抗噬菌体缀合物(Amersham Pharmacia,代码27-9421-01)共孵 育并随后冲洗后,对孔中的噬菌体进行检测。随后,利用标准的HRP产 色底物测定法在96孔ELISA阅读仪中测定HRP的活性。
不管封闭试剂中存在或不存在EDTA,Phtlec和PhTN3噬菌体在 检验中产生了强响应(14倍于背景),而辅助噬菌体在两种封闭剂中 没有产生高于背景读数的响应。仅仅观察到与BSA的低程度结合(图 26)。
因此,我们可得出结论,人Phtlec和PhTN3噬菌体都展示出可 为抗人四柄蛋白抗体特异性识别的表位。
实施例3
在噬菌体上展示的Phtlec和PhTN3的真实配基结合特性的证实
人四柄蛋白的CTLD结构域的脱辅基以对赖氨酸敏感的方式特异 性结合到人纤溶酶原kringle 4结构域上[Graversen et al.(1998)]。钙 或赖氨酸类似物如AMCHA(6-氨基-环己酸)可抑制四柄蛋白对纤溶酶 原的结合,其中钙能够结合到CTLD结构域的配基结合位点中的两个 位点上(Kd约为0.2mM),而赖氨酸类似物能够特异性结合到纤溶酶 原中两个更强的赖氨酸结合位点上(Kd约为15mM),这两个位点中一 个定位在kringle 1中,另一个定位在kringle 4中。
为了证明人Phtlec和PhTN3噬菌体对人纤溶酶原的特异性 AMCHA敏感性结合,设计了与应用来证明在噬菌体颗粒上存在展示 的Phlec和PhCTLD GIII融合蛋白的ELSISA检验(见实施例2)相似的 检验。
利用添加或未添加5mM AMCHA的人纤溶酶原溶液(10μg/mL)包 被平板各孔。对照孔利用BSA进行包被。设计了两个完全相同的检验, 一个利用3%脱脂乳封闭过剩的结合活性,另一个利用添加5mM EDTA的3%脱脂乳封闭过剩的结合活性。适当情况下,封闭溶液、洗 涤溶液和噬菌体贮存液中添加5mM AMCHA。将两组孔与Phtlec-、或 PhTN3-、或辅助噬菌体样品进行共孵育,冲洗后,如上文所述利用缀 合HRP的抗噬菌体抗体测定每个孔中结合的噬菌体量。结果如图27中 panel A和B所示,总结如下:
(a)在不存在AMCHA的情况下,利用任何封闭剂时,人Phtlec噬 菌体与纤溶酶原包被的孔的结合产生了8-10倍于背景水平的响应,而 人PhTN3噬菌体产生了4倍(不存在EDTA)或7倍(存在EDTA的情况下) 于背景响应水平的响应。
(b)在存在5mM AMCHA的情况下,发现人Phtlec-和PhTN3噬菌 体与纤溶酶原的结合受到完全破坏。
(c)Phtlec和PhTN3噬菌体没有展示对BSA的结合,并且对照辅助 噬菌体没有展示出对任何固定化物质的结合。
(d)在利用组合噬菌体技术领域中众所周知的、优选用以减少非特 异性结合的脱脂乳封闭试剂时,可非常高效地检测到人Phtlec和 PhTN3噬菌体对特异性配基的中等结合强度(约20mM的水平)的特 异性结合,并且几乎没有背景。
总之,结果表明,在噬菌体颗粒上展示的Phtlec和PhTN3 Gene III 融合蛋白展示出与那些真实的四柄蛋白相对应的纤溶酶原结合特性, 并且Phtlec和PhTN3噬菌体的物理和生化特性与将它们用作载体以 产生组合文库的预期用途是很相容的,从这样的文库中可筛选具有新 结合特性的CTLD衍生单位。
实施例4
构建噬菌体文库Phtlec-lb001和Phtlec-lb002
本实施例中应用的所有寡核苷酸全部由DNA Technology(Aarhus, Denmark)提供。
通过将20μg经KpnI和MunI限制性消化的pPhtlec噬菌粒DNA (见实施例1)与利用标准条件从寡核苷酸htlec-lib1-tp(SEQ ID NO:39) 扩增得到的10ug经Kpn I和Mun I限制性消化的DNA区段连接,构 建了含有相应于Phtlec(SEQ ID NO:12)位点141-146(环3)、150-153 (环4的一部分)及残基168(β4中的Phe)的随机氨基酸残基的噬菌体文 库Phtlec-lb001,其中N表示核苷酸T、C、G和A分别各占25%的 混合物,S表示C和G各50%的混合物,其编码适当随机化的核苷酸 序列的,并且寡核苷酸htlec-lib1-rev(SEQ ID NO:40)和htlec-lib1/2-fo (SEQ ID NO:41)用作引物。利用标准方法,通过电穿孔方式利用连接 混合物转化所谓的电感受态大肠杆菌TG-1细胞。转化后,将大肠杆 菌TG-1涂布到含有0.2mg氨苄青霉素/mL和2%葡萄糖的2×TY-琼脂 平板上并在30℃下培养过夜。
通过将20μg经BglII和MunI限制性消化的pPhtlec噬菌粒DNA (见实施例1)与利用标准条件从寡核苷酸对htlec-lib2-tprev(SEQ ID NO:42)和htlec-lib2-tpfo(SEQ ID NO:43)扩增得到的15ug经BglII 和MunI限制性消化的DNA区段连接,构建了含有相应于Phtlec(SEQ ID NO:12)位点121-123、125和126(环1的绝大部分)以及残基150-153 (环4的一部分)的随机氨基酸残基的噬菌体文库Phtlec-lb002,其中N 表示核苷酸T、C、G和A分别各占25%的混合物,S表示C和G各 为50%的混合物,其编码适当随机化的核苷酸序列,并且寡核苷酸 htlec-lib2-rev(SEQ ID NO:44)和htlec-lib1/2-fo(SEQ ID NO:41)用 作引物。利用标准方法,通过电穿孔方式利用连接混合物转化所谓的 电感受态大肠杆菌TG-1细胞。转化后,将大肠杆菌TG-1涂布到含有 0.2mg氨苄青霉素/mL和2%葡萄糖的2×TY-琼脂平板上并在30℃下 培养过夜。
确定了文库Phtlec-lb00l和-1b002的滴度分别为1.4×109及3.2× 109克隆。对每个文库中的6个克隆进行培养,并利用标准的小量制备 方法分离噬菌粒DNA确定环区的核苷酸序列(DNA Technology, Aarhus,Denmark)。由于技术原因,每个文库中的一个克隆没有能够 提供可靠的核苷酸序列,而Phtlec-lib001中的一个克隆显然含有一个 主要缺失。表3展示了与Phtlec(SEQ ID NO:12)相比,其它9个克隆 (lb001-1,lb001-2,lb001-3,lb001-4,lb002-1,lb002-2,lb002-3,lb002-4 和lb002-5)的环区核苷酸序列的变异。
表3:从Phtlec-lb001和-lb002文库中分离的Phtlec环衍生物的变 异(标出了β2和β3的共有元件) 克隆                                      环区序列 Phtlec        120                           130                           140                           150                    160         ′                            ′                            ′                            ′                    ′  β2-N  D  M  A  A  E  G  T  W  V  D  M  T  G  T  R  I  A  Y  K  N  W  E  T  E  I  T  A  Q  P  D  G  G  K  T  E  N -β3-S  G  A  A  N  G  K  W  F  D   - AACGACATGGCGGCCGAGGGCACCTGGGTGGACATGACCGGTACCCGCATCGCCTACAAGAACTGGGAGACTGAGATCACCGCGCAACCCGATGGCGGCAAGACCGAGAAC -- TCAGGCGCGGCCAACGGCAAGTGGTTCGAC lb001-1                                                                        H  G  W  R  T  R           A  N  E */Q                                  V                                                                       CACGGCTGGCGGACCCGG         GCCAACGAGTAG                                  GTC lb001-2                                                                        I*/Q S  E  V  E           D  W*/Q T                                   G                                                                       ATCTAGACGGAGGTCGAG         GACTGGTAGACC                                  GGG lb001-3                                                                        A  G  G  K  W  R           G  G  L  G                                    K                                                                       GCGGGCGGGAAGTGGCGG         GGCGGCCTGGGC                                  AAG lb001-4                                                                        Q  R  V  E  C  G           E  A  V  C                                    N                                                                       CAGAGGGTGGAGTCGGGG         GAGGCGGTCTGC                                  AAC lb002-1        A  M  S      G  R                                                                          P  I  C  R       GGCATGAGC    GGGCGG                                                                        CCCATCTGCCGG lb002-2        E  A  W      T  E                                                                          Q  E  C  S       GAGGCCTGG    ACGGAG                                                                        CAgCACTGCTOC lb002-3        A  Q  D      P  R                                                                          S  L  L  T       GCGCAGGAC    CCGCGG                                                                        TCGCTCCTGACC lb002-4        K  A  R      K   R                                                                         D  P  P  P       AAGGCGCGG    AAGAGGA                                                                       GACCCCCCCCCC lb002-5        -  -  -  -   R  P                                                                          I  A  R*/Q       -------------CGCCCG                                                                        ATCGCGAGGTAG
实施例5
构建噬菌体文库PhtCTLD-lb003
本实施例中应用的所有寡核苷酸全部由DNA Technology(Aarhus, Denmark)提供。
通过将20μg经BglII和MunI限制性消化的pPhtCTLD噬菌粒 DNA(参见实施例1)与编码适当随机化的环1和环4区的10μg经BglII 和MunI限制性消化的DNA区段群相连接,构建了含有相应于 PhtCTLD(SEQ ID NO:15)位点77-79、81-82(环1)及108-109(环4) 的随机氨基酸残基的噬菌体文库PhtCTLD-lb003,其中环1中具有或 不具有两和三个随机残基插入,而环4中具有三和四个随机残基插入。 以三个环1 DNA区段之一与两个环4 DNA区段之一的混合物为模板, 以寡核苷酸TN-lib3-rev(SEQ ID NO:45)and loop 3-4-5tagfo(SEQ ID NO:46)为引物,利用标准的方法,从6个所谓的组装反应扩增得 到了DNA区段群。通过标准方法,以寡核苷酸loop1b(SEQ ID NO: 47)、loop1c(SEQ ID NO:48)或loopld(SEQ ID NO:49)为模板,以寡 核苷酸TN-lib3-rev(SEQ ID NO:45)和TN-KpnI-fo(SEQ ID NO:50) 为引物,在反应中扩增三个环1区段中的每个区段;以寡核苷酸loop4b (SEQ ID NO:51)或loop4c(SEQ ID NO:52)为模板,以寡核苷酸 loop3-4rev(SEQ ID NO:53)和loop3-4fo(SEQ ID NO:54)为引物,在 反应中扩增两个DNA环4区段中的每个区段。在寡核苷酸序列中,N 表示核苷酸T、C、G和A分别各占25%的混合物,S表示C和G各 为50%的混合物,编码适当随机化的核苷酸序列。利用标准方法,通 过电穿孔方式利用连接混合物转化所谓的电感受态大肠杆菌TG-1细 胞。转化后,将大肠杆菌TG-1涂布到含有0.2mg氨苄青霉素/mL和 2%葡萄糖的2×TY-琼脂平板上,并在30℃下培养过夜。
确定了得到的文库PhtCTLD-lb003的大小为1.4×1010个克隆。 对文库中的24个克隆进行培养,并分离噬菌体和噬菌粒DNA。确定 环区的核苷酸序列(DNA Technology,Aarhus,Denmark),并利用标准 方法,以缀合HRP的抗gene VIII(Amersham Pharmacia Biotech)作 为二抗,利用ELISA-type检验分析其与抗四柄蛋白的多克隆抗体即 抗TN(DAKO A/S,Denmark)的结合。我们发现,18个克隆含有正确 的环插入区段,一个克隆含有野生型环区序列,一个克隆含有主要的 缺失,两个克隆含有两或多个序列,两个克隆含有存在于环区中的移 框突变。具有正确环插入区段的18个克隆中的13个克隆、野生型克 隆、以及混合分离物中的一个分离物与多克隆抗TN抗体反应强烈。 18个正确克隆中的3个克隆与抗体反应很弱,然而,两个正确克隆、 缺失突变体、一个混合分离物以及两个移框突变体没有展示高于背景 的信号。
实施例6
利用对抗TN抗体的生物淘选进行噬菌体筛选
利用标准方法,通过在Maxisorb immunotube(NUNC,Denmark) 中进行淘选,在多克隆抗TN抗体上对取自PhtCTLD-lb003文库中的 约1011个噬菌体进行两轮筛选。在进行了第二轮筛选后,对平皿接种 的7×107个克隆中的15个克隆进行培养,噬菌粒DNA进行分离,对 核酸序列进行确定。发现所有的15个克隆都编码正确的且不同的环序 列。
实施例7
CTLD-噬菌体在纤溶酶原上的模型筛选 I:淘选后利用胰蛋白酶消化进行洗脱
为了证明能够从一群噬菌体中选择出具有源自四柄蛋白的CTLD 噬菌体,在96孔Maxisorb微滴定板(NUNC,Denmark)中、以人纤溶 酶原为抗原通过淘选进行的选择试验中,选用了含有从M13K07辅助 噬菌体感染后利用噬菌粒pPhtCTLD(参见实施例1)转化的大肠杆菌 TGl培养物中分离的PhtCTLD噬菌体与从M13K07辅助噬菌体感染 后利用噬菌粒pPhtCPB转化的培养物中分离的噬菌体的混合物,其中 这两种噬菌体的比率分别为1∶10和1∶105。通过将具有适当限制性酶 突出末端序列的双链寡核苷酸(SEQ ID NO:55)连接到经KpnI和 MunI限制性消化的pPhtCTLD噬菌粒DNA中,构建了pPhtCPB噬 菌粒。由于翻译终止密码子被导入到生成的pPhtCPB噬菌粒(SEQ ID NO:56)的CTLD编码区,所以因利用辅助噬菌体进行感染获得的 pPhtCBP噬菌体仅仅展示野生型M13 gene III蛋白。
利用标准的方法,在96孔微滴定板中进行筛选实验。简单来讲, 在每个孔中,利用溶于100μL PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4,2H20,加水至1L,利用NaOH调节pH7.4)的 3μg人纤溶酶原或100μL PBS(用于分析非特异性结合),在4℃包被过 夜,在37℃包被1小时。利用PBS冲洗一次后,在37℃下利用400μL PBS和3%脱脂乳封闭孔1小时。封闭完成后,利用PBS和0.1%Tween 20将孔冲洗一次,利用PBS冲洗三次,然后向其中添加悬浮在100μL PBS、3%脱脂乳中的噬菌体。使噬菌体在37℃下进行1小时的结合, 然后利用PBS、Tween 20冲洗3次和利用PBS冲洗3次。室温下,通 过100ul(1mg/mL胰蛋白酶的PBS溶液)进行胰蛋白酶消化30min来从 每个孔中洗脱结合的噬菌体,并利用洗脱的噬菌体感染指数增长的大 肠杆菌TG1细胞,然后在添加有2%葡萄糖和0.1mg/ml氨苄青霉素的 2×TY琼脂平板上进行涂布和滴定。
最开始(第一轮),选用了1012个PhtCTLD噬菌体(A系列)、1010 个PhtCTLD噬菌体和1011个PhtCPB噬菌体的混合物(B系列)或106 个PhtCTLD和1011个PhtCPB噬菌体的混合物(C系列)。随后(第二 轮),选用了每个系列中的1011个噬菌体。表4总结了这两轮筛选的结 果。
表4:利用淘选和胰蛋白酶洗脱进行PhtCTLD和PhtCPB混合物 筛选     纤溶酶原   (*105个集落)     空白   (*105个集落)   第1轮  A   B   C   第2轮  A   B   C     113.0     1.8     0.1     49     5.2     0.3     19.50     1.10     0.30     0.10     0.20     0.04
从第二轮涂布得到的12个克隆和起始噬菌体混合物涂布得到的5 个克隆中分离了噬菌粒DNA,并确定了CTLD区的核苷酸序列。 PhtCTLD/PhtCPB的起始1/10混合物(B系列)中,1/5鉴定为CTLD 序列。起始1/105混合物(C系列)中,所有5个序列都源自pPhtCPB 噬菌粒。第二轮筛选后,从B系列中分析的12个序列中有9个序列以 及C系列中的所有12个序列都源自pPhtCTLD噬菌粒。
实施例8
CTLD-噬菌体在纤溶酶原上的模型筛选 II:淘选后利用0.1M三乙按进行洗脱
为了证明能够从一群噬菌体中选择含源自四柄蛋白的CTLD的噬 菌体,在96孔Maxisorb微滴定板(NUNC,Denmark)中、以人纤溶酶 原为抗原通过淘选进行的选择试验中,选用了M13K07辅助噬菌体感 染后从噬菌粒pPhtCTLD(参见实施例1)转化的大肠杆菌TG1培养物 中分离的PhtCTLD噬菌体与M13K07辅助噬菌体感染后从噬菌粒 pPhtCPB(参见实施例6)转化的培养物中分离的噬菌体组成的混合 物,其中这两种噬菌体的比率分别为1∶102和1∶106。
简单来讲,在每个孔中,利用溶于100μL PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4,2H20,加水至1L,利用NaOH调节 至pH7.4)的3μg人纤溶酶原或100μL PBS(用于非特异性结合分析) 在4℃包被过夜,在37℃包被1小时。利用PBS冲洗一次后,在37℃ 下利用400μL PBS和3%脱脂乳封闭孔1小时。封闭完成后,利用PBS 和0.1%Tween 20将孔冲洗一次,利用PBS冲洗三次,然后向其中添 加悬浮在100μL PBS、3%脱脂乳中的噬菌体。使噬菌体在37℃下 进行1小时的结合,然后在利用PBS、Tween 20冲洗15次,利用PBS 冲洗15次。室温下,通过100ul 0.1M三乙胺从每个孔中洗脱结合的 噬菌体,为时10分钟,经0.5vol.1M Tris-HCl pH7.4中和后,利用 洗脱的噬菌体感染指数增长的大肠杆菌TG1细胞,然后在添加有2% 葡萄糖和0.1mg/ml氨苄青霉素的2×TY琼脂平板上进行涂布和滴定。
最开始(第一轮),选用了1012个PhtCTLD噬菌体(A系列)、109 个PhtCTLD噬菌体和1011个PhtCPB噬菌体的混合物(B系列)或105 个PhtCTLD和1011个PhtCPB噬菌体的混合物(C系列)。随后(第二 轮),选用了每个系列中的1011个噬菌体。表5总结了这两轮筛选的结 果。
表5:通过三乙胺淘选洗脱筛选PhtCTLD和PhtCPB混合物     纤溶酶原     (*104个集落)     空白     (*104个集落)   第1轮  A   B   C   第2轮  A   B   C   第3轮  A   B   C     18     0.5     0.25     n.d.     5.0     1.8     n.d.     11     6.5     0.02     0.00     0.02     n.d.     0.00     0.02     n.d.     0.00     0.02 n.d.=未测
利用标准方法培养从第二轮筛选得到的A和B系列的噬菌体混合 物,并利用ELISA-type检验分析其与纤溶酶原的结合。简单来讲,在 每个孔中,利用溶于100μL PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4,2H20,加水至1L,利用NaOH调节至pH7.4) 的3μg纤溶酶原或100μL PBS(用于非特异性结合分析)在4℃下包被 过夜,在37℃下包被1小时。利用PBS冲洗一次后,在37℃下利用 400μL PBS和3%脱脂乳封闭孔1小时。封闭完成后,利用PBS和0.1% Tween 20将孔冲洗一次,利用PBS冲洗一次,然后向其中添加悬浮在 100μL PBS、3%脱脂乳中的噬菌体。使噬菌体混合物在37℃下进行 1小时的结合,然后利用PBS、Tween 20冲洗3次,利用PBS冲洗3 次。冲洗完成后,向每个孔中添加溶于PBS、3%脱脂乳的50μL 1∶5000 稀释的缀合HRP的抗-gene VIII抗体(Amersham Pharmacia Biotech) 并在37℃下孵育1小时。在与“第二”抗体结合后,每孔利用PBS、 Tween 20冲洗3次,利用PBS冲洗3次,随后向其中添加50μL TMB 底物(DAKO-TMB One-Step Substrate System,代码:S1600,DAKO, Denmark)。反应进行20min,随后利用0.5vol.0.5M H2SO4使其终止, 并进行分析。ELISA分析结果进一步证实了此两个系列中噬菌体与纤 溶酶原特异性结合(图28)。
实施例9
从Phtlec-lb002文库中筛选与母鸡卵白溶菌酶结合的噬菌体
在利用标准方法、涉及系列淘选、用以筛选与母鸡卵白溶菌酶结 合的噬菌体的试验中,应用了源自Phtlec-lb002文库(参见实施例4)但 大小约为原始文库的250倍的1.2×1012个噬菌体。
简单来讲,利用溶于1mL PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4,2H20,添水至1L,利用NaOH调至pH7.4)的 30μg母鸡卵白溶菌酶或1mL PBS(用于非特异性结合分析)分别在4℃ 包被Maxisorb immunotubes(NUNC,Denmark)过夜和37℃下包被1 小时。利用PBS冲洗一次后,在37℃下向试管中注入PBS和3%脱 脂乳并封闭1小时。封闭完成后,利用PBS和0.1%Tween 20将管冲 洗一次,利用PBS冲洗3次,然后向其中添加悬浮在1ml PBS、3%脱 脂乳中的噬菌体。使噬菌体在37℃下进行1小时的结合,然后在利 用PBS、Tween 20冲洗6次和利用PBS冲洗6次。室温下,通过用 1ml 0.1M三乙胺从每个孔中洗脱结合的噬菌体,为时10分钟,经1M Tris-HCl pH7.4中和后,利用洗脱的噬菌体感染指数增长的大肠杆菌 TG1细胞,然后在添加有2%葡萄糖和0.1mg/ml氨苄青霉素的2×TY 琼脂平板上进行涂布和滴定。在随后的多轮筛选中,淘选步骤应用了 源自在经从溶菌酶包被的试管洗脱下的噬菌体感染后涂布的克隆培养 物中的约1012个噬菌体。然而,通过在噬菌体淘选后将冲洗次数由6 次增至10次,提高了结合的严格性。
表7展示了筛选步骤的结果
表7:通过淘选从Phtlec-lb002文库中选择结合溶菌酶的噬菌体     第1轮     第2轮     第3轮     溶菌酶     2.4*104     3.5*103     3.2*105     空白     n.a.     4.0*102     2.5*102     比例     n.a.     9     1.3*103
n.a.=不适用
为了对结合特异性进行分析,利用标准方法培养从第3轮筛选得 到的12个克隆中的噬菌体,并利用ELISA-type检验分析其与母鸡卵 白溶菌酶和人β2-微球蛋白的结合。简单来讲,在每个孔中,利用溶于 100μL PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4, 2H20,加水至1L,利用NaOH调节至pH7.4)的3μg母鸡卵白溶菌酶 或3μg人β2-微球蛋白或100μL PBS(用于非特异性结合分析)在4℃ 下包被过夜和在37℃下包被1小时。利用PBS冲洗一次后,在37℃ 下利用400μL PBS和3%脱脂乳封闭孔1小时。封闭完成后,利用PBS 和0.1%Tween 20将孔冲洗一次,利用PBS冲洗3次,然后向其中添 加悬浮在100μL PBS、3%脱脂乳中的噬菌体。使噬菌体在37℃下 进行1小时的结合,然后利用PBS、Tween 20冲洗3次和利用PBS 冲洗3次。冲洗完成后,向每个孔中添加溶于PBS、3%脱脂乳的50μL 1∶5000稀释的缀合HRP的抗-gene VIII抗体(Amersham Pharmacia Biotech)并在37℃下孵育1小时。在与“第二”抗体结合后,每孔利 用PBS、Tween 20冲洗3次,利用PBS冲洗3次,随后向其中添加 50μL TMB底物(DAKO-TMB One-Step Substrate System,code: S1600,DAKO,Denmark)。反应进行20min,随后利用0.5M H2SO4使其终止。
图29中总结的结果显示了对溶菌酶有相对弱但特异性的结合。
实施例10
构建源自大白鼠甘露糖结合蛋白CTLD(r-MBP)的噬菌粒 (pPrMBP)和源自人表面活性剂蛋白D CTLD(h-SP-D)的噬菌粒 (pPhSP-D)
利用标准方法,通过将从大白鼠肝脏分离的cDNA扩增得到的、 并经Sfi I和Not I限制性消化的DNA区段(Drickamer,K.,et al.,J. Biol.Chem.1987,262(6):2582-2589)(扩增中利用寡核苷酸引物 SfiMBP 5′-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCCA AACAAGTTGCATGCCTTCTCC-3′[SEQ ID NO:62]和NotMBP 5′-GCACTCCTGCGGCCGCGGCTGGGAACTCGCAGAC-3′[SEQ ID NO:63])连接到Amersham Pharmacia Biotech(代码27-9401-01)提 供的预先经Sfi I和Not I切割的载体pCANTAB 5E中,构建了噬菌粒 pPrMBP。图31展示了获得的pPrMBP的略图,并给出了PrMBP的 核苷酸序列(SEQ ID NO:58)。图30展示了由PrMBP插入区段编码的 氨基酸序列(SEQ ID NO:59)。
利用标准方法,通过将从人肺分离的cDNA扩增得到的、并经Sfi I和Not I限制性消化的DNA区段(Lu,J.,et al.,Biochem J.1992jun 15;284:795-802)(扩增中利用寡核苷酸引物SfiSP-D 5′-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCCAAAGAA AGTTGAGCTCTTCCC-3′[SEQ ID NO:64]和NotSP-D 5′-GCACTCCTGCGGCCGCGAACTCGCAGACCACAAGAC-3′ [SEQ ID NO:65])连接到Amersham Pharmacia Biotech(代码 27-9401-01)提供的预先经Sfi I和Not I切割的载体pCANTAB 5E中, 构建了噬菌粒pPhSP-D。图33展示了获得的pPhSP-D的略图,并给 出了PhSP-D的核苷酸序列(SEQ ID NO:60)。图32展示了由PhSP-D 插入区段编码的氨基酸序列(SEQ ID NO:61)。
实施例11
构建噬菌体文库PrMBP-lb001
通过将20μg经SfiI和NotI限制性消化的pPrMBP噬菌粒DNA (参见实施例10)与编码适当随机化的环1和环4区的10ug经SfiI和 NotI限制性消化的DNA区段群连接,构建了含有对应于PrMBP CTLD(SEQ ID NO:59)位点71-73或70-76(环1)及97-101或100-101 (环4)的随机氨基酸残基的噬菌体文库PrMBP-lb001。将组合3个环1 DNA区段之一与3个环4 DNA区段之一的9个组装反应为模板,以 寡核苷酸Sfi-标记5′-CGGCTGAGCGGCCCAGC-3′(SEQ ID NO:74) 和Not-标记5′-GCACTCCTGCGGCCGCG-3′(SEQ ID NO:75)为引 物,利用标准方法,扩增得到了DNA区段群。以pPrMBP噬菌粒DNA (参见实施例10)为模板,以寡核苷酸MBPloop1a fo(SEQ ID NO:66)、 MBPloop1b fo(SEQ ID NO:67)或MBPloop1c fo(SEQ ID NO:68)以及 SfiMBP(SEQ ID NO:62)为引物,在第一次PCR反应中扩增三个环1 区段中的每个区段,并利用Sfi-tag(SEQ ID NO:74)和MBPloop1-tag fo(SEQ ID NO:69)进行第二次PCR反应以进行进一步扩增。以 pPrMBP噬菌粒DNA(参见实施例10)为模板,以寡核苷酸MBPloop4a rev(SEQ ID NO:71)、MBPloop4b rev(SEQ ID NO:72)或MBPloop4c rev(SEQ ID NO:73)以及NotMBP(SEQ ID NO:63)为引物,利用标准 方法,在第一次PCR反应中扩增3个DNA环4区段中的每个区段, 并利用MBPloop4-tag rev(SEQ ID NO:70)和Not-tag(SEQ ID NO:63) 进行第二次PCR,以进一步进行扩增。在寡核苷酸序列中,N表示核 苷酸T、C、G和A分别各占25%的混合物,S表示C和G各为50 %的混合物,编码适当随机化的核苷酸序列。利用标准方法,通过电 穿孔方式利用连接混合物转化所谓的电感受态大肠杆菌TG-1细胞。 转化后,将大肠杆菌TG-1细胞涂布到含有0.2mg氨苄青霉素/mL和 2%葡萄糖的2×TY-琼脂平板上并在30℃下培养过夜。
实施例12
构建噬菌体文库PhSP-D-lb001
通过将20μg经SfiI和NotI限制性消化的pPhSP-D噬菌粒DNA (参见实施例10)与编码适当随机化的环1和环4区的10ug经SfiI和 NotI限制性消化的DNA区段群连接,构建了含有对应于PhSP-D CTLD插入区段(SEQ ID NO:61)位点74-76或73-79(环1)及100-104 或103-104(环4)的随机氨基酸残基的噬菌体文库PhSP-D-lb001。将组 合3个环1 DNA区段之一与3个环4 DNA区段之一的9个组装反应 为模板,以寡核苷酸Sfi-标记5′-CGGCTGAGCGGCCCAGC-3′(SEQ ID NO:74)和Not-标记5′-GCACTCCTGCGGCCGCG-3′(SEQ ID NO:75)为引物,利用标准方法,扩增DNA区段群。以pPhSP-D噬菌 粒DNA(参见实施例10)为模板,以寡核苷酸Sp-dloop1a fo(SEQ ID NO:76)、Sp-dloop1b fo(SEQ ID NO:77)或Sp-dloop1c fo(SEQ ID NO:78)以及SfiSP-D(SEQ ID NO:64)为引物,在第一次PCR反应中 扩增得到了三个环1区段中的每个区段,并利用Sfi-tag(SEQ ID NO:74)和Sp-dloop1-tag fo(SEQ ID NO:79)为引物在PCR中进一步进 行扩增。以pPhSP-D噬菌粒DNA(参见实施例10)为模板,以寡核苷 酸Sp-dloop4a rev(SEQ ID NO:81)、Sp-dloop4b rev(SEQ ID NO:82) 或Sp-dloop4c rev(SEQ ID NO:83)以及NotSP-D(SEQ ID NO:65)为引 物,利用标准方法在第一次PCR反应中扩增3个DNA环4区段中的 每个区段,并以Sp-dloop4-tag rev(SEQ ID NO:80)和Not-tag(SEQ ID NO:75)为引物进行PCR以进一步进行扩增。在寡核苷酸序列中,N表 示核苷酸T、C、G和A分别各占25%的混合物,S表示C和G各为 50%的混合物,编码适当随机化的核苷酸序列。利用标准方法,通过 电穿孔方式利用连接混合物转化所谓的电感受态大肠杆菌TG-1细胞。 转化后,将大肠杆菌TG-1细胞涂布到含有0.2mg氨苄青霉素/mL和 2%葡萄糖的2×TY-琼脂平板上并在30℃下培养过夜。
实施例13
构建噬菌体文库PhtCTLD-lb004
本实施例中应用的所有寡核苷酸皆由DNA Technology(Aarhus, Denmark)提供。
通过将20μg经KpnI和MunI限制性消化的pPhtCTLD噬菌粒 DNA(参见实施例1)与编码适当随机化的环3和环5区的10ug经KpnI 和MunI限制性消化的DNA区段群连接,构建了含有相应于PhtCTLD (SEQ ID NO:15)位点97-102或98-101(环3)以及位点116-122或 118-120(环5)的随机氨基酸残基的噬菌体文库PhtCTLD-lb004。从组 合3个环5 DNA区段中的每个区段与3个环3 DNA区段中的每个DNA 区段的9个第一次PCR反应物中扩增得到了DNA区段群。这些区 段是以寡核苷酸loop3a(SEQ ID NO:84)、loop3b(SEQ ID NO:85)或 loop3c(SEQ ID NO:86)为模板、以loop5a(SEQ ID NO:87)、 loop5b(SEQ ID NO:88)或loop5c(SEQ ID NO:89)及loop3-4rev(SEQ ID NO:91)为引物进行扩增得到的。以第一次PCT产物为模板、以寡 核苷酸loop3-4rev(SEQ ID NO:91)和loop3-4-5tag fo(SEQ ID NO:90) 为引物,通过PCR反应对这些DNA区段进行进一步扩增。所有PCR 反应都是利用标准方法进行的。
在寡核苷酸序列中,N表示核苷酸T、C、G和A分别各占25% 的混合物,S表示C和G各为50%的混合物,编码适当随机化的核苷 酸序列。利用标准方法,通过电穿孔方式利用连接混合物转化所谓的 电感受态大肠杆菌TG-1细胞。转化后,将大肠杆菌TG-1细胞涂布到 含有0.2mg氨苄青霉素/mL和2%葡萄糖的2×TY-琼脂平板上并在 30℃下培养过夜。
生成的文库PhtCTLD-lb004的大小确定为7×109个克隆。从文库 中挑选16个克隆并分离噬菌粒DNA。确定出环区的核苷酸序列(DNA Technology,Aarhus,Denmark)。发现13个克隆含有正确的环插入区 段,而3个克隆在该区域含有移框突变。
实施例14
筛选与固定在人血清白蛋白上的A型血糖基部分结合的Phtlec-噬 菌体和PhtCTLD-噬菌体
在设计为利用标准方法通过在96孔Maxisorb微滴定板(NUNC, Denmark)中淘选而筛选对固定在人血清白蛋白A-HA上的A型血糖基 部分具有特定亲和力的、源自Phtlec-和PhtCTLD的噬菌体的试验中, 应用了通过标准方法从Phtlec-lb001和Phtlec-lb002(参见实施例4)文 库的甘油原液培养的噬菌体从PhtCTLD-lb003(参见实施例5)文库的 甘油原液培养的噬菌体。
最初,利用0.3vol.20%聚乙二醇6000(PEG)溶液和2.5M NaCl溶液中对噬菌体上清液进行沉淀,并将沉淀物重新悬浮在TE-缓冲液 (10mM Tris-HCl pH8,1mM EDTA)中。在大肠杆菌TG-1细胞上进行 滴定后,将源自Phtlec-lb001和-lb002的噬菌体以1∶1的比率混合, 并在2×TY培养基中调节至5×1012pfu/mL,并在2×TY培养基中将源 自PhtCTLD-lb003文库(#4)的噬菌体调节至2.5×1012pfu/mL。
进行第一轮淘选前,在三个孔的每个孔中,用固定化在含于100ul PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4,2H20,添 加水至1L,利用NaOH调节pH7.4)中的人血清白蛋白A-HA (Glycorex AB,Lund,Sweden)上的1ug人A型血三糖抗原分别在4℃ 下包被过夜和在室温下包被1小时。利用PBS冲洗1次后,在室温下 利用300μL PBS和3%脱脂乳对所有的孔进行为时1小时的封闭。封闭 后,利用PBS和0.1%Tween 20将孔冲洗一次,利用PBS冲洗三次, 然后向其中添加50ul噬菌体悬浮液和50μL PBS、6%脱脂乳的混合物。 使噬菌体在室温下进行2小时的结合,然后利用PBS、Tween 20冲洗 8次和利用PBS冲洗8次。室温下,通过100ul(1mg/mL胰蛋白酶的 PBS溶液)胰蛋白酶消化30min来从每个孔中洗脱结合的噬菌体,并利 用洗脱的噬菌体感染指数增长的大肠杆菌TG1细胞,然后在添加有2 %葡萄糖和0.1mg/ml氨苄青霉素的2×TY琼脂平板上进行涂布和滴定。
在第二轮筛选中,将150μL第一轮筛选得到的集落的粗噬菌体上 清液与150μL PBS、6%脱脂乳混合,并如前所述,利用在三个A-HA 包被的孔的每个孔中淘选分配100ul混合物。通过将冲洗步骤从16次 增至32次而提高结合的严格性。也利用300μL噬菌体混合物在没有 接受任何抗原作为对照的三个孔中进行淘选。
在第三轮筛选中,将150μL第2轮筛选得到的集落的粗噬菌体上清液 与150μLPBS、6%脱脂乳混合,并如前所述,利用其在三个A-HA包被 的孔的每个孔中淘选分配100ul混合物。冲洗次数仍为32次。也利用300μL 噬菌体混合物在没有接受任何抗原作为对照的三个孔中进行淘选。
表8对筛选结果进行了总结。
表8.通过淘选和胰蛋白酶消化洗脱,选择与A-HA结合的Phtlec 噬菌体(#1)和PhtCTLD噬菌体(#4)     A-HA     空白     比例     第1轮  #1     0.8*103     n.a.     n.a.            #4     1.1*103     n.a.     n.a.     第2轮  #1     1.0*103     0.5*102     20            #4     1.3*103     0.5*102     26     第3轮  #1     8.0*104     0.5*102     1600            #4     9.0*105     0.5*102     18000
n.a.=不适用
从#1和#4系列各挑取48个克隆,置于96孔微量滴定盘中生长, 并利用标准方法通过M13K07辅助噬菌体感染制备噬菌体。利用 ELISA-type检验分析96个噬菌体上清液中的噬菌体对A-HA抗原的 结合和对母鸡卵白溶菌酶的非特异性结合。简单来讲,在每个孔中, 利用溶于100μL PBS(PBS,0.2g KCl,0.2g KH2PO4,8g NaCl,1.44g Na2HPO4,2H20,加水至1L,利用NaOH调至pH7.4)的1μgA-HA或 溶于100μL PBS的1μg母鸡卵白溶菌酶(用于非特异性结合分析)在4 ℃下包被过夜及在室温下包被1小时。利用PBS冲洗1次后,在室 温下利用300μL PBS和3%脱脂乳对孔进行为时1小时的封闭。封闭 完成后,利用PBS和0.1% Tween 20将孔冲洗一次,利用PBS冲洗三 次,然后向其中添加处于50μL PBS、6%脱脂乳中的50ul噬菌体上 清液。使噬菌体混合物在室温下进行2小时的结合,然后利用PBS、 Tween 20冲洗3次和利用PBS冲洗3次。冲洗完成后,向每个孔中添 加溶于PBS、3%脱脂乳的50μL 1∶5000稀释的缀合HRP的抗-gene VIII抗体(Amersham Pharmacia Biotech)并在室温下孵育1小时。在 与“笫二”抗体结合后,每孔利用PBS、Tween 20冲洗3次,利用PBS 冲洗3次,随后向其中添加50μL TMB底物(DAKO-TMB One-Step Substrate System,代码:S1600,DAKO,Denmark)。反应进行20min, 随后利用0.5M H2SO4使其终止,并进行分析。ELISA分析结果展示 了两个系列中的噬菌体对A-HA特异性结合的″阳性结果″(图34和 35),这是通过在A-HA上产生的信号与在溶菌酶产生的信号之比等于 或大于1.5并且具有高于背景的信号来判断的。
从#l系列中检验得到13个阳性(hits),而从#4系列中检验得到28 个阳性。
参考文献
Aspberg,A.,Miura,R.,Bourdoulous,S.,Shimonaka,M., Heineg rd,D.,Schachnet,M.,Ruoslahti,E.,and Yamaguchi,Y.(1997). ″lectican的C型凝集素结构域,一族聚集的硫酸软骨素蛋白多糖通过 不依赖于糖基的蛋白-蛋白相互作用与细胞粘合素相结合″.Proc. Natl.Acad.Sci.(USA)94:10116-10121
Bass,S.,Greene,R.,and Wells,J.A.(1990).″激素噬菌体:具有改 变的结合特性的变体蛋白富集方法″.Proteins 8:309-314
Benhar,I.,Azriel,R.,Nahary,L.,Shaky,S.,Berdichevsky,Y., Tamarkin,A.,and Wels,W.(2000).″抗原如活体细菌上的Lpp-OmpA 融合物展示介导的高效噬菌体抗体筛选方法″.J.Mol.Biol.301: 893-904
Berglund,L.and Petersen,T.E.(1992).″纤溶酶原结合蛋白四柄 蛋白的基因结构″.FEBS Letters 309:15-19
Bertrand,J.A.,Pignol,D.,Bernard,J-P.,Verdier,J-M.,Dagorn, J-C.,and Fontecilla-Camps,J.C.(1996).″胰腺结合形成的抑制剂人胰 石蛋白的晶体结构″.EMBO J.15:2678-2684
Bettler,B.,Texido,G.,Raggini,S.,Rüegg,D.,and Hofstetter,H. (1992).″利用homolog-扫描诱变鉴定的Fcε受体(FcεRII/CD23)中的 免疫球蛋白E-结合位点″.J.Biol.Chem.267:185-191
Blanck,O.,Iobst,S.T.,Gabel,C.,and Drickamer,K.(1996).″向同 型甘露糖结合蛋白中导入类选择蛋白结合特异性″.J.Biol.Chem.271: 7289-7292
Boder,E.T.and Wittrup,K.D.(1997).″用于筛选组合多肽文库的 酵母表面展示″.Nature Biotech.15:553-557
Burrows L,Iobst ST,Drickamer K.(1997)“N-乙酰氨基葡萄糖对 小鸡肝脏凝集素的选择性结合”.Biochem J.324:673-680
Chiba,H.,Sano,H.,Saitoh,M.,Sohma,H.,Voelker,D.R.,Akino, T.,and Kuroki,Y.(1999).″向肺表面活性蛋白A中导入甘露糖结合蛋 白型磷脂酰肌醇识别″.Biochemistry 38:7321-7331
Christensen,J.H.,Hansen,P.K.,Lillelund,O.,and Th gersen, H.C.(1991).″爪蟾转录因子IIIA的N-末端three-finger区段与5S RNA基因内部控制区的序列特异性结合″.FEBS Letters 281:181-184
Cyr,J.L.and Hudspeth,A.J.(2000).″抗内的蛋白的、细菌噬菌 体展示的抗体文库″.Proc.Natl.Acad.Sci(USA)97:2276-2281
Drickamer,K.(1992).″工程操作到C-型甘露糖结合蛋白中的半 乳糖结合活性″.Nature 360:183-186
Drickamer,K.and Taylor,M.E.(1993).″动物凝集素的生物学″. Annu.Rev.Cell Biol.9:237-264
Drickamer,K.(1999).″C型类凝集素结构域″.Curr.Opininon Struc.Biol.9:585-590
Dunn,I.S.(1996).″蛋白的噬菌体展示″.Curr.Opinion Biotech.7: 547-553
Erbe,D.V.,Lasky,L.A.,and Presta,L.G.″Selectin variants″.US Patent No.5593882
Ernst,W.J.,Spenger,A.,Toellner,L.,Katinger,H.,Grabherr,R.M. (2000).″扩展的杆状病毒表面展示。Autographa caufornica NPV的天 然外壳蛋白的修饰″.Eur.J.Biochem.267:4033-4039
Ewart,K.V.,Li,Z.,Yang,D.S.C.,Fletcher,G.L,and Hew,C.L. (1998).″相应于C型凝集素糖结合位点的Atlantic herring抗冻蛋白 的冰结合位点″.Biochemistry 37:4080-4085
Feinberg,H.,Park-Snyder,S.,Kolatkar,A.R.,Heise,C.T.,Taylor, M.E.,and Weis,W.I.(2000).″巨噬细胞甘露糖受体中的C型糖识别结 构域的结构″.J.Biol.Chem.275:21539-21548
Fujii,I.,Fukuyama,S.,Iwabuchi,Y.,and Tanimura,R.(1998).″ 噬菌体展示的组合文库中的进化催化抗体″.Nature Biotech.16: 463-467
Gates,C.M.,Stemmer,W.P.C.,Kaptein,R.,and Schatz,P.J. (1996).“通过在lac阻遏物上的展示对肽文库中的配基进行亲和力选 择性分离”.J.Mol.Biol.255:373-386
Graversen,J.H.,Lorentsen,R.H.,Jacobsen,C.,Moestrup,S.K., Sigurskjold,B.W.,Th gersen,H.C.,and Etzerodt,M.(1998).″C-型凝 集素四柄蛋白的纤溶酶原结合位点定位在糖基识别结构域中并且其 结合对钙和赖氨酸敏感″.J.Biol.Chem.273:29241-29246
Graversen,J.H.,Jacobsen,C.,Sigurskjold,B.W.,Lorentsen,R.H., Moestrup,S.K.,Th gersen,H.C.,and Etzerodt,M.(2000).″Kringle- 四柄蛋白相互作用的亲和性和选择性的突变分析。将新颖的kringle 亲和性移植到四柄蛋白凝集素支架中″.J.Biol.Chem.275: 37390-37396
Griffiths,A.D.and Duncan,A.R.(1998).″利用噬菌体展示进行抗 体筛选的策略″.Curr.Opinion Biotech.9:102-108 Holtet,T.L.,Graversen,J.H.,Clemmensen,I.,Th gersen,H.C., and Etzerodt,M.(1997.).″四柄蛋白,一种三聚体纤溶酶原结合C型外 源凝集″.Prot.Sci.6:1511-1515
Honma,T.,Kuroki,Y.,Tzunezawa,W.,Ogasawara,Y.,Sohma, H.,Voelker,D.R.,and Akino,T.(1997).″谷氨酸185-丙氨酸221的甘 露糖结合蛋白A区可在不损失任何与脂质与多房型棘球囊II型细胞的 相互作用的情况下替代谷氨酸195-苯丙氨酸228的表面活性蛋白A区 ″。Biochemistry 36:7176-7184
Huang,W.,Zhang,Z.,and Palzkill,T.(2000).″利用β-内酰胺酶 抑制性蛋白的噬菌体展示设计有效的β-内酰胺酶抑制剂″.J.Biol. Chem.275:14964-14968
Hufton,S.E.,van Neer,N.,van den Beuken,T.,Desmet,J.,Sablon, E.,and Hoogenboom,H.R.(2000).″可用作产生新颖的结合配基的蛋 白质支架的、与细胞毒性T淋巴细胞相关的抗原4的开发与应用″. FEBS Letters 475:225-231
H kansson,K.,Lim,N.K.,Hoppe,H-J.,and Reid,K.B.M.(1999). ″三聚体alpha-螺旋卷曲螺旋和人肺表面活性蛋白D的三个凝集素结 构域的晶体结构″.Structure Folding and Design 7:255-264
Iobst,S.T.,Wormald,M.R.,Weis,W.I.,Dwek,R.A.,and Drickamer,K.(1994)。″糖配基与Ca(2+)依赖型动物凝集素的结合。I. 利用定点诱变和NMR进行甘露糖结合分析″.J.Biol.Chem.269: 15505-15511
Iobst,S.T.and Drickamer,K.(1994).″糖配基与Ca(2+)依赖型动 物凝集素的结合。II.利用定点诱变产生高亲和性半乳糖结合″.J.Biol. Chem.269:15512-15519
Iobst,S.T.and Drickamer,K.(1996).″对大白鼠肝脏和巨噬细胞 唾液酸糖蛋白受体的糖识别域的选择性糖基结合″.J.Biol.Chem.271: 6686-6693
Jaquinod,M.,Holtet,T.L.,Etzerodt,M.,Clemmensen,I., Th gersen,H.C.,and Roepstorff,P.(1999).″人四柄蛋白中的翻译后 修饰和遗传变异的质谱定性″.Biol.Chem.380:1307-1314
Kastrup,J.S.,Nielsen,B.B.,Rasmussen,H.,Holtet,T.L., Graversen,J.H.,Etzerodt,M.,Th gersen,H.C.,and Larsen,I.K. (1998).″人四柄蛋白的C型凝集素糖识别域的结构″.Acta.Cryst.D 54: 757-766
Kogan,T.P.,Revelle,B.M.,Tapp,S.,Scott,D.,and Beck,P.J. (1995).″单氨基酸残基可确定内皮细胞选择素的配基特异性″.J.Biol. Chem.270:14047-14055
Kolatkar,A.R.,Leung,A.K.,Isecke,R.,Brossmer,R.,Drickamer, K.,and Weis,W.I.(1998).″N-乙酰半乳糖胺对C型动物凝集素糖识别 域的结合机理″.J.Biol.Chem.273:19502-19508
Lorentsen,R.H.,Graversen,J.H.,Caterer,N.R.,Th gersen,H.C., and Etzerodt,M.(2000).″四柄蛋白中的肝素结合位点定位在N-末 端区中并且其结合与糖识别域无关″.Biochem.J.347:83-87
Marks,J.D.,Hoogenboom,H.R.,Griffiths,A.D.,and Winter,G. (1992).″丝状噬菌体上的蛋白的分子进化。模拟免疫系统的策略″.J. Biol.Chem.267:16007-16010
Mann K,Weiss IM,Andre S,Gabius HJ,Fritz M.(2000).″ abalone(Haliotis laevigata)nacre protein perlucin的氨基酸序列。具 有半乳糖/甘露糖特异性的功能性C型凝集素结构域的检测″.Eur.J. Biochem.267:5257-5264
McCafferty,J.,Jackson,R.H.,and Chiswell,D.J.(1991).″噬菌体 酶:细菌噬菌体表面上的功能性碱性磷酸酶的表达和亲和层析″.Prot. Eng.4:955-961
McCormack,F.X.,Kuroki,Y.,Stewart,J.J.,Mason,R.J.,and Voelker,D.R.(1994).″表面活性剂蛋白A氨基酸Glu195和Arg197对 受体结合、磷脂聚集、分泌调节以及通过II型细胞进行的促进的磷脂 吸收是必需的″.J.Biol.Chem.269:29801-29807
McCormack,F.X.,Festa,A.L.,Andrews,R.P.,Linke,M.,and Walzer,P.D.(1997).″表面活性剂蛋白A的糖识别域介导了对卡氏肺 囊虫的主要的表面糖蛋白的结合″.Biochemistry 36:8092-8099
Meier,M.,Bider,M.D.,Malashkevich,V.N.,Spiess,M.,and Burkhard,P.(2000).″唾液酸糖蛋白受体H1亚单位的糖识别域的晶体 结构″.J.Mol.Biol.300:857-865
Mikawa,Y.G.,Maruyama,I.N.,and Brenner,S.(1996).″细菌噬 菌体lambda头上的蛋白的表面展示″.J.Mol.Biol.262:21-30
Mio H,Kagami N,Yokokawa S,Kawai H,Nakagawa S,Takeuchi K,Sekine S,Hiraoka A.(1998).″人、小鼠、大白鼠完全长度干细胞生 长因子这一C型凝集素大家族中的新成员的cDNA的分离和定性″. Biochem.Biophys.Res.Commun.249:124-130
Mizuno,H.,Fujimoto,Z.,Koizumi,M.,Kano,H.,Atoda,H.,and Morita,T.(1997).″凝固辅助因子IX/X-结合蛋白这一C型凝集素结构 域异二聚体的结构″.Nat.Struc.Biol.4:438-441
Ng,K.K.,Park-Snyder,S.,and Weis,W.I.(1998a).″C型甘露糖结 合蛋白中的Ca2+-依赖型结构变化″.Biochemistry 37:17965-17976
Ng,K.K.and Weis,W.I.(1998b).″C型甘露糖结合蛋白中脯氨酰 肽键异构化作用与Ca2+结合的偶联″.Biochemistry 37:17977-17989
Nielsen,B.B.,Kastrup,J.S.,Rasmussen,H.,Holtet,T.L., Graversen,J.H.,Etzerodt,M.,Th gersen,H.C.,and Larsen,I.K. (1997).″具有α-螺旋卷曲螺旋的三聚体结合蛋白四柄蛋白的晶体结构 ″.FEBS Letters 412:388-396
Nissim A.,Hoogenboom,H.R.,Tomlinson,I.M.,Flynn,G., Midgley,C.,Lane,D.,and Winter,G.(1994).″′单pot′噬菌体展示文库 中的抗体区段作为免疫化学试剂″.EMBO J.13:692-698
Ogasawara,Y.and Voelker,D.R.(1995).″工程操作到表面活性剂 蛋白D中的改变的糖识别域揭示了对磷脂酰肌醇和葡糖苷鞘氨醇的不 同结合机理″.J.Biol.Chem.270:14725-14732
Ohtani,K.,Suzuki,Y.,Eda,S.,Takao,K.,Kase,T.,Yamazaki,H., Shimada,T.,Keshi,H.,Sakai,Y.,Fukuoh,A.,Sakamoto,T.,and Wakamiya,N.(1999).,″源自肝脏的新颖的人胶原凝集素(CL-L1)的分 子克隆″.J.Biol.Chem.274:13681-13689
Pattanajitvilai,S.,Kuroki,Y.,Tsunezawa,W.,McCormack,F.X., and Voelker,D.R.(1998).″表面活性剂蛋白A的Argl97的突变分析。 His197产生了特异性脂吸收缺陷″.J.Biol.Chem.273:5702-5707
Poget,S.F.,Legge,G.B.,Proctor,M.R.,Butler,P.J.,Bycroft,M., and Williams,R.L.(1999).″源自与D-半乳糖复合的Polyandrocarpa misakiensis的有被膜的C-型凝集素的结构″.J.Mol.Biol.290:867-879
Revelle,B.M.,Scott,D.,Kogan,T.P.,Zheng,J.,and Beck,P.J. (1996).,″P-选择蛋白-sialyl LewisX结合相互作用的结构功能分析。配 基结合特异性的诱变变更″.J.Biol.Chem.271:4289-4297
Sano,H.,Kuroki,Y.,Honma,T.,Ogasawara,Y.,Sohma,H., Voelker,D.R.,and Akino,T.(1998).″嵌合蛋白分析表明大白鼠肺胶原 凝集素糖识别域中的区是与磷酸脂、糖脂和多房型棘球囊II细胞三相 互作用所必需的″J.Biol.Chem.273:4783-4789
Schaffitzel,C.,Hanes,J.,Jermutus,L.,and Plücktun,A.(1999). ”核糖体展示:文库中的抗体的体外筛选与评估方法″.J.Immunol. Methods 231:119-135
Sheriff,S.,Chang,C.Y.,and Ezekowitz,R.A.(1994).″通过三α- 螺旋卷曲螺旋进行的人甘露糖结合蛋白糖识别域三聚化作用″.Nat. Struc.Biol.1:789-794
S rensen,C.B.,Berglund,L.,and Petersen,T.E.(1995).″编码鼠 四柄蛋白的cDNA的克隆″.Gene 152:243-245
Torgersen,D.,Mullin,N.P.,and Drickamer,K.(1998).″利用选择 蛋白/甘露糖结合蛋白嵌合体分析的对E-和P-选择蛋白的配基结合机 理″.J.Biol.Chem.273:6254-6261
Tormo,J.,Natarajan,K.,Margulies,D.H.,and Mariuzza,R.A. (1999).″结合到其MHC I配基上的类凝集素天然杀伤细胞的晶体结 构”.Nature 402:623-631
Tsunezawa,W.,Sano,H.,Sohma,H.,McCormack,F.X.,Voelker, D.R.,and Kuroki,Y.(1998).″表面活性剂蛋白A的定点诱变揭示了通 过II型肺泡细胞进行的脂聚集的解离和脂吸收″.Biochim.Biophys. Acta 1387:433-446
Weis,W.I.,Kahn,R.,Fourme,R.,Drickamer,K.,and Hendrickson,W.A.(1991).″利用MAD phasing确定的大白鼠甘露糖 结合蛋白的钙依赖型凝集素结构域的结构″.Science 254:1608-1615
Weis,W.I.,and Drickamer,K.(1996).″凝集素-糖识别的结构基 础″.Annu.Rev.Biochem.65:441-473
Whitehorn,E.A.,Tate,E.,Yanofsky,S.D.,Kochersperger,L., Davis A.,Mortensen,R.B.,Yonkovic,S.,Bell,K.,Dower,W.J.,and Barrett,R.W.(1995).″“标记的”细胞表面受体的表达和应用的一般 方法″.Bio/Technology 13:1215-1219
Wragg,S.and Drickamer,K.(1999).″氨基酸残基鉴定确定了胞 饮作用中配基对唾液酸糖蛋白受体结合的pH依赖性″.J.Biol.Chem. 274:35400-35406
Zhang,H.,Robison,B.,Thorgaard,G.H.,and Ristow,S.S.(2000). ″源自虹鳟鱼(Oncorhynchos Mykiss)纯合子克隆的鱼C型凝集素基因 的克隆、图谱分析和基因组组织″.Biochim.et Biophys.Acta 1494: 14-22
                        序列表 <110>Borean Pharma A/S <120>具有C型类凝集素结构域的支架结构的蛋白质组合文库 <130>P200001100 WO JNy <140> <141> <150>DK PA 2000 01872 <151>2000-12-13 <160>91 <170>PatentIn Ver.2.1 <210>1 <211>571 <212>DNA <213>人类 <220> <221>CDS <222>(1)..(564) <223>编码FX-htlec的插入片段 <400>1 gga tcc atc gag ggt agg ggc gag cca cca acc cag aag ccc aag aag    48 Gly Ser Ile Glu Gly Arg Gly Glu Pro Pro Thr Gln Lys Pro Lys Lys   1               5                  10                  15 att gta aat gcc aag aaa gat gtt gtg aac aca aag atg ttt gag gag    96 Ile Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu
         20                  25                  30 ctc aag agc cgt ctg gac acc ctg gcc cag gag gtg gcc ctg ctg aag    144 Leu Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys
     35                  40                  45 gag cag cag gcc ctg cag acg gtc gtc ctg aag ggg acc aag gtg cac    192 Glu Gln Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His
 50                  55                  60 atg aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc cac gag gcc    240 Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala  65                  70                  75                  80 agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc cct cag act    288 Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr
             85                  90                  95 ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag agc gtg ggc    336 Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly
        100                 105                 110 aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg gcc gag ggc    384 Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly
    115                 120                 125 acc tgg gtg gac atg acc ggt acc cgc atc gcc tac aag aac tgg gag    432 Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu
130                 135                 140 act gag atc acc gcg caa ccc gat ggc ggc aag acc gag aac tgc gcg    480 Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala 145                 150                 155                 160 gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag cgc tgc cgc    528 Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg
            165                 170                 175 gat caa ttg ccc tac atc tgc cag ttc ggg atc gtg taagctt            571 Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val
        180                 185 <210>2 <211>188 <212>PRT <213>人类 <400>2 Gly Ser Ile Glu Gly Arg Gly Glu Pro Pro Thr Gln Lys Pro Lys Lys   1               5                  10                  15 Ile Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu
         20                  25                  30 Leu Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys
     35                  40                  45 Glu Gln Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His
 50                  55                  60 Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala  65                  70                  75                  80 Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr
             85                  90                  95 Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly
        100                 105                 110 Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly
    115                 120                 125 Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu
130                 135                 140 Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala 145                 150                 155                 160 Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg
            165                 170                 175 Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val
        180                 185 <210>3 <21l>436 <212>DNA <213>人类 <220> <22l>CDS <222>(1)..(429) <223>编码FX-htCTLD的插入片段 <400>3 gga tcc atc gag ggt agg gcc ctg cag acg gtc gtc ctg aag ggg acc    48 Gly Ser Ile Glu Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr   1               5                  10                  15 aag gtg cac atg aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc    96 Lys Val His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe
         20                  25                  30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc    144 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr
     35                  40                  45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag    192 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln
 50                  55                  60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg    240 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala  65                  70                  75                  80 gcc gag ggc acc tgg gtg gac atg acc ggt acc cgc atc gcc tac aag    288 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys
             85                  90                  95 aac tgg gag act gag atc acc gcg caa ccc gat ggc ggc aag acc gag    336 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu
        100                 105                 110 aac tgc gcg gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag    384 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
    115                 120                 125 cgc tgc cgc gat caa ttg ccc tac atc tgc cag ttc ggg atc gtg        429 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val
130                 135                 140 taagctt                                                            436 <210>4 <211>143 <212>PRT <213>人类 <400>4 Gly Ser Ile Glu Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr   1               5                  10                  15 Lys Val His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe
         20                  25                  30 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr
     35                  40                  45 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln
 50                  55                  60 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala  65                  70                  75                  80 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys
             85                  90                  95 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu
        100                 105                 110 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
    115                 120                 125 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val
130                 135                 140 <210>5 <211>47 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>5 cggctgagcg gcccagccgg ccatggccga gccaccaacc cagaagc                47 <210>6 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>6 cctgcggccg ccacgatccc gaactgg                                      27 <210>7 <211>43 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>7 cggctgagcg gcccagccgg ccatggccgc cctgcagacg gtc                    43 <210>8 <211>570 <212>DNA <213>人类 <220> <221>CDS <222>(8)..(565) <223>编码PhTN的插入片段 <400>8 ggcccag ccg gcc atg gcc gag cca cca acc cag aag ccc aag aag att    49
    Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile
      1               5                  10 gta aat gcc aag aaa gat gtt gtg aac aca aag atg ttt gag gag ctc    97 Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu  15                  20                  25                  30 aag agc cgt ctg gac acc ctg gcc cag gag gtg gcc ctg ctg aag gag    145 Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu
             35                  40                  45 cag cag gcc ctg cag acg gtc tgc ctg aag ggg acc aag gtg cac atg    193 Gln Gln Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val His Met
         50                  55                  60 aaa tgc ttt ctg gcc ttc acc cag acg aag acc ttc cac gag gcc agc    241 Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser
     65                  70                  75 gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc cct cag act ggc    289 Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly
 80                  85                  90 tcg gag aac gac gcc ctg tat gag tac ctg cgc cag agc gtg ggc aac    337 Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn  95                 100                 105                 110 gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg gcc gag ggc acc    385 Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr
            115                 120                 125 tgg gtg gac atg acc ggc gcc cgc atc gcc tac aag aac tgg gag act    433 Trp Val Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys Asn Trp Glu Thr
        130                 135                 140 gag atc acc gcg caa ccc gat ggc ggc aag acc gag aac tgc gcg gtc    481 Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val
    145                 150                 155 ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag cgc tgc cgc gat    529 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp
160                 165                 170 cag ctg ccc tac atc tgc cag ttc ggg atc gtg gcg gccgc              570 Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 175                 180                 185 <210>9 <211>186 <212>PRT <213>人类 <400>9 Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile Val Asn   1               5                  10                  15 Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu Lys Ser
         20                  25                  30 Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu Gln Gln
     35                  40                  45 Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val His Met Lys Cys
 50                  55                  60 Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser Glu Asp  65                  70                  75              80 Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly Ser Glu
             85                  90              95 Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn Glu Ala
        100                 105             110 Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr Trp Val
    115                 120             125 Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys Asn Trp Glu Thr Glu Ile
130                 135             140 Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val Leu Ser 145                 150             155                     160 Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp Gln Leu
            165             170                     175 Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala
        180             185 <210>10 <211>438 <212>DNA <213>人类 <220> <221>CDS <222>(8)..(433) <223>编码PhTN3的插入片段 <400>10 ggcccag ccg gcc atg gcc gcc ctg cag acg gtc tgc ctg aag ggg acc    49
    Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr
      1               5                  10 aag gtg cac atg aaa tgc ttt ctg gcc ttc acc cag acg aag acc ttc    97 Lys Val His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe  15                  20                  25                  30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc    145 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr
             35                  40                  45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag    193 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln
         50                  55                  60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg    241 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala
     65                  70                  75 gcc gag ggc acc tgg gtg gac atg acc ggc gcc cgc atc gcc tac aag    289 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys
 80                  85                  90 aac tgg gag act gag atc acc gcg caa ccc gat ggc ggc aag acc gag    337 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu  95                 100                 105                 110 aac tgc gcg gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag    385 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
            115                 120                 125 cgc tgc cgc gat cag ctg ccc tac atc tgc cag ttc ggg atc gtg gcg    433 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala
        130                 135                 140 gccgc                                                              438 <210>11 <211>142 <212>PRT <213>人类 <400>11 Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val   1               5                  10                  15 His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu
         20                  25                  30 Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln
     35                  40                  45 Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val
 50                  55                  60 Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu  65                  70                  75                  80 Gly Thr Trp Val Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys Asn Trp
             85                  90                  95 Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys
        100                 105                 110 Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys
    115                 120                 125                      Arg Asp Gln Leu pro Tyr Ile Cys Gln Phe Gly Ile Val Ala
130                 135                 140 <210>12 <211>570 <212>DNA <213>人类 <220> <221>CDS <222>(8)..(565) <223>编码Phtlec的插入片段 <400>12 ggcccag ccg gcc atg gcc gag cca cca acc cag aag ccc aag aag att    49
    Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile
      1               5                  10 gta aat gcc aag aaa gat gtt gtg aac aca aag atg ttt gag gag ctc    97 Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu  15                  20                 25                   30 aag agc cgt ctg gac acc ctg gcc cag gag gtg gcc ctg ctg aag gag    145 Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu
             35                  40                  45 cag cag gcc ctg cag acg gtc gtc ctg aag ggg acc aag gtg cac atg    193 Gln Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His Met
         50                  55                  60 aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc cac gag gcc agc    241 Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser
     65                  70                  75 gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc cct cag act ggc    289 Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly
 80                  85                  90 tcg gag aac gac gcc ctg tat gag tac ctg cgc cag agc gtg ggc aac    337 Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn  95                 100                 105                 110 gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg gcc gag ggc acc    385 Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr
            115                 120                 125 tgg gtg gac atg acc ggt acc cgc atc gcc tac aag aac tgg gag act    433 Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu Thr
        130                 135                 140 gag atc acc gcg caa ccc gat ggc ggc aag acc gag aac tgc gcg gtc    48l Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val
    145                 150                 155 ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag cgc tgc cgc gat    529 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp
160                 165                 170 caa ttg ccc tac atc tgc cag ttc ggg atc gtg gcg gccgc             570 Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 175                 180                 185 <210>13 <211>186 <212>PRT <213>人类 <400>13 Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile Val Asn   1               5                  10                  15 Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu Lys Ser
         20                  25                  30 Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu Gln Gln
     35                  40                  45 Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His Met Lys Val
 50                  55                  60 Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser Glu Asp  65                  70                  75                  80 Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly Ser Glu
             85                  90                  95 Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn Glu Ala
        100                 105                 110 Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr Trp Val
    115                 120                 125 Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu Thr Glu Ile
130                 135                 140 Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val Leu Ser 145                 150                 155                 160 Gly Ala Ala Asn Gly Lys Trp Phe A5p Lys Arg Cys Arg Asp Gln Leu
            165                 170                 175 Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala
        180                 185 <210>14 <211>438 <212>DNA <213>人类 <220> <221>CDS <222>(8)..(433) <223>编码PhtCTLD的插入片段 <400>14 ggcccag ccg gcc atg gcc gcc ctg cag acg gtc gtc ctg aag ggg acc    49
    Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr
      1               5                  10 aag gtg cac atg aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc    97 Lys Val His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe  15                  20                  25                  30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc    145 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr
             35                  40                  45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag    193 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln
         50                  55                  60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg    241 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala
     65                  70                  75 gcc gag ggc acc tgg gtg gac atg acc ggt acc cgc atc gcc tac aag    289 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys
 80                  85                  90 aac tgg gag act gag atc acc gcg caa ccc gat ggc ggc aag acc gag    337 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu  95                 100                 105                 110 aac tgc gcg gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag    385 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
            115                 120                 125 cgc tgc cgc gat caa ttg ccc tac atc tgc cag ttc ggg atc gtg gcg    433 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala
        130                 135                 140 gccgc                                                              438 <210>15 <21l>142 <212>PRT <213>人类 <400>l5 Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val   1               5                  10                  15 His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu
         20                  25                  30 Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln
     35                  40                  45 Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val
 50                  55                  60 Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu  65                  70                  75                  80 Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp
             85                  90                  95 Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys
        100                 105                 110 Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys
    115                 120                 125 Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala
130                 135                 140 <210>16 <211>555 <212>DNA <213>Mus musculus <220> <223>含有mtlec编码部分的EcoRI-HindIII插入片段 <400>16 ggaattcgag tcacccactc ccaaggccaa gaaggctgca aatgccaaga aagatttggt  60 gagctcaaag atgtcgagga gctcaagaac aggatggatg tcctggccca ggaggtggcc  120 ctgctgaagg agaagcaggc cttacagact gtggtcctga agggcaccaa ggtgaacttg  180 aaggtcctcc tggccttcac ccaaccgaag accttccatg aggcgagcga ggactgcatc  240 tcgcaagggg gcacgctggg caccccgcag tcagagctag agaacgaggc gctgttcgag  300 tacgcgcgcc acagcgtggg caacgatgcg gagatctggc tgggcctcaa cgacatggcc  360 gcggaaggcg cctgggtgga catgaccggt accctcctgg cctacaagaa ctgggagacg  420 gagatcacga cgcaacccga cggcggcaaa gccgagaact gcgccgccct gtctggcgca  480 gccaacggca agtggttcga caagcgatgc cgcgatcaat tgccctacat ctgccagttt  540 gccattgtga agctt                                                   555 <210>17 <211>77 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>17 cggaattcga gtcacccact cccaaggcca agaaggctgc aaatgccaag aaagatttgg  60 tgagctcaaa gatgttc                                                 77 <210>18 <211>94 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>18 gcggatccag gcctgcttct ccttcagcag ggccacctcc tgggccagga catccatcct  60 gttcttgagc tcctcgaaca tctttgagct cacc                              94 <210>19 <211>97 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>19 gcaggcctta cagactgtgt gcctgaaggg caccaaggtg aacttgaagt gcctcctggc 60 cttcacccaa ccgaagacct tccatgaggc gagcgag                          97 <210>20 <211>93 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>20 ccgcatgctt cgaacagcgc ctcgttctct agctctgact gcggggtgcc cagcgtgccc 60 ccttgcgaga tgcagtcctc gctcgcctca tgg                              93 <210>21 <211>61 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>21 ggttcgaata cgcgcgccac agcgtgggca acgatgcgga gatctaaatg ctcccaattg 60 c                                                                 61 <210>22 <211>55 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>22 ccaagcttca caatggcaaa ctggcagatg tagggcaatt gggagcattt agatc     55 <210>23 <211>86 <212>DNA <213>人工序列 <223>人工序列描述:寡核苷酸 <400>23 cggagatctg gctgggcctc aacgacatgg ccgcggaagg cgcctgggtg gacatgaccg  60 gtaccctcct ggcctacaag aactgg                                       86 <210>24 <211>130 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>24 gggcaattga tcgcggcatc gcttgtcgaa cctcttgccg ttggctgcgc cagacagggc  60 ggcgcagttc tcggctttgc cgccgtcggg ttgcgtcgtg atctccgtct cccagttctt  120 gtaggccagg                                                         130 <210>25 <211>40 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>25 ctgggatcca tccagggtcg cgagtcaccc actcccaagg                       40 <210>26 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>26 ccgaagctta cacaatggca aactggc                                    27 <210>27 <211>39 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>27 ctgggatcca tccagggtcg cgccttacag actgtggtc                       39 <210>28 <211>568 <212>DNA <213>Mus musculus <220> <221>CDS <222>(1)..(561) <223>编码FX-mtlec的插入片段 <400>28 gga tcc atc cag ggt cgc gag tca ccc act ccc aag gcc aag aag gct    48 Gly Ser Ile Gln Gly Arg Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala   1               5                  10                  15 gca aat gcc aag aaa gat ttg gtg agc tca aag atg ttc gag gag ctc    96 Ala Asn Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu
         20                  25                  30 aag aac agg atg gat gtc ctg gcc cag gag gtg gcc ctg ctg aag gag    144 Lys Asn Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu
     35                  40                  45 aag cag gcc tta cag act gtg gtc ctg aag ggc acc aag gtg aac ttg    192 Lys Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu
 50                  55                  60 aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc cat gag gcg agc    240 Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser  65                  70                  75                  80 gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc ccg cag tca gag    288 Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu
             85                  90                  95 cta gag aac gag gcg ctg ttc gag tac gcg cgc cac agc gtg ggc aac    336 Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn
        100                 105                 110 gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc gcg gaa ggc gcc    384 Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala
    115                 120                 125 tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag aac tgg gag acg    432 Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr
130                 135                 140 gag atc acg acg caa ccc gac ggc ggc aaa gcc gag aac tgc gcc gcc    480 Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala 145                 150                 155                 160 ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag cga tgc cgc gat    528 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp
            165                 170                 175 caa ttg ccc tac atc tgc cag ttt gcc att gtg taagctt                568 Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val
        180                 185 <210>29 <211>187 <212>PRT <213>Mus musculus <400>29 Gly Ser Ile Gln Gly Arg Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala   1               5                  10                  15 Ala Asn Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu
         20                  25                  30 Lys Asn Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu
     35                  40                  45 Lys Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu
 50                  55                  60 Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser  65                  70                  75                  80 Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu
             85                  90                  95 Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn
        100                 105                 110 Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala
    115                 120                 125 Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr
130                 135                 140 Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala 145                 150                 155                 160 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp
            165                 170                 175 Gln Leu Pco Tyr Ile Cys  Gln Phe Ala Ile Val
        180                  185 <210>30 <211>436 <212>DNA <213>Mus musculus <220> <221>CDS <222>(1)..(429) <223>编码FX-mtCTLD的插入片段 <400>30 gga tcc atc cag ggt cgc gcc tta cag act gtg gtc ctg aag ggc acc    48 Gly Ser Ile Gln Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr   1               5                  10                  15 aag gtg aac ttg aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc    96 Lys Val Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe
         20                  25                  30 cat gag gcg agc gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc    144 His Glu Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr
     35                  40                  45 ccg cag tca gag cta gag aac gag gcg ctg ttc gag tac gcg cgc cac    192 Pro Gln Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His
 50                  55                  60 agc gtg ggc aac gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc    240 Ser Val Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala  65                  70                  75                  80 gcg gaa ggc gcc tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag    288 Ala Glu Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys
             85                  90                  95 aac tgg gag acg gag atc acg acg caa ccc gac ggc ggc aaa gcc gag    336 Asn Trp Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu
        100                 105                 110 aac tgc gcc gcc ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag    384 Asn Cys Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
    115                 120                 125 cga tgc cgc gat caa ttg ccc tac atc tgc cag ttt gcc att gtg        429 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val
130                 135                 140 taagctt                                                            436 <210>31 <211>143 <212>PRT <213>Mus musculus <400>31 Gly ser Ile Gln Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr   1               5                  10                  15 Lys Val Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe
         20                  25                  30 His Glu Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr
     35                  40                  45 Pro Gln Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His
 50                  55                  60 Ser Val Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala  65                  70                  75              80 Ala Glu Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys
             85                  90              95 Asn Trp Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu
        100                 105             110 Asn Cys Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
115                 120                 125 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val
130                 135                 140 <210>32 <211>47 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>32 cggctgagcg gcccagccgg ccatggccga gtcacccact cccaagg                47 <210>33 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>33 cctgcggccg ccacgatccc gaactgg                                      27 <210>34 <211>46 <212>DNA <213>人工序列 <220> <223>人工序列描述:引物 <400>34 cggctgagcg gcccagccgg ccatggccgc cttacagact gtggtc                 46 <210>35 <211>570 <212>DNA <213>Mus musculus <220> <221>CDS <222>(8)..(565) <223>编码Pmtlec的插入片段 <400>35 ggcccag ccg gcc atg gcc gag tca ccc act ccc aag gcc aag aag gct    49
    Pro Ala Met Ala Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala
      1               5                  10 gca aat gcc aag aaa gat ttg gtg agc tca aag atg ttc gag gag ctc    97 Ala Asn Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu  15                  20                  25                  30 aag aac agg atg gat gtc ctg gcc cag gag gtg gcc ctg ctg aag gag    145 Lys Asn Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu
             35                  40                  45     aag cag gcc tta cag act gtg gtc ctg aag ggc acc aag gtg aac ttg    193 Lys Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu
         50                  55                  60 aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc cat gag gcg agc    241 Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser
     65                  70                  75 gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc ccg cag tca gag    289 Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu
 80                  85                  90 cta gag aac gag gcg ctg ttc gag tac gcg cgc cac agc gtg ggc aac    337 Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn  95                 100                 105             110 gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc gcg gaa ggc gcc    385 Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala
            115                 120             125 tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag aac tgg gag acg    433 Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr
        130                 135             140 gag atc acg acg caa ccc gac ggc ggc aaa gcc gag aac tgc gcc gcc    481 Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala
    145                 150             155 ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag cga tgc cgc gat    529 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp
160                 165             170 caa ttg ccc tac atc tgc cag ttt gcc att gtg gcg gccgc    570 Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala 175                 180                 185 <210>36 <211>186 <212>PRT <213>Mus musculus <400>36 Pro Ala Met Ala Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala Ala Asn   1               5                  10                  15 Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu Lys Asn
         20                  25                  30 Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu Lys Gln
     35                  40                  45 Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu Lys Val
 50                  55                  60 Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser Glu Asp  65                  70                  75                  80 Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu Leu Glu
             85                  90                  95 Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn Asp Ala
        100                 105                 110 Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala Trp Val
    115                 120                 125 Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr Glu Ile
130                 135                 140 Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala Leu Ser 145                 150                 155                 160 Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp Gln Leu
            165                 170                 175 Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala
        180                 185 <210>37 <211>438 <212>DNA <213>Mus musculus <220> <221>CDS <222>(8)..(433) <223>编码PmtCTLD的插入片段 <400>37 ggcccag ccg gcc atg gcc gcc tta cag act gtg gtc ctg aag ggc acc    49
    Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr
      1               5                  10 aag gtg aac ttg aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc    97 Lys Val Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe  15                  20                  25                  30 cat gag gcg agc gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc    145 His Glu Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr
             35                  40                  45 ccg cag tca gag cta gag aac gag gcg ctg ttc gag tac gcg cgc cac    193 Pro Gln Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His
         50                  55                  60 agc gtg ggc aac gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc    241 Ser Val Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala
     65                  70                  75 gcg gaa ggc gcc tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag    289 Ala Glu Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys
 80                  85                  90 aac tgg gag acg gag atc acg acg caa ccc gac ggc ggc aaa gcc gag    337 Asn Trp Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu  95                 100                 105                 110 aac tgc gcc gcc ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag    385 Asn Cys Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys
            115                 120                 125 cga tgc cgc gat caa ttg ccc tac atc tgc cag ttt gcc att gtg gcg    433 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala
        130                 135                 140 gccgc                                                              438 <210>38 <211>142 <212>PRT <213>Mus musculus <400>38 Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val   1               5                  10                  15 Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu
         20                  25                  30 Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln
     35                  40                  45 Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val
 50                  55                  60 Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu  65                  70                  75              80 Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp
             85                  90              95 Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys
        100                 105             110 Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys
    115                 120             125 Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala
130                 135             140 <210>39 <211>116 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>39 cgcctacaag aactggnnsn nsnnsnnsnn snnscaaccc gatnnsnnsn nsnnsgagaa 60 ctgcgcggtc ctgtcaggcg cggccaacgg caagtggnns gacaagcgct gccgcg     116 <210>40 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>40 gaccggtacc cgcatcgcct acaagaactg g                                 31 <210>41 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>41 gtagggcaat tgatcgcggc agcgcttgtc                                   30 <210>42 <211>94 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>42 gctgggcctc aacgacnnsn nsnnsgagnn snnstgggtg gacatgaccg gtacccgcat  60 cgcctacaag aactgggaga ctgagatcac cgcg                              94 <210>43 <211>102 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>43 cgcggcagcg cttgtcgaac cacttgccgt tggccgcgcc tgacaggacc gcgcagttct  60 csnnsnnsnn snnatcgggt tgcgcggtga tctcagtctc cc                     102 <210>44 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>44 cgaggccgag atctggctgg gcctcaacga c                                 31 <210>45 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>45 gggcaacgag gccgagatct ggctgggcct c                                 31 <210>46 <211>19 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>46 cctgaccctg cagcgcttg                                               19 <210>47 <211>81 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>47 cgagatctgg ctgggcctca acgacnnsnn snnsnnsnns nnsgagggca cctgggtgga  60 catgaccggt acccgcatcg c                                            81 <210>48 <211>78 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>48 cgagatctgg ctgggcctca acgacnnsnn snnsnnsnns gagggcacct gggtggacat  60 gaccggtacc cgcatcgc                                                78 <210>49 <211>94 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>49 gctgggcctc aacgacnnsn nsnnsgagnn snnstgggtg gacatgaccg gtacccgcat  60 cgcctacaag aactgggaga ctgagatcac cgcg                              94 <210>50 <211>18 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>50 gcgatgcggg taccggtc                                                18 <210>51 <211>89 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>51 gcatcgccta caagaactgg gagactgaga tcaccgcgca acccgatggc ggcnnsnnsn  60 nsnnsnnsnn sgagaactgc gcggtcctg                                    89 <210>52 <211>86 <212>DNA     <213>人工序列 <220> <223>人工序列描述:寡核苷酸     <400>52 gcatcgccta caagaactgg gagactgaga tcaccgcgca acccgatggc ggcnnsnnsn  60 nsnnsnnsga gaactgcgcg gtcctg                                       86 <210>53 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>53 catgaccggt acccgcatcg cctacaagaa ctgg                              34 <210>54 <211>66 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>54 cctgaccctg cagcgcttgt cgaaccactt gccgttggcc gcgcctgaca ggaccgcgca  60 gttctc                                                             66 <210>55 <211>45 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>55 ggtacctaag tgacgatatc ctgacctaac tgcagggatc aattg                 45 <210>56 <211>343 <212>DNA <213>人类 <220> <221>CDS <222>(8)..(274) <223>人PhtCPB插入片段 <400>56 ggcccag ccg gcc atg gcc gcc ctc cag acg gtc tgc ctg aag ggg acc    49
    Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr
      1               5                  10 aag gtg cac atg aaa tgc ttt ctg gcc ttc acc cag acg aag acc ttc    97 Lys Val His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe  15                  20                  25                  30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc    145 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr
             35                  40                  45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag    193 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln
         50                  55                  60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg    241 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala
     65                  70                  75 gcc gag ggc acc tgg gtg gac atg acc ggt acc taagtgacga tatcctgacc  294 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr
 80                  85 taactgcagg gatcaattgc cctacatctg ccagttcggg atcgtgtag              343 <210>57 <211>89 <212>PRT <213>人类 <400>57 Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val   1               5                  10                  15 His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu
         20                  25                  30 Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln
     35                  40                  45 Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val
50                   55                  60 Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu  65                  70                  75                  80 Gly Thr Trp Val Asp Met Thr Gly Thr
             85 <210>58 <211>405 <212>DNA <213>黑家鼠(Rattus rattus) <220> <221>CDS <222>(8)..(400) <223>鼠PrMBP插入片段 <400>58 ggcccag ccg gcc atg gcc aac aag ttg cat gcc ttc tcc atg ggt aaa    49
    Pro Ala Met Ala Asn Lys Leu His Ala Phe Ser Met Gly Lys
      1               5                  10 aag tct ggg aag aag ttc ttt gtg acc aac cat gaa agg atg ccc ttt    97 Lys Ser Gly Lys Lys Phe Phe Val Thr Asn His Glu Arg Met Pro Phe  15                  20                  25                  30 tcc aaa gtc aag gcc ctg tgc tca gag ctc cga ggc act gtg gct atc    145 Ser Lys Val Lys Ala Leu Cys Ser Glu Leu Arg Gly Thr Val Ala Ile
             35                  40                  45 ccc aag aat gct gag gag aac aag gcc atc caa gaa gtg gct aaa acc    193 Pro Lys Asn Ala Glu Glu Asn Lys Ala Ile Gln Glu Val Ala Lys Thr
         50                  55                  60 tct gcc ttc cta ggc atc acg gac gag gtg act gaa ggc caa ttc atg    241 Ser Ala Phe Leu Gly Ile Thr Asp Glu Val Thr Glu Gly Gln Phe Met
     65                  70                  75 tat gtg aca ggg ggg agg ctc acc tac agc aac tgg aaa aag gat gag    289 Tyr Val Thr Gly Gly Arg Leu Thr Tyr Ser Asn Trp Lys Lys Asp Glu
 80                  85                  90 ccc aat gac cat ggc tct ggg gaa gac tgt gtc act ata gta gac aac    337 Pro Asn Asp His Gly Ser Gly Glu Asp Cys Val Thr Ile Val Asp Asn  95                 100                 105                 110 ggt ctg tgg aat gac atc tcc tgc caa gct tcc cac acg gct gtc tgc    385 Gly Leu Trp Asn Asp Ile Ser Cys Gln Ala Ser His Thr Ala Val Cys
            115                 120                 125 gag ttc cca gcc gcg gccgc                                          405 Glu Phe Pro Ala Ala
        130 <210>59 <211>131 <212>PRT <213>黑家鼠 <400>59 Pro Ala Met Ala Asn Lys Leu His Ala Phe Ser Met Gly Lys Lys Ser   1               5                  10                  15 Gly Lys Lys Phe Phe Val Thr Asn His Glu Arg Met Pro Phe Ser Lys
         20                  25                  30 Val Lys Ala Leu Cys Ser Glu Leu Arg Gly Thr Val Ala Ile Pro Lys
     35                  40                  45 Asn Ala Glu Glu Asn Lys Ala Ile Gln Glu Val Ala Lys Thr Ser Ala
 50                  55                  60 Phe Leu Gly Ile Thr Asp Glu Val Thr Glu Gly Gln Phe Met Tyr Val  65                  70                  75                  80 Thr Gly Gly Arg Leu Thr Tyr Ser Asn Trp Lys Lys Asp Glu Pro Asn
             85                  90                  95 Asp His Gly Ser Gly Glu Asp Cys Val Thr Ile Val Asp Asn Gly Leu
        100                 105                 110 Trp Asn Asp Ile Ser Cys Gln Ala Ser His Thr Ala Val Cys Glu Phe
    115                 120                 125 Pro Ala Ala
130 <210>60 <211>408 <212>DNA <213>人类 <220> <221>CDS <222>(8)..(403) <223>人PhSP-D插入片段 <400>60 ggcccag ccg gcc atg gcc aag aaa gtt gag ctc ttc cca aat ggc caa    49
    Pro Ala Met Ala Lys Lys Val Glu Leu Phe Pro Asn Gly Gln
      1               5                  10 agt gtg ggg gag aag att ttc aag aca gca ggc ttt gta aaa cca ttt    97 Ser Val Gly Glu Lys Ile Phe Lys Thr Ala Gly Phe Val Lys Pro Phe  15                  20                  25                  30 acg gag gca cag ctg ctg tgc aca cag gct ggt gga cag ttg gcc tct    145 Thr Glu Ala Gln Leu Leu Cys Thr Gln Ala Gly Gly Gln Leu Ala Ser
             35                  40                  45 cca cgc tct gcc gct gag aat gcc gcc ttg caa cag ctg gtc gta gct    193 Pro Arg Ser Ala Ala Glu Asn Ala Ala Leu Gln Gln Leu Val Val Ala
         50                  55                  60 aag aac gag gct gct ttc ctg agc atg act gat tcc aag aca gag ggc    241 Lys Asn Glu Ala Ala Phe Leu Ser Met Thr Asp Ser Lys Thr Glu Gly
     65                  70                  75 aag ttc acc tac ccc aca gga gag tcc ctg gtc tat tcc aac tgg gcc    289 Lys Phe Thr Tyr Pro Thr Gly Glu Ser Leu Val Tyr Ser Asn Trp Ala
 80                  85                  90 cca ggg gag ccc aac gat gat ggc ggg tca gag gac tgt gtg gag atc    337 Pro Gly Glu Pro Asn Asp Asp Gly Gly Ser Glu Asp Cys Val Glu Ile  95                 100                 105                 110 ttc acc aat ggc aag tgg aat gac agg gct tgt gga gaa aag cgt ctt    385 Phe Thr Asn Gly Lys Trp Asn Asp Arg Ala Cys Gly Glu Lys Arg Leu
            115                 120                 125 gtg gtc tgc gag ttc gcg gccgc                                      408 Val Val Cys Glu Phe Ala
        130 <210>61 <211>132 <212>PRT <213>人类 <400>61 Pro Ala Met Ala Lys Lys Val Glu Leu Phe Pro Asn Gly Gln Ser Val   1               5                  10                  15 Gly Glu Lys Ile Phe Lys Thr Ala Gly Phe Val Lys Pro Phe Thr Glu
         20                  25                  30 Ala Gln Leu Leu Cys Thr Gln Ala Gly Gly Gln Leu Ala Ser Pro Arg
     35                  40                  45 Ser Ala Ala Glu Asn Ala Ala Leu Gln Gln Leu Val Val Ala Lys Asn
 50                  55                  60 Glu Ala Ala Phe Leu Ser Met Thr Asp Ser Lys Thr Glu Gly Lys Phe  65                  70                  75                  80 Thr Tyr Pro Thr Gly Glu Ser Leu Val Tyr Ser Asn Trp Ala Pro Gly
             85                  90                  95 Glu Pro Asn Asp Asp Gly Gly Ser Glu Asp Cys Val Glu Ile Phe Thr
        100                 105                 110 Asn Gly Lys Trp Asn Asp Arg Ala Cys Gly Glu Lys Arg Leu Val Val
    115                 120                 125 Cys Glu Phe Ala
130 <210>62 <211>49 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>62 cggctgagcg gcccagccgg ccatggccaa caagttgcat gccttctcc             49 <210>63 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>63 gcactcctgc ggccgcggct gggaactcgc agac                             34 <210>64 <211>48 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>64 cggctgagcg gcccagccgg  ccatggccaa gaaagttgag ctcttccc            48 <210>65 <211>36 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>65 gcactcctgc ggccgcgaac tcgcagacca caagac                            36 <210>66 <211>65 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>66 gccaccggtg acgtagatga attggccttc snnsnnsnns nnsnngtccg tgatgcctag  60 gaagg                                                              65 <210>67 <211>68 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>67 gccaccggtg acgtagatga attggccttc snnsnnsnns nnsnnsnngt ccgtgatgcc  60 taggaagg                                                           68 <210>68 <211>62 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>68 gccaccggtg acgtagatga asnnsnnsnn snnsnnsnns nncgtgatgc ctaggaaggc  60 ag                                                                 62 <210>69 <211>40 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>69 ccagttgctg tatttcaggc tgccaccggt gacgtagatg                         40 <210>70 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>70 gcctgaaata cagcaactgg aagaaagacg aacc                               34 <210>71 <211>68 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>71 ctggaagaaa gacgaaccga atgaccatgg cnnsnnsnns nnsnnsgaag actgtgtcac  60 tatagtag                                                           68 <210>72 <211>71 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>72 ctggaagaaa gacgaaccga atgaccatgg cnnsnnsnns nnsnnsnnsg aagactgtgt  60 cactatagta g                                                       71 <210>73 <211>59 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>73 ctggaagaaa gacgaaccga atnnsnnsnn snnsnnsgaa gactgtgtca ctatagtag  59 <210>74 <211>17 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>74 cggctgagcg gcccagc                                                 17 <210>75 <211>17 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>75 gcactcctgc ggccgcg                                                 17 <210>76 <211>69 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>76 ctcaccggtc ggatacgtga acttgccctc tgtsnnsnns nnsnnsnnat cagtcatgct  60 caggaaagc                                                          69 <210>77 <211>72 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>77 ctcaccggtc ggatacgtga acttgccctc tgtsnnsnns nnsnnsnnsn natcagtcat  60 gctcaggaaa gc                                                      72 <210>78 <211>60 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>78 ctcaccggtc ggatacgtga asnnsnnsnn snnsnnsnns nnagtcatgc tcaggaaagc  60 <210>79 <211>39 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>79 cagttggaat agaccaggga ctcaccggtc ggatacgtg                         39 <210>80 <211>65 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>80 gggccccagg ggagcccaac gatgatggcn nsnnsnnsnn snnsgaggac tgtgtggaga  60 tcttc                                                              65 <210>81 <211>68 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>81 gggccccagg ggagcccaac gatgatggcn nsnnsnnsnn snnsnnsgag gactgtgtgg  60 agatcttc                                                           68 <210>82 <211>68 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>82 gggccccagg ggagcccaac gatgatggcn nsnnsnnsnn snnsnnsgag gactgtgtgg  60 agatcttc                                                           68 <210>83 <211>56 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>83 gggccccagg ggagcccaac nnsnnsnnsn nsnnsgagga ctgtgtggag atcttc     56 <210>84 <211>77 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>84 gcatcgccta caagaactgg nnsnnsnnsn nsnnsnnsca acccgatggc ggcaagaccg 60 agaactgcgc ggtcctg                                                77 <210>85 <211>83 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>85 gcatcgccta caagaactgg gagnnsnnsn nsnnsnnsnn sgcgcaaccc gatggcggca 60 agaccgagaa ctgcgcggtc ctg                                         83 <210>86 <211>80 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>86     gcatcgccta caagaactgg gagnnsnnsn nsnnsnnsgc gcaacccgat ggcggcaaga 60 ccgagaactg cgcggtcctg                                             80 <210>87 <211>75 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>87 gtagggcaat tgatcgctgc agcgcttgtc gaaccasnns nnsnnsnnsn nsnnsnncag 60 gaccgcgcag ttctc                                                  75 <210>88 <211>84 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>88 gtagggcaat tgatcgctgc agcgcttgtc gaaccacttg ccsnnsnnsn nsnnsnnsnn 60 gcctgacagg accgcgcagt tctc                                        84 <210>89 <211>81 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>89 gtagggcaat tgatcgctgc agcgcttgtc gaaccacttg ccsnnsnnsn nsnnsnngcc 60 tgacaggacc gcgcagttct c                                           81 <210>90 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>90 gtagggcaat tgatcgctgc                                             20 <210>91 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>91 catgaccggt acccgcatcg cctacaagaa ctgg                            34
QQ群二维码
意见反馈