首页 / 专利库 / 疗法 / 疫苗 / 全细胞疫苗 / 分泌性蛋白质家族

分泌性蛋白质家族

阅读:341发布:2022-01-13

专利汇可以提供分泌性蛋白质家族专利检索,专利查询,专利分析的服务。并且本 发明 涉及一族新颖的分泌性 蛋白质 ,称作SECFAM1家族,它的家族成员包括新颖蛋白质INSP113、INSP114、INSP115、INSP116和INSP117,经本发明鉴定为分泌性蛋白质,含有带表皮生长因子(EGF)折叠的长125-153个 氨 基酸的结构域,以及含有8个保守性半胱氨酸残基;本发明还涉及这些蛋白质和编码基因的核酸序列在诊断、 预防 和 治疗 疾病 中的用途。,下面是分泌性蛋白质家族专利的具体信息内容。

1.一种鉴定SECFAM1家族成员的方法,其特征在于,所述方法包 括:
搜索翻译核酸序列或多肽序列数据库,鉴定一个与下列序列轮廓相匹配 的多肽序列:
        A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V
1M     -1 -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
2N      1  2  2 -1 -1  0 -1 -1 -1 -1 -1  0  3 -2 -2  1  0 -3 -2 -1
3K      0  0 -1  0 -2  1  2 -2 -1  0 -1  1 -1 -3  2 -1 -1 -3 -2  1
4R      0  3 -1 -2  4  0 -1 -2 -1  0  0  0  0 -2 -2  1 -1 -3 -2 -1
5Y      1  0 -2 -2 -2 -1 -1 -2 -1  0  0 -1  0 -1  3  0 -1 -2  2  0
6L     -1  2 -1 -1 -2  0  0 -2 -1 -1  0  3  2 -2 -2  0  1 -2 -2 -1
7Q      1  0  0 -1 -1  1  0 -1 -1 -2 -2  0 -1 -2 -1  2  2  3 -1 -1
8K     -1 -1  2 -1 -2 -1 -1  0 -1  0  0  1  2 -1 -2  0  0 -3 -2  2
9A      0  0 -2 -2 -1 -1 -2 -2 -2  0  0 -1  0 -1 -2  0 -1  7  0  0
10T     0  1  0 -1 -1  0 -1 -1 -1 -1  0  0  0 -2  1  2  1 -3 -2 -1
11Q     1  0  0 -1 -1  2  0 -1 -1 -1  0  0  0 -2  0  2  0 -3 -2 -1
12G     0  0  0  2 -2 -1  0  3  4 -2 -2 -1  2 -2 -2  0 -1 -2 -1 -2
13K     1 -1 -1 -1 -2 -1 -1  2 -2 -3 -2  0 -1 -1 -2  2 -1  7 -1 -2
14L     0 -2 -2 -3 -1 -2 -2  1 -2 -1  0 -2  0  0 -2 -1  1  8  0 -1
15L     2 -2 -3 -3 -1 -2 -2 -2 -3  1  3 -2  0 -1 -2 -1  0 -3 -1  2
16I    -1 -2 -3 -4 -1 -2 -3 -4 -3  2  4 -2  1  1 -3 -2 -1 -2  0  1
17I     1 -2 -2 -2 -1 -2 -2 -2 -1  1  1 -2  0  0  3 -1 -1 -1  2  0
181     0 -2 -1 -2 -1 -1 -2 -2 -2  1  3 -1  0 -1 -2  1  0 -2 -1  0
19F    -1 -2 -3 -3  6 -2 -3 -3 -1 -1  0 -2  3  2 -3 -2 -1  6  3 -1
20I     0 -2 -1 -2 -1 -2 -2 -2 -2  3  1 -2  0 -1 -2  1  1 -3 -1  2
21V     2 -2 -1 -2  3 -1 -1 -1 -2  0  0 -1  0 -2 -2  2  0 -3 -2  0
22T     1 -2 -2 -2  3 -1 -2 -2 -2 -1  0 -2  2 -1 -2  0  2  6 -1  0
23L    -1 -3 -3 -3  4 -3 -3 -3 -2  0  2 -3  0  4 -3 -2 -1 -1  0  1
24W     0 -3 -3 -3  5 -2 -3 -2 -2 -1  0 -3 -1  0 -3 -1 -1  9  0 -1
25G     1 -2 -1 -2  4 -1 -2  1 -2  0  0 -1  2 -2 -2  0  1 -2 -2  0
26K    -1  0 -1 -2  1  1  0 -3  1  0  1  2  0  2 -2 -1 -1 -2  0 -1
27A     0 -2 -3 -3 -1 -2 -2 -3 -3  1  3 -2  3  0  0 -2 -1 -2 -1  1
28V     0 -2 -2 -3  4 -2 -2 -3 -3  3  0 -2  3 -1 -2 -1  0 -2 -1  2
29S     0 -1  0 -1 -1 -1 -1 -1  5 -1  1 -1  0 -1 -2  2  0 -3  0 -1
30S     4 -1 -1 -2 -1 -1 -1  2 -2 -2 -2 -1 -1 -2 -1  1  1 -3 -2 -1
31A     1 -1  0  0 -1  1  0  1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
32N    -1 -1  2 -1 -2 -1 -2 -2 -1  0  3 -1  0  1 -3  1 -1 -2 -1  0
33H    -1  0  0 -1 -2  5  0 -3  3 -1  1  0  0 -2 -2 -1 -1 -2 -1 -1
34H    -1  0  0 -1 -2  0  0 -2  6  0 -1  0 -1 -2  2  0 -1 -3  0 -1
35K    -1  0  0 -1 -3  3  0 -2  4 -3 -2  1 -1 -3  3  0 -1 -2  0 -2
36A     2  1  0 -1 -1  0 -1 -1  4 -1 -1  0 -1 -2 -1  0  2 -2  0 -1
37H     0 -1  0 -1 -2 -1 -1  3  6 -3 -3 -1 -2 -2 -2  1 -1 -2  0 -2
38H     0 -1  0 -2  5 -1 -1 -2  5 -1  0 -1 -1 -1 -2  0  1 -2  0 -1
39V    -1 -2 -2 -2 -2 -1  0 -3 -2  2  2 -2  0 -1  2 -2 -1 -3 -1  2
40R     1  2 -1 -1 -2  1  1 -1 -1 -2 -2  3 -1 -3 -1  0 -1 -3 -2 -2
41T     2 -1 -1 -1 -2  3  0  1 -1 -2 -2  0 -1 -3  0  0  2 -2 -2 -1
42G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
43T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
44C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
45E    -1  0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
46V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
47V     0 -3 -3 -3 -1 -2 -2 -3 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
48A     4 -1 -1 -2  0 -1 -1 -1 -2 -1 -1 -1 -1 -2 -1  0  2 -3 -2  0
49L     3 -2 -3 -3 -1 -2 -2 -2 -3  0  2 -2  0 -1 -2  0  0 -3 -1  1
50H    -2 -1  0  3 -3  0  0 -2  8 -3 -3 -1 -2 -2 -2 -1 -2 -3  0 -3
51R    -1  6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
52C    -1 -3 -1  3  8 -2 -1 -2 -2 -2 -2 -2 -2 -2 -2 -1 -1 -3 -2 -2
53C     0 -2 -1 -2  8 -2 -2 -2 -2 -1 -1 -2 -1 -2 -2  2  0 -2 -2 -1
54N    -1  0  6  0 -2  0  0  0  0 -3 -3  0 -2 -3 -2  2  0 -4 -2 -3
55K    -1  2  0 -1 -3  3  0 -2 -1 -3 -2  4 -1 -3 -1  0 -1 -3 -2 -2
56N    -2 -1  6  0 -3  0  0 -1  0 -3 -3  0 -2 -3  3  0  0 -4 -2 -3
57K    -1  5  0 -2 -3  0  0 -2  0 -3 -2  3 -1 -3 -2 -1 -1 -3 -2 -3
58I    -1  2 -2 -3 -2 -1 -2 -3 -2  4  0 -1  0 -1 -3 -2 -1 -3 -1  1
59E    -1  0  0  0 -3  0  5 -2 -1 -2 -2  0 -2 -3 -1  0  2 -3 -2 -1
60E    -1 -1 -1  0 -3  0  5 -3 -1  2 -1  0 -1 -2 -2 -1 -1 -3 -2  0
61R     1  5 -1 -2 -2  0  0 -1 -1 -2 -2  0 -1 -3 -2  0 -1 -3 -2 -2
62S     0  2  0 -1 -2  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
63Q    -1  0  0  0 -3  6  1 -2  0 -3 -2  0  0 -3 -1  0 -1 -2 -1 -2
64T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
65V     2 -2 -3 -3 -1 -2 -2 -2 -3  1  0 -2  0 -1 -2 -1  0 -3 -1  4
66K    -1  3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
67C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
68S     2 -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
69C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
70F    -2  2 -2 -3 -2 -1 -2 -3 -1  0  1 -1  0  4 -3 -2 -2 -1  0 -1
71P    -1  0 -1 -1 -3  0  0 -2 -2 -3 -3  2 -2 -3  5  1 -1 -4 -3 -2
72G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
73Q    -1  0  0  0 -3  6  1 -2  0 -3 -2  2  0 -3 -1  0 -1 -2 -1 -2
74V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
75A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
76G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
77T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
78T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
79R    -1  6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
80A     4 -1  1 -1  0 -1 -1  0 -1 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
81A     0  4  0 -2 -2  2  0 -2 -1 -2  0  2  0 -3 -2  0 -1 -3 -2 -2
82P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
83S     2 -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
84C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
85V     0 -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
86D    -2 -2  0  6 -3  0  2 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
87A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
88S     0  2  0 -1 -1  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
89I    -1 -3 -3 -3 -1 -3 -3 -4 -3  5  1 -3  0  0 -3 -2 -1 -3 -1  2
90V      0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
91E     -1  1 -1 -1 -2  0  1 -3 -2  2  1  2  0 -1 -2 -1 -1 -3 -2  0
92Q     -1  0  0  0 -2  4  1  0 -1 -2 -2  0 -1 -2 -1  0  2  2 -1 -2
93K     -1  2  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
94W     -2 -1 -2 -2 -2  2 -1 -2 -1 -3 -2 -1 -1  0 -3 -2 -2 10  0 -3
95W     -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
96C      0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
97H     -2  0  1  3 -3  2  2 -2  5 -3 -3  0 -2 -2 -1  0 -1 -3  0 -3
98M     -1 -1- 2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
99Q     -1  0  2  0 -3  2  3 -2  0 -1  1  0  0 -2 -2  0 -1 -3 -2 -1
100P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
101C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
102L    -1 -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  1
103E    -1 -1 -1  0 -3  0  5 -2 -1 -1  0  0 -1 -2  0  0 -1 -3 -2  0
104G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
105E    -1  0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
106E    -1 -1  0  2 -4  0  4  2 -1 -3 -4  0 -3 -3 -1  0 -1 -3 -3 -3
107C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
108K    -1  1  0  3 -3  0  0 -2 -1 -3 -3  4 -2 -3 -1  0 -1 -3 -2 -2
109V     0 -2 -2 -3 -1 -2 -2 -3 -3  1  2 -2  0 -1 -2 -1  1 -3 -1  4
110L    -1 -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  0
111P    -1 -2 -2 -2 -2 -2 -2 -3 -2  2 -1 -2 -1 -2  6 -1 -1 -4 -2  0
112D    -2 -1  3  6 -3  0  1 -1  0 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
113R    -1  3  2 -2 -2  0 -1 -2  0 -1  1  0  0 -1 -2  0 -1 -2  1 -1
114K     0 -1  0  0 -1  0  0  0 -1 -2 -2  1 -1 -2 -1  4  1 -3 -2 -2
115G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
116W    -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
117S     0 -1  0 -1 -1  0 -1 -1 -1 -1 -1  0  2 -2 -1  3  3 -2 -2 -1
118C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
119S     1 -1  0 -1 -1 -1 -1 -1 -2  0 -1 -1 -1 -2 -1  3  3 -3 -2  0
120S     0  0  0  0 -2  3  0 -1 -1 -2 -2  0 -1 -2 -1  3  1 -3 -2 -2
121G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
122N    -1 -1  5  0 -3 -1 -1  3  4 -3 -3 -1 -2 -3 -2  0 -1 -3 -1 -3
123K    -1  3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
124V     0 -3 -3 -3 -1 -2 -2 -4 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
125K    -1  1  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
126T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
127T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
128R    -1  3  0 -1 -2  0  0 -2 -1 -2 -2  4 -1 -3 -1  0  2 -3 -2 -2
129V     0 -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
130T     0 -1  0 -1 -1  0 -1 -1  2 -1  0 -1 -1 -2 -1  3  3 -3 -1 -1
131H    -1  4  0 -1 -3  0  0 -2  4 -3 -2  0 -1 -3  3 -1 -1 -3 -1 -3
其中,当把所述序列轮廓作为查询序列输入到搜索程序BLAST时,采 用生物信息国家中心(NCBI)确定的缺省参数[Blosum 62矩阵;空位开放罚 分=11,空位拓展罚分=1],E值为10-2或以下的那些就是SECFAM1家族成 员。
2.如权利要求1所述的方法,其特征在于,所述E值等于或少于10-5 ,等于或少于10-10,等于或少于10-50,最好等于或少于10-70。
3.如权利要求1或2所述的方法,其特征在于,所述翻译核酸序列数 据库由cDNA、EST、mRNA、全部或部分基因组数据库产生。
4.如上述权利要求中任一项所述的方法,其特征在于,所述数据库是 EST数据库。
5.如上述权利要求中任一项所述的方法,其特征在于,所述数据库是 人序列数据库。
6.一种分离的多肽,其特征在于,所述多肽:
(i)包括这样一个多肽序列:当以下列序列轮廓作为查询序列输入到搜 索程序BLAST时,采用NCBI确定的缺省参数,所述多肽序列的E值为10-2 或以下,Blosum 62矩阵;空位开放罚分=11,空位拓展罚分=1;
      A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V
1M   -1 -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
2N    1  2  2 -1 -1  0 -1 -1 -1 -1 -1  0  3 -2 -2  1  0 -3 -2 -1
3K    0  0 -1  0 -2  1  2 -2 -1  0 -1  1 -1 -3  2 -1 -1 -3 -2  1
4R      0  3 -1 -2  4  0 -1 -2 -1  0  0  0  0 -2 -2  1 -1 -3 -2 -1
5Y      1  0 -2 -2 -2 -1 -1 -2 -1  0  0 -1  0 -1  3  0 -1 -2  2  0
6L     -1  2 -1 -1 -2  0  0 -2 -1 -1  0  3  2 -2 -2  0  1 -2 -2 -1
7Q      1  0  0 -1 -1  1  0 -1 -1 -2 -2  0 -1 -2 -1  2  2  3 -1 -1
8K     -1 -1  2 -1 -2 -1 -1  0 -1  0  0  1  2 -1 -2  0  0 -3 -2  2
9A      0  0 -2 -2 -1 -1 -2 -2 -2  0  0 -1  0 -1 -2  0 -1  7  0  0
10T     0  1  0 -1 -1  0 -1 -1 -1 -1  0  0  0 -2  1  2  1 -3 -2 -1
11Q     1  0  0 -1 -1  2  0 -1 -1 -1  0  0  0 -2  0  2  0 -3 -2 -1
12G     0  0  0  2 -2 -1  0  3  4 -2 -2 -1  2 -2 -2  0 -1 -2 -1 -2
13K     1 -1 -1 -1 -2 -1 -1  2 -2 -3 -2  0 -1 -1 -2  2 -1  7 -1 -2
14L     0 -2 -2 -3 -1 -2 -2  1 -2 -1  0 -2  0  0 -2 -1  1  8  0 -1
15L     2 -2 -3 -3 -1 -2 -2 -2 -3  1  3 -2  0 -1 -2 -1  0 -3 -1  2
16I    -1 -2 -3 -4 -1 -2 -3 -4 -3  2  4 -2  1  1 -3 -2 -1 -2  0  1
17I     1 -2 -2 -2 -1 -2 -2 -2 -1  1  1 -2  0  0  3 -1 -1 -1  2  0
18I     0 -2 -1 -2 -1 -1 -2 -2 -2  1  3 -1  0 -1 -2  1  0 -2 -1  0
19F    -1 -2 -3 -3  6 -2 -3 -3 -1 -1  0 -2  3  2 -3 -2 -1  6  3 -1
20I     0 -2 -1 -2 -1 -2 -2 -2 -2  3  1 -2  0 -1 -2  1  1 -3 -1  2
21V     2 -2 -1 -2  3 -1 -1 -1 -2  0  0 -1  0 -2 -2  2  0 -3 -2  0
22T     1 -2 -2 -2  3 -1 -2 -2 -2 -1  0 -2  2 -1 -2  0  2  6 -1  0
23L    -1 -3 -3 -3  4 -3 -3 -3 -2  0  2 -3  0  4 -3 -2 -1 -1  0  1
24W     0 -3 -3 -3  5 -2 -3 -2 -2 -1  0 -3 -1  0 -3 -1 -1  9  0 -1
25G     1 -2 -1 -2  4 -1 -2  1 -2  0  0 -1  2 -2 -2  0  1 -2 -2  0
26K    -1  0 -1 -2  1  1  0 -3  1  0  1  2  0  2 -2 -1 -1 -2  0 -1
27A     0 -2 -3 -3 -1 -2 -2 -3 -3  1  3 -2  3  0  0 -2 -1 -2 -1  1
28V     0 -2 -2 -3  4 -2 -2 -3 -3  3  0 -2  3 -1 -2 -1  0 -2 -1  2
29S     0 -1  0 -1 -1 -1 -1 -1  5 -1  1 -1  0 -1 -2  2  0 -3  0 -1
30S     4 -1 -1 -2 -1 -1 -1  2 -2 -2 -2 -1 -1 -2 -1  1  1 -3 -2 -1
31A     1 -1  0  0 -1  1  0  1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
32N    -1 -1  2 -1 -2 -1 -2 -2 -1  0  3 -1  0  1 -3  1 -1 -2 -1  0
33H    -1  0  0 -1 -2  5  0 -3  3 -1  1  0  0 -2 -2 -1 -1 -2 -1 -1
34H    -1  0  0 -1 -2  0  0 -2  6  0 -1  0 -1 -2  2  0 -1 -3  0 -1
35K    -1  0  0 -1 -3  3  0 -2  4 -3 -2  1 -1 -3  3  0 -1 -2  0 -2
36A     2  1  0 -1 -1  0 -1 -1  4 -1 -1  0 -1 -2 -1  0  2 -2  0 -1
37H     0 -1  0 -1 -2 -1 -1  3  6 -3 -3 -1 -2 -2 -2  1 -1 -2  0 -2
38H     0 -1  0 -2  5 -1 -1 -2  5 -1  0 -1 -1 -1 -2  0  1 -2  0 -1
39V    -1 -2 -2 -2 -2 -1  0 -3 -2  2  2 -2  0 -1  2 -2 -1 -3 -1  2
40R     1  2 -1 -1 -2  1  1 -1 -1 -2 -2  3 -1 -3 -1  0 -1 -3 -2 -2
41T     2 -1 -1 -1 -2  3  0  1 -1 -2 -2  0 -1 -3  0  0  2 -2 -2 -1
42G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
43T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
44C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
45E    -1  0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
46V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
47V     0 -3 -3 -3 -1 -2 -2 -3 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
48A     4 -1 -1 -2  0 -1 -1 -1 -2 -1 -1 -1 -1 -2 -1  0  2 -3 -2  0
49L     3 -2 -3 -3 -1 -2 -2 -2 -3  0  2 -2  0 -1 -2  0  0 -3 -1  1
50H    -2 -1  0  3 -3  0  0 -2  8 -3 -3 -1 -2 -2 -2 -1 -2 -3  0 -3
51R    -1  6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
52C    -1 -3 -1  3  8 -2 -1 -2 -2 -2 -2 -2 -2 -2 -2 -1 -1 -3 -2 -2
53C     0 -2 -1 -2  8 -2 -2 -2 -2 -1 -1 -2 -1 -2 -2  2  0 -2 -2 -1
54N    -1  0  6  0 -2  0  0  0  0 -3 -3  0 -2 -3 -2  2  0 -4 -2 -3
55K    -1  2  0 -1 -3  3  0 -2 -1 -3 -2  4 -1 -3 -1  0 -1 -3 -2 -2
56N    -2 -1  6  0 -3  0  0 -1  0 -3 -3  0 -2 -3  3  0  0 -4 -2 -3
57K    -1  5  0 -2 -3  0  0 -2  0 -3 -2  3 -1 -3 -2 -1 -1 -3 -2 -3
58I    -1  2 -2 -3 -2 -1 -2 -3 -2  4  0 -1  0 -1 -3 -2 -1 -3 -1  1
59E    -1  0  0  0 -3  0  5 -2 -1 -2 -2  0 -2 -3 -1  0  2 -3 -2 -1
60E    -1 -1 -1  0 -3  0  5 -3 -1  2 -1  0 -1 -2 -2 -1 -1 -3 -2  0
61R     1  5 -1 -2 -2  0  0 -1 -1 -2 -2  0 -1 -3 -2  0 -1 -3 -2 -2
62S     0  2  0 -1 -2  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
63Q    -1  0  0  0 -3  6  1 -2  0 -3 -2  0  0 -3 -1  0 -1 -2 -1 -2
64T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
65V     2 -2 -3 -3 -1 -2 -2 -2 -3  1  0 -2  0 -1 -2 -1  0 -3 -1  4
66K    -1  3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
67C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
68S     2 -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
69C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
70F    -2  2 -2 -3 -2 -1 -2 -3 -1  0  1 -1  0  4 -3 -2 -2 -1  0 -1
71P    -1  0 -1 -1 -3  0  0 -2 -2 -3 -3  2 -2 -3  5  1 -1 -4 -3 -2
72G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
73Q    -1  0  0  0 -3  6  1 -2  0 -3 -2  2  0 -3 -1  0 -1 -2 -1 -2
74V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
75A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
76G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
77T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
78T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
79R    -1  6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
80A     4 -1  1 -1  0 -1 -1  0 -1 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
81A     0  4  0 -2 -2  2  0 -2 -1 -2  0  2  0 -3 -2  0 -1 -3 -2 -2
82P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
83S     2 -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
84C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
85V     0 -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
86D    -2 -2  0  6 -3  0  2 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
87A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
88S     0  2  0 -1 -1  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
89I    -1 -3 -3 -3 -1 -3 -3 -4 -3  5  1 -3  0  0 -3 -2 -1 -3 -1  2
90V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
91E    -1  1 -1 -1 -2  0  1 -3 -2  2  1  2  0 -1 -2 -1 -1 -3 -2  0
92Q    -1  0  0  0 -2  4  1  0 -1 -2 -2  0 -1 -2 -1  0  2  2 -1 -2
93K    -1  2  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
94W    -2 -1 -2 -2 -2  2 -1 -2 -1 -3 -2 -1 -1  0 -3 -2 -2 10  0 -3
95W    -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
96C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
97H    -2  0  1  3 -3  2  2 -2  5 -3 -3  0 -2 -2 -1  0 -1 -3  0 -3
98M    -1 -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
99Q    -1  0  2  0 -3  2  3 -2  0 -1  1  0  0 -2 -2  0 -1 -3 -2 -1
100P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7- 1- 1 -4 -3 -2
101C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
102L    -1 -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  1
103E    -1 -1 -1  0 -3  0  5 -2 -1 -1  0  0 -1 -2  0  0 -1 -3 -2  0
104G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
105E    -1  0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
106E    -1 -1  0  2 -4  0  4  2 -1 -3 -4  0 -3 -3 -1  0 -1 -3 -3 -3
107C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
108K    -1  1  0  3 -3  0  0 -2 -1 -3 -3  4 -2 -3 -1  0 -1 -3 -2 -2
109V     0 -2 -2 -3 -1 -2 -2 -3 -3  1  2 -2  0 -1 -2 -1  1 -3 -1  4
110L    -1 -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  0
111P    -1 -2 -2 -2 -2 -2 -2 -3 -2  2 -1 -2 -1 -2  6 -1 -1 -4 -2  0
112D    -2 -1  3  6 -3  0  1 -1  0 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
113R    -1  3  2 -2 -2  0 -1 -2  0 -1  1  0  0 -1 -2  0 -1 -2  1 -1
114K     0 -1  0  0 -1  0  0  0 -1 -2 -2  1 -1 -2 -1  4  1 -3 -2 -2
115G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
116W    -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
117S     0 -1  0 -1 -1  0 -1 -1 -1 -1 -1  0  2 -2 -1  3  3 -2 -2 -1
118C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
119S     1 -1  0 -1 -1 -1 -1 -1 -2  0 -1 -1 -1 -2 -1  3  3 -3 -2  0
120S     0  0  0  0 -2  3  0 -1 -1 -2 -2  0 -1 -2 -1  3  1 -3 -2 -2
121G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
122N    -1 -1  5  0 -3 -1 -1  3  4 -3 -3 -1 -2 -3 -2  0 -1 -3 -1 -3
123K    -1  3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
124V     0 -3 -3 -3 -1 -2 -2 -4 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
125K    -1  1  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
126T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
127T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
128R    -1  3  0 -1 -2  0  0 -2 -1 -2 -2  4 -1 -3 -1  0  2 -3 -2 -2
129V     0 -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
130T     0 -1  0 -1 -1  0 -1 -1  2 -1  0 -1 -1 -2 -1  3  3 -3 -1 -1
131H    -1  4  0 -1 -3  0  0 -2  4 -3 -2  0 -1 -3  3 -1 -1 -3 -1 -3
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
7.如权利要求6所述的多肽,其特征在于,所述多肽由这样一个多肽 组成。
8.如权利要求6或7所述的多肽,其特征在于,所述多肽的最大E值 是10-2,更好地,所述多肽的最小E值等于或少于10-5、等于或少于10-10、 等于或少于10-50,最好等于或少于10-70。
9.一种分离的多肽,其特征在于,所述多肽
(i)包括一满足以下共有基酸序列的多肽:G-T-C-E-[VI]-[VI]-[AT]- [AVL]-[HD]-R-[CD]-[CS]-[NS]-[KRQ]-[NP]-[RK]-[IR]-[ET]-[EI]-[RA]-[SR]-Q- T-[VA]-[KR]-C-[SA]-C-[LFR]-[PSK]-G-[KQ]-[VI]-A-G-T-T-R-[NA]-[RQLAK]- P-[SA]-C-V-[DE]-A-[SAR]-I-[VI]-[IELKR]-[WGQET]-[KR]-[WQ]-W-C- [EHNQD]-M-[ENQL]-P-C-[LV]-[EVLP]-G-E-[DEG]-C-[KRD]-[TVL]-L-[PI]- [DN]-[NYSLR]-[STK]-G-W-[MST]-C-[ASIT]-[TSRQ]-P(0,1)-G-[NHG]-[KR]- [IV]-K-T-T;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
10.如权利要求9所述的多肽,其特征在于,所述多肽由一满足以下共 有氨基酸序列的多肽组成:G-T-C-E-[VI]-[VI]-[AT]-[AVL]-[HD]-R-[CD]- [CS]-[NS]-[KRQ]-[NP]-[RK]-[IR]-[ET]-[EI]-[RA]-[SR]-Q-T-[VA]-[KR]-C-[SA]- C-[LFR]-[PSK]-G-[KQ]-[VI]-A-G-T-T-R-[NA]-[RQLAK]-P-[SA]-C-V-[DE]-A- [SAR]-I-[VI]-[IELKR]-[WGQET]-[KR]-[WQ]-W-C-[EHNQD]-M-[ENQL]-P-C- [LV]-[EVLP]-G-E-[DEG]-C-[KRD]-[TVL]-L-[PI]-[DN]-[NYSLR]-[STK]-G-W- [MST]-C-[ASIT]-[TSRQ]-P(0,1)-G-[NHG]-[KR]-[IV]-K-T-T。
11.一种多肽,其特征在于,所述多肽:
(i)包括SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28和/或SEQ ID NO:30所示的氨 基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
12.如权利要求11所述的多肽,其特征在于,所述多肽:
(i)包括SEQ ID NO:26和/或SEQ ID NO:30所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
13.如权利要求11或12所述的多肽,其特征在于,所述多肽:
(i)由SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28和/或SEQ ID NO:30所示的氨 基酸序列组成;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
14.一种多肽,其特征在于,所述多肽:
(i)包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:37和/或SEQ ID NO:39所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
15.如权利要求14所述的多肽,其特征在于,所述多肽:
(i)由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:37和/或SEQ ID NO:39所示的氨基酸序列组成;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
16.一种多肽,其特征在于,所述多肽:
(i)包括SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:53和/或SEQ ID NO:55所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
17.如权利要求16所述的多肽,其特征在于,所述多肽:
(i)由SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO: 43、SEQ ID NO:53和/或SEQ ID NO:55所示的氨基酸序列组成;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
18.一种多肽,其特征在于,所述多肽:
(i)包括SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:45和/或SEQ ID NO:47所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
19.如权利要求18所述的多肽,其特征在于,所述多肽:
(i)由SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:45和/或SEQ ID NO:47所示的氨基酸序列组成;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
20.一种多肽,其特征在于,所述多肽:
(i)包括SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:49和/或SEQ ID NO:51所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
21.如权利要求20所述的多肽,其特征在于,所述多肽:
(i)由括SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:49和/或SEQ ID NO:51所示的氨基酸序列组成;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,或者具有 与(i)所述多肽相同的抗原决定簇;或者
(iii)是(i)或(ii)的功能等同物。
22.一种多肽,它是权利要求6至21中任一项(iii)部分所述的功能等同 物,其特征在于,所述多肽与以下序列所示的氨基酸序列同源:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO: 18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO: 26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:37,SEQ ID NO: 39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO: 47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53和/或SEQ ID NO:55,而且是含有EGF结构域的蛋白质家族成员。
23.一种多肽,它是权利要求6至22中任一项所述的片段或功能等同 物,其特征在于,所述多肽与以下序列或其活性片段的序列同一性大于 80%:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8, SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16, SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24, SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:37, SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45, SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53和/或 SEQ ID NO:55,最好大于85%、90%、95%、98%或99%。
24.一种多肽,它是权利要求6至23中任一项所述的功能等同物,其特 征在于,所述多肽与具有以下氨基酸序列的多肽共享较高平的结构同源 性:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8, SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16, SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24, SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:37, SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45, SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53和/或 SEQ ID NO:55。
25.一种多肽,它是权利要求6至21中任一项所述的片段或者权利要求 23中具有与权利要求6至21中任一项部分(i)所述多肽相同的抗原决定簇的 片段,其特征在于,所述多肽由来自以下氨基酸序列所示的7或以上个氨基 酸残基组成:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53和/或SEQ ID NO:55。
26.如上述权利要求中任一项所述的多肽,其特征在于,所述多肽具有 与凝血因子X相似的生物活性。
27.一种编码上述权利要求中任一项所述的多肽的纯化核酸分子。
28.如权利要求27所述的纯化核酸分子,其特征在于,所述纯化核酸分 子包括以下序列所示的核酸序列:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO: 13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21, SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52和SEQ ID NO:54,或者是其冗余等同物或片段。
29.如权利要求27所述的纯化核酸分子,其特征在于,所述纯化核酸分 子由以下序列所示的核酸序列组成:SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO: 13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21, SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52和/或SEQ ID NO:54,或者是其冗余等同物或片段。
30.一种在高度严谨条件下与权利要求27至30中任一项所述的核酸分 子杂交的纯化核酸分子。
31.一种含有权利要求27至30中任一项所述的核酸分子的载体。
32.一种用权利要求31所述的载体转化的宿主细胞。
33.一种配体,其特征在于:所述配体与权利要求6至26中任一项所述 的含有EGF结构域的蛋白质家族多肽特异性结合。
34.如权利要求33所述的配体,其特征在于:所述配体是一种抗体
35.一种增加或降低权利要求6至26中任一项所述的多肽的表达水平或 活性的化合物。
36.如权利要求35所述的化合物,其特征在于:所述化合物与权利要求 6至26中任一项所述的多肽结合,并且不会诱导该多肽产生任何生物作 用。
37.如权利要求36所述的化合物,其特征在于:所述化合物是天然或修 饰的基质、配体、酶、受体或者结构或功能类似物。
38.如权利要求6至26中任一项所述的多肽、权利要求27至30中任一 项所述的核酸分子、权利要求31所述的载体、权利要求32所述的宿主细 胞、权利要求33或34所述的配体、或者权利要求35至37中任一项所述的 化合物,在治疗或诊断疾病中的用途。
39.一种诊断患者疾病的方法,其特征在于:所述方法包括评估所述患 者组织中编码权利要求6至26中任一项所述多肽的天然基因的表达水平, 或者评估权利要求6至26中任一项所述多肽的活性,并将所述表达水平或 者活性与对照水平作比较,若该水平与所述对照水平不同,则表示患病。
40.如权利要求39所述的方法,其特征在于:所述方法在体外进行。
41.如权利要求39或40所述的方法,其特征在于:所述方法包括以下 步骤:
(a)在适合形成配体-多肽复合物的条件下,将权利要求33或34所述的 配体与生物样品接触;以及
(b)检测所述复合物。
42.如权利要求39或40所述的方法,其特征在于:所述方法包括以下 步骤:
(a)在允许权利要求27至30中任何一项所述的核酸分子和核酸探针之 间形成杂交复合物的严谨条件下,将患者的组织样品与该探针接触;
(b)在步骤(a)使用的相同条件下,将对照样品与所述探针接触;以及
(c)检测所述样品中是否存在杂交复合物,其中,检测到患者样品中杂 交复合物的水平与对照样品中杂交复合物水平不同,表示患病。
43.如权利要求39或40所述的方法,其特征在于:所述方法包括以下 步骤:
(a)在允许权利要求27至30中任何一项所述的核酸分子和核酸引物之 间形成杂交复合物的严谨条件下,将患者组织的核酸样品与该引物接触;
(b)在步骤(a)使用的相同条件下,将对照样品与所述引物接触;
(c)扩增样品中的核酸;以及
(d)检测患者和对照样品中扩增核酸的水平;其中,检测到患者样品的 扩增核酸水平与对照样品的扩增核酸水平明显不同,表示患病。
44.如权利要求39或40所述的方法,其特征在于:所述方法包括:
(a)从有待测试疾病的患者中获得组织样品;
(b)从所述组织样品中分离权利要求27至30中任何一项所述的核酸分 子;以及
(c)通过检测核酸分子与疾病相关的突变是否存在,诊断患者疾病,若 存在,表示患病。
45.如权利要求44所述的方法,其特征在于:所述方法还包括扩增核酸 分子以形成扩增产物,以及检测该扩增产物中是否存在突变。
46.如权利要求44或45所述的方法,其特征在于:所述患者是否存在 突变是这样检测的:将所述核酸分子与在严谨条件下和所述核酸分子杂交的 核酸探针接触,形成杂交双链分子,该杂交双链分子在对应于与疾病相关的 突变的任何部分具有核酸探针链的未杂交部分;以及检测探针链的未杂交部 分是否存在,表示与疾病相关的突变存在或不存在。
47.如权利要求39至46中任一项所述的方法,其特征在于:所述疾病 包括但不限于:生育障碍,包括不孕症;细胞增殖性疾病,包括肿瘤、黑素 瘤、癌、结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤;骨髓增生 性疾病,例如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板减少症、 血管生成障碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏症、炎症性 肠疾病、关节炎、屑病、呼吸道发炎、哮喘和器官移植排斥;心血管疾 病,包括高血压、水肿、心绞痛、动脉硬化症、血栓症、败血症、休克、再 灌注损伤和缺血;神经系统疾病,包括中枢神经系统疾病、阿茨海默氏 病、脑损伤、肌萎缩性侧索硬化症和疼痛;发育障碍;代谢性疾病,包括糖 尿病、骨质疏松和肥胖、AIDS和肾病;感染,包括病毒性感染、细菌性感 染、真菌性感染和寄生虫感染。
48.如权利要求39至46中任一项所述的方法,其特征在于,所述疾病 是涉及淋巴细胞抗原的疾病。
49.如权利要求6至26中任一项所述的多肽作为含有EGF结构域的蛋 白质的用途。
50.一种药物组合物,其特征在于:所述组合物含有权利要求6至26中 任一项所述的多肽、权利要求27至30中任一项所述的核酸分子、权利要求 31所述的载体、权利要求32所述的宿主细胞、权利要求33或34所述的配 体、或者权利要求35至37中任一项所述的化合物。
51.一种疫苗组合物,其特征在于:所述组合物含有权利要求6至26中 任一项所述的多肽或权利要求27至30中任一项所述的核酸分子。
52.如权利要求6至26中任一项所述的多肽、权利要求27至30中任 一项所述的核酸分子、权利要求31所述的载体、权利要求32所述的宿主细 胞、权利要求33或34所述的配体、权利要求35至37中任一项所述的化合 物、或者权利要求50所述的药物组合物在制备治疗以下疾病的药物中的用 途:生育障碍,包括不孕症;细胞增殖性疾病,包括肿瘤、黑素瘤、肺癌、 结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤;骨髓增生性疾病,例 如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板减少症、血管生成障 碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏症、炎症性肠疾病、关 节炎、银屑病、呼吸道发炎、哮喘和器官移植排斥;心血管疾病,包括高血 压、水肿、心绞痛、动脉硬化症、血栓症、败血症、休克、再灌注损伤和缺 血;神经系统疾病,包括中枢神经系统疾病、阿耳茨海默氏病、脑损伤、肌 萎缩性侧索硬化症和疼痛;发育障碍;代谢性疾病,包括糖尿病、骨质疏松 和肥胖、AIDS和肾病;感染,包括病毒性感染、细菌性感染、真菌性感染 和寄生虫感染以及其它病理病症。
53.如权利要求6至26中任一项所述的多肽、权利要求27至30中任一 项所述的核酸分子、权利要求31所述的载体、权利要求32所述的宿主细 胞、权利要求33或34所述的配体、权利要求35至37中任一项所述的化合 物、或者权利要求50所述的药物组合物在制备治疗涉及淋巴抗原的疾病的 药物中的用途。
54.一种治疗患者疾病的方法,其特征在于:所述方法包括把权利要求 6至26中任一项所述的多肽、权利要求27至30中任一项所述的核酸分 子、权利要求31所述的载体、权利要求32所述的宿主细胞、权利要求33 或34所述的配体、权利要求35至37中任一项所述的化合物、或者权利要 求50所述的药物组合物给予该患者。
55.如权利要求54所述的方法,其特征在于:当与健康受试者中多肽的 天然基因的表达水平或者活性相比,病患者的该表达水平或活性是较低的, 给予该患者的多肽、核酸分子、载体、配体、化合物或组合物是激动剂。
56.如权利要求54所述的方法,其特征在于:当与健康受试者中多肽的 天然基因的表达水平或者活性相比,病患者的该表达水平或活性是较高的, 给予该患者的多肽、核酸分子、载体、配体、化合物或组合物是拮抗剂。
57.一种监测治疗患者疾病的方法,其特征在于:所述方法包括在一段 时间内监测患者组织中权利要求6至26中任一项所述的多肽的表达水平或 活性、或权利要求27至30中任一项所述的核酸分子的表达水平,若在该时 间内所述表达水平或活性趋向于对照水平,表示该疾病获得缓解。
58.一种鉴定有效地治疗和/或诊断疾病的化合物的方法,其特征在于: 所述方法包括将权利要求6至26中任一项所述的多肽、或者权利要求27至 30中任一项所述的核酸分子与怀疑对所述多肽或核酸分子有结合亲和的 一或多种化合物接触,以及选择能特异性地结合所述核酸分子或多肽的化合 物。
59.一种诊断疾病的试剂盒,其特征在于:所述试剂盒包括第一容器, 它含有在严谨条件下与权利要求27至30中任一项所述的核酸分子杂交的核 酸探针;第二容器,它含有用来扩增该核酸分子的引物;以及该探针和引物 的使用说明书,方便诊断疾病。
60.如权利要求59所述的试剂盒,其特征在于:所述试剂盒还包括装有 消化未杂交RNA的试剂的第三容器。
61.一种试剂盒,其特征在于:所述试剂盒包括核酸分子阵列,其中至 少一个核酸分子是权利要求27至30中任一项所述的核酸分子。
62.一种试剂盒,其特征在于:所述试剂盒包括一或多种与权利要求6 至26中任一项所述多肽结合的抗体;以及一种用来检测所述抗体与所述多 肽之间结合反应的试剂。
63.一种转基因或剔除非人动物,其特征在于:所述动物被转化为更高 水平、更低水平或不表达权利要求6至26中任一项所述的多肽。
64.一种筛选有效治疗疾病的化合物的方法,其特征在于:所述方法包 括将权利要求63所述的非人转基因动物与候选化合物接触,并测定该化合 物对动物疾病的影响。
65.如权利要求6至26中任一项所述的多肽、权利要求27至30中任一 项所述的核酸分子、权利要求31所述的载体、权利要求32所述的宿主细 胞、权利要求33或34所述的配体、权利要求35至37中任一项所述的化合 物、或者权利要求50所述的药物组合物在体外授精中的用途或作为避孕药 的用途。
66.如权利要求6至26中任一项所述的多肽、权利要求27至30中任一 项所述的核酸分子、权利要求31所述的载体、权利要求32所述的宿主细 胞、权利要求33或34所述的配体、权利要求35至37中任一项所述的化合 物、或者权利要求50所述的药物组合物在制备避孕药中的用途。
67.如权利要求6至26中任一项所述的多肽、权利要求27至30中任一 项所述的核酸分子、权利要求31所述的载体、权利要求32所述的宿主细 胞、权利要求33或34所述的配体、权利要求35至37中任一项所述的化合 物、或者权利要求50所述的药物组合物在制备治疗以下疾病的药物中的用 途:关节炎、类湿性关节炎、关节银屑病、骨关节炎、全身性红斑狼疮、 全身性硬化症、硬皮病、多肌炎、肾小球性肾炎、纤维化、肺纤维化和发 炎、过敏性或超敏性疾病、皮炎、哮喘、慢性阻塞性肺病、炎症性肠病、克 罗恩氏病、溃疡性结肠炎、多发性硬化症、脓毒性休克、HIV感染、移植排 斥、伤口愈合、转移、子宫内膜异位、肝炎、肝纤维化、癌症、痛觉丧失、 动脉粥样硬化相关的血管发炎、炎症性皮肤病如特应性皮炎和银屑病、斯耶 格伦氏综合征和/或重肌症无力。

说明书全文

技术领域

发明涉及一族新颖的分泌性蛋白质,称作SECFAM1家族,它的家族 成员包括新颖蛋白质INSP113、INSP114、INSP115、INSP116和INSP117, 经本发明鉴定为分泌性蛋白质,含有带表皮生长因子(EGF)折叠的长125-153 个基酸的结构域,以及含有8个保守性半胱氨酸残基;本发明还涉及这些 蛋白质和编码基因的核酸序列在诊断、预防治疗疾病中的用途。

本文所引用的全部出版物、专利和专利申请,均纳入其全文作为参考。

发明背景

目前,药物发现方法正蕴酿着一场根本革命,因为功能基因组学年代已 经来临。术语“功能基因组学”应用于使用生物信息学工具将功能归因于感 兴趣的蛋白质序列的方法。这些工具正日益显示其必要性,因为序列数据产 生的速度远远高于研究实验室将功能划分给这些蛋白质序列的能
随着生物信息学工具的功效和准确性提高,这些工具正快速取代生物化 学特性鉴定的常规技术。事实上,鉴定本发明所用的先进生物信息学工具现 在能够输出可获得较高置信度的结果。
各所研究院和商业机构正在检查已有的序列数据,并且逐渐获得重大发 现。然而,仍然有必要鉴定和特性分析其他基因和它们编码的多肽,作为研 究和药物发现的目标。
分泌性蛋白质的介绍
细胞制造和分泌胞外蛋白质的能力是许多生物过程的中心。酶、生长因 子、胞外基质蛋白和信号传导分子全部由细胞分泌出来。这是分泌小泡与质 膜融合所致。多数情况下,但不是所有情况,蛋白质被信号肽导入内质网, 并进入分泌小泡。信号肽是顺式作用序列,影响多肽链从细胞质转运至膜结 合室如分泌小泡。靶向分泌小泡的多肽或者分泌进入胞外基质,或者留在质 膜内。留在质膜内的多肽有一或多个跨膜结构域。在细胞机能发挥中心作用 的分泌性蛋白质的例子是细胞因子、激素、胞外基质蛋白(粘附分子)、蛋白 酶及生长和分化因子。
含EGF结构域的蛋白质
表皮生长因子(EGF)样蛋白质通过激活EGF受体(EGF-R)家族成员来刺 激细胞分裂(Yarden等人,Eur J Cancer.2001 Sep;37 Suppl 4:S3-81)。EGF 是一种短肽,具有一个带6个保守性半胱氨酸的独有基序,其中全部6个半 胱氨酸参与了二硫键的形成。事实上,在不同功能的各种蛋白质中都发现了 这个基序(Davis等人,New Biol.1990 May;2(5):410-9)。而这些结构域可 在很多类型的蛋白质中找到,但它们的功能多种多样,以致无法对它们的功 能作出任何明确的结论,应当注意,所有EGF结构域(前列腺素G/H合成酶 除外)或者在膜结合蛋白的胞外结构域内或者在已知分泌进入胞外基质的蛋 白质内找到。业已知道,EGF结构域参与蛋白质间相互作用,同样地,它们 的大部分疏残基暴露在非结合蛋白质表面上。这一结构域由于具有高度保 守性半胱氨酸模式,因此对从线虫类蠕虫到人的范围广泛的生物体中信号传 导和调节事件起重要作用。已知,从组织修复和血液因子凝结调节的过程到 涉及多种类型人肿瘤生长和发展的过程等多方面都牵涉到EGF结构域。后 一种情况中,EGF-样蛋白质通过激活EGF信号传导途径来刺激细胞分裂 (Yarden等人,Eur J Cancer,2001 Sep;37 Suppl 4:S3-81)。正由于这些观 察结果,它们在肿瘤进展中的作用对人们寻求抗癌治疗策略极为重要,本领 域研制的一些新治疗药物都是基于干扰EGF信号传导途径这一方面(Waksal 等人,Cancer Metastasis Rev.1999;18(4):427-36)。
所以,关于这些结构的认识越多,对引起上述疾病状态和相关疾病状态 的隐伏途径的理解越深,而且可以研究更有效的基因和/或药物疗法以治疗 这些病症。
本文详细描述了一族全新的分泌性蛋白质配体的鉴定。分泌性蛋白质配 体的定义是一种由特定细胞分泌,而且通过调节(包括配体拮抗作用,如 Dan家族那样)关连受体的活性和下游信号转导途径可在同一个或另一个细 胞内产生表型应答的蛋白质。例如,已知的分泌性蛋白质配体家族是糖蛋白 激素家族。
卵泡刺激素(FSH)是糖蛋白激素家族其中一个成员。男性的FSH由脑下 垂体前叶的细胞分泌,进入血流,然后再与睾丸支持细胞上的关连受体结 合,调节精子生成过程。女性的FSH与卵巢的卵泡膜细胞、基质细胞和颗 粒细胞上的受体结合,调节排卵。男性和女性缺乏FSH均可导致不孕症。 给予蛋白质治疗剂形式的FSH可恢复FSH水平,采用这一方法可对抗FSH 触发的不孕症。可获得的FSH例如是GONAL-fTM(Serono)。
根据这一例子类推,可以看到鉴定新的分泌性配体蛋白质家族,为界定 新颖配体-受体途径,特别是为详细描述配体结合的表型结果铺平了道路。 若鉴定到人的病症是该新颖分泌性配体蛋白质家族中任一成员机能不良所引 起的结果,那么,可给予该成员作为蛋白质治疗剂来对抗该病症。

发明内容

本发明基于如下发现:INSP113、INSP114、INSP115、INSP116和 INSP117多肽是分泌性蛋白质,具体地说,它們含有EGF样结构域的分泌 性蛋白质,较佳地具有与凝血因子X相似的生物活性。INSP113、 INSP114、INSP115、INSP116和INSP117一起构成本发明鉴定的SECFAM1 蛋白质家族的一部分。
SECFAM1蛋白质家族的注释
现时并无关于本发明蛋白质的标注文字(annotation),本发明的蛋白质含 有一个强的分泌性蛋白质特征(signature),为信号肽形式,可与类似蛋白质 聚集在一起,获得其他物种的动物直向同源物支持。进一步检查可构建一族 迄今为止未被定性分析过的蛋白质,该族蛋白质由5个人基因(INSP113、 INSP114、INSP115、INSP116和INSP117)组成,并且包括哺乳动物和鱼类 直向同源物,共含有15个序列。这些序列全部都具有一个强的信号肽区, 该区的组成是可变的,其余为极相似的序列。总而言之,人序列内的序列同 一性在49%或以上,有一个强的保守性残基轮廓(图1)。本文把这一相关序 列群称作“SECFAM1家族”。
本发明第一方面一实施例提供一种鉴定SECFAM1家族成员的方法,该 方法包括:
搜索翻译核酸序列或多肽序列数据库,鉴定一个与下列序列轮廓 (sequence profile)相匹配的多肽序列:
       A   R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V
1  M  -1  -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
2  N   1   2  2 -1 -1  0 -1 -1 -1 -1 -1  0  3 -2 -2  1  0 -3 -2 -1
3  K   0   0 -1  0 -2  1  2 -2 -1  0 -1  1 -1 -3  2 -1 -1 -3 -2  1
4  R   0   3 -1 -2  4  0 -1 -2 -1  0  0  0  0 -2 -2  1 -1 -3 -2 -1
5  Y   1   0 -2 -2 -2 -1 -1 -2 -1  0  0 -1  0 -1  3  0 -1 -2  2  0
6  L  -1   2 -1 -1 -2  0  0 -2 -1 -1  0  3  2 -2 -2  0  1 -2 -2 -1
7  Q   1   0  0 -1 -1  1  0 -1 -1 -2 -2  0 -1 -2 -1  2  2  3 -1 -1
8  K  -1  -1  2 -1 -2 -1 -1  0 -1  0  0  1  2 -1 -2  0  0 -3 -2  2
9  A   0   0 -2 -2 -1 -1 -2 -2 -2  0  0 -1  0 -1 -2  0 -1  7  0  0
10 T   0   1  0 -1 -1  0 -1 -1 -1 -1  0  0  0 -2  1  2  1 -3 -2 -1
11 Q   1   0  0 -1 -1  2  0 -1 -1 -1  0  0  0 -2  0  2  0 -3 -2 -1
12 G   0   0  0  2 -2 -1  0  3  4 -2 -2 -1  2 -2 -2  0 -1 -2 -1 -2
13 K   1  -1 -1 -1 -2 -1 -1  2 -2 -3 -2  0 -1 -1 -2  2 -1  7 -1 -2
14 L   0  -2 -2 -3 -1 -2 -2  1 -2 -1  0 -2  0  0 -2 -1  1  8  0 -1
15 L   2  -2 -3 -3 -1 -2 -2 -2 -3  1  3 -2  0 -1 -2 -1  0 -3 -1  2
16 I  -1  -2 -3 -4 -1 -2 -3 -4 -3  2  4 -2  1  1 -3 -2 -1 -2  0  1
17 I   1  -2 -2 -2 -1 -2 -2 -2 -1  1  1 -2  0  0  3 -1 -1 -1  2  0
18 I   0  -2 -1 -2 -1 -1 -2 -2 -2  1  3 -1  0 -1 -2  1  0 -2 -1  0
19 F  -1  -2 -3 -3  6 -2 -3 -3 -1 -1  0 -2  3  2 -3 -2 -1  6  3 -1
20 I   0  -2 -1 -2 -1 -2 -2 -2 -2  3  1 -2  0 -1 -2  1  1 -3 -1  2
21 V   2  -2 -1 -2  3 -1 -1 -1 -2  0  0 -1  0 -2 -2  2  0 -3 -2  0
22 T   1  -2 -2 -2  3 -1 -2 -2 -2 -1  0 -2  2 -1 -2  0  2  6 -1  0
23 L  -1  -3 -3 -3  4 -3 -3 -3 -2  0  2 -3  0  4 -3 -2 -1 -1  0  1
24 W   0  -3 -3 -3  5 -2 -3 -2 -2 -1  0 -3 -1  0 -3 -1 -1  9  0 -1
25 G   1  -2 -1 -2  4 -1 -2  1 -2  0  0 -1  2 -2 -2  0  1 -2 -2  0
26 K  -1   0 -1 -2  1  1  0 -3  1  0  1  2  0  2 -2 -1 -1 -2  0 -1
27 A    0  -2 -3 -3 -1 -2 -2 -3 -3  1  3 -2  3  0  0 -2 -1 -2 -1  1
28 V    0  -2 -2 -3  4 -2 -2 -3 -3  3  0 -2  3 -1 -2 -1  0 -2 -1  2
29 S    0  -1  0 -1 -1 -1 -1 -1  5 -1  1 -1  0 -1 -2  2  0 -3  0 -1
30 S    4  -1 -1 -2 -1 -1 -1  2 -2 -2 -2 -1 -1 -2 -1  1  1 -3 -2 -1
31 A    1  -1  0  0 -1  1  0  1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
32 N   -1  -1  2 -1 -2 -1 -2 -2 -1  0  3 -1  0  1 -3  1 -1 -2 -1  0
33 H   -1   0  0 -1 -2  5  0 -3  3 -1  1  0  0 -2 -2 -1 -1 -2 -1 -1
34 H   -1   0  0 -1 -2  0  0 -2  6  0 -1  0 -1 -2  2  0 -1 -3  0 -1
35 K   -1   0  0 -1 -3  3  0 -2  4 -3 -2  1 -1 -3  3  0 -1 -2  0 -2
36 A    2   1  0 -1 -1  0 -1 -1  4 -1 -1  0 -1 -2 -1  0  2 -2  0 -1
37 H    0  -1  0 -1 -2 -1 -1  3  6 -3 -3 -1 -2 -2 -2  1 -1 -2  0 -2
38 H    0  -1  0 -2  5 -1 -1 -2  5 -1  0 -1 -1 -1 -2  0  1 -2  0 -1
39 V   -1  -2 -2 -2 -2 -1  0 -3 -2  2  2 -2  0 -1  2 -2 -1 -3 -1  2
40 R    1   2 -1 -1 -2  1  1 -1 -1 -2 -2  3 -1 -3 -1  0 -1 -3 -2 -2
41 T    2  -1 -1 -1 -2  3  0  1 -1 -2 -2  0 -1 -3  0  0  2 -2 -2 -1
42 G    0  -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
43 T    0  -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
44 C    0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
45 E   -1   0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
46 V    0  -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
47 V    0  -3 -3 -3 -1 -2 -2 -3 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
48 A    4  -1 -1 -2  0 -1 -1 -1 -2 -1 -1 -1 -1 -2 -1  0  2 -3 -2  0
49 L    3  -2 -3 -3 -1 -2 -2 -2 -3  0  2 -2  0 -1 -2  0  0 -3 -1  1
50 H   -2  -1  0  3 -3  0  0 -2  8 -3 -3 -1 -2 -2 -2 -1 -2 -3  0 -3
51 R   -1   6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
52 C   -1  -3 -1  3  8 -2 -1 -2 -2 -2 -2 -2 -2 -2 -2 -1 -1 -3 -2 -2
53 C    0  -2 -1 -2  8 -2 -2 -2 -2 -1 -1 -2 -1 -2 -2  2  0 -2 -2 -1
54 N   -1   0  6  0 -2  0  0  0  0 -3 -3  0 -2 -3 -2  2  0 -4 -2 -3
55 K   -1   2  0 -1 -3  3  0 -2 -1 -3 -2  4 -1 -3 -1  0 -1 -3 -2 -2
56 N   -2  -1  6  0 -3  0  0 -1  0 -3 -3  0 -2 -3  3  0  0 -4 -2 -3
57 K   -1   5  0 -2 -3  0  0 -2  0 -3 -2  3 -1 -3 -2 -1 -1 -3 -2 -3
58 I   -1   2 -2 -3 -2 -1 -2 -3 -2  4  0 -1  0 -1 -3 -2 -1 -3 -1  1
59 E  -1   0  0  0 -3  0  5 -2 -1 -2 -2  0 -2 -3 -1  0  2 -3 -2 -1
60 E  -1  -1 -1  0 -3  0  5 -3 -1  2 -1  0 -1 -2 -2 -1 -1 -3 -2  0
61 R   1   5 -1 -2 -2  0  0 -1 -1 -2 -2  0 -1 -3 -2  0 -1 -3 -2 -2
62 S   0   2  0 -1 -2  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
63 Q  -1   0  0  0 -3  6  1 -2  0 -3 -2  0  0 -3 -1  0 -1 -2 -1 -2
64 T   0  -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
65 V   2  -2 -3 -3 -1 -2 -2 -2 -3  1  0 -2  0 -1 -2 -1  0 -3 -1  4
66 K  -1   3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
67 C   0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
68 S   2  -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
69 C   0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
70 F  -2   2 -2 -3 -2 -1 -2 -3 -1  0  1 -1  0  4 -3 -2 -2 -1  0 -1
71 P  -1   0 -1 -1 -3  0  0 -2 -2 -3 -3  2 -2 -3  5  1 -1 -4 -3 -2
72 G   0  -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
73 Q  -1   0  0  0 -3  6  1 -2  0 -3 -2  2  0 -3 -1  0 -1 -2 -1 -2
74 V   0  -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
75 A   5  -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
76 G   0  -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
77 T   0  -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
78 T   0  -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
79 R  -1   6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
80 A   4  -1  1 -1  0 -1 -1  0 -1 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
81 A   0   4  0 -2 -2  2  0 -2 -1 -2  0  2  0 -3 -2  0 -1 -3 -2 -2
82 P  -1  -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
83 S   2  -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
84 C   0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
85 V   0  -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
86 D  -2  -2  0  6 -3  0  2 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
87 A   5  -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
88 S   0   2  0 -1 -1  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
89 I  -1  -3 -3 -3 -1 -3 -3 -4 -3  5  1 -3  0  0 -3 -2 -1 -3 -1  2
90 V   0  -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
91  E   -1   1 -1 -1 -2  0  1 -3 -2  2  1  2  0 -1 -2 -1 -1 -3 -2  0
92  Q   -1   0  0  0 -2  4  1  0 -1 -2 -2  0 -1 -2 -1  0  2  2 -1 -2
93  K   -1   2  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
94  W   -2  -1 -2 -2 -2  2 -1 -2 -1 -3 -2 -1 -1  0 -3 -2 -2 10  0 -3
95  W   -3  -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
96  C    0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
97  H   -2   0  1  3 -3  2  2 -2  5 -3 -3  0 -2 -2 -1  0 -1 -3  0 -3
98  M   -1  -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
99  Q   -1   0  2  0 -3  2  3 -2  0 -1  1  0  0 -2 -2  0 -1 -3 -2 -1
100 P   -1  -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
101 C    0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
102 L   -1  -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  1
103 E   -1  -1 -1  0 -3  0  5 -2 -1 -1  0  0 -1 -2  0  0 -1 -3 -2  0
104 G    0  -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
105 E   -1   0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
106 E   -1  -1  0  2 -4  0  4  2 -1 -3 -4  0 -3 -3 -1  0 -1 -3 -3 -3
107 C    0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
108 K   -1   1  0  3 -3  0  0 -2 -1 -3 -3  4 -2 -3 -1  0 -1 -3 -2 -2
109 V    0  -2 -2 -3 -1 -2 -2 -3 -3  1  2 -2  0 -1 -2 -1  1 -3 -1  4
110 L   -1  -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  0
111 P   -1  -2 -2 -2 -2 -2 -2 -3 -2  2 -1 -2 -1 -2  6 -1 -1 -4 -2  0
112 D   -2  -1  3  6 -3  0  1 -1  0 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
113 R   -1   3  2 -2 -2  0 -1 -2  0 -1  1  0  0 -1 -2  0 -1 -2  1 -1
114 K    0  -1  0  0 -1  0  0  0 -1 -2 -2  1 -1 -2 -1  4  1 -3 -2 -2
115 G    0  -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
116 W   -3  -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
117 S    0  -1  0 -1 -1  0 -1 -1 -1 -1 -1  0  2 -2 -1  3  3 -2 -2 -1
118 C    0  -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
119 S    1  -1  0 -1 -1 -1 -1 -1 -2  0 -1 -1 -1 -2 -1  3  3 -3 -2  0
120 S    0   0  0  0 -2  3  0 -1 -1 -2 -2  0 -1 -2 -1  3  1 -3 -2 -2
121 G    0  -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
122 N   -1  -1  5  0 -3 -1 -1  3  4 -3 -3 -1 -2 -3 -2  0 -1 -3 -1 -3
123 K  -1   3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
124 V   0  -3 -3 -3 -1 -2 -2 -4 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
125 K  -1   1  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
126 T   0  -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
127 T   0  -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
128 R  -1   3  0 -1 -2  0  0 -2 -1 -2 -2  4 -1 -3 -1  0  2 -3 -2 -2
129 V   0  -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
130 T   0  -1  0 -1 -1  0 -1 -1  2 -1  0 -1 -1 -2 -1  3  3 -3 -1 -1
131 H  -1   4  0 -1 -3  0  0 -2  4 -3 -2  0 -1 -3  3 -1 -1 -3 -1 -3
其中,当该轮廓作为查询序列输入到搜索程序BLAST时,采用NCBI (生物信息国家中心;http://www.ncbi.nlm.nih.gov/)确定的缺省参数[Blosum 62矩阵;空位开放罚分=11,空位拓展罚分=1],E值为10-2或以下的那些就 是SECFAM1家族成员。
所以,本文的“SECFAM1家族成员”指的是满足上述轮廓的一个多肽 序列,当作为BLAST查询序列,使用上述参数输入时,其最大阈值E是 10-2。该多肽序列的最小阈值E优选等于或少于10-5,等于或少于10-10,等 于或少于10-50,最好等于或少于10-70。例如,当把家族成员INSP113与本 发明第一方面的轮廓作比较,得到的E值是4e-80。E值代表预期在数据库内 任意找到的更好或同样好的匹配数目,或者可形容为任意发生一个匹配的概 率。因此,根据E值来排列所有击中目标,而E值反过来又取决于a)每个 序列位置可提供的候选物数目(就氨基酸而言该数目为20)、序列或匹配区长 度、以及所搜索的数据库大小。所以,短的序列如SECFAM1家族成员的E 值一般比两个长序列之间可比较的匹配大。
上述轮廓考虑了一个信号序列和一个EGF样结构域的存在。此轮廓使 信号肽区(氨基酸1至30)的氨基酸序列与EGF样结构域相比,有较高程度 的变异性(variability)。此处上下文的“变异性”涉及氨基性序列之间的相似 性和同一性程度。这反映了在本发明鉴定的SECFAM1家族中15个成员发 现的情况。15个成员之间的EGF样结构域具有较高程度的相似性,提示 EGF样结构域可能与分子一个重要功能有关。如果该结构域的重要性不高, 则它的成员之间保守程度不会太高。
进行搜索的翻译核酸序列数据库可以包括,但不限于,由cDNA、 EST、mRNA、全部或部分基因组数据库产生的翻译核酸序列。
本发明第二方面提供一种分离的多肽,该多肽:
i)包括或由这样的一个多肽序列组成:当以下列轮廓作为查询序列输入 到搜索程序BLAST时,采用NCBI(生物信息国家中心)确定的缺省参数 [Blosum 62矩阵;空位开放罚分=11,空位拓展罚分=1],所述多肽序列的E 值为10-2或以下;
       A   R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V
1  M  -1  -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
2  N   1   2  2 -1 -1  0 -1 -1 -1 -1 -1  0  3 -2 -2  1  0 -3 -2 -1
3  K   0   0 -1  0 -2  1  2 -2 -1  0 -1  1 -1 -3  2 -1 -1 -3 -2  1
4  R   0   3 -1 -2  4  0 -1 -2 -1  0  0  0  0 -2 -2  1 -1 -3 -2 -1
5  Y   1   0 -2 -2 -2 -1 -1 -2 -1  0  0 -1  0 -1  3  0 -1 -2  2  0
6  L  -1   2 -1 -1 -2  0  0 -2 -1 -1  0  3  2 -2 -2  0  1 -2 -2 -1
7  Q   1   0  0 -1 -1  1  0 -1 -1 -2 -2  0 -1 -2 -1  2  2  3 -1 -1
8  K  -1  -1  2 -1 -2 -1 -1  0 -1  0  0  1  2 -1 -2  0  0 -3 -2  2
9  A   0   0 -2 -2 -1 -1 -2 -2 -2  0  0 -1  0 -1 -2  0 -1  7  0  0
10 T   0   1  0 -1 -1  0 -1 -1 -1 -1  0  0  0 -2  1  2  1 -3 -2 -1
11 Q   1   0  0 -1 -1  2  0 -1 -1 -1  0  0  0 -2  0  2  0 -3 -2 -1
12 G   0   0  0  2 -2 -1  0  3  4 -2 -2 -1  2 -2 -2  0 -1 -2 -1 -2
13 K   1  -1 -1 -1 -2 -1 -1  2 -2 -3 -2  0 -1 -1 -2  2 -1  7 -1 -2
14 L   0  -2 -2 -3 -1 -2 -2  1 -2 -1  0 -2  0  0 -2 -1  1  8  0 -1
15 L   2  -2 -3 -3 -1 -2 -2 -2 -3  1  3 -2  0 -1 -2 -1  0 -3 -1  2
16 I  -1  -2 -3 -4 -1 -2 -3 -4 -3  2  4 -2  1  1 -3 -2 -1 -2  0  1
17 I   1  -2 -2 -2 -1 -2 -2 -2 -1  1  1 -2  0  0  3 -1 -1 -1  2  0
18 I   0  -2 -1 -2 -1 -1 -2 -2 -2  1  3 -1  0 -1 -2  1  0 -2 -1  0
19 F  -1  -2 -3 -3  6 -2 -3 -3 -1 -1  0 -2  3  2 -3 -2 -1  6  3 -1
20 I   0  -2 -1 -2 -1 -2 -2 -2 -2  3  1 -2  0 -1 -2  1  1 -3 -1  2
21 V   2  -2 -1 -2  3 -1 -1 -1 -2  0  0 -1  0 -2 -2  2  0 -3 -2  0
22 T   1  -2 -2 -2  3 -1 -2 -2 -2 -1  0 -2  2 -1 -2  0  2  6 -1  0
23 L    -1 -3 -3 -3  4 -3 -3 -3 -2  0  2 -3  0  4 -3 -2 -1 -1  0  1
24 W     0 -3 -3 -3  5 -2 -3 -2 -2 -1  0 -3 -1  0 -3 -1 -1  9  0 -1
25 G     1 -2 -1 -2  4 -1 -2  1 -2  0  0 -1  2 -2 -2  0  1 -2 -2  0
26 K    -1  0 -1 -2  1  1  0 -3  1  0  1  2  0  2 -2 -1 -1 -2  0 -1
27 A     0 -2 -3 -3 -1 -2 -2 -3 -3  1  3 -2  3  0  0 -2 -1 -2 -1  1
28 V     0 -2 -2 -3  4 -2 -2 -3 -3  3  0 -2  3 -1 -2 -1  0 -2 -1  2
29 S     0 -1  0 -1 -1 -1 -1 -1  5 -1  1 -1  0 -1 -2  2  0 -3  0 -1
30 S     4 -1 -1 -2 -1 -1 -1  2 -2 -2 -2 -1 -1 -2 -1  1  1 -3 -2 -1
31 A     1 -1  0  0 -1  1  0  1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
32 N    -1 -1  2 -1 -2 -1 -2 -2 -1  0  3 -1  0  1 -3  1 -1 -2 -1  0
33 H    -1  0  0 -1 -2  5  0 -3  3 -1  1  0  0 -2 -2 -1 -1 -2 -1 -1
34 H    -1  0  0 -1 -2  0  0 -2  6  0 -1  0 -1 -2  2  0 -1 -3  0 -1
35 K    -1  0  0 -1 -3  3  0 -2  4 -3 -2  1 -1 -3  3  0 -1 -2  0 -2
36 A     2  1  0 -1 -1  0 -1 -1  4 -1 -1  0 -1 -2 -1  0  2 -2  0 -1
37 H     0 -1  0 -1 -2 -1 -1  3  6 -3 -3 -1 -2 -2 -2  1 -1 -2  0 -2
38 H     0 -1  0 -2  5 -1 -1 -2  5 -1  0 -1 -1 -1 -2  0  1 -2  0- 1
39 V    -1 -2 -2 -2 -2 -1  0 -3 -2  2  2 -2  0 -1  2 -2 -1 -3 -1  2
40 R     1  2 -1 -1 -2  1  1 -1 -1 -2 -2  3 -1 -3 -1  0 -1 -3 -2 -2
41 T     2 -1 -1 -1 -2  3  0  1 -1 -2 -2  0 -1 -3  0  0  2 -2 -2 -1
42 G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
43 T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
44 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
45 E    -1  0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
46 V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
47 V     0 -3 -3 -3 -1 -2 -2 -3 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
48 A     4 -1 -1 -2  0 -1 -1 -1 -2 -1 -1 -1 -1 -2 -1  0  2 -3 -2  0
49 L     3 -2 -3 -3 -1 -2 -2 -2 -3  0  2 -2  0 -1 -2  0  0 -3 -1  1
50 H    -2 -1  0  3 -3  0  0 -2  8 -3 -3 -1 -2 -2 -2 -1 -2 -3  0 -3
51 R    -1  6  0 -2 -3  0  0 -2  0 -3 -2  1- 1- 3- 2- 1- 1 -3 -2 -3
52 C    -1 -3 -1  3  8 -2 -1 -2 -2 -2 -2 -2 -2 -2 -2 -1 -1 -3 -2 -2
53 C     0 -2 -1 -2  8 -2 -2 -2 -2 -1 -1 -2 -1 -2 -2  2  0 -2 -2 -1
54 N    -1  0  6  0 -2  0  0  0  0 -3 -3  0 -2 -3 -2  2  0 -4 -2 -3
55 K    -1  2  0 -1 -3  3  0 -2 -1 -3 -2  4 -1 -3 -1  0 -1 -3 -2 -2
56 N    -2 -1  6  0 -3  0  0 -1  0 -3 -3  0 -2 -3  3  0  0 -4 -2 -3
57 K    -1  5  0 -2 -3  0  0 -2  0 -3 -2  3 -1 -3 -2 -1 -1 -3 -2 -3
58 I    -1  2 -2 -3 -2 -1 -2 -3 -2  4  0 -1  0 -1 -3 -2 -1 -3 -1  1
59 E    -1  0  0  0 -3  0  5 -2 -1 -2 -2  0 -2 -3 -1  0  2 -3 -2 -1
60 E    -1 -1 -1  0 -3  0  5 -3 -1  2 -1  0 -1 -2 -2 -1 -1 -3 -2  0
61 R     1  5 -1 -2 -2  0  0 -1 -1 -2 -2  0 -1 -3 -2  0 -1 -3 -2 -2
62 S     0  2  0 -1 -2  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
63 Q    -1  0  0  0 -3  6  1 -2  0 -3 -2  0  0 -3 -1  0 -1 -2 -1 -2
64 T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
65 V     2 -2 -3 -3 -1 -2 -2 -2 -3  1  0 -2  0 -1 -2 -1  0 -3 -1  4
66 K    -1  3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
67 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
68 S     2 -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
69 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
70 F    -2  2 -2 -3 -2 -1 -2 -3 -1  0  1 -1  0  4 -3 -2 -2 -1  0 -1
71 P    -1  0 -1 -1 -3  0  0 -2 -2 -3 -3  2 -2 -3  5  1 -1 -4 -3 -2
72 G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
73 Q    -1  0  0  0 -3  6  1 -2  0 -3 -2  2  0 -3 -1  0 -1 -2 -1 -2
74 V     0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
75 A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
76 G     0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
77 T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
78 T     0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
79 R    -1  6  0 -2 -3  0  0 -2  0 -3 -2  1 -1 -3 -2 -1 -1 -3 -2 -3
80 A     4 -1  1 -1  0 -1 -1  0 -1 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
81 A     0  4  0 -2 -2  2  0 -2 -1 -2  0  2  0 -3 -2  0 -1 -3 -2 -2
82 P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
83 S     2 -1  0 -1 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -1
84 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
85 V     0 -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
86 D    -2 -2  0  6 -3  0  2 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
87  A   5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0
88  S   0  2  0 -1 -1  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  0 -3 -2 -2
89  I  -1 -3 -3 -3 -1 -3 -3 -4 -3  5  1 -3  0  0 -3 -2 -1 -3 -1  2
90  V   0 -3 -3 -3 -1 -2 -2 -3 -3  3  0 -2  0 -1 -2 -2  0 -3 -1  4
91  E  -1  1 -1 -1 -2  0  1 -3 -2  2  1  2  0 -1 -2 -1 -1 -3 -2  0
92  Q  -1  0  0  0 -2  4  1  0 -1 -2 -2  0 -1 -2 -1  0  2  2 -1 -2
93  K  -1  2  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
94  W  -2 -1 -2 -2 -2  2 -1 -2 -1 -3 -2 -1 -1  0 -3 -2 -2 10  0 -3
95  W  -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
96  C   0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
97  H  -2  0  1  3 -3  2  2 -2  5 -3 -3  0 -2 -2 -1  0 -1 -3  0 -3
98  M  -1 -1 -2 -3 -1  0 -2 -3 -2  0  1 -1  7  0 -2 -1 -1 -1 -1  0
99  Q  -1  0  2  0 -3  2  3 -2  0 -1  1  0  0 -2 -2  0 -1 -3 -2 -1
100 P  -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2
101 C   0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
102 L  -1 -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  1
103 E  -1 -1 -1  0 -3  0  5 -2 -1 -1  0  0 -1 -2  0  0 -1 -3 -2  0
104 G   0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
105 E  -1  0  0  1 -4  1  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2
106 E  -1 -1  0  2 -4  0  4  2 -1 -3 -4  0 -3 -3 -1  0 -1 -3 -3 -3
107 C   0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
108 K  -1  1  0  3 -3  0  0 -2 -1 -3 -3  4 -2 -3 -1  0 -1 -3 -2 -2
109 V   0 -2 -2 -3 -1 -2 -2 -3 -3  1  2 -2  0 -1 -2 -1  1 -3 -1  4
110 L  -1 -2 -3 -4 -1 -2 -3 -4 -3  1  4 -2  1  0 -3 -2 -1 -2 -1  0
111 P  -1 -2 -2 -2 -2 -2 -2 -3 -2  2 -1 -2 -1 -2  6 -1 -1 -4 -2  0
112 D  -2 -1  3  6 -3  0  1 -1  0 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3
113 R  -1  3  2 -2 -2  0 -1 -2  0 -1  1  0  0 -1 -2  0 -1 -2  1 -1
114 K   0 -1  0  0 -1  0  0  0 -1 -2 -2  1 -1 -2 -1  4  1 -3 -2 -2
115 G   0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
116 W  -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  0 -4 -3 -2 11  1 -3
117 S   0 -1  0 -1 -1  0 -1 -1 -1 -1 -1  0  2 -2 -1  3  3 -2 -2 -1
118 C   0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1
119 S    1 -1  0 -1 -1 -1 -1 -1 -2  0 -1 -1 -1 -2 -1  3  3 -3 -2  0
120 S    0  0  0  0 -2  3  0 -1 -1 -2 -2  0 -1 -2 -1  3  1 -3 -2 -2
121 G    0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3
122 N   -1 -1  5  0 -3 -1 -1  3  4 -3 -3 -1 -2 -3 -2  0 -1 -3 -1 -3
123 K   -1  3  0 -1 -3  0  0 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2
124 V    0 -3 -3 -3 -1 -2 -2 -4 -3  4  0 -2  0 -1 -2 -2  0 -3 -1  4
125 K   -1  1  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2
126 T    0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
127 T    0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  0  6 -2 -2  0
128 R   -1  3  0 -1 -2  0  0 -2 -1 -2 -2  4 -1 -3 -1  0  2 -3 -2 -2
129 V    0 -3 -3 -3 -1 -2 -2 -3 -3  2  0 -2  0 -1 -2 -2  0 -3 -1  5
130 T    0 -1  0 -1 -1  0 -1 -1  2 -1  0 -1 -1 -2 -1  3  3 -3 -1 -1
131 H   -1  4  0 -1 -3  0  0 -2  4 -3 -2  0 -1 -3  3 -1 -1 -3 -1 -3
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
优选地,所述多肽在上述试验中的最大E值是10-2。更好地,所述多肽 序列的最小E值等于或少于10-5、等于或少于10-10、等于或少于10-50,最好 等于或少于10-70。降低该阈值起着更严谨过滤器作用,把含有信号肽和 EGF样结构域的多肽与一般背景多肽序列分开。
本发明第二方面第三实施例提供一种分离的多肽,该多肽
(i)包括一满足以下共有氨基酸序列的多肽: G-T-C-E-[VI]-[VI]-[AT]-[AVL]-[HD]-R-[CD]-[CS]-[NS]-[KRQ]-[NP]-[RK]- [IR]-[ET]-[EI]-[RA]-[SR]-Q-T-[VA]-[KR]-C-[SA]-C-[LFR]-[PSK]-G-[KQ]- [VI]-A-G-T-T-R-[NA]-[RQLAK]-P-[SA]-C-V-[DE]-A-[SAR]-I-[VI]-[IELKR]- [WGQET]-[KR]-[WQ]-W-C-[EHNQD]-M-[ENQL]-P-C-[LV]-[EVLP]-G-E-[DEG]-C- [KRD]-[TVL]-L-[PI]-[DN]-[NYSLR]-[STK]-G-W-[MST]-C-[ASIT]-[TSRQ]-P(0,1)- G-[NHG]-[KR]-[IV]-K-T-T;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明第二方面第四实施例提供一种分离的多肽,该多肽由一满足以下 共有氨基酸序列的多肽组成: G-T-C-E-[VI]-[VI]-[AT]-[AVL]-[HD]-R-[CD]-[CS]-[NS]-[KRQ]-[NP]-[RK]-[IR]- [ET]-[EI]-[RA]-[SR]-Q-T-[VA]-[KR]-C-[SA]-C-[LFR]-[PSK]-G-[KQ]-[VI]-A-G- T-T-R-[NA]-[RQLAK]-P-[SA]-C-V-[DE]-A-[SAR]-I-[VI]-[IELKR]-[WGQET]-[KR]- [WQ]-W-C-[EHNQD]-M-[ENQL]-P-C-[LV]-[EVLP]-G-E-[DEG]-C-[KRD]-[TVL]-L- [PI]-[DN]-[NYSLR]-[STK]-G-W-[MST]-C-[ASIT]-[TSRQ]-P(0,1)-G-[NHG]-[KR]- [IV]-K-T-T。
本发明第二方面第五实施例提供一种如本发明第二方面第三实施例所述 的分离的多肽,其中,该分离的多肽包含一或多个,最好全部四个位于共有 氨基酸序列氨基酸位置55、60、66和77上的半胱氨酸残基。本发明第三和 第四实施例的氨基酸序列写成PROSITE(蛋白质位点和型式)符号,其中氨基 酸以它们的一个字母代码表示(Bairoch,A.,Bucher,P.,and Hofmann, K.,(1997);The PROSITE Database:Its status in 1997.Nucl.Acids Res. 25,217-221)。简单地说,一个包括以下通式的多肽可作如下解释:
  A(1)-x(i1,j1)-A2-x(i2,j2)-....A{p-1}-x(i{p-1},j{p-1})-Ap
A(k)是一个组分,或者表示一个氨基酸如C,或者表示一组可能的氨基 酸如[ILVF]。如果组分A(k)明确地表示一个氨基酸(例如C或L),那么它是 一个特征组分;或者如果组分A(k)表示一个以上氨基酸(例如[ILVF]或 [FWY])),那么它是一个模糊组分。i(k)、j(k)都是整数,全部k都满足 i(k)<=j(k)。x(ik,jk)表示与ik和jk之间任意氨基酸匹配的型式外卡区。如 果j(k)比i(k)大(例如x(2,3)),则外卡区x(ik,jk)是“可变的”。这样一个 外卡区的可变度是jk-ik.br>,例如x(2,3)的可变度是1。如果j(k)等于i(k) (例如x(2,2)),则外卡区是固定不变的,例如可把x(2,2)写成x(2)。 若有 的话,一种型式的可变产物是该型式内可变外卡区的多个可变产物,除非将 它限定为一个产物。
例如,C-x(2)-H是一种带有两个组分(C和H)和一个固定外卡区的型 式。它与含有一个C,紧跟着任何两个任意氨基酸再紧跟着一个H的任何序 列匹配。氨基酸序列ChgHyw和liChgHlyw包括在该通式内。C-x(2,3)-H是一种带有两个组分(C和H)和一个可变外卡区的型式。它与含有一个C, 紧跟着任何两个或三个任意氨基酸再紧跟着一个H的任何序列(例如 aaChgHywk和liChgaHlyw)匹配。C-x(2,3)-[ILV]是一种带有两个组分(C和 [ILV])和一个可变外卡区的型式。它与含有一个C,紧跟着任何两个或三个 任意氨基酸再紧跟着一个I、L或V的任何序列匹配。
本发明该实施例所述的序列涵盖INSP117(SEQ ID NO:26)氨基酸位置 44-129(对比氨基酸52-138,见图1)的高度同一性区(high identity region)。
虽然申请人并不希望受此理论约束,但要求本发明上述实施例的多肽全 部都具有信号肽序列。因此,缺少信号肽的所述多肽成熟形式构成本发明另 一方面。
本发明第三方面一实施例提供一种多肽,该多肽:
(i)包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:37和/或SEQ ID NO:39所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明第三方面第二实施例提供一种多肽,该多肽:
(i)由SEQIDNO:2、SEQ ID NO:4、SEQ ID NO:37和/或SEQID NO:39所示的氨基酸序列组成。
下文将具有SEQ ID NO:2所示的序列的多肽(accession number CAD28501.1)称为“INSP113多肽”。
虽然申请人并不希望受此理论约束,但要求INSP113多肽的首25个氨 基酸形成信号肽。SEQ ID NO:2和SEQ ID NO:4分别是含有或无信号序列 的INSP113全长多肽序列。下文将具有SEQ ID NO:4所示的序列的多肽称 为“INSP113成熟多肽”。
具有SEQ ID NO:37所示的序列的多肽是INSP113多肽的剪接变体, 下文称作“INSP113sv多肽”。
虽然申请人并不希望受此理论约束,但要求INSP113sv多肽的首25个 氨基酸形成信号肽。SEQ ID NO:39是无信号序列的INSP113sv多肽序列。 下文将具有SEQ ID NO:39所示的序列的多肽称为“INSP113sv成熟多 肽”。
较佳地,本发明第三方面第二实施例的抗原决定簇、片段或功能等同物 包含位于SEQ ID NO:2中氨基酸位置96、101、107和118上的四个半胱 氨酸残基中一或多个。更好的是,这些半胱氨酸残基的一或多个在生理条件 下参与二硫键形成。本发明这一方面“生理条件”指的是找到天然或野生型 多肽的自然环境。二硫键形成通常是一个蛋白质正确构象因而是它的功能所 必需的。所以,保留这些半胱氨酸残基十分重要。
本发明第三方面第三实施例提供一种多肽,该多肽:
(i)包括SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:53和/或SEQ ID NO:55所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明第三方面第四实施例提供一种多肽,该多肽:
(i)由SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:41、SEQ ID NO: 43、SEQ ID NO:53和/或SEQ ID NO:55所示的氨基酸序列组成。
下文将具有SEQ ID NO:6所示的序列的多肽(accession number CAD38865.1)称为“INSP114多肽”。
虽然申请人并不希望受此理论约束,但要求INSP114多肽的首30个氨 基酸形成信号肽。SEQ ID NO:8是无信号序列的INSP114全长多肽序列。 下文将具有SEQ ID NO:8所示的序列的多肽称为“INSP114成熟多肽”。
具有SEQ ID NO:41所示的序列的多肽是INSP114多肽的剪接变体, 下文称作“INSP114-SV2多肽”。
虽然申请人并不希望受此理论约束,但要求INSP114-SV2多肽的首30 个氨基酸形成信号肽。SEQ ID NO:43是无信号序列的INSP114-SV2多肽序 列。下文将具有SEQ ID NO:43所示的序列的多肽称为“INSP114-SV2成 熟多肽”。
具有SEQ ID NO:53所示的序列的多肽是INSP114多肽的剪接变体, 下文称作“INSP114-SV1多肽”。
虽然申请人并不希望受此理论约束,但要求INSP114-SV1多肽的首30 个氨基酸形成信号肽。SEQ ID NO:55是无信号序列的INSP114-SV1多肽序 列。下文将具有SEQ ID NO:55所示的序列的多肽称为“INSP114-SV1成 熟多肽”。
较佳地,本发明第三方面第四实施例的抗原决定簇、片段或功能等同物 包含位于SEQ ID NO:6、SEQ ID NO:41或SEQ ID NO:53中氨基酸位置 96、101、107和118上四个半胱氨酸残基中一或多个。更好的是,这些半胱 氨酸残基的一或多个在生理条件下参与二硫键形成。二硫键形成通常是一个 蛋白质正确构象因而是它的功能所必需的。所以,保留这些半胱氨酸残基十 分重要。
本发明第三方面第五实施例提供一种多肽,该多肽:
(i)包括SEQ ID NO:10、SEQIDNO:12、SEQ ID NO:45和/或SEQ ID NO:47所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明第三方面第六实施例提供一种多肽,该多肽:
(i)由SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:45和/或SEQ ID NO:47所示的氨基酸序列组成。
下文将具有SEQ ID NO:10所示的序列的多肽(accession number AAY53016)称为“INSP115多肽”。
虽然申请人并不希望受此理论约束,但要求INSP115多肽的首42个氨 基酸形成信号肽。SEQ ID NO:12是无信号序列的INSP115全长多肽序列。 下文将具有SEQ ID NO:12所示的序列的多肽称为“INSP115成熟多 肽”。
下文将具有SEQ ID NO:45所示的序列的多肽称为“INSP115克隆多 肽”。
虽然申请人并不希望受此理论约束,但要求INSP115克隆多肽的首45 个氨基酸形成信号肽。SEQ ID NO:47是无信号序列的INSP115克隆多肽序 列。下文将具有SEQ ID NO:47所示的序列的多肽称为“INSP115克隆成 熟多肽”。
较佳地,本发明第三方面第六实施例的抗原决定簇、片段或功能等同物 包含位于SEQ ID NO:10或SEQ ID NO:45中氨基酸位置97、102、108 和119上四个半胱氨酸残基中一或多个。更好的是,这些半胱氨酸残基的一 或多个在生理条件下参与二硫键形成。二硫键形成通常是一个蛋白质正确构 象因而是它的功能所必需的。所以,保留这些半胱氨酸残基十分重要。
本发明第三方面第七实施例提供一种多肽,该多肽:
(i)包括SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:49和/或SEQ ID NO:51所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明第三方面第八实施例提供一种多肽,该多肽:
(i)由SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:49和/或SEQ ID NO:51所示的氨基酸序列组成。
下文将具有SEQ ID NO:14所示的序列的多肽(accession number XP_087261.1)称为“INSP116多肽”。
虽然申请人并不希望受此理论约束,但要求INSP116多肽的首34个氨 基酸形成信号肽。SEQ ID NO:16是无信号序列的INSP116全长多肽序列。 下文将具有SEQ ID NO:16所示的序列的多肽称为“INSP116成熟多 肽”。
下文将具有SEQ ID NO:49所示的序列的多肽称为“INSP116克隆多 肽”。
虽然申请人并不希望受此理论约束,但要求INSP116克隆多肽的首36 个氨基酸形成信号肽。SEQ ID NO:51是无信号序列的INSP116克隆多肽序 列。下文将具有SEQ ID NO:51所示的序列的多肽称为“INSP116克隆成 熟多肽”。
较佳地,本发明第三方面第八实施例的抗原决定簇、片段或功能等同物 包含位于SEQ ID NO:14或SEQ ID NO:49中氨基酸位置105、110、116 和127上四个半胱氨酸残基中一或多个。更好的是,这些半胱氨酸残基的一 或多个在生理条件下参与二硫键形成。二硫键形成通常是一个蛋白质正确构 象因而是它的功能所必需的。所以,保留这些半胱氨酸残基十分重要。
本发明第三方面第九实施例提供一种多肽,该多肽:
(i)包括SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28和/或SEQ ID NO:30所示的氨 基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明此第三方面的多肽最好:
(i)包括SEQ ID NO:26和/或SEQ ID NO:30所示的氨基酸序列;
(ii)是其片段,该片段是含有EGF结构域的蛋白质家族成员,优选具有 与凝血因子X相似生物活性的成员,或者具有与(i)所述多肽相同的抗原决定 簇;或者
(iii)是(i)或(ii)的功能等同物。
本发明第三方面第十实施例提供一种多肽,该多肽:
(i)由SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28和/或SEQ ID NO:30所示的氨 基酸序列组成。
较佳地,本发明第三方面第九实施例的抗原决定簇、片段或功能等同物 包含位于SEQ ID NO:26中氨基酸位置98、103、109和120上四个半胱氨 酸残基中一或多个。更好的是,氨基酸位置98和109上的半胱氨酸残基在 生理条件下形成一对二硫键。所以,保留这些半胱氨酸残基十分重要。将 SEQ ID NO:26与1WHE的相似序列(图12)作比较,鉴定了本发明此实施例 的四个半胱氨酸残基。
下文将具有SEQ ID NO:18所示的序列的多肽称为“INSP117外显子1 多肽”。将具有SEQ ID NO:20所示的序列的多肽称为“INSP117外显子2 多肽”。将具有SEQ ID NO:22所示的序列的多肽称为“INSP117外显子3 多肽”。将具有SEQ ID NO:24所示的序列的多肽称为“INSP117外显子4 多肽”。
下文将具有SEQ ID NO:26所示的序列的多肽称为“INSP117多 肽”。
虽然申请人并不希望受此理论约束,但要求INSP117外显子1多肽的首 30个氨基酸形成信号肽。SEQ ID NO:28和SEQ ID NO:30分别是无信号 序列的INSP117外显子1和全长多肽序列。下文将具有SEQ ID NO:28所 示的序列的多肽称为“INSP117外显子1成熟多肽”。下文将具有SEQ ID NO:30所示的序列的多肽称为“INSP117成熟多肽”。
本文所用的术语“INSP117外显子多肽”包括如下的多肽:含有 INSP117外显子1多肽、INSP117外显子2多肽、INSP117外显子1成熟多 肽、INSP117外显子3多肽、INSP117外显子4多肽、INSP117多肽或 INSP117成熟多肽的多肽,以及由INSP117外显子1多肽、INSP117外显子 2多肽、INSP117外显子1成熟多肽、INSP117外显子3多肽、INSP117外 显子4多肽、INSP117多肽或INSP117成熟多肽组成的多肽。
本文所用的术语“INSP113、INSP114、INSP115、INSP116和INSP117 多肽”和“INSP113、INSP114、INSP115、INSP116或INSP117多肽”包括 如下的多肽:包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO: 16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、 SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53和/或SEQ ID NO:55所示的序列的多肽。
如本发明第一方面所说明的一样,鉴定包含EGF样结构域的新颖蛋白 质是有用的,这是因为这样的结构域已被发现在很多疾病包括多种类型的肿 瘤特别是人疾病和肿瘤生长和发展中具有重要作用。
较佳地,本发明第二或第三方面的多肽是含有EGF结构域的蛋白质家 族成员,最好具有与凝血因子X相似的生物活性。“具有与凝血因子X相 似的生物活性”指的是多肽具有与凝血因子X相似的生物活性,进而具有与 TAFA家族相似的生物活性,而TAFA家族与CC细胞因子相似(参见Tang, Y.T.等人,‘TAFA:A novel secreted family with homology to CC- chemokines’,Genbank record AAP92046,at http: //harvester.embl.de/harvester/Q7Z5/Q7Z5A7.htm;也可参见Tang等人, ‘TAFA:a novel secreted family with conserved cysteine residues and restricted expression in the brain’,Genomics.2004 Apr;83(4):727-34)。实施例17和 18给出了确定该多肽是否具有与凝血因子X相似的生物活性的试验。
本发明第四方面提供一种编码本发明第二或第三方面的多肽的纯化核酸 分子。
较佳的是,该纯化核酸分子包含SEQ ID NO:1所示的核酸序列(编码 INSP113多肽)、SEQ ID NO:3所示的核酸序列(编码INSP113成熟多肽)、 SEQ ID NO:5所示的核酸序列(编码INSP114多肽)、SEQ ID NO:7所示的 核酸序列(编码114成熟多肽)、SEQ ID NO:9所示的核酸序列(编码 INSP115多肽)、SEQ ID NO:11所示的核酸序列(编码INSP115成熟多肽)、 SEQ ID NO:13所示的核酸序列(编码INSP116多肽)、SEQ ID NO:15所示 的核酸序列(编码INSP116成熟多肽)、SEQ ID NO:17所示的核酸序列(编 码INSP117外显子1多肽)、SEQ ID NO:19所示的核酸序列(编码INSP117 外显子2多肽)、SEQ ID NO:21所示的核酸序列(编码INSP117外显子3多 肽)、SEQ ID NO:23所示的核酸序列(编码INSP117外显子4多肽)、SEQ ID NO:25所示的核酸序列(编码INSP117多肽)、SEQ ID NO:27所示的核 酸序列(编码INSP117成熟外显子1多肽)、SEQ ID NO:29所示的核酸序列 (编码INSP117成熟多肽)、SEQ ID NO:36所示的核酸序列(编码INSP113sv 多肽)、SEQ ID NO:38所示的核酸序列(编码INSP113sv成熟多肽)、SEQ ID NO:40所示的核酸序列(编码INSP114-SV2多肽)、SEQ ID NO:42所示 的核酸序列(编码INSP-SV2成熟多肽)、SEQ ID NO:44所示的核酸序列(编 码INSP115克隆多肽)、SEQ ID NO:46所示的核酸序列(编码INSP115克隆 成熟多肽)、SEQ ID NO:48所示的核酸序列(编码INSP116克隆多肽)、SEQ ID NO:50所示的核酸序列(编码INSP116克隆成熟多肽)、SEQ ID NO:52 所示的核酸序列(编码INSP114-SV1多肽)和/或SEQ ID NO:54所示的核酸 序列(编码INSP114-SV1成熟多肽),或者是这些序列中任何一个的冗余等同 物或片段。
本发明还提供由如下核酸序列组成的纯化核酸分子:SEQ ID NO:1所 示的核酸序列(编码INSP113多肽)、SEQ ID NO:3所示的核酸序列(编码 INSP113成熟多肽)、SEQ ID NO:5所示的核酸序列(编码INSP114多肽)、 SFQ ID NO:7所示的核酸序列(编码114成熟多肽)、SEQ ID NO:9所示的 核酸序列(编码INSP115多肽)、SEQ ID NO:11所示的核酸序列(编码 INSP115成熟多肽)、SEQ ID NO:13所示的核酸序列(编码INSP116多肽)、 SEQ ID NO:15所示的核酸序列(编码INSP116成熟多肽)、SEQ ID NO:17 所示的核酸序列(编码INSP117外显子1多肽)、SEQ ID NO:19所示的核酸 序列(编码INSP117外显子2多肽)、SEQ ID NO:21所示的核酸序列(编码 INSP117外显子3多肽)、SEQ ID NO:23所示的核酸序列(编码INSP117外 显子4多肽)、SEQ ID NO:25所示的核酸序列(编码INSP117多肽)、SEQ ID NO:27所示的核酸序列(编码INSP117成熟外显子1多肽)、SEQ ID NO:29所示的核酸序列(编码INSP117成熟多肽)、SEQ ID NO:36所示的 核酸序列(编码INSP113sv多肽)、SEQ ID NO:38所示的核酸序列(编码 INSP113sv成熟多肽)、SEQ ID NO:40所示的核酸序列(编码INSP114-SV2 多肽)、SEQ ID NO:42所示的核酸序列(编码INSP-SV2成熟多肽)、SEQ ID NO:44所示的核酸序列(编码INSP115克隆多肽)、SEQ ID NO:46所示的 核酸序列(编码INSP115克隆成熟多肽)、SEQ ID NO:48所示的核酸序列 (编码INSP116克隆多肽)、SEQ ID NO:50所示的核酸序列(编码INSP116 克隆成熟多肽)、SEQ ID NO:52所示的核酸序列(编码INSP114-SV1多肽) 和/或SEQ ID NO:54所示的核酸序列(编码INSP114-SV1成熟多肽),或者 本发明的纯化核酸分子是这些序列中任何一个的冗余等同物或片段。
虽然本申请中SEQ ID NO:52和SEQ ID NO:54所示的序列不包括一 个终止密码子,但此处所用的SEQ ID NO:52和SEQ ID NO:54也包括这 样的核苷酸序列,它们具有本申请中包括一个终止密码子的SEQ ID NO:52 和SEQ ID NO:54所示的序列。类似地,对于本申请中不包括一个终止密 码子的其它SEQ ID NO所示的序列,引述这些SEQ ID NO时也包括引述包 括一个终止密码子的该序列。
根据本发明此方面一个实施例,纯化核酸分子不包括位于INSP117外显 子1多肽起始处的信号肽(SEQ ID NO:18所示的氨基酸1至30)。该实施例 的纯化核酸分子最好包括SEQ ID NO:17所示的核苷酸91至115(如SEQ ID NO:27所示,编码INSP117外显子1成熟多肽)或者SEQ ID NO:25所 示的核苷酸91至402(如SEQ ID NO:29所示,编码INSP117成熟多肽)。 本发明还提供由SEQ ID NO:17所示的核苷酸91至115(如SEQ ID NO:27 所示,编码INSP117外显子1成熟多肽)或者SEQ ID NO:25所示的核苷酸 91至402(如SEQ ID NO:29所示,编码INSP117成熟多肽)组成的纯化核酸 分子。
本发明第五方面提供一种在高度严谨条件下与本发明第四方面的核酸分 子杂交的纯化核酸分子。
本发明第六方面提供一种含有本发明第四或第五方面的核酸分子的载 体,例如表达载体。优选的载体包括pCR4-TOPO-INSP113(图18)、pCR4- TOPO-INSP113sv(图19)、pDONR(图20)、pEAK12d(图21)、pDEST12.2 (图22)、pENTR-INSP113-6HIS(图23)、pENTR-INSP113sv-6HIS(图24)、 pEAK12d-INSP113-6HIS(图25)、pEAK12d-INSP113sv-6HIS(图26)、 pDEST12.2-INSP113-6HIS(图27)、pDEST12.2-INSP113sv-6HIS(图28)、 pCR4-TOPO-INSP114(图31)、pCR4-TOPO-INSP114-GR1(图35)、pCR4- TOPO-INSP114-SV2(图36)、pDONR 221(图38)、pEAK12d(图39)、 pDEST12.2(图40)、pENTR_INSP114-6HIS(图41)、pEAK12d_INSP114- 6HIS(图42)、pDEST12.2_INSP114-6HIS(图43)、pENTR_INSP114-SV1- 6HIS(图44)、pEAK12d_INSP114-SV1-6HIS(图45)、pDEST12.2_INSP114- SV1-6HIS(图46)、pENTR_INSP114-SV2-6HIS(图47)、pEAK12d_INSP114- SV2-6HIS(图48)、pDEST12.2_INSP114-SV2-6HIS(图49)pDONR 221(图 51)、pEAK12d(图52)、pDEST12.2(图53)、pENTR_INSP115-6HIS(图 54)、pEAK12d_INSP115-6HIS(图55)、pDEST12.2_INSP115-6HIS(图56)、 pDONR 221(图58)、pEAK12d(图59)、pDEST12.2(图60)、 pENTR_INSP116-6HIS(图61)、pEAK12d_INSP116-6HIS(图62)、 pDEST12.2_INSP116-6HIS(图63)、pCRII-TOPO-INSP117(图66)、pDONR 221(图67)、pEAK12d(图68)、pDEST12.2(图69)、pENTR_INSP117-6HIS (图70)、pEAK12d_INSP117-6HIS(图71)和pDEST12.2_INSP117-6HIS(图 72)。
本发明第七方面提供一种用本发明第六方面的载体转化的宿主细胞。
本发明第八方面提供一种配体,它特异性地结合本发明第二或第三方面 的含EGF的蛋白质家族成员。较佳地,所述配体抑制本发明第一方面的多 肽的功能,该多肽是含EGF结构域的蛋白质家族成员。本发明多肽的配体 可以有各种形式,包括天然或修饰物质、酶、受体、有机小分子如分子量最 多为2000Da最好800Da或以下的天然或合成有机小分子、肽模拟物、无机 分子、肽、多肽、抗体、上述物质的结构或功能模拟物。
本发明第九方面提供一种有效改变编码本发明第二或第三方面的多肽的 天然基因表达或者调节本发明第二或第三方面的多肽活性的化合物。
本发明第九方面的化合物可以增加(激动)或降低(拮抗)基因表达水平或 多肽活性。
重要的是,鉴定了INSP113、INSP114、INSP115、INSP116和INSP117 多肽功能,就可以设计能够鉴定有效地治疗和/或诊断疾病的化合物的筛选 方法。本发明第八和第九方面的配体和化合物可用这样的方法鉴定。这些方 法包括在本发明范围内。
本发明第十方面提供本发明第二或第三方面的多肽,或者本发明第四或 第五方面的核酸分子,或者本发明第六方面的载体,或者本发明第七方面的 宿主细胞,或者本发明第八方面的配体,或者本发明第九方面的化合物在治 疗或诊断涉及含EGF结构域的蛋白质家族成员的疾病中的用途。这些疾病 可以包括细胞增殖性疾病,包括肿瘤、黑素瘤、癌、结肠直肠癌、乳癌、 胰腺癌、头颈癌及其它实体肿瘤;骨髓增生性疾病,例如白血病、非何杰金 氏淋巴瘤、白血球减少症、血小板减少症、血管生成障碍、卡波西氏肉瘤; 自身免疫/炎症疾病,包括过敏症、炎症性肠疾病、关节炎、屑病、呼吸 道发炎、哮喘和器官移植排斥;心血管疾病,包括高血压、水肿、心绞痛、 动脉硬化症、血栓症、败血症、休克、再灌注损伤和缺血;神经系统疾病, 包括中枢神经系统疾病、阿茨海默氏病、脑损伤、肌萎缩性侧索硬化症和 疼痛;发育障碍;代谢性疾病,包括糖尿病、骨质疏松和肥胖、AIDS和肾 病;感染,包括病毒性感染、细菌性感染、真菌性感染和寄生虫感染和其他 病理病症。较佳地,所述疾病是涉及含EGF结构域的蛋白质的疾病。这些 分子也可用来制造治疗上述疾病的药物。这些分子还可用来避孕或治疗包括 不孕症在内的生殖障碍。
本发明第十一方面提供一种诊断患者疾病的方法,该方法包括评估所述 患者组织中编码本发明第二或第三方面的多肽的天然基因的表达水平或者本 发明第二或第三方面的多肽活性,并将所述表达水平或者活性与对照水平作 比较,若该水平与所述对照水平不同,则表示患病。这种方法最好在体外进 行。可用类似方法监测对患者疾病的治疗,其中多肽或核酸分子的表达水平 或活性在一段时间内趋向于对照水平,表示该疾病获得缓解。
检测本发明第二或第三方面的多肽的优选方法包括以下步骤:(a)在适 合形成配体-多肽复合物的条件下,将本发明第八方面的一种配体,例如抗 体与生物样品接触;以及(b)检测所述复合物。
本领域的读者将懂得,本发明第十一方面的方法有很多种,各不相同, 例如,核酸与短探针杂交法、点突变分析法、聚合酶链式反应(PCR)扩增法 以及使用抗体检测异常蛋白水平的方法。类似方法的使用可以是短期或长时 间的,以便治疗患者被监测的疾病。本发明还提供一些用于这些方法中诊断 疾病的试剂盒。
本发明第十二方面提供本发明第二或第三方面的多肽作为含有EGF结 构域蛋白质的用途。本发明多肽作为含有EGF结构域蛋白质的适当用途包 括作为细胞生长、代谢或分化调节剂的用途、作为受体/配体对一部分的用 途以及作为生理或病理病症诊断标记物的用途。
本发明第十三方面提供一种药物组合物,该组合物含有本发明第二或第 三方面的多肽,或者本发明第四或第五方面的核酸分子,或者本发明第六方 面的载体,或者本发明第七方面的宿主细胞,或者本发明第八方面的配体, 或者本发明第九方面的化合物,并掺合药学上可接受的载体。
本发明第十四方面提供本发明第二或第三方面的多肽,或者本发明第四 或第五方面的核酸分子,或者本发明第六方面的载体,或者本发明第七方面 的宿主细胞,或者本发明第八方面的配体,或者本发明第九方面的化合物在 制造诊断或治疗疾病的药物中的用途。
本发明第十五方面提供一种治疗患者疾病的方法,该方法包括把本发明 第二或第三方面的多肽,或者本发明第四或第五方面的核酸分子,或者本发 明第六方面的载体,或者本发明第七方面的宿主细胞,或者本发明第八方面 的配体,或者本发明第九方面的化合物给予该患者。
当与健康受试者中编码本发明第二或第三方面的多肽的天然基因的表达 水平或者本发明第二或第三方面的多肽活性相比,病患者的该表达水平或活 性较低的,给予该患者的多肽、核酸分子、配体或化合物应该是激动剂。相 反,当与健康受试者中所述多肽的天然基因的表达水平或者活性相比,病患 者的该表达水平或活性较高的,给予该患者的多肽、核酸分子、配体或化合 物应该是拮抗剂。拮抗剂的例子包括反义核酸分子、核酶和配体,例如抗 体。
本发明第十六方面提供转基因或剔除非人动物,它们被转化为表达更高 水平、更低水平或者不表达本发明第二或第三方面的多肽。这些转基因动物 是研究疾病极为有用的模型,也可用在筛选方案中,鉴定有效治疗或诊断这 样一种疾病的化合物。
以下,给出为实施本发明而可采用的标准技术和步骤的概要。应明白, 本发明并不限于所述的这些具体方法、方案、细胞系、载体和试剂。还应明 白,本文所用的术语目的仅在于描述具体实施例,该术语不应该被看成为限 定本发明的范围。本发明的范围只由所附权利要求书的术语限定。
说明书中核苷酸和氨基酸使用标准缩写。
除非另有指出,本发明的做法是采用分子生物学、微生物学、重组 DNA技术和免疫学的常规技术,它们都已为本领域技术人员所掌握。
这些技术在有关文献中已有详细解释。例如,可参考以下特别适用的文 献:Sambrook Molecular Cloning;A Laboratory Manual,Second Edition (1989);DNA Cloning,Volumes I and II(D.N Glover ed.1985); Oligonucleotide Synthesis(M.J.Gait ed.1984);Nucleic Acid Hybridization(B.D. Hames & S.J.Higgins eds.1984);Transcription and Translation(B.D.Hames & S.J.Higgins eds.1984);Animal Cell Culture(R.I.Freshney ed.1986); Immobilized Cells and Enzymes(IRL Press,1986);B.Perbal,A Practical Guide to Molecular Cloning(1984);the Methods in Enzymology series (Academic Press,Inc.),especially volumes 154 & 155;Gene Transfer Vectors for Mammalian Cells(J.H.Miller and M.P.Calos eds.1987,Cold Spring Harbor Laboratory);Immunochemical Methods in Cell and Molecular Biology(Mayer and Walker,eds.1987,Academic Press,London);Scopes,(1987)Protein Purification:Principles and Practice,Second Edition(Springer Verlag,N.Y.); Handbook of Experimental Immunology,Volumes I-IV(D.M.Weir and C.C. Blackwell eds.1986)。
本文所用的术语“多肽”包括含有相互间以肽键或修饰肽键连接的两个 或以上氨基酸的任何肽或蛋白质,即肽同构物(isostere)。该术语指短链(肽和 寡肽)和长链(蛋白质)。
本发明的多肽可以是成熟蛋白质形式,或者可以是前(pre-,pro-,prepro-) 蛋白质,其可通过切割前部分而激活,产生活性成熟多肽。这些多肽中的前 序列可以是先导序列或者分泌序列或者是用来纯化成熟多肽序列的序列。
本发明第二或第三方面的多肽可形成融合蛋白的一部分。例如,有利的 往往包括一或多个附加氨基酸序列,这些附加氨基酸序列可含有分泌序列或 先导序列、前序列(pro-sequences)、有助纯化的序列、或者例如在重组生产 中赋予蛋白质更高稳定性的序列。另一个选择或者另一方面是,成熟多肽可 与另一种化合物,例如与延长该多肽半衰期的化合物(譬如聚乙二醇)融合。
多肽可含有除20个基因编码的氨基酸外的由天然过程,例如翻译后加 工,或者由本领域公知的化学修饰技术修饰的氨基酸。在已知的修饰中,本 发明的多肽通常带有的修饰是糖基化、脂质附着、硫酸化、例如谷氨酸残基 的γ-羧酸化,羟基化和ADP-核糖基化。其他可能的修饰包括乙酰化、酰 化、酰胺化、黄素的共价附着、血素分子的共价附着、核苷酸或核苷酸衍生 物的共价附着、脂质衍生物的共价附着、磷脂酰肌醇的共价附着、交联、环 化、二硫键形成、脱甲基化、共价交联形成、半胱氨酸形成、焦谷氨酸盐形 成、甲酰化、GPI锚着形成、碘化、甲基化、豆蔻酰化、化、蛋白水解加 工、磷酸化、异戊二烯化、外消旋化、硒酰化、转移-RNA介导的蛋白质中 插入氨基酸例如精氨酰化,以及遍在蛋白化。
修饰可发生于多肽的任何位置,包括肽骨架、氨基酸侧链以及氨基或羧 基末端。事实上,天然存在的肽和合成肽一般通过共价修饰封闭肽的氨基或 羧基末端,或者封闭二者,这样的修饰存在于本发明的多肽中。
发生在多肽内的修饰通常随制成该多肽的方式而变化。对于重组制成的 多肽,通过特定宿主细胞翻译后修饰能力以及存在于所述多肽的氨基序列中 的修饰信号来确定大部分修饰的性质和程度。例如,不同类型的宿主细胞之 间糖基化型式是不同的。
本发明的多肽可以任何合适的方式制成。这些多肽包括分离的天然存在 的多肽(例如自细胞培养基中纯化而来)、重组产生的多肽(包括融合蛋白)、 合成产生的多肽或者通过这些方法组合所产生的多肽。
本发明第三方面的功能等同多肽可以是与INSP113、INSP114、 INSP115、INSP116和INSP117多肽同源的多肽。如果一个多肽的序列与另 一个多肽的序列具有足够高程度的同一性或相似性,本文就用术语“同源 的”来形容该两个多肽。“同一性”表示在对比序列的任何特定位置上,两 个序列之间的氨基酸残基是相同的。“相似性”表示在对比序列的任何特定 位置上,两个序列的氨基酸残基是相似的。同一性和相似性的程度不难计算 (Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988;Biocomputing.Informatics and Genome Projects, Smith,D.W.,ed.,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part 1,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;Sequence Analysis Primer,Gribskov,M. and Devereux,J.,eds.,M Stockton Press,New York,1991)。
所以,同源多肽包括INSP113、INSP114、INSP115、INSP116和 INSP117多肽的天然生物变体(例如,产生多肽的物种内等位基因变体或地理 变体)和突变体(例如,含有氨基酸取代、插入或缺失的突变体)。这些突变体 可包括其中一或多个氨基酸残基被保守性或非保守性氨基酸残基(优选保守 性氨基酸残基)取代的多肽,这样一个取代的氨基酸残基可以或不必是遗传 密码编码的残基。典型的取代是在Ala、Val、Leu和Ile之间;在Ser和Thr 之间;在酸性残基Asp和Glu之间;在Asn和Gln之间;在性残基Lys和 Arg之间;或者在芳香族残基Phe和Tyr之间进行。特别优选的是这样一些 变体:有多个氨基酸,即5至10个氨基酸,1至5个氨基酸,1至3个氨基 酸,1至2个氨基酸,或者仅有1个氨基酸以任意组合取代、缺失或插入的 变体。特别优选的是不改变该蛋白质的性质和活性的沉默取代、插入和缺 失。就此而言,特别优选的还有保守性取代。这些突变体也包括其中一或多 个氨基酸残基包括一取代基团的多肽。
通常,两个多肽之间的同一性大于30%,就认为它们在功能上是等同 的。本发明第二或第三方面的功能等同多肽与INSP113、INSP114、 INSP115、INSP116或INSP117多肽,或其活性片段的序列同一性优选大于 80%。更好的多肽分别具有大于85%、90%、95%、98%或99%的同一性。
本发明第二或第三方面的功能等同多肽还可以是已用一或多种结构对比 技术鉴定的多肽。例如,可以应用Inpharmatica Genome ThreaderTM技术(它 构成用于产生BiopendiumTM检索数据库的检索工具的其中一部分,参见国 际申请WO 01/69507)来鉴定现时具有未知功能的多肽,这些多肽虽然与 INSP113、INSP114、INSP115、INSP116和INSP117多肽具有较低的序列同 一性,但由于与INSP113、INSP114、INSP115、INSP116和INSP117多肽序 列共享较高水平的结构同源性,故可预计它们是含有EGF结构域的蛋白质 家族成员。“较高水平的结构同源性”指用Inpharmatica Genome Threader 预测两个蛋白质共享至少10%确定性和以上的结构同源性。
本发明第二或第三方面的多肽还包括INSP113、INSP114、INSP115、 INSP116和INSP117多肽的片段、INSP113、INSP114、INSP115、INSP116 和INSP117多肽的功能等同物的片段,只要那些片段是含有EGF结构域的 蛋白质家族成员,或者带有与INSP113、INSP114、INSP115、INSP116和 INSP117多肽相同的抗原性决定簇。
本文所用的术语“片段”指氨基酸序列与INSP113、INSP114、 INSP115、INSP116和INSP117多肽或它们的其中一种功能等同物的部分而 非全部氨基酸序列相同的多肽。这些片段应包括所述序列的至少n个连续氨 基酸,取决于特定的序列,n最好是7或以上(例如,8、10、12、14、16、 18、20或以上)。小片段可形成抗原性决定簇。
全长INSP113、INSP114、INSP115、INSP116和INSP117多肽的片段可 分别由INSP113、INSP114、INSP115、INSP116和INSP117多肽中2、3或 4个相邻外显子序列组合组成。
这些片段可以是“独立的(free-standing)”,即不是其他氨基酸或多肽的 一部分,也不与其他氨基酸或多肽融合,或者它们可包含在它们构成其中一 部分或区域的较大多肽之内。当包含在较大多肽之内时,本发明的片段最好 构成单个连续区域。例如,一些优选实施例涉及一个片段,其具有与该片段 的氨基末端融合的前多肽区域,和/或具有与该片段的羧基末端融合的附加 区域。然而,单一个较大多肽内可含有多个片段。
本发明的多肽或其免疫原性片段(包含至少一个抗原性决定簇)可被应用 来产生对这些多肽有免疫特异性的配体,例如多克隆或单克隆抗体。这些抗 体可用于分离或鉴定表达本发明的多肽的克隆,或者用于亲和力层析法纯化 这些多肽。抗体还可用来帮助诊断或治疗,以及其他应用,这对本发领域技 术人员是显而易见的。
术语“蛋白质”指一类多肽,包括但不限于,起酶功能的那些。较佳 地,本发明的蛋白质或多肽起配体作用。本文的配体指与另一个分子如受体 结合的分子。配体可以是酶的协同因子。术语“免疫特异性”指抗体对本发 明的多肽的亲和力远远大于它们对现有领域其他相关多肽的亲和力。本文所 用的术语“抗体”指能够与所述抗原性决定簇结合的完整分子及其片段,例 如Fab、F(ab′)2和Fv。所以,这些抗体与本发明第二或第三方面的多肽结 合。
“远远较大的亲和力”指的是与已知的分泌性蛋白质的亲和力相比,本 发明多肽的亲和力有可测量的增大。
较佳的是,对本发明多肽的亲和力相对于已知的分泌性蛋白质,例如含 EGF结构域的蛋白质家族成员至少增大1.5倍,2倍,5倍,10倍,100 倍,103倍,104倍,105倍、106倍或更高。
如果需要多克隆抗体,可用本发明第二或第三方面的多肽使一种选定哺 乳动物免疫,例如小鼠、兔、山羊或。用来免疫动物的多肽可通过重组 DNA技术产生,或者可通过化学方法合成。有需要的时候,可将多肽与一 载体蛋白质连接。通过化学方法与多肽偶联的常用载体包括血清白蛋白、 甲状腺球蛋白和钥孔血蓝蛋白。然后,用偶联的多肽来免疫动物。采集该免 疫动物的血清,再按公知的程序,例如免疫亲和力层析法加以处理。
本领域技术人员可轻易地生产针对本发明第二或第三方面的多肽的单克 隆抗体。应用杂交瘤技术生产单克隆抗体的一般方法已为人所公知(例如, 参见Kohler,G.和Milstein,C.,Nature 256:495-497(1975);Kozbor等, Immunology Today 4:72(1983);Cole等,77-96 in Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.(1985))。
可针对各种性质,即同种型、表位、亲和力等,筛选对本发明第二或第 三方面的多肽产生的多系列单克隆抗体。单克隆抗体特别用于纯化它们所针 对的各种多肽。另一方面,编码感兴趣单克隆抗体的基因可通过例如本领域 公知的PCR技术在杂交瘤中分离出来,并可在适当载体中克隆和表达。
还可使用嵌合抗体,其中非人的可变区与人稳定区连接或融合(例如, 参见Liu等,Proc.Natl.Acad.Sci.USA,84,3439(1987))。
可对抗体进行修饰,例如通过使它人源化,以便在某一个体内的免疫原 性减弱(参见ones等,Nature,321,522(1986);Verhoeyen等,Science, 239,1534(1988);Kabat等,J.Immunol.,147,1709(1991);Queen等, Proc.Natl Acad.Sci.USA,86,10029(1989);Gorman等,Proc.Natl Acad. Sci.USA,88,34181(1991);以及Hodgson等,Bio/Technology,9,421 (1991))。本文所用的术语“人源化抗体”指非人供体抗体的重链和/或轻链 可变区内CDR氨基酸和选定的其他氨基酸已经被人抗体的等同氨基酸所取 代的抗体分子。所以,人源化抗体与人抗体极为相近,但具有该供体抗体结 合的能力。
另一个选择是,抗体可以是“双特异性”抗体,即它是一种有两个不同 抗原结合区的抗体,每一结合区针对不同表位。
可应用噬菌体展示技术选择基因,所述基因编码具有与本发明多肽结合 的活性的抗体,它们来自筛选用来加工有关抗体的以PCR技术扩增的人淋 巴细胞V基因库,或者天然文库(McCafferty,J.等,(1990),Nature 348, 552-554;Marks,J.等,(1992)Biotechnology 10,779-783)。这些抗体的亲 和力也可通过链改组加以改善(Clackson,T.等,(1991)Nature 352,624- 628)。
以上述技术产生的多克隆抗体或单克隆抗体得到额外应用,因为它们可 用作免疫测定法、放射性免疫测定法(RIA)或者酶联免疫吸附测定法(ELISA) 中的试剂。在这些应用中,可使用可分析检测到的试剂,例如放射性同位 素、萤光分子或酶来标记抗体。
本发明第四和第五方面的优选核酸分子是编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO: 12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53和/或SEQ ID NO:55所示的多肽序列的那些分子 和功能等效多肽。这些核酸分子可用于本文描述的方法和应用中。本发明的 核酸分子最好含有至少n个本文所公开的序列中的连续核苷酸,取决于特定 的序列,n是10或以上(例如,12、14、15、18、20、25、30、35、40或以 上)。
本发明的核酸分子还包括上述核酸分子的互补序列(例如,用于反义或 探测目的)。
本发明的核酸分子可以是RNA形式,如mRNA,或者是DNA形式, 包括例如cDNA、合成DNA或基因组DNA。这样一些核酸分子可通过克 隆、化学合成技术或其组合获得。例如,核酸分子可通过应用诸如固相亚磷 酰胺化学合成从基因组或cDNA文库化学合成,或者从生物体中分离而制 备。RNA分子的产生是运用DNA序列的体内或体外转录。
核酸分子可以是双链或单链。单链DNA可以是编码链,也称有义链, 或者它可以是非编码链,也称反义链。
术语“核酸分子”还包括DNA和RNA类似物,例如含有修饰骨架的 那些类似物,以及肽核酸(PNA)。本文所用的术语“PNA”指反义分子或反 基因试剂,其含有长至少5个核苷酸的寡核苷酸,所述寡核苷酸与最好以赖 氨酸为末端的氨基酸残基肽骨架连接。该末端赖氨酸使组合物具有溶解性。 PNA可被聚乙二醇化,延长它们在细胞内的停留时间,在细胞内它们优先 与补体单链DNA和RNA结合,并终止转录延伸(Nielsen,P.E.等,(1993) Anticancer Drug Des.8:53-63)。
编码本发明多肽的核酸分子可以与本文公开的一或多个核酸分子的编码 序列相同。
这些分子还可以有另一个不同序列,因为遗传密码简并性,该不同序列 编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53和/或SEQ ID NO:55所示的多肽。这些核酸分子可包括,但不限于,成熟多肽自身的编 码序列;成熟多肽的编码序列加上附加编码序列,例如编码先导序列或分泌 序列(如前多肽序列)的序列;成熟多肽的编码序列,加上或不加上前述附加 编码序列,再加上另外一些非编码序列,包括非编码5’和3’序列,例如在转 录(包括终止信号)、核糖体结合和mRNA稳定性中发挥作用的转录非翻译序 列。核酸分子还包括编码附加氨基酸的附加序列,例如提供附加功能的那些 氨基酸。
本发明第四和第五方面的核酸分子也可编码本发明第二或第三方面的多 肽及片段的片段或功能等同物。这样一种核酸分子可以是天然存在的变体, 例如天然存在的等位基因变体,或者该分子可以是未知是天然存在的变体。 核酸分子的非天然存在的变体可通过诱变技术制成,包括适用于核酸分子、 细胞或生物体的那些技术。
就此而言,这些变体是通过核苷酸取代、缺失或插入而不同于上述核酸 分子的变体。取代、缺失或插入可涉及一或多个核苷酸。变体可在编码区或 非编码区或者二者内发生变化。编码区内的变化可产生保守性或非保守性氨 基酸取代、缺失或插入。
本发明的核酸分子也可以采用本领域公知的方法为多种原因而进行改 造,这些原因包括修饰克隆、加工、和/或基因产物(多肽)的表达。可用来改 造核苷酸序列的技术还包括应用随机断裂所作的DNA改组、基因片段和合 成寡核苷酸的PCR重新装配。可利用定点诱变插入新的限制位点,改变糖 基化模式,修改密码子偏向,产生剪接变体,引入突变等等。
编码本发明第二或第三方面的多肽的核酸分子可与异源序列连接,以致 该组合核酸分子编码融合蛋白。这样一些组合核酸分子包括在本发明第四和 第五方面之内。例如,要在肽库中筛选抑制多肽活性的抑制剂,用这种组合 核酸分子表达可被市售抗体识别的融合蛋白是有用的。融合蛋白还可被改造 成含有位于本发明多肽的序列与异源蛋白质的序列之间的切割位点,这样, 切割该多肽,从该异源蛋白质中纯化出来。
本发明的核酸分子还包括一些反义分子,它们与编码本发明的多肽的核 酸分子部分互补,因而能与编码核酸分子杂交。如本领域普通技术人员所 知,这些反义分子,例如寡核苷酸,可设计成识别、特异性地结合以及防止 编码本发明多肽的靶核酸的转录(例如,参见Cohen,J.S.,Trends in Pharm. Sci.,10,435(1989),Okano,J.Neurochem.56,560(1991);O′Connor,J. Neurochem 56,560(1991);Lee等,Nucleic Acids Res 6,3073(1979); Cooney等,Science 241,456(1988);Dervan等,Science 251,1360 (1991))。
本文所用的术语“杂交”指两个核酸分子通过氢键相互缔合。通常,将 一个分子固定于固相支持物上,而另一个分子在溶液中游离。然后,在有利 氢键键合的条件下使两个分子相互接触。影响键合的因素包括:溶剂的类型 和体积;反应温度;杂交时间;搅拌;封闭液相分子与固相支持物非特异性 附着的试剂(Denhardt′s试剂或BLOTTO);分子的浓度;提高分子缔合率的 化合物的使用(硫酸葡聚糖或聚乙二醇);杂交后洗涤条件的严谨程度(参见上 述文献Sambrook等)。
应用本领域公知的杂交测定法(例如,参见上述文献Sambrook等,同 上),可检查一个完全互补分子与靶分子杂交的抑制。遵照Wahl,G.M.和 S.L.Berger(1987;Methods Enzymol.152:399-407)以及Kimmel,A.R. (1987;Methods Enzymol.152:507-511)的教导,在不同严谨程度的条件 下,使基本上同源的分子竞争并抑制完全同源的分子与靶分子的结合。
“严谨程度”指在杂交反应中与不同的分子缔合相比,有利于极度相似 的分子缔合的条件。高度严谨杂交条件定义为42℃下在一溶液中培养过 夜,该溶液含有50%甲酰胺、5XSSC(150mM氯化钠,15mM柠檬酸三 钠)、50mM磷酸钠(pH7.6)、5xDenhardts溶液、10%硫酸葡聚糖和20微克/ 毫升变性剪切鲑鱼精子DNA,然后,约65℃下在0.1X SSC中洗涤过滤 器。低度严谨条件涉及在35℃下进行的杂交反应(参见上述文献Sambrook 等,同上)。杂交使用的优选条件是高度严谨杂交条件。
本发明该方面的优选例子是其全长至少有70%与编码INSP113、 INSP114、INSP115、INSP116和INSP117多肽的核酸分子相同的核酸分子 以及基本上与这些核酸分子互补的核酸分子。本发明该方面的优选核酸分子 含有一区域,该区域的全长至少有80%与这些编码序列相同,或者是它们的 一个互补核酸分子。就此而言,特别优选的是其全长至少有90%,优选至少 95%,更好至少98%、99%或以上与所述核酸分子相同的核酸分子。优选的 例子是编码基本上保留与INSP113、INSP114、INSP115、INSP116和 INSP117多肽相同的生物功能或活性的多肽的核酸分子。
本发明还提供一种检测本发明核酸分子的方法,该方法包括以下步骤: (a)在杂交条件下,将本发明的核酸探针与生物样品接触,形成双链体;以 及(b)检测所形成的任何双链体。
下文另外讨论关于本发明可采用的测定法,上述的核酸分子可用作 RNA、cDNA或基因组DNA的杂交探针,分离编码INSP113、INSP114、 INSP115、INSP116和INSP117多肽的全长cDNA和基因组克隆,以及分离 与编码该多肽的基因有高度同一性的同源或直向同源基因的cDNA和基因组 克隆。
在这点上,可以使用以下技术,其中包括已为本领域技术人员所知的, 为了举例说明讨论如下。DNA的测序和分析方法已为人公知,在本领域中 可以获得到,事实上这些方法也用于以下讨论的本发明很多实施例中。这些 方法可使用酶,例如DNA聚合酶I的克列诺片段测序酶(US Biochemical Corp,Cleveland,OH)、Taq聚合酶(Perkin Elmer)、耐热T7聚合酶 (Amersham,Chicago,IL)或者这些酶的组合,以及校读外切核酸酶,例如 Gibco/BRL(Gaithersburg,MD)出售的ELONGASE扩增系统中找到的那些外 切核酸酶。优选的测序方法可应用Hamilton Micro Lab 2200(Hamilton, Reno,NV)、Peltier Thermal Cycler(PTC200;MJ Research,Watertown,MA) 和ABI催化剂以及373和377 DNA测序仪(Perkin Elmer)等仪器进行自动操 作。
一种分离编码具有与INSP113、INSP114、INSP115、INSP116和 INSP117多肽等同功能的多肽的核酸分子的方法是按照本领域公认的标准程 序用天然或人工设计的探针探测基因组或cDNA文库(例如,参见″Current Protocols in Molecular Biology″,Ausubel等(eds),Greene Publishing Association and John Wiley Interscience,New York,1989,1992)。特别有用 的探针:含有至少15个,优选至少30个,更好是至少50个邻接碱基,这 些碱基对应于,或者与适当的编码基因的核酸序列(SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO: 11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO: 19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO: 27、SEQ ID NO:29、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO: 40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO: 48、SEQ ID NO:50、SEQ ID NO:52和SEQ ID NO:54)互补。使用可分 析检测到的试剂标记这些探针,方便鉴定。有用的试剂包括,但不限于,放 射性同位素、萤光染料和能够催化待检测产物形成的酶。有了这些探针,本 领域普通技术人员就能够从人、哺乳动物或其他动物来源中分离出感兴趣的 基因组DNA、cDNA或RNA聚核苷酸编码蛋白质的互补拷贝,并能够在这 些来源中筛选出有关序列,例如该家族、类型和/或亚型的额外成员。
多数情况下,分离的cDNA序列是不完整的,因为编码多肽的区域通常 在5’端被截短。现时有一些方法可获得全长cDNA,或者将短cDNA延长。 应用部分核苷酸序列和本领域公知的各种方法检测上游序列,例如启动子和 调控元件,可将这些序列延长。例如,可采用的一种方法是基于快速扩增 cDNA末端的方法(RACE;例如参见Frohman等,PNAS USA 85,8998- 9002,1988)。最近,MarathonTM technology(Clontech Laboratories Inc.)对这 种技术进行了改进,例如使较长cDNA的检索大大简化。另一种稍稍不同的 技术称为“限制位点”PCR,它使用通用探针检索邻接一已知基因座的未知 核酸序列(Sarkar,G.(1993)PCR Methods Applic.2:318-322)。以基于已知 区域的趋异性引物,也可用反向PCR来扩增或延长序列(Triglia,T.等, (1988)Nucleic Acids Res.16:8186)。捕捉PCR是可使用的另一种方法,它 涉及通过PCR技术扩增邻接人和酵母人工染色体DNA中一已知序列的 DNA片段(Lagerstrom,M.等,(1991)PCR Methods Applic.,1,111-119)。 可用来检索未知序列的另一种方法是Parker,J.D.等描述的方法(1991, Nucleic Acids Res.19:3055-3060)。另外,人们可使用PCR、嵌套引物和 PromoterFinderTM文库来查看基因组DNA(Clontech,Palo Alto,CA)。这种 方法不需要筛选文库,可用于寻找内含子/外显子接合。
当筛选全长cDNA时,最好用已经按大小进行选择包含了较大cDNA 的文库。优选的还有随机引物文库,因为它们含有较多含基因5’区的序列。 对于寡d(T)文库不能产生全长cDNA的情形,最好使用随机引物文库。基因 组文库可用来将序列延伸进入5’非转录调控区。
在本发明一实施例中,本发明的核酸分子可用来进行染色体定位。在这 一技术中,核酸分子特异性靶向,并能与单个人染色体的特定位置杂交。对 本发明染色体的相关序列作图谱,是确认那些序列与基因相关疾病相互关系 的重要步骤。一旦将序列与准确染色体位置在图谱反映出来,就可以将染色 体上序列的物理位置与基因图谱数据关联起来。这些数据例如可以在人类孟 德尔遗传学数据库中找到(Johns Hopkins大学韦尔奇医学库在线提供)。然 后,通过连分析(物理相邻基因的共同继承)确定基因与定位在同一个染色 体区的疾病之间的关系。这为研究人员用定位克隆或其他基因发现技术检索 疾病基因提供了有价值的信息。一旦通过遗传连锁分析粗略确定了疾病或综 合征位于特定基因组区,定位在该区域的任何序列代表相关或调控基因,可 作进一步研究。核酸分子还可用来检测由于正常、载体或染病个体之间移 位、反转等造成染色体位置的差异。
本发明的核酸分子对于组织定位也是有价值的。这些技术通过检测编码 多肽的mRNA可以确定该多肽在组织中的表达模式。这些技术包括原位杂 交技术和核苷酸扩增技术,例如PCR。从研究中获得的结果可知道生物体中 多肽的正常功能。另外,mRNA的正常表达模式与突变基因编码的mRNA 的正常表达模式之间的比较研究为理解突变多肽在疾病中的作用提供了有价 值的认知。不适当表达可以是时间、空间或量化。
还可采取基因沉默方法使编码本发明多肽的基因内源表达下调。一种方 法是RNA干扰(RNAi)(Elbashir,SM等,Nature 2001,411,494-498),可 用来使序列特异性翻译后基因沉默。短dsRNA寡核苷酸在体外合成,并导 入细胞中。这些dsRNA寡核苷酸的序列特异性结合引发靶mRNA降解,从 而减少或消除靶蛋白质表达。
上述评估基因沉默方法的功效可用TaqMan方法在RNA水平上测量多 肽的表达(例如,Western印迹)来评价。
本发明的载体包含本发明的核酸分子,可以是克隆或表达载体。本发明 的宿主细胞可以是原核细胞或真核细胞,它们可用本发明的载体转化、转染 或转导。
本发明的多肽可以重组形式制备,方法是在宿主细胞所含的载体内表达 它们的编码核酸分子。这些表达方法已为本领域技术人员公知,很多方法已 由上述的Sambrook和Fernandez与Hoeffler的书(1998,eds.″Gene expression systems,Using nature for the art of expression″.Academic Press, San Diego,London,Boston,New York,Sydney,Tokyo,Toronto)详细叙 述。
一般而言,可使用适合维持、繁殖或表达核酸分子在一所需宿主内产生 多肽的任何系统或载体。应用各种公知的常规技术,例如上述Sambrook中 描述的技术,可将适当的核苷酸序列插入一表达系统中。通常,可使编码基 因受控于调控元件,例如启动子、核糖体结合位点(对于细菌表达),任选 地是操纵子,以便将编码所希望的多肽的DNA序列转录至转化宿主细胞的 RNA内。
例如,适当的表达系统的例子包括染色体系统、附加体系统和病毒衍生 系统,包括例如衍生自以下物质的载体:细菌质粒、噬菌体、转位子、酵母 附加体、插入元件、酵母染色体元件、病毒例如杆状病毒、乳多空病毒如 SV40、牛痘病毒、腺病毒、禽痘病毒、假狂犬病毒和逆转录病毒,或者其 组合,例如从质粒和噬菌体遗传因子所产生的载体,包括粘粒和噬菌粒。人 的人工染色体(HAC)也可用来输送在质粒中所含有和表达的较大DNA片 段。本发明用的适当载体的优选例子是载体pCR4-TOPO-INSP113(图18)、 pCR4-TOPO-INSP113sv(图19)、pDONR(图20)、pEAK12d(图21)、 pDEST12.2(图22)、pENTR-INSP113-6HIS(图23)、pENTR-INSP113sv-6HIS (图24)、pEAK12d-INSP113-6HIS(图25)、pEAK12d-INSP113sv-6HIS(图 26)、pDEST12.2-INSP113-6HIS(图27)、pDEST12.2-INSP113sv-6HIS(图 28)、pCR4-TOPO-INSP114(图31)、pCR4-TOPO-INSP114-GR1(图35)、 pCR4-TOPO-INSP114-SV2(图36)、pDONR 221(图38)、pEAK12d(图39)、 pDEST12.2(图40)、pENTR_INSP114-6HIS(图41)、pEAK12d_INSP114- 6HIS(图42)、pDEST12.2_INSP114-6HIS(图43)、pENTR_INSP114-SV1- 6HIS(图44)、pEAK12d_INSP114-SV1-6HIS(图45)、pDEST12.2_INSP114- SV1-6HIS(图46)、pENTR_INSP114-SV2-6HIS(图47)、pEAK12d_INSP114- SV2-6HIS(图48)、pDEST12.2_INSP114-SV2-6HIS(图49)pDONR 221(图 51)、pEAK12d(图52)、pDEST12.2(图53)、pENTR_INSP115-6HIS(图 54)、pEAK12d_INSP115-6HIS(图55)、pDEST12.2_INSP115-6HIS(图56)、 pDONR 221(图58)、pEAK12d(图59)、pDEST12.2(图60)、 pENTR_INSP116-6HIS(图61)、pEAK12d_INSP116-6HIS(图62)、 pDEST12.2_INSP116-6HIS(图63)、pCRII-TOPO-INSP117(图66)、pDONR 221(图67)、pEAK12d(图68)、pDEST12.2(图69)、pENTR_INSP117-6HIS (图70)、pEAK12d_INSP117-6HIS(图71)和pDEST12.2_INSP117-6HIS(图 72)。
特别适合的表达系统包括微生物,例如用重组噬菌体、质粒或粘粒 DNA表达系统转化的细菌;用酵母表达载体转化的酵母;用病毒表达载体 (例如杆状病毒)感染的昆虫细胞系统;用病毒表达载体(例如,花椰菜花叶病 毒CaMV;烟草花叶病毒TMV)或者用细胞表达载体(例如,Ti或pBR322质 粒)转化的植物细胞系统;或者动物细胞系统。无细胞翻译系统也可用来产 生本发明的多肽。
参照许多标准实验手册,例如Davis等人(Basic Methods in Molecular Biology(1986))和上述Sambrook等人中描述的方法,可将编码本发明的多 肽的核酸分子导入宿主细胞内。特别适合的方法包括磷酸转染、DEAE-葡 聚糖介导的转染、转染、微量注射、阳离子质粒介导的转染、电穿孔、转 导、划痕加载、弹导导入或感染(参见上述Sambrook等人,同上,1989; Ausubel等人,1991;Spector,Goldman & Leinwald,1998)。在真核细胞 中,表达系统可以是暂时的(例如附加体)或者永久的(染色体整合),取决于 该系统的需要。
编码核酸分子可以包括或不包括编码调控序列例如信号肽或先导序列的 序列,有需要的时候,例如将翻译的多肽分泌到内质网腔、胞质间隙或胞外 环境中。这些信号可以与该多肽内源,或者它们可以是异源信号。先导序列 可在翻译后加工中被细菌宿主除去。
除了调控序列之外,希望可以加入能调节与宿主细胞生长有关的多肽表 达的调节序列。调节序列的例子是对化学和物理刺激,包括调节化合物的存 在,或者对各种温度或代谢条件的应答可引起基因的表达增大或减少的序 列。调节序列是载体的那些非翻译区,例如增强子、启动子以及5’和3’非翻 译区。它们与宿主细胞蛋白质相互作用,进行转录和翻译。这些调节序列的 强度和特异性可以是不同的。取决于所用的载体系统和宿主,可使用任何数 量的适当转录和翻译元件,包括组成型和诱导型启动子。例如在细菌系统内 克隆时,可使用诱导型启动子,例如Bluescript噬菌粒的杂交lacZ启动子 (Stratagene,LaJolla,CA)或pSportlTM质粒(Gibco BRL)等等。在昆虫细胞内 可用杆状病毒多体蛋白启动子。由植物细胞基因组(例如,热激、 RUBISCO和贮藏蛋白基因)或者植物病毒(例如,病毒启动子或先导序列)衍 生而来的启动子或增强子可克隆到载体中。哺乳动物细胞系统优选使用哺乳 动物基因或哺乳动物病毒的启动子。如果需要产生含有序列的多个拷贝的细 胞系,可使用基于SV40或EBV的载体和一适当选择性标记物。
构建一个表达载体,用适当的调节序列可以使特定核酸编码序列位于该 载体内,所述编码序列相对于调节序列的定位和方向使得该编码序列在该调 节序列的“控制”下转录,即与DNA分子结合的RNA聚合酶在调节序列 下转录该编码序列。在一些情况下,有需要将序列修饰成它可以适当方向附 着于调控序列,即维持读框。
调控序列和其他调节序列可在插入载体之前先连接到核酸编码序列。另 一个选择是,直接将编码序列克隆到已经含有调控序列和适当限制位点的表 达载体中。
对于长时间高得率地生产重组多肽,最好有稳定的表达。例如,稳定地 表达感兴趣的多肽的细胞系可以用含有病毒来源复制的表达载体和/或同一 个或不同载体上的内源性表达元件和选择性基因转化。导入载体之后,允许 细胞先在富集培养基中生长1-2天,再转移到选择培养基中。选择性标记物 的目的是为选择带来抗性,它的存在可以使成功表达导入序列的细胞生长和 恢复。稳定转化的细胞的抗性克隆可应用适合细胞类型的组织培养技术进行 增殖。
本领域技术人员已知哺乳动物细胞系可用作表达宿主,而哺乳动物细胞 系包括美国典型菌种保藏中心(ATCC)的许多无限增殖化细胞系,包括但不限 于,中国仓鼠卵巢(CHO)细胞、HeLa细胞、幼仓鼠肾(BHK)细胞、猴肾 (COS)细胞、C127细胞、3T3细胞、BHK细胞、HEK 293细胞、Bowes黑 色素瘤细胞和人肝细胞癌(例如Hep G2)细胞以及其他许多细胞系。
杆状病毒系统中,用于杆状病毒/昆虫细胞表达系统的物质在市场上以 试剂盒形式提供,可以购自Invitrogen,San Diego CA(“MaxBac”试剂 盒)。这些技术对本领域技术人员而言是众所周知的,在Summers和Smith 的文章(Texas Agricultural Experiment Station Bulletin No.1555(1987))中也有 所描述。特别适合该系统使用的宿主细胞包括昆虫细胞,例如果蝇S2细胞 和草地夜蛾Sf9细胞。
本领域已经知道很多植物细胞培养基和全植物遗传表达系统。合适的植 物细胞遗传表达系统的例子包括美国专利US 5,693,506;US 5,659,122;和 US 5,608,143中描述的系统。植物细胞培养基的遗传表达的另外一些例子在 Zenk,Phytochemistry 30,3861-3863(1991)中已有描述。
具体地说,可使用分离和培养原生质体得到全再生植物的所有植物,以 致回收到的全植物含有转移基因。特别是所有植物可从培养细胞或组织中再 生,包括但不限于甘蔗糖用甜菜花、水果和其他树木、豆类和蔬菜的 所有主要种属。
特别优选的细菌宿主细胞的例子包括链球菌、葡萄球菌、大肠杆菌、链 霉菌和枯草芽孢杆菌细胞。
特别适合真菌表达的宿主细胞的例子包括酵母细胞(例如酿酒酵母)和曲 霉菌细胞。
本领域已经知道许多选择系统,它们都可用来回收转化细胞系。例如, 单纯疱疹病毒胸腺嘧啶激酶(Wigler,M.等人,(1977)Cell 11:223-32)和腺嘌 呤磷酸核糖转移酶(Lowy,I.等人,(1980)Cell 22:817-23)基因可分别用在 tk-或aprt±细胞中。
另外,选择的基础可以是抗代谢物、抗生素或除草剂抗性;例如,二氢 叶酸还原酶(DHFR)赋予氨甲蝶呤抗性(Wigler,M.等人,(1980)Proc.Nall. Acad.Sci.77:3567-70);npt赋予氨基糖苷新霉素和G-418抗性(Colbere- Garapin,F.等人,(1981)J.Mol.Biol.150:1-14),als或pat分别赋予绿黄 隆和草丁膦乙酰转移酶抗性。此外,还描述了其他选择性基因,它们的例子 为本领域技术人员所知。
虽然标记基因表达的存在或不存在提示感兴趣的基因也是存在的,但它 的存在和表达有待确认。例如,如果在一标记基因序列中插入相关的基因, 标记基因功能不存在则可以确定含有适当序列的转化细胞。另一个选择是, 在单个启动子控制下将标记基因与编码本发明的多肽的序列串联放置。标记 基因应答诱导或选择的表达通常也表示串联基因的表达。
另外,含有编码本发明的多肽的核酸序列,并表达所述多肽的宿主细胞 可通过本领域技术人员公知的各种程序进行鉴定。这些程序包括但不限于: DNA-DNA或DNA-RNA杂交和蛋白质生物分析,例如,萤光激活细胞分类 术(FACS)或免疫测定技术(例如,酶联免疫吸附试验(ELISA)和放射性免疫测 定法(RIA)),包括用来检测和/或定量分析核酸或蛋白质的膜、溶液或晶片技 术(参见Hampton,R.等人,(1990)Serological Methods,a Laboratory Manual,APS Press,St Paul,MN和Maddox,D.E.等人,(1983)J.Exp. Med,158,1211-1216)。
本领域技术人员公知的各种各样标记和连接技术可用在不同的核酸和氨 基酸试验中。产生标记杂交的装置或者检测与编码本发明的多肽的核酸分子 有关的序列的PCR探针包括,寡标记、镍翻译、末端标记或使用标记聚核 苷酸的PCR扩增。另外,也可将编码本发明的多肽的序列克隆到载体内, 以产生mRNA探针。这些载体是本领域公知的,可通过商业途径获得,加 入诸如T7、T3或SP6等适当RNA聚合酶和标记核苷酸可在体外合成RNA 探针。这些步骤使用市场上供应的各种试剂盒(Pharmacia & Upjohn, (Kalamazoo,MI);Promega(Madison WI);和U.S.Biochemical Corp., Cleveland,OH))进行。
易于检测的合适报导分子或标记包括放射性核、酶和萤光、化学发光或 发色试剂和物质、协同因子、抑制剂、磁性粒子等等。
本发明的核酸分子还可用来制造转基因动物,特别是啮齿动物。这些转 基因动物构成本发明的另一方面。这可通过局部修饰体细胞,或者通过种系 治疗引入遗传修饰来实现。这些转基因动物特别适用于制作动物模型,分析 作为本发明多肽的调节剂的药物分子。
从重组细胞培养基中回收和纯化多肽的方法是公知的,包括硫酸铵或乙 醇沉淀、酸提取、阳离子或阴离子交换层析法、磷酸纤维素层析法、疏水基 相互作用层析法、亲和力层析法、羟磷灰石层析法和血凝素层析法。高效液 相层析法特别适用于纯化。当分离和/或纯化期间多肽发生变性时,可应用 蛋白质再折叠的公知技术来再产生活性构象。
也可利用特异性载体结构来帮助蛋白质纯化,有需要的时候,将编码本 发明的多肽的序列与编码有利于可溶性蛋白质纯化的多肽结构域的核酸序列 连接。有利于纯化的结构域的例子包括金属螯合肽,例如允许在固定金属上 纯化的肌氨酸-色氨酸组件,允许在固定免疫球蛋白上纯化的蛋白A结构 域,以及用在FLAGS延伸/亲和纯化系统(Immunex Corp.,Seattle,WA)中的 结构域。为了方便纯化,可以采用可切割接头序列的内含物,例如在纯化结 构域与本发明的多肽之间的对XA因子或肠激酶有特异性的序列。一种这样 的表达载体为融合蛋白的表达提供准备,所述融合蛋白含有本发明的多肽, 与硫氧还蛋白或肠激酶切割位点前面的多个肌氨酸残基融合。肌氨酸残基有 利于固定金属离子亲和力层析法(IMAC)的纯化,参见Porath,J.等人的描 述(Prot.Exp.Purif.3:263-281,(1992)),而硫氧还蛋白或肠激酶切割位点为 从融合蛋白纯化多肽提供了一种手段。Kroll,D.J.等人对含有融合蛋白的载 体进行了讨论(1993;DNA Cell Biol.12:441-453)。
如果多肽的表达是用在筛选测定法中,通常最好是在它表达的宿主细胞 表面上产生该多肽。在此情况下,宿主细胞可在用于筛选测定法之前,例如 用萤光激活细胞分类术(FACS)或免疫测定技术之前收获。如果多肽分泌到培 养基中,可回收该培养基以便回收和纯化表达多肽。如果多肽是在细胞内产 生,则回收多肽之前必须先溶解细胞。
本发明的多肽可用来筛选各种药物筛选技术使用的化合物库。这些化合 物可以激活(激动)或抑制(拮抗)本发明多肽的基因的表达水平或活性,构成 本发明的另一方面。优选的化合物是能有效地改变编码本发明第二或第三方 面的多肽的天然基因的表达,或者调节本发明第二或第三方面的多肽的活 性。
激动剂或拮抗剂化合物可从,例如,细胞制剂、无细胞制剂、化学库或 天然混合产物中分离出来。这些激动剂或拮抗剂可以是天然的或者是经修饰 的基质、配体、酶、受体或者结构或功能类似物。关于这些筛选技术的综 述,可参见Coligan等人,Current Protocols in Immunology 1(2):Chapter 5 (1991)。
最有可能成为良好拮抗剂的化合物是与本发明的多肽结合但在结合后又 不会诱导该多肽生物作用的分子。潜在的拮抗剂包括有机小分子、肽、多肽 和抗体,它们与本发明的多肽结合,由此抑制或消除它的活性。以这种方 式,多肽与正常细胞结合分子的结合可被抑制,从而抑制该多肽的正常生物 活性。
用在此筛选技术中的本发明的多肽可以在溶液中游离,附着于固相支持 物上,留在细胞表面或位于细胞内。一般而言,这些筛选程序可涉及使用适 当细胞或细胞膜表达与测试化合物接触的多肽,观察结合、或功能反应的刺 激或抑制。再将与测试化合物接触的细胞和不接触测试化合物的对照细胞的 功能反应作比较。借助适当检测系统,这种测定方法可以评估测试化合物是 否导致多肽激活产生一个信号。一般情况下,在已知激动剂存在下分析激活 的抑制剂,在测试化合物存在下观察对激动剂激活的影响。
一种鉴定本发明多肽的激动剂或拮抗剂化合物的优选方法包括:
(a)在允许与多肽结合的条件下,将在其表面上表达本发明第二或第三 方面的多肽的细胞与待筛选化合物接触,所述的多肽与能够在化合物与该多 肽结合之后提供可检测信号的第二成分缔合;和
(b)通过测定化合物与多肽相互作用所产生的信号水平来确定该化合物 是否结合和激活或抑制该多肽。
另一种鉴定本发明多肽的激动剂或拮抗剂化合物的优选方法包括:
(a)在允许与多肽结合的条件下,将在其表面上表达多肽的细胞与待筛 选化合物接触,所述的多肽与能够在化合物与该多肽结合之后提供可检测信 号的第二成分缔合;和
(b)通过对化合物与多肽相互作用所产生的信号水平与在该化合物不存 在下的信号水平作比较来确定该化合物是否结合和激活或抑制该多肽。
在另一优选实施例中,上述的通用方法还包括在多肽的标记或无标记配 体存在下对激动剂或拮抗剂进行鉴定。
在另一实施例中,鉴定本发明的多肽的激动剂或拮抗剂的方法包括:
在允许结合多肽的条件和候选化合物存在下,测定配体例如受体与表面 上带有本发明多肽的细胞、或者与含有这样一种多肽的细胞膜结合的抑制, 并测定与该多肽结合的配体数量。能够引起配体结合减少的化合物就认为是 激动剂或拮抗剂。配体最好是带标记的。
更具体地说,筛选多肽拮抗剂或激动剂化合物的方法包括以下步骤:
(a)使标记的配体与在细胞表面上表达本发明多肽的全细胞,或者与含 有本发明的多肽的细胞膜培养,
(b)测定与全细胞或细胞膜结合的标记配体数量,
(c)在步骤(a)的标记配体和全细胞或者细胞膜的混合物中加入候选化合 物,使该混合物达到平衡;
(d)测定步骤(c)之后与全细胞或细胞膜结合的标记配体数量;以及
(e)比较步骤(b)和(d)中结合的标记配体之差值,引起步骤(d)的结合减少 的化合物是激动剂或拮抗剂。
本发明的INSP113、INSP114、INSP115、INSP116和INSP117多肽可调 节细胞生长和分化。因此,INSP113、INSP114、INSP115、INSP116和 INSP117多肽的生物活性可用允许研究细胞生长和分化的系统(例如器官培养 试验)或者用琼脂糖培养基中的集落分析系统来检查。有很多测定法可以测 定细胞增殖的刺激或抑制。
例如,要观察细胞生长的抑制,人们可利用一个固相或液相介质。在固 相介质中,通过比较形成的集落大小,可从受试者细胞群中选取生长受抑制 的细胞。在液相介质中,通过测量培养基混浊度或DNA中标记胸腺嘧啶核 苷的结合量,可筛选出生长受抑制的细胞。一般地,采用核苷类似物与新合 成DNA的结合量来衡量一群细胞中的增殖情况(即活性细胞生长)。例如, 可用溴脱氧尿苷(BrdU)作为DNA标记试剂,抗BrdU小鼠单克隆抗体为检 测试剂。这种抗体只与含有带溴脱氧尿苷的DNA的细胞结合。与此测定法 结合使用的检测方法有很多种,包括免疫萤光检验法、免疫组织化学法和 ELISA、以及色度测定法。包括溴脱氧尿苷(BrdU)和抗BrdU小鼠单克隆抗 体试剂盒可通过商业途径获得,例如从Boehringer Mannheim(Indianapolis, IN)购买。
将干细胞或胚胎细胞与各种数量的INSP113、INSP114、INSP115、 INSP116和INSP117多肽接触,观察干细胞或胚胎细胞分化后的影响,可测 定INSP113、INSP114、INSP115、INSP116和INSP117多肽对细胞分化的作 用。利用对组织有特异性的抗体和显微镜法,可以鉴定所得到的细胞。
在上述测定法中,发现INSP113、INSP114、INSP115、INSP116和 INSP117多肽以剂量依赖方式调节免疫和/或神经系统细胞增殖和分化。所 以,INSP113、INSP114、INSP115、INSP116和INSP117多肽的“功能等同 物”包括在上述测定法中具有任何相同的以剂量依赖方式调节细胞增殖和分 化的活性的多肽。虽然剂量依赖活性的程度不必与INSP113、INSP114、 INSP115、INSP116和INSP117多肽完全一样,但“功能等同物”在给定的 活性测定法中最好基本上具有与INSP113、INSP114、INSP115、INSP116和 INSP117多肽相类似的剂量依赖关系。
上述一些实施例可应用简单结合测定法,其中测试化合物与带有多肽的 表面的附着运用与该测试化合物直接或间接结合的标记检测,或者可应用涉 及与标记竞争物竞争的测定法检测。另一个实施例采用竞争药物筛选测定 法,其中能够结合多肽的中和抗体与测试化合物特异性地竞争结合。以此方 式可用抗体检测对多肽有特异性结合亲和力的任何测试化合物的存在。
也可把测定法设计成检测加入的测试化合物对细胞内编码多肽的mRNA 产生的作用。例如,ELISA可构建成通过本领域公知的标准方法以单克隆抗 体或多克隆抗体测量多肽的分泌水平或细胞相关水平,这可用来检索抑制或 增强在适当操纵的细胞或组织中产生多肽的化合物。然后,测定多肽与测试 化合物之间的结合复合物的形成。
可采用另一种药物筛选技术,它高通量筛选对感兴趣的多肽具有适当结 合亲和力的化合物(参见国际专利申请WO84/03564)。在这一方法中,在固 相基质上合成大量不同的小测试化合物,它们再与本发明的多肽反应,洗 涤。一种固定多肽的方法是用非中和抗体。以本领域公知的方法可检测结合 多肽。纯化的多肽也可直接铺在板上,用于上述药物筛选技术中。
通过本领域公知的标准受体结合技术,例如配体结合和交联测定法,本 发明的多肽可用来鉴定膜结合或可溶性受体,在配体结合和交联测定法中, 多肽用放射性同位素标记,以化学方法修饰,或者与有利于它的检测或纯化 的肽序列融合,并与推定受体来源(例如,细胞组合物、细胞膜、细胞上清 液、组织抽提物或体液)一起培育。结合的效率可用生物物理技术,如表面 胞质基因共振和光谱测定。结合测定法用于纯化和克隆受体,但也可鉴定多 肽的激动剂和拮抗剂,这些激动剂和拮抗剂与其受体竞争结合多肽。进行筛 选测定的标准方法已为本领域所熟悉。
本发明还包括一种筛选试剂盒,它可用在鉴定上述的激动剂、拮抗剂、 配体、受体、基质、酶的方法中。
本发明包括激动剂、拮抗剂、配体、受体、基质和酶以及通过上述方法 发现的能调节本发明多肽的活性或抗原性的其他化合物。
本发明还提供一些药物组合物,其含有本发明的多肽、核酸、配体或化 合物,以及合适的药物载体。这些组合物适合用作治疗或诊断试剂、疫苗、 或其他免疫原性组合物,下文将作详细说明。
根据本文所用的术语,当组合物中以X+Y的总重量计时至少85%是 X,就认为含有多肽、核酸、配体或化合物[X]的组合物“基本上不含”杂质 [本文以Y表示]。优选X占组合物中X+Y总重量的至少约90%,更好至少 约95%、98%或者甚至99%(重量)。
药物组合物最好含有治疗有效量的本发明的多肽、核酸分子、配体或化 合物。本文所用的术语“治疗有效量”指需要治疗、缓解、或预防目标疾病 或病症,或者具有可检测的治疗或预防作用的治疗药剂的用量。任何一种化 合物的有效治疗剂量最初可在例如肿瘤细胞的细胞培养测定法、或者动物模 型通常是小鼠、兔、狗、或猪模型中估计。动物模型还可用来确定适当的浓 度范围和给药途径。有了这些信息,就可以确定给予人的有用给药剂量和途 径。
人受试者的准确有效剂量取决于疾病状态的严重程度、受试者的一般健 康状况、受试者的年龄、体重和性别、饮食、给药的时间和频率、药物组 合、反应灵敏度,以及治疗耐受性/反应。该用量可以常规实验测定,由医 生判断。通常,有效剂量从0.01毫克/千克至50毫克/千克,优选从0.05毫 克/千克至10毫克/千克。组合物可单独给予患者,或者与其他药剂、药物或 激素结合给予。
一种药物组合物还可含有药学上可接受的载体,作为治疗试剂给予。这 些载体包括抗体和其他多肽、基因和其他治疗试剂,例如脂质体,只要该载 体本身不会诱导产生对接受该组合物的个体有害的抗体,而且载体的给予不 会产生过高毒性。合适的载体可以是大的代谢缓慢的大分子,例如蛋白质、 聚糖、聚乳酸、聚羟基乙酸、聚合氨基酸、氨基酸共聚物和失活病毒颗粒。
还可使用药学上可接受的盐,例如无机酸盐,如盐酸盐、氢溴酸盐、磷 酸盐、硫酸盐等等;以及有机酸盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸 盐等等。Remington′s Pharmaceutical Sciences(Mack Pub.Co.,N.J.1991)对药 学上可接受的载体作了详尽讨论。
治疗组合物中药学上可接受的载体也可含有水、盐水、甘油和乙醇等液 体。另外,这些组合物还可含有辅助物质,例如,湿润剂或乳化剂、pH缓 冲物质等等。这些载体能将药物组合物配制成供患者摄取的片剂、丸剂、糖 衣片、胶囊、液体、凝胶、糖浆、膏剂、悬浮液等等。
一旦配成以后,本发明的组合物可直接给予受试者。接受治疗的受试者 可以是动物;特别是人受试者。
本发明使用的药物组合物可以任何途径给予,包括但不限于,口服、静 脉内、肌内、动脉内、脊髓内、鞘内、心室内、透皮或经皮(例如参见 WO98/20734)、皮下、腹腔内、鼻内、肠内、局部、舌下、阴道内或直肠 途径。本发明的药物组合物也可用基因枪或无针注射器给予。一般将治疗组 合物制成可注射的液体溶液或悬浮液;也可以制成适合注射前溶解或悬浮于 液体介质中的固体形式。
通过注射可将组合物直接输送到皮下、腹腔内、静脉内或肌内,或者送 到组织间质空间。组合物也可施加在病变部位。剂量治疗可分单剂或多剂。
如果本发明的多肽的活性在一特定疾病状态中是过度的,有多种方法可 采用。其中一种方法包括把上述抑制剂化合物(拮抗剂)与药学上可接受的载 体一起给予受试者,抑制剂化合物的量为通过例如阻断配体、基质、酶、受 体的结合,或者抑制第二信号而抑制多肽的功能,从而缓解异常状况的有效 量。这些拮抗剂优选是抗体。这些拮抗剂最好是嵌合抗体和/或人源化抗 体,如前所述,可使它们的免疫原性减至最低。
另一种方法是给予保留了对上述配体、基质、酶、受体有结合亲和力的 多肽的可溶形式。通常,多肽以保留相关部分的片段的形式给予。
在一替换方法中,应用表达封闭技术,例如用内部产生或另外给予的反 义核酸分子(如上所述),抑制编码多肽的基因表达。设计多肽的编码基因的 调控区、5’区或调节区(信号序列、启动子、增强子和内含子)的互补序列或 反义核酸分子(DNA、RNA或PNA),可获得对基因表达的修饰。类似地, 用“三螺旋体”碱基成对方法可实现抑制。三螺旋体成对是有用的,这是因 为它能抑制双螺旋体充分打开以结合聚合酶、转录因子或调节分子的能力。 应用三螺旋DNA的治疗取得最新进展,在文献中已有描述(Gee,J.E.等 人,(1994)In:Huber,B.E.and B.I.Carr,Molecular and Immunologic Approaches,Futura Publishing Co.,Mt.Kisco,NY)。互补序列或反义分子 还可设计成防止转录子与核糖体结合,从而封闭mRNA的翻译。这些寡核 苷酸可给予,或在体内表达中原位产生。
另外,使用对它的编码mRNA序列有特异性的核糖体,可防止表达本 发明的多肽。核糖体是具有催化活性的天然或合成RNA(例如,参见 Usman,N等人,Curr.Opin.Struct.Biol(1996)6(4),527-33)。可设计合成核 糖体,在选定位置上特异性切割mRNA,从而防止mRNA翻译为功能多 肽。核糖体通常在RNA分子中找到,可用天然的磷酸核糖骨架和天然碱基 合成。另一个选择是,核糖体可用非天然骨架,例如2’-氧-甲基RNA合 成,保护核糖核酸酶免于降解,还可含有经修饰的碱基。
可对RNA分子进行修饰,以增加胞内稳定性和延长半衰期。可能的修 饰包括但不限于,在分子的5’和/或3’末端加入侧翼序列或在分子的骨架内 使用硫代磷酸或2’-氧-甲基而不用磷酸二酯酶连锁。这一概念对于产生PNA 是固有的,可延伸至所有这些分子中,方法是包含非常规碱基,例如肌苷、 核苷(queosine)和高修饰苷(butosine)以及乙酰基-、甲基-、硫代-、及类似 修饰形式的腺嘌呤、胞苷、鸟嘌呤、胸腺嘧啶和尿苷,它们不易被内源性内 切核酸酶识别。
有一些方法治疗与本发明的多肽表达不足够或与其活性相关的异常症 状。其中一种方法包括把治疗有效量的能激活该多肽的化合物,即上述激动 剂给予患者,缓解异常征状。另外,也可以给予治疗量的多肽与适当药物载 体,以恢复多肽的相关生理平衡。
基因疗法可用来在受试者体内通过相关细胞内源性产生多肽。基因疗法 以修正治疗基因置换缺陷基因,永久治疗多肽的不适当产生。
本发明的基因疗法可发生于体内或体外。体外基因疗法需要分离和纯化 患者的细胞,导入治疗基因,以及将经基因改造的细胞再引入患者体内。与 之相反,体内基因疗法不需要分离和纯化患者的细胞。
治疗基因往往被“包装”以方便给予患者。基因输送赋形剂可以是非病 毒,例如脂质体,或者复制缺陷型病毒,例如Berkner,K.L.(Curr.Top. Microbiol.Immunol.,158,39-66(1992))所述的腺病毒,或者Muzyczka, N.(Curr.Top.Microbiol.Immunol.,158,97-129(1992)和美国专利US5, 252,479所述的腺伴随病毒(AVV)载体。例如,可对编码本发明的多肽的核 酸分子进行改造,以在复制缺陷型逆转录病毒载体中表达。然后,分离这种 表达构建体,导入用含有编码多肽的RNA的逆转录病毒质粒载体转导的包 装细胞内,使该包装细胞现在能产生含有感兴趣的基因的感染病毒粒子。将 这些生产细胞给予患者,体内改造细胞和体内表达多肽(参见“Gene Therapy and other Molecular Genetic-based Therapeutic Approaches”(纳入作为文献参 考),Human Molecular Genetics(1996),T Strachan和A P Read,BIOS Scientific Publishers Ltd)。
另一种方法是给予“裸露DNA”,其中治疗基因直接注入血流或肌肉 组织。
对于本发明的多肽或核酸分子是引起疾病的试剂的情形,本发明提出它 们可用在疫苗中,产生针对疾病引发剂的抗体。
本发明的疫苗可以是预防性(即预防感染)或者是治疗性的(即治疗感染后 疾病)。这些疫苗包括免疫抗原、免疫原、多肽、蛋白质或核酸,通常与前 述药学上可接受的载体结合,包括本身不会诱导产生对接受该组合物的个体 有害的任何载体。这些载体还可用作免疫刺激剂(“辅助剂”)。此外,抗原 或免疫原可与细菌类毒素例如来自白喉、破伤、霍乱、幽螺杆菌和其他 致病原的类毒素偶联。
因为多肽可以在胃内分解,所以含有多肽的疫苗最好肠胃外给予(例如 皮下、肌内、静脉内、或皮内注射)。适合肠胃外给予的制剂包括无菌水溶 液或非水溶液,其可含有抗氧化剂、缓冲液、抑菌剂和使制剂与接受者的血 液等渗的溶解物,以及无菌水悬浮液或非水悬浮液,其可包括悬浮剂或增稠 剂。
本发明的疫苗制剂可制成单剂或多剂容器。例如,密封安瓿和小瓶可储 存于冻干条件下,只要在使用之前加入无菌液体载体。剂量取决于疫苗的比 活性,通过常规实验可轻易测定。
还可通过基因传送与本发明多肽结合的抗体,例如参见国际专利申请 WO 98/55607。
在配制疫苗组合物时也可使用“快速注射”技术(例如见 www.powderject.com)。
国际专利申请WO 00/29428描述了许多接种疫苗和疫苗输送系统的合 适方法。
本发明还涉及本发明的核酸分子作为诊断试剂的用途。检测以本发明核 酸分子(该核酸分子与功能障碍相关)为特点的基因突变形式提供了一种诊断 工具,它可加入或限定因为基因的表达不足、过度表达或者空间或时间表达 发生改变而引起的疾病或疾病易感性的诊断。通过各种技术可在DNA水平 上检测携带基因突变的个体。
用于诊断的核酸分子可从受试者的细胞中获得,例如从血液、尿、唾 液、组织活体或尸体材料中获得。基因组DNA可直接用作检测,或者在分 析前用PCR、连接酶链式反应(LCR)、链置换扩增(SDA)或者其他扩增技术 酶解扩增(参见Saiki等人,Nature,324,163-166(1986);Bej等人,Crit. Rev.Biochem.Molec.Biol.,26,301-334(1991);Birkenmeyer等人,J.Virol. Meth.,35,117-126(1991);Van Brunt,J.,Bio/Technology,8,291-294 (1990))。
在一实施例中,本发明该方面提供一种诊断患者疾病的方法,该方法包 括评估编码本发明的多肽的天然基因的表达水平,并将所述表达水平与对照 水平作比较,若该水平与所述对照水平不同,则表示患病。这种方法包括以 下步骤:
(a)在允许本发明的核酸分子和核酸探针形成杂交复合物的严谨条件 下,将患者的组织样品与探针接触;
(b)在与步骤(a)相同的条件下,将对照样品与所述探针接触;
(c)以及检测所述样品中是否存在杂交复合物。
其中,检测到患者样品中杂交复合物的水平与对照样品中杂交复合物不 同,表示患病。
本发明另一方面包括一种诊断方法,其包括以下步骤:
(a)从待测试疾病的患者中获得组织样品;
(b)从所述组织样品中分离本发明的核酸分子;
(c)通过检测与疾病相关的核酸分子是否存在突变,诊断患者疾病。
为了帮助上述方法检测核酸分子,可包括扩增步骤,例如利用PCR技 术。
将扩增产物大小的变化与正常基因型比较,可检测到缺失或插入。将扩 增DNA与本发明的标记RNA,或者与本发明的标记反义DNA序列杂交, 可以鉴定点突变。以核糖核酸酶消化或评估熔点温度的差异,区分完全匹配 的序列与错配的双链体。患者是否存在突变可这样检测:将DNA与在严谨 条件下和该DNA杂交的核酸探针接触,形成杂交双链分子,该杂交双链分 子在对应于与疾病相关的突变的任何部分具有核酸探针链的未杂交部分;检 测探针链的未杂交部分是否存在即表示该DNA链的对应部分存在或不存在 与疾病相关的突变。这样的诊断特别适用于产前,甚至新生儿测试。
参考基因与“突变体”基因之间的点突变和其他序列差异可通过公知技 术鉴定,例如,直接DNA测序或单链构象多态性(参见Orita等人, Genomics,5,874-879(1989))。例如,测序引物可与改良PCR产生的双链 PCR产物或单链模板分子一起使用。以使用放射性标记核苷酸的常规程序或 者通过使用萤光标记的自动测序程序,进行序列测定。克隆DNA节段也可 用作检测特异性DNA片段的探针。当与PCR结合时该方法的灵敏度大大提 高。另外,点突变和其他序列变异,例如多态性,可参照上述方法检测,例 如使用等位基因特异性寡核苷酸对不同于单个核苷酸的序列进行PCR扩 增。
在变性试剂存在或不存在下改变DNA片段的凝胶电泳迁移率,或直接 对DNA测序都可以检测到DNA序列的差异(例如Myers等人,Science (1985)230:1242))。特定位置的序列变化可通过核酸酶保护测定法揭示,例 如RNase和S1保护,或者化学切割方法发现(Cotton等人,Proc.Natl.Acad. Sci.USA(1985)85:4397-4401)。
除了常规凝胶电泳和DNA序列测定之外,微小缺失、非整倍性、易 位、倒位等突变也可用原位分析加以检测(例如,参见Keller等人,DNA Probes,2nd Ed.,Stockton Press,New York,N.Y.,USA(1993)),换言之, 可分析细胞内DNA或RNA序列的突变,无需分离或固定在膜上。萤光原 位杂交(FISH)是目前最常用的方法,就FISH的综述已有很多报导(例如,参 见Trachuck等人,Science,250,559-562(1990),and Trask等人,Trends, Genet.,7,149-154(1991))。
本发明另一实施例中,构建了包括本发明核酸分子的寡核苷酸探针阵 列,对遗传变体、突变和多态性进行有效筛选。阵列技术方法是公知的,获 得广泛应用,可用来解释分子遗传方面的各种问题,包括基因表达、遗传连 锁和遗传变异性(例如,参见M.Chee等人,Science(1996),Vol 274,pp 610-613)。
在一实施例中,按照PCT申请WO95/11995(Chee等人);Lockhart,D. J.等人((1996)Nat.Biotech.14:1675-1680));以及Schena,M.等人((1996) Proc.Natl.Acad.Sci.93:10614-10619))描述的方法制作和使用阵列。寡核苷 酸对的范围从2至1,000,000以上。应用光引导化学法在基质的指定区域上 合成低聚物。基质可以是纸、尼龙或其他种类的膜、过滤器、晶片、玻璃载 片或其他任何合适的固相支持物。另外,参照PCT申请WO95/25116 (Baldeschweiler等人)中描述的方法,使用化学偶联程序和喷墨应用装置可在 基质表面上合成寡核苷酸。另一方面,利用真空系统、热学、紫外线、机械 或化学结合程序,以类似斑点(或狭线)印迹的“栅格”阵列将cDNA片段或 寡核苷酸设置和连接于基质表面上。阵列,例如上述的那些阵列,可用人手 或现有设备(斑点印迹或狭线印迹装置)、材料(任何合适的固相支持物)和机 器(包括自动仪器)制作,它们可含有8、24、96、384、1536或6144个寡核 苷酸,或者2至1,000,000以上之间的任何数目,该数目能够使阵列有效地 应用于市场上买到的仪器中。
除了上述讨论的方法之外,通过包括测定受试者样品中多肽或mRNA 水平异常增加或减少的方法可以诊断疾病。采用本领域公知的任何方法可以 在RNA水平上测定表达减少或增加,以便对聚核苷酸作定量分析,例如核 酸扩增,如PCR、RT-PCR、RNase保护、Northern印迹和其他杂交方法。
可用来确定从宿主获得的样品中本发明的多肽水平的测定技术已为本领 域技术人员所知,在上文提到的一些文献中已有讨论(包括放射性免疫测定 法、竞争结合测定法、Western印迹分析和ELISA试验)。本发明该方面提供 一种诊断方法,其包括以下步骤:(a)在适合形成配体-多肽复合物的条件 下,将上述一种配体与生物样品接触;以及(b)检测所述复合物。
测定多肽水平的方案,例如ELISA、RIA和FACS还可为诊断多肽表达 的变化或异常水平提供基础。在适合形成复合物的条件下将正常哺乳动物受 试者,优选是人的体液或细胞抽提物与针对多肽的抗体结合,确立多肽表达 的正常或标准值。标准复合物形成的数量可用各种方法定量测定,例如光度 计装置。
特异性结合本发明多肽的抗体可用来诊断以多肽表达为特点的症状或疾 病,或者用在测定法中监测以本发明的多肽、核酸分子、配体和其他化合物 治疗的患者。用于诊断目的的抗体可以用上述关于治疗所述的相同方法制 成。对多肽的诊断分析包括利用抗体和标记检测人体液或者细胞或组织抽提 物的多肽的方法。使用的多肽可以修饰或不作修饰,将它们与报导分子共价 或非共价结合加上标记。可以应用本领域已知的各种各样报导分子,其中一 些已在上文作了描述。
将在受试者活体组织获得的对照样品和患病样品中表达的多肽数量与标 准值作比较。标准值与受试者值之间的偏差建立诊断疾病的参数。可通过诊 断分析法区分多肽不存在、存在和过度表达,并监测治疗干预期间多肽水平 的调节。这些分析也可用来评估动物研究、临床试验或个体患者的监测治疗 中特定治疗方案的疗效。
本发明的一种诊断试剂盒可包括:
(a)本发明的核酸分子;
(b)本发明的多肽;或者
(c)本发明的配体。
本发明一方面提供一种诊断试剂盒,该试剂盒可包括第一容器,其含有 在严谨条件下与本发明的核酸分子杂交的核酸探针;第二容器,其含有用来 扩增该核酸分子的引物;以及该探针和引物的使用说明书,方便诊断疾病。 这种试剂盒还可包括装有消化未杂交RNA的试剂的第三容器。
本发明另一方面也提供一种诊断试剂盒,该试剂盒可包括核酸分子阵 列,其中至少一个核酸分子是本发明的核酸分子。
为了检测本发明的多肽,一种诊断试剂盒可包括一或多种与本发明的多 肽结合的抗体;一种用来检测该抗体与多肽之间结合反应的试剂。
这些试剂盒都可用于诊断涉及含有EGF结构域的蛋白质家族成员的疾 病或这些疾病易感性。这些疾病可包括但不限于:细胞增殖性疾病,包括肿 瘤、黑素瘤、肺癌、结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤; 骨髓增生性疾病,例如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板 减少症、血管生成障碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏 症、炎症性肠疾病、关节炎、银屑病、呼吸道发炎、哮喘和器官移植排斥; 心血管疾病,包括高血压、水肿、心绞痛、动脉硬化症、血栓症、败血症、 休克、再灌注损伤和缺血;神经系统疾病,包括中枢神经系统疾病、阿耳茨 海默氏病、脑损伤、肌萎缩性侧索硬化症和疼痛;发育障碍;代谢性疾病, 包括糖尿病、骨质疏松和肥胖、AIDS和肾病;感染,包括病毒性感染、细 菌性感染、真菌性感染和寄生虫感染和其他病理病症。较佳地,所述疾病是 涉及淋巴细胞抗原的疾病。这些试剂盒还可用来检测包括不孕症在内的生殖 障碍。
以下,将通过举例说明,特别是结合INSP113、INSP114、INSP115、 INSP116和INSP117多肽对本发明的各个方面和实施例进行描述。
应明白,在不脱离本发明的范围的情况下可以作出改型。
附图说明
图1:SECFAM1家族中全部15个多肽序列的ClustalW对比,包括 INSP113多肽(SEQ ID NO:2)、INSP114多肽(SEQ ID NO:6)、INSP115多肽 (SEQ ID NO:10)、INSP116多肽(SEQ ID NO:14)、INSP117多肽(SEQ ID NO:26)及其小鼠的直向同源物(AK049880.1、chr6_prediction-SEQ ID NO: 31、chr10_prediction-SEQ ID NO:32、AK078681、BAC41130.1和 AAH15306.1),大鼠直向同源物(chr2_prediction-SEQ ID NO:33、 chr4_prediction-SEQ ID NO:34),短尾猿直向同源物(BAB60784.1)和河鲀直 向同源物(scaffold_3581_prediction-SEQ ID NO:35)。
图2:INSP113(SEQ ID NO:2)的SignalP信号肽预测。信号肽概率: 0.994。最大切割位点概率:在位置25和26之间,为0.400。
图3:INSP114(SEQ ID NO:6)的SignalP信号肽预测。信号肽概率: 0.969。最大切割位点概率:在位置30和31之间,为0.713。
图4:INSP115(SEQ ID NO:10)的SignalP信号肽预测。信号肽概率: 0.931。最大切割位点概率:在位置42和43之间,为0.274。
图5:INSP116(SEQ ID NO:14)的SignalP信号肽预测。信号肽概率: 0.908。最大切割位点概率:在位置34和35之间,为0.374。
图6:INSP117(SEQ ID NO:26)的SignalP信号肽预测。信号肽概率: 0.989。最大切割位点概率:在位置30和31之间,为0.748。
图7:由CAD28501.1(INSP113多肽;SEQ ID NO:2)查询获得的 Genome Threader输出结果。
图8:由CAD38865.1(INSP114多肽;SEQ ID NO:6)查询获得的 Genome Threader输出结果。
图9:由XP_08726.1(INSP116多肽;SEQ ID NO:14)查询获得的 Genome Threader输出结果。
图10:由INSP117(SEQ ID NO:26)查询获得的Genome Threader输出 结果。
图11:AAY53016(INSP115;SEQ ID NO:10)在家族数据库中的上部15 个BLASTP结果和运用BLASTP在AAY53016(INSP115;SEQ ID NO:10)与 INSP114(SEQ ID NO:6)之间产生的对比。
图12:INSP113(SEQ ID NO:2)与上部击中结构1WHE之间的Genome Threader对比。四个形成二硫键的保守性半胱氨酸在查询序列的位置96、 101、107和118上(下部)。半胱氨酸98和109代表一对保守性二硫化物, 如1WHE结构所定义。
图13:SECFAM1蛋白质家族的轮廓,围绕INSP117(SEQ ID NO:26) 建立。
图14:取自INSP117中位置44至129氨基酸(对比氨基酸52-138,(图 1))的家族共有序列,以PROSITE形式表示。键:“-”等于每个对比位置之 间一个空格;G=100%保守性G残基;[VI]=该对比位置上或者是V或者 是I;P(0,1)=该对比位置上发现一次或完全没有P残基。
图15:INSP113的预测核苷酸序列和翻译。
图16:用引物对INSP113-CP1和INSP113-CP2克隆的INSP113 PCR产 物的核苷酸序列和翻译。
图17:用引物对INSP113-CP1和INSP113-CP2克隆的INSP113sv PCR 产物的核苷酸序列和翻译。
图18:pCR4-TOPO-INSP113的图谱。
图19:pCR4-TOPO-INSP113sv的图谱。
图20:pDONR 221的图谱。
图21:表达载体pEAK12d的图谱。
图22:表达载体pDEST12.2的图谱。
图23:pENTR-INSP113-6HIS的图谱。
图24:pENTR-INSP113sv-6HIS的图谱。
图25:pEAK12d-INSP113-6HIS的图谱。
图26:pEAK12d-INSP113sv-6HIS的图谱。
图27:pDEST12.2-INSP113-6HIS的图谱。
图28:pDEST12.2-INSP113sv-6HIS的图谱。
图29:INSP114序列和编码序列的翻译,给出PCR引物的位置。
图30:用引物对INSP114-CP1和INSP114-CP2克隆的INSP114 PCR产 物的核苷酸序列和翻译。
图31:pCR4-TOPO-INSP114的图谱。
图32:INSP114编码序列(cds)的核苷酸对比与IMAGE克隆 1616371(包括终止密码子)的相应区。
图33:INSP114编码序列的氨基酸对比与IMAGE克隆1616371的相应 区。
图34:克隆的INSP114-GR1 PCR产物的核苷酸序列和翻译,给出 RACE反应用的引物对位置。
图35:pCR4-TOPO-INSP114-GR1的图谱。
图36:用引物对INSP114-CP3和INSP114-CP4克隆的INSP114-SV2 PCR产物的核苷酸序列和翻译。
图37:pCR4-TOPO-INSP114-SV2的图谱。
图38:pDONR 221的图谱。
图39:表达载体pEAK12d的图谱。
图40:表达载体pDEST12.2的图谱。
图41:pENTR_INSP114-6HIS的图谱。
图42:pEAK12d_INSP114-6HIS的图谱。
图43:pDEST12.2_INSP114-6HIS的图谱。
图44:pENTR_INSP114-SV1-6HIS的图谱。
图45:pEAK12d_INSP114-SV1-6HIS的图谱。
图46:pDEST12.2_INSP114-SV1-6HIS的图谱。
图47:pENTR_INSP114-SV2-6HIS的图谱。
图48:pEAK12d_INSP1141-SV2-6HIS的图谱。
图49:pDEST12.2_INSP114-SV2-6HIS的图谱。
图50:INSP115序列和编码序列的翻译。
图51:pDONR 221的图谱。
图52:表达载体pEAK12d的图谱。
图53:表达载体pDEST12.2的图谱。
图54:pENTR_INSP115-6HIS的图谱。
图55:pEAK12d_INSP115-6HIS的图谱。
图56:pDEST12.2_INSP115-6HIS的图谱。
图57:INSP116序列和编码序列的翻译。
图58:pDONR 221的图谱。
图59:表达载体pEAK12d的图谱。
图60:表达载体pDEST12.2的图谱。
图61:pENTR_INSP116-6HIS的图谱。
图62:pEAK12d_INSP116-6HIS的图谱。
图63:pDEST12.2_INSP116-6HIS的图谱。
图64:INSP117的预测核苷酸序列和翻译。
图65:用引物对INSP117-CP1和INSP117-CP2克隆的INSP117 PCR产 物的核苷酸序列和翻译。
图66:pCRII-TOPO-INSP117的图谱。
图67:pDONR 221.的图谱。
图68:表达载体pEAK12d的图谱。
图69:表达载体pDEST12.2的图谱。
图70:pENTR_INSP117-6HIS的图谱。
图71:pEAK12d_INSP117-6HIS的图谱。
图72:pDEST12.2_INSP117-6HIS的图谱。

具体实施方式

实施例1-SECFAM1家族成员的选择和对比
现时并无关于INSP113、INSP114、INSP115、INSP116和INSP117的注 释,它们含有一个强的分泌性蛋白质特征,为信号肽形式,可与类似蛋白质 聚集在一起,获得其他物种的动物直向同源物支持。
进一步检查可构建一族迄今为止未被定性分析过的蛋白质,该族蛋白质 由5个人基因(INSP113-117)组成,并且包括哺乳动物和鱼类直向同源物,共 有15个序列。用ClustalW工具(Thompson,J.D.,Higgins,D.G.,Gibson T.J.Nucleic Acids Res 1994Nov 11;22(22):4673-80)对这些序列进行对比 (图1)。从对比中可以清楚看到序列相似性和差异性。
运用SignalP程序(http://www.cbs.dtu.dk/services/SignalP/)鉴定 INSP113-117多肽中可能的信号肽区和切割位点。INSP113(SEQ ID NO:2) 的SignalP结果提示,切割位点最可能在SEQ ID NO:2的位置25和26之 间(图2)。INSP114(SEQ ID NO:6)的SignalP结果提示,切割位点最可能在 SEQ ID NO:6的位置30和31之间(图3)。INSP115(SEQ ID NO:10)的 SignalP结果提示,切割位点最可能在SEQ ID NO:10的位置42和43之间 (图4)。INSP116的SignalP结果提示,切割位点最可能在SEQ ID NO:14 的位置34和35之间(图5)。INSP117(SEQ ID NO:26)的SignalP结果提 示,切割位点最可能在SEQ ID NO:26的位置30和31之间。
已经发现,信号肽区与该多肽表现有较高相似性的其他区相比变异性更 大。总的来说,观察到人序列的同一性下降至49%,但保留了强的保守性残 基轮廓(图1)。这群相关序列被称作“SECFAM1家族”。
实施例2-INSP115
对AAY53016(INSP115)运用称作“Genome Threader”的专有生物信息 程序进行查询,没有产生任何结果。然而,鉴定了一个AAY53016(INSP115) 的智人共生同源物(paralogue),此处命名为CAD38865.1(INSP114)。对 INSP115和SECFAM1家族运用BLASTP查询鉴定了CAD38865.1(INSP114) 的残基42-130(图11),它们与AAY53016(INSP115)的残基43-132有51%同 一性。CAD38865.1(INSP114)的残基42-130含有预计接纳EGF样结构域结 构的区(残基67-121)。基于AAY53016(INSP115)与CAD38865.1(INSP114) 预计接纳EGF样结构域结构的区有高度序列同一性,可以预测AAY53016 (INSP115)也能接纳EGF样结构域结构。Chothia和Lesk,1986(EMBO Journal vol.5 pp823)首次表明,序列同一性大于50%的蛋白质,它们的85% 组成残基具有相同构象。其他机构(Sander,C.and Schneider,R.(1991) Proteins vol.9 pp56;Hubbard,T.J.P.and Blundell,T.L.(1987)Protein Engineering vol.1 pp159;Flores,T.P.,Orengo,C.A.,Moss,D.M.and Thornton,J.M.(1993)Protein Science vol.2 pp1811;and Hilbert,M., Bohm,G.and Jaenicke,R.(1993)Proteins vol.17 pp138)随后延续了这些研 究,表明即使同一性低到30%,蛋白质的折叠结构仍保持相同。
实施例3-INSP117基因模型的支持证据
用EST(BM94096)证实了INSP117基因模型预测。该EST跨越3个剪 接外显子,这3个剪接外显子涵盖INSP117的残基7-120(共134个残基), 完全相同。人基因组Build31的chr1:112149567-112151424(+链)与此EST 对应。另外,翻译基因模型与其它SECFAM1家族成员的对比非常强烈(见 图1)。
实施例4-SECFAM1蛋白质内含有EGF结构域的证据
SECFAM1蛋白质家族无法以分泌性蛋白质来表征,不能用基于序列或 结构域轮廓的方法,例如BLAST、CDD、InterPro scan或Inpharmatica Domain Professor.放置它们的标注文字。假设从序列水平来说毫无关系的序 列之间维持结构折叠,可以用专有Inpharmatica Genome Threader程序来寻 找与已知结构的结构关系。
对15个家族序列中每一个进行Genome Threader查询,结果显示结构 有被再现的趋势。在SECFAM1序列查询的多种情况下都发现结构1WHE、 2PF2、2SPT和1URK。另外,在相同查询序列区的情况下,它们始终与相 同结构区折叠(如受家族对比支配)。七十和八十年代放置了任一折叠预测在 数据集内的置信区间百分比,这些输入数据通常构成最有意义的结果(图7- 10是人序列结果(INSP115没有再现任何结果))。独立地来看,这些击中目标 的意义太低,以致无法得出任何明确的结论。不过,整个序列范围都始终击 中这些结构,这些序列中某些序列同一性差异很大(例如INSP113和 INSP114之间的序列同一性为68%),这一事实提示了它们有很强的关系。 所有情况下,家族序列折叠的结构区与EGF样结构域有关。
从得到的序列对比可以看到,一直都有四个保守性半胱氨酸(例如,见 图12)。这些半胱氨酸残基相当于SECFAM1家族对比的位置106、111、117 和128(见图1)。此外,这些保守残基参与了已知结构内二硫键的形成。
图8所示为SECFAM1家族残基频率的轮廓。这代表该家族的独有特 征。该轮廓是采用新序列INSP117构建的,用作模板,从该模板计算在对比 中每一位置上任一氨基酸残基由INSP117各个残基所占据的可能性。再把计 算结果列出来,作为在对比中每一位置上20个氨基酸残基中每一个由 INSP117残基定界的概率评分表。
实施例5-组织分布
观察到剪接成两个以上外显子的表达序列标记(EST)支持了全部5个序 列。关于每个EST匹配的信息见表1。此信息表示INSP113-117基因表达在 中枢神经系统组织中获得了上调。
表1:与5个人基因匹配的表达序列标记(EST),表中给出查询号 (accession numbers)和观察到它们可在其中表达的组织   序列   EST Accession No.   组织   INSP113   H23443.1   全脑(婴儿)   AW955725.1   结肠癌   INSP114   AA984082   脑:额叶   AA984097   脑:额叶   H08484   全脑(婴儿)   INSP115   BI596893   脑:下丘脑   BI915401   脑   BI599742   脑:下丘脑   INSP116   BI599941   脑:下丘脑   INSP117   BM694096   眼:视网膜   BQ638101   眼:视网膜
实施例6-SECFAM1家族轮廓
图13所示为SECFAM1家族对位置有特异性的打分矩阵或者轮廓。这 表示该家族的独有特征。要产生此轮廓首先建立一个多序列对比。选择一个 模板序列,此处为INSP117,围绕该序列构建一个轮廓。对每列被模板序列 残基占据的家族多序列对比进行评估,估算可能的20种氨基酸类型中每一 种的频率。基于BLOSUM62位置依赖性背景矩阵(Henikoff & Henikoff, 1992.Proc.Natl.Acad.Sci.USA,89:10915-9),根据频率分数和看到一种残 基取代优势残基的可能性来计算家族对比中每个位置该种氨基酸残基的分 数。这一矩阵基于大的家族对比数据集(BLOcks SUbstitution Matrix),其 中氨基酸取代频率的评估是基于以62%或以上同一性聚集的对比。在此情况 下,把这些因数合并,得到SECFAM1对比中每个位置上每种氨基酸的对数 分数。最大正数代表最有可能在那一位置找到的那些氨基酸。可用这种轮廓 来确定一查询序列的对比分数。将每一位置上那个氨基酸的相应分数开方, 该查询序列每个氨基酸的全部这些分数的总和构成那个序列的对比分数。如 果它在某一阈值以上,该查询序列可能与该家族有密切关系。这个轮廓形成 该家族的敏感统计标准。
实施例7-INSP113的克隆
7.1人cDNA模板的制备
按照制造商的方案,以Superscript II RNase H-反向转录酶(Invitrogen)从 各种正常人组织总RNA样品(Clontech,Ambion,以及本研究小组的样品)制 备了第一链cDNA。在1.5ml微量离心管(Eppendorf tube)内混合Oligo(dT)15 引物(1μl,500μg/ml)(Promega)、2μg人总RNA、1μl 10mM dNTP混合物 (,dATP,dGTP,dCTP和dTTP各10mM,pH值为中性),加入无菌蒸馏 水配至终体积12μl,65℃加热5分钟,再置于上冷冻。稍微离心收集内 容物,加入4μl 5X第一链缓冲液(First-Strand Buffer)、2μl 0.1M DTT和1 μl RnaseOUT重组核糖核酸酶抑制剂(40单位/μl,Invitrogen)。轻轻混合离 心管内容物,42℃培育2分钟;再加入1μl(200单位)SuperScript II酶,用 吸管操作轻轻混合。使混合物在42℃培育50分钟,再在70℃加热15分钟 失活。为了除去与cDNA互补的RNA,加入1μl(2单位)大肠杆菌RNase H (Invitrogen),反应混合物在37℃培育20分钟。加入179μl灭菌水稀释终体 积为21μl的反应混合物,得到总体积200μl。从结肠、脑和肾产生用作扩 增INSP113的模板的人cDNA样品。
7.2cDNA文库
人cDNA文库(在噬菌体λ载体中)购自Clontech,或者由本研究小组在λ GT10载体中制成。噬菌体λDNA按照制造商(Promega,Corporation, Madison WI.)的说明用Wizard Lambda Preps DNA纯化系统在小规模的感染 大肠杆菌宿主菌培养基中制备。用作扩增INSP113的模板的人cDNA文库 样品来自成人脑皮层、胎儿脑和胎儿肾。
7.3用于PCR的基因特异性克隆引物
设计长度为18至25个碱基的PCR引物对,以便运用引物设计软件 (Scientific & Educational Software,PO Box 72045,Durham,NC 27722- 2045,USA)扩增虚拟cDNA的全编码序列。将PCR引物优化至温度接近 55+10℃,GC含量为40-60%。选择对靶序列(INSP113)有高度选择性的引物 (几乎没有不是非特异性引发)。
7.4用各种人cDNA模板和噬菌体文库cDNA对INSP113进行PCR扩增
设计基因特异性克隆引物(INSP113-CP1和INSP113-CP2,图15-17和表 2),扩增一个420bp cDNA片段,该片段涵盖INSP113预测序列的完整399 bp编码序列。以INSP113预测序列对公用EST序列数据库进行查询,结果 提示该序列可能在成人和胎儿脑、成人和胎儿肾、以及结肠cDNA模板中表 达。所以,应用基因特异性克隆引物INSP113-CP1和INSP113-CP2,以7.1 节列出的人cDNA样品和7.2节列出的噬菌体文库cDNA样品为PCR模 板。用MJ Research DNA Engine在50μl终体积中进行PCR扩增,该终体积 含有1X AmpliTaqTM缓冲液、200μM dNTPs、克隆引物各50pmole、2.5单 位AmpliTaqTM(Perkin Elmer)和人cDNA模板100ng,程序如下:94℃,2 分钟;94℃循环40次,1分钟,51℃,1分钟,以及72℃,1分钟;然后, 72℃循环1次,7分钟,4℃持续循环。
在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到各个扩增产物 (全部都是50μ1)。看到单个PCR产物以接近预定分子量在相应于成人脑第 一链cDNA模板的样品内迁移。又看到第二个PCR产物以500bp在相应于 胎儿脑cDNA文库模板的样品内迁移。这两个PCR产物都用Wizard PCR Preps DNA纯化系统(Promega)从凝胶纯化。每个PCR产物在50μl无菌水中 洗脱出来,直接被亚克隆。
                   表2  INSP113克隆和測序引物   引物   序列(5’-3’)   INSP113-CP1   AGA ATG GCA ATG GTC TCT G   INSP113-CP2   CCA CAA ATG CTT CTG TTA GG   INSP113-EX1   AAG CAG GCT TCG CCA CCA TGG CAA TGG TCT CTG CGA T   INSP113-EX2   GTG ATG GTG ATG GTG GGT TCT TGG GTG AAT TCT CG   INSP113sv-EX1   AAG CAG GCT TCG CCA CCA TGG CAA TGG TCT CTG CGA T   INSP113sv-EX2   GTG ATG GTG ATG GTG AGG CCT TGG ATG ATC TGA AG   GCP正向   G GGG ACA AGT TTG TAC AAA AAA GCA GGC TTC GCC ACC   GCP反向   GGG GAC CAC TIT GTA CAA GAA AGC TGG GTT TCA ATG GTG ATG   GTG ATG GTG   pEAK12F   GCC AGC TTG GCA CTT GAT GT   pEAK12R   GAT GGA GGT GGA CGT GTC AG   21M13   TGT AAA ACG ACG GCC AGT   M13REV   CAG GAA ACA GCT ATG ACC
  T7  TAA TAC GAC TCA CTA TAG G   T3  ATT AAC CCT CAC TAA AGG   SP6  ATT TAG GTG ACA CTA TAG
下划线序列=Kozak序列
粗体=终止密码子
斜线序列=His标签
7.5PCR产物的亚克隆
用购自Invitrogen Corporation的TA克隆试剂盒,在制造商指定的条件 下将PCR产物亚克隆到拓朴异构酶I修饰的克隆载体(pCR4-TOPO)中。简言 之,取4μ1凝胶纯化的PCR产物,室温下与1μl TOPO载体和1μl盐溶液 培养15分钟。再按以下方法将反应混合物转化到大肠杆菌菌株TOP10 (Invitrogen)中:50μl One Shot TOP10细胞等分试样在冰上解冻,加入2μl TOPO反应物。该混合物冰上培育15分钟,再在42℃培育热激刚好30 秒。将样品送回冰上,加入250μl温热SOC培养基(室温)。样品在37℃摇 动培育(220rpm)1小时。然后,将转化混合物300μl铺在含有氨比西林(100 μg/ml)的L-broth(LB)板上,37℃培育过夜。
7.6集落PCR
用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNA Engine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终 体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、T3引 物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2分 钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟。作进一步分 析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使产生预期PCR 产物大小(由于多个克隆位点(MCS)而得到420bp或约500bp cDNA+105bp) 的集落生长过夜,生长条件:温度为37℃,5毫升含有氨比西林(50μg/ml) 的L-broth(LB)板,220rpm摇动。
7.7质粒DNA的制备和测序
按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或 Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备 小量制备(Miniprep)质粒DNA。将质粒DNA在100μl无菌水中洗脱。用 Eppendorf BO光度计或Spectramax 190光度计(Molecular Devices)测定DNA 浓度。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat. no.4390246)以T7为引物对质粒DNA(200-500ng)进行DNA测序。引物序 列见表2。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板 (Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分 析。
序列分析鉴定了一个由成人脑cDNA扩增的克隆,该克隆与预测的 INSP113序列完全匹配。图16为克隆的cDNA片段序列。图18为克隆的 PCR产物(pCR4-TOPO-INSP113)(质粒ID13887)的质粒图谱。
鉴定到的第二个克隆含有一个INSP113预测的剪接变体。该产物由胎儿 脑cDNA文库扩增。它在预测外显子1和2之间有一个附加外显子,该附加 外显子包括一个终止密码子,导致产生一个216bp开放阅读框(ORF)。图17 为克隆的cDNA片段序列。图19为克隆的PCR产物(pCR4-TOPO- INSP113sv)(质粒ID13888)的质粒图谱。
实施例8-在HEK293/EBNA细胞中表达INSP113和INSP113sv的质粒的构 建
通过DNA测序鉴定一个含有INSP113或INSP113sv全编码序列(ORF) 的pCRII-TOPO克隆(pCR4-TOPO-INSP113,质粒ID 13887(图18),或 pCR4-TOPO-INSP113sv,质粒ID 13888(图19)),再运用GatewayTM克隆方 法(Invitrogen)以此克隆将各插入片段亚克隆到哺乳动物细胞表达载体 pEAK12d(图21)和pDEST12.2(图22)中。
8.1与符合读框的6HIS标签序列融合的Gateway相容性INSP113ORF和 INSP113sv ORF的产生
Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生一个这样 的编码框(ORF):在INSP0113或INSP113sv的5’端添加attB1重组位点和 Kozak序列,在3’端添加6个编码HIS标签的序列、终止密码子以及attB2 重组位点(Gateway相容性cDNA)并保证INSP0113或INSP113sv、6个编码 HIS基因和终止密码子在同一个阅读框内。第一次PCR反应(在50μl终体积 中)含有:1.5μl pCR4-TOPO-INSP113(质粒ID 13887)或1.5μl pCR4-TOPO- INSP113sv(质粒ID 13888)、1.5μl dNTPs(10mM)、5μl 10X Pfx聚合酶缓冲 液、1μl MgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP113- EX1和INSP113-EX2,或者INSP113sv-EX1和INSP113sv-EX2)、2.5μl10X EnhancerTM溶液(Invitrogen)和1μl Platinum Pfx DNA聚合酶(Invitrogen)。在 95℃首次变性步骤进行PCR反应2分钟,然后94℃循环15次15秒;50℃ 30秒;以及68℃2分钟30秒。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)直接在扩增反应混合物中纯化产物。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5 μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、 Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl of Platinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃ 循环4次15秒;50℃30秒以及68℃3分钟;94℃循环19次15秒;55℃ 30秒和68℃3分钟;然后4℃持续循环。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
8.2 Gateway相容的INSP113 ORF和INSP113sv ORF亚克隆到Gateway入门 载体pDONR221和表达载体pEAK12d和pDEST12.2
Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物 亚克隆到Gateway入门载体pDONR221(Invitrogen,图20):将5μl纯化的 PCR2产物与1μl pDONR221载体(0.15μg/μl)、2μl BP缓冲液和1.5μl BP 克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入蛋白酶 K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(2μl),通过 电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的 30μl等分试样(Invitrogen)在冰上解冻,加入2μl BP反应混合物。把混合物 转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成后,立即加入预 热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内, 37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺 在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统 (Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator 系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒 DNA(200-500ng)进行DNA测序。引物序列见表2。测序反应物用Dye-Ex 柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯 化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆(pENTR-INSP113-6HIS,质 粒ID 14216,图23,和pENTR-INSP113sv-6HIS,质粒ID 14223,图24)的 质粒洗脱液,该重组反应的10μl反应终体积含有1.5μl pEAK12d载体或 pDEST12.2载体(图21 & 22)(0.1μg/μl)、2μl LR缓冲液和1.5μl LR克隆酶 (Invitrogen)。混合物室温培育1小时,加入蛋白酶K(2μg)终止反应,37℃ 培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌 DH10B细胞,方法如下:取DH10B电感受态细胞的30μl等分试样 (Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物转移到0.1cm 冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电 穿孔仪电电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC 培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm) 培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有氨比西林(40 μg/ml)的L-broth(LB)板上,37℃培育过夜。
在每个载体亚克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以 pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进 行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2 载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表2。
从序列已被确认的各个克隆(pEAK12d-INSP113-6HIS,质粒ID number 14225(图25),pEAK12d-INSP113sv-6HIS,质粒ID number 14227(图26), pDEST12.2-INSP113-6HIS,质粒ID 14226(图27),pDEST12.2-INSP113sv- 6HIS,质粒ID 14260(图28))中任一个取500ml培养基,制备用氯化铯梯度 纯化的大量制备(maxi-prep)DNA,制备方法参照Sambrook J.等人的方法 (Molecular Cloning,a Laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将质粒DNA重悬于1μg/μl无菌水中,-20℃储 存。
实施例9  INSP114的克隆
9.1人cDNA模板的制备
按照制造商的方案,以Superscript II RNase H-反向转录酶(Invitrogen)从 人正常脑总RNA样品(Clontech)制备了第一链eDNA。在1.5ml微量离心管 内混合Oligo(dT)15引物(1μl,500μg/ml)(Promega)、2μg人脑总RNA、1μl 10mM dNTP混合物(,dATP,dGTP,dCTP和dTTP各10mM,pH值为中 性),加入无菌蒸馏水配至终体积12μl,65℃加热5分钟,再置于冰上冷 冻。稍微离心收集内容物,加入4μl 5X第一链缓冲液、2μl 0.1M DTT和 1μl RnaseOUT重组核糖核酸酶抑制剂(40单位/μl,Invitrogen)。轻轻混合离 心管内容物,42℃培育2分钟;再加入1μl(200单位)SuperScript II酶,用 吸管操作轻轻混合。使混合物在42℃培育50分钟,再在70℃加热15分钟 失活。为了除去与cDNA互补的RNA,加入1μl(2单位)大肠杆菌RNase H (Invitrogen),反应混合物在37℃培育20分钟。加入179μl灭菌水稀释终体 积为21μl的反应混合物,得到总体积200μl。
9.2 cDNA文库
人cDNA文库(在噬菌体λ载体中)购自Clontech,或者由本研究小组在λ GT10载体中制成。噬菌体λDNA按照制造商(Promega,Corporation, Madison WI.)的说明,用Wizard Lambda Preps DNA纯化系统在小规模的感 染大肠杆菌宿主菌培养基中制备。用作扩增INSP114的模板的人cDNA文 库样品来自成人和胎儿脑。
9.3用于PCR的基因特异性克隆引物
设计长度为18至25个碱基的PCR引物对,以便运用引物设计软件 (Scientific & Educational Software,PO Box 72045,Durham,NC 27722- 2045,USA)扩增虚拟cDNA的全编码序列。将PCR引物优化至温度接近 55+10℃,GC含量为40-60%。选择对靶序列(INSP114)有高度选择性的引物 (几乎没有不是非特异性引发)。
9.4用各种人cDNA模板和噬菌体文库cDNA对INSP114进行PCR扩增
设计基因特异性克隆引物(INSP114-CP1和INSP114-CP2,图29、图30 和表3),扩增一个439bp cDNA片段,该片段涵盖INSP114预测序列的完 整393bp编码序列。以INSP114预测序列对公用EST序列数据库进行查 询,结果提示该序列应该在脑cDNA模板中表达。所以,应用基因特异性克 隆引物INSP114-CP1和INSP114-CP2,以9.1节列出的人cDNA样品和9.2 节列出的噬菌体文库cDNA样品为模板。用MJ Research DNA Engine在50 μl终体积中进行PCR扩增,该终体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、克隆引物各50pmole、2.5单位AmpliTaqTM(Perkin Elmer)和人 cDNA模板100ng,程序如下:94℃,2分钟;94℃循环40次,30秒, 55℃,30秒,以及72℃,1分钟;然后,72℃循环1次,7分钟,4℃持续 循环。
                       表3  INSP114克隆和測序引物   引物   序列(5′-3′)   INSP114-CP1   GCT GCA GGA TGA GTA AGA GA   INSP114-CP2   TCA TCA GCC TTG AGG ATC AC   INSP114-CP3   ATG AGT AAG AGA TAC TTA CAG AAA GC   INSP114-CP4   TCA CCA CCT AGT TGT TTT GAC TTT ATT C   INSP114-GR1-3′   ACG CGA GCT GCT CCA TCA TGT GT   INSP114-   GRlnest-3′   TGG TGC CAT ATG CAG CCA TGT CT   GeneRacerTM 3′   GCT GTC AAC GAT ACG CTA CGT AAC G   GeneRacerTM   Nested 3′   CGC TAC GTA ACG GCA TGA CAG TG   GeneRacerTM   GCT GTC AAC GAT ACG CTA CGT AAC GGC ATG ACA GTG(T)18
  Oligo dT   INSP114-EX1   AA GCA GGC TTC  GCC ACC ATG AGT AAG AGA TAC TTA CA   INSP114-EX2   GTG ATG GTG ATG GTG ATG GGT TAC CCT AGT TGT TT   INSP114-EX3   GTG ATG GTG ATG GTG CAC GTT TGC CCT AGT TGT TT   INSP114-EX4   GTG ATG GTG ATG GTG CCA CCT AGT TGT TTT GAC TT   GCP正向   G GGG ACA AGT TTG TAC AAA AAA GCA GGC TTC  GCC ACC   GCP反向   GGG GAC CAC TTT GTA CAA GAA AGC TGG GTT TCA ATG GTG   ATG GTG ATG GTG   pEAK12F   GCC AGC TTG GCA CTT GAT GT   pEAK12R   GAT GGA GGT GGA CGT GTC AG   21M13   TGT AAA ACG ACG GCC AGT   M13REV   CAG GAA ACA GCT ATG ACC   T7   TAA TAC GAC TCA CTA TAG G   T3   ATT AAC CCT CAC TAA AGG   SP6   ATT TAG GTG ACA CTA TAG
下划线序列=Kozak序列
粗体=终止密码子
斜线序列=His标签
在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到各个扩增产物 (全部都是50μl)。看到单个PCR产物以接近预定分子量在相应于脑第一链 cDNA模板的样品内迁移。该PCR产物用Qiagen MinElute DNA纯化系统 (Qiagen)纯化。PCR产物在10μl EB缓冲液(10mM Tris.Cl,pH 8.5)中洗脱 出来,直接被亚克隆。
9.5PCR产物的亚克隆
用购自Invitrogen Corporation的TA克隆试剂盒,在制造商指定的条件 下将PCR产物亚克隆到拓朴异构酶I修饰的克隆载体(pCR4-TOPO)中。简言 之,取4μl凝胶纯化的人脑cDNA扩增PCR产物,室温下与1μl TOPO载 体和1μl盐溶液培养15分钟。再按以下方法将反应混合物转化到大肠杆菌 菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分试样在冰上解 冻,加入2μl TOPO反应物。该混合物冰上培育15分钟,再在42℃培育热 激刚好30秒。将样品送回冰上,加入250μl温热SOC培养基(室温)。样品 在37℃摇动培育(220rpm)1小时。然后,将转化混合物300μl铺在含有氨 比西林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。
9.6集落PCR
用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNA Engine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终 体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、T3引 物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2分 钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟。作进一步分 析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使产生预期PCR 产物大小(由于多个克隆位点(MCS)而得到439bp cDNA+105bp)的集落生长 过夜,生长条件:温度为37℃,5毫升含有氨比西林(100μg/ml)的L-broth (LB)板,220rpm摇动。
9.7质粒DNA的制备和测序
按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或 Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备 Miniprep质粒DNA。将质粒DNA在100μl无菌水中洗脱。用Eppendorf BO光度计或Spectramax 190光度计(Molecular Devices)测定DNA浓度。按 照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no. 4390246)以T7和T3为引物对质粒DNA(200-500ng)进行DNA测序。引物 序列见表3。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板 (Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分 析。
序列分析鉴定了一个克隆,该克隆与预测的INSP114序列完全匹配。图 29为克隆的cDNA片段序列。图31为克隆的PCR产物(pCR4-TOPO- INSP114)(质粒ID.14213)的质粒图谱。
9.8 IMAGE cDNA克隆的鉴定和测序
以INSP114预测序列对公用EST序列数据库进行查询,鉴定了大量对 应于部分INSP1148序列的人EST。这些EST由脑和睾丸模板产生。鉴定了 一个EST,GenBank Accession AA984082,它与INSP114编码序列的首385 bp完全匹配。相应的克隆IMAGE 1616371购自ATCC。用T7和T3测序引 物,以及扩增引物INSP114-CP1和INSP114-CP2(见上文)对该IMAGE克隆 插入片段进行测序。发现IMAGE插入片段与INSP114序列的首3个外显子 完全对应。最后一个外显子仅由3个氨基酸以及它们后面的一个终止密码子 组成。INSP114序列中这些氨基酸是VTH(Val-Thr-His)。IMAGE克隆中这3 个氨基酸是ANV(Ala-Asn-Val),后面跟随一个终止密码子。IMAGE克隆 1616371对应于INSP114-SV1,是质粒ID 14211。INSP114编码序列与 IMAGE克隆1616371的相应区的序列对比示于图32和33中。
9.9 3’RACE(cDNA末端的快速扩增)
因为发现了IMAGE克隆1616371含有一个与预测序列不同的外显子 4,所以决定利用3’RACE快速扩增INSP114预测序列,以鉴定是否可以找 到任何其它外显子4序列。以INSP114预测序列对公用EST序列数据库进 行查询,鉴定到大量由脑和睾丸模板产生的相应人EST。因此,决定用脑和 睾丸cDNA样品作为3’RACE反应的模板。
9.10 3’RACE扩增反应
按照制造商的说明,用GeneRacerTM系统(Invitrogen)进行3’RACE。除 RNA模板外,全部反应组分都由该系统供给。按照制造商的方案,利用供 应的GeneRacerTM Oligo dT引物(表3)和Superscript II RNase H-反向转录酶 (Invitrogen)将脑和睾丸RNA(Clontech,Ambion)转化为3’RACE-准备第一 链cDNA。简言之,在1.5ml微量离心管内混合1μl GeneRacerTM Oligo dT 引物(50μM)、1μl 10mM dNTP混合物、5μg人总RNA样品,加入DEPC 处理过的无菌水配至终体积12μl,65℃加热5分钟,再置于冰上冷冻2分 钟。稍微离心收集内容物,加入4μl 5X第一链缓冲液、2μl 0.1M DTT、1 μl RnaseOUT重组核糖核酸酶抑制剂(40单位/μl,Invitrogen)以及1μl SuperScript II RT(200U/μl)。轻轻混合离心管内容物,并稍微离心收集内容 物,42℃培育50分钟;再在70℃加热15分钟失活。将混合物再次置于冰 上冷冻2分钟,再稍微离心收集内容物,加入1μl(2单位)大肠杆菌RNase H (Invitrogen),除去与cDNA互补的RNA。混合物在37℃培育20分钟,然 后置于冰上冷冻。第一链cDNA于-20℃冻存,进行RACE反应时再取出 使用。
在INSP114序列的外显子2和3内分别设计一对基因特异性嵌套3’ RACE引物(INSP114-GR1-3’和INSP114-GRlnest-3’,表3)。这些引物在连 续RACE PCR反应中分别与GeneRacerTM 3’引物及GeneRacerTM 3’嵌套引物 结合使用。对于第一次扩增反应,使1X PlatinumTaq高保真度PCR缓冲 液、2mM MgSO4、200μM dNTPs、0.2μM INSP114-GR1-3’引物、0.6μM GeneRacerTM 3’引物、2.5单位PlatinumTaq高保真度DNA聚合酶 (Invitrogen)、2μl 3’GeneRacerTM-准备脑第一链cDNA或者3’GeneRacerTM- 准备睾丸第一链cDNA模板混合,配成50μl终体积。运用MJ Research DNA Engine进行热循环,程序如下:94℃,2分钟;94℃循环5次,30 秒,72℃,3分钟;94℃循环5次,30秒,70℃,3分鐘;94℃循环25 次,30秒,60℃,30秒,68℃,3分钟;然后,68℃循环1次,10分钟, 4℃持续循环。
对于第二次PCR扩增反应,使1μl PCR1产物与1X PlatinumTaq高保 真度PCR缓冲液、2mM MgSO4、200μM dNTPs、0.2μM INSP114- GRlnest-3’引物、0.2μM GeneRacerTM Nested 3’引物、2.5单位PlatinumTaq 高保真度DNA聚合酶(Invitrogen)混合,配成50μl终体积。运用MJ Research DNA Engine进行热循环,程序如下:94℃,2分钟;94℃循环25 次,30秒,60℃,30秒,68℃,3分钟;然后,68℃循环1次,10分钟, 4℃持续循环。
在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到各个扩增产物 (全部都是50μl)。凝胶上每条泳道都观察到有多条带。从脑cDNA PCR1剪 下一条带,从脑cDNA PCR2剪下一条带,从睾丸PCR2剪下三条带。这些 PCR产物都用Qiagen MinElute DNA纯化系统(Qiagen)纯化。每个产物在10 μl EB缓冲液(10mM Tris.Cl,pH 8.5)中洗脱出来,直接被亚克隆。
9.11 3’RACE PCR产物的亚克隆
用购自Invitrogen Corporation的TA克隆试剂盒,在制造商指定的条件 下将各个RACE PCR产物亚克隆到拓朴异构酶I修饰的克隆载体(pCR4- TOPO)中。简言之,取4μl凝胶纯化的人脑cDNA扩增PCR产物,室温下 与1μl TOPO载体和1μl盐溶液培养15分钟。再按以下方法将反应混合物 转化到大肠杆菌菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分 试样在冰上解冻,加入2μl TOPO反应物。该混合物冰上培育15分钟,再 在42℃培育热激刚好30秒。将样品送回冰上,加入250μl温热SOC培养 基(室温)。样品在37℃摇动培育(220rpm)1小时。然后,将转化混合物铺在 含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。
9.12集落PCR
用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNA Engine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终 体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、T3引 物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2分 钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟30秒或3分 钟(视乎预期插入片段的大小)。作进一步分析之前,将样品保持在4℃(持续 循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使看起来含有插 有片段(即由于多个克隆位点获得的PCR产物大小比105bp大)的集落生长 过夜,生长条件:温度为37℃,5毫升含有氨比西林(50μg/ml)的L-broth (LB)板,220rpm摇动。
9.13质粒DNA的制备和测序
按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或 Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备 Miniprep质粒DNA。将质粒DNA在100μl无菌水中洗脱。用Eppendorf BO光度计或Spectramax 190光度计(Molecular Devices)测定DNA浓度。按 照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no. 4390246)以T7和T3为引物对质粒DNA(200-500ng)进行DNA测序。引物 序列见表3。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板 (Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分 析。
序列分析鉴定了多个克隆,它们的外显子4序列与pCR4-TOPO- INSP114克隆(质粒ID 14213)或IMAGE克隆1616371(质粒ID 14211)完全相 同。不过,也鉴定到一个克隆,它含有第三个版本的外显子4。此情况下, 外显子4仅由一个氨基酸W(Trp)后面跟随一个终止密码子组成。这代表一 个剪接外显子4,而且不是外显子3进入内含子序列的延续。用睾丸cDNA 模板扩增了该序列。图34为该RACE反应产物的序列。图35为克隆产物 pCR4-TOPO-INSP114-GR1的图谱。该克隆是质粒ID 15939。
9.14含有INSP114预测外显子1-3和RACE鉴定的外显子4的克隆的产生
通过RACE扩增和克隆反应鉴定了一个新INSP114外显子4,但需要产 生一个含有INSP114全长序列和该新外显子4序列的克隆。为此,决定由 pCR-TOPO-INSP114克隆(质粒ID 14213)改造该版本的序列,称作INSP114- SV2,使用的一对PCR引物可用新版本取代原外显子4。这些引物没有用 cDNA模板测试,这是因为外显子4序列的长度非常短,利用PCR引物可 被加到含有外显子1-3序列的cDNA模板上。
设计一对基因特异性引物INSP114-CP3和INSP114-CP4(表3),扩增 INSP114序列,同时取代外显子4序列。在50μl终体积中进行PCR反应, 该终体积含有1X PlatinumTaq高保真度PCR缓冲液、2mM MgSO4、200 μM dNTPs、克隆引物各10pmole、2.5单位PlatinumTaq高保真度DNA聚 合酶(Invitrogen)、1μl质粒ID 14213。用MJ Research DNA Engine进行热循 环,程序如下:94℃,2分钟;94℃循环30次,30秒,55℃,30秒, 68℃,30秒;然后,68℃循环1次,7分钟,4℃持续循环。
在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到各个扩增产物 (全部都是50μl)。看到单个PCR产物以接近预定分子量迁移。该PCR产物 用Wizard PCR Preps DNA纯化系统(Promega)纯化。PCR产物在50μl水中 洗脱出来,直接被亚克隆。
9.15PCR产物的亚克隆
用购自Invitrogen Corporation的TA克隆试剂盒,在制造商指定的条件 下将PCR产物亚克隆到拓朴异构酶I修饰的克隆载体(pCR4-TOPO)中。简言 之,取4μl凝胶纯化的人脑cDNA扩增PCR产物,室温下与1μl TOPO载 体和1μl盐溶液培养15分钟。再按以下方法将反应混合物转化到大肠杆菌 菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分试样在冰上解 冻,加入20μl TOPO反应物。该混合物冰上培育15分钟,再在42℃培育 热激刚好30秒。将样品送回冰上,加入250μl温热SOC培养基(室温)。样 品在37℃摇动培育(220rpm)1小时。然后,将转化混合物铺在含有氨比西 林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。
9.16集落PCR
用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNA Engine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终 体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、T3引 物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2分 钟;94℃循环30次,30秒,48℃,30秒,以及72℃,30秒。作进一步分 析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使产生预期PCR 产物大小(由于多个克隆位点(MCS)而得到390bp cDNA+105bp)的集落生长 过夜,生长条件:温度为37℃,5毫升含有氨比西林(100μg/ml)的L-broth (LB)板,220rpm摇动。
9.17质粒DNA的制备和测序
按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或 Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备 Miniprep质粒DNA。将质粒DNA在100μl无菌水中洗脱。用Eppendorf BO光度计或Spectramax 190光度计(Molecular Devices)测定DNA浓度。按 照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no. 4390246)以T7和T3为引物对质粒DNA(200-500ng)进行DNA测序。引物 序列见表3。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板 (Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分 析。
序列分析鉴定了一个克隆,该克隆与预测的INSP114-SV2序列完全匹 配,并且有替代外显子4序列。图36为克隆的cDNA片段序列。图37为克 隆的PCR产物(pCR4-TOPO-INSP114-SV2)(质粒ID.14426)的质粒图谱。
实施例10-INSP114、INSP114-SV1、INSP114-SV2的哺乳动物细胞表达载 体的构建
运用GatewayTM克隆方法(Invitrogen)以质粒14213、14211和14426为 PCR模板分别产生含有INSP114、INSP114-SV1或INSP114-SV2ORF序列 的pEAK12d(图42、45 & 48)和pDEST12.2(图43、46 & 49)表达克隆,带 有编码6HIS标签的3’序列。
10.1与符合读框的6HIS标签序列融合的Gateway相容性INSP114、 INSP114-SV1和INSP114-SV2 ORF的产生
Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生这样的编 码框(ORF):在INSP114、INSP114-SV1和INSP114-SV2的5’端添加attB1 重组位点和Kozak序列,在3’端添加6个编码HIS标签的序列、终止密码 子以及attB2重组位点(Gateway相容性cDNA)并保证INSP114、INSP114- SV1和INSP114-SV2、6个编码HIS基因和终止密码子在同一个阅读框内。 第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质粒14213、14211或 14426、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSPI 14为INSP114-EX1和 INSP114-EX2,INSP114-SV1为INSP114-EX1和INSP114-EX3,INSP114- SV2为INSP114-EX1和INSP114-EX4)、以及0.5μl Platinum Pfx DNA聚合 酶(Invitrogen)。在95℃首次变性步骤进行PCR反应2分钟,然后94℃循环 12次15秒;55℃30秒;68℃2分钟;以及4℃持续循环。在1X TAE缓冲 液(Invitrogen)中的0.8%琼脂糖凝胶上看到扩增产物,按照制造商的说明,以 预定分子量迁移的一个产物用Wizard PCR Preps DNA纯化系统(Promega)凝 胶纯化,回收在50μl水中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5 μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、 Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl of Platinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃ 循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃ 30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
10.2 Gateway相容的INSP114 ORF、INSP114-SV1 ORF和INSP114-SV2 ORF亚克隆到Gateway入门载体pDONR221和表达载体pEAK12d和 pDEST12.2
Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物 亚克隆到Gateway入门载体pDONR221(Invitrogen,图38):将5μl纯化的 PCR2产物与1.5μl pDONR221载体(0.15μg/μl)、2μl BP缓冲液和1.5μl BP 克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入蛋白酶 K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过 电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的 25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物 转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成后,立即加入预 热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内, 37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺 在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统 (Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator 系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒 DNA(150-200ng)进行DNA测序。引物序列见表3。测序反应物用Dye-Ex 柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯 化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆(pENTR_INSP114-6HIS,质 粒ID 14391,图41,pENTR_INSP114-SV1-6HIS,质粒ID 14392,图44, 或pENTR_INSP114-SV2-6HIS,质粒ID 14689,图47)的质粒洗脱液(2μl或 约150ng),该反应的10μl反应终体积含有1.5μl pEAK12d载体或 pDEST12.2载体(图39 & 40)(0.1μg/μl)、2μl LR缓冲液和1.5μl LR克隆酶 (Invitrogen)。混合物室温培育1小时,加入蛋白酶K(2μg)终止反应,37℃ 培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌 DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样 (Invitrogen)在冰上解冻,加入1μl LR反应混合物。把混合物转移到0.1cm 冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电 穿孔仪电电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC 培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm) 培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有氨比西林(100 μg/ml)的L-broth(LB)板上,37℃培育过夜。
在每个载体亚克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以 pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进 行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2 载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表3。
从序列已被确认的各个克隆(pEAK12d_INSP114-6HIS、 pEAK12d_INSP114-SV1-6HIS和pEAK12d_INSP114-SV2-6HIS,质粒ID 14396、14397和14695,分别见图42、45和48,以及pDEST12.2_INSP114- 6HIS、pDEST12.2_INSP114-SV1-6HIS和pDEST12.2_INSP114-SV2-6HIS, 质粒ID 14408、14409和14696,分别见图43、46和49)中任一个取500ml 培养基,制备用氯化铯梯度纯化的maxi-prep DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,a Laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将质粒DNA重悬于1μg/μl无菌水(或10 mM Tris-HCl pH 8.5)中,-20℃储存。
实施例11-INSP115的克隆
INSP115是一个含有132个氨基酸蛋白质(396bp)的预测序列,所述蛋 白质由4个外显子编码。运用全长编码序列(cds)来搜索公用EST数据库,我 们鉴定到多个与INSP115序列相匹配的序列。选取一个序列GenBank Accession BI599742,它对应于IMAGE cDNA克隆5299791,该克隆购自 ATCC。用测序引物T7和T3(表4)对IMAGE克隆插入序列进行测序。发现 该插入序列含有INSP115 cds。IMAGE克隆5299791是质粒数据库ID 14210。鉴定了INSP115对应区后,没有对该IMAGE克隆插入序列的全长 序列进行测序。
                表4 INSP115克隆和測序引物   引物   序列(5′-3′)   T7引物   TAA TAC GAC TCA CTA TAG G   T3引物   ATT AAC CCT CAC TAA AGG   INSP115-EX1   AA GCA GGC TTC GCC ACC ATG GCG CCA TCG CCC AGG AC   INSP115-EX2   GTG ATG GTG ATG GTG GGA GAC CGT GGT GGT CTT TA   GCP正向   G GGG ACA AGT TTG TAC AAA AAA GCA GGC TTC GCC ACC   GCP反向   GGG GAC CAC TTT GTA CAA GAA AGC TGG GTT TCA ATG   GTG ATG GTG ATG GTG   PEAK12F   GCC AGC TTG GCA CTT GAT GT   PEAK12R   GAT GGA GGT GGA CGT GTC AG   21M13   TGT AAA ACG ACG GCC AGT   M13REV   CAG GAA ACA GCT ATG ACC
下划线序列=Kozak序列
粗体=终止密码子
斜线序列=His标签
图50为INSP115预测序列。IMAGE克隆5299791的对应区与 INSP 115 cds在核苷酸水平上完全一致。
实施例12-INSP115的哺乳动物细胞表达载体的构建
运用GatewayTM克隆方法(Invitrogen)以质粒14210为PCR模板产生含 有INSP115 ORF序列的pEAK12d(图55)和pDEST12.2(图56)表达克隆,带 有编码6HIS标签的3’序列。
12.1与符合读框的6HIS标签序列融合的Gateway相容性INSP115 ORF的 产生
Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生一个这样 的编码框(ORF):在INSP115的5’端添加attB1重组位点和Kozak序列,在 3’端添加6个编码HIS标签的序列、终止密码子以及attB2重组位点 (Gateway相容性cDNA)并保证INSP115、6个编码HIS基因和终止密码子在 同一个阅读框内。第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质 粒14210、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP115-EX1和INSP115- EX2)、以及0.5μl Platinum Pfx DNA聚合酶(Invitrogen)。在95℃首次变性 步骤进行PCR反应2分钟,然后94℃循环12次15秒;55℃30秒,和 68℃2分钟;以及4℃持续循环。在1X TAE缓冲液(Invitrogen)中的0.8%琼 脂糖凝胶上看到扩增产物,按照制造商的说明,以预定分子量迁移的一个产 物用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化,回收在50μl水 中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5 μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、 Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl of Platinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃ 循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃ 30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
12.2 Gateway相容的INSP115 ORF亚克隆到Gateway入门载体pDONR221 和表达载体pEAK12d和pDEST12.2
Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物 亚克隆到Gateway入门载体pDONR221(Invitrogen,图51):将5μl纯化的 PCR2产物与1.5μl pDONR221载体(0.15μg/μl)、2μl BP缓冲液和1.5μl BP 克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入蛋白酶 K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过 电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的 25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物 转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成后,立即加入预 热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内, 37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺 在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统 (Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator 系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒 DNA(150-200ng)进行DNA测序。引物序列见表4。测序反应物用Dye-Ex 柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯 化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆(pENTR_INSP115-6HIS,质 粒ID 14393,图54)的质粒洗脱液(2μl或约150ng),该反应的10μl反应终 体积含有1.5μl pEAK12d载体或pDEST12.2载体(图52&53)(0.1μg/μl)、2 μl LR缓冲液和1.5μl LR克隆酶(Invitrogen)。混合物室温培育1小时,加入 蛋白酶K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1 μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感 受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl LR反应混合 物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方 案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成 后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml 卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10 μl和50μl)铺在含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过 夜。
在每載體亞克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以 pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进 行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2 载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表4。
从序列已被确认的各个克隆(pEAK12d_INSP115-6HIS,质粒ID_number 14398,图56)中任一个取500ml培养基,制备用氯化铯梯度纯化的maxi- prep DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,a Laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将 质粒DNA重悬于1μg/μl无菌水(或10mM Tris-HCl pH 8.5)中,-20℃储 存。
实施例13-INSP116的克隆
INSP116是一个含有140个氨基酸蛋白质(420bp)的预测序列,所述蛋 白质由5个外显子编码。运用全长编码序列(cds)来搜索公用EST数据库, 我们鉴定到多个与INSP116序列相匹配的序列。选取一个序列GenBank Accession BI599941,它对应于IMAGE cDNA克隆5302753,该克隆购自 ATCC。用测序引物T7和T3(表5)对IMAGE克隆插入序列进行测序。发现 该插入序列含有INSP116 cds。IMAGE克隆5302753是质粒数据库ID 14206。鉴定了INSP116对应区后,没有对该IMAGE克隆插入序列的全长 序列进行测序。
图57为INSP116预测序列。IMAGE克隆5302753的对应区与 INSP116 cds在核苷酸水平上完全一致。
              表5 INSP116克隆和測序引物   引物   序列(5′-3′)   T7引物   TAA TAC GAC TCA CTA TAG G   T3引物   ATT AAC CCT CAC TAA AGG   INSP116-EX1   AA GCA GGC TTC  GCC ACC ATG AGG TCC CCA AGG ATG AG   INSP116-EX2   GTG ATG GTG ATG GTG CCG CGT TAC CTT CGT AGT TT   GCP正向   G GGG ACA AGT TTG TAC AAA AAA GCA GGC TTC  GCC ACC   GCP反向   GGG GAC CAC TTT GTA CAA GAA AGC TGG GTT TCA ATG   GTG ATG GTG ATG GTG   pEAK12F   GCC AGC TTG GCA CTT GAT GT   pEAK12R   GAT GGA GGT GGA CGT GTC AG   21M13   TGT AAA ACG ACG GCC AGT   M13REV   CAG GAA ACA GCT ATG ACC
下划线序列=Kozak序列
粗体=终止密码子
斜线序列=His标签
实施例14-INSP116的哺乳动物细胞表达载体的构建
运用GatewayTM克隆方法(Invitrogen)以质粒14206为PCR模板产生含 有INSP116 ORF序列的pEAK12d(图62)和pDEST12.2(图63)表达克隆,带 有编码6HIS标签的3’序列。
14.1与符合读框的6HIS标签序列融合的Gateway相容性INSP116 ORF的 产生
Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生一个这样 的编码框(ORF):在INSP116的5’端添加attB1重组位点和Kozak序列,在 3’端添加6个编码HIS标签的序列、终止密码子以及attB2重组位点 (Gateway相容性cDNA)并保证INSP116、6个编码HIS基因和终止密码子在 同一个阅读框内。第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质 粒14206、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP116-EX1和INSP116- EX2)、以及0.5μl Platinum Pfx DNA聚合酶(Invitrogen)。在95℃首次变性 步骤进行PCR反应2分钟,然后94℃循环12次15秒;55℃30秒,和 68℃2分钟;以及4℃持续循环。在1X TAE缓冲液(Invitrogen)中的0.8%琼 脂糖凝胶上看到扩增产物,按照制造商的说明,以预定分子量迁移的一个产 物用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化,回收在50μl水 中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5 μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、 Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl of Platinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃ 循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃ 30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
14.2 Gateway相容的INSP116 ORF亚克隆到Gateway入门载体pDONR221 和表达载体pEAK12d和pDEST12.2
Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物 亚克隆到Gateway入门载体pDONR221(Invitrogen,图58):将5μl纯化的 PCR2产物与15μl pDONR221载体(0.15μg/μl)、2μl BP缓冲液和1.5μl BP 克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入蛋白酶K 1μl(2μg/μl)终止反应,37℃培育多10分钟。取该反应的一等分试样(1 μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感 受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合 物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方 案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成 后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml 卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10 μl和50μl)铺在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过 夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统 (Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator 系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒 DNA(150-200ng)进行DNA测序。引物序列见表5。测序反应物用Dye-Ex 柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯 化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆(pENTR_INSP116-6HIS,质 粒ID 14394,图61)的质粒洗脱液(2μl或约150ng),该反应的10μl反应终 体积含有1.5μl pEAK12d载体或pDEST12.2载体(图59 & 60)(0.1μg/μl)、2 μl LR缓冲液和1.5μl LR克隆酶(Invitrogen)。混合物室温培育1小时,加入 蛋白酶K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1 μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感 受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl LR反应混合 物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方 案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成 后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml 卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10 μl和50μl)铺在含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过 夜。
在每个载体克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以 pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进 行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2 载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表5。
从序列已被确认的各个克隆(pEAK12d INSP116-6HIS,质粒ID number 14399,图62)中任一个取500ml培养基,制备用氯化铯梯度纯化的maxi- prep DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,a Laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将 质粒DNA重悬于1μg/μl无菌水(或10mM Tris-HCl pH 8.5)中,-20℃储 存。
实施例15-INSP117的克隆
15.1人cDNA模板的制备
按照制造商的方案,以Superscript II RNase H-反向转录酶(Invitrogen)从 人正常组织总RNA样品(Clontech,)制备了第一链cDNA。在1.5ml微量离 心管内混合Oligo(dT)15引物(1μl,500μg/ml)(Promega)、2μg人总RNA、1 μl 10mM dNTP混合物(,dATP,dGTP,dCTP和dTTP各10mM,pH值为 中性),加入无菌蒸馏水配至终体积12μl,65℃加热5分钟,再置于冰上冷 冻。稍微离心收集内容物,加入4μl 5X第一链缓冲液、2μl 0.1M DTT和 1μl RnaseOUT重组核糖核酸酶抑制剂(40单位/μl,Invitrogen)。轻轻混合离 心管内容物,42℃培育2分钟;再加入1μl(200单位)SuperScript II酶,用 吸管操作轻轻混合。使混合物在42℃培育50分钟,再在70℃加热15分钟 失活。为了除去与cDNA互补的RNA,加入1μl(2单位)大肠杆菌RNase H (Invitrogen),反应混合物在37℃培育20分钟。加入179μl灭菌水稀释终体 积为21μl的反应混合物,得到总体积200μl。由胎盘、眼和视网膜产生用 作INSP117扩增模板的人cDNA样品。还测试了通用参考标准细胞系混合 cDNA样品(Stratagene)。
15.2 cDNA文库
人cDNA文库(在噬菌体λ载体中)购自Clontech,或者由本研究小组在 GT10载体中制成。噬菌体λDNA按照制造商(Promega,Corporation, Madison WI.)的说明,用Wizard Lambda Preps DNA纯化系统在小规模的感 染大肠杆菌宿主菌培养基中制备。用作INSP117扩增模板的人cDNA文库 样品来自胎盘和视网膜。
15.3用于PCR的基因特异性克隆引物
设计长度为18至25个碱基的PCR引物对,以便运用引物设计软件 (Scientific & Educational Software,PO Box 72045,Durham,NC 27722- 2045,USA)扩增虚拟cDNA的全编码序列。将PCR引物优化至温度接近 55+10℃,GC含量为40-60%。选择对靶序列(INSP117)有高度选择性的引物 (几乎没有不是非特异性引发)。
15.4用各种人cDNA模板和噬菌体文库cDNA对INSP117进行PRC扩增
设计基因特异性克隆引物(INSP117-CP1和INSP117-CP2,图64、图65 和表6),扩增一个412bp cDNA片段,该片段涵盖INSP117预测序列的完 整399bp编码序列。以INSP117预测序列对公用EST序列数据库进行查 询,结果提示该序列可能在胎盘、眼和视网膜cDNA模板中表达。所以,采 用基因特异性克隆引物INSP117-CP1和INSP117-CP2,以15.1节列出的人 cDNA样品和15.2节列出的噬菌体文库cDNA样品为模板。在50μl终体积 中进行PCR扩增,该终体积含有1X PlatinumTaq高保真度PCR缓冲液、2 mM MgSO4、200μM dNTPs、克隆引物各0.2μM、2.5单位PlatinumTaq高 保真度DNA聚合酶(Invitrogen)、人cDNA模板100ng、以及0X、1X或2X 终浓度的PCRx增强溶液(Invitrogen)。用MJ Research DNA Engine进行热循 环,程序如下:94℃,2分钟;94℃循环40次,30秒,55℃,30秒, 68℃,1分钟;然后,68℃循环1次,7分钟,4℃持续循环。
在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到各个扩增产物 (全部都是50μl)。看到单个PCR产物以接近预定分子量在相应于视网膜第 一链cDNA模板的样品内迁移。该PCR产物用Qiagen MinElute DNA纯化 系统(Qiagen)纯化。PCR产物在10μl EB缓冲液(10mM Tris.Cl,pH 8.5)中 洗脱出来,直接被亚克隆。
                表6 INSP117克隆和測序引物   引物   序列(5′-3′)   INSP117-CP1   TTC TCT CCG CAG GAT GAG TGA   INSP117-CP2   TCG TGT GAC CTT GGT GGT TT   INSP117-EX1   AAG CAG GCT TCG CCA CCA TGA GTG AGA GGG TCG AGC G   INSP117-EX2   GTG ATG GTG ATG GTG TCG TGT GAC CTT GGT GGT TT   GCP正向   G GGG ACA AGT TTG TAC AAA AAA GCA GGC TTC  GCC ACC   GCP反向   GGG GAC CAC TTT GTA CAA GAA AGC TGG GTT TCA ATG GTG   ATG GTG ATG GTG   pEAK12F   GCC AGC TTG GCA CTT GAT GT   pEAK12R   GAT GGA GGT GGA CGT GTC AG   21M13   TGT AAA ACG ACG GCC AGT   M13REV   CAG GAA ACA GCT ATG ACC   T7   TAA TAC GAC TCA CTA TAG G   SP6   ATT TAG GTG ACA CTA TAG
下划线序列=Kozak序列
粗体=终止密码子
斜线序列=His标签
15.5PCR产物的亚克隆
用购自Invitrogen Corporation的TA克隆试剂盒,在制造商指定的条件 下,将PCR产物亚克隆到拓朴异构酶I修饰的克隆载体(pCRII-TOPO)中。 简言之,取4μl凝胶纯化的人视网膜cDNA扩增PCR产物,室温下与1μl TOPO载体和1μl盐溶液培养15分钟。再按以下方法将反应混合物转化到 大肠杆菌菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分试样在 冰上解冻,加入2μl TOPO反应物。该混合物冰上培育15分钟,再在42℃ 培育热激刚好30秒。将样品送回冰上,加入250μl温热SOC培养基(室 温)。样品在37℃摇动培育(220rpm)1小时。然后,将转化混合物铺在含有 氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。
15.6集落PCR
用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNA Engine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终 体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、SP6 引物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2 分钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟。作进一步 分析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使产生预期PCR 产物大小(由于多个克隆位点(MCS)而得到412bp cDNA+187bp)的集落生长 过夜,生长条件:温度为37℃,5毫升含有氨比西林(50μg/ml)的L-broth (LB)板,220rpm摇动。
15.7质粒DNA的制备和测序
按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或 Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备 Miniprep质粒DNA。将质粒DNA在100μl无菌水中洗脱。用Eppendorf BO光度计测定DNA浓度。按照制造商的说明,用BigDyeTerminator系统 (Applied Biosystems cat.no.4390246)以T7和SP6为引物对质粒DNA(200- 500ng)进行DNA测序。引物序列见表6。测序反应物用Dye-Ex柱(Qiagen) 或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯化,再用 Applied Biosystems 3700测序仪分析。
序列分析鉴定了一个克隆,该克隆与预测的INSP117序列完全匹配。图 65为克隆的cDNA片段序列。图66为克隆的PCR产物(pCRII-TOPO- INSP117)(质粒ID.14417)的质粒图谱。
实施例16 INSP117的哺乳动物细胞表达载体的构建
运用GatewayTM克隆方法(Invitrogen)以质粒14417为PCR模板产生含 有INSP117 ORF序列的pEAK12d(图71)和pDEST12.2(图72)表达克隆,带 有编码6HIS标签的3’序列。
16.1与符合读框的6HIS标签序列融合的Gateway相容性INSP117 ORF的 产生
Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生一个这样 的编码框(ORF):在INSP117的5’端添加attB1重组位点和Kozak序列,在 3’端添加6个编码HIS标签的序列、终止密码子以及attB2重组位点 (Gateway相容性cDNA)并保证INSP117、6个编码HIS基因和终止密码子在 同一个阅读框内。第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质 粒14417、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP117-EX1和INSP117- EX2)、以及0.5μl Platinum Pfx DNA聚合酶(Invitrogen)。在95℃首次变性 步骤进行PCR反应2分钟,然后94℃循环12次15秒;55℃30秒,和 68℃2分钟;以及4℃持续循环。在1X TAE缓冲液(Invitrogen)中的0.8%琼 脂糖凝胶上看到扩增产物,按照制造商的说明,以预定分子量迁移的一个产 物用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化,回收在50μl水 中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5 μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、 Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl of Platinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃ 循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃ 30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
16.2 Gateway相容的INSP117 ORF亚克隆到Gateway入门载体pDONR221 和表达载体pEAK12d和pDEST12.2
Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物 亚克隆到Gateway入门载体pDONR221(Invitrogen,图67):将5μl纯化的 PCR2产物与1.5μl pDONR221载体(0.15μg/μl)、2μl BP缓冲液和1.5μl BP 克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入蛋白酶K1 μl(2μg/μl)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl), 通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细 胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把 混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用 Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作完成后,立即 加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试 管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50 μl)铺在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统 (Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator 系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒 DNA(150-200ng)进行DNA测序。引物序列见表6。测序反应物用Dye-Ex 柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯 化,再用Applied Biosystems3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆(pENTR_INSP117-6HIS,质 粒ID 14594,图70)的质粒洗脱液(2μl或约150ng),该重组反应的10μl反 应终体积含有1.5μl pEAK12d载体或pDEST12.2载体(图68&69)(0.1μg/ μl)、2μl LR缓冲液和1.5μl LR克隆酶(Invitrogen)。混合物室温培育1小 时,加入蛋白酶K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分 试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取 DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl LR 反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建 议的方案,用Biorad Gene PulserTM电穿孔仪电电穿孔的细胞中。电穿孔操作 完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个 15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试 样(10μl和50μl)铺在含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培 育过夜。
在每个载体亚克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以 pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进 行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2 载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表6。
从序列已被确认的各个克隆(pEAK12d_INSP117-6HIS,质粒ID number 14601,图71)中任一个取500ml培养基,制备用氯化铯梯度纯化的maxi- prep DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,a Laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将 质粒DNA重悬于1μg/μl无菌水(或10mM Tris-HCl pH 8.5)中,-20℃储 存。
实施例17:INSP113、INSP114、INSP115、INSP116和INSP117的表达和 纯化
现在,根据本文公开的核苷酸和氨基酸序列,进行其他实验以确定 INSP113、INSP114、INSP115、INSP116和INSP117多肽在体内的组织分布 和表达水平。
可通过对不同人组织的cDNA进行PCR反应,研究INSP113、 INSP114、INSP115、INSP116和INSP117多肽转录物是否存在。INSP113、 INSP114、INSP115、INSP116和INSP117转录物在测试样品中的水平可能 很低。所以,设计确定各种人组织中是否存在一个转录物的实验需要特别小 心,因为RNA制剂中小量基因组污染物都会导致假阳性结果。因此,进行 逆转录之前,全部RNA都应该先用DNAse处理。另外,每一种组织都应设 一个对照反应,该对照反应不进行逆转录(a-ve RT对照)。
例如,以Multiscript逆转录酶(ABI)和任意六聚引物,每一种组织可取 1μg总RNA,用来产生cDNA。为每种组织设立一个对照反应,在该对照反 应中除逆转录酶外加入全部组分(-ve RT对照)。每种组织的逆转录RNA样 品和负RT对照都进行PCR反应。根据本文提供的序列信息,很容易设计对 INSP113、INSP114、INSP115、INSP116和INSP117有特异性的引物。逆转 录样品中存在正确分子量的产物加上负RT对照中不存在产物,都可以看成 是该组织存在转录物的证据。任何合适的cDNA文库都可用来筛选 INSP113、INSP114、INSP115、INSP116和INSP117转录物,而不仅仅是按 上述方法产生的cDNA文库。
INSP113、INSP114、INSP115、INSP116和INSP117多肽的组织分布型 式提供了关于这些多肽功能的其它有用信息。
此外,也可用以下载体进行其它实验:pCR4-TOPO-INSP113(图18)、 pCR4-TOPO-INSP113sv(图19)、pDONR(图20)、pEAK12d(图21)、 pDEST12.2(图22)、pENTR-INSP113-6HIS(图23)、pENTR-INSP113sv-6HIS (图24)、pEAK12d-INSP113-6HIS(图25)、pEAK12d-INSP113sv-6HIS(图 26)、pDEST12.2-INSP113-6HIS(图27)、pDEST12.2-INSP113sv-6HIS(图 28)、pCR4-TOPO-INSP114(图31)、pCR4-TOPO-INSP114-GR1(图35)、 pCR4-TOPO-INSP114-SV2(图36)、pDONR 221(图38)、pEAK12d(图39)、 pDEST12.2(图40)、pENTR_INSP114-6HIS(图41)、pEAK12d_INSP114- 6HIS(图42)、pDEST12.2_INSP114-6HIS(图43)、pENTR_INSP114-SV1- 6HIS(图44)、pEAK12d_INSP114-SV1-6HIS(图45)、pDEST12.2_INSP114- SV1-6HIS(图46)、pENTR_INSP114-SV2-6HIS(图47)、pEAK12d_INSP114- SV2-6HIS(图48)、pDEST12.2_INSP114-SV2-6HIS(图49)pDONR 221(图 51)、pEAK12d(图52)、pDEST12.2(图53)、pENTR_INSP115-6HIS(图 54)、pEAK12d_INSP115-6HIS(图55)、pDEST12.2_INSP115-6HIS(图56)、 pDONR 221(图58)、pEAK12d(图59)、pDEST12.2(图60)、 pENTR_INSP116-6HIS(图61)、pEAK12d_INSP116-6HIS(图62)、 pDEST12.2_INSP116-6HIS(图63)、pCRII-TOPO-INSP117(图66)、pDONR 221(图67)、pEAK12d(图68)、pDEST12.2(图69)、pENTR_INSP117-6HIS (图70)、pEAK12d_INSP117-6HIS(图71)和pDEST12.2_INSP117-6HIS(图 72)。运用这些载体转染哺乳动物细胞系能够使INSP113、INSP114、 INSP115、INSP116和INSP117多肽获得高水平表达,因而能够对 INSP113、INSP114、INSP115、INSP116和INSP117多肽的功能特点进行连 续研究。以下材料和方法是适合这些实验用的其中一个例子。
细胞培养基
表达埃-巴二氏病毒核抗原的人胚胎肾293细胞(HEK293-EBNA, Invitrogen)维持悬浮在无Ex-cell VPRO血清的培养基中(种子储备,维持培养 基,JRH)。转染前16至20小时(第1天),将细胞接种在2x T225烧瓶中(每 个烧瓶50毫升,接种在含有2%FBS移种培养基(JRH)的DMEM/F12(1∶1) 中,密度为2×105个细胞/毫升)。第二天(转染第0天),用JetPEITM试剂进行 转染(2μl/μg质粒DNA,PolyPlus-transfection转染试剂)。每个烧瓶中,质粒 DNA与GFP(萤光报导基因)DNA共转染。再将转染混合物加入2x T225烧 瓶中,37℃(5%CO2)培育6天。在第1和第6天进行定性萤光检验,确认阳 性转染(Axiovert 10 Zeiss)。
在第6天(收获天),将两个烧瓶中的上清液(100ml)合并,离心(4℃, 400g),并置于带有独特鉴定器的器皿内。保留一等分试样(500μl),对6His 标签蛋白作QC(内部生物加工QC)。
参照BP/PEI/HH/02/04中称之“悬浮细胞PEI转染”的方案,以 Polysciences的聚乙烯亚胺为转染剂进行放大批量生产。
纯化方法
含有C端带6His标签的重组蛋白质的培养基样品用冷冻缓冲液A(50 mM磷酸二氢钠;600mM氯化钠;8.7%(重量/体积)甘油,pH 7.5)稀释。样 品经无菌过滤器(Millipore)过滤,4℃储存于无菌方形培养瓶中(Nalgene)。
4℃下用连接到样品自动装载器(Labomatic)的VISION工作站(Applied Biosystems)进行纯化。纯化程序由两个连续步骤组成:在装有镍离子的 Poros 20MC(Applied Biosystems)柱(4.6×50mm,0.83ml)上进行金属亲和力 层析,再在Sephadex G-25培养(Amersham Pharmacia)柱(1.0×10cm)上进行凝 胶过滤。
第一个层析步骤的金属亲和柱用30柱体积的EDTA溶液(100mM EDTA;1M NaCl;pH 8.0)再生,用15柱体积的100mM硫酸镍溶液洗涤重 新装载镍离子,用10柱体积的缓冲液A和7柱体积的缓冲液B(50mM磷酸 二氢钠;600mM氯化钠;8.7%(重量/体积)400mM甘油;咪唑,pH 7.5)洗 涤,最后用15柱体积含15mM咪唑的缓冲液A平衡。样品用Labomatic的 样品装载器转移到200毫升定量环,然后以10ml/min的速率装到镍金属亲 和柱上。亲和柱再用12柱体积的缓冲液A和28柱体积含20mM咪唑的缓 冲液A洗涤。在20mM咪唑洗涤期间,附着比较松散的污染蛋白质从柱中 洗脱出来。重组的His标签蛋白质最后用10柱体积的缓冲液B洗脱,流速 为2ml/min,收集洗脱出来的蛋白质。
第二层析步骤的Sephadex G-25凝胶过滤柱用2毫升缓冲液D(1.137M 氯化钠;2.7mM氯化;1.5mM磷酸二氢钾;8mM磷酸二氢钠;pH 7.2) 再生,然后用4柱体积的缓冲液C(137mM氯化钠;2.7mM氯化钾;1.5 mM磷酸二氢钾;8mM磷酸二氢钠;20%(重量/体积)甘油;pH 7.4)平衡。 从镍柱洗脱出来的峰值馏分自动通过连接到VISION的整合型样品装载器装 在Sephadex G-25柱上,蛋白质用缓冲液C洗脱,流速为2ml/min。该馏分 经过无菌离心过滤器(Millipore)过滤,冻存于-80℃。取样品的一等分试样以 SDS-PAGE(4-12%NuPAGE凝胶;Novex)Western印迹和抗His抗体进行分 析。NuPAGE凝胶可用0.1%考马斯亮蓝R250染色溶液(30%甲醇,10%乙 酸)室温染色1小时,然后用20%甲醇,7.5%乙酸去色,直至背景澄清,蛋 白质带清晰可见。
电泳后将蛋白质从凝胶电转移到硝基纤维素膜上。室温下用5%在缓冲 液E(137mM氯化钠;2.7mM氯化钾;1.5mM磷酸二氢钾;8mM磷酸二 氢钠;0.1%Tween 20,pH 7.4)中的奶粉封闭纤维素膜1小时,再于4℃在 缓冲液E中的2.5%奶粉中与2种兔多克隆抗His抗体(G-18和H-15,各0.2 μg/ml;Santa Cruz)混合物培养过夜。室温再培养1小时之后,膜用缓冲液 E(3×10分钟)洗涤,再与结合HRP的第二抗兔抗体(DAKO,HRP 0399)室温 培养2小时,第二抗体用含2.5%奶粉的缓冲液E稀释至1/3000。用缓冲液 E(3×10分钟)洗涤之后,膜用ECL试剂盒(Amersham Pharmacia)显影1分 钟。然后,将膜与超膜(Hyperfilm)(Amersham Pharmacia)接触,使超膜显 影,对Western印迹影像作目测分析。
对于由考马斯亮蓝染色检测到蛋白质带的样品,采用BCA蛋白质测定 试剂盒(Pierce)可确定它们所含蛋白质的浓度,以牛血清白蛋白为标准。
此外,细胞系中多肽过度表达或表达下调都可用来确定转录激活对宿主 细胞基因组的影响。把免疫沉淀法与Western印迹分析结合以及免疫沉淀法 与质谱结合,都可鉴定INSP113、INSP114、INSP115、INSP116和INSP117 多肽的二聚配偶体、共激活剂和共抑制剂。
实施例18-与凝血因子X相似的生物活性的检测试验
1.针对T淋巴细胞应答的试验
Fas-配体诱导的T细胞死亡
此试验将会揭示受体介导的细胞死亡的新调节剂。
在此试验中,用重组6 HIS标签的Fas配体与单克隆抗6-his抗体一起 刺激Jurkat细胞(人T细胞系),诱导T细胞凋亡。以LDH的释放(当细胞死 亡时培养基放出的一种胞质酶)来量化死亡。在色度分析490nm处读出读 数。已经知道,T细胞在许多自身免疫疾病中起致病作用,其中一种治疗策 略是能够控制抗原特异性T细胞死亡(例如,用抗-TNFα治疗克罗恩氏病病 人)。
人-MLR:增殖和细胞因子分泌
这一基于细胞的试验测定新蛋白质对淋巴细胞增殖和细胞因子分泌,或 者对来自另一供体的PBMC刺激后的抑制(同种异体反应性)的作用。此试验 说明了抗原特异性T细胞和抗原呈递细胞功能,它们在任何自身免疫疾病中 都是重要的细胞应答。以CBA量化分泌因子(IL-2、4、5、10、TNF-α和 IFN-γ)。
注意:增殖和细胞因子分泌都是独立应答。
小鼠-MLR:增殖
这一基于细胞的试验测定新蛋白质对淋巴细胞增殖或对来自另一供体 (小鼠菌株)的脾细胞刺激后的小鼠脾细胞抑制的作用。此基于细胞的试验测 定新蛋白质对T淋巴细胞和抗原呈递细胞应答的作用,可用来确认h-MLR 试验中鉴定的阳性和击中目标的活性。这一试验也可用来选择在人疾病小鼠 模型中使用的测试蛋白质。
用超抗原TSST刺激人PBMC
超抗原是影响T细胞的强免疫系统调节剂。超抗原影响免疫系统介导的 疾病,例如IBD、特应性皮炎和银屑病等炎症性皮肤病。在该细胞试验中, 我们特别针对通过TCB引致的T淋巴细胞激活,但与T细胞对典型抗原的 应答(尤其是共刺激分子)的要求不同。
用ConA或PHA刺激人PBMC
这些基于细胞的试验测定新蛋白质对细胞因子分泌的作用,所述细胞因 子分泌由作用于不同细胞的两个不同刺激物所诱导,由细胞因子珠子阵列 (CBA)试验(IL-2、IFN-γ、TNF-α、IL-5、IL-4和IL-10)测定出。
大多数细胞因子都有双重作用,促炎性或抗炎性,取决于受伤、周围和 细胞目标。任何能够调节细胞因子分泌的蛋白质都具有潜在治疗作用(例 如,降低IFN-γ和TNF-α水平对Th1-介导的自身免疫疾病有有益的效果,而 降低IL-4、IL-5可能对Th2-介导的疾病有有益的效果,诱导IL-10对多发性 硬化症和全身性红斑狼疮可能有利)。
2.针对单核细胞/巨噬细胞和粒细胞应答的试验
用LPS刺激人PBMC
这一基于细胞的试验测定新蛋白质对LPS诱导的细胞因子分泌(IFN-γ、 TNF-α)的作用,所述细胞因子作用于单核细胞/巨噬细胞和粒细胞。
任何能够调节IFN-γ和TNF-α分泌的蛋白质都对Th1-介导的自身免疫疾 病有有益的效果。
3.针对嗜中性粒细胞应答的试验
嗜中性粒细胞在炎症性疾病和自身免疫疾病(例如类风湿关节炎)中起着 重要作用。白细胞趋化细胞因子如IL-8启动细胞与微血管内皮之间一系列 附着相互作用,导致嗜中性粒细胞激活、附着,最后迁移。嗜中性粒细胞的 组织浸润取决于细胞骨架元件改组,所述元件与这些细胞的细胞形态特异性 改变相关。
这一基于细胞的试验测定新蛋白质对人嗜中性粒细胞的细胞骨架改组的 作用。
4.针对B淋巴细胞应答的试验
一般认为,自身抗体和浸润B细胞在各种自身免疫疾病中起着重要作 用,例如全身性红斑狼疮(SLE)、类风湿关节炎、斯耶格伦氏综合征和重肌 症无力。引人注目的证据显示,B细胞自身平衡不受调节可能影响免疫耐受 性,导致产生致病抗体与长期发炎的自身反应性B细胞不适当地存活。对触 发B细胞受体后调节B细胞增殖、存活和分化发挥关键作用的新颖因子进 行鉴定,与开发新的治疗方法密切相关。
B细胞增殖
这一基于细胞的试验测定新蛋白质对B细胞存活的作用。
B细胞共刺激
这一基于细胞的试验测定新蛋白质对B细胞共刺激的作用。
5.针对单核细胞和小胶质细胞应答的试验
THP-1钙离子流量
THP1-细胞内Ca+流量的试验测定新蛋白质对它们触发内质网释放胞内 钙离子(普遍第二信使事件)的能力的作用。
6.小胶质细胞增殖(呈递到下一个IAC)
已经知道,在小胶质祖细胞增殖过程中,包括一些细胞因子在内的很多 集落刺激因子起着关键作用。其中,M-CSF对巨噬细胞/小胶质细胞成熟的 最后步骤是至关重要的,任何其它因子都无法取代。对该生物应答进行评 估,是评价影响小胶质细胞活性的一种方法,因此,也是鉴定有可能治疗 MS的分子的一个机会。
研究这一基于细胞的试验,以便测定小胶质细胞系对M-CSF的增殖应 答。可行性和可靠性阶段都获得最佳结果。该试验在96孔板内进行,需要 无放射活性物质,容易自动操作。
7.检测细胞因子样活性的试验
关于结构-活性关系的研究表明,细胞因子利用氨基酸末端区来结合和 激活受体。蛋白水解消化、突变形成、或针对该区氨基酸的化学修饰都能够 产生具有拮抗活性的化合物(Loetscher P and Clark-Lewis I,J Leukoc Biol, 69:881-884,2001Lambeir A等人,J Biol Chem,276:29839-29845, 2001,Proost P等人,Blood,98(13):3554-3561,2001)。故一般认为,对 相应细胞因子的氨基酸末端区或其它区内一个或多个残基作特异性修饰(缺 失、非保守性取代)而获得的拮抗分子,具有治疗炎症疾病和自身免疫疾病 的潜在能力(WO 02/28419;WO 00/27880;WO 99/33989;Schwarz MK and Wells TN,Curr Opin Chem Biol,3:407-17,1999)。所以,本专利申请的另 一个目的在于通过修饰本发明的多肽产生这样一类拮抗剂。
本发明多肽和相关试剂的治疗应用可通过动物细胞、组织和模型的体内 /体外试验(Coleman RA等人,Drug Discov Today,6:1116-1126,2001;Li AP,Drug Discov Today,6:357-366,2001;Methods Mol.Biol vol.138, “Chemokines Protocols”,edited by Proudfoot AI等人,Humana Press Inc., 2000;Methods Enzymol,vol.287and 288,Academic Press,1997),或者通 过电脑环境(in silico)/计算方法(Johnson DE and Wolfgang GH,Drug Discov Today,5:445-454,2000)来进行评价,它们都是公知的药物发现和临床前 研究期间确认细胞因子及其它生物产物的方法。
本专利申请公开了一些新颖的细胞因子样多肽和一系列相关的试剂,它 们可用作以适当方法配制的药物组合物的活性成分,所述药物组合物用于治 疗或预防诸如细胞增殖性疾病、自身免疫/炎症疾病、心血管疾病、神经系 统疾病、发育障碍、代谢性疾病、感染和其他病理病症等疾病。具体地说, 基于细胞因子的已知特性,本发明公开的多肽和试剂应该可以治疗涉及异常 或缺陷细胞迁移的病症。非限制性地,这些病症是:关节炎、类风湿性关节 炎(RA)、关节银屑病、骨关节炎、全身性红斑狼疮(SLE)、全身性硬化症、 硬皮病、多肌炎、肾小球性肾炎、纤维化、肺纤维化和发炎、过敏性或超敏 性疾病、皮炎、哮喘、慢性阻塞性肺病(COPD)、炎症性肠病(IBD)、克罗恩 氏病、溃疡性结肠炎、多发性硬化症、脓毒性休克、HIV感染、移植排斥、 伤口愈合、转移、子宫内膜异位、肝炎、肝纤维化、癌症、痛觉丧失、动脉 粥样硬化相关的血管发炎。 确认和表征细胞因子样多肽的细胞和动物试验
已经开发了多个试验,以细胞培养基或动物模型,例如体内趋化性试验 (Proudfoot A等人,J Biol Chem 276:10620-10626,2001;Lusti-Narasimhan M等人,J Biol Chem,270:2716-21,1995),或者小鼠耳朵肿胀(Garrigue JL等人,Contact Dermatitis,30:231-7,1994),测试细胞因子的特异性、 效能和效率。关于细胞因子的综述和书籍(Methods Mol.Biol vol.138, “Chemokines Protocols”,edited by Proudfoot AI等人,Humana Press Inc., 2000;Methods Enzymol,vol.287 and 288,Academic Press,1997)已经描述 了很多产生有用工具和产物(抗体、转基因动物、放射标记蛋白等)的其它试 验和技术,它们可用来较准确地确认与可能的治疗或诊断方法及应用有关的 本发明细胞因子样多肽及相关试剂的生物活性。
细胞因子表达调节试验
1.简介
以下基于细胞的体内三重复制试验测定本发明蛋白质对细胞因子分泌的 作用,所述细胞因子分泌由作用于不同人外周血单核细胞(hPBMC)的伴刀豆 球蛋白A(Con A)诱导,由IL-2、IFN-γ、TNF-α、IL-5、IL-4和IL-10的细胞因 子珠子阵列(CBA)试验测定出。
最佳条件是96孔板上每孔100,000个细胞,终体积100μl,在2%甘油 中。
最佳有丝分裂原(ConA)浓度是5ng/ml。
最佳试验时间是48小时。
读数选择CBA。
2设备和软件
·96孔微滴定板光度计EX(Labsystem).
·Graph Pad Prism软件
·Excel软件
·流式细胞仪Becton-Dickinson
·CBA分析软件
·细胞培养基罩
·细胞培养基的培养器皿
·离心分离机
·吸液管
3.材料和试验
·血沉棕黄层(Buffy coat)
·DMEM GIBCO
·人血清型AB SIGMA
·L-谷氨酰胺GIBCO
·青霉素-链霉素GIBCO
·Ficoll PHARMACIA
·细胞培养基用的96孔微滴定板COSTAR
·伴刀豆球蛋白A SIGMA
·人Th1/Th2细胞因子CBA试剂盒Becton-Dickinson
·PBS GIBCO
·FALCON 50ml无菌培养皿Becton-Dickinson
·BSA SIGMA
·甘油MERCK
·DMSO SIGMA
·96孔锥形底微滴定板NUNC
4方法
4.1血沉棕黄层的人PBMC的纯化
用DMEM稀释血沉棕黄层1至2。然后在50ml Falcon试管内的15ml Ficoll层中缓慢加入25ml稀释的血液,试管离心(2000rpm,20min,室 温,无制动器)。然后收集界面(环),细胞用25ml DMEM洗涤,然后离心 (1200rpm,5min)。这一程序重复三次。由血沉棕黄层获得大约600×106总 细胞。
4.2筛选
将80μl 1.25×106细胞/ml用DMEM+2.5%人血清+1%L-谷氨酰胺+1% 青霉素-链霉素稀释,然后加入到96孔微滴定板上。
每孔加入10μl(每孔一种条件):蛋白质用PBS+20%甘油稀释(蛋白质终 稀释浓度为1/10)。
然后,每孔再加入10μl ConA刺激剂(每孔一种条件):
-ConA 50μg/ml(ConA终浓度为5μg/ml)
48小时后,收集细胞上清液,运用人Th1/Th2细胞因子CBA试剂盒 (Becton-Dickinson)测定人细胞因子。
4.3CBA分析
(详细情况参见CBA试剂盒说明书小册子)
i)人Th1/Th2混合捕获珠的制备
确定实验所需的分析试管数目。
混合前,使各捕获珠悬液强烈旋涡几秒钟。在每个分析试验中,每种捕 获珠取10μl等分试样,加入到一个标有“混合捕获珠”的试管内。使捕获珠 混合物彻底旋涡。
ii)测试样品的制备
上清液用试验稀释剂(20μl上清液+60μl试验稀释剂)稀释(1∶4)。先把 样品稀释溶液混合,再将样品转移到96孔锥形底微滴定板(Nunc)。
iii)人Th1/Th2细胞因子CBA试验步骤
取50μl稀释上清液,加入到96孔锥形底微滴定板(Nunc)上。然后加入 50μl混合捕获珠,再加入50μl人Th1/Th2 PE检测试剂。该96孔板室温培 育3小时,避免直接暴露于光中,然后1500rpm离心5分钟。小心地弃掉上 清液。在下一步骤中,每孔加入200μl洗涤缓冲液,二次,然后1500rpm离 心5分钟,小心地弃掉上清液。之后,向每孔加入130μl洗涤缓冲液,重悬 捕获珠沉淀物。最后用流式细胞仪分析样品。利用CBA应用软件、活性碱 基(Activity Base)和微软Excel软件分析数据。
由分析试剂盒的读数可以评价,本发明的蛋白质是否在体外对全部测试 细胞因子(IFN-γ、TNF-α、IL-2、IL-4、IL-5、IL-10)始终产生抑制作用。
此外,根据EC50数值,可轻易评价哪一种细胞因子被抑制得最好,然 后到达与该细胞因子有关的特定自身免疫/炎症疾病。
序列:
SEQ ID 1:(INSP113全核苷酸序列)
  1  ATGGCAATGG TCTCTGCGAT GTCCTGGGTC CTGTATTTGT GGATAAGTGC TTGTGCAATG
 61  CTACTCTGCC ATGGATCCCT TCAGCACACT TTCCAGCAGC ATCACCTGCA CAGACCAGAA
121  GGAGGGACGT GTGAAGTGAT AGCAGCACAC CGATGTTGCA ACAAGAATCG CATTGAGGAG
181  CGGTCACAAA CAGTAAAGTG TTCCTGTCTA CCTGGAAAAG TGGCTGGAAC AACAAGAAAC
241  CGGCCTTCTT GCGTCGATGC CTCCATAGTG ATTTGGAAAT GGTGGTGTGA GATGGAGCCT
301  TGCCTAGAAG GAGAAGAATG TAAGACACTC CCTGACAATT CTGGATGGAT GTGCGCAACA
361  GGCAACAAAA TTAAGACCAC GAGAATTCAC CCAAGAACCT AA
SEQ ID 2:(INSP113全FASTA序列;INSP113[人]CAD28501.1假定蛋白)
  1  MAMVSAMSWV LYLWISACAML LCHGSLQHTFQ QHHLHRPEG GTCEVIAAH RCCNKNRIEE
 61  RSQTVKCSCL PGKVAGTTRNR PSCVDASIVIW KWWCEMEPC LEGEECKTL PDNSGWMCAT
121  GNKIKTTRIH PRT
SEQ ID 3:(INSP113成熟核苷酸序列)
  1  TCCCTTCAGC ACACTTTCCA GCAGCATCAC CTGCACAGAC CAGAAGGAGG GACGTGTGAA
 61  GTGATAGCAG CACACCGATG TTGCAACAAG AATCGCATTG AGGAGCGGTC ACAAACAGTA
121  AAGTGTTCCT GTCTACCTGG AAAAGTGGCT GGAACAACAA GAAACCGGCC TTCTTGCGTC
181  GATGCCTCCA TAGTGATTTG GAAATGGTGG TGTGAGATGG AGCCTTGCCT AGAAGGAGAA
241  GAATGTAAGA CACTCCCTGA CAATTCTGGA TGGATGTGCG CAACAGGCAA CAAAATTAAG
301  ACCACGAGAA TTCACCCAAG AACCTAA
SEQ ID 4:(INSP11成熟多肽序列)
  1  SLQHTFQQHH LHRPEGGTCE VIAAHRCCNK NRIEERSQTV KCSCLPGKVA GTTRNRPSCV
 61  DASIVIWKWW CEMEPCLEGE ECKTLPDNSG WMCATGNKIK TTRIHPRT
SEQ ID 5:(INSP114全核苷酸序列)
  1  ATGAGTAAGA GATACTTACA GAAAGCAACA AAAGGAAAAC TGCTAATAAT AATATTTATT
 61  GTAACCTTGT GGGGGAAAGT TGTATCCAGT GCAAACCATC ATAAAGCTCA CCATGTTAAA
121  ACGGGAACTT GTGAGGTGGT GGCACTCCAC AGATGCTGTA ATAAGAACAA GATAGAAGAA
181  CGGTCACAAA CAGTCAAGTG CTCCTGCTTC CCTGGGCAGG TGGCAGGCAC CACGCGAGCT
241  GCTCCATCAT GTGTGGATGC TTCAATAGTG GAACAGAAAT GGTGGTGCCA TATGCAGCCA
301  TGTCTAGAGG GAGAAGAATG TAAAGTTCTT CCGGATCGGA AAGGATGGAG CTGTTCCTCT
361  GGGAATAAAG TCAAAACAAC TAGGGTAACC CATTAA
SEQ ID 6:(INSP114全FASTA序列;INSP114[人]CAD38865.1人多肽)
  1  MSKRYLQKAT KGKLLIIIFI VTLWGKVVSS ANHHKAHHVK TGTCEVVALH CCNKNKIEER
 61  SQTVKCSCFP GQVAGTTRAA PSCVDASIVE QKWWCHMQPC LEGEECKVLP DRKGWSCSSG
121  NKVKTTRVTH
SEQ ID 7:(INSP 114成熟核苷酸序列)
  1  GCAAACCATC ATAAAGcTCA CCATGTTAAA ACGGGAACTT GTGAGGTGGT GGCACTCCAC
 61  AGATGCTGTA ATAAGAACAA GATAGAAGAA CGGTCACAAA CAGTCAAGTG CTCCTGCTTC
121  CCTGGGCAGG TGGCAGGCAC CACGCGAGCT GCTCCATCAT GTGTGGATGC TTCAATAGTG
181  GAACAGAAAT GGTGGTGCCA TATGCAGCCA TGTCTAGAGG GAGAAGAATG TAAAGTTCTT
241  CCGGATCGGA AAGGATGGAG CTGTTCCTCT GGGAATAAAG TCAAAACAAC TAGGGTAACC
301  CATTAA
SEQ ID 8:(INSP 114成熟多肽序列)
  1  ANHHKAHHVK TGTCEVVALH RCCNKNKIEE RSQTVKCSCF PGQVAGTTRA APSCVDASIV
 61  EQKWWCHMQP CLEGEECKVL PDRKGWSCSS GNKVKTTRVT H
SEQ ID 9:(INSP115全核苷酸序列)
  1  ATGGCGCCAT CGCCCAGGAC CGGCAGCCGG CAAGATGCGA CCGCCCTGCC CAGCATGTCC
 61  TCAACTTTCT GGGCGTTCAT GATCCTGGCC AGCCTGCTCA TCGCCTACTG CAGTCAGCTG
121  GCCGCCGGCA CCTGTGAGAT TGTGACCTTG GACCGGGACA GCAGCCAGCC TCGGAGGACG
181  ATCGCCCGGC AGACCGCCCG CTGTGCGTGT AGAAAGGGGC AGATCGCCGG CACCACGAGA
241  GCCCGGCCCG CCTGTGTGGA CGCAAGAATC ATCAAGACCA AGCAGTGGTG TGACATGCTT
301  CCGTGTCTGG AGGGGGAAGG CTGCGACTTG TTAATCAACC GGTCAGGCTG GACGTGCACG
361  CAGCCCGGCG GGAGGATAAA GACCACCACG GTCTCCTGA
SEQ ID 10:(INSP115全FASTA序列INSP115[人]AAY53016人分泌性蛋白质克隆)
  1  MAPSPRTGSR QDATALPSMS STFWAFMILA SLLIAYCSQL AAGTCEIVTL DRDSSQPRRT
 61  IARQTARCAC RKGQIAGTTR ARPACVDARI IKTKQWCDML PCLEGEGCDL LINRSGWTCT
121  QPGGRIKTTT VS
SEQ ID 11:(INSP115成熟核苷酸序列)
  1  GGCACCTGTG AGATTGTGAC CTTGGACCGG GACAGCAGCC AGCCTCGGAG GACGATCGCC
 61  CGGCAGACCG CCCGCTGTGC GTGTAGAAAG GGGCAGATCG CCGGCACCAC GAGAGCCCGG
121  CCCGCCTGTG TGGACGCAAG AATCATCAAG ACCAAGCAGT GGTGTGACAT GCTTCCGTGT
181  CTGGAGGGGG AAGGCTGCGA CTTGTTAATC AACCGGTCAG GCTGGACGTG CACGCAGCCC
241  GGCGGGAGGA TAAAGACCAC CACGGTCTCC TGA
SEQ ID 12:(INSP115成熟多肽序列)
  1  GTCEIVTLDR DSSQPRRTIA RQTARCACRK GQIAGTTRAR PACVDARIIK TKQWCDMLPC
 61  LEGEGCDLLI NRSGWTCTQP GGRIKTTTVS
 SEQ ID 13:(INSP116全核苷酸序列)
  1  ATGAGGTCCC CAAGGATGAG AGTCTGTGCT AAGTCAGTGT TGCTGTCGCA CTGGCTCTTT
 61  CTAGCCTACG TGTTAATGGT GTGCTGTAAG CTGATGTCCG CCTCAAGCCA GCACCTCCGG
121  GGACATGCAG GTCACCACCA AATCAAGCAA GGGACCTGTG AGGTGGTCGC CGTGCACAGG
181  TGCTGCAATA AGAACCGCAT AGAAGAGCGG TCACAAACGG TCAAGTGCTC TTGCTTCCCG
241  GGACAGGTGG CGGGCACAAC TCGGGCTCAA CCTTCTTGTG TTGAAGCTTC CATTGTGATT
301  CAGAAATGGT GGTGTCACAT GAATCCGTGT TTGGAAGGAG AGGATTGTAA AGTGCTGCCA
361  GATTACTCAG GTTGGTCCTG TAGCAGTGGC AATAAAGTCA AAACTACGAA GGTAACGCGG
421  TAG
SEQ ID 14:(INSP116全FASTA序列;INSP116[人]XP_087261.1假定蛋白)
  1  MRSPRMRVCA KSVLLSHWLF LAYVLMVCCK LMSASSQHLR GHAGHHQIKQ GTCEVVAVHR
 61  CCNKNRIEER SQTVKCSCFP GQVAGTTRAQ PSCVEASIVI QKWWCHMNPC LEGEDCKVLP
121  DYSGWSCSSG NKVKTTKVTR
 SEQ ID 15:(INSP116成熟核苷酸序列)
  1  TCAAGCCAGC ACCTCCGGGG ACATGCAGGT CACCACCAAA TCAAGCAAGG GACCTGTGAG
 61  GTGGTCGCCG TGCACAGGTG CTGCAATAAG AACCGCATAG AAGAGCGGTC ACAAACGGTC
121  AAGTGCTCTT GCTTCCCGGG ACAGGTGGCG GGCACAACTC GGGCTCAACC TTCTTGTGTT
181  GAAGCTTCCA TTGTGATTCA GAAATGGTGG TGTCACATGA ATCCGTGTTT GGAAGGAGAG
241  GATTGTAAAG TGCTGCCAGA TTACTCAGGT TGGTCCTGTA GCAGTGGCAA TAAAGTCAAA
301  ACTACGAAGG TAACGCGGTA G
SEQ ID 16:(INSP116成熟多肽序列)
  1  SSQHLRGHAG HHQIKQGTCE VVAVHRCCNK NRIEERSQTV KCSCFPGQVA GTTRAQPSCV
 61  EASIVIQKWW CHMNPCLEGE DCKVLPDYSG WSCSSGNKVK TTKVTR
SEQ ID 17:(INSP117核苷酸序列:外显子1)
  1  ATGAGTGAGA GGGTCGAGCG GAACTGGAGC ACGGGCGGCT GGCTGCTGGC ACTGTGCCTG
 61  GCCTGGCTGT GGACCCACCT GACCTTGGCT GCCTTGCAGC CTCCCACTGC CACAG
SEQ ID 18:(INSP117蛋白质序列:外显子1)
  1  MSERVERNWS TGGWLLALCL AWLWTHLTLA ALQPPTATV
SEQ ID 19:(INSP117核苷酸序列:外显子2)
  1  TGCTTGTGCA GCAGGGCACC TGCGAGGTGA TTGCGGCTCA CCGCTGCTGC AACCGGAACC
 61  GCATCGAGGA GCGCTCCCAG ACGGTGAAAT GCTCCTGTTT TTCTGGCCAG GTGGCCGGCA
121  CCACGCGGGC AAAGCCCTCC TGCGTGGACG
SEQ ID 20:(INSP117蛋白质序列:外显子2)
  1  LVQQGTCEVI AAHRCCNRNR IEERSQTVKC SCFSGQVAGT TRAKPSCVDA
SEQ ID 21:(INSP117核苷酸序列:外显子3)
  1  CCTCCATCGT CCTGCAGAGA TGGTGGTGTC AGATGGAGCC CTGCCTGCCG GGGGAGGAGT
 61  GTAAGGTGCT CCCGGACCTG TCGGGATGGA GCTGCAGCAG TGGACACAAA GTCAAAACCA
121  CCAAG
SEQ ID 22:(INSP117蛋白质序列:外显子3)
  1  SIVLQRWWCQ MEPCLPGEEC KVLPDLSGWS CSSGHKVKTT K
SEQ ID 23:(INSP117核苷酸序列:外显子4)
  1  GTCACACGAT AG
SEQ ID 24:(INSP117蛋白质序列:外显子4)
  1  VTR
SEQ ID 25:(INSP117全编码序列)
  1  ATGAGTGAGA GGGTCGAGCG GAACTGGAGC ACGGGCGGCT GGCTGCTGGC ACTGTGCCTG
 61  GCCTGGCTGT GGACCCACCT GACCTTGGCT GCCTTGCAGC CTCCCACTGC CACAGTGCTT
121  GTGCAGCAGG GCACCTGCGA GGTGATTGCG GCTCACCGCT GCTGCAACCG GAACCGCATC
181  GAGGAGCGCT CCCAGACGGT GAAATGCTCC TGTTTTTCTG GCCAGGTGGC CGGCACCACG
241  CGGGCAAAGC CCTCCTGCGT GGACGCCTCC ATCGTCCTGC AGAGATGGTG GTGTCAGATG
301  GAGCCCTGCC TGCCGGGGGA GGAGTGTAAG GTGCTCCCGG ACCTGTCGGG ATGGAGCTGC
361  AGCAGTGGAC ACAAAGTCAA AACCACCAAG GTCACACGAT AG
SEQ ID 26:(INSP117完整蛋白质序列)
  1  MSERVERNWS TGGWLLALCL AWLWTHLTLA ALQPPTATVL VQQGTCEVIA AHRCCNRNRI
 61  EERSQTVKCS CFSGQVAGTT RAKPSCVDAS IVLQRWWCQM EPCLPGEECK VLPDLSGWSC
121  SSGHKVKTTK VTR
SEQ ID 27:(INSP117成熟核苷酸序列外显子1)
  1  GCCTTGCAGC CTCCCACTGC CACAG
SEQ ID 28:(INSP117成熟多肽序列外显子1)
  1  ALQPPTATV
SEQ ID 29:(INSP117成熟核苷酸序列)
  1  GCCTTGCAGC CTCCCACTGC CACAGTGCTT GTGCAGCAGG GCACCTGCGA GGTGATTGCG
 61  GCTCACCGCT GCTGCAACCG GAACCGCATC GAGGAGCGCT CCCAGACGGT GAAATGCTCC
121  TGTTTTTCTG GCCAGGTGGC CGGCACCACG CGGGCAAAGC CCTCCTGCGT GGACGCCTCC
181  ATCGTCCTGC AGAGATGGTG GTGTCAGATG GAGCCCTGCC TGCCGGGGGA GGAGTGTAAG
241  GTGCTCCCGG ACCTGTCGGG ATGGAGCTGC AGCAGTGGAC ACAAAGTCAA AACCACCAAG
301  GTCACACGAT AG
SEQ ID 30:(INSP117成熟多肽序列)
  1  ALQPPTATVL VQQGTCEVIA AHRCCNRNRI EERSQTVKCS CFSGQVAGTT RAKPSCVDAS
 61  IVLQRWWCQM EPCLPGEECK VLPDLSGWSC SSGHKVKTTK VTR
SEQ ID 31:(染色体6上小鼠直向同源物的Inpharmatica预测序列)
  1  MRVCAKWVLL SRWLVLTYVL MVCCKLMSAS SQHLRGHAGH HLIKPGTCEV VAVHRCCNKN
 61  RIEERSQTVK CSCFPGQVAG TTRAQPSCVE AAIVIEKWWC HMNPCLEGED CKVLPDSSGW
121  SCSSGNKVKT TKAS
SEQ ID 32:(染色体10上小鼠直向同源物的Inpharmatica预测序列)
  1  MNKRYLQKAT QGKLLIIIFI VTLWGKAVSS ANHHKAHHVR TGTCEVVALH RCCNKNKIEE
 61  RSQTVKCSCF PGQVAGTTRA APSCVDASIV EQKWWCHMQP CLEGEECKVL PDRKGWSCSS
121  GNKVKTTRVT H
SEQ ID 33:(染色体2上大鼠直向同源物的Inpharmatica预测序列)
  1  MAERSTSNWS PGSWVLALCL AWLWTRLASA SLQPPTSTVK QGTCEVIAAH RCCNRNRIEE
 61  RSQTVKCSCL SGQVAGTTRA KPSCVDASIV LQKWWCQMEP CLLGEECKVL PDLSGWSCSR
121  GHKVKTTKVL RWT
SEQ ID 34:(染色体4上大鼠直向同源物的Inpharmatica预测序列)
  1  MTMVSAMSWV LYLWISACAM LLCHGSLQHT FQQHHLHRPE GGTCEVIAAH RCCNKNRIEE
 61  RSQTVKCSCL PGKVAGTTRN RPSCVDASIV IGKWWCEMEP CLEGEECKTL PDNSGWMCAT
121  GNKIKTTRVS P
SEQ ID 35:(基因组DNA scaffold 3581上河鲀直向同源物的Inpharmatica预测序列)
  1  MNVIRSVRPS HWGLLLLCTA AFCSQLVATG NQSSRGQRGS EQERTGTCEV VAAHRCCNKN
 61  KIEERSQTVK CSCFPGQVAG TTRALPSCVD ASIVRQKWWC NMEPCVVGEE CRVLPDLTGW
121  SCISGNKVKT TKVSRGAALV VKKPNRTSLQ CRI
 SEQ ID NO:36:(INSP 113sv核苷酸序列)
  1  ATGGCAATGG TCTCTGCGAT GTCCTGGGTC CTGTATTTGT GGATAAGTGC TTGTGCAATG
 61  CTACTCTGCC ATGGATCCCT TCAGCACACT TTCCAGCAGC ATCACCTGCA CAGACCAGGT
121  GCAGAGCAAA ACCAGTGTGG CTGGAAAGGA GAAAGAAGGA AAGGGGGCTT CAAGCAAGAT
181  CATGTGCATT GTCAGACTTC AGATCATCCA AGGCCT
SEQ ID NO:37:(INSP 113sv多肽序列)
  1  MAMVSAMSWV LYLWISACAM LLCHGSLQHT FQQHHLHRPG AEQNQCGWKG ERRKGGFKQD
 61  HVHCQTSDHP RP
SEQ ID NO:38:(INSP113sv成熟核苷酸序列)
  1  TCCCTTCAGC ACACTTTCCA GCAGCATCAC CTGCACAGAC CAGGTGCAGA GCAAAACCAG
 61  TGTGGCTGGA AAGGAGAAAG AAGGAAAGGG GGCTTCAAGC AAGATCATGT GCATTGTCAG
121  ACTTCAGATC ATCCAAGGCC T
SEQ ID NO:39:(INSP113sv成熟多肽序列)
  1  SLQHTFQQHH LHRPGAEQNQ CGWKGERRKG GFKQDHVHCQ TSDHPRP
SEQ ID NO:40:(INSP114-SV2核苷酸序列)
  1  ATGAGTAAGA GATACTTACA GAAAGCAACA AAAGGAAAAC TGCTAATAAT AATATTTATT
 61  GTAACCTTGT GGGGGAAAGT TGTATCCAGT GCAAACCATC ATAAAGCTCA CCATGTTAAA
121  ACGGGAACTT GTGAGGTGGT GGCACTCCAC AGATGCTGTA ATAAGAACAA GATAGAAGAA
181  CGGTCACAAA CAGTCAAGTG CTCCTGCTTC CCTGGGCAGG TGGCAGGCAC CACGCGAGCT
241  GCTCCATCAT GTGTGGATGC TTCAATAGTG GAACAGAAAT GGTGGTGCCA TATGCAGCCA
301  TGTCTAGAGG GAGAAGAATG TAAAGTTCTT CCGGATCGGA AAGGATGGAG CTGTTCCTCT
361  GGGAATAAAG TCAAAACAAC TAGGTGGTGA
SEQ ID NO:41:(INSP114-SV2多肽序列)
  1  MSKRYLQKAT KGKLLIIIFI VTLWGKVVSS ANHHKAHHVK TGTCEVVALH RCCNKNKIEE
 61  RSQTVKCSCF PGQVAGTTRA APSCVDASIV EQKWWCHMQP CLEGEECKVL PDRKGWSCSS
121  GNKVKTTRW
SEQ ID NO:42:(INSP114-SV2成熟核苷酸序列)
  1  GCAAACCATC ATAAAGCTCA CCATGTTAAA ACGGGAACTT GTGAGGTGGT GGCACTCCAC
 61  AGATGCTGTA ATAAGAACAA GATAGAAGAA CGGTCACAAA CAGTCAAGTG CTCCTGCTTC
121  CCTGGGCAGG TGGCAGGCAC CACGCGAGCT GCTCCATCAT GTGTGGATGC TTCAATAGTG
181  GAACAGAAAT GGTGGTGCCA TATGCAGCCA TGTCTAGAGG GAGAAGAATG TAAAGTTCTT
241  CCGGATCGGA AAGGATGGAG CTGTTCCTCT GGGAATAAAG TCAAAACAAC TAGGTGGTGA
SEQ ID NO:43:(INSP114-SV2成熟多肽序列)
  1  ANHHKAHHVK TGTCEVVALH RCCNKNKIEE RSQTVKCSCF PGQVAGTTRA APSCVDASIV
 61  EQKWWCHMQP CLEGEECKVL PDRKGWSCSS GNKVKTTRW
 SEQ ID NO:44:(INSP115克隆核苷酸序列)
  1  ATGGCGCCAT CGCCCAGGAC CGGCAGCCGG CAAGATGCGA CCGCCCTGCC CAGCATGTCC
 61  TCAACTTTCT GGGCGTTCAT GATCCTGGCC AGCCTGCTCA TCGCCTACTG CAGTCAGCTG
121  GCCGCCGGCA CCTGTGAGAT TGTGACCTTG GACCGGGACA GCAGCCAGCC TCGGAGGACG
181  ATCGCCCGGC AGACCGCCCG CTGTGCGTGT AGAAAGGGGC AGATCGCCGG CACCACGAGA
241  GCCCGGCCCG CCTGTGTGGA CGCAAGAATC ATCAAGACCA AGCAGTGGTG TGACATGCTT
301  CCGTGTCTGG AGGGGGAAGG CTGCGACTTG TTAATCAACC GGTCAGGCTG GACGTGCACG
361  CAGCCCGGCG GGAGGATAAA GACCACCACG GTCTCCTGA
SEQ ID NO:45:(INSP115克隆多肽序列)
 1  MAPSPRTGSR QDATALPSMS STFWAFMILA SLLIAYCSQL AAGTCEIVTL DRDSSQPRRT
61  IARQTARCAC RKGQIAGTTR ARPACVDARI IKTKQWCDML PCLEGEGCDL LINRSGWTCT    121  QPGGRIKTTT VS
SEQ ID NO:46:(INSP115克隆成熟核苷酸序列)
  1  ACCTGTGAGA TTGTGACCTT GGACCGGGAC AGCAGCCAGC CTCGGAGGAC GATCGCCCGG
 61  CAGACCGCCC GCTGTGCGTG TAGAAAGGGG CAGATCGCCG GCACCACGAG AGCCCGGCCC
121  GCCTGTGTGG ACGCAAGAAT CATCAAGACC AAGCAGTGGT GTGACATGCT TCCGTGTCTG
181  GAGGGGGAAG GCTGCGACTT GTTAATCAAC CGGTCAGGCT GGACGTGCAC GCAGCCCGGC
241  GGGAGGATAA AGACCACCAC GGTCTCCTGA
SEQ ID NO:47:(INSP115克隆成熟多肽序列)
  1  TCEIVTLDRD SSQPRRTIAR QTARCACRKG QIAGTTRARP ACVDARIIKT KQWCDMLPCL
 61  EGEGCDLLIN RSGWTCTQPG GRIKTTTVS
 SEQ ID NO:48:(INSP116克隆核苷酸序列)
  1  ATGAGGTCCC CAAGGATGAG AGTCTGTGCT AAGTCAGTGT TGCTGTCGCA CTGGCTCTTT
 61  CTAGCCTACG TGTTAATGGT GTGCTGTAAG CTGATGTCCG CCTCAAGCCA GCACCTCCGG
121  GGACATGCAG GTCACCACCA AATCAAGCAA GGGACCTGTG AGGTGGTCGC CGTGCACAGG
181  TGCTGCAATA AGAACCGCAT AGAAGAGCGG TCACAAACGG TCAAGTGCTC TTGCTTCCCG
241  GGACAGGTGG CGGGCACAAC TCGGGCTCAA CCTTCTTGTG TTGAAGCTTC CATTGTGATT
301  CAGAA TGGT GGTGTCACAT GAATCCGTGT TTGGAAGGAG AGGATTGTAA AGTGCTGCCA
361  GATTACTCAG GTTGGTCCTG TAGCAGTGGC AATAAAGTCA AAACTACGAA GGTAACGCGG
421  TAG
SEQ ID NO:49:(INSP116克隆多肽序列)
  1  MRSPRMRVCA KSVLLSHWLF LAYVLMVCCK LMSASSQHLR GHAGHHQIKQ GTCEVVAVHR
 61  CCNKNRIEER SQTVKCSCFP GQVAGTTRAQ PSCVEASIVI QKWWCHMNPC LEGEDCKVLP
121  DYSGWSCSSG NKVKTTKVTR
SEQ ID NO:50:(INSP 116克隆成熟核苷酸序列)
  1  TCAAGCCAGC ACCTCCGGGG ACATGCAGGT CACCACCAAA TCAAGCAAGG GACCTGTGAG
 61  GTGGTCGCCG TGCACAGGTG CTGCAATAAG AACCGCATAG AAGAGCGGTC ACAAACGGTC
121  AAGTGCTCTT GCTTCCCGGG ACAGGTGGCG GGCACAACTC GGGCTCAACC TTCTTGTGTT
181  GAAGCTTCCA TTGTGATTCA GAAATGGTGG TGTCACATGA ATCCGTGTTT GGAAGGAGAG
241  GATTGTAAAG TGCTGCCAGA TTACTCAGGT TGGTCCTGTA GCAGTGGCAA TAAAGTCAAA
301  ACTACGAAGG TAACGCGGTA
SEQ ID NO:51:(INSP116克隆成熟多肽序列)
  1  SSQHLRGHAG HHQIKQGTCE VVAVHRCCNK NRIEERSQTV KCSCFPGQVA GTTRAQPSCV
 61  EASIVIQKWW CHMNPCLEGE DCKVLPDYSG WSCSSGNKVK TTKVTR
 SEQ ID NO:52:(INSP114-SV1核苷酸序列)
  1  ATGAGTAAGA GATACTTACA GAAAGCAACA AAAGGAAAAC TGCTAATAAT AATATTTATT
 61  GTAACCTTGT GGGGGAAAGT TGTATCCAGT GCAAACCATC ATAAAGCTCA CCATGTTAAA
121  ACGGGAACTT GTGAGGTGGT GGCACTCCAC AGATGCTGTA ATAAGAACAA GATAGAAGAA
181  CGGTCACAAA CAGTCAAGTG CTCCTGCTTC CCTGGGCAGG TGGCAGGCAC CACGCGAGCT
241  GCTCCATCAT GTGTGGATGC TTCAATAGTG GAACAGAAAT GGTGGTGCCA TATGCAGCCA
301  TGTCTAGAGG GAGAAGAATG TAAAGTTCTT CCGGATCGGA AAGGATGGAG CTGTTCCTCT
361  GGGAATAAAG TCAAAACAAC TAGGGCAAAC GTG
SEQ ID NO:53:(INSP114-SV1多肽序列)
  1  MSKRYLQKAT KGKLLIIIFI VTLWGKVVSS ANHHKAHHVK TGTCEVVALH RCCNKNKIEE
 61  RSQTVKCSCF PGQVAGTTRA APSCVDASIV EQKWWCHMQP CLEGEECKVL PDRKGWSCSS
121  GNKVKTTRAN V
SEQ ID NO:54:(INSP114-SV1成熟核苷酸序列)
  1  GCAAACCATC ATAAAGCTCA CCATGTTAAA ACGGGAACTT GTGAGGTGGT GGCACTCCAC
 61  AGATGCTGTA ATAAGAACAA GATAGAAGAA CGGTCACAAA CAGTCAAGTG CTCCTGCTTC
121  CCTGGGCAGG TGGCAGGCAC CACGCGAGCT GCTCCATCAT GTGTGGATGC TTCAATAGTG
181  GAACAGAAAT GGTGGTGCCA TATGCAGCCA TGTCTAGAGG GAGAAGAATG TAAAGTTCTT
241  CCGGATCGGA AAGGATGGAG CTGTTCCTCT GGGAATAAAG TCAAAACAAC TAGGGCAAAC
301  GTG   SEQ ID NO:55:(INSP114-SV1成熟多肽序列)
  1  ANHHKAHHVK TGTCEVVALH RCCNKNKIEE RSQTVKCSCF PGQVAGTTRA APSCVDASIV
 61  EQKWWCHMQP CLEGEECKVL PDRKGWSCSS GNKVKTTRAN V
序列表
<110>阿雷斯贸易股份有限公司
<120>分泌性蛋白质家族
<130>P033591WO
<140>PCT/GB2004/001248
<141>2004-03-24
<150>GB 0306771.7
<151>2003-03-24
<160>126
<170>SeqWin99,版本1.02
<210>1
<211>402
<212>DNA
<213>智人
<400>1
atggcaatgg tctctgcgat gtcctgggtc ctgtatttgt ggataagtgc ttgtgcaatg    60
ctactctgcc atggatccct tcagcacact ttccagcagc atcacctgca cagaccagaa   120
ggagggacgt gtgaagtgat agcagcacac cgatgttgca acaagaatcg cattgaggag   180
cggtcacaaa cagtaaagtg ttcctgtcta cctggaaaag tggctggaac aacaagaaac   240
cggccttctt gcgtcgatgc ctccatagtg atttggaaat ggtggtgtga gatggagcct   300
tgcctagaag gagaagaatg taagacactc cctgacaatt ctggatggat gtgcgcaaca   360
ggcaacaaaa ttaagaccac gagaattcac ccaagaacct aa                      402
<210>2
<211>133
<212>PRT
<213>智人
<400>2
Met Ala Met Val Ser Ala Met Ser Trp Val Leu Tyr Leu Trp Ile Ser
1               5                   10                  15
Ala Cys Ala Met Leu Leu Cys His Gly Ser Leu Gln His Thr Phe Gln
            20                  25                  30
Gln His His Leu His Arg Pro Glu Gly Gly Thr Cys Glu Val Ile Ala
        35                  40                  45
Ala His Arg Cys Cys Asn Lys Asn Arg Ile Glu Glu Arg Ser Gln Thr
    50                  55                  60
Val Lys Cys Ser Cys Leu Pro Gly Lys Val Ala Gly Thr Thr Arg Asn
65                  70                  75                  80
Arg Pro Ser Cys Val Asp Ala Ser Ile Val Ile Trp Lys Trp Trp Cys
                85                  90                  95
Glu Met Glu Pro Cys Leu Glu Gly Glu Glu Cys Lys Thr Leu Pro Asp
            100                 105                 110
Asn Ser Gly Trp Met Cys Ala Thr Gly Asn Lys Ile Lys Thr Thr Arg
        115                 120                 125
Ile His Pro Arg Thr
    130
<210>3
<211>327
<212>DNA
<213>智人
<400>3
tcccttcagc acactttcca gcagcatcac ctgcacagac cagaaggagg gacgtgtgaa   60
gtgatagcag cacaccgatg ttgcaacaag aatcgcattg aggagcggtc acaaacagta  120
aagtgttcct gtctacctgg aaaagtggct ggaacaacaa gaaaccggcc ttcttgcgtc  180
gatgcctcca tagtgatttg gaaatggtgg tgtgagatgg agccttgcct agaaggagaa  240
gaatgtaaga cactccctga caattctgga tggatgtgcg caacaggcaa caaaattaag  300
accacgagaa ttcacccaag aacctaa                                      327
<210>4
<211>108
<212>PRT
<213>智人
<400>4
Ser Leu Gln His Thr Phe Gln Gln His His Leu His Arg Pro Glu Gly
1                5                   10                  15
Gly Thr Cys Glu Val Ile Ala Ala His Arg Cys Cys Asn Lys Asn Arg
            20                  25                  30
Ile Glu Glu Arg Ser Gln Thr Val Lys Cys Ser Cys Leu Pro Gly Lys
        35                  40                  45
Val Ala Gly Thr Thr Arg Asn Arg Pro Ser Cys Val Asp Ala Ser Ile
    50                  55                  60
Val Ile Trp Lys Trp Trp Cys Glu Met Glu Pro Cys Leu Glu Gly Glu
65                  70                  75                  80
Glu Cys Lys Thr Leu Pro Asp Asn Ser Gly Trp Met Cys Ala Thr Gly
                85                  90                  95
Asn Lys Ile Lys Thr Thr Arg Ile His Pro Arg Thr
            100                 105
<210>5
<211>396
<212>DNA
<213>智人
<400>5
atgagtaaga gatacttaca gaaagcaaca aaaggaaaac tgctaataat aatatttatt   60
gtaaccttgt gggggaaagt tgtatccagt gcaaaccatc ataaagctca ccatgttaaa  120
acgggaactt gtgaggtggt ggcactccac agatgctgta ataagaacaa gatagaagaa  180
cggtcacaaa cagtcaagtg ctcctgcttc cctgggcagg tggcaggcac cacgcgagct  240
gctccatcat gtgtggatgc ttcaatagtg gaacagaaat ggtggtgcca tatgcagcca  300
tgtctagagg gagaagaatg taaagttctt ccggatcgga aaggatggag ctgttcctct  360
gggaataaag tcaaaacaac tagggtaacc cattaa                            396
<210>6
<211>130
<212>PRT
<213>智人
<400>6
Met Ser Lys Arg Tyr Leu Gln Lys Ala Thr Lys Gly Lys Leu Leu Ile
1               5                   10                  15
Ile Ile Phe Ile Val Thr Leu Trp Gly Lys Val Val Ser Ser Ala Asn
            20                  25                  30
His His Lys Ala His His Val Lys Thr Gly Thr Cys Glu Val Val Ala
        35                  40                  45
Leu His Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser Gln Thr Val
    50                  55                  60
Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr Arg Ala Ala
65                  70                  75                  80
Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp Trp Cys His
                85                  90                  95
Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu Pro Asp Arg
            100                 105                 110
Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr Thr Arg Val
        115                 120                 125
Thr His
    130
<210>7
<211>306
<212>DNA
<213>智人
<400>7
gcaaaccatc ataaagctca ccatgttaaa acgggaactt gtgaggtggt ggcactccac   60
agatgctgta ataagaacaa gatagaagaa cggtcacaaa cagtcaagtg ctcctgcttc  120
cctgggcagg tggcaggcac cacgcgagct gctccatcat gtgtggatgc ttcaatagtg  180
gaacagaaat ggtggtgcca tatgcagcca tgtctagagg gagaagaatg taaagttctt  240
ccggatcgga aaggatggag ctgttcctct gggaataaag tcaaaacaac tagggtaacc  300
cattaa                                                             306
<210>8
<211>101
<212>PRT
<213>智人
<400>8
Ala Asn His His Lys Ala His His Val Lys Thr Gly Thr Cys Glu Val
1                5                   10                  15
Val Ala Leu His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser
            20                  25                  30
Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr
        35                  40                  45
Arg Ala Ala Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp
    50                  55                  60
Trp Cys His Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu
65                  70                  75                  80
Pro Asp Arg Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr
                85                  90                  95
Thr Arg Val Thr His
            100
<210>9
<211>399
<212>DNA
<213>智人
<400>9
atggcgccat cgcccaggac cggcagccgg caagatgcga ccgccctgcc cagcatgtcc   60
tcaactttct gggcgttcat gatcctggcc agcctgctca tcgcctactg cagtcagctg  120
gccgccggca cctgtgagat tgtgaccttg gaccgggaca gcagccagcc tcggaggacg  180
atcgcccggc agaccgcccg ctgtgcgtgt agaaaggggc agatcgccgg caccacgaga  240
gcccggcccg cctgtgtgga cgcaagaatc atcaagacca agcagtggtg tgacatgctt  300
ccgtgtctgg agggggaagg ctgcgact tgttaatcaacc ggtcaggctg gacgtgcacg  360
cagcccggcg ggaggataaa gaccaccacg gtctcctga                         399
<210>10
<211>132
<212>PRT
<213>智人
<400>10
Met Ala Pro Ser Pro Arg Thr Gly Ser Arg Gln Asp Ala Thr Ala Leu
1               5                   10                  15
Pro Ser Met Ser Ser Thr Phe Trp Ala Phe Met Ile Leu Ala Ser Leu
            20                  25                  30
Leu Ile Ala Tyr Cys Ser Gln Leu Ala Ala Gly Thr Cys Glu Ile Val
        35                  40                  45
Thr Leu Asp Arg Asp Ser Ser Gln Pro Arg Arg Thr Ile Ala Arg Gln
   50                   55                  60
Thr Ala Arg Cys Ala Cys Arg Lys Gly Gln Ile Ala Gly Thr Thr Arg
65                  70                  75                  80
Ala Arg Pro Ala Cys Val Asp Ala Arg Ile Ile Lys Thr Lys Gln Trp
                85                  90                  95
Cys Asp Met Leu Pro Cys Leu Glu Gly Glu Gly Cys Asp Leu Leu Ile
            100                 105                 110
Asn Arg Ser Gly Trp Thr Cys Thr Gln Pro Gly Gly Arg Ile Lys Thr
        115                 120                 125
Thr Thr Val Ser
    130
<210>11
<211>273
<212>DNA
<213>智人
<400>11
ggcacctgtg agattgtgac cttggaccgg gacagcagcc agcctcggag gacgatcgcc   60
cggcagaccg cccgctgtgc gtgtagaaag gggcagatcg ccggcaccac gagagcccgg  120
cccgcctgtg tggacgcaag aatcatcaag accaagcagt ggtgtgacat gcttccgtgt  180
ctggaggggg aaggctgcga cttgttaatc aaccggtcag gctggacgtg cacgcagccc  240
ggcgggagga taaagaccac cacggtctcc tga                               273
<210>12
<211>90
<212>PRT
<213>智人
<400>12
Gly Thr Cys Glu Ile Val Thr Leu Asp Arg Asp Ser Ser Gln Pro Arg
1               5                   10                  15
Arg Thr Ile Ala Arg Gln Thr Ala Arg Cys Ala Cys Arg Lys Gly Gln
            20                  25                  30
Ile Ala Gly Thr Thr Arg Ala Arg Pro Ala Cys Val Asp Ala Arg Ile
        35                  40                  45
Ile Lys Thr Lys Gln Trp Cys Asp Met Leu Pro Cys Leu Glu Gly Glu
    50                  55                  60
Gly Cys Asp Leu Leu Ile Asn Arg Ser Gly Trp Thr Cys Thr Gln Pro
65                  70                  75                  80
Gly Gly Arg Ile Lys Thr Thr Thr Val Ser
                85                  90
<210>13
<211>423
<212>DNA
<213>智人
<400>13
atgaggtccc caaggatgag agtctgtgct aagtcagtgt tgctgtcgca ctggctcttt   60
ctagcctacg tgttaatggt gtgctgtaag ctgatgtccg cctcaagcca gcacctccgg  120
ggacatgcag gtcaccacca aatcaagcaa gggacctgtg aggtggtcgc cgtgcacagg  180
tgctgcaata agaaccgcat agaagagcgg tcacaaacgg tcaagtgctc ttgcttcccg  240
ggacaggtgg cgggcacaac tcgggctcaa ccttcttgtg ttgaagcttc cattgtgatt  300
cagaaatggt ggtgtcacat gaatccgtgt ttggaaggag aggattgtaa agtgctgcca  360
gattactcag gttggtcctg tagcagtggc aataaagtca aaactacgaa ggtaacgcgg  420
tag                                                                423
<210>14
<211>140
<212>PRT
<213>智人
<400>14
Met Arg Ser Pro Arg Met Arg Val Cys Ala Lys Ser Val Leu Leu Ser
1               5                   10                  15
His Trp Leu Phe Leu Ala Tyr Val Leu Met Val Cys Cys Lys Leu Met
            20                   25                   30
Ser Ala Ser Ser Gln His Leu Arg Gly His Ala Gly His His Gln Ile
        35                  40                  45
Lys Gln Gly Thr Cys Glu Val Val Ala Val His Arg Cys Cys Asn Lys
    50                  55                  60
Asn Arg Ile Glu Glu Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Pro
65                  70                  75                  80
Gly Gln Val Ala Gly Thr Thr Arg Ala Gln Pro Ser Cys Val Glu Ala
                85                  90                  95
Ser Ile Val Ile Gln Lys Trp Trp Cys His Met Asn Pro Cys Leu Glu
            100                 105                 110
Gly Glu Asp Cys Lys Val Leu Pro Asp Tyr Ser Gly Trp Ser Cys Ser
        115                 120                 125
Ser Gly Asn Lys Val Lys Thr Thr Lys Val Thr Arg
    130                 135                 140
<210>15
<211>321
<212>DNA
<213>智人
<400>15
tcaagccagc acctccgggg acatgcaggt caccaccaaa tcaagcaagg gacctgtgag   60
gtggtcgccg tgcacaggtg ctgcaataag aaccgcatag aagagcggtc acaaacggtc  120
aagtgctctt gcttcccggg acaggtggcg ggcacaactc gggctcaacc ttcttgtgtt  180
gaagcttcca ttgtgattca gaaatggtgg tgtcacatga atccgtgttt ggaaggagag  240
gattgtaaag tgctgccaga ttactcaggt tggtcctgta gcagtggcaa taaagtcaaa  300
actacgaagg taacgcggta g                                            321
<210>16
<211>106
<212>PRT
<213>智人
<400>16
Ser Ser Gln His Leu Arg Gly His Ala Gly His His Gln Ile Lys Gln
1               5                   10                  15
Gly Thr Cys Glu Val Val Ala Val His Arg Cys Cys Asn Lys Asn Arg
            20                  25                  30
Ile Glu Glu Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln
        35                  40                  45
Val Ala Gly Thr Thr Arg Ala Gln Pro Ser Cys Val Glu Ala Ser Ile
    50                  55                  60
Val Ile Gln Lys Trp Trp Cys His Met Asn Pro Cys Leu Glu Gly Glu
65                  70                  75                  80
Asp Cys Lys Val Leu Pro Asp Tyr Ser Gly Trp Ser Cys Ser Ser Gly
                85                  90                  95
Asn Lys Val Lys Thr Thr Lys Val Thr Arg
            100                 105
<210>17
<211>115
<212>DNA
<213>智人
<400>17
atgagtgaga gggtcgagcg gaactggagc acgggcggct ggctgctggc actgtgcctg  60
gcctggctgt ggacccacct gaccttggct gccttgcagc ctcccactgc cacag      115
<210>18
<211>39
<212>PRT
<213>智人
<400>18
Met Ser Glu Arg Val Glu Arg Asn Trp Ser Thr Gly Gly Trp Leu Leu
1               5                   10                 15
Ala Leu Cys Leu Ala Trp Leu Trp Thr His Leu Thr Leu Ala Ala Leu
            20                  25                  30
Gln Pro Pro Thr Ala Thr Val
        35
<210>19
<211>150
<212>DNA
<213>智人
<400>19
tgcttgtgca gcagggcacc tgcgaggtga ttgcggctca ccgctgctgc aaccggaacc   60
gcatcgagga gcgctcccag acggtgaaat gctcctgttt ttctggccag gtggccggca  120
ccacgcgggc aaagccctcc tgcgtggacg                                   150
<210>20
<211>50
<212>PRT
<213>智人
<400>20
Leu Val Gln Gln Gly Thr Cys Glu Val Ile Ala Ala His Arg Cys Cys
1               5                   10                  15
Asn Arg Asn Arg Ile Glu Glu Arg Ser Gln Thr Val Lys Cys Ser Cys
            20                  25                  30
Phe Ser Gly Gln Val Ala Gly Thr Thr Arg Ala Lys Pro Ser Cys Val
        35                  40                  45
Asp Ala
    50
<210>21
<211>125
<212>DNA
<213>智人
<400>21
cctccatcgt cctgcagaga tggtggtgtc agatggagcc ctgcctgccg ggggaggagt   60
gtaaggtgct cccggacctg tcgggatgga gctgcagcag tggacacaaa gtcaaaacca  120
ccaag                                                              125
<210>22
<211>41
<212>PRT
<213>智人
<400>22
Ser Ile Val Leu Gln Arg Trp Trp Cys Gln Met Glu Pro Cys Leu Pro
1               5                   10                  15
Gly Glu Glu Cys Lys Val Leu Pro Asp Leu Ser Gly Trp Ser Cys Ser
            20                  25                  30
Ser Gly His Lys Val Lys Thr Thr Lys
        35                  40
<210>23
<211>12
<212>DNA
<213>智人
<400>23
gtcacacgat ag                                                    12
<210>24
<211>3
<212>PRT
<213>智人
<400>24
Val Thr Arg
1
<210>25
<211>402
<212>DNA
<213>智人
<400>25
atgagtgaga gggtcgagcg gaactggagc acgggcggct ggctgctggc actgtgcctg   60
gcctggctgt ggacccacct gaccttggct gccttgcagc ctcccactgc cacagtgctt  120
gtgcagcagg gcacctgcga ggtgattgcg gctcaccgct gctgcaaccg gaaccgcatc  180
gaggagcgct cccagacggt gaaatgctcc tgtttttctg gccaggtggc cggcaccacg  240
cgggcaaagc cctcctgcgt ggacgcctcc atcgtcctgc agagatggtg gtgtcagatg  300
gagccctgcc tgccggggga ggagtgtaag gtgctcccgg acctgtcggg atggagctgc  360
agcagtggac acaaagtcaa aaccaccaag gtcacacgat ag                     402
<210>26
<211>133
<212>PRT
<213>智人
<400>26
Met Ser Glu Arg Val Glu Arg Asn Trp Ser Thr Gly Gly Trp Leu Leu
1               5                   10                  15
Ala Leu Cys Leu Ala Trp Leu Trp Thr His Leu Thr Leu Ala Ala Leu
            20                  25                  30
Gln Pro Pro Thr Ala Thr Val Leu Val Gln Gln Gly Thr Cys Glu Val
        35                  40                  45
Ile Ala Ala His Arg Cys Cys Asn Arg Asn Arg Ile Glu Glu Arg Ser
    50                  55                  60
Gln Thr Val Lys Cys Ser Cys Phe Ser Gly Gln Val Ala Gly Thr Thr
65                  70                  75                  80
Arg Ala Lys Pro Ser Cys Val Asp Ala Ser Ile Val Leu Gln Arg Trp
                85                  90                  95
Trp Cys Gln Met Glu Pro Cys Leu Pro Gly Glu Glu Cys Lys Val Leu
            100                 105                 110
Pro Asp Leu Ser Gly Trp Ser Cys Ser Ser Gly His Lys Val Lys Thr
        115                 120                 125
Thr Lys Val Thr Arg
    130
<210>27
<211>25
<212>DNA
<213>智人
<400>27
gccttgcagc ctcccactgc cacag                                  25
<210>28
<211>9
<212>PRT
<213>智人
<400>28
Ala Leu Gln Pro Pro Thr Ala Thr Val
1               5
<210>29
<211>312
<212>DNA
<213>智人
<400>29
gccttgcagc ctcccactgc cacagtgctt gtgcagcagg gcacctgcga ggtgattgcg   60
gctcaccgct gctgcaaccg gaaccgcatc gaggagcgct cccagacggt gaaatgctcc  120
tgtttttctg gccaggtggc cggcaccacg cgggcaaagc cctcctgcgt ggacgcctcc  180
atcgtcctgc agagatggtg gtgtcagatg gagccctgcc tgccggggga ggagtgtaag  240
gtgctcccgg acctgtcggg atggagctgc agcagtggac acaaagtcaa aaccaccaag  300
gtcacacgat ag                                                      312
<210>30
<211>103
<212>PRT
<213>智人
<400>30
Ala Leu Gln Pro Pro Thr Ala Thr Val Leu Val Gln Gln Gly Thr Cys
1               5                   10                  15
Glu Val Ile Ala Ala His Arg Cys Cys Asn Arg Asn Arg Ile Glu Glu
            20                  25                  30
Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Ser Gly Gln Val Ala Gly
        35                  40                  45
Thr Thr Arg Ala Lys Pro Ser Cys Val Asp Ala Ser Ile Val Leu Gln
    50                  55                  60
Arg Trp Trp Cys Gln Met Glu Pro Cys Leu Pro Gly Glu Glu Cys Lys
65                  70                  75                  80
Val Leu Pro Asp Leu Ser Gly Trp Ser Cys Ser Ser Gly His Lys Val
                85                  90                  95
Lys Thr Thr Lys Val Thr Arg
            100
<210>31
<211>134
<212>PRT
<213>小家鼠
<400>31
Met Arg Val Cys Ala Lys Trp Val Leu Leu Ser Arg Trp Leu Val Leu
1               5                   10                  15
Thr Tyr Val Leu Met Val Cys Cys Lys Leu Met Ser Ala Ser Ser Gln
            20                  25                  30
His Leu Arg Gly His Ala Gly His His Leu Ile Lys Pro Gly Thr Cys
        35                  40                  45
Glu Val Val Ala Val His Arg Cys Cys Asn Lys Asn Arg Ile Glu Glu
    50                  55                  60
Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly
65                  70                  75                  80
Thr Thr Arg Ala Gln Pro Ser Cys Val Glu Ala Ala Ile Val Ile Glu
                85                  90                  95
Lys Trp Trp Cys His Met Asn Pro Cys Leu Glu Gly Glu Asp Cys Lys
            100                 105                     110
Val Leu Pro Asp Ser Ser Gly Trp Ser Cys Ser Ser Gly Asn Lys Val
        115                 120                 125
Lys Thr Thr Lys Ala Ser
    130
<210>32
<211>131
<212>PRT
<213>小家鼠
<400>32
Met Asn Lys Arg Tyr Leu Gln Lys Ala Thr Gln Gly Lys Leu Leu Ile
1               5                   10                  15
Ile Ile Phe Ile Val Thr Leu Trp Gly Lys Ala Val Ser Ser Ala Asn
            20                  25                  30
His His Lys Ala His His Val Arg Thr Gly Thr Cys Glu Val Val Ala
        35                  40                  45
Leu His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser Gln Thr
    50                  55                  60
Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr Arg Ala
65                  70                  75                  80
Ala Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp Trp Cys
                85                  90                  95
His Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu Pro Asp
            100                 105                 110
Arg Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr Thr Arg
        115                 120                 125
Val Thr His
    130
<210>33
<211>133
<212>PRT
<213>黑家鼠
<400>33
Met Ala Glu Arg Ser Thr Ser Asn Trp Ser Pro Gly Ser Trp Val Leu
1               5                   10                  15
Ala Leu Cys Leu Ala Trp Leu Trp Thr Arg Leu Ala Ser Ala Ser Leu
            20                  25                  30
Gln Pro Pro Thr Ser Thr Val Lys Gln Gly Thr Cys Glu Val Ile Ala
        35                  40                  45
Ala His Arg Cys Cys Asn Arg Asn Arg Ile Glu Glu Arg Ser Gln Thr
    50                  55                  60
Val Lys Cys Ser Cys Leu Ser Gly Gln Val Ala Gly Thr Thr Arg Ala
65                  70                  75                  80
Lys Pro Ser Cys Val Asp Ala Ser Ile Val Leu Gln Lys Trp Trp Cys
                85                  90                  95
Gln Met Glu Pro Cys Leu Leu Gly Glu Glu Cys Lys Val Leu Pro Asp
            100                 105                 110
Leu Ser Gly Trp Ser Cys Ser Arg Gly His Lys Val Lys Thr Thr Lys
        115                 120                 125
Val Leu Arg Trp Thr
   130
<210>34
<211>131
<212>PRT
<213>黑家鼠
<400>34
Met Thr Met Val Ser Ala Met Ser Trp Val Leu Tyr Leu Trp Ile Ser
1               5                   10                  15
Ala Cys Ala Met Leu Leu Cys His Gly Ser Leu Gln His Thr Phe Gln
            20                  25                  30
Gln His His Leu His Arg Pro Glu Gly Gly Thr Cys Glu Val Ile Ala
        35                  40                  45
Ala His Arg Cys Cys Asn Lys Asn Arg Ile Glu Glu Arg Ser Gln Thr
    50                  55                  60
Val Lys Cys Ser Cys Leu Pro Gly Lys Val Ala Gly Thr Thr Arg Asn
65                  70                  75                  80
Arg Pro Ser Cys Val Asp Ala Ser Ile Val Ile Gly Lys Trp Trp Cys
                85                   90                 95
Glu Met Glu Pro Cys Leu Glu Gly Glu Glu Cys Lys Thr Leu Pro Asp
            100                 105                 110
Asn Ser Gly Trp Met Cys Ala Thr Gly Asn Lys Ile Lys Thr Thr Arg
        115                 120                 125
Val Ser Pro
    130
<210>35
<211>153
<212>PRT
<213>河鲀
<400>35
Met Asn Val Ile Arg Ser Val Arg Pro Ser His Trp Gly Leu Leu Leu
1               5                   10                  15
Leu Cys Thr Ala Ala Phe Cys Ser Gln Leu Val Ala Thr Gly Asn Gln
            20                  25                  30
Ser Ser Arg Gly Gln Arg Gly Ser Glu Gln Glu Arg Thr Gly Thr Cys
        35                  40                  45
Glu Val Val Ala Ala His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu
    50                  55                  60
Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly
65                  70                  75                  80
Thr Thr Arg Ala Leu Pro Ser Cys Val Asp Ala Ser Ile Val Arg Gln
                85                  90                  95
Lys Trp Trp Cys Asn Met Glu Pro Cys Val Val Gly Glu Glu Cys Arg
            100                 105                 110
Val Leu Pro Asp Leu Thr Gly Trp Ser Cys Ile Ser Gly Asn Lys Val
        115                 120                 125
Lys Thr Thr Lys Val Ser Arg Gly Ala Ala Leu Val Val Lys Lys Pro
    130                 135                 140
Asn Arg Thr Ser Leu Gln Cys Arg Ile
145                 150
<210>36
<211>216
<212>DNA
<213>智人
<400>36
atggcaatgg tctctgcgat gtcctgggtc ctgtatttgt ggataagtgc ttgtgcaatg  60
ctactctgcc atggatccct tcagcacact ttccagcagc atcacctgca cagaccaggt  120
gcagagcaaa accagtgtgg ctggaaagga gaaagaagga aagggggctt caagcaagat  180
catgtgcatt gtcagacttc agatcatcca aggcct                            216
<210>37
<211>72
<212>PRT
<213>智人
<400>37
Met Ala Met Val Ser Ala Met Ser Trp Val Leu Tyr Leu Trp Ile Ser
1               5                   10                  15
Ala Cys Ala Met Leu Leu Cys His Gly Ser Leu Gln His Thr Phe Gln
            20                  25                  30
Gln His His Leu His Arg Pro Gly Ala Glu Gln Asn Gln Cys Gly Trp
        35                  40                  45
Lys Gly Glu Arg Arg Lys Gly Gly Phe Lys Gln Asp His Val His Cys
    50                  55                  60
Gln Thr Ser Asp His Pro Arg Pro
65                  70
<210>38
<211>141
<212>DNA
<213>智人
<400>38
tcccttcagc acactttcca gcagcatcac ctgcacagac caggtgcaga gcaaaaccag   60
tgtggctgga aaggagaaag aaggaaaggg ggcttcaagc aagatcatgt gcattgtcag  120
acttcagatc atccaaggcct                                             141
<210>39
<211>47
<212>PRT
<213>智人
<400>39
Ser Leu Gln His Thr Phe Gln Gln His His Leu His Arg Pro Gly Ala
1               5                   10                  15
Glu Gln Asn Gln Cys Gly Trp Lys Gly Glu Arg Arg Lys Gly Gly Phe
            20                  25                  30
Lys Gln Asp His Val His Cys Gln Thr Ser Asp His Pro Arg Pro
        35                  40                  45
<210>40
<211>390
<212>DNA
<213>智人
<400>40
atgagtaaga gatacttaca gaaagcaaca aaaggaaaac tgctaataat aatatttatt   60
gtaaccttgt gggggaaagt tgtatccagt gcaaaccatc ataaagctca ccatgttaaa  120
acgggaactt gtgaggtggt ggcactccac agatgctgta ataagaacaa gatagaagaa  180
cggtcacaaa cagtcaagtg ctcctgcttc cctgggcagg tggcaggcac cacgcgagct  240
gctccatcat gtgtggatgc ttcaatagtg gaacagaaat ggtggtgcca tatgcagcca  300
tgtctagagg gagaagaatg taaagttctt ccggatcgga aaggatggag ctgttcctct  360
gggaataaag tcaaaacaac taggtggtga                                   390
<210>41
<211>129
<212>PRT
<213>智人
<400>41
Met Ser Lys Arg Tyr Leu Gln Lys Ala Thr Lys Gly Lys Leu Leu Ile
1               5                   10                  15
Ile Ile Phe Ile Val Thr Leu Trp Gly Lys Val Val Ser Ser Ala Asn
            20                  25                  30
His His Lys Ala His His Val Lys Thr Gly Thr Cys Glu Val Val Ala
        35                  40                  45
Leu His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser Gln Thr
    50                  55                  60
Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr Arg Ala
65                  70                  75                  80
Ala Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp Trp Cys
                85                  90                  95
His Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu Pro Asp
            100                 105                 110
Arg Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr Thr Arg
        115                 120                 125
Trp
<210>42
<211>300
<212>DNA
<213>智人
<400>42
gcaaaccatc ataaagctca ccatgttaaa acgggaactt gtgaggtggt ggcactccac   60
agatgctgta ataagaacaa gatagaagaa cggtcacaaa cagtcaagtg ctcctgcttc  120
cctgggcagg tggcaggcac cacgcgagct gctccatcat gtgtggatgc ttcaatagtg  180
gaacagaaat ggtggtgcca tatgcagcca tgtctagagg gagaagaatg taaagttctt  240
ccggatcgga aaggatggag ctgttcctct gggaataaag tcaaaacaac taggtggtga  300
<210>43
<211>99
<212>PRT
<213>智人
<400>43
Ala Asn His His Lys Ala His His Val Lys Thr Gly Thr Cys Glu Val
1               5                   10                  15
Val Ala Leu His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser
            20                  25                  30
Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr
        35                  40                  45
Arg Ala Ala Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp
    50                  55                  60
Trp Cys His Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu
65                  70                  75                  80
Pro Asp Arg Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr
                85                  90                  95
Thr Arg Trp
<210>44
<211>399
<212>DNA
<213>智人
<400>44
atggcgccat cgcccaggac cggcagccgg caagatgcga ccgccctgcc cagcatgtcc   60
tcaactttct gggcgttcat gatcctggcc agcctgctca tcgcctactg cagtcagctg  120
gccgccggca cctgtgagat tgtgaccttg gaccgggaca gcagccagcc tcggaggacg  180
atcgcccggc agaccgcccg ctgtgcgtgt agaaaggggc agatcgccgg caccacgaga  240
gcccggcccg cctgtgtgga cgcaagaatc atcaagacca agcagtggtg tgacatgctt  300
ccgtgtctgg agggggaagg ctgcgacttg ttaatcaacc ggtcaggctg gacgtgcacg  360
cagcccggcg ggaggataaa gaccaccacg gtctcctga                         399
<210>45
<211>132
<212>PRT
<213>智人
<400>45
Met Ala Pro Ser Pro Arg Thr Gly Ser Arg Gln Asp Ala Thr Ala Leu
1               5                   10                  15
Pro Ser Met Ser Ser Thr Phe Trp Ala Phe Met Ile Leu Ala Ser Leu
            20                  25                  30
Leu Ile Ala Tyr Cys Ser Gln Leu Ala Ala Gly Thr Cys Glu Ile Val
        35                  40                  45
Thr Leu Asp Arg Asp Ser Ser Gln Pro Arg Arg Thr Ile Ala Arg Gln
    50                  55                  60
Thr Ala Arg Cys Ala Cys Arg Lys Gly Gln Ile Ala Gly Thr Thr Arg
65                  70                  75                  80
Ala Arg Pro Ala Cys Val Asp Ala Arg Ile Ile Lys Thr Lys Gln Trp
                85                  90                  95
Cys Asp Met Leu Pro Cys Leu Glu Gly Glu Gly Cys Asp Leu Leu Ile
            100                 105                 110
Asn Arg Ser Gly Trp Thr Cys Thr Gln Pro Gly Gly Arg Ile Lys Thr
        115                 120                 125
Thr Thr Val Ser
    130
<210>46
<211>270
<212>DNA
<213>智人
<400>46
acctgtgaga ttgtgacctt ggaccgggac agcagccagc ctcggaggac gatcgcccgg   60
cagaccgccc gctgtgcgtg tagaaagggg cagatcgccg gcaccacgag agcccggccc  120
gcctgtgtgg acgcaagaat catcaagacc aagcagtggt gtgacatgct tccgtgtctg  180
gagggggaag gctgcgactt gttaatcaac cggtcaggct ggacgtgcac gcagcccggc  240
gggaggataa agaccaccac ggtctcctga                                   270
<210>47
<211>89
<212>PRT
<213>智人
<400>47
Thr Cys Glu Ile Val Thr Leu Asp Arg Asp Ser Ser Gln Pro Arg Arg
1               5                   10                  15
Thr Ile Ala Arg Gln Thr Ala Arg Cys Ala Cys Arg Lys Gly Gln Ile
            20                  25                  30
Ala Gly Thr Thr Arg Ala Arg Pro Ala Cys Val Asp Ala Arg Ile Ile
        35                  40                  45
Lys Thr Lys Gln Trp Cys Asp Met Leu Pro Cys Leu Glu Gly Glu Gly
    50                  55                  60
Cys Asp Leu Leu Ile Asn Arg Ser Gly Trp Thr Cys Thr Gln Pro Gly
65                  70                  75                  80
Gly Arg Ile Lys Thr Thr Thr Val Ser
                85
<210>48
<211>423
<212>DNA
<213>智人
<400>48
atgaggtccc caaggatgag agtctgtgct aagtcagtgt tgctgtcgca ctggctcttt     60
ctagcctacg tgttaatggt gtgctgtaag ctgatgtccg cctcaagcca gcacctccgg    120
ggacatgcag gtcaccacca aatcaagcaa gggacctgtg aggtggtcgc cgtgcacagg    180
tgctgcaata agaaccgcat agaagagcgg tcacaaacgg tcaagtgctc ttgcttcccg    240
ggacaggtgg cgggcacaac tcgggctcaa ccttcttgtg ttgaagcttc cattgtgatt    300
cagaaatggt ggtgtcacat gaatccgtgt ttggaaggag aggattgtaa agtgctgcca    360
gattactcag gttggtcctg tagcagtggc aataaagtca aaactacgaa ggtaacgcgg    420
tag                                                                  423
<210>49
<211>140
<212>PRT
<213>智人
<400>49
Met Arg Ser Pro Arg Met Arg Val Cys Ala Lys Ser Val Leu Leu Ser
1               5                   10                  15
His Trp Leu Phe Leu Ala Tyr Val Leu Met Val Cys Cys Lys Leu Met
            20                  25                  30
Ser Ala Ser Ser Gln His Leu Arg Gly His Ala Gly His His Gln Ile
        35                  40                  45
Lys Gln Gly Thr Cys Glu Val Val Ala Val His Arg Cys Cys Asn Lys
    50                  55                  60
Asn Arg Ile Glu Glu Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Pro
65                  70                  75                  80
Gly Gln Val Ala Gly Thr Thr Arg Ala Gln Pro Ser Cys Val Glu Ala
                85                  90                  95
Ser Ile Val Ile Gln Lys Trp Trp Cys His Met Asn Pro Cys Leu Glu
            100                 105                 110
Gly Glu Asp Cys Lys Val Leu Pro Asp Tyr Ser Gly Trp Ser Cys Ser
        115                 120                 125
Ser Gly Asn Lys Val Lys Thr Thr Lys Val Thr Arg
    130                 135                 140
<210>50
<211>320
<212>DNA
<213>智人
<400>50
tcaagccagc acctccgggg acatgcaggt caccaccaaa tcaagcaagg gacctgtgag   60
gtggtcgccg tgcacaggtg ctgcaataag aaccgcatag aagagcggtc acaaacggtc  120
aagtgctctt gcttcccggg acaggtggcg ggcacaactc gggctcaacc ttcttgtgtt  180
gaagcttcca ttgtgattca gaaatggtgg tgtcacatga atccgtgttt ggaaggagag  240
gattgtaaag tgctgccaga ttactcaggt tggtcctgta gcagtggcaa taaagtcaaa  300
actacgaagg taacgcggta                                              320
<210>51
<211>106
<212>PRT
<213>智人
<400>51
Ser Ser Gln His Leu Arg Gly His Ala Gly His His Gln Ile Lys Gln
1               5                   10                  15
Gly Thr Cys Glu Val Val Ala Val His Arg Cys Cys Asn Lys Asn Arg
            20                  25                  30
Ile Glu Glu Arg Ser Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln
        35                  40                  45
Val Ala Gly Thr Thr Arg Ala Gln Pro Ser Cys Val Glu Ala Ser Ile
    50                  55                  60
Val Ile Gln Lys Trp Trp Cys His Met Asn Pro Cys Leu Glu Gly Glu
65                  70                  75                  80
Asp Cys Lys Val Leu Pro Asp Tyr Ser Gly Trp Ser Cys Ser Ser Gly
                85                  90                  95
Asn Lys Val Lys Thr Thr Lys Val Thr Arg
            100                 105
<210>52
<211>393
<212>DNA
<213>智人
<400>52
atgagtaaga gatacttaca gaaagcaaca aaaggaaaac tgctaataat aatatttatt   60
gtaaccttgt gggggaaagt tgtatccagt gcaaaccatc ataaagctca ccatgttaaa  120
acgggaactt gtgaggtggt ggcactccac agatgctgta ataagaacaa gatagaagaa  180
cggtcacaaa cagtcaagtg ctcctgcttc cctgggcagg tggcaggcac cacgcgagct  240
gctccatcat gtgtggatgc ttcaatagtg gaacagaaat ggtggtgcca tatgcagcca  300
tgtctagagg gagaagaatg taaagttctt ccggatcgga aaggatggag ctgttcctct  360
gggaataaag tcaaaacaac tagggcaaac gtg                               393
<210>53
<211>131
<212>PRT
<213>智人
<400>53
Met Ser Lys Arg Tyr Leu Gln Lys Ala Thr Lys Gly Lys Leu Leu Ile
1               5                   10                  15
Ile Ile Phe Ile Val Thr Leu Trp Gly Lys Val Val Ser Ser Ala Asn
            20                  25                  30
His His Lys Ala His His Val Lys Thr Gly Thr Cys Glu Val Val Ala
        35                  40                  45
Leu His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser Gln Thr
    50                  55                  60
Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr Arg Ala
65                  70                  75                  80
Ala Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp Trp Cys
                85                  90                  95
His Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu Pro Asp
            100                 105                 110
Arg Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr Thr Arg
        115                 120                 125
Ala Asn Val
    130
<210>54
<211>303
<212>DNA
<213>智人
<400>54
gcaaaccatc ataaagctca ccatgttaaa acgggaactt gtgaggtggt ggcactccac   60
agatgctgta ataagaacaa gatagaagaa cggtcacaaa cagtcaagtg ctcctgcttc  120
cctgggcagg tggcaggcac cacgcgagct gctccatcat gtgtggatgc ttcaatagtg  180
gaacagaaat ggtggtgcca tatgcagcca tgtctagagg gagaagaatg taaagttctt  240
ccggatcgga aaggatggag ctgttcctct gggaataaag tcaaaacaac tagggcaaac  300
gtg                                                                303
<210>55
<211>101
<212>PRT
<213>智人
<400>55
Ala Asn His His Lys Ala His His Val Lys Thr Gly Thr Cys Glu Val
1               5                   10                  15
Val Ala Leu His Arg Cys Cys Asn Lys Asn Lys Ile Glu Glu Arg Ser
            20                  25                  30
Gln Thr Val Lys Cys Ser Cys Phe Pro Gly Gln Val Ala Gly Thr Thr
        35                  40                  45
Arg Ala Ala Pro Ser Cys Val Asp Ala Ser Ile Val Glu Gln Lys Trp
    50                  55                  60
Trp Cys His Met Gln Pro Cys Leu Glu Gly Glu Glu Cys Lys Val Leu
65                  70                  75                  80
Pro Asp Arg Lys Gly Trp Ser Cys Ser Ser Gly Asn Lys Val Lys Thr
                85                  90                  95
Thr Arg Ala Asn Val
            100
<210>56
<211>87
<212>PRT
<213>智人
<220>
<222>5或6
<223>Xaa是Val或Ile
<220>
<222>7
<223>Xaa是Ala或Thr
<220>
<222>8
<223>Xaa是Ala,Val或Leu
<220>
<222>9
<223>Xaa是His或Asp
<220>
<222>11
<223>Xaa是Cys或Asp
<220>
<222>12
<223>Xaa是Cys或Ser
<220>
<222>13
<223>Xaa是Asn或Ser
<220>
<222>14
<223>Xaa是Lys,Arg或Gln
<220>
<222>15
<223>Xaa是Asn或Pro
<220>
<222>16或25
<223>Xaa是Arg或Lys
<220>
<222>17
<223>Xaa是Ile或Arg
<220>
<222>18
<223>Xaa是Glu或Thr
<220>
<222>19
<223>Xaa是Glu或Ile
<220>
<222>20
<223>Xaa是Arg或Ala
<220>
<222>21
<223>Xaa是Ser或Arg
<220>
<222>24
<223>Xaa是Val或Ala
<220>
<222>27或42
<223>Xaa是Ser或Ala
<220>
<222>29
<223>Xaa是Leu,Phe或Arg
<220>
<222>30
<223>Xaa是Pro,Ser或Lys
<220>
<222>32
<223>Xaa是Lys或Gln
<220>
<222>33
<223>Xaa是Val或Ile
<220>
<222>39
<223>Xaa是Asn或Ala
<220>
<222>40
<223>Xaa是Arg,Gln,Leu,Ala或Lys
<220>
<222>45
<223>Xaa是Asp或Glu
<220>
<222>47
<223>Xaa是Ser,Ala或Arg
<220>
<222>49
<223>Xaa是Val或Ile
<220>
<222>50
<223>Xaa是Ile,Glu,Leu,Lys或Arg
<220>
<222>51
<223>Xaa是Trp,Gly,Gln,Glu或Thr
<220>
<222>52
<223>Xaa是Lys或Arg
<220>
<222>53
<223>Xaa是Trp或Gln
<220>
<222>56
<223>Xaa是Glu,His,Asn,Gln或Asp
<220>
<222>58
<223>Xaa是Glu,Asn,Gln或Leu
<220>
<222>61
<223>Xaa是Leu或Val
<220>
<222>62
<223>Xaa是Glu,Val,Leu或Pro
<220>
<222>65
<223>Xaa是Asp,Glu或Gly
<220>
<222>67
<223>Xaa是Lys,Arg或Asp
<220>
<222>68
<223>Xaa是Thr,Val或Leu
<220>
<222>70
<223>Xaa是Pro或Ile
<220>
<222>71
<223>Xaa是Asp或Asn
<220>
<222>72
<223>Xaa是Asn,Tyr,Ser,Leu或Arg
<220>
<222>73
<223>Xaa是Ser,Thr或Lys
<220>
<222>76
<223>Xaa是Met,Ser或Thr
<220>
<222>78
<223>Xaa是Ala,Ser,Ile或Thr
<220>
<222>79
<223>Xaa是Thr,Ser,Arg或Gln
<220>
<222>82
<223>Xaa是Asn,His或Gly
<220>
<222>83
<223>Xaa是Lys或Arg
<220>
<222>84
<223>Xaa是Ile或Val
<400>56
Gly Thr Cys Glu Xaa Xaa Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa
1               5                   10                  15
Xaa Xaa Xaa Xaa Xaa Gln Thr Xaa Xaa Cys Xaa Cys Xaa Xaa Gly Xaa
            20                  25                  30
Xaa Ala Gly Thr Thr Arg Xaa Xaa Pro Xaa Cys Val Xaa Ala Xaa Ile
        35                  40                  45
Xaa Xaa Xaa Xaa Xaa Trp Cys Xaa Met Xaa Pro Cys Xaa Xaa Gly Glu
    50                  55                  60
Xaa Cys Xaa Xaa Leu Xaa Xaa Xaa Xaa Gly Trp Xaa Cys Xaa Xaa Pro
65                  70                  75                  80
Gly Xaa Xaa Xaa Lys Thr Thr
                85
<210>57
<211>86
<212>PRT
<213>智人
<220>
<222>5或6
<223>Xaa是Val或Ile
<220>
<222>7
<223>Xaa是Ala或Thr
<220>
<222>8
<223>Xaa是Ala,Val或Leu
<220>
<222>9
<223>Xaa是His或Asp
<220>
<222>11
<223>Xaa是Cys或Asp
<220>
<222>12
<223>Xaa是Cys或Ser
<220>
<222>13
<223>Xaa是Asn或Ser
<220>
<222>14
<223>Xaa是Lys,Arg或Gln
<220>
<222>15
<223>Xaa是Asn或Pro
<220>
<222>16或25
<223>Xaa是Arg或Lys
<220>
<222>17
<223>Xaa是Ile或Arg
<220>
<222>18
<223>Xaa是Glu或Thr
<220>
<222>19
<223>Xaa是Glu或Ile
<220>
<222>20
<223>Xaa是Arg或Ala
<220>
<222>21
<223>Xaa是Ser或Arg
<220>
<222>24
<223>Xaa是Val或Ala
<220>
<222>27或42
<223>Xaa是Ser或Ala
<220>
<222>29
<223>Xaa是Leu,Phe或Arg
<220>
<222>30
<223>Xaa是Pro,Ser或Lys
<220>
<222>32
<223>Xaa是Lys或Gln
<220>
<222>33
<223>Xaa是Val或Ile
<220>
<222>39
<223>Xaa是Asn或Ala
<220>
<222>40
<223>Xaa是Arg,Gln,Leu,Ala或Lys
<220>
<222>45
<223>Xaa是Asp或Glu
<220>
<222>47
<223>Xaa是Ser,Ala或Arg
<220>
<222>49
<223>Xaa是Val或Ile
<220>
<222>50
<223>Xaa是Ile,Glu,Leu,Lys或Arg
<220>
<222>51
<223>Xaa是Trp,Gly,Gln,Glu或Thr
<220>
<222>52
<223>Xaa是Lys或Arg
<220>
<222>53
<223>Xaa是Trp或Gln
<220>
<222>56
<223>Xaa是Glu,His,Asn,Gln或Asp
<220>
<222>58
<223>Xaa是Glu,Asn,Gln或Leu
<220>
<222>61
<223>Xaa是Leu或Val
<220>
<222>62
<223>Xaa是Glu,Val,Leu或Pro
<220>
<222>65
<223>Xaa是Asp,Glu或Gly
<220>
<222>67
<223>Xaa是Lys,Arg或Asp
<220>
<222>68
<223>Xaa是Thr,Val或Leu
<220>
<222>70
<223>Xaa是Pro或Ile
<220>
<222>71
<223>Xaa是Asp或Asn
<220>
<222>72
<223>Xaa是Asn,Tyr,Ser,Leu或Arg
<220>
<222>73
<223>Xaa是Ser,Thr或Lys
<220>
<222>76
<223>Xaa是Met,Ser或Thr
<220>
<222>78
<223>Xaa是Ala,Ser,Ile或Thr
<220>
<222>79
<223>Xaa是Thr,Ser,Arg或Gln
<220>
<222>81
<223>Xaa是Asn,His或Gly
<220>
<222>82
<223>Xaa是Lys或Arg
<220>
<222>83
<223>Xaa是Ile或Val
<400>57
Gly Thr Cys Glu Xaa Xaa Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa
1               5                   10                  15
Xaa Xaa Xaa Xaa Xaa Gln Thr Xaa Xaa Cys Xaa Cys Xaa Xaa Gly Xaa
            20                  25                  30
Xaa Ala Gly Thr Thr Arg Xaa Xaa Pro Xaa Cys Val Xaa Ala Xaa Ile
        35                  40                  45
Xaa Xaa Xaa Xaa Xaa Trp Cys Xaa Met Xaa Pro Cys Xaa Xaa Gly Glu
    50                  55                  60
Xaa Cys Xaa Xaa Leu Xaa Xaa Xaa Xaa Gly Trp Xaa Cys Xaa Xaa Gly
65                  70                  75                  80
Xaa Xaa Xaa Lys Thr Thr
                85
<210>58
<211>19
<212>PRT
<213>人工序列
<220>
<223>寡核苷酸引物
<400>58
Ala Gly Ala Ala Thr Gly Gly Cys Ala Ala Thr Gly Gly Thr Cys Thr
1               5                   10                  15
Cys Thr Gly
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>59
ccacaaatgc ttctgttagg                                             20
<210>60
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>60
aagcaggctt cgccaccatg gcaatggtct ctgcgat                      37
<210>61
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>61
gtgatggtga tggtgggttct tgggtgaat tctcg                        35
<210>62
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>62
aagcaggctt cgccaccatg gcaatggtct ctgcgat                      37
<210>63
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>63
gtgatggtga tggtgaggcc ttggatgatc tgaag                        35
<210>64
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>64
ggggacaagt ttgtacaaaa aagcaggctt cgccacc                        37
<210>65
<211>51
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>65
ggggaccactt tgtacaaga aagctgggtt tcaatggtga tggtgatggt g        51
<210>66
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>66
gccagcttgg cacttgatgt                                           20
<210>67
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>67
gatggaggtg gacgtgtcag                                           20
<210>68
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>68
tgtaaaacga cggccagt                                          18
<210>69
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>69
caggaaacag ctatgacc                                          18
<210>70
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>70
taatacgact cactatagg                                         19
<210>71
<211>18
<212>
<213>人工序列
<220>
<223>寡核苷酸引物
<400>71
attaaccctc actaaagg                                      18
<210>72
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>72
atttaggtga cactatag                                      18
<210>73
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>73
gctgcaggat gagtaagaga                                    20
<210>74
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>74
tcatcagcct tgaggatcac                                    20
<210>75
<211>26
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>75
atgagtaaga gatacttaca gaaagc                                      26
<210>76
<211>28
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>76
tcaccaccta gttgttttga ctttattc                                    28
<210>77
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>77
acgcgagctg ctccatcatg tgt                                         23
<210>78
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>78
tggtgccata tgcagccatg tct                                         23
<210>79
<211>25
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>79
gctgtcaacg atacgctacg taacg                                            25
<210>80
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>80
cgctacgtaa cggcatgaca gtg                                              23
<210>81
<211>54
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>81
gctgtcaacg atacgctacg taacggcatg acagtgtttt tttttttttt tttt            54
<210>82
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>82
aagcaggctt cgccaccatg agtaagagat acttaca                               37
<210>83
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>83
gtgatggtga tggtgatggg ttaccctagt tgttt                                 35
<210>84
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>84
gtgatggtga tggtgcacgt ttgccctagt tgttt                                 35
<210>85
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>85
gtgatggtga tggtgccacc tagttgtttt gactt                                 35
<210>86
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>86
ggggacaagtt tgtacaaaa aagcaggctt cgccacc                               37
<210>87
<211>51
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>87
ggggaccact ttgtacaaga aagctgggtt tcaatggtga tggtgatggt g               51
<210>88
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>88
gccagcttgg cacttgatgt                                                  20
<210>89
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>89
gatggaggtg gacgtgtcag                                                  20
<210>90
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>90
tgtaaaacga cggccagt                                                    18
<210>91
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>91
caggaaacag ctatgacc                                                    18
<210>92
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>92
taatacgact cactatagg                                                   19
<210>93
<211>18
<212>
<213>人工序列
<220>
<223>寡核苷酸引物
<400>93
attaaccctc actaaagg                                                    18
<210>94
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>94
atttaggtga cactatag                                                    18
<210>95
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>95
taatacgact cactatagg                                                   19
<210>96
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>96
attaaccctc actaaagg                                                    18
<210>97
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>97
aagcaggctt cgccaccatg gcgccatcgc ccaggac                               37
<210>98
<211>35
<212>
<213>人工序列
<220>
<223>寡核苷酸引物
<400>98
gtgatggtga tggtgggaga ccgtggtggt cttta                                 35
<210>99
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>99
ggggacaagt ttgtacaaaa aagcaggctt cgccacc                               37
<210>100
<211>51
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>100
ggggaccact ttgtacaaga aagctgggtt tcaatggtga tggtgatggt g               51
<210>101
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>101
gccagcttgg cacttgatgt                                                  20
<210>102
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>102
gatggaggtg gacgtgtcag                                                  20
<210>103
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>103
tgtaaaacga cggccagt                                                    18
<210>104
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>104
caggaaacag ctatgacc                                                    18
<210>105
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>105
taatacgact cactatagg                                                   19
<210>106
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>106
attaaccctc actaaagg                                                    18
<210>107
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>107
aagcaggctt cgccaccatg aggtccccaa ggatgag                               37
<210>108
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>108
gtgatggtga tggtgccgcg ttaccttcgt agttt                                 35
<210>109
<211>37
<212>
<213>人工序列
<220>
<223>寡核苷酸引物
<400>109
ggggacaagt ttgtacaaaa aagcaggctt cgccacc                               37
<210>110
<211>51
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>110
ggggaccact ttgtacaaga aagctgggtt tcaatggtga tggtgatggt g               51
<210>111
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>111
gccagcttgg cacttgatgt                                                  20
<210>112
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>112
gatggaggtg gacgtgtcag                                                  20
<210>113
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>113
tgtaaaacga cggccagt                                                    18
<210>114
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>114
caggaaacag ctatgacc                                                    18
<210>115
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>115
ttctctccgc aggatgagtg a                                                21
<210>116
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>116
tcgtgtgacc ttggtggttt                                                  20
<210>117
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>117
aagcaggctt cgccaccatg agtgagaggg tcgagcg                               37
<210>118
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>118
gtgatggtga tggtgtcgtg tgaccttggt ggttt                                 35
<210>119
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>119
ggggacaagt ttgtacaaaa aagcaggctt cgccacc                               37
<210>120
<211>51
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>120
ggggaccact ttgtacaaga aagctgggtt tcaatggtga tggtgatggt g               51
<210>121
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>121
gccagcttgg cacttgatgt                                                  20
<210>122
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>122
gatggaggtg gacgtgtcag                                                  20
<210>123
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>123
tgtaaaacga cggccagt                                                    18
<210>124
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>124
caggaaacag ctatgacc                                                    18
<210>125
<211>19
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>125
taatacgact cactatagg                                                   19
<210>126
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>126
atttaggtga cactatag                                                    18
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈