首页 / 专利库 / 疗法 / 疫苗 / 全细胞疫苗 / 分泌性蛋白质家族

分泌性蛋白质家族

阅读:953发布:2022-01-21

专利汇可以提供分泌性蛋白质家族专利检索,专利查询,专利分析的服务。并且本 发明 涉及一族新颖的分泌性 蛋白质 ,称作SECFAM3家族,它的家族成员包括新颖人蛋白质INSP123、INSP124和INSP125,经本发明鉴定为含有血管性血友病因子C型(vWFC)结构域的分泌性蛋白质;本发明还涉及这些蛋白质和编码基因的核酸序列在诊断、 预防 和 治疗 疾病 中的用途。,下面是分泌性蛋白质家族专利的具体信息内容。

1.一种鉴定SECFAM3家族成员的方法,其特征在于,所述方法包括:搜索翻译核酸序列或多肽序列数据库,鉴定一个与下列序列轮廓相匹配的多肽序列:A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V1 M   -2 -2 -3 -4 -2 -1 -3 -4 -3  0  2 -2  8  0 -3 -2 -2 -2 -2  02 A    3 -1 -3 -3 -1 -1 -2 -2 -3  0  0  1  2  1 -2 -1 -1 -3 -1  13 L    1 -2 -2 -3 -2 -2 -2 -2  2  0  2 -2  0 -2  0  1 -1 -3 -2  24 H   -1 -1  1 -1 -3 -1 -1  3  6 -3 -1 -1 -2 -2 -2  2 -1 -3 -1 -35 I    0 -2 -3 -3 -2  0  0 -3 -3  3  2 -2  0 -1 -3 -2 -1 -3 -2  26 H    0 -2 -1 -2 -2 -1 -1 -3  7  0  0 -2 -1 -2  0  0 -1 -3  0  27 E    0 -2 -2 -1 -2 -1  2 -3 -1  0  1 -1  2  2 -3  0 -1 -2  2  08 A    2 -2 -1 -2  3 -2 -2  2 -2 -2 -2 -2 -2 -3 -2  3  1 -3 -3 -29 C    0 -3 -2 -3  7 -2 -3 -3 -3  0 -1 -2  3  3 -3  0 -1 -2 -1  010 I   -1 -2 -2 -2 -2 -2  0  0 -2  3  2 -2  0  0 -3  0  0 -2  3  011 L   -2  0 -3 -4 -2 -2 -3 -4 -3  0  4 -2  3  3 -4 -2 -2 -2  0  012 L    0  0 -3 -4 -2 -2 -3 -3 -3  0  3 -2  0 -1  1 -2 -1 -3 -2  113 L   -1 -2 -2 -2 -2 -2  0 -3 -3  0  3 -2  0  1 -3  1  1 -3 -1  114 V    0  0 -3 -3  4  0 -2 -3 -3  0  0 -2  2 -2 -3 -2 -1 -3 -2  415 I   -1  0 -2 -3  4 -2 -2 -3  2  2  1 -2  0 -1 -3  0  0  4 -1  016 P    0  0 -2 -2 -2 -2 -2 -3  4 -1  0 -2 -1  2  3  0 -1 -2  0  017 G    0 -3 -2 -3 -2 -2 -3  2 -3  1  0 -3  3  3 -3 -1 -2 -2  0  118 L    1 -3 -3 -4 -1 -2 -3 -3 -3  0  4 -2  0 -1 -3 -2 -1 -3 -2  219 V    2 -1 -1 -2 -2  3 -1 -2 -2  0 -1 -1 -1 -3 -2  1  1 -3 -2  220 T   -1 -2 -2 -3  4 -2 -2 -3 -3  0  3 -2  0 -2 -3  1  3 -3 -2  021 S    0 -2 -1 -2  4 -2 -2  1 -3 -1  1 -2  2 -2  0  2 -1 -3 -3 -122 A    3 -2 -2 -2 -1 -2 -2 -1 -2 -1  0 -2 -1  1  2  2 -1 -3 -2  023 A    2 -2 -3 -2  5  0  0 -2 -3 -1  0 -2 -1 -3  2 -1 -1 -3 -2  124 I    1  1 -2 -2 -2 -1 -2 -2 -2  2  0 -1 -1 -1 -2  2 -1 -3  1  125 S   -1 -1  2 -1 -2  1 -1 -2  4  2 -1 -1 -1 -2 -2  3 -1 -4 -1 -126 H    0 -2  3 -1 -3 -1 -1 -2  5 -2 -2 -1 -2  0  3  0 -1 -3 -1  027 E   -1 -1  0  1 -3  0  5 -2 -1 -3 -3  0 -2 -3 -1  1  2 -3 -2 -228 D    1 -2  0  4 -2 -1  0 -1 -2 -2  0 -1 -1 -2 -1  2  0 -4 -3 -229 Y   -2 -1 -2 -2 -3  2 -1 -3  0  0 -1 -1 -1  0  3 -1 -2  0  5  030 P    0 -1 -1 -1 -2 -1 -1  0  5 -3 -3 -1 -2 -3  4  0  0 -3 -1 -231 A    3 -2 -2 -2 -1 -1 -2 -1 -3  0  2 -1  0 -2  0  0  0 -3 -2  032 D   -2 -1  0  5 -3  0  2 -2 -1 -2 -3  2 -2 -3 -1  0 -1 -4 -3  033 E    0 -1 -2  0 -2  0  3 -3 -1  0  0 -1  0  3 -2 -1 -1 -2  0  034 G    1 -2  0 -1 -2 -1 -2  4 -2 -2 -2 -2  0 -2 -2  1  1 -2 -3  035 D     0  2  0  2 -2  0  0 -2 -1 -2  0  0 -1 -3  2 -1 -1 -3 -2 -236 Q     0  3  0 -1 -2  3  0 -2 -1 -2 -2  0 -1 -3 -1  1  3 -3 -2 -237 I     0 -2 -3 -2 -1 -2 -2 -2 -3  1  0 -2  0 -2  4 -1 -1 -3 -2  238 S    -1 -1  0  1 -2  0  2 -2 -1  2 -1  1 -1 -2 -2  2 -1 -3 -2  039 S     3 -1 -1 -1 -1 -1 -1 -1 -2 -1  0 -1 -1 -2  2  3  0 -3 -2 -140 N     0 -2  2 -1 -3 -1  1  3 -1  0  0 -1 -1 -3  1 -1 -1 -3 -2  041 D     1 -2 -1  3 -2  0  2 -2 -2 -1  0 -1 -1  0 -2  0 -1 -3 -2 -142 N    -1 -1  2  1 -3  0  3  0 -1 -2  0  0 -1 -2 -2  1 -1 -3 -2 -243 L     1 -3 -3 -3  4 -2 -3 -3 -1  0  1 -3  0  3 -3 -2 -2  0  5  044 I     1 -1 -1  0 -2  0  2 -2 -2  1 -1  1 -1 -2 -2  2 -1 -4 -2  045 F    -2 -3 -2  1 -2 -2 -2 -3 -1  2  0 -3  0  4 -3 -2 -2 -1  4  146 D     1 -2 -1  2 -2 -1  0  0 -2 -3 -3 -1 -2 -3  4  1 -1 -4 -3 -247 D     0 -2  0  5 -3 -1  0  1 -2 -3 -4 -1 -3 -3  2  1 -1 -4 -3 -348 Y    -2  3 -1 -2 -3  2 -1 -3  0 -2 -2  0 -1  0 -3 -2 -2  0  6 -249 R    -2  4  0 -2 -4  2  0 -2  5 -4 -3  0 -2 -3  2 -1 -2 -3 -1 -350 G    -1 -2  0  2 -3 -1  1  4 -2 -2 -3 -1 -2 -3 -2  1 -1 -3 -3  051 K    -1  2  1 -1 -3  0  0  1 -1 -3 -3  4 -2 -3 -2  1 -1 -3 -3 -352 G    -1 -2 -1  2  4 -2 -1  3 -2 -2 -3 -2 -2  0 -2  0  2 -2 -2 -253 C    -1 -4 -4 -4 10 -4 -4 -4 -3 -1 -1 -4 -1  2 -4 -2 -2 -2 -1 -154 V    -1 -2 -1  0 -2 -1  1 -2 -2  0  0 -1  3 -2 -2  1  0 -3 -2  355 D     0 -2  0  6 -3  0  1 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -356 D    -2 -1  3  4 -4  0  2  2 -1 -4 -4 -1 -3 -4 -2  0 -1 -4 -3 -357 S     0 -1  2  2 -3  1  0  2 -1 -3 -3 -1 -2 -3 -2  3  0 -3 -3 -358 G     0  1  0 -1 -3 -1 -2  5 -2 -4 -4 -1 -3 -3 -2  1 -2 -3 -3 -359 F    -1 -4 -4 -4 -2 -3 -3 -4 -2  3  0 -3  0  5 -4 -2 -1 -1  0  360 V    -1 -3 -3 -2 -2 -1  1 -3 -1  0  0 -2  0  3 -3 -2 -1 -1  4  361 Y    -2 -2 -2 -3 -2 -2 -2 -3  0 -1 -1 -2 -1  4 -3  0 -2  0  7 -262 K     1 -1 -2 -2 -2 -1 -1  0 -3  0 -1  1 -1 -2  2 -1 -1 -4 -2  363 L    -1 -3 -2 -3 -2 -3 -3  4 -3  4  1 -3  0 -1 -3 -1 -2 -3 -2  064 G    -1 -1  0  0 -4  0  3  5 -1 -4 -4 -1 -3 -4 -2  0 -2 -3 -3 -365 E    -2 -1 -1  0 -3  3  3 -3 -1 -2 -1  0  3 -1 -2 -1 -2  7 -1 -266 R    -2  2 -2 -3 -2  0 -1 -3  0  1 -1  1 -1  3 -3 -2 -2 -1  4  067 F    -2 -3 -3 -3 -2 -3 -3 -3 -1 -1 -1 -3 -1  6 -4 -2  1  6  3 -168 F     0  1 -2 -3 -2 -1 -2 -2 -1 -1  1 -1  0  2 -3  0  0 -1  2 -169 P    -2 -2 -1  2 -4  0  2 -2 -2 -4 -4 -1 -3 -4  6 -1 -1 -4 -3 -370 G     0 -2  0 -1 -2 -1 -1  5 -2 -4 -4 -1 -2 -3 -2  3 -1 -3 -3 -371 H    -2 -2  0  5 -3 -1  0 -2  4 -3 -4 -1 -3 -3  3  0 -1 -4 -2 -372 S    -1 -1  0 -1 -2 -1 -1 -2  5 -3 -3 -1 -2 -3  4  3  1 -3 -1 -273 N     2 -2  2 -2  8 -2 -2 -2 -2 -2 -2 -2 -2 -3 -3  0  0 -3 -2 -174 C    -1 -2 -1 -1  8 -1  3 -3 -2 -2 -2 -1 -2 -3 -2  0  2 -3 -2 -175 P    -1  2 -2 -2 -3  3  0 -3 -2 -2  0  0 -1 -3  5 -1 -1 -3 -2 -276 C     0 -4 -4 -4 10 -4 -5 -4 -4 -1 -1 -4 -1 -2 -4 -1 -1 -2 -2 -177 V    -1 -2 -2 -1 -2 -1  2 -3 -2  0  2 -1  0 -1 -2 -1  0 -3 -2  378 C     0 -4 -4 -4 10 -4 -5 -4 -4 -1 -1 -4 -1 -2 -4 -1 -1 -2 -2 -179 A     2 -1 -1 -1 -1  1 -1 -2 -2 -2 -2 -1 -1 -3 -1  0  4 -3 -2 -180 L     1 -1 -1  0 -2  0  2 -2 -2 -1  0 -1 -1 -2 -2  1  1 -3 -2 -181 D    -2 -2  0  5 -4  0  4 -2 -1 -3 -4 -1 -3 -3 -2  0  1 -4 -3 -382 G     0 -3  0 -2 -4 -3 -3  7 -3 -5 -5 -3 -4 -4 -3  0 -3 -3 -4 -483 P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7  1 -1 -4 -3 -384 V     0 -2 -2 -3 -2  1 -1 -3 -3  1  1 -2  0 -2 -2  0 -1 -3 -2  485 C     0 -3 -3 -3 10 -3 -4 -3 -3 -2 -2 -3 -2 -3 -3  0 -1 -3 -3 -286 D     1 -2 -1  3  4 -1 -1 -2 -2 -1 -2 -2  0  0 -2  1  0 -3 -2  087 Q    -1  3 -1 -2 -3  4  0 -3 -1 -2 -2  2 -1 -3 -2 -1 -1 -3 -2  088 P    -1 -2 -1 -2 -2 -2 -2 -3 -3 -2 -2 -2 -2 -4  6  0  4 -4 -3 -189 E    -2  2  0  2 -4  0  5 -2 -1 -4 -3  1 -2 -4 -2 -1 -2 -4 -3 -390 C     0 -4 -4 -4 10 -4 -5 -4 -4 -2 -2 -4 -2 -3 -4 -2 -2 -3 -3 -291 P    -1 -2 -2 -2 -3 -2 -2 -3 -3 -1 -2 -2 -2 -3  6 -1  2 -4 -3  092 K     0  3  0  0 -3  0  3 -2 -1 -3 -3  3 -2 -3 -2  0 -1 -3 -2 -293 I    -1 -3 -3 -4 -1 -2 -3 -4 -3  3  3 -2  0 -1 -3 -2  1 -3 -2  194 H    -1 -1  0 -1  4 -1 -1 -2  7 -3 -3 -1 -2 -2  2  1 -1 -3  0 -395 P     0 -2 -2 -1 -3 -1  1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -296 K     1  3 -1 -2 -2  0  0 -2  0 -2 -2  2 -1 -1 -2  1 -1 -2  2 -297 C     0 -3 -3 -3 10 -3 -4 -3 -3 -2 -2 -3 -2 -3  2 -1 -1 -3 -3 -298 T    -1 -3 -2 -3 -1 -2 -3 -4 -3  4  0 -3  1 -1 -3 -1  3 -3 -2  299 K    -2  1  0 -1 -4  0  2 -2  7 -3 -3  2 -2 -2 -2 -1 -2 -3  0 -3100 V    -1 -3 -3 -3 -1 -3 -3 -4 -3  3  0 -3  0 -1 -3 -2 -1 -3 -1  5101 E     1 -1  0  3 -2  0  2 -1 -1 -3 -3  1 -2 -3 -1  2  0 -4 -3 -2102 H    -2  2  1 -1 -3  0 -1 -2  7 -3 -2  0 -2 -1 -2 -1  1 -2  3 -2103 N    -1  0  3 -1 -2  0  0 -1  4 -2 -2  1 -2  0 -2  1  0 -1  4 -2104 G    -1 -1  0  2 -3  4  2  2 -1 -4 -3  0 -2 -3 -2  0 -1 -3 -2 -3105 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1106 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1107 P    -1 -3 -3 -2 -3 -2 -2 -3 -3 -1 -2 -2 -2 -4  7 -2 -1 -4 -3  0108 E    -1  2  0  2 -3  4  2 -2 -1 -2 -1  0 -1 -3 -2 -1 -1 -3 -2  0109 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1110 K    -1  0  0  0 -3  0  3 -2 -1 -1 -2  3 -1 -3 -2  1 -1 -3 -2  1111 E     2  2 -1  0 -3  0  4 -2 -1 -3 -2  2 -2 -3 -2  0 -1 -3 -2 -2112 V    -1  1 -1 -1 -3 -1  1  1 -2  1 -1  1 -1 -2 -2 -1 -1 -3 -2  2113 K     0  0  0 -1 -3  0  0  4 -2 -4 -3  4 -2 -3 -2  1 -1 -3 -3 -3114 N    -2  0  6  0 -3  0  0  0  0 -3 -3  2 -2 -3 -2  0  0 -4 -2 -3115 F    -1 -3 -3 -3 -2 -2 -2 -3  0  0  0 -2  0  4 -3 -2 -1  0  6  1116 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1117 E    -1 -1  0  3 -3  0  4 -2 -1 -2  0  0 -2 -3 -2  0  1 -3 -3 -2118 Y    -2 -2 -2 -2 -3 -1  1 -3  0 -1 -1 -2 -1  5 -3 -2 -2  0  6 -2119 H    -2  5  2 -2 -3  0 -1 -2  4 -2 -1  0  3 -2 -2 -1 -1 -3 -1 -2120 G    -1 -2  2 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -3 -3 -3121 K    -1  4 -1 -2 -3  0  0 -3 -1 -1 -2  5 -1 -3 -2 -1 -1 -3 -2  0122 N    -1 -2  2 -2 -2 -2 -2 -2 -2  2  0 -2  0 -2 -2  0  4 -3 -2  1123 Y    -2 -3 -3 -3 -2 -2 -3 -3  0 -1 -1 -3 -1  4 -4 -2 -2  1  8 -1124 K     0  1  0 -1 -3  2  2 -2  4 -3 -2  2 -1 -1 -2 -1 -2 -2  3 -2125 I    -1 -2  2 -2 -2 -2 -2 -2 -2  2  1 -2  0 -1 -2  0  1 -3 -2  2126 L    -1 -2  2 -2 -2 -2 -2  3 -2  0  3 -2  0 -1 -3 -1 -1 -3 -2 -1127 E    -1  0  0  1 -4  3  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2128 E    -1 -1  2  0 -3  0  4 -2  0 -3 -3  0 -2 -1 -2  0  1 -2  3 -2129 F    -2 -3 -3 -3 -2 -3 -3 -3 -1  0  0 -3  0  7 -5 -2 -2  0  2 -1130 K    -1  1  2 -1 -3  2  0 -2 -1 -1  0  2  1 -2 -2 -1 -1 -3 -2  0131 P    -1 -3 -3 -3 -2 -2 -2 -3 -3  1  2 -2  0 -2  3 -2  0 -3 -2  3132 S     0  0  1  2  2 -1  0 -1 -1 -3 -3 -1 -2 -3  1  4  1 -4 -3 -2133 P    -1 -2 -2 -1 -3 -1  1 -3 -2 -2 -3 -1 -2 -4  7 -1 -1 -4 -3  0134 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1  0 -2 -2 -1135 E    -1  1 -1  0 -3  0  5 -3 -1 -1  1  0 -1 -2 -2 -1 -1 -3 -2 -1136 W    -1  2 -1 -2 -3  2  0 -2  3 -2  0  1 -1 -2 -2  1 -1  4 -1 -2137 C     0  0 -3 -3 10 -3 -4 -3 -3  0 -1 -3 -1 -2 -3 -1  0 -3 -2 -1138 R    -1  4 -1 -2 -2  0 -1 -3 -1  2 -1  2 -1 -1 -2 -1  1 -2  1  0139 C     0 -4 -4 -4 10 -4 -5 -4 -4 -1 -1 -4 -1 -2 -4 -1 -1 -2 -2 -1140 E    -1 -1  0  2 -3  0  5 -3 -1 -2  0  0 -1 -3 -2  0  1 -3 -2 -2141 P     1 -2  1 -2 -2 -1 -1 -2 -2  0  0 -1 -1 -2  2  1  1 -3 -2  0142 S    -1 -1  4  2 -3  1  0  2 -1 -3 -3 -1 -2 -3 -2  2 -1 -4 -3 -3143 N    -1  1  2 -1 -3 -1 -1  4 -1 -4 -4  1 -2 -3 -2  1 -1 -3 -3 -3144 E    -1  0 -1  0 -3  0  4 -3 -1  1 -1  0 -1 -2 -2 -1  1 -3 -2  1145 V     3 -2 -3 -3 -1 -2 -2 -2 -3  0  0 -2  0 -2 -2 -1 -1 -3 -2  3146 H    -2  1 -2 -3 -2 -1 -2 -3  3  0  2 -1  0  2 -3 -2 -2 -1  4 -1147 C    -1  0 -3 -3 10 -3 -3 -3 -3 -2 -2 -2 -2 -3  1 -1 -1 -3 -3 -2148 V     0 -2 -1 -2 -1 -1 -2 -2 -3  0  1 -1  0 -2 -2  2  3 -3 -2  2149 V    -1 -3 -3 -3  1 -2 -2 -3 -3  2  0 -2  0 -2  2 -2 -1 -4 -2  5150 A     3 -2 -2 -2  2 -1 -1 -1 -2  0 -1 -1 -1 -2 -2  2  0 -3 -2  2151 D     1 -2  0  5 -2  1  0  0 -2 -3 -3 -1 -2 -3 -2  1 -1 -4 -3 -2152 C    -1 -3 -3 -3 10 -3 -4  0 -3 -2 -2 -3 -1  1 -4 -1 -2 -2 -1 -2153 A     2 -2 -2 -2 -2 -1  0 -2 -2 -1  0 -1 -1  1  4 -1 -1 -3 -1 -1154 V     2 -1 -2 -1 -2  4  1 -2 -2 -1 -2  0 -1 -3  3 -1 -1 -3 -2  0155 P    -1 -2 -1  1 -2 -2 -1 -2 -2  1  0 -2 -1 -2  4  0  2 -4 -3  0156 E    -2  1 -1  0 -4  0  3 -3  2 -3 -3  1 -2  2  3 -1 -2 -3 -1 -3157 C    -1 -3 -3 -3  9  1 -3 -3 -3 -2 -1 -3 -1 -2 -3 -2 -2  5 -2 -2158 V    -1  0 -2 -3 -2  0 -2 -3 -3  2  0 -2  0  1 -2 -2  1 -2 -1  4159 N    -2  1  4  4 -3  0  0 -1  0 -3 -3 -1 -2 -1 -2  0 -1  3  3 -3160 P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -1 -3  1 -2 -4  7  0 -1 -4 -3 -2161 V    -1 -3 -3 -3 -2  0  0 -4 -3  4  0 -2  0  2 -3 -2 -1 -2  0  3162 Y    -2  1 -1 -3 -3 -1 -1 -3  4 -2  0 -1 -1  0 -3  0 -2  0  6 -2163 E    -1 -1 -1  0 -3  3  4 -3 -1 -2 -1  0 -1 -3  3  0  0 -3 -2 -2164 P    -1 -1 -2 -1 -3  0  1 -3 -1 -2 -1  0 -2 -2  5 -1 -1 -2  2 -2165 E    -1 -2  1  2 -3 -1  1  3 -1 -3 -3 -1 -3 -1 -2  0 -1 -2  2 -3166 Q    -2  0 -1 -1 -3  4  2 -3  3 -3  0  2 -1 -2 -2 -1 -2  5  0 -2167 C     0 -3 -3 -4  9 -3 -4 -4 -3  0  0 -3 -1 -2 -3 -2 -1 -2 -2  0168 C     0 -3 -3 -3  9 -3 -3 -3 -3  0 -1 -3 -1 -2 -3  0 -1 -3 -2  1169 P     0 -2 -3 -2 -3 -1 -2 -2 -3 -2  0 -1 -1 -3  7 -1 -1 -4 -3 -1170 V    -1 -2 -2 -2 -2 -1  1 -3 -2  3  0  1  0 -2 -2 -2 -1 -3 -2  4171 C    -1 -2 -3 -3  9 -2 -3 -3 -3 -1  0  1 -1 -2 -3 -1 -1 -3 -2 -1172 K    -1  1  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2173 N     2 -1  3  2 -2 -1  0  2 -1 -3 -3 -1 -2 -3 -2  1 -1 -4 -3 -2174 G     0 -1  0 -1 -3 -2 -2  5 -2 -4 -3  0 -3 -3 -2  0 -2 -2 -3 -3175 P    -1 -2  1 -1 -3 -1  0 -2 -2 -3 -3 -1 -2 -4  6 -1 -1 -4 -3 -2176 N    -1 -1  5  0 -3 -1 -1 -1  0 -3 -3 -1 -2 -2 -2  1  0  6 -1 -3177 C    -1 -2 -2 -2  8 -2 -2 -3  3 -2 -2 -2 -2 -2  1 -1  0 -3 -1 -2178 F    -2 -2 -1 -2 -3 -2 -2  1  4 -2 -2  0 -1  4  0 -1 -2  0  3 -2179 A     2 -2 -2 -3 -1 -2 -2  2 -3  0  1 -2  0  0 -2 -1 -1 -3 -1  1180 G     0 -1  0  0 -2 -1  1  3 -2 -2  0 -1 -1 -2  1  1  1 -3 -2 -1181 T     0 -2 -1 -1 -1 -1 -1 -2 -2  1 -1 -1 -1 -2  1  0  5 -3 -2  0182 T     1 -1  0 -1 -1  2  0 -1 -2 -1  0 -1  0 -2 -1  1  3 -3 -2 -1183 I     1 -3 -2 -3 -1 -2 -2 -2 -3  3  0 -2  0 -1 -2  0  0 -3 -1  3184 I    -1 -3 -3 -3 -2 -3 -3  1 -3  5  0 -3  0  2 -3 -2 -1 -2  0  1185 P    -1 -2 -2 -1 -3  0  1 -2 -2 -2  0 -1 -1 -3  6 -1 -1 -4 -3 -2186 A     4  1 -2 -2  0 -1 -1  0 -2 -1 -1  0 -1 -2 -1  0  0 -3 -2  0187 G     0 -2  0 -1 -3 -2 -2  6 -2 -2 -3 -2 -2 -3 -2  0 -2 -2 -3  0188 I    -1  2 -1  0 -3  0  3 -3 -1  2 -1  0 -1 -2  1 -1 -1 -3 -2  0189 E    -1 -1 -1  0 -3  0  4 -2 -1  0 -2  0 -1 -3  3 -1 -1 -3 -2 -1190 V     0  0 -1  1 -2 -1 -1 -2 -2  0  0 -1  0 -2 -2 -1  2 -3 -2  3191 K    -1  0 -1 -1 -3  0  1 -2 -1 -2 -2  4 -1 -2 -2 -1 -1  7 -1  0192 V     0 -1 -1 -2 -2  1  0 -3 -2  0  0  1  0 -2 -2 -1  2 -3 -1  3193 D    -2 -2  0  6 -3  0  1 -1 -1 -3 -4 -1 -3 -3 -1  0  1 -4 -3 -3194 E     1 -1 -1  1 -2  0  4 -2 -1 -1 -2  0 -1 -2 -1  0 -1 -3 -2  1195 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1196 N    -1 -1  3 -1 -2 -1 -1 -1 -1 -1 -1 -1 -1  2 -2  0  4 -2  0 -1197 I    -1 -1 -2 -3  5 -2 -2 -3 -3  4  0  1  0 -1 -3 -1 -1 -3 -1  1198 C     0 -3 -2 -3  9 -3 -3 -3 -3 -1 -1 -3 -1 -2 -3 -1  1 -2 -2 -1199 H    -2  2  0 -2 -3  0  0 -2  7 -3 -2  0 -2  0 -2 -1 -2 -1  3 -3200 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1201 H    -1  0  0 -1 -2  0  0 -2  7 -2 -2 -1 -2 -1 -2  0  3 -2  0 -2202 N    -2 -1  4  3 -3  0  0 -1  0 -2 -2 -1 -2  0 -2  0 -1 -1  4 -2203 G     0 -1  0  0 -3  0  3  5 -1 -4 -4 -1 -3 -3 -2  0 -2 -2 -3 -3204 D    -1  0  0  4 -3  3  3 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2205 W    -1 -2  0  3 -3 -1  0  3 -2 -3 -3 -2 -2 -1 -2 -1 -2  8  0 -3206 W    -2 -3 -2 -3 -2 -2 -3  3 -2 -3 -3 -3 -1  0 -3 -2 -2 11  0 -3207 K    -1  3  0 -2 -3  0  0 -2  0 -2 -2  3 -1  0 -2 -1 -1 -1  4 -2208 P    -1 -1 -1 -1 -2  3  0 -3 -1 -1  1  0  0 -2  4 -1 -1 -3 -2 -1209 A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0210 Q    -1  0 -1 -1 -2  3  0 -2 -1 -1  0  0  4 -1 -1  0  2 -2 -1  0211 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1212 S     0 -1  0  0 -1  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  3 -3 -2 -1213 K    -1  5  0 -2 -3  0  0 -2  0 -3 -2  4 -1 -3 -2 -1 -1 -3 -2 -3214 R    -1  3  0 -2 -2  0 -1 -3  6 -1  1  0  0 -1 -2 -1 -1 -2  0 -1215 E    -1  0  0  1 -4  1  5 -2  0 -3 -3  3 -2 -3 -1  0 -1 -3 -2 -2216 C     0 -2  3 -1  9 -2 -2 -2 -1 -1 -1 -2 -1 -2 -3  0 -1 -3 -2 -1217 Q    -1  2 -1 -1  6  3  0 -2 -1 -2 -2  1 -1 -3 -2  0 -1 -2 -2 -2218 G    -1  0  3  0 -3  3  0  3  0 -3 -3  0 -1 -3 -2  0 -1 -3 -2 -3219 K    -1  0  0 -2 -2  0  0 -2  5  0  0  3  3 -1 -2 -1 -1 -2  0  0220 Q    -1  0  0  0 -3  4  4 -2  0 -3 -2  0 -1 -3 -1  0 -1 -2 -1 -2221 T     0 -1  0 -1 -2 -1 -1  4 -2 -2 -2 -1 -2 -2 -1  0  4 -2 -2 -1222 V     0 -2 -2 -3 -1 -1 -2 -3 -2  2  1 -1  4  0 -2 -1  0 -2 -1  3其中,当把所述序列轮廓作为查询序列输入到搜索程序BLAST时,采用生物信息国家中心(NCBI)确定的缺省参数[Blosum 62矩阵;空位开放罚分=11,空位拓展罚分=1],E值为10-2或以下的那些就是SECFAM3家族成员。
2.如权利要求1所述的方法,其特征在于,所述E值等于或少于10-5,等于或少于10-10,等于或少于10-50,最好等于或少于10-70。
3.如权利要求1或2所述的方法,其特征在于,所述翻译核酸序列数据库由cDNA、EST、mRNA、全部或部分基因组数据库产生。
4.如上述权利要求中任一项所述的方法,其特征在于,所述数据库是EST数据库。
5.如上述权利要求中任一项所述的方法,其特征在于,所述数据库是人序列数据库。
6.一种分离的多肽,其特征在于,所述多肽:(i)包括这样一个多肽序列:当以下列序列轮廓作为查询序列输入到搜索程序BLAST时,采用NCBI确定的缺省参数,所述多肽序列的E值为10-2或以下,Blosum 62矩阵;空位开放罚分=11,空位拓展罚分=1;A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V1 M    -2 -2 -3 -4 -2 -1 -3 -4 -3  0  2 -2  8  0 -3 -2 -2 -2 -2  02 A     3 -1 -3 -3 -1 -1 -2 -2 -3  0  0  1  2  1 -2 -1 -1 -3 -1  13 L     1 -2 -2 -3 -2 -2 -2 -2  2  0  2 -2  0 -2  0  1 -1 -3 -2  24 H    -1 -1  1 -1 -3 -1 -1  3  6 -3 -1 -1 -2 -2 -2  2 -1 -3 -1 -35 I     0 -2 -3 -3 -2  0  0 -3 -3  3  2 -2  0 -1 -3 -2 -1 -3 -2  26 H     0 -2 -1 -2 -2 -1 -1 -3  7  0  0 -2 -1 -2  0  0 -1 -3  0  27 E     0 -2 -2 -1 -2 -1  2 -3 -1  0  1 -1  2  2 -3  0 -1 -2  2  08 A     2 -2 -1 -2  3 -2 -2  2 -2 -2 -2 -2 -2 -3 -2  3  1 -3 -3 -29 C     0 -3 -2 -3  7 -2 -3 -3 -3  0 -1 -2  3  3 -3  0 -1 -2 -1  010 I    -1 -2 -2 -2 -2 -2  0  0 -2  3  2 -2  0  0 -3  0  0 -2  3  011 L    -2  0 -3 -4 -2 -2 -3 -4 -3  0  4 -2  3  3 -4 -2 -2 -2  0  012 L     0  0 -3 -4 -2 -2 -3 -3 -3  0  3 -2  0 -1  1 -2 -1 -3 -2  113 L    -1 -2 -2 -2 -2 -2  0 -3 -3  0  3 -2  0  1 -3  1  1 -3 -1  114 V     0  0 -3 -3  4  0 -2 -3 -3  0  0 -2  2 -2 -3 -2 -1 -3 -2  415 I    -1  0 -2 -3  4 -2 -2 -3  2  2  1 -2  0 -1 -3  0  0  4 -1  016 P     0  0 -2 -2 -2 -2 -2 -3  4 -1  0 -2 -1  2  3  0 -1 -2  0  017 G     0 -3 -2 -3 -2 -2 -3  2 -3  1  0 -3  3  3 -3 -1 -2 -2  0  118 L     1 -3 -3 -4 -1 -2 -3 -3 -3  0  4 -2  0 -1 -3 -2 -1 -3 -2  219 V     2 -1 -1 -2 -2  3 -1 -2 -2  0 -1 -1 -1 -3 -2  1  1 -3 -2  220 T    -1 -2 -2 -3  4 -2 -2 -3 -3  0  3 -2  0 -2 -3  1  3 -3 -2  021 S     0 -2 -1 -2  4 -2 -2  1 -3 -1  1 -2  2 -2  0  2 -1 -3 -3 -122 A     3 -2 -2 -2 -1 -2 -2 -1 -2 -1  0 -2 -1  1  2  2 -1 -3 -2  023 A     2 -2 -3 -2  5  0  0 -2 -3 -1  0 -2 -1 -3  2 -1 -1 -3 -2  124 I     1  1 -2 -2 -2 -1 -2 -2 -2  2  0 -1 -1 -1 -2  2 -1 -3  1  125 S    -1 -1  2 -1 -2  1 -1 -2  4  2 -1 -1 -1 -2 -2  3 -1 -4 -1 -126 H     0 -2  3 -1 -3 -1 -1 -2  5 -2 -2 -1 -2  0  3  0 -1 -3 -1  027 E    -1 -1  0  1 -3  0  5 -2 -1 -3 -3  0 -2 -3 -1  1  2 -3 -2 -228 D     1 -2  0  4 -2 -1  0 -1 -2 -2  0 -1 -1 -2 -1  2  0 -4 -3 -229 Y    -2 -1 -2 -2 -3  2 -1 -3  0  0 -1 -1 -1  0  3 -1 -2  0  5  030 P     0 -1 -1 -1 -2 -1 -1  0  5 -3 -3 -1 -2 -3  4  0  0 -3 -1 -231 A     3 -2 -2 -2 -1 -1 -2 -1 -3  0  2 -1  0 -2  0  0  0 -3 -2  032 D    -2 -1  0  5 -3  0  2 -2 -1 -2 -3  2 -2 -3 -1  0 -1 -4 -3  033 E     0 -1 -2  0 -2  0  3 -3 -1  0  0 -1  0  3 -2 -1 -1 -2  0  034 G     1 -2  0 -1 -2 -1 -2  4 -2 -2 -2 -2  0 -2 -2  1  1 -2 -3  035 D     0  2  0  2 -2  0  0 -2 -1 -2  0  0 -1 -3  2 -1 -1 -3 -2 -236 Q     0  3  0 -1 -2  3  0 -2 -1 -2 -2  0 -1 -3 -1  1  3 -3 -2 -237 I     0 -2 -3 -2 -1 -2 -2 -2 -3  1  0 -2  0 -2  4 -1 -1 -3 -2  238 S    -1 -1  0  1 -2  0  2 -2 -1  2 -1  1 -1 -2 -2  2 -1 -3 -2  039 S     3 -1 -1 -1 -1 -1 -1 -1 -2 -1  0 -1 -1 -2  2  3  0 -3 -2 -140 N     0 -2  2 -1 -3 -1  1  3 -1  0  0 -1 -1 -3  1 -1 -1 -3 -2  041 D     1 -2 -1  3 -2  0  2 -2 -2 -1  0 -1 -1  0 -2  0 -1 -3 -2 -142 N    -1 -1  2  1 -3  0  3  0 -1 -2  0  0 -1 -2 -2  1 -1 -3 -2 -243 L     1 -3 -3 -3  4 -2 -3 -3 -1  0  1 -3  0  3 -3 -2 -2  0  5  044 I     1 -1 -1  0 -2  0  2 -2 -2  1 -1  1 -1 -2 -2  2 -1 -4 -2  045 F    -2 -3 -2  1 -2 -2 -2 -3 -1  2  0 -3  0  4 -3 -2 -2 -1  4  146 D     1 -2 -1  2 -2 -1  0  0 -2 -3 -3 -1 -2 -3  4  1 -1 -4 -3 -247 D     0 -2  0  5 -3 -1  0  1 -2 -3 -4 -1 -3 -3  2  1 -1 -4 -3 -348 Y    -2  3 -1 -2 -3  2 -1 -3  0 -2 -2  0 -1  0 -3 -2 -2  0  6 -249 R    -2  4  0 -2 -4  2  0 -2  5 -4 -3  0 -2 -3  2 -1 -2 -3 -1 -350 G    -1 -2  0  2 -3 -1  1  4 -2 -2 -3 -1 -2 -3 -2  1 -1 -3 -3  051 K    -1  2  1 -1 -3  0  0  1 -1 -3 -3  4 -2 -3 -2  1 -1 -3 -3 -352 G    -1 -2 -1  2  4 -2 -1  3 -2 -2 -3 -2 -2  0 -2  0  2 -2 -2 -253 C    -1 -4 -4 -4 10 -4 -4 -4 -3 -1 -1 -4 -1  2 -4 -2 -2 -2 -1 -154 V    -1 -2 -1  0 -2 -1  1 -2 -2  0  0 -1  3 -2 -2  1  0 -3 -2  355 D     0 -2  0  6 -3  0  1- 1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -356 D    -2 -1  3  4 -4  0  2  2 -1 -4 -4 -1 -3 -4 -2  0 -1 -4 -3 -357 S     0 -1  2  2 -3  1  0  2 -1 -3 -3 -1 -2 -3 -2  3  0 -3 -3 -358 G     0  1  0 -1 -3 -1 -2  5 -2 -4 -4 -1 -3 -3 -2  1 -2 -3 -3 -359 F    -1 -4 -4 -4 -2 -3 -3 -4 -2  3  0 -3  0  5 -4 -2 -1 -1  0  360 V    -1 -3 -3 -2 -2 -1  1 -3 -1  0  0 -2  0  3 -3 -2 -1 -1  4  361 Y    -2 -2 -2 -3 -2 -2 -2 -3  0 -1 -1 -2 -1  4 -3  0 -2  0  7 -262 K     1 -1 -2 -2 -2 -1 -1  0 -3  0 -1  1 -1 -2  2 -1 -1 -4 -2  363 L    -1 -3 -2 -3 -2 -3 -3  4 -3  4  1 -3  0 -1 -3 -1 -2 -3 -2  064 G    -1 -1  0  0 -4  0  3  5 -1 -4 -4 -1 -3 -4 -2  0 -2 -3 -3 -365 E    -2 -1 -1  0 -3  3  3 -3 -1 -2 -1  0  3 -1 -2 -1 -2  7 -1 -266 R    -2  2 -2 -3 -2  0 -1 -3  0  1 -1  1 -1  3 -3 -2 -2 -1  4  067 F    -2 -3 -3 -3 -2 -3 -3 -3 -1 -1 -1 -3 -1  6 -4 -2  1  6  3 -168 F     0  1 -2 -3 -2 -1 -2 -2 -1 -1  1 -1  0  2 -3  0  0 -1  2 -169 P    -2 -2 -1  2 -4  0  2 -2 -2 -4 -4 -1 -3 -4  6 -1 -1 -4 -3 -370 G     0 -2  0 -1 -2 -1 -1  5 -2 -4 -4 -1 -2 -3 -2  3 -1 -3 -3 -371 H    -2 -2  0  5 -3 -1  0 -2  4 -3 -4 -1 -3 -3  3  0 -1 -4 -2 -372 S    -1 -1  0 -1 -2 -1 -1 -2  5 -3 -3 -1 -2 -3  4  3  1 -3 -1 -273 N     2 -2  2 -2  8 -2 -2 -2 -2 -2 -2 -2 -2 -3 -3  0  0 -3 -2 -174 C    -1 -2 -1 -1  8 -1  3 -3 -2 -2 -2 -1 -2 -3 -2  0  2 -3 -2 -175 P    -1  2 -2 -2 -3  3  0 -3 -2 -2  0  0 -1 -3  5 -1 -1 -3 -2 -276 C     0 -4 -4 -4 10 -4 -5 -4 -4 -1 -1 -4 -1 -2 -4 -1 -1 -2 -2 -177 V    -1 -2 -2 -1 -2 -1  2 -3 -2  0  2 -1  0 -1 -2 -1  0 -3 -2  378 C     0 -4 -4 -4 10 -4 -5 -4 -4 -1 -1 -4 -1 -2 -4 -1 -1 -2 -2 -179 A     2 -1 -1 -1 -1  1 -1 -2 -2 -2 -2 -1 -1 -3 -1  0  4 -3 -2 -180 L     1 -1 -1  0 -2  0  2 -2 -2 -1  0 -1 -1 -2 -2  1  1 -3 -2 -181 D    -2 -2  0  5 -4  0  4 -2 -1 -3 -4 -1 -3 -3 -2  0  1 -4 -3 -382 G     0 -3  0 -2 -4 -3 -3  7 -3 -5 -5 -3 -4 -4 -3  0 -3 -3 -4 -483 P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7  1 -1 -4 -3 -384 V     0 -2 -2 -3 -2  1 -1 -3 -3  1  1 -2  0 -2 -2  0 -1 -3 -2  485 C     0 -3 -3 -3 10 -3 -4 -3 -3 -2 -2 -3 -2 -3 -3  0 -1 -3 -3 -286 D     1 -2 -1  3  4 -1 -1 -2 -2 -1 -2 -2  0  0 -2  1  0 -3 -2  087 Q    -1  3 -1 -2 -3  4  0 -3 -1 -2 -2  2 -1 -3 -2 -1 -1 -3 -2  088 P    -1 -2 -1 -2 -2 -2 -2 -3 -3 -2 -2 -2 -2 -4  6  0  4 -4 -3 -189 E    -2  2  0  2 -4  0  5 -2 -1 -4 -3  1 -2 -4 -2 -1 -2 -4 -3 -390 C     0 -4 -4 -4 10 -4 -5 -4 -4 -2 -2 -4 -2 -3 -4 -2 -2 -3 -3 -291 P    -1 -2 -2 -2 -3 -2 -2 -3 -3 -1 -2 -2 -2 -3  6 -1  2 -4 -3  092 K     0  3  0  0 -3  0  3 -2 -1 -3 -3  3 -2 -3 -2  0 -1 -3 -2 -293 I    -1 -3 -3 -4 -1 -2 -3 -4 -3  3  3 -2  0 -1 -3 -2  1 -3 -2  194 H    -1 -1  0 -1  4 -1 -1 -2  7 -3 -3 -1 -2 -2  2  1 -1 -3  0 -395 P     0 -2 -2 -1 -3 -1  1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -296 K     1  3 -1 -2 -2  0  0 -2  0 -2 -2  2 -1 -1 -2  1 -1 -2  2 -297 C     0 -3 -3 -3 10 -3 -4 -3 -3 -2 -2 -3 -2 -3  2 -1 -1 -3 -3 -298 T    -1 -3 -2 -3 -1 -2 -3 -4 -3  4  0 -3  1 -1 -3 -1  3 -3 -2  299 K    -2  1  0 -1 -4  0  2 -2  7 -3 -3  2 -2 -2 -2 -1 -2 -3  0 -3100 V    -1 -3 -3 -3 -1 -3 -3 -4 -3  3  0 -3  0 -1 -3 -2 -1 -3 -1  5101 E     1 -1  0  3 -2  0  2 -1 -1 -3 -3  1 -2 -3 -1  2  0 -4 -3 -2102 H    -2  2  1 -1 -3  0 -1 -2  7 -3 -2  0 -2 -1 -2 -1  1 -2  3 -2103 N    -1  0  3 -1 -2  0  0 -1  4 -2 -2  1 -2  0 -2  1  0 -1  4 -2104 G    -1 -1  0  2 -3  4  2  2 -1 -4 -3  0 -2 -3 -2  0 -1 -3 -2 -3105 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1106 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1107 P    -1 -3 -3 -2 -3 -2 -2 -3 -3 -1 -2 -2 -2 -4  7 -2 -1 -4 -3  0108 E    -1  2  0  2 -3  4  2 -2 -1 -2 -1  0 -1 -3 -2 -1 -1 -3 -2  0109 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1110 K    -1  0  0  0 -3  0  3 -2 -1 -1 -2  3 -1 -3 -2  1 -1 -3 -2  1111 E     2  2 -1  0 -3  0  4 -2 -1 -3 -2  2 -2 -3 -2  0 -1 -3 -2 -2112 V    -1  1 -1 -1 -3 -1  1  1 -2  1 -1  1 -1 -2 -2 -1 -1 -3 -2  2113 K     0  0  0 -1 -3  0  0  4 -2 -4 -3  4 -2 -3 -2  1 -1 -3 -3 -3114 N    -2  0  6  0 -3  0  0  0  0 -3 -3  2 -2 -3 -2  0  0 -4 -2 -3115 F    -1 -3 -3 -3 -2 -2 -2 -3  0  0  0 -2  0  4 -3 -2 -1  0  6  1116 C     0 -3 -3 -3 10 -3 -5 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1117 E    -1 -1  0  3 -3  0  4 -2 -1 -2  0  0 -2 -3 -2  0  1 -3 -3 -2118 Y    -2 -2 -2 -2 -3 -1  1 -3  0 -1 -1 -2 -1  5 -3 -2 -2  0  6 -2119 H    -2  5  2 -2 -3  0 -1 -2  4 -2 -1  0  3 -2 -2 -1 -1 -3 -1 -2120 G    -1 -2  2 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -3 -3 -3121 K    -1  4 -1 -2 -3  0  0 -3 -1 -1 -2  5 -1 -3 -2 -1 -1 -3 -2  0122 N    -1 -2  2 -2 -2 -2 -2 -2 -2  2  0 -2  0 -2 -2  0  4 -3 -2  1123 Y    -2 -3 -3 -3 -2 -2 -3 -3  0 -1 -1 -3 -1  4 -4 -2 -2  1  8 -1124 K     0  1  0 -1 -3  2  2 -2  4 -3 -2  2 -1 -1 -2 -1 -2 -2  3 -2125 I    -1 -2  2 -2 -2 -2 -2 -2 -2  2  1 -2  0 -1 -2  0  1 -3 -2  2126 L    -1 -2  2 -2 -2 -2 -2  3 -2  0  3 -2  0 -1 -3 -1 -1 -3 -2 -1127 E    -1  0  0  1 -4  3  6 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2128 E    -1 -1  2  0 -3  0  4 -2  0 -3 -3  0 -2 -1 -2  0  1 -2  3 -2129 F    -2 -3 -3 -3 -2 -3 -3 -3 -1  0  0 -3  0  7 -5 -2 -2  0  2 -1130 K    -1  1  2 -1 -3  2  0 -2 -1 -1  0  2  1 -2 -2 -1 -1 -3 -2  0131 P    -1 -3 -3 -3 -2 -2 -2 -3 -3  1  2 -2  0 -2  3 -2  0 -3 -2  3132 S     0  0  1  2  2 -1  0 -1 -1 -3 -3 -1 -2 -3  1  4  1 -4 -3 -2133 P    -1 -2 -2 -1 -3 -1  1 -3 -2 -2 -3 -1 -2 -4  7 -1 -1 -4 -3  0134 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1  0 -2 -2 -1135 E    -1  1 -1  0 -3  0  5 -3 -1 -1  1  0 -1 -2 -2 -1 -1 -3 -2 -1136 W    -1  2 -1 -2 -3  2  0 -2  3 -2  0  1 -1 -2 -2  1 -1  4 -1 -2137 C     0  0 -3 -3 10 -3 -4 -3 -3  0 -1 -3 -1 -2 -3 -1  0 -3 -2 -1138 R    -1  4 -1 -2 -2  0 -1 -3 -1  2 -1  2 -1 -1 -2 -1  1 -2  1  0139 C     0 -4 -4 -4 10 -4 -5 -4 -4 -1 -1 -4 -1 -2 -4 -1 -1 -2 -2 -1140 E    -1 -1  0  2 -3  0  5 -3 -1 -2  0  0 -1 -3 -2  0  1 -3 -2 -2141 P     1 -2  1 -2 -2 -1 -1 -2 -2  0  0 -1 -1 -2  2  1  1 -3 -2  0142 S    -1 -1  4  2 -3  1  0  2 -1 -3 -3 -1 -2 -3 -2  2 -1 -4 -3 -3143 N    -1  1  2 -1 -3 -1 -1  4 -1 -4 -4  1 -2 -3 -2  1 -1 -3 -3 -3144 E    -1  0 -1  0 -3  0  4 -3 -1  1 -1  0 -1 -2 -2 -1  1 -3 -2  1145 V     3 -2 -3 -3 -1 -2 -2 -2 -3  0  0 -2  0 -2 -2 -1 -1 -3 -2  3146 H    -2  1 -2 -3 -2 -1 -2 -3  3  0  2 -1  0  2 -3 -2 -2 -1  4 -1147 C    -1  0 -3 -3 10 -3 -3 -3 -3 -2 -2 -2 -2 -3  1 -1 -1 -3 -3 -2148 V     0 -2 -1 -2 -1 -1 -2 -2 -3  0  1 -1  0 -2 -2  2  3 -3 -2  2149 V    -1 -3 -3 -3  1 -2 -2 -3 -3  2  0 -2  0 -2  2 -2 -1 -4 -2  5150 A     3 -2 -2 -2  2 -1 -1 -1 -2  0 -1 -1 -1 -2 -2  2  0 -3 -2  2151 D     1 -2  0  5 -2  1  0  0 -2 -3 -3 -1 -2 -3 -2  1 -1 -4 -3 -2152 C    -1 -3 -3 -3 10 -3 -4  0 -3 -2 -2 -3 -1  1 -4 -1 -2 -2 -1 -2153 A     2 -2 -2 -2 -2 -1  0 -2 -2 -1  0 -1 -1  1  4 -1 -1 -3 -1 -1154 V     2 -1 -2 -1 -2  4  1 -2 -2 -1 -2  0 -1 -3  3 -1 -1 -3 -2  0155 P    -1 -2 -1  1 -2 -2 -1 -2 -2  1  0 -2 -1 -2  4  0  2 -4 -3  0156 E    -2  1 -1  0 -4  0  3 -3  2 -3 -3  1 -2  2  3 -1 -2 -3 -1 -3157 C    -1 -3 -3 -3  9  1 -3 -3 -3 -2 -1 -3 -1 -2 -3 -2 -2  5 -2 -2158 V    -1  0 -2 -3 -2  0 -2 -3 -3  2  0 -2  0  1 -2 -2  1 -2 -1  4159 N    -2  1  4  4 -3  0  0 -1  0 -3 -3 -1 -2 -1 -2  0 -1  3  3 -3160 P    -1 -2 -2 -1 -3 -1 -1 -2 -2 -1 -3  1 -2 -4  7  0 -1 -4 -3 -2161 V    -1 -3 -3 -3 -2  0  0 -4 -3  4  0 -2  0  2 -3 -2 -1 -2  0  3162 Y    -2  1 -1 -3 -3 -1 -1 -3  4 -2  0 -1 -1  0 -3  0 -2  0  6 -2163 E    -1 -1 -1  0 -3  3  4 -3 -1 -2 -1  0 -1 -3  3  0  0 -3 -2 -2164 P    -1 -1 -2 -1 -3  0  1 -3 -1 -2 -1  0 -2 -2  5 -1 -1 -2  2 -2165 E    -1 -2  1  2 -3 -1  1  3 -1 -3 -3 -1 -3 -1 -2  0 -1 -2  2 -3166 Q    -2  0 -1 -1 -3  4  2 -3  3 -3  0  2 -1 -2 -2 -1 -2  5  0 -2167 C     0 -3 -3 -4  9 -3 -4 -4 -3  0  0 -3 -1 -2 -3 -2 -1 -2 -2  0168 C     0 -3 -3 -3  9 -3 -3 -3 -3  0 -1 -3 -1 -2 -3  0 -1 -3 -2  1169 P     0 -2 -3 -2 -3 -1 -2 -2 -3 -2  0 -1 -1 -3  7 -1 -1 -4 -3 -1170 V    -1 -2 -2 -2 -2 -1  1 -3 -2  3  0  1  0 -2 -2 -2 -1 -3 -2  4171 C    -1 -2 -3 -3  9 -2 -3 -3 -3 -1  0  1 -1 -2 -3 -1 -1 -3 -2 -1172 K    -1  1  0 -1 -3  0  0 -2 -1 -3 -2  6 -1 -3 -1  0 -1 -3 -2 -2173 N     2 -1  3  2 -2 -1  0  2 -1 -3 -3 -1 -2 -3 -2  1 -1 -4 -3 -2174 G     0 -1  0 -1 -3 -2 -2  5 -2 -4 -3  0 -3 -3 -2  0 -2 -2 -3 -3175 P    -1 -2  1 -1 -3 -1  0 -2 -2 -3 -3 -1 -2 -4  6 -1 -1 -4 -3 -2176 N    -1 -1  5  0 -3 -1 -1 -1  0 -3 -3 -1 -2 -2 -2  1  0  6 -1 -3177 C    -1 -2 -2 -2  8 -2 -2 -3  3 -2 -2 -2 -2 -2  1 -1  0 -3 -1 -2178 F    -2 -2 -1 -2 -3 -2 -2  1  4 -2 -2  0 -1  4  0 -1 -2  0  3 -2179 A     2 -2 -2 -3 -1 -2 -2  2 -3  0  1 -2  0  0 -2 -1 -1 -3 -1  1180 G     0 -1  0  0 -2 -1  1  3 -2 -2  0 -1 -1 -2  1  1  1 -3 -2 -1181 T     0 -2 -1 -1 -1 -1 -1 -2 -2  1 -1 -1 -1 -2  1  0  5 -3 -2  0182 T     1 -1  0 -1 -1  2  0 -1 -2 -1  0 -1  0 -2 -1  1  3 -3 -2 -1183 I     1 -3 -2 -3 -1 -2 -2 -2 -3  3  0 -2  0 -1 -2  0  0 -3 -1  3184 I    -1 -3 -3 -3 -2 -3 -3  1 -3  5  0 -3  0  2 -3 -2 -1 -2  0  1185 P    -1 -2 -2 -1 -3  0  1 -2 -2 -2  0 -1 -1 -3  6 -1 -1 -4 -3 -2186 A     4  1 -2 -2  0 -1 -1  0 -2 -1 -1  0 -1 -2 -1  0  0 -3 -2  0187 G     0 -2  0 -1 -3 -2 -2  6 -2 -2 -3 -2 -2 -3 -2  0 -2 -2 -3  0188 I    -1  2 -1  0 -3  0  3 -3 -1  2 -1  0 -1 -2  1 -1 -1 -3 -2  0189 E    -1 -1 -1  0 -3  0  4 -2 -1  0 -2  0 -1 -3  3 -1 -1 -3 -2 -1190 V     0  0 -1  1 -2 -1 -1 -2 -2  0  0 -1  0 -2 -2 -1  2 -3 -2  3191 K    -1  0 -1 -1 -3  0  1 -2 -1 -2 -2  4 -1 -2 -2 -1 -1  7 -1  0192 V     0 -1 -1 -2 -2  1  0 -3 -2  0  0  1  0 -2 -2 -1  2 -3 -1  3193 D    -2 -2  0  6 -3  0  1 -1 -1 -3 -4 -1 -3 -3 -1  0  1 -4 -3 -3194 E     1 -1 -1  1 -2  0  4 -2 -1 -1 -2  0 -1 -2 -1  0 -1 -3 -2  1195 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1196 N    -1 -1  3 -1 -2 -1 -1 -1 -1 -1 -1 -1 -1  2 -2  0  4 -2  0 -1197 I    -1 -1 -2 -3  5 -2 -2 -3 -3  4  0  1  0 -1 -3 -1 -1 -3 -1  1198 C     0 -3 -2 -3  9 -3 -3 -3 -3 -1 -1 -3 -1 -2 -3 -1  1 -2 -2 -1199 H    -2  2  0 -2 -3  0  0 -2  7 -3 -2  0 -2  0 -2 -1 -2 -1  3 -3200 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1201 H    -1  0  0 -1 -2  0  0 -2  7 -2 -2 -1 -2 -1 -2  0  3 -2  0 -2202 N    -2 -1  4  3 -3  0  0 -1  0 -2 -2 -1 -2  0 -2  0 -1 -1  4 -2203 G     0 -1  0  0 -3  0  3  5 -1 -4 -4 -1 -3 -3 -2  0 -2 -2 -3 -3204 D    -1  0  0  4 -3  3  3 -2  0 -3 -3  0 -2 -3 -1  0 -1 -3 -2 -2205 W    -1 -2  0  3 -3 -1  0  3 -2 -3 -3 -2 -2 -1 -2 -1 -2  8  0 -3206 W    -2 -3 -2 -3 -2 -2 -3  3 -2 -3 -3 -3 -1  0 -3 -2 -2 11  0 -3207 K    -1  3  0 -2 -3  0  0 -2  0 -2 -2  3 -1  0 -2 -1 -1 -1  4 -2208 P    -1 -1 -1 -1 -2  3  0 -3 -1 -1  1  0  0 -2  4 -1 -1 -3 -2 -1209 A     5 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  0  0 -3 -2  0210 Q    -1  0 -1 -1 -2  3  0 -2 -1 -1  0  0  4 -1 -1  0  2 -2 -1  0211 C     0 -3 -3 -3 10 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1212 S     0 -1  0  0 -1  0  0 -1 -1 -2 -2  0 -1 -2 -1  4  3 -3 -2 -1213 K    -1  5  0 -2 -3  0  0 -2  0 -3 -2  4 -1 -3 -2 -1 -1 -3 -2 -3214 R    -1  3  0 -2 -2  0 -1 -3  6 -1  1  0  0 -1 -2 -1 -1 -2  0 -1215 E    -1  0  0  1 -4  1  5 -2  0 -3 -3  3 -2 -3 -1  0 -1 -3 -2 -2216 C     0 -2  3 -1  9 -2 -2 -2 -1 -1 -1 -2 -1 -2 -3  0 -1 -3 -2 -1217 Q    -1  2 -1 -1  6  3  0 -2 -1 -2 -2  1 -1 -3 -2  0 -1 -2 -2 -2218 G    -1  0  3  0 -3  3  0  3  0 -3 -3  0 -1 -3 -2  0 -1 -3 -2 -3219 K    -1  0  0 -2 -2  0  0 -2  5  0  0  3  3 -1 -2 -1 -1 -2  0  0220 Q    -1  0  0  0 -3  4  4 -2  0 -3 -2  0 -1 -3 -1  0 -1 -2 -1 -2221 T     0 -1  0 -1 -2 -1 -1  4 -2 -2 -2 -1 -2 -2 -1  0  4 -2 -2 -1222 V     0 -2 -2 -3 -1 -1 -2 -3 -2  2  1 -1  4  0 -2 -1  0 -2 -1  3(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
7.如权利要求6所述的多肽,其特征在于,所述多肽由权利要求6所述的多肽组成。
8.如权利要求6或7所述的多肽,其特征在于,所述多肽的最大E阈值是10-2,所述多肽的最小E阈值较好为等于或少于10-5、等于或少于10-10、等于或少于10-50,最好等于或少于10-70。
9.一种分离的多肽,其特征在于,所述多肽(i)包括一满足以下共有基酸序列的多肽:[GTDFC](0,1)-[CF](0,1)-[VMSED](0,1)-[DEA](0,1)-[DENG](0,1)-[SQNDG](0,1)-[SGR](0,1)-[FIV](0,1)-[VYFE](0,1)-[YFS](0,1)-[KVAGP](0,1)-[LIG](0,1)-[GE](0,1)-[EWQM](0,1)-[RKYFQVI](0,1)-[FYWT](0,1)-[FALYRTS](0,1)-[PED](0,1)-[GS](0,1)-[HPDS](0,1)-[STHP](0,1)-[CNAT](0,1)-[CTE](0,1)-[PQRL](0,1)-C(0,1)-[VELT](0,1)-C(0,1)-[TAQ](0,1)-[ELATSD](0,1)-[EDT]-G-[PS]-[VLAQS]-[CS]-[DAMSTFCV]-[QRKV]-R(0,1)-[PT]-[ERDK]-C-[PTV]-[KERSA]-[LIVT]-[HPSC]-[PAE]-[KRASY]-[CP]-[TIVM]-[HKRE]-[VI]-[DESAKP]-[HTNRYG]-[NSTYHK](0,1)-[PA](0,1)-[TG](0,1)-[QGDES]-C-C-[PV]-[EQRDLV]-C;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
10.如权利要求9所述的多肽,其特征在于,所述多肽由一满足以下共有氨基酸序列的多肽组成:[GTDFC](0,1)-[CF](0,1)-[VMSED](0,1)-[DEA](0,1)-[DENG](0,1)-[SQNDG](0,1)-[SGR](0,1)-[FIV](0,1)-[VYFE](0,1)-[YFS](0,1)-[KVAGP](0,1)-[LIG](0,1)-[GE](0,1)-[EWQM](0,1)-[RKYFQVI](0,1)-[FYWT](0,1)-[FALYRTS](0,1)-[PED](0,1)-[GS](0,1)-[HPDS](0,1)-[STHP](0,1)-[CNAT](0,1)-[CTE](0,1)-[PQRL](0,1)-C(0,1)-[VELT](0,1)-C(0,1)-[TAQ](0,1)-[ELATSD](0,1)-[EDT]-G-[PS]-[VLAQS]-[CS]-[DAMSTFCV]-[QRKV]-R(0,1)-[PT]-[ERDK]-C-[PTV]-[KERSA]-[LIVT]-[HPSC]-[PAE]-[KRASY]-[CP]-[TIVM]-[HKRE]-[VI]-[DESAKP]-[HTNRYG]-[NSTYHK](0,1)-[PA](0,1)-[TG](0,1)-[QGDES]-C-C-[PV]-[EQRDLV]-C。
11.一种多肽,其特征在于,所述多肽:(i)包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:39、SEQ IDNO:41、SEQ ID NO:43和/或SEQ ID NO:45所示的氨基酸序列;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
12.如权利要求11所述的多肽,其特征在于,所述多肽:(i)由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45所示的氨基酸序列组成;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
13.一种多肽,其特征在于,所述多肽:(i)包括SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51和/或SEQ ID NO:53所示的氨基酸序列;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
14.如权利要求13所述的多肽,其特征在于,所述多肽:(i)由SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51或SEQ ID NO:53所示的氨基酸序列组成;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
15.一种多肽,其特征在于,所述多肽:(i)包括SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、EQ ID NO:28、SEQ ID NO:30、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59和/或SEQ ID NO:61所示的氨基酸序列;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
16.如权利要求15所述的多肽,其特征在于,所述多肽:(i)由SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、EQ ID NO:28、SEQ ID NO:30、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59或SEQ ID NO:61所示的氨基酸序列组成;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
17.一种多肽,它是权利要求6至16中任一项(iii)部分所述的功能等同物,其特征在于,所述多肽与以下序列所示的氨基酸序列同源:SEQ IDNO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQID NO:28,SEQ ID NO:30,SEQ ID NO:39,SEQ ID NO:41,SEQ IDNO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ IDNO:59或SEQ ID NO:61,以及是含有vWFC结构域的蛋白质家族成员。
18.一种多肽,它是权利要求6至17中任一项所述的片段或功能等同物,其特征在于,所述多肽与以下氨基酸序列或其活性片段的序列同一性大于80%:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ IDNO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:39,SEQ IDNO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47或SEQ IDNO:49,最好大于85%、90%、95%、98%或99%。
19.一种多肽,它是权利要求6至18中任一项所述的功能等同物,其特征在于,所述多肽与具有以下氨基酸序列的多肽共享较高平的结构同源性:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ IDNO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ IDNO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:39,SEQ IDNO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ IDNO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59或SEQ ID NO:61。
20.一种多肽,它是权利要求6至16以及权利要求18所述的片段,所述片段具有与权利要求6至16中任一项部分(i)所述多肽相同的抗原决定簇,其特征在于,所述多肽由来自以下氨基酸序列所示的7或以上个氨基酸残基组成:SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:39,SEQ IDNO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ IDNO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59或SEQ ID NO:61。
21.一种编码上述权利要求中任一项所述的多肽的纯化核酸分子。
22.如权利要求21所述的纯化核酸分子,其特征在于,所述纯化核酸分子包括以下序列所示的核酸序列:SEQ ID NO:1,SEQ ID NO:3,SEQ IDNO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ IDNO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ IDNO:54,SEQ ID NO:56,SEQ ID NO:58和/或SEQ ID NO:60,或者是其冗余等同物或片段。
23.如权利要求21所述的纯化核酸分子,其特征在于,所述纯化核酸分子由以下序列所示的核酸序列组成:SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27SEQ ID NO:29,SEQID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ IDNO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ IDNO:54,SEQ IDNO:56,SEQ ID NO:58和/或SEQ IDNO:60,或者是其冗余等同物或片段。
24.一种在高度严谨条件下与权利要求21至25中任一项所述的核酸分子杂交的纯化核酸分子。
25.一种含有权利要求21至24中任一项所述的核酸分子的载体。
26.一种用权利要求25所述的载体转化的宿主细胞。
27.一种配体,其特征在于:所述配体与权利要求6至20中任一项所述的含有vWFC结构域的蛋白质家族多肽特异性结合。
28.如权利要求27所述的配体,其特征在于:所述配体是一种抗体
29.一种增加或降低权利要求6至20中任一项所述的多肽的表达水平或活性的化合物。
30.如权利要求29所述的化合物,其特征在于:所述化合物与权利要求6至20中任一项所述的多肽结合,并且不会诱导该多肽产生任何生物作用。
31.如权利要求30所述的化合物,其特征在于:所述化合物是天然或修饰的基质、配体、酶、受体或者结构或功能类似物。
32.如权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物,在治疗或诊断疾病中的用途。
33.一种诊断患者疾病的方法,其特征在于:所述方法包括评估所述患者组织中编码权利要求6至20中任一项所述多肽的天然基因的表达水平,或者评估权利要求6至20中任一项所述多肽的活性,并将所述表达水平或者活性与对照水平作比较,若该水平与所述对照水平不同,则表示患病。
34.如权利要求33所述的方法,其特征在于:所述方法在体外进行。
35.如权利要求33或34所述的方法,其特征在于:所述方法包括以下步骤:(a)在适合形成配体-多肽复合物的条件下,将权利要求27或28所述的配体与生物样品接触;以及(b)检测所述复合物。
36.如权利要求33或34所述的方法,其特征在于:所述方法包括以下步骤:(a)在允许权利要求21至24中任何一项所述的核酸分子和核酸探针之间形成杂交复合物的严谨条件下,将患者的组织样品与该探针接触;(b)在步骤(a)使用的相同条件下,将对照样品与所述探针接触;以及(c)检测所述样品中是否存在杂交复合物,其中,检测到患者样品中杂交复合物的水平与对照样品中杂交复合物水平不同,表示患病。
37.如权利要求33或34所述的方法,其特征在于:所述方法包括以下步骤:(a)在允许权利要求21至24中任何一项所述的核酸分子和核酸引物之间形成杂交复合物的严谨条件下,将患者组织的核酸样品与该引物接触;(b)在步骤(a)使用的相同条件下,将对照样品与所述引物接触;(c)扩增样品中的核酸;以及(d)检测患者和对照样品中扩增核酸的水平;其中,检测到患者样品的扩增核酸水平与对照样品的扩增核酸水平明显不同,表示患病。
38.如权利要求33或34所述的方法,其特征在于:所述方法包括:(a)从有待测试疾病的患者中获得组织样品;(b)从所述组织样品中分离权利要求21至24中任何一项所述的核酸分子;以及(c)通过检测核酸分子中与疾病相关的突变是否存在,诊断患者疾病,若存在,表示患病。
39.如权利要求38所述的方法,其特征在于:所述方法还包括扩增核酸分子以形成扩增产物,以及检测该扩增产物中是否存在突变。
40.如权利要求38或39所述的方法,其特征在于:所述患者是否存在突变是这样检测的:将所述核酸分子与在严谨条件下和所述核酸分子杂交的核酸探针接触,形成杂交双链分子,该杂交双链分子在对应于与疾病相关的突变的任何部分具有核酸探针链的未杂交部分;以及检测探针链的未杂交部分是否存在,表示与疾病相关的突变存在或不存在。
41.如权利要求33至40中任一项所述的方法,其特征在于:所述疾病包括但不限于,细胞增殖性疾病,包括肿瘤、黑素瘤、癌、结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤;骨髓增生性疾病,例如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板减少症、血管生成障碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏症、炎症性肠疾病、关节炎、屑病、呼吸道发炎、哮喘和器官移植排斥;心血管疾病,包括高血压、水肿、心绞痛、动脉硬化症、血栓症、败血症、休克、再灌注损伤和缺血;神经系统疾病,包括中枢神经系统疾病、阿茨海默氏病、脑损伤、肌萎缩性侧索硬化症和疼痛;发育障碍,例如与软骨和骨架发育相关的疾病,包括骨关节炎;代谢性疾病,包括糖尿病、骨质疏松和肥胖、AIDS和肾病;感染,包括病毒性感染、细菌性感染、真菌性感染和寄生虫感染以及其它病理病症。
42.如权利要求33至40中任一项所述的方法,其特征在于,所述疾病是涉及淋巴细胞抗原的疾病。
43.如权利要求6至20中任一项所述的多肽作为含有vWFC结构域的蛋白质的用途。
44.一种药物组合物,其特征在于:所述组合物含有权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求26所述的宿主细胞、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物。
45.一种疫苗组合物,其特征在于:所述组合物含有权利要求6至20中任一项所述的多肽或权利要求21至24中任一项所述的核酸分子。
46.如权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求26所述的宿主细胞、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物、或者权利要求44所述的药物组合物在制备治疗以下疾病的药物中的用途:包括但不限于,细胞增殖性疾病,包括肿瘤、黑素瘤、肺癌、结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤;骨髓增生性疾病,例如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板减少症、血管生成障碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏症、炎症性肠疾病、关节炎、银屑病、呼吸道发炎、哮喘和器官移植排斥;心血管疾病,包括高血压、水肿、心绞痛、动脉硬化症、血栓症、败血症、休克、再灌注损伤和缺血;神经系统疾病,包括中枢神经系统疾病、阿耳茨海默氏病、脑损伤、肌萎缩性侧索硬化症和疼痛;发育障碍,例如与软骨和骨架发育相关的疾病,包括骨关节炎;代谢性疾病,包括糖尿病、骨质疏松和肥胖、AIDS和肾病;感染,包括病毒性感染、细菌性感染、真菌性感染和寄生虫感染以及其它病理病症。
47.如权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求26所述的宿主细胞、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物、或者权利要求44所述的药物组合物在制备治疗涉及淋巴抗原的疾病的药物中的用途。
48.一种治疗患者疾病的方法,其特征在于:所述方法包括把权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求26所述的宿主细胞、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物、或者权利要求44所述的药物组合物给予该患者。
49.如权利要求48所述的方法,其特征在于:当与健康受试者中多肽的天然基因的表达水平或者活性相比,病患者的该表达水平或活性是较低的,给予该患者的多肽、核酸分子、载体、配体、化合物或组合物是激动剂。
50.如权利要求48所述的方法,其特征在于:当与健康受试者中多肽的天然基因的表达水平或者活性相比,病患者的该表达水平或活性是较高的,给予该患者的多肽、核酸分子、载体、配体、化合物或组合物是拮抗剂。
51.一种监测治疗患者疾病的方法,其特征在于:所述方法包括在一段时间内监测患者组织中权利要求6至20中任一项所述的多肽的表达水平或活性、或权利要求21至24中任一项所述的核酸分子的表达水平,若在该时间内所述表达水平或活性趋向于对照水平,表示该疾病获得缓解。
52.一种鉴定有效地治疗和/或诊断疾病的化合物的方法,其特征在于:所述方法包括将权利要求6至20中任一项所述的多肽、或者权利要求21至24中任一项所述的核酸分子与怀疑对所述多肽或核酸分子有结合亲和的一或多种化合物接触,以及选择能特异性地结合所述核酸分子或多肽的化合物。
53.一种诊断疾病的试剂盒,其特征在于:所述试剂盒包括第一容器,它含有在严谨条件下与权利要求21至24中任一项所述的核酸分子杂交的核酸探针;第二容器,它含有用来扩增该核酸分子的引物;以及该探针和引物的使用说明书,方便诊断疾病。
54.如权利要求53所述的试剂盒,其特征在于:所述试剂盒还包括装有消化未杂交RNA的试剂的第三容器。
55.一种试剂盒,其特征在于:所述试剂盒包括核酸分子阵列,其中至少一个核酸分子是权利要求21至24中任一项所述的核酸分子。
56.一种试剂盒,其特征在于:所述试剂盒包括一或多种与权利要求6至26中任一项所述多肽结合的抗体;以及一种用来检测所述抗体与所述多肽之间结合反应的试剂。
57.一种转基因或剔除非人动物,其特征在于:所述动物被转化为更高水平、更低水平或不表达权利要求6至20中任一项所述的多肽。
58.一种筛选有效治疗疾病的化合物的方法,其特征在于:所述方法包括将权利要求57所述的非人转基因动物与候选化合物接触,并测定该化合物对动物疾病的影响。
59.如权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求26所述的宿主细胞、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物、或者权利要求44所述的药物组合物在体外授精中的用途或作为避孕药的用途。
60.如权利要求6至20中任一项所述的多肽、权利要求21至24中任一项所述的核酸分子、权利要求25所述的载体、权利要求26所述的宿主细胞、权利要求27或28所述的配体、或者权利要求29至31中任一项所述的化合物、或者权利要求44所述的药物组合物在制备避孕药中的用途。

说明书全文

分泌性蛋白质家族

技术领域

发明涉及一族新颖的分泌性蛋白质,称作SECFAM3家族,它的家族成员包括新颖蛋白质INSP123、INSP124和INSP125,经本发明鉴定为分泌性蛋白质,含有长50-60个基酸的冯·维勒布兰德因子C型(也叫血管性血友病因子C型,vWFC)结构域,以及含有10个保守性半胱氨酸残基;本发明还涉及这些蛋白质和编码基因的核酸序列在诊断、预防治疗疾病中的用途。
本文所引用的全部出版物、专利和专利申请,均纳入其全文作为参考。
发明背景目前,药物发现方法正蕴酿着一场根本革命,因为功能基因组学年代已经来临。术语“功能基因组学”应用于使用生物信息学工具将功能归因于感兴趣的蛋白质序列的方法。这些工具正日益显示其必要性,因为序列数据产生的速度远远高于研究实验室将功能划分给这些蛋白质序列的能
随着生物信息学工具的功效和准确性提高,这些工具正快速取代生物化学特性鉴定的常规技术。事实上,鉴定本发明所用的先进生物信息学工具现在能够输出可获得较高置信度的结果。
各所研究院和商业机构正在检查已有的序列数据,并且逐渐获得重大发现。然而,仍然有必要鉴定和特性分析其它基因和它们编码的多肽,作为研究和药物发现的目标。
简介分泌性蛋白质细胞制造和分泌胞外蛋白质的能力是许多生物过程的中心。酶、生长因子、胞外基质蛋白和信号传导分子全部由细胞分泌出来。这是分泌小泡与质膜融合所致。多数情况下,但不是所有情况,蛋白质被信号肽导入内质网,并进入分泌小泡。信号肽是顺式作用序列,影响多肽链从细胞质转运至膜结合室如分泌小泡。靶向分泌小泡的多肽或者分泌进入胞外基质,或者留在质膜内。留在质膜内的多肽有一或多个跨膜结构域。在细胞机能发挥中心作用的分泌性蛋白质的例子是细胞因子、激素、胞外基质蛋白(粘附分子)、蛋白酶及生长和分化因子。
含血管性血友病因子C型结构域的蛋白质血管性血友病因子C型(vWFC)结构域的特点是在长约56个氨基酸的区域内有一个含10个半胱氨酸的保守性空间分布型(spatial pattern)。这些结构域是胞外多结构域大蛋白质的共同特征,包括Chordin、血小板反应蛋白(Thombospondin)、IIA型原骨胶原和Ventroptin。它们也可在与调节发育如短原肠胚形成(SOG)相关的小蛋白质中找到。在血管性血友病因子蛋白质中首次鉴定到vWFC结构域。已经发现,所述的血管性血友病因子蛋白质通过在受伤部位与凝血因子VIII形成非共价复合物而参与血板-血管内皮细胞相互作用,由此在血管受损部位的血液凝固中发挥重要作用。在此情况下,一般认为,vWFC结构域参与蛋白质低聚合反应。在其它形成复合物的蛋白质中也找到这种结构域,表明它在形成复合物过程中对于蛋白质-蛋白质相互作用有一定的色。
已经有人强调了vWFC结构域在发育过程中的作用。Sandell LJ等(JMusculoskel.Interact 2(6):521-523,2002)提出,两种蛋白质Chordin和IIA型原骨胶原通过它们的vWFC结构域与骨形态形成蛋白(BMP)拮抗性结合。此拮抗性结合在骨架发育过程中能够调节软骨和骨骼的发育。还有人提出,BMP在软骨和骨骼过度生长的病症如骨关节炎中也发挥一定作用。所以,含有vWFC结构域的治疗性蛋白质能够帮助调控这些病症的进展是可能的。
所以,关于这些结构域的认识越多,对引起上述疾病状态和相关疾病状态的隐伏途径的理解越深,而且可以研究更有效的基因和/或药物疗法以治疗这些病症。
本文详细描述了一族全新的分泌性蛋白质配体的鉴定。分泌性蛋白质配体的定义是一种由特定细胞分泌,而且通过调节(包括配体拮抗作用,如Dan家族那样)关连受体的活性和下游信号转导途径可在同一个或另一个细胞内产生表型应答的蛋白质。例如,已知的分泌性蛋白质配体家族是糖蛋白激素家族。
卵泡刺激素(FSH)是糖蛋白激素家族其中一个成员。男性的FSH由脑下垂体前叶的细胞分泌,进入血流,然后再与睾丸支持细胞上的关连受体结合,调节精子生成过程。女性的FSH与卵巢的卵泡膜细胞、基质细胞和颗粒细胞上的受体结合,调节排卵。男性和女性缺乏FSH均可导致不孕症。给予蛋白质治疗剂形式的FSH可恢复FSH平,采用这一方法可对抗FSH触发的不孕症。可获得的FSH例如是GONAL-fTM(Serono)。
根据这一例子类推,可以看到鉴定新的分泌性配体蛋白质家族,为界定新颖配体-受体途径,特别是为详细描述配体结合的表型结果铺平了道路。若鉴定到人的病症是该新颖分泌性配体蛋白质家族中任一成员机能不良所引起的结果,那么,可给予该成员作为蛋白质治疗剂来对抗该病症。

发明内容

本发明基于如下发现:INSP123、INSP124和INSP125多肽是分泌性蛋白质,具体地说,它们是含有vWFC结构域的分泌性蛋白质。INSP123、INSP124和INSP125一起构成本发明鉴定的SECFAM3蛋白质家族的一部分。可以预测,INSP123、INSP124和INSP125也可以是具有变体功能的剪接变体,例如对它们的结合配偶体有不同的亲和力。
SECFAM3蛋白质家族的注释现时并无关于本发明蛋白质的标注文字(annotation),本发明的蛋白质含有一个强的分泌性蛋白质特征(signature),为信号肽形式,可与类似蛋白质聚集在一起,获得其它物种的动物直向同源物支持。进一步检查可构建一族迄今为止未被定性分析过的蛋白质,该族蛋白质包含2个人基因,并且包括脊椎动物和脊索动物直向同源物,目前共含有22个序列。这一族相关的序列此处称之“SECFAM3家族”。
这22个序列全部都具有一个强的信号肽区,该区的组成是可变的,其余为极相似的序列。
本发明第一方面一实施例提供一种鉴定SECFAM3家族成员的方法,该方法包括:搜索翻译核酸序列或多肽序列数据库,鉴定一个与下列序列轮廓(sequence profile)相匹配的多肽序列:A   R   N   D   C   Q   E   G   H   I   L   K   M   F   P   S   T   W   Y   V1  M   -2  -2 - 3  -4  -2  -1  -3  -4  -3   0   2  -2   8   0  -3  -2  -2  -2  -2   02  A    3  -1  -3  -3  -1  -1  -2  -2  -3   0   0   1   2   1  -2  -1  -1  -3  -1   13  L    1  -2  -2  -3  -2  -2  -2  -2   2   0   2  -2   0  -2   0   1  -1  -3  -2   24  H   -1  -1   1  -1  -3  -1  -1   3   6  -3  -1  -1  -2  -2  -2   2  -1  -3  -1  -35  I    0  -2  -3  -3  -2   0   0  -3  -3   3   2  -2   0  -1  -3  -2  -1  -3  -2   26  H    0  -2  -1  -2  -2  -1  -1  -3   7   0   0  -2  -1  -2   0   0  -1  -3   0   27  E    0  -2  -2  -1  -2  -1   2  -3  -1   0   1  -1   2   2  -3   0  -1  -2   2   08  A    2  -2  -1  -2   3  -2  -2   2  -2  -2  -2  -2  -2  -3  -2   3   1  -3  -3  -29  C    0  -3  -2  -3   7  -2  -3  -3  -3   0  -1  -2   3   3  -3   0  -1  -2  -1   010 I   -1  -2  -2  -2  -2  -2   0   0  -2   3   2  -2   0   0  -3   0   0  -2   3   011 L   -2   0  -3  -4  -2  -2  -3  -4  -3   0   4  -2   3   3  -4  -2  -2  -2   0   012 L    0   0  -3  -4  -2  -2  -3  -3  -3   0   3  -2   0  -1   1  -2  -1  -3  -2   113 L   -1  -2  -2  -2  -2  -2   0  -3  -3   0   3  -2   0   1  -3   1   1  -3  -1   114 V    0   0  -3  -3   4   0  -2  -3  -3   0   0  -2   2  -2  -3  -2  -1  -3  -2   415I    -1   0  -2  -3   4  -2  -2  -3   2   2   1  -2   0  -1  -3   0   0   4  -1   016 P    0   0  -2  -2  -2  -2  -2  -3   4  -1   0  -2  -1   2   3   0  -1  -2   0   017 G    0  -3  -2  -3  -2  -2  -3   2  -3   1   0  -3   3   3  -3  -1  -2  -2   0   118 L    1  -3  -3  -4  -1  -2  -3  -3  -3   0   4  -2   0  -1  -3  -2  -1  -3  -2   219 V    2  -1  -1  -2  -2   3  -1  -2  -2   0  -1  -1  -1  -3  -2   1   1  -3  -2   220 T   -1  -2  -2  -3   4  -2  -2  -3  -3   0   3  -2   0  -2  -3   1   3  -3  -2   021 S    0  -2  -1  -2   4  -2  -2   1  -3  -1   1  -2   2  -2   0   2  -1  -3  -3  -122 A    3  -2  -2  -2  -1  -2  -2  -1  -2  -1   0  -2  -1   1   2   2  -1  -3  -2   023 A    2  -2  -3  -2   5   0   0  -2  -3  -1   0  -2  -1  -3   2  -1  -1  -3  -2   124 I    1   1  -2  -2  -2  -1  -2  -2  -2   2   0  -1  -1  -1  -2   2  -1  -3   1   125 S   -1  -1   2  -1  -2   1  -1  -2   4   2  -1  -1  -1  -2  -2   3  -1  -4  -1  -126 H    0  -2   3  -1  -3  -1  -1  -2   5  -2  -2  -1  -2   0   3   0  -1  -3  -1   027 E   -1  -1   0   1  -3   0   5  -2  -1  -3  -3   0  -2  -3  -1   1   2  -3  -2  -228 D    1  -2   0   4  -2  -1   0  -1  -2  -2   0  -1  -1  -2  -1   2   0  -4  -3  -229 Y   -2  -1  -2  -2  -3   2  -1  -3   0   0  -1  -1  -1   0   3  -1  -2   0   5   030 P    0  -1  -1  -1  -2  -1  -1   0   5  -3  -3  -1  -2  -3   4   0   0  -3  -1  -231 A    3  -2  -2  -2  -1  -1  -2  -1  -3   0   2  -1   0  -2   0   0   0  -3  -2   032 D   -2  -1   0   5  -3   0   2  -2  -1  -2  -3   2  -2  -3  -1   0  -1  -4  -3   033 E    0  -1  -2   0  -2   0   3  -3  -1   0   0  -1   0   3  -2  -1  -1  -2   0   034 G    1  -2   0  -1  -2  -1  -2   4  -2  -2  -2  -2   0  -2  -2   1   1  -2  -3   035 D    0   2   0   2  -2   0   0  -2  -1  -2   0   0  -1  -3   2  -1  -1  -3  -2  -236 Q    0   3   0  -1  -2   3   0  -2  -1  -2  -2   0  -1  -3  -1   1   3  -3  -2  -237 I    0  -2  -3  -2  -1  -2  -2  -2  -3   1   0  -2   0  -2   4  -1  -1  -3  -2   2
38 S   -1  -1   0   1  -2   0   2  -2  -1   2  -1   1  -1  -2  -2   2  -1  -3  -2   039 S    3  -1  -1  -1  -1  -1  -1  -1  -2  -1   0  -1  -1  -2   2   3   0  -3  -2  -140 N    0  -2   2  -1  -3  -1   1   3  -1   0   0  -1  -1  -3   1  -1  -1  -3  -2   041 D    1  -2  -1   3  -2   0   2  -2  -2  -1   0  -1  -1   0  -2   0  -1  -3  -2  -142 N   -1  -1   2   1  -3   0   3   0  -1  -2   0   0  -1  -2  -2   1  -1  -3  -2  -243 L    1  -3  -3  -3   4  -2  -3  -3  -1   0   1  -3   0   3  -3  -2  -2   0   5   044 I    1  -1  -1   0  -2   0   2  -2  -2   1  -1   1  -1  -2  -2   2  -1  -4  -2   045 F   -2  -3  -2   1  -2  -2  -2  -3  -1   2   0  -3   0   4  -3  -2  -2  -1   4   146 D    1  -2  -1   2  -2  -1   0   0  -2  -3  -3  -1  -2  -3   4   1  -1  -4  -3  -247 D    0  -2   0   5  -3  -1   0   1  -2  -3  -4  -1  -3  -3   2   1  -1  -4  -3  -348 Y   -2   3  -1  -2  -3   2  -1  -3   0  -2  -2   0  -1   0  -3  -2  -2   0   6  -249 R   -2   4   0  -2  -4   2   0  -2   5  -4  -3   0  -2  -3   2  -1  -2  -3  -1  -350 G   -1  -2   0   2  -3  -1   1   4  -2  -2  -3  -1  -2  -3  -2   1  -1  -3  -3   051 K   -1   2   1  -1  -3   0   0   1  -1  -3  -3   4  -2  -3  -2   1  -1  -3  -3  -352 G   -1  -2  -1   2   4  -2  -1   3  -2  -2  -3  -2  -2   0  -2   0   2  -2  -2  -253 C   -1  -4  -4  -4  10  -4  -4  -4  -3  -1  -1  -4  -1   2  -4  -2  -2  -2  -1  -154 V   -1  -2  -1   0  -2  -1   1  -2  -2   0   0  -1   3  -2  -2   1   0  -3  -2   355 D    0  -2   0   6  -3   0   1  -1  -1  -3  -4  -1  -3  -3  -1   0  -1  -4  -3  -356 D   -2  -1   3   4  -4   0   2   2  -1  -4  -4  -1  -3  -4  -2   0  -1  -4  -3  -357 S    0  -1   2   2  -3   1   0   2  -1  -3  -3  -1  -2  -3  -2   3   0  -3  -3  -358 G    0   1   0  -1  -3  -1  -2   5  -2  -4  -4  -1  -3  -3  -2   1  -2  -3  -3  -359 F   -1  -4  -4  -4  -2  -3  -3  -4  -2   3   0  -3   0   5  -4  -2  -1  -1   0   360 V   -1  -3  -3  -2  -2  -1   1  -3  -1   0   0  -2   0   3  -3  -2  -1  -1   4   361 Y   -2  -2  -2  -3  -2  -2  -2  -3   0  -1  -1  -2  -1   4  -3   0  -2   0   7  -262 K    1  -1  -2  -2  -2  -1  -1   0  -3   0  -1   1  -1  -2   2  -1  -1  -4  -2   363 L   -1  -3  -2  -3  -2  -3  -3   4  -3   4   1  -3   0  -1  -3  -1  -2  -3  -2   064 G   -1  -1   0   0  -4   0   3   5  -1  -4  -4  -1  -3  -4  -2   0  -2  -3  -3  -365 E   -2  -1  -1   0  -3   3   3  -3  -1  -2  -1   0   3  -1  -2  -1  -2   7  -1  -266 R   -2   2  -2  -3  -2   0  -1  -3   0   1  -1   1  -1   3  -3  -2  -2  -1   4   067 F   -2  -3  -3  -3  -2  -3  -3  -3  -1  -1  -1  -3  -1   6  -4  -2   1   6   3  -168 F    0   1  -2  -3  -2  -1  -2  -2  -1  -1   1  -1   0   2  -3   0   0  -1   2  -169 P   -2  -2  -1   2  -4   0   2  -2  -2  -4  -4  -1  -3  -4   6  -1  -1  -4  -3  -370 G    0  -2   0  -1  -2  -1  -1   5  -2  -4  -4  -1  -2  -3  -2   3  -1  -3  -3  -371 H   -2  -2   0   5  -3  -1   0  -2   4  -3  -4  -1  -3  -3   3   0  -1  -4  -2  -372 S   -1  -1   0  -1  -2  -1  -1  -2   5  -3  -3  -1  -2  -3   4   3   1  -3  -1  -273 N    2  -2   2  -2   8  -2  -2  -2  -2  -2  -2  -2  -2  -3  -3   0   0  -3  -2  -174 C   -1  -2  -1  -1   8  -1   3  -3  -2  -2  -2  -1  -2  -3  -2   0   2  -3  -2  -175 P   -1   2  -2  -2  -3   3   0  -3  -2  -2   0   0  -1  -3   5  -1  -1  -3  -2  -276 C    0  -4  -4  -4  10  -4  -5  -4  -4  -1  -1  -4  -1  -2  -4  -1  -1  -2  -2  -177 V   -1  -2  -2  -1  -2  -1   2  -3  -2   0   2  -1   0  -1  -2  -1   0  -3  -2   378 C    0  -4  -4  -4  10  -4  -5  -4  -4  -1  -1  -4  -1  -2  -4  -1  -1  -2  -2  -179 A    2  -1  -1  -1  -1   1  -1  -2  -2  -2  -2  -1  -1  -3  -1   0   4  -3  -2  -180 L    1  -1  -1   0  -2   0   2  -2  -2  -1   0  -1  -1  -2  -2   1   1  -3  -2  -181 D   -2  -2   0   5  -4   0   4  -2  -1  -3  -4  -1  -3  -3  -2   0   1  -4  -3  -3
82  G     0  -3   0  -2  -4  -3  -3   7  -3  -5  -5  -3  -4  -4  -3   0  -3  -3  -4  -483  P    -1  -2  -2  -1  -3  -1  -1  -2  -2  -3  -3  -1  -2  -4   7   1  -1  -4  -3  -384  V     0  -2  -2  -3  -2   1  -1  -3  -3   1   1  -2   0  -2  -2   0  -1  -3  -2   485  C     0  -3  -3  -3  10  -3  -4  -3  -3  -2  -2  -3  -2  -3  -3   0  -1  -3  -3  -286  D     1  -2  -1   3   4  -1  -1  -2  -2  -1  -2  -2   0   0  -2   1   0  -3  -2   087  Q    -1   3  -1  -2  -3   4   0  -3  -1  -2  -2   2  -1  -3  -2  -1  -1  -3  -2   088  P    -1  -2  -1  -2  -2  -2  -2  -3  -3  -2  -2  -2  -2  -4   6   0   4  -4  -3  -189  E    -2   2   0   2  -4   0   5  -2  -1  -4  -3   1  -2  -4  -2  -1  -2  -4  -3  -390  C     0  -4  -4  -4  10  -4  -5  -4  -4  -2  -2  -4  -2  -3  -4  -2  -2  -3  -3  -291  P    -1  -2  -2  -2  -3  -2  -2  -3  -3  -1  -2  -2  -2  -3   6  -1   2  -4  -3   092  K     0   3   0   0  -3   0   3  -2  -1  -3  -3   3  -2  -3  -2   0  -1  -3  -2  -293  I    -1  -3  -3  -4  -1  -2  -3  -4  -3   3   3  -2   0  -1  -3  -2   1  -3  -2   194  H    -1  -1   0  -1   4  -1  -1  -2   7  -3  -3  -1  -2  -2   2   1  -1  -3   0  -395  P     0  -2  -2  -1  -3  -1   1  -2  -2  -3  -3  -1  -2  -4   7  -1  -1  -4  -3  -296  K     1   3  -1  -2  -2   0   0  -2   0  -2  -2   2  -1  -1  -2   1  -1  -2   2  -297  C     0  -3  -3  -3  10  -3  -4  -3  -3  -2  -2  -3  -2  -3   2  -1  -1  -3  -3  -298  T    -1  -3  -2  -3  -1  -2  -3  -4  -3   4   0  -3   1  -1  -3  -1   3  -3  -2   299  K    -2   1   0  -1  -4   0   2  -2   7  -3  -3   2  -2  -2  -2  -1  -2  -3   0  -3100 V    -1  -3  -3  -3  -1  -3  -3  -4  -3   3   0  -3   0  -1  -3  -2  -1  -3  -1   5101 E     1  -1   0   3  -2   0   2  -1  -1  -3  -3   1  -2  -3  -1   2   0  -4  -3  -2102 H    -2   2   1  -1  -3   0  -1  -2   7  -3  -2   0  -2  -1  -2  -1   1  -2   3  -2103 N    -1   0   3  -1  -2   0   0  -1   4  -2  -2   1  -2   0  -2   1   0  -1   4  -2104 G    -1  -1   0   2  -3   4   2   2  -1  -4  -3   0  -2  -3  -2   0  -1  -3  -2  -3105 C     0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1106 C     0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1107 P    -1  -3  -3  -2  -3  -2  -2  -3  -3  -1  -2  -2  -2  -4   7  -2  -1  -4  -3   0108 E    -1   2   0   2  -3   4   2  -2  -1  -2  -1   0  -1  -3  -2  -1  -1  -3  -2   0109 C     0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1110 K    -1   0   0   0  -3   0   3  -2  -1  -1  -2   3  -1  -3  -2   1  -1  -3  -2   1111 E     2   2  -1   0  -3   0   4  -2  -1  -3  -2   2  -2  -3  -2   0  -1  -3  -2  -2112 V    -1   1  -1  -1  -3  -1   1   1  -2   1  -1   1  -1  -2  -2  -1  -1  -3  -2   2113 K     0   0   0  -1  -3   0   0   4  -2  -4  -3   4  -2  -3  -2   1  -1  -3  -3  -3114 N    -2   0   6   0  -3   0   0   0   0  -3  -3   2  -2  -3  -2   0   0  -4  -2  -3115 F    -1  -3  -3  -3  -2  -2  -2  -3   0   0   0  -2   0   4  -3  -2  -1   0   6   1116 C     0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1117 E    -1  -1   0   3  -3   0   4  -2  -1  -2   0   0  -2  -3  -2   0   1  -3  -3  -2118 Y    -2  -2  -2  -2  -3  -1   1  -3   0  -1  -1  -2  -1   5  -3  -2  -2   0   6  -2119 H    -2   5   2  -2  -3   0  -1  -2   4  -2  -1   0   3  -2  -2  -1  -1  -3  -1  -2120 G    -1  -2   2  -1  -3  -2  -2   6  -2  -4  -4  -2  -3  -3  -2   0  -2  -3  -3  -3121 K    -1   4  -1  -2  -3   0   0  -3  -1  -1  -2   5  -1  -3  -2  -1  -1  -3  -2   0122 N    -1  -2   2  -2  -2  -2  -2  -2  -2   2   0  -2   0  -2  -2   0   4  -3  -2   1123 Y    -2  -3  -3  -3  -2  -2  -3  -3   0  -1  -1  -3  -1   4  -4  -2  -2   1   8  -1124 K     0   1   0  -1  -3   2   2  -2   4  -3  -2   2  -1  -1  -2  -1  -2  -2   3  -2125 I    -1  -2   2  -2  -2  -2  -2  -2  -2   2   1  -2   0  -1  -2   0   1  -3  -2   2
126 L   -1  -2   2  -2  -2  -2  -2   3  -2   0   3  -2   0  -1  -3  -1  -1  -3  -2  -1127 E   -1   0   0   1  -4   3   6  -2   0  -3  -3   0  -2  -3  -1   0  -1  -3  -2  -2128 E   -1  -1   2   0  -3   0   4  -2   0  -3  -3   0  -2  -1  -2   0   1  -2   3  -2129 F   -2  -3  -3  -3  -2  -3  -3  -3  -1   0   0  -3   0   7  -5  -2  -2   0   2  -1130 K   -1   1   2  -1  -3   2   0  -2  -1  -1   0   2   1  -2  -2  -1  -1  -3  -2   0131 P   -1  -3  -3  -3  -2  -2  -2  -3  -3   1   2  -2   0  -2   3  -2   0  -3  -2   3132 S    0   0   1   2   2  -1   0  -1  -1  -3  -3  -1  -2  -3   1   4   1  -4  -3  -2133 P   -1  -2  -2  -1  -3  -1   1  -3  -2  -2  -3  -1  -2  -4   7  -1  -1  -4  -3   0134 C    0  -3  -3  -3  10  -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1   0  -2  -2  -1135 E   -1   1  -1   0  -3   0   5  -3  -1  -1   1   0  -1  -2  -2  -1  -1  -3  -2  -1136 W   -1   2  -1  -2  -3   2   0  -2   3  -2   0   1  -1  -2  -2   1  -1   4  -1  -2137 C    0   0  -3  -3  10  -3  -4  -3  -3   0  -1  -3  -1  -2  -3  -1   0  -3  -2  -1138 R   -1   4  -1  -2  -2   0  -1  -3  -1   2  -1   2  -1  -1  -2  -1   1  -2   1   0139 C    0  -4  -4  -4  10  -4  -5  -4  -4  -1  -1  -4  -1  -2  -4  -1  -1  -2  -2  -1140 E   -1  -1   0   2  -3   0   5  -3  -1  -2   0   0  -1  -3  -2   0   1  -3  -2  -2141 P    1  -2   1  -2  -2  -1  -1  -2  -2   0   0  -1  -1  -2   2   1   1  -3  -2   0142 S   -1  -1   4   2  -3   1   0   2  -1  -3  -3  -1  -2  -3  -2   2  -1  -4  -3  -3143 N   -1   1   2  -1  -3  -1  -1   4  -1  -4  -4   1  -2  -3  -2   1  -1  -3  -3  -3144 E   -1   0  -1   0  -3   0   4  -3  -1   1  -1   0  -1  -2  -2  -1   1  -3  -2   1145 V    3  -2  -3  -3  -1  -2  -2  -2  -3   0   0  -2   0  -2  -2  -1  -1  -3  -2   3146 H   -2   1  -2  -3  -2  -1  -2  -3   3   0   2  -1   0   2  -3  -2  -2  -1   4  -1147 C   -1   0  -3  -3  10  -3  -3  -3  -3  -2  -2  -2  -2  -3   1  -1  -1  -3  -3  -2148 V    0  -2  -1  -2  -1  -1  -2  -2  -3   0   1  -1   0  -2  -2   2   3  -3  -2   2149 V   -1  -3  -3  -3   1  -2  -2  -3  -3   2   0  -2   0  -2   2  -2  -1  -4  -2   5150 A    3  -2  -2  -2   2  -1  -1  -1  -2   0  -1  -1  -1  -2  -2   2   0  -3  -2   2151 D    1  -2   0   5  -2   1   0   0  -2  -3  -3  -1  -2  -3  -2   1  -1  -4  -3  -2152 C   -1  -3  -3  -3  10  -3  -4   0  -3  -2  -2  -3  -1   1  -4  -1  -2  -2  -1  -2153 A    2  -2  -2  -2  -2  -1   0  -2  -2  -1   0  -1  -1   1   4  -1  -1  -3  -1  -1154 V    2  -1  -2  -1  -2   4   1  -2  -2  -1  -2   0  -1  -3   3  -1  -1  -3  -2   0155 P   -1  -2  -1   1  -2  -2  -1  -2  -2   1   0  -2  -1  -2   4   0   2  -4  -3   0156 E   -2   1  -1   0  -4   0   3  -3   2  -3  -3   1  -2   2   3  -1  -2  -3  -1  -3157 C   -1  -3  -3  -3   9   1  -3  -3  -3  -2  -1  -3  -1  -2  -3  -2  -2   5  -2  -2158 V   -1   0  -2  -3  -2   0  -2  -3  -3   2   0  -2   0   1  -2  -2   1  -2  -1   4159 N   -2   1   4   4  -3   0   0  -1   0  -3  -3  -1  -2  -1  -2   0  -1   3   3  -3160 P   -1  -2  -2  -1  -3  -1  -1  -2  -2  -1  -3   1  -2  -4   7   0  -1  -4  -3  -2161 V   -1  -3  -3  -3  -2   0   0  -4  -3   4   0  -2   0   2  -3  -2  -1  -2   0   3162 Y   -2   1  -1  -3  -3  -1  -1  -3   4  -2   0  -1  -1   0  -3   0  -2   0   6  -2163 E   -1  -1  -1   0  -3   3   4  -3  -1  -2  -1   0  -1  -3   3   0   0  -3  -2  -2164 P   -1  -1  -2  -1  -3   0   1  -3  -1  -2  -1   0  -2  -2   5  -1  -1  -2   2  -2165 E   -1  -2   1   2  -3  -1   1   3  -1  -3  -3  -1  -3  -1  -2   0  -1  -2   2  -3166 Q   -2   0  -1  -1  -3   4   2  -3   3  -3   0   2  -1  -2  -2  -1  -2   5   0  -2167 C    0  -3  -3  -4   9  -3  -4  -4  -3   0   0  -3  -1  -2  -3  -2  -1  -2  -2   0168 C    0  -3  -3  -3   9  -3  -3  -3  -3   0  -1  -3  -1  -2  -3   0  -1  -3  -2   1169 P    0  -2  -3  -2  -3  -1  -2  -2  -3  -2   0  -1  -1  -3   7  -1  -1  -4  -3  -1
170 V   -1  -2  -2  -2  -2  -1   1  -3  -2   3   0   1   0  -2  -2  -2  -1  -3  -2   4171 C   -1  -2  -3  -3   9  -2  -3  -3  -3  -1   0   1  -1  -2  -3  -1  -1  -3  -2  -1172 K   -1   1   0  -1  -3   0   0  -2  -1  -3  -2   6  -1  -3  -1   0  -1  -3  -2  -2173 N    2  -1   3   2  -2  -1   0   2  -1  -3  -3  -1  -2  -3  -2   1  -1  -4  -3  -2174 G    0  -1   0  -1  -3  -2  -2   5  -2  -4  -3   0  -3  -3  -2   0  -2  -2  -3  -3175 P   -1  -2   1  -1  -3  -1   0  -2  -2  -3  -3  -1  -2  -4   6  -1  -1  -4  -3  -2176 N   -1  -1   5   0  -3  -1  -1  -1   0  -3  -3  -1  -2  -2  -2   1   0   6  -1  -3177 C   -1  -2  -2  -2   8  -2  -2  -3   3  -2  -2  -2  -2  -2   1  -1   0  -3  -1  -2178 F   -2  -2  -1  -2  -3  -2  -2   1   4  -2  -2   0  -1   4   0  -1  -2   0   3  -2179 A    2  -2  -2  -3  -1  -2  -2   2  -3   0   1  -2   0   0  -2  -1  -1  -3  -1   1180 G    0  -1   0   0  -2  -1   1   3  -2  -2   0  -1  -1  -2   1   1   1  -3  -2  -1181 T    0  -2  -1  -1  -1  -1  -1  -2  -2   1  -1  -1  -1  -2   1   0   5  -3  -2   0182 T    1  -1   0  -1  -1   2   0  -1  -2  -1   0  -1   0  -2  -1   1   3  -3  -2  -1183 I    1  -3  -2  -3  -1  -2  -2  -2  -3   3   0  -2   0  -1  -2   0   0  -3  -1   3184 I   -1  -3  -3  -3  -2  -3  -3   1  -3   5   0  -3   0   2  -3  -2  -1  -2   0   1185 P   -1  -2  -2  -1  -3   0   1  -2  -2  -2   0  -1  -1  -3   6  -1  -1  -4  -3  -2186 A    4   1  -2  -2   0  -1  -1   0  -2  -1  -1   0  -1  -2  -1   0   0  -3  -2   0187 G    0  -2   0  -1  -3  -2  -2   6  -2  -2  -3  -2  -2  -3  -2   0  -2  -2  -3   0188 I   -1   2  -1   0  -3   0   3  -3  -1   2  -1   0  -1  -2   1  -1  -1  -3  -2   0189 E   -1  -1  -1   0  -3   0   4  -2  -1   0  -2   0  -1  -3   3  -1  -1  -3  -2  -1190 V    0   0  -1   1  -2  -1  -1  -2  -2   0   0  -1   0  -2  -2  -1   2  -3  -2   3191 K   -1   0  -1  -1  -3   0   1  -2  -1  -2  -2   4  -1  -2  -2  -1  -1   7  -1   0192 V    0  -1  -1  -2  -2   1   0  -3  -2   0   0   1   0  -2  -2  -1   2  -3  -1   3193 D   -2  -2   0   6  -3   0   1  -1  -1  -3  -4  -1  -3  -3  -1   0   1  -4  -3  -3194 E    1  -1  -1   1  -2   0   4  -2  -1  -1  -2   0  -1  -2  -1   0  -1  -3  -2   1195 C    0  -3  -3  -3  10  -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1196 N   -1  -1   3  -1  -2  -1  -1  -1  -1  -1  -1  -1  -1   2  -2   0   4  -2   0  -1197 I   -1  -1  -2  -3   5  -2  -2  -3  -3   4   0   1   0  -1  -3  -1  -1  -3  -1   1198 C    0  -3  -2  -3   9  -3  -3  -3  -3  -1  -1  -3  -1  -2  -3  -1   1  -2  -2  -1199 H   -2   2   0  -2  -3   0   0  -2   7  -3  -2   0  -2   0  -2  -1  -2  -1   3  -3200 C    0  -3  -3  -3  10  -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1201 H   -1   0   0  -1  -2   0   0  -2   7  -2  -2  -1  -2  -1  -2   0   3  -2   0  -2202 N   -2  -1   4   3  -3   0   0  -1   0  -2  -2  -1  -2   0  -2   0  -1  -1   4  -2203 G    0  -1   0   0  -3   0   3   5  -1  -4  -4  -1  -3  -3  -2   0  -2  -2  -3  -3204 D   -1   0   0   4  -3   3   3  -2   0  -3  -3   0  -2  -3  -1   0  -1  -3  -2  -2205 W   -1  -2   0   3  -3  -1   0   3  -2  -3  -3  -2  -2  -1  -2  -1  -2   8   0  -3206 W   -2  -3  -2  -3  -2  -2  -3   3  -2  -3  -3  -3  -1   0  -3  -2  -2  11   0  -3207 K   -1   3   0  -2  -3   0   0  -2   0  -2  -2   3  -1   0  -2  -1  -1  -1   4  -2208 P   -1  -1  -1  -1  -2   3   0  -3  -1  -1   1   0   0  -2   4  -1  -1  -3  -2  -1209 A    5  -1  -2  -2   0  -1  -1   0  -2  -1  -1  -1  -1  -2  -1   0   0  -3  -2   0210 Q   -1   0  -1  -1  -2   3   0  -2  -1  -1   0   0   4  -1  -1   0   2  -2  -1   0211 C    0  -3  -3  -3  10  -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1212 S    0  -1   0   0  -1   0   0  -1  -1  -2  -2   0  -1  -2  -1   4   3  -3  -2  -1213 K   -1   5   0  -2  -3   0   0  -2   0  -3  -2   4  -1  -3  -2  -1  -1  -3  -2  -3
214 R   -1   3   0  -2  -2   0  -1  -3   6  -1   1   0   0  -1  -2  -1  -1  -2   0  -1215 E   -1   0   0   1  -4   1   5  -2   0  -3  -3   3  -2  -3  -1   0  -1  -3  -2  -2216 C    0  -2   3  -1   9  -2  -2  -2  -1  -1  -1  -2  -1  -2  -3   0  -1  -3  -2  -1217 Q   -1   2  -1  -1   6   3   0  -2  -1  -2  -2   1  -1  -3  -2   0  -1  -2  -2  -2218 G   -1   0   3   0  -3   3   0   3   0  -3  -3   0  -1  -3  -2   0  -1  -3  -2  -3219 K   -1   0   0  -2  -2   0   0  -2   5   0   0   3   3  -1  -2  -1  -1  -2   0   0220 Q   -1   0   0   0  -3   4   4  -2   0  -3  -2   0  -1  -3  -1   0  -1  -2  -1  -2221 T    0  -1   0  -1  -2  -1  -1   4  -2  -2  -2  -1  -2  -2  -1   0   4  -2  -2  -1222 V    0  -2  -2  -3  -1  -1  -2  -3  -2   2   1  -1   4   0  -2  -1   0  -2  -1   3其中,当该轮廓作为查询序列输入到搜索程序BLAST时,采用NCBI(生物信息国家中心;http://www.ncbi.nlm.nih.gov/)确定的缺省参数[Blosum62矩阵;空位开放罚分=11,空位拓展罚分=1],E值为10-2或以下的那些就是SECFAM3家族成员。
所以,本文的“SECFAM3家族成员”指的是满足上述轮廓的一个多肽序列,当作为BLAST查询序列,使用上述参数输入时,其最大阈值E是10-2。该多肽序列的最小阈值E优选等于或少于10-5,等于或少于10-10,等于或少于10-50,最好等于或少于10-70。例如,当把家族成员INSP124(SEQID NO:12)与本发明第一方面的轮廓作比较,得到的E值是e-143。E值代表预期在数据库内任意找到的更好或同样好的匹配数目,或者可形容为任意发生一个匹配的概率。因此,根据E值来排列所有击中目标,而E值反过来又取决于a)每个序列位置可提供的候选物数目(就氨基酸而言该数目为20)、序列或匹配区长度、以及所搜索的数据库大小。所以,短的序列如SECFAM3家族成员的E值一般比两个长序列之间可比较的匹配大。
上述轮廓考虑了一个信号序列和一个vWFC结构域的存在。此轮廓使信号肽区(氨基酸1至30)的氨基酸序列与vWFC结构域相比,有较高程度的变异性(variability)。此处的“变异性”涉及氨基性序列之间的相似性和同一性程度。这反映了在本发明鉴定的SECFAM3家族中22个成员发现的情形。22个成员之间的vWFC样结构域具有较高程度的相似性,提示vWFC样结构域可能与分子一个重要功能有关。如果该结构域的重要性不高,则它的成员之间保守程度不会太高。
进行搜索的翻译核酸序列数据库可以包括,但不限于,由cDNA、EST、mRNA、全部或部分基因组数据库产生的翻译核酸序列。
本发明第二方面提供一种分离的多肽,该多肽:i)包括或由这样的一个多肽序列组成:当以下列轮廓作为查询序列输入到搜索程序BLAST时,采用NCBI(生物信息国家中心)确定的缺省参数[Blosum 62矩阵;空位开放罚分=11,空位拓展罚分=1],所述多肽序列的E值为10-2或以下;A   R   N   D   C   Q   E   G   H   I   L   K   M   F   P   S   T   W   Y   V1  M   -2  -2  -3  -4  -2  -1  -3  -4  -3   0   2  -2   8   0  -3  -2  -2  -2  -2   02  A    3  -1  -3  -3  -1  -1  -2  -2  -3   0   0   1   2   1  -2  -1  -1  -3  -1   13  L    1  -2  -2  -3  -2  -2  -2  -2   2   0   2  -2   0  -2   0   1  -1  -3  -2   24  H   -1  -1   1  -1  -3  -1  -1   3   6  -3  -1  -1  -2  -2  -2   2  -1  -3  -1  -35  I    0  -2  -3  -3  -2   0   0  -3  -3   3   2  -2   0  -1  -3  -2  -1  -3  -2   26  H    0  -2  -1  -2  -2  -1  -1  -3   7   0   0  -2  -1  -2   0   0  -1  -3   0   27  E    0  -2  -2  -1  -2  -1   2  -3  -1   0   1  -1   2   2  -3   0  -1  -2   2   08  A    2  -2  -1  -2   3  -2  -2   2  -2  -2  -2  -2  -2  -3  -2   3   1  -3  -3  -29  C    0  -3  -2  -3   7  -2  -3  -3  -3   0  -1  -2   3   3  -3   0  -1  -2  -1   010 I   -1  -2  -2  -2  -2  -2   0   0  -2   3   2  -2   0   0  -3   0   0  -2   3   011 L   -2   0  -3  -4  -2  -2  -3  -4  -3   0   4  -2   3   3  -4  -2  -2  -2   0   012 L    0   0  -3  -4  -2  -2  -3  -3  -3   0   3  -2   0  -1   1  -2  -1  -3  -2   113 L   -1  -2  -2  -2  -2  -2   0  -3  -3   0   3  -2   0   1  -3   1   1  -3  -1   114 V    0   0  -3  -3   4   0  -2  -3  -3   0   0  -2   2  -2  -3  -2  -1  -3  -2   415 I   -1   0  -2  -3   4  -2  -2  -3   2   2   1  -2   0  -1  -3   0   0   4  -1   016 P    0   0  -2  -2  -2  -2  -2  -3   4  -1   0  -2  -1   2   3   0  -1  -2   0   017 G    0  -3  -2  -3  -2  -2  -3   2  -3   1   0  -3   3   3  -3  -1  -2  -2   0   118 L    1  -3  -3  -4  -1  -2  -3  -3  -3   0   4  -2   0  -1  -3  -2  -1  -3  -2   219 V    2  -1  -1  -2  -2   3  -1  -2  -2   0  -1  -1  -1  -3  -2   1   1  -3  -2   220 T   -1  -2  -2  -3   4  -2  -2  -3  -3   0   3  -2   0  -2  -3   1   3  -3  -2   021 S    0  -2  -1  -2   4  -2  -2   1  -3  -1   1  -2   2  -2   0   2  -1  -3  -3  -122 A    3  -2  -2  -2  -1  -2  -2  -1  -2  -1   0  -2  -1   1   2   2  -1  -3  -2   023 A    2  -2  -3  -2   5   0   0  -2  -3  -1   0  -2  -1  -3   2  -1  -1  -3  -2   124 I    1   1  -2  -2  -2  -1  -2  -2  -2   2   0  -1  -1  -1  -2   2  -1  -3   1   125 S   -1  -1   2  -1  -2   1  -1  -2   4   2  -1  -1  -1  -2  -2   3  -1  -4  -1  -126 H    0  -2   3  -1  -3  -1  -1  -2   5  -2  -2  -1  -2   0   3   0  -1  -3  -1   027 E   -1  -1   0   1  -3   0   5  -2  -1  -3  -3   0  -2  -3  -1   1   2  -3  -2  -228 D    1  -2   0   4  -2  -1   0  -1  -2  -2   0  -1  -1  -2  -1   2   0  -4  -3  -229 Y   -2  -1  -2  -2  -3   2  -1  -3   0   0  -1  -1  -1   0   3  -1  -2   0   5   030 P    0  -1  -1  -1  -2  -1  -1   0   5  -3  -3  -1  -2  -3   4   0   0  -3  -1  -231 A    3  -2  -2  -2  -1  -1  -2  -1  -3   0   2  -1   0  -2   0   0   0  -3  -2   032 D   -2  -1   0   5  -3   0   2  -2  -1  -2  -3   2  -2  -3  -1   0  -1  -4  -3   033 E    0  -1  -2   0  -2   0   3  -3  -1   0   0  -1   0   3  -2  -1  -1  -2   0   034 G    1  -2   0  -1  -2  -1  -2   4  -2  -2  -2  -2   0  -2  -2   1   1  -2  -3   0
35 D    0   2   0   2  -2   0   0  -2  -1  -2   0   0  -1  -3   2  -1  -1  -3  -2  -236 Q    0   3   0  -1  -2   3   0  -2  -1  -2  -2   0  -1  -3  -1   1   3  -3  -2  -237 I    0  -2  -3  -2  -1  -2  -2  -2  -3   1   0  -2   0  -2   4  -1  -1  -3  -2   238 S   -1  -1   0   1  -2   0   2  -2  -1   2  -1   1  -1  -2  -2   2  -1  -3  -2   039 S    3  -1  -1  -1  -1  -1  -1  -1  -2  -1   0  -1  -1  -2   2   3   0  -3  -2  -140 N    0  -2   2  -1  -3  -1   1   3  -1   0   0  -1  -1  -3   1  -1  -1  -3  -2   041 D    1  -2  -1   3  -2   0   2  -2  -2  -1   0  -1  -1   0  -2   0  -1  -3  -2  -142 N   -1  -1   2   1  -3   0   3   0  -1  -2   0   0  -1  -2  -2   1  -1  -3  -2  -243 L    1  -3  -3  -3   4  -2  -3  -3  -1   0   1  -3   0   3  -3  -2  -2   0   5   044 I    1  -1  -1   0  -2   0   2  -2  -2   1  -1   1  -1  -2  -2   2  -1  -4  -2   045 F   -2  -3  -2   1  -2  -2  -2  -3  -1   2   0  -3   0   4  -3  -2  -2  -1   4   146 D    1  -2  -1   2  -2  -1   0   0  -2  -3  -3  -1  -2  -3   4   1  -1  -4  -3  -247 D    0  -2   0   5  -3  -1   0   1  -2  -3  -4  -1  -3  -3   2   1  -1  -4  -3  -348 Y   -2   3  -1  -2  -3   2  -1  -3   0  -2  -2   0  -1   0  -3  -2  -2   0   6  -249 R   -2   4   0  -2  -4   2   0  -2   5  -4  -3   0  -2  -3   2  -1  -2  -3  -1  -350 G   -1  -2   0   2  -3  -1   1   4  -2  -2  -3  -1  -2  -3  -2   1  -1  -3  -3   051 K   -1   2   1  -1  -3   0   0   1  -1  -3  -3   4  -2  -3  -2   1  -1  -3  -3  -352 G   -1  -2  -1   2   4  -2  -1   3  -2  -2  -3  -2  -2   0  -2   0   2  -2  -2  -253 C   -1  -4  -4  -4  10  -4  -4  -4  -3  -1  -1  -4  -1   2  -4  -2  -2  -2  -1  -154 V   -1  -2  -1   0  -2  -1   1  -2  -2   0   0  -1   3  -2  -2   1   0  -3  -2   355 D    0  -2   0   6  -3   0   1  -1  -1  -3  -4  -1  -3  -3  -1   0  -1  -4  -3  -356 D   -2  -1   3   4  -4   0   2   2  -1  -4  -4  -1  -3  -4  -2   0  -1  -4  -3  -357 S    0  -1   2   2  -3   1   0   2  -1  -3  -3  -1  -2  -3  -2   3   0  -3  -3  -358 G    0   1   0  -1  -3  -1  -2   5  -2  -4  -4  -1  -3  -3  -2   1  -2  -3  -3  -359 F   -1  -4  -4  -4  -2  -3  -3  -4  -2   3   0  -3   0   5  -4  -2  -1  -1   0   360 V   -1  -3  -3  -2  -2  -1   1  -3  -1   0   0  -2   0   3  -3  -2  -1  -1   4   361 Y   -2  -2  -2  -3  -2  -2  -2  -3   0  -1  -1  -2  -1   4  -3   0  -2   0   7  -262 K    1  -1  -2  -2  -2  -1  -1   0  -3   0  -1   1  -1  -2   2  -1  -1  -4  -2   363 L   -1  -3  -2  -3  -2  -3  -3   4  -3   4   1  -3   0  -1  -3  -1  -2  -3  -2   064 G   -1  -1   0   0  -4   0   3   5  -1  -4  -4  -1  -3  -4  -2   0  -2  -3  -3  -365 E   -2  -1  -1   0  -3   3   3  -3  -1  -2  -1   0   3  -1  -2  -1  -2   7  -1  -266 R   -2   2  -2  -3  -2   0  -1  -3   0   1  -1   1  -1   3  -3  -2  -2  -1   4   067 F   -2  -3  -3  -3  -2  -3  -3  -3  -1  -1  -1  -3  -1   6  -4  -2   1   6   3  -168 F    0   1  -2  -3  -2  -1  -2  -2  -1  -1   1  -1   0   2  -3   0   0  -1   2  -169 P   -2  -2  -1   2  -4   0   2  -2  -2  -4  -4  -1  -3  -4   6  -1  -1  -4  -3  -370 G    0  -2   0  -1  -2  -1  -1   5  -2  -4  -4  -1  -2  -3  -2   3  -1  -3  -3  -371 H   -2  -2   0   5  -3  -1   0  -2   4  -3  -4  -1  -3  -3   3   0  -1  -4  -2  -372 S   -1  -1   0  -1  -2  -1  -1  -2   5  -3  -3  -1  -2  -3   4   3   1  -3  -1  -273 N    2  -2   2  -2   8  -2  -2  -2  -2  -2  -2  -2  -2  -3  -3   0   0  -3  -2  -174 C   -1  -2  -1  -1   8  -1   3  -3  -2  -2  -2  -1  -2  -3  -2   0   2  -3  -2  -175 P   -1   2  -2  -2  -3   3   0  -3  -2  -2   0   0  -1  -3   5  -1  -1  -3  -2  -276 C    0  -4  -4  -4  10  -4  -5  -4  -4  -1  -1  -4  -1  -2  -4  -1  -1  -2  -2  -177 V   -1  -2  -2  -1  -2  -1   2  -3  -2   0   2  -1   0  -1  -2  -1   0  -3  -2   378 C    0  -4  -4  -4  10  -4  -5  -4  -4  -1  -1  -4  -1  -2  -4  -1  -1  -2  -2  -1
79  A    2  -1  -1  -1  -1   1  -1  -2  -2  -2  -2  -1  -1  -3  -1   0   4  -3  -2  -180  L    1  -1  -1   0  -2   0   2  -2  -2  -1   0  -1  -1  -2  -2   1   1  -3  -2  -181  D   -2  -2   0   5  -4   0   4  -2  -1  -3  -4  -1  -3  -3  -2   0   1  -4  -3  -382  G    0  -3   0  -2  -4  -3  -3   7  -3  -5  -5  -3  -4  -4  -3   0  -3  -3  -4  -483  P   -1  -2  -2  -1  -3  -1  -1  -2  -2  -3  -3  -1  -2  -4   7   1  -1  -4  -3  -384  V    0  -2  -2  -3  -2   1  -1  -3  -3   1   1  -2   0  -2  -2   0  -1  -3  -2   485  C    0  -3  -3  -3  10  -3  -4  -3  -3  -2  -2  -3  -2  -3  -3   0  -1  -3  -3  -286  D    1  -2  -1   3   4  -1  -1  -2  -2  -1  -2  -2   0   0  -2   1   0  -3  -2   087  Q   -1   3  -1  -2  -3   4   0  -3  -1  -2  -2   2  -1  -3  -2  -1  -1  -3  -2   088  P   -1  -2  -1  -2  -2  -2  -2  -3  -3  -2  -2  -2  -2  -4   6   0   4  -4  -3  -189  E    -2   2   0   2  -4   0   5  -2  -1  -4  -3   1  -2  -4  -2  -1  -2  -4  -3  -390  C    0  -4  -4  -4  10  -4  -5  -4  -4  -2  -2  -4  -2  -3  -4  -2  -2  -3  -3  -291  P   -1  -2  -2  -2  -3  -2  -2  -3  -3  -1  -2  -2  -2  -3   6  -1   2  -4  -3   092  K    0   3   0   0  -3   0   3  -2  -1  -3  -3   3  -2  -3  -2   0  -1  -3  -2  -293  I   -1  -3  -3  -4  -1  -2  -3  -4  -3   3   3  -2   0  -1  -3  -2   1  -3  -2   194  H   -1  -1   0  -1   4  -1  -1  -2   7  -3  -3  -1  -2  -2   2   1  -1  -3   0  -395  P    0  -2  -2  -1  -3  -1   1  -2  -2  -3  -3  -1  -2  -4   7  -1  -1  -4  -3  -296  K    1   3  -1  -2  -2   0   0  -2   0  -2  -2   2  -1  -1  -2   1  -1  -2   2  -297  C    0  -3  -3  -3  10  -3  -4  -3  -3  -2  -2  -3  -2  -3   2  -1  -1  -3  -3  -298  T   -1  -3  -2  -3  -1  -2  -3  -4  -3   4   0  -3   1  -1  -3  -1   3  -3  -2   299  K   -2   1   0  -1  -4   0   2  -2   7  -3  -3   2  -2  -2  -2  -1  -2  -3   0  -3100 V   -1  -3  -3  -3  -1  -3  -3  -4  -3   3   0  -3   0  -1  -3  -2  -1  -3  -1   5101 E    1  -1   0   3  -2   0   2  -1  -1  -3  -3   1  -2  -3  -1   2   0  -4  -3  -2102 H   -2   2   1  -1  -3   0  -1  -2   7  -3  -2   0  -2  -1  -2  -1   1  -2   3  -2103 N   -1   0   3  -1  -2   0   0  -1   4  -2  -2   1  -2   0  -2   1   0  -1   4  -2104 G   -1  -1   0   2  -3   4   2   2  -1  -4  -3   0  -2  -3  -2   0  -1  -3  -2  -3105 C    0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1106 C    0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1107 P   -1  -3  -3  -2  -3  -2  -2  -3  -3  -1  -2  -2  -2  -4   7  -2  -1  -4  -3   0108 E   -1   2   0   2  -3   4   2  -2  -1  -2  -1   0  -1  -3  -2  -1  -1  -3  -2   0109 C    0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1110 K   -1   0   0   0  -3   0   3  -2  -1  -1  -2   3  -1  -3  -2   1  -1  -3  -2   1111 E    2   2  -1   0  -3   0   4  -2  -1  -3  -2   2  -2  -3  -2   0  -1  -3  -2  -2112 V   -1   1  -1  -1  -3  -1   1   1  -2   1  -1   1  -1  -2  -2  -1  -1  -3  -2   2113 K    0   0   0  -1  -3   0   0   4  -2  -4  -3   4  -2  -3  -2   1  -1  -3  -3  -3114 N   -2   0   6   0  -3   0   0   0   0  -3  -3   2  -2  -3  -2   0   0  -4  -2  -3115 F   -1  -3  -3  -3  -2  -2  -2  -3   0   0   0  -2   0   4  -3  -2  -1   0   6   1116 C    0  -3  -3  -3  10  -3  -5  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1117 E   -1  -1   0   3  -3   0   4  -2  -1  -2   0   0  -2  -3  -2   0   1  -3  -3  -2118 Y   -2  -2  -2  -2  -3  -1   1  -3   0  -1  -1  -2  -1   5  -3  -2  -2   0   6  -2119 H   -2   5   2  -2  -3   0  -1  -2   4  -2  -1   0   3  -2  -2  -1  -1  -3  -1  -2120 G   -1  -2   2  -1  -3  -2  -2   6  -2  -4  -4  -2  -3  -3  -2   0  -2  -3  -3  -3121 K   -1   4  -1  -2  -3   0   0  -3  -1  -1  -2   5  -1  -3  -2  -1  -1  -3  -2   0122 N   -1  -2   2  -2  -2  -2  -2  -2  -2   2   0  -2   0  -2  -2   0   4  -3  -2   1
123 Y   -2  -3  -3  -3  -2  -2  -3  -3   0  -1  -1  -3  -1   4  -4  -2  -2   1   8  -1124 K    0   1   0  -1  -3   2   2  -2   4  -3  -2   2  -1  -1  -2  -1  -2  -2   3  -2125 I   -1  -2   2  -2  -2  -2  -2  -2  -2   2   1  -2   0  -1  -2   0   1  -3  -2   2126 L   -1  -2   2  -2  -2  -2  -2   3  -2   0   3  -2   0  -1  -3  -1  -1  -3  -2  -1127 E   -1   0   0   1  -4   3   6  -2   0  -3  -3   0  -2  -3  -1   0  -1  -3  -2  -2128 E   -1  -1   2   0  -3   0   4  -2   0  -3  -3   0  -2  -1  -2   0   1  -2   3  -2129 F   -2  -3  -3  -3  -2  -3  -3  -3  -1   0   0  -3   0   7  -5  -2  -2   0   2  -1130 K   -1   1   2  -1  -3   2   0  -2  -1  -1   0   2   1  -2  -2  -1  -1  -3  -2   0131 P   -1  -3  -3  -3  -2  -2  -2  -3  -3   1   2  -2   0  -2   3  -2   0  -3  -2   3132 S    0   0   1   2   2  -1   0  -1  -1  -3  -3  -1  -2  -3   1   4   1  -4  -3  -2133 P   -1  -2  -2  -1  -3  -1   1  -3  -2  -2  -3  -1  -2  -4   7  -1  -1  -4  -3   0134 C    0  -3  -3  -3   10 -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1   0  -2  -2  -1135 E   -1   1  -1   0  -3   0   5  -3  -1  -1   1   0  -1  -2  -2  -1  -1  -3  -2  -1136 W   -1   2  -1  -2  -3   2   0  -2   3  -2   0   1  -1  -2  -2   1  -1   4  -1  -2137 C    0   0  -3  -3   10 -3  -4  -3  -3   0  -1  -3  -1  -2  -3  -1   0  -3  -2  -1138 R   -1   4  -1  -2  -2   0  -1  -3  -1   2  -1   2  -1  -1  -2  -1   1  -2   1   0139 C    0  -4  -4  -4  10  -4  -5  -4  -4  -1  -1  -4  -1  -2  -4  -1  -1  -2  -2  -1140 E   -1  -1   0   2  -3   0   5  -3  -1  -2   0   0  -1  -3  -2   0   1  -3  -2  -2141 P    1  -2   1  -2  -2  -1  -1  -2  -2   0   0  -1  -1  -2   2   1   1  -3  -2   0142 S   -1  -1   4   2  -3   1   0   2  -1  -3  -3  -1  -2  -3  -2   2  -1  -4  -3  -3143 N   -1   1   2  -1  -3  -1  -1   4  -1  -4  -4   1  -2  -3  -2   1  -1  -3  -3  -3144 E   -1   0  -1   0  -3   0   4  -3  -1   1  -1   0  -1  -2  -2  -1   1  -3  -2   1145 V    3  -2  -3  -3  -1  -2  -2  -2  -3   0   0  -2   0  -2  -2  -1  -1  -3  -2   3146 H   -2   1  -2  -3  -2  -1  -2  -3   3   0   2  -1   0   2  -3  -2  -2  -1   4  -1147 C   -1   0  -3  -3   10 -3  -3  -3  -3  -2  -2  -2  -2  -3   1  -1  -1  -3  -3  -2148 V    0  -2  -1  -2  -1  -1  -2  -2  -3   0   1  -1   0  -2  -2   2   3  -3  -2   2149 V   -1  -3  -3  -3   1  -2  -2  -3  -3   2   0  -2   0  -2   2  -2  -1  -4  -2   5150 A    3  -2  -2  -2   2  -1  -1  -1  -2   0  -1  -1  -1  -2  -2   2   0  -3  -2   2151 D    1  -2   0   5  -2   1   0   0  -2  -3  -3  -1  -2  -3  -2   1  -1  -4  -3  -2152 C   -1  -3  -3  -3  10  -3  -4   0  -3  -2  -2  -3  -1   1  -4  -1  -2  -2  -1  -2153 A    2  -2  -2  -2  -2  -1   0  -2  -2  -1   0  -1  -1   1   4  -1  -1  -3  -1  -1154 V    2  -1  -2  -1  -2   4   1  -2  -2  -1  -2   0  -1  -3   3  -1  -1  -3  -2   0155 P   -1  -2  -1   1  -2  -2  -1  -2  -2   1   0  -2  -1  -2   4   0   2  -4  -3   0156 E   -2   1  -1   0  -4   0   3  -3   2  -3  -3   1  -2   2   3  -1  -2  -3  -1  -3157 C   -1  -3  -3  -3   9   1  -3  -3  -3  -2  -1  -3  -1  -2  -3  -2  -2   5  -2  -2158 V   -1   0  -2  -3  -2   0  -2  -3  -3   2   0  -2   0   1  -2  -2   1  -2  -1   4159 N   -2   1   4   4  -3   0   0  -1   0  -3  -3  -1  -2  -1  -2   0  -1   3   3  -3160 P   -1  -2  -2  -1  -3  -1  -1  -2  -2  -1  -3   1  -2  -4   7   0  -1  -4  -3  -2161 V   -1  -3  -3  -3  -2   0   0  -4  -3   4   0  -2   0   2  -3  -2  -1  -2   0   3162 Y   -2   1  -1  -3  -3  -1  -1  -3   4  -2   0  -1  -1   0  -3   0  -2   0   6  -2163 E   -1  -1  -1   0  -3   3   4  -3  -1  -2  -1   0  -1  -3   3   0   0  -3  -2  -2164 P   -1  -1  -2  -1  -3   0   1  -3  -1  -2  -1   0  -2  -2   5  -1  -1  -2   2  -2165 E   -1  -2   1   2  -3  -1   1   3  -1  -3  -3  -1  -3  -1  -2   0  -1  -2   2  -3166 Q   -2   0  -1  -1  -3   4   2  -3   3  -3   0   2  -1  -2  -2  -1  -2   5   0  -2
167 C    0  -3  -3  -4   9  -3  -4  -4  -3   0   0  -3  -1  -2  -3  -2  -1  -2  -2   0168 C    0  -3  -3  -3   9  -3  -3  -3  -3   0  -1  -3  -1  -2  -3   0  -1  -3  -2   1169 P    0  -2  -3  -2  -3  -1  -2  -2  -3  -2   0  -1  -1  -3   7  -1  -1  -4  -3  -1170 V   -1  -2  -2  -2  -2  -1   1  -3  -2   3   0   1   0  -2  -2  -2  -1  -3  -2   4171 C   -1  -2  -3  -3   9  -2  -3  -3  -3  -1   0   1  -1  -2  -3  -1  -1  -3  -2  -1172 K   -1   1   0  -1  -3   0   0  -2  -1  -3  -2   6  -1  -3  -1   0  -1  -3  -2  -2173 N    2  -1   3   2  -2  -1   0   2  -1  -3  -3  -1  -2  -3  -2   1  -1  -4  -3  -2174 G    0  -1   0  -1  -3  -2  -2   5  -2  -4  -3   0  -3  -3  -2   0  -2  -2  -3  -3175 P   -1  -2   1  -1  -3  -1   0  -2  -2  -3  -3  -1  -2  -4   6  -1  -1  -4  -3  -2176 N   -1  -1   5   0  -3  -1  -1  -1   0  -3  -3  -1  -2  -2  -2   1   0   6  -1  -3177 C   -1  -2  -2  -2   8  -2  -2  -3   3  -2  -2  -2  -2  -2   1  -1   0  -3  -1  -2178 F   -2  -2  -1  -2  -3  -2  -2   1   4  -2  -2   0  -1   4   0  -1  -2   0   3  -2179 A    2  -2  -2  -3  -1  -2  -2   2  -3   0   1  -2   0   0  -2  -1  -1  -3  -1   1180 G    0  -1   0   0  -2  -1   1   3  -2  -2   0  -1  -1  -2   1   1   1  -3  -2  -1181 T    0  -2  -1  -1  -1  -1  -1  -2  -2   1  -1  -1  -1  -2   1   0   5  -3  -2   0182 T    1  -1   0  -1  -1   2   0  -1  -2  -1   0  -1   0  -2  -1   1   3  -3  -2  -1183 I    1  -3  -2  -3  -1  -2  -2  -2  -3   3   0  -2   0  -1  -2   0   0  -3  -1   3184 I   -1  -3  -3  -3  -2  -3  -3   1  -3   5   0  -3   0   2  -3  -2  -1  -2   0   1185 P   -1  -2  -2  -1  -3   0   1  -2  -2  -2   0  -1  -1  -3   6  -1  -1  -4  -3  -2186 A    4   1  -2  -2   0  -1  -1   0  -2  -1  -1   0  -1  -2  -1   0   0  -3  -2   0187 G    0  -2   0  -1  -3  -2  -2   6  -2  -2  -3  -2  -2  -3  -2   0  -2  -2  -3   0188 I   -1   2  -1   0  -3   0   3  -3  -1   2  -1   0  -1  -2   1  -1  -1  -3  -2   0189 E   -1  -1  -1   0  -3   0   4  -2  -1   0  -2   0  -1  -3   3  -1  -1  -3  -2  -1190 V    0   0  -1   1  -2  -1  -1  -2  -2   0   0  -1   0  -2  -2  -1   2  -3  -2   3191 K   -1   0  -1  -1  -3   0   1  -2  -1  -2  -2   4  -1  -2  -2  -1  -1   7  -1   0192 V    0  -1  -1  -2  -2   1   0  -3  -2   0   0   1   0  -2  -2  -1   2  -3  -1   3193 D   -2  -2   0   6  -3   0   1  -1  -1  -3  -4  -1  -3  -3  -1   0   1  -4  -3  -3194 E    1  -1  -1   1  -2   0   4  -2  -1  -1  -2   0  -1  -2  -1   0  -1  -3  -2   1195 C    0  -3  -3  -3  10  -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1196 N   -1  -1   3  -1  -2  -1  -1  -1  -1  -1  -1  -1  -1   2  -2   0   4  -2   0  -1197 I   -1  -1  -2  -3   5  -2  -2  -3  -3   4   0   1   0  -1  -3  -1  -1  -3  -1   1198 C    0  -3  -2  -3   9  -3  -3  -3  -3  -1  -1  -3  -1  -2  -3  -1   1  -2  -2  -1199 H   -2   2   0  -2  -3   0   0  -2   7  -3  -2   0  -2   0  -2  -1  -2  -1   3  -3200 C    0  -3  -3  -3  10  -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1201 H   -1   0   0  -1  -2   0   0  -2   7  -2  -2  -1  -2  -1  -2   0   3  -2   0  -2202 N   -2  -1   4   3  -3   0   0  -1   0  -2  -2  -1  -2   0  -2   0  -1  -1   4  -2203 G    0  -1   0   0  -3   0   3   5  -1  -4  -4  -1  -3  -3  -2   0  -2  -2  -3  -3204 D   -1   0   0   4  -3   3   3  -2   0  -3  -3   0  -2  -3  -1   0  -1  -3  -2  -2205 W   -1  -2   0   3  -3  -1   0   3  -2  -3  -3  -2  -2  -1  -2  -1  -2   8   0  -3206 W   -2  -3  -2  -3  -2  -2  -3   3  -2  -3  -3  -3  -1   0  -3  -2  -2  11   0  -3207 K   -1   3   0  -2  -3   0   0  -2   0  -2  -2   3  -1   0  -2  -1  -1  -1   4  -2208 P   -1  -1  -1  -1  -2   3   0  -3  -1  -1   1   0   0  -2   4  -1  -1  -3  -2  -1209 A    5  -1  -2  -2   0  -1  -1   0  -2  -1  -1  -1  -1  -2  -1   0   0  -3  -2   0210 Q   -1   0  -1  -1  -2   3   0  -2  -1  -1   0   0   4  -1  -1   0   2  -2  -1   0
211 C    0  -3  -3  -3   10 -3  -4  -3  -3  -1  -1  -3  -1  -2  -3  -1  -1  -2  -2  -1212 S    0  -1   0   0  -1   0   0  -1  -1  -2  -2   0  -1  -2  -1   4   3  -3  -2  -1213 K   -1   5   0  -2  -3   0   0  -2   0  -3  -2   4  -1  -3  -2  -1  -1  -3  -2  -3214 R   -1   3   0  -2  -2   0  -1  -3   6  -1   1   0   0  -1  -2  -1  -1  -2   0  -1215 E   -1   0   0   1  -4   1   5  -2   0  -3  -3   3  -2  -3  -1   0  -1  -3  -2  -2216 C    0  -2   3  -1   9  -2  -2  -2  -1  -1  -1  -2  -1  -2  -3   0  -1  -3  -2  -1217 Q   -1   2  -1  -1   6   3   0  -2  -1  -2  -2   1  -1  -3  -2   0  -1  -2  -2  -2218 G   -1   0   3   0  -3   3   0   3   0  -3  -3   0  -1  -3  -2   0  -1  -3  -2  -3219 K   -1   0   0  -2  -2   0   0  -2   5   0   0   3   3  -1  -2  -1  -1  -2   0   0220 Q   -1   0   0   0  -3   4   4  -2   0  -3  -2   0  -1  -3  -1   0  -1  -2  -1  -2221 T    0  -1   0  -1  -2  -1  -1   4  -2  -2  -2  -1  -2  -2  -1   0   4  -2  -2  -1222 V    0  -2  -2  -3  -1  -1  -2  -3  -2   2   1  -1   4   0  -2  -1   0  -2  -1   3(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
较佳地,本发明的多肽是含有vWFC结构域的分泌性蛋白质家族成员。所述多肽在上述试验中的最大E值优选是10-2。更好地,所述多肽序列的最小E值等于或少于10-5、等于或少于10-10、等于或少于10-50,最好等于或少于10-70。降低该阈值起着更严谨过滤器作用,把含有信号肽和vWFC结构域的多肽与一般背景多肽序列分开。
本发明第二方面第三实施例提供一种分离的多肽,该多肽(i)包括一满足以下共有氨基酸序列的多肽:[GTDFC](0,1)-[CF](0,1)-[VMSED](0,1)-[DEA](0,1)-[DENG](0,1)-[SQNDG](0,1)-[SGR](0,1)-[FIV](0,1)-[VYFE](0,1)-[YFS](0,1)-[KVAGP](0,1)-[LIG](0,1)-[GE](0,1)-[EWQM](0,1)-[RKYFQVI](0,1)-[FYWT](0,1)-[FALYRTS](0,1)-[PED](0,1)-[GS](0,1)-[HPDS](0,1)-[STHP](0,1)-[CNAT](0,1)-[CTE](0,1)-[PQRL](0,1)-C(0,1)-[VELT](0,1)-C(0,1)-[TAQ](0,1)-[ELATSD](0,1)-[EDT]-G-[PS]-[VLAQS]-[CS]-[DAMSTFCV]-[QRKV]-R(0,1)-[PT]-[ERDK]-C-[PTV]-[KERSA]-[LIVT]-[HPSC]-[PAE]-[KRASY]-[CP]-[TIVM]-[HKRE]-[VI]-[DESAKP]-[HTNRYG]-[NSTYHK](0,1)-[PA](0,1)-[TG](0,1)-[QGDES]-C-C-[PV]-[EQRDLV]-C;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
较佳地,本发明的多肽是含有vWFC结构域的分泌性蛋白质家族成员。本发明此实施例引述的序列涵盖INSP124(SEQ ID NO:12)氨基酸位置54-171(序列对比中氨基酸155-279,见图1)的高度同一性区。
本发明第二方面第四实施例提供一种多肽,该多肽包括或由一满足以下共有氨基酸序列的多肽组成:[GTDFC](0,1)-[CF](0,1)-[VMSED](0,1)-[DEA](0,1)-[DENG](0,1)-[SQNDG](0,1)-[SGR](0,1)-[FIV](0,1)-[VYFE](0,1)-[YFS](0,1)-[KVAGP](0,1)-[LIG](0,1)-[GE](0,1)-[EWQM](0,1)-[RKYFQVI](0,1)-[FYWT](0,1)-[FALYRTS](0,1)-[PED](0,1)-[GS](0,1)-[HPDS](0,1)-[STHP](0,1)-[CNAT](0,1)-[CTE](0,1)-[PQRL](0,1)-C(0,1)-[VELT](0,1)-C(0,1)-[TAQ](0,1)-[ELATSD](0,1)-[EDT]-G-[PS]-[VLAQS]-[CS]-[DAMSTFCV]-[QRKV]-R(0,1)-[PT]-[ERDK]-C-[PTV]-[KERSA]-[LIVT]-[HPSC]-[PAE]-[KRASY]-[CP]-[TIVM]-[HKRE]-[VI]-[DESAKP]-[HTNRYG]-[NSTYHK](0,1)-[PA](0,1)-[TG](0,1)-[QGDES]-C-C-[PV]-[EQRDLV]-C-[KERSV]-[EKRA]-[VIRKEG]-[KGS]-[NK]-[FYV]-C-[EDLT]-[YFE]-[HRNM]-[GN]-[KRV]-[NTVLI]-[YF]-[KQHREAY]-[ILVTSN]-[LGN]-[EQ]-[ENYT]-F-P(0,1)-S(0,1)-[KRVMLQN]-[PVLIT]-[SNTCRDP]-[PVE](0,1)-[CT](0,1)-[ELR](0,1)-[WRHKQSL](0,1)-[CTIR](0,1)-[RTYIK](0,1-C-[EDTL]-[PAVLSNT](0,1)-[SNQDG](0,1)-[GNRKS](0,1)-[EIVTR]-[VAL]-[RHLYF](0,1)-[CRP]-[TSVL](0,1)-[VICP]-[ASVC]-Q(0,1)-A(0,1)-C(0,1)-[DAPQGS]-[CQGF]-[APTFLE](0,1)-[QVAPE]-[TPSLID]-[EPRHKF]-[CWQ]-[VQTFI]-[NDQRY]-[PLKS]-[VILEF]-[YLSHR]-[EQTSP]-[PKLYE]-[DEGIYN]-[QSWKHE]-[CAL]-[CV]-[PL]-[VIKES]-[CK]。
本发明第二方面第五实施例提供一种分离的多肽,该多肽由一满足以下共有氨基酸序列的多肽组成:[GTDFC](0,1)-[CF](0,1)-[VMSED](0,1)-[DEA](0,1)-[DENG](0,1)-[SQNDG](0,1)-[SGR](0,1)-[FIV](0,1)-[VYFE](0,1)-[YFS](0,1)-[KVAGP](0,1)-[LIG](0,1)-[GE](0,1)-[EWQM](0,1)-[RKYFQVI](0,1)-[FYWT](0,1)-[FALYRTS](0,1)-[PED](0,1)-[GS](0,1)-[HPDS](0,1)-[STHP](0,1)-[CNAT](0,1)-[CTE](0,1)-[PQRL](0,1)-C(0,1)-[VELT](0,1)-C(0,1)-[TAQ](0,1)-[ELATSD](0,1)-[EDT]-G-[PS]-[VLAQS]-[CS]-[DAMSTFCV]-[QRKV]-R(0,1)-[PT]-[ERDK]-C-[PTV]-[KERSA]-[LIVT]-[HPSC]-[PAE]-[KRASY]-[CP]-[TIVM]-[HKRE]-[VI]-[DESAKP]-[HTNRYG]-[NSTYHK](0,1)-[PA](0,1)-[TG](0,1)-[QGDES]-C-C-[PV]-[EQRDLV]-C。
本发明第二方面第六实施例提供一种如本发明第二方面第三实施例所述的分离的多肽,其中,该分离的多肽包含一或多个,最好全部10个位于本发明第二方面第三至第五实施例的共有氨基酸序列氨基酸位置2、23、25、27、34、40、47、57、58和61上的半胱氨酸残基。在另一实施例中,该分离的多肽包含一或多个,最好全部10个位于本发明第二方面第四实施例的共有氨基酸序列氨基酸位置68、88、91、93、101、109、114、124、125和128上的半胱氨酸残基。在又一实施例中,该分离的多肽包含一或多个,最好全部位于本发明第二方面第四实施例的共有氨基酸序列氨基酸位置2、23、25、27、34、40、47、57、58、61、68、88、91、93、101、109、114、124、125和128上的半胱氨酸残基。
本发明第二方面第三至第五实施例的氨基酸序列写成PROSITE(蛋白质位点和型式)符号,其中氨基酸以它们的一个字母代码表示(Bairoch,A.,Bucher,P.,and Hofmann,K.,(1997);The PROSITE Database:Its statusin 1997.Nucl.Acids Res.25,217-221)。简单地说,一个包括以下通式的多肽可作如下解释:A(1)-x(i1,j1)-A2-x(i2,j2)-....A{p-1}-x(i{p-1},j{p-1})-ApA(k)是一个组分,或者表示一个氨基酸如C,或者表示一组可能的氨基酸如[ILVF]。如果组分A(k)明确地表示一个氨基酸(例如C或L),那么它是一个特征组分;或者如果组分A(k)表示一个以上氨基酸(例如[ILVF]或[FWY])),那么它是一个模糊组分。i(k)、j(k)都是整数,全部k都满足i(k)<=j(k)。x(ik,jk)表示与ik和jk之间任意氨基酸匹配的型式外卡区。如果j(k)比i(k)大(例如x(2,3)),则外卡区x(ik,jk)是“可变的”。这样一个外卡区的可变度是jk-ik.br>,例如x(2,3)的可变度是1。如果j(k)等于i(k)(例如x(2,2)),则外卡区是固定不变的,例如可把x(2,2)写成x(2)。若有的话,一种型式的可变产物是该型式内可变外卡区的多个可变产物,除非将它限定为一个产物。
例如,C-x(2)-H是一种带有两个组分(C和H)和一个固定外卡区的型式。它与含有一个C,紧跟着任何两个任意氨基酸再紧跟着一个H的任何序列匹配。氨基酸序列ChgHyw和liChgHlyw包括在该通式内。C-x(2,3)-H是一种带有两个组分(C和H)和一个可变外卡区的型式。它与含有一个C,紧跟着任何两个或三个任意氨基酸再紧跟着一个H的任何序列(例如aaChgHywk和liChgaHlyw)匹配。C-x(2,3)-[ILV]是一种带有两个组分(C和[ILV])和一个可变外卡区的型式。它与含有一个C,紧跟着任何两个或三个任意氨基酸再紧跟着一个I、L或V的任何序列匹配。
虽然申请人并不希望受此理论约束,但要求本发明上述实施例的多肽全部都具有信号肽序列。因此,缺少信号肽的所述多肽成熟形式构成本发明另一方面。
本发明第三方面一实施例提供一种多肽,该多肽:(i)包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:39、SEQ IDNO:41、SEQ ID NO:43和/或SEQ ID NO:45所示的氨基酸序列;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
本发明第三方面第二实施例提供一种多肽,该多肽由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43和/或SEQ ID NO:45所示的氨基酸序列组成。
下文将具有SEQ ID NO:2所示的序列的多肽称为“INSP123多肽”。
小量的EST数据,主要来自啮齿动物EST数据提示,INSP123序列应该在脑cDNA模板或神经组织中找到。
虽然申请人并不希望受此理论约束,但要求INSP123多肽的首23个氨基酸形成信号肽。SEQ ID NO:2和SEQ ID NO:4分别是含有或无信号序列的INSP123全长多肽序列。下文将具有SEQ ID NO:4所示的序列的多肽称为“INSP123成熟多肽”。
此外,虽然申请人并不希望受此理论约束,但要求INSP123克隆多肽的首22个氨基酸形成信号肽。SEQ ID NO:39和SEQ ID NO:41分别是含有或无信号序列的INSP123克隆全长多肽序列。下文将具有SEQ ID NO:39所示的序列的多肽称为“INSP123克隆多肽”。将具有SEQ ID NO:41所示的序列的多肽称为“INSP123克隆成熟多肽1”。
或者,较佳地,虽然申请人并不希望受此理论约束,但要求INSP123克隆多肽的首21个氨基酸形成信号肽。SEQ ID NO:39和SEQ ID NO:43分别是含有或无信号序列的INSP123克隆全长多肽序列。下文将具有SEQID NO:39所示的序列的多肽称为“INSP123克隆多肽”。将具有SEQ IDNO:43所示的序列的多肽称为“INSP123克隆成熟多肽2”。
或者,较佳地,虽然申请人并不希望受此理论约束,但要求INSP123克隆多肽的首31个氨基酸形成信号肽。SEQ ID NO:39和SEQ ID NO:45分别是含有或无信号序列的INSP123克隆全长多肽序列。下文将具有SEQID NO:39所示的序列的多肽称为“INSP123克隆多肽”。将具有SEQ IDNO:45所示的序列的多肽称为“INSP123克隆成熟多肽3”。
较佳地,本发明第三方面第二实施例的抗原决定簇、片段或功能等同物包含位于SEQ ID NO:2中氨基酸位置53、74、76、78、85、90、97、105、106和107上的10个半胱氨酸残基中一或多个。更好的是,这些半胱氨酸残基的一或多个在生理条件下参与二硫键形成。本发明这一方面“生理条件”指的是找到天然或野生型多肽的自然环境。二硫键形成通常是一个蛋白质正确构象因而是它的功能所必需的。所以,保留这些半胱氨酸残基十分重要。
本发明第三方面第三实施例提供一种多肽,该多肽:(i)包括SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51和/或SEQ ID NO:53所示的氨基酸序列;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
较佳地,本发明此第三方面的多肽由SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51和/或SEQ ID NO:53所示的氨基酸序列组成。
较佳地,本发明第三方面第四实施例的抗原决定簇、片段或功能等同物包含位于SEQ ID NO:12中氨基酸位置53、74、76、78、85、90、97、105、106和109上的10个半胱氨酸残基中一或多个。更好的是,这些半胱氨酸残基的一或多个在生理条件下参与二硫键形成。甚至更好的是,所述抗原决定簇、片段或功能等同物还包含位于氨基酸位置116、134、137、139、147、152、157、167、168和171上的10个半胱氨酸残基中一或多个。
下文将具有SEQ ID NO:6所示的序列的多肽称为“INSP124外显子1多肽”。下文将具有SEQ ID NO:8所示的序列的多肽称为“INSP124外显子2多肽”。下文将具有SEQ ID NO:10所示的序列的多肽称为“INSP124外显子3多肽”。
下文将具有SEQ ID NO:12所示的序列的多肽称为“INSP124多肽”。
预测到INSP124与Ventroptin较相似,后者也叫Neuralin,它是一种在视网膜中以双梯度模式表达的BMP-4(骨形态形成蛋白4)拮抗剂。BMP是通过特定受体传导信号的多功能分泌性蛋白质。它们具有诱导成年动物异常软骨形成的能力,而它们在由此种能力诱导的软骨形成中也扮演重要角色(Chimal-Monroy J等,Dev Biol.2003May 15;257(2):292-301)。
Ventroptin是chordin家族成员,已知能够拮抗BMP2和BMP4(Takahashi H等,Development.2003Nov;130(21):5203-15)。Ventroptin的错误表达改变视网膜内多个拓扑基因的表达模式以及视网膜轴突沿双轴向顶盖突出。所以,拓扑视网膜-顶盖突出似乎由沿双轴上双梯度分子Ventroptin确定(Sakuta H等,Science.2001 Jul 6;293(5527):111-5)。在器官形成过程中,Ventroptin在许多组织如背根神经节、肠、骨架稠密软骨以及发育中的毛囊等内部呈现宽的表达模式(Coffinier C等,Mech Dev.2001Jan;100(1):119-22)。
最近鉴定了一种新颖chordin样蛋白质CHL2,它的结构与Ventroptin极为相似。当向非洲爪蟾属胚胎注射CHL2RNA,诱导了次级轴。可以推定,CHL2在发育和退化关节的透明软骨中对关节软骨细胞的再生和成熟产生负面影响(Nakayama N.等,(2004)Jan;131(1):229-40)。
小量的EST数据,主要来自啮齿动物EST数据提示,INSP124序列应该在神经组织中找到。
虽然申请人并不希望受此理论约束,但要求INSP124外显子1多肽的首23个氨基酸形成信号肽。SEQ ID NO:14和SEQ ID NO:16分别是无信号序列的INSP124外显子1多肽序列和全长多肽序列。下文将具有SEQ IDNO:14所示的序列的多肽称为“INSP124外显子1成熟多肽”。下文将具有SEQ ID NO:16所示的序列的多肽称为“INSP124成熟多肽”。
此外,虽然申请人并不希望受此理论约束,但要求INSP124克隆多肽的首22个氨基酸形成信号肽。SEQ ID NO:47和SEQ ID NO:49分别是含有或无信号序列的INSP124克隆全长多肽序列。下文将具有SEQ ID NO:47所示的序列的多肽称为“INSP124克隆多肽”。将具有SEQ ID NO:49所示的序列的多肽称为“INSP124克隆成熟多肽1”。
或者,较佳地,虽然申请人并不希望受此理论约束,但要求INSP124克隆多肽的首21个氨基酸形成信号肽。SEQ ID NO:47和SEQ ID NO:51分别是含有或无信号序列的INSP124克隆全长多肽序列。下文将具有SEQID NO:47所示的序列的多肽称为“INSP124克隆多肽”。将具有SEQ IDNO:51所示的序列的多肽称为“INSP124克隆成熟多肽2”。
或者,较佳地,虽然申请人并不希望受此理论约束,但要求INSP124克隆多肽的首31个氨基酸形成信号肽。SEQ ID NO:47和SEQ ID NO:53分别是含有或无信号序列的INSP124克隆全长多肽序列。下文将具有SEQID NO:47所示的序列的多肽称为“INSP124克隆多肽”。将具有SEQ IDNO:53所示的序列的多肽称为“INSP124克隆成熟多肽3”。
此处所用的术语“INSP124外显子多肽”包括含有INSP124外显子1多肽、INSP124外显子2多肽、INSP124外显子1成熟多肽、INSP124外显子3多肽、INSP124多肽、INSP124成熟多肽1、INSP124成熟多肽2或INSP124成熟多肽3的多肽以及由INSP124外显子1多肽、INSP124外显子1成熟多肽、INSP124外显子2多肽、INSP124外显子3多肽、INSP124多肽或INSP124成熟多肽组成的多肽。
本发明第三方面第五实施例提供一种多肽,该多肽:(i)包括SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59和/或SEQ ID NO:61所示的氨基酸序列;(ii)是其片段,该片段是含有vWFC结构域的蛋白质家族成员,或者具有与(i)所述多肽相同的抗原决定簇;或者(iii)是(i)或(ii)的功能等同物。
本发明第三方面第六实施例提供一种多肽,该多肽由SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQID NO:28、SEQ ID NO:30、SEQ ID NO:47、SEQ ID NO:49、SEQ IDNO:51和/或SEQ ID NO:53所示的氨基酸序列组成。
较佳地,本发明此方面第六实施例的抗原决定簇、片段或功能等同物包含位于SEQ ID NO:26中氨基酸位置69、82、90、92、100、105、110、120、121和124上的10个半胱氨酸残基中一或多个。更好的是,这些半胱氨酸残基的一或多个在生理条件下参与二硫键形成。二硫键形成通常是构成蛋白质正确构象因此是该蛋白质功能整体所需要的。所以,保留这些半胱氨酸残基显得十分重要。
下文将具有SEQ ID NO:18所示的序列的多肽称为“INSP125外显子1多肽”。下文将具有SEQ ID NO:20所示的序列的多肽称为“INSP125外显子2多肽”。下文将具有SEQ ID NO:22所示的序列的多肽称为“INSP125外显子3多肽”。下文将具有SEQ ID NO:24所示的序列的多肽称为“INSP125外显子4多肽”。
下文将具有SEQ ID NO:26所示的序列的多肽称为“INSP125多肽”。
小量的EST数据,主要来自啮齿动物EST数据提示,INSP125序列应该在神经组织中找到。
虽然申请人并不希望受此理论约束,但要求INSP125外显子1多肽的首23个氨基酸形成信号肽。SEQ ID NO:28和SEQ ID NO:30分别是无信号序列的INSP125外显子1多肽序列和全长多肽序列。下文将具有SEQ IDNO:28所示的序列的多肽称为“INSP125外显子1成熟多肽”。下文将具有SEQ ID NO:30所示的序列的多肽称为“INSP125成熟多肽”。
此外,虽然申请人并不希望受此理论约束,但要求INSP125克隆多肽的首22个氨基酸形成信号肽。SEQ ID NO:55和SEQ ID NO:57分别是含有或无信号序列的INSP125克隆全长多肽序列。下文将具有SEQ ID NO:55所示的序列的多肽称为“INSP125克隆多肽”。将具有SEQ ID NO:57所示的序列的多肽称为“INSP125克隆成熟多肽1”。
或者,较佳地,虽然申请人并不希望受此理论约束,但要求INSP125克隆多肽的首21个氨基酸形成信号肽。SEQ ID NO:55和SEQ ID NO:59分别是含有或无信号序列的INSP125克隆全长多肽序列。下文将具有SEQID NO:55所示的序列的多肽称为“INSP125克隆多肽”。将具有SEQ IDNO:59所示的序列的多肽称为“INSP125克隆成熟多肽2”。
或者,较佳地,虽然申请人并不希望受此理论约束,但要求INSP125克隆多肽的首31个氨基酸形成信号肽。SEQ ID NO:55和SEQ ID NO:61分别是含有或无信号序列的INSP125克隆全长多肽序列。下文将具有SEQID NO:55所示的序列的多肽称为“INSP125克隆多肽”。将具有SEQ IDNO:61所示的序列的多肽称为“INSP125克隆成熟多肽3”。
此处所用的术语“INSP125外显子多肽”包括含有INSP125外显子1多肽、INSP125外显子1成熟多肽、INSP125外显子2多肽、INSP125外显子3多肽、INSP125外显子4多肽、INSP125多肽、INSP125成熟多肽1、INSP125成熟多肽2或INSP125成熟多肽3的多肽以及由INSP125外显子1多肽、INSP125外显子1成熟多肽、INSP125外显子2多肽、INSP125外显子3多肽、INSP125外显子4多肽、INSP125多肽或INSP125成熟多肽组成的多肽。
如本发明第一方面所解释一样,鉴定含有vWFC结构域的新颖蛋白质是有用的,这是因为已发现这样的结构域在很多类型的疾病中具有重要作用,包括发育过程相关的那些疾病,例如与软骨和骨架发育有关的疾病。
本发明第四方面提供一种编码本发明第二或第三方面的多肽的纯化核酸分子。
较佳的是,该纯化核酸分子包含SEQ ID NO:1所示的核酸序列(编码INSP123多肽)、SEQ ID NO:3所示的核酸序列(编码INSP123成熟多肽)、SEQ ID NO:5所示的核酸序列(编码INSP124外显子1多肽)、SEQ IDNO:7所示的核酸序列(编码124外显子2多肽)、SEQ ID NO:9所示的核酸序列(编码INSP124外显子3多肽)、SEQ ID NO:11所示的核酸序列(编码INSP124多肽)、SEQ ID NO.13所示的核酸序列(编码INSP124成熟多肽)、SEQ ID NO:15所示的核酸序列(编码INSP124外显子1成熟多肽)、SEQ ID NO:17所示的核酸序列(编码INSP125外显子1多肽)、SEQ IDNO:19所示的核酸序列(编码INSP125外显子2多肽)、SEQ ID NO.21所示的核酸序列(编码INSP125外显子3多肽)、SEQ ID NO:23所示的核酸序列(编码INSP125外显子4多肽)、SEQ ID NO:25所示的核酸序列(编码INSP125多肽)、SEQ ID NO:27所示的核酸序列(编码INSP125外显子1成熟多肽)、SEQ ID NO:29所示的核酸序列(编码INSP125成熟多肽)、SEQID NO:38所示的核酸序列(编码INSP123克隆多肽)、SEQ ID NO:40所示的核酸序列(编码INSP123克隆成熟多肽1)、SEQ ID NO:42所示的核酸序列(编码INSP123克隆成熟多肽2)、SEQ ID NO:44所示的核酸序列(编码INSP123克隆成熟多肽3)、SEQ ID NO:46所示的核酸序列(编码INSP124克隆多肽)、SEQ ID NO:48所示的核酸序列(编码INSP24克隆成熟多肽1)、SEQ ID NO:50所示的核酸序列(编码INSP124克隆成熟多肽2)、SEQID NO:52所示的核酸序列(编码INSP124克隆成熟多肽3)、SEQ ID NO:54所示的核酸序列(编码INSP125克隆多肽)、SEQ ID NO:56所示的核酸序列(编码INSP125克隆成熟多肽1)、SEQ ID NO:58所示的核酸序列(编码INSP125克隆成熟多肽2)和/或SEQ ID NO:60所示的核酸序列(编码INSP125克隆成熟多肽),或者是这些序列中任何一个的冗余等同物或片段。
本发明还提供由如下核酸序列组成的纯化核酸分子:SEQ ID NO:1所示的核酸序列(编码INSP123多肽)、SEQ ID NO:3所示的核酸序列(编码INSP123成熟多肽)、SEQ ID NO:5所示的核酸序列(编码INSP124外显子1多肽)、SEQ ID NO:7所示的核酸序列(编码124外显子2多肽)、SEQ IDNO:9所示的核酸序列(编码INSP124外显子3多肽)、SEQ ID NO:11所示的核酸序列(编码INSP124多肽)、SEQ ID NO:13所示的核酸序列(编码INSP124成熟多肽)、SEQ ID NO:15所示的核酸序列(编码INSP124外显子1成熟多肽)、SEQ ID NO:17所示的核酸序列(编码INSP125外显子1多肽)、SEQ ID NO:19所示的核酸序列(编码INSP125外显子2多肽)、SEQID NO:21所示的核酸序列(编码INSP125外显子3多肽)、SEQ ID NO:23所示的核酸序列(编码INSP125外显子4多肽)、SEQ ID NO:25所示的核酸序列(编码INSP125多肽)、SEQ ID NO.27所示的核酸序列(编码INSP125外显子1成熟多肽)、SEQ ID NO:29所示的核酸序列(编码INSP125成熟多肽)、SEQ ID NO:38所示的核酸序列(编码INSP123克隆多肽)、SEQ IDNO:40所示的核酸序列(编码INSP123克隆成熟多肽1)、SEQ ID NO:42所示的核酸序列(编码INSP123克隆成熟多肽2)、SEQ ID NO:44所示的核酸序列(编码INSP123克隆成熟多肽3)、SEQ ID NO:46所示的核酸序列(编码INSP124克隆多肽)、SEQ ID NO:48所示的核酸序列(编码INSP124克隆成熟多肽1)、SEQ ID NO:50所示的核酸序列(编码INSP124克隆成熟多肽2)、SEQ ID NO:52所示的核酸序列(编码INSP124克隆成熟多肽3)、SEQID NO:54所示的核酸序列(编码INSP125克隆多肽)、SEQ ID NO:56所示的核酸序列(编码INSP125克隆成熟多肽1)、SEQ ID NO:58所示的核酸序列(编码INSP125克隆成熟多肽2)和/或SEQ ID NO:60所示的核酸序列(编码INSP125克隆成熟多肽3),或者本发明的纯化核酸分子是这些序列中任何一个的冗余等同物或片段。
根据本发明此方面一实施例,纯化的核酸分子不包括位于INSP123多肽(SEQ ID NO:2所示的氨基酸1-23)、INSP124外显子1多肽(SEQ IDNO:6所示的氨基酸1-23)、INSP124多肽(SEQ ID NO:12所示的氨基酸1-23)、INSP125外显子1多肽(SEQ ID NO:18所示的氨基酸1-23)或INSP125多肽(SEQ ID NO:26所示的氨基酸1-23)起点处的信号肽。根据此实施例,所述的纯化核酸分子最好包括SEQ ID NO:1所示的核苷酸70至417(如SEQ ID NO:3所示,编码INSP123成熟多肽)、SEQ ID NO:5所示的核苷酸70至390(如SEQ ID NO:13所示,编码INSP124外显子1成熟多肽)、SEQ ID NO:11所示的核苷酸70至669(如SEQ ID NO:15所示,编码INSP124成熟多肽)、SEQ ID NO:17所示的核苷酸70至100(如SEQ IDNO:27所示,编码INSP125外显子1成熟多肽)或者SEQ ID NO:25所示的核苷酸70至528(如SEQ ID NO:29所示,编码INSP125成熟多肽)。
另外,根据本发明此方面第二实施例,纯化的核酸分子不包括位于INSP123多肽(SEQ ID NO:39所示的氨基酸1-22)、INSP124多肽(SEQ IDNO:43所示的氨基酸1-22)或INSP125多肽(SEQ ID NO:47所示的氨基酸1-22)起点处的信号肽。根据此实施例,所述的纯化核酸分子最好包括SEQID NO:38所示的核苷酸67至414(如SEQ ID NO:40所示,编码INSP123克隆成熟多肽1)、SEQ ID NO:46所示的核苷酸67至666(如SEQ ID NO:48所示,编码INSP124克隆成熟多肽1)或者SEQ ID NO:54所示的核苷酸67至525(如SEQ ID NO:56所示,编码INSP125克隆成熟多肽1)。
或者,较佳地,根据本发明此方面第三实施例,纯化的核酸分子不包括位于INSP123多肽(SEQ ID NO:39所示的氨基酸1-21)、INSP124多肽(SEQID NO:47所示的氨基酸1-21)或INSP125多肽(SEQ ID NO:55所示的氨基酸1-21)起点处的信号肽。根据此实施例,所述的纯化核酸分子最好包括SEQ ID NO:38所示的核苷酸64至414(如SEQ ID NO:42所示,编码INSP123克隆成熟多肽2)、SEQ ID NO:46所示的核苷酸44至666(如SEQID NO:50所示,编码INSP124克隆成熟多肽2)或者SEQ ID NO:54所示的核苷酸64至525(如SEQ ID NO:58所示,编码INSP125克隆成熟多肽2)。
或者,较佳地,根据本发明此方面第四实施例,纯化的核酸分子不包括位于INSP123多肽(SEQ ID NO:39所示的氨基酸1-31)、INSP124多肽(SEQID NO:47所示的氨基酸1-31)或INSP125多肽(SEQ ID NO:55所示的氨基酸1-31)起点处的信号肽。根据此实施例,所述的纯化核酸分子最好包括SEQ ID NO:38所示的核苷酸94至414(如SEQ ID NO:44所示,编码INSP123克隆成熟多肽3)、SEQ ID NO:46所示的核苷酸94至666(如SEQID NO:52所示,编码INSP124克隆成熟多肽3)或者SEQ ID NO:54所示的核苷酸94至525(如SEQ ID NO:60所示,编码INSP125克隆成熟多肽3)。
本发明还提供由SEQ ID NO:1所示的核苷酸70至417(如SEQ IDNO:3所示,编码INSP123成熟多肽)、SEQ ID NO:5所示的核苷酸70至390(如SEQ ID NO:13所示,编码INSP124外显子1成熟多肽)、SEQ IDNO:11所示的核苷酸70至669(如SEQ ID NO:15所示,编码INSP124成熟多肽)、SEQ ID NO:17所示的核苷酸70至100(如SEQ ID NO:27所示,编码INSP125外显子1成熟多肽)、SEQ ID NO:25所示的核苷酸70至528(如SEQ ID NO:29所示,编码INSP125成熟多肽)、SEQ ID NO:38所示的核苷酸67至414(如SEQ ID NO:40所示,编码INSP123克隆成熟多肽1)、SEQ ID NO:38所示的核苷酸64至414(如SEQ ID NO:42所示,编码INSP123克隆成熟多肽2)、SEQ ID NO:38所示的核苷酸94至414(如SEQID NO:44所示,编码INSP123克隆成熟多肽3)、SEQ ID NO:46所示的核苷酸67至666(如SEQ ID NO:48所示,编码INSP124克隆成熟多肽1)、SEQ ID NO:46所示的核苷酸44至666(如SEQ ID NO:50所示,编码INSP124克隆成熟多肽2)、SEQ ID NO:46所示的核苷酸94至666(如SEQID NO:52所示,编码INSP124克隆成熟多肽3)、SEQ ID NO:54所示的核苷酸67至525(如SEQ ID NO:56所示,编码INSP125克隆成熟多肽1)、SEQ ID NO:54所示的核苷酸64至525(如SEQ ID NO:58所示,编码INSP125克隆成熟多肽2)或者SEQ ID NO:54所示的核苷酸94至525(如SEQ ID NO:69所示,编码INSP125克隆成熟多肽3)组成的纯化核酸分子。
本发明第五方面提供一种在高度严谨条件下与本发明第四方面的核酸分子杂交的纯化核酸分子。
本发明第六方面提供一种含有本发明第四或第五方面的核酸分子的载体,例如表达载体。优选的载体包括pCR4-TOPO-INSP123(图9)、pDONR(图10)、pEAK12d(图11)、pDEST12.2(图12)、pENTR-INSP123-6HIS(图13)、pEAK12d-INSP123-6HIS(图14)、pDEST12.2-INSP123-6HIS(图15)、pCR4-BluntII-TOPO-INSP124(图19)、pDONR221(图20)、pEAK12d(图21)、pDEST12.2(图22)、pENTR_INSP124-6HIS(图23)、pEAK12d_INSP124-6HIS(图24)、pDEST12.2_INSP124-6HIS(图25)、pCR4-TOPO-INSP125(图29)、pDONR221(图30)、pEAK12d(图31)、pDEST12.2(图32)、pENTR_INSP125-6HIS(图33)、pEAK12d_INSP125-6HIS(图34)和pDEST12.2_INSP125-6HIS(图35)表达载体。
本发明第七方面提供一种用本发明第六方面的载体转化的宿主细胞。
本发明第八方面提供一种配体,它特异性地结合本发明第二或第三方面的含vWFC结构域的蛋白质家族成员。
本发明第九方面提供一种有效改变编码本发明第二或第三方面的多肽的天然基因表达或者调节本发明第二或第三方面的多肽活性的化合物。
本发明第九方面的化合物可以增加(激动)或降低(拮抗)基因表达水平或多肽活性。
重要的是,鉴定了INSP123、INSP124和INSP125多肽功能,就可以设计能够鉴定有效地治疗和/或诊断疾病的化合物的筛选方法。本发明第八和第九方面的配体和化合物可用这样的方法鉴定。这些方法包括在本发明范围内。
本发明第十方面提供本发明第二或第三方面的多肽,或者本发明第四或第五方面的核酸分子,或者本发明第六方面的载体,或者本发明第七方面的宿主细胞,或者本发明第八方面的配体,或者本发明第九方面的化合物在治疗或诊断涉及含vWFC结构域的蛋白质家族成员的疾病中的用途。这些疾病可以包括细胞增殖性疾病,包括肿瘤、黑素瘤、癌、结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤;骨髓增生性疾病,例如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板减少症、血管生成障碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏症、炎症性肠疾病、关节炎、屑病、呼吸道发炎、哮喘和器官移植排斥;心血管疾病,包括高血压、水肿、心绞痛、动脉硬化症、血栓症、败血症、休克、再灌注损伤和缺血;神经系统疾病,包括中枢神经系统疾病、阿茨海默氏病、脑损伤、肌萎缩性侧索硬化症和疼痛;发育障碍,例如与软骨和骨架发育相关的疾病,包括骨关节炎;代谢性疾病,包括糖尿病、骨质疏松和肥胖、AIDS和肾病;感染,包括病毒性感染、细菌性感染、真菌性感染和寄生虫感染和其它病理病症。较佳地,所述疾病是涉及含vWFC结构域的蛋白质的疾病。这些分子也可用来制造治疗上述疾病的药物。这些分子还可用来避孕或治疗包括不孕症在内的生殖障碍。
本发明第十一方面提供一种诊断患者疾病的方法,该方法包括评估所述患者组织中编码本发明第二或第三方面的多肽的天然基因的表达水平或者本发明第二或第三方面的多肽活性,并将所述表达水平或者活性与对照水平作比较,若该水平与所述对照水平不同,则表示患病。这种方法最好在体外进行。可用类似方法监测对患者疾病的治疗,其中多肽或核酸分子的表达水平或活性在一段时间内趋向于对照水平,表示该疾病获得缓解。
检测本发明第二或第三方面的多肽的优选方法包括以下步骤:(a)在适合形成配体-多肽复合物的条件下,将本发明第八方面的一种配体,例如抗体与生物样品接触;以及(b)检测所述复合物。
本领域的读者将懂得,本发明第十一方面的方法有很多种,各不相同,例如,核酸与短探针杂交法、点突变分析法、聚合酶链式反应(PCR)扩增法以及使用抗体检测异常蛋白水平的方法。类似方法的使用可以是短期或长时间的,以便治疗患者被监测的疾病。本发明还提供一些用于这些方法中诊断疾病的试剂盒。
本发明第十二方面提供本发明第二或第三方面的多肽作为含有vWFC结构域蛋白质的用途。本发明多肽作为含有vWFC结构域蛋白质的适当用途包括作为细胞生长、代谢或分化调节剂的用途、作为受体/配体对一部分的用途以及作为生理或病理病症诊断标记物的用途。
本发明第十三方面提供一种药物组合物,该组合物含有本发明第二或第三方面的多肽,或者本发明第四或第五方面的核酸分子,或者本发明第六方面的载体,或者本发明第七方面的宿主细胞,或者本发明第八方面的配体,或者本发明第九方面的化合物,并掺合药学上可接受的载体。
本发明第十四方面提供本发明第二或第三方面的多肽,或者本发明第四或第五方面的核酸分子,或者本发明第六方面的载体,或者本发明第七方面的宿主细胞,或者本发明第八方面的配体,或者本发明第九方面的化合物在制造诊断或治疗疾病的药物中的用途。
本发明第十五方面提供一种治疗患者疾病的方法,该方法包括把本发明第二或第三方面的多肽,或者本发明第四或第五方面的核酸分子,或者本发明第六方面的载体,或者本发明第七方面的宿主细胞,或者本发明第八方面的配体,或者本发明第九方面的化合物给予该患者。
当与健康受试者中编码本发明第二或第三方面的多肽的天然基因的表达水平或者本发明第二或第三方面的多肽活性相比,病患者的该表达水平或活性较低的,给予该患者的多肽、核酸分子、配体或化合物应该是激动剂。相反,当与健康受试者中所述多肽的天然基因的表达水平或者活性相比,病患者的该表达水平或活性较高的,给予该患者的多肽、核酸分子、配体或化合物应该是拮抗剂。拮抗剂的例子包括反义核酸分子、核酶和配体,例如抗体。
本发明第十六方面提供转基因或剔除非人动物,它们被转化为表达更高水平、更低水平或者不表达本发明第二或第三方面的多肽。这些转基因动物是研究疾病极为有用的模型,也可用在筛选方案中,鉴定有效治疗或诊断这样一种疾病的化合物。
以下,给出为实施本发明而可采用的标准技术和步骤的概要。应明白,本发明并不限于所述的这些具体方法、方案、细胞系、载体和试剂。还应明白,本文所用的术语目的仅在于描述具体实施例,该术语不应该被看成为限定本发明的范围。本发明的范围只由所附权利要求书的术语限定。
说明书中核苷酸和氨基酸使用标准缩写。
除非另有指出,本发明的做法是采用分子生物学、微生物学、重组DNA技术和免疫学的常规技术,它们都已为本领域技术人员所掌握。
这些技术在有关文献中已有详细解释。例如,可参考以下特别适用的文献:Sambrook Molecular Cloning;A Laboratory Manual,Second Edition(1989);DNA Cloning,Volumes I and II(D.N Glover ed.1985);Oligonucleotide Synthesis(M.J.Gait ed.1984);Nucleic Acid Hybridization(B.D.Hames&S.J.Higgins eds.1984);Transcription and Translation(B.D.Hames&S.J.Higgins eds.1984);Animal Cell Culture(R.I.Freshney ed.1986);Immobilized Cells and Enzymes(IRL Press,1986);B.Perbal,A PracticalGuide to Molecular Cloning(1984);the Methods in Enzymology series(Academic Press,Inc.),especially volumes 154&155;Gene Transfer Vectorsfor Mammalian Cells(J.H.Miller and M.P.Calos eds.1987,Cold Spring HarborLaboratory);Immunochemical Methods in Cell and Molecular Biology(Mayerand Walker,eds.1987,Academic Press,London);Scopes,(1987)ProteinPurification:Principles and Practice,Second Edition(Springer Verlag,N.Y.);Handbook of Experimental Immunology,Volumes I-IV(D.M.Weir and C.C.Blackwell eds.1986)。
本文所用的术语“多肽”包括含有相互间以肽键或修饰肽键连接的两个或以上氨基酸的任何肽或蛋白质,即肽同构物(isostere)。该术语指短链(肽和寡肽)和长链(蛋白质)。
本发明的多肽可以是成熟蛋白质形式,或者可以是前(pre-,pro-,prepro-)蛋白质,其可通过切割前部分而激活,产生活性成熟多肽。这些多肽中的前序列可以是先导序列或者分泌序列或者是用来纯化成熟多肽序列的序列。
本发明第二或第三方面的多肽可形成融合蛋白的一部分。例如,有利的往往包括一或多个附加氨基酸序列,这些附加氨基酸序列可含有分泌序列或先导序列、前序列(pro-sequences)、有助纯化的序列、或者例如在重组生产中赋予蛋白质更高稳定性的序列。另一个选择或者另一方面是,成熟多肽可与另一种化合物,例如与延长该多肽半衰期的化合物(譬如聚乙二醇)融合。
多肽可含有除20个基因编码的氨基酸外的由天然过程,例如翻译后加工,或者由本领域公知的化学修饰技术修饰的氨基酸。在已知的修饰中,本发明的多肽通常带有的修饰是糖基化、脂质附着、硫酸化、例如谷氨酸残基的γ-羧酸化,羟基化和ADP-核糖基化。其它可能的修饰包括乙酰化、酰化、酰胺化、黄素的共价附着、血素分子的共价附着、核苷酸或核苷酸衍生物的共价附着、脂质衍生物的共价附着、磷脂酰肌醇的共价附着、交联、环化、二硫键形成、脱甲基化、共价交联形成、半胱氨酸形成、焦谷氨酸盐形成、甲酰化、GPI锚着形成、碘化、甲基化、豆蔻酰化、化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、硒酰化、转移-RNA介导的蛋白质中插入氨基酸例如精氨酰化,以及遍在蛋白化。
修饰可发生于多肽的任何位置,包括肽骨架、氨基酸侧链以及氨基或羧基末端。事实上,天然存在的肽和合成肽一般通过共价修饰封闭肽的氨基或羧基末端,或者封闭二者,这样的修饰存在于本发明的多肽中。
发生在多肽内的修饰通常随制成该多肽的方式而变化。对于重组制成的多肽,通过特定宿主细胞翻译后修饰能力以及存在于所述多肽的氨基序列中的修饰信号来确定大部分修饰的性质和程度。例如,不同类型的宿主细胞之间糖基化型式是不同的。
本发明的多肽可以任何合适的方式制成。这些多肽包括分离的天然存在的多肽(例如自细胞培养基中纯化而来)、重组产生的多肽(包括融合蛋白)、合成产生的多肽或者通过这些方法组合所产生的多肽。
本发明第三方面的功能等同多肽可以是与INSP123、INSP124和INSP125多肽同源的多肽。如果一个多肽的序列与另一个多肽的序列具有足够高程度的同一性或相似性,本文就用术语“同源的”来形容该两个多肽。“同一性”表示在对比序列的任何特定位置上,两个序列之间的氨基酸残基是相同的。“相似性”表示在对比序列的任何特定位置上,两个序列的氨基酸残基是相似的。同一性和相似性的程度不难计算(Computational MolecularBiology,Lesk,A.M.,ed.,Oxford University Press,New York,1988;Biocomputing.Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part1,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,yon Heinje,G.,AcademicPress,1987;Sequence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,New York,1991)。
所以,同源多肽包括INSP123、INSP124和INSP125多肽的天然生物变体(例如,产生多肽的物种内等位基因变体或地理变体)和突变体(例如,含有氨基酸取代、插入或缺失的突变体)。这些突变体可包括其中一或多个氨基酸残基被保守性或非保守性氨基酸残基(优选保守性氨基酸残基)取代的多肽,这样一个取代的氨基酸残基可以或不必是遗传密码编码的残基。典型的取代是在Ala、Val、Leu和Ile之间;在Ser和Thr之间;在酸性残基Asp和Glu之间;在Asn和Gln之间;在性残基Lys和Arg之间;或者在芳香族残基Phe和Tyr之间进行。特别优选的是这样一些变体:有多个氨基酸,即5至10个氨基酸,1至5个氨基酸,1至3个氨基酸,1至2个氨基酸,或者仅有1个氨基酸以任意组合取代、缺失或插入的变体。特别优选的是不改变该蛋白质的性质和活性的沉默取代、插入和缺失。就此而言,特别优选的还有保守性取代。这些突变体也包括其中一或多个氨基酸残基包括一取代基团的多肽。
通常,两个多肽之间的同一性大于30%,就认为它们在功能上是等同的。本发明第二或第三方面的功能等同多肽与INSP123、INSP124或INSP125多肽,或其活性片段的序列同一性优选大于80%。更好的多肽分别具有大于85%、90%、95%、98%或99%的同一性。
本发明第二或第三方面的功能等同多肽还可以是已用一或多种结构对比技术鉴定的多肽。例如,可以应用Inpharmatica Genome ThreaderTM技术(它构成用于产生BiopendiumTM检索数据库的检索工具的其中一部分,参见国际申请WO01/69507)来鉴定现时具有未知功能的多肽,这些多肽虽然与INSP123、INSP124和INSP125多肽具有较低的序列同一性,但由于与INSP123、INSP124和INSP125多肽序列共享较高水平的结构同源性,故可预计它们是含有vWFC结构域的蛋白质家族成员。“较高水平的结构同源性”指用Inpharmatica Genome Threader预测两个蛋白质共享至少10%确定性和以上的结构同源性。
本发明第二或第三方面的多肽还包括INSP123、INSP124和INSP125多肽的片段、INSP123、INSP124和INSP125多肽的功能等同物的片段,只要那些片段是含有vWFC结构域的蛋白质家族成员,或者带有与INSP123、INSP124和INSP125多肽相同的抗原性决定簇。
本文所用的术语“片段”指氨基酸序列与INSP123、INSP124和INSP125多肽或它们的其中一种功能等同物的部分而非全部氨基酸序列相同的多肽。这些片段应包括所述序列的至少n个连续氨基酸,取决于特定的序列,n最好是7或以上(例如,8、10、12、14、16、18、20或以上)。小片段可形成抗原性决定簇。
全长INSP123、INSP124和INSP125多肽的片段可分别由INSP123、INSP124和INSP125多肽中2、3或4个相邻外显子序列组合组成。
这些片段可以是“独立的(free-standing)”,即不是其它氨基酸或多肽的一部分,也不与其它氨基酸或多肽融合,或者它们可包含在它们构成其中一部分或区域的较大多肽之内。当包含在较大多肽之内时,本发明的片段最好构成单个连续区域。例如,一些优选实施例涉及一个片段,其具有与该片段的氨基末端融合的前多肽区域,和/或具有与该片段的羧基末端融合的附加区域。然而,单一个较大多肽内可含有多个片段。
本发明的多肽或其免疫原性片段(包含至少一个抗原性决定簇)可被应用来产生对这些多肽有免疫特异性的配体,例如多克隆或单克隆抗体。这些抗体可用于分离或鉴定表达本发明的多肽的克隆,或者用于亲和力层析法纯化这些多肽。抗体还可用来帮助诊断或治疗,以及其它应用,这对本发领域技术人员是显而易见的。
术语“蛋白质”指一类多肽,包括但不限于,起着酶功能的那些。较佳地,本发明的蛋白质或多肽起配体作用。本文的配体指与另一个分子如受体结合的分子。配体可以是酶的协同因子。术语“免疫特异性”指抗体对本发明的多肽的亲和力远远大于它们对现有领域其它相关多肽的亲和力。本文所用的术语“抗体”指能够与所述抗原性决定簇结合的完整分子及其片段,例如Fab、F(ab′)2和Fv。所以,这些抗体与本发明第二或第三方面的多肽结合。
如果需要多克隆抗体,可用本发明第二或第三方面的多肽使一种选定哺乳动物免疫,例如小鼠、兔、山羊或。用来免疫动物的多肽可通过重组DNA技术产生,或者可通过化学方法合成。有需要的时候,可将多肽与一载体蛋白质连接。通过化学方法与多肽偶联的常用载体包括血清白蛋白、甲状腺球蛋白和钥孔血蓝蛋白。然后,用偶联的多肽来免疫动物。采集该免疫动物的血清,再按公知的程序,例如免疫亲和力层析法加以处理。
本领域技术人员可轻易地生产针对本发明第二或第三方面的多肽的单克隆抗体。应用杂交瘤技术生产单克隆抗体的一般方法已为人所公知(例如,参见Kohler,G.和Milstein,C.,Nature 256:495-497(1975);Kozbor等,Immunology Today 4:72(1983);Cole等,77-96in Monoclonal Antibodiesand Cancer Therapy,Alan R.Liss,Inc.(1985))。
可针对各种性质,即同种型、表位、亲和力等,筛选针对本发明第二或第三方面的多肽产生的多系列单克隆抗体。单克隆抗体特别用于纯化它们所针对的各种多肽。另一方面,编码感兴趣单克隆抗体的基因可通过例如本领域公知的PCR技术在杂交瘤中分离出来,并可在适当载体中克隆和表达。
还可使用嵌合抗体,其中非人的可变区与人稳定区连接或融合(例如,参见Liu等,Proc.Natl.Acad.Sci.USA,84,3439(1987))。
可对抗体进行修饰,例如通过使它人源化,以便在某一个体内的免疫原性减弱(参见ones等,Nature,321,522(1986);Verhoeyen等,Science,239,1534(1988);Kabat等,J.Immunol.,147,1709(1991);Queen等,Proc.Natl Acad.Sci.USA,86,10029(1989);Gorman等,Proc.Natl Acad.Sci.USA,88,34181(1991);以及Hodgson等,Bio/Technology,9,421(1991))。本文所用的术语“人源化抗体”指非人供体抗体的重链和/或轻链可变区内CDR氨基酸和选定的其它氨基酸已经被人抗体的等同氨基酸所取代的抗体分子。所以,人源化抗体与人抗体极为相近,但具有该供体抗体结合的能力。
另一个选择是,抗体可以是“双特异性”抗体,即它是一种有两个不同抗原结合区的抗体,每一结合区针对不同表位。
可应用噬菌体展示技术选择基因,所述基因编码具有与本发明多肽结合的活性的抗体,它们来自筛选用来加工有关抗体的以PCR技术扩增的人淋巴细胞V基因库,或者天然文库(McCafferty,J.等,(1990),Nature 348,552-554;Marks,J.等,(1992)Biotechnology 10,779-783)。这些抗体的亲和力也可通过链改组加以改善(Clackson,T.等,(1991)Nature 352,624-628)。
以上述技术产生的多克隆抗体或单克隆抗体得到额外应用,因为它们可用作免疫测定法、放射性免疫测定法(RIA)或者酶联免疫吸附测定法(ELISA)中的试剂。在这些应用中,可使用可分析检测到的试剂,例如放射性同位素、萤光分子或酶来标记抗体。
本发明第四和第五方面的优选核酸分子是编码SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ IDNO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59和SEQ IDNO:61所示的多肽序列和功能等效多肽的那些。这些核酸分子可用于本文描述的方法和应用中。本发明的核酸分子最好含有至少n个本文所公开的序列中的连续核苷酸,取决于特定的序列,n是10或以上(例如,12、14、15、18、20、25、30、35、40或以上)。
本发明的核酸分子还包括上述核酸分子的互补序列(例如,用于反义或探测目的)。
本发明的核酸分子可以是RNA形式,如mRNA,或者是DNA形式,包括例如cDNA、合成DNA或基因组DNA。这样一些核酸分子可通过克隆、化学合成技术或其组合获得。例如,核酸分子可通过应用诸如固相亚磷酰胺化学合成从基因组或cDNA文库化学合成,或者从生物体中分离而制备。RNA分子的产生是运用DNA序列的体内或体外转录。
核酸分子可以是双链或单链。单链DNA可以是编码链,也称有义链,或者它可以是非编码链,也称反义链。
术语“核酸分子”还包括DNA和RNA类似物,例如含有修饰骨架的那些类似物,以及肽核酸(PNA)。本文所用的术语“PNA”指反义分子或反基因试剂,其含有长至少5个核苷酸的寡核苷酸,所述寡核苷酸与最好以赖氨酸为末端的氨基酸残基肽骨架连接。该末端赖氨酸使组合物具有溶解性。PNA可被聚乙二醇化,延长它们在细胞内的停留时间,在细胞内它们优先与补体单链DNA和RNA结合,并终止转录延伸(Nielsen,P.E.等,(1993)Anticancer Drug Des.8:53-63)。
编码本发明多肽的核酸分子可以与本文公开的一或多个核酸分子的编码序列相同。
这些分子还可以有另一个不同序列,因为遗传密码简并性,该不同序列编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:39、SEQ IDNO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ IDNO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ IDNO:57、SEQ ID NO:59和SEQ ID NO:61所示的多肽。这些核酸分子可包括,但不限于,成熟多肽自身的编码序列;成熟多肽的编码序列加上附加编码序列,例如编码先导序列或分泌序列(如前多肽序列)的序列;成熟多肽的编码序列,加上或不加上前述附加编码序列,再加上另外一些非编码序列,包括非编码5’和3’序列,例如在转录(包括终止信号)、核糖体结合和mRNA稳定性中发挥作用的转录非翻译序列。核酸分子还包括编码附加氨基酸的附加序列,例如提供附加功能的那些氨基酸。
本发明第四和第五方面的核酸分子也可编码本发明第二或第三方面的多肽及片段的片段或功能等同物。这样一种核酸分子可以是天然存在的变体,例如天然存在的等位基因变体,或者该分子可以是未知是天然存在的变体。核酸分子的非天然存在的变体可通过诱变技术制成,包括适用于核酸分子、细胞或生物体的那些技术。
就此而言,这些变体是通过核苷酸取代、缺失或插入而不同于上述核酸分子的变体。取代、缺失或插入可涉及一或多个核苷酸。变体可在编码区或非编码区或者二者内发生变化。编码区内的变化可产生保守性或非保守性氨基酸取代、缺失或插入。
本发明的核酸分子也可以采用本领域公知的方法为多种原因而进行改造,这些原因包括修饰克隆、加工、和/或基因产物(多肽)的表达。可用来改造核苷酸序列的技术还包括应用随机断裂所作的DNA改组、基因片段和合成寡核苷酸的PCR重新装配。可利用定点诱变插入新的限制位点,改变糖基化模式,修改密码子偏向,产生剪接变体,引入突变等等。
编码本发明第二或第三方面的多肽的核酸分子可与异源序列连接,以致该组合核酸分子编码融合蛋白。这样一些组合核酸分子包括在本发明第四和第五方面之内。例如,要在肽库中筛选抑制多肽活性的抑制剂,用这种组合核酸分子表达可被市售抗体识别的融合蛋白是有用的。融合蛋白还可被改造成含有位于本发明多肽的序列与异源蛋白质的序列之间的切割位点,这样,切割该多肽,从该异源蛋白质中纯化出来。
本发明的核酸分子还包括一些反义分子,它们与编码本发明的多肽的核酸分子部分互补,因而能与编码核酸分子杂交。如本领域普通技术人员所知,这些反义分子,例如寡核苷酸,可设计成识别、特异性地结合以及防止编码本发明多肽的靶核酸的转录(例如,参见Cohen,J.S.,Trends in Pharm.Sci.,10,435(1989),Okano,J.Neurochem.56,560(1991);O′Connor,J.Neurochem 56,560(1991);Lee等,Nucleic Acids Res 6,3073(1979);Cooney等,Science 241,456(1988);Dervan等,Science 251,1360(1991))。
本文所用的术语“杂交”指两个核酸分子通过氢键相互缔合。通常,将一个分子固定于固相支持物上,而另一个分子在溶液中游离。然后,在有利氢键键合的条件下使两个分子相互接触。影响键合的因素包括:溶剂的类型和体积;反应温度;杂交时间;搅拌;封闭液相分子与固相支持物非特异性附着的试剂(Denhardt′s试剂或BLOTTO);分子的浓度;提高分子缔合率的化合物的使用(硫酸葡聚糖或聚乙二醇);杂交后洗涤条件的严谨程度(参见上述文献Sambrook等)。
应用本领域公知的杂交测定法(例如,参见上述文献Sambrook等,同上),可检查一个完全互补分子与靶分子杂交的抑制。遵照Wahl,G.M.和S.L.Berger(1987;Methods Enzymol.152:399-407)以及Kimmel,A.R.(1987;Methods Enzymol.152:507-511)的教导,在不同严谨程度的条件下,使基本上同源的分子竞争并抑制完全同源的分子与靶分子的结合。
“严谨程度”指在杂交反应中与不同的分子缔合相比,有利于极度相似的分子缔合的条件。高度严谨杂交条件定义为42℃下在一溶液中培养过夜,该溶液含有50%甲酰胺、5×SSC(150mM氯化钠,15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardts溶液、10%硫酸葡聚糖和20微克/毫升变性剪切鲑鱼精子DNA,然后,约65℃下在0.1×SSC中洗涤过滤器。低度严谨条件涉及在35℃下进行的杂交反应(参见上述文献Sambrook等,同上)。杂交使用的优选条件是高度严谨杂交条件。
本发明该方面的优选例子是其全长至少有70%与编码INSP123、INSP124和INSP125多肽的核酸分子相同的核酸分子以及基本上与这些核酸分子互补的核酸分子。本发明该方面的优选核酸分子含有一区域,该区域的全长至少有80%与这些编码序列相同,或者是它们的一个互补核酸分子。就此而言,特别优选的是其全长至少有90%,优选至少95%,更好至少98%、99%或以上与所述核酸分子相同的核酸分子。优选的例子是编码基本上保留与INSP123、INSP124和INSP125多肽相同的生物功能或活性的多肽的核酸分子。
本发明还提供一种检测本发明核酸分子的方法,该方法包括以下步骤:(a)在杂交条件下,将本发明的核酸探针与生物样品接触,形成双链体;以及(b)检测所形成的任何双链体。
下文另外讨论关于本发明可采用的测定法,上述的核酸分子可用作RNA、cDNA或基因组DNA的杂交探针,分离编码INSP123、INSP124和INSP125的全长cDNA和基因组克隆,以及分离与编码该多肽的基因有高度同一性的同源或直向同源基因的cDNA和基因组克隆。
在这点上,可以使用以下技术,其中包括已为本领域技术人员所知的,为了举例说明讨论如下。DNA的测序和分析方法已为人公知,在本领域中可以获得到,事实上这些方法也用于以下讨论的本发明很多实施例中。这些方法可使用酶,例如DNA聚合酶I的克列诺片段测序酶(US BiochemicalCorp,Cleveland,OH)、Taq聚合酶(Perkin Elmer)、耐热T7聚合酶(Amersham,Chicago,IL)或者这些酶的组合,以及校读外切核酸酶,例如Gibco/BRL(Gaithersburg,MD)出售的ELONGASE扩增系统中找到的那些外切核酸酶。优选的测序方法可应用Hamilton Micro Lab 2200(Hamilton,Reno,NV)、Peltier Thermal Cycler(PTC200;MJ Research,Watertown,MA)和ABI催化剂以及373和377DNA测序仪(Perkin Elmer)等仪器进行自动操作。
一种分离编码具有与INSP123、INSP124和INSP125多肽等同功能的多肽的核酸分子的方法是按照本领域公认的标准程序用天然或人工设计的探针探测基因组或cDNA文库(例如,参见″Current Protocols in MolecularBiology″,Ausubel等(eds),Greene Publishing Association and John WileyInterscience,New York,1989,1992)。特别有用的探针:含有至少15个,优选至少30个,更好是至少50个邻接碱基,这些碱基对应于,或者与适当的编码基因的核酸序列(SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:54、SEQ ID NO:56、SEQ ID NO:58和SEQ ID NO:60)互补。使用可分析检测到的试剂标记这些探针,方便鉴定。有用的试剂包括,但不限于,放射性同位素、萤光染料和能够催化待检测产物形成的酶。有了这些探针,本领域普通技术人员就能够从人、哺乳动物或其它动物来源中分离出感兴趣的基因组DNA、cDNA或RNA聚核苷酸编码蛋白质的互补拷贝,并能够在这些来源中筛选出有关序列,例如该家族、类型和/或亚型的额外成员。
多数情况下,分离的cDNA序列是不完整的,因为编码多肽的区域通常在5’端被截短。现时有一些方法可获得全长cDNA,或者将短cDNA延长。应用部分核苷酸序列和本领域公知的各种方法检测上游序列,例如启动子和调控组件,可将这些序列延长。例如,可采用的一种方法是基于快速扩增cDNA末端的方法(RACE;例如参见Frohman等,PNAS USA 85,8998-9002,1988)。最近,MarathonTMtechnology(Clontech Laboratories Inc.)对这种技术进行了改进,例如使较长cDNA的检索大大简化。另一种稍稍不同的技术称为“限制位点”PCR,它使用通用探针检索邻接一已知基因座的未知核酸序列(Sarkar,G.(1993)PCR Methods Applic.2:318-322)。以基于已知区域的趋异性引物,也可用反向PCR来扩增或延长序列(Triglia,T.等,(1988)Nucleic Acids Res.16:8186)。捕捉PCR是可使用的另一种方法,它涉及通过PCR技术扩增邻接人和酵母人工染色体DNA中一已知序列的DNA片段(Lagerstrom,M.等,(1991)PCR Methods Applic.,1,111-119)。可用来检索未知序列的另一种方法是Parker,J.D.等描述的方法(1991,Nucleic Acids Res.19:3055-3060)。另外,人们可使用PCR、嵌套引物和PromoterFinderTM文库来查看基因组DNA(Clontech,Palo Alto,CA)。这种方法不需要筛选文库,可用于寻找内含子/外显子接合。
当筛选全长cDNA时,最好用已经按大小进行选择包含了较大cDNA的文库。优选的还有随机引物文库,因为它们含有较多含基因5’区的序列。对于寡d(T)文库不能产生全长cDNA的情形,最好使用随机引物文库。基因组文库可用来将序列延伸进入5’非转录调控区。
在本发明一实施例中,本发明的核酸分子可用来进行染色体定位。在这一技术中,核酸分子特异性靶向,并能与单个人染色体的特定位置杂交。对本发明染色体的相关序列作图谱,是确认那些序列与基因相关疾病相互关系的重要步骤。一旦将序列与准确染色体位置在图谱反映出来,就可以将染色体上序列的物理位置与基因图谱数据关联起来。这些数据例如可以在人类孟德尔遗传学数据库中找到(Johns Hopkins大学韦尔奇医学库在线提供)。然后,通过连分析(物理相邻基因的共同继承)确定基因与定位在同一个染色体区的疾病之间的关系。这为研究人员用定位克隆或其它基因发现技术检索疾病基因提供了有价值的信息。一旦通过遗传连锁分析粗略确定了疾病或综合征位于特定基因组区,定位在该区域的任何序列代表相关或调控基因,可作进一步研究。核酸分子还可用来检测由于正常、载体或染病个体之间移位、反转等造成染色体位置的差异。
本发明的核酸分子对于组织定位也是有价值的。这些技术通过检测编码多肽的mRNA可以确定该多肽在组织中的表达模式。这些技术包括原位杂交技术和核苷酸扩增技术,例如PCR。从研究中获得的结果可知道生物体中多肽的正常功能。另外,mRNA的正常表达模式与突变基因编码的mRNA的正常表达模式之间的比较研究为理解突变多肽在疾病中的作用提供了有价值的认知。不适当表达可以是时间、空间或量化。
本发明的载体包含本发明的核酸分子,可以是克隆或表达载体。本发明的宿主细胞可以是原核细胞或真核细胞,它们可用本发明的载体转化、转染或转导。
本发明的多肽可以重组形式制备,方法是在宿主细胞所含的载体内表达它们的编码核酸分子。这些表达方法已为本领域技术人员公知,很多方法已由上述的Sambrook和Femandez与Hoeffiier的书(1998,eds.″Geneexpression systems,Using nature for the art of expression″.Academic Press,San Diego,London,Boston,New York,Sydney,Tokyo,Toronto)详细叙述。
一般而言,可使用适合维持、繁殖或表达核酸分子在一所需宿主内产生多肽的任何系统或载体。应用各种公知的常规技术,例如上述Sambrook中描述的技术,可将适当的核苷酸序列插入一表达系统中。通常,可使编码基因受控于调控组件,例如启动子、核糖体结合位点(对于细菌表达),任选地是操纵子,以便将编码所希望的多肽的DNA序列转录至转化宿主细胞的RNA内。
例如,适当的表达系统的例子包括染色体系统、附加体系统和病毒衍生系统,包括例如衍生自以下物质的载体:细菌质粒、噬菌体、转位子、酵母附加体、插入组件、酵母染色体组件、病毒例如杆状病毒、乳多空病毒如SV40、牛痘病毒、腺病毒、禽痘病毒、假狂犬病毒和逆转录病毒,或者其组合,例如从质粒和噬菌体遗传因子所产生的载体,包括粘粒和噬菌粒。人的人工染色体(HAC)也可用来输送在质粒中所含有和表达的较大DNA片段。本发明用的适当载体的优选例子是载体INSP123(图9)、pDONR(图10)、pEAK12d(图11)、pDEST12.2(图12)、pENTR-INSP123-6HIS(图13)、pEAK12d-INSP123-6HIS(图14)、pDEST12.2-INSP123-6HIS(图15)、pCR4-BluntII-TOPO-INSP124(图19)、pDONR221(图20)、pEAK12d(图21)、pDEST12.2(图22)、pENTR_INSP124-6HIS(图23)、pEAK12d_INSP124-6HIS(图24)、pDEST12.2_INSP124-6HIS(图25)、pCR4-TOPO-INSP125(图29)、pDONR221(图30)、pEAK12d(图31)、pDEST12.2(图32)、pENTR_INSP125-6HIS(图33)、pEAK12d_INSP125-6HIS(图34)和pDEST12.2_INSP125-6HIS(图35)。
特别适合的表达系统包括微生物,例如用重组噬菌体、质粒或粘粒DNA表达系统转化的细菌;用酵母表达载体转化的酵母;用病毒表达载体(例如杆状病毒)感染的昆虫细胞系统;用病毒表达载体(例如,花椰菜花叶病毒CaMV;烟草花叶病毒TMV)或者用细胞表达载体(例如,Ti或pBR322质粒)转化的植物细胞系统;或者动物细胞系统。无细胞翻译系统也可用来产生本发明的多肽。
参照许多标准实验手册,例如Davis等人(Basic Methods in MolecularBiology(1986))和上述Sambrook等人中描述的方法,可将编码本发明的多肽的核酸分子导入宿主细胞内。特别适合的方法包括磷酸转染、DEAE-葡聚糖介导的转染、转染、微量注射、阳离子质粒介导的转染、电穿孔、转导、划痕加载、弹导导入或感染(参见上述Sambrook等人,同上,1989;Ausubel等人,1991;Spector,Goldman&Leinwald,1998)。在真核细胞中,表达系统可以是暂时的(例如附加体)或者永久的(染色体整合),取决于该系统的需要。
编码核酸分子可以包括或不包括编码调控序列例如信号肽或先导序列的序列,有需要的时候,例如将翻译的多肽分泌到内质网腔、胞质间隙或胞外环境中。这些信号可以与该多肽内源,或者它们可以是异源信号。先导序列可在翻译后加工中被细菌宿主除去。
除了调控序列之外,希望可以加入能调节与宿主细胞生长有关的多肽表达的调节序列。调节序列的例子是对化学和物理刺激,包括调节化合物的存在,或者对各种温度或代谢条件的应答可引起基因的表达增大或减少的序列。调节序列是载体的那些非翻译区,例如增强子、启动子以及5’和3’非翻译区。它们与宿主细胞蛋白质相互作用,进行转录和翻译。这些调节序列的强度和特异性可以是不同的。取决于所用的载体系统和宿主,可使用任何数量的适当转录和翻译组件,包括组成型和诱导型启动子。例如在细菌系统内克隆时,可使用诱导型启动子,例如Bluescriipt噬菌粒的杂交lacZ启动子(Stratagene,LaJolla,CA)或pSportlTM质粒(Gibco BRL)等等。在昆虫细胞内可用杆状病毒多角体蛋白启动子。由植物细胞基因组(例如,热激、RUBISCO和贮藏蛋白基因)或者植物病毒(例如,病毒启动子或先导序列)衍生而来的启动子或增强子可克隆到载体中。哺乳动物细胞系统优选使用哺乳动物基因或哺乳动物病毒的启动子。如果需要产生含有序列的多个拷贝的细胞系,可使用基于SV40或EBV的载体和一适当选择性标记物。
构建一个表达载体,用适当的调节序列可以使特定核酸编码序列位于该载体内,所述编码序列相对于调节序列的定位和方向使得该编码序列在该调节序列的“控制”下转录,即与DNA分子结合的RNA聚合酶在调节序列下转录该编码序列。在一些情况下,有需要将序列修饰成它可以适当方向附着于调控序列,即维持读框。
调控序列和其它调节序列可在插入载体之前先连接到核酸编码序列。另一个选择是,直接将编码序列克隆到已经含有调控序列和适当限制位点的表达载体中。
对于长时间高得率地生产重组多肽,最好有稳定的表达。例如,稳定地表达感兴趣的多肽的细胞系可以用含有病毒来源复制的表达载体和/或同一个或不同载体上的内源性表达组件和选择性基因转化。导入载体之后,允许细胞先在富集培养基中生长1-2天,再转移到选择培养基中。选择性标记物的目的是为选择带来抗性,它的存在可以使成功表达导入序列的细胞生长和恢复。稳定转化的细胞的抗性克隆可应用适合细胞类型的组织培养技术进行增殖。
本领域技术人员已知哺乳动物细胞系可用作表达宿主,而哺乳动物细胞系包括美国典型菌种保藏中心(ATCC)的许多无限增殖化细胞系,包括但不限于,中国仓鼠卵巢(CHO)细胞、HeLa细胞、幼仓鼠肾(BHK)细胞、猴肾(COS)细胞、C127细胞、3T3细胞、BHK细胞、HEK 293细胞、Bowes黑色素瘤细胞和人肝细胞癌(例如Hep G2)细胞以及其它许多细胞系。
杆状病毒系统中,用于杆状病毒/昆虫细胞表达系统的物质在市场上以试剂盒形式提供,可以购自Invitrogen,San Diego CA(“MaxBac”试剂盒)。这些技术对本领域技术人员而言是众所周知的,在Summers和Smith的文章(Texas Agricultural Experiment Station Bulletin No.1555(1987))中也有所描述。特别适合该系统使用的宿主细胞包括昆虫细胞,例如果蝇S2细胞和草地夜蛾Sf9细胞。
本领域已经知道很多植物细胞培养基和全植物遗传表达系统。合适的植物细胞遗传表达系统的例子包括美国专利US5,693,506;US5,659,122;和US5,608,143中描述的系统。植物细胞培养基的遗传表达的另外一些例子在Zenk,Phytochemistry 30,3861-3863(1991)中已有描述。
具体地说,可使用分离和培养原生质体得到全再生植物的所有植物,以致回收到的全植物含有转移基因。特别是所有植物可从培养细胞或组织中再生,包括但不限于甘蔗糖用甜菜花、水果和其它树木、豆类和蔬菜的所有主要种属。
特别优选的细菌宿主细胞的例子包括链球菌、葡萄球菌、大肠杆菌、链霉菌和枯草芽孢杆菌细胞。
特别适合真菌表达的宿主细胞的例子包括酵母细胞(例如酿酒酵母)和曲霉菌细胞。
本领域已经知道许多选择系统,它们都可用来回收转化细胞系。例如,单纯疱疹病毒胸腺嘧啶激酶(Wigler,M.等人,(1977)Cell 11:223-32)和腺嘌呤磷酸核糖转移酶(Lowy,I.等人,(1980)Cell 22:817-23)基因可分别用在tk-或aprt±细胞中。
另外,选择的基础可以是抗代谢物、抗生素或除草剂抗性;例如,二氢叶酸还原酶(DHFR)赋予氨甲蝶呤抗性(Wigler,M.等人,(1980)Proc.Natl.Acad.Sci.77:3567-70);npt赋予氨基糖苷新霉素和G-418抗性(Colbere-Garapin,F.等人,(1981)J.Mol.Biol.150:1-14),als或pat分别赋予绿黄隆和草丁膦乙酰转移酶抗性。此外,还描述了其它选择性基因,它们的例子为本领域技术人员所知。
虽然标记基因表达的存在或不存在提示感兴趣的基因也是存在的,但它的存在和表达有待确认。例如,如果在一标记基因序列中插入相关的基因,标记基因功能不存在则可以确定含有适当序列的转化细胞。另一个选择是,在单个启动子控制下将标记基因与编码本发明的多肽的序列串联放置。标记基因应答诱导或选择的表达通常也表示串联基因的表达。
另外,含有编码本发明的多肽的核酸序列,并表达所述多肽的宿主细胞可通过本领域技术人员公知的各种程序进行鉴定。这些程序包括但不限于:DNA-DNA或DNA-RNA杂交和蛋白质生物分析,例如,萤光激活细胞分类术(FACS)或免疫测定技术(例如,酶联免疫吸附试验(ELISA)和放射性免疫测定法(RIA)),包括用来检测和/或定量分析核酸或蛋白质的膜、溶液或芯片技术(参见Hampton,R.等人,(1990)Serological Methods,a LaboratoryManual,APS Press,St Paul,MN和Maddox,D.E.等人,(1983)J.Exp.Med,158,1211-1216)。
本领域技术人员公知的各种各样标记和连接技术可用在不同的核酸和氨基酸试验中。产生标记杂交的装置或者检测与编码本发明的多肽的核酸分子有关的序列的PCR探针包括,寡标记、镍翻译、末端标记或使用标记聚核苷酸的PCR扩增。另外,也可将编码本发明的多肽的序列克隆到载体内,以产生mRNA探针。这些载体是本领域公知的,可通过商业途径获得,加入诸如T7、T3或SP6等适当RNA聚合酶和标记核苷酸可在体外合成RNA探针。这些步骤使用市场上供应的各种试剂盒(Pharmacia&Upjohn,(Kalamazoo,MI);Promega(Madison WI);和U.S.Biochemical Corp.,Cleveland,OH))进行。
易于检测的合适报导分子或标记包括放射性核、酶和萤光、化学发光或发色试剂和物质、协同因子、抑制剂、磁性粒子等等。
本发明的核酸分子还可用来制造转基因动物,特别是啮齿动物。这些转基因动物构成本发明的另一方面。这可通过局部修饰体细胞,或者通过种系治疗引入遗传修饰来实现。这些转基因动物特别适用于制作动物模型,分析作为本发明多肽的调节剂的药物分子。
从重组细胞培养基中回收和纯化多肽的方法是公知的,包括硫酸铵或乙醇沉淀、酸提取、阳离子或阴离子交换层析法、磷酸纤维素层析法、疏水基相互作用层析法、亲和力层析法、羟磷灰石层析法和血凝素层析法。高效液相层析法特别适用于纯化。当分离和/或纯化期间多肽发生变性时,可应用蛋白质再折叠的公知技术来再产生活性构象。
也可利用特异性载体结构来帮助蛋白质纯化,有需要的时候,将编码本发明的多肽的序列与编码有利于可溶性蛋白质纯化的多肽结构域的核酸序列连接。有利于纯化的结构域的例子包括金属螯合肽,例如允许在固定金属上纯化的肌氨酸-色氨酸组件,允许在固定免疫球蛋白上纯化的蛋白A结构域,以及用在FLAGS延伸/亲和纯化系统(Immunex Corp.,Seattle,WA)中的结构域。为了方便纯化,可以采用可切割接头序列的内含物,例如在纯化结构域与本发明的多肽之间的对XA因子或肠激酶有特异性的序列。一种这样的表达载体为融合蛋白的表达提供准备,所述融合蛋白含有本发明的多肽,与硫氧还蛋白或肠激酶切割位点前面的多个肌氨酸残基融合。肌氨酸残基有利于固定金属离子亲和力层析法(IMAC)的纯化,参见Porath,J.等人的描述(Prot.Exp.Purif.3:263-281,(1992)),而硫氧还蛋白或肠激酶切割位点为从融合蛋白纯化多肽提供了一种手段。Kroll,D.J.等人对含有融合蛋白的载体进行了讨论(1993;DNA Cell Biol.12:441-453)。
如果多肽的表达是用在筛选测定法中,通常最好是在它表达的宿主细胞表面上产生该多肽。在此情况下,宿主细胞可在用于筛选测定法之前,例如用萤光激活细胞分类术(FACS)或免疫测定技术之前收获。如果多肽分泌到培养基中,可回收该培养基以便回收和纯化表达多肽。如果多肽是在细胞内产生,则回收多肽之前必须先溶解细胞。
本发明的多肽可用来筛选各种药物筛选技术使用的化合物库。这些化合物可以激活(激动)或抑制(拮抗)本发明多肽的基因的表达水平或活性,构成本发明的另一方面。优选的化合物是能有效地改变编码本发明第二或第三方面的多肽的天然基因的表达,或者调节本发明第二或第三方面的多肽的活性。
激动剂或拮抗剂化合物可从,例如,细胞制剂、无细胞制剂、化学库或天然混合产物中分离出来。这些激动剂或拮抗剂可以是天然的或者是经修饰的基质、配体、酶、受体或者结构或功能类似物。关于这些筛选技术的综述,可参见Coligan等人,Current Protocols in Immunology 1(2):Chapter 5(1991)。
最有可能成为良好拮抗剂的化合物是与本发明的多肽结合但在结合后又不会诱导该多肽生物作用的分子。潜在的拮抗剂包括有机小分子、肽、多肽和抗体,它们与本发明的多肽结合,由此抑制或消除它的活性。以这种方式,多肽与正常细胞结合分子的结合可被抑制,从而抑制该多肽的正常生物活性。
用在此筛选技术中的本发明的多肽可以在溶液中游离,附着于固相支持物上,留在细胞表面或位于细胞内。一般而言,这些筛选程序可涉及使用适当细胞或细胞膜表达与测试化合物接触的多肽,观察结合、或功能反应的刺激或抑制。再将与测试化合物接触的细胞和不接触测试化合物的对照细胞的功能反应作比较。借助适当检测系统,这种测定方法可以评估测试化合物是否导致多肽激活产生一个信号。一般情况下,在已知激动剂存在下分析激活的抑制剂,在测试化合物存在下观察对激动剂激活的影响。
一种鉴定本发明多肽的激动剂或拮抗剂化合物的优选方法包括:(a)在允许与多肽结合的条件下,将在其表面上表达本发明第二或第三方面的多肽的细胞与待筛选化合物接触,所述的多肽与能够在化合物与该多肽结合之后提供可检测信号的第二成分缔合;和(b)通过测定化合物与多肽相互作用所产生的信号水平来确定该化合物是否结合和激活或抑制该多肽。
另一种鉴定本发明多肽的激动剂或拮抗剂化合物的优选方法包括:(a)在允许与多肽结合的条件下,将在其表面上表达多肽的细胞与待筛选化合物接触,所述的多肽与能够在化合物与该多肽结合之后提供可检测信号的第二成分缔合;和(b)通过对化合物与多肽相互作用所产生的信号水平与在该化合物不存在下的信号水平作比较来确定该化合物是否结合和激活或抑制该多肽。
在另一优选实施例中,上述的通用方法还包括在多肽的标记或无标记配体存在下对激动剂或拮抗剂进行鉴定。
在另一实施例中,鉴定本发明的多肽的激动剂或拮抗剂的方法包括:在允许结合多肽的条件和候选化合物存在下,测定配体例如受体与表面上带有本发明多肽的细胞、或者与含有这样一种多肽的细胞膜结合的抑制,并测定与该多肽结合的配体数量。能够引起配体结合减少的化合物就认为是激动剂或拮抗剂。配体最好是带标记的。
更具体地说,筛选多肽拮抗剂或激动剂化合物的方法包括以下步骤:(a)使标记的配体与在细胞表面上表达本发明多肽的全细胞,或者与含有本发明的多肽的细胞膜培养,(b)测定与全细胞或细胞膜结合的标记配体数量,(c)在步骤(a)的标记配体和全细胞或者细胞膜的混合物中加入候选化合物,使该混合物达到平衡;(d)测定步骤(c)之后与全细胞或细胞膜结合的标记配体数量;以及(e)比较步骤(b)和(d)中结合的标记配体之差值,引起步骤(d)的结合减少的化合物是激动剂或拮抗剂。
本发明的INSP123、INSP124和INSP125多肽可调节细胞生长和分化。因此,INSP123、INSP124和INSP125多肽的生物活性可用允许研究细胞生长和分化的系统(例如器官培养试验)或者用琼脂糖培养基中的集落分析系统来检查。有很多测定法可以测定细胞增殖的刺激或抑制。
例如,要观察细胞生长的抑制,人们可利用一个固相或液相介质。在固相介质中,通过比较形成的集落大小,可从受试者细胞群中选取生长受抑制的细胞。在液相介质中,通过测量培养基混浊度或DNA中标记胸腺嘧啶核苷的结合量,可筛选出生长受抑制的细胞。一般地,采用核苷类似物与新合成DNA的结合量来衡量一群细胞中的增殖情况(即活性细胞生长)。例如,可用溴脱氧尿苷(BrdU)作为DNA标记试剂,抗BrdU小鼠单克隆抗体为检测试剂。这种抗体只与含有带溴脱氧尿苷的DNA的细胞结合。与此测定法结合使用的检测方法有很多种,包括免疫萤光检验法、免疫组织化学法和ELISA、以及色度测定法。包括溴脱氧尿苷(BrdU)和抗BrdU小鼠单克隆抗体试剂盒可通过商业途径获得,例如从Boehringer Mannheim(Indianapolis,IN)购买。
将干细胞或胚胎细胞与各种数量的INSP123、INSP124和INSP125多肽接触,观察干细胞或胚胎细胞分化后的影响,可测定INSP123、INSP124和INSP125多肽对细胞分化的作用。利用对组织有特异性的抗体和显微镜法,可以鉴定所得到的细胞。
在上述测定法中,发现INSP123、INSP124和INSP125多肽以剂量依赖方式调节免疫和/或神经系统细胞增殖和分化。所以,INSP123、INSP124和INSP125多肽的“功能等同物”包括在上述测定法中具有任何相同的以剂量依赖方式调节细胞增殖和分化的活性的多肽。虽然剂量依赖活性的程度不必与INSP123、INSP124和INSP125多肽完全一样,但“功能等同物”在给定的活性测定法中最好基本上具有与INSP123、INSP124和INSP125多肽相类似的剂量依赖关系。
上述一些实施例可应用简单结合测定法,其中测试化合物与带有多肽的表面的附着运用与该测试化合物直接或间接结合的标记检测,或者可应用涉及与标记竞争物竞争的测定法检测。另一个实施例采用竞争药物筛选测定法,其中能够结合多肽的中和抗体与测试化合物特异性地竞争结合。以此方式可用抗体检测对多肽有特异性结合亲和力的任何测试化合物的存在。
也可把测定法设计成检测加入的测试化合物对细胞内编码多肽的mRNA产生的作用。例如,ELISA可构建成通过本领域公知的标准方法以单克隆抗体或多克隆抗体测量多肽的分泌水平或细胞相关水平,这可用来检索抑制或增强在适当操纵的细胞或组织中产生多肽的化合物。然后,测定多肽与测试化合物之间的结合复合物的形成。
可采用另一种药物筛选技术,它高通量筛选对感兴趣的多肽具有适当结合亲和力的化合物(参见国际专利申请WO84/03564)。在这一方法中,在固相基质上合成大量不同的小测试化合物,它们再与本发明的多肽反应,洗涤。一种固定多肽的方法是用非中和抗体。以本领域公知的方法可检测结合多肽。纯化的多肽也可直接铺在板上,用于上述药物筛选技术中。
通过本领域公知的标准受体结合技术,例如配体结合和交联测定法,本发明的多肽可用来鉴定膜结合或可溶性受体,在配体结合和交联测定法中,多肽用放射性同位素标记,以化学方法修饰,或者与有利于它的检测或纯化的肽序列融合,并与推定受体来源(例如,细胞组合物、细胞膜、细胞上清液、组织抽提物或体液)一起培育。结合的效率可用生物物理技术,如表面胞质基因共振和光谱测定。结合测定法用于纯化和克隆受体,但也可鉴定多肽的激动剂和拮抗剂,这些激动剂和拮抗剂与其受体竞争结合多肽。进行筛选测定的标准方法已为本领域所熟悉。
本发明还包括一种筛选试剂盒,它可用在鉴定上述的激动剂、拮抗剂、配体、受体、基质、酶的方法中。
本发明包括激动剂、拮抗剂、配体、受体、基质和酶以及通过上述方法发现的能调节本发明多肽的活性或抗原性的其它化合物。
本发明还提供一些药物组合物,其含有本发明的多肽、核酸、配体或化合物,以及合适的药物载体。这些组合物适合用作治疗或诊断试剂、疫苗、或其它免疫原性组合物,下文将作详细说明。
根据本文所用的术语,当组合物中以X+Y的总重量计时至少85%是X,就认为含有多肽、核酸、配体或化合物[X]的组合物“基本上不含”杂质[本文以Y表示]。优选X占组合物中X+Y总重量的至少约90%,更好至少约95%、98%或者甚至99%(重量)。
药物组合物最好含有治疗有效量的本发明的多肽、核酸分子、配体或化合物。本文所用的术语“治疗有效量”指需要治疗、缓解、或预防目标疾病或病症,或者具有可检测的治疗或预防作用的治疗药剂的用量。任何一种化合物的有效治疗剂量最初可在例如肿瘤细胞的细胞培养测定法、或者动物模型通常是小鼠、兔、狗、或猪模型中估计。动物模型还可用来确定适当的浓度范围和给药途径。有了这些信息,就可以确定给予人的有用给药剂量和途径。
人受试者的准确有效剂量取决于疾病状态的严重程度、受试者的一般健康状况、受试者的年龄、体重和性别、饮食、给药的时间和频率、药物组合、反应灵敏度,以及治疗耐受性/反应。该用量可以常规实验测定,由医生判断。通常,有效剂量从0.01毫克/千克至50毫克/千克,优选从0.05毫克/千克至10毫克/千克。组合物可单独给予患者,或者与其它药剂、药物或激素结合给予。
一种药物组合物还可含有药学上可接受的载体,作为治疗试剂给予。这些载体包括抗体和其它多肽、基因和其它治疗试剂,例如脂质体,只要该载体本身不会诱导产生对接受该组合物的个体有害的抗体,而且载体的给予不会产生过高毒性。合适的载体可以是大的代谢缓慢的大分子,例如蛋白质、聚糖、聚乳酸、聚羟基乙酸、聚合氨基酸、氨基酸共聚物和失活病毒颗粒。
还可使用药学上可接受的盐,例如无机酸盐,如盐酸盐、氢溴酸盐、磷酸盐硫酸盐等等;以及有机酸盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等等。Remington′s Pharmaceutical Sciences(Mack Pub.Co.,N.J.1991)对药学上可接受的载体作了详尽讨论。
治疗组合物中药学上可接受的载体也可含有水、盐水、甘油和乙醇等液体。另外,这些组合物还可含有辅助物质,例如,湿润剂或乳化剂、pH缓冲物质等等。这些载体能将药物组合物配制成供患者摄取的片剂、丸剂、糖衣片、胶囊、液体、凝胶、糖浆、膏剂、悬浮液等等。
一旦配成以后,本发明的组合物可直接给予受试者。接受治疗的受试者可以是动物;特别是人受试者。
本发明使用的药物组合物可以任何途径给予,包括但不限于,口服、静脉内、肌内、动脉内、脊髓内、鞘内、心室内、透皮或经皮(例如参见WO98/20734)、皮下、腹腔内、鼻内、肠内、局部、舌下、阴道内或直肠途径。本发明的药物组合物也可用基因枪或无针注射器给予。一般将治疗组合物制成可注射的液体溶液或悬浮液;也可以制成适合注射前溶解或悬浮于液体介质中的固体形式。
通过注射可将组合物直接输送到皮下、腹腔内、静脉内或肌内,或者送到组织间质空间。组合物也可施加在病变部位。剂量治疗可分单剂或多剂。
如果本发明的多肽的活性在一特定疾病状态中是过度的,有多种方法可采用。其中一种方法包括把上述抑制剂化合物(拮抗剂)与药学上可接受的载体一起给予受试者,抑制剂化合物的量为通过例如阻断配体、基质、酶、受体的结合,或者抑制第二信号而抑制多肽的功能,从而缓解异常状况的有效量。这些拮抗剂优选是抗体。这些拮抗剂最好是嵌合抗体和/或人源化抗体,如前所述,可使它们的免疫原性减至最低。
另一种方法是给予保留了对上述配体、基质、酶、受体有结合亲和力的多肽的可溶形式。通常,多肽以保留相关部分的片段的形式给予。
在一替换方法中,应用表达封闭技术,例如用内部产生或另外给予的反义核酸分子(如上所述),抑制编码多肽的基因表达。设计多肽的编码基因的调控区、5’区或调节区(信号序列、启动子、增强子和内含子)的互补序列或反义核酸分子(DNA、RNA或PNA),可获得对基因表达的修饰。类似地,用“三螺旋体”碱基成对方法可实现抑制。三螺旋体成对是有用的,这是因为它能抑制双螺旋体充分打开以结合聚合酶、转录因子或调节分子的能力。应用三螺旋DNA的治疗取得最新进展,在文献中已有描述(Gee,J.E.等人,(1994)In:Huber,B.E.and B.I.Carr,Molecular and ImmunologicApproaches,Futura Publishing Co.,Mt.Kisco,NY)。互补序列或反义分子还可设计成防止转录子与核糖体结合,从而封闭mRNA的翻译。这些寡核苷酸可给予,或在体内表达中原位产生。
另外,使用对它的编码mRNA序列有特异性的核糖体,可防止表达本发明的多肽。核糖体是具有催化活性的天然或合成RNA(例如,参见Usman,N等人,Curr.Opin.Struct.Biol(1996)6(4),527-33)。可设计合成核糖体,在选定位置上特异性切割mRNA,从而防止mRNA翻译为功能多肽。核糖体通常在RNA分子中找到,可用天然的磷酸核糖骨架和天然碱基合成。另一个选择是,核糖体可用非天然骨架,例如2’-氧-甲基RNA合成,保护核糖核酸酶免于降解,还可含有经修饰的碱基。
可对RNA分子进行修饰,以增加胞内稳定性和延长半衰期。可能的修饰包括但不限于,在分子的5’和/或3’末端加入侧翼序列或在分子的骨架内使用硫代磷酸或2’-氧-甲基而不用磷酸二酯酶连锁。这一概念对于产生PNA是固有的,可延伸至所有这些分子中,方法是包含非常规碱基,例如肌苷、核苷(queosine)和高修饰苷(butosine)以及乙酰基-、甲基-、硫代-、及类似修饰形式的腺嘌呤、胞苷、鸟嘌呤、胸腺嘧啶和尿苷,它们不易被内源性内切核酸酶识别。
有一些方法治疗与本发明的多肽表达不足够或与其活性相关的异常症状。其中一种方法包括把治疗有效量的能激活该多肽的化合物,即上述激动剂给予患者,缓解异常征状。另外,也可以给予治疗量的多肽与适当药物载体,以恢复多肽的相关生理平衡。
基因疗法可用来在受试者体内通过相关细胞内源性产生多肽。基因疗法以修正治疗基因置换缺陷基因,永久治疗多肽的不适当产生。
本发明的基因疗法可发生于体内或体外。体外基因疗法需要分离和纯化患者的细胞,导入治疗基因,以及将经基因改造的细胞再引入患者体内。与之相反,体内基因疗法不需要分离和纯化患者的细胞。
治疗基因往往被“包装”以方便给予患者。基因输送赋形剂可以是非病毒,例如脂质体,或者复制缺陷型病毒,例如Berkner,K.L(Curr.Top.Microbiol.Immunol.,158,39-66(1992))所述的腺病毒,或者Muzyczka,N.(Curr.Top.Microbiol.Immunol.,158,97-129(1992)和美国专利US5,252,479所述的腺伴随病毒(AVV)载体。例如,可对编码本发明的多肽的核酸分子进行改造,以在复制缺陷型逆转录病毒载体中表达。然后,分离这种表达构建体,导入用含有编码多肽的RNA的逆转录病毒质粒载体转导的包装细胞内,使该包装细胞现在能产生含有感兴趣的基因的感染病毒粒子。将这些生产细胞给予患者,体内改造细胞和体内表达多肽(参见“GeneTherapy and other Molecular Genetic-based Therapeutic Approaches”(纳入作为文献参考),Human Molecular Genetics(1996),T Strachan和A P Read,BIOS Scientific Publishers Ltd)。
另一种方法是给予“裸露DNA”,其中治疗基因直接注入血流或肌肉组织。
对于本发明的多肽或核酸分子是引起疾病的试剂的情形,本发明提出它们可用在疫苗中,产生针对疾病引发剂的抗体。
本发明的疫苗可以是预防性(即预防感染)或者是治疗性的(即治疗感染后疾病)。这些疫苗包括免疫抗原、免疫原、多肽、蛋白质或核酸,通常与前述药学上可接受的载体结合,包括本身不会诱导产生对接受该组合物的个体有害的任何载体。这些载体还可用作免疫刺激剂(“辅助剂”)。此外,抗原或免疫原可与细菌类毒素例如来自白喉、破伤、霍乱、幽螺杆菌和其它致病原的类毒素偶联。
因为多肽可以在胃内分解,所以含有多肽的疫苗最好肠胃外给予(例如皮下、肌内、静脉内、或皮内注射)。适合肠胃外给予的制剂包括无菌水溶液或非水溶液,其可含有抗氧化剂、缓冲液、抑菌剂和使制剂与接受者的血液等渗的溶解物,以及无菌水悬浮液或非水悬浮液,其可包括悬浮剂或增稠剂
本发明的疫苗制剂可制成单剂或多剂容器。例如,密封安瓿和小瓶可储存于冻干条件下,只要在使用之前加入无菌液体载体。剂量取决于疫苗的比活性,通过常规实验可轻易测定。
本发明还涉及本发明的核酸分子作为诊断试剂的用途。检测以本发明核酸分子(该核酸分子与功能障碍相关)为特点的基因突变形式提供了一种诊断工具,它可加入或限定因为基因的表达不足、过度表达或者空间或时间表达发生改变而引起的疾病或疾病易感性的诊断。通过各种技术可在DNA水平上检测携带基因突变的个体。
用于诊断的核酸分子可从受试者的细胞中获得,例如从血液、尿、唾液、组织活体或尸体材料中获得。基因组DNA可直接用作检测,或者在分析前用PCR、连接酶链式反应(LCR)、链置换扩增(SDA)或者其它扩增技术酶解扩增(参见Saiki等人,Nature,324,163-166(1986);Bej等人,Crit.Rev.Biochem.Molec.Biol.,26,301-334(1991);Birkenmeyer等人,J.Virol.Meth.,35,117-126(1991);Van Brunt,J.,Bio/Technology,8,291-294(1990))。
在一实施例中,本发明该方面提供一种诊断患者疾病的方法,该方法包括评估编码本发明的多肽的天然基因的表达水平,并将所述表达水平与对照水平作比较,若该水平与所述对照水平不同,则表示患病。这种方法包括以下步骤:(a)在允许本发明的核酸分子和核酸探针形成杂交复合物的严谨条件下,将患者的组织样品与探针接触;(b)在与步骤(a)相同的条件下,将对照样品与所述探针接触;(c)以及检测所述样品中是否存在杂交复合物。
其中,检测到患者样品中杂交复合物的水平与对照样品中杂交复合物不同,表示患病。
本发明另一方面包括一种诊断方法,其包括以下步骤:(a)从待测试疾病的患者中获得组织样品;(b)从所述组织样品中分离本发明的核酸分子;(c)通过检测与疾病相关的核酸分子是否存在突变,诊断患者疾病。
为了帮助上述方法检测核酸分子,可包括扩增步骤,例如利用PCR技术。
将扩增产物大小的变化与正常基因型比较,可检测到缺失或插入。将扩增DNA与本发明的标记RNA,或者与本发明的标记反义DNA序列杂交,可以鉴定点突变。以核糖核酸酶消化或评估熔点温度的差异,区分完全匹配的序列与错配的双链体。患者是否存在突变可这样检测:将DNA与在严谨条件下和该DNA杂交的核酸探针接触,形成杂交双链分子,该杂交双链分子在对应于与疾病相关的突变的任何部分具有核酸探针链的未杂交部分;检测探针链的未杂交部分是否存在即表示该DNA链的对应部分存在或不存在与疾病相关的突变。
这样的诊断特别适用于产前,甚至新生儿测试。
参考基因与“突变体”基因之间的点突变和其它序列差异可通过公知技术鉴定,例如,直接DNA测序或单链构象多态性(参见Orita等人,Genomics,5,874-879(1989))。例如,测序引物可与改良PCR产生的双链PCR产物或单链模板分子一起使用。以使用放射性标记核苷酸的常规程序或者通过使用萤光标记的自动测序程序,进行序列测定。克隆DNA节段也可用作检测特异性DNA片段的探针。当与PCR结合时该方法的灵敏度大大提高。另外,点突变和其它序列变异,例如多态性,可参照上述方法检测,例如使用等位基因特异性寡核苷酸对不同于单个核苷酸的序列进行PCR扩增。
在变性试剂存在或不存在下改变DNA片段的凝胶电泳迁移率,或直接对DNA测序都可以检测到DNA序列的差异(例如Myers等人,Science(1985)230:1242))。特定位置的序列变化可通过核酸酶保护测定法揭示,例如RNase和S 1保护,或者化学切割方法发现(Cotton等人,Proc.Natl.Acad.Sci.USA(1985)85:4397-4401)。
除了常规凝胶电泳和DNA序列测定之外,微小缺失、非整倍性、易位、倒位等突变也可用原位分析加以检测(例如,参见Keller等人,DNAProbes,2nd Ed.,Stockton Press,New York,N.Y.,USA(1993)),换言之,可分析细胞内DNA或RNA序列的突变,无需分离或固定在膜上。萤光原位杂交(FISH)是目前最常用的方法,就FISH的综述已有很多报导(例如,参见Trachuck等人,Science,250,559-562(1990),and Trask等人,Trends,Genet.,7,149-154(1991))。
本发明另一实施例中,构建了包括本发明核酸分子的寡核苷酸探针阵列,对遗传变体、突变和多态性进行有效筛选。阵列技术方法是公知的,获得广泛应用,可用来解释分子遗传方面的各种问题,包括基因表达、遗传连锁和遗传变异性(例如,参见M.Chee等人,Science(1996),Vol 274,pp610-613)。
在一实施例中,按照PCT申请WO95/11995(Chee等人);Lockhart,D.J.等人((1996)Nat.Biotech.14:1675-1680));以及Schena,M.等人((1996)Proc.Natl.Acad.Sci.93:10614-10619))描述的方法制作和使用阵列。寡核苷酸对的范围从2至1,000,000以上。应用光引导化学法在基质的指定区域上合成低聚物。基质可以是纸、尼龙或其它种类的膜、过滤器、芯片、玻璃载片或其它任何合适的固相支持物。另外,参照PCT申请WO95/25116(Baldeschweiler等人)中描述的方法,使用化学偶联程序和喷墨应用装置可在基质表面上合成寡核苷酸。另一方面,利用真空系统、热学、紫外线、机械或化学结合程序,以类似斑点(或狭线)印迹的“栅格”阵列将cDNA片段或寡核苷酸设置和连接于基质表面上。阵列,例如上述的那些阵列,可用人手或现有设备(斑点印迹或狭线印迹装置)、材料(任何合适的固相支持物)和机器(包括自动仪器)制作,它们可含有8、24、96、384、1536或6144个寡核苷酸,或者2至1,000,000以上之间的任何数目,该数目能够使阵列有效地应用于市场上买到的仪器中。
除了上述讨论的方法之外,通过包括测定受试者样品中多肽或mRNA水平异常增加或减少的方法可以诊断疾病。采用本领域公知的任何方法可以在RNA水平上测定表达减少或增加,以便对聚核苷酸作定量分析,例如核酸扩增,如PCR、RT-PCR、RNase保护、Northern印迹和其它杂交方法。
可用来确定从宿主获得的样品中本发明的多肽水平的测定技术已为本领域技术人员所知,在上文提到的一些文献中已有讨论(包括放射性免疫测定法、竞争结合测定法、Western印迹分析和ELISA试验)。本发明该方面提供一种诊断方法,其包括以下步骤:(a)在适合形成配体-多肽复合物的条件下,将上述一种配体与生物样品接触;以及(b)检测所述复合物。
测定多肽水平的方案,例如ELISA、RIA和FACS还可为诊断多肽表达的变化或异常水平提供基础。在适合形成复合物的条件下将正常哺乳动物受试者,优选是人的体液或细胞抽提物与针对多肽的抗体结合,确立多肽表达的正常或标准值。标准复合物形成的数量可用各种方法定量测定,例如光度计装置。
特异性结合本发明多肽的抗体可用来诊断以多肽表达为特点的症状或疾病,或者用在测定法中监测以本发明的多肽、核酸分子、配体和其它化合物治疗的患者。用于诊断目的的抗体可以用上述关于治疗所述的相同方法制成。对多肽的诊断分析包括利用抗体和标记检测人体液或者细胞或组织抽提物的多肽的方法。使用的多肽可以修饰或不作修饰,将它们与报导分子共价或非共价结合加上标记。可以应用本领域已知的各种各样报导分子,其中一些已在上文作了描述。
将在受试者活体组织获得的对照样品和患病样品中表达的多肽数量与标准值作比较。标准值与受试者值之间的偏差建立诊断疾病的参数。可通过诊断分析法区分多肽不存在、存在和过度表达,并监测治疗干预期间多肽水平的调节。这些分析也可用来评估动物研究、临床试验或个体患者的监测治疗中特定治疗方案的疗效。
本发明的一种诊断试剂盒可包括:(a)本发明的核酸分子;(b)本发明的多肽;或者(c)本发明的配体。
本发明一方面提供一种诊断试剂盒,该试剂盒可包括第一容器,其含有在严谨条件下与本发明的核酸分子杂交的核酸探针;第二容器,其含有用来扩增该核酸分子的引物;以及该探针和引物的使用说明书,方便诊断疾病。这种试剂盒还可包括装有消化未杂交RNA的试剂的第三容器。
本发明另一方面也提供一种诊断试剂盒,该试剂盒可包括核酸分子阵列,其中至少一个核酸分子是本发明的核酸分子。
为了检测本发明的多肽,一种诊断试剂盒可包括一或多种与本发明的多肽结合的抗体;一种用来检测该抗体与多肽之间结合反应的试剂。
这些试剂盒都可用于诊断涉及含有vWFC结构域的蛋白质家族成员的疾病或这些疾病易感性。这些疾病可包括但不限于:细胞增殖性疾病,包括肿瘤、黑素瘤、肺癌、结肠直肠癌、乳癌、胰腺癌、头颈癌及其它实体肿瘤;骨髓增生性疾病,例如白血病、非何杰金氏淋巴瘤、白血球减少症、血小板减少症、血管生成障碍、卡波西氏肉瘤;自身免疫/炎症疾病,包括过敏症、炎症性肠疾病、关节炎、银屑病、呼吸道发炎、哮喘和器官移植排斥;心血管疾病,包括高血压、水肿、心绞痛、动脉硬化症、血栓症、败血症、休克、再灌注损伤和缺血;神经系统疾病,包括中枢神经系统疾病、阿耳茨海默氏病、脑损伤、肌萎缩性侧索硬化症和疼痛;发育障碍,例如与软骨和骨架发育相关的疾病,包括骨关节炎;代谢性疾病,包括糖尿病、骨质疏松和肥胖、AIDS和肾病;感染,包括病毒性感染、细菌性感染、真菌性感染和寄生虫感染和其它病理病症。较佳地,所述疾病是涉及淋巴细胞抗原的疾病。这些试剂盒还可用来检测包括不孕症在内的生殖障碍。
以下,将通过举例说明,特别是结合INSP123、INSP124和INSP125多肽对本发明的各个方面和实施例进行描述。
应明白,在不脱离本发明的范围的情况下可以作出改型。
附图说明
图1:SECFAM3家族的序列对比。血管性血友病因子C型(vWFC)结构域1跨越所述序列对比的155-214aa区,vWFC结构域2跨越所述序列对比的221-281aa区。INSP123、124和125在“Id”栏加上灰色阴影。顺序号14和15为带标记的脊索动物,在对比序列中代表海鞘种属的翻译EST序列。
图2:基于全部三个同种型都有同一个信号肽预测序列(图2),预计INSP123、124和125都是分泌性蛋白质。
图3:此基因编码外显子的预测剪接模式(不按比例)。INSP123和INSP125都是基于小鼠和短尾猿cDNA序列;而INSP124是预测的可能剪接模式,含有两个血管性血友病因子C型结构域。这种剪接对序列水平的影响可参见图1。
图4:INSP124的预测结构域1和2(突出显示)与各种蛋白质的特征血管性血友病因子C型结构域的序列对比。黑色阴影部分表示序列保守性较大。
图5:基于INSP124的家族位置特异性概率矩阵图。
图6:基于INSP124的氨基酸53至171(SEQ ID NO:12)的以PROSITE格式表示的家族共有序列。键:-=每个对比位置之间的一个空格;G=100%保守性G残基;[VI]=在那个对比位置上的V或I;P(0,1)=在该对比位置上发现一次的P残基或者完全找不到P残基。
图7:INSP123预测核苷酸序列和翻译。
图8:用引物对INSP123-CP1和INSP123-CP2克隆的INSP123PCR产物的核苷酸序列和翻译。
图9:pCR4-TOPO-INSP123的图谱。
图10:pDONR 221的图谱。
图11:表达载体pEAK12d的图谱。
图12:表达载体pDEST12.2的图谱。
图13:pENTR-INSP123-6HIS的图谱。
图14:pEAK12d-INSP123-6HIS的图谱。
图15:pDEST12.2-INSP123-6HIS的图谱。
图16:INSP124预测核苷酸序列和编码序列的翻译。
图17:基因组DNA中INSP124编码外显子机构和PCR引物的位置。
图18:克隆的INSP124产物核苷酸序列和ORF的翻译。
图19:pCR-BluntII-TOPO-INSP124的图谱。
图20:pDONR 221的图谱。
图21:表达载体pEAK12d的图谱。
图22:表达载体pDEST12.2的图谱。
图23:pENTR_INSP124-6HIS的图谱。
图24:pEAK12d_INSP124-6HIS的图谱。
图25:pDEST12.2_INSP124-6HIS的图谱。
图26:INSP125预测核苷酸序列和编码序列的翻译。
图27:基因组DNA中INSP125编码外显子机构和PCR引物的位置。
图28:克隆的INSP125产物核苷酸序列和ORF的翻译。
图29:pCR4-TOPO-INSP125的图谱。
图30:pDONR 221的图谱。
图31:表达载体pEAK12d的图谱。
图32:表达载体pDEST12.2的图谱。
图33:pENTR_INSP125-6HIS的图谱。
图34:pEAK12d_INSP125-6HIS的图谱。
图35:pDEST12.2_INSP125-6HIS的图谱。
图36:INSP125-6HIS的N末端排序结果。

具体实施方式

实施例1-SECFAM3家族成员的选择和对比现时并无关于INSP123、INSP123和INSP125的注释,它们含有一个强的分泌性蛋白质特征,为信号肽形式,可与类似蛋白质聚集在一起,例如其它物种的动物直向同源物。
进一步检查可构建一族迄今为止未被定性分析过的蛋白质,该族蛋白质由22个序列组成:2个人基因(及其同种型)与它们的脊椎动物和脊索动物直向同源物。
表1为22个家族成员清单
表1包括SECFAM3家族的所有序列,以及肽长度,可能的话,还有组织分布信息。
这些序列用ClustalW工具进行对比(Thompson,J.D.,Higgins,D.G.,Gibson T.J.Nucleic Acids Res 1994 Nov 11;22(22):4673-80)图1)。由此序列对比可以清楚看到序列之间的相似性和差异性。每个蛋白质都具有以信号肽形式出现的强分泌性蛋白质特征(protein signature)以及至少一个vWFC结构域。
人序列中,INSP123(SEQ ID NO:2)、INSP124(SEQ ID NO:6)和INSP125(SEQ ID NO:26)都是新的预测序列,在公共或专利数据库(例如NCBI、DDBJ和Derwent)中未有描述。至今仍未鉴定到编码这三种蛋白质中任一种的人cDNA。不过,与短尾猿和小鼠cDNA高度同源提供了强有力的支持证据,即所公开的三种INSP序列是短尾猿和小鼠序列的人等同物。
实施例2-INSP123、INSP124和INSP125多肽存在的支持证据短尾猿(食蟹猴)cDNAAB063096.1(cDNA序列),BAB60802.1(蛋白质序列)。全插入序列cDNA克隆(成年雄性脑(右颞叶))。
长度=138aa。
INSP123(SEQ ID NO:2):99%ID,Query 1-138aa,Target 1-138aa,e=7e-84。
长度相同,有1个氨基酸不同。
INSP124:100%ID,Query 1-130aa,Target 1-130aa,e=3e-79。
INSP125:63%ID。分为两个100%ID的区(Query 1-33aa,Target 1-33aa,和Query 34-83aa,Target 81-130aa)。
小鼠(小家鼠)AK083856.1(小家鼠12天胚胎脊神经节cDNA,RIKEN全长富集文库,克隆:D130026K08产物:假设血管性血友病因子,含有C型重复的蛋白质,全插入序列)[注意:附加的G核苷酸(G 873)引起该序列的读框移动,而该移动并未得到那一区基因组DNA支持。修正时,与上述的短尾猿翻译cDNA序列相似性以及信号肽的恢复也对该修正的有效性作补充支持]。
以下给出修正序列翻译的统计数据:长度=131aa。
INSP123:99%ID,Query 1-131aa,Target 1-131aa,e=4e-79。
长度相同,有1个氨基酸不同。
INSP124:99%ID,Query 1-130aa,Target 1-130aa,e=1e-78。
INSP125:63%ID。分为两个100%ID的区(Query 1-33aa,Target 1-33,和Query 34-83aa,Target 81-130aa)。
AK080585.1(小家鼠10天幼鼠皮层cDNA,RIKEN全长富集文库,产物:假设血管性血友病因子,含有C型重复的蛋白质,全插入序列)。
以下给出翻译产物的统计数据:长度=175aa。
INSP123:63%ID。分为两个100%ID的区(Query 1-33,Target 1-33,和Query 81-130aa,Target 34-83aa),其间有一剪接区。
INSP124:77%ID。分为两个100%和98%ID的区(Query 1-33aa,Target1-33aa,和Query 81-222aa,Target 34-175aa)。
INSP125:98%ID,Query 1-175aa,Target 1-175aa,e=e-122.(长度相同,有2个氨基酸被保守性取代)。
实施例3-鉴定信号肽序列使用SignalP程序(http://www.cbs.dtu.dk/services/SignalP/)来鉴定INSP123-125多肽的潜在信号肽区和分割位点。因为这三种多肽都具有相同的起始序列,所以这三种同种型的SignalP结果是一样的,即是,INSP123(SEQ ID NO:2)、INSP124(SEQ ID NO:12)和INSP125(SEQ ID NO:26)的SignalP结果都表示切割位点最可能在位置23和24之间(图2)。
实施例4-SECFAM3家族内含有vWFC结构域的证据将SECFAM3家族的每个序列与蛋白质结构域轮廓进行比较。这种方法显示在SECFAM3序列对比的位置221至281上有一个vWFC结构域(图1)。在位置155至214aa之间的序列对比范围内击中同一个结构域类型的几率较少,表明此家族的较长蛋白质内有两个vWFC结构域,在较短蛋白质(例如INSP123)内有一个vWFC结构域。提取INSP124的这两个vWFC结构域并使之与一个具有来自多种蛋白质的50个特征vWFC结构域的轮廓进行序列对比(图4)。这些区域保留了10个半胱氨酸模式以及一些非半胱氨酸残基,排除一切合理疑点地证实了序列水平上的两个结构域确实是vWFC样结构域。假设半胱氨酸模式得到了保留,这些结构域的结构有可能呈现与已知vWFC结构域相似的形状。根据这两个vWFC结构域在序列对比中出现的次序,下文称为“结构域1”和“结构域2”。
实施例5-INSP123.INSP124和INSP125的剪接模式INSP123仅含有结构域1(SEQ ID NO:2的53-109aa),而INSP124含有两个结构域(SEQ ID NO:12的53-109aa和116-171aa)。同种型INSP125(SEQ ID NO:26)的特征在于,在序列对比的位置136与182之间有一个剪接区(图1和图3)。这有效地缺失了结构域1的前四个半胱氨酸,最可能导致作为vWFC结构域的结构域1是没有功能的。然而,结构域2不受此剪接的破坏,因此可以代表在此蛋白质看到的单个vWFC结构域(SEQ ID NO:26的69-124aa)。
预测本发明多肽的剪接变体具有不同生物功能,例如具有结合配偶体的不同亲和力。
实施例6-SECFAM3家族轮廓图5所示为SECFAM3家族对位置有特异性的打分矩阵或者轮廓。这表示该家族的独有特征。要产生此轮廓首先建立一个多序列对比。选择一个模板序列,此处为INSP124,围绕该序列构建一个轮廓。对每列被模板序列残基占据的家族多序列对比进行评估,估算可能的20种氨基酸类型中每一种的频率。基于BLOSUM62位置依赖性背景矩阵(Henikoff&Henikoff,1992.Proc.Natl.Acad.Sci.USA,89:10915-9),根据频率分数和看到一种残基取代优势残基的可能性来计算家族对比中每个位置该种氨基酸残基的分数。这一矩阵基于大的家族对比数据集(BLOcks SUbstitution Matrix),其中氨基酸取代频率的评估是基于以62%或以上同一性聚集的对比。在此情况下,把这些因数合并,得到SECFAM3对比中每个位置上每种氨基酸的对数分数。最大正数代表最有可能在那一位置找到的那些氨基酸。可用这种轮廓来确定一查询序列的对比分数。将每一位置上那个氨基酸的相应分数开方,该查询序列每个氨基酸的全部这些分数的总和构成那个序列的对比分数。如果它在某一阈值以上,该查询序列可能与该家族有密切关系。这个轮廓形成该家族的敏感统计标准。INSP124的BLASTP结果得到的最小E值为e-143。
实施例7-产生SECFAM3家族以PROSITE格式表示的的共有序列图6所示为代表SECFAM3家族蛋白质的第一个结构域的共有序列。预测该结构域为vWFC结构域。第二个结构域也是vWFC结构域。
实施例8-INSP123的克隆人cDNA模板的制备按照制造商的方案,以Superscript II RNase H-反向转录酶(Invitrogen)从各种正常人组织总RNA样品(购自Clontech,Stratagene,Ambion,BiochainInstitute以及在本研究小组内制备)制备了第一链cDNA。在1.5ml微量离心管(Eppendorftube)内混合Oligo(dT)15引物(1μl,500μg/ml)(Promega)、2μg人总RNA、1μl 10mM dNTP混合物(dATP,dGTP,dCTP和dTTP各10mM,pH值为中性),加入无菌蒸馏水配至终体积12μl,65℃加热5分钟,再置于上冷冻。稍微离心收集管内的内容物,加入4μl 5X第一链缓冲液(First-Strand Buffer)、2μl 0.1M DTT和1μl RnaseOUT重组核糖核酸酶抑制剂(40单位/μl,Invitrogen)。轻轻混合离心管内容物,42℃培育2分钟;再加入1μl(200单位)SuperScript II酶,用吸管操作轻轻混合。使混合物在42℃培育50分钟,再在70℃加热15分钟失活。为了除去与cDNA互补的RNA,加入1μl(2单位)大肠杆菌RNase H(Invitrogen),反应混合物在37℃培育20分钟。加入179μl灭菌水稀释终体积为21μl的反应混合物,得到总体积200μl。从脑产生用作扩增INSP123的模板的人cDNA样品。cDNA文库人cDNA文库(在噬菌体λ载体中)购自Clontech,Invitrogen,或者由本研究小组在λGT10载体中制成。噬菌体λDNA按照制造商(Promega,Corporation,Madison WI.)的说明用Wizard Lambda Preps DNA纯化系统在小规模的感染大肠杆菌宿主菌培养基中制备。用作扩增INSP123的模板的人cDNA文库样品来自胎儿脑、成人脑以及脑-肺-睾丸混合库。
用于PCR的基因特异性克隆引物设计长度为18至25个碱基的PCR引物对,以便运用引物设计软件(Scientific&Educational Software,PO Box 72045,Durham,NC 27722-2045,USA)扩增虚拟cDNA的全编码序列。将PCR引物优化至温度接近55+10℃,GC含量为40-60%。选择对靶序列(INSP 123)有高度选择性的引物(几乎没有不是非特异性引发)。
用各种人cDNA模板和噬菌体文库cDNA对INSP123进行PCR扩增设计基因特异性克隆引物(INSP123-CP1和INSP123-CP2,图7、图8和表1),扩增一个482bp cDNA片段,该片段涵盖INSP123预测序列的完整414bp编码序列。以INSP123预测序列对公用EST序列数据库进行查询,结果提示该序列可能在脑cDNA模板中表达。所以,应用基因特异性克隆引物INSP123-CP1和INSP123-CP2,以人脑cDNA样品和1.2节列出的噬菌体文库cDNA样品为PCR模板。用MJ Research DNA Engine在50μl终体积中进行PCR扩增,该终体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、克隆引物各50pmole、2.5单位AmpliTaqTM(Perkin Elmer)和cDNA模板100ng,程序如下:94℃,2分钟;94℃循环40次,1分钟,53℃,1分钟,以及72℃,1分钟;然后,72℃循环1次,7分钟,4℃持续循环。
在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上分析每次扩增的反应混合物(50μl),看到单个PCR产物以接近预定分子量在相应于脑-肺-睾丸cDNA文库模板的样品内迁移。这个PCR产物用Wizard PCR Preps DNA纯化系统(Promega)纯化。该PCR产物在50μl水中洗脱出来,直接被亚克隆。
表1INSP123克隆和测序引物
下划线序列=Kozak序列粗体=终止密码子斜线序列=His标签PCR产物的亚克隆用购白Invitrogen Corporation的TA克隆试剂盒,在制造商指定的条件下将PCR产物亚克隆到拓朴异构酶I修饰的克隆载体(pCR4-TOPO)中。简言之,取4μl从脑-肺-睾丸cDNA文库扩增得到的凝胶纯化PCR产物,室温下与1μl TOPO载体和1μl盐溶液培养15分钟。再按以下方法将反应混合物转化到大肠杆菌菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分试样在冰上解冻,加入2μl TOPO反应物。该混合物冰上培育15分钟,再在42℃培育热激刚好30秒。将样品送回冰上,加入250μl温热SOC培养基(室温)。样品在37℃摇动培育(220rpm)1小时。然后,将转化混合物铺在含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。集落PCR用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNAEngine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、T3引物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2分钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟。作进一步分析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR反应产物。使产生预期PCR产物大小(由于多个克隆位点(MCS)而得到482bp cDNA+105bp)的集落生长过夜,生长条件:温度为37℃,5毫升含有氨比西林(50μg/ml)的L-broth(LB)板,220rpm摇动。
质粒DNA的制备和测序按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备小量制备(Miniprep)质粒DNA。将质粒DNA在100μl无菌水中洗脱。用Eppendorf BO光度计或Spectramax 190光度计(Molecular Devices)测定DNA浓度。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no.4390246)以T7和T3为引物对质粒DNA(100-200ng)进行DNA测序。引物序列见表1。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分析。
序列分析鉴定了一个克隆,该克隆与预测的INSP123序列完全匹配。图8为克隆cDNA片段序列。图9为克隆PCR产物(pCR4-TOPO-INSP123)(质粒ID14352)的质粒图谱。
实施例9-INSP123的哺乳动物细胞表达载体的构建运用GatewayTM克隆方法(Invitrogen),以质粒14352作为PCR模板,产生含有INSP123ORF序列的pEAK12d(图11)和pDEST12.2(图12)表达克隆,带有编码6HIS标签的3’序列。
与符合读框的6HIS标签序列融合的Gateway兼容性INSP123ORF的产生Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生这样的编码框(ORF):在INSP123的5’端添加attB1重组位点和Kozak序列,在3’端添加6个编码HIS标签的序列(6HIS)、终止密码子以及attB2重组位点(Gateway兼容性cDNA)并保证INSP123与6个编码HIS基因和终止密码子在同一个阅读框内。第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质粒14352、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μlMgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP123-EX1和INSP123-EX2)、以及0.5μl Platinum Pfx DNA聚合酶(Invitrogen)。在95℃首次变性步骤进行PCR反应2分钟,然后94℃循环12次15秒;55℃30秒;68℃2分钟;以及4℃持续循环。在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到扩增产物,按照制造商的说明,以预定分子量(447bp)迁移的一个产物用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化,回收在50μl水中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5μldNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl of Platinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用Wizard PCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
Gateway兼容的INSP123 ORF亚克隆到Gateway入门载体pDONR221和表达载体pEAK12d和pDEST12.2Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物亚克隆到Gateway入门载体pDONR221(Invitrogen,图10):将5μl纯化的PCR2产物与1.5μl pDONR221载体(0.1μg/μl)、2μl BP缓冲液和1.5μl BP克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入1μl蛋白酶K(2μg/μl)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有卡那霉素(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5rml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒DNA(150-200ng)进行DNA测序。引物序列见表1。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆((pENTR INSP123-6HIS,质粒ID 14595,图13)的质粒洗脱液(2μl或约150ng),该重组反应的10μl反应终体积含有1.5μl pEAK12d载体或pDEST12.2载体(图11&12)(0.1μg/μl)、2μl LR缓冲液和1.5μl LR克隆酶(Invitrogen)。混合物室温培育1小时,加入蛋白酶K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
在每个载体亚克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表1。
从序列已被确认的各个克隆(pEAK12d INSP123-6HIS,质粒ID number14602,图8,以及pDEST12.2INSP123-6HIS,质粒ID 14606,图9)中任一个取500ml培养基,制备用氯化铯梯度纯化的大量制备(maxi-prep)DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,aLaboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将质粒DNA重悬于1μg/μl无菌水(或10mM Tris-HCl pH 8.5)中,-20℃储存。
实施例10通过外显子装配来克隆INSP124预测INSP124是一个全长SECFAM3家族新颖分泌性蛋白质,由三个编码外显子编码的222个氨基酸(666bp)组成(图16&17)。
为了产生INSP124蛋白质:-通过PCR反应从质粒ID 14352(含有INSP123,INSP124的剪接变体)扩增外显子1。
-通过PCR反应从基因组DNA扩增外显子2和3(图17)。
-使凝胶纯化的外显子混合,进行一个新的PCR反应扩增重新装配的DNA。
-利用Invitrogen GatewayTM方法,将对应于INSP124编码序列的全长PCR产物(图18)亚克隆到pCR-BluntII-TOPO克隆载体(Invitrogen),然后再依次亚克隆到pDONR 201(Gateway入门载体)以及表达载体pEAK12d和pDEST12.2。
从质粒或基因组DNA对编码INSP124的外显子进行PCR扩增设计PCR引物扩增外显子1、2和3(表2)。外显子1的反向引物(INSP124-e1R)的5’端与INSP124的外显子2有18bp重叠。外显子2的正向引物(INSP124-e2F)的5’端与INSP124的外显子1有19bp重叠。外显子2的反向引物(INSP124-e2R)的5’端与INSP124的外显子3有19bp重叠。外显子3的正向引物(INSP124-e3F)的5’端与INSP124的外显子2有18bp重叠。
要产生INSP124的外显子1,用MJ Research DNA Engine在50μl终体积中进行PCR扩增,该终体积含有100ng质粒ID 14352DNA、1XAmpliTaqTM缓冲液、200μM dNTPs、INSP124-e1F 50pmole、INSP124-e1R50pmole和2.5单位AmpliTaqTM(Perkin Elmer),程序如下:94℃,2分钟;94℃循环30次,30秒,63℃,30秒,以及72℃,1分钟;然后,72℃循环1次,7分钟,4℃持续循环。
要产生INSP124的外显子2,在50μl终体积中进行PCR扩增,该终体积含有1μl基因组DNA(0.1μg/μl(Novagen Inc.))、1X AmpliTaqTM缓冲液、200μM dNTPs、INSP124-e2F 50pmole、INSP124-e2R 50pmole和2.5单位AmpliTaqTM(Perkin Elmer)。要产生INSP124的外显子3,在50μl终体积中进行PCR扩增,该终体积含有1μl基因组DNA(0.1μg/μl(NovagenInc.))、1X AmpliTaqTM缓冲液、200μM dNTPs、INSP124-e3F 50pmole、INSP124-e3R 50pmole和2.5单位AmpliTaqTM(Perkin Elmer)。产生外显子2和3的PCR循环采用MJ Research DNA Engine,程序如下:94℃,2分钟;94℃循环30次,30秒,65℃,30秒,以及72℃,40秒;然后,72℃循环1次,5分钟,4℃持续循环。
在1.8%琼脂糖凝胶(1X TAE)上分析反应产物,利用Wizard PCR PrepsDNA纯化系统(Promega)凝胶纯化有正确大小(对于外显子1、2和3分别是439bp、168bp和171bp)的PCR产物,并用50μl水洗脱。在1.8%琼脂糖凝上目测10μl每一个纯化产物,估计它们的浓度。
表2-INSP124克隆和测序的引物
下划线序列=Kozak序列粗体=终止密码子斜线序列=His标签粗斜体=与毗邻外显子重叠装配外显子1、2和3产生INSP124ORF在50μl PCR反应中装配外显子1、2和3,该反应含有3μl凝胶纯化的外显子1、5μl凝胶纯化的外显子2、5μl凝胶纯化的外显子3、1.5μl 10mM dNTPs、1μl MgSO4、1.5μl INSP124-e1F(10μM)、1.5μl INSP124-e3R(10μM)、5μl10X Platinum pfxTM缓衡液和0.5μl Platinum pfxTMDNA聚合酶(5U/μl)(Invitrogen)。反应条件如下:94℃,4分钟;94℃循环10次,30秒,48℃,30秒,以及68℃,1分钟;94℃循环25次,30秒;52℃,30秒,以及68℃,1分钟;68℃附加长循环1次,10分钟;以及4℃持续循环。在0.8%琼脂糖凝胶(1X TAE)上分析反应产物。利用Wizard PCR PrepsDNA纯化系统(Promega)凝胶纯化有正确大小(704bp)的PCR产物,并用50μl水洗脱,直接亚克隆。
PCR产物的亚克隆在制造商指定的条件下,将PCR产物亚克隆到用购自InvitrogenCorporation的拓朴异构酶I修饰的克隆载体(pCR-BluntII-TOPO)中。简言之,取4μl凝胶纯化的PCR产物,室温下与1μl TOPO载体和1μl盐溶液培养15分钟。再按以下方法将反应混合物转化到大肠杆菌菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分试样在冰上解冻,加入2μlTOPO反应物。该混合物冰上培育15分钟,再在42℃培育热激刚好30秒。将样品送回冰上,加入250μl温热SOC培养基(室温)。样品在37℃摇动培育(220rpm)1小时。然后,将转化混合物300μl铺在含有卡那霉素(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
集落PCR用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNAEngine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、SP6引物20pmole、1单位AmpliTaqTM(Perkin Elmer)。循环条件如下:94℃,2分钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟。作进一步分析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使产生预期PCR产物大小(由于多个克隆位点(MCS)而得到704bp cDNA+186bp)的集落生长过夜,生长条件:温度为37℃,5毫升含有卡那霉素(40μg/ml)的L-broth(LB)板,220rpm摇动。
质粒DNA的制备和测序按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备Miniprep质粒DNA。将质粒DNA在100μl无菌水中洗脱。用EppendorfBO光度计或Spectramax 190光度计(Molecular Devices)测定DNA浓度。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no.4390246)以T7和SP6为引物对质粒DNA(200-500ng)进行DNA测序。引物序列见表2。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分析。
序列分析鉴定了一个克隆,该克隆与预测的INSP124序列完全匹配。图3为克隆cDNA片段序列。图19为克隆PCR产物(pCR-BluntII-TOPO-INSP124,质粒ID.14649)的质粒图谱。
实施例11-INSP124的哺乳动物细胞表达载体的构建运用GatewayTM克隆方法(Invitrogen),以质粒14649作为PCR模板,产生含有INSP124ORF序列的pEAK12d(图21)和pDEST12.2(图22)表达克隆,带有编码6HIS标签的3’序列。
与符合读框的6HIS标签序列融合的Gateway兼容性INSP124ORF的产生Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生这样的编码框(ORF):在INSP124的5’端添加attB1重组位点和Kozak序列,在3’端添加6个编码HIS标签的序列(6HIS)、终止密码子以及attB2重组位点(Gateway兼容性cDNA)并保证INSP124与6个编码HIS基因和终止密码子在同一个阅读框内。第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质粒14649、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μlMgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP124-EX1和INSP 124-EX2)、以及0.5μl Platinum Pfx DNA聚合酶(Invitrogen)。在95℃首次变性步骤进行PCR反应2分钟,然后94℃循环12次15秒;55℃30秒;68℃2分钟;以及4℃持续循环。在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到扩增产物,按照制造商的说明,以预定分子量(699bp)迁移的一个产物用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化,回收在50μl无菌水中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μlPlatinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用WizardPCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。
Gateway兼容的INSP124ORF亚克隆到Gateway入门载体pDONR221和表达载体pEAK12d和pDEST12.2Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物亚克隆到Gateway入门载体pDONR221(Invitrogen,图20):将5μl纯化的PCR2产物与1.5μl pDONR221载体(0.1μg/μl)、2μl BP缓冲液和1.5μl BP克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入1μl蛋白酶K(2μg/μl)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有卡那霉素(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒DNA(150-200ng)进行DNA测序。引物序列见表1。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆((pENTR_INSP124-6HIS,质粒ID14690,图23)的质粒洗脱液(2μl或约150ng),该重组反应的10μl反应终体积含有1.5μl pEAK12d载体或pDEST12.2载体(图21&22)(0.1μg/μl)、2μl LR缓冲液和1.5μl LR克隆酶(Invitrogen)。混合物室温培育1小时,加入蛋白酶K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
在每个载体亚克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表2。
从序列已被确认的各个克隆(pEAK12d INSP124-6HIS,质粒ID number14697,图24,以及pDEST12.2_INSP124-6HIS,质粒ID 14698,图25)中任一个取500ml培养基,制备用氯化铯梯度纯化的大量制备(maxi-prep)DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,aLaboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press),将质粒DNA重悬于1μg/μl无菌水(或10mM Tris-HCl pH 8.5)中,-20℃储存。
实施例12-通过外显子装配来克隆INSP125预测INSP125是一个全长SECFAM3家族新颖分泌性蛋白质,由175个氨基酸(525bp)组成(图26)。预测的INSP125编码序列除了含有一个长47个氨基酸(141bp)缺失之外,与预测的INSP124编码序列相同。前面已经克隆了INSP124预测序列(pCR-BluntII-TOPO-INSP124,质粒ID 14649)。
为了产生INSP125蛋白质:-通过PCR反应从质粒pCR-BluntII-TOPO-INSP124(质粒ID 14649)扩增INSP125外显子1。
-通过PCR反应从质粒ID14649扩增外显子2至4为单一产物。
-使凝胶纯化的外显子混合,进行一个新的PCR反应扩增重新装配的DNA。
-利用Invitrogen GatewaTMM方法,将对应于INSP125编码序列的全长PCR产物(图28)亚克隆到pCR4-TOPO克隆载体(Invitrogen),然后再依次亚克隆到pDONR 201(Gateway入门载体)以及表达载体pEAK12d和pDEST12.2。
从质粒ID 14649对编码INSP125的外显子进行PCR扩增设计PCR引物扩增INSP125的外显子1以及外显子2至4(表3)。外显子1的反向引物(INSP125-e1R)的5’端与INSP125的外显子2有19bp重叠。外显子2的正向引物(INSP125-e2F)的5’端与INSP125的外显子1有18bp重叠。由于编码序列的5’和3’端与INSP124相同,所以引物INSP124-e1F和INSP124-e3R可用作扩增外显子片段,最终全INSP125编码序列的正向和反向引物。
要产生INSP125的外显子1,在50μl终体积中进行PCR扩增,该终体积含有100ng质粒ID 14649DNA、1.5μl 10mM dNTPs、1μl MgSO4、1.5μl INSP124-e1F(10μM)、1.5μl INSP125-e1R(10μM)、5μl 10X PlatinumPfxTM缓衡液和0.5μl Platinum PfxTMDNA聚合酶(5U/μl)(Invitrogen)。反应条件如下:94℃,2分钟;94℃循环30次,15秒,61℃,30秒,以及68℃,1分钟;68℃附加长循环1次,7分钟;4℃持续循环。预测的产物大小为150bp。
要产生INSP125的外显子2至4,进行与上述产生外显子1完全一样的PCR扩增,除了扩增引物使用INSP125-e2F和INSP124-e3R外。预期的产物大小为450bp。
将反应产物装在1.5%琼脂糖凝胶(1X TAE)上,并按照制造商的说明,用Qiagen MinElute DNA纯化系统(Qiagen)凝胶纯化有正确大小(150bp和450bp)的PCR产物,用10μl EB缓衡液(10mM Tris.Cl,pH 8.5)洗脱。
表3-INSP125克隆和测序的引物
下划线序列=Kozak序列粗体=终止密码子斜线序列=His标签粗斜体=与毗邻外显子重叠装配外显子1、2至4产生INSP125ORF在50μl PCR反应中装配外显子1、2至4,该反应含有1μl凝胶纯化的外显子1、1μl凝胶纯化的外显子2-4产物、1μl 10mM dNTPs、2μlMgSO4、1μl INSP124-e1F(10μM)、1μl INSP124-e3R(10μM)、5μl 10XPlatinum Taq HiFi缓衡液和0.5μl Platinum Taq HiFi DNA聚合酶(5U/μl)(Invitrogen)。反应条件如下:94℃,2分钟;94℃循环10次,30秒,48℃,30秒,以及68℃,1分钟;94℃循环25次,30秒;52℃,30秒,以及68℃,1分钟;68℃附加长循环1次,7分钟;以及4℃持续循环。在1%琼脂糖凝胶(1X TAE)上分析反应产物。利用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化有正确大小(563bp)的PCR产物,并用50μl水洗脱,直接亚克隆。
PCR产物的亚克隆在制造商指定的条件下,将PCR产物亚克隆到用购自InvitrogenCorporation的拓朴异构酶I修饰的克隆载体(pCR4-TOPO)中。简言之,取4μl凝胶纯化的PCR产物,室温下与1μl TOPO载体和1μl盐溶液培养15分钟。再按以下方法将反应混合物转化到大肠杆菌菌株TOP10(Invitrogen)中:50μl One Shot TOP10细胞等分试样在冰上解冻,加入2μl TOPO反应物。该混合物冰上培育15分钟,再在42℃培育热激刚好30秒。将样品送回冰上,加入250μl温热SOC培养基(室温)。样品在37℃摇动培育(220rpm)1小时。然后,将转化混合物300μl铺在含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。
集落PCR用无菌牙签将集落接种在50μl无菌水中。然后,用MJ Research DNAEngine使10μl接种物等分试样在20μl总反应体积中进行PCR扩增,该终体积含有1X AmpliTaqTM缓冲液、200μM dNTPs、T7引物20pmole、T3引物20pmole、1单位AmpliTaM(Perkin Elmer)。循环条件如下:94℃,2分钟;94℃循环30次,30秒,48℃,30秒,以及72℃,1分钟。作进一步分析之前,将样品保持在4℃(持续循环)。
用1X TAE缓冲液中的1%琼脂糖凝胶分析PCR产物。使产生预期PCR产物大小(由于多个克隆位点(MCS)而得到563bp cDNA+105bp)的集落生长过夜,生长条件:温度为37℃,5毫升含有氨比西林(100μg/ml)的L-broth(LB)板,220rpm摇动。
质粒DNA的制备和测序按照制造商的说明,用Qiaprep Turbo 9600自动化系统(Qiagen)或Wizard Plus SV Minipreps试剂盒(Promega cat.no.1460)由5毫升培养基制备Miniprep质粒DNA。将质粒DNA在100μl无菌水中洗脱。用EppendorfBO光度计或Spectramax 190光度计(Molecular Devices)测定DNA浓度。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no.4390246)以T7和T3为引物对质粒DNA(200-500ng)进行DNA测序。引物序列见表1。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 96净化板(Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分析。
序列分析鉴定了一个克隆,该克隆与预测的INSP125序列完全匹配。图3为克隆cDNA片段序列。图29为克隆PCR产物(pCR4-TOPO-INSP125,质粒ID.14681)的质粒图谱。
实施例13-INSP125的哺乳动物细胞表达载体的构建运用GatewayTM克隆方法(Invitrogen),以质粒14681为PCR模板产生含有INSP125ORF序列的pEAK12d(图31)和pDEST12.2(图32)表达克隆,带有编码6HIS标签的3’序列。
与符合读框的6HIS标签序列融合的Gateway兼容性INSP125ORF的产生Gateway克隆方法的第一阶段涉及二步PCR反应,使之产生一个这样的编码框(ORF):在INSP125的5’端添加attB1重组位点和Kozak序列,在3’端添加6个编码HIS标签的序列、终止密码子以及attB2重组位点(Gateway兼容性cDNA)并保证INSP125、6个编码HIS基因和终止密码子在同一个阅读框内。第一次PCR反应(在50μl终体积中)含有:1μl(40ng)质粒14681、1.5μl dNTPs(10mM)、10μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、基因特异性引物各0.5μl(100μM)(INSP125-EX1和INSP125-EX2)、以及0.5μl Platinum Pfx DNA聚合酶(Invitrogen)。在95℃首次变性步骤进行PCR反应2分钟,然后94℃循环12次15秒;55℃30秒,和68℃2分钟;以及4℃持续循环。在1X TAE缓冲液(Invitrogen)中的0.8%琼脂糖凝胶上看到扩增产物,按照制造商的说明,以预定分子量(593bp)迁移的一个产物用Wizard PCR Preps DNA纯化系统(Promega)凝胶纯化,回收在50μl水中。
第二次PCR反应(在50μl终体积中)含有:10μl纯化PCR 1产物、1.5μl dNTPs(5mM)、5μl 10X Pfx聚合酶缓冲液、1μl MgSO4(50mM)、Gateway转化引物各0.5μl(100μM)(GCP正向、GCP反向)和0.5μl ofPlatinum Pfx DNA聚合酶。第二次PCR反应的条件是:95℃1分钟;94℃循环4次15秒;50℃30秒以及68℃2分钟;94℃循环25次15秒;55℃30秒和68℃2分钟;然后4℃持续循环。按照制造商的说明,用WizardPCR prep DNA纯化系统(Promega)凝胶纯化PCR产物。Gateway兼容的INSP125ORF亚克隆到Gateway入门载体pDONR221和表达载体pEAK12d和pDEST12.2Gateway克隆方法的第二阶段按如下方法将Gateway修饰的PCR产物亚克隆到Gateway入门载体pDONR221(Invitrogen,图30):将5μl纯化的PCR2产物与15μl pDONR221载体(0.15μg/μl)、2μl BP缓冲液和1.5μl BP克隆酶混合物(Invitrogen)在10μl终体积中室温培育1小时。加入蛋白酶K1μl(2μg/μl)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl BP反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有氨比西林(40μg/ml)的L-broth(LB)板上,37℃培育过夜。
自6个获得的集落中取5ml培养基,用Qiaprep Turbo 9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照制造商的说明,用BigDyeTerminator系统(Applied Biosystems cat.no.4390246)以21M13和M13Rev为引物对质粒DNA(150-200ng)进行DNA测序。引物序列见表3。测序反应物用Dye-Ex柱(Qiagen)或者Montage SEQ 968净化板(Millipore cat.no.LSKS09624)纯化,再用Applied Biosystems 3700测序仪分析。
重组反应采用含有正确序列的其中一个克隆(pENTR INSP125-6HIS,质粒ID 14876,图33)的质粒洗脱液(2μl或约150ng),该反应的10μl反应终体积含有1.5μl pEAK12d载体或pDEST12.2载体(图31&32)(0.1μg/μl)、2μl LR缓冲液和1.5μl LR克隆酶(Invitrogen)。混合物室温培育1小时,加入蛋白酶K(2μg)终止反应,37℃培育多10分钟。取该反应的一等分试样(1μl),通过电穿孔法转化大肠杆菌DH10B细胞,方法如下:取DH10B电感受态细胞的25μl等分试样(Invitrogen)在冰上解冻,加入1μl LR反应混合物。把混合物转移到0.1cm冷冻的电穿孔小玻璃管内按照制造商建议的方案,用Biorad Gene PulserTM电穿孔仪电穿孔的细胞中。电穿孔操作完成后,立即加入预热至室温的SOC培养基(0.5ml)。把混合物转移到一个15ml卡口试管内,37℃摇动(220rpm)培育1小时。将转化混合物的等分试样(10μl和50μl)铺在含有氨比西林(100μg/ml)的L-broth(LB)板上,37℃培育过夜。
在每个载体克隆获得的6个集落中取5ml培养基,用Qiaprep Turbo9600自动化系统(Qiagen)制备质粒Miniprep DNA。按照上述方法,以pEAK12F和pEAK12R为引物对pEAK12d载体的质粒DNA(200-500ng)进行DNA测序。按照上述方法,以21M13和M13Rev为引物对pDEST12.2载体的质粒DNA(200-500ng)进行DNA测序。引物序列见表3。
从序列已被确认的各个克隆(pEAK12d_INSP125-6HIS,质粒ID number14882,图34,以及pDEST12.2_INSP125-6HIS,质粒ID number 14886,图35)中任一个取500ml培养基,制备用氯化铯梯度纯化的maxi-prep DNA,制备方法参照Sambrook J.等人的方法(Molecular Cloning,a LaboratoryManual,第二版,1989,Cold Spring Harbor Laboratory Press),将质粒DNA重悬于1μg/μl无菌水(或10mM Tris-HCl pH 8.5)中,-20℃储存。
对INSP125进行5′测序,以决定正确的成熟多肽序列。测序得到INSP125的两个成熟形式,其中一个主要形式始于AAISE(SEQ ID NO:59),另一个形式始于DEDGPV(SEQ ID NO:61)。这些结果见图36。
实施例14-INSP123、INSP124和INSP125的表达和纯化现在,根据本文公开的核苷酸和氨基酸序列,进行其它实验以确定INSP123、INSP124和INSP125多肽在体内的组织分布和表达水平。
可通过对不同人组织的cDNA进行PCR反应,研究INSP123、INSP124和INSP125多肽转录物是否存在。INSP123、INSP124和INSP125转录物在测试样品中的水平可能很低。所以,设计确定各种人组织中是否存在一个转录物的实验需要特别小心,因为RNA制剂中小量基因组污染物都会导致假阳性结果。因此,进行逆转录之前,全部RNA都应该先用DNAse处理。另外,每一种组织都应设一个对照反应,该对照反应不进行逆转录(a-ve RT对照)。
例如,以Multiscript逆转录酶(ABI)和任意六聚引物,每一种组织可取1μg总RNA,用来产生cDNA。为每种组织设立一个对照反应,在该对照反应中除逆转录酶外加入全部组分(-ve RT对照)。每种组织的逆转录RNA样品和负RT对照都进行PCR反应。根据本文提供的序列信息,很容易设计对INSP123、INSP124和INSP125有特异性的引物。逆转录样品中存在正确分子量的产物加上负RT对照中不存在产物,都可以看成是该组织存在转录物的证据。任何合适的cDNA文库都可用来筛选INSP123、INSP124和INSP125转录物,而不仅仅是按上述方法产生的cDNA文库。
INSP123、INSP124和INSP125多肽的组织分布型式提供了关于这些多肽功能的其它有用信息。
此外,也可用以下载表达体进行其它实验:pCR4-TOPO-INSP123(图9)、pDONR(图10)、pEAK12d(图11)、pDEST12.2(图12)、pENTR-INSP123-6HIS(图13)、pEAK12d-INSP123-6HIS(图14)、pDEST12.2_INSP123-6HIS(图15)、pCR4-BluntII-TOPO-INSP124(图19)、pDONR221(图20)、pEAK12d(图21)、pDEST12.2(图22)、pENTR_INSP124-6HIS(图23)、pEAK12_NSP124-6HIS(图24)、pDEST12.2_INSP124-6HIS(图25)、pCR4-TOPO-INSP125(图29)、pDONR221(图30)、pEAK12d(图31)、pDEST12.2(图32)、pENTR_INSP125-6HIS(图33)、pEAK12d_INSP125-6HIS(图34)和pDEST12.2_INSP125-6HIS(图35)。运用这些载体转染哺乳动物细胞系能够使INSP123、INSP124和INSP125多肽获得高水平表达,因而能够对INSP123、INSP124和INSP125多肽的功能特点进行连续研究。以下材料和方法是适合这些实验用的其中一个例子。
细胞培养基表达埃-巴二氏病毒核抗原的人胚胎肾293细胞(HEK293-EBNA,Invitrogen)维持悬浮在无Ex-cell VPRO血清的培养基中(种子储备,维持培养基,JRH)。转染前16至20小时(第1天),将细胞接种在2x T225烧瓶中(每个烧瓶50毫升,接种在含有2%FBS移种培养基(JRH)的DMEM/F12(1∶1)中,密度为2×105个细胞/毫升)。第二天(转染第0天),用JetPEITM试剂进行转染(2μl/μg质粒DNA,PolyPlus-transfection转染试剂)。每个烧瓶中,质粒DNA与GFP(萤光报导基因)DNA共转染。再将转染混合物加入2x T225烧瓶中,37℃(5%CO2)培育6天。在第1和第6天进行定性萤光检验,确认阳性转染(Axiovert 10Zeiss)。
在第6天(收获天),将两个烧瓶中的上清液合并,离心(4℃,400g),并置于带有独特鉴定器的器皿内。保留一等分试样(500μl),对6His标签蛋白作QC(内部生物加工QC)。
参照BP/PEI/HH/02/04中称之“悬浮细胞PEI转染”的方案,以Polysciences的聚乙烯亚胺为转染剂进行放大批量生产。
纯化方法含有C端带6His标签的重组蛋白质的培养基样品用冷冻缓冲液A(50mM磷酸二氢钠;600mM氯化钠;8.7%(重量/体积)甘油,pH 7.5)稀释。样品经无菌过滤器(Millipore)过滤,4℃储存于无菌方形培养瓶中(Nalgene)。
4℃下用连接到样品自动装载器(Labomatic)的VISION工作站(AppliedBiosystems)进行纯化。纯化程序由两个连续步骤组成:在装有镍离子的Poros 20MC(Applied Biosystems)柱(4.6×50mm,0.83ml)上进行金属亲和力层析,再在Sephadex G-25培养(Amersham Pharmacia)柱(1.0×10cm)上进行凝胶过滤。
第一个层析步骤的金属亲和柱用30柱体积的EDTA溶液(100mMEDTA;1M NaCl;pH 8.0)再生,用15柱体积的100mM硫酸镍溶液洗涤重新装载镍离子,用10柱体积的缓冲液A和7柱体积的缓冲液B(50mM磷酸二氢钠;600mM氯化钠;8.7%(重量/体积)400mM甘油;咪唑,pH 7.5)洗涤,最后用15柱体积含15mM咪唑的缓冲液A平衡。样品用Labomatic的样品装载器转移到200毫升定量环,然后以10ml/min的速率装到镍金属亲和柱上。亲和柱再用12柱体积的缓冲液A和28柱体积含20mM咪唑的缓冲液A洗涤。在20mM咪唑洗涤期间,附着比较松散的污染蛋白质从柱中洗脱出来。重组的His标签蛋白质最后用10柱体积的缓冲液B洗脱,流速为2ml/min,收集洗脱出来的蛋白质。
第二层析步骤的Sephadex G-25凝胶过滤柱用2毫升缓冲液D(1.137M氯化钠;2.7mM氯化;1.5mM磷酸二氢钾;8mM磷酸二氢钠;pH 7.2)再生,然后用4柱体积的缓冲液C(137mM氯化钠;2.7mM氯化钾;1.5mM磷酸二氢钾;8mM磷酸二氢钠;20%(重量/体积)甘油;pH 7.4)平衡。从镍柱洗脱出来的峰值馏分自动通过连接到VISION的整合型样品装载器装在Sephadex G-25柱上,蛋白质用缓冲液C洗脱,流速为2ml/min。该馏分经过无菌离心过滤器(Millipore)过滤,冻存于-80℃。取样品的一等分试样以SDS-PAGE(4-12%NuPAGE凝胶;Novex)Westem印迹和抗His抗体进行分析。NuPAGE凝胶可用0.1%考马斯亮蓝R250染色溶液(30%甲醇,10%乙酸)室温染色1小时,然后用20%甲醇,7.5%乙酸去色,直至背景澄清,蛋白质带清晰可见。
电泳后将蛋白质从凝胶电转移到硝基纤维素膜上。室温下用5%在缓冲液E(137mM氯化钠;2.7mM氯化钾;1.5mM磷酸二氢钾;8mM磷酸二氢钠;0.1%Tween 20,pH 7.4)中的奶粉封闭纤维素膜1小时,再于4℃在缓冲液E中的2.5%奶粉中与2种兔多克隆抗His抗体(G-18和H-15,各0.2μg/ml;Santa Cruz)混合物培养过夜。室温再培养1小时之后,膜用缓冲液E(3×10分钟)洗涤,再与结合HRP的第二抗兔抗体(DAKO,HRP 0399)室温培养2小时,第二抗体用含2.5%奶粉的缓冲液E稀释至1/3000。用缓冲液E(3×10分钟)洗涤之后,膜用ECL试剂盒(Amersham Pharmacia)显影1分钟。然后,将膜与超膜(Hyperfilm)(Amemham Pharmacia)接触,使超膜显影,对Western印迹影像作目测分析。
对于由考马斯亮蓝染色检测到蛋白质带的样品,采用BCA蛋白质测定试剂盒(Pierce)可确定它们所含蛋白质的浓度,以牛血清白蛋白为标准。
此外,细胞系中多肽过度表达或表达下调都可用来确定转录激活对宿主细胞基因组的影响。把免疫沉淀法与Western印迹分析结合以及免疫沉淀法与质谱结合,都可鉴定INSP123、INSP124和INSP125多肽的二聚配偶体、共激活剂和共抑制剂。
实施例15-与含有血管性血友病因子C型的分泌性蛋白质生物活性相似的生物活性的检测试验1.基于少突细胞的试验少突细胞负责中枢神经系内髓磷脂形成。在多发性硬化病中,它们是受攻击的第一批细胞,失去这些细胞会导致重大的行为障碍。除了抑制发炎外,有人提出治疗多发性硬化病的一个策略是增强在多发性硬化病出现的损害部位的不完全髓鞘再生。与神经细胞一样,成熟的少突细胞不会分裂,但先祖细胞会产生新的少突细胞。这些先祖细胞在成人脑甚至胚胎内的数量很少,对于HTS来说,这一先祖细胞的数量是不足够的。
Oli-neu是以t-neu致癌基因无限增殖化少突基因前体而获得的鼠细胞系。对它们作充分研究,并作为代表性细胞系来研究初期少突细胞的生物学。
这些细胞可用在两类试验中。
一类试验用于鉴定刺激少突细胞增殖的因素,另一类试验用于寻找促进它们分化的因素。这两件事件对于观察帮助再生和修复脱髓鞘疾病都是至关重要的。
另一种可能的细胞系是人细胞系MO3-13。将横纹肌肉瘤细胞与成人少突细胞融合可以得到MO3-13。不过,这些细胞分化为少突细胞的能力较低,而且它们的增殖率也不足以进行增殖试验。然而,它们表现出少突细胞的某些特征,它们的形态也很适合核易位研究。因此,这一细胞系可用在三种转录因子(分别是NF-Kb、Stat-1和Stat-2)的核易位试验中。Jak/Stat转录途径是由许多因子例如IFNα、β、γ、细胞因子(如IL-2、IL-6、lL-5)或激素(例如GH、TPO、EPO)激活的复杂途径。应答的特异性取决于激活的Stat的组合。例如,值得注意的是,IFN-β激活Stat1、2和3核易位,而IFN-γ仅能激活Stat1。同样地,很多细胞因子和生长因子诱导NF-kB易位。这些试验的目的在于获得一给定蛋白质激活途径的图像。
2.基于星形胶质细胞的试验星形胶质细胞的生物学非常复杂,但一般认为有两种基本状态。在静态中,星形胶质细胞通过为神经细胞和少突细胞送谷氨酸酯和提供能量底物来调节神经细胞的代谢和兴奋水平。在激活态中,星形胶质细胞产生趋化因子和细胞因子以及一氧化氮。第一种状态被认为是正常健康状态,而第二种状态在发炎、中风或神经系统退化性疾病中发生。当该激活状态持续出现,可以视为生病状态。
已经知道许多因子和许多途径可以调控星形胶质细胞的激活。为了鉴定调控星形胶质细胞激活的新因子,可以使用U373细胞,它们是来自星形胶质细胞的人细胞系。NF-kB、c-Jun以及Stat都是信号传导分子,已知在星形胶质细胞的激活中发挥关键作用。
基于NF-kB、c-Jun和Stat 1、2和3的核易位进行一系列筛选。这些途径的原型激活物是IL-1b、IFN-β或IFN-γ。目的在于鉴定可用作治疗中枢神经系统的蛋白质。
3.基于神经细胞的试验神经细胞是非常复杂和多样化的细胞,但它们有两方面是相同的。首先,它们都是有丝分裂后细胞,第二,它们都能够神经支配其它细胞。它们的存活与是否存在营养因子有关,后者通常由受神经支配的靶细胞产生。很多神经系统退化性疾病失去了对靶细胞的神经支配,导致细胞体萎缩和细胞凋亡。因此,鉴定能够补偿靶细胞缺乏的营养因子对治疗神经系统退化性疾病非常重要。
在此研究中,可利用大鼠PC12细胞的亚克隆NS1细胞进行一个存活试验。这些细胞已被使用多年,在经初生神经细胞(包括参与神经细胞存活和分化的途径(MEK、PI3K、CREB))进行确认之前,很多营养生物学知识都是基于这些细胞而获得的。相反,鼠成神经细胞瘤细胞即N2A细胞不会应答典型的神经营养因子,但Jun-激酶抑制剂会阻止失去血清(serumdeprivation)诱导的细胞凋亡。因此,对这两个细胞系进行试验,将有助于发现不同类型的“促进存活”的蛋白质。
重要的是,我们在前述试验中鉴定了能够促进增殖和分化的因子。为了鉴定特异性促进神经细胞分化的因子,采用基于神经突发芽的NS1分化试验。在神经系统退化性疾病中促进于轴突或树枝状发芽是有利的,这是因为以下两个原因:首先,它帮助退化神经细胞重生以及重新建立与靶细胞之间的接触;其次,它增强所谓的由健康纤维侧向发芽,这是延迟诸如帕金森氏病或阿耳茨海默氏病等神经系统退化性疾病末期的补偿现象。
4.基于内皮细胞的试验脑与血管之间的脑血屏障(BBB)导致皮层脊髓液与血清组成存在差异。内皮细胞与星形胶质细胞之间紧密接触,就会产生BBB。防止脑内白细胞渗透可维持免疫耐受状态,允许用相同的胞内信号传导途径产生两个平行的内分泌系统。不过,很多疾病或肿瘤改变了BBB的完整性,白细胞和血清蛋白进入脑内,诱导神经系统发炎。不容易建立BBB体外模型,但初生内皮细胞培养基,例如人胚胎脐静脉内皮细胞(HUVEC),可以模仿BBB生物学的某些方面。例如,刺激胞内钙质释出的蛋白质可诱导BBB渗漏。在鉴定能调节BBB完整性的蛋白质的研究中,可在凝血酶存在或不存在下对HUVEC进行钙迁移试验。
SEQFAM3序列表SEQ ID 1(INSP123核苷酸序列,单个外显子)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG GTGACCAGAT CTCCAGTAAT121  GACAATCTGA TCTTTGATGA CTATCGAGGG AAAGGGTGTG TCGATGACAG CGGCTTTGTA181  TACAAGTTGG GAGAACGATT TTTCCCTGGG CATTCCAACT GTCCATGTGT CTGTGCTCTA241  GATGGACCTG TTTGCGACCA ACCAGAATGC CCTAAAATTC ACCCAAAGTG TACTAAAGTG301  GAACACAATG GATGCTGTCC TGAGTGCAAA GAAGTAAAAA ACTTCTGTGA ATATCACGGG361  AAAAATTACA AAATCTTGGA GGAATTTAAG GTATGCGTTA CCCTCCATAT TTATTGASEQ ID 2(INSP123蛋白质序列,单个外显子)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQISSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC  PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK VCVTLHIYSEQ ID 3(INSP123成熟蛋白质CDS-信号肽分割23:24aa)1  ATCAGTCATG AAGACTATCC TGCTGATGAA GGTGACCAGA TCTCCAGTAA TGACAATCTG61  ATCTTTGATG ACTATCGAGG GAAAGGGTGT GTCGATGACA GCGGCTTTGT ATACAAGTTG121  GGAGAACGAT TTTTCCCTGG GCATTCCAAC TGTCCATGTG TCTGTGCTCT AGATGGACCT181  GTTTGCGACC AACCAGAATG CCCTAAAATT CACCCAAAGT GTACTAAAGT GGAACACAAT241  GGATGCTGTC CTGAGTGCAA AGAAGTAAAA AACTTCTGTG AATATCACGG GAAAAATTAC301  AAAATCTTGG AGGAATTTAA GGTATGCGTT ACCCTCCATA TTTATTGASEQ ID 4(INSP123成熟蛋白质序列-信号肽分割23:24aa)1  ISHEDYPADE GDQISSNDNL IFDDYRGKGC VDDSGFVYKL GERFFPGHSN CPCVCALDGP61  VCDQPECPKI HPKCTKVEHN GCCPECKEVK NFCEYHGKNY KILEEFKVCV TLHIYSEQ ID 5(INSP124核苷酸序列,第一外显子)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG GTGACCAGAT CTCCAGTAAT121  GACAATCTGA TCTTTGATGA CTATCGAGGG AAAGGGTGTG TCGATGACAG CGGCTTTGTA181  TACAAGTTGG GAGAACGATT TTTCCCTGGG CATTCCAACT GTCCATGTGT CTGTGCTCTA241  GATGGACCTG TTTGCGACCA ACCAGAATGC CCTAAAATTC ACCCAAAGTG TACTAAAGTG301  GAACACAATG GATGCTGTCC TGAGTGCAAA GAAGTAAAAA ACTTCTGTGA ATATCACGGG361  AAAAATTACA AAATCTTGGA GGAATTTAAGSEQ ID 6(INSP124蛋白质序列,第一外显子)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQISSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK
SEQ ID 7(INSP124核苷酸序列,第二外显子)1  CCCTCTCCAT GTGAATGGTG TCGCTGTGAG CCCAGCAATG AAGTTCACTG TGTTGTAGCA61  GACTGCGCAG TTCCTGAGTG TGTCAACCCA GTCTATGAAC CAGAACAATG TTGTCCTGTC121  TGCAAAAATGSEQ ID 8(INSP124蛋白质序列,第二外显子)1  PSPCEWCRCE PSNEVHCVVA DCAVPECVNP VYEPEQCCPV CKNGSEQ ID 9(INSP124核苷酸序列,第三外显子)1  GTCCAAACTG CTTTGCAGGA ACGACGATAA TTCCAGCTGG CATTGAAGTG AAAGTGGACG61  AATGTAACAT CTGTCATTGT CACAACGGGG ACTGGTGGAA GCCTGCTCAG TGTTCGAAAC121  GTGAATGCCA AGGCAAGCAG ACTGTGTAGSEQ ID 10(INSP124蛋白质序列,第三外显子)1PNCFAGTTII PAGIEVKVDE CNICHCHNGD WWKPAQCSKR ECQGKQTVSEQ ID 11(INSP 124全编码序列)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG GTGACCAGAT CTCCAGTAAT121  GACAATCTGA TCTTTGATGA CTATCGAGGG AAAGGGTGTG TCGATGACAG CGGCTTTGTA181  TACAAGTTGG GAGAACGATT TTTCCCTGGG CATTCCAACT GTCCATGTGT CTGTGCTCTA241  GATGGACCTG TTTGCGACCA ACCAGAATGC CCTAAAATTC ACCCAAAGTG TACTAAAGTG301  GAACACAATG GATGCTGTCC TGAGTGCAAA GAAGTAAAAA ACTTCTGTGA ATATCACGGG361  AAAAATTACA AAATCTTGGA GGAATTTAAG CCCTCTCCAT GTGAATGGTG TCGCTGTGAG421  CCCAGCAATG AAGTTCACTG TGTTGTAGCA GACTGCGCAG TTCCTGAGTG TGTCAACCCA481  GTCTATGAAC CAGAACAATG TTGTCCTGTC TGCAAAAATG GTCCAAACTG CTTTGCAGGA541  ACGACGATAA TTCCAGCTGG CATTGAAGTG AAAGTGGACG AATGTAACAT CTGTCATTGT601  CACAACGGGG ACTGGTGGAA GCCTGCTCAG TGTTCGAAAC GTGAATGCCA AGGCAAGCAG661  ACTGTGTAGSEQ ID 12(INSP124全蛋白质序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQISSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK PSPCEWCRCE PSNEVHCVVA DCAVPECVNP VYEPEQCCPV CKNGPNCFAG181  TTIIPAGIEV KVDECNICHC HNGDWWKPAQ CSKRECQGKQ TVSEQ ID 13(INSP124成熟蛋白质CDS第一外显子-信号肽分割23:24aa)1  ATCAGTCATG AAGACTATCC TGCTGATGAA GGTGACCAGA TCTCCAGTAA TGACAATCTG61  ATCTTTGATG ACTATCGAGG GAAAGGGTGT GTCGATGACA GCGGCTTTGT ATACAAGTTG121  GGAGAACGAT TTTTCCCTGG GCATTCCAAC TGTCCATGTG TCTGTGCTCT AGATGGACCT181  GTTTGCGACC AACCAGAATG CCCTAAAATT CACCCAAAGT GTACTAAAGT GGAACACAAT241  GGATGCTGTC CTGAGTGCAA AGAAGTAAAA AACTTCTGTG AATATCACGG GAAAAATTAC301  AAAATCTTGG AGGAATTTAA G
SEQ ID 14(INSP124成熟蛋白质序列第一外显子-信号肽分割23:24aa)1  ISHEDYPADE GDQISSNDNL IFDDYRGKGC VDDSGFVYKL GERFFPGHSN CPCVCALDGP61  VCDQPECPKI HPKCTKVEHN GCCPECKEVK NFCEYHGKNY KILEEFKSEQ ID 15(INSP124成熟蛋白质全CDS-信号肽分割23:24aa)1  ATCAGTCATG AAGACTATCC TGCTGATGAA GGTGACCAGA TCTCCAGTAA TGACAATCTG61  ATCTTTGATG ACTATCGAGG GAAAGGGTGT GTCGATGACA GCGGCTTTGT ATACAAGTTG121  GGAGAACGAT TTTTCCCTGG GCATTCCAAC TGTCCATGTG TCTGTGCTCT AGATGGACCT181  GTTTGCGACC AACCAGAATG CCCTAAAATT CACCCAAAGT GTACTAAAGT GGAACACAAT241  GGATGCTGTC CTGAGTGCAA AGAAGTAAAA AACTTCTGTG AATATCACGG GAAAAATTAC301  AAAATCTTGG AGGAATTTAA GCCCTCTCCA TGTGAATGGT GTCGCTGTGA GCCCAGCAAT361  GAAGTTCACT GTGTTGTAGC AGACTGCGCA GTTCCTGAGT GTGTCAACCC AGTCTATGAA421  CCAGAACAAT GTTGTCCTGT CTGCAAAAAT GGTCCAAACT GCTTTGCAGG AACGACGATA481  ATTCCAGCTG GCATTGAAGT GAAAGTGGAC GAATGTAACA TCTGTCATTG TCACAACGGG541  GACTGGTGGA AGCCTGCTCA GTGTTCGAAA CGTGAATGCC AAGGCAAGCA GACTGTGTAGSEQ ID 16(INSP124成熟蛋白质全序列-信号肽分割23:24aa)1  ISHEDYPADE GDQISSNDNL IFDDYRGKGC VDDSGFVYKL GERFFPGHSN CPCVCALDGP61  VCDQPECPKI HPKCTKVEHN GCCPECKEVK NFCEYHGKNY KILEEFKPSP CEWCRCEPSN121  EVHCVVADCA VPECVNPVYE PEQCCPVCKN GPNCFAGTTI IPAGIEVKVD ECNICHCHNG181  DWWKPAQCSK RECQGKQTVSEQ ID 17(INSP125核苷酸序列,第一外显子)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAGSEQ ID 18(INSP125蛋白质序列,第一外显子)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEDSEQ ID 19(INSP125核苷酸序列,第二外显子)1  ATGGACCTGT TTGCGACCAA CCAGAATGCC CTAAAATTCA CCCAAAGTGT ACTAAAGTGG61  AACACAATGG ATGCTGTCCT GAGTGCAAAG AAGTAAAAAA CTTCTGTGAA TATCACGGGA121  AAAATTACAA AATCTTGGAG GAATTTAAGSEQ ID 20(INSP125蛋白质序列,第二外显子)1GPVCDQPECP KIHPKCTKVE HNGCCPECKE VKNFCEYHGK NYKILEEFKSEQ ID 21(INSP125核苷酸序列,第三外显子)1  CCCTCTCCAT GTGAATGGTG TCGCTGTGAG CCCAGCAATG AAGTTCACTG TGTTGTAGCA61  GACTGCGCAG TTCCTGAGTG TGTCAACCCA GTCTATGAAC CAGAACAATG TTGTCCTGTC121  TGCAAAAATGSEQ ID 22(INSP125蛋白质序列,第三外显子)1  PSPCEWCRCE PSNEVHCVVA DCAVPECVNP VYEPEQCCPV CKNG
SEQ ID 23(INSP125核苷酸序列,第四外显子)1  GTCCAAACTG CTTTGCAGGA ACGACGATAA TTCCAGCTGG CATTGAAGTG AAAGTGGACG61  AATGTAACAT CTGTCATTGT CACAACGGGG ACTGGTGGAA GCCTGCTCAG TGTTCGAAAC121  GTGAATGCCA AGGCAAGCAG ACTGTGTAGSEQ ID 24(INSP125蛋白质序列,第四外显子)1  PNCFAGTTII PAGIEVKVDE CNICHCHNGD WWKPAQCSKR ECQGKQTVSEQ ID 25(INSP125全编码序列)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG ATGGACCTGT TTGCGACCAA121  CCAGAATGCC CTAAAATTCA CCCAAAGTGT ACTAAAGTGG AACACAATGG ATGCTGTCCT181  GAGTGCAAAG AAGTAAAAAA CTTCTGTGAA TATCACGGGA AAAATTACAA AATCTTGGAG241  GAATTTAAGC CCTCTCCATG TGAATGGTGT CGCTGTGAGC CCAGCAATGA AGTTCACTGT301  GTTGTAGCAG ACTGCGCAGT TCCTGAGTGT GTCAACCCAG TCTATGAACC AGAACAATGT361  TGTCCTGTCT GCAAAAATGG TCCAAACTGC TTTGCAGGAA CGACGATAAT TCCAGCTGGC421  ATTGAAGTGA AAGTGGACGA ATGTAACATC TGTCATTGTC ACAACGGGGA CTGGTGGAAG481  CCTGCTCAGT GTTCGAAACG TGAATGCCAA GGCAAGCAGA CTGTGTAGSEQ ID 26(INSP125全蛋白质序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEDGPVCDQ PECPKIHPKC TKVEHNGCCP61  ECKEVKNFCE YHGKNYKILE EFKPSPCEWC RCEPSNEVHC VVADCAVPEC VNPVYEPEQC121  CPVCKNGPNC FAGTTIIPAG IEVKVDECNI CHCHNGDWWK PAQCSKRECQ GKQTVSEQ ID 27(INSP125成熟蛋白质CDS第一外显子-信号肽分割23:24aa)1  ATCAGTCATG AAGACTATCC TGCTGATGAA GSEQ ID 28(INSP125成熟蛋白质第一外显子-信号肽分割23:24aa)1  IPGLVTSAAI SHEDYPADESEQ ID 29(INSP125成熟蛋白质CDS-信号肽分割23:24aa)1  ATCAGTCATG AAGACTATCC TGCTGATGAA GATGGACCTG TTTGCGACCA ACCAGAATGC61  CCTAAAATTC ACCCAAAGTG TACTAAAGTG GAACACAATG GATGCTGTCC TGAGTGCAAA121  GAAGTAAAAA ACTTCTGTGA ATATCACGGG AAAAATTACA AAATCTTGGA GGAATTTAAG181  CCCTCTCCAT GTGAATGGTG TCGCTGTGAG CCCAGCAATG AAGTTCACTG TGTTGTAGCA241  GACTGCGCAG TTCCTGAGTG TGTCAACCCA GTCTATGAAC CAGAACAATG TTGTCCTGTC301  TGCAAAAATG GTCCAAACTG CTTTGCAGGA ACGACGATAA TTCCAGCTGG CATTGAAGTG361  AAAGTGGACG AATGTAACAT CTGTCATTGT CACAACGGGG ACTGGTGGAA GCCTGCTCAG421  TGTTCGAAAC GTGAATGCCA AGGCAAGCAG ACTGTGTAG
SEQ ID 30(INSP125成熟蛋白质序列-信号肽分割23:24aa)1  ISHEDYPADE DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG KNYKILEEFK61  PSPCEWCRCE PSNEVHCVVA DCAVPECVNP VYEPEQCCPV CKNGPNCFAG TTIIPAGIEV121  KVDECNICHC HNGDWWKPAQ CSKRECQGKQ TVSEQ ID 31(小鼠chr1直向同源物的Inpharmatica基因预测序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQASSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK VSEQ ID 32(小鼠chr1直向同源物的Inpharmatica基因预测序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQASSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK PSPCEWCRCE PSNEVHCVVA DCAVPECVNP IYEPEQCCPV CKNGPNCFAG181  TTIIPAGIEV KVDDCNICHC HNGDWWKPAQ CSKRECQGKQ TVSEQ ID 33(大鼠chr9直向同源物的Inpharmatica基因预测序列)1  MALHIHEACI LLLVIPGLVT PAAISHEDYP ADEGDQASSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK VSEQ ID 34(大鼠chr14直向同源物的Inpharmatica基因预测序列)1  MPSSSAMAVG ALSSSLLVIC CLMVALCSPS IPLEKLAQAP EQPGQEKREH ASRDSPGRVS61  ELGRASRDEG SSARDWKSKG SRALSGREAW SKQKQAWAAQ SGSAKAADWQ VRPRGDTPQG121  EPPAAAQEAI SLELMPTPEL PEEYAYPDYR GKGCVDESGF VYAIGEKFAP GPSACPCLCT181  EEGPLCAQPE CPRLHPRCIH VDTSQCCPQC KERKNYCEFR GKTYQTLEEF VVSPCERCRC241  EANGEVLCTV SACPQTECVD PVYEPDQCCP ICKNGPNCFA ETAVIPAGRE VKTDECTICH301  CTYEEGTWRI ERQAMCTRHE CRQMSEQ ID 35(河豚gDNA支架_631直向同源物的Inpharmatica基因预测序列)1  MVVSESLSMT RRVRTAALAL LVCAHAVSGF SVAGQQESTC EENGGIYFVG EWYFLDSDHC61  TQCECTAEGP VCFRTECTSL PAACIHVSHY PTDCCPRCEK IGCEYRGVVY ELGQNFQPTE121  CEQCTCDSDG IARCLVADCA PPPCVNPVYQ PGKCCPECKD GPNCYVTASR TQVIPAGEPT181  WVDACTKCRC HDGQDAGYWE GNRLATCSRL KNCNHEGMLP RSKSEQ ID 36(河豚gDNA支架_889直向同源物的Inpharmatica基因预测序列)1  MLHSVAMTAE FLFVLVILTS SAQSHPIVTL PASREHSERV LSPAGQDNHS DKQAAEAYGV61  LEERDSLGPN RTASSPDRPN WNEQSSLNRI DEAPTSDVTL SLDAIDEYAY PDYRGKGCMD121  ESGFVFAIGE QFTPGPSTCP CLCTDEGPLC TKPECPKVHP RCIKVDTSQC CPLCREKKNY181  CDFRGKLYAS LEEFKVSPCE KCRCEPSGEV LCTVAACPQT ECVDPEYEPD QCCPICKSGE
241  WTPFPELSEQ ID 37(河豚gDNA支架_1933直向同源物的Inpharrmatica基因预测序列)1  MAPLLPATFV LLLALRAVTP AAVSNPEDYA ADEAERSAAD SIIFDDYRGK GCVDDSGFVY61  KLGERFYPGH SNCPCVCTED GPVCDQPECP RLHPKCTKVE HNGCCPECKE VKNFCEYRGK121  TYKILEEFKV RSEQ ID 38(INSP123克隆核苷酸序列)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG GTGACCAGAT CTCCAGTAAT121  GACAATCTGA TCTTTGATGA CTATCGAGGG AAAGGGTGTG TCGATGACAG CGGCTTTGTA181  TACAAGTTGG GAGAACGATT TTTCCCTGGG CATTCCAACT GTCCATGTGT CTGTGCTCTA241  GATGGACCTG TTTGCGACCA ACCAGAATGC CCTAAAATTC ACCCAAAGTG TACTAAAGTG301  GAACACAATG GATGCTGTCC TGAGTGCAAA GAAGTAAAAA ACTTCTGTGA ATATCACGGG361  AAAAATTACA AAATCTTGGA GGAATTTAAG GTATGCGTTA CCCTCCATAT TTATSEQ ID 39(INSP123克隆多肽序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQISSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK VCVTLHIYSEQ ID 40(INSP123克隆成熟核苷酸序列1)1  GCTATCAGTC ATGAAGACTA TCCTGCTGAT GAAGGTGACC AGATCTCCAG TAATGACAAT61  CTGATCTTTG ATGACTATCG AGGGAAAGGG TGTGTCGATG ACAGCGGCTT TGTATACAAG121  TTGGGAGAAC GATTTTTCCC TGGGCATTCC AACTGTCCAT GTGTCTGTGC TCTAGATGGA181  CCTGTTTGCG ACCAACCAGA ATGCCCTAAA ATTCACCCAA AGTGTACTAA AGTGGAACAC241  AATGGATGCT GTCCTGAGTG CAAAGAAGTA AAAAACTTCT GTGAATATCA CGGGAAAAAT301  TACAAAATCT TGGAGGAATT TAAGGTATGC GTTACCCTCC ATATTTATSEQ ID 41(INSP123克隆成熟多肽序列1)1  AISHEDYPAD EGDQISSNDN LIFDDYRGKG CVDDSGFVYK LGERFFPGHS NCPCVCALDG61  PVCDQPECPK IHPKCTKVEH NGCCPECKEV KNFCEYHGKN YKILEEFKVC VTLHIYSEQ ID 42(INSP123克隆成熟核苷酸序列2)1  GCTGCTATCA GTCATGAAGA CTATCCTGCT GATGAAGGTG ACCAGATCTC CAGTAATGAC61  AATCTGATCT TTGATGACTA TCGAGGGAAA GGGTGTGTCG ATGACAGCGG CTTTGTATAC121  AAGTTGGGAG AACGATTTTT CCCTGGGCAT TCCAACTGTC CATGTGTCTG TGCTCTAGAT181  GGACCTGTTT GCGACCAACC AGAATGCCCT AAAATTCACC CAAAGTGTAC TAAAGTGGAA241  CACAATGGAT GCTGTCCTGA GTGCAAAGAA GTAAAAAACT TCTGTGAATA TCACGGGAAA
301  AATTACAAAA TCTTGGAGGA ATTTAAGGTA TGCGTTACCC TCCATATTTA TSEQ ID 43(INSP123克隆成熟多肽序列2)1  AAISHEDYPA DEGDQISSND NLIFDDYRGK GCVDDSGFVY KLGERFFPGH SNCPCVCALD61  GPVCDQPECP KIHPKCTKVE HNGCCPECKE VKNFCEYHGK NYKILEEFKV CVTLHIYSEQ ID 44(INSP123克隆成熟核苷酸序列3)1  GATGAAGGTG ACCAGATCTC CAGTAATGAC AATCTGATCT TTGATGACTA TCGAGGGAAA61  GGGTGTGTCG ATGACAGCGG CTTTGTATAC AAGTTGGGAG AACGATTTTT CCCTGGGCAT121  TCCAACTGTC CATGTGTCTG TGCTCTAGAT GGACCTGTTT GCGACCAACC AGAATGCCCT181  AAAATTCACC CAAAGTGTAC TAAAGTGGAA CACAATGGAT GCTGTCCTGA GTGCAAAGAA241  GTAAAAAACT TCTGTGAATA TCACGGGAAA AATTACAAAA TCTTGGAGGA ATTTAAGGTA301  TGCGTTACCC TCCATATTTA TSEQ ID 45(INSP123克隆成熟多肽序列3)1  DEGDQISSND NLIFDDYRGK GCVDDSGFVY KLGERFFPGH SNCPCVCALD GPVCDQPECP61  KIHPKCTKVE HNGCCPECKE VKNFCEYHGK NYKILEEFKV CVTLHIYSEQ ID 46(INSP124克隆核苷酸序列)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG GTGACCAGAT CTCCAGTAAT121  GACAATCTGA TCTTTGATGA CTATCGAGGG AAAGGGTGTG TCGATGACAG CGGCTTTGTA181  TACAAGTTGG GAGAACGATT TTTCCCTGGG CATTCCAACT GTCCATGTGT CTGTGCTCTA241  GATGGACCTG TTTGCGACCA ACCAGAATGC CCTAAAATTC ACCCAAAGTG TACTAAAGTG301  GAACACAATG GATGCTGTCC TGAGTGCAAA GAAGTAAAAA ACTTCTGTGA ATATCACGGG361  AAAAATTACA AAATCTTGGA GGAATTTAAG CCCTCTCCAT GTGAATGGTG TCGCTGTGAG421  CCCAGCAATG AAGTTCACTG TGTTGTAGCA GACTGCGCAG TTCCTGAGTG TGTCAACCCA481  GTCTATGAAC CAGAACAATG TTGTCCTGTC TGCAAAAATG GTCCAAACTG CTTTGCAGGA541  ACGACGATAA TTCCAGCTGG CATTGAAGTG AAAGTGGACG AATGTAACAT CTGTCATTGT601  CACAACGGGG ACTGGTGGAA GCCTGCTCAG TGTTCGAAAC GTGAATGCCA AGGCAAGCAG661  ACTGTGSEQ ID 47(INSP124克隆多肽序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEGDQISSN DNLIFDDYRG KGCVDDSGFV61  YKLGERFFPG HSNCPCVCAL DGPVCDQPEC PKIHPKCTKV EHNGCCPECK EVKNFCEYHG121  KNYKILEEFK PSPCEWCRCE PSNEVHCVVA DCAVPECVNP VYEPEQCCPV CKNGPNCFAG181  TTIIPAGIEV KVDECNICHC HNGDWWKPAQ CSKRECQGKQ TV
SEQ ID 48(INSP124克隆成熟核苷酸序列1)1  GCTATCAGTC ATGAAGACTA TCCTGCTGAT GAAGGTGACC AGATCTCCAG TAATGACAAT61  CTGATCTTTG ATGACTATCG AGGGAAAGGG TGTGTCGATG ACAGCGGCTT TGTATACAAG121  TTGGGAGAAC GATTTTTCCC TGGGCATTCC AACTGTCCAT GTGTCTGTGC TCTAGATGGA181  CCTGTTTGCG ACCAACCAGA ATGCCCTAAA ATTCACCCAA AGTGTACTAA AGTGGAACAC241  AATGGATGCT GTCCTGAGTG CAAAGAAGTA AAAAACTTCT GTGAATATCA CGGGAAAAAT301  TACAAAATCT TGGAGGAATT TAAGCCCTCT CCATGTGAAT GGTGTCGCTG TGAGCCCAGC361  AATGAAGTTC ACTGTGTTGT AGCAGACTGC GCAGTTCCTG AGTGTGTCAA CCCAGTCTAT421  GAACCAGAAC AATGTTGTCC TGTCTGCAAA AATGGTCCAA ACTGCTTTGC AGGAACGACG481  ATAATTCCAG CTGGCATTGA AGTGAAAGTG GACGAATGTA ACATCTGTCA TTGTCACAAC541  GGGGACTGGT GGAAGCCTGC TCAGTGTTCG AAACGTGAAT GCCAAGGCAA GCAGACTGTGSEQ ID 49(INSP124克隆成熟多肽序列1)1  AISHEDYPAD EGDQISSNDN LIFDDYRGKG CVDDSGFVYK LGERFFPGHS NCPCVCALDG61  PVCDQPECPK IHPKCTKVEH NGCCPECKEV KNFCEYHGKN YKILEEFKPS PCEWCRCEPS121  NEVHCVVADC AVPECVNPVY EPEQCCPVCK NGPNCFAGTT IIPAGIEVKV DECNICHCHN181  GDWWKPAQCS KRECQGKQTVSEQ ID 50(INSP124克隆成熟核苷酸序列2)1  GCTGCTATCA GTCATGAAGA CTATCCTGCT GATGAAGGTG ACCAGATCTC CAGTAATGAC61  AATCTGATCT TTGATGACTA TCGAGGGAAA GGGTGTGTCG ATGACAGCGG CTTTGTATAC121  AAGTTGGGAG AACGATTTTT CCCTGGGCAT TCCAACTGTC CATGTGTCTG TGCTCTAGAT181  GGACCTGTTT GCGACCAACC AGAATGCCCT AAAATTCACC CAAAGTGTAC TAAAGTGGAA241  CACAATGGAT GCTGTCCTGA GTGCAAAGAA GTAAAAAACT TCTGTGAATA TCACGGGAAA301  AATTACAAAA TCTTGGAGGA ATTTAAGCCC TCTCCATGTG AATGGTGTCG CTGTGAGCCC361  AGCAATGAAG TTCACTGTGT TGTAGCAGAC TGCGCAGTTC CTGAGTGTGT CAACCCAGTC421  TATGAACCAG AACAATGTTG TCCTGTCTGC AAAAATGGTC CAAACTGCTT TGCAGGAACG481  ACGATAATTC CAGCTGGCAT TGAAGTGAAA GTGGACGAAT GTAACATCTG TCATTGTCAC541  AACGGGGACT GGTGGAAGCC TGCTCAGTGT TCGAAACGTG AATGCCAAGG CAAGCAGACT601  GTGSEQ ID 51(INSP124克隆成熟多肽序列2)1  AAISHEDYPA DEGDQISSND NLIFDDYRGK GCVDDSGFVY KLGERFFPGH SNCPCVCALD61  GPVCDQPECP KIHPKCTKVE HNGCCPECKE VKNFCEYHGK NYKILEEFKP SPCEWCRCEP121  SNEVHCVVAD CAVPECVNPV YEPEQCCPVC KNGPNCFAGT TIIPAGIEVK VDECNICHCH181  NGDWWKPAQC SKRECQGKQT VSEQ ID 52(INSP124克隆成熟核苷酸序列3)1  GATGAAGGTG ACCAGATCTC CAGTAATGAC AATCTGATCT TTGATGACTA TCGAGGGAAA
61  GGGTGTGTCG ATGACAGCGG CTTTGTATAC AAGTTGGGAG AACGATTTTT CCCTGGGCAT121  TCCAACTGTC CATGTGTCTG TGCTCTAGAT GGACCTGTTT GCGACCAACC AGAATGCCCT181  AAAATTCACC CAAAGTGTAC TAAAGTGGAA CACAATGGAT GCTGTCCTGA GTGCAAAGAA241  GTAAAAAACT TCTGTGAATA TCACGGGAAA AATTACAAkA TCTTGGAGGA ATTTAAGCCC301  TCTCCATGTG AATGGTGTCG CTGTGAGCCC AGCAATGAAG TTCACTGTGT TGTAGCAGAC361  TGCGCAGTTC CTGAGTGTGT CAACCCAGTC TATGAACCAG AACAATGTTG TCCTGTCTGC421  AAAAATGGTC CAAACTGCTT TGCAGGAACG ACGATAATTC CAGCTGGCAT TGAAGTGAAA481  GTGGACGAAT GTAACATCTG TCATTGTCAC AACGGGGACT GGTGGAAGCC TGCTCAGTGT541  TCGAAACGTG AATGCCAAGG CAAGCAGACT GTGSEQ ID 53(INSP124克隆成熟多肽序列3)1  DEGDQISSND NLIFDDYRGK GCVDDSGFVY KLGERFFPGH SNCPCVCALD GPVCDQPECP61  KIHPKCTKVE HNGCCPECKE VKNFCEYHGK NYKILEEFKP SPCEWCRCEP SNEVHCVVAD121  CAVPECVNPV YEPEQCCPVC KNGPNCFAGT TIIPAGIEVK VDECNICHCH NGDWWKPAQC181  SKRECQGKQT VSEQ ID 54(INSP125克隆核苷酸序列)1  ATGGCTCTTC ATATTCATGA AGCTTGCATA CTTCTGTTGG TCATCCCTGG ATTGGTCACC61  TCTGCTGCTA TCAGTCATGA AGACTATCCT GCTGATGAAG ATGGACCTGT TTGCGACCAA121  CCAGAATGCC CTAAAATTCA CCCAAAGTGT ACTAAAGTGG AACACAATGG ATGCTGTCCT181  GAGTGCAAAG AAGTAAAAAA CTTCTGTGAA TATCACGGGA AAAATTACAA AATCTTGGAG241  GAATTTAAGC CCTCTCCATG TGAATGGTGT CGCTGTGAGC CCAGCAATGA AGTTCACTGT301  GTTGTAGCAG ACTGCGCAGT TCCTGAGTGT GTCAACCCAG TCTATGAACC AGAACAATGT361  TGTCCTGTCT GCAAAAATGG TCCAAACTGC TTTGCAGGAA CGACGATAAT TCCAGCTGGC421  ATTGAAGTGA AAGTGGACGA ATGTAACATC TGTCATTGTC ACAACGGGGA CTGGTGGAAG481  CCTGCTCAGT GTTCGAAACG TGAATGCCAA GGCAAGCAGA CTGTGSEQ ID 55(INSP125克隆多肽序列)1  MALHIHEACI LLLVIPGLVT SAAISHEDYP ADEDGPVCDQ PECPKIHPKC TKVEHNGCCP61  ECKEVKNFCE YHGKNYKILE EFKPSPCEWC RCEPSNEVHC VVADCAVPEC VNPVYEPEQC121  CPVCKNGPNC FAGTTIIPAG IEVKVDECNI CHCHNGDWWK PAQCSKRECQ GKQTVSEQ ID 56(INSP125克隆成熟核苷酸序列1)1  GCTATCAGTC ATGAAGACTA TCCTGCTGAT GAAGATGGAC CTGTTTGCGA CCAACCAGAA61  TGCCCTAAAA TTCACCCAAA GTGTACTAAA GTGGAACACA ATGGATGCTG TCCTGAGTGC121  AAAGAAGTAA AAAACTTCTG TGAATATCAC GGGAAAAATT ACAAAATCTT GGAGGAATTT181  AAGCCCTCTC CATGTGAATG GTGTCGCTGT GAGCCCAGCA ATGAAGTTCA CTGTGTTGTA241  GCAGACTGCG CAGTTCCTGA GTGTGTCAAC CCAGTCTATG AACCAGAACA ATGTTGTCCT301  GTCTGCAAAA ATGGTCCAAA CTGCTTTGCA GGAACGACGA TAATTCCAGC TGGCATTGAA361  GTGAAAGTGG ACGAATGTAA CATCTGTCAT TGTCACAACG GGGACTGGTG GAAGCCTGCT421  CAGTGTTCGA AACGTGAATG CCAAGGCAAG CAGACTGTG
SEQ ID 57(INSP125克隆成熟多肽序列1)1  AISHEDYPAD EDGPVCDQPE CPKIHPKCTK VEHNGCCPEC KEVKNFCEYH GKNYKILEEF61  KPSPCEWCRC EPSNEVHCVV ADCAVPECVN PVYEPEQCCP VCKNGPNCFA GTTIIPAGIE121  VKVDECNICH CHNGDWWKPA QCSKRECQGK QTVSEQ ID 58(INSP125克隆成熟核苷酸序列2)1  GCTGCTATCA GTCATGAAGA CTATCCTGCT GATGAAGATG GACCTGTTTG CGACCAACCA61  GAATGCCCTA AAATTCACCC AAAGTGTACT AAAGTGGAAC ACAATGGATG CTGTCCTGAG121  TGCAAAGAAG TAAAAAACTT CTGTGAATAT CACGGGAAAA ATTACAAAAT CTTGGAGGAA181  TTTAAGCCCT CTCCATGTGA ATGGTGTCGC TGTGAGCCCA GCAATGAAGT TCACTGTGTT241  GTAGCAGACT GCGCAGTTCC TGAGTGTGTC AACCCAGTCT ATGAACCAGA ACAATGTTGT301  CCTGTCTGCA AAAATGGTCC AAACTGCTTT GCAGGAACGA CGATAATTCC AGCTGGCATT361  GAAGTGAAAG TGGACGAATG TAACATCTGT CATTGTCACA ACGGGGACTG GTGGAAGCCT421  GCTCAGTGTT CGAAACGTGA ATGCCAAGGC AAGCAGACTG TGSEQ ID 59(INSP125克隆成熟多肽序列2)1  AAISHEDYPA DEDGPVCDQP ECPKIHPKCT KVEHNGCCPE CKEVKNFCEY HGKNYKILEE61  FKPSPCEWCR CEPSNEVHCV VADCAVPECV NPVYEPEQCC PVCKNGPNCF AGTTIIPAGI121  EVKVDECNIC HCHNGDWWKP AQCSKRECQG KQTVSEQ ID 60(INSP125克隆成熟核苷酸序列3)1  GATGAAGATG GACCTGTTTG CGACCAACCA GAATGCCCTA AAATTCACCC AAAGTGTACT61  AAAGTGGAAC ACAATGGATG CTGTCCTGAG TGCAAAGAAG TAAAAAACTT CTGTGAATAT121  CACGGGAAAA ATTACAAAAT CTTGGAGGAA TTTAAGCCCT CTCCATGTGA ATGGTGTCGC181  TGTGAGCCCA GCAATGAAGT TCACTGTGTT GTAGCAGACT GCGCAGTTCC TGAGTGTGTC241  AACCCAGTCT ATGAACCAGA ACAATGTTGT CCTGTCTGCA AAAATGGTCC AAACTGCTTT301  GCAGGAACGA CGATAATTCC AGCTGGCATT GAAGTGAAAG TGGACGAATG TAACATCTGT361  CATTGTCACA ACGGGGACTG GTGGAAGCCT GCTCAGTGTT CGAAACGTGA ATGCCAAGGC421  AAGCAGACTG TGSEQ ID 61(INSP125克隆成熟多肽序列3)1  DEDGPVCDQP ECPKIHPKCT KVEHNGCCPE CKEVKNFCEY HGKNYKILEE FKPSPCEWCR61  CEPSNEVHCV VADCAVPECV NPVYEPEQCC PVCKNGPNCF AGTTIIPAGI EVKVDECNIC121  HCHNGDWWKP AQCSKRECQG KQTV
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈