首页 / 专利库 / 遗传学 / 基因治疗 / Ob受体及诊断和治疗体重疾病的方法

Ob受体及诊断和治疗体重疾病的方法

阅读:811发布:2023-02-24

专利汇可以提供Ob受体及诊断和治疗体重疾病的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及编码Ob受体(ObR)-一种参与 哺乳动物 体重调节的受体蛋白-的核苷酸的发现、识别和鉴定。本发明涉及obR核苷酸,宿主细胞表达系统,ObR蛋白,融合蛋白,多肽和肽,所述受体的 抗体 ,能表达obR转基因的转基因动物或不能表达ObR的重组失效动物,所述受体的拮抗剂和激动剂,以及能调节obR基因表达或ObR活性的其它化合物,可将上述化合物用于体重 疾病 的诊断、药物筛选、临床试验监测和/或 治疗 ,所述体重疾病包括,但不限于肥胖、恶病质和厌食。,下面是Ob受体及诊断和治疗体重疾病的方法专利的具体信息内容。

1.一种分离的核酸分子,它含有obR基因的核苷酸序列。
2.一种分离的核酸分子,它编码一种Ob受体或其片段,该分子具有如 下的核苷酸序列:
编码图1所示基酸序列或由保藏于ATCC的保藏号69952的cDNA克 隆famj5312中所含cDNA编码的氨基酸序列的;或
编码图6所示氨基酸序列的;或
编码图3所示氨基酸序列,或由ATCC保藏的保藏号为69963的cDNA 克隆fahj5312d中所含的氨基酸序列,或由ATCC保藏的基因组克隆h-ObR -p87中所含的氨基酸序列的;或
能在严格条件下与(a)、(b)或(c)的核苷酸序列或其补体杂交的。
3.一种分离的核苷酸序列,它编码一种相当于Ob受体蛋白的胞外域、 跨膜域或胞质域的多肽,或编码Ob受体蛋白的一种其中缺失了跨膜域或胞 质域的缺失突变型。
4.一种分离的核苷酸序列,它编码一种嵌合蛋白,该蛋白包括与一种异 源多肽融合的权利要求3的多肽。
5.如权利要求4的分离的核苷酸序列,其中,所述异源多肽是一种免疫 球蛋白的恒定区。
6.一种核苷酸载体,含有权利要求1,2,3,4或5的核苷酸序列。
7.一种表达载体,含有权利要求1,2,3,4,或5的核苷酸序列, 该序列与一个核苷酸调控序列操作连接在一起,而该调控序列控制所述核苷 酸序列在宿主细胞内的表达。
8.如权利要求7的表达载体,其中,所述调控序列选自巨细胞病毒 hCMV立即早期基因、SV40腺病毒的早期或晚期启动子、lac系统、trp系 统、TAC系统、TRC系统、噬菌体λ的主要操纵子和启动子区、fd外被蛋 白的操纵区、3-磷酸甘油酸激酶的启动子、酸性磷酸酶的启动子和酵母α -交配因子的启动子。
9.一种用遗传工程方法产生的宿主细胞,它含有权利要求1,2,3, 4或5的核苷酸序列。
10.一种用遗传工程方法产生的宿主细胞,它含有权利要求1,2,3, 4或5的核苷酸序列,该核苷酸序列与一个核苷酸调控序列操作连接在一起, 而该调控序列控制所述核苷酸序列在宿主细胞中的表达。
11.如权利要求10的遗传工程宿主细细胞,其中,所述宿主细胞是成纤 维细胞、中国仓鼠卵(CHO)细胞、COS细胞、或VERO细胞、下丘脑细胞或 脉络丛细胞。
12.一种分离的Ob受体蛋白。
13.一种分离的Ob受体蛋白,具有图1,3或6所示的氨基酸序列或 由含于由ATCC保藏的保藏号为69952的cDNA克隆famj5312中的cDNA 编码的氨基酸序列,或由含于由ATCC保藏的保藏号为69963的cDNA克隆 fahj5312d中的cDNA编码的氨基酸序列,或由保藏于ATCC的基因组克隆h -obR-p87编码的氨基酸序列。
14.一种多肽,具有相当于Ob受体蛋白的胞外域、跨膜域或胞质域的 氨基酸序列,或Ob受体蛋白的一种其中的跨膜域或胞质域已缺失的缺失突 变型。
15.一种嵌合蛋白,含有与一种异源多肽融合的权利要求14的多肽。
16.如权利要求15的多肽,其中,所述异源多肽是一种免疫球蛋白的恒 定区。
17.一种抗体,它能免疫特异地结合权利要求12或13的Ob受体蛋白。
18.一种抗体,它能免疫特异地结合权利要求14的多肽。
19.一种诊断哺乳动物的体重疾病的方法,包括测定患者样品中ObR基 因的表达。
20.如权利要求19的方法,其中,所述表达是通过检测obR基因的 mRNA转录物而测定的。
21.如权利要求19的方法,其中,所述表达是通过测定obR基因产物 测定的。
22.一种诊断哺乳动物的体重疾病的方法,包括检测所述哺乳动物基因 组中所含的obR基因突变。
23.一种筛选可用于治疗体重疾病的化合物的方法,包括让一种化合物 接触一种能表达obR基因的培养的宿主细胞,并检测该obR基因表达方面的 变化,由该培养的细胞表达的obR基因产物的活性的变化,或宿主细胞蛋白 的酪氨酸磷酸化方面的变化,或该宿主细胞中离子流动方面的变化。
24.如权利要求23的方法,其中,所述obR基因的表达是通过测定该 obR基因的mRNA转录物而检测的。
25.如权利要求23的方法,其中,所述obR基因的表达是通过测定Ob 受体蛋白而检测的。
26.如权利要求23的方法,其中,宿主细胞的酪氨酸磷酸化是用一种抗 -磷酸酪氨酸抗体测定的。
27.一种治疗哺乳动物的低体重疾病的方法,包括对该哺乳动物给药一 种化合物,该化合物的用量足以抑制通过内源性Ob实现的Ob受体激活作 用。
28.如权利要求27的方法,其中,所述低体重疾病是厌食、恶病质、食 欲过盛、AIDS相关的消瘦或癌症相关的消瘦。
29.如权利要求27的方法,其中,所述化合物被释放至下丘脑或脉络丛 中。
30.如权利要求27的方法,其中,所述化合物是一种拮抗剂,它能与所 述Ob受体结合,并抑制该受体的激活作用。
31.如权利要求27的方法,其中,所述化合物能结合内源Ob,并中和 Ob活性。
32.如权利要求31的方法,其中,所述化合物是一种相当于Ob受体胞 外域的多肽或能与Ob结合的所述胞外域的一部分、一种缺少跨膜域或胞质 域的缺失突变型Ob受体蛋白、一种包括Ob受体的胞外域的嵌合型融合蛋 白、或能与Ob结合的所述胞外域的一部分,或一种与一种异源多肽融合的 跨膜缺失突变型。
33.如权利要求32的方法,其中,所述嵌合型融合蛋白的异源多肽是一 种免疫球蛋白的恒定区。
34.如权利要求32或33的方法,其中,所述化合物是通过对所述哺乳 动物给药能在该哺乳动物体内表达并分泌所述多肽或融合蛋白的遗传工程 细胞而释放至该哺乳动物体内的。
35.如权利要求31的方法,其中,所述化合物是一种抗独特型抗体,或 其Fab部分,它能模拟Ob受体的胞外域并中和内源Ob。
36.一种治疗哺乳动物的低体重疾病的方法,包括对哺乳动物给药一种 化合物,该化合物的用量足于抑制所述Ob受体在体内的表达。
37.如权利要求36的方法,其中,所述低体重疾病是厌食、恶病质、食 欲过盛、AIDS相关的消瘦或癌症相关的消瘦。
38.如权利要求36的方法,其中,所述化合物被释放至下丘脑或脉络丛 中。
39.如权利要求36的方法,其中所述化合物是一种反义寡核苷酸,它能 抑制编码所述Ob受体的mRNA转录物的翻译。
40.如权利要求36的方法,其中,所述化合物是一种核酶,它能抑制编 码所述Ob受体的mRNA转录物的翻译。
41.如权利要求36的方法,其中,所述化合物是一种寡核苷酸,它能与 所述Ob受体基因的调控区形成三重螺旋,并抑制转录。
42.如权利要求36的方法,其中,所述化合物是一种重组DNA结构, 它能通过定向同源重组使Ob受体基因或其调控区失活。
43.一种治疗哺乳动物的低体重疾病的方法,包括对该哺乳动物给药一 种化合物,该化合物的用量足于抑制由内源Ob与该Ob受体结合所诱导的信 号转导。
44.如权利要求43的方法,其中,所述低体重疾病是厌食、恶病质、食 欲过盛、AIDS相关的消瘦或癌症相关的消瘦。
45.如权利要求43的方法,其中,所述化合物被释放至下丘脑或脉络 丛。
46.如权利要求43的方法,其中,所述化合物能抑制Ob受体一诱导的 信号转导的胞内介体的活性。
47.如权利要求46的方法,其中,所述化合物能抑制一种酪氨酸激酶或 一种酪氨酸磷酸酶。
48.如权利要求43、44或45的方法,其中,所述化合物是一种受一个 调控序列控制的编码一个不能转导信号的Ob受体的寡核苷酸结构,所述调 控序列可指导该不能转导信号的受体在体内的靶细胞中的表达。
49.如权利要求48的方法,其中,所进寡核苷酸结构编码一种Ob受体 的不能转导信号的缺失突变型,其中,所述胞质域全部或部分缺失。
50.一种治疗哺乳动物肥胖的方法,包括对哺乳动物给药一种化合物, 该化合物的用量足以上调一种功能性Ob受体在该哺乳动物体内的表达。
51.如权利要求50的方法,其中,所述化合物被释放至下丘脑或脉络 丛。
52.如权利要求50或51的方法,其中,所述的哺乳动物表达缺陷型ob 受体而所述化合物包括一种受一个调控区控制的编码一种功能性Ob受体的 核苷酸结构,所述调控区能指导该功能性受体在哺乳动物的靶细胞中表达。
53.如权利要求50或51的方法,其中,所述哺乳动物能表达一种突变 型Ob受体,而所述化合物包括一种编码一种野生型Ob受体的核苷酸结构, 该结构可通过定向同源重组校正所述内源突变。
54.一种编码一种Ob受体的分离的核酸分子,该核酸分子具有编码图3 所示氨基酸序列的氨基酸1-868的核苷酸序列。
55.一种编码一种Ob受体的分离的核酸分子,该核酸分子具有编码图3 所示氨基酸序列的氨基酸1-965的核苷酸序列。
56.一种编码一种Ob受体的分离的核酸分子,该核酸分子具有编码图3 所示氨基酸序列的氨基酸1-1065的核苷酸序列。
57.一种编码一种Ob受体的分离的核酸分子,该核酸分子具有编码图3 所示氨基酸序列的氨基酸1-1115的核苷酸序列。
58.一种编码一种Ob受体的分离的核酸分子,它能诱导IL-6RE介导 的基因表达。
59.一种编码一种Ob受体的分离的核酸分子,它能诱导HRRE介导的 基因表达。
60.如权利要求54-57中任一项的分离的核酸分子,所述分子编码一 种氨基酸序列,该序列与图3所述氨基酸序列的相同性至少为90%。
61.如权利要求59的分离的核酸分子,该分子编码一种氨基酸序列,该 序列与图3所示氨基酸序列的氨基酸1-965的相同性至少为90%。
62.一种检验一种试剂是否是用于治疗体重疾病的候选试剂的方法,包 括:
(a)用所述试剂处理能表达一种编码ObR多肽的基因的真核细胞;和
(b)在有所述试剂的条件下测定所述真核细胞对所述基因的表达;
其中,如果在有所述试剂的条件下所述基因的表达不同于在没有所述试 剂的条件下所述真核细胞对所述基因的表达,则该试剂被确认为是治疗所述 体重疾病的候选试剂。
63.如权利要求62的方法,还包括在没有所述试剂的条件下测定所述 真核细胞对所述基因的表达。
64.一种检验一种试剂是否是用于治疗体重疾病的候选试剂的方法,包 括:
(a)用所述试剂处理能表达一种编码ObR多肽的基因的真核细胞;和
(b)测定所述试剂与所述真核细胞的结合;
其中,如果所述试剂与所述真核细胞的结合不同于所述试剂与不能表达 所述基因的对照真核细胞的结合,而该对照真核细胞在其它方面相同于该表 达所述基因的真核细胞,则该试剂被确认为是治疗体重疾病的候选试剂。
65.如权利要求64的方法,还包括测定所述试剂与所述对照真核细胞的 结合。
66.一种检验一种试剂是否是用于治疗体重疾病的候选试剂的方法,包 括:
(a)用所述试剂处理一种ObR多肽;和
(b)测定所述试剂与所述ObR多肽的结合;
其中,当所述试剂能选择性地结合所述ObR多肽时,则该试剂被确认 为是治疗体重疾病的候选试剂。
67.如权利要求62、64、或66的方法,其中,所述ObR多肽包括ObR 的胞质域。
68.如权利要求67的方法,其中,所述胞质域包括图3中的氨基酸861 -1165。
69.如权利要求67的方法,其中,所述ObR多肽还包括ObR的胞外域。
70.如权利要求66的方法,其中,所述ObR多肽与一种可检测的标记 物融合。
71.如权利要求62或64的方法,其中,所述真核细胞是脉络丛细胞。
72.如权利要求62或64的方法,其中,所述基因是一种重组基因。

说明书全文

发明涉及编码Ob受体(ObR)-一种参与哺乳动物体重调节的受体蛋 白-的核苷酸的发现、识别和鉴定。本发明包括obR核苷酸,宿主细胞表达 系统,ObR蛋白,融合蛋白,多肽和肽,所述受体的抗体,能表达obR转 基因的转基因动物或不能表达ObR的重组失效动物,所述受体的拮抗剂和激 动剂,以及能调节obR基因表达或ObR活性的其它化合物,可将上述化合 物用于体重疾病的诊断、药物筛选、临床试验监测和/或治疗,所述体重疾病 包括,但不限于肥胖、恶病质和厌食。

肥胖是最为流行的体重疾病,而且是西方世界最重要的营养疾病,据估 计,中年人群中的发病率为30-50%。诸如神经性厌食和神经性食欲过盛 的其它体重疾病使西方世界的女性群体的大约0.2%受到困扰,这种病同样 对健康造成严重威胁。另外,诸如厌食和恶病质(消瘦)的疾病还是诸如癌、 囊性纤维化和AIDS的其它疾病的突出特征。

被定义为相对瘦体重而言的体脂肪过剩的肥胖还可引起其它疾病。例 如,这种疾病决定着诸如冠状动脉病、中和糖尿病的疾病的高发病率(例 如,参见Nishina,P.M.等,1994,Metab.43:554-558)。肥胖不仅是一种 行为问题,即随意多食的结果。而且,观察到的肥胖与正常被试者的身体组 成差异是由于代谢和神经/代谢相互作用的差异造成的。这些差异似乎在一定 程度上归因于基因表达、和/或基因产物量或活性的不同(Friedman,J.M.等, 1991,Mammalian Gene 1:130-144)。

肥胖的流行病学有地证实了这种疾病具有遗传特征(Stunkard,1990, N.Eng.J.Med.322:1483)。Moll等报导,在很多群体中,肥胖似乎只受少数 基因位点的控制(Moll等,1991,Am.J.Hum.Gen.49:1243)。此外,人类双 生子研究可靠地提供了有关体重控制的丰富的遗传基础,估计的遗传力为80 -90%(Simopoulos,A.P和Childs B.,著,1989,见“肥胖的遗传变异和营 养”(“Genetic Variation and Nutrition in Obesity”),营养和糖尿病综述(World Review of Nutrition and Diabetes)63,S.Karger,Basel,Switzerland;Borjeson, M.,1976,Acta.Paediatr.Scand.65:279-287)。

对通过有意地系统性多吃而试图增重的非肥胖人体所做的研究发现,这 种人更难于以这种方式增加体重,而且仅能通过极高的热量摄入维持升高的 体重。相反,自发性肥胖个体以正常或中等偏高地热量摄入即可保持其肥胖 状态。另外,动物饲养中的普通经验是,不同品系的猪、等具有不同的肥 胖诱因。对人类肥胖和动物肥胖模型的遗传学研究表明,肥胖是由于食物摄 入、食物诱发的能量消耗和脂质与瘦体合成代谢之间的平衡的复杂的缺陷型 调节而造成的。

人类和其它物种的很多以肥胖为特征的遗传病,其较突出的症状通常还 包括畸形特征和智力迟钝。例如,大约在20,000个活产儿中就有一个受到 Praderwilli综合症(PWS)的困扰,并且会出现新生儿肌肉健康状况较差,面部 和生殖畸形,和总体上的肥胖。

除了PWS以外,还鉴定了包括肥胖症状在内的很多其它的多效性综合 症。这些综合症在遗传学上更为直接,并且似乎涉及常染色体隐性等位基 因。这些疾病尤其包括Ahlstroem、Carpenter、Bardet-Biedl、Cohen和 Morgagni-Stewart-Monel综合症。

现有很多供研究肥胖用的模型(例如,参见Bray,GA.,1992,脑研究进展 (Prog.Brain.Res.)93:333-341,和Bray,G.A.,1989,美国临床营养杂志 (Amer.J.Clin.Nutr.)5:891-902)。例如,业已鉴定了具有能导致包括肥胖症 状在内的综合症的突变的动物,并且尝试过将这种动物用作肥胖研究的模 型。迄今为止,用于遗传性肥胖研究的做过最深入的研究的动物模型是小鼠 模型。例如,为了回顾其发展,可参阅Friedman,J.M.等,1991,哺乳动物遗 传(Mamm.Gen.)1:130-144;Friedman,J.M.和Liebel,R.L,1992,细胞(Cell) 69:217-220)。

用小鼠所做研究已经证实,肥胖是一种具有很高遗传力的极为复杂的性 状。业已鉴定了发生在多个基因座的能导致肥胖表型的突变。其中包括常染 色体隐性突变肥胖(ob)、糖尿病(db)、多脂肪(fat)和矮胖(tub)。另外,已证实 发生于agouti(野鼠色)和脂肪(Adipose)(Ad)基因座上的常染色体显性突变 Yellow(黄色)会产生肥胖表型。

ob和db突变分别发生在6号和4号染色体上,但都能产生一种复杂的、 临床上类似的肥胖表型,其症状大约始于1月龄时,其症状包括多食、葡萄 糖和胰岛素代谢的极度异常、极差的体温调节能力和非战栗性产热,极度迟 钝和瘦肉体重的发育不全。这种复杂的表型使得人们难于确定其主要缺陷归 因于哪一种突变(Bray GA.,等,1989美国临床营养杂志(Amer.J.Clin.Nutr.) 5:891-902)。

使用分子遗传标记和经典遗传标记已将db基因定位于4号中等染色体 上(Friedman等,1991,Mamm.Gen.1:130-144)。小鼠基因组的一个片 段的突变图谱与人的一致表明,如果存在db基因的人类同系物的话,它很 可能位于人类染色体色体1p上。

所述ob基因及其人类同系物最近已被克隆(Zhang,Y等,1994,Nature 372:425-432)。该基因似乎能产生4.5kb的脂肪组织信使RNA,它含有 一个167个基酸的开放读框。该ob基因的推定氨基酸序列表明,它是一 种分泌蛋白,并因此作为来自脂肪组织的信号途径的一部分起作用,用于调 节体脂肪沉积的某些方面。另外,最近的研究已证实,当外源服用重组ob 蛋白(又被称作莱普亭(leptin))时,至少能够部分纠正ob小鼠所表现出的与肥 胖相关的表型(Pelleymounter,M.A.等,1995,Science 269:540-543; Halalas,J.L.等,1995,Science269:543-546;Campfield,L.A.等,1995, Science 269:546-549)。最新的研究已揭示,肥胖人和肥胖啮齿类动物 (ob/ob小鼠除外)其产生ob mRNA或蛋白的能力并无缺陷,而且其生产量通 常会高于瘦型个体(Maffei等,1995,自然医学分册(Nature Med.)1(11):1155 -116l;Considine等,1995,临床研究杂志(J.Clin invest.)95(6):2986 -2988;Lohnqvist等,1995,Nature Med.1:950-953;Hamilton等, 1995,Nature Med.1:953-956)。以上资料表明,对于人类肥胖来说, 对正常或较高含量Ob的耐受性可能比Ob产生不足更为重要。不过,被认为 是在下丘脑中表达的ob基因产物的受体仍难于捉摸。

由发生于fat或tub基因座的纯合突变所导致的肥胖,其发展比发生在 ob和db小鼠上的肥胖的发展缓慢(Coleman,D.L,和Eicher,E.M.,1990,遗 传学杂志(J.Heredity)81:424-427),tub肥胖的发展较fat动物的肥胖的发 展缓慢。tub肥胖表型的这种特征使得tub肥胖表型的发展与人类肥胖的发 展方式最为接近。不过,即使这样这些动物的肥胖表型仍可以超重为特征, 其中,这些动物的体重最终可接近正常小鼠体重的两倍。

业已将fat突变定位于小鼠8号染色体上,而tub突变被定位于小鼠7 号染色体上。据Naggert等报导,fat突变最近已得到鉴定(Naggert,J.K.,等, 1995,自然遗传学分册(Nature Genetics)10:135-141)。具体地讲,fat突变 好象是发生在编码羧肽酶(Cpe)E蛋白的Cpe基因座上的一种突变。Cpe是一 种参与包括胰岛素原在内的激素原加工的外肽酶。

agouti基因座上的显性Yellow突变,可导致一种多效性综合症,它会引 起中度成体发胖,黄色皮毛颜色肿瘤生成的高发病率(Herberg,L.和Coleman, D.L.,1977,新陈代谢(Metabolism)26:59),和体脂肪的异常解剖分布 (Coleman,D.L.,1978,Diabetologia 14:141-148)。这种突变是可导致体 重增加而不是下降的多效性突变的唯一已知例子。这种突变会导致一种在正 常情况下仅能在新生儿皮肤中出现的蛋白被广泛表达(Michaud,E.J.等, 1994,发育遗传学(Genes,Devel.)8:1463-1472)。

其它动物模型包括fa/fa(fatty)大鼠,它们与上文所述的ob/ob和db/db 小鼠有许多相似之处。有一点不同的是,尽管fa/fa大鼠对寒冷极为敏感,但 其非战栗性产热的能力是正常的。迟钝在保持fa/fa大鼠的肥胖方面所起的作 用似乎要大于其在相应的小鼠突变体上的作用。另外,诸如NZO小鼠和日 本KK小鼠的小鼠近交系是中度肥胖的。某些杂交小鼠,如Wellesley小鼠会 自发地发胖。另外,某些沙漠啮齿类动物,如刺毛小鼠在其天然生存环境下 不会发胖,但在用标准实验饲料饲养时会发胖。

通过物理或药理学方法已建立了被用作肥胖模型的动物。例如,大鼠腹 侧正中下丘脑(VMH)和腹外侧下丘脑(VLH)的双侧病变分别与多食症和过度 肥胖以及吞咽不能、恶病质和厌食相关。另外,业已证实给新生小鼠喂食谷 氨酸-单钠(MSG)或硫代葡萄糖金也会导致肥胖综合症。

上述每一种啮齿类模型都伴有糖类代谢的改变,类似于人类的Ⅱ型糖尿 病。例如,同类系的C57BL/KS ob和db小鼠均可能出现严重糖尿病,最终 使β细胞坏死和发生胰岛萎缩,造成相对的胰岛素缺乏,而同类系的 C57BL/6J ob和db小鼠会发生瞬时型耐胰岛素糖尿病,但最终会被β细胞胞 肥大所补偿,与人类的Ⅱ型糖尿病相似。

就ob和db小鼠而言,这些小鼠的表型与人类肥胖的相似之处在于,与 瘦型对照相比,突变型小鼠吃的更多,所消耗的能量更少(与胖人相似),而 不在于糖尿病的发展。这种表型与具有腹侧正中下丘脑病变的动物的表型也 十分相似,这表明两种突变均会干扰在中枢神经系统中对营养信息作出正确 综合或反应的能力。上述假设得到了异种共生实验结果的支持(Colemom, D.L.1973,糖尿病学(Diabetologica)9:294-298),该实验证明,ob小鼠缺乏 循环饱因子,而db小鼠能耐受ob因子的作用。由上述实验得出的结论是, 所述突变型小鼠的肥胖是由控制机体组成的假设的反馈机制的传入环和/或 整合中心的不同缺陷而造成的。

因此,总而言之,构成世界范围内的问题的肥胖,是一种复杂的、遗传 力很高的性状。由于这种病的严重性、流行性及潜在的异质性,导致迫切需 要鉴定参与体重控制的基因和基因产物。

本发明的一个目的是提供体重调节剂、提供诊断体重疾病的方法、提供 治疗这种疾病的方法和提供用于筛选可用于控制体重的物质的测试系统。

本发明涉及编码Ob受体(ObR)-一种参与哺乳动物体重控制的受体蛋 白-的核苷酸的发现、鉴别和鉴定。在本文中首次披露的ObR是一种跨膜蛋 白,它一次跨越细胞膜,并参与通过其天然配体Ob结合而触发的信号转导, 所述Ob又被称为莱普亭。ObR具有发现于Ⅰ型细胞因子受体家族的氨基酸 序列基序,并且与IL-6受体、G-CSF受体和LIF受体的gp130信号转 导成分最为相关。在本发明的工作实例中得到的结果表明,长形的ObR(主要 在下丘脑中表达)通过一种信号转导及转录活人蛋白(STAT)介导的途径转导 信号,它通常为IL-6型细胞因子受体,而存在于肥胖db/db小鼠中的主要 为天然存在的截短形式的或突变形式的ObR则不然。长形ObR可以介导 STAT蛋白的激活,并通过IL-6效应基因因子刺激转录。重组实验证明, 尽管ObR能以类似于IL-6型细胞因子受体的特异性介导胞内信号,但其 信号似乎独立于IL-6型细胞因子受体的gp130信号转导成分。

长度大约为5kb的ObR mRNA转录物是在脉络丛、下丘脑和包括和 肝在内的其它组织中表达的。本文所披露的鼠类短形编码894(图1)和893个 氨基酸的受体蛋白;而本文所披露的鼠类长形obR cDNA和人类obR cDNA 分别编码1162个氨基酸和1165个氨基酸的受体蛋白(分别见图6和图3)。所 述ObR有一个典型的疏前导序列(两种形式的鼠类ObR中的长度均约为22 个氨基酸,而在人类ObR中的长度大约为20个氨基酸);一个胞外域(在两 种形式的鼠类ObR中的长度均约为815个氨基酸,而在人类ObR中的长度 约为819个氨基酸);一个短的跨膜区(在两种形式的鼠类ObR和人类ObR 中的长度均大约为23个氨基酸);以及一个胞质域。编码鼠类ObR短形(图 1)和长形(图6)的转录物,在短形终止密码子5'末端的第15个密码子之前是 相同的,然后完全趋异,这暗示可能存在可变剪接。正如本文所披露的,由 894个氨基酸的鼠类短形obR cDNA编码的胞质域为34个氨基酸,而由鼠类 长形obR cDNA(302个氨基酸)编码的胞质域大约和由人类obR cDNA(303个 氨基酸)编码的胞质域的长度相同。由鼠类长形ObR和人类ObR推测出的氨 基酸序列在编码区范围内是同源的,并具有75%的同一性(图7)。

db小鼠的肥胖表型是由obR基因上的G→T颠换而造成的。这种颠换 可产生一个剪接供体位点,该位点又会导致db突变型中obR长型mRNA的 异常加工。在db突变型中,由这种异常加工所产生的长型mRNA,其编码 截短形式的并且与894个氨基酸的短形ObR相同的ObR蛋白。与短形ObR 类似,该突变型长形ObR缺乏大部分胞质结构域,而且不能通过STAT介导 的途径转导信号。在db/db小鼠体内所缺乏的信号感受态的长形ObR是保持 体重所必须的。

本发明涉及以下核苷酸,表达这些核苷酸的宿主细胞,和这些核苷酸的 表达产物:(a)编码哺乳动物ObR的核苷酸,包括人ObR及该obR基因产物; (b)编码ObR的各个部分的核苷酸,这些部分相应于其各个功能域,以及由 这些核苷酸序列所确定的多肽产物,包括,但不限于胞外域(ECD)、跨膜域 (TM)、和胞质域(CD);(c)编码ObR突变型的核苷酸,在该ObR突变型中, 所述功能域之一的全部或一部分缺失或改变了,以及由这些核苷酸序列所编 码的多肽,包括,但不限于其TM全部或部分缺失的可溶性受体,和其CD 全部或部分缺失的非功能性受体;(d)编码含有与另一种多肽融合的所述ObR 或其一个功能域(例如,胞外域)的融合蛋白的核苷酸。

本发明还涉及ObR的激动剂和拮抗剂,其中包括能与天然Ob竞争的小 分子、大分子、突变型Ob蛋白,以及抗体,和可用于抑制obR基因表达的 核苷酸序列(例如,反义和核酶分子,以及基因或调控序列置换结构)或用于 加强ObR基因表达的核苷酸序列(例如,能使ObR基因受一种强启动子系统 控制的表达结构),和能表达obR转基因的转基因动物或不能表达ObR的“失 效”动物。

另外,本发明涉及用于包括肥胖和恶病质的体重疾病的诊断评估、分型 和预测以及用于鉴定具有这种病的诱因的患者的方法和组合物。举例来说, 可将本发明的 obR核苷酸分子用作诊断性杂交探针或诊断性PCR分析的引 物,用于鉴定obR基因上的obR基因突变、等位变异和调控缺陷。本发明还 提供了用于实施上述方法的诊断试剂盒。

另外,本发明还涉及将所述obR基因和/或obR基因产物用于鉴定能调 节obR基因表达和/或obR基因活性,即作为其激动剂或拮抗剂的化合物的 方法。这种化合物可被用作体重控制剂,特别是用作治疗剂,治疗包括肥胖、 恶病质和厌食在内的体重和体重疾病。

再者,本发明涉及用于治疗包括肥胖、恶病质和厌食在食的体重疾病的 方法和组合物。所述方法和组合物可以调节obR基因的表达水平和/或obR 基因产物的活性水平。

本发明部分地基于在对很多细胞系和组织、对脑脉络丛中的对Ob有高 度亲和力的受体进行广泛研究之后得到的惊人发现,源于由脉络丛mRNA制 备的文库的obR cDNA的鉴定和克隆,其新型序列的鉴定,以与db基因图 谱相同的遗传间距将该obR基因作图于小鼠基因组上,和作为Ⅰ型细胞因子 受体家族的跨膜受体的ObR的鉴定。在包括下丘脑在内的其它组织中检测到 过obR mRNA。

主要在下丘脑中表达的全长ObR通过激活STAT蛋白并通过IL-6效 应基因因子刺激的转录进行信号转导。全长的长形ObR转导信号的能力与存 在于db/db小鼠中的天然存在的截短形式或突变形式的不同,后者不能介导 信号转导。本发明还包括缺少一个或另一个对于信号转输和诱导基因表达有 重要作用的胞内域的ObR类型。

                         A..定义

本文中,以下的术语无论是单数形式还是复数形式,均具有以下含义:

Ob:是指由Zhang等(1994,Nature 372:425-432)所披露的Ob蛋 白,它又被称作莱普亭(Leptin),该文献被全文收作本文的参考资料。Ob包 括与Ob同源或与ObR结合的分子。具有N-末端磷酸酶功能域的Ob 融合蛋白在本文中被称为AP-Ob融合蛋白,而具有C-末端碱性碱酸酶 功能域的Ob融合蛋白在本文中被称为Ob-AP融合蛋白。

obR核苷酸或编码序列:是指编码ObR蛋白、ObR蛋白的多肽或肽片 段、或ObR融合蛋白的核苷酸序列,obR核苷酸序列所涉及的DNA包括基 因组DNA(例如,obR基因)或cDNA或RNA。

ObR:是指Ob受体蛋白。ObR蛋白的多肽或肽片段被称为ObR多肽 或ObR肽。与一种不相关的蛋白融合的ObR、或ObR多肽或肽片段在本文 中被称为ObR融合蛋白。功能性ObR是指在体内或体外能以高亲合力结合 Ob的蛋白。

ECD:是指“胞外域”。

TM:是指“跨膜域”。

CD:是指“胞质域”。

                     Ⅳ..附图说明

图1.编码鼠类短型ObR蛋白(894个氨基酸)的鼠obR(短型)cDNA的核 苷酸序列(序列1)和推定的氨基酸序列(序列2)。短型鼠ObR的功能域有:信 号序列(氨基酸残基1至22左右),胞外域(大约为氨基酸残基23-837),穿 膜域(大约为氨基酸残基838-860),和胞质域(大约为氨基酸残基861- 894)。胞外域中潜在的N-连接的糖基化位点通过N-X-S和N-X- T基序第一个氨基酸上方的星号标出。字下划线表示Ⅰ型细胞因子受体家族 的保守基序。

图2A-2B.AP-Ob融合蛋白的结合研究。

图2A.用ObR cDNA转染的COS-7细胞,用1nM(稀释于DMEM+ 10%FBS)的各种AP或AP-Ob融合蛋白处理。柱体表示2次结合测定的 平均值,而误差柱表示两次测定之间的差异。1)未融合的AP,2)AP- Ob(小鼠),3)AP-Ob(小鼠)+100nM小鼠Ob,4)AP-Ob(小鼠)+100nM 人Ob,5)AP-Ob(人),6)Ob-AP(小鼠),7)AP-Ob(小鼠),与模拟转 染的(载体-无插入片段)COS-7细胞一起培养过。

图2B.AP-Ob与ObR相互作用的结合等温线和Scatchard分析。用各 种浓度的AP-Ob(小鼠)融合蛋白培养由obR cDNA转染过的COS-7细 胞。用插图表示Scatchard转化作用。

图3.编码人ObR蛋白的人obR cDNA的核苷酸序列(序列3)和推定的 氨基酸序列(序列4)。人ObR的功能域有:信号序列(从氨基酸残基1至20 左右),胞外域(大约为氨基酸残基21-839),跨膜域(大约为氨基酸残基840 -862),和胞质域(大约为氨基酸残基863-1165)。还示出了5′-非翻译核 苷酸序列。胞外域中潜在的N-连接糖基化位点用N-X-S和N-X- T基序的第一个氨基酸上方面的星号表示。字下划线表示Ⅰ型细胞因子受体 家族的保守基序。

图4.鼠ObR和人gp130胞外域的比较。通过在相应的氨基酸周围描影 表示相同的残基(黑体)和保守置换(灰体)。所示保守置换的定义同FASTA定 义。

图5.鼠ObR(图1所示的短型)与人ObR的比较。两种序列之间相同的 氨基酸用星号表示。

图6.编码鼠长型ObR蛋白的鼠长型obR cDNA的核苷酸序列和推定的 氨基酸序列。长型鼠ObR的功能域有:信号序列(从氨基酸残基1至22左右), 胞外域(大约为氨基酸残基23-837),跨膜域(大约为氨基酸残基838- 860),和胞质域(大约为氨基酸残基861-1162)。

图7.长型人与鼠ObR的比较。相同的残基和保守置换分别用2个星号 和1个星号表示。所示保守置换的定义同FASTA定义。缩略语:mobr-1, 鼠ObR长形;hobr,人类同系物。

图8.编码ObR的基因在小鼠4号染色体上的定位。

图9.db/db长型转录物上的106bp插入片段的核苷酸序列。示出了其在 推定的氨基酸序列中接近插入区的精确插入位置

图10.表示ObR-Ig对OB蛋白的中和作用的柱形图。用ObR cDNA 对COS细胞进行瞬时转染,并测定其结合0.5nM AP-OB的能力。柱1示 在无ObR-IgG融合蛋白时出现的高水平的特异性结合。柱2、3和4表 示用3种不同柱级分的纯化ObR IgG所产生的对结合作用的近乎完全的抑制 作用。

图11A.示意性地表示ObR蛋白的各种C-末端缺失突变型。在每种蛋 白的上方标出了其名称和预测长度(aa)。胞外域用斜线表示,跨膜域用黑体 表示,胞质域用白框表示。胞质域中酪氨酸残基的位置用水平线条表示 (Y986、Y1079和Y1141在人ObR与鼠ObR之间是保守的)。胞质域的长度 (aa)在每种蛋白的下面标出。

图11B.表示用IL-6RE-CAT表达结构(上图)或HRRE-CAT表达 结构(下图)和图11A的ObR缺失突变型进行CAT测试的结果的柱形图。用 编码所述ObR突变型和IL-6RE-CAT或HRRE-CAT的cDNA转染H -35细胞。用无血清的培养基本身(-)或含有鼠莱普亭的无血清培养基(+) 处理细胞的传代培养物24小时。测定CAT活性,并以用未处理过的对照培 养物得到的值的相对值形式表示。

图12.表示AP-Ob融合蛋白结合测试的结果的柱形图。用编码所示 ObR蛋白的cDNA转染COS-7细胞。48小时后,用1mM AP-Ob融合 蛋白培养细胞。柱体表示两次结合测试的平均值。误差柱表示两次测试的差 异。

图13A.各种突变型ObR蛋白的示意图。示出了酪氨酸残基986和1079 的位置。还标出了“框1”序列的位置。

图13B.表示HRRE-CAT诱导试验结果的柱形图。用HRRE-CAT 和OB-RY986F,OB-RY1079F或OB-R(框(box)1mt)的表达结构对H -35细胞进行共转染。用含有人莱普亭的无血清培养基处理细胞的传代培 养物24小时。测定CAT活性,并用未处理过的对照培养物得到的值的相对 值形式表示。

图14A.各种受体嵌合体的示意图。其中,阴影部分为源于G-CSFR 的部分;而非阴影部分源于ObR。标出了预测的框1、框2和框3基序的位 置。

图14B.表示IL-6RE-CAT(左图)和HRRE-CAT诱导测定结果的 柱形图。用所示受体(ObR,G-CSFR或嵌合体)的表达质粒和IL-6- RE-CAT或HREE-CAT表达结构对H-35进行共转染。用适当配体刺 激细胞,并按图11B所示实验的方法测定CAT活性。所有的值均以非处理 对照培养物的相对值形式表示(3-4次实验的平均值+标准误)。

图15A.表示HRRE-CAT诱导测定结果的柱形图。用HRRE-CAT 和所示量的ObR和OB-RΔ868-1165对H-35细胞进行共转染。用 莱普亭刺激细胞,并按照图11所示实验的方法测定CAT活性。所有的值均 以非处理培养物的相对值形式表示。

图15B.表示IL-6RE-CAT诱导测定结果的柱形图。用IL-6RE -CAT和标明量的ObR/G-CSFR和OB-RΔ868-1165对H-35细 胞进行共转染。用莱普亭刺激细胞,并按照图11所示实验的方法测定CAT 活性。所有的值均以非处理培养物的相对值形式表示。

图15C.表示IL-6RE-CAT诱导测定结果的柱形图。用IL-6RE -CAT和标示量的G-CSFR和G-CSFR(Δcyto)对H-35细胞进行共 转染。用G-CSF刺激细胞,用按照图11所示实验的方法测定CAT活性。 所有的值均以非处理培养物的相对值形式表示。

图15D.表示IL-6RE-CAT诱导测定结果的柱形图。用IL-6RE -CAT和标示量的G-CSFR/ObR和G-CSFR(Δcyto)对H-35细胞进 行共转染。用G-CSF刺激细胞,并按照图11所示实验的方法测定CAT活 性。所有的值均以非处理培养物的相对值形式表示。

图15E.表示IL-6RE-CAT诱导测定结果的柱形图。用IL-6RE -CAT和标示量的ObR和OB-RY1141F对H-35细胞进行共转染。用 莱普亭处理细胞,并按照图11所示实验的方法测定CAT活性。所有的值均 以非处理培养物的相对值形式表示。

                   Ⅴ.发明的详细说明

在本文中首次披露的ObR,是一种参与体重调节的新型受体蛋白。ObR 是一种跨膜蛋白,它从膜中跨越一次,并属于细胞因子受体的Ⅰ型家族,而 且,与IL-6受体、G-CSF受体和LIF受体的gp130信号转导成分的关 系最为密切。信号转导是由Ob与其受体的结合触发的。中和Ob、清除Ob 或干扰它与ObR的结合可导致体重增加。在脉络丛和包括下丘脑在内的其它 组织中检测到过ObRmRNA。

本发明涉及下列物质在体重疾病的诊断和治疗中的用途:obR核苷 酸,ObR蛋白和肽,以及ObR的抗体(例如,它可以作为ObR激动剂或拮 抗剂),能抑制受体活性或表达的拮抗剂,或能激发受体活性或加强其表达的 兴奋剂,所述疾病包括,但不限于包括人在内的动物的肥胖、恶病质和厌食。 患者体内ObR异常或ObR信号转导途径异常的诊断,有助于设计出合适的 处理或治疗方案。另外,可将obR核苷酸和ObR蛋白用于鉴定能有效治疗 受ObR调节的体重疾病的化合物。

具体地讲,在以下的各小节中所披露的本发明涉及ObR,相应于该ObR 的各功能域(例如,ECD、TM或CD)的多肽或肽,突变的、截短的或缺失 的ObR(例如,缺失了一个或几个功能域或其部分的ObR,如ΔTM和/或Δ CD),ObR融合蛋白(例如,ObR或ObR的一个诸如ECD的功能域与不相 关的蛋白或诸如免疫球蛋白恒定区的肽(即IgFc)融合),编码上述产物的核苷 酸序列,以及能产生上述ObR产物的宿主细胞表达系统。

本发明的特征还在于具有与一种特定氨基酸序列大致相同的氨基酸序 列的Ob受体。

“大致相同”是指一种多肽或核酸的序列与参考氨基酸或核酸的序列的 相同性至少为85%,优选地为90%,更优选地为95%或更高。对多肽而 言,参考多肽序列的长度通常至少为16个氨基酸,优选至少为20个氨基酸, 更优选至少为25个氨基酸,最好为35个氨基酸,对核酸而言,参考核酸序 列的长度通常至少为50个核苷酸,优选至少为60个核苷酸,更优选至少为 75个核苷酸,最好为110个核苷酸。

可以用序列分析软件测定序列同一性(例如,Wisconsin大学遗传学计算 机组的序列分析软件包生物技术中心,1710 University Avenue,Madison, WI 53705)。

当多肽序列与参考序列的相同性不到100%时,不相同的位点优选是, 但不一定是参考序列的保守置换。保守置换通常包括下列各组的内部置换: 甘氨酸和丙氨酸;缬氨酸、异亮氨酸和亮氨酸;天冬氨酸和谷氨酸;天冬酰 胺和谷氨酰胺;丝氨酸和苏氨酸;赖氨酸和精氨酸;以及苯丙氨酸和酪氨酸。

在说一种特定的多肽与特定长度的参考多肽有特定百分比的同一性 时,该百分相同性是相对该参考肽而言的。因此,与长度为100个氨基酸的 参考多肽的相同性为50%的一种肽,可以是一种50个氨基酸的多肽,它与 参考多肽的一个50个氨基酸长的部分完全相同。也可以是长度为100个氨 基酸的多肽,它与参考多肽整个长度的相同性为50%。当然,有很多其它 多肽都满足同一标准。

本发明还涉及ObR的抗体和抗特应抗体(包括Fab片段)、拮抗剂和激动 剂,以及能抑制ObR基因表达的化合物或核苷酸结构(转录因子抑制剂,反 义和核酶分子,或基因或调控序列置换结构)或能促进ObR表达的化合物或 核苷酸结构(例如,其obR编码序列可操纵地与诸如启动子、启动子/增强子 之类的表达控制因子结合的表达结构)。本发明还涉及遗传工程产生的宿主细 胞和动物,使其能表达人ObR(或其突变型)或抑制或“剔除”该动物内源ObR 的表达。

可将ObR蛋白或肽、ObR融合蛋白、obR核苷酸序列、抗体、拮抗剂 和激动剂用于检测突变型ObR或表达不正确的ObR,以便诊断诸如肥胖、 厌食或恶病质的体重疾病。可将ObR蛋白或肽、ObR融合蛋白、obR核苷 酸序列、宿主细胞表达系统、抗体、拮抗剂、激动剂和遗传工程产生的细胞 和动物用于筛选能有效治疗上述体重疾病的药物。使用遗传工程宿主细胞和 /或动物的优点是,该系统不仅可以鉴定能与ObR的ECD结合的化合物,而 且还能鉴定可影响由活化ObR而转导的信号的化合物。

最后,可将ObR蛋白产物(尤其是可溶性衍生物,如相应于ObR ECD 的肽或缺少TM域的截短了的多肽)和融合蛋白产物(尤其是ObR-Ig融合蛋 白,即:ObR或ObR的一个诸如ECD、ΔTM的功能域与IgFc的融合体), 抗体和抗特应抗体(包括Fab片段)、拮抗剂或激动剂(包括能调节信号转导的 化合物,它可以作用于ObR信号转导途径的下游目标)用于治疗上述疾病。 例如,服用有效量的可溶性ObR ECD,能模拟ObR ECD的ΔTM ObR或 ECD-IgFc融合蛋白或抗特应抗体(或其Fab),可以“清除”或“中和”内 源Ob,并抑制或减弱其结合和受体激活,导致体重增加。可将编码上述ObR 产物的核苷酸结构用于通过遗传工程方法产生宿主细胞,以便在体内表达这 种ObR产物;这种遗传工程细胞在体内像“生物反应器”一样起作用,源源 不断地提供能“清除”或中和Ob的ObR、ObR肽、可溶性ECD或ΔTM 或ObR融合蛋白。可将编码功能性ObR、突变型ObR的核苷酸结构,以及 反义和核酶分子用于“基因治疗”方法中,用于在治疗体重疾病时调节ObR 表达和/或活性。因此,本发明还涉及治疗体重疾病的药物制剂和方法。

本发明在某种程度上基于以下惊人发现:Ob的高亲和力受体能以很高 浓度在脉络丛中表达。这一发现使得用一种新型碱性磷酸酶/Ob(AP-Ob) 融合蛋白对细胞和组织进行原位染色成为可能。用未标记的Ob所做的竞争 研究证实,所观察到的原位结合是对Ob特异的。用AP-Ob融合蛋白对鼠 obR cDNA进行鉴定,以筛选由鼠脉络丛mRNA合成并瞬时转染到哺乳动物 COS细胞中的cDNA表达文库。鉴定了一个能表达Ob的短形高亲和力受体 的克隆,famj 5312,并进行了测序。序列分析显示,所述obR cDNA和预 测的氨基酸序列是含有表明该ObR是受体蛋白Ⅰ型家族一员的氨基酸片段的 新型序列。本文所披露的作图研究表明,所述obR基因位于db位点。本文 所提供的资料还进一步表明,该db基因是一种突变型obR基因,它可以表 达一种编码与短型鼠ObR相同的蛋白的异常剪接的obR长型信息。将 famj5312序列用于筛选人胎脑cDNA文库,结果鉴定了本文所披露的人obR cDNA克隆fahj5312d。本文中还披露了将根据人cDNA序列设计的寡核苷 酸引物用于克隆人基因组DNA克隆h-ObR-p87。采用根据人ObR胞 质域设计的简并引物由鼠下丘脑克隆了编码鼠长型ObR的mRNA。

在以下各小节中将对本发明做更详细地说明。

                      A..ObR基因

在图1和6中分别示出了鼠短型(长度为894个氨基酸)和鼠长型ObR的 cDNA序列(序列1)和推定的氨基酸序列(序列2)。鼠短型和长型ObR的信号 序列在图1和6中分别从氨基酸残基1延伸到22左右;两种型式的鼠ObR 的胞外域在图1和6中大约从氨基酸残基23延伸至837;两种型式的鼠ObR 的跨膜域在图1和6中大约从氨基酸残基838延伸至860;鼠短型ObR的胞 质域在图1中大约从氨基酸残基861延伸至894,而长形ObR的胞质域在图 6中从氨基酸残基861延伸至1162。至少已鉴定到一种另类短型鼠ObR, 它比图1所示序列少一个氨基酸(即:893个氨基酸)。其C-末端序列与图1 所示序列的差别在于,没有残基890-893(RTDTL);而第二种短形ObR的 残基890-893的序列为:IMWI。

人ObR的cDNA序列(序列3)和推定的氨基酸序列(序列4)如图3所示。 人ObR信号序列在图3中从氨基酸残基1延伸至20左右;人ObR的胞外域 在图3中大约从氨基酸残基21延伸至839;人ObR的跨膜域在图3中大约 为氨基酸残基840-862;而人ObR的胞质域在图3中大约从氨基酸残基 863延伸至1165。将源于人cDNA克隆的序列用于设计引物,在下文所述的 实施例中用这些引物克隆人基因组obR,h-obR-p87。

在下文的实施例中所提供的资料表明,obR基因位于db位点,而db 基因是一种突变型obR基因,它能以异常剪接的转录物形式在db小鼠体内 表达,所产生的mRNA种在其编码ObR的胞质域的部分具有一个大约为106 个核苷酸(nt)的插入片段。该插入片段能产生一种突变,由此所产生的转录物 编码一种超前截短了的长型,其与鼠短型ObR相同。

本发明的obR核苷酸序列包括:(a)如图1、3或6所示的DNA序列, 或含于由美国典型培养物保藏中心(ATCC)保存的大肠杆菌531284F3菌株中 的cDNA克隆famj5312上的或含于由ATCC保存的大肠杆菌h-obRD菌株 中的cDNA克隆fahj5312d上的或含于由ATCC保存的人基因组克隆h-obR -p87上的核苷酸序列;(b)编码图1、3或6所示氨基酸序列的或由ATCC 保存的cDNA克隆famj5312或由ATCC保存的cDNA克隆fahj5312d编码的 或含于由ATCC保存的人基因组克隆h-obR-p87中的氨基酸序列的核苷 酸序列;(c)能在高度严格的条件下与图1、3或6所示DNA序列或含于由 ATCC保存的cDNA克隆famj5312中的或含于由ATCC保存的cDNA克隆 fahj5312d中的或含于由ATCC保存的人基因组克隆h-obR-p87中的DNA 序列的补体(complement)杂交,并编码一种功能上等同的基因产物的一切核 苷酸序列,例如,在65℃下,在0.5M NaHPO4、7%十二烷基硫酸钠(SDS) 中与滤膜结合的DNA杂交,并在68℃下在0.1×SSC/0.1%SDS中洗涤 (Ausubel F.M.等著,1989,Current Protocols in Molecular Biology,Vol.I, Green Rublishing Asso-ciaties,Inc.,and John Wiley & Sons Inc.,New York, 见P.2.10.3);和(d)能在不太严格的条件下,例如,在诸如42℃下在0.2× SSC/0.1%SDS中洗涤的中等严格的条件下(Ausubel等,1989,同上),与 编码图1、3或6所示的氨基酸序列的DNA序列或含于由ATCC保存的 cDNA克隆famj5312中的或含于由ATCC保存的cDNA克隆fahj5312d中的 或含于由ATCC保存的人基因组克隆h-ObR-p87中的DNA序列的补体 杂交,并且还能编码一种功能上等同的ObR基因产物的一切核苷酸序列。 ObR的功能性等同物包括存在于其它物种的天然生成的ObR,和天然生成 的或遗传工程合成的突变型ObR。本发明还包括序列(a)至(d)的简并变体。

本发明还包括优选为DNA分子的核酸分子,它能与前一段落中的核苷 酸序列(a)至(d)杂交,因此,也是所述核苷酸序列的补体。如上文所述,该杂 交条件可以是高度严格的或不太严格的。在所述核酸分子是脱寡核苷酸 (“寡聚体”)的场合下,高度严格的条件是指诸如在6×SSC/0.05%焦磷酸 钠中在37℃(适用于14个碱基的寡聚体)、48℃(适用于17个碱基的寡聚 体)、55℃(适用于20个碱基的寡聚体)和60℃(适用于23个酰基的寡聚体) 的温度下洗涤。上述核酸分子可以编码obR后义分子或起到该分子的作用, 例如,用于obR基因调节(在obR基因核酸序列的扩增反应中编码和/或作为 反义引物)。就obR基因调节而言,上述方法可用于调节诸如恶病质和/或厌 食的疾病。而且,可将上述序列用作核酶和/或三螺旋序列的部分,还可用于 obR基因调节。另外,可以把上述分子用作诊断方法的要素,以便能检测出 决定导致诸如肥胖的体重疾病的特定obR等位基因的存在。

除了上述obR核苷酸序列之外,用本领域众所周知的分子生物学方法, 无须过多的实验即可鉴定并顺利分离到存在于同一物种中的全长obR cDNA 或其因序列和/或存在于其它物种中的所述obR基因的同系物。在相关物种中 鉴定的ObR同系物可用于开发与人类关系更密切的动物模型系统,用于药物 的发现。例如,由源于感兴趣的生物的脉络丛mRNA合成的cDNA表达文 库,可以用源于同一物种的标记Ob,如AP-Ob融合蛋白进行筛选。另外, 可以用本文所披露的核苷酸作为杂交或扩增探针,通过杂交筛选源于所述感 兴趣的生物的这种cDNA文库或基因组DNA文库。而且,还可以通过类似 方法鉴定编码与所述ObR基因产物的一个或几个功能域有高度同源性的蛋 白的位于所述基因组中的其它遗传基因座上的基因。就cDNA文库而言,上 述筛选方法可以鉴定源于相同或不同物种的可变剪接的转录物的克隆。

筛选可以用双重滤膜通过滤膜杂交进行。标记过的探针可至少含有图 1、3或6所示obR核苷酸序列的至少15-30个碱基对。当cDNA文库源 于不同于产生标记序列的生物的生物类型时,所采用的杂交洗涤条件应当是 低严格性的。对于人obR同系物的克隆来说,采用诸如鼠obR探针的探针时, 杂交可以在诸如65℃的温度、在Church′s缓冲液(7%SDS,250mM NaHPO4,2 μMEDTA,1%BSA)中的条件下进行。洗涤可以这样进行: 在65℃下在2×SSC,0.1%SDS中洗涤,然后在65℃下在0.1×SSC, 0.1%SDS中洗涤。

低严格条件为本领域技术人员所熟知,并可根据产生所述文库和标记序 列的具体生物可预见地加以改变。例如,有关这些条件的指南可以参阅以下 书目:Sambrook等,1989,分子克隆实验手册,冷泉港出版社(Molecular Cloning,A Laboratory Manual,Cold Springs Harbor Press,N.Y);和Ausubel 等,1989,分子生物学通用方法(Current Protocols in Molecular Biology, Green Publishing Associates and Wiley Interscience,N.Y)。

另外,同样可以用适度严格的条件,将标记的 obR核苷酸探针用于筛选 源于感兴趣的生物的基因组文库。人基因组克隆的识别和鉴定有助于设计出 治疗人类患者的体重疾病的诊断性试验和临床方案。例如,可将源于人基因 的内含子/外显子边界附近部位的序列用来设计引物,将该引物用于扩增试验 中,检测外显子、内含子、剪接位点(例如,剪接受体和/或供体位点)等中可 用于诊断的突变。

另外,通过使用根据本文所披露的obR基因产物中的氨基酸序列所设计 的简并寡核苷酸引物库进行的PCR,可以从感兴趣的生物的核酸中分离obR 基因同系物。反应模板可以是通过mRNA的逆转录而获得的cDNA,例如, 所述mRNA可以从已知的或猜测的能表达obR基因的等位基因的人或非人 细胞系或诸如脉络丛的组织中制备。

可以对PCR产物进行亚克隆并测序,以确保所扩增的序列是obR基因 的序列。然后可将该PCR片段用于通过各种方法分离全长cDNA克隆。例 如,可以标记所扩增的片段,并将其用于筛选cDNA文库,如,噬菌体cDNA 文库。另外,可通过筛选基因组文库的方式将标记的片段用于分离基因组克 隆。

还可以利用PCR技术分离全长cDNA序列。例如,可以用标准方法从 合适的细胞或组织来源(即:已知的或猜测的能表达obR基因的来源,例如 脉络丛或脑组织)中分离RNA。对该RNA实施逆转录反应,用对所述扩增 片段的大多数(most)5′-末端特异的寡核苷酸引物引发第一股链的合成。然后 通过标准的末端转移酶反应用嘌呤对所产生的RNA/DNA杂合体加尾,可 以用RNAase H消化该杂合体,再通过聚胞苷酸(poly-C)引物引发第二股 链的合成。因此,很容易分离扩增片段上游的cDNA序列。为了回顾可以采 用的克隆方法,可以参阅诸如Sambrook等的著述(1989,同上)。

另外,可将obR基因序列用于分离突变型obR基因的等位基因。可以 从已知的或怀疑其具有造成诸如肥胖、恶病质或厌食的体重疾病基因型的个 体中分离上述突变型等位基因。然后可将突变型等位基因和突变型等位基因 产物用在下文所述的治疗和诊断系统中。另外,可将这种ObR基因序列用于 检测可能会影响体重的obR基因调节(例如,启动子或启动子/增强子)缺陷。

例如,可以用为本领域技术人员所熟知的PCR方法分离一种突变型obR 基因的cDNA。在这种场合下,可以用如下方法合成第一条cDNA链:让 Oligo-dT(寡聚脱氧胸苷酸)寡核苷酸与自推测其携带突变型obR等位基因 的个体的已知的或怀疑能表达该基因的组织中分离的mRNA杂交,并用逆转 录酶延长这条新链。接着用能特异性地与正常基因的5'末端杂交的寡核苷酸 合成第二条cDNA链。然后用本领域技术人员熟知的方法,采用上述两种引 物通过PCR扩增所述产物,克隆到适当载体上,并进行DNA序列分析。通 过比较突变型obR等位基因和正常obR等位基因的DNA序列,可以查明决 定突变型obR基因产物的功能丧失或改变的突变。

另外,可以用获自被怀疑或已知其带有突变型obR等位基因的个体的 DNA构建基因组文库,或用获自已知的或怀疑能表达该突变型obR等位基 因的组织的RNA构建cDNA文库。然后可以对正常的obR基因或其任何适 当的片段进行标记,并用作探针,在上述文库中鉴定相关的突变型ObR等位 基因。然后可以纯化含有该突变型ObR基因序列的克隆,并用本领域技术人 员所熟知的方法进行序列分析。

另外,可以用cDNA构建表达文库,该cDNA是用诸如从被怀疑或已知 其携带突变型ObR等位基因的个体的已知的或被怀疑能表达这种突变型等 位基因的组织中分离的RNA合成的。如下文的5.3.节所述,由所述推测的突 变型组织以所述方法制备的基因产物,可以表达并用标准的抗体筛选技术结 合抗正常obR基因的抗体进行筛选(例如,筛选技术可以参阅Harlow,E.和 Lane著,1988,“抗体:实施手册”,冷泉港出版社(“Antibodies:A Laboratory Manual”,Cold Spring Harbor Press,Cold Spring Harbor))。另外, 可以用诸如AP-Ob或Ob-AP融合蛋白的标记的Ob融合蛋白进行筛选 以实现所述筛选。对于能导致表达的基因产物具有改变了的功能的obR突变 来说(例如,由错义突变或移码突变所导致的改变),有一类ObR的多克隆抗 体可以与突变型ObR基因产物发生交叉反应。可以用本领域技术人员所熟知 的方法纯化通过其与上述标记抗体的反应检测的基因文库克隆并进行序列 分析。

本发明还涉及编码突变型ObR、ObR的肽片段、截短的ObR和ObR 融合蛋白的核苷酸序列。其中,包括,但不限于编码以下产物的核苷酸序列: 在下文的5.2节中所披露的突变型ObR;相应于ObR的ECD、TM和/或 CD域或这些功能域的部分的多肽或肽;其中缺失了所述功能域中的一个或 两个的截短了的ObR,例如,缺少TM或同时缺少TM和CD区的可溶性 ObR,或缺少全部或一部分CD区的截短了的、无功能的ObR。编码融合蛋 白的核苷酸可以包括,但不限于编码以下产物的核苷酸:全长ObR,截短的 ObR或与不相关的蛋白或肽融合的ObR肽片段,例如,将ObR ECD固定在 细胞膜上的跨膜序列;能提高血液中所产生的融合蛋白(如ObR-Ig)的稳定 性和半衰期的IgFc;或可以用作标记的酶,荧光蛋白,发光蛋白。

本发明还涉及(a)含有上述ObR编码序列和/或其补体(即:反义链)中任 一个的DNA载体;(b)含有上述ObR编码序列中任一个的DNA表达载体, 所述ObR编码序列可操纵地与能指导该序列表达的调节元件连接;和(c)通 过遗传工程方法产生的含有上述ObR编码序列中任一个的宿主细胞,该编码 序列可操纵地与能指导其在该宿主细胞中表达的调节元件连接。在本文中, 调节元件包括,但不限于诱导型和非诱导型启动子、增强子、操纵子以及本 领域技术人员所知的能启动或调节表达的其它元件。所述调节因子包括,但 不限于巨细胞病毒hCMV立即早期基因,SV40腺病毒的早期或晚期启动 子,lac系统,trp系统,TAC系统,TRC系统,噬菌体A的主要操纵子和 启动子区,fd外壳蛋白的操纵区,3-磷酸甘油酸激酶的启动子,酸性磷酸 酶的启动子,以及酵母α-交配因子的启动子。

                  B..ObR蛋白和多肽

可以制备ObR蛋白,ObR的多肽和肽片段,ObR的突变、截短或缺失 的型式和/或ObR融合蛋白,将其用于各种目的,包括,但不限于制备抗体, 作为诊断试验中的试剂,鉴定参与体重调节的其它细胞基因产物,用作筛选 能用于治疗体重疾病的化合物的试验的试剂,并用作可用于治疗与ObR相关 的体重疾病的药用制剂。

图1和6分别表示鼠短型和长型ObR蛋白。在上述两型式的ObR中, 信号序列从氨基酸1延伸到氨基酸22左右;ECD大约从氨基酸23延伸至 837;而TM大约从氨基酸838延伸至860。在短型鼠ObR上,CD大约从 氨基酸861延伸至894(或在第二种短型中延伸至893);而在其长型上大约从 氨基酸861延伸至1162。图3表示人ObR的氨基酸序列。其信号序列从氨 基酸残基1延伸至20左右;ECD大约从氨基酸残基21延伸至839;TM 大约从氨基酸残基840延伸862;而CD大约从氨基酸残基863延伸至1165。

ObR序列始于一个甲硫氨酸,它在DNA序列中的位置与一个翻译起始 位点一致,其后是一个典型的肽分泌的疏水信号序列。以上两种型式的鼠 ObR的预测的成熟胞外域是一样的,并且长度均为815个氨基酸,而预测的 人ObR的ECD长度为819个氨基酸。ObR胞外域具有很多Ⅰ型细胞因子受 体家族的特征(其综述见Heldin,1995,细胞(Cell)80:213-223),并且 与IL-6受体(Taga等,1989,Cell 58:573-581)、G-CSF受体 (Fukunaga等,1990,Cell 61:341-350)和LIF受体(Gearing等,1991, 科学(Science)255:1434-1437)的gp130信号转导因子的关系最为密切。 事实上,本文所提供的资料表明,长型ObR通过激活STAT蛋白-由IL-6 型细胞因子受体家族介导的信号转导途径的标志-转导信号。

在图4中对鼠ObR和gp130之间的胞外域进行了比较。尽管这两种分 子之间总体上的氨基酸序列同一性较低(24%),但所保留的有特色的半胱氨 酸残基、Trp-Ser-X-Trp-Ser基序(图1所示鼠序列的氨基酸残基317 -321和620-624;图3所示人序列的氨基酸残基319-323和622-626)、 和这一类蛋白中其它残基的保守(其综述见Kishi-moto等,1994,Cell 76: 253-262)都是显而易见的。鼠短型ObR和人ObR的氨基酸序列在鼠短型 ObR的长度范围内是高度同源的(图5)。事实上,鼠短型和人克隆的推定氨 基酸序列之间的同一性(78%)等于或大于在对鼠和人的gp130型式(Saito 等,1992,免疫学杂志(J.Immunol.)148:4066-4071)、LIF受体(Gough 等,1988,美国科学院院刊(Proc.Natl.Acad.Sci.)85:2623-2627)和G- CSF受体(Fukanaga等,1990,Proc.Natl.Acad.Sci.87:8702-8706)进行比 较时所观察到的同一性。类似地,由鼠和人长型ObR推定的氨基酸序列在其 编码区长度范围内是同源的,并具有75%的相同性(图7)。

在鼠和人ObR的ECD中均存在潜在的N-连接的糖基化位点(即:氨 基酸序列基序N-X-S或N-X-T)。在图1和6所示的鼠ECD序列 中,至少可以确认20个潜在的N-连接的糖基化位点(参见始于下列氨基酸 残基的三肽基序:23、41、56、73、81、98、187、206、276、347、 397、433、516、624、659、670、688、697、728、和750);而在 图3所示的人ObR ECD序列中至少可确认16个潜在的N-连接的糖基化位 点(参见始于下列氨基酸残基的三肽基序:41、56、73、98、187、 275、345、431、514、622、657、668、686、695、698和726)。 在鼠和人ObR胞外域后面的是23个氨基酸的预测跨膜域。

图1所示的鼠cDNA编码一种短的胞质域(34个氨基酸)。鼠ObR胞质 域的氨基酸5-24(即:图1中的氨基酸残基865-884)与LIF受体的胞内 域的近膜序列有47%的同一性,并含有一个box1 Jak相互作用序列(Navazaki 等,1994,Proc.Natl.Acad.Sci.91:2285-2289)。有趣的是,由所述cDNA 编码的一种蛋白具有长于鼠短型ObR胞内域的胞内域。虽然所述鼠短型和人 胞内域在直到鼠短型ObR的最后5个残基的范围内都是高度保守的,但人的 胞内域一直延续到类似于gp130的长度。所述鼠短型克隆和人克隆的核苷酸 序列在鼠短型ObR的整个编码区范围内也是极其相似的,但随后在接近鼠短 型ObR终止密码子处完全趋异。

本文所披露的鼠短型cDNA的短胞质域具有几种Ⅰ型细胞因子受体多肽 的特征(其综述见Kishimoto等,1994,Cell 76:253-262)。不过,本文 所报导的结果表明,短型ObR不能通过STAT途径启动信号转导,该途径是 由长型ObR介导的。事实上,所述与ObR具有很高同源性的3个受体均具 有在胞内信号转导中有重要作用的长的胞质域。这加大了所分离的鼠短形 ObR克隆是嵌合体或编码一种罕见的、不代表脉络丛中的主要表达型式的异 常剪接型式的可能性。为了解决这一问题,选择8个在文库筛选中分别鉴定 的鼠克隆,并用制备到终止密码子的序列3'的引物通过PCR扩增每一个克隆 (各自为有150个克隆的亚集合体)。结果表明,所有8个克隆均含有相同的 3′非翻译序列。另外,对5个分别分离到的克隆的C-末端测序,均表现出 有相同的终止密码子。最后,用从不同于产生所述cDNA的小鼠品系 (C57B1/KsJ)的脉络丛中提取的全RNA进行逆转录PCR,产生了在同一位点 上含有终止密码子的相同的PCR产物。上述结果表明,所分离到的鼠短型克 隆既非嵌合型式,亦非罕见的异常剪接型式,而很可能是该受体在鼠脉络丛 中的主要型式。本文所提供的资料表明,小鼠ObR的可变剪接的型式具有较 长的胞内域(长型);即:野生型obR基因以两种型式表达:一种mRNA转录 物具有一个大约为100个核苷酸的插入片段,它编码具有一种短的胞质域的 ObR;另一种mRNA转录物编码具有一种长的胞质域的ObR,该胞质域与 人的CD同源。

图6所示的鼠cDNA克隆编码长型ObR。如上文所述,编码鼠长型ObR 的ECD和TM的氨基酸与编码鼠短型的氨基酸相同。不过,由鼠长型cDNA 编码的胞质域(302个氨基酸)的长度大致与由人ObR cDNA编码的胞质域相 同。与obR短型不同的是,由鼠长型的核苷酸序列编码的obR直到整个胞质 域的范围内都是与人ObR相似的。

本文所提供的资料还表明,db是长型鼠obR基因的一种突变型。db 突变型能表达一种异常剪接的转录物,在该转录物的编码CD的mRNA部分 含有一个大约为106个核苷酸的插入片段。虽然该转录物是长的,但由插入 序列形成的突变所产生的转录物编码一种截短的ObR蛋白,该蛋白与所述短 型ObR相同,因此,它缺少大部分CD。本文所提供的资料表明,与长型 ObR不同,短型ObR,即:与db/db小鼠的肥胖表型相关的受体型式不能转 导由STAT途径介导的信号。因此,好像是信号转导感受态的长型ObR积极 参与了体重的调节和保持。

总之,已鉴定了几种主要ObR型式的信使RNA。存在于大部分组织中 的优势ObR mRNA能编码一种具有一个由34个氨基酸残基组成的短的胞质 域的跨膜蛋白,它被称为短型。在下丘脑中存在一种obRmRNA,它所编码 的蛋白具有与短型相同的胞外域,但有一个302个残基长的胞质域,它被称 为长型。所述db突变能导致长型转录物的异常剪接产物的产生,从而形成 一种具有截短了的胞质域的蛋白。有趣的是,在db/db小鼠中长型ObR的 mRNA,能编码一种结构与天然存在的短型相同的蛋白。其C-端区的丧失 被认为使ObR失去了活性,并推测能导致db/db小鼠的肥胖表型。

序列资料表明,ObR可能产生类似于G-CSFR、LIFR和gp130的信 号转录作用(Stahl和Yancopoulos,1993,细胞(Cell)74:587-590; Kishimoto等,1995,血液(Blood)86:1243-1254)。由上述受体进行的信 号转导,尤其能实现Janus激酶家族的受体相关激酶的激活,由此导致磷酸 化作用,并激发STAT1、STAT3和STAT5的DNA结合活性(Ihle,1995, Nature 377:591-594;Kishimoto等,1995,Blood 86:1243-1254)。 这一过程反过来又与诱导的基因转录相关(所述基因具有STAT蛋白的结合位 点),如编码急相血浆蛋白的肝基因(Lai等,1995,生物化学杂志 (J.Biol.Chem.)270:23254-23257)。为了验证所克隆的ObR同种型是否确 系信号转导受体分子,将ObR导入已建立的组织培养细胞系中,并将细胞对 OB处理的反应与由结构上相关的IL-6-型细胞因子受体介导的反应加以 比较。在下文的实施例中所提供的结果表明,该长型ObR是一种信号转导分 子。具体地讲,所述结果证实了该长型ObR具有IL-6-型细胞因子受体 的功能特异性。所述结果还证实,短型ObR不能通过由所述ObR长型转导 的STAT途径转导信号。因此,好像是长型ObR,而不是短型ObR与体重 的保持相关。

本发明的ObR氨基酸序列包括图1(序列2)、图3(序列4)或图6所示的 氨基酸序列,或由保存于ATCC的cDNA克隆famj5312或保存于ATCC的 cDNA克隆fahj5312d或保存在ATCC的人基因组克隆h-obR-p87编码 的氨基酸序列。而且,本发明还包括其它物种的ObR。事实上,由上面的 5.1节中所披露的obR核苷酸所编码的一切ObR蛋白均属于本发明的范畴。

本发明还涉及作为由5.1节中所披露的核苷酸序列编码的ObR的功能性 等同物的蛋白,这种功能性等同物可以用众多标准中的任一种判断,所述标 准包括,但不限于结合Ob的能力,对Ob的结合力,Ob结合所产生的生物 学效应,例如,当ObR等同物存在于适当细胞型中时的信号转导、细胞代谢 的变化(例如,离子流动、酪氨酸磷酸化)或表型的变化(如减轻、抑制或延缓 肥胖表型,即db或ob表型)、或体重减少。所述功能性等同的ObR蛋白包 括,但不限于在由上文的5.1节中所披露的 obR核苷酸序列编码的氨基酸序 列中的氨基酸残基的添加或置换,但这种变化导致的是沉默改变,由此产生 一种功能上相同的基因产物。氨基酸置换,可基于有关残基在极性、电荷、 可溶性、疏水性、亲水性和/或两亲性方面的相似性完成。例如,非极性(疏 水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、笨丙氨酸、 色氨酸和甲硫氨酸;极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨 酸、酪氨酸、天冬酰胺和谷氨酰胺;带正电荷的(碱性)氨基酸包括精氨酸、 赖氨酸和组氨酸;而带负电荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。

尽管可以对obR DNA进行随机突变(采用本领域技术人员所熟知的随机 诱变技术)并检测所得到的突变型ObR的活性,但也可以通过工程方法使obR 编码序列发生定点突变(采用本领域技术人员所熟知的定点诱变技术)产生突 变型ObR,该突变型ObRs具有增加的功能,例如,对Ob的较高结合力和/ 或较大的信号转导能力;或具有降低的功能,例如,对Ob的较低的结合力 和/或较弱的信号转导能力。

例如,小鼠短型ObR(图1)和人ObR同系物(图3)的比较示于图5中, 其中,相同的氨基酸残基用星号标出。可以对突变型ObR进行工程操作,以 使相同的区域(在图5中用星号标出)得以保存,而可变残基(图5中未加星号 的残基)被改变,例如,通过缺失或插入一个或几个氨基酸残基或置换一个或 几个不同的氨基酸残基。可以对可变位置上的保守性变性进行工程操作,以 产生仍保留有功能的突变型ObR;例如,保留了Ob结合力或信号转导能力 或同时保留了这两种能力。可以在这些可变位置上用工程操作方法产生非保 守性变化,以改变其功能,例如,Ob结合力或信号转导能力或这两种能力。 另外,如果需要改变功能,可以用工程操作方法使所述保守区域(即:图5中 用星号标示的相同的氨基酸)发生缺失或非保守性变化。例如,可以通过工程 操作使CD发生缺失或非保守性变化(置换或插入),例如,鼠ObR的氨基酸 残基861-894(图1),或人ObR的氨基酸残基863-1165(图3),或CD的 各个部分,例如,鼠ObR的氨基酸残基861-884(图1),或人ObR(box 1 Jak 相互作用域)的氨基酸残基863-886,以产生一种突变型ObR,该突变型 ObR能结合Ob,但不能转导信号。可以对图5所示ECD中的标有星号的残 基进行工程操作,以使其发生非保守性变化,从而产生具有改变了的Ob结 合力的突变型ObR。根据图7中对鼠长型ObR和人ObR同系物的比较,可 以将相同的突变方法用于设计突变型ObR,在图7中,相同的氨基酸残基用 双星号表示。

图4中示出了鼠ObR的ECD与人gp130的比较,其中,相同的残基用 黑体表示,而保守性变化用灰体表示。据推测,在保持ECD的三级结构方 面相同区域和保守区域有着重要作用,而可变区可产生每一种受体对其配体 的特异性。因此,通过改变图4所示的可变区,可以通过工程方法产生具有 改变了的Ob结合力的ObR突变型。可以对所述ObR突变型进行设计,以 保留在图4中被框出(包括黑框和灰框)的ObR氨基酸序列,或含有一个或几 个由图4的灰框所示gp130序列所产生的保守性置换。

可以使obR编码序列发生其它突变,以产生更适于在所选定的宿主细胞 中表达、放大等的ObR。例如,为了消除二硫键,可以缺失或用另一种氨基 酸置换半胱氨酸残基;可以改变或消除N-连接的糖基化位点,以实现诸如 均相产物表达的目的,这种产物更容易从酵母宿主中回收和纯化,已知上述 位点为高糖基化N-连连接位点。为此,发生在ECD上的一个或几个糖基 化识别序列(N-X-S或N-X-T)中任一个的第一或第三氨基酸位置上 的各种氨基酸置换和/或发生在ECD上的一个或几个所述识别序列中任一个 的第二位置上的一个氨基酸的缺失,可以抑制ObR在修饰过的三肽序列上的 糖基化作用(例如,参见Miyajima等,1986,欧洲分子生物学协会杂志 (EMBO J.)5(6):1193-1197)。

相当于ObR的一个或几个功能碱(如ECD、TM或CD)的肽、截短了的 或缺失的ObR(例如,缺失了其中的TM和/或CD的ObR)、以及由全长ObR、 ObR肽或截短的ObR与一种不相关的蛋白融合而成的融合蛋白也属于本发 明范畴,并可以根据在本节和上文的5.1节中所披露的obR核苷酸序列和 ObR氨基酸序列进行设计。所述融合蛋白包括,但不限于IgFc融合蛋白, 它能稳定ObR蛋白或肽,并延长其在体内的半衰期;或与能使融合蛋白固定 在细胞膜上的一切氨基酸序列融合,以使其ECD被呈现在细胞表面上;或 是与具有标记功能的酶、荧光蛋白或发光蛋白融合。

虽然可用化学方法合成ObR多肽和肽(例如,参见Creighton,1983,蛋白 质:结构和分子原理(Proteins:Structures and Molecular Principles), W.H.Freeman & Co.,N.Y),但源于ObR的大型多肽和全长ObR本身最好用 本领域广为人知的技术通过重组DNA方法产生,以表达含有ObR基因序列 和/或编码序列的核酸。可将这种方法用于构建含有5.1节中披露的obR核苷 酸序列合适的转录及翻译控制信号的表达载体。例如,所述方法包括体外重 组DNA技术、合成技术和体内遗传重组技术。例如,参见披露于Sambrook 等(1989,同上)和Ausubel等(1989,同上)的著述中的技术。或者,可以用 诸如合成仪的装置化学合成能编码obR核苷酸序列的RNA。例如,参见披 露于寡核苷酸合成(“Oligonucleotide Synthesis”)(1984,Gait,M.J.著,IRL Press,Oxford)中的技术,该文献的全文被收作本文参考。

可以用各种宿主表达载体系统表达本发明的obR核苷酸序列。如果该 ObR肽或多肽是可溶性衍生物(例如,相当于ECD的ObR肽;截短的或缺失 的ObR,其中的TM和/或CD已缺失)的话,在ObR肽或多肽不是分泌性的 时可从培养物,即宿主细胞中回收该肽或多肽,而在ObR肽或多肽是由宿主 细胞分泌的时可从培养基中回收。不过,该表达系统还包括遗传工程产生的 宿主细胞,该细胞可原位表达ObR或其功能性等同物,即固定在细胞膜上。 可以用适当的洗涤剂和脂微团以及本领域技术人员所熟知的方法实现从这 种表达系统中纯化或富集ObR。不过,可将这种用工程方法产生的宿主细胞 本身用于以下场合:它不仅对于保持ObR的结构和功能特征起着重要作用, 而且对评估其生物学活性有重要意义,例如,用于药物筛选试验中。

可用于本发明目的的表达系统包括,但不限于诸如用含有obR核苷酸序 列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化过的细菌(例 如,大肠杆菌、枯草芽胞杆菌)的微生物;用含有obR核苷酸序列的重组酵 母表达载体转化过的酵母(例如,酵母属、毕赤酵母属);用含有obR核苷酸 序列的重组病毒表达载体(例如,杆状病毒)感染过的昆虫细胞系统;用含有 obR核苷酸序列的重组病毒表达载体(例如,花椰菜花叶病毒,CaMV;烟 草花叶病毒TMV)感染过的或用含有obR核苷酸序列的重组质粒表达载体(如 Ti质粒)转化过的植物细胞系统;或获得了重组表达结构的哺乳动物细胞系统 (例如,COS、CHD、BHK、293、3T3),所述表达结构含有源于哺乳动 物细胞的启动子(例如,金属硫蛋白启动子)或源于哺乳动物病毒的启动子(例 如,腺病毒晚期启动子;痘苗病毒7.5K启动子)。

在细菌系统中,可以根据被表达的obR基因产物的预期用途对若干表达 载体进行适当选择。例如,当需要产生大量的此类蛋白以制备ObR蛋白的药 用组合物或制备该ObR蛋白的抗体时,需要用诸如能指导便于纯化的融合蛋 白产物的高水平表达的载体。这种载体包括,但不限于大肠杆菌表达载体 pUR278(Pruther等,1983,EMBO J.2:1791),其中,obR编码序列可以 与lacZ编码区单独在读框中的连接到该载体,以产生所述融合蛋白;pIN载 体(Inouye和Inouye,1985,核酸研究(Nucleic Acids Res.)13:3101-3109; Van Heeke和Schuster,1989,生物化学杂志(J.Biol.Chem.)264:5503- 5509);以及类似载体。还可将pGEX载体用于表达外源多肽,该多肽是一种 与谷胱甘肽S-转移酶(GST)的融合蛋白。一般,这种融合蛋白是可溶性的, 而且便于从裂解的细胞中纯化,其做法是:将其吸附到谷胱甘肽-琼脂糖珠 上,然后在有游离的谷胱甘肽的条件下洗脱。将PGEX载体设计成包括凝血 酶或因子Xa蛋白酶裂解位点,以便能从GST部分分离出克隆的目标基因产 物。

在昆虫系统中,用苜蓿纹夜蛾(Autographa californica)核型多体病毒 (AcNPN)作为载体表达外源基因。该病毒生长于草地贪夜蛾(spodoptera frugiperda)细胞中。可将obR基因编码区单独克隆到该病毒的非必需区(例 如,多角体蛋白基因)上,并置于AcNPV启动子(例如,多角体蛋白启动子) 的控制之下。ObR基因编码序列的成功插入,可导致多角体蛋白基因的失活 和无包被重组病毒(即:缺少由多角体蛋白基因编码的蛋白质外被的病毒)的 产生。然后再用这种重组病毒感染草地贪夜蛾细胞,其中,所插入的基因得 以表达(例如,参见Smith等,1983,病毒学杂志(J.Virol.)46:584;Smith, 美国专利US 4,215,051)。

在哺乳动物宿主细胞中,可以使用多种病毒基表达系统。当腺病毒被用 作表达载体时,可将感兴趣的obR核苷酸序列连接在腺病毒转录/翻译控制复 合体上,例如,晚期启动子和三联前导序列。然后通过体外或体内重组将该 嵌合基因插入腺病毒基因组中。如果插入点是在病毒基因组的非必需区上(例 如,E1或E3区),将会产生一种有活力的并能在感染的宿主中表达obR基 因产物的重组病毒(例如,参见Logan和ShenR,1984,美国科学院院刊(Proc. Natl.Acad.Sci.)USA 81:3655-3659)。插入的obR核苷酸序列的有效翻 译可能还需要特殊的起始信号。这些信号包括ATG起始密码子及相邻的序 列。在完整的obR基因或cDNA(包括其自身的起始密码子及相邻序列)被插 入合适的表达载体的情况下,无须额外的翻译控制信号。不过,当插入的仅 仅是一部分obR编码序列时,必须提供外源翻译控制信号,可能包括ATG 起始密码子。而且,该起始密码子必须与所需的编码序列的读框同相,以确 保整个插入片段的翻译。所述外源翻译控制信号和起始密码子可有多种来 源,它可以是天然的和合成的。通过包含合适的转录增强元件、转录终止子 等可以提高表达的效率(参见Bittner等,1987,酶学方法(Methods in Enzymol.)153:516-544)。

另外,可以选择宿主细胞品系,该品系能调节插入序列的表达,或以所 需的特定方式修饰并加工其基因产物。蛋白产物的这种修饰(如糖基化)和加 工(如裂解)可能对该蛋白的功能至关重要。不同的宿主细胞具有进行蛋白和 基因产物的翻译后加工和修饰的特征性的、特殊机制。可以选择合适的细胞 系或宿主系统,以确保所表达的外源蛋白的正确修饰和加工。为达此目的, 可以使用具有用于正确加工初级转录物、基因产物的糖基化和磷酸化的细胞 器的真核宿主细胞。这种哺乳动物宿主细胞包括,但不限于CHO、VERO、 BHK、Hela、COS、MDCK、293、3T3、WI38,尤其是脉络丛细胞 系。

为了长期、高得率地生产重组蛋白,稳定的表达是优选的。例如,可以 制备出可稳定表达上述obR序列的细胞系。可以用由适当的表述控制元件(例 如,启动子、增强子序列、转录终止子、聚腺苷酸化位点等)控制并有一种选 择标记的DNA转化宿主细胞,而不是用含有病毒复制起点的表达载体转化。 在导入外源DNA之后,可以让制备出的细胞在富集培养基中生长1-2天, 然后将其转移到选择培养基上。重组质粒上的选择标记可以产生选择抗性, 并使得该细胞能将所述质粒稳定地整合到其染色体中,生长型成转化灶,随 后可以对该转化灶进行克隆并扩增成细胞系。可将该方法适当用于制备能表 达obR基因产物的细胞系。由此制备的细胞系特别适用于筛选和评价能影响 obR基因产物的内在活性的化合物。

有多种选择系统可供使用,包括,但不限于可分别用于tk-、hgprt-或 aprt-细胞的单纯疱疹病毒胸苷激酶(Wigler等,1977,Cell 11:223)、次 黄嘌呤-鸟嘌呤磷酸核糖转移酶基因(Szybalska和Szybalski,1962, Proc.Natl.Acad.Sci.USA48:2026)、和腺嘌呤磷酸核糖转移酶基因(Louy等, 1980,Cell 22:817)。另外,可以将抗代谢物抗性用作以下基因的选择基 础:dhfr,它能产生对氨甲蝶呤的抗性(Wigler等,1980, Natl.Acad.Sci.USA 77:3567;O′Hare等,1981,Proc.Natl.Acad.Sci.USA. 78:1527);gpt,它可以产生对霉酚酸的抗性(Mulligan & Berg,1981, Proc.Natl.Acad.Sci.USA78:2072);neo,它能产生对氨基糖苷G-418的 抗性(Colbeme-Garapin等,1981,J.Mol.Biol.150:1);以及hvgro,它 能产生对潮霉素的抗性(Santere等,1984,Gene30:147)。

另外,可以用对被表达的融合蛋白特异的抗体方便地纯化一切融合蛋 白。例如,由Janknecht等所披露的一种系统可用于方便地纯化在宿主细胞 系中表达的非变性融合蛋白(Jamknecht等,1991,Proc.Natl.Acad.Sci.USA 88:8972-8976)。在该系统中,将感兴趣的基因亚克隆到痘苗重组质粒上, 以使该基因的开放读框被翻译融合到由6个组氨酸残基构成的氨基末端尾 上。将获自由重组痘苗病毒感染的细胞的提取物加样到Ni2+次氮基乙酸-琼 脂糖柱上,并用含有咪唑的缓冲液选择性地洗脱由组氨酸标记的蛋白。

还可以在转基因动物中表达obR基因产物。任何物种的动物均可用于生 产obR转基因动物,其中包括,但不限于小鼠、大鼠、兔、豚鼠、猪、微型 猪(micro-pigs)、山羊和非人灵长类,如狒狒、猿、和黑猩猩。

本领域已知的任何方法均可用于将obR转基因导入动物中,以产生转基 因动物的起始系。这些方法包括,但不限于原核显微注射法(Hoppe,PC.和 Wagner,-33T.E.,1989,美国专利US 4,873,191);由逆转录病毒介导的基 因向种系中的转入(Van der Putten等,1985,Proc.Natl.Acad.Sci.USA 82: 6148-6152);胚胎干细胞中的基因定向(Thompson等,1989,Cell 56:313 -321);胚胎的电穿孔法(Lo,1983,分子细胞生物学(Mol Cell.Biol.)3:1803 -1814);以及精子介导的基因转移(Lavitrano等,1989,Cell 57:717-723) 等。为了回顾这此方法,可参阅Gordon,1989,转基因动物(Transgenic Animals),Intl.Rev.Cytol.115:171-229,该资料被全文收作本文参考。

本发明提供了在其所有细胞中均携带有obR转基因的转基因动物,以及 在其某些,而不是所有细胞中都携带有该转基因的动物,即嵌合型动物。所 整合的转基因可以是一个转基因,或是多联体,例如,头-头连接或头-尾 连接的多联体。还可以将该转基因选择性地导入特定的细胞类型并将其激 活,例如,按照Lasko等披露的方法进行(Lasko,M.等,1992, Proc.Natl.Acad.Sci.USA 89:6232-6236)。这种细胞型特异激活所需的调 控序列,取决于感兴趣的具体细胞类型,而且,对于本领域技术人员来说是 显而易见的。当希望把obR基因的转基因整合到内源obR基因的染色体位点 上时,优选基因定向法。简单地讲,当使用这样一种方法时,出于整合的需 要设计含有某些与内源obR基因同源的核苷酸序列的载体,通过与染色体序 列的同源重组进入内源obR基因的核苷酸序列,并破坏其作用。还可以将转 基因选择性地导入特定的细胞类型,并由此仅仅失活该细胞类型中的内源 obR基因,例如,通过Gu等披露的方法进行(Gvu等,1994,Science 265: 103-106)。这种细胞型特异失活所需的调控序列取决于感兴趣的特定细胞 类型,而且,对于本领域技术人员来说是显而易见的。

一旦制备出转基因动物,即可用标准方法测定重组obR基因的表达。初 步筛选可以通过Southern印迹分析或PCR技术而实现,对动物组织进行分 析,以验证是否也发生了转基因的整合。还可以用如下方法测定转基因在组 织中的表达水平,这些方法包括,但不限于对获自动物的组织样品进行 Northern印迹分析、原位杂交分析和RT-PCR。还可以用对obR转基因产 物特异的抗体通过免疫细胞化学方法对ObR基因表达组织样进行评价。

                      C..ObR蛋白抗体

本发明还涉及能特异识别ObR的一个或几个表位,或ObR的保守变体 或ObR的肽片段的表位的抗体。所述抗体包括,但不限于多克隆抗体、单克 隆抗体(mAbs)、人源化或嵌合抗体、单链抗体、Fab片段、F(ab')2片段、由 Fab表达文库产生的片段、抗独特型(anti-Id)抗体、以及上述任何抗体的表 位结合片段。

例如,可将本发明的抗体用于检测生物学样品中的ObR,并因此可被 用作诊断或预测方法的一部分,以检测出有异常ObR含量的患者。例如,还 可将这些抗体用于在下文的3.5节中所述的化合物筛选方法中,以评价试验 化合物对obR基因产物表达和/或活性的影响。另外,还可将这些抗体用于在 下文的5.6节中所述的基因治疗方法中,例如,用于在把正常和/或制备出的 ObR-表达细胞导入患者体内之前对其进行评估。还可将这种抗体用作抑制 异常ObR活性的方法。因而可将所述抗体用作体重疾病治疗方法的组成部 分。

为了制备抗体,可以通过注射ObR、ObR肽(例如,相当于所述受体的 一个功能域,如ECD、TM或CD的肽)、截短的ObR多肽(其中的一个或几 个功能域,如TM或CD已缺失的ObR)、ObR的功能性等同物或ObR突变 体的方法使各种宿主动物免疫。所述宿主动物可以包括,但不限于兔、小鼠、 和大鼠,仅列举以上几种。为了加强免疫反应,可根据宿主的物种使用各种 佐剂,包括,但不限于Freund's(完全和不完全)佐剂、诸如氢氧化的矿物凝 胶,诸如溶血卵磷脂、多聚醇、聚阴离子、肽、油乳、匙孔血蓝蛋白、二硝 基苯酚的表面活性物质,以及诸如BCG(卡介苗)和小棒杆菌的潜在可用的人 的佐剂。多克隆抗体是源于免疫动物血清的抗体分子的异质群体。

单克隆抗体是特定抗原的抗体的均质群体,这种抗体可以用任何方法获 得,这些方法以在培养物中延续细胞系的方式产生抗体分子。所述方法包 括,但不限于Kohler和Milstein的杂交瘤技术(1975,Nature 256:495- 497;和US 4,376,110),人B-细胞杂交瘤技术(Kosbor等,1983,当代免 疫学(Immunology Today)4:72;Cole等,1983,Proc.Natl.Acad.Sci.USA 80:2026-2030),和EBV-杂交瘤技术(Cole等,1985,单抗和癌症治 疗(Monoclonal Antibodies And Cancer Therapy),Alan R.Liss,Inc.,pp.77- 96)。所述抗体可以是任何类型的免疫球蛋白,包括IgG、IgM、IgE、IgA、 IgD及其所有亚型。可以在体外或体内培养能产生本发明mAb的杂交瘤。在 体内生产高效价的mAbs是现有的优选生产方法。

此外,还可以使用为了制备“嵌合型抗体”而发展起来的技术(Morrison 等,1984,Proc.Natl.Acad.Sci.USA,81:6851-6855;Neubergor等, 1984,Nature,312;604-608;Takeda等,1985,Nature,314:452- 454),该方法是通过剪接源于具有适当抗原特异性的抗体分子的基因和源于 具有适当生物学活性的人抗体分子的基因而实现。嵌合型抗体是一种其不同 的部分源于不同的动物种的分子,如具有源于鼠mAb的可变区和人免疫球 蛋白恒定区的分子。

另外,可以改进已知的用于制备单链抗体的方法(US专利4,946,778; Bird,1988,Science 242:423-426;Huston等,1988, Proc.Natl.Acad.Sci.USA 85:5879-5883;和Ward等,1989,Nature 334: 544-546)以制备抗obR基因产物的单链抗体。单链抗体是通过由一个氨基 酸桥将Fv区的重链和轻链片段连接而形成的一种单链多肽。

可以用已知方法制备能识别特异表位的抗体片段。例如,这些片段包 括,但不限于:可用胃蛋白酶消化抗体分子而产生的F(ab')2片段,以及可通 过还原F(ab')2片段的二硫键而产生的Fab片段。另外,可以构建Fab表达文 库(Huse等,1989,Sciece,246:1275-1281),以便能快速、方便的鉴定 具有所需特异性的单克隆Fab片段。

反过来,又可以将ObR的抗体用于通过本领域技术人员熟知的技术制 备“模拟”ObR的抗独特型抗体(例如,参见Greenspam和Bona,1993,美 国联邦实验生物学会杂志(FASEB J)7(5):437-444;和Nissinoff,1991, J.Immunol.147(8):2429-2438)。例如,可将能与ObR ECD结合并竞争性 抑制Ob与ObR结合的抗体用于制备“模拟”ECD的抗独特型,因此,该 抗独特型又能结合并中和Ob。可将上述中和性抗独特型或该抗独特异的Fab 片段用于治疗方法中,用于中和Ob并促进体重增加。

D..体重疾病异常性的诊断

可将多种方法用于诊断和预测性评估体重疾病,所述疾病包肥胖、恶病 质和厌食,并用于确认具有这种疾病诱因的对象。

例如,所述方法可以使用诸如在5.1节中所披露的obR核苷酸序列和在 5.3节中所披露的ObR抗体的制剂。具体地讲,可将上述制剂用于诸如:(1) 检测obR基因的存在,或检测ObR mRNA相对无体重疾病状态而言是过表 达还是表达不足;(2)检测相对无体重疾病状态而言obR基因产物过量还是不 足;和(3)检测由ObR介导的信号转导途径的干扰或异常性的场合。

例如,本文所披露的方法可以用预先包装好的诊断试剂盒实现,该试剂 盒至少含有一种本文所披露的特殊obR-核苷酸序列或ObR抗体制剂,该试 剂盒可方便地用于诸如临床试验的场合,以诊断具有体重疾病异常现象的患 者。

为了检测obR突变,可将任何具核细胞用作基因组核酸的来源。为了检 测ObR基因表达或ObR基因产物,可以使用表达过ObR基因的任何细胞型 或组织,如脉络丛细胞。

在下文的5.4.1节中披露了以核酸为基础的检测技术。在5.4.2节中披露 了肽检测技术。

                   1..检测obR基因及转录物

可以用多种方法检测出发生在obR基因上的突变。可将来自任何具核细 胞的核酸用作这种测定方法的起点,并可以用本领域技术人员熟知的核酸制 备方法提取核酸。

可将DNA用于生物学样品的杂交或扩增测试中,以检测与obR基因结 构相关的异常性,包括点突变、插入、缺失和染色体重排。所述测试包括, 但不限于Southern分析、单链构象多态性分析(SSCP)和PCR分析。

例如,所述用于检测obR基因特异突变的诊断方法可能包括:接触并培 养荻自诸如源于患者的样品或其它适当细胞来源的含有重组DNA分子、克 隆的基因或其简并变体的核酸,和在5.1节中所披露的一种或几种包括重组 DNA分子、克隆的基因或其简并变体的标记核酸制剂,培养是在有利于所述 制剂与其在obR基因中的互补序列特异退火的条件下进行的。优选的是,所 述核酸制剂的长度至少为15-30个核苷酸。在培养之后,将所有未退火的 核酸从核酸obR分子杂合体上除去。然后检测杂交过的核酸分子的存在,如 果存在这种分子的话。例如,用这种检测方法可将来自感兴趣的细胞类型或 组织的核酸固定在诸如薄膜的固相支持物上,或固定在塑料表面上,如微滴 定板或聚苯乙烯珠的表面上。在这种情况下,在培养之后,未退火的、在5.1 节中所述类型的标记核酸制剂容易被清除。对保留的、退火的、标记的ObR 核酸制剂的检测可以用本领域技术人员熟知的标准方法完成。可将与所述核 酸制剂退火的ObR基因序列与根据正常ObR基因序列预测的退火模式加以 比较,以确认是否存在ObR基因突变。

用于检测患者样品或其它合适细胞来源中的ObR基因特异性核酸分子 的其它诊断方法可能包括对该分子进行扩增,例如,通过PCR(由Mullis, K.B.,1987,在US 4,683,202中提出的实验方案)方法扩增,然后用本领域技术 人员熟知的方法检测扩增的分子。可将所得到的扩增序列与根据当扩增的核 酸中仅含有正常拷贝的obR基因时所预期的序列加以比较,以确定是否存在 obR基因突变。

另外,可以用众所周知的基因型分类方法鉴定带有obR基因突变的个 体。例如,这类方法包括限制性片段长度多态性(RFLP)的使用,其中涉及所 使用的特定限制酶的识别位点之一的序列变化。

另外,所披露的可用于鉴定obR基因突变的分析DNA多态性的改进方 法,利用的是限制酶位点之间可变数量的短的、串联重复的DNA序列的存 在。例如,Weber(US 5,075,217,其全文被收作本文参考)披露了一种DNA 标记,该标记是基于(dC-dA)n-(dG-dT)n短串联重复模序的长度多态性。 估计(dC-dT)n-(dG-dT)n模序的平均长度为30,000-60,000bp。排列 如此紧密的标记具有高频率的共遗传性,而且在诸如obR基因的突变的遗传 突变的鉴定和与obR突变相关的疾病和异常的诊断方面极为有用。

另外,Caskey等(US 5,364,759,其全文被收作本文参考)披露了一种用 于检测短的3核苷酸和4核苷酸重复序列的DNA分布测定。该方法包括提 取诸如obR基因的感兴趣的DNA,扩增所提取的DNA,以及标记重复的 序列,从而作出有关个体的DNA的基因型图。

还可以通过检测并测定obR转录测定obR基因的表达水平。例如,可 以分离已知的或被怀疑能表达obR基因的细胞类型组织,如脑、尤其是脉络 丛细胞的RNA,并用上文所披露的杂交和PCR方法进行测定。所分离的细 胞可以源于细胞培养物或患者体内。对取自培养物的细胞进行分析可能是对 细胞进行测定的必要步骤,该细胞被用作基于细胞的基因治疗方法的一部 分,或被用于检测化合物对ObR基因表达的影响。上述分析可以揭示 obR 基因表达方式的定量及定性特征,包括obR基因表达的激活或失活。

在所述检测方法的一种实施方案中,cDNA是由感兴趣的RNA合成的 (例如,将RNA分子逆转录成cDNA)。然后将该cDNA上的一段序列用作核 酸扩增反应,如PCR扩增反应等的模板。在该方法的逆转录和核酸扩增步骤 中被用作合成起始试剂(如引物)的核酸试剂是从披露于5.1节的obR核酸试 剂中选择的。这种核酸试剂的长度优选为9-30个核苷酸。为了检测扩增 产物,可以用放射性标记的或非放射性标记的核苷酸。另外,要制备足够的 扩增产物,以便能通过标准的溴化乙锭染色或通过其它合适的核酸染色方法 显现该产物。

另外,还可以“在原位”进行obR基因表达的测定,即直接测定在活体 解剖或切除术中获得的患者组织的组织切片(固定的和/或冷冻的)。可将披露 于5.1节中的核酸试剂用作这种原位方法的探针和/或引物(例如,参见Nuovo, G.J.,1992,“原位杂交PCR:方法和应用(PCR In Situ Hybridization: Protocols And Applications)”Raven Press,NY)。

另外,如果能得到足够数量的适当细胞,则可以实施标准Northern分 析,以测定obR基因的mRNA表达水平。

                    2..检测obR基因产物

在上文的5.3节中所披露的抗野生型obR基因产物或其保守性变体或肽 片段的抗体还可用于本节所述的体重疾病诊断和预测方法中。可将这种诊断 方法用于检测ObR基因表达水平上的异常性,或ObR在结构和/或时序、组 织、细胞或亚细胞定位方面的异常性,并可以在体内或体外,如在活体解剖 组织上实施该方法。

例如,可将抗ObR ECD表位的抗体用于体内检测ObR在体内的表达型 式和表达水平。可以用诸如不透射线的或其它合适的化合物标记所述抗体, 并将其注射到受治对象体内,以便用诸如X-射线、CAT-扫描或MRI的 方法显现其与体内表达的ObR的结合。标记过的抗体片段,例如,含有抗原 结合区的最小部分的Fab或单链抗体可优选用于促进血脑屏障交联的目的, 并能够标记在脉络丛中表达的ObR。

另外,任何能检测到其存在的ObR融合蛋白或ObR缀合蛋白均可以服 用。例如,可以服用由不透射线的或其它合适化合物标记的ObR融合或缀合 蛋白,并进行体内显现,如上文结合标记的抗体所做说明。可将诸如AP- Ob或Ob-AP融合蛋白的其它融合蛋白用于体外诊断方法中。

另外,还可将上述免疫测定或融合蛋白的检测测定用于活体解剖和尸体 解剖样品的体外测定,以评价ObR的表达型式。所述测定并不局限于使用限 定ObR ECD的抗体,而且还可包括使用针对ObR的任何功能域,如ECD、 TM和/或CD的表位的抗体。所述每一种或所有标记抗体的使用,可提供有 关ObR翻译和朝向细胞表面的胞内转运的有用信息,并可以鉴定其在加工方 面的缺陷。

接受分析的组织或细胞类型通常包括已知的或被怀疑能表达ObR基因 的组织或细胞,例如,脉络丛细胞。例如,本文所使用的蛋白提取方法,可 以是诸如由Harlow和Lane所披露的方法(Harlow,E.和Lane,D.,1988, “Antibodies:ALaboratory Manual”,Cold Spring Harber Laboratory Pross, Cold Spring Harbor,New York),该书被全文收作本文参考。所分离的细胞可 源于细胞培养物或源于患者。对来自培养物的细胞进行分析是评价细胞的一 个必要步骤,该细胞可被用作基于细胞的基因治疗方法的一部分,或用于检 验化合物对obR基因表达的影响。

例如,可以在本发明中使用的诸如在上文的5.3节中披露的抗体,或抗 体片段可被用于定量或定性检测 obR基因产物或其保守性变体或肽片段的存 在。例如,这一目的可以这样实现:通过采用荧光标记的抗体(参见本节以下 的内容)的免疫荧光技术,同时结合光学显微检测、流式细胞计量术或荧光测 定。当obR基因产物被表达于细胞表面上时,上述方法尤其适用。

可用于本发明的抗体(或其片段)或Ob融合蛋白或缀合蛋白,还可用于 组织学测定,如免疫荧光、电子显微或非免疫测定,用于原位检测obR基因 产物或其保守性变体或肽片段,或用于Ob结合(针对标记过的Ob融合蛋 白)。

原位检测可以这样实现:从患者体内取出组织学样品,并将本发明的标 记抗体或融合蛋白涂在样品上。最好通过将标记过的抗体(或片段)涂在生物 学样品样上的方式使用所述抗体(或片段)或融合蛋白。采用上述方法不仅可 以测定obR基因产物或保守性变体或肽片段的存在,或Ob结合的存在,而 且可以测定其在检查的组织中的存在。通过使用本发明,本发明普通技术人 员将很容易领会到,可以对多种组织学方法(如染色方法)中的任一种加以改 进,以便实现所述原位检测。

对ObR基因产物或其保守性变体或肽片段的免疫测定和非免疫测定, 通常包括在有能确认obR基因产物或其保守性变体或肽片段的可检测的标记 抗体存在的条件下培养诸如生理液体、组织提取物、新采集的细胞或在细胞 培养物中培养过的细胞的裂解液的样品,和通过多种本领域公知技术中的任 一种检测结合抗体。

可以使所述生物学样品接触并固定在诸如硝酸纤维素膜的固相支持物 或载体上,或固定在其它能固定细胞、细胞颗粒或可溶性蛋白的固相支持物 上。然后可以用合适的缓冲液洗涤所述支持物,然后再用可检测地标记过的 ObR抗体或Ob融合蛋白进行处理。接着,用所述缓冲液再次洗涤所述固相 支持物,以除去未结合的抗体或融合蛋白。然后,可以用常规方法测定固体 支持物上的结合标记物的量。

“固相支持物或载体”是指能够结合抗原或抗体的任何支持物。众所周 知的支持物包括玻璃、聚苯乙烯、聚丙乙烯、聚乙烯、葡聚糖、尼龙、淀粉 酶、天然和改性纤维素、聚丙烯酰胺、辉长岩和磁矿。对于本发明来说, 所述载体的性质或者有一定程度的可溶性或是不溶性的。实际上,所述支持 材料可以为任何可能的结构构型,只要所连接的分子能够与抗原或抗体结合 即可。因此,所述支持物构型可以是球形的,如呈球状,或为筒状,如在试 管的内表面或棒的外表面。另外,其表面可以是平的,如板、试条等。优选 的支持物包括聚苯乙烯球。本领域技术人员可以理解,用常规实验方法可以 确定很多其它适于结合抗体或抗原的载体。

可以用公知方法测定特定的多种ObR抗体或Ob融合蛋的白结合活性。 本领域技术人员通过常规实验方法确定每一种测定的可操作的和最佳测试 条件。

就抗体而言,对ObR抗体进行可检测地标记的方法之一是将其同一种 酶连接,并将其用于酶免疫测定(EIA)中(Voller,A.,“酶联免疫吸附检测(The Enzyme Linked Immunosorbent Assay(ELISA))”,1978,Diagnostic Horizons 2:1-7,Microbiological Associates Quarterly Publication,Walkersvslle, MD;Voller,A.等,1978,临床病理学(J.Clin.Pathol.)31:507-520; Butler,J.E,1981,Meth.Enzyme.73:482-523;Maggio,E.(著),1980,酶 免疫检测(Enzyme lmmuno-assay),CRC Press,Boca Raton,FL;Ishikawa,E. 等,(著),1981,Enzyme,Immunoassay,Kgakushoin,Tokyo)。所述与抗体 结合的酶可以和适当的底物,优选为显色底物反应,以生成能通过诸如分光 光度装置、荧光测定装置或目测装置检测到的化学成分。可用于可检测地标 记抗体的酶包括,但不限于苹果酸脱氢酶、葡萄球菌核酸酶、δ-5-类固 醇异构酶、酵母醇脱氢酶、α-磷酸甘油盐,脱氢酶、磷酸三糖异构酶、辣 根过氧化物酶、碱性磷酸酶、天冬酰胺酶、葡萄糖氧化酶、β-半乳糖苷酶、 核糖核酸酶、脲酶、过氧化氢酶、葡萄糖-6-磷酸脱氢酶、葡糖淀粉酶和 乙酰胆碱酯酶。检测过程可以通过比色法实现,该方法使用特定酶的一种显 色底物。检测过程还可以通过目测比较某种底物的酶促反应程度和以类似方 法制备的标准物的反应程度而实现。

检测还可以用多种其它免疫测定方法中的任一种而实现。举例来说,通 过放射性方法标记抗体或抗体片段,可以用放射免疫测定(RIA)方法检测 ObR(例如,参见Weintraub,B.,放免原理,放射配体格测技术的第七次培训 教程(Principles of Radioimmunoassays,Seventh Training Course on Radioligand Assay Techniques),The Endocrine Society,1986年3月,该资料被 收作本文参考)。可通过诸如使用γ-计数器或闪烁计数器的方法或放射性自 显影法检测放射性同位素。

还可以用荧光化合物标记所述抗体。当用荧光标记过的抗体遇到波长合 适的光照时,就可通过荧光检测到它的存在。最常用的荧光标记化合物有荧 光素异硫氰酸盐、罗丹明、藻红蛋白、藻蓝蛋白、别藻蓝蛋白、邻苯二和 荧光胺。

还可用诸如152Eμ或镧系其它成员的荧光发光金属对抗体进行可检测地 标记。可以用诸如二乙三胺五乙酸(DTPA)或乙二胺四乙酸(EDTA)的金属螯合 基团将所述金属连接在抗体上。

还可以通过连接化学发光化合物的方法对所述抗体进行可检测地标 记。然后通过检测发光现象确定化学发光标记抗体的存在,所述发光现象是 在化学反应过程中发生的。特别有用的化学发光标记化合物的例子有鲁米 诺、异鲁米诺、theromatic acridinium ester、咪唑、吖啶盐和草酸酯。

类似地,还可将生物发光化合物用于标记本发明的抗体。生物发光是存 在于生物系统中的一种化学发光,其中,一种催化性蛋白可提高化学发光的 效率。通过测定发光现象测定生物发光蛋白的存在。可用于标记目的的重要 生物发光化合物有荧光素、荧光素酶和水母素。

E..能调节ObR表达或活性的筛选测定

设计以下测定是为了鉴定如下化合物:能与ObR(包括,但不限于ObR 的ECD或CD)相互作用(如与之结合)的化合物,能与可以和ObR(包括,但 不限于ObR的TM或CD)相互作用的胞内蛋白相互作用(如与之结合)的化合 物,能干扰ObR与参与ObR-介导的信号转导的跨膜蛋白或胞内蛋白的相 互作用的化合物,以及能调节obR基因活性(即:调节ObR基因表达水平) 或调节ObR水平的化合物。还可以使用鉴定能与ObR基因调控序列(如启动 子序列)结合的化合物和能调节ObR基因表达的化合物的测定方法。例如, 参见Platt,K.A.,1994,J.Biol.Chem.269:28558-28562,该资料被全文收 作本文参考。

可以根据本发明进行筛选的化合物包括,但不限于肽,抗体及其片段, 以及其它能与ObR的ECD结合并模拟由天然配体(即:激动剂)触发的活性 或抑制由天然配体(即:拮抗剂)触发的活性的有机化合物(例如,肽模拟物); 以及肽,抗体或其片段,和其它能模拟ObR的ECD(或其一部分)并能结合和 “中和”天然配体的有机化合物。

所述化合物可以包括,但不限于诸如可溶性肽的肽,包括,但不限于随 机肽文库的成员(例如,参见Lam,K.S.等,1991,Nature 354:82-84; Houghten,R.等,1991,Nature 354:84-86);由D型和/或L型构型的氨 基酸组成的组合型化学衍生的分子文库;磷酸肽(包括,但不限于随机的或部 分简并的定向磷酸肽文库;例如,参见Songyang,Z.等,1993,Cell 72: 767-778);抗体(包括,但不限于多克隆抗体、单克隆抗体、人源化抗体、 抗独特性抗体、嵌合型或单链抗体、和FAb、F(ab')2和FAb表达文库片段, 及其表位结合片段),以及小型有机或无机分子。

可以用本发明方法筛选的其它化合物包括,但不限于能够通过血脑屏障 进入适当细胞(例如,脉络丛或下丘脑细胞)、并影响obR基因或与ObR信号 转导途径有关的某些其它基因的表达(例如,通过与参与基因表达的调控区或 转录因子相互作用)的小型有机分子;或能影响ObR活性(例如,通过抑制或 加强CD的酶促活性)或与ObR信号转导相关的某些其它胞内因子,如gp130 的活性的化合物。

计算机模拟和检索技术可用于化合物鉴定,或改进已鉴定的能调节ObR 表达或活性的化合物。已鉴定到这样的化合物或组合物,其活性位点或区域 已被鉴定。所述活性位点通常是配体结合位点,Ob与ObR本身的相互作用 域。所述活性位点可以用本领域已知方法鉴定,例如,包括基于肽的氨基酸 序列、核酸的核苷酸序列或对相关化合物或组合物与其天然配体的复合体所 做的研究进行鉴定。在后一种情况下,可以用化学或X-射线晶体学方法发 现活性位点,其是通过寻找因子上复合的配体的存在位置而进行。

然后,测定活性位点的三维几何结构。这一目的可通过包括X-射线晶 体学在内的已知方法而实现,该方法可以测定完整的分子结构。另一方面, 可以用固相或液相NMR方法测定某些分子内距离。可以使用任何结构测定 的其它实验方法来测定部分或整个几何结构。在测定几何结构时,可以使用 天然或人工的复合配体,该配体可以提高活性位点测定的精度

如果测得一种不完全的或不够精确的结构,可以用基于计算机的数字模 拟方法来完善其结构或提高其精度。可以使用一切识别模拟方法,包括专用 于特定生物聚合物,如蛋白或核酸的参数模拟,基于计算分子运动的分子动 态模拟,基于热集团的统计力学模拟或复合模拟,对于大部分类型的模型来 说,标准分子力场表示组成性原子和基团之间所必需的力,并可以从物理化 学中已知的力场中力加以选择。不完全的或不够精确的实施结构可被用作由 上述模拟方法计算出来的完整的、更精确的结构的限制。

最后,在通过实验方法、模拟方法或其综合方法测定了活性位点的结构 之后,通过检索包括化合物及其分子结构信息的数据库,可以确定能候选的 调节化合物。上述检索所找到的化合物的结构与测定的活性活点结构相吻 合,并能与构成该活性位点的基团相互作用。上述检索可以人工完成,但最 好由计算机辅助完成。通过检索所发现的化合物为潜在的ObR调节化合物。

另外,还可将上述方法用于从已知的调节化合物或配体中鉴定改进的调 节化合物。可以改变已知化合物的组成,并可以用上述实验和计算机模拟方 法对新的组成进行分析,以测定这种改变的结构效应。然后将改变了的结构 与该化合物的活性位点结构加以比较,以确定是否取得了改进的适用性或相 互作用效果。用这种方法可以快速评估组成的系统性变化,例如侧基的改 变,以获得具有提高了的特异性或活性的改进的调节化合物或配体。

对于本领域技术人员来说,可用于根据Ob、ObR和相关的转导和转录 因子的活性位点鉴定的其它实施和计算机模拟方法是显而易见的。

分子模拟系统的例子有CHARMm和QUANTA程序(Polygen Corporation,Waltham,MA)。CHARMm执行能量最低化和分子动力学功 能。QUANTA执行分子结构的构建、作图模拟和分析功能。QUANTA可以 完成对各分子之间相互作用的构建、修饰、显现和行为分析。

有很多文章对药物与特异蛋白的相互作用的计算机模拟进行了综述,例 如,Rotivinen等,1988,Acta Pharmaceutical Fenmica 97:159-166; Ripka,新科学家(New Scientist)54-57(June 16,1988);Mckinaly和 Rossmanm,1989,药学,毒理学年度综述(Annu.Rev.Pharmacol.Toxiciol.) 29:111-122;Pemy和Davies,药物设计中的结构-活性定量关系 (OSAR:Quantrtative Structure-Activity Relationships in Drug Design) pp.189-193(Alan R.Liss,Inc.1989);Lewis和Dean,1989 Proc.R.Soc.Lond.236:125-140和141-162;有关核酸成分的模型受体, 可参考Askew等,1989,J.Am.Chem.Soc.111:1082-1090。可用于筛选 并图解说明化合物的其它计算机程序可由诸如BioDesign,Inc.(Pasadena, CA)、Allelix,Inc.(Mississauge,Omario Canada)和Hypercube,Inc.(Cambridge, Ontario)的公司提供。虽然这些程序的设计主要是用于对特定蛋白特异的药物 的,但也可将其修改成针对DNA或RNA的区域特异的药物,一旦所述区域 得以鉴定的话。

尽管以上说明是就设计并制备可以改变结合的化合物而言,但也可用于 筛选已知化合物文库,其中包括天然产物或合成化合物,以及包括蛋白在内 的生物活性材料,以寻找到可作为抑制剂或激活剂的化合物。

通过诸如本文所披露的测定方法所鉴定的化合物可用于诸如阐明obR 基因产物的生物学功能和用于缓解体重疾病的目的。在下文的5.5.4节中将 讨论用于检测由诸如5.5.1至5.5.3节所述方法鉴定的化合物的作用的测定方 法。

                1..能与ObR结合的化合物的

                      体外筛选测定

为了鉴定能与ObR(包括,但不限于ObR的ECD、或CD)相互作用(例 如,与之结合)的化合物,可以设计体外系统。例如,所鉴定的化合物可用于 调节野生型和/或突变型obR基因产物的活性;可用于阐明ObR的生物学功 能;可用于筛选能破坏正常的ObR相互作用的鉴定化合物;或由其本身破坏 这种相互作用。

用于鉴定能与ObR结合的化合物的测定方法的原理包括:制备ObR与 试验化合物的反应混合物,在足于使以上两个部分相互作用并结合的条件下 和反应时间里反应,以形成可以从该反应混合物中清除和/或检测到的复合 物。所用的ObR类型可根据筛选测定的目的而有所变化。例如,在寻找天然 配体的激动剂时,可以使用全长ObR或可溶性截短ObR,如,其分子中缺 失了TM和/或CD的ObR,相当于ECD的肽或含有与有利于该测定系统(例 如,所得到的复合物的标记、分离等)的蛋白或多肽融合的ObR ECD的融合 蛋白。一旦鉴定所寻找的能与所述胞质域相互作用的化合物,就可以使用相 当于ObR CD的肽和含有ObR CD的融合蛋白。

可以多种方式实施所述筛选测定。例如,实施上述测定的一种方法包 括:将ObR蛋白、多肽、肽或融合蛋白或试验化合物固定在一种固相上,并 在反应结束时测定固定在所述固相上的ObR/试验化合物复合物。在所述方法 的一种实施方案中,可将ObR反应剂固定在一种固体表面上,而未被固定的 试验化合物可进行直接或间接固定。

在实践中,微量滴定板可被方便地用作所述固相。被固定的组分可以是 通过非共价或共价结合而固定的。非共价结合可以通过将蛋白溶液简单地涂 在固体表面上并干燥而实现。另外,可以用对待固定的蛋白特异的固定化抗 体,优选为单克隆抗体,把所述蛋白固定在固体表面上。可事先制备好所述 固体表面待用。

为了实施所述测定,将非固定化的组分加到含有该固定组分的涂层表面 上。在反应结束之后,除去未反应的组分(例如,用洗涤方法),其作业条件 为使所有形成的复合物仍固定在固体表面上。可以用多种方法完成对固定在 固体表面上的复合物的检测。如果对事先未固定的组分进行预标记的话,检 测到固定在固体表面上的标记即表明形成了复合物。如果不对事先未固定的 组分进行预标记的话,则可以用一种间接标记来检测固定在固体表面上的复 合物,例如,用对所述事先未固定的组分特异的标记抗体(该抗体可以是用标 记过的抗-Ig抗体直抗或间接标地标记的)。

另外,可以在液相中进行反应,将反应产物和未反应的组分分离,并检 测复合物;例如,用对ObR蛋白、多肽、肽或融合蛋白或试验化合物特异的 固定化抗体固定生成于溶液中的一切复合物,并用对有可能生成的复合物的 其它组分特异的标记抗体检测被固定的复合物。

另外,可以用基于细胞的测定鉴定能与ObR相互作用的化合物。为此, 可以使用能表达ObR的细胞系或通过遗传工程方法产生的(例如,通过ObR DNA转染或转导)能表达ObR的细胞系(例如,COS细胞、CHO细胞、成 纤维细胞等)。可以通过与天然Ob比较或竞争的方式测定试验化合物与诸如 由宿主细胞表达的obR ECD的相互作用。

                 2..测定能与ObR相互作用

                        的胞内蛋白

任何适用于测定蛋白与蛋间相互作用的方法均可用于鉴定能与ObR相 互作用的跨膜蛋白或胞内蛋白。可以使用的常规方法有共免疫沉淀、交联, 以及通过梯度柱或层析柱对细胞裂解液或获自细胞裂解液的蛋白和ObR进 行共纯化,以鉴定所述裂解液中能与ObR相互作用的蛋白。为了进行上述测 定,所使用的ObR组分可以是全长ObR、缺乏膜固着区(membrane-anchoring region)的可溶性衍生物(例如,一种截短的ObR,其中的TM已缺失,所产 生的截短分子含有与CD融合的ECD)、相当于CD的肽或含有ObR的CD 的融合蛋白。一旦分离到这种胞内蛋白,即可对其进行鉴定,然后再将其用 于标准方法中鉴定能与它相互作用的蛋白。例如,用本领域技术人员所熟知 的技术,例如,通过Edman降解技术(例如,参见Creighton,1983,“蛋白质: 结构和分子原理(Proteins:Structures and Molecular Principles)”,W.H. Freeman & Co.,N.Y,pp.34-49)至少能测定与ObR相互作用的胞内蛋白的 部分氨基酸序列。所得到的氨基酸序列可用于指导能被用于筛选编码所述胞 内蛋白的基因序列的寡核苷酸混合物的制备。例如,可以用标准杂交或PCR 技术实现筛选。用于制备寡核苷酸混合物和筛选的技术是众所周知的(例如, 参见Ausubel的著述,同上,和PCR方法:方法和应用指南(PCR Protocols: A Guide to Methods and Applications),1990 Innis,M.等著,Academic Press, Inc.,New York)。

另外,可以采用能同时鉴定编码能与ObR相互作用的跨膜蛋白或胞内 蛋白的基因的方法。例如,所述方法包括以与公知的入gtl1文库抗体检测技 术类似的方法,用标记的ObR蛋白、或ObR多肽、肽或融合蛋白,例如, 与一种标记(如酶、荧光剂、发光蛋白或染料)融合的ObR多肽或ObR功能 域、或Ig-Fc功能域检测表达、文库。

详细披露了一种用于体内检测蛋白相互作用的方法:双杂交系统,但其 用意仅在于说明,而不是限定。该系统的一种型式业已披露(Chien等, 1991,Proc.Natl.Acad.Sci.USA,88:9578-9582)并可通过商业途径从 Clontech(Palo Alto,CA)获得。

简单地讲,用上述系统构建编码两种杂合蛋白的质粒:一种质粒由编码 转录激活蛋白的DNA结合域的核苷酸和与之融合的编码ObR、ObR多肽、 肽或融合蛋白的核苷酸序列组成,而另一种质粒由编码所述转录激活蛋白的 激活域的核苷酸和与之融合的编码一种未知蛋白的、作为cDNA文库的一部 分重组进入该质粒的cDNA组成。将所述DNA-结合域融合质粒和cDNA 文库转入一种酿酒酵母(Saccharomyces Cerevisiae)菌株,该菌株具有一个报道 基因(例如,HBS或lacZ),其调控区含有转录激活物结合位点。仅有任一种 杂合蛋白都不能激活该报导基因的转录:DNA-结合域的杂交不能实现, 因为它不能产生激活功能,激活域的杂交也不能实现,因为它不能定位于激 活物结合位点。两种杂合蛋白的相互作用可以重建功能性激活蛋白,并导致 所述报导基因的表达,通过测定报导基因产物可以检测出该基因的表达。

可将上述双杂交系统或相关方法用于筛选能与“诱铒”基因产物相互作 用的蛋白的激活域文库。举例来说,而不是要进行限定,可将ObR用作诱铒 基因产物。将全基因组或cDNA序列同编码激活域的DNA融合。将该文库 和编码与所述DNA结合域融合的杂合诱饵obR基因产物共转化到酵母报导 菌株中,并筛选所得到的能表达该报导基因的转化体。例如(其用意不是限 定),可以将诸如在图1、图3或图6中示出的obR(或obR的一个功能域) 的开放读框的诱饵obR基因序列克隆到一种载体上,以使其可翻译地融合于 编码GAL 4蛋白的DNA-结合域的DNA上。纯化所述克隆,并提取决定 报导基因表达的文库质粒。然后用DNA测序方法鉴定由该文库质粒编码的 蛋白。

然后,可以用本领域经常采用的方法构建所述细胞系的cDNA文库,可 用该文库检测能与诱饵基因产物相互作用的蛋白。例如,按照本文所披露的 特定系统,可将所述cDNA片段插入一种载体,以使其可翻译地与GAL 4的 转录激活域GAL 4融合。可将该文库随诱饵ObR基因-GAL 4融合质粒一 起共转化到含有lacZ基因的酵母菌株中,该基因由含有GAL 4激活序列的 启动子启动。将一种由cDNA编码的蛋白与能与诱饵ObR基因产物相互作 用的GAL 4翻译激活域融合,可以重建一种活性GAL 4蛋白,并因此启动 HIS3基因的表达。通过其在含有缺少组氨酸的半固体琼脂基培养基的培养皿 上的生长,可以测定能表达HIS3的克隆。然后从这些菌株中纯化cDNA, 并将其用于通过本领域常用的方法制备并分离所述诱铒obR基因相互作用蛋 白。

             3.测定能干扰ObR/胞内或ObR/跨膜

                    大分子的化合物 相互作用

所述能与ObR相互作用的大分子在本文中是指“结合配偶体”。所述结 合体配偶体很可能与ObR信号转导途径有关,并因此参与ObR对体重的调 节。因此,希望鉴定能干扰或破坏上述结合配偶体与Ob的相互作用的化合 物,可将该化合物用于调节ObR活性并控制与ObR活性相关的体重疾病。

用于鉴定能干扰ObR与其配偶体之间的相互作用的测定系统的基本原 理包括:制备一种反应混合物,该混合物含有在上文的5.5.1节和5.5.2节中 所披露的ObR蛋白、多肽、肽或融合蛋白,以及所述结合配偶体,反应是在 使以上两种组分相互作用并结合成复合物的条件下进行,并反应足够的时 间。为了试验一种化合物的抑制活性,在有和没有该试验化合物的条件下制 备反应混合物。试验化合物可在一开始即包含于反应混合物中,或在加入 ObR组分及其配偶体一段时间之后再加入。对照反应混合物是在没有试验化 合物的条件下培养或与空白对照剂一起培养。然后检测由ObR组分和结合配 偶体所生成的任何复合物。在对照反应中可生成复合物,但在含有试验化合 物的反应混合物中不能,这表明所述试验化合物能干扰ObR与其互作型结合 配偶体的相互作用。另外,可将在含有试验化合物和正常ObR蛋白的反应混 合物中的复合物生成与在含有试验化合物和突变型ObR的反应混合物中的 复合物生成加以比较。在希望鉴定能破坏突变型ObR,而不是正常ObR的 相互作用的条件下,这种比较可能很重要。

能干扰ObR及其结合配偶体的相互作用的测定可以异相或均相型式进 行。异相测定包括将ObR组分的产物或其结合配偶体固定在一种固相上,并 在反应结束时检测固定在该固相上的复合物。在均相测定中,整个反应是在 液相中进行的。在每一种方法中,反应物的加入顺序可以改变,以获得有关 被试验化合物的不同资料。例如,通过在有试验物质的条件下进行反应可以 鉴定能通过竞争作用干扰其相互作用的试验化合物;即:在加入ObR组分和 可相互作用的结合配偶体之前或同时加入试验物质。另外,通过在复合物生 成之后将试验化合物加入反应混合物中的方法可以检验能破坏预先生成的 复合物的试验化合物,例如,有高结合常数的化合物,它能将复合物中的一 种成分排斥出去。下面将对各种方法作扼要说明。

在异相测定系统中,将ObR组分或可相互作用的结合配偶体固定在固 体表面上,而对未固定的一类组分进行直接或间接标记。在实践中,经常使 用微量滴定板。被固定的组分可以是通过非共价键或共价键结合固定化的。 非共价结合可以通过简单地将obR基因产物或结合配偶体的溶液涂在固体表 面上并干燥而实现。另外,可以用对待固定的组分特异的固定化抗体将该组 分固定在固体表面上。该表面可事先制备并贮存待用。

为了进行所述测定,让固定组分的配偶体在有或没有试验化合物的条件 下接触涂过的表面。在反应结束后,将未反应的组分除去(例如,通过洗涤), 所生成的一切复合物将仍然固定在所述固体表面上。可以用多种方法实施对 固定在固体表面上的复合物的检测。在对非固定的组分作过预先标记的情况 下,通过检测固定在所述表面上的标记物可以表明复合物的生成。在未对非 固定的组分进行预先标记的情况下,可以用一种直接标记物检测固定在所述 表面上的复合物;例如,使用一种对开始时非固定的组分特异的标记抗体(该 抗体是用标记过的抗-Ig抗体直接或间接标记过的)。根据反应组分的加入 顺序,可以检测出能抑制复合物生成或破坏预先生成的复合物的试验化合 物。

另外,可以在液相中,在有或没有试验化合物的条件下进行反应,将反 应产物和非反应的组分分离,并检测复合物;例如,用对结合组分之一特异 的固定化抗体固定溶液中所生成的任何复合物,并用一种对另一个配偶体特 异的标记抗体检测固定的配偶体。同样,根据向液相中加入反应物的顺序, 可以鉴定能抑制复合物或能破坏预先生成的复合物的化合物。

在本发明的另一种实施方案中,可以采用均相测定。在该方法中,制备 一种由ObR组分和可相互作用的结合配偶体组成的预先生成复合物,其中的 ObR或其结合配偶体是预先标记过的,但由标记物所产生的信号因复合物的 生成而被猝灭(例如,参见Rubenstein的美国专利US 4,109,496,该专利使 用这种方法进行免疫测定)。加入能竞争并排斥预先生成的复合物中的一种组 分的试验物质,会导致出现高于背景的信号。通过这种方法可以鉴定能破坏 ObR/胞内结合配偶体相互作用的试验物质。

在一种具体实施方案中,可制备一种用于固定的ObR融合体。例如, 可以用诸如pGEX-5X-1的融合载体将ObR或诸如与CD相当的肽片段 融合于谷胱甘肽-S-转移酶(GST)基因上,用这种方法保留其在所产生的 融合蛋白中的结合活性。可以用在上文的5.3节中所述的本领域中常用的方 法纯化可相互作用的结合配偶体,并制备单克隆抗体。例如,可以用本领域 中常用的方法用放射性同位素125I标记所述单克隆抗体。例如,在异相测定 中,可将GST-ObR融合蛋白固定在谷胱甘肽-琼脂糖颗粒上。然后在有 或没有试验化合物的条件下,以使得相互作用和结合能够发生的方式加入可 相互作用的结合配偶体。在反应时间结束后,可将未结合的材料洗去,并可 将标记过的单克隆抗体加入该系统中,使其与复合的组分结合。通过测定仍 然与谷胱甘肽-琼脂糖球结合的放射性活性量,可以测定 obR基因产物与可 相互作用的结合配偶体之间的相互作用。试验化合物对上述相互作用的成功 抑制可导致所测得放射性活性的下降。

另外,可以在没有固体谷胱甘肽-琼脂糖颗粒的条件下在液体中混合 GST-ObR融合蛋白和可相互作用的结合配偶体。可以在以上组分相互作 用期间或之后加入试验化合物。然后将该混合物加入谷胱甘肽-琼脂糖颗粒 中,并洗去未结合的材料。同样,可通过加入标记过的抗体并测定与所述颗 粒相关的放射性活性的方法检测对ObR/结合配偶体相互作用的抑制程度。

在本发明的另一种实施方案中,可以用相当于ObR和/或可相互作用或 结合的配偶体(此时该结合配偶体是蛋白)的结合域的肽片段取代一种或两种 全长蛋白,实施相同的技术。可以用本领域中常用方法的任一种鉴定并分离 结合位点。所述方法包括,但不限于诱变编码所述蛋白之一的基因,并通过 共免疫沉淀测定对结合的破坏作用。然后可以选择编码复合物中第二种组分 的基因的补偿突变。对编码相应蛋白的基因所作的序列分析将揭示出相应于 参与相互作用结合的蛋白区域的突变。另外,可以用上述方法将一种蛋白固 定在一种固体表面上,并使其相互作用于并结合于其标记过的结合配偶体 上,该结合配偶体曾用诸如胰蛋白酶的蛋白酶处理过。在洗涤之后,一种短 的、含有所述结合域的标记过的肽仍保持与固相材料结合,可以分离并通过 氨基酸测序鉴定该肽。而且,一旦得到编码胞内结合配偶体的基因,即可制 备出能表达所述蛋白的肽片段的短的基因片段,然后可测试其结合活性并进 行纯化或合成。

例如(不是出于限定目的),可以通过制备GST-ObR融合蛋白并使其 结合于谷胱甘肽琼脂糖颗粒上而将obR基因产物固定在一种如上所述的固体 材料上。可以用诸如35S的放射性同位素标记可相互作用的结合配偶体,并 用诸如胰蛋白酶的蛋白酶进行裂解。然后将裂解产物加入固定的GST-ObR 融合蛋白中,并使其结合。在洗去未结合的肽之后,可以用众所周知的方法 洗脱代表胞内结合配偶体结合域的标记过的结合材料,纯化、并分析其氨基 酸序列。可以通过合成方法生产所鉴定的肽,或用重组DNA技术将其融合 在合适的易化蛋白。

                   4..鉴定能缓解体重疾病的

                       化合物的测定方法

可以检测包括,但不限于通过诸如在上文的5.5.1至5.5.3节中所披露的 测定方法鉴定的化合物在缓解包括肥胖在内的体重疾病综合症方面的能 力。上述测定方法可以鉴定影响ObR活性的化合物(例如,能与ObR结合、 抑制天然配体结合,和激活信号转导(激动剂)或封阻激活作用(拮抗剂)的化合 物,和能与ObR的天然配体结合并中和配体活性的化合物);或能影响obR 基因活性的化合物(通过影响obR基因的表面,包括分子,例如,能影响或 干扰剪接过程的蛋白或小的有机分子,以便调节全长或截短型式的ObR的表 达)。不过,应当指出的是,所披露的测定方法还可用于鉴定能调节ObR信 号转导的化合物(例如,能影响下游信号转导过程的化合物,如酪氨酸激酶或 磷酸酶活性的抑制剂或增强剂,所述酶参与由Ob与ObR结合而激活的信号 转导)。能影响ObR信号转导途径的另一步骤的化合物的鉴定和使用也属于 本发明范畴,其中,obR基因和/或obR基因产物参与了这一途径,并可以 通过影响这一途径来调节ObR对体重疾病发展的影响。所述化合物可被用作 治疗体重疾病方法的一部分。

本发明涉及基于细胞和基于动物模型的、用于鉴定具有减轻体重疾病综 合症能力的化合物的测定方法。所述基于细胞的测定系统还可被用作测定天 然配体Ob,包括重组或合成产生的Ob和Ob突变体的纯度和效力的“金标 准(gold standard)”。

可将基于细胞的系统用于鉴定能起到缓解体重疾病综合症作用的化合 物。例如,所述细胞系统可以包括重组或非重组细胞,如能表达obR基因的 细胞系。例如,可以使用脉络丛细胞、下丘脑细胞或源于脉络丛或下丘脑的 细胞系。另外,可将通过遗传工程方法产生的能表达功能性ObR可效应于通 过天然Ob配体的激活作用的表达宿主细胞(例如,COS细胞、CHO细胞、 成纤维细胞)用作测定的终止,例如,通过化学或表型变化、另一个宿主细胞 基因诱导、离子流动的变化(例如,Ca+)+、宿主细胞蛋白酪氨酸磷酸化等 的测定而实现。

在使用所述细胞系统时,用被怀疑具有缓解体重疾病综合症的能力的化 合物处理细胞,化合物的浓度高到、而且处理时间长到足于诱发被处理的细 胞产生这种体重疾病的缓解作用。处理之后,对细胞进行测定,以测定obR 基因表达的变化,例如,测定细胞裂解液中的obR mRNA转录物(例如,通 过Northern分析法)或测定细胞中ObR蛋白的表达;能调控或调节obR基因 表达的化合物是治疗剂的优良候选对象。另外,对细胞进行检查,以确定是 否有一种或几种体重疾病样细胞表型已变得接近更正常或更野生的表型、非 体重疾病表型或一种更倾向于产生低发病率或严重度的疾病综合症的表 型。另外,可以测定ObR作为其一个部分的信号转导途径的组分的表达和/ 或活性,或ObR信号转导途径本身的活性。

例如,在照射之后,通过与源于未照射过的对照细胞的裂解液进行比较 测定处理细胞裂解液中宿主细胞蛋白的酪氨酸磷酸化的存在。在上述测定系 统中,试验化合物抑制宿主细胞蛋白酪氨酸磷酸化的能力表明,该试验化合 物能抑制由ObR激活作用起动的信号转导。可用Western印迹法对细胞裂解 液进行方便地测定;即:通过凝胶电泳分离宿主细胞、转移并用一种抗-磷 酸酪氨酸检测抗体(例如,用诸如放射性标记物、荧光剂、酶等的信号发生化 合物标记过的抗-磷酸酪氨酸抗体)检测(例如,参见Glenney等,1988,免 疫方法杂志(J.Immunol.Methods)109:277-285;Fradkelton等,1983, Mol.Cell.Biol.3:1343-1352)。另外,可以采用ELISA方法,其中,用一 种对目标宿主细胞蛋白特异的固定抗体固定参与ObR信号转导途径的一种 特定宿主细胞蛋白,并用标记过的抗磷酸酪氨酸抗体检测固定化宿主细胞蛋 白上磷酸酪氨酸的有或无(参见king等,1993,生命科学(Life Sciences)53: 1465-1472)。在另一种方案中,作为ObR刺激信号转导的终止,可以测定 离子流动,如离子流动。

另外,可以测定STAT蛋白的激活作用和由IL-6效应基因元件介导的 转录刺激作用。例如,可以制备一种重组表达载体,使其含有克隆在接近一 个报导基因处的IL6效应元件序列,并可通过测定报导基因活性测定ObR活 性的调节。可以使用的报导基因包括,但不限于编码氯霉素乙酰转移酶 (CAT)、萤火虫荧光素酶或人生长激素的基因。

另外,可将包括诸如ob、db和ob/db小鼠的基于动物的体重疾病系统 用于鉴定能缓解体重疾病样综合症的化合物。可将所述动物模型用作鉴定能 有效治疗上述疾病的药物、药剂、疗法和处置方法的被作用物。例如,可以 用被怀疑具有缓解体重疾病综合症的化合物处理动物模型,该化合物的浓度 高到、而且处理时间长到足于引起被处理动物发生体重疾病的缓解作用。可 以通过评价与诸如肥胖的体重疾病相关的疾病的恢复监测动物对上述处理 的反应。就处置方法而言,任何能恢复体重疾病样综合症的任何方面的治疗 均被视为用于人类体重疾病治疗处置的可选方案。如将在下面的5.7.1节中 讨论的,可通过绘制剂量效应曲线的方法测定试验剂的剂量。

              F..包括体重疾病在内的体重治疗

本发明涉及用于改变体重并治疗体重疾病的方法和组合物,所述疾病包 括,但不限于肥胖、恶病质和厌食。由于正常obR基因产物功能的丧失会导 致肥胖表型的发展,提高obR基因产物活性或激活ObR途径(例如,下游激 活)有利于使表现出缺陷型obR基因表达水平和/或obR活性水平的肥胖个体 逐渐趋于接近正常状态。

另外,通过降低obR基因表达水平和/或obR基因活性和/或下调ObR 途径的活性(例如,通过定向下游信号转导过程),可以缓解某些体重疾病的 综合症,例如,涉及低于正常体重表型的恶病质。下面探讨不同的方法

               1..制ObR表达或ObR活性,

                    促进体重增加

任何能中和Ob或抑制obR基因表达(抑制转录或翻译)的方法均可用于 实现体重增加。所述方法可被用于治疗诸如厌食或恶病质的疾病。还可将所 述方法用于农业目的;即提高家畜动物的体重。

例如,可通过服用能结合并“中和”循环Ob的可溶性肽、蛋白、融合 蛋白或抗体(包括抗独特型抗体),和ObR的天然配体实现体重增加。为此, 可以使用相当于ObR的ECD的肽、ObR的可溶性缺失突变型(例如,Δ TMObR突变型)或ObR功能域中的任一个或融合于另一种多肽(例如,IgFc 多肽)的突变型。另外,可以使用能模拟ObR ECD并中和Ob的抗独特型抗 体或抗独特型抗体的片段(参见5.3节,同上)。给受治对象服用的上述ObR 肽、蛋白、融合蛋白、抗独特型抗体或Fab的量足于中和Ob并实现体重增 力。

可使用相当于ECD具有图1或6中所示的氨基酸序列,大约从23-837 号氨基酸残基,或具有图3所示的氨基酸序列,从约从21-839号氨基酸 残基的ObR肽。还可以使用ObRΔTM突变体中23个氨基酸的疏水锚定序 列(例如,大约为图1或6中的838-860号氨基酸残基,或大约为图3中 840-862号氨基酸残基)。ObR、ObR ECD或ΔTM ObR与IgFc多肽的 融合不仅可以提高该制剂的稳定性,而且可以延长ObR-Ig融合蛋白在体 内的半衰期和提高其活性。可对该融合蛋白的Ig部分的Fc片段作进一步的 修饰,以降低免疫球蛋白的效应子功能。参见下文的第10节。

在本文所披露的一种特定实施方案中,将小鼠或人ObR的胞外域同IgG 恒定区融合。如图10所示,纯化的ObR-IgG能够有效地抑制或中和AP -OB融合蛋白与细胞表面ObR的结合(参见10.4.节)。

在中和循环Ob的另一种实施方案中,可以给患者服用经过遗传工程操 作的、能表达所述可溶型式或分泌型式ObR的细胞,使其能在体内起到“生 物反应器的作用,以便能连续供应Ob中和蛋白。所述细胞可以获自所述患 者或一个MHC相容性供体,并可以包括,但不限于成纤维细胞、血细胞(例 如,淋巴细胞)、脂肪细胞、肌细胞、内皮细胞等。可以用重组DNA技术对 所述细胞进行体外遗传工程操作,以便将ObR ECD、ΔTM ObR或ObR- Ig融合蛋白(例如,ObR-、ECD-或ΔTM ObR-IgFc融合蛋白)的编码 序列导入该细胞中,例如,通过转导(使用病毒载体,优选使用能将转基因整 合到细胞基因组中的载体)或转染方法,包括,但不限于使用质粒、粘粒、 YAC、电穿孔、脂质体等。可将ObR编码序列置于一个强组成型或诱导型 启动子或启动子/增强子的控制之下,以实现所述ObR肽或融合蛋白的表达 和分泌。可将所制备的能表达并分泌所需ObR产物的细胞系统地导入患者体 内,例如,通过腹膜内注射方法导入循环系统,位于脉络丛或下丘脑。另外, 可将所述细胞掺入一种基质,并植入体内,例如,可将通过遗传工程方法产 生的成纤维细胞作为皮肤移植物的一部分植入;而通过遗传工程方法产生的 内皮细胞可以作为血管移植物的一部分植入(例如,参见Anderson等,US 5,399,349;和Mulligan & Wilson,US 5,460,959,它们分别被作为整体收 作本文参考)。

如果待服用的细胞是非自体细胞,则可以用众所周知的方法服用这种细 胞,只要该方法可以预防针对导入细胞的宿主免疫反应的发生。例如,可以 胶囊化型式导入所述细胞,虽然可以与紧邻的胞外环境进行组分交换,但所 导入的细胞不会被宿主的免疫系统识别。

在另一种实施方案中,可以设计体重增加疗法,以降低内源ObR基因 表达的水平,例如,用反义或核糖酶方法抑制或阻止obR mRNA转录物的翻 译;用三重螺旋方法抑制obR基因的转录;或通过定向同源重组使obR基因 或其内源启动子失活或“失效”。由于obR基因是在大脑中,包括脉络丛和 下丘脑中表达,给药技术最好被设计成能通过血脑屏障(参见PCT WO89/10134,该专利被作为一个整体收作本文参考)。另外,可将本文所披 露的反义、核糖酶或DNA结构直接给药至含有目标细胞的部位;例如,脉 络丛和/或下丘脑。

反义方法包括设计能与ObR mRNA互补的寡核苷酸(DNA或RNA)。反 义寡核苷酸能与互补的ObR mRNA转录物结合,并抑制其翻译。绝对互补 性尽管是优选的,但是没有必要。在本文中,“互补”于一部分RNA的序列 是指具有足于与该RNA杂交,形成稳定的双链体的序列;对于双链反义核 酸来说,可以对该双链DNA的一条链进行检测,或测定三链体的形成。杂 交能力同时取决于其互补程度和反义核酸的长度。一般,杂交的核酸越长, 它所包含的与RNA错配的碱基越多,并仍然可形成稳定的双链体(或三链 体,如果条件许可的话)。本领域技术人员通过用标准方法测定杂交复合体的 熔点可以确定错配的允许度。

互补于所述信息(message)5'末端,例如,5'非翻译序列直至并包括AUG 起始密码子在内的序列的寡核苷酸,能最有效地抑制翻译作用。不过,最近 已证实互补于mRNA3'非翻译序列的序列也能有效抑制mRNA的翻译。大致 参阅Wagner,R.,1994,Nature 372:333-335。因此,在反义方法中,可 以用互补于图1(鼠短型)、图6(鼠长型)或图3(人长型)所示obR的5′-或3' -非翻译、非编码区的寡核苷酸抑制内源obR mRNA的翻译。互补于该 mRNA的5'非翻译区的寡核苷酸应当包括AUG起始密码子。互补于mRNA 编码区的反义寡核苷酸是翻译的不十分有效的抑制剂,但可用于本发明中。 反义核酸无论被设计成能与ObR mRNA的5'、3′-或编码区杂交,其长度 均至少应为6个核苷酸,而且,优选为长度为6至大约50个核苷酸的寡核 苷酸。在特定场合下,该寡核苷酸至少为10个核苷酸,至少17个核苷酸、 至少25个核苷酸或至少50个核苷酸。

无论靶序列的选择如何,最好首先进行体外研究,以便对该反义寡核苷 酸抑制基因表达的能力进行定量。这些研究优选使用能区分反义基因抑制和 寡核苷酸的非特异生物学效应的对照。同样理想的是,该研究能比较目标 RNA或蛋白的含量和内在对照RNA或蛋白的含量。另外,预计将用所述反 义寡核苷酸获得的结果与用对照寡核苷酸获得的结果进行比较。理想的是, 对照寡核苷酸的长度大致与试验寡核苷酸的长度相同,而且,该寡核苷酸的 核苷酸序列与反义序列的差异不超过抑制与靶序列进行特异杂交所必须的 程度。

所述寡核苷酸可以是单链或双链的DNA或RNA或其嵌合混合物或衍生 物或修饰型式。举例来说,可以对该寡核苷酸的碱基部分、糖部分或磷酸骨 架进行修饰,以提高该分子的稳定性、杂交能力等。该寡核苷酸可以包括其 它附属基团,如肽(例如,用于在体内寻靶宿主细胞受体的肽),或能促进跨 细胞膜转运(例如,参见Letsinger等,1989,Proc.Natl.Acad.Sci.U.S.A.86: 6553-6556;Lemaitre等,1987,Proc.Natl.Acad.Sci.USA 84:648-652; PCT公开号WO 88/09810,出版日1988年12月15日)或通过血脑屏障转运 (例如,参见PCT公开号WO 89/10134,出版日1988年4月25日)的制剂, 杂交触发的裂解剂(例如,参见Krol等,1988,生物技术(BioTechniques)6: 958-976)或嵌入剂(例如,参见Zon,1988,药学研究(Pharm.Res.)5:539 -549)。为此,可将所述寡核苷酸缀合于另一种分子上,例如,肽、杂交触 发的交联剂、转运剂、杂交触发的裂解剂上。

所述反义寡核苷酸可以包括至少一个修饰的碱基部分,该碱基部分选自 包括,但不限于由下列化合物组成的一组:5-氟尿嘧啶、5-溴尿嘧啶、 5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧 基羟甲基)尿嘧啶、5-羧甲基氨甲基-2硫尿苷、5-羧甲基氨甲基尿嘧 啶、二氢尿嘧啶、β-D-半乳糖queosine、肌苷、N6-异戊基腺嘌呤、 1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2 -甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲 基鸟嘌呤、5-甲基氨甲基尿嘧啶、5甲氧基氨甲基-2-硫尿嘧啶、β -D-甘露糖queosine、5′-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2 -甲硫基-N6-异戊基腺嘌呤、尿嘧啶-5-氧代乙酸(Ⅴ)、 wybutoxosine、假尿嘧啶、queosine、2-硫胞嘧啶、5-甲基-2-硫尿 嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧代 乙酸甲酯、尿嘧啶-5-氧代乙酸(Ⅴ)、5-甲基-2-硫尿嘧啶、3-(3 -氨基-3-N-2-羧丙基)尿嘧啶、(acp3)W、和2,6-二氨基嘌呤。

所述反义寡核苷酸还可以包括至少一个修饰过的糖部分,该部分选自包 括,但不限于下列化合物组成的一组:阿拉伯糖、2-氟阿拉伯糖、木糖 和己糖。

在另一种实施方案中,该反义寡核苷酸包括至少一个修饰过的磷酸骨 架,该骨架选自由下列化合物组成的一组:硫代磷酸酯、二硫代磷酸酯、硫 代氨基磷酸酯、氨基磷酸酯、二氨基磷酸酯、甲基磷酸酯、烷基磷酸三酯和 formacetal或其类似物。

在另一种实施方案中,所述反义寡核苷酸是一种α-端基异构寡核苷 酸。α-端基异构寡核苷酸能与互补RNA形成特殊的双链杂合体,其中, 与常见的β-单元不同,所述链是彼此平行地取向的(Gautier等,1987, Nucl.Acids.Res.15:6625-6641)。所述寡核苷酸是2'-O-甲基核糖核苷 酸(Inoue等,1987,Nucl.Acids Res.15:6131-6148)、或嵌合的RNA- DNA类似物(Inoue等,1987,FEBS Lett.215:327-330)。

本发明的寡核苷酸还可以用本领域公知的标准方法合成,例如,使用一 台自动化DNA合成仪(如由Biosearch,Applied Biosystems等出售的合成 仪)。举例来说,可以用Stein等的方法(1988,Nucl.Acids Res.16:3209) 合成硫代磷酸酯寡核苷酸,甲基磷酸酯寡核苷酸可用可控孔度玻璃聚合物支 持体(Sarin等,1988,Proc.Natl.Acad.Sci.U.S.A.85:7448-7451)等进行制 备。

虽然可以使用互补于obR编码区序列的反义寡核苷酸,但互补于转录的 非翻译区的寡核苷酸最佳。例如,可将具有如下序列的反义寡核核苷酸用于 本发明中:

a)5'-CATCTTACTTCAGAGAA-3',它互补于图3中的核苷酸-14 至+3。

b)5'-CATCTTACTTCAGAGAAGTACAC-3',它互补于图3中的核 苷酸-20至+3。

c)5'-CATCTTACTTCAGAGAAGTACACCCATAA-3',它互补于图3 中的核苷酸-26至+3。

d)5'-CATCTTACTTCAGAGAAGTACACCCATAATCCTCT-3',它互 补于图3中的寡核苷酸-32至+3。

e)5'-AATCATCTTACTTCAGAGAAGTACACCCATAATCC-3,它 互补于图3中的核苷酸-29至+6。

f)5′-CTTACTTCAGAGAAGTACACCCATAATCC-3,它互补于图3 中的核苷酸-29至-1。

g)5′-TCAGAGAAGTACACCCATAATCC-3,它互补于图3中的核 苷酸-29至-7。

h) 5'-AAGTACACCCATAATCC-3,它互补于图3中的核苷酸-29 至-13。

所述反义分子应当被输入能在体内表达ObR的细胞中,例如,脉络丛 和/或下丘脑。已建立起多种用于将反义DNA或RNA送入细胞的方法;例 如,可将反义分子直接注射到组织位点,或全身性给药针对目标细胞而设计 的修饰过的反义分子(例如,与能特异结合表达于靶细胞表面的受体或抗原的 肽或抗体的反义分子)。

不过,要使该反义分子达到足以抑制内源mRNA表达的胞内浓度通常 是很困难的。因此,优选的方法是使用一种重组DNA结构,其中,该反义 寡核苷酸被置于强polⅢ或polⅡ启动子的操纵之下。用这种结构转染患者 体内的靶细胞,可导致足够量的单链RNA转录,这些单链RNA能与内源 obR转录物形成互补的碱基对,从而阻止obR mRNA的翻译。例如,可以体 内导入一种载体,以便该载体能被细胞摄入,并指导反义RNA的转录。所 述载体可以保持其附加体型式或进行染色体整合,只要它能够转录产生所需 的反义RNA即可。所述载体可以用本领域规范化的重组DNA技术制备。载 体可以是用于在哺乳动物细胞中复制和表达的质粒、病毒或本领域公知的其 它载体。编码反义RNA的序列的表达可以通过本领域公知的任何启动子在 哺乳动物中实施,优选在人细胞中实施。所述启动子可以是诱导型的或组成 型的。所述启动子包括,但不限于:SV40早期启动子片段(Bernoist和 Chambon,1981,Nature 290:304-310)、包含于Rous肉瘤病毒的3'长的末 端重复中的启动子(Yamamoto等,1980,Cell 22:787-797)、疱疹胸苷 激酶启动子(Wagner等,1981,Proc.Natl.Acad.Sci.U.S.A.78:1441- 1445)、金属硫蛋白基因的调控序列(Brinster等,1982,Nature 296:39- 42)等。任何类型的质粒、粘粒、YAC或病毒载体均可用于制备能被直接导 入诸如脉络丛或下丘脑的组织位点的重组DNA结构。另外,可将病毒载体 用于选择性地感染目标组织(例如,可将疱疹病毒用于感染脑组织),在每一 种情况下均可通过其它途径(例如,全身给药)实现给药。

被设计用于催化裂解obR mRNA转录物的核酶分子也可被用于抑制 obR mRNA的翻译和ObR的表达(例如,参见PCT国际公开WO 90/11364, 公开日1990年10月4日;Sarver等,1990,Science 247:1222-1225)。 虽然可以用能在特异的识别序列上裂解mRNA的核酶来破坏obR mRNA, 但优选使用锤头状核酶。锤头状核酶能在由旁侧区限定的部位裂解mRNA, 该旁侧区与靶mRNA形成互补碱基对。唯一的要求是,所述靶mRNA具有 如下的2个碱基的序列:5'UG-3′。锤头状核酶的构建和制备为本领域 所熟知,并由Haseloff和Gerlan作过更全面的描述(1988,Nature,334:585 -591)。在人ObR cDNA的核苷酸序列上(图3)有数百个潜在的锤头状核酶 裂解位点。理想的是,所述核酶通过遗传工程方法生产的,以使其裂解识别 位点位于接近ObR mRNA的5'末端处;即:提高效率,同时减少非功能性 mRNA转录物的胞内积累。

例如,可将具有如下序列的锤头状核酶用于本发明中:

a)5'-ACAGAAUUUUUGACAAAUCAAAGCAGANNNNUCUGAGNA GUCCUUACUUCAGAGAA-3',它可以裂解图3所示人obR mRNA的核 苷酸-1至1。

b)5'-GGCCCGGGCAGCCUGCCCAAAGCCGGNNNNCCGGAGNAG UCGCCAGACCGGCUCGUG-3',它可以裂解图3所示核苷酸-175至- 176。

c)5'-UGGCAUGCAAGACAAAGCAGGNNNNCCUGAGNAGUCCU UAAAUCUCCAAGGAGUAA-3',它可以裂解图3所示核苷酸102至103。

d)5'-UAUAUGACAAAGCUGUNNNNACAGAGNAGUCCUUGUGUG GUAAAGACACG-3′,它可裂解图3所示核苷酸994至995。

e)5'-AGCACCAAUUGAAUUGAUGGCCAAAGCGGGNNNNCCCGA GNAGUCAACCGUAACAGUAUGU-3',它可裂解图3所示核苷酸2142 至2143。

f)5'-UGAAAUUGUUUCAGGCUCCAAAGCCGGNNNNCCGGAGNA GUCAAGAAGAGGACCACAUGUCACUGAUGC-3',它可裂解图3所示 核苷酸2736至2737。

g)5'-GGUUUCUUCAGUGAAAUUACACAAAGCAGCNNNNGCUGA GNAGUCAGUUAGGUCACACAUC-3',它可裂解图3所示核苷酸3492 至3493。

h)5'-ACCCAUUAUAACACAAAGCUGANNNNUCAGAGNAGUCAU CUGAAGGUUUCUUC-3′,它可裂解图3所示核苷酸3521至3522。

本发明的核酶还包括RNA内切核糖核酸酶(以下称“Cech型核酶”), 如天然存在于嗜热四膜虫(Tetrahymena Thermophila)中的一种酶(被称为IVS 或L-19 IVS RNA),Thomas Cech及其合作者对此做过详尽说明(Zaug等, 1984,Science,224:574-578;Iang和Cech,1986,Science,23: 470-475;Zang等,1986,Nature,324:429-433;国际专利申请公 开号WO 88/04300,由University PatentInc.公开;Been和Cech,1986, Cell,47:207-216)。Cech型核酶具有一个有8个碱基对的活性位点, 它能与靶RNA序列杂交,然后裂解该靶RNA。本发明涉及能寻靶ObR上 的8个碱基对的活性位点序列的Cech型核酶。

在反义方法中,所述核酶可以由修饰的寡核苷酸(例如,为了提高其稳定 性、定向性等)组成,并应当送入能在体内表达ObR的细胞中,例如,下丘 脑和/或脉络丛。一种优选的输送方法包括受一个强的组成型palⅢ或polⅡ 启动子控制的“编码”所述核酶的DNA结构,以便转染的细胞能产生足够 数量的核酶,以破坏内源obR信息,并抑制翻译。由于核酶不同于反义分子, 它是催化性的,较低的胞内浓度即可有效。

通过使用定向的同源重组方法使obR基因或其启动子失活或“失效”, 也可以降低内源ObR基因的表达(例如,参见Smithies等,1985,Nature 317:230-234;Thomas & Capecchi,1987,Cell 51:503-512; Thompson等,1989 Cell 5:313-321;以上文献分别被以全文型式收作 本文参考)。例如,可以用有或没有选择标记和/或负选择标记的、其旁侧为 与内源obR基因(该ObR基因的编码区或调控区)同源的DNA的突变型非功 能性ObR(或一种完全无关的DNA序列)转染能在体内表达ObR的细胞。通 过定向同源重组插入该DNA结构,可导致obR基因失活。这种方法特别适 用于农业领域,其中,对ES(胚胎于)细胞的修饰可用于产生具有失活ObR 的动物子代(例如,参见Thomas和Capecchi1987和Thompson1989,同上)。 不过,也可以对该方法加以改进,以适用于人,用合适的病毒载体将所述重 组DNA结构直接给药或导引至所需的体内部位,例如,用疱疹病毒载体向 诸如下丘脑和/或脉络丛的脑组织输送。

另外,通过定向互补于obR基因调控区(即:obR启动子和/或增强子) 脱氧核糖核苷酸序列)形成三重螺旋结构,抑制obR基因在体内的靶细胞中 表达,可以减弱内源obR基因表达(大致参见Helene,C.1991,Anticancer Drug Des.6(6):569-84;Helene,C.等,1992,Ann,N.YAccad.Sci.660:27- 36;和Maher,L.J.,1992,Bioassays 14(12):807-15)。

在本发明的又一个实施方案中,用“显性失活”方法降低ObR活性, 以实现体重增加。为此,可将编码缺陷型ObR的结构用于基因治疗方法中, 以减弱适当靶细胞中的ObR活性。例如,如将能指导宿主细胞表达ObRs的 核苷酸序列导入脉络丛或下丘脑的细胞中(通过上述体内或来自体内的基因 疗法),所表达的ObRs的CD(例如,图1中861-894号氨基酸残基;图6 中861-1162号氨基酸残基;或图3中863-1165号氨基酸残基)或CD的 一部分(例如,框1Jak相互作用序列;图1和6的氨基酸残基861-884; 或图3的氨基酸残基863-886)是缺失的或突变的。另外,可以用定向同源 重组的方法将这种缺失或突变导入受治对象下丘脑或脉络丛的内源ObR基 因中。这种用工程方法所得到的细胞可以表达非功能性受体(即:一种能结合 其天然配体,但不能进行信号转导的固着受体)。存在于脉络丛或下丘脑中的 上述工程细胞对内源Ob配体应当表现出较弱反应,从而导致体重增加。

              2..恢复或加强ObR表达或活性,

                     促进体重下降

就提高正常obR基因表达和/或obR基因产物活性而言,可将obR核酸 序列用于治疗包括肥胖在内的体重疾病。当肥胖的原因是缺陷型ObR时,可 以诸如基因替代疗法型式施治。具体地讲,可以用载体将一个或几个拷贝的 正常obR基因或能指导具有正常功能的obR基因产物产生的obR基因的一 部分插入患者或动物受治对象体内的合适细胞中,所述载体包括,但不限于 腺病毒、腺伴随病毒、逆转录病毒和疱疹病毒载体,此外,还有能将DNA 导入细胞的其它颗粒子,如脂质体。

由于obR基因是在包括脉络丛和下丘脑的脑组织中表达的,所述基因替 代疗法技术应当能够将obR基因送至患者体内的上述类型细胞中。因此,应 将输送ObR基因的方法设计成能顺利通过血-脑屏障,这种方法为本领域技 术人员所熟知(例如,参见PCT申请,公开号WO 98/10134,该专利被以全 文型式收作本文参考),或者,该方法应包括将所述obR基因序列直接给药 至待表达该obR基因序列的细胞部位。另外,可以用定向同源重组的方法纠 正诸如脉络丛和/或下丘脑的适当组织中的缺陷型内源ObR基因。在动物中, 可将定向同源重组用于纠正ES细胞中的缺陷,以产生具有纠正了的性状的 子代。

可用于提高obR基因表达的总体水平和/或ObR活性的其它方法包括, 将适当的ObR表达细胞,优选为自体细胞导入患者体内,导入的部位和数量 足于缓解包括肥胖在内的体重疾病综合症。所述细胞可以是重组型的或非重 组型的。可被用于提高患者体内obR基因表达的总体水平的细胞包括正常细 胞,尤其是能表达obR基因的下丘脑细胞。可将所述细胞用于大脑的解剖部 位,或作为组织移植物放置在身体的不同部位。这种基于细胞的基因治疗技 术为本领域技术人员所熟知,例如,参见Anderson等的美国专利US 5,399,349;Mulligan和Wilson的美国专利US 5,460,959。

最后,可将在上述测定中鉴定的能激发或加强由ObR激活的信号转导, 例如,通过激活ObR级联的下游信号转导蛋白,并由此避开缺陷型ObR的 化合物用于实现体重的减少。有关制剂及服用方式取决于该化合物的物理化 学特性。所述服用方式包括可通过血脑屏障的已知技术。

                   G..药用制剂和给药方法

可以给患者服用治疗有效剂量的被确认能影响obR基因表达或ObR活 性的化合物,以治疗或缓解包括肥胖、恶病质和厌食在内的体重疾病。治疗 有效剂量是指足于导致体重疾病症状减轻的所述化合物用量。

                        1..有效剂量

可以通过标准药理学方法,用细胞培养物或实验动物测定所述化合物的 毒性和疗效,例如,测定其LD50(使群体的50%致死的剂量)和ED50(对群体 的50%有治疗效果的剂量)。毒性作用和治疗作用的剂量比为治疗指数,并 可以LD50/ED50之比型式表示。优选具有较大治疗指数的化合物。尽管可以 使用具有毒副作用的化合物,但要采取防范措施,以设计出能将所述化合物 定向给药至受治组织的给药系统,以减少对无关细胞的潜在危害,从而减轻 其副作用。

可将在细胞培养试验和动物研究中取得的资料用于制备供人体使用的 各种剂量。所述化合物的剂量优选处于这样的循环浓度范围内:其中包括 ED50,少有或没有毒性。根据所用的剂型和给药途径,其剂量可以在该范围 内变动。对于用于本发明方法的任何化合物来说,都可以通过细胞培养试验 初步计算出其治疗有效剂量。在动物模型中,可以制备能达到包括IC50(即: 能实现对症状的半数最大抑制的试验化合物浓度)在内的循环血浆浓度范围 的剂量,这一剂量是在细胞培养中测定的。上述资料可被用于更精确地确定 适用于人体的剂量。例如,通过高效液相层析可以测定在血浆中的浓度。

                        2..制剂及用途

可以通过常规方法,用一个或几种生理学上可以接受的载体或赋形剂制 备适用于本发明的药用组合物。

因此,可将所述化合物及其生理学上可以接受的盐和溶剂化物制成适于 通过吸入或吹入(经口或鼻)或口服、颊服(buccal)、肠胃外或直肠使用方法给 药的型式。

对于口服而言,该药用组合物可以采用诸如通过常规方法,用诸如粘结 剂(例如,预凝胶化玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素)的可以 药用的赋形剂、填料(例如,乳糖、微晶纤维素或磷酸氢钙)、润滑剂(例如, 硬脂酸镁、滑石或石)、崩解剂(例如,铃薯淀粉或淀粉乙醇酸钠)、或湿 润剂(例如,十二烷基硫酸钠)制备成的片剂或胶囊型式。可以用本领域众所 周知的方法对片剂进行包衣。用于口服的液体制剂可以采用诸如溶液、糖浆 或悬液的型式,或以干制品型式提供,在使用之前用水或其它合适载体制成 液体。上述液体制剂可以通过常规方法用诸如悬浮剂(例如,山梨醇糖浆、纤 维素衍生物或氢化食用脂肪)、乳化剂(例如,卵磷脂和阿拉伯胶);非水媒介 物(例如,杏仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲 酸甲酯或丙酯或山梨酸)的可以药用的添加剂制备。如有必要,该制剂还可以 含有合适的缓冲盐、矫味剂、着色剂和增甜剂。

用于口服的制剂适于被制成能可控制地释放活性化合物的型式。

对于颊服来说,所述组合物可以采用以常规方法制备的片剂或锭剂型 式。

对于吸入服用来说,用于本发明的化合物通常是以气溶胶喷雾型式给 药,该喷雾剂由加压装置或喷雾器用诸如二氯二氟甲烷、三氯氟代甲烷、二 氯四氟乙烷、CO2或其它合适气体的合适的推进剂提供。就加压气溶胶而 言,其剂量单位可以通过设置一个以输送定量气溶胶的型式确定。可将用 于吸气器或吹气器的诸如明胶的胶囊和药筒制成含有由所述化合物和诸如 乳糖或淀粉的合适粉状基质组成的粉状混合物的型式。

可将上述化合物制成适于通过注射的肠胃外给药型式,例如,通过 (bolus)注射或连续输注型式服用。适于注射的制剂可以单位剂量型式提供, 例如,装于安瓿瓶或多剂量容器中,并添加有防腐剂。该组合物可以采用诸 如含于油性或水性媒介物中的悬液、溶液或乳液型式,并可以含有诸如悬浮 剂、稳定剂/或分散剂的配制剂。另外,该活性成分可以是适于与适当媒介物 组配的粉状型式,例如,在使用之前用灭菌的无热原水组配。

还可将上述化合物制成诸如栓剂或保留灌肠剂型式的直肠组合物,例 如,含有诸如可可油或其它甘油酯的常见栓剂基质。

除了上述制剂以外,还可将上述化合物制备成缓释制剂。这用长效制剂 可以通过植入方法(例如,皮下或肌内植入)或肌内注射方法使用。因此,举 例来说,所述化合物可以用合适的聚合材料或疏水材料(例如,溶于可以接受 的油中的乳剂)或离子交换树脂制备,或制成微溶性衍生物,例如,微溶性盐。

如果必要,所述化合物可以包装或分配装置型式提供,其中可以容纳含 有活性成分的一个或几个单位剂量型式。例如,所述包装可以包括金属或塑 料泊,如发泡包装。在所述包装或分配装置上还可带有使用说明。

                Ⅵ..实施例:ObR的原位定位

在本文所提供的实施例中,通过用Ob(莱普亭(leptin))-碱性磷酸酶(AP) 融合蛋白所做的结合研究证实,在哺乳动物脉络丛组织中存在高亲和性Ob 受体。还发现,所观察到的融合蛋白结合是Ob-特异性的,而不是由非特 异性碱性磷酸酶产生的假象。

                     A..材料和方法

Ob-碱性磷酸酶融合蛋白的构建和表达。

制备两种类型的融合蛋白。具体地讲,制备Ob-AP融合蛋白,其中, AP部分位于该融合蛋白的羧基末端;制备AP-Ob融合蛋白,其中,AP 部分位于该融合蛋白的氨基末端。

为了制备小鼠和人Ob-Ap和Ap-Ob融合结构,通过标准的聚合酶 链式反应方法扩增cDNA序列。对于小鼠和人Ob-AP融合蛋白而言,分 别由相应的cDNA扩增编码小鼠和人Ob的整个开放读框的核苷酸序列。用 HindⅢ和BamHⅠ裂解位于扩增引物末端的限制位点(小鼠),并将其插入 APtag-2的HindⅢ-BglⅡ多接头位点;或用BamHⅠ和BglⅡ裂解(人), 并将其插入APtag-2的BglⅡ位点。对于小鼠和人AP-Ob融合结构而言, 首先制备能表达一种具有其自身信号肽的新型AP融合蛋白(APtag-3),做 法是:用分泌性胎盘碱性磷酸酶(包括信号序列)的PCR扩增序列置换Aptag -2上位于HindⅢ和XhoⅠ位点之间的序列。设置一个BglⅡ位置,以便导 入该位点的融合蛋白符合AP蛋白的读框。然后由相应的cDNA通过PCR扩 增预测的成熟型式的小鼠和人Ob的序列。用BamHⅠ和BglⅡ裂解位于扩增 引物末端的限制位点,并将其插入APtag-3的BglⅡ位点。

将各个质粒瞬时转染到COS-7细胞中(11.25μg/150mm板)。让细胞 生长至铺满,再用条件培养基(media-conditioned)3天。然后对细胞进行离心, 0.45μm过滤,并用20mMHepes(pH7.0)和0.05%叠氮钠保存于4℃温度下。 按照Flanagam和Leder(Flanagan,J.G.和Leder,P.,1980,Cell 63:185- 194)披露的方法在96孔平板读数器上测定条件培养基,并定量AP活性,所 不同的是,在所有测定中均省去了高精氨酸。

原位融合蛋白结合。

在12孔平板中用HBHA(含有0.5mg/ml BSA、0.1%NaN3、20mM HEPES[pH7.0])的Hank's平衡盐溶液漂洗四分小鼠脑、分离的脉络丛、细胞 和细胞系一次。然后,在室温下将组织和含有AP-Ob融合体、Ob-AP 融合体的组织培养上清液或对照上清液(即:仅含有未融合的AP的上清液、 含有AP-OB或OB-AP融合蛋白+80倍摩尔过量大肠杆菌产生的重组 OB的上清液或获自模拟转染的COS细胞的上清液)一起培养75分钟,同时 伴以缓慢转动。随后按前文所述方法处理样品(Cheng,H.J.和Flangan,J.G., 1994,Cell 79:157-168)。

                      B..结果

为了找到Ob受体,构建O-b碱性磷酸酶融合蛋白,其可通过比色法 检测其Ob结果。具体地讲,将编码小鼠和人Ob蛋白的cDNA分子插入上 文6.1节中所述的表达载体APtag-2和APtag-3上。插入表达载体Aptag -2后所产生的融合蛋白,其Ob位于该融合蛋白的N-末端,而胎盘碱性 磷酸酶(AP)位于该融合蛋白的C-末端。所得到的融合蛋白被称为Ob- AP。插入载体APtag-3之后所产生的融合蛋白,其AP位于N-末端, 它与位于C-末端的预测的成熟型式的Ob蛋白融合。所得到的融合蛋白被 称为AP-Ob。两种型式的鼠融合蛋白均为分泌性的,并且均以大致为 81KDa的预测分子量型式生成。

为了鉴定能表达Ob受体的细胞或组织,采用了几种方法。用本文所述 方法试验的每一种细胞、细胞系和组织都至少可能参与体重调节。所采用的 第一种方法试图指导Ob-AP和AP-Ob融合蛋白结合试验。用该方法检 测过的细胞系包括胎盘细胞系Be WO(ATCC No.CCL98)和JAR(ATCC No. HTB144);肌细胞系L6(ATCC No.CRL 1458)和BC3H(ATCC No.CRL 1443); 神经细胞系PC12(ATCC No.CRL 1712)和NB41A3(ATCC No.CCL147);前脂 肪细胞系3T3-L1(ATCC No.CRL 173);和肝细胞系Hepa1-6(ATCC No.CRL 1830)。还用该方法试验了来自下丘脑的原代培养物和来自小脑的原 代培养物。上述研究无一产生阳性结合结果。

其次,还尝试过通过检测基因表达随重组Ob蛋白的存在而发生的变化 来鉴定能表达Ob受体的细胞系。其原理是,基因表达的变化,无论是obR 基因的表达,还是Ob/ObR-相关的信号转导途径更下游处的基因的表达, 可用于鉴定其中存在ObR的细胞。

上述分析是通过对源于Ob处理过的或未处理过的细胞的RNA进行的 标准示差演示分析(参见Pardee等,US 5,262,311)完成的。简单地讲,从用 Ob处理过的或未经处理的细胞中提取RNA,并以如下方式进行RT-PCR 扩增:可以对存在于源于Ob处理的细胞系和源于未经Ob处理的细胞系的 RNA中的单个转录物含量进行直接的定量比较。用该方法试验过的Ob细胞 系有INS-1、3T3-L1、Hepa1-6、L6、PC12、NB41A3和BC3H。 另外,还试验了原代下丘脑培养物。在试验过的细胞中,无一表现出因该细 胞是否用Ob处理过而产生的在表达型式方面的可检测的定量差异。

第三,还尝试过通过用重组Ob蛋白处理细胞,并测定信号转导途径激 活的迹象的方法来鉴定能表达Ob受体的细胞。具体地讲,通过3H的摄入监 测cAMP的变化,并通过由抗磷酸酪氨酸抗体处理过的Western印迹测定酪 氨酸磷酸化的变化。用这种方法对20个以上的细胞系进行了检验。具体地 讲,这些细胞系包括小鼠细胞系Y1(肾上腺皮层;ATCC No.CCL79)、 BC3H(平滑肌-脑瘤;ATCC No.CRL1443),P19(胚胎癌性细胞;ATCC No.CRL 1825)、3T3L1(前脂肪细胞;ATCC No.CRL173)、Hepa1-6(肝 癌;ATCC No.CRL1830)、C2C12(成肌细胞;ATCC No.CRL1772)、 NMUMG(乳腺,正常上皮;ATCC No.CRL1636)、MM5MT(乳腺;ATCC No.CRL 1637)、NB41A3(成神经细胞瘤;ATCC No.CCL 147)、AtT20(脑垂 体;ATCC No.CCL89)、N MU LI(肝;ATCC No.CRL 1638)、BNL CL2(肝;ATCC No.TIB 73)和NCTC-1469(肝;ATCC No.CCL 91);大鼠 细胞系,包括L6(成肌细胞;ATCC No.CRL 1458)、PC12(肾上腺嗜铬细胞; ATCC No.CRL 1721)、和H-4-H-E(肝癌;ATCC No.CRL 1548);和人 细胞系,包括SW 872(脂肪肉瘤;ATCCNo.HTB 92)、HepaG2(肝;ATCC No.HB8065)、和成神经细胞瘤细胞系,包括SK-N-SH(ATCC No.HTB 11)。在该试验中,同样未能在试验过的任何细胞中观察到取决于Ob的差异。

在对哺乳动物细胞系和组织作过深入研究之后,将成年小鼠脑四分剖 开,用AP-Ob融合蛋白处理,洗涤,并用上文的6.1节所披露的组织学方 法测定该融合蛋白的结合AP活性。在啮齿类动物的脑脉络丛中(位于侧向和 第三脑室)观察到了AP-Ob融合蛋白的再现性结合。不过,在脉络丛周围 的脑组织中未发现AP-Ob染色。脉络丛是主要决定脑脊液产生的组织。 而且,脉络丛被认为是血脑屏障的“保护者”之一。

用由非融合的AP处理过的组织和由AP-Ob处理过的组织进行对照 AP染色,是在有加入的过量非结合Ob的条件下进行,以便竞争结合所述融 合蛋白。在这些对照的任一个中都未出现类似于Ab-Ob融合蛋白的染色现 象,这表明所观察到的AP-Ob结合是Ob特异的,而不是由AP导致的假 象。

因此,总体来说,只有在采用几种方法之后才能定位一种结合Ob的细 胞表面分子;而该细胞表面分子存在于大脑的特定部位-脉络丛中。

                 Ⅶ..实施例:克隆鼠ObR基因

在下面的7.2.1节中,披露了由用鼠脉络丛RNA构建的表达文库成功地 克隆了一种短型Ob受体cDNA,famj5312。用上文第6节中所提供的实施 例中披露的方法,用AP-Ob融合蛋白筛选表达文库。在下文的7.2.2节披 露了短型Ob受体编码区的核苷酸序列,而且,还披露了Ob短型受体蛋白的 氨基酸序列。在下文的7.2.3节中披露的竞争结合研究表明,由提取的编码 一种受体的cDNA编码的蛋白,表现出对小鼠和人Ob蛋白有高的亲和结合 力。7.2.4节所披露的研究证实了所分离的ObRcDNA克隆的真实性。

如下文所述,由ObR表现出的高亲和力Ob结合和其与细胞因子受体Ⅰ 型家族的同源性相关,这表明ObR是通过与Ob配体结合触发的信号转导参 与哺乳动物的体重控制。

                     A..材料和方法

脉络丛mRNA分离。

按照RSelden在分子生物学通用方法(Current Protocols for Molecular Biology)(4.2.3增补14)中披露的Chirgwin等的异硫氰酸胍/CsCl方法(1979, 生物化学(Biochemistry)18:5294)每100只小鼠一批地从300只小鼠脉络丛 中分离总RNA。在进行定量之后,用蒸馏过的去离子水将RNA稀释至 1mg/ml,并用等体积的DNase溶液(20mM MgCl2、2mM DTT、0.1单位 DNase、0.6单位RNase抑制剂,溶于TE中)在37℃下培养30分钟,以除 去掺杂的DNA。用苯酚/三氯甲烷/异戊醇萃取所述RNA,并用乙醇沉淀。 在260nm波长下定量,然后对一个等分试样进行电泳,以检测其完整性。一 共纯化了320μg总RNA。

用Qiagen(Chatsworth,CA)出售的Oligotex-dT试剂盒(产品目录号 70042)提取PolyA+RNA,按照生产商的说明操作。在进行定量以后,用 乙醇使mRNA沉淀,并以1mg/ml的浓度重新悬浮于蒸馏过的、去离子的、 DEPC处理过的水中。一共纯化了11μg Poly A+RNA。

文库构建。

按照Gubler和Hoffman的方法(Gene,1983,25:263),用购自Life Technologies(Gaithersburg,MD)的Superscript Plasmid cDNA合成试剂盒(产 品目录号:Series 8248)合成cDNA。所得到的cDNA连接到哺乳动物表达 载体pMET7的NotⅠ/SalⅠ位点上,pMET7是pME18S的改进型式,它使用 上文所述的SRα启动子(Takebe,Y等,1988,分子细胞生物学 (Mol.Cel.Bio.)8:466)。之所以选择该载体,是因为它含有在COS7细胞中 表达的强真核启动子,含有AMP抗性基因,而且长度仅为3.0kb。该载体小 的尺寸之所以重要,是因为它能增加克隆大型cDNA的可能性。其它相当的 载体为4.8kb,而且较大,因此增加了不完全复制的机率,并降低了克隆大 型cDNA的可能性。用乙醇沉淀连接的cDNA,并以25mg/ml的浓度重新悬 浮于蒸馏过的、去离子的、DEPC处理的水中。通过电穿孔法,在0.1cm的 杯中用1μl DNA转化40μl电感受态DH10B大肠杆菌。

进行2次cDNA合成,并将其用于构建两个独立的小鼠脉络丛文库: mCP(小鼠脉络丛)A和mCPD。

DNA制备。

根据cDNA转化的效价用初级转化体以150cfu/孔的浓度接种96深孔平 板,接种1ml的LB-amp中。在使用等分试样之前,仅让初级转化体在37 ℃下生长1小时,以避免较小插入克隆的过分生长,并因此使得在150cfu的 库(pool)中较大的克隆表现不足。在37℃下使培养物通气生长15-16小时。 在制备之前,取出100μl细胞悬浮液,并加入100μl 50%的甘油中,混 合,并于-80℃保存(甘油冷冻板)。

用WizardTM Miniprops DNA Purification System(Promega,Madison, WI;产品目录号A7100)制备DNA,采用改进的96孔方案。该方法如下:

1)在4℃下,以3200rpm的速度在96深孔板中离心培养物。除去上清 液。

2)顺序加入140μl每种细胞重悬液(50mM Tris-HCl,pH7.5,10mM EDTA,100μg/ml RNaseA)、细胞裂解液(0.2M氢氧化钠,1.0%SDS)和中 和液(1.32M乙酸,pH4.8),在加入每一种试剂后涡旋14秒钟,以确保混 合良好。

3)将板在水中放置15分钟。

4)在4℃下,以3200rpm的速度离心样品10分钟。

5)将上清液转至96孔Polyfiltronic聚丙烯过滤板上(10μm,0.8ml)。

6)加入500μl WP树脂,并在室温下培养3-5分钟;对所述板施加 吸力。

7)用640μl的重悬液将样品洗涤3遍。

8)在室温下,以3200rpm的速度离心样品5分钟,以除去残留缓冲液。

9)用40μl室温下的水洗脱样品2-5分钟。

10)在室温下,以3200rpm的速度使洗脱的DNA通过微孔板。

11)定量DNA。

收集方法。

设计收集方法,以得到大小最佳的1200cfu的库,适于转染和检测,并 可迅速降至150cfu的较小的库。一旦鉴定到150的阳性库,为了提供该库的 表现度,需要400-800个独立的克隆。开始使用一个1200cfu的库,意味 着需要较少的DNA探针,但在最后的鉴定步骤中需要更多独立的克隆(3200 -6400),因此,需要更多的时间来鉴定阳性克隆。

从组成排的8个孔中等量收集共5μg DNA,共得到1200cfu。因此, 每个96孔板可产生12份收集的DNA,用于转染到COS-7细胞中。

在鉴定到阳性库之后,从构成该库的8个孔中的每一个中制备DNA, 并再转染到COS-7细胞中。在鉴定到一个阳性孔之后,通过将该孔的一份 甘油冷冻等分试样铺平板破坏该孔,以得到数以千计的独立克隆。每一个阳 性克隆挑选400-800个克隆,并排列在96孔板中,用上述方法获得DNA, 并收集24个孔中的DNA用于转染。从阳性排中提取代表每一个克隆的 DNA,并转染,以作最终鉴定。

定量Ob细胞表面结合分析。

大致按以前就Kit-AP所述的方法(Flanagcm,J.G.和Leder,P.,1990, Cell 63:185-194)用AP-Ob融合蛋白进行定量细胞表面结合试验。

Ob蛋白。

本文所使用的重组鼠Ob蛋白是以前披露的(Campfield等,1995, Science 269:546-549)。本文所用的重组人Ob蛋白,是用含有抗人Ob 的单克隆抗体的单克隆抗体柱从杆状病毒上清液中纯化的。通过标准考马斯 蓝染色判定,所纯化的重组人Ob蛋白的纯度大于95%。

DNA测序。

测序及序列组合是按以前披露的方法进行的(International Polycystic Kidney Consortium,1995,Cell 81:289-298)。

Northern分析

通过标准方法(Chirgwin,J.M.等,1979,Biochemistry 18:5294- 5299),用由编码鼠ObR胞外域的序列扩增的标记DNA对源于各种组织的 PolyA+mRNA(Clontech)进行Northern印迹分析检测。

rt-PCR。

用标准方法(Zhang,Y.等,1994,Nature 372:425-432)对1μg总 RNA进行逆转录PCR(rt-PCR)反应。具体地讲,用随机六聚体制备第一条 cDNA链。然后用源于编码ObR胞外域的序列的引物或G3PDH对照引物通 过PCR扩增所述第一条cDNA链。

                       B..结果

            1..克隆源于小鼠脉络丛的Ob受体

在上文的第6节中提供的实施例中所披露的AP-Ob融合蛋白与鼠脉 络丛的强Ob-特异结合表明,在该组织中可能有一种Ob受体高水平表达。 因此,为了实现克隆编码该Ob受体的cDNA,解剖获自300只小鼠的脉络 丛,并从该组织中一共提取到11μg polyA+RNA用于按上文7.1节所披露 的方法构建cDNA文库。

开始,将3μg poly A+用于制备cDNA,再将该cDNA用于构建小鼠 脉络丛cDNA文库A。收集一切大小大于500bp的制备的cDNA(261ng),并 将其中的90ng连接在pMET7上。将这种连接的cDNA转化到电感受态 DH10B大肠杆菌中,得到一个大致为7.2×105cfu的文库,其平均大小为 1Kb。

鉴于cDNA文库A没有足够数量的含有大到足于以统计学上合理的频 率编码一种受体的插入片段,将另3μg poly A+RNA用于制备758ng cDNA。收集32ng代表cDNA最大的两种级分的cDNA,并将其连接到 pMET7上。用这种连接的cDNA分子进行转染,得到2.4×105cfu的小鼠 脉络丛文库D,其平均插入片段大小为2kb。仅使用cDNA最大的两种级分 可保证该文库倾向于大的cDNA。这一点通过鉴定10个克隆的插入片段大 小得到了证实;其中7个克隆的插入片段的长度大于2kb,未发现插入片段 小于1kb的克隆。这与文库A形成了对照,在文库A中,20个克隆中的16 个小于1kb。

从小鼠脉络丛文库A中制备并收集代表6×105cfu(40个板)的DNA。 从小鼠脉络丛文库D中制备代表2.4×105cfu(16个板)的DNA。

为了进行筛选,将所述文库制备成有150个克隆的库,并将8个库的混 合物用于每一次转染(即:1200克隆/转染)。将收集的DNA瞬时转染到COS -7细胞中,并通过与含有鼠AP-Ob融合蛋白的上清液一起培养对细胞 进行筛选,洗涤,并染色以原位测定AP活性,一切操作尽如上文的6.1和 6.2节所述。一旦鉴定到阳性克隆,便对8个亚库中的每一个分别进行检测, 并对所得到的亚库进行一步细分,直到鉴定到单一的阳性克隆。

一共由文库A和D产生了632个DNA库,共鉴定了10个独立的阳性 库。所有阳性库均被成功地分解为各有150个克隆的亚库,并对阳性亚库进 一步细分,直到鉴定单个阳性克隆。该克隆含有一个5.1kb的cDNA插入片 段,被命名为famj5312。

                2..Ob受体(ObR)及ObR基因

用上文7.2.1节所述方法提取的famj5312鼠 obR cDNA克隆含有一个大 约为5.1kb的插入片段。由该克隆所得到的核苷酸序列示于图1中(序列1)。 该克隆的核苷酸序列表明,有一个开放读框,由该序列所产生的ObR的氨基 酸序列也示于图1中(序列2)。

该鼠ObR蛋白的推断的894个氨基酸的序列始于一个甲硫氨酸,其密 码子位于与翻译起始位点吻合的DNA序列内。该ObR氨基酸序列始于一个 从氨基酸残基1-23的一个疏水信号序列,这种序列常见于膜结合性或分 泌性蛋白。

所述鼠Ob受体蛋白含有一个从氨基酸残基836-860的疏水性跨膜 域,这表明该Ob受体跨过细胞膜一次。

该跨膜域的位置表明,成熟鼠ObR蛋白的胞外部分是从氨基酸残基24 至氨基酸残基837。数据库检索显示,ObR的胞外域含有同源片段,该片段 使得ObR被归入细胞因子受体的Ⅰ型家族(例如,为了回顾其发展,可参阅 Heldin,C.-H,1995,Cell 80:213-223;和Kishimoto,T.和Tetsuya,T., 1994,Cell 76:253-252)。ObR似乎与IL-6受体、GSF受体和LIF受 体的gp130信号转导成分的关系最为密切。对ObR和gp130的氨基酸序列进 行对比研究揭示,尽管两种蛋白之间总体上的序列相同性不高,但特征性的 保守性的半胱氨酸残基、Trp-Ser-X-Trp-Ser基序和Ⅰ型蛋白家族 内保守的其它氨基酸残基却显而易见。

在该鼠Obr蛋白的单一跨膜域之后,有一个由34个氨基酸(即:氨基酸 残基861-894)的短的胞质域。同源性比较还表明,该ObR胞质域的前23 个氨基酸与LIF受体的近膜序列有30%的相同性。

对获自总RNA的obR mRNA进行的逆转录PCR扩增证实了在脉络丛 中存在obR转录物(单链约为5kb),而且还证实了其在下丘脑中的存在。另 外,对源于几种小鼠组织的poly A+RNA所做的Northern印迹分析表明, obR mRNA还存在于诸如肺和肾的其它组织中。

            3..OB受体能有效结合OB蛋白

对AP-Ob与由上文的7.2.2节所披露的obR cDNA编码的ObR的结 合进行分析。该分析的结果示于图2中,它证实了该ObR对小鼠和人Ob蛋 白均有很强的Ob-特异性结合力。

在图2中示出了对AP融合蛋白结合力的定量分析结果。在把所述ObR 克隆瞬时转染到COS细胞中以后,检查到1nM鼠AP-Ob的强力结合(相 对模拟转染的COS细胞或ObR转染的COS细胞与非融合AP-一起培养而 言)(图2A)。这种结合几乎能完全被100nM未标记的重组小鼠或人莱普亭蛋 白所抑制,这表明,该受体可以结合天然Ob。AP和人Ob的融合体还能以 高亲合力结合小鼠ObR,象一种在其N-末端为小鼠莱普亭,C-末端上 为AP的融合蛋白(Ob-AP)一样起作用。对小鼠AP-Ob的结合进行 Scatchard分析(图2B),所得到的解离常数值(KD)为0.7×10-9M。

                 4..famj5312克隆的真实性

用几种方法检验所分离的ObR famj5312克隆的真实性。首先,用引物 对8个分别分离的克隆(分别在150个克隆的亚库中)PCR扩增,制备至终止 密码子的obR序列3'末端。序列分析证实,所有8个克隆均含有相同3'非翻 译序列。另外,对分别分离的编码ObRC-末端的5个克隆进行测序,并发 现其分别利用相同的终止密码子。最后,对获自不同于产生所述cDNA文库 的品系的小鼠品系(C57/BLKsJ)的脉络丛总RNA进行逆转录PCR(rt- PCR),得到一种在相同的位点上含有终止密码子的相同PCR产物。这些资 料表明,所分离到的famj5312 cDNA克隆,既不是嵌合克隆,也不是罕见的 异常剪接过程的结果,而是代表了一种编码脉络丛中主导型式的ObR受体的 克隆。

               5..克隆小鼠长型ObR编码核酸

如本文所述,本发明人克隆了鼠ObR长型。

为了找到人长型ObR基因(图3)的小鼠同系物,对自小鼠下丘脑、Ks、 和脉络丛、db和Ks中提取的第一条cDNA链进行半嵌套PCR,所用的5′ 引物来自小鼠短型开始与人长型趋异的前面的片段,而3'简并引物是由人 ObR同系物胞内区域设计的。通过3'RACE对全转录物作进一步鉴定。

从C57B1/KS(KS)和C57B1/KS-db(db)脉络丛和下丘脑中制备全 mRNA。用购自GIBCO-BRL的Superscript Reverse Transcriptase的逆转 录酶,以随机六聚体或Oligo dT为引物,由1μg mRNA的cDNA逆转录生 成cDNA。共制备了24μg cDNA。为了进行PCR,以1∶200的比例稀 释cDNA,并将3μg稀释的cDNA用于25μl反应物中。

第一轮PCR反应,使用编码小鼠ObR蛋白序列PNPKNCSW的5'引物, 其核苷酸组成为:5'-CCAAAC CCC AAG AAT TGT TCC TGG-3';互补 于编码接近人长型的羧基末端的KIMENKMCD的核苷酸序列的反向简并引 物,其核苷酸组成为:5'-TC(GA)CA CAT(CT)TT(GA)TT(GATC)CC CAT TAT CTT-3′。

在第二轮PCR反应中,其3′引物相同,而5'引物为第一轮反应5'引物的 内部,它编码的蛋白序列为AQGLNFQK,其核苷酸组成为:5'-GCACAA GGACTGAATTTCCAAAAG-3'。

按上述方法进行PCR反应,所不同的是嵌套PCR的型式为:94℃下3 分钟;94℃下30秒,57℃下30秒,72℃下40秒,反应30轮;72℃下 5分钟,反应1轮。

用Taq循环测序试剂盒,在自动ABI 373A和377 DNA测序仪(Applied Biosystems,Foster City,CA)上进行DNA测序。用Sequencher进行序列分析。

另外,用自下丘脑中提取的mRNA对编码鼠长型ObR胞内域的核酸进 行半嵌套PCR,以得到足够量的编码小鼠长型obR因的特定PCR产物。 对该PCR产物测序(图6)证实,该DNA编码长型ObR的小鼠同系物。直到 短型终止密码子5'端的第5个密码子之前,短型和长型的转录物是相同的, 然后完全趋异,暗示发生了可变剪接。由小鼠长型和人ObR推定的氨基酸序 列在其编码区长度范围内是同源的,并具有75%的相同性(图7)。

                6..ObR mRNA的表达特性

作为了解ObR组织分布的第一个步骤,在各种鼠组织中检查其mRNA 的表达。为此,用由编码ObR胞外域的序列扩增得到的标记DNA对源于各 种小鼠组织(心、脑、脾、肺、肝、骨骼肌、肾和睾丸;Clontech,Palo Alto,CA) 的polyA+mRNA(2μg/泳道)的Northern印迹进行检测分析。杂交是按照 生产商的说明书,在65℃下在Rapid-hyb缓冲液中进行的。

在大部分组织中,ObR mRNA以略大于5kb的单一条带型式出现,表 明这里所披露的5.1kb的cDNA克隆是全长的。在分析过的组织中,在肺、 肾和全脑中观察到了表达。在睾丸中未检测到表达。

对获自总RNA的)bR mRNA进行的RT-PCR扩增,证实了该转录物 在脉络丛中的存在,还证实了其在下丘脑中的存在。用从小鼠脉络丛或下丘 脑中提取的1μg总RNA进行RT-PCR反应。从db/db小鼠(C57B1/BLKsJ 背景)或+/+同窝仔对照中分离组织。对用随机六聚体制备的第一条cDNA 链进行PCR扩增,所用引物源于编码ObR胞外域的序列或用G3PDH对照 引物。在平行进行的总RNA对照的模拟逆转录扩增中,未检测到带。

               Ⅷ..实施例:obR基因即db基因

下文披露的实验和研究证实,obR基因位于db位点,而db小鼠中的 obR基因是一种突变型obR,它可导致一种具有106个核苷酸的插入片段的 异常剪接mRNA的转录,产生一种截短的长型鼠ObR蛋白,该蛋白与鼠短 型ObR相同。

               A..obR基因位于db遗传间隙内

在此处所提供的实施例中,所披露的研究表明,obR基因位于小鼠4号 染色体的4-5cM区,它相当于db位点所处的同一区域。

                      1..材料和方法

PCR扩增。

将下列由famj5312衍生的引物用于扩增小鼠基因组DNA:

正向引物:5'-GCTGCACTTAACCTGGC-3'

反向引物:5'-GGATAACTCAGGAACG-3'。

PCR反应混合物含有6μl模板DNA(10ng/μl)1.4μl 10×Perkin Elmer(Novwalk,CT)PCR缓冲液,1.12μl dNTPs(2.5mM)、1.05μl正向 引物(6.6μM)、1.05μl反向引物(6.6μM)、0.38μl H2O和3μl Ampli Taq HotstartTM聚合酶(Perkin Elmer;0.5u/μl)。

扩增参数为:94℃,2分钟,此时加入ampli Taq,然后94℃,40秒, 55℃,50秒和72℃,30秒一轮的反应进行共30轮次。

在相同反应条件下使用第二组引物,所不同的是,55℃的轮次是在52 ℃下进行:

正向引物:5'-CACTATTTGCCCTTCAG-3'

反向引物:5'-GCCTGAGATAGGGGTGC-3'

电泳。

在以下两种条件下对样品进行电泳:在室温下,在非变性的8%丙烯酰 胺凝胶上,以45W电泳3小时;在4℃下,在非变性的10%丙烯酰胺SSCP(单 链构象多形性)凝胶上,以20W电泳2.5小时。

用SYBR GreenⅠ对以上两种类型的凝胶进行染色,并在一台MD荧光 计上扫描,获得了可以解释的结果。

              2..对famj5312 obR cDNA克隆进行作图

按照8.1节中所披露的方法,由famj5312 cDNA的编码序列设计PCR 引物。这些引物扩增了C57B1/6J基因组DNA的1921bp片段,它与obR cDNA 上两个引物之前的碱基对长度吻合,和源于由野生型衍生的Mus Spretus品 系SPRET/Ei。位于Mus Spretus等位基因上的3bp插入片段编码一个位于45 号和46号氨基酸之间的额外Asn。通过单链构象多形性(SSCP)凝胶电泳和 非变性凝胶电泳进行的大小测定,在杂交(C57B1/6J×Mus Spretus)F1♀× C57B1/6J♂的182个回交子代中发现了ObR的Mus Spretus 195bp等位基因 的遗传分离。将Mus Spretus等位基因的分离型式与该回交实验组中已作图 的226个其它遗传位点的分离型式加以比较。通过减少obR与其它标记之间 的复交换的次数证实,obR位于鼠4号染色体上,大致位于标记D4Mit9远 端2.2±1.6cM处,并位于标记D4Mit46近端4.6±1.6cM处。通过对其它 遗传学标记进行作图进一步精细ObR的遗传学图距。参见图8,该obR基 因距离D4Mit255远端0.6±0.3CM,并距离D4Mitl55近端0.6±0.6CM。

由famj5312 cDNA 3'序列设计的其它引物对(正向= CACTATTGCCCTTCAG;反向=GCCTGAGATAGGGGTGC)还证实了 C57B1/6J基因组DNA与野生型衍生的Mus Spretus品系SPRET/Ei的基因组 DNA之间在SSCP凝胶上的多态性。另外,这使得famj5312 cDNA的遗传 作图可以用该克隆的另一个片段进行。该多态性的作图与上文披露的famj 5312的作图100%一致,同时证实了obR的作图,并证实famj 5312 cDNA 克隆不是嵌合型的。

                3..鼠db遗传区的确定

小鼠db基因最初被作图于小鼠4号染色体上(Hummel,K.-P.等, 1966,Science 153:1127-1128)。对该遗传定位已作过进一步细化(Bahary, N.等,1990,Proc.Natl.Acad.Sci.USA 87:8642-8646;Bahary,N.等, 1993,Genomics 16:113-122),以便将db定位于近鸟氨酸脱羧基酶4(Odc4) 位点与无名远端标记D4Rck22和D4Rck69之间的1.5cM的遗传间距内。 Bahary等在1993年还报导D4Mit 205接近Odc4 1.1cM。因此,相对D4Mit205 而言,db基因位于大约2.2cM的远端。

db等位基因最初出现于C57B1/BLKsJ近交系。随后将所述db突变转移 到其它遗传背景中,以形成同类品系。通过对同类品系C57B1/6J-m db动 物定型,可以确定db基因在小鼠4号染色体上必然存在的遗传间距内。通 过上述分析,确定了必然含有db基因的遗传间距,位于近端无名DNA标记 D4Mit255与远端标记D4Mit 331和D4Mit 31之间,大致为4cM(在Mit图上 确定的遗传距离;Dietvich,W.F.等,1994,自然,遗传学分册(Nature Genetics)7:220-245;Copeland,N.G.等,1993,Science 262:67; Whitehead Institute/MIT Center for Genome Research,鼠遗传图谱,Database Release 10,April 28,1995)。应当指出的是,由Bahary等(1993,同上)确定 的间距似乎比本文所确定的遗传图距小几个厘摩(cM)。参见图8,其中, D4Mit255和D4Mit31之间的距离大约为5.1cM。

通过比较上述famj5312的作图数据和db的作图数据发现,famj5312 的图位距D4Mit255远端0.6±0.6cM,距D4Mit155近端0.6±0.6cM,完 全符合obR是db基因的设想。

              B..db小鼠的obR突变可产生一种

                      截短的长型受体

                       1..材料和方法

由C57B1/KS(KS)和C57B1/KS-db(db)脉络丛和下丘脑制备总 mRNA。用购自GIBCO-BRL的Superscript Reverse Transcviptase逆转录 酶,用随机六聚体或Oligo dT作引物,由1μg mRNA的cDNA逆转录 cDNA。共制备了24μg cDNA。为了进行PCR,将cDNA稀释1∶200 倍,并将3μg稀释过的cDNA用于25μl的反应物中。

根据小鼠短型cDNA克隆、famj5312和长型cDNA克隆(图6)设计引 物,使其覆盖短型和长型obR cDNA的编码区。由每种样品制备平均大小为 600bp的重叠PCR片段。在0.8%的低熔点琼脂糖凝胶上对PCR产物进行电 泳。从凝胶上分离DNA并用琼脂糖酶酶解。用两种末端引物和内部引物对 琼脂糖酶酶解的DNA片段测序。

PCR条件。25μl PCR反应物中含有2mM MgCl2,0.5mM每种引物, dATP、dTTP、dCTP和dGTP各200mM,和0.5单位的Taq聚合酶,溶 于1×Taq聚合酶缓冲液(Perkin-Elmer)。所有PCR反应均在GeneAmp PCR System 9600(Pekin-Elmer)上进行。除非另作说明,一般的PCR参数为: 94℃下3分钟;94℃下10秒,57℃下10秒,72℃下40秒,35轮次, 72℃下5分钟1轮次。

DNA测序和序列分析。在自动ABI 373A和377 DNA测序仪上,用Taq 循环测序试剂盒(Applied Bio-systems,Fobter City,CA)进行DNA测序。用 测序仪(Sequencher)进行序列分析。

                       2..结果

用从KS和db小鼠的脉络丛中提取的mRNA进行半嵌套PCR。用db cDNA作模板制备的PCR产物大约比用KsDNA作模板制备的产物长 100bp。对两种PCR产物直接进行测序。在上述小鼠的脉络丛中表达的短型 mRNA的编码序列内,未检测到序列差异。然而,在对由始于两种型式共有 的跨膜域并止于长型所特有的胞内域所产生的PCR产物进行测序时,我们发 现db/db和对照之间在几种组织中存在明显差异。测序数据表明,推定的db 长型obR相比正常长型转录物量有一个106bp的插入片段(图9)。该106bp 片段包括编码最后5个氨基酸的序列、终止密码子以及所述短型的 88bp3′UTR区的序列。db长型能产生一种与所述短型相同的截短的ObR蛋 白,它缺少胞内域。在所有db组织中均未检测到所述正常长型,在对照组 织中也未检测到db长型。

为了了解这种明显的剪接错误的机制,我们比较了db/db小鼠和对照小 鼠的obR基因组序列。在db/db小鼠的106bp插入位点之后紧邻的2bp处发 现一个G→T的核苷酸变化。这种变化所产生的剪接供体能将所述106bp 的片段转化成插入db长型中的外显子。由于上述插入作用,该db长型仅能 产生一种不具备胞内信号域的截短蛋白。由于与ObR关系最密切的Ⅰ型细胞 因子受体均具有长的胞间域,所述长型的长的胞间域对于启动胞内信号转导 至关重要。上述资料所述受体在体重调节方面的作用,而不能产生ObR长型 是db/db小鼠出现极度肥胖表型的原因。

               Ⅸ..实施例:克隆人ObR编码核酸

本节将披露编码人ObR的cDNA和基因组DNA的克隆和鉴定。

                    A..克隆人Obr cDNA

将所述famj 5312 cDNA插入片段用于检测购自Sratagene(La Jolla,CA) 的建在Uni-Zap XR载体上的人胎脑cDNA文库。之所以选择源于人胎脑 的cDNA文库,是因为该文库有可能含有存在于整个脑部的cDNA,包括脉 络丛、小鼠obRcDNA组织源,以及存在于下丘脑中的cDNA。

以大约50,000pfu/板的密度将所述cDNA文库铺平板于20块平板上。用 Amersham Hybond-N尼龙薄膜滤膜在每块板上重复进行滤膜吸附(lift)。按 照标准方法将所述滤膜变性、中和和交联。在有32P标记的核苷酸的条件下, 通过随机引导对探针进行放射性标记。让滤膜与探针在65℃下,在Church's 缓冲液(7%SDS、250mM NaHPO4、2μM EDTA、1%BSA)杂交过夜。 次日,在65℃下,在2×SSC/0.1%SDS中洗涤滤膜20分钟,然后在0.1 ×SSC/0.1%SDS中洗涤10分钟。随后在-80℃下用其对Kodak胶片曝光 5小时。

在对照比较重复的滤膜之后,获得了13个重复的信号。随后进行二次 铺平板,将每种初级塞的10μl 1∶1000的稀释液铺平板。使用与上文所述 相同的探针、杂交和洗涤条件。在80℃下对胶片曝光2小时。13个原始阳 性信号中仅有一个在该胶片上产生重复信号。

对来自阳性平板的4个独立噬斑进行处理,并按照Stratagene披露的方 法,用ExAssist辅助噬菌体、XLl-Blue细胞和SOLR细胞剪切。然后将 剪切产物铺平板于LB/Amp平板上,并在37℃下培养过夜。从每个平板上 挑取一个白色菌落,并在37℃下,在液体LB/Amp中生长过夜。次日,用 Promega Witzard Mini-prep试剂盒进行小量制备。用EcoRⅠ和XhoⅠ消化该 小量制备产物,测定插入片段的大小。4个克隆之一(d)具有一个大约6kb的 插入片段。

用Qiagen Plasmid Maxi试剂盒制备供测序用的DNA。

图3表示人ObR cDNA的核苷酸序列(序列3),它编码信号序列(氨基酸 残基1至20左右)、胞外域(大约从氨基酸残基21~839)、跨膜域(大约从氨 基酸残基840-862)和胞质域(大约从氨基酸残基863-1165)。

                 B..克隆人obR基因组DNA

正如这里所披露的,本发明人克隆了人ObR基因组DNA。

将famj5312 cDNA插入片段用于检测购自Genome Systems Inc.的人高 密度PAC滤膜(产品目录号FPAC-3386)。用Prime-It试剂盒(Stratagene; 产品目录号300392)对探针进行随机引导的标记。按照生产商推荐的方法, 在Amersham Rapid-hyb缓冲液中进行杂交。然后在65℃下,在2×SSC/1 %SDS中洗涤滤膜,并在-80℃下对Kodak胶片进行曝光。

鉴定到11个推定的阳性PAC克隆。测定其方格位置,而所述克隆购自 Geneme Systems,Inc.。

本发明人将方格位置P298-K6上的克隆命名为hobr-p87,通过用 来自ObR开放读框的5'(obRF4和obR R4)和3'(obRS和obRO)末端的引物对 进行的PCR测试进一步证实其含有整个ObR编码区。用于该验证实验中的 引物如下:

obRF4:    5'-CTGCCTGAAGTGTTAGAAGA-3′

obRR4:    5'-GCTGAACTGACATTAGAGGTG-3'

ohRS:     5'-ACCTATGAGGACGAAAGCCAGAGAC-3′

obRO:     5'TGTGAGCAACTGTCCTCGAGAACT-3'

已于1995年12月28日将hobr-p87交由ATCC保存。

              X..实施例:构建ObR-免疫球

                      蛋白融合蛋白

                 A..制备OBR-IG融合蛋白

将人ObR的胞外部分制备成与免疫球蛋白恒定区结合的融合蛋白。免 疫球蛋白的恒定区可以具有遗传修饰,包括能减弱或消除免疫球蛋白结构所 固有的效应活性的修饰(例如,参见PCT公开号WO 88/07089,公开日:1988 年9月22日)。简单地讲,进行PCR重叠延伸,以便将编码人ObR的胞外 部分的DNA连接于编码人IgG1的绞链区、CH2和CH3区的DNA。上述 目的是按照在以下的小节中所披露的方法实现的。

                      B..制备基因融合体

以100μl的最终体积制备PCR反应物,该反应物由Pfu聚合酶和含有 引物(各1μM)、dNTPs(各200μM)、和1ng模板DNA的缓冲液(Stratagene) 组成。

通过聚合酶链式反应(PCR)制备相当于结合Ob的编码ObR ECD或其一 部分的DNA序列的DNA片段,所使用的引物对是为了扩增编码整个人ObR ECD的序列以及少量5′非编码序列而设计的。例如,正向引物为:

5'-GTCACGATGTCGACGTGTACTTCTCTGAAGTAAGATGATTTG -3' 相当于图3中的核苷酸-20至+8,在其5'末端另有14个核苷酸(含有一个 SalⅠ位点)。反向引物为:

5′-GTCAGGTCAGAAAAGCTTATCACTCTGTGTTTTTCAATATCATC TTGAGTGAA-3′ 相当于图3中核苷酸+2482至+2517的补体,在其5'末端另有18个核苷 酸(含有一个HindⅢ位点)。将一种编码人ObR的cDNA用作扩增胞外域的 模板。用上述引物进行的PCR扩增能产生一种编码ObR胞外域的DNA片 段。

在另一个PCR反应中,设计了用于扩增IgG恒定区(即:绞链区、CH2 区和CH3区)的第二组引物,以使反向引物有一个独特的限制位点,而正向 引物的5'末端互补于在前面的ObR ECD扩增中所用反向引物的5'末端区 (即:5′-AAGCTTTTCTGACCTGACNNN-3'),这使得ObR编码核苷酸 序列上的开放读框延伸至待扩增的IgG核苷酸序列的整个长度。该反应中所 用的模板DNA是人IgG重链基因组DNA的2000个核苷酸的片段(Ellison 等,1982,Nuc.Acids.Res 10:4071-4079)。

通过另一个PCR反应制备完整的人ObR-IgG融合片段。混合上述两 个PCR反应的纯化产物,变性(95℃,1分钟),然后复性(54℃,30秒), 使两种片段互补的末端退火。用dNTP和Taq聚合酶以及用第一个PCR反应 的正向PCR引物和第二个PCR反应的反向PCR引物扩增的整个片段补平所 述链。为了便于克隆到表达载体上,随后用能识别第一个PCR反应的正向 PCR引物和第二个PCR反应的反向PCR引物上特别设计的位点的限制酶裂 解所得到的片段。然后该消化过的片段克隆到同样用所述限制酶处理过的表 达载体上。

将序列分析用于证实其结构,并将该结构用于转染COS细胞,以检测 瞬时表达。

本领域技术人员知道,有多种因素影响待将所述ObR-IgG融合片段 克隆至其中的表达载体的选择,如宿主生物的性质、实现所需转录和翻译控 制的必需元件。例如,如果需要瞬时表达,可以上面制备的ObR-IgG融合 片段克隆到表达载体pcDNA-1(Invitrogen)上。另外,通过将ObR-IgG 融合片段克隆到表达载体pcDNA-3(Ivitrogen)上,可以实现融合蛋白的稳 定表达。

另外,可以用诸如CD5-IgG1载体(由Amffo等披露,1990,Cell, 61:1303-1313)的已含有IgG恒定区的表达载体制备小鼠和/或人ObR- IgG融合蛋白。按照上述方法,用一个PCR反应制备编码ObR胞外域的DNA 片段,以使编码ObR胞外域的开放读框是连续的,并符合编码IgG恒定区的 开放读框。

例如,用Extaq(PanVera Corp.)对小鼠和人ObR的胞外域(包括信号)肽进 行PCR扩增。将以下引物用于在第一代表达结构中扩增小鼠和人ObR:

小鼠

正向引物:

5′-CCCAATGTCGACATGATGTGTCAGAAATTCTAT-3'

反向引物:

5′-AAAAAGGATCCGGTCATTCTGCTGCTTGTCGAT-3'

正向引物:

5′-CCCAATGTCGACATGGTGTACTTCTCTGAAGTA-3'

反向引物:

5′-TTTTTGGATCCCACCTGCATCACTCTGGTG-3'

上述每一个正向引物均含有一个SalⅠ限制位点,而上述每一个反向引 物含有一个BamHⅠ限制位点。用所述小鼠和人obR cDNA作模板进行扩增, 然后将所得到的PCR片段克隆到CD5-IgG载体(Aruffo等,1990,Cell)的 XhoⅠ/BamHⅠ位点。将所得到的载体瞬时转染到COS细胞中,并制备条件培 养基。用蛋白A对该条件培养基进行免疫沉淀(IP),并通过SDS PAGE分析 证实,小鼠ObR IgG融合蛋白的表达水平高于人ObR-IgG的表达水平。 为了提高人ObR-IgG融合体的表达,设计能扩增人ObR胞外域(无信号肽) 的引物,并将该片段和编码小鼠ObR的信号肽共连接到CD5-IgG载体上。 将以下引物用于扩增与小鼠ObR信号肽融合的人ObRECD片段:

正向引物:

5′                                          - TTTAACTTGTCATATCCAATTACTCCTTGGAGATTTAAGTTGTCT TGC3'

反向引物:5'TTTTTGGATCCCACCTGCATCACTCTGGTG-3'

在扩增,限制酶消化和亚克隆之后,让所得到的结构在COS细胞中瞬 时表达。对所得到的条件培养基所作的IP和SDS-PAGE分析证实了170KD 人ObRIgG融合蛋白的成功表达。加强免疫球蛋白融合蛋白表达的另一种方 法,包括以这种方式将ObR胞外域(不包括信号肽)插入CD5-IgG1载体中: 使CD5信号肽融合于成熟的ObR胞外域上。已证实这样一种信号肽的融合, 可加强免疫球蛋白融合蛋白的表达。

                       C..制备修饰的CH2域

可对按上述方法制备的ObR-IgG基因融合体的核苷酸序列进行修 饰,用丝氨酸残基置换铰链区的半胱氨酸残基,和/或置换CH2域内被认为 是IgG结合Fc受体及补体活化所必需的氨基酸。

修饰CH2域,置换被认为是与结合Fc受体相关的氨基酸的过程是按如 下方法实现的。按上述方法制备质粒结构,提供用于修饰ObR-IgCγl CH2 域的模板。用上文第一个PCR反应中所述的正向PCR引物和一种反向引物 对该模板进行PCR扩增,将所述反向引物设计成与IgG1的CH2域的5′末端 部分同源,所不同的是,所设计的改变氨基酸234、235和237的5个核苷 酸置换(Canfield,S.M.和Morrison,S.L.(1991)实验医学杂志(J.Exp.Med.)173: 1483-1491)分别为:Leu-Ala、Leu-Glu、和Gly-Ala。用该PCR 引物进行扩增,能产生一种由CH2域的修饰部分组成的DNA片段。在第二 个PCR反应中,用上文所述第二个PCR反应中所用的反向引物和一种正向 引物对该模板进行扩增,将所述正向引物设计成与该分子的Ig部分互补,并 含有为CH2氨基酸置换所必须的5个互补核苷酸改变。用所述引物进行的 PCR扩增,能产生一种由CH2域的修饰部分、一个内含子、CH3域和3'端 附加序列组成的片段。通过另一个PCR反应制备由修饰的CH2域组成的完 整obR-IgCγl片段。混合上述两个PCR反应的纯化产物,变性(95℃,1 分钟),然后复性(54℃,30秒),使两种片段的互补末端退火。用dNTP和 Taq聚合酶以及用所述第一个PCR反应的正向PCR引物和第二个PCR反应 的反向PCR引物扩增的完整片段补平所述链。为了便于克隆到所述表达载体 上,随后用能识别所述第一个PCR反应的正向PCR引物和第二个PCR反应 的反向PCR引物所特有的位点的限制酶裂解所得到的片段。然后将该消化过 的片段克隆到同样用上述限制酶处理过的表达载体上。

将序列分析用于证实其结构,并将该结构用于转染COS细胞,以检验 其瞬时表达。将hIgG ELISA用于测定/证实瞬时表达水平,对于所述结构来 说,其表达水平为100ng蛋白/ml细胞上清液。转染CHO细胞系,以便永久 表达该融合蛋白。

                    D..OBR-lg中和Ob蛋白

为了证实ObR-IgG融合蛋白是否能在体外和在小鼠体内结合并中和 OB蛋白(莱普亭),用小鼠ObR-IgG融合蛋白对293个细胞进行大规模瞬 时转染。在蛋白A柱上将ObR-IgG蛋白纯化至接近均相。并分析其抑制 碱性磷酸酶-OB融合蛋白(AP-OB)结合细胞表面ObR的能力。

用小鼠ObR cDNA瞬时转染COS细胞,并测试其结合0.5nM AP-OB 的能力。如图10所示,纯化的ObR-IgG能有效抑制或中和AP-OB融 合蛋白与细胞表面ObR的结合。

图10中的第1栏表示在没有ObR-IgG融合蛋白的条件下观察到的高 水平的特异结合。第2、3和4栏表示用3种不同的纯化ObR-IgG柱级 分所观察到的对结合近乎完全的抑制。

                Ⅺ..OBR长型具有IL-6型细胞因子

                       受体的信号转导能力

为了验证克隆的ObR同种型是否具有信号转导能力,将ObR基因导入 所建立的组织培养细胞系,并将相应于OB处理的细胞反应与由结构上相关 的IL-6型细胞因子受体介导的细胞反应加以比较。在该实例中所提供的结 果证实了ObR长型是一种信号转导分子,并具有IL-6型细胞因子受体的 功能特异性。

                       A..材料和方法

                           1.细胞

按已知方法培养COS-1、COS-7、H-35(Baumann等,1989, Ann.N.Y.Acad.Sci.557:280-297),HepG2和Hep3B(Lai等,1995, J.Biol.Chem.270:23254-23257)细胞。在仅含有0.5%胎牛血清或添加了 1μM地塞米松、0.1-1000ng/ml人OB、1000ng/ml小鼠OB、IL- 6(Genetics Institute)或G-CSF(Immunex Corp.)的培养基中处理所述细胞。 为了用gp130抑制信号转导,并用抗人gp130、B-R3的两种泛抑制的 (pan-blocking)单克隆抗体(Chevalier等,1995,N.Y.Acad.Sci.762:482-484) 和144的混合物(20μg/ml)处理细胞。

            2..表达载体及CAT报导基因构建体

上文披露了人ObR长型和小鼠ObR短型的表达载体(7-9节)。业已披 露了截短的人G-CSFR(27)(Ziegler等,1993,Mol.Cell.Brol.,13:2384- 2390)和大鼠STAT1、STAT3和STAT5B(Lai等,1995,J.Biol.Chem.,270: 23254-23257;Ripperger等,1995,J.Biol.Chem.270:29998-30006)。 通过重叠延伸PCR,用合成的编码特定氨基酸置换的寡核苷酸(Higuchi等, 1988,Nucleic Acids Res.12:5707-5717)制备具有突变的框3(box3)序列 (Y1141F)的ObR。该Y1141F的1141位上的酪氨酸被苯丙氨酸所取代。通 过将密码子716和717转换成两个终止密码子,制备了含有截去55个羧基 末端残基的大鼠STAT3的质粒SV-SPORT1(Life Technologies,Inc.)。先前 已披露了CAT报导基因构建体,pHRRE_CAT和pIL-6RE-CAT(Lia等, 1995,J.Biol.Chem.270:23254-23257;Movella等,1995, J.Biol.Chem.270:8298-8310)。

                  3..细胞转染及分析

通过DEAE-葡聚糖方法(Lopata等,1989,Nucleic Acids Res.12: 5707-5717)用质粒DNA转染COS-1、H-35和Hep3B细胞,通过磷 酸钙方法(Graham等,1973,病毒学(Virology),52:456-461)转染HepG2 细胞,并通过脂质转染胺方法转染COS-7细胞。将COS细胞的继代培养 物在无血清培养基中保持16小时,然后通过用细胞因子处理15分钟激活 STAT蛋白。按照Sadowski等(1993,Science,26:1739-1744)所披露的方 法,用全细胞提取物通过EMSA测定STAT蛋白对DNA的结合作用。将高 亲和性SIEm 67(Sadowski等,1993,Science,26:1739-1744)和TB- 2(Ripperger等,1995,J.Biol.Chem.270:29998-30006)的双链寡核苷酸用 作EMSA底物。用细胞因子或OB处理CAT基因转染过的细胞培养物24小 时。通过检测细胞提取物系列稀释液对CAT活性进行定量,换算成共转染标 记质粒pIE-MUP(Morella等,1995,J.Biol.Chem.270:8298-8310) 的表达,并以每一个实验系列的非处理对照培养物的值(定为=1.0)的相对值 型式表示。大致按Cheng和Flangan所披露的方法(Cheng & Flanagan,1994, Cell,79:157-168)定量AP-OB融合蛋白的细胞表面结合力(6节)。

                    B..结果和讨论

                  1..OBR活化STAT蛋白

为了测定ObR是否具有恢复细胞信号转导器的能力,用两种代表性ObR 型式-小鼠短型(也相当于在db/db小鼠中检测到的突变形)和人长型-的表 达载体瞬时转染COS细胞。转染2天后,在1nM人或小鼠碱性磷酸酶-OB 中培养细胞,通过所表现出的碱性磷酸酶-OB(AP-OB)融合蛋白的特异 结合测定ObR的细胞表面表达。短型ObR的转染可导致结合作用比长型的 结合作用大约高10倍。在多种AP-OB浓度下进行的Scatchard转化的结 合数据表明,所观察到的长型的较低结合力主要为降低的细胞表面表达所 致。小鼠短型结合鼠和人配体的亲和力为0.7nM,而人长型结合鼠和人配体 的亲和力为1.0nM。

用人或小鼠ObR的表达载体(2μg/ml)和各种STAT蛋白(3μg/ml)对 COS-1细胞进行共转染。通过ObR表达载体和各种STAT同种型所进行的 共转染,可以分析由配体诱导的特定STAT蛋白的激活作用。在没有或有 OB(100ng/ml)的条件下处理转染的细胞15分钟,并通过EMSA用诊断性寡 核苷酸底物STE或TB-2鉴定对STAT蛋白结合DNA的激活作用。在上 述实验中,仅有长型ObR能激活内源COS STAT蛋白或共表达的STAT1、 STAT3或STAT5B。ObR对所有STAT同种型的激活作用都是配体依赖型 的。相反,短型ObR不能激活任何内源或共转染的STAT蛋白,尽管其具有 高的表面表达力。由于长型ObR能激活所有同样能由G-CSFR、LIFR和 gp130激活的STAT蛋白(Kishimoto等,1995,Blood,86:1243-1245; Lia等,1995,J.Biol.Chem.270:23254-23257),推测该长型ObR能以IL -6型细胞因子受体的特异性刺激转录作用。

                 2..OBR信号诱导基因表达

先前已将啮齿类和人肝癌细胞系用于确定异位表达的血细胞生成素受 体的基因诱导作用(Baumann等,Mol.Cell.Biol.14:138-146)。随后, 将3种互补的肝癌细胞系用于鉴定ObR信号转导。将长型或短型ObR或人 G-CSFR连同HRRE-CAT报导基因结构一起导入大鼠H-35细胞,其 在这些细胞中的表达通过许多血细胞生成素的信号而得以加强(Morrella 等,1995,J.Biol.Chem.270:8289-8310)。仅用无血清培养基或含有细胞 因子(mOB、LIF或IL-6)的有或没有地基米松的培养基处理继代培养物24 小时。长型ObR介导了CAT基因表达的配体依赖型诱导。其激发作用得到 了地塞米松的协同加强作用。由ObR介导的细胞反应十分类似于内源IL- 6R的作用,但特征性地不同于内源LIFR的作用。相反,短型ObR未能诱 导基因表达,这表明有34个残基的胞质域尽管有与框1相关的基序,但不 能恢复细胞信号转导功能。具有被截短至27个残基的胞质域G-CSFR仍 能在有配体的条件下诱导基因转录这一事实表明,所述细胞能对由一种血细 胞生成素受体的短的、含有框1的胞质域作出反应。在G-CSFR-转染的 对照细胞中不能诱导CAT基因表达这一事实表明,在没有转染的ObR的条 件下,H-35细胞对OB无反应。

                 3..OBR独立于gp130起作用

上面所披露的结果支持这样的模型:长型ObR能重建类似于IL-6R 的信号转导途径。接着,为了确定gp130是否是功能性ObR的一部分,将长 型ObR连同HRRE-CAT或IL-6RE-CAT一起导入HepG2细胞,并 测定抗gp130抗体的抑制作用。

用小鼠或人OB处理转染的HepG2细胞,能产生类似的、强的诱导作用, 其作用强度落在由IL-6所产生作用的范围内(30-40倍的激发作用)。剂 量效应分析表明,用100ng/ml OB可获得最大的调节作用。在4个独立实验 中证实,1-5ng/ml OB可产生1/2最大激发作用,1000ng/ml的浓度所产 生生的激发作用一致性地低于最大值。在有已知其能抑制所有IL-6型细胞 因子受体的信号转导的抗人gp130单克隆抗体(Chevalier等,1995, N.YAcad.Sci.762:482-484)的条件下,IL-6对基因表达的激发作用正 如预料般地被破坏了,而OB的调节作用未受影响。上述结果表明,ObR是 独立于gp130起作用(对抗gp130不敏感),而且,通过受体的同源寡聚化可 以触发信号启动。

       4..OBR的框3序列和STAT3与信号转导有关

由IL-6 RE诱导转录是IL-10R的血细胞生成素受体的特征,该受 体的胞质域内至少有一个拷贝的框3基序(YXXQ)(Lai等,1995, J.Biol.Chem.270:23254-23257)。已证实框3序列因其在受体相关激酶激 活方面的作用而参与重建STAT3与受体的结合(Lai等,1995, J.Biol.Chem.270:23254-23257;Stahl等,1995,Science 267:1349- 1353)。长型ObR(图3)在氨基酸位置1141-1144上含有一个拷贝的框3基 序,这可能是STAT3的激活作用和IL-6RE-CAT的转录激发作用的原 因。为验证ObR的框3基序和STAT3是否与ObR的基因诱导作用相关,使 用两种互补的试剂:一种框3突变型ObR和一种显性失活STAT3。通过将 氨基酸位置1141上的酪氨酸诱变成苯丙氨酸(Y1141F)测定框3序列在长型 ObR上所起作用。用野生型ObR或ObRY1141F的表达载体(2μg/ml)连同 pHRRE-CAT或pIL-6RE-CAT一起转染HepG2和H-35细胞。用 人OB(100ng/ml)处理细胞,并测定CAT活性的相对变化。将突变型ObR转 染到HepG2细胞中所产生的对HRRE-和IL-6RE-CAT报导基因结构 的激发作用低于野生型ObR的激发作用。例如,在HepG2细胞和H-35 细胞中,HRRE-CAT表达的激发作用降低了40倍。IL-6RE-CAT的 激发作用在HepG2细胞中降低了20倍,而在H-35细胞中降低了100倍。 对照实验表明,突变型ObR的减了的信号转导活性并非由于破坏了表面表 达,正如由AP-OB结合所证实的。突变的相对作用在IL-6RE上的表现 比在HRRE上的表现更为明显。用H-35细胞所做的一个类似实验证实, 框3突变与IL-6RE调节作用的丧失相关,而HRRE的调节作用仅受到很 小的影响。这一结果与先前的观察一致,即:在某些细胞系中,STAT3的恢 复在由IL-6RE介导的基因诱导方面的作用大于在由HRRE介导的基因诱 导方面的作用(Lai等,1995,J.Biol.Chem.270:23254-23257;Morella 等,1995,J.Biol.Chem.270:8298-8310;Wang等,1995,Blood 86: 1671-1679)。

Y1141F ObR突变型的降低的基因调控作用还与STAT蛋白较低的激活 作用相关。当像转染野生型ObR般地将突变型ObR转染到COS-1细胞中 时,未检测到内源COS STAT蛋白的激活作用。另外,ObR Y1141F在激活 超量表达的STAT1和STAT3方面的作用比野生型ObR低大约10倍。不过, STAT5B的激活作用不受该突变的影响。由ObR Y1141F对STAT的激活作 用的上述特征,与在框3缺陷型gp130(Lai等,1995,J.Biol.Chem.270: 23254-23257)和G-CSFR(Movella等,1995,J.Biol.Chem.270:8298- 8310)上所观察到的结果相吻合,并能解释在报导基因结构调节方面的特殊变 化。

STAT3的信号转导作用是利用STAT3 55C的超量表达确定的,STAT3   55C是一种突变型STAT3,其羧基末端的55个残基被截去了,在对基因 转录的作用方面,它起着STAT3的显性失活抑制剂的作用。诸如上文11.2.1 节中所披露的DNA结合试验证实,长型ObR能有效激活STAT3 55C的 DNA结合活性。STAT3 55C基本上能破坏由ObR介导的IL-6RE的诱 导作用,并能将HRRE的作用减弱50%。上述资料表明,在肝细胞中,有 ObR参与的信号转导途径同样为IL-6-型细胞因子受体所利用,而且对 STAT3 55C敏感。

                  5..OBR能利用STAT3和

                     STAT5B基因诱导

特定的报导基因结构在HepG2或H-35细胞中的诱导作用最大,而且 不会受到超量表达的野生型STAT蛋白的明显加强。为了证实由ObR激活的 STAT蛋白是否起着正调节物的作用,用人ObR连同pIL-6RE-CAT或 pHRRE-CAT和STAT蛋白的表达载体一起转染人Hep3B细胞。相对非处 理的对照测定人OB(100ng/ml)对CAT活性的激发作用(平均值±S.D.;N= 3-4)。所述肝癌细胞仍能表达功能性IL-6R,但缺乏针对其它IL-6 -型细胞因子的受体(Baumam等,1994,Mol.Cell.Biol.14:138-146)。 而且,所述细胞具有较低含量的STAT3和-5,因此,可通过STAT蛋白超 量表达所获得的功能测定ObR的信号转导。由上述实验所得出的结果表明, 超量表达的STAT3可介导IL-6RE的诱导作用增加15倍。超量表达的 STAT31和STAT5B可分别将由ObR介导的HRRE-CAT的诱导作用提高5 倍和30倍。

                      C..结论

上文所提供的结果表明,全长ObR是一种信号转导受体,其作用模式 与IL-6-型细胞因子受体相关。这些数据还支持这样的假设,即:截短的 ObR变体,如在很多组织中表达的或由db突变型转录物编码的短型,要么 是信号转导不能的,要么产生一个减弱了的信号转导的所有组成成分,弱到 无法用本文所使用的工具检测到。在肝细胞中在基因表达水平上实现的OB 反应的重建这一事实有说服力的提示我们,同样的过程也可能发生在下丘脑 细胞中或其它能正常表达全长ObR的细胞类型中。ObR是通过STAT蛋白 与特定信号转导途径关联,以及有关这些蛋白是通过可鉴别的DNA结合元 件控制基因的特异性的知识,可能有助于确定ObR的直接作用,这与理解 OB在体内的作用相关。上文所提供的实验系统还可被用于研究有关天然存 在的短型ObR在其长型的功能调节方面的功能性作用(如果有这样的作用的 话)。

                  12..OBR的突变分析

为了确定ObR胞质区上对激活基因重要的区域,产生了一系列突变体, 并进行了分析。下面所披露的研究,确定了两个对诱导基因表达至关重要的 ObR胞质域的独特区域。

                     12.材料和方法

                       12.1.1细胞

用Baumann等所披露的方法(1989,Ann.N.Y.Acad.Sci.557:280-297) 培养COS-1、COS-7和H-35细胞。在含有0.5%胎牛血清和1μM 地塞米松的培养基中进行模拟激发,或在添加了100ng/ml人莱普亭(Roche)、 IL-6(Genetics Institute)或G-CSF(Immunex Corp)的同一种培养基中处 理。

                  12.1.2表达载体和CAT

                     报导基因结构

用于长型人ObR的表达载体已在上文(第9节)中披露,而大鼠STAT1、 STAT3和STAT5B已在现有技术中披露(Lai等,1995,J.Biol.Chem.270: 23254-23257;Ripperger等,1995,J.Biol.Chem.270:29998-30006)。通 过PCR制备pOB-RΔ1115-1165、pOB-RΔ1065-1165和pOB -RΔ965-1165,它们均编码羧基末端截短的人ObR。简单地讲,将跨 人ObR的胞内域的寡核苷酸用于制备特定氨基酸的框内终止密码子。用 EcoRⅤ和XbaⅠ消化PCR片段,并将该片段亚克隆到用EcoRⅤ和XbaⅠ消化 过的人ObR上。用类似方法制备pOB-RΔ868,但使用能产生一个MscⅠ -XbaⅠ片段的引物,由该片段取代内源人ObR序列。按照在11.1.2节中披 露的方法制备编码具有突变的框3序列的人ObR的pOB-RY1141F。ObR 突变体pOB-R(boxlmt)在其ObR框1基序中含有PNP→SNS的变化(aa876 和878);而突变型pOB-RY986F和pOB-RY1079F是通过重叠延伸PCR 制备,制备时使用合成的寡核苷酸,该寡核苷酸编码特定的Tyr→Phe的氨 基酸置换(Higuchi等,1988,Nucleic Acids Res.16:7351-7367)。CAT 报导基因结构pHRRE-CAT和pIL-6-CAT已在现有技术中披露(Lai 等,1995,J.Biol.Chem.270:23254-23257;Movella等,1995,J.Biol. Chem.270:8298-8310)。

                12.1.3细胞转染及分析

通过DEAE-葡聚糖方法(Lopata等,1984,Nucleic Acids Res.12: 5707-5717)转染COS-1和H-35细胞,并通过脂转染胺方法(Tarstaglia 等,1995,Cell 83:1263-1271)转染COS-7细胞。为了分析STAT的激 活作用,将COS细胞在无血清培养基中保持16小时,接着用100ng/ml莱普 亭或G-CSF处理细胞15小时。

为了进行CAT分析,将转染过的细胞培养物细分,并用配体处理24小 时。测定CAT报导基因活性,并以每个实验系列的非处理对照所得到的值的 相对值型式表示。按照Sadowski等所披露的方法(1993,Science 26:1739 -1744),通过对全细胞提取物进行电泳迁移率变动分析(EMSA)分析STAT 蛋白对DNA的结合。在EMSA中,用放射标记的双链寡核苷酸SIEm67(用 于STAT1和STAT3)和TB-2(用于STAT5B)作结合底物。按照Cheng和 Flangan所披露的方法(1994,Cell 79:157-168),通过定量AP-OB融 合蛋白细胞表面结合力分析COS细胞中的受体表达。

                     12.1.4免疫印迹

所有免疫印迹均按Baumann等所述方法(1996,Proc.Natl.Acad.Sci. U.S.A.93:XXX-XXX)进行,并按照生产商(Amersham)的说明,通过加 强的化学发光检测显现免疫活性蛋白。对STAT5B特异的兔多克隆抗体购自 Santa Cruz Biotechnology。

                     12.2结果和讨论

如上所述,ObR是Ⅰ型细胞因子受体超家族的一员。这一类型的受体缺 乏内源性酪氨酸激酶活性,并且是由配体诱导的受体同源二聚化或异源二聚 化激活的。在很多场合,活化作用需要激活Janus家族(JAKs)的受体相关激 酶(Ihle等,1994,生物科学动态(Trends.Biol.Sci.)19:222-227)。JAK 与细胞因子受体的胞内部分的近膜域相关,在由配体诱导的受体激活作用之 后启动信号转导途径。JAK蛋白的下游目标包括转录因子的STAT(Signal Transducers and Activators of Transcription)家族的成员(Ihle等,1994, Trends.Biol.Sci.19:222-227)。STAT是DNA结合转录因子,它含有Src -同源(SH2)域,它能通过磷酸化酪氨酸残基与受体分子相互作用。STAT由 酪氨酸的磷酸化作用激活,形成异源二聚体或同源二聚体,转运到胞核中, 并调节靶基因的转录。

             12.2.1 OBR胞内域至少包括2个

             对信号转导有重要作用的区域

为了确定ObR胞质域中信号转导所需的区域,制造一系列的C-末端 缺失突变体(图11A)。将编码这些突变体的cDNA连同IL-6RE-CAT或 HRRE-CAT报导结构一起瞬时共转染到H-35细胞中,并测定其激发转 录的能力(图11B)。除掉ObR的框3序列(aa 1141-1144)的C-末端截短作 用,破坏了由IL-6-RE引起的转录激活作用(图11B;上图)。这一结果 与单个框3基序中Y→F突变的事实或ObR在H-35细胞中通过IL-6RE 彻底破坏信号转导(11.2.4节)的情况吻合。相反,除去极端C-末端序列对 通过HRRE进行的ObR信号转导的减弱作用很小,直到除去位置868-965 之间的大约97个氨基酸之后才能彻底破坏其信号转导作用(图11B)。

为了确保各种ObR突变体的表达载体能指导表面定位受体蛋白的合 成,通过AP-OB结合研究测定用各种结构转染的COS细胞的受体表达。 由ObR C-末端截短所产生的蛋白,是在表面上表达,并与配体结合(图12)。 而且,ObR的表达水平随胞内域的渐进性截短而提高。

如上文所述,通过IL-6RE进行的ObR基因诱导与STAT1和STAT3 的激活作用相关,而且,已证实通过HRRE完成的ObR基因诱导与STAT5B 的激活作用相关。为了进一步评价HRRE激发和STAT5B激活作用之间的关 系,用STAT5B的表达质粒和ObR缺失突变体共转染COS细胞。用这些细 胞制备提取物,对该提取物所做的免疫印迹表明STAT5B是以相对均等的量 在每一种转染培养物中表达。用莱普亭处理细胞。做EMSA分析,并通过 Western印迹定量STAT蛋白含量。ObR的渐进性C-末端截短,可导致其 激活STAT5B的能力减弱,而且,只有在除去近膜ObR片段之后(结构pOBR Δ868-1165)才丧失可检测的STAT5B激活作用。因此,ObR STAT5B激 活作用的丧失和通过HRRE进行的基因诱导之间似乎存在相关性。

为了确定保守性胞内域酪氨酸残基和近膜框1基序在由HRRE进行的 ObR信号转导中的作用,制备了突变体OB-RY1141F、OB-RY986F、 OB-RY1079F和OB-R(boxlmt)(图13A)。当在COS细胞中分析时,AP -OB结合研究证实,上述突变体大致表达在细胞表面,野生型ObR也是如 此。在将OB-RY986F和OB-RY1079F转染到H-35细胞中后,其调 节HRRE的能力未变(图13B)。相反,ObR框1基序的突变会使由该元件实 现的对基因诱导的调节作用完全丧失。因此,ObR的框1基序似乎是决定 ObR激活能通过HRRE调节基因诱导的激活途径的重要决定因素。

由ObR通过IL-6RE进行的基因诱导需要接近ObR的极端C-末端 的序列(图11B)。相反,通过HRRE进行的ObR基因诱导似乎不需要这些C -末端序列。另外,除去ObR胞内域序列的氨基酸965-1165之间的大约 200个氨基酸之后仅对由所述元件进行的基因诱导产生很小的影响,而是取 决于氨基酸868-965之间的大约17个氨基酸的近膜序列。因此,所提出 的ObR框2基序(Lee等,1996,Nature 379:632-635)(从ObR aa 1066 -1075)似乎对由HRRE进行的基因诱导不产生作用。EMSA分析表明, HRRE的基因诱导作用与ObR激活STAT5B的能力相关。有趣的是,已完全 缺失了所有胞内域酪氨酸残基、并因此缺失了所有潜在的SH2停靠位点的 OB-RΔ965-1165,依然能够低水平进行STAT5B激活,并通过HRRE 进行转导激发。只有当ObR的近膜序列被除去之后(OB-RΔ868-1165), HRRE基因诱导作用和STAT5B的激活作用才会完全丧失。与此吻合的是, 含有突变型框1基序的OB-R(box lmt)同样不能诱导由HRRE实现的基因 诱导作用,并可因此推测其不能激活STAT5B。

                    13.OBR的多聚化

ObR的一级结构提示,它与IL-6-型细胞因子受体信号转导亚基的 关系极为密切。这一类型的成员可通过异源二聚化或同源二聚化而被激活 (Kishimeto等,1994,Cell 76:253-262;Heldm等,l995,Cell 80: 213-223)。前者包括IL-6的受体、白血病抑制因子(LIF)、制癌蛋白M、 IL-11和睫状神经营养因子(CNTF),它们均拥有共同的信号转导物 gp130(Kishimoto等,1994,1994,Cell 76:253-262;Taga等,1989.Cell 58:573-581)。不过,早先我们已发现ObR似乎独立于gp130进行信号 转导(Baumann等,1996,Proc.Natl.Acad.Sci.U.S.A.93:XXX-XXX)。 因此,ObR可以在有关其它辅助链的条件下起作用,如被IL-3、粒细胞 巨噬细胞集落刺激因子(GM-CSF)和IL-5(IL-3Rβ)、或IL-2、IL -4、IL-7和IL-9(IL-2Rγ)的受体所共用的信号转导亚基。不过, ObR可在不能表达IL-3Rβ或IL-R-γ的肝癌细胞中转导信号(Wang等, 1995,J.Biol.Chem.270:8298-8310)。另外,ObR可以被同源二聚化所 激活,正如由粒细胞集落刺激因子受体(G-CSFR)所证实的(Fukanaga等, 1991,EMBO J.10:2855-2865;Ishezaka-Ikeda等,1993,Proc.Natl. Acad.Sci.U.S.A.90:123-127)。因此,为了确定ObR是否具有二聚化并 以同源二聚体的型式进行信号转导,构建了编码与ObR的胞内域结合的G -CSFR胞外域的嵌合受体,或具有与G-CSFR的胞内域结合的ObR胞 外域的反复受体(reciprocal receptor),并对其进行了分析(图14)。

                     13.1材料和方法

                       13.1.1.细胞

按照Baumann等所披露的方法(1989,Ann.N.Y.Acad.Sci.557:280- 297)培养COS-1、COS-7和H-35细胞。在含有0.5%胎牛血清和1 μM地塞米松的培养基中对细胞进行模拟刺激,或用添加了100ng/ml人莱 普亭(Roche)、IL-6(Genetics Institute)、或G-CSF(Immunex Corp.)的同 一种培养基进行处理。

            13.1.2表达载体及CAT报导基因结构

长型人ObR的表达载体如上文所述(第9节),全长G-CSFR或截短的 G-CSFR(ΔCyto)(Ziegler等,1993,Mol.Cell.Bvol.13:2384-2390),以 及大鼠STAT1、STAT3和STAT5B已在现有技术中披露(Lai等,1995,J. Biol.Chem.270:23254-23257;Ripperger等,1995,J.Biol.Chem. 270:29998-30006)。在本文中,术语“Δcyto”是指胞质域的缺失。G -CSFR/ObR嵌合受体是通过PCR制备的,它编码人G-CSFR的胞外域 (aa1-598),该胞外域邻接人ObR的跨膜域和胞内域(aa829-1165)。通过 PCR制备ObR/G-CSFR嵌合受体,它编码与人G-CSFR的胞内域(aa631 -813)结合的小鼠ObR胞外域和跨膜序列(aa1-860)。CAT报导基因结 构、pHRRE-CAT和pIL-6-CAT已在现有技术中披露(Lai等,1995,J. Biol.Chem.270:23254-23257;Morella等,1995,J.Biol.Chem.270: 8298-8310)。

                   13.1.3细胞转染和分析

用DEAE葡聚糖方法(Lopata等,1984,Nucleic Acids Res.12:5707- 5717)转染COS-1和H-35细胞,并用脂转染胺方法(Tartaglia等,1984, Cell 83:1263-1271)转染COS-7细胞。为了分析STAT蛋白激活作用, 在无血清培养基中保持COS细胞16小时,随后用100ng/ml莱普亭或G- CSF处理细胞15分钟。

为了做CAT测定,对转染的细胞培养物进行细分,并用配体处理24小 时。测定CAT报导活性,并以所获得的每个实验系列的非处理对照培养物的 值的相对值型式表示。按照Sadowski等所披露的方法(1993,Science 26: 1739-1744),用全细胞提取物作电泳迁移率变动分析,以分析STAT蛋白 的DNA结合力。在该EMSA分析中,将放射标记的双链寡核苷酸SIEm67(用 于STAT1和STAT3)和TB-2(用于STAT5B)用作结合底物。按照Cheng和 Flangan所披露的方法(1994,Cell 79:157-168),通过定量AP-OB融合 蛋白的细胞表面结合力分析COS细胞中的受体表达。

                    13.1.4免疫印迹

所有免疫印迹均按Baumann等所披露的方法进行(1996,Proc.Natl.Acad. Sci.U.S.A.93:XXX-XXX),并按照生产商(Amersham)所披露的方法, 通过加强的化学发光检测显现免疫活性蛋白。对STAT5B特异的兔多克隆抗 血清购自Santa Curz Biotechnology。抗细菌表达的G-CSF-R胞外域的 山羊多克隆抗血清是在Roswell Park Cancer Institute Springville Laboratories 制备的。

                    13.2结果和讨论

下面将披露的实验提示,尽管ObR胞质域的二聚化可能足以进行信号 转导,但随着配体结合,也可形成较高级别的同源寡聚体。

      13.2.1同源二聚化OBR胞内域可能足以进行信号转导

由于已证实嵌合受体复合体对于分析细胞因子受体激活作用十分有效 (Movella等,1995,J.Biol.Chem.270:8298-8310;Vigon等,1993, 癌基因(Oncogene)8:2607-2615;Baumann等,1994,Mol.Cell.Biol. 14:138-146),制备了ObR/G-CSFR和G-CSFR/ObR嵌合体,并进 行了研究,作为分析ObR信号转导机制的一种工具(图14A)。为了分析G- CSFR/ObR嵌合受体是否能够产生与野生型ObR相当的配体诱导的信号,测 试该嵌合体的STAT激活作用和转录激发作用。G-CSFR/ObR与STAT蛋 白的共转染产生了一种由G-CSF-诱导的STAT1、STAT3和STAT5B激 活作用。这一结果与由OB在ObR转染的细胞中诱导的STAT蛋白激活作用 相似。通过对用G-CSFR/ObR转染的培养物进行免疫印迹分析证实了嵌合 受体的表达。上述结果表明,由G-CSF介导的ObR胞质域的二聚化,可 产生一种ObR-类型的STAT蛋白的激活作用。另外,已发现G-CSFR/ObR 嵌合体可以激发转录作用,这一结果是在用IL-6RE和HRRE报导结构对 H-35细胞进行受体共转染之后,通过检测该细胞中的基因诱导而测定的(图 14B)。已发现所诱发的反应类似于ObR或内源IL-6R所述报导基因结构 的诱导作用。

上述结果表明,两个ObR胞质域的同源二聚化可启动由ObR进行的信 号转导,类似于由野生型G-CSFR实现的介导信号转导的机制。不过,G -CSFR/ObR嵌合体不能确切地证明OB配体具有使ObR胞外域二聚化的能 力。因此,分析了由含有与G-CSFR胞内域结合的ObR胞外域的相互嵌 合体产生的信号转导活性(图14A)。事实上,ObR/G-CSFR嵌合体可以介 导相当于由野生型ObR、G-CSFR/ObR和野生型G-CSFR的基因诱导 作用(图14B)。因此,综合上述结果表明,ObR无须辅助链来进行信号转导, 而且,两个ObR胞内域的聚合似乎足以实现受体激活。

两个ObR胞内域的聚合足以产生一个伴随配体诱导的激活作用的信号 这一事实表明,ObR可通过受体的同源二聚化起作用。如果是这样的话,由 ObR实现的信号转导可能是“有害的”,即超量表达一种信号转导缺陷型同 源二聚化配偶体,类似于受体酪氨酸激酶家族成员所表现出的特征(Paulson 等,1989,J.Biol.Chem.264:17615-17618;Svensson等,1990,J.Biol. Chem.265:20863-20868;Wen等,1992,J.Biol.Chem.267:2512 -2518;Fantl等,1993,Annu.Rev.Biochem.62:453-481)。如上文所 述(第12节),仅含有胞质域的6个近膜氨基酸的ObR是信号转导缺陷型(图 11B)。因此,进行了实验,以确定一种截短的、信号转导缺陷型ObR的表达 是否会破坏由全长ObR进行的信号转导。用截短的受体OB-RΔ868- 1165和全长ObR对细胞进行共转染,并测定这种复合体激发一种报导基因 结构表达的能力,其中,OB-RΔ868-1165的量相对全长ObR是逐渐 加大的。用量逐渐加大的截短ObR不会减弱由野生型受体进行的信号转导 (图15A)。不过,即使在截短受体的用量大大超出全长受体用量的情况下, 所观察到的信号转导抑制也未能达到由超量表达和信号转导缺陷型截短G- CSFR(Δcyto)对G-CSFR信号转导的抑制(图15A和15C)。所观察到的 ObR和G-CSFR对显性失活阻抑的不同的敏感性,是其胞外域的特征,这 是由用受体嵌合体进行的显性失活研究所证实的(图15B和15C)。

对obR这种弱的显性失活阻抑加一种可能的解释是,两个ObR分子的 相互作用可能需要位于所述受体胞内区的功能域。为了验证这种可能性,检 验了由一种突变性受体进行的ObR显性失活阻抑,该突变型是通过ObR框3 基序中的一个氨基酸置换(Y1141F)产生的信号转导缺陷而实现的。如上所 述,这种突变可完全破坏H-35细胞中由IL-6RE实现的ObR调节基因 诱导的作用(第12节)。因此,对OB-R(Y1141F)抑制由该增强因子实现的 野生型ObR信号转导的能力进行了研究。所述研究表明,提高转染突变型 OB-RY1141F对野生型受体的比例,不会明显抑制信号转导(图15E)。因 此,ObR框3突变体和OB-RΔ868-1165在其反式阻抑野生型ObR的 信号转导方面的能力表现相似。有趣的是,截短的或框3突变型ObR受体的 低水平表达,可产生对野生型ObR信号转导作用的轻度加强作用。而且,在 有用量逐渐加大的截短OB-RΔ868-1165的条件下,还可观察到ObR/G -CSFR信号转导的类似特征(图15A、15B和15C)。

如上所述(第11节),ObR可以在有IL-6-型细胞因子受体的gp130 信号转导因子的中和抗体的条件下,在肝癌细胞中转导信号。而且,所述肝 癌细胞不能表达其它特征性的细胞因子受体辅助链IL-2Rγ或IL-3Rβ (Wang等,1995,Blood 86:1671-1679;Morella等,1995,J.Biol.Chem. 270:8298-8310)。因此,ObR可能是通过一个与受体同源二聚化相关的 机制起作用。在Ⅰ型细胞因子受体家族的成员中,推测由G-CSFR进行的 信号转导,是通过配体诱导的受体同源二聚化而启动的(Fukanaga等,1991, EMBO J.10:2855-2865;Ishezaka-IKeda等,1993,Proc.Natl.Acad. Sci.U.SA.90:123-127)。如上所述,已证实将嵌合受体用于分析细胞因 子受体激活作用是十分有效的(Movella等,1995,同上;Vigon等,1993, 同上;Baumann等,1994,同上),制备了ObR/G-CSFR和G-CSFR/ObR 嵌合体,并将其作为分析ObR信号转导的工具加以研究。所述研究揭示,G -CSFR/ObR嵌合体可有效启动IL-6RE-CAT和HRRE-CAT报导结 构的转录作用(图14B)。由于G-CSFR在结合G-CSF时被认为可形成同 源二聚体,这意味着两个胞内ObR域的聚合足以启动受体信号转导。ObR/G -CSFR嵌合体还以这种方式通过IL-6RE和HRRE介导转录激活作用(图 14B)。上述结果表明,莱普亭结合可以使两个ObR胞外域二聚化,由此引发 至少两个胞内G-CSFR域的结合,并激活所述受体复合体。而且,上述结 果表明,可以制备出能像ObR激动剂那样通过两个ObR链的简单交联而起 作用的小型分子或抗体。

正如就可通过简单的同源二聚化而激活的受体所预测的那样,一种信号 转导缺陷型同源二聚化配偶体的共表达,可大大减弱由全长G-CSFR和G -CSFR/嵌合体实现的信号转导。不过,OB-RΔ868-1165不能如此 有效地抑制由全长ObR或ObR/G-CSFR嵌合体进行的信号转导。因此, 可能的情况是,莱普亭与细胞表面受体的结合可导致较高级别的寡聚化(受体 数>2/复合体),正如在IL-10受体复合体上所证实的(Tan等,1995,J. Biol.Chem.21:12906-12911)以及在活化素/TGF-βR家族的成员上所 证实的(Brand等,1993,J.Biol.Chem.268:11500-11503;Weiser等, 1993,Mol.Cell.Biol.13:7239-7247;Wrana等,1994,Cell 71:1003 -1014;Moustakas等,1993,J.Biol.Chem.268:22215-22218;Henis 等,1994,J.Cell Biol.126:139-154)。按照这一模式,由全长ObR或ObR/G -CSFR嵌合体进行的配体结合,可导致两个以上受体链的聚合,而且,只 是两个胞内域的并列对于信号发生来说就足够了。预计这种复合体对显性失 活阻抑的抵抗力很强。含G-CSFR/ObR嵌合体的复合体中的G-CSFR(Δ cyto)对信号转导的强有力的抑制表明,当处于简单的同源二聚体结构的前后 时,ObR胞内域会受到有效抑制。尽管OB-RΔ868-1165有可能处于 细胞膜上与野生型ObR不同的部位,但ObR胞内域的一个酪氨酸残基的突 变(Y1141F)似乎不大可能导致改变了的受体膜定位。因此,我们对由OB- RΔ868-1165或OB-RY1141F介导的类似抑制效应的观察表明,我们 的结果并非是由改变了的膜定位所致。OB-RΔ868-1165和OB- RY1141F低的表达水平,可以小规模地增强全长ObR和ObR/G-CSFR嵌 合体的信号转导。我们推测,这一效果可归因于配体呈递(Andres等,1989, (细胞生物学杂志)(J.Cell Biol.)109:3137-3145;Massaugue等,1992, Cell 69:1067-1070;Lin等,1993,(细胞生物学动态)(Trends.Cell Biol.) 3:14-19)或配体转移,正如早先在TNF受体上所证实的(Tarstaglia等, 1993,J.Biol.Chem.268:18542-18548)。

如上所述,短型ObR可能在体内起着转运或清除功能(Tartaglia等, 1995,Cell 83:1263-1271)。不过,长型和短型ObR可能在功能上相互作 用的可能性提示我们,短型ObR可以调节长型ObR的活性。这一结论得到 了在小鼠体内主要的天然形成的非信号转导短型ObR(含有34个氨基酸的胞 内域),它还相当于存在于db/db小鼠中的突变形ObR,可抑制长型受体信 号转导的事实的支持。

                14.微生物的保藏

已于标明的日期将下列微生物交由美国典型培养物保藏中心 (ATCC)(Rockville,Maryland)保藏,并被授予所标明的保藏号: 微生物              克隆    ATCC保藏号  保藏日期 大肠杆菌菌株      famj5312     69952    11月22日 1995 5312B4F3 大肠杆菌h-ObRD    fahj5312d    69963    12月5日 1995 大肠杆菌h-ObR-p87 h-ObR-p87    69972    12月28日 1995

本发明并不局限于由本文所披露的具体实施方案限定的范围,这些实施 方案只是就本发明的某一方面进行说明的,而且,功能上等同的方法及要素 也属于本发明的范畴。事实上,除了本文所图示和说明的方案之外,本领域 技术人员通过阅读上述说明书及附图可以很容易地理解本发明的各种改 进。这些改进被视为落在所附权利要求书的范围内。

                             序列表 (1)一般资料:

(ⅰ)申请人:Tartaglia,Louis A.

            Tepper.RobertⅠ.

            Culpepper,Janice A.

            White,David W。

(ⅱ)发明名称Ob受体及诊断和治疗体重疾病的方法

(ⅲ)序列数:50

(ⅳ)相关地址:

    (A)收件人:Fish和Richardson P.C.

    (B)街道:225 Franklin Street

    (C)城市:Boston

    (D)州:Massachusetts

    (E)国家:U.S.A.

    (F)邮编:021001-2804

(ⅴ)计算机可读型式:

    (A)媒体类型:软盘

    (B)计算机:IBM PC兼容

    (C)操作系统:PC-DOS/MS-DOS

    (D)软件:WordPerfect(Version 5.1)

(ⅵ)当前申请资料:

    (A)申请号:US 08/708,123

    (B)申请日:1996.09.03

    (C)分类:

(ⅶ)在先申请资料:

    (A)申请号:US 08/638,524

    (B)申请日:1996.04.26

(ⅶ)在先申请资料:

    (A)申请号:US 08/599,455

    (B)申请日:1996.01.22

(ⅶ)在先申请资料:

    (A)申请号:US 08/583,1 53

    (B)申请日:1995.12.28

(ⅶ)在先申请资料:

    (A)申请号:US 08/570,142

    (B)申请日:1995.12.11

(ⅶ)在先申请资料:

    (A)申请号:US 08/569,485

    (B)申请日:1995.12.08

(ⅶ)在先申请资料:

    (A)申请号:US 08/566,622

    (B)申请日:1995.12.04

(ⅶ)在先申请资料:

    (A)申请号:US 08/562,663

    (B)申请日:1995.11.27

(ⅷ)律师/代理人资料:

    (A)姓名:Meikeljohn,Ph.D.,Anita L.

    (B)注册号:35,283

    (C)文件/档案号:07334/019001

(ⅸ)电信资料:

    (A)电话:(617)542-5070

    (B)传真:(617)542-8906

    (C)电传:200154 (2)序列1资料:

(ⅰ)序列特征:

    (A)长度:3097bp

    (B)类型:核酸

    (C)链型:双

    (D)拓朴结构:不详

(ⅱ)分子类型:cDNA

(ⅸ)特征:

    (A)名称/关键词:CDS

(B)位置:61..2742 (ⅹⅰ)序列描述:序列1: GTCGACCCAC GCGTCCGGAG GAATCGTTCT GCAAATCCAG GTGTACACCT CTGAAGAAAG 60 ATG ATG TGT CAG AAA TTC TAT GTG GTT TTG TTA CAC TGG GAA TTT CTT 108 Met Met Cys Gln Lys Phe Tyr Val Val Leu Leu His Trp Glu Phe Leu   1               5                  10                  15 TAT GTG ATA GCT GCA CTT AAC CTG GCA TAT CCA ATC TCT CCC TGG AAA 156 Tyr Val Ile Ala Ala Leu Asn Leu Ala Tyr Pro Ile Ser Pro Trp Lys              20                  25                  30 TTT AAG TTG TTT TGT GGA CCA CCG AAC ACA ACC GAT GAC TCC TTT CTC 204 Phe Lys Leu Phe Cys Gly Pro Pro Asn Thr Thr Asp Asp Ser Phe Leu 15       35                  40                  45 TCA CCT GCT GGA GCC CCA AAC AAT GCC TCG GCT TTG AAG GGG GCT TCT 252 Ser Pro Ala Gly Ala Pro Asn Asn Ala Ser Ala Leu Lys Gly Ala Ser      50                  55                  60 GAA GCA ATT GTT GAA GCT AAA TTT AAT TCA AGT GGT ATC TAC GTT CCT 300 Glu Ala Ile Val Glu Ala Lys Phe Asn Ser Ser Gly Ile Tyr Val Pro  65                  70                  75                  80 GAG TTA TCC AAA ACA GTC TTC CAC TGT TGC TTT GGG AAT GAG CAA GGT 348 Glu Leu Ser Lys Thr Val Phe His Cys Cys Phe Gly Asn Glu Gln Gly                  85                  90                  95 CAA AAC TGC TCT GCA CTC ACA GAC AAC ACT GAA GGG AAG ACA CTG GCT 396 Gln Asn Cys Ser Ala Leu Thr Asp Asn Thr Glu Gly Lys Thr Leu Ala             100                 105                 110 TCA GTA GTG AAG GCT TCA GTT TTT CGC CAG CTA GGT GTA AAC TGG GAC 444 Ser Val Val Lys Ala Ser Val Phe Arg Gln Leu Gly Val Asn Trp Asp         115                 120                 125 ATA GAG TGC TGG ATG AAA GGG GAC TTG ACA TTA TTC ATC TGT CAT ATG 492 Ile Glu Cys Trp Met Lys Gly Asp Leu Thr Leu Phe Ile Cys His Met     130                 135                 140 GAG CCA TTA CCT AAG AAC CCC TTC AAG AAT TAT GAC TCT AAG GTC CAT 540 Glu Pro Leu Pro Lye Asn Pro Phe Lys Asn Tyr Asp Ser Lys Val His 145                 150                 155                 160 CTT TTA TAT GAT CTG CCT GAA GTC ATA GAT GAT TCG CCT CTG CCC CCA 588 Leu Leu Tyr Asp Leu Pro Glu Val Ile Asp Asp Ser Pro Leu Pro Pro                 165                 170                 175 CTG AAA GAC AGC TTT CAG ACT GTC CAA TGC AAC TGC AGT CTT CGG GGA 636 Leu Lys Asp Ser Phe Gln Thr Val Gln Cys Asn Cys Ser Leu Arg Gly             180                     185                 190 TGT GAA TGT CAT GTG CCG GTA CCC AGA GCC AAA CTC AAC TAC GCT CTT 684 Cys Glu Cys His Val Pro Val Pro Arg Ala Lys Leu Asn Tyr Ala Leu         195                 200                 205 CTG ATG TAT TTG GAA ATC ACA TCT GCC GGT GTG AGT TTT CAG TCA CCT 732 Leu Met Tyr Leu Glu Ile Thr Ser Ala Gly Val Ser Phe Gfn Ser Pro     210                 215                 220 CTG ATG TCA CTG CAG CCC ATG CTT GTT GTG AAA CCC GAT CCA CCC TTA 780 Leu Met Ser Leu Gln Pro Met Leu Val Val Lys Pro Asp Pro Pro Leu 225                 230                 235                 240 GGT TTG CAT ATG GAA GTC ACA GAT GAT GGT AAT TTA AAG ATT TCT TGG 828 Gly Leu His Met Glu Val Thr Asp Asp Gly Asn Leu Lys Ile ser Trp                 245                 250                 255 GAC AGC CAA ACA ATG GCA CCA TTT CCG CTT CAA TAT CAG GTG AAA TAT 876 Asp Ser Gln Thr Met Ala Pro Phe Pro Leu Gln Tyr Gln Val Lys Tyr             260                 265                 270 TTA GAG AAT TCT ACA ATT GTA AGA GAG GCT GCT GAA ATT GTC TCA GCT 924 Leu Glu Asn Ser Thr Ile Val Arg Glu Ala Ala Glu Ile Val Ser Ala         275                 280                 285 ACA TCT CTG CTG GTA GAC AGT GTG CTT CCT GGA TCT TCA TAT GAG GTC 1972 Thr Ser Leu Leu Val Asp Ser Val Leu Pro Gly Ser Ser Tyr Glu Val     290                 295                 300 CAG GTG AGG AGC AAG AGA CTG GAT GGT TCA GGA GTC TGG AGT GAC TGG 1020 Gln Val Arg Ser Lys Arg Leu Asp Gly Ser Gly Val Trp Ser Asp Trp 305                 310                 315                 320 AGT TCA CCT CAA GTC TTT ACC ACA CAA GAT GTT GTG TAT TTT CCA CCC 1068 Ser Ser Pro Gln Val Phe Thr Thr Gln Asp Val Val Tyr Phe Pro Pro                 325                 330                 335 AAA ATT CTG ACT AGT GTT GGA TCG AAT GCT TCT TTT CAT TGC ATC TAC 1116 Lys Ile Leu Thr Ser Val Gly Ser Asn Ala Ser Phe His Cys Ile Tyr             340                 345                 350 AAA AAC GAA AAC CAG ATT ATC TCC TCA AAA CAG ATA GTT TGG TGG AGG 1164 Lys Asn Glu Asn Gln Ile Ile Ser Ser Lys Gln Ile Val Trp Trp Arg         355                 360                 365 AAT CTA GCT GAG AAA ATC CCT GAG ATA CAG TAC AGC ATT GTG AGT GAC 1212 Asn Leu Ala Glu Lys Ile Pro Glu Ile Gln Tyr Ser Ile Val Ser Asp     370                 375                 380 CGA GTT AGC AAA GTT ACC TTC TCC AAC CTG AAA GCC ACC AGA CCT CGA 1260 Arg Val Ser Lys Val Thr Phe Ser Asn Leu Lys Ala Thr Arg Pro Arg 385                 390                 395                 400 GGG AAG TTT ACC TAT GAC GCA GTG TAC TGC TGC AAT GAG CAG GCG TGC 1308 Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu Gln Ala Cys                 405                     410             415 CAT CAC CGC TAT GCT GAA TTA TAC GTG ATC GAT GTC AAT ATC AAT ATA 1356 His His Arg Tyr Ala Glu Leu Tyr Val Ile Asp Val Asn Ile Asn Ile             420                 425                 430 TCA TGT GAA ACT GAC GGG TAC TTA ACT AAA ATG ACT TGC AGA TGG TCA 1404 Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg Trp Ser         435                 440                 445 CCC AGC ACA ATC CAA TCA CTA GTG GGA AGC ACT GTG CAG CTG AGG TAT 1452 Pro Ser Thr Ile Gln Ser Leu Val Gly Ser Thr Val Gln Leu Arg Tyr     450                 455                 460 CAC AGG CGC AGC CTG TAT TGT CCT GAT AGT CCA TCT ATT CAT CCT ACG 1500 His Arg Arg Ser Leu Tyr Cys Pro Asp Ser Pro Ser Ile His Pro Thr 465                 470                 475                 480 TCT GAG CCC AAA AAC TGC GTC TTA CAG AGA GAC GGC TTT TAT GAA TGT 1548 Ser Glu Pro Lys Asn Cys Val Leu Gln Arg Asp Gly Phe Tyr Glu Cys                 485                 490                 495 GTT TTC CAG CCA ATC TTT CTA TTA TCT GGC TAT ACA ATG TGG ATC AGG 1596 Val Phe Gln Pro Ile Phe Leu Leu Ser Gly Tyr Thr Met Trp Ile Arg             500                 505                 510 ATC AAC CAT TCT TTA GGT TCA CTT GAC TCG CCA CCA ACG TGT GTC CTT 1644 Ile Asn His Ser Leu Gly Ser Leu Asp Ser Pro Pro Thr Cys Val Leu         515                 520                 525 CCT GAC TCC GTA GTA AAA CCA CTA CCT CCA TCT AAC GTA AAA GCA GAG 1692 Pro Asp Ser Val Val Lys Pro Leu Pro Pro Ser Asn Val Lys Ala Glu     530                 535                 540 ATT ACT GTA AAC ACT GGA TTA TTG AAA GTA TCT TGG GAA AAG CCA GTC 1740 Ile Thr Val Asn Thr Gly Leu Leu Lys Val Ser Trp Glu Lys Pro Val 545                 550                 555                 560 TTT CCG GAG AAT AAC CTT CAA TTC CAG ATT CGA TAT GGC TTA AGT GGA 1788 Phe Pro Glu Asn Asn Leu Gln Phe Gln Ile Arg Tyr Gly Leu Ser Gly                 565                 570                 575 AAA GAA ATA CAA TGG AAG ACA CAT GAG GTA TTC GAT GCA AAG TCA AAG 1836 Lys Glu Ile Gln Trp Lys Thr His Glu Val Phe Asp Ala Lys Ser Lys             580                 585                 590 TCT GCC AGC CTG CTG GTG TCA GAC CTC TGT GCA GTC TAT GTG GTC CAG 1884 Ser Ala Ser Leu Leu Val Ser Asp Leu Cys Ala Var Tyr Val Val Gln         595                 600                 605 GTT CGC TGC CGG CGG TTG GAT GGA CTA GGA TAT TGG AGT AAT TGG AGC 1932 Val Arg Cys Arg Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn Trp Ser     610                 615                 620 AGT CCA GCC TAT ACG CTT GTC ATG GAT GTA AAA GTT CCT ATG AGA GGG 1980 Ser Pro Ala Tyr Thr Leu Val Met Asp Val Lys Val Pro Met Arg Gly 625                 630                 635                 640 CCT GAA TTT TGG AGA AAA ATG GAT GGG GAC GTT ACT AAA AAG GAG AGA 2028 Pro Glu Phe Trp Arg Lys Met Asp Gly Asp Val Thr Lys Lys Glu Arg                 645                 650                 655 AAT GTC ACC TTG CTT TGG AAG CCC CTG ACG AAA AAT GAC TCA CTG TGT 2076 Asn Val Thr Leu Leu Trp Lys Pro Leu Thr Lys Asn Asp Ser Leu Cys             660                 665                 670 AGT GTG AGG AGG TAC GTT GTG AAG CAT CGT ACT GCC CAC AAT GGG ACG 2124 Ser Val Arg Arg Tyr Val Val Lys His Arg Thr Ala His Asn Gly Thr             675             680                 685 TGG TCA GAA GAT GTG GGA AAT CGG ACC AAT CTC ACT TTC CTG TGG ACA 2172 Trp Ser Glu Asp Val Gly Asn Arg Thr Asn Leu Thr Phe Leu Trp Thr 690                     695                 700 GAA CCA GCG CAC ACT GTT ACA GTT CTG GCT GTC AAT TCC CTC GGC GCT 2220 Glu Pro Ala His Thr Val Thr Val Leu Ala Val Asn Ser Leu Gly Ala 705                 710                 715                 720 TCC CTT GTG AAT TTT AAC CTT ACC TTC TCA TGG CCC ATG AGT AAA GTG 2268 Ser Leu Val Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser Lys Val                 725                 730                 735 AGT GCT GTG GAG TCA CTC AGT GCT TAT CCC CTG AGC AGC AGC TGT GTC 2316 Ser Ala Val Glu Ser Leu Ser Ala Tyr Pro Leu Ser Ser Ser Cys Val             740                 745                 750 ATC CTT TCC TGG ACA CTG TCA CCT GAT GAT TAT AGT CTG TTA TAT CTG 2364 Ile Leu Ser Trp Thr Leu Ser Pro Asp Asp Tyr Ser Leu Leu Tyr Leu         755                 760                 765 GTT ATT GAA TGG AAG ATC CTT AAT GAA GAT GAT GGA ATG AAG TGG CTT 2412 Val Ile Glu Trp Lys Ile Leu Asn Glu Asp Asp Gly Met Lys Trp Leu     770                 775                 780 AGA ATT CCC TCG AAT GTT AAA AAG TTT TAT ATC CAC GAT AAT TTT ATT 2460 Arg Ire Pro Ser Asn Val Lys Lys Phe Tyr Ile His Asp Asn Phe Ile 785                 790                 795                 800 CCC ATC GAG AAA TAT CAG TTT AGT CTT TAC CCA GTA TTT ATG GAA GGA 2508 Pro Ile Glu Lys Tyr Gln Phe Ser Leu Tyr Pro Val Phe Met Glu Gly                 805                 810                 815 GTT GGA AAA CCA AAG ATA ATT AAT GGT TTC ACC AAA GAT GCT ATC GAC 2556 Val Gly Lys Pro Lys Ile Ile Asn Gly Phe Thr Lys Asp Ala Ile Asp             820                 825                 830 AAG CAG CAG AAT GAC GCA GGG CTG TAT GTC ATT GTA CCC ATA ATT ATT 2604 Lys Gln Gln Asn Asp Ala Gly Leu Tyr Val Ile Val Pro Ile Ile Ile         835                 840                 845 TCC TCT TGT GTC CTA CTG CTC GGA ACA CTG TTA ATT TCA CAC CAG AGA 2652 Ser Ser Cys Val Leu Leu Leu Gly Thr Leu Leu Ile Ser His Gln Arg     850                 855                 860 ATG AAA AAG TTG TTT TGG GAC GAT GTT CCA AAC CCC AAG AAT TGT TCC 2700 Met Lys Lys Leu Phe Trp Asp Asp Val Pro Asn Pro Lys Asn Cys Ser 865                 870                 875                 880 TGG GCA CAA GGA CTG AAT TTC CAA AAG AGA ACG GAC ACT CTT 2742 Trp Ala Gln Gly Leu Asn Phe Gln Lys Arg Thr Asp Thr Leu                 885                 890 TGAAGTCTCT CATGACCACT ACAGATGAAC CCAATCTACC AACTTCCCAA CAGTCCATAC 2802 AATATTAGAA GATGTTTACA TTTTGATGGA GGGAAACAAA CCTAAACTAT GGTTTGAATG 2862 ACTAAGAAAT AACATTTGAT GAGCTTATTA GAGAAGTGTA TATTTTGTGG CCACAATGTA 2922 GGTTTGATGT AGTTCAGTTT GGGACATATG CTTGATTTTC AGGGCATCAA AAATTTAAAG 2982 TTGATATTCA   TGGACTCTGC   ATTTTATTTC   TTAAGTCATA   AAATGATAAT   GGTGTGACGG 3042 TTGGTGTCAG   AACCTATTTG   GGTACAGATC   ACCAAAATAT   GGTAGGTAAT   GCCTT 3097 (2)序列2资料:

(ⅰ)序列特征:

    (A)长度:894aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:序列2: Met Met Cys Gln Lys Phe Tyr Val Val Leu Leu His Trp Glu Phe Leu   1               5                  10                  15 Tyr Val Ile Ala Ala Leu Asn Leu Ala Tyr Pro Ile Ser Pro Trp Lys              20                  25                  30 Phe Lys Leu Phe Cys Gly Pro Pro Asn Thr Thr Asp Asp Ser Phe Leu          35                  40                  45 Ser Pro Ala Gly Ala Pro Asn Asn Ala Ser Ala Leu Lys Gly Ala Ser      50                  55                  60 Glu Ala Ile Val Glu Ala Lys Phe Asn Ser Ser Gly Ile Tyr Val Pro  65                  70                  75                  80 Glu Leu Ser Lys Thr Val Phe His Cys Cys Phe Gly Asn Glu Gln Gly                  85                  90                  95 Gln Asn Cys Ser Ala Leu Thr Asp Asn Thr Glu Gly Lys Thr Leu Ala             100                 105                 110 Ser Val Val Lys Ala Ser Val Phe Arg Gln Leu Gly Val Asn Trp Asp         115                 120                 125 Ile Glu Cys Trp Met Lys Gly Asp Leu Thr Leu Phe Ile Cys His Met     130                 135                 140 Glu Pro Leu Pro Lys Asn Pro Phe Lys Asn Tyr Asp Ser Lys Val His 145                 150                 155                 160 Leu Leu Tyr Asp Leu Pro Glu Val Ile Asp Asp Ser Pro Leu Pro Pro                 165                 170                 175 Leu Lys Asp Ser Phe Gln Thr Val Gln Cys Aen Cys Ser Leu Arg Gly             180                 185                 190 Cys Glu Cys His Val Pro Val Pro Arg Ala Lys Leu Asn Tyr Ala Leu         195                 200                 205 Leu Met Tyr Leu Glu Ile Thr Ser Ala Gly Val Ser Phe Gln Ser Pro     210                 215                220 Leu Met Ser Leu Gln Pro Met Leu Val Val Lys Pro Asp Pro Pro Leu 225                 230                 235                 240 Gly Leu His Met Glu Val Thr Asp Asp Gly Asn Leu Lys Ile Ser Trp                 245                 250                 255 Asp Ser Gln Thr Met Ala Pro Phe Pro Leu Gln Tyr Gln Val Lys Tyr             260                 265                 270 Leu Glu Asn Ser Thr Ile Val Arg Glu Ala Ala Glu Ile Val Ser Ala         275                 280                 285 Thr Ser Leu Leu Val Asp Ser Val Leu Pro Gly Ser Ser Tyr Glu Val     290                 295                 300 Gln Val Arg Ser Lys Arg Leu Asp Gly Ser Gly Val Trp Ser Asp Trp 305                 310                 315                 320 Ser Ser Pro Gln Val Phe Thr Thr Gln Asp Val Val Tyr Phe Pro Pro                 325                 330                 335 Lys Ile Leu Thr Ser Val Gly Ser Asn Ala Ser Phe His Cys Ile Tyr             340                 345                 350 Lys Ash Glu Asn Gln Ile Ile Ser Ser Lys Gln Ile Val Trp Trp Arg         355                 360                 365 Asn Leu Ala Glu Lys Ile Pro Glu Ile Gln Tyr Ser Ile Val Ser Asp     370                 375                 380 Arg Val Ser Lys Val Thr Phe Ser Asn Leu Lys Ala Thr Arg Pro Arg 385                 390                 395                 400 Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu Gln Ala Cys                 405                 410                 415 His His Arg Tyr Ala Glu Leu Tyr Val Ile Asp Val Asn Ile Asn Ile             420                 425                 430 Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg Trp Ser         435                 440                 445 Pro Ser Thr Ile Gln Ser Leu Val Gly Ser Thr Val Gln Leu Arg Tyr     450                 455                 460 His Arg Arg Ser Leu Tyr Cys Pro Asp Ser Pro Ser Ile His Pro Thr 465                 470                 475                 480 Ser Glu Pro Lys Asn Cys Val Leu Gln Arg Asp Gly Phe Tyr Glu Cys                 485                 490                 495 Val Phe Gln Pro Ile Phe Leu Leu Ser Gly Tyr Thr Met Trp Ile Arg             500                 505                 510 Ile Asn His Ser Leu Gly Ser Leu Asp Ser Pro Pro Thr Cys Val Leu         515                 520                 525 Pro Asp Ser Val Val Lys Pro Leu Pro Pro Ser Asn Val Lys Ala Glu     530                 535                 540 Ile Thr Val Asn Thr Gly Leu Leu Lys Val Ser Trp Glu Lys Pro Val 545                 550                 555                 560 Phe Pro Glu Asn Asn Leu Gln Phe Gln Ile Arg Tyr Gly Leu Ser Gly                 565                 570                 575 Lys Glu Ile Gln Trp Lys Thr His Glu Val Phe Asp Ala Lys Ser Lys             580                 585                 590 Ser Ala Ser Leu Leu Val Ser Asp Leu Cys Ala Val Tyr Val Val Gln         595                 600                 605 Val Arg Cys Arg Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn Trp Ser     610                 615                 620 Ser Pro Ala Tyr Thr Leu Val Met Asp Val Lys Val Pro Met Arg Gly 625                 630                 635                 640 Pro Glu Phe Trp Arg Lys Met Asp Gly Asp Val Thr Lys Lys Glu Arg                 645                 650                 655 Asn Val Thr Leu Leu Trp Lys Pro Leu Thr Lys Asn Asp Ser Leu Cys             660                 665                 670 Ser Val Arg Arg Tyr Val Val Lys His Arg Thr Ala His Asn Gly Thr         675                 680                 685 Trp Ser Glu Asp Val Gly Asn Arg Thr Asn Leu Thr Phe Leu Trp Thr     690                695                  700 Glu Pro Ala His Thr Val Thr Val Leu Ala Val Asn Ser Leu Gly Ala 705                 710                 715                 720 Ser Leu Val Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser Lys Val                 725                 730                 735 Ser Ala Val Glu Ser Leu Ser Ala Tyr Pro Leu Ser Ser Ser Cys Val             740                 745                 750 Ile Leu Ser Trp Thr Leu Ser Pro Asp Asp Tyr Ser Leu Leu Tyr Leu         755                 760                 765 Val Ile Glu Trp Lys Ile Leu Asn Glu Asp Asp Gly Met Lys Trp Leu     770                 775                 780 Arg Ile Pro Ser Asn Val Lys Lys Phe Tyr Ile His Asp Asn Phe Ile 785                 790                 795                 800 Pro Ile Glu Lys Tyr Gln Phe Ser Leu Tyr Pro Val Phe Met Glu Gly                 805                 810                 815 Val Gly Lys Pro Lys Ile Ile Asn Gly Phe Thr Lys Asp Ala Ile Asp             820                 825                 830 Lys Gln Gln Asn Asp Ala Gly Leu Tyr Val Ile Val Pro Ile Ile Ile         835                 840                 845 Ser Ser Cys Val Leu Leu Leu Gly Thr Leu Leu Ile Ser His Gln Arg     850                 855                 860 Met Lys Lys Leu Phe Trp Asp Asp Val Pro Asn Pro Lys Asn Cys Ser 865                 870                 875                 880 Trp Ala Gln Gly Leu Asn Phe Gln Lys Arg Thr Asp Thr Leu                 885                 890 (2)序列3资料:

(ⅰ)序列特征:

    (A)长度:3871bp

    (B)类型:核酸

    (C)链型:双

    (D)拓朴结构:不详

(ⅱ)分子类型:cDNA

(ⅸ)特征:

    (A)名称/关键词:CDS

    (B)位置:194..3688

(ⅹⅰ)序列描述:序列3: GGCACGAGCC GGTCTGGCTT GGGCAGGCTG CCCGGGCCGT GGCAGGAAGC CGGAAGCAGC 60 CGCGGCCCCA GTTCGGGAGA CATGGCGGGC GTTAAAGCTC TCGTGGCATT ATCCTTCAGT 120 GGGGCTATTG GACTGACTTT TCTTATGCTG GGATGTGCCT TAGAGGATTA TGGGTGTACT 180 TCTCTGAAGT AAG ATG ATT TGT CAA AAA TTC TGT GTG GTT TTG TTA CAT 229                Met Ile Cys Gln Lys Phe Cys Val Val Leu Leu His                  1               5                  10 TGG GAA TTT ATT TAT GTG ATA ACT GCG TTT AAC TTG TCA TAT CCA ATT 277 Trp Glu Phe Ile Tyr Val Ile Thr Ala Phe Asn Leu Ser Tyr Pro Ile          15                  20                  25 ACT CCT TGG AGA TTT AAG TTG TCT TGC ATG CCA CCA AAT TCA ACC TAT 325 Thr Pro Trp Arg Phe Lys Leu Ser Cys Met Pro Pro Asn Ser Thr Tyr      30              35                  40 GAC TAC TTC CTT TTG CCT GCT GGA CTC TCA AAG AAT ACT TCA AAT TCG 373 Asp Tyr Phe Leu Leu Pro Ala Gly Leu Ser Lys Asn Thr Ser Asn Ser  45                  50                  55                  60 AAT GGA CAT TAT GAG ACA GCT GTT GAA CCT AAG TTT AAT TCA AGT GGT 421 Asn Gly His Tyr Glu Thr Ala Val Glu Pro Lys Phe Aen Ser Ser Gly                  65                  70                  75 ACT CAC TTT TCT AAC TTA TCC AAA ACA ACT TTC CAC TGT TGC TTT CGG 469 Thr His Phe Ser Asn Leu Ser Lys Thr Thr Phe Mis Cys Cys Phe Arg              80                  85                  90 AGT GAG CAA GAT AGA AAC TGC TCC TTA TGT GCA GAC AAC ATT GAA GGA 517 Ser Glu Gln Asp Arg Asn Cys Ser Leu Cys Ala Asp Asn Ile Glu Gly          95                 100                 105 AAG ACA TTT GTT TCA ACA GTA AAT TCT TTA GTT TTT CAA CAA ATA GAT 565 Lys Thr Phe Val Ser Thr Val Asn Ser Leu Val Phe Gln Gln Ile Asp     110                 115                 120 GCA AAC TGG AAC ATA CAG TGC TGG CTA AAA GGA GAC TTA AAA TTA TTC 613 Ala Asn Trp Asn Ile Gln Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe 125                 130                 135                 140 ATC TGT TAT GTG GAG TCA TTA TTT AAG AAT CTA TTC AGG AAT TAT AAC 661 Ile Cys Tyr Val Glu Ser Leu Phe Lys Asn Leu Phe Arg Asn Tyr Asn                 145                 150                 155 TAT AAG GTC CAT CTT TTA TAT GTT CTG CCT GAA GTG TTA GAA GAT TCA 709 Tyr Lys Val His Leu Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser             160                 165                 170 CCT CTG GTT CCC CAA AAA GGC AGT TTT CAG ATG GTT CAC TGC AAT TGC 757 Pro Leu Val Pro Gln Lys Gly Ser Phe Gln Met Val His Cys Asn Cys         175                 180                 185 AGT GTT CAT GAA TGT TGT GAA TGT CTT GTG CCT GTG CCA ACA GCC AAA 805 Ser Val His Glu Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys     190                 195                 200 CTC AAC GAC ACT CTC CTT ATG TGT TTG AAA ATC ACA TCT GGT GGA GTA 853 Leu Asn Asp Thr Leu Leu Met Cys Leu Lys Ile Thr Ser Gly Gly Val 205                 210                 215                 220 ATT TTC CAG TCA CCT CTA ATG TCA GTT CAG CCC ATA AAT ATG GTG AAG 901 Ile Phe Gln Ser Pro Leu Met Ser Val Gln Pro Ile Asn Met Val Lys                 225                 230                 235 CCT GAT CCA CCA TTA GGT TTG CAT ATG GAA ATC ACA GAT GAT GGT AAT 949 Pro Asp Pro Pro Leu Gly Leu His Met Glu Ile Thr Asp Asp Gly Asn             240                 245                 250 TTA AAG ATT TCT TGG TCC AGC CCA CCA TTG GTA CCA TTT CCA CTT CAA 997 Leu Lys Ile Ser Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gln         255                260                  265 TAT CAA GTG AAA TAT TCA GAG AAT TCT ACA ACA GTT ATC AGA GAA GCT 1045 Tyr Gln Val Lys Tyr Ser Glu Asn Ser Thr Thr Val Ile Arg Glu Ala     270                 275                 280 GAC AAG ATT GTC TCA GCT ACA TCC CTG CTA GTA GAC AGT ATA CTT CCT 1093 Asp Lys Ile Val Ser Ala Thr Ser Leu Leu Val Asp Ser Ile Leu Pro 285                 290                 295                 300 GGG TCT TCG TAT GAG GTT CAG GTG AGG GGC AAG AGA CTG GAT GGC CCA 1141 Gly Ser Ser Tyr Glu Val Gln Val Arg Gly Lys Arg Leu Asp Gly Pro                 305                 310                 315 GGA ATC TGG AGT GAC TGG AGT ACT CCT CGT GTC TTT ACC ACA CAA GAT 1189 Gly Ile Trp Ser Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gln Asp             320                 325                 330 GTC ATA TAC TTT CCA CCT AAA ATT CTG ACA AGT GTT GGG TCT AAT GTT 1237 Val Ile Tyr Phe Pro Pro Lys Ile Leu Thr Ser Val Gly Ser Asn Val         335                 340                 345 TCT TTT CAC TGC ATC TAT AAG AAG GAA AAC AAG ATT GTT CCC TCA AAA 1285 Ser Phe His Cys Ile Tyr Lys Lys Glu Asn Lys Ile Val Pro Ser Lys     350                 355                 360 GAG ATT GTT TGG TGG ATG AAT TTA GCT GAG AAA ATT CCT CAA AGC CAG 1333 Glu Ile Val Trp Trp Met Asn Leu Ala Glu Lys Ile Pro Gln Ser Gln 365                 370                 375                 380 TAT GAT GTT GTG AGT GAT CAT GTT AGC AAA GTT ACT TTT TTC AAT CTG 1381 Tyr Asp Val Val Ser Asp His Val Ser Lys Val Thr Phe Phe Asn Leu                 385                 390                 395 AAT GAA ACC AAA CCT CGA GGA AAG TTT ACC TAT GAT GCA GTG TAC TGC 1429 Asn Glu Thr Lys Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys             400                 405                 410 TGC AAT GAA CAT GAA TGC CAT CAT CGC TAT GCT GAA TTA TAT GTG ATT 1477 Cys Asn Glu His Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val Ile         415                420                 425 GAT GTC AAT ATC AAT ATC TCA TGT GAA ACT GAT GGG TAC TTA ACT AAA 1525 Asp Val Asn Ile Asn Ile Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys     430                 435                 440 ATG ACT TGC AGA TGG TCA ACC AGT ACA ATC CAG TCA CTT GCG GAA AGC 1573 Met Thr Cys Arg Trp Ser Thr Ser Thr Ile Gln Ser Leu Ala Glu Ser 445                 450                 455                 460 ACT TTG CAA TTG AGG TAT CAT AGG AGC AGC CTT TAC TGT TCT GAT ATT 1621 Thr Leu Gln Leu Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp Ile                 465                 470                 475 CCA TCT ATT CAT CCC ATA TCT GAG CCC AAA GAT TGC TAT TTG CAG AGT 1669 Pro Ser Ile His Pro Ile Ser Glu Pro Lys Asp Cys Tyr Leu Gln Ser             480                 485                 490 GAT GGT TTT TAT GAA TGC ATT TTC CAG CCA ATC TTC CTA TTA TCT GGC 1717 Asp Gly Phe Tyr Glu Cys Ile Phe Gln Pro Ile Phe Leu Leu Ser Gly         495                 500                 505 TAC ACA ATG TGG ATT AGG ATC AAT CAC TCT CTA GGT TCA CTT GAC CTC 1765 Tyr Thr Met Trp Ile Arg Ile Asn His Ser Leu Gly Ser Leu Asp Leu     510                 515                 520 CCA CCA ACA TGT GTC CTT CCT GAT TCT GTG GTG AAG CCA CTG TCI CCA 1813 Pro Pro Thr Cys Val Leu Pro Asp Ser Val Val Lys Pro Leu Ser Pro 525                 530                 535                 540 TCC AGT GTG AAA GCA GAA ATT ACT ATA AAC ATT GGA TTA TTG AAA ATA 1861 Ser Ser Val Lys Ala Glu Ile Thr Ile Asn Ile Gly Leu Leu Lys Ile                 545                 550                 555 TCT TGG GAA AAG CCA GTC TTT CCA GAG AAT AAC CTT CAA TTC CAG ATT 1909 Ser Trp Glu Lys Pro Val Phe Pro Glu Asn Ash Leu Gln Phe Gln Ile             560                 565                 570 CGC TAT GGT TTA AGT GGA AAA GAA GTA CAA TGG AAG ATG TAT GAG GTT 1957 Arg Tyr Gly Leu Ser Gly Lys Glu Val Gln Trp Lys Met Tyr Glu Val         575                  580                585 TAT GAT GCA AAA TCA AAA TCT GTC AGT CTC CCA GTT CCA GAC TTG TGT 2005 Tyr Asp Ala Lys Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys     590                 595                 600 GCA GTC TAT GCT GTT CAG GTG CGC TGT AAG AGG CTA GAT GGA CTG GGA 2053 Ala Val Tyr Ala Val Gln Val Arg Cys Lys Arg Leu Asp Gly Leu Gly 605                 610                 615                 620 TAT TGG AGT AAT TGG AGC AAT CCA GCC TAC ACA GTT GTC ATG GAT ATA 2101 Tyr Trp Ser Asn Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp Ile                 625                 630                 635 AAA GTT CCT ATG AGA GGA CCT GAA TTT TGG AGA ATA ATT AAT GGA GAT 2149 Lys Val Pro Met Arg Gly Pro Glu Phe Trp Arg Ile Ile Asn Gly Asp             640                 645                 650 ACT ATG AAA AAG GAG AAA AAT GTC ACT TTA CTT TGG AAG CCC CTG ATG 2197 Thr Met Lys Lys Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met         655                 660                 665 AAA AAT GAC TCA TTG TGC AGT GTT CAG AGA TAT GTG ATA AAC CAT CAT 2245 Lys Asn Asp Ser Leu Cys Ser Val Gln Arg Tyr Val Ile Asn His His     670                 675                 680 ACT TCC TGC AAT GGA ACA TGG TCA GAA GAT GTG GGA AAT CAC ACG AAA 2293 Thr Ser Cys Asn Gly Thr Trp Ser Glu Asp Val Gly Asn His Thr Lys 685                 690                 695                 700 TTC ACT TTC CTG TGG ACA GAG CAA GCA CAT ACT GTT ACG GTT CTG GCC 2341 Phe Thr Phe Leu Trp Thr Glu Gln Ala His Thr Val Thr Val Leu Ala                 705                 710                 715 ATC AAT TCA ATT GGT GCT TCT GTT GCA AAT TTT AAT TTA ACC TTT TCA 2389 Ile Asn Ser Ile Gly Ala Ser Val Ala Asn Phe Asn Leu Thr Phe Ser             720                 725                 730 TGG CCT ATG AGC AAA GTA AAT ATC GTG CAG TCA CTC AGT GCT TAT CCT 2437 Trp Pro Met Ser Lys Val Asn Ile Val Gln Ser Leu Ser Ala Tyr Pro         735                 740                 745 TTA AAC AGC AGT TGT GTG ATT GTT TCC TGG ATA CTA TCA CCC AGT GAT 2485 Leu Asn Ser Ser Cys Val Ile Val Ser Trp Ile Leu Ser Pro Ser Asp     750                 755                 760 TAC AAG CTA ATG TAT TTT ATT ATT GAG TGG AAA AAT CTT AAT GAA GAT 2533 Tyr Lys Leu Met Tyr Phe Ile Ile Glu Trp Lys Asn Leu Asn Glu Asp 765                 770                 775                 780 GGT GAA ATA AAA TGG CTT AGA ATC TCT TCA TCT GTT AAG AAG TAT TAT 2581 Gly Glu Ile Lys Trp Leu Arg Ile Ser Ser Ser Val Lys Lys Tyr Tyr                 785                 790                 795 ATC CAT GAT CAT TTT ATC CCC ATT GAG AAG TAC CAG TTC AGT CTT TAC 2629 Ile His Asp His Phe Ile Pro Ile Glu Lys Tyr Gln Phe Ser Leu Tyr             800                 805                 810 CCA ATA TTT ATG GAA GGA GTG GGA AAA CCA AAG ATA ATT AAT AGT TTC 2677 Pro Ile Phe Met Glu Gly Val Gly Lys Pro Lys Ile Ile Asn Ser Phe         815                 820                 825 ACT CAA GAT GAT ATT GAA AAA CAC CAG AGT GAT GCA GGT TTA TAT GTA 2725 Thr Gln Asp Asp Ile Glu Lys His Gln Ser Asp Ala Gly Leu Tyr Val     830                 835                 840 ATT GTG CCA GTA ATT ATT TCC TCT TCC ATC TTA TTG CTT GGA ACA TTA 2773 Ile Val Pro Val Ile Ile Ser Ser Ser Ile Leu Leu Leu Gly Thr Leu 845                 850                 855                 860 TTA ATA TCA CAC CAA AGA ATG AAA AAG CTA TTT TGG GAA GAT GTT CCG 2821 Leu Ile Ser His Gln Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro                 865                 870                 875 AAC CCC AAG AAT TGT TCC TGG GCA CAA GGA CTT AAT TTT CAG AAG CCA 2869 Asn Pro Lys Asn Cys Ser Trp Ala Gln Gly Leu Asn Phe Gln Lys Pro             880                 885                 890 GAA ACG TTT GAG CAT CTT TTT ATC AAG CAT ACA GCA TCA GTG ACA TGT 2917 Glu Thr Phe Glu His Leu Phe Ile Lys His Thr Ala Ser Val Thr Cys         895                 900                 905 GGT CCT CTT CTT TTG GAG CCT GAA ACA ATT TCA GAA GAT ATC AGT GTT 2965 Gly Pro Leu Leu Leu Glu Pro Glu Thr Ile Ser Glu Asp Ile Ser Val     910                 915                 920 GAT ACA TCA TGG AAA AAT AAA GAT GAG ATG ATG CCA ACA ACT GTG GTC 3013 Asp Thr Ser Trp Lys Asn Lys Asp Glu Met Met Pro Thr Thr Val Val 925                 930                 935                 940 TCT CTA CTT TCA ACA ACA GAT CTT GAA AAG GGT TCT GTT TGT ATT AGT 3061 Ser Leu Leu Ser Thr Thr Asp Leu Glu Lys Gly Ser Val Cys Ile Ser                 945                 950                 955 GAC CAG TTC AAC AGT GTT AAC TTC TCT GAG GCT GAG GGT ACT GAG GTA 3109 Asp Gln Phe Asn Ser Val Asn Phe Ser Glu Ala Glu Gly Thr Glu Val             960                 965                 970 ACC TAT GAG GAC GAA AGC CAG AGA CAA CCC TTT GTT AAA TAC GCC ACG 3157 Thr Tyr Glu Asp Glu Ser Gln Arg Gln Pro Phe Val Lys Tyr Ala Thr         975                 980                 985 CTG ATC AGC AAC TCT AAA CCA AGT GAA ACT GGT GAA GAA CAA GGG CTT 3205 Leu Ile Ser Asn Ser Lys Pro Ser Glu Thr Gly Glu Glu Gln Gly Leu     990                 995                1000 ATA AAT AGT TCA GTC ACC AAG TGC TTC TCT AGC AAA AAT TCT CCG TTG 3253 Ile Asn Ser Ser Val Thr Lys Cys Phe Ser Ser Lys Asn Ser Pro Leu 1005                1010                1015                1020 AAG GAT TCT TTC TCT AAT AGC TCA TGG GAG ATA GAG GCC CAG GCA TTT 3301 Lys Asp Ser Phe Ser Asn Ser Ser Trp Glu Ile Glu Ala Gln Ala Phe                 1025                1030                1035 TTT ATA TTA TCA GAT CAG CAT CCC AAC ATA ATT TCA CCA CAC CTC ACA 3349 Phe Ile Leu Ser Asp Gln His Pro Asn Ile Ile Ser Pro His Leu Thr             1040                1045                1050 TTC TCA GAA GGA TTG GAT GAA CTT TTG AAA TTG GAG GGA AAT TTC CCT 3397 Phe Ser Glu Gly Leu Asp Glu Leu Leu Lys Leu Glu Gly Asn Phe Pro         1055                1060                1065 GAA GAA AAT AAT GAT AAA AAG TCT ATC TAT TAT TTA GGG GTC ACC TCA 3445 Glu Glu Asn Asn Asp Lys Lys Ser Ile Tyr Tyr Leu Gly Val Thr Ser     1070                1075                1080 ATC AAA AAG AGA GAG AGT GGT GTG CTT TTG ACT GAC AAG TCA AGG GTA 3493 Ile Lys Lys Arg Glu Ser Gly Val Leu Leu Thr Asp Lys Ser Arg Val 1085                1090                1095                1100 TCG TGC CCA TTC CCA GCC CCC TGT TTA TTC AGG GAC ATC AGA GTT CTC 3541 Ser Cys Pro Phe Pro Ala Pro Cys Leu Phe Thr Asp Ile Arg Val Leu                 1105                1110                1115 CAG GAC AGT TGC TCA CAC TTT GTA GAA AAT AAT ATC AAC TTA GGA ACT 3589 Gln Asp Ser Cys Ser His Phe Val Glu Asn Asn Ile Asn Leu Gly Thr             1120                1125                1130 TCT AGT AAG AAG ACT TTT GCA TCT TAC ATG CCT CAA TTC CAA ACT TGT 3637 Ser Ser Lys Lys Thr Phe Ala Ser Tyr Met Pro Gln Phe Gln Thr Cys         1135                1140                1145 TCT ACT CAG ACT CAT AAG ATC ATG GAA AAC AAG ATG TGT GAC CTA ACT 3685 Ser Thr Gln Thr His Lys Ile Met Glu Asn Lys Met Cys Asp Leu Thr     1150                1155                1160 GTG TAATTTCACT GAAGAAACCT TCAGATTTGT GTTATAATGG GTAATATAAA 3738 Val 1165 GTGTAATAGA TTATAGTTGT GGGTGGGAGA GAGAAAAGAA ACCAGAGTCC AAATTTGAAA 3798 ATAATTGTTC CCAACTGAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 3858 AAAAAAAAAA AAA 3871 (2)序列4资料:

(ⅰ)序列特征:

    (A)长度:1165aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:序列4: Met Ile Cys Gln Lys Phe Cys Val Val Leu Leu His Trp Glu Phe Ile   1               5                  10                  15 Tyr Val Ile Thr Ala Phe Asn Leu Set Tyr Pro Ile Thr Pro Trp Arg              20                  25                  30 Phe Lys Leu Ser Cys Met Pro Pro Asn Ser Thr Tyr Asp Tyr Phe Leu          35                  40                  45 Leu Pro Ala Gly Leu Ser Lys Asn Thr Ser Asn Ser Asn Gly His Tyr      50                  55                  60 Glu Thr Ala Val Glu Pro Lys Phe Asn Ser Ser Gly Thr His Phe Ser  65                  70                  75                  80 Asn Leu Ser Lys Thr Thr Phe His Cys Cys Phe Arg Ser Glu Gln Asp                  85                   90                 95 Arg Asn Cys Ser Leu Cys Ala Asp Asn Ile Glu Gly Lys Thr Phe Val             100                 105                 110 Ser Thr Val Asn Ser Leu Val Phe Gln Gln Ile Asp Ala Asn Trp Asn         115                 120                 125 Ile Gln Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe Ile Cys Tyr Val     130                 135                 140 Glu Ser Leu Phe Lys Asn Leu Phe Arg Asn Tyr Asn Tyr Lys Val His 145                 150                 155                 160 Leu Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser Pro Leu Val Pro                 165                 170                 175 Gln Lys Gly Ser Phe Gln Met Val His Cys Asn Cys Ser Val His Glu             180                 185                 190 Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys Leu Asn Asp Thr         195                 200                 205 Leu Leu Met Cys Leu Lys Ile Thr Ser Gly Gly Val Ile Phe Gln Ser     210                 215                 220 Pro Leu Met Ser Val Gln Pro Ile Asn Met Val Lys Pro Asp Pro Pro 225                 230                 235                 240 Leu Gly Leu His Met Glu Ile Thr Asp Asp Gly Asn Leu Lys Ile Ser                 245                 250                 255 Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gln Tyr Gln Val Lys             260                 265                 270 Tyr Ser Glu Asn Ser Thr Thr Val Ile Arg Glu Ala Asp Lys Ile Val         275                 280                 285 Ser Ala Thr Ser Leu Leu Val Asp Ser Ile Leu Pro Gly Ser Ser Tyr     290                 295                 300 Glu Val Gln Val Arg Gly Lys Arg Leu Asp Gly Pro Gly Ile Trp Ser 305                 310                 315                 320 Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gln Asp Val Ile Tyr Phe                 325                 330                 335 Pro Pro Lys Ile Leu Thr Ser Val Gly Ser Asn Val Ser Phe His Cys             340                 345                 350 Ile Tyr Lys Lys Glu Asn Lys Ile Val Pro Ser Lys Glu Ile Val Trp         355                 360                 365 Trp Met Asn Leu Ala Glu Lys Ile Pro Gln Ser Gln Tyr Asp Val Val     370                 375                 380 Ser Asp His Val Ser Lys Val Thr Phe Phe Asn Leu Asn Glu Thr Lys 385                 390                 395                 400 Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu His                 405                 410                 415 Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val Ile Asp Val Asn Ile             420                 425                 430 Asn Ile Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg         435                 440                 445 Trp Ser Thr Ser Thr Ile Gln Ser Leu Ala Glu Ser Thr Leu Gln Leu     450                 455                 460 Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp Ile Pro Ser Ile His 465                 470                 475                 480 Pro Ile Ser Glu Pro Lys Asp Cys Tyr Leu Gln Ser Asp Gly Phe Tyr                 485                 490                 495 Glu Cys Ile Phe Gln Pro Ile Phe Leu Leu Ser Gly Tyr Thr Met Trp             500                 505                 510 Ile Arg Ile Asn His Ser Leu Gly Ser Leu Asp Leu Pro Pro Thr Cys         515                 520                 525 Val Leu Pro Asp Ser Val Val Lys Pro Leu Ser Pro Ser Ser Val Lys     530                 535                 540 Ala Glu Ile Thr Ile Asn Ile Gly Leu Leu Lys Ile Ser Trp Glu Lys 545                 550                 555                 560 Pro Val Phe Pro Glu Asn Asn Leu Gln Phe Gln Ile Arg Tyr Gly Leu                 565                 570                575 Ser Gly Lys Glu Val Gln Trp Lys Met Tyr Glu Val Tyr Asp Ala Lys             580                 585                 590 Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys Ala Val Tyr Ala         595                 600                 605 Val Gln Val Arg Cys Lys Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn     610                 615                 620 Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp Ile Lys Val Pro Met 625                 630                 635                 640 Arg Gly Pro Glu Phe Trp Arg Ile Ile Asn Gly Asp Thr Met Lys Lys                 645                 650                 655 Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met Lys Asn Asp Ser             660                 665                 670 Leu Cys Ser Val GIn Arg Tyr Val Ile Asn His His Thr Ser Cys Asn         675                 680                 685 Gly Thr Trp Ser Glu Asp Val Gly Asn His Thr Lys Phe Thr Phe Leu     690                 695                 700 Trp Thr Glu Gln Ala His Thr Val Thr Val Leu Ala Ile Asn Ser Ile 705                 710                 715                 720 Gly Ala Ser Val Ala Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser                 725                 730                 735 Lys Val Asn Ile Val Gln Ser Leu Ser Ala Tyr Pro Leu Asn Ser Ser             740                 745                 750 Cys Val Ile Val Ser Trp Ile Leu Ser Pro Ser Asp Tyr Lys Leu Met         755                  760                 765 Tyr Phe Ile Ile Glu Trp Lys Asn Leu Asn Glu Asp Gly Glu Ile Lye    770                  775                 780 Trp Leu Arg Ile Ser Ser Ser Val Lys Lys Tyr Tyr Ile His Asp His 785                790                  795                 800 Phe Ile Pro Ile Glu Lys Tyr Gln Phe Ser Leu Tyr Pro Ile Phe Met                 805                 810                     815 Glu Gly Val Gly Lys Pro Lys Ile Ile Asn Ser Phe Thr Gln Asp Asp             820                 825                  830 Ile Glu Lys His Gln Ser Asp Ala Gly Leu Tyr Val Ile Val Pro Val         835                 840                 845 Ile Ile Ser Ser Ser Ile Leu Leu Leu Gly Thr Leu Leu Ile Ser His     850                 855                 860 Gln Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro Asn Pro Lye Asn 865                 870                 875                 880 Cys Ser Trp Ala Gln Gly Leu Asn Phe Gln Lys Pro Glu Thr Phe Glu                 885                 890                 895 His Leu Phe Ile Lys His Thr Ala Ser Val Thr Cys Gly Pro Leu Leu             900                 905                 910 Leu Glu Pro Glu Thr Ile Ser Glu Asp Ile Ser Val Asp Thr Ser Trp         915                 920                 925 Lys Asn Lys Asp Glu Met Met Pro Thr Thr Val Val Ser Leu Leu Ser     930                 935                 940 Thr Thr Asp Leu Glu Lys Gly Ser Val Cys Ile Ser Asp Gln Phe Asn 945                 950                 955                 960 Ser Val Asn Phe Ser Glu Ala Glu Gly Thr Glu Val Thr Tyr Glu Asp                 965                 970                 975 Glu Ser Gln Arg Gln Pro Phe Val Lys Tyr Ala Thr Leu Ile Ser Asn             980                 985                 990 Ser Lys Pro Ser Glu Thr Gly Glu Glu Gln Gly Leu Ile Asn Ser Ser         995                1000                1005 Val Thr Lys Cys Phe Ser Ser Lys Asn Ser Pro Leu Lys Asp Ser Phe     1010                1015                1020 Ser Asn Ser Ser Trp Glu Ile Glu Ala Gln Ala Phe Phe Ile Leu Ser 1025                1030                1035                1040 Asp Gln His Pro Asn Ile Ile Ser Pro His Leu Thr Phe Ser Glu Gly                 1045                1050                1055 Leu Asp Glu Leu Leu Lys Leu Glu Gly Asn Phe Pro Glu Glu Asn Asn             1060                1065                1070 Asp Lys Lys Ser Ile Tyr Tyr Leu Gly Val Thr Ser Ile Lys Lys Arg         1075                1080                1065 Glu Ser Gly Val Leu Leu Thr Asp Lys Ser Arg Val Ser Cys Pro Phe     1090                1095                1100 Pro Ala Pro Cys Leu Phe Thr Asp Ile Arg Val Leu Gln Asp Ser Cys 1105                1110                1115                1120 Ser His Phe Val Glu Asn Asn Ile Asn Leu Gly Thr Ser Ser Lys Lys                 1125                1130                1135 Thr Phe Ala Ser Tyr Met Pro Gln Phe Gln Thr Cys Ser Thr Gln Thr             1140                1145                1150 His Lys Ile Met Glu Asn Lys Met Cys Asp Leu Thr Val         1155                1160                1165 (2)序列5资料:

(ⅰ)序列特征:

    (A)长度:488aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:序列5: Tyr Ile Ser pro Glu Ser Pro Val Val Gln Leu His Ser Asn Phe Thr 1               5                   10                  15 Ala Val Cys Val Leu Lys Glu Lys Cys Met Asp Tyr Phe His Val Asn             20                  25                  30 Ala Asn Tyr Ile Val Trp Lys Thr Asn His Phe Thr Ile Pro Lys Glu         35                  40                  45 Gln Tyr Thr Ile Ile Asn Arg Thr Ala Ser Ser Val Thr Phe Thr Asp     50                  55                  60 Ile Ala Ser Leu Asn Ile Gln Leu Thr Cys Asn Ile Leu Thr Phe Gly 65                  70                  75                  80 Gln Leu Glu Gln Asn Val Tyr Gly Ile Thr Ile Ile Ser Gly Leu Pro                 85                  90                  95 Pro Glu Lys Pro Lys Asn Leu Ser Cys Ile Val Asn Glu Gly Lys Lys             100                 105                 110 Met Arg Cys Glu Trp Asp Gly Gly Arg Glu Thr His Leu Glu Thr Asn         115                 120                 125 Phe Thr Leu Lys Ser Glu Trp Ala Thr His Lys Phe Ala Asp Cys Lys     130                 135                 140 Ala Lys Arg Asp Thr Pro Thr Ser Cys Thr Val Asp Tyr Ser Thr Val 145                 150                 155                 160 Tyr Phe Val Asn Ile Glu Val Trp Val Glu Ala Glu Asn Ala Leu Gly                 165                 170                 175 Lys Val Thr Ser Asp His Ile Asn Phe Asp Pro Val Tyr Lys Val Lys             180                 185                 190 Pro Asn Pro Pro His Asn Leu Ser Val Ile Asn Ser Glu Glu Leu Ser         195                 200                 205 Ser Ile Leu Lys Leu Thr Trp Thr Asn Pro Ser Ile Lys Ser Val Ile     210                 215                 220 Ile Leu Lys Tyr Asn Ile Gln Tyr Arg Thr Lys Asp Ala Ser Thr Trp 225                 230                 235                 240 Ser Gln Ile Pro Pro Glu Asp Thr Ala Ser Thr Arg Ser Ser Phe Thr                 245                 250                 255 Val Gln Asp Leu Lys Pro Phe Thr Glu Tyr Val Phe Arg Ile Arg Cys             260                 265                 270 Met Lys Glu Asp Gly Lys Gly Tyr Trp Ser Asp Trp Ser Glu Glu Ala         275                 280                 285 Ser Gly Ile Thr Tyr Glu Asp Arg Pro Ser Lys Ala Pro Ser Phe Trp     290                 295                 300 Tyr Lys Ile Asp Pro Ser His Thr Gln Gly Tyr Arg Thr Val Gln Leu 305                 310                 315                 320 Val Trp Lys Thr Leu Pro Pro Phe Glu Ala Asn Gly Lys Ile Leu Asp                 325                 330                 335 Tyr Glu Val Thr Leu Thr Arg Trp Lys Ser His Leu Gln Asn Tyr Thr             340                 345                 350 Val Asn Ala Thr Lys Leu Thr Val Asn Leu Thr Asn Asp Arg Tyr Leu         355                 360                 365 Ala Thr Leu Thr Val Arg Asn Leu Val Gly Lys Ser Asp Ala Ala Val     370                 375                 380 Leu Thr Ile Pro Ala Cys Asp Phe Gln Ala Thr His Pro Val Met Asp 385                 390                 395                 400 Leu Lys Ala Phe Pro Lys Asp Asn Met Leu Trp Val Glu Trp Thr Thr                 405                 410                 415 Pro Arg Glu Ser Val Lys Lys Tyr Ile Leu Glu Trp Cys Val Leu Ser             420                 425                 430 Asp Lys Ala Pro Cys Ile Thr Asp Trp Gln Gln Glu Asp Gly Thr Val         435                 440                 445 His Arg Thr Tyr Leu Arg Gly Asn Leu Ala Glu Ser Lys Cys Tyr Leu     450                 455                 460 Ile Thr Val Thr Pro Val Tyr Ala Asp Gly Pro Gly Ser Pro Glu Ser 465                 470                 475                 480 Ile Lys Ala Tyr Leu Lys Gln Ala                 485 (2)序列6资料:

(ⅰ)序列特征:

    (A)长度:5aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:肽

(ⅹⅰ)序列描述:序列6:

Trp Ser Xaa Trp Ser

1               5 (2)序列7资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列7:

CATCTTACTT CAGAGAA

17 (2)序列8资料:

(ⅰ)序列特征:

    (A)长度:23bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列8:

CATCTTACTT CAGAGAAGTA CAC

23 (2)序列9资料:

(ⅰ)序列特征:

    (A)长度:29bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列9:

CATCTTACTT CAGAGAAGTA CACCCATAA

29 (2)序列10资料:

(ⅰ)序列特征:

    (A)长度:35bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列10:

CATCTTACTT CAGAGAAGTA CACCCATAAT CCTCT

35 (2)序列11资料:

(ⅰ)序列特征:

    (A)长度:35bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列11:

AATCATCTTA CTTCAGAGAA GTACACCCAT AATCC

35 (2)序列12资料:

(ⅰ)序列特征:

    (A)长度:29bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列12:

CTTACTTCAG AGAAGTACAC CCATAATCC

29 (2)序列13资料:

(ⅰ)序列特征:

    (A)长度:23bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列13:

TCAGAGAAGT ACACCCATAA TCC

23 (2)序列14资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列14:

AAGTACACCC ATAATCC

17 (2)序列15资料:

(ⅰ)序列特征:

    (A)长度:56bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列15:

ACAGAAUUUU UGACAAAUCA AAGCAGANNN NUCUGAGNAG UCCUUACUUC AGAGAA

56 (2)序列16资料:

(ⅰ)序列特征:

    (A)长度:57bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列16:

GGCCCGGGCA GCCUGCCCAA AGCCGGNNNN CCGGAGNAGU CGCCAGACCG GCUCGUG

57 (2)序列17资料:

(ⅰ)序列特征:

    (A)长度:56bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列17:

UGGCAUGCAA GACAAAGCAG GNNNNCCUGA GNAGUCCUUA AAUCUCCAAG GAGUAA

56 (2)序列18资料:

(ⅰ)序列特征:

    (A)长度:50bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列18:

UAUAUGACAA AGCUGUNNNN ACAGAGNAGU CCUUGUGUGG UAAAGACACG

50 (2)序列19资料:

(ⅰ)序列特征:

    (A)长度:61bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列19:

AGCACCAAUU GAAUUGAUGG CCAAAGCGGG NNNNCCCGAG NAGUCAACCG UAACAGUAUG

60

U

61 (2)序列20资料:

(ⅰ)序列特征:

    (A)长度:69bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列20:

UGAAAUUGUU UCAGGCUCCA AAGCCGGNNN NCCGGAGNAG UCAAGAAGAG GACCACAUGU

60

CACUGAUGC

69 (2)序列21资料:

(ⅰ)序列特征:

    (A)长度:61bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列21:

GGUUUCUUCA GUGAAAUUAC ACAAAGCAGC NNNNGCUGAG NAGUCAGUUA GGUCACACAU

60

C

61 (2)序列22资料:

(ⅰ)序列特征:

    (A)长度:53bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:不详

(ⅱ)分子类型:RNA

(ⅹⅰ)序列描述:序列22:

ACCCAUUAUA ACACAAAGCU GANNNNUCAG AGNAGUCAUC UGAAGGUUUC UUC

53 (2)序列23资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列23:

GCTGCACTTA ACCTGGC

17 (2)序列24资料:

(ⅰ)序列特征:

    (A)长度:16bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列24:

GGATAACTCA GGAACG

16 (2)序列25资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列25:

CACTATTTGC CCTTCAG

17 (2)序列26资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列26:

GCCTGAGATA GGGGTGC

17 (2)序列27资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列27:

CACTATTTGC CCTTCAG

17 (2)序列28资料:

(ⅰ)序列特征:

    (A)长度:17bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列28:

GCCTGAGATA GGGGTGC

17 (2)序列29资料:

(ⅰ)序列特征:

    (A)长度:8aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:肽

(ⅹⅰ)序列描述:序列29:

Pro Asn Pro Lys Asn Cys Ser Trp

1               5 (2)序列30资料:

(ⅰ)序列特征:

    (A)长度:24bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列30:

CCAAACCCCA AGAATTGTTC CTGG

24 (2)序列31资料:

(ⅰ)序列特征:

    (A)长度:9aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:肽

(ⅹⅰ)序列描述:序列31:

Lys Ile Met Glu Asn Lys Met Cys Asp

1               5 (2)序列32资料:

(ⅰ)序列特征:

    (A)长度:26bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列32:

TCRCACATYT TRTTNCCCAT TATCTT

26 (2)序列33资料:

(ⅰ)序列特征:

    (A)长度:8aa

    (B)类型:氨基酸

    (D)拓朴结构:不详

(ⅱ)分子类型:肽

(ⅹⅰ)序列描述:序列33:

Ala Gln Gly Leu Asn Phe Gln Lys

1               5 (2)序列34资料:

(ⅰ)序列特征:

    (A)长度:24bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列34:

GCACAAGGAC TGAATTTCCA AAAG

24 (2)序列35资料:

(ⅰ)序列特征:

    (A)长度:20bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列35:

CTGCCTGAAG TGTTAGAAGA

20 (2)序列36资料:

(ⅰ)序列特征:

    (A)长度:21bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列36:

GCTGAACTGA CATTAGAGGT G

21 (2)序列37资料:

(ⅰ)序列特征:

    (A)长度:25bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列37:

ACCTATGAGG ACGAAAGCCA GAGAC

25 (2)序列38资料:

(ⅰ)序列特征:

    (A)长度:24bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列38:

TGTGAGCAAC TGTCCTCGAG AACT

24 (2)序列39资料:

(ⅰ)序列特征:

    (A)长度:42bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列39:

GTCACGATGT CGACGTGTAC TTCTCTGAAG TAAGATGATT TG

42 (2)序列40资料:

(ⅰ)序列特征:

    (A)长度:53bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列40:

GTCAGGTCAG AAAAGCTTAT CACTCTGTGT TTTTCAATAT CATCTTGAGT GAA

53 (2)序列41资料:

(ⅰ)序列特征:

    (A)长度:21bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列41:

AAGCTTTTCT GACCTGACNN N

21 (2)序列42资料:

(ⅰ)序列特征:

    (A)长度:3854bp

    (B)类型:核酸

    (C)链型:双

    (D)拓朴结构:不详

(ⅱ)分子类型:cDNA

(ⅸ)特征:

    (A)名称/关键词:CDS

    (B)位置:61..3546 (ⅹⅰ)序列描述:序列42: GTCGACCCAC GCGTCCGGAG GAATCGTTCT GCAAATCCAG GTGTACACCT CTGAAGAAAG 60 ATG ATG TGT CAG AAA TTC TAT GTG GTT TTG TTA CAC TGG GAA TTT CTT 108 Met Met Cys Gln Lys Phe Tyr Val Val Leu Leu His Trp Glu Phe Leu   1               5                  10                  15 TAT GTG ATA GCT GCA CTT AAC CTG GCA TAT CCA ATC TCT CCC TGG AAA 156 Tyr Val Ile Ala Ala Leu Asn Leu Ala Tyr Pro Ile Ser Pro Trp Lys              20                  25                  30 TTT AAG TTG TTT TGT GGA CCA CCG AAC ACA ACC GAT GAC TCC TTT CTC 204 Phe Lys Leu Phe Cys Gly Pro Pro Asn Thr Thr Asp Asp Ser Phe Leu          35                  40                  45 TCA CCT GCT GGA GCC CCA AAC AAT GCC TCG GCT TTG AAG GGG GCT TCT 252 Ser Pro Ala Gly Ala Pro Asn Asn Ala Ser Ala Leu Lys Gly Ala Ser      50                  55                  60 GAA GCA ATT GTT GAA GCT AAA TTT AAT TCA AGT GGT ATC TAC GTT CCT 300 Glu Ala Ile Val Glu Ala Lys Phe Asn Ser Ser Gly Ile Tyr Val Pro  65                  70                  75                  80 GAG TTA TCC AAA ACA GTC TTC CAC TGT TGC TTT GGG AAT GAG CAA GGT 348 Glu Leu Ser Lys Thr Val Phe His Cys Cys Phe Gly Asn Glu Gln Gly                  85                  90              95 CAA AAC TGC TCT GCA CTC ACA GAC AAC ACT GAA GGG AAG ACA CTG GCT 396 Gln Asn Cys Ser Ala Leu Thr Asp Asn Thr Glu Gly Lys Thr Leu Ala             100                 105                 110 TCA GTA GTG AAG GCT TCA GTT TTT CGC CAG CTA GGT GTA AAC TGG GAC 444 Ser Val Val Lys Ala Ser Val Phe Arg Gln Leu Gly Val Asn Trp Asp         115                 120                 125 ATA GAG TGC TGG ATG AAA GGG GAC TTG ACA TTA TTC ATC TGT CAT ATG 492 Ile Glu Cys Trp Met Lys Gly Asp Leu Thr Leu Phe Ile Cys His Met     130                 135                 140 GAG CCA TTA CCT AAG AAC CCC TTC AAG AAT TAT GAC TCT AAG GTC CAT 540 Glu Pro Leu Pro Lys Asn Pro Phe Lys Asn Tyr Asp Ser Lys Val His 145                 150                 155                 160 CTT TTA TAT GAT CTG CCT GAA GTC ATA GAT GAT TCG CCT CTG CCC CCA 588 Leu Leu Tyr Asp Leu Pro Glu Val Ile Asp Asp Ser Pro Leu Pro Pro                 165                 170                 175 CTG AAA GAC AGC TTT CAG ACT GTC CAA TGC AAC TGC AGT CTT CGG GGA 636 Leu Lys Asp Ser Phe Gln Thr Val Gln Cys Asn Cys Ser Leu Arg Gly             180                 185                 190 TGT GAA TGT CAT GTG CCG GTA CCC AGA GCC AAA CTC AAC TAC GCT CTT 684 Cys Glu Cys His Val Pro Val Pro Arg Ala Lys Leu Asn Tyr Ala Leu         195                 200                 205 CTG ATG TAT TTG GAA ATC ACA TCT GCC GGT GTG AGT TTT CAG TCA CCT 732 Leu Met Tyr Leu Glu Ile Thr Ser Ala Gly Val Ser Phe Gln Ser Pro     210                 215                 220 CTG ATG TCA CTG CAG CCC ATG CTT GTT GTG AAA CCC GAT CCA CCC TTA 780 Leu Met Ser Leu Gln Pro Met Leu Val Val Lys Pro Asp Pro Pro Leu 225                 230                 235                 240 GGT TTG CAT ATG GAA GTC ACA GAT GAT GGT AAT TTA AAG ATT TCT TGG 828 Gly Leu His Met Glu Val Thr Asp Asp Gly Asn Leu Lys Ile Ser Trp                 245                 250                 255 GAC AGC CAA ACA ATG GCA CCA TTT CCG CTT CAA TAT CAG GTG AAA TAT 876 Asp Ser Gln Thr Met Ala Pro Phe Pro Leu Gln Tyr Gln Val Lys Tyr             260                 265                 270 TTA GAG AAT TCT ACA ATT GTA AGA GAG GCT GCT GAA ATT GTC TCA GCT 924 Leu Glu Asn Ser Thr Ile Val Arg Glu Ala Ala Glu Ile Val Ser Ala         275                 280                 285 ACA TCT CTG CTG GTA GAC AGT GTG CTT CCT GGA TCT TCA TAT GAG GTC 972 Thr Ser Leu Leu Val Asp Ser Val Leu Pro Gly Ser Ser Tyr Glu Val     290                 295                 300 CAG GTG AGG AGC AAG AGA CTG GAT GGT TCA GGA GTC TGG AGT GAC TGG 1020 Gln Val Arg Ser Lys Arg Leu Asp Gly Ser Gly Val Trp Ser Asp Trp 305                 310                 315                 320 AGT TCA CCT CAA GTC TTT ACC ACA CAA GAT GTT GTG TAT TTT CCA CCC 1068 Ser Ser Pro Gln Val Phe Thr Thr Gln Asp Val Val Tyr Phe Pro Pro                 325                 330                 335 AAA ATT CTG ACT AGT GTT GGA TCG AAT GCT TCT TTT CAT TGC ATC TAC 1116 Lys Ile Leu Thr Ser Val Gly Ser Asn Ala Ser Phe His Cys Ile Tyr            340                 345                 350 AAA AAC GAA AAC CAG ATT ATC TCC TCA AAA CAG ATA GTT TGG TGG AGG 1164 Lys Asn Glu Asn Gln Ile Ile Ser Ser Lys Gln Ile Val Trp Trp Arg        355                 360                 365 AAT CTA GCT GAG AAA ATC CCT GAG ATA CAG TAC AGC ATT GTG AGT GAC 1212 Asn Leu Ala Glu Lys Ile Pro Glu Ile Gln Tyr Ser Ile Val Ser Asp     370                 375                 380 CGA GTT AGC AAA GTT ACC TTC TCC AAC CTG AAA GCC ACC AGA CCT CGA 1260 Arg Val Ser Lys Val Thr Phe Ser Asn Leu Lys Ala Thr Arg Pro Arg 385                 390                 395                 400 GGG AAG TTT ACC TAT GAC GCA GTG TAC TGC TGC AAT GAG CAG GCG TGC 1308 Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu Gln Ala Cys 10              405                 410                 415 CAT CAC CGC TAT GCT GAA TTA TAC GTG ATC GAT GTC AAT ATC AAT ATA 1356 His His Arg Tyr Ala Glu Leu Tyr Val Ile Asp Val Asn Ile Asn Ile             420                 425                 430 TCA TGT GAA ACT GAC GGG TAC TTA ACT AAA ATG ACT TGC AGA TGG TCA 1404 Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg Trp Ser         435                 440                 445 CCC AGC ACA ATC CAA TCA CTA GTG GGA AGC ACT GTG CAG CTG AGG TAT 1452 Pro Ser Thr Ile Gln Ser Leu Val Gly Ser Thr Val Gln Leu Arg Tyr     450                 455                 460 CAC AGG CGC AGC CTG TAT TGT CCT GAT AGT CCA TCT ATT CAT CCT ACG 1500 His Arg Arg Ser Leu Tyr Cys Pro Asp Ser Pro Ser Ile His Pro Thr 465                 470                 475                 480 TCT GAG CCC AAA AAC TGC GTC TTA CAG AGA GAC GGC TTT TAT GAA TGT 1548 Ser Glu Pro Lys Asn Cys Val Leu Gln Arg Asp Gly Phe Tyr Glu Cys                 485                 490                 495 GTT TTC CAG CCA ATC TTT CTA TTA TCT GGC TAT ACA ATG TGG ATC AGG 1596 Val Phe Gln Pro Ile Phe Leu Leu Ser Gly Tyr Thr Met Trp Ile Arg             500                 505                 510 ATC AAC CAT TCT TTA GGT TCA CTT GAC TCG CCA CCA ACG TGT GTC CTT 1644 Ile Asn His Ser Leu Gly Ser Leu Asp Ser Pro Pro Thr Cys Val Leu         515                 520                 525 CCT GAC TCC GTA GTA AAA CCA CTA CCT CCA TCT AAC GTA AAA GCA GAG 1692 Pro Asp Ser Val Val Lys Pro Leu Pro Pro Ser Asn Val Lys Ala Glu     530                 535                 540 ATT ACT GTA AAC ACT GGA TTA TTG AAA GTA TCT TGG GAA AAG CCA GTC 1740 Ile Thr Val Asn Thr Gly Leu Leu Lys Val Ser Trp Glu Lys Pro Val 545                 550                 555                 560 TTT CCG GAG AAT AAC CTT CAA TTC CAG ATT CGA TAT GGC TTA AGT GGA 1788 Phe Pro Glu Asn Asn Leu Gln Phe Gln Ile Arg Tyr Gly Leu Ser Gly                 565                 570                 575 AAA GAA ATA CAA TGG AAG ACA CAT GAG GTA TTC GAT GCA AAG TCA AAG 1836 Lys Glu Ile Gln Trp Lys Thr His Glu Val Phe Asp Ala Lys Ser Lys             580                 585                 590 TCT GCC AGC CTG CTG GTG TCA GAC CTC TGT GCA GTC TAT GTG GTC CAG 1884 Ser Ala Ser Leu Leu Val Ser Asp Leu Cys Ala Val Tyr Val Val Gln         595                 600                 605 GTT CGC TGC CGG CGG TTG GAT GGA CTA GGA TAT TGG AGT AAT TGG AGC 1932 Val Arg Cys Arg Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn Trp Ser     610                 615                 620 AGT CCA GCC TAT ACG CTT GTC ATG GAT GTA AAA GTT CCT ATG AGA GGG 1980 Ser Pro Ala Tyr Thr Leu Val Met Asp Val Lys Val Pro Met Arg Gly 625                 630                 635                 640 CCT GAA TTT TGG AGA AAA ATG GAT GGG GAC GTT ACT AAA AAG GAG AGA 2028 Pro Glu Phe Trp Arg Lys Met Asp Gly Asp Val Thr Lys Lys Glu Arg                 645                 650                 655 AAT GTC ACC TTG CTT TGG AAG CCC CTG ACG AAA AAT GAC TCA CTG TGT 2076 Asn Val Thr Leu Leu Trp Lys Pro Leu Thr Lys Asn Asp Ser Leu Cys             660                 665                 670 AGT GTG AGG AGG TAC GTT GTG AAG CAT CGT ACT GCC CAC AAT GGG ACG 2124 Ser Val Arg Arg Tyr Val Val Lys His Arg Thr Ala His Asn Gly Thr         675                 680                 685 TGG TCA GAA GAT GTG GGA AAT CGG ACC AAT CTC ACT TTC CTG TGG ACA 2172 Trp Ser Glu Asp Val Gly Asn Arg Thr Asn Leu Thr Phe Leu Trp Thr     690                 695                 700 GAA CCA GCG CAC ACT GTT ACA GTT CTG GCT GTC AAT TCC CTC GGC GCT 2220 Glu Pro Ala His Thr Val Thr Val Leu Ala Val Asn Ser Leu Gly Ala 705                 710                 715                 720 TCC CTT GTG AAT TTT AAC CTT ACC TTC TCA TGG CCC ATG AGT AAA GTG 2268 Ser Leu Val Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser Lys Val                 725                 730                 735 AGT GCT GTG GAG TCA CTC AGT GCT TAT CCC CTG AGC AGC AGC TGT GTC 2316 Ser Ala Val Glu Ser Leu Ser Ala Tyr Pro Leu Ser Ser Ser Cys Val             740                 745                 750 ATC CTT TCC TGG ACA CTG TCA CCT GAT GAT TAT AGT CTG TTA TAT CTG 2364 Ile Leu Ser Trp Thr Leu Ser Pro Asp Asp Tyr Ser Leu Leu Tyr Leu         755                 760                 765 GTT ATT GAA TGG AAG ATC CTT AAT GAA GAT GAT GGA ATG AAG TGG CTT 2412 Val Ile Glu Trp Lys Ile Leu Asn Glu Asp Asp Gly Met Lys Trp Leu     770                 775                 780 AGA ATT CCC TCG AAT GTT AAA AAG TTT TAT ATC CAC GAT AAT TTT ATT 2460 Arg Ile Pro Ser Asn Val Lys Lys Phe Tyr Ile His Asp Asn Phe Ile 785                 790                 795                 800 CCC ATC GAG AAA TAT CAG TTT AGT CTT TAC CCA GTA TTT ATG GAA GGA 2508 Pro Ile Glu Lys Tyr Gln Phe Ser Leu Tyr Pro Val Phe Met Glu Gly                 805                 810                 815 GTT GGA AAA CCA AAG ATA ATT AAT GGT TTC ACC AAA GAT GCT ATC GAC 2556 Val Gly Lys Pro Lys Ile Ile Asn Gly Phe Thr Lys Asp Ala Ile Asp             820                 825                 830 AAG CAG CAG AAT GAC GCA GGG CTG TAT GTC ATT GTA CCC ATA ATT ATT 2604 Lys Gln Gln Asn Asp Ala Gly Leu Tyr Val Ile Val Pro Ile Ile Ile         835                 840                 845 TCC TCT TGT GTC CTA CTG CTC GGA ACA CTG TTA ATT TCA CAC CAG AGA 2652 Ser Ser Cys Val Leu Leu Leu Gly Thr Leu Leu Ile Ser His Gln Arg     850                 855                 860 ATG AAA AAG TTG TTT TGG GAC GAT GTT CCA AAC CCC AAG AAT TGT TCC 2700 Met Lys Lys Leu Phe Trp Asp Asp Val Pro Asn Pro Lys Asn Cys Ser 865                 870                 875                 880 TGG GCA CAA GGA CTG AAT TTC CAA AAG CCT GAA ACA TTT GAG CAT CTT 2748 Trp Ala Gln Gly Leu Asn Phe Gln Lys Pro Glu Thr Phe Glu His Leu                 885                 890                 895 TTT ACC AAG CAT GCA GAA TCA GTG ATA TTT GGT CCT CTT CTT CTG GAG 2796 Phe Thr Lys His Ala Glu Ser Val Ile Phe Gly Pro Leu Leu Leu Glu             900                 905                 910 CCT GAA CCC ATT TCA GAA GAA ATC AGT GTC GAT ACA GCT TGG AAA AAT 2844 Pro Glu Pro Ile Ser Glu Glu Ile Ser Val Asp Thr Ala Trp Lys Ash         915                 920                 925 AAA GAT GAG ATG GTC CCA GCA GCT ATG GTC TCC CTT CTT TTG ACC ACA 2892 Lys Asp Glu Met Val Pro Ala Ala Met Val Ser Leu Leu Leu Thr Thr     930                 935                 940 CCA GAC CCT GAA AGC AGT TCT ATT TGT ATT AGT GAC CAG TGT AAC AGT 2940 Pro Asp Pro Glu Ser Ser Ser Ile Cys Ile Ser Asp Gln Cys Asn Ser 945                 950                 955                 960 GCT AAC TTC TCT GGG TCT CAG AGC ACC CAG GTA ACC TGT GAG GAT GAG 2988 Ala Asn Phe Ser Gly Ser Gln Ser Thr Gln Val Thr Cys Glu Asp Glu                 965                 970                 975 TGT CAG AGA CAA CCC TCA GTT AAA TAT GCA ACT CTG GTC AGC AAC GAT 3036 Cys Gln Arg Gly Pro Ser Val Lys Tyr Ala Thr Leu Val Ser Asn Asp             980                 985                 990 AAA CTA GTG GAA ACT GAT GAA GAG CAA GGG TTT ATC CAT AGT CCT GTC 3084 Lys Leu Val Glu Thr Asp Glu Glu Gln Gly Phe Ile His Ser Pro Val         995                 1000                1005 AGC AAC TGC ATC TCC AGT AAT CAT TCC CCA CTG AGG CAG TCT TTC TCT 3132 Ser Asn Cys Ile Ser Ser Asn His Ser Pro Leu Arg Gln Ser Phe Ser     1010                1015                1020 AGC AGC TCC TGG GAG ACA GAG GCC CAG ACA TTT TTC CTT TTA TCA GAC 3180 Ser Ser Ser Trp Glu Thr Glu Ala Gln Thr Phe Phe Leu Leu Ser Asp 1025                1030                1035                1040 CAG CAA CCC ACC ATG ATT TCA CCA CAA CTT TCA TTC TCG GGG TTG GAT 3228 Gln Gln Pro Thr Met Ile Ser Pro Gln Leu Ser Phe Ser Gly Leu Asp                 1045                1050                1055 GAG CTT TTG GAA CTG GAG GGA AGT TTT CCT GAA GAA AAT CAC AGG GAG 3276 Glu Leu Leu Glu Leu Glq Gly Ser Phe Pro Glu Glu Asn His Arg Glu             1060                1065                1070 AAG TCT GTC TGT TAT CTA GGA GTC ACC TCC GTC AAC AGA AGA GAG AGT 3324 Lys Ser Val Cys Tyr Leu Glu Val Thr Ser Val Asn Arg Arg Glu Ser         1075                1080                1085 GGT GTG CTT TTG ACT GGT GAG GCA GGA ATC CTG TGC ACA TTC CCA GCC 3372 Gly Val Seu Leu Thr Gly Glu Ala Gly Ile Leu Cys Thr Phe Pro Ala     1090                1095                1100 CAG TGT CTG TTC ACT GAC ATC AGG ATC CTC CAG GAG AGA TGC TCA CAC 3420 Gln Cys Leu Phe Set Asp Ile Arg Ile Leu Gln Glu Arg Cys Ser His 1105                1110                1115                1120 TTT GTA GAA AAT AAT TTG AGT TTA GGG ACC TCT GGT GAG AAC TTT GTA 3468 Phe Val Glu Asn Asn Leu Ser Leu Gly Thr Ser Gly Glu Asn Phe Val                 1125                1130                1135 CCT TAC ATG CCC CAA TTT CAA ACC TGT TCC ACG CAC AGT CAC AAG ATA 3516 Pro Tyr Met Pro Gln Phe Gln Thr Cys Ser Thr His Ser His Lys Ile             1140                1145                1150 ATG GAG AAT AAG ATG TGT GAC TTA ACT GTG 3546 Met Glu Asn Lys Met Cys Asp Leu Thr Val         1155                1160 TAATCTCATC CAAGAAGCCT CAAGGTTCCA TTCCAGTAGA GCCTGTCATG TATAATGTGT 3606 TCTTTTATTG TTGTGGATGT GGGAGACAAG TGTCAGAATC TAGTGTGAAA ATGATTGTTT 3666

CCAAACTAAG  TGTGTCTATT  TTCTCTCAGT  AATACANATG  AAACATATGA  GGAAGCCCTC

3726

ATTAATCTAC  TAATGTAGAT  GGACTCTTAC  TGAATATATT  CCCAAGATAC  TTGGGGAAGT

3786

CTCCCTAATT  CTAGCTAAAA  GAANTAGAAC  TACTAAACAC  TGAATCTGGA  AAAAAAAAAA

3846

AAAAAAAG

3854 (2)序列43资料:

(ⅰ)序列特征:

        (A)长度:1162aa

        (B)类型:氨基酸

        (D)拓朴结构:不详

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:序列43:

Met Met Cys Gln Lys Phe Tyr Val Val Leu Leu His Trp Glu Phe Leu

 1               5                   10                 15

Tyr Val Ile Ala Ala Leu Asn Leu Ala Tyr Pro Ile Ser Pro Trp Lys

             20                  25                  30

Phe Lys Leu Phe Cys Gly Pro Pro Asn Thr Thr Asp Asp Ser Phe Leu

         35                  40                  45

Ser Pro Ala Gly Ala Pro Asn Asn Ala Ser Ala Leu Lys Gly Ala Ser

     50                  55                   60

Glu Ala Ile Val Glu Ala Lys Phe Asn Ser Ser Gly Ile Tyr Val Pro

 65                  70                  75                  80

Glu Leu Ser Lys Thr Val Phe His Cys Cys Phe Gly Asn Glu Gln Gly

                 85                  90                 95 Gln Asn Cys Ser Ala Leu Thr Asp Asn Thr Glu Gly Lys Thr Leu Ala            100                  105                 110 Ser Val Val Lys Ala Ser Val Phe Arg Gln Leu Gly Val Asn Trp Asp         115                 120                 125 Ile Glu Cys Trp Met Lys Gly Asp Leu Thr Leu Phe Ile Cys His Met     130                 135                 140 Glu Pro Leu Pro Lys Asn Pro Phe Lys Asn Tyr Asp Ser Lys Val His 145                 150                 155                 160 Leu Leu Tyr Asp Leu Pro Glu Val Ile Asp Asp Ser Pro Leu Pro Pro                 165                170                  175 Leu Lys Asp Ser Phe Gln Thr Val Gln Cys Asn Cys Ser Leu Arg Gly             180                 185                 190 Cys Glu Cys His Val Pro Val Pro Arg Ala Lys Leu Asn Tyr Ala Leu         195                 200                 205 Leu Met Tyr Leu Glu Ile Thr Ser Ala Gly Val Ser Phe Gln Ser Pro     210                 215                 220 Leu Met Ser Leu Gln Pro Met Leu Val Val Lys Pro Asp Pro Pro Leu 225                 230                 235                 240 Gly Leu His Met Glu Val Thr Asp Asp Gly Asn Leu Lys Ile Ser Trp                 245                 250                 255 Asp Ser Gln Thr Met Ala Pro Phe Pro Leu Gln Tyr Gln Val Lys Tyr             260                 265                 270 Leu Glu Asn Ser Thr Ile Val Arg Glu Ala Ala Glu Ile Val Ser Ala         275                 280                 285 Thr Ser Leu Leu Val Asp Ser Val Leu Pro Gly Ser Ser Tyr Glu Val     290                 295                 300 Gln Val Arg Ser Lys Arg Leu Asp Gly Ser Gly Val Trp Ser Asp Trp 305                 310                 315                 320 Ser Ser Pro Gln Val Phe Thr Thr Gln Asp Val Val Tyr Phe Pro Pro                 325                 330                 335 Lys Ile Leu Thr Ser Val Gly Ser Asn Ala Ser Phe His Cys Ile Tyr             340                 345                 350 Lys Asn Glu Asn Gln Ile Ile Ser Ser Lys Gln Ile Val Trp Trp Arg         355                 360                 365 Asn Leu Ala Glu Lys Ile Pro Glu Ile Gln Tyr Ser Ile Val Ser Asp     370                 375                 380 Arg Val Ser Lys Val Thr Phe Ser Asn Leu Lys Ala Thr Arg Pro Arg 385                 390                 395                 400 Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu Gln Ala Cys                 405                 410                 415 His His Arg Tyr Ala Glu Leu Tyr Val Ile Asp Val Asn Ile Asn Ile             420                 425                 430 Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg Trp Ser         435                 440                 445 Pro Ser Thr Ile Gln Ser Leu Val Gly Ser Thr Val Gln Leu Arg Tyr     450                 455                 460 His Arg Arg Ser Leu Tyr Cys Pro Asp Ser Pro Ser Ile His Pro Thr 465                 470                 475                 480 Ser Glu Pro Lys Asn Cys Val Leu Gln Arg Asp Gly Phe Tyr Glu Cys                 485                 490                 495 Val Phe Gln Pro Ile Phe Leu Leu Ser Gly Tyr Thr Met Trp Ile Arg             500                 505                 510 Ile Asn His Ser Leu Gly Ser Leu Asp Ser Pro Pro Thr Cys Val Leu         515                 520                 525 Pro Asp Ser Val Val Lys Pro Leu Pro Pro Ser Asn Val Lys Ala Glu     530                 535                 540 Ile Thr Val Asn Thr Gly Leu Leu Lys Val Ser Trp Glu Lys Pro Val 545                 550                 555                 560 Phe Pro Glu Asn Asn Leu Gln Phe Gln Ile Arg Tyr Gly Leu Ser Gly                 565                 570                 575 Lys Glu Ile Gln Trp Lys Thr His Glu Val Phe Asp Ala Lys Ser Lys             580                 585                 590 Ser Ala Ser Leu Leu Val Ser Asp Leu Cys Ala Val Tyr Val Val Gln         595                 600                 605 Val Arg Cys Arg Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn Trp Ser     610                 615                 620 Ser Pro Ala Tyr Thr Leu Val Met Asp Val Lys Val Pro Met Arg Gly 625                 630                 635                 640 Pro Glu Phe Trp Arg Lys Met Asp Gly Asp Val Thr Lys Lys Glu Arg                 645                 650                 655 Asn Val Thr Leu Leu Trp Lys Pro Leu Thr Lys Asn Asp Ser Leu Cys             660                 665                 670 Ser Val Arg Arg Tyr Val Val Lys His Arg Thr Ala His Asn Gly Thr         675                 680                 685 Trp Ser Glu Asp Val Gly Asn Arg Thr Asn Leu Thr Phe Leu Trp Thr     690                 695                 700 Glu Pro Ala His Thr Val Thr Val Leu Ala Val Asn Ser Leu Gly Ala 705                 710                 715                 720 Ser Leu Val Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser Lys Val                 725                 730                 735 Ser Ala Val Glu Ser Leu Ser Ala Tyr Pro Leu Ser Ser Ser Cys Val             740                 745                 750 Ile Leu Ser Trp Thr Leu Ser Pro Asp Asp Tyr Ser Leu Leu Tyr Leu         755                 760                 765 Val Ile Glu Trp Lys Ile Leu Asn Glu Asp Asp Gly Met Lys Trp Leu     770                 775                 780 Arg Ile Pro Ser Asn Val Lys Lys Phe Tyr Ile His Asp Asn Phe Ile 785                 790                 795                 800 Pro Ile Glu Lys Tyr Gln Phe Ser Leu Tyr Pro Val Phe Met Glu Gly                 805                 810                 815 Val Gly Lys Pro Lys Ile Ile Asn Gly Phe Thr Lys Asp Ala Ile Asp             820                 825                 830 Lys Gln Gln Asn Asp Ala Gly Leu Tyr Val Ile Val Pro Ile Ile Ile         835                 840                 845 Ser Ser Cys Val Leu Leu Leu Gly Thr Leu Leu Ile Ser His Gln Arg     850                 855                 860 Met Lys Lys Leu Phe Trp Asp Asp Val Pro Asn Pro Lys Asn Cys Ser 865                 870                 875                 880 Trp Ala Gln Gly Leu Asn Phe Gln Lys Pro Glu Thr Phe Glu His Leu                 885                 890                 895 Phe Thr Lys His Ala Glu Ser Val Ile Phe Gly Pro Leu Leu Leu Glu             900                 905                 910 Pro Glu Pro Ile Ser Glu Glu Ile Ser Val Asp Thr Ala Trp Lys Asn         915                 920                 925 Lys Asp Glu Met Val Pro Ala Ala Met Val Ser Leu Leu Leu Thr Thr     930                 935                 940 Pro Asp Pro Glu Ser Ser Ser Ile Cys Ile Ser Asp Gln Cys Asn Ser 945                 950                 955                 960 Ala Asn Phe Ser Gly Ser Gln Ser Thr Gln Val Thr Cys Glu Asp Glu                 965                 970                 975 Cys Gln Arg Gly Pro Ser Val Lys Tyr Ala Thr Leu Val Ser Asn Asp             980                 985                 990 Lys Leu Val Glu Thr Asp Glu Glu Gln Gly Phe Ile His Ser Pro Val         995                 1000                1005 Ser Asn Cys Ile Ser Ser Asn His Ser Pro Leu Arg Gln Ser Phe Ser     1010                1015                1020 Ser Ser Ser Trp Glu Thr Glu Ala Gln Thr Phe Phe Leu Leu Ser Asp 1025                1030                1035                1040 Gln Gln Pro Thr Met Ile Ser Pro Gln Leu Ser Phe Ser Gly Leu Asp                 1045                1050                1055 Glu Leu Leu Glu Leu Glu Gly Ser Phe Pro Glu Glu Asn His Arg Glu             1060                1065                1070 Lys Ser Val Cys Tyr Leu Glu Val Thr Ser Val Asn Arg Arg Glu Ser         1075                1080                1085 Gly Val Seu Leu Thr Gly Glu Ala Gly Ile Leu Cys Thr Phe Pro Ala     1090                1095                1100 Gln Cys Leu Phe Ser Asp Ile Arg Ile Leu Gln Glu Arg Cys Ser His 1105                1110                1115                1120 Phe Val Glu Asn Asn Leu Ser Leu Gly Thr Ser Gly Glu Asn Phe Val                 1125                1130                1135 Pro Tyr Met Pro Gln Phe Gln Thr Cys Ser Thr His Ser His Lys Ile             1140                1145                1150 Met Glu Asn Lys Met Cys Asp Leu Thr Val         1155                1160 (2)序列44资料:

(ⅰ)序列特征:

    (A)长度:16bp

    (B)类型:核酸

    (C)链型:双

    (D)拓朴结构:不详

(ⅱ)分子类型:cDNA

(ⅹⅰ)序列描述:序列44:

TCRCACATYT TRTTNCCCAT TATCTT

16 (2)序列45资料:

(ⅰ)序列特征:

    (A)长度:33bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:单

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列45:

CCCAATGTCG ACATGATGTG TCAGAAATTC TAT

33 (2)序列46资料:

(ⅰ)序列特征:

    (A)长度:33bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列46:

AAAAAGGATC CGGTCATTCT GCTGCTTGTC GAT 33 (2)序列47资料:

(ⅰ)序列特征:

    (A)长度:33bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列47:

CCCAATGTCG ACATGGTGTA CTTCTCTGAA GTA

33 (2)序列48资料:

(ⅰ)序列特征:

    (A)长度:30bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列48:

TTTTTGGATC CCACCTGCAT CACTCTGGTG

30 (2)序列49资料:

(ⅰ)序列特征:

    (A)长度:48bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列49:

TTTAACTTGT CATATCCAAT TACTCCTTGG AGATTTAAGT TGTCTTGC

48 (2)序列50资料:

(ⅰ)序列特征:

    (A)长度:30bp

    (B)类型:核酸

    (C)链型:单

    (D)拓朴结构:线性

(ⅱ)分子类型:DNA

(ⅹⅰ)序列描述:序列50:

TTTTTGGATC CCACCTGCAT CACTCTGGTG

30

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈