首页 / 专利库 / 动物学 / 哺乳动物 / 胆盐刺激的脂酶变异体、其制法、用途及编码它的核酸

胆盐刺激的脂酶变异体、其制法、用途及编码它的核酸

阅读:837发布:2023-03-04

专利汇可以提供胆盐刺激的脂酶变异体、其制法、用途及编码它的核酸专利检索,专利查询,专利分析的服务。并且本 发明 涉及作为胆盐刺激的脂酶(RSSL;EC3.1.1.1)变异体的新多肽。还涉及编码所述多肽的DNA分子,及含所述DNA分子的亚产物。本发明还涉及生产所述BSSL变异体以及生产能表达BSSL变异体的转基因非人类 哺乳动物 的方法。此外,本发明涉及所述的转基因动物以及含有来自所述转基因动物的乳的婴儿配方。本发明还涉及含所述多肽的药物组合物,以及所述多肽和DNA分子对于药物制造的用途。,下面是胆盐刺激的脂酶变异体、其制法、用途及编码它的核酸专利的具体信息内容。

1.一种编码不到722个基酸的多肽的核酸分子,所述多肽是 一种BSSL变异体,所说BSSL变异体含SEQ ID No:3所示第536-722 个残基的部分氨基酸序列。
2.根据权利要求1的核酸分子,其中所说的BSSL变异体在其C -末端有一个苯丙氨酸残基。
3.根据权利要求1或2的核酸分子,其中所说BSSL变异体在其 C-末端部分含有序列Gln-Met-Pro。
4.根据权利要求1或2的核酸分子,其中所说BSSL变异体在其 C-末端部分含SEQ ID No:3中残基第712-722所示的氨基酸序列。
5.根据权利要求1或2的核酸分子,其中所述BSSL含不到16 个重复单位。
6.根据权利要求1的编码多肽的核酸分子,所述多肽的氨基酸 序列与序列表SEQID No:5、6或9所示的氨基酸序列至少90%同源。
7.根据权利要求6的编码多肽的核酸分子,所述多肽含序列表 SEQ ID No:5、6或9所示的氨基酸序列。
8.一种编码多肽的核酸分子,所述多肽的氨基酸序列与序列表 SEQ ID No:7所示的氨基酸序列至少90%同源,但编码在187位置为天 冬酰胺的多肽的那些核酸分子除外。
9.根据权利要求8的编码多肽的核酸分子,所述多肽含序列表 SEQ ID No:7所示的氨基酸序列。
10.序列表SEQ ID No:5、6、7或9所示的多肽。
11.由根据权利要求1-9的任一权利要求的核酸序列编码的多 肽。
12.根据权利要求10或11的多肽,所述多肽的纯度超过90%。
13.含根据权利要求1-9的任一权利要求的核酸分子的杂种基 因。
14.一种含权利要求13的杂种基因的可复制的表达载体。
15.根据权利要求14的载体,所述载体为乳头状瘤病毒载体 pS258、pS259或pS299。
16.含有权利要求13杂种基因的细胞。
17.根据权利要求16的细胞,此细胞来自鼠细胞系C127或大肠 杆菌。
18.一种生产权利要求11或12的重组多肽的方法,所说方法包 括(ⅰ)将按照权利要求1-9的任一权利要求的核酸分子插入能在特异的 宿主细胞或有机体中复制的杂种基因,(ⅱ)将所得的重组杂种基因引入 宿主细胞或有机体;(ⅲ)在培养基内或上鉴定和生长产生的细胞,或鉴 定和繁殖有机体,以便表达多肽;(ⅳ)回收多肽。
19.根据权利要求18的方法,其中杂种基因含于牛乳头状瘤病毒 载体pS258、pS259或pS299。
20.一种表达系统,包含能在含所述杂种基因的宿主细胞或有机 体中表达的杂种基因,以致于当杂种基因表达时生产重组多肽,所说杂 种基因是通过将权利要求1-9的任一权利要求的核酸序列插入能调节所 述杂种基因表达的基因中而产生。
21.含有根据权利要求10-12的任一权利要求多肽的婴儿食品组 合物。
22.用权利要求10-12的任一权利要求的多肽补充婴儿食品组合 物的婴儿食品组合物生产方法。
23.权利要求10-12的任一权利要求的多肽作为婴儿食物补充剂 的用途。
24.含权利要求10-12的任一权利要求的多肽的药物组合物。
25.在治疗中应用的权利要求10-12的任一权利要求的多肽。
26.按权利要求10-12的任一权利要求的多肽在制备用于治疗与 外分泌胰腺功能生理障碍相关的药物中的应用。
27.根据权利要求26的应用,用于制造治疗胆囊纤维化药物。
28.根据权利要求26的应用,用于制造治疗慢性胰腺炎的药物。
29.根据权利要求26的应用,用于制造治疗脂肪吸收不良的药物。
30.根据权利要求26的应用,用于制造治疗脂溶性维生素吸收不 良的药物。
31.根据权利要求26的应用,用于制造治疗由生理原因所致脂肪 吸收不良的药物。
32.根据权利要求26的应用,用于制造改进膳食脂类的利用的药 物。
33.改进权利要求26的应用,用于制造提高早产儿膳食脂类的利 用率的药物。

说明书全文

技术领域

发明涉及作为胆盐刺激的脂酶(BSSL;EC3.1.1.1.)变异体的新的 多肽。也涉及编码所述多肽的DNA分子,涉及含所述DNA分子的亚产 品。此外本发明涉及生产所述BSSL变异体和生产能表达BSSL变异体 的转基因非人类哺乳动物的方法。而且本发明涉及所述的转基因动物及 含此转基因动物乳的婴儿膳食配方。本发明还涉及含所述多肽的药物组 合物,所述多肽及制造药物的DNA分子的用途。

背景技术

膳食脂类的
膳食脂类是一种重要的能量来源。富含能量的三脂酰甘油占这些脂 类的95%以上。一些脂类,如某些脂肪酸和脂溶性维生素,是必需的膳食 成分。在胃肠吸收之前,三脂酰甘油和微量成分,如酯化的脂溶性维生素、 胆固醇及二脂酰磷脂酰甘油,需要酯键水解以得到疏水性弱、可吸收的产 物。通过称为脂酶的特异性酶类催化这些反应。
在人类中,相关的必需脂酶有,胃脂酶、共脂酶依赖的胰脂酶(水解三 -和二脂酰甘油)、胰磷脂酶A2(水解二脂酰磷脂酰甘油)和羧基酯水解酶 (CEH)(水解固醇酯和脂溶性维生素酯及三、二和单脂酰甘油)。对哺乳 的新生儿,胆盐刺激的脂酶(BSSL)在水解上述提到的几种脂类过程中发 挥着重要的作用。脂类消化产物和胆盐一 起形成混合的吸收微团或单层吸收囊泡(Hernell et al.,1990)。 胆盐刺激的脂酶
胆盐刺激的脂酶(BSSL)在有限几个种类,如人类、大猩猩、猫 和狗中是乳中成分(Hernell et al.,1989,Hamosh et al., 1986)。在上部小肠内容物中与胆汁混合后,BSSL被初级胆盐 (Hernell,1975)特异地激活。约占总乳蛋白1%的BSSL,和乳一 起经过胃时不降解,在十二指肠内容物中胆盐保护其不被如胰蛋白酶 和糜蛋白酶的胰蛋白酶类失活。
热处理人乳(巴斯德消毒法62.5℃,30分钟),使BSSL完全 失活(Bjrksten et al.,1980),使早产儿的脂肪吸收系数降低 约1/3(Williamson et al.,1978,Atkinson et al.,1981), 因此由于BSSL和同样脂肪成分的婴儿膳食配方比,新鲜人乳中三脂酰 甘油较好利用(Hernell et al.,1991,Chapell et al.,1986)。
BSSL是一种非特异性脂酶(EC3.1.1.1),它不但大量水解 三脂酰甘油,而且水解二和单脂酰甘油,胆固醇酯类及脂溶性维生素 酯类(Blckberg&Hernell,1983)。因此,活化后,BSSL本身有 能水解人乳中的大部分脂类,纵使人乳三脂酰甘油的最有效利用需 要胃脂酶(EC3.1.1.3),共脂酶依赖的胰脂酶(EC3.1.1.3) 和BSSL(Bernbck et al.,1990)的协同作用。
最近研究表明,乳酶对于新生儿利用长链多不饱和脂肪酸是特别 重要的(Hernell et al.,1993)。这些脂肪酸是eicosanoids的 重要前体并有助于神经系统的发育。新生儿,尤其早产儿,从前体合 成这些脂肪酸的能力有限。因此,认为出生后在一段还未确定的时期 内仍然需要它们。
最近从几个实验室研究中已描述了乳脂酶和胰羧基酯水解酶 (CEH)(E.C.3.1.1.1)两者cDNA结构的特征(Baba et al., 1991;Hui et al.,1991;Nilsson et al.,1990;Reue et al.,1991),结论为,乳酶和胰酶是同一基因的产物。BSSL或CEH基 因的cDNA序列及推导出的基酸序列(SEQ ID NO:1)也公开在WO 91/15234(Oklahoma Medical Research Foundation)和WO91/ 18923(Aktiebolaget Astra)中。
BSSL是一种单链糖蛋白。推导出的蛋白质(SEQ ID NO:3) 含722个氨基酸残基,而且高度糖基化(Abouakilet al.,1989)。 这种蛋白质N-端部分的一半同乙酰胆脂酶及其它一些脂酶有显著 同源性(Nilsson et al.,1990)。
一个暂定的丝氨基残基活性位点定位在第194位丝氨酸;这个丝 氨酸两侧的序列同丝氨酸水解酶的共有活性位点序列是一致的。一个 暂定的N-糖基化位点、在活性位点丝氨酸N-端的仅7个残基处 (Nilsson et al.,1990)。
BSSL在其C-端含16个脯氨酸丰富的重复序列,每个重复序列 由11个氨基酸残基组成。重复序列数量的不同似乎主要解释了源于 不同种之相应酶之间分子大小和氨基酸构成上的差异(Han et al., 1987;Fontaine et al.,1991;Kyger et al.,1989)。这些 重复序列带有占此蛋白15-20%的糖类的大部分(Baba et al., 1991;Abouakil et al.,1989)。
在BSSL和典型的脂酶之间独一无二的结构差别在多肽链的C-端, 即由11个氨基酸残基组成的16个富含脯氨酸的重复序列。和大 鼠相应的胰酶分别只有3和4个重复序列(Han et al.,1987; Kyger et al.,1989)。因此,可以假设即,C-端,或至少部分 C-端对于脂酶活性抗乳化的长链三脂酰甘油的活性是必不可少的。 脂类吸收异常
脂类吸收异常及由此引起的营养不良,一般原因是管腔内共脂酶 依赖的胰脂酶和/或胆盐的水平降低。这种脂酶缺乏的典型例子是囊 性纤维性变患者,其中80%的人由于普遍的遗传性紊乱导致终生缺 陷,再就是慢性胰腺炎,通常由慢性酒精中毒引起。
目前,治疗胰脂酶缺乏的患者,是口服很大剂量的猪胰酶粗制品。 然而,共脂酶依赖的胰脂酶通常由于胃内pH低而失活。使用大剂量 的酶不能完全克服此影响。因此大剂量口服胰酶对多数患者是不够的, 而且该制品不纯且口味差。
已制定配方的某种药片,能通过胃的酸性区,只在空肠的相对碱 性环境中释放出酶。但是,许多胰病患者空肠呈不正常的酸性,在那 些情况下药片不能释放酶。
而且,由于目前市场上的制品为非人类来源,有产生免疫反应的 危险性,对患者产生有害作用或降低疗效。
此制品进一步的弊端是,和共脂酶依赖的脂酶比,其它脂解活性 的内容物尚未陈述。实际上,它们多半含很低水平的BSSL/CEH活性。 这可能是许多患囊性纤维性变的患者尽管用补充疗法,但仍患有脂溶 性维生素和必需脂肪酸缺乏的一个原因。
因此,强烈需要具有人类脂酶特性和结构并具有广泛底物特异性 的产品。此产品能给患一或几种胰脂解酶缺乏的患者口服。使用本发 明的产品本身或同含其它脂酶的制品结合满足了这种需要。
本发明构思简述
按照本发明,重组BSSL变异体有稳定的催化活性,但比全长BSSL 含较少糖基化位点,由此其生产可能降低糖类的异质性程度。这种复 杂性的降低使此重组蛋白易于纯化及描述特征,将导致更有效地生产 具有BSSL活性的多肽。
另一方面,糖基化程度的降低减少了对宿主的要求,并允许几种 宿主细胞有较高水平的生产。但在另一方面,BSSL变异体糖基化位点 数的降低,允许较低等真核生物进行高效生产并限制可引起免疫反应 的异常糖基化的潜在危险。这种大小的降低,糖基化复杂性较低也表 明与具有很复杂及含大量糖类部分的蛋白质相比较,宿主范围比较广 阔。
治疗用BSSL变异体的大小较小,但是活性相等,这意谓着补充所 需的物质重量减少了。进一步,重组BSSL变异体缺乏大多数或全部O -糖基化重复单位,可能的优点是降低接受个体中产生免疫反应的危 险性。这是因为依赖于产生它的细胞,O-连接的糖可能是很有异源 性的。
科学文献指出,天然BSSL粘着在小肠粘液中并通过其吸收。筛选 的降低了吸收率的BSSL变异体在较长时期内对膳食脂类底物是有活性 的,进而产生高效的腔内消化。这种变异体的例子是具有降低的糖基 化的分子。
如上所述,已证实BSSL对新生儿神经系统发育上发挥重要作用的 长链多不饱和脂肪酸(Hernellet al.,1993)和维生素的利用是 特别重要的。
按照本发明,在此方面更有效的BSSL变异体可经已知方法筛选。 截短的酶可能有不同的构象,所述构象影响对不同的脂类底物的特异 性。
本发明公开
一方面,本发明涉及编码短于722个氨基酸的BSSL变异体的核酸 分子,所说的BSSL变异体含SEQ ID NO:3中所示536-722残基部 分氨基酸序列。
术语“部分氨基酸序列”理解为含一个氨基酸及几个氨基酸的序 列或几个结合的所述序列。
术语“BSSL变异体”理解为多肽,具有BSSL活性,并且含序列表 SEQ ID NO:3所示的人BSSL之部分氨基酸序列。
术语“具有BSSL活性的多肽”理解为至少含有下列特性的多肽
(a)适于口服;
(b)能被特异性胆盐活化;
(c)在小肠内容物中起非特异性脂酶的作用,即能水解脂类,
   相对地与其化学结构和物理状态(乳化的、微团的、可溶
   的)无关;
并且可选择地有一或更多下述特性:
(d)水解有不同链长度及不同不饱和程度之脂肪酸的三脂酰甘
   油的能力;
(e)也有水解二脂酰甘油、单脂酰甘油胆甾烯基酯、溶血磷脂
   酰甘油、视黄基和其它脂溶性维生素酯的能力;
(f)不但有水解三脂酰甘油的sn-1(3)酯键的能力,而且
   有水解sn-2酯键的能力;
(g)不但具有和初级胆盐相互作用的能力,而且有和次级胆盐
   相互作用的能力;
(h)最佳活性依赖胆盐;
(i)在胃内容物中稳定,对其催化效率的影响不会达到任何实
   质程度;
(j)若胆盐存在,稳定地抗胰酶,如胰蛋白酶失活;
(k)结合肝素和肝素衍生物,如硫酸肝素的能力;
(l)和脂-水界面结合的能力;
(m)对低压冻干法足够稳定;
(n)当和食物成分,如人乳或乳膳食成分混合时稳定。
另一些方面,本发明涉及如上所述的核酸分子,其中所说BSSL变异 体在其C-端位置有一个苯丙氨酸残基,或在其C-端部分含一个谷 氨酰胺-蛋氨酸-脯氨酸(Gln-Met-Pro)序列,另一方面在其C-端 部分可替换含有SEQ ID NO:3中第712-722残基所示的氨基酸序 列。
在本发明中,术语“C-端位置”命名为最后的C-端残基位置, 而术语“C-端部分”可理解为组成BSSL变异体C-端的约50个氨 基酸残基。
如上所述本发明进一步涉及核酸分子,其中所说的BSSL变异体含 不到16个的重复单位。本发明中术语“重复单位”命名为33个核 苷酸的重复单位之一,所述每一核苷酸均在序列表SEQ ID NO:1 中有说明。
另一些方面,本发明涉及上述编码一种多肽的核酸分子,所述多 肽的氨基酸序列与序列表中的SEQ ID NO:5、6或9所示的氨基 酸序列有至少90%的同源,并涉及编码一种多肽的核酸分子,所述 多肽的氨基酸序列与序列表SEQ ID NO:7所示的氨基酸序列至少 有90%的同源,但编码187位置上有一个天冬酰胺的多肽的那些核 酸分子除外。
本发明也涉及序列表中SEQ ID NO:5、6、7、或9所示的 多肽以及如上所说的核酸序列编码的多肽。
本发明还涉及一种含上述核酸分子的杂种基因,一种含所述杂种 基因的可复制的表达载体以及含有所述杂种基因的细胞。所述细胞可 以是原核细胞、单细胞真核有机体或源于多细胞有机体如哺乳动物的 细胞。
在本发明中,“杂种基因”意思是核酸序列,它一方面包含编码 如上定义的BSSL变异体的核酸序列,另一方面含有能调控所述杂种基 因产物表达的基因之核酸序列。术语“基因”意思是在所需组织能调 控和定位杂种基因表达的一个完整的基因和其亚序列。通常,所说的 亚序列至少有一或多个启动子区、一个转录起始位点、3′和5′非 编码区和结构序列。
优选地,杂种基因通过在体外将编码BSSL变异体的核酸序列插入 到用现有技术能调控表达的基因中而形成的。另外,编码BSSL变异体 的核酸序列在体内可通过同源重组插入。
在本发明中,术语“可复制的”意思是指载体能在给定类型的它 被导入的宿主细胞中复制。紧接核酸的序列上游可提供一个编码信号 肽的序列,信号肽的存在保证了由含载体的宿主细胞表达的BSSL变异 体的分泌。信号序列可以是天然和核酸序列有关的,或是其它来源的。
载体可以是适于重组DNA方法的任何载体,载体的选择通常依赖 于它被导入的宿主细胞。因此,载体可以是自主复制载体,即作为染 色体外单位存在的载体,其复制不依赖染色体复制;此类载体的例子 有质粒、噬菌体、粘粒、微小染色体或病毒。另外,载体可以是这样 的载体,当其引入宿主细胞时,整合进宿主细胞基因组中,与其整合 的染色体一起复制。适宜的载体例子是细菌表达载体和酵母表达载体。 本发明的载体可携带上述定义的本发明的任何核酸序列。
另一方面,本发明涉及重组多肽的生产方法,所说方法包括(ⅰ) 在能于特异性宿主细胞或有机体中复制的杂种基因中插入上述核酸分 子;(ⅱ)将所得的重组杂种基因导入宿主细胞或有机体;(ⅲ) 在培养基内或上使所得的细胞生长,或鉴定并繁殖有机体,以表达多 肽;和(ⅳ)回收多肽。
用于生长细胞的培养基可以是适于此目的的任何常规培养基。合 适的载体可以是上述任何载体,而合适的宿主细胞可以是上述列出的 任何类型细胞。用于构建载体和使其引入宿主细胞的方法可以是重组 DNA领域中用于此目的的任何已知方法。可以分泌细胞表达的人重组 BSSL变异体,即通过细胞膜输出,这依赖于细胞的类型和载体的构成。
如果BSSL变异体由重组宿主细胞内产生,即,细胞不分泌出BSSL 变异体,则可通过标准方法,包括通过机械方法,如声处理或匀浆化, 或通过酶学或化学方法使细胞裂解,接着进行纯化而回收。
为了分泌,编码BSSL变异体的DNA序列之前应有一编码信号肽的 序列,其存在保证了BSSL变异体从细胞中分泌,以致将至少相当比例 的表达的BSSL变异体分泌到培养基中并回收。
本发明也涉及到一种表达系统,包括在含有所说的杂种基因的宿 主细胞或有机体中可以表达的杂种基因,当杂种基因表达时产生重组 多肽,通过将上述核酸序列插入能调节所说杂种基因表达的基因中产 生所述的杂种基因。
生产本发明的重组BSSL变异体可能的方法是使用能将BSSL变异体 分泌到其乳中的转基因非人类哺乳动物。转基因非人类哺乳动物的使 用,其优点是可以以合理的成本获得高产率的重组BSSL变异体,尤其 若非人类哺乳动物是母牛时,在乳中生产作为例如婴儿膳食配方的正 常组分的重组BSSL变异体以便当使用重组BSSL变异体作为以乳为基本 的产品中的营养添加剂时不必过度纯化。
而且在较高等有机体如非人类哺乳动物中生产通常会对哺乳动物 蛋白进行正确的加工,如有关上述的翻译后加工过程和适当折叠,也 可以得到大量基本上纯的BSSL变异体。
因此,上述表达系统可以是哺乳动物表达系统,其包括编码BSSL 变异体的DNA序列,此序列插入到编码非人类哺乳动物乳蛋白的基因 中,以便形成在成年哺乳动物雌性乳腺内可表达的杂种基因,所述哺乳动 物含有所说杂种基因。
通常认为,作为表达组织的乳腺和编码乳蛋白的基因特别适合于 在转基因非人类哺乳动物中生产异源蛋白质,由于乳蛋白在乳腺中 通常以高表达水平生产。而且易于大量收集和使用乳。在本发明中, 在重组BSSL变异体的生产中使用乳蛋白基因的进一步的益处是,利用 表达调节及生产位置(乳腺)在类似其自然生产条件的条件下进行生 产。
当在转基因哺乳动物中使用时,上述杂种基因优选地含有编码 信号肽的序列,以便能将杂种基因产物正确地分泌到乳腺内。信号 肽典型地通常是在所述研究的乳蛋白基因中发现的或是与编码BSSL变异 体的DNA序列相关的。但是,能调节杂种基因产物使其分泌到乳腺 内的其它信号序列,也是相关的。当然,杂种基因的各种元件应以如 此方式融合,以便使基因产物进行正确表达及加工。因此,应将编码 所需信号肽的DNA序列与编码BSSL变异体的DNA序列的N-末端部分精 确融合。在杂种基因中,编码BSSL变异体的DNA序列,通常含有其终 止密码子,但不是其自身的信息裂解和聚腺苷酸位点。通常保留编码 BSSL变异体的DNA序列的下游,乳蛋白基因的mRNA加工序列。
许多因素被认为对某个特别杂种基因的实际表达水平有影响。启动 子及上述其它调节序列的能力、哺乳动物基因组中表达系统的整合位 点、编码BSSL变异体的DNA序列在乳蛋白编码基因中的整合位点、赋 予转录后调节元件及其它类似因子对获得的表达水平是相当重要的。 根据对影响杂种基因表达水平的各种因子的认识,本领域技术人员知 道怎样设计用于本发明目的的表达体系。
所用的乳蛋白基因可源于与表达体系所插入的乳蛋白基因之种相 同,或源于别的种。就此而论已表明,乳腺靶基因表达的调节元件在 功能上跨跃了种的界限,这也许是由于可能的共同祖先(Hennighausen et al.1990)。
在构建本发明表达体系中所用的编码乳蛋白适宜的基因或其有效 的亚序列通常发现于不同哺乳类源的乳清蛋白之中,如乳清酸蛋白 (WAP)基因,优选的是鼠源的;和β-乳球蛋白基因,优选的是 羊源的。而且可能发现不同来源的酪蛋白基因也适于BSSL变异体的转 基因生产,如牛αS1-酪蛋白和兔β-酪蛋白。目前优选的基因是 鼠WAP基因,因发现其可在不同转基因动物乳中使许多外源人类蛋白 质的高水平表达(Hennighausen et al.1990)。
另一个和本发明表达系统相关的优选序列是能调节高水平表达的 所谓表达稳定序列。强有力证据表明,此稳定序列发现于乳蛋白基因 附近和上游。
本发明也包括生产能表达BSSL变异体的转基因非人类哺乳动物的 方法,包括(a)将上述表达系统进入受精卵或非人类哺乳动物胚胎 细胞以便使表达系统掺入哺乳动物种系;和(b)使所得的受精卵或 胚胎发育成为成年雌性非人类哺乳动物。
可使用任何合适的技术,如在“Manipulating the Mouse Embryo”,A Laboratory Manual,Cold Spring Harbor Laboratory Press 1986中描述的将表达系统掺入哺乳动物种系。 例如,几百个分子的表达系统可直接注射进受精卵,如受精的一个细 胞卵或其卵原核,或所用哺乳动物的胚胎,此后将微注射的卵转入假 孕代育母亲的输卵管,使其发育。
生产能表达BSSL变异体的转基因非人类哺乳动物的方法也包括其 中所说的哺乳动物基本上不能表达来自哺乳动物本身的BSSL的方法。 所述方法包括(a)损害哺乳动物的BSSL表达能力以便基本上不表达 哺乳动物BSSL,并按上述将一个表达系统以使在哺乳动物中表达BSSL 变异体的方式插入哺乳动物种系,和/或(b)用如上限定的表达系 统取代哺乳动物BSSL基因或其部分。
通过在导致BSSL表达的DNA序列中引入突变可以方便地破坏哺乳 动物的BSSL表达能力。所述突变可以包括使DNA序列脱离框架、引入 终止密码、缺乏DNA序列的一或多个核苷酸。
可用上述的表达系统或通过熟知的同源重组原理用编码BSSL变异 体的DNA序列取代哺乳动物BSSL基因或其部分。
在更重要的方面,本发明涉及在其基因组中有如上DNA序列的转 基因非人类哺乳动物。所说DNA序列可优选地存在于哺乳动物的胚系 及哺乳动物的乳蛋白基因中。优选地可从包括小鼠、大鼠、兔、羊、 猪和牛筛选转基因非人类哺乳动物。
本发明也包括如上转基因非人类哺乳动物的后代及从所述转基因 非人类哺乳动物获得的乳。
本发明进一步涉及含如上乳的婴儿配方及上述含BSSL变异体的婴 儿配方。婴儿配方可使用常规方法制备,而且可含任何必需的添加剂 矿物质、维生素等。
进一步,本发明涉及含如上BSSL变异体的药物组合物及所述BSSL 变异体在治疗中的应用。
更进一步,本发明涉及用上述BSSL变异体制造用于治疗与外分泌 胰腺功能不全:胆囊纤维化、慢性胰腺炎、脂肪吸收障碍、脂溶性维 生素吸收不良、由于病理原因造成的脂肪吸收不良相关的病理状态之 药物。本发明也涉及用于药物制造的BSSL变异体对于改善膳食脂类利 用的用途,尤其在早产儿中。
实施例 1.重组BSSL在真核及原核细胞中的表达 1.1实验方法 1.1.1重组质粒
被克隆进pUC19中的含2.3kb人BSSL cDNA(Nilsson et al. 1990)的质粒pS146经HindⅢ和SalⅠ酶解,将BSSL cDNA导入牛乳头 瘤病毒(BPV)表达载体,pS147(图1)。此载体含有位于鼠金属硫 因1(mMT-1)控制增强子及启动元件之下(Pavlakis&Hamer, 1983)的人BSSL cDNA。mRNA加工信号通过含部分外显子Ⅱ、内含子 Ⅱ、外显子Ⅲ及兔β-球蛋白基因下游元件的基因组片段提供。将该 转录单位克隆进含整个BPV基因组的载体中。对BPV和BSSL转录单位来 说,转录是单方向的。为了使此载体在大肠杆菌中繁殖,该载体还包 含pML2d,它是pBR322的衍生物(Sarver et al.1982)。
表达载体pS147和在Harrey肉瘤病毒5′-长末端重复序列及SV40 多腺苷酸化信号(Lusd&Botchan,1984)驱动下的编码新霉素抗 性基因的载体共转染
为了在大肠杆菌中表达BSSL,从质粒pT7-7(Ausubel et al, 1992)中将BSSL cDNA作为NdeⅠ-BamHⅠ片段亚克隆到pGEMEX-1 (Promega,Madison,WI,USA)(Studier & Moffat,1986)中。 用这种克隆方法,T7基因10编码序列被前面加起始密码子的编码 成熟蛋白质的BSSL基因置换。最终表达载体pGEMEX/BSSL通过使用特 异的BSSL内引物,经DNA测序证实。 1.1.1.2诱变
指定起始密码ATG中的A为核苷酸1号。对于氨基酸序号,信号 肽中的第一个蛋氨酸号为-23,将成熟蛋白质中第一个氨基酸残基, 丙氨酸,指定为1号。
为构建缺失变异体A(SEQ ID NO:4),合成了两个PCR引物, PCR-1和PCR-2(表1)。为了克隆进不同的质粒,产生了HindⅢ、 SalⅠ和BamHⅠ位点。没有改变氨基酸序列,在BSSL序列中产生了BclⅠ 位点。这样做为了便于加入合成的DNA,以获得其它变异体。引物PCR -2含两个合成的终止密码子。所得的PCR片段经BamHⅠ和HindⅢ酶解 并克隆进pUC18以便序列分析。该质粒命名为pS157。正确的PCR片段 通过在独一无二的Asp700位点(BSSL cDNA中1405位置)和β-球蛋 白基因片段前部的SalⅠ位点与BSSL序列融合而插入到BPV表达载体, 结果产生pS257。
通过使用3、4、7和8号寡核苷酸(表1)获得了B-变异体 构建体(SEQ ID NO:5)。退火的寡核苷酸正好编码C-未端氨 基酸序列相当于全长蛋白质中的赖氨酸712至苯丙氨酸722。此片段和 谷氨酰胺535融合。一个翻译终止子直接插入到最后一个苯丙氨酸后。 此片段在5′端含一个BclⅠ位点并在3′端含一个SalⅠ位点,使其能 够导入pS157。所得的质粒用Asp700和SalⅠ酶解,将313bp片段导入上 述的表达载体。产生的质粒命名为pS258。 表1.
用于构建BSSL变异体的合成的寡核苷酸在限制性位点的核苷酸下 面划了线。翻译终止信号由黑体字标出。变异体N中可变密码在PCR -3中用黑体字和星号标出。  寡核苷酸                         序列(5′-3′)  PCR-1  CGGGATCCGAAGCCCTTCGCCACCCCCACG  PCR-2  CGAAGCTTGTCGACTTACTACTGATCAGTCACTGTGGGCAGCGCCAG  PCR-3  GGGAATTCTGGCCATTGCTTGGGTGAAGAGGAATATCGCGGCCTTCGG  GGGGGACCCCAACCAGATCACGCTCTTCGGGGAGTCT  PCR-4  CGGGATCCCACATAGTGCAGCATGGGGTACTCCAGGCC  1  GATCAGGGGGCCCCCCCCGTGCCGCCCACGGGTGACTCCGGG  2  GCCCCCCCCGTGCCGCCCACGGGTGACTCCAAGGAAGCTCAGA  3  TGCCTGCAGTCATTAGGTTTTAGTAAGTCGACA  4  AGCTTGTCGACTTACTAAAACCTAATGACTG  5  CAGGCATCTGAGCTTCCTTGGAGTCACCCGTGGGCGGCACGGGGGGGG  CCCCGGA  6  GTCACCCGTGGGCGGCACGGGGGGGGCCCCCT  7  GATCAGAAGGAAGCTCAGA  8  CAGGCATCTGAGCTTCCTTCT
为了构建编码C-变异体(SEQ ID NO:6)的基因,使用1 至6号寡核苷酸(表1)。退火的DNA片段含两个重复序列,编码11 个氨基酸与共有序列(Nilsson et al.1990)一致,在谷氨酰胺 535和赖氨酸712-苯丙氨酸722序列之间插入。此片段也含一个5′ 端的BclⅠ位点及一个3′端SalⅠ位点,以允许与上述相同的克隆策略。 所得的质粒命名为pS259 。
为构建变异体N(非-N-糖基化的变异体,SEQ ID NO:7), 合成了两个PCR引物(PCR-3和PCR-4,表1)。产生EcoRⅠ和BamHⅠ 位点,以使360bp的PCR产物克隆进pUC19中进行序列分析。将潜在N- 连接的糖基化位点,在天冬酰胺187,变成谷氨酰胺。分离作为BalⅠ- HindⅢ片段的修饰的序列然后与含mNT-1启动子和5′端BSSL cDNA 的SacⅠ和BalⅠ片段一起克隆进SacⅠ和HindⅢ消化过的pUC19,一个约 1.2kb的SacⅠ-DraⅢ片段由此质粒分离到,然后分别插入到在表达载 体之内的mMT-1元件和BSSL cDNA序列中。所得的质粒命名为pS299。 1.1.3.哺乳动物细胞培养和转染
根据磷酸沉淀法(Graham&Van der Eb,1973)将载体 共转染进鼠细胞系C127(ATCC CRL 1616)。
在补充10%胎牛血清的Ham′s F12-Dulbecco′s Modified Eagle′s培养基(DMEM)(1∶1)中培养C127细胞。用1.5mg×ml-1 的G418筛选新霉素抗性细胞克隆,10-15天后,抗性细胞克隆从 主平皿中分离,传代,用于分析。 1.1.4细菌菌株和培养条件
为了表达实验将载体pGEMEX/BSSL转化到大肠杆菌菌株JM109 (DE3)和BL21(DE3)pLysS中。表达实验按Studier等人(1986) 的描述进行。收集细菌后,通过离心(4℃,5,000xg 10分钟,) 沉淀细胞。为制备周质和胞质部分,将沉淀重悬于每克沉淀4ml 20mM Tris-C1/20%蔗糖,pH8.0,200μl 0.1M EDTA及40μl的溶菌酶(15mg/每ml水)中。重悬液置上40 分钟。每克沉淀物加160μl 0.5M MgCl2,此后在12000xg,离心 悬液20分钟,产生的上清液含周质蛋白质,沉淀物代表细胞质部分。 另外,为制备可溶性蛋白质,将细胞悬于40mM Tris-Cl,0.1mM EDTA,0.5mM(苯基甲基磺酰氟化物pH8.2),冻融和声处理几次使 其溶解。离心细胞溶解液(25℃,30,000xg 30分钟)。 1.1.5.核酸分析
从分离的哺乳动物细胞系或大肠杆菌细胞(Ausubel et al, 1992)制备RNA和DNA。在琼脂糖凝胶中使RNA或DNA分离,转印到 GeneScreen Plus(New England Nuclear)上,按供应商的说明 杂交。 1.1.6.天然酶的制备
按前述的方法(Blckberg&Hernell,1981)从人乳中纯化 胆盐刺激的脂酶。纯化的制品经SDS-PAGE判断同源性,当用长链 三脂酰甘油为底物检测时,比活性为每分钟,每mg释放100μmol脂肪 酸。 1.1.7酶分析
使用阿拉伯树胶乳化的三油酸甘油酯为底物,按所述的方法 (Blckberg&Hernell,1981)进行酶检测。用10mM胆酸钠为 激活的胆盐,进行培养。当检测胆盐依赖性时,加入胆盐(胆酸钠或 脱胆酸钠,Sigma Chem.Co)达到表3中所给的浓度。 1.1.8 Western印迹
为了在印迹实验中获得有意义的反应,通过Blue Sepharose (Pharmaci LKB Biotechnology)层析浓缩条件培养基。将各个培 养基和Blue Sepharose(每ml凝胶约10ml培养基)混合。用含0.1M KCl的0.5M Tris-Cl缓冲液,pH7.4洗涤凝胶(每ml胶10ml)。 酶活性用同一缓冲液的1.5M KCl洗脱。用此方法浓缩了25-30 倍,纯化了3-5倍。按Laemmli(1970)方法,必要地在10%聚 丙烯酰胺凝胶上进行SDS-PAGE。转移至硝酸纤维素膜上,与抗纯化 的BSSL的多克隆兔抗血清一起孵育后,用和碱性磷酸酶结合的山羊抗 兔IgG及来自Bio-Rad的发育试剂盒进行测定结果。 1.1.9用N-糖苷酶F处理
加1μl 1M的β-巯基乙醇和0.5μl 10%(w/v)的 SDS到含BSSL活性为每分钟释放2.5μmol脂肪酸的10μl变异体B中。 煮沸5分钟后,加入10μl 0.1M磷酸钠缓冲液pH8.0,6μl 0.1M EDTA,4μl 7.5%(w/v)Nonidet P40和5μl(IU) N-糖苷酶F(Boechringer Mannheim)。作为对照,处理了同等 量的变异体B,除无糖苷酶加入外。在37℃温育过夜后样品经SDS -PAGE电泳,并使用多克隆兔BSSL抗血清进行印迹。 1.2.结果 1.2.1构建BSSL变异体
在表2和图1中概括了关于全长BSSL,BSSL变异体的修饰。用于 产生这些变异体的策略在1.1.部分描述了。对变异体A(SEQ ID NO:4)而言,终止密码引入到谷氨酰胺535位置后,去除了全长蛋 白质的最后187个氨基酸。对变异体B(SEQ ID NO:5)而言, 编码正巧11个氨基酸的区域和原始翻译终止子与谷氨酰胺-535融 合,因此,这种变异体缺乏所有的重复序列。对变异体C(SEQ ID NO:6)而言,含两个重复序列的片段,插入到谷氨酰胺-535和赖 氨酸-712至苯丙氢酸722序列之间。所述重复序列含有与共有序列 (Nilsson et al,1990)相同的序列。
为了分析唯一不明确的N-连接的水化合物结构(其位置接近 活性位点丝氨酸-194)的重要性构建变异体。通过将天冬酰胺-187 变成谷氨酰胺而改变潜在的N-糖基化位点获得变异体N(SEQ ID NO:7)。 表2
和人类BSSL相关的BSSL变异体的氨基酸序列     变异体     缺失的残基     变化的残基 A(SEQ ID NO:4)     536-722 B(SEQ ID NO:5)     536-711 C(SEQ ID NO:6)  536-568,591-711 N(SEQ ID NO:7)   Asn 187→Gln 1.2.2哺乳动物细胞系重组DNA的特征描述
重组DNA样品从用编码不同BSSL变异体的表达载体转染的细胞系 中制备。制备的DNA用BamHⅠ消化,在琼脂糖凝胶上分开,并转移至杂 交膜上。使用的探针是32P标记的BSSL cDNA。杂交结果证实了重组 基因的存在,而且载体拷贝数在不同的细胞系大约相等(图2)。杂 交片段的位置反映了各种BSSL序列的长度并与期望大小一致。位置也 类似于起源于细菌的用于转染实验的DNA,表明在细胞系中没有主要 的载体DNA的重排(图2)。代表变异体A的DNA一样品中上边的杂交 信号可能归因于部分消化。 1.2.3在哺乳动物细胞中全长和突变BSSL mRNA的表达
为分析不同重组BSSL基因的表达,从分离的细胞系中制备了mRNA 。 Northern印迹实验和用32P-标记的BSSL cDNA杂交实验表明,在含 有BSSL载体(图3)的所有细胞系中都可检测到重组mRNA。在对照样 品中没有杂交,所述对照样品得自含除BSSL cDNA外的相同载体的细 胞系(图3)。
杂交mRNA的不同长度与cDNAs的修饰一致。在不同样品中重组BSSL mRNA变异体的稳定状态水平除了变异体A(图3)外,几乎是相同的。 变异体A mRNA积累降低的原因尚未知晓,但观察到两个细胞系群及 分离的克隆。在不同样品中等量RNA的存在,通过用鼠β-actin探针 (图3,较低组)杂交证实 1.2.4生产哺乳动物全长和BSSL变异体
收集了源于单个克隆的用全长BSSL及其不同突变形式转染的C127 -细胞培养基并分析BSSL的活性(图4)。对于全长分子和变异体N、 B和C,最高表达克隆的活性范围是每分钟每毫升培养基释放0.7- 2.3μmol脂肪酸。和天然人乳中BSSL的比活性比较,此表达水平为每 毫升培养基7-23μg。对变异体A而言,所有分析的克隆其活性 低于每分钟每毫升培养基释放0.05μmol脂肪酸。在Blue-Sepharose 柱上浓缩和冷冻干燥显示最高活性的克隆,表明的确表达了有活性的 酶,尽管表达水平较低不能排除。通过相当低比活性解释以变异体A 部分获得的低活性可能性。
源于不同转染实验克隆的Western印迹显示于图5A。BSSL变异 体明显的Mr正如所望。但是应注意到,对全长BSSL及变异体B和C 而言,出现了双条带。因为所有这三个都有单一完整的N-糖基化位 点,而没出现双条带的变异体N缺少N-糖基化位点,所以可能解释 为,双条带产生于N-糖基化的差别。因此变异体B应该用N-糖苷 酶F消化。如图5B所示,上面的带只保留痕量,而下面的带强度增 加,表明只有部分表达的变异体N-糖基化了。
BSSL的特性之一是其可通过初级胆盐,如胆酸盐(Hernell, 1975)将异性活化。所有不同重组形式的BSSL证明了胆酸盐活化的相 同浓度依赖性(图6)。在使用的实验体系中约10mM获得了最大活 性。当将胆酸盐换成脱氧胆酸盐(次级胆盐),无此活化产生。因此, 重组全长及不同的变异体证明了胆盐活化的同一特异性。 1.2.5.大肠杆菌中全长BSSL的表达及生化特性
用含位于T7启动子控制下的人BSSL cDNA的表达载体pGEMEX/ BSSL转化两个大肠杆菌菌株JM109(DE3)和BL21(DE3)pLysS (Studier et al.,1986)。鉴别来自于两个菌株的转化体,将其 培养并用IPTG诱导约90分钟(Studier et al.,1986)。通过使 用BSSL cDNA为32P标记的探针,经Northern印迹分析总mRNA表明, 两个菌株中均有效地诱导了表达而且转录受到密切调节(图7A)。 明显的重组BSSL mRNA的大小约2.4kb,和期望长度一致。蛋白质样 品的SDS-PAGE分离及用抗BSSL抗体免疫测定表明在大肠杆菌中有 效地产生了全长BSSL(图7B)。BL21(DE3)pLysS菌株比 JM109(DE)(图7B)菌株有更多的蛋白质被分泌到周质。
IPTG诱导的大肠杆菌培养基含相当于0.5-4μg蛋白质/ml培养 基的活性可溶的BSSL。Western印迹证明20-60%的反应物在不 溶的沉淀物中。未诱导的细菌不包含任何明显的BSSL活性。
来自培养细菌的脂酶活性表明和天然乳中BSSL有同样的胆盐依赖 性。 2.重组全长和突变的胆盐刺激脂酶的纯化及特征描述 2.1.实验方法 2.1.1.酶和酶变异体
如上所述构建和表达了重组全长BSSL和BSSL变异体B、C和N。 和天然的酶比较,变异体B(SEQ ID NO:5)缺少所有16个独 一无二的,O-糖基化的,富含脯氨酸、C-未端重复序列(aa 536 -711),但含有大部分的融合于谷氨酰胺-535的C-未端片段(aa 712-722)。变异体C(SEQ ID NO:6)含同样的C-未端片 段和在谷氨酰胺-535与赖氨酸-712之间的两个11个残基的重复单 位。在变异体N(非-N-糖基化变异体,SEQ ID NO:7),负 责唯一连接糖的天冬酰胺-187换成了谷氨酰胺残基。天然BSSL从人 乳中按所述方法纯化(Blckberg&Hernell,1981)。 2.1.2.酶分析    
用阿拉伯乳化的三油酸甘油酯为底物,如所述(Blckberg& Hernell,1981)测定了脂酶活性,用胆酸钠(10mM)为活化胆盐。 此测定的不同变化在附图说明中给出。 2.1.3. 制备免疫吸附
按制造者的描述用CMBr,使纯化的乳BSSL(5mg)结合到Sepharose 上。抗纯化的乳BSSL兔产生的多克隆抗血清40ml通过此柱。用0.1M 甘氨酸-HCl pH2.5洗脱特异抗体。用固态Tris使pH立即调至8 左右。脱盐和冻干后,将6mg亲和纯化抗体与上述Sepharose结合。 2.1.4.纯化方法
含5-25μg重组表达BSSL或BSSL变异体的条件培养基,以每ml 配好凝胶10ml培养基与Blue Sepharose混合(Pharmacia,Swedan)。 彻底混合30分钟后,用0.05M Tris-Cl pH7.0,0.05M KCl流洗凝胶;脂酶活性用0.05M Tris-Cl,pH7.0,1.5M KCl洗脱。收集活性峰,对5mM佛多那钠,pH7.4,0.05M NaCl透 析。透析液用于肝素-Sepharose柱。此柱用在5mM佛多那钠缓冲液, pH7.4中的梯度0.05-1.0M NaCl洗脱。收集含脂酶活性的组分, 用于免疫吸附柱,用0.05M Tris-Cl pH7.5,0.15M NaCl流洗后,0.1M甘氨酸-HCl、pH2.5洗脱结合的脂酶。用固态Tris 使组分的pH立即调到8左右。 2.1.5.电泳
基本根据Laemmli(1970)方法,进行了十二烷基硫酸钠聚丙烯 酰胺凝胶电泳(SDS-PAGE)蛋白质用考斯亮蓝染色。 2.1.6.N-未端序列分析
在Applied Biosystems公司的477A脉冲液相测序仪及带有来于 制造商的规范循环程序和化学品的连网苯硫乙内酰脲120A分析仪上进 行氨基酸序列分析。从测得的标准蛋白质序列(β-乳球蛋白)计算, 最初及重复产量分别为47%和97%。 2.2.结果 2.2.1.重组BSSL和BSSL变异体的纯化
主要用在Blue Sepharose柱上层析条件培养基作为浓缩步骤。 接着在肝素-Sepharose柱上层析主要是去除培养基中存在的大部分 白蛋白得到初步纯化。此步骤也说明,重组BSSL分子都具有肝素结合 能力。免疫吸附后,所有BSSL变异体,象经SDS-PAGE(图8)制定 的那样,纯度超过90%。全长酶及变异体B和C作为成对物迁移。 不同变异体的表观Mr列于表3。N-未端序列分析对所有8个循环 的变异体测出了一个单一顺序:Ala-Lys-Leu-Gly-Ala-Val-Tyr -Thr-。 2.2.2.脂酶活性
表3显示了不同制品的表观分子量。制品的比活性范围是每分钟 每毫克蛋白质释放游离脂肪酸75-120μmol。因此没有观察到全长 BSSL和BSSL变异体间活性的显著差别。
所有制品说明绝对需要对抗长链三脂酰甘油的初级胆汁盐(胆酸 钠)活性(图9A)。脱氧胆酸钠不能提供任何变异体活性(资料未 列出)。但是,一旦结合不同的胆盐,脱氧胆酸盐就有双重作用(图 9B和C)。首先它降低活化必需的胆酸盐浓度,其次在较高胆盐浓 度下抑制酶的活性。 表3
重组全长BSSL和BSSL变异体的表观Mr  酶      Mr(KDa)      通过SDS-PAGE测定 全长        105,107 变异体B        63,65 变异体C        60,62 变异体N        95 2.2.3.重组BSSL和BSSL变异体的稳定性
重组BSSL和BSSL变异体与天然乳BSSL显示了同样的pH稳定性 (图10)。pH在2.5-3左右所有情况下都有失活发生。pH在 3以上,所有变异体是完全稳定的,提供的蛋白质浓度足够高。这通 过加入小牛血清白蛋白或卵清蛋白达到(资料未列出)在所有测试的 pH,稀释的样品都是不太稳定的,但阈值是一样的(资料未列出)。 图11显示和天然乳酶比较,重组酶的热稳定性。在37-40℃此 活性开始降低。变异体(B、C、N)稳定性比全长重组酶和乳酶略 低。但是,如果蛋白质浓度通过加入小牛血清白蛋白得到提高,所有 变异体在40℃也是稳定的(图11)。
天然乳BSSL和所有重组变异体对胰蛋白酶都敏感。一种依赖时间 的失活获得了(图12)。但是,如果胆盐,即胆酸盐存在于缓冲液 中,脂酶变异体就得到了保护,脂酶活性保留下来(图12)。
因此,鉴于许多体外特征,即胆盐活化、肝素结合、pH和温度 稳定性及对蛋白酶失活的胆盐保护将不同的BSSL变异体与天然乳BSSL 比较,没有发现显著差异。 3.在转基因动物中表达 3.1.表达载体的构建
为了构建在转基因动物乳中生产重组人BSSL变异体的表达载体, 使用了下列策略(图13)。
应用Lidberg等人(1992)叙述的方法,获得了含人BSSL基因不 同部分的质粒(pS309、pS310、pS311)。质粒pS309含一个SphⅠ片段, 此片段包含5′-非转录区至第四内含子的部分序列。质粒pS310含 一个SacⅠ片段,此片段含有一从第一内含子的部分序列至第六内含子 的部分序列的BSSL变异体基因序列。最后质粒pS311含一个BamHⅠ片段, 此片段含BSSL基因的第五内含子的主要部分及缺失第十一外显子的内 含子/外显子结构的其余部分。缺失的序列是231bp,它能产生一个 编码BSSL变异体的序列,此变异体实际上含77个氨基酸或比全长 BSSL少七个重复单位。产生BSSL变异体(变异体T)的核苷酸序列列 于序列表SEQ ID NO:8中。变异体T的氨基酸序列列于序列表 SEQ ID NO:9中。
由于在人BSSL基因第十一外显子有高度的重复序列,在这种序列 克隆进质粒或在细菌中繁殖时,可设想有相当高的重排频度。根据这 种假设,含有截短第十一外显子的所需BSSL变异体基因得到了鉴定、 分离、进行了序列分析。另一个质粒pS283,含部分在HindⅢ和SacⅠ 位点克隆进pUC19的部分人BSSL cDNA,用于基因组序列的融合。质 粒pS283也用于获得合适的限制酶酶切位点,KpnⅠ位于BSSL 5′非翻 译前导序列中。
用NcoⅠ和SacⅠ消化质粒pS283,通过电泳分离到一约2.7kb的片 段。用NcoⅠ和BspEⅠ消化质粒pS309,分离到一包含BSSL基因5′一部 分约2.3kb的片段。用BspEⅠ和SacⅠ消化质粒pS310,分离到一含BSSL 基因中间段部分约2.7kb的片段。这三个片段连接在一起,转化感受 态大肠杆菌菌株TG2,经氨基苄青霉素筛选分离转化体。
从许多转化体制备了质粒,一个含所要构建物的质粒,叫pS312 (图14),用于进一步研究。
为了获得pS311的修饰形式,位于终止密码下游的BamHⅠ位点换成 SalⅠ位点,便于进一步克隆,使用了下列方法:通过BamHⅠ部分消化, 使质粒pS311线性化。分离到线性化的片段,将BamHⅠ换成SalⅠ位点的 合成DNA接头(5′-GATCGTCGAC-3′)插入,破坏了BamHⅠ位点。 由于有两个潜在的用于整合合成接头的位置,所以通过限制酶切割分 折所得的质粒。在11外显子下游理想位置插入接头的质粒得到分离, 命名为pS313。
为了获得含有人BSSL变异体基因组序列的最终表达载体构建体, 使用现有的表达载体pS314,设计它来调节泌乳期乳腺细胞的阶段和 组织特异性表达。质粒pS314含一个克隆为NotⅠ片段的鼠乳清酸性蛋 白(WAP)基因(Campbell et al.1984)的基因组片段。
基因组片段含约4.5kb的上游调节序列(URS),所有四个鼠WAP 外显子及所有内含子序列、约3kb的最后外显子的下游序列。独一无 二的KpnⅠ位点位于天然WAP翻译起始密码上游第一个外显子24bp内。 另一个独一无二的限制酶位点位于第三外显子内SalⅠ位点。
人BSSL变异体基因组序列用下列方法插入到KpnⅠ和SalⅠ位点间, 第一,用KpnⅠ和SalⅠ消化pS314,电泳分离代表裂解质粒的片段,第 二,用KpnⅠ和BamHⅠ消化pS312一个约4.7kb,代表BSSL基因5′部分 的片段得到分离。第三,用BamHⅠ和SalⅠ消化pS313,分离到人BSSL基 因的3′一部分。这三个片段连接起来,转化感受态大肠杆菌,经氨 基苄青霉素选择后分离转化体。
质粒从几个转化体中得到制备,通过限制酶图谱和序列分析仔细 分析。确定了代表所需的表达载体的一个质粒,命名为pS317(图15)。
为了移去原核质粒序列,用NotⅠ消化pS317。此后,含人BSSL变 异体基因组片段和侧翼的鼠WAP序列的重组载体因子经琼脂糖电泳分 离。分离的片段在注进鼠胚胎之前进一步经电洗脱纯化。
在转基因鼠乳中表达人BSSL变异体的重组基因显示于图16。 3.2.转基因动物的产生
按照3.1.部分从质粒pS317分离一个NotⅠ片段。此DNA片段含 连接到编码人BSSL变异体基因组序列的鼠WAP启动子。这种分离片段 以3ng/μl的浓度,将其注射进从供体小鼠获取的350C5781/6J ×CBA/2J-f2胚胎的原核中,供体小鼠预先用5IU怀孕母马牛清 用于排卵过速的促性腺激素处理。C57B1/6J×CBA/2J-f1 动物从Bomholtgard Breeding和Research Center LTD,Ry, Denmark获得。从输卵管采集胚胎后,用M2培养基(Hogan et al.1986)中的透明质酸酶处理,从丘细胞分离胚胎。清洗后,将胚 胎转至M15培养基(Hogan et al,1986),保存在5%CO2孵 箱中。使用液压微操作器和带有Nomarski镜片的Nikon倒置显微镜, 在轻石蜡油下的M2微粒中进行注射。注射后,267个看上去健康的 胚胎埋植进12个假孕的,经腹膜内注射0.3个ml,2.5%Avertin C57B1/6J×CBA/2J-f1受体中。从动物生后三周获得的尾尸 检标本DNA,经PCR分析,识别整合转基因的小鼠。用Southern Blot 分析证实了阳性结果。
为收集乳,雌性泌乳期动物用2IU催产素经腹膜内注射,十分钟 后用0.40ml,2.5%的Avertin腹膜内麻醉。集乳器通过一个化过的 管附在乳头上,通过轻轻按摩哺乳动物腺体,将乳收集到一个1.5ml的 Eppendorf管中。乳量随泌乳天数改变,每个小鼠及每次收集在0.1和 0.5ml之间。 3.3.转基因小鼠中BSSL变异体的表达
通过剪尾样本制备的DNA分析鉴别转基因鼠。组织样品与蛋白酶 K温育,经酚/氯仿抽提。如存在代表表达载体片段的异源引入的DNA 扩增特异的片段的带引物的聚合酶链反应中使用分离的DNA。用DNA杂 交实验分析动物以证实PCR数据并检测可能的重排,整合载体元件的 结构并得到有关整合载体元件拷贝数的资料。
在一套实验中,用两种方法分析了31只小鼠,结果表明,一只 鼠带有pS317的异源DNA载体元件。PCR分析和杂交实验的结果一致 (图17)。
总共65个测试动物,有10个是pS317转基因的。
将鉴定带有载体DNA元件(建立者动物)的小鼠配对,F1动物 用同样的方法进行转基因分析。
通过琼脂糖福尔马林凝胶电泳分离在泌乳期从pS317转基因雌性 动物不同组织中分离的RNA,然后转至滤纸上,以32P-标记的BSSL cDNA为探针杂交。获得的结果证明,在泌乳期表达在乳腺表达受限制 (图18)。
从麻醉的用催产素处理诱导泌乳的建立者动物收集乳样品,分析 重组BSSL变异体的存在。此是通过SDS-PAGE电泳,转移至硝酸纤维 素膜,及与产生的抗天然人BSSL的多克隆抗体孵育实现。
获得的结果证实了转基因小鼠乳中重组人BSSL变异体的表达。图 19证实了转基因小鼠乳中重组BSSL变异体的存在。SDS-PAGE分离 及源于不同pS317转基因小鼠的乳样品免疫印迹分析显示,和全长源 于转基因pS314的小鼠乳中重组BSSL比较,带有还原性表观分子量的 重组BSSL产量高。质粒pS314类似pS317,不同的是,pS314含全长人 BSSL cDNA,不含基因组变异体。出现在所有鼠乳样品中的双带代表 鼠BSSL,并因此显出抗血清的交叉反应。出现在图19的第9泳道明 显的双带(包含纯化的鼠BSSL)的观察进一步支持这个结论。
稳定的转基因动物系产生了。
用相似的方法,也可制备能表达人BSSL变异体的其它转基因动物, 如兔、奶牛绵羊。 保藏
根据布达佩斯条约在DSM(Deutsche Sammlung von Mikroorganismen und Zellkulturen)保藏了下列质粒  质粒     保藏号      保藏日  pS309  pS310  pS311  pS317     DSM 7101     DSM 7102     DSM 7103     DSM 7104     1992.6.12  pS147  pS257  pS299     DSM 7495     DSM 7496     DSM 7497     1993.2.26  pS258  pS259     DSM 7501     DSM 7502     1993.3.3
附图概述 图1 A.用于表达不同BSSL变异体的BPV为基本载体的图谱。 B.分析不同BSSL变异体的图例说明。FL表示全长BSSL。活性位点 用圆圈表示,潜在的N-连接的碳水化合物位点用三形表示。含重 复序列的区域用条线区表示,保守的C-未端用涂满黑色区表示。 图2
源于表达BSSL变异体细胞系的DNA的Southern印迹分析。分析了 从表达全长BSSL(FL)、变异体A(A)、变异体B(B)、变异 体C(C)和变异体N(N)制备的DNA。用BamHⅠ消化5μg各自制 备的细胞DNA(左)及1ng纯化的细菌载体DNA(右)。 DNA样品在 琼脂糖凝胶上分离,转移至GeneScreen Plus膜上,与32P-标记的 人BSSL cDNA杂交。 图3
从表达BSSL变异体的细胞系分离的RNA的Northern印迹分析。分 析了从生产全长BSSL(FL)、变异体A(A)、变异体B(B)、 变异体C(C)、变异体N(N)的细胞系制备的10μg总RNA。用 来自C127细胞系的RNA作负对照(-)(上边组)所述细胞系含有与 图1中载体相同的BPV-载体,除了编码一个与BSSL不相干的蛋白质 外,用32P-标记的BSSL cDNA与滤膜杂交。用鼠β-肌动蛋白cDNA 为探针,与滤膜再次杂交。B-肌动蛋白mRNA信号(下边组)用作上 样到每一泳道mRNA量的内标对照。 图4
在用全长和突变形式的人BSSL转染的C127细胞中BSSL的表达活 性。C127细胞用不同的BSSL构建体转染:全长BSSL(FL)、变异 体N(N)、变异体C(C)、变异体B(B)、变异体A(A)。 起始生长期后,筛选个别克隆,使之成长至汇合。筛选的克隆(n) 数表示在图中。在条件培养基上确定脂酶活性。其数值用每ml条件培 养基每分钟释放的游离脂肪酸的μmol表示。 图5 A.全长和突变的重组BSSL的Western印迹分析。脂酶活性的量表示 为,每分钟释放脂肪酸的μmol,用于凝胶是,全长0.2(泳道1)、 变异体N0.16(泳道2)、变异体C0.6(泳道3)、变异体B0.8 (泳道4)及天然BSSL0.1(泳道5)。所用的抗血清是在抗从人乳 纯化的BSSL的兔中产生的。分子大小标记(Prestained SDS-PAGE Standard,Low Range,BioRad)标在左边。 B.N-糖苷酶F处理的变异体B的Western印迹。用实验方法所述 的N-糖苷酶F消化变异体B。泳道1是未处理的,泳道2是处理的 变异体B。 图6
全长及突变BSSL的胆盐依赖性。在改变浓度的胆酸钠(实线)或 脱氧胆酸钠(断线)存在的情况下,在来自全长重组BSSL(*)、变 异体A(□)、变异体B(▲)变异体C(■)、变异体N (●)及纯化的人乳BSSL(○)的条件培养基上确定脂酶活性。对A 变异体而言,按实验方法所述,在Blue Sepharose上浓缩条件培养 基。除了最大活性只有其它酶的1/10变异体A外,选择各来源的 酶量以获得同样的最大活性水平。对照实验表明生长培养基不影响活 性水平或天然BSSL的胆盐依赖性(数据未列出)。 图7 A.使用pGEMEX通过不同的大肠杆菌菌株产生的BSSL Northern印迹。 细菌用实验方法中所述的IPTG进行诱导。
实验条件见图2所示。泳道1,菌株BL21(DE3)pLysS, 未诱导的;泳道2,菌株BL21(DE3)pLysS,诱导的;泳道3, 菌株JM109(DE3),未诱导的;泳道4,菌株JM109(DE3), 诱导的。 B.使用抗纯化的乳BSSL的抗体8-18%SDS-PAGE Western印迹 表明,使用pGEMEX在不同大肠杆菌菌株中重组BSSL的表达。用IPTG诱 导细菌,按实验方法所述从裂解液制备细胞质和周质蛋白质。上样至 泳道2-5(周质制品)和7-10(胞质制品)的细菌蛋白质量代 表了使菌株和生产水平成比例的相同培养量。泳道1,Pharmacia分 子大小标记;泳道2和8,菌株JM109(DE3),诱导的:泳道3 和7,菌株JM109(DE3),未诱导的;泳道4和10,菌株BL21 (DE3)pLysS,诱导的;泳道5和9,菌株BL21(DE3) pLysS,未诱导的;泳道6,25ng纯化的天然BSSL。 图8
纯化的重组BSSL及BSSL变异体的SDS-PAGE。全长重组BSSL(FL) 和BSSL变异体N、B及C按所述纯化。除了B用1.5μg外,每种用 3μg纯化的天然乳BSSL(NAT)用5μg。分子大小标记的位置在左 边。 图9
通过胆酸钠,脱氧胆酸钠对重组BSSL及BSSL活化的作用。在无 (左边组)或存在5mM(中间组)或10mM(右边组)脱氧胆酸盐的 条件下,用不同浓度的胆酸钠分析了纯化的重组全长BSSL(●)、重 组BSSL变异体B(○)、C(■)和N(▲)、及纯化的天然乳BSSL (□)制品的脂酶活性。 图10
重组BSSL和BSSL变异体在不同pH的稳定性。在37℃,pH2 -8的不同缓冲液中温育天然BSSL、重组全长BSSL及BSSL变异体。所 有缓冲液均含1mg/ml牛血清白蛋白,30分钟后,撤去分装品,分 析脂酶活性,符号的解释见图9的说明。 图11
重组BSSL和BSSL变异体的热稳定性。在50mM Tris-Cl缓冲液pH7.5, 指定的温度下温育纯化的重组全长BSSL,BSSL变异体及天然乳BSSL。一组 牛血清白蛋白(BSA)样品加至1mg/ml。30分钟后撤出样品并分析脂酶活性。 活性表示为在0分钟每份样品的活性百分比,符号的解释见图9的说明。 图12
胆盐对通过胰蛋白酶使重组BSSL及BSSL变异体失活的影响。在 25℃,有(实线)无(断线)10mM胆酸钠存在条件下,将纯化重 组全长BSSL、BSSL变异体及天然乳BSSL(15μl含14μg)加到含 10μg胰蛋白酶(TPCK-胰蛋白酶、Boehringer-Mannheim)60μl, 1.0M Tris-Cl pH7.4的溶液中。在指定时间,撤除测定样品, 分析脂酶活性。数值表示为无胰蛋白酶条件下对照温育中获得值的百 分比。符号解释见图9的说明。 图13
生产质粒pS317的方法,更详细资料见3.1部分 图14
质粒pS312的图示结构。 图15
质粒pS317的图示结构。 图16
表示3.1部分所述WAP第一外显子内人BSSL变异体基因组结构 物理上引入的物理图谱。 图17 A.用于转基因动物鉴定的PCR引物的定位图示。5′-引物位于在 融合上游位置-148bp开始的WAP序列内,所述融合在WAP和BSSL变异 体之间。3′-引物位于编码融合点下游400bp的第一BSSL变异体内 含子中。 B.使用的PCR引物序列 C.琼脂糖凝胶显示潜在建立者动物典型的PCR分析。M:分子量标 记。泳道1:产生于质粒pS317的对照PCR产物。泳道2-13:从潜 在建立者动物制备的DNA进行PCR反应。 图18
从pS317转基因雌性小鼠分离的不同组织制备的RNA Northern印 迹分析。在泌乳第四天分离组织。通过琼脂糖-甲分离分析源于每 一组织的10μg总RNA,转移其至滤膜上,与32P-标记的人BSSL cDNA进行杂交。泳道含Mg:乳腺;Li:肝;Ki:肾;Sp:脾; He:心;Lu:;Sg:唾液腺;Br:脑。RNA的核苷酸大小 在右边标出。 图19
从pS317转基因小鼠、全长cDNA载体pS314转基因小鼠及对照动物 乳的Western印迹。样品经SDS-PAGE分离,转移至Immobilon滤膜上, 用抗天然人BSSL产生的抗血清进行免疫印迹分析。泳道1:分子量标 记;泳道2、3和4:2μl来自3个pS317建立者FO#91F1雌 仔的乳(F1 30、31和33)。泳道5:2μl来自建立者#90 pS317的乳。泳道6、7和8:2μl源于非BSSL转基因动物乳;泳道 9:纯化的鼠BSSL;泳道10:纯化的人天然BSSL。
参考文献 Abouakil,N.,Rogalska,E.,and Lombardo,D.(1989): Biochim.Biophys. Acta 1002,225-230 Atkinson,S.A.,Bryan,M.H.,and Andiersson,G.H.(1981):J.Pediatr.99, 617-624 Ausubel,F.M.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith, J.A.,Struhl,K.(eds.)in:Current Protocols in Molecular Biology(John Wiley & Sons,New York;edition of 1992) Baba,T.,Downs,D.,Jackson,K.W.,Tang,J.and Wang,C.S.(1991): Biochemistry 30,500-510. Bernbck,S.,Blckberg,L.,and Hernell,O.(1990):J.Clin.Invest.85,1221- 1226 Bjrksten,B.,Burman,L.G.,deChateau,P.,Fredrikzon,B.,Gothefors,L.& Hernell,O.(1980):Br.Med.J.201,267-272. Blckberg,L.&Hernell,O.(1981):Eur.J.Biochem 116,221-225. Blckberg,L.and Hernell,O.(1983):FEBS Lett.157,337-341 Campbell,S.M.,Rosen,J.M.,Hennighausen,L.G.,Strech-Jurk,U.and Sippel,A.E.(1984):Nucleic Acid Res.12,8685-8697. Chappell,J.E.,Clandinin,M.T.,Kearney-Volpe,C.,Reichman,B.,and Swyer,P.W.(1986):J.Pediatr.108,439-447 Fontaine,R.,Carter,C.,and Hui,D.(1991): Biochernistry30,7008-1014 Graham,F.L.,and Van der Eb,A.J.(1973):Virology52,456-467 Hamosh,M.,Freed,L.M.,York,CM.,Sturman,J.A.,and Hamosh,P. (1986):Fed.Proc.45,1452 Han,J.H.,Stratowa,C.,and Rutter,W.J.(1987): Biochemistry26,1617-1625 Hennighausen,L.,Ruiz,L.& Wall,R(1990):Current Opinion in Biotechnology1,74-78. Hernell,O.(1975):Eur.J.Clin.Invest.5,267-272 Hernell,O.,Blckberg,L.,and Lindberg,T.in:Textbook of gastroenterology and nutrition in infancy (Lebenthal,E.ed)pp.209-217 (Raven Press,New York 1989) Hernell,O.,Staggers,J.E.and Carey,M.C.(1990):Biochernistry29.2041- 2056 Hernell,O.and Blckberg,L.in:Encyclopedia of human biology (Dulbecco,R.ed.)Vol.3,pp.47-56(Academic Press,San Diego 1991) Hernell,O.,Blckberg,L.,Chen,Q.,Sternby,B.and Nilsson,.(1993):J. Pediatr.Gastroenterol.Nutr.(In press) Hogan,B.,Constantini,F.and Lacy,E.(1986):Manipulating the mouse embryo.A Laboratory Manual.Cold Spring Harbor Laboratory Press. Hui,D.and Kissel,J.A.(1990):Febs Lett.276,131-134. Kyger,E.M.,Wiegand,R.C.,and Lange,L.G.(1989): Biochem.Biophys.Res. Commun.164,1302-1309 Laemmli,U.K.(1970):Nature(London)227,680-685 Lidberg,U.,Nilsson,J.,Strmberg,K.,Stenman,G.,Sahlin,P.,Enerbck, S.G.and Bjursell,G.(1992):Genomics13,630-640 Lusky,M.,and Botchan,M.R.(1984):Cell36,391-401 Nilsson,J.,Blckberg,L.,Carlsson,P.,Enerbck,S.,Hernell,O.and Bjursell,G.(1990):Eur.J.Biochem.192,543-550. Pavlakis,G.N.,and Hamer,D.H.(1983):Proc.Natl.Acad.Sci.USA 80,397- 401 Reue,K.,Zambaux,J.,Wong,H.,Lee,G.,Leete,TH.,Ronk,M.,Shively, J.E.,Sternby,B.,Borgstrm,B.,Ameis,D.and Schotz,M.C.(1991):J.Lipid. Res.32,267-276. Sarver,N.,Byrne,J.C.,and Howell,P.M.(1982):Proc.Natl.Acad.Sci.USA 79,7147-7151 Studier,F.W.and Moffat,B.A.(1986):J.Mol.Biol.189,113-130 Williamson,S.,Finucane,E.,Ellis,H.,and Gamsu,H.R.(1978):Arch.Dis. Childhood53,555-563
序列表 (1)一般资料:    
(ⅰ)申请人:
  (A)名字:AB ASTRA
  (B)街道:Kvarnbergagatan 16
  (C)市:  Sodertalje
  (E)国家:Sweden
  (F)邮编(ZIP):S-151 85
  (G)电话:+46-8-553 260 00
  (H)电传:+46-8-553 288 20
  (I)电挂:19237 astra s
(ⅱ)发明题目:新多肽
(ⅲ)序列数:9
(ⅳ)计算机可读形式:
  (A)介质类型:软盘
  (B)计算机:IBM PC可容机
  (C)操作系统:PC-DOS/MS-DOS
  (D)软件:PatentIn Release#1.0,Version#1.25(EPO)
(ⅵ)在先申请资料:
  (A)申请号:SE 9300686-4
  (B)申请日:1993.3.1
(ⅵ)在先申请资料:
  (A)申请号:SE9300722-7
  (B)申请日:1993.3.4 (2)SEQ ID NO:1的资料:
(ⅰ)序列特征:
  (A)长度:2428bp
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:线性
(ⅱ)分子类型:cDNA到mRNA
(ⅲ)假设:无
(ⅲ)反义:无
(ⅵ)来源:
  (A)有机体:Homo sapiens
  (F)组织类型:乳腺
(ⅸ)特征:
  (A)名称/关键词:CDS
  (B)位置:82..2319
  (D)其它资料:/产物=“胆盐刺激的脂酶”
(ⅸ)特征:
  (A)名称/关键词:外显子
  (B)位置:985..1173
(ⅸ)特征:
  (A)名称/关键词:外显子
  (B)位置:1174..1377
(ⅸ)特征:
  (A)名称/关键词:外显子
  (B)位置:1378..1575
(ⅸ)特征:
  (A)名称/关键词:外显子
  (B)位置:1576..2415
(ⅸ)特征:
  (A)名称/关键词:mat_肽
  (B)位置:151..2316
(ⅸ)特征:
  (A)名称/关键词:polyA_信号
  (B)位置:2397..2402
(ⅸ)特征:
  (A)名称/关键词:重复_区域
  (B)位置:1756..2283
(ⅸ)特征:
  (A)名称/关键词:5′UTR
  (B)位置:1..81
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1756..1788
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1789..1821
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1822..1854
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1855..1887
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1888..1920
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1921..1953
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1954..1986
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1987..2019
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2020..2052
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2053..2085
(ⅸ)特征:
  (A)名称/关键调:重复_单位
  (B)位置:2086..2118
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2119..2151
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2152..2184
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2185..2217
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2218..2250
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位量:2251..2283
(ⅹⅰ)序列描述:SEQ ID NO:1: ACCTTCTGTA TCAGTTAAGT GTCAAGATGG AAGGAACAGC AGTCTCAAGA TAATGCAAAG    60 AGTTTATTCA TCCAGAGGCT G ATG CTC ACC ATG GGG CGC CTG CAA CTG GTT     111
                    Met Leu Thr Met Gly Arg Leu Gln Leu Val
                    -23         -20                 -15 GTG TTG GGC CTC ACC TGC TGC TGG GCA GTG GCG AGT GCC GCG AAG CTG     159 Val Leu Gly Leu Thr Cys Cys Trp Ala Val Ala Ser Ala Ala Lys Leu
        -10                  -5               1 GGC GCC GTG TAC ACA GAA GGT GGG TTC GTG GAA GGC GTC AAT AAG AAG     207 Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val Asn Lys Lys
  5                  10                  15 CTC GGC CTC CTG GGT GAC TCT GTG GAC ATC TTC AAG GGC ATC CCC TTC      255 Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly Ile Pro Phe  20                  25                  30                  35 GCA GCT CCC ACC AAG GCC CTG GAA AAT CCT CAG CCA CAT CCT GGC TGG      303 Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His Pro Gly Trp
             40                  45                  50 CAA GGG ACC CTG AAG GCC AAG AAC TTC AAG AAG AGA TGC CTG CAG GCC      351 Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys Leu Gln Ala
         55                  60                  65 ACC ATC ACC CAG GAC AGC ACC TAC GGG GAT GAA GAC TGC CTG TAC CTC      399 Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys Leu Tyr Leu
     70                  75                  80 AAC ATT TGG GTG CCC CAG GGC AGG AAG CAA GTC TCC CGG GAC CTG CCC     447 Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg Asp Leu Pro
 85                  90                  95 GTT ATG ATC TGG ATC TAT GGA GGC GCC TTC CTC ATG GGG TCC GGC CAT     495 Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly Ser Gly His 100                 105                 110                 115 GGG GCC AAC TTC CTC AAC AAC TAC CTG TAT GAC GGC GAG GAG ATC GCC     543 Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu Glu Ile Ala
            120                 125                 130 ACA CGC GGA AAC GTC ATC GTG GTC ACC TTC AAC TAC CGT GTC GGC CCC     591 Thr Arg Gly Asn Val Ile Val Val Thr phe Asn Tyr Arg Val Gly Pro
        135                 140                 145 CTT GGG TTC CTC AGC ACT GGG GAC GCC AAT CTG CCA GGT AAC TAT GGC     639 Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly Asn Tyr Gly
    150                 155                 160 CTT CGG GAT CAG CAC ATG GCC ATT GCT TGG GTG AAG AGG AAT ATC GCG     687 Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg Asn Ile Ala
165                 170                 175 GCC TTC GGG GGG GAC CCC AAC AAC ATC ACG CTC TTC GGG GAG TCT GCT     735 Ala Phe Gly Gly Asp Pro Asn Asn Ile Thr Leu Phe Gly Glu Ser Ala 180                 185                 190                 195 GGA GGT GCC AGC GTC TCT CTG CAG ACC CTC TCC CCC TAC AAC AAG GGC     783 Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr Asn Lys Gly
            200                 205                 210 CTC ATC CGG CGA GCC ATC AGC CAG AGC GGC GTG GCC CTG AGT CCC TGG     831 Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu Ser Pro Trp
        215                 220                 225 GTC ATC CAG AAA AAC CCA CTC TTC TGG GCC AAA AAG GTG GCT GAG AAG     879 Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val Ala Glu Lys
    230                 235                 240 GTG GGT TGC CCT GTG GGT GAT GCC GCC AGG ATG GCC CAG TGT CTG AAG     927 Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln Cys Leu Lys
245                 250                 255 GTT ACT GAT CCC CGA GCC CTG ACG CTG GCC TAT AAG GTG CCG CTG GCA     975 Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val Pro Leu Ala 260                 265                 270                 275 GGC CTG GAG TAC CCC ATG CTG CAC TAT GTG GGC TTC GTC CCT GTC ATT    1023 Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val Pro Val Ile
            280                 285                 290 GAT GGA GAC TTC ATC CCC GCT GAC CCG ATC AAC CTG TAC GCC AAC GCC    1071 Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr Ala Asn Ala
        295                 300                 305 GCC GAC ATC GAC TAT ATA GCA GGC ACC AAC AAC ATG GAC GGC CAC ATC    1119 Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp Gly His Ile
    310                 315                 320 TTC GCC AGC ATC GAC ATG CCT GCC ATC AAC AAG GGC AAC AAG AAA GTC    1167 Phe Ala Ser Ile Asp Met Pro Ala Ile Asn Lys Gly Asn Lys Lys Val
325                 330                 335 ACG GAG GAG GAC TTC TAC AAG CTG GTC AGT GAG TTC ACA ATC ACC AAG    1215 Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr Ile Thr Lys 340                 345                 350                 355 GGG CTC AGA GGC GCC AAG ACG ACC TTT GAT GTC TAC ACC GAG TCC TGG    1263 Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr Glu Ser Trp
            360                 365                 370 GCC CAG GAC CCA TCC CAG GAG AAT AAG AAG AAG ACT GTG GTG GAC TTT    1311 Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val Val Asp Phe
        375                 380                 385 GAG ACC GAT GTC CTC TTC CTG GTG CCC ACC GAG ATT GCC CTA GCC CAG    1359 Glu Thr Asp Val Leu Phe Leu Val Pro Thr Glu Ile Ala Leu Ala Gln
    390                 395                 400 CAC AGA GCC AAT GCC AAG AGT GCC AAG ACC TAC GCC TAC CTG TTT TCC    1407 His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr Leu Phe Ser
405                 410                 415 CAT CCC TCT CGG ATG CCC GTC TAC CCC AAA TGG GTG GGG GCC GAC CAT    1455 His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly Ala Asp His 420                 425                 430                 435 GCA GAT GAC ATT CAG TAC GTT TTC GGG AAG CCC TTC GCC ACC CCC ACG    1503 Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala Thr Pro Thr
            440                 445                 450 GGC TAC CGG CCC CAA GAC AGG ACA GTC TCT AAG GCC ATG ATC GCC TAC    1551 Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met Ile Ala Tyr
        455                 460                 465 TGG ACC AAC TTT GCC AAA ACA GGG GAC CCC AAC ATG GGC GAC TCG GCT    1599 Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly Asp Ser Ala
    470                 475                 480 GTG CCC ACA CAC TGG GAA CCC TAC ACT ACG GAA AAC AGC GGC TAC CTG    1647 Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser Gly Tyr Leu
485                 490                 495 GAG ATC ACC AAG AAG ATG GGC AGC AGC TCC ATG AAG CGG AGC CTG AGA    1695 Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg Ser Leu Arg 500                 505                 510                 515 ACC AAC TTC CTG CGC TAC TGG ACC CTC ACC TAT CTG GCG CTG CCC ACA    1743 Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala Leu Pro Thr
            520                 525                 530 GTG ACC GAC CAG GAG GCC ACC CCT GTG CCC CCC ACA GGG GAC TCC GAG    1791 Val Thr Asp Gln Glu Ala Thr Pro Val Pro Pro Thr Gly Asp Ser Glu
        535                 540                 545 GCC ACT CCC GTG CCC CCC ACG GGT GAC TCC GAG ACC GCC CCC GTG CCG    1839 Ala Thr Pro Val Pro Pro Thr Gly Asp Ser Glu Thr Ala Pro Val Pro
    550                 555                 560 CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC TCC    1887 Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser
565                 570                 575 GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG    1935 Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val 580                 585                 590                 595 CCG CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC       1983 Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp
            600                 605                 610 TCC GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC TCC GGG GCC CCC CCC        2031 Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro
        615                 620                 625 GTG CCG CCC ACG GGT GAC TCC GGC GCC CCC CCC GTG CCG CCC ACG GGT        2079 Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly
    630                 635                 640 GAC GCC GGG CCC CCC CCC GTG CCG CCC ACG GGT GAC TCC GGC GCC CCC        2127 Asp Ala Gly Pro Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro
645                 650                 655 CCC GTG CCG CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG ACC CCC ACG        2175 Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Thr Pro Thr 660                 665                 670                 675 GGT GAC TCC GAG ACC GCC CCC GTG CCG CCC ACG GGT GAC TCC GGG GCC        2223 Gly Asp Ser Glu Thr Ala Pro Val Pro Pro Thr Gly Asp Ser Gly Ala
            680                 685                 690 CCC CCT GTG CCC CCC ACG GGT GAC TCT GAG GCT GCC CCT GTG CCC CCC        2271 Pro Pro Val Pro Pro Thr Gly Asp Ser Glu Ala Ala Pro Val Pro Pro
        695                 700                 705 ACA GAT GAC TCC AAG GAA GCT CAG ATG CCT GCA GTC ATT AGG TTT TAGCGTCCCA 2326 Thr Asp Asp Ser Lys Glu Ala Gln Met Pro Ala Val Ile Arg Phe
    710                 715                 720 TGAGCCTTGG TATCAAGAGG CCACAAGAGT GGGACCCCAG GGGCTCCCCT CCCATCTTGA      2386 GCTCTTCCTG AATAAAGCCT CATACCCCTA AAAAAAAAAA AA                         2428 (2)SEQ ID NO:2的资料:
(ⅰ)序列特征:
(A)长度:745个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:SEQ ID NO:2 Met Leu Thr Met Gly Arg Leu Gln Leu Val Val Leu Gly Leu Thr Cys -23         -20                 -15                 -10 Cys Trp Ala Val Ala Ser Ala Ala Lys Leu Gly Ala Val Tyr Thr Glu
    -5                    1               5 Gly Gly Phe Val Glu Gly Val Asn Lys Lys Leu Gly Leu Leu Gly Asp  10                  15                  20                  25 Ser Val Asp Ile Phe Lys Gly Ile Pro Phe Ala Ala Pro Thr Lys Ala
             30                  35                  40 Leu Glu Asn Pro Gln Pro His Pro Gly Trp Gln Gly Thr Leu Lys Ala
         45                  50                  55 Lys Asn Phe Lys Lys Arg Cys Leu Gln Ala Thr Ile Thr Gln Asp Ser
     60                  65                  70 Thr Tyr Gly Asp Glu Asp Cys Leu Tyr Leu Asn Ile Trp Val Pro Gln
 75                  80                  85 Gly Arg Lys Gln Val Ser Arg Asp Leu Pro Val Met Ile Trp Ile Tyr  90                  95                 100                 105 Gly Gly Ala Phe Leu Met Gly Ser Gly His Gly Ala Asn Phe Leu Asn
            110                 115                 120 Asn Tyr Leu Tyr Asp Gly Glu Glu Ile Ala Thr Arg Gly Asn Val Ile
        125                 130                 135 Val Val Thr Phe Asn Tyr Arg Val Gly Pro Leu Gly Phe Leu Ser Thr
    140                 145                 150 Gly Asp Ala Asn Leu Pro Gly Asn Tyr Gly Leu Arg Asp Gln His Met
155                 160                 165 Ala Ile Ala Trp Val Lys Arg Asn Ile Ala Ala Phe Gly Gly Asp Pro 170                 175                 180                 185 Asn Asn Ile Thr Leu Phe Gly Glu Ser Ala Gly Gly Ala Ser Val Ser
            190                 195                 200 Leu Gln Thr Leu Ser Pro Tyr Asn Lys Gly Leu Ile Arg Arg Ala Ile
        205                 210                 215 Ser Gln Ser Gly Val Ala Leu Ser Pro Trp Val Ile Gln Lys Asn Pro
    220                 225                 230 Leu Phe Trp Ala Lys Lys Val Ala Glu Lys Val Gly Cys Pro Val Gly
235                 240                 245 Asp Ala Ala Arg Met Ala Gln Cys Leu Lys Val Thr Asp Pro Arg Ala 250                 255                 260                 265 Leu Thr Leu Ala Tyr Lys Val Pro Leu Ala Gly Leu Glu Tyr Pro Met
            270                 275                 280 Leu His Tyr Val Gly Phe Val Pro Val Ile Asp Gly Asp Phe Ile Pro
        285                 290                 295 Ala Asp Pro Ile Asn Leu Tyr Ala Asn Ala Ala Asp Ile Asp Tyr Ile
    300                 305                 310 Ala Gly Thr Asn Asn Met Asp Gly His Ile Phe Ala Ser Ile Asp Met
315                 320                 325 Pro Ala Ile Asn Lys Gly Asn Lys Lys Val Thr Glu Glu Asp Phe Tyr 330                 335                 340                 345 Lys Leu Val Ser Glu Phe Thr Ile Thr Lys Gly Leu Arg Gly Ala Lys
            350                 355                 360 Thr Thr Phe Asp Val Tyr Thr Glu Ser Trp Ala Gln Asp Pro Ser Gln
        365                 370                 375 Glu Asn Lys Lys Lys Thr Val Val Asp Phe Glu Thr Asp Val Leu Phe
    380                 385                 390 Leu Val Pro Thr Glu Ile Ala Leu Ala Gln His Arg Ala Asn Ala Lys
395                 400                 405 Ser Ala Lys Thr Tyr Ala Tyr Leu Phe Ser His Pro Ser Arg Met Pro 410                 415                 420                 425 Val Tyr Pro Lys Trp Val Gly Ala Asp His Ala Asp Asp Ile Gln Tyr
            430                 435                 440 Val Phe Gly Lys Pro Phe Ala Thr Pro Thr Gly Tyr Arg Pro Gln Asp
        445                 450                 455 Arg Thr Val Ser Lys Ala Met Ile Ala Tyr Trp Thr Asn Phe Ala Lys
    460                 465                 470 Thr Gly Asp Pro Asn Met Gly Asp Ser Ala Val Pro Thr His Trp Glu
475                 480                 485 Pro Tyr Thr Thr Glu Asn Ser Gly Tyr Leu Glu Ile Thr Lys Lys Met  490                 495                 500                 505 Gly Ser Ser Ser Met Lys Arg Ser Leu Arg Thr Asn Phe Leu Arg Tyr
            510                 515                 520 Trp Thr Leu Thr Tyr Leu Ala Leu Pro Thr Val Thr Asp Gln Glu Ala
        525                 530                 535 Thr Pro Val Pro Pro Thr Gly Asp Ser Glu Ala Thr Pro Val Pro Pro
    540                 545                 550 Thr Gly Asp Ser Glu Thr Ala Pro Val Pro Pro Thr Gly Asp Ser Gly
555                 560                 565 Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro 570                 575                 580                 585 Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser
            590                 595                 600 Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val
        605                 610                 615 Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp
    620                 625                 630 Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ala Gly Pro Pro Pro
635                 640                 645 Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly 650                 655                 660                 665 Asp Ser Gly Ala Pro Pro Val Thr Pro Thr Gly Asp Ser Glu Thr Ala
            670                 675                 680 Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr
        685                 690                 695 Gly Asp Ser Glu Ala Ala Pro Val Pro Pro Thr Asp Asp Ser Lys Glu
    700                 705                 710 Ala Gln Met Pro Ala Val Ile Arg Phe
715                 720 (2)SEQ ID NO:3的资料:
(ⅰ)序列特征:
(A)长度:722个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅲ)假设:无
(ⅵ)来源
(A)有机体:Homo sapiens
(F)组织类型:乳腺
(ⅹⅰ)序列描述:SEQ ID NO:3: Ala Lys Leu Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val 1               5                   10                  15 Asn Lys Lys Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly
        20                  25                  30 Ile Pro Phe Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His
    35                  40                  45 Pro Gly Trp Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys
50                  55                  60 Leu Gln Ala Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys 65                  70                  75                  80 Leu Tyr Leu Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg
            85                  90                  95 Asp Leu Pro Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly
        100                 105                 110 Ser Gly His Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu
    115                 120                 125 Glu Ile Ala Thr Arg Cly Asn Val Ile Val Val Thr Phe Asn Tyr Arg
130                 135                 140 Val Gly Pro Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly 145                 150                 155                 160 Asn Tyr Gly Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg
            165                 170                 175 Asn Ile Ala Ala Phe Gly Gly Asp Pro Asn Asn Ile Thr Leu Phe Gly
        180                 185                 190 Glu Ser Ala Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr
    195                 200                 205 Asn Lys Gly Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu
210                 215                 220 Ser Pro Trp Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val 225                 230                 235                 240 Ala Glu Lys Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln
            245                 250                 255 Cys Leu Lys Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val
        260                 265                 270 Pro Leu Ala Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val
    275                 280                 285 Pro Val Ile Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr
290                 295                 300 Ala Asn Ala Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp 305                 310                 315                 320 Gly His Ile Phe Ala Ser Ile Asp Met Pro Ala Ile Asn Lys Gly Asn
            325                 330                 335 Lys Lys Val Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr
        340                 345                 350 Ile Thr Lys Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr
    355                 360                 365 Glu Ser Trp Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val
370                 375                 380 Val Asp Phe Glu Thr Asp Val Leu phe Leu Val Pro Thr Glu Ile Ala 385                 390                 395                 400 Leu Ala Gln His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr
            405                 410                 415 Leu Phe Ser His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly
        420                 425                 430 Ala Asp His Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala
    435                 440                 445 Thr Pro Thr Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met
450                 455                 460 Ile Ala Tyr Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly 465                 470                 475                 480 Asp Ser Ala Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser
            485                 490                 495 Gly Tyr Leu Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg
        500                 505                 510 Ser Leu Arg Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala
    515                 520                 525 Leu Pro Thr Val Thr Asp Gln Glu Ala Thr Pro Val Pro Pro Thr Gly
530                 535                 540 Asp Ser Glu Ala Thr Pro Val Pro Pro Thr Gly Asp Ser Glu Thr Ala 545                 550                 555                 560 Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr
            565                 570                 575 Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala
        580                 585                 590 Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro
    595                 600                 605 Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly
610                 615                 620 Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro 625                 630                 635                 640 Pro Thr Gly Asp Ala Gly Pro Pro Pro Val Pro Pro Thr Gly Asp Ser
            645                 650                 655 Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val
        660                 665                 670 Thr Pro Thr Gly Asp Ser Glu Thr Ala Pro Val Pro Pro Thr Gly Asp
    675                 680                 685 Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Glu Ala Ala Pro
690                 695                 700 Val Pro Pro Thr Asp Asp Ser Lys Glu Ala Gln Met Pro Ala Val Ile 705                 710                 715                 720 Arg Phe (2)SEQ ID NO:4的资料:
(ⅰ)序列特征:
  (A)长度:535个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅲ)假设:无
(ⅵ)来源
  (A)有机体:Homo sapiens
  (F)组织类型:乳腺
(ⅸ)特征:
  (A)名称/关键词:肽
  (B)位置:1..535
  (D)其它资料:/标记=变异体_A
(ⅹⅰ)序列描述:SEQ ID NO:4: Ala Lys Leu Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val 1               5                   10                  15 Asn Lys Lys Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly
        20                  25                  30 Ile Pro Phe Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His
    35                  40                  45 Pro Gly Trp Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys
50                  55                  60 Leu Gln Ala Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys 65                  70                  75                  80 Leu Tyr Leu Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg
            85                  90                  95 Asp Leu Pro Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly
        100                 105                 110 Ser Gly His Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu
    115                 120                 125 Glu Ile Ala Thr Arg Gly Asn Val Ile Val Val Thr Phe Asn Tyr Arg
130                 135                 140 Val Gly Pro Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly 145                 150                 155                 160 Asn Tyr Gly Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg
            165                 170                 175 Asn Ile Ala Ala Phe Gly Gly Asp Pro Asn Asn Ile Thr Leu Phe Gly
        180                 185                 190 Glu Ser Ala Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr
    195                 200                 205 Asn Lys Gly Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu
210                 215                 220 Ser Pro Trp Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val 225                 230                 235                 240 Ala Glu Lys Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln
            245                 250                 255 CyS Leu Lys Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val
        260                 265                 270 Pro Leu Ala Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val
    275                 280                 285 Pro Val Ile Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr
290                 295                 300 Ala Asn Ala Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp 305                 310                 315                 320 Gly His Ile Phe Ala Ser Ile Asp Met Pro Ala Ile Asn Lys Gly Asn
            325                 330                 335 Lys Lys Val Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr
        340                 345                 350 Ile Thr Lys Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr
    355                 360                 365 Glu Ser Trp Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val
370                 375                 380 Val Asp Phe Glu Thr Asp Val Leu Phe Leu Val Pro Thr Glu Ile Ala 385                 390                 395                 400 Leu Ala Gln His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr
            405                 410                 415 Leu Phe Ser His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly
        420                 425                 430 Ala Asp His Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala
    435                 440                 445 Thr Pro Thr Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met
450                 455                 460 Ile Ala Tyr Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly 465                 470                 475                 480 Asp Ser Ala Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser
            485                 490                 495 Gly Tyr Leu Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg
        500                 505                 510 Ser Leu Arg Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala
    515                 520                 525 Leu Pro Thr Val Thr Asp Gln
530                 535 (2)SEQ ID NO:5的资料:
(ⅰ)序列特征:
  (A)长度:546个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅲ)假设:无
(ⅵ)来源
  (A)有机体:Homo sapiens
  (F)组织类型:乳腺
(ⅸ)特征:
  (A)名称/关键词:肽
  (B)位置:1..546
  (D)其它资料:/标记=变异体_B
(ⅹⅰ)序列描述:SEQ ID NO:5: Ala Lys Leu Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val 1               5                   10                  15 Asn Lys Lys Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly
        20                  25                  30 Ile Pro Phe Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His
    35                  40                  45 Pro Gly Trp Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys
50                  55                  60 Leu Gln Ala Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys 65                  70                  75                  80 Leu Tyr Leu Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg
            85                  90                  95 Asp Leu Pro Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly
        100                 105                 110 Ser Gly His Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu
    115                 120                 125 Glu Ile Ala Thr Arg Gly Asn Val Ile Val Val Thr Phe Asn Tyr Arg
130                 135                 140 Val Gly Pro Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly 145                 150                 155                 160 Asn Tyr Gly Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg
            165                 170                 175 Asn Ile Ala Ala Phe Gly Gly Asp Pro Asn Asn Ile Thr Leu Phe Gly
        180                 185                 190 Glu Ser Ala Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr
    195                 200                 205 Asn Lys Gly Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu
210                 215                 220 Ser Pro Trp Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val 225                 230                 235                 240 Ala Glu Lys Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln
            245                 250                 255 Cys Leu Lys Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val
        260                 265                 270 Pro Leu Ala Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val
    275                 280                 285 Pro Val Ile Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr
290                 295                 300 Ala Asn Ala Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp 305                 310                 315                 320 Gly His Ile Phe Ala Ser Ile Asp Met Pro Ala Ile Asn Lys Gly Asn
            325                 330                 335 Lys Lys Val Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr
        340                 345                 350 Ile Thr Lys Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr
    355                 360                 365 Glu Ser Trp Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val
370                 375                 380 Val Asp Phe Glu Thr Asp Val Leu Phe Leu Val Pro Thr Glu Ile Ala 385                 390                 395                 400 Leu Ala Gln His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr
            405                 410                 415 Leu Phe Ser His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly
        420                 425                 430 Ala Asp His Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala
    435                 440                 445 Thr Pro Thr Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met
450                 455                 460 Ile Ala Tyr Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly 465                 470                 475                 480 Asp Ser Ala Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser
            485                 490                 495 Gly Tyr Leu Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg
        500                 505                 510 Ser Leu Arg Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala
    515                 520                 525 Leu Pro Thr Val Thr Asp Gln Lys Glu Ala Gln Met Pro Ala Val Ile
530                 535                 540 Arg Phe 545 (2)SEQ ID NO:6的资料:
(ⅰ)序列特征:
  (A)长度:568个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅲ)假设:无
(ⅵ)来源
  (A)有机体:Homo sapiens
  (F)组织类型:乳腺
(ⅸ)特征:
  (A)名称/关键词:肽
  (B)位置:1..568
  (D)其它资料:/标记=变异体_C
(ⅹⅰ)序列描述:SEQ ID NO:6: Ala Lys Leu Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val 1               5                   10                  15 Asn Lys Lys Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly
        20                  25                  30 Ile Pro Phe Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His
    35                  40                  45 Pro Gly Trp Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys
50                  55                  60 Leu Gln Ala Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys 65                  70                  75                  80 Leu Tyr Leu Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg
            85                  90                  95 Asp Leu Pro Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly
        100                 105                 110 Ser Gly His Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu
    115                 120                 125 Glu Ile Ala Thr Arg Gly Asn Val Ile Val Val Thr Phe Asn Tyr Arg
130                 135                 140 Val Gly Pro Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly 145                 150                 155                 160 Asn Tyr Gly Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg
            165                 170                 175 Asn Ile Ala Ala Phe Gly Gly Asp Pro Asn Asn Ile Thr Leu Phe Gly
        180                 185                 190 Glu Ser Ala Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr
    195                 200                 205 Asn Lys Gly Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu
210                 215                 220 Ser Pro Trp Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val 225                 230                 235                 240 Ala Glu Lys Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln
            245                 250                 255 Cys Leu Lys Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val
        260                 265                 270 Pro Leu Ala Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val
    275                 280                 285 Pro Val Ile Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr
290                 295                 300 Ala Asn Ala Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp 305                 310                 315                 320 Gly His Ile Phe Ala Ser Ile Asp Met Pro Ala Ile Asn Lys Gly Asn
            325                 330                 335 Lys Lys Val Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr
        340                 345                 350 Ile Thr Lys Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr
    355                 360                 365 Glu Ser Trp Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val
370                 375                 380 Val Asp Phe Glu Thr Asp Val Leu Phe Leu Val Pro Thr Glu Ile Ala 385                 390                 395                 400 Leu Ala Gln His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr
            405                 410                 415 Leu Phe Ser His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly
        420                 425                 430 Ala Asp His Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala
    435                 440                 445 Thr Pro Thr Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met
450                 455                 460 Ile Ala Tyr Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly 465                 470                 475                 480 Asp Ser Ala Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser
            485                 490                 495 Gly Tyr Leu Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg
        500                 505                 510 Ser Leu Arg Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala
    515                 520                 525 Leu Pro Thr Val Thr Asp Gln Gly Ala Pro Pro Val Pro Pro Thr Gly
530                 535                 540 Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Lys Glu Ala 545                 550                 555                 560 Gln Met Pro Ala Val Ile Arg Phe
            565 (2)SEQ ID NO:7的资料:
(ⅰ)序列特征:
  (A)长度:722个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅲ)假设:无
(ⅵ)来源
  (A)有机体:Homo sapiens
  (F)组织类型:乳腺
(ⅸ)特征:
  (A)名称/关键词:肽
  (B)位置:1..722
  (D)其它资料:/标记=变异体_N
(ⅹⅰ)序列描述:SEQ ID NO:7: Ala Lys Leu Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val 1               5                   10                  15 Asn Lys Lys Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly
        20                  25                  30 Ile Pro Phe Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His
    35                  40                  45 Pro Gly Trp Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys
50                  55                  60 Leu Gln Ala Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys 65                  70                  75                  80 Leu Tyr Leu Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg
            85                  90                  95 Asp Leu Pro Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly
        100                 105                 110 Ser Gly His Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu
    115                 120                 125 Glu Ile Ala Thr Arg Gly Asn Val Ile Val Val Thr Phe Asn Tyr Arg
130                 135                 140 Val Gly Pro Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly 145                 150                 155                 160 Asn Tyr Gly Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg
            165                 170                 175 Asn Ile Ala Ala Phe Gly Gly Asp Pro Asn Gln Ile Thr Leu Phe Gly
        180                 185                 190 Glu Ser Ala Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr
    195                 200                 205 Asn Lys Gly Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu
210                 215                 220 Ser Pro Trp Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val 225                 230                 235                 240 Ala Glu Lys Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln
            245                 250                 255 Cys Leu Lys Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val
        260                 265                 270 Pro Leu Ala Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val
    275                 280                 285 Pro Val Ile Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr
290                 295                 300 Ala Asn Ala Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp 305                 310                 315                 320 Gly His Ile Phe Ala Set Ile Asp Met Pro Ala Ile Asn Lys Gly Asn
            325                 330                 335 Lys Lys Val Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr
        340                 345                 350 Ile Thr Lys Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr
    355                 360                 365 Glu Ser Trp Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val
370                 375                 380 Val Asp Phe Glu Thr Asp Val Leu Phe Leu Val Pro Thr Glu Ile Ala 385                 390                 395                 400 Leu Ala Gln His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr
            405                 410                 415 Leu Phe Ser His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly
        420                 425                 430 Ala Asp His Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala
    435                 440                 445 Thr Pro Thr Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met
450                 455                 460 Ile Ala Tyr Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly 465                 470                 475                 480 Asp Ser Ala Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser
            485                 490                 495 Cly Tyr Leu Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg
        500                 505                 510 Ser Leu Arg Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala
    515                 520                 525 Leu Pro Thr Val Thr Asp Gln Glu Ala Thr Pro Val Pro Pro Thr Gly
530                 535                 540 Asp Ser Glu Ala Thr Pro Val Pro Pro Thr Gly Asp Ser Glu Thr Ala 545                 550                 555                 560 Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr
            565                 570                 575 Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala
        580                 585                 590 Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro
    595                 600                 605 Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly
610                 615                 620 Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro 625                 630                 635                 640 Pro Thr Gly Asp Ala Gly Pro Pro Pro Val Pro Pro Thr Gly Asp Ser
            645                 650                 655 Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val
        660                 665                 670 Thr Pro Thr Gly Asp Ser Glu Thr Ala Pro Val Pro Pro Thr Gly Asp
    675                 680                 685 Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Glu Ala Ala Pro
690                 695                 700 Val Pro Pro Thr Asp Asp Ser Lys Glu Ala Gln Met Pro Ala Val Ile 705                 710                 715                 720 Arg Phe (2)SEQ ID NO:8的资料:
(ⅰ)序列特征:
  (A)长度:2184bp
  (B)类型:核酸
  (C)链型:双链
  (D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(ⅲ)假设:无
(ⅲ)反义:无
(ⅵ)来源
  (A)有机体:Homo sapiens
  (F)组织类型:乳腺
(ⅸ)特征:
  (A)名称/关键词:CDS
  (B)位置:82..2088
  (D)其它资料:/标记=变异体_T
(ⅸ)特征:
  (A)名称/关键词:mat_肽
  (B)位置:151..2085
(ⅸ)特征:
  (A)名称/关键词:重复_区域
  (B)位置:1756..2052
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1756..1788
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1789..1821
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1822..1854
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1855..1887
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1888..1920
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1921..1953
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1954..1986
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:1987..2019
(ⅸ)特征:
  (A)名称/关键词:重复_单位
  (B)位置:2020..2052
(ⅹⅰ)序列描述:SEQ ID NO:8: ACCTTCTGTA TCAGTTAAGT GTCAAGATGG AAGGAACAGC AGTCTCAAGA TAATGCAAAG      60 AGTTTATTCA TCCAGAGGCT G ATG CTC ACC ATG GGG CGC CTG CAA CTG GTT       111
                    Met Leu Thr Met Gly Arg Leu Gln Leu Val
                    -23         -20                 -15 GTG TTG GGC CTC ACC TGC TGC TGG GCA GTG GCG AGT GCC GCG AAG CTG       159 Val Leu Gly Leu Thr Cys Cys Trp Ala Val Ala Ser Ala Ala Lys Leu
        -10                  -5                   1 GGC GCC GTG TAC ACA GAA GGT GGG TTC GTG GAA GGC GTC AAT AAG AAG       207 Gly Ala Val Tyr Thr Glu Gly Gly Phe Val Glu Gly Val Asn Lys Lys
  5                  10                  15 CTC GGC CTC CTG GGT GAC TCT GTG GAC ATC TTC AAG GGC ATC CCC TTC       255 Leu Gly Leu Leu Gly Asp Ser Val Asp Ile Phe Lys Gly Ile Pro Phe  20                  25                  30                  35 GCA GCT CCC ACC AAG GCC CTG GAA AAT CCT CAG CCA CAT CCT GGC TGG       303 Ala Ala Pro Thr Lys Ala Leu Glu Asn Pro Gln Pro His Pro Gly Trp
             40                  45                  50 CAA GGG ACC CTG AAG GCC AAG AAC TTC AAG AAG AGA TGC CTG CAG GCC       351 Gln Gly Thr Leu Lys Ala Lys Asn Phe Lys Lys Arg Cys Leu Gln Ala
         55                  60                  65 ACC ATC ACC CAG GAC AGC ACC TAC GGG GAT GAA GAC TGC CTG TAC CTC       399 Thr Ile Thr Gln Asp Ser Thr Tyr Gly Asp Glu Asp Cys Leu Tyr Leu
     70                  75                  80 AAC ATT TGG GTG CCC CAG GGC AGG AAG CAA GTC TCC CGG GAC CTG CCC       447 Asn Ile Trp Val Pro Gln Gly Arg Lys Gln Val Ser Arg Asp Leu Pro
 85                  90                  95 GTT ATG ATC TGG ATC TAT GGA GGC GCC TTC CTC ATG GGG TCC GGC CAT       495 Val Met Ile Trp Ile Tyr Gly Gly Ala Phe Leu Met Gly Ser Gly His 100                 105                 110                 115 GGG GCC AAC TTC CTC AAC AAC TAC CTG TAT GAC GGC GAG GAG ATC GCC       543 Gly Ala Asn Phe Leu Asn Asn Tyr Leu Tyr Asp Gly Glu Glu Ile Ala
            120                 125                 130 ACA CGC GGA AAC GTC ATC GTG GTC ACC TTC AAC TAC CGT GTC GGC CCC       591 Thr Arg Gly Asn Val Ile Val Val Thr Phe Asn Tyr Arg Val Gly Pro
        135                 140                 145 CTT GGG TTC CTC AGC ACT GGG GAC GCC AAT CTG CCA GGT AAC TAT GGC       639 Leu Gly Phe Leu Ser Thr Gly Asp Ala Asn Leu Pro Gly Asn Tyr Gly
    150                 155                 160 CTT CGG GAT CAG CAC ATG GCC ATT GCT TGG GTG AAG AGG AAT ATC GCG       687 Leu Arg Asp Gln His Met Ala Ile Ala Trp Val Lys Arg Asn Ile Ala
165                 170                 175 GCC TTC GGG GGG GAC CCC AAC AAC ATC ACG CTC TTC GGG GAG TCT GCT       735 Ala Phe Gly Gly Asp Pro Asn Asn Ile Thr Leu Phe Gly Glu Ser Ala 180                 185                 190                 195 GGA GGT GCC AGC GTC TCT CTG CAG ACC CTC TCC CCC TAC AAC AAG GGC       783 Gly Gly Ala Ser Val Ser Leu Gln Thr Leu Ser Pro Tyr Asn Lys Gly
            200                 205                 210 CTC ATC CGG CGA GCC ATC AGC CAG AGC GGC GTG GCC CTG AGT CCC TGG       831 Leu Ile Arg Arg Ala Ile Ser Gln Ser Gly Val Ala Leu Ser Pro Trp
        215                 220                 225 GTC ATC CAG AAA AAC CCA CTC TTC TGG GCC AAA AAG GTG GCT GAG AAG       879 Val Ile Gln Lys Asn Pro Leu Phe Trp Ala Lys Lys Val Ala Glu Lys
    230                 235                 240 GTG GGT TGC CCT GTG GGT GAT GCC GCC AGG ATG GCC CAG TGT CTG AAG       927 Val Gly Cys Pro Val Gly Asp Ala Ala Arg Met Ala Gln Cys Leu Lys
245                 250                 255 GTT ACT GAT CCC CGA GCC CTG ACG CTG GCC TAT AAG GTG CCG CTG GCA       975 Val Thr Asp Pro Arg Ala Leu Thr Leu Ala Tyr Lys Val Pro Leu Ala 260                 265                 270                 275 GGC CTG GAG TAC CCC ATG CTG CAC TAT GTG GGC TTC GTC CCT GTC ATT      1023 Gly Leu Glu Tyr Pro Met Leu His Tyr Val Gly Phe Val Pro Val Ile
            280                 285                 290 GAT GGA GAC TTC ATC CCC GCT GAC CCG ATC AAC CTG TAC GCC AAC GCC      1071 Asp Gly Asp Phe Ile Pro Ala Asp Pro Ile Asn Leu Tyr Ala Asn Ala
        295                 300                 305 GCC GAC ATC GAC TAT ATA GCA GGC ACC AAC AAC ATG GAC GGC CAC ATC      1119 Ala Asp Ile Asp Tyr Ile Ala Gly Thr Asn Asn Met Asp Gly His Ile
    310                 315                 320 TTC GCC AGC ATC GAC ATG CCT GCC ATC AAC AAG GGC AAC AAG AAA GTC      1167 Phe Ala Ser Ile Asp Met Pro Ala Ile Asn Lys Gly Asn Lys Lys Val
325                 330                 335 ACG GAG GAG GAC TTC TAC AAG CTG GTC AGT GAG TTC ACA ATC ACC AAG      1215 Thr Glu Glu Asp Phe Tyr Lys Leu Val Ser Glu Phe Thr Ile Thr Lys 340                 345                 350                 355 GGG CTC AGA GGC GCC AAG ACG ACC TTT GAT GTC TAC ACC GAG TCC TGG      1263 Gly Leu Arg Gly Ala Lys Thr Thr Phe Asp Val Tyr Thr Glu Ser Trp
            360                 365                 370 GCC CAG GAC CCA TCC CAG GAG AAT AAG AAG AAG ACT GTG GTG GAC TTT     1311 Ala Gln Asp Pro Ser Gln Glu Asn Lys Lys Lys Thr Val Val Asp Phe
        375                 380                 385 GAG ACC GAT GTC CTC TTC CTG GTG CCC ACC GAG ATT GCC CTA GCC CAG     1359 Glu Thr Asp Val Leu Phe Leu Val Pro Thr Glu Ile Ala Leu Ala Gln
    390                 395                 400 CAC AGA GCC AAT GCC AAG AGT GCC AAG ACC TAC GCC TAC CTG TTT TCC     1407 His Arg Ala Asn Ala Lys Ser Ala Lys Thr Tyr Ala Tyr Leu Phe Ser
405                 410                 415 CAT CCC TCT CGG ATG CCC GTC TAC CCC AAA TGG GTG GGG GCC GAC CAT     1455 His Pro Ser Arg Met Pro Val Tyr Pro Lys Trp Val Gly Ala Asp His 420                 425                 430                 435 GCA GAT GAC ATT CAG TAC GTT TTC GGG AAG CCC TTC GCC ACC CCC ACG     1503 Ala Asp Asp Ile Gln Tyr Val Phe Gly Lys Pro Phe Ala Thr Pro Thr
            440                 445                 450 GGC TAC CGG CCC CAA GAC AGG ACA GTC TCT AAG GCC ATG ATC GCC TAC     1551 Gly Tyr Arg Pro Gln Asp Arg Thr Val Ser Lys Ala Met Ile Ala Tyr
        455                 460                 465 TGC ACC AAC TTT GCC AAA ACA GGG GAC CCC AAC ATG GGC GAC TCG GCT     1599 Trp Thr Asn Phe Ala Lys Thr Gly Asp Pro Asn Met Gly Asp Ser Ala
    470                 475                 480 GTG CCC ACA CAC TGG GAA CCC TAC ACT ACG GAA AAC AGC GGC TAC CTG     1647 Val Pro Thr His Trp Glu Pro Tyr Thr Thr Glu Asn Ser Gly Tyr Leu
485                 490                 495 GAG ATC ACC AAG AAG ATG GGC AGC AGC TCC ATG AAG CGG AGC CTG AGA     1695 Glu Ile Thr Lys Lys Met Gly Ser Ser Ser Met Lys Arg Ser Leu Arg 500                 505                 510                 515 ACC AAC TTC CTG CGC TAC TGG ACC CTC ACC TAT CTG GCG CTG CCC ACA     1743 Thr Asn Phe Leu Arg Tyr Trp Thr Leu Thr Tyr Leu Ala Leu Pro Thr
            520                 525                 530 GTG ACC GAC CAG GAG GCC ACC CCT GTG CCC CCC ACA GGG GAC TCC GAG     1791 Val Thr Asp Gln Glu Ala Thr Pro Val Pro Pro Thr Gly Asp Ser Glu
        535                 540                 545 GCC ACT CCC GTG CCC CCC ACG GGT GAC TCC GAG ACC GCC CCC GTG CCG     1839 Ala Thr Pro Val Pro Pro Thr Gly Asp Ser Glu Thr Ala Pro Val Pro
    550                 555                 560 CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC TCC     1887 Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser
565                 570                 575 GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG     1935 Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val 580                 585                 590                 595 CCG CCC ACG GGT GAC TCC GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC     1983 Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp
            600                 605                 610 TCC GGG GCC CCC CCC GTG CCG CCC ACG GGT GAC TCC GGG GCC CCC CCT      2031 Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro
        615                 620                 625 GTG CCC CCC ACA GAT GAC TCC AAG GAA GCT CAG ATG CCT GCA GTC ATT      2079 Val Pro Pro Thr Asp Asp Ser Lys Glu Ala Gln Met Pro Ala Val Ile
    630                 635                 640 AGG TTT TAGCGTCCCA TGAGCCTTGG TATCAAGAGG CCACAAGAGT GGGACCCCAG       2135 Arg Phe
645 GGGCTCCCCT CCCATCTTGA GCTCTTCCTG AATAAAGCCT CATACCCCT                2184 (2)SEQ ID NO:9的资料:
(ⅰ)序列特征:
  (A)长度:668个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(ⅱ)分子类型:蛋白质
(ⅹⅰ)序列描述:SEQ ID NO:9: Met Leu Thr Met Gly Arg Leu Gln Leu Val Val Leu Gly Leu Thr Cys -23         -20                 -15                 -10 Cys Trp Ala Val Ala Ser Ala Ala Lys Leu Gly Ala Val Tyr Thr Glu
    -5                    1               5 Gly Gly Phe Val Glu Gly Val Asn Lys Lys Leu Gly Leu Leu Gly Asp  10                  15                  20                  25 Ser Val Asp Ile Phe Lys Gly Ile Pro Phe Ala Ala Pro Thr Lys Ala
             30                  35                  40 Leu Glu Asn Pro Gln Pro His Pro Gly Trp Gln Gly Thr Leu Lys Ala
         45                  50                  55 Lys Asn Phe Lys Lys Arg Cys Leu Gln Ala Thr Ile Thr Gln Asp Ser
     60                  65                  70 Thr Tyr Gly Asp Glu Asp Cys Leu Tyr Leu Asn Ile Trp Val Pro Gln
 75                  80                  85 Gly Arg Lys Gln Val Ser Arg Asp Leu Pro Val Met Ile Trp Ile Tyr  90                  95                 100                 105 Gly Gly Ala Phe Leu Met Gly Ser Gly His Gly Ala Asn Phe Leu Asn
            110                 115                 120 Asn Tyr Leu Tyr Asp Gly Glu Glu Ile Ala Thr Arg Gly Asn Val Ile
        125                 130                 135 Val Val Thr Phe Asn Tyr Arg Val Gly Pro Leu Gly Phe Leu Set Thr
    140                 145                 150 Gly Asp Ala Asn Leu Pro Gly Asn Tyr Gly Leu Arg Asp Gln His Met
155                 160                 165 Ala Ile Ala Trp Val Lys Arg Asn Ile Ala Ala Phe Gly Gly Asp Pro 170                 175                 180                 185 Asn Asn Ile Thr Leu Phe Gly Glu Ser Ala Gly Gly Ala Ser Val Ser
            190                 195                 200 Leu Gln Thr Leu Set Pro Tyr Asn Lys Gly Leu Ile Arg Arg Ala Ile
        205                 210                 215 Ser Gln Ser Gly Val Ala Leu Ser Pro Trp Val Ile Gln Lys Asn Pro
    220                 225                 230 Leu Phe Trp Ala Lys Lys Val Ala Glu Lys Val Gly Cys Pro Val Gly
235                 240                 245 Asp Ala Ala Arg Met Ala Gln Cys Leu Lys Val Thr Asp Pro Arg Ala 250                 255                 260                 265 Leu Thr Leu Ala Tyr Lys Val Pro Leu Ala Gly Leu Glu Tyr Pro Met
            270                 275                 280 Leu His Tyr Val Gly Phe Val Pro Val Ile Asp Gly Asp Phe Ile Pro
        285                 290                 295 Ala Asp Pro Ile Asn Leu Tyr Ala Asn Ala Ala Asp Ile Asp Tyr Ile
    300                 305                 310 Ala Gly Thr Asn Asn Met Asp Gly His Ile Phe Ala Ser Ile Asp Met
315                 320                 325 Pro Ala Ile Asn Lys Gly Asn Lys Lys Val Thr Glu Glu Asp Phe Tyr 330                 335                 340                 345 Lys Leu Val Ser Glu Phe Thr Ile Thr Lys Gly Leu Arg Gly Ala Lys
            350                 355                 360 Thr Thr Phe Asp Val Tyr Thr Glu Ser Trp Ala Gln Asp Pro Ser Gln
        365                 370                 375 Glu Asn Lys Lys Lys Thr Val Val Asp Phe Glu Thr Asp Val Leu Phe
    380                 385                 390 Leu Val Pro Thr Glu Ile Ala Leu Ala Gln His Arg Ala Asn Ala Lys
395                 400                 405 Ser Ala Lys Thr Tyr Ala Tyr Leu Phe Ser His Pro Ser Arg Met Pro 410                 415                 420                 425 Val Tyr Pro Lys Trp Val Gly Ala Asp His Ala Asp Asp Ile Gln Tyr
            430                 435                 440 Val Phe Gly Lys Pro Phe Ala Thr Pro Thr Gly Tyr Arg Pro Gln Asp
        445                 450                 455 Arg Thr Val Ser Lys Ala Met Ile Ala Tyr Trp Thr Asn Phe Ala Lys
    460                 465                 470 Thr Gly Asp Pro Asn Met Gly Asp Ser Ala Val Pro Thr His Trp Glu
475                 480                 485 Pro Tyr Thr Thr Glu Asn Ser Gly Tyr Leu Glu Ile Thr Lys Lys Met 490                 495                 500                 505 Gly Ser Ser Ser Met Lys Arg Ser Leu Arg Thr Asn Phe Leu Arg Tyr
            510                 515                 520 Trp Thr Leu Thr Tyr Leu Ala Leu Pro Thr Val Thr Asp Gln Glu Ala
        525                 530                 535 Thr Pro Val Pro Pro Thr Gly Asp Ser Glu Ala Thr Pro Val Pro Pro
    540                 545                 550 Thr Gly Asp Ser Glu Thr Ala Pro Val Pro Pro Thr Gly Asp Ser Gly
555                 560                 565 Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro 570                 575                 580                 585 Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser
            590                 595                 600 Gly Ala Pro Pro Val Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val
        605                 610                 615 Pro Pro Thr Gly Asp Ser Gly Ala Pro Pro Val Pro Pro Thr Asp Asp
    620                 625                 630 Ser Lys Glu Ala Gln Met Pro Ala Val Ile Arg Phe
635                 640                 645 INDICATIONS RELATTING TO A DEPOSITED MICROORGANISM
                (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITE D MICROORGANISM
               (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rulc 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rule 13bis) INDICATIONS RELATING TO A DEPOSITED MICROORGANISM
               (PCT Rule 13bis)
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈