首页 / 专利库 / 遗传学 / 哺乳动物基因 / 哺乳动物的特洛德样基因和蛋白质

哺乳动物的特洛德样基因和蛋白质

阅读:846发布:2020-05-11

专利汇可以提供哺乳动物的特洛德样基因和蛋白质专利检索,专利查询,专利分析的服务。并且提出了一种编码与人或小鼠BMP-1/mTld不同的特洛德样 蛋白质 的 哺乳动物 基因,所述基因在结构上与BMP-1基因家族的成员相似,但在不同的 位置 上,并编码不同的蛋白质。该基因编码的蛋白质可用以筛选推定的 治疗 剂以抑制BMP-1基因家族的活性,防止结疤、 纤维 变性等。,下面是哺乳动物的特洛德样基因和蛋白质专利的具体信息内容。

1.一种基本纯化的DNA分子制品,所述DNA分子包含SEQ ID NO:2核苷 酸1052至3649之间的序列。
2.一种基因构建物,所述构建物按5'到3'顺序包括:
一个在宿主细胞中有活性的转录启动子:和
一个包含SEQ ID NO:2核苷酸1052至3649之间核苷酸序列的DNA片段
3.一种治疗创口的方法,所述方法包括下列步骤:
在合适的宿主细胞中提供一个基因构建物,所述构建物包含一个在宿主细胞 中有活性的转录启动子以及一个含有SEQ ID NO:2核苷酸1052至3649之间核苷 酸序列的DNA片段,以使所述核苷酸序列编码蛋白质:和以有效量对创口给药,使该创口比未经治疗的创口更迅速地愈合。
4.一种基本纯的蛋白质制品,所述蛋白质具有SEQ ID NO:3中基酸1至 1013之间的氨基酸序列。
5.一种基本纯化的DNA分子制品,所述DNA分子包含SEQ ID NO:4核苷 酸1089至3686之间的核苷酸序列。
6.一种基因构建物,所述基因构建物按5'到3顺序包括:
一个在宿主细胞中有活性的转录启动子:和
一个含有SEQ ID NO:4中核苷酸1089至3686之间的核苷酸序列的DNA片 段。
7.一种治疗伤口的方法,所述方法包括下列步骤:
在合适的宿主细胞中提供一个基因构建物,所述构建物包含一个在宿主细胞 中有活性的转录启动子以及一个含有SEQ ID NO:4核苷酸1089至3686之间核苷 酸序列的DNA片段,以使该核苷酸序列编码蛋白质:
并将该蛋白质以有效量用于伤口,使该伤口比未经治疗的伤口更迅速地愈 合。
8.一种基本纯的蛋白质制品,所述蛋白质有SEQ ID NO:5氨基酸1至1013 之间的氨基酸序列。

说明书全文

相互参照的相关申请

本申请要求了1996年5月30日提交的临时专利申请60/018,684的优先权。

关于联邦政府赞助的研究或开发的声明

不适用。

发明背景

本发明涉及骨形态生成蛋白领域,更具体地涉及BMP-1/Tld基因家族中的基 因。

哺乳动物如小鼠和人骨骼的形成,是通过一系列骨形态生成蛋白(BMP)来控 制的。在参与成骨的7种已知BMP中,6种(称为BPM-2到BMP-7)属于TGF-β 超家族。第7种BMP(称为BMP-1)并不类似于TGF-β,而是衍生自不同的基因家 族。BMP-1基因家族成员通常有下列结构域:虾红素样金属蛋白酶结构域,一个 或多个在其它蛋白中被认为与Ca++结合的EGF样基序和许多CUB结构域,CUB 结构域是介导补体成分Clr/Cls中蛋白之间相互作用的基序,也已明确它存在于各 种参与发育过程的蛋白中。Wozney,J.M.等在Science 242:1528-1534(1988)中描 述了BMP-1的核苷酸序列。

其它非哺乳类动物中发现的蛋白质中也存在哺乳动物BMP-1结构域的结 构。这些蛋白质包括果蝇属特洛德(tolloid)(Tld)(Shimell,M.J.,Cell 67:469- 481(1991))、特洛德样果蝇属基因产物(Tlr-11或tolkin)(Nguyen,T.,Dev.Biol. 166:569-586(1994)和Finelli,A.L.,等,Genetics 141:271-281(1995))、海胆BMP-1同 系物(suBMP-1)(Hwang,S.-P.,等,Development 120:559-568(1994))、两种相关的 海胆发育基因产品SpAN和BP10(Reynolds,S.D.,等,Development 114:769- 786(1992)和Lepage,T.,等,Development 114:147-164(1992))、Xenopus BMP- 1(xBMP-1)(Maeno,M.等,Gene 134:257-261(1993)和哺乳动物特洛德 (mTld)(Takahara,K.等,J.Biol.Chem.269:32572-32578(1994))。在传阅评述金属 蛋白酶虾红素家族的文章(Bond.J.S.和R.J.Benynon,Protein Science 4:1247-1261 在1249页(1995))中只是简单地提到了从非洲爪蟾属(Xenopus)获得的特洛德样基 因(xolloid),但没有公开关于基因本身的数据。编码这些蛋白质的基因的一些核 酸序列是已知的。尽管靠两个不同的可变剪接的mRNA分子,哺乳动物BMPl 基因编码了BMP-1蛋白和mTld蛋白。本段中提到的论文均结合入本文作参考。

发明概述

本发明概括地描述了一种新的哺乳动物特洛德样基因产物(mTll)及其关联基 因,该基因与mTld以及其它已知的BMP-1相关蛋白和基因不同。并且报道了小 鼠和人的基因版本。

本发明的一个目的是提供涉及脊椎动物中胞外基质沉积(如成骨)的基因和基 因产物。

本发明的另一个目的是为合理开发抑制特洛德样基因活性治疗纤维变性、结 疤、瘢痕瘤、外科粘连等的药物提供靶分子。

本发明还有一个目的是提供一种重组DNA构建物、以及该构建物所编码 的、用来加速伤口和骨折愈合的蛋白质。

本发明还有一个目的是提供对小鼠染色体8中央部分作图的标记基因。

本发明另一个目的是提供对人染色体4的4q32-4q33区域作图的标记基因。

本发明还有一个目的是提供探测哺乳动物细胞中非BMP-1骨形态生成蛋白 基因的探针的核苷酸序列。

本发明的一个特征是所述小鼠基因的3'非翻译区含有新的简单重复序列。

本发明的其它目的、特征和优点在参照附图进行下列详细叙述时将会更为清 晰。

附图简述

图1提供了小鼠mTll cDNA的图谱,包括5'和3'非翻译部分。排列在mTll cDNA下方的行列是用来比较的一些相关基因的cDNA克隆的示意图,它们按照 与mTll相同的比例来绘制。基因产物结构域对应的cDNA部分用高亮度表示。 带点方框、浓阴影方框、条纹方框、淡阴影方框以及黑色方框分别表示信号肽、 前区(proregion)、金属蛋白酶、CUB和EGF结构域。白色方框表示不同蛋白质 独有的结构域。波浪线表示5'和3'非翻译区。缩写含义是:mTld,哺乳动物 tolloid;mBMP-1哺乳动物BMP-1;xBMP-1,非洲爪蟾属BMP-1;suBMP-l, 海胆BMP-1;Tld,果蝇属tolloid;Tlr-1,果蝇属tolloid相关基因;SpAN和 BP10,相关的海胆发育基因。限制性酶包括:Bg,BglⅡ;C,ClaⅠ;E,EcoRⅠ; H,HincⅡ;N,NcoⅠ;S,SmaⅠ;St,StuⅠ。

图2将公开的mTll基因的基酸序列与mTld基因的氨基酸序列进行序列对 比。图中显示了两种蛋白质共同的结构域结构。结构域如图1所示。采用GAP 程序(Genetics Computer Group,Madison,Wisconsin)进行序列对比,GAP重量为 3.0、GAP长度重量为0.1,并附带推定信号肽序列的手工对比。半胱氨酸用方 框框出,潜在的天冬酰胺(Asn)糖基化连接位点用下划线表示,金属肽内切蛋白酶 活性位点基序HEXXH用点线方框框出。

图3显示了小鼠染色体8中心部分的示意图。图谱管理程序(Map Manager) (Manly K.,"A Macintosh Program for Storage and Analysis of Experimental Genetic Mapping Data,"Mammalian Genome 4:301-313(1993))比较了Tll与其它来自TJL BSS反交板(backcross panel)的基因座的分离数据,进行连接分析,产生了此图 谱。TJL BSS反交板数据从Jackson Laboratories Public Data  Base(http://www.jax.org/Resources/documents/cmdata)获得。

发明详述

这样从小鼠分离获得基本纯的哺乳动物特洛德样(mTll)cDNA制品:从小鼠 系BMP-1tmlblh的胚胎成纤维细胞制备cDNA文库,用小鼠BMP-1基因中约330 基对的AatⅡ-DrdⅠ限制性片段作探针,在低严格性条件下进行筛选(如下文实施 例所述)。BMP-1tmlblh是剔除了BMP-1基因(KO)的小鼠,它是缺失BMP-1基因的 等位基因纯合子小鼠。SEQ ID NO:1中所示的探针与BMP-1tmlblh基因剔除小鼠所 缺失的BMP-1基因360碱基对片段对应。由于cDNA文库中没有BMP-1,因此 在DNA序列平上筛选不能回收只与BMP-1相关的序列,回收的是与BMP-1 不同的序列。

在筛选中,基因组只有一个区域未被回收(见图1)。最初筛选中获得的KO3 和KO7-2的重叠性cDNA克隆视为基本纯的制品,它包括了大多数但并非全部编 码序列。筛选用标准程序在低严格性条件下进行(Ausubel,F.M.,等,Current Protocols in Molecular Biology,Wiley,New York(1987)CA)。其余编码序列通过高 严格性条件对胚胎成纤维细胞cDNA文库进行再次筛选获得,从而揭示了另一个 延伸至基因5'非翻译部分的克隆(KO8-2)。获得的KO8-2颗粒也视为基本纯的制 品。

本领域普通技术人员可以象发明者那样将分开的克隆序列连接在一起,产生 SEQ ID NO:2中所示的全长cDNA。本文提供的SEQ ID NO:2是一个有5'和3'侧 翼非翻译序列的3039碱基对的开放读框。开放读框编码哺乳动物特洛德样蛋白 质(称为mTll)。这里所示的序列表示三个cDNA克隆(KO3,KO7-2和KO8-2) 组合的核酸序列。在mTll基因的3'非翻译区中,有一个是以前没有报道过的简单 重复序列(SSR)。SSR有如下序列:(GT)20GC(GT)7GC(GT)7GCAT(GT)3GCAT (GT)3(SEQ ID NO:2中的核苷酸4148-4239).SEQ ID NO:2中的序列数据可从 Genbank Accession Number U34042获得。

如果DNA制品中已经除去了90%以上任何有DNA的宿主细胞的细胞物 质,则认为任何来源的含有mTll基因序列的DNA分子制品是基本上纯的。例如, 细胞物质可利用商品纯化试剂盒(如购自Qiagen的试剂盒(Chatsworth,CA))从核 酸制剂中除去。较佳的是,核酸制品中超过10%的核酸分子含有全部或部分mTll 基因或其部分。更佳的是,超过50%,甚至还要佳的是超过90%的核酸分子含 有mTll基因全部或部分序列。

注意到其它与mTll有关的基因以及BMP-l家族的其它成员用可以比较的筛 选方法从BMP-1/mTld和mTll均缺失的双缺失胚胎cDNA文库中分离获得。这种 双缺失突变动物可将拥有两个基因座之一的杂合动物交配而制得。

小鼠mTll基因图示位于染色体8中心近D8Bir22处(1994年染色体8委员会 报告中位于31号位置)(Ceci,J.D.,"Mouse Chromosome 8,"Mammalian Genome 5:S124-S138(1994))。这同一个染色体大区是四个会导致明显发育异常的基因缺损 图谱位点,四种异常是:Hook(Hk)、肾上皮质素发育异常(Acd)、Quinky(Q)和成 比例型侏儒(Proportional dwarf)(pdw)。相反,BMP-1图示位于小鼠染色体14(Ceci, J.D.,等,"An interspecific backcross linkage map of the proximal half of mouse chromosome 14,"Genomics 6:673-678(1990))。

图2显示所提到的鼠mTll蛋白质结构域结构,系从与小鼠特洛德蛋白质 产物的序列相似性预测而得。由于它与其它特洛德样蛋白质有相似性,预计公开 的mTll基因编码的产物将是在发育和自身稳定过程(如伤口愈合)中起关键作用的 蛋白酶。此蛋白质可能参与了胞外基质前体变成大分子结构的成熟过程。当给予 组织有效量的该蛋白质时,也许此蛋白质在生长因子体内外的激活中起作用,也 许会促进发育和自身稳定过程。另一方面,如果mTll蛋白质的功能被抑制,则 这些过程本身也会抑制,在输送有效量抑制剂时,可有利地利用该性质以防止纤 维变性和过度疤痕或其它伤口愈合异常。通过在选定的已知与人类在相同的生化 或生理学上相似的家畜和模型动物上,进行此蛋白质用量范围的测试,可以容易 地确定输送至靶位点以激活发育和自身稳定性所需该蛋白质的有效量。例如,在 皮肤伤口愈合的试验中,猪皮是人皮的合适模型。同样,也可确定Tll蛋白质抑 制剂的有效量。有效量是指能比未处理伤口有效地减少纤维变性、结疤或瘢痕瘤 发生的伤口给药量,纤维变性、结疤或瘢痕瘤程度的评价根据临床或兽医上所接 受的标准而定。这种测试最好在通常被视为与人皮肤有关的模型体系中进行。

由于此蛋白质在动物组织中的含量通常非常少,因此BMP体系蛋白质的工 作能受到抑制。本文证明了,以前未知的基因mTll可以克隆入含有(在合适宿 主细胞内)有效转录启动子的合适的表达载体中,继而导入合适的宿主细胞并在其 中表达,并以天然构型纯化,所有这些均采用常规方法(参见下文)。这样表达的 蛋白质可保留在宿主细胞内,或可以分泌到胞外生长培养基中(如果在构建物上提 供合适的信号序列的话)。蛋白质可用常规的方法从细胞或生长培养基中纯化获 得。

合适的转录启动子是载体pFASTBacl(该载体可购自Gibco-BRL)上发现的杆 状病毒极迟启动子。另一个合适的启动子是杆状病毒立即早期启动子,如在 pAcPIEl载体(Novagen,Madison,WⅠ)上发现的启动子。任何其它有利的表达元件 如增强子、终止子等本领域已知的元件可包括在合适的表达载体中。合适的宿主 可以是昆虫组织培育细胞,如细胞系Sf21、Sf9、或High Five(Invitrogen,san Diego,CA)。

含有小于全部编码序列的该基因的合适部分也可有利地克隆入合适的载体 中,以形成基因重组构建物。应当理解,根据本发明制得的构建物不必含有整个 mTll基因座或编码区,但应含有能编码所需功能的一个或多个部分,或含有该基 因其它有用性能(如与所需基因组序列互补)的部分。本领域普通技术人员应当理 解,mTll蛋白质(以及编码mTll蛋白质的相应的遗传物质)在大小和序列上的某 些变化不会干扰其功能。在构建含有全部或部分mTll基因的基因构建物以及其 编码的蛋白质时,这些经修饰的形式可用已知的有利方法进行工程化。

只要所产生的蛋白质保留了与家族其它成员相关的所需功能,认为这些改 变、修饰、添加和缺失均在本发明的范围内。如果蛋白质在层粘连蛋白-5断裂标 准试验中保留了切断活性,则蛋白质是感受态蛋白。也希望蛋白质能保留对前胶 原的C-蛋白酶活性(如Kessler,E.,等在Science 271:360-362(1996)中关于BMP-1所 述,该内容结合入本文作参考)。本领域技术人员对这些测定方法伴有的必要的控 制是熟悉的。或者,希望蛋白质由于这种变化而丧失某些功能,这类情况也包括 在本发明的范围内。

这样制得的基本纯的蛋白质制品被确定为制品,其中mTll蛋白质的层粘连 蛋白-5断裂活性不受制品中存在的其它蛋白质或分子的影响。根据蛋白质打算采 用的场合,mTll蛋白质在基本纯的蛋白质制品中的量至少应为10%,至少50 %为佳,至少75%为更佳,至少95%为最佳。通过用亲和标记物对蛋白质作标 记,并使制品通过对标记物有亲和性的柱,可增加此蛋白质制品中感兴趣的蛋白 质。也可采用一种加工标记物,经适当加工形成的蛋白质(缺少断裂前区)可从加 载有粗品的柱中洗脱获得。

以DNA序列预测的mTll翻译产物(SEQ ID NO:3)预计分子量为114,532(pⅠ 6.15)。如果翻译产物在图2所示的前区和蛋白酶结构域边界处断裂,则成熟的蛋 白酶的预测分子量为98,007(pⅠ6.18)。

当将鼠mTll蛋白质序列与其它特洛德样基因进行比较时,两个哺乳动物蛋 白质(mTld和mTll)的前区与两个果蝇属蛋白质(Tld或Tlr-1)的前区间没有明显的 同源性。mTll的蛋白酶结构域与Tld有66%相似(47%相同),与Tlr-1有69% 相似(52%相同)。mTll与两个果蝇属蛋白质的序列相似性比与mTld的相似性稍 高,而两个哺乳动物蛋白质中的一个与两个果蝇属蛋白质中的一个无明显关。通 过采用Sehwartz和Dayhoff的划痕系统(scoring system)(atlas of Protein Sequence and Structure,Dayhoff,M.O.,ed.,National Biomedical Research Foundation, Washington,D.C.,p.353-358(1979)),如果排列的氨基酸对的相似性临界值大于 0.5,则表示氨基酸对是“相似的”。

mTll mRNA转录物看来不会是可变剪接而成的,因为用该编码区内部的克隆 KO3片段(SEQ ID NO:2,核苷酸1113-2745)作为探针只检测到有一个转录物,而 且因为在cDNA文库筛选时只分离得到单一的mTll cDNA。

在成年人的大脑和肾脏中发现有相当强的mTll mRNA表达,在和骨骼肌 的RNA中表达水平稍低,在心脏和睾丸的RNA中表达水平非常低。对于脾脏或 肝脏则没有明显的信号。在Northern印迹法暴光60小时后,肝脏测出非常微弱 的信号,但脾脏没有检测到信号。

mTll的mRNA表达方式与以前报道的BMP-1转录物和mTld转录物不同。 在交配后7天发现胚胎总的RNA表达水平很低,发育11天时mRNA水平稍有增 加,15天时有相当高水平的峰值,然后在胚胎17天时降低。相反,发现BMP- 1和mTld转录物在胚胎7天时的水平比胚胎11天时的高。用同一印迹法来检测 mTll、BMP-1和mTld转录水平。

在交配后9.5-11.5天期间胚胎发育中检测到有mTll mRNA转录物。如以前 mTld RNA观察所见,在整个间充质内观察到mTll信号,在未来骨和神经管腹部 上方区域的水平较高。在以前对mTld观察时发现有信号的前侧菱脑的相同部位 上发现有强信号,这与底板中的mTll表达一致。在发育的脊椎间结缔组织上方 发现有规律性强表达。在发育的肺的间充质中发现有高的mTll信号,相反,在 肝脏中没有表达或表达水平非常低,这反映了Northern印迹分析成年小鼠肺和肝 脏中mTll mRNA的相对量。在交配13.5天后的胚胎旁矢截面中,发现在舌、鼻 发育过程中的间充质成中、颌骨和发育肠襻的粘膜下层中有表达。在发育的心脏 房室瓣膜上方发现有mTll表达。

在发育的小鼠组织中mTll和mTld mRNA分布的主要区别是在发育大脑第四 脑室底板前庭区域的神经上皮上方所见,在该处不同切面上始终发现有强的mTll 表达,而没有发现mTld或BMP表达。在脑室和新生期大脑导水管的神经上皮衬 里上方的许多切片中发现有mTll RNA表达。在丘脑内和侧脑室神经上皮衬里中 的特殊核上也发现有mTll表达。在成年脑中,小脑颗粒层中发现有强的mTll表 达。在新生期和成年小鼠脑的其它结构上也发现有较弱的mTll表达。人脑各部 位RNA的Northern印迹法分析也检测到在人小脑中有相当强的mTll信号。

注意到的mTll mRNA和先前报道的mTll分布之间的另一个区别是在发育的 脊髓中,在该处mTll表达比先前报道的mTld更广,它超越底板伸展至脊髓的更 背侧。在其它发育组织中,mTll和mTld转录物的分布是相互重叠的。

特别可以预计到的是,通过采用选择的包括上述小鼠基因mTll-特异性部位 的探针,来探测适当动物细胞的cDNA文库,可从其它动物中分离获得mTll基 因的等价物。通过比较小鼠mTll编码区与RMP-1/mTld编码区的核酸序列,并选 择与BMP-1不等价的mTll基因部分,可获得小鼠mTll基因的mTll特异性部分。 作为有效的探针,所选的序列应不含会与许多基因组位点交叉杂交的重复序列。 探针长度应至少约200碱基。已经认识到,BMP-1家族该基因在编码蛋白质前区 和C端17个氨基酸的区域中是最具可变性的,因此希望可以从mTll基因的这些 区域分离获得合适的探针。在SEQ ID NO:2中,此区域对应于C端部分的大约碱 基3599-3650,和前区的大约碱基701-1051之间的序列。这样的片段可通过切口 翻译、末端标记或其它本领域已知的合适方法来转变成探针。也应理解,可用分 子生物学中熟知的技术来体外合成所需的片段(或实际上是整个基因)。

这已通过采用人源DNA来得以实现。为了获得人源mTll序列,用长度为 677bp的小鼠mTll cDNA克隆KO3的NdeⅠ-Eco72Ⅰ片段(对应于CUB4的一部分 和CUB5全部以及羧基端)来筛选人胎盘基因组DNA文库。分离获得含有人TLL 基因最后三个外显子的基因组克隆151-2。然后用长度为339bp的小鼠mTll cDNA KO7-2的TapⅠ片段(对应于部分前区)来筛选相同的人基因组DNA文库,从而分 离得到基因组克隆5-2和8,这两个克隆均含有TLL基因5'端的第一个外显子。 合成获得对应于5'和3'非翻译区序列的寡核苷酸引物,和从人胎儿软骨RNA合 成的cDNA一起使用,对TLL编码区的其余部分进行长距离PCR扩增。正向引 物为5'-TCTTG CAGTC AGTTG CTTTG CTGG-3'(SEQ ID NO:10)。反向引物为 5'-TAGTG CGGCC GCACA TTCCT TTGTG TTC-3'(SEQ ID NO:11)。

人mTll的核酸序列见SEQ ID NO:4。该基因编码的蛋白质见SEQ ID NO:5。 基因(或其部分)可以小鼠基因的相同方式使用,但其它优点是可用于基因治疗和 诊断等,因为它不必象小鼠mTll基因那样需要使基因适用于人体使用。

因为mTll缺陷也许会导致人体遗传异常,故需确定人TLL基因的染色体位 置。将一个长度为527bp的cDNA PCR产物(对应于人TLL基因的最后3个外显 子)与EcoRⅠ-消化的基因组DNA(来自一组人-小鼠细胞杂交体)的Southern印迹杂 交。发现在5.1和9.5kb人条带呈强杂交,以及对来自30个杂交系(从17个不相 关的人细胞系和4个小鼠细胞系衍生获得)DNA进行检测(Takahara,K.,等,J. Biol.Chem.269:26280-26285(1994))表明,TLL的分离与人染色体4的分布有 关。在检测的细胞杂交体中,一个保留了人染色体4易位的杂交体进一步将TLL 定位在染色体4的长臂上。细胞杂交体55R16没有完整的染色体4,但是保留了 1I/4易位11qter-11p13∷4q25-4qter。这些结果将TLL定位在4q25-4qter区。用 Trask,B.,Methods Cell Biol.35:1-35(1992)的方法,在人细胞分裂中期染色体伸展 体(spread)上进行荧光原位杂交(FISH),对TLL基因独立作图。用洋地黄毒苷- 11-dUTP(Boehringer Mannheim)随机引导(Feinberg,A.P.和B.Vogelstein,B.Anal. Biochem.132:6-13(1983)),对含有TLL第一个外显子和大小约为16kb插入片段 的人基因组DNA克隆8作标记,并将其用作FISH分析的探针。获得图象并如上 所述(Takahara,K.,等,同上)进行分析。在检测的16/18(88.8%)的中期伸展体中只 在4q32-4q33上发现有双倍荧光信号,在10/18的中期伸展体的染色体上发现有 双荧光信号,而在其它染色体上没有信号,这将TLL定位在该区域中。

通过选择预计能侧接mTll基因(或基因任何部分)的特异性引物,也可用PCR 来扩增对应于mTll区的基因组部分。该基因的两个特异性部分可用作合适的探 针。在基因编码区外选择引物是无效的,因为非编码部分降低的选择性压力会导 致小鼠和其它动物在这些区域中发生更大的差异。特别应注意的是,应对人和模 型动物(如小鼠)BMP家族的此类基因进行特别搜寻,以寻求它们与人畸形的关系 (参见例如"The Chicken With a Duck's Feet:It's All in the Biochemical Signal,"The New York Times,National Edition,p.B6(1 996年5月21日))。

也可特别预计到,mTll基因编码的大量蛋白质可在宿主细胞中表达(或从宿 主细胞中分泌出),纯化至基本纯的制品,并用于随后的功能测定。在这样的一个 功能试验中,将描述表达蛋白质的功能特征。预计蛋白质的功能包括金属蛋白酶 活性、C-蛋白酶活性和层粘连蛋白-5加工活性,以及激活TGF-β样蛋白的活性, 鉴于其总体结构在结构域水平上与已知的蛋白质相似,因此这些预计是合理的。

在另一个试验中,此蛋白质可用来筛选抑制蛋白质活性的推定试剂。如果 mTll能救活BMP-1剔除小鼠,则它用类似修饰或消除BMP-1蛋白功能的方式, 来改变mTll蛋白功能的任何治疗系统,将是重要的。因此,任何一组这样的试 剂都必需以mTll蛋白质进行筛选。在这样的试验中,所有支持mTll功能的试验 成分可在合适的盐和pH条件下一同加入,并与一组蛋白质功能推定抑制剂结合 使用。采用已建立的蛋白质功能测定方法(在结合人本文其它处作为参考的文献中 有所描述),将可以确定任何被测试剂是否能抑制蛋白质活性,从而使其成为以治 疗剂量用于抑制纤维变性、减少结疤和减少瘢痕瘤的候选试剂。采用来自BMP- 1基因家族的相关蛋白质正在进行这种筛选努力。参见Kessler,同上。

现在也有可能用所公开的蛋白质或其片段来进行合理的药物设计。在设计 时,对蛋白质或片段进行X-射线结晶图分析,以确定它们的活性位点和可与推定 治疗剂相互作用的位点。

目前表明BMP-1编码的蛋白质可在C端附近断裂前胶原。人们早就认为这 种胶原产生所必需的C端-蛋白酶活性存在于未知的蛋白质中。因此利用C端蛋 白酶活性作为胶原相关疾病的治疗剂具有很高的商业价值。由于mTll是唯一的 与BMP-1密切相关(根据cDNA文库筛选的结果)的其它哺乳动物基因,因此也特 别期望,mTll编码的蛋白质是另一种C端蛋白酶,进一步讲,通过将基因导入 重组载体中进行体外生产治疗性蛋白,可用mTll基因来生产这种C端蛋白酶, 并在遗传疾病治疗中直接给药。人的基因特别适用于这些应用。

在讨论了下列非限制性实施例后可更好地理解本发明。

实施例

BMP-1/mTld-无效小鼠胚胎cDNA文库

如Hogan等("Manipulatingthe Mouse Embryo:A Laboratory Manual,2nd Ed.," pp.260-261,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1 994))所述的 制备小鼠胚胎成纤维细胞(MEF)。从已制成与BMP-1/mTld基因的无效等位基因 (即不表达BMP-1/mTld蛋白质)纯合的胚胎制得10150mm的MEF平板,使 MEF生长至铺满(在DMEM中,10%胎血清),3天后用50μg/ml抗坏血酸盐 处理18小鼠,收集,并用FastTrack试剂盒(Invitrogen)分离获得42μg聚腺苷酸 化mRNA。然后用SuperScript Choice系统(Gibco-BRL),用5μg等份聚腺苷酸来 合成有EcoRⅠ末端的双链cDNA。然后将该cDNA与EcoRⅠ-切开的λgt10臂连接, 并用GigapakⅡGold包装提取物(Stratagene)进行包装。5μg聚腺苷酸提供了约 2.2×10-6PFU的未扩增的文库。随机挑选的克隆的平均插入片段大小为2.9kb。

DNA序列分析

将限制性片段亚克隆人pBluescriptⅡKS+,用双脱链终止法从双链模板获 得序列(如Lee S.-T.,等在"Construction of a full-length cDNA encoding human pro- alpha 2(Ⅰ)collagen and its expression in pro-alpha 2(Ⅰ)-deficient W8 rat cells,"J.Biol. Chem.263:13414-13418(1988)中描述的)。用T3和T7引物对亚克隆的末端进行测 序,通过引入缺失或采用与插入序列互补的引物使亚克隆固有部分得以测序。两 条链的测序证实了本文报道的mTll序列。

聚合酶链反应(PCR)

PCR反应这样进行:在480循环变温加热仪(Perkin-Elmer Corp.)中在94℃下 使引物(每种引物为0.2μM)变性3分钟,然后以94℃/1分钟、57℃/1分钟、72 ℃/1.5分钟循环35次,最后在72℃下培育8分钟。最终体积为100μl 10mM Tris-HCl(pH8.3)、50mM KCl、1.5mMMgCl2、0.01%(w/v)明胶、dNTP各0.2mM 和2.5单位的Tαq聚合酶(Perkin-Elmer Corp.)

用于原位杂交的组织切片

用于原位杂交的固定在载玻片上的组织切片由G.E.Lyons(Wisconsin- Madsion大学)提供。如Lyons等在"The expression of myosin genes in developing skeletal muscle,"J.Cell Biol.111:1465-1476(1990)中所述的方法固定包埋小鼠组 织。简言之,将组织固定在4%多聚甲磷酸盐缓冲液中,脱水,并用石蜡油浸 润。将一系列5-7μm厚的切片固定在明胶化载玻片上。1-3个切片固定在载玻片 上,在二甲苯中去石蜡油、并且再水化。对切片用蛋白酶K消化,后固定,用三 乙醇胺/7酸酐处理,清洗并脱水。

用于原位杂交的探针

将mTll特异性探针(对应于1104bp的mTll 3'非翻译区的部分)用于原位杂 交。由于3'非翻译区与BMP-1或mTld序列没有相似性,因此探针不会与BMP- 1或mTld RNA交叉杂交。

为了保证探针不与其它有类似于长SSR(这种长SSR在mTll 3'非翻译区中心 部分(核苷酸4148-4239))的重复序列的RNA转录物杂交,根据生产商条件 (Stratagene)制备两个分离的核糖探针(对应于SSR上游或下游的3′-UT序列),用 35S-UTP(>1000Ci/mmol/Amersham Corp.)作标记,并联合以增强原位杂交信号。 用碱将探针水解成平均为70碱基大小。

对于SSR下游的3'非翻译序列,用正向引物5'-CCAGC TTAAC CTGTT CACAC-3'(SEQ ID NO:6)和反向引物5'-AACT CTAC TTCCA CTTCA TC-3′(SEQ ID NO:7)制备399bp的PCR产物(SEQ ID NO:2核苷酸4283-4681)。将PCR产物 连接入pCRⅡT-A载体(Invitrogen)的克隆位点。使pCRⅡ多接头中HindⅢ位点处 的模板线形化,并用RNA聚合酶T7转录,制得均匀标记的反义核糖探针。同时 使pCRⅡ多接头中XhoⅠ位点处线形化,并用RNA聚合酶SP6转录,制得有义对 照核糖探针。

对于SSR上游的3'非翻译序列,用正向引物5'-TCAGA ACAGA AAGGA ATGTG-3′(SEQ ID NO:8)和反向引物5'-GACCA CTATT CCACA TCACC-3'(SEQ ID NO:9)制备420bp的PCR产物(SEQ ID NO:2核苷酸3666-4085),并连接入pCRⅡ T-A的克隆位点。使pCRⅡ多接头中XhoⅠ位点处线形化并用RNA聚合酶SP6转 录,制得反义核糖探针,而使pCRⅡ多接头中HindⅢ位点处线形化并用RNA聚 合酶T7转录,制得有义对照核糖探针。

原位杂交和清洗步骤

使切片在52℃50%去离子的甲酰胺、0.3M NaCl、20mM Tris-HCl、 pH4.5、5mM EDTA、10mM NaPO4、10%硫酸葡聚糖、1份Denhardt's溶液、 50μg/ml酵母总RNA、25μmol/ml硫代ATP(Boehringer-Mannheim)和50-75,000 cpm/μl35S标记的cRNA探针中杂交过夜。使组织在65℃的50%甲酰胺、 2×SSC、10mM二硫苏糖醇中严格清洗;在磷酸盐缓冲盐水中漂清;并用20μg/ml RNaseA37℃处理30分钟。随后在37℃2×SSC和0.1×SSC中清洗15分钟后, 使载玻片脱水,将其浸在KodakNTB-2核示踪乳液中,并在4℃、有干燥剂的不 透光箱子中暴光一周。照片显影采用Kodak D-19。用Zeiss Axiophot显微镜的亮 视野和暗视野镜片分析载玻片。

Northern和Southern印迹分析

纯化获得长1633bp的EcoRⅠ片段(SEQ ID NO:2,核苷酸1113-2745)(对应于 cDNA克隆KO3的5'端)(图1),并用作Northern印迹分析的探针。该片段含有对 应于大多数蛋白酶结构域的序列;所有CUB1、CUB2和EGF1的结构域;和CUB3 结构域的大部分。用凝胶纯化上述用于原位杂交试验的339bp的PCR产物,并将 其用作Southern印迹分析的探针。用随机引导法(Feinberg和Vogelstein,"A technique for radiolabeling DNA restriction endonuclease fragments to high specific activity:Addendum,"Anal.Biochem.137:266-267(1984))对两个探针作放射性标记 至比活为4-6×109cpm/μg,并在Quichhyb(Stratagene)中68℃杂交成印迹1小时。 使Northern印迹(从Clontech获得)在68℃、2×SSC、0.1%SDS洗涤两次10分 钟,然后在68℃、以0.1×SSC、0.1%SDS洗涤两次15分钟。Southern印迹在 68℃、以2×SSC、0.1%SDS洗涤两次10分钟,然后在68℃、以0.1×SSC、 0.1%SDS中洗涤两次20分钟。

mTll基因的亚克隆和表达

BMP-1、mTld和mTll的成熟活性形式的氨基酸序列是相似的。只是每种蛋 白质的C端没有同源性。C端序列的这种独特性已经被用来生产一系列可区别三 种蛋白质形式的多克隆抗体。在小鼠mTll中,使合成的肽Ac-CYIRYK SIRYPETMHAKN-OH(对应于mTll最后的17个氨基酸)与蛋白质载体钥孔血兰 素连接,悬浮在盐水中,与等体积弗氏佐剂混合乳化,注入两只兔子每只背部皮 下3-4处。在加强免疫后12周和16周,放血取血清。不象小鼠和人之间的BMP-1 和mTld的C端氨基酸序列较为保守,小鼠和人mTll的C端氨基酸序列是不同的。 也许这是由于动物间的差异,小鼠mTllC端肽在兔子中产生的抗体滴度比BMP-1 和mTldC端肽高出3倍。为了产生人mTllC端特异性抗体,将采用肽Ac- CHIRYKSIRYPDTTHTK K-OH。这些抗体有商业用途,可用于试验显示细胞、 组织和哺乳动物有机体(包括但不局限于模型动物体系如啮齿类动物和灵长类动 物和人)中mTll蛋白质的产生和定位。由于对骨形态生成蛋白的了解进展迅速, 因此区别各组分的能力不仅在研究方面重要,而且在监测BMP体系疾病患者的 BMP体系组分水平和分布上也很重要。这些疾病可能包括,例如小鼠和人体的纤 维变性疾病。此外,由于TLL基因的缺陷,还可能会有遗传性发育异常。采用本 文所述的抗体和核酸探针就可确定mTll在这些遗传异常中起的作用。显然,mTll 蛋白质在BMP体系中是很重要的,因为它明显很好地取代了小鼠两个染色体上 均缺失的BMP-1等位基因BMP-1。这些小鼠在怀孕的全过程能够存活,但是在 脐区会发育形成持久的小肠疝。这些小鼠在出生后不久就会死亡,推测是由于缺 失BMP-1/mTld基因。然而,它们不表现出肉眼可见的模式形成(pattern formation) 紊乱、胶原纤维形成紊乱或总体发育紊乱。没有某些BMP-1/mTld样活性,就不 可能有这样清晰的发育顺序或甚至是胶原纤维形成。我们已经发现,BMP-1缺失 小鼠胚胎成纤维细胞中有这样的C端蛋白酶形式的活性。这些活性看来是由mTll 提供的,而且看来没有其他密切相关的基因。

序列表

(1)一般信息:  (ⅰ)申请人:Greenspan.Daniel S

         Takahara.Kazuhiko

         Hoffman.Guy G  (ⅱ)发明名称:哺乳动物的特洛德样蛋白质  (ⅲ)序列数目:13  (ⅳ)通信地址:

(A)收件人:Quarles & Brady

(B)街道:l South Pinckney Street

(C)城市:Madison

(D)州:WI

(E)国家:US

(F)邮编:53703

(V)计算机可读形式:

(A)记录介质类型:软盘

(B)计算机:IBM PC兼容型

(C)操作系统:PC-DOS/MS-DOS

(D)软件:PatentIn Release #1.0,Version#1.30  (ⅵ)本申请资料:

(A)申请号:

(B)申请日:

(C)分类:  (ⅷ)律师/代理人信息:

(A)NAME:Berson,Bennett J

(B)登记号:37094

(C)参考/案卷号:960296.93839  (ⅸ)通讯信息:

(A)电话:608-251-5000

(B)电传:608-251-9166

(2)SEQ ID NO:1的信息:  (ⅰ)序列特征:

(A)长度:330碱基对

(B)类型:核酸

(C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸探针"  (ⅹⅰ)序列描述:SEQ ID NO:1: ACGTCCAGAC CGGAGCGGGT GTGGCCCGAT GGGGTCATCC CGTTTGTGAT TGGAGGGAAT           60 TTCACAGGCA GCCAGAGGGC AGTCTTCCGG CAGGCCATGA GACACTGGGA GAAGCATACC          120 TGTGTCACCT TCTTGGAGCG CACAGATGAG GACAGCTATA TTGTATTCAC CTACCGACCC          180 TGCGGGTGCT GCTCCTACGT GGGTCGCCGA GGTGGGGGCC CCCAGGCCAT CTCCATCGGC          240 AAGAACTGTG ACAAGTTTGG CATCGTGGTC CATGAGCTGG GCCATGTCAT TGGCTTCTGG          300 CACGAGCACA CGCGGCCCGA CCGCGACCGC                                           330 (2)SEQ ID NO:2的信息:  (ⅰ)序列特征:

(A)长度:4771碱基对

(B)类型:核酸

(C)链型:双链

(D)拓扑结构:线性  (ⅱ)分子类型:DNA(基因组)  (ⅸ)特征:

(A)名称/关键:CDS

(B)位置:611..3652

(D)其它信息:/产物="小鼠mTll蛋白质"  (ⅹⅰ)序列描述:SEQ ID NO:2: CACACCCCTT TGCTCTCCGG GCAGTCGGGA GCTTCCCTAG CTTCGGCAGG CTTTTAAGGT           60 CTGGCGGCGT AGAAATGCCT ATCCCCCACC CCCTTCCTCG GTCTCCCCTT TCAGTTCAGA          120 TGTGCTGATG TGCAGACCGG ATTCATCTTC CCCGAGCAGC GGCGGTGGCA GCGGCGGGCG          180 CAGGCGGCTG CAGCTCGCTC TCGGCCGCGG GGTCCTGACA GCGGCGGGGG CGCGGCGCGG          240 GAGCCGGAGC TCCGGTGGCA GCTGAGCCCG CCGTGCGCCT CTCGCCGCGG CCGGTCGTGA          300 TCGCGGGAAG TTCGACCGCT GGAAGGACGA CCTAGACCGA GCCGGGTTGG CTGCGGCTGC          360 CCTGCGCCGA GCTCCTCACC TGCCTTCCGC CCACCCGCGG GCCCCCGGCC AAGTTCCCCA          420 GCATCCGGGG GAGACAGGGA GACATTTGCC CTCTCTAGCG TCCTGAAGAC ATCCGCATGT          480 CTCCGGACAC CTGAACATTC AGGTCTTTCC GAGGAGCTTC CCAGTCGGGA TAAGAACACT          540 GTCCCTAGAG CCCCGCATAT CCACGCGGCC CTCCGGGTCT GGTCCCCTCC TTTTCCTCTA          600 GGGGAGGAGG ATG GGT TTG CAA GCG CTC TCC CCG AGG ATG CTC CTG TGG             649

       Met Gly Leu Gln Ala Leu Ser Pro Arg Met Leu Leu Trp

         1               5                  10 TTG GTG GTC TCG GGT ATT GTT TTC TCC CGG GTG CTG TGG GTC TGC GCT            697 Leu Val Val Ser Gly Ile Val Phe Ser Arg Val Leu Trp Val Cys Ala

 15                  20                  25 GGC CTC GAT TAT GAT TAC ACT TTT GAT GGG AAC GAA GAG GAC AAA ACG            745 Gly Leu Asp Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr  30                  35                  40                  45 GAG CCT ATA GAT TAC AAG GAC CCG TGC AAA GCT GCT GTG TTT TGG GGT            793 Glu Pro Ile Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly

             50                  55                  60 GAC ATC GCC TTA GAT GAT GAA GAC TTA AAT ATC TTC CAA ATA GAC AGG            841 Asp Ile Ala Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg

         65                  70                  75 ACA ATT GAC CTG ACC CAG AGC CCC TTT GGA AAA CTT GGA CAT ATT ACA            889 Thr Ile Asp Leu Thr Gln Ser Pro Phe Gly Lys Leu Gly His Ile Thr

     80                  85                  90 GGT GGC TTT GGA GAC CAT GGC ATG CCA AAG AAG CGA GGG GCA CTC TAC            937 Gly Gly Phe Gly Asp His Gly Met Pro Lys Lys Arg Gly Ala Leu Tyr

 95                 100                 105 CAA CTT ATA GAG AGG ATC AGA AGA ATT GGC TCT GGC TTG GAG CAA AAT            985 Gln Leu Ile Glu Arg Ile Arg Arg Ile Gly Ser Gly Leu Glu Gln Asn 110                 115                 120                 125 AAC ACG ATG AAG GGA AAA GCA CCT CCA AAA TTG TCA GAG CAA AGT GAG           1033 Asn Thr Met Lys Gly Lys Ala Pro Pro Lys Leu Ser Glu Gln Ser Glu

            130                 135                 140 AAA AAT CGA GTT CCC AGA GCT GCT ACC TCA AGA ACG GAA AGG ATA TGG           1081 Lys Asn Arg Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp

        145                 150                 155 CCT GGG GGT GTC ATT CCT TAT GTC ATA GGA GGA AAC TTT ACT GGC AGC           1129 Pro Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser

    160                 165                 170 CAG AGA GCC ATG TTC AAG CAG GCC ATG AGA CAC TGG GAA AAG CAC ACC           1177 Gln Arg Ala Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr

175                 180                 185 TGT GTG ACG TTC ACT GAG AGA AGT GAT GAA GAA AGT TAT ATT GTG TTC           1225 Cys Val Thr Phe Thr Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe 190                 195                 200                 205 ACC TAC AGG CCT TGT GGA TGC TGC TCC TAT GTT GGT CGG CGG GGA AAT           1273 Thr Tyr Arg Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn

            210                 215                 220 GGC CCT CAG GCC ATC TCT ATT GGC AAG AAC TGT GAC AAG TTT GGA ATT           1321 Gly Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile

        225                 230                 235 GTT GTT CAT GAA CTG GGC CAC GTG ATA GGC TTC TGG CAT GAA CAT ACC           1369 Val Val His Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr

    240                 245                 250 CGC CCA GAC CGA GAC AAC CAT GTC ACC ATC ATT AGA GAG AAC ATC CAG           1417 Arg Pro Asp Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln

255                 260                 265 CCA GGT CAA GAG TAC AAT TTT CTA AAG ATG GAG CCT GGA GAA GTG AAC           1465 Pro Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn 270                 275                 280                 285 TCT CTT GGG GAA AGA TAT GAT TTT GAC AGT ATC ATG CAC TAC GCC AGG           1513 Ser Leu Gly Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg

            290                 295                 300 AAC ACC TTC TCA AGA GGG ATG TTT TTA GAC ACA ATA CTC CCC TCC CGT           1561 Asn Thr Phe Ser Ar9 Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg

        305                 310                 315 GAT GAT AAT GGC ATT CGT CCT GCA ATT GGT CAA CGG ACC CGG TTA AGC           1609 Asp Asp Asn Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser

    320                 325                 330 AAA GGA GAC ATT GCA CAA GCA AGA AAG CTG TAT CGA TGC CCA GCA TGT           1657 Lys Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys

335                 340                 345 GGA GAA ACC CTG CAA GAA TCC AGT GGC AAC CTT TCT TCC CCA GGA TTC           1705 Gly Glu Thr Leu Gln Glu Ser Ser Gly Asn Leu Ser Ser Pro Gly Phe 350                 355                 360                 365 CCA AAT GGC TAC CCT TCC TAC ACA CAC TGC ATC TGG AGA GTG TCT GTG           1753 Pro Asn Gly Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val

            370                 375                 380 ACC CCG GGA GAA AAG ATT GTC TTG AAT TTT ACC ACA ATG GAC CTT TAC           1801 Thr Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr

         385                390                 395 AAA AGT AGT TTG TGC TGG TAT GAT TAC ATT GAA GTA AGA GAT GGT TAC           1849 Lys Ser Ser Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr

    400                 405                 410 TGG AGG AAG TCA CCT CTC CTT GGT AGA TTC TGT GGG GAC AAA GTG GCT           1897 Trp Arg Lys Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Val Ala

415                 420                 425 GGA GTT CTT ACA TCT ACG GAC AGC AGA ATG TGG ATT GAG TTT CGT AGC           1945 Gly Val Leu Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser 430                 435                 440                 445 AGC AGT AAC TGG GTA GGA AAA GGG TTT GCA GCT GTC TAT GAA GCG ATT           1993 Ser Ser Asn Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile

            450                 455                 460 TGT GGA GGG GAG ATA AGG AAA AAC GAA GGG CAG ATT CAG TCT CCC AAT           2041 Cys Gly Gly Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn

        465                 470                 475 TAC CCC GAT GAC TAC CGA CCA ATG AAG GAG TGT GTA TGG AAA ATA ATG           2089 Tyr Pro Asp Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Met

    480                 485                 490 GTG TCC GAG GGC TAC CAT GTT GGA CTG ACC TTT CAG GCC TTT GAG ATC           2137 Val Ser Glu Gly Tyr His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile

495                 500                 505 GAA AGA CAT GAC AGC TGT GCC TAT GAC CAC CTA GAA GTT CGA GAT GGA           2185 Glu Arg His Asp Ser Cys Ala Tyr Asp His Leu Glu Val Arg Asp Gly 510                 515                 520                 525 GCC AGT GAG AAC AGC CCT TTG ATA GGA CGG TTC TGT GGT TAT GAC AAA           2233 Ala Ser Glu Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys

            530                 535                 540 CCT GAA GAT ATA AGG TCT ACT TCC AAC ACC CTG TGG ATG AAG TTT GTC           2281 Pro Glu Asp Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val

        545                 550                 555 TCT GAC GGG ACT GTG AAC AAG GCA GGG TTT GCT GCG AAC TTT TTT AAA           2329 Ser Asp Gly Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys

    560                 565                 570 GAG GAA GAT GAG TGT GCC AAA CCT GAC CGA GGA GGC TGT GAA CAG AGG           2377 Glu Glu Asp Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg

575                 580                 585 TGT CTT AAC ACA CTA GGC AGC TAC CAG TGT GCC TGT GAG CCT GGC TAT           2425 Cys Leu Asn Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr 590                 595                 600                 605 GAA CTG GGG CCA GAC AGA AGA AGC TGT GAA GCT GCT TGC GGA GGA CTT           2473 Glu Leu Gly Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu

            610                 615             620 CTG ACG AAG CTC AAT GGC ACC ATA ACC ACC CCC GGC TGG CCC AAA GAG           2521 Leu Thr Lys Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu

        625                 630                 635 TAC CCT CCA AAC AAA AAC TGT GTG TGG CAA GTG ATC GCG CCA AGC CAG           2569 Tyr Pro Pro Asn Lys Asn Cys Val Trp Gln Val Ile Ala Pro Ser Gln

    640                 645                 650 TAC AGA ATC TCT GTG AAG TTT GAG TTT TTT GAA TTG GAA GGC AAT GAA           2617 Tyr Arg Ile Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu

655                 660                 665 GTT TGC AAA TAC GAT TAC GTG GAG ATC TGG AGC GGC CCT TCC TCT GAG           2665 Val Cys Lys Tyr Asp Tyr Val Glu Ile Trp Ser Gly Pro Ser Ser Glu 670                 675                 680                 685 TCT AAA CTG CAT GGC AAG TTC TGT GGC GCT GAC ATA CCT GAA GTG ATG           2713 Ser Lys Leu His Gly Lys Phe Cys Gly Ala Asp Ile Pro Glu Val Met

            690                 695                 700 ACT TCC CAT TTC AAC AAC ATG AGG ATT GAA TTC AAG TCA GAC AAC ACT           2761 Thr Ser His Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr

        705                 710                 715 GTA TCC AAG AAG GGC TTC AAA GCA CAT TTT TTC TCA GAT AAG GAT GAG           2809 Val Ser Lys Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu

    720                 725                 730 TGT TCA AAG GAT AAT GGT GGC TGT CAG CAT GAG TGT GTC AAC ACG ATG           2857 Cys Ser Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met

735                 740                 745 GGA AGT TAC ACG TGT CAG TGC CGG AAT GGA TTC GTG TTG CAT GAG AAC           2905 Gly Ser Tyr Thr Cys Gln Cys Arg Asn Gly Phe Val Leu His Glu Asn 750                 755                 760                 765 AAG CAT GAT TGC AAG GAA GCC GAG TGT GAA CAG AAG ATA CAC AGC CCA           2953 Lys His Asp Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro

            770                 775                 780 AGT GGT CTC ATC ACC AGT CCC AAC TGG CCA GAC AAG TAT CCA AGC AGG           3001 Ser Gly Leu Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg

        785                 790                 795 AAA GAG TGC ACG TGG GTG ATC AGT GCC ATT CCT GGC CAC CGC ATC ACA           3049 Lys Glu Cys Thr Trp Val Ile Ser Ala Ile Pro Gly His Arg Ile Thr

    800                 805                 810 TTA GCC TTC AAT GAG TTT GAG GTT GAA CAA CAT CAA GAA TGT GCT TAT           3097 Leu Ala Phe Asn Glu Phe Glu Val Glu Gln His Gln Glu Cys Ala Tyr

815                 820                 825 GAT CAC TTG GAA ATT TTT GAT GGA GAA ACG GAG AAG TCA CCA ATA CTT           3145 Asp His Leu Glu Ile Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu 830                 835                 840                 845 GGC CGA CTA TGT GGC AGC AAG ATA CCA GAT CCC CTC ATG GCT ACT GGG           3193 Gly Arg Leu Cys Gly Ser Lys Ile Pro Asp Pro Leu Met Ala Thr Gly

            850                 855                 860 AAT GAA ATG TTT ATT CGG TTT ATT TCT GAT GCC TCT GTT CAA AGA AAA           3241 Asn Glu Met Phe Ile Arg Phe Ile Ser Asp Ala Ser Val Gln Arg Lys

        865                 870                 875 GGC TTT CAA GCT ACA CAT TCC ACA GAG TGT GGT GGT CGA TTG AAA GCA           3289 Gly Phe Gln Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala

    880                 885                 890 GAG TCA AAG CCT AGA GAC CTG TAC TCC CAT GCT CAG TTr GGT GAT AAT           3337 Glu Ser Lys Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn

895                 900                 905 AAC TAC CCA GGA CAA CTG GAC TGT GAA TGG TTG TTG GTG TCA GAA CGA           3385 ASh Tyr Pro Gly Gln Leu Asp Cys Glu Trp Leu Leu Val Ser Glu Arg 910                 915                 920                 925 GGA TCT CGA CTT GAA TTG TCC TTC CAG ACA TTC GAA GTA GAA GAA GAA           3433 Gly Ser Arg Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu

            930                 935                 940 GCT GAC TGT GGC TAT GAC TAT GTT GAA GTC TTT GAT GGT CTC AGT TCA           3481 Ala Asp Cys Gly Tyr Asp Tyr Val Glu Val Phe Asp Gly Leu Ser Ser

        945                 950                 955 AAA GCT GTG GGT CTT GGT AGA TTC TGT GGG TCA GGG CCA CCA GAA GAA           3529 Lys Ala Val Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu

    960                 965                 970 ATC TAT TCA ATT GGA GAT GTG GCT TTG ATT CAT TTC CAC ACA GAT GAC           3577 Ile Tyr Ser Ile Gly Asp Val Ala Leu Ile His Phe His Thr Asp Asp

975                 980                 985 ACT ATC AAC AAG AAA GGA TTT TAT ATA AGA TAT AAA AGT ATA AGA TAC           3625 Thr Ile Asn Lys Lys Gly Phe Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr 990                 995                 1000                1005 CCG GAA ACG ATG CAT GCC AAG AAC TAA TGCCGACCCT CCCTCAGAAC                 3672 Pro Glu Thr Met His Ala Lys Asn*

            1010 AGAAAGGAAT GTGCATATGG AAAGAAGACA TTTTTAAAAT AGACAATATT AATACAATTG         3732 TTTTATATAA TGAATTTGAG CAAAAGAAAC CTGCAAGATT AGAGTTATCT CTGAAGTGAA         3792 AGAGAACTTT CCAGAAAACC TGATTGGCAT TGCAAGGATG TTTGAAAGTC ATGCTTGTTC         3852 AAGGAAGATT AACAGCTTGA AATAGATGCT TCACATTTTG GACAGTTCAT TTAATGAGCT         3912 GTGATTCTCT GGAGTGATTT CTTGACTACT TTTCCAAGAT CTGGGGACGT AGAAATGATG         3972 GGACGGATCA TAGCTTGGAA ACCCACTTCT TGGGTCTTAG CATGTTTGCT TAGACTCTGT         4032 AGGTCAGACA CAGTGTAAAC CAAATTCATG TAAGGTGATG TGGAATAGTG GTCTTTGGAA         4092 GGTGGTTCAT CATTTAAATG TAGGTTTGTG CTTGTGTGTA TGTTCACATA TGCAAGTGTG         4152 TGTGTGTGTG TGTGTGTGTG TGTGTGTGTG TGTGTGCGTG TGTGTGTGTG TGCGTGTGTG         4212 TGTGTGTGCA TGTGTGTGCA TGTGTGTTTG GAAACTGGAA TATTTCATCT TCATTATTTT         4272 CAAATGCAGG CCAGCTTAAC CTGTTCACAC AAATGATTTT GTGACCACTT CATTGTATCT         4332 GTATCTTGAG AAGTTTGAAA TATCTATAGT GTCTACAATG CAGTTAATCC CTAGATATCG         4392 GATAATACCC AGTTCACTAG TAAACTCATT TCTCTCTGGG GAAGTGCTGA ATAGTCTCCA         4452 AATTCAAGAA ACTCACCATG TCTTATAAAC CTTTAAGATA AAATTCCAAC GAGGTGTGTG         4512 CAGCCATCTT CCAAATGACT GCCTGGATGT TTCTTAGTCC AGTTACTACT GCTGCTGCTA         4572 TTGGTCTTTC TTTTATTGTT AATGTGTTGA TATGTTGTTA TTATTATGGT TATTATTATT         4632 GATGTTGTTA CTATATTTAA AAATGATGAG ATGAAGTGGA AGTAGAGTTT GGGAGAAATG         4692 AAATCTCTCT TTTTTGTTCT CTTCTTGAAA TTCAGTTTCA AAAAATACAA TATTGGGTGG         4752 CAAAAAAAAA AAAAAAAAA                                                      4771 (2)SEQ ID NO:3的信息:  (ⅰ)序列特征:

(A)长度:1014氨基酸

(B)类型:氨基酸

(D)拓扑结构:线性  (ⅱ)分子类型:蛋白质  (ⅹⅰ)序列描述:SEQ ID NO:3: Met Gly Leu Gln Ala Leu Ser Pro Arg Met Leu Leu Trp Leu Val Val   1               5                  10                  15 Ser Gly Ile Val Phe Ser Arg Val Leu Trp Val Cys Ala Gly Leu Asp

         20                  25                  30 Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Pro Ile

     35                  40                  45 Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala

 50                  55                  60 Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Iie Asp  65                  70                  75                  80 Leu Thr Gln Ser Pro Phe Gly Lys Leu Gly His Ile Thr Gly Gly Phe

             85                  90              95 Gly Asp His Gly Met Pro Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile

        100                 105                 110 Glu Arg Ile Arg Arg Ile Gly Ser Gly Leu Glu Gln Asn Asn Thr Met

    115                 120                 125 Lys Gly Lys Ala Pro Pro Lys Leu Ser Glu Gln Ser Glu Lys Asn Arg

130                 135                140 Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly 145                 150                 155                 160 Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala

            165                 170                 175 Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr

        180                 185                 190 Phe Thr Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg

    195                 200                 205 Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln

210                 215                 220 Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His 225                 230                 235                 240 Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp

            245                 250                 255 Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln

        260                 265                 270 Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly

    275                 280                 285 Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe

290                 295                 300 Ser Arg Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn 305                 310                 315                 320 Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp

            325                 330                 325 Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr

        240                 345                 350 Leu Gln Glu Ser Ser Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly

    255                 360                 365 Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly

370                 375                 380 Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser 385                 390                 395                 400 Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys

            405                 410                 415 Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Val Ala Gly Val Leu

        420                 425                 430 Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Asn

    435                 440                 445 Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly

450                 455                 460 Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp 465                 470                 475                 480 Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Met Val Ser Glu

            485                 490                 495 Gly Tyr His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile Glu Arg His

        500                 505                 510 Asp Ser Cys Ala Tyr Asp His Leu Glu Val Arg Asp Gly Ala Ser Glu

    515                 520                 525 Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp

530                 535                 540 Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly 545                 550                 555                 560 Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp

            565                 570                 575 Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn

        580                 585                 590 Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly

    595                 600                 605 Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys

610                 615                 620 Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro 625                 630                 635                 640 Asn Lys Asn Cys Val Trp Gln Val Ile Ala Pro Ser Gln Tyr Arg Ile

            645                 650                 655 Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys

        660                 665                 670 Tyr Asp Tyr Val Glu Ile Trp Ser Gly Pro Ser Ser Glu Ser Lys Leu

    675                 680                 685 His Gly Lys Phe Cys Gly Ala Asp Ile Pro Glu Val Met Thr Ser His

690                 695                 700 Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys 705                 710                 715                 720 Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys

            725                 730                 735 Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr

        740                 745                 750 Thr Cys Gln Cys Arg Asn Gly Phe Val Leu His Glu Asn Lys His Asp

    755                 760                 765 Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu

770             775             780 Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys 785                 790                 795                 800 Thr Trp Val Ile Ser Ala Ile Pro Giy His Arg Ile Thr Leu Ala Phe

            805                 810                 815 Asn Glu Phe Glu Val Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu

        820                 825                 830 Glu Ile Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu

    835                 840                 845 Cys Gly Ser Lys Ile Pro Asp Pro Leu Het Ala Thr Gly Asn Glu Het

850                 855                 860 Phe Ile Arg Phe Ile Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln 865                 870                 875                 880 Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys

            885                 890                 895 Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro

        900                 905                 910 Gly Gln Leu Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg

    915                 920                 925 Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys

930                 935                 940 Gly Tyr Asp Tyr Val Glu Val Phe Asp Gly Leu Ser Ser Lys Ala Val 945                 950                 955                 960 Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser

            965                 970                 975 Ile Gly Asp Val Ala Leu Ile His Phe His Thr Asp Asp Thr Ile Asn

        980                 985                 990 Lys Lys Gly Phe Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Glu Thr

    995                 1000                1005 Met His Ala Lys Asn*

1010 (2)SEQ ID NO:4的信息:  (ⅰ)序列特征:

(A)长度:3919碱基对

(B)类型:核酸

(C)链型:双链

(D)拓扑结构:线性  (ⅱ)分子类型:DNA(基因组)  (ⅵ)来源:

(A)生物体:Homo sapiens  (ⅸ)特征:

(A)名称/关键:CDS

(B)位置:648..3689

(D)其它信息:/产物="人mTll蛋白质"  (ⅹⅰ)序列描述:SEQ ID NO:4: CTCACACTTT TGCTCTCTTG CAGTCAGTTG CTTTGCTGGC TTCTGCAGGC TTTTAAGGTC           60 TCGCGGCGTA GAAATGCCTG GCCCCCACCC CCTTCCTCGG TCTCCCCTTT CAATTCAGAT          120 GTGCTGATGT GCAGACCGGA TTCATCTTCT CGGAGCTGCG GCGGCGGCTT TGGGCTCAGG          180 CGGCGGCGGC TCGCGCTCGG CCGCGGAGTC CTGGCAGCAG CGGGGACGCG GCGCGGGAGT          240 CCGAGCTCTG GTGGCAGCTG AGCCCGCGGG GCGCCGCTCG CCGAGCCGCG GCCGCGGGAA          300 GTTCGGCAGC CAGAAGGACG ACCTGGCAGG CTGCGAGCGC CAGCGCCGCC AGAGCCGAGT          360 TTGCCTGCGC CCTCCCCGCC TCCGAGTGCA GAGTTCCTTA CCTGCCCTCC GCCCACCCGT          420 GGGCCCCTAG CCAACTTCTC CCTGCGACTG GGGGTAACAG GCAGTGCTTG CCCTCTCTAC          480 TGTCCCGGCG GCATCCACAT GTTTCCGGAC ACCTGAGCAC CCCGGTCCCG CCGAGGAGCC          540 TCCGGGTGGG GAGAAGAGCA CCGGTGCCCC TAGCCCCGCA CATCAGCGCG GACCGCGGCT          600 GCCTAACCTC TGGGTCCCGT CCCCTCCTTT TCCTCCGGGG GAGGAGG ATG GGG TTG            656

                                                Met Gly Leu

                                                1015 GGA ACG CTT TCC CCG AGG ATG CTC GTG TGG CTG GTG GCC TCG GGG ATT            704 Gly Thr Leu Ser Pro Arg Met Leu Val Trp Leu Val Ala Ser Gly Ile

    1020                1025                1030 GTT TTC TAC GGG GAG CTA TGG GTC TGC GCT GGC CTC GAT TAT GAT TAC            752 Val Phe Tyr Gly Glu Leu Trp Val Cys Ala Gly Leu Asp Tyr Asp Tyr

1035                1040                1045 ACT TTT GAT GGG AAC GAA GAG GAT AAA ACA GAG ACT ATA GAT TAC AAG            800 Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Thr Ile Asp Tyr Lys 1050                1055                1060                1065 GAC CCG TGT AAA GCC GCT GTA TTT TGG GGC GAT ATT GCC TTA GAT GAT            848 Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala Leu Asp Asp

            1070                1075                1080 GAA GAC TTA AAT ATC TTT CAA ATA GAT AGG ACA ATT GAC CTT ACG CAG            896 Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Ile Asp Leu Thr Gln

        1085                1090                1095 AAC CCC TTT GGA AAC CTT GGA CAT ACC ACA GGT GGA CTT GGA GAC CAT           944 Asn Pro Phe Gly Asn Leu Gly His Thr Thr Gly Gly Leu Gly Asp His

    1100                1105                1110 GCT ATG TCA AAG AAG CGA GGG GCC CTC TAC CAA CTT ATA GAC AGG ATA            992 Ala Met Ser Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile Asp Arg Ile

1115                1120                1125 AGA AGA ATT GGC TTT GGC TTG GAG CAA AAC AAC ACA GTT AAG GGA AAA           1040 Arg Arg Ile Gly Phe Gly Leu Glu Gln Asn Asn Thr Val Lys Gly Lys 1130                1135                1140                1145 GTA CCT CTA CAA TTC TCA GGG CAA AAT GAG AAA AAT CGA GTT CCC AGA           1088 Val Pro Leu Gln Phe Ser Gly Gln Asn Glu Lys Asn Arg Val Pro Arg

            1150                1155                1160 GCC GCT ACA TCA AGA ACG GAA AGA ATA TGG CCT GGA GGC GTT ATT CCT           1136 Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly Val Ile Pro

        1165                1170                1175 TAT GTT ATA GGA GGA AAC TTC ACT GGC AGC CAG AGA GCC ATG TTC AAG           1184 Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala Met Phe Lys

    1180                1185                1190 CAG GCC ATG AGG CAC TGG GAA AAG CAC ACA TGT GTG ACT TTC ATA GAA           1232 Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr Phe Ile Glu

1195                1200                1205 AGA AGT GAT GAA GAG AGT TAC ATT GTA TTC ACC TAT AGG CCT TGT GGA           1280 Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg Pro Cys Gly 1210                1215                1220                1225 TGC TGC TCC TAT GTA GGT CGG CGA GGA AAT GGA CCT CAG GCA ATC TCT           1328 Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln Ala Ile Ser

            1230                1235                1240 ATC GGC AAG AAC TGT GAT AAA TTT GGG ATT GTT GTT CAT GAA TTG GGT           1376 Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His Glu Leu Gly

        1245                1250                1255 CAT GTG ATA GGC TTT TGG CAT GAA CAC ACA AGA CCA GAT CGA GAT AAC           1424 His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp Arg Asp Asn

    1260                1265                1270 CAC GTA ACT ATC ATA AGA GAA AAC ATC CAG CCA GGT CAA GAG TAC AAT           1472 His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln Glu Tyr Asn

1275                1280                1285 TTT CTG AAG ATG GAG CCT GGA GAA GTA AAC TCA CTT GGA GAA AGA TAT           1520 Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly Glu Arg Tyr 1290                1295                1300                1305 GAT TTC GAC AGT ATC ATG CAC TAT GCC AGG AAC ACC TTC TCA AGG GGG           1568 Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe Ser Arg Gly

            1310                1315                1320 ATG TTT CTG GAT ACC ATT CTC CCC TCC CGT GAT GAT AAT GGC ATA CGT           1616 Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn Gly Ile Arg

        1325                1330                1335 CCT GCA ATT GGT CAG CGA ACC CGT CTA AGC AAA GGA GAT ATC GCA CAG           1664 Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp Ile Ala Gln

    1340                1345                1350 GCA AGA AAG CTG TAT AGA TGT CCA GCA TGT GGA GAA ACT CTA CAA GAA           1712 Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr Leu Gln Glu

1355                1360                1365 TCC AAT GGC AAC CTT TCC TCT CCA GGA TTT CCC AAT GGC TAC CCT TCT           1760 Ser Asn Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly Tyr Pro Ser 1370                1375                1380                1385 TAC ACA CAC TGC ATC TGG AGA GTT TCT GTG ACC CCA GGG GAG AAG ATT           1808 Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly Glu Lys Ile

            1390                1295                1400 GTT TTA AAT TTT ACA ACG ATG GAT CTA TAC AAG AGT AGT TTG TGC TGG           1856 Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser Leu Cys Trp

        1405                1410                1415 TAT GAC TAT ATT GAA GTA AGA GAC GGG TAC TGG AGA AAA TCA CCT CTC           1904 Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys Ser Pro Leu

    1420                1425                1430 CTT GGT AGA TTC TGT GGG GAC AAA TTG CCT GAA GTT CTT ACT TCT ACA           1952 Leu Gly Arg Phe Cys Gly Asp Lys Leu Pro Glu Val Leu Thr Ser Thr

1435                1440                1445 GAC AGC AGA ATG TGG ATT GAG TTT CGT AGC AGC AGT AAT TGG GTA GGA           2000 Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Asn Trp Val Gly 1450                1455                1460                1465 AAA GGC TTT GCA GCT GTC TAT GAA GCG ATC TGT GGA GGT GAG ATA CGT           2048 Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly Glu Ile Arg

            1470                1475                1480 AAA AAT GAA GGA CAG ATT CAG TCT CCC AAT TAT CCT GAT GAC TAT CGC           2096 Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp Asp Tyr Arg

        1485                1490                1495 CCG ATG AAA GAA TGT GTG TGG AAA ATA ACA GTG TCT GAG AGC TAC CAC           2144 Pro Met Lys Glu Cys Val Trp Lys Ile Thr Val Ser Glu Ser Tyr His

    1500                1505                1510 GTC GGG CTG ACC TTT CAG TCC TTT GAG ATT GAA AGA CAT GAC AAT TGT           2192 Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His Asp Asn Cys

1515                1520                1525 GCT TAT GAC TAC CTG GAA GTT AGA GAT GGA ACC AGT GAA AAT AGC CCT           2240 Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Thr Ser Glu Asn Ser Pro 1530                1535                1540                1545 TTG ATA GGG CGT TTC TGT GGT TAT GAC AAA CCT GAA GAC ATA AGA TCT           2288 Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp Ile Arg Ser

            1550                1555                1560 ACC TCC AAT ACT TTG TGG ATG AAG TTT GTT TCT GAC GGA ACT GTG AAC           2336 Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly Thr Val Asn

        1565                1570                1575 AAA GCA GGG TTT GCT GCT AAC TTT TTT AAA GAG GAA GAT GAG TGT GCC           2384 Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp Glu Cys Ala

    1580                1585                1590 AAA CCT GAC CGT GGA GGC TGT GAG CAG CGA TGT CTG AAC ACT CTG GGC           2432 Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn Thr Leu Gly

1595                1600                1605 AGT TAC CAG TGT GCC TGT GAG CCT GGC TAT GAG CTG GGC CCA GAC AGA           2480 Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly Pro Asp Arg 1610                1615                1620                1625 AGG AGC TGT GAA GCT GCT TGT GGT GGA CTT CTT ACC AAA CTT AAC GGC           2528 Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys Leu Asn Gly

            1630                1635                1640 ACC ATA ACC ACC CCT GGC TGG CCC AAG GAG TAC CCT CCT AAT AAG AAC           2576 Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro Asn Lys Asn

        1645                1650                1655 TGT GTG TGG CAA GTG GTT GCA CCA ACC CAG TAC AGA ATT TCT GTG AAG           2624 Cys Val Trp Gln Val Val Ala Pro Thr Gln Tyr Arg Ile Ser Val Lys

    1660                1665                1670 TTT GAG TTT TTT GAA TTG GAA GGC AAT GAA GTT TGC AAA TAT GAT TAT           2672 Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys Tyr Asp Tyr

1675                1680                1685 GTG GAG ATC TGG AGT GGT CTT TCC TCT GAG TCT AAA CTG CAT GGC AAA           2720 Val Glu Ile Trp Ser Gly Leu Ser Ser Glu Ser Lys Leu His Gly Lys 1690                1695                1700                1705 TTC TGT GGC GCT GAA GTG CCT GAA GTG ATC ACA TCC CAG TTC AAC AAT           2768 Phe Cys Gly Ala Glu Val Pro Glu Val Ile Thr Ser Gln Phe Asn Asn

            1710                1715                1720 ATG AGA ATT GAA TTC AAA TCT GAC AAT ACT GTA TCC AAG AAG GGC TTC           2816 Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys Lys Gly Phe

        1725                1730                1725 AAA GCA CAT TTT TTC TCA GAC AAA GAT GAA TGC TCT AAG GAT AAT GGT           2864 Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys Asp Asn Gly

    1740                1745                1750 GGA TGT CAG CAC GAA TGT GTC AAC ACG ATG GGG AGC TAC ATG TGT CAA           2912 Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr Met Cys Gln

1755                1760                1765 TGC CGT AAT GGA TTT GTG CTA CAT GAC AAT AAA CAT GAT TGC AAG GAA           2960 Cys Arg Asn Gly Phe Val Leu His Asp Asn Lys His Asp Cys Lys Glu 1770                1775                1780                1785 GCT GAG TGT GAA CAG AAG ATC CAC AGT CCA AGT GGC CTC ATC ACC AGT           3008 Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu Ile Thr Ser

            1790                1795                1800 CCC AAC TGG CCA GAC AAG TAC CCA AGC AGG AAA GAA TGC ACT TGG GAA           3056 Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys Thr Trp Glu

        1805                1810                1815 ATC AGC GCC ACT CCC GGC CAC CGA ATC AAA TTA GCC TTT AGT GAA TTT           3104 Ile Ser Ala Thr Pro Gly His Arg Ile Lys Leu Ala Phe Ser Glu Phe

    1820                1825                1830 GAG ATT GAG CAG CAT CAA GAA TGT GCT TAT GAC CAC TTA GAA GTA TTT           3152 Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu Glu Val Phe

1835                1840                1845 GAT GGA GAA ACA GAA AAG TCA CCG ATT CTT GGA CGA CTA TGT GGC AAC           3200 Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu Cys Gly Asn 1850                1855                1860                1865 AAG ATA CCA GAT CCC CTT GTG GCT ACT GGA AAT AAA ATG TTT GTT CGG           3248 Lys Ile Pro Asp Pro Leu Val Ala Thr Gly Asn Lys Met Phe Val Arg

            1870                1875                1880 TTT GTT TCT GAT GCA TCT GTT CAA AGA AAA GGC TTT CAA GCC ACA CAT           3296 Phe Val Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln Ala Thr His

        1885                1890                1895 TCT ACA GAG TGT GGC GGA CGA TTG AAA GCA GAA TCA AAA CCA AGA GAT           3344 Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys Pro Arg Asp

    1900                1905                1910 CTG TAC TCA CAT GCT CAG TTT GGT GAT AAC AAC TAC CCA GGA CAG GTT           3392 Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro Gly Gln Val

1915                1920                1925 GAC TGT GAA TGG CTA TTA GTA TCA GAA CGG GGC TCT CGA CTT GAA TTA           3440 Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg Leu Glu Leu 1930                1935                1940                1945 TCC TTC CAG ACA TTT GAA GTG GAG GAA GAA GCA GAC TGT GGC TAT GAC           3488 Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys Gly Tyr Asp

            1950                1955                1960 TAT GTG GAG CTC TTT GAT GGT CTT GAT TCA ACA GCT GTG GGG CTT GGT           3536 Tyr Val Glu Leu Phe Asp Gly Leu Asp Ser Thr Ala Val Gly Leu Gly

        1965                1970                1975 CGA TTC TGT GGA TCC GGG CCA CCA GAA GAG ATT TAT TCA ATT GGA GAT           3584 Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser Ile Gly Asp

    1980                1985                1990 TCA GTT TTA ATT CAT TTC CAC ACT GAT GAC ACA ATC AAC AAG AAG GGA           3632 Ser Val Leu Ile His Phe His Thr Asp Asp Thr Ile Asn Lys Lys Gly

1995                2000                2005 TTT CAT ATA AGA TAC AAA AGC ATA AGA TAT CCA GAT ACC ACA CAT ACC           3680 Phe His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr Thr His Thr 2010                2015                2020                2025 AAA AAA TAA CACCAAAACC TCTGTCAGAA CACAAAGGAA TGTGCATAAT                   3729 Lys Lys  * GGAGAGAAGACATATTTTTT TTAAAACTGA AGATATTGGC ACAAATGTTT TATACAAAGA          3789 GTTTGAACAAAAAATCCCTG TAAGACCAGA ATTATCTTTG TACTAAAAGA GAAGTTTCCA          3849 GCAAAACCCTCATCAGCATT ACAAGGATAT TTGAACTCCA TGCTTGATGG TATTAATAAA          3909 GCTGGTGAAA                                                                3919 (2)SEQ ID NO:5的信息:  (ⅰ)序列特征:

(A)长度:1014氨基酸

(B)类型:氨基酸

(D)拓扑结构:线性  (ⅱ)分子类型:蛋白质  (ⅹⅰ)序列描述:SEQ ID NO:5: Met Gly Leu Gly Thr Leu Ser Pro Arg Met Leu Val Trp Leu Val Ala   1               5                  10                  15 Ser Gly Ile Val Phe Tyr Gly Glu Leu Trp Val Cys Ala Gly Leu Asp

         20                  25                  30 Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Thr Ile

     35                  40                  45 Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala

 50                  55                  60 Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Ile Asp  65                  70                  75                  80 Leu Thr Gln Asn Pro Phe Gly Asn Leu Gly His Thr Thr Gly Gly Leu

             85                  90                  95 Gly Asp His Ala Met Ser Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile

        100                 105                 110 Asp Arg Ile Arg Arg Ile Gly Phe Gly Leu Glu Gln Asn Asn Thr Val

    115                 120                 125 Lys Gly Lys Val Pro Leu Gln Phe Ser Gly Gln Asn Glu Lys Asn Arg

130                 135                 140 Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly 145                 150                 155                 160 Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala

            165                 170                 175 Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr

        180                 185                 190 Phe Ile Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg

    195                 200                 205 Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln

210                 215                 220 Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His 225                 230                 235                 240 Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp

            245                 250                 255 Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln

        260                 265                 270 Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly

    275                 280                 285 Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe

290                 295                 300 Ser Arg Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn 305                 310                 315                 320 Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp

            325                 330                 335 Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr

        340                 345                 350 Leu Gln Glu Ser Asn Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly

    355                 360                 365 Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly

370                 375                 380 Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser 385                 390                 395                 400 Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys

            405                 410                 415 Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Leu Pro Glu Val Leu

        420                 425                 430 Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Ash

    435                 440                 445 Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly

450                 455                 460 Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp 465                 470                 475                 480 Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Thr Val Ser Glu

            485                 490                 495 Ser Tyr His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His

        500                 505                 510 Asp Asn Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Thr Ser Glu

    515                 520                 525 Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp

530                 535                 540 Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly 545                 550                 555                 560 Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp

            565                 570                 575 Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn

        580                 585                 590 Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly

    595                 600                 605 Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys

610                 615                 620 Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro 625                 630                 635                 640 Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Thr Gln Tyr Arg Ile

            645                 650                 655 Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys

        660                 665                 670 Tyr Asp Tyr Val Glu Ile Trp Ser Gly Leu Ser Ser Glu Ser Lys Leu

    675                 680                 685 His Gly Lys Phe Cys Gly Ala Glu Val Pro Glu Val Ile Thr Ser Gln

690                 695                 700 Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys 705                 710                 715                 720 Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys

            725                 730                 735 Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr

        740                 745                 750 Met Cys Gln Cys Arg Asn Gly Phe Val Leu His Asp Asn Lys His Asp

    755                 760             765 Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu

770                 775                 780 Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys 785                 790                 795                 800 Thr Trp Glu Ile Ser Ala Thr Pro Gly His Arg Ile Lys Leu Ala Phe

            805                 810                 815 Ser Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu

        820                 825                 830 Glu Val Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu

    835                 840                 845 Cys Gly Asn Lys Ile Pro Asp Pro Leu Val Ala Thr Gly Asn Lys Met

850                 855                 860 Phe Val Arg Phe Val Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln 865                 870                 875                 880 Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys

            885                 890                 895 Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro

        900                 905                 910 Gly Gln Val Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg

    915                 920                 925 Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys

930                 935                 940 Gly Tyr Asp Tyr Val Glu Leu Phe Asp Gly Leu Asp Ser Thr Ala Val 945                 950                 955                 960 Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser

            965                 970                 975 Ile Gly Asp Ser Val Leu Ile His Phe His Thr Asp Asp Thr Ile Asn

        980                 985                 990 Lys Lys Gly Phe His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr

    995                 1000                1005 Thr His Thr Lys Lys *

1010 (2)SEQ ID NO:6的信息:  (ⅰ)序列特征:

(A)长度:20碱基对

(B)类型:核酸

(C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸引物"  (ⅹⅰ)序列描述:SEQ ID NO:6: CCAGCTTAAC CTGTTCACAC                                      20 (2)SEQ ID NO:7的信息:  (ⅰ)序列特征:

  (A)长度:20碱基对

  (B)类型:核酸

  (C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸引物"  (ⅹⅰ)序列描述:SEQ ID NO:7: AACTCTACTT CCACTTCATC                                      20 (2)SEQ ID NO:8的信息:  (ⅰ)序列特征:

(A)长度:20碱基对

(B)类型:核酸

(C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸引物"  (ⅹⅰ)序列描述:SEQ ID NO:8: TCAGAACAGA AAGGAATGTG                                      20 (2)SEQ ID NO:9的信息:  (ⅰ)序列特征:

(A)长度:20碱基对

(B)类型:核酸

(C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸引物"  (ⅹⅰ)序列描述:SEQ ID NO:9: GACCACTATT CCACATCACC                                      20 (2)SEQ ID NO:10的信息:  (ⅰ)序列特征:

(A)长度:24碱基对

(B)类型:核酸

(C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸引物"  (ⅹⅰ)序列描述:SEQ ID NO:10: TCTTGCAGTC AGTTGCTTTG CTGG                                 24 (2)SEQ ID NO:11的信息:  (ⅰ)序列特征:

(A)长度:28碱基对

(B)类型:核酸

(C)链型:单链

(D)拓扑结构:线性  (ⅱ)分子类型:其它核酸

(A)描述:/描述="寡核苷酸引物"  (ⅹⅰ)序列描述:SEQ ID NO:11: TAGTGCGGCC GCACATTCCT TTGTGTTC                             28 (2)SEQ ID NO:12:的信息  (ⅰ)序列特征:

(A)长度:18氨基酸

(B)类型:氨基酸

(C)链型:

(D)拓扑结构:线性  (ⅱ)分子类型:肽  (ⅹⅰ)序列描述:SEQ ID NO:12: Cys Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Glu Thr Met His Ala 1               5                   10                  15 Lys Asn (2)SEQ ID NO:13:的信息  (ⅰ)序列特征:

(A)长度:18氨基酸

(B)类型:氨基酸

(C)链型:

(D)拓扑结构:线性  (ⅱ)分子类型:肽  (ⅹⅰ)序列描述:SEQ ID NO:13: Cys His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr Thr His Thr 1               5                   10                  15 Lys Lys

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈