半衰期延长的人因子Ⅸ变体 |
|||||||
申请号 | CN200880122214.9 | 申请日 | 2008-10-15 | 公开(公告)号 | CN102026653B | 公开(公告)日 | 2014-06-18 |
申请人 | 北卡罗来纳-查佩尔山大学; 启示生物制药公司; | 发明人 | D·W·斯坦福德; D·M·曼; D·冯; | ||||
摘要 | 说明了糖基化位点数目增加的因子IX变体。所述因子IX变体的 半衰期 延长和/或回收提高。 | ||||||
权利要求 | |||||||
说明书全文 | 半衰期延长的人因子Ⅸ变体背景技术发明领域 [0003] 本发明涉及包含附加的糖基化位点的因子IX变体,以及编码该因子IX变体的核酸构建体。 [0004] 相关技术的说明 [0005] 可商购的因子IX有血浆来源的产品(Mononine )和重组蛋白(Benefix)。Mononine 的缺点在于传播通过由纯化步骤所带有的细菌和病毒(例如HIV,肝炎病 毒)污染而造成的疾病的可能。重组蛋白(例如Benefix )的使用避免了这些问题。 然而,在实验动物模型系统和人的静脉内(i.v.)弹丸注入后,重组因子IX(r因子IX,例 如Benefix )的药物动力学性质比人血浆来源的因子IX(pd因子IX,例如Mononine )的性质差。由于r因子IX不够良好的药物动力学性质,因此一般r因子IX的剂量需要 高20-30%以达到与pd因子IX相同的促凝血活性水平(White等,(April1998),Seminars in Hematology,vol.35,no.2 SuppI.2:33-38;Roth 等,(December 15,2001)Blood vol.98(13):3600-3606)。 [0006] 已证实向蛋白中添加糖基化位点是延长它们半衰期的重要工具。例如,达贝泊汀-α(Darbepoetin-a)是红细胞生成素的重组形式,其中添加了两个附加的N-连接 糖基化位点(Elliott等,Enhancement of therapeutic protein invivo activities through glycoengineering,Nat Biotechnol.(2003)21:414-421)。 为了产生达贝 泊汀,将残基30和32突变产生一个糖基化位点,并且将残基87、88和90突变产生第 二糖基化位点。具有这两个附加糖基化位点的达贝泊汀的半衰期是正常红细胞生成素 的三倍;此外,它的安全性与红细胞生成素没有差别。尽管达贝泊汀分子具有5个氨 基酸的变化,但是自2004年以来,未鉴别出对达贝泊汀的抗体发展的病例(Smalling 等,“Drug-induced andantibody-mediated pure red cell aplasia:a review of literature and currentknowledge”,Biotechnol Annu Rev.(2004)10:237-250; Sinclair等,“Glycoengineering:the effect of glycosylation on the properties of therapeuticprotein”,J Pharm Sci.(2005)94:1626-1635)。添加neo-糖基化位点也延长 了瘦素(leptin)和MpI配体的半衰期。 [0007] 本发明涉及生产具有附加的糖基化位点的因子IX(FIX)变体。该重组因子IX变体的回收值更高和/或半衰期更长从而使得可以向对象施用较低剂量和/或较低频次的因 子IX。 [0008] 发明简述 [0009] 本发明提供了与野生型因子IX相比,包含一个或多于一个附加的糖基化位点的分离的因子IX(FIX)变体。可以通过以下方式的任意组合来引入所述一个或多个附加的糖 基化位点:附加的氨基酸的插入、氨基酸的缺失、氨基酸的取代和/或氨基酸的重排。也可 以通过定点突变和/或FIX变体的化学合成引入所述一个或多个附加的糖基化位点。 [0010] 在一些实施方式中,该附加的糖基化位点中的至少一个位于激活肽(activationpeptide)之内。该FIX变体可以包含插入至SEQ ID NO:33所示的人FIX氨基酸序列的 N157和N167位置之间的肽片段,并且所述肽片段可以包含约3至约100个氨基酸残基。所 述肽片段可以包含小鼠因子IX激活肽的至少一部分(例如,图1,第4行)并且可以修饰所 述小鼠激活肽以增加糖基化位点数目(例如图1,第2和3行)。本发明所述的FIX蛋白变 体可以是人FIX蛋白。 [0011] 本发明所述变体FIX的一个或多个附加的糖基化位点可以是N-连接糖基化位点、O-连接糖基化位点以及N-连接糖基化位点和O-连接糖基化位点的组合。 [0012] 在一些实施方式中,糖基化位点可以包括N-连接糖基化位点,所述N-连接糖基化位点包含共有序列NXT/S,条件是X不是脯氨酸。在其他实施方式中,该糖基化位点包括 O-连接糖基化位点,所述O-连接糖基化位点包含选自以下的共有序列:CXXGGT/S-C(SEQ ID NO:9)、NSTE/DA(SEQID NO:10)、NITQS(SEQ ID NO:11)、QSTQS(SEQ ID NO:12)、D/ E-FT-R/K-V(SEQ ID NO:13)、C-E/D-SN(SEQ ID NO:14)、GGSC-K/R(SEQ ID NO:15)以及它们的任意组合。此外,本发明所述的FIX变体可以包含约1至约5个附加的糖基化位点。 [0013] 本发明还提供了包含编码本发明所述FIX变体的核苷酸序列的载体,包含本发明所述载体的转化的细胞以及包含本发明所述FIX变体的转基因动物。 [0014] 在一些实施方式中,本发明所述FIX变体的至少一个附加的糖基化位点可以位于激活肽之外。 [0015] 此外,本发明所述FIX变体的至少一个附加的糖基化位点可以对应于在FIX的非人同源物的天然形式中被糖基化的位点,其中非人同源物可以是,例如,狗、猪、牛或小鼠。 [0016] 本发明还提供了增加因子IX蛋白中糖基化位点数目的方法,包括:a)将第一FIX 氨基酸序列与第二FIX氨基酸序列比对;b)鉴别存在于所述第一FIX氨基酸序列而不存在 于所述第二氨基酸序列中的糖基化位点;c)修饰所述第二FIX氨基酸序列以引入糖基化位 点,该糖基化位点对应于步骤(b)中在第一FIX氨基酸序列中鉴别出的糖基化位点,其中修 饰所述第二FIX氨基酸序列增加了FIX蛋白中的糖基化位点数目。 [0017] 在本发明的方法中,第一FIX氨基酸序列可以来自非人类物种,而第二氨基酸序列可以是人FIX。在这些方法的进一步实施方式中,第一FIX氨基酸序列中的糖基化位点可 以位于激活肽之内或激活肽之外。这些方法还包括在所述激活肽之内和所述激活肽之外均 添加一个或多个糖基化位点。 [0018] 本发明还提供分离的FIX变体,与野生型FIX相比,该变体包含一个或多个附加的糖链。在一些实施方式中,通过化学和/或酶方法将所述一个或多个附加的糖链添加到FIX 蛋白上。 附图说明[0020] 现在将参考下列附图对本发明的这些和其他特征进行说明,这些附图旨在说明而并非限制本发明。 [0021] 图1显示了人因子IX变体。第1行:人因子IX(SEQ ID NO:5);第2行:具有小鼠激活肽(AP)片段的人因子IX,其中未修饰小鼠AP片段(SEQID NO:2);第3行:具有添 加了一个糖基化位点的小鼠AP的人FIX(SEQID NO:3);第4行:具有小鼠AP和添加的两个 糖基化位点的人FIX(SEQID NO:4)。小箭头表示成熟FIX的第一氨基酸(SEQ ID NO:33)。 两个大箭头表示激活肽切割位点。黑色星号表示人FIX蛋白中两个存在的糖基化位点。灰 色星号表示提议的附加的糖基化位点。 [0022] 图2显示了人因子IX(SEQ ID NO:5)与来自狗(SEQ ID NO:16)、猪(SEQ ID NO:17)、牛(SEQ ID NO:18)和小鼠(SEQ ID NO:19)(分别为第2、3、4和5行)的同源氨基酸 序列的比对。两个箭头表示激活肽切割位点。星号表示在所示五个物种的至少一个中存在 的糖基化位点。 [0023] 图3显示了几种哺乳动物物种激活肽(牛(SEQ ID NO:20)、绵羊(SEQID NO:21)、马(SEQ ID NO:22)、狗(SEQ ID NO:23)、猫(SEQ ID NO:24)、大鼠(SEQ ID NO:25)、小鼠(SEQ ID NO:26)、人(SEQ ID NO:27)、猪(SEQ ID NO:28)、兔(SEQ ID NO:29和30)以及 豚鼠(SEQ IDNO:31))的比对。用黑背景和白体字显示高度可变区。所显示的共有序列对 应于SEQ ID NO:32。 [0024] 图4显示了与野生型重组人因子IX相比,含有一个额外糖基化位点的人FIX变体的半衰期箱形图(box plot)。该FIX变体的半衰期延长了约1.5小时。每个箱形图的结果 代表对八只小鼠半衰期的测定;用实水平线表示每个箱形图的中位数,并用该图上的误差 线显示每组小鼠的极限值。 [0025] 图5显示牛、狗、人、小鼠、鸭嘴兽和负鼠的完整FIX氨基酸序列比对。 [0026] 图6显示了本发明FIX变体的168个其他实例,其中已将O-连接糖基化位点连接序列插入到激活肽之外的区域。 [0027] 根据随后对实施方式的详细说明,本发明的其他方面、特征和优势将变得显而易见。 [0028] 发明详述 [0029] 除非另外定义,本文中使用的所有技术和科学术语的含义与本发明所属领域的一般技术人员通常理解的含义相同。在本发明说明中所使用的术语的目的仅在于说明特定的 实施方式而不意欲限制本发明。 [0030] 定义 [0031] 如本文所使用的,“一个”或“该”可以表示一个或多于一个。例如,“一个”细胞可以表示单个细胞或多个细胞。 [0032] 还如本文所使用的,“和/或”是指并且涵盖一个或多个相关的所列项目的任意或全部可能组合,当解释为择一时(“或”)是指不包括组合。 [0033] 如本文所使用的,当表示如数量(例如,甲基化的量)等的可测量值时,术语“约”意在涵盖该指明量的±20%、±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。 [0034] 如本文所使用的,过渡短语“基本由…组成”表示应将主张的范围理解为包含在该主张中引用的明确的材料或步骤,“以及实质上不会影响所主张发明的基本和新颖特性的 那些”。参见,In re Herz,537 F.2d 549,551-52,190U.S.P.Q.461,463(CCPA 1976)(原文强调);还参见,MPEP§2111.03。因此,当在本发明的权利要求中使用时,术语“基本由…组成”不意在理解为等同于“包含”。 [0035] 术语“药物动力学性质”具有其常用和习惯的含义并且表示因子IX蛋白的吸收、分布、代谢和排出。 [0036] “生物利用度”的常用和习惯含义是所施用的生物活性药物进入体循环的分数或数量。在本发明实施方式的上下文中,术语“生物利用度”包括常用和习惯的含义,但是另 外还认为其具有更广泛的含义以包括因子IX蛋白的生物活性程度。就因子IX而言,例如, “生物利用度”的一种测量为输液后在循环中所获得的因子IX蛋白的促凝血活性。 [0037] “翻译后修饰”具有其常用和习惯的含义并包括,但不限于,前导序列的去除、谷氨酸残基的γ-羧基化、天门冬氨酸残基的β-羟基化、天门冬酰胺残基的N-连接糖基化、丝氨酸和/或苏氨酸残基的O-连接糖基化、酪氨酸残基的硫酸化、丝氨酸残基的磷酸化以及 它们的任意组合。 [0038] 如本文所使用的,参考来源于人血浆的标准物确定了“生物活性”。对于因子IX,该标准物为MONONINE (ZLB Behring)。将该标准物的生物活性视为100%。 [0039] 术语“加工因子”为广义术语,其包括促进功能性因子IX形成的任何蛋白、肽、非肽辅因子、底物和/或核酸。这些加工因子的实例包括,但不限于,成对碱性氨基酸转换(或 切割)酶(PACE)、维生素K环氧化物还原酶(VKOR)和维生素K依赖的γ-谷氨酰基羧化酶 (VKGC)。 [0040] 如本文所使用的,术语“因子IX蛋白”包括野生型因子IX蛋白和天然发生的或人工的变体(例如,在人FIX激活肽的位置148处(根据SEQ ID NO:33所示的成熟人FIX 氨基酸序列进行编号,其显示在位置148为T)的T/A二态性(dimorphism)),如Graham 等所 述的 (“The Malmo polymorphismof coagulation factor IX,an immunologic polymorphism due to dimorphism ofresidue 148 that is in linkage disequilibrium with two other F.IXpolymorphisms)”,Am.J.Hum.Genet.42:573-580(1988))。因此,本 发明的FIX蛋白包括具有SEQ ID NO:33所示氨基酸序列的成熟人FIX蛋白,其中位置148 处生物氨基酸可以是T或A,而对象在该位点对于T或A可以是杂合的或纯合的。本发 明的FIX蛋白还可以包括文献中已知的FIX突变形式(参见,例如,Chang等,“Changing residue 338 in human factor IX fromarginine to alanine causes an increase in catalytic activity”,J.Biol.Chem.273:12089-94(1998);Cheung 等,“Identification of the endothelial cell bindingsite for factor IX”,PNAS USA 93:11068-73(1996); Horst,“MolecularPathology”,第361页(458页),CRC出版社,1991,以上每篇文献以全部内容作为参考并入本文)。如本领域已知的,本发明的FIX蛋白还包括目前已知的或以后鉴 别的任何其他天然发生的人FIX变体或人工的人FIX变体、它们的衍生物和活性片段/活 性结构域。本发明的因子IX蛋白还包括FIX的药理学活性形式,它是一种分子,其中已在 蛋白酶的作用下从所述蛋白中切割出激活肽(或通过在核酸水平将其移除而通过工程化 将其从所述蛋白中移出),从而产生了FIX的两条不相连的(non-contiguous)多肽链(轻 链和重链),它们折叠成功能性FIX凝血因子。具体地,具有修饰以提高糖基化程度(例如, N-连接和/O-连接糖基化)的因子IX变体明确地包含在该广 义术语内。 [0041] 术语“半衰期”为广义术语,其包括常用和习惯的含义以及在因子IX科学文献中出现的常用和习惯的含义。该定义具体地包含了与因子IX有关的参数的测量,其定义了从 输注时所测量的初始值降低至该初始值一半的输注后的时间。在一些实施方式中,可以在 如本领域熟知的和如本发明所述的多种免疫测定中使用因子IX的抗体在血液和/或血液 组分中测量FIX的半衰期。作为另外一种选择,如本领域熟知的和如本发明所述的,可以使 用包括标准凝血测定在内的功能性测定来检测因子IX活性的降低,将其作为对半衰期的 测量。 [0042] 如本文所使用的,术语“回收”包括通过任何可接受的方法所测量的FIX的量,其包括,但不限于,出于测量输注、注射、或递送或施用后FIX水平的目的,在取出生物样本 (例如,血液或血液产品样本)的最早实施时间在受者动物或人对象的循环中所检测到的 FIX抗原水平或FIX蛋白酶活性水平或凝血活性水平。使用当前的方法,测量FIX回收的 最早生物采样时间通常在输注、注射或递送或施用FIX后的头15分钟内,但是随着科学和 /或临床技术的改善,有理由期待更快的采样时间。本质上,此处FIX的回收值意为表示输 注、注射或递送/施用的FIX的最大分数,其可以在对受者动物或患者输注、注射或递送后 的尽可能早的时间点在受者的循环中测量到。 [0043] 术语“糖基化位点”为广义术语,其具有常用和习惯的含义。在本申请的文中,该术语适用于可能可以接受糖部分(carbohydrate moiety)的位点,以及其上已确实连接了 糖部分的蛋白(具体为FIX)内位点,并且包括可以作为寡糖和/或糖的受体的任何氨基酸 序列。 [0044] 术语“分离的”可以指核酸或多肽,其基本不合细胞物质、病毒物质和/或培养基(当通过重组DNA技术产生时)或化学前体或其他化学品(当化学合成时)。此外,“分离 的片段”为核酸或多肽的片段,其天然状态下不是片段并且不会在自然状态下发现。 [0045] “分离的细胞”指从通常与其在自然状态下相关的其他细胞和/或组织组分中分离出的细胞。例如,分离的细胞是细胞培养物的一部分的细胞。分离的细胞也可以是,例如, 为了提供治疗性或其他有益作用而施用于或引入对象的细胞。 [0046] 本发明的一些实施方式涉及具有一个或多个附加的糖基化位点的因子IX变体。“附加的(additional)”或“新”糖基化位点表示该FIX变体中的糖基化位点数目大于“野 生型”形式的因子FIX中通常所存在的糖基化位点数目。本发明的因子IX蛋白可以包括血 浆来源的FIX以及FIX的重组形式。通常,本发明的实施方式涉及增加本发明FIX分子中 的糖基化位点数目。然而,应理解,由于天然发生的或人工的FIX变体也可以根据本发明方 法进行修饰以增加糖基化位点的数目和/或增加糖链的数目,因此可以通过修饰以增加糖 基化位点数目和/或增加糖链数目的本发明的因子IX蛋白不局限于特定的“野生型”FIX 氨基酸序列。 [0047] 本发明还涉及含有附加的糖链的FIX变体。这些附加的糖侧链可以存在于通过本文所述方法引入本发明FIX变体的一个或多个附加的糖基化位点。作为另外一种选择,如 本领域所熟知的,由于化学和/或酶方法将这些糖链引入至FIX分子,因此其他糖侧链可以 存在于FIX蛋白的位点上。“附加的”或“新”糖链表示FIX变体中的糖链数目大于“野生 型”形式因子IX中通常存在的糖链数目。在多种实施方式中,可以添加约1至约500个附 加的糖侧链(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50)。 [0048] 在一些实施方式中,至少一个附加的糖基化位点位于因子IX的激活肽中(例如,具有SEQ ID NO:1所示氨基酸序列的人FIX激活肽)。在特定实施方式中,该FIX变体具 有肽片段的插入,其在SEQ ID NO:33所示的人因子IX氨基酸序列的位置N157和N167之 间引入一个或多个糖基化位点。 [0049] 可以将插入引入至本发明的FIX变体以增加糖基化位点数目,并且该插入可以包含从约1个至约100个氨基酸残基,其包括从1至100的任意数目的氨基酸残基(例如,1、 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、 55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、 80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99和100)。 [0050] 在特定实施方式中,该插入包括来源于如小鼠(例如,如图1中第4行和SEQ ID NO:2所示)的非人物种的全部或至少部分(例如,至少3、4、5、6、7、8、9、10、11、12、13、14、 15或更多个氨基酸残基)因子IX激活肽。在其他实施方式中,修饰人FIX序列以包含所述 非人(例如,小鼠)FIX激活肽,修饰该激活肽以增加糖基化位点数目(例如,如图1中第2 行和第3行以及SEQ ID NO:3和4所示)。在其他实施方式中,可以通过插入包括鸭嘴兽 (图5)的任何非人FIX蛋白的激活肽的氨基酸片段来修饰人FIX氨基酸序列。SEQ ID NO: 305提供了14个氨基酸的片段,其可被引入至人FIX的激活肽,例如,对于来自小鼠激活肽 的插入的肽片段,引入至在如图1所示的氨基酸残基166和167之间或在该激活肽中的任 何其他位点。SEQ IDNO:306提供了成熟人FIX变体,其具有插入至氨基酸残基166和167 之间的鸭嘴兽的14个氨基酸的序列。根据本文所教导的,还可以修饰该插入的肽序列以引 入附加的糖基化位点。如图5中所提供的,鸭嘴兽FIX的氨基酸序列还表明可以在FIX蛋 白的激活肽中插入至少14个氨基酸而预期的该蛋白的活性和/或功能将不会受到不利的 影响。 [0051] 所述糖基化位点可以选自N-连接糖基化位点、O-连接糖基化位点和/或N-连接糖基化位点和O-连接糖基化位点的组合。在一些实施方式中,所添加的糖基化位点包括 N-连接糖基化位点,并且共有序列为NXT/S,条件是X不是脯氨酸。 [0052] 在一些实施方式中,FIX氨基酸序列中可以添加约1至约5个糖基化位点。在多种实施方式中,可以添加约1至约50个糖基化位点(例如,1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49或50)。本发明的实施方式包括FIX变体,其中已通过特定氨基酸的插入、缺失或者取代产生了N-连接或O-连接糖基化位点。在特定实施 方式中,所述插入、缺失和/或取代位于图1中箭头所示的激活肽区域内。如SEQ ID NO:1 所示,本文提供了人FIX激活肽的氨基酸序列。 [0053] 在一些实施方式中,所添加的糖基化位点包括O-连接糖基化位点,并且共有序列可以是,但不限于,CXXGGT/S-C(SEQ ID NO:9)、NSTE/DA(SEQ ID NO:10)、NITQS(SEQ ID NO: 11)、QSTQS(SEQ ID NO:12)、D/E-FT-R/K-V(SEQ ID NO:13)、C-E/D-SN(SEQ ID NO:14)和GGSC-K/R(SEQ ID NO:15)。 [0054] 考虑可以将引入至FIX氨基酸序列的附加的糖基化位点引入至FIX蛋白的整个氨基酸序列的任何位置。因此,在一些实施方式中,将所述附加的一个或多个糖基化位点引 入至激活肽(图1中用箭头表示;SEQ ID NO:33所示的成熟人FIX氨基酸序列的氨基酸 146-180),引入至激活肽之外(例如,该激活肽之前和/或之后)或引入至该激活肽之内 和该激活肽之外。因此,根据对SEQ ID NO:33所示的成熟人FIX蛋白的氨基酸序列的415 个氨基酸的编号,可以通过在任意氨基酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、 93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、 114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、 133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、 152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、 171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、 190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、 209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、 228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、 247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、 266、 267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、 285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、 304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、 323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、 342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、 361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、 380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、 399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415或它们的任意组合之间插入附加氨基酸残基以引入糖基化连接位点。如本文所使用的,“糖基化连接位 点”或“糖基化位点”可以表示糖连接共有序列(即,一系列氨基酸,它们作为将糖(单糖、 寡糖或多糖)连接到氨基酸序列的共有序列;或者它可以表示共价连接糖部分的实际的氨 基酸残基。该糖部分可以是单糖(简单的糖分子)、或寡糖或多糖。 [0055] 在特定实施方式中,可以将附加的氨基酸插入至和/或取代入构成激活肽的任意氨基酸残基,如在任意氨基酸145、146、147、148、149、150、151、152、153、154、155、156、157、 158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、 177、178、179、180、181、182和它们的任意组合之间。此外,可以将本发明的相同插入(物)在FIX蛋白氨基酸序列中相同和/或不同位置(包括在激活肽之内)引入多次。另外,可 以在FIX蛋白整个氨基酸序列上的氨基酸残基之间的相同和/或不同的位置,包括在激活 肽之内,一次或多次引入不同插入(物)和/或相同插入(物)。 [0056] 据本领域所熟知的,一些蛋白可以支持很多个糖侧链并且O-连接糖基化位点之间的距离可以少至每隔一个氨基酸(参见,例如,Kolset和Tveit,“Serglycin-structure and biology”,Cell.Mol.Life Sci 65:1073-1085(2008)和 Kiani等,“Structure and function of aggrecan”,Cell Research 12(1):19-32 (2002))。对于N-连接糖基化位点,位点之间的距离可以少至3、4、5或6个氨基酸(参见,例如,Lundin等,“Membrane topology of the DrosophilaOR83b odorant receptor”,FEBS Letters 581:5601-5604(2007); Apweiler等,“On the frequency of protein glycosylation,as deduced from analysis of theSWISS-PROT database”,Biochimica et Biophysica Acta 1473:4-8(19991),以上每篇文献的全部内容作为参考并入本文)。 [0057] 此外,可以通过突变(例如,氨基酸的取代、添加和/或缺失)修饰本发明的FIX蛋白以引入N-连接糖基化位点、O-连接糖基化位点或N-连接和O-连接糖基化位点。例 如,可以根据本领域标准的分子模型方法鉴别功能性FIX蛋白表面上适于修饰(例如,突 变)以引入一个或多个糖基化位点的氨基酸残基。表2中提供了该方法的一个特定实例, 其显示了用于确定成熟人FIX蛋白中每个氨基酸的相对表面可及性的分子模型计算结果。 溶剂可及性的计算是基于该FIX蛋白真实三维结构的晶体结构确定。第一列列出了氨基酸 名称,第二列列出了相应氨基酸的序列位置,而名为“总计”的列显示了对每个氨基酸的计 算的溶剂可及性值(以相对单位)。总计列中较高的值表示所计算的特定氨基酸明显暴露 于溶剂(即,在折叠蛋白质的表面上)。对于本发明,任意地选择了大于或等于60的截止值 以鉴别FIX分子表面上的氨基酸残基,可以根据本发明的方法修饰这些氨基酸残基以增加 糖基化位点的数目。 [0058] 例如,在一些实施方式中,可以考虑对总计值大于或等于60的三个连续氨基酸残基进行修饰以引入附加的糖基化位点,而这些区域在表2的总计列中用阴影表示。(在表 2中,构成激活肽的氨基酸残基也用阴影表示)。然而,60是用作实例的任意截断值,可以 选择任何其他截断值以选择用于修饰的候选氨基酸以掺入附加的糖基化位点。此外,该方 法仅是如何选择FIX蛋白中氨基酸残基进行修饰的一个实例,因此可以经过修饰以将附加 的糖基化位点掺入成熟人FIX蛋白的氨基酸残基不局限于表2总计列中具有任何特定值的 那些。根据本领域中熟知的以及本文所教导的方法修饰成熟FIX氨基酸序列中任何一个或 多个氨基酸残基以及根据熟知的方法和本文所述方法测试任何得到的FIX变体的活性、稳 定性、回收、半衰期等在本发明的范围内并且在本领域普通技术人员的能力范围内(参见, 例如,Elliott等, “Structural requirements for additional N-linked carbohydrate on recombinanthuman erythropoietin”,J.Biol.Chem.279:16854-62(2004),其全部内容作为参考并入本文)。 [0059] 本发明的实施方式涉及重组因子IX变体,其中已添加了糖基化位点以改善因子IX的回收和/或半衰期和/或稳定性。所述糖基化位点可以是N-连接和/或O-连接糖基 化位点。在具体的实施方式中,添加了至少一个N-连接糖基化位点。本文提供了如SEQ ID NO:34-91所示的在激活肽中具有一个或多个附加的N-连接糖基化位点的人FIX变体的多 个实例。 [0060] 本文提供了如SEQ ID NO:92-132所表示的在激活肽中具有一个或多个附加的O-连接糖基化位点的人FIX变体的多个其他实例。此外,通过将引入如SEQ ID NO:34-91所 示的N-连接糖基化位点的修饰与引入如SEQ IDNO:92-132所示的O-连接糖基化位点的修 饰以任意组合和任意顺序进行组合,本文提供了在激活肽中具有一个或多个附加的N-连 接糖基化位点和一个或多个附加的O-连接糖基化位点的人FIX变体的多个实例。这些组 合还可以包括引入更多糖基化位点的激活肽之内和/或激活肽之外的任何其他修饰。本领 域的普通技术人员能够容易地鉴别如对本文中SEQ ID NO:34-132所示的氨基酸序列所说 明的这些组合的修饰,并且这些组合的修饰包含在本发明的实施方式中,如同本文清楚地 提供了说明所有这些组合的每个氨基酸序列一样。 [0061] 如本文所提到的,在一些实施方式中,将至少一个附加的糖基化位点引入至FIX氨基酸序列中在激活肽之外的位点。优选地,所述至少一个附加的糖基化位点对应于因子 IX非人类同源物的天然形式中被糖基化的位点,例如,如图2所示,其中在图中所示的所有 非人物种中的氨基酸260-262处鉴别出糖基化位点,但该糖基化位点不在人FIX蛋白中天 然存在。修饰人FIX氨基酸序列以在SEQ ID NO:33所示的氨基酸序列(人FIX的成熟(即 分泌的)形式)的氨基酸262处引入丝氨酸或苏氨酸,这将在人蛋白中引入附加的N-连接 糖基化位点。优选地,所述非人同源物来自于狗、猪、牛或小鼠。 [0062] 本文提供了以SEQ ID NO:135-304表示的在激活肽之外具有一个或多个附加的N-连接糖基化位点的人FIX变体或具有附加的N-连接和O-连接糖基化位点组合的人FIX 变体的多个实例。本文在图6中提供了在激活肽之外 具有一个或多个附加的O-连接糖基 化位点的人FIX变体的多个其他实例。容易理解的是,图6所示的和序列表中所列的修饰 可以与本文所提供的任何其他实例中所示的修饰组合,并且图6所示的和序列表中所列的 修饰不局限于所示的特定N-连接或O-连接糖基化位点共有序列。本发明的任何N-连接 和/或O-连接糖基化位点共有序列以及本领域中已知的任何其他序列均包含于本发明的 实施方式中并且可以单独引入本发明的FIX中,以与其他O-连接糖基化位点共有序列任意 组合的方式和/或以与任何N-连接糖基化位点共有序列任意组合的方式引入本发明的FIX 以增加FIX蛋白上糖基化位点的数目。 [0063] 本发明的其他实施方式涉及增加因子IX蛋白中糖基化位点数目的方法,其包括一个或多个下列步骤:a)比对第一和第二因子IX氨基酸序列;b)鉴别在第一FIX氨基酸序 列中存在而在第二FIX氨基酸序列中不存在的一个或多个糖基化位点;和c)改变第二FIX 氨基酸序列以在第二FIX氨基酸中引入一个或多个新的或附加的糖基化位点,所述一个或 多个新的或附加的糖基化位点对应于步骤(b)中在第一氨基酸序列中所鉴别的一个或多 个糖基化位点。在特定实施方式中,所述第一氨基酸序列为来自非人物种的因子IX而所述 第二氨基酸序列为人因子IX。在某些实施方式中,将所述一个或多个新的或附加的糖基化 位点引入至第二FIX氨基酸序列的激活肽中。在其他实施方式中,将所述一个或多个新的 或附加的糖基化位点引入至第二FIX氨基酸序列的激活肽之外,而在其他实施方式中,以 任意组合并且在任意位置将所述一个或多个新的或附加的糖基化位点引入至第二FIX氨 基酸序列的激活肽之内和第二FIX氨基酸序列的激活肽之外。在本发明的方法中,所述新 的或附加的糖基化位点可以是任意组合的N-连接和/或O-连接糖基化位点。 [0064] 本发明的方法包括在第一FIX氨基酸序列中含有糖基化位点的相应区域附近修饰第二FIX氨基酸序列(例如,在1、2、3、4、5或6个氨基酸之内),以及在如第一FIX氨基 酸序列的相应区域中的那些的准确氨基酸位置处修饰第二FIX氨基酸序列。 [0065] 本文还提供了核酸,其包含编码本发明的FIX氨基酸序列的核苷酸序列,或基本由和/或由编码本发明的FIX氨基酸序列的核苷酸序列组成。这 些核酸可以存在于载体 中,如表达框。因此,本发明的其他实施方式涉及表达框,其设计用于表达编码本发明任何 因子IX变体的核苷酸序列。本发明的核酸和/或载体可以存在于细胞中。因此,本发明的 各种实施方式涉及含有载体(例如,表达框)的重组宿主细胞。该细胞可以是分离的和/ 或存在于转基因动物中。因此,本发明的某些实施方式还涉及包含核酸的转基因动物,所述 核酸包含编码本发明任何因子IX变体的核苷酸序列。 [0066] 人、小鼠、豚鼠和鸭嘴兽FIX的激活肽氨基酸序列的比较显示,小鼠FIX氨基酸序列具有存在于其激活肽中的其他(additional)9个氨基酸,豚鼠FIX氨基酸序列具有存在 于其激活肽中的其他10个氨基酸残基,而鸭嘴兽具有存在于其激活肽中的其他14个氨基 酸(图5)。这些额外的氨基酸位于人因子IX的两个天然发生的糖基化位点(N157和N167) 之间。 [0067] 人和小鼠FIX具有基本相同的结构并且人的酶可以在小鼠中起作用。由于人FIX在不具有小鼠中存在的其他9个氨基酸片段的情况下也起作用,因此因子IX分子的这一区 域可以耐受在其序列内的修饰(包括插入、取代和/或缺失)而该分子在结构、生物化学或 功能完整性上没有严重损失。小鼠中插入的9个氨基酸最可能是表面残基(由结构研究 所支持),并因此被糖基化酶获得而修饰。在天然人因子IX中,两个N-连接糖基化位点分 别距激活肽的氨基和羧基切割位点12个和14个氨基酸。因此,在本发明的一些实施方式 中,为了添加糖基化位点以改善半衰期和/或生物利用度,可以在人因子IX蛋白的N157和 N167之间添加附加的氨基酸残基。在多个实施方式中,通过天然序列的插入、缺失和/或修 饰添加糖基化位点以包含用于O-连接糖基化的连接序列和/或用于N-连接糖基化的共有 序列。 [0068] 激活肽的人序列起始于成熟蛋白的残基146。天然糖基化位点位于N157和N167(SEQ ID NO:33)。在一些实施方式中,可以将附加的氨基酸残基插入到两个正常糖基 化位点(人序列中的N157和N167之间)之间以提供附加的糖基化位点。在一些实施方式 中,添加了约3至约100个附加的氨基酸残基。在其他实施方式中,添加了约5至约50个 氨基酸残基。在其他实施方式中,添加了约5至约20个氨基酸残基。在其他实施方式中, 添加了约7至约15个氨基酸残基。通常,所述氨基酸残基选自20种生物氨基酸,条件是脯 氨酸不用作糖基化位点NXT/S(N-连接糖基化的共有序列)中的 “X”。表1示出了20种普 通生物氨基酸和它们的缩写。 [0069] 可以添加N-糖基化位点和/或O-糖基化位点。用于添加糖基化位点的共有序列在本领域中是已知的,并且所述共有序列包括N-糖基化的共有序列“NXT/S”,其中X不是脯 氨酸。O-糖基化位点的变化更大并且通常不具有用于连接的“共有序列”。在优选的实施方 式中,通过天然序列的插入、缺失和/或修饰引入了因子IX的附加的O-连接糖基化位点以 包含在诸如因子II、因子VII、因子VIII、因子X、蛋白质C和蛋白质S的其他凝血蛋白中存 在的O-连接糖基化的共有序列。例如,发现序列CXXGGT/S-C(SEQ ID NO:9)在几种凝血因 子和止血蛋白中作为连接O-连接寡糖的共有序列(van denSteen等,“Critical Reviews in Biochemistry and Molecular Biology”,MichaelCox主编,33(3):151-208(1998))。在一些实施方式中,糖基化位点包括O-连接糖基化位点,其包括但不限于: [0070] CXXGGT/S-C(SEQ ID NO:9) [0071] NSTE/DA(SEQ ID NO:10) [0072] NITQS(SEQ ID NO:11) [0073] QSTQS(SEQ ID NO:12) [0074] D/E-FT-R/K-V(SEQ ID NO:13) [0075] C-E/D-SN(SEQ ID NO:14) [0076] GGSC-K/R(SEQ ID NO:15)。 [0077] 在以上序列中,用下划线表示糖基化的连接点。在一些实施方式中,通过插入用于O-连接糖基化的S/T残基制备FIX变体,其中残基分别位于任一侧(either side),如下列 的三聚体:G-T/S-C、ST-E/D、ITQ、STQ、FT-R/K,E/D-SN和GSC。其他变化包括对于实际糖基化位点的S和T的可交换性。S可以取代T,T可以取代S。本发明的实施方式涉及通过插 入、缺失和/或取代以添加认为是N-连接或者O-连接糖基化信号的任何序列。 [0078] 在一些实施方式中,将来自小鼠、人及其他哺乳动物因子IX序列的内源N-连接和O-连接的连接序列插入至激活肽。可以单独插入这些序列或组合插入。在某些实施方 式中,插入的片段包含糖基化位点之间的间隔区,其可以单个存在、或串联重复存在或以多 个存在等。本发明的间隔区的长度可以从1个至约100个氨基酸(例如,1、2、3、4、5、6、7、 8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、 59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、 84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99和100)。在一些实施方式中,例如,该间隔区可以从1至约20个氨基酸。在其他实施方式中,该间隔区可以从1至约10个氨 基酸。在其他实施方式中,该间隔区可以从1至约5个氨基酸残基。 [0079] 本发明的间隔区包含在所添加的糖连接位点之间和/或包含在天然发生的糖基化位点和所添加的糖基化位点之间,以减少或消除位阻并提供被糖基转移酶的有效识别。 本发明的间隔区可以由氨基酸残基的任意组合组成,但前提条件是所述氨基酸残基不是半 胱氨酸或脯氨酸并且该间隔区的氨基酸序列所具有的疏水性残基(例如,色氨酸、酪氨酸、 苯丙氨酸和缬氨酸)不超过约10%。 [0080] 在一些实施方式中,将NXT/S掺入至所插入的氨基酸序列中以添加一个或多个附加的糖基化位点。除脯氨酸不可取外,“X”可以是任何生物氨基酸。在一些实施方式中,向因子IX变体中添加了至少一个附加的糖基化位点。在其他实施方式中,添加了两个附加的 糖基化位点。在其他实施方式中,添加了3个附加的糖基化位点。在其他实施方式中,添加 了4个附加的糖基化位点。在其他实施方式中,添加了5个附加的糖基化位点。在一些实 施方式中,添加了6个附加的糖基化位点。在其他实施方式中,添加了多于6个附加的糖基 化位点。 [0081] 在一个实施方式中,将成熟人FIX氨基酸序列(SEQ ID NO:33)位置161处的Ala替换为Asn以提供1个附加的糖基化位点。在另一个实施方式中,将来自小鼠激活肽的肽 片段插入至人FIX激活肽中并修饰小鼠序列以产生1个附加的糖基化位点(图1,第3行; SEQ ID NO:3)或2个附加的糖基化位点(SEQ ID NO:4;图1,第2行)。在其他实施方式 中,将序列VFIQDNITD(SEQ ID NO:6)插入到SEQ ID NO:33所示的成熟人FIX氨基酸序 列的残基161和162之间从而在人FIX序列中引入N-连接糖基化位点。在另一实施方式 中,通过在VFIQDNITD插入中用Asn代替Asp添加另 一新糖基化位点。插入的序列将为 VFIQDNITN(SEQ ID NO:7)。可以组合以上所讨论的实施方式以在人因子IX蛋白中提供1 至4个附加的糖基化位点。 [0082] 在另一种实施方式中,添加了以下序列,其提供了5个附加的糖基化位点。用加粗或下划线示出了糖基化位点。 [0083] AETVFPDVDYVNSTENETIQDNITDNETILDNITQSTQSFNDFTR(SEQID NO:8) [0084] 在一些实施方式中,在激活肽之外的位点添加糖基化位点。可以通过,例如,将来自人的因子IX的氨基酸序列与来自其他物种的因子IX的氨基酸序列比对并确定非人物种 中的糖基化位点的位置来选择这些附加位点。然后,修饰人FIX氨基酸序列中同源或等同 位置以提供糖基化位点。该方法可以用于鉴别潜在的N-糖基化和O-糖基化位点。 [0085] 图2中提供了该方法的实例,其中将人FIX氨基酸序列(SEQ ID NO:1)分别与来自狗、猪、牛和小鼠的FIX氨基酸序列比对。在第5颗星的位置处,在除人之外的所有所示 物种中均具有糖基化位点,表明在该位置对糖基化具有很好的耐受性。狗、猪、牛和小鼠FIX氨基酸序列在该位点(NXT/S)具有N-糖基化的共有序列,但是人FIX氨基酸序列不具有该 共有序列。相反,人FIX氨基酸序列为NAA。人FIX氨基酸序列在氨基酸262处突变产生了 共有序列NAT/S,这将在人FIX蛋白的该位置处引入附加的糖基化位点。 [0086] 通过本领域中熟知的方法和在本文所提供的实施例部分中所述的方法产生了根据本发明的FIX变体并对其进行鉴定。这些方法包括凝血时间的测定(部分促凝血酶原激 酶时间(PPT)测定)和向测试动物施用FIX变体以通过本领域中熟知的适当的免疫测定和 /或活性测定来确定回收、半衰期和生物利用度。 [0087] 在一些实施方式中,通过本文所述的一种或多种方法步骤生产重组因子IX蛋白。通过所述方法产生的重组因子IX蛋白可以包含在药物组合物中。一些实施方式涉及包含 根据本文所述方法生产的重组因子IX蛋白的试剂盒。通过向有需要的对象(例如,人类患 者)施用有效量的重组因子IX蛋白,可以将重组因子IX蛋白用于治疗出血紊乱的方法。 [0088] 可以使用多种表达载体以产生基因工程细胞。一些表达载体设计用于在 利于所选的高表达细胞的多种条件下扩增转染的细胞后表达大量重组蛋白。一些表达载体设计用 于在不需要在选择压力下进行扩增的情况下表达大量重组蛋白。本发明包括根据本领域中 的标准方法产生基因工程细胞并且不依赖于任何特定表达载体或表达系统的使用。 [0089] 为了产生基因工程细胞以产生大量因子IX蛋白,用含有编码所述蛋白的cDNA的表达载体转染细胞。在一些实施方式中,目标蛋白质与所选的共转染酶一起表达,所述共转 染酶导致在给定细胞系统中该目标蛋白发生适当的翻译后修饰。 [0090] 所述细胞可以选自多种来源,但是所述细胞另外是可以用含有核酸(优选编码因子IX蛋白的cDNA)的表达载体转染的细胞。 [0091] 除非另外指明,本发明实践采用了本领域技术范围内的分子生物学、微生物学、重组DNA和免疫学的常规技术。文献中全面地解释了这些技术。参见,例如, Sambrook等,“分子克隆:实验室指南(Molecular Cloning:ALaboratory Manual)”, 第2版(1989);“DNA克 隆(DNA Cloning)”,第 I和II卷(D.N Glover主 编,1985); “寡核苷酸合成(OligonucleotideSynthesis)”,(M.J.Gait主编,1984);“核酸杂交 (Nucleic AcidHybridization)”,(B.D.Hames 和S.J.Higgins 主 编,1984);“转 录 和 翻 译 (Transcription and Translation)”,(B.D.Hames 和S.J.Higgins 主 编,1984); “动物细胞培养(Animal Cell Culture)”,(R.I.Freshney主编,1986);“固定化细胞 和 酶(Immobilized Cells and Enzymes)”,(IRL出 版 社,1986);B.Perbal,“分 子 克隆实用指南(A Practical Guide to Molecular Cloning)”(1984);丛书,“酶学方法 (Methods in Enzymology)”,(Academic Press,Inc),特别是第154卷和155卷(分别 为Wu和Grossman编著和Wu编著);“哺乳动物细胞的基因转移载体(Gene Transfer Vectors for MammalianCells)”,(J.H.Miller和 M.P.Calos 编 著,1987,Cold Spring HarborLaboratory);“细胞和分子生物学中的免疫化学方法(ImmunochemicalMethods in Cell and Molecular Biology)”,Mayer和Walker编著(AcademicPress,London,1987); Scodes,“蛋白质纯化:原理与实践(Protein Purification:Principles and Practice)”,第二版,1987(Springer-Verlag,N.Y.);和“实验免疫学手册(Handbook of Experimental Immunology)”,第I-IV卷(D.M.Weir 和C.C.Blackwell编著,1986)。说明书中引用的所有 专利、专利申请和出版物以它们的整体作为参考引入本文。 [0092] 基因工程技术 [0093] 通过基因工程产生克隆的基因、重组DNA、载体、转化的宿主细胞、蛋白和蛋白片段是熟知的。参见,例如,授予Bell等的美国专利No.4761371的第6栏,第3行至第9栏,第65行;授予Clark等的美国专利No.4877729的第4栏,第38行至第7栏,第6行;授予 Schilling的美国专利No.4912038的第3栏,第26行至第14栏,第12行;和授予Wallner 的美国专利No.4879224的第6栏,第8行至第8栏,第59行。 [0094] 载体为可复制的DNA构建体。载体在本文中用于扩增编码因子IX蛋白的核酸和/或表达编码因子IX蛋白的核酸。表达载体为可复制的核酸构建体,其中编码因子IX蛋白 的核苷酸序列可操作地与适合的控制序列连接,所述控制序列能够实现核苷酸序列在适合 的宿主中表达以产生因子IX蛋白。对这些控制序列的需要将根据所选的宿主和所选的转 化方法而改变。通常,控制序列包括转录启动子、控制转录的任选操纵子序列、编码适合的 mRNA核醣体结合位点的序列和控制转录和翻译终止的序列。 [0095] 载体包括质粒、病毒(例如,腺病毒、巨细胞病毒)、噬菌体和可整合的DNA片段(即,通过重组可整合到宿主基因组的片段)。所述载体独立于宿主基因组复制和起作用, 或者在一些情况下,可以整合至基因组本身。表达载体可以含有启动子和RNA结合位点,其 可操作地与待表达的基因连接并在宿主生物中可操作。 [0096] 当功能上彼此相关时,DNA区域或核苷酸序列可操作地连接或可操作地关联。例如,如果启动子控制序列转录时,则该启动子可操作地与编码序列连接;如果核糖体结合位 点所处的位置使得序列能够翻译时,则该核糖体结合位点可操作地与编码序列连接。 [0097] 转化的宿主细胞是已经用因子IX蛋白载体转化、转导和/或转染的细胞,所述因子IX蛋白载体是使用重组DNA技术构建的。 [0098] 适合的宿主细胞包括原核生物、酵母或高等真核细胞,如哺乳动物细胞和昆虫细胞。来源于多细胞生物的细胞是重组因子IX蛋白合成特别适合的宿主,并且哺乳动物细胞 是特别优选的细胞。细胞培养中,这些细胞的增殖 已成为常规的方法(“组织培养(Tissue Culture)”,Academic Press,kruse和patterson主编(1973))。有用的宿主细胞系的实 例为VERO和HeLa细胞、中国仓鼠卵巢(CHO)细胞系和WI138、HEK 293、BHK、COS-7、CV和 MDCK细胞系。这些细胞的表达载体通常包括(必要时)复制起点、位于编码待表达因子IX 蛋白的核苷酸序列上游并且与其关联的启动子,以及核糖体结合位点、RNA拼接位点(如果 使用含有内含子的基因组DNA)、多腺苷酸化位点和转录终止序列。在优选的实施方式中,使 用美国专利No.5888809中的表达系统在中国仓鼠卵巢(CHO)细胞中进行表达,该专利以其 整体作为参考并入本文。 [0099] 通常通过病毒源提供用于转化脊椎动物细胞的表达载体中的转录和翻译控制序列。例如,常用的启动子来源于多形瘤、腺病毒2和猿猴病毒40(SV40)。参见,例如,美国专利No.4599308。 [0100] 可以通过构建载体以包含外源起点,如可以来源于SV 40或其他病毒(例如,多形瘤、腺病毒、VSV或BPV)以提供复制起点,或可以通过宿主细胞染色体复制机制提供。如果 将载体整合至宿主细胞染色体,则后者通常就足够了。 [0101] 可以通过与可选择标志物和编码因子IX蛋白的核酸共转化的方法转化哺乳动物细胞,而不使用含有病毒复制起点的载体。合适的可选择标志物的实例为二氢叶酸还原酶 (DHFR)或胸苷激酶。在美国专利No.4399216中还说明了该方法,该专利以整体作为参考并 入本文。 [0102] 适于在重组脊椎动物细胞培养中适应因子IX蛋白合成的其他方法包括Gething等,Nature 293:620(1981);Mantei等,Nature 281:40;和Levinson等,EPO专利申请 No.117060A和117058A,以上每篇文献的全部内容作为参考并入本文。 [0103] 诸如昆虫细胞(例如,培养的草地夜蛾(诸如杆状病毒表达载体(例如,来源于苜蓿丫纹夜蛾(Autographa californica)MNPV、蛾(Rachiplusia ou)MNPV或Galleria ou MNPV的载体)的表达载体可以在实施本发明中使用,如授予Smith等的美国专利 No.4745051和4879236中所说明的。一般说来,杆状病毒表达载体包含含有待表达的核 苷酸序列的杆状病毒基因组,所述核苷酸序列在从多角体蛋白翻译的起始信号到ATG起始 位点的位置范围内并 且在杆状病毒多角体蛋白启动子的转录控制下插入至多角体蛋白基 因。 [0104] 原核生物宿主细胞包括革兰氏阴性或革兰氏阳性生物,例如大肠杆菌(E.coli)或芽孢杆菌属(bacilli)。高等真核细胞包括如下所述的哺乳动物源的已建立的细胞系。 示例性宿主细胞为E.coli W3110(ATCC 27325)、E.coliB、E.coli X1776(ATCC 31537)和 E.coli 294(ATCC 31446)。多种适合的原核和微生物载体是可用的。通常使用pBR322转化 E.coli。重组微生物表达载体中最常用的启动子包括β内酰胺酶(青霉素酶)和乳糖启 动子系统(Chang等,Nature 275:615(1978);和Goeddel等,Nature 281:544(1979))、色 氨酸(trp)启动子系统(Goeddel等,Nucleic Acids Res.8:4057(1980)和EPO App.Publ. No.36776)以及tac启动子(De Boer等,Proc.Natl.Acad.Sci.USA 80:21(1983))。启动 子和Shine-Dalgarno序列(用于原核宿主表达)可操作地与编码因子IX蛋白的核酸连接, 即它们所处的位置使得能够促进因子IX信使RNA从DNA转录。 [0105] 如酵母培养物的真核微生物也可以用编码蛋白的载体转化(参见,例如、美国专利No.4745057)。尽管通常可用多种其他菌株,但是酿酒酵母(Saccharomyces cerevisiae) 是低等真核宿主微生物中最常使用的。酵母载体可以包含来自2微米酵母质粒的复制起点 或自主复制序列(ARS)、启动子、编码因子IX蛋白的核酸、多腺苷酸化和转录终止的序列以 及选择基因。示例性质粒为YRp7,(Stinchcomb等,Nature 282:39(1979);Kingsman等, Gene 7:141(1979);Tschemper等,Gene 10:157(1980))。酵母载体中适合的启动序列包 括金属硫蛋白、3-磷酸甘油酸激酶的启动子(Hitzeman等,J.Biol.Chem.255:2073(1980)) 或其他糖酵解酶的启动子(Hess等,J.Adv.Enzyme Reg.7:149(1968);和Holland等, Biochemistry 17:4900(1978))。在R.Hitzeman等,EPO专利No.73657中还说明了在酵母 表达中使用的合适载体和启动子。 [0106] 本发明的克隆的编码序列可以编码任何物种来源的FIX,包括小鼠、大鼠、狗、负鼠、兔、猫、猪、马、绵羊、牛、豚鼠、负鼠、鸭嘴兽和人,但是优选地编码人源的因子IX蛋白。 还涵盖了编码因子IX的核酸,所述核酸可与编码本文所公开的蛋白的核酸杂交。可以在 低严谨条件或甚至严谨条件下(例如,如以0.3M NaCl、0.03M柠檬酸钠、0.1%SDS在60℃ 或甚至70℃ 严谨洗膜为代表的严谨条件)实施这些序列与编码本文所公开的因子IX蛋 白的核酸在标准原位杂交测定中的杂交。参见,例如,Sambrook等,“分子克隆:实验室指 南(Molecular Cloning,A Laboratory Manual)”,(第二版,1989),Cold Spring Harbor Laboratory)。 [0107] 可以通过已知方法在转基因动物中表达根据本发明产生的FIX变体。参见,例如,美国专利NO.6344596,其以整体作为参考并入本文。简言之,转基因动物可以包括,但不限 于,家畜(例如,猪、山羊、绵羊、牛、马、兔等)、啮齿动物(如小鼠、大鼠和豚鼠)和家养宠物(例如,猫和狗)。在一些实施方式中,如猪、绵羊、山羊和牛的家畜动物是特别优选的。 [0108] 通过以将多核苷酸稳定地整合到成熟动物种系细胞DNA并且以正常孟德尔方式遗传的方式将编码本发明人因子IX变体的适当多核苷酸引入单细胞胚中产生了本发明的 转基因动物。本发明的转基因动物将具有在体液和/或组织中产生FIX变体的表型。例 如,出于治疗性使用,将所述FIX变体从这些体液和/或组织中移出并处理。(参见,例如, Clark等“,Expression ofhuman anti-hemophilic factor IX in the milk of transgenic sheep”,Bio/Technology 7:487-492(1989);Van Cott 等,“Haemophilic factors producedby transgenic livestock:abundance can enable alternative therapies worldwide”,Haemophilia 10(4):70-77(2004),其全部内容作为参考并入本文)。 [0109] 可以通过多种方式将DNA分子引入胚胎,所述方式包括,但不限于,微量注射、磷酸钙介导的沉淀、脂质体融合或全能或多能干细胞的反转录病毒感染。然后,可以将转化的 细胞能引入胚胎并掺入其中以形式转基因动物。例如,在L.M.Houdebine编写的“转基因动 物的产生和使用(TransgenicAnimal Generation and Use)”,Harwood Academic Press, (1997)中说明了制备转基因动物的方法。也可以使用核转移方法或使用胚胎细胞系或成 体细胞系进行克隆的方法产生转基因动物,如在Campbell等,Nature 380:64-66(1996)和 Wilmut等,Nature 385:810-813(1997)中所述的。也可以使用利用DNA细胞质注射的技 术,如美国专利No.5523222中所述的。 [0110] 可以通过引入包含编码因子IX的序列的嵌合构建体获得产生因子IX的转基因动物。获得转基因动物的方法是熟知的。参见,例如,Hogan等,“操纵小鼠胚胎(MANIPULATING THE MOUSE EMBRYO)”,(Cold Spring Harbor Press 1986);Krimpenfort 等,Bio/ Technology 9:88(1991);Palmiter等,Cell 41:343(1985);Kraemer等,“早期哺乳动物胚胎的基因操控(GENETIC MANIPULATION OF THE EARLY MAMMALIANEMBRYO)”,(Cold Spring Harbor Laboratory Press 1985);Hammer等,Nature 315:680(1985);Wagner等,美国专 利No.5175385;Krimpenfort等,美国专利No.5175384;Janne等,Ann.Med.24:273(1992); Brem等,Chim.Oggi.11:21(1993);Clark等,美国专利No.5476995,所有文献以其整体作为参考并入本文。 [0111] 在一些实施方式中,可以使用在乳腺组织中有“活性”的顺式调控区,其中在乳汁合成的生理条件下启动子在乳腺组织中比在其他组织中更有活性。这些启动子包括,但不 限于,短或长乳清酸性蛋白(WAP)、短或长α、β和κ酪蛋白、α-乳白蛋白和β-乳球蛋 白(“BLG”)启动子。根据本发明,也可以使用指导表达的蛋白向其他体液(特别是血液和 尿液)分泌的信号序列。这些序列的实例包括分泌的凝血因子的信号肽,其包括因子IX、蛋 白C和组织型纤维蛋白溶酶原活化因子的信号肽。 [0112] 除以上所讨论的启动子外,增强子、拼接信号、转录终止信号、多腺苷酸化位点、缓冲序列、RNA加工序列以及调控转基因表达的其他序列均属于调控转录的有用序列。 [0113] 优选地,所述表达系统或构建体包括位于编码所需重组蛋白的核苷酸序列下游的3’非翻译区。该区域可以提高转基因的表达。提供多聚腺苷酸信号的序列属于对此有用的 3’非翻译区。 [0114] 适合的异源3’非翻译序列可以来源于,例如,SV40小t抗原、酪蛋白3’非翻译区或本领域中熟知的其他3’非翻译序列。核糖体结合位点对提高FIX表达效率也是重要的。 同样地,调控FIX翻译后修饰的序列在本发明中也是有用的。 [0115] 在欧洲专利申请373012、欧洲专利申请251874、PCT专利申请8505376、PCT专利申请8505125、欧洲专利申请162782和PCT专利申请8400560中公开了因子IX编码序列, 以及表达该序列的载体和宿主细胞,以上所有专利申请以其整体作为参考并入本文。 [0116] 可以通过重组方法(如使用PCR的定点诱变)产生具有附加的糖基化 位点的FIX蛋白变体。作为另外一种选择,可以化学合成该因子IX变体以制备具有一个或多个附加的 糖基化位点的因子IX蛋白。 [0117] 实施例 [0118] 实施例1、向人FIX氨基酸序列中添加一个糖基化位点。 [0119] 在CHO细胞中产生了在激活肽中具有一个附加的糖基化位点的人FIX变体。该变体是稳定的,并且与野生型重组人FIX相比具有正常的活性和延长的半衰期。 [0120] 载体。使用来自ICOS的含有FIX-pDEF38CHEF-1启动子的载体表达编码野生型重组人FIX或重组人FIX变体的核酸。 [0121] 变体FIX。制备用于这些实验的变体人FIX包含9个额外的氨基酸,其含有插入激活肽中的一个额外糖基化位点(SEQ ID NO:3;图1,第3行)。该变体的激活肽序列为AETV FPDVDYVNSTEAETILDNITDGAILNNITQSTQSFNDFTR(SEQ IDNO:133),其中用加粗表示9个添加 的氨基酸,该序列显示氨基酸146在N末端而氨基酸181在C末端,该编号基于SEQ ID NO: 33所示的成熟人FIX氨基酸序列。 [0122] CHO DG44细胞的转染。以3×105个细胞/毫升的密度将细胞接种于含有15mL生6 长培养基的125mL震荡三角瓶中并在37℃培育。第3天,细胞密度应为~1×10 个细胞/ 毫升。通过将20μg的DNA稀释于650μl的OPTIPROSFM,轻轻混合并在室温(RT)下培育5 分钟制备了DNA-LIPOFECTAMINE2000CD复合物。使用前,将LIPOFECTAMINE 2000CD轻轻混 合,通过将45μl所述溶液置于650μl的OPTIPRO SFM,轻轻混合并在RT培育5分钟进行稀 释。培育后,合并稀释的DNA和稀释的LIPOFECTAMINE 2000CD,轻轻混合并在RT培育30-45 分钟以使得能够形成DNA-LIPOFECTAMINE2000CD复合物。培育后,将DNA-LIPOFECTAMINE 2000CD复合物加入到震荡三角瓶中。48小时后,将细胞旋转沉降并将培养基改变为30ml TM 的CD OptiCHO 培养基(Invitrogen,产品目录号:12681-011)。每2-3天更换培养基以获 得稳定转染的细胞。 [0123] FIX表达细胞的选择。由于在DG44细胞中dhfr基因是失活的,因此使 用dhfr 基 因 (Egrie JC 和 Browne JK,“Development and characterization ofnovel erythropoiesis stimulating protein(NESP)”,Nephrol Dial Transplant.2001;16 Suppl 3:3-13)作为选择标志物。稳定表达dhfr的阳性DG44细胞在细胞生长时不需要HT 并且可以在CD CHO培养基中生长。 [0124] 从混合的CHO DG44细胞转染子和293细胞克隆1中采集的培养基中纯化hFIX变体蛋白。rhFIX变体蛋白的纯化如下所述。向原始培养基中加入乙二胺四乙酸(200mM,pH 7.4)和苯甲脒(1M溶液)至最终浓度分别为4mM和5mM。将含有rhFIX变体蛋白的培养基 在4℃与Q sepharose阴离子交换树脂混合。用20mM Tris(pH 7.4)、0.15M NaCl、2mM EDTA 和2mM苯甲脒预平衡Q sepharose树脂。用1L平衡缓冲液清洗该柱,然后再用200mL不含 EDTA的平衡缓冲液清洗。用20mM Tris(pH 7.4)、0.15M NaCl和10mM CaCl2洗脱rhFIX变 体蛋白。 [0125] FIX活性。通过将100μl缺乏FIX的人血浆与100μl的自动活化部分凝血活酶时间(aPTT)试剂(Trinity biotech USA)以及用80μl的Owren-Koller缓冲液稀释的 20μl测试样本在37℃培育3分钟确定了变体重组人FIX的功能性活性。为了开始反应,加 入了100μl 25mM的CaCl2,并通过肉眼观察测量凝血形成时间。将正常混合的人血浆的凝 血活性视为100%。通过用凝血活性除以由免疫测定所确定的FIX蛋白的总量计算FIX-特 异的活性并用单位/毫克表示。野生型FIX的特异活性为116单位/毫克,而具有1个额 外糖基化位点的FIX的活性为104单位/毫克。 [0126] FIX大小。通过聚丙烯酰胺凝胶电泳检测到与纯化的血浆FIX和CHO细胞中产生的纯化的野生型重组FIX相比,具有一个额外糖基化位点的纯化的FIX的大小明显增加。一 旦通过酶催化去除糖之后,变体FIX大致随着经过类似处理的野生型重组FIX迁移。 [0127] 半衰期。通过用具有一个额外糖基化位点的变体FIX注射8只血友病B小鼠以及用野生型重组FIX注射8只不同的血友病B小鼠进行半衰期测量。向每组中的血友病B 小鼠注射100单位的FIX/kg。注射后,在15分钟、4小时、12小时、24小时和48小时确定 保留在循环中的FIX的量。使用野生型FIX作为标准品,通过ELISA测量保留在循环中的 FIX的量。从AffinityBiologicals公司获得了用于ELISA的抗体(产品号码SAFIX-AP SAFIX-APHRP)。将曲线用单指数衰变拟合。 [0128] 如图4所示,具有一个额外糖基化位点的变体FIX表现出更长的半衰期2 (约1.5小时)。如Griffith 所报道的,由于不完全唾液酸化作用可以导致更短的 半衰期,因此将对该变体进行进一步分析以确定是否存在该FIX蛋白的完全唾液酸 化。确定唾液酸化程度的测定在本领域中是熟知的(参见,例如,Anumula和Dhume, “High resolution and high sensitivity methods foroligosaccharide mapping and characterization by normal phase highperformance liquid chromatography following derivatization with highlyfluorescent anthranilic acid),Glycobiology 8:685-694(1998);Liu等,“Humanplasma N-glycoproteome analysis by immunoaffinity subtraction,hydrazidechemistry,and mass spectrometry),J.Proteome Res.4(6): 2070-2080(2005),以上每篇文献的全部内容均作为参考并入本文)。 [0129] 蛋白的半衰期可以受到多种因素的影响。单纯的大小对循环蛋白质是保留在循环中还是分布到全身各处具有主要的影响。另外,特异结合位点可以将蛋白从循环中除去。众 所周知,唾液酸化不足的血浆蛋白质具有暴露的GlcNAc和Gal残基,其可以通过去唾液酸 3-5 糖蛋白肝受体从循环中移除 。存在在哺乳动物组织中差异表达的18个不同唾液酰转移 6 酶的家族 。在人中,N-糖基化N-末端半乳糖通常通过α(2,6)唾液酸终止。CHO或BHK 细胞产生FIX,其中N-糖基化末端半乳糖通过α(2,3)-唾液酸化的半乳糖封端。然而,在 293细胞中产生的FIX由α(2,6)-半乳糖上的唾液酸封端。唾液酸化不足可以容易地导致 循环中清除率的提高,并掩盖由额外糖基化所导致的预期半衰期的延长。可以体外(通过 3 酶催化添加唾液酸 )改善唾液酸化不足,或在细胞培养中通过向表达重组FIX的细胞中添 7-10 加唾液酸化酶或通过操作培养条件以提高唾液酸化 从而改善唾液酸化不足。还根据所 示出的,用Gal(β1-4)GlcNAc-Rα(2,6)-唾液酸转移酶的基因转染CHO细胞胜过了内源唾 11 液酸化酶并导致以末端α-(2,6)-唾液酰-半乳糖为主要修饰的重组蛋白的产生 。 [0130] 该研究表明氨基酸残基可以插入人因子IX的激活肽中而不会实质上影响其凝血时间,并且这些插入对人因子IX的产生没有有害作用。这些研究还表明如本领域中一般技 术人员使用熟知技术所能容易地鉴别出的,只要不 含能够环回到FIX蛋白本身并破坏结 构的任何序列,则任何氨基酸序列均可以掺入到因子IX的激活肽中。此外,可以掺入氨基 酸序列,其允许化学添加用于添加化合物(如聚乙二醇)以进一步延长半衰期的特异位点。 可以根据使用常规实验方法的标准规程产生并测试这些序列。 [0131] 实施例2.不具有引入的新糖基化位点的变体人FIX [0132] 作为示范,差异很大的序列也可以插入至人FIX的激活肽中而不会不利地影响FIX分子,将以下氨基酸序列FLNCCPGCCMEP(SEQ ID NO:134)插入至激活肽的氨基酸161和 162(基于如SEQ ID NO:33所示的成熟FIX氨基酸序列进行编号)之间。根据以上实施例 1中所述的方法,分析该重组蛋白,并且其表现出与野生型重组人FIX相同的功能性。 [0133] 本领域的技术人员将理解在不背离本发明精神的前提下,可以进行多种和各种修改。因此、应清楚地理解本发明的形式仅是说明性的而不意欲限制本发明的范围。 [0135] 本发明由下列权利要求所限定,并且其中包含了权利要求的等价形式。 [0136] 实施例1的参考文献 [0137] 1.Yan SC,Razzano P,Chao YB,et al.Characterization and novelpurification ofrecombinant human protein C from three mammalian cell lines. Biotechnology(N Y).1990;8:655-661. [0138] 2.Griffith MJ,Monroe DM,van Cott DE,et al.N-GLYCAN SIALYLATIONISIMPORTANT FOR IN VIVO RECOVERY OF RECOMBINANT FACTOR IX.J ThrombHaemost.2007; 5:P-M-043. [0139] 3.Raju TS,Briggs JB,Chamow SM,Winkler ME,Jones AJ.Glycoengineeringoftherapeutic glycoproteins:in vitro galactosylation and sialylation of glycoproteins withterminal N-acetylglucosamine and galactose residues. Biochemistry.2001;40:8868-8876. [0140] 4.Joziasse DH,Lee RT,Lee YC,et al.alpha3-galactosylated glycoproteins can bind to the hepatic asialoglycoprotein receptor.Eur J Biochem.2000;267:6501-6508. [0141] 5.Van den Nieuwenhof IM,Koistinen H,Easton RL,et al.Recombinantglycodelincarrying the same type of glycan structures as contraceptive glycodelin-A can be produced inhuman kidney 293 cells but not in Chinese hamster ovary cells.Eur J Biochem.2000;267:4753-4762. [0142] 6.Takashima S,Kurosawa N,Tachida Y,Inoue M,Tsuji S.Comparativeanalysis ofthe genomic structures and promoter activities of mouse Siaalpha2, 3Galbeta1,3GalNAcGalNAcalpha2,6-sialyltransferase genes (ST6GalNAc III and IV):characterization of theirSp1 binding sites.J Biochem (Tokyo).2000;127: 399-409. [0143] 7.Chee Furng Wong D,Tin Kam Wong K,Tang Goh L,Kiat Heng C,Gek Sim Yap M.Impact of dynamic online fed-batch strategies on metabolism,productivityandN-glycosylation quality in CHO cell cultures.Biotechnol Bioeng.2005;89: 164-177. [0144] 8.Chen P,Harcum SW.Effects of amino acid additions on ammonium stressed CHOcells.J Biotechnol.2005;117:277-286. [0145] 9.Chen P,Harcum SW.Effects of elevated ammonium on glycosylationgeneexpression in CHO cells.Metab Eng.2006;8:123-132. [0146] 10.Nam JH,Zhang F,Ermonval M,Linhardt RJ,Sharfstein ST.The effects of cultureconditions on the glycosylation of secreted human placental alkalinephosphatase producedin Chinese hamster ovary cells.Biotechnol Bioeng.2008;100: 1178-1192. [0147] 11.Grabenhorst E,Hoffmann A,Nimtz M,Zettlmeissl G,ConradtHS.Construction ofstable BHK-21 cells coexpressing human secretory glycoproteins and human Gal(beta1-4)GlcNAc-R alpha 2,6-sialyltransferase alpha 2,6-linked NeuAc is preferentially attachedto the Gal(beta 1-4)GlcNAc(beta 1-2)Man(alpha 1-3)-branch of diantennary oligosaccharidesfrom secreted recombinant beta-trace protein.Eur J Biochem.1995;232:718-725. [0148] 表1 [0149] [0150] 表2 [0151] 溶剂可及表面积(ASA)计算参数: [0152] 球形半径:1.4 [0153] 埋藏阈值:0.25 [0154] Bck S.Chn 总计 SC Ref. 百分比 SC分类 [0155] TYR 1 0.27 125.59 125.86 232.25 54.08 E [0156] ASN 2 7.49 64.20 71.70 152.56 42.08 E [0157] SER 3 31.85 35.49 67.34 104.76 33.88 E [0158] GLY 4 35.78 13.41 49.18 30.80 43.53 E [0159] LYS 5 16.74 158.41 175.15 217.63 72.79 E [0160] LEU 6 8.28 135.99 144.28 185.25 73.41 E [0161] GLU 7 8.50 21.04 29.54 168.29 12.50 B [0162] GLU 8 30.76 44.77 75.53 168.29 26.60 E [0163] PHE 9 24.15 164.83 188.98 220.07 74.90 E [0164] VAL 10 13.07 51.73 64.80 157.34 32.88 E [0165] GLN 11 31.24 149.22 180.46 183.52 81.31 E [0166] GLY 12 24.92 3.98 28.90 30.80 12.91 B [0167] ASN 13 6.63 59.16 65.79 152.56 38.78 E [0168] LEU 14 11.27 83.39 94.66 185.25 45.02 E [0169] GLU 15 2.60 116.90 119.50 168.29 69.47 E [0170] ARG 16 0.86 88.62 89.49 249.57 35.51 E [0171] GLU 17 0.00 18.71 18.71 168.29 11.12 B [0172] CYS 18 8.83 5.31 14.14 129.22 4.11 B [0173] MET 19 18.21 138.84 157.06 195.71 70.94 E [0174] GLU 20 39.22 46.20 85.41 168.29 27.45 E [0175] GLU 21 13.25 19.74 32.98 168.29 11.73 B [0176] LYS 22 14.47 176.83 191.30 217.63 81.25 E [0177] CYS 23 16.54 4.14 20.68 129.22 3.20 B [0178] SER 24 7.99 31.53 39.52 104.76 30.10 E [0179] PHE 25 5.59 64.06 69.65 220.07 29.11 E [0180] GLU 26 5.05 82.90 87.96 168.29 49.26 E [0181] GLU 27 1.52 7.49 9.00 168.29 4.45 B [0182] ALA 28 4.70 3.15 7.85 86.68 3.63 B [0183] ARG 29 4.39 118.91 123.30 249.57 47.64 E [0184] GLU 30 32.80 52.38 85.18 168.29 31.13 E [0185] VAL 31 26.79 57.63 84.42 157.34 36.63 E [0186] PHE 32 15.66 55.53 71.18 220.07 25.23 E [0187] GLU 33 38.84 97.20 136.05 168.29 57.76 E [0188] ASN 34 8.70 57.51 66.21 152.56 37.70 E [0189] THR 35 6.61 62.61 69.22 141.80 44.15 E [0190] GLU 36 4.28 98.00 102.28 168.29 58.23 E [0191] ARG 37 2.80 119.95 122.76 249.57 48.06 E [0192] THR 38 0.00 0.00 0.00 141.80 0.00 B [0193] THR 39 0.00 54.41 54.41 141.80 38.37 E [0194] GLU 40 10.13 57.40 67.54 168.29 34.11 E [0195] PHE 41 8.14 42.37 50.50 220.07 19.25 B [0196] TRP 42 0.00 61.69 61.69 267.74 23.04 B [0197] LYS 43 10.33 119.92 130.25 217.63 55.10 E [0198] GLN 44 4.98 133.39 138.37 183.52 72.69 E [0199] TYR 45 25.77 75.81 101.58 232.25 32.64 E [0200] VAL 46 8.23 65.11 73.35 157.34 41.38 E [0201] ASP 47 20.51 55.77 76.27 135.82 41.06 E [0202] GLY 48 10.54 2.70 13.24 30.80 8.77 B [0203] ASP 49 0.58 35.16 35.73 135.82 25.89 E [0204] GLN 50 6.81 104.99 111.80 183.52 57.21 E [0205] CYS 51 3.97 22.00 25.97 129.22 17.03 B [0206] GLU 52 31.64 139.49 171.12 168.29 82.89 E [0207] SER 53 37.04 48.46 85.50 104.76 46.26 E [0208] ASN 54 16.68 102.95 119.64 152.56 67.48 E [0209] PRO 55 19.36 7.93 27.29 158.05 5.02 B [0210] CYS 56 12.01 2.30 14.30 129.22 1.78 B [0211] LEU 57 6.35 89.67 96.02 185.25 48.40 E [0212] ASN 58 49.16 42.59 91.75 152.56 27.92 E [0213] GLY 59 48.82 13.15 61.97 30.80 42.69 E [0214] GLY 60 3.57 0.40 3.97 30.80 1.30 B [0215] SER 61 11.00 85.41 96.41 104.76 81.53 E [0216] CYS 62 17.13 1.83 18.96 129.22 1.42 B [0217] LYS 63 7.94 139.66 147.60 217.63 64.17 E [0218] ASP 64 15.09 57.49 72.58 135.82 42.32 E [0219] ASP 65 7.60 43.64 51.24 135.82 32.13 E [0220] ILE 66 30.84 144.89 175.73 187.72 77.18 E [0221] ASN 67 13.32 122.54 135.85 152.56 80.32 E [0222] SER 68 3.81 36.41 40.23 104.76 34.76 E [0223] TYR 69 14.11 26.83 40.93 232.25 11.55 B [0224] GLU 70 5.59 73.21 78.80 168.29 43.50 E [0225] CYS 71 6.68 0.67 7.35 129.22 0.52 B [0226] TRP 72 7.49 115.47 122.97 267.74 43.13 E [0227] CYS 73 1.76 7.99 9.75 129.22 6.19 B [0228] PRO 74 6.36 67.68 74.04 158.05 42.82 E [0229] PHE 75 7.24 67.64 74.88 220.07 30.73 E [0230] GLY 76 5.84 8.63 14.47 30.80 28.03 E [0231] PHE 77 1.57 60.84 62.41 220.07 27.65 E [0232] GLU 78 4.54 42.38 46.92 168.29 25.18 E [0233] GLY 79 33.91 4.27 38.18 30.80 13.86 B [0234] LYS 80 28.88 148.45 177.33 217.63 68.21 E [0235] ASN 81 0.00 33.47 33.47 152.56 21.94 B [0236] CYS 82 0.00 0.23 0.23 129.22 0.18 B [0237] GLU 83 19.73 71.03 90.77 168.29 42.21 E [0238] LEU 84 1.61 106.59 108.20 185.25 57.54 E [0239] ASP 85 5.18 78.25 83.43 135.82 57.61 E [0240] VAL 86 0.61 0.52 1.13 157.34 0.33 B [0241] THR 87 0.56 59.85 60.41 141.80 42.21 E [0242] CYS 88 12.82 25.94 38.77 129.22 20.08 B [0243] ASN 89 32.29 109.18 141.47 152.56 71.56 E [0244] ILE 90 9.42 71.41 80.83 187.72 38.04 E [0245] LYS 91 31.54 47.20 78.74 217.63 21.69 B [0246] ASN 92 14.48 28.84 43.32 152.56 18.90 B [0247] GLY 93 0.00 0.00 0.00 30.80 0.00 B [0248] ARG 94 4.85 114.06 118.90 249.57 45.70 E [0249] CYS 95 0.00 0.00 0.00 129.22 0.00 B [0250] GLU 96 0.10 40.37 40.48 168.29 23.99 B [0251] GLN 97 0.00 0.00 0.00 183.52 0.00 B [0252] PHE 98 0.00 38.92 38.92 220.07 17.68 B [0253] CYS 99 0.93 1.21 2.13 129.22 0.93 B [0254] LYS 100 1.98 161.78 163.76 217.63 74.34 E [0255] ASN 101 26.90 32.19 59.09 152.56 21.10 B [0256] SER 102 17.07 15.09 32.17 104.76 14.41 B [0257] ALA 103 53.92 73.38 127.30 86.68 84.65 E [0258] ASP 104 29.80 71.30 101.10 135.82 52.49 E [0259] ASN 105 5.98 116.68 122.66 152.56 76.48 E [0260] LYS 106 6.97 78.17 85.14 217.63 35.92 E [0261] VAL 107 2.15 2.48 4.63 157.34 1.57 B [0262] VAL 108 4.70 79.48 84.18 157.34 50.52 E [0263] CYS 109 6.11 0.74 6.84 129.22 0.57 B [0264] SER 110 3.10 48.75 51.85 104.76 46.53 E [0265] CYS 111 19.48 3.24 22.72 129.22 2.51 B [0266] THR 112 1.32 1.85 3.17 141.80 1.31 B [0267] GLU 113 16.54 86.13 102.67 168.29 51.18 E [0268] GLY 114 27.26 2.40 29.66 30.80 7.79 B [0269] TYR 115 19.30 0.93 20.23 232.25 0.40 B [0270] ARG 116 7.93 125.32 133.25 249.57 50.22 E [0271] LEU 117 24.16 36.08 60.24 185.25 19.48 B [0272] ALA 118 6.67 13.31 19.98 86.68 15.36 B [0273] GLU 119 24.69 145.15 169.84 168.29 86.25 E [0274] ASN 120 31.18 62.55 93.73 152.56 41.00 E [0275] GLN 121 3.07 82.40 85.46 183.52 44.90 E [0276] LYS 122 0.00 38.14 38.14 217.63 17.53 B [0277] SER 123 0.12 38.91 39.03 104.76 37.14 E [0278] CYS 124 1.30 0.00 1.30 129.22 0.00 B [0279] GLU 125 5.57 83.86 89.42 168.29 49.83 E [0280] PRO 126 10.45 60.74 71.18 158.05 38.43 E [0281] ALA 127 27.45 24.33 51.79 86.68 28.07 E [0282] [0283] [0284] ILE 216 0.00 0.00 0.00 187.72 0.00 B [0285] VAL 217 0.00 0.00 0.00 157.34 0.00 B [0286] THR 218 0.00 0.00 0.00 141.80 0.00 B [0287] ALA 219 0.00 0.00 0.00 86.68 0.00 B [0288] ALA 220 0.72 0.00 0.72 86.68 0.00 B [0289] CYS 222 0.15 0.00 0.15 129.22 0.00 B [0290] VAL 223 3.08 0.33 3.40 157.34 0.21 B [0291] GLU 224 5.42 62.67 68.09 168.29 37.24 E [0292] THR 225 55.43 85.50 140.93 141.80 60.30 E [0293] GLY 226 23.22 15.40 38.62 30.80 49.99 E [0294] VAL 227 14.36 32.05 46.41 157.34 20.37 B [0295] LYS 228 21.74 169.93 191.67 217.63 78.08 E [0296] ILE 229 1.70 0.00 1.70 187.72 0.00 B [0297] THR 230 0.00 43.99 43.99 141.80 31.02 E [0298] VAL 231 1.40 0.00 1.40 157.34 0.00 B [0299] VAL 232 0.00 22.26 22.26 157.34 14.15 B [0300] ALA 233 0.00 0.00 0.00 86.68 0.00 B [0301] GLY 234 5.58 0.00 5.58 30.80 0.00 B [0302] GLU 235 11.21 10.69 21.90 168.29 6.35 B [0303] ASN 237 0.00 24.88 24.88 152.56 16.31 B [0304] ILE 238 25.21 36.69 61.90 187.72 19.54 B [0305] GLU 239 35.47 73.18 108.65 168.29 43.48 E [0306] GLU 240 6.25 104.93 111.18 168.29 62.35 E [0307] THR 241 27.21 106.54 133.75 141.80 75.13 E [0308] GLU 242 13.37 27.36 40.73 168.29 16.26 B [0309] THR 244 7.49 10.34 17.83 141.80 7.29 B [0310] GLU 245 14.27 29.00 43.27 168.29 17.23 B [0311] GLN 246 4.49 22.72 27.22 183.52 12.38 B [0312] LYS 247 12.94 163.01 175.95 217.63 74.90 E [0313] ARG 248 7.70 34.16 41.85 249.57 13.69 B [0314] ASN 249 4.99 64.87 69.87 152.56 42.52 E [0315] VAL 250 8.42 0.00 8.42 157.34 0.00 B [0316] ILE 251 32.72 66.80 99.51 187.72 35.58 E [0317] ARG 252 4.11 113.04 117.14 249.57 45.29 E [0318] ILE 253 2.07 32.52 34.58 187.72 17.32 B [0319] ILE 254 5.06 124.37 129.43 187.72 66.25 E [0320] PRO 255 1.25 22.02 23.27 158.05 13.94 B [0321] ASN 258 3.97 73.90 77.87 152.56 48.44 E [0322] TYR 259 8.25 19.59 27.84 232.25 8.43 B [0323] ASN 260 36.09 85.16 121.25 152.56 55.82 E [0324] ALA 261 27.50 23.02 50.52 86.68 26.55 E [0325] ALA 262 54.08 69.46 123.54 86.68 80.14 E [0326] ILE 263 13.33 75.87 89.19 187.72 40.41 E [0327] ASN 264 16.68 24.65 41.33 152.56 16.16 B [0328] LYS 265 4.07 126.06 130.12 217.63 57.92 E [0329] TYR 266 0.38 51.66 52.04 232.25 22.24 B [0330] ASN 267 1.12 9.95 11.07 152.56 6.52 B [0331] ASP 269 0.00 3.49 3.49 135.82 2.57 B [0332] ILE 270 0.00 0.00 0.00 187.72 0.00 B [0333] ALA 271 0.00 0.00 0.00 86.68 0.00 B [0334] LEU 272 1.11 0.07 1.18 185.25 0.04 B [0335] LEU 273 0.34 0.00 0.34 185.25 0.00 B [0336] GLU 274 0.00 18.28 18.28 168.29 10.86 B [0337] LEU 275 0.00 0.00 0.00 185.25 0.00 B [0338] ASP 276 16.49 57.20 73.69 135.82 42.11 E [0339] GLU 277 2.61 96.37 98.99 168.29 57.27 E [0340] PRO 278 2.44 69.22 71.66 158.05 43.80 E [0341] LEU 279 3.48 0.00 3.48 185.25 0.00 B [0342] VAL 280 4.62 111.51 116.13 157.34 70.87 E [0343] LEU 281 15.17 28.43 43.60 185.25 15.35 B [0344] ASN 282 0.29 40.69 40.98 152.56 26.67 E [0345] SER 283 2.66 27.61 30.27 104.76 26.35 E [0346] TYR 284 1.12 51.82 52.94 232.25 22.31 B [0347] VAL 285 0.00 0.00 0.00 157.34 0.00 B [0348] THR 286 0.00 0.95 0.95 141.80 0.67 B [0349] PRO 287 0.00 5.93 5.93 158.05 3.75 B [0350] ILE 288 2.87 0.12 2.98 187.72 0.06 B [0351] CYS 289 1.72 0.15 1.87 129.22 0.11 B [0352] ILE 290 17.34 23.72 41.07 187.72 12.64 B [0353] ALA 291 14.96 0.76 15.71 86.68 0.88 B [0354] ASP 292 17.82 71.99 89.81 135.82 53.01 E [0355] LYS 293 0.30 128.24 128.55 217.63 58.93 E [0356] GLU 294 2.05 120.77 122.82 168.29 71.76 E [0357] TYR 295 0.04 41.29 41.33 232.25 17.78 B [0358] THR 296 0.00 0.61 0.61 141.80 0.43 B [0359] ASN 297 0.00 62.71 62.71 152.56 41.11 E [0360] ILE 298 4.83 94.49 99.32 187.72 50.34 E [0361] PHE 299 3.42 14.54 17.97 220.07 6.61 B [0362] LEU 300 2.16 9.56 11.72 185.25 5.16 B [0363] LYS 301 25.40 142.97 168.37 217.63 65.69 E [0364] PHE 302 27.30 158.84 186.14 220.07 72.18 E [0365] GLY 303 8.18 18.77 26.95 30.80 60.93 E [0366] SER 304 9.64 28.10 37.74 104.76 26.83 E [0367] GLY 305 4.68 0.00 4.68 30.80 0.00 B [0368] TYR 306 0.02 72.96 72.98 232.25 31.41 E [0369] VAL 307 0.43 6.79 7.22 157.34 4.32 B [0370] SER 308 2.56 0.03 2.59 104.76 0.02 B [0371] GLY 309 0.06 0.00 0.06 30.80 0.00 B [0372] TRP 310 0.48 6.95 7.43 267.74 2.60 B [0373] GLY 311 14.74 1.12 15.86 30.80 3.63 B [0374] ARG 312 27.44 38.98 66.42 249.57 15.62 B [0375] VAL 313 39.36 64.84 104.20 157.34 41.21 E [0376] PHE 314 16.57 135.17 151.73 220.07 61.42 E [0377] LYS 316 29.68 122.27 151.95 217.63 56.18 E [0378] GLY 317 11.82 0.00 11.82 30.80 0.00 B [0379] ARG 318 7.84 121.48 129.32 249.57 48.67 E [0380] SER 319 3.30 5.88 9.18 104.76 5.61 B [0381] ALA 320 14.51 29.06 43.57 86.68 33.52 E [0382] LEU 321 0.05 87.51 87.55 185.25 47.24 E [0383] VAL 322 0.00 20.76 20.76 157.34 13.19 B [0384] LEU 323 0.00 6.41 6.41 185.25 3.46 B [0385] GLN 324 2.61 21.41 24.02 183.52 11.66 B [0386] TYR 325 2.73 19.35 22.09 232.25 8.33 B [0387] LEU 326 0.00 0.03 0.03 185.25 0.02 B [0388] ARG 327 0.00 113.77 113.77 249.57 45.59 E [0389] VAL 328 0.01 1.68 1.69 157.34 1.07 B [0390] PRO 329 0.02 39.18 39.20 158.05 24.79 B [0391] LEU 330 17.34 52.97 70.31 185.25 28.59 E [0392] VAL 331 5.59 3.04 8.63 157.34 1.93 B [0393] ASP 332 18.64 75.55 94.18 135.82 55.62 E [0394] ARG 333 9.89 133.09 142.98 249.57 53.33 E [0395] ALA 334 8.14 30.31 38.44 86.68 34.96 E [0396] THR 335 2.05 47.23 49.27 141.80 33.31 E [0397] CYS 336 0.00 0.22 0.22 129.22 0.17 B [0398] LEU 337 2.01 79.09 81.10 185.25 42.69 E [0399] ARG 338 33.37 177.73 211.10 249.57 71.21 E [0400] SER 339 20.57 5.99 26.56 104.76 5.72 B [0401] THR 340 20.65 4.56 25.21 141.80 3.22 B [0402] LYS 341 43.24 145.22 188.46 217.63 66.73 E [0403] PHE 342 14.62 24.42 39.04 220.07 11.10 B [0404] THR 343 9.93 93.74 103.68 141.80 66.11 E [0405] ILE 344 19.59 6.66 26.25 187.72 3.55 B [0406] TYR 345 9.63 83.94 93.56 232.25 36.14 E [0407] ASN 346 8.78 116.51 125.29 152.56 76.37 E [0408] ASN 347 1.44 17.46 18.90 152.56 11.44 B [0409] MET 348 5.65 1.01 6.66 195.71 0.52 B [0410] PHE 349 2.97 5.49 8.46 220.07 2.50 B [0411] CYS 350 0.34 0.00 0.34 129.22 0.00 B [0412] ALA 351 2.12 0.15 2.27 86.68 0.17 B [0413] GLY 352 2.51 0.00 2.51 30.80 0.00 B [0414] PHE 353 1.64 19.67 21.31 220.07 8.94 B [0415] GLU 355 13.85 62.67 76.51 168.29 37.24 E [0416] GLY 356 20.68 0.00 20.69 30.80 0.01 B [0417] GLY 357 22.76 4.81 27.58 30.80 15.63 B [0418] ARG 358 1.89 66.71 68.60 249.57 26.73 E [0419] ASP 359 9.52 11.56 21.07 135.82 8.51 B [0420] SER 360 13.75 11.98 25.73 104.76 11.43 B [0421] CYS 361 14.62 38.52 53.15 129.22 29.81 E [0422] GLN 362 1.88 39.36 41.24 183.52 21.45 B [0423] GLY 363 12.98 1.09 14.07 30.80 3.53 B [0424] ASP 364 3.70 4.29 7.99 135.82 3.16 B [0425] SER 365 1.74 5.22 6.96 104.76 4.98 B [0426] GLY 366 0.00 0.00 0.00 30.80 0.00 B [0427] GLY 367 2.61 1.56 4.17 30.80 5.07 B [0428] PRO 368 0.92 0.00 0.92 158.05 0.00 B [0429] VAL 370 0.00 1.87 1.87 157.34 1.19 B [0430] THR 371 0.36 6.97 7.34 141.80 4.92 B [0431] GLU 372 30.42 54.74 85.16 168.29 32.53 E [0432] VAL 373 4.82 14.38 19.20 157.34 9.14 B [0433] GLU 374 42.40 67.06 109.46 168.29 39.85 E [0434] GLY 375 14.57 17.57 32.14 30.80 57.04 E [0435] THR 376 0.00 0.00 0.00 141.80 0.00 B [0436] SER 377 0.00 9.63 9.63 104.76 9.19 B [0437] PHE 378 0.00 0.08 0.08 220.07 0.04 B [0438] LEU 379 0.31 0.02 0.33 185.25 0.01 B [0439] THR 380 0.00 0.00 0.00 141.80 0.00 B [0440] GLY 381 0.00 0.00 0.00 30.80 0.00 B [0441] ILE 382 0.00 0.00 0.00 187.72 0.00 B [0442] ILE 383 0.00 2.10 2.10 187.72 1.12 B [0443] SER 384 1.95 0.00 1.95 104.76 0.00 B [0444] TRP 385 1.30 110.40 111.70 267.74 41.24 E [0445] GLY 386 23.92 0.65 24.57 30.80 2.12 B [0446] GLU 387 32.54 33.31 65.85 168.29 19.80 B [0447] GLU 388 9.64 90.20 99.84 168.29 53.60 E [0448] CYS 389 31.77 22.87 54.64 129.22 17.70 B [0449] ALA 390 25.02 65.91 90.92 86.68 76.04 E [0450] MET 391 10.13 86.20 96.33 195.71 44.04 E [0451] LYS 392 18.83 160.20 179.02 217.63 73.61 E [0452] GLY 393 46.51 15.41 61.92 30.80 50.03 E [0453] LYS 394 5.28 37.72 43.00 217.63 17.33 B [0454] TYR 395 15.71 24.41 40.12 232.25 10.51 B [0455] GLY 396 6.12 2.98 9.09 30.80 9.66 B [0456] ILE 397 0.00 3.32 3.32 187.72 1.77 B [0457] TYR 398 0.00 6.22 6.22 232.25 2.68 B [0458] THR 399 0.00 0.00 0.00 141.80 0.00 B [0459] LYS 400 0.00 32.89 32.89 217.63 15.11 B [0460] VAL 401 0.00 0.00 0.00 157.34 0.00 B [0461] SER 402 0.00 10.50 10.50 104.76 10.03 B [0462] ARG 403 16.40 77.09 93.49 249.57 30.89 E [0463] TYR 404 0.00 0.94 0.94 232.25 0.41 B [0464] VAL 405 0.82 0.86 1.68 157.34 0.55 B [0465] ASN 406 1.90 94.81 96.71 152.56 62.15 E [0466] TRP 407 3.71 52.87 56.58 267.74 19.75 B [0467] ILE 408 0.00 0.08 0.08 187.72 0.04 B [0468] LYS 409 1.34 104.52 105.87 217.63 48.03 E [0469] GLU 410 4.61 86.16 90.77 168.29 51.20 E [0470] LYS 411 5.92 54.20 60.12 217.63 24.90 B [0471] THR 412 4.57 11.00 15.57 141.80 7.75 B [0472] LYS 413 18.60 112.34 130.93 217.63 51.62 E [0473] LEU 414 33.54 129.02 162.55 185.25 69.65 E [0474] THR 415 42.16 44.61 86.77 141.80 31.46 E [0475] 总面积:26818.00 |