表达内含肽修饰蛋白的转基因植物及相关生物药物的生产过程专利检索-激素去除治疗疗法专利检索查询-专利查询网

表达内含肽修饰蛋白的转基因 植物及相关生物药物的生产过程

阅读：1023发布：2020-07-17

专利汇可以提供表达内含肽修饰蛋白的转基因植物及相关生物药物的生产过程专利检索，专利查询，专利分析的服务。并且本发明公开了表达CIVPS或内含肽修饰治疗性蛋白的转基因植物，包含它们的物质组分，从转基因植物中生产的治疗性蛋白，构建含有CIVPS或内含肽修饰治疗基因的转基因植物的方法，植物中表达CIVPS或内含肽修饰治疗性蛋白的方法，以及该转基因植物的应用方法。，下面是表达内含肽修饰蛋白的转基因植物及相关生物药物的生产过程专利的具体信息内容。

权利要求

1.含有编码至少一个修饰蛋白的至少一个表达构建体的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体含有编码至少一个治疗性蛋白的至少一个外源基因序列，该至少一个外源基因序列与编码至少一个插入蛋白序列或其片段的至少一个序列融合。
2.根据权利要求1所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个外源基因序列被分成多个片段，各片段与编码至少一个插入蛋白序列或其片段的至少一个序列融合。
3.一组如权利要求2所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中每个植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代表达该至少一个外源基因序列的一个不同片段。
4.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个治疗性蛋白与至少一个插入蛋白序列或其片段的至少氨基端和羧基端之一融合。
5.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个外源基因序列是部分外源基因序列。
6.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体适于蛋白表达。
7.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体与至少一个调控序列和至少一个选择序列中至少之一融合。
8.根据权利要求7所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个调控序列进一步包括启动子序列、复制子序列原点和信号序列中至少之一。
9.根据权利要求7所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个选择序列进一步包括除草基因、抗菌基因、荧光标记、染色标记和选择标记。
10.根据权利要求9所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中至少一个选择标记具有对溴苯腈、2，2-二氯丙酸、G418、草甘膦、吡氟氯禾灵、潮霉素、咪唑啉、卡那霉素、甲氨蝶呤、新霉素、草胺膦、稀禾定、trichothecne、磺脲、s-三嗪和/或三氮嘧啶中至少一种化学物质的抗性。
11.根据权利要求10所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其对至少一种化学物质的常规毒性水平有抗性。
12.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体是组成型表达。
13.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体是瞬时表达。
14.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体在整个植物中表达。
15.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体在植物特定组织中表达。
16.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体在植物生命周期的预定时刻表达。
17.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体在至少一个亚细胞室中表达。
18.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体表达并分泌到细胞外。
19.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体表达，并且至少一种刺激启动该至少一个修饰蛋白的剪接。
20.根据权利要求19所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一种刺激包括改变pH、改变渗透压、改变温度、加入杀虫剂、加入化学物质、改变光照和改变声音中至少之一。
21.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该刺激启动至少一个修饰蛋白在至少一个插入蛋白序列或其片段的至少一端发生剪接。
22.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个修饰蛋白通过化学物质诱导和生物诱导之一进行表达。
23.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个治疗性蛋白是激素、生长因子、受体、配体、抗体、抗原、酶和疫苗之一。
24.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其是可育的，并且至少一个修饰蛋白是可遗传蛋白。
25.权利要求1、2或3所述的近交的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代。
26.权利要求1、2或3所述的杂交的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代。
27.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个表达构建体编码至少一个剪接点。
28.根据权利要求1、2或3所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中至少一个治疗性蛋白通过动物、病毒和微生物之一表达。
29.根据权利要求1-28之任一所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个治疗性蛋白是动物治疗性蛋白。
30.根据权利要求29所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个治疗性蛋白是人治疗性蛋白。
31.根据权利要求1-30之任一所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个插入蛋白序列是内含肽。
32.根据权利要求1-30之任一所述的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其中该至少一个插入蛋白序列是可控插入蛋白序列。
33.一种生产重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代的方法，该方法包括：
构建编码至少一个修饰蛋白的至少一个表达构建体，该至少一个表达构建体含有编码至少一个治疗性蛋白的至少一个外源基因序列，该至少一个外源基因序列与编码至少一个插入蛋白序列或其片段的至少一个序列融合；以及
用该表达构建体转化至少一个植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代。
34.根据权利要求33所述的方法，其中该至少一个外源基因序列被分成多个片段，各片段与编码至少一个插入蛋白序列或其片段的至少一个序列融合。
35.一种生产一组根据权利要求34所生产的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代的方法，其中每个植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代表达该至少一个外源基因序列的一个不同片段。
36.根据权利要求33、34或35所述的方法，其中该至少一个外源基因序列是部分外源基因序列。
37.根据权利要求33、34或35所述的方法，其中该至少一个外源基因序列的内部与编码至少一个插入蛋白序列或其片段的至少一个序列融合。
38.根据权利要求33、34或35所述的方法，其中该至少一个外源基因序列的两端与编码至少一个插入蛋白序列或其片段的至少一个序列融合。
39.根据权利要求33、34或35所述的方法，其进一步包括使编码至少一个治疗性蛋白序列的至少一个重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中的至少一个重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代再生。
40.根据权利要求39所述的方法，其中再生步骤按照下述至少一种方法操作：
培育重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；
将重组的和非遗传重组的植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代杂交；以及
将两种遗传重组的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代回交。
41.根据权利要求33、34或35所述的方法，其中该至少一个表达构建体包括启动子、选择标记、抗性标记、可育标记、聚腺苷化序列、抑制子、增强子、定位序列和信号序列中至少之一。
42.根据权利要求33、34或35所述的方法，其中通过病毒转化、包被DNA的微粒轰击、脂质体基因转化、细菌基因转移、电穿孔、和化学基因转化中至少之一将该至少一个表达构建体转化到至少一个植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中。
43.根据权利要求33、34或35所述的方法，其中借助选择标记和抗性标记中至少之一来挑选转化植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代。
44.根据权利要求33、34或35所述的方法，其中重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代由转化胚性组织、植物原生质体、未成熟胚细胞或转化种子中至少之一再生而来。
45.根据权利要求33、34或35所述的方法，其进一步包括克隆至少一个外源基因序列和编码至少一个插入蛋白序列或其片段的至少一个序列。
46.根据权利要求33-45所述的方法，其中该至少一个治疗性蛋白是动物治疗性蛋白。
47.根据权利要求46所述的方法，其中该至少一个治疗性蛋白是人治疗性蛋白。
48.根据权利要求33-47所述的方法，其中该至少一个插入蛋白序列是内含肽。
49.根据权利要求33-47所述的方法，其中该至少一个插入蛋白序列是可控插入蛋白序列。
50.一种从至少一个重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中生产修饰蛋白、蛋白片段或治疗性蛋白的方法，该方法包括：
构建编码至少一个修饰蛋白的至少一个表达构建体，该至少一个表达构建体含有编码至少一个治疗性蛋白的至少一个外源基因序列，该至少一个外源基因序列与编码至少一个插入蛋白序列或其片段的至少一个序列融合；
用该表达构建体转化至少一个植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；以及
表达该至少一个修饰蛋白。
51.根据权利要求50所述的方法，其进一步包括通过以下步骤体外重新形成至少一个治疗性蛋白：
将含有至少一个修饰蛋白的一组重组植物混合，该组重组植物表达亲代治疗性蛋白的不同子序列；
剪接该至少一个治疗性蛋白以去除该至少一个插入蛋白序列或其部分；以及
重新连接得到的治疗性蛋白子序列，从而重新获得具有完全活性的亲代治疗性蛋白。
52.根据权利要求50或51所述的方法，其进一步包括从重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中收获至少一个修饰蛋白。
53.根据权利要求50或51所述的方法，其进一步包括纯化该至少一个修饰蛋白。
54.根据权利要求50或51所述的方法，其进一步包括使编码至少一个治疗性蛋白序列的至少一个重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中的至少一个重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代再生。
55.根据权利要求50或51所述的方法，其中该至少一个插入蛋白序列或其片段能发挥切除、裂解、连接、切除-连接、裂解-连接和环化中至少一种作用。
56.根据权利要求50或51所述的方法，其中一个转基因植物和一组转基因植物中之一产生两个或两个以上治疗性蛋白。
57.根据权利要求50-56之任一所述的方法，其中该至少一个治疗性蛋白是动物治疗性蛋白。
58.根据权利要求57所述的方法，其中该至少一个治疗性蛋白是人治疗性蛋白。
59.根据权利要求50-58之任一所述的方法，其中该至少一个插入蛋白序列是内含肽。
60.根据权利要求50-58之任一所述的方法，其中该至少一个插入蛋白序列是可控插入蛋白序列。
61.从表达至少一个修饰蛋白的植物中获得治疗性蛋白的生产过程，该生产过程包括：
将至少一个治疗性蛋白的核苷酸编码序列分成多个片段；
将该每个片段与至少一个插入蛋白序列或其片段的编码序列融合；
构建多个允许至少一个修饰蛋白序列表达的表达载体；
用每个上述构建的表达载体遗传修饰一组植物，从而在该组植物内获得至少一个治疗性蛋白的整个编码序列；
培育该遗传修饰植物；
收获该遗传修饰植物；
表达该至少一个修饰蛋白；以及
将遗传修饰植物粉碎并在一种加工工艺中将其混合，其中至少一个插入蛋白序列或其片段被诱导从至少一个修饰蛋白上剪接，重新形成并回收至少一个得到的治疗性蛋白。
62.根据权利要求61所述的生产过程，其中该表达载体进一步使转化有该载体的植物得以选出。
63.根据权利要求61所述的生产过程，其进一步包括纯化该至少一种治疗性蛋白。
64.根据权利要求61所述的生产过程，其中该加工工艺是化学和机械加工工艺之一。
65.根据权利要求61-64之任一所述的生产过程，其中该至少一个治疗性蛋白是动物治疗性蛋白。
66.根据权利要求65所述的生产过程，其中该至少一个治疗性蛋白是人治疗性蛋白。
67.根据权利要求61-66之任一所述的生产过程，其中该至少一个插入蛋白序列是内含肽。
68.根据权利要求61-66之任一所述的生产过程，其中该至少一个插入蛋白序列是可控插入蛋白序列。

说明书全文

技术领域

本发明涉及表达治疗性蛋白与CIVPS或内含肽融合而成的多肽的转基因植物、生产该转基因植物的方法、在植物中表达可控插入蛋白序列(“CIVPS”)或内含肽修饰蛋白的方法、从植物中生产治疗性蛋白的生产过程，以及包含表达CIVPS或内含肽修饰蛋白的转基因植物的各种产品及其用途。

背景技术

制药业离不开具有特定治疗性、用于制造源于生物技术研究进展的新一代药物的蛋白(称为治疗性蛋白)的持续供给。与传统药物的合成途径不同，治疗性蛋白通常通过微生物发酵或哺乳动物细胞培养获得。
在哺乳动物细胞培养和微生物发酵中，细胞是在大的发酵罐、桶或容器中生长。在精确的温度、氧气水平和酸性等环境条件下保持细胞活力并刺激其产生靶蛋白。然后从培养物中分离纯化靶蛋白，最后制成最终药品。
相对于传统的细胞培养和发酵工艺而言，从植物中生产治疗性蛋白有很多优点，是很有前景的选择。据估测，利用植物生产1克蛋白的操作成本要比细胞培养或发酵工艺低10倍。而且由于不需要大规模的整套上游培养设备，利用植物生产蛋白的制造设备的资本成本也显著低于传统的培养工艺。因为植物能使复杂蛋白正确折叠，一般不产生包含体，而且植物中可能会使蛋白糖基化，而细菌中则完全不能，所以植物蛋白生产也优于微生物生产。虽然哺乳细胞也能使蛋白正确折叠和糖基化，但与之不同的是，植物通常不会给可能污染细胞培养系统的人类传染性病原以栖息之所，从而提供了另一层安全保障。与大型细胞培养系统因需要长时间特殊密闭和无菌供应而投入的研究和努力相比，植物蛋白的大型生产要相对简单。
目前从植物中生产治疗性蛋白的技术还存在很多需要监管并可能妨碍最终工业应用的局限性。当植物产生的蛋白质水平足够高，达到不合法的药理或毒性作用时，如果被动物或人野外食用，就可能产生安全隐患。使用果实、蔬菜、块茎和干果等可食用的植物宿主会使不小心污染食物链的可能性增加。所以在操作这样的转基因植物时，就有必要使用价格不菲的监查和隔离系统。其他安全考虑还涉及植物品种间潜在的性别或其他遗传漂变(genetic drift)。植物或其他野生物之间的水平基因转移也可能导致食物链污染和产生有潜在危害的品种。
一种消除这些安全问题并发挥植物蛋白生产优势的方法是将插入多肽序列插到亲代的治疗性蛋白中，从而破坏该蛋白的生物活性。这种方法已在表达抗除草剂蛋白的植物中得到验证，研究显示该蛋白多个部分可能都与内含肽融合，然后经该植物基因组的不同部分表达并在体内重组后产生具有完全活性的蛋白。这种系统的优点在于可限制水平基因转移。不过，由于完整的功能蛋白仍然在植物内产生，因此这种方法并不能消除可能因植物在相同条件下表达治疗性蛋白所引起的潜在毒性。将治疗性蛋白分成几段，每一片段与一个帮助体外反式剪接的内含肽片段融合，然后在不同植物内表达这些融合的内含肽片段，随后培育、收获这些植物，并在制造设备内将其混合以体外获得有完整重组活性的治疗性蛋白。该方法可避免植物在野外生产完全活性蛋白所带来的隐患。

发明内容

本发明提供遗传重组植物、植物部分、幼苗、种子、芽苗及其后代(统称为“植物”)，它们含有编码动物治疗性蛋白，优选为人治疗性蛋白的单个或多个、整个或一部分外源基因序列，各基因序列与单个或多个CIVPS或内含肽序列融合，并根据需要与适于植物基因表达和转化的调控序列融合。这些包括单个和多个内含肽修饰基因序列的修饰基因序列，可以在整个植物、特定组织或其任一组合中组成型或瞬时表达。在本发明的不同实施例中，任一个修饰基因序列或任一组修饰基因序列都可以在任一或所有组织中组成型表达或在某一特定时间表达。
本发明还涉及生产含有可控插入蛋白序列(“CIVPS”)或内含肽修饰基因的转基因植物的方法，例如先构建包含亲代CIVPS或内含肽修饰基因的DNA片段，然后用该构建体转化植物。
本发明还涉及利用转基因植物生产整个或一部分CIVPS或内含肽修饰治疗性蛋白的方法，例如先用单个或多个修饰基因序列转化植物或植物细胞，然后表达出CIVPS或内含肽修饰蛋白。这类生产方法可以扩大到从一种或一组转基因植物中生产两个或两个以上治疗性蛋白。在一优选实施例中，基因序列可以在任何时候表达。在另一实施例中，蛋白质剪接前最好具有截然不同的活性和/或结构特性。剪接后的蛋白产品显示出活性，除非受到与非CIVPS或内含肽修饰蛋白亲代序列同源的外加或内产分子的抑制。CIVPS或内含肽修饰基因产品可以大量表达，并从植物材料中回收。另外，还可以利用植物或植物材料本身获取CIVPS或内含肽修饰基因产品。
本发明还提供一种或多种植物所表达的CIVPS或内含肽修饰治疗性蛋白、内含肽融合蛋白部分的用途，以及一种或多种表达CIVPS 或内含肽修饰基因的转基因植物在单独或组合、批量、半批量和连续工业化生产具有完全活性的治疗性蛋白中的用途。
本领域的技术人员从以下简要附图说明和论述中可显而易见地了解到本发明的其他目的、有益效果和特征。

附图说明

图1是表示将CIVPS或内含肽编码序列与具有目标活性的蛋白编码基因的3’端、5’端融合或者插入该基因内部来构建CIVPS或内含肽修饰治疗性蛋白编码DNA序列，然后将该序列翻译成CIVPS 或内含肽修饰蛋白的示意图。
图2是表示从多种转基因植物中生产出具有最终活性的治疗性蛋白的示意图。

具体实施方式

本发明是针对一种新的从植物中高效低廉地生产安全药物的方法，该方法利用CIVPS、或内含肽修饰治疗性蛋白、或蛋白部分对植物进行改造，其中CIVPS或内含肽连接到所需的蛋白部分。本文所用的术语“CIVPS”和“内含肽”意指相同产品，可互换使用。简化起见，这里将术语“CIVPS”和“内含肽”统称为“插入蛋白序列”。
由于CIVPS或内含肽修饰蛋白或蛋白部分可以在细胞中高表达，但其活性则大为降低，因此发现如果将其克隆到一种或多种植物中，活性降低则使上述转基因植物细胞、植物片段或植物组织长成能产生CIVPS或内含肽修饰蛋白的完整植物。另外，在几个例如使重组植物按以下方式表达修饰蛋白或蛋白部分的不同实施例中都可能获得这样的转基因植物：1)组成型或瞬时地，2)植物生长周期中使用化学诱导或生物诱导，3)在整个植物或尤其是在不同的植物组织内，和/或4)有或没有亚细胞定位等。
本发明是针对转基因植物中治疗性蛋白的生产，所用术语“转基因植物”与遗传重组植物同义，它们的种子和后代植物、或者任何植物部分、组织或细胞，都含有编码包括但不限于激素、生长因子、细胞因子、受体、配体、抗体(单克隆等)和疫苗等CIVPS或内含肽修饰治疗性蛋白的基因。本发明还针对转基因植物本身，其含有编码包括但不限于激素、生长因子、细胞因子、受体、配体、抗体 (单克隆等)和疫苗等CIVPS或内含肽修饰治疗性蛋白的基因。本发明进一步针对产生CIVPS或内含肽修饰治疗性蛋白的转基因植物的生产，从植物中生产CIVPS或内含肽修饰治疗性蛋白的方法，以及植物作为治疗性蛋白生产载体的用途。
转基因植物是表达单个或多个外源基因及其相关蛋白(或核苷酸)活性的多细胞植物。插入蛋白序列是亲代蛋白序列内部的或与其相邻的蛋白序列，它可以自动在任一端或两端，即羧基端或氨基端，自我裂解，并能在特定条件下顺式或反式反应合适时，有选择地使得到的外显肽(extein)蛋白片段连接。例如参见Perler等，Nucl. Acids Res.，22：1125-1127(1994)；Pietrokovski，S.，Protein Sci.， 2：697-705(1994)。所以，可以将插入蛋白序列描述为读码框内 (in-frame)的、能自我裂解并能潜在自我连接的多肽，通常作为较大的前体蛋白分子的一部分出现。插入蛋白序列在几个基本方面与其他蛋白酶或酶原有所不同。与蛋白酶将自身或其他蛋白裂解成多个不连接的多肽不同，插入蛋白序列具有既能将自身或其他蛋白裂解又能将多个多肽反式或顺式构象连接的能力。所以，相对于蛋白酶对蛋白起作用所导致的末端裂解而言，插入蛋白序列则具有使多个位点裂解并将得到的蛋白片段连在一起的能力。这种裂解可自动发生，或者可通过已知的分子生物技术或生物化学技术在特定条件下诱导产生。已知诱导插入蛋白序列剪接的技术包括改变插入蛋白序列的温度(通常提高温度)、降低插入蛋白序列溶液的pH值，或者用各种化学物质，特别是含硫醇的试剂，处理插入蛋白序列。另外，使用尿素或二价阳离子，尤其是Zn2+，能抑制插入蛋白序列的剪接。加入EDTA可消除二价阳离子的抑制。各种来源的插入蛋白序列的序列、特征及功能已有较全面的文献报道。例如参见：Kane et.al.，Science 250：651(1990)；Davis et.al.，J.Bact.173：5653(1991)， Davis et.al.，Cell 71：1(1992)(Mycobacterium tuberculosis)；Perler，et.al.， PNAS 89：5577(1992)(Thermococcus litoralis)。
图1所示，内含肽DNA编码序列与治疗性蛋白编码DNA序列结合产生其目标活性或结构功能可被完全改变的内含肽修饰蛋白。表达CIVPS或内含肽修饰蛋白(由相关的CIVPS或内含肽修饰基因编码)的转基因植物比以前的转基因植物有所改进，这是因为亲代 CIVPS或内含肽修饰蛋白可以有两种通过插入蛋白序列裂解进行可控介导的截然不同的状态。这种裂解可能与目标蛋白序列的重组有关也可能无关。
本发明可以由任一种或多种植物品种以及单个或多个蛋白与一个或多个插入蛋白序列的任一组合构成。植物品种可以包括但不限于：杨树、桦树、雪松、松树、阔叶树、针叶树、黄豆、柳枝稷、玉米、烟草、紫苜蓿、甘蔗、花椰菜、洋蓟、香蕉、苹果、草莓、蔓越橘、黄瓜、莴苣、葡萄、柠檬、瓜、坚果、柑橘、水稻、柑桔、桃、梨、蓝莓、草莓、西红柿、胡萝卜、卷心菜、马铃薯、菊苣、韭葱、菠菜、杂草、竹芋、甜菜、木薯、芜菁、山药、小萝卜、甘薯、小麦、大麦、大豆、豆、油菜籽、粟、向日葵、燕麦、豌豆、块茎、竹子、海藻、藻(algae)等。
蛋白可以包括任何已知的、公认的、经修饰的或者新构建的有治疗效用的蛋白。虽然天然蛋白的选用不受限制，但是优选的蛋白包括激素(胰岛素、生长激素、抗利尿激素)、生长因子(促红细胞生成素、表皮生长因子、胰岛素样生长因子、成纤维细胞生长因子)、细胞因子(IL-2，IL-6)、酶(胰肮酶、胃脂肪酶、葡糖脑苷脂酶、尿激酶、艾杜糖醛酸苷酶)、细菌或病毒抗原、抗体、受体和其他涉及疾病发病机理的治疗性蛋白及其所有相关异构体。
用于修饰蛋白、并且其融合体会在所选用植物中表达的插入蛋白序列的选用也不受限制。可以在所选用蛋白的任何构型中使用任一或多个插入蛋白序列。插入蛋白序列应具有在某些刺激作用下其一端或两端被剪接的能力，并且可以允许或不允许一个或多个插入蛋白序列所融合的蛋白的连接。
生产表达CIVPS或内含肽修饰蛋白的转基因植物和从转基因植物中生产CIVPS或内含肽修饰蛋白均可通过以下步骤完成：构建含有CIVPS或内含肽修饰目的蛋白和表达所需的必要调控元件的 DNA序列，扩增和选择所构建的DNA，然后转化要用的植物品种，最后再生和挑选已正确转化的植物品种，必要的话，纯化天然形式或裂解形式的CIVPS或内含肽修饰蛋白。生产表达CIVPS或内含肽修饰治疗性蛋白的转基因植物和从转基因植物中生产CIVPS或内含肽修饰治疗性蛋白构成本发明的一部分。
要生产转基因植物或转基因植物中的CIVPS或内含肽修饰蛋白，就必须先构建CIVPS或内含肽修饰蛋白的DNA序列。构建过程包括：将要用的治疗性蛋白和插入蛋白序列的完整基因序列或其部分序列克隆到E.coli或其他任何合适宿主中(如：某些情况下酵母菌可能适用，或者借助或不借助病毒或非病毒载体在哺乳动物细胞和植物细胞表达)。
一旦基因与编码插入蛋白序列的序列被克隆后，它们就按所需构型(configuration)连接。选用的插入蛋白序列应具有行使所需功能的能力，例如能自动剪接或在外加刺激作用下剪接(例如光照、 pH变化、温度、压力或改变CIVPS或内含肽修饰蛋白周围的局部化学成分)，必要时，能允许融合蛋白与自身顺式连接，或者与另一蛋白反式连接。通过直接多肽合成或本领域已知的方法很容易将插入蛋白序列的DNA序列与特定蛋白DNA序列连接，得到图1所示的 CIVPS或内含肽修饰蛋白DNA编码序列或其序列组合。前面已经提到，CIVPS或内含肽修饰蛋白是插入蛋白序列与天然蛋白的羧基端、氨基端或内部融合而成的蛋白。虽然有许多可供选用的方法，不过将插入蛋白序列的编码序列和所要用的蛋白编码序列融合的一种方法应是合成或纯化所要用的治疗性蛋白序列的编码序列，用限制性酶切蛋白编码序列中要插入CIVPS或内含肽的位点，然后将 CIVPS或内含肽编码序列连接到该限制性位点上。另一种方法是使用PCR法连接基因元件。
可以直接将多聚核苷酸或任一核酸片段克隆到合适的调控和/或选择序列上，或者通过载体进行克隆。调控片段例如是控制CIVPS 或内含肽修饰蛋白短暂表达的启动子、复制原点，和/或控制体内特定植物组织和/或特定亚细胞室中CIVPS或内含肽修饰蛋白空间分布的信号序列。选择元件例如包括除草或抗菌基因、荧光标记、染色标记和其他合适的选择标记。然后将得到的包括CIVPS或内含肽修饰蛋白编码多聚核苷酸和视情况选用的任何所要用调控或选择元件的多聚核苷酸或载体扩增，获得可用于随后所用植物品种转化的较大量产物。
上述任一或所有步骤都有可能更改，以促使任一所要用插入蛋白序列和蛋白之间的特异定位和融合。改变蛋白编码序列和/或插入蛋白序列编码序列以及连接其中一个序列或两个序列都可用本领域的已知技术实现，例如定点突变、计算突变(computational mutagenesis)和选择、随机突变、聚合酶链反应(PCR)、易错PCR (error-prone PCR)、和/或技术人员公认的其他任何合适的常规方法。这些技术有助于对大量连接序列进行排列，而且可以使用任何所想要的、合适的组合。同样，根据本发明还可以对调控和选择元件进行任一组合或定位。
基因调控元件，例如启动子(Guilley等，Higgins，T.J.V.，Coruzzi 等，Tingey等，Ryan等，Rocha-Sosa等，Wenzler等，Bird等)、增强子(Brederode等)、RNA剪接位点、核糖体结合位点、糖基化位点、蛋白剪接位点、亚细胞信号序列(Smeekens等，van den Broeck 等、Schreier等，Tague等)、分泌信号序列(Von Heijne，G.，Sijmons 等)或其他有利于控制CIVPS或内含肽修饰蛋白在转化植物体内的短暂或空间分布、范围和形式或糖基化、或者浓度、结构和活性，或者后续在人或除人外的动物体内的治疗活性的调控元件。使用这些元件的目的是帮助将转基因植物中的CIVPS或内含肽修饰蛋白生产和加工成治疗性蛋白。CIVPS或内含肽修饰蛋白可以按组成型或诱导方式表达。为了获得这些模式之一，可按本文描述的、本领域已知的、或者以后发明的方法操作。可以借助一种或多种外部刺激来诱导蛋白表达。诱导方式例如包括使用杀虫剂、光照、温度变化和/或声音等，不过也可使用其他外部刺激。另外，重组植物还可以表达任一种或多种选择标记基因或报告基因，从而产生对溴苯腈、 2，2-二氯丙酸、G418、草甘膦、吡氟氯禾灵(haloxyfop)、潮霉素、咪唑啉、卡那霉素、甲氨蝶呤、新霉素、草胺膦、稀禾定、trichothecne、磺脲、s-三嗪和/或三氮嘧啶(triazolopyrimidine)等化学物质的抗性。
CIVPS或内含肽修饰蛋白DNA序列经构建、与所需调控和选择 DNA序列结合、成功克隆及选择后，就需要转化所要用的植物品种并培育出完整植物。可通过本领域的已知技术(Draper等，Potrykus 等，Broothaerts等)转化所要用的植物品种并培育完整植物。转化技术包括但不限于：根癌农杆菌(Agrobacterium tumefaciens)介导的基因转移、发根农杆菌(Agrobacterium rhizogenes)介导的基因转移、苜蓿根瘤菌(Sinorhizobium meliloti)介导的基因转移、根瘤菌 (Rhizobium)介导的基因转移、百脉根根瘤菌(Rhizobium loti)介导的基因转移、基因直接向植物原生质体转移、Ti质粒介导的基因转移(借助或不借助辅助质粒)、基因枪或粒子轰击植物转化 (Gordon-Kamm等)、微注射和纤维介导的转化、病毒转化和组织电穿孔(Shimamoto等)。整个植物、植物外植体(例如但不限于根外植体)、任何植物部分(例如但不限于植物叶块、种子或种子块)、植物原生质体或非原生质体、或者单个或多个植物细胞中都可发生基因转移。
选择已正确转化的植物使用的也是本领域已知的方法。包含有 CIVPS或内含肽修饰蛋白的转化DNA中的选择标记(例如抗性基因、编码有色化合物产物的基因、编码荧光化合物产物的基因等) 可使选择方法更便利。另外，也可以从转化植物中分离DNA并分析确定预期CIVPS或内含肽修饰蛋白编码序列是否存在。适于对选择步骤予以确认的技术包括DNA测序、聚合酶链式反应、限制位点酶切分析和southern杂交分析。任何可鉴别出预期转基因植物的选择方法都可以使用。
用CIVPS或内含肽修饰蛋白与所需的调控和选择序列转化植物后，就可通过本领域的已知方法再生出整个植物(Horsch等)。大多数方法中都包括：在合适的培养基及光照、温度条件下，培养被转化的植物细胞、外植体、组织、植物部分或整个植物。再生植物的方法不应限制本发明，任何有效方法都可使用。
选出完整的转基因植物后，就能对CIVPS或内含肽修饰蛋白的表达进行监控。如果只是生产表达CIVPS或内含肽修饰蛋白的转基因植物则不需要监控，但需要仔细确认是否真正获得所要的表达 CIVPS或内含肽修饰蛋白的转基因植物，以及其表达是否受所使用的控制元件的正确控制。可通过western杂交分析、放射免疫分析 (RIA)、原位杂交、二维凝胶电泳(和染色)或者质谱分析的方法对植物提取物或从转基因植物中纯化的蛋白组分进行分析以监控 CIVPS或内含肽修饰蛋白的表达。另外，应将一些纯化蛋白或者转基因植物本身用可使CIVPS或内含肽裂解的条件处理。处理完后，可同时将CIVPS或内含肽修饰蛋白和得到的可能是CIVPS或内含肽裂解序列的蛋白进行western杂交分析和其他分析以查验蛋白是否正确以及CIVPS或内含肽修饰蛋白与得到的裂解蛋白之间的活性差异。设计的该活性测定方案应当能监控所需蛋白的活性，而且应该对该活性有特异性，不易受竞争性干扰(competing interference)的影响。可以使用一种控制标准，对天然活性与CIVPS或内含肽修饰活性和CIVPS或内含肽裂解后活性进行比较。
表达CIVPS或内含肽修饰蛋白的植物的应用方法和生产过程包括：将该植物用作生产治疗性蛋白的载体，以及用于输送疫苗。表达CIVPS或内含肽修饰蛋白的转基因植物用作实现上述目的之一的载体的任一批量、半批量或连续的生产过程都属于本发明的主旨。这些生产过程可以包括但不限于以下范围：收获表达CIVPS或内含肽修饰蛋白的植物，向其施加CIVPS或内含肽裂解刺激，然后与其它载体以载体/转基因植物大于或等于0的比例混合，接着用化学、酶学或生物学的方法将其转化成上述产物之一。
如图2所示，本发明还针对从表达CIVPS或内含肽修饰蛋白的植物中制备治疗性蛋白的生产过程。该过程包括：将治疗性蛋白的核酸编码序列分成多个片段；将读码框内的每个片段与能反式剪接的插入蛋白序列编码融合；构建可使融合有插入蛋白序列的编码序列表达的表达载体并挑选转化有该载体的植物；用前面构建的各个表达载体对多个植物进行遗传修饰(性别兼容或不兼容)使得该组植物中含有完整的亲代治疗性蛋白编码序列；使转基因植物生长；收获转基因植物；将转基因植物粉碎并在一种液体制造工艺中混合，这样融合了插入蛋白序列的蛋白部分就在允许剪接的条件作用下，重新形成亲代的治疗性蛋白，最后将该蛋白纯化。
本发明的一个实施例中，表达的CIVPS或内含肽修饰蛋白包括亲代蛋白序列，其活性已知、通过序列或结构同源性推知、和/或通过突变或从头合成而产生。将各亲代序列分成子序列后与插入蛋白序列融合。一旦插入后，融合子序列表达的修饰蛋白在体内就失去了活性。该实施例可以扩大到一个植物或一组植物的两个或两个以上转基因蛋白。如果需要，当与其它按这样设计的CIVPS或内含肽修饰蛋白接触并且存在合适的剪接刺激时，通过CIVPS或内含肽的顺式或反式剪接，完整的亲代蛋白的原有活性就能被完全恢复。例如，在一项应用中，植物收获后，将分别表达融合有插入蛋白序列的一部分治疗性蛋白的两个植物混合，各插入蛋白序列被诱导从其亲代蛋白序列上自我剪接，将两个治疗性蛋白部分连在一起，这样亲代蛋白就恢复了原有或预期活性、亲合力或用作配体或激素的能力。使用或不使用蛋白重组来进行CIVPS或内含肽剪接以产生功能活性的方法是本领域技术人员已知的方法，这里不必重复。这些方法包括使用光照、温度、改变pH和/或加入化学试剂。
图2示出从多个转基因植物中生产出有最终活性的治疗性蛋白。第一步中，所需治疗性蛋白的整个DNA编码序列被分成两个或两个以上片段。然后将各片段与内含肽蛋白编码序列融合。接着将该融合构建体装到合适的表达载体中并将与具有体外反式剪接能力的内含肽融合的各治疗性蛋白片段转化植物，该植物随后表达该构建体。收获这些植物，提取蛋白并混合，这种混合使蛋白融合体发生反式剪接，即内含肽部分被去除，得到的治疗性蛋白部分重新连接，从而重新获得具有完全活性的治疗性蛋白。当处于合适的裂解环境下，CIVPS或内含肽修饰蛋白或其组分的裂解可体外完成。虽然图2示意图中只表示出一例生产治疗性蛋白的整个过程，但是本领域的普通技术人员应当理解，可以构建其它的变化形式作为 CIVPS或内含肽修饰蛋白的组合。
本发明还针对重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，其包含编码至少一个修饰蛋白的表达构建体，其中该修饰蛋白包括其内部或两端与 CIVPS或内含肽序列或其片段融合、或者与CIVPS或内含肽修饰蛋白的氨基端或羧基端相融合的靶蛋白或蛋白片段。在一个实施例中，该植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代的各表达构建体包括可操纵彼此相连的编码靶蛋白的第一核苷酸序列和编码CIVPS或内含肽序列的第二核苷酸序列，以及可视情况选用的选择标记或报告基因和/或启动子。可以理解，在更多特定实施例中，这些序列可以直接或者借助一个或多个接头相融合，更优选是在阅读框内融合。该修饰蛋白可以通过植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代组成型或诱导表达。在后一种情况下，至少一个修饰蛋白可通过一个或多个刺激来启动或诱导表达和/或剪接。合适的刺激例如包括改变pH、改变渗透压、温度、加入化学物质、光照变化和/或声音。
植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可以在植物生命周期的预定时刻、一个或多个特定组织或其组织部分、和/或至少一个特定亚细胞室中表达修饰蛋白。自由选择或与后者结合，该修饰蛋白可以表达并分泌到细胞外。植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代等特定组织可以是种子、根、果实、茎、块茎、和/或叶，特定的亚细胞室可以是细胞质、非原生质体、线粒体、质体、内质网、内含体、液泡和/或细胞核。不过其他组织或亚细胞室也包含在本发明范围内。
植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代还可以携带一个抗化学物质选择标记。选择标记例如包括溴苯腈、2，2-二氯丙酸、G418、草甘膦、吡氟氯禾灵、潮霉素、咪唑啉、卡那霉素、甲氨蝶呤、新霉素、草胺膦、稀禾定、trichothecne、磺脲、s-三嗪和/或三氮嘧啶。不过也可选用其他选择标记。可以在CIVPS或内含肽修饰蛋白核苷酸前加启动子。某些情况下，植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可能对所选择的化学物质的常规剧毒性有耐受性或抗性。
在另一实施例中，植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代是可育的，具有至少一个可遗传的修饰蛋白编码核苷酸序列。不过也可以是不育的。另外如上所示，本发明可扩展到通过本发明所述方法得到或者不能得到的近交和杂交遗传重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代。特别感兴趣的是植物部分、植物种子、植物芽苗和植物原生质体，它们具有重要的商业价值。植物、植物组织、植物细胞和亚细胞片段也具有商业价值和其他兴趣。
在一方面，插入蛋白序列和靶蛋白或蛋白片断形成至少一个与该靶蛋白接合的剪接点。在一个理想的实施例中，在该剪接点的羧基端，氨基酸残基带有羟基或巯基侧链。在另一特别有用的实施例中，该剪接点可能位于插入蛋白序列或其片段的下游，包括位于靶蛋白或蛋白部分的氨基端、不带例如羟基或巯基侧链的氨基酸残基。在另一其它变化形式中，剪接点可能位于插入蛋白序列或其片段的上游，包括位于靶蛋白或蛋白部分的氨基端并带有羟基或巯基侧链的氨基酸残基。另外，该剪接点可能位于插入蛋白序列或其片段的上游，包括一个半胱氨酸。还有另一种重要的变化形式就是剪接点可能位于插入蛋白序列或其片段的下游，在插入蛋白序列或其片段的羧基端具有His-Asn，和/或在邻近的靶蛋白氨基端具有带羟基或巯基侧链的氨基酸残基。在另一变化形式中，剪接点可能位于插入蛋白序列或其片段的下游，在插入蛋白序列或其片段的羧基端具有Asp、Asn、Glu或Gln，和/或在邻近的靶蛋白或其片段氨基端具有带羟基或巯基侧链的氨基酸残基。
进一步的修饰包括羧基端的Asp被不带羧基或氨基侧链的氨基酸取代，插入蛋白序列或其片段包括一个外部可控的插入蛋白序列或其片段。适合插入本发明产品的其他构建体包括插入蛋白序列或其片段在靶蛋白或其片段的Ser、Thr或Cys之前紧挨着插入，和插入蛋白序列的氨基或羧基端包括Ser、Thr或Cys等。
治疗性蛋白或蛋白部分可以在人或除人外的动物、病毒或微生物，例如本领域公知的细菌中表达，后面会有详述。优选的靶蛋白包括胰岛素、促红细胞生成素、生长激素、表皮生长因子、血清白蛋白、胰肮酶、胰岛素样生长激素、肿瘤坏死因子、肿瘤坏死因子受体、HER-2受体、单克隆抗体和其他激素或生长因子，及其所有各自的异构体。
本发明的另一实施例包括修饰蛋白在病毒中的表达。虽然可以使用任何病毒，但具体例如为HIV、肝炎病毒、SARS、人类乳头病毒(Human Pappiloma Virus)、流感病毒、轮状病毒和水痘病毒等。
重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可通过以下方法生产，该方法包括：构建至少编码一种修饰蛋白的表达构建体，该修饰蛋白包括其内部或两端与CIVPS或内含肽序列或其片段融合、或者其与CIVPS或内含肽修饰蛋白的氨基端或羧基端相融合的靶蛋白或蛋白片段；用该表达构建体转化多个植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；从被转化的植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中挑出至少编码一种修饰蛋白序列的遗传重组体使其再生。
转化稳定是非常优选的要求。不过暂时稳定的转化也是可接受的。再生步骤可通过培育植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代，将重组的和非遗传重组的植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代杂交，和/或将两种遗传重组的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代回交来进行。
本方法使用的表达构建体可以包括一个或多个启动子、选择标记、抗性标记、可育标记、聚腺苷化序列、抑制子、增强子、定位序列和/或信号序列。该方法的一个重要方面是，通过病毒转化、包被DNA的微粒轰击、脂质体基因转化、细菌基因转移、电穿孔、或化学基因转化，或者上述几种方法将表达构建体转化到植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中。如上所述，植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可通过例如根癌农杆菌或苜蓿根瘤菌等细菌进行转化，不过也可使用其他的微生物。在本方法中，可以用化学基因转化法进行转化，可以借助例如磷酸钙和/或聚乙二醇或本领域已知的其他适用本目的的化学物质完成。可借助选择标记、抗性标记或至少一种CIVPS或内含肽修饰蛋白编码核苷酸的表达来挑选转化体。本发明的方法中，遗传重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可从被转化的胚性组织、植物原生质体、未成熟胚细胞或被转化的种子等再生而来。
本发明还提供一种从一个或多个表达修饰蛋白或蛋白片段的重组转化植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中生产该修饰蛋白或蛋白片段以及重新形成的具有完全活性的治疗性蛋白的方法，该方法包括：操作上述方法，并且继续从转化植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中收获修饰蛋白或蛋白片段。该方法可进一步包括体外重新形成蛋白，即收获后将表达亲代蛋白的、各自与插入蛋白序列融合的不同子序列的多个植物混合，然后利用CIVPS或内含肽剪接来重新形成原先的亲代序列。该方法可进一步包括纯化修饰蛋白。按此所述，该方法可以生产包含CIVPS或内含肽修饰蛋白或蛋白片段的修饰蛋白或蛋白片段，或者剪接后不带先前融合的插入蛋白序列的完全成熟蛋白。
本发明还提供一种生产修饰蛋白的方法，该修饰蛋白由内部或两端与插入蛋白序列或其片段相融合或与插入蛋白序列或其片段的氨基端或羧基端相融合的靶蛋白或蛋白片段构成。该方法包括获得编码其读码框内或者其氨基端或羧基端融合有插入蛋白序列或其片段的靶蛋白的表达构建体；用该表达构建体转化宿主植物细胞；然后在利于表达修饰蛋白的条件下培养转化植物宿主细胞。
在一个优选方面，表达构建体中编码插入蛋白序列或其片段的至少一个第一核苷酸片段与编码靶蛋白或蛋白片段的第二核苷酸片段的5’端融合。另外，表达构建体中编码插入蛋白序列或其片段的第一核苷酸片段还可以与编码靶蛋白或蛋白片段的第二核苷酸片段的3’端融合。本方法特别适用于使用已知能顺式或反式切除、裂解、连接、切除-连接、裂解-连接和/或环化的插入蛋白序列或其片段。当要诱导插入蛋白序列或其片段进行蛋白剪接时，可采用改变温度、光照或pH、加入或除去能促进或抑制剪接或裂解的化学试剂、氨基酸去磷酸化或去糖基化、或者接触/去除激活或抑制剪接或裂解的肽或模拟肽的方式诱导或启动其发生。
诱导蛋白剪接的另一种方式是体外或体内接触或去除能激活或抑制剪接或裂解的肽或模拟肽制剂。可产生理想结果的重要变化形式是插入蛋白序列或其片段的氨基或羧基端包括Ser、Thr或Cys，或者是插入蛋白序列或其片段的羧基端在靶蛋白或蛋白片段的 Ser、Thr或Cys之前包括Asp、Asn、Gln或Glu。不过，还可能有本领域已知的其他修饰。
在本方法中，表达构建体可进一步包括启动子、选择标记、抗性标记、可育标记、聚腺苷化序列、抑制子、增强子、定位序列和/ 或信号序列。另外，该方法还可以包括通过病毒转化、包被DNA的微粒轰击、脂质体基因转化、细菌基因转移、电穿孔、和/或化学基因转化，或者本领域已知的其他方法，或者以后开发的方法将表达构建体转化到植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代中。如上所述，此处所述方法中，用于转移表达构建体的细胞可以是根癌农杆菌或其他细菌；转化所用化学试剂可以是磷酸钙或聚乙二醇；转化后的植物细胞、植物部分、植物等可通过选择标记或抗性标记的表达来鉴别；选择转化了的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可通过修饰蛋白基因序列的表达来操作；并且遗传重组的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代可通过被转化的胚性组织、植物原生质体、未成熟胚细胞或被转化的种子等再生而来。
本发明还针对一种生产能表达一种或多种修饰蛋白的种子的方法。该方法包括：获得本发明的遗传重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；培养或培育该遗传重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；收获培育出的能表达一种或多种修饰蛋白的植物种子。
本发明提供的另一方法是利用植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代来表达一种或几种修饰蛋白以生产治疗性蛋白。该方法包括收获一个或多个根据本发明教导得到的重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；机械加工该植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代；将该机械加工的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代与其它遗传重组植物按大于或等于零的比例结合，在能获得化合物的条件下化学加工该植物或其特定部分。该化合物可以是利用本发明方法生产的治疗性蛋白或其他产自亲代蛋白的其他目的化合物。
本发明通过挤压、研磨、切碎、包覆、切片、切块、压榨、粉碎和/或撕碎等方式机械加工植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代。不过也可使用其他合适的加工技术。可通过各种技术或其组合对混合成分进行化学加工。其中一些经过以下预处理：蒸汽、稀酸或浓酸、氨爆炸、消毒、水中浸泡、用溶剂混合、改变pH、温度或渗透压、接受或改变光照、无机和/或酶催化、糖化、脱色、冲洗、发酵、蒸馏、色谱分析、吸附和/或加入化学物质。当然，使用其他处理方式也同样奏效。各个步骤操作如下：预处理方式可以是将混合产物浸泡以便抽提之用，化学加工可通过用至少一种硫酸、盐酸、磷酸或碳酸、氢氧化钠、有机或无机碱进行预处理、在20℃或20℃以上的水中浸泡和/或用至少水或有机/无机溶剂之一将混合产物混匀的方式完成。已经述及，可以施加外部刺激来诱导修饰蛋白或蛋白片段的剪接。外部刺激例如包括改变pH、渗透压或温度，使用声音、光照，或者加入化学物质。
某些情况下，剪接蛋白或蛋白片段的活性相对于修饰蛋白或蛋白片段可能发生变化，例如分解代谢、合成代谢、亲合力或治疗活性相对原靶蛋白发生变化。剪接蛋白或蛋白片段例如来源于促红细胞生成素、胰岛素、生长激素、肿瘤坏死因子、肿瘤坏死因子受体、 HER-2受体、表皮生长因子、成纤维细胞生长因子、胰岛素样生长激素、血管紧张素、因子V、因子VII、抗菌肽、抗体或其他激素或生长因子及其所有相关异构体。可见，剪接蛋白能在剪切和连接后变成成熟的治疗性蛋白。
本发明的另一方面包括生产一种或多种靶蛋白或蛋白片段的方法。该方法包括制备第一修饰蛋白或蛋白片段，其中插入蛋白序列或其片段的氨基端通过上述方法与靶蛋白或蛋白片段的羧基端融合；制备包括插入蛋白序列片段的第二或多个修饰蛋白；在利于第二修饰蛋白中插入蛋白序列或其片段反式裂解的条件下，使第一和第二或多个修饰蛋白接触；以及重复该过程直至靶蛋白完全重新形成具有所需活性的蛋白。
上述制备一种或多种靶蛋白的方法可变通为：制备第一修饰蛋白，其中插入蛋白序列或其片段的羧基端通过上述方法与靶蛋白或蛋白片段的氨基端融合；同样制备包括插入蛋白序列片段的第二或多个修饰蛋白或蛋白片段；在利于第一修饰蛋白或蛋白片段中插入蛋白序列或其片段反式裂解的条件下，使第一和第二或多个修饰蛋白接触；以及所有蛋白部分重复该过程直至最终获得所需的靶蛋白。裂解可按以下途径诱导：改变温度、光照或pH，加入或除去能促进/抑制剪接或抑制裂解的化学物质，氨基酸脱磷酸化或去糖基化，和/或接触/除去能激活/抑制剪接/裂解的肽或模拟肽等。
还应当注意，本发明的应用不限于制造加工或机械加工。本发明的应用例如但不限于输送疫苗、激素或治疗性蛋白，其中CIVPS 或内含肽修饰蛋白可以包括治疗性蛋白和/或蛋白抗原(潜在的保护性蛋白序列)和插入蛋白序列的结合，可通过香蕉、黄豆等转基因植物表达。例如，人或除人外的动物消化上述植物产品时即可实现上述输送过程。然后该植物经嘴巴咀嚼并在胃中受体内刺激，从而启动或诱导插入蛋白序列的裂解。如果食用对象是人，就可能是胃中低pH刺激诱导插入蛋白序列从抗原或治疗性蛋白中裂解出来，必要的话，进行适当连接。然后治疗性蛋白或抗原会流入十二指肠或小肠，在那儿pH为中性，蛋白产物可被稳定吸收到血液中。
实施例
例1、利用内含肽修饰技术从多个烟草植物中生产人生长激素。
人生长激素(hGH，也称为human somatotropin)的活性和结构已研究得很透彻，目前人生长激素的几种形式已被许可用于生长激素缺陷、慢性肾功能衰竭、特纳氏综合征、HIV消耗性综合征的干预治疗。生长激素的天然形式之前已在植物中表达(Staub等，2000)
本例介绍从烟草植物的内含肽修饰hGH基因获得人生长激素的步骤。该实施例中，我们选用hGH基因的密码子优化版本(Genbank Accession#AF205361)[SEQ ID NO：1]和来自Synechocystis Sp.的内含肽(Genbank Accession#AF545504(In)，#AF54505(Ic))[SEQ ID NO：2 和3]。虽然在操作本发明时可以对使用的不同步骤作出变更，但本例仅给出以下操作步骤：1)制备内含肽修饰hGH基因；2)将该基因装到合适的烟草表达载体中；3)用该表达载体转化烟草；4)挑选表达内含肽修饰基因的转化体并使其再生成成熟的烟草植物。回收并混合这些植物中的内含肽蛋白以诱导剪接并重组形成有活性的 hGH(如图2所示)。
设计内含肽修饰hGH-In和Ic-hGH的融合基因需要将天然丝氨酸、苏氨酸或半胱氨酸密码子之前紧挨着的hGH基因切开或者加入人工密码子插入该基因任何位置。我们选择将hGH基因(SEQ ID NO：1)的碱基对241处的天然丝氨酸位点裂开。然后合成hGH-In 基因(Blue Heron，Bothell，WA)，得到一段碱基对240处包含hGH 启动密码子并直接与来自集胞藻(Synechocystis)(Genbank #AF545504)[SEQ ID NO：2]dnaE氨基内含肽(In)序列相连的DNA 序列。同样，在hGH基因的碱基对241前插入来自集胞藻(Genbank #AF54505)[SEQ ID NO：3]dnaE羧基内含肽(Ic)的编码序列，该序列后连接着从hGH基因碱基对241到其末端(碱基对582)的基因片段，从而合成Ic-hGH。这些融合产物也能通过PCR和其他分子生物技术很容易地构建而成。
合成后，就将hGH-In基因和Ic-hGH基因克隆到之前已报道过的根癌农杆菌双元表达载体pBI121(GenbankAccession#AY781296) [SEQ ID NO：4](Chin等，2003)中分别构建出pBIhGHIn和 pBIIchGH。利用电穿孔法将每个载体导入根癌农杆菌LBA4404中得到两组不同的克隆子：一组包含pBIhGHIn，另一组包含pBIIchGH。然后挑出各组的克隆子，30℃、200rpm、LB培养基中培养过夜。第二天早上将培养物用LB培养基按1∶1稀释，培养至A550约为1.0。选用烟草根培养28天至35天后的叶片进行转化。一组叶片与含 pBIhGHIn的根癌农杆菌共培养，另一组叶片与含pBIIchGH的根癌农杆菌共培养。在转化培养基(1×MS盐、3％蔗糖、2mg/L α-萘乙酸、 0.5mg/L苄氨基嘌呤)中28℃培养2-3天。然后将叶切片转移到选择培养基中(1×MS盐、3％蔗糖、2mg/L α-萘乙酸、500mg/L羧苄青霉素和100mg/L卡那霉素)。然后再生出重组植物，并植入土壤获得每个转化体。
用收获缓冲液(50mM Tris-HCl，pH8.0，200mM NaCl，5mM EDTA和0.1％Tween20)从根癌农杆菌所转化的分别含有pBIhGHIn 和pBIIchGH的各植物中收获蛋白。可以将这些pBIhGHIn和 pBIIchGH蛋白在25℃、pH7缓冲液中混合，并培育诱导两个片段之间进行反式内含肽剪接。最后得到完整的hGH。使用hGH抗体进行 western杂交分析可测得该蛋白大小，根据已报道的大鼠Nb2细胞的生长刺激(Staub等，2000)可检测该蛋白的活性。
例2：使用内含肽修饰技术从烟草植物中生产人促红细胞生成素人促红细胞生成素的活性和结构已研究得很透彻(Lai等， 1986)，目前人促红细胞生成素的几种形式已被许可用于贫血的干预治疗。人促红细胞生成素的天然形式之前已在植物中表达(Cheon 等，2004)。天然形式的促红细胞生成素的表达会影响植物形态和再生能力，所以内含肽修饰可降低该蛋白在植物中表达的负面影响。
虽然也可以使用其他植物宿主，但本例仅介绍从烟草中的内含肽修饰hEPO基因获得人促红细胞生成素(hEPO)的步骤。该实施例中，我们选用EPO基因(Genbank Accession#NM000799)[SEQ ID NO：5]和来自Mycobacterium tuberculosis的其编码区的自导引核算内切酶编码区(编码区碱基对313-1002，对应氨基酸105-334)被去掉的内含肽(Genbank Accession#X58485)[SEQ ID NO：6]。虽然在操作本发明时可以对使用的不同步骤作出变更，但本例仅给出以下操作：1)制备内含肽修饰hEPO基因；2)将该基因装到合适的烟草表达载体中；3)用该表达载体转化烟草；4)挑选表达内含肽修饰基因的转化体并使其再生成成熟的烟草植物。回收这些植物中的内含肽蛋白并诱导剪接从而重组形成有活性的hEPO。
设计内含肽修饰hEPO基因需要将成熟肽的天然半胱氨酸29之前紧邻的hEPO基因切开。虽然可以选用其他的半胱氨酸残基，但是纯化的剪接效率较低。可以通过上述序列合成(Blue Heron，Bothell， WA)hEPO基因，或者用以前报道的方法制备(Gangopadhyay等， 2003)。
合成后，将内含肽修饰hEPO基因(现在称为IC29hEPO)[SEQ ID NO：7]克隆到以前报道(Cheon等，2004)的根癌农杆菌双元表达载体pPEV-1(Clontech，CA，USA)中得到pPEV-IC29hEPO。然后利用电穿孔法将pPEV-IC29hEPO导入根癌农杆菌EHA105。然后使用加有25mg/L利福平和50mg/L卡那霉素的YEP培养基筛选转化克隆子。
选用烟草叶培养9周的叶片进行转化。用次氯酸钠对叶片消毒后，取大小0.5cm2的叶块与含有pPEV-IC29hEPO的根癌农杆菌 EHA105重组子在28℃暗处共培养3天。28℃转化培养基(1×MS 盐)上温育2-3天。然后用内含250mg/L羧苄青霉素的1×MS冲洗并转移到选择培养基(1×MS盐、3％蔗糖、2mg/L苄氨基嘌呤、0.1mg/L 萘乙酸、250mg/L羧苄青霉素和100mg/L卡那霉素)。取出在含有卡那霉素的培养基中形成的重组根，置于新鲜的再生培养基中。然后将根转移到生根培养基(1×MS琼脂、250mg/L羧苄青霉素、100mg/L 卡那霉素)上并随后移植转化体，从而再生出重组植物。
用收获缓冲液(50mM Tris-HCl，pH8.0，200mM NaCl，5mM EDTA和0.1％Tween20)或本领域已知的其他方法从上述植物中收获蛋白。可以将这些IC29hEPO蛋白重悬在含1mMEDTA、0.5M L-精氨酸、1mM DTT(或TCEP)、20mM磷酸钠pH7.5和0.5NaCl的溶液中，25℃培养过夜(Gangopadhyay等，2003)。这样就得到内含肽被剪切下来的完整形式的hEPO。使用hEPO抗体进行western杂交分析可检测该蛋白大小。
至此本发明描述完毕，在不脱离本发明的精神或范围下对本发明作出变更和修饰，对本领域的普通技术人员来说是显而易见的。
参考书目
Dale，Biotechnol.Prog.15：775-776(1999).
Park，et al.，Biotechnol.Prog.14：699-704(1998).
Taylor，et al.，Biotechnol.Prog.16：541-547(2000).
Poirier，Nature Biotechnology 17：960-961(1999).
Ingram，Biotechnol.Prog.15：855-866(1999).
Mansfield，et al.，Biotechnol.Prog.15：804-816(1999).
Evans，et al.，Protein Science 7：2256-2264(1998).
Perler，et al.，Nucl.Acids Res.22：1125-1127(1994).
Xu，et al.，EMBO 15：5146-5153(1996).
Wood，et al.，Biotechnol.Prog.16：1055-1063(2000).
Clarke，P.N.A.S.(USA)91：11084-11088(1994).
Derbyshire，et al.，P.N.A.S.(USA)95：1356-1357(1998).
Perler，et al.，Nucleic Acids Res.22：1125-1127(1994).
Wallace，C.J.，Protein Sci.2：697-705，(1993).
Xu，et al.，Cell 75：1371-1377(1993).
Pietrokovski，S.，Protein Sci.3735：2340-2350(1994).
Ausbel，et al.，“Current Protocols in Molecular Biology，”Wiley，New York(1998).
Draper，et al.，“Plant Genetic Transformation and Gene Expression：A Laboratory Manual，”Blackwell Scientific Publications，Boston(1998).
Potrykus，et al.，“Gene Transfer to Plants，”Springer，New York(1995).
Guilley，et al.，Cell，30：763(1982).
Broothaerts，et al.，Nature，433：629(2005).
Higgins，T.J.V，Annu.Rev.Plant Physiol.35：191(1984).
Coruzzi，et al.，EMBO J.3：1671(1984).
Tingey，et al.，EMBO J.6：3565(1987).
Ryan，et al.，Nuc.Acids Res.17：3584(1989).
Rocha-Sosa，et al.，EMBO J.8：23(1989).
Wenzler，et al.，Plant Mol.Biol.12：41(1989).
Bird et al.，Plant Mol.Biol.11：651(1988).
Brederode，et al.，Nucl.Acids Res.8：2213(1980).
Smeekens，et al.，T.I.B.S.15：73(1990).
van den Broeck et al.，Nature 313：358(1985).
Schreier，et al.，EMBO J.4：25(1985).
Tague，et al.，Plant Phys.86：506(1988).
Von Heijne，G.，J.Mol.Biol.189：239(1986).
Sijmons，et al.，Bio/Technol.8：217(1990).
Gordon-Kamm，et al.，The Plant Cell 2：603(1990).
Shimamoto，et al.，Nature 338：274(1989).
Horsch，et al.，Science 2：1229(1985).
Ziegler，et al.，Molecular Breeding 6：37-46(2000).
Dai，et al.，(a)，Molecular Breeding 6：277-285(2000).
Dai，et al.，(b)，Molecular Breeding 9：43-54(2000).
Montvalvo-Rodriguez，et al.，Biotech.and Bioeng.2：151-159(2000).
U.S.Patent No.6,022,846.
Chu，et al.，Sci.Sin.18：659-668(1975).
Klein，et al.，Nature 327：70-73(1987).
Chin，et al.，PNAS 100：4510(2003).
Staub，et al.，Nature Biotech 18：333(2000).
Lai et.al.，J.Biol.Chem.，261：3116(1986).
Cheon et.al.，Transgenic Research，13：541(2004).
Gangopadhyay et.al.，Biochimica et BiophysicaActa，1619：193(2003).
序列表
<110>Agrivida，Inc.
     Raab，R. Michael
     Rupling，Karl
     Jensen， Kyle L.
<120>TRANSGENIC PLANTS EXPRESSING INTEIN MODIFIED PROTEINS AND
     ASSOCIATED PROCESSES FOR BIO-PHARMACEUTICAL PRODUCTION
<130>RAA-PT002WO
<150>US60/572,966
<151>2004-05-19
<160>7
<170>PatentIn version 3.3
<210>1
<211>582
<212>DNA
<213>Homo sapiens
<400>1
atgggggtgc acgaatgtcc tgcctggctg tggcttctcc tgtccctgct gtcgctccct      60
ctgggcctcc cagtcctggg cgccccacca cgcctcatct gtgacagccg agtcctggag     120
aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc     180
agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg     240
atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct     300
gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg     360
catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga     420
gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc     480
actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg     540
aagctgtaca caggggaggc ctgcaggaca ggggacagat ga                        582
<210>2
<211>609
<212>DNA
<213>Synechocystis sp.
<400>2
atggctttcc cgactattcc actgagccgc ctgttcgaca acgctatgct gcgagctcac      60
cgtctgcacc agctggcttt cgacacctac caggagttcg aagaagcata catcccgaaa     120
gaacagaaat actccttcct gcagaacccg cagacctccc tgtgcttctc cgaaagcatt     180
ccgaccccga gcaaccgcga agaaacccag cagaaatcca acctcgagct gctgcgtatc     240
tgcctttctt tcggaactga gatccttacc gttgagtacg gaccacttcc tattggtaag     300
atcgtttctg aggaaattaa ctgctcagtg tactctgttg atccagaagg aagagtttac     360
actcaggcta tcgcacaatg gcacgatagg ggtgaacaag aggttctcga gtacgagctt     420
gaagatggat ccgttattcg tgctacctct gaccatagat tcttgactac agattatcag     480
cttctcgcta tcgaggaaat ctttgctagg caacttgatc tccttacttt ggagaacatc     540
aagcagacag aagaggctct tgacaaccac agacttccat tccctttgct cgatgctgga     600
accatcaag                                                             609
<210>3
<211>453
<212>DNA
<213>Synechocystis sp.
<400>3
atggttaagg tgattggaag acgttctctt ggtgttcaaa ggatcttcga tatcggattg      60
ccacaagacc acaactttct tctcgctaat ggtgccatcg ctgccaattg ctccctgctg     120
ctgattcaat cctggctgga accagttcag ttcctgcgtt ccgttttcgc taactcacta     180
gtttatggcg cttccgactc caacgtttac gacctgctga aggacctgga agaaggtatt     240
cagactctga tgggtcgtct ggaggacggt tcccctagga ccggtcagat cttcaaacag     300
acctatagca aattcgacac caactcccac aacgacgacg cgttgctgaa aaactacggt     360
ctgctgtact gcttccggaa ggacatggac aaggttgaga ctttcctgcg tatcgttcag     420
tgccgttccg ttgaaggttc ctgcggtttc taa                                  453
<210>4
<211>8196
<212>DNA
<213>Expression vector pBI121
<400>4
aaacactgat agtttaaact gaaggcggga aacgacaatc tgatcatgag cggagaatta      60
agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac gtttggaact     120
gacagaaccg caacgattga aggagccact cagccgcggg tttctggagt ttaatgagct     180
aagcacatac gtcagaaacc attattgcgc gttcaaaagt cgcctaaggt cactatcagc     240
tagcaaatat ttcttgtcaa aaatgctcca ctgacgttcc ataaattccc ctcggtatcc     300
aattaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt     360
gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg     420
ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg     480
gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg     540
ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg     600
gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca     660
tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc     720
accaagcgaa acatcgcatc gagcgagcac gtactcggat.ggaagccggt cttgtcgatc     780
aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca     840
aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga     900
atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg     960
cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg    1020
aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg    1080
ccttctatcg ccttcttgac gagttcttct gagatcgttc aaacatttgg caataaagtt    1140
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt    1200
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta    1260
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa    1320
actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgggcc tcctgtcaat    1380
gctggcggcg gctctggtgg tggttctggt ggcggctctg agggtggtgg ctctgagggt    1440
ggcggttctg agggtggcgg ctctgaggga ggcggttccg gtggtggctc tggttccggt    1500
gattttgatt atgaaaagat ggcaaacgct aataaggggg ctatgaccga aaatgccgat    1560
gaaaacgcgc tacagtctga cgctaaaggc aaacttgatt ctgtcgctac tgattacggt    1620
gctgctatcg atggtttcat tggtgacgtt tccggccttg ctaatggtaa tggtgctact    1680
ggtgattttg ctggctctaa ttcccaaatg gctcaagtcg gtgacggtga taattcacct    1740
ttaatgaata atttccgtca atatttacct tccctccctc aatcggttga atgtcgccct    1800
tttgtctttg gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc    1860
agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg    1920
agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg    1980
tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc    2040
aagcttgcat gcctgcagcc cacagatggt tagagaggct tacgcagcag gtctcatcaa    2100
gacgatctac ccgagcaata atctccagga aatcaaatac cttcccaaga aggttaaaga    2160
tgcagtcaaa agattcagga ctaactgcat caagaacaca gagaaagata tatttctcaa    2220
gatcagaagt actattccag tatggacgat tcaaggcttg cttcacaaac caaggcaagt    2280
aatagagatt ggagtctcta aaaaggtagt tcccactgaa tcaaaggcca tggagtcaaa    2340
gattcaaata gaggacctaa cagaactcgc cgtaaagact ggcgaacagt tcatacagag    2400
tctcttacga ctcaatgaca agaagaaaat cttcgtcaac atggtggagc acgacacact    2460
tgtctactcc aaaaatatca aagatacagt ctcagaagac caaagggcaa ttgagacttt    2520
tcaacaaagg gtaatatccg gaaacctcct cggattccat tgcccagcta tctgtcactt    2580
tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa tgccatcatt gcgataaagg    2640
aaaggccatc gttgaagatg cctctgccga cagtggtccc aaagatggac ccccacccac    2700
gaggagcatc gtggaaaaag aagacgttcc aaccacgtct tcaaagcaag tggattgatg    2760
tgatatctcc actgacgtaa gggatgacgc acaatcccac tatccttcgc aagacccttc    2820
ctctatataa ggaagttcat ttcatttgga gagaacacgg gggactctag agtttgaaat    2880
tctctgtgaa ttttttttgt tgattgatga ttgtcttcaa aaacattcct gggtttgact    2940
tttttttcat cggagcttcg tctgtgttgt tggttgatgt caattggtat ttgtattaat    3000
ccgtactttt tcaatgattg ctttcttaag ttttttaaca tttgtttttt ggcggcggag    3060
aaatctggag taatgttgaa aaacaatgac aattttgttt ctttcaatcc taaattttcg    3120
atttttctca ctacccttat ctctatttga tcgatttttt gttattgttt acagatgaaa    3180
aagcagagaa ttgttgtgaa aatcgggagc agctcgctca caaacagtaa cggaagtatt    3240
gatgaagcca aaatcaagga gcatacggaa gccatttcat tattaaaaga aaacgggcat    3300
gaagtaatcc tcattacctc aggcgcggtg gcagccggtt tttccgctct cggctatccg    3360
gcgcgccccg ttacgataaa aggaaagcag gcagccgccg cggtcggcca gacgctttta    3420
atgcagcaat atatggacca tttaaaaaga tacggtctga cgccggcgca aattttatta    3480
acaagaaatg atttctcaaa aagagagcgg tacagaaatg cgtatgccac ggtaatggaa    3540
ttattggagc ggggagtcgt gccgattatt aatgagaatg attccacatc agtcgaagaa    3600
ctgacgttcg gagataatga catgctgtcg gcgcttgtga gcggcctgat tcatgcagac    3660
caattaatga ttctcacaga cattaacggg ctgtacgatg ccaatccgaa tgaaaaccct    3720
gacgcaaagc ggtttgacta tttgactgac attacacctg aattgctcgg gtatgccgga    3780
tcagcgggct cgaaggtcgg caccggaggc atgaagtcaa aatttctcgc tgcccagacc    3840
gcattgtcgc tcggagttaa ggtgtttatc ggaaccggtg ccggacggga aaaactgaag    3900
gtgattttag acggtaaagg cgacggcaca tatatcggtg ataaagagct gtccaccgtc    3960
aataatacac ggcaatggat catgtttcat tctccgatat caggggaaat catcattgat    4020
gggggagcgg agcaggcgat gatccataac ggctcaagtc tccttccggc cggtgtcgcc    4080
gatgtctgcg gcagttttcc gaaaggggcc gtggtggaag tcagaggtcc cggcggcatc    4140
atcggcaaag ggcagacgca ttactcatcc gatgagattt tggaagccaa agggaagcgg    4200
agcgatcagc ttccgggcgc gaagcaggtg gaagtgattc acagaaatga ttgggtgaat    4260
ctatttgacg agggggaaaa caaatgatct agaggatccg tttgaaattc tctgtgaatt    4320
ttttttgttg attgatgatt gtcttcaaaa acattcctgg gtttgacttt tttttcatcg    4380
gagcttcgtc tgtgttgttg gttgatgtca attggtattt gtattaatcc gtactttttc    4440
aatgattgct ttcttaagtt ttttaacatt tgttttttgg cggcggagaa atctggagta    4500
atgttgaaaa acaatgacaa ttttgtttct ttcaatccta aattttcgat ttttctcact    4560
acccttatct ctatttgatc gattttttgt tattgtttac agatgagtga agtattgcaa    4620
aaagctgcct tggcaaaaga agcggctgcc gaaatggtca tgaaaacgac tgctgaaaaa    4680
aacgaagcgc tccaatgtat tgcagacgga ctcagaaatg aacgccagct gattttaaca    4740
gagaatcaga aagatattga agcgggacag aaaagagggc tgacacctga cattattgac    4800
aggctgactc ttgatgaaaa acgcctgctc gatatcgcgg atgctgtaga actgttaatc    4860
ggtctggaag atcccgtcgg tgaatcattg gagaccattc aaaaagagaa tggattatcc    4920
attgaaaaaa tccgcgtgcc cctcggagta gtgggcatga tctatgaagc cagaccgaat    4980
gttaccgtag acgctgccac actttgcctg aaaaccggaa acgcggttgt gctcagagga    5040
agttcgtcag ccatccacag caacaaagcg cttgtcagtg tgatgaaacg cgcactggga    5100
ctgtcaaagc ttccgattga tgccgttcag ctcatagaag atacaagcaa agaaaccgcg    5160
aaacagctct tcacattaaa tgacgggctg gatgtattga tcccgcgcgg cggcaaaaat    5220
ttgattgatc tggtggtcag ggaatcaacc gtacccgtgt tagaaaccgg agcgggcaac    5280
tgccacgtgt acatagatga gtcagcagat cccgatatgg caagagatgt cgtcatcaac    5340
gccaaaacac agcggccttc tgtctgcaat gcgattgaat ctcttttgat tcatgaaaaa    5400
tgggcggaag tacacggacg aaagctgctg aatcagctga cagaaaaagg ggtggagcta    5460
cgcggagatc agatgatttg cgagctggag cctaatgcga aacaagccga agaggccgat    5520
tggggagcgg aatacctggc gccgattctc agtgtaaaaa cggtgcatga cgtacaggag    5580
gcggtccgcc acattcagca gtacggcaca aaccattcag aagccattct gacggaaaac    5640
ggtgagcatg ccgcttactt ccagacagcc gttgacgccg ccgccgtgta tcataatgct    5700
tccacacggt ttacagacgg ctttgaattc tgaggatccc cgggtggtca gtcccttatg    5760
ttacgtcctg tagaaacccc aacccgtgaa atcaaaaaac tcgacggcct gtgggcattc    5820
agtctggatc gcgaaaactg tggaattgat cagcgttggt gggaaagcgc gttacaagaa    5880
agccgggcaa ttgctgtgcc aggcagtttt aacgatcagt tcgccgatgc agatattcgt    5940
aattatgcgg gcaacgtctg gtatcagcgc gaagtcttta taccgaaagg ttgggcaggc    6000
cagcgtatcg tgctgcgttt cgatgcggtc actcattacg gcaaagtgtg ggtcaataat    6060
caggaagtga tggagcatca gggcggctat acgccatttg aagccgatgt cacgccgtat    6120
gttattgccg ggaaaagtgt acgtatcacc gtttgtgtga acaacgaact gaactggcag    6180
actatcccgc cgggaatggt gattaccgac gaaaacggca agaaaaagca gtcttacttc    6240
catgatttct ttaactatgc cggaatccat cgcagcgtaa tgctctacac cacgccgaac    6300
acctgggtgg acgatatcac cgtggtgacg catgtcgcgc aagactgtaa ccacgcgtct    6360
gttgactggc aggtggtggc caatggtgat gtcagcgttg aactgcgtga tgcggatcaa    6420
caggtggttg caactggaca aggcactagc gggactttgc aagtggtgaa tccgcacctc    6480
tggcaaccgg gtgaaggtta tctctatgaa ctgtgcgtca cagccaaaag ccagacagag    6540
tgtgatatct acccgcttcg cgtcggcatc cggtcagtgg cagtgaaggg cgaacagttc    6600
ctgattaacc acaaaccgtt ctactttact ggctttggtc gtcatgaaga tgcggacttg    6660
cgtggcaaag gattcgataa cgtgctgatg gtgcacgacc acgcattaat ggactggatt    6720
ggggccaact cctaccgtac ctcgcattac ccttacgctg aagagatgct cgactgggca    6780
gatgaacatg gcatcgtggt gattgatgaa actgctgctg tcggctttaa cctctcttta    6840
ggcattggtt tcgaagcggg caacaagccg aaagaactgt acagcgaaga ggcagtcaac    6900
ggggaaactc agcaagcgca cttacaggcg attaaagagc tgatagcgcg tgacaaaaac    6960
cacccaagcg tggtgatgtg gagtattgcc aacgaaccgg atacccgtcc gcaaggtgca    7020
cgggaatatt tcgcgccact ggcggaagca acgcgtaaac tcgacccgac gcgtccgatc    7080
acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga tctctttgat    7140
gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt ggaaacggca    7200
gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca gccgattatc    7260
atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac cgacatgtgg    7320
agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga tcgcgtcagc    7380
gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca aggcatattg    7440
cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa gtcggcggct    7500
tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca gcagggaggc    7560
aaacaatgaa tcaacaactc tcctggcgca ccatcgtcgg ctacagcctc gggaattgct    7620
accgagctcg atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc    7680
ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt aataattaac    7740
atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac    7800
atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg    7860
gtgtcatcta tgttactaga tggaattcac tggccgtcgt tttacaacgt cgtgactggg    7920
aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc    7980
gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg    8040
aatgaattca gtacattaaa aacgtccgca atgtgttatt aagttgtcta agcgtcaatt    8100
tgtttacacc acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg    8160
gcacaaaatc accactcgat acaggcagcc catcag                              8196
<210>5
<211>582
<212>DNA
<213>Homo sapiens
<400>5
atgggggtgc acgaatgtcc tgcctggctg tggcttctcc tgtccctgct gtcgctccct      60
ctgggcctcc cagtcctggg cgccccacca cgcctcatct gtgacagccg agtcctggag     120
aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc     180
agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg     240
atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct     300
gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg     360
catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga     420
gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc     480
actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg     540
aagctgtaca caggggaggc ctgcaggaca ggggacagat ga                        582
<210>6
<211>636
<212>DNA
<213>Mycobacterium tuberculosis
<400>6
tgcctcgcag agggcactcg gatcttcgat ccggtcaccg gtacaacgca tcgcatcgag      60
gatgttgtcg atgggcgcaa gcctattcat gtcgtggctg ctgccaagga cggaacgctg     120
catgcgcggc ccgtggtgtc ctggttcgac cagggaacgc gggatgtgat cgggttgcgg     180
atcgccggtg gcgccatcgt gtgggcgaca cccgatcaca aggtgctgac agagtacggc     240
tggcgtgccg ccggggaact ccgcaaggga gacagggtgg cgcaaccgcg acgcttcgat     300
ggattcggtg acctggctgc agagatgacc gatgccgtgc tgaattatct ggacgagcgc     360
ggcgtgaccg cgcaggaggc cgcggccatg atcggtgtag cttccgggga cccccgcggt     420
ggaatgaagc aggtcttagg tgccagccgc cttcgtcggg atcgcgtgca ggcgctcgcg     480
gatgccctgg atgacaaatt cctgcacgac atgctggcgg aagaactccg ctattccgtg     540
atccgagaag tgctgccaac gcggcgggca cgaacgttcg acctcgaggt cgaggaactg     600
cacaccctcg tcgccgaagg ggttgtcgtg cacaac                               636
<210>7
<211>1137
<212>DNA
<213>Synthetic construct
<400>7
gccccaccac gcctcatctg tgacagccga gtcctggaga ggtacctctt ggaggccaag      60
gaggccgaga atatcacgac gggctgcctc gcagagggca ctcggatctt cgatccggtc     120
accggtacaa cgcatcgcat cgaggatgtt gtcgatgggc gcaagcctat tcatgtcgtg     180
gctgctgcca aggacggaac gctgcatgcg cggcccgtgg tgtcctggtt cgaccaggga     240
acgcgggatg tgatcgggtt gcggatcgcc ggtggcgcca tcgtgtgggc gacacccgat     300
cacaaggtgc tgacagagta cggctggcgt gccgccgggg aactccgcaa gggagacagg     360
gtggcgcaac cgcgacgctt cgatggattc ggtgacctgg ctgcagagat gaccgatgcc     420
gtgctgaatt atctggacga gcgcggcgtg accgcgcagg aggccgcggc catgatcggt     480
gtagcttccg gggacccccg cggtggaatg aagcaggtct taggtgccag ccgccttcgt     540
cgggatcgcg tgcaggcgct cgcggatgcc ctggatgaca aattcctgca cgacatgctg     600
gcggaagaac tccgctattc cgtgatccga gaagtgctgc caacgcggcg ggcacgaacg     660
ttcgacctcg aggtcgagga actgcacacc ctcgtcgccg aaggggttgt cgtgcacaac     720
tgtgctgaac actgcagctt gaatgagaat atcactgtcc cagacaccaa agttaatttc     780
tatgcctgga agaggatgga ggtcgggcag caggccgtag aagtctggca gggcctggcc     840
ctgctgtcgg aagctgtcct gcggggccag gccctgttgg tcaactcttc ccagccgtgg     900
gagcccctgc agctgcatgt ggataaagcc gtcagtggcc ttcgcagcct caccactctg     960
cttcgggctc tgggagccca gaaggaagcc atctcccctc cagatgcggc ctcagctgct    1020
ccactccgaa caatcactgc tgacactttc cgcaaactct tccgagtcta ctccaatttc    1080
ctccggggaa agctgaagct gtacacaggg gaggcctgca ggacagggga cagatga       1137

标题	发布/更新时间	阅读量
一种用于治疗卵巢早衰的产品	2020-05-12	288
一种抗人甲状旁腺激素的纳米抗体及其筛选方法和应用	2020-05-23	854
用于传递治疗剂的基于环糊精的聚合物	2020-05-27	467
修饰的生长激素	2020-05-20	866
一种用于治疗瘢痕的夹子	2020-05-14	362
17α-二氢马烯雌酮抗动脉粥样硬化的用途	2020-05-23	500
一种治疗尿毒症的中药组合物及其制备方法	2020-05-22	116
用PDGF-CC抑制剂和抗雌激素治疗ER阴性乳癌	2020-05-11	728
MiR-26家族作为肝细胞癌和对治疗的应答性的预测性标志物的用途	2020-05-25	61
一种改善功能性消化不良的菊芋粕菊粉及其制备方法和应用	2020-05-17	621

表达内含肽修饰蛋白的转基因植物及相关生物药物的生产过程

技术领域

背景技术

发明内容

附图说明

具体实施方式

该功能需要专业版企业版VIP权限，您可以：