图1是表示将CIVPS或内含肽编码序列与具有目标活性的蛋白 编码基因的3’端、5’端融合或者插入该基因内部来构建CIVPS或内 含肽修饰治疗性蛋白编码DNA序列,然后将该序列翻译成CIVPS 或内含肽修饰蛋白的示意图。
图2是表示从多种转基因植物中生产出具有最终活性的治疗性 蛋白的示意图。
本发明是针对一种新的从植物中高效低廉地生产安全药物的方 法,该方法利用CIVPS、或内含肽修饰治疗性蛋白、或蛋白部分对 植物进行改造,其中CIVPS或内含肽连接到所需的蛋白部分。本文 所用的术语“CIVPS”和“内含肽”意指相同产品,可互换使用。简化起 见,这里将术语“CIVPS”和“内含肽”统称为“插入蛋白序列”。
由于CIVPS或内含肽修饰蛋白或蛋白部分可以在细胞中高表 达,但其活性则大为降低,因此发现如果将其克隆到一种或多种植 物中,活性降低则使上述转基因植物细胞、植物片段或植物组织长 成能产生CIVPS或内含肽修饰蛋白的完整植物。另外,在几个例如 使重组植物按以下方式表达修饰蛋白或蛋白部分的不同实施例中都 可能获得这样的转基因植物:1)组成型或瞬时地,2)植物生长周 期中使用化学诱导或生物诱导,3)在整个植物或尤其是在不同的植 物组织内,和/或4)有或没有亚细胞
定位等。
本发明是针对转基因植物中治疗性蛋白的生产,所用术语“转基 因植物”与遗传重组植物同义,它们的种子和后代植物、或者任何植 物部分、组织或细胞,都含有编码包括但不限于
激素、生长因子、 细胞因子、受体、配体、
抗体(单克隆等)和
疫苗等CIVPS或内含 肽修饰治疗性蛋白的基因。本发明还针对转基因植物本身,其含有 编码包括但不限于激素、生长因子、细胞因子、受体、配体、抗体 (单克隆等)和疫苗等CIVPS或内含肽修饰治疗性蛋白的基因。本 发明进一步针对产生CIVPS或内含肽修饰治疗性蛋白的转基因植物 的生产,从植物中生产CIVPS或内含肽修饰治疗性蛋白的方法,以 及植物作为治疗性蛋白生产载体的用途。
转基因植物是表达单个或多个外源基因及其相关蛋白(或核苷 酸)活性的多细胞植物。插入蛋白序列是亲代蛋白序列内部的或与 其相邻的蛋白序列,它可以自动在任一端或两端,即羧基端或
氨基 端,自我裂解,并能在特定条件下顺式或反式反应合适时,有选择 地使得到的外显肽(extein)蛋白片段连接。例如参见Perler等,Nucl. Acids Res.,22:1125-1127(1994);Pietrokovski,S.,Protein Sci., 2:697-705(1994)。所以,可以将插入蛋白序列描述为读码框内 (in-frame)的、能自我裂解并能潜在自我连接的多肽,通常作为较 大的前体蛋白分子的一部分出现。插入蛋白序列在几个基本方面与 其他蛋白酶或酶原有所不同。与蛋白酶将自身或其他蛋白裂解成多 个不连接的多肽不同,插入蛋白序列具有既能将自身或其他蛋白裂 解又能将多个多肽反式或顺式构象连接的能力。所以,相对于蛋白 酶对蛋白起作用所导致的末端裂解而言,插入蛋白序列则具有使多 个位点裂解并将得到的蛋白片段连在一起的能力。这种裂解可自动 发生,或者可通过已知的分子生物技术或生物化学技术在特定条件 下诱导产生。已知诱导插入蛋白序列剪接的技术包括改变插入蛋白 序列的温度(通常提高温度)、降低插入蛋白序列溶液的pH值,或 者用各种化学物质,特别是含硫醇的
试剂,处理插入蛋白序列。另 外,使用尿素或二价阳离子,尤其是Zn2+,能抑制插入蛋白序列的 剪接。加入EDTA可消除二价阳离子的抑制。各种来源的插入蛋白 序列的序列、特征及功能已有较全面的文献报道。例如参见:Kane et.al.,Science 250:651(1990);Davis et.al.,J.Bact.173:5653(1991), Davis et.al.,Cell 71:1(1992)(Mycobacterium tuberculosis);Perler,et.al., PNAS 89:5577(1992)(Thermococcus litoralis)。
图1所示,内含肽DNA编码序列与治疗性蛋白编码DNA序列 结合产生其目标活性或结构功能可被完全改变的内含肽修饰蛋白。 表达CIVPS或内含肽修饰蛋白(由相关的CIVPS或内含肽修饰基因 编码)的转基因植物比以前的转基因植物有所改进,这是因为亲代 CIVPS或内含肽修饰蛋白可以有两种通过插入蛋白序列裂解进行可 控介导的截然不同的状态。这种裂解可能与目标蛋白序列的重组有 关也可能无关。
本发明可以由任一种或多种植物品种以及单个或多个蛋白与一 个或多个插入蛋白序列的任一组合构成。植物品种可以包括但不限 于:杨树、桦树、
雪松、松树、阔叶树、针叶树、黄豆、柳枝稷、 玉米、
烟草、紫苜蓿、
甘蔗、花椰菜、洋蓟、香蕉、苹果、草莓、 蔓越橘、黄瓜、莴苣、葡萄、柠檬、瓜、坚果、柑橘、水稻、柑桔、 桃、梨、
蓝莓、草莓、西红柿、胡萝卜、卷心菜、
马铃薯、菊苣、 韭葱、菠菜、
杂草、竹芋、甜菜、木薯、芜菁、山药、小萝卜、甘 薯、小麦、
大麦、大豆、豆、
油菜籽、粟、向日葵、燕麦、豌豆、 块茎、竹子、海藻、藻(algae)等。
蛋白可以包括任何已知的、公认的、经修饰的或者新构建的有 治疗效用的蛋白。虽然天然蛋白的选用不受限制,但是优选的蛋白 包括激素(胰岛素、生长激素、抗利尿激素)、生长因子(促红细胞 生成素、表皮生长因子、胰岛素样生长因子、
成纤维细胞生长因子)、 细胞因子(IL-2,IL-6)、酶(胰肮酶、胃脂肪酶、葡糖脑苷脂酶、尿 激酶、
艾杜糖
醛酸苷酶)、细菌或病毒
抗原、抗体、受体和其他涉及
疾病发病机理的治疗性蛋白及其所有相关异构体。
用于修饰蛋白、并且其融合体会在所选用植物中表达的插入蛋 白序列的选用也不受限制。可以在所选用蛋白的任何构型中使用任 一或多个插入蛋白序列。插入蛋白序列应具有在某些刺激作用下其 一端或两端被剪接的能力,并且可以允许或不允许一个或多个插入 蛋白序列所融合的蛋白的连接。
生产表达CIVPS或内含肽修饰蛋白的转基因植物和从转基因植 物中生产CIVPS或内含肽修饰蛋白均可通过以下步骤完成:构建含 有CIVPS或内含肽修饰目的蛋白和表达所需的必要调控元件的 DNA序列,扩增和选择所构建的DNA,然后转化要用的植物品种, 最后再生和挑选已正确转化的植物品种,必要的话,纯化天然形式 或裂解形式的CIVPS或内含肽修饰蛋白。生产表达CIVPS或内含肽 修饰治疗性蛋白的转基因植物和从转基因植物中生产CIVPS或内含 肽修饰治疗性蛋白构成本发明的一部分。
要生产转基因植物或转基因植物中的CIVPS或内含肽修饰蛋 白,就必须先构建CIVPS或内含肽修饰蛋白的DNA序列。构建过 程包括:将要用的治疗性蛋白和插入蛋白序列的完整基因序列或其 部分序列克隆到E.coli或其他任何合适宿主中(如:某些情况下酵 母菌可能适用,或者借助或不借助病毒或非病毒载体在哺乳动物细 胞和植物细胞表达)。
一旦基因与编码插入蛋白序列的序列被克隆后,它们就按所需 构型(configuration)连接。选用的插入蛋白序列应具有行使所需功 能的能力,例如能自动剪接或在外加刺激作用下剪接(例如光照、 pH变化、温度、压力或改变CIVPS或内含肽修饰蛋白周围的局部化 学成分),必要时,能允许融合蛋白与自身顺式连接,或者与另一蛋 白反式连接。通过直接多肽合成或本领域已知的方法很容易将插入 蛋白序列的DNA序列与特定蛋白DNA序列连接,得到图1所示的 CIVPS或内含肽修饰蛋白DNA编码序列或其序列组合。前面已经提 到,CIVPS或内含肽修饰蛋白是插入蛋白序列与天然蛋白的羧基 端、氨基端或内部融合而成的蛋白。虽然有许多可供选用的方法, 不过将插入蛋白序列的编码序列和所要用的蛋白编码序列融合的一 种方法应是合成或纯化所要用的治疗性蛋白序列的编码序列,用限 制性酶切蛋白编码序列中要插入CIVPS或内含肽的位点,然后将 CIVPS或内含肽编码序列连接到该限制性位点上。另一种方法是使 用PCR法连接基因元件。
可以直接将多聚核苷酸或任一核酸片段克隆到合适的调控和/或 选择序列上,或者通过载体进行克隆。调控片段例如是控制CIVPS 或内含肽修饰蛋白短暂表达的启动子、复制原点,和/或控制体内特 定植物组织和/或特定亚细胞室中CIVPS或内含肽修饰蛋白空间分 布的
信号序列。选择元件例如包括除草或抗菌基因、
荧光标记、染 色标记和其他合适的选择标记。然后将得到的包括CIVPS或内含肽 修饰蛋白编码多聚核苷酸和视情况选用的任何所要用调控或选择元 件的多聚核苷酸或载体扩增,获得可用于随后所用植物品种转化的 较大量产物。
上述任一或所有步骤都有可能更改,以促使任一所要用插入蛋 白序列和蛋白之间的特异定位和融合。改变蛋白编码序列和/或插入 蛋白序列编码序列以及连接其中一个序列或两个序列都可用本领域 的已知技术实现,例如定点突变、计算突变(computational mutagenesis)和选择、随机突变、
聚合酶链反应(PCR)、易错PCR (error-prone PCR)、和/或技术人员公认的其他任何合适的常规方 法。这些技术有助于对大量连接序列进行排列,而且可以使用任何 所想要的、合适的组合。同样,根据本发明还可以对调控和选择元 件进行任一组合或定位。
基因调控元件,例如启动子(Guilley等,Higgins,T.J.V.,Coruzzi 等,Tingey等,Ryan等,Rocha-Sosa等,Wenzler等,Bird等)、增 强子(Brederode等)、RNA剪接位点、核糖体结合位点、糖基化位 点、蛋白剪接位点、亚细胞信号序列(Smeekens等,van den Broeck 等、Schreier等,Tague等)、分泌信号序列(Von Heijne,G.,Sijmons 等)或其他有利于控制CIVPS或内含肽修饰蛋白在转化植物体内的 短暂或空间分布、范围和形式或糖基化、或者浓度、结构和活性, 或者后续在人或除人外的动物体内的治疗活性的调控元件。使用这 些元件的目的是帮助将转基因植物中的CIVPS或内含肽修饰蛋白生 产和加工成治疗性蛋白。CIVPS或内含肽修饰蛋白可以按组成型或 诱导方式表达。为了获得这些模式之一,可按本文描述的、本领域 已知的、或者以后发明的方法操作。可以借助一种或多种外部刺激 来诱导蛋白表达。诱导方式例如包括使用
杀虫剂、光照、温度变化 和/或声音等,不过也可使用其他外部刺激。另外,重组植物还可以 表达任一种或多种选择标记基因或报告基因,从而产生对溴苯腈、 2,2-二氯丙酸、G418、草甘膦、吡氟氯禾灵(haloxyfop)、潮霉素、 咪唑啉、卡那霉素、甲氨蝶呤、新霉素、草胺膦、稀禾定、trichothecne、 磺脲、s-三嗪和/或三氮嘧啶(triazolopyrimidine)等化学物质的抗性。
CIVPS或内含肽修饰蛋白DNA序列经构建、与所需调控和选择 DNA序列结合、成功克隆及选择后,就需要转化所要用的植物品种 并培育出完整植物。可通过本领域的已知技术(Draper等,Potrykus 等,Broothaerts等)转化所要用的植物品种并培育完整植物。转化 技术包括但不限于:根癌农杆菌(Agrobacterium tumefaciens)介导 的基因转移、发根农杆菌(Agrobacterium rhizogenes)介导的基因转 移、苜蓿根瘤菌(Sinorhizobium meliloti)介导的基因转移、根瘤菌 (Rhizobium)介导的基因转移、百脉根根瘤菌(Rhizobium loti)介 导的基因转移、基因直接向植物原生质体转移、Ti质粒介导的基因 转移(借助或不借助辅助质粒)、基因枪或粒子轰击植物转化 (Gordon-Kamm等)、微注射和纤维介导的转化、病毒转化和组织电 穿孔(Shimamoto等)。整个植物、植物外植体(例如但不限于根外 植体)、任何植物部分(例如但不限于植物叶块、种子或种子块)、 植物原生质体或非原生质体、或者单个或多个植物细胞中都可发生 基因转移。
选择已正确转化的植物使用的也是本领域已知的方法。包含有 CIVPS或内含肽修饰蛋白的转化DNA中的选择标记(例如抗性基 因、编码有色化合物产物的基因、编码荧光化合物产物的基因等) 可使选择方法更便利。另外,也可以从转化植物中分离DNA并分析 确定预期CIVPS或内含肽修饰蛋白编码序列是否存在。适于对选择 步骤予以确认的技术包括DNA测序、聚合酶链式反应、限制位点酶 切分析和southern杂交分析。任何可
鉴别出预期转基因植物的选择 方法都可以使用。
用CIVPS或内含肽修饰蛋白与所需的调控和选择序列转化植物 后,就可通过本领域的已知方法再生出整个植物(Horsch等)。大多 数方法中都包括:在合适的培养基及光照、温度条件下,培养被转 化的植物细胞、外植体、组织、植物部分或整个植物。再生植物的 方法不应限制本发明,任何有效方法都可使用。
选出完整的转基因植物后,就能对CIVPS或内含肽修饰蛋白的 表达进行监控。如果只是生产表达CIVPS或内含肽修饰蛋白的转基 因植物则不需要监控,但需要仔细确认是否真正获得所要的表达 CIVPS或内含肽修饰蛋白的转基因植物,以及其表达是否受所使用 的控制元件的正确控制。可通过western杂交分析、放射免疫分析 (RIA)、原位杂交、二维凝胶
电泳(和
染色)或者质谱分析的方法 对
植物提取物或从转基因植物中纯化的蛋白组分进行分析以监控 CIVPS或内含肽修饰蛋白的表达。另外,应将一些纯化蛋白或者转 基因植物本身用可使CIVPS或内含肽裂解的条件处理。处理完后, 可同时将CIVPS或内含肽修饰蛋白和得到的可能是CIVPS或内含肽 裂解序列的蛋白进行western杂交分析和其他分析以查验蛋白是否正 确以及CIVPS或内含肽修饰蛋白与得到的裂解蛋白之间的活性差 异。设计的该活性测定方案应当能监控所需蛋白的活性,而且应该 对该活性有特异性,不易受竞争性干扰(competing interference)的 影响。可以使用一种控制标准,对天然活性与CIVPS或内含肽修饰 活性和CIVPS或内含肽裂解后活性进行比较。
表达CIVPS或内含肽修饰蛋白的植物的应用方法和生产过程包 括:将该植物用作生产治疗性蛋白的载体,以及用于输送疫苗。表 达CIVPS或内含肽修饰蛋白的转基因植物用作实现上述目的之一的 载体的任一批量、半批量或连续的生产过程都属于本发明的主旨。 这些生产过程可以包括但不限于以下范围:收获表达CIVPS或内含 肽修饰蛋白的植物,向其施加CIVPS或内含肽裂解刺激,然后与其 它载体以载体/转基因植物大于或等于0的比例混合,接着用化学、 酶学或生物学的方法将其转
化成上述产物之一。
如图2所示,本发明还针对从表达CIVPS或内含肽修饰蛋白的 植物中制备治疗性蛋白的生产过程。该过程包括:将治疗性蛋白的 核酸编码序列分成多个片段;将读码框内的每个片段与能反式剪接 的插入蛋白序列编码融合;构建可使融合有插入蛋白序列的编码序 列表达的表达载体并挑选转化有该载体的植物;用前面构建的各个 表达载体对多个植物进行遗传修饰(性别兼容或不兼容)使得该组 植物中含有完整的亲代治疗性蛋白编码序列;使转基因植物生长; 收获转基因植物;将转基因植物
粉碎并在一种液体制造工艺中混 合,这样融合了插入蛋白序列的蛋白部分就在允许剪接的条件作用 下,重新形成亲代的治疗性蛋白,最后将该蛋白纯化。
本发明的一个实施例中,表达的CIVPS或内含肽修饰蛋白包括 亲代蛋白序列,其活性已知、通过序列或结构同源性推知、和/或通 过突变或从头合成而产生。将各亲代序列分成子序列后与插入蛋白 序列融合。一旦插入后,融合子
序列表达的修饰蛋白在体内就失去 了活性。该实施例可以扩大到一个植物或一组植物的两个或两个以 上转基因蛋白。如果需要,当与其它按这样设计的CIVPS或内含肽 修饰蛋白
接触并且存在合适的剪接刺激时,通过CIVPS或内含肽的 顺式或反式剪接,完整的亲代蛋白的原有活性就能被完全恢复。例 如,在一项应用中,植物收获后,将分别表达融合有插入蛋白序列 的一部分治疗性蛋白的两个植物混合,各插入蛋白序列被诱导从其 亲代蛋白序列上自我剪接,将两个治疗性蛋白部分连在一起,这样 亲代蛋白就恢复了原有或预期活性、亲合力或用作配体或激素的能 力。使用或不使用蛋白重组来进行CIVPS或内含肽剪接以产生功能 活性的方法是本领域技术人员已知的方法,这里不必重复。这些方 法包括使用光照、温度、改变pH和/或加入化学试剂。
图2示出从多个转基因植物中生产出有最终活性的治疗性蛋 白。第一步中,所需治疗性蛋白的整个DNA编码序列被分成两个或 两个以上片段。然后将各片段与内含肽蛋白编码序列融合。接着将 该融合构建体装到合适的表达载体中并将与具有体外反式剪接能力 的内含肽融合的各治疗性蛋白片段转化植物,该植物随后表达该构 建体。收获这些植物,提取蛋白并混合,这种混合使蛋白融合体发 生反式剪接,即内含肽部分被去除,得到的治疗性蛋白部分重新连 接,从而重新获得具有完全活性的治疗性蛋白。当处于合适的裂解 环境下,CIVPS或内含肽修饰蛋白或其组分的裂解可体外完成。虽 然图2示意图中只表示出一例生产治疗性蛋白的整个过程,但是本 领域的普通技术人员应当理解,可以构建其它的变化形式作为 CIVPS或内含肽修饰蛋白的组合。
本发明还针对重组植物或植物部分、幼苗、组织、细胞、亚细 胞片段、种子、芽苗、原生质体、子代或后代,其包含编码至少一 个修饰蛋白的表达构建体,其中该修饰蛋白包括其内部或两端与 CIVPS或内含肽序列或其片段融合、或者与CIVPS或内含肽修饰蛋 白的氨基端或羧基端相融合的靶蛋白或蛋白片段。在一个实施例 中,该植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、 芽苗、原生质体、子代或后代的各表达构建体包括可操纵彼此相连 的编码靶蛋白的第一核苷酸序列和编码CIVPS或内含肽序列的第二 核苷酸序列,以及可视情况选用的选择标记或报告基因和/或启动 子。可以理解,在更多特定实施例中,这些序列可以直接或者借助 一个或多个接头相融合,更优选是在阅读框内融合。该修饰蛋白可 以通过植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、 芽苗、原生质体、子代或后代组成型或诱导表达。在后一种情况下, 至少一个修饰蛋白可通过一个或多个刺激来启动或诱导表达和/或剪 接。合适的刺激例如包括改变pH、改变渗透压、温度、加入化学物 质、光照变化和/或声音。
植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽 苗、原生质体、子代或后代可以在植物生命周期的预定时刻、一个 或多个特定组织或其组织部分、和/或至少一个特定亚细胞室中表达 修饰蛋白。自由选择或与后者结合,该修饰蛋白可以表达并分泌到 细胞外。植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、 芽苗、原生质体、子代或后代等特定组织可以是种子、根、果实、 茎、块茎、和/或叶,特定的亚细胞室可以是
细胞质、非原生质体、 线粒体、质体、内质网、内含体、液泡和/或细胞核。不过其他组织 或亚细胞室也包含在本发明范围内。
植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽 苗、原生质体、子代或后代还可以携带一个抗化学物质选择标记。 选择标记例如包括溴苯腈、2,2-二氯丙酸、G418、草甘膦、吡氟氯禾 灵、潮霉素、咪唑啉、卡那霉素、甲氨蝶呤、新霉素、草胺膦、稀 禾定、trichothecne、磺脲、s-三嗪和/或三氮嘧啶。不过也可选用其 他选择标记。可以在CIVPS或内含肽修饰蛋白核苷酸前加启动子。 某些情况下,植物或植物部分、幼苗、组织、细胞、亚细胞片段、 种子、芽苗、原生质体、子代或后代可能对所选择的化学物质的常 规剧毒性有耐受性或抗性。
在另一实施例中,植物或植物部分、幼苗、组织、细胞、亚细 胞片段、种子、芽苗、原生质体、子代或后代是可育的,具有至少 一个可遗传的修饰蛋白编码核苷酸序列。不过也可以是不育的。另 外如上所示,本发明可扩展到通过本发明所述方法得到或者不能得 到的近交和杂交遗传重组植物或植物部分、幼苗、组织、细胞、亚 细胞片段、种子、芽苗、原生质体、子代或后代。特别感兴趣的是 植物部分、植物种子、植物芽苗和植物原生质体,它们具有重要的 商业价值。植物、植物组织、植物细胞和亚细胞片段也具有商业价 值和其他兴趣。
在一方面,插入蛋白序列和靶蛋白或蛋白片断形成至少一个与 该靶蛋白接合的剪接点。在一个理想的实施例中,在该剪接点的羧 基端,氨基酸残基带有羟基或巯基
侧链。在另一特别有用的实施例 中,该剪接点可能位于插入蛋白序列或其片段的下游,包括位于靶 蛋白或蛋白部分的氨基端、不带例如羟基或巯基侧链的氨基酸残 基。在另一其它变化形式中,剪接点可能位于插入蛋白序列或其片 段的上游,包括位于靶蛋白或蛋白部分的氨基端并带有羟基或巯基 侧链的氨基酸残基。另外,该剪接点可能位于插入蛋白序列或其片 段的上游,包括一个半胱氨酸。还有另一种重要的变化形式就是剪 接点可能位于插入蛋白序列或其片段的下游,在插入蛋白序列或其 片段的羧基端具有His-Asn,和/或在邻近的靶蛋白氨基端具有带羟 基或巯基侧链的氨基酸残基。在另一变化形式中,剪接点可能位于 插入蛋白序列或其片段的下游,在插入蛋白序列或其片段的羧基端 具有Asp、Asn、Glu或Gln,和/或在邻近的靶蛋白或其片段氨基端 具有带羟基或巯基侧链的氨基酸残基。
进一步的修饰包括羧基端的Asp被不带羧基或氨基侧链的氨基 酸取代,插入蛋白序列或其片段包括一个外部可控的插入蛋白序列 或其片段。适合插入本发明产品的其他构建体包括插入蛋白序列或 其片段在靶蛋白或其片段的Ser、Thr或Cys之前紧挨着插入,和插 入蛋白序列的氨基或羧基端包括Ser、Thr或Cys等。
治疗性蛋白或蛋白部分可以在人或除人外的动物、病毒或微生 物,例如本领域公知的细菌中表达,后面会有详述。优选的靶蛋白 包括胰岛素、促红细胞生成素、生长激素、表皮生长因子、血清白 蛋白、胰肮酶、胰岛素样生长激素、
肿瘤坏死因子、肿瘤坏死因子 受体、HER-2受体、单克隆抗体和其他激素或生长因子,及其所有 各自的异构体。
本发明的另一实施例包括修饰蛋白在病毒中的表达。虽然可以 使用任何病毒,但具体例如为HIV、
肝炎病毒、SARS、人类
乳头病 毒(Human Pappiloma Virus)、流感病毒、轮状病毒和水痘病毒等。
重组植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、 芽苗、原生质体、子代或后代可通过以下方法生产,该方法包括: 构建至少编码一种修饰蛋白的表达构建体,该修饰蛋白包括其内部 或两端与CIVPS或内含肽序列或其片段融合、或者其与CIVPS或内 含肽修饰蛋白的氨基端或羧基端相融合的靶蛋白或蛋白片段;用该 表达构建体转化多个植物或植物部分、幼苗、组织、细胞、亚细胞 片段、种子、芽苗、原生质体、子代或后代;从被转化的植物部分、 幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或 后代中挑出至少编码一种修饰蛋白序列的遗传重组体使其再生。
转化稳定是非常优选的要求。不过暂时稳定的转化也是可接受 的。再生步骤可通过培育植物或植物部分、幼苗、组织、细胞、亚 细胞片段、种子、芽苗、原生质体、子代或后代,将重组的和非遗 传重组的植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、 原生质体、子代或后代杂交,和/或将两种遗传重组的植物或植物部 分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、子 代或后代回交来进行。
本方法使用的表达构建体可以包括一个或多个启动子、选择标 记、抗性标记、可育标记、聚腺苷化序列、抑制子、增强子、定位 序列和/或信号序列。该方法的一个重要方面是,通过病毒转化、包 被DNA的微粒轰击、脂质体基因转化、细菌基因转移、电穿孔、或 化学基因转化,或者上述几种方法将表达构建体转化到植物或植物 部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原生质体、 子代或后代中。如上所述,植物或植物部分、幼苗、组织、细胞、 亚细胞片段、种子、芽苗、原生质体、子代或后代可通过例如根癌 农杆菌或苜蓿根瘤菌等细菌进行转化,不过也可使用其他的微生 物。在本方法中,可以用化学基因转化法进行转化,可以借助例如
磷酸钙和/或聚乙二醇或本领域已知的其他适用本目的的化学物质完 成。可借助选择标记、抗性标记或至少一种CIVPS或内含肽修饰蛋 白编码核苷酸的表达来挑选转化体。本发明的方法中,遗传重组植 物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原 生质体、子代或后代可从被转化的胚性组织、植物原生质体、未成 熟胚细胞或被转化的种子等再生而来。
本发明还提供一种从一个或多个表达修饰蛋白或蛋白片段的重 组转化植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、 芽苗、原生质体、子代或后代中生产该修饰蛋白或蛋白片段以及重 新形成的具有完全活性的治疗性蛋白的方法,该方法包括:操作上 述方法,并且继续从转化植物或植物部分、幼苗、组织、细胞、亚 细胞片段、种子、芽苗、原生质体、子代或后代中收获修饰蛋白或 蛋白片段。该方法可进一步包括体外重新形成蛋白,即收获后将表 达亲代蛋白的、各自与插入蛋白序列融合的不同子序列的多个植物 混合,然后利用CIVPS或内含肽剪接来重新形成原先的亲代序列。 该方法可进一步包括纯化修饰蛋白。按此所述,该方法可以生产包 含CIVPS或内含肽修饰蛋白或蛋白片段的修饰蛋白或蛋白片段,或 者剪接后不带先前融合的插入蛋白序列的完全成熟蛋白。
本发明还提供一种生产修饰蛋白的方法,该修饰蛋白由内部或 两端与插入蛋白序列或其片段相融合或与插入蛋白序列或其片段的 氨基端或羧基端相融合的靶蛋白或蛋白片段构成。该方法包括获得 编码其读码框内或者其氨基端或羧基端融合有插入蛋白序列或其片 段的靶蛋白的表达构建体;用该表达构建体转化
宿主植物细胞;然 后在利于表达修饰蛋白的条件下培养转化植物宿主细胞。
在一个优选方面,表达构建体中编码插入蛋白序列或其片段的 至少一个第一核苷酸片段与编码靶蛋白或蛋白片段的第二核苷酸片 段的5’端融合。另外,表达构建体中编码插入蛋白序列或其片段的 第一核苷酸片段还可以与编码靶蛋白或蛋白片段的第二核苷酸片段 的3’端融合。本方法特别适用于使用已知能顺式或反式
切除、裂解、 连接、切除-连接、裂解-连接和/或环化的插入蛋白序列或其片段。 当要诱导插入蛋白序列或其片段进行蛋白剪接时,可采用改变温 度、光照或pH、加入或除去能促进或抑制剪接或裂解的化学试剂、 氨基酸去磷
酸化或去糖基化、或者接触/去除激活或抑制剪接或裂解 的肽或模拟肽的方式诱导或启动其发生。
诱导蛋白剪接的另一种方式是体外或体内接触或去除能激活或 抑制剪接或裂解的肽或模拟肽制剂。可产生理想结果的重要变化形 式是插入蛋白序列或其片段的氨基或羧基端包括Ser、Thr或Cys, 或者是插入蛋白序列或其片段的羧基端在靶蛋白或蛋白片段的 Ser、Thr或Cys之前包括Asp、Asn、Gln或Glu。不过,还可能有 本领域已知的其他修饰。
在本方法中,表达构建体可进一步包括启动子、选择标记、抗 性标记、可育标记、聚腺苷化序列、抑制子、增强子、定位序列和/ 或信号序列。另外,该方法还可以包括通过病毒转化、包被DNA的 微粒轰击、脂质体基因转化、细菌基因转移、电穿孔、和/或化学基 因转化,或者本领域已知的其他方法,或者以后开发的方法将表达 构建体转化到植物或植物部分、幼苗、组织、细胞、亚细胞片段、 种子、芽苗、原生质体、子代或后代中。如上所述,此处所述方法 中,用于转移表达构建体的细胞可以是根癌农杆菌或其他细菌;转 化所用化学试剂可以是磷酸钙或聚乙二醇;转化后的植物细胞、植 物部分、植物等可通过选择标记或抗性标记的表达来鉴别;选择转 化了的植物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、 芽苗、原生质体、子代或后代可通过修饰蛋白基因序列的表达来操 作;并且遗传重组的植物或植物部分、幼苗、组织、细胞、亚细胞 片段、种子、芽苗、原生质体、子代或后代可通过被转化的胚性组 织、植物原生质体、未成熟胚细胞或被转化的种子等再生而来。
本发明还针对一种生产能表达一种或多种修饰蛋白的种子的方 法。该方法包括:获得本发明的遗传重组植物或植物部分、幼苗、 组织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代; 培养或培育该遗传重组植物或植物部分、幼苗、组织、细胞、亚细 胞片段、种子、芽苗、原生质体、子代或后代;收获培育出的能表 达一种或多种修饰蛋白的植物种子。
本发明提供的另一方法是利用植物或植物部分、幼苗、组织、 细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代来表达一 种或几种修饰蛋白以生产治疗性蛋白。该方法包括收获一个或多个 根据本发明教导得到的重组植物或植物部分、幼苗、组织、细胞、 亚细胞片段、种子、芽苗、原生质体、子代或后代;
机械加工该植 物或植物部分、幼苗、组织、细胞、亚细胞片段、种子、芽苗、原 生质体、子代或后代;将该机械加工的植物或植物部分、幼苗、组 织、细胞、亚细胞片段、种子、芽苗、原生质体、子代或后代与其 它遗传重组植物按大于或等于零的比例结合,在能获得化合物的条 件下化学加工该植物或其特定部分。该化合物可以是利用本发明方 法生产的治疗性蛋白或其他产自亲代蛋白的其他目的化合物。
本发明通过
挤压、
研磨、切碎、包覆、切片、切块、
压榨、粉 碎和/或撕碎等方式机械加工植物或植物部分、幼苗、组织、细胞、 亚细胞片段、种子、芽苗、原生质体、子代或后代。不过也可使用 其他合适的加工技术。可通过各种技术或其组合对混合成分进行化 学加工。其中一些经过以下预处理:
蒸汽、稀酸或浓酸、氨爆炸、 消毒、水中浸泡、用
溶剂混合、改变pH、温度或渗透压、接受或改 变光照、无机和/或酶催化、
糖化、脱色、冲洗、发酵、蒸馏、色谱 分析、
吸附和/或加入化学物质。当然,使用其他处理方式也同样奏 效。各个步骤操作如下:预处理方式可以是将混合产物浸泡以便抽 提之用,化学加工可通过用至少一种
硫酸、
盐酸、磷酸或
碳酸、氢 氧化钠、有机或无机
碱进行预处理、在20℃或20℃以上的水中浸泡 和/或用至少水或有机/无机溶剂之一将混合产物混匀的方式完成。已 经述及,可以施加外部刺激来诱导修饰蛋白或蛋白片段的剪接。外 部刺激例如包括改变pH、渗透压或温度,使用声音、光照,或者加 入化学物质。
某些情况下,剪接蛋白或蛋白片段的活性相对于修饰蛋白或蛋 白片段可能发生变化,例如分解代谢、合成代谢、亲合力或治疗活 性相对原靶蛋白发生变化。剪接蛋白或蛋白片段例如来源于促红细 胞生成素、胰岛素、生长激素、肿瘤坏死因子、肿瘤坏死因子受体、 HER-2受体、表皮生长因子、成纤维细胞生长因子、胰岛素样生长 激素、血管紧张素、因子V、因子VII、抗菌肽、抗体或其他激素或 生长因子及其所有相关异构体。可见,剪接蛋白能在剪切和连接后 变成成熟的治疗性蛋白。
本发明的另一方面包括生产一种或多种靶蛋白或蛋白片段的方 法。该方法包括制备第一修饰蛋白或蛋白片段,其中插入蛋白序列 或其片段的氨基端通过上述方法与靶蛋白或蛋白片段的羧基端融 合;制备包括插入蛋白序列片段的第二或多个修饰蛋白;在利于第 二修饰蛋白中插入蛋白序列或其片段反式裂解的条件下,使第一和 第二或多个修饰蛋白接触;以及重复该过程直至靶蛋白完全重新形 成具有所需活性的蛋白。
上述制备一种或多种靶蛋白的方法可变通为:制备第一修饰蛋 白,其中插入蛋白序列或其片段的羧基端通过上述方法与靶蛋白或 蛋白片段的氨基端融合;同样制备包括插入蛋白序列片段的第二或 多个修饰蛋白或蛋白片段;在利于第一修饰蛋白或蛋白片段中插入 蛋白序列或其片段反式裂解的条件下,使第一和第二或多个修饰蛋 白接触;以及所有蛋白部分重复该过程直至最终获得所需的靶蛋 白。裂解可按以下途径诱导:改变温度、光照或pH,加入或除去能 促进/抑制剪接或抑制裂解的化学物质,氨基酸脱磷酸化或去糖基 化,和/或接触/除去能激活/抑制剪接/裂解的肽或模拟肽等。
还应当注意,本发明的应用不限于制造加工或机械加工。本发 明的应
用例如但不限于输送疫苗、激素或治疗性蛋白,其中CIVPS 或内含肽修饰蛋白可以包括治疗性蛋白和/或蛋白抗原(潜在的保护 性蛋白序列)和插入蛋白序列的结合,可通过香蕉、黄豆等转基因 植物表达。例如,人或除人外的动物消化上述植物产品时即可实现 上述输送过程。然后该植物经嘴巴咀嚼并在胃中受体内刺激,从而 启动或诱导插入蛋白序列的裂解。如果食用对象是人,就可能是胃 中低pH刺激诱导插入蛋白序列从抗原或治疗性蛋白中裂解出来,必 要的话,进行适当连接。然后治疗性蛋白或抗原会流入十二指肠或 小肠,在那儿pH为中性,蛋白产物可被稳定吸收到血液中。
实施例
例1、利用内含肽修饰技术从多个烟草植物中生产人生长激素。
人生长激素(hGH,也称为human somatotropin)的活性和结构 已研究得很透彻,目前人生长激素的几种形式已被
许可用于生长激 素
缺陷、慢性肾功能衰竭、特纳氏综合征、HIV消耗性综合征的干 预治疗。生长激素的天然形式之前已在植物中表达(Staub等,2000)
本例介绍从烟草植物的内含肽修饰hGH基因获得人生长激素的 步骤。该实施例中,我们选用hGH基因的密码子优化版本(Genbank Accession#AF205361)[SEQ ID NO:1]和来自Synechocystis Sp.的内含 肽(Genbank Accession#AF545504(In),#AF54505(Ic))[SEQ ID NO:2 和3]。虽然在操作本发明时可以对使用的不同步骤作出变更,但本 例仅给出以下操作步骤:1)制备内含肽修饰hGH基因;2)将该基 因装到合适的烟草表达载体中;3)用该表达载体转化烟草;4)挑 选表达内含肽修饰基因的转化体并使其再生成成熟的烟草植物。回 收并混合这些植物中的内含肽蛋白以诱导剪接并重组形成有活性的 hGH(如图2所示)。
设计内含肽修饰hGH-In和Ic-hGH的融合基因需要将天然丝氨 酸、苏氨酸或半胱氨酸密码子之前紧挨着的hGH基因切开或者加入 人工密码子插入该基因任何
位置。我们选择将hGH基因(SEQ ID NO:1)的碱基对241处的天然丝氨酸位点裂开。然后合成hGH-In 基因(Blue Heron,Bothell,WA),得到一段碱基对240处包含hGH 启动密码子并直接与来自集胞藻(Synechocystis)(Genbank #AF545504)[SEQ ID NO:2]dnaE氨基内含肽(In)序列相连的DNA 序列。同样,在hGH基因的碱基对241前插入来自集胞藻(Genbank #AF54505)[SEQ ID NO:3]dnaE羧基内含肽(Ic)的编码序列,该序 列后连接着从hGH基因碱基对241到其末端(碱基对582)的基因 片段,从而合成Ic-hGH。这些融合产物也能通过PCR和其他分子生 物技术很容易地构建而成。
合成后,就将hGH-In基因和Ic-hGH基因克隆到之前已报道过 的根癌农杆菌双元表达载体pBI121(GenbankAccession#AY781296) [SEQ ID NO:4](Chin等,2003)中分别构建出pBIhGHIn和 pBIIchGH。利用电穿孔法将每个载体导入根癌农杆菌LBA4404中得 到两组不同的克隆子:一组包含pBIhGHIn,另一组包含pBIIchGH。 然后挑出各组的克隆子,30℃、200rpm、LB培养基中培养过夜。第 二天早上将培养物用LB培养基按1∶1稀释,培养至A550约为1.0。 选用烟草根培养28天至35天后的
叶片进行转化。一组叶片与含 pBIhGHIn的根癌农杆菌共培养,另一组叶片与含pBIIchGH的根癌 农杆菌共培养。在转化培养基(1×MS盐、3%
蔗糖、2mg/L α-
萘乙酸、 0.5mg/L苄氨基嘌呤)中28℃培养2-3天。然后将叶切片转移到选择 培养基中(1×MS盐、3%蔗糖、2mg/L α-萘乙酸、500mg/L羧苄青霉 素和100mg/L卡那霉素)。然后再生出重组植物,并植入
土壤获得每 个转化体。
用收获缓冲液(50mM Tris-HCl,pH8.0,200mM NaCl,5mM EDTA和0.1%Tween20)从根癌农杆菌所转化的分别含有pBIhGHIn 和pBIIchGH的各植物中收获蛋白。可以将这些pBIhGHIn和 pBIIchGH蛋白在25℃、pH7缓冲液中混合,并培育诱导两个片段之 间进行反式内含肽剪接。最后得到完整的hGH。使用hGH抗体进行 western杂交分析可测得该蛋白大小,根据已报道的大鼠Nb2细胞的 生长刺激(Staub等,2000)可检测该蛋白的活性。
例2:使用内含肽修饰技术从烟草植物中生产人促红细胞生成素 人促红细胞生成素的活性和结构已研究得很透彻(Lai等, 1986),目前人促红细胞生成素的几种形式已被许可用于贫血的干预 治疗。人促红细胞生成素的天然形式之前已在植物中表达(Cheon 等,2004)。天然形式的促红细胞生成素的表达会影响植物形态和再 生能力,所以内含肽修饰可降低该蛋白在植物中表达的负面影响。
虽然也可以使用其他植物宿主,但本例仅介绍从烟草中的内含 肽修饰hEPO基因获得人促红细胞生成素(hEPO)的步骤。该实施 例中,我们选用EPO基因(Genbank Accession#NM000799)[SEQ ID NO:5]和来自Mycobacterium tuberculosis的其编码区的自导引核算内 切酶编码区(编码区碱基对313-1002,对应氨基酸105-334)被去掉 的内含肽(Genbank Accession#X58485)[SEQ ID NO:6]。虽然在操 作本发明时可以对使用的不同步骤作出变更,但本例仅给出以下操 作:1)制备内含肽修饰hEPO基因;2)将该基因装到合适的烟草 表达载体中;3)用该表达载体转化烟草;4)挑选表达内含肽修饰 基因的转化体并使其再生成成熟的烟草植物。回收这些植物中的内 含肽蛋白并诱导剪接从而重组形成有活性的hEPO。
设计内含肽修饰hEPO基因需要将成熟肽的天然半胱氨酸29之 前紧邻的hEPO基因切开。虽然可以选用其他的半胱氨酸残基,但 是纯化的剪接效率较低。可以通过上述序列合成(Blue Heron,Bothell, WA)hEPO基因,或者用以前报道的方法制备(Gangopadhyay等, 2003)。
合成后,将内含肽修饰hEPO基因(现在称为IC29hEPO)[SEQ ID NO:7]克隆到以前报道(Cheon等,2004)的根癌农杆菌双元表达 载体pPEV-1(Clontech,CA,USA)中得到pPEV-IC29hEPO。然后利 用电穿孔法将pPEV-IC29hEPO导入根癌农杆菌EHA105。然后使用 加有25mg/L利福平和50mg/L卡那霉素的YEP培养基筛选转化克隆 子。
选用烟草叶培养9周的叶片进行转化。用
次氯酸钠对叶片消毒 后,取大小0.5cm2的叶块与含有pPEV-IC29hEPO的根癌农杆菌 EHA105重组子在28℃暗处共培养3天。28℃转化培养基(1×MS 盐)上温育2-3天。然后用内含250mg/L羧苄青霉素的1×MS冲洗 并转移到选择培养基(1×MS盐、3%蔗糖、2mg/L苄氨基嘌呤、0.1mg/L 萘乙酸、250mg/L羧苄青霉素和100mg/L卡那霉素)。取出在含有卡 那霉素的培养基中形成的重组根,置于新鲜的再生培养基中。然后 将根转移到生根培养基(1×MS琼脂、250mg/L羧苄青霉素、100mg/L 卡那霉素)上并随后移植转化体,从而再生出重组植物。
用收获缓冲液(50mM Tris-HCl,pH8.0,200mM NaCl,5mM EDTA和0.1%Tween20)或本领域已知的其他方法从上述植物中收获 蛋白。可以将这些IC29hEPO蛋白重悬在含1mMEDTA、0.5M L-精 氨酸、1mM DTT(或TCEP)、20mM磷酸钠pH7.5和0.5NaCl的溶 液中,25℃培养过夜(Gangopadhyay等,2003)。这样就得到内含肽 被剪切下来的完整形式的hEPO。使用hEPO抗体进行western杂交 分析可检测该蛋白大小。
至此本发明描述完毕,在不脱离本发明的精神或范围下对本发 明作出变更和修饰,对本领域的普通技术人员来说是显而易见的。
参考书目
Dale,Biotechnol.Prog.15:775-776(1999).
Park,et al.,Biotechnol.Prog.14:699-704(1998).
Taylor,et al.,Biotechnol.Prog.16:541-547(2000).
Poirier,Nature Biotechnology 17:960-961(1999).
Ingram,Biotechnol.Prog.15:855-866(1999).
Mansfield,et al.,Biotechnol.Prog.15:804-816(1999).
Evans,et al.,Protein Science 7:2256-2264(1998).
Perler,et al.,Nucl.Acids Res.22:1125-1127(1994).
Xu,et al.,EMBO 15:5146-5153(1996).
Wood,et al.,Biotechnol.Prog.16:1055-1063(2000).
Clarke,P.N.A.S.(USA)91:11084-11088(1994).
Derbyshire,et al.,P.N.A.S.(USA)95:1356-1357(1998).
Perler,et al.,Nucleic Acids Res.22:1125-1127(1994).
Wallace,C.J.,Protein Sci.2:697-705,(1993).
Xu,et al.,Cell 75:1371-1377(1993).
Pietrokovski,S.,Protein Sci.3735:2340-2350(1994).
Ausbel,et al.,“Current Protocols in Molecular Biology,”Wiley,New York(1998).
Draper,et al.,“Plant Genetic Transformation and Gene Expression:A Laboratory Manual,”Blackwell Scientific Publications,Boston(1998).
Potrykus,et al.,“Gene Transfer to Plants,”Springer,New York(1995).
Guilley,et al.,Cell,30:763(1982).
Broothaerts,et al.,Nature,433:629(2005).
Higgins,T.J.V,Annu.Rev.Plant Physiol.35:191(1984).
Coruzzi,et al.,EMBO J.3:1671(1984).
Tingey,et al.,EMBO J.6:3565(1987).
Ryan,et al.,Nuc.Acids Res.17:3584(1989).
Rocha-Sosa,et al.,EMBO J.8:23(1989).
Wenzler,et al.,Plant Mol.Biol.12:41(1989).
Bird et al.,Plant Mol.Biol.11:651(1988).
Brederode,et al.,Nucl.Acids Res.8:2213(1980).
Smeekens,et al.,T.I.B.S.15:73(1990).
van den Broeck et al.,Nature 313:358(1985).
Schreier,et al.,EMBO J.4:25(1985).
Tague,et al.,Plant Phys.86:506(1988).
Von Heijne,G.,J.Mol.Biol.189:239(1986).
Sijmons,et al.,Bio/Technol.8:217(1990).
Gordon-Kamm,et al.,The Plant Cell 2:603(1990).
Shimamoto,et al.,Nature 338:274(1989).
Horsch,et al.,Science 2:1229(1985).
Ziegler,et al.,Molecular Breeding 6:37-46(2000).
Dai,et al.,(a),Molecular Breeding 6:277-285(2000).
Dai,et al.,(b),Molecular Breeding 9:43-54(2000).
Montvalvo-Rodriguez,et al.,Biotech.and Bioeng.2:151-159(2000).
U.S.Patent No.6,022,846.
Chu,et al.,Sci.Sin.18:659-668(1975).
Klein,et al.,Nature 327:70-73(1987).
Chin,et al.,PNAS 100:4510(2003).
Staub,et al.,Nature Biotech 18:333(2000).
Lai et.al.,J.Biol.Chem.,261:3116(1986).
Cheon et.al.,Transgenic Research,13:541(2004).
Gangopadhyay et.al.,Biochimica et BiophysicaActa,1619:193(2003).
序列表
<110>Agrivida,Inc.
Raab,R. Michael
Rupling,Karl
Jensen, Kyle L.
<120>TRANSGENIC PLANTS EXPRESSING INTEIN MODIFIED PROTEINS AND
ASSOCIATED PROCESSES FOR BIO-PHARMACEUTICAL PRODUCTION
<130>RAA-PT002WO
<150>US60/572,966
<151>2004-05-19
<160>7
<170>PatentIn version 3.3
<210>1
<211>582
<212>DNA
<213>Homo sapiens
<400>1
atgggggtgc acgaatgtcc tgcctggctg tggcttctcc tgtccctgct gtcgctccct 60
ctgggcctcc cagtcctggg cgccccacca cgcctcatct gtgacagccg agtcctggag 120
aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180
agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240
atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300
gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360
catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420
gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480
actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540
aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582
<210>2
<211>609
<212>DNA
<213>Synechocystis sp.
<400>2
atggctttcc cgactattcc actgagccgc ctgttcgaca acgctatgct gcgagctcac 60
cgtctgcacc agctggcttt cgacacctac caggagttcg aagaagcata catcccgaaa 120
gaacagaaat actccttcct gcagaacccg cagacctccc tgtgcttctc cgaaagcatt 180
ccgaccccga gcaaccgcga agaaacccag cagaaatcca acctcgagct gctgcgtatc 240
tgcctttctt tcggaactga gatccttacc gttgagtacg gaccacttcc tattggtaag 300
atcgtttctg aggaaattaa ctgctcagtg tactctgttg atccagaagg aagagtttac 360
actcaggcta tcgcacaatg gcacgatagg ggtgaacaag aggttctcga gtacgagctt 420
gaagatggat ccgttattcg tgctacctct gaccatagat tcttgactac agattatcag 480
cttctcgcta tcgaggaaat ctttgctagg caacttgatc tccttacttt ggagaacatc 540
aagcagacag aagaggctct tgacaaccac agacttccat tccctttgct cgatgctgga 600
accatcaag 609
<210>3
<211>453
<212>DNA
<213>Synechocystis sp.
<400>3
atggttaagg tgattggaag acgttctctt ggtgttcaaa ggatcttcga tatcggattg 60
ccacaagacc acaactttct tctcgctaat ggtgccatcg ctgccaattg ctccctgctg 120
ctgattcaat cctggctgga accagttcag ttcctgcgtt ccgttttcgc taactcacta 180
gtttatggcg cttccgactc caacgtttac gacctgctga aggacctgga agaaggtatt 240
cagactctga tgggtcgtct ggaggacggt tcccctagga ccggtcagat cttcaaacag 300
acctatagca aattcgacac caactcccac aacgacgacg cgttgctgaa aaactacggt 360
ctgctgtact gcttccggaa ggacatggac aaggttgaga ctttcctgcg tatcgttcag 420
tgccgttccg ttgaaggttc ctgcggtttc taa 453
<210>4
<211>8196
<212>DNA
<213>Expression vector pBI121
<400>4
aaacactgat agtttaaact gaaggcggga aacgacaatc tgatcatgag cggagaatta 60
agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac gtttggaact 120
gacagaaccg caacgattga aggagccact cagccgcggg tttctggagt ttaatgagct 180
aagcacatac gtcagaaacc attattgcgc gttcaaaagt cgcctaaggt cactatcagc 240
tagcaaatat ttcttgtcaa aaatgctcca ctgacgttcc ataaattccc ctcggtatcc 300
aattaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 360
gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 420
ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 480
gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg 540
ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 600
gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 660
tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 720
accaagcgaa acatcgcatc gagcgagcac gtactcggat.ggaagccggt cttgtcgatc 780
aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 840
aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc tgcttgccga 900
atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 960
cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 1020
aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 1080
ccttctatcg ccttcttgac gagttcttct gagatcgttc aaacatttgg caataaagtt 1140
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt 1200
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta 1260
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa 1320
actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgggcc tcctgtcaat 1380
gctggcggcg gctctggtgg tggttctggt ggcggctctg agggtggtgg ctctgagggt 1440
ggcggttctg agggtggcgg ctctgaggga ggcggttccg gtggtggctc tggttccggt 1500
gattttgatt atgaaaagat ggcaaacgct aataaggggg ctatgaccga aaatgccgat 1560
gaaaacgcgc tacagtctga cgctaaaggc aaacttgatt ctgtcgctac tgattacggt 1620
gctgctatcg atggtttcat tggtgacgtt tccggccttg ctaatggtaa tggtgctact 1680
ggtgattttg ctggctctaa ttcccaaatg gctcaagtcg gtgacggtga taattcacct 1740
ttaatgaata atttccgtca atatttacct tccctccctc aatcggttga atgtcgccct 1800
tttgtctttg gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc 1860
agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg 1920
agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg 1980
tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc 2040
aagcttgcat gcctgcagcc cacagatggt tagagaggct tacgcagcag gtctcatcaa 2100
gacgatctac ccgagcaata atctccagga aatcaaatac cttcccaaga aggttaaaga 2160
tgcagtcaaa agattcagga ctaactgcat caagaacaca gagaaagata tatttctcaa 2220
gatcagaagt actattccag tatggacgat tcaaggcttg cttcacaaac caaggcaagt 2280
aatagagatt ggagtctcta aaaaggtagt tcccactgaa tcaaaggcca tggagtcaaa 2340
gattcaaata gaggacctaa cagaactcgc cgtaaagact ggcgaacagt tcatacagag 2400
tctcttacga ctcaatgaca agaagaaaat cttcgtcaac atggtggagc acgacacact 2460
tgtctactcc aaaaatatca aagatacagt ctcagaagac caaagggcaa ttgagacttt 2520
tcaacaaagg gtaatatccg gaaacctcct cggattccat tgcccagcta tctgtcactt 2580
tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa tgccatcatt gcgataaagg 2640
aaaggccatc gttgaagatg cctctgccga cagtggtccc aaagatggac ccccacccac 2700
gaggagcatc gtggaaaaag aagacgttcc aaccacgtct tcaaagcaag tggattgatg 2760
tgatatctcc actgacgtaa gggatgacgc acaatcccac tatccttcgc aagacccttc 2820
ctctatataa ggaagttcat ttcatttgga gagaacacgg gggactctag agtttgaaat 2880
tctctgtgaa ttttttttgt tgattgatga ttgtcttcaa aaacattcct gggtttgact 2940
tttttttcat cggagcttcg tctgtgttgt tggttgatgt caattggtat ttgtattaat 3000
ccgtactttt tcaatgattg ctttcttaag ttttttaaca tttgtttttt ggcggcggag 3060
aaatctggag taatgttgaa aaacaatgac aattttgttt ctttcaatcc taaattttcg 3120
atttttctca ctacccttat ctctatttga tcgatttttt gttattgttt acagatgaaa 3180
aagcagagaa ttgttgtgaa aatcgggagc agctcgctca caaacagtaa cggaagtatt 3240
gatgaagcca aaatcaagga gcatacggaa gccatttcat tattaaaaga aaacgggcat 3300
gaagtaatcc tcattacctc aggcgcggtg gcagccggtt tttccgctct cggctatccg 3360
gcgcgccccg ttacgataaa aggaaagcag gcagccgccg cggtcggcca gacgctttta 3420
atgcagcaat atatggacca tttaaaaaga tacggtctga cgccggcgca aattttatta 3480
acaagaaatg atttctcaaa aagagagcgg tacagaaatg cgtatgccac ggtaatggaa 3540
ttattggagc ggggagtcgt gccgattatt aatgagaatg attccacatc agtcgaagaa 3600
ctgacgttcg gagataatga catgctgtcg gcgcttgtga gcggcctgat tcatgcagac 3660
caattaatga ttctcacaga cattaacggg ctgtacgatg ccaatccgaa tgaaaaccct 3720
gacgcaaagc ggtttgacta tttgactgac attacacctg aattgctcgg gtatgccgga 3780
tcagcgggct cgaaggtcgg caccggaggc atgaagtcaa aatttctcgc tgcccagacc 3840
gcattgtcgc tcggagttaa ggtgtttatc ggaaccggtg ccggacggga aaaactgaag 3900
gtgattttag acggtaaagg cgacggcaca tatatcggtg ataaagagct gtccaccgtc 3960
aataatacac ggcaatggat catgtttcat tctccgatat caggggaaat catcattgat 4020
gggggagcgg agcaggcgat gatccataac ggctcaagtc tccttccggc cggtgtcgcc 4080
gatgtctgcg gcagttttcc gaaaggggcc gtggtggaag tcagaggtcc cggcggcatc 4140
atcggcaaag ggcagacgca ttactcatcc gatgagattt tggaagccaa agggaagcgg 4200
agcgatcagc ttccgggcgc gaagcaggtg gaagtgattc acagaaatga ttgggtgaat 4260
ctatttgacg agggggaaaa caaatgatct agaggatccg tttgaaattc tctgtgaatt 4320
ttttttgttg attgatgatt gtcttcaaaa acattcctgg gtttgacttt tttttcatcg 4380
gagcttcgtc tgtgttgttg gttgatgtca attggtattt gtattaatcc gtactttttc 4440
aatgattgct ttcttaagtt ttttaacatt tgttttttgg cggcggagaa atctggagta 4500
atgttgaaaa acaatgacaa ttttgtttct ttcaatccta aattttcgat ttttctcact 4560
acccttatct ctatttgatc gattttttgt tattgtttac agatgagtga agtattgcaa 4620
aaagctgcct tggcaaaaga agcggctgcc gaaatggtca tgaaaacgac tgctgaaaaa 4680
aacgaagcgc tccaatgtat tgcagacgga ctcagaaatg aacgccagct gattttaaca 4740
gagaatcaga aagatattga agcgggacag aaaagagggc tgacacctga cattattgac 4800
aggctgactc ttgatgaaaa acgcctgctc gatatcgcgg atgctgtaga actgttaatc 4860
ggtctggaag atcccgtcgg tgaatcattg gagaccattc aaaaagagaa tggattatcc 4920
attgaaaaaa tccgcgtgcc cctcggagta gtgggcatga tctatgaagc cagaccgaat 4980
gttaccgtag acgctgccac actttgcctg aaaaccggaa acgcggttgt gctcagagga 5040
agttcgtcag ccatccacag caacaaagcg cttgtcagtg tgatgaaacg cgcactggga 5100
ctgtcaaagc ttccgattga tgccgttcag ctcatagaag atacaagcaa agaaaccgcg 5160
aaacagctct tcacattaaa tgacgggctg gatgtattga tcccgcgcgg cggcaaaaat 5220
ttgattgatc tggtggtcag ggaatcaacc gtacccgtgt tagaaaccgg agcgggcaac 5280
tgccacgtgt acatagatga gtcagcagat cccgatatgg caagagatgt cgtcatcaac 5340
gccaaaacac agcggccttc tgtctgcaat gcgattgaat ctcttttgat tcatgaaaaa 5400
tgggcggaag tacacggacg aaagctgctg aatcagctga cagaaaaagg ggtggagcta 5460
cgcggagatc agatgatttg cgagctggag cctaatgcga aacaagccga agaggccgat 5520
tggggagcgg aatacctggc gccgattctc agtgtaaaaa cggtgcatga cgtacaggag 5580
gcggtccgcc acattcagca gtacggcaca aaccattcag aagccattct gacggaaaac 5640
ggtgagcatg ccgcttactt ccagacagcc gttgacgccg ccgccgtgta tcataatgct 5700
tccacacggt ttacagacgg ctttgaattc tgaggatccc cgggtggtca gtcccttatg 5760
ttacgtcctg tagaaacccc aacccgtgaa atcaaaaaac tcgacggcct gtgggcattc 5820
agtctggatc gcgaaaactg tggaattgat cagcgttggt gggaaagcgc gttacaagaa 5880
agccgggcaa ttgctgtgcc aggcagtttt aacgatcagt tcgccgatgc agatattcgt 5940
aattatgcgg gcaacgtctg gtatcagcgc gaagtcttta taccgaaagg ttgggcaggc 6000
cagcgtatcg tgctgcgttt cgatgcggtc actcattacg gcaaagtgtg ggtcaataat 6060
caggaagtga tggagcatca gggcggctat acgccatttg aagccgatgt cacgccgtat 6120
gttattgccg ggaaaagtgt acgtatcacc gtttgtgtga acaacgaact gaactggcag 6180
actatcccgc cgggaatggt gattaccgac gaaaacggca agaaaaagca gtcttacttc 6240
catgatttct ttaactatgc cggaatccat cgcagcgtaa tgctctacac cacgccgaac 6300
acctgggtgg acgatatcac cgtggtgacg catgtcgcgc aagactgtaa ccacgcgtct 6360
gttgactggc aggtggtggc caatggtgat gtcagcgttg aactgcgtga tgcggatcaa 6420
caggtggttg caactggaca aggcactagc gggactttgc aagtggtgaa tccgcacctc 6480
tggcaaccgg gtgaaggtta tctctatgaa ctgtgcgtca cagccaaaag ccagacagag 6540
tgtgatatct acccgcttcg cgtcggcatc cggtcagtgg cagtgaaggg cgaacagttc 6600
ctgattaacc acaaaccgtt ctactttact ggctttggtc gtcatgaaga tgcggacttg 6660
cgtggcaaag gattcgataa cgtgctgatg gtgcacgacc acgcattaat ggactggatt 6720
ggggccaact cctaccgtac ctcgcattac ccttacgctg aagagatgct cgactgggca 6780
gatgaacatg gcatcgtggt gattgatgaa actgctgctg tcggctttaa cctctcttta 6840
ggcattggtt tcgaagcggg caacaagccg aaagaactgt acagcgaaga ggcagtcaac 6900
ggggaaactc agcaagcgca cttacaggcg attaaagagc tgatagcgcg tgacaaaaac 6960
cacccaagcg tggtgatgtg gagtattgcc aacgaaccgg atacccgtcc gcaaggtgca 7020
cgggaatatt tcgcgccact ggcggaagca acgcgtaaac tcgacccgac gcgtccgatc 7080
acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga tctctttgat 7140
gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt ggaaacggca 7200
gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca gccgattatc 7260
atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac cgacatgtgg 7320
agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga tcgcgtcagc 7380
gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca aggcatattg 7440
cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa gtcggcggct 7500
tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca gcagggaggc 7560
aaacaatgaa tcaacaactc tcctggcgca ccatcgtcgg ctacagcctc gggaattgct 7620
accgagctcg atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc 7680
ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt aataattaac 7740
atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac 7800
atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg 7860
gtgtcatcta tgttactaga tggaattcac tggccgtcgt tttacaacgt cgtgactggg 7920
aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc 7980
gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg 8040
aatgaattca gtacattaaa aacgtccgca atgtgttatt aagttgtcta agcgtcaatt 8100
tgtttacacc acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg 8160
gcacaaaatc accactcgat acaggcagcc catcag 8196
<210>5
<211>582
<212>DNA
<213>Homo sapiens
<400>5
atgggggtgc acgaatgtcc tgcctggctg tggcttctcc tgtccctgct gtcgctccct 60
ctgggcctcc cagtcctggg cgccccacca cgcctcatct gtgacagccg agtcctggag 120
aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180
agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240
atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300
gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360
catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420
gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480
actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540
aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582
<210>6
<211>636
<212>DNA
<213>Mycobacterium tuberculosis
<400>6
tgcctcgcag agggcactcg gatcttcgat ccggtcaccg gtacaacgca tcgcatcgag 60
gatgttgtcg atgggcgcaa gcctattcat gtcgtggctg ctgccaagga cggaacgctg 120
catgcgcggc ccgtggtgtc ctggttcgac cagggaacgc gggatgtgat cgggttgcgg 180
atcgccggtg gcgccatcgt gtgggcgaca cccgatcaca aggtgctgac agagtacggc 240
tggcgtgccg ccggggaact ccgcaaggga gacagggtgg cgcaaccgcg acgcttcgat 300
ggattcggtg acctggctgc agagatgacc gatgccgtgc tgaattatct ggacgagcgc 360
ggcgtgaccg cgcaggaggc cgcggccatg atcggtgtag cttccgggga cccccgcggt 420
ggaatgaagc aggtcttagg tgccagccgc cttcgtcggg atcgcgtgca ggcgctcgcg 480
gatgccctgg atgacaaatt cctgcacgac atgctggcgg aagaactccg ctattccgtg 540
atccgagaag tgctgccaac gcggcgggca cgaacgttcg acctcgaggt cgaggaactg 600
cacaccctcg tcgccgaagg ggttgtcgtg cacaac 636
<210>7
<211>1137
<212>DNA
<213>Synthetic construct
<400>7
gccccaccac gcctcatctg tgacagccga gtcctggaga ggtacctctt ggaggccaag 60
gaggccgaga atatcacgac gggctgcctc gcagagggca ctcggatctt cgatccggtc 120
accggtacaa cgcatcgcat cgaggatgtt gtcgatgggc gcaagcctat tcatgtcgtg 180
gctgctgcca aggacggaac gctgcatgcg cggcccgtgg tgtcctggtt cgaccaggga 240
acgcgggatg tgatcgggtt gcggatcgcc ggtggcgcca tcgtgtgggc gacacccgat 300
cacaaggtgc tgacagagta cggctggcgt gccgccgggg aactccgcaa gggagacagg 360
gtggcgcaac cgcgacgctt cgatggattc ggtgacctgg ctgcagagat gaccgatgcc 420
gtgctgaatt atctggacga gcgcggcgtg accgcgcagg aggccgcggc catgatcggt 480
gtagcttccg gggacccccg cggtggaatg aagcaggtct taggtgccag ccgccttcgt 540
cgggatcgcg tgcaggcgct cgcggatgcc ctggatgaca aattcctgca cgacatgctg 600
gcggaagaac tccgctattc cgtgatccga gaagtgctgc caacgcggcg ggcacgaacg 660
ttcgacctcg aggtcgagga actgcacacc ctcgtcgccg aaggggttgt cgtgcacaac 720
tgtgctgaac actgcagctt gaatgagaat atcactgtcc cagacaccaa agttaatttc 780
tatgcctgga agaggatgga ggtcgggcag caggccgtag aagtctggca gggcctggcc 840
ctgctgtcgg aagctgtcct gcggggccag gccctgttgg tcaactcttc ccagccgtgg 900
gagcccctgc agctgcatgt ggataaagcc gtcagtggcc ttcgcagcct caccactctg 960
cttcgggctc tgggagccca gaaggaagcc atctcccctc cagatgcggc ctcagctgct 1020
ccactccgaa caatcactgc tgacactttc cgcaaactct tccgagtcta ctccaatttc 1080
ctccggggaa agctgaagct gtacacaggg gaggcctgca ggacagggga cagatga 1137