产生雄性不育植物的组合物和方法

申请号 CN201280040579.3 申请日 2012-06-19 公开(公告)号 CN104080914A 公开(公告)日 2014-10-01
申请人 先锋国际良种公司; 纳幕尔杜邦公司; 发明人 丹尼斯·L·比德尼; 马克·西甘; 卡尔·福尔肯; H·高; 德里克·詹茨; 迈克·拉斯纳; 基思·洛; 莱斯齐克·亚历山大·里兹尼克; 詹姆斯·杰斐逊·史密斯;
摘要 本 发明 公开了在 植物 基因组中的雄性能育性基因中产生靶向修饰的方法。所述方法涉及使植物细胞与能够在所述雄性能育性基因中的靶序列中诱导双链断裂的工程改造的双链断裂诱导剂 接触 以及鉴定在所述靶序列中包含变更的细胞。本发明还公开的是在雄性能育性基因中包含具有变更的雄性能育性基因的植物、植物细胞、植物部分和 种子 。本发明还公开了在其中具有至少一个靶向修饰的雄性能育性基因的核酸分子、编码作为工程改造的双链断裂诱导剂的内切核酸酶的优化的核酸分子以及包含所述核酸分子中的一者或多者的表达盒、宿主细胞和植物。
权利要求

1.在植物基因组中的雄性能育性基因中产生靶向修饰的方法,所述方法包括:
(a)使至少一个在雄性能育性基因中包含靶序列的植物细胞与能够在所述靶序列处诱导双链断裂的工程改造的双链断裂诱导剂接触;以及
(b)鉴定至少一个来自步骤(a)的在其基因组中的所述靶序列处包含变更的细胞,其中所述变更选自(i)置换至少一个核苷酸、(ii)缺失至少一个核苷酸、(iii)插入至少一个核苷酸和(iv)(i)至(iii)的任何组合;
其中所述雄性能育性基因的变更是无效突变。
2.根据权利要求1所述的方法,其中所述雄性能育性基因选自MS26、MS45、BS92-7、
5126和Mscal。
3.根据权利要求1所述的方法,还包括再生包含所述变更的能育植物。
4.根据权利要求1所述的方法,其中所述工程改造的双链断裂诱导剂为内切核酸酶、锌指核酸酶、TAL效应物核酸酶、转座酶或位点特异性重组酶。
5.根据权利要求4所述的方法,其中所述内切核酸酶被修饰成在所述靶序列处特异性切割,并且其中所述内切核酸酶不再在其野生型内切核酸酶靶序列处切割。
6.根据权利要求1所述的方法,其中对所述无效突变而言纯合的植物是雄性不育的。
7.根据权利要求3所述的方法,还包括使所述能育植物自交并选择由所述自交导致的子代植物,其中所述子代植物对于所述变更而言是纯合的。
8.根据权利要求3所述的方法,还包括使所述能育植物与在所述雄性能育性基因中包含无效突变的第二能育植物杂交并选择由所述杂交导致的子代植物,其中所述子代植物是雄性不育的。
9.根据权利要求1所述的方法,其中所述变更包括包含目标多核苷酸的转基因的插入。
10.根据权利要求9所述的方法,其中所述转基因还包含可操作连接至所述目标多核苷酸的启动子,并且其中所述启动子能够驱动所述目标多核苷酸在植物中的表达。
11.根据权利要求9所述的方法,其中所述目标多核苷酸编码为所述植物提供农学优点的表型标记或RNA或蛋白质
12.根据权利要求1所述的方法,其中所述植物选自玉蜀黍、高粱稻、小麦、黑麦、大麦、小米和燕麦。
13.根据权利要求1所述的方法,其中所述雄性能育性基因为MS26。
14.根据权利要求13所述的方法,其中所述靶序列包含SEQ ID NO:1中示出的核苷酸序列。
15.根据权利要求13所述的方法,其中所述工程改造的双链断裂诱导剂衍生自I-CreI。
16.根据权利要求14所述的方法,其中步骤(a)包括向所述至少一个植物细胞引入包含编码所述工程改造的双链断裂诱导剂的核苷酸序列的核酸构建体。
17.根据权利要求16所述的方法,其中所述核苷酸序列选自:
(a)SEQ ID NO:4、5、6或7中示出的核苷酸序列;和
(b)与选自SEQ ID NO:4、5、6和7中所示的核苷酸序列的至少一个核苷酸序列具有至少80%核苷酸序列同一性的核苷酸序列,其中所述核苷酸序列编码包含内切核酸酶活性的多肽。
18.根据权利要求17所述的方法,其中所述核酸构建体还包含可操作连接至编码所述工程改造的双链断裂诱导剂的核苷酸序列的启动子,其中所述启动子能够驱动所述核苷酸序列在植物细胞中的表达。
19.根据权利要求18所述的方法,其中所述启动子为玉蜀黍泛素启动子。
20.根据权利要求17所述的方法,其中所述核酸构建体还包含可操作连接的核定位信号的编码序列。
21.根据权利要求20所述的方法,其中所述核定位信号包含选自SEQ ID NO:2、3和21的基酸序列。
22.根据权利要求1所述的方法,其中所述雄性能育性基因为MS45。
23.根据权利要求22所述的方法,其中所述靶序列包含SEQ ID NO:20中所示的核苷酸序列。
24.根据权利要求22所述的方法,其中所述工程改造的双链断裂诱导剂衍生自I-CreI。
25.根据权利要求23所述的方法,其中步骤(a)包括向所述至少一个植物细胞引入包含编码所述工程改造的双链断裂诱导剂的全部或部分的核苷酸序列的核酸构建体。
26.根据权利要求25所述的方法,其中所述核苷酸序列选自:
(a)SEQ ID NO:22、23或34中所示的核苷酸序列;和
(b)与选自SEQ ID NO:22、23和34中所示的核苷酸序列的至少一个核苷酸序列具有至少80%核苷酸序列同一性的核苷酸序列,其中所述核苷酸序列编码包含内切核酸酶活性的多肽。
27.根据权利要求26所述的方法,其中所述工程改造的双链断裂诱导剂包含第一多肽和第二多肽。
28.根据权利要求26所述的方法,其中所述核酸构建体还包含可操作连接至编码所述工程改造的双链断裂诱导剂的核苷酸序列的启动子,其中所述启动子能够驱动所述核苷酸序列在植物细胞中的表达。
29.根据权利要求28所述的方法,其中所述启动子为玉蜀黍泛素启动子。
30.根据权利要求26所述的方法,其中所述核酸构建体还包含可操作连接的核定位信号的编码序列。
31.根据权利要求30所述的方法,其中所述核定位信号的编码序列选自SEQ ID NOS:
2、3和21。
32.通过根据权利要求1所述的方法产生的植物或通过所述方法产生的植物的后代,其中所述后代包含所述变更。
33.根据权利要求32所述的植物,其中所述植物为高粱植物并且所述雄性能育性基因为MS26。
34.根据权利要求33所述的植物,其中所述变更的MS26基因包含选自SEQ ID NO:63、
64、65、66、67、68、69、70、71、72、73、74、75、76、77和78的核苷酸序列。
35.在其基因组中的雄性能育性基因中包含靶向修饰的植物,其中所述靶向修饰为靶向突变或转基因的插入,并且其中所述雄性能育性基因选自MS26、MS45、BS92-7、5126和Mscal。
36.根据权利要求35所述的植物,其中所述靶向修饰为所述雄性能育性基因中的无效突变。
37.根据权利要求36所述的植物,其中所述植物对于所述变更而言是纯合的。
38.根据权利要求37所述的植物,其中所述植物为雄性不育的。
39.根据权利要求35所述的植物,其中所述植物选自玉蜀黍、高粱、水稻、小麦、黑麦、大麦、小米和燕麦。
40.根据权利要求39所述的植物,其中所述植物为在所述雄性能育性基因MS26中包含靶向突变的高粱植物。
41.根据权利要求40所述的植物,其中所述MS26基因包含选自SEQ ID NO:63、64、65、
66、67、68、69、70、71、72、73、74、75、76、77和78的核苷酸序列。
42.分离的包含根据权利要求1所述的方法产生的雄性能育性基因的核酸分子,其中所述雄性能育性基因包含所述变更。
43.包含表达构建体的植物,所述表达构建体包含可操作连接至编码内切核酸酶的核苷酸序列的启动子,其中所述内切核酸酶能够特异性结合至选自SEQ ID NO:1和20的靶序列并在所述靶序列中产生双链断裂,并且其中所述启动子能够驱动可操作连接的核苷酸序列在植物细胞中的表达。
44.根据权利要求43所述的植物,其中所述核苷酸序列包含内切核酸酶的DNA结合结构域的编码序列,并且其中所述编码序列选自:
(a)SEQ ID NO:4的核苷酸100-261和核苷酸661-822;
(b)SEQ ID NO:5的核苷酸70-231和核苷酸631-792;
(c)SEQ ID NO:6、7或34的核苷酸70-231和核苷酸820-981;和
(d)(a)、(b)或(c)的简并编码序列。
45.根据权利要求43所述的植物,其中所述核苷酸序列选自SEQ ID NO:4、5、6、7、22、
23和34。
46.表达构建体,所述表达构建体包含可操作连接至选自SEQ ID NO:4、5、6、7、22、23和34的核苷酸序列的启动子。

说明书全文

产生雄性不育植物的组合物和方法

技术领域

[0001] 本发明涉及植物分子生物学领域,尤其涉及在植物的雄性能育性基因中产生靶向突变的方法。
[0002] 对经由EFS-WEB作为文本文件提交的序列表的引用
[0003] 经由EFS-Web以电子方式将序列表的正式文本作为ASCII格式序列表提交,文件名称为418871SEQLIST.TXT,创建日期为2012年6月12日,文件大小为322KB,并且该文件
与本说明书同时提交。该ASCII格式文档中所含的序列表是本说明书的一部分,并且全文
以引用的方式并入本文。

背景技术

[0004] 杂种植物育种的发展已经使得所产生的作物在质量和数量方面取得相当大的进展成为可能。因为杂交程序,增加的产率和所需特性如病虫害抗性、热和干旱耐受性的组合以及植物组成的变化均是可能的。这些程序经常严重依赖于提供雄性亲本,该雄性亲本贡
献花粉给雌性亲本以产生所得的杂种。
[0005] 大田作物通过利用植物的授粉方法的技术进行育种。如果花粉从一朵花传递至相同植物或遗传上相同的植物的同一朵花或另一朵花,则植物为自花授粉。如果花粉来自不
同植物上的花,则植物是异花授粉。
[0006] 在某些物种,例如油菜(Brassica campestris)中,植物通常是自花不育的,仅可异花授粉。在自花授粉的物种(例如大豆和花)中,雄性和雌性植物处于解剖学上的并置关系。在天然授粉期间,给定的花的雄性繁殖器官对同一朵花的雌性繁殖器官授粉。
[0007] 玉蜀黍植物(玉米(Zea mays L.))既可通过自花授粉技术也可通过异花授粉来繁育。玉蜀黍在同一植物上具有位于雄穗上的雄花和位于雌穗上的雌花。其可自花授粉或
异花授粉。当将花粉从雄穗吹到从初期(incipient)雌穗顶端伸出的穗丝上时,玉蜀黍
中就发生了天然授粉。
[0008] 开发玉蜀黍杂种需要开发纯合近交系、使这些近交系杂交并评价该杂交。谱系育种和轮回选择是用于从种群开发近交系的育种方法中的两种。育种程序将来自两个或更多
个近交系或多种基础广泛的来源的所需性状组合进育种库,通过自交和对所需表型的选择
从所述库中开发出新的近交系。杂种玉蜀黍品种是两种此类近交系的杂交,每种都可能具
有另一种所缺乏的一种或多种所需特性,或补足另一者的一种或多种所需特性。将新的近
交系与其它近交系杂交,对从这些杂交获得的杂种进行评价以确定具有商业潜能的那些。
第一代的杂种子代被定为F1。在对杂种的开发中,仅寻求F1杂种植物。F1杂种比其近交亲
本更有活。这种杂种活力或杂种优势可以多种途径体现,包括增加的营养生长和增加的
产率。
[0009] 可通过结合人工去雄在内的雄性不育系统来产生杂种玉蜀黍种子。为产生杂种种子,从正在生长的雌性近交亲本(其可与雄性近交亲本以各种交替行模式种植)除去雄穗。
因此,假如与外来玉蜀黍花粉来源足够分离,雌性近交系的雌穗将仅被来自雄性近交系的
花粉受精。得到的种子因此是杂种(F1)并将形成杂种植物。
[0010] 影响植物发育的田间变化可导致在雌性亲本的人工去雄完成后植物又雄穗化。或者,雌性近交植物雄蕊在去雄过程中可能没有完全移除。无论如何,结果是雌性植物将成功散播花粉,一些雌性植物将被自花授粉。这将导致连同正常产生的杂种种子一起收获雌性
近交系的种子。雌性近交种子没有表现出杂种优势,因此生产力不如F1种子。此外,雌性
近交种子的存在对生产杂种的公司来说可能代表着种质安全风险。
[0011] 或者,可通过机器对雌性近交系以机械的方式去雄。机械去雄和手工去雄的可靠性大致相同,但更快并且成本更低。然而,较之手工去雄,大多数去雄机器会对植物造成更多的伤害。因此,目前没有令人完全满意的去雄形式,仍一直需要进一步降低生产成本的替代方法以及需要消除杂种种子生产中的雌性亲本自花授粉。
[0012] 植物中引起雄性不育的突变有可能可用于作物如玉蜀黍的杂种种子生产的方法,并且可通过消除对耗费大量劳动力从用于产生杂种种子的母本植物移除雄花(也称为去
雄)的需要来降低生产成本。玉蜀黍中引起雄性不育的突变已通过多种方法如X射线
紫外线照射、化学处理或转座元件插入(ms23、ms25、ms26、ms32)(Chaubal等人(2000)Am J Bot(《美国植物学杂志》)87:1193-1201)产生。通过能育/不育“分子转换”对能育性基因进行条件调节可增加用于设计新的雄性不育系统来进行作物改良的选项(Unger等人
(2002)Transgenic Res(《转基因研究》)11:455-465)。
[0013] 除了鉴别影响雄性能育性的新基因外,仍需要提供产生遗传雄性不育的可靠系统。

发明内容

[0014] 本发明提供了在植物基因组中的雄性能育性基因中产生靶向修饰的方法。该方法涉及使至少一个在雄性能育性基因中包含靶序列的植物细胞与能够在该靶序列处诱导
双链断裂的工程改造的双链断裂诱导剂(engineered double-strand-break-inducing
agent)接触。该方法还涉及鉴别至少一个在其基因组中的靶序列处包含变更的细胞。如果
需要,该方法可还包括再生包含该变更的能育植物。该变更包括但不限于在靶序列中置换
至少一个核苷酸、在靶序列中缺失至少一个核苷酸、在靶序列中插入至少一个核苷酸或者
它们的任何组合。例如,变更可以是在雄性能育性基因的靶序列中插入转基因或无效突变,其中对该无效突变而言纯合的子代植物是雄性不育的。在本发明的一个实施例中,在雄性
能育性基因的靶序列中插入转基因是雄性能育性基因中的无效突变。
[0015] 在植物基因组中的雄性能育性基因中产生靶向修饰的方法的第一个实施例中,雄性能育性基因选自MS26、MS45、BS92-7、5126和Mscal。
[0016] 在第二个实施例中,该方法还包括再生包含该变更的植物,尤其是能育植物。
[0017] 在第三个方面,工程改造的双链断裂诱导剂为内切核酸酶、锌指核酸酶、TAL效应物核酸酶、转座酶或位点特异性重组酶。优选地,该内切核酸酶被修饰成在靶序列处特异性切割,而不再在其野生型内切核酸酶靶序列处切割。
[0018] 在第四个实施例中,该方法还包括使能育植物自交并选择由该自交导致的子代植物,其中所述子代植物对于该变更而言是纯合的。
[0019] 在第五个实施例中,该方法还包括使能育植物与在雄性能育性基因中包含无效突变的第二能育植物杂交并选择由该杂交导致的子代植物,其中所述子代植物是雄性不育
的。
[0020] 在第六个实施例中,变更包括包含目标多核苷酸的转基因的插入。该转基因可还包含可操作连接至该目标多核苷酸的启动子,其中该启动子能够驱动该目标多核苷酸在植
物中的表达。例如,该目标多核苷酸可编码为植物提供农学优点的表型标记或RNA或蛋白
质。
[0021] 在第七个实施例中,植物选自玉蜀黍、高粱稻、小麦、黑麦、大麦、小米和燕麦。
[0022] 在第八个实施例中,雄性能育性基因为MS26。例如,该实施例的靶序列可包含SEQ ID NO:1中示出的核苷酸序列。工程改造的双链断裂诱导剂可例如衍生自I-CreI。
[0023] 在第九个实施例中,使至少一个在MS26中包含靶序列的植物细胞与工程改造的双链断裂诱导剂接触的步骤包括向该至少一个植物细胞引入包含编码该工程改造的双链
断裂诱导剂的核苷酸序列的核酸构建体。该核苷酸序列可选自例如SEQ ID NO:4、5、6和7中示出的核苷酸序列;和与选自SEQ ID NO:4、5、6和7中示出的核苷酸序列的至少一个核苷酸序列具有至少80%核苷酸序列同一性的核苷酸序列,其中该核苷酸序列编码包含内切
核酸酶活性的多肽。如果需要,核酸构建体可还包含可操作连接至编码该工程改造的双链
断裂诱导剂的核苷酸序列的启动子,其中该启动子能够驱动该核苷酸序列在植物细胞中的
表达。例如,启动子可以是玉蜀黍泛素启动子。另外,核酸构建体可还包含可操作连接的核定位信号的编码序列。这种核定位信号可包含例如选自SEQ ID NO:2、3和21的基酸序
列。
[0024] 在第十个实施例中,雄性能育性基因为MS45。例如,该实施例的靶序列可包含SEQ ID NO:20中示出的核苷酸序列。工程改造的双链断裂诱导剂可例如衍生自I-CreI。
[0025] 在第十一个实施例中,使至少一个在MS45中包含靶序列的植物细胞与工程改造的双链断裂诱导剂接触的步骤包括向该至少一个植物细胞引入包含编码该工程改造的双
链断裂诱导剂的核苷酸序列的核酸构建体。该核苷酸序列可选自例如SEQ ID NO:22、23或
34中示出的核苷酸序列;和与选自SEQ ID NO:22、23或34中示出的核苷酸序列的至少一
个核苷酸序列具有至少80%核苷酸序列同一性的核苷酸序列,其中该核苷酸序列编码包含
内切核酸酶活性的多肽。如果需要,核酸构建体可还包含可操作连接至编码该工程改造的
双链断裂诱导剂的核苷酸序列的启动子,其中该启动子能够驱动该核苷酸序列在植物细胞
中的表达。例如,启动子可以是玉蜀黍泛素启动子。另外,核酸构建体可还包含可操作连接的核定位信号的编码序列。这种核定位信号可包含例如选自SEQ ID NO:2、3和21的氨基
酸序列。
[0026] 本发明还提供分离的包含至少一种具有靶向修饰或变更的雄性能育性基因的核酸分子以及包含至少一种具有靶向修饰或变更的雄性能育性基因的植物、植物部分、植物
细胞和种子。本发明的植物包括但不限于由任何本文所公开的方法产生的植物和任何由任
何这类方法所产生的植物的后代,其中该后代包含该变更。
[0027] 在一个实施例中,植物在其基因组中的雄性能育性基因中包含靶向修饰,其中该靶向修饰为转基因的插入,并且该雄性能育性基因选自MS26、MS45、BS92-7、5126和Mscal。
例如,转基因的插入可引起该雄性能育性基因中的无效突变,并且对于该变更而言纯合的
植物是雄性不育的。
[0028] 在另一个实施例中,植物选自玉蜀黍、高粱、水稻、小麦、黑麦、大麦、小米和燕麦。
[0029] 在另一个实施例中,该植物是在雄性能育性基因MS26中包含靶向修饰的高粱植物,其中该MS26基因包含选自SEQ ID NO:63、64、65、66、67、68、69、70、71、72、73、74、75、
76、77和78的核苷酸序列。
[0030] 另外提供的是分离的核酸分子,该核酸分子编码能够在包含本发明靶序列的DNA中诱导双链断裂的工程改造的双链断裂诱导剂。还提供了包含至少一种分离的编码工程改
造的双链断裂诱导剂的核酸分子的表达盒以及包含所述表达盒中的至少一者的宿主细胞
和植物。
[0031] 在本发明的一个实施例中,表达盒包含可操作连接至选自SEQ ID NO:4、5、6、7、22、23和34的核苷酸序列的启动子。
[0032] 在另一个实施例中,本发明提供包含表达构建体的植物,该表达构建体包含可操作连接至编码内切核酸酶的核苷酸序列的启动子。该内切核酸酶能够特异性结合至选自
SEQ ID NO:1和20的靶序列并在其中产生双链断裂,其中该启动子能够驱动可操作连接的
核苷酸序列在植物细胞中的表达。编码该内切核酸酶的核苷酸序列可包含内切核酸酶的
DNA结合结构域的编码序列,其中该编码序列选自:
[0033] (a)SEQ ID NO:4的核苷酸100-261和核苷酸661-822;
[0034] (b)SEQ ID NO:5的核苷酸70-231和核苷酸631-792;
[0035] (c)SEQ ID NO:6、7或34的核苷酸70-231和核苷酸820-981;和
[0036] (d)(a)、(b)或(c)的简并编码序列。
[0037] 优选地,编码该内切核酸酶的核苷酸序列是选自SEQ ID:4、5、6、7、22、23和34的核苷酸序列。
[0038] 附图和序列表说明
[0039] 由以下的“具体实施方式”及构成本申请的一部分的附图和序列表可以更完全地理解本发明。本申请随附的序列说明和序列表符合美国联邦法规37C.
F.R.§§1.821-1.825中关于专利申请中的核苷酸和氨基酸序列公开的指导规则。序列
说明含有37C.F.R.§§1.821-1.825中定义的氨基酸三字母代码,将其以引用方式并入本
文。
[0040] 附图
[0041] 图1.DNA双链断裂诱导的内源靶位点的DNA变更。(A)一般化的内源靶位点,其旁侧是标为DNA1和DNA2的基因组DNA序列,所述基因组序列可用作同源重组的DNA交换区。
(B)一般化的DNA构建体,其可用于表达DNA内切核酸酶(核酸酶基因)以识别和切割内源
靶位点。该DNA内切核酸酶基因可被物理连接至(C)或(D)中描述的供体DNA,或者被其他
双链断裂诱导剂置换。(C)一般化的供体DNA构建体,其具有两个区域DNA1和DNA2,所述
两个区域与目标多核苷酸和/或标记基因旁侧的基因组靶标同源。(D)一般化的供体DNA
构建体,其不具有与目标多核苷酸和/或标记基因旁侧的基因组靶标同源的区域。DNA片
段的插入将在识别位点之处或附近产生目标多核苷酸的插入。(E)当(C)或(D)中描述的
供体构建体的目标多核苷酸和/或标记基因分别通过同源重组或非同源重组插入在内源
靶位点时的一个预期结果。(F)在修复由DNA内切核酸酶产生的DNA双链断裂的过程中通
过缺失来变更内源靶位点时的另一个结果。(C)或(D)中描述的供体构建体的目标多核苷
酸和/或标记基因可通过随机DNA整合插入在不相关的位点。(G)在修复被DNA内切核酸
酶切割的DNA双链断裂的过程中通过插入不相关DNA来变更内源靶位点时的另一个结果。
(C)或(D)中描述的供体构建体的目标多核苷酸和/或标记基因可通过随机DNA整合插入
在不相关的位点。
[0042] 图2.玉蜀黍TS-MS26靶位点的突变等位基因。第一代玉蜀黍转化体(T0植物)中存在的突变等位基因处于由工程改造的MS26内切核酸酶产生的表观3′端GTAC悬突的
中央。野生型(SEQ ID NO:35)、3281(SEQ ID NO:36)、2963(SEQ ID NO:37)、2980(SEQ ID NO:38)、3861(SEQ ID NO:39)、3956(SEQ ID NO:40)、3990(SEQ ID NO:41)、6227(SEQ ID NO:42)。
[0043] 图3.来自玉蜀黍(玉蜀黍MS26,SEQ ID NO:13)、水稻(水稻MS26,SEQ ID NO:14)、高粱(高粱MS26,SEQ ID NO:15)和黑麦(黑麦MS26,SEQ ID NO:16)的MS26基因的
基因组区之间整个TS-MS26靶位点(MS26TS,SEQ ID NO:1)的序列同源性。
[0044] 图4.用于水稻的生物弹射转化的载体。
[0045] 图5.通过生物弹射(biolistic)转化引入的在水稻MS26基因处的突变。
[0046] 图6.A)用于水稻转化的PHP40827的质粒片段。该质粒含有处于玉蜀黍泛素启动子控制下的四环素抑制子和由ZmEND2启动子调控的蓝色荧光基因(CFP)。另外,该质粒片
段含有一个拷贝的由玉蜀黍组蛋白2B启动子调控的红色荧光基因。该构建体中的红色荧
光基因的一部分以正向取向重复,由具有369bp的重叠的两个RFP基因片段组成。这两个
片段由含有TS-MS26靶位点的136bp间隔物分开(图6A)。B)TET处理过的事件(1、2、3)
的TS-MS26靶位点处的突变的PCR分析与未暴露于四环素的这些相同事件(对照)的PCR
产物的比较。
[0047] 图7.PHP40827愈伤组织事件中鉴别的水稻MS26基因处的突变。以灰色突出显示的是来自水稻的野生型TS-MS26。野生型水稻MS26(SEQ ID NO:49)、ms26.1(SEQ ID NO:
50)、ms26.2(SEQ ID NO:51)、ms26.3(SEQ ID NO:52)、ms26.4(SEQ ID NO:53)、ms26.5(SEQ ID NO54)、ms26.6(SEQ ID NO:55)、ms26.7(SEQ ID NO:56)、ms26.8(SEQ ID NO:57)
[0048] 图8.开花时的玉蜀黍T0植物。与由工程改造的MS26++内切核酸酶产生的T0双等位基因事件(带标签的植物)相比,含有一个突变的ms26等位基因的T0植物(两株外
侧的植物)的生长和发育没有明显不同(A)。该双等位基因事件是不育的(花期时雄穗显
示处于来自单等位基因事件的两个雄穗之间)(B)。
[0049] 图9.开花时的玉蜀黍T1子代(A、B、C)植物。示出了对ms26-Td或ms26-Ci突变等位基因而言杂合的T1子代植物(左侧的两株植物)和在右侧的两株纯合不育的T1植物
(A)。ms26基因突变对T1子代植物的生长和发育没有多效性。在T1子代植物中两个突变
等位基因(ms26-Td和ms26-Ci)均仅在处于纯合状态时产生不育表型(B和C)。
[0050] 图10.来自雄性不育(ms26/ms26)和雄性能育(MS26ms26)水稻植物的圆锥花序和花药。(A)水稻圆锥花序显示雄性不育纯合ms26/ms26植物在左边而雄性能育杂合Ms26/
ms26植物在右边。来自雄性不育ms26/ms26(B)和雄性能育Ms26/ms26(C)圆锥花序的花药
压片在分图A中示出。
[0051] 图11A-E.包含SEQ ID NO:6、7或34的核苷酸170-231和核苷酸820-981、SEQID NO:5的核苷酸70-231和核苷酸631-792以及SEQ ID NO:4的核苷酸100-261和核苷
酸661-822的大范围核酸酶的植物优化核苷酸序列的片段的比对。
[0052] 图12.在TS-MS26靶位点含有突变或缺失的来自不同高粱植物的MS26识别序列和DNA序列的比对。NO:1和62-78分别对应于SEQ ID NO:1和62-78。SEQ ID NO:62代
表野生型高粱MS26核苷酸序列。
[0053] 图13.(A)MS26/ms26.78Δ高粱植物的圆锥花序和(B)ms26.78Δ/ms26.78Δ高粱植物的圆锥花序。
[0054] 图14.来自MS26/ms26.78Δ植物(图14A)和ms26.78Δ/ms26.78Δ植物(图14B)的柱头、花药和花粉。MS26/ms26.78Δ花药(图14C)中容易检测到花粉,然而
从来自ms26.78Δ/ms26.78Δ植物的花药(图14D)未观察到花粉。
[0055] 序列
[0056] SEQ ID NO:1为TS-MS26靶位点的核苷酸序列,该靶位点被能够在该靶序列诱导双链断裂的工程改造的MS26内切核酸酶识别。
[0057] SEQ ID NO:2为核定位信号SV40NLS-1。
[0058] SEQ ID NO:3为核定位信号SV40NLS-2。
[0059] SEQ ID NO:4为编码工程改造的MS26内切核酸酶的植物优化核苷酸序列(无内含子)。
[0060] SEQ ID NO:5为编码工程改造的MS26+内切核酸酶的植物优化核苷酸序列(无内含子)。
[0061] SEQ ID NO:6为编码工程改造的MS26++内切核酸酶的植物优化核苷酸序列。该核苷酸序列具有调整至低于60%的GC含量并且含有内含子。
[0062] SEQ ID NO:7为编码工程改造的MS26+内切核酸酶的植物优化核苷酸序列。该核苷酸序列具有调整至低于60的GC含量并且含有内含子。
[0063] SEQ ID NO:8为玉蜀黍中编码细胞色素P450(MS26)的雄性能育性基因的核苷酸序列(AF366297)。
[0064] SEQ ID NO:9为水稻中编码细胞色素P450(MS26)的雄性能育性基因的核苷酸序列(LOC_Os03g07250)。
[0065] SEQ ID NO:10为高粱中编码细胞色素P450(MS26)的雄性能育性基因的核苷酸序列。
[0066] SEQ ID NO:11为黑麦中编码细胞色素P450(MS26)的雄性能育性基因的核苷酸序列(黑麦(Secale cereal),FJ539083)。
[0067] SEQ ID NO:12为玉蜀黍中编码细胞色素P450(AAK52956.1)的雄性能育性基因(MS26)的氨基酸序列。
[0068] SEQ ID NO:13为包含图3中所示的玉蜀黍TS-MS26靶位点的玉蜀黍基因组区。
[0069] SEQ ID NO:14为包含图3中所示的水稻TS-MS26靶位点的水稻基因组区。
[0070] SEQ ID NO:15为包含图3中所示的高粱TS-MS26靶位点的高粱基因组区。
[0071] SEQ ID NO:16为包含图3中所示的黑麦TS-MS26靶位点的黑麦基因组区。
[0072] SEQ ID NO:17为引物UNIMS265′-2。
[0073] SEQ ID NO:18为引物UNIMS263′-1。
[0074] SEQ ID NO:19为包含玉蜀黍TS-MS26靶序列的玉蜀黍基因组区。
[0075] SEQ ID NO:20为来自玉蜀黍的TS-MS45靶序列。
[0076] SEQ ID NO:21为MAY1/MAY融合物中所用的核定位氨基酸序列。
[0077] SEQ ID NO:22为编码MAY1的植物优化核苷酸序列。
[0078] SEQ ID NO:23为编码MAY2的植物优化核苷酸序列。
[0079] SEQ ID NO:24为玉蜀黍中编码查和二苯乙烯合酶(5126)的雄性能育性基因的核苷酸序列(AX060770)。
[0080] SEQ ID NO:25为水稻中编码查耳酮和二苯乙烯合酶(5126)的雄性能育性基因的核苷酸序列(LOC_Os07g22850)。
[0081] SEQ ID NO:26为玉蜀黍中编码二氢黄酮醇4-还原酶(BS7)的雄性能育性基因的核苷酸序列(AF366295)。
[0082] SEQ ID NO:27为水稻中编码二氢黄酮醇4-还原酶(BS7)的雄性能育性基因的核苷酸序列(LOC_Os08g40440)。
[0083] SEQ ID NO:28为玉蜀黍中编码异胡豆苷合酶(MS45)的雄性能育性基因的核苷酸序列(AF360356)。
[0084] SEQ ID NO:29为水稻中编码异胡豆苷合酶(MS45)的雄性能育性基因的核苷酸序列(LOC_Os03g15710)。
[0085] SEQ ID NO:30为质粒PHP31457。
[0086] SEQ ID NO:31为质粒PHP31459。
[0087] SEQ ID NO:32为玉蜀黍中编码MS22蛋白的雄性能育性基因的核苷酸序列。
[0088] SEQ ID NO:33为编码MAY1/MAY融合物中所用的核定位氨基酸序列的DNA序列。
[0089] SEQ ID NO:34为编码MAY1-接头-MAY2蛋白的植物优化基因。
[0090] SEQ ID NO:35为图2中所示的野生型TS-MS26DNA片段。
[0091] SEQ ID NO:36为图2中所示的3281TS-MS26DNA片段。
[0092] SEQ ID NO:37为图2中所示的2963TS-MS26DNA片段。
[0093] SEQ ID NO:38为图2中所示的2980TS-MS26DNA片段。
[0094] SEQ ID NO:39为图2中所示的3861TS-MS26DNA片段。
[0095] SEQ ID NO:40为图2中所示的3956TS-MS26DNA片段。
[0096] SEQ ID NO:41为图2中所示的3990TS-MS26DNA片段。
[0097] SEQ ID NO:42为图2中所示的6227TS-MS26DNA片段。
[0098] SEQ ID NO:43为图5中所示的野生型TS-MS26DNA片段。
[0099] SEQ ID NO:44为图5中所示的Ev48TS-MS26DNA片段。
[0100] SEQ ID NO:45为图5中所示的Ev62.1TS-MS26DNA片段。
[0101] SEQ ID NO:46为图5中所示的Ev62.13TS-MS26DNA片段。
[0102] SEQ ID NO:47为图5中所示的Ev62.14TS-MS26DNA片段。
[0103] SEQ ID NO:48为图5中所示的Ev67TS-MS26DNA片段。
[0104] SEQ ID NO:49为图7中所示的野生型TS-MS26DNA片段。
[0105] SEQ ID NO:50为图7中所示的ms26.1TS-MS26DNA片段。
[0106] SEQ ID NO:51为图7中所示的ms26.2TS-MS26DNA片段。
[0107] SEQ ID NO:52为图7中所示的ms26.3TS-MS26DNA片段。
[0108] SEQ ID NO:53为图7中所示的ms26.4TS-MS26DNA片段。
[0109] SEQ ID NO:54为图7中所示的ms26.5TS-MS26DNA片段。
[0110] SEQ ID NO:55为图7中所示的ms26.6TS-MS26DNA片段。
[0111] SEQ ID NO:56为图7中所示的ms26.7TS-MS26DNA片段。
[0112] SEQ ID NO:57为图7中所示的ms26.8TS-MS26DNA片段。
[0113] SEQ ID NO:58为质粒PHP40082的核苷酸序列。
[0114] SEQ ID NO:59为质粒PHP40126的核苷酸序列。
[0115] SEQ ID NO:60为质粒PHP40827的核苷酸序列。
[0116] SEQ ID NO:61为质粒PHP42063的核苷酸序列。
[0117] SEQ ID NO:62-78为图12中所示的DNA片段。SEQ ID NO:62为野生型高粱MS26基因的一部分的核苷酸序列。SEQ ID NO:63-78示出了对SEQ ID NO:62中所示的野生型
高粱MS26基因的核苷酸序列的修饰。

具体实施方式

[0118] 本说明书中提及的所有公布和专利申请指示了本发明所属领域的技术人员的水平。所有公布和专利申请在相同程度上全文以引用方式并入本文,如同每个单独的公布或
专利申请被具体地和独立地指出全文以引用方式并入本文一样。
[0119] 虽然为了清楚地理解而已经通过举例说明和实例较详细地描述了本发明,但显然可以在权利要求书范围内实施一些改变和修饰。
[0120] 本文中和随附的权利要求书中所用名词形式上为单数,但包括复数指代,除非上下文清楚表明并非如此。因此,例如,提及“植物”则包括多个这种植物;提及“细胞”则包括一个或多个细胞以及本领域技术人员已知的其等同物,以此类推。
[0121] 产生遗传雄性不育的可靠系统将提供开发杂种植物的优势。通过使用细胞质雄性不育(CMS)近交系可在一些基因型中避免费力的去雄处理。缺少育性恢复基因时,CMS近
交系的植物是雄性不育的,因为因子来自于细胞质(而不是细胞核)基因组。因而,该特性
只通过母本在玉蜀黍植物遗传,因为仅母本为受精种子提供胞质。来自非雄性不育的另一
近交系的花粉使CMS植物受精。来自该第二近交系的花粉可能会或可能不会贡献使杂种植
物雄性可育的基因。通常,必须将来自去雄的正常玉蜀黍的种子和相同杂种的CMS产生种
子共混以确保在栽培杂种植物时有足够的花粉载荷可供受精以及确保细胞质多样性。
[0122] 核(基因性)不育性可以是显性或隐性的。如果雌性系的繁殖是可能的(例如通过体外克隆繁殖),则仅显性不育性可用于杂种种子形成。如果不育和能育植物容易辨别,则可以使用隐性不育性。然而基因性不育性的商业实用性受限于克隆繁殖的费用和淘汰自
身能育植物的雌株行。
[0123] 在颁给Brar等人的美国专利4,654,465和4,727,219中公开了一种类型的遗传不育性。然而,这种形式的遗传雄性不育需要在基因组内分开的位置保持多个突变基因并
且需要复杂的标记系统来追踪基因以及便利地利用该系统。Patterson也描述了染色
易位的基因系统,其可以是有效的,但其是复杂的。(参见美国专利No.3,861,709和3,
710,511。)
[0124] 已经进行了许多尝试来在这些系统上进行改善。例如,Fabijanski等人开发了若干在植物中导致雄性不育的方法(参见EPO89/3010153.8公开号329,308和作为WO90/
08828公开的PCT申请PCT/CA90/00037)。一种方法包括向植物内递送与雄性组织特
异性启动子关联的编码细胞毒性物质的基因。另一种方法涉及反义系统,其中鉴别对能育
性关键的基因并且将该基因的反义基因插入进该植物内。Fabijanski等人也示出了若干细
胞毒性反义系统。参见EP0329308。还有一个系统使用“阻遏”基因,其抑制对雄性不育关键的另一基因的表达。参见作为WO90/08829公布的PCT/GB90/00102。对于另外的
例子,请参见美国专利No.6,281,348。
[0125] 该系统的更进一步改善是美国专利No.5,478,369中描述的改善,其中赋予可控雄性不育的方法通过失活或以其他方式沉默对雄性能育性关键的植物天然的基因并用与
控制对雄性能育性关键的基因的表达的诱导型启动子连接的对雄性能育性关键的基因转
化植物来实现。也就是说,通过本领域技术人员已知用于防止序列表达的任何方法(例如
反义方法、共抑制、突变、使用核糖酶或发夹、各种阻遏系统等等,下文进行了讨论)来防止内源序列的表达。植物因而在组成上是不育的,从而仅在该启动子被诱导并且其连接的雄
性能育性基因表达时变成可育的。
[0126] 在许多情况下,雄性不育植物性状通过保持纯合隐形条件来表达。在保持纯合条件方面出现了困难,这时必须将恢复基因用于保持。例如,对雄性能育性关键的基因中的天然突变在该突变等位基因处于纯合状态时可为植物赋予雄性不育表型。但是因为该纯合
性导致雄性不育,所以不能维持纯合的雄性不育系。当将该基因的非突变形式引入植物中
时能育性得以恢复。然而,该形式的品系保持移除了所需的纯合隐形条件,在一半所得的
子代中恢复了完全的雄性能育性,并阻止纯雄性不育母系的保持。若消除含有恢复基因的
花粉的产生,从而提供仅产生不含有恢复基因的花粉的保持系植物,在由这种花粉受精时
子代可保持它们的纯合条件,则可以避免这些问题。一种方法的例子在Dellaporta等人,
6,743,968中示出,其中产生具有半合子构建体的植物,该构建体包含可产生对细胞致命的产物的基因(与花粉特异性启动子连接)和恢复基因。当与纯合隐性雄性不育植物杂交时,
子代因而保留纯合隐性条件。其他方法已例如在U.S.7,696,405中进行了描述。
[0127] 如所指出的,雄性不育系统相伴随的许多工作的一个重要方面是鉴定影响雄性能育性的基因。这种基因可用于用以控制雄性能育性的多种系统,包括上面描述的那些。
[0128] 如本文所用,“遗传雄性不育”由突变、抑制或其他对对小孢子发生中的特定步骤关键的基因的影响而引起,小孢子发生这个术语适用于孢子形成的整个过程。这些基因可统称为雄性能育性基因(或者雄性不育基因)。在基因功能影响能育性的总途径中有许多
步骤,如玉蜀黍中的遗传雄性不育的频率所展示的。在涵盖了从良种近交系到未适应群体
(unadapted population)的材料中发现了雄性不育突变体的新等位基因。
[0129] 在美国专利No.5,478,369中,描述了一种方法,通过该方法将Ms45雄性能育性基因加标签并克隆于玉蜀黍染色体9上。此前,已经描述了染色体9上的雄性能育性基因
ms2,其从未被克隆和测序。其不是‘369专利中提及的基因的等位基因。参见Albertsen,M.和Phillips,R.L.,“Developmental Cytology of13Genetic Male Sterile Loci in
Maize”Canadian Journal of Genetics&Cytology(《加拿大遗传学与细胞学杂志》)23:
195-208(1981年1月)。此前克隆的唯一能育性基因是Aarts等人(出处同上)描述的拟
南芥(Arabadopsis)基因。
[0130] 后来发现的对雄性能育性重要的基因的例子有很多,包括拟南芥ABORTEDMICROSPORES(AMS)基因(Sorensen等人,The Plant Journal(《植物杂志》)(2003)33(2):
413-423);拟南芥MS1基因(Wilson等人,The Plant Journal(《植物杂志》)(2001)39(2):
170-181);NEF1基因(Ariizumi等人,The Plant Journal(《植物杂志》)(2004)39(2):
170-181);拟南芥AtGPAT1基因(Zheng等人,The Plant Cell(《植物细胞》)(2003)15:
1872-1887);据显示拟南芥dde2-2突变是丙二烯化物合酶基因中的缺陷(Malek等人,
Planta(《植物》)(2002)216:187-192);拟南芥匿名花粉-1基因(flp1)(Ariizumi等人,
Plant Mol.Biol.(《植物分子生物学》)(2003)53:107-116);拟南芥MALE MEIOCYTE DEATH1基因(Yang等人,The Plant Cell(《植物细胞》)(2003)15:1281-1295);绒毡层-特异性锌指基因TAZ1(Kapoor等人,The Plant Cell(《植物细胞》)(2002)14:2353-2367);和TAPETUM DETERMINANT1基因(Lan等人,The Plant Cell(《植物细胞》)(2003)15:2792-2804)。
[0131] 表1列出了来自玉蜀黍的许多已知的雄性能育性突变体或基因。
[0132] 表1
[0133] 来自玉蜀黍的雄性能育性突变体或基因。
[0134]
[0135]
[0136]
[0137] 美国专利公布US2008-0086783A1描述了称为“BS92-7”或“BS7”的雄性能育性基因,其位于玉蜀黍染色体7上。BS92-7可用于上面描述的系统以及影响雄性能育性的其他系统。
[0138] 1998年5月12日公布的美国专利No.5,750,868描述了称为“5126”的雄性能育性基因(SEQ ID NO:24)。
[0139] 1995年12月26日公布的美国专利No.5,478,369描述了称为“MS45”的雄性能育性基因。
[0140] 2009年4月14日公布的美国专利No.7517975描述了称为“MS26”(也称为SB200或SBMu200)的雄性能育性基因,其位于玉蜀黍染色体1上。MS26可用于上面描述的系统以
及影响雄性能育性的其他系统。
[0141] 2009年2月5日公布的美国专利公布US2009-0038026A1,描述了称为“Mscal”或“MS22”的雄性能育性基因,其位于玉蜀黍染色体7上并且编码对雄性能育性关键的蛋
白质。称为ms22或mscal的突变最开始以表型雄性不育而闻名,花药不从雄穗伸出并
且缺少造孢组织。West和Albertsen(1985)Maize Newsletter(《玉蜀黍通讯》)59:87;
Neuffer等人(1977)Mutants of maize.(《玉蜀黍的突变体》)纽约冷泉港的冷泉港实验
室出版社(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。该突变
基因座最初称为ms22,但后来改为mscal或雄性不育转化花药(male sterile converted
anther)。参见Chaubal等人,“The transformation of anthers in the mscalmutant of maize”Planta(《植物》)(2003)216:778-788。
[0142] 在本公开文本的上下文中,使用了许多术语和缩写。提供了以下定义。
[0143] 本文所用的术语“识别序列”或“识别位点”是指植物细胞基因组中的这样的DNA序列,在该DNA序列处通过双链断裂诱导剂诱导双链断裂。术语“识别序列”和“识别位点”在本文中可互换使用。
[0144] 术语“靶位点”、“靶序列”、“靶基因座”、“基因组靶位点”、“基因组靶序列”在本文中可互换使用,是指植物细胞基因组中的包含双链断裂诱导剂的识别序列的多核苷酸序列。
[0145] “人工靶序列”是已被引入植物的基因组中的靶序列。这种人工靶序列可在序列上与植物基因组中的内源或天然靶序列相同,但可位于植物基因组中的另一不同位置(即非内源或者非天然位置)。
[0146] “内源靶序列”或“天然靶序列”在本文中可互换使用来指植物基因组的内源或天然的靶序列并且在植物基因组中处于该靶序列的内源或天然位置。
[0147] “变更的靶序列”是指与非变更的靶序列相比,包含至少一个本发明的变更的本文所公开的靶序列。本发明的这种“变更”包括例如:(i)置换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或者(i)-(iii)的任何组合。
[0148] 本文所用的术语“双链断裂诱导剂”是指任何能在靶序列中产生双链断裂的酶。在靶序列或其他DNA中产生双链断裂在本文中可称为“切开”或者“切割”该靶序列或其他DNA。在本发明的一些实施例中,双链断裂诱导剂已经过工程改造(或修饰)以切开特定的
内源靶序列,其中该内源靶序列在被该经工程改造的双链断裂诱导剂切开之前不是会被天
然的(非工程改造的或非修饰的)双链断裂诱导剂所识别的序列。
[0149] “工程改造的双链断裂诱导剂”是任何双链断裂诱导剂,包括但不限于天然的或野生型的双链断裂诱导剂以及已经经修饰以在目标靶序列处产生双链断裂的先前经工程改造的双链断裂诱导剂,该经工程改造的双链断裂诱导剂在其修饰之前具有与双链断裂诱导
剂的初始靶序列不同的核苷酸序列。优选地,本发明的工程改造的双链断裂诱导剂不再能
够在初始靶序列出产生双链断裂。
[0150] 术语“内切核酸酶”是指可切割多核苷酸链内的磷酸二酯键的任何酶,并且包括可切割作为特异性位点的DNA的不破坏基的限制性内切核酸酶。限制性内切核酸酶包括I型、II型、III型和IV型内切核酸酶,它们进一步包括亚型。在I型和III型系统中,甲基
化酶活性和限制酶活性二者都包含在单一复合物中。
[0151] I型和III型限制内切核酸酶能识别特定识别位点,但通常在离识别位点可变的位置处切割,该位置距离识别位点可达数百个碱基对。在II型系统中,限制酶活性不依赖
于任何甲基化酶活性,并且切割通常发生在识别位点之内或附近的特定位点处。大多数的
II型酶能切割回文序列,但是IIa型酶能识别非回文识别位点并在识别位点外部切割,IIb
型酶切割序列两次,两个位点都在识别位点外部,而IIs型酶能识别非对称识别位点并在
一侧上和离识别位点约1-20个核苷酸的确定距离处切割。
[0152] IV型限制酶能靶向甲基化的DNA。限制酶在例如如下数据库和文献中有进一步的描述和分类:REBASE数据库(网页rebase.neb.com;Roberts等人,(2003)Nucleic Acids
Res(《核酸研究》)31:418-20);Roberts等人,(2003)Nucleic Acids Res(《核酸研究》)31:
1805-12;以及Belfort等人,(2002),载于:Mobile DNA II,第761-783页,Craigie等人编辑(华盛顿特区ASM出版社(ASM Press,Washington,DC))。
[0153] 内切核酸酶还包括大范围核酸酶,也称为归巢核酸内切酶(HE酶),其类似限制性内切核酸酶,在特定的识别序列出结合并切开,然而大范围核酸酶的识别位点通常较
长,约18bp或更长。已更具保守的序列基序将大范围核酸酶分成四个家族;这些家族为
LAGLIDADG家族、GIY-YIG家族、H-N-H家族和His-Cys盒家族。这些基序参与金属离子的配
位和磷酸二酯键的水解。HE酶的显著之处在于它们的识别位点长,并且能容忍它们的DNA
底物中有一定的序列多态性。大范围核酸酶的命名规范与其他限制性内切核酸酶的规范相
似。对于分别由独立式ORF(free-standing ORF)、内含子和内含肽编码的大范围核酸酶,它们也通过前缀F-、I-或PI-进行表征。例如,来自酿酒酵母(Saccharomyces cerevisiae)
由内含子、内含肽和独立式基因编码的大范围核酸酶分别表示为I-SceI、PI-SceI和
F-SceII。大范围核酸酶结构域、结构和功能是已知的,参见例如Guhan和Muniyappa(2003)Crit Rev Biochem Mol Biol(《生物化学和分子生物学评论》)38:199-248;Lucas等人,(2001)Nucleic Acids Res(《核酸研究》)29:960-9;Jurica和Stoddard,(1999),Cell Mol Life Sci(《细胞和分子生命科学》)55:1304-26;Stoddard,(2006)Q Rev Biophys(《生物物理学季评》)38:49-95;以及Moure等人,(2002)Nat Struct Biol(《自然-结构生物
学》)9:764。在一些例子中,使用工程改造的大范围核酸酶。用于修饰动力学性质、辅因子相互作用、表达、最佳条件和/或识别位点特异性以及筛选活性的方法是已知的。参见例如Epinat等人,(2003)Nucleic Acids Res(《核酸研究》)31:2952-62;Chevalier等人,(2002)Mol Cell(《分子细胞》)10:895-905;Gimble等人,(2003)Mol Biol(《分子生物学》)334:
993-1008;Seligman等人,(2002)Nucleic Acids Res(《核酸研究》)30:3870-9;Sussman等人,(2004)J Mol Biol(《分子生物学杂志》)342:31-41;Rosen等人,(2006)Nucleic Acids Res(《核酸研究》)34:4791-800;Chames等人,(2005)Nucleic Acids Res(《核酸研究》)33:e178;Smith等人,(2006)Nucleic Acids Res(《核酸研究》)34:e149;Gruen等人,(2002)Nucleic Acids Res(《核酸研究》)30:e29;Chen和Zhao,(2005)Nucleic Acids Res(《核酸研究》)33:e154;WO2005105989;WO2003078619;WO2006097854;WO2006097853;
WO2006097784;和WO2004031346。
[0154] 内切核酸酶可以是能结合非天然或外源识别序列而不结合天然或内源识别序列的经修饰的内切核酸酶。内切核酸酶的修饰可少至一个核苷酸。经修饰的内切核酸酶不能
够在野生型靶序列内产生双链断裂。野生型(即在被修饰前)内切核酸酶能够在野生型靶
序列内产生双链断裂。
[0155] 内切核酸酶通过编码内切核酸酶的多核苷酸提供。可对这种编码内切核酸酶的多核苷酸进行修饰以置换上与天然存在的多核苷酸序列相比在植物中具有更高使用频率的
密码子。例如,可对编码内切核酸酶的多核苷酸进行修饰以置换上与天然存在的多核苷酸
序列相比在玉蜀黍或大豆植物中具有更高使用频率的密码子。
[0156] 术语“工程改造的内切核酸酶”是已经过工程改造(或修饰)以切开特定的内源靶序列,其中该内源靶序列在被该工程改造的内切核酸酶切开之前不是会被天然的(非工
程改造的或非修饰的)内切核酸酶所识别的序列。
[0157] 在一些本发明的实施例中,该工程改造的内切核酸酶为工程改造的MS26内切核酸酶、工程改造的MS26+内切核酸酶、工程改造的MS26++内切核酸酶或工程改造的MS45内
切核酸酶。
[0158] 如本文所用,“物理连接的”和“物理键合的”和“遗传上连接的”用于指属同一分子或染色体的部分的任何两个或多个基因、转基因、天然基因、突变基因、变更、靶位点、标记等。
[0159] 如本文所用,目标基因组区域内的“目标多核苷酸”是该目标基因组区域的任何编码和/或非编码部分,包括但不限于转基因、天然基因、突变基因和遗传标记例如单核苷酸多态性(SNP)标记和简单重复序列(SSR)标记。
[0160] “开放阅读框”缩写为ORF。
[0161] 如本文所用,“核酸”意指多核苷酸,包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸也可包括片段和经修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或DNA的聚合物,其任选含有合成的、非天然的或变更的核苷酸碱基。核苷酸(通常以其5′-单磷酸酯形式存在)用如下的单字母代码指代:“A”指代腺苷或脱氧腺苷(分别对于RNA或者DNA),
“C”指代胞嘧啶或脱氧胞嘧啶,“G”指代苷或脱氧鸟苷,“U”指代尿苷,“T”指代脱氧胸苷,“R”指代嘌呤(A或G),“Y”指代嘧啶(C或T),K指代G或T,“H”指代A或C或者T,“I”指代肌苷,“N”指代任何核苷酸。
[0162] 术语“在功能上等价的子片段”和“功能等价子片段”在本文中可互换使用。这些术语是指分离核酸片段的这样的部分或子序列,其中变更基因表达或产生某种表型的能力得到保持而无论该片段或子片段是否编码活性酶。例如,该片段或子序列可用于设计嵌合
基因以在转化的植物中产生所需的表型。可通过将核酸片段或其子片段(无论其是否编码
活性酶)相对于植物启动子序列以有义或反义取向进行连接,来设计嵌合基因用于抑制。
[0163] 术语“保守结构域”或“基序”是指在进化上相关的蛋白质的比对序列上特定位置处保守的一组氨基酸。虽然其他位置处的氨基酸在同源蛋白质之间可变,但在特定位置
处高度保守的氨基酸指示对于蛋白质的结构、稳定性或活性而言必需的氨基酸。由于它们
因其在蛋白质同源物家族的比对序列中的高保守度而被鉴定,所以它们可用作鉴定物或者
“识别标志(signature)”,以确定具有新确定的序列的蛋白质是否属于之前鉴定的蛋白质家族。
[0164] 多核苷酸和多肽序列、其变体以及这些序列的结构关系,可用术语“同源性”、“同源的”、“实质上相同的”、“实质上相似的”和“实质上对应”描述,这些术语在本文中可互换使用。这些是指多肽或核酸片段,其中一个或多个氨基酸或核苷酸碱基的变化不影响分子的功能,如介导基因表达或产生某种表型的能力。这些术语还指核酸片段的这样的修饰形
式:相对于初始的未经修饰的片段,所述修饰形式不实质改变所得的核酸片段的功能性质。
这些修饰包括核酸片段中缺失、置换和/或插入一个或多个核苷酸。
[0165] 所涵盖的实质上相似的核酸序列可通过其与本文所例示的序列杂交,或者与本文所公开的以及与任何本文所公开的核酸序列在功能上等价的核苷酸序列的任何部分杂交
(在中等严格条件下,例如0.5X SSC,0.1%SDS,60℃)的能力来定义。可调整严格性条件
以筛选中等相似片段,如来自远缘关系生物的同源序列,以及高度相似片段,如来自近缘关系生物的复制功能性酶的基因。杂交后的洗涤决定了严格性条件。
[0166] 术语“选择性杂交”包括指在严格杂交条件下核酸序列与指定的核酸靶序列杂交的程度比其与非靶序列杂交的程度可检测地更高(例如,至少2倍于背景),并且基本上排
除非靶核酸。选择性杂交的序列通常相互具有约至少80%的序列同一性,或者90%的序列
同一性,最多至100%并包括100%的序列同一性(即完全互补性)。
[0167] 术语“严格条件”或者“严格杂交条件”包括指在体外杂交测定中探针将与其靶序列选择性杂交的条件。严格条件是序列依赖性的,并且将在不同环境下不同。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。或者,可以
调节严格性条件以允许序列中的一些错配,从而检测到较低程度的相似性(异源探测)。一
般地讲,探针长度小于约1000个核苷酸,任选长度小于500个核苷酸。
[0168] 通常,严格条件将为其中盐浓度低于约1.5M钠离子,通常为约0.01至1.0M钠离子浓度(或者其他盐),pH为7.0至8.3,对短探针(例如,10至50个核苷酸)而言温度
至少30℃,对长探针(例如超过50个核苷酸)而言温度为至少约60℃的那些条件。严格
条件还可以通过添加去稳定剂如甲酰胺来实现。示例性的低严格性条件包括在37℃下用
30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,并在50至55℃下
在1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格
性条件包括在40%至45%甲酰胺、1M NaCl、1%SDS中在37℃下杂交,并在0.5X至1X SSC
中在55℃至60℃下洗涤。示例性的高严格性条件包括在50%甲酰胺、1M NaCl、1%SDS中
在37℃下杂交,并在0.1X SSC中在60至65℃下洗涤。
[0169] 特异性通常决定于杂交后的洗涤,关键因素为最终洗涤溶液的离子强度和温度。对于DNA-DNA杂交体,可根据Meinkoth等人,(1984)Anal Biochem(《分析生物化学》)138:
267-284的公式估计Tm:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/
L;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟嘌呤核苷酸和胞嘧啶核苷酸的百分
比,%form为杂交溶液中甲酰胺的百分比,L为杂交体的长度(单位为碱基对)。Tm为
50%的互补靶序列与完美匹配的探针杂交时的温度(在确定的离子强度和pH下)。每1%
的错配,Tm降低约1℃;因此,可调节Tm、杂交和/或洗涤条件以杂交至所需同一性的序列。
例如,如果寻求具有≥90%同一性的序列,则可将Tm降低10℃。通常,将严格条件选择为
比特定序列及其互补序列在确定的离子强度和pH下的热解链温度(Tm)低约5℃。然而,
极端严格条件可以采用在比热解链温度(Tm)低1、2、3或4℃下的杂交和/或洗涤;中等严
格条件可以采用在比热解链温度(Tm)低6、7、8、9或10℃下的杂交和/或洗涤;低严格条
件可以采用在比热解链温度(Tm)低11、12、13、14、15或20℃下的杂交和/或洗涤;利用该公式,杂交和洗涤组成以及所需的Tm,普通技术人员将理解,杂交和/或洗涤溶液的严格性的变化固有地得到了描述。如果所需的错配程度导致Tm低于45℃(水溶液)或32℃(甲
酰胺溶液),则优选增加SSC浓度以使得可使用较高的温度。有关核酸的杂交的详尽指
南见于如下文献:Tijssen,Laboratory Techniques in Biochemistry and Molecular
Biology--Hybridization with Nucleic Acid Probes(《生物化学和分子生物学实验室技
术--核酸探针杂交》),第I部分,第2章,“Overview of principles of hybridization and the strategy of nucleic acid probe assays”(核酸探针测定法的杂交原理和策略
概览),纽约爱思唯尔出版社(Elsevier,New York),(1993);以及Current Protocols in Molecular Biology(《现代分子生物学方法》),第2章,Ausubel等人编辑,纽约格林出版与威利交叉科学(Greene Publishing and Wiley-Interscience,New York)(1995)。杂交
和/或洗涤条件可施加至少10、30、60、90、120或者240分钟。
[0170] 在核酸或多肽序列的情形中,“序列同一性”或“同一性”是指在指定的比较窗口范围为获得最大对应而比对时两条序列中相同的核酸碱基或氨基酸残基。
[0171] 术语“序列同一性百分数”意指通过在比较窗口上比较两个最佳比对的序列所确定的数值,其中多核苷酸或多肽序列在比较窗口中的部分与参考序列(不包含添加或缺
失)相比包含添加或缺失(即空位),以便两个序列的最佳比对。通过以下方式计算这种百
分数:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置
的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到
序列同一性百分数。序列同一性百分数的有用例子包括但不限于50%、55%、60%、65%、
70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,或者
50%至100%的任何整数百分数。这些同一性可用本文描述的任何程序确定。
[0172] 序列比对和同一性百分数或相似性计算可用多种被设计用于检测同源序列的比较方法来确定,包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.公司,威斯
TM
康星州麦迪逊市(Madison,WI))的MegAlign 程序。在本申请的上下文中,应当理解,若
使用序列分析软件进行分析,分析的结果将基于所提到的软件的“默认值”,除非另外指明。
如本文所用,“默认值”将意指软件第一次初始化时原始加载在该软件中的任何数值或参数组。
[0173] “Clustal V比对方法”对应于标示为Clustal V的比对方法(由Higgins和Sharp,(1989)CABIOS5:151-153;Higgins等人,(1992)Comput Appl Biosci(《技算机在生物科学中的应用》)8:189-191描述),其存在于LASERGENE生物信息学计算软件包(DNASTAR TM
Inc.公司,威斯康星州麦迪逊市)的MegAlign 程序中。对于多序列比对,默认值对应于
空位罚分(GAP PENALTY)=10,空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal
方法进行蛋白质序列的双序列比对和同一性百分数计算的默认参数是KTUPLE=1、空位罚
分=3,窗口(GAP LENGTH PENALTY)=5,DIAGONALS SAVED=5。对于核酸,这些参数是
KTUPLE=2、空位罚分=5,窗口=4,DIAGONALS SAVED=4。在用Clustal V程序进行序
列比对后,可以通过观察同一程序中的“序列距离”表来获得“百分比同一性”。
[0174] “Clustal W比对方法”对应于标示为Clustal W的比对方法(由Higgins 和Sharp,(1989)CABIOS5:151-153;Higgins等人,(1992)Comput Appl Biosci(技算机在生物科学中的应用》)8:189-191描述),其存于LASERGENE生物信息学计算软件包(DNASTAR
TM
Inc.公司,威斯康星州麦迪逊市)的MegAlign v6.1程序中。用于多序列比对的默认参数
(空位罚分=10、空位长度罚分=0.2、延迟发散序列(Delay Divergen Seqs)(%)=30,
DNA转换权重(DNA Transition Weight)=0.5、蛋白质权重矩阵(Protein Weight Matrix)
=Gonnet系列,DNA权重矩阵(DNA Weight Matrix)=IUB)。在用Clustal W程序进行序
列比对后,可以通过观察同一程序中的“序列距离”表来获得“百分比同一性”。
[0175] 除非另有规定,否则本文提供的序列同一性/相似性值是指使用GAP版本10(GCG,Accelrys,加利福尼亚州圣地亚哥市(San Diego,CA))采用如下参数获得的值:使用空位产生罚分权重=50和空位长度延伸罚分权重=3以及nwsgapdna.cmp打分矩阵获
得核苷酸序列的同一性百分数和相似性百分数;使用空位产生罚分权重=8和空位长度延
伸罚分权重=2以及BLOSUM62打分矩阵获得氨基酸序列的同一性百分数和相似性百分数
(Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)89:
10915)。GAP利用Needleman和Wunsch(1970)J Mol Biol(《分子生物学杂志》)48:443-53
算法来寻找两个完整序列的比对,该比对使匹配数最大而使空位数最小。GAP考虑所有可能的比对和空位位置,并使用以匹配碱基为单位的空位产生罚分和空位延伸罚分产生出具
有最大数目的匹配碱基和最少的空位的比对。
[0176] “BLAST”是美国国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)提供的用于寻找生物序列之间的相似性区域的搜索算法。该程序将核
苷酸或者蛋白质序列与序列数据库比较,并计算各匹配的统计显著性以鉴定出与查询序列
具有足够的相似性的序列使得相似性不会被预测为随机发生。BLAST报告所鉴定的序列以
及它们与查询序列的局部比对。
[0177] 本领域的技术人员熟知,许多序列同一性水平可用于鉴定来自其它物种的或者经天然修饰或合成法修饰的多肽,其中这种多肽具有相同或相似的功能或活性。同一性
百分数的有用例子包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或者
95%,或者50%至100%之间的任何整数百分数。的确,50%至100%的任何整数氨基酸同
一性可用于描述本发明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、
61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、
76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%或99%。
[0178] “基因”是指表达特定蛋白质的核酸片段,包括位于编码序列之前的调节序列(5′非编码序列)和之后的调节序列(3′非编码序列)。“天然基因”是指自然界中所存在的具有其自身调节序列的基因。“嵌合基因”是指不是天然的基因、包含在自然界中不在一起的调节序列和编码序列的任何基因。因此,嵌合基因可以包含源自不同来源的调节序列和编
码序列,或者源自相同来源、但以不同于自然界中存在的方式排列或者在不同于自然界中
存在的遗传基因座处的调节序列和编码序列。“外来”基因是指通常不存在于宿主生物体
中、但通过基因转移引入该宿主生物体中的基因。外来基因可以包含插入非天然的生物体
中的天然基因,或嵌合基因。
[0179] “突变基因”是已通过人为介入而变更的天然基因。这种“突变基因”的序列与相应的天然基因的序列不同之处在于至少一个核苷酸添加、缺失或置换。在本发明的某些实施例中,突变基因包含由本文所公开的双链断裂诱导剂引起的变更。
[0180] “转基因”是已经通过转化程序引入基因组中的基因。转基因可例如编码一种或多种蛋白质或不被翻译成蛋白质的RNA。但是,本发明的转基因不需要编码蛋白质和/或非翻译的RNA。在本发明的某些实施例中,转基因包含一种或多种嵌合基因,包括包含例如目标基因、表型标记、选择标记和用于基因沉默的DNA的嵌合基因在内。
[0181] 如本文所用,“靶向修饰”是生物体基因组中的靶序列中的修饰,该修饰通过使用涉及本文所公开的或者本领域已知的能够在靶序列的DNA中诱导双链断裂的双链断裂诱导剂的方法变更天然基因内的靶序列来产生。“靶向突变”是天然基因中的突变,该突变通过使用涉及本文所公开的或本领域已知的能够在靶序列的DNA中诱导双链断裂的双链断
裂诱导剂的方法变更天然基因内的靶序列来产生。“靶向突变”是一种类型的“靶向修饰”。
[0182] 当本文关于DNA、基因和其他核酸使用时,术语“变更”、“修饰”和“突变”要被视为等价的术语,除非根据上下文显而易见的是打算将不同的含义用于这些术语中的任一者或更多者。
[0183] “无效突变”是基因中导致该基因不被转录为RNA和/或反义成功能性蛋白质产物的突变。包含无效突变的等位基因称为“无效等位基因”。基因中的无效突变可例如通过该基因中的变更引起,包括(i)置换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或者(iv)(i)-(iii)的任何组合。
[0184] 如本文所用,“雄性能育性基因”是对导致小孢子发生并且包括小孢子发生在内的步骤关键的基因,小孢子发生这个术语适用于孢子形成的整个过程。这些基因可统称为雄性能育性基因(或者雄性不育基因)。术语“雄性能育性基因”、“雄性能育基因”、“雄性不育性基因”和“雄性不育基因”可互换使用。
[0185] “能育植物”是能够产生子代植物的植物。在本发明的某些实施例中,能育植物是能产生活雄配子和雌配子并且自身能育的植物。这种自身能育植物可在没有任何其他植物贡献配子及其中所含的遗传材料的情况下产生子代植物。本发明的其他实施例可涉及使用
不自身能育的植物,因为该植物不产生活的或者说是能够授受精的雄配子或者雌配子。如
本文所用,“雄性不育植物”是不产生活的或者说是能够授精的雄配子的植物。如本文所用,“雌性不育植物”是不产生活的或者说是能够受精的雌配子的植物。已经认识到雄性不育和雌性不育植物可分别是雌性可育和雄性可育的。还应认识到,雄性能育(但雌性不育)植
物当与雌性能育植物杂交时可产生活的子代,而雌性能育(但雄性不育)植物当与雄性能
育植物杂交时可产生活的子代。
[0186] 术语“基因组”在其应用于植物细胞时,不仅涵盖细胞核内存在的染色体DNA,也涵盖细胞的亚细胞组分(例如线粒体或质体)中存在的细胞器DNA。
[0187] “经密码子修饰的基因”或者“密码子偏好基因”或者“密码子优化基因”是这样的基因,其密码子使用的频率被设计成模拟宿主细胞的偏好密码子使用的频率。
[0188] “等位基因”是基因的占据染色体上给定基因座的数种备选形式之一。当染色体上给定基因座处存在的所有等位基因都相同时,该植物在该基因座处是纯合的。如果染色体上给定基因座处存在的等位基因不同,则该植物在该基因座处是杂合的。
[0189] “编码序列”是指编码特定氨基酸序列的多核苷酸序列。“调节序列”是指位于编码序列上游(5′非编码序列)、内部或下游(3′非编码序列)并且影响相关联的编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列可包括但不限于:启动子、翻译前导序列、5′非翻译序列、3′非翻译序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应物结合位点和茎-环结构。
[0190] “启动子”是指能够控制编码序列或功能RNA的表达的DNA序列。启动子序列由近端上游元件和更远端的上游元件组成,后一类元件经常称作增强子。因此,“增强子”是这样的DNA序列,其可以刺激启动子活性,并且可以是启动子的固有元件或经插入以增强
启动子的活性或组织特异性的异源元件。启动子可以整体源自天然基因,或由源自自然界
中存在的不同启动子的不同元件构成,和/或包含合成的DNA区段。本领域技术人员应当
理解,不同的启动子可以引导基因在不同组织或细胞类型中或在不同的发育阶段或应答于
不同的环境条件表达。还认识到,由于在大多数情况下调节序列的确切界限仍未完全确定,因此存在一定变异的各DNA片段可以具有相同的启动子活性。引起基因在大部分细胞类型
中在大多数时间表达的启动子常称作“组成型启动子”。不断发现可用于植物细胞中的各
种类型的新启动子;许多例子可见于如下汇编中:Okamuro和Goldberg,(1989),载于The Biochemistry of Plants(《植物生物化学》),第115卷,Stumpf和Conn编辑(纽约州纽
约市:学术出版社(Academic Press)),第1-82页。
[0191] “翻译前导序列”是指位于基因启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列上游的完全加工的mRNA中。翻译前导序列可以影响初级转录物加工成mRNA、mRNA稳定性或翻译效率。翻译前导序列的例子已有描述(例如Turner
和Foster,(1995)Mol Biotechnol(《分子生物技术》)3:225-236)。
[0192] “3′非编码序列”、“转录终止子”或“终止序列”是指位于编码序列下游的DNA序列,包括聚腺苷酸化识别序列和其他编码能够影响mRNA加工或基因表达的调节信号的序列。聚腺苷酸化信号通常表征为实现聚腺苷酸串(polyadenylic acid tract)添加至
mRNA前体的3′末端。不同的3′非编码序列的用途由Ingelbrecht等人,(1989)Plant
Cell(《植物细胞》)1:671-680例举。
[0193] “RNA转录物”是指由RNA聚合酶催化的DNA序列的转录所产生的产物。当RNA转录物是DNA序列的完美互补拷贝时,其被称为初级转录物。当RNA转录物是由初级转录物的
转录后加工衍生的RNA序列时,其被称为成熟RNA。“信使RNA”或“mRNA”是指没有内含子且可被细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA模板互补且用逆转录酶从mRNA模板
合成的DNA。cDNA可以是单链的,或者可用DNA聚合酶I的Klenow片段转化成双链形式。
“有义”RNA是指包括该mRNA并且可在细胞内或在体外翻译成蛋白质的RNA转录物。“反义
RNA”是指与靶初级转录物或mRNA的全部或部分互补,并且能阻断靶基因的表达的RNA转录
物(参见例如美国专利No.5,107,065)。反义RNA的互补性可存在于特定基因转录物的任何
部分,即在5′非编码序列、3′非编码序列、内含子或编码序列。“功能RNA”是指反义RNA、核酶RNA或其他可能不被翻译但仍对细胞过程具有影响的RNA。术语“互补序列”或“反向
互补序列”在本文中可互换使用来指mRNA转录物,并且意在限定该信使RNA的反义RNA。
[0194] 术语“可操作连接”是指各核酸序列在单个核酸片段上的关联,使得一个核酸序列的功能被另一个核酸序列调节。例如,当启动子能够调节编码序列的表达时(即,该编码序列处于该启动子的转录控制下),则该启动子与该编码序列可操作连接。编码序列可以以有义或反义取向与调节序列可操作连接。在另一个例子中,互补的RNA区域可以直接或者
间接地与靶mRNA的上游(5′)可操作连接,或者与靶mRNA的下游(3′)可操作连接,或
者在靶mRNA内部可操作连接,或者第一互补区在靶mRNA的上游(5′),而其互补序列在靶
mRNA的下游(3′)。
[0195] 本文所用的标准重组DNA和分子克隆技术是本领域公知的,在如下文献中有更完全的描述:Sambrook等人,Molecular Cloning:A Laboratory Manual(《分子克隆:实验室手册》);纽约冷泉港的冷泉港实验室出版社(Cold Spring Harbor Laboratory:Cold
Spring Harbor,NY)(1989)。转化方法是本领域技术人员所熟知的并且在下文中进行了描
述。
[0196] “PCR”或“聚合酶链反应”是一项用于合成特定DNA区段的技术,由一系列的重复的变性、退火和延伸循环组成。通常,将双链DNA进行热变性,并将两条与靶区段的3′边界互补的引物与该DNA在低温下退火,然后在中等温度下延伸。一组这三个连续步骤称为一个“循环”。
[0197] 术语“重组的”是指序列的两个原本分开的区段例如通过化学合成,或使用遗传工程技术对核酸的分离的区段进行操纵而人工组合在一起。
[0198] 术语“质粒”、“载体”和“盒”是指这样的染色体外元件,其通常携带不是细胞中心代谢的一部分的基因,并且通常为双链DNA的形式。这种元件可以是衍自任何来源的、单链或双链DNA或RNA的、线状或环状形式的自主复制序列、基因组整合序列、噬菌体或核苷
酸序列,其中多个核苷酸序列已接合或重组成能够将目标多核苷酸引入细胞中的独特构建
体。“转化盒”是指含有外来基因并且除该外来基因之外还具有能促进具体宿主细胞的转化的元件的特定载体。“表达盒”是指含有外来基因并且除该外来基因之外还具有使该基因可以在外来宿主中表达的元件的特定载体。
[0199] 术语“重组DNA分子”、“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文中可互换使用。重组构建体包含在自然界中不全部在一起的核酸片段(例如调节序列和编码序列)的人工组合。例如,嵌合构建体可以包含源自不同来
源的调节序列和编码序列,或者源自相同来源、但是以不同于自然界中存在的方式排列的
调节序列和编码序列。此类构建体可单独使用或可与载体结合使用。如果使用载体,则载
体的选择取决于本领域技术人员熟知的将用于转化宿主细胞的方法。例如,可使用质粒载
体。技术人员熟知为了成功地转化、选择和增殖宿主细胞而必须在载体上存在的遗传元
件。技术人员也会认识到,不同的独立转化事件可导致不同的表达水平和模式(Jones等
人,(1985)EMBO J4:2411-2418;De Almeida等人,(1989)Mol Gen Genetics(《分子与普通遗传学》)218:78-86),从而通常筛选多个事件以获得表现出所需的表达水平和模式的
株系。这种筛选可通过标准的分子生物学测定法、生物化学测定法和其他测定法完成,所
述测定法包括DNA印迹分析、mRNA表达的RNA印迹分析、PCR、实时定量PCR(qPCR)、逆转录
PCR(RT-PCR)、蛋白质表达的免疫印迹分析、酶或活性测定和/或表型分析。
[0200] 本文所用的术语“表达”是指产生前体形式或成熟形式的功能性最终产物(例如mRNA或蛋白质)。
[0201] 术语“引入”意指将核酸(例如表达构建体)或蛋白质提供进细胞中。“引入”包括指代核酸整合进真核或原核细胞中,其中核酸可整合进细胞基因组中,并且该术语包括
指代将核酸或蛋白瞬时提供给细胞。“引入”包括指代稳定或瞬时转化方法以及有性杂交。
因此,在将核酸片段(例如,重组DNA构建体/表达构建体)插入细胞中的语境中,“引入”意指“转染”或“转化”或“转导”,并且包括指代将核酸片段掺入进真核或原核细胞中,其中该核酸片段可掺入进细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中、转化成自主复制子或瞬时表达(例如,转染的mRNA)。
[0202] “成熟”蛋白质是指翻译后加工的多肽(即,已从初级翻译产物移除了任何存在的原肽或前肽所得的多肽)。“前体”蛋白是指mRNA的翻译的初级产物(即,仍存在原肽和前肽)。原肽和前肽可以是但不限于胞内定位信号。
[0203] “稳定转化”是指核酸片段转移进宿主生物体的基因组中,包括核基因组和细胞器基因组二者在内,从而导致遗传上稳定的遗传。相反,“瞬时转化”是指核酸片段转移进宿主生物体的细胞核或其他含DNA的细胞器中,从而导致在不整合或稳定遗传的情况下基因表达。含有转化的核酸片段的宿主生物体称作“转基因”生物体。
[0204] 如本文所用,“转基因”是指在其基因组中包含异源多核苷酸的植物或细胞。通常,异源多核苷酸稳定地整合于基因组内,使得该多核苷酸得以传递至连续世代。异源多核苷酸可以单独整合进基因组中,或者作为表达构建体的一部分整合进基因组中。“转基因”在本文中用于包括其基因型已因异源核酸的存在而变更的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括最初经如此变更的那些转基因物以及通过有性杂交或无性繁殖
从最初的转基因物产生的那些转基因物。本文所用的术语“转基因”不涵盖通过常规植物
育种方法或通过自然发生的事件(如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)进行的基因组(染色体或染色体外基因组)变更。
[0205] 术语“植物”是指整株植物、植物器官、植物组织、种子、植物细胞以及其种子和子代。植物细胞包括但不限于来自种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、苗、配子体、孢子体、花粉和小孢子的细胞。植物部分包括分化的和未分化的组织,包括但不限于根、茎、苗、叶、花粉、种子、瘤组织和各种形式的细胞和培养物(例如,单细胞、原生质体、胚和愈伤组织)。植物组织可以在植物中或者在植物器官、组织或培养物中。术语“植物器官”是指构成植物的形态上和功能上不同的部分的植物组织或者一组组织。术语“基因组”是指生物体每个细胞或病毒或细胞器中存在的全部遗传材料(基因和非编码序列);和/或
作为(单倍体)单位从一个亲本遗传的一整套染色体。“子代”包含植物的任何后续世代。
[0206] 本发明可用于生产杂种植物。植物中引起雄性不育的突变在用于作物例如玉蜀黍的杂种种子生产方法中是有用的。在杂种玉蜀黍种子生产中利用雄性不育植物消除了从用
于产生杂种种子的母本植物耗费大量劳动力来移除雄花(当玉蜀黍是该植物时也称为去
雄)的需要。玉蜀黍中引起雄性不育的突变已通过多种方法如X射线或紫外线照射、化学
处理或转座元件插入(ms23、ms25、ms26、ms32)(Chaubal等人(2000)Am J Bot(《美国植物学杂志》)87:1193-1201)产生。然而,这类方法是随机的诱变,其在整个基因组随机诱导突变而不仅仅在目标基因中。通常,使用这类随机诱变方法,其需要相当多努力来鉴别在目标基因中含有突变的植物并且并不肯定这样的植物将会得到鉴定。此外,使用随机诱变方法,所测试的每种植物有可能携带多个突变。因此,被鉴别在目标基因中具有突变的植物必须
回交几代或更多代以消除不处于目标基因内的不期望的突变。
[0207] 与这类随机诱变方法相比,本发明通过在任何植物中,尤其是任何作物中在目标雄性能育性基因中产生靶向突变或变更提供了用于产生雄性不育植物的改良方法。因为该
突变是靶向目标雄性能育性基因,所以不必对携带随机突变的成千上万的植物群体进行筛
选来鉴别在目标雄性能育性基因中具有突变的植物。此外,在目标基因之外的不期望的突
变极少,并且如果如果发生该不期望的突变,则全部在本发明方法所产生的特定植物中。因此,消除了或至少减少了将植物回交以移除不在目标基因中的不期望的突变的需要。
[0208] 在第一个方面,本发明提供了在植物基因组中的雄性能育性基因中产生靶向修饰的方法。该方法涉及使至少一个在雄性能育性基因中包含靶序列的植物细胞与能够在该靶
序列处诱导双链断裂的工程改造的双链断裂诱导剂接触并然后鉴定至少一个在其基因组
的该靶序列处包含变更的细胞。该方法可还包括再生包含该变更的能育植物或雄性不育植
物。
[0209] 该方法涉及使用能够在包含目标雄性能育性基因中的靶序列的DNA中诱导双链断裂的工程改造的双链断裂诱导剂。本发明的方法不依赖于特定的工程改造的双链断裂诱
导剂,只要该工程改造的双链断裂诱导剂能够在本发明的靶序列中诱导DNA双链断裂。本
文公开的或者本领域知道的任何这种工程改造的双链断裂诱导剂都可在本发明的方法中
使用。此外,本发明涵盖通过本文所公开的或本领域已知的方法产生任何工程改造的双链
断裂诱导剂的使用。
[0210] 本发明的方法包括使至少一个在雄性能育性基因中包含靶序列的植物细胞与能够在该靶序列处诱导双链断裂的工程改造的双链断裂诱导剂接触。这种接触可涉及例如将
包含该双链断裂诱导剂的多肽直接引入植物细胞中或将包含编码该工程改造的双链断裂
诱导剂的核苷酸序列的核酸构建体引入植物细胞中,由此在该细胞中产生该工程改造的双
链断裂诱导剂。该核酸构建体可包含例如可操作连接至编码本发明的工程改造的双链断裂
诱导剂的核苷酸序列的启动子。本文公开的或本领域已知的可驱动该可操作连接的核苷酸
序列在植物细胞中表达的任何启动子均可用于本发明的方法中。
[0211] 如果需要或者必需实现该工程改造的双链断裂诱导剂的胞核定位,则该核苷酸构建体可还包含可操作连接的编码核定位信号的核苷酸序列。本文公开的或本领域已知的可
利于该工程改造的双链断裂诱导剂的核定位的任何核定位信号均可用于本发明的方法中。
这种核定位信号包括但不限于包含SEQ ID NO:2、3或21中所示的氨基酸序列的核定位信
号。
[0212] 本发明的方法涉及在靶序列中产生变更。这种变更包括例如,置换至少一个核苷酸、缺失至少一个核苷酸、插入至少一个核苷酸以及一个或多个置换、缺失和插入的任何组合。
[0213] 在本发明的一个实施例中,变更为转基因的插入。这种转基因可包含例如一个、两个、三个、四个或更多个目标多核苷酸。如果需要,可将目标多核苷酸可操作连接至能够驱动目标多核苷酸在植物中表达的启动子。目标多核苷酸包括但不限于为植物提供农学优点的表型标记和RNA或蛋白质。
[0214] 在本发明的另一个实施例中,雄性能育性基因的靶序列中的变更是无效变更。当植物对这种无效突变而言是纯合的(即,在目标雄性能育性基因处具有两个无效等位基
因)时,该植物为雄性不育。这样一种无效突变可由任何上文所公开的变更(包括例如转基
因的插入)引起。在本发明的某个实施例中,转基因包含表型标记,尤其是选择标记。已经认识到,当该无效突变是由包含表型标记,尤其是选择标记的转基因的插入引起的时,鉴定在目标雄性能育性基因处包含至少一个无效等位基因的植物可包括鉴定包含该表型标记,
尤其是选择标记的植物。
[0215] 本发明的方法可还包括使包含雄性能育性基因中的变更的能育植物自交并选择由该自交导致的子代植物,其中所述子代植物对于该变更而言是纯合的。在本发明的一个
实施例中,该方法还包括使包含作为雄性能育性基因中的无效突变的变更的能育植物自交
并选择由该自交导致的子代植物,其中所述子代植物对于该变更而言是纯合的并且为雄性
不育。
[0216] 在本发明的另一个实施例中,本发明的方法还包括使在雄性能育性基因中包含无效突变的第一能育植物与在雄性能育性基因中包含无效突变的第二能育植物杂交并选择
由该杂交导致的子代植物,其中所述子代植物为雄性不育。该第一和第二雄性不育植物二
者可通过本文所公开的方法产生并且可以是通过本文所公开的方法产生的能育植物的后
代。该第一和第二雄性不育植物可在雄性能育性基因中包含相同的无效突变。或者,该第
一雄性不育植物可在雄性能育性基因中包含第一无效突变,而该第二雄性不育植物可在雄
性能育性基因中包含第二无效突变,其中该第一无效突变与该第二无效突变不同。在本发
明的一个实施例中,第一无效突变包括包含第一表型标记,尤其是第一选择标记的第一转
基因的插入,而第二无效突变包括包含第二表型标记,尤其是第二选择标记的第二转基因
的插入。因而,当第一能育植物与第二能育植物杂交时,包含该第一无效突变和第二无效突变二者的雄性不育子代可鉴定为包含该第一和第二表型标记的那些子代植物。
[0217] 可将本发明的方法用于在植物中的任何雄性能育性基因中产生靶向修饰并因而可在包含雄性能育性基因的任何植物中产生雄性不育植物。目标雄性能育性基因包括但不
限于表1中公开的基因和MS26、MS45、BS92-7、5126和Mscal。
[0218] 在本发明的一个实施例中,本发明的方法涉及在植物(例如玉蜀黍植物或高粱植物)的基因组中在雄性能育性基因MS26中产生靶向修饰。该方法涉及使至少一个在MS26
基因中包含靶序列的植物细胞与能够在该靶序列处诱导双链断裂的工程改造的双链断裂
诱导剂接触并然后鉴定至少一个在其基因组的该靶序列处包含变更(尤其是无效突变)的
细胞。该方法还包括再生包含该变更的能育植物。
[0219] MS26基因中的可用于该实施例的靶序列的例子在TS-MS26(SEQ ID NO:1)中示出。在该例子中,可以使用能够在该靶序列处诱导双链断裂的任何双链断裂诱导剂。
[0220] 可将能够在包含SEQ ID NO:1的TS-MS26靶序列中诱导双链断裂的工程改造的双链断裂诱导剂作为包含可操作连接至编码该工程改造的双链断裂诱导剂的核苷酸序列的
启动子的核苷酸构建体引入植物中。本文公开的或本领域已知的可驱动该可操作连接的编
码该工程改造的双链断裂诱导剂的核苷酸序列在植物细胞中表达的任何启动子均可用于
本发明的方法中。编码工程改造的双链断裂诱导剂的核苷酸序列可选自:SEQ ID NO:4至
7中所示的核苷酸序列;以及与选自SEQ ID NO:4至7中所示的核苷酸序列的至少一个核
苷酸序列具有至少80%核苷酸序列同一性的核苷酸序列。该核酸构建体可还包含可操作连
接的核定位信号。
[0221] 在一个实施例中,通过本发明的方法产生的植物是在雄性能育性基因MS26中包含靶向修饰的高粱植物,其中该MS26基因包含选自SEQ ID NO:63、64、65、66、67、68、69、
70、71、72、73、74、75、76、77和78的核苷酸序列。
[0222] 在本发明的另一个实施例中,本发明的方法涉及在植物(例如玉蜀黍植物)的基因组中在雄性能育性基因MS45中产生靶向修饰。该方法涉及使至少一个在MS45基因中包
含靶序列的植物细胞与能够在该靶序列处诱导双链断裂的工程改造的双链断裂诱导剂接
触并然后鉴定至少一个在其基因组的该靶序列处包含变更(尤其是无效突变)的细胞。该
方法还包括再生包含该变更的能育植物。
[0223] MS45基因中的可用于该实施例的靶序列的例子在TS-MS45靶位点(SEQ ID NO:20)中示出。编码工程改造的双链断裂诱导剂的核苷酸序列可选自:SEQ ID NO:22、23和
34中示出的核苷酸序列;以及与选自SEQ ID NO:22、23和34中示出的核苷酸序列的至少
一个核苷酸序列具有至少80%核苷酸序列同一性的核苷酸序列。该核酸构建体可还包含可
操作连接的核定位信号。
[0224] 在该例子中,可以使用能够在该靶序列处诱导双链断裂的任何双链断裂诱导剂。在一个实施例中,可以使用由SEQ ID NO:22中所示的核苷酸序列编码的第一多肽和由SEQ ID NO:23中所示的核苷酸序列编码的第二多肽。可将能够在TS-MS45靶位点(SEQ ID NO:
20)中诱导双链断裂的工程改造的双链断裂诱导剂作为包含可操作连接至编码该工程改造
的双链断裂诱导剂的核苷酸序列的启动子的核苷酸构建体引入植物中。本文公开的或本领
域已知的可驱动该可操作连接的编码该工程改造的双链断裂诱导剂的核苷酸序列在植物
细胞中表达的任何启动子均可用于本发明的方法中。编码工程改造的双链断裂诱导剂的核
苷酸序列包括但不限于SEQ ID NO:22、23或34中示出的核苷酸序列。该核酸构建体可还
包含可操作连接的核定位信号。
[0225] 在第二个方面,本发明提供在其基因组中包含至少一个具有靶向修饰的雄性能育性基因的植物以及其包含具有靶向修饰的雄性能育性基因中的至少一者的后代。这种靶向
修饰包含上文中所公开的雄性能育性基因中的变更。本发明的植物可通过本文所公开的用
于在植物的基因组中产生靶向修饰的方法制备,所述植物包括但不限于对雄性能育性基因
中的无效突变而言杂合的能育植物、对雄性能育性基因中的无效突变而言纯合的雄性不育
植物以及在雄性能育性基因中包含变更的植物,其中该变更包含转基因的插入。在本发明
的一个实施例中,本发明的植物在其基因组中包含雄性能育性基因中转基因的插入并且这
种插入是无效突变。
[0226] 在第三个方面,本发明提供包含具有至少一个靶向修饰的雄性能育性基因的分离的核酸分子。这种靶向修饰包含一个或多个上文所公开的雄性能育性基因中的变更。
[0227] 在第四个方面,本发明提供分离的植物优化核酸分子,其编码工程改造的双链断裂诱导剂,特别是衍生自I-CreI的工程改造的双链断裂诱导剂,更特别是能够在TS-MS26
或TS-MS45靶序列中诱导DNA双链断裂的衍生自I-CreI的工程改造的双链断裂诱导剂,最
特别是编码工程改造的MS26内切核酸酶或工程改造的MS45内切核酸酶的衍生自I-CreI
的工程改造的双链断裂诱导剂。本发明的核酸分子包括但不限于包含SEQ ID NO:4、5、6、
7、22、23或34中示出的核苷酸序列、编码工程改造的MS26内切核酸酶、工程改造的MS26+
内切核酸酶、工程改造的MS26++内切核酸酶或工程改造的MS45内切核酸酶的核苷酸序列
及其片段或变体的核酸分子。在本发明的一个实施例中,核酸分子包含已经为了在目标植
物中表达而进行优化的核苷酸序列。
[0228] 本发明的组合物包括内切核酸酶,该内切核酸酶为能够在DNA分子的特定识别序列或靶序列中诱导双链断裂的双链断裂诱导剂。具体地讲,本发明提供包含编码内切核酸
酶的核苷酸序列的分离的多核苷酸。本发明涵盖分离的或实质上纯化的多核苷酸或蛋白质
组合物。“分离的”或“纯化的”多核苷酸或蛋白质或其生物活性部分,实质上或基本上不含通常在该多核苷酸或蛋白质的天然环境中存在的、与该多核苷酸或蛋白质相伴随或相互作
用的组分。因此,分离的或纯化的多核苷酸或蛋白质,当通过重组技术产生时实质上不含其他细胞物质或培养基,或者当通过化学法合成时实质上不含化学前体或其他化学物质。最
佳的是,“分离的”多核苷酸不含在衍生该多核苷酸的生物体的基因组DNA中天然位于该多核苷酸的旁侧的序列(即位于该多核苷酸的5′和3′末端的序列)(最佳的是蛋白质编
码序列)。例如,在多个实施例中,分离的多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、
0.5kb或0.1kb的在衍生该多核苷酸的细胞的基因组DNA中天然位于该多核苷酸的旁侧的
核苷酸序列。实质上不含细胞物质的蛋白质包括具有小于约30%、20%、10%、5%或1%
(以干重计)的污染性蛋白质的蛋白质制备物。当本发明的蛋白质或其生物活性部分用重
组法生产时,最佳的是,培养基具有少于约30%、20%、10%、5%或1%(以干重计)的化学前体或非目标蛋白质的化学品。
[0229] 所公开的多核苷酸以及由其编码的蛋白质的片段和变体也为本发明所涵盖。所谓“片段”是意指多核苷酸的一部分或由其编码的氨基酸序列以及蛋白质的一部分。多核苷酸的片段可编码保持所示例的蛋白质的生物活性的蛋白质片段并因而包含靶序列特异性的
内切核酸酶活性,尤其是在如本文所述的TS-MS26或TS-MS45靶位点处的核酸酶活性。因
此,核苷酸序列的片段可在至少约200个核苷酸、约400个核苷酸,并且最多至编码本发明
蛋白质的全长多核苷酸的范围内。
[0230] “变体”旨在意指实质上类似的序列。对于多核苷酸,变体包含具有在5’和/或3’末端的缺失(即截短);具有在天然多核苷酸的一个或多个内部位点处的一个或多个核
苷酸的缺失和/或添加;和/或具有在本文所公开的多核苷酸序列中的一个或多个位点处
的一个或多个核苷酸的置换的多核苷酸。对于多核苷酸,保守变体包括由于遗密码的兼并
性,编码本发明内切核酸酶多肽中的一者的氨基酸序列的那些序列。变体多核苷酸还包括
通过合成法衍生的多核苷酸,如那些例如通过使用定点诱变产生但仍编码本发明的核酸内
切酶蛋白的多核苷酸。通常,通过本文别处所述的序列比对程序和参数测定,本发明的特定多核苷酸的变体将与该特定多核苷酸具有至少约80%、85%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%或更高的序列同一性。
[0231] 本发明的特定多核苷酸(即参考多核苷酸)的变体,还可通过比较变体多核苷酸所编码的多肽与该参考多核苷酸所编码的多肽之间的序列同一性百分数来进行评价。任
何两条多肽之间的序列同一性百分数,可用本文别处描述的序列比对程序和参数来计算。
若任何给定的本发明多核苷酸对是通过比较它们编码的两条多肽所具有的序列同一性百
分数来进行评估,则两条编码的多肽之间的序列同一性百分数为至少约40%、45%、50%、
55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%或更高的序列同一性。
[0232] “变体”蛋白旨在意指通过在天然蛋白质的N末端和/或C末端缺失(所谓的截短)一个或多个氨基酸;在天然蛋白质中的一个或多个内部位点缺失和/或添加一个或多
个氨基酸;或在天然蛋白质中的一个或多个位点置换一个或多个氨基酸。本发明所涵盖的
变体蛋白质是生物活性的,也就是它们继续具有天然蛋白质的所需生物活性,即在如本文
所述的TS-MS26或TS-MS45靶序列处具有核酸酶活性。通过本文其他地方描述的序列比对
程序和参数测定,本发明的内切核酸酶蛋白的生物活性变体将与天然蛋白质的氨基酸序列
具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。本发明的蛋白质的生物活性变体与该蛋白质可相差少至1-15个氨基酸残基,
少至1-10个(如6-10个)、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。
[0233] 本发明的蛋白质可通过多种方式(包括氨基酸置换、缺失、截短和插入)进行变更。这类操纵的方法是本领域公知的。例如,内切核酸酶蛋白的氨基酸序列变体和片段
可通过在DNA中作出突变来制备。诱变和多核苷酸变更的方法是本领域公知的。参见例
如Kunkel(1985)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)82:488-492;Kunkel等人(1987)Methods in Enzymol.(《酶学方法》)154:367-382;美国专利No.4,873,192;
Walker和Gaastra编辑(1983)Techniques in Molecular Biology(《分子生物学技术》)
(纽约的麦克米伦出版公司(MacMillan Publishing Company,New York)),以及其中引用
的参考文献。有关不会影响目标蛋白质的生物活性的适当氨基酸置换的指导可在如下文献
所述的模型中找到:Dayhoff等人,(1978)Atlas of Protein Sequence and Structure(《蛋白序列和结构图表集》)(华盛顿特区的美国国家生物医学研究基金会(Natl.Biomed.Res.
Found.,Washington,D.C.)),将该文献以引用方式并入本文。保守置换,如将一个氨基酸用另一具有相似性质的氨基酸进行交换,可能是最佳的。
[0234] 变体多肽将继续具有在TS-MS26或TS-MS45靶位点处的所需核酸酶活性。显然,将在编码该变体的DNA中所作的突变一定不能将序列设置在阅读框外,并且优选将不会生
成可能产生二级mRNA结构的互补区。参见欧洲专利申请公开No.75,444。
[0235] 本文所涵盖的蛋白质序列的缺失、插入和置换预期不会造成该蛋白质特性的根本变化。然而,当难以在进行置换、缺失或插入之前预测置换、缺失或插入的确切效果时,本领域技术人员将会知道将通过常规的筛选测定法评价该效果(Lucas等人2001Nucl.Acids
Res.(《核酸研究》)29:960-969)。
[0236] 变体多核苷酸和蛋白质还涵盖衍生自诱变和引起重组的程序(如DNA改组)的序列和蛋白质。用这种程序,可操纵一种或多种不同的内切核酸酶序列以产生具有所需性
质的新内切核酸酶。以该方式,从一组相关的多核苷酸序列产生重组多核苷酸的文库,所
述相关的多核苷酸序列包含具有实质的序列同一性且可以在体外或体内同源重组的序列
区。这种DNA改组的策略是本领域已知的。参见例如,Stemmer(1994)Proc.Natl.Acad.
Sci.USA(《美国国家科学院院刊》)91:10747-10751;Stemmer(1994)Nature(《自然》)(《自然》)370:389-391;Crameri等人(1997)Nature Biotech.(《自然生物技术》)15:436-438;
Moore等人(1997)J.Mol.Biol.(《分子生物学杂志》)272:336-347;Zhang等人(1997)
Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)94:4504-4509;Crameri等人(1998)
Nature(《自然》)(《自然》)391:288-291;以及美国专利No.5,605,793和5,837,458。
[0237] 本发明的方法涉及使用一种或多种双链断裂诱导剂。本发明的双链断裂诱导剂可以是任何能识别和/或结合特定多核苷酸识别序列以在该识别序列之处或附近的靶序列
中产生断裂的试剂。双链断裂诱导剂的例子包括但不限于内切核酸酶、位点特异性重组酶、转座酶、拓扑异构酶、TAL效应物核酸酶和锌指核酸酶,并且包括它们的修饰衍生物、变体和片段。
[0238] 识别序列是任何被双链断裂诱导剂特异性识别和/或结合的多核苷酸序列。识别位点序列的长度可变,并且包括例如长度为至少4、6、8、10、12、14、16、18、19、20、21、22、23、
24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、
49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70个或者更多个核苷酸的序列。
[0239] 识别位点有可能是回文的,即一条链上的序列在互补链上从相反方向读起来是一样的。切口/切割位点可在识别序列内部,或者切口/切割位点可在识别序列外部。在另
一个变型形式中,切割可发生在彼此正对着的核苷酸位置处以产生平端切口,或者在其他
情况中,切口可交错以产生单链悬突,也称“粘性末端”,其可以为5′悬突或3′悬突。识别序列可以是内源的或外源的。当识别位点为内源序列时,其可以是被自然发生的或天然的
双链断裂诱导剂识别的识别序列。作为另一种选择,内源识别位点可被经修饰的或经工程
改造的双链断裂诱导剂识别和/或结合,所述经修饰的或经工程改造的双链断裂诱导剂被
设计或选择成特异性识别内源识别序列以产生双链断裂。经修饰的双链断裂诱导剂可衍自
天然的、自然发生的双链断裂诱导剂,或者其可以是人工产生或合成的。
[0240] 有多种方法可用来鉴定那些在识别序列之处或附近具有变更的基因组的细胞,而无须使用可筛选的标记表型。这类方法可认为是直接分析识别序列以检测识别序列中的任
何变化,包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法以及它们的任何组合。
[0241] 蛋白质可通过各种方式进行变更,包括氨基酸置换、缺失、截短和插入。用于这类操作的方法是公知的。例如,可通过在DNA中作出突变来制备蛋白质的氨基酸序列变体。诱变和核苷酸序列变更的方法包括例如Kunkel,(1985)Proc.Natl.Acad.Sci.USA(《美
国国家科学院院刊》)82:488-92;Kunkel等人,(1987)Meth Enzymol(《酶学方法》)154:
367-82;美国专利No.4,873,192;Walker和Gaastra编辑(1983)Techniques in Molecular Biology(《分子生物学技术》)(纽约的麦克米伦出版公司(MacMillan Publishing
Company,New York)),以及其中引用的参考文献。有关不太可能影响蛋白质的生物活性
的氨基酸置换的指导,见于例如Dayhoff等人,(1978)Atlas of Protein Sequence and
Structure(《蛋白序列和结构图表集》)(华盛顿特区的美国国家生物医学研究基金会)的
模型。保守置换,如将一个氨基酸用另一具有相似性质的氨基酸进行交换,可以是优选的。
保守缺失、插入和氨基酸置换预期不会造成蛋白质特征的根本性变化,并且任何置换、缺
失、插入或它们的组合的效果可通过常规筛选测定法进行评价。测定双链断裂诱导活性的
测定法是已知的,一般是测量该试剂对含有识别位点的DNA底物的总体活性和特异性。
[0242] 任何大范围核酸酶均可用作双链断裂诱导剂,包括但不限于I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F-SceI、F-SceII、F-SuvI、F-TeVI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NcIIp、I-NgrIp、I-NitI、I-Nj aI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、
I-SquIP、I-Ssp6803I、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、
PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、PI-TliII或它们的任何变体或衍生物。
[0243] 位点特异性重组酶,也称重组酶,是催化其相容的重组位点之间的保守位点特异性重组的多肽,包括天然多肽以及保留活性的衍生物、变体和/或片段,以及编码保持活性的重组酶的天然多核苷酸、衍生物、变体和/或片段。
[0244] 重组过程中的一个步骤涉及在识别位点之处或附近进行多核苷酸切割。该切割活性可用于产生双链断裂。关于位点特异性重组酶以及它们的识别位点的综述,请参见
Sauer(1994)Curr Op Biotechnol(《生物技术当前述评》)5:521-7;以及Sadowski,(1993)FASEB7:760-7。
[0245] 重组酶的整合酶家族具有超过一百个成员并且包括例如FLP、Cre、λ整合酶和R。已根据活性位点的结构将整合酶家族分组成两类即丝氨酸重组酶和酪氨酸重组酶。酪氨酸
家族包括Cre、FLP、SSV1和lambda(λ)整合酶,使用催化性的酪氨酸的羟基对DNA的磷酸
二酯键进行亲核攻击。通常,酪氨酸家族的成员最初在DNA上产生缺口,然后DNA形成双链
断裂。在包括phiC31(ΦC31)整合酶的丝氨酸重组酶家族中,保守丝氨酸残基形成与DNA
靶位点的共价连接(Grindley等人,(2006)Ann Rev Biochem(《生物化学年鉴》)16:16)。
对于整合酶家族的其他成员,参见例如Esposito等人,(1997)Nucleic Acids Res(《核酸
研究》)25:3605-14以及Abremski等人,(1992)Protein Eng(《蛋白质工程》)5:87-91。
[0246] 其他重组系统包括例如链霉菌(streptomycete)噬菌体phiC31(Kuhstoss等人,(1991)J Mol Biol(《分子生物学杂志》)20:897-908);来自芝田硫化叶菌(Sulfolobus
shibatae)的SSV1位点特异性重组系统(Maskhelishvili等人,(1993)Mol Gen Genet(《分
子与普通遗传学》)237:334-42);以及基于逆转录病毒整合酶的整合系统(Tanaka等人,
(1998)Gene(《基因》)17:67-76)。
[0247] 有时,重组酶是不需要辅因子或超螺旋底物的重组酶,包括但不限于Cre、FLP以及它们的活性衍生物、变体或片段。FLP重组酶催化DNA复制过程中的位点特异性反应
酿酒酵母的两微米质粒的扩增。FLP重组酶催化两个FRT位点之间的位点特异性重组。
FLP蛋白已被克隆和表达(Cox,(1993)Proc.Natl.Acad.Sci.USA(《美国国家科学院院
刊》)80:4223-7)。FLP的功能衍生物、变体和片段是已知的(Buchholz等人,(1998)Nat
Biotechnol(《自然生物技术》)16:617-8;Hartung等人,(1998)J Biol Chem(《生物化学杂志》)273:22884-91;Saxena等人,(1997)Biochim Biophys Acta(《生物化学与生物物理学学报》)1340:187-204;以及Hartley等人,(1980)Nature(《自然》)286:860-4)。
[0248] 噬菌体重组酶Cre催化两个lox位点之间的位点特异性重组(Guo等人,(1997)Nature(《自然》)389:40-6;Abremski等人,(1984)J Biol Chem(《生物化学杂志》)259:
1509-14;Chen等人,(1996)Somat Cell Mol Genet(《体细胞和分子遗传学》)22:477-88;
Shaikh等人,(1977)J Biol Chem(《生物化学杂志》)272:5695-702;以及Buchholz等人,(1998)Nat Biotechnol(《自然生物技术》)16:617-8)。可用来在识别序列处产生双链断
裂的位点特异性重组酶的例子包括例如FLP、Cre、SSV1、λInt、ΦC31、HK022和R。用于植物的位点特异性重组系统的例子可见于美国专利No.5,929,301;美国专利No.6,175,056;
WO99/25821;美国专利No.6,331,661;WO99/25855;WO99/25841和WO99/25840,将
每个专利的内容都以引用方式并入本文。
[0249] 用于修饰动力学性质、辅因子相互作用和要求、表达、最佳条件和/或识别位点特异性以及筛选重组酶和变体的活性的方法是已知的,参见例如Miller等人,(1980)
Cell(《细胞》)20:721-9;Lange-Gustafson和Nash,(1984),J Biol Chem259:12724-32;
Christ等人,(1998)J Mol Biol(《分子生物学杂志》)288:825-36;Lorbach等人,(2000)J Mol Biol(《分子生物学杂志》)296:1175-81;Vergunst等人,(2000)Science(《科学》)290:
979-82;Dorgai等人,(1995)J Mol Biol(《分子生物学杂志》)252:178-88;Dorgai等人,(1998)J Mol Biol(《分子生物学杂志》)277:1059-70;Yagu等人,(1995)J Mol Biol(《分子生物学杂志》)252:163-7;Sclimente等人(2001)Nucleic Acids Res(《核酸研究》)29:
5044-51;Santoro和Schultze,(2002),Proc.Natl.Acad.Sci.USA(《科学院院刊》)99:
4185-90;Buchholz和Stewart,(2001)Nat Biotechnol(《自然生物技术》)19:1047-52;
Voziyanov等人,(2002)Nucleic Acids Res(《核酸研究》)30:1656-63;Voziyanov等人,(2003)J Mol Biol(《分子生物学杂志》)326:65-76;Klippel等人,(1988)EMBO J7:3983-9;
Arnold等人,(1999)EMBO J18:1407-14;WO03/08045;WO99/25840;和WO99/25841。
识别位点从约30个核苷酸微小位点到几百个核苷酸不等。
[0250] 可使用重组酶的任何识别位点,包括天然存在的位点以及变体。变体识别位点是已知的,参见例如Hoess等人,(1986)Nucleic Acids Res(《核酸研究》)14:2287-300;
Albert等人,(1995)Plant J(《植物杂种》)7:649-59;Thomson等人,(2003)Genesis(《起源》)36:162-7;Huang等人,(1991)Nucleic Acids Res(《核酸研究》)19:443-8;Siebler和Bode,(1997),Biochemistry(《生 物 化 学》)36:1740-7;Schlake 和 Bode,(1994)Biochemistry(《生物化学》)33:12746-51;Thygarajan等人,(2001)Mol Cell Biol(《分子和细胞生物学》)21:3926-34;Umlauf和Cox,(1988)EMBO J7:1845-52;Lee和Saito,(1998),Gene(《基因》)216:55-65;WO01/23545;WO99/25821;WO99/25851;WO01/
11058;WO01/07572和美国专利No.5,888,732。
[0251] 重组酶可通过编码重组酶的多核苷酸提供,或者其可通过编码重组酶的经修饰的多核苷酸提供。例如,(编码重组酶的)多核苷酸可经修饰以置换上与天然存在的多核苷
酸序列相比在植物中具有较高使用频率的密码子,或者其可经修饰以置换上与天然存在的
多核苷酸序列相比在玉蜀黍或大豆植物中具有较高使用频率的密码子。
[0252] TAL效应物核酸酶是新的一类序列特异性核酸酶,其可用于在植物或其他生物体的基因组中的特定靶序列处产生双链断裂。TAL效应物核酸酶是通过将天然或经工程改造
的转录激活因子样(TAL)效应物或其功能部分与内切核酸酶(例如FokI)的催化结构域融
合来产生。独特的模化TAL效应物DNA结合结构域使得可以设计具有潜在地任何给定的
DNA识别特异性的蛋白质。因此,可对TAL效应物核酸酶的DNA结合结构域进行工程改造
以识别特定的DNA靶位点,并因此可用来在所需的靶序列处产生双链断裂。参见WO2010/
079430;Morbitzer等人(2010)PNAS10.1073/pnas.1013133107;Scholze和Boch(2010)
Virulence(《毒力》)1:428-432;Christian等人Genetics(《遗传学》)(2010)186:757-761;
Li等人(2010)Nuc.Acids Res.(《核酸研究》)(2010)doi:10.1093/nar/gkq704;以及
Miller等人(2011)Nature Biotechnology(《自然生物技术》)29:143-148;所有这些文献和专利均以引用方式并入本文。
[0253] 转座酶是介导转座子从基因组中的一个位置转座到另一个位置的多肽。转座酶通常诱导双链断裂以切除转座子、识别近末端重复序列以及将切除的转座子的末端合在一
起。在一些系统中,在转座过程中还需要其他蛋白质来将末端合在一起。
[0254] 转座子和转座酶的例子包括但不限于:来自玉蜀黍的Ac/Ds、Dt/rdt、Mu-M1/Mn和Spm(En)/dSpm元件、来自金鱼草的Tam元件、来自噬菌体的Mu转座子、细菌转座子
(Tn)和插入序列(IS)、酵母的Ty元件(逆转录转座子)、来自拟南芥的Ta1元件(逆转录转
座子)、来自果蝇(Drosophila)的P元件转座子(Gloor等人,(1991)Science(《科学》)253:
1110-1117)、来自果蝇的Copia、Mariner和Minos元件、来自家蝇的Hermes元件、来自粉纹夜蛾(Trichplusia ni)的PiggyBack元件、来自秀丽隐杆线虫(C.elegans)的Tc1元件,
以及来自小鼠的IAP元件(逆转录转座子)。在一些例子中,转座酶通过编码转座酶的多核
苷酸提供。
[0255] 有可能通过置换上与天然存在的多核苷酸序列相比在植物中具有较高使用频率的密码子,或者通过置换上与天然存在的多核苷酸序列相比在玉蜀黍或大豆植物中具有较
高使用频率的密码子,来修饰编码转座酶的多核苷酸。
[0256] DNA拓扑异构酶调节DNA二级和更高级结构和主要与复制、转录、重组和修复相关的功能。各种拓扑异构酶共有两种特征:(i)能够在两个相续的酯交换反应中切割和再封
接DNA的磷酸二酯主链;以及(ii)一旦形成拓扑异构酶切割的DNA中间体,该酶能使切断
的DNA末端分开,让另一单链或双链DNA区段通过。DNA拓扑异构酶可被分类为三个进化上
独立的家族:IA型、IB型和II型。
[0257] 那些切割DNA的一条链并容许环状DNA的连接数出现单步骤变化的DNA拓扑异构酶,定义为I型DNA拓扑异构酶。大肠杆菌拓扑异构酶I和拓扑异构酶III、酿酒酵母拓扑
异构酶III以及逆促旋酶属于IA型或I-5′型亚家族,因为蛋白质连接至DNA的5′磷酸。
IB型或I-3′型酶的原型存在于所有的真核生物中,也存在于痘苗病毒拓扑异构酶I中,其
中蛋白质连接至3′磷酸。尽管细菌的酶和真核生物的酶之间在机制和特异性上有差异,但酵母DNA拓扑异构酶I可补充细菌DNA拓扑异构酶I突变体(Bjornsti等人,(1987)Proc.
Natl.Acad.Sci.USA(《美国国家科学院院刊》)84:8971-5)。IA型拓扑异构酶能松开负超螺旋DNA并需要镁和DNA的单链区。拓扑异构酶IB能以同等的效率松开正和负超螺旋DNA,
不需要DNA的单链区或金属离子来发挥功能。
[0258] II型家族包括大肠杆菌DNA促旋酶、大肠杆菌拓扑异构酶IV(par E)、真核生物II型拓扑异构酶和古细菌(archaic)拓扑异构酶VI。II型酶是同型二聚的(真核生物拓扑
异构酶II)或四聚的(促旋酶),能切割双链体的两条链。对于可供利用的拓扑异构酶,优
选的切割位点是已知的。
[0259] 锌指核酸酶(ZFN)是工程改造的双链断裂诱导剂,由锌指DNA结合结构域和双链断裂诱导剂结构域构成。识别位点特异性由锌指结构域赋予,锌指结构域通常包含两个、三个或四个例如具有C2H2结构的锌指,然而其他锌指结构也是已知的并已经经工程改造。锌
指结构域易于设计特异性结合选定的多核苷酸识别序列的多肽。ZFN由与非特异性内切核
酸酶结构域连接的工程改造的DNA结合锌指结构域组成,所述非特异性内切核酸酶结构域
为例如来自IIs型内切核酸酶(如FokI)的核酸酶结构域。可将另外的功能性融合至锌指
结合结构域,包括转录激活因子结构域、转录阻遏蛋白结构域和甲基化酶。在一些例子中,核酸酶结构域的二聚化为切割活性所需。每个锌指能识别靶DNA中的三个连续碱基对。例
如,若一个3锌指结构域识别9个连续核苷酸的序列,由于该核酸酶要求二聚化,则将两组
锌指三联体用于结合一条18个核苷酸的识别序列。一条18个核苷酸的识别序列的长度足
18 10
以在哺乳动物基因组中是独特的(4 =6.9×10 )。
[0260] 到目前为止,设计的锌指模块主要识别GNN和ANN三联体(Dreier等人,(2001)J Biol Chem(《生物化学杂志》)276:29466-78;Dreier等人,(2000)J Mol Biol(《分
子生物学杂志》)303:489-502;Liu等人(2002)J Biol Chem(《生物化学杂志》)277:
3850-6),但使用CNN或TNN三联体也是已知的(Dreier等人,(2005)J Biol Chem(《生
物化学杂志》)280:35588-97;Jamieson等人,(2003)Nature Rev Drug Discov(《自然评论:药物发现》)2:361-8)。还可参见Durai等人,(2005)Nucleic Acids Res(《核酸研
究》)33:5978-90;Segal,(2002)Methods(《方法》)26:76-83;Porteus和Carroll,(2005)Nat Biotechnol(《自然生物技术》)23:967-73;锌指协会(网站www.zincfinger.org);
Pabo等人,(2001)Ann Rev Biochem(《生物化学年评》)70:313-40;Wolfe等人,(2000)Ann Rev Biophys Biomol Struct(《生物物理和生物分子结构年评》)29:183-212;Segal和
Barbas,(2001)Curr Opin Biotechnol12:632-7;Segal等人,(2003)Biochemistry(《生物化学》)42:2137-48;Beerli和Barbas,(2002)Nat Biotechnol(《自然生物技术》)20:
135-41;Carroll等人,(2006)Nature Protocols(《自然实验手册》)1:1329;Ordiz等人,(2002)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)99:13290-5;Guan等人,(2002)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)99:13296-301;WO2002099084;WO00/
42219;WO02/42459;WO2003062455;美国专利申请公开No.20030059767;美国专利申请
公开No.2003/0108880;美国专利No.6,140,466、6,511,808和6,453,242。
[0261] 作为另一种选择,可将工程改造的锌指DNA结合域与其他保持DNA切口产生/切割活性的双链断裂诱导剂或其衍生物融合。例如,该类型的融合可用于将双链断裂诱导剂
导向至不同的靶位点,用以改变缺口或切割位点的位置、用以将诱导剂导向较短的靶位点
或用以将诱导剂导向较长的靶位点。在一些例子中,将锌指DNA结合域与保持DNA切口产
生/切割活性的位点特异性重组酶、转座酶、拓扑异构酶或它们的衍生物融合。
[0262] 有可能通过编码锌指核酸酶的多核苷酸提供锌指核酸酶。该编码锌指核酸酶的多核苷酸可通过置换上与天然存在的多核苷酸序列相比在植物中具有较高使用频率的密码
子,或者通过置换上与天然存在的多核苷酸序列相比在玉蜀黍或大豆植物中具有较高使用
频率的密码子来进行修饰。
[0263] 充分的同源性或序列同一性表明两个多核苷酸序列具有充分的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度,以及多核苷酸的序
列相似性。序列相似性可通过序列的总长度上的序列同一性百分数,和/或通过包含局部
相似性的保守区域(如具有100%序列同一性的连续核苷酸)以及序列长度的一部分上的
序列同一性百分数来描述。
[0264] 靶标和供体多核苷酸具有的同源性或序列同一性的量可变,包括总长度和/或具有在以下范围内的单位整数值的区域:约1-20bp、20-50bp、50-100bp、75-150bp、
100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、
450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、
1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb或最多至该靶位点的总长度并包括该靶位点的总长度。这些范围包括该范围内的每个整数,例如1-20bp的范围包括1、2、
3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可通过两条多核苷酸的全比对长度上的序列同一性百分数来描述,所述序列同一性百分数包括约至少
50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、
81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%或100%的序列同一性百分数。充分的同源性包括多核苷酸长度、全局序列同一性百分数和连续核苷酸的任选保守的区域或者局部序列同一性百分数的任何
组合,例如充分的同源性可描述为75-150bp的与靶基因座区域具有至少80%序列同一性
的区域。充分的同源性也可通过所预测的两条多核苷酸在高严格条件下特异性杂交的能力
来描述,参见例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual(《分子克隆:实验室手册》),(纽约冷泉港实验室出版社);Current Protocols in Molecular Biology(《现代分子生物学实验手册》),Ausubel等人编辑(1994)Current Protocols(《现代实验手册》),(格林出版格林出版联合公司和约翰威立父子公司(Greene Publishing
Associates,Inc.and John Wiley&Sons,Inc)); 以 及 Tijssen,(1993)Laboratory
Techniques in Biochemistryand Molecular Biology--Hybridization with Nucleic
Acid Probes(《生物化学和分子生物学实验室技术——核酸探针杂交》),(纽约爱思唯尔
出版公司(Elsevier,New York))。
[0265] 可采用任何手段将改变双子叶植物细胞的基因组所需的各种组分合在一起。例如,在体外系统中,可通过使各组分在适于DNA切割的条件下接触来提供双链断裂诱导剂
和包含识别位点的多核苷酸。
[0266] 作为另一种选择,已知有多种方法可用来将核苷酸序列和多肽引入生物体中,包括例如转化、有性杂交在内,以及将多肽、DNA或mRNA引入细胞中。
[0267] 用于接触、提供和/或引入组合物到各种生物体中的方法是已知的,包括但不限于稳定转化方法、瞬时转化方法、病毒介导的方法和有性育种。稳定转化表示所引入的多核苷酸整合进生物体的基因组中并能够被其子代遗传。瞬时转化表示所引入的组合物仅仅在
生物体中暂时表达或者存在。
[0268] 用于将多核苷酸或多肽引入进植物中的方案可根据作为转化靶标的植物或植物细胞的类型(如单子叶植物或双子叶植物)而异。将多核苷酸和多肽引入植物
细胞并随后插入进植物基因组中的合适方法包括显微注射(Crossway等人,(1986)
Biotechniques(《生物技术》)4:320-34和美国专利No.6,300,543)、分生组织转化(美
国 专利 No.5,736,369)、电穿 孔(Riggs 等 人,(1986)Proc.Natl.Acad.Sci.USA(《美
国国家科学院院刊》)83:5602-6)、土壤杆菌(Agrobacterium)介导的转化(美国专
利No.5,563,055和No.5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J3:
2717-22)和弹道粒子加速(美国专利No.4,945,050;No.5,879,918;No.5,886,244;
No.5,932,782;Tomes等人,(1995)“Direct DNA Transfer into Intact Plant Cells
via Microprojectile Bombardment”,载于Plant Cell,Tissue,and Organ Culture:
Fundamental Methods,Gamborg和Phillips编辑(Springer-Verlag,柏林);McCabe等人,(1988)Biotechnology(《生物技术》)6:923-6;Weissinger等人,(1988)Ann Rev Genet(《遗传学年评》)22:421-77;Sanford等人,(1987)Particulate Science and Technology(《微粒科学与技术》)5:27-37(洋葱);Christou等人,(1988)Plant Physiol(《植物生理
学》)87:671-4(大豆);Finer和McMullen,(1991)In Vitro Cell Dev Biol(《体外细胞与发育生物学》)27P:175-82(大豆);Singh等人,(1998)Theor Appl Genet(《理论与应用遗传学》)96:319-24(大豆);Datta等人,(1990)Biotechnology(《生物技术》)8:736-40(水稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)85:4305-9(玉蜀黍);Klein等人,(1988)Biotechnology(《生物技术》)6:559-63(玉蜀黍);美国专利
No.5,240,855;No.5,322,783和No.5,324,646;Klein等人,(1988)Plant Physiol(《植物生理学》)91:440-4(玉蜀黍);Fromm等人,(1990)Biotechnology(《生物技术》)8:833-9(玉蜀黍);Hooykaas-Van Slogteren等人,(1984)Nature(《自然》)311:763-4;美国专利
No.5,736,369(谷物);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA(《美国国家科学
院院刊》)84:5345-9(百合科(Liliaceae));De Wet等人,(1985)载于The Experimental Manipulation of Ovule Tissues(《胚珠组织的实验操纵》),Chapman等人编辑(纽约
朗文(Longman,New York)),第197-209页(花粉);Kaeppler等人,(1990)Plant Cell
Rep(《植物细胞报道》)9:415-8)以及Kaeppler等人,(1992)Theor Appl Genet(《理论
和应用遗传学》)84:560-6(晶须介导的转化);D’Halluin等人,(1992)Plant Cell(《植物细胞》)4:1495-505(电穿孔);Li等人,(1993)Plant Cell Rep(《植物细胞报道》)12:
250-5;Christou和Ford(1995)Annals Botany(《植物年鉴》)75:407-13(水稻)以及
Osjoda等人,(1996)Nat Biotechnol(《自然生物技术》)14:745-50(玉蜀黍,通过根癌土壤杆菌(Agrobacterium tumefaciens)),
[0269] 作为另一种选择,可通过使植物与病毒或病毒核酸接触来将多核苷酸引入植物中。一般地讲,这种方法涉及将多核苷酸掺入在病毒DNA或RNA分子内。在一些例子中,
可最初将目标多肽作为病毒多聚蛋白质的一部分合成,然后在体内或体外通过蛋白水解加
工该多聚蛋白质而产生所需的重组蛋白。涉及病毒DNA或RNA分子的、用于将多核苷酸引
入植物中并表达其中所编码的蛋白质的方法是已知的,参见例如美国专利No.5,889,191、
No.5,889,190、No.5,866,785、No.5,589,367和No.5,316,931。瞬时转化方法包括但不限
于直接引入多肽如双链断裂诱导剂进生物体中、引入多核苷酸如DNA和/或RNA多核苷酸、
引入RNA转录物如编码双链断裂诱导剂的mRNA进生物体中。这类方法包括例如显微注射
或粒子轰击。参见例如Crossway等人,(1986)Mol Gen Genet(《分子与普通遗传学》)202:
179-85;Nomura等人,(1986)Plant Sci(《植物科学》)(《植物科学》)44:53-8;Hepler等人,(1994)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)91:2176-80;以及Hush等人,(1994)J Cell Sci(《细胞科学杂志》)107:775-84。
[0270] 标准的DNA分离、纯化、分子克隆、载体构建和验证/表征方法是完善确立的,参见例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual(《分子克隆:实验室手册》),(纽约冷泉港实验室出版社)。载体和构建体包括包含目标多核苷酸和任选的其他组分的环状质粒和线状多核苷酸,所述其他组分包括接头、衔接子、调节区、内含子、限制位点、增强子、隔离子、选择标记、目标核苷酸序列、启动子和/或其他有助于载体构建或分析的位点。在一些例子中,识别位点和/或靶位点可包含在内含子、编码序列、5′UTR、
3′UTR和/或调节区内。
[0271] 任何启动子都可使用,并且可根据所需的结果来选择。启动子是参与RNA聚合酶和其他蛋白质的识别和结合以起始转录的DNA区域。植物启动子是能够起始在植物细胞
中的转录的启动子;关于植物启动子的综述,请参见Potenza等人,(2004)In Vitro Cell Dev Biol(《体外细胞与发育生物学》)40:1-22。组成型启动子包括例如WO99/43838
和美国专利No.6,072,050中公开的Rsyn7启动子的核心启动子以及其他组成型启动子;
CaMV35S核心启动子(Odell等人,(1985)Nature(《自然》)313:810-2);水稻肌动蛋白
(McElroy等人,(1990)Plant Cell(《植物细胞》)2:163-71);遍在蛋白(Christensen等
人,(1989)Plant Mol Biol(《植物分子生物学》)12:619-32;Christensen等人,(1992)Plant Mol Biol(《植物分子生物学》)18:675-89);pEMU(Last等人,(1991)Theor Appl Genet(《理论和应用遗传学》)81:581-8);MAS(Velten等人,(1984)EMBO J3:2723-30);
ALS启动子(美国专利No.5,659,026),等等。其他的组成型启动子在例如如下美国专
利中 描述:No.5,608,149;No.5,608,144;No.5,604,121;No.5,569,597;No.5,466,785;
No.5,399,680;No.5,268,463;No.5,608,142和No.6,177,611。在一些例子中,可使用诱导型启动子。病原体感染后诱导的病原体诱导型启动子包括但不限于那些调节PR蛋白、SAR
蛋白、β-1,3-葡聚糖酶、几丁质酶等的表达的启动子。
[0272] 可将化学调节启动子用于通过施加外源化学调节剂来调控基因在植物中的表达。该启动子可以是化学诱导型启动子,其中化学剂的施加可诱导基因表达,或者是化学
阻遏型启动子,其中化学剂的施加可阻遏基因表达。化学诱导型启动子包括但不限于玉蜀
黍In2-2启动子,其由苯磺酰胺除草剂安全剂激活(De Veylder等人,(1997)Plant Cell
Physiol(《植物细胞生理学》)38:568-77);玉蜀黍GST启动子(GST-II-27,WO93/01294),其由用作萌前除草剂的疏水亲电子化合物激活;以及烟草PR-1a启动子(Ono等人,(2004)
Biosci Biotechnol Biochem(《生物科学、生物技术与生物化学》)68:803-7),其由水杨酸激活。其他化学调控启动子包括类固醇响应启动子(参见例如,糖皮质素诱导型启动子
(Schena等人,(1991)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)88:10421-5;
McNellis等人,(1998)Plant J(《植物杂志》)14:247-257);四环素诱导型和四环素阻遏型启动子(Gatz等人,(1991)Mol Gen Genet(《分子与普通遗传学》)227:229-37;美国专利No.5,814,618和No.5,789,156)。
[0273] 组织偏好启动子可用来靶向特定的植物组织内的增强的表达。组织偏好的启动子包括例如Kawamata等人,(1997)Plant Cell Physiol(《植物细胞生理学》)38:792-803;
Hansen等人,(1997)Mol Gen Genet(《分子与普通遗传学》)254:337-43;Russell等
人,(1997)Transgenic Res(《转基因研究》)6:157-68;Rinehart等 人,(1996)Plant
Physiol(《植物生理学》)112:1331-41;Van Camp等人,(1996)Plant Physiol(《植物生理学》)112:525-35;Canevascini等人,(1996)Plant Physiol(《植物生理学》)112:513-524;
Lam,(1994)Results Probl Cell Differ(《细胞分化的结果与问题》)20:181-96;以及
Guevara-Garcia等人,(1993)Plant J(《植物杂志》)4:495-505。叶偏好的启动子包括
例如Yamamoto等人,(1997)Plant J(《植物杂志》)12:255-65;Kwon等人,(1994)Plant Physiol(《植物生理学》)105:357-67;Yamamoto等人,(1994)Plant Cell Physiol(《植物细胞生理学》)35:773-8;Gotor等人,(1993)Plant J(《植物杂志》)3:509-18;Orozco等人,(1993)Plant Mol Biol(《植物分子生物学》)23:1129-38;Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)90:9586-90;Simpson等人,(1958)EMBO J4:
2723-9;Timko等人,(1988)Nature(《自然》)318:57-8。根偏好的启动子包括例如Hire
等人,(1992)Plant Mol Biol(《植物分子生物学》)20:207-18(大豆根特异性谷氨酰胺
合酶基因);Miao等人,(1991)Plant Cell(《植物细胞》)3:11-22(细胞质谷氨酰胺合酶
(GS));Keller和Baumgartner,(1991)Plant Cell(《植物细胞》)3:1051-61(法国菜豆的GRP1.8基因中的根特异性控制元件);Sanger等人,(1990)Plont Mol Biol(《植物分子生
物学》)14:433-43(根瘤土壤杆菌甘露氨酸合酶(MAS)的根特异性启动子);Bogusz等人,
(1990)Plant Cell(《植物细胞》)2:633-41(从糙叶山黄麻(Parasponia andersonii)和山黄麻(Trema tomentosa)分离的根特异性启动子);Leach和Aoyagi,(1991)Plant Sci(《植物科学》)79:69-76(毛根土壤杆菌(A.rhizogenes)rolC和rolD根诱导基因);Teeri等
人,(1989)EMBO J8:343-50(土壤杆菌损伤诱导的TR1’和TR2’基因);VfENOD-GRP3基
因启动子(Kuster等人,(1995)Plant Mol Biol(《植物分子生物学》)29:759-72);以
及rolB启动子(Capana等人,(1994)Plant Mol Biol(《植物分子生物学》)25:681-91;
phaseolin基因(Murai等人,(1983)Science(《科学》)23:476-82;Sengopta-Gopalen等
人,(1988)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)82:3320-4)。还可参见
美 国 专 利 No.5,837,876;No.5,750,386;No.5,633,363;No.5,459,252;No.5,401,836;
No.5,110,732和No.5,023,179。
[0274] 种子偏好的启动子包括种子发育过程中活跃的种子偏好启动子和在种子萌发过程中活跃的种子萌发启动子。参见Thompson等人,(1989)BioEssays10:108。种子偏好的
启动子包括但不限于Cim1(细胞分裂素诱导的信息);cZ19B1(玉蜀黍19kDa玉蜀黍蛋白);
以及milps(肌-肌醇-1-磷酸合酶)(WO00/11177;和美国专利6,225,529)。对于双子
叶植物,种子偏好的启动子包括但不限于豆类β-菜豆球蛋白、油菜籽蛋白、β-伴球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等。对于单子叶植物,种子偏好启动子包括但不
限于玉蜀黍15kDa玉蜀黍蛋白基因启动子、22kDa玉蜀黍基因启动子、27kDaγ玉蜀黍基因
启动子、waxy基因启动子、shrunken1基因启动子、shrunken2基因启动子、球蛋白1基因启动子、油质蛋基因启动子和nucl。还可参见WO00/12733,其中公开了来自END1和END2
基因的种子偏好启动子。
[0275] 表型标记是可筛选或可选择的标记,其包括可视标记和可选择标记,无论其是阳性还是阴性选择标记。可使用任何表型标记。具体地讲,可选择或可筛选的标记包含这样
的DNA区段,该DNA区段使得可以常常在特定条件下鉴定或者选取或者不选取含有它的分
子或细胞。这些标记可编码活性,例如但不限于RNA、肽或蛋白质的产生,或者可为RNA、肽、蛋白质、无机和有机化合物或组合物等提供结合位点。
[0276] 选择标记的例子包括但不限于:包含限制酶位点的DNA区段;编码能提供对原本有毒的化合物的抗性的产物的DNA区段,所述有毒化合物包括抗生素如壮观霉素、氨苄青
霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT));
编码原本在受体细胞中缺乏的产物的DNA区段(例如tRNA基因、营养缺陷型标记);编码
可容易鉴定的产物的DNA区段(例如表型标记如β-半乳糖苷酶、GUS;荧光蛋白如绿色荧
光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP),以及细胞表面蛋白);PCR新引物位点的产生(例如两个之前不并置的DNA序列的并置)、限制性内切
核酸酶或其他DNA修饰酶、化学剂等不作用或者作用的DNA序列的加入;以及使其得以鉴定
的特定修饰(例如甲基化)所需的DNA序列的加入。
[0277] 另外的选择标记包括能赋予对除草化合物如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)的抗性的基因。参见例如Yarranton,(1992)Curr Opin Biotech(《生物技术新见》)3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)89:6314-8;Yao等人,(1992)Cell(《细胞》)71:63-72;Reznikoff,(1992)Mol Microbiol(《分子微生物学》)6:2419-22;Hu等人,(1987)Cell(《细胞》)48:555-66;Brown等人,(1987)Cell(《细胞》)49:603-12;Figge等人,(1988)Cell(《细胞》)52:713-22;
Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)86:5400-4;
Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)86:2549-53;
Deuschle等人,(1990)Science(《科学》)248:480-3;Gossen,(1993)博士论文,海德堡大学(University of Heidelberg);Reines等人,(1993)Proc.Natl.Acad.Sci.USA(《美
国国家科学院院刊》)90:1917-21;Labow等人,(1990)Mol Cell Biol(《分子和细胞生物学》)10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)88:
5072-6;Wyborski等人,(1991)Nucleic Acids Res(《核酸研究》)19:4647-53;Hillen和Wissman,(1989)Topics Mol Struc Biol(《分子结构生物学专题》)10:143-62;Degenkolb等人,(1991)Antimicrob Agents Chemother(《(抗微生物剂和化学疗法》)35:1591-5;
Kleinschnidt等人,(1988)Biochemistry(《生物化学》)27:1094-104;Bonin,(1993)博士论文,海德堡大学;Gossen等人,(1992)Proc.Natl.Acad.Sci.USA(《美国国家科学院院干》)89:5547-51;Oliva等人,(1992)Antimicrob Agents Chemother(《抗微生物剂和化学疗法》)36:913-9;Hlavka等人,(1985)Handbook of Experimental Pharnacology(《实验药理学手册》),第78卷(柏林施普林格(Springer-Verlag,Berlin));Gill等人,(1988)
Nature(《自然》)334:721-4。
[0278] 可采用常规条件培养具有所引入的序列的细胞或使其再生成植物,参见例如McCormick等人,(1986)Plant Cell Rep(《植物细胞报道》)5:81-4。然后可培养该植物,并用相同转化株或用不同转化株或未转化株进行授粉,并鉴定出具有所需特性和/或包含
所引入的多核苷酸或多肽的所得子代。可培养两代或更多代以确保多核苷酸得到稳定保持
和遗传,并收获种子。
[0279] 可使用任何植物,包括单子叶植物和双子叶植物。可使用的单子叶植物的例子包括但不限于玉米(玉蜀黍)、水稻(Oryza sativa)、黑麦(Secale cereale)、高
粱(Sorghum bicolor,Sorghum vulgore)、小米(如珍珠粟(Pennisetum glaucum)、黄
米(Panicum miliaceum)、谷子(Setaria italica)、龙爪稷(Eleusine coracana))、小
麦(Triticum aestivum)、甘蔗(Saccharum spp.)、燕麦(Avena)、大麦(Hordeum)、菠萝
(Ananas comosus)、香蕉(Musa spp.)、棕榈、观赏植物和草。可使用的双子叶植物的例子包括但不限于大豆(Glycine max)、卡诺拉油菜(Brassica napus和B.campestris)、苜蓿
(Medicago sativa)、烟草(Nicotiana tabacum)、拟南芥(Arabidopsis thaliana)、向日葵(Helianthus annuus)、棉花(Gossypium arboreum)和花生(Arachis hypogaea)、西红柿
(Solanum lycopersicum)、铃薯(Solanum tuberosum)等。
[0280] 目标转基因、重组DNA分子、DNA序列以及目标多核苷酸可包含一种或多种目标基因。这类目标基因可编码例如为植物提供农学优势的蛋白质。目标基因可反映作物开发的
参与者的商业市场和利益。目标作物和市场在变化,并且随着发展中国家打开世界市场,也将出现新的作物和技术。另外,随着对农学性状和特性如产率和杂种优势的理解的增加,对用于转化的基因的选择将会相应变化。目标基因的大体类别包括例如涉及信息的那些基因
(如锌指)、涉及通信的那些基因(如激酶)和涉及看家的那些基因(如热休克蛋白)。转
基因的更具体类别例如包括编码对农学、昆虫抗性、病害抗性、除草剂抗性、不育性、谷粒特征和商业产品重要的性状的基因。一般而言,目标基因包括涉及油脂、淀粉水化合物或营养物质代谢的那些基因以及影响仁大小、蔗糖载量等的那些基因。
[0281] 除了使用传统的育种方法之外,还可在遗传上变更对农学上重要的性状如油含量、淀粉含量和蛋白质含量。修饰包括提高油酸、饱和油和不饱和油的含量,提高赖氨酸和硫的水平,提供必需氨基酸以及淀粉的修饰。在美国专利No.5,703,049、No.5,885,801、
No.5,885,802和No.5,990,389中描述了Hordothionin蛋白修饰,将这些专利以引用的方
式并入本文。另一个例子是美国专利No.5,850,016中描述的富含赖氨酸和/或硫的由大
豆2S白蛋白编码的种子蛋白以及Williamson等人(1987),Eur.J.Biochem.(《欧洲生化
杂志》)165:99-106中所述的来自大麦的胰凝乳蛋白抑制剂,以上专利文献的公开内容以引用的方式并入本文。
[0282] 可通过定点诱变产生编码序列的衍生物来增加预选氨基酸在所编码的多肽中的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因衍生自大麦胰凝乳蛋白酶抑制剂,
1996年11月1日提交的系列号为08/740,682的美国专利申请以及WO98/20133,将
以上专利文献的公开内容以引用的方式并入本文。其他蛋白质包括富含甲硫氨酸的植物
蛋白,例如来自向日葵种子的该蛋白质(Lilley等人(1989)Proceedings of the World
Congress on Vegetable Protein Utilization in Human Foods and Animal Feedstuffs,Applewhite编辑(伊利诺州香槟市的美国油脂化学家协会(American Oil Chemists
Society,Champaign,Illinois)),第497-502页;以引用的方式并入本文);来自玉米的该蛋白质(Pedersen等人(1986)J.Biol.Chem.(《生物化学杂志》)261:6279;Kirihara等人,(1988)Gene(《基因》)71:359;两篇文献均以引用方式并入本文);以及来自水稻的该蛋白质(Musumura等人(1989)Plant Mol.Biol.(《植物分子生物学》)12:123,其以引用方式并入本文)。其他农学上重要的基因编码胶乳、Floury2、生长因子、种子贮藏因子和转录因子。
[0283] 昆虫抗性基因可以编码针对严重影响产量的害虫的抗性,所述害虫例如是根虫、切根虫、欧洲玉米螟等。这类基因包括(例如)苏金芽孢杆菌(Bacillus thuringiensis)
毒性蛋白基因(美国专利No.5,366,892;5,747,450;5,736,514;5,723,756;5,593,881;
和Geiser等人(1986)Gene(《基因》)48:109);等等。
[0284] 编码病害抗性性状的基因包括解毒基因,如对抗funonosin的解毒基因(美国专利No.5,792,931);无毒力(avr)和病害抗性(R)基因(Jones等人(1994),Science(《科
学》)266:789;Martin等人,(1993)Science(《科学》)262:1432;以及Mindrinos等人,(1994),Cell(《细胞》)78:1089);等等。
[0285] 除草剂抗性性状可包括编码针对能抑制乙酰乳酸合酶(ALS)的作用的除草剂的抗性的基因,特别是磺酰脲型除草剂(例如含有导致这种抗性的突变的乙酰乳酸合酶
(ALS)基因,所述突变特别是S4和/或Hra突变),编码针对能抑制谷氨酰胺合酶的作用
的除草剂,如草胺膦或basta的抗性的基因(例如bar基因);草甘膦(例如EPSPS基因和
GAT基因;参见例如美国公开No.20040082770和WO03/092360);或者本领域已知的其他
此类基因。bar基因编码对除草剂basta的抗性,nptII基因编码针对抗生素卡那霉素和遗
传霉素的抗性,ALS基因突变体编码针对除草剂氯磺隆的抗性。
[0286] 不育性基因也可编码在表达盒中,为物理去雄提供备选方案。以这种方式使用的基因的例子包括雄性组织偏好基因和具有雄性不育表型的基因(如QM),在美国专利
No.5,583,210中有描述。其他基因包括激酶和编码对雄配子体或雌性配子体发育有毒的化
合物的那些。可如US7,969,405和US7,612,251中所述通过破坏淀粉积聚来实现对花粉的
形成、功能或散播的干扰。
[0287] 谷粒的质量反映在诸如以下的性状:饱和及不饱和油的水平和类型、必需氨基酸的质量和数量、纤维素的水平。在玉米中,经修饰的hordothionin蛋白在美国专利
No.5,703,049、No.5,885,801、No.5,885,802和No.5,990,389中有描述。
[0288] 还可在(一种或多种)基因上编码商业性状,所述基因可增加例如用于乙醇生产的淀粉,或提供蛋白质的表达。转化植物的另一个重要商业应用是生产聚合物和生物塑料,如美国专利No.5,602,321中所述。诸如β-酮基硫解酶、PHB酶(聚羟基丁酸合酶)和乙
酰乙酰辅酶A还原酶之类的基因(参见Schubert等人(1988)J.Bacteriol.(《细菌学杂
志》)170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达。
[0289] 外源产物包括植物酶和产物以及来自包括原核生物和其他真核生物在内的其他来源的那些。这类产物包括酶、辅因子、激素等等。可增加蛋白质,特别是具有改善的氨基酸分布以改善植物营养价值的修饰蛋白质的水平。这可通过表达具有提高的氨基酸含量的
这类蛋白质来实现。
[0290] 目标转基因、重组DNA分子、DNA序列以及目标多核苷酸可包含一种或多种用于基因沉默的DNA序列。涉及在植物中表达DNA序列的基因沉默方法是本领域已知的,包括但
不限于共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、含内含子的发夹
RNA(ihpRNA)干扰、转录基因沉默以及微RNA(miRNA)干扰。
[0291] 共抑制可用于抑制植物基因的表达以产生对于由这些基因编码的蛋白质而言具有不可检测的蛋白质水平的植物。参见例如Broin等人(2002)Plant Cell(《植物细胞》)
(《植物细胞》)14:1417-1432。共抑制还可用来抑制同一植物中的多种蛋白质的表达。参见例如美国专利No.5,942,657。使用共抑制来抑制植物中的内源基因的表达的方法在如
下文献和专利中有描述:Flavell等人(1994)Proc.Natl.Acad.Sci.USA(《美国国家科学院
院刊》)91:3490-3496;Jorgensen等人(1996)Plant Mol.Biol.(《植物分子生物学》)31:
957-973;Johansen和Carrington(2001)Plant Physiol.(《植物生理学》)126:930-938;
Broin等人(2002)Plant Cell(《植物细胞》)14:1417-1432;Stoutjesdijk等人(2002)
Plant Physiol.(《植物生理学》)129:1723-1731;Yu等人(2003)Phytochemistry(《植
物化学》)63:753-763;以及美国专利No.5,034,323、No.5,283,184和No.5,942,657;
将上面的每篇文献和专利以引用方式并入本文。共抑制的效率可通过在表达盒中在有
义序列的3′和多聚腺苷酸化信号的5′位置包括多聚dT区来提高。参见美国专利公
布No.20020048814,将该文献以引用的方式并入本文。通常,这种核苷酸序列与内源基
因的转录物的序列具有相当大的序列同一性,优选的是高于约65%的序列同一性,更优
选的是高于约85%的序列同一性,最优选的是高于约95%的序列同一性。参见美国专利
No.5,283,184和No.5,034,323;将这些文献以引用方式并入本文。
[0292] 反义抑制还可用来抑制同一植物中的多种蛋白质的表达。参见例如美国专利No.5,942,657。此外,反义核苷酸的部分可用来破坏靶基因的表达。一般而言,可使用至
少50个核苷酸、100个核苷酸、200个核苷酸、300个、400个、450个、500个、550个或更多个的序列。使用反义抑制来抑制植物中的内源基因的表达的方法在例如如下文献和专利
中描述:Liu等人(2002)Plant Physiol.(《植物生理学》)129:1732-1743以及美国专利
No.5,759,829和No.5,942,657,将上述文献中的每一者以引用的方式并入本文。反义抑制
的效率可通过在表达盒中在反义序列的3′和聚腺苷酸化信号的5′位置处包括多聚dT区
来提高。参见美国专利公布No.20020048814,将该文献以引用的方式并入本文。
[0293] 使用反义抑制来抑制植物中的内源基因的表达的方法在例如如下文献和专利中描述:Waterhouse等人(1998)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)95:
13959-13964;Liu等人(2002)Plant Physiol.(《植物生理学》)129:1732-1743;以及
WO99/49029、WO99/53050、WO99/61631和WO00/49035;将上面的每篇文献和专利
以引用方式并入本文。
[0294] hpRNA干扰的方法在Waterhouse和Helliwell(2003)Nat.Rev.Genet.4:29-38及其中引用的参考文献中有描述。这些方法在抑制内源基因表达方面是高度有效的。参见
例如Chuang和Meyerowitz(2000)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)97:
4985-4990;Stoutiesdijk等人(2002)Plant Physiol.(《植物生理学》)129:1723-1731;
以及Waterhouse和Helliwell(2003)Nat.Rev.Genet.4:29-38。使用hpRNA干扰来抑制
或沉默基因的表达的方法在例如如下文献和专利中描述:Chuang和Meyerowitz(2000)
Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)97:4985-4990;Stoutjesdijk等人
(2002)Plant Physiol.(《植物生理学》)129:1723-1731;Waterhouse和Helliwell(2003)Nat.Rev.Genet.4:29-38;Pandolfini等人BMC Biotechnology3:7,以及美国专利公布
No.20030175965;将上面的每篇文献和专利以引用方式并入本文。hpRNA构建体体内沉默
基因表达的效率的瞬时测定法已由Panstruga等人(2003)Mol.Biol.Rep.(《分子生物学报
道》)30:135-140进行了描述,将该文献以引用方式并入本文。
[0295] 对于ihpRNA,干扰分子具有与hpRNA相同的总体结构,但该RNA分子另外还包含内含子,该内含子能够在表达该ihpRNA的细胞中被剪接。内含子的使用使得发夹RNA
分子中的环区大小在剪接后最小化,这可提高干扰的效率。参见例如Smith等人(2000)
Nature(《自然》)407:319-320。事实上,Smith等人显示使用ihpRNA介导的干扰100%抑
制了内源基因表达。使用ihpRNA干扰来抑制内源植物基因的表达的方法例如在Smith等
人(2000)Nature(《自然》)407:319-320中有描述。Wesley等人(2001)Plant J.(《植物
杂志》)27:581-590;Wang和Waterhouse(2001)Curr.Opin.Plant Biol.(《植物生物学新
见》)5:146-150;Waterhouse和Helliwell(2003)Nat.Rev.Genet.4:29-38;Helliwell和Waterhouse(2003)Methods(《方法》)30:289-295以及美国专利公布No.20030180945,将上面每篇专利和文献以引用的方式并入本文。
[0296] 转录基因沉默(TGS)可通过使用hpRNA构建体来实现,在所述构建体中,发夹的反向重复序列与待沉默的基因的启动子区域具有序列同一性。将hpRNA加工成可与同源
启动子区发生相互作用的短RNA可触发降解或甲基化而导致沉默(Aufsatz等人(2002)
PNAS(《美国国家科学院院刊》)99(增刊4):16499-16506;Mette等人(2000)EMBO J19(19):
5194-5201)。
[0297] 对靶蛋白的表达的抑制可通过表达编码微RNA(miRNA)的基因进行RNA干扰来获得。miRNA是由约22个核糖核苷酸组成的调节剂。miRNA在抑制内源基因的表达方面高度
有效。参见例如Javier等人(2003)Nature(《自然》)425:257-263,将该文献以引用方式
并入本文。对于miRNA干扰,将表达盒设计成表达模仿内源miRNA基因的RNA分子。niRNA
基因编码形成发夹结构的RNA,该发夹结构含有与另一内源基因(靶序列)互补的、具有22
个核苷酸的序列。miRNA分子在抑制内源基因的表达方面高度有效,并且它们所诱导的RNA
干扰被后续各代植物遗传。
[0298] 同源重组的频率受多个因素影响。不同的生物体在同源重组的量和同源与非同源重组的相对比例方面不同。一般地讲,同源性区域的长度影响同源重组事件的频率,同源性区域越长,频率越高。为观察到同源重组而需要的同源性区域的长度也是随物种而异的。
在许多情况下,至少5kb的同源性已被利用,但在少至25-50bp的同源性的情况下就已观
察到同源重组。所需要的最小同源性长度,已估计在大肠杆菌中为20-50bp(Singer等人,
(1982)Cell(《细胞》)31:25-33;Shen和Huang,(1986)Genetics(《遗传学》)112:441-57;
Watt等人,(1985)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)82:4768-72)、在
酿酒酵母中为63-89bp(Sugawara和Haber,(1992)Mol Cell Biol(《分子和细胞生物
学》)12:563-75),而在哺乳动物细胞中为163-300bp(Rubnitz和Subramani,(1984)Mol
Cell Biol(《分子和细胞生物学》)4:2253-8;Ayares等人,(1986)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)83:5199-203;Liskay等人,(1987)Genetics(《遗传学》)115:
161-7)。
[0299] 同源重组在昆虫中已得到证明。在果蝇中,Dray和Gloor发现,少至3kb的总模板:靶标同源性就足够以适当的效率将大的非同源DNA区段复制进靶标中(Dray和Gloor,
(1997)Genetics(《遗传学》)147:689-99)。Golic等人采用在果蝇中的靶标FRT处进行FLP介导的DNA整合,显示当供体和靶标具有4.1kb的同源性时,与1.1kb的同源性时相比,整
合效率大约高10倍(Golic等人,(1997),Nucleic Acids Res(《核酸研究》),25:3665)。
来自果蝇的数据表明,2-4kb的同源性对于有效靶向是足够的,但是有一些证据证明低得多的同源性(约30bp至约100bp范围内)可能就足够(Nassif和Engels,(1993)Proc.Natl.
Acad.Sci.USA(《美国国家科学院院刊》)90:1262-6;Keeler和Gloor,(1997)Mol Cell
Biol(《分子和细胞生物学》)17:627-34)。
[0300] 也在其他生物体中实现了同源重组。例如,在寄生性原生动物利什曼虫(Leishmania)中进行同源重组需要至少150-200bp的同源性(Papadopoulou和Dumas,
(1997)Nucleic Acids Res(《核酸研究》)25:4278-86)。在丝状真菌构巢曲霉(Aspergillus nidulans)中,用少至50bp旁侧同源性实现了基因置换(Chaveroche等人,(2000)Nucleic
Acids Res(《核酸研究》)28:e97)。在纤毛虫嗜热四膜虫(Tetrahymena thermophila)中也证明了靶向基因置换(Gaertig等人,(1994)Nucleic Acids Res(《核酸研究》)22:5391-8)。
在哺乳动物中,使用可在培养物中培养、转化、选择和引入小鼠胚胎中的多能胚胎干细胞系(ES),同源重组在小鼠中已经是最成功的。带有插入的转基因ES细胞的胚胎可发育成遗
传上嵌合的后代。通过将同胞小鼠进行杂种繁殖,可获得携带选定的基因的纯合小鼠。该
方法的综述在如下文献中提供:Watson等人,(1992)Recombinant DNA(《重组DNA》),第2版,(科学美国人图书(Scientific American Books),WH Freeman&Co.发行);Capecchi,(1989),Trends Genet(《遗传学趋势》),5:70-6;以及Bronson,(1994)J Biol Chem(《生物化学杂志》)269:27155-8。由于缺乏能够移植到卵母细胞或发育的胚胎中的干细胞,在小鼠以外的哺乳动物中的同源重组曾是有限的。然而,McCreath等人,Nature(《自然》)405:
1066-9(2000)报道了通过在原代胚胎成纤维细胞中进行转化和选择在绵羊中成功进行了
同源重组。
[0301] 易错DNA修复机制可在双链断裂位点产生突变。非同源末端连接(NHEJ)途径是将断裂的末端连接在一起的最普通的修复机制(Bleuyard等人,(2006)DNA Repair(《DNA
复制》)5:1-12)。染色体的结构完整性通常通过修复来保持,但是缺失、插入或其他重排是可能的。一个双链断裂的两个末端是NHEJ最普遍的底物(Kirik等人,(2000)EMBO J19:
5562-6),然而如果出现两个不同的双链断裂,则来自不同断裂的游离端可被连接并导致染色体缺失(Siebert和Puchta,(2002)Plant Cell(《植物细胞》)14:1121-31),或不同染色体之间的染色体易位(Pacher等人,(2007)Genetics(《遗传学》)175:21-9)。
[0302] 也可将附加型DNA分子连接进双链断裂中,例如将T-DNA整合进染色体双链断裂中(Chilton和Que,(2003)Plant Physiol(《植物生理学》)133:956-65;Salomon和Puchta,(1998)EMBO J17:6086-95)。一旦双链断裂周围的序列被变更,例如被涉及双链断裂成熟
的外切核酸酶活性变更,则如果存在同源序列,如非分裂的体细胞中的同源染色体,或DNA复制后的姊妹染色单体的话,基因转换途径可恢复初始结构(Molinier等人,(2004)Plant Cell(《植物细胞》)16:342-52)。异位DNA序列和/或表观遗传DNA序列也可充当DNA修
复模板用于同源重组(Puchta,(1999)Genetics(《遗传学》)152:1173-81)。
[0303] 植物细胞基因组的变更,例如通过同源重组(HR)变更,是遗传工程的强大工具。尽管高等植物中的同源重组频率低,但还是有植物内源基因同源重组的少数成功例子。植
物中同源重组的参数已主要通过拯救(rescue)所引入的截短的选择性标记基因进行了研
究。在这些实验中,同源DNA片段通常在0.3kb至2kb之间。观察到的同源重组频率大约为
-4 -5
10 至10 。参见例如Halfter等人,(1992)Mol Gen Genet(《分子与普通遗传学》)231:
186-93;Offringa等人,(1990)EMBO J9:3077-84;Offringa等人,(1993)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)90:7346-50;Paszkowski等人,(1988)EMBO J7:4021-6;
Hourda和Paszkowski,(1994)Mol Gen Genet(《分子与普通遗传学》)243:106-11;以及
Risseeuw等人,(1995)Plant J(《植物杂志》)7:109-19。
[0304] 使用含有与靶基因同源约7kb的区域的靶向载体,在拟南芥中靶向内源非选择-4
基因,靶向频率估计为至少3.9×10 (Maio和Lam,(1995),Plant J(《植物杂志》),7:
359-65)。在另一个例子中,使用阳性-阴性选择方案和含有与靶标同源最多22.9kb的
-5
序列的靶向载体,检测到同源重组的频率低于5.3×10 ,尽管有大的旁侧序列可供重组
(Thykjaer等人,(1997)Plant Mol Biol(《植物分子生物学》)35:523-30)。在拟南芥中,使用靶向构建体通过同源重组敲除了AGL5MADS盒基因,该靶向构建体由插入AGL5序列中
(大约离5′末端3kb和离3′末端2kb)的卡那霉素抗性盒组成。在所产生的750个卡
那霉素抗性转基因株系中,有一个株系含有预期的插入(Kempin等人,(1997)Nature(《自
然》)389:802-3)。Hanin等人利用与编码原卟啉原氧化酶的拟南芥PPO基因的3kb5′末
-4
端和2kb3′末端同源性,获得了基础频率为7×10 的同源重组事件(Hanin等人,(2001)
Plant J(《植物杂志》)28:671-7)。Terada等人使用土壤杆菌介导的转化程序靶向了水
稻中的Waxy基因座。将形式为设置在T-DNA的两个末端的两个拷贝的白喉毒素基因的阴
性选择用于消除T-DNA的随机整合,从而使得可以在选定的材料中富集稀有的同源重组事
件,并且它们的重组系统从仅仅150粒水稻种子产生了数千个事件。在没有包含用于增强
-3
同源重组的元件的情况下,水稻中waxy基因的同源重组频率据报道为0.65×10 (Terada
等人,(2002)Nat Biotech(《自然生物技术》)20:1030-4)。
[0305] 到目前为止,DNA双链断裂(DSB)似乎是每个受试生物体中刺激同源重组途径的有效因素(Puchta等人,(1995)Plant Mol Biol(《植物分子生物学》)28:281-92;Tzfira和White,(2005)Trends Biotechnol(《生物技术趋势》)23:567-9;Puchta,(2005)J Exp Bot(《实验植物学杂志》))56:1-14)。使用DNA断裂剂,在植物中人工构建的同源DNA重复序列之间观察到同源重组增加两倍至九倍(Puchta等人,(1995)Plant Mol Biol(《植物分
子生物学》)28:281-92)。在玉蜀黍原生质体中,用线状DNA分子进行的实验证明质粒之间的同源重组增强(Lyznik等人,(1991)Mol Gen Genet(《分子与普通遗传学》)230:209-18)。
[0306] 使用稀有切割酶以及转座子如Ac和Mutator研究了DSB对同源重组的影响(Chiurazzi等人,(1996)Plant Cell(《植物细胞》)8:2057-66;Puchta等人,(1996)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)93:5055-60;Xiao和Peterson,(2000)Mol Gen Genet(《分子与普通遗传学》)263:22-9;以及Shalev和Levy(1997)Genetics(《遗
传学》)146:1143-51)。Chiurazzi等人(1996)Plant Cell(《植物细胞》)8:2057-66使
用HO内切核酸酶将DSB引入拟南芥染色体中并观察到HO识别位点旁侧的重复序列之间的
同源重组频率提高了10倍。Ac转座元件的切除也以甚至更高的频率刺激了所述元件旁侧
的重复序列之间的同源重组(Xiao和Peterson(2000)Mol Gen Genet(《分子与普通遗传
学》)263:22-9)。
[0307] Puchta等人报道,当使用I-SceI产生DSB时,人工靶基因座处的同源重组频率提高最多达两个数量级(Puchta等人,(1996)Proc.Natl.Acad.Sci.USA(《美国国家科学院
院刊》)93:5055-60)。在Puchta等人报道的实验中,通过用两个分别的土壤杆菌菌株进行共接种,将I-SceI表达盒与靶向构建体一起引入进转基因烟草靶株系中。含有靶向构建体
的T-DNA与靶位点之间的同源重组重构了卡那霉素抗性基因(nptII)。同源重组的频率与
I-SceI表达盒的量之间有明显的相关性,从而表明DSB越多产生的同源重组频率越高。
[0308] 在烟草中使用锌指核酸酶(ZFN),在预先引入的人工靶位点处获得了高频率的同源重组(Wright等人,(2005)Plant J(《植物杂志》)44:693-705)。将锌指核酸酶表达盒
和供体DNA通过共电穿孔引入进原生质体中,并通过卡那霉素抗性和GUS活性监测靶向修
饰。在大约每10个转化株中观察到一个修饰事件,然而如DNA印迹分析所指示,只有20%
的修饰事件含有所需的同源重组产物。
[0309] 锌指核酸酶是具有变更的特异性的工程改造的内切核酸酶,例如通过将工程改造的DNA结合域与内切核酸酶(例如FokI)融合(Durai等人,(2005)Nucleic Acids Res(《核
酸研究》)33:5978-90;Mani等人,(2005)Biochem Biophys Res Comm(《生物化学和生物物理研究通讯》)335:447-57)。Wright等人以及Lloyd等人报道使用锌指核酸酶在整合进
烟草或拟南芥染色体DNA中的DNA靶位点处作出高频率诱变(Wright等人,(2005)Plant
J(《植物杂志》)44:693-705;Lloyd等人,(2005)Proc.Natl.Acad.Sci.USA(《美国国家科学院院刊》)102:2232-7)。使用设计的能识别烟草内源乙酰乳酸合酶(ALS)基因座的锌指
核酸酶,引入了已知能赋予针对咪唑啉酮和磺脲除草剂的抗性的突变ALS基因以替换内源
ALS基因,替换频率为超过2%的转化细胞(Townsend等人,(2009),Nature(《自然》)459:
442-5)。内源基因的敲除和转基因的表达可通过基因靶向同时实现。使用设计的锌指核酸
酶,靶向了编码玉蜀黍种子中的植酸生物合成最终步骤中所需的肌醇-1,3,4,5,6-五磷酸
2-激酶的IPK1基因,以通过同源重组插入编码草胺膦乙酰转移酶对草铵膦除草剂(如双丙
氨膦)的耐受性的PAT基因。插入PAT基因来破坏IPK1基因在发育的种子中同时导致了除
草剂耐受性和预期的肌醇磷酸谱(profile)变更(Shukla等人(2009)Nature(《自然》)459:
437-41)。
[0310] 重组酶的丝氨酸家族的成员在重组位点处产生双链断裂,作为它们的催化活性的一部分(Grindley等人,(2006)Ann Rev Biochem(《生物化学年评》)16:16)。甜橙中的
R/RS系统似乎诱导了RS位点的突变,从而导致与位点特异性重组反应本身不相关的染色
体缺失(Ballester等人,(2006)Plant Cell Rep(《植物细胞报道》)26:39-45)。
[0311] 另一个方法采用对现有的归巢内切核酸酶进行蛋白质工程改造以变更它们的靶标特异性。归巢内切核酸酶如I-SceI或I-CreI能结合和切割相对较长的DNA识别序列
(分别为18bp和22bp)。这些序列据预测在基因组中很少天然发生,通常仅1或2个位
点/基因组。可通过对DNA结合结构域处的氨基酸置换进行合理设计和/或对突变的单体
进行组合性装配和选择,来改变归巢内切核酸酶的切割特异性(参见例如Arnould等人,
(2006)J Mol Biol(《分子生物学杂志》)355:443-58;Ashworth等人,(2006)Nature(《自然》)441:656-9;Doyon等人,(2006)J Am Chem Soc(《美国化学会志》)128:2477-84;
Rosen等人,(2006)Nucleic Acids Res(《核酸研究》)34:4791-800;以及Smith等人,
(2006)Nucleic Acids Res(《核酸研究》)34:e149;Lyznik等人(2009)美国专利申请公
开No.20090133152A1;Smith等人(2007)美国专利申请公开No.20070117128A1)。已证明
了经工程改造的大范围核酸酶能切割同种突变位点而不扩大它们的特异性。将对野生型酵
母I-SceI归巢核酸酶具有特异性的人工识别位点引入玉蜀黍基因组中,检测到当转基因
I-SceI通过杂交引入并通过基因切除激活时,在1%的被分析的F1植物中存在识别序列的
突变(Yang等人,(2009)Plant Mol Biol(《植物分子生物学》)70:669-79)。更实际的是,使用基于I-CreI大范围核酸酶序列设计的工程改造的单链内切核酸酶靶向玉蜀黍无舌叶
基因座(liguleless locus)。当通过土壤杆菌介导的对不成熟胚的转化来引入设计的归巢
核酸酶时,在3%的T0转基因植物中检测到选定的无舌叶基因座识别序列的突变(Gao等人
(2010)Plant J(《植物杂志》)61:176-87)。
[0312] 细胞的DNA修复机制是进行转化以引入外源DNA或诱导内源基因的突变的基础。DNA同源重组是细胞使用同源序列修复DNA损伤的专DNA修复方式。在植物中,
DNA同源重组发生频率过低而不能用于转化,直至发现该过程可通过DNA双链断裂来刺
激(Bibikova等人(2001)Mol.Cell Biol.(《分子细胞生物学》)21:289-297;Puchta和
Baltimore(2003)Science(《(科学》)300:763;Wright等人(2005)Plant J.(《植物杂
志》)44:693-705)。
[0313] 实例
[0314] 如下实例中进一步限定了本发明,其中份数和百分数是以重量计,度是指摄氏度,除非另有规定。应当理解,这些实例虽然说明本发明的各实施例,但仅以举例说明的方式给出。由以上讨论和这些实例,本领域技术人员可确定本发明的基本特征,并且在不脱离本发明的精神和范围的前提下,可作出本发明的各种变化和修改以使本发明适合于各种应用和条件。这类修改也当视为落入所附权利要求的范围内。
[0315] 缩写词的含义如下:“sec”指秒,“min”指分钟,“h”指小时,“d”指天,“μL”指微升、“mL”指毫升,“L”指升,“μM”指微摩尔/升、“mM”指毫摩尔/升,“M”指摩尔/升,“mmol”指毫摩尔,“μmol”旨微摩尔,“g”旨克,“μg”旨微克,“ng”旨纳克,“U”指单位,“bp”指碱基对,“kb”指千碱基。
[0316] 实例1
[0317] DNA双链断裂诱导的内源靶位点变更
[0318] 当DNA双链断裂诱导剂识别并切割基因组中的靶位点处的特定识别序列时,形成DNA双链断裂,从而触发细胞DNA修复机制以动员修复可能对细胞致命的损伤。该过程可在
植物转化中用来特异性地在靶位点处引入突变,以敲除位于靶位点处的基因或在靶位点处
插入目标供体DNA。一旦形成DNA双链断裂,取决于所涉及的DNA构建体的设计和DNA的实
际修复过程,可获得不同的结果服务于不同的转化目的。
[0319] 对于简单的位点特异性基因突变,必须在同一细胞中存在含有识别序列的靶位点(图1A)和能特异性识别该识别序列的DNA双链断裂剂如内切核酸酶(图1B)。在内切核
酸酶识别并切割该DNA后,两个游离末端可凭借细胞DNA修复机构通过末端接合来修复,而
无需任何外部因子的介入。该两个末端可被修复至其初始状态,从而没有变化可检测到,或者它们可在修复前被变更,从而导致在它们再次连接后有可检测的变化,如该识别序列以
及可能额外周围序列的一个或多个核苷酸被缺失(图1F)。突变通过该后一过程在靶位点
处引入。
[0320] 为实现位点特异性DNA插入,细胞中除了存在靶位点和内切核酸酶之外,还必须同时存在含有目标DNA的供体DNA。供体DNA可在目标DNA的旁侧含有与位于靶位点旁侧
的DNA序列相同的DNA序列,即同源序列(图1C)。目标DNA可通过同源重组插入在靶位点
处(图1E),这是一个受靶位点处的DNA双链断裂刺激的过程。供体DNA也可仅含有目标
DNA而不含任何旁侧同源序列(图1D)。目标DNA仍可被插入在靶位点处,但通过非同源重
组以较不可预测的方式插入。类似地,在DNA末端被修复时恰好存在的非相关DNA都可插
入在靶位点处(图1G)。可在同一转化实验中同时获得不同的结果(图1E-G)。
[0321] 可将体内产生DNA双链断裂的任何手段用作DNA双链断裂诱导剂如最通常使用的识别超过18bp的序列的大范围核酸酶,该长度足以使序列在大多数基因组中是独特的。许
多大范围核酸酶已被发现并表征为识别许多不同的序列,但这类序列在重要的作物如大豆
或玉蜀黍中通常不天然存在。即使类似的序列可见于作物基因组中,但这些序列的有限数
目仍太小而以致不可用。可对某些大范围核酸酶如I-CreI以使得其将不再优先识别野生
型I-CreI的识别序列而是将优先识别特定选择的目标序列的方式通过蛋白质工程进行修
饰。利用I-CreI内切核酸酶的灵活性,可以设计并制备经修饰的I-CreI来切割基因组中
选择的靶位点,并随后在该选定的靶位点处引入突变或插入目标基因。该方法所提供的精
确遗传工程改造将解决传统植物转化方法(如土壤杆菌感染和生物射弹轰击)目前所面临
的许多问题,如不可预测的整合、不需要的内源基因破坏、未预测到的转基因表达等等。
[0322] 实例2
[0323] 通过使用工程改造的MS26内切核酸酶对细胞色素P450样基因MS26进行靶向诱变产生的雄性不育玉蜀黍植物
[0324] ZmMS26为用于在玉蜀黍中产生位于染色体1的短臂上的雄性不育突变的目标基因座。玉蜀黍MS26基因(SEQ ID NO:8;AF366297)由五个外显子组成,其编码的氨基酸序
列(SEQ ID NO12;AAK52956.1)与CYP704B1-Zm基因(玉蜀黍细胞色素P450单加氧酶的大
(超过26个基因)家族的成员)具有相当大的同源性。催化活性所必需的血红素结构域存
在于第五个外显子中(美国专利No.7517975)。玉蜀黍MS26基因的无效突变可引起花药室
中小孢子发育的过早终止,因为该基因涉及花粉壁形成(Li等人(2010)Plant Cell(《植物
细胞》);22:173)。在该区域中的移码或过早终止突变预计可敲除玉蜀黍MS26基因功能。
[0325] 一种经工程改造的基于I-CreI的归巢内切核酸酶(称为工程改造的MS26内切核酸酶)能够在玉蜀黍MS26基因中产生双链断裂,从而导致引入可敲除MS26蛋白的功能的
突变。该过程是有利的因为其不需要专用的选择步骤或对常规转化方案的修改。如所期望
的,MS26编码序列处的单核苷酸缺失或插入产生了不育玉蜀黍植物。
[0326] A.TS-MS26靶位点和工程改造的MS26内切核酸酶
[0327] 选择定为“TS-MS26”靶位点(SEQ ID NO:1)的靶位点用于设计定制的双链断裂诱导剂。TS-MS26靶位点为一22bp多核苷酸,位置距离玉蜀黍MS26基因的第五个外显子的5′末端62bp,并且具有如下序列:
[0328] gatggtgacgtac^gtgccctac(SEQ ID NO:1)。
[0329] 双链断裂位点和悬突区域带有下划线;酶在C13之后切割,如通过^所指示的。基于I-CreI归巢内切核酸酶设计三种工程改造的内切核酸酶的植物优化核苷酸序列(编码
工程改造的MS26内切核酸酶的SEQ ID NO:4;编码工程改造的MS26+内切核酸酶的SEQ ID
NO:5和7;编码工程改造的MS26++内切核酸酶的SEQ ID NO:6)以在选定的TS-MS26靶位
点(SEQ ID NO:1)处结合并产生双链断裂。
[0330] B.编码工程改造的MS26内切核酸酶和用于通过同源重组进行转基因整合的修复DNA的植物表达载体的载体构建
[0331] 使用标准的分子生物学技术构建包含适当的工程改造的内切核酸酶的表达盒的载体。
[0332] 植物表达盒含有编码工程改造的MS26内切核酸酶的植物密码子优化核苷酸序列以为了在玉蜀黍细胞中性能更佳。这些植物优化序列还补充有编码核定位信号的DNA序
列,对于工程改造的MS26内切核酸酶,该信号添加至蛋白质(SEQ ID NO:2)的N-末端,对
于工程改造的MS26++内切核酸酶,该信号添加至SEQ ID NO:3的N-末端。玉蜀黍泛素启
动子和马铃薯蛋白酶抑制剂II基因终止子序列完成了该基因设计。在一些情况下,通过将
ST-LS1内含子添加至第一内切核酸酶单体的编码序列来另外修饰编码工程改造的MS26+
内切核酸酶的植物优化核苷酸序列(SEQ ID NO:5)以消除其在大肠杆菌和土壤杆菌中的
表达(SEQ ID NO7)。含有编码工程改造的MS26++内切核酸酶的植物优化核苷酸序列(SEQ
ID NO:6)的表达盒还含有插入进第一单体的编码序列中以便消除其在大肠杆菌和土壤杆
菌中的表达的ST-LS1内含子,并且其密码子序列针对GC含量进行了优化。
[0333] 将这些表达盒插入进T-DNA中,该T-DNA也配有BAR或moPAT选择标记基因从而允许在含有双丙氨磷的培养基上选择转基因事件。对于在TS-MS26靶位点处的突变未应用
选择。
[0334] C.转基因植物的制备
[0335] 通过(Djukanovic等人2006)中所述的改良的土壤杆菌介导的转化程序转化玉蜀黍(玉米)未成熟胚。从灭菌仁解剖出十到十一天龄的未成熟胚(1.3-1.8mm)并放置
进2ml液体培养基[4.0g/L N6基础盐(Sigma C-1416;美国密苏里州圣路易斯的西格玛
奥德里奇公司(Sigma-Aldrich Co.,St.Louis,MO,USA))、1.0ml/L Eriksson’s维生素混合物(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L2,4-二氯苯氧乙酸(2,4-D)、
0.690g/L L-脯氨酸、68.5g/L蔗糖、36.0g/L葡萄糖,pH5.2]中。将土壤杆菌悬浮液稀
释至在550nm下的光学密度为0.175。将含有胚的培养基用1ml的土壤杆菌悬浮液替换并让
胚在室温下温育五分钟。温育后,将胚(40枚胚/板)胚轴向下转移至容纳有4.0g/L N6
基础盐(Sigma C-1416)、1.0ml/L Eriksson’s维生素混合物(Sigma E-1511)、1.0mg/
L盐酸硫胺素、1.5mg/L2,4-D、0.690g/L L-脯氨酸、30.0g/L蔗糖、0.85mg/L硝酸
盐、0.1nM乙酰丁香酮、3.0g/L Gelrite,pH5.8的板上。将胚在21℃下于暗处温育3-4
天,然后转移至含有4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson’s维生素
混合物(Sigma E-1511)、0.5mg/L盐酸硫胺素、1.5mg/L2,4-D、0.690g/L L-脯氨酸、
30.0g/L蔗糖、0.5g/L2-(N-吗啉)乙磺酸(MES)缓冲液、0.85mg/L硝酸盐、100mg/L
羧苄青霉素和8g/L Sigma琼脂的培养基上来在28℃下于暗处另外温育十天。然后将胚转
移(19枚胚/板)至容纳有4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson’s
维生素混合物(Sigma E-1511)、0.5mg/L盐酸硫胺素、1.5mg/L2,4-D、0.69g/L L-脯
氨酸、30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸盐、1.5mg/L双丙氨磷、
100mg/L羧苄青霉素、8.0g/L琼脂,pH5.8的新板上并在28℃下置于暗处。三周后,将
应答的愈伤组织(7个愈伤组织/板)分培至含有4.0g/L N6基础盐(Sigma C-1416)、
1.0ml/L Eriksson’s维生素混合物(Sigma E-1511)、0.5mg/L盐酸硫胺素、1.5mg/
L2,4-D、0.69g/L L-脯氨酸、30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸盐、
3.0mg/L双丙氨磷、100mg/L羧苄青霉素、8.0g/L琼脂,pH5.8的培养基上。在28℃下
暗处五周后,通过将小量的选定组织转移至再生培养基(1个转基因事件/板)上来诱导体
细胞胚胎发生,该培养基含有4.3g/L Murashige and Skoog(MS)盐(Gibco11117;纽约格
兰德岛的Gibco公司(Gibco,Grand Island,NY))、5.0ml/L MS维生素储备溶液(Sigma
M3900)、100mg/L肌-肌醇、0.1μM脱落酸(ABA)、1mg/L吲哚乙酸(IAA)、0.5mg/L玉
米素、60.0g/L蔗糖、3.0mg/L双丙氨磷、100mg/L羧苄青霉素、6.0g/L超纯琼脂,
pH5.6。将板在28℃下于暗处温育2-3周。将所有具有可见的苗和根的材料转移(每个事
件5-10棵苗/板)至含有4.3g/LMS盐(Gibco11117)、5.0ml/L MS维生素储备溶液
(Sigma M3900)、100mg/L肌-肌醇40.0g/L蔗糖、3mg/L双丙氨磷、100mg/L苯菌
灵(Benomyl)6.0g/LBacto-琼脂,pH5.6的培养基上,并在28℃下于人造光下温育。一周
后,将小植物移进容纳有除双丙氨磷的相同培养基的玻璃管(1棵小植物/管)中并在人造
光下培养直至对它们进行采样和/或移植进土壤中。
[0336] 通过土壤杆菌介导的对未成熟玉蜀黍胚的转化递送四个版本的编码靶向TS-MS26靶位点的工程改造的内切核酸酶的植物优化序列(SEQ.ID NO:4、SEQ.ID NO:5、SEQ ID NO:
6或SEQ.ID NO:7)。制备了超过1,000株T0植物,每棵植物再生自在含有1.5mg/L双丙
氨磷的培养基上选择的独立愈伤组织。转化效率代表了产生转化事件的共同培养的胚的百
分比。对于工程改造的MS26内切核酸酶,转化频率为14%至35%;这在有记录的用于以类
似土壤杆菌菌株遗传转化玉蜀黍胚的其他基因的常规转化频率之内。
[0337] D.筛选TS-MS26靶位点处的突变以及选择突变植物。
[0338] 通过PCR扩增TS-MS26靶位点区域并随后用在TS-MS26靶位点内切割的BsiWI限制酶消化,然后将限制酶消化产物进行凝胶电泳来针对在TS-MS26靶位点处的突变对T0植
物进行筛选。用BsiWI不能完成对PCR扩增的靶位点的切割指示已发生突变。在300株
来自使用SEQ ID NO:5的转化实验的T0植物中鉴定了三个突变的MS26等位基因(表2),
在257株分析的来自使用SEQ ID NO:7的实验的T0植物中鉴定了三个突变的MS26等位基
因。在使用SEQ ID NO:4的转化实验中未发现突变型MS26等位基因。当SEQ ID NO:6用
于转化实验中时观察到最高的突变等位基因频率,在344株分析的T0植物中产生15个突
变(表2)。
[0339] 结果在表2中给出。突变率表示在TS-MS26靶位点处含有突变的T0分析植物的百分比。T0植物中存在的突变ms26等位基因在由工程改造的内切核酸酶产生的表观3′
末端GTAC悬突的中间(图2)。
[0340] 表2。
[0341] 表达工程改造的内切核酸酶的T0玉蜀黍植物在TS-MS26靶位点处的突变率
[0342]
[0343] 处于开花时的T0植物在图8中示出。与由工程改造的MS26++内切核酸酶产生的T0双等位基因事件(带标签的植物)相比,含有一个突变的ms26等位基因的T0植物(两
株外侧的植物)的生长和发育没有明显不同(A)。该双等位基因事件是不育的(花期时雄
穗显示处于来自单等位基因事件的两个雄穗之间)(B)。
[0344] 将选定的在内源MS26基因中含有一个核苷酸插入(ms26-Ci)或一个核苷酸缺失(ms26-Td)的T0植物在温室中培养并自花传粉以产生T1子代植物。通过在T1植物的叶
DNA样品上进行的PCR测定法测定T1植物中存在的MS26等位基因。T1子代中ms26-Ci(一
个核苷酸插入)和ms26-Td(一个核苷酸缺失)等位基因的分离在表3中示出。
[0345] 表3。
[0346] 来自自花传粉的T0植物的子代的分离数据。
[0347]
[0348] E.由在TS-MS26靶位点处的突变诱导的不育性。
[0349] 将衍生自两株初始的T0植物(各在MS26基因中携带突变(ms26-Ci和ms26-Td))自交的T1玉蜀黍姊妹株在标准的生长条件下栽培。图9A示出了开花时的衍生自每个T0事
件的一株杂合MS26/ms26-植物和一株纯合ms26-/ms26-植物。所有植物在株高上是类似
的并且在相似的时间达到成熟。在数天的期间在全部植物的雌穗的顶部从外壳抽出穗丝。
花期时的成熟雄穗花序的近距离照片在图9B和9C中示出。植物产生含有小穗的雄穗,具
有中央的花序轴和分支。仅杂合的MS26/ms26-Ci和MS26/ms26-Td T1姊妹株发育出悬挂
在细长花丝上的花药。ms26-Ci/ms26-Ci和ms26-Td/ms26-Td纯合姊妹株含有的小穗无出
现花药的迹象,从而指示雄性不育。
[0350] 实例3
[0351] 通过使用工程改造的MS26内切核酸酶对细胞色素P450样基因MS26进行靶向诱变产生的雄性不育水稻植物
[0352] 玉蜀黍MS26基因(ZmMS26,登录号为AF366297;SEQ ID NO:8)及其在水稻(登录号为LOC_Os03g07250;SEQ ID NO:9)、高粱(SEQ ID NO:10)和黑麦(SEQ ID NO:11)中的直系同源物编码细胞色素P450,CYP704B家族(美国专利申请公开No.2009/0183284),
其被认为可催化具有16碳和18碳链的Ω羟基化脂肪酸的产生(Li等人(2010)Plant
Cell(《植物细胞》)22:173)。破坏玉蜀黍(美国专利No.7517975)或水稻MS26基因的编
码框的纯合隐性突变可导致植物不能生成功能性的花粉粒,这有可能是由于对花粉壁形成
关键的脂肪酸的产生降低(Li等人(2010)Plant Cell(《植物细胞》)22:173)。来自玉蜀
黍、水稻、高粱和黑麦的MS26基因全都在该基因的最后一个外显子内含有一相同的22个核
苷酸的序列,称为“TS-MS26”靶位点(图3)。
[0353] A.TS-MS26靶位点和工程改造的MS26内切核酸酶
[0354] 如实例2所述,选择TS-MS26靶位点用于设计工程改造的MS26内切核酸酶。籼稻和粳稻品种二者均在它们的基因组中含有该内源TS-MS26靶位点。水稻中的包含TS-MS26
靶位点的基因组区在图3中示出(SEQ ID NO:14)。图3还示出了玉蜀黍(SEQ ID NO:13)、
水稻(SEQ ID NO:14)、高粱(SEQ ID NO:15)和黑麦(SEQ ID NO:16)中的包含TS-MS26靶
位点的基因组区并且阐明这些基因组区可含有一些物种之间的碱基对差异且仍然是工程
改造的MS26内切核酸酶的功能性靶位点。
[0355] B.载体和转化
[0356] 将含有内源TS-MS26靶位点的初期水稻愈伤组织(稻(Oryza sativa)粳稻(japonica)亚种Nipponbare或Kitaake栽培种)用作土壤杆菌介导的或生物弹射介导的
DNA递送的转化靶标。对于生物弹射转化,通过改良Chen等人((1998)Plant Cell Rep.
(《植物细胞报道》)18:25-31)描述的方案将载体PHP40082和PHP40126(图4;分别为SEQ
ID NO:58和59)共同轰击进两周龄的衍生自种子的愈伤组织中。PHP40082含有设置在玉
蜀黍泛素启动子的转录控制下的编码单链工程改造的MS26+内切核酸酶的植物优化序列
(SEQ ID NO:5)。PHP40126含有融合至红色荧光基因(RFP)并设置在玉蜀黍END2启动子
的调控下的除草剂抗性选择标记。
[0357] 通过土壤杆菌介导的转化将PHP40827用于产生水稻事件。PHP40827含有设置在含有3个拷贝的Tet操纵子的CAMV35S启动子的转录控制下的编码单链工程改造的MS26+
内切核酸酶的植物优化核苷酸序列(SEQ.ID NO:5)。该质粒也含有处于玉蜀黍泛素启动子
控制下的四环素抑制子和由ZmEND2启动子调控的蓝色荧光基因(CFP)。另外,PHP40827含
有一个拷贝的由玉蜀黍组蛋白2B启动子调控的红色荧光基因。该构建体中的红色荧光基
因的一部分以正向取向重复,由具有369bp的重叠的两个RFP基因片段组成。这两个片段
由136bp间隔物分开,该间隔物含有TS-MS26靶位点(图6A)。在不存在四环素时,愈伤组
织由于CFP标记的表达而发蓝色荧光。在存在四环素时,工程改造的MS26+大范围核酸酶
的去阻遏将导致两个交叠序列之间的TS-MS26靶位点处发生双链断裂以促进分子内重组
并产生功能性RFP基因,这通过相对于蓝色荧光背景的发红色荧光细胞的出现来反映。选
择发红色荧光的愈伤组织事件用于另外的表征和植物再生。
[0358] C.植物组织中TS-MS26靶位点处的突变的鉴定
[0359] 通过如下步骤针对TS-MS26靶位点突变对分别通过生物弹射介导的或土壤杆菌介导的转化产生的双丙氨磷抗性的发红色荧光的愈伤组织或发绿色和红色荧光的愈伤组
织事件进行筛选:使用引物对UNIMS265’-2(GACGTGGTGCTCAACTTCGTGAT)(SEQ ID NO:17)
和UNIMS263’-1(GCCATGGAGAGGATGGTCATCAT)(SEQ ID NO:18)通过PCR扩增该区域并用识
别序列5’-CGTACG-3’的DNA限制酶BsiWI消化扩增产物。将这些反应的产物在1%琼脂
糖凝胶上进行电泳并筛选抗BsiWI消化的带,该带可指示TS-MS26靶位点处的突变。
[0360] 292个通过共同轰击PHP40082和PHP40126事件所产生的双丙氨磷抗性事件中的二十二个含有对BsiWI限制酶消化有抗性的PCR产物,其指示TS-MS26靶位点处的突变。对
这些PCR产物的亚克隆和DNA序列分析揭示了整个TS-MS26靶位点上的多个突变,包括点
突变以及一个至大于250个核苷酸的缺失和插入。这些突变的例子在图5中示出。在数种
情形中在TS-MS26靶位点处的插入由衍生自共同轰击的载体的序列的片段组成(例如,参
见图5;事件48(Ev.48)含有RFP的54个碱基对)。
[0361] 还在用四环素处理后针对在TS-MS26靶位点处的突变存在对含有PHP40827的发蓝色荧光的水稻愈伤组织进行筛选(图6B)。于37℃将八个独立的PHP40827事件置于含
有1mg/升四环素(TET)的愈伤组织维持培养基上24小时;分离基因组DNA并通过PCR分
析在TS-MS26靶位点处的突变,并且将其与未暴露于四环素的这些相同事件(对照)的PCR
产物比较(图6B)。八个PHP40827事件中的六个产生依赖于四环素施用的BsiWI抗性PCR
产物。亚克隆来自TET和对照处理的PCR产物并进行DNA序列分析。来自未切割对照处理
反应的PCR产物的大部分未揭示在整个TS-MS26靶位点上的突变。相比之下,来自BSIWI
抗性PCR产物的DNA序列的大部分反映出在整个TS-MS26靶位点上的高比例的缺失和插入
(参见图7中的例子)。从在TS-MS26靶位点处含有突变的愈伤组织事件再生处植物用于
表型分析。
[0362] D.含有MS26突变的水稻植物的表型分析
[0363] 将从用PHP40082和PHP40126共同轰击的愈伤组织事件再生的除草剂抗性植物以及来自含有PHP40827的发蓝色荧光的愈伤组织的植物在温室条件下培养,分析MS26
中的突变并让其结出自交种子(T1种子)。通过从6株植物(3PHP40082/PHP40126和
3PHP40827)选择含有非相同的MS26突变但缺少用于转化的载体的T1种子来筛选雄性能
育性。通过检查花药的淀粉填充的花粉粒的发育还有植物结出自交种子的能力来确定雄性
能育性。针对TS-MS26靶位点处的突变通过PCR筛选小植物。继续推进MS26/ms26杂合的
和ms26/ms26纯合的突变植物并针对它们产生功能性花粉的能力进行评分(图10A)。概括
地说,34株MS26/ms26植物中的34株为雄性能育的,而两个例外,29株ms26/ms26植物中
的27株是雄性不育的(表4)。对源自停留在后期单核小孢子发育的ms26/ms26植物的花
药的显微镜检查揭示出数目减少并且形状异常的小孢子(图10B)。相比之下,来自MS26/
ms26植物的花药含有许多类似于Li等人(Plant Cell(《植物细胞》)2010;22:173)报道
的观察结果的正常小孢子(图10C)。该雄性不育植物是雌性能育的,如通过它们在用野生
型水稻花粉受精时结实的能力所证明的。
[0364] 表4。
[0365] 来自自交种子的水稻植物的能育性评分
[0366]
[0367] 实例4
[0368] 玉蜀黍MS45基因中的靶向突变
[0369] 使在其基因组中包含内源靶识别序列的玉蜀黍株系与工程改造的大范围核酸酶接触,该大范围核酸酶被设计成特异性识别MS45基因中的内源靶序列并在其中产生双链
断裂。使包含内源靶位点的未成熟胚与下文描述的元件接触,选择事件并进行表征。
[0370] A.玉蜀黍TS-MS45靶位点和工程改造的MS45内切核酸酶
[0371] 选择位于MS45基因中并被称为TS-MS45靶位点(SEQ ID NO:20)的内源玉蜀黍基因组靶位点用于设计工程改造的双链断裂诱导剂。
[0372] 包含TS-MS45靶位点的基因组区域具有TS-MS45靶位点以标下划线示出的如下序列:
[0373] GGAGTTCTGCGGCCGGCCGCTCGGCCTGAGGTTCCACGGGGAGACCGGCGAGCTCTACGTCGCCGACGCGTACTACGGTCTCATGGTCGT(SEO IDNO:19)
[0374] TS-MS45靶位点为具有如下序列的22bp多核苷酸:
[0375] CGGGGAGACCGGC^GAGCTCTAC(SEQ ID NO:20)
[0376] 双链断裂位点和悬突以黑体示出,酶在核苷酸13后切割,如通过^所指示的。
[0377] 根据合同由Precision BioSciences公司(北卡罗来纳州德罕(Durhan,NC USA))制备设计用于识别TS-MS45靶位点的工程改造的MS45内切核酸酶。该工程改造的MS45内
切核酸酶为异型二聚体。一个单体定为MAY1而另一者定为MAY2。
[0378] 将核定位信号(SEQ ID NO:21)添加至每个单体的氨基末端以改善蛋白质向细胞核内的转运。构建编码MAY1的植物优化核苷酸序列(SEQ ID NO:22)或编码MAY2的植物
优化核苷酸序列(SEQ ID NO:23)。
[0379] B.编码工程改造的MS45内切核酸酶和用于通过同源重组进行转基因整合的修复DNA的植物表达载体的载体构建
[0380] 用于再生和选择所产生的基因组变更的策略不采用选择标记表达盒的重构,因而双链断裂诱导剂载体不具有选择标记盒的片段。在该实例中,双链断裂诱导剂载体具有编
码草胺膦乙酰基转移酶的表型标记表达盒,其用于验证载体的成功递送。
[0381] 使用标准的分子生物学技术构建含有编码MS45内切核酸酶的植物优化编码序列的载体。PHP31456包含如下可操作连接的元件:Ubi pro::ubi5’UTR::cMAY1::pinII::
Ubi pro::ubi5’UTR::cMAY2::pinII::35S CaMV pro::BAR::pinII;其中ubi pro为玉蜀黍泛素启动子,ubi5’UTR为玉蜀黍泛素基因的5′非翻译区,cMAY1和cMAY2为设计
用于在内源TS-MS45玉蜀黍基因组靶位点特异性识别并诱导双链断裂的分别编码MAY1和
MAY2单体的DNA序列,35S CaMV pro为35S花椰菜花叶病毒启动子,BAR编码草胺膦乙酰基
转移酶,而pinII为来自马铃薯蛋白酶抑制剂II的转录终止序列。PHP31458包含如下可操
作连接的元件:Ubi pro::ubi5’UTR::NLS::cMAY1::pinII::Ubi pro::ubi5’UTR::
NLS::cMAY2::pinII::35S CaMV pro::BAR::pinII;其中ubi pro为玉蜀黍泛素启动子,ubi5’UTR为玉蜀黍泛素基因的5′非翻译区,NLS为编码SV40核定位信号的DNA片段,
cMAY1和cMAY2为设计用于在内源TS-MS45玉蜀黍基因组靶位点特异性识别并诱导双链断
裂的分别编码MAY1和MAY2单体的DNA序列,35S CaMV pro为35S花椰菜花叶病毒启动子,
BAR编码草胺膦乙酰基转移酶,而pinII为来自马铃薯蛋白酶抑制剂II的转录终止序列
[0382] 这些载体设计用于在TS-MS45靶位点处诱导双链断裂并从而产生TS-MS45靶位点的变更。将PHP31456和PHP31458的载体元件插入在T-DNA的右边界和左边界之间用于通
过土壤杆菌介导引入进植物细胞中,从而产生载体PHP31457和PHP31459。
[0383] 使用实例2C中所描述的土壤杆菌介导的方法,用载体PHP31457(SEQ ID NO:30)或PHP31459(SEQ ID NO:31)转化授粉后9-12天(DAP)的玉蜀黍未成熟胚。
[0384] 通过在含有3mg/L双丙氨磷的培养基上进行愈伤组织选择,将双丙氨磷抗性用于鉴定推定的转化事件。针对内源靶位点的修饰筛选使用标准的培养和再生条件从稳定转
化株再生的愈伤组织和/或植物。
[0385] C.评价转化玉蜀黍的TS-MS45靶位点的修饰
[0386] 可将用于分离、操纵和表征多核苷酸和或蛋白质的任何标准方案用于鉴定、选择和表征推定的修饰事件。
[0387] 使用靶位点旁侧的引物从获自转化玉蜀黍细胞的基因组DNA制备PCR产物并通过Qiaquick(美国新墨西哥州瓦伦西亚的凯杰公司(Qiagen Inc.,Valencia,NM,USA))纯化。
将靶位点中含有的双链断裂诱导酶或限制酶添加至纯化的靶位点PCR产物DNA以测试靶位
点是否已经经过修饰。将该混合物在37℃下消化约0.5小时至过夜(大约17小时),消化
时间取决于所用的酶。将具有大范围核酸酶的样品用0.5μL蛋白酶K和0.2μL20%SDS
处理以使蛋白质变性。将消化产物在1.5至2%琼脂糖凝胶上分离。未消化的产物表明靶
位点被修饰。
[0388] 通过使用产生389bp产物的引物对PCR扩增靶位点区域,针对在TS-MS45靶位点处的突变筛选双丙氨磷抗性愈伤组织和/或T0植物事件。将产生389bp PCR产物的样品
用工程改造的MS45内切核酸酶进行酶消化。在一些情形中,直接克隆PCR产物并测序。在
大约300株所分析的转化植物中未鉴别到具有TS-MS45靶位点修饰的转化事件。
[0389] D.工程改造的MS45内切核酸酶的改良
[0390] 进一步评价工程改造的MS45内切核酸酶表明,该核酸酶的活性低于能够产生内源玉蜀黍靶位点的修饰的其他核酸酶如MS26+和MS26++。
[0391] 工程改造的MS45内切核酸酶的设计中预计会增加玉蜀黍中的核酸酶活性的改良为包含使用接头多肽融合的MAY1和MAY2单体的单链蛋白质。可连接MAY1和MAY2单体以
产生形式为MAY1-接头-MAY2或MAY2-接头-MAY1的单链蛋白质。编码MAY1-接头-MAY2
蛋白的植物优化基因在SEQ ID NO:34中示出。如果需要,可将核定位信号(如SEQ ID NO:
21)添加至该蛋白质的氨基末端。
[0392] E.递送工程改造的MS45内切核酸酶基因进玉蜀黍细胞中的备选方法
[0393] 通过直接DNA递送方法如粒子轰击引入工程改造的MS45内切核酸酶基因可与通过土壤杆菌引入大范围核酸酶基因相比增加大范围核酸酶基因的拷贝数;增加的大范围核
酸酶基因拷贝数可增加靶位点修饰的频率10-50倍。用至少一种上述多核苷酸构建体轰击
来自温室或田间栽培的高型II(High type II,HiII)供体植物的未成熟玉蜀黍。如果构
建体不包括选择标记,则可将含有选择标记基因的另一多核苷酸共沉淀于用于轰击的粒子
上。
[0394] 在授粉后8-12天收获雌穗用于分离受精胚。将收获的雌穗在50% 漂白剂加0.5%Micro洗涤剂中表面灭菌20分钟,然后用无菌水漂洗两次。分离未成熟胚并以
胚轴侧朝下(盾片侧朝上)放置,每个板25枚胚。在轰击前将这些胚在560L琼脂培养基
上于暗处培养4天。培养基560L为基于N6的培养基,含有Eriksson′s维生素、硫胺素、
蔗糖、2,4-D和硝酸。在轰击当天,将胚转移至560Y培养基4小时,然后布置在2.5cm的
靶区域内。培养基560Y是高渗培养基(含高浓度蔗糖的560L)。
[0395] 如下使用CaCl2沉淀程序通过沉积DNA来递送至1.0μm(平均直径)金小球上来制备粒子:100μL水中的制备的金粒子(0.6mg)、20μL(2μg)TrisEDTA缓冲液(总共
1μg)中的DNA、100μL2.5M CaCl2、40μl 0.1M亚精胺。将每种试剂依序添加至金粒子悬
浮液。将最终的混合物进行简单的超声处理。在沉淀期间,简单地离心粒子,用500μL100%乙醇洗、再次离心得到沉淀物并重新悬浮于60μL100%乙醇中以制备最终的悬浮液。通过
简单地超声处理最终的制备物、点样5μL于每个巨载体的中央并在轰击前干燥约2分钟来
准备巨载体。使用DuPont生物弹射氦粒子枪以阻挡屏距组织8cm轰击样品板。所有样品
均接受650PSI的单次射击,从每管制备的粒子/DNA提取总共十份等分试样。
[0396] 或者,使用包含阳离子脂质溶液的试剂使待递送的DNA与微粒子缔合。例如,将DNA溶液添加至50μL金粒子储备溶液(0.1μg/μL的0.6微米金粒子)。将DNA储备溶
液(10μL的0.1μg/μL质粒溶液)添加至30μL水。向该DNA混合物,添加50μL金储备
TM
溶液并对该混合物进行简单地超声处理。接着添加5μL的TFX-50 (威斯康辛州麦迪逊的
普洛麦格公司(Promega Corp,Madison WI)),并将该混合物置于100rpm的旋转摇荡器10
分钟。将该混合简单离心以获得金粒子的沉淀物并移除上清液。在移除过量的DNA/TFX
溶液后,添加120μL的无水EtOH,并将10μL等分试样分配至通常与DuPont PDS-1000氦
粒子枪一起使用的巨载体上。让具有粘附的DNA的金粒子干燥于载体上,然后将这些用于
标准的粒子轰击。
[0397] 轰击后4至12小时,于28℃下将胚移至低渗透愈伤组织引发培养基3-7天,然后转移至选择培养基并每2周进行分培。对于大多数大范围核酸酶,在轰击后将胚于32℃
下温育约48小时可增加靶位点修饰频率2-4倍。在约10周后,将胚转移至再生培养基。
使体细胞胚成熟2-4周后,将发育良好的体细胞胚转移至光照培养室中的萌发培养基。大
约7-10天后,将发育的小植物转移至管中直至小植物定植良好,并且可移植进浅箱(flat)
和/或盆中并培养至成熟。
[0398] 实例5
[0399] 通过使用工程改造的MS26内切核酸酶对细胞色素P450样基因MS26进行靶向诱变产生的雄性不育高粱植物
[0400] A.TS-MS26靶位点和工程改造的MS26内切核酸酶
[0401] 如实例2所述,选择TS-MS26靶位点用于设计工程改造的MS26内切核酸酶。高粱(Sorghum bicolor)中的包含TS-MS26靶位点的基因组区在图3中示出(SEQ ID NO:15)。
[0402] B.载体和转化
[0403] 将含有内源MS26靶位点(TS-MS26,SEQ ID NO:1)的未成熟高粱胚用作土壤杆菌DNA递送的转化靶标。将PHP42063(SEQ ID NO:61)用于通过土壤杆菌介导的转化产生高
粱愈伤组织事件。PHP42063含有设置在玉蜀黍CAS1启动子的转录控制下的单链MS26+内
切核酸酶(实例2中所描述的)。CAS1启动子已显示可被磺酰脲-安全剂2-CBSU或被高
温进行转录诱导(于2012年5月18日提交的美国专利申请61/648,758)。PHP42063还
含有由ZmEND2启动子调控的蓝色荧光基因(CFP),其用作用于选择T-DNA整合进高粱细胞
中的视觉标记。另外,PHP42063还含有一个拷贝的由玉蜀黍组蛋白2B启动子调控的红色
荧光基因。该构建体中的红色荧光基因的一部分以正向取向重复,由具有369bp的重叠的
两个RFP基因片段组成。这两个片段由含有MS26靶位点的136bp间隔物分开,如上针对
PHP40827(图6,SEQ ID NO:60)所述的。根据Zhao等人(Plant Molecular Biology(《植
物分子生物学》)44:789-798,2000)用PHP42063转化未成熟胚。选择发蓝色荧光的愈伤组织并用于再生植物并且在温室中培养至成熟并结实。通过拷贝数分析验证含有PHP42063
的DNA插入物的高粱植物。选择四株独立的单拷贝或低拷贝PHP42063转化植物用于另外
的实验。在授粉后14-20天收获发蓝色荧光的未成熟胚、灭菌、置于维持培养基(无PPT选
择的PHI-U)上并在室温(23C-26C)下或在37C的高温下于暗处温育24至48小时。在该
阶段结束时,将在高温下温育的胚移至室温(<26C)并让胚在暗处生长。如上所述,含有
PHP42063并在收获后于26C下维持的胚由于CFP标记的表达而仅发蓝色荧光。相比之下,
在高温下处理后大约72小时,于37C下温育的胚开始在胚上发育出发红色荧光的区域。该
观察结果表明,热诱导型基因盒CAS1:MS26+已在RF-FP报告基因的两个交叠的序列之间的
MS26靶位点处导致双链断裂,从而促进分子内重组并产生功能性RPF基因,该功能性RPF基
因通过相对于蓝色荧光背景的发红色荧光细胞的出现来反映。选择发红色荧光的愈伤组织
事件用于植物再生和另外的分子和表型表征。
[0404] C.高粱组织中TS-MS26靶位点处的突变的鉴定
[0405] 通过如下步骤针对在TS-MS26靶位点处的突变筛选再生的植物:使用引物对UNIMS265’-2(GACGTGGTGCTCAACTTCGTGAT,SEQ ID NO:17)和UNIMS263’-1(GCCATGGAGAGGATGGTCATCAT,SEQ ID NO:18)通过PCR扩增该区域并用识别序列5’-CGTACG-3’的DNA限制酶
BsiWI消化扩增的产物。将这些反应的产物在1%琼脂糖凝胶上进行电泳并筛选抗BsiWI
消化的带,该带可指示TS-MS26靶位点处的突变。
[0406] 389株来自所产生的PHP42063热处理胚的再生植物中129株含有对BsiWI限制酶消化有抗性的PCR产物,其指示TS-MS26靶位点处的突变。对这些PCR产物的亚克隆和
DNA序列分析揭示了在整个TS-MS26区域上的多个突变,该突变主要由范围为3至98个核
苷酸的在TS-MS26靶位点内和在整个该靶位点上的缺失组成。偶尔,检测到单个至11个核
苷酸的小插入物。总计在这些再生的高粱植物中鉴定了16个非相同的突变(图12,SEQ ID
NO:62-78)。将在TS-MS26靶位点处含有突变的植物用于表型分析。
[0407] D.含有MS26突变的高粱植物的表型分析
[0408] 将在高粱中的TS-MS26处含有突变的再生植物在温室条件下培养并让其结出自交种子(T1种子)。通过种植来自在整个TS-MS26靶位点上含有78bp缺失(ms26.78Δ)的
植物的T1种子来筛选雄性能育性表型。在开花之前,针对在TS-MS26靶位点处的突变通过
PCR筛选籽苗;鉴定MS26/MS26(野生型)、MS26/ms26.78Δ(杂合的)和ms26.78Δ/
ms26.78Δ(隐性)植物并继续推进。通过检验花药的淀粉填充的花粉粒的发育还有植物结
出自交种子的能力来确定雄性能育性。如图13A中所示,MS26/ms26.78Δ的圆锥花序揭
示了花药伸出、花粉散播和结实。相比之下,ms26.78Δ/ms26.78Δ植物(图13B)伸出
小的萎缩的花药,不散播花粉并且不结实。相比于来自MS26/ms26.78Δ植物的花药(图
14A)的检查结果,来自ms26.78Δ/ms26.78Δ植物的花药(图14B)小。此外,当更近地
检查来自这些植物的花药时,在MS26/ms26.78Δ花药(图14C)中更容易检测到花粉,然
而来自ms26.78Δ/ms26.78Δ植物的花药(图14D)未观察到花粉。观察到能育性表型
与MS26基因型之间的良好相关性。概括地说,所有的MS26/MS26和MS26/ms26.78Δ
植物均是雄性能育的,而所有的ms26.78Δ/ms26.78Δ植物均是雄性不育的(表5)。这
些雄性不育植物是雌性能育的,如通过它们在用野生型高粱花粉受精时结实的能力所证明
的(数据未示出)。
[0409] 表5.
[0410] 高粱植物的能育性评分
[0411]基因型 能育 不育
MS26/MS26 3 0
MS26/ms26.78Δ 7 0
ms2678Δ/ms26.78Δ 0 8
[0412] 在本说明书中提及的所有出版物和专利申请表现了本发明所属领域技术人员的水平。所有出版物和专利申请都以引用方式并入本文,所引用的程度就如同明确且独立地
指明将每篇单独的出版物或专利申请以引用方式并入本文一样。
[0413] 虽然为了清楚地理解而已经通过举例说明和例子较详细地描述了本发明,但显然可以在权利要求书范围内实施一些改变和修饰。
QQ群二维码
意见反馈