首页 / 专利库 / 作物管理 / 非生物胁迫 / 植物中的靶向基因组优化

植物中的靶向基因组优化

阅读:301发布:2020-05-18

专利汇可以提供植物中的靶向基因组优化专利检索,专利查询,专利分析的服务。并且提供用核苷酸向导DNA修饰多肽(如RNA向导内切核酸酶)、向导多核苷酸和用于修复双链断裂的供体分子,以靶向方式在预先 选定 的位点处修饰 植物 细胞基因组的改进方法和手段。,下面是植物中的靶向基因组优化专利的具体信息内容。

1.用于在预先选定的位点处修饰植物细胞的(核)基因组或用于产生具有经修饰的基因组的植物细胞的方法,其包括步骤:
a.向所述植物细胞中引入RNA向导内切核酸酶(RGEN)和至少一个向导多核苷酸,其中所述RGEN和所述至少一个向导多核苷酸能够形成使得RGEN能够在所述预先选定的位点处或附近引入(双链)DNA断裂或一个或多个切口或单链断裂或诱导DNA链替换的复合物;
b.向所述细胞中引入至少一个包含目的多核苷酸的供体多核苷酸;
c.选择植物细胞,其中所述供体多核苷酸已用作用于修复所述DNA断裂的模板,由此在所述预先选定的位点处整合所述目的多核苷酸,在所述预先选定的位点处产生所述基因组的修饰,其中所述修饰选自:
i.至少一个核苷酸的替换;
ii.至少一个核苷酸的缺失;
iii.至少一个核苷酸的插入;或
iv.i.-iii.的任意组合;
其特征在于通过使所述植物细胞与至少一个包含编码所述RGEN的嵌合基因、至少一个编码所述至少一个向导多核苷酸的嵌合基因和所述至少一个供体多核苷酸的细菌接触来将所述RGEN、所述至少一个向导多核苷酸和所述至少一个供体多核苷酸引入所述植物细胞。
2.权利要求1的方法,其中所述细菌是根瘤农杆菌。
3.权利要求1或2的方法,其中所述编码所述内切核酸酶的嵌合基因、所述至少一个编码所述至少一个向导多核苷酸的嵌合基因和所述至少一个供体多核苷酸定位在一个T-DNA载体上。
4.权利要求1-3中任一项的方法,其中所述编码所述内切核酸酶的嵌合基因、所述至少一个编码所述至少一个向导多核苷酸的嵌合基因和所述至少一个供体多核苷酸定位在一个T-DNA分子上(单组T-DNA边界之间)。
5.权利要求1-4中任一项的方法,其中所述RGEN是切口酶或一对切口酶。
6.权利要求1-4中任一项的方法,其中所述RGEN是Cas9或Cpf1。
7.权利要求1-6中任一项的方法,其中所述编码所述至少一个向导多核苷酸的嵌合基因编码两个或多个向导多核苷酸序列。
8.权利要求1-7中任一项的方法,其中所述编码所述内切核酸酶的嵌合基因的编码区已针对在植物中表达进行优化。
9.权利要求1-8中任一项的方法,其中所述RGEN包含SEQ ID NO6的从10位基酸至
1388位氨基酸的氨基酸序列。
10.权利要求1-8中任一项的方法,其中所述编码所述RGEN的嵌合基因包含SEQ ID NO.5的从核苷酸28至核苷酸4164的核苷酸序列。
11.权利要求1-10中任一项的方法,其中所述细菌进一步包含引入并在所述植物细胞中表达的选择标记基因。
12.权利要求11的方法,其中所述选择标记基因赋予所述植物细胞选择表型。
13.权利要求11或12的方法,其中所述选择标记基因定位在所述一个T-DNA载体上。
14.权利要求11-13中任一项的方法,其中所述选择标记基因定位在所述一个T-DNA分子上。
15.权利要求1-14中任一项的方法,其中所述核基因组中的所述修饰赋予所述植物细胞选择表型。
16.权利要求12-15中任一项的方法,其中所述选择表型是对一种或多种除草剂的耐受性。
17.权利要求12-16中任一项的方法,其中所述修饰赋予所述植物细胞的所述选择表型可以用于直接选择包含所述修饰的植物细胞。
18.权利要求12-17中任一项的方法,其中所述选择标记基因赋予所述植物细胞的选择表型可以用于选择包含所述修饰的植物细胞。
19.权利要求1-18中任一项的方法,其中所述细胞包含在未成熟胚或成胚愈伤组织内。
20.权利要求1-19中任一项的方法,其中所述供体DNA分子包含位于目的DNA分子侧翼的一条或两条侧翼核苷酸序列,所述一条或两条侧翼核苷酸序列与所述预先选定的位点上游和/或下游的基因组DNA具有足够的同源性,以允许与所述上游和/或下游DNA区重组。
21.权利要求1-20中任一项的方法,其中所述目的多核苷酸包含一个或多个可表达的目的基因,所述可表达的目的基因可选地选自除草剂抗性基因、昆虫抗性基因、疾病抗性基因、非生物胁迫抗性基因、涉及油生物合成的酶、涉及糖类生物合成的酶、涉及纤维强度或纤维长度的酶、涉及次生代谢物生物合成的酶。
22.权利要求1-21中任一项的方法,其包括另一将所述选择的包含所述修饰的植物细胞培养为植物的步骤。
23.权利要求22的方法,其包括另一使所述植物与另一植物杂交并可选地获得包含所述修饰的子代植物的步骤。
24.权利要求22或23的方法,其包括另一选择包含所述修饰但不包含所述编码所述RGEN的嵌合基因、所述至少一个编码所述至少一个向导多核苷酸的嵌合基因和所述选择标记基因的子代植物的步骤。
25.权利要求1-24中任一项的方法,其中所述植物细胞或植物是稻植物细胞或稻植物。
26.在(核)基因组中预先选定的位点处包含修饰的植物细胞、植物部分、种子、植物产物或植物,其通过权利要求1-25中任一项的方法产生。
27.细菌,其包含权利要求1-21的任一项中所述的编码RGEN的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个供体多核苷酸,其中所述细菌能够将所述编码所述RGEN的嵌合基因、所述编码所述向导多核苷酸的嵌合基因和所述供体多核苷酸转移入或引入植物细胞(的核基因组),其中所述RGEN和所述向导多核苷酸在所述植物细胞中表达时能够形成使得RGEN能够在植物细胞的(核)基因组中预先选定的位点处引入DNA断裂的复合物,其中所述供体多核苷酸将用作用于修复所述DNA断裂的模板。
28.权利要求27的细菌,其是根瘤农杆菌。
29.权利要求27或28的细菌,其中所述编码所述RGEN的嵌合基因、所述编码所述向导多核苷酸的嵌合基因和所述供体多核苷酸定位在一个载体上,可选地一个T-DNA分子上(一对T-DNA边界之间)。
30.(T-DNA)载体,其可选地在一个T-DNA分子上(一对T-DNA边界之间)包含权利要求1-
21的任一项中所述的编码RGEN的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个供体多核苷酸。
31.权利要求27-29中任一项的细菌或权利要求30的载体,其进一步包含可选地在所述一个T-DNA分子上(一对T-DNA边界之间)的选择标记基因。
32.用于修饰植物细胞中的内源EPSPS基因或用于产生具有经修饰的EPSPS基因的植物细胞或用于测试基因组编辑(成分)的效率的方法,其包括步骤:
a.在所述细胞中表达识别所述植物的内源EPSPS基因中的序列的位点定向DNA修饰多肽和/或向所述植物细胞中引入可用作用于修饰所述内源EPSPS基因的模板的供体多核苷酸;
b.通过在包含一种或多种EPSPS抑制剂的培养基上培养所述植物细胞来评价所述植物细胞对所述一种或多种EPSPS抑制剂的耐受性;并可选地
c.选择对所述EPSPS抑制剂具有提高的耐受性的植物细胞。
33.权利要求32的方法,其中所述EPSPS抑制剂用作第一选择剂。
34.权利要求32或33的方法,其中所述植物细胞是稻植物细胞。
35.用于在预先选定的位点处修饰植物细胞的(核)基因组的方法,其包括步骤:
a.向所述细胞中引入核苷酸向导DNA修饰多肽(NGDMP)和向导多核苷酸,其中所述NGDMP和向导多核苷酸能够形成使得NGDMP能够在预先选定的位点处修饰植物细胞基因组的复合物;
b.选择其中已在所述预先选定的位点处修饰了所述基因组的植物细胞;
其特征在于用粒子流入抢将所述NGDMP、所述向导多核苷酸引入所述植物细胞。
36.用于在预先选定的位点处修饰植物细胞的(核)基因组的方法,其包括步骤:
a.向所述细胞中引入核苷酸向导DNA修饰多肽(NGDMP)和向导多核苷酸,其中所述NGDMP和向导多核苷酸能够形成使得NGDMP能够在预先选定的位点处修饰植物细胞基因组的复合物;
b.向所述细胞中引入至少一个(植物可表达的)选择标记基因;
c.选择一个或多个包含所述选择标记基因的植物细胞;
d.选择其中已在所述预先选定的位点处修饰了所述基因组的植物细胞;
其特征在于通过使所述植物细胞与至少一个包含编码所述RGEN的嵌合基因、至少一个编码所述至少一个向导多核苷酸的嵌合基因和至少一个含有所述选择标记基因的多核苷酸的细菌接触来将所述NGDMP、所述至少一个向导多核苷酸和所述至少一个选择标记基因引入所述植物细胞。
37.权利要求35或36的方法,其中所述RGDMP是RGEN,所述RGEN和所述至少一个向导多核苷酸能够形成使得RGEN能够在所述预先选定的位点处或附近引入DNA断裂的复合物。
38.权利要求37的方法,其中将包含目的多核苷酸的供体多核苷酸与所述RGEN和所述向导多核苷酸一起引入所述植物细胞,其中所述供体多核苷酸用作用于修复所述DNA断裂的模板,由此在所述预先选定的位点处整合所述目的多核苷酸,在所述预先选定的位点处产生所述基因组的修饰。
39.细菌,其包含权利要求36-38的任一项中所述的编码NGDMP的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个(植物可表达的)选择标记基因,其中所述细菌能够将所述编码所述NGDMP的嵌合基因、所述编码所述向导多核苷酸的嵌合基因和所述选择标记基因转移入或引入植物细胞(的核基因组),其中所述NGDMP和所述向导多核苷酸在所述植物细胞中表达时能够形成使得NGDMP能够修饰植物细胞的(核)基因组的复合物。
40.权利要求39的细菌,其是根瘤农杆菌。
41.权利要求39或40的细菌,其中所述编码所述NGDMP的嵌合基因、所述编码所述向导多核苷酸的嵌合基因和所述选择标记基因定位在一个载体上,可选地一个T-DNA分子上(一对T-DNA边界之间)。
42.(T-DNA)载体,其可选地在一个T-DNA分子上(一对T-DNA边界之间)包含权利要求
36-41的任一项中所述的编码NGDMP的嵌合基因、编码向导多核苷酸的嵌合基因和选择标记基因。

说明书全文

植物中的靶向基因组优化

技术领域

[0001] 本发明涉及农学领域。更具体而言,本发明提供在植物细胞基因组中精确定位的核苷酸序列处引入包括插入、缺失或取代的靶向修饰的方法和手段。具体而言,该方法利用通过农杆菌(Agrobacterium)介导的递送同时递送至植物细胞的RNA向导内切核酸酶(RGEN)、向导多核苷酸和供体多核苷酸分子,导致编辑事件的回收率提高,其中供体多核苷酸用作修复DNA断裂或一个或多个DNA切口、或单链DNA断裂的模板,无论是否交错。还描述用于评价基因组编辑成分的测定。

背景技术

[0002] 在基因组(如植物基因组)中引入靶向修饰(包括控制外源DNA的整合位置)的需要已变得越来越重要,已发展了若干种方法来满足此需要(综述参见Kumar和Fladung,2001,Trends in Plant Science,6,155-159页)。这些方法大多依赖于最初通过表达双链断裂诱导(DSBI)酶来在所靶向的位置处引入双链DNA断裂。
[0003] 已显示通过经切点罕见内切核酸酶(rare cleaving endonuclease)(如l-Scel)诱导双链DNA断裂(DSB)活化靶基因座和/或修复或供体DNA使同源重组频率提高若干个数量级(Puchta等,1996,Proc.Natl.Acad.Sci.U.S.A.,93,5055-5060页;Chilton和Que,Plant Physiol.,2003;D'Halluin等2008Plant Biotechnol.J.6,93-102)。
[0004] WO 2005/049842描述了用切点罕见“双链断裂”诱导(DSBI)酶以及改善的l-Scel编码核苷酸序列改善植物中的靶向DNA插入的方法和手段。
[0005] WO2006/105946描述了用于通过同源重组在植物细胞和植物中将靶DNA序列精确更换为目的DNA序列的方法,由此随后可利用其中所述的用于通过DSBI切点罕见内切核酸酶的小孢子特异性表达来去除所选择的DNA的方法,去除在同源重组期期间用于暂时选择基因替换事件的选择标记或筛选标记而不留痕迹且无需在去除步骤期间诉诸于体外培养。
[0006] WO2008/037436描述了WO2006/105946的方法和手段的变通形式,其中通过诱导双链断裂的切点罕见内切核酸酶诱导的所选DNA片段的去除步骤在种系特异性启动子的控制下进行。该方法的其他实施方案一方面依赖于修复DNA的非同源末端连接,另一方面依赖于同源重组。WO08/148559描述WO2008/037436的方法的变通形式,即用于通过同源重组在真核细胞如植物细胞中将靶DNA序列更换为目的DNA序列的方法,由此随后可利用去除所选择的侧翼为两个同向重复的核苷酸序列的DNA的方法,去除在同源重组期期间用于暂时选择基因替换事件的选择标记或筛选标记而不留足迹。
[0007] 此外,已描述了这样的方法,该方法允许设计切点罕见内切核酸酶以改变酶的底物或底物特异性,从而允许不依赖于任何天然的切点罕见内切核酸酶的识别位点的存在来在目的基因座诱导双链断裂。简言之,可以用设计用于识别特异性核苷酸序列的锌指结构域和来自天然限制酶如Fokl的非特异性DNA切割结构域之间的杂合体来制备嵌合限制酶。这类方法已描述于例如WO 03/080809、W094/18313或WO95/09233中及Isalan等,2001,Nature Biotechnology 19,656-660;Liu等1997,Proc.Natl.Acad.Sci.USA 94,5525-
5530)中。WO2004/067736中描述了另一种通过从变体文库选择来产生定制大范围核酸酶的方式。还可以通过WO2007/047859中所述的合理设计来获得序列特异性和DNA结合亲和改变的定制大范围核酸酶或重新设计的大范围核酸酶。此外,WO10/079430和W011/072246描述了可定制DNA结合特异性的转录激活因子样效应(TALE)蛋白的设计及可如何将这些蛋白与核酸酶结构域(例如FOK1)融合来产生对基本上任何DNA序列具有序列特异性的嵌合限制酶,即TALE核酸酶(TALEN)。
[0008] Bedell等,2012(Nature 491:114-118页)和Chen等,2011(Nature Methods 8:753-755页)分别描述了使用TALEN和ZFN的哺乳动物细胞中的寡核苷酸介导基因组编辑。
[0009] Elliot等(1998,Mol Cel Biol 18:93-101页)描述了同源性介导的DSB修复测定,其中发现掺入突变的频率与距离切割位点的距离负相关。
[0010] W011/154158和W011/154159描述了以靶向方式修饰包含嵌合基因的转基因植物的植物基因组的方法和手段,其中嵌合基因具有常用于植物分子生物学的DNA元件,以及重新设计用于切割这种常用于植物分子生物学的元件的大范围核酸酶。
[0011] WO2013026740描述了用双链DNA断裂诱导酶以靶向方式修饰紧靠已有原种事件的植物基因组的方法和手段。
[0012] WO2014161821公开了提供来用双链断裂诱导酶(如TALEN)和用于修复双链断裂的供体分子,以靶向方式在预先确定的位点修饰真核细胞基因组的改进方法和手段。
[0013] 最近,发现了称为Crispr/Cas的新的基因组编辑方法(Jinek等,2012,Science;Gasiunas等,2012,PNAS;Cong等,2013,Science;Mali等,2016,Science;Cho等,2013,Nature Biotechnology;Shan等,2013,Nature Biotechnology;Nekrasov等,2013,Nature Biotechnology;Feng等,2013,Cell Res)。
[0014] WO2014144155公开了用于使用规律成簇间隔短回文重复/CRISPR相关(CRISPR/Cas)系统的基因打靶的材料和方法。
[0015] WO2014186686公开了用于在靶核酸序列处修饰植物基因组的方法。还提供了用于将融合蛋白靶向至植物基因组中的靶核酸序列的方法。还提供了用于在植物中测试Cas系统成分的方法、修饰的植物和植物细胞、融合蛋白、及编码这类融合蛋白的核酸分子。
[0016] WO2014194190公开了用CRISPR(规律成簇间隔短回文重复)相关核酸酶在植物基因组中进行特异性基因打靶和DNA序列精确编辑的组合物和方法。用这些组合物和方法可以产生非转基因遗传修饰作物。
[0017] WO 2015/026883公开了用于植物或植物细胞基因组中靶序列的基因组修饰的组合物和方法,以及利用向导多核苷酸/Cas内切核酸酶系统进行细胞或生物基因组中核苷酸序列的基因组修饰、进行基因编辑和/或进行将目的多核苷酸插入细胞或生物基因组或从细胞或生物基因组缺失目的多核苷酸的组合物和方法,育种方法及利用两成分RNA向导和Cas内切核酸酶系统选择植物的方法,及用于编辑细胞基因组中的核苷酸序列的组合物和方法。
[0018] WO 2015/026885公开了用于细胞基因组中靶序列的基因组修饰的组合物和方法,以及用于编辑细胞基因组中的核苷酸序列的组合物和方法,以及育种方法及利用两成分RNA多核苷酸和Cas内切核酸酶系统选择植物的方法。
[0019] WO2015/026886公开了用于植物基因组位点定向修饰的方法。具体而言,提供用于通过RNA引入植物基因组位点定向修饰的方法。
[0020] WO 2015/048707公开了用于赋予植物双生病毒群抗性的材料和方法,尤其是用于用CRISPR/Cas系统赋予植物对双生病毒群的抗性的材料和方法。
[0021] WO2015117041公开了用一个或多个基因修饰介导的方法在真核系统中产生显性性状的方法。该技术的方面进一步涉及用于在高粱植物中沉默SbCSE和/或SbCAD2基因表达或活性的方法。
[0022] WO2015131101公开了用于植物中CRISPR/Cas介导的靶向基因修饰的新的玉米、番茄和大豆U6、U3、U2、U5和7SL snRNA启动子。该公开还提供了用U6、U3、U2、U5和7SL启动子驱动在用于植物中的靶向基因修饰的CRISPR/Cas系统中发挥功能的sgRNA多核苷酸的表达的方法。该公开还提供通过在基因组切割位点处插入平端DNA片段进行基因组修饰的方法。
[0023] WO2015139008公开了用于对DNA序列进行靶向改变的方法和组合物。
[0024] WO2015171894公开了用于选择靶基因中含有突变的修饰植物的方法及通过该方法产生的植物。具体而言,该公开提供这样的方法,该方法包括将编码基因组编辑蛋白的重组表达盒引入亲本植物的分生组织细胞或种系细胞,其中基因组编辑蛋白特异性识别靶基因;使亲本植物杂交或自交,由此产生多个子代种子;选择从子代种子长出的表现可在完整植物平选择的表型的子代植物。
[0025] WO2015189693公开了病毒介导的基因组编辑平台,该平台便于多重化,避免稳定转化,适用于不同植物物种。改造烟草脆裂病毒(TRV)的RNA2基因组,以携带并全身递送向导RNA分子进入过量表达Cas9内切核酸酶的植物中。
[0026] WO2016007948公开了用于植物或植物细胞基因组中靶序列的农艺性状修饰的组合物和方法。
[0027] WO2016084084公开了核酸构建体,该核酸构建体包含烟草脆裂病毒(TRV)序列和编码介导目的基因组的靶序列中的序列特异性切割的单向导RNA(sgRNA)的核酸序列,其中TRV序列缺乏功能性2b序列。还提供包含该构建体的植物细胞和该构建体在基因编辑中的用途。
[0028] WO2016106121公开了用于修饰植物细胞基因组中的靶位点的方法和组合物,由此这类修饰包括转基因整合和突变,以及用于鉴定和富集包含经修饰的靶位点的细胞的方法和组合物。
[0029] WO2016061481公开了从一个多核苷酸构建体(合成基因)产生大量小RNA以便于RNA指导的多重基因组编辑、修饰、表达抑制的材料和方法,及其他基于RNA的技术。
[0030] WO2016116032公开了用于通过基因瞬时表达来在植物中进行位点特异性修饰的方法,该方法包括以下步骤:在目的植物的细胞或组织中瞬时表达对靶片段特异的序列特异性核酸酶,其中序列特异性核酸酶对靶位点特异,通过该核酸酶切割靶位点,由此通过植物的DNA修复达到靶位点的位点特异性修饰。
[0031] Endo等2016(Plant Physiology,2016年2月,170卷,667-677页)教导了用农杆菌顺次递送的方法,首先递送可选地含有gRNA的Cas9构建体,然后在第二步骤中递送供体分子和可选的gRNA,以增强转化效率,允许Cas9在随后引入供体时充分表达。
[0032] 但是,仍然存在优化植物中的基因组编辑系统例如以提高正确编辑事件的回收率的需要。本发明提供用RGEN和供体分子引入特异性修饰来产生靶向序列修饰(如插入、缺失和替换)的改进方法,以及用于评价诸如切点罕见内切核酸酶(例如RGEN)、向导多核苷酸和供体多核苷酸的基因组编辑成分的测定。这将在下文的说明详述、实施例权利要求中描述。
[0033] 发明概述
[0034] 在一方面,提供用于在预先选定的位点处修饰植物细胞的(核)基因组或用于产生具有经修饰的基因组的植物细胞的方法,其包括步骤:
[0035] a.向该植物细胞中引入RNA向导内切核酸酶(RGEN)和至少一个向导多核苷酸,其中该RGEN和该至少一个向导多核苷酸能够形成使得RGEN能够在该预先选定的位点处或附近引入(双链)DNA断裂或一个或多个切口或单链断裂或诱导DNA链替换的复合物;
[0036] b.向该细胞中引入至少一个包含目的多核苷酸的供体多核苷酸;
[0037] c.选择植物细胞,其中该供体多核苷酸已用作用于修复该DNA断裂的模板,由此在该预先选定的位点处整合该目的多核苷酸,在该预先选定的位点处产生该基因组的修饰,其中该修饰选自:
[0038] i.至少一个核苷酸的替换;
[0039] ii.至少一个核苷酸的缺失;
[0040] iii.至少一个核苷酸的插入;或
[0041] iv.i.-iii.的任意组合;
[0042] 其特征在于通过使该植物细胞与至少一个包含编码该RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和该至少一个供体多核苷酸的细菌接触来将该RGEN、该至少一个向导多核苷酸和该至少一个供体多核苷酸引入该植物细胞。
[0043] 该细菌可以是根瘤农杆菌(Agrobacterium tumefaciens)。
[0044] 编码该内切核酸酶的嵌合基因、该至少一个编码该至少一个向导多核苷酸的嵌合基因和该至少一个供体多核苷酸可以定位在一个T-DNA载体上,如一个T-DNA分子上(单组T-DNA边界之间)。
[0045] 在本文所述的任意方法中,RGEN可以是切口酶或一对切口酶。RGEN可以是例如Cas9、Cpf1、CasX、C2c1、Csm1(或其突变体,如切口突变体或核酸酶死亡突变体)。
[0046] 编码该至少一个向导多核苷酸的嵌合基因可以编码两个或多个向导多核苷酸序列。
[0047] 该编码该内切核酸酶的嵌合基因的编码区可以针对在植物中表达进行优化。
[0048] RGEN可以包含SEQ ID NO 6的从10位基酸至1388位氨基酸的氨基酸序列。编码该RGEN的嵌合基因可以包含SEQ ID NO.5的从核苷酸28至核苷酸4164的核苷酸序列。
[0049] 在本文所述任意方法和化合物/产物的另一实施方案中,该细菌进一步包含引入并在该植物细胞中表达的选择标记基因。该选择标记基因可以赋予该植物细胞选择表型。该选择标记基因可以与编码该RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和该至少一个供体多核苷酸一起定位在该一个T-DNA载体上。它可以定位在同一个T-DNA分子上。
[0050] 在一个实施方案中,由该方法引起的(核)基因组中的修饰赋予该植物细胞选择表型。
[0051] 无论由选择标记基因还是由基因组中预先选定的位点处的修饰赋予,该选择表型都可方便地是对一种或多种除草剂的耐受性。
[0052] 在一方面,该修饰赋予该植物细胞的选择表型可以用于直接选择包含该修饰的植物细胞。
[0053] 备选地,该选择标记基因赋予该植物细胞的选择表型可以用于选择包含该修饰的植物细胞。为此,首先选择具有该选择标记基因所赋予的选择表型的一个或多个细胞,然后选择包含所预期的修饰的植物细胞,或确认所选择的一个或多个植物细胞中存在所预期的修饰。
[0054] 该植物细胞可以包含在未成熟胚或成胚愈伤组织(embryogenic callus)内。
[0055] 在本文所述的任意方法和化合物/产物中,该供体DNA分子可以包含位于目的DNA分子侧翼的一条或两条侧翼核苷酸序列,该一条或两条侧翼核苷酸序列与该预先选定的位点上游和/或下游的基因组DNA具有足够的同源性,以允许与该上游和/或下游DNA区同源重组。目的多核苷酸可以包含一个或多个可表达的目的基因,该可表达的目的基因可选地选自除草剂耐受性基因、昆虫抗性基因、疾病抗性基因、非生物胁迫抗性基因、涉及油生物合成或糖类生物合成的酶、涉及纤维强度或纤维长度的酶、涉及次生代谢物生物合成的酶。
[0056] 在本文所述方法的另一个步骤中,可将所选择的植物细胞培养为包含该修饰的植物。在另一步骤中,可使该植物与另一植物杂交,并可以可选地获得包含该修饰的子代植物。在另一步骤中,可以选择包含该修饰但不包含该编码该RGEN的嵌合基因、该至少一个编码该至少一个向导多核苷酸的嵌合基因和该选择标记基因的子代植物。
[0057] 该植物细胞或植物可以是稻植物细胞或植物。
[0058] 在另一方面,提供按照本文所述的任意方法产生的在(核)基因组中预先选定的位点处包含修饰的植物细胞、植物部分、种子、植物产物或植物。
[0059] 还提供包含编码RGEN的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个供体多核苷酸的细菌,其中按照本文所述的方法,该细菌能够将该编码该RGEN的嵌合基因、该编码该向导多核苷酸的嵌合基因和该供体多核苷酸转移入或引入植物细胞(的核基因组),其中该RGEN和该向导多核苷酸在该植物细胞中表达时能够形成使得RGEN能够在植物细胞的(核)基因组中预先选定的位点处引入DNA断裂的复合物,其中该供体多核苷酸将用作用于修复该DNA断裂的模板。该编码该RGEN的嵌合基因、该编码该向导多核苷酸的嵌合基因和该供体多核苷酸可以定位在一个载体上,如一个T-DNA分子上(一对T-DNA边界之间)。
[0060] 还描述用于本方法的(T-DNA)载体,该载体例如在一个T-DNA分子上(一对T-DNA边界之间)包含本文所述的编码RGEN的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个供体多核苷酸。
[0061] 在另一方面,提供用于修饰植物细胞中的内源EPSPS基因或用于产生具有经修饰的EPSPS基因的植物细胞或用于测试基因组编辑(成分)的效率的方法,其包括步骤:
[0062] a.在该细胞中表达识别该植物的内源EPSPS基因中的序列的位点定向DNA修饰多肽和/或向该植物细胞中引入可用作用于修饰该内源EPSPS基因的模板的供体多核苷酸;
[0063] b.通过在包含一种或多种EPSPS抑制剂的培养基上培养该植物细胞来评价该植物细胞对该EPSPS抑制剂的耐受性;并可选地
[0064] c.选择对该EPSPS抑制剂具有提高的耐受性的植物细胞。
[0065] EPSPS抑制剂(例如草甘膦(glyphosate))可以用作直接选择剂。
[0066] 还描述用于在预先选定的位点处修饰植物细胞的(核)基因组的方法,其包括步骤:
[0067] a.向该细胞中引入核苷酸向导DNA修饰多肽(NGDMP)和向导多核苷酸,其中该NGDMP和向导多核苷酸能够形成使得NGDMP能够在预先选定的位点处修饰植物细胞基因组的复合物;
[0068] b.选择其中已在该预先选定的位点处修饰了该基因组的植物细胞;
[0069] 其特征在于用粒子流入枪将该NGDMP、该向导多核苷酸引入该植物细胞。
[0070] 还描述用于在预先选定的位点处修饰植物细胞的(核)基因组的方法,其包括步骤:
[0071] a.向该细胞中引入核苷酸向导DNA修饰多肽(NGDMP)和向导多核苷酸,其中该NGDMP和向导多核苷酸能够形成使得NGDMP能够在预先选定的位点处修饰植物细胞基因组的复合物;
[0072] b.向该细胞中引入至少一个(植物可表达的)选择标记基因;
[0073] c.选择一个或多个包含该选择标记基因的植物细胞;
[0074] d.选择其中已在该预先选定的位点处修饰了该基因组的植物细胞;
[0075] 其特征在于通过使该植物细胞与至少一个包含编码该RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和至少一个含有该选择标记基因的多核苷酸的细菌接触来将该NGDMP、该至少一个向导多核苷酸和该至少一个选择标记基因引入该植物细胞。
[0076] 该RGDMP可以是RGEN,其中该RGEN和该至少一个向导多核苷酸能够形成使得RGEN能够在该预先选定的位点处或附近引入DNA断裂的复合物。
[0077] 可将包含目的多核苷酸的供体多核苷酸与该RGEN和该向导多核苷酸一起引入该植物细胞,其中该供体多核苷酸用作用于修复该DNA断裂的模板,由此在该预先选定的位点处整合该目的多核苷酸,在该预先选定的位点处产生该基因组的修饰。
[0078] 还提供包含编码NGDMP的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个(植物可表达的)选择标记基因的细菌,其中按照本文所述的方法,该细菌能够将该编码该NGDMP的嵌合基因、该编码该向导多核苷酸的嵌合基因和该选择标记基因转移入或引入植物细胞(的核基因组),其中该NGDMP和该向导多核苷酸在该植物细胞中表达时能够形成使得NGDMP能够修饰植物细胞的(核)基因组的复合物。该编码该NGDMP的嵌合基因、该编码该向导多核苷酸的嵌合基因和该选择标记基因可以定位在一个载体上,如一个T-DNA分子上(一对T-DNA边界之间)。
[0079] 还描述如在一个T-DNA分子上(一对T-DNA边界之间)包含本文所述方法的编码NGDMP的嵌合基因、编码向导多核苷酸的嵌合基因和选择标记基因的(T-DNA)载体。
[0080] 附图简述
[0081] 图1:TIPS测定的示意性总览。
[0082] 图2:从通过轰击成胚愈伤组织获得的GlyT事件获得的克隆PCR产物的比对。
[0083] 发明详述
[0084] 发明人发现,在用包含RGEN表达盒(例如用于Cas9)、编码向导多核苷酸的嵌合基因和用于修复所诱导的DNA断裂的供体DNA的单个农杆菌菌株转化植物时,精确基因编辑事件的回收率令人惊奇地比用直接递送法在分开的载体上一起提供这三种成分时高。为此,用在一个T-DNA载体上、更具体而言在单对T-DNA边界之间(即在一个T-DNA分子上)包含这三种成分的农杆菌菌株转化了成胚愈伤组织或稻未成熟胚。在用供体DNA转化来在稻内源EPSPS基因中引入导致除草剂耐受性提高的突变(TIPS突变)时,与直接递送(约0.2%至1.6%)相比,这产生了至多约10%的提高的耐草甘膦事件回收率。目前的农杆菌法因此令人惊奇地产生足够的Cas9表达,以允许在同时引入时有效整合供体DNA。认为与粒子轰击相比农杆菌介导的DNA递送更高的细胞打靶频率产生于与通过粒子轰击递送DNA相比,农杆菌介导DNA递送时将DNA引入了更高数目的细胞。还发现,在基于由共同递送的选择标记基因提供的耐受性选择事件时,几乎一半(43%)的耐受事件甚至似乎包含所希望得到的修饰。
这明显增强了还回收难以选择所预期的修饰本身的事件的可能性。此外,农杆菌介导的转化(或类似细菌系统)具有这样的优势,它可以用于不适于轰击的植物物种或变种。在直接递送法中,粒子流入枪轰击提供最佳结果。还发现,通过EPSPS打靶,直接草甘膦选择可用作成功编辑的读出,从而提供用于评价和比较诸如序列特异性内切核酸酶(例如大范围核酸酶、ZFN、TALEN、RGEN等)、向导多核苷酸和供体构建体的基因组编辑成分的有用测定系统。
[0085] WO2015026883教导了使已包含Cas9盒的植物与包含gRNA盒的植物杂交,或提供含有gRNA盒和可选的供体构建体的已包含Cas9盒的植物,由此指向在引入向导和供体多核苷酸时已具有RGEN表达的重要性。WO2015026883还教导通过直接递送(粒子枪轰击)在玉米中编辑EPSPS,及用双丙氨膦(bialaphos)选择来富集产生于共转化的moPAT选择标记基因的编辑事件(间接选择)。长期选择和培养后,从3282个胚开始,产生了390株T0植物,其中72%包含诱变的EPSPS。但是,大多数修饰EPSPS事件产生于NHEJ,而仅小部分修饰事件包含所预期的来自重组模板(供体核酸)的TIPS突变。
[0086] WO2015/026886描述了玉米EPSPS编辑,其中用粒子轰击将重组模板与sgRNA表达盒和Cas9表达载体连同moPAT选择标记基因一起共同递送,并在双丙氨膦上进行初始选择。
[0087] WO2015131101描述了用PEG转化和轰击共同递送三种成分。WO2016007948公开了通过粒子轰击共同递送gRNA构建体、多核苷酸修饰模板、Cas9盒。
[0088] Endo等2016(Plant Physiology,2016年2月,170卷,667-677页)教导了用农杆菌顺次递送的方法,首先递送可选地含有gRNA的Cas9构建体,然后在第二步骤中递送供体分子和可选的gRNA,以增强转化效率,允许Cas9在随后引入供体时充分表达。
[0089] 因此,现有技术公开了通过直接递送法同时递送gRNA构建体、RGEN构建体和供体多核苷酸,或先递送仅至少RGEN构建体,然后递送供体多核苷酸。
[0090] 因此,在第一方面,本发明涉及用于在预先选定的位点处修饰植物细胞的(核)基因组或用于产生在其(核)基因组中预先选定的位点处包含修饰(即靶向修饰)的植物细胞的方法,其包括步骤:
[0091] a.向该植物细胞中引入RNA向导内切核酸酶(RGEN)和至少一个向导多核苷酸,其中该RGEN和该至少一个向导多核苷酸能够形成使得RGEN能够在该预先选定的位点处或附近引入DNA断裂(双链DNA断裂或一个或多个切口或单链断裂)或诱导DNA链替换(例如通过无催化活性的核酸酶)的复合物;
[0092] b.向该细胞中引入至少一个包含目的多核苷酸的供体多核苷酸;
[0093] c.选择植物细胞,其中该供体多核苷酸已用作用于修复该DNA断裂的模板,由此在该预先选定的位点处整合该目的多核苷酸,在该预先选定的位点处产生该基因组的修饰,其中该修饰选自:
[0094] i.至少一个核苷酸(即一个或多个核苷酸)的替换;
[0095] ii.至少一个核苷酸(即一个或多个核苷酸)的缺失;
[0096] iii.至少一个核苷酸(即一个或多个核苷酸)的插入;或
[0097] iv.i.-iii.的任意组合;
[0098] 其特征在于通过使该细胞与至少一个细菌接触来将该RGEN、该至少一个向导多核苷酸和该至少一个供体多核苷酸引入该植物细胞,该至少一个细菌包含编码该RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和该至少一个供体多核苷酸。
[0099] 本文所述的RNA向导核酸酶或内切核酸酶是具有(内切)核酸酶活性的RNA向导DNA修饰多肽。
[0100] RGEN通常源自CRISPR系统,CRISPR系统是广泛存在的一类用于防御外来核酸的细菌系统。CRISPR系统见于广范围的真细菌和古细菌生物中。CRISPR系统包括I、II、III和V亚型(参见例如2007025097;WO2013098244;WO2014022702;WO2014093479;WO2015155686;EP3009511;US2016208243)。野生型II型CRISPR/Cas系统利用与向导和活化RNA复合的RNA向导核酸酶(例如Cas9)来识别和切割外来核酸(Jinek等,2012,上文)。
[0101] Cas9同源物见于多种真细菌中,包括但不限于以下分类群的细菌:放线菌(Actinobacteria)、产水菌门(Aquificae)、拟杆菌门-绿菌门(Bacteroidetes-Chlorobi)、衣原体-疣微菌门(Chlamydiae-Verrucomicrobia)、Chlroflexi、蓝细菌(Cyanobacteria)、硬壁菌门(Firmicutes)、朊细菌门(Proteobacteria)、螺旋体门(Spirochaetes)和热孢菌门(Thermotogae)。示例性Cas9蛋白质是酿脓链球菌(Streptococcus pyogenes)Cas9蛋白质。其他Cas9蛋白质、其同源物和变体及用于基因编辑的方法描述于例如Chylinksi等,RNA Biol.2013年5月1日;10(5):726-737;Nat.Rev.Microbiol.2011年6月;9(6):467-477;Hou等,Proc Natl Acad Sci U S A.2013年9月24日;110(39):15644-9;Sampson等,Nature.2013年5月9日;497(7448):254-7;Jinek等,Science.2012年8月17日;337(6096):
816-21;WO2013142578;WO2013176772;WO2014065596;WO2014089290;WO2014093709;
WO2014093622;WO2014093655;WO2014093701;WO2014093712;WO2014093635;
WO2014093595;WO2014093694;WO2014093661;WO2014093718;WO2014093709;
WO2014099750;WO2014113493;WO2014190181;WO2015006294;WO2015071474;
WO2015077318;WO2015089406;WO2015103153;WO201621973;WO201633298;WO201649258中,全都在此引入作为参考。
[0102] 其他RNA向导核酸酶包括例如Cpf1(也称为Cas12a)及其同源物和变体(如例如Zetsche等,Cell,163卷,3期,759-771页,2015年10月22日;EP3009511;US2016208243;Kleinstiver等,Nat Biotechnol.2016年8月;34(8):869-74;Gao等,Cell Res.2016年8月;
26(8):901-13;Hur等,2016Nat Biotech;Kim等,2016Nat Biotech;Yamano等,Cell.2016年
4月21日;WO2016166340;WO2016205711;further Broad;WO2017064546;WO2017141173;
WO201795111中所述,全都在此引入作为参考。
[0103] 其他RNA向导核酸酶还包括例如C2c1和C2c3(也分别称为Cas12b和Cas12c;Shmakov等,Mol Cell.2015年11月5日;60(3):385-97;EP3009511;WO2016205749)、Csm1(WO2017141 173)、CasX和CasY(Burnstein等,Nature 542卷,2017)及其他来自另一2类crispr系统的核酸酶(Schmakov等,Nature Reviews Microbiology 15,169-182,2017)(全都在此引入作为参考)。
[0104] 其他RNA向导核酸酶可以包括Argonaut样蛋白,如WO2015157534中所述的eg。
[0105] WO2013088446中描述了其他RNA向导核酸酶和其他RNA向导多肽。
[0106] 在一个实施方案中,该RGEN还可以是RNA向导切口酶或一对RNA向导切口酶,其各自在预先选定的位点处或附近的双链DNA的仅一条链中引入断裂。在一对切口酶中,一种酶在预先选定的位点处或附近的DNA的一条链中引入断裂,而另一种酶在预先选定的位点处或附近的DNA的另一条链中引入断裂。两个单链断裂可以在两条链上的同一核苷酸位置处引入,产生平端双链DNA断裂,但两个单链断裂也可以在各链中不同的核苷酸位置处引入,在断裂位点产生5’或3’突出(“黏端”或“交错切割”)。在一个实施方案中,以这样的方式选择指导切口酶的两个向导多核苷酸,使得产生如例如WO201628682中所述的具有3’突出的断裂。切口突变体及其用途例如描述于以上文件中,尤其是WO2014191518、WO2014204725、WO201628682中。仅在DNA的两条链的一条中引入断裂(即单链DNA断裂)的单个切口突变体还可以增强与供体多核苷酸的同源性指导修复(HDR)(Richardson等2016,Nature Biotechnology 34,339-344;US62/262,189)。
[0107] 作为核酸酶或切口酶的替代,还可以用上述核酸酶的核酸酶缺陷(也称为“死亡”或无催化活性)变体如dCas9来增加供体多核苷酸的靶向插入,如例如Richardson等2016,Nature Biotechnology 34,339-344;US62/262,189中所述。这类变体缺乏切割或切口DNA的能力,但能够靶向至并结合DNA(参见例如WO2013176772、EP3009511)。认为这些“死亡”核酸酶通过结合两条链之一(“DNA解链”),由此通过允许供体多核苷酸与另一“游离”DNA链退火来增强与供体多核苷酸的重组,诱导链替换。
[0108] 切口突变体已针对多种RGEN描述过,且涉及催化结构域如RuvC样结构域(例如Cpf1)的HNH和RuvC结构域(例如Cas9)中的一个或多个突变。例如,通过RuvC中的突变D10A可将SpCas9转化为切口酶,HNH核酸酶结构域中的863A将SpCas9转化为DNA切口酶,而失活两个核酸酶结构域产生无催化活性的蛋白质(Jinek等,2012,上文,Gasiunas等,2012,Proc.Natl.Acad.Sci.USA 109,E2579-E2586)。在Cpf1中,发现D917A以及E1006A突变完全失活FnCpf1的DNA切割活性,而D1255A显著降低溶核活性(Zetsche等,2015,上文)。其他RGEN(例如Cas9或Cpf1)变体的相应残基可以通过最佳比对来确定。
[0109] 本文所用的编码RGEN的嵌合基因通常包含以下有效连接的成分:编码RGEN的DNA区(RGEN编码区)、(植物可表达的)启动子及可选的在植物中具有功能的聚腺苷酸化和转录终止子(3’端区域)。这种启动子可以是组成型启动子,但取决于希望RGEN在何时表达,也可以使用其他启动子,如诱导型启动子(例如胁迫诱导型启动子、干旱诱导型启动子、激素诱导型启动子、化学品诱导型启动子等)、组织特异性启动子、发育调节启动子等。
[0110] 植物可表达的组成型启动子是能够在大多数细胞类型中(以不依赖于时空的方式)指导高水平表达的启动子。植物可表达的组成型启动子的实例包括细菌来源的启动子,如来自农杆菌的章鱼合酶(OCS)和胭脂氨酸合成酶(NOS)启动子,以及病毒来源的启动子,如花椰菜花叶病毒(CaMV)35S转录物(Hapster等,1988,Mol.Gen.Genet.212:182-190)或19S RNA基因(Odell等,1985,Nature.6;313(6005):810-2;美国专利号5,352,605;WO 84/02913;Benfey等,1989,EMBO J.8:2195-2202)的启动子,增强型2x35S启动子(Kay等,
1987,Science 236:1299-1302;Datla等(1993),Plant Sci 94:139-149),木薯脉花叶病毒的启动子(CsVMV;WO 97/48819,US 7,053,205),2xCsVMV(WO2004/053135),圆环病毒(AU 
689 311)启动子,甘蔗杆状DNA病毒(ScBV)启动子(Samac等,2004,Transgenic Res.13(4):
349-61),玄参花叶病毒(FMV)启动子(Sanger等,1990,Plant Mol Biol.14(3):433-43),地三叶草病毒启动子4号或7号(WO 96/06932),及US 5,164,316、US 5,196,525、US 5,322,
938、US 5,359,142和US 5,424,200中所述的增强型35S启动子。在植物来源的启动子中,应提到来自玉米(Zea mays)和向日葵的植物核糖-双羧化酶/化酶(Rubisco)小亚基启动子(US 4,962,028;W099/25842),拟南芥(Arabidopsis thaliana)组蛋白H4基因启动子(Chabouté等,1987),玉米、稻和甘蔗的泛素启动子(Holtorf等,1995,Plant Mol.Biol.29:
637-649,US 5,510,474),稻肌动蛋白1启动子(Act-1,US 5,641,876),EP 0 507 698 A1中所述的组蛋白启动子,玉米醇脱氢酶1启动子(Adh-1)(来自http://www.patentlens.net/daisy/promoters/242.html))。如果该使用是与各终止之的使用组合,则也可以使用来自菊属(Chrysanthemum)的小亚基启动子(Outchkourov等,Planta,216:1003-1012,2003)。
[0111] 其他植物可表达的启动子可以是响应环境、激素、化学、发育信号而以组织或细胞或种系或发育阶段特异的方式调节基因表达的植物基因启动子。启动子的选择主要基于目的表型,由诸如组织(例如种子、果实、根、花粉、维管组织、花、心皮等)、可诱导性(例如响应创伤、热、冷、干旱、光、病原体等)、定时、发育阶段等的因素决定。
[0112] 可用于实施本发明的其他启动子是响应胁迫而引出表达的那些,如响应干旱、低温、盐胁迫或暴露于ABA而激活的RD29启动子(Yamaguchi-Shinozaki等,2004,Plant Cell,6卷,251-264;WO12/101118),以及响应热(例如参见Ainley等(1993)Plant Mol.Biol.22:
13-23)、光(例如豌豆rbcS-3A启动子,Kuhlemeier等(1989)Plant Cell 1:471-478,及玉米rbcS启动子,Schaffher和Sheen(1991)Plant Cell 3:997-1012)、创伤(例如wunl,Siebertz等(1989)Plant Cell 1:961-968)、病原体(如Buchel等(1999)Plant 
Mol.Biol.40:387-396中所述的PR-I启动子和Manners等(1998)Plant Mol.Biol.38:1071-
1080中所述的PDF 1.2启动子)和化学品如茉莉酮酸甲酯或水杨酸(例如参见Gatz(1997)Annu.Rev.Plant Physiol.Plant Mol.Biol.48:89-108)而诱导的启动子。此外,通过使用诸如在衰老(参见例如Gan和Amasino(1995)Science 270:1986-1988)或晚期种子发育(例如参见Odell等(1994)Plant Physiol.106:447-458)时发挥作用的那些启动子的启动子,可以控制表达的时间。
[0113] 还可以使用盐诱导型启动子,如稻地方品种Pokkali(PKN)的盐诱导型NHX1启动子th(Jahan等,6  International Rice Genetics symposium,2009,海报摘要4-37页),来自小盐芥(Thellungiella halophila)的液泡H+-焦磷酸酶的盐诱导型启动子(TsVP1)(Sun等,BMC Plant Biology 2010,10:90),编码磷脂过氧化氢同种型gpx1的甜橙(Citrus sinensis)基因的盐诱导型启动子(Avsian-Kretchmer等,Plant Physiology 2004年7月
135卷,1685-1696页)。
[0114] 使用组织特异性和/或发育阶段特异性启动子,例如仅在该组织内在发育阶段的某时间框内可以促进转录的启动子。参见例如Blazquez(1998)Plant Cell 10:791-800,其表征拟南芥LEAFY基因启动子。还参见Cardon(1997)Plant J 12:367-77,其描述识别拟南芥花分生组织同一性基因API的启动子区中的保守序列基序的转录因子SPL3;及Mandel(1995)Plant Molecular Biology,第29卷,第995-1004页,其描述分生组织启动子eIF4。可以使用在特定组织的整个生命周期中具有活性的组织特异性启动子。在一方面,本发明的核酸与主要仅在纤维细胞中具有活性的启动子有效连接,在一方面,本发明的核酸与主要在棉纤维细胞伸长阶段具有活性的启动子有效连接,例如,如Rinehart(1996)上文所述。核酸可以与将优先在棉纤维细胞中表达的FbI2A基因启动子有效连接(同上)。还参见John(1997)Proc.Natl.Acad.Sci.USA 89:5769-5773;John等,美国专利号5,608,148和5,602,
321,其描述棉纤维特异性启动子和用于构建转基因棉植物的方法。还可以用根特异性启动子来表达本发明的核酸。根特异性启动子的实例包括来自醇脱氢酶基因的启动子(DeLisle(1990)Int.Rev.Cytol.123:39-60),及诸如美国专利号5,618,988、5,837,848和5,905,186中所公开的那些的启动子。可用于表达本发明的核酸的其他启动子包括例如胚珠特异性、胚特异性、胚乳特异性、珠被特异性、种皮特异性启动子,或其某种组合;叶特异性启动子(参见例如Busk(1997)Plant J.11:1285 1295,其描述玉米中的叶特异性启动子);来自发根农杆菌(Agrobacterium rhizogenes)的ORF13启动子(其在根中显示高活性,参见例如Hansen(1997)上文);玉米花粉特异性启动子(参见例如Guerrero(1990)
Mol.Gen.Genet.224:161 168);可以使用在果实成熟、叶片衰老和脱落期间具有活性的番茄启动子,花的(在较小程度上)保卫细胞优先启动子(例如PCT/EP12/065608中所述)(参见例如Blume(1997)Plant J.12:731 746);来自铃薯SK2基因的雌蕊特异性启动子(参见例如Ficker(1997)Plant Mol.Biol.35:425431);来自豌豆的Blec4基因,其在转基因苜蓿的营养枝顶端和花柄顶端的表皮组织中具有活性,使得它可成为将外来基因的表达靶向至活跃生长的枝条或纤维的表皮层的有用工具;胚珠特异性BELI基因(参见例如Reiser(1995)Cell 83:735-742,GenBank No.U39944);和/或Klee,美国专利号5,589,583中的启动子,该专利描述了能够在分生组织和/或快速分裂细胞中赋予高水平转录的植物启动子区。可以用于本发明的其他组织特异性启动子包括:种子特异性启动子(如美国专利号5,773,697中所述的油菜籽蛋白、菜豆蛋白或DC3启动子),在果实成熟期间具有活性的果实特异性启动子(如dru 1启动子(美国专利号5,783,393),或2AI 1启动子(例如参见美国专利号4,943,
674)和番茄多聚半乳糖酸酶启动子(例如参见Bird等(1988)Plant Mol.Biol.11:651-
662),花特异性启动子(例如参见Kaiser等(1995)Plant Mol.Biol.28:231-243),花粉活性启动子如PTA29、PTA26和PTAI 3(例如参见美国专利号5,792,929),如例如Baerson等(1994Plant Mol.Biol.26:1947-1959)中所述,在维管组织(例如参见Ringli和Keller(1998)Plant Mol.Biol.37:977-988)、心皮(例如参见Ohl等(1990)Plant Cell 2:)、花粉和胚珠(例如参见Baerson等(1993)Plant Mol.Biol.22:255-267)中具有活性的启动子。在备选实施方案中,用可在暴露于植物激素(如植物生长素)时诱导的植物启动子来表达用于实施本发明的核酸。例如,本发明可以使用大豆{Glycine max L.)中的植物生长素应答元件E1启动子片段(AuxRE)(Liu(1997)Plant Physiol.115:397-407);植物生长素响应性拟南芥GST6启动子(也响应水杨酸和过氧化氢)(Chen(1996)Plant J.10:955-966);来自烟草的植物生长素诱导型parC启动子(Sakai(1996)37:906-913);植物生物素应答元件(Streit(1997)Mol.Plant Microbe Interact.10:933-937);及响应胁迫激素脱落酸(ABA)的启动子(Sheen(1996)Science 274:1900-1902)。可以使用的其他激素诱导型启动子包括植物生长素诱导型启动子(如van der Kop等(1999)Plant Mol.Biol.39:979-990或Baumann等,(1999)Plant Cell 11:323-334中所述的植物生长素诱导型启动子)、细胞分裂素诱导型启动子(例如参见Guevara-Garcia(1998)Plant Mol.Biol.38:743-753)、响应赤霉素的启动子(例如参见Shi等(1998)Plant Mol.Biol.38:1053-1060,Willmott等(1998)Plant Molec.Biol.38:817-825)等。
[0115] 其他启动子可以是可在暴露于可应用于植物的化学试剂如除草剂或抗生素时诱导的植物启动子。例如,可以使用由苯磺酰胺除草剂安全剂激活的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol.38:568-577);不同除草剂安全剂的应用诱导不同的基因表达模式,包括根、排水器和茎端分生组织中的表达。编码序列可以处在例如四环素诱导型启动子(例如就包含燕麦(Avena sativa L)精氨酸脱羧酶基因的转基因烟草植物所述(Masgrau(1997)Plant J.11:465-473))或水杨酸应答元件(Stange(1997)Plant J.11:1315-1324)的控制之下。使用化学{例如激素或杀虫剂)诱导型启动子,即响应可应用于大田中的转基因植物的化学品的启动子,可以在植物的特定发育阶段诱导本发明的多肽表达。还可以用美国专利号6,784,340和Zuo等(2000,Plant J.24:265-273)中所述的雌激素诱导型表达系统来驱动用于实施本发明的核酸的表达。
[0116] 在备选实施方案中,可以使用这样的启动子,该启动子的宿主范围限于靶植物物种,如玉米、稻、大麦、小麦、马铃薯或其他作物,可在作物的任何发育阶段诱导。
[0117] 在备选实施方案中,组织特异性植物启动子可以驱动有效连接的序列在特异性靶组织中表达。在备选实施方案中,使用驱动优先在靶组织或细胞类型中表达但也可以在其他组织中产生一些表达的组织特异性启动子。
[0118] 在备选实施方案中,可以使用例如http://arabidopsis.med.ohio-state.edu/AtcisDB/bindingsites.html.上所述的启动子元件,这些启动子元件可以组合产生功能性启动子。
[0119] RNA向导蛋白质(如RGEN)借助于向导多核苷酸(如向导RNA)靶向至特异性靶核酸(例如DNA)。本文所用的向导多核苷酸是可指导RNA向导蛋白质(如RGEN)至特异性靶序列的多核苷酸。优选的向导多核苷酸是向导RNA或gRNA。“靶序列”指设计向导序列来靶向(例如具有互补性)的序列。技术人员将充分意识到,如也描述于上文引用的文献中的对与某种RGEN结合使用的向导多核苷酸的要求,以及在使用某种RGEN时对靶序列的某些要求(例如特异性原间隔区邻近基序“PAM”)。同样,技术人员可充分意识到各RGEN在靶序列内的切割位点的位置。
[0120] 本文所用的至少一个向导多核苷酸指一个或多个向导多核苷酸。实际上,可向细胞提供用于表达一个以上向导多核苷酸的构建体,以允许多重化,即同时靶向多个位点。这类方法例如描述于Xie等(PNAS,2015年3月17日,112卷,11期,3570-3575页)、WO2016061481、WO2015099850、Char等,(Plant Biotechnology Journal,2016年9月5日)(在此引入作为参考)中。向导RNA的组成和结构(包括可能的tracr和PAM区)在本领域中已得到充分阐述,本文所述的向导多核苷酸对应于本领域中所述的那些。
[0121] 编码该至少一个向导多核苷酸(向导RNA)的嵌合基因包含以下有效连接的元件:适合用于表达RNA的启动子、编码gRNA的DNA区和可选的适合用于表达RNA的终止区(3’端区或终止子)。这类启动子通常是DNA聚合酶III(pol III)启动子,但也可以使用pol II启动子(WO2015099850)。植物可表达的pol III启动子尤其适合用于表达本发明的向导RNA,植物功能性pol III终止子也是,如例如Jiang W.等,2013;WO2014186686;WO2014194190;
WO2015026883;WO2015026885;WO2015026886;WO2015131101;WO2015171894;WO2016007948中所述。
[0122] 本文所用的供体多核苷酸指用作用于在邻近或处于切割位点(即DNA断裂位点)的预先选定的位点处修饰基因组DNA的模板的多核苷酸(例如单链或双链DNA分子或RNA分子),因此也称为重组模板。本文所用的“用作用于修饰基因组DNA的模板”意指在预先选定的位点处拷贝或整合(部分)供体多核苷酸。这可以通过供体多核苷酸和邻近预先选定的位点的序列中的同源序列之间的同源重组来达到,或可选地与供体多核苷酸的两端之一的非同源末端连接(NHEJ)组合,由此导致在预先选定的位点处掺入目的多核苷酸。同源重组整合将允许在核苷酸水平将供体多核苷酸与靶基因组连接,而NHEJ可在供体多核苷酸和基因组DNA之前的接界处产生小的插入/缺失。
[0123] 本文所用的目的多核苷酸指供体多核苷酸中在拷贝或整合进入靶基因组时产生所预期的靶向修饰(也称为精确或精准编辑事件或靶向插入事件)的序列。该修饰可以是替换至少一个核苷酸、缺失至少一个核苷酸、插入至少一个核苷酸、或其任意组合,只要所产生的序列在至少一个核苷酸上不同于原基因组序列。因此,该修饰可以是至少一个核苷酸改变,但也可以是多个核苷酸改变,如替换、插入或缺失或其组合,由此允许通过本领域公知的技术(如测序、PCR分析、限制性分析等)鉴定该修饰。
[0124] 本文所用的“预先选定的位点”或“预先确定的位点”指基因组(例如核基因组)中的特定核苷酸序列,希望在该位置处插入、替换和/或缺失一个或多个核苷酸。这可以例如是内源基因座或之前引入的外来DNA或转基因中或与之前引入的外来DNA或转基因连接的特定核苷酸序列。预先选定的位点可以是预期在该处(或之后)插入一个或多个核苷酸的特定核苷酸位置。预先选定的位点还可以包含待更换(替换)或缺失的一个或多个核苷酸的序列。
[0125] 关于DNA断裂诱导位点的位置,本文所用的“该预先选定的位点处或附近”指断裂位点(切割位点)与预先选定的位点重叠(预先选定的位点处)或远离预先选定的位点(即发生靶向修饰的位点)定位(预先选定的位点附近或邻近预先选定的位点)。这可以是距离预先选定的位点例如1bp、2bp、3bp、4bp、5bp、6bp、7bp、8bp、9bp、10bp、15bp、20bp、25bp、30bp、40bp、50bp,以及例如100bp、200bp、300bp、400bp、500bp、1kb、2kb或5kb,如例如WO2014161821中所述。
[0126] 本发明的细菌可以是能够指导包含在细菌内的DNA稳定转移入植物细胞基因组的任何细菌,优选非致病或武器解除(不含癌基因)的细菌。这类细菌包含一个或多个质粒,例如肿瘤诱导质粒(Ti质粒)或根诱导质粒(Ri质粒),其中所谓的转移DNA(T-DNA)在转化后转移入植物细胞并整合入植物基因组。某些根瘤菌目(Rhizobiales)的土壤细菌具有这种能力,如根瘤菌科(Rhizobiaceae)(例如根瘤菌属物种(Rhizobium spp.)、中华根瘤菌属物种(Sinorhizobium  spp.)、农杆菌属物种(Agrobacterium  spp.));叶杆菌科(Phyllobacteriaceae)(例如中生根瘤菌属物种(Mesorhizobium spp.)、叶杆菌属物种(Phyllobacterium spp.));布鲁氏菌科(Brucellaceae)(例如苍白杆菌属物种
(Ochrobactrum spp.));慢生根瘤菌科(Bradyrhizobiaceae)(例如慢生根瘤菌属物种(Bradyrhizobium spp.));及黄色杆菌科(Xanthobacteraceae)(例如固氮根瘤菌属物种(Azorhizobium spp.))、农杆菌属物种、根瘤菌属物种、中华根瘤菌属物种、中生根瘤菌属物种、叶杆菌属物种、苍白杆菌属物种和慢生根瘤菌属物种,其实例包括苍白杆菌属物种、根瘤菌属物种、百脉根中生根瘤菌(Mesorhizobium loti)、苜蓿中华根瘤菌
(Sinorhizobium meliloti)。根瘤菌的实例包括豌豆根瘤菌三叶草生物变种
(R.leguminosarum bv,trifolii)、豌豆根瘤菌菜豆生物变种(R.leguminosarum bv,phaseoli)和豌豆根瘤菌蚕豆生物变种(Rhizobium leguminosarum,bv,viciae)(美国专利
7,888,552)。
[0127] 能够转化植物细胞并诱导DNA掺入植物基因组的可用于实施本发明的其他细菌有固氮菌属(Azobacter)(需氧)、新月藻属(Closterium)(严格厌氧)、克雷伯氏菌属(Klebsiella)(选择性需氧)和红螺菌属(Rhodospirilllum)(厌氧,具有光合活性)的细菌。还发现Ti质粒的转移赋予若干根瘤菌科成员如三叶草根瘤菌(Rhizobium trifolii)、豌豆根瘤菌(Rhizobium leguminosarum)和紫金叶杆菌(Phyllobacterium myrsinacearum)肿瘤诱导能力,而根瘤菌属物种NGR234、苜蓿中华根瘤菌和百脉根中生根瘤菌实际上可修饰为介导基因转移至许多多样的植物(Broothaerts等,2005,Nature,433:629-633)。
[0128] T-DNA通过农杆菌等转移至植物细胞的机制有充分记录(参见例如Tzfira和Citovsky(2006)Curr.Opin.Biotechnol.17:147-154;Gelvin(2003)Microbiol.Molec.Biol.Rev.67:16-37;Gelvin(2009)Plant Physiol.150:1665-1676)。简言之,T-DNA通常通过称为右边界(RB)和左边界(LB)的两个边界区定界。边界通过毒力蛋白VirD2形成切口,产生在其5’端共价附着40VirD2的单链转移DNA。蛋白质-DNA复合物(还包含农杆菌VirE2蛋白质)通过所谓的4型分泌系统(T4SS,毒力蛋白和ssDNA转运蛋白二者)排出农杆菌细胞,借助农杆菌毒力蛋白和植物因子二者转移入植物细胞并整合在植物基因组中。vir基因通常作为一系列操纵子见于Ti或Ri质粒上。多种Ti和Ri质粒在vir基因互补链中稍有不同,例如并非总是存在virF。用农杆菌介导的载体来将DNA引入植物细胞为本领域公知。参见例如Fraley等,(1985;Biotechnology 3:629-635),Rogers等,(1987;Methods Enzymol 153:253-277)和美国专利号5,563,055。
[0129] T-DNA转移并非严格需要左边界(LB),因为缺乏LB但包含RB的含有癌基因的T-DNA具有高毒力,而这类包含LB但不含RB的T-DNA完全无毒力(Jen等,1986,J Bacteriol 166:491-499)。因此,本文所用的T-DNA指可通过细菌转移至植物细胞的DNA分子,其除用于修复DNA断裂的DNA(修复DNA)外还包含至少一个T-DNA边界,优选至少右T-DNA边界。但是,为了防止掺入所不希望的载体元件,左边界和右边界都应包含,即在目的DNA侧翼,因为这些边界确定T-DNA分子的末端。
[0130] 已描述左边界比右边界更倾向于“读过”(参考文献)。因此,为了减少一个载体中的两个DNA加工为单个T-DNA分子的机会,两个T-DNA可以这样取向,使得在载体上两个T-DNA最靠近彼此定位的点,不存在两个左边界面对面(头对头;RB-LB;LB-RB)。因此,在一个实施方案中,载体上的两个T-DNA的取向是这样,使得在载体上两个T-DNA最靠近彼此定位的点,存在两个右边界面对面(T-DNA处于尾对尾取向:LB-RB;RB-LB)。在更优选的实施方案中,载体上两个T-DNA的取向为同一方向,使得一个T-DNA的左边界面对另一个T-DNA的右边界,即两个T-DNA处于头对尾取向(LB-LB;RB-LB)。
[0131] 可以用于本发明的隶属于农杆菌属的细菌的实例包括但不限于根瘤农杆菌、发根农杆菌、放射形农杆菌(Agrobacterium radiobacter)、悬钩子农杆菌(Agrobacterium rubi)、葡萄农杆菌(Argobacterium vitis)。所使用的农杆菌属物种可以是野生型(例如有毒力)或武器接触菌株。适宜的农杆菌菌株包括野生型菌株(例如根瘤农杆菌),或其中突变了一个或多个基因以提高转化效率的菌株,例如其中vir基因表达和/或其诱导由于突变体或嵌合virA或virG基因的存在而改变的农杆菌菌株(例如Chen和Winans,1991,J.Bacteriol.173:1139-1144;和Scheeren-Groot等,1994,J.Bacteriol.176:6418-6246),例如美国专利号6,483,013中所述的包含优选与多拷贝质粒连接的额外virG基因拷贝(如源自pTiBo542的超级virG基因)的农杆菌菌株。其他适宜的菌株包括但不限于:根瘤农杆菌GV3101(pMP90))(Konc和Schell,1986,Mol Gen Genet.204:383-396)、LBA4404(Hoekema等,Nature 303:179-180(1983))、EHA101(Hood等,J.Bac.168:1291-1301(1986))、EHA105(Hood等,Trans Res.2:208-218(1993))、AGL1(Lazo等,Bio Technology 2:963-967(1991))。
[0132] 对于农杆菌介导的植物转化,可将待插入植物细胞的DNA克隆入特殊质粒,例如克隆入中间(穿梭)载体或克隆入二元载体。中间载体不能在农杆菌细胞中独立复制,但可以在常用的大肠杆菌(Escherichia coli)分子克隆菌株中操作和复制。这类中间载体包含通常以右和左T-DNA边界重复区为框的序列,其可包含对选择转化的植物细胞具有功能的选择标记基因、克隆接头、克隆多聚接头、或其他可作为预定用于植物细胞转化的基因的引入位点发挥作用的序列。因此可用穿梭载体作为克隆载体,在大肠杆菌中通过标准方法容易地进行所希望转移至植物的基因的克隆和操作。随后可将经最终操作的穿梭载体引入农杆菌植物转化菌株用于其他研究。中间穿梭载体可以借助辅助质粒(通过细菌接合)、通过电穿孔、通过化学介导直接DNA转化或通过其他已知方法转入农杆菌。由于Ti或Ri质粒或其衍生物和中间质粒之间同源的序列,穿梭质粒可以通过同源重组整合入Ti或Ri质粒或其衍生物。此同源重组(即质粒整合)事件由此提供了用共整合质粒的Ti或Ri质粒部分提供的复制起点和其他质粒维持功能将改变的穿梭载体稳定维持在农杆菌中的手段。Ti或Ri质粒还包含含有转移T-DNA所必需的vir基因的vir区。携带vir区的质粒通常是已从其缺失了包括右和左T-DNA边界重复的T-DNA区的突变Ti或Ri质粒(辅助质粒)。这类具有功能性vir基因而缺乏全部或基本全部T区和相关元件的pTi来源的质粒在本文中描述性地称为辅助质粒。
[0133] 用于植物转化的T-DNA载体还可以用所谓的超二元系统制备。这是穿梭载体/同源重组系统的专化实例(由以下综述:Komari等,(2006)In:Methods in Molecular Biology(K.Wang编辑)343期:Agrobacterium Protocols(第2版,1卷)HUMANA PRESS Inc.,Totowa,NJ,15-41页;和Komori等,(2007)Plant Physiol.145:1155-1160)。超二元系统所利用的根瘤农杆菌宿主菌株是LBA4404(pSBI)。菌株LBA4404(pSBI)包含两个独立复制的质粒pAL4404和pSBI。pAL4404是Ti质粒来源的辅助质粒,其包含完整的一组vir基因(来自Ti质粒pTiACH5),但没有T-DNA区(因此没有T-DNA左和右边界重复序列)。质粒pSBI提供源自pTiBo542的另一组部分vir基因;此部分vir基因组包括virB操纵子和virC操纵子,以及基因virG和virDI。用于超二元系统的穿梭载体的一个实例是pSBI I,其包含作为预定用于植物细胞转化的基因的引入位点的克隆多聚接头,侧翼为右和左T-DNA边界重复区。穿梭载体pSBI 1不能在农杆菌中独立复制,但在借助pSBI和pSBI I上存在的共同序列之间的同源重组整合入pSBI时作为共整合质粒稳定维持。因此,源自两种不同农杆菌Ti质粒来源的Vir蛋白有成效地作用于经修饰的pSBI I载体上引入LBA4404(pSBI)的完全修饰的T-DNA区并将其转入植物细胞。超二元系统已证明在转化单子叶植物物种中尤其有用。参见Hiei等,(1994)Plant J.(6:271-282和Ishida等,(1996)Nat.Biotechnol.14:745-750。
[0134] 显而易见,也可以通过后文所述的常规克隆技术而不是上文所述的二元同源重组系统来制备T-DNA载体。
[0135] 根据本发明,编码RGEN的嵌合基因包含植物可表达的启动子(优选DNA聚合酶II“pol II”启动子),如上文所述的启动子,该启动子与编码RGEN的DNA区和可选的在植物中具有功能的3’端区有效连接。可以在嵌合基因中有效连接其他元件来优化RGEN的表达。该嵌合基因还可以与启动子组合包含其他定位在启动子和编码序列之间的调节序列,如转录激活因子(“增强子”),例如申请WO 87/07644中所述的烟草花叶病毒(TMV)翻译激活因子,或例如Carrington&Freed 1990,J.Virol.64:1590-1597所述的烟草蚀纹病毒(TEV)的翻译激活因子。
[0136] 可以掺入的内含子的实例包括来自以下的5’内含子:稻肌动蛋白1基因(参见US5641876)、稻肌动蛋白2基因、玉米蔗糖合酶基因(Clancy和Hannah,2002,Plant Physiol.130(2):918-29)、玉米醇脱氢酶-1(Adh-1)和Bronze-1基因(Callis等1987Genes Dev.1(10):1183-200;Mascarenhas等1990,Plant Mol Biol.15(6):913-20)、玉米热休克蛋白70基因(参见US5593874)、玉米皱缩1基因、马铃薯(Solanum tuberosum)光敏感1基因、矮牵牛(Petunia hybrida)热休克蛋白70基因、来自苜蓿的替换组蛋白H3基因(Keleman等2002Transgenic Res.11(1):69-72)和拟南芥替换组蛋白H3(组蛋白H3.3样)基因
(Chaubet-Gigot等,2001,Plant Mol Biol.45(1):17-30)。
[0137] 其他适宜的调节元件包括5’UTR。本文所用的5’UTR(也称为前导序列)是信使RNA(mRNA)的位于转录起始位点和编码区的起始密码子之前的特定区域。它涉及mRNA稳定性和翻译效率。例如,可以利用35S转录起始位点下游的矮牵牛叶绿素a/b结合蛋白基因的5’非翻译前导序列来增强报告基因表达的稳态水平(Harpster等,1988,Mol Gen Genet.212(1):182-90)。WO95/006742描述了用源自编码热休克蛋白的基因的5’非翻译前导序列来增加转基因表达。
[0138] 该嵌合基因还可以包含在植物细胞中有效的3’端区,即转录终止或聚腺苷酸化序列。作为转录终止或聚腺苷酸化序列,可以利用细菌来源(例如根瘤农杆菌的nos终止子)、病毒来源(例如CaMV 35S终止子)或植物来源(例如已公开的专利申请EP 0 633 317 A1中所述的组蛋白终止子)的任何相应序列。聚腺苷酸化区可以源自天然来源、源自多种其他植物基因、或源自T-DNA。待加入的3’端序列可以源自例如胭脂氨酸合成酶或章鱼碱合酶基因,或备选地源自另一植物基因。
[0139] 根据本发明,编码至少一个向导多核苷酸的嵌合基因包含与编码向导多核苷酸(gRNA)的DNA区有效连接的植物可表达的启动子(DNA聚合酶III“pol III”启动子)。可以在嵌合基因中有效连接其他元件,如增强子或内含子,以优化向导多核苷酸的表达。
[0140] 编码该至少一个向导多核苷酸的嵌合基因也可以编码两个或多个通过切割序列连接的向导多核苷酸序列(gRNA),以使得能够多重化,即同时靶向多个DNA序列。这已描述于例如WO2015099850(Csy4切割位点)、WO20160614811(tRNA切割序列)和WO2014204724中。
[0141] 在一个实施方案中,该编码该RGEN的嵌合基因、该至少一个编码该至少一个向导多核苷酸的嵌合基因和该至少一个供体多核苷酸定位在一个T-DNA载体上。这种T-DNA载体可以包含一个或多个一起含有该(至少)三个成分(即编码该RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和供体多核苷酸)的T-DNA分子。例如,全部(至少)三个成分可以定位在该一个T-DNA载体中分开的T-DNA上,每个成分侧翼为一对T-DNA边界(左和右)。在另一实例中,编码该RGEN的嵌合基因和至少一个编码该至少一个向导多核苷酸的嵌合基因可以一起定位在一个T-DNA分子上(一组T-DNA边界之间,左和右),向导多核苷酸定位在另一个T-DNA分子上(一组T-DNA边界之间,左和右)。在具体实例中,该编码该RGEN的嵌合基因、该至少一个编码该至少一个向导多核苷酸的嵌合基因和该至少一个供体多核苷酸一起定位在一个T-DNA分子上,即全都定位在单组T-DNA边界(左边界和右边界)之间。
[0142] 在具体实施方案中,针对在植物中表达优化RGEN的编码区。还可以针对在具体植物物种(例如稻或小麦)中表达优化它。RGEN(包括Cas9)的植物优化编码区尤其描述于Shan等Nature Protocols,9,2395-2410;WO2015026883;WO2015026885;WO2015026886中。
[0143] 在一个实施方案中,其中该编码该RGEN的嵌合基因包含SEQ ID NO.5的从28位核苷酸至4146位核苷酸的核苷酸序列。
[0144] 在一个实施方案中,该RGEN可以包含与SEQ ID NO.6的aa 10-1388具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或100%序列同一性且在对应于SEQ ID NO.6的24位的氨基酸位置上包含D至E取代的氨基酸序列。
[0145] 优选该RGEN包含至少一个、例如两个核定位信号(NLS)。NLS基本可以定位在多肽中的任何地方,只要它不干扰RGEN的功能,但优选定位在N端和/或C端或其附近。
[0146] 在本发明的方法的另一实施方案中,该细菌进一步包含引入并在该植物细胞中表达的选择或筛选标记基因。本文所用的“选择或筛选标记”具有其在本领域中的通常含义,且包括但不限于植物可表达的膦丝菌素乙酰转移酶、新霉素磷酸转移酶、草甘膦氧化酶、耐草甘膦EPSP酶、腈水解酶基因、突变体乙酰乳酸合酶或乙酰羟基酸合酶基因、β-葡糖醛酸糖苷酶(GUS)、R基因座基因、绿色荧光蛋白等。在植物细胞或植物中表达时,选择或筛选标记基因可赋予该植物细胞或植物选择或筛选表型。该选择标记基因可以在分开的T-DNA分子上,或可以与另外(至少)三个成分中的一个或多个或全部组合在一个T-DNA上。
[0147] 这种用一个细菌将选择或筛选标记基因与其他成分共同递送(例如在一个T-DNA载体上或甚至在一个T-DNA上)大幅提高了产生所预期的修饰的事件的回收率。之前已发现,在对共同引入的选择标记进行选择(即第一次选择)时,几乎一半的显示选择标记基因所赋予的耐受性的事件确实包含所希望得到的修饰。
[0148] 在另一实施方案中,按本文所述用一个细菌递送编码RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和至少一个供体核苷酸,而例如通过与分开的包含该选择标记基因的细菌共培养或通过另一种递送技术(例如直接递送)来将选择或筛选标记基因分开引入植物细胞。
[0149] 备选地(或此外),掺入目的多核苷酸时在植物细胞基因组中产生的修饰赋予该植物细胞选择或筛选表型。
[0150] 本文所用的选择或筛选表型是赋予植物细胞或植物的特征,其允许从其他不具有该特征的植物细胞或植物区分和/或挑出和/或富集该植物细胞或植物。这可以是例如视觉标记(例如颜色或荧光标记)或在某些条件如选择剂(例如除草剂、抗生素)下的选择优势。
[0151] 方便地,该选择或筛选表型可以是除草剂耐受性,如对EPSPS抑制剂除草剂(例如草甘膦)的耐受性。为此,可以这样设计供体多核苷酸和目的多核苷酸,使得在存在于植物细胞基因组中的天然EPSPS基因中引入提高对除草剂如草甘膦的耐受性的突变。具体实例是例如Li等,2016,Nature Plants中所述的TIPS突变。同样,可以设计供体多核苷酸来修饰其他允许对修饰进行选择的植物内源基因。例如,可以修饰诸如ALS/AHAS、ACCase、HPPD的内源基因来调节(提高)对相应除草剂(其为本领域公知)的耐受性。备选地,可以在特异性基因组座位引入选择标记的完整编码序列,由此通过选择基因组位置以便利用已有调节元件,例如通过用选择或筛选标记基因的编码序列替换已有基因(其可以是内源基因,但也可以是转基因)的编码序列,或通过引入包括调节序列以及编码序列的整个基因,将它置于所需调节元件(如启动子、终止子)的控制之下。
[0152] 选择或筛选表型在修饰EPSPS基因的情况下可以是例如(提高的)草甘膦耐受性,在修饰ALS/AHAS基因的情况下可以是例如(提高的)咪唑啉酮、嘧啶基硫代苯甲酸酯、磺酰基氨基羰基三唑啉酮、磺酰脲和/或三唑并嘧啶耐受性,在修饰HPPD基因的情况下可以是例如(提高的)吡唑啉酮、三酮和二酮腈(例如甲基磺草酮(mesotrione)、异噁唑草酮(isoxaflutole)、苯吡唑草酮(topramezone)、磺酰草吡脱(pyrasulfutole)和环磺酮(tembotrione))耐受性等。
[0153] 在另一实施方案中,靶向修饰赋予该植物细胞的选择表型可以用于在靶向基因组修饰赋予对其的耐受性的选择化合物上直接选择,即无需基于共转化的选择标记基因(例如bar基因)的第一次选择。这允许在非常早的阶段筛选靶向修饰,减少对确认所预期的修饰的存在的第二选择或筛选步骤的需要。
[0154] 使用农杆菌或任何其他细菌的植物细胞转化可经原生质体共培养、外植体接种、花浸渍和真空渗入而发生。这类技术描述于例如美国专利号5,177,010、美国专利号5,104,310、欧洲专利申请号0131624B1、欧洲专利申请号120516、欧洲专利申请号159418B1、欧洲专利申请号176112、美国专利号5,149,645、美国专利号5,469,976、美国专利号5,464,763、美国专利号4,940,838、美国专利号4,693,976、欧洲专利申请号116718、欧洲专利申请号
290799、欧洲专利申请号320500、欧洲专利申请号604662、欧洲专利申请号627752、欧洲专利申请号0267159、欧洲专利申请号0292435、美国专利号5,231,019、美国专利号5,463,
174、美国专利号4,762,785、美国专利号5,004,863和美国专利号5,159,135中。包含T-DNA的载体在转化植物细胞中的用途已得到深入研究,并充分描述于欧洲专利申请120516、An等,(1985,EMBO J.4:277-284)、Fraley等,(1986,Crit.Rev.Plant Sci.4:1-46)及Lee和Gelvin(2008,Plant Physiol.146:325-332)中。
[0155] 可以按照本发明转化的多种组织外植体包括来自下胚轴、子叶、未成熟合子胚、叶、花药、花瓣、胚珠、根、分生组织、干细胞和叶柄的外植体。愈伤组织也可以按照本发明转化。本文所用的术语“愈伤组织”指由于植物组织培养而产生的主要为成胚细胞和细胞团的散乱物质。易碎愈伤组织指具有形成枝条和根的潜能并最终再生为整株植物的具有易碎结构的愈伤组织。致密愈伤组织也可以具有形成枝条和根的潜能。愈伤组织可以从上文提到的多种组织外植体再生/诱导。
[0156] 在一个实施方案中,按照本发明修饰其基因组的植物细胞包含在未成熟胚或成胚愈伤组织内,即该细胞是下文所述的未成熟胚(未成熟胚细胞)或成胚愈伤组织(成胚愈伤组织细胞)的细胞。
[0157] 为了指导目的核苷酸的掺入,供体DNA分子可以包含一个或两个具有足够的长度和与预先选定的位点上游和/或下游的基因组DNA的序列同一性的同源区,以允许与预先选定的位点侧翼的上游和/或下游DNA区重组。这允许更好地控制目的DNA的插入。实际上,同源重组整合将允许在核苷酸水平将目的DNA与植物核基因组连接。
[0158] 为了具有足够的同源性用于重组,同源区长度可以变动,且长度应为至少约10个核苷酸。但是,侧翼区可以尽可能长(例如至多约100-150kb,人完整的细菌人工染色体(BAC))。优选地,侧翼区将为约10nt、15nt、20nt、25nt、50nt、10Ont、200nt、500nt、750nt、1000nt、1500nt、2000nt、2500nt、5000nt或甚至更长。此外,同源区无需与预先选定的位点的侧翼DNA区相同,可以与预先选定的位点的侧翼DNA区具有约80%至约100%之间的序列同一性,优选约95%至约100%序列同一性。侧翼区越长,对同源性的要求的严格性越低。此外,优选邻近DSB的序列同一性尽可能高。此外,为了达到更换预先选定的位点处的靶DNA序列而不改变邻近DNA序列的DNA序列,侧翼DNA序列应优选与预先选定的位点侧翼的上游和下游DNA区或待更换的靶DNA序列相同。
[0159] 供体多核苷酸(目的多核苷酸)可以包含一个或多个植物可表达的目的基因或一个或多个植物可表达的基因的部分。这种植物可表达的目的基因可以例如是下文进一步描述的除草剂耐受性基因、昆虫抗性基因、疾病抗性基因、非生物胁迫抗性基因、涉及油生物合成、糖类生物合成的酶、涉及纤维强度或纤维长度的酶、涉及次生代谢物生物合成的酶。
[0160] 供体多核苷酸(目的多核苷酸)还可以包含例如WO 06/105946、WO08/037436或WO08/148559中所述的可在插入后去除或不去除的选择或筛选标记,以便于鉴定可能正确的靶向事件。此选择或筛选标记基因优选不同于可以其他方式转入植物细胞的任何其他标记基因。
[0161] 显而易见,还可以同时递送一个以上农杆菌菌株进行多重化,参见Char等,(Plant Biotechnology Journal,2016年9月5日)。
[0162] 在另一个步骤中,可以将这样产生和选择的包含靶向修饰的植物细胞培养为植物。随后可使这种包含靶向修饰的植物与另一植物杂交。然后可以选择其子代植物,该子代植物包含所预期的修饰,但例如不包含该编码该RGEN的嵌合基因和/或该至少一个编码该至少一个向导多核苷酸的嵌合基因和/或非靶向插入的供体多核苷酸。与另一植物杂交也可以是自交。这种包含靶向修饰的植物也可以用来产生本文中其他地方所述的植物产物。
[0163] 应理解,本发明的此方面的方法可以应用于适于细菌转化的任何植物细胞或植物。在一个实例中,该植物细胞或植物是稻物种(稻属(Oryza)),例如稻(Oryza sativa)。
[0164] 提供按照本发明的方法产生的植物细胞、植物部分和植物(如果实、种子、胚、繁殖组织、分生区、愈伤组织、叶、根、枝条、花、纤维、维管组织、配子体、孢子体、花粉和小孢子,其特征在于它们在(核)基因组中包含预期的修饰(插入、替换和/或缺失))也是本发明的目的。通过传统育种方法产生的包含DNA修饰事件的植物的配子、种子、胚、合子或体细胞、子代或杂种也包含在本发明的范围之内。这类植物可以包含在预先选定的位点处插入或替换预先选定的位点的目的多核苷酸,或可以缺失特异性DNA序列(甚至单个核苷酸),与它们的祖先植物的不同将仅在于此预期的修饰的存在。
[0165] 在第二方面,本发明提供适合用于以上方法的细菌。这种细菌包含编码RGEN的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个供体多核苷酸,其中该细菌能够将该编码该RGEN的嵌合基因、该编码该向导多核苷酸的嵌合基因和该供体多核苷酸转入植物细胞(的核基因组),其中该RGEN和该向导多核苷酸在该植物细胞中表达时能够形成使得RGEN能够在植物细胞的(核)基因组中预先选定的位点处引入DNA断裂的复合物,其中该供体多核苷酸将用作用于修复该DNA断裂的模板,全都如以上第一方面的任意实施方案中所述。
[0166] 还提供包含本文所述编码RGEN的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个供体多核苷酸的(T-DNA)载体。在另一实施方案中,该载体还包含本文所述的筛选或选择标记基因。优选地,该成分定位在一个DNA分子上(一对T-DNA边界之间)。
[0167] 在第三方面,本发明提供以上方面中所述的分离的RGEN多肽,如Cas9多肽,其在对应于SEQ ID NO.6的24位的氨基酸位置上包含D至E取代。在一个实例中,该分离的RGEN多肽与SEQ ID NO 6的10位氨基酸至1388位氨基酸具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或100%序列同一性。
[0168] 编码上述RGEN的分离的核酸也包括在本发明的范围之内,例如其中该核酸包含SEQ ID NO.5的从28位核苷酸至4164位核苷酸的核苷酸序列或其与SEQ ID 5具有1、2、3、4、5、6、7、8、9、10、15、20、25nt差异但编码上述分离的RGEN多肽的变体。
[0169] 在另一实施方案中,提供嵌合基因,其包含与异源启动子有效连接的上述分离的核酸。
[0170] 还提供宿主细胞,如细菌细胞或植物细胞,其包含上述分离的多肽、分离的核酸或嵌合基因。
[0171] 在第四方面,提供用于修饰植物细胞中的内源EPSPS基因或用于产生具有经修饰的EPSPS基因的植物细胞的方法,其包括步骤:
[0172] a.在该细胞中表达识别该植物的内源EPSPS基因中的序列的位点定向DNA修饰多肽和/或向该植物细胞中引入可用作用于修饰该内源EPSPS基因的模板的供体多核苷酸;
[0173] b.通过在包含一种或多种EPSPS抑制剂的培养基上培养该植物细胞来评价该植物细胞对该EPSPS抑制剂的耐受性;并可选地
[0174] c.选择对该至少一种EPSPS抑制剂具有提高的耐受性的植物细胞(与修饰前的该植物细胞相比)。
[0175] 在EPSPS抑制剂(例如草甘膦)上直接选择(即用EPSPS抑制剂作为第一选择剂)允许容易地读出该方法的效率等。因此,此方法可以方便地用于评价基因组修饰成分(基因组编辑成分),如供体多核苷酸、向导多核苷酸、位点特异性核酸酶(例如大范围核酸酶)、锌指核酸酶(ZFN)、TAL效应核酸酶(TALEN)、RGEN、DNA向导核酸酶或其他可以引入突变的位点定向或序列特异性DNA修饰酶(例如脱氨酶)、以及用于表达这类成分的元件(如启动子),以及其他可以例如在事件的效率、纯度方面影响结果的参数,如递送方法/机器,例如粒子轰击、细菌转化、(核糖核)蛋白转染、递送多种成分的时间点等。另外,通过选择具有提高的耐受性的细胞,可以选择具有经修饰的EPSPS基因的细胞。因此,此方法还允许产生具有经修饰的EPSPS基因的植物细胞,例如具有经修饰的(例如提高的或降低的)对EPSPS抑制剂除草剂的耐受性的植物细胞。
[0176] 在一个实施方案中,具有经修饰的EPSPS基因的植物细胞的选择(即在包含EPSPS抑制剂的培养基上培养)发生在转化后首先直接将细胞培养在非选择性培养基上之后的几天(例如1、2、3、4或5天)。EPSPS抑制剂可以是草甘膦。培养基可以包含浓度为约50-250mg/L、如约100-200mg/L、如约150mg/L的草甘膦。
[0177] 在一个实施方案中,该供体多核苷酸包含TIPS突变,即在用作用于修饰该内源EPSPS基因的模板时导致在该EPSPS基因中引入TIPS突变。在备选实施方案中,该供体多核苷酸可以包含TIPV或TIPL突变。
[0178] 在另一实施方案中,该植物细胞是稻植物细胞。
[0179] 在另一实施方案中,未在植物细胞中引入(功能性)选择标记基因,即该方法排除了引入分开的(功能性)选择标记基因。
[0180] 通过按照本领域可用的任意方法,如农杆菌介导的转化、直接递送法如轰击或病毒递送等,为植物细胞提供植物可表达的编码多肽的基因,可以方便地达到在植物细胞中表达位点定向DNA修饰多肽。备选地,如本领域中所述(参见例如WO2014065596),可以可选地与向导多核苷酸结合直接为植物细胞提供多肽。
[0181] 在第五方面,本发明提供用于在预先选定的位点处修饰植物细胞的(核)基因组或用于产生在(核)基因组中预先选定的位点处具有修饰的植物细胞的方法,其包括步骤:
[0182] a.在该细胞中引入/表达核苷酸向导DNA修饰多肽(NGDMP)和向导多核苷酸,其中该NGDMP和向导多核苷酸能够形成使得NGDMP能够在预先选定的位点处修饰植物细胞基因组的复合物;
[0183] b.选择其中已在该预先选定的位点处修饰了该基因组的植物细胞;
[0184] 其特征在于用粒子流入枪将该NGDMP、该向导多核苷酸引入该植物细胞。
[0185] 本文所用的粒子流入枪指例如Vain,P,Keen,N.Murillo,J.等Plant Cell Tiss Organ Cult(1993)33:237所述的允许直接在氦气流中加速DNA包被的金粒子的装置。
[0186] 在另一方面,提供用于在预先选定的位点处修饰植物细胞的(核)基因组或用于产生具有经修饰的基因组的植物细胞的方法,其包括步骤:
[0187] a.向该细胞中引入核苷酸向导DNA修饰多肽(NGDMP)和向导多核苷酸,其中该NGDMP和向导多核苷酸能够形成使得NGDMP能够在预先选定的位点处修饰植物细胞基因组的复合物;
[0188] b.向该细胞中引入至少一个(植物可表达的)选择标记基因;
[0189] c.选择一个或多个包含该选择标记基因的植物细胞(即选择一个或多个具有该选择标记基因所赋予的选择表型的植物细胞);
[0190] d.(从该一个或多个植物细胞)选择其中已在该预先选定的位点处修饰了该基因组的植物细胞;
[0191] 其特征在于通过使该植物细胞与至少一个包含编码该RGEN的嵌合基因、至少一个编码该至少一个向导多核苷酸的嵌合基因和至少一个含有该选择标记基因的多核苷酸的细菌接触来将该NGDMP、该至少一个向导多核苷酸和该至少一个选择标记基因引入该植物细胞。
[0192] 核苷酸向导DNA修饰多肽(NGDMP)可以是核苷酸向导内切核酸酶,例如上文所述RGEN,或DNA向导内切核酸酶(例如W02014189628;W02015140347;Nature Biotechnology 34,768-773,2016),或其他核苷酸向导(例如RNA向导或DNA向导)DNA修饰多肽,如例如WO2013176772、WO2013088446、WO2014099750中所述的外遗传修饰因子(例如甲基化酶)、脱氨酶(碱基编辑)。
[0193] 因此,本文所用的“修饰”或“经修饰的”可以指例如由切割和随后的修复或通过碱基编辑引起的预先选定的位点处的核苷酸序列的变化。它还可以指预先选定的位点处或附近的外遗传状态(例如DNA甲基化、染色质结构、组蛋白修饰)的改变,该改变可影响例如附近基因的表达。
[0194] 因此,在一个实施方案中,该RGDMP是RGEN,该RGEN和该至少一个向导多核苷酸能够形成使得RGEN能够在该预先选定的位点处或附近引入DNA断裂的复合物。
[0195] 可将包含目的多核苷酸的供体多核苷酸与该RGEN和该向导多核苷酸一起引入该植物细胞,其中该供体多核苷酸用作用于修复该DNA断裂的模板,由此在该预先选定的位点处整合该目的多核苷酸,在该预先选定的位点处产生该基因组的修饰。
[0196] 本发明还提供包含编码NGDMP的嵌合基因、至少一个编码至少一个向导多核苷酸的嵌合基因和至少一个(植物可表达的)选择标记基因的细菌,其中该细菌能够将该编码该NGDMP的嵌合基因、该编码该向导多核苷酸的嵌合基因和该选择标记基因转移入或引入植物细胞(的核基因组),其中该NGDMP和该向导多核苷酸在该植物细胞中表达时能够形成使得NGDMP能够修饰植物细胞的(核)基因组的复合物。
[0197] 该细菌可以是上文所述能够指导包含在细菌内的DNA稳定转移入植物细胞基因组的任何细菌。尤其适宜的是根瘤农杆菌。
[0198] 在一个实例中,编码NGDMP的嵌合基因、编码向导多核苷酸的嵌合基因和选择标记基因定位在一个载体上,优选一个T-DNA分子上(一对T-DNA边界之间)。
[0199] 该细菌可进一步包含例如用于修复RGEN诱导的DNA断裂的本文所述的供体多核苷酸。在优选实施方案中,该供体多核苷酸定位在同一T-DNA上。
[0200] 还描述优选在一个T-DNA分子上(一对T-DNA边界之间)包含本文所述编码NGDMP的嵌合基因、编码向导多核苷酸的嵌合基因和选择标记基因的(T-DNA)载体。该载体还可优选在同一T-DNA上包含供体多核苷酸。
[0201] 显而易见,通过供体多核苷酸,本发明的方法允许插入任何目的核酸分子,包括含有编码表达产物的基因(目的基因)的核酸分子,含有具有例如用于随后的鉴定的特定核苷酸序列特征的核苷酸序列的核酸分子,或包含或修饰(可诱导)例如调节定位在预先选定的位点附近的基因的表达的增强子或沉默子的核酸分子。
[0202] 耐除草剂基因包括编码5-烯醇丙酮莽草酸-3-磷酸合酶基因(EPSPS)的基因。这类EPSPS基因的实例有鼠伤寒沙门氏菌(Salmonella typhimurium)的AroA基因(突变体CT7)(Comai等,1983,Science 221,370-371)、农杆菌属物种细菌的CP4基因(Barry等,1992,Curr.Topics Plant Physiol.7,139-145)、编码矮牵牛属(Petunia)EPSPS的基因(Shah等,1986,Science 233,478-481)、番茄EPSPS(Gasser等,1988,J.Biol.Chem.263,4280-4289)或穇属(Eleusine)EPSPS(WO 01/66704)。它还可以是例如EP 0837944、WO 00/66746、WO 
00/66747或WO02/26995中所述的突变EPSPS。还可以通过按美国专利号5,776,760和5,463,
175中所述表达编码草甘膦氧化还原酶的基因来获得耐草甘膦植物。还可以通过按例如WO 
02/36782、WO 03/092360、WO 05/012515和WO 07/024782中所述表达编码草甘膦乙酰转移酶的基因来获得耐草甘膦植物。还可以通过按例如WO 01/024615或WO 03/013226中所述选择包含上述基因的天然存在的突变的植物来获得耐草甘膦植物。赋予草甘膦耐受性的EPSPS基因描述于例如美国专利申请号11/517,991、10/739,610、12/139,408、12/352,532、
11/312,866、11/315,678、12/421,292、11/400,598、11/651,752、11/681,285、11/605,824、
12/468,205、11/760,570、11/762,526、11/769,327、11/769,255、11/943801或12/362,774中。其他赋予草甘膦耐受性的基因(如脱羧酶基因)描述于例如美国专利申请11/588,811、
11/185,342、12/364,724、11/185,560或12/423,926中。
[0203] 其他耐除草剂基因可以编码例如美国专利申请号11/760,602中所述的除草剂解毒酶或耐受抑制的突变体谷氨酰胺合酶。一个这种有效的解毒酶是编码膦丝菌素乙酰转移酶的酶(如来自链霉菌属物种的bar或pat蛋白)。膦丝菌素乙酰转移酶例如描述于美国专利号5,561,236、5,648,477、5,646,024、5,273,894、5,637,489、5,276,268、5,739,082、5,908,810和7,112,665中。
[0204] 耐除草剂基因还可以赋予对抑制羟丙基丙酮酸双加氧酶(HPPD)的除草剂的耐受性。羟丙基丙酮酸双加氧酶催化对羟苯基丙酮酸(HPP)转化为尿黑酸的反应。可以用编码天然存在的抗性HPPD酶的基因或编码WO 96/38567、WO 99/24585、WO 99/24586、WO 2009/144079、WO 2002/046387或US 6,768,044中所述的突变或嵌合HPPD酶的基因转化耐受HPPD抑制剂的植物。还可以通过用编码某些酶的基因转化植物来获得对HPPD抑制剂的耐受性,这些酶使得虽然通过HPPD抑制剂抑制了天然HPPD酶也能够形成尿黑酸。这类植物和基因描述于WO 99/34008和WO 02/36787中。如WO 2004/024928中所述,除编码HPPD耐受酶的基因外,还可以通过用编码具有预苯酸脱氢酶(PDH)活性的酶的基因转化植物来改善植物对HPPD抑制剂的耐受性。另外,还可以通过在其基因组中加入编码能够代谢或降解HPPD抑制剂的酶(如WO 2007/103567和WO 2008/150473中所示的CYP450酶)的基因来使植物更耐受HPPD抑制剂除草剂。
[0205] 其他除草剂耐受性基因编码例如Tranel和Wright(2002,Weed Science 50:700-712)中以及美国专利号5,605,011、5,378,824、5,141,870和5,013,659中所述的变体ALS酶(也称为乙酰羟酸合酶,AHAS)。美国专利号5,605,011、5,013,659、5,141,870、5,767,361、
5,731,180、5,304,732、4,761,373、5,331,107、5,928,937和5,378,824及国际公开WO 96/
33270中描述了耐磺基脲植物和耐咪唑啉酮植物的产生。例如WO 2004/040012、WO 2004/
106529、WO 2005/020673、WO 2005/093093、WO 2006/007373、WO 2006/015376、WO 2006/
024351和WO 2006/060634中也描述了其他耐咪唑啉酮基因。例如WO 07/024782中描述了其他耐磺基脲和耐咪唑啉酮基因。
[0206] 昆虫耐受性基因可以包含编码以下的编码序列:
[0207] 1)来自苏金芽孢杆菌(Bacillus thuringiensis)的杀虫晶体蛋白或其杀虫部分,如Crickmore等(1998,Microbiology and Molecular Biology Reviews,62:807-813)所列、Crickmore等(2005)在http://www.lifesci.sussex.ac.uk/Home/Neil_Crickmore/Bt/)上在线更新的苏云金芽孢杆菌毒素命名的杀虫晶体蛋白或其杀虫部分,例如Cry蛋白种类Cry1Ab、Cry1Ac、Cry1B、Cry1C、Cry1D、Cry1F、Cry2Ab、Cry3Aa或Cry3Bb的蛋白或其杀虫部分(例如EP 1999141和WO 2007/107302),或由例如美国专利申请号12/249,016中所述的合成基因编码的这类蛋白质;或
[0208] 2)来自苏云金芽孢杆菌的晶体蛋白或其部分,其在来自苏云金芽孢杆菌的另一第二晶体蛋白或其部分的存在下具有杀虫活性,如由Cry34和Cry35晶体蛋白组成的二元毒素(Moellenbeck等2001,Nat.Biotechnol.19:668-72;Schnepf等2006,Applied Environm.Microbiol.71,1765-1774),或由Cry1A或Cry1F蛋白和Cry2Aa或ry2Ab或Cry2Ae蛋白组成的二元毒素(美国专利申请号12/214,022);或
[0209] 3)包含来自苏云金芽孢杆菌的不同杀虫晶体蛋白的部分的杂合杀虫蛋白,如以上1)的蛋白的杂合体或以上2)的蛋白的杂合体,例如通过玉米事件MON89034产生的
Cry1A.105蛋白(WO 2007/027777);或
[0210] 4)以上1)至3)中任一项的蛋白,其中用另一氨基酸替换一些(尤其是1至10个)氨基酸,以获得对靶昆虫物种的更高杀虫活性,和/或扩大所影响的靶昆虫物种的范围,和/或由于在克隆或转化期间引入编码DNA的改变,如玉米事件MON863或MON88017中的Cry3Bb1蛋白,或玉米事件MIR604中的Cry3A蛋白;或
[0211] 5)来自苏云金芽孢杆菌或蜡样芽孢杆菌(Bacillus cereus)杀虫分泌蛋白或其杀虫部分,如http://www.lifesci.sussex.ac.uk/home/Neil_Crickmore/Bt/vip.html上所列的植物杀虫(VIP)蛋白,例如来自VIP3Aa蛋白质种类的蛋白;或
[0212] 6)来自苏云金芽孢杆菌或蜡样芽孢杆菌的分泌蛋白,其在来自苏云金芽孢杆菌或蜡样芽孢杆菌的第二分泌蛋白的存在下具有杀虫活性,如由VIP1A和VIP2A蛋白组成的二元毒素(WO 94/21795);或
[0213] 7)包含来自苏云金芽孢杆菌或蜡样芽胞杆菌的不同分泌蛋白的部分的杂合杀虫蛋白,如以上1)中的蛋白的杂合蛋白或以上2)中的蛋白的杂合蛋白;或
[0214] 8)以上5)至7)中任一项的蛋白,其中用另一氨基酸替换一些(尤其是1至10个)氨基酸,以获得对靶昆虫物种的更高杀虫活性,和/或扩大所影响的靶昆虫物种的范围,和/或由于在克隆或转化期间引入编码DNA的改变(同时仍编码杀虫蛋白),如棉花事件COT102中的VIP3Aa蛋白;或
[0215] 9)来自苏云金芽孢杆菌或蜡样芽胞杆菌的分泌蛋白,其在来自苏云金芽孢杆菌的晶体蛋白的存在下具有杀虫活性,如由VIP3和Cry1A或Cry1F组成的二元毒素,或由VIP3蛋白和Cry2Aa或Cry2Ab或Cry2Ae蛋白组成的VIP3蛋白(美国专利申请号12/214,022);
[0216] 10)以上9)的蛋白,其中用另一氨基酸替换一些(尤其是1至10个)氨基酸,以获得对靶昆虫物种的更高杀虫活性,和/或扩大所影响的靶昆虫物种的范围,和/或由于在克隆或转化期间引入编码DNA的改变(同时仍编码杀虫蛋白)。
[0217] 本文所用的“耐昆虫基因”进一步包括含有在表达时产生在由植物害虫摄入时抑制此害虫的生长的双链RNA的序列的转基因,如例如WO 2007/080126、WO 2006/129204、WO 2007/074405、WO 2007/080127和WO 2007/035650中所述。
[0218] 非生物胁迫耐受性基因包括:
[0219] 1)WO 00/04173、WO/2006/045633中所述能够降低植物细胞或植物中聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的转基因;
[0220] 2)例如WO 2004/090140中所述能够降低植物或植物细胞中PARG编码基因的表达和/或活性的转基因;
[0221] 3)例如PCT/EP07/002433、EP 1999263或WO 2007/107326中所述编码烟酰胺腺嘌呤二核苷酸挽救合成途径的植物功能性酶(包括烟酰胺酶、烟酸磷酸核糖转移酶、烟酸单核苷酸腺苷酰转移酶、烟酰胺腺嘌呤二核苷酸合成酶或烟酰胺磷酸核糖转移酶)的转基因。
[0222] 涉及糖类生物合成的酶包括例如EP 0571427、WO 95/04826、EP 0719338、WO 96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/
42328、WO 97/44472、WO 97/45545、WO 98/27212、WO 98/40503、W099/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO 00/77229、WO 
01/12782、WO 01/12826、WO 02/101059、WO 03/071860、WO 2004/056999、WO 2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO 2005/095619、WO 2005/095618、WO 
2005/123927、WO 2006/018319、WO 2006/103107、WO 2006/108702、WO 2007/009823、WO 
00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、WO 01/14569、WO 02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO 96/34968、WO 98/20145、WO 
99/12950、WO 99/66050、WO 99/53072、US 6,734,341、WO 00/11192、WO 98/22604、WO 98/
32326、WO 01/98509、WO 01/98509、WO 2005/002359、US 5,824,790、US 6,013,861、WO 94/
04693、WO 94/09144、WO 94/1 1520、WO 95/35026或WO 97/20936中所述的那些,或EP 
0663956、WO 96/01904、WO 96/21023、WO 98/39460和WO 99/24593中公开的涉及多聚果糖(尤其是菊粉和果聚糖型)产生的酶,WO 95/31553、US 2002031826、US 6,284,479、US 5,
712,107、WO 97/47806、WO 97/47807、WO 97/47808和WO 00/14249中公开的涉及α-1,4-葡聚糖产生的酶,WO 00/73422中公开的涉及α-1,6分枝α-1,4-葡聚糖产生的酶,例如WO 00/
47727、WO 00/73422、US 5,908,975和EP 0728213中公开的涉及alternan产生的酶,例如WO 
2006/032538、WO 2007/039314、WO 2007/039315、WO 2007/039316、JP 2006304779和WO 
2005/012529中公开的涉及透明质酸产生的酶。
[0223] 植物(被子植物或裸子植物)包括例如棉花、卡诺拉(canola)、油菜(oilseed rape)、大豆、蔬菜、马铃薯、浮萍属物种(Lemna spp.)、烟草属物种(Nicotiana spp.)、拟南芥属(Arabidopsis)、苜蓿、大麦、豆、玉米、棉花、亚麻、小米、豌豆、油菜(rape)、稻、黑麦、红花、高粱、大豆、向日葵、烟草、草坪、小麦、芦笋、甜菜和糖用甜菜、嫩茎花椰菜、卷心菜、胡萝卜、花椰菜、芹菜、黄瓜、茄子、莴苣、洋葱、油菜(oilseed rape)、胡椒、马铃薯、南瓜、萝卜、菠菜、豌豆荚、甘蔗、番茄、西葫芦、扁桃、苹果、杏、香蕉、黑莓、蓝莓、可可、樱桃、椰子、蔓越橘、海枣、葡萄、葡萄柚、番石榴、猕猴桃、柠檬、酸橙、芒果、甜瓜、油桃、橙子、番木瓜、西番莲果、桃、花生、梨、菠萝、阿月浑子、李子、悬钩子、草莓、红橘、胡桃和西瓜。
[0224] 在一个实施方案中,还提供按照本发明的方法产生的植物细胞、植物部分和植物,如果实、种子、胚、繁殖组织、分生区、愈伤组织、叶、根、枝条、花、纤维、维管组织、配子体、孢子体、花粉和小孢子,其特征在于它们在基因组中包含特异性修饰(插入、替换和/或缺失)。通过传统育种方法产生的包含DNA修饰事件的植物的配子、种子、胚、合子或体细胞、子代或杂种也包含在本发明的范围之内。这类植物可以包含在靶序列处插入或替换靶序列的目的核酸分子,或可以缺失特异性DNA序列(甚至单个核苷酸),与它们的祖先植物的不同将仅在于,与修饰之前的原植物细胞或植物相比,存在此异源DNA或DNA序列,或缺乏特异性缺失的序列(即预期的修饰)。
[0225] 在具体实施方案中,本文所述的植物细胞是非繁殖植物细胞,或不能再生为植物的植物细胞,或不能通过光合作用从无机物(如水、二氧化和无机盐)合成糖类和蛋白质来维持其生命的植物细胞。
[0226] 本发明还提供用于产生在预先选定的位点处包含修饰的植物的方法,其包括使按照以上方法产生的植物与另一植物或与自身杂交并可选地收获种子的步骤。
[0227] 本发明还提供用于产生饲料、食品或纤维的方法,其包括提供按照以上方法产生的植物群体并收获种子的步骤。
[0228] 本发明的植物和种子可以进一步用化合物(例如如果对这种化学品具有耐受性)处理。
[0229] 因此,本发明还提供培养按照以上方法产生的植物的方法,其包括对该植物或或该植物在其中生长的基质应用化学品的步骤。
[0230] 还提供在大田中培养植物的方法,其包括对按照以上方法产生的植物应用化合物的步骤。
[0231] 还提供产生经处理的种子的方法,其包括对按照上文所述方法产生的植物的种子应用化合物(如上文所述化学品)的步骤。
[0232] 在另一实施方案中,通过本方法(包括靶向修饰)获得的植物可用于获得植物产品。因此,还提供用于产生植物产品的方法,其包括通过本文所述方法获得植物或其部分,并从其产生植物产品。
[0233] 本文所用的植物产品可以是食品(其可以是食品成分)、饲料产品(其可以是饲料成分)或工业产品,其中食品或饲料可以例如是油、粗粉、谷物、淀粉、面粉或蛋白质,其中工业产品可以是生物燃料、纤维、工业化学品、药物或营养品。动物饲料可以是收获谷物、干草、秸秆或青贮饲料。按照本发明获得的植物可以直接用作动物饲料,例如在培养在大田中时。
[0234] 在例如大豆植物的情况下,植物产品可以是大豆粉磨碎种子、面粉或絮片(flake),或大豆油、大豆蛋白、卵磷脂、豆浆豆腐、人工奶油、生物柴油、生物复合材料、黏合剂、溶剂润滑剂、清洁剂、泡沫、油漆、墨水、蜡烛、或含大豆油或大豆蛋白质的食品或饲料。
[0235] 在例如小麦植物或其他谷类植物的情况下,食品的实例包括面粉、淀粉、发酵或不发酵面包、面团、面条、动物饲料、早餐谷物食品、小吃、蛋糕、麦芽、油酥点心、麸质和含有基于面粉的调味汁的食品。
[0236] 在纤维植物(如棉花、亚麻、黄麻、大麻、苎麻、剑麻、马尼拉麻、菠萝、椰子)的情况下,植物产品可以是纤维、纱、织物,但也可以是油、粗粉、蛋糕。
[0237] 在番茄植物的情况下,该产品可以是沙拉、三明治、番茄汁、番茄片、番茄沙司、番茄酱(tomato paste)、番茄汤、番茄酱(tomato ketchup)及任何其他包含番茄的食品,如面团、披萨、莎莎酱汁(salsa)等。
[0238] 这种植物产品可包含含有靶向修饰的核酸或其部分,如包含产生扩增子诊断或对靶向修饰特异的核酸的这种产品。
[0239] 在一些实施方案中,用于实施本发明的核酸分子,包括供体核酸分子以及编码例如向导多核苷酸、核酸酶、切口酶或其他DNA修饰多肽的核酸分子,可以通过任何适合用于预期宿主细胞的手段引入(瞬时或稳定)细胞,例如病毒递送、细菌递送(例如农杆菌)、聚乙二醇(PEG)介导转化、电穿孔、真空渗入、脂转染、显微注射、生物射弹、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子和介导递送。
[0240] 植物的转化意指以导致序列的稳定或瞬时表达的方式将核酸分子引入植物。单子叶植物和双子叶植物细胞的转化和再生现在都是常规操作,最适合的转化技术的选择将由实施者决定。方法的选择将随待转化的植物类型而变:本领域技术人员将意识到具体方法对给定植物类型的适合性。适宜的方法包括但不限于:植物原生质体电穿孔;脂质体介导转化;聚乙二醇(PEG)介导转化;用病毒转化;植物细胞显微注射;植物细胞微射弹轰击;真空渗入;及农杆菌介导转化。
[0241] 可将转化的植物细胞再生为整株植物。这类再生技术依赖于在组织培养生长培养基中操作某些植物激素,通常依赖于与所希望的核苷酸序列一起引入的杀生物剂和/或除草剂标志。Evans等,Protoplasts Isolation and Culture,Handbook of Plant Cell Culture,124-176页,MacMillilan Publishing Company,New York,1983和Binding,Regeneration of Plants,Plant Protoplasts,21-73页,CRC Press,Boca Raton,1985中描述了从培养的原生质体再生植物。还可以从植物愈伤组织、外植体、器官或其部分获得再生。这类再生技术概述于Klee(1987)Ann.Rev.of Plant Phys.38:467-486中。为了从转基因组织如未成熟胚获得整株植物,可以在一系列包含营养物和激素的培养基中在受控环境条件下培养它们(称为组织培养的方法)。一旦产生整株植物并产生种子,即开始评价子代。
[0242] 核酸分子也可以通过渐渗的手段引入植物。渐渗意指通过自然手段使核酸整合在植物基因组中,即通过使包含本文所述嵌合基因的植物与不包含该嵌合基因的植物杂交。可以针对包含嵌合基因的那些选择子代。
[0243] 为了本发明的目的,两个相关核苷酸或氨基酸序列的表示为百分比的“序列同一性”指两个最佳比对的序列中具有相同残基的位置数除以所比较的位置数(x100)。将缺口(即比对中在一个序列中存在残基但在另一个序列中不存在残基的位置)视为具有不同残基的位置。通过Needleman和Wunsch算法(Needleman和Wunsch 1970)进行两个序列的比对。使用标准软件程序,如作为Wisconsin Package Version 10.1(Genetics Computer Group,Madison,Wisconsin,USA)的部分的GAP,使用缺口产生罚分50和缺口延伸罚分3的默认评分矩阵,可以方便地进行以上计算机辅助序列比对。
[0244] 本文所用的嵌合基因指由有效连接以使得能够表达基因的异源元件组成的基因,由此该组合并非天然存在于自然界中。因此,术语“异源的”指源自不同来源的两个或多个核酸或蛋白质序列之间的关系。例如,如果这种组合通常不见于自然界中,则启动子就有效连接的核酸序列如编码序列而言是异源的。此外,具体序列就它所插入的细胞或生物而言可以是“异源的”(即并非天然存在于该具体细胞或生物中)。
[0245] 表述“有效连接的”意指嵌合基因的该元件以这样的方式彼此连接,使得其功能协调,允许表达编码序列,即它们功能性连接。作为实例,在启动子能够确保另一核苷酸序列的转录和最终表达时,该启动子与该另一核苷酸序列功能性连接。如果两个蛋白质编码核苷酸序列(例如转运肽编码核酸序列和编码第二蛋白质的核酸序列)以这样的方式连接,使得可以形成第一和第二蛋白质或多肽的融合蛋白,则它们功能性连接或有效连接。
[0246] 在基因(例如嵌合基因)导致形成表达产物时,称它表达。表达产物指产生于编码这种产物的核酸、DNA或RNA(例如本文所述第二核酸)的转录和可选的翻译的中间产物或终产物。转录过程中,处于调节区尤其是启动子控制下的DNA序列转录为RNA分子。RNA分子可以自己形成表达产物,或在它能够翻译为肽或蛋白质时是中间产物。在RNA作为基因表达终产物例如能够与另一核酸或蛋白质相互作用时,称基因编码RNA分子作为表达产物。RNA表达产物的实例包括抑制RNA,例如有义RNA(共抑制)、反义RNA、核酶、miRNA或siRNA、mRNA、rRNA和tRNA。在基因表达终产物是蛋白质或肽时,称基因编码蛋白质作为最终产物。
[0247] 植物可表达的嵌合基因是能够在植物(细胞)中表达的嵌合基因。这种嵌合基因包含植物可表达的启动子和可选的在植物细胞中具有功能的3’端区。
[0248] 可将其他有效连接的元件(例如增强子、内含子)包含入本发明的嵌合基因,以增强有效连接的编码序列的表达。
[0249] 本文所用的核酸或核苷酸指DNA和RNA二者。DNA还包括cDNA和基因组DNA。核酸分子可以是单链或双链,且可以化学合成或在体外或甚至在体内通过生物表达产生。
[0250] 显而易见,无论何时通过引用相应DNA分子的核苷酸序列来定义RNA分子的核苷酸序列,均应将核苷酸序列中的胸腺嘧啶(T)替换为尿嘧啶(U)。引用RNA还是DNA分子将从本申请的上下文显而易见。
[0251] 本文所用的“包含”将解释为指出所提到的陈述特征、整数、步骤或成分的存在,但不排除一个或多个特征、整数、步骤或成分或其组的存在或加入。因此,例如,包含核苷酸或氨基酸的序列的核酸或蛋白质可以包含比实际引用的核苷酸或氨基酸多的核苷酸或氨基酸,即包含在更大的核酸或蛋白质中。包含功能或结构确定的DNA区的嵌合基因可以包含附加的DNA区等。
[0252] 除非实施例中另有说明,所有重组DNA技术均按Sambrook等(1989)Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press,NY中及Ausubel等(1994)Current Protocols in Molecular Biology,Current Protocols,USA的第1和2卷中所述的标准流程进行。BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications,UK联合出版的R.D.D.Cray的Plant Molecular Biology Labfax(1993)中描述了用于植物分子研究的标准材料和方法。标准分子生物学技术的其他参考文献包括Sambrook和Russell(2001)Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press,NY;Brown(1998)Molecular Biology LabFax,第2版,Academic Press(UK)的第I和II卷。用于聚合酶链反应的标准材料和方法可见于Dieffenbach和Dveksler(1995)PCR Primer:A Laboratory Manual,Cold Spring Harbor Laboratory Press中,及McPherson等(2000)PCR-Basics:From Background to Bench,第1版,Springer Verlag,德国中。
[0253] 本文中提到或引用的所有专利、专利申请和出版物或公开(包括互联网上的出版物)以其整体引入作为参考。
[0254] 包含在61千字节(在Microsoft 中测量的大小)的命名为“BCS16-2019_ST25.txt”的文件中的序列表包含SEQ ID NO:1至SEQ ID NO:6这6个序列,在此通过电子提交一并提交,且在此引入作为参考。
[0255] 将参考本文所述的实施例进一步描述本发明;但是,应理解本发明不限于这类实施例。
[0256] 序列表
[0257] 在整篇说明书和实施例中,引用以下序列:
[0258] SEQ ID NO.1:Cas9载体pKVA790/pBay00201的核苷酸序列;
[0259] SEQ ID NO.2:gRNA载体pKVA766的核苷酸序列;
[0260] SEQ ID NO.3:TIPS修复载体pKVA761的核苷酸序列;
[0261] SEQ ID NO.4:T-DNA载体pBay00461的核苷酸序列;
[0262] SEQ ID NO.5:存在于pKVA790/pBay00201和pBay00461中的植物优化Cas9的编码序列;
[0263] SEQ ID NO.6:SEQ ID NO.5的植物密码子优化Cas9的氨基酸序列。实施例
[0264] 实施例1:载体构建
[0265] 使用标准分子生物学技术,创建以下载体,其包含以下有效连接的元件:
[0266] ·RGEN(Cas9)表达载体pKVA790(Seq ID No:1):
[0267] o pubiZm(nt 431-2427):包含玉米泛素-1基因启动子区的序列(Christensen等,1992);
[0268] ■5'UTR(nt 1261-2427):包含玉米泛素-1基因前导序列的序列(Christensen等,1992);包含内含子;
[0269] ■内含子(nt  1481-2427):包含玉米泛素-1基因的第一内含子的序列(Christensen等,1992);
[0270] o Cas9Sp-3Pb(nt 2430-6635):经修饰的酿脓链球菌内切核酸酶CAS9基因的编码序列(CDS)(Li等,2013),在24位氨基酸包含E而不是D,进一步适应稻或小麦密码子选择;
[0271] ■NLSsv40(nt  2439-2456):源自猿猴病毒40大T抗原基因的核定位信号(Kalderon等,1984);
[0272] ■NLSnuplXI(nt 6594-6632):非洲爪蟾(Xenopus laevis)核质蛋白基因的核定位信号(Dingwall等,2187);
[0273] o 3'nos-N3(nt 6646-6904):包含来自pTiT37的T-DNA的胭脂氨酸合成酶基因3’非翻译区的序列(Depicker等,1982)。
[0274] ·向导RNA表达载体pKVA766(SEQ ID NO:2):
[0275] o P-u6-3.1(nt 534-1049-互补链):稻U6基因的Pol III启动子区(Jiang W.等,2013);
[0276] o sgR-1.22(nt 429-533-互补链):编码用于内切核酸酶CAS9介导的DNA切割的合成向导RNA的序列(Li等,2013),靶向稻epsps基因;
[0277] ■SiteTS3(nt 429-448互补链):sgRNA靶向序列;
[0278] ■sgR22(nt 429-533互补链):编码用于内切核酸酶CAS9介导的DNA切割的合成向导RNA的序列(Li等,2013),靶向稻EPSPS基因;
[0279] ■sgRNA(nt 449-525互补链):向导RNA支架序列;
[0280] ■Tpolll(nt 526-533互补链):RNA聚合酶III终止信号。
[0281] ·用于TIPS突变的修复DNA载体pKVA761(SEQ ID NO:3):
[0282] o epspsOs-2Ga-4(nt 404-1403):经修饰的稻5-烯醇丙酮莽草酸-3-磷酸合酶基因的基因组编码序列的片段,编码经修饰的稻物种EPSPS蛋白(未公开);
[0283] ■外显子(nt 717-961);
[0284] ■TIPS区(nt 888-926);
[0285] ■T169I(nt 909-911);
[0286] ■P173S(nt 921-923);
[0287] ■外显子(nt 1041-1194)。
[0288] ·包含Cas9、gRNA和TIPS修复DNA的T-DNA载体pTKVA869/pBay00461(SEQ ID NO:4):
[0289] o RB(nt 1至25):来自根瘤农杆菌T-DNA的右边界重复(Zambryski,1988);
[0290] Cas9嵌合基因:
[0291] o pubiZm(nt 143-2139):包含玉米泛素-1基因启动子区的序列(Christensen等,1992);
[0292] ■5'ubiZm内含子1(nt 1130-2139):包含玉米泛素-1基因的第一内含子的序列(Christensen等,1992);
[0293] o Cas9Sp-3Pb(nt 2142-6347):经修饰的酿脓链球菌内切核酸酶CAS9基因的编码序列(CDS)(Li等,2013),适应稻密码子选择;
[0294] ■NLSsv40(nt  2151-2168):源自猿猴病毒40大T抗原基因的核定位信号(Kalderon等,1984);
[0295] ■NLSnuplXI(nt 6306-6344):非洲爪蟾核质蛋白基因的核定位信号(Dingwall等,2187);
[0296] o 3'nos-N3(nt 6646-6904):包含来自pTiT37的T-DNA的胭脂氨酸合成酶基因3’非翻译区的序列(Depicker等,1982);
[0297] gRNA嵌合基因:
[0298] o P-U6-3.1(nt 6630-7145):稻U6基因的启动子区(Jiang W.等,2013);
[0299] o Guide RNA(nt 7146-7250):编码用于内切核酸酶CAS9介导的DNA切割的合成向导RNA的序列(Li等,2013),靶向稻epsps基因;
[0300] ■SiteTS3(nt 7146-7165):sgRNA靶向序列;
[0301] ■sgR22(nt 7146-7250):编码用于内切核酸酶CAS9介导的DNA切割的合成向导RNA的序列(Li等,2013),靶向稻EPSPS基因;
[0302] ■sgRNA(nt 7166-7242):向导RNA支架序列;
[0303] ■Tpolll(nt 7243-7250):RNA聚合酶III终止信号;
[0304] 携带TIPS突变的用于EPSPS的修复DNA
[0305] o epspsOs-2Ga-4(nt 404-1403):经修饰的稻5-烯醇丙酮莽草酸-3-磷酸合酶基因的基因组编码序列的片段,编码经修饰的稻物种EPSPS蛋白(未公开);
[0306] ■外显子(nt 7570-7814):
[0307] ■TIPS区(nt 7741-7779)
[0308] ■T169I(nt 7762-7764)
[0309] ■P173S(nt 7774-7776)
[0310] ■外显子(nt 7894-8047)
[0311] Bar选择标记基因
[0312] o P35S3(nt8650-9435):包含花椰菜花叶病毒35S转录物的启动子区的序列(Odell等,1985).
[0313] o Bar编码序列(nt9438-9989):吸水链霉菌(Streptomyces hygroscopicus)膦丝菌素乙酰转移酶基因的编码序列(Thompson等,1987).
[0314] o 3'nos(nt 10009-10269):包含来自pTiT37的T-DNA的胭脂氨酸合成酶基因3’非翻译区的序列(Depicker等,1982);
[0315] o LB(nt 10464-10488):来自根瘤农杆菌T-DNA的左边界重复(Zambryski,1988)。
[0316] 实施例2:培养基
[0317] RSK-500=SK-1m盐(Khanna&Raina,1998)、Khanna维生素(Khanna&Raina,1998)、L-脯氨酸1.16g/L、CuS04.5H20 2.5mg/L、2.4-D 2mg/L、麦芽糖20g/L、山梨醇30g/L、MES 0.5g/L、琼脂糖6g/L、pH 5.8;
[0318] RSK-600=RSK500培养基,但含1mg/L 2.4-D和0.5mg/L BAP;
[0319] RSK-100=SK-1m盐(Khanna&Raina,1998)、Khanna维生素(Khanna&Raina,1998)、L-脯氨酸1.16g/L、2.4-D 2mg/L、蔗糖30g/L、MES 0.5g/L、琼脂糖6g/L、pH 5.8;
[0320] RSK-201=SK-1m盐Duchefa(Khanna&Raina,1998)、Khanna维生素(Khanna&Raina,1998)、L-脯氨酸1.16g/L、L-谷氨酰胺0.8765g/L、L-精氨酸0.174g/L、甘氨酸7.5mg/L、L-天冬氨酸0.288g/L、酪蛋白水解物300mg/L、2.4-D 2mg/L、蔗糖20g/L、甘露醇55g/L、山梨醇
55g/L、MES 0.5g/L、琼脂糖6g/L、pH 5.8;
[0321] MSR4=MS培养基、L-脯氨酸0.552g/L、L-谷氨酰胺0.8765g/L、L-精氨酸0.174g/L、甘氨酸7.5mg/L、L-天冬氨酸0.288g/L、激动素1mg/L、NAA 0.5mg/L、麦芽糖30g/L、山梨醇10g/L、MES 0.5g/L、琼脂糖6g/L、pH 5.8;
[0322] MSR2=MS培养基、L-脯氨酸0.552g/L、酪蛋白水解物300mg/L、NAA 0.5mg/L、蔗糖30g/L、MES0.5g/L、琼脂糖6g/L、pH 5.8;
[0323] AAM=AA培养基(Hiei等,1994)、L-谷氨酰胺0.8765g/L、L-精氨酸0.174g/L、甘氨酸7.5mg/L、L-天冬氨酸0.288g/L、酪蛋白氨基酸500mg/L、蔗糖68.5g/L、葡萄糖36g/L、pH 5.2;
[0324] SKAS-1m诱导前培养基=SK-1m盐Duchefa(Khanna&Raina,1998)、Khanna维生素(Khanna&Raina,1998)、L-脯氨酸1.16g/L、L-谷氨酰胺0.8765g/L、L-精氨酸0.174g/L、甘氨酸7.5mg/L、L-天冬氨酸0.288g/L、酪蛋白水解物300mg/L、2.4-D 2mg/L、乙酰丁香酮200μΜ、蔗糖30g/L、葡萄糖10g/L、琼脂糖6g/L、pH 5.2;
[0325] SKAS-1m共培养培养基=SK-1m盐Duchefa(Khanna&Raina,1998)、Khanna维生素(Khanna&Raina,1998)、2.4-D 2mg/L、乙酰丁香酮200μΜ、蔗糖30g/L、葡萄糖10g/L、琼脂糖6g/L pH 5.2
[0326] MS/2=含1/2浓度的MS盐、蔗糖30g/L、琼脂糖4.5g/L、pH 5.8的MS培养基。
[0327] 参考文献
[0328] Khanna&Raina,Plant Cell,Tissue and Organ Culture,52:145-153,1998[0329] Hiei等,Plant J.,6:271-282,1994
[0330] 实施例3:使用成胚愈伤组织的粒子轰击介导的编辑
[0331] 用成熟种子来源的成胚愈伤组织作为起始物质进行粒子轰击。为此,在25-30℃之间的温度下在RSK100基质上避光孵育无菌种子~3至4周进行成胚愈伤组织的诱导。
[0332] 在RSK100上孵育3至4周后,从RSK100平板选择成胚愈伤组织,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下在RSK600上传代培养几天。
[0333] 轰击当天,选择来自RSK600平板的活跃生长的成胚,切为更小的块,转移至RSK201上进行几小时的预质壁分离。预质壁分离后,用生物射弹PDS-100/He粒子递送系统(Bio-Rad)或粒子流入枪(PIG)系统(Grayel)轰击EC。对于Biorad系统,粒子轰击参数如下:金粒子直径,0.3-3μm;靶标距离,9cm;轰击压力,9301.5k Pa;间隙距离,6.4mm;巨载体飞行距离,11mm。对于各质粒DNA(Cas9、gRNA、修复DNA),每次发射使用0.125pmol DNA。对于Grayel系统,粒子轰击参数如下:金粒子直径,0.6μm;靶标距离17cm;轰击压力500k Pa;对于各质粒DNA(Cas9、gRNA、修复DNA),每次发射使用1.25μg DNA。
[0334] 轰击后,将愈伤组织块转移至非选择性RSK500愈伤组织诱导培养基,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育几天。在非选择性基质上的此时期之后,将愈伤组织块转移至补充了150mg/L草甘膦作为选择剂的RSK500培养基,再次在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育。
[0335] ~3至4周后,将在含150mg/L草甘膦的选择性RSK500培养基上显示成胚愈伤组织增殖的愈伤组织块传代培养在相同的基质上。每次传代应包括充分切割活跃生长的成胚愈伤组织块,直至获得“纯的”耐草甘膦成胚愈伤组织系。然后将该“纯的”活跃生长耐草甘膦成胚愈伤组织系转移至RSK600基质+150mg/L草甘膦。在RSK 600培养基上孵育约1个月后,将愈伤组织块转移至非选择性再生培养基MSR4,在16小时光照/8小时避光的光周期下在25-30℃下孵育。可将再生苗的愈伤组织转移至MSR2培养基进行进一步发育。将再生苗转移至MS/2基质进行进一步伸长,然后转移至温室
[0336] 结果
[0337] 用上述质粒pKVA790(Cas9)+pKVA761(修复DNA)+pKVA766(gRNA)转化成胚愈伤组织。这产生了使用PIG装置的每~500个愈伤组织1-8个GlyT事件(0.2-1.6%)和使用Biorad装置的每~500个愈伤组织0-1个GlyT事件(0-0.2%)的回收率。进行靶区域扩增PCR产物的限制消化(PvuI)作为第一分子筛选来确认在天然epsps基因中作为沉默突变引入了TIPS突变,在供体DNA中靠近TIPS突变引入Pvul位点,以便于鉴定TIPS epsps编辑事件的分子筛选。通过Biorad基因枪获得的2个glyT愈伤组织事件的扩增PCR产物的Pvu1消化产物显示2个单等位基因TIPS编辑事件。从这2个事件获得的克隆PCR产物的测序显示,这些是双等位基因突变,一个等位基因中是TIPS突变,另一个等位基因中是靶位点处的6bp缺失(参见图2)。
[0338] 通过PIG获得的53个glyT愈伤组织事件的扩增PCR产物的Pvu1消化产物揭示了38个单等位基因TIPS编辑事件、14个双等位基因TIPS编辑事件和1个无TIPS突变的事件。13个双等位基因事件的测序分析确认TIPS突变在两个等位基因中的存在。从通过PIG获得的8个单等位基因编辑事件获得的克隆PCR产物的测序显示,这些是双等位基因突变事件,一个等位基因中是TIPS突变,另一个等位基因中是非特异性突变(插入或缺失)。
[0339] 实施例4:使用未成熟胚的农杆菌介导的编辑
[0340] 方法
[0341] 将新鲜分离的未成熟胚转移至补充了25mg/L乙酰水杨酸的固体SKAS-1m预诱导培养基,25-30℃之间的温度下避光3-4天。预诱导后,将未成熟胚浸入农杆菌感染培养基(2x109细菌/ml于AAM+300μΜAS中)10-15分钟,然后转移至SKAS-1m共培养培养基,~25℃避光3至4天。
[0342] 共培养后,从胚去除胚芽鞘,将胚转移至补充了250mg/L替卡西林(ticarcillin)的非选择性RSK500愈伤组织诱导培养基,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育几天。
[0343] 在非选择性基质上的此时期后,将胚转移至相同的RSK500培养基+250mg/L替卡西林,现在补充150mg/L草甘膦作为选择剂,再次在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育。
[0344] 3至4周后,将在含250mg/L替卡西林+150mg/L草甘膦的选择性RSK500培养基上显示成胚愈伤组织增殖的胚传代培养在相同的基质上。每次传代应包括充分切割活跃生长的成胚愈伤组织块,直至获得“纯的”耐草甘膦成胚愈伤组织系。然后将该“纯的”活跃生长耐草甘膦成胚愈伤组织系转移至含250mg/L替卡西林+150mg/L草甘膦的选择性RSK600培养基。在RSK 600培养基上孵育约1个月后,将愈伤组织块转移至含100mg/L替卡西林的非选择性再生培养基MSR4,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育。可将再生苗的愈伤组织转移至含100mg/L替卡西林的MSR2培养基进行进一步发育。将再生苗转移至MS/2基质进行进一步伸长,然后转移至温室。
[0345] 结果
[0346] 将与实施例3中所述相同的成分(即pKVA790的Cas9+pKVA761的修复DNA+pKVA766(gRNA)的gRNA)克隆入一个T-DNA载体pTKVA869/pBay00461,并转化入农杆菌菌株ACH5C3(GV400),随后用该农杆菌菌株来按上文所述转化未成熟胚。
[0347] 这产生了~10%的GlyT愈伤组织事件回收率(77个glyT愈伤组织事件/750个共培养的未成熟胚)。75个glyT愈伤组织事件的扩增PCR产物的PvuI消化产物揭示58个单等位基因TIPS epsps编辑事件,15个双等位基因TIPS编辑事件和1个无TIPS突变的事件。2个双等位基因TIPS编辑事件的PCR产物的测序分析确认两个等位基因中都存在TIPS突变。来自6个单等位基因TIPS编辑事件的克隆PCR产物的测序分析显示这些是双等位基因突变事件,一个等位基因中是TIPS突变,另一个等位基因中是非特异性突变(缺失或插入)。
[0348] 实施例5:使用成胚愈伤组织的农杆菌介导的编辑
[0349] 用成熟种子来源的成胚愈伤组织作为起始物质进行共培养。为此,在25-30℃之间的温度下在RSK100基质上避光孵育无菌种子~3至4周进行成胚愈伤组织的诱导。
[0350] 在RSK100上孵育3至4周后,从RSK100平板选择成胚愈伤组织,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下在RSK600上传代培养几天。
[0351] 共培养起始当天,选择来自RSK600平板的活跃生长成胚愈伤组织块,浸入农杆菌9
感染培养基(4x10细菌/ml于AAM+300μΜAS中)10-15分钟,然后转移至SKAS-1m共培养培养基,~25℃避光3至4天。
[0352] 共培养后,将愈伤组织块转移至非选择性RSK500愈伤组织诱导培养基+250mg/L替卡西林,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育几天。在非选择性基质上的此时期之后,将愈伤组织块转移至相同的RSK500培养基+250mg/L替卡西林,现在补充150mg/L草甘膦作为选择剂,再次在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育。
[0353] ~3至4周后,将在含150mg/L草甘膦的选择性RSK500培养基+250mg/L替卡西林上显示成胚愈伤组织增殖的愈伤组织块充分切割后传代培养在相同的基质上。每次传代应包括充分切割活跃生长的成胚愈伤组织块,直至获得“纯的”耐草甘膦成胚愈伤组织系。然后将该“纯的”活跃生长耐草甘膦成胚愈伤组织系转移至选择性RSK600基质+250mg/L替卡西林和150mg/L草甘膦。在RSK 600培养基上孵育约1个月后,将愈伤组织块转移至含100mg/L替卡西林的再生培养基MSR4,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育。可将再生苗转移至含100mg/L替卡西林的MSR2培养基进行进一步发育。将再生苗转移至MS/2基质进行进一步伸长,然后转移至温室。
[0354] 结果
[0355] 将与实施例3中所述相同的成分(即pKVA790的Cas9+pKVA761的修复DNA+pKVA766(gRNA)的gRNA)克隆入一个T-DNA载体pTKVA869/pBay00461,并转化入农杆菌菌株GA00182,随后用该农杆菌菌株来按上文所述转化成胚愈伤组织。
[0356] 这产生了10-18个glyT事件/~500个共培养的愈伤组织块(2-4%)的回收率。10个glyT愈伤组织事件的扩增PCR产物的PvuI消化产物揭示9个单等位基因TIPS epsps编辑事件和1个双等位基因TIPS编辑事件。
[0357] 实施例6:使用未成熟胚和间接选择的农杆菌介导的编辑
[0358] 方法
[0359] 将新鲜分离的未成熟胚转移至补充了25mg/L乙酰水杨酸的固体SKAS-1m预诱导培养基,25-30℃之间的温度下避光3-4天。预诱导后,将未成熟胚浸入农杆菌感染培养基(2x109细菌/ml于AAM+300μΜAS中)10-15分钟,然后转移至SKAS-1m共培养培养基,~25℃避光3至4天。
[0360] 共培养后,从胚去除胚芽鞘,将胚转移至补充了250mg/L替卡西林的非选择性RSK500愈伤组织诱导培养基,在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育几天。
[0361] 在非选择性基质上3天后,将胚转移至相同的RSK500培养基+250mg/L替卡西林,现在补充5mg/L膦丝菌素(PPT)作为选择剂,再次在16小时光照/8小时避光的光周期下在25-30℃之间的温度下孵育。
[0362] 3至4周后,将在含250mg/L替卡西林和5mg/L PPT的选择性RSK500培养基上显示成胚愈伤组织增殖的胚切为更小块,传代培养在含5mg/L PPT的相同基质上。3周后,再次在含250mg/L替卡西林和5mg/L PPT的选择性RSK500培养基上传代培养增殖的愈伤组织切块。
[0363] 结果
[0364] 用实施例4中所述农杆菌菌株ACH5C3(GV400)(除实施例1中所述bar选择标记外还包含三成分T-DNA载体pBay00461/pTKVA869)来转化未成熟胚,并按上文所述进行PPT选择。
[0365] 在最初铺板的178个未成熟胚(IE)中,95个IE产生了耐PPT愈伤组织。从这些活跃生长的耐PPT成胚愈伤组织系收获了多个切块,用一条TIPS突变上的引物和一条供体DNA同源区外侧的epsps基因中的引物进行TIPS PCR。在95个反应IE的44个(46.3%)中,一个或多个愈伤组织切块产生了TIPS特异性PCR扩增产物。
[0366] 在反应IE亚组中,将TIPS PCR取样后剩余的EC切为小块,通过在150mg/L草甘膦上选择仍可回收耐草甘膦事件。
[0367] 这表明用一个农杆菌菌株同时递送选择标记基因和随后在相应的选择剂上选择允许在不“直接”对编辑本身进行选择(如实施例4和5中所述)的情况下回收修复DNA介导的编辑事件。
[0368] 在与两个农杆菌菌株(一个包含修复DNA加gRNA和Cas9表达盒,另一个包含选择标记基因(bar))共培养时,上文所述PPT选择后,在最初铺板的135个未成熟胚中,回收了3个glyR事件。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈