用于产生对草甘膦除草剂具有抗性的植物的组合物和方法

申请号 CN201580048737.3 申请日 2015-07-01 公开(公告)号 CN106687594A 公开(公告)日 2017-05-17
申请人 纳幕尔杜邦公司; 先锋国际良种公司; 发明人 V.德祖卡诺维; S.C.乔内斯; Z-B.刘; M.拉斯纳; L.A.赖兹尼克;
摘要 本公开包括对膦酰基甲基甘 氨 酸家族的 除草剂 ,例如草甘膦具有抗性的突变 植物 的产生。提供了用于编辑细胞中的感兴趣的核苷酸序列的组合物和方法,其采用向导多核苷酸/Cas内切核酸酶系统,其中Cas内切核酸酶通过向导多核苷酸引导以识别且任选地向细胞的基因组中的特定靶位点处引入双链断裂。待编辑的感兴趣的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。更具体地,提供了用于编辑细胞中的烯醇式丙 酮 基莽 草酸 ‑3‑ 磷酸 合酶(EPSPS)核苷酸序列的组合物和方法。所述方法和组合物采用向导多核苷酸/Cas内切核酸酶系统来提供用于编辑细胞基因组内的EPSPS核苷酸序列的有效系统。还提供了用于产生草甘膦耐受性植物细胞、植物外植体、 种子 和谷粒的组合物和方法。
权利要求

1.一种用于产生烯醇式丙基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
2.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
b)由(a)的植物细胞获得植物;
c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
d)选择表现出草甘膦抗性的子代植物。
3.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
a)获得植物或其种子,其中所述植物或所述种子在内源性EPSPS基因中包含修饰,所述修饰通过Cas内切核酸酶、向导RNA和多核苷酸修饰模板产生,其中所述植物或所述种子对草甘膦具有抗性;以及
b)产生不含所述向导RNA和Cas内切核酸酶的子代植物。
4.一种产生草甘膦抗性玉米植物的方法,所述方法包括提供玉米植物细胞,其中所述玉米植物细胞的内源性染色体EPSPS基因已通过向导RNA/Cas内切核酸酶系统进行修饰以产生草甘膦抗性EPSPS蛋白;以及由所述玉米植物细胞培育玉米植物,其中所述植物对草甘膦具有抗性。
5.一种由权利要求1-4中任一项所述的方法产生的植物。
6.一种由权利要求5所述的植物产生的种子。
7.一种向导RNA,其中所述可变靶向域靶向植物EPSPS核苷酸序列的片段
8.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的细胞提供向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)获得在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
9.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
10.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,所述方法包括:
a)向包含EPSPS核苷酸序列的细胞提供能够表达向导RNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA构建体、以及多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS基因的非功能片段和所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
11.一种用于复制细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因片段的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含EPSPS基因片段的至少一个拷贝。
12.一种用于替换细胞中的第一烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)启动子序列的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含不同于所述第一EPSPS启动子序列的第二启动子或第二启动子片段。
13.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入调控元件的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含待插入到所述EPSPS核苷酸序列中的调控元件。
14.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入内含子的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含内含子序列。
15.一种草甘膦抗性玉米植物,其中所述玉米植物包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中所述玉米植物不表达草甘膦敏感性EPSPS多肽。
16.一种草甘膦抗性玉米植物细胞,其中所述玉米植物细胞包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中所述内源性EPSPS多核苷酸序列存在于与对应野生型对照相比相同的染色体位置

说明书全文

用于产生对草甘膦除草剂具有抗性的植物的组合物和方法

[0001] 本申请要求2014年7月11日提交的美国临时申请62/023246的权益,所述文献全文以引用方式并入本文。

技术领域

[0002] 本公开涉及分子生物学领域,具体地,涉及用于针对除草剂抗性编辑细胞基因组的方法。
[0003] 以电子方式递交的序列表的引用
[0004] 通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表提交,该文件名称为“20150617_BB2366PCT_SeqLst_ST25.txt”,创建日期为2015年6月17日,文件大小为220千字节,并且该文件与本说明书同时提交。在这一ASCII格式的文件中包含的序列表
为所述说明书的部分并且全文以引用方式并入本文。

背景技术

[0005] 除草剂抗性植物可减少对用以控制杂草的耕种的需要,从而有效地降低种植者的成本。具有增加的除草剂抗性的作物的开发是当前农业实践中的重大突破,因为它为农民
提供了新的杂草控制选择。
[0006] 就此而言作为许多研究的主题的一种除草剂是N-膦酰基甲基甘酸,通常称为草甘膦。草甘膦抑制莽草酸途径,其导致包括氨基酸、激素和维生素的芳族化合物的生物合
成。具体地,草甘膦通过抑制酶5-烯醇式丙基莽草酸-3-磷酸合酶(称为EPSPS)来遏制磷
酸烯醇式丙酮酸(PEP)和3-磷酸基莽草酸向5-烯醇式丙酮基-3-磷酸莽草酸的转化。已使用
植物基因工程方法修饰EPSP合酶DNA和所编码的蛋白质,并且将这些分子转入在农学上重
要的植物中。已经分离出造成草甘膦抗性的I类EPSPS的变体(Pro-Ser,美国专利4,769,
061;Gly-Ala,美国专利4,971,908;Gly-Ala、Gly-Asp,美国专利5,310,667;Gly-Ala、Ala-Thr,美国专利5,8866,775)。然而,许多EPSPS变体不是用于植物中的有效酶(Padgette等
人,在“Herbicide-resistant Crops”中,第4章第53-83页.Stephen Duke编辑,Lewis Pub,CRC Press Boca Raton,Fla.1996)。一种I类EPSPS变体,即可操作地连接至异源启动子的T-102-I/P-106-S(TIPS),已经表现出为转基因玉米植物提供草甘膦(N-膦酰基甲基甘氨
酸)抗性(美国专利6,040,497)。
[0007] 仍然需要开发抗除草剂作物,尤其是抗草甘膦的作物。还需要开发包含通过基因编辑获得的突变基因的具有农业价值的抗除草剂作物,其中基因的突变导致除草剂抗性。
[0008] 提供了用于产生表现出除草剂抗性且具体地草甘膦抗性的突变植物的组合物和方法。
发明内容
[0009] 本公开包括对膦酰基甲基甘氨酸家族的除草剂,例如草甘膦具有抗性的突变植物的产生。提供了用于编辑细胞中的感兴趣的核苷酸序列的组合物和方法,其采用向导多核
苷酸/Cas内切核酸酶系统,其中Cas内切核酸酶通过向导多核苷酸引导以识别且任选地向
细胞的基因组中的特定靶位点处引入双链断裂。待编辑的感兴趣的核苷酸序列可位于由
Cas内切核酸酶识别的靶位点之内或之外。更具体地,提供了用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的组合物和方法。所述方法和组合物采用向导多
核苷酸/Cas内切核酸酶系统来提供用于编辑细胞基因组内的EPSPS核苷酸序列的有效系
统。待编辑的核苷酸序列可位于由Cas内切核酸酶识别的靶位点之内或之外。细胞包括但不限于植物细胞。还提供了用于产生草甘膦耐受性或草甘膦抗性植物细胞、植物外植体、种子和谷粒的组合物和方法。
[0010] 因此,在本公开的第一实施方案中,所述方法包括一种用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的方法,该方法包括向所述细胞引入向导
RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复
合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰。多核苷酸修
饰模板还可包括EPSPS基因的非功能片段
[0011] 在另一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含EPSPS核苷酸序列的细胞中引入向导
RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复
合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定
在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰
包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。可通过本领域已知的方法或者通过能够表达向导RNA的重组DNA构建体的表达而将向导RNA直接引入
细胞。可通过本领域已知的方法或者通过能够表达Cas内切核酸酶的重组DNA构建体的表达
而将Cas内切核酸酶直接引入细胞。多核苷酸修饰模板(EPSPS多核苷酸修饰模板)可包括
EPSPS基因的部分片段(并且因此其自身不编码全功能性的EPSPS多肽)。
[0012] 在其它实施方案中,所述方法包括一种用于复制细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因片段的方法,一种用于替换细胞中的烯醇式丙酮基莽草酸-3-磷酸
合酶(EPSPS)启动子序列的方法,一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶
(EPSPS)核苷酸序列中插入启动子或调控元件的方法,一种用于编辑细胞中的烯醇式丙酮
基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的内含子元件的方法,所述方法包括向所述细胞
中引入向导RNA、多核苷酸修饰模板和Cas内切核酸酶。细胞可以是但不限于任何植物细胞。
[0013] 在另一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向
导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成
复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链
断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;d)选择
表现出草甘膦抗性的子代植物。
[0014] 在另一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向
导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成
复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链
断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及d)
筛选不含所述向导RNA和Cas内切核酸酶的(c)的子代植物。
[0015] 本发明提供包含经编辑的感兴趣的基因(诸如但不限于烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因序列)的植物、植物部分、植物细胞和种子,其中包含经编辑的感兴趣的基因的这些突变植物、植物部分、植物细胞和种子表现出除草剂抗性。
[0016] 本文公开了本发明的方法和组合物的另外的实施方案。
[0017] 附图和序列表简述
[0018] 根据下列的详细描述和附图以及序列表,可以更全面地理解本发明,下列的详细描述和附图以及序列表形成本申请的一部分。序列描述以及所附序列表遵循如37 C.F.R.§
§1.821-1.825所列出的关于专利申请中核苷酸和氨基酸序列公开的规定。序列描述包含如
37 C.F.R.§§1.821-1.825中所限定的氨基酸的三个字母编码,其以引用方式并入本文。
[0019] 附图
[0020] 图1A示出含有双分子的双链向导多核苷酸,该双链向导多核苷酸包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多
肽相互作用的第二核苷酸序列域(称为Cas内切核酸酶识别域或CER域)。双链向导多核苷酸
的CER域包含沿着互补区域杂交的两个单独分子。这两个单独分子可为RNA、DNA和/或RNA-
DNA组合序列。包含连接到CER域的VT域的双链向导多核苷酸的第一分子(示为cr核苷酸)被
称为“crDNA”(当由DNA核苷酸的连续片段构成时)或“crRNA”(当由RNA核苷酸的连续片段构成时),或“crDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。包含CER域的双链向导多核苷酸的第二分子(示为tracr核苷酸)被称为“tracrRNA”(当由RNA核苷酸的连续片段构成时)或“tracrDNA”(当由DNA核苷酸的连续片段构成时),或“tracrDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。
[0021] 图1B示出单链向导多核苷酸,该单链向导多核苷酸包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互作用的
第二核苷酸域(称为Cas内切核酸酶识别域或CER域)。所谓“域”,意指核苷酸的连续片段,该连续片段可为RNA、DNA和/或RNA-DNA组合序列。单链向导多核苷酸包含通过连接子核苷酸
序列(示为环)连接到tracr核苷酸(包含CER域)的cr核苷酸(包含连接到CER域的VT域)。由
来自cr核苷酸和tracr核苷酸的序列构成的单链向导多核苷酸可被称为“单链向导RNA”(当由RNA核苷酸的连续片段构成时)或“单链向导DNA”(当由DNA核苷酸的连续片段构成时)或
“单链向导RNA-DNA”(当由RNA核苷酸和DNA核苷酸的组合构成时)。
[0022] 图2A至图2C示出用于Cas9、crRNA和tracrRNA表达的表达盒。图2A示出含有铃薯ST-LS1内含子、SV40氨基末端核定位序列(SV40NLS)和VirD2羧基末端NLS(VirD2 NLS)的玉
米密码子优化的Cas9基因(编码Cas9内切核酸酶),其可操作地连接至植物泛素启动子(UBI Pro)(诸如但不限于SEQ ID NO:5)。玉米优化的Cas9基因(仅Cas9编码序列,不是NLS)对应于SEQ ID NO:5的核苷酸位置2037-2411和2601-6329,其中马铃薯内含子位于SEQ ID NO:5的第2412-2600位处。SV40NLS位于SEQ ID NO:5的第2010-2036位处。VirD2 NLS位于SEQ ID NO:5的第6330-6386位处。图2B示出可操作地连接至核苷酸序列的玉米U6聚合酶III启动
子,该核苷酸序列编码可操作地连接至玉米U6终止子的crRNA分子。图2C示出可操作地连接至核苷酸序列的玉米U6聚合酶III启动子,该核苷酸序列编码可操作地连接至玉米U6 
PolIII终止子的tracrRNA分子。图2D示出了可操作地连接至玉米U6聚合酶III启动子的单
链向导多核苷酸(向导RNA),其被玉米U6终止子终止。图2E示出了玉米优化的Cas9和单链向导RNA表达盒,二者结合到单个载体DNA上。
[0023] 图3示出相对于在玉米基因组LIGCas-3靶位点处适当取向的PAM序列(AGG)(SEQ ID NO:14,表1)与基因组LIGCas-3靶位点相互作用的单链向导RNA/Cas9内切核酸酶复合
物。该单链向导RNA(浅灰色背景,SEQ ID NO:8)是crRNA和tracrRNA之间的融合体并且包含与双链DNA基因组靶位点的一条DNA链互补的可变靶向域。Cas9内切核酸酶以深灰色示出。
形指向有义DNA链和反义DNA链两者上的预期DNA切割位点。
[0024] 图4A-B示出用于编辑感兴趣的核苷酸序列的单链向导RNA/Cas内切核酸酶系统的示意图。为了能够进行特定核苷酸编辑,将包含至少一个核苷酸修饰的多核苷酸修饰模板
(当与待编辑的核苷酸序列比较时)与单链向导RNA和Cas内切核酸酶表达盒一起引入细胞。
例如,如本文所示,待编辑的核苷酸序列为玉米细胞中的内源性野生型烯醇式丙酮基莽草
酸-3-磷酸合酶(EPSPS)基因。Cas内切核酸酶(阴影圆圈)为玉米优化的Cas9内切核酸酶,其使用诸如SEQ ID NO:24的向导RNA切割在epsps基因座内的moCas9靶序列。图4-A示出包括
三个核苷酸修饰的多核苷酸修饰模板(当与图4-B中描绘的野生型epsps基因座比较时),其
侧接有两个EPSPS基因同源性区域HR-1和HR-2。图4-B示出与epsps基因座相互作用的向导
RNA/玉米优化的Cas9内切核酸酶复合物。需要被编辑的EPSPS基因的初始氨基酸密码子示
为aCT和Cca(图4-B)。具有修饰的核苷酸的核苷酸密码子(以大写示出)示为aTC和Tca(图4-
B)。在涉及内源性EPSPS基因的修饰的示例中使用编码功能性玉米EPSPS蛋白的非全长DNA
分子。
[0025] 图5示出用于玉米中的EPSPS基因编辑的Cas9表达盒的两种型式(还可参见SEQ ID NO:5和SEQ ID NO:23)。
[0026] 图6示出moCas9靶序列(标有下划线)的一些示例,其位于EPSPS的DNA片段上,通过在玉米细胞中moCas9内切核酸酶的切割位点(粗箭头)处引入双链断裂来诱变。在SEQ ID 
NO:206中,moCas9切割位点旁边的三个核苷酸(短线)缺失。SEQ ID NO:207-208表示核苷酸缺失可扩大超出moCas9切割位点。
[0027] 图7示出了EPSPS模板载体,其用于递送包含三个TIPS核苷酸修饰的EPSPS多核苷酸修饰模板。EPSP多核苷酸修饰模板包括EPSPS基因的部分片段。载体长6,475基对(bp),并且包含两个与epsps基因座同源的区域(epsps-HR1和epsps-HR2)。两个Gateway克隆位点
(ATTL4和ATTL3)、抗生素抗性基因(KAN)和复制的pUC起点(PUC ORI)完成了EPSPS模板载体
的合成。
[0028] 图8示出了基于PCR的筛选策略,该策略用于鉴定玉米细胞中具有TIPS核苷酸修饰的玉米事件。两对PCR引物用于扩增epsps基因座的基因组片段(上段)。它们都包含TIPS特
异性引物(带圆点的箭头指示三个TIPS修饰的位点)。较短的片段(780bp F-E2)通过扩增
EPSPS多核苷酸修饰模板片段产生(模板检测)。除了4个分析事件,在其它分析事件中都发
现了扩增的EPSPS多核苷酸修饰模板片段(板F-E2)。较长的片段(839bp H-T)通过扩增基因
组EPSPS序列产生,前提条件是epsps基因座包含负责TIPS修饰的三个核苷酸修饰。六个事
件被鉴定为含有三个核苷酸修饰(板H-T)。白色箭头指向包含扩增的EPSPS多核苷酸修饰模
板和负责TIPS修饰的核苷酸修饰两者的事件。扩增了编码功能性EPSPS的非全长片段。
[0029] 图9A示出了用于鉴定所选择事件中经编辑的EPSPS DNA片段的PCR方案的示意图。无论编辑产物如何,都对含有epsps基因座的外显子1、内含子1和外显子2中的一部分的部
分基因组片段进行扩增(板A,1050bp F-E3。对仅代表具有一个或多个突变的部分EPSPS基
因序列的扩增产物进行克隆和测序。图9B示出经测序的扩增产物的两个示例。在一些扩增
产物中,EPSPS核苷酸和moCas9靶序列(标有下划线)没有变化,这表明一个EPSPS等位基因
未经编辑(野生型等位基因;SEQ ID NO:40)。在其它扩增产物中,三个特异性核苷酸置换(代表TIPS修饰)被鉴定为在moCas9靶序列(标有下划线)(SEQ ID NO:39)中没有突变。
[0030] 图10示出用大豆泛素启动子/5’UTR/内含子1替换EPSPS1启动子/5’UTR的实验设计。
[0031] 图11示出表示EPSP复制多核苷酸修饰模板的遗传元件的示意图。
[0032] 图12示出表示经设计允许epsps基因座的编辑以包含位于epsps-TIPS编码序列(TIPS)前面的玉米泛素启动子(Ubi启动子+Ubi内含子)的EPSPS多核苷酸玉米泛素启动子
模板(诸如SEQ ID NO:55)的示意图。
[0033] 图13A-13C.玉米EPSPS聚泛素化位点的修饰。(A)比较所选择的推测性玉米EPSPS聚泛素化位点(玉米)与其它植物物种(矮牵花、番茄、高粱、稻和苋属植物)的类似位点。
(B)玉米EPSPS编码序列中待编辑的核苷酸(标有下划线,编码氨基酸以粗体是示出)。(C)在所选择的T0植物中鉴定编辑的EPSPS编码序列。
[0034] 图14A-14C.内含子介导的增强元件(A)。EPSPS基因的第一内含子的5′区段(编辑:标有下划线的置换和点表示的缺失)(B)以及其赋予三个IME元件(标有下划线)的经编辑型
式,如所选择的玉米T0植株中所存在的。编辑的核苷酸以粗体示出(C)。
[0035] 图15A-15B.另选地,剪接玉米细胞中的EPSPS mRNA。(A)左板代表EPSPS cDNA的分析。图36A中的泳道I4示出了包含未剪接的第三内含子的EPSPS前mRNA的扩增(图36B所示的
804bp的诊断片段表示替代性剪接事件)。泳道E3和F8显示具有剪接内含子的EPSPS PCR扩
增片段。除非合成cDNA,否则不会扩增这些诊断片段(显然,泳道E3、I4和F8中不存在包含总RNA的带(在图36A的右边以总RNA板示出))。图36B中的灰色方框表示八个EPSPS外显子(在
每个方框上标记出了它们的大小)。
[0036] 图16示出第二EPSPS内含子和第三外显子之间的连接区处的剪接位点(粗体)。待编辑的核苷酸标有下划线。含有如所选择的玉米T0植株中存在的经编辑的第2内含子-第3
外显子剪接位点的epsps-TIPS等位基因列出为SEQ ID NO:83。
[0037] 图17示出用于编辑天然大豆EPSPS1基因中的氨基酸序列的实验设计。
[0038] 图18示出用大豆泛素(UBQ)内含子1替换EPSPS1内含子1的实验设计。
[0039] 序列
[0040] SEQ ID NO:1为来自酿脓链球菌(Streptococcus pyogenes)M1 GAS(SF370)的Cas9基因的核苷酸序列。
[0041] SEQ ID NO:2为马铃薯ST-LS1内含子的核苷酸序列。
[0042] SEQ ID NO:3为SV40氨基N末端的氨基酸序列。
[0043] SEQ ID NO:4为根瘤农杆菌(Agrobacterium tumefaciens)双分型VirD2 T-DNA边界内切核酸酶羧基末端的氨基酸序列。
[0044] SEQ ID NO:5为表达玉米优化的Cas9的表达盒的核苷酸序列。
[0045] SEQ ID NO:6为在可变靶向域中包含LIGCas-3靶序列的crRNA的核苷酸序列。
[0046] SEQ ID NO:7为来自酿脓链球菌M1 GAS(SF370)>的tracrRNA的核苷酸序列
[0047] SEQ ID NO:8为在可变靶向域中包含LIGCas-3靶序列的单链向导RNA的核苷酸序列。
[0048] SEQ ID NO:9为玉米U6聚合酶III启动子的核苷酸序列。
[0049] SEQ ID NO:10为玉米U6聚合酶III终止子的两个拷贝的核苷酸序列。
[0050] SEQ ID NO:11为包含LIGCas-3可变靶向域的玉米优化的单链长向导RNA表达盒的核苷酸序列。
[0051] SEQ ID NO:12为玉米基因组靶位点LIGCas-1的核苷酸序列加PAM序列。
[0052] SEQ ID NO:13为玉米基因组靶位点LIGCas-2的核苷酸序列加PAM序列。
[0053] SEQ ID NO:14为玉米基因组靶位点LIGCas-3的核苷酸序列加PAM序列。
[0054] SEQ ID NO:15-21、27-34和41-52为PCR引物和探针的核苷酸序列。
[0055] SEQ ID NO:22为玉米优化的moCAS9内切核酸酶的氨基酸序列。
[0056] SEQ ID NO:23为玉米优化的moCAS9内切核酸酶的核苷酸序列。
[0057] SEQ ID NO:24为向导RNA EPSPS sgRNA的DNA型式的核苷酸序列。
[0058] SEQ ID NO:25为EPSPS多核苷酸模板的核苷酸序列。
[0059] SEQ ID NO:26为包含TIPS核苷酸修饰的DNA片段的核苷酸序列。
[0060] SEQ ID NO:35为具有完整Cas靶序列的DNA片段的核苷酸序列。
[0061] SEQ ID NO:36-38为具有突变Cas靶序列的DNA片段的核苷酸序列。
[0062] SEQ ID NO:39为TIPS编辑的EPSPS核苷酸序列片段的核苷酸序列。
[0063] SEQ ID NO:40为野生型epsps核苷酸序列片段的核苷酸序列。
[0064] SEQ ID NO:53为WOL1006反向引物的核苷酸序列。
[0065] SEQ ID NO:54为EPSPS-复制多核苷酸模板的核苷酸序列。
[0066] SEQ ID NO:55为EPSPS-玉米泛素启动子多核苷酸模板的核苷酸序列。
[0067] SEQ ID NO:56为EPSPS-K90R多核苷酸模板的核苷酸序列。
[0068] SEQ ID NO:57为EPSPS-IME多核苷酸模板的核苷酸序列。
[0069] SEQ ID NO:58为EPSPS-T剪接的多核苷酸模板的核苷酸序列。
[0070] SEQ ID NO:59为EPSPS-合成多核苷酸模板的核苷酸序列。
[0071] 玉米GOS2 5′-UTR1和内含子1以及5′-UTR2。
[0072] SEQ ID NO:60-61、83-84、96-97分别为大豆基因组Cas内切核酸酶靶序列大豆EPSPS-CR1、大豆EPSPS-CR2、大豆EPSPS-CR4、大豆EPSPS-CR5、大豆EPSPS-CR6、大豆EPSPS-CR7的核苷酸序列。
[0073] SEQ ID NO:62为大豆U6小核RNA启动子GM-U6-13.1的核苷酸序列。
[0074] SEQ ID NO:63和64分别为质粒QC868、QC879的核苷酸序列。
[0075] SEQ ID NO:65、66、85、86、87、98、99和100分别为RTW1013A、RTW1012A、RTW1199、RTW1200、RTW1190A、RTW1201、RTW1202、RTW1192A的核苷酸序列。
[0076] SEQ ID NO:67-81、88-95、101-104为引物和探针的核苷酸序列。
[0077] SEQ ID NO:82为大豆密码子优化的Cas9的核苷酸序列。
[0078] SEQ ID NO:105为玉米优化的moCAS9内切核酸酶的核苷酸序列。
[0079] SEQ ID NO:106为来自嗜热链球菌(S.thermophiles)的Cas9内切核酸酶(genbank CS571758.1)的核苷酸序列。
[0080] SEQ ID NO:107为来自嗜热链球菌的Cas9内切核酸酶(genbank CS571758.1)的核苷酸序列。
[0081] SEQ ID NO:108为来自无乳链球菌(S.agalactiae)的Cas9内切核酸酶(genbank CS571785.1)的核苷酸序列。
[0082] SEQ ID NO:109为来自无乳链球菌的Cas9内切核酸酶(genbank CS571790.1)
[0083] 的核苷酸序列。
[0084] SEQ ID NO:110为来自变异链球菌(S.mutans)的Cas9内切核酸酶(genbank CS571790.1)的核苷酸序列。

具体实施方式

[0085] 本公开包括对膦酰基甲基甘氨酸家族的除草剂,例如草甘膦具有抗性的突变植物的产生。提供了用于编辑细胞中的感兴趣的核苷酸序列的组合物和方法,其采用向导多核
苷酸/Cas内切核酸酶系统,其中Cas内切核酸酶通过向导多核苷酸引导以识别感兴趣的核
苷酸序列并且向细胞的基因组中的特定靶位点处引入双链断裂。待编辑的感兴趣的核苷酸
序列可位于由Cas内切核酸酶识别的靶位点之内或之外。另外,提供了用于细胞基因组中的靶位点的基因组修饰和用于将感兴趣的多核苷酸序列插入细胞的基因组中的组合物和方
法,其采用向导多核苷酸/Cas内切核酸酶系统。
[0086] 更具体地,提供了用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的组合物和方法。该方法和组合物采用向导多核苷酸/Cas内切核酸酶系统来提供
用于编辑细胞基因组内的EPSPS核苷酸序列的有效系统。待编辑的核苷酸序列可位于由Cas
内切核酸酶识别的靶位点之内或之外。细胞包括但不限于植物细胞。还提供了用于产生草
甘膦耐受性或草甘膦抗性植物细胞、植物外植体、种子和谷粒的组合物和方法。
[0087] CRISPR基因座(Clustered Regularly Interspaced Shorr Palindromic Repeats,规律成簇间隔短回文重复序列)(也称为SPIDRs--SPacer Interspersed Direct 
Repeats,间隔区散在同向重复序列))构成最近描述的DNA基因座的家族。CRISPR基因座由
短且高度保守的DNA重复序列(通常24至40bp,重复1至140次,也称CRISPR重复序列)组成,所述DNA重复序列是部分回文的。重复的序列(通常是物种特异性的)被恒定长度的可变序
列(通常20至58bp,取决于CRISPR基因座(2007年3月1日公布的WO2007/025097))间隔。
[0088] CRISPR基因座首先在大肠杆菌(E.coli)中识别(Ishino等人,(1987)J.Bacterial.169:5429-5433;Nakata等人(1989)J.Bacterial.171:3553-3556)。类似的插入短重复序列已经在地中海富盐菌(Haloferax  mediterranei)、酿脓链球菌
(Streptococcus pyogenes)、项圈藻(Anabaena)和结核分枝杆菌(Mycobacterium 
tuberculosis)中鉴定(Groenen等人,(1993)Mol.Microbiol.10:1057-1065;Hoe等人
(1999)Emerg.Infect.Dis.5:254-263;Masepohl等人(1996)Biochim.Biophys.Acta1307:
26-30;Mojica等人(1995)Mol.Microbiol.17:85-93)。CRISPR基因座与其它SSR的不同之处在于重复序列的结构,其被称为短规则间隔的重复序列(SRSR)(Janssen等人(2002)OMICS 
J.Integ.Biol6:23-33;Mojica等人(2000)Mol.Microbiol.36:244-246)。所述重复序列是成簇出现的短元件,其通常被恒定长度的可变序列规则地间隔(Mojica等人(2000)
Mol.Microbiol.36:244-246)。
[0089] “Cas基因”包括这样的基因,该基因通常与旁侧CRISPR基因座偶联、相关或接近或在邻近旁侧CRISPR基因座的位置。术语“Cas基因”、“CRISPR-相关联的(Cas)基因”在本文中可互换使用。Cas蛋白质家族的全面综述在Haft等人,(2005)Computational Biology,PLoS Comput Biol 1(6):e60.doi:10.1371/journal.pcbi.0010060中提出。
[0090] 如本文所述,除了四种先前已知的基因家族之外,还描述了41种CRISPR-相关联的(Cas)基因家族。其示出CRISPR体系属于不同的类,具有不同的重复图案、基因组和物种范围。在给定CRISPR基因座处的Cas基因数在物种之间可以不同。
[0091] Cas内切核酸酶与由Cas基因编码的Cas蛋白质相关,其中所述Cas蛋白质能够将双链断裂引入到DNA靶序列中。Cas内切核酸酶通过向导多核苷酸引导来识别并任选地在细胞
的基因组中的特定靶位点处引入双链断裂。如本文所用,术语“向导多核苷酸/Cas内切核酸酶系统”是指能够将双链断裂引入DNA靶序列的Cas内切核酸酶和向导多核苷酸的复合物。
Cas内切核酸酶接近基因组靶位点解旋DNA双链并且在识别靶序列时通过向导多核苷酸裂
解两条DNA链,但唯一条件是正确的原间隔序列相邻基元(PAM)大致在靶序列的3′端处取向(图3)。
[0092] 在一个实施方案中,Cas内切核酸酶为能够在DNA靶位点处引入双链断裂的Cas9内切核酸酶,其中在特定位置处的DNA裂解通过以下方式实现:a)在DNA靶位点和引导多核苷
酸的可变靶向域之间碱基配对互补,以及b)存在紧邻DNA靶位点的短原间隔序列相邻基元
(PAM)。
[0093] 在一个实施方案中,Cas内切核酸酶基因为Cas9内切核酸酶,诸如但不限于2007年3月1日公布并且以引用方式并入本文中的WO2007/025097中以SEQ ID NO:462、474、489、
494、499、505和518列出的Cas9基因。在另一个实施方案中,Cas内切核酸酶基因为植物如玉米或大豆优化的Cas9内切核酸酶(图1A)。在另一个实施方案中,Cas内切核酸酶基因可操作地连接至Cas密码子区域上游的SV40核靶向信号
[0094] 在一个实施方案中,Cas内切核酸酶基因为SEQ ID NO:105-110的Cas9内切核酸酶基因,或它们的任何功能片段或变体。
[0095] 术语“功能片段”、“功能上等同的片段”和“功能等同片段”在本文中可互换使用。这些术语是指其中产生双链断裂的能得以保持的Cas内切核酸酶序列的一部分或亚序
列。
[0096] 术语“功能变体”、“功能上等同的变体”和“功能等同变体”在本文中可互换使用。这些术语是指其中产生双链断裂的能力得以保持的Cas内切核酸酶的变体。片段和变体可
通过诸如定点诱变和合成构建之类的方法来获得。
[0097] 在一个实施方案中,Cas内切核酸酶基因为植物密码子优化的酿脓链球菌Cas9基因,其可识别N(12-30)NGG形式的任何基因组序列。
[0098] 在一个实施方案中,Cas内切核酸酶通过本领域已知的任何方法直接引入到细胞中,例如但不限于转染和局部应用。
[0099] 内切核酸酶是切割多核苷酸链内的磷酸二酯键的酶,并且包括在特定位点切割DNA而不损伤碱基的限制性内切核酸酶。限制性内切核酸酶包括I型、II型、III型和IV型内切核酸酶,它们进一步包括亚型。在I型和III型系统中,甲基化酶活性和限制酶活性两者都包含在单一复合物中。内切核酸酶还包括大范围核酸酶,也称为归巢内切核酸酶(HEases),其如同限制性内切核酸酶,在特定识别位点处结合和切割,然而大范围核酸酶的识别位点
通常较长,约18bp或更长。(2012年3月22日提交的专利申请WO-PCT PCT/US12/30061)大范
围核酸酶已基于保守序列基元分为四个家族(Belfort  M和Perlman  P  S 
J.Biol.Chem.1995(270):30237-30240)。这些基元参与金属离子的配位和磷酸二酯键的解。HE酶的显著之处在于它们的识别位点长,并且能容忍它们的DNA底物中有一定的序列多态性。大范围核酸酶的命名规范与其他限制性内切核酸酶的规范相似。对于分别由独立式
ORF、内含子和内含肽编码的大范围核酸酶,它们也通过前缀F-、I-或PI-进行表征。重组过程中的一个步骤涉及在识别位点之处或附近进行多核苷酸裂解。这个裂解活性可用来产生
双链断裂。有关位点特异性重组酶以及它们的识别位点的综述,参见Sauer(1994)
Curr.Op.Biotechnol.5:521-7;and Sadowski(1993)FASEB 7:760-7。在一些示例中,重组酶来自整合酶或解离酶家族。
[0100] TAL效应物核酸酶是新一类序列特异性核酸酶,可用来在植物或其他生物体的基因组中的特定靶序列处产生双链断裂。(Milleret al.(2011)Nature Biotechnology 29:
143-148)。锌指核酸酶(ZFN)为工程化的双链断裂诱导剂,由锌指DNA结合域和双链断裂诱
导剂域构成。识别位点特异性由锌指域赋予,锌指域通常包含两个、三个或者四个例如具有C2H2结构的锌指,但是其它锌指结构也是已知的并被工程化。锌指域易于设计特异性结合
选择的多核苷酸识别序列的多肽。ZFN包括与非特异性内切核酸酶域连接的工程化的DNA结
合锌指域,所述非特异性内切核酸酶域例如来自IIs型内切核酸酶(诸如FokI)的核酸酶域。
可将另外的功能性融合到锌指结合域,包括转录激活因子域、转录阻遏蛋白域和甲基化酶。
在一些示例中,核酸酶域的二聚化为切割活性所需。每个锌指能识别靶DNA中的三个连续碱基对。例如,一个3锌指域识别9个连续核苷酸的序列,由于该核酸酶要求二聚化,使用两组锌指三联体来结合一条18个核苷酸的识别序列。
[0101] 在本公开的一个实施方案中,组合物包括包含向导多核苷酸和Cas9内切核酸酶的植物或种子,其中所述Cas9内切核酸酶和向导多核苷酸能够形成复合物并且在所述植物的
基因组靶位点中产生双链断裂。
[0102] 细菌和古细菌已进化出适应性免疫防御机制,又称为规律成簇间隔短回文重复序列(CRISPR)/CRISPR相关联的(Cas)系统,其使用短RNA来指导外源核酸的降解(2007年3月1
日公布的WO2007/025097)。来自细菌的II型CRISPR/Cas系统采用crRNA和tracrRNA将Cas内
切核酸酶引导至其DNA靶标。crRNA(CRISPR RNA)包含与双链DNA靶标中的一条链互补的区
域并且与tracrRNA(反式激活CRISPR RNA)碱基配对,从而形成指导Cas内切核酸酶裂解DNA
靶标的RNA双链体。
[0103] 如本文所用,术语“向导多核苷酸”是指如下多核苷酸序列,该多核苷酸序列可与Cas内切核酸酶形成复合物并且使Cas内切核酸酶能够识别并且任选地裂解DNA靶位点。向导多核苷酸可包括单分子或双分子。向导多核苷酸序列可为RNA序列、DNA序列、或它们的组合(RNA-DNA组合序列)。任选地,引导多核苷酸可包含至少一个核苷酸、磷酸二酯键或键修饰,诸如但不限于核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2’-氟A、2’-氟U、2′-O-甲基RNA、硫代磷酸酯键(键合到胆固醇分子、键合到聚乙二醇分子、键合到间隔区18(六乙二醇链)分子)、或导致环化的5’至3’共价键。在本公开的一些实施方案中,引导多核苷酸不单独包含核糖核酸(RNA)。单独包含核糖核酸的引导多核苷酸也称为“引导DNA”。
[0104] 向导多核苷酸可为双分子(也称为双链向导多核苷酸),其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互
作用的第二核苷酸序列域(称为Cas内切核酸酶识别域或CER域)(图1A)。双分子向导多核苷
酸的CER域包含沿着互补区域杂交的两个单独分子(图1A)。这两个单独分子可为RNA、DNA
和/或RNA-DNA组合序列。在一些实施方案中,包含连接到CER域的VT域的双链向导多核苷酸的第一分子(在图1A中示为“cr核苷酸”)被称为“crDNA”(当由DNA核苷酸的连续片段构成时)或“crRNA”(当由RNA核苷酸的连续片段构成时),或“crDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。cr核苷酸可包括细菌和古细菌中天然存在的crRNA的片段。在一个
实施方案中,细菌和古细菌中天然存在的crRNA的片段以本文所公开的cr核苷酸形式存在,其大小范围可为,但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施方案中,包含CER域的双链体向导多核苷酸的第二分子(在图1A中被
示出为tracr核苷酸)被称为“tracrRNA”(当由RNA核苷酸的连续片段构成时)或“tracrDNA”(当由DNA核苷酸的连续片段构成时),或“tracrDNA-RNA”(当由DNA核苷酸和RNA核苷酸的组合构成时)。在一个实施方案中,向导RNA/Cas9内切核酸酶复合物的RNA为包含双链体
crRNA-tracrRNA的双工RNA。
[0105] 引导多核苷酸也可为单分子,其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列域(称为可变靶向域或VT域)以及与Cas内切核酸酶多肽相互作用的第二核苷酸域(称
为Cas内切核酸酶识别域或CER域)(图1B)。所谓“域”,意指核苷酸的连续片段,该连续片段可为RNA、DNA和/或RNA-DNA组合序列。单链向导多核苷酸的VT域和/或CER域可包含RNA序
列、DNA序列或RNA-DNA组合序列。在一些实施方案中,单链向导多核苷酸包括连接到tracr核苷酸(包含CER域)的cr核苷酸(包含连接到CER域的VT域),其中所述键为包含RNA序列、
DNA序列或RNA-DNA组合序列的核苷酸序列(图1B)。由来自cr核苷酸和tracr核苷酸的序列
构成的单链向导多核苷酸可被称为“单链向导RNA”(当由RNA核苷酸的连续片段构成时)或
“单链向导DNA”(当由DNA核苷酸的连续片段构成时)或“单链向导RNA-DNA”(当由RNA核苷酸和DNA核苷酸的组合构成时)。在本发明的一个实施方案中,单向导RNA包括crRNA或crRNA片段以及可与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas系统的tracrRNA或tracrRNA
片段,其中所述向导RNA/Cas内切核酸酶复合物可引导Cas内切核酸酶至植物基因组靶位
点,使得Cas内切核酸酶将双链断裂引入到基因组靶位点中。
[0106] 使用单向导多核苷酸与双链体向导多核苷酸相比的一个方面是仅需要形成一个表达盒即可表达单向导多核苷酸。
[0107] 术语“可变靶向域”或“VT域”在本文中可互换使用并且指与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一核苷酸序列域(VT域)和靶序列之间的互补性%可为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、
63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、
79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%或100%。可变靶域的长度可为至少12、13、14、15、16、17、
18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些实施方案中,可变靶向域包含12至30个核苷酸的连续片段。可变靶向域可由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)、或它们的任意组合构成。
[0108] 术语向导多核苷酸的“Cas内切核酸酶识别域”或“CER域”在本文中可互换使用并且是指与Cas内切核酸酶多肽相互作用的核苷酸序列(诸如向导多核苷酸的第二核苷酸序列域)。CER域可由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)、或它们的任意组合构成。
[0109] 连接单链向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含RNA序列、DNA序列或RNA-DNA组合序列。在一个实施方案中,连接单向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列的长度可为至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、
20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、
45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、
70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、
94、95、96、97、98、99或100个核苷酸。在一个实施方案中,连接单链向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含四环序列,诸如但不限于GAAA四环序列。
[0110] 向导多核苷酸、VT域和/或CER域的核苷酸序列修饰可选自但不限于5′帽、3′聚腺苷酸化尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将向导多核苷酸靶向到亚细胞位置的修饰或序列、提供追踪的修饰或序列、提供用于蛋白质的结合位点的修饰或序列、锁定核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2’-氟A核苷酸、2’-氟U核苷酸、2′-O-甲基RNA核苷酸、硫代磷酸酯键(键合到胆固醇分子、键合到聚乙二醇分子、键合到间隔区18分子)、5’至3’共价键、或它们的任意组合。这些修饰可产生至少一种附加的有益特征,其中所述附加的有益特征选自经修饰或调控的稳定性,亚细胞靶向,跟踪荧光标记,蛋白或蛋白复合物的结合位点,与互补靶序列的经修饰的结合亲和力,经修饰的对细胞降解的抗性,或增加的细胞渗透性。
[0111] 在本公开的一个实施方案中,组合物包含向导多核苷酸,所述向导多核苷酸包含:(i)与靶DNA中的核苷酸序列互补的第一核苷酸序列域(VT域);以及(ii)与Cas内切核酸酶
相互作用的第二核苷酸序列域(CER域),其中第一核苷酸序列域和第二核苷酸序列域由脱
核糖核酸(DNA)、核糖核酸(RNA)、或它们的组合构成。第一核苷酸序列域(可变靶向域)和靶序列之间的互补性%可为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、
59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、
74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0112] 在本公开的一个实施方案中,引导多核苷酸的第一核苷酸序列域(VT域)和第二核苷酸序列域(CER域)位于单个分子上。在另一个实施方案中,第二核苷酸序列域(Cas内切核酸酶识别域)包含能够沿着互补区域杂交的两个单独分子。
[0113] 在一个实施方案中,组合物包含向导多核苷酸,其中第一核苷酸序列域(VT域)为DNA序列,并且第二核苷酸序列域(CER域)选自DNA序列、RNA序列、以及它们的组合。
[0114] 在一个实施方案中,可使用本领域技术人员已知的任何方法将向导多核苷酸直接引入植物细胞,所述方法诸如但不限于粒子轰击或局部应用。
[0115] 当向导多核苷酸仅由RNA序列(也称为“向导RNA”)组成时,其可通过引入包含可操作地连接到植物特异性启动子的相应引导DNA序列的重组DNA分子而间接引入,该植物特异性启动子能够转录所述植物细胞中的向导多核苷酸。术语“相应引导DNA”是指如下DNA分
子,该DNA分子与RNA分子相同但是RNA分子的每个“U”替换为“T”。
[0116] 在一些实施方案中,引导多核苷酸通过粒子轰击或包含可操作地连接至植物U6聚合酶III启动子的相应引导DNA的重组DNA构建体的农杆菌(Agrobacterium)转化来引入。
[0117] 术语“靶位点”、“靶序列”、”靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”和“基因组靶基因座”在本文中可互换使用并且指细胞的基因组(包括叶绿体和线粒体DNA)中的多核苷酸序列,在细胞基因组中在该多核苷酸序列处通过Cas内切核酸酶诱导双链断裂。靶位点可为细胞或生物体的基因组中的内源位点,或者另选地,靶位点可与细胞或生物体是异源的,从而不天然存在于基因组中,或靶位点与其天然出现的位置相比可存在
于异源基因组位置中。如本文所用,术语“内源靶序列”和“天然靶序列”可在本文中互换使用并且是指这样的靶序列,该靶序列对细胞或生物体的基因组为内源或天然的并且位于该
靶序列在细胞或生物体的基因组中的内源或天然位置处。细胞包括但不限于动物、细菌、真菌、昆虫、酵母和植物细胞以及通过本文所述的方法制备的植物和种子。
[0118] 在一个实施方案中,与正在使用的具体基因编辑系统相关联的靶位点可以类似于DNA识别位点或者可以是被双链断裂诱导剂特定识别和/或结合的靶位点,所述双链断裂诱
导剂诸如但不限于锌指内切核酸酶、大范围核酸酶、或TALEN内切核酸酶。
[0119] “人工靶位点”或“人工靶序列”在本文中可互换使用并且指已被引入到细胞或生物体(诸如但不限于植物或酵母)的基因组中的靶序列。这种人工靶序列可在序列上与细胞基因组中的内源或天然靶序列相同,但可位于细胞或生物体的基因组中的另一不同位置
(即,非内源或非天然位置)。
[0120] “改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用,并且指如本文所公开的当与未改变的靶序列相比时包含至少一个改变的靶序列。此类“改变”包括例如:(i)替换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或(iv)(i)-(iii)的任意组合。
[0121] 本文中公开了用于修饰生物体(诸如但不限于植物或酵母)的基因组靶位点的方法。
[0122] 在一个实施方案中,用于修饰细胞的基因组中的靶位点的方法包括将向导多核苷酸引入具有Cas内切核酸酶的细胞,其中所述向导多核苷酸和Cas内切核酸酶能够形成复合
物,该复合物使Cas内切核酸酶能够在所述靶位点处引入双链断裂。该方法还可鉴定至少一个在所述靶标处具有修饰的细胞,其中在所述靶位点处的修饰选自(i)至少一个核苷酸的
替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。该方法还可进一步包括将供体DNA引入到所述细胞中,其中所述供体DNA包含感兴
趣的多核苷酸。
[0123] 还提供用于修饰细胞的基因组中的靶位点的方法,该方法包括向细胞引入向导多核苷酸和Cas内切核酸酶,其中所述向导多核苷酸和Cas内切核酸酶能够形成复合物,该复
合物使Cas内切核酸酶能够在所述靶位点处引入双链断裂。该方法可进一步包括鉴定至少
一个在所述靶标处具有修饰的细胞,其中在所述靶位点处的修饰选自(i)至少一个核苷酸
的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。该方法还可进一步包括将供体DNA引入到所述细胞中,其中所述供体DNA包含感
兴趣的多核苷酸。
[0124] 还提供了用于修饰细胞基因组中的靶位点的方法,该方法包括:a)将cr核苷酸、能够表达tracrRNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA引入到细胞中,其中所述cr核苷酸为脱氧核糖核苷酸序列或脱氧核糖核苷酸与核糖核苷酸序列的组
合,其中所述cr核苷酸、所述tracrRNA和所述Cas内切核酸酶能够形成使Cas内切核酸酶能
够在所述靶位点处引入双链断裂的复合物;以及b)鉴定至少一个在所述靶位点处具有修饰
的细胞,其中所述修饰选自(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。
[0125] 还提供了用于修饰细胞基因组中的靶位点的方法,该方法包括:a)将tracr核苷酸、能够表达crRNA的第一重组DNA构建体、以及能够表达Cas内切核酸酶的第二重组DNA引
入到细胞中,其中所述tracr核苷酸选自脱氧核糖核苷酸序列或脱氧核糖核苷酸与核糖核
苷酸序列的组合,其中所述tracr核苷酸、所述crRNA和所述Cas内切核酸酶能够形成使Cas
内切核酸酶在所述靶位点处引入双链断裂的复合物;以及b)鉴定至少一个在所述靶位点处
具有修饰的细胞,其中所述修饰选自(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,以及(iv)(i)-(iii)的任意组合。
[0126] 靶位点的长度可改变,并且包括例如长度为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸的靶位点。靶位点还有可能是回文的,即一条链上的序列在互补链上从相反方向读起来是一样的。切口/切割位点可位于靶序列内,或者切口/切割位点可位于靶序列之外。在另一个变型形式中,切割可发生在互相相对的核苷酸位置处以产生平端切口,或者在其它情况中,切口可交错以产生单链突出端,也称“粘性末端”,其可以为5′突出端或者3′突出端。
[0127] 还可使用基因组靶位点的活性变体。此类活性变体可与给定靶位点具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或更高的序列同一性,其中活性变体保留生物活性并且因此能够由Cas内切核酸酶识别和裂解。通过内切核酸酶测量靶位点的双链断裂的测定法是本领域中已知
的,并且通常测量该试剂对含有识别位点的DNA底物的总体活性和特异性。
[0128] 各种方法和组合物均可用于获得具有插入到Cas内切核酸酶的靶位点中的感兴趣的多核苷酸的细胞或生物体。此类方法可采用同源重组来提供感兴趣的多核苷酸在靶位点
处的整合。在提供的一种方法中,向供体DNA构建体中的细胞提供感兴趣的多核苷酸。如本文所用,“供体DNA”是包含待插入到Cas内切核酸酶的靶位点中的感兴趣的多核苷酸的DNA构建体。任选地,供体DNA构建体还可包含感兴趣的多核苷酸旁侧的第一同源性区域和第二同源性区域。供体DNA的第一同源性区域和第二同源性区域分别与存在于植物基因组的靶
位点中或旁侧的第一基因组区域和第二基因组区域共享同源性。所谓“同源性”是指类似的DNA序列。例如,存在于供体DNA上的“基因组区域的同源性区域”是与植物基因组中的给定“基因组区域”具有类似序列的DNA区域。同源性区域可具有任何长度,该长度足以促进裂解靶位点处的同源重组。例如,同源性区域的长度可为至少5-10、5-15、5-20、5-25、5-30、5-
35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-
300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-
1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-
2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,使得同源性区域具有充分的同源性与相应的基因组区域发生同源重组。“充分的同源性”表明两个多核苷酸序列具有充分的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总体长
度,以及多核苷酸的序列相似性。序列相似性可通过序列的总长度上的序列同一性百分比,和/或通过包含局部化相似性的保守区域(诸如具有100%序列同一性的连续的核苷酸)以
及序列长度的一部分上的序列同一性百分比来描述。
[0129] 靶标和供体多核苷酸共享的同源性或者序列同一性的量可变化,包括总长度和/或具有在以下范围内的单位整数值的区域:约1-20bp、20-50bp、50-100bp、75-150bp、100-
250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、
500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、
2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb、或者直到并包括该靶位点的总长度。这些范围包括该范围内的每个整数,例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、
16、17、18、19和20bp。同源性的量也可通过两个多核苷酸的完全比对长度上的序列同一性百分数来描述,所述序列同一性百分数包括约至少50%、55%、60%、65%、70%、71%、
72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性百分数。充分的同源性包括多核苷酸长度、全局序列同一性百分数和连续核苷酸的
任选保守区域或局部序列同一性百分数的任意组合,例如充分的同源性可描述为75-150bp
的与靶基因座区域具有至少80%序列同一性的区域。充分的同源性还可通过所预测的两个
多核苷酸在高严格条件下特异性杂交的能力来描述,参见例如Sambrook等人,(1989)
Molecular Cloning:A Laboratory Manual,(Cold Spring Harbor Laboratory Press,
NY);Current Protocols in Molecular Biology,Ausubel等人编辑,(1994)Current 
Protocols,(Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.);以及
Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--
Hybridization with Nucleic Acid Probes,(Elsevier,New York)。
[0130] 如本文所用,“基因组区域”是细胞的基因组中的染色体的区段,该区段存在于靶位点的任一侧上,或者另选地,还包含靶位点的一部分。基因组区域可包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-
95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-
1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-
2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,使得基因组区域具有充分的同源性与相应的同源性区域发生同源重组。
[0131] 供体DNA上的同源性区域可与靶位点旁侧的任何序列具有同源性。虽然在一些实施方案中,同源性区域与紧邻靶位点旁侧的基因组序列共享显著的序列同源性,但应当认
识到,同源性区域可被设计为与如下区域具有充分的同源性,该区域可进一步位于靶位点
的5′或3′处。在另外的实施方案中,同源性区域还可与靶位点的片段连同下游基因组区域具有同源性。在一个实施方案中,第一同源性区域还包含靶位点的第一片段并且第二同源
性区域包含靶位点的第二片段,其中第一片段和第二片段不相似。
[0132] 如本文所用,“同源重组”是指两个DNA分子之间在同源性位点处的DNA片段交换。同源重组的频率受多个因素影响。不同的生物体在同源重组的量以及同源重组与非同源重
组的相对比例方面不同。一般地讲,同源性区域的长度影响同源重组事件的频率,同源性区域越长,频率越高。为观察到同源重组而需要的同源性区域的长度也是随物种而异的。在许多情况下,至少5kb的同源性已被利用,但在少至25-50bp的同源性的情况下就已观察到同
源重组。参见例如Singer等人,(1982)Cell 31:25-33;Shen和Huang,(1986)Genetics 112:
441-57;Watt等人,(1985)Proc.Natl.Acad.Sci.USA 82:4768-72;Sugawara和Haber,
(1992)Mol Cell Biol 12:563-75;Rubnitz和Subramani,(1984)Mol Cell Biol 4:2253-
8;Ayares等人,(1986)Proc.Natl.Acad.Sci.USA 83:5199-203;Liskay等人,(1987)
Genetics 115:161-7。
[0133] 同源性介导的修复(HDR)是细胞内修复双链DNA断裂和单链DNA断裂的机制。同源性介导的修复包括同源重组(HR)和单链退火(SSA)(Lieber.2010 Annu.Rev.Biochem.79:
181-211)。HDR的最常见形式称为同源重组(HR),其要求供体和受体DNA之间具有最长的序
列同源性。HDR的其它形式包括单链退火(SSA)以及断裂诱导的复制,这些相对于HR需要较
短的序列同源性。在切口(单链断裂)处同源性介导的修复可通过采用不同于在双链断裂处
HDR的机制来进行(Davis和Maizels.PNAS(0027-8424),111(10),第E924-E932页)。
[0134] 植物细胞的基因组改变,例如通过同源重组(HR)改变,是基因工程的强大工具。尽管高等植物中的同源重组频率低,但还是有植物内源基因同源重组的少数成功示例。植物中同源重组的参数已主要通过拯救(rescue)所引入的截短的选择性标记基因进行了研究。
在这些实验中,同源DNA片段通常在0.3kb至2kb之间。观察到的同源重组频率大约为10-4至
10-5。参见例如Halfter等人,(1992)Mol Gen Genet 231:186-93;Offringa等人,(1990)EMBO J 9:3077-84;Offringa等人,(1993)Proc.Natl.Acad.Sci.USA 90:7346-50;
Paszkowski等人,(1988)EMBO J7:4021-6;Hourda和Paszkowski,(1994)Mol Gen Genet 
243:106-11;以及Risseeuw等人,(1995)Plant J 7:109-19。
[0135] 同源重组在昆虫中已得到证明。Dray和Gloor在果蝇属中发现,少至3kb的总模板:靶标同源性就足够以适当的效率将大的非同源DNA区段拷贝到靶标中(Dray和Gloor,
(1997)Genetics 147:689-99)。Golic等人采用在果蝇属中的靶标FRT处FLP介导的DNA整
合,证实了当供体和靶标共享4.1kb的同源性时,与1.1kb的同源性时相比,整合效率为约10倍高(Golic等人,(1997)Nucleic Acids Res 25:3665)。来自果蝇属的数据表明,2-4kb的同源性对于有效靶向是充足的,但是存在一些证据证明低得多的同源性——约30bp至约
100bp——可能就足够(Nassif和Engels,(1993)Proc.Natl.Acad.Sci.USA 90:1262-6;
Keeler和Gloor,(1997)Mol.Cell Biol.17:627-34)。
[0136] 也在其它生物体中实现了同源重组。例如,在寄生性原生动物利什曼原虫属中进行同源重组需要至少150-200bp的同源性(Papadopoulou和Dumas,(1997)Nucleic Acids 
Res 25:4278-86)。在丝状真菌构巢曲霉(Aspergillus nidulans)中,用少至50bp旁侧同源性实现了基因替换(Chaveroche等人,(2000)Nucleic Acids Res 28:e97)。在纤毛虫嗜热四膜虫(Tetrahymena thermophila)中也证明了所靶向的基因替换(Gaertig等人,(1994)
Nucleic Acids Res 22:5391-8)。在哺乳动物中,本领域已成功培养繁殖、转化、选择多能胚胎干细胞系(ES),再将其引入小鼠胚胎,从而在小鼠体内极其顺利地实现了同源重组。带有插入的转基因ES细胞的胚胎发育成遗传后代。通过将同胞小鼠进行杂种繁殖,可获得携
带选择的基因的纯合小鼠。该方法的概述在以下文献中提供:Watson等人,(1992)
Recombinant DNA,第2版,(Scientific American Books,WH Freeman&Co.出版);
Capecchi,(1989)Trends Genet 5:70-6;以及Bronson,(1994)J Biol Chem 269:27155-8。
由于缺乏能够移植到卵母细胞或发育的胚胎中的干细胞,在小鼠以外的哺乳动物中的同源
重组曾是有限的。但是,McCreath等人,Nature 405:1066-9(2000)报道了通过在原代胚胎纤维细胞中进行转化和选择而在绵羊中成功进行了同源重组。
[0137] 一旦在DNA中诱导产生双链断裂,细胞的DNA修复机制就被激活以修复断裂。易错DNA修复机制可在双链断裂位点处产生突变。将断裂端连到一起的最常用修复机制是非同
源末端连接(NHEJ)途径(Bleuyard等人,(2006)DNA Repair 5:1-12)。染色体的结构完整性通常通过修复来保持,但缺失、插入或其它重排都是可能的(Siebert和Puchta,(2002)
Plant Cell 14:1121-31;Pacher等人,(2007)Genetics 175:21-9)。一个双链断裂的两个末端是NHEJ的最普遍的底物(Kirik等人,(2000)EMBO J19:5562-6),但是,如果发生两个不同的双链断裂,则来自不同断裂的游离末端可连接并导致染色体缺失(Sieberr和Puchta,
(2002)Plant Cell 14:1121-31),或不同染色体之间的染色体易位(Pacher等人,(2007)
Genetics 175:21-9)。
[0138] 也可将附加型DNA分子连接到双链断裂中,例如将T-DNA整合到染色体双链断裂中(Chilton和Que,(2003)Plant Physiol 133:956-65;Salomon和Puchta,(1998)EMBO J 17:
6086-95)。一旦双链断裂周围的序列被改变,例如被参与双链断裂成熟的外切核酸酶活性
改变,如果同源序列可以,如非分裂的体细胞中的同源染色体,或者DNA复制后的姊妹染色单体(Molinier等人,(2004)Plant Cell 16:342-52),则基因转换途径可恢复初始结构。异位的和/或表成的DNA序列也可充当DNA修复模板用于同源重组(Puchta,(1999)Genetics 
152:1173-81)。
[0139] 另选地,双链断裂可通过同源DNA序列之间的同源重组来修复。DNA双链断裂似乎是刺激同源重组途径的有效因子(Puchta等人,(1995)Plant Mol Biol 28:281-92;Tzfira和White,(2005)Trends Biotechnol 23:567-9;Puchta,(2005)J Exp Bot 56:1-14)。使用DNA断裂剂,在植物中人工构建的同源DNA重复序列之间观察到同源重组提高两倍至九倍
(Puchta等人,(1995)Plant Mol Biol 28:281-92)。在玉米原生质体中,用线状DNA分子进行实验证明了质粒之间的同源重组增强(Lyznik等人,(1991)Mol Gen Genet 230:209-
18)。
[0140] 在一些实施方案中,本文中提供的方法包括使细胞与供体DNA和Cas内切核酸酶接触。一旦通过Cas内切核酸酶将双链断裂引入靶位点中,则供体DNA的第一同源性区域和第
二同源性区域可经历与其相应的同源性基因组区域的同源重组,从而在供体和基因组之间
进行DNA交换。
[0141] 因此,所提供的方法使供体DNA的感兴趣的多核苷酸整合到细胞或生物体基因组的靶位点处的双链断裂中,从而改变原始靶位点并产生改变的基因组靶位点。
[0142] 在本公开的一个实施方案中,方法包括用于将感兴趣的多核苷酸引入到细胞基因组的靶位点中的方法,该方法包括:a)向细胞引入向导多核苷酸、供体DNA和Cas内切核酸
酶,其中所述向导多核苷酸和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶
能够在所述靶位点处引入双链断裂;b)使(a)的细胞与包含感兴趣的多核苷酸的供体DNA接
触;以及c)鉴定至少一个来自(b)的细胞,该细胞在其基因组中包含在所述靶位点处整合的感兴趣的多核苷酸。可通过本领域中已知的任何方式引入引导多核苷酸、Cas内切核酸酶和供体DNA。这些方式包括但不限于通过粒子轰击直接递送每种组分,通过一个或多个重组
DNA表达盒递送,或它们的任意组合。
[0143] 在本公开的一些实施方案中,该方法包括用于将感兴趣的多核苷酸引入到细胞基因组的靶位点中的方法,其中使用能够表达供体DNA和/或Cas内切核酸酶的至少一个重组
DNA构建体将供体DNA和Cas内切核酸酶引入所述细胞;并且/或其中向导多核苷酸通过粒子
轰击直接引入。
[0144] 可通过本领域已知的任何方式引入供体DNA。例如,提供了细胞或生物体,诸如但不限于具有靶位点的植物或酵母。供体DNA可通过本领域中已知的任何转化方法来提供,所述转化方法包括例如农杆菌介导的转化或基因枪粒子轰击。供体DNA可瞬时地存在于细胞
中或其可通过病毒复制子引入。在Cas内切核酸酶和靶位点的存在下,供体DNA被插入到转
化的基因组中。
[0145] 另一个方法采用对现有的归巢内切核酸酶进行蛋白质工程改造以改变它们的靶标特异性。归巢内切核酸酶,如I-SceI或I-CreI,能结合和裂解相对较长的DNA识别序列(分别为18bp和22bp)。这些序列据预测在基因组中很少天然发生,通常仅1或2个位点/基因组。
归巢内切核酸酶的裂解特异性可通过合理设计在DNA结合域处的氨基酸置换和/或突变单
体的组合装配和选择来改变(参见例如Arnould等人,(2006)J Mol Biol 355:443-58;
Ashworth等人,(2006)Nature 441:656-9;Doyon等人,(2006)J Am Chem Soc 128:2477-
84;Rosen等人,(2006)Nucleic Acids Res 34:4791-800;以及Smith等人,(2006)Nucleic Acids Res 34:e149;Lyznik等人(2009)美国专利申请公布20090133152A1;Smith等人
(2007)美国专利申请公布20070117128A1)。已证明了工程化大范围核酸酶能切割同族突变
位点而不扩大它们的特异性。将对野生型酵母I-SceI归巢核酸酶具有特异性的人工识别位
点引入玉米基因组,并且当转基因I-SceI通过杂交引入并且通过基因切除激活时,检测到
在1%的被分析的F1植物中的识别序列的突变(Yang等人,(2009)Plant Mol Biol 70:669-
79)。更具体地,使用基于I-CreI大范围核酸酶序列进行设计的工程化单链内切核酸酶靶向玉米无舌叶基因座(liguleless locus)。当设计的归巢核酸酶通过农杆菌介导转化未成熟
胚芽来引入时,在3%的TO转基因植物中检测到选择的无舌叶基因座识别序列的突变(Gao
等人,(2010)Plant J 61:176-87)。
[0146] 感兴趣的多核苷酸在本文中进一步描述并且反映出作物开发参与者的商业市场和利益。感兴趣的作物和市场在变化,随着发展中国家开放了世界市场,也将出现新的作物和技术。另外,随着我们对农学性状和特性诸如收率和杂种优势的理解逐渐深入,对用于基因工程的基因的选择将相应地变化。
[0147] 使用引导多核苷酸/Cas内切核酸酶系统进行的基因组编辑。
[0148] 如本文所述,引导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸修饰模板结合使用,允许编辑感兴趣的基因组核苷酸序列。虽然存在许多双链断裂制造系统,但其实际应用于基因编辑可能由于所诱导的双链断裂(DSB)的频率相对较低而受限。迄今为止,许多基因组修饰方法依赖于同源重组系统。同源重组(HR)可提供用于找到感兴趣的基因组
DNA序列并且根据实验规范修饰它们的分子方法。同源重组以低频率在植物体细胞中发生。
该过程可通过在所选择的内切核酸酶靶位点处引入双链断裂(DSB)而增强到用于基因组工
程化的实际水平。所面临的挑战是有效地在感兴趣的基因组位点处形成DSB,因为两个相互作用的DNA分子之间的信息传递的方向性存在偏差(断裂的分子充当遗传学信息的受体)。
本文描述了向导多核苷酸/Cas系统的用途,即,提供灵活的基因组裂解特异性并且在DNA靶位点处产生高频率的双链断裂,从而实现在感兴趣的核苷酸序列中的高效基因编辑(基因
修饰),其中待编辑的感兴趣的核苷酸序列可位于由Cas内切核酸酶识别和裂解的靶位点之
内或之外。
[0149] “修饰的核苷酸”或“编辑的核苷酸”是指在与其未修饰的核苷酸序列相比时包含至少一个改变的感兴趣的核苷酸序列。此类“改变”包括例如:(i)替换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或(iv)(i)-(iii)的任意组合。
[0150] 本文公开了用于编辑感兴趣的核苷酸序列的方法和组合物,所述核苷酸序列诸如但不限于植物基因组中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列。
[0151] 在本公开的一个实施方案中,所述方法包括一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)获得植物或其种子,其中所述植物或所述种子在内源性EPSPS基因中包含修饰,所述修饰通过Cas内切核酸酶、向导RNA和多核苷酸修饰模板产生,其中所述植物或所述种子对草甘膦具有抗性;以及b)产生不含所述向导
RNA和Cas内切核酸酶的子代植物。
[0152] 在一个实施方案中,组合物包含草甘膦抗性玉米植物,其中玉米植物包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列并且其中玉米植物不表达草甘膦敏感性
EPSPS多肽。
[0153] 在一个实施方案中,组合物包含草甘膦抗性玉米植物细胞,其中玉米植物细胞包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列并且其中内源性EPSPS多核苷酸
序列存在于与相应野生型对照相比相同的染色体位置。
[0154] 术语“多核苷酸修饰模板”是指当与待编辑的核苷酸序列相比时包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可为至少一个核苷酸的置换、添加或缺失、或它们的任意组合。任选地,多核苷酸修饰模板还可包含至少一个核苷酸修饰旁侧的同源核苷酸序列,其中旁侧同源核苷酸序列向待编辑的所需核苷酸序列提供充分的同源性。
[0155] 在一个实施方案中,本公开描述了一种用于编辑细胞的基因组中的核苷酸序列的方法,该方法包括向细胞提供向导多核苷酸、多核苷酸修饰模板和至少一种Cas内切核酸
酶,其中所述Cas内切核酸酶在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷酸修饰。细胞包括但不限于动物、细
菌、真菌、昆虫、酵母和植物细胞以及通过本文所述的方法制备的植物和种子。待编辑的核苷酸可位于由Cas内切核酸酶识别和裂解的靶位点之内或之外。在一个实施方案中,所述至少一个核苷酸修饰不是在由Cas内切核酸酶识别和裂解的靶位点处的修饰。在另一个实施
方案中,待编辑的至少一个核苷酸与基因组靶位点之间存在至少1、2、3、4、5、6、7、8、9、10、
11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、40、50、100、200、300、400、
500、600、700、900或1000个核苷酸。
[0156] 在一个实施方案中,本公开描述了一种用于编辑植物细胞的基因组中的核苷酸序列的方法,该方法包括向植物细胞提供向导RNA、多核苷酸修饰模板和至少一种玉米优化的Cas9内切核酸酶,其中所述玉米优化的Cas9内切核酸酶能够在所述植物基因组中的moCas9
靶序列处提供双链断裂,其中所述多核苷酸修饰模板包含所述核苷酸序列的至少一个核苷
酸修饰。
[0157] 在一个实施方案中,本公开描述了一种用于编辑细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸
修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷
酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰。
[0158] 在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含EPSPS核苷酸序列的细胞提供向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所
述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所
述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括
所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
[0159] 在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含Cas内切核酸酶和EPSPS核苷酸序列的细胞中提供向导RNA和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合
物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在
所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包
括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
[0160] 在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,该方法包括:a)向包含EPSPS核苷酸序列的细胞提供能够表达
向导RNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA构建体、和多核苷
酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含
所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及b)鉴定在所述EPSPS核苷酸序列处具有
至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的
一个或多个核苷酸的至少一个缺失、插入或置换。
[0161] 在一些实施方案中,多核苷酸修饰模板(EPSPS多核苷酸修饰模板)可包括EPSPS基因的部分片段(并且因此其自身不编码全功能性的EPSPS多肽)。
[0162] 在一个实施方案中,EPSPS多核苷酸修饰模板包含三个点突变,所述点突变造成T102I/P106S(TIPS)突变的形成。表达TIPS-EPSPS双突变转基因的转基因植物表现出草甘
膦耐受性(Funke,T等人,J.Biol.Chem.2009,284:9854-9860)。如本文所定义,“草甘膦”是指N-膦酰甲基甘氨酸的任意除草有效形式(包括其任意盐),导致在植物中产生草甘膦阴离
子的其它形式,以及膦酰甲基甘氨酸家族中的任意其它除草剂。
[0163] 在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向导
RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复
合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断
裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由
(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;d)选择
表现出草甘膦抗性的子代植物。
[0164] 在一个实施方案中,本公开描述了一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,该方法包括:a)向包含EPSPS核苷酸序列的植物细胞提供向导
RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复
合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断
裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;b)由
(a)的植物细胞获得植物;c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及d)
筛选不含所述向导RNA和Cas内切核酸酶的(c)的子代植物。
[0165] 当表现出抗除草剂性增强的植物经受除草剂,并且与由适当的对照植物提供的剂量/响应曲线比较,其剂量/响应曲线向右偏移时,证明抗除草剂性增强。此类剂量/响应曲线具有绘制在x轴上的“剂量”和绘制在y轴上的“伤害率”、“除草效果”等等。
[0166] 实质上抵抗除草剂的植物当经受农业界通常用来杀灭田地中杂草的浓度和比率的除草剂时,表现出很少的(如果有的话)脱色、枯斑、溶解性病变、失绿病斑或者其它病变并且不矮化、凋萎或者畸变。术语抗性和耐受性在本公开可互换地使用。
[0167] 图4示出基因组编辑程序中所使用的组分的示意图。向植物细胞提供玉米优化的Cas内切核酸酶、向导RNA和多核苷酸修饰模板。例如,如图4所示,相比于待编辑的EPSPS基因组序列,该多核苷酸修饰模板包含三个核苷酸修饰(用箭头指出)。这三个核苷酸修饰导
致以下氨基酸改变:T-102改变为I-102,P-106改变为S-106,所以被称为TIPS突变。第一点突变由密码子序列ACT中的C核苷酸被T核苷酸置换引起;第二点突变由相同密码子序列ACT
中的T核苷酸被C核苷酸置换,形成异亮氨酸密码子ATC引起;第三点突变由密码子序列CCA
中的第一个C核苷酸被T核苷酸置换,形成丝氨酸密码子TCA引起(图4)。
[0168] 待编辑的核苷酸序列可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的序列。例如,细胞的基因组中的核苷酸序列可为稳定地掺入到细胞基因组中的天然基因、突变基因、非天然基因、外来基因、或转基因。编辑此类核苷酸可得到另外的所需表型或基因型。
[0169] 使用向导多核苷酸/Cas内切核酸酶系统的调控序列修饰
[0170] 在一个实施方案中,待修饰的核苷酸序列可为调控序列,诸如启动子,其中编辑启动子包括将启动子或启动子片段替换(也称为“启动子交换”或“启动子替换”)为不同的启动子(也称为替换启动子)或启动子片段(也称为替换启动子片段),其中启动子替换导致以下情况中的任一种或以下情况的任一组合:提高的启动子活性、提高的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、同一细胞层或其他细胞层中基因表达的时机或发育进度的修饰(诸如但不
限于延长玉米花药的绒毡层中基因表达的时机(1998年11月17日公布的US 5,837,850))、
DNA结合元件的突变和/或DNA结合元件的缺失或添加。待修饰的启动子(或启动子片段)可
为对于正在编辑的细胞为内源、人工、预先存在、或转基因的启动子(或启动子片段)。替换启动子(或替换启动子片段)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的启动子(或启动子片段)。
[0171] 在一个实施方案中,待修饰的核苷酸序列可为启动子,其中编辑启动子包括将天然EPSPS1启动子替换为植物泛素启动子。
[0172] 在另一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸修饰模板或供体DNA序列结合使用以允许将启动子或启动子元件插入到感兴趣的基因组
核苷酸序列中,其中启动子插入(或启动子元件插入)导致以下情况中的任一种或以下情况
的任一组合:提高的启动子活性(提高的启动子强度)、提高的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、基因表达的时机或发育进度的修饰、DNA结合元件的突变和/或DNA结合元件的添加。
待插入的启动子元件可为但不限于启动子核心元件(诸如但不限于CAAT盒、CCAAT盒、普里
布诺盒和/或TATA盒)、用于诱导型表达的翻译调控序列和/或阻遏子系统(诸如TET操纵子
阻遏子/操纵子/诱导物元件、或磺酰脲类(Su)阻遏子/操纵子/诱导物元件)。脱水响应元件(DRE)首先被识别为干旱响应基因rd29A的启动子中的顺式作用启动子元件,其包含9bp保
守核心序列,TACCGACAT(Yamaguchi-Shinozaki,K.,和Shinozaki,K.(1994)Plant Cell 6,
251-264)。将DRE插入到内源启动子中可赋予下游基因干旱诱导型表达。另一个示例是ABA
响应元件(ABRE),其包含据发现存在于许多ABA和/或胁迫调控的基因中的(C/T)ACGTGGC共
有序列(Busk P.K.,Pages M.(1998)Plant Mol.Biol.37:425-435)。将35S增强子或MMV增强子插入到内源启动子区中将提高基因表达(美国专利5196525)。待插入的启动子(或启动
子元件)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的启动子(或启动子元件)。
[0173] 在一个实施方案中,待修饰的核苷酸序列可为启动子,其中启动子的编辑包括使用本文所述的向导多核苷酸/Cas内切核酸酶系统复制天然EPSPS1启动子。
[0174] 在另一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于允许启动子或启动子元件的缺失,其中启动子缺失(或启动子元件缺失)导致以下情况中的任一种或以下情
况的任一组合:永久失活的基因座、提高的启动子活性(提高的启动子强度)、提高的启动子组织特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、基因表达的时机或发育进度的修饰、DNA结合元件的突变和/或DNA结合元件的添加。待缺失的启动子元件可以是,但不限于启动子核心元件、启动子增强子元件或35S增强子元件。待缺失的启动子或启动子片段对于正在编辑的细胞可为内源、人工、预先存在、或转基因的。
[0175] 使用向导多核苷酸/Cas内切核酸酶系统的终止子修饰
[0176] 在一个实施方案中,待修饰的核苷酸序列可为终止子,其中编辑终止子包括将终止子或终止子片段替换(也称为“终止子交换”或“终止子替换”)为不同的终止子(也称为替换终止子)或终止子片段(也称为替换终止子片段),其中终止子替换导致以下情况中的任
一种或以下情况的任一组合:增加的终止子活性、增加的终止子组织特异性、降低的终止子活性、降低的终止子组织特异性、DNA结合元件的突变和/或DNA结合元件的缺失或添加。待修饰的终止子(或终止子片段)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的终止子(或终止子片段)。替换终止子(或替换终止子片段)可为对于正在编辑的细胞为内
源、人工、预先存在、或转基因的终止子(或终止子片段)。
[0177] 在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共递送的多核苷酸修饰模板或供体DNA序列组合使用以允许将终止子或终止子元件插入到感兴趣的基因组核苷
酸序列中,其中终止子插入(或终止子元件插入)导致以下情况中的任一种或以下情况的任
一组合:增加的终止子活性(增加的终止子强度)、增加的终止子组织特异性、降低的终止子活性、降低的终止子组织特异性、DNA结合元件的突变和/或DNA结合元件的添加。
[0178] 待插入的终止子(或终止子元件)可为对于正在编辑的细胞为内源、人工、预先存在、或转基因的终止子(或终止子元件)。
[0179] 在另一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于允许终止子或终止子元件的缺失,其中终止子缺失(或终止子元件缺失)导致以下情况中的任一种或以下情
况的任一组合:提高的终止子活性(提高的终止子强度)、提高的终止子组织特异性、降低的终止子活性、降低的终止子组织特异性、DNA结合元件的突变和/或DNA结合元件的添加。待缺失的终止子或终止子片段对于正在编辑的细胞可为内源、人工、预先存在、或转基因的。
[0180] 使用向导多核苷酸/Cas内切核酸酶系统的另外的调控序列修饰
[0181] 在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于修饰或替换细胞的基因组中的调控序列。调控序列为能够增加或降低生物体内特定基因的表达并且/或者能
够改变生物体内基因的组织特异性表达的核酸分子的区段。调控序列的示例包括但不限于
3’UTR(非翻译区)区、5’UTR区、转录激活因子、转录增强子、转录阻遏子、翻译阻遏子、剪接因子、miRNA、siRNA、人工miRNA、启动子元件、CAMV 35 S增强子、MMV增强子元件(2013年3月
11日提交的PCT/US14/23451)、SECIS元件、聚腺苷酸化信号,以及聚泛素化位点。在一些实施方案中,编辑(修饰)或替换调控元件导致改变的蛋白质翻译、RNA切割、RNA剪接、转录终止或翻译后修饰。在一个实施方案中,可鉴定启动子内的调控元件并且可编辑或修饰这些
调控元件,从而优化这些调控元件对启动子的上调或下调。
[0182] 在一个实施方案中,待修饰的感兴趣的基因组序列是聚泛素化位点,其中聚泛素化位点的修饰导致蛋白质降解速度的修饰。泛素标签使蛋白质通过蛋白酶体或自体吞噬降
解。已知蛋白酶体抑制剂导致蛋白质生产过剩。对编码感兴趣的蛋白质的DNA序列的修饰可产生感兴趣的蛋白质的至少一种氨基酸修饰,其中所述修饰允许蛋白质的聚泛素化(翻译
后修饰),从而导致对蛋白质降解的修饰。
[0183] 在一个实施方案中,待修饰的感兴趣的基因组序列为玉米EPSPS基因上的聚泛素化位点,其中聚泛素化位点使用本文所述的向导多核苷酸/Cas内切核酸酶系统修饰,由于
EPSPS蛋白质降解速度减慢,所以蛋白质含量增加。
[0184] 在一个实施方案中,待修饰的感兴趣的基因组序列为内含子位点,其中该修饰包括使用本文所述的向导多核苷酸/Cas内切核酸酶系统将内含子增强基序插入到内含子中,
这引起对包含所述内含子的基因的转录活性的调节。
[0185] 在一个实施方案中,待修饰的感兴趣的基因组序列为内含子位点,其中该修饰包括将大豆EPSP1内含子替换为大豆泛素内含子1,如本文所述。
[0186] 使用向导多核苷酸/Cas内切核酸酶系统修饰剪接位点和/或引入替代剪接位点
[0187] 蛋白质合成使用由前mRNA分子经受成熟过程产生的mRNA分子。通过添加多A尾对前mRNA分子进行加帽、剪接和稳定化。真核细胞进化出复杂的剪接过程,该过程产生原始前mRNA分子的备选变体。真核细胞中的一些可能不产生用于蛋白质合成的功能模板。在玉米
细胞中,剪接过程受外显子-内含子连接位点处的剪接位点影响。典型的剪接位点的示例是AGGT。基因编码序列可包含多个替代剪接位点,其可影响前mRNA成熟过程的总体效率,因而可限制细胞中的蛋白质积累。向导多核苷酸/Cas内切核酸酶系统可与共递送的多核苷酸修
饰模板组合使用来编辑感兴趣的基因,以便在所述连接区或剪接位点的任意变型处引入典
型的剪接位点,所述剪接位点改变前mRNA分子的剪接模式。
[0188] 在一个实施方案中,待修饰的感兴趣的核苷酸序列为玉米EPSPS基因,其中基因的修饰包括使用本文所述的向导多核苷酸/Cas内切核酸酶系统修饰可选的剪接位点,从而提
高功能基因转录物和基因产物(蛋白质)的产量。
[0189] 在一个实施方案中,待修饰的感兴趣的核苷酸序列为基因,其中基因的修饰包括编辑可选地剪接的基因的内含子边界以改变剪接变体的积累。
[0190] 使用向导多核苷酸/Cas内切核酸酶系统修饰编码感兴趣的蛋白质的核苷酸序列
[0191] 在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可用于修饰或替换细胞的基因组中的编码序列,其中修饰或替换导致以下情况中的任一种或以下情况的任一组合:
增加的蛋白质(酶)活性、增加的蛋白质功能性、降低的蛋白质活性、降低的蛋白质功能性、位点特异性突变、蛋白质域交换、蛋白质敲除、新的蛋白质功能性、修饰的蛋白质功能性。
[0192] 在一个实施方案中,蛋白质敲除是由于将终止密码子引入到感兴趣的编码序列中造成的。
[0193] 在一个实施方案中,蛋白质敲除是由于感兴趣的编码序列中的起始密码子的缺失造成的。
[0194] 使用向导多核苷酸/Cas内切核酸酶系统的氨基酸和/或蛋白质融合
[0195] 在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸序列一起使用或不一起使用以将编码第一蛋白质的第一编码序列融合到编码细胞基因组
中的第二蛋白质的第二编码序列,其中蛋白质融合导致以下情况中的任一种或以下情况的
任一组合:提高的蛋白质(酶)活性、提高的蛋白质功能性、降低的蛋白质活性、降低的蛋白质功能性、新的蛋白质功能性、修饰的蛋白质功能性、新的蛋白质定位、新的蛋白质表达时机、修饰的蛋白质表达模式、嵌合蛋白质,或具有显性表型功能性的修饰蛋白质。
[0196] 在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共递送的多核苷酸序列一起使用或不一起使用以将编码叶绿体定位信号(例如,叶绿体转运肽)的第一编码序列
融合到编码感兴趣的蛋白质的第二编码序列,其中蛋白质融合导致将感兴趣的蛋白质靶向
到叶绿体。
[0197] 在一个实施方案中,向导多核苷酸/Cas内切核酸酶系统可与共同递送的多核苷酸序列一起使用或不一起使用以将第一编码序列融合到第二编码序列,其中蛋白质融合产生
具有显性表型功能性的修饰蛋白质。
[0198] 本文公开了用于编辑感兴趣的核苷酸序列的方法和组合物,所述核苷酸序列诸如但不限于植物基因组中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列。本文描述
了用于产生突变EPSPS基因和/或烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞
或植物的方法并且可包括编辑EPSPS密码子区域、产生变体植物EPSPS、复制天然EPSPS基
因、调控序列修饰、编辑EPSPS基因聚泛素化位点、编辑内含子元件、编辑剪接位点、终止子修饰、另外的调控序列修饰、剪接位点的修饰和/或引入替代剪接位点、编码感兴趣的蛋白质的核苷酸序列的修饰、如本文所述的氨基酸和/或蛋白质融合、或它们的任一组合。例如,可组合EPSPS基因的基因修饰(通过本文所述的方法,诸如但不限于EPSPS密码子区域的编
辑、剪接位点的编辑或修饰等),同时修饰驱动EPSPS基因的启动子。
[0199] 用于识别在其基因组中在所述靶位点处包含整合的感兴趣的多核苷酸的至少一个植物细胞的方法。
[0200] 还提供了用于鉴定在其基因组中包含在所述靶位点处整合的感兴趣的多核苷酸的至少一个植物细胞的方法。有多种方法可用于鉴定在靶位点处或附近具有对基因组的插
入的那些植物细胞,而无须使用可筛选的标记表型。这种方法可认为是直接分析靶序列以
检测靶序列中的任何变化,包括但不限于PCR方法、测序方法、核酸酶消化、Southern印迹法以及它们的任意组合。参见例如,美国专利申请12/147,834以本文所述方法所需的程度以
引用方式并入本文中。
[0201] 该方法还包括由包含整合到其基因组中的感兴趣的多核苷酸的植物细胞再生植物。该植物可为不育的或能育的。已经认识到任何感兴趣的多核苷酸均可在靶位点处提供、整合到植物基因组中,并且在植物中表达。
[0202] 感兴趣的多核苷酸/多肽包括但不限于抗除草剂性编码序列、杀虫编码序列、杀线虫编码序列、抗微生物编码序列、抗真菌编码序列、抗病毒编码序列、非生物和生物胁迫耐受性编码序列、或修饰植物性状诸如收率、谷粒质量、营养成分、淀粉质量和数量、固氮和/或氮利用、以及含油量和/或油组成的序列。更具体的感兴趣的多核苷酸包括但不限于改善作物收率的基因,改善作物合意性的多肽,编码赋予对非生物胁迫(诸如干旱、氮、温度盐度、有毒金属或微量元素)的抗性的蛋白或者赋予对毒素(诸如杀虫剂和除草剂)的抗性的
那些蛋白或者赋予对生物胁迫(诸如真菌、病毒、细菌、昆虫和线虫入侵)的抗性及对与这些生物体相关联疾病的发展的抗性的那些蛋白的基因。感兴趣的基因的大体类别包括例如涉
及信息的那些基因(诸如锌指)、涉及通信的那些基因(诸如激酶)和涉及持家的那些基因
(诸如热激蛋白)。转基因的更具体类别例如包括编码对农艺学、昆虫抗性、病害抗性、除草剂抗性、能育性或不育性、谷粒特性和商业产品重要的性状的基因。一般而言,感兴趣的基因包括涉及油、淀粉、水化合物或营养物质代谢的那些以及影响籽粒大小、蔗糖载量等的那些,所述性状可与本文所述的草甘膦抗性堆叠或者组合使用。
[0203] 除了使用传统的育种方法外,还可通过遗传方式改变农学上重要的性状,诸如油含量、淀粉含量和蛋白质含量。修饰包括增加油酸、饱和油与不饱和脂的含量,提升赖氨酸和硫的水平,提供必需氨基酸,以及修饰淀粉。美国专利5,703,049、5,885,801、5,885,802和5,990,389描述了大麦硫堇(Hordothionin)蛋白质修饰法,这些专利都以引用方式并入
本文。另一个示例是美国专利5,850,016中所述的由大豆2S白蛋白基因编码的富含赖氨酸
和/或富含硫的种子蛋白,以及Williamson等人(1987)Eur.J.Biochem.165:99-106中描述
的来自大麦的胰凝乳蛋白酶抑制剂,这些文献的公开内容都以引用方式并入本文。
[0204] 商业性状也能被编码在感兴趣的多核苷酸上,其能够增加例如,用于乙醇生产的淀粉,或提供蛋白的表达。转化的植物的另一个重要商业用途是生产聚合物和生物塑料诸
如美国专利5,602,321中所述。基因诸如β-酮硫酶、PHBase(聚羟基丁酸酯合酶)、以及乙酰乙酰辅酶A还原酶(参见Schubert等人(1988)J.Bacteriol.170:5837-5847)有利于聚羟基
链烷酸酯(PHA)的表达。
[0205] 可通过定点诱变产生编码序列的衍生物,以增加预选氨基酸在所编码的多肽中的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因源自大麦胰凝乳蛋白酶抑制剂(1996年11
月1日提交的美国申请序列号08/740,682,以及WO 98/20133,这些专利的公开内容以引用
方式并入本文)。其它蛋白包括富含甲硫氨酸的植物蛋白,诸如来自向日葵种子的蛋白
(Lilley等人(1989)Proceedings of the World Congress on Vegetable Protein 
Utilization in Human Foods and Animal Feedstuffs,Applewhite编辑(American Oil 
Chemists Society,Champaign,Illinois),第497-502页);将该文献以引用方式并入本
文);来自玉米的蛋白(Pedersen等人(1986)J.Biol.Chem.261:6279);Kirihara等人(1988)Gene 71:359;这些文献都以引用方式并入本文);以及来自稻的蛋白(Musumura等人(1989)Plant Mol.Biol.12:123,该文献以引用方式并入本文)。其它农学上重要的基因编码胶乳、Floury 2、生长因子、种子贮藏因子和转录因子。
[0206] 改善作物收率的多核苷酸包括矮化基因,诸如Rht1和Rht2(Peng等人(1999)Nature 400:256-261),以及增加植物生长的那些,诸如铵诱导型谷氨酸脱氢酶。改善作物合意性的多核苷酸包括例如允许植物具有减少的饱和脂肪含量的那些多核苷酸、提高植物
营养价值的那些多核苷酸、以及增加谷粒蛋白的那些多核苷酸。改善耐盐性的多核苷酸是
增加或允许植物在与已引入耐盐基因的该植物的天然环境相比更高盐度的环境中生长的
那些多核苷酸。
[0207] 影响氨基酸生物合成的多核苷酸/多肽包括例如邻氨基苯甲酸盐合酶(AS;EC 4.1.3.27),该酶催化植物、真菌和细菌中从芳族氨基酸途径分支到色氨酸生物合成的第一反应。在植物中,色氨酸的生物合成的化学过程是区室化于叶绿体中的。参见例如美国公布
20080050506。另外的感兴趣的序列包括分支酸丙酮酸裂解酶(CPL),其是指编码催化分支
酸转化为丙酮酸和pHBA的酶的基因。表征最充分的CPL基因已从大肠杆菌中分离并具有
GenBank登录号M96268。参见美国专利7,361,811,将其以引用的方式并入本文。
[0208] 这些感兴趣的多核苷酸序列可编码涉及提供病害或害虫抗性的蛋白。所谓“病害抗性”或“害虫抗性”意指植物避开作为植物-病原体相互作用的后果的有害症状。害虫抗性基因可编码对严重导致收率下降的害虫诸如根虫、切根虫、欧洲玉米螟等的抗性。病害抗性基因和昆虫抗性基因,诸如用于抗细菌保护的溶菌酶或天蚕抗菌肽(cecropin),或者用于
抗真菌保护的蛋白质诸如防御素、葡聚糖酶或几丁质酶,或者用于防治线虫或昆虫的苏
金芽孢杆菌(Bacillus thuringiensis)内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶,都是可用的基因产物的示例。编码病害抗性性状的基因包括解毒基因,诸如抗伏马毒素(美国专利5,792,931);无毒性(avr)和病害抗性(R)基因(Jones等人(1994)Science 266:789;
Martin等人(1993)Science 262:1432;和Mindrinos等人(1994)Cell 78:1089);等等。害虫抗性基因可编码对严重导致收率下降的害虫诸如根虫、切根虫、欧洲玉米螟等的抗性。这种基因包括例如苏云金芽孢杆菌毒蛋白基因(美国专利5,366,892、5,747,450、5,736,514、5,
723,756、5,593,881;和Geiser等人(1986)Gene 48:109);等等。
[0209] “抗除草剂性蛋白”或由“抗除草剂性编码核酸分子”表达生成的蛋白质包括这样的蛋白质,其赋予细胞与未表达该蛋白质的细胞相比耐受更高浓度除草剂的能力,或赋予细胞与未表达该蛋白质的细胞相比对某种浓度除草剂耐受更长时间的能力。抗除草剂性性
状可通过如下基因引入到植物中:编码对乙酰乳酸合酶(ALS)起到抑制作用的除草剂(特别
是磺酰脲类除草剂)的抗性的基因、编码对谷氨酰胺合酶起到抑制作用的除草剂诸如草胺
膦或者basta的抗性的基因(如,bar基因)、对草甘膦的抗性的基因(如,EPSP合酶基因和GAT基因)、对HPPD抑制剂的抗性的基因(如,HPPD基因)或者本领域已知的其它此类基因。参见例如美国专利7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970、6,
867,293和美国临时申请61/401,456,将所述专利中的每个以引用的方式并入本文。bar基
因编码对除草剂basta的抗性,nptII基因编码对抗生素卡那霉素和遗传霉素的抗性,并且
ALS基因突变体编码对除草剂氯磺隆的抗性。
[0210] 不育基因也可编码在表达盒中,并且为物理去雄提供备选方案。以此类方式使用的基因的示例包括雄性育性基因,诸如MS26(参见例如美国专利7,098,388、7,517,975、7,
612,251)、MS45(参见例如美国专利5,478,369、6,265,640)或MSCA1(参见例如美国专利7,
919,676)。玉米植物(玉米(Zea mays L.))可通过自花授粉和异花授粉两种技术来进行育
种。在同一植株上,玉米具有位于雄穗上的雄花,以及位于雌穗上的雌花。其可自花授粉
(“自交”)或异花授粉。当将花粉从雄穗吹至从初始雌穗顶部突出的穗丝时在玉米中发生天然的授粉。授粉可通过本领域的技术人员已知的技术容易地控制。玉米杂交体的开发需
要纯合近交系的开发、这些近交系的杂交和杂交的评估。谱系选择和轮回选择是用于从群
体开发近交系的两种育种方法。育种程序将来自两种或更多种近交系或各种广泛来源的所
需性状结合到育种库中,从育种库中通过自交并选择所需表型来开发新的近交系。杂交玉
米品种是两个此类近交系的杂交,所述近交系中的每个可能具有一种或多种在另一近交系
中缺乏的所需特性,或补充另一近交系的所需特性。使新的近交系与其它近交系杂交,并且对来自这些杂交的杂交体进行评估以确定哪些具有商业潜力。第一代杂交子代称为F1。F1
杂交体比其自交亲本更有活力。该杂交体活力或者杂种优势可以多种方式体现,包括增加
的营养生长和提高的收率。
[0211] 杂交玉米种子可通过结合了人工去雄的雄性不育系统产生。为了产生杂交种子,将雄穗从生长的雌性近交亲本移除,其可以与雄性近交亲本成交替行的多种模式种植。因
此,在与外来玉米花粉的来源充分隔离的前提条件下,磁性近交株的雌穗将仅通过来自雄
性近交株的花粉受精。因此所得种子是杂交体(F1)并且将形成杂交植物。
[0212] 影响植物发育的田地变化可导致植物在雌性亲本的人工去雄完成之后抽穗。或者,雌性近交植物雄穗可能无法在去雄过程期间被完全移除。在任何情况下,结果是雌性植物将成功地散出花粉并且一些雌性植物将自花授粉。这将导致雌性近交株的种子连同正常
产生的杂交种子一起收获。雌性近交株种子不表现出杂种优势并且因此不如F1种子高产。
此外,雌性近交株种子的存在对于生产杂交体的公司可能意味着种质安全风险。
[0213] 另选地,雌性近交株可通过机器机械地去雄。机械去雄大致如手工去雄一样可靠,但是更快并且成本更低。然而,大多数去雄机器比手工去雄对植物产生更多损害。因此,目前没有一种去雄形式是完全令人满意的,并且仍然需要进一步降低生产成本的替代品以及消除杂交种子生产中雌性亲本的自花授粉。
[0214] 造成植物中雄性不育的突变有潜力可用于作物植物(诸如玉米)的杂交种子生产的方法中,并且可通过以下方式来降低生产成本:消除耗费劳力地从用作杂交亲本的母本
植物移除雄花(也称为去雄)的需要。已有多种方法可产生造成玉米中雄性不育的突变,诸
X射线或紫外线照射、化学处理或转座元件插入(ms23、ms25、ms26、ms32)(Chaubal等人(2000)Am J Bot 87:1193-1201)。通过能育性/不育性“分子开关”对能育性基因进行条件调控可增强设计用于作物改良的新雄性不育性系统的选择性(Unger等人(2002)
Transgenic Res 11:455-465)。
[0215] 此外,已经认识到感兴趣的多核苷酸可还包含与所靶向的感兴趣的基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与对应的mRNA杂交。可对反义序列作出修饰,只要该序列能杂交对应的mRNA并干扰其表达。以此方式,可使用与对应的反义序列具有70%、80%或85%序列同一性的反义构建体。此外,反义核苷酸的部分可用来破坏靶基因的表达。一般而言,可使用至少50个核苷酸、100个核苷酸、200个核苷酸或更多个核苷酸的序列。
[0216] 另外,感兴趣的多核苷酸还可以有义取向使用来抑制植物中的内源基因的表达。用有义取向的多核苷酸抑制植物中的基因表达的方法是本领域已知的。该方法通常涉及用
包含这样的启动子的DNA构建体转化植物,该启动子可操作地连接至对应于该内源基因的
转录物的核苷酸序列的至少一部分,能驱动在植物中的表达。通常,这种核苷酸序列与内源基因的转录物的序列具有实质的序列同一性,通常高于约65%的序列同一性、约85%的序
列同一性或高于约95%的序列同一性。参见美国专利5,283,184和5,034,323;将这些专利
以引用方式并入本文。
[0217] 感兴趣的多核苷酸还可以是表型标记。表型标记是可筛选或可选择的标记,其包括可视标记和选择性标记,无论它是阳性还是阴性选择性标记。可使用任何表型标记。具体地,可选择的或可筛选的标记包含这样的DNA区段,该DNA区段使得可以常常在特定条件下
鉴定或选取或者不选取含有它的分子或细胞。这些标记可编码活性,诸如但不限于RNA、肽或蛋白质的产生,或者可为RNA、肽、蛋白质、无机和有机化合物或组合物等提供结合位点。
[0218] 选择性标记的示例包括但不限于包含限制性酶位点的DNA区段;编码提供对于有毒化合物的抗性的产物的DNA区段,所述有毒化合物包括抗生素,诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外缺乏受体细胞的产物的DNA区段(例如,tRNA基因、营养缺陷标记);编码可易于鉴定的产物的DNA区段(例如,表型标记,诸如β-半乳糖苷酶、GUS;荧光蛋白,诸如绿色荧光蛋白(GFP),青色荧光蛋白(CFP),黄色荧光蛋白(YFP),红色荧光蛋白(RFP),以及细胞表面蛋
白);产生用于PCR的新引物位点(例如,之前尚未并置的两个DNA序列的并置)的DNA区段;包含未受限制性内切核酸酶或其他DNA修饰酶、化学品等作用或受其作用的DNA序列的DNA区
段;以及包含特异性修饰(例如,甲基化)所需的DNA序列的DNA区段,该特异性修饰使得可以鉴别该DNA序列。
[0219] 另外的选择性标记包括能赋予对除草化合物如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)的抗性的基因。参见例如Yarranton,(1992)Curr Opin Biotech 3:
506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA 89:6314-8;Yao等人,
(1992)Cell 71:63-72;Reznikoff,(1992)Mol Microbiol 6:2419-22;Hu等人,(1987)Cell 
48:555-66;Brown等人,(1987)Cell 49:603-12;Figge等人,(1988)Cell 52:713-22;
Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-4;Fuerst等人,(1989)
Proc.Natl.Acad.Sci.USA 86:2549-53;Deuschle等人,(1990)Science 248:480-3;
Gossen,(1993)Ph.D.Thesis,University of Heidelberg;Reines等人,(1993)
Proc.Natl.Acad.Sci.USA 90:1917-21;Labow等人,(1990)Mol Cell Biol 10:3343-56;
Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA 89:3952-6;Baim等人,(1991)
Proc.Natl.Acad.Sci.USA 88:5072-6;Wyborski等人,(1991)Nucleic Acids Res 19:
4647-53;Hillen和Wissman,(1989)Topics Mol Struc Biol 10:143-62;Degenkolb等人,(1991)Antimicrob Agents Chemother 35:1591-5;Kleinschnidt等人,(1988)
Biochemistry 27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg;
Gossen等人,(1992)Proc.Natl.Acad.Sci.USA 89:5547-51;Oliva等人,(1992)Antimicrob Agents Chemother 36:913-9;Hlavka等人,(1985)Handbook of Experimental 
Pharmacology,第78卷(Springer-Verlag,Berlin);Gill等人,(1988)Nature 334:721-4。
也可以在一种或多种基因上编码商业性状,所述基因可提高例如用于乙醇生产的淀粉,或
提供蛋白质表达。转化的植物的另一个重要商业用途是生产聚合物和生物塑料诸如美国专
利5,602,321中所述。基因诸如β-酮硫酶、PHBase(聚羟基丁酸酯合酶)、以及乙酰乙酰辅酶A还原酶(参见Schubert等人(1988)J.Bacteriol.170:5837-5847)有利于聚羟基链烷酸酯
(PHA)的表达。
[0220] 外源产物包括植物酶和植物产物,以及来自包括原核生物和其他真核生物在内的其他来源的那些产物。这类产物包括酶、辅因子、激素等。可增加蛋白质的水平,特别是具有能够提高植物营养价值的改善氨基酸分布的经修饰蛋白质的水平。这可通过表达具有提高
的氨基酸含量的这类蛋白质来实现。
[0221] 感兴趣的转基因、重组DNA分子、DNA序列以及感兴趣的多核苷酸可包含一个或者多个用于基因沉默的DNA序列。涉及在植物中表达DNA序列的基因沉默方法是本领域已知
的,包括但不限于共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、含内含子的发夹RNA(ihpRNA)干扰、转录基因沉默以及微RNA(miRNA)干扰。
[0222] 如本文所用,“核酸”是指多核苷酸,并且包括脱氧核糖核苷酸或者核糖核苷酸碱基的单链或者双链聚合物。核酸也可包括片段和修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用,表示单链或者双链的RNA和/或DNA聚合物,其任选含有合成的、非天然的或者改变的核苷酸碱基。核苷酸(通常以它们的5′单磷酸形式存在)通过它们的单字母命名指代如下:“A”指代腺苷或脱氧腺苷(分别对于RNA或者DNA),“C”指代胞嘧啶或脱氧胞嘧啶,“G”指代苷或脱氧鸟苷,“U”指代尿苷,“T”指代脱氧胸苷,“R”指代嘌呤(A或G),“Y”指代嘧啶(C或T),“K”指代G或T,“H”指代A或C或T,“I”指代肌苷,并且“N”指代任何核苷酸。
[0223] “开放阅读框”缩写为ORF。
[0224] 术语“功能上等同的亚片段”和“功能等同亚片段”在本文中可互换使用。这些术语指代分离的核酸片段的这样的部分或者亚序列,其中改变基因表达或者产生某种表型的能力得到保持,无论该片段或者亚序列是否编码活性酶。例如,该片段或亚片段可用于设计基因以在转化的植物中产生所需的表型。可通过将核酸片段或其亚片段——无论其是否编码
活性酶——相对于植物启动子序列以有义或反义方向进行连接,来设计基因用于抑制。
[0225] 术语“保守域”或“基元”是指在进化上相关的蛋白质的经比对的序列上特定位置处保守的一组氨基酸。虽然其他位置处的氨基酸在同源蛋白质之间可变,但在特定位置处高度保守的氨基酸表示对于蛋白质的结构、稳定性或活性而言必需的氨基酸。由于它们在
蛋白质同源物家族的经比对的序列中的高保守度而被鉴定,它们可用作鉴定物或者“识别
标志(signature)”,以测定具有新确定的序列的蛋白质是否属于之前鉴定的蛋白质家族。
[0226] 多核苷酸和多肽序列、其变体以及这些序列的结构关系,可用术语“同源性”、“同源的”、“实质上相同的”、“实质上相似的”和“实质上对应”描述,这些术语在本文中可互换使用。这些是指多肽或者核酸片段,其中一个或者多个氨基酸或者核苷酸碱基的变化不影响分子的功能,诸如介导基因表达或者产生某种表型的能力。这些术语还指代核酸片段的
这样的修饰,相对于初始的未修饰的片段,所述修饰不实质上改变所得的核酸片段的功能
性质。这些修饰包括在核酸片段中缺失、置换和/或插入一个或多个核苷酸。
[0227] 所涵盖的实质上相似的核酸序列,可通过其与本文所例示的序列杂交,或与本文所公开的且与任何本文所公开的核酸序列在功能上等同的核苷酸序列的任何部分杂交(在
中等严格条件下,例如0.5X SSC,0.1%SDS,60℃)的能力来定义。可调整严格条件以筛选中等相似片段,诸如来自远缘生物的同源序列,以及高度相似片段,诸如来自近缘生物的复制功能酶的基因。杂交后的洗涤决定了严格条件。
[0228] 术语“选择性杂交”包括指代在严格杂交条件下核酸序列与指定的核酸靶序列杂交的程度相比于其与非靶核酸序列杂交的程度具有更高的可检测程度(例如,至少2倍于背
景),并且实质上排除非靶核酸。选择性杂交的序列通常相互具有约至少80%的序列同一
性,或者90%的序列同一性,最多至100%并包括100%的序列同一性(即完全互补)。
[0229] 术语“严格条件”或“严格杂交条件”包括指代在体外杂交测定中探针将与其靶序列选择性杂交的条件。严格条件是序列依赖性的,并且在不同的情况中将会不同。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。另选地,可以调整严格条件以允许序列中的一些错配,从而检测到较低程度的相似性(异源探测)。通常,探针的长度少于约1000个核苷酸,任选地长度少于500个核苷酸。
[0230] 通常,严格条件将为其中盐浓度低于约1.5M钠离子,通常为约0.01M至1.0M钠离子浓度(或者其它盐),pH为7.0至8.3,对短探针(例如,10至50个核苷酸)而言温度为至少约30℃,对长探针(例如大于50个核苷酸)而言温度为至少约60℃的那些条件。严格条件还可以
通过添加去稳定剂诸如甲酰胺来实现。示例性的低严格条件包括用30%-35%甲酰胺、1M 
NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液在37℃下杂交并在1X至2X SSC(20X SSC=3.0M NaC1/0.3M柠檬酸三钠)中在50-55℃下洗涤。示例性的中等严格条件包括在40%-45%甲酰
胺、1.0M NaCl、1%SDS中在37℃下杂交并在0.5X至1X SSC中在55-60℃下洗涤。示例性的高严格条件包括在50%甲酰胺、1M NaCl、1%SDS中在37℃下杂交并在0.1X SSC中在60-65℃
下洗涤。
[0231] 在核酸或多肽序列的情形中,“序列同一性”或“同一性”是指在指定的比较窗范围为获得最大对应而比对时两条序列中相同的核酸碱基或氨基酸残基。
[0232] 术语“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的数值,其中多核苷酸或者多肽序列在比较窗口中的部分与参考序列(不包含添加或缺
失)相比包含添加或缺失(即空位),以用于两个序列的最佳比对。通过以下方式计算这种百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置
的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分数。序列同一性百分比的可用示例包括但不限于50%、55%、60%、65%、
70%、75%、80%、85%、90%或者95%,或者50%至100%的任何整数百分数。这些同一性可用本文描述的任何程序确定。
[0233] 序列比对和百分比同一性或者相似性计算可用多种被设计用于检测同源序列的比较方法来确定,包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.,
Madison,WI)的MegAlignTM程序。在本申请的上下文中,应理解,在使用序列分析软件进行分析的情况中,除非另有指明,否则分析的结果将基于所提到的程序的“默认值”。如本文所用,“默认值”将意指软件第一次初始化时原始装载在该软件中的任何数值或者参数组。
[0234] “Clustal V比对方法”对应于标记为Clustal V的比对方法(通过以下文献描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci 8:
TM
189-191)并且可见于LASERGENE生物信息学计算软件包的MegAlign 程序(DNASTAR Inc.,
Madison,WI)。对于多重比对,默认值对应于GAP PENALTY=10,以及GAP LENGTH PENALTY=
10。使用Clustal方法进行蛋白质序列的逐对比对和百分比同一性计算的默认参数是
KTUPLE=1,GAP PENALTY=3,WINDOW=5,以及DIAGONALS SAVED=5。对于核酸,这些参数是KTUPLE=2,GAP PENALTY=5,WINDOW=4,以及DIAGONALS SAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。
[0235] “Clustal W比对方法”对应于标记为Clustal W的比对方法(通过以下文献描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci 8:
189-191)并且可见于LASERGENE生物信息学计算软件包的MegAlignTM v6.1程序(DNASTAR 
Inc.,Madison,WI)。用于多重比对的默认参数(GAP PENALTY=10、GAP LENGTH PENALTY=
0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein Weight 
Matrix=Gonnet系列、以及DNA Weight Matrix=IUB)。在用Clustal W程序进行序列比对
后,可以通过观察同一程序中的“序列距离”表来获得“百分比同一性”。
[0236] 除非另作说明,否则本文提供的序列同一性/相似性值指使用GAP版本10(GCG,Accelrys,San Diego,CA)用以下参数获得的值:使用空位形成罚分权重50和空位长度延伸罚分权重3以及nwsgapdna.cmp计分矩阵获得的核苷酸序列的同一性%和相似性%;使用空
位形成罚分权重8和空位长度延伸罚分2以及BLOSUM62计分矩阵获得的氨基酸序列的同一
性%和相似性%(Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA89:10915)。GAP利用Needleman和Wunsch,(1970)J Mol Biol 48:443-53的算法来寻找两个完整序列的比对,该比对使匹配数最大而使空位数最小。GAP考虑所有可能的比对和空位位置,并使用以匹配碱基为单位的空位形生罚分和空位延伸罚分产生出具有最大数目的匹配碱基和最少的空
位的比对。
[0237] “BLAST”是美国国家生物技术信息中心(NCBI)提供的用于寻找生物序列之间的相似性区域的搜索算法。该程序将核苷酸或蛋白质序列与序列数据库比较,并计算各匹配的
统计学显著性以鉴定出与查询序列具有足够的相似性的序列,使得相似性不会被预测为随
机发生。BLAST报告所鉴定的序列以及它们与查询序列的局部比对。
[0238] 本领域的技术人员熟知,许多序列同一性水平可用于鉴定来自其它物种的或者经天然修饰或合成来源的多肽,其中这种多肽具有相同或相似的功能或活性。同一性百分比
的可用示例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或者95%,或者50%至100%的任何整数百分数。实际上,50%至100%的任何整数氨基酸同一性可用于
描述本发明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、
63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、
78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%。
[0239] “基因”是指通常表达功能性分子(诸如但不限于特定蛋白质)的核酸片段,包括位于编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。“天然基因”是指与其自身调控序列一起天然存在的基因。
[0240] “突变基因”是已通过人为干预被改变的基因。这种“突变基因”的序列与对应的非突变基因的序列不同之处在于至少一个核苷酸的添加、缺失或置换。在本发明的某些实施方案中,突变基因包含由本文所公开的向导多核苷酸/Cas内切核酸酶系统引起的改变。突
变植物是包含突变基因的植物。
[0241] 如本文所用,“靶向突变”是天然基因中的通过如下方式产生的突变:使用涉及本文所公开的或者本领域已知的能够在靶序列的DNA中诱导双链断裂的双链断裂诱导剂的方法,对天然基因内的靶序列进行改变。
[0242] 在一个实施方案中,靶向突变是引导多核苷酸/Cas内切核酸酶诱导的基因编辑的结果,如本文所述。引导多核苷酸/Cas内切核酸酶诱导的靶向突变可发生于位于基因组靶
位点之内或之外的核苷酸序列中,该基因组靶位点由Cas内切核酸酶识别和裂解。
[0243] 术语“基因组”应用于植物细胞时,不仅涵盖细胞核内存在的染色体DNA,也涵盖细胞的亚细胞组分(例如线粒体或质体)中存在的细胞器DNA。
[0244] “密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是这样的基因,其密码子用法的频率被设计成模拟宿主细胞的偏好密码子用法的频率。
[0245] “等位基因”是基因的占据染色体上特定基因座的几种另选形式之一。当染色体上特定基因座处存在的所有等位基因都相同时,该植物在该基因座处是纯合的。如果染色体上特定基因座处存在的等位基因不同,则该植物在该基因座处是杂合的。
[0246] “编码序列”指编码特定氨基酸序列的多核苷酸序列。“调控序列”指位于编码序列上游(5′非编码序列)、内部、或下游(3′非编码序列)并且影响相关编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调控序列可包括但不限于:启动子、翻译前导序列、5′非翻译序列、3′非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应物结合位点和茎环结构。
[0247] “植物优化的核苷酸序列”是已经过优化以提高在植物中的表达、特别是提高在植物中或者一种或者多种感兴趣植物中的表达的核苷酸序列。例如,可通过使用一个或多个用于改善表达的植物优选的密码子,对本文所公开的编码蛋白质诸如例如双链断裂诱导剂
(例如内切核酸酶)的核苷酸序列进行修饰,来合成植物优化的核苷酸序列。对于宿主优选
的密码子使用的讨论,参见例如Campbell和Gowri(1990)Plant Physiol.92:1-11。
[0248] 在本领域中用于合成植物优选的基因的方法是可用的。参见例如美国专利5,380,831和5,436,391,以及Murray等人(1989)Nucleic Acids Res.17:477-498,它们以引用方式并入本文。已知有另外的序列修饰可增强在植物宿主中的基因表达。这些修饰包括例如
消除以下序列:一个或多个编码假聚腺苷酸化信号、外显子-内含子剪接位点信号的序列,一个或多个转座子样重复序列,以及其他这种得到很好表征的可能对基因表达有害的序
列。可将序列的G-C含量调整到给定的植物宿主的平均水平,这通过参考在宿主植物细胞中表达的已知基因计算得到。当可能时,修饰序列以避免一个或多个预测的发夹二级mRNA结
构。因此,本发明的“植物优化的核苷酸序列”包含一个或者多个这种序列修饰。
[0249] “启动子”指能够控制编码序列或功能RNA的表达的DNA序列。启动子序列由近端上游元件和更远端的上游元件组成,后一类元件经常称作增强子。因此,“增强子”是这样的DNA序列,其可以刺激启动子活性,并且可以是启动子的固有元件或经插入以增强启动子的水平或组织特异性的异源元件。启动子可以整体源自天然基因,或由源自天然存在的不同启动子的不同元件构成,和/或甚至包含合成的DNA区段。本领域技术人员应当理解,不同的启动子可以指导基因在不同组织或细胞类型中或在不同的发育阶段或应答于不同的环境
条件时表达。还认识到,由于在大多数情况下调控序列的确切界限仍未完全确定,因此存在一定变异的各DNA片段可以具有相同的启动子活性。造成基因在大多数时间在大多数细胞
类型中表达的启动子通常称为“组成型启动子”。
[0250] 已经证实,某些启动子能够以高于其他启动子的速率指导RNA合成。这些被称为“强启动子”。已经证实,某些其他启动子仅在特定类型的细胞或组织中以较高水平指导RNA合成,并且如果启动子优选地在某些组织中指导RNA合成,但在其他组织中以降低的水平指导RNA合成,则其通常被称为“组织特异性启动子”或“组织偏好启动子”。由于引入到植物中的一个或多个嵌合基因的表达模式使用启动子来控制,因此人们对下述新型启动子的分离
一直有兴趣,该新型启动子能够在特定组织类型中或在特定植物发育阶段以一定水平控制
一个或多个嵌合基因的表达。
[0251] 不断发现可用于植物细胞中的各种类型的新启动子,在以下汇编中可以找到许多示例:Okamuro和Goldberg,(1989)The Biochemistry of Plants,第115卷,Stumpf和Conn编辑(New York,NY:Academic Press),第1-82页。
[0252] “翻译前导序列”是指位于基因的启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列上游的mRNA中。翻译前导序列可影响初级转录物加工成mRNA、mRNA稳定性或翻译效率。翻译前导序列的示例已有描述(例如Turner和Foster,
(1995)Mol Biotechnol 3:225-236)。
[0253] “3′非编码序列”、“转录终止子”或“终止序列”是指位于编码序列下游的DNA序列,并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其它序列。聚腺苷酸化信号通常以影响添加聚腺苷酸片至mRNA前体的3′端为特征。不同的3′非编码序列的用途由Ingelbrecht等人,(1989)Plant Cell 1:671-680例示。
[0254] “RNA转录物”是指由RNA聚合酶催化的DNA序列的转录所产生的产物。当RNA转录物是DNA序列的完全互补拷贝时,它被称为初级转录物或前mRNA。当RNA转录物是由初级转录物前mRNAt的转录后加工衍生的RNA序列时,它被称为成熟RNA或mRNA。“信使RNA”或者
“mRNA”是指没有内含子且可由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA模板互补且用反转录酶从mRNA模板合成的DNA。cDNA可为单链的或通过使用DNA聚合酶I的Klenow片段转化
成双链形式。“有义”RNA是指包含mRNA并且可被翻译成细胞内或体外的蛋白质的RNA转录
物。“反义RNA”是指与靶初级转录物或者mRNA的全部或者部分互补,并且能阻断靶基因的表达的RNA转录物(参见例如美国专利5,107,065)。反义RNA可与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能RNA”是指反义RNA、核酶RNA或者其它可能不被翻译但仍对细胞过程具有作用的RNA。术语“互补序列”或“反向互补序列”在本文中可互换地用来指涉mRNA转录物,并且意在定义该信息(message)的反义RNA。
[0255] 术语“可操作地连接”指各核酸序列结合在单一核酸片段上,使得一个核酸序列的功能被另一个核酸序列调节。例如,当启动子能够调节编码序列的表达时(即,该编码序列处于该启动子的转录控制下),则该启动子与该编码序列可操作地连接。编码序列可以有义或者反义方向与调控序列可操作地连接。在另一个示例中,互补的RNA区域可直接或者间接地与靶mRNA的上游(5′)可操作地连接,或者与靶mRNA的下游(3′)可操作地连接,或者在靶mRNA内部可操作地连接,或者第一互补区在靶mRNA的上游(5′),而其互补序列在靶mRNA的下游(3′)。
[0256] 本文所用的标准的重组DNA和分子克隆技术是本领域熟知的,并且在以下文献中有更完全的描述:Sambrook等人,Molecular Cloning:A Laboratory Manual;Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989)。转化方法是本领域技术人员熟知的,并在下文中描述。
[0257] “PCR”或“聚合酶链反应”是一项用于合成特定DNA区段的技术,并且由一系列的重复的变性、退火和延伸循环组成。通常,将双链DNA进行热变性,并将两条与靶区段的3′边界互补的引物与该DNA在低温下退火,然后在中等温度下延伸。一组这三个连续步骤称为一个“循环”。
[0258] 术语“重组的”是指序列的两个本来分开的区段例如通过化学合成人工组合在一起,或者通过遗传工程技术对核酸的分离的区段进行操纵。
[0259] 术语“质粒”、“载体”和“盒”指这样的染色体外元件,其通常携带不是细胞的中心代谢的一部分的基因,并且通常为双链DNA的形式。这种元件可以是衍自任何来源的、单链或者双链DNA或者RNA的、线状或环状形式的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已连接或者重组成能够将感兴趣多核苷酸引入细胞的独特构建体。“转化盒”是指含有一种基因并且除该基因之外还具有能促进特定宿主细胞的转化的元件的特定载体。“表达盒”是指含有一种基因并且除该基因之外还具有使该基因在宿主中表达的元件的特定载体。
[0260] 术语“重组DNA分子”、“重组构建体”、“表达构建体”、“构建体”、“构建体”和“重组DNA构建体”在本文中可互换使用。重组构建体包含在自然界中不全部在一起的核酸片段(例如调控序列和编码序列)的人工组合。例如,构建体可以包含源自不同来源的调控序列
和编码序列,或源自相同来源、但是以不同于自然界中存在的方式排列的调控序列和编码
序列。这种构建体可单独使用或可与载体结合使用。如果使用载体,则载体的选择取决于将被用来转化宿主细胞的方法,这是本领域技术人员熟知的。例如可使用质粒载体。技术人员熟知为了成功地转化、选择和繁殖宿主细胞而必须在载体上存在的遗传元件。技术人员还
将认识到,不同的独立转化事件可导致不同的表达水平和表达模式(Jones等人,(1985)
EMBO J 4:2411-2418;De Almeida等人,(1989)Mol Gen Genetics218:78-86),因此通常对多个事件进行筛选以获得显示所需表达水平和表达模式的细胞系。这种筛选可通过标准的
分子生物学测定法、生物化学测定法和其它测定法完成,所述测定法包括DNA的Southern分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、反转录PCR(RT-PCR)、蛋白质表达的免疫印迹分析、酶或者活性测定和/或表型分析。
[0261] 本文所用的术语“表达”指产生前体形式或成熟形式的功能性最终产物(例如mRNA、引导多核苷酸或蛋白质)。
[0262] 术语“引入”意指向细胞提供核酸(例如表达构建体)或蛋白质。引入包括指代核酸掺入到真核或原核细胞中,其中该核酸可掺入到该细胞的基因组中,并且包括指代核酸或蛋白质短暂提供到细胞。引入包括指代稳定的或短暂的转化方法,以及有性杂交。因此,在将核酸片段(例如,重组DNA构建体/表达构建体)插入细胞中的情形中,“引入”意指“转染”或“转化”或“转导”,并且包括指代将核酸片段掺入到真核或原核细胞中,其中该核酸片段可掺入到细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中,转化成自主复制子或瞬时表达(例如,转染的mRNA)。
[0263] “成熟”蛋白质指翻译后加工的多肽(即,已从初级翻译产物移除了任何存在的原肽或前肽所得的多肽)。“前体”蛋白质指mRNA的翻译的初级产物(即,仍存在原肽和前肽)。
原肽和前肽可以是但不限于胞内定位信号。
[0264] “稳定转化”是指将核酸片段转移至宿主生物体的基因组(包括核基因组和细胞器基因组)中,导致基因稳定遗传。相反,“瞬时转化”是指核酸片段转移到宿主生物体的细胞核或者其它含DNA的细胞器中,从而导致基因表达而不整合或不稳定遗传。
[0265] 遗传改良种质的商业开发也已进展到将多种性状引入作物植物的阶段,通常称为基因堆叠方法。在该方法中,可将赋予不同感兴趣的特性的多种基因引入植物。基因堆叠可通过许多方法实现,包括但不限于共转化、再转化以及使具有不同感兴趣的基因的品系的
杂交。
[0266] 术语“植物”指整株植物、植物器官、植物组织、种子、植物细胞、及其种子和子代。植物细胞包括但不限于来自种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、苗、配子体、孢子体、花粉和小孢子的细胞。植物部分包括分化和未分化的组织,包括但不限于根、茎、苗、叶、花粉、种子、瘤组织和各种形式的细胞和培养物(例如,单细胞、原生质体、胚和愈伤组织)。植物组织可以在植物中或在植物器官、组织或培养物中。术语“植物器官”指构成植物的形态上和功能上不同的部分的植物组织或一组植物组织。术语“基因组”是指生物体每个细胞或病毒或细胞器中存在的全部互补遗传物质(基因和非编码序列);和/或作为(单
倍体)单元从一个亲本继承的完整组的染色体。“子代”包含植物的任何后续世代。
[0267] 转基因植物包括例如这样的植物,该植物在其基因组内包含通过转化步骤引入的异源多核苷酸。异源多核苷酸能被稳定地整合进基因组中,使得该多核苷酸传递至连续的
世代。异源多核苷酸可单独地或作为重组DNA构建体的一部分整合到基因组中。转基因植物还可在其基因组内包含不止一个异源多核苷酸。每个异源多核苷酸可赋予转基因植物不同
性状。异源多核苷酸可包括源自外来物种的序列,或者,如果源自相同物种,则可为对其天然形式进行了实质性修饰的序列。“转基因”可包括其基因型已因异源核酸的存在而改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初经如此改变的转基因植物以及通过有性杂交或无性繁殖从最初的转基因植物产生的那些。通过常规植物育种方
法,通过本文所述的不导致外来多核苷酸插入的基因组编辑程序,或通过诸如随机异花受
精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变不旨在被认为是转基因的。
[0268] “厘摩”(cM)或“图距单位(map unit)”是两个连接的基因、标记、靶位点、基因座或它们的任何配对之间的距离,其中1%的减数分裂产物是重组的。因此,一厘摩与等于两个连接的基因、标记、靶位点、基因座或它们的任何配对之间的1%平均重组频率的距离相当。
[0269] 蛋白质可以各种方式进行改变,包括氨基酸置换、缺失、截短和插入。用于此类操作的方法一般来讲是已知的。例如,可通过在DNA中的突变来制备蛋白质的氨基酸序列变体。用于诱变和核苷酸序列改变的方法包括例如Kunkel,(1985)Proc.Natl.Acad.Sci.USA 
82:488-92;Kunkel等人,(1987)Meth Enzymol 154:367-82;美国专利4,873,192;Walker和Gaastra编辑(1983)Techniques in Molecular Biology(MacMillan Publishing 
Company,New York)以及其中引用的参考文献。有关不太可能影响蛋白质的生物活性的氨
基酸置换的指导,见于例如Dayhoff等人,(1978)Atlas of Protein Sequence and 
Structure(Natl Biomed Res Found,Washington,D.C.)的模型。保守置换,诸如将一个氨基酸用另一具有相似性质的氨基酸进行交换,可以是优选的。保守缺失、插入和氨基酸置换预期不会造成蛋白质特征的根本性变化,并且任何置换、缺失、插入或它们的组合的效应可通过常规筛选测定法进行评估。测定双链断裂诱导活性的测定法是已知的,一般是测量该
试剂对含有靶位点的DNA底物的总体活性和特异性。
[0270] 已知有多种方法可用来将核苷酸序列和多肽引入到生物体中,包括例如转化、有性杂交在内,以及将多肽、DNA或mRNA引入细胞中。
[0271] 用于接触、提供和/或引入组合物到各种生物体中的方法是已知的,包括但不限于稳定转化方法、瞬时转化方法、病毒介导的方法和有性育种。稳定转化表示所引入的多核苷酸整合到生物体的基因组中并能够被其子代遗传。瞬时转化表示所引入的组合物仅仅在生
物体中暂时表达或存在。
[0272] 用于将多核苷酸或多肽引入到植物中的方案可根据作为转化目标的植物或者植物细胞的类型(如单子叶植物或双子叶植物)而异。将多核苷酸和多肽引入到植物细胞中并
随后插入到植物基因组中的合适方法包括显微注射(Crossway等人,(1986)Biotechniques 
4:320-34,以及美国专利6,300,543)、分生组织转化(美国专利5,736,369)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA 83:5602-6)、农杆菌介导的转化(美国专利5,563,
055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J 3:2717-22),以及弹道粒子加速法(美国专利4,945,050;5,879,918;5,886,244;5,932,782;Tomes等人,(1995)″Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment″
inPlant Cell,Tissue,and Organ Culture:Fundamental Methods,Gamborg和Phillips编辑(Springer-Verlag,Berlin);McCabe等人,(1988)Biotechnology 6:923-6;Weissinger等人,(1988)Ann Rev Genet 22:421-77;Sanford等人,(1987)Particulate Science and Technology 5:27-37(洋葱);Christou等人,(1988)Plant Physiol 87:671-4(大豆);
Finer和McMullen,(1991)In Vitro Cell Dev Biol 27P:175-82(大豆);Singh等人,
(1998)Theor Appl Genet 96:319-24(大豆);Datta等人,(1990)Biotechnology 8:736-40(稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA 85:4305-9(玉米);Klein等人,(1988)Biotechnology 6:559-63(玉米);美国专利5,240,855;5,322,783和5,324,646;Klein等人,(1988)Plant Physiol 91:440-4(玉米);Fromm等人,(1990)Biotechnology 8:833-9(玉米);Hooykaas-Van Slogteren等人,(1984)Nature 311:763-4;美国专利5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA84:5345-9(百合科(Liliaceae));De Wet等人,(1985)The Experimental Manipulation of Ovule Tissues,Chapman等人编辑
(Longman,New York),第197-209页(花粉);Kaeppler等人,(1990)Plant Cell Rep 9:415-
8和Kaeppler等人,(1992)Theor Appl Genet 84:560-6(触须介导的转化);D′Halluin等人,(1992)Plant Cell 4:1495-505(电穿孔);Li等人,(1993)Plant Cell Rep 12:250-5;
Christou和Ford(1995)Annals Botany 75:407-13(稻),以及Osjoda等人,(1996)Nat 
Biotechnol 14:745-50(玉米,通过根瘤农杆菌(Agrobacterium tumefaciens))。
[0273] 另选地,可通过使植物与病毒或者病毒核酸接触来将多核苷酸引入植物。一般地讲,这种方法涉及将多核苷酸掺入在病毒DNA或RNA分子内。在一些示例中,感兴趣的多肽可最初作为病毒聚蛋白的一部分合成,其以后可通过体内或体外蛋白水解加工而产生所需的
重组蛋白。涉及病毒DNA或者RNA分子的、用于将多核苷酸引入植物并表达其中所编码的蛋
白质的方法是已知的,参见例如美国专利5,889,191、5,889,190、5,866,785、5,589,367和
5,316,931。瞬时转化方法包括但不限于将多肽诸如双链断裂诱导剂直接引入生物体、引入多核苷酸诸如DNA和/或RNA多核苷酸、以及将RNA转录物诸如编码双链断裂诱导剂的mRNA引
入生物体。此类方法包括例如显微注射法或粒子轰击法。参见例如Crossway等人,(1986)
Mol Gen Genet 202:179-85;Nomura等人,(1986)Plant Sci 44:53-8;Hepler等人,(1994)Proc.Natl.Acad.Sci.USA 91:2176-80;以及Hush等人,(1994)J Cell Sci 107:775-84。
[0274] 术语“双子叶植物”是指也称为“双子叶植物纲”的被子植物的亚类并且包括提及整株植物、植物器官(例如,叶、茎、根等)、种子、植物细胞及其子代。本文所用的植物细胞包括但不限于种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、苗、配子体、孢子体、花粉和小孢子。
[0275] 在本发明的上下文中的术语“杂交的”或“杂交”或“正在杂交”意指配子通过授粉而融合以产生子代(即,细胞、种子或植物)。该术语涵盖有性杂交(一株植物由另一株植物授粉)和自交(自花授粉,即,当花粉和胚珠(或者小孢子和大孢子)来自相同植物或遗传上相同的植物时)。
[0276] 术语“基因掺入”是指遗传基因座的所需等位基因从一种遗传背景传递到另一种遗传背景。例如,所需等位基因在特定基因座的基因掺入能够通过两个亲本植株间的有性
杂交被传递到至少一个子代植株,其中至少一个亲本植株在其基因组中具有所需等位基
因。另选地,例如等位基因的传递能够通过两个供体基因组之间的重组而发生,例如在融合原生质体中,其中至少其中一个供体原生质体在其基因组中具有所需等位基因。所需等位
基因可为例如转基因、经修饰(经突变或编辑)天然等位基因,或者所选择的标记或QTL的等位基因。
[0277] 标准的DNA分离、纯化、分子克隆、载体构建和验证/表征方法是已建立的,参见例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual,(Cold Spring Harbor Laboratory Press,NY)。载体和构建体包括含有感兴趣的多核苷酸和任选其它组
分的环状质粒和线性多核苷酸,所述其它组分包括连接子、衔接子、调控区、内含子、限制位点、增强子、隔离子、选择性标记、感兴趣的核苷酸序列、启动子和/或其它有助于载体构建或者分析的位点。在一些示例中,识别位点和/或靶位点可包含在内含子、编码序列、5′UTR、
3′UTR和/或调控区内。
[0278] 本发明还提供了表达构建体,所述表达构建体用于在酵母或植物、植物细胞或植物部分中表达能够结合到靶位点并在靶位点中产生双链断裂的向导多核苷酸/Cas系统。在
一个实施方案中,本发明的表达构建体包含可操作地连接至编码Cas基因的核苷酸序列的
启动子以及可操作地连接至本发明的向导多核苷酸的启动子。该启动子能够驱动可操作地
连接的核苷酸序列在植物细胞中的表达。
[0279] 启动子是参与RNA聚合酶和其它蛋白质的识别和结合以引发转录的DNA区域。植物启动子是能够在植物细胞中引发转录的启动子,有关植物启动子的综述参见Potenza等人,(2004)In Vitro Cell Dev Biol 40:1-22。组成型启动子包括例如Rsyn7启动子的核心启
动子以及WO99/43838和美国专利6,072,050中公开的其它组成型启动子;核心CaMV 35S启
动子(Odell等人,(1985)Nature 313:810-2);稻肌动蛋白(McElroy等人,(1990)Plant 
Cell 2:163-71);泛素(Christensen等人,(1989)Plant Mol  Biol 12:619-32;
Christensen等人,(1992)Plant Mol Biol 18:675-89);pEMU(Last等人,(1991)Theor 
Appl Genet 81:581-8);MAS(Velten等人,(1984)EMBO J 3:2723-30);ALS启动子(美国专利5,659,026)等。其它组成型启动子在例如美国专利5,608,149;5,608,144;5,604,121;5,
569,597;5,466,785;5,399,680;5,268,463;5,608,142和6,177,611中有所描述。在一些示例中,可使用诱导型启动子。病原体感染后被诱导的病原体诱导型启动子包括但不限于那
些调节PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等的表达的启动子。
[0280] 可将化学调控启动子用于通过施用外源化学调控剂来调节基因在植物中的表达。该启动子可以是化学诱导启动子,其中化学剂的施加可诱导基因表达,或者是化学阻遏型
启动子,其中化学剂的施加可阻遏基因表达。化学诱导型启动子包括但不限于玉米In2-2启动子,其由苯磺酰胺除草剂安全剂激活(De Veylder等人,(1997)Plant Cell Physiol 38:
568-77);玉米GST启动子(GST-II-27,WO93/01294),其由用作萌前除草剂的疏水亲电子化合物激活;以及烟草PR-1a启动子(Ono等人,(2004)Biosci Biotechnol Biochem 68:803-
7),其由水杨酸激活。其它化学调控的启动子包括甾类化合物响应性启动子(参见例如糖皮质激素诱导型启动子(Schena等人,(1991)Proc.Natl.Acad.Sci.USA 88:10421-5;
McNellis等人,(1998)Plant J 14:247-257);四环素诱导型和四环素阻遏型启动子(Gatz等人,(1991)Mol Gen Genet 227:229-37;美国专利5,814,618和5,789,156)。
[0281] 组织优选的启动子可用来靶向特定植物组织内的增强的表达。组织优选的启动子包括例如Kawamata等人,(1997)Plant Cell Physiol 38:792-803;Hansen等人,(1997)Mol Gen Genet 254:337-43;Russell等人,(1997)Transgenic Res 6:157-68;Rinehart等人,(1996)Plant Physiol 112:1331-41;Van Camp等人,(1996)Plant Physiol 112:525-35;
Canevascini等人,(1996)Plant Physiol 112:513-524;Lam,(1994)Results Probl Cell Differ 20:181-96;以及Guevara-Garcia等人,(1993)Plant J 4:495-505。叶优选的启动子包括例如Yamamoto等人,(1997)Plant J 12:255-65;Kwon等人,(1994)Plant Physiol 
105:357-67;Yamamoto等人,(1994)Plant Cell Physiol 35:773-8;Gotor等人,(1993)Plant J 3:509-18;Orozco等人,(1993)Plant Mol Biol 23:1129-38;Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA 90:9586-90;Simpson等人,(1958)EMBO J 4:2723-9;
Timko等人,(1988)Nature 318:57-8。根偏好的启动子包括(例如)下列文献中提出的那些:
Hire等人,(1992)Plant Mol Biol 20:207-18(大豆根特异性谷氨酰胺合成酶基因);Miao等人,(1991)Plant Cell 3:11-22(胞质谷氨酰胺合成酶(GS));Keller和Baumgartner,
(1991)Plant Cell 3:1051-61(法国菜豆的GRP 1.8基因中的根特异性控制元件);Sanger
等人,(1990)Plant Mol Biol 14:433-43(根瘤农杆菌甘露氨酸合酶(MAS)的根特异性启动子);Bogusz等人,(1990)Plant Cell 2:633-41(从榆科山黄麻(Parasponia andersonii)和鸡屎藤山麻黄(Trema tomentosa)分离的根特异性启动子);Leach和Aoyagi,(1991)
Plant Sci 79:69-76(毛根农杆菌(A.rhizogenes)rolC和rolD根诱导基因);Teeri等人,
(1989)EMBO J 8:343-50(农杆菌创伤诱导的TR1′和TR2’基因);VfENOD-GRP3基因启动子(Kuster等人,(1995)Plant Mol Biol 29:759-72);以及rolB启动子(Capana等人,(1994)Plant Mol Biol 25:681-91);菜豆素基因(Murai等人,(1983)Science 23:476-82;
Sengopta-Gopalen等人,(1988)Proc.Natl.Acad.Sci.USA 82:3320-4)。还可参见美国专利
5,837,876、5,750,386、5,633,363、5,459,252、5,401,836、5,110,732和5,023,179。
[0282] 种子优选的启动子包括种子发育过程中活跃的种子特异性启动子和在种子萌发过程中活跃的种子萌发启动子。参见Thompson等人,(1989)BioEssays 10:108。种子优选的启动子包括但不限于Cim1(细胞分裂素诱导信息);cZ19B1(玉米19kDa玉米醇溶蛋白);以及milps(肌醇-1-磷酸合酶);(WO00/11177和美国专利6,225,529)。对于双子叶植物,种子优选的启动子包括但不限于豆类β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等。对于单子叶植物,种子优选地启动子包括但不限于玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDaγ玉米醇溶蛋白、糯性蛋白、超甜蛋白1、超甜蛋白2、球蛋白1、油质蛋白、以及nuc1。另参见WO00/12733,其中公开了来自END1和END2基因的种子偏好启动子。
[0283] 表型标记是可筛选或可选择的标记,其包括可视标记和选择性标记,无论它是阳性还是阴性的选择性标记。可使用任何表型标记。具体地,可选择的或可筛选的标记包含这样的DNA区段,该DNA区段使得可以常常在特定条件下鉴定或选取或者不选取含有它的分子
或细胞。这些标记可编码活性,诸如但不限于RNA、肽或蛋白质的产生,或者可为RNA、肽、蛋白质、无机和有机化合物或组合物等提供结合位点。
[0284] 选择性标记的示例包括但不限于包含限制性酶位点的DNA区段;编码提供对于有毒化合物的抗性的产物的DNA区段,所述有毒化合物包括抗生素,诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外缺乏受体细胞的产物的DNA区段(例如,tRNA基因、营养缺陷标记);编码可易于鉴定的产物的DNA区段(例如,表型标记,诸如β-半乳糖苷酶、GUS;荧光蛋白,诸如绿色荧光蛋白(GFP),青色荧光蛋白(CFP),黄色荧光蛋白(YFP),红色荧光蛋白(RFP),以及细胞表面蛋
白);产生用于PCR的新引物位点(例如,之前尚未并置的两个DNA序列的并置)的DNA区段;包含未受限制性内切核酸酶或其他DNA修饰酶、化学品等作用或受其作用的DNA序列的DNA区
段;以及包含特异性修饰(例如,甲基化)所需的DNA序列的DNA区段,该特异性修饰使得可以鉴别该DNA序列。
[0285] 另外的选择性标记包括能赋予对除草化合物如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸(2,4-D)的抗性的基因。参见例如Yarranton,(1992)Curr Opin Biotech 3:
506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA 89:6314-8;Yao等人,
(1992)Cell 71:63-72;Reznikoff,(1992)Mol Microbiol 6:2419-22;Hu等人,(1987)Cell 
48:555-66;Brown等人,(1987)Cell 49:603-12;Figge等人,(1988)Cell 52:713-22;
Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-4;Fuerst等人,(1989)
Proc.Natl.Acad.Sci.USA 86:2549-53;Deuschle等人,(1990)Science 248:480-3;
Gossen,(1993)Ph.D.Thesis,University of Heidelberg;Reines等人,(1993)
Proc.Natl.Acad.Sci.USA 90:1917-21;Labow等人,(1990)Mol Cell Biol 10:3343-56;
Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA 89:3952-6;Baim等人,(1991)
Proc.Natl.Acad.Sci.USA 88:5072-6;Wyborski等人,(1991)Nucleic Acids Res 19:
4647-53;Hillen和Wissman,(1989)Topics Mol Struc Biol 10:143-62;Degenkolb等人,(1991)Antimicrob Agents Chemother 35:1591-5;Kleinschnidt等人,(1988)
Biochemistry 27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg;
Gossen等人,(1992)Proc.Natl.Acad.Sci.USA 89:5547-51;Oliva等人,(1992)Antimicrob Agents Chemother 36:913-9;Hlavka等人,(1985)Handbook of Experimental 
Pharmacology,第78卷(Springer-Verlag,Berlin);Gill等人,(1988)Nature 334:721-4。
[0286] 可采用常规条件将具有所引入的序列的细胞生长或再生成植物,参见例如McCormick等人,(1986)Plant Cell Rep 5:81-4。然后可使这些植株生长,并用相同转化株或者用不同转化株或未转化株进行授粉,并鉴定出具有所需特性和/或包含所引入的多核
苷酸或者多肽的所得子代。可生长两代或更多代以确保多核苷酸得到稳定保持和遗传,并
收获种子。
[0287] 可使用任何植物,包括单子叶植物和双子叶植物。可使用的单子叶植物的示例包括但不限于玉米(Zea mays)、稻(Oryza sativa)、裸麦(Secale cereale)、高粱(Sorghum bicolor、Sorghum vulgare)、粟(例如珍珠粟(Pennisetum glaucum)、黄米(Panicum 
miliaceum)、谷子(Setaria italica)、龙爪稷(Eleusine coracana))、小麦(Triticum 
aestivum)、甘蔗(Saccharum spp.)、燕麦(Avena)、大麦(Hordeum)、柳枝稷(Panicum 
virgatum)、菠萝(Ananas comosus)、香蕉(Musa spp.)、棕榈、观赏植物、草坪草和其它草类。可使用的双子叶植物的示例包括但不限于大豆(Glycine max)、卡诺拉(Brassica 
napus和B.campestris)、苜蓿(Medicago sativa)、烟草(Mcotiana tabacum)、拟南芥
(Arabidopsis thaliana)、向日葵(Helianthus annuus)、(Gossypium arboreum)和花生(Arachis hypogaea)、西红柿(Solanum lycopersicum)、马铃薯(Solanum tuberosum)等。
[0288] 经修饰的(突变的或经编辑的)天然DNA序列诸如EPSPS可包含一个或多个感兴趣的基因。这种感兴趣的基因可编码例如为植物提供农学优势的蛋白质。
[0289] 植物的标记辅助选择和育种
[0290] 在作物中开发分子标记的主要动力是通过标记辅助选择(MAS)在植物育种中提高效率的潜能。遗传标记等位基因,或另选地,数量性状基因座(QTL)等位基因用于识别植物,该植物在一个或多个基因座处包含所需基因型,并且预期将所需基因型连同所需表型转移
到其子代。遗传标记等位基因(或QTL等位基因)能够被用于鉴定在一个基因座或若干个不
连锁或连锁基因座处包含所需基因型的植物(例如单倍型),并且该植物预期将所需基因型
连同所需表型一起传递至它们的子代。应当理解,出于MAS的目的,术语标记可涵盖标记和QTL基因座两者。
[0291] 在确定所需表型和多态性染色体基因座(例如,标记基因座或QTL)同时分离之后,可以使用那些多态性基因座来选择对应于所需表型的等位基因-称为标记辅助选择(MAS)
的过程。简而言之,在来自待选择的植物的生物样本中检测对应于标记核酸的核酸。该检测可采取探针核酸与标记杂交的形式,例如使用等位基因特异性杂交、southern印迹分析、
northern印迹分析、原位杂交、引物的杂交然后是PCR扩增标记区域等。用于检测标记的各种程序是本领域中已知的。在生物样本中的特定标记的存在(或不存在)被验证之后,选择
植物,即,用于通过选择性育种形成子代植物。
[0292] 植物育种需要组合感兴趣的性状与用于高收率的基因以及其它所需性状以开发改良的植物品种。筛选大量样本可能是昂贵、耗时且不可靠的。使用标记和/或遗传连锁的核酸是用于在育种程序中选择具有所需性状的植物的有效方法。例如,经过田地评价的标
记辅助选择的一个优点在于,MAS可无论生长季节如何而在一年中的任何时候进行。此外,环境效应与标记辅助选择无关。
[0293] 当群体对于影响一个或多个性状的多个基因座进行分离时,MAS的效率与表型筛选相比变得甚至更高,这是因为所有基因座在实验室中可从DNA的单个样本一起处理。
[0294] 细胞的DNA修复机制是引入外源DNA或者在内源基因中诱导突变的基础。DNA同源重组是细胞使用同源序列修复DNA损伤的专DNA修复方式。在植物中,DNA同源重组发生频率过低而不能按常规用于基因靶向或编辑,后来发现该过程可通过DNA双链断裂刺激
(Bibikova等人,(2001)Mol.Cell Biol.21:289-297;Puchta和Baltimore,(2003)Science 
300:763;Wright等人,(2005)Plant J.44:693-705)。
[0295] 缩写的含义如下:“sec”表示秒,“min”表示分钟,“h”表示小时,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔,“mM”表示毫摩尔,“M”表示摩尔,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对,并且“kb”表示千碱基对。
[0296] 本文所公开的组合物和方法的非限制性示例如下:
[0297] 1.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
[0298] a)向包含EPSPS核苷酸序列的植物细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包
含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
[0299] b)由(a)的植物细胞获得植物;
[0300] c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
[0301] d)选择表现出草甘膦抗性的子代植物。
[0302] 2.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
[0303] a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
[0304] b)由(a)的植物细胞获得植物;
[0305] c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
[0306] d)选择表现出草甘膦抗性的子代植物。
[0307] 3.根据实施方案1-2中任一项所述的方法,其中所述多核苷酸修饰模板包含EPSPS核苷酸序列的非功能片段或部分片段。
[0308] 4.根据实施方案1-2中任一项所述的方法,其中所述靶位点位于所述EPSPS核苷酸序列内。
[0309] 5.根据实施方案1-2中任一项所述的方法,还包括选择不含所述向导RNA和Cas内切核酸酶的子代植物。
[0310] 6.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物的方法,所述方法包括:
[0311] a)获得植物或其种子,其中所述植物或所述种子在内源性EPSPS基因中包含修饰,所述修饰通过Cas内切核酸酶、向导RNA和多核苷酸修饰模板产生,其中所述植物或所述种
子对草甘膦具有抗性;以及
[0312] b)产生不含所述向导RNA和Cas内切核酸酶的子代植物。
[0313] 7.根据实施方案6所述的方法,还包括选择表现出草甘膦抗性的植物。
[0314] 8.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含TIPS编辑的EPSPS基因。
[0315] 9.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含K90R和TIPS编辑的EPSPS基因。
[0316] 10.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含IME和TIPS编辑的EPSPS基因。
[0317] 11.根据实施方案1-7中任一项所述的方法,其中所述突变植物包含T剪接的且TIPS编辑的EPSPS基因。
[0318] 12.根据实施方案1-11中任一项所述的方法,其中所述植物为单子叶植物或双子叶植物。
[0319] 13.根据实施方案12所述的方法,其中所述单子叶植物选自玉米、稻、高粱、裸麦、大麦、小麦、粟、燕麦、甘蔗、草坪草或柳枝稷。
[0320] 14.根据实施方案12所述的方法,其中所述双子叶植物选自大豆、卡诺拉、苜蓿、向日葵、棉、烟草、花生、马铃薯、烟草、拟南芥或红花。
[0321] 15.根据实施方案1-12中任一项所述的方法,其中所述向导RNA通过粒子轰击直接提供。
[0322] 16.根据实施方案1、3-12中任一项所述的方法,其中向所述细胞直接提供Cas内切核酸酶。
[0323] 17.根据实施方案1-12中任一项所述的方法,其中所述向导RNA通过粒子轰击或包含可操作地连接至植物U6聚合酶III启动子的对应的向导DNA的重组DNA构建体的农杆菌转
化来提供。
[0324] 18.根据实施方案1-17中任一项所述的方法,其中所述Cas内切核酸酶基因选自Cas9内切核酸酶或植物优化的Cas9内切核酸酶。
[0325] 19.根据实施方案18所述的方法,其中所述植物优化的Cas9内切核酸酶选自玉米优化的Cas9内切核酸酶和大豆优化的Cas9内切核酸酶。
[0326] 20.根据前述实施方案中任一项所述的方法,其中所述Cas9内切核酸酶由SEQ ID NO:105-110中的任一个、或其任何功能片段或变体编码。
[0327] 21.一种产生草甘膦抗性玉米植物的方法,所述方法包括提供玉米植物细胞,其中所述植物细胞的内源性染色体EPSPS基因已通过向导RNA/Cas内切核酸酶系统进行修饰以
产生草甘膦抗性EPSPS蛋白;以及由所述玉米植物细胞培育玉米植物,其中所述植物对草甘膦具有抗性。
[0328] 22.根据实施方案21所述的方法,其中所述玉米植物对1X草甘膦施用具有抗性。
[0329] 23.根据实施方案22所述的方法,其中所述内源性染色体EPSPS基因为预先存在的重组DNA。
[0330] 24.一种由实施方案1-23中任一项所述的方法产生的植物。
[0331] 25.一种由实施方案24所述的植物产生的种子。
[0332] 26.根据实施方案24所述的植物,其中所述植物对1X草甘膦施用具有抗性。
[0333] 27.一种向导RNA,其中所述可变靶向域靶向于植物EPSPS核苷酸序列的片段。
[0334] 28.根据实施方案27所述的向导RNA,其中所述可变靶向域靶向选自SEQ ID NO:12、13、14、60、61、83、84、96、97的植物靶位点。
[0335] 29.根据实施方案27所述的向导RNA,其中与所述向导RNA对应的DNA序列为SEQ ID NO:24。
[0336] 30.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
[0337] a)向包含EPSPS核苷酸序列的细胞提供向导RNA、Cas内切核酸酶和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述
EPSPS核苷酸序列的至少一个核苷酸修饰;以及
[0338] b)获得在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
[0339] 31.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
[0340] a)向包含Cas内切核酸酶和EPSPS核苷酸序列的植物细胞提供向导RNA和多核苷酸修饰模板,其中所述Cas内切核酸酶在所述植物细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
[0341] b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的植物细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
[0342] 32.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变细胞的方法,所述方法包括:
[0343] a)向包含EPSPS核苷酸序列的细胞提供能够表达向导RNA的第一重组DNA构建体、能够表达Cas内切核酸酶的第二重组DNA构建体、和多核苷酸修饰模板,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的
靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含所述EPSPS基因的非功能片段和
所述EPSPS核苷酸序列的至少一个核苷酸修饰;以及
[0344] b)鉴定在所述EPSPS核苷酸序列处具有至少一个核苷酸修饰的至少一个(a)的细胞,其中所述修饰包括所述EPSPS核苷酸序列中的一个或多个核苷酸的至少一个缺失、插入或置换。
[0345] 33.根据实施方案30-32中任一项所述的方法,其中所述多核苷酸修饰模板包含EPSPS核苷酸序列的非功能片段或部分片段。
[0346] 34.根据实施方案30-32中任一项所述的方法,其中所述靶位点位于所述EPSPS核苷酸序列内。
[0347] 35.一种用于复制细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)基因片段的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞
的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含EPSPS基因片段的
至少一个拷贝。
[0348] 36.一种用于替换细胞中的第一烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)启动子序列的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能
够在所述细胞的所述基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含
不同于所述第一EPSPS启动子序列的第二启动子或第二启动子片段。
[0349] 37.根据实施方案36所述的方法,其中所述第一EPSPS启动子序列的替换导致以下情况中的任一种或以下情况的任一组合:细胞层中增加的启动子活性、增加的启动子组织
特异性、降低的启动子活性、降低的启动子组织特异性、新的启动子活性、诱导型启动子活性、延长的基因表达窗、或者基因表达的时机或发育进度的修饰。
[0350] 38.根据实施方案36所述的方法,其中所述第二启动子或第二启动子片段是玉米泛素启动子。
[0351] 39.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入调控元件的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内
切核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含待
插入到所述EPSPS核苷酸序列中的调控元件。
[0352] 40.根据实施方案39所述的方法,其中插入所述调控元件导致下列情况中的任一种或下列情况的任一组合:启动子活性增加、启动子的组织特异性增加、启动子活性降低、启动子的组织特异性降低、新的启动子活性、诱导型启动子活性、基因表达窗延长、出现与基因表达的时机或发育进度有关的修饰、DNA结合元件突变、或添加了DNA结合元件。
[0353] 41.根据实施方案30-32中任一项所述的方法,其中所述多核苷酸修饰模板包含至少一个内含子介导的增强子基序。
[0354] 42.根据实施方案30-32中任一项所述的方法,其中所述多核苷酸修饰模板包含不同于天然EPSPS编码序列的至少一个剪接位点。
[0355] 43.一种用于在细胞中的烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)核苷酸序列中插入内含子的方法,所述方法包括向所述细胞提供向导RNA、多核苷酸修饰模板和Cas内切
核酸酶,其中所述向导RNA和Cas内切核酸酶能够形成复合物,该复合物使Cas内切核酸酶能够在所述细胞的基因组中的靶位点处引入双链断裂,其中所述多核苷酸修饰模板包含内含
子序列。
[0356] 44.根据实施方案30-32中任一项所述的方法,其中所述EPSPS核苷酸序列选自天然EPSPS基因序列的部分片段、EPSPS启动子序列、EPSPS终止子序列、EPSPS调控序列、以及EPSPS编码序列、EPSPS剪接序列、EPSPS聚泛素化序列以及EPSPS内含子序列。
[0357] 45.根据实施方案30-32中任一项所述的方法,其中所述EPSPS核苷酸序列的所述至少一个核苷酸修饰位于所述Cas内切核酸酶的所述靶位点之外。
[0358] 46.根据实施方案30-32中任一项所述的方法,其中所述EPSPS核苷酸序列的所述至少一个核苷酸修饰位于所述Cas内切核酸酶的所述靶位点之内。
[0359] 47.根据实施方案30-47中任一项所述的方法,其中所述细胞是植物细胞。
[0360] 48.根据实施方案47所述的方法,其中植物细胞选自单子叶植物和双子叶植物细胞。
[0361] 49.根据实施方案48所述的方法,其中植物细胞选自玉米、稻、高粱、黑麦、大麦、小麦、粟、燕麦、甘蔗、草坪草、柳枝稷、大豆、卡诺拉、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥、和红花细胞。
[0362] 50.一种由实施方案30-32中任一项所述的方法产生的植物细胞。
[0363] 51.一种由实施方案50所述的植物细胞产生的植物或子代植物,其中所述植物或子代植物表现出草甘膦抗性。
[0364] 52.一种草甘膦抗性玉米植物,其中玉米植物包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中玉米植物不表达草甘膦敏感性EPSPS多肽。
[0365] 53.一种草甘膦抗性玉米植物细胞,其中玉米植物细胞包含编码草甘膦抗性EPSPS多肽的内源性EPSPS多核苷酸序列,并且其中内源性EPSPS多核苷酸序列存在于与相应野生
型对照相比相同的染色体位置。
[0366] 54.一种用于产生烯醇式丙酮基莽草酸-3-磷酸合酶(EPSPS)突变植物细胞的方法,所述方法包括:
[0367] a)EPSPS密码子区域的编辑;或者
[0368] b)天然EPSPS基因的复制;或者
[0369] c)调控序列修饰;或者
[0370] d)EPSPS基因聚泛素化位点的编辑;或者
[0371] e)编辑内含子元件;或者
[0372] f)编辑或修饰剪接位点;或者
[0373] g)终止子修饰;或者
[0374] h)引入替代的剪接位点;或者
[0375] i)氨基酸和/或蛋白质融合;或者
[0376] j)(a)-(j)的任一组合;
[0377] 其中所述方法包括向包含EPSPS核苷酸序列的植物细胞提供至少一个向导RNA、至少一个Cas内切核酸酶、以及任选地多核苷酸修饰模板或供体DNA,其中所述至少一个向导
RNA和至少一个Cas内切核酸酶能够形成复合物,所述复合物使所述Cas内切核酸酶能够识
别、结合且任选地裂解所述植物细胞的基因组中的至少一个靶位点,其中所述多核苷酸修
饰模板包含所述EPSPS核苷酸序列的至少一个核苷酸修饰;
[0378] b)由(a)的植物细胞获得植物;
[0379] c)评估(b)的植物中是否存在所述至少一个核苷酸修饰;以及
[0380] d)选择表现出草甘膦抗性的子代植物。
[0381] 55.根据实施方案54所述的方法,还包括由所述植物细胞获得植物、评估所述植物中是否存在所述至少一个核苷酸修饰、以及选择表现出草甘膦抗性的子代植物。
[0382] 实施例
[0383] 在以下实施例中,除非另行指出,否则份数和百分比均按重量计,并且度数的单位都是摄氏度。应该理解,尽管这些实施例说明了本发明的实施方案,但仅是以例证的方式给出的。根据上文的论述内容和下文的实施例,本领域技术人员能够对本发明做出各种变化和修改,使其适用于各种用途和条件。此类修改形式也旨在落入所附实施方案的范围内。
[0384] 实施例1
[0385] 以玉米植株中的基因组修饰为基础的向导RNA/Cas内切核酸酶的表达盒
[0386] 本文所述的向导RNA/Cas内切核酸酶系统基于II型CRISPR/Cas系统,由Cas内切核酸酶与向导RNA(或双工crRNA和tracrRNA)组成;其中Cas内切核酸酶与向导RNA可一起形成
复合物,该复合物可识别植物的基因组靶位点,然后向该靶位点引入双链断裂(2013年8月
22日提交的美国专利申请61/868706)。
[0387] 为了检测玉米中的向导RNA/Cas内切核酸酶系统,步骤如下:首先,将来自酿脓链球菌M1 GAS(SF370)的Cas9基因(SEQ ID NO:1)按本领域已知的标准技术进行玉米密码子
优化,然后引入马铃薯ST-LS1内含子(SEQ ID NO:2),使该Cas9基因不能在大肠杆菌
(E.coli)和农杆菌(Agrobacterium)中表达(参见图1A)。为有利于Cas9蛋白在玉米细胞中
核定位,我们分别在Cas9开放阅读框的氨基和羧基末端引入了猿猴病毒40(Simian virus 
40)(SV40)单分型氨基末端核定位信号(MAPKKKRKV,SEQ ID NO:3)和根癌农杆菌
(Agrobacterium tumefaciens)双分型VirD2 T-DNA边界内切核酸酶羧基末端核定位信号
(KRPRDRHDGELGGRKRAR,SEQ ID NO:4)(图2A)。采用标准分子生物学技术将玉米优化Cas9基因可操作地连接至玉米组成型或调控型启动子。图2A示出了玉米优化Cas9表达盒的一个示
例(SEQ ID NO:5)。图2A所示的玉米优化Cas9基因包含ST-LS1内含子、SV40氨基末端核定位信号(NLS)以及由植物泛素启动子驱动的VirD2羧基末端NLS。
[0388] 针对基因组工程应用,形成功能性向导RNA/Cas内切核酸酶系统所必需的第二成分是crRNA和tracrRNA分子的双链体(图1A)、或crRNA和tracrRNA分子的融合,被称为单链
向导RNA(图1B)。为赋予玉米有效表达向导RNA(或有效表达双工crRNA/tracrRNA)的能力,
分离出了存在于8号染色体上的玉米U6聚合酶III启动子(SEQ ID NO:9)和玉米U6聚合酶
III终止子(SEQ ID NO:10中前8个碱基),并采用标准分子生物学技术将它们可操作地融合至向导RNA的末端(图2D)。示例性表达盒在图2D中示出,其示出了驱动单链向导RNA表达的
玉米U6聚合酶III启动子,该单链向导RNA的末端为U6聚合酶III终止子。
[0389] 如图3A所示,向导RNA(或crRNA分子)还包含与双链DNA靶标的一条链互补的区域(称为可变靶向域),其长度为约12至30个核苷酸,位于用来识别并切割靶位点的PAM序列上游(图3A中反义链上的5’NGG3’,对应于3A中正义链上的5’CCN3’)(Gasiunas等人(2012)Proc.Natl.Acad.Sci.USA 109:E2579-86;Jinek等人(2012)Science 337:816-21;Mali等人(2013)Science 339:823-26;Cong等人(2013)Science339:819-23。为有利于向crRNA或单链向导RNA表达构建体快速引入玉米基因组DNA靶序列,以反向串联取向(切割方向朝外)
引入了两个IIS型BbsI限制性内切核酸酶靶位点,具体操作参见Cong等人(2013)
Science339:819-23。IIS型限制性内切核酸酶在切割时,将其靶位点从crRNA或单链向导
RNA表达质粒切除,产生突出端,此时技术人员便能够把包含所需玉米基因组DNA靶位点的
双工寡核苷酸框内定向克隆进可变靶向域。在本实施例中,只用以鸟嘌呤核苷酸开头的靶
序列来促进单链向导RNA或crRNA的有利表达聚合酶III。
[0390] 然后,Cas内切核酸酶基因和单链向导RNA两者的表达使得形成了图3A中描绘的向导RNA/Cas复合物,该复合物能够将双链断裂引入Cas内切核酸酶靶位点。
[0391] 另选地,Cas内切核酸酶基因(图2A)、crRNA(图3B)、以及tracrRNA(图3C)的表达使得形成了crRNA/tracrRNA/Cas复合物,该复合物能够将双链断裂引入Cas内切核酸酶靶位点。
[0392] 实施例2
[0393] 向导RNA/Cas内切核酸酶系统通过非同源末端连接机制切割玉米中的染色体DNA并引入突变
[0394] 为检测实施例1描述的玉米优化的向导RNA/Cas内切核酸酶是否能够通过非同源末端连接(NHEJ)修复途径识别、切割玉米EPSPS基因并使其发生突变,使玉米epsps基因座
中的三个不同的基因组靶序列为切割靶标(参见表1),并通过深度测序技术检查是否存在
NHEJ突变。
[0395] 表1.单链向导RNA/Cas内切核酸酶系统靶向的玉米基因组靶位点
[0396]
[0397] EPSPS=烯醇式丙酮基莽草酸磷酸合酶基因
[0398] 通过粒子介导递送技术(参见实施例14),在存在BBM和WUS2基因的情况下,将玉米优化的Cas9内切核酸酶和单链向导RNA表达盒(包含特定的玉米可变靶向域)共递送到60至
90个Hi-II玉米未成熟胚芽中(2013年3月13日提交的美国专利申请13/800447)。
[0399] 在7天之后,合并20-30个最均匀转化的胚并且提取总基因组DNA。用 高保真度PCR主混合物(New England Biolabs,M0531L)对预期靶位点周围的区域进行PCR扩
增,将该主混合物添加到扩增子特异性条形码所必需的序列上,然后利用“加尾”引物,在两轮PCR过程中进行Illumnia测序。一级PCR反应使用的引物示于表2;二级PCR反应使用的引
物为AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG(正向,SEQ ID NO:15)和
CAAGCAGAAGACGGCATA(反向,SEQ ID NO:16)。
[0400] 表2.PCR引物序列
[0401]
[0402] 用Qiagen PCR纯化离心柱纯化PCR扩增产物,等摩尔比混合,采用基于Hoechst染料的荧光测定法测量浓度,再将扩增产物于Illumina MiSeq个人型测序系统中,用PhiX 
control v3(Illumina,FC-110-3001)以30%至40%(v/v)加标(用于抵消序列偏差),对100个核苷酸长的单个读段进行深度测序。只有那些读段长度≥1个核苷酸插入缺失(indel)
(在以预期切割位点为中心、且含10个核苷酸的窗口内),而且阴性对照中未见类似含量的
突变,才被归入NHEJ突变。具有相同突变的多个NHEJ突变读段被计数为单个读段,只计一
次;目视确认出现频率排名前十的那些突变都出现在预期的切割位点内。然后,使用目视确认的NHEJ突变总数,基于读段总数,计算一段长度适宜读段与条形码和正向引物完全匹配
的突变体读段的百分比(%)。
[0403] 通过深度测序,靶向三个EPSPS靶标(SEQ ID NO:12、13、14)的向导RNA/Cas内切核酸酶系统相比于仅cas9对照,NHEJ突变的恢复频率在表3中示出。此数据表明,本文所述的向导RNA/Cas内切核酸酶系统可用于在感兴趣的基因组位点处引入双链断裂。编辑EPSPS靶标可以产生对基于草甘膦的除草剂有耐受性和/或抗性的植株。
[0404] 表3.通过向导RNA/Cas系统在玉米烯醇式丙酮基莽草酸磷酸合酶靶基因座处产生的突变读段百分比(%)
[0405]
[0406] 合在一起,这些数据表明:本文所述的使用单链向导RNA表达盒的玉米优化的向导RNA/Cas内切核酸酶系统切割玉米染色体DNA,并且产生NHEJ突变。
[0407] 实施例3
[0408] 向导RNA/Cas内切核酸酶系统将双链断裂(DBS)递送到玉米epsps基因座,从而得到所需的点突变
[0409] 开发了两种玉米优化的Cas9内切核酸酶,评估它们在基因组靶序列处引入双链断裂的能力。第一玉米优化的Cas9内切核酸酶如图2A所示(实施例1和表达盒SEQ ID NO:5)。
第二玉米优化的Cas9内切核酸酶(moCas9内切核酸酶;SEQ ID NO:22(蛋白质)和23(DNA)),通过将信号添加到moCas9编码序列的5’端(图5),为该内切核酸酶补充SV40核定位信号。随后,为增强植物moCas9表达盒在玉米细胞中的表达并消除其在大肠杆菌和农杆菌中的表
达,通过将ST-LS1内含子插入到moCas9编码序列中,对植物moCas9表达盒进行修饰。玉米泛素启动子序列和马铃薯蛋白酶抑制剂II基因终止子序列与moCas9内切核酸酶基因设计互
补。moCas9表达盒的结构元件示于图5,其氨基酸序列和核苷酸序列作为SEQ ID No:22和23列出。
[0410] 单向导RNA(sgRNA)表达盒基本上如实施例1所述并且在图2D中示出。由U6聚合酶III玉米启动子(SEQ ID NO:9)及其同族U6聚合酶III终止序列(TTTTTTTT)组成。向导RNA
(SEQ ID NO:24)包含20个核苷酸长的可变靶向域(SEQ ID NO:24中第1至20位核苷酸),随后是能与诱导双链断裂的内切核酸酶相互作用的RNA序列。
[0411] EPSPS密码子序列内的玉米优化的Cas9内切核酸酶靶序列(moCas9靶序列)与向导sgRNA(确定Cas9内切核酸酶在EPSPS编码序列内切割的位点)的20个核苷酸长的可变序列
互补。
[0412] 合成moCAS9靶序列(SEQ ID NO:39中第25至44位核苷酸),并且将其克隆进向导RNA-Cas9表达载体,该载体被设计成通过农杆菌介导转化将向导RNA-Cas9系统的组分递送
到BMS(墨西哥黑甜玉米(Black Mexican Sweet))细胞。还利用农杆菌T-DNA递送了酵母FLP
位点特异性重组酶和WDV(小麦矮小病毒)复制相关蛋白(复制酶)。由于moCas9靶序列侧接
有FLP重组靶点(FRT),因而被玉米细胞中的FLP切除,形成附加体(染色体样)结构。这种环状DNA片段通过WDV复制酶(复制起点嵌入WDV启动子)进行复制,这使它们能够在大肠杆菌
细胞内恢复。如果玉米优化的Cas9内切核酸酶在moCas9靶序列处造成双链断裂,其修复便
可能产生突变。下列文献详细讲述了该过程:Lyznik,L.A.,Djukanovic,V.,Yang,M.和Jones,S.(2012)Double-strand break-induced targeted mutagenesis in plants.发表
于:Transgenic plants:Methods and Protocols(Dunwell,J.M.和Wetten,A.C.编辑).New York Heidelberg Dordrecht London:Springer,第399-416页。
[0413] 使用本文所述玉米优化的Cas9内切核酸酶之一的向导RNA/Cas9内切核酸酶系统在moCas9靶序列中产生双链断裂(表4)。表4示出使用SEQID NO:23的moCas9内切核酸酶或
SEQ ID NO:5的玉米优化的Cas9内切核酸酶在玉米BMS细胞中诱变的moCas9靶序列的百分
比。两种向导RNA/Cas内切核酸酶系统都在来自玉米BMS细胞且从其恢复的附加体DNA分子
上可用的67%至84%的moCas9靶序列处产生双链断裂(根据靶向诱变事件的数目判断)。经
诱变的EPSPS靶序列的样本示于图6。该观察结果表明,本文所述的玉米优化的Cas9内切核
酸酶在玉米细胞中起作用,并在moCas9靶序列处有效产生双链断裂。
[0414] 表4.玉米BMS细胞中由玉米优化的Cas9内切核酸酶诱变的moCas9靶序列的百分比
[0415]
[0416] 为完成玉米染色体EPSPS基因的靶向基因组编辑,在一个方面,创建多核苷酸修饰模板(SEQ ID NO:25),用于为编辑EPSPS编码序列提供遗传信息,并将该多核苷酸修饰模板与向导RNA/Cas9系统组分共递送。
[0417] 如图4所示,相比待编辑的天然EPSPS基因组序列,该多核苷酸修饰模板包含三个核苷酸修饰(用箭头指出)。这三个核苷酸修饰导致以下氨基酸改变:T-102改变为I-102,P-
106改变为S-106,所以被称为TIPS突变。第一点突变由密码子序列ACT中的C核苷酸被T核苷酸置换为T核苷酸引起;第二点突变由相同密码子序列ACT中的T核苷酸被C核苷酸置换,形
成异亮氨酸密码子(ATC)引起;第三点突变由密码子序列CCA中的第一C核苷酸被T核苷酸置
换,形成丝氨酸密码子TCA引起(图4)。如SEQ ID NO:26:atcgcaatgcggtca所示,前述两种密码子序列彼此相距不足9个核苷酸。这三种核苷酸修饰以粗体示出。两种密码子之间的核苷酸与epsps基因座上未编辑的天然EPSPS基因是同源的。该多核苷酸修饰模板还包含玉米
EPSPS基因组序列的DNA片段,这些DNA片段在EPSPS基因编辑过程中用作同源序列。同源序
列的短臂(HR1-图4)为810个碱基对长,并且同源序列的长臂(HR2-图4)为2,883个碱基对长
(SEQ ID NO:25)。所用的EPSPS模板序列中没有一个编码功能EPSPS蛋白。
[0418] 在该实施例中,EPSPS多核苷酸修饰模板作为质粒(参见模板载体1,图7),采用粒子枪轰击法,与向导sgRNA表达盒和玉米优化的Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含实施例1中所述的玉米优化的Cas9内切核酸酶表达盒
(SEQ ID NO:5),并且还包含moPAT选择性标记基因。将10至11天龄未成熟胚芽的胚轴朝下置于装有N6培养基(表5)的板中,并且在28℃下温育4至6小时,再进行轰击。将这些板置于PDS-1000装置中底部起第三层搁架上,并且以200psi轰击。后轰击,在黑暗中于28℃温育胚芽过夜,然后转移至装有N6-2培养基的板中,在28℃下培养6至8天。将胚芽转移到装有N6-3培养基的板中培养3周,然后转移相应的愈伤组织至装有N6-4培养基的板中,再进行三周选择培养。经共计六周28℃选择培养后,将少量所选组织转移到MS再生培养基上,并且在黑暗中于28℃温育三周。
[0419] 表5.培养基成分
[0420]
[0421]
[0422] 通过以下步骤提取DNA:将愈伤组织细胞样本、两个不锈珠和450μL提取缓冲液(250mM NaCl,200mM Tris-HCl(pH 7.4),25mM EDTA,4.2M盐酸胍)放入Mega滴定架的每个管中。将架子在1650r.p.m的Genogrinder中摇动60秒并且在4℃在3000×g下离心20分钟。
将300μl上清液转移到Unifilter 96孔DNA Binding GF/F Microplate(770-2810,
Whatman,GE Healthcare)的孔中。将微板置于多孔板真空歧管(5017,Pall Life 
Sciences)的顶部。施加真空压力,直到孔完全变干。用100μL提取缓冲液重复一遍真空过滤过程,然后用250μL洗涤缓冲液(50mM Tris-HCl(pH 7.4),200mM NaCl,70%乙醇)重复两遍真空过滤过程。通过将GF/F过滤板置于空的废液收集板上,除去残余乙醇,并且以3000×g
离心10min。在100μL洗脱缓冲液(10mM Tris-HCl,pH 8.3)中洗脱DNA,并且以3000×g离心
1min。每个样本进行四次不同的PCR反应(F-E2、F-T、H-T和F-E3)。在20μl总体积中,包含大约40ng基因组DNA、10μl REDExtract-N-Amp PCR ReadyMix(R4775,Sigma-Aldrich Co.)和
5皮摩尔每种引物。每个PCR反应的引物组合列于表6中。
[0423] 表6.PCR反应的引物组合
[0424]
[0425]
[0426] 对五个得自未转化玉米近交小植株的基因组DNA样本进行同样的PCR反应。在95℃初始变性5分钟后,使用DNA Engine Tetrad2热循环仪(BioRad Laboratories,Hercules,CA)进行每个PCR扩增,每次扩增执行35个以上循环:94℃变性30s,68℃退火30s,72℃延伸
1min。将PCR产物F-E2、F-T和H-T与100bp DNA Ladder(N0467S,NewEngland Biolabs)在1%琼脂糖凝胶中以100伏特分离45分钟。为进行测序,使用TOPO TA克隆试剂盒(Invitrogen 
Corp,Carlsbad,CA)将来自所选择的愈伤组织的F-E3 PCR扩增片段克隆到pCR 2.1-TOPO载体中。在ABI 3700毛细管测序仪(Applied Biosystems,Foster City,CA)上,用BigDye 
Terminator chemistry进行DNA测序。每个样本包含约0.5μg Topo质粒DNA和6.4皮摩尔引
物E3-EPex3 Rev(ACCAAGCTGCTTCAATCCGACAAC,SEQ ID NO:34)。使用测序仪程序对序列进行分析。
[0427] 筛选在包含双丙氨磷的培养基上选择的31个愈伤组织事件的样本(moPAT选择性标记基因为向导RNA-moCas9表达载体的一部分)是否存在TIPS点突变。24个事件包含已整
合到基因组DNA中的TIPS点突变(图8,F-E2处理)。其中,6个事件显示染色体EPSPS基因的
PCR扩增产物具有TIPS突变(图8,H-T处理)。PCR引物对(其中一个引物可与EPSPS多核苷酸
修饰模板上没有的epsps基因组序列杂交,并且另一个引物结合到存在于EPSPS多核苷酸修
饰模板上的经编辑的EPSPS序列)将epsps-TIPS编辑产物与野生型EPSPS等位基因或TIPS突
变的随机插入区分开。如果编辑一个EPSPS等位基因以包含TIPS置换,则无论在PCR扩增过
程期间是否选择TIPS置换,这种经编辑的等位基因都应被检测为源自基因组epsps基因座
的DNA片段。用野生型EPSPS引物替换TIPS引物(表6,F-E3引物对),并且将PCR扩增产物克隆进TOPO克隆载体,然后测序。测序数据代表所选事件之一中基因组epsps基因座序列的随机样本(图9,愈伤组织A12 3360.92)。图9示出,在不改变任何其它epsps核苷酸的情况下,本文所公开的方法使得成功编辑了三种负责TIPS突变的核苷酸(图9中以粗体示出),同时未
诱变moCas9靶序列(向导RNA的结合位点在图9中加下划线)。
[0428] 另外,其它EPSPS等位基因未被编辑,表明在该特定事件中只编辑了一个EPSPS等位基因(图9B)。
[0429] 实施例4
[0430] 向导RNA/Cas内切核酸酶系统将双链断裂递送到玉米epsps基因座,导致玉米植株含有经编辑的epsps-TIPS基因
[0431] 如实施例3所述产生并选择EPSPS基因编辑事件。概括地说,EPSPS多核苷酸修饰模板作为质粒(参见模板载体1,图7),采用粒子枪轰击法,与向导RNA表达盒和玉米优化的
Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含实施例1
所述的玉米优化的Cas9内切核酸酶表达盒(SEQ ID NO:5),并且还包含moPAT选择性标记基因。
[0432] 在28℃下选择培养6周后,将少量所选择的组织转移到MS再生培养基上,并且在黑暗中于28℃下温育3周。3周后,将可见苗转移到包含MS-1培养基的平板上,并且在26℃下光照培养1至2周,直至苗生长至适宜送入温室,然后将其转移至平地土壤。Ms-1培养基包含:
4.3g/L MS盐(Gibco 11117),5.0ml/L MS维生素原液(Sigma M3900),100mg/L肌醇,40.0g/L蔗糖,和6.0g/L细菌用琼脂(pH 5.6)。
[0433] 采用上述程序,由3282个胚芽培育出了390株T0玉米植株,因此,转化总效率为12%,这进一步表明本文所用的向导RNA/Cas系统只产生较低毒性或无毒性(表7)。
[0434] 表7.EPSPS编辑的转化效率。
[0435]
[0436]
[0437] 将T0小植株移至温室7至10天后,从每个T0小植株提取DNA,如实施例3所述进行PCR程序,以筛选T0植株在epsps基因座处是否有突变。
[0438] 如实施例3所述的终点PCR程序测定,所分析的T0植株中的72%(270/375,表8)包含经诱变EPSPS等位基因。大多数突变(230/375或89%)是易错非同源末端连接(NHEJ)造成
的,然而40株T0植株(40/375或11%)包含TIPS编辑的epsps等位基因,这表明涉及模板化双链断裂修复机制(表8)。
[0439] 表8.epsps基因座处的突变
[0440]
[0441] 用引物对(表6,F-E3引物对)来扩增包含来自所选择的T0植株基因组DNA的moCas6靶序列和EPSPS编辑位点的epsps基因座的天然同源片段。将PCR扩增产物克隆进TOPO克隆
载体,并且如实施例3所述进行测序。测序数据表示来自特定T0植株的基因组epsps基因座
序列的随机样本(表9),并且还指明所选择的T0植株的基因型。转移到盆中的含epsps-TIPS等位基因的T0植株列于表9中(选自初始40个含TIPS事件的一组T0植株)。
[0442] 表9.在T0植株中观察到的epsps基因座的基因型。TIPS是指包含TIPS编辑的epsps序列的克隆。NHEJ是指存在NHEJ突变;并且WT是指存在由天然epsps基因座扩增的野生型
EPSPS序列。
[0443]
[0444]
[0445] 如表9所示,所选择的植株E1以及E3至E9包含epsps-TIPS编辑型式的EPSPS基因,要么随附野生型EPSPS等位基因(WT),要么随附NHEJ诱变的epsps等位基因(NHEJ)。表9中
TIPS、WT、NHEJ前的数字指明鉴定特定型式EPSPS等位基因的频率。如果所有克隆都包含
TIPS编辑的EPSPS序列,则所分析的植株可能是epsps-TIPS等位基因纯合植株(参见例如
E2)。如果仅约50%的克隆包含TIPS编辑的epsps序列,则所分析的植株可能是epsps-TIPS
等位基因半合植株(参见例如E1)。其它植株(诸如E3或E4)可能是TIPS嵌合植株。在一个事
件E2中,T0植株在epsps基因座处仅包含TIPS编辑的序列,这表明,本文公开的向导RNA/Cas内切核酸酶系统在玉米植株中epsps基因座处成功编辑了负责两个epsps-TIPS等位基因的
三个核苷酸(图9B中以粗体示出)。
[0446] 对所选择的T0植株执行qPCR分析,以估计野生型EPSPS基因和moCas9内切核酸酶序列的拷贝数。对于来自T0植株的DNA样本,进行玉米EPSPS基因和ADH持家基因的多重qPCR扩增。PCR反应所用的引物和探针示于表10。
[0447] 表10.用于T0植株qPCR分析的引物
[0448]
[0449] 所有分析都是使用LightCycler 480实时PCR系统(Roche Diagnostics)进行的。将wtEPSPS基因型的阈值设定为1.76。将EPSPS拷贝数小于1.76,终点荧光测量值最高也不
足野生型对照两倍的每种样本归类为一种等位基因EPSPS基因型(相对野生型EPSPS等位基
因为半合子)。
[0450] 采用qPCR方法估计TIPS序列拷贝数。qPCR反应所用的引物和探针示于表11。
[0451] 表11.qPCR分析中为估计TIPS序列拷贝数而使用的引物
[0452]
[0453] 将具有ΔCt值的比较Ct值法归一化为双等位基因TIPS基因型的平均ΔCt值,提供了对所分析植株样本中检测到的TIPS序列的拷贝数估计。
[0454] 表12:所选择的T0植株的qPCR基因分型和拷贝数。
[0455]
[0456] qPCR基因分型表明,在所选择的T0植株的事件E1、E2、E7、E8和E9中未检测到野生型EPSPS等位基因(野生型EPSPS等位基因数目,表12)。所选择的T0植株中存在TIPS模板序列和moCas9编码序列两者,据推测,这是由于与转化过程相关联的随机插入所致(表12:就TIPS模板序列而言,T0植株的E1、E7和E9事件)。如果两种遗传元件(随机插入的TIPS模板和moCas9表达盒)并非都连接至编辑的epsps-TIPS基因,则可采用标准育种程序在T1子代中
将这两种遗传元件分离。
[0457] T0植株在温室中生长良好,并可繁殖。使用设定为每英亩20加仑的喷雾室,用1X剂量草甘膦喷洒处于V3生长阶段的T0植株样本。1X剂量草甘膦如下制备:将2.55ml Powermax溶于300ml水(活性成分:草甘膦即N-(膦酰基甲基)甘氨酸的盐形式,48.7%)。施用草甘膦后第7天,一些T0植株未观察到叶组织损坏。这些小植株是epsps-TIPS等位基因半合植株,而其它小植株严重损坏。施用除草剂后第14天,观察到一棵植株的叶组织仍未出现损
坏,该植株在epsps基因座的44个基因组克隆中包含21个epsps-TIPS等位基因(如实施例3
所述克隆并测序)。该T0植株被称为在epsps基因座处半合的。
[0458] 这些数据表明,向导RNA/Cas系统可用于在玉米中产生TIPS编辑的EPSPS等位基因。还获得在epsps基因座处纯合(两个epsps-TIPS等位基因)且未插入附加的TIPS模板的
玉米植株(植株E2)。此外,一些epsps-TIPS编辑的玉米T0植株的确显示出对1X剂量草甘膦
具有一定程度耐受性。
[0459] 实施例5
[0460] 含有epsps-TIPS编辑的基因的玉米植株的F1子代的表征
[0461] 使如实施例3和4中所述产生和表征的含有一个或两个epsps-TIPS等位基因的两个T0植株(E1和E2)与野生型玉米亲本植株交叉授粉。收集种子,将其干燥并种植。针对wt-EPSPS、修饰EPSPS、Cas9和moPAT序列的存在对出苗的幼苗进行基因分型(表13)。“基因组TIPS”表示EPSPS基因的TIPS编辑的等位基因(阴性=TIPS修饰不存在,阳性=在epsps基因座处存在TIPS修饰),“Cas9 CDS”表示Cas9编码序列的诊断片段,“moPAT CDS”-选择性标记基因的诊断DNA片段,“TIPS序列”-含有TIPS编辑的序列的DNA片段的总数,“Wt EPSPS等位基因”-未经编辑或修饰的野生型EPSPS等位基因的数目。“阴性”是指未通过PCR扩增外源DNA片段。
[0462] 表13.分离出用于转化的载体DNA的遗传元件的F1子代玉米植株的列表
[0463]
[0464] 选择、培育含有一个野生型EPSPS等位基因和一个epsps-TIPS等位基因(在epsps基因座处半合)的F1子代植株诸如表13中的植株#3并使其自花授粉。收集F2种子。F2群体包含产生野生型F2植株、在epsps基因座处半合和纯合的F2植株的分离的EPSPS等位基因。
[0465] 实施例6
[0466] 来自所选的F1植株的F2子代的胚拯救
[0467] 在V3生长阶段,用300ml水中的2.55ml Powermax(草甘膦溶液)以20加仑/英亩的设置喷洒E1和E2亲本植株的F1植株子代的随机样本。含有epsps-TIPS编辑的等位基因的F1
植株在草甘膦施用中存活下来,而不含epsps-TIPS等位基因的其它F1植株表现出严重的叶
组织损伤(干枯、褐色叶子)。含有epsps-TIPS的植株的生长减慢并且随时间推移植株在新
萌发的叶子上生长出叶组织的发白节段。
[0468] 对于来自自交的F1植株的F2子代幼苗的胚拯救,在授粉18天后收获穗并将穗在20∶80漂白剂/水混合物中灭菌。将胚切下并放置在具有或没有0.1mM、0.5mM、1mM、3mM浓度的草甘膦的生根培养基(272V-4.3g/L Murashige和Skoog基础盐混合物,5.0ml/L MS维生素
原液、100mg/L肌醇(mio-inositol)、40g/L蔗糖、6g/L Bacto琼脂)上。将它们转移至26℃的明亮房间并且使其萌发7天。含有野生型EPSPS等位基因、对于epsps-TIPS等位基因半合和
纯合的胚在没有草甘膦的培养基上发芽。在培养基中的0.1mM草甘膦浓度下,只有含有
epsps-TIPS等位基因的胚产生绿色幼苗。epsps-TIPS等位基因在所分析幼苗中的存在指示
为“阳性”或“阴性”,而野生型EPSPS等位基因拷贝数在右侧列出示出(表14)。
[0469] 表14.在含有0.1、0.3、0.5、1.0和3.0mM草甘膦的培养基上发芽的F2幼苗的基因型[0470]
[0471]
[0472] 在含有0.1mM草甘膦或最高3mM的任何其它浓度的草甘膦的培养基上的发芽的胚中未检测到野生型幼苗。此外,在epsps基因座处对于epsps-TIPS等位基因纯合的胚在
1.0mM草甘膦浓度下产生绿色幼苗,而半合胚则不能。发芽的胚中草甘膦耐受性水平与经编辑的epsps-TIPS等位基因的存在以及它们的剂量(一个或两个等位基因)相关。
[0473] 实施例7
[0474] 使用向导RNA/Cas9系统编辑玉米EPSPS基因
[0475] 可使用EPSPS多核苷酸修饰模板在玉米epsps基因座中引入氨基酸置换。可合成EPSPS-多核苷酸修饰模板并使用对应的SphI和SpeI限制位点将其插入图7所述的模板载体
中。EPSPS多核苷酸修饰模板可作为质粒DNA使用粒子枪轰击法与向导RNA表达盒和玉米优
化的Cas9内切核酸酶表达载体一起共递送。
[0476] 可培育植株并分析其中是否存在氨基酸突变,如实施例3、4和5中所述。
[0477] 实施例8
[0478] 玉米EPSPS的变体
[0479] 除实施例3中所述的TIPS突变之外的降低草甘膦敏感性的EPSPS突变是本领域中已知的(US 8,436,159)并且也可引入(与TIPS结合或不结合)到玉米EPSPS基因中,如实施
例3所述。另外,可通过本领域技术人员已知的方法鉴定新型EPSPS突变。本文所述的向导多核苷酸/Cas内切核酸酶系统可用于在EPSPS基因中引入这些突变中的任一个、或这些突变
的任意组合并且可针对除草剂抗性对所得的玉米EPSPS变体进行评估。
[0480] 实施例9
[0481] 使用向导RNA/Cas9内切核酸酶系统复制天然EPSPS基因
[0482] 在玉米中存在一种天然EPSPS基因。实施例5中所述的F1子代植株在epsps-TIPS基因座处为半合的。具有EPSPS基因的两个功能拷贝的玉米植株积聚两倍于具有一个功能
EPSPS基因拷贝的植株的EPSPS蛋白(表15)。野生型ETX植株的叶片样本中EPSPS肽的量与在
epsps基因座处半合(一个EPSPS等位基因被敲除)的玉米植株相比增加了一倍。
[0483] 表15.在野生型和突变EPSPS玉米植株的叶片样本中鉴定的特征EPSPS肽的峰面积
[0484]
[0485] 可使用本文所述的向导RNA/Cas9内切核酸酶基因编辑程序,例如通过使用作为SEQ ID NO:54列出的EPSPS多核苷酸复制模板来复制天然EPSPS基因。该多核苷酸修饰模板的遗传元件在图11示出。实施例3和4所述的程序将TIPS置换引入EPSPS基因的两个拷贝中
并且由编辑性DNA模板(图11)拷贝天然EPSPS基因的复制片段。EPSPS-复制多核苷酸修饰模
板作为质粒DNA,采用粒子枪轰击法,与向导RNA表达盒和玉米优化的Cas9内切核酸酶表达
载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含本文所述的玉米优化的Cas9内
切核酸酶表达盒并且还包含moPAT选择性标记基因。在经编辑的epsps基因座处纯合的所得
F2玉米植株包含四个epsps-TIPS编码序列,可针对这些植株的植物组织中的升高的EPSPS-
TIPS蛋白水平对所述植株进行评估。
[0486] 实施例10
[0487] 玉米EPSPS天然基因的启动子修饰
[0488] 玉米细胞中的蛋白质积累随蛋白编码基因的转录活性变化。EPSPS启动子是弱转录控制遗传元件,而源自一组不同的植株的泛素启动子已知是高活性且强效的。EPSPS多核苷酸玉米泛素启动子模板诸如SEQ ID NO:55可被设计成允许epsps基因座的编辑以包含置
于epsps-TIPS编码序列(epsps-ubiTIPS)前面的玉米泛素启动子(图12)。EPSPS-多核苷酸
玉米泛素启动子模板作为质粒,采用粒子枪轰击法,与向导sgRNA表达盒和玉米优化的Cas9内切核酸酶表达载体共递送,其中玉米优化的Cas9内切核酸酶表达载体包含玉米优化的
Cas9内切核酸酶表达盒并且还包含moPAT选择性标记基因。使用实施例3和4所述的程序编
辑玉米植株。可与由天然EPSPS基因启动子驱动的epsps-TIPS等位基因(和蛋白质积累)相
比,在T0植株和它们子代的玉米组织中评估epsps-ubiTIPS等位基因的表达水平和EPSPS-
TIPS蛋白积累。
[0489] 启动子修饰,诸如针对玉米描述的启动子修饰,不限于玉米并且还可通过本文所述的方法提供给任何植物。可鉴定EPSPS基因阻遏蛋白的DNA识别位点并且使用本文所述的
基因编辑技术在植物基因组中引入它们的天然位置。例如,可通过消除或改变EPSPS基因的启动子内的阻遏元件(或植物基因组张的任何EPSPS阻遏蛋白序列)产生基因经编辑的植
物,其中所述植物在不同的环境条件下表现出较高的EPSPS活性、产生更高的产量并且提供增强的草甘膦抗性。增加的EPSPS活性还可通过用另一启动子替代天然EPSPS启动子来实
现,所述另一启动子诸如但不限于组成型启动子、组织特异性启动子、人工启动子、嵌合启动子、得到具有更高产率和增强的草甘膦抗性的植物的经编辑的启动子。可添加或修饰启
动子调控元件,以提供增强启动子活性并导致增强的EPSPS活性的正调控元件。上述改变中的任一个可由其自身或彼此结合提供,诸如将阻遏元件的消除或改变与正调控元件的添加
或修饰结合起来,以导致增强的启动子活性并导致增加的EPSPS活性和增强的草甘膦抗性。
[0490] 实施例11
[0491] 使用向导RNA/Cas9内切核酸酶系统编辑EPSPS基因泛素化位点
[0492] 待降解的蛋白质上存在限定的泛素化位点,通过利用专用计算机程序(例如CKSAAP_UbSite(Ziding Zhang′s Laboratory of Protein Bioinformatics,College of Biological Sciences,China Agricultural University,100193 Beijing,China),已在玉米EPSPS蛋白内发现了这些泛素化位点。图13A示出玉米EPSPS编码序列内的一个所选择
的聚泛素化位点,并将该位点的氨基酸特征序列与来自其它植物的同等EPSPS位点进行比
较(图13A)。将第90位氨基酸赖氨酸(K)(在其它种类植物中高度保守)选择为EPSPS蛋白质
聚泛素化的潜在位点。用于编辑epsps基因座的多核苷酸修饰模板(称为玉米EPSPS多核苷
酸K90R模板)作为SEQ ID No:56列出。该模板允许编辑epsps基因座,以使其第90位氨基酸赖氨酸(K)被置换成精氨酸(R)(K90R),还使其第102位与第106位的氨基酸出现另外两种
TIPS置换(图13B和13C)。使用本文所述的向导RNA/Cas内切核酸酶系统编辑玉米基因组
DNA,并如本文所述产生T0植株。通过本文所述的基因分型方法选择包含核苷酸修饰(由
K90R模板上的信息(图13C)指定)的T0植株。为了升高的蛋白含量,可选择F1epsps-
K90RTIPS植株,因为这种植株的EPSPS蛋白降解速率较慢。
[0493] 实施例12
[0494] 编辑内含子元件以引入内含子介导的增强子元件(IME)
[0495] 可使用在邻近其它转录控制元件的位置处的转录增强子来调控天然EPSPS基因的转录活性。已知内含子包含增强子元件,从而影响天然启动子(包括EPSPS启动子)转录的总体速率。例如,玉米泛素5’UTR的第一内含子赋予单子叶植物高表达水平,如专利申请WO 
2011/156535 A1所指明。通过被授予专利的分析法(2011年12月15日公布的WO2011/156535 A1中提出)鉴定了内含子增强基序CATATCTG(图14A)(也称为内含子介导的增强子元件
IME),并在EPSPS第一内含子的5’端选择适当的核苷酸位点用于进行编辑,从而引入内含子介导的增强子元件(IME)(图14B-14C)。多核苷酸修饰模板(称为玉米EPSPS多核苷酸IME模
板)以SEQ ID NO:57列出。该多核苷酸修饰模板允许编辑epsps基因座,使其在EPSPS第一内含子中包含三个IME(两个IME位于DNA的一条链上,另一个IME位于DNA的反向链上),并在第
102位和第106位处具有TIPS置换。然后,使用本文所述的向导RNA/Cas9内切核酸酶系统来
编辑玉米植株的基因组DNA。通过对T0植株进行基因分型,可选择包含IMETIPS编辑的EPSPS编码序列的玉米植株,然后可进一步评估这些玉米植株由于经编辑EPSPS基因的转录速率
增大而引起的EPSPS-TIPS蛋白含量提高并评估其草甘膦抗性。
[0496] 实施例13
[0497] 使用向导RNA/Cas9内切核酸酶系统编辑剪接位点和/或引入替代性剪接位点
[0498] 在玉米细胞中,剪接过程受外显子-内含子连接位点处的剪接位点影响,如产生EPSPS mRNA的过程所示(图1SA-15B)。图15A示出EPSPS扩增的前mRNA的分析结果(左侧cDNA
板)。图15A中泳道14显示包含未剪接的第三内含子的EPSPS的前mRNA的扩增,导致产生表征替代性剪接事件的804bp诊断片段。泳道E3和F8显示由常规剪接内含子产生的EPSPS PCR扩
增片段。除非合成了cDNA,否则不扩增诊断片段(诸如泳道14的804bp片段),包含总RNA的泳道E3、14和F8中未出现谱带(如图15A右侧的总RNA板所示)证实了这一点。玉米EPSPS基因中以及来自其它物种的基因中典型的剪接位点是AGGT,而其它(改变的)剪接位点变体可能导
致对前mRNA分子的处理异常。EPSPS编码序列包含多个替代性剪接位点,这些替代性剪接位点可能影响前mRNA成熟过程的总效率,因而可能限制EPSPS蛋白在玉米细胞中积聚。
[0499] 为限制EPSPS基因表达期间替代性剪接事件的发生率,可使用本文所述的向导RNA/Cas9内切核酸酶系统来编辑剪接位点。第二天然EPSPS内含子与第三外显子的连接处
的剪接位点是AGTT,可对该剪接位点进行编辑,以便在该连接处引入典型的剪接位点AGGT
(图16)。T被置换为G不影响天然EPSPS开放阅读框,也未改变EPSPS氨基酸序列。多核苷酸修饰模板(称为玉米EPSPS多核苷酸T剪接模板)以SEQ ID NO:58列出。该多核苷酸修饰模板允许编辑epsps基因座,使其在第二内含子与第三外显子的连接位点处包含典型的AGGT剪接
位点,并在第102位和第106位处具有TIPS置换。使用本文所述的过程编辑玉米植株。可评估F1 epsps-T剪接玉米植株的草甘膦抗性以及由于功能性EPSPS mRNA信息产量增加而引起
的蛋白含量的提高。
[0500] 实施例14
[0501] 通过编辑天然EPSPS基因的编码序列提高其基因活性
[0502] 在玉米基因中存在若干与转录水平增强相关联的元件,同样它们可导致增强的蛋白质合成。它们不局限于编码区域的特定序列,相反它们有利于感兴趣的基因的编码序列
的整体结构。其中有可减慢翻译过程的玉米稀有密码子(示例可包括S79-AGT>AGC、V106-
GTA>GTT、V155-GTA>GTG、R189-CGT>CGC、L196-CTA>CTT)、可导致蛋白质合成异常终止的框外(out-of-frame)开放阅读框、可有助于mRNA模板的过早降解的mRNA去稳定位点、可
影响前mRNA剪接过程的隐藏内含子、转座子插入位点以及其它。在玉米EPSPS编码序列中鉴定了多个此类元件。这些元件可使用玉米EPSPS多核苷酸模板诸如SEQ ID NO:59消除或修
饰。可使用实施例3和4所述的程序编辑玉米植株。由于功能性EPSPS mRNA信息的产生增加、它们在蛋白质合成中的稳定性和利用率提高,在所选择的F1 EPSPS-合成植株中EPSPS-
TIPS蛋白含量可增加。可评估经编辑植株的草甘膦抗性。
[0503] 实施例15
[0504] 玉米未成熟胚芽的转化
[0505] 转化可通过已知在植物中有效的各种方法来实现,包括粒子介导递送、农杆菌介导转化、PEG介导递送和电穿孔。
[0506] a.粒子介导的递送
[0507] 按以下步骤,利用粒子递送技术转化玉米未成熟胚芽。培养基配方如下所示。
[0508] 给穗去皮,用30%Clorox漂白剂加0.5%微洗涤剂表面消毒20分钟,再用无菌水冲洗两次。分离未成熟胚芽,胚轴一侧朝下(盾片一侧朝上)放置,每板放25个胚芽,置于560Y培养基中保持4小时,随后在2.5cm靶区域内对准,准备接受轰击。另选地,将分离的胚芽置于560L(起始培养基)上,并且置于暗处,26℃至37℃温度范围内放置8小时至24小时,然后置于560Y上,在26℃下保持4小时,再如上所述进行轰击。
[0509] 使用标准分子生物学技术构建包含双链断裂诱导剂和供体DNA的质粒,然后与包含发育基因ODP2(AP2域转录因子ODP2(胚珠发育蛋白2);US20090328252 A1)和Wushel
(US2011/0167516)的质粒共轰击。
[0510] 如下,使用水溶性阳离子脂质(Cat#E1811,Promega,Madison,WI,USA),将受关注的质粒和DNA沉淀在0.6μm(平均直径)的金粒料上。首先使用1μg质粒DNA,以及任选地其它共轰击用构建体诸如各50ng(0.5μl)、包含发育基因ODP2(AP2域转录因子ODP2(胚珠发育蛋白2);US20090328252 A1)和Wushel的质粒,在上制备DNA溶液。向预混的DNA中,在水中加入20μl制备的金微粒(15mg/ml)和5μl Tfx-50并小心地混合。金微粒在微量离心管中以10,000rpm粒化1分钟并且除去上清液。所得的粒料小心地用100ml 100%EtOH冲洗,而不将粒
料重新悬浮,并且小心地除去EtOH冲洗剂。加入105μl 100%EtOH并且通过简单超声将颗粒重新悬浮。然后,将10μl点样到每个载体的中心,并使其轰击前干燥约2分钟。
[0511] 另选地,使用氯化(CaCl2)沉淀程序,通过将100μl制备的钨微粒的水溶液、10μl(1μg)DNA的Tris EDTA缓冲液(1μg总DNA)、100μl 2.5M CaCl2,以及10μl 0.1M亚精胺混合,将感兴趣的质粒和DNA沉积到1.1μm(平均直径)钨粒料上。在搅拌的同时,依次将每种试剂加入钨颗粒悬浮液。短暂超声处理最终混合物,并且使其置于恒定涡旋环境中温育10分钟。沉淀期之后,将各管短暂离心,弃去液体,用500ml 100%乙醇洗涤颗粒,然后离心30秒。同样,除去液体,并且将105μl 100%乙醇加入最终的钨微粒粒料中。就颗粒枪轰击而言,将钨/DNA微粒简单声波处理。将10μl钨/DNA颗粒点样到每个大载体的中心,在轰击之前使点样的颗粒干燥约2分钟。
[0512] 用Biorad氦基因枪以第四档(level#4)轰击样本板。从具有制备好的颗粒/DNA的每管取等分试样,共计十份,以450PSI轰击所有样本各一次。
[0513] 轰击之后,将胚芽置于560P(维持培养基)上,在26℃至37℃范围内的温度下培养12至48小时,然后置于26℃温度下。5至7天后,将胚芽转移到含3mg/L双丙氨磷的560R选择培养基上,并且在26℃下每两周继代一次。在选择的约10周之后,抗选择愈伤组织克隆体转移到288J培养基中,以引发植物再生。在体细胞胚成熟(2-4周)之后,将发育良好的体细胞胚转移到培养基中用于发芽并转移到光照培养室。约7-10天之后,将发育中的苗转移到管
中的272V无激素培养基中7-10天,直至苗良好地构建。然后将植物转移以插入包含盆栽土
的平地(相当于2.5″盆)中,并在生长室中生长1周,随后在温室中生长另外的1-2周,然后转移到Classic 600盆(1.6加仑)并生长至成熟。监测植物,并对转换效率、和/或再生能力的修饰进行评分。
[0514] 起始培养基(560L)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、20.0g/l蔗糖、1.0mg/l 2,4-D和
2.88g/l L-脯氨酸(用D-I H2O定容,之后用KOH调节至pH 5.8);2.0g/l固化剂(在用D-I 
H2O定容之后添加);以及8.5mg/l硝酸(在将培养基灭菌并冷却至室温之后添加)。
[0515] 维持培养基(560P)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖、2.0mg/l 2,4-D和
0.69g/l L-脯氨酸(用D-I H2O定容,之后用KOH调节至pH 5.8);3.0g/l固化剂(在用D-I 
H2O定容之后添加);以及0.85mg/l硝酸银(在将培养基灭菌并冷却至室温之后添加)。
[0516] 轰击培养基(560Y)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、120.0g/l蔗糖、1.0mg/l 2,4-D和
2.88g/l L-脯氨酸(用D-I H2O定容,之后用KOH调节至pH 5.8);2.0g/l固化剂(在用D-I 
H2O定容之后添加);以及8.5mg/l硝酸银(在将培养基灭菌并冷却至室温之后添加)。
[0517] 选择培养基(560R)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson维生素混合物(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖、和2.0mg/l 2,4-D(用D-I H2O定容,之后用KOH调节至pH 5.8);3.0g/l固化剂(在用D-I H2O定容之后添加);以及
0.85mg/l硝酸银和3.0mg/l双丙氨磷(两者均在将培养基灭菌并冷却至室温之后添加)。
[0518] 植物再生培养基(288J)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素原液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆醇、以及0.40g/l甘氨酸(用精制D-I H2O定容)(Murashige和Skoog(1962)Physiol.Plant.15:473),100mg/l肌醇、0.5mg/l玉米素、60g/l蔗糖、以及1.0ml/l 0.1mM脱落酸(在调节至pH 5.6之后用精制D-I H2O定
容);3.0g/l固化剂(用D-I H2O定容之后添加);以及1.0mg/l吲哚乙酸和3.0mg/l双丙氨磷
(将培养基灭菌并冷却至60℃之后添加)。
[0519] 无激素培养基(272V)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素原液(0.100g/l烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆辛和0.40g/l甘氨酸,用精制去离子水定容)、0.1g/l肌醇和40.0g/l蔗糖(在调至pH 5.6后用精制去离子水定容)和6g/l细菌
培养用琼脂(在用精制去离子水定容后加入),灭菌并冷却至60℃。
[0520] b.农杆菌介导的转化
[0521] 农杆菌介导转化基本上如Djukanovic等人(2006)Plant Biotech J4:345-57中所述执行。简而言之,将10-12日龄的未成熟胚芽(尺寸为0.8-2.5mm)从灭菌内核进行解剖并
且置于液体培养基中(4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson维生素混合物
(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.690g/L L-脯氨酸、68.5g/L蔗糖、
36.0g/L葡萄糖,pH 5.2)。胚芽收集后,用浓度为0.35-0.45 OD550的1ml农杆菌替换培养
基。在室温下将玉米胚芽与农杆菌温育5分钟,然后将混合物倒入培养基板中,所述培养基板包含4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson维生素混合物(Sigma E-
1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.690g/L L-脯氨酸、30.0g/L蔗糖、0.85mg/L硝酸银、0.1nM乙酰丁香酮以及3.0g/L固化剂,pH5.8。将胚轴向下在黑暗中于20℃下温育3天,然后在黑暗中于28℃下温育4天,然后转移到新的培养基板中,所述新培养基板包含
4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson维生素混合物(Sigma E-1511)、
1.0mg/L盐酸硫胺素、1.5mg/L 2,4-D、0.69g/L L-脯氨酸、30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸银、3.0mg/L双丙氨磷、100mg/L羧苄青霉素以及6.0g/L琼脂,pH 5.8。将胚芽每三周继代培养直至鉴定转基因事件。将少量组织转移至再生培养基(4.3g/L MS盐
(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、0.1μM ABA、1mg/L IAA、0.5mg/L玉米素、60.0g/L蔗糖、1.5mg/L双丙氨磷、100mg/L羧苄青霉素、3.0g/L固化剂,pH 5.6),并且在黑暗中于28℃培养两周,从而诱导体细胞胚发生。随后,将所有长出芽和根的材料转移到含有4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、40.0g/L蔗糖、
1.5g/L固化剂,pH为5.6的培养基上,并且在人造光下于28℃温育。一周后,将小植株移入装有相同培养基的玻璃管中,并且使其生长直至再采样和/或将其移植到土壤中。
[0522] 实施例16
[0523] 使用向导RNA/Cas内切核酸酶系统对大豆EPSPS1基因进行基因编辑
[0524] A.设计大豆EPSPS基因上的向导RNA/Cas9内切核酸酶靶位点。
[0525] 在大豆EPSPS1基因Glyma01g33660的外显子2中鉴定出了两个向导RNA/Cas9内切核酸酶靶位点(大豆EPSPS-CR1和大豆EPSPS-CR2)(表16)。
[0526] 表16.大豆EPSPS1基因上的向导RNA/Cas9内切核酸酶靶位点
[0527]
[0528] B.使用向导RNA表达盒、Cas9内切核酸酶表达盒和多核苷酸修饰模板将特定氨基酸变化引入大豆EPSPS1基因
[0529] 使用大豆U6小核RNA启动子GM-U6-13.1(SEQ ID.NO:62)表达向导RNA,以引导Cas9核酸酶至指定的基因组靶位点(表17)。在第一质粒中连接大豆密码子优化的Cas9内切核酸
酶(SEQ ID NO:82)表达盒与向导RNA表达盒,该第一质粒与多核苷酸修饰模板共递送。该多核苷酸修饰模板包含特定的核苷酸变化,该变化用于编码EPSPS1多肽(Glyma01g33660)中
的氨基酸变化,诸如外显子2中的T183I和P187S(TIPS)。也可使用本文所述的向导RNA/Cas
内切核酸酶系统获得EPSPS1多肽中的其它氨基酸变化。特定氨基酸修饰可通过基因组DNA
和多核苷酸修饰模板之间的同源重组,在向导RNA/Cas内切核酸酶系统的促进下实现。
[0530] 表17.将向导RNA/Cas9表达盒与多核苷酸修饰模板用于稳定转化大豆,以获得EPSPS1基因的特定氨基酸修饰。
[0531]
[0532] C.检测稳定转化的大豆中的向导RNA/Cas9系统介导的位点特异性非同源末端连接(NHEJ)
[0533] 从体细胞胚芽样本中提取基因组DNA,并且采用7500实时PCR系统(Applied Biosystems,Foster City,CA)通过使用靶位点特异性引物和FAM标记荧光探针进行定量
PCR分析,以检查双链断裂靶位点的拷贝数变化。以双重反应形式执行qPCR分析,采用
syringolide诱导蛋白(SIP)作为内源性对照,采用包含靶位点(带2个等位基因)的一个拷
贝的野生型93B86基因组DNA样本作为单拷贝校准品(calibrator)。还使用了向导RNA/Cas9
的qPCR引物/探针(SEQ ID:70-72)和PinII的qPCR引物/探针(SEQ ID:73-75),分析转基因事件中是否存在向导RNA-Cas9表达盒。qPCR引物/探针列于表18。
[0534] 表18.用于转基因大豆事件的qPCR分析的引物/探针
[0535]
[0536] 用VIC标记内源性对照探针SIP-T,用FAM标记用于所有靶位点的基因特异性探针,以同时检测两根荧光探针(Applied Biosystems)。捕集PCR反应数据,使用7500实时PCR系
统提供的序列检测软件进行分析,并使用相对定量方法(Applied Biosystems)计算基因拷
贝数。
[0537] 由于带双链断裂靶位点的两个等位基因的野生型93B86基因组DNA被用作单拷贝校准品,所以,靶位点没有任何变化的事件将作为一个拷贝被检测到,本文称为Wt-Homo
(qPCR值>=0.7);一个等位基因变化的事件不再可被靶位点特异性qPCR检测到,将作为半个拷贝被检测到,本文称为NHEJ-Hemi(0.1<qPCR值<0.7);两个等位基因都变化的事件将作为无效事件被检测到,本文称为NHEJ-Null(qPCR值=<0.1)。如表19所示,靶向大豆
EPSPS-CR1位点和EPSPS-CR2位点的向导RNA/Cas内切核酸酶系统都能在其指定的靶位点处
有效引入双链断裂(DSB)。我们在93B86基因型中检测到了NHEJ-Hemi和NHEJ-Null两者。通
过PCR/TOPO克隆/测序确认向导RNA/Cas9系统在特定的Cas9靶位点处介导了NHEJ(非同源
末端连接)突变。
[0538] 表19.向导RNA/Cas9系统在大豆EPSPS1基因上诱导靶位点双链断裂突变率。数字表示事件的数量(括号内的数字为百分比)。
[0539]
[0540] D.检测大豆EPSPS基因中的TIPS突变
[0541] 为在天然EPSPS基因上编辑特定氨基酸(诸如导致TIPS修饰的那些),将多核苷酸修饰模板(诸如RTW1013A或RTW1012A(表17))与向导RNA/Cas9表达盒共递送到大豆细胞中。
[0542] 通过特异性PCR分析确定向导RNA/Cas9系统介导的DNA同源重组引起的天然EPSPS1基因的修饰,如图17所示。使用引物对WOL569(SEQ ID NO:79)和WOL876(SEQ ID NO:
80)执行特异性PCR测定,检测天然EPSPS1基因中的完全的TIPS修饰。使用第二引物对
WOL569(SEQ ID NO:79)和WOL570(SEQ ID NO:81)来扩增TIPS修饰的EPSPS1等位基因和WT
(野生型)/NHEJ突变的等位基因。使用TOPO克隆/测序来验证序列。对于EPSPS-CR2,使用
EPSP1基因中的TIPS编辑产生七株T0植株。对于该事件中的EPSPS1基因,将一个等位基因编辑为TIPS并且用非同源末端连接(NHEJ)将第二等位基因修复为2bp的缺失。
[0543] 实施例17
[0544] 使用向导RNA/Cas内切核酸酶系统进行大豆基因的内含子替换
[0545] A.设计向导RNA/Cas9内切核酸酶靶位点。
[0546] 在大豆EPSPS1基因Glyma01g33660中鉴定出了四个向导RNA/Cas9内切核酸酶靶位点(表20)。经鉴定,这四个靶位点中的两个(大豆EPSPS-CR1和大豆EPSPS-CR2)靶向大豆
EPSPS基因的外显子2,如实施例16所述。另两个靶位点(大豆EPSPS-CR4和大豆EPSPS-CR5)
被设计成邻近大豆EPSPS基因的内含子1的5’端。
[0547] 表20.大豆EPSPS1基因上的向导RNA/Cas9内切核酸酶靶位点。
[0548]
[0549] B.用向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板,实现用大豆泛素(UBQ)内含子1替换大豆EPSPS1基因的内含子1,完成大豆稳定转化
[0550] 使用大豆U6小核RNA启动子GM-U6-13.1(SEQ ID.NO:62)表达两种向导RNA(大豆EPSPS-CR1和大豆EPSPS-CR4,或大豆EPSPS-CR1和大豆EPSPS-CR5),以引导Cas9内切核酸酶至指定的基因组靶位点(表21)。靶位点之一(大豆EPSPS-CR1)位于外显子2中,如实施例16
所述,第二靶位点(大豆EPSPS-CR4或大豆EPSPS-CR5)位于天然EPSPS1基因的内含子1的5’
端附近。在表达质粒QC878/RTW1199(SEQ ID NO:63/85)或QC878/RTW1200(SEQ ID NO:63/
86)中连接大豆密码子优化的Cas9内切核酸酶表达盒与向导RNA表达盒,这些表达质粒与多
核苷酸修饰模板共递送。该多核苷酸修饰模板RTW1190A(SEQ ID NO:87)包含大豆UBQ基因
的532bp内含子1和TIPS修饰的外显子2。可使用向导RNA/Cas系统,通过基因组DNA与多核苷酸修饰模板之间的同源重组,实现大豆UBQ内含子1替换大豆EPSPS1内含子1,从而增强天然或经修饰的大豆EPSPS1基因表达。
[0551] 表21.在大豆稳定转化过程中,为用大豆泛素(UBQ)内含子1替换大豆EPSPS1基因的内含子1而使用的向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板
[0552]
[0553]
[0554] C.检测稳定转化的大豆中的向导RNA/Cas9系统介导的位点特异性NHEJ
[0555] 使用表22列出的qPCR引物/探针,如实施例16C所述检测了位点特异性NHEJ。
[0556] 表22.用于转基因大豆事件的qPCR分析的引物/探针
[0557]
[0558] D.使用向导RNA/Cas9内切核酸酶系统检测大豆UBQ内含子1对大豆EPSPS1内含子1的替换
[0559] 为将天然EPSPS1基因处的大豆EPSPS1内含子1替换为大豆UBQ内含子1,使用表22和图18所示的两种向导RNA表达载体。QC878载体(SEQ ID NO:63)靶向外显子2,并且
RTW1199(SEQ ID NO:85)或RTW1200(SEQ ID NO:86)靶向内含子1的5’端。使用两个向导
RNA/Cas系统在双重切割大豆EPSPS基因,导致除去天然的EPSPS1内含子1/部分外显子2片
段。同时,将多核苷酸修饰模板RTW1190A(SEQ ID NO:87)共递送到大豆细胞中,多核苷酸修饰模板与基因组DNA之间的同源重组导致EPSPS1内含子1被替换为大豆UBQ内含子1,并且由
PCR分析证实外显子2中的所需氨基酸修饰。然后使用引物对WOL1001/WOL1002(SEQ ID NO:
92和93)以及WOL1003/WOL1004(SEQ ID NO:94和95)进行PCR测定,以检测内含子替换事件。
[0560] 实施例18
[0561] 使用向导RNA/Cas内切核酸酶系统完成大豆基因的启动子替换(启动子更换)
[0562] A.设计向导RNA/Cas9内切核酸酶靶位点。
[0563] 在大豆EPSPS1基因Glyma01g33660中鉴定出了四个向导RNA/Cas9内切核酸酶靶位点(表23)。经鉴定,这四个靶位点中的两个(大豆EPSPS-CR1和大豆EPSPS-CR2)靶向大豆
EPSPS基因的外显子2,如实施例16所述。还鉴定出,大豆EPSPS-CR6和大豆EPSPS-CR7位于-
798bp天然EPSPS启动子的5’端附近。
[0564] 表23.大豆EPSPS1基因上的向导RNA/Cas9内切核酸酶靶位点。
[0565]
[0566] B.用向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板,实现用大豆UBQ启动子替换-798bp大豆EPSPS1启动子,完成大豆稳定转化。
[0567] 使用大豆U6小核RNA启动子GM-U6-13.1(SEQ ID.NO:62)表达两种向导RNA(大豆EPSPS-CR1和大豆EPSPS-CR6,或大豆EPSPS-CR1和大豆EPSPS-CR7),从而引导Cas9核酸酶至指定的基因组靶位点(表24)。靶位点之一(大豆EPSPS-CR1)位于外显子2中,如实施例16所
述,第二靶位点(大豆EPSPS-CR6或大豆EPSPS-CR7)位于-798bp天然EPSPS1启动子的5’端附近。在表达质粒QC878/RTW1201(SEQ ID NO:63/98)或QC878/RTW1202(SEQ ID NO:63/99)中连接大豆密码子优化的Cas9内切核酸酶表达盒与向导RNA表达盒,这些表达质粒与多核苷
酸修饰模板RTW1192A(SEQ ID NO:100)共递送。多核苷酸修饰模板包含1369bp大豆UBQ基因启动子、47bp 5UTR和532bp UBQ内含子1。可使用向导RNA/Cas系统,通过基因组DNA与多核苷酸修饰模板之间的同源重组,实现大豆UBQ启动子替换特定的大豆EPSPS1启动子,从而增强天然或经修饰的大豆EPSPS1基因表达。
[0568] 表24.在大豆稳定转化中,为用大豆UBQ启动子替换-798bp大豆EPSPS1启动子而使用的向导RNA/Cas9内切核酸酶表达盒和多核苷酸修饰模板
[0569]
[0570] C.检测稳定转化的大豆中的向导RNA/Cas9系统介导的位点特异性NHEJ
[0571] 使用表25列出的qPCR引物/探针,如实施例16C所述检测了位点特异性NHEJ。
[0572] 表25.用于转基因大豆事件的qPCR分析的引物/探针
[0573]
[0574] D.使用向导RNA/Cas9内切核酸酶系统检测大豆UBQ启动子替换大豆EPSPS1启动子。
[0575] 为将天然EPSPS1基因处的大豆EPSPS1启动子替换为大豆UBQ启动子,在每个大豆转化实验中,使用表10所示的两种向导RNA表达载体。QC878(SEQ ID NO:63)靶向外显子2,并且RTW1201(SEQ ID NO:98)或RTW1202(SEQ ID NO:99)靶向大豆-798bp启动子的5’端。使用两个向导RNA/Cas系统双重切割大豆EPSPS1基因,导致除去天然EPSPS基因中的天然
EPSPS1启动子/5’UTR-外显子1/内含子1/部分外显子2片段。同时,将多核苷酸修饰模板
RTW1192A(SEQ ID NO:100)共递送到大豆细胞中。该RTW1192A DNA包含1369bp大豆UBQ启动子、其47bp 5-UTR、以及位于EPSPS1外显子1-内含子1修饰的外显子2前面的532bp UBQ内含子1。该多核苷酸修饰模板与基因组DNA之间的同源重组导致EPSPS1启动子/5’UTR被替换为大豆UBQ启动子/5’UTR/内含子1,并且通过PCR分析证实了所需的氨基酸修饰。然后使用引物对WOL1005/WOL1006(SEQ ID NO:104和105)以及WOL1003/WOL1004(SEQ ID NO:94和95)
进行PCR测定,以检测启动子替换事件。
[0576] 实施例19
[0577] 植株EPSPS的变体
[0578] 除实施例3中所述的TIPS突变之外的降低草甘膦敏感性的EPSPS突变是本领域中已知的(US 8,436,159)并且也可引入(与TIPS结合或不结合)到植株EPSPS基因中,如实施
例3和实施例8所述。另外,可通过本领域技术人员已知的方法鉴定新型EPSPS突变。本文所述的向导多核苷酸/Cas内切核酸酶系统可用于在EPSPS基因中引入这些突变中的任一个、
或这些突变的任意组合并且可针对除草剂抗性对所得的玉米EPSPS变体进行评估。表26列
出可使用本文所述的方法提供的一些EPSPS突变。
[0579] 表26可使用本文所述的方法提供的EPSPS突变。
[0580]
QQ群二维码
意见反馈