首页 / 专利库 / 农用化学品和农药 / 非选择性除草剂 / 以5‑烯醇式丙酮酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白

以5‑烯醇式丙酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白

阅读:940发布:2020-05-18

专利汇可以提供以5‑烯醇式丙酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白专利检索,专利查询,专利分析的服务。并且现行公开涉及在 植物 中以5‑烯醇式丙 酮 酰莽 草酸 ‑3‑ 磷酸 合酶(EPSPS)基因为靶的改造锌指蛋白,以及使用上述锌指蛋白调整基因表达,基因失活与靶向基因修饰的方法。具体而言,本公开涉及供靶向剪切与改变EPSPS基因的锌指核酸酶。,下面是以5‑烯醇式丙酰莽草酸‑3‑磷酸合酶基因为靶的改造锌指蛋白专利的具体信息内容。

1.一种非天然存在的锌指蛋白(ZFP),其包括四个、五个或六个锌指DNA结合区域,每个锌指结构域包含识别螺旋区,其中所述ZFP经改造而结合于目标EPSPS靶基因组区域中的靶位点,并且选自具有表A中所示的识别螺旋区的名称为10654、10658、9875、10275、10740、
10741、10742、11038、11039、11034、11036和11037的ZFP。
2.权利要求1所述的ZFP,其中所述ZFP为包含一个或多个功能域的融合蛋白。
3.权利要求2所述的ZFP,其中一个或多个功能域选自下述组成的组:转录阻抑物、核酸内切酶、甲基转移酶、组蛋白脱乙酰酶、转录激活物和组蛋白乙酰转移酶。
4.权利要求3所述的ZFP,其中所述ZFP为下述的锌指核酸酶(ZFN),其剪切目标EPSPS靶基因组区域,所述ZFN包含一个或多个改造的锌指结合区域与核酸酶剪切域。
5.权利要求4所述的ZFN,其中所述ZFN剪切一个或多个EPSPS共生同源基因或直向同源基因序列。
6.编码权利要求1-5中任一所述的一个或多个锌指蛋白(ZFP)的多核苷酸。
7.一种产生包含权利要求6所述的一个或多个多核苷酸的植物宿主细胞的方法,包括以包含权利要求6的多核苷酸的一个或多个ZFP表达载体稳定转化和/或以一个或多个多核苷酸暂时转染所述植物宿主细胞。
8.权利要求7的方法,其中所述细胞是芸薹属(Brassica)细胞。
9.权利要求7的方法,其中所述细胞是欧洲油菜(B.napus)细胞。
10.一种在植物细胞中剪切一个或多个EPSPS基因的方法,所述方法包括下述步骤:
将权利要求6所述的一个或多个多核苷酸导入植物细胞;和
在所述细胞中表达所述一个或多个ZFN,其中所述ZFN剪切一个或多个EPSPS基因。
11.权利要求10所述的方法,其中至少一个多核苷酸稳定转染入所述植物细胞中。
12.权利要求10所述的方法,其中至少一个多核苷酸暂时转染入所述植物细胞中。
13.权利要求10-12中任一项所述的方法,其中所述植物细胞中所有的EPSPS共生同源基因被剪切。
14.权利要求10-12中任一项所述的方法,其中所述植物细胞中一个或多个EPSPS共生同源基因被剪切。
15.包含第一、第二和第五DNA序列的供体载体;
其中
(i)所述第一序列和第三DNA序列同源,而所述第二序列与第四DNA序列同源;
(ii)所述第三DNA序列和第四DNA序列是染色体5-烯醇式丙酰莽草酸-3-磷酸合酶(EPSPS)基因,所述染色体EPSPS DNA序列与SEQ ID NO:10-14中任一个所示的序列显示至少80%同一性;且
(iii)所述第五序列插入所述第一与第二序列间并且为外源核酸序列;
其中所述供体载体包含由ZFP结合的靶位点,所述ZFP包含表A中所示选自10654、
10658、9875、10275、10740、10741、10742、11038、11039、11034、11036和11037的识别螺旋区。
16.权利要求15所述的供体载体,其中第三与第四序列的近边(near edge)为毗连的。
17.权利要求15所述的供体载体,其中第三与第四序列的近边通过至少一个核苷酸对分隔。
18.权利要求15-17中任一项所述的载体,其中所述第五序列包含编码选择性标记的序列。
19.权利要求18所述的载体,其中选择性标记选自下述组成的组:绿色荧光蛋白(GFP)、β-葡糖酸糖苷酶(GUS)、草胺膦N-乙酰转移酶(PAT,BAR)、新霉素磷酸转移酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二合酶、α-淀粉酶、酪酸酶、β-半乳糖苷酶、荧光素酶、母发光蛋白、EPSP合酶、腈水解酶、乙酰乳糖合酶(ALS)、二氢叶酸还原酶(DHFR)、茅草枯脱卤素酶及邻氨基苯甲酸合酶。
20.权利要求15-17中任一项所述的载体,其中所述第五序列包含选自下组的序列:编码除选择性标记以外蛋白质的序列;一个或多个转录调节序列;一个或多个增强或减弱蛋白质靶向的序列;一个或多个编码蛋白质的部分的序列;小干扰RNA;和微RNA。
21.权利要求20所述的载体,其中所述第五序列包含编码突变体EPSPS染色体序列的序列,其增加植物针对除草剂草甘膦的耐受性。
22.一种将外源核酸序列导入植物细胞基因组中的方法,所述方法包括下列步骤:
在存在权利要求15-21中任一项所述的供体载体的情况下,在所述细胞中表达一个或多个锌指核酸酶(ZFN);
其中所述ZFN剪切第三或第四序列之一的EPSPS千基对;
从而使得在步骤(b)中染色体DNA的剪切刺激所述供体载体通过同源重组整合入基因组中。
23.一种在植物细胞中表达外源核酸序列产物的方法,所述方法包括下述步骤:
根据权利要求22方法导入所述的外源序列从而使得所述外源序列的产物在植物细胞中表达。
24.一种在植物细胞基因组中刺激分子内同源重组的方法,所述方法包括下述步骤:
将权利要求4-6中任一项所述的ZFN在植物细胞中存在下述DNA片段的情况下导入所述植物细胞,所述DNA片段包含(i)具有至少一个表B中所指定的靶位点SEQ ID NO:141-153的EPSPS基因,和(ii)第一与第二同源序列,从而使得所述ZFN剪切该DNA片段并促进分子内同源重组。
25.权利要求24所述的方法,其中同源重组导致在内源DNA片段内的缺失。
26.权利要求25所述的方法,其中所述缺失序列选自下组:编码EPSPS基因全部或部分的序列和编码选择性标记全部或部分的序列。
27.权利要求25所述的方法,其中所述缺失DNA由外源序列取代,所述方法进一步包括:
将多核苷酸导入所述细胞,其中所述多核苷酸包括:
(a)至少两个序列在所述内源DNA片段中与非缺失序列同源;和
(b)所述外源序列。
28.权利要求27所述的方法,其中所述外源序列为选择性标记。
29.权利要求28所述的方法,其中所述选择性标记选自下组:绿色荧光蛋白(GFP)、β-葡糖醛酸糖苷酶(GUS)、草胺膦N-乙酰转移酶(PAT,BAR)、新霉素磷酸转移酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二氧合酶、α-淀粉酶、酪氨酸酶、β-半乳糖苷酶、荧光素酶、水母发光蛋白、EPSP合酶、腈水解酶、乙酰乳糖合酶(ALS)、二氢叶酸还原酶(DHFR)、茅草枯脱卤素酶和邻氨基苯甲酸合酶。
30.权利要求27所述的方法,其中所述外源序列为EPSPS基因序列。
31.权利要求30所述的方法,其中所述EPSPS基因序列包含突变。
32.权利要求31所述的方法,其中所述突变增加植物针对除草剂草甘膦的耐受性。
33.一种从植物细胞基因组中缺失EPSPS基因序列的方法,所述方法包括下述步骤:
在所述植物细胞中表达第一与第二锌指核酸酶(ZFN),其中所述第一ZFN在EPSPS基因的第一位点处剪切,而所述第二ZFN在所述EPSPS基因的第二位点处剪切,其中所述EPSPS基因序列位于所述第一位点与第二位点之间,其中第一与第二位点的剪切导致所述EPSPS基因序列的缺失,
其中所述第一和第二ZFN分别是如权利要求4中所述的ZFN。
34.权利要求33所述的方法,其中第一与第二位点非同源末端连接。
35.权利要求33或34所述的方法,其中所述第一与第二位点通过至少100个核苷酸分隔。
36.权利要求33所述的方法,其中所述植物细胞为包含外源ESPS序列的转基因植物细胞。
37.一种调整EPSPS基因表达的方法,所述方法包括:
在细胞中表达权利要求1到3中任一项所述的ZFP,其中所述ZFP与所述EPSPS基因的靶位点结合,从而调整所述EPSPS基因的表达。
38.权利要求37所述的方法,其中所述ZFP增加所述EPSPS基因的转录。
39.权利要求38所述的方法,其中所述ZFP增加植物针对除草剂草甘膦的耐受性。
40.权利要求37所述的方法,其中所述ZFP降低所述EPSPS基因的转录。
41.权利要求40所述的方法,其中所述ZFP降低植物针对除草剂草甘膦的耐受性。
42.权利要求1所述的ZFP,其中所述锌指结合区域包含表A排列中所示的识别螺旋。
43.权利要求6所述的多核苷酸,其中目标EPSPS靶基因组区域属于EPSPS基因,其包括选自下组的核苷酸序列:SEQ ID NOS:10-14或与其至少有95%同一性的序列。
44.权利要求4所述的ZFP,其中所述核酸酶剪切域包括剪切半域。
45.权利要求44所述的ZFN,其中所述核酸酶剪切域来自IIS型限制性核酸内切酶。
46.权利要求45所述的ZFN,其中所述IIS型限制性核酸内切酶是Fok I。

说明书全文

以5-烯醇式丙酰莽草酸-3-磷酸合酶基因为靶的改造锌指

蛋白

技术领域

[0001] 本发明主要涉及植物中基因组工程,基因打靶,靶向染色体整合及蛋白质表达等领域。特别而言,本发明涉及以5-烯醇式丙酮酰莽草酸-3-磷酸合酶(5-enolpyruvyl 
shikimate-3-phosphate synthase)基因为靶的改造锌指蛋白(engineered zinc finger 
proteins),及在调节基因表达、基因失活及靶向基因修饰中使用该锌指蛋白的方法。更加
特别而言,本发明属于催化EPSPS基因靶向剪切和改变的改造锌指核酸酶。
现有技术
[0002] 农业中一个主要让人感兴趣的方向,尤其考虑到不少植物基因组全核苷酸序列业已确定,是靶向调节基因表达和基因序列改变。特别而言,调节基因表达及修饰内源植物序
列的能可以促进许多应用,例如,农作物特性的优化,所述特性影响营养价值、产量、胁迫
耐受性、病原体抗性、油质量以及对农药的抗性和/或改造植物用作生物工厂以生产医药化
合物或工业化学品。
[0003] 改造锌指蛋白(ZFPs)已被方便的用于选择性的调节基因表达及靶向改变植物基因序列(参见,如,U.S.Patents Nos.7,262,054,7,235,354,7,220,719,7,001,768与6,
534,261;以及U.S.Serial No.60/874,911)。锌指蛋白是以序列特异性为特征依靠称为锌
指由金属稳定化的域结合DNA、RNA和/或蛋白质的蛋白质。参见,例如,Miller等人(1985)
EMBO J.4:1609-1614;Rhodes et al.(1993)Sci.Amer.268(2):56-65;及Klug(1999)
J.Mol.Biol.293:215-218。ZFPs通常见于转录因子,迄今为止,在数千已知或推定的转录因
子中辨识出超过10000个锌指序列。
[0004] 对所选基因靶的调节和改变理论上可以通过设计对具有所希望生物活性,预先确定的DNA序列有特异性的ZFPs来达成。例如,将锌指结构域与调节性的域在融合蛋白中结
合,从而产生改造锌指转录因子以控制基因调节(参见,例如U.S.Patent No.6,534,261)。
锌指结构域亦与核酸酶剪切域结合, 产生锌指核酸酶(ZFNs)以特异性的靶向希望修饰
(如,缺失,突变,同源重组或插入外源序列)的基因组双链断裂(参见,如U.S.Patent 
ApplicationPublication Nos.2007/0134796与2005/0064474)。改造ZFPs极大的促进了外
源序列的插入或在植物中特异靶位点内源序列的修饰,并提供了比常规方法效率更高的对
植物基因组的靶向改变(参见,如U.S.Patents Nos.7,262,054,7,235,354,7,220,719,7,
001,768与6,534,261)。
[0005] 然而,基因组复制常见于植物中,而且仍有对在植物基因组中靶向改变上述共生同源基因(paralogous genes),以及在植物中调节共生同源基因表达的组合物与方法的需
求。
[0006] 发明概述
[0007] 本发明提供在植物细胞中调节表达及靶向改变一个或多个共生同源基因(例如EPSPS基因)的组合物与方法。植物细胞可以来自单子叶植物(monocots)或双子叶植物
(dicots)物种,亦包括培养的细胞,在任何发育阶段植物中的细胞,以及从全本植物上移除
的细胞和置回植物的细胞(或其后代)。植物细胞亦包括一个或多个同源或共生同源的基因
序列,其中任何部分或全部可作为本发明描述方法进行修饰的靶。
[0008] 在一方面,本文描述结合作为目标EPSPS靶基因组区域的锌指蛋白(ZFPs),其中所述ZFP包括一个或更多改造的锌指结合区域。在一些实施方案中,锌指结合区域包含表A所
示的序列。在一些实施方案中,作为ZFP靶的EPSPS基因包括选自下组的核苷酸序列:SEQ ID 
NOS:10-14或与其至少有大约80%-100%同一性的序列,包括任何在该范围内的同一性百
分比,例如与其有81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%序列
相同(序列同一性)。在一些实施方案中,所述ZFP是融合蛋白,包含一个或更多的调节区。在
一个实施方案中,一个或更多的调节区选自下组:转录阻抑物、核酸内切酶、甲基转移酶、组
蛋白脱乙酰酶、转录激活物以及组蛋白乙酰转移酶。在一个实施方案中,所述ZFP与EPSPS基
因的靶序列结合,其中EPSPS表达增加或降低。在一个实施方案中,所述ZFP与EPSPS基因的
转录调节序列结合。在另一个实施方案中,所述ZFP在EPSPS基因的转录起始位点上游结合。
在另一个实施方案中,所述ZFP在EPSPS基因转录起始位点邻近结合。在另一个实施方案中,
所述ZFP在EPSPS 基因的转录起始位点下游结合。在一个实施方案中,所述ZFP在EPSPS基因
转录起始位点下游的RNA多聚酶暂停位点(pause site)邻近结合。
[0009] 在一个实施方案中,所述ZFP是剪切目标EPSPS靶基因组区域的锌指核酸酶(ZFN),其中所述ZFN包含一个或更多改造的锌指结合区域,与核酸酶剪切(cleavage)域。在一些实
施方案中,所述ZFN包括融合多肽,所述多肽包含对EPSPS基因序列有特异性的改造的锌指
结合区域与剪切域,所述ZFN还包括一个或更多融合多肽,所述多肽包含改造的锌指结合区
域与剪切半域(half domain)。在一些实施方案中,锌指结合区域包括选自由包含表A所示
识别域的锌指蛋白组成的组。剪切域与剪切半域可由例如各种限制性核酸内切酶和/或靶
向(homing)核酸内切酶得到。在一个实施方案中,所述剪切域与剪切半域源自IIS型限制性
核酸内切酶(例如,Fok I)。所述ZFN可能特异性的剪切一种特定EPSPS基因序列。或者,所述
ZFN可能剪切两种或更多同源EPSPS基因序列,所述同源序列可能包括EPSPS共生同源或正
向(orthologous)同源基因序列。
[0010] 在一些实施方案中,作为ZFN靶的EPSPS基因包含选自下组的核苷酸序列:SEQ ID NOS:10-14或与其至少有大约80%-100%同一性的序列,包括任何在该范围内的同一性百
分比,例如与其有81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%序列
同一性。
[0011] 所述ZFN可能在EPSPS基因的编码区域内或在该基因内或邻近该基因的非编码区域,例如,前导序列、尾随序列或内含子,或者在非转录区域内编码区域上游,或其下游区域
结合和/或剪切EPSPS基因。在一些实施方案中,所述ZFN结合和/或剪切所述EPSPS基因的编
码序列或调节序列。在一些实施方案中,所述ZFN在选自由SEQ ID NOS:10-14的核苷酸序列
组成的区域内结合并剪切EPSPS基因。
[0012] 在另一方面,本文描述了包括一个或更多ZFP的组合物,所述组合物可能包含一个或更多ZFN。植物细胞可能包含一个独特的EPSPS基因或多个EPSPS共生同源基因。因此,组
合物可能包括一个或更多ZFP,所述ZFP在植物细胞中靶向一个或更多EPSPS基因,例如,1、
2、3、4、5或直到任意数量的EPSPS共生同源基因或植物细胞中存在的所有EPSPS共生同源基
因。在一个实施方案中,所述组合物包括一个或更多在植物细胞中靶向所有EPSPS共生同源
基因的ZFP。在另一个实施方案中,所述组合物包括一个在 植物细胞中特异性的靶向一个
特定EPSPS共生同源基因的ZFP。举例而言,所述组合物可能包括一个在植物细胞中特异性
的结合并剪切一个特定EPSPS共生同源基因的ZFN,或多个在植物细胞中特异性的结合并剪
切两个或更多EPSPS共生同源基因的ZFN。另外,组合物可能包含非核酸酶的ZFP,所述ZFP改
变一个或更多EPSPS共生同源基因的转录调节。
[0013] 在另一方面,本文描述了编码一个或更多本文描述的ZFP的多肽。在一个实施方案中,所述多肽编码至少一个ZFN。作为示例的多肽包括编码表A所示任意锌指蛋白的核苷酸
序列。
[0014] 在另一方面,本文描述了ZFP表达载体,所述载体包含编码一个或更多,可操纵的与启动子连接,本文所描述ZFP的多核苷酸。在一个实施方案中,一个或更多ZFP是ZFN。
[0015] 在另一方面,本文描述了包含一个或更多ZFP表达载体的植物宿主细胞。该植物宿主细胞可能是由一个或更多ZFP表达载体稳定的转化或暂时性的转染,或两者组合。在一个
实施方案中,所述一个或更多ZFP表达载体在植物宿主细胞中表达一个或更多ZFN。
[0016] 在另一方面,本文描述了在植物细胞中剪切一个或更多共生同源基因的方法,该方法包括:(a)将一个或更多编码一个或更多ZFN的表达载体导入植物细胞,所述ZFN与一个
更多共生同源基因的靶位点在下述条件下结合:所述ZFN表达,且剪切一个或更多共生同源
基因。在一些实施方案中,所述靶位点在EPSPS基因中。在一个实施方案中,在植物细胞中一
个特定EPSPS共生同源基因被剪切。在另一个实施方案中,多于一个EPSPS共生同源基因被
剪切,举例而言,2、3、4、5或直至任意数量的EPSPS共生同源基因或植物细胞中存在的所有
EPSPS共生同源基因被剪切。
[0017] 在另一方面,本文描述了一个包括第一与第二DNA序列的供体载体,其中(i)第一序列与第三序列同源,而第二序列与第四序列同源;且(ii)第三和第四序列是染色体DNA序
列。在一些实施方案中,第三和第四序列的近边(near edge)被至少一对核苷酸分开。在一
个实施方案中,第三和第四序列是内源序列。在另一个实施方案中,第三和第四序列是外源
序列。在任何供体载体中,作为靶的染色体DNA序列可能为EPSPS序列。在一些实施方案中,
所述染色体EPSPS DNA序列属于包括选自下组核苷酸序列的EPSPS基因:SEQ ID NOS:10-14
或与其至少有大约80%-100%同一性的序列,包括任 何在该范围内的同一性百分比,例如
与其有81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%序列同一性。
[0018] 在一些实施方案中,供体载体第一或第二序列中至少一个长度为100核苷酸或更短。另外,本文描述的任一载体可能进一步包括第五序列,其中所述第五序列:(a)介于第一
和第二序列之间,且(b)为外源序列。在一些实施方案中,第五序列大小至少为一对基,但
可能大到22千碱基对或更大。
[0019] 所述供体载体(比如,第五序列)可能亦包括编码蛋白质或蛋白质一部分的序列。在一些实施方案中,所述编码蛋白质的序列编码选择性标记(例如,绿色荧光蛋白(GFP)、β-
葡糖酸糖苷酶(GUS)、草胺膦N-乙酰转移酶(PAT,BAR)、新霉素磷酸转移酶、潮霉素磷酸转
移酶、β-内酰胺酶、儿茶酚二合酶、α-淀粉酶、酪酸酶、β-半乳糖苷酶、荧光素酶、母发
光蛋白、EPSP合酶、腈水解酶、乙酰乳酸合酶(ALS)、二氢叶酸还原酶(DHFR)、茅草枯
(dalapon)脱卤素酶及邻氨基苯甲酸合酶)。在另一些实施方案中,蛋白质编码序列(例如,
第五序列)编码蛋白质或蛋白质一部分,例如与染色体序列同源的序列。
[0020] 在其它实施方案中,所述供体载体(例如,第五序列)包括一个或更多转录调节序列。举例而言,供体载体可能包括一个或更多增加或减少所述共生同源基因(例如,EPSPS)
表达的转录调节序列。在一些实施方案中,供体载体包括一个或多个增强或减弱蛋白质运
输的蛋白质靶向序列。
[0021] 进一步在其它实施方案中,所述供体载体(例如,第五序列)可能包括与突变体染色体序列(例如,EPSPS)对应的野生型,或作为替代,与野生型染色体序列(例如,EPSPS)对
应的突变体。在一些实施方案中,所述突变体染色体序列包括一个或更多选自下组的突变:
点突变、取代、缺失与插入。在一个实施方案中,所述供体载体包括突变体EPSPS染色体序
列,所述序列增加植物对除草剂草甘膦(glyphosate)的耐受性。
[0022] 在本文描述的任何供体载体中,第一序列可能与第三序列有至少35%的同源性。类似的,在本文描述的任何供体载体中,第二序列可能与第四序列有至少35%的同源性。在
有些实施方案中,第一序列与第三序列有至少35%至50%、至少50%至70%,至少70%至
80%,至少80%至85%,至少85%至90%,至少90%至95%,至少95%、96%、97%、98%、
99%或100%的同源性。在有些实施方案中,第二序列与第四序列有至少35%至50%、至少
50% 至70%,至少70%至80%,至少80%至85%,至少85%至90%,至少90%至95%,至少
95%、96%、97%、98%、99%或100%的同源性。
[0023] 在又一方面,本文描述了一种将外源序列导入植物细胞基因组的方法。所述方法包括下列步骤:(a)使细胞与本文描述的任何供体载体接触;(b)在细胞中表达一个或更多
锌指核酸酶,其中一个或更多锌指核酸酶在第三或第四序列任一的0.4和3千碱基对之间剪
切染色体DNA,其结果是在步骤(b)中染色体DNA的剪切促进了所述供体载体通过同源重组
整合入基因组中。在一些实施方案中,一个或更多核酸酶为IIS型限制性核酸内切酶的剪切
域与改造的锌指结合区域间的融合蛋白。
[0024] 在一些实施方案中,所述锌指核酸酶剪切包括选自下组核苷酸序列的EPSPS基因:SEQ ID NOS:10-14或与其至少有大约80%-100%同一性的序列,包括任何在该范围内的同
一性百分比,例如与其有81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、
99%序列同一性。
[0025] 在另一方面,本文描述了一种在植物中表达外源核酸序列的方法,该方法包括下列步骤:(a)使细胞与包含外源核酸序列的供体载体接触;(b)在细胞中表达锌指核酸酶
(ZFN),其中ZFN在染色体中距离第三或第四序列任一3千碱基对之内剪切一个或更多共生
同源基因(例如,一个或更多EPSPS基因)。在步骤(b)中剪切染色体DNA导致供体载体通过同
源重组整合入基因组及外源核酸序列产物的表达。
[0026] 在一些实施方案中,所述锌指核酸酶剪切包括选自下组核苷酸序列的EPSPS基因:SEQ ID NOS:10-14或与其至少有大约80%-100%同一性的序列,包括任何在该范围内的同
一性百分比,例如与其有81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、
99%序列同一性。
[0027] 在另一方面,本文描述了一种在植物细胞基因组中进行分子内同源重组的方法,该方法包括下列步骤:(a)提供包含靶基因序列并进一步包含第一序列的DNA片段,其中第
一序列与第二序列同源;(b)使所述DNA片段与本文描述的ZFN接触,其中ZFN在靶基因序列
处剪切DNA片段,从而促进分子内同源重组。在一些实施方案中,所述DNA片段对所述细胞为
内源的。在其它实施方案中,所述DNA片段对所述细胞为外源的。在一些实施方案中,所述靶
基因对所述细胞为特有的(unique)。在其它实施方案中,所述靶基因为共生同源基因。在上
述任何方法中,所述靶基因可能包括特有的或共生同源 的EPSPS基因且所述ZFN包括表A所
示的任何序列。在一些实施方案中,同源重组可能在染色体中发生。在一个实施方案中,第
一和第二序列间的DNA从染色体中缺失。在一个实施方案中,从染色体中缺失的序列可能编
码全部或部分靶基因。在另一个实施方案中,从染色体中缺失的序列可能编码全部或部分
选择性标记,例如,绿色荧光蛋白(GFP)、β-葡糖醛酸糖苷酶(GUS)、phosphinothricin N-乙
酰转移酶(PAT,BAR)、新霉素磷酸转移酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二氧合
酶、α-淀粉酶、酪氨酸酶、β-半乳糖苷酶、荧光素酶、水母发光蛋白、EPSP合酶、腈水解酶、乙
酰乳糖合酶(ALS)、二氢叶酸还原酶(DHFR)、茅草枯脱卤素酶及邻氨基苯甲酸合酶。
[0028] 在一些实施方案中,所述缺失的DNA由外源序列取代,该方法进一步包括将多核苷酸导入细胞,其中该多核苷酸包括(i)第四和第五序列,其中第四序列与靠近第一序列的未
缺失序列同源且第五序列与靠近第二序列的未缺失序列同源;(ii)所述外源序列。
[0029] 在一些实施方案中,缺失的DNA由基因序列取代,所述基因序列可能包括野生型基因序列的对应突变体。在一些实施方案中,所述突变体基因序列包括一个或更多选自下组
的突变:点突变、取代、缺失及插入。在一个实施方案中,缺失的DNA被EPSPS基因序列取代,
例如,包含增加植物对除草剂草甘膦耐受性的突变的EPSPS基因序列。
[0030] 在另一个实施方案中,所述外源序列可能是选择性标记,例如,绿色荧光蛋白(GFP)、β-葡糖醛酸糖苷酶(GUS)、phosphinothricin N-乙酰转移酶(PAT,BAR)、新霉素磷酸
转移酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二氧合酶、α-淀粉酶、酪氨酸酶、β-半乳糖
苷酶、荧光素酶、水母发光蛋白、EPSP合酶、腈水解酶、乙酰乳糖合酶(ALS)、二氢叶酸还原酶
(DHFR)、茅草枯脱卤素酶及邻氨基苯甲酸合酶。
[0031] 在另一个实施方案中,本文描述了从植物细胞基因组中缺失基因序列的方法,该方法包括(a)提供包含基因序列的植物细胞;(b)在所述细胞中表达第一和第二锌指核酸酶
(ZFNs),其中第一ZFN在第一剪切位点剪切,而第二ZFN在第二剪切位点剪切,其中所述基因
序列位于第一剪切位点和第二剪切位点之间,其中第一和第二剪切位点的剪切导致所述基
因序列的缺失。在一些实施方案中,所述基因序列是EPSPS基因。缺失的基因序列大小由第
一和第二剪切位点间的距离确定。相应的,可以获取在任何目标基因组区域 中任何大小的
缺失。可以获得25、50、100、200、300、400、500、600、700、800、900、1000对核苷酸,或在此范
围内任意整数值对核苷酸的缺失。此外,可以使用上述方法及本文公开的组合物缺失任何
大于1000对核苷酸的整数值对核苷酸的序列。在一个实施方案中,第一和第二剪切位点间
隔至少100个核苷酸。在一个实施方案中,整个基因(例如,EPSPS)缺失。在另一个实施方案
中,基因(例如,EPSPS)一部分缺失。在一个实施方案中,所述基因序列(例如,EPSPS基因序
列)从转基因植物细胞中缺失。所述基因序列(例如,EPSPS)可以是内源或外源序列。
[0032] 在另一方面,本文描述了调整植物基因调节的方法,所述方法包括(a)提供包含靶基因序列的植物细胞;(b)在该细胞中表达ZFP,其中所述ZFP与该靶基因调节序列结合,从
而调整靶基因的调节。在一些实施方案中,所述基因序列为EPSPS基因。ZFP与调节序列的结
合可能增加或减少靶基因(例如,EPSPS)的转录。在一些实施方案中,ZFP亦增加或减少植物
对除草剂草甘膦的耐受性。
[0033] 在另一方面,亦提供了通过本文中描述的任何方法所得的转基因植物细胞。
[0034] 在另一方面,本文提供了包含本文描述方法所得的转基因植物细胞的植物。
[0035] 在本文描述的任何方法中,对靶植物基因序列的修饰(例如,转录调节序列或EPSPS编码序列)可用于增加或减少植物对除草剂草甘膦的耐受性。
[0036] 因此,本发明包括,但不仅限于,下列编号的实施方案:
[0037] 1.一种与目标EPSPS靶基因组区域结合的锌指蛋白(ZFP),所述ZFP包括一个或更多改造的锌指结合区域。
[0038] 2.实施方案1中所述的ZFP,其中所述靶基因组区域是在双子叶植物细胞中。
[0039] 3.实施方案2中所述的ZFP,其中所述靶基因组区域是在菜籽(canola)细胞中。
[0040] 4.实施方案2中所述的ZFP,其中所述靶基因组区域是在芸薹(Brassica)植物细胞中。
[0041] 5.实施方案1中所述的ZFP,其中所述目标EPSPS靶基因组区域属于包含选自下组的核苷酸序列的EPSPS基因:SEQ ID NOS:10-14或与其至少有 95%同一性的序列。
[0042] 6.实施方案1中所述的ZFP,其中所述ZFP是包含一个或更多功能域的融合蛋白。
[0043] 7.实施方案6中所述的ZFP,包含选自下组的一个或更多功能域:转录阻抑物、核酸内切酶、甲基转移酶、组蛋白脱乙酰酶、转录激活物以及组蛋白乙酰转移酶。
[0044] 8.实施方案1-7中任一项所述的ZFP,其中所述ZFP与所述EPSPS基因转录调节序列结合。
[0045] 9.实施方案1-7中任一所述的ZFP,其中所述ZFP在所述EPSPS基因转录起始序列的上游结合。
[0046] 10.实施方案1-7中任一所述的ZFP,其中所述ZFP在所述EPSPS基因转录起始序列邻近结合。
[0047] 11.实施方案1-10中任一所述的ZFP,其中所述ZFP增加所述EPSPS基因的转录。
[0048] 12.实施方案1-10中任一所述的ZFP,其中所述ZFP减少所述EPSPS基因的转录。
[0049] 13.实施方案1中所述的ZFP,其中所述ZFP为剪切EPSPS目标靶基因组区域的锌指核酸酶(ZFN),所述ZFN包含一个或更多锌指结合区域及核酸酶剪切域。
[0050] 14.实施方案13所述的ZFN,其中所述剪切域包含两个剪切半域。
[0051] 15.实施方案14所述的ZFN,其中所述剪切半域源自相同核酸酶。
[0052] 16.实施方案15所述的ZFN,其中所述剪切半域源自IIS型限制性内切酶。
[0053] 17.实施方案16所述的ZFN,其中所述IIS型限制性内切酶是Fok I。
[0054] 18.实施方案13所述的ZFN,其中所述EPSPS目标靶基因组区域属于包含选自下组的核苷酸序列的EPSPS基因:SEQ ID NOS:10-14或与其至少有95%同一性的序列。
[0055] 19.实施方案13所述的ZFN,其中所述ZFN与EPSPS基因的编码区域结合。
[0056] 20.实施方案13所述的ZFN,其中所述ZFN与EPSPS基因的非编码区域结合。
[0057] 21.实施方案20所述的ZFN,其中所述ZFN与EPSPS基因的调节序列结合。
[0058] 22.实施方案13所述的ZFN,其中所述ZFN剪切一个或更多EPSPS共生同源或正向同源基因序列。
[0059] 23.实施方案13所述的ZFN,其中所述ZFN特异性的剪切一个EPSPS共生同源或正向同源基因序列。
[0060] 24.实施方案13所述的ZFN,包括含有如表A所示序列的锌指结合区域。
[0061] 25.实施方案13所述的ZFN,其中所述ZFN在选自由SEQ ID NOS:10-14的核苷酸序列组成的区域内结合并剪切EPSPS基因。
[0062] 26.实施方案13所述的ZFN,其中所述ZFN包括:
[0063] (a)第一融合蛋白,包括第一锌指结合区域,和第一剪切半域,其中第一锌指结合区域与第一核苷酸序列结合;以及
[0064] (b)第二融合蛋白,包括第二锌指结合区域,和第二剪切半域,其中第二锌指结合区域与第二核苷酸序列结合。
[0065] 27.实施方案26所述的ZFN,其中所述第二核苷酸序列位于距离第一核苷酸序列2和50个核苷酸间的位置
[0066] 28.实施方案26所述的ZFN,其中剪切发生在第一和第二核苷酸序列之间。
[0067] 29.一种包含实施方案1-28中任一所述的一个或更多锌指蛋白(ZFPs)的组合物。
[0068] 30.实施方案29所述的组合物,其中一个或更多ZFP为锌指核酸酶(ZFNs)。
[0069] 31.实施方案29所述的组合物,包括一个或多个在植物细胞中靶向一个或更多EPSPS基因的ZFP。
[0070] 32.实施方案29所述的组合物,包括两个或多个在植物细胞中组合靶向所有的EPSPS共生同源基因的ZFP。
[0071] 33.实施方案30所述的组合物,包括一个在植物细胞中特异性的结合并剪切一个EPSPS共生同源基因的ZFN
[0072] 34.实施方案30所述的组合物,包括两个或更多在植物细胞中结合并剪切两个或更多EPSPS共生同源基因的ZFN。
[0073] 35.实施方案30所述的组合物,包括一个或更多在植物细胞中结合并剪切所有EPSPS共生同源基因的ZFN。
[0074] 36.编码实施方案1-28中任一所述的一个或更多锌指蛋白(ZFP)的多核苷酸。
[0075] 37.实施方案36所述的多核苷酸,包含编码如表A所示锌指蛋白的核苷酸序列。
[0076] 38.一种ZFP表达载体,包含可操纵的与启动子连接的实施方案36或37所述的多核苷酸。
[0077] 39.一种包含一种或更多实施方案38所述ZFP表达载体的植物宿主细胞。
[0078] 40.实施方案39所述的植物宿主细胞,其中所述细胞稳定的由一种或更多ZFP表达载体转染。
[0079] 41.实施方案39所述的植物宿主细胞,其中所述细胞暂时性的由一种或更多ZFP表达载体转染。
[0080] 42.一种在植物细胞中剪切一个或更多EPSPS基因的方法,该方法包括:
[0081] (a)用编码一种或更多实施方案10所述的ZFN的一种或更多ZFP表达载体转染所述植物细胞;
[0082] (b)在所述细胞中表达一种或更多ZFN,其中所述ZFN剪切一个或更多EPSPS基因。
[0083] 43.实施方案42所述的方法,其中至少一种ZFP表达载体稳定转染至所述植物细胞中。
[0084] 44.实施方案42所述的方法,其中至少一种ZFP表达载体暂时转染至所述植物细胞中。
[0085] 45.实施方案42-44任一所述的方法,其中至少两种ZFP表达载体转染至所述细胞中。
[0086] 46.实施方案45所述的方法,其中至少两种ZFP表达载体共同转染至所述细胞中。
[0087] 47.实施方案45所述的方法,其中至少两种ZFP表达载体先后依次转染至所述细胞中。
[0088] 48.实施方案42至47任一所述的方法,其中所述植物细胞中所有的EPSPS共生同源基因被剪切。
[0089] 49.实施方案42至47任一所述的方法,其中所述植物细胞中一个EPSPS共生同源基因被剪切。
[0090] 50.实施方案42至47任一所述的方法,其中所述植物细胞中至少两个EPSPS共生同源基因被剪切。
[0091] 51.一种包含第一和第二DNA序列的供体载体;
[0092] 其中第一序列与第三序列同源,且第二序列与第四序列同源;且
[0093] 其中第三和第四序列是染色体EPSPS DNA序列
[0094] 52.实施方案51所述的供体载体,其中第三和第四序列的近边是毗连的。
[0095] 53.实施方案51所述的供体载体,其中第三和第四序列的近边被至少一对核苷酸分开。
[0096] 54.实施方案51至53中任一所述的载体,其中所述染色体EPSPS DNA序列属于包含选自下组的核苷酸序列的EPSPS基因:SEQ ID NOS:10-14或与其至少有95%同一性的序列。
[0097] 55.实施方案51至54中任一所述的载体,其中所述第三和第四序列是外源序列。
[0098] 56.实施方案51至54中任一所述的载体,其中所述第三和第四序列是内源序列。
[0099] 57.实施方案51至56中任一所述的载体,其中所述第一或第二序列至少之一长度为100核苷酸或更短。
[0100] 58.实施方案51至57中任一所述的载体,进一步包括第五序列,其中所述第五序列
[0101] (a)介于(interpose)第一和第二序列之间;且
[0102] (b)为外源核酸序列。
[0103] 59.实施方案58所述的载体,其中所述第五序列大小至少为1碱基对。
[0104] 60.实施方案58或59任一所述的载体,其中所述第五序列包括编码选择性标记的序列。
[0105] 61.实施方案61所述的载体,其中所述选择性标记选自下组:绿色荧光蛋白(GFP)、β-葡糖醛酸糖苷酶(GUS)、phosphinothricin N-乙酰转移酶(PAT,BAR)、新霉素磷酸转移
酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二氧合酶、α-淀粉酶、酪氨酸酶、β-半乳糖苷酶、
荧光素酶、水母发光蛋白、EPSP合酶、腈水解酶、乙酰乳糖合酶(ALS)、二氢叶酸还原酶
(DHFR)、茅草枯 脱卤素酶及邻氨基苯甲酸合酶。
[0106] 62.实施方案58所述的载体,其中所述第五序列包括编码除选择性标记以外蛋白质的序列。
[0107] 63.实施方案58至62所述的载体,其中所述第五序列包括一个或更多转录调节序列。
[0108] 64.实施方案58至63所述的载体,其中所述第五序列包括一个或更多增强或减弱蛋白质靶向的序列。
[0109] 65.实施方案63所述的载体,其中所述一个或更多转录调节序列增加EPSPS表达。
[0110] 66.实施方案63所述的载体,其中所述一个或更多转录调节序列减少EPSPS表达。
[0111] 67.实施方案58至66所述的载体,其中所述第五序列包括一个或更多编码小干扰RNA或微RNA或蛋白质一部分的序列
[0112] 68.实施方案67所述的载体,其中所述编码所述蛋白质一部分的序列包括与EPSPS染色体序列同源的序列。
[0113] 69.实施方案58所述的载体,其中所述第五序列包括突变体EPSPS染色体序列相应的野生型序列。
[0114] 70.实施方案58所述的载体,其中所述第五序列包括野生型EPSPS染色体序列相应的突变体序列。
[0115] 71.实施方案70所述的载体,其中所述突变体EPSPS染色体序列增加植物对除草剂草甘膦的耐受性。
[0116] 72.实施方案51至71所述的载体,其中所述第一序列与第三序列有至少35%的同源性。
[0117] 73.实施方案51至72所述的载体,其中所述第二序列与第四序列有至少35%的同源性。
[0118] 74.一种将外源核酸序列导入植物细胞基因组的方法,所述方法包括下述步骤:
[0119] (a)使所述细胞与实施方案51至73任一所述的供体载体接触;以及
[0120] (b)在所述细胞中表达锌指核酸酶(ZFN),其中所述ZFN剪切第三或第四序列之一的3千碱基对以内的在染色体DNA中的EPSPS基因(anEPSPS gene in chromosomal DNA 
within 3 kilobase pairs of either of the third or fourth sequences)。
[0121] 从而使步骤(b)中染色体DNA的剪切促进供体载体通过同源重组整合入基因组中。
[0122] 75.实施方案74所述的方法,其中所述EPSPS基因包含选自下组的核苷酸序列的EPSPS基因:SEQ ID NOS:10-14或与其至少有95%同一性的序列。
[0123] 76.一种在植物细胞中表达外源核酸序列产物的方法,所述方法包括下述步骤:
[0124] (a)使所述细胞与实施方案58至73任一所述的供体载体接触;
[0125] (b)在所述细胞中表达锌指核酸酶(ZFN),其中所述ZFN剪切第三或第四序列之一的3千碱基对以内的在染色体DNA中的EPSPS基因。
[0126] 从而使步骤(b)中染色体DNA的剪切导致供体载体通过同源重组整合入基因组中以及所述外源核酸序列的表达。
[0127] 77.实施方案76所述的方法,其中所述EPSPS基因包含选自下组的核苷酸序列EPSPS基因:SEQ ID NOS:10-14或与其至少有95%同一性的序列。
[0128] 78.根据实施方案74或75任一所述的方法获得的转基因植物细胞。
[0129] 79.一种含有实施方案78所述转基因植物细胞的植物。
[0130] 80.一种在植物细胞基因组中进行分子内同源重组的方法,所述方法包括下述步骤:
[0131] (a)提供包含EPSPS基因并进一步包含与第二序列同源的第一序列的DNA片段;
[0132] (b)使所述DNA片段与实施方案14至28任一所述的ZFN接触,其中ZFN在EPSPS基因序列处剪切所述DNA片段,从而促进分子内同源重组。
[0133] 81.实施方案80所述的方法,其中所述DNA片段对细胞是内源的。
[0134] 82.实施方案80或81所述的方法,其中所述同源重组发生在染色体上。
[0135] 83.实施方案82所述的方法,其中所述第一和第二序列间的DNA从染色体缺失。
[0136] 84.实施方案80至83任一所述的方法,其中所述EPSPS基因在基因组中为特有的。
[0137] 85.实施方案80至83任一所述的方法,其中一个或更多所述EPSPS基因的共生同源基因存在于所述基因组中。
[0138] 86.实施方案80至85任一所述的方法,其中所述ZFN包括一对融合蛋白,其中每个融合蛋白都是由IIS型限制性内切酶剪切域与改造的锌指结合区域融合而成的。
[0139] 87.实施方案80至86任一所述的方法,其中所述第二序列是自第一序列距离的至少100碱基对(the second sequence is at least 100 base pairs from thefirst 
sequence)。
[0140] 88.实施方案80至86任一所述的方法,其中所述EPSPS基因序列是自(from)所述第一或第二序列的至少100碱基对。
[0141] 89.实施方案80至86任一所述的方法,其中所述EPSPS基因序列位于所述第一和第二序列之间。
[0142] 90.实施方案80至89任一所述的方法,其中所述第一或第二序列之一对生物体为外源的。
[0143] 91.实施方案80至90任一所述的方法,其中所述第一和第二序列两者对于生物体均为外源的。
[0144] 92.实施方案83所述的方法,其中所述从染色体缺失的序列编码EPSPS基因的全部或一部分。
[0145] 93.实施方案83所述的方法,其中所述从染色体缺失的序列编码选择性标记的全部或一部分。
[0146] 94.实施方案93所述的方法,其中所述选择性标记选自下组:绿色荧光蛋白(GFP)、β-葡糖醛酸糖苷酶(GUS)、phosphinothricin N-乙酰转移酶(PAT,BAR)、新霉素磷酸转移
酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二氧合酶、α-淀粉酶、酪氨酸酶、β-半乳糖苷酶、
荧光素酶、水母发光蛋白、EPSP合酶、腈水解酶、乙酰乳糖合酶(ALS)、二氢叶酸还原酶
(DHFR)、茅草枯脱卤素酶及邻氨基苯甲酸合酶。
[0147] 95.实施方案83所述的方法,其中所述缺失的DNA被外源序列取代,所述方法进一步包括:
[0148] 将多核苷酸导入所述细胞,其中所述多核苷酸包括:
[0149] (a)第四和第五序列,其中所述第四序列与靠近第一序列的非缺失序列同源,且第五序列与靠近第二序列的非缺失序列同源;以及
[0150] (b)所述外源序列。
[0151] 96.实施方案95所述的方法,其中所述外源序列是选择性标记。
[0152] 97.实施方案96所述的方法,其中所述选择性标记选自下组:绿色荧光蛋白(GFP)、β-葡糖醛酸糖苷酶(GUS)、phosphinothricin N-乙酰转移酶(PAT,BAR)、新霉素磷酸转移
酶、潮霉素磷酸转移酶、β-内酰胺酶、儿茶酚二氧合酶、α-淀粉酶、酪氨酸酶、β-半乳糖苷酶、
荧光素酶、水母发光蛋白、EPSP合酶、腈水解酶、乙酰乳糖合酶(ALS)、二氢叶酸还原酶
(DHFR)、茅草枯脱卤素酶及邻氨基苯甲酸合酶。
[0153] 98.实施方案95所述的方法,其中所述外源序列为EPSPS基因序列。
[0154] 99.实施方案98所述的方法,其中所述EPSPS基因序列包含突变。
[0155] 100.实施方案99所述的方法,其中所述突变增加植物对除草剂草甘膦的耐受性。
[0156] 101.一种从植物基因组中缺失EPSPS基因序列的方法,所述方法包括:
[0157] (a)提供包含EPSPS基因序列的植物细胞;以及
[0158] (b)在所述细胞中表达第一和第二锌指核酸酶(ZFN),其中第一ZFN在第一剪切位点剪切,而第二ZFN在第二剪切位点剪切,其中所述EPSPS基因序列位于第一剪切位点和第
二剪切位点之间,其中第一和第二剪切位点的剪切导致所述EPSPS基因序列的缺失。
[0159] 102.实施方案101所述的方法,其中通过所述第一和第二剪切位点的非同源末端联接缺失所述EPSPS基因序列。
[0160] 103.实施方案101或102所述的方法,其中所述第一和第二剪切位点间隔至少100核苷酸。
[0161] 104.实施方案101或102所述的方法,其中所述植物细胞是转基因植物细胞。
[0162] 105.实施方案101或102所述的方法,其中所述EPSPS基因是外源序列。
[0163] 106.实施方案101或102所述的方法,其中所述EPSPS基因是内源序列。
[0164] 107.一种调整EPSPS基因调节的方法,所述方法包括:
[0165] (a)提供含有EPSPS基因序列的植物细胞;以及
[0166] (b)在所述细胞中表达ZFP,其中所述ZFP与所述EPSPS基因中的靶位点结合,从而调整所述EPSPS基因的调节。
[0167] 108.实施方案107所述的方法,其中所述靶位点是所述EPSPS基因的 调节序列。
[0168] 109.实施方案107所述的方法,其中所述靶位点位于所述EPSPS基因转录起始位点的上游。
[0169] 110.实施方案107所述的方法,其中所述靶位点邻近所述EPSPS基因的转录起始位点。
[0170] 111.实施方案107所述的方法,其中所述靶位点位于所述EPSPS基因转录起始位点的下游。
[0171] 112.实施方案107所述的方法,其中所述ZFP增加EPSPS基因的转录。
[0172] 113.实施方案112所述的方法,其中所述ZFP增加植物对除草剂草甘膦的耐受性。
[0173] 114.实施方案107所述的方法,其中所述ZFP减少所述EPSPS基因的转录。
[0174] 115.实施方案114所述的方法,其中所述ZFP减少植物对除草剂草甘膦的耐受性。
[0175] 鉴于本文的公开,本领域一般技术人员可以容易的想到本发明的这些和其它实施方案。
[0176] 附图简述
[0177] 图1显示Southern Blot,提供了欧洲油菜(B.Napus)变种Nex710、芜菁(B.rapa)与甘蓝(B.oleracea)基因组中EPSPS基因数的估计。(标准标记是Promega的分析DNA宽量程标
记)
[0178] 图2A-2E显示产生ZFN表达构建体所用克隆策略的概图表示。使用分步克隆策略:将ZFN编码基因各自克隆入载体pVAX-C2A-NLSop2-EGFP-FokMono(图2A)与pVAX-N2A-
NLSop2-EGFP-FokMono(图2B)以构建双重蛋白质盒(图2C)。将该盒与pDAB3731连接以产生
最终质粒(图2D)以表达ZFN异源双聚体。随即将所述ZFN盒使用Gateway技术转移入二元载
体以构建土壤杆菌(Agrobacterium)-介导欧洲油菜转化构建体(图2E)。ZFN d2=10654-
CH3-v2;ZFN rb2=10657-CH3-v2。
[0179] 图3A-D显示EPSPS的共生同源基因特异性扩增。图3A-3D分别表示共生同源基因A、B、C与D特异性PCR分析。1-6泳道包含下列DNA。泳道 1:无DNA PCR对照;泳道2:欧洲油菜变
种Nex710 DNA(10ng/μl);泳道3、4、5与6包含共生同源基因基因D、C、B与A(1570bp)以1ng/μ
l的浓度作为阳性对照的扩增DNA。PCR产物在2%E-GEL96(Invitrogen,Carlsbad,CA)上泳
动,使用GEL DPC 2000胶文档编制系统(Bio-Rad,Hercules,CA)显影。捕捉图像并使用
QUANTITY ONE软件(Bio-Rad,Hercules,CA)分析,并进一步使用E-EDITOR软件
(Invitrogen,Carlsbad,CA)处理。片断大小以碱基对(bp)表示。
[0180] 图4显示ZFN对欧洲油菜EPSPS共生同源基因的结合与剪切位点。需要两个ZFN蛋白质以实施DNA的双链(ds)剪切。在剪切位点上游,以向下箭头标示,一个蛋白质(10567或
10658)与下划线所示的核苷酸相联,而另一个蛋白质(10654)结合下划线所示序列的下游。
只有当两个蛋白质均与其相应的位点结合时,剪切才发生。在5个共生同源基因中有一对在
一个或两个ZFN结合位点由轻微的序列差异(下划线)提供了序列特异性,并导致在所述共
生同源基因中选择性的双链剪切。
[0181] 图5显示在EPSPS共生同源基因D中的ZFN介导缺失。在B.napus中,在EPSPS共生同源基因D中存在的ZFN介导双链DNA断裂经非同源末端联接(NHEJ)修复导致2bp的缺失。所述
ZFN pDAB7151的剪切靶为CAGTT,这对应于所述2bp的GT缺失。底图:预期的野生型序列;顶
图:使用SEQUENCHER软件对26个共生同源基因D克隆进行序列比对,显示所述2bp缺失。这些
序列由13个克隆的正向与反向引物测序获取。
[0182] 图6显示在B.napus EPSPS共生同源基因D中ZFN-介导双链断裂导致的NHEJ。显示多个NHEJ缺失相对于野生型DNA中预期的剪切位点(顶)的序列比对。右手侧括号中的数字
显示见于序列比对中相同的分子数。
[0183] 图7A-7B显示在B.napus EPSPS共生同源基因C和D中ZFN-介导双链断裂导致的NHEJ。显示多个NHEJ缺失相对于野生型与经处理的试样中预期的剪切位点(顶)的序列比
对。试样号对应表5所示的号码。
[0184] 图8A-8C显示在B.napus EPSPS共生同源基因A和B中ZFN-介导双链断裂导致的NHEJ。显示多个NHEJ缺失相对于野生型与经处理的试样中预期的剪切位点(顶)的序列比
对。试样号对应表6所示的号码。
[0185] 图9(SEQ ID NO:10)显示B.napus EPSPS共生同源基因A的序列。
[0186] 图10(SEQ ID NO:11)显示B.napus EPSPS共生同源基因B的序列。
[0187] 图11A-11B(SEQ ID NO:12)显示B.napus EPSPS共生同源基因C的序列。
[0188] 图12A-12B(SEQ ID NO:13)显示B.napus EPSPS共生同源基因D的序列。
[0189] 图13A-13B(SEQ ID NO:14)显示B.napus EPSPS共生同源基因E的序列。
[0190] 图14,小图A至E描述肾293报道细胞中示例性EPSPS ZFN(亦参见实施例3)的基因修正活性。图14A显示使用ZFN对10654与10658的基因修正活性。图14B显示使用ZFN对10654
与10658的基因修正活性。图14C显示使用ZFN对9875与10275的基因修正活性。图14D显示使
用ZFN对10740/10741与10749/10742的基因修正活性。图14E显示使用每个直方(bar)下显
示的ZFN对的基因修正活性。
[0191] 详细描述
[0192] 本文公开了适用于调节表达及靶向剪切与改变植物基因,尤其是植物共生同源基因的组合物与方法。共生同源基因调节的可通过,例如使用改造ZF转录因子或修饰基因调
节区域的方法来调节。基因可通过,例如靶向剪切继以染色体内同源重组或靶向剪切继以
外源多核苷酸(包含一个或更多与基因核苷酸序列同源的区域)与基因组序列同源重组的
方法来改变。共生同源基因一个非限定性的例子是EPSPS基因。
[0193] 基因组序列包括存在于染色体、附加体(游离基因)、细胞器基因组(例如,线粒体,叶绿体)、人工染色体以及任何其它类型存在于细胞中的核酸,例如扩增序列、双微染色体
及内源或感染的细菌与病毒的基因组中的序列。基因组序列可以是正常的(亦即野生型)或
突变体;突变体序列可能包括,例如插入、删除、易位、重排和/或点突变。基因组序列亦可包
括多个不同等位基因中的一个。
[0194] 本文公开的组合物包括一个或更多ZFP,所述ZFP包括改造的锌指结合区域、编码这些多肽的多核苷酸、以及ZFP与编码ZFP的多核苷酸的组合。锌指结合区域可包括一个或
更多锌指(例如,2、3、4、5、6、7、8、9或更多锌指),且可改造以与任何EPSPS基因组序列结合。
[0195] 本文描述的ZFP通过激活或阻抑基因转录可用于调节EPSPS基因表达。 可构建包括锌指结构域连接到调节区的融合体的ZFP以产生激活或阻抑基因转录的嵌合转录因子。
通过将锌指结构域与核酸酶剪切域(或剪切半域)连接以产生锌指核酸酶,ZFP亦可用于靶
向剪切目标EPSPS基因组区域。因此,通过识别目标EPSPS基因组区域,且在该区域期望基因
调节、剪切或重组,根据本文公开的方法,可构建包括一个或多个融合蛋白的锌指蛋白,所
述融合蛋白包括一个或更多与经改造以在该基因组区域识别EPSPS基因区域的锌指结构域
连接的调节区和/或剪切域(或剪切半域)。细胞中所述包含融合蛋白(或多个融合蛋白)的
ZFP的存在会导致所述融合蛋白结合到其结合位点,或在所述基因组区域内或附近剪切以
及调节的改变。另外,如果EPSPS基因组区域被剪切且与该EPSPS基因组区域同源的外源多
核苷酸亦存在于该细胞中,高频度的同源重组会发生在所述EPSPS基因组区域与所述外源
多核苷酸之间。
[0196] 植物细胞可包含一个或更多同源或共生同源EPSPS基因序列,其中数个或全部可作为本文公开方法进行修饰的靶。因此,本文描述的组合物可能在植物细胞中靶向一个或
更多EPSPS基因,例如,1、2、3、4、5或直至任何数量或所有存在植物细胞中的EPSPS共生同源
基因。一些ZFP可能在植物细胞中特异性的与一个特定的EPSPS共生同源基因结合。其它ZFP
可能在植物细胞中与多个EPSPS共生同源基因结合。因此,一个或更多ZFP或编码具有不同
特性ZFP的表达载体可以组合以在植物细胞中靶向期望的目标EPSPS基因。
[0197] 总述
[0198] 除非指明为其它,所述方法的实行以及本文公开的组合物的制备与用途使用分子生物学、生物化学、染色质结构与分析、计算化学、细胞培养、重组DNA与相关领域的常规方
法,只要它们属于本领域的常规技术。这些技术在文献中完全得到阐明。例如,参见
Sambrook et al.MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold 
Spring Harbor LaboratoryPress,1989 and Third edition,2001;Ausubel et al.,
CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley & Sons,New York,1987 and 
periodicupdates;the series METHODS IN ENZYMOLOGY,Academic Press,San Diego;
Wolffe,CHROMATIN STRUCTURE AND FUNCTION,Third edition,Academic Press,San 
Diego,1998;METHODS IN ENZYMOLOGY,Vol.304,“Chromatin”(P.M.Wassarman and 
A.P.Wolffe,eds.),Academic Press,San Diego,1999;METHODS IN MOLECULAR BIOLOGY,
Vol.119,“Chromatin Protocols”(P.B.Becker,ed.)Humana Press,Totowa,1999。
[0199] 定义
[0200] 术语“核酸”、“多核苷酸”与“寡聚核苷酸”可互换使用,指脱氧核糖核酸或核糖核酸多聚体,具有链状或环状构造,并为单链或双链形式。在本公开中使用时,这些术语不应
解释为针对多聚体长度作出限定。该术语可包容天然核酸的已知类似物,以及在其碱基、糖
和/或磷酸部分(例如,磷硫酰骨架)有修饰的核苷酸。一般而言,特定核苷酸的类似物具有
相同的碱基配对特异性;亦即,A的类似物将与T碱基配对。
[0201] 术语“多肽”、“肽”与“蛋白质”可互换使用,指氨基酸残基的多聚体。该术语亦适用于其一个或更多氨基酸是相应的天然存在氨基酸的化学类似物或修饰衍生物的氨基酸多
聚体。
[0202] “结合”指序列特异的,非共价的大分子间相互作用(例如,蛋白质与核酸间)。在结合相互作用中,并不需要所有部分都是序列特异的(例如,与DNA骨架中磷酸残基的接触),
只要作为整体该相互作用是序列特异的即可。上述相互作用通常以解离常数(Kd)为10-6M-1
或更小为特征。“亲和力”指所述结合的强度:增加结合亲和力对应Kd减少。
[0203] “结合蛋白”是具有与另一个分子非共价结合能力的蛋白质。结合蛋白可与,例如,DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。
对于蛋白质结合蛋白,该蛋白质可与自身(以形成同源二聚体,同源三聚体等等)和/或一个
或更多不同的蛋白质分子结合。结合蛋白可具有多于一种类型的结合活性。举例而言,锌指
蛋白具有DNA结合、RNA结合与蛋白质结合活性。
[0204] “锌指DNA结合蛋白”(或结合区域)是通过一个或更多锌指,以序列特异性为特征与DNA结合的蛋白质,或更大蛋白质中的域,所述锌指是在结合区域中的氨基酸序列区域,
其结构通过锌离子的配位作用稳定化。术语锌指DNA结合蛋白常常缩写为锌指蛋白或ZFP。
[0205] 锌指结合区域可经“改造”以与预先确定的核苷酸序列(例如,EPSPS基 因序列)结合。改造锌指蛋白方法的非限定性示例包括设计及选择。设计的锌指蛋白是非天然存在的
蛋白质,其设计/组成主要来自理性的标准。设计的理性标准包括运用取代法则及计算机算
法以处理存储已有的ZFP设计与结合数据信息的数据组中的信息。举例而言,参见
U.S.Patents 6,140,081;6,453,242;6,534,261;以及6,785,613;亦参见WO 98/53058;WO 
98/53059;WO 98/53060;WO 02/016536与WO 03/016496;以及U.S.Patents 6,746,838;6,
866,997与7,030,215。因此,“改造”锌指蛋白或“非天然”锌指蛋白为其一个或更多锌指DNA
结合区域组分(识别螺旋)为非天然的,且经改造以与事先选定的靶位点结合的蛋白质。
[0206] “选择的”锌指蛋白是非见于天然的蛋白质,其产生主要来自例如噬菌体展示、相互作用陷阱(trap)或杂交选择的经验性过程。举例而言,参见US 5,789,538;US 5,925,
523;US 6,007,988;US 6,013,453;US 6,200,759;US 6,733,970;US RE39,229;以及WO 
95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970WO 01/
88197与WO 02/099084。
[0207] 术语“序列”指任何长度的核苷酸序列,可以是DNA或RNA;可以是链状、环状或分枝的,且可以是单链或双链的。术语“供体序列”指插入基因组的核苷酸序列。供体序列可以是
任何长度,例如长度在2至25000核苷酸之间(或任何之间或之上的整数),优选长度在100至
5000核苷酸之间(或任何之间或之上的整数),较优选长度大约在200至2500核苷酸之间。
[0208] “同源序列”指与第二序列具有部分序列同一性的第一序列,且其序列可以为与第二序列完全相同。“同源非相同序列”指与第二序列具有部分序列同一性的第一序列,但其
序列与第二序列并不完全相同。举例而言,包含突变基因野生型序列的多核苷酸与该突变
基因同源且不完全相同。在一些实施方案中,所述两序列间的同源程度足以使利用正常细
胞机理使两者之间同源重组成为可能。两个同源非完全相同序列可以为任何长度,且其非
同源程度可以小到一个核苷酸(例如,利用靶向同源重组校正基因组点突变的情况),或大
到10或更多千碱基对(例如,在染色体中预先确定的位点插入基因的情况)。包含同源非相
同序列的两个多肽无需长度相同。举例而言,可使用20至10000核苷酸或核苷酸对的外源多
核苷酸(亦即,供体多核苷酸)。
[0209] 确定核酸及蛋白质序列同一性的技术在本领域是已知的。通常,上述技 术包含确定基因mRNA的核苷酸序列和/或确定由其编码的氨基酸序列,并用这些序列与第二个核苷
酸或氨基酸序列比较。亦可用此方式确定并比较基因组序列。一般而言,相同(同一性)指两
个多核苷酸或多肽中各自准确的核苷酸-核苷酸或氨基酸-氨基酸对应。两个或更多序列
(多核苷酸或氨基酸)可通过确定其同一性百分比相比较。不管是核酸还是氨基酸序列,两
个序列的同一性百分比,为两个序列比对的序列间准确匹配数除以较短序列的长度再乘以
100。一个近似的核酸序列序列比对由Smith and Waterman,Advances inApplied 
Mathematics 2:482-489(1981)的局部同源算法提供。通过使用Dayhoff, Atlas of 
Protein Sequences and Structure,M.O.Dayhoff ed.,5 suppl.3:353-358,National 
Biomedical Research Foundation,Washington,D.C.,USA研制以及Gribskov,Nucl.Acids 
Res.14(6):6745-6763(1986)正态化的评分矩阵,该算法可用于氨基酸序列。用该算法确定
序列同一性度的示例性实施由GeneticsComputer Group(Madison,WI)提供于“BestFit”应
用程序中。该方法的缺省参数描述于Wisconsin Sequence Analysis Package Program 
Manual,Version 8(1995)(可自Genetics Computer Group,Madison,WI得到)中。在本发明
背景下确立相同率的优选方法是使用爱丁堡大学拥有版权,由John F.Collins与Shane 
S.Sturrok研制,以及IntelliGenetics,Inc.(Mountain View,CA)发布的MPSRCH程序集。在
该套程序集中,当缺省参数用于评分表时(例如,开放间隔罚分(gap open penalty)12,
(gap extension penalty)延伸间隔罚分1,(gap)间隔罚分6),可以使用Smith-Waterman算
法。根据所得的数据,“匹配”值反映了序列同一性程度。其它适合用来计算序列间同一性百
分比或相似度的程序在本领域通常是公知的,例如,另一个序列匹配程序是BLAST,使用缺
省数据。例如,BLASTN和BLASTP可使用下述缺省参数:遗传密码(geneticcode)=标准
(standard);过滤(filter)=无(none);链(strand)=双(both);截断值(cutoff)=60;期
望值(expect)=10;模型(Matrix)=BLOSUM62;描述(Descriptions)=50序列;排列(sort 
by)=高分(high score);数据库(Databases)=非冗余(non-redundant),Genbank+EMBL+
DDBJ+PDB+GenBank CDStranslations+Swiss protein+Spupdate+PIR。这些程序的细节可
以在互联网上找到。考虑本文描述的序列,所期望的序列同一性度大约为35%至100%以及
任何之间的整数值。典型的,序列间同一性百分比为至少35%-40%;40%-45%;45%-
50%;50%-60%;60%-70%;70-75%,优选为80-82%,较优选为85-90%, 更优选为92%,
进一步较优选为95%,最优选为98%序列同一性。
[0210] 或者,多核苷酸之间的序列相似度可通过下述方法确定:在允许同源区域间形成稳定双联体的条件下进行多核苷酸杂交,继以用单链特异性核酸酶消化,并确定消化后片
段的大小。两个核酸,或两个多肽序列在下述情况下为基本上相互同源:所述序列在确定长
度分子上,显示如上述方法确定的至少大约70-75%,优选80%-82%,较优选85%-90%,更
优选92%,进一步更优选95%,最优选98%序列同一性。在此所用的基本上同源亦指与特定
DNA或多肽序列显示为完全同一性的序列。亦可用Southern杂交实验辨识DNA序列基本上同
源,所述实验是在根据该系统定义的严格条件下进行的。确定合适的杂交条件属于本领域
公知技术。例如,参见Sambrook et al.,supra; Nucleic Acid Hybridization:A 
Practical Approach,editors B.D.Hames and S.J.Higgins,(1985)Oxford;Washington,
DC;IRL Press)。
[0211] 两个核酸片段的选择性杂交可以通过下述确定。两个核酸分子间的序列同一性(identical)度影响上述分子间杂交反应的效率和强度。部分相同的核酸序列将至少部分
抑制完全相同序列对靶分子的杂交。对完全相同序列杂交的抑制可用本领域众所周知的杂
交分析(例如,Southern(DNA)blot、Northern(RNA)blot、溶液杂交,或类似,参见Sambrook,
et al.,Molecular Cloning:ALaboratory Manual,Second Edition,(1989)Cold Spring 
Harbor,N.Y.)来评估。上述分析可使用不同程度的选择度进行,例如,使用从低到高严格程
度不同的条件。如果采用低严格度条件,可以使用甚至缺乏部分序列同一性度(例如,与靶
分子具有少于30%序列同一性的探针)的第二探针评估非特异性结合不存在,从而,在不存
在非特异性结合反应时,第二探针将不会与靶杂交。
[0212] 当使用基于杂交的检测系统时,选择与参考核酸序列互补的核酸探针,并随即通过选择合适的条件,所述探针与所述参考序列选择性的相互杂交或结合以形成双链分子。
能够与参照序列在中等严格杂交条件下选择性的与参照序列杂交的核酸分子通常在下述
条件下杂交:即允许检测至少约为10-14核苷酸长度,具有与所选核酸探针序列有超过约
70%的序列同一性的靶核酸序列。严格杂交条件通常允许检测至少约为10-14核苷酸长度,
具有与所选核酸探针序列有超过约90-95%的序列同一性的靶核酸序列。有用于探针/参考
序列杂交的杂交条件,其中所述探针与所述参考序列具有特定程度的序列同一性,可如本
领域已知方法确定(参见,例如,Nucleic Acid Hybridization:APractical Approach,
editors B.D.Hames and S.J.Higgins,(1985)Oxford;Washington,DC;IRL Press)。
[0213] 杂交条件对本领域技术人员为众所周知的。杂交严格度指杂交条件不利于形成含有错配核苷酸杂交体的程度,严格度越高,则对错配杂交体的容忍度越低。影响杂交严格度
的因素对本领域技术人员为众所周知的,且包括,但不仅限于:温度,pH,离子强度,有机溶
剂,例如甲酰胺与二甲亚砜的浓度。如本领域技术人员所知,杂交严格度随温度升高,离子
强度降低与溶剂浓度降低而增加。
[0214] 就杂交严格条件而论,在本领域众所周知可使用很多等价条件通过,例如,改变下列因素以确立特定严格度:所述序列的长度与本性,不同序列的碱基构成,盐与其它杂交溶
液组分浓度,是否在所述杂交溶液中存在封闭剂(例如,硫酸葡聚糖,与聚乙二醇),杂交反
应温度与时间参数,以及,改变洗涤条件。选择特定组的杂交条件选自本领域的下列标准方
法(参见,例如,Sambrook,et al.,Molecular Cloning:A Laboratory Manual,Second 
Edition,(1989)Cold Spring Harbor,N.Y.)。
[0215] “重组”指在两个多核苷酸间交换遗传信息的过程。就本公开考虑,“同源重组(HR)”指上述交换的下述特定形式,即,例如,发生于细胞中的双链断裂修复。该过程需要核
苷酸序列的同源性,使用“供体”分子作为模板修复“靶”分子(亦即,经受双链断裂的分子),
该过程以“非交换基因转换(non-crossover gene conversion)”或“短路基因转换(short 
track geneconversion)”等不同名称为人所知,因其导致遗传信息从所述供体转移至所述
靶。虽不愿拘于任何特定理论,但该转移可涉及在断裂靶与所述供体间形成的异源双链DNA
的错配校正,和/或“合成依存性链退火(synthesis-dependent strand annealing)”,其中
所述供体用于重新合成遗传信息,该遗传信息将成为靶的一部分,和/或相关过程。上述特
定HR常导致所述靶分子序列的改变,从而使所述供体多核苷酸部分或全部序列掺入所述靶
多核苷酸中。
[0216] “剪切”指DNA分子共价骨架的断裂。剪切可通过多种方法起始,包括但不仅限于,磷酸二酯键的酶或化学水解。单链剪切与双链剪切均为可能,且双链剪切可作为两个分别
的单链剪切事件的结果发生。DNA剪切可导致平端或交错末端的产生。在一些实施例中,融
合多肽用于靶向双链DNA剪切。
[0217] “剪切域”包括一个或更多具有DNA剪切催化活性的多肽序列。剪切域可包含于单独的多肽链中,或剪切活性可来源于两个(或更多)多肽的联合。
[0218] “剪切半域”为下述的多肽序列,即其与第二多肽(可为相同或相异的)结合形成具有剪切活性的复合物(优选为双链剪切活性)。
[0219] “染色质”为包含细胞基因组的核蛋白结构。细胞染色质包括核酸,主要为DNA,与蛋白质,包括组蛋白与非组蛋白染色体蛋白。真核细胞染色质绝大多数以核小体形式存在,
其中核小体(nucleosome)核心包括大约150碱基对,与包含组蛋白H2A,H2B,H3与H4各两个
的八聚体(octamer)相联系的DNA;以及在核小体核心间延伸的接头DNA(根据生物体不同,
可为不同长度)。组蛋白H1分子通常与所述接头DNA相联系。就现行公开考虑,术语“染色质”
意为包含所有类型的细胞核蛋白,原核与真核两者皆可。细胞染色质(chromatin)包括染色
体与附加体染色质。
[0220] “染色体”为包含细胞全部或部分基因组的染色质复合物。细胞基因组经常以染色体组型为特征,所述染色体组型包含细胞基因组的所有染色体集合。细胞基因组可包括一
个或更多染色体。
[0221] “附加体”为可复制的核酸,核蛋白复合物或其它包含核酸的结构,且其不为细胞染色体的染色体组型(karyotype)一部分。附加体的示例包括质粒与一些病毒基因组。
[0222] “可及区域(accessible region)”为细胞染色质上的位点,所述细胞染色质中存在于该核酸中的靶位点可由识别该靶位点的外源分子结合。虽不愿拘于任何特定理论,但
相信可及区域为未包装入核小体结构内的区域。可及区域的迥异结构常可通过其对化学与
酶探针,例如核酸酶的敏感度进行检测。
[0223] “靶位点”或“靶序列”为限定核酸一部分的核酸序列,且若足以允许结合的条件存在,结合分子将结合其上。举例而言,序列5’-GAATTC-3’为EcoRI限制性内切酶的靶位点。
[0224] “外源”分子为非正常存在于细胞中,但可通过一种或更多遗传学,生物化学或其它方法导入细胞的分子。“正常存在于细胞”为根据细胞特定发育阶段与环境条件所确定。
因此,例如,仅在肌肉胚胎发育中存在的分子就成年肌肉细胞而论为外源分子。类似的,由
热激诱导的分子就非经热激的细胞而论为外源分子。外源分子可包括,例如,功能障碍性内
源分子的功能性版 本,或正常功能性内源分子的功能障碍性版本。
[0225] 外源分子可为,除其它外,小分子,例如,通过组合化学过程生成的,或大分子,例如蛋白质,核酸,水化合物,脂肪,糖蛋白,脂蛋白,多糖,任何上述分子的修饰衍生物,或
任何含有一种或更多上述分子的组合物。核酸包括DNA与RNA,可为单链或双链;可为线性,
分支的或环状;且可为任何长度。核酸包括那些能够形成双链,以及可形成三链的核酸。参
见,例如,U.S.Patent Nos.5,176,996与5,422,251。蛋白质包括,但不仅限于,DNA结合蛋
白,转录因子,染色质重建因子,甲基化DNA结合蛋白,多聚酶,甲基酶,脱甲基酶,乙酰酶,脱
乙酰酶,激酶,磷酸酶,整合酶,重组酶,连接酶,拓扑异构酶,促旋酶(gyrase)与解旋酶。
[0226] 外源分子可为与内源分子为相同类型的分子,例如,外源蛋白质或核酸。举例而言,外源核酸可包括感染性的病毒基因组,根癌土壤杆菌(Agrobacterium tumefaciens)T-
链,导入细胞的质粒或附加体,或正常情况下不存在于细胞中的染色体。将外源分子导入细
胞的方法对本领域技术人员为已知的,且包括但不仅限于,脂肪介导转移(亦即,脂质体,包
括中性与阳离子性脂肪),电穿孔,直接注射,细胞融合,颗粒轰击,磷酸共沉淀,DEAE葡聚
糖介导转移与病毒载体介导转移。外源分子包括非植物分子,例如,哺乳类(例如,人类或人
源化)抗体
[0227] 相反,“内源”分子为正常情况下在特定发育阶段中在特定环境条件下存在于特定细胞中的分子。举例而言,内源核酸可包括染色体,线粒体,质体或其它细胞器的基因组,或
天然存在的附加体核酸。除此之外内源分子可包括蛋白质,例如,转录因子与酶。
[0228] “融合”分子为下述分子,即其中两个或更多亚基分子相连接,优选为共价连接。所述亚基分子可为同样化学类型分子,或可为不同化学类型分子。第一种类型的融合分子的
示例包括但不仅限于,融合蛋白(例如,包含ZFPDNA结合区域与剪切域融合的ZFN)与融合核
酸(例如,编码上述融合蛋白的核酸)。第二类型融合分子的示例包括但不仅限于,形成三链
的核酸与多肽间的融合,以及小沟结合物质与核酸间的融合。
[0229] 在细胞中融合蛋白的表达可来自将所述融合蛋白递送到所述细胞中,或将编码所述融合蛋白的多核苷酸递送到细胞中,并在其中转录所述多核苷酸,翻译所得转录物以产
生融合蛋白。在细胞中表达蛋白质亦可涉及反式剪接, 多肽剪切与多肽连接。将多核苷酸
与多肽递送至细胞的方法在本公开其它部分表示。
[0230] “基因”,对现行公开目的而言,包括编码基因产物(参见下文)的DNA,以及所有调节基因产物产生的DNA区域,无论上述调节序列是否邻近编码和/或转录序列。相应的,基因
包括但不仅限于,启动子序列,终止子,翻译调节序列例如核糖体结合位点与内核糖体进入
位点,增强子,沉默基因,绝缘子(insulator),边界元件,复制起点,基质连接位点与基因座
控制区。
[0231] “基因表达”指将包含于基因中的信息转换为基因产物。基因产物可为基因的直接转录产物(例如,mRNA,tRNA,rRNA,反义RNA,核酶,shRNA,微RNA,结构RNA或任何其它类型的
RNA)或mRNA翻译产生的蛋白质。基因产物亦包括通过例如帽化,多腺苷酸化,甲基化与编辑
等过程修饰的RNA,以及通过例如甲基化,乙酰化,磷酸化,遍在蛋白化(ubiquitination),
ADP-核糖基化,十四烷基化(myristilation)以及糖基化修饰的蛋白质。
[0232] 基因表达的“调整”指基因活性的改变。表达的调整可包括但不仅限于,基因激活与基因阻抑。
[0233] “植物”细胞包括但不仅限于,单子叶植物(monocots)或双子叶植物(dicots)的细胞。单子叶植物的非限定性示例包括谷类植物例如玉米,水稻,大麦,燕麦,小麦,高粱,黑
麦,甘蔗,菠萝,洋葱,香蕉与椰子。双子叶植物的非限定性示例包括烟草,番茄,向日葵,
花,甜菜,铃薯,生菜,甜瓜,大豆,canola(菜籽)与苜蓿。植物细胞可来自所述植物任何部
分和/或植物发育的任何阶段。
[0234] “目标区域”为细胞染色质的任何区域,例如,基因或者在基因内或邻近基因的非编码序列,其中期望其与外源分子结合(例如,EPSPS目标区域包含在EPSPS基因内或邻近其
的区域)。结合可以靶向DNA剪切和/或靶向重组为目的。目标区域可存在于染色体,附加体,
细胞器基因组(例如,线粒体或质体),或例如感染病毒基因组。目标区域可在基因编码区域
内,可在转录的非编码区域内,例如,引导序列,尾随序列或内含子,或在非转录区域内,无
论是所述编码区域的上游或下游。目标区域可小至1对核苷酸或直至长度为25000对核苷
酸,或任何整数值的核苷酸对。
[0235] 术语“可操作的连接”与“可操作的连接于”可互换用于指将两个或更多组分(例如序列元件)并列,其中所述组分如此排列,使得两个组分均正 常运作,并使至少其中一个组
分能够介导施加于至少一个其它组分的功能。欲举例说明,则可称转录调节序列,例如启动
子与编码序列为可操作的连接,如若所述转录调节序列根据是否存在一个或更多转录调节
因子控制所述编码序列的转录水平。转录调节序列通常与编码序列顺式可操纵的连接,但
无需直接与其相邻。举例而言,增强子为可操作的连接于编码序列的转录调节序列,尽管其
并不毗连。
[0236] 就融合多肽而论,术语“可操作的连接”可指下述事实,即其每个组分与其它组分相连接时实施同样功能,正如其未如此连接时仍将如此实施一般。举例而言,就ZFP DNA结
合区域与剪切域融合的融合多肽而论,所述ZFPDNA结合区域与所述剪切域为可操作的连
接,如若在此融合多肽中,所述ZFP DNA结合区域能够与其靶位点和/或其结合位点结合,而
所述剪切域能够在所述靶位点附近剪切DNA。
[0237] 蛋白质,多肽或核酸的“功能性片段”为其序列不同于全长蛋白质,多肽或核酸,但其保留与全长蛋白质,多肽或核酸相同功能的蛋白质,多肽或核酸。功能片段可拥有较之相
应天然分子更多,更少或相同数量残基,和/或可含有一个或更多氨基酸或核苷酸取代。确
定核酸功能的方法(例如,编码功能,与其它核酸杂交的能力)在本领域为众所周知的。类似
的,确定蛋白质功能的方法为众所周知的。举例而言,多肽的DNA结合功能可通过,例如,滤
膜结合,电泳迁移率变动或免疫沉淀分析进行确定。DNA剪切可通过凝胶电泳来分析。参见
Ausubel et al.,见上。蛋白质与另一种蛋白质相互作用的能力可通过下述方法确定:例
如,共同免疫沉淀,双杂交分析或者互补分析,可为遗传的亦可为生物化学的。参见,例如
Fields et al.(1989)Nature340:245-246;U.S.Patent No.5,585,245与PCT WO 98/
44350。
[0238] 靶位点
[0239] 所述披露的方法与组合物包括含有下述融合蛋白的ZFP:即所述融合蛋白包括调节区或剪切域(或剪切半域)与锌指结构域,其中所述锌指结构域,通过结合于细胞染色质
上的序列(例如,EPSPS基因靶位点或结合位点),将所述调节区或剪切域(或剪切半域)的活
性引导至所述序列附近,并且由此调整转录,或在所述靶序列的附近诱导剪切。如在该披露
其它地方所提出的一般,锌指结构域可经改造以与几乎任何所期望的序列结合。相应的,在
识 别目标区域含有下述序列,即在此期望基因调节,剪切或重组,则一个或更多锌指结合
区域可经改造以与一个或更多在目标区域内的序列结合。
[0240] 在细胞染色质中选择EPSPS目标基因组区域以供锌指结构域(例如,靶位点)结合可由下述方法达成,例如,根据公开于共有的US Patent No.6,453,242(Sept.17,2002)中
的方法,其亦公开了涉及ZFP以与选择序列结合的方法。本领域技术人员应清楚简地对核苷
酸序列的肉眼检查亦可用于选择靶位点。相应的,在所要求的方法中可使用任何选择靶位
点的方法。
[0241] 靶位点通常包括多个邻近的靶亚位点。靶亚位点指由单独锌指结合的序列(通常或者为核苷酸三联体,或可与邻近的核苷酸四联体有一个核苷酸重叠的核苷酸四联体)。参
见,例如,WO 02/077227。若将锌指蛋白接触最多的链定义为靶链“主要(primary)识别链”
或“主要接触链”,则一些锌指蛋白与靶链上的三碱基三联体以及非靶链的第四个碱基结
合。靶位点通常至少长为9个核苷酸,且相应的,由含有至少三个锌指的锌指结合区域结合。
然而,例如,亦有可能4-指结合区域与12-核苷酸靶位点结合,5-指结合区域与15-核苷酸靶
位点结合,或6-指结合区域与18-核苷酸靶位点结合。显而易见,更大的结合区域(例如,7-,
8-,9-指或更多)与更长靶位点的结合亦为可能的。
[0242] 靶位点并不需要为三的倍数个核苷酸。例如,当发生交叉链相互作用时(参见,例如,US Patent 6,453,242与WO 02/077227),多-指结合区域的一个或更多单独锌指可与重
叠的四联体亚位点结合。其结果为,三-指蛋白质可与10-核苷酸序列结合,其中第十个核苷
酸为由末端的指结合的四联体的一部分,四-指蛋白质可与13-核苷酸序列结合,其中第十
三个核苷酸为由末端的指结合的四联体的一部分,依此类推。
[0243] 在单独锌指之间的氨基酸接头的长度和特性亦影响针对靶序列的结合。举例而言,在多-指结合区域邻近锌指间所谓“非规范接头”,“长接头”或“结构化接头”的存在可允
许这些指与非直接毗连的亚位点结合。上述接头的非限定性示例描述于,例如,US Patent 
No.6,479,626与WO 01/53480中。相应的,在锌指结合区域靶位点中的一个或更多亚位点,
可彼此相隔1,2,3,4,5或更多核苷酸。仅举一例,4-指结合区域可与下述13-核苷酸靶位点
结合,即所述靶位点顺次包含两个毗连的3-核苷酸亚位点,插入核苷酸,与两个毗连的三联
体亚位点。关于连接人工核酸酶以结合于相隔不同数量的核苷酸的靶位点的组合物与方法
亦参见,U.S.Application No.61/130,099。序列(例如, 靶位点)间的距离指两个序列间,
从所述序列最靠近彼此的边缘测量的插入核苷酸或核苷酸对的数量。
[0244] 在有些实施方案中,设计了具有转录因子功能的ZFP。对转录因子功能,通常所有所需要的仅为单纯的与启动子足够近的结合。相对启动子的准确位置,取向,以及距离,只
要其在限定范围内,均无足轻重。该特性允许在选择构建人工转录因子的靶位点时相当的
灵活性。ZFP所识别的靶位点因此可为所述靶基因上任何合适的位点,只需其允许ZFP激活
或抑制基因表达,所述ZFP可操作的连接于调节区。优选的靶位点包括转录开始位点邻近,
下游或上游的区域。另外还包括,位于增强子区域的靶位点,阻抑物位点,RNA多聚酶暂停位
点以及特异性调节位点(例如,SP-1位点,低氧(hypoxia)反应元件,核受体识别元件,p53结
合位点),cDNA编码区域或已表达序列标志(EST)编码区域上的位点。
[0245] 在其它实施方案中,设计了具有核酸酶活性的ZFP。在细胞中,包含锌指结合区域与剪切域融合蛋白的ZFN(或两个融合蛋白,每个均包含锌指结合区域与剪切半域)的表达,
导致在靶序列附近的剪切。在有些实施方案中,剪切依赖两个锌指结构域/剪切半域融合分
子的结合以使结合位点分离。所述两个靶位点可位于不同的DNA链上,或者,两个靶位点可
位于同一个DNA链上。
[0246] 锌指结合区域
[0247] 锌指结合区域包括一个或更多锌指。Miller et al.(1985)EMBO J.4:1609-1614;Rhodes(1993)Scientific American Feb.:56-65;US Patent No.6,453,242。通常,单独锌
指结合区域长度为约30氨基酸。结构研究说明每个锌指结合区域(基序)含有两个beta折叠
(sheet)(由包含两个不变半胱氨酸残基的beta转支持),以及alpha螺旋(包含两个不变
组氨酸残基),并通过所述两个半胱氨酸与两个组氨酸对锌原子的配位将其支撑为特定的
构象。
[0248] 锌指既包括规范的(canonical)C2H2锌指(亦即,其中锌离子由两个半胱氨酸与两个组氨酸残基配位的那些),以及非规范的锌指,例如,C3H锌指(其中锌离子由三个半胱氨
酸残基与一个组氨酸残基配位的那些)以及C4锌指(其中锌离子由四个半胱氨酸残基配位
的那些)。亦参见WO 02/057293。
[0249] 锌指结合区域可经改造以与所选的序列结合。参见,例如,Beerli et al. (2002)Nature Biotechnol.20:135-141;Pabo et al.(2001)Ann.Rev.Biochem.70:313-340;
Isalan et al.(2001)Nature Biotechnol.19:656-660;Segal et al.(2001)
Curr.Opin.Biotechnol.12:632-637;Choo et al.(2000)Curr.Opin.Struct.Biol.10:
411-416。改造的锌指结合区域可较之天然存在的锌指蛋白具有新型的结合特异性。改造方
法包括但不仅限于,理性设计与多种类型的选择。理性设计包括,例如,使用包含三联体(或
四联体)核苷酸序列与单独锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序
列与一个或更多锌指氨基酸序列相联系,所述锌指与该特定三联体或四联体序列结合。参
见,例如,共有的U.S.Patents 6,453,242与6,534,261。其它设计方法公开于,例如,
U.S.Patents 6,746,838;6,785,613;6,866,997;以及7,030,215中。
[0250] 示例性的选择方法,包括噬菌体展示与二杂交系统,公开于US Patents5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;与6,242,568,
以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197与GB 2,338,237中。
[0251] 增强锌指结合区域的结合特异性描述于,例如,共有的US Patent No.6,794,136中。
[0252] 因为单独锌指与三-核苷酸(亦即,三联体)序列(或可与邻近锌指的四-核苷酸结合位点重叠以一个核苷酸的四-核苷酸序列)结合,锌指结合区域经改造以结合的序列(例
如,靶序列)长度将决定在改造的锌指结合区域中锌指的数量。举例而言,对于其中指基序
不结合于重叠亚位点的ZFP,六-核苷酸靶序列由二-指结合区域结合;九-核苷酸靶序列由
三-指结合区域结合,依此类推。如本文所示,在靶位点上单独锌指的结合位点(亦即,亚位
点)并不需要为毗连的,而是可以由一个或数个核苷酸所分隔,取决于在多-指结合区域中
所述锌指间氨基酸序列(亦即,指间接头)的长度与特性。
[0253] 在多-指锌指结合区域中,邻近锌指可由5个氨基酸左右的氨基酸接头(所谓“规范的”指间接头(inter-finger linkers))序列,或者,一个或更多非规范的接头所分隔。参
见,例如,共有的US Patent Nos.6,453,242与6,534,261。对包含多于三个指的改造的锌指
结合区域,在有些锌指间插入较长的(“非规范的”)指间接头可为优选的,这是因为其可能
增加结合区域的结合亲和力和/或特异性。参见,例如,U.S.Patent No.6,479,626与WO 01/
53480。相应的,多-指锌指结合区域亦可以非规范性指间接头的存在与位置的为特征。举例
而 言,包括三个指(由两个规范的指间接头联结),长接头与三个附加指(由两个规范的指
间接头联结)的六-指锌指结合区域表示为2x3构型。类似的,包括两个指(与其间的规范的
指间接头),长接头与两个附加指(由规范的指间接头联结)的结合区域表示为2x2蛋白质。
包含三个二-指单元(在其中任一所述两个指由规范的接头联结),其中每个而二-指单元由
长接头联结于邻近的二指单元的蛋白质,称为3x2蛋白质。
[0254] 在多-指结合区域两个邻近锌指间长或非规范指间接头的存在常常允许所述两个指结合于在靶位点上并非直接紧接的亚位点。相应的,在靶位点上亚位点间可有一个或更
多核苷酸的间隔,亦即,靶位点可包含一个或更多不由锌指接触的核苷酸。举例而言,2x2锌
指结合区域可与两个由一个核苷酸分隔的六-核苷酸序列结合,亦即,其结合于13-核苷酸
靶序列。亦参见Mooreet al.(2001a)Proc.Natl.Acad.Sci.USA 98:1432-1436;Moore et 
al.(2001b)Proc.Natl.Acad.Sci.USA 98:1437-1441与WO 01/53480。
[0255] 如之前所提及的,靶位点为由单独锌指结合的三-或四-核苷酸序列。出于某些考虑,二-指单元称为结合组件。结合组件可通过,例如,在多-指蛋白质(通常为三指)的环境
下选择两个邻近指来获取,所述多-指蛋白质与特定六-核苷酸靶序列结合。或者,组件可通
过组合单独的锌指来构建。亦参见WO 98/53057与WO 01/53480。
[0256] 锌指结合区域可设计为与一个或更多同源的(例如,正向同源的或共生同源的)EPSPS靶基因组序列结合。举例而言,锌指结合区域可设计为特异性的结合于一个独特的
EPSPS靶序列。或者,锌指结合区域可设计为与多个正向同源的或共生同源的EPSPS基因组
序列结合。
[0257] 在一个实施方案中,本文描述了包括示于表A氨基酸序列的锌指结合区域。在另一个实施方案中,本公开提供了编码锌指结合区域的多核苷酸,其中所述锌指结合区域包括
示于表A的氨基酸序列。
[0258] 调节区
[0259] 本文所述的ZFP可任选的与调节区相联系以调整基因表达。ZFP可共价的或非共价的与一个或更多调节区,或者两个或更多调节区相联系,其中所述两个或更多域为同一域
的两个拷贝,或两个不同域。所述调节区可作为融合蛋白的一部分,共价的与所述ZFP相联,
例如,通过氨基酸接头。所述ZFP 亦可通过非共价的二聚体化功能域,例如,亮氨酸拉链
STAT蛋白质N末端域或FK506结合蛋白(参见,例如,O′Shea,Science 254:539(1991),
Barahmand-Pour et al,Curr.Top.Microbiol.Immunol.211:121-128(1996);Klemm et 
al.,Annu.Rev.Immunol.16:569-592(1998);Klemm et al.,Annu.Rev.Immunol.16:569-
592(1998);Ho et al.,Nature 382:822-826(1996);以及Pomeranz et al.,Biochem.37:
965(1998))与调节区相联系。所述调节区可与ZFP在任何合适的位置相联系,包括所述ZFP
的C或N末端。
[0260] 除ZFP外通常的调节区包括,例如,转录因子的效应者(effctor)结构域(激活物,阻抑物,共激活物,共阻抑物),沉默基因,核激素受体,癌基因转录因子(例如,myc,jun,
fos,myb,max,mad,rel,ets,bcl,myb,mos家族成员等等);DNA修复酶及其相关因子与修饰
因子;DNA重排酶及其相关因子与修饰因子;染色质相关蛋白及其修饰因子(例如,激酶,乙
酰酶与脱乙酰酶);以及DNA修饰酶(例如,甲基转移酶,拓扑异构酶,解螺旋酶,连接酶,激
酶,磷酸酶,多聚酶,核酸内切酶)及其相关因子与修饰因子。
[0261] 可从其获取调节区的转录因子多肽包括涉及调节与基础转录中的那些。上述多肽包括转录因子,其效应者结构域,共激活物,沉默基因,核激素受体(对关于转录中涉及的蛋
白质与核酸元件的综述参见,例如,Goodrich et al.,Cell 84:825-30(1996);转录因子的
总体综述参见Barnes & Adcock,Clin.Exp.Allergy 25 Suppl.2:46-9(1995)and Roeder,
Methods Enzymol.273:165-71(1996))。已知专用于转录因子的数据库(参见,例如,
Science269:630(1995))。核激素受体转录因子描述于,例如,Rosen et al.,J 
Med.Chem.38:4855-74(1995)。C/EBP家族转录因子的综述见于Wedel et  al.,
Immunobiology 193:171-85(1995)。介导通过核激素受体的转录调节的共激活物与共阻抑
物的综述见于,例如,Meier,Eur.J Endocrinol.134(2):158-9(1996);Kaiser et al.,
Trends Biochem.Sci.21:342-5(1996);以及Utley et al.,Nature394:498-502(1998))。
GATA转录因子,其涉及血细胞生成的调节,描述于,例如,Simon,Nat.Genet.11:9-11
(1995);Weiss et al.,Exp.Hematol.23:99-107。TATA盒结合蛋白(TBP)与其相关的TAP多
肽(其包括TAF30,TAF55,TAF80,TAF 10,TAFI 50与TAF250)描述于Goodrich & Tjian,
Curr.Opin.Cell Biol.6:403-9(1994)and Hurley,Curr.Opin.Struct.Biol.6:69-75
(1996)。STAT家族转录因子的综述见于,例如,Barahmand-Pour  et  al.,
Curr.Top.Microbiol.Immunol. 211:121-8(1996)。涉及疾病的转录因子的综述见于Aso 
et al.,J Clin.Invest.97:1561-9(1996)。
[0262] 在一个实施方案中,来自人类KOX-1蛋白质的KRAB阻抑域用作转录阻抑物(Thiesen et al.,New Biologist 2:363-374(1990);Margolin et al.,PNAS91:4509-
4513(1994);Pengue et al.,Nucl.Acids Res.22:2908-2914(1994);Witzgall et al.,
PNAS 91:4514-4518(1994))。在另一个实施方案中,KAP-1,KRAB共阻抑物,与KRAB一同使用
(Friedman et al.,Genes Dev.10:2067-2078(1996))。或者,KAP-1可单独与ZFP使用。其它
作为转录阻抑物作用的优选转录因子和转录因子域包括MAD(see,e.g.,Sommer et al.,
J.Biol.Chem.273:6632-6642(1998);Gupta et al.,Oncogene 16:1149-1159(1998);
Queva et al.,Oncogene 16:967-977(1998);Larsson et al.,Oncogene 15:737-748
(1997);Laherty et al.,Cell 89:349-356(1997);以及Cultraro et al,Mol 
Cell.Biol.17:2353-2359(19977));FKHR(横纹肌肉瘤叉头基因(forkhead 
inrhapdosarcoma gene);Ginsberg et al.,Cancer Res.15:3542-3546(1998);Epsteinet 
al,Mol.Cell.Biol.18:4118-4130(1998));EGR-1(早期生长反应基因产物-1(early 
growth response gene product-1);Yan et al.,PNAS 95:8298-8303(1998);and Liu et 
al.,Cancer Gene Ther.5:3-28(1998));ets2阻抑物因子阻抑物域(theets2 repressor 
factor repressor domain)(ERD;Sgouras et al.,EMBO J14:4781-4793((19095));以及
MAD smSIN3相互作用域(SID;Ayer et al.,Mol.Cell.Biol.16:5772-5781(1996))。
[0263] 在一个实施方案中,HSV VP16激活域用作转录激活物(参见,例如,Hagmann et al.,J.Virol.71:5952-5962(1997))。其它可提供激活域的优选转录因子包括VP64激活域
(Seipel et al.,EMBO J.11:4961-4968(1996));核激素受体(参见,例如,Torchia et 
al.,Curr.Opin.Cell.Biol.10:373-383(1998));核因子kappa B的p65亚基(Bitko & 
Barik,J.Virol.72:5610-5618(1998)and Doyle& Hunt,Neuroreport 8:2937-2942
(1997));以及EGR-1(早期生长反应基因产物-1;Yan et al.,PNAS 95:8298-8303(1998);
以及Liu et al.,Cancer Gene Ther.5:3-28(1998))。
[0264] 激酶,磷酸酶与其它修饰涉及基因调节的多肽亦作为ZFP的调节区为有用的。上述修饰因子常常涉及由,例如,激素介导的打开或关闭转录。涉及转录调节的激素的综述见于
Davis,Mol.Reprod.Dev.42:459-67(1995), Jackson et al.,Adv.Second Messenger 
Phosphoprotein Res.28:279-86(1993),以及Boulikas,Crit.Rev.Eukaryot.Gene 
Expr.5:1-77(1995),而磷酸酶的综述见于,例如,Schonthal & Semin,Cancer Biol.6:
239-48(1995)。核酪氨酸激酶描述于Wang,Trends Biochem.Sci.19:373-6(1994)。
[0265] 如上所述,有用的域亦可得自癌基因(例如,myc,jun,fos,myb,max,mad,rel,ets,bcl,myb,mos家族成员)的基因产物与其相关因子与修饰因子。癌基因描述于,例如,
Cooper.Oncogenes,2nd ed.,The Jones and Bartlett Series inBiology,Boston,
Mass.,Jones and Bartlett Publishers,1995。ets转录因子的综述见于Waslylk et al.,
Eur.J.Biochem.211:7-18(1993)与Crepieux et al.,Crit.Rev.Oncog.5:615-38(1994)。
Myc癌基因的综述见于,例如,Ryan et al.,Biochem.J.314:713-21(1996)。jun与fos转录
因子描述于,例如,The Fos and Jun Familiesof Transcription Factors,Angel & 
Herrlich,eds.(1994)。max癌基因的综述见于Hurlin  et al.,Cold Spring 
Harb.Symp.Quant.Biol.59:109-16。myb基因家族的综述见于Kanei-Ishii et al.,
Curr.Top.Microbiol.Immunol.211:89-98(1996)。mos家族的综述见于Yew et al.,
Curr.Opin.Genet.Dev.3:19-25(1993)。
[0266] ZFP可包括得自DNA修复酶与其相关因子与修饰因子的调节区。DNA修复系统的综述见于,例如,Vos,Curr.Opin.Cell Biol.4:385-95(1992);Sancar,Ann.Rev.Genet.29:
69-105(1995);Lehmann,Genet.Eng.17:1-19(1995);以及Wood,Ann.Rev.Biochem.65:135-
67(1996)。DNA重排酶与其相关因子与修饰因子亦可用作调节区(参见,例如,Gangloffet 
al.,Experientia 50:261-9(1994);Sadowski,FASEB J.7:760-7(1993))。
[0267] 类似的,调节区亦可源自DNA修饰酶(例如,DNA甲基转移酶,拓扑异构酶,解螺旋酶,连接酶,激酶,磷酸酶,多聚酶)与其相关因子与修饰因子。解螺旋酶的综述见于Matson 
et  al.,Bioessays,16:13-22(1994),而甲基转移酶描述于Cheng,
Curr.Opin.Struct.Biol.5:4-10(1995)。染色质相关蛋白与其修饰因子(例如,激酶,乙酰
酶与脱乙酰酶),例如组蛋白脱乙酰酶(Wolffe,Science 272:371-2(1996))亦有用于作为
域以添加到所选的ZFP。在一个优选实施方案中,所述调节区为作为转录阻抑物作用的DNA
甲基转移酶,(参见,例如,Van den Wyngaert et al.,FEBS Lett.426:283-289(1998);
Flynn et al.,J.Mol.Biol.279:101-116(1998);Okano et al.,Nucleic Acids Res.26:
2536-2540(1998);以及Zardo & Caiafa,J.Biol.Chem.273:16517-16520(1998))。在另一 
个优选实施方案中,核酸内切酶,如Fok1用作转录阻抑物,其通过基因剪切起作用(参见,例
如,WO95/09233;以及PCT/US94/01201)。
[0268] 控制染色质与DNA结构,活动与定位的因子及其相关因子与修饰因子;源自微生物(例如,原核生物,真核生物与病毒)的因子,以及与其相联系或修饰其的因子亦可用于获取
嵌合蛋白质。在一个实施方案中,重组酶与整合酶用作调节区。在一个实施方案中,组蛋白
乙酰转移酶用作转录激活物(参见,例如,Jin & Scotto,Mol.Cell.Biol.18:4377-4384
(1998);Wolffe,Science272:371-372(1996);Taunton et al.,Science 272:408-411
(1996);以及Hassig etal.,PNAS 95:3519-3524(1998))。在另一个实施方案中,组蛋白脱
乙酰酶用作转录阻抑物(参见,例如,Jin & Scotto,Mol.Cell.Biol.18:4377-4384(1998);
Syntichaki & Thireos,J.Biol.Chem.273:24414-24419(1998);Sakaguchi et al.,Genes 
Dev.12:2831-2841(1998);以及Martinez et al,J.Biol.Chem.273:23781-23785(1998))。
[0269] 可包含多肽域间的接头域,例如,两个ZFP间或ZFP与调节区间的。上述接头通常为多肽序列,例如大约5到200个氨基酸间的多聚甘氨酸序列。优选的接头通常为弹性的
(flexible)氨基酸序列,其作为重组融合蛋白的一部分合成。参见,例如,U.S.Patent 
No.6,534,261;Liu et al.,Proc.Nat.Acad.Sci.USA,95:5525-5530(1997);Pomerantz et 
al.,Proc.Nat.Acad.Sci.USA92:9752-9756(1995);Kim et al.,Proc.Nat.Acad.Sci.USA 
93:1156-1160(1996);以其全文引用的形式包含于本文中。或者,弹性的接头可使用下述的
计算机程序,即其能够对DNA结合位点与肽自身两者进行建模(Desjarlais &Berg,
Proc.Nat.Acad.Sci.USA 90:2256-2260(1993),Proc.Nat.Acad.Sci.USA91:11099-11103
(1994),或通过噬菌体展示方法理性的进行设计。
[0270] 在其他实施方案中,使用化学接头以连接合成产生或重组产生的域序列。上述弹性的接头对本领域技术人员为已知的。举例而言,聚乙二醇接头可得自Shearwater 
Polymers,Inc.Huntsville,Ala。这些接头可任选的具有酰胺键,氢硫键或异功能键
(heterofunctional linkage)。除将ZFP共价的连接于调节区外,可使用非共价方法以产生
ZFP与调节区相联系的分子。
[0271] 剪切域
[0272] 本文所公开的融合蛋白的剪切域部分可得自任何核酸内切酶或核酸外切 酶。剪切域可源自的核酸内切酶示例包括但不仅限于,限制性核酸内切酶与靶向核酸内切酶。参
见,例如,2002-2003 Catalogue,New England Biolabs,Beverly,MA;and Belfort et al.
(1997)Nucleic Acids Res.25:3379-3388。附加的剪切DNA的酶为已知的(例如,S1核酸酶;
绿豆核酸酶;胰DNase I;微球菌核酸酶;酵母HO核酸内切酶;亦参见Linn et al.(eds.)
Nucleases,Cold SpringHarbor Laboratory Press,1993)。这些酶(或其功能性片段)中的
一种或更多可用作剪切域与剪切半域的来源。
[0273] 类似的,剪切半域(例如,包含锌指结合区域与剪切半域的融合蛋白)可源自下述任何核酸酶或其部分,如上面所提出的,即其剪切活性需要二聚作用。通常,若融合蛋白包
括剪切半域,则需要两个融合蛋白进行剪切。或者,可使用包括两个剪切半域的单一蛋白
质。所述两个剪切半域可源自同一个核酸内切酶(或其功能性的片段),或每个剪切半域可
源自不同的核酸内切酶(或其功能性的片段)。此外,所述两个融合蛋白的靶位点优选以下
述的方式相互排列,即使得两个融合蛋白分别与其靶位点的结合将将剪切半域置为下述两
者间的空间取向,即其允许所述剪切半域形成功能性的剪切域,例如,通过二聚化。从而,在
有些实施方案中,所述靶位点的近边间隔5-8个核苷酸或15-18个核苷酸。然而任何整数数
量的核苷酸或核苷酸对可插入到两个靶位点之间(例如,从2到50个核苷酸或更多)。通常,
剪切点处于靶位点之间。
[0274] 限制性核酸内切酶(限制性酶)存在于许多物种中,且能够序列特异性的结合于DNA(在识别位点),并在或接近结合位点处剪切DNA。有些限制性酶(例如,IIS型)在远离识
别位点的位点剪切DNA,且具有可分离的结合与剪切域。举例而言,IIS型酶FokI在距离其一
个链上的识别位点9个核苷酸,另一个链上识别位点13个核苷酸处催化DNA的双链剪切。参
见,例如,US Patents 5,356,802;5,436,150与5,487,994,以及Li et al.(1992)
Proc.Natl.Acad.Sci.USA 89:4275-4279;Li et al.(1993)Proc.Natl.Acad.Sci.USA90:
2764-2768;Kim et al.(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kimet al.(1994b)
J.Biol.Chem.269:31,978-31,982。从而,在一个实施方案中,融合蛋白包括来自至少一个
IIS型限制性酶的剪切域(或剪切半域)以及一个或更多锌指结合区域,其可能为经或未经
改造。
[0275] 其剪切域可与结合区域分离的IIS型限制性酶示例为FokI。该特定酶作 为二聚体有活性(Bitinaite et al.(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575)。相应的,
就现行公开考虑,用于公开的融合蛋白中的FokI酶部分被视为剪切半域。从而,针对使用锌
指-FokI融合蛋白的靶向双链剪切和/或靶向细胞序列取代,两个融合蛋白,每个均包含
FokI剪切半域,可用于重建具有催化活性的剪切域。或者,亦可使用含有锌指结合区域与两
个FokI剪切半域的单一多肽。针对使用锌指-FokI融合蛋白的靶向剪切与靶向序列变更在
本公开其它地方提供。
[0276] 剪切域或剪切半域可为蛋白质的任何部分,只要其保留剪切活性的,或保留多聚化(例如,二聚化)以形成功能性剪切域的能力。
[0277] IIS型限制性酶的示例列于表1。附加的限制性酶亦包含可分离的结合与剪切域,且其为现行公开所考虑。参见,例如Roberts et al.(2003)Nucleic AcidsRes.31:418-
420。
[0278] 表1:一些IIS型限制性酶
[0279] Aar I      BsrB I    SspD5 I
[0280] Ace III    BsrD I    Sth132 I
[0281] Aci I      BstF5I    Sts I
[0282] Alo I      Btr I     TspDT I
[0283] Bae I      Bts I     TspGW I
[0284] Bbr7 I     Cdi I     Tth111 II
[0285] Bbv I      CjeP I    UbaP I
[0286] Bbv II     Drd II    Bsa I
[0287] BbvC I     Eci I     BsmB I
[0288] Bcc I      Eco31 I
[0289] Bce83 I    Eco57 I
[0290] BceA I     Eco57M I
[0291] Bcef I     Esp3 I
[0292] Bcg I      Fau I
[0293] BciV I     Fin I
[0294] Bfi I      Fok I
[0295] Bin I      Gdi II
[0296] Bmg I      Gsu I
[0297] Bpu10 I    Hga I
[0298] BsaX I     Hin4 II
[0299] Bsb I      Hph I
[0300] BscA I     Ksp632 I
[0301] BscG I     Mbo II
[0302] BseR I     Mly I
[0303] BseY I     Mme I
[0304] Bsi I      Mnl I
[0305] Bsm I      Pfl1108 I
[0306] BsmA I     Ple I
[0307] BsmF I     Ppi I
[0308] Bsp24 I   Psr I
[0309] BspG I    RleA I
[0310] BspM I    Sap I
[0311] BspNC I   SfaN I
[0312] Bsr I     Sim I
[0313] 锌指融合蛋白
[0314] 设计与构建融合蛋白(与编码其的多核苷酸)的方法对本领域技术人员为已知的。举例而言,设计与构建包含锌指结构域与调节或剪切域(或剪切半域)的融合蛋白,以及编
码上述融合蛋白的多核苷酸的方法,描述于共有的Patents 6,453,242与6,534,261以及
U.S.Patent Aplication Publications2007/0134796与2005/0064474;其以全文引用的方
式包含于本文中。在有些实施方案中,构建了编码所述融合蛋白的多核苷酸。该多核苷酸可
插入载体中,且该载体可导入细胞中(更多关于载体与将多核苷酸导入细胞的方法的公开
见下)。
[0315] 在本文所述方法的有些实施方案中,锌指核酸酶包括含有锌指结合区域与来自FokI限制性酶的剪切半域的融合蛋白,且在细胞中表达两个上述的融合蛋白。在细胞中两
个融合蛋白的表达可来自下述方法:将两个蛋白质递送到所述细胞中;将一个蛋白质与编
码一个蛋白质的核酸递送到所述细胞中;将两个核酸,每个均编码一个蛋白质递送到所述
细胞中;或通过将编码两个蛋白质单一核酸递送到所述细胞中。在其它实施方案中,融合蛋
白包括含有两个剪切半域与锌指结合区域的单一多肽链。在此情况下,单一融合蛋白表达
于细胞中,且虽不愿拘于理论,但相信作为所述剪切半域的分子内二聚体形成的结果,该融
合蛋白剪切DNA。
[0316] 在有些实施方案中,所述融合蛋白(例如,ZFP-FokI融合蛋白)的组分经排列,使得所述锌指功能域最接近所述融合蛋白的氨基末端,而所述剪切半域最接近其羧基末端。这
与在天然存在的二聚体剪切域,例如那些源自FokI酶的中,剪切域的相对取向一致,即其中
DNA结合区域最接近氨基末端而剪切半域最接近羧基末端。在这些实施方案中,所述剪切半
域的二聚化形成功能性的核酸酶通过将所述融合蛋白结合至相反DNA链上的位点来达成,
其中所述结合位点的5’端彼此接近。
[0317] 在其它实施方案中,所述融合蛋白(例如,ZFP-FokI融合蛋白)的组分经排列,使得所述剪切半域最接近所述融合蛋白的氨基末端,而所述锌指结构域最接近其羧基末端。在
这些实施方案中,所述剪切半域的二聚化形成功能性的核酸酶通过将所述融合蛋白结合至
相反DNA链上的位点来达成,其中所述结合位点的3’端彼此接近。
[0318] 在仍旧其它的实施方案中,第一个融合蛋白在其氨基末端最接近处含有所述剪切半域,而在其羧基末端最接近处含有所述锌指结构域,而第二个融合蛋白如下述排列,使得
所述锌指结构域在其氨基末端最接近处,而所述剪切半域在其羧基末端最接近处。在这些
实施方案中,两个融合蛋白均结合于同一个DNA链,其中第一个其锌指结构域最靠近其羧基
末端的融合蛋白的结合位点位于第二个其锌指结构域最接近其氨基末端的融合蛋白的结
合位点的5’侧。
[0319] 在有些实施方案中,所公开的融合蛋白其在所述锌指结构域与所述剪切域(或剪切半域)间的氨基酸序列称为“ZC接头”。所述ZC接头须与上面讨论的指间接头区别开来。关
于获取优化剪切的ZC接头的细节,参见,例如,U.S.Patent Publications 20050064474A1
与20030232410以及InternationalPatent Publication WO05/084190。
[0320] 在一个实施方案中,本公开提供了包含具有示于表A的识别螺旋氨基酸序列的锌指蛋白的ZFN。在另一个实施方案中,本文提供了包含具有示于表A识别螺旋的ZFP的编码核
苷酸序列的ZFP表达载体。
[0321] 基因表达的调节
[0322] 多种分析可用于确定ZFP是否调整基因表达。特定ZFP的活性可使用多种体外与体内分析通过测定,例如,蛋白质或mRNA水平,产物水平,酶活性,报道基因的转录激活或阻
抑,使用,例如,免疫分析(例如,使用抗体的ELISA与免疫组织化学分析),杂交分析(例如,
Rnase保护,Northern,原位杂交,寡核苷酸点阵研究),色度法分析,扩增分析,酶活性分析,
表型分析以及类似的来进行评价。
[0323] ZFP通常首先针对其活性在体外使用ELISA分析,随即使用肾脏细胞来测试。所述ZFP通常首先使用具有报道基因的暂时表达系统测试,并随即所述靶内源基因的调节在细
胞中与在全植物中在体内与体外均进行测试。所述 ZFP可在细胞中重组表达,可在移植到
植物的细胞中重组表达,或在转基因植物中重组表达,以及作为蛋白质使用下述的给药
体施用于植物或细胞。所述细胞可为固定化的,可在溶液中,可注射于植物,或可天然存在
于转基因或非转基因植物。
[0324] 基因表达的调整使用本文所述的一种体外或体内分析进行测试。将试样或测试经ZFP处理,并与无测试化合物的对照试样比较以检查调整的程度。对内源基因表达的调节,
所述ZFP通常具有200nM或更少的Kd,较优选100nM或更少,更优选50nM,最优选25nM或更少。
[0325] 所述ZFP的作用可通过检查任何上述参数来进行测定。任何合适的基因表达,表型或生理学变化均可用于评价ZFP的影响。当使用完整细胞或植物确定功能性后果时,亦可测
定多种作用,例如植物生长,已知与未特征化的遗传标记的转录变化(例如,Northern blot
或寡核苷酸点阵研究),细胞代谢的变化,例如细胞生长或pH的变化,以及胞内第二信使,例
如cGMP的的变化。
[0326] ZFP调节内源基因表达的优选分析可在体外实施。在一个优选的体外分析形式中,在培养细胞中ZFP对内源基因表达的调节通过使用ELISA分析检查蛋白质生成来测定。将所
述测试试样与经空载体或以其它基因为目标,不相关的ZFP处理的对照细胞进行比较。
[0327] 在另一个实施方案中,ZFP对内源基因表达的调节在体外通过测定靶基因mRNA表达的水平来确定。基因表达水平使用扩增,例如,使用PCR,LCR或杂交分析,例如Northern杂
交,Rnase保护,点印迹法,来进行测定。Rnase保护用于一个实施方案中。蛋白质与mRNA的水
平使用直接或间接标记的检测剂,例如,荧光或放射性标记的核酸,放射性或酶标记的抗
体,以及类似物进行检测,如本文所述。
[0328] 或者,可使用可操作性的连接于报道基因,例如荧光素酶,绿色荧光蛋白,CAT或β-gal的靶基因启动子设计报道基因系统。所述报道构建体通常共转染至培养细胞中。当使用
所选的ZFP处理后,报道基因转录,翻译或活性的量根据本领域技术人员所知的标准技术进
行测定。
[0329] 转基因与非转基因植物亦用作检查内源基因体内表达调节的优选实施方案。转基因植物可稳定的表达所选的ZFP。或者,可使用暂时表达所选ZFP的植物,或对其ZFP通过递
送载体施与的植物。内源基因表达的调节使用任 何一个本文描述的分析进行测试。
[0330] 靶向剪切方法
[0331] 公开的方法与组合物可用于在细胞染色质上的目标区域(例如,在基因组中所期望的或预决的位点上,例如,在EPSPS基因内或邻近该基因,无论该基因是突变体或野生型)
剪切DNA。为进行上述靶向DNA剪切,锌指结合区域经改造与在预决的剪切位点上或邻近其
的靶位点结合,且在细胞内表达包含所述改造的锌指结合区域与剪切域的融合蛋白。在所
述融合蛋白的锌指部分与所述靶位点结合后,剪切域在所述靶位点附近剪切DNA。剪切的准
确位点可取决于ZC接头的长度。
[0332] 或者,两个融合蛋白,每个包含锌指结合区域与剪切半域,在细胞中表达,且与以下述方式并置的靶位点结合,即重建了功能性的剪切域,且DNA在所述靶位点附近被剪切。
在一个实施方案中,剪切发生在两个锌指结合区域的靶位点之间。所述锌指结合区域中的
一个或两者可经改造。
[0333] 为使用锌指结合区域-剪切域融合多肽进行靶向剪切,结合位点可涵盖剪切位点,或所述结合位点的近边可为距离所述剪切位点1,2,3,4,5,6,10,25,50或更多个核苷酸(或
任何在1到50个核苷酸之间的整数值)。所述结合位点相对于所述剪切位点的准确位置将取
决于特定的剪切域,以及ZC接头的长度。对于使用两个融合多肽,其中每个均包含锌指结合
区域与剪切半域的方法的,所述结合位点通常位于所述剪切位点两侧。从而第一个结合位
点的近边可为距所述剪切位点一侧1,2,3,4,5,6,25或更多个核苷酸(或任何在1到50个核
苷酸之间的整数值),而第二个结合位点的近边可为距所述剪切位点另一侧1,2,3,4,5,6,
25或更多个核苷酸(或任何在1到50个核苷酸之间的整数值)。在体外与体内对剪切位点进
行定位的方法对本领域技术人员为已知的。
[0334] 从而,本文所述方法可使用融合于剪切域的改造的锌指结合区域。在此情况下,所述结合区域经改造,在期望进行剪切的位置或其附近与靶序列结合。将所述融合蛋白,或编
码其的多核苷酸,导入植物细胞。一旦导入所述细胞或在其中表达,所述融合蛋白结合于靶
序列,并在靶序列上或其附近进行剪切。剪切的准确位点取决于所述剪切域的特性和/或所
述结合与剪切域之间接头序列的存在和/或特性。在使用两个融合蛋白,每个均包含剪切半
域的 情况下,所述结合位点近边之间的距离可为1,2,3,4,5,6,7,8,9,10,25或更多个核苷
酸(或任何1到50个核苷酸之间的整数值)。剪切的最佳水平亦可既取决于在所述两个融合
蛋白上结合位点之间的距离(参见,例如,Smith et al.(2000)Nucleic Acids Res.28:
3361-3369;Bibikova et al.(2001)Mol.Cell.Biol.21:289-297),又取决于每个融合蛋白
上ZC接头的长度。亦参见U.S.Patent Publication 20050064474A1以及International 
Patent PublicationsWO05/084190,WO05/014791与WO03/080809。
[0335] 在有些实施方案中,所述剪切域包含两个剪切半域,即第一剪切半域与第二剪切半域,两者均为包含结合区域的单一多肽的一部分。所述剪切半域可具有相同或不同的氨
基酸序列,只要它们具有剪切DNA的功能。
[0336] 剪切半域亦可能由单独分子分别提供。举例而言,两个融合多肽可能导入细胞,其中每个多肽均包含结合区域与剪切半域。所述剪切半域可具有相同或不同的氨基酸序列,
只要它们具有剪切DNA的功能。进一步,所述结合区域与靶位点结合,所述靶位点通常以下
述方式配置,即当所述融合多肽结合后,所述两个剪切半域表现出下述的相对彼此的空间
取向,即其允许剪切域的重建(例如,通过所述半域的二聚化),从而将所述半域置于相对彼
此的位置以形成功能性的剪切域,导致在目标区域剪切细胞染色质。一般而言,所述重建剪
切域的剪切发生在位于所述两个靶序列之间的位点。所述蛋白质中的一个或两者可经改造
以与其靶位点结合。
[0337] 所述两个融合蛋白可以相同或者相反极性结合于所述目标区域,且其结合位点(亦即,靶位点)可间隔任何数量的核苷酸,例如,从0到200个核苷酸或任何其间的整数值。
在有些实施方案中,两个融合蛋白,其中每个均包含锌指结合区域与剪切半域,的结合位
点,自每个结合位点最接近另一个结合位点的边缘(edge)起计算可彼此间距5到18之间个
核苷酸,例如,间距5-8个核苷酸,或间距15-18个核苷酸,或间距6个核苷酸,或间距16个核
苷酸,且剪切发生于所述结合位点之间。
[0338] DNA剪切的位点通常位于所述两个融合蛋白的结合位点之间。DNA的双链断裂通常为两个单链断裂,亦称“切口”,彼此偏移1,2,3,4,5,6或更多个核苷酸的结果(举例而言,天
然FokI剪切双链DNA为彼此偏移4个核苷酸的单链断裂的结果)。从而,剪切未必需要发生于
每个DNA链上准确相对的位点。另外,所述融合蛋白的结构与所述靶位点间的距离可影响剪 
切是否在邻近一个单独核苷酸对处发生,或剪切是否发生于多个位点。然而,对于许多应
用,包括靶向重组与靶向突变(见下),在一定核苷酸范围内的剪切通常已经足够,而不需要
剪切发生于特定碱基对间。
[0339] 如上所指明,所述融合蛋白可作为多肽和/或多核苷酸导入。举例而言,两个多核苷酸,每个包含编码一个前述多肽的序列,可导入细胞,且当所述多肽表达,并每个均与其
靶序列结合时,剪切发生在靶序列处或其附近。另外,亦可将包含编码两个融合多肽的单一
多核苷酸导入细胞。多核苷酸可为DNA,RNA或其任何修饰形式或类似物,或DNA和/或RNA。
[0340] 为增强剪切特异性,亦可在本文所述方法中使用附加的组合物。举例而言,单一剪切半域可展示受限的双链剪切活性。在下述方法中,即其中两个融合蛋白,每个均含有三指
锌指结构域与剪切半域,导入细胞,则任一蛋白质特定于约9-核苷酸的靶位点。尽管该总计
(aggregate)18个核苷酸的靶序列似在哺乳类基因组中为独特的,任何给定9-核苷酸靶位
点平均在人类基因组中出现约23000次。从而,由于单一半域的位点特异性结合,可能会出
现非特异性剪切。相应的,本文所述方法考虑使用剪切半域,例如FokI(或编码其的核酸)的
显性失活突变体,其与两个融合蛋白一起表达于细胞中。所述显性失活突变体能够二聚化,
但是无法剪切,并亦阻遏与其二聚化的半域的剪切活性。通过提供摩尔数上针对所述融合
蛋白为过量的显性失活突变体,仅仅下述区域,即其中两个融合蛋白均结合的,才将具有足
够高局部浓度的功能性剪切半域以供二聚作用以及剪切发生。在下述位点,即仅仅两个融
合蛋白之一结合的,其剪切半域与所述显性失活突变体半域形成二聚体,而不发生非期望
的,非特异性的剪切。
[0341] 在所述FokI剪切半域中已经识别出了三个催化性的氨基酸残基:Asp450,Asp467与Lys469。Bitinaite et al.(1998)Proc.Natl.Acad Sci.USA 95:10,570-10,575。从而,
在这些残基中的一个中一个或更多突变可用于产生显性失活突变。进一步,其它IIS型核酸
内切酶的许多催化性氨基酸残基为已知和/或可以通过,例如,与FokI序列进行序列比对
和/或通过产生并测试突变体的催化活性来确定。
[0342] 在剪切半域中二聚体化功能域突变
[0343] 下述方法,即涉及使用ZFP与剪切半域间的融合物(例如,ZFP/FokI融 合物)以进行靶向剪切的,需要使用两个上述融合分子,每个均通常导向独特的靶序列。所述两个融合
蛋白的靶序列可如此选取,从而将靶向剪切导向基因组中的独特位点,如上所讨论。使得剪
切特异性减少的潜在来源为所述两个ZFP/剪切半域融合物之一的同源二聚化的结果。该现
象可能由于下列原因发生,例如,在基因组中存在所述两个ZFP/剪切半域融合物之一的靶
序列的反向重复序列,且所述靶序列的位置允许所述相同融合蛋白的两个拷贝互相以下述
取向与间距结合,即其允许功能性二聚体的形成。
[0344] 一种减少在除预期靶位点以外的序列发生这种类型的异常剪切的概率的方法涉及产生所述剪切半域的变体,其最小化或阻止同源二聚化。优选的,改变所述半域中涉及其
二聚化的区域中的一个或更多氨基酸。在所述FokI蛋白质二聚体的晶体结构中,有报道称
所述剪切半域的结构类似于在FokI剪切DNA时所述剪切半域的排列。Wah et al.(1998)
Proc.Natl.Acad.Sci.USA95:10564-10569。该结构指明在位置483与487处的氨基酸残基在
所述FokI剪切半域的二聚化中起关键作用。该结构亦指明在位置446,447,479,483,484,
486,487,490,491,496,498,499,500,531,534,537与538处的氨基酸残基均足够靠近二聚
作用的界面,从而影响到二聚作用。相应的,在前述位置中的一个或更多处发生的氨基酸序
列改变似将改变所述剪切半域的二聚作用特性。上述变化可通过,例如,构建含有(或编码)
在这些位置不同氨基酸残基的文库并选取具有所期望特性的变体,或通过理性设计个体的
突变体来导入。除阻止同源二聚作用外,亦可能这些突变中一些可能增加上述由两个野生
型剪切半域所得的剪切效力。
[0345] 相应的,在FokI剪切半域中任何氨基酸残基处的改变,若其影响二聚化,则其可用于阻止一对ZFP/FokI融合物间发生下述二聚作用,即其可导致在非期望序列处的剪切。从
而,为使用一对ZFP/FokI融合物进行靶向剪切,所述融合蛋白中的一个或两者可包括一个
或更多的改变,其抑制自身二聚作用,但允许所述两个融合蛋白间的异源二聚作用发生,从
而使得剪切发生在期望的靶位点。在有些实施方案中,两个融合蛋白均存在改变,且所述改
变具有附加作用;亦即,最小化或消除了任一融合物的同源二聚作用,其导致异常剪切,同
时较之得自使用野生型剪切半域的,促进了所述两个融合蛋白间的异源二聚作用。
[0346] 对共生同源基因组序列的靶向改变方法与靶向重组方法
[0347] 本文亦描述了取代基因组序列的方法,例如,将一个或更多共生同源基因(例如,细胞染色质中作为EPSPS靶的目标基因组区域)取代为同源非等同序列(亦即,靶向重组)。
之前取代特定序列的尝试涉及将细胞与包含具有与染色体区域有同源性的序列(亦即,供
体DNA)接触,继以选择其中所述供体DNA分子同源重组入基因组的细胞。这些方法的成功率
较低,这是由于同源重组的不良效率,以及所述供体DNA高频度的非特异性插入基因组上除
目标位点外的区域。
[0348] 现行公开提供了靶向序列改变的方法,其特征为更高效率的靶向重组与更低频率的非特异性插入事件。所述方法涉及制造与使用改造的锌指结合区域,其在共生同源基因
序列(例如,EPSPS基因序列)处或其附近结合,融合于剪切域(或剪切半域)以在细胞DNA中
造成一个或更多靶向双链断裂。因为细胞DNA中双链断裂在所述剪切位点附近数千倍的激
发细胞修复机理,上述靶向剪切使得基因序列(例如,EPSPS)的改变或取代(通过同源导向
修复)可以发生在基因组中几乎任何位点。
[0349] 本文所述方法可应用于来自任何生物或物种的任何共生同源基因(例如,EPSPS)序列。在有些实施方案中,所述改变的EPSPS靶基因组区域属于包含选自下组的核苷酸序列
的EPSPS基因:SEQ ID NOS:10-14或预期具有至少约80-100%序列同一性度的,包含在此区
间内任何百分比的相同度,例如与其具有81,82,83,84,85,86,87,88,89,90,91,92,93,94,
95,96,97,98,99%序列同一性度。
[0350] 除本文所述的融合分子外,对选定基因组序列的靶向取代亦需要导入所述取代(或供体)序列。所述供体序列可在表达所述融合蛋白之前,同时或之后导入所述细胞。所述
供体多核苷酸针对基因组序列(例如,EPSPS)含有足够的同源性以支持其同与之具有同源
性的EPSPS基因组序列间的同源重组(或同源导向修复)。供体与基因组序列间大约25,50,
100,200,500,750,1000,1500,2000或更多个核苷酸的序列同源性(或任何在10到2000之间
整数值个核苷酸,或更多)将支持其间的同源重组。供体序列可在从10到5000个核苷酸(或
任何其间整数值个核苷酸)或更长的长度范围内浮动。显而易见所述供体序列通常与其取
代的基因组序列不完全相同。举例而言,所述供体多核苷酸的序列可较之所述基因组序列
含有一个或更多单碱基变 化,插入,缺失,倒位或重组,只要存在与染色体序列足够的同源
性。或者,供体序列可含有两侧为两个同源区域的非同源序列。此外,供体序列可包括含有
下述序列的载体分子,即其与细胞染色质中的目标区域不同源。一般而言,供体序列的同源
区域将具有与期望其与之进行重组的基因组序列至少50%的序列同一性度。在有些实施方
案中,存在60%,70%,80%,90%,95%,98%,99%或99.9%的序列同一性度。可存在任何
在1%与100%之间值的序列同一性度,取决于所述供体多核苷酸的长度。
[0351] 供体分子可含有数个,非毗连的区域,其与细胞染色质同源。举例而言,为靶向插入通常不存在于目标区域的序列,所述序列可存在于供体核酸分子上,且其两侧为与目标
区域的基因序列具有同源性的区域。
[0352] 为使确定成功插入所述供体序列的分析(例如,杂交,PCR,限制性酶消化)简单化,有些相对EPSPS基因组序列的序列差异可能存在于供体序列中。优选地,若其位于编码区
域,则上述核苷酸序列差异将不改变氨基酸序列,或将造成沉默氨基酸变化(亦即,不影响
所述蛋白质结构或功能的改变)。所述供体多核苷酸可任选的含有对应于在目标区域锌指
结构域结合位点的序列改变,以阻止剪切已通过同源重组导入细胞染色质的供体序列。
[0353] 所述供体多核苷酸可为DNA或RNA,单链或双链,且可以线性或环状形式导入细胞。若以线性形式导入,所述供体序列的两端可通过本领域技术人员已知的方法保护(例如,防
止核酸外切性降解)。举例而言,一个或更多双脱氧核苷酸残基可添加到线性分子的3’末
端,和/或将自身互补的寡核苷酸连接到一个或两个末端。参见,例如,Chang et al.(1987)
Proc.Natl.Acad.Sci.USA 84:4959-4963;Nehls et al.(1996)Science 272:886-889。附
加的保护外源多核苷酸防止降解的方法包括但不仅限于,添加末端氨基基团与使用修饰的
核苷酸间连接,例如,磷硫酰化合物,氨基磷酸酯,以及O-甲基核糖或脱氧核糖残基。
[0354] 多核苷酸可作为载体分子的一部分导入细胞,所述载体分子具有其它序列,例如,复制起点,启动子与编码抗生素抗性的基因。另外,供体多核苷酸可作为裸露核酸,作为与
试剂,例如脂质体或聚羟体(poloxamer)的复合物导入,或这可通过细菌或病毒(例如,土壤
杆菌,根瘤菌属(Rhizobium sp.)NGR234,苜蓿中华根瘤菌(Sinorhizoboium meliloti),百
脉根中生根瘤菌(Mesorhizobium loti),烟草花叶病病毒,马铃薯病毒X,花椰菜花叶病病
毒 与木薯叶脉花叶病病毒)。参见,例如,Chung et al.(2006)Trends Plant Sci.11(1):
1-4。
[0355] 虽不愿拘于单一理论,但看来在细胞序列中双链断裂的存在,加上与邻近或围绕所述断裂的区域具有同源性的外源DNA分子的存在,激活下述细胞机理,即其通过将序列信
息从所述供体分子转移到细胞(例如,基因组或染色体)序列中来修复所述断裂;亦即,通过
同源导向修复过程,亦称为“基因转换”。申请人的方法有利的将改造ZFP的强力靶向能力与
剪切域(或剪切半域)组合以特异性的靶向共生同源基因,例如EPSPS基因,从而使得靶序列
的剪切在下述基因组区域产生双链断裂,即在所述区域期望插入外源序列。
[0356] 为改变染色体序列,并不需要将供体的全序列拷贝入所述染色体,只要拷贝足够多的供体序列以实现所期望的序列改变。
[0357] 通过同源重组插入供体序列的效率与细胞DNA中双链断裂与期望重组发生的位点间的距离负相关。换言之,当双链断裂越靠近期望重组发生的位点时,同源重组的效率就越
高。当其中准确的重组位点未预决时(例如,所期望的重组事件可在一段基因组序列范围上
发生时),选择所述供体序列的长度与序列,以及剪切位点,以获取所期望的重组事件。当其
中所述期望的事件设计为在基因组序列中改变一个单独核苷酸对的序列时,细胞染色质在
该核苷酸对任一侧10000个核苷酸以内受剪切。在有些实施方案中,剪切发生在距需改变其
序列的核苷酸对任一侧1,000,500,200,100,90,80,70,60,50,40,30,20,10,5或2个核苷酸
以内,或为任何在2到1000之间整数值的核苷酸。
[0358] 如上所详述,两个融合蛋白,每个均包括锌指结合区域与剪切半域,其结合位点,自每个结合位点靠近另一个结合位点最近的边缘测定,可为5-8或15-18个核苷酸以外,且
剪切发生在所述结合位点之间。剪切是发生在所述结合位点间的单一位点处还是多个位点
处并不重要,这是因为受剪切的基因组序列由供体序列所取代。从而,为有效的通过靶向重
组改变一个单独核苷酸对的序列,结合位点间区域的中点为距该核苷酸对10000核苷酸以
内,优选1000核苷酸以内,或500个核苷酸以内,或200个核苷酸以内,或100个核苷酸以内,
或50个核苷酸以内,或20个核苷酸以内,或10个核苷酸以内,或5个核苷酸以内,或2个核苷
酸以内,或1个个核苷酸以内,或就在 目标核苷酸对处。
[0359] 在有些实施方案中,同源染色体可适用作供体多核苷酸。从而,例如,在异源杂合体中突变的校正可通过改造出下述融合蛋白来达成,即所述蛋白结合于并剪切在一个染色
体上的所述突变序列,但并不剪切在同源染色体上的野生型序列。在携带突变的染色体上
的双链断裂激发了基于同源的“基因转换”过程,其中来自同源染色体的野生型序列被拷贝
入受剪切的染色体,从而恢复了两个拷贝的野生型序列。
[0360] 亦提供了可能增强靶向重组水平的方法与组合物,包括但不仅限于,使用附加的ZFP-功能性结构域融合物以激活涉及同源重组的基因的表达,例如,RAD52上位显性组
(epistasis group)成员(例如,Rad50,Rad51,Rad51B,Rad51C,Rad51D,Rad52,Rad54,
Rad54B,Mre11,XRCC2,XRCC3),其产物与前述基因产物(例如,BRCA1,BRCA2)相互作用的基
因,和/或在NBS1复合物中的基因。参见,例如,Boyko et al.(2006)Plant Physiology 
141:488-497 andLaFarge et al.(2003)Nucleic Acids Res 31(4):1148-1155。可使用类
似的ZFP-功能性结构域融合物,与本文公开的方法与组合物组合,以阻抑涉及非同源末端
连接的基因表达(例如,Ku70/80,XRCC4,poly(ADP ribose)polymerase,DNA ligase 4)。参
见,例如,Riha et al.(2002)EMBO 21:2819-2826;Freisner etal.(2003)Plant J.34:
427-440;Chen et al.(1994)European Journal ofBiochemistry 224:135-142。公开了使
用锌指结合区域与功能性结构域间融合物激活与阻抑基因表达的方法,例如,于共有的US 
Patents 6,534,261;6,824,978与6,933,113中。其它阻抑方法包括使用向需要阻抑的基因
靶向的反义寡核苷酸和/或小干扰RNA(siRNA或RNAi)或shRNA。
[0361] 作为激活涉及同源重组的基因产物表达的备选方法或附加方法,这些蛋白质(或其功能性片段)与以目标基因组区域(例如,EPSPS)为靶的锌指结合区域的融合物,可用于
将这些蛋白质(重组蛋白质)招致到目标区域,从而增加其局部浓度,并进一步激发同源重
组过程。或者,如上所述涉及同源重组的多肽(或其功能性片段)可为包含锌指结合区域,剪
切域(或剪切半域)以及所述重组蛋白(或其功能性片段)的三重融合蛋白的一部分。其它涉
及基因转换与重组相关染色质重建,且可用于前述方法与组合物的蛋白质,包括组蛋白乙
酰转移酶(例如,Esa1p,Tip60),组蛋白甲基转移酶(例如,Dot1p),组蛋白激酶与组蛋白磷
酸酶。参见,例如,Bhat et al.(1999)Plant J. 33:455-469。
[0362] 在包含锌指/核酸酶融合分子与供体DNA分子的细胞中,靶向重组效率的进一步增加,通过将细胞阻遏于细胞周期的G2期来达成,在该期同源性驱动的修复过程具最大限活
性。上述停止可用多种方法达成。举例而言,细胞可经下述物质处理,例如,药物,影响细胞
周期进行从而将细胞停止在G2期的化合物和/或小分子。这类分子的示例包括但不仅限于,
影响微管多聚化的化合物(例如,长春花碱,诺考达唑(nocodazole),紫杉醇),与DNA相互作
用的化合物(例如,顺-铂(II)二胺二氯化物,顺铂,阿霉素)和/或影响DNA合成的化合物(例
如,胸腺嘧啶核苷,羟脲,L-含羞草碱,依托泊苷(etoposide,5-氟代尿嘧啶)。重组效率的额
外增加通过使用组蛋白脱乙酰酶(HDAC)抑制剂(例如,丁酸钠,曲古抑菌素(trichostatin 
A))达成,所述抑制剂改变染色质结构以使细胞重组装置更易接近基因组DNA。
[0363] 其它停止细胞周期的方法包括过表达抑制CDK细胞周期激酶活性的蛋白,例如,通过将编码该蛋白的cDNA导入所述细胞或者通过将激活编码该蛋白的基因表达的改造ZFP导
入所述细胞。细胞周期停止亦可通过抑制细胞周期蛋白与CDK活性的方法来达成,例如,使
用RNAi方法(例如,U.S.PatentNo.6,506,559)或通过将下述改造ZFP导入所述细胞,即所述
ZFP阻抑一种或更多涉及细胞周期进行的基因,例如,细胞周期蛋白和/或CDK基因的表达。
关于合成改造锌指蛋白以调节基因表达的方法参见,例如,共有的U.S.Patent No.6,534,
261。
[0364] 或者,在有些情况下,在缺乏供体多核苷酸的情况下进行靶向剪切(优选在S或G2期),而重组发生在同源染色体间。
[0365] 表达载体
[0366] 编码一个或更多ZFP的核酸可克隆入载体内以供转化原核或真核细胞以进行复制和/或表达。载体可为原核载体,例如,质粒,或穿梭载体,昆虫载体或真核载体。编码ZFP的
核酸亦可克隆入表达载体内,以施用于植物细胞。
[0367] 为表达ZFP,编码ZFP的序列通常亚克隆入含有启动子以引导转录的表达载体中。合适的细菌与真核启动子在本领域为众所周知的,且描述于,例如,Sambrook et al.,
Molecular Cloning,A Laboratory Manual(2nd ed.1989;3rded.,2001);Kriegler,Gene 
Transfer and Expression:A Laboratory Manual (1990);and Current Protocols in 
Molecular Biology(Ausubel et al.,见上)中。针对,例如,大肠杆菌,芽孢杆菌属,沙
菌属的表达所述ZFP的细菌表达系统是可获取的(Palva et al.,Gene 22:229-235
(1983))。上述表达系统的试剂盒是可市购的。针对哺乳类细胞,酵母与昆虫细胞的真核表
达系统对本领域技术人员是众所周知的,且亦为可市购的。
[0368] 用于引导ZFP编码核酸表达的启动子取决于特定的用途。举例而言,适于宿主细胞的强组成型启动子通常用于表达与提纯ZFP。
[0369] 相反,当在体内施用ZFP以调节植物基因时(参见下面的“对植物细胞的核酸递送”部分),使用组成型或诱导型的启动子,取决于所述ZFP的特定用途。植物启动子的非限定性
示例包括源自A.thaliana泛肽-3(ubi-3)(Callis,et al.,1990,J.Biol.Chem.265-12486-
12493);A.tumifaciens甘露碱合酶(Δmas)(Petolino et al.,U.S.Patent No.6,730,
824);和/或木薯叶脉花叶病病毒(CsVMV)(Verdaguer et al.,1996,Plant Molecular 
Biology 31:1129-1139)的启动子序列。亦参见实施例。
[0370] 除启动子外,表达载体通常包含转录单元或表达盒,其包含需用于在宿主细胞,无论是原核还是真核细胞中表达核酸的所有额外元件。通常的表达盒从而含有启动子,其可
操作性的连接于,例如,编码所述ZFP的核酸序列,以及信号,其需用于,例如,转录物的有效
多聚腺苷化,转录终止,核糖体结合位点与翻译终止。其它盒元件可能包括,例如,增强子,
以及异源剪接信号。
[0371] 用于将遗传信息转送入细胞的特定表达载体根据ZFP的预期用途选取,例如,在植物,动物,细菌,真菌,原生生物等等中的表达(参见下面所述的表达载体)。标准细菌与动物
表达载体在本领域为已知的,且详述于,例如,U.S.Patent Publication 20050064474A1以
及International Patent PublicationsWO05/084190,WO05/014791与WO03/080809中。
[0372] 标准转染方法可用于产生下述细菌,哺乳类,酵母或昆虫细胞系,即其表达大量的蛋白质,所述蛋白质可随即使用标准技术提纯(参见,例如,Colleyet  al.,
J.Biol.Chem.264:17619-17622(1989);Guide to Protein Purification,inMethods in 
Enzymology,vol.182(Deutscher,ed.,1990))。真核与原核细胞的转化根据标准技术实施
(参见,例如,Morrison,J.Bact.132:349-351(1977);Clark-Curtiss & Curtiss,Methods 
in Enzymology 101:347-362(Wu et al.,eds., 1983)。
[0373] 可使用任何众所周知的将外源核苷酸序列导入上述宿主细胞中的过程。这些包括使用磷酸钙转染,polybrene,原生质体融合,电穿孔,声波方法(例如,声致孔
(sonoporation)),脂质体,显微注射,裸露DNA,质粒载体,病毒载体,包括附加体性的和整
合性的,以及其它任何众所周知的方法将克隆的基因组DNA,cDNA,人工合成DNA或其它外源
基因材料导入宿主细胞中(参见,例如,Sambrook et al.,见上)。仅仅需要所用的特定遗传
工程过程能够成功的将至少一个基因导入能够表达所选蛋白质的宿主细胞。
[0374] 针对植物细胞的核酸递送
[0375] 如上所指明,DNA构建体可通过多种常规技术导入(例如,导入其基因组)所期望的植物宿主。关于上述技术的综述,参见,例如,Weissbach &Weissbach Methods for Plant 
Molecular Biology(1988,Academic Press,N.Y.)Section VIII,pp.421-463;以及
Grierson & Corey,Plant Molecular Biology(1988,2d Ed.),Blackie,London,Ch.7-9。
[0376] 举例而言,所述DNA构建体可能使用例如电穿孔与对植物细胞原生质体的显微注射的方法直接导入所述植物细胞的基因组DNA,或者所述DNA构建体可使用生物弹射击
(biolistic)方法,例如DNA颗粒轰击(参见,例如,Klein et al(1987)Nature 327:70-73)
直接导入植物组织。或者,所述DNA构建体可能与合适的T-DNA侧翼区域合并,并导入常规的
根癌土壤杆菌宿主载体。根癌土壤杆菌介导转化技术,包括解除武装(disarming)与使用二
元载体,在科学文献中得到充分描述。参见,例如,Horsch et al(1984)Science233:496-
498,and Fraley et al(1983)Proc.Nat′l.Acad.Sci.USA 80:4803。
[0377] 另外,基因转移可能使用非农杆菌细菌或病毒,例如,Rhizobium sp.NGR234,Sinorhizoboium meliloti,Mesorhizobium loti,马铃薯病毒X,花椰菜花叶病病毒与木薯
叶脉花叶病病毒和/或烟草花叶病病毒。参见,例如,Chunget al.(2006)Trends Plant 
Sci.11(1):1-4。
[0378] 当细胞使用binary T DNA载体Bevan(1984)Nuc.Acid Res.2:8711-8721)或共培养过程(Horsch et al(1985)Science 227:1229-1231)由细菌感染时,所述根癌土壤杆菌
宿主的毒性功能将引导所述构建体与邻近的标记插入植物细胞的DNA。一般而言,所述土壤
杆菌转化系统用于改造双子叶植物(Bevan et al (1982)Ann.Rev.Genet 16:357-384;
Rogers et al(1986)Methods Enzymol.118:627-641)。所述土壤杆菌转化系统亦可用于转
化,以及转移DNA于单子叶植物与植物细胞。参见U.S.Patent No.5,591,616;Hernalsteen 
et al(1984)EMBO J 3:3039-3041;Hooykass-Van Slogteren et al(1984)Nature 311:
763-764;Grimsley et al(1987)Nature 325:1677-179;Boulton et al(1989)Plant 
Mol.Biol.12:31-40.;以及Gould et al(1991)Plant Physiol.95:426-434。
[0379] 备选的基因转移与转化方法包括但不仅限于,通过钙离子-,聚乙二醇(PEG)-或电穿孔-介导裸露DNA的摄入进行原生质体转化(参见Paszkowskiet al.(1984)EMBO J 3:
2717-2722,Potrykus et al.(1985)Molec.Gen.Genet.199:169-177;Fromm et al.(1985)
Proc.Nat.Acad.Sci.USA 82:5824-5828;andShimamoto(1989)Nature 338:274-276)以及
对植物组织进行电穿孔(D′Halluinet al.(1992)Plant Cell 4:1495-1505)。其它植物细
胞转化的方法包括显微注射,碳化介导DNA摄入(Kaeppler et al.(1990)Plant Cell 
Reporter 9:415-418),以及微粒轰击(参见Klein et al.(1988)Proc.Nat.Acad.Sci.USA 
85:4305-4309;以及Gordon-Kamm et al.(1990)Plant Cell 2:603-618)。
[0380] 本公开的方法与组合物可用于将外源序列插入植物细胞基因组中预决的位置。这是有用的,考虑到导入植物基因组的转基因表达严重取决于其整合位点。相应的,编码,例
如,养分,抗生素或治疗分子的基因可通过靶向重组插入到植物基因组中对其表达有利的
区域。
[0381] 通过上述任何转化技术产生的转化植物细胞可经培养再生出完整植物,其拥有转化的基因型以及由此,所期望的表型。上述再生技术依赖于在组织培养生长培养基中操作
某些植物激素,通常依赖于抗微生物剂和/或除草剂标记,其可与所期望的核苷酸序列一同
导入。自培养原生质体的植物再生描述于″Protoplasts Isolation and Culture″in 
Handbook of Plant Cell Culture,pp.124-176,Macmillian Publishing Company,New 
York,1983;以及Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRC 
Press,Boca Raton,1985。再生亦可得自植物愈伤组织,外植体,器官,花粉,胚或其部分。上
述再生技术一般的描述于Klee et al(1987)Ann.Rev.of Plant Phys.38:467-486。
[0382] 导入植物细胞的核酸可用于给予基本上任何植物以所期望的性状。使用现行公开的核酸构建体与上面所述多种转化方法,广泛种类的植物与植物细 胞系统可经改造以获
取本文所述的所期望的生理学和农学特征。在优选实施方案中,需改造的目标植物与植物
细胞包括但不仅限于,那些单子叶与双子叶植物,例如作物,包括谷类作物(例如,小麦,玉
米,稻,黍,大麦),果实作物(例如,西红柿,苹果,梨,草莓,橙子),草料作物(例如,苜蓿),根
菜作物(例如,胡萝卜,马铃薯,甜菜,甘薯(yam)),叶菜作物(例如,莴苣(lettuce),菠菜);有
花植物(例如,牵花,玫瑰,雏菊),松柏类树木(例如,松杉,杉);用于phytoremediation
的植物(例如,积聚重金属的植物);油料作物(例如,向日葵,油菜籽)以及实验用的植物(例
如,拟南芥(Arabidopsis))。从而,本公开的方法与组合物具有对广泛范围的植物的用途,
包括但不仅限于,来自天门冬属(Asparagus),燕麦属(Avena),芸薹属(Brassica),柑橘属
(Citrus),西瓜属(Citrullus),辣椒属(Capsicum),南瓜属(Cucurbita),胡萝卜属
(Daucus),飞蓬属(Erigeron),大豆属(Glycine),棉属(Gossypium),大麦属(Hordeum),莴
苣属(Lactuca),黑麦草属(Lolium),番茄属(Lycopersicon),苹果属(Malus),木薯属
(Manihot),烟草属(Nicotiana),诸葛菜属(Orychophragmus),稻属(Oryza),鳄梨属
(Persea),菜豆属(Phaseolus),豌豆属(Pisum),梨属(Pyrus),李属(Prunus),萝卜属
(Raphanus),黑麦属(Secale),茄科(Solanum),高梁属(Sorghum),小麦属(Triticum),葡萄
属(Vitis),豇豆属(Vigna)与玉蜀黍属(Zea)。
[0383] 本领域技术人员将认定在所述表达盒稳定的掺入转基因植物并确证为可操作的之后,其可通过有性杂交导入其它植物中。多种标准育种技术任意均可使用,取决于需进行
杂交的物种。
[0384] 转化的植物细胞,愈伤组织,组织或植物可根据由存在于所述转化DNA上的标记基因编码的性状通过选择或筛选所述改造植物材料进行识别与分离。举例而言,可通过将改
造植物材料在下述培养基中生长而实施选择,即所述培养基含有抗生素或除草剂的量足以
具有抑制性,但针对其所述转化基因构建体提供抗性。进一步,转化植物与植物细胞亦可能
通过筛选任何可见标记基因(例如,β-葡萄糖醛酸苷酶,荧光素酶,B或C1基因)的活性来识
别,所述标记基因可能存在于重组核酸构建体上。上述选择与筛选方法对本领域技术人员
是众所周知的。
[0385] 亦可使用物理与生物化学方法以识别包含插入基因构建体的植物或植物细胞转化体。这些方法包括但不仅限于:1)Southern分析或PCR扩增以检测 与确定重组DNA插入的
结构;2)Northern blot,S1 RNase保护,引物延伸或反转录酶-PCR扩增以检测与检查所述
基因构建体的RNA转录物;3)酶分析以检测酶或核酶活性,其中上述基因产物由所述基因构
建体编码;4)蛋白质凝胶电泳,Western blot技术,免疫沉淀或酶联免疫分析,其中所述基
因构建体产物为蛋白质。其它技术,例如原位杂交,酶染色以及免疫染色亦可用于在特定植
物器官与组织中检测所述重组构建体的存在或表达。实施所有这些分析的方法对本领域技
术人员为众所周知的。
[0386] 使用本文公开方法进行基因操作的结果可通过,例如,对自目标组织分离的RNA进行Northern blot来加以观察。通常,若mRNA的量增加,则可假定其相应的内源基因较之之
前表达速率增加。可使用其它测定基因和/或CYP74B活性的方法。可使用不同类型的酶分
析,取决于所使用的底物以及检测反应产物或副产物增加或减少的方法。此外,CYP74B水平
和/或表达量可用免疫化学方法,亦即,ELISA,RIA,EIA与其它对本领域技术人员为众所周
知的基于抗体的分析,例如通过电泳检测分析(可进行染色或Westernblotting),来进行测
定。转基因可选择性的表达于所述植物的某些组织或某些发展阶段,或所述转基因可基本
上在所有植物组织中,基本上在其整个生活史中表达。然而,任何组合式的表达模式亦可适
用。
[0387] 现行公开亦涵盖了上述转基因植物的种子,其中所述种子具有所述转基因或基因构建体。现行公开进一步涵盖了上述转基因植物的后代,克隆,细胞系或细胞,其中所述后
代,克隆,细胞系或细胞具有所述转基因或基因构建体。
[0388] ZFP与编码ZFP的表达载体可直接施用于植物以供基因调节,靶向剪切和/或重组。在有些实施方案中,所述植物包含多个共生同源靶基因。已知植物可含有多个共生同源基
因,举例而言,欧洲油菜具有5个共生同源的EPSPS基因(SEQ ID NOS:10-14),其可为一个或
更多ZFP的靶(参见实施例)。从而,一个或更多不同ZFP或编码ZFP的表达载体可施用于植物
以在该植物中靶向一个或更多EPSPS基因。举例而言,对1,2,3,4,5或直至任何数量的共生
同源基因(例如,EPSPS共生同源基因)或存在于植物中的所有共生同源基因(例如,EPSPS共
生同源基因)可进行靶向。
[0389] 在有些实施方案中,作为靶的EPSPS基因包含选自下组的核苷酸序列:SEQ ID NOS:10-14或与其至少有大约80%-100%同一性的序列,包括任何在 该范围内的同一性百
分比,例如与其有81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%序列
同一性。
[0390] 有效量的使用可通过通常用于引导ZFP与所需处理的植物细胞最终接触的任何途径。所述ZFP以任何合适的方法施用,优选使用医药上可接受的载体。施用上述调整剂的合
适方法是可用的,且对本领域技术人员为众所周知的,而且,尽管可使用多于一种途径施用
特定组合物,特定途径常常可提供较之其它途径更加迅捷而更加有效的反应。
[0391] 载体亦可部分根据所施用的特定组合物,以及用于施用该组合物的特定方法进行使用与确定。相应的,有广泛种类的医药组合物的合适配制可供使用。
[0392] 应用
[0393] 农业上一个特定的目标领域是遗传改良植物使其具有除草剂抗性。许多除草剂通过抑制植物需用于生长的关键酶或蛋白质来其作用。举例而言,除草剂草甘膦通过抑制合
成芳香族氨基酸的酶5-烯醇式丙酮酰-3-磷酸莽草酸合酶(EPSPS)来杀灭植物。对草甘膦具
有耐受性的植物已通过将EPSPS转基因插入植物基因组,过表达EPSPS,并选择性的突变
EPSPS以产生草甘膦抗性突变体来产生(参见,例如,U.S.Pat.Nos.5,312,910与6,987,213;
以及Papanikou et al.(2004)Planta 218(4):589-598)。
[0394] 举例而言,所述公开方法与组合物可用于调整表达以及EPSPS基因的靶向改变。在一方面,改造ZFP用于在植物中上调与下调EPSPS的表达。ZFP可选的与供调整基因表达的调
节区相联系,其可为共价或非共价的联系,且激活或阻抑EPSPS基因转录。上述ZFP可用于增
加或减少所述EPSPS酶的产生,在植物中控制芳香族氨基酸的生物合成,或者增加或减少植
物对除草剂草甘膦的耐受性,例如,使作物对除草剂草甘膦有抗性,增加作物产量,或消除
杂草或野生植物对草甘膦的抗性。
[0395] 包含一个或更多ZFP的组合物,或编码其的核苷酸,可施用于植物细胞。在一个实施方案中,至少两个识别EPSPS基因上或者相同靶序列或者不同靶序列的ZFP,或编码上述
ZFP的多核苷酸,施用于细胞。第一个ZFP可选的与第二个ZFP相联系,可为共价的或非共价
的。由或者相联系的或者单独的ZFP识别邻近靶位点可用于产生ZFP的协同结合,导致较之
单独结合于其各 自靶位点的ZFP亲和力更大的亲和力。
[0396] 对于阻抑基因表达,通常将所述基因的表达减少约20%(亦即,80%的非ZFP调整表达),较优选约50%(亦即,50%的非ZFP调整表达),更优选约70-100%(亦即,25%到0%
的非ZFP调整表达)。对于激活基因表达,通常将表达激活约1.5倍(亦即,150%的非ZFP调整
表达),优选2倍(亦即,200%的非ZFP调整表达),更优选5-10倍(亦即,500-1000%的非ZFP
调整表达),直至至少100倍或更多。
[0397] 改造ZFP激活剂与阻抑剂的表达亦可通过小分子调节系统,例如tet-调节系统与RU-486系统来控制(参见,例如,Gossen & Bujard,PNAS 89:5547(1992);Oligino et al.,
Gene Ther.5:491-496(1998);Wang et al.,Gene Ther.4:432-441(1997);Neering et 
al,Blood 88:1147-1155(1996);and Rendahl et al.,Nat.Biotechnol.16:757-761
(1998))。这些调节系统对所述ZFP激活剂与阻抑剂的表达给予小分子控制,且对所述目标
基因(例如,EPSPS)施加进一步水平的控制。
[0398] 在另一方面,ZFN用于在EPSPS基因组序列中诱导突变,例如,通过在两个位点剪切并缺失其间序列,通过在一个单独位点剪切继以非同源末端连接,在一个或两个位点剪切,
并在所述断裂间插入外源序列和/或通过在位点剪切从而移除一个或两个或几个核苷酸。
靶向剪切亦可用于构建基因敲除(例如,以供功能性基因组学或靶标确认)与协助将序列靶
向插入基因组(亦即,基因敲入(knock-in));例如,为细胞工程或蛋白质过表达的目的。插
入可通过下述方法进行,即通过同源重组或靶向整合取代染色体序列,其中将两侧具有与
染色体上目标区域同源的序列的新序列(亦即,不存在于目标区域内的序列)插入于预决的
靶位点。同样的方法亦可用于用突变体EPSPS基因序列取代野生型EPSPS基因序列,或将一
个等位基因变换为不同的等位基因。本文所描述的组合物与方法亦可用于产生具有可诱导
的ZFP和/或稳定整合入基因组的ZFN的植物种系。相应的,编码所述含锌指蛋白质的稳定整
合序列可在合适的诱导下表达以在所述植物中经历多个植物世代以及在植物发育的任何
阶段达成所期望的效果。
[0399] 此外,感染或整合植物病原体的靶向剪切可用于在植物宿主中通过下述方法治疗病原体感染:例如,通过剪切所述病原体的基因组从而使其病原性减少或消失。此外,靶向
剪切编码植物病毒受体的基因可用于阻遏上述载体 的表达,从而在植物中阻止病毒感染
和/或病毒扩散。
[0400] 植物病原体的示例包括但不仅限于:植物病毒,例如苜蓿花叶病毒(Alfamoviruses),甲型隐蔽病毒(Alphacryptoviruses),香蕉病毒(Badnaviruses),乙型
隐蔽病毒(Betacryptoviruses),二双粒病毒(Bigeminiviruses),雀麦花叶病毒
(Bromoviruses),大麦黄花叶病毒(Bymoviruses),发状病毒(Capilloviruses),香石竹潜
隐病毒(Carlaviruses),香石竹斑驳病毒(Carmoviruses),花椰菜花叶病毒
(Caulimoviruses),黄化线状病毒(Closteroviruses),豇豆花叶病毒(Comoviurses),黄瓜
花叶病毒(Cucumoviruses),质型弹状病毒(Cytorhabdoviruses),香石竹环斑病毒
(Dianthoviruses),突花叶病毒(Enamoviruses),蚕豆病毒(Fabaviruses),斐济病毒
(Fijiviruses),真菌传杆状病毒(Furoviruses),大麦病毒(Hordeiviruses),杂双粒病毒
(Hybrigeminiviruses),悬钩子病毒(Idaeoviruses),等变环点病毒(Ilarviruses),甘薯
病毒(Ipomoviruses),黄症病毒(Luteoviruses),玉米褪绿斑驳病毒(Machlomoviruses),
柘橙病毒(Macluraviruses),玉蜀黍雷亚多精致病毒(Marafiviruses),单双粒病毒
(Monogeminiviruses),矮缩病毒(Nanaviruses),坏死病毒(Necroviruses),线虫传多面体
病毒(Nepoviruses),核型弹状病毒(Nucleorhabdoviruses),水稻病毒(Oryzaviruses),欧
尔密病毒(Ourmiaviruses),植物呼肠孤病毒(Phytoreoviruses),马铃薯x病毒
(Potexviruses),马铃薯y病毒(Potyviruses),黑麦草花叶病毒(Rymoviruses),卫星
(satellite)RNAs,卫星病毒(satelliviruses),随伴病毒(Sequiviruses),南方菜豆花叶
病毒(Sobemoviruses),纤细病毒(Tenuiviruses),烟草花叶病毒(Tobamoviruses),烟草脆
裂病毒(Tobraviruses),番茄丛矮病毒(Tombusviruses),番茄斑萎病毒(Tospoviruses),
纤毛病毒(Trichoviruses),芜菁黄花叶病毒(Tymoviruses),幽影病毒(Umbraviruses),叶
脉曲张病毒(Varicosaviruses)与矮化病毒(Waikaviruses);真菌病原体,例如黑穗病(例
如黑粉菌(Ustilaginales)),锈病(锈菌(Uredinales)),麦角症(麦角菌(Clavicepts 
pupurea))与霉病;霉菌(卵菌(Oomycetes))例如马铃薯晚疫病菌(Phytophthora 
infestans)(马铃薯疫病);细菌病原体例如欧文氏菌(Erwinia)(例如,草生欧文氏菌
(E.herbicola)),假单胞菌(Pseudomonas)(例如,绿脓杆菌(P.aeruginosa),丁香假单胞菌
(P.syringae),荧光假单胞菌(P.fluorescense)与恶臭假单胞菌(P.putida)),劳 尔氏菌
(Ralstonia)(例如,茄科劳尔氏菌(R.solanacearum)),土壤杆菌(Agrobacterium)与黄单
胞菌(Xanthomonas);线虫(线虫动物门(Nematoda));以及植物粘液虫(Phytomyxea)(多粘
菌(Polymyxa)与根肿菌(Plasmodiophora))。
[0401] 公开的靶向重组方法可用于用同源非相同序列取代一个或更多EPSPS基因组序列。举例而言,突变体基因组序列可用野生型序列取代,或者,野生型基因组序列可用突变
体序列取代,用以,例如,使作物具有对除草剂草甘膦的抗性,增加植物产量,消除杂草或野
生植物对草甘膦的抗性,等等。同样的,基因的一个等位基因可由不同等位基因使用本文所
披露的靶向重组方法进行取代。
[0402] 在许多这样的情况下,目标EPSPS基因组区域包含突变,而供体多核苷酸包含相应的野生型序列。类似的,若期望,野生型基因组序列可由突变体序列取代。举例而言,可用下
述方法在植物中消除或减少草甘膦抗性,即用野生型基因取代突变的或外源EPSPS基因,移
除外源EPSPS基因,突变EPSPS基因至较低的草甘膦抗性,或者用支持较低水平EPSPS表达的
序列取代EPSPS基因的对照序列。或者,在植物中可将突变导入EPSPS基因使其具有针对草
甘膦的抗性,或者通过突变所述EPSPS基因以产生草甘膦耐受性EPSPS酶,或者通过用增加
EPSPS表达水平的序列取代所述EPSPS基因的对照序列。增加针对除草剂草甘膦耐受性的
EPSPS基因修饰与突变体EPSPS酶在本领域为已知的(参见,例如,U.S.Patent Nos.7,238,
508,7,214,535,7,141,722,7,045,684,6,803,501,6,750,377,6,248,876,6,225,114,6,
040,497,5,866,775,5,804,425,5,776,760,5,633,435,5,627,061,5,554,798,5,463,
175,5,312,910,5,310,667,5,188,642,5,145,783,4,971,908与4,940,835,以及WO00/
66748;以引用方式包含于本文中)。
[0403] 靶向剪切与靶向重组亦可用于改变非编码序列(例如,调节序列如启动子,增强子,起始子,终止子,剪接位点)以改变EPSPS基因产物的表达水平。上述方法可用于,例如,
增加草甘膦耐受性EPSPS变体在作物中的表达。
[0404] EPSPS基因的失活可通过下述方式达成,例如,通过一个单独剪切事件,通过剪切继以非同源末端连接,通过在两个位点剪切继以连接从而缺失所述两个剪切位点间的序
列,通过将错义或无义密码子靶向重组入编码区域,或通过将无关序列(亦即,“填充”序列)
靶向重组入所述基因或其调节区域, 从而破坏该基因或其调节区域。
[0405] 染色质结构的靶向修饰,如公开于共有的WO 01/83793中的,可用于促进融合蛋白与细胞染色质的结合。
[0406] 在其它实施方案中,除了或替代本文所公开的锌指-剪切域融合物,可使用一个或更多锌指结合区域与重组酶(或其功能性片段)的融合物,以促进靶向重组。参见,例如,共
有的US patent No.6,534,261与Akopian et al.(2003)Proc.Natl.Acad.Sci.USA 100:
8688-8691。
[0407] 在其它实施方案中,本公开的方法与植物用于提供其活性需要二聚作用(无论是同源二聚作用或异源二聚作用)的ZFP结合区域与转录激活或阻抑域的融合物。在这些情况
下,融合多肽包含锌指结合区域与功能性域单体(例如,来自二聚转录激活或阻抑域的单
体)。两个上述融合多肽结合于置于合适位置的靶位点允许二聚作用,从而重建功能性转录
激活与阻抑域。
[0408] 进一步,如上所公开的,本文提出的方法与组合物可用于将外源序列靶向整合入细胞基因组中的目标区域(例如,EPSPS基因的调节或编码序列),例如,其中剪切增强通过
同源依存性机理进行插入的(例如,插入包含外源序列与一个或更多与预决的基因组序列
(亦即,靶位点)或者为相同的,或者为同源非同一性的序列一起的供体序列)。
[0409] 如上所指明,在有些实施方案中,通过同源依存性以及同源非依存性机理进行靶向整合涉及将外源序列插入由剪切所产生的末端之间。所述插入的外源序列可为任何长
度,例如,在1到50个核苷酸长度间较短的“补片”序列(例如,2,3,4,5,6,7,8,9,10,11,12,
13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45或50个核苷酸的
序列)
[0410] 当其中靶向整合为同源依存性时,供体核酸或供体序列包含外源序列与一个或更多与预决的基因组序列(亦即,靶位点)或者为相同的,或者为同源非同一性的序列一起。在
有些实施方案中,在所述外源序列的两侧存在两个相同序列,或两个同源非相同序列(或两
者各一)。外源序列(或外源核酸或外源多核苷酸)为含有正常情况下不存在于目标区域内
的核酸序列的。
[0411] 外源序列的示例包括但不仅限于,cDNA,启动子序列,增强子序列,表位标记,标记基因,剪切酶识别位点与多种类型的表达构建体。标记基因包括但不仅限于,编码介导化学
或抗生素抗性(例如,氨苄青霉素抗性,卡那霉素抗性,G418抗性,潮霉素B抗性,嘌呤霉素抗
性,好必思(herbiace) 抗性)的蛋白质的序列,编码有色或荧光或发光蛋白质(例如,绿色
荧光蛋白,增强绿色荧光蛋白,红色荧光蛋白,荧光素酶)的序列,以及介导细胞生长和/或
基因扩增的蛋白质(例如,四氢叶酸还原酶)。表位标记包括,例如,一个或更多拷贝的FLAG,
His,myc,Tap,HA或者任何可检出的氨基酸序列。
[0412] 蛋白质表达构建体包括但不仅限于,cDNA与可操纵的连接于cDNA的转录控制序列。转录控制序列包括启动子,增强子与绝缘子。其它可包含在表达构建体中的转录与翻译
调节序列包括,例如,内核糖体进入位点,编码2A肽与多腺苷酸化信号的序列。蛋白质表达
构建体的示例为包含编码抗体重链的序列与编码抗体轻链的序列的抗体表达构建体,每个
序列可操纵的连接于启动子(所述启动子可为相同或不同),而所述序列其一或两者可选的
可操纵的连接于增强子(且当两个编码序列均连接于增强子时,所述增强子可为相同或不
同)。
[0413] 剪切酶识别位点包括,例如,由限制性核酸内切酶,靶向核酸内切酶和/或大范围核酸酶识别的序列。剪切酶识别位点的靶向整合(或者通过同源依存性或者通过同源非依
存性机理)对产生其基因组仅包含一个单独的特定酶剪切位点的细胞为有用的。将上述细
胞与识别并在该单独位点剪切的酶相接触促进随后外源序列的靶向整合(或者通过同源依
存性或者通过同源非依存性机理)和/或在该受剪切的位点处的靶向突变。
[0414] 靶向核酸内切酶的示例包括I-CeuI,PI-PspI,PI-Sce,I-SceIV,I-CsmI,I-PanI,I-SceI,I-SceII,I-PpoI,I-SceIII,I-CreI,I-TevI,I-TevII与I-TevIII。其识别序列为已
知。亦参见U.S.Pat.No.6,833,252,U.S.Pat.No.5,420,032;Belfort etal.(1997)Nucleic 
Acids Res.25:3379-3388;Dujon et al.(1989)Gene 82:115-118;Perler et al.(1994)
Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble et 
al.(1996)J.Mol.Biol.263:163-180;Argast et al.(1998)J.Mo1.Biol.280:345-353与
New England Biolabs产品目录。
[0415] 尽管大部分靶向核酸内切酶的剪切特异性相对其识别位点并非绝对,但所述位点足够长,从而使得通过在含有一个单独拷贝的其识别位点的细胞中表达靶向核酸内切酶可
在每个哺乳类大小的基因组中获取一个单独的剪切事件。亦有报道称可改造剪切酶以结合
非天然靶位点。参见,例如,Chevalier etal.(2002)Molec.Cell 10:895-905;Epinat et 
al.(2003)Nucleic Acids Res. 31:2952-2962;Ashworth et al.(2006)Nature 441:656-
659。
[0416] 之前使用靶向核酸内切酶以获取靶向重组与整合的方法受下述问题困扰,即所述识别位点的靶向插入极端低效,需要艰巨的筛选以识别含有所述识别位点插入所期望位置
的细胞。现行方法通过允许高效的靶向整合DNA剪切酶识别位点(或者为同源依存性或者为
同源非依存性)克服了这些问题。
[0417] 在有些实施方案中,靶向整合用于插入RNA表达构建体,例如,负责调节微RNA,shRNA或siRNA表达的序列。启动子,增强子与其它转录调节序列,如上所述,亦可掺入RNA表
达构建体。
[0418] 在其中靶向整合通过同源依存性机理发生的实施方案中,供体序列在外源序列两侧的区域含有足够的同源性以支持在基因组序列中进行同源导向修复,从而将所述外源序
列插入基因组靶位点。因此,所述供体核酸可为任何足以支持外源序列通过同源依存性修
复机理(例如,同源重组)整合的大小。虽不愿拘于任何特定理论,但在所述外源序列两侧的
同源区域被认为向断裂染色体末端提供了模板以供在所述双链断裂位点重新合成遗传信
息。
[0419] 外源序列的靶向整合,如本文所公开,可用于产生细胞与细胞系以供蛋白质表达。参见,例如共有的U.S.Patent Application Publication No.2006/0063231(基于所有目
的,其公开由此以其全文引用的方式包含于本文中)。为由整合入基因组的外源序列编码的
一种或更多蛋白质的最佳表达,所述染色体整合位点应与整合序列的高水平转录相容,优
选在广泛细胞类型与发育状态中均如此。然而,观察到整合序列的转录依赖于整合位点而
浮动,其余因素姑且不计,这是由于所述整合位点的基因组染色质结构。相应的,期望支持
高水平整合序列转录的基因组靶位点。在有些实施方案中,亦期望外源序列的整合不导致
一种或更多细胞基因(例如,癌基因)的异位激活。另一方面,当整合启动子和/或增强子序
列时,可能期望异位表达。
[0420] 对有些实施方案,期望整合位点并不存在于必需基因(例如,对细胞存活必要的基因)中,从而使得外源序列的整合并不导致所述必需基因的失活。另一方面,如果意图为关
闭基因功能(亦即,构建基因“敲除”),外源序列的靶向整合以破坏内源基因为有效的方法。
在这些情况下,所述外源序列可为任何序列,只要其能够阻遏所述内源基因转录,或产生非
功能性的翻译产物,例如,可能可检出的一小片氨基酸残基(见上)。在有些实施方案中,所
述外源序列可包括标记基因(如上所述),允许对进行了靶向整合的细胞加以 选择。
[0421] 其它支持高水平转录整合序列的基因组靶位点可识别为开放染色质或“易接近的区域”,如描述于,例如,共有的U.S.Patent Application Publications2002/0064802
(2002年5月30日)与2002/0081603(2002年6月27日)。
[0422] 在基因组序列中双链断裂的存在不仅促进外源序列的同源依存性整合(亦即,同源重组),亦促进外源序列在所述双链断裂位点同源非依存性整合入基因组。相应的,本文
所公开的组合物与方法可用于靶向剪切基因组序列,继以外源序列非同源依存性整合于该
靶剪切位点或其附近。举例而言,细胞可与一个或更多如本文所述经改造以在基因组中目
标区域剪切的ZFP-剪切域(或剪切半域)融合蛋白(或一种或更多编码上述融合蛋白的多核
苷酸)以及包含缺乏针对目标区域同源性的外源序列的多核苷酸相接触,以获取下述细胞,
即其中所述外源序列的全部或部分整合入目标区域。
[0423] 本文所公开的靶向整合(亦即,将外源序列插入基因组)方法,无论是同源依存性的还是同源非依存性的,均可用于多种目的。这些包括但不仅限于,将基因或cDNA序列插入
细胞基因组以使细胞能够表达所述基因或cDNA的转录和/或翻译产物。在其中疾病或病状
可来自多种突变中一种的情况下(例如,多个点突变散布于所述具有的序列中),野生型基
因cDNA拷贝的靶向整合(或者为同源依存性的或者为同源非依存性的)特别有效。举例而
言,将上述野生型cDNA插入未翻译的先导序列或位于所有已知突变上游的基因第一个外显
子。在有些整合体中,若其保持翻译阅读框,则其结果为所述野生型cDNA表达且其表达由合
适的内源转录调节序列调节。在其它实施方案中,上述整合的cDNA序列可包括置于所述野
生型cDNA下游,突变体内源基因上游的转录(和/或翻译)终止信号。以此方法,使致病基因
的野生型拷贝表达,且所述变异体内源基因不表达。在其它的实施方案中,将野生型cDNA的
一部分插入基因的合适区域中(例如,其中致病突变成簇聚集的基因)。
[0424] 实施例
[0425] 下列为实施现行公开的特定实施方式的实施例。所述实施例仅为说明目的而提供,且并无以任何方式限定现行公开范围的意图。
[0426] 经努力保证所用数值(例如,量,温度,等等)的准确度,但理所当然 的,应容许一些实验误差与偏差。
[0427] 实施例1:在欧洲油菜中识别靶序列
[0428] A.序列鉴定
[0429] 将已知功能的天然菜籽油基因DNA序列选为使用改造锌指核酸酶进行基因组剪辑的靶。这些基因,称作5-烯醇式丙酮酰莽草酸-3-磷酸合酶(5-enolpyruvyl shikimate-3-
phosphate synthase)(EPSPS)基因的序列源自欧洲油菜L,Nex710。该酶EPSPS为莽草酸途
径的第六个酶,所述途径对在植物中合成芳香族氨基酸与许多芳香族代谢物至关重要
(Bentley(1990)Crit.Rev.Biochem.Mol Biol.25:307-384)。其催化磷酸烯醇式丙酮酸
(PEP)的烯醇式丙酮酸半基转移至莽草酸-3-磷酸(S3P)的5-羟基上。因为欧洲油菜为合并
芜菁(2n=20,AA)与甘蓝(2n=18,CC)染色体组所得的双二倍体(Morinaga,1934;U,1935),
期望在该物种中应具有多于一个基因的EPSPS。
[0430] B.DNA分离
[0431] 将欧洲油菜变种Nex710种子植于温室中。在栽植13日后收获试样,将其在液氮中闪冻(flash frozen),并储藏于-80℃直至使用。
[0432] 基因组DNA通过使用或者溴化十六烷基三甲基铵沉淀,或者为分离植物DNA的Plant DNeasy抽提试剂盒(Qiagen,Valencia,CA)分离。对使用CTAB的过程,将1g叶组织(六
株植物的组)在液氮中磨碎。如Permingeat et al.(PlantMol.Biol.Reptr.(1998)16:1-6;
以引用方式包含于本文中)所描述分离DNA,但是修饰了抽提缓冲液。所述修饰的抽提缓冲
液含有100mM Tris-HCl(pH8.0),2M NaCl,25mM EDTA,2.5%CTAB(Sigma Catalog#H-5882)
与1.5%聚乙烯吡咯烷酮-40(PVP-40)。总基因组DNA使用PLANT DNEASY extractionkit
(Qiagen,Valencia,CA),根据生产商的推荐分离,除了一处修饰。将PVP-40添加入AP1缓冲
液(Qiagen)至终浓度为1%。若DNA需经限制性酶消化,其将进一步通过两次下述的聚乙二
醇(PEG,MW8000)沉淀步骤提纯。将等体积的1.2M NaCl/13%PEG添加到DNA中,并在上培
育2小时。随即将试样以5000xg旋转10分钟,弃去上清,用70%乙醇洗涤沉淀。用冷冻干燥
全去除乙醇,并将所述DNA沉淀重新悬浮于EB缓冲液中(Qiagen)。
[0433] 随即使用PicoGreen荧光核酸染色根据贩卖商的指示(Molecular Probes, Eugene,OR)通过在260与280nm处的吸光度读数测定DNA。DNA的质量通过在0.8%琼脂糖胶
上使用Tris-乙酸-EDTA(TAE)缓冲液将DNA试样进行跑胶来检查(Sambrook et al.(1989)
Gel electrophoresis of DNA,MolecularCloning.Cold Spring Harbor Laboratory 
Press,p.6.7)。
[0434]
[0435] 在欧洲油菜基因组DNA基因扩增,克隆与测序之前通过Southern分析实施对EPSPS基因拷贝数的估计。消化基因组DNA的限制性酶通过下述方法选择,即其在所述基因中切割
DNA一次(Gasser and K1ee(1990)NucleicAcid Research 18:2821),并在其两侧的基因组
序列中切割第二次,从而使得对每个EPSPS基因在与EPSPS基因探针杂交后得到独特大小的
基因组DNA片段。多数所选的限制性酶(Pvu II,Nde I,Bsr BI,Bsa I,Bcl I,Bsm I,Afl 
II)或者靠近5’端或者在基因中间切割,只有BclI例外,其在所述基因的3’端,即探针杂交
处切割(见下)。
[0436] DNA试样(对Nex710每个5μg,对欧洲油菜每个4μg,对甘蓝每个3μg)用30单位的每种限制性酶Pvu II,Nde I,Bsr BI,Bsa I,Bcl I,Bsm I与Afl II分别在eppendorf试管中
根据生产商的指示(New England BioLabs)消化过夜。对消化的DNA试样随即进行乙醇沉
淀,并冷冻干燥所得沉淀。
[0437] 干燥过的沉淀在2x上样缓冲液中重新悬浮,装载于0.85%琼脂糖胶,并对其在0.4xTris-乙酸缓冲液在pH8.0下进行电泳(Sambrook et al.(1989)Gelelectrophoresis 
of DNA,Molecular Cloning,Cold Spring Harbor Laboratory Press,p.6.7)。随即将所
得胶用溴乙锭染色,并用UV将DNA条带显影。随即将DNA在25mM焦磷酸钠buffer(Murray et 
al.(1992)Plant Mol.Biol.Reptr.10:173-177)转移到GENESCREEN PLUS杂交转移膜上
(DuPont NEN,Boston,MA,USA)。预杂交在65℃下于SIGMA PERFECT HYB PLUS杂交缓冲液
(Sigma,St.Louis,MO)中至少进行2小时。杂交在该缓冲液中在添加放射性探针(见下)后过
夜进行。杂交与预杂交两个步骤均使用杂交烤炉(RobbinsScientific Corp,Sunnyvale,
CA,USA)进行。在20倍稀释的包含200mM磷酸钠pH7.8,50mM焦磷酸钠,10mM EDTA与2%SDS
(Murray et al.,见上)的洗涤缓冲液中洗涤所得膜。使用起初5分钟的漂洗继以两次每次
15分钟的洗涤。所得印迹随即在室温下暴露于磷光成像屏12小时,然后在BIORAD PERSONAL 
FX磷光成像仪(Bio-Rad,Hercules,CA)中扫描。
[0438] 所述供Southern blot杂交的EPSPS探针通过PCR使用欧洲油菜变种Nex710作为基因组DNA模板产生。引物从基于公开的欧洲油菜基因组DNA序列(Gasser and Klee,见上)的
外显子8序列使用VECTORNTI软件(Invitrogen,Carlsbad,CA)设计,并由MWG BIOTECH,Inc.
(High Pint,NC,USA)定制合成。正向与反向引物的序列分别为TTGGAGCTACAGTGGAAGAAGGTT
(SEQ ID NO:1)与CGATTGCATCTCACTCAGTTCATTA(SEQ ID NO:2)。PCR反应包含5μl 10X HOT 
START PCR缓冲液(Qiagen,Valencia,CA,USA),2μl25mM MgCl2,4μl 10mM核苷酸混合液,1μ
l每种(20μM),1.5单位HOT STARTTaq DNA多聚酶(Qiagen,Valencia,CA),5μl Nex710模板
DNA,以及灭菌水使总体积为50μl。扩增在ICYCLER IQ实时PCR仪上(Bio-Rad,Hercules,CA)
进行,使用下列参数:起初在95℃下变性15分钟,继以在95℃下35周期30秒,在55.5℃与
52.9℃下退火30秒,以及在72℃下30秒。350碱基对的PCR产物用QIAQUICK核苷酸移除试剂
盒(Qiagen,Valencia,CA)纯化。DNA大小与完整性通过在2.0%E-GEL琼脂糖胶
(Invitrogen,Carlsbad,CA)上进行电泳来进行验证。使用PICOGREEN DNA量化试剂
(Invitrogen,Carlsbad,CA)来确定片段的数量。使用READY-TO-GO DNA标记珠(-dCTP)
(Amersham Biosciences,Piscataway,NJ)标记DNA探针。
[0439] Southern blot分析显示多个欧洲油菜EPSPS特异性条带(四个或更多),以及可能有同样多的基因存在(图1)。芜菁与甘蓝DNA与较少条带杂交,且其数量与位置合计不足以
得到欧洲油菜的模式,表明在双二倍体化之后,亲本与欧洲油菜基因组中发生了序列分歧。
次要条带可能来自与其它具有少量序列同源性的欧洲油菜基因的交叉杂交。
[0440] D.基因扩增与序列分析
[0441] 在现行研究中,芜菁EPSPS cDNA序列(GenBank Accession No.AY512663,SEQ ID NO:3)用于使用BLAST算法查询TIGR欧洲油菜EST数据组(可在互联网上
tigrblast.tigr.org/tgi/获取)。识别出了两个序列,TC1307(部分且未标注)与TC1308(全
长EPSPS)。所述TC1307序列为EPSPS基因序列。使用AY512663与TC1307序列涉及多种短寡聚
核苷酸用作PCR引物,包括下列正向寡聚核苷酸:
[0442] 5’-ATGGCGCAAGCTAGCAGAATCTGCC-3’(SEQ ID NO:4)
[0443] 5’-ATGGCGCAAGCTAGCAGAATC-3’(SEQ ID NO:5)
[0444] 5’-CCAGCAGCAGCGTGGAGCTTATCAGATA-3’(SEQ ID NO:6),以及下列反向寡聚核苷酸:
[0445] 5’-GGCCCAAAACTGATTCAACGATTGC-3’(SEQ ID NO:7)
[0446] 5’-CGTTGCCACCAGCAGCAGTA-3’(SEQ ID NO:8)
[0447] 5’-GATGGTCCAGTCACAGTCACACTGTTCTCTGT-3’(SEQ IDNO:9)。
[0448] 所有的寡聚核苷酸引物由Integrated DNA Technologies(IDT,Coralville,IA)合成并购自。
[0449] 对基于PCR的分析,DNA扩增在含有2.5μl的10X LA PCR bufferII(Mg2+plus)(Takara Bio Inc.,Otsu,Shiga,Japan),0.7μl的25mM MgCl2,4μl的10mM nucleotide 
mix,0.5μl的每种引物(20μM),1.25单位TAKARALA Taq多聚酶(Takara Bio Inc.),1μl的欧
洲油菜变种Nex710模板DNA(3-10ng DNA),以及灭菌水至25μl的总体积的PCR反应混合物中
进行。扩增或者在MJthermocycler(Bio-Rad,Hercules,CA)或者在GENEAMP PCR system 
9700(Applied Biosystems,Foster City,CA)中,使用下列参数进行:起初在94℃下变性1
分钟,继以30周期在94℃下20秒,在59℃下30秒,以及在72℃下2分钟。PCR产物的大小与完
整度通过电泳验证。
[0450] 当用SR130与SR131引物(分别为SEQ ID NOS 4与7)实施PCR时,扩增出了2.6kb-3kb大小的DNA片段。将这些片段使用来自Invitrogen(Carlsbad,CA)的TA cloning kit根
据生产商的推荐方法直接克隆入载体pCR2.1(Invitrogen,Carlsbad,CA)。克隆片段在DAS
使用CEQ dye terminatorcycle sequencing kit(Beckman Coulter,Fullerton,CA)根据
生产商的推荐进行测序或将测序服务包给Cogenics之前为Lark Technologies,
Inc.Houston,TX)。多个克隆的序列分析揭示了三个相异的基因片段。这些基因片段称为
EPSPS共生同源基因C,D与E(SEQ ID NOS:12-14)。
[0451] 为了识别所述基因其它可能存在于欧洲油菜基因组中的变体,在如上所述同样的PCR条件下以温度梯度运行PCR。扩增在ICYCLER IQ实时PCR仪(Bio-Rad,Hercules,CA)中使
用下述参数进行:起初在94℃下变性1分钟,继以30周期在94℃下20秒,在40℃到60℃温度
梯度下30秒,以及 72℃下4分钟。进行72℃下30分钟的最后延伸,继以4℃下无限期暂停。在
这些条件下,一个特定的对应约2.5kb扩增DNA的条带在52.5℃下产生。将扩增的DNA克隆入
载体pCR2.1,并对其如前所述进行测序。多个克隆的序列分析清楚的指明该PCR产物代表不
同的基因,其识别为EPSPS共生同源基因B(SEQ ID NO:11)。
[0452] 对应于片段TC1307的引物1307F(SEQ ID NO:5)与1307R(SEQ ID NO:8)用于下列组成的PCR反应液:5μl的10X Hot Start PCR buffer(Qiagen,Valencia,CA),3μl的25mM 
MgCl2,4μl的10mM核苷酸混合物,1μl的每种引物(20μM),1.5单位的HOT START Taq DNA多
聚酶(Qiagen,Valencia,CA),5μl(20ng)的Nex710模板DNA,以及灭菌水至总体积50μl。扩增
在ICYCLER IQ PCR仪(Bio-Rad,Hercules,CA)中使用下列参数进行:起初在95℃下变性15
分钟,继以35周期的95℃下30秒,在40℃到60℃的温度梯度下30秒,以及在72℃下1分钟。在
72℃下进行10分钟的最后延伸继以在4℃下无限期暂停。在这些条件下,在41.4℃产生了
700bp的扩增DNA条带。将该片段克隆于TOPO PCR2.1载体中并如前所述进行测序。多个克隆
序列比对后得到669bp的序列,其识别为EPSPS共生同源基因A(SEQ ID NO:10)。
[0453] 其它PCR反应使用引物4th_Gene_F2(SEQ ID NO:6)与EPSP_cDNA_R9(SEQ ID NO:9)进行以扩增共生同源基因A的更长序列。PCR反应混合物为下列组成:10.0μl的ACCUPRIME 
SUPERMIX II PCR扩增试剂(Invitrogen,Carlsbad,CA),0.5μl的每种引物(20μM),3μl的
Nex710模板DNA,以及灭菌水至总体积20μl。扩增使用下列参数进行:95℃下3分钟,继以10
周期的95℃下30秒,73℃(-0.5℃/周期)下30秒,以及68℃下3分钟,继以30周期95℃下30
秒,68℃下30秒与68℃下3分钟。再继以68℃下最终延伸30分钟。将约2kb的扩增片段克隆入
TOPO PCR2.1载体并随即如前所述进行测序。多个克隆序列比对后得到1571bp的共生同源
基因A序列。
[0454] 芜菁cDNA(SEQ ID NO:3)与欧洲油菜基因组DNA(SEQ ID NO:14)的比较显示在EPSPS基因中存在8个外显子与7个内含子。基于该比较,从欧洲油菜变种Nex710 DNA分离所
得的所有5个共生同源基因的序列比对表明,在所述基因之间在编码区域有小的差异,例如
单核苷酸多态性(SNPs),而内含子序列在核苷酸水平上的具有显著更大的差异。总体而言,
在5个EPSPS共生同源基因间有84%或更多的序列同源性(参见表2)。
[0455] 表2.EPSPS共生同源基因A-E间的序列同源性(%)
[0456] (SEQ ID NOS:10-14)
[0457] EPSPS 共生同源基因 共生同源基因D 共生同源  基因E  98 共生同源  基因A  88 共生同源  基因B  84 共生同源  基因C  97
 共生同源基因E     88   84   95
 共生同源基因A       92   87
 共生同源基因B         84
[0458] 注意到了所述5个共生同源基因间的差异,这是因为其凸显了可由序列依存性DNA结合蛋白,例如锌指蛋白辨别的序列区域。期望设计与尽管非常相似的序列中一个基因序
列结合但不与另一个结合的锌指DNA结合区域。对所述共生同源基因中的四个,B,C,D与E
(SEQ ID NOS:11-14),其近乎全长的基因序列,以及对1575kb的共生同源基因A,其部分基
因序列受选择作为设计锌指核酸酶的靶,如下面所述。
[0459] 实施例2:EPSPS锌指DNA结合区域的设计
[0460] 使用自欧洲油菜EPSPS共生同源基因A-E(实施例1,图9-13)中识别的靶位点,为EPSPS锌指选择识别螺旋。代表性EPSPS锌指涉及的识别螺旋如下示于表A
[0461] 表A:EPSPS锌指设计
[0462]ZFN  名称   F1   F2   F3   F4   F5   F6
10654  EPSPS QSGDLTR  (SEQ ID  NO:91) RSDTLST  (SEQ ID  NO:92) RNDNRIT  (SEQ ID  NO: QSSDLSR  (SEQ ID  NO:94) QSSDLTR  (SEQ ID  NO:  无
93) 95)
10658*  EPSPS DRSNLSR  (SEQ ID  NO:96) RSDALAR  (SEQ ID  NO:97) QNAHRKT  (SEQ ID  NO: RSDHLSE  (SEQ ID  NO:99) NSRNRKT  (SEQ ID  NO:  无
98) 100)
9875  EPSPS  QSSDLSR  (SEQ ID RSDHLSR  (SEQ ID QSSDLRR  (SEQ ID QSGNLAR  (SEQ ID QSGNLAR  (SEQ ID   无 [0463]
    NO:94)   NO:101)   NO:102)   NO:103)   NO:103)  
  10275     RSDVLSQ  (SEQ ID  NO:   RNANRKK  (SEQ ID  NO:   RSDNLST  (SEQ ID     RNDARIT  (SEQ ID  NO:   RSDNLST  (SEQ ID     DNSSRIT  EPSPS 104) 105) NO:106) 107) NO:106) (SEQ ID  
NO:108)
  10740   RSDVLSE  (SEQ ID  NO:   TSGHLSR  (SEQ ID  NO:   RSDDLSK  (SEQ ID     DSSARKK  (SEQ ID  NO:   无   无 EPSPS 109) 110) NO:111) 112)
  10741     TSGNLTR  (SEQ ID  NO:   TSGSLTR  (SEQ ID  NO:   RSDHLST  (SEQ ID     QSANRTK  (SEQ ID  NO:   无   无 EPSPS 113) 114) NO:115) 116)
  10742     TSGNLTR  (SEQ ID  NO:   TSGSLTR  (SEQ ID  NO:   RSDHLSQ  (SEQ ID     TSSNRIT  (SEQ ID  NO:   无   无 EPSPS 113) 114) NO:117) 118)
  9876  EPSPS   QSSDLRR  (SEQ ID  NO:   RSDHLSR  (SEQ ID  NO:   QSSDLRR  (SEQ ID     DRSALSR  (SEQ ID  NO:   QSGNLAR  (SEQ ID     无
102) 101) NO:102) 119) NO:103)
  9882  EPSPS   QSSDLRR  (SEQ ID  NO:   RSDHLST  (SEQ ID  NO:   HSDTRKK  (SEQ ID     QSGNLAR  (SEQ ID  NO:   QSGNLAR  (SEQ ID     无
102) 115) NO:120) 103) NO:103)
  11038     QSGNLAR  (SEQ ID  NO:   TSGSLTR  (SEQ ID  NO:   RSDHLST  (SEQ ID     QSANRTK  (SEQ ID  NO:   无   无 EPSPS 103) 114) NO:115) 116)
  11039     QSGNLAR  (SEQ ID  NO:   TSGSLTR  (SEQ ID  NO:   RSDHLSQ  (SEQ ID     TSSNRIT  (SEQ ID  NO:   无   无 EPSPS 103) 114) NO:117) 118)
  10744     RSDDLSE  (SEQ ID  NO:   TNSNRKR  (SEQ ID  NO:   RSDSLSA  (SEQ ID     TSANLSR  (SEQ ID  NO:   无   无 EPSPS 121) 122) NO:123) 124)
  10743     RREDLIT  (SEQ ID  NO:   TSSNLSR  (SEQ ID  NO:   RSDTLSE  (SEQ ID     QNANRKT  (SEQ ID  NO:   无   无 EPSPS 125) 126) NO:127) 128)
  10745     RSDTLSE  (SEQ ID  NO:   TSANLSR  (SEQ ID  NO:   RSDSLSA  (SEQ ID     TSANLSR  (SEQ ID  NO:   无   无 EPSPS 127) 124) NO:123) 124)
  9892  EPSPS   RSDNLSA  (SEQ ID  NO:   QNRDRKN  (SEQ ID  NO:   QSGDLTR  (SEQ ID     RSDALAR  SEQ ID  NO:   RSDNLRE  (SEQ ID     无
129) 130) NO:91) 97) NO:131)
  9895  EPSPS   RSAALAR  (SEQ ID  NO:   RSDDLTR  (SEQ ID  NO:   QSGDLTR  (SEQ ID     RSDTLSQ  (SEQ ID  NO:   QSGSLTR  (SEQ ID     无
132) 133) NO:91) 134) NO:135)
  9896  EPSPS   RSDALAR  (SEQ ID  NO:   RSDDLTR  (SEQ ID  NO:   QSGDLTR  (SEQ ID     RSDTLSQ  (SEQ ID  NO:   QSGSLTR  (SEQ ID     无
97) 133) NO:91) 134) NO:135)
  10657*     DRSNLSR  (SEQ ID  NO:   RSDALAR  (SEQ ID  NO:   QNAHRKT  (SEQ ID     RSDHLSE  (SEQ ID  NO:   NSRNRKT  (SEQ IN     无 EPSPS 96) 97) NO:98) 99) NO:100)
  12385     QSGDLTR  SEQ ID  NO:   RSDTLST  (SEQ ID  NO:   RNDNRIT  (SEQ ID     QSSDLSR  (SEQ ID  NO:   LLTTLKA  (SEQ ID     无 EPSPS 91) 92) NO:93) 94) NO:136)
[0464]  12202*     DRSNLSR  (SEQ ID  NO:   RSDALAR  (SEQ ID  NO:   QNAHRKT  (SEQ ID     RSDHLSE  (SEQ ID  NO:   KNFNLHQ  (SEQ ID     无 EPSPS 96) 97) NO:98) 99) NO:137)
  14318*     DRSNLSR  (SEQ ID  NO:   RSDALAR  (SEQ ID  NO:   QNAHRKT  (SEQ ID     RSDHLSE  (SEQ ID  NO:   KNFNLHQ  (SEQ ID     无 EPSPS 96) 97) NO:98) 99) NO:137)
  14320*     DRSNLSR  (SEQ ID  NO:   RSDALAR  (SEQ ID  NO:   QNAHRKT  (SEQ ID     RSDHLSE  (SEQ ID  NO:   KNFNLHQ  (SEQ ID     无 EPSPS 96) 97) NO:98) 99) NO:137)
  13969     DRSNLSR  (SEQ ID  NO:   RSDALAR  (SEQ ID  NO:   TSTGLLI  (SEQ ID     RSDHLSE  (SEQ ID  NO:   KNFNLHQ  (SEQ ID     无 EPSPS 96) 97) NO:138) 99) NO:137)
  12540     DRSNLSR  (SEQ ID  NO:   RSDALAR  (SEQ ID  NO:   VSHTRLD  (SEQ ID     RSDHLSE  (SEQ ID  NO:   NSRNRKT  (SEQ ID     无 EPSPS 96) 97) NO:139) 99) NO:100)
  12352     QSGDLTR  (SEQ ID  NO:   RSDTLST  (SEQ ID  NO:   TRYKLMS  (SEQ ID     QSSDLSR  (SEQ ID  NO:   QSSDLTR  (SEQ ID     无 EPSPS 91) 92) NO:140) 94) NO:95)
  11034     RSDVLSE  (SEQ ID  NO:   TSGHLSR  (SEQ ID  NO:   RSDDLSK  (SEQ ID     DSSARKK  (SEQ ID  NO:   无   无 EPSPS 109) 110) NO:111) 112)
  11036     TSGNLTR  (SEQ ID  NO:   TSGSLTR  (SEQ ID  NO:   RSDHLST  (SEQ ID     QSANRTK  (SEQ ID  NO:   无   无 EPSPS 113) 114) NO:115) 116)
  11037     TSGNLTR  (SEQ ID  NO:   TSGSLTR  (SEQ ID  NO:   RSDHLSQ  (SEQ ID     TSSNRIT  (SEQ ID  NO:   无   无 EPSPS 113) 114) NO:117) 118)
             
             
[0465] (*备注-10657与10658,12202,14318与14320,10740与11034,10741与11036,以及10742与11037 ZFN彼此的区别在于并非位于识别螺旋上的突变)
[0466] 所述锌指设计的靶位点如下所示于表B。ZFP10654与10658为共生同源基因C与D上的靶位点设计;ZFP9875与10275为共生同源基因D上的靶位点设计;而ZFP10740,10741与
10742为结合于共生同源基因A与B上的靶位点而设计。
[0467] 表B:EPSPS锌指的靶位点
[0468] ZFN名称   靶位点(5’to 3’)
 10654 EPSPS   ttACTGCTgCAGGTGGCAac (SEQ ID NO:141)
 10658 EPSPS   ggCAGCGGTGAGTGGACgc (SEQ ID NO:142)
[0469]  9875 EPSPS   ttGAAGAAGCTGGGGCTta(SEQ ID NO:143)
  10275 EPSPS   gcATCAAGcATGTAGTTGATGtc(SEQ ID NO:144)
  10740 EPSPS   aaATCTCGGGTCTGat(SEQ ID NO:145)
  10741 EPSPS   tcTAATGGGTTGAAgc(SEQ ID NO:146)
  10742 EPSPS   tcTAATGGGTTGAAgc(SEQ ID NO:146)
  9876 EPSPS   ttGAAGAAGCTGGGGCTta(SEQ ID NO:143)
  9882 EPSPS   ttGAAGAAGCTGGGGCTta(SEQ ID NO:143)
  11038 EPSPS   tcTAATGGGTTGAAgc(SEQ ID NO:146)
  11039 EPSPS   tcTAATGGGTTGAAgca(SEQ ID NO:146)
  10744 EPSPS   gaGATTTGGATCCGgg(SEQ ID NO:147)
  10743 EPSPS   tcCAACCGGATTCTtc(SEQ ID NO:148)
  10745 EPSPS   gaGATTTGGATCCGgg(SEQ ID NO:147)
  9892 EPSPS   tgCAGGTGGCAaCGCAAGgat(SEQ ID NO:149)
  9895 EPSPS   caGTAACGGCAGCGGTGag(SEQ ID NO:150)
  9896 EPSPS   caGTAACGGCAGCGGTGag(SEQ ID NO:150)
  10657 EPSPS   ggCAGCGGTGAGTGGACgc(SEQ ID NO:142)
  12385 EPSPS   ttACTGCTgCAGGTGGCAac(SEQ ID NO:141)
  12202 EPSPS   ggCAGCGGTGAGTGGACgc(SEQ ID NO:142)
  14318 EPSPS   ggCAGCGGTGAGTGGACgc(SEQ ID NO:142)
  14320 EPSPS   ggCAGCGGTGAGTGGACgc(SEQ ID NO:142)
  13969 EPSPS   GCAGCGGTGAGTGGACG(SEQ ID NO:151)
  12540 EPSPS   tgCAGCTGTAAGTGGACgc(SEQ ID NO:152)
  12352 EPSPS   ttACTGCTgCTGGTGGCAac(SEQ ID NO:153)
  11034 EPSPS   aaATCTCGGGTCTGat(SED ID NO:145)
  11036 EPSPS   tcTAATGGGTTGAAgc(SEQ ID NO:146)
  11037 EPSPS   tcTAATGGGTTGAAgc(SEQ ID NO:146)
[0470] 将所述EPSPS设计并入下述锌指表达载体,即其编码具有至少一个有CCHC结构的指的蛋白质。参见,U.S.Patent Application Serial No.60/874,911。尤其是,每个蛋白的
最后指具有CCHC骨架。随即将锌指编码序列融合于IIS型限制性酶FokI的核酸酶结构域(通
过四氨基酸的ZC接头与Wah et al.(1998)Proc.Natl.Acad.Sci.USA 95:10564-10569序列
的384-579位氨基酸)以形成EPSPS ZFN。对多种ZFN分析其生物学活性和/或毒性,如
U.S.PatentApplication No.60/995,566所述。
[0471] 实施例3:在HEK293细胞中EPSPS特异性ZFN的功能性验证
[0472] 本文所述的EPSPS ZFN促进同源重组的能力在描述于Urnov(2005)Nature 435(7042):646-51与U.S.Patent Publication No.20050064474(例如,实施例6-11)中的GFP
系统中得到了测试。简言之,携带所述EPSP基因目标区域的HEK293报道细胞系如下所述产
生,通过PCR扩增所述EPSP基因的目标区域,并随后将其克隆入pcDNA4TO-GIF。使用上述质
粒转染HEK293,并随后在转染后48小时在400μg/ml博莱霉素(Zeocin)存在下进行选择。
[0473] 所得稳定克隆的池随即使用下述ZFN进行测试,即所述ZFN导向在上述所产生的报道细胞系中EPSP基因的特定目标区域,测试方法如下所述。将报道细胞系以350000细胞/孔
接种于12孔板中的1mL DMEM,10%FBS培养基(无PSG),并用50或100ng每种ZFN进行转染,并
且将500ng无启动子的GFP供体(Urnov(2005)Nature)转染入500000报道细胞中,使用每试
样2uL Lipofectamine 2000(Invitrogen),根据Invitrogen Lipofectamine 2000实验方
案进行。每对ZFN的转染重复三次。在转染后翌日,对每个孔添加1mLDMEM培养基,其中含有
1.5uL长春花碱使终浓度为0.2μM到1mM,并在转染72小时后将其移除。在转染5天后通过在
Guava桌上FACS分析仪上通过每次转染测量40000细胞来分析所得细胞的GFP表达。示例性
的结果示于图14,小图A到E。
[0474] 实施例4:在欧洲油菜变种Nex710中一个ZFN可剪切两个或更多EPSPS共生同源基因
[0475] 为了评价设计的锌指核酸酶在植物细胞中的功能性,利用了在生活植物细胞中表达上述蛋白质的方法。可在DNA没有掺入植物细胞基因组的条件下将编码锌指核酸酶蛋白
质的DNA递送入植物细胞。从而,所述DNA暂时维持在植物细胞中,并充当基因表达的模板。
或者,可在允许DNA掺入植物细胞基因组的条件下将编码锌指核酸酶蛋白质的DNA递送入植
物细胞,导致锌指核酸酶编码基因的转基因,从而使得所得DNA分子稳定维持在植物细胞
中,并充当基因表达的模板。本领域技术人员可利用锌指核酸酶编码DNA的暂时或转基因表
达之一以评价这些蛋白在生活植物细胞中的功能性。
[0476] A.载体设计
[0477] 在欧洲油菜细胞中构建了质粒载体以供表达ZFN蛋白。为了优化表达与两个需用以形成功能性的锌指核酸酶异源二聚体的不同蛋白质的相对化学量,采用了下述的表达策
略,即其导致两个ZFN单体的开放阅读框均插入一个单独的载体,由一个单独的启动子驱
动。该策略利用了源自Thesoa assigna病毒的2A序列(Mattion,et al.(1996)J.Virol.70,
8124-8127),或者为SMV病毒核定位信号(NLS)(PKKKRKV(SEQ ID NO:15);Kalderon et al.
(1984a)Nature 311:33-38;Kalderon et al.(1984b)Cell 39:499-509),或者为来自
opaque-2基因(op-2;Maddaloni et al.(1989)Nucleic Acids Research 17:7532;Van 
Eenennaam et al.(2004)Metabolic Engineering 6:101-108)的玉米NLS,的功能性,以及
源自木薯叶脉花叶病病毒启动子或CsVMV的启动子(参见表3)。
[0478] 表3.存在于用于欧洲油菜转化的多种构建体中的ZFN对与表达元件的描述
[0479]     ZFN对   构建体号   构建体类   基因卡盒
S.N. 型
  1   10654-v2/10657-v2   pDAB7147   二元的   CsVMV/ZFN对/AtuORF23//  AtUbi10/Pat/AtuORF1
  2   10654-v3/10658-v3   pDAB7150   二元的   CsVMV/ZFN对/AtuORF23//  AtUbi10/Pat/AtuORF1
  3   10654-v2/10657-v2   pDAB7151   非二元的   CsVMV/ZFN对/AtuORF23
  4   10654-v3/10658-v3   pDAB7154   非二元的   CsVMV/ZFN对/AtuORF23
  5   10740-v2/10741-v2   pDAB7185   二元的   RB7 MAR//CsVMV//ZFN  对//AtuORF23//中断的  ipt(onc 4)基因Orf//4OCS  delta mas 2’//PAT//AtuORF1
  6   10740-v2/10742-v2   pDAB7186   二元的   RB7 MAR//CsVMV//ZFN  对//AtuORF23//中断的  ipt(onc 4)基因Orf//4OCS  delta mas 2’//PAT//AtuORF1 [0480] CsVMV=木薯叶脉花叶病病毒启动子与517bp的先导序列(Verdaguer et al.
(1998)Plant Mol.Biol.37:1055-1067);AtuORF23=根癌土壤杆菌ORF23 3’UTR;AtUbi10
=拟南芥泛肽基因10启动子;Pat=来自绿色产色链霉菌(Streptomyces 
viridochromogenes)草胺膦乙酰转移酶基因。其为报道于USpatent 5633434中的重建基
因;AtuORF1=Agrobacterium tumefacians ORF1 3’ UTR(Genebank accession number 
X00493,NC_002377);RB7MAR=烟草基质附着区;4OCS delta mas 2’=修饰的甘露碱合酶
启动子,其包含4X OCS元件以增强表达;中断的ipt(onc 4)基因Orf=根癌土壤杆菌破坏的
ipt基因(使用genebank序列ID ATTMRPTI以供设计)。
[0481] 设计了分步的模式克隆方案以开发这些针对任何给定对的ZFN编码基因的表达载体,所述ZFN编码基因为选自文库档案或从头合成。首先,pVAX载体(参见,例如
U.S.Patent Publication 2005-0267061,所述公开以引用方式包含于此)经修饰以涵盖示
于图2A-2E的N-末端表达域。该修饰质粒(pVAX-N2A-NLSop2-EGFP-FokMono)(Figure 2A)的
特征包括重新设计与合成的NLS编码区段,与重新设计的与合成的编码FokI核酸酶结构域,
使用双子叶植物偏好的密码子。另外,在独特的XhoI位点下游的一个单独核苷酸插入(C)形
成了额外的SacI位点以便克隆。
[0482] 其次,pVAX载体(参见,例如U.S.Patent Publication 2005-0267061)亦经修饰以涵盖C-末端表达域。该修饰质粒(pVAX-C2A-NLSop2-EGFP-FokMono)(Figure 2B)的特征包
括重新设计的与合成的NLS编码区段,与重新设计的与合成的编码FokI核酸酶结构域,使用
双子叶植物偏好的密码子。另外,来自Thosea asigna病毒的2A序列(EGRGSLLTCGDVEENPGP,
SEQ ID NO:16)导入ZFN ORF的N-末端以达随后连接所述两个蛋白质编码域的目的。
[0483] 使用限制性酶KpnI与BamHI产生相容末端通过连接将编码个别锌指蛋白ORF的基因盒克隆入N2A或C2A载体之一。其次,将来自C2A载体的BglII/XhoI片段使用相同限制性位
点插入N2A载体,得到含有下述盒的中间构建体,即所述盒包括夹在NcoI与SacI限制性位点
之间的两个ZFN编码域(图2C)。
[0484] 最终,来自该中间构建体的NcoI/SacI盒(图2C),包含两个ZFN基因,使用这些限制性酶切出,并连接入质粒骨架pDAB3731。所得的质粒,例如pDAB7151(图2D),包含所述ZFN基
因加上相关的启动子与终止子序列,加上选择性标记以供质粒维持(表2)。所述序列通过限
制性酶消化与测序来确证。在该构建体中,所述ZFN表达盒(包括启动子与终止子元件)两侧
为attL位点以供使用来自Invitrogen(Carlsbad,CA)的GATEWAY system进行方便的操作。
将每个使用该克隆方案产生的ZFN构建体转化入大肠杆菌DH5α 细胞(Invitrogen,
Carlsbad,CA),并随后在合适的选择下维持。
[0485] 对农杆菌介导植物转化,将所述ZFN盒使用GATEWAY  LR CLONASE反应(Invitrogen,cat#11791-019)克隆入二元构建体。所得的二元构建体(图2E)通过限制性酶
消化确证,并随即转化入根癌土壤杆菌菌株Z707s。包含该克隆的菌落通过限制性酶消化与
测序反应确证。
[0486] B.暂时与稳定表达系统
[0487] ZFN表达构建体的质粒制备,例如pDAB7151,如图2所描述,自2L生长于含有抗生素的培养的大肠杆菌使用无核酸内切酶的GIGAPREP kit(Qiagen,Valencia,CA)根据生产商
的推荐方法产生。使用多种方法将质粒DNA直接递送于欧洲油菜的下胚轴细胞。
[0488] 在暂时ZFN递送的一个实施例中,对菜籽下胚轴节片(部分)通过触须-介导的下胚轴节片暂时转化进行DNA递送。欧洲油菜变种Nex710的种子经用10%(v/v)CLOROX(5.25%
次氯酸钠)表面灭菌10分钟并用灭菌蒸馏水漂洗三次。随后,在含有1/2浓度MS培养基(1/
2MS基础盐分与维生素,1%蔗糖,0.8%琼脂糖,pH5.8)的Phytatray上,以每Phytatray25种
子使种子发芽。将所述种子置于培养室以使其在23℃下发芽5天,其光周期为16小时光照,8
小时黑暗。于日5,将3mm长的下胚轴节片在无菌情况下切出,并置于无菌水中以阻止当在切
其它节片时其变干。弃去茎与根节片。将所得节片水平置于一张灭菌滤纸之上,静止在
MSK1D1培养基(MS基础盐分与维生素,1mg/L激动素,1mg/L 2,4-二氯苯氧基乙酸[2,4-D],
30g/L蔗糖,7g/L TC琼脂糖,pH5.8)表面上。将节片在23℃与16小时光照下培养3天。
[0489] 在触须处理日,将300根部分愈伤组织的下胚轴节片与30ml“高渗培养基”(MS盐与B5维生素,4.42mg/L 2,4-D以及12%蔗糖)一起置于Sorvall瓶中在室温下进行一小时预处
理。该预处理是使组织部分胞质分离的手段以试着在随后的触须处理中当破坏细胞壁时缓
解对细胞的损害。随后,将8.1ml5%Silar SO-9碳化硅触须(Advanced Composite 
Materials,LLC Greer,SC)溶液与170μg如上述制备的非二元ZFN质粒DNA(表2)添加至
Sorval瓶。所述瓶随即在颜料混合器(Red Devil Equipment Co.,Minneapolis,MN)上剧烈
振荡30秒,其中所述颜料罐钳组件经改造翻新以握持Sorval瓶。在振荡后,将100ml“高渗培
养基”立刻添加到瓶中,并允许其在室温下恢复20分钟。随 即通过将所述瓶的内容物倾倒
通过合适大小的灭菌线网的方法回收以将节片自触须与瓶的液体内容物分离。最后,将节
片置回到有滤纸的新鲜的MSK1D1培养基板上。在触须处理后日1,2,3与7取约100mg的试样
以供暂时表达分析。
[0490] 在另一个实施例中,所述暂时递送系统使用聚乙二醇(PEG)介导转化下胚轴原生质体。原生质体使用由Sun et al.(Can.J.Bot.(1998)76:530-541)描述的方法经修饰从欧
洲油菜变种Nex710苗的下胚轴组织制备。种子经表面灭菌并在MS菜籽培养基上如上所述发
芽7天。为每次处理收集一克下胚轴。将下胚轴切成<=1mm大小的薄切片,并置于含有MS9m
培养基(9%甘露醇,5mM MES,10mM精氨酸,0.3%聚乙烯吡咯烷酮-40(PVP-40))的100mm培
养板中。在将所有下胚轴节片都置于培养皿中后,用吸量管移除液体培养基,并用6ml酶溶
液(包含0.1%Macerozyme-R10(Yakult Honsha Co.Ltd,Tokyo,Japan),1%Cellulase-R10
(Yakult Honsha Co.Ltd,Tokyo,Japan),1%Pectinase(Sigma Chemical Co.)的MS9m)取
代。
[0491] 将所得组织在25℃下置于暗处在旋转振荡器上以40rpm轻微振荡16小时以消化细胞壁。在培育后,在无菌条件下将酶-原生质体溶液通过置于50ml可丢弃离心管之上的100μ
m细胞滤过器(Sigma Chemical Co.)过滤。将溶液在50xg下离心5分钟。在弃去上清后,将原
生质体沉淀重新悬浮于4mlMS9m培养基中。在15ml离心管中将原生质体悬浮液轻柔的层叠
于含4.5ml含0.5M蔗糖溶液的MS之上并在50xg下离心。用微量吸管将原生质体从位于相之
间的厚条带中取出,并通过在50xg下离心5分钟用5ml MS9m培养液洗涤。
[0492] 为进行DNA处理,将所述原生质体沉淀重新悬浮于200μl甘露醇镁溶液中以达到最终浓度为1×105原生质体/ml。将50μl非二元质粒DNA,例如pDAB51(表2)的试样添加到置于
15ml可丢弃灭菌离心管中的200μl原生质体溶液中并混匀。将等体积的40%PEG-3350溶液
(Sigma Chemical Co)添加到所述原生质体溶液中,并在室温下培育20分钟。随后,添加
0.8ml W5培养基(125mM CaCl2H2O,154mM NaCl,5mM KCl与5mM葡萄糖),并另外培育10分钟
继以在180xg下离心3分钟。用吸量管移除PEG溶液,并将原生质体重新悬浮于1ml WI溶液。
随即将试管在暗处培育约18小时,继以在180xg下离心3分钟。移除上清,并将100μl原生质
体悬浮液转移至2ml Eppendorf 管中。在DNA处理后0,1,2,3日收集原生质体(105/ml),并
储藏于-80℃直至分析。将10μl原生质体悬浮液试样与二乙酸荧光素染料混合,并在血细胞
计数器中计量存活的原生质体。
[0493] 在另一个实施例中,该暂时递送系统使用农杆菌介导转化下胚轴节片。将节片在灭菌滤纸上于愈伤组织诱导培养基MSK1D1上培养,并如上所述触须实验方案给予3日预处
理。在农杆菌处理前日,将二元质粒,例如pDAB7147(表2)的细菌培养(1环)接种到含有包括
合适抗生素的35ml YEP培养基的烧瓶中。允许所述细菌培养在暗处以200rpm恒定振荡在28
℃下生长过夜~16小时。翌日,将农杆菌溶液在液体M培养基中制备到浓度为Klett 50。将
下胚轴节片从滤纸转移到100x25mm含40ml农杆菌悬浮液的培养皿并在室温下每10分钟周
期性回荡培育30分钟。在处理期间最后,移除农杆菌溶液并将下胚轴节片转移回原来含有
MSK1D1培养基与滤纸的板中。在Percival中,或在培养室中通过将板覆以箔减少光强度
将节片共培养3日。
[0494] 在三日共培养后,将节片转移至愈伤组织诱导培养基MSK1D1TC(MS,1mg/l激动素,1mg/l 2,4-D,0.5mg/l MES,5mg/l AgNO3,300mg/l特泯菌(Timentin),200mg/l羧苄青霉素
(carbenicillin),3%蔗糖,0.7%植物琼脂(Phytagar))。在农杆菌处理后0,2,3,4与7日取
约100mg下胚轴组织并在-80℃下储藏直至分析。
[0495] 在一个使用稳定转基因表达系统的ZFN递送的实施例中,将欧洲油菜变种Nex710的种子表面灭菌,发芽5日,制备≤1mm的下胚轴节片,并如触须处理中所述预处理3日。在3
日后,用任何二元农杆菌菌株(表2)处理下胚轴节片,并如上述农杆菌介导暂时表达系统所
描述的共培养3日。
[0496] 在共培养3日后,将300个下胚轴节片转移到愈伤组织诱导培养基MSK1D1H1(MS,1mg/l激动素,1mg/l 2,4-D,0.5gm/l MES,5mg/l AgNO3,300mg/l特泯菌,200mg/l羧苄青霉
素,1mg/l好必思,3%蔗糖,0.7%植物琼脂)中用低水平除草剂选择7日。随即将下胚轴节片
转移至含有高水平选择的MSK1D1H3(MS,1mg/l激动素,1mg/l 2,4-D,0.5gm/l MES,5mg/l 
AgNO3,300mg/l特泯菌,200mg/l羧苄青霉素,3mg/l好必思,3%蔗糖,0.7%植物琼脂)中2
周,并随即转移至MSK1D1H5培养基(MS,1mg/l激动素,1mg/l2,4-D,0.5gm/l MES,5mg/l 
AgNO3,300mg/l特泯菌,200mg/l羧苄青霉素,5mg/l好必思,3%蔗糖,0.7%植物琼脂)再两
周。对每个二元构建体得到总 共203与227个愈伤组织系(表2),其愈伤组织频率分别为
67.6%与75.5%。在农杆菌处理5-7周后随即对五十个随机愈伤组织系进行DNA分析。
[0497] C:靶向ZFN介导双链剪切的EPSPS共生同源基因分析
[0498] 在本实施例中ZFN的功能性应理解为包括(但不仅限于)ZFN在作物物种细胞中表达,以及该ZFN在该作物的内源基因组中通过识别,结合与剪切其所期望的靶以介导双链
(ds)断裂的能力。亦应理解,在本实施例中,所述ZFN的靶为在内源基因座的基因,以及其在
所述作物基因组内的构象。为了评价改造ZFN是否具有针对所期望的靶基因在基因组环境
中的功能性,采用了基于DNA序列的分析。预计在DNA中ZFN诱导ds断裂诱导修复机理,例如
非同源末端连接(NHEJ)(由Cahill et al.(2006)Front Biosci.1:1958-1976综述)。NHEJ
的一个结果为部分断裂DNA链会以非完美的形式修复,导致在剪切位点的少量缺失,插入或
取代。本领域技术人员可通过多种方法检测DNA序列中的这些变化。
[0499] 为在EPSPS共生同源基因中识别NHEJ,使用基于PCR的方法开发了基因特异性分析。在五个EPSPS共生同源基因中四个,即A,B,C与D中的序列差异足以允许开发共生同源基
因特异性的分析。在靶基因座,共生同源基因D与E的序列无法足够分辨开来,导致仅开发了
一种分析来代表这两个共生同源基因。PCR扩增使用对靶基因具有特异性,并侧接所述ZFN
的预期剪切位点的寡聚核苷酸引物进行。共生同源基因特异性PCR引物如下所述:
[0500] 共生同源基因A:
[0501] 正向引物:5’-TCCCAGCTTCTTTAGATTCTAAGG-3’(SEQ ID NO:17)
[0502] 反向引物:5’-CTGCAACTTTTCACATAGCAA-3’(SEQ ID NO:18)
[0503] 共生同源基因B:
[0504] 正向引物:
[0505] 5’-CAAGAGTGATATCGAGTTGTACCTTGGGAATGCT-3’)(SEQ IDNO:19)
[0506] 反向引物:5’-AGGCCATCATATCGAGCAAACGCAGT-3’(SEQ ID NO:20)
[0507] 共生同源基因C:
[0508] 正向引物:5’-GGGTAAACAACCGTGCTGTA-3’(SEQ ID NO:21)
[0509] 反向引物:5’-AAAGACTGCTGCAAACAAGATC-3’(SEQ ID NO:22)
[0510] 共生同源基因D/E:
[0511] 正向引物:5’-GGTTGTTGAAGGATGCGGT-3’(SEQ ID NO:23)
[0512] 反向引物:5’-GCAAACAATTCATAGAGTAAATGTG-3’(SEQ ID NO:24)
[0513] 所有的正向与反向PCR引物均对给定直向同源基因组合使用以扩增或者纯化的基因组DNA或者含有每个共生同源基因的阳性对照质粒DNA,反应条件如下:25μl反应体积包
含2.5μl DNA模板(10ng/μl)或质粒DNA阳性对照(1ng/μl),0.625μl每种引物(每种10μM),
2.5μl的10x ACCUPRIME PCR bufferII,以及0.15μl(0.75单位)在酶生产商提供的缓冲液
中的ACCUPRIME TaqDNA多聚酶(Invitrogen,Carlsbad,CA)。扩增在ICYCLER IQ(Bio-Rad,
Hercules,CA)使用下述参数进行:94℃下2分钟,35周期(94℃下30秒,退火(参见下述梯度)
30秒,68℃下1分钟),68℃下10分钟,4℃下无限期暂停。
[0514] 运行梯度以确定最佳反应条件。梯度温度为65.0℃与50.0℃之间。共生同源基因A,B,C与D/E分别在62.1℃,65.0℃,65.0℃与59.3℃的退火温度下显示最佳扩增(图3A-
3D),且在后续研究中使用这些温度。将所有4个共生同源基因的PCR产物克隆入TOPO 
pCR2.1载体(Invitrogen,Carlsbad,CA),并对其通过对共生同源基因特异性扩增产物的测
序加以确证。
[0515] 比较了上述将ZFN递送到下胚轴细胞的三种暂时方法与一种稳定方法以鉴定评价ZFN效力(由存在最多数量的NHEJ确定)的最有效方法。在该研究中使用了在肾293细胞中证
明为有效的共生同源基因D特异性ZFN。预测这些ZFN蛋白质将与两个共生同源基因D的
EPSPS基因特异性短序列结合构成剪切双链DNA的异源二聚核酸酶(图4)。这些ZFN基因存在
于四个构建体中;两个二元构建体,pDAB7147与pDAB7150,其对农杆菌介导转化具有特异
性,而剩下两个构建体,pDAB7151与pDAB7154则供暂时转化(表2)。稳定转化的愈伤组织进
一步归类为“绿色”与“棕色”试样,其中在所 述“棕色”组织中具有较高ZFN表达可能性,从
而具有高频率的NHEJ的机会。后者可能导致细胞毒性而使组织变“棕”。收集了所有的试样
(参见4B部分),包括未处理的对照,将其冻结并冷冻干燥,但原生质体试样除外,其直接用
于DNA分离。基因组DNA通过上述Qiagen方法分离。3μg的所有基因组DNA用5单位MaeIII限制
性内切酶(Roche Applied Science,Indianapolis,IN)依照生产商的推荐消化过夜。
[0516] 所述DNA随即通过下述乙醇沉淀方法提纯,即添加0.1体积3M乙酸钠,pH5.2与2体积100%乙醇继以在微离心管中以10000g离心5分钟。所述DNA随即用70%乙醇洗涤,且在
SPEEDVAC蒸发器(Savant)中将沉淀干燥并将其重悬浮于水中。随即对所述DNA进行第二次
MaeIII消化过夜,并如前所指示用乙醇沉淀。所述限制性酶位点位于两个成对的单体ZFN结
合位置间(图4),且靠近FokI域二聚化处,并在基因组DNA中诱导双链断裂。因此,所述限制
性酶消化富集发生了NHEJ从而导致其丧失限制性酶识别位点的片段。
[0517] 随即使用对共生同源基因D具有特异性且包夹所述ZFN预测剪切位点的寡聚核苷酸引物进行了PCR扩增。将对作为靶的EPSPS共生同源基因D具有特异性的正向PCR引物(5’-
GGTTGTTGAAGGATGCGGT-3’)(SEQ  IDNO:23)与反向PCR引物(5’-
GCAAACAATTCATAGAGTAAATGTG-3’)(SEQID NO:24)组合使用以在下述条件下扩增纯化的基
因组DNA:55μl反应体积包含10μl经Mae III消化的gDNA(26.4ng)模板,1.25μl每种引物(每
种10μM),5μl的10x ACCUPRIME PCR buffer II,5μl的10%PVP-40与1μl(5单位)ACCUPRIME 
TaqDNA多聚酶(Invitrogen,Carlsbad,CA)。自下述扩增循环得到了预期大小的扩增产物:
94℃下2分钟,40周期(94℃下30秒,59.3℃下30秒,68℃下1分钟),68℃下10分钟,并在4℃
下无限期暂停。使用来自Invitrogen(Carlsbad,CA)的TA克隆试剂盒将所得扩增片段直接
克隆入载体pCR2.1。
[0518] 在每个时点每个处理下对大约90个单独克隆片段使用存在于pCR2.1上的M13正向与M13反向启动位点进行测序。在给定处理中包括未处理的对照。大约3000个克隆通过此法
进行了测序。
[0519] 对包括两个相异ZFN处理所得的所有测序结果的分析揭示了13个克隆(经正向与反向测序引物两者确证)正好在pDAB7151中存在的ZFN预期剪切位点处含有少量缺失,表明
所述NHEJ机理在该位点介导对所述DNA序列 的非完美修复(图5)。这些特定克隆得自ZFN转
化3日后的原生质体DNA试样。这些结果说明了所述改造ZFN以特定方式在作物物种中内源
基因基因座处诱导靶向双链断裂的能力。在任何其它ZFN处理方法中使用该类型的测序未
发现NHEJ。
[0520] D.大规模并行测序分析(Massively Parallel Sequencing Analysis)
[0521] 在另一个实施例中,PCR与大规模并行焦磷酸测序(massively parallelpyrosequencing)的组合用于在上述所得试样中调查共生同源基因D。相同组的正
向与反向共生同源基因D特异性引物(SEQ ID NO:23与SEQ ID NO:24)用于扩增代表将ZFN
转化入菜籽下胚轴细胞的3种暂时与一种稳定方法的所有试样DNA。扩增条件如上所述。
[0522] 该初步扩增产物随即使用MINELUTE PCR purification kit(Qiagen,Valencia,CA)纯化,并洗脱出10μl DNA。涉及第二组嵌套引物以扩增适于大规模并行测序的大约
100bp的片段。合成了所述正向引物PCR的六个变体(5’-XXX AGTTGTACCTTGGGAATG-3’)(SEQ 
ID NO:25)其中XXX=GGC,CGC,GGC,CGG,CCG或GCG,以及所述反向PCR引物的六个变体(5’-
XXXATCAATTTCTTGACAATAACA-3’)(SEQ ID NO:26)其中XXX=GGC,CGC,GGC,CGG,CCG或GCG,
并将其用HPLC纯化(IDT,Coralville,IA)。每个引物5’末端的3bp标签用作识别密钥,并表
扩增子源自哪个细胞试样。具有匹配鉴定标签(密钥)(key)的引物对组合用于在下述条
件下扩增源自上述试样的纯化初步PCR扩增子:50μl反应体积包含10μl稀释1∶10的纯化PCR
扩增子,1.25μl每种引物(每种10μM),5μl 10x ACCUPRIME PCR缓冲液I与0.31μl(1.5单位)
在酶生产商提供的缓冲液中的ACCUPRIME TaqDNA高保真度多聚酶(Invitrogen,Carlsbad,
CA)。预期大小的扩增产物得自下述扩增循环:94℃下2分钟,30周期(94℃下30秒,62℃下30
秒,68℃下30秒),68℃下5分钟,以及4℃下无限期暂停,并使用MINELUTE  PCR 
purification kit(Qiagen,Valencia,CA)根据生产商的推荐方法对其进行纯化。
[0523] 大规模并行焦磷酸测序反应(亦称为454测序)如(Margulies et al.(2005)Nature 437:376-380)所述直接对PCR产物实施。454测序结构的分析通过鉴定出在所述DNA
分子中含有预期大小与位置的缺失的序列表示来进行。这些分析的结果表明多个9-12bp的
小缺失存在于这些ZFN的预期剪切位点,如图6 所示。四十八个缺失中的四十六个见于得自
经ZFN构建体pDAB8147稳定转化的绿色愈伤组织的序列表示(表3)。获得了使用相同ZFN对
的两个其它缺失,一个来自经暂时转化处理的原生质体DNA(pDAB7151)而另一个来自经农
杆菌(pDAB7147)暂时转化处理的下胚轴组织。这些缺失恰好位于ZFN靶位点处,且表明产生
了ZFN诱导的ds断裂,其随后由NHEJ机理所修复。
[0524] 因为通过用于本实施例的PCR分析无法分辨共生同源基因序列D与E,所述共生同源基因两者其一或均由所述ZFN剪切都是可能的。这些结果进一步说明了所述改造ZFN以特
定方式在作物物种内的内源基因基因座处诱导靶向双链断裂的能力。其进一步证明在现行
实验条件下,ZFN稳定转化的方法为供筛选NHEJ最有效的方法。存在于构建体pDAB7150与
pDAB7154中的ZFN在经不同转化方法处理的多种方法中并不显示任何缺失(参见表4)。
[0525] 表4.大规模并行测序的结果,显示在得自用ZFN pDAB7147与pDAB7151暂时与稳定转化的欧洲油菜下胚轴节片(片段)的EPSPS共生同源基因D目标序列中的NHEJ。所述对照试
样由未经ZFN处理的组织组成。
[0526]  S.N.   试样   ZFN构建体  #   试样#-引物   分析的序列   #of  NHEJ
  1   对照   pDAB7147+  pDAB7151   1-正向   18,215   0
  2   对照   pDAB7147+  pDAB7151   1-反向   18,922   0
  3   原生质体   pDAB7151   2-正向   45,896   0
  4   原生质体   pDAB7151   2-反向   48,606   1
  5   触须   pDAB7151   3-正向   19,601   0
  6   触须   pDAB7151   3-反向   19,628   0
  7   暂时农杆菌   pDAB7147   4-正向   31,281   1
  8   暂时农杆菌   pDAB7147   4-反向   31,595   0
  9   稳定农杆菌  -G   pDAB7147   5-正向   13,795   29
  10   稳定农杆菌  -G   pDAB7147   5-反向   13,221   17
[0527]  11   稳定农杆菌  -B   pDAB7147   6-正向   8,167   0
  12   稳定农杆菌  -13   pDAB7147   6-反向   7,549   0
    总计       276,476   48
[0528] 为努力在其它EPSPS共生同源基因中分析ZFN诱导双链断裂,实施PCR与大规模并行焦磷酸测序的组合以调查剩余EPSPS共生同源基因DNA中的ZFN诱导双链断裂。使用了来
自如部分4D-E所述的经含pDAB7147与pDAB7150的农杆菌菌株稳定转化的同一“绿色”愈伤
组织的经MaeIIII消化的基因组DNA。PCR扩增随即使用对EPSPS共生同源基因A,B,C与D有特
异性,锚于基因组DNA上所述ZFN预期剪切位点两侧的寡聚核苷酸引物进行。将针对共生同
源基因A的正向PCR引物(5’-TCCCAGCTTCTTTAGATTCTAAGG-3’)(SEQ ID NO:17)与反向PCR引
物(5’-CTGCAACTTTTCACATAGCAA-3’)(SEQ ID NO:18),针对共生同源基因B的正向PCR引物
(5’-CAAGAGTGATATCGAGTTGTACCTTGGGAATGCT-3’)(SEQ ID NO:19)与反向PCR引物(5’-
AGGCCATCATATCGAGCAAACGCAGT-3’)(SEQ ID NO:20),针对共生同源基因C的正向PCR引物
(5’-GGGTAAACAACCGTGCTGTA-3’)(SEQ  IDNO:21)与反向PCR引物(5’-
AAAGACTGCTGCAAACAAGATC-3’)(SEQ IDNO:22)以及如部分4D-E所述同样组的正向与反向引
物(SEQ ID NO:23与SEQID NO:24),组合用于针对每个共生同源基因分别扩增基因组DNA:
50μl反应体积含有200ng经Mae III消化的gDNA模板(10μl),1.25μl每种引物(每种10μM),5
μl的10x Accuprime PCR buffer II,5μl的10%PVP-40以及0.3μl(1.5单位)在酶生产商提
供的缓冲液中的ACCUPRIME TaqDNA高保真度多聚酶(Invitrogen,Carlsbad,CA)。扩增产物
由下述扩增循环产生:94℃下2分钟,25周期(94℃下30秒,退火30秒,68℃下1分钟),68℃下
5分钟,在4℃下无限期暂停。下列共生同源基因的退火温度如下所述:A=62.1℃B=65℃,C
=65℃而D=59.3℃。
[0529] 该初步扩增产物随即使用Qiagen MinElute PCR Purification Kit(Qiagen,Valencia,CA)纯化并以10μl EB缓冲液洗脱。合成并用HPLC(IDT,Coralville, IA)纯化了
共生同源基因A正向PCR引物的三个变体(5’-XXXATCGAGTTGTACCTTGGGAATG-3’)(SEQ ID 
NO:27),其中XXX=GGC,CGG或GCC以及其反向PCR引物的三个变体(5’-
XXXAATAAGTCCTTAACCTTACCTT-3’)(SEQ ID NO:28),其中XXX=GGC,CGG或GCC。合成并用
HPLC(IDT,Coralville,IA)纯化了共生同源基因B正向PCR引物的三个变体(5’-XXX 
AGAGTGATATCGAGTTGTACCTTG-3’)(SEQ IDNO:29),其中XXX=CGG,CGC或GCC以及其反向PCR
引物的三个变体(5’-XXX ACACTCCTTAACCTTACCTT-3’)(SEQ ID NO:30),其中XXX=CGG,CGC
或GCC。合成并用HPLC(IDT,Coralville,IA)纯化了共生同源基因C正向PCR引物的三个变体
(5’-XXXAGAGTGATATTGAGTTGTACCTTG-3’)(SEQ ID NO:31),其中XXX=CGG,GGC或GCC以及其
反向PCR引物的三个变体(5’-XXXAAAGCTCCTTAACCTTTACCT-3’)(SEQ ID NO:32),其中XXX=
CGG,GGC或GCC。对共生同源基因D进行二次PCR扩增的引物(SEQ ID NO:25与SEQID NO:26)
描述于部分4D。每个引物5’末端的3bp标签用作识别密钥并表明该扩增子来自哪个欧洲油
菜试样。将具有匹配识别标签(密钥)的引物对组合用于扩增纯化的下述初步PCR扩增子,即
所述扩增子以下述条件源自上述试样:50μl反应体积含有10μl以1∶10稀释的纯化PCR扩增
子,1.25μl每种引物(每种10μM),5μl 10x Accuprime PCR缓冲液I以及0.3μl(1.5单位)在
酶生产商提供的缓冲液中Accuprime TaqDNA高保真度聚合酶(Invitrogen,Carlsbad,CA)。
预期大小的扩增产物得自下述扩增循环:94℃下2分钟,33周期(94℃下30秒,62℃下30秒,
68℃下30秒),68℃下5分钟并在4℃下无限期暂停,并使用Qiagen(Valencia,CA)的
MinElute PCR purification kit根据生产商的推荐方法纯化。
[0530] 直接对PCR产物如部分4D所述进行大规模并行焦磷酸测序反应。所述测序结果的分析通过鉴定出在所述DNA分子中含有预期大小与位置的缺失的序列表示来进行。
[0531] 这些分析的结果表明在共生同源基因C与D中在预期的ZFN剪切位点处存在多个小尺度缺失(图7)。pDAB7147 ZFN再一次对剪切两个共生同源基因,C与D(以及E),为有效的。
这些5-32bp的剪切精确位于ZFN的靶位点,并说明了pDAB7147 ZFN剪切2个或更多EPSPS共
生同源基因。这些 结果进一步说明了这些改造ZFN以特定方式在作物物种中在同源基因基
因座处诱导靶向双链断裂的能力。
[0532] 在经pDAB7147与pDAB7150处理的试样5,6与9的共生同源基因A与B中亦各发现了一个NHEJ。这些NHEJ见于预期的位置。然而,因为一些对照试样亦含有一个NHEJ(表5中的试
样2,7与13),所述ZFN无法视为有效剪切这些共生同源基因。
[0533] 表5.大规模并行测序的结果,显示下述的DNA分子,即其发生了ZFN介导双链断裂,继以在欧洲油菜的四个EPSPS共生同源基因中的靶序列上发生了NHEJ修复。所述对照试样
代表未经ZFN处理的转基因愈伤组织。
[0534]  试样号   靶共生同     ZFN构建体   引物   比对的  序列   总  NHEJ
源基因 数
  1   A   对照   正向   18,451   0
  2   A   对照   反向   19,005   1
  3   A   pDAB7150   正向   14,711   0
  4   A   pDAB7150   反向   15,616   0
  5   A   pDAB7147   正向   21,478   1
  6   A   pDAB7147   反向   22,459   1
  7   B   对照   正向   12,682   1
  8   B   对照   反向   18,033   0
  9   B   pDAB7150   正向   11,361   1
  10   B   pDAB7150   反向   13,017   0
  11   B   pDAB7147   正向   16,565   0
  12   B   pDAB7147   反向   17,499   0
  13   C   对照   正向   20,516   1
  14   C   对照   反向   14,790   0
  15   C   pDAB7150   正向   9,073   0
  16   C   pDAB7150   反向   9,096   1
  17   C   pDAB7147   正向   12,696   3
  18   C   pDAB7147   反向   14,719   19
[0535]  23   D   pDAB7147   正向   7,028   5
  24   D   pDAB7147   反向   6,832   9
[0536] 实施例5:第二个ZFN在欧洲油菜中剪切所述五个共生同源基因中剩下的两个
[0537] 接下来,着眼于在剩下两个共生同源基因A与B中诱导双链断裂,尝试了ZFN介导双链断裂。使用了两个新的改造ZFN,其以位于距第一个ZFN结合位置5’约350bp的不同序列为
靶(图4)。这些特定ZFN构建体,pDAB7185与pDAB7186(表3),用于欧洲油菜下胚轴节片的稳
定转化,如实施例4,部分B所述。根据之前实施例4,部分C所述将用ZFN稳定转化的愈伤组织
冻结,冷冻干燥并提取DNA。随即使用或者BsoB1(New England Biolabs,Ipswich,MA)或者
Lwe I(Fermentas,Inc.,Hanover,MD)消化DNA以富集发生了NHEJ的片段(图4)。所述消化根
据生产商的指示实施过夜并如前所述通过乙醇沉淀纯化。随即使用对靶基因具有特异性,
且包夹所述ZFN预期剪切位点的引物进行PCR扩增。共生同源基因A的正向PCR引物(5’-
CAGCGTGGAGCTTATCAGA-3’)(SEQ ID NO:33)与反向PCR引物(5’-AAACGCAACACTAAGCAAAC-
3’)(SEQ ID NO:35),共生同源基因B的正向PCR引物(5’-GAAGAGTAACAACGGCTCTGTG-3’)
(SEQ ID NO:34)与反向PCR引物(5’-GAAAGAAAGAAGCAAACCGAC-3’)(SEQ ID NO:90),其对相
应靶共生同源基因具有特异性,组合用于在下述条件下扩增纯化基因组DNA。
[0538] 对共生同源基因A,50μl反应体积包含420-700ng BsoBI消化的基因组DNA模板(10μl),1.25ul每种引物(每种10μM),5μl的10x Accuprime PCR缓冲液II,5μl的10%PVP-40与
0.3μl(1.5单位)在酶生产商提供的缓冲液中的Accuprime TaqDNA高保真度多聚酶
(Invitrogen,Carlsbad,CA)。扩增产物由下述扩增循环产生:94℃下2分钟,28周期(94℃下
30秒,60℃下30秒,68℃下1分钟),68℃下5分钟,4℃下无限期暂停。对共生同源基因B,50μl
反应体积包含420-700ng BsoBI消化的基因组DNA模板(10μl),1.25ul每种引物(每种10μ
M),5μl的10x Accuprime PCR缓冲液II,5μl的10%PVP-40与0.3μl(1.5单位)在酶生产商提
供的缓冲液中的Accuprime TaqDNA高保真度多聚酶(Invitrogen,Carlsbad,CA)。扩增产物
由下述扩增循环产生:94℃下2分 钟,28周期(94℃下30秒,58℃下30秒,68℃下1分钟),68
℃下5分钟,4℃下无限期暂停。该初步扩增产物随即使用MINELUTE PCR purification kit
(Qiagen,Valencia,CA)分离并以10μl EB缓冲液洗脱。合成并用HPLC(IDT,Coralville,IA)
纯化了共生同源基因A正向PCR引物的三个变体(5’-XXXTCTGTTTCCACGGCGGAG-3’)(SEQ ID 
NO:36),其中XXX=CCG,GCG或CGC以及其反向PCR引物的三个变体((5’-
XXXAAGCGGCAAGAAGAAGAATC-3’)(SEQ ID NO:37),其中XXX=CCG,GCG或CGC。合成并用HPLC
(IDT,Coralville,IA)纯化了共生同源基因B正向PCR引物的三个变体(5’-XXX 
TCTGTTTCCACGGCTGAG-3’)(SEQ ID NO:38),其中XXX=GGC,GCC或CGG以及其反向PCR引物的
三个变体(5’-XXXATTGGACAGAGATTTGGGTC-3’)(SEQ ID NO:39),其中XXX=GGC,GCC或CGG。
每个引物5’末端的3bp标签用作识别密钥并表明该扩增子来自哪个欧洲油菜试样。将具有
匹配识别标签(密钥)的引物对组合用于扩增纯化的下述初步PCR扩增子,即所述扩增子以
下述条件源自上述试样:50μl反应体积含有10μl以1∶10稀释的纯化PCR扩增子,1.25μl每种
引物(每种10μM),5μl10x ACCUPPRIME PCR缓冲液I以及0.3μl(1.5单位)在酶生产商提供的
缓冲液中ACCUPRIME TaqDNA高保真度聚合酶(Invitrogen,Carlsbad,CA)。
[0539] 预期大小的扩增产物得自下述扩增循环:94℃下2分钟,25周期(94℃下30秒,退火30秒,68℃下30秒),68℃下5分钟并在4℃下无限期暂停,并使用Qiagen(Valencia,CA)的
MINELUTE PCR purification kit根据生产商的推荐方法纯化。上面所列第二次PCR反应的
退火温度如下所述:对共生同源基因A,66℃,而对共生同源基因B,64℃。
[0540] 直接对PCR产物进行大规模并行焦磷酸测序反应。所述测序结果的分析通过鉴定出在所述DNA分子中含有预期大小与位置的缺失的序列表示来进行。
[0541] 这些分析的结果表明在预期剪切位点处存在多个小尺度缺失(图8,表6)。同样,这些缺失精确位于所述ZFN靶位点,并表明由ZFN诱导的双链断裂产生于基因组中,并随后由
NHEJ修复。克隆于pDAB7185的ZFN总体上较之ZFN pDAB7186对引起双链断裂为更加有效。
[0542] 这些结果进一步说明了这些改造ZFN以特定方式在作物物种中同源基因基因座处诱导靶向双链断裂的能力。该结果亦说明了同样的ZFN剪切两个 EPSPS共生同源基因,A与B
的能力。
[0543] 表6.大规模并行测序的结果,显示下述的DNA分子,即其发生了ZFN介导双链断裂,继以在欧洲油菜的两个EPSPS共生同源基因,A与B中的靶序列上发生了NHEJ修复。所述对照
试样代表未经ZFN处理的转基因愈伤组织。
[0544]  S.N.   靶共生同  源基因   ZFN构建体   引物   比对的序  列数   总  NHEJ
  1   A   对照   正向   12903   0
  2   A   对照   反向   12027   0
  3   A   pDAB7185   正向   10432   9
  4   A   pDAB7185   反向   9883   3
  5   A   pDAB7186   正向   20,496   2
  6   A   pDAB7186   反向   18697   3
  7   B   对照   正向   20655   0
  8   B   对照   反向   22733   0
  9   B   pDAB7185   正向   15663   32
  10   B   pDAB7185   反向   15864   26
  11   B   pDAB7186   正向   21333   4
  12   B   pDAB7186   反向   24003   12
[0545] 实施例6:可剪切所有EPSPS共生同源基因的两个ZFN
[0546] 在另一个实施例中,用两个ZFN共转化欧洲油菜下胚轴节片,并建立了含有所述ZFN两者的稳定转基因事件,其在所有EPSPS共生同源基因中表明了NHEJ。在该实验中用于
共转化ZFN构建体为pDAB7147与pDAB7185(表3)。如实施例4与5所述产生了稳定转基因愈伤
组织事件,分离并分析了DNA。同源,由于序列相似性,难以分辨共生同源基因D与E中的
NHEJ。所有的NHEJ位于所述多种共生同源基因的预期靶位点上。
[0547] 这些结构确证了下述两点:1.可针对多基因家族的相异序列设计ZFN以 特异性的剪切1-2个基因/共生同源基因。2.若需要,可使用多个ZFN以同时剪切所有的共生同源基
因。
[0548] 其它与靶向剪切,靶向重组与靶向整合的信息可参见United  States PatentApplication publications US-2003-0232410;US-2005-0026157;US-2005-
0064474;US-2005-0208489与US-2007-0134796,其公开以全文引用的方式包含于本文中以
供所有目的。
[0549] 所有本文提及的专利,专利申请与出版物均以全文引用的方式包含于本文中,以供所有目的。
[0550] 尽管本公开以部分详述的方式通过说明与举例的方法提供以供清楚理解,对本领域技术人员显而易见可对其实施多种变化与修饰而不偏离本公开的精神与范围。相应的,
前述描述与实施例不应理解为构成限定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈