首页 / 专利库 / 作物管理 / 非生物胁迫 / 用于基因组工程的与核酸内切酶相连的修复模板

用于基因组工程的与核酸内切酶相连的修复模板

阅读:673发布:2020-05-14

专利汇可以提供用于基因组工程的与核酸内切酶相连的修复模板专利检索,专利查询,专利分析的服务。并且本 发明 涉及人工分子复合物,其包含至少一个位点特异性核酸酶以及与其直接相互作用的至少一个修复模板对接结构域,所述修复模板对接结构域与至少一个修复模板核酸序列相互作用。人工复合物可进一步包含至少一个相互作用结构域。人工分子复合物被配置为以靶向的方式高 精度 地介导原核或真核或病毒 生物 或基因组中DNA靶序列的修复,并因此可用于原核或真核细胞或生物体的基因组工程或在体内或体外用于原核、真核或病毒基因组中的基因组工程。还提供了例如用于性状开发或用于 治疗 疾病 的修饰原核或真核细胞或病毒基因组中的至少一个DNA靶序列的方法。另外,提供了制备包含至少一个人工分子复合物或由至少一个人工分子复合物编辑的 植物 、植物细胞、植物材料或衍生物或其后代的方法。,下面是用于基因组工程的与核酸内切酶相连的修复模板专利的具体信息内容。

1.一种人工分子复合物,包括
(a)至少一个位点特异性核酸酶(SSN)或其催化活性片段,或编码其的核酸序列,并且直接与(b)相互作用
(b)至少一个修复模板对接结构域(RTDD)或编码其的核酸序列,其中所述修复模板对接结构域被配置为直接与至少一个修复模板核酸序列(RT)相互作用;
(c)任选地包含至少一个相互作用结构域(IA)或编码其的核酸序列,其中所述至少一个相互作用结构域与所述至少一个位点特异性核酸酶或其催化活性片段直接相互作用,并且其中所述至少一个相互作用结构域被配置为提供选自由以下组成的组的至少一种功能:
(i)与所述至少一个修复模板对接结合域相互作用;和/或
(ii)与所述至少一个修复模板核酸序列相互作用;和/或
(iii)与基因组DNA序列特异性相互作用;
其中所述至少一个修复模板核酸序列包含至少一个与至少一个基因组互补序列互补的部分,并且其中所述至少一个修复模板核酸序列配置成介导DNA靶序列的修复。
2.根据权利要求1的人工分子复合物,其中所述位点特异性核酸酶或编码其的核酸序列选自以下至少一种:CRISPR核酸酶,包括Cas或Cpf1核酸酶;TALEN;ZFN;大范围核酸酶;限制性核酸内切酶,包括FokI或其变体;或两种位点特异性切口核酸内切酶;或其变体或催化活性片段。
3.根据权利要求1或2中任一项的人工分子复合物,其中所述至少一个修复模板对接结构域或编码其的核酸序列选自以下至少一个:生物素;适体;DNA、RNA或蛋白质染料,包括荧光团,包含荧光素,或其变体,来酰亚胺或四氮唑(XTT);特异性配置为与至少一个修复模板核酸序列相互作用的向导核酸序列;链霉抗生物素蛋白或其变体,优选单体抗生物素蛋白;抗生物素蛋白或其变体;亲和标签,优选链霉抗生物素蛋白标签;抗体;单链可变片段(scFv);单域抗体(纳米抗体);抗运载蛋白;农杆菌VirD2蛋白或其结构域;小核糖核酸病毒VPg;拓扑异构酶或其结构域;PhiX174噬菌体A蛋白;PhiX A*蛋白;VirE2蛋白或其结构域;
或地高辛。
4.根据前述权利要求中任一项的人工分子复合物,其中所述至少一个相互作用结构域或编码其的核酸序列选自以下至少一种:DNA结合结构域;链霉抗生物素蛋白或其变体,优选单体链霉抗生物素蛋白;抗生物素蛋白或其变体;亲和标签;生物素化信号;生物素受体位点;链霉抗生物素蛋白标签;抗体;单链可变片段(scFv);单结构域抗体(纳米抗体);抗运载蛋白;生物素;适体;DNA、RNA或蛋白质染料,包括荧光团,包含荧光素,或其变体,马来酰亚胺或四氮唑(XTT));特异性配置为与所述至少一个修复模板核酸序列相互作用的向导核酸序列;农杆菌VirD2蛋白或其结构域;小核糖核酸病毒VPg;拓扑异构酶或其结构域;
PhiX174噬菌体A蛋白;PhiX A*蛋白;VirE2蛋白或其结构域;或地高辛。
5.根据前述权利要求中任一项的人工分子复合物,其中所述至少一个位点特异性核酸酶和/或所述至少一个修复模板核酸序列和/或所述至少一个相互作用结构域包含至少一个核定位序列、质体定位序列,优选线粒体定位序列或叶绿体定位序列。
6.根据前述权利要求中任一项的人工分子复合物,其中所述至少一个修复模板核酸序列包含至少一个末端部分,优选3'末端,其中该末端部分不与所述人工分子复合物的任何其他组分相互作用,并因此配置成与至少一个基因组互补序列杂交以介导所述DNA靶序列的修复,和/或其中所述至少一个修复模板核酸序列作为质粒提供。
7.根据前述权利要求中任一项的人工分子复合物,其中所述至少一个位点特异性核酸酶或其催化活性片段或编码其的序列选自CRISPR核酸酶,优选选自Cas或Cpf1核酸酶,或FokI核酸酶,或其催化片段,且所述至少一个相互作用结构域或编码其的序列选自单链可变片段或单体链霉抗生物素蛋白。
8.根据前述权利要求中任一项的人工分子复合物,其中所述复合物包含至少一个代表所述至少一个修复模板对接结构域的向导核酸序列,其中所述至少一个向导核酸序列中的每一个包含
(i)第一序列部分,其与识别DNA靶序列互补,和
(ii)第二序列部分,其中所述第二序列部分被配置为与所述至少一个位点特异性核酸酶相互作用,和
(iii)其中所述至少一个向导核酸序列与所述至少一个修复模板核酸序列物理缔合,并因此形成包含至少一个RNA或DNA和至少一个其他DNA核酸序列的杂交核酸序列或由至少一个RNA或DNA和至少一个其他DNA核酸序列组成的杂交核酸序列,和
(iv)任选地包含在所述至少一个向导核酸序列和所述至少一个修复模板核酸序列之间的接头区域,
优选其中所述修复模板核酸序列在所述向导核酸序列的3'末端与所述向导核酸序列缔合,和/或其中所述修复模板核酸序列与所述向导核酸序列的5'末端缔合,和/或其中所述修复模板核酸序列位于所述向导核酸序列内。
9.根据前述权利要求中任一项的人工分子复合物,其中所述至少一个修复模板核酸序列和/或所述至少一个向导核酸序列包括核苷酸序列,所述核苷酸序列选自天然或非天然存在核苷酸序列,包含合成核苷酸序列,任选地包括主链和/或基修饰,其中所述向导核酸序列包括单链或部分单链的RNA或DNA核苷酸序列,且其中所述至少一个修复模板核酸序列包括单链或双链DNA核苷酸序列。
10.根据前述权利要求中任一项的人工分子复合物,其中所述至少一个位点特异性核酸酶或编码其的序列,和所述至少一个相互作用结构域或编码其的序列,和/或所述至少一个修复模板对接结构域或编码其的序列通过至少一个接头结构域连接。
11.根据前述权利要求中任一项的人工分子复合物,所述至少一个位点特异性核酸酶或其催化活性片段或编码其的序列独立地选自由以下组成的组:来自以下的Cas多肽:链球菌属(Streptococcus spp.)包括化脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus),金黄色葡萄球菌(Staphylococcus aureus),或奈瑟菌属(Neisseria spp.)包括脑膜炎奈瑟菌(Neisseriameningitides),棒杆菌(Corynebacter),萨特氏菌(Sutterella),军团菌(Legionella),密螺旋体(Treponema),产线菌(Filifactor),真细菌(Eubacterium),乳酸菌(Lactobacillus),支原体(Mycoplasma),拟杆菌(Bacteroides),Flaviivola,黄杆菌(Flavobacterium),Sphaerochaeta,固氮螺菌(Azospirillum),葡糖醋杆菌(Gluconacetobacter),罗氏菌(Roseburia),细小棒菌(Parvibaculum),硝酸盐裂解菌(Nitratifractor),支原体和弯曲杆菌(Campylobacter),Candidatus Micrarchaeum acidiphilum ARMAN-1,俭菌总细菌(Parcubacteria)(GenBank:APG80656.1),硫化叶菌属(Sulfolobus spp.),包括岛硫化叶菌(Sulfolobus islandicus)HVE10/4(GenBank:ADX81770.1)或REY15A(GenBank:ADX84852.1);来自古细菌或细菌的Cpf1多肽,包括来自以下的Cpf1多肽:基酸球菌属(Acidaminococcus spp.)包括氨基酸球菌属BV3L6,毛螺菌(Lachnospiraceae spp.)包括毛螺菌ND2006、毛螺菌MC2017、毛螺菌MA2020,瘤胃纤维丁酸弧菌(Butyrivibrio proteoclasticus),Candidatus spp.,Methanoplasma termitum,稻田钩端螺旋体(Leptospira inadai),眼莫拉菌(Moraxella bovoculi)237,异域菌门细菌(Peregrinibacteria bacterium)GW201 
1_GWA2_33_10,俭菌总门细菌(Parcubacteria bacterium)GW201 1_GWC2_44_17,史密斯氏菌属(Smithella sp.)SCADC,史密斯氏菌属SC_K08D17,弗朗西斯氏菌(Francisella spp.)包括新凶手弗朗西丝氏菌(Francisella novicida)U112,挑剔真杆菌(Eubacterium eligens),普氏菌(Prevotella spp.)或卟啉单胞菌(Porphyromonas spp.);或来自以下的Argonaute核酸酶:格氏黄杆菌(GenBank:AFZ73749.1),绿微囊藻(Microcystis aeruginosa)(NCBI参考序列:WP_012265209.1或NCBI参考序列:WP_002747795.1或NCBI参考序列:WP_012265209.1),Halogeometricum pallidum(GenBank:ELZ29017.1),Natrialaba asiatica(NCBI参考序列:WP_0061 1 1085.1),冷盐碱红菌(Natronorubrum tibetense)(NCBI参考序列:WP_006090832.1),隐红碱线菌(Natrinema pellirubrum)(NCBI参考序列:WP_006183335.1),或胶州湾聚球菌(Synechococcus spp.)(NCBI参考序列:WP_011378069.1);或它们的变体和/或功能片段和/或组合,包括切口酶或缺乏内切核苷酸活性的核酸酶。
12.根据前述权利要求中任一项的人工分子复合物,其用于治疗疾病的方法,其中所述疾病的特征在于至少一个基因组突变并且所述工分子复合物被配置为靶向并修复所述至少一个基因组突变。
13.一种使用根据前述权利要求中任一项的人工分子复合物治疗疾病的方法,其中所述疾病的特征在于至少一个基因组突变,并且所述人工分子复合物被配置为靶向并修复所述至少一个基因组突变。
14.植物、植物细胞、植物材料、或其衍生物或后代,其包含至少一个根据权利要求1-11中任一项的人工分子复合物或由至少一个根据权利要求1-11中任一项的人工分子复合物编辑。
15.一种修饰至少一个DNA靶序列的方法,包括以下步骤:
(i)提供至少一个原核、真核或病毒细胞和/或基因组,所述细胞和/或基因组包含在感兴趣的基因组区域中的至少一个基因组互补序列和至少一个DNA靶序列;
(ii)提供至少一个如权利要求1至11中任一项所定义的人工分子复合物;
(iii)在合适的条件下使所述至少一个人工分子复合物与所述至少一个DNA靶序列接触,以实现
(a)所述至少一个位点特异性核酸酶与所述至少一个DNA靶序列的相互作用;
(b)所述至少一个修复模板核酸序列与所述至少一个基因组互补序列的互补碱基配对,以实现所述至少一个互补序列的识别和由所述至少一个位点特异性核酸酶诱导的至少一个DNA断裂,其中所述至少一个修复模板核酸序列指导在所述至少一个DNA靶序列的位点的同源定向修复;以及
(iv)获得至少一个原核、真核或病毒细胞和/或基因组,所述细胞和/或基因组包含所述至少一个DNA靶序列中的修饰。
16.根据权利要求15的方法,其中所述人工分子复合物的所述至少一个修复模板核酸序列和/或所述至少一个修复模板对接结构域独立于所述至少一个分子复合物的所述至少一个位点特异性核酸酶而被提供至所述至少一个原核、真核或病毒细胞,并且所述至少一个人工分子复合物在所述至少一个原核或真核或病毒细胞和/或基因组内被组装或部分组装。
17.根据权利要求15的方法,其中所述至少一个人工分子复合物是离体组装的人工分子复合物。
18.根据权利要求15-17中任一项的方法,其中所述至少一个真核细胞是植物细胞,优选来自选自由以下组成的组的植物的植物细胞:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉蜀黍属(Zea spp.)包括玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜属(Beta spp.)包括甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana  benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、黄花螺旋狸藻(Genlisea aurea)、黄瓜(Cucumis sativus)、川桑(Marus notabilis)、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine nexuosa)、北美独行菜(Lepidium virginicum)、荠菜花(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.Sativa)、甜橙(Citrus sinensis)、麻树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、属(Gossypium sp.)、紫英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭(Allium tuberosum),或属于上述植物之一的任何变种或亚种。
19.根据权利要求18的方法,其中所述至少一个DNA靶序列的修饰引起选自由以下组成的组的性状编辑:产量提高;耐受非生物胁迫,包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、化胁迫、重金属胁迫、盐胁迫或水浸;耐受生物胁迫,包括虫耐受性、细菌耐受性、病毒耐受性、真菌耐受性或线虫耐受性;抗除草剂,包括草甘膦、草铵膦、ALS抑制剂和麦草畏;抗倒伏性;花期;抗落粒;种子颜色;胚乳组成;营养成分;或是代谢工程,包括基因组编辑以允许在至少一个植物细胞中的分子产药方法。
20.根据权利要求15至19中任一项的方法,还包括以下步骤:
(v)鉴定和/或选择至少一个原核、真核或病毒细胞和/或基因组,所述细胞和/或基因组包含所述至少一个DNA靶序列中的所述修饰。
21.一种用于制备植物或植物细胞的方法,包括以下步骤:
(i)执行根据权利要求15-20中任一项的方法,其中所述至少一个真核细胞是植物细胞;
(ii)从步骤(i)的至少一个植物细胞获得至少一个植物或其后代;
(iii)任选地:确定在所述至少一个植物或其后代的至少一个细胞中在所述至少一个DNA靶序列中的所述修饰。
22.根据权利要求21的方法,其中所述至少一个植物或植物细胞选自单子叶植物或双子叶植物,优选地其中所述植物选自由以下组成的组:玉蜀黍属包括玉米,本氏烟草,或甜菜属包括甜菜,或黑麦属(Secale ssp.)包括黑麦或小麦属(Triticum ssp.)包括普通小麦。
23.至少一个根据权利要求1至11中任一项的人工分子复合物在原核、真核或病毒细胞和/或基因组或生物体中,优选在植物细胞或生物体中的基因组工程的用途。

说明书全文

用于基因组工程的与核酸内切酶相连的修复模板

技术领域

[0001] 本发明涉及人工分子复合物,其包含至少一个位点特异性核酸酶以及与其直接相互作用的至少一个修复模板对接结构域,所述修复模板对接结构域与至少一个修复模板核酸序列相互作用。人工复合物可进一步包含至少一个相互作用结构域。人工分子复合物被配置为以靶向的方式高精度地介导原核或真核或病毒生物或基因组中DNA靶序列的修复,并因此可用于原核或真核细胞或生物体的基因组工程或在体内或体外用于原核、真核或病毒基因组中的基因组工程。还提供了例如用于性状开发或用于治疗疾病的修饰原核或真核细胞或病毒基因组中的至少一个DNA靶序列的方法。另外,提供了制备包含至少一个人工分子复合物或由至少一个人工分子复合物编辑的植物、植物细胞、植物材料或衍生物或其后代的方法。这里因此提供了适用于任何位点特异性核酸酶的人工分子复合物,所述人工分子复合物指导修复模板与待修饰的DNA靶序列紧密物理接近以允许在诱导的DNA双链断裂的位点处现成可用的原位修复模板以保证各种基因组工程方法的高效率和可预测性。
[0002] 发明背景
[0003] 精准的基因编辑或基因组工程已经发展成为遗传工程最重要的领域之一,可以对目标基因组进行靶向和定点操纵。定点基因组工程的一个必不可少的先决条件是可编程的核酸酶,它可以用来在指定位置断裂感兴趣的核酸以诱导双链断裂(DSB)或一个或多个单链断裂。或者,所述核酸酶可以是嵌合或突变的变体,不再包含核酸酶功能,而是作为识别分子与另一种酶组合。因此那些核酸酶或其变体对于任何基因编辑或基因组工程方法都是关键的。近年来,已经开发了许多合适的核酸酶,特别是定制的核酸内切酶,包括大范围核酸酶,锌指核酸酶,TALE核酸酶,衍生自例如格氏黄杆菌(Natronobacterium gregoryi)的Argonaute核酸酶和作为成簇的规律间隔短回文重复 (CRISPR)系统的一部分的CRISPR核酸酶,包括例如Cas,Cpf1,CasX或CasY核酸酶。
[0004] 在其自然环境中的CRISPRs(成簇的规律间隔短回文重复)最初在细菌中进化,其中 CRISPR系统履行适应性免疫系统的作用以防御病毒攻击。暴露于病毒后,病毒DNA 的短片段被整合到CRISPR基因座中。从包含病毒序列的CRISPR基因座的一部分转录出RNA。该RNA含有与病毒基因组互补的序列,介导CRISPR效应蛋白靶向病毒基因组中的靶序列。
CRISPR效应蛋白切割并从而干扰病毒靶的复制。在过去的几年中, CRISPR系统也已经成功地用于真核细胞中的基因编辑或基因组工程。目前,动物细胞的编辑和人类的治疗应用是重要的研究重点。对复杂动物和植物基因组进行靶向修饰仍然是一项艰巨的任务。
[0005] 在其天然环境中的CRISPR系统描述了分子复合物,其包含至少一个小的和单独的非编码RNA,其与Cas核酸酶或另一种CRISPR核酸酶如Cpf1核酸酶组合(Zetsche et al., "Cpf1 Is a Single RNA-Guides Endonuclease of a Class 2CRISPR-Cas System",Cell,163, pp.1-13,October 2015),其可以产生特定的DNA双链断裂。目前,CRISPR系统分为两类,包括五种类型CRISPR系统,II型系统,例如使用Cas9作为效应物,和V型系统,其使用Cpf1作为效应分子(Makarova等,Nature Rev.Microbial.,2015年)。在人工 CRISPR系统中,合成的非编码RNA和CRISPR核酸酶和/或任选地修饰的CRISPR核酸酶(修饰用作切口酶或缺乏任何核酸酶功能)可以与至少一个合成的或人工向导RNA 或组合crRNA和/或
tracrRNA功能的gRNA组合使用(Makarova等,2015,同上)。由 CRISPR/Cas在天然系统中介导的免疫应答需要CRISPR-RNA(crRNA),其中控制 CRISPR核酸酶的特异性激活的该向导
RNA的成熟在至今已表征的各种CRISPR系统之间显著不同。首先,入侵DNA,也称为间隔区,整合在CRISPR基因座近端的两个相邻重复区域之间。II型CRISPR系统编码Cas9核酸酶作为干扰步骤的关键酶,该系统包含crRNA以及反式激活RNA(tracrRNA)作为向导基序。这些杂交并形成被RNAseIII 识别的双链(ds)RNA区域并且可被切割以形成成熟crRNA。这些然后又与Cas分子缔合以便将核酸酶特异性向导至靶核酸区域。重组gRNA分子可以包含可变的DNA识别区域和Cas相互作用区域两者,并且可以独立于特定靶核酸和期望的Cas核酸酶而被特别设计。作为进一步的安全机制,PAM(前间隔区邻近基序)必须存在于靶核酸区域;这些是直接来自Cas9/RNA复合物识别的DNA的DNA序列。已经描述了来自化脓链球菌 
(Streptococcus pyogenes)的Cas9的PAM序列是“NGG”或“NAG”(标准IUPAC核苷酸编号)(Jinek等,"A programmable dual-RNA-guided DNA endonuclease in adaptive 
bacterial  immunity",Science  2012,337:816-821)。来自金黄色葡萄球菌
(Staphylococcus aureus)的Cas9的PAM序列是“NNGRRT”或“NNGRR(N)”。已知其他变体 CRISPR/Cas9系统。因此,脑膜炎奈瑟球菌(Neisseria meningitidis)Cas9在PAM序列 
NNNNGATT处切割。嗜热链球菌(Streptococcus thermophilus)Cas9在PAM序列 NNAGAAW处切割。最近,针对弯曲杆菌(Campylobacter)的CRISPR系统已经描述了进一步的PAM基序
NNNNRYAC(WO2016/021973A1)。对于Cpf1核酸酶,已经描述了 Cpf1-crRNA复合物有效地切割前置有由短富含T的PAM的靶DNA,这不同于由Cas9 系统识别的通常富含G的PAM(Zetsche等人,同上)。此外,通过使用修饰的CRISPR 多肽,可以获得特定的单链断裂。Cas切口酶与各种重组gRNA的组合使用还可以通过双DNA切口的方式诱导高度特异性的DNA双链断裂。此外,通过使用两种gRNA,可以优化DNA结合的特异性并因此优化DNA切割。
[0006] 目前,例如,依赖于Cas9或其变体或其任何嵌合形式作为核酸内切酶的II型系统已经被修饰用于基因组工程。由两种组分(也称为单向向导RNA(sgRNA)的向导 RNA(gRNA)和非特异性CRISPR相关核酸内切酶)组成的合成CRISPR系统可用于通过共表达特异于被靶向基因且能够与核酸内切酶Cas9结合的gRNA产生敲除细胞或动物。值得注意的是,该gRNA是人工分子,包含一个与Cas或任何其他CRISPR效应蛋白或其变体或催化活性片段相互作用的结构域,以及另一个与感兴趣的靶核酸相互作用的结构域,因此代表crRNA和tracrRNA的合成融合物(“单向导RNA”(sgRNA)或简称“gRNA”;Jinek等,2012,同上)。基因组靶可以是任何~20个核苷酸的DNA序列,条件是靶紧接地存在于PAM的上游。PAM序列对于靶结合具有突出的重要性,并且确切的序列取决于Cas9的种类,并且例如对于化脓链球菌来源的Cas9是5'GGG3'或 5'NAG3'(标准IUPAC核苷酸编码)(Jinek等人,2012,同上)。使用修饰的Cas核酸酶,可以向感兴趣的靶序列引入靶向性单链断裂。组合使用这种Cas切口酶与不同重组 gRNA,可以使用双切口系统引入高度位点特异性DNA双链断裂。使用一个或多个 gRNA可以进一步提高总体特异性并减少脱靶效应。
[0007] 一旦表达,Cas9蛋白和gRNA通过gRNA“支架”结构域和Cas9上表面暴露的带正电荷的沟槽之间的相互作用形成核糖核蛋白复合物。重要的是,gRNA的“间隔区 (spacer)”序列仍然可以自由地与靶DNA相互作用。Cas9-gRNA复合物将与具有PAM 的任何基因组序列结合,但gRNA间隔区与靶DNA匹配的程度决定了Cas9是否会切割。一旦Cas9-gRNA复合物结合假定的DNA靶,gRNA靶向序列的3'末端的“种子”序列开始与靶DNA退火。如果种子和靶DNA序列匹配,gRNA将继续以3'至5'方向(相对于gRNA的极性)与靶DNA退火。
[0008] 最近,除了CRISPR/Cas9系统之外,工程化的CRISPR/Cpf1系统对于靶向性基因组工程变得越来越重要(参见Zetsche等人,同上和EP 3 009 511A2)。V型系统与II型系统一起属于2类CRISPR系统(Makarova和Koonin Methods.Mol.Biol.,2015,1311: 47-753)。Cpf1效应蛋白是一种大蛋白(约1,300个基酸),含有与Cas9的相应结构域同源的RuvC样核酸酶结构域以及Cas9特征性富含精氨酸的簇的对应物。然而,Cpf1 缺乏存在于所有Cas9蛋白质中的HNH核酸酶结构域,并且RuvC样结构域在Cpf1序列中是连续的,这不同于Cas9,其中包含长插入物,包括HNH结构域(Chylinski,2014; Makarova,2015)。Cpf1效应物与Cas9效应物相比具有一定的差异,即不需要额外的反式激活crRNA(tracrRNA)用于CRISPR阵列加工,通过短T富含PAM有效切割靶DNA(与 Cas9相反,其中PAM跟随有富含G的序列),并且通过Cpf1引入交错的DNA双链断裂。最近,基于CasX和CasY的额外的新型CRISPR-Cas系统已经被鉴定,这归因于效应蛋白的相对较小的大小,对于许多基因编辑或基因组工程方法具有特殊意义(Burstein et al.,"New CRISPR-Cas systems from uncultivated 
microbes",Nature,December 2016)。 CRISPR系统的特异性主要由gRNA靶向序列相较剩余基因组对基因组靶标的特异性如何来决定。
[0009] 鉴于绿藻、苔藓植物、蕨类植物和陆生植物的基因组及表型差异,植物界包括具有高异质性和多样性的物种。植物基因组和其复杂性代表了对高精确基因编辑或基因组工程的挑战。例如,玉蜀黍(玉米)在所有粮食作物中具有全球最高产量,2012年生产8.75 亿吨。其具有约2.4兆亿基对(Gb)的基因组,单倍染色体数为10(Schnable等,2009;Zhang等,
2009)。普通小麦(Triticum aestivum)(面包小麦)是六倍体,基因组大小估计为约 17Gb。
甜菜普通亚种(Beta vulgaris ssp.vulgaris)(糖甜菜)的基因组大小范围是约470兆碱基(Mb)-约569Mb。植物细胞的特殊架构和组成以及独特发育需要在计划用于修饰植物细胞内的靶序列时,具体修改基因组工程工具。因此,就动物尤其是哺乳动物确立的与之相关基因组工程的工具和原理不必然在感兴趣的植物细胞中运作,需要建立技术的特定策略以实现植物中的广泛应用。
[0010] 同样,动物尤其是哺乳动物基因组是复杂的,例如包括就小家鼠基因组而言的2.7 Gb或就智人基因组而言的3.2Gb。尤其是当基于CRISPR的基因编辑或基因组工程方法意在用于人基因组内靶标的精确基因编辑或基因组工程时,因而迫切需要提供高特异性,因为任何类型的脱靶效应都可能非常有害。
[0011] 就基因组工程着重考虑的另一方面是感兴趣的基因组靶位点切割后必需的修复机制,因为双链断裂(DSB)或DNA损伤一般对基因组完整性有害。基因组材料中的DSB 能由如下引起:电离辐射、化学品、化、酶和复制期间的单链断裂,并代表可能导致基因损失、DNA复制停滞和细胞死亡的一系列DNA损害形式。因此,细胞机器提供双链断裂(DSB)修复机制是很重要的。细胞具有尝试修复任何双链或单链DNA损害的内在机制。DSB修复机制分成2个主要基本类型,即非同源性末端连接(NHEJ)和同源重组 (HR)。基于同源性的修复机制通常称为同源指导的修复(HOR)。
[0012] NHEJ是动植物中的主要核响应,其不需要同源序列,但通常易出错并因此可能诱变(Wyman C.,Kanaar R“. DNA double-strand repair repair:all's well that ends well”, Annu.Rev.Genet.2006;40,363-83)。通过HOR修复需要同源性,但那些使用完整染色体修复断裂染色体的HOR途径,即双链断裂修复和合成依赖性链退火,是高度准确的。在经典的DSB修复途径中,3'末端侵入完整的同源模板,然后作为DNA修复合成的引物,最终导致形成双重霍利迪连接(dHJ)。dHJ是四链分枝结构,当侵入链的延伸从第二个DSB末端“捕获”并合成DNA时形成。通过两种方式之一的切割来分解单个 HJ。依赖于合成的链退火是保守的,并且完全导致非交叉事件。这意味着所有新合成的序列都存在于同一个分子上。与NHEJ修复途径不同,在合成依赖性链退火中,链侵入和D环形成后,侵入链的新合成部分从模板中被置换并返回到另一DSB端的非侵入链的加工末端。非侵入链的3'末端被延伸并连接以填补间隙。还有HOR的另一途径,称为断裂诱导修复途径,其尚未完全表征。该途径的核心特征是在DSB处仅存在一个可用于修复的侵入端。
[0013] 另一HOR通路是单链退火(SSA)。SSA是非保守的并在顺向重复>30bp之间发生,导致缺失。近年来,微同源指导的末端连接(MMEJ)被认为是真核生物中的独特DSB修复类型。此通路仅需要极短(2-14bp)的同源区域,其通常留下的缺口如SSA。其也与 HR和NHEJ通路在遗传上不同,并在哺乳动物细胞中用作NHEJ的后备(Kwon,T.,Huq, E.,&Herrin,D.L.
(2010).Microhomology-mediated and nonhomologous repair of a double-strand 
break in the chloroplast genome of Arabidopsis).Proceedings of the National 
Academy of Sciences of the United States of America,107(31),13954-13959)。总
之, HR/HOR采用姐妹染色单体上的DNA上同源片段作为模板。其因而提供高保真度,然而效率则更低。相反,NHEJ是高效直接的途径,其能重接2个末端而不依赖于显著同源性,此效率伴有以下缺点:该过程易错且可能与插入或缺失相关。
[0014] 由于寻求影响自然修复通路的基因编辑或基因组工程方法,因此需要物理设计修复模板(RT),这是一个重要参数。能提供RT作为ssDNA或部分dsDNA。就基因组编辑而言联合修复模板(RT)的依赖于CRISPR工具的当前操作完全取决于分开提供双或单链的核酸RT,其进而识别仅通过碱基配对和杂交来修复的DNA断裂。然而,RT在诱导 DNA断裂位点的物理和时间可用性无法通过目前可用的方法控制,因为这些方法不在区室处以正确构型、浓度和因而化学计量学形式提供精确的RT空间和时间供应,在所述区室中修复必须发生,优选立即在诱导靶DNA断裂后以不仅特异控制断裂,而且控制修复事件。
[0015] 与CRISPR/Cas核酸酶一样,Argonaute核酸内切酶(“Argonaute”)通过使用核酸向导来指定靶序列参与防御外来核酸,所述靶序列然后由Argonaute蛋白组分切割。具体地,Argonaute可以通过与设计的或合成的靶向核酸的核酸形成复合物来结合和切割靶核酸,其中切割所述靶核酸可以在所述靶核酸中引入双链断裂。与Cas9系统一样, Argonaute核酸向导提供了一种简便的编程核酸内切酶序列特异性的方法。然而,短 ssRNA分子被许多真核Argonaute用作向导,而没有任何二级结构识别约束,例如存在于Cas9-短向导RNA(sgRNA,gRNA)相互作用中的那些短ssRNA分子。因此,大多数真核细胞中ssRNA的丰度使得RNA向导的真核生物Argonaute的特异性靶向成为潜在的挑战。相反,一些原核Argonaute由短的5'-磷酸化的ssDNA分子向导(Swarts,D.C.et al.DNA-guided DNA interference by a prokaryotic Argonaute.Nature 507,258-261,2014; Swarts,D.C.et al.Argonaute of the archaeon Pyrococcus furiosus is a DNA-guided nuclease that targets 
cognate DNA Nucleic Acids Res.43,5120-5129 2015),并且因此归因于存在于真核细胞中的短ssDNA分子的缺乏,而固有地具有较低的被宿主细胞衍生核酸误导的可能性。因此,DNA向导的Argonaute核酸内切酶具有应用于真核基因组编辑的潜。然而,先前未证实在植物中使用格氏黄杆菌Argonaute(NgAgo)系统。
[0016] 在文献中,已记载了如果序列在核内极为接近而不是显著量的分开,则2种序列之间的同源重组发生更频繁。例如,在2种情况中,染色体定位的供体分子与靶标之间获得的拟南芥基因编辑率分析较高,其中一种情况中供体存在的染色体与靶标相同,而另一情况中2个基因座位于不同染色体(Fauser等,2012)。然而,这些发现尚未以合理方式用于优化真核细胞中基于位点特异性内切酶的基因编辑或基因组工程方法。
[0017] EP 2 958 996 A1寻求如下来克服特定DSB修复问题:在细胞中提供NHEJ机制抑制剂以增加核酸酶(如ZFN或TALEN)或核酸酶系统(如CRISPR/Cas)介导的基因破坏。通过抑制这些NHEJ DNA修复通路的关键酶活性,使用DNA依赖性蛋白激酶催化亚基 (DNA-PKc)和/或聚-(ADP-核糖)聚合酶1/2(PARP1/2)的小分子抑制剂,核酸酶的基因破坏平通过迫使细胞采取比经典NHEJ更易出错的修复通路(如选择性NHEJ和/或微同源指导的末端连接)而提高。因此,在基因组编辑进程中加入额外化学物,然而,这可能对一些细胞类型和测定不利。这也能影响所处理细胞的基因组完整性和/或再生潜能。
[0018] Ma等人(2016,JCB,214(5):529,"CRISPR-Cas9 nuclear dynamics and target recognition in living cells")使用3'-修饰的sgRNA,其允许基于适体的荧光报告因子结合以研究针对端粒靶标的Cas9的动力学和sgRNA动力学。值得注意的是,tracrRNA序列内的修饰对靶向没有影响。只有随后截断的tracrRNA序列导致sgRNA不稳定而不依赖于适体修饰。
[0019] 因此,持续需要提供合适的CRISPR工具,尤其是优化用于精确植物(特别是主要农作物)编辑的工具,所述工具组合了高精度基因组切割,例如通过提供就感兴趣细胞中靶位点优化的gRNA和同时提供调节高精度和准度的HOR以及因而调节DSB的靶向修复的可能性,这对于控制基因编辑或基因组工程干预是必要的。
[0020] 由此,提出新策略以提供用于精确基因组编辑的修复模板也是目标之一,特别是适合真核细胞(包括酵母、动物和植物细胞)但也适用于原核细胞的修复模板,例如用于代谢工程和各种其他目的或用于修饰病毒基因组(例如,病毒减毒或减少病毒的毒力)。尽管生物技术中的基因组编辑取得巨大进步,如用于治疗方法、基因治疗或者植物或微生物基因组工程以用于靶向性状发育,在涉及待引入的靶向基因组修饰的特异性或脱靶效应方面仍有大问题和顾虑。此问题尤其与精确度相关,所述精确度能在诱导感兴趣基因组靶核酸的断裂和相关修复时获得。
[0021] 由于诱导DSB的任意种类基因编辑或基因组工程方法引入潜在有害的DNA断裂和可能不需要的DNA修复机制导致不需要的核酸交换,持续需要开发更有效的方法和工具以实现高精度和受控基因编辑或基因组工程,这也意味着靶向的DNA修复模板(RT) 的使用。
[0022] 另一个经常与提供成功基因组工程而没有介导脱靶效应相关的问题是修复模板在形成断裂并因而必须修复时于DSB位点处的物理可用性。通常,如上所详述,所需编辑事件通过非同源末端连接(NHEJ)通路或通过与内源同源序列重组的修复而在竞争中胜出。取决于待修饰的靶生物体,这要求更集中的策略以引入基因编辑或基因组工程工具以及感兴趣的修复模板,从而所有工具能在适当时间到达含基因组的细胞内的区室 (如优选核)或任何其它携带基因组的区室(如线粒体)。一种部分克服此限制的方法是扩增修复模板并因而增加模板在核中的丰度且假定通过借助双生病毒载体使其更可用于修复DSB(参见例如
Mach,Plant Cell.2014,doi:10.1 105/tpc.1 14.122606;和Baltes等, Plant 
Cell.2014,doi:10.1 105/tpc.1 13.1 19792)。然而,修复模板作为单独物理实体递送,并因此没有控制机制来确定修复模板在核酸内切酶引入DSB的确切时间点确实存在于需要
DNA修复的位置。
[0023] 涉及CRISPR应用时,频繁建议使用游离ssDNA核苷酸作为修复模板或质粒携带修复模板,而没有公开或建议在产生DSB时,保证使修复模板确实物理接触待原位修复的DSB的策略。
[0024] 生物素-链霉抗生物素蛋白和生物素-抗生物素蛋白相互作用在性质上是最稳定-15
的,解离常数Kd为10 M。该关联基于抗生物素蛋白或链霉抗生物素蛋白之间的同源四聚体结构(分别每个亚基为~16.5和13.2kDa)和普遍存在但丰度低的维生素生物素。同源四聚体链霉抗生物素蛋白或抗生物素蛋白复合物自发形成并且能够结合具有低解离常数的四
种生物素分子。在至少两次尝试中,可以通过降低结合亲和力来克服自发四聚化 
(Laitinen et al.2003,"Rational Design of an Active Avidin Monomer."Journal of Biological Chemistry 278(6):4010-4014;Mann et al.2016,"Cell labeling and 
proximity dependent biotinylation with engineered monomeric streptavidin."
TECHNOLOGY 4(3):1-7)。同样地,通过在序列内包含生物素化信号,证明了核酸酶的生物素化是可能的(Kay et al.2009, "High-throughput Biotinylation of Proteins."
Methods in molecular biology(Clifton,N.J.) 498:185-196)。BirA是一种可能用于细菌蛋白质表达的生物素化酶,但生物素化也发生在高等植物中(Tissot et al.1996,"
Protein biotinylation in higher plants:characterization of biotin 
holocarboxylase synthetase activity from pea(Pisum sativum)leaves.",
Biochemical Journal 314(Pt 2):391-395)。
[0025] 单链可变片段(scFv)代表免疫球蛋白的重链(VH)和轻链(VL)的可变区的融合蛋白,与 10至约25个氨基酸的短接头肽连接,并且已知为通用高亲和力结合分子。可以通过连接两个scFv来工程化为二价(divalent)(或二价(bivalent))单链可变片段(di-scFv,
bi-scFv)。这可以通过产生具有两个VH和两个VL区的单个肽链而产出串联scFv来实现
(Kufer et al.,2004,Trends in Biotechnology,22(5),238-244;Xiong et al.,2006,
Protein Engineering Design and Selection,19(8),359-367)。
[0026] 到目前为止,这些关于生物素化分子及其同源结合伴侣或其他高亲和力分子结合对 (例如抗体或单链可变片段及其同源伴侣)的能力的发现尚未被开发利用用于使用位点特异性核酸酶和修复模板的靶向基因组工程。
[0027] 在该点,对不同靶细胞必需的递送基因编辑或基因组工程和/或修复模板工具的独特差异变得明显。在这方面,植物细胞具有包括细胞壁在内的某些辨识性特征,使得植物细胞中的基因编辑或基因组工程成为与为动物/哺乳动物细胞建立的基因编辑或基因组工程完全不同的任务,因为基因组编辑和/或修复工具的递送通过与其它真核细胞不同的转化、转染和/或转导方法介导。然而,必须考虑这些独特性以实现高精确的植物基因组编辑。
因此,本发明的一个目的是克服对提供新工具和方法的明显需求,所述工具和方法适合真核细胞(包括植物细胞)中的高精度基因组编辑(尤其是CRISPR和Argonaute介导的基因组
编辑的领域)以克服基因编辑领域的现有限制,所述现有限制涉及修复模板在DSB被修复的位点和时间的物理可用性和因而通过经非同源末端连接通路(NHEJ)或与(内源)同源序列
(HR/HOR)重组的DNA修复机制的竞争。本发明的另一个目的是提供适用于任何位点特异性核酸酶并且不限于核酸向导的CRISPR或Argonaute核酸酶的简化的定点核酸酶工具箱,其可通过提供分子或分子复合物来用于真核或原核细胞中的定点基因组编辑或对任何原核、真核或病毒基因组的定点基因组编辑,所述分子或分子复合物统一DNA识别、切割与修复模板性质且同时能容易递送到靶位点即原核细胞、真核或病毒基因组,尤其是动物细胞基因组,特别是哺乳动物细胞基因组或植物细胞基因组,因为动物或植物细胞基因组编辑期间待实现的精确度仍需要提高以符合医疗和食品管理局设置的必要高监管要求。本文公开的人工分子复合物的脱靶整合险低于作为游离分子引入细胞的ss-或ds-DNA修复模板的脱靶整合风险。另外,一个目的是提供特定优化来用于借助植物特异递送方法来转移植物特异基因组编辑构建体的递送工具。另外,一个目的是,若需要,提供能依赖于使用瞬时提供的RNA和位点特异性核酸酶的瞬时编辑活性的方法,因为某些情况中的敏感性针对任何遗传修饰形式,所述遗传修饰将外来DNA作为产生过程的中间物整合。最终,本发明的一个目的是提供基因编辑或基因组工程方法,其在涉及新靶标测试的时间节约方面优于近期的方法,因为不需要费力的克隆和预测试。

发明内容

[0028] 根据本发明实现上面确定的目标,这是通过将修复模板递送到DSB位点来解决修复模板可用性的问题,所述递送是通过将所述修复模板作为“货物”直接束到核酸酶复合物,而适合用于该方法的核酸酶谱通过提供依赖于任何感兴趣的位点特异性核酸酶(SSN) 的人工分子复合物而已经显著增加。通过提供至少一个修复模板对接结构域(RTDD)和至少一个SSN,在原位形成断裂时指导修复模板到双链断裂,其中所述修复模板对接结构域被配置为直接与至少一个修复模板核酸序列(RT)相互作用来增加所述修复模板(RT) 开发用于修复所述断裂的局部可用性。从而,本发明所述人工分子复合物不仅协助提供定制修复模板,还能有助于增加基因编辑事件的频率和/或特异性。此想法因此在单一分子复合物内组合位点特异性核酸酶与修复模板的功能,用于同时的基因组切割和靶向修复,与特定递送工具和方法联合以递送所述基因组编辑工具和/或所述修复模板到靶细胞中的感兴趣的区室。此系统由此允许现有的编辑方法具有更高特异性和因而减少脱靶效应,这在尽可能最小化大型动物尤其是哺乳动物或有时甚至更复杂的植物基因组中的脱靶切割是需要的。
[0029] 具体地,通过在第一方面提供人工分子复合物来实现上述目的,所述人工分子复合物包含(a)至少一个位点特异性核酸酶(SSN)或其催化活性片段,或编码其的核酸序列,并且直接与(b)相互作用,(b)至少一个修复模板对接结构域(RTDD)或编码其的核酸序列,其中所述修复模板对接结构域被配置为直接与至少一个修复模板核酸序列(RT)相互作用;(c)任选地包含至少一个相互作用结构域(IA)或编码其的核酸序列,其中所述至少一个相互作用结构域与所述至少一个位点特异性核酸酶或其催化活性片段直接相互作用,并且其中所述至少一个相互作用结构域被配置为提供选自由以下组成的组的至少一种功能:(i)与所述至少一个修复模板对接结合域相互作用;和/或(ii)与所述至少一个修复模板核酸序列相互作用;和/或(iii)与基因组DNA序列特异性相互作用;其中所述至少一个修复模板核酸序列包含至少一个与至少一个基因组互补序列互补的部分,并且其中所述至少一个修复模板核酸序列配置成介导DNA靶序列的修复。
[0030] 在根据本发明的各个方面的一个实施方案中,提供了人工分子复合物,其中所述位点特异性核酸酶或编码其的核酸序列选自以下至少一种:CRISPR核酸酶(包括Cas或 Cpf1核酸酶)、TALEN、ZFN、大范围核酸酶、限制性核酸内切酶(包括IIS类限制性核酸内切酶,包括FokI或其变体),或两种位点特异性切口核酸内切酶,或其变体或催化活性片段。
[0031] 在另一个实施方案中,提供了人工分子复合物,其中所述至少一个修复模板对接结构域或编码其的核酸序列选自以下至少一个:生物素;适体;DNA、RNA或蛋白质染料,包括荧光团,包含荧光素,或其变体,来酰亚胺或四氮唑(Tetraxolium)(XTT));特异性配置为与至少一个修复模板核酸序列相互作用的向导核酸序列;链霉抗生物素蛋白或其变体,优选单体抗生物素蛋白;抗生物素蛋白或其变体;亲和标签,优选链霉抗生物素蛋白标签;抗体;单链可变片段(scFv);单域抗体(纳米抗体);抗运载蛋白 (anticalin);农杆菌VirD2蛋白或其结构域;小核糖核酸病毒VPg;拓扑异构酶或其结构域;PhiX174噬菌体A蛋白;PhiX A*蛋白;VirE2蛋白或其结构域;或地高辛。另一个众所周知的相互作用系统是SNAP标签,例如与New England Biolabs Inc.(www.neb.com) 提供的dCas9融合的SNAP标签。SNAP标签能够结合一系列荧光团、生物素和其他缀合物。主要目的是允许可视化,但它也可用于绑定修复模板。
[0032] 在根据本发明的上述第一方面的又一个实施方案中,提供了一种人工分子复合物,其中所述至少一个相互作用结构域或编码其的核酸序列选自以下至少一种:DNA结合结构域;链霉抗生物素蛋白或其变体,优选单体链霉抗生物素蛋白;抗生物素蛋白或其变体;
亲和标签;生物素化信号;生物素受体位点;链霉抗生物素蛋白标签;抗体;单链可变片段(scFv);单结构域抗体(纳米抗体);抗运载蛋白;生物素;适体;DNA、RNA 或蛋白质染料,包括荧光团,包含荧光素,或其变体,马来酰亚胺或四氮唑(XTT));特异性配置为与至少一个修复模板核酸序列相互作用的向导核酸序列;农杆菌VirD2蛋白或其结构域;小核糖核酸病毒VPg;拓扑异构酶或其结构域;PhiX174噬菌体A蛋白; PhiX A*蛋白;VirE2蛋白或其结构域;或地高辛。
[0033] 在又一个实施方案中,提供了一种人工分子复合物,其中所述至少一个位点特异性核酸酶和/或所述至少一个修复模板核酸序列和/或所述至少一个相互作用结构域包含至少一个核定位序列、质体定位序列,优选线粒体定位序列或叶绿体定位序列。
[0034] 在根据本发明的各个方面的另一个实施方案中,提供了一种人工分子复合物,其中所述至少一个修复模板核酸序列包含至少一个末端(优选3'末端)部分,其中该末端部分不与人工分子复合物的任何其他组分相互作用,并因此配置成与至少一个基因组互补序列杂交以介导所述DNA靶序列的修复,和/或其中所述至少一个修复模板核酸序列作为质粒提供。
[0035] 在又一个实施方案中,提供了一种人工分子复合物,其中所述至少一个位点特异性核酸酶或其催化活性片段或编码其的序列选自CRISPR核酸酶(优选选自Cas或Cpf1核酸酶),或FokI核酸酶,或其催化片段,和所述至少一个相互作用结构域或编码其的序列选自单链可变片段或单体链霉抗生物素蛋白。
[0036] 此外,在另一个实施方案中,提供了一种人工分子复合物,其中所述复合物包含至少一个代表所述至少一个修复模板对接结构域的向导核酸序列,其中所述至少一个向导核酸序列中的每一个包含(i)第一序列部分,其与识别DNA靶序列互补,和(ii)第二序列部分,其中所述第二序列部分被配置为与所述至少一个位点特异性核酸酶相互作用,和 (iii)其中所述至少一个向导核酸序列与所述至少一个修复模板核酸序列物理缔合,并因此形成包含至少一个RNA或DNA和至少一个其他DNA核酸序列的杂交核酸序列或由至少一个RNA或DNA和至少一个其他DNA核酸序列组成的杂交核酸序列,和(iv)任选地包含在所述至少一个向导核酸序列和所述至少一个修复模板核酸序列之间的接头区域,优选其中所述修复模板核酸序列在所述向导核酸序列的3'末端与所述向导核酸序列缔合,和/或其中所述修复模板核酸序列与所述向导核酸序列的5'末端缔合,和/或其中所述修复模板核酸序列位于所述向导核酸序列内。
[0037] 在另一个实施方案中,提供一种人工分子复合物,其中所述至少一个修复模板核酸序列和/或所述至少一个向导核酸序列包括核苷酸序列,其选自天然或非天然存在核苷酸序列,包括合成核苷酸序列,任选地包含主链和/或碱基修饰,其中所述向导核酸序列包括单链或部分单链的RNA或DNA核苷酸序列,且其中所述至少一个修复模板核酸序列包括单链或双链DNA核苷酸序列。
[0038] 在根据本发明的各个方面的又一个实施方案中,提供了一种人工分子复合物,其中所述至少一个位点特异性核酸酶或编码其的序列,和所述至少一个相互作用结构域或编码其的序列,和/或所述至少一个修复模板对接结构域或编码其的序列通过至少一个接头结构域连接。
[0039] 在所提供的一个实施方案中,所述至少一个位点特异性核酸酶或其催化活性片段或编码其的序列独立地选自由以下组成的组:来自以下的Cas多肽:链球菌属(Streptococcus spp.)包括化脓链球菌(Streptococcus pyogenes)、嗜热链球菌
(Streptococcus thermophilus)、金黄色葡萄球菌(Staphylococcus aureus),或奈瑟菌属(Neisseria spp.)包括脑膜炎奈瑟菌  (Neisseriameningitides),棒杆菌
(Corynebacter),萨特氏菌(Sutterella),军团菌(Legionella),密螺旋体(Treponema),产线菌(Filifactor),真细菌(Eubacterium),乳酸菌(Lactobacillus),支原体
(Mycoplasma),拟杆菌(Bacteroides),Flaviivola,黄杆菌(Flavobacterium), 
Sphaerochaeta,固氮螺菌(Azospirillum),葡糖醋杆菌(Gluconacetobacter),罗氏菌 (Roseburia),细小棒菌(Parvibaculum),硝酸盐裂解菌(Nitratifractor),支原体,弯曲杆菌 (Campylobacter),Candidatus Micrarchaeum acidiphilum ARMAN-1,俭菌总细菌 (Parcubacteria)(GenBank:APG80656.1),硫化叶菌属(Sulfolobus spp.),包括岛硫化叶菌 (Sulfolobus islandicus)HVE10/4(GenBank:ADX81770.1)或REY15A(GenBank: 
ADX84852.1),以及Candidatus Parvarchaeum acidiphilum ARMAN-4;来自古细菌或细菌的Cpf1多肽,包括来自以下的Cpf1多肽:氨基酸球菌属(Acidaminococcus spp.)包括氨基酸球菌属BV3L6,毛螺菌(Lachnospiraceae spp.)包括毛螺菌ND2006、毛螺菌 MC2017、毛螺菌MA2020,瘤胃纤维丁酸弧菌(Butyrivibrio proteoclasticus),Candidatus spp.,Methanoplasma termitum,稻田钩端螺旋体(Leptospira inadai),眼莫拉菌(Moraxella bovoculi)237,异域菌门细菌(Peregrinibacteria bacterium)GW201 1_GWA2_33_10,俭菌总门细菌(Parcubacteria bacterium)GW201 1_GWC2_44_17,史密斯氏菌属(Smithella 
sp.) SCADC,史密斯氏菌属SC_K08D17,弗朗西斯氏菌(Francisella spp.)包括新凶手弗朗西丝氏菌(Francisella novicida)U112,挑剔真杆菌(Eubacterium eligens),普氏菌
(Prevotella spp.)或卟啉单胞菌(Porphyromonasspp.);或来自以下的Argonaute核酸酶:
格氏黄杆菌 (GenBank:AFZ73749.1),绿微囊藻(Microcystis aeruginosa)(NCBI参考序列:  WP_012265209.1或NCBI参考序列:WP_002747795.1或NCBI参考序列: WP_
012265209.1),Halogeometricum pallidum(GenBank:ELZ29017.1),Natrialaba asiatica(NCBI参考序列:WP_0061 1 1085.1),冷盐碱红菌(Natronorubrum tibetense)(NCBI 参考序列:WP_006090832.1),隐红碱线菌(Natrinema pellirubrum)(NCBI参考序列: WP_
006183335.1),或胶州湾聚球菌(Synechococcus spp.)(NCBI参考序列:WP_01 
1378069.1);或它们的变体和/或功能片段和/或组合,包括切口酶或缺乏内切核苷酸活性的核酸酶。
[0040] 在根据本发明的第二方面,提供了根据前述实施方案中任一项的人工分子复合物,其用于治疗疾病的方法,其中所述疾病的特征在于至少一个基因组突变并且所述工分子复合物被配置为靶向并修复所述至少一个基因组突变。因此,提供了使用根据前述权利要求中任一项的人工分子复合物治疗疾病的方法,其中所述疾病的特征在于至少一个基因组突变,并且所述人工分子复合物被配置为靶向并修复所述至少一个基因组突变。
[0041] 在另一方面,提供了植物、植物细胞、植物材料、或其衍生物或后代,其包含至少一个根据前述方面和/或实施方案中任一项的人工分子复合物或由至少一个根据前述方面和/或实施方案中任一项的人工分子复合物编辑。
[0042] 在又一方面,提供了修饰至少一个DNA靶序列的方法,包括以下步骤:(i)提供至少一个原核、真核或病毒细胞和/或基因组,所述细胞和/或基因组包含在感兴趣的基因组区域中的至少一个基因组互补序列和至少一个DNA靶序列;(ii)提供至少一个如前述任一方面和/或实施方案中所定义的人工分子复合物;(iii)在合适的条件下使所述至少一个人工分子复合物与所述至少一个DNA靶序列接触,以实现(a)所述至少一个位点特异性核酸酶与所述至少一个DNA靶序列的相互作用;(b)所述至少一个修复模板核酸序列与所述至少一个基因组互补序列的互补碱基配对,以实现所述至少一个互补序列的识别和由所述至少一个位点特异性核酸酶诱导的至少一个DNA断裂,其中所述至少一个修复模板核酸序列指导在所述至少一个DNA靶序列的位点的同源定向修复;以及(iv) 获得至少一个原核、真核或病毒细胞和/或基因组,所述细胞和/或基因组包含所述至少一个DNA靶序列中的修饰。
[0043] 在上述方面的一个实施方案中,提供了修饰至少一个DNA靶序列的方法,其中所述人工分子复合物的所述至少一个修复模板核酸序列和/或所述至少一个修复模板对接结构域独立于所述至少一个分子复合物的所述至少一个位点特异性核酸酶而被提供至所述至少一个原核、真核或病毒细胞和/或基因组,并且所述至少一个人工分子复合物在所述至少一个原核或真核或病毒基因组和/或细胞内被组装或部分组装。
[0044] 在上述方面的又一个实施方案中,提供了修饰至少一个DNA靶序列的方法,其中所述至少一个人工分子复合物是离体组装的人工分子复合物。
[0045] 在上述方面的另一个实施方案中,提供了修饰至少一种DNA靶序列的方法,其中所述至少一个真核细胞是植物细胞,优选来自选自由以下组成的组的植物的植物细胞:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗 (Saccharum officinarium)、玉蜀黍属(Zea spp.)(包括玉米(Zea mays))、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza 
australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus 
domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜属(Beta spp.)(包括甜菜(Beta vulgaris))、小胡萝卜(Daucus pusillus)、 Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草 (Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯 (Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、黄花螺旋狸藻
(Genlisea aurea)、黄瓜(Cucumis sativus)、川桑(Marus notabilis)、Arabidopsis 
arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥 
(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠
(Cardamine nexuosa)、北美独行菜(Lepidium virginicum)、荠菜花(Capsella bursa 
pastoris)、 Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝 (Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica  juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria 
subsp.Sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、 Cicer judaicum、木豆(Cajanus 
cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆 (Phaseolus vulgaris)、大豆(Glycine max)、属(Gossypium sp.)、紫英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus) 和韭(Allium tuberosum),或属于上述植物之一的任何变种或亚种。
[0046] 在另一个实施方式中,提供了修饰至少一个DNA靶序列的方法,其中所述至少一个DNA靶序列的修饰引起选自由以下组成的组的性状编辑:产量提高;耐受非生物胁迫,包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、盐胁迫或水浸;耐受生物胁迫,包括虫耐受性、细菌耐受性、病毒耐受性、真菌耐受性或线虫耐受性;抗除草剂,包括草甘膦、草铵膦、ALS抑制剂和麦草畏;抗倒伏性;花期;抗落粒;种子颜色;胚乳组成;营养成分;或是代谢工程,包括基因组编辑以允许在至少一个植物细胞中的分子产药方法。
[0047] 还提供了修饰至少一种DNA靶序列的方法,其额外包括以下步骤:(v)鉴定和/或选择至少一个原核、真核或病毒基因组和/或细胞,所述基因组或细胞包含所述至少一个 DNA靶序列的所述修饰。
[0048] 在另一方面,提供制备植物或植物细胞的方法,包括以下步骤:(i)执行根据上述方面和/或实施方案任一种的方法,其中所述至少一个真核细胞是植物细胞;(ii)从步骤(i) 的至少一个植物细胞获得至少一个植物或其后代;(iii)任选地:确定在所述至少一个植物或其后代的至少一个细胞中所述至少一个DNA靶序列中的所述修饰。
[0049] 在一个实施方案中,提供了用于制备植物或植物细胞的方法,其中所述至少一个植物或植物细胞选自单子叶植物或双子叶植物,优选地,其中所述植物选自由以下组成的组:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉蜀黍属(Zea spp.)(包括玉米(Zea mays))、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻
(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦 (Secale cereale)、黑小麦(Triticale)、苹果(Malus 
domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜属(Beta spp.)(包括甜菜(Beta vulgaris))、小胡萝卜(Daucus pusillus)、 Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草 (Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯 (Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、黄花螺旋狸藻
(Genlisea aurea)、黄瓜(Cucumis sativus)、川桑(Marus notabilis)、Arabidopsis 
arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥 
(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠
(Cardamine nexuosa)、北美独行菜(Lepidium virginicum)、荠菜花(Capsella bursa 
pastoris)、 Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝 (Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica  juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria 
subsp.Sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、 Cicer judaicum、木豆(Cajanus 
cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆 (Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus) 和韭(Allium tuberosum),或属于上述植物之一的任何变种或亚种。
[0050] 在另一方面,提供了至少一个根据上述方面和/或实施方案中任一项的人工分子复合物在原核、真核或病毒细胞、基因组或生物体中,优选在植物细胞或生物体中的基因组工程的用途。
[0051] 本发明的其它方面和实施方式能获自后续详细描述、附图序列表以及所附权利要求。
[0052] 附图简述
[0053] 图1 A-D(Fig.1 A-D)显示就本发明所述不同RNA/DNA杂合核酸序列或 DNA-DNA核酸序列而言可能构型和不同缔合方式的非限制性示例,所述向导核酸部分代表根据本发明的所述至少一个修复模板对接结构域(RTDD)和/或所述至少一个相互作用结构域(IA)。(A)单链修复模板(RT)(ssDNA)与向导核酸分子通过沃森克里克碱基配对的非共价结合,所述向导核酸分子含有用作sgRNA或tracrRNA或用作gDNA的序列。 (B)单链RT(ssDNA)与所述向导核酸分子的共价缔合。此形式能通过连续合成作为单一分子的RTDD向导核酸分子和RT部分来制备,或通过连接分开的部分以形成单一分子来制造。(C)与所述向导核酸分子非公价缔合的双链RT(dsDNA)。(D)与所述向导核酸分子公价缔合的双链RT(dsDNA)。
[0054] 图2A-C(Fig.2A-C)显示可能位置的非限制性示例,在该处RT能附于或缔合向导核酸分子,所述向导核酸分子作为根据本发明的至少一个RTDD和/或所述至少一个IA。 (A)单或双链RT与向导核酸分子的3'末端的共价或非共价缔合。(B)单或双链RT与向导核酸分子的5'末端的共价或非共价缔合。(D)单或双链RT内部与向导核酸分子的共价或非共价缔合。修复模板(RT)部分在本图和所有其他图中以白色显示。
[0055] 图3A-E(Fig.3A-E)显示使用RT与向导核酸分子的3'端共价缔合的一个实施方式,采用本文公开的位点特异性核酸酶(SSN)核酸酶复合物向感兴趣基因组序列逐步引入编辑的非限制性示例。(A)向导核酸分子与SSN例如NgAgo、Cas(包括Cas9、CasX或 CasY或Cpf1)复合的示意图。(B)复合物结合靶DNA(基因组DNA(gDNA))和指示切割位点(黑三)的示意图。(C)经切割靶DNA的示意图。(D)由SSN释放的经切割靶DNA 以及与修复模板(RT)通过互补沃森克里克碱基配对相互作用的示意图。(E)包括拷贝自同源重组期间RT的编辑在内的修复靶位点(gDNA)的示意图。修复模板(RT)部分在所有图中以白色显示。
[0056] 图4A至C(Fig.4A-C)显示了作为SSN的核酸向导的核酸内切酶和作为相互作用结构域(IA)的蛋白质或蛋白质结构域的融合蛋白的设计的非限制性实例,所述相互作用结构域(IA)具有直接或间接结合修复模板(RT)的能力。(A)作为复合物的所述融合蛋白与所述靶DNA的示意图。(B)引入双链断裂后的复合物的示意图。核酸向导的核酸内切酶与靶DNA分离。融合的核酸修复模板以基于同源性的方式与靶区域形成复合物。(C) 发生同源定向修复后靶DNA的示意图。值得注意的是,所提出的方法使用多于一个 RTDD来为基因组工程复合物增加更多精确度。
[0057] 图5在左图中显示了纯化的核酸酶(在这种情况下是CRISPR核酸酶),其与RTDD1 融合并在大肠杆菌中表达。它在变性的连续梯度(4-10%)SDS凝胶上跑胶并显示蛋白质的数量和纯度。在该凝胶中染色蛋白质。右图显示了该绑定。这是4%非变性丙烯酰胺凝胶(Blue Native PAGE),并且这里使用GelRed染色DNA。将FAM标记的(RTDD2-) 修复模板在不含核酸酶-RTDD1的核酸酶缓冲液中孵育或左侧显示的含核酸酶-RTDD1 的核酸酶缓冲液中孵育。如果存在蛋白质,则如通过在较高分子量水平检测到的DNA 所见(箭头)发生了绑定。
[0058] 图6在第1行中显示了靶位点的野生型序列的一部分(全长序列代表SEQ ID NO: 47),在第2行和第3行中显示INDEL发生的实例(全长序列代表SEQ ID NO:48和49),在第4行显示正确的HDR事件(全长序列代表SEQ ID NO:50),并且第5行显示修复模板(全长序列代表SEQ ID NO:51)。
[0059] 图7显示了当修复模板不与核酸酶绑定(左列)以及与核酸酶绑定(右列)时归一化的 HDR效率的比较。
[0060] 定义
[0061] 必须注意的是,除非上下文另有明确规定,否则如本文所用,单数形式“一(a)”、“一(an)”和“该”包括复数形式。例如,对一种组件的引用也旨在包括多个组件的组成。对含有“一(a)”组分的组合物的引用旨在包括除了所述组分之外的其他组分。换句话说,术语“一(a)”、“一(an)”和“该”不表示数量的限制,而是表示存在“至少一个”所引用的项目。每个术语旨在涵盖本领域技术人员所理解的其最广泛的含义,并且包括以类似方式操作以实现类似目的的所有技术等同物。
[0062] 范围可以在本文中表述为从“大约”或“近似”或“基本上”一个特定值和/或至“大约”或“近似”或“基本上”另一特定值。当表达这样的范围时,其他示例性实施实施方案包括从一个特定值和/或到另一个特定值。此外,术语“约”意指由本领域普通技术人员确定的特定值的可接受误差范围内,这将部分取决于如何测量或确定该值,即测量系统的限制。例如,根据本领域的实践,“约”可意味着在可接受的标准偏差内。或者,“约”可以表示给定值的最高±20%,优选最高±10%,更优选最高±5%,更优选最高±1%的范围。或者,特别是关于生物系统或过程,该术语可以意指数值的一个数量级内,优选在2倍内。在本申请和权利要求中描述特定值时,除非另有说明,否则术语“约”是隐含的,并且在本文中意味着在特定值的可接受的误差范围内。
[0063] “包含”或“含有”或“包括”是指至少所述化合物、元件、颗粒或方法步骤存在于组合物或制品或方法中,但不排除存在其他化合物、材料、颗粒、方法步骤,即使其他这样的化合物、材料、颗粒、方法步骤与所指明的那些具有相同的功能。
[0064] 如本文所用,“核酸”意指多核苷酸并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可包括片段和修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或 DNA的聚合物,任选地含有合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以5' 单磷酸盐形式存在)的单字母名称如下所示:“A”表示腺苷或脱氧腺苷(分别对于RNA 或DNA),“C”表示胞嘧啶或脱氧胞嘧啶,“G”表示苷或脱氧鸟苷,“U”表示尿苷,“T”表示脱氧胸苷,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“N”表示任何核苷酸。核酸可包含核苷酸。核酸对细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段,但核酸不一定必须编码基因。核酸可以是DNA你。核酸可以是RNA。核酸可包含一种或多种类似物(例如,改变的主链、糖或核碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、异种核酸、吗啉代、核酸、乙二醇核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如罗丹明或与糖连接的荧光素)、含硫醇的核苷酸、连接生物素的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、20假尿苷、二氢尿苷、奎诺辛和怀俄苷。根据本发明的核酸可以通过磷酸二酯键连接(例如,天然存在的)或通过硫代磷酸酯键连接,或两者的混合。
[0065] 术语“向导RNA”、“gRNA”或“单向导RNA”或“sgRNA”在本文中可互换使用,并且是指CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)的合成融合物,或术语是指仅由crRNA和/或tracrRNA组成的单个RNA分子,或者该术语是指单独包含 crRNA或tracrRNA部分的gRNA。tracr和crRNA部分因此不一定必须存在于一个共价连接的RNA分子上,然而它们也可以由两个单独的RNA分子组成,所述两个单独的 RNA分子可以缔合或可以通过非共价或共价相互作用缔合以提供根据本公开的 gRNA。术语“gDNA”或“sgDNA”或“向导DNA”在本文中可互换使用,并且指的是与Argonaute核酸酶相互作用的核酸分子。归因于它们与位点特异性核酸酶相互作用的能力并且有助于将所述位点特异性核酸酶靶向基因组靶位点,本文公开的gRNA和 gDNA都被称为“向导(guiding)核酸”或“向导(guide)核酸”。
[0066] 术语“基因编辑”、“基因组编辑”和“基因组工程”在本文中可互换使用,并且是指针对活体有机体的任何遗传信息或基因组的靶向特异性修饰的策略和技术。因此,术语包括基因编辑,但也包括除基因组的基因编码区之外的区域的编辑。它还包括编辑或工程化核(如果存在)以及细胞的其他遗传信息。此外,术语“基因组编辑”和“基因组工程”还包括表观遗传编辑或表观遗传工程,即例如甲基化、组蛋白修饰或可能引起基因表达可遗传改变的非编码RNA的靶向修饰。
[0067] 关于序列或分子的术语“核苷酸”和“核酸”在本文中可互换使用,并且指天然或合成来源的单链或双链DNA或RNA。术语核苷酸序列因此被用于与其长度无关的任何 DNA或RNA序列,使得该术语包含任何包含至少一个核苷酸的核苷酸序列,但也包括任何种类的较大的寡核苷酸或多核苷酸。术语因此是指天然和/或合成的脱氧核糖核酸 (DNA)和/或核糖核酸(RNA)序列,其可以任选地包含合成的核酸类似物。根据本公开内容的核酸可以任选地进行密码子优化。“密码子优化”意味着DNA或RNA的密码子使用适合于感兴趣的细胞或生物体的密码子使用,以改善所述目的细胞或生物体中所述重组核酸的转录速率。本领域技术人员很清楚,归因于密码子的简并性,靶核酸可以在一个位置被修饰,而这种修饰仍然会在翻译后在该位置产生相同的氨基酸序列,这是通过密码子优化实现的考虑靶细胞或生物体的物种特异性密码子使用。根据本申请的核酸序列可以对以下非限制性生物体列表进行特定的密码子优化:大麦(Hordeum vulgare)、双色高粱(Sorghum bicolor)、黑麦(Secale cereale)、黑小麦(Triticale)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italic)、水稻(Oryza sativa)、小粒稻(Oryza minuta)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza a/ta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑小麦(Triticale)、球茎大麦(Hordeum bulbusom)、紫短柄草
(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops 
tauschii)、苹果(Ma/us domestica)、甜菜(Beta vulgaris)、向日葵(Helianthus 
annuus)、Daucus glochidiatus、小胡萝卜(Daucus pusillus)、Daucus muricatus、胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、Erythrante guttata、螺旋狸藻(Genlisea aurea)、美花烟草(Nicotiana sylvestris)、烟草(Nicotiana tabacum)、绒毛状烟草
(Nicotiana tomentosiformis)、本氏烟草 (Nicotiana benthamiana)、番茄(Solanum/
ycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、黄瓜(Cucumis sativus)、川桑(Marus notabilis)、拟南芥(Arabidopsis 
thaliana)、深山南芥(Arabidopsis lyrata)、Arabidopsis arenosa、喜马拉雅鼠
(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠
(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa 
pastoris)、Olmarabidopsis pumila、筷子芥(Arabis hirsute)、欧洲油菜(Brassica 
napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、芥菜(Brassica juncea)、黑芥(Brassica nigra)、萝卜(Raphanus sativus)、Eruca vesicaria subsp.sativa、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、大豆(Glycine max)、棉属(Gossypium sp.)、毛果杨(Populus trichocarpa)、小鼠(Mus musculus)、大鼠(Rattus norvegicus)或人(Homo sapiens)。
[0068] 如本文所用,“非天然”或“非天然存在”或“人工”可指在天然核酸或蛋白质中未发现的核酸或多肽序列、任何其他生物分子如生物素或荧光素。非天然可以指亲和标签。非天然可以指融合。非天然的可以指包含突变、插入和/或缺失的天然存在的核酸或多肽序列。非天然序列可展现和/或编码其中非天然序列被融合的核酸和/或多肽序列也可展现的活
性(例如,酶活性、甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。可通过遗传工程将非天然核酸或多肽序列连接至天然存在的核酸或多肽序列(或其变体)以产生编
码嵌合核酸和/或多肽的嵌合核酸和/或多肽序列。非天然序列可以指3'杂交延伸序列。
[0069] 如本文所用,“核苷酸”因此通常可以指碱-糖-磷酸盐组合。核苷酸可以包含合成核苷酸。核苷酸可以包含合成的核苷酸类似物。核苷酸可以是单体单元的核酸序列(例如,脱氧核糖核酸(DNA)和核糖核酸(RNA))。术语核苷酸可以包括三磷酸核糖核苷三磷酸 (ATP)、三磷酸尿苷(UTP)、三磷酸胞苷(CTP)、三磷酸鸟苷(GTP)和dATP、dCTP、dITP、 dUTP、dGTP、dTTP或其衍生物等脱氧核糖核苷三磷酸。这样的衍生物可以包括,例如但不限于[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP、以及在含有它们的核酸分子上赋予核酸酶抗性的核苷酸衍生物。本文使用的术语核苷酸可以指双脱氧核糖核苷三磷酸 (ddNTPs)及其衍生物。二脱氧核糖核苷三磷酸的说明性实例可以包括但不限于ddATP、 ddCTP、ddGTP、ddITP和
ddTTP。核苷酸可以是未标记的或通过公知的技术可检测地标记的。标记也可以用量子点进行。可检测标记可以包括例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可以包括但不限于荧光素、 5-羧基荧光素(FAM)、2'7'-5二甲氧基-4'5-二氯-6-羧基荧光素(JOE)、若丹明、6-羧基罗丹明(R6G)、N,N,N',N'-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)、4-(4'-二甲基氨基苯偶氮基)苯甲酸(DABCYL)、Cascade Blue、Oregon Green、Texas红、花青和 5-(2'-氨乙基)氨基-1-磺酸(EDANS)。
[0070] 如本文所用,“融合物”可以指包含一个或多个非天然序列(例如部分)的蛋白质和/或核酸。融合可以位于修饰蛋白的N-末端或C-末端,或两者,或在分子内作为单独的结构域。对于核酸分子,融合分子可以在5'或3'末端或其间任何合适的位置连接。融合可以是转录和/或翻译融合。融合物可以包含一个或多个相同的非天然序列。融合物可以包含一个或更多个不同的非天然序列。融合物可以是嵌合物。融合物可以包含核酸亲和标签。融合物可以包含条形码。融合物可以包含肽亲和标签。融合物可以提供位点特异性效应物或碱基编辑的亚细胞定位(例如,用于靶向细胞核的核定位信号 (NLS)、用于靶向线粒体的线粒体定位信号、用于靶向至叶绿体的叶绿体定位信号、内质网(ER)滞留信号等)。融合物可提供可用于追踪或纯化的非天然序列(例如亲和标签)。融合可以是小分子如生物素或染料,如alexa荧光染料、Cyanine3染料、Cyanine5 染料。融合可以提供增加的或降低的稳定性。在一些实施方案中,融合可包含可检测标记,包括可提供可检测信号的部分。可以提供可检测信号的合适的可检测标记和/或部分可以包括但不限于酶、放射性同位素、特异性结合对的成员;荧光团;荧光报道分子或荧光蛋白;量子点等等。融合物可以包含FRET对的成员或荧光团/量子点供体/受体对。融合物可以包含酶。合适的酶可以包括但不限于辣根过氧化物酶、萤光素酶、β-25半乳糖苷酶等。融合物可以包含荧光蛋白。合适的荧光蛋白可以包括但不限于绿色荧光蛋白(GFP)(例如来自维多利亚水母(Aequoria victoria)的GFP,来自日本鳗鲡 (Anguilla japonica)的荧光蛋白或其突变体或衍生物)、红色荧光蛋白、黄色荧光蛋白、黄绿色荧光蛋白(例如,来自头孢克洛毛状苔藓的四聚体荧光蛋白的mNeonGreen)、任何各种荧光和有色蛋白。融合物可以包含纳米颗粒。合适的纳米粒子可以包括荧光或发光纳米粒子,以及可选地连接至纳米粒子的磁性纳米粒子或纳米金刚石。可以检测纳米粒子的任何光学或磁性性质或特征。融合物可包含解旋酶、核酸酶(例如FokI)、核酸内切酶、核酸外切酶(例如5'外切核酸酶和/或3'外切核酸酶)、连接酶、切口酶、核酸酶-解旋酶(例如Cas3)、DNA甲基转移酶(例如Dam)或DNA脱甲基酶、组蛋白甲基转移酶、组蛋白脱甲基酶、乙酰化酶(包括例如但不限于组蛋白乙酰化酶)、脱乙酰酶(包括例如但不限于组蛋白脱乙酰酶)、磷酸酶、激酶、转录(共)激活剂、转录(共)因子、 RNA聚合酶亚基、转录阻遏物、DNA结合蛋白、DNA结构化蛋白、长的非编码 RNA、DNA修复蛋白(例如参与修复单链和/或双链断裂的蛋白质,例如涉及碱基切除修复、核苷酸切除修复、错配修复、NHEJ、HR、微同源性介导的末端连接(MMEJ)和/ 或可选的非同源末端连接(ANHEJ)的蛋白,例如但不限于HR调节剂和HR复合物组装信号)、标记蛋白、报道蛋白、荧光蛋白、配体结合蛋白(例如mCherry或重金属结合蛋白)、信号肽(例如Tat-信号序列)、靶向性蛋白或肽、亚细胞定位序列(例如,核定位序列,叶绿体定位序列)和/或抗体表位,或其任何组合。
[0071] 本文所用的术语“催化活性片段”指的是氨基酸序列,其是指从给定模板氨基酸序列或编码其的核酸序列衍生的核心序列,包含模板序列的全部或部分活性位点,条件是所得到的催化活性片段仍具有天然酶或其变体的活性位点负责的表征模板序列的活性。所述修饰适于产生仍具有与模板序列相同活性的较小体积氨基酸序列,使得催化活性片段成为空间上不太苛刻的更通用或更稳定的工具。
[0072] 本文公开的任何位点特异性核酸酶的“变体”代表与相应野生型位点特异性核酸酶相比包含至少一个突变、缺失或插入的分子,以改变天然存在的野生型酶的活性。作为非限制性例子,“变体”可以是催化失活的Cas9(dCas9),或已被修饰以用作切口酶的位点特异性核酸酶。
[0073] 如本文所用,术语“递送构建体”或“递送载体”是指用作用于运输感兴趣的核酸 (包含RNA和DNA的杂交核酸)和/或氨基酸序列货物进入靶细胞,优选真核细胞的任何生物或化学手段。本文所用的术语“载体”指递送本公开所述遗传或重组构建体到靶细胞、组织、器官或植物的转运工具。载体因而包括核酸序列任选包括序列如调控序列或定位序列以用于直接或间接递送到感兴趣靶细胞或植物所需细胞区室中的植物靶结构。载体也能用于引入氨基酸序列到靶细胞或靶结构。通常,本文所用的载体可以是质粒载体。术语“直接引入”指将含有本公开所述待修饰核酸序列的所需靶细胞或靶结构直接转化或转导或转染到感兴趣的特定靶细胞,其中用载体递送的材料会发挥其作用。术语“间接引入”指在某一结构(例如叶的细胞或者植物器官或组织的细胞)中实现引入,其自身不代表待转化的实际感兴趣靶细胞或结构,但这些结构用作系统性传播和转移载体 (优选包括本公开所述遗传构建体)到实际植物靶结构(例如分生细胞或组织)的基础。在术语“载体”用于转染氨基酸序列到靶细胞的上下文中,术语“载体”指用于肽或蛋白转染的合适试剂,例如离子脂质混合物、细胞穿透肽(CPP)或粒子轰击。在引入核酸物质的上下文中,术语载体不能仅指质粒载体,而且指合适载体材料,其能用作引入核酸和/或氨基酸序列递送到感兴趣靶细胞的基础,例如通过粒子轰击方式。所述载体材料包括金或钨粒子。最后,术语载体也指病毒载体在引入至少一种本公开所述遗传构建体中的应用,例如改良病毒,如获自以下病毒株:腺病毒或腺相关病毒(AAV)载体、慢病毒载体、单纯疱疹病毒(HSV-1)、牛痘病毒、仙台病毒、辛德毕斯病毒、塞姆利基森林甲病毒、EB病毒(EBV)、玉米条纹病毒(MSV)、大麦条纹花叶病毒(BSMV)、雀麦草花叶病毒(BMV,登录号:RNA1:X58456;RNA2:X58457;RNA3:X58458)、玉米斑纹病毒 (MSpV)、玉米雷亚多非纳病毒(MYDV)、玉米黄矮病毒(MYDV)、玉米矮小花叶病毒 (MDMV)、甜菜坏死黄脉病毒科的正链RNA病毒如甜菜坏死黄色叶脉病毒(登录号: RNA1:NC_003514;
RNA2:NC_003515;RNA3:NC_003516;RNA4:NC_003517),或雀麦花叶病毒科的正链RNA病毒如苜蓿花叶病病毒属病毒(登录号:RNA1:NC_001495; RNA2:NC_002024;RNA3:NC_002025),或雀麦花叶病毒属的正链RNA病毒如BMV(同上),或南瓜花叶病毒属的正链RNA病毒如黄瓜花叶病毒(登录号:RNA1:NC_002034; RNA2:NC_002035;RNA3:NC_001440),或油橄榄病毒属的正链RNA病毒,花椰菜花叶病毒科的dsDNA病毒,尤其是Badnavirus或Caulimovirus科,如不同香蕉条纹病毒(例如登录号:NC_007002,NC_015507,NC_006955或NC_003381)或花椰菜镶嵌病毒(登录号:NC_001497),或木薯脉花叶病毒属、碧冬茄病毒属、Rosadnavirus、
Solendovirus、大豆褪绿斑驳病毒属或东格鲁病毒属的病毒,长线形病毒科的正链RNA病毒如葡萄卷叶病毒属、毛形病毒属的正链RNA病毒,例如莴苣侵染性黄化病毒(登录号:RNA1: NC_003617;RNA2:NC_003618)或番茄褪绿病毒(登录号:RNA1:NC_007340;RNA2: NC_
007341),长线形病毒如甜菜黄化病毒(登录号:NC_001598),或隐症病毒,单链DNA (+/-)双生病毒科病毒如甜菜曲顶病毒科、菜豆金黄花叶病毒科的病毒,例如菜豆金黄花叶病毒、烟草曲茎病毒、烟草斑驳病毒、番茄褪绿斑驳病毒、番茄矮叶病毒、番茄金花叶病毒、番茄卷叶病毒、番茄斑驳病毒、或番茄黃斑病毒,或曲顶病毒属的双生病毒科如甜菜曲顶病毒或番茄伪曲顶病毒属、Turncurtvirus或玉米线条病毒属的双生病毒科,例如玉米条纹病毒(同
上)、烟草黄矮病毒、小麦矮缩病毒、黄症病毒科的正链RNA病毒如黄矮病毒属的正链RNA病毒例如大麦黄矮病毒-PA V(登录号:NC_004750),或马铃薯卷叶病毒属的正链RNA病毒如马铃薯卷叶病毒(登录号:NC_001747),矮化病毒科的单链DNA病毒,包括矮缩病毒属或香蕉束顶病毒属,分体病毒科的双链RNA病毒,包括甲型双分病毒科、乙型双分病毒科或丁型双分病毒科,马铃薯纺锤形茎类病毒科的类病毒,马铃薯Y病毒科的正链RNA病毒如包括布兰布Y病毒属、大麦黄花叶病毒属、甘薯病毒属、柘橙病毒属、禾本科病毒属,例如小麦花叶病毒(登录号:NC_012799),或马铃薯Y病毒属的马铃薯Y病毒科如甜菜花叶病毒(登录号:NC_
005304)、玉米矮小花叶病毒(登录号:NC_003377)、马铃薯Y病毒(登录号:NC_001616)或玉米花叶病毒(登录号:NC_018833),或花叶病毒属的马铃薯Y病毒科如雀麦线条病毒(登录
号:NC_003501) 或小麦线条花叶病毒(登录号:NC_001886),假病毒科的单链RNA病毒如假病毒属或塞尔病毒属的单链RNA病毒,呼肠病毒科的双链RNA病毒如水稻矮缩病毒(登录号:
RNA1: NC_003773;RNA2:NC_003774;RNA3:NC_003772;RNA4:NC_003761;RNA5: NC_003762;
RNA6:NC_003763;RNA7:NC_003760;RNA8:NC_003764;RNA9: NC_003765;RNA10:NC_003766;
RNA11:NC_003767;RNA12:NC_003768),番茄丛矮病毒科的正链RNA病毒如包括甲型坏死病毒属、黄金葛病毒属,乙型坏死病毒属、香石竹斑驳病毒属、香石竹病毒属、画眉草病毒属、假龙舌兰坏死线条病毒属、玉米褪绿斑驳病毒属、黍花叶病毒属、番茄丛束矮病毒属、幽影病毒属或玉米病毒属例如玉米坏死条纹病毒(登录号:NC_007729),或帚状病毒科的正链
RNA病毒如真菌传杆状病毒属、大麦病毒属的病毒例如大麦条斑花叶病毒(登录号:RNA1:
NC_003469;RNA2: NC_003481;RNA3:NC_003478),或花生丛簇病毒属、马铃薯病病毒属、烟草花叶病毒属或烟草脆裂病毒的病毒例如烟草脆裂病毒(登录号:RNA1:NC_003805;RNA2: NC_00381 1),以及单分子负链RNA病毒目的负链RNA病毒,尤其是弹状病毒科的负链RNA病毒如大麦黄化条矮病毒(登录号:KM213865)或莴苣坏死黄化病毒(登录号/样本:NC_
007642/AJ867584),微RNA病毒目的正链RNA病毒,尤其是伴生豇豆病毒科的正链RNA病毒如豇豆花叶病毒属、蚕豆病毒属、线虫传多面体病毒属、Cheravirus、温州蜜柑矮缩病毒属、伴生病毒属、番茄灼烧病毒属或矮化病毒属的正链RNA病毒,芜菁黄花叶病毒目的正链RNA病毒,尤其是α线性病毒科的正链RNA病毒,如青葱 X病毒属、黑麦草潜隐病毒属、柑橘病毒属或马铃薯X病毒属的病毒,芜菁黄花叶病毒尤其是乙型线形病毒科,如毛状病毒属、香石竹潜病毒属、柑橘病毒属、凹陷病毒属、马铃薯T病毒属或葡萄病毒属的病毒,芜菁黄花叶病毒目的正链RNA病毒,尤其是芜菁黄花叶病毒科的正链RNA病毒,如葡萄斑点病毒目、玉米雷亚朵非纳病毒目或芜菁黄花叶病毒目的病毒,以及细菌载体,例如农杆菌,如根瘤农杆菌。最后,术语载体也指合适的化学转运剂,其用于与物理引入方法联合将线性核酸序列(单或双链)引入到靶细胞内,包括基于聚合物或脂质的递送构建体。
[0074] 因此合适的递送构建体或载体包含用于将核苷酸序列递送到靶细胞的生物学手段,包括病毒载体、农杆菌属,或化学递送构建体,包括纳米颗粒,例如中孔二氧化纳米颗粒(MSNPs),阳离子聚合物包括基于PEI(聚乙烯亚胺)聚合物的方法或聚合物如 DEAE-葡聚糖,或非共价表面附着PEI以产生阳离子表面、脂质或聚合物囊泡,或其组合。脂质或聚合物囊泡可以选自例如脂质、脂质体、脂质包封系统、纳米颗粒、小核酸 -脂质颗粒制剂、聚合物和聚合物囊泡。
[0075] 本文所用的术语“遗传构建体”或“重组构建体”指包括以下的构建体:质粒或质粒载体、粘粒、人工酵母-或细菌人工染色体(YAC和BAC)、噬菌粒、基于噬菌体的载体、表达盒、分离的单链或双链核酸序列(含DNA和RNA序列)或氨基酸序列、包括修饰病毒在内的病毒载体,和其组合或混合物,用于引入或转化、转染或转导到任何原核或真核靶细胞,包括本公开所述植物、植物细胞、组织、器官或材料。本公开所述重组构建体能包括采用核酸或氨基酸序列形式的效应结构域,其中所述效应结构域代表分子,其能在靶细胞中产生影响并包括转基因、单链和双链RNA分子(包含向导RNA((s)gRNA)、 miRNA或siRNA),或氨基酸序列(包括酶或其催化活性片段、结合蛋白、抗体、转录因子、核酸酶,优选位点特异性核酸酶)等。此外,重组构建体能包括调节序列和/或定位序列。重组构建体能纳入载体,包括质粒载体,和/或可与载体结构分离存在,例如采用多肽序列形式或作为非载体相连单链或双链核酸。其例如通过转化引入后,遗传构建体可例如采用双链或单链DNA、双链或单链RNA形式或作为氨基酸序列保持在染色体外,即未整合入靶细胞基因组。或者,本公开所述遗传构建体或其部分能稳定整合入靶细胞基因组,包括靶细胞核基因组或其它遗传元件,包含质体如线粒体或叶绿体的基因组。用于此关系的术语质粒载体指最初获自质粒的遗传构建体。质粒通常指自主复制的环形染色体外元件,采用双链核酸序列形式。在遗传工程领域,这些质粒常规通过插入来接受靶向修饰,插入例如编码抵御抗生素或除草剂抗性的基因、编码靶核酸序列的基因、定位序列、调节序列、标签序列、包括抗生素标记或荧光标记在内的标记基因等。维持初始质粒的结构组件,如复制起点。根据本发明的某些实施方式,所述定位序列能包括核定位序列、质体定位序列(优选线粒体定位序列或叶绿体定位序列)。所述定位序列对植物生物技术领域的技术人员而言是可用的。用于不同感兴趣靶细胞的多种质粒载体市售可得且其修饰为各领域技术人员已知。
[0076] 术语“遗传修饰”或“遗传操作”或“遗传操纵”在本文中以广义使用并指通过人为干预完成的任意修饰核酸序列或氨基酸序列、靶细胞、组织、器官或生物体,直接或间接影响靶细胞、组织、器官或生物体的内源遗传物质或转录组或蛋白质组从而以目的性方式修饰其,使得其不同于无人为干预时发现的状态,而术语基因组编辑特定指靶向操作靶细胞基因组。人为干预可在体外或体内发生,或两者同时发生。例如,更多修饰可包括一个或多个点突变如用于靶向蛋白工程或密码子优化、缺失,以及至少一个核酸或氨基酸分子(也包括同源重组)的一个或多个插入或缺失、核酸或氨基酸序列的修饰,或其组合。该术语也应包括核酸分子或氨基酸分子或宿主细胞或生物体(包含植物或其植物材料),其与天然存在的相当序列、生物体或材料类似,但其已通过至少一个目的性操作步骤构建。
[0077] 本文所用的“靶向遗传操作”或“靶向”或“定点”基因编辑或基因组编辑因而是“遗传操作”的结果,其通过靶向方式(即靶细胞中的至少一个特定位置且在特定合适环境下) 产生影响以在至少一个待操作细胞(优选植物细胞)内实现所需效果。
[0078] 根据本公开使用的术语“转基因”是指包含基因或遗传构建体的动物、动物细胞、组织或器官、植物、植物细胞、组织、器官或材料,其包含已通过自然方式或通过来自另一生物体的遗传工程技术转移到植物、植物细胞、组织器官或材料中的转基因。术语“转基因”包括核酸序列,包括DNA或RNA或其组合或混合。因此,术语“转基因”不限于通常鉴定为基因的序列,即编码蛋白质的序列。它还可以指例如非编码蛋白质的 DNA或RNA序列。因此,术语转基因通常意味着引入感兴趣的细胞的相应核酸不天然存在于相应的靶原核或真核细胞中,所述靶原核或真核细胞包括细菌细胞、酵母细胞、真菌细胞、动物或动物细胞、植物、植物细胞、组织、器官或材料。因此,本文所用的术语转基因或转基因的是指通过分子生物学、遗传学等人工技术,从一个生物体的基因组中取出或合成产生的核酸序列或氨基酸序列,并然后以瞬时或稳定的方式引入另一个生物体。
[0079] 本文所用的术语“植物”或“植物细胞”指植物生物体、植物器官、分化与未分化的植物组织、植物细胞、种子以及其衍生物和后代。例如,植物细胞包括但不限于来自以下的细胞:种子、来自成熟和未成熟胚胎、分生组织、籽苗、不同状态的愈伤组织、叶、花、根、芽、配子体、孢子体、花粉、花粉管和小孢子、原生质体、大型藻类和微藻类。不同的植物细胞可以是单倍体、二倍体、四倍体、六倍体或多倍体
[0080] 本文所用的“对象”可指人或非人动物。术语包括但不限于哺乳动物(如人、其它灵长类、猪、啮齿动物(如小鼠和大鼠或仓鼠)、兔、豚鼠、牛、马、猫、狗、绵羊和山羊)。在一个实施方式中,所述对象是人。
[0081] 本文所用的“治疗(treat)”、“治疗(treating)”和“治疗(treatment)”一般指获得所需药理和 /或生理效应。所述效应可以是预防性的,形式为完全或部分预防疾病或其症状,和/或可以是治疗性的,形式为部分或完全治愈疾病和/或归因于疾病的不良效果。本文所用的“疗法”涵盖哺乳动物中的任何疾病或症状疗法,且包括:(a)预防对象出现疾病或症状,所述对象可能易产生疾病或症状,但尚未诊断具有其;(b)抑制疾病或症状,即阻滞其发展;或(c)缓解疾病,引起疾病消退。治疗剂可在疾病或损伤之前、其间或之后施用。对治疗持续性疾病尤其感兴趣,其中治疗使患者不需要的临床症状稳定或减少。这种治疗需要在受影响组织功能完全丧失前进行。该主题疗法需要在疾病的症状期中施用,且一些情况中是在疾病的症状期后。
[0082] 本文所用的“植物材料”指能在任何发育阶段中获自植物的任何材料。植物材料可植物原位获得或者来自植物或其植物组织或器官的体外培养物。该术语因而包括植物细胞、组织和器官及发育的植物结构以及亚细胞成分如核酸、多肽和所有化学植物物质或代谢物,其能在植物细胞或区室内发现和/或能由植物生成,或其能获自任何植物细胞、组织或任意发育阶段植物的提取物。该术语还包括植物材料的衍生物如原生质体,其衍生自植物材料所含的至少一个植物细胞。因此,该术语还包括植物的分生细胞或分生组织。
[0083] 本文所用的术语“突变”和“修饰”可互换使用,指体外或体内核酸操作背景下缺失、插入、添加、取代、编辑、链断裂和/或引入加合物。缺失定义为核酸序列变化,其中一个或多个核苷酸不存在。插入或添加是核酸序列变化,引起一个或多个核苷酸加入。“取代”或编辑产生自分子对一个或多个核苷酸的取代,所述分子是不同于被取代一个或多个核苷酸的分子。例如,核酸可由不同核酸取代,例如胞嘧啶、腺嘌呤、鸟嘌呤或尿苷取代胸腺嘧啶。嘧啶取代嘧啶(如C-T或T-C的核苷酸取代)或嘌呤取代嘌呤(如G-A或 A-G的核苷酸取代)定义为转换,而嘧啶取代嘌呤或嘌呤取代嘧啶(如G-T或G-C或A-T 或A-C)定义为颠换。或者,核酸可由修饰的核酸取代,例如由胸腺嘧啶二醇取代胸腺嘧啶。突变可导致错配。术语错配指2个核酸之间的非共价相互作用,各核酸位于不同核苷酸序列或核酸分子,这不遵从碱基配对规则。例如,对于部分互补序列5'-AGT-3' 和5'-AAT-3',存在G-A错配(转换)。
[0084] 涉及双链核酸序列如作为DNA靶序列的基因组序列时,术语“链断裂”包括单链断裂和/或双链断裂。单链断裂(缺口)指双链核酸序列中2条链之一的中断。这与双链断裂相反,后者指双链核酸序列中2条链的中断。本公开所述链断裂可使用合适的核酸内切酶(包括CRISPR核酸内切酶或其变体,其中所述变体可以是突变或截断形式的野生型蛋白或核酸内切酶,其能发挥野生型蛋白的酶功能)通过酶切在感兴趣的核酸碱基位置引入双链核酸序列。
[0085] 本文所用的“互补”或“互补性”描述2种DNA、2种RNA之间的关系,或涉及本发明所述杂交序列时,RNA与DNA核酸区之间的关系。由DNA或RNA的核酸碱基定义,2个核酸区能根据锁钥模型彼此杂交。为此,沃森克里克碱基配对原理分别具有腺嘌呤和胸腺嘧啶/尿嘧啶以及鸟嘌呤和胞嘧啶作为互补碱基的基础。此外,本文所用的术语“互补”也包括非沃森克里克配对,如反沃森克里克、Hoogsteen、反Hoogsteen和Wobble 配对,只要各碱基对能彼此建立氢键,即2条不同核酸链能基于所述互补性彼此杂交。不需要在给定长度上彼此100%对齐的两个序列延伸意义上的完美互补,因为本领域技术人员意识到核酸杂交受以下因素的影响:诸如核酸之间的互补程度和长度、所涉及条件的严格性、形成的杂交的Tm和核酸内的G:C比等。此外,空间因素可以影响两个序列即使彼此不是100%互补也将杂交的事实。因此,根据本发明的两个互补核酸序列可具有至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、在至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少 98%或至少
99%的彼此的序列同源性或互补性,并且在约中等严格条件下仍然可以彼此杂交。“中等”严格条件是指在低于Tm 20至29℃的温度范围内的0.165-0.330M NaCl,其中Tm定义为可以通过常用的计算来估计的DNA序列的Tm:
[0086] Tm=81.5+16.6log10([Na+]/1.0+0.7[Na+])+0.41(%[G+C])-(500/n)-P-F,其中[0087] Tm=以℃表示的熔融温度,[Na+]=钠离子的摩尔浓度,%[G+C]=DNA序列中G +C碱基的百分比,n=碱基中DNA序列的长度,P=%错配碱基对的温度校正(每1%错配约1℃),F=甲酰胺浓度校正(=0.63℃每1%[甲酰胺])。
[0088] 本文所用的术语“瞬时引入”指有或没有借助递送载体地向靶结构如植物细胞瞬时引入本公开所述至少一个核酸序列,优选纳入递送载体或重组构建体,其中所述至少一个核酸序列在合适反应条件下引入,从而基因组作为整体而言,未出现所述至少一个核酸序列整合入靶结构的内源核酸物质,使得所述至少一个核酸序列未整合入靶细胞的内源DNA。因此,在瞬时引入的情况中,所引入的遗传构建体不遗传到靶结构(例如原核,动物或植物细胞)的后代。产生自转录或翻译的至少一个核酸序列或产物仅采用组成型或诱导型形式短暂存在,即以瞬时方式,并因而仅能在靶细胞中有活性以在有限时间内发挥其效果。
由此,经瞬时引入而引入的至少一个核酸序列不会遗传到细胞后代。然而,以瞬时方式引入的核酸序列效果可能会遗传到靶细胞后代。
[0089] 本文所用的术语“稳定整合”或“稳定整合的”指本公开所述至少一个核酸序列稳定整合,优选纳入递送载体或重组构建体。整合可在感兴趣真核细胞区室内靶细胞的核基因组或任何其它基因组核外物质中发生,如线粒体或植物细胞质体。因此,稳定整合的至少一个重组构建体可遗传到如此经修饰靶细胞的后代。根据遗传构建体的性质,所有或部分遗传构建体会稳定整合,因为遗传构建体可包括数个感兴趣区域,包含待稳定整合的靶区域以及用于植物细胞内遗传构建体的转运、递送、维持和正确定位所需的其它区域,然而,该区域本身不整合,但用作待稳定整合的感兴趣区域的载货设备,正如本领域技术人员已知。本公开所述至少一个遗传构建体稳定整合入至少一个造血或分生细胞或组织,会因而引起如此修饰的靶结构基因组区域即DNA靶区域通过所述至少一个造血或分生细胞的所有发育阶段来遗传到改良细胞的后代,这可能有利于处理方法,其中需要产生自至少一个造血分生细胞分化和发育的终细胞类型的靶向遗传修饰和收率。例如,实现稳定整合入植物幼穗的至少一个分生细胞能因而引起所引入遗传特征稳定遗传到花粉或胚珠发育的配子,其产生自幼穗的至少一个分生细胞。稳定整合入至少一个多能造血细胞或者任何多能或多潜能细胞同样会引起所引入遗传特征的稳定遗传。
[0090] 本文所用的术语“粒子轰击”也称为生物弹道转染或微粒介导的基因转移,指向靶细胞或组织转移包被微粒或纳米粒子的物理递送方法,所述粒子包含感兴趣核酸或遗传构建体。微粒和纳米粒子用作射弹并在感兴趣靶结构上高压点火,使用合适装置,通常称为“基因枪”。经粒子轰击转化使用覆盖有感兴趣基因的金属微弹,其随后在靶细胞上用称为“基因枪”(Sandford等.1987)的设备高速发射,速度快到足以穿透靶组织的细胞壁,但未尖锐到足以导致细胞死亡。对于其细胞壁完全移除的原生质体,条件在逻辑上不同。至少一个微弹上的沉淀核酸或遗传构建体在轰击后释放到细胞内,并根据上面给定的定义瞬时整合入基因组或表达。微弹加速通过高压放电或压缩气体(氦)完成。关于所用金属粒子,强制要求其无毒、无反应性,且其具有小于靶细胞的直径。最常用金或钨。有大量来自基因枪和涉及其一般用途的相关系统的厂商以及供应商的公开可得信息。
[0091] 在原核或真核细胞优选动物细胞且更优选本公开所述植物或植物细胞或植物材料的背景下,本文所用的术语“衍生物”或“后裔”或“后代”涉及这种细胞或材料的后裔,其产生自包括有性繁殖和无性繁殖在内的自然生殖繁育。本领域技术人员熟知,所述繁殖能导致突变引入生物体基因组,这由产生后裔或后代的自然现象引起,所述后裔或后代的基因组不同于亲代生物体或细胞,然而仍属于同一属/物种并具有与亲代重组宿主细胞大致相同的特征。因此,本公开的术语包括这类由生殖或再生期间自然现象引起的衍生物或后裔或后代。此外,在物质或分子的背景下,术语“衍生物”可指直接或通过修饰间接获自另一物质或分子,而不是指细胞或生物体。这可能指衍生自细胞或植物代谢物的核酸序列,所述代谢物获自细胞或材料。因此,这些术语不是指任何任意的衍生物、后代或祖代,而是指与亲代细胞或病毒或其分子系统发生相关即基于亲代细胞或病毒或其分子的衍生物、后代或祖代,衍生物、后代或祖代以及“亲本”之间的关系明显可由本领域技术人员推断。
[0092] 此外,本文在生物学序列(核酸或氨基酸)或分子或复合物的上下文中使用的术语“衍生”、“衍生自”或“衍生物”暗示相应序列基于参考序列,例如来自序列表,或数据库登录号,或相应的支架结构,即源自所述序列,而参考序列可包含更多序列,例如病毒的全基因组或完整多蛋白编码序列,而“衍生自”天然序列的序列可以仅包含其一个分离的片段或其连续片段。在这种情况下,cDNA分子或RNA可以说是“衍生自”作为分子模板的DNA序列。因此,本领域技术人员可以容易地定义“衍生自”参考序列的序列,其将通过DNA或氨基酸水平上的序列比对与相应的参考序列具有高度相同性,并且将与相应的参考序列具有一致的DNA/氨基酸连续延伸(对于比对的分子给定长度,>75%的查询相同性,条件是衍生的序列是查询序列并且参考序列表示序列比对期间的对象)。本领域技术人员因此可以基于本文提供的公开内容通过聚合酶链式反应等将相应序列克隆到合适的感兴趣的载体系统中,或使用序列作为载体支架。因此,术语“衍生自”不是任意序列,而是与其衍生的参考序列相对应的序列,而某些差异(例如在宿主细胞内复制重组构建物期间天然发生的某些突变)不能被排除并且因此包含于术语“衍生自”。此外,来自亲本序列的几个序列段可以连接在从亲本衍生的序列中。不同的片段与亲本序列具有高(优选高于90%)甚至100%的同源性。本领域技术人员很清楚,当提供或部分提供为核酸序列时,根据本发明的人工分子复合物的序列然后将被转录并任选地在体内翻译并且可能在宿主细胞内被进一步消化和/或加工 (信号肽的切割,内源性生物素化等),使得术语“衍生自”表示与根据本发明的公开的原始使用的序列的相关性。
[0093] 本文所用的术语“靶区域”、“靶位点”、“靶结构”、“靶构建体”、“靶核酸”或“靶细胞 /组织/生物体”或“DNA靶区域”指可以是靶细胞任何区室内任意基因组区域的靶标。
[0094] 本文所用的术语“调节序列”指能指导感兴趣核酸序列转录和/或翻译和/或修饰的核酸或氨基酸序列。
[0095] 术语“蛋白”、“氨基酸”或“多肽”在本文中可互换使用并指具有催化酶功能或者结构或功能效应的氨基酸序列。术语“氨基酸”或“氨基酸序列”或“氨基酸分子”包括任何天然或化学合成的蛋白、肽、多肽和酶或修饰蛋白、肽、多肽和酶,其中术语“修饰”包括蛋白、肽、多肽和酶的任何化学或酶修饰,包括野生型序列截断成更短但仍具有活性的部分。
[0096] 根据本发明,可以使用本领域技术范围内的常规分子生物学、微生物学和重组DNA 技术。这些技术在文献中有充分说明。参见,例如,Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,Second Edition(1989)Cold Spring Harbor Laboratory Press, Cold Spring Harbor,New York(本文为“Sambrook等,1989”);DNA Cloning:A Practical Approach,Volumes I and II(D.N.Glover ed.1985);Oligonucleotide Synthesis(M.J.Gait ed. 1984);Nucleic Acid Hybridization(B.D.Hames&SJ.Higgins eds.(1985);Transcription and Translation(B.D.Hames&S.J.Higgins,eds.(1984);
Animal Cell Culture(Rl.Freshney, ed.(1986);Immobilized Cells and Enzymes(IRL Press,(1986);B.Perbal,A Practical Guide To Molecular Cloning(1984);
F.M.Ausubel et al.(eds.),Current Protocols in Molecular Biology,John Wiley&
Sons,Inc.(1994);等。
[0097] 每当本公开涉及核酸或氨基酸序列的同源性或相同性的百分比时,这些值限定了通过使用EMBOSS Water配对序列比对(核苷酸)程序(www.ebi.ac.uk/Tools/psa /emboss_water/nucleotide.html)核酸或用于氨基酸序列的EMBOSS Water配对序列比对 (蛋白质)程序(www.ebi.ac.uk/Tools/psa/emboss_water/)。由欧洲分子生物学实验室 (EMBL)欧洲生物信息学研究所(EBI)提供的用于局部序列比对的工具使用修改的 Smith-Waterman算法(参见www.ebi.ac.uk/Tools/psa/和Smith,TF&Waterman,MS“通用分子子序列的鉴定”Journal of Molecular Biology,1981 147(1):195-197)。进行对齐时,使用由EMBL-EBI定义的默认参数。这些参数是(i)对于氨基酸序列:矩阵= BLOSUM62,空位开放罚分=10和空位延伸罚分=0.5或(ii)对于核酸序列:矩阵=DNA 满,空位开放罚分=10和空位延伸罚分=0.5。
[0098] 发明详述
[0099] 根据本发明的第一方面,提供了一种人工分子复合物,其包含(a)至少一个位点特异性核酸酶(SSN)或其催化活性片段或编码其的核酸序列,并且直接与(b)至少一个修复模板对接结构域(RTDD)或编码其的核酸序列相互作用,其中所述修复模板对接结构域被配置为直接与至少一个修复模板核酸序列(RT)相互作用;(c)任选地包含至少一个相互作用结构域(IA)或编码其的核酸序列,其中所述至少一个相互作用结构域直接与所述至少一个位点特异性核酸酶或其催化活性片段相互作用,和其中所述至少一个相互作用结构域被配置为提供选自由以下组成的组的至少一种功能:(i)与所述至少一个修复模板对接结构域相互作用;和/或(ii)与所述至少一个修复模板核酸序列相互作用;和/或(iii)与基因组DNA序列特异性相互作用;其中所述至少一个修复模板核酸序列包含至少一个与至少一个基因组互补序列互补的部分,并且其中所述至少一个修复模板核酸序列被配置为介导DNA靶序列的修复。
[0100] 因此,本发明依赖于位点特异性核酸酶(SSN)。该核酸酶的特征在于具有核酸酶功能和DNA识别功能。所述DNA识别功能可以是介导DNA识别或结合的结构域形式的核酸酶固有的,或者可以通过额外的向导分子辅助,例如用于核酸向导的CRISPR(RNA 向导的)或Argonaute(DNA向导的)核酸酶,但本发明不限于使用上述核酸向导的核酸酶,并因此增加了靶向基因组工程应用于任何非CRISPR或Argonaute位点特异性核酸酶的范围。根据本发明的人工系统的另一部分是至少一个修复模板核酸序列(RT),因为本公开的产品和方法主要集中在使得RT在由SSN诱导的双链断裂位点处物理可用。此外,本发明依赖于修复模板对接结构域(RTDD)作为优化的分子系统的一部分。该RTDD实现了直接或间接使SSN和至少一个RT紧密接触以允许有效和靶向的基因组工程的功能。
[0101] 因此,RTDD与RT共价或非共价缔合,即它在分子水平上直接与RT相互作用。同时,所述RTDD直接与所述至少一个SSN相互作用,并因此代表所述SSN和所述RT 之间的连接分子或结构域。对于所述RTDD,有几种可能的配置。在一个实施例中,所述RTDD直接与所述SSN缔合。例如,如果所述SSN是CRISPR核酸酶,则所述RTDD 可以是gRNA,或者如果所述SSN是Argonaute核酸酶,则所述RTDD可以是gDNA。在另一实施例中,所述RTDD可以是SSN本身的一部分,或者它可以是所述RT的一部分,所述RTDD表示所述RT或所述SSN的特定部分。在这些实施方案中,所述SSN 可以包含作为其氨基酸序列的一部分的结构域,其可以与携带RT的适体相互作用。因此,在某些实施方案中,不存在单独的相互作用结构域,因为所述位点特异性核酸酶本身包含用于与RTDD相互作用的结构域。因此,所述RTDD可以是与所述RT核酸序列缔合的适体,其中所述适体被识别并因此可以特异性地与所述SSN和/或额外的相互作用结构域相互作用。
[0102] 此外,根据本发明设想了所述人工分子复合物的组分之间的共价和非共价相互作用。
[0103] 在进一步的实施方案中,所述人工分子复合物包含额外的相互作用结构域(IA)。在该配置中,对于某些实施例,所述RTDD可以与所述额外的相互作用结构域缔合。所述相互作用结构域直接相互作用,即与所述SSN共价地作为融合分子或非共价地与SSN 物理缔合,并为所述分子复合物提供额外的功能。所述相互作用结构域可以是包含DNA 识别/结合功能的蛋白质结构域,即它可以是能够以位点特异性方式与基因组DNA靶位点相互作用的结构域,或者所述相互作用结构域可以特异性地配置为与RDTT和/或所述RT相互作用。例如,所述相互作用结构域可以包含固有的DNA识别和结合功能,而不具有核酸酶功能本身以与基因组DNA特异性相互作用。在另一个实施例中,如下面进一步详述的,所述相互作用结构域可以用作与RT缔合的RTDD的高度特异性相互作用伴侣。通过添加相互作用结构域将这种额外的DNA识别或RTDD相互作用功能添加到分子复合物中,除了单独的仅有SSN的功能之
外,还提供了对基因组工程的另一水平的特异性。
[0104] 最后,特别是下文详述的所述RTDD直接与RT以及进一步的相互作用结构域相互作用提供了一种通用的工具包,以(i)使RT与感兴趣的SSN紧密接触,并从而紧密接近由所述至少一个SSN诱导的双链断裂来以人工分子复合物的形式提供分子系统,所述人工分子复合物具有(ii)适用于真核生物和原核生物中的各种定制基因组工程方法的优异的靶向范围和更高的精确度,以实现基因组工程、代谢工程、植物性状开发和治疗应用的优化结果。
[0105] 因此,本发明的各个方面和实施方案都依赖于提供了合适的双链断裂诱导酶或两个切口酶作为SSN以及适当设计的修复模板核酸序列(RT),其中的要点是本发明的事实是使SSN和RT紧密接近来以靶向的方式指导基因组工程事件。
[0106] 在一个实施方案中,至少一个RTDD是CRISPR gRNA或gDNA,并且其直接与修复模板相互作用或与修复模板缔合,以构建来自所述RTDD的RNA-DNA或DNA和来自所述RT的DNA的杂交核酸序列。
[0107] 因此,根据本发明的“人工分子复合物”代表包含至少一个氨基酸组分(即SSN和任选的相互作用结构域)、RTDD和核酸碱基修复模板(RT)的复合物。在组装状态下,所述复合物将通常包含至少一个包含氨基酸(蛋白质)的组分(即至少一个SSN)和包含核酸的组分(即RT)。所述至少一个RTDD和任选的所述至少一个相互作用结构域还可以包含氨基酸和/或核酸作为构建单元,但是归因于所述组分在所述分子复合物内的功能,更大范围的分子(包括合成构建单元或不同生物分子和/或合成分子的组合)是可能的。
[0108] 因此,根据本发明的人工分子复合物通过添加至少一个进一步的相互作用介导结构域克服了寡核苷酸(RT)-酶(SSN)缀合物它们不能在体内自组装从而严重限制它们在体内基因组编辑中的用途的缺点,所述相互作用介导结构域即RTDD和任选的IA,所述 RTDD和任选的IA保证当与至少一个携带待修饰的感兴趣的基因组靶DNA(基因组包括编码和非编
码区,包括核、质体和游离基因的靶DNA和表观遗传靶位点)的完整细胞作用时,体内或通常在生理条件下在体内和体外RT和SSN的紧密缔合以及分子复合物的完美组装。
[0109] 在一个实施方案中,可以在体内提供和完全组装所述人工分子复合物,例如通过提供必要的构建体以合成并随后在宿主细胞内组装所述复合物。在另一个实施方案中,人工分子复合物可以作为离体组装的分子复合物提供,其随后在体内引入感兴趣的宿主细胞中,或者使其在体外与感兴趣的基因组靶分子接触。在又一个实施方案中,所述人工分子复合物的部分可以离体产生,并且部分可以在体内产生,例如在引入携带用于转录和/或表达人工分子复合物组分的质粒的合适的递送载体后,并且然后发挥其功能的最终人工分子复合物将基于RTDD介导的内在识别功能在体内组装。
[0110] 因此,根据本发明的人工分子复合物的任何组分之间的“相互作用”或“直接相互作用”意味着所述人工分子复合物的两种组分之间的任何共价或非共价相互作用或连接。因此,核酸水平上的共价连接可能意味着核酸分子的核苷酸之间的磷酸二酯或硫代磷酸酯键。此外,共价连接可以是氨基酸与另一个氨基酸和/或修饰的核酸分子之间的二硫键,而根据本发明可以设想任何天然存在的共价连接或人工共价连接。非共价相互作用包括静电相互作用,包括离子、氢键或卤素键、范德华力,包括偶极子-偶极子、偶极子诱导的偶极子、伦敦分散力、П效应和疏水效应。值得注意的是,根据本发明的人工分子复合物的组分中可存在一种以上的相互作用类型。例如,所述SSN(例如CRISPR 核酸酶)可以通过非共价相互作用与作为RTDD的gRNA相互作用。所述RTDD可以与修复模板RT共价连接。在另一个实施方案中,作为SSN的Argonaute融合蛋白可以与作为相互作用结构域(IA)的单链可变抗体片段共价融合。所述IA尤其可以对荧光素具有特异性,并且因此可以与所述RTDD荧光素非共价相互作用。荧光素和这种标记的修复模板核酸RT可以作为合成的共价融合物提供。在另一个实施方案中,不同组分的缔合是通过非共价相互作用介导的,例如通过亮氨酸-拉链识别与SSN或IA相互作用的DNA 靶序列和/或适体(基于核酸或氨基酸)。在一个实施方案中,所述RTDD可以是适体,例如在所述修复模板中提供所述适体功能的序列。在另一个实施方案中,允许与所述修复模板杂交的向导核酸的延伸可以用作所述至少一个RTDD。如果将向导核酸定义为诸如 RTDD,则这样的实施方案使用多于一个RTDD。在又一个实施方案中,用于与所述修复模板连接的向导核酸的3'-或5'-末端可以特异性地配置为起RTDD的作用。
[0111] 根据本发明,所述人工分子复合物的不同组分可包含天然存在的和/或合成的人工构建单元。
[0112] 因此,根据本发明的各种实施方案的位点特异性核酸酶(SSN)或编码其的核酸序列可以是任何天然存在的或工程化的核酸酶,其能够以位点特异性方式识别和切割DNA。由于许多SSN将在生物体或病毒的基因组内具有大量潜在的切割位点,优选具有确定的切割模式的这种SSN或具有定制的切割模式的设计者SSN。因此,SSN包括用于基因组编辑技术的位点特异性核酸酶,例如设计者锌指核酸酶、转录激活因子效应物 (TALE)核酸酶、(归巢)大范围核酸酶、CRISPR系统衍生的核酸酶(包括Cas或Cpf1核酸酶)、或Argonaute核酸酶以及稀有切割核酸内切酶、或两种位点特异性切口核酸内切酶(包括IIS类限制性核酸内切
酶,包括FokI或其变体)、或两种位点特异性切口核酸内切酶,或其变体或催化活性片段,或任何上述SSN的变体或催化活性片段。因此,根据本发明,可以存在多于一个SSN或编码其的核酸序列,而所述分子一起能够在DNA 靶序列诱导靶向的DNA双链断裂,或者两个连续的单链断裂。
[0113] 根据本发明的“DNA靶序列”可以是双链DNA、基因组或基于质粒内的任何区域,在此诱导靶向的DNA断裂并随后在根据本发明的修复模板(RT)的帮助下被修复。即使“DNA靶序列”源自内源序列,也可以通过在包含所述基因组DNA的分子上(优选在质粒上)呈递相关序列,在体外进行所述序列的编辑或工程化。在此类实施方案中,感兴趣的靶基因座可包含在细胞内的DNA分子中。所述细胞可以是原核细胞或真核细胞,或用于病毒繁殖的原核细胞或真核宿主细胞内的质粒上的病毒基因组。所述细胞可以是哺乳动物细胞。所述哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。所述细胞可以是非哺乳动物的真核细胞,例如家禽、鱼或虾。所述细胞也可以是植物细胞。所述植物细胞可以是作物植物,例如木薯、玉米、高粱、小麦、大豆、棉花、甜菜或稻米。所述植物细胞也可以是藻类、树木或蔬菜。通过本发明引入所述细胞的修饰可以是使得所述细胞和所述细胞的后代被改变以改善生物产物(如抗体、淀粉、醇或其它所需细胞输出)的产生。通过本发明引入所述细胞的修饰可以使得所述细胞和所述细胞的后代包括变化所产生的生物产物的改变。在另一个实施方案中,所述“DNA靶序列”可以是感兴趣的表观基因组基因座。
[0114] 根据本发明的“基因组互补序列”是指根据本发明的RT的序列部分可以通过互补碱基配对进行比对。因此,所述“DNA靶序列”和所述“基因组互补序列”可以是重叠的或甚至相同的,但是对于某些实施方案,所述序列可以是不同的(例如在所述至少一个SSN将在所述RT的所述“基因组互补序列”部分的上游或者下游具有切割位点的情况下)。
[0115] 在任何所述实施方案中,所述链断裂可以是双链断裂,或者它可以是两个单链断裂。
[0116] 在某些实施方案中,通过在一个实施方案中用RTDD标记的或缔合的修复模板寡核苷酸的蛋白质共递送,或在另一个实施方案中作为基于质粒的表达融合蛋白并随后暴露于RTDD标记的修复模板的蛋白质共递送,将所述人工分子复合物的所述SSN组分和任选的所述IA组分将递送至包含待修饰的感兴趣的基因组区域的宿主细胞或测定系统。在设想多于一个的RTDD的情况下,例如,一个RTDD是向导核酸分子和另一RTDD 是与所述RT缔合的分子(例如生物素或标记物,例如荧光素),额外的RTDD可以被共递送。根据本发明的基于质粒或载体的方法还包括所述SSN和/或所述IA和/或其融合蛋白的稳定表达系的方法。
[0117] 在一个实施方案中,所述人工分子复合物包含两个SSN分子,一个SSN是活性核酸酶,并且另一个SSN是催化失活的核酸酶缺陷分子,其中所述失活SSN将作为RTDD /RT的相互作用伴侣。所述人工分子复合物的所述配置可以增强对某些感兴趣的DNA 靶序列的特异性。
[0118] 在另一个实施方案中,融合蛋白或非共价缔合的活性Cpf1和作为相互作用结构域的失活dCas9可以作为SSN提供。用于作为RTDD的Cas9的gRNA可以靶向所述修复模板或其延伸,形成Cpf1-dCas9-RT复合物。crRNA(Cpf1)靶向为双链切割定义的基因组基因座以启动HDR。
[0119] 同样地,高活性锌指蛋白、megaTAL或失活的大范围核酸酶可用作相互作用结构域。
[0120] 在根据本发明的各个方面的一个实施方案中,所述至少一个修复模板对接结构域 (RTDD)或编码其的核酸序列,或所述至少一个人工分子复合物选自以下至少一种:生物素;适体;DNA、RNA或蛋白质染料,包括荧光团,包含荧光素,或其变体,马来酰亚胺或四氮唑(XTT));特异性配置为与至少一个修复模板核酸序列相互作用的向导核酸序列;链霉抗生物素蛋白或其变体,优选单体抗生物素蛋白;抗生物素蛋白或其变体,亲和标签,优选链霉抗生物素蛋白标签;抗体;单链可变片段(scFv);单域抗体(纳米抗体);抗运载蛋白;农杆菌VirD2蛋白或其结构域(参见例如SEQ ID NO:33);小核糖核酸病毒VPg;拓扑异构酶或其结构域;PhiX174噬菌体A蛋白;PhiX A*蛋白;VirE2蛋白或其结构域;或地高辛。因此,所述RTDD可以是天然存在的或合成的分子,不限于核酸或氨基酸分子。因此,所述RTDD是本发明的人工分子复合物的特异性相互作用介质,其可以以通用方式设计以偶联至少一个感兴趣的SSN和至少一个特异于感兴趣的基因组互补区并任选地携带感兴趣的插入物的修复模
板,所述插入物待在通过所述至少一个SSN切割的感兴趣的DNA靶序列被引入。对于使用基于CRISPR或Argonaute的 SSN的实施方案,所述RTDD可以是向导核酸序列。因此,根据本发明的RTDD可以是属于各种类型的人工或天然分子的分子。因此,所述RTDD由其直接与至少一个修复模板核酸序列(RT)相互作用的能力以及额外通过与所述至少一个SSN直接相互作用的能力来定义。因此,所述RTDD是人工分子复合物内的分子接头,归因于所述分子接头与RT和SSN的双重相互作用而提供与所述RT和所述SSN的紧密物理接近并且通过高度特异的
分子相互作用保证所述人工分子复合物在体外和体内的缔合。对于某些实施方案,可以存在多于一个携带多于一个RT的RTDD。
[0121] 在另一个实施方案中,所述人工分子复合物包含相互作用结构域,其中所述至少一个相互作用结构域或编码其的核酸序列选自以下至少一种:DNA结合结构域;链霉抗生物素蛋白或其变体,优选单体链霉抗生物素蛋白;抗生物素蛋白或其变体;亲和标签;生物素化信号;生物素受体位点;链霉抗生物素蛋白标签;抗体;单链可变片段(scFv);单结构域抗体(纳米抗体);抗运载蛋白;生物素;适体;DNA、RNA或蛋白质染料,包括荧光团,包含荧光素,或其变体,马来酰亚胺或四氮唑(XTT));特异性配置为与至少一个修复模板核酸序列相互作用的向导核酸序列;农杆菌VirD2蛋白或其结构域;小核糖核酸病毒VPg;拓扑异构酶或其结构域;PhiX174噬菌体A蛋白;PhiX A*蛋白; VirE2蛋白或其结构域;或地高辛。
[0122] 值得注意的是,归因于相互作用结构域是任选组分的事实,RTDD和相互作用结构域可以从可比较和重叠的分子类别中选择,其可以额外优化根据本发明的人工分子复合物的特异性或效率。相互作用结构域的存在对于使用人工分子复合物的实施方案可能是重要的,其中没有核酸向导的核酸酶用作SSN,或其中所述SSN携带一个或多个修饰内在的DNA识别、所述SSN的结合或切割活性的突变。在另一个实施方案中,由于作为人工分子复合物中的另外组分的相互作用结构域可以向复合物添加扩展的功能并因此可以扩展其可用性范围,相互作用结构域的存在可以有利地与任何种类的SSN组合使用以进一步增加靶向范围、结合和/或切割的效率、切割速率、或靶向感兴趣的DNA 靶序列的精确度。特别是对于包含复杂基因组的高等真核生物中的基因组工程,额外的组分(即相互作用结构域)的存在可因此对于实现由本发明的RT介导的改善的DNA切割的精确度和靶向的修复具有突出的重要
性。在某些实施方案中,所述IA可代表用于不参与基因组工程本身的分子伴侣的高度特异性结合伴侣,其中所述分子伴侣或同源结合伴侣代表与RT缔合的RTDD。因此,添加IA结构域以及同源伴侣RTDD的额外水平可以为所述人工分子复合物添加显著更高的结合特异性和
RT可用性,来改善靶向的基因组工程方法的结果。
[0123] 根据本发明的相互作用结构域(IA)具有选自由以下组成的组的若干功能:(i)与所述至少一个修复模板对接结构域相互作用;和/或(ii)与所述至少一个修复模板核酸序列相互作用;和/或(iii)与基因组DNA的序列特异性相互作用。这些功能中的一个以上可以在一个特定IA中得到统一。
[0124] 可能优选使用IA,其代表对同源配体,对适体或抗原/表位具有内在高特异性和高亲和力结合能力的蛋白质或多肽,所述同源配体例如合成配体,包括生物分子的荧光素,包括生物素或地高辛及其变体。如本文所用并且如免疫学领域中常用的术语“抗原”是指“产生抗体”的分子,即可引发适应性免疫应答的物质。因此,抗原是与抗原特异性受体结合的分子,T细胞或B细胞受体或其变体,例如纳米抗体或单链可变片段抗体、双特异性抗体、串联双价scFv、双价抗体、串联三价scFv(三价)或三价抗体(三价)。抗原通常是(多)肽,但它也可以是多糖或脂质,其可能与蛋白质或多糖载体分子结合。通过所述IA的这种内在结合/识别性质介导,可以选择感兴趣的IA,其将以高度特异性的方式特异性识别RTDD,并且所述IA可以与SSN共价或非共价连接或融合。因此,包含这样的IA增加了本发明的人工分子复合物的额外水平的特异性,并且保证与所述 RTDD直接相互作用的所述RT将与由高度特异性IA-RTDD缔合介导的SSN-IA复合物特异性缔合。最优选地,所述IA和所述同源RTDD具有高亲和力常数或结合亲和力,并因此在生理条件下彼此具有低解离常数(Kd),即低μM范围中的Kd值,或优选nM范围内的Kd值,并优选其之下的Kd值。所述IA可以是分别具有一个或多个特异性(三价抗体衍生片段)或具有一个以上结合位点(四聚链霉抗生物素蛋白)的单价、二价、三价或多价分子。在该实施方案中,可存在一个以上的RTDD和/或RT,并将其用所述人工分子复合物呈递至所述至少一个SSN。具有低解离常数(Kd)的IA是优选的,即反过来对其同源配体具有高亲和力。通常,由于两个分子之间的非共价结合相互作用(即蛋白质和配体之间的典型相互作用形式),亚皮摩尔解离常数是罕见的。然而,有一些重要的例外。生物素和天然存在的抗生物素蛋白以大致10-15M的解离常数结合,其表示的亲和力高到不适合于应用,其预期有可逆结合。商业抗体或scFv可以具有在10-14M10-6M 的范围内的Kd值。为了本发明的目的,IA-RTDD对应该因此具有低解离常数,即具有高亲合力。
[0125] 另外,在某些实施例中,所述IA可以直接与所述RT相互作用。当所述RT核酸序列包含延伸(例如基于核酸的适体)时,该序列可以被同源结合伴侣所述IA识别,其然后可以以高度特异性的方式与所述RT相互作用。此外,所述IA可以是具有多于一个结合特异性的二价或三价或多价分子。所述IA的一部分可以被配置为与所述RTDD相互作用,并且一部分可以被配置为与所述RT相互作用,而所述IA与所述SSN缔合,使得在基因组工程期间可以实现所述RT和所述SSN甚至更紧密的缔合。
[0126] 在另一个实施方案中,所述IA可以是具有与基因组DNA的序列特异性相互作用能力的结合分子。这将在将人工分子复合物靶向DNA靶序列期间增加更多特异性。此外,这允许使用修饰的SSN以便可以提供具有优化的切割活性的SSN,而所述IA介导以高精度将所述人工分子复合物靶向DNA靶序列的功能,而SSN和/或IA可以与RTDD相互作用,所述RTDD与所述RT相互作用并因此将所述RT呈递至位点,所述位点处将诱导双链断裂。在一个实施方案中,所述IA因此可以是DNA结合结构域或DNA结合基序,其被设计为在所述至少一个SSN核酸酶或其变体的N-或C-末端上的融合蛋白的一部分。基于氨基酸的接头将允许灵活性并避免DNA结合或核酸酶活性的空间位阻。潜在的DNA结合结构域也可以是锌指(Roy等人2012),例如Cys 2/His2锌指(Kubo等人 1998)、TALEN(Hubbard等人2015)或能够高度特异性结合DNA的灭活的Argonaute或 Cas9蛋白。这些DNA结合结构域中的任何一个都理想地靶向同源臂侧翼序列外的序列,以避免相互作用的空间位阻,并因此可以为本发明的人工分子复合物增加另一水平的特异性。
[0127] 在另一个实施方案中,可以在所述人工分子复合物内使用多于一个IA结构域,即,一个用作RTDD的高特异性和亲和性结合物的IA,并且一个用作额外的DNA结合结构域的IA,两个IA直接与所述人工分子复合物的所述至少一个SSN相互作用(即共价或非共价缔合)。
[0128] 在一个实施方案中,所述至少一个SSN和/或所述至少一个IA包含生物素化信号或生物素化受体位点或链霉标签。相关的信号/位点可以通过内源(BirA)或外源生物素化酶 /试剂在体外或体内生物素化,或者在体外生物素化步骤中生物素化,并然后可以通过链霉抗生物素蛋白或抗生物素蛋白(或优选其修饰变体,最优选其单体变体)识别和结合生物素化的信号/位点和/或链霉标签,其中所述链霉抗生物素蛋白或抗生物素蛋白或其变体将与感兴趣的RT缔合。由于已知抗生物素蛋白与DNA非特异性相互作用(Morpurgo 等,2004),抗生物素蛋白的修饰变体或更优选链霉抗生物素蛋白或其变体可能是优选的。
[0129] 特别是对于不依赖于向导RNA/DNA的SSN,如果与根据本发明的RTDD和/或IA 组合使用,具有给定结合特异性的单体链霉抗生素或scFv的额外结合能力和因此的RT 靶向能力可以显著增加用于基因组工程的合适SSN的范围。
[0130] 在一个实施方案中,生物素可以通过市售试剂盒与所述修复模板DNA融合,或作为第三方如RTDD合成过程的一部分与所述修复模板DNA融合。使用修饰的链霉抗生物素蛋白或抗生物素蛋白序列确保不发生蛋白质间复合,并且每个蛋白质结合一个生物素化的修复模板DNA。然后将所述修复模板与作为相互作用结构域的链霉抗生物素蛋白或其任何变体连接(Niemeyer et al.1999,"Functionalization of covalent DNA-streptavidin conjugates by means of biotinylated modulator components."Bioconjug Chem 10
(5):708-719),其中所述相互作用结构域直接与所述SSN相互作用,例如通过提供作为融合分子的所述SSN和所述链霉抗生物素蛋白。在另一个实施方案中,所述 SSN可包含生物素化信号或肽,并且所述生物素化将在宿主细胞中体内进行。在该实施方案中,链霉抗生物素或抗生物素蛋白或其变体可以用作与RT连接的RTDD本身。编码适合作为根据本发明的相互作用结构域或作为根据本发明的RTDD的单体链霉抗生物素蛋白(mSA)的示例性序列显示在
SEQ ID NO:34中。与SSN融合的mSA因此可以理解为作为根据本发明的RTDD或作为根据本发明的相互作用结构域。在另一个实施方案中,所述SSN可以携带链霉标签,该标签分别被作为相互作用结构域或作为RTDD 的链霉抗生物素蛋白变体识别。合适的链霉抗生物素蛋白或抗生物素蛋白酶或其变体或编码其的载体可由本领域技术人员例如从IBA 
Lifesciences(Gottingen,Germany), addgene(Cambridge,MA,USA),Intregrated DNA Technologies(Coralville,IA,USA),或GeneArt(ThermoFisher;Waltham,MA,USA)获得。编码适合作为根据本发明的IA 或RTDD的mSA的单体链霉抗生物素蛋白构建体的另一个示例
性序列显示在SEQ ID NO:42中。
[0131] 在一些实施方案中,所述RTDD和所述SSN和/或所述相互作用结构域之间的相互作用或附着或缔合因此由选自结合对的非共价相互作用的结合对的相互作用导致,所述结合对选自但不限于:生物素-抗生物素蛋白;生物素-链霉抗生物素蛋白;生物素修饰形式的抗生物素蛋白;蛋白质-蛋白质;蛋白质-核酸相互作用;配体-受体相互作用;配体-底物相互作用;抗体-抗原;单链抗体-抗原;抗体或单链抗体-半抗原;激素-激素结合蛋白;受体-激动剂;受体-受体拮抗剂;IgG-蛋白A;酶-酶辅助因子;酶-酶抑制剂;单链DNA-VirE2;StickyC-dsDNA;RISC(RNA诱导的沉默复合物)-RNA;病毒外壳蛋白-核酸;抗荧光素单链可变片段抗体(抗FAM scFV)-荧光素;抗地高辛(DIG)单链可变片段(scFv)免疫球蛋白(DIG-scFv)-地高辛(DIG)和农杆菌VirD2结合蛋白,或其任何组合或变体。值得注意的是,具有定制特异性和高亲和力(在pM或甚至fM范围内)的抗体和抗体片段或衍生物(如scFv、纳米抗体或双价抗体)是可商购的,特别是结合经典染料的此类抗体或其片段或变体,如荧光素,或其衍生物。
[0132] 在一个实施方案中,根据本发明的相互作用结构域选自亮氨酸拉链、适体序列、 dCas9、dCPF1、大范围核酸酶、锌指或TALE构建体。在该实施方案中,可以通过中间 DNA结合结构域或DNA结合基序使所述至少一个SSN和所述RT DNA直接相互作用,所述中间DNA结合结构域或DNA结合基序被设计为所述SSN的N-和/或C-末端上的融合蛋白的一部分。基于氨基酸的接头将允许灵活性并避免DNA结合或核酸酶活性的空间位阻。潜在的DNA结合结构域也可以是锌指(Roy et al.2012,"Prediction of DNA-binding specificity in zinc finger proteins."J Biosci 37(3):483-491),例如Cys2/His2锌指(Kubo et al.1998,"Cys2/His2 zinc-finger protein family of petunia:evolution and general 
mechanism of target-sequence recognition."Nucleic Acids Research 26(2):608-
615)、 TALEN(Hubbard et al.2015,"Continuous directed evolution of DNA-binding proteins to improve TALEN specificity."Nat Methods 12(10):939-942)或能够高度
特异性结合DNA的灭活的Argonaute或Cas蛋白。作为相互作用结构域的这些DNA结合结构域中的任一个可以额外地有助于靶向同源臂侧翼的感兴趣的序列之外的序列,以避免相互作用的空间位阻。所述相互作用结构域可以实现增加本发明的人工分子复合物的DNA结合的功能和/或允许为RTDD/RT连锁提供额外的对接位点以提供适合于基因组工程的高度特异
性复合物。
[0133] 根据某些实施方案,根据本发明的所述至少一个SSN可以与DNA结合结构域融合,即蛋白质或其片段,或编码所述蛋白质或所述蛋白质片段的基因序列,所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子,包括但不限于麦芽糖结合蛋白(MBP)、S 标签、Lex A DNA结合结构域(DBD)融合物、GAL4 DNA结合结构域融合物和单纯疱疹病毒(HSV)BP16蛋白融合物。
[0134] 在某些实施方案中,可存在多于一个RTDD。第一个RTDD可以是mSA或单链可变片段(scFv),而第二个RTDD可以是生物素或scFv的同源配体。在一个实施方案中,使用基于CRISPR或Argonaute的SSN系统,第一RTDD是向导核酸序列,并且第二 RTDD是生物素或荧光素或与RT连接的任何其他高亲和力结合伴侣部分,其中单体链霉抗生物素蛋白或scFv或另一个同源蛋白结合伴侣代表识别第二RTDD并以高亲和力与其结合的IA。因为所述RTDD提供与所述RT和所述SSN的强烈且可靠的相互作用以实现精确的基因组工程事件,根据本发明的这种人工分子复合物的设计通过同时提供高RT可用性并且不损失RT而允许最大的灵活
性使RT与效应物SSN紧密接触。
[0135] 在一个实施方案中,可通过针对染料荧光素的单链可变片段(scFv)抗体实现修复模板与SSN连锁。特异性结合荧光素和荧光素衍生物的scFv以杂合蛋白方式与所述SSN 融合(Schenk et al.2007,"Generation and application of a fluorescein-specific single-chain antibody."Biochimie 89(1 1):1304-131 1)。在另一个实施方案中,所述SSN可以包含与其相互作用的荧光素分子,并且同源荧光素特异性scFv可以作为与RT的融合物提供,并且可以结合与SSN缔合的荧光素。因此,所述scFv可以用作根据本发明的RTDD或用作根据本发明的相互作用结构域。
[0136] 在本发明的其他实施方案中,可以使用具有不同结合特异性的任何scFv。
[0137] 合适的scFv-配体对选自由以下组成的祖:scFv和荧光素(FAM)或任何FAM衍生物或变体,识别地高辛(DIG)的scFv,定制的识别感兴趣的SSN上的表位/抗原的scFv,等等。编码具有荧光素结合能力的scFv编码序列的一个示例性序列显示在SEQ ID NO: 43中。
[0138] 在另一个实施方案中,设计适体序列以与所述至少一个SSN特异性相互作用。在该实施方案中,所述适体序列可以与感兴趣的修复模板序列共价或非共价连接,以允许所述SSN和作为RTDD的所述适体之间的直接缔合,而不产生融合蛋白和/或利用额外的相互作用结构域。在其中不使用单独的相互作用结构域的实施方案中,与所述RT相互作用的所述RTDD包含能够特异性相互作用的核苷酸基序,即连接或结合所述至少一个SSN蛋白的结构域,或其被配置为与所述RTDD相互作用的特定结构域:在一些实施方案中,所述相互作用选自但不限于:锌指蛋白-锌指基序;限制酶识别结构域-限制酶识别序列;转录因子的DNA结合域-DNA基序;阻遏子-操作子;亮氨酸拉链-启动子;螺旋环螺旋-E盒结构域;包含富含精氨酸的基序结构域的RNA结合基序,αβ蛋白结构域,RNA识别基序(RRM)结构域,K-同源结构域,双链RNA结合基序,RNA结合锌指和RNA靶向酶-同源特异性RNA序列;HIV-rev蛋白-HIV rev反应元件(RRE)的Stem IIB;牛免疫缺陷病毒(BIV)Tat主要结合域-BIV反式作用反应元件(TAR)序列的环1;噬菌体λ,phi21和P22 N蛋白,在它们各自的RNA中的N-利用(nut)位点中的boxB环发夹。
[0139] 就本发明涉及Argonaute作为位点特异性核酸酶的用途而言,除了向导-DNA分子的优点之外,NgAgo核酸内切酶的递送通过其小尺寸而得以促进。野生型(WT)蛋白 
(GenBank登录号AFZ73749)是887个氨基酸,或大约化脓链球菌Cas9大小的2/3。这简化了克隆和载体组装,可以增加细胞中核酸酶的表达水平,并减少从高度大小敏感的平台如病毒(包括DNA或RNA病毒)表达蛋白质的挑战。与其他核酸向导的核酸内切酶一样,NgAgo SSN通常需要至少两种组分用于植物细胞中的靶向诱变:5'-磷酸化的单链向导-DNA和NgAgo核酸内切酶蛋白。对于靶向编辑,插入或序列替换,还可以向植物细胞提供编码所需序列变化的DNA模板,以通过NHEJ或HR修复途径引入变化。最常通过表型变化(例如通过敲除或引入导致可见表型的基因)、通过基于PCR的方法(例如通过富集PCR,PCR消化或T7EI或Surveyor核酸内切酶测定)或通过靶向的Next生成测序(NGS;也称为深度测序)检测成功的编辑事件。
在一个具体实施方案中,修饰的 Argonaute核酸内切酶在约20℃至约35℃的温度下具有活性。在一个具体实施方案中,修饰的Argonaute核酸内切酶在约23℃至约32℃的温度下具有活性。可用作核酸内切酶的Argonaute蛋白可包含三个关键功能结构域:PIWI核酸内切酶结构域、PAZ结构域和 MID结构域。所述PIWI结构域可能类似于核酸酶。所述核酸酶可以是RNase H或DNA 向导的核糖核酸酶。所述PIWI结构域可以共享二价阳离子结合基序,用于可以切割RNA 和DNA的其他核酸酶显示的催化作用。所述二价阳离子结合基序可含有四个带负电的进化保守氨基酸。所述四个带负电的进化保守氨基酸可以是天冬氨酸-谷氨酸-天冬氨酸- 天冬氨酸(DEDD)。所述四个带负电荷的进化保守氨基酸可以形成催化四分体,其结
2+
合两个Mg  离子并将靶核酸切割成带有3'羟基和5'磷酸基团的产物。所述PIWI结构域可以进一步包含一个或多个选自碱性残基的氨基酸。所述PIWI结构域可以进一步包含一个或多个选自组氨酸、精氨酸、赖氨酸及其组合的氨基酸。所述组氨酸、精氨酸和/或赖氨酸可在催化和/或切割中起重要作用。Argonaute对靶核酸的切割可以在单个磷酸二酯键处发生。在一些情况下,一个或多个镁阳离子和/或锰阳离子可促进靶核酸切割,其中第一阳离子可亲核攻击并活化水分子,并且第二阳离子可稳定过渡态和离去基团。对于某些Argonaute核酸酶,gDNA的长度将提供Argonaute和向导gDNA之间的亲和力。
[0140] 根据本发明的合适的argonaute蛋白显示于SEQ ID NO:19和20,或者可以包含具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、 78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、
95%、96%、97%、98%或99%的序列同源性的序列,只要所述同源序列仍然履行其来源(即它起源于)的argonaute蛋白的功能。其他合适的 argonaute序列公开在临时美国申请号
62/345,448中,该申请通过引用并入本文中。其他合适的Argonaute序列可以衍生自根据SEQ ID NO:21至29的序列或与其具有至少 66%、67%、68%、69%、70%、71%、72%、73%、
74%、75%、76%、77%、78%、 79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%序列同源性的序列。
[0141] Argonaute可包含核酸结合结构域。所述核酸结合结构域可包含与核酸接触的区域。核酸结合结构域可包含核酸。核酸结合结构域可包含蛋白质材料。核酸结合结构域可包含核酸和蛋白质材料。核酸结合结构域可包含DNA。核酸结合结构域可包含单链DNA。核酸结合结构域的实例可包括但不限于螺旋-转角-螺旋结构域、锌指结构域、亮氨酸拉链(bZIP)结构域、翼状螺旋结构域、翼状螺旋-转角-螺旋结构域、螺旋-环-螺旋结构域、 HMG-盒结构域、Wor3结构域、免疫球蛋白结构域、B3结构域或TALE结构域。核酸结合结构域可以是
Argonaute蛋白的结构域。Argonaute蛋白可以是真核Argonaute或原核Argonaute。
Argonaute蛋白可以结合RNA或DNA,或RNA和DNA两者。Argonaute 蛋白可以切割RNA或DNA或RNA和DNA两者。在某些情况下,Argonaute蛋白结合 DNA并切割DNA。在某些情况下,
Argonaute蛋白结合双链DNA并切割双链DNA。在一些情况下,两个或更多个核酸结合结构域可以连接在一起。将多个核酸结合结构域连接可以提供增加的多核苷酸靶向特异性。两个或更多个核酸结合结构域可以通过一个或多个接头连接。所述接头可以是灵活的接头。接头可包括长度为1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、
24、25、30、 35、40或更多个氨基酸。所述接头结构域可包含甘氨酸和/或丝氨酸,并且在一些实施方案中,可由甘氨酸和/或丝氨酸组成或可基本上由甘氨酸和/或丝氨酸组成。接头可以是核酸接头,其可以包含核苷酸。核酸接头可以将两个DNA结合结构域连接在一起。核酸接头的长度可以是至多5、10、15、20、25、30、35、40、45或50或更多个核苷酸。核酸接头的长度可以是至少5、10、15、30、35、40、45或50或更多个核苷酸。核酸结合结构域可以与核酸序列结合。核酸结合结构域可以通过杂交与核酸结合。可以工程化(例如,工程化以与基因组中的序列杂交)核酸结合结构域。可以通过分子克隆技术(例如,定向进化、位点特异性突变和合理诱变)来工程化核酸结合结构域。
[0142] 在某些实施方案中,根据本发明的SSN将是CRISPR核酸酶(包括Cas或Cpf1),或 Argonaute核酸酶,或其变体或催化活性片段。合适的CRISPR核酸酶序列选自由以下组成的组:SEQ ID NO:19至29,或35至41或与其具有至少66%、67%、68%、69%、 70%、71%、
72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%或99%的序列同源性的序列。其他合适的Cas或Cpf1效应子可衍生自来自包括以下属的生物体:链球菌属、弯曲杆菌属、Candidatus Micrarchaeum acidiphilum ARMAN-1、俭菌总门细菌属(GenBank:
APG80656.1)、硫化叶菌属(Sulfolobus spp.),包括冰岛硫化叶菌(Sulfolobus 
islandicus)HVE10/4(GenBank:ADX81770.1)或 REY15A(GenBank:ADX84852.1)、硝酸盐裂解菌属、葡萄球菌属(Staphylococcus)、细小棒菌属、罗氏菌属、奈瑟菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳酸菌属、真细菌属、棒杆菌属、肉食杆菌属
(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Listeria)、Paludibacter、梭菌属(Clostridium)、毛螺菌属、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西斯氏菌属、军团菌属(Legionella)、脂环酸芽孢杆菌属  (Alicyclobacillus)、
Methanomethyophilus、卟啉单胞菌属(Porphyromonas)、普氏菌属 (Prevotella)、拟杆菌属(Bacteroidetes)、创伤球菌属(Helcococcus)、Letospira、脱硫弧菌属
(Desulfovibrio)、Desulfonatronum、丰佑菌属(Opitutaceae)、肿块芽胞杆菌属 
(Tuberibacillus)、芽孢杆菌属(Bacillus)、Brevibacilus、甲基杆菌属
(Methylobacterium)或氨基酸球菌属,例如来自变形链球菌(S.mutans)、无乳链球菌
(S.agalactiae)、马链球菌(S. equisimilis)、血链球菌(S.sanguinis)、炎链球菌
(S.pneumonia);空肠弯曲杆菌(C.jejuni),大肠弯曲杆菌(C.coli);N.salsuginis、
N.tergarcus;耳葡萄球菌(S.auricularis),肉葡萄球菌(S.carnosus);脑膜炎奈瑟菌,淋病奈瑟氏菌(N.gonorrhoeae);单核细胞增生李斯特氏菌(L.monocytogenes)、伊万诺维酵母(L.ivanovii);肉毒梭菌(C.botulinum)、艰难梭菌(C. difficile)、破伤风梭菌
(C.tetani)、索氏梭菌(C.sordellii)。
[0143] 在一个实施方案中,作为本发明的人工分子复合物的一部分的所述至少一个位点特异性核酸酶或其催化活性片段或编码其的序列独立地选自由以下组成的组:以下的Cas 多肽:链球菌属包括化脓链球菌、嗜热链球菌、金黄色葡萄球菌,或奈瑟菌属包括脑膜炎奈瑟菌,棒杆菌,萨特氏菌,军团菌,密螺旋体,产线菌,真细菌,乳酸菌,支原体,拟杆菌,Flaviivola,黄杆菌,Sphaerochaeta,固氮螺菌,葡糖醋杆菌,罗氏菌,细小棒菌,硝酸盐裂解菌,支原体,弯曲杆菌,Candidatus Micrarchaeum acidiphilum ARMAN-1,俭菌总门细菌(GenBank:APG80656.1),硫化叶菌属,包括冰岛硫化叶菌HVE10/4 (GenBank:ADX81770.1)或REY15A(GenBank:ADX84852.1),以及Candidatus Parvarchaeum acidiphilum ARMAN-4;来自古细菌或细菌的Cpf1多肽,包括以下的Cpf1 多肽:氨基酸球菌属、包括氨基酸球菌属BV3L6,毛螺菌、包括毛螺菌ND2006、毛螺菌MC2017、毛螺菌MA2020,瘤胃溶纤维丁酸弧菌,Candidatus spp.,Methanoplasma termitum,稻田钩端螺旋体,牛眼莫拉菌237,异域菌门细菌GW201 1_GWA2_33_10,俭菌总门细菌GW201 1_GWC2_44_17,史密斯氏菌属SCADC,史密斯氏菌属SC_K08D17,弗朗西斯氏菌包括新凶手弗朗西丝氏菌U112,挑剔真杆菌,普氏菌或卟啉单胞菌;或来自以下的Argonaute核酸酶:格氏黄杆菌(GenBank:AFZ73749.1),铜绿微囊藻(NCBI 参考序列:WP_012265209.1或NCBI参考序列:WP_002747795.1或NCBI参考序列: WP_012265209.1),Halogeometricum pallidum(GenBank:ELZ29017.1),Natrialaba 
asiatica(NCBI参考序列:WP_0061 1 1085.1),冷盐碱红菌(NCBI参考序列: WP_
006090832.1),隐红碱线菌(NCBI参考序列:WP_006183335.1),或胶州湾聚球菌 (NCBI参考序列:WP_01 1378069.1),或其变体和/或功能片段和/或组合,包括切口酶或缺乏内切核苷酸活性的核酸酶。
[0144] 在使用至少一个Cpf1效应子作为SSN的本发明的其他实施方案中,前间隔区邻近基序(PAM)或PAM样基序指导效应蛋白复合物与感兴趣的靶基因座的结合。在使用至少一个Cpf1效应子作为SSN的实施方案中,所述PAM是5'TTN,其中N是A/C/G 或T。在本发明的另一个优选实施方案中,所述PAM是5'TTTV,其中V是A/C或G。在某些实施方案中,所述PAM是5'TTN,其中N是A/C/G或T并且所述PAM位于所述前间区的5'-末端的上游。在本发明的某些实施方案中,所述PAM是5'CTA,并且所述PAM位于所述前间区或所述靶基因座的5'-末端的上游。在某些实施方案中,提供了RNA向导的基因组编辑核酸酶的扩展的靶向范围,其中Cpf1家族的富含T的PAM 允许靶向和编辑富含AT的基因组。
[0145] 在某些实施方案中,CRISPR酶被工程化并且可以包含一个或多种降低或消除核酸酶活性的突变。同样地,本发明考虑使用两个或更多个切口酶的方法,特别是双重切口酶或双切口酶方法以产生靶向的DNA双链断裂。
[0146] 在根据本发明的人工分子复合物内使用Cpf1效应蛋白复合物的实施方案中,可以使用具有一个或多种非天然存在的或工程化的或修饰的或优化的核酸组分的Cpf1效应子,或编码的蛋白质。在优选的实施方案中,所述复合物的所述核酸组分可包含与顺向重复序列连接的向导序列,其中所述顺向重复序列包含一个或多个茎环或优化的二级结构。在优选的实施方案中,所述顺向重复序列具有最小长度16个核苷酸和单个茎环。在进一步的实施方案中,所述顺向重复序列的长度长于16个核苷酸,优选多于17个核苷酸,并且具有多于一个茎环或优化的二级结构。在优选的实施方案中,可以修饰所述顺向重复序列以包含一个或多个蛋白质结合RNA适体。在优选的实施方案中,可以包括一个或多个适体,例如优化的二级结构的一部分。这种适体可能能够结合噬菌体外壳蛋白。所述噬菌体外壳蛋白可以选自包含以下的组:Qβ、F2、GA、fr、JP501、MS2、 M12、R17、BZ13、JP34、JP500、KU1、M1、MX1、TW18、VK、SP、F1、ID2、NL95、 TW19、AP205、 7s和PRR1。在优选的实施方案中,所述噬菌体外壳蛋白是MS2。
[0147] 在某些实施方案中,本发明还提供所述至少一个SSN效应蛋白的包含RuvC结构域的催化活性片段中的所述一个或多个突变或所述两个或更多个突变。在一些实施方案中,所述RuvC结构域可包含RuvCI、RuvCII或RuvCIII结构域,或与RuvCI、RuvCII 或RuvCIII结构域等同源的催化活性结构域或与如本文所述任何方法中所述的任何相关结构域同源的
催化活性结构域。所述效应蛋白SSN可包含一个或多个异源功能结构域。所述人工分子复合物的所述一个或多个异源功能结构域可包含一个或多个核定位信号 (NLS)结构域。所述一个或多个异源功能结构域可包含至少两个或更多个NLS结构域。所述一个或多个NLS结构域可以位于所述效应蛋白质(例如,Cpf1)的末端或所述效应蛋白质(例如,Cpf1)的末端附近或接近所述效应蛋白质(例如,Cpf1)的末端,并且如果有两个或更多个NLS,则两者中的每一个可以位于所述效应蛋白质(例如,Cpf1)的末端或接近所述效应蛋白质(例如,Cpf1)的末端。所述一个或多个异源功能结构域可包含一个或多个转录激活结构域。在优选的实施方案中,所述转录激活结构域可包含VP64。所述一个或多个异源功能结构域可包含一个或多个转录抑制结构域。在优选实施例中,所述转录抑制结构域包含KRAB结构域或SID结构域(例如,SID4X)。所述一个或多个异源功能结构域可包含一个或多个作为SSN的核酸酶结构域。在一个实施方案中,所述 SSN可包含Fok1或其催化活性片段或变体。
[0148] 在一个优选的实施方案中,根据本发明的人工分子复合物的所述至少一个位点特异性核酸酶或其变体或催化活性片段或编码其的序列选自CRISPR核酸酶(优选选自Cas 或者Cpf1核酸酶),或FokI核酸酶,或其催化片段,并且所述至少一个相互作用结构域或编码其的序列选自单链可变片段或单体链霉抗生物素蛋白。
[0149] 在一个实施方案中,根据本发明的人工分子复合物包含至少一个CRISPR或 Argonaute衍生的SSN,或其变体或催化活性片段,和至少一个代表至少一个修复模板对接结构域的向导核酸序列,其中所述至少一个向导核酸序列中的每一个包含(i)与识别 DNA靶序列互补的第一序列部分,和(ii)第二序列部分,其中所述第二序列部分配置为与所述至少一个位点特异性核酸酶相互作用,和(iii)其中所述至少一个向导核酸序列与所述至少一个修复模板核酸序列物理缔合,并从而形成包含至少一个RNA或DNA和至少一个其他
DNA核酸序列的杂交核酸序列或由至少一个RNA或DNA和至少一个其他 DNA核酸序列组成的杂交核酸序列,和(iv)任选地包含在所述至少一个向导核酸序列和所述至少一个修复模板核酸序列之间的接头区域,优选其中所述修复模板核酸序列在向导核酸序列的3'末端与所述向导核酸序列缔合,和/或其中所述修复模板核酸序列与所述向导核酸序列的5'末端缔合,和/或其中所述修复模板核酸序列位于所述向导核酸序列内。
[0150] 根据本发明的各个方面和实施方案的所述至少一个修复模板核酸序列和/或所述至少一个向导核酸序列包括核苷酸序列,其选自天然或非天然存在核苷酸序列,包括合成核苷酸序列,任选地包含主链和/或碱基修饰,其中所述向导核酸序列包括单链或部分单链的RNA或DNA核苷酸序列,且其中所述至少一个修复模板核酸序列包括单链或双链 DNA核苷酸序列。
[0151] 在某些实施方案中,根据本发明的人工分子复合物的所述至少一个修复模板核酸序列(RT)包含至少一个末端部分,优选3'末端,其中该末端部分不与任何其他末端部分相互作用并因此被配置为与至少一个基因组互补序列杂交以介导所述DNA靶序列的修复,和/或其中所述至少一个修复模板核酸序列作为质粒提供。为了能够达到所述至少一个基因组互补序列,因此应当以允许与所述至少一个基因组互补序列进行最佳碱基配对的配置提供RT。此配置将根据RT的性质和取决于提供RT的方式而变化。在某些实施方案中,使用至少一个RT,其可以共价或非共价附着至RTDD,例如gRNA或gDNA。
[0152] 在使用包含至少一个作为RTDD的RNA区段的分子或使用编码感兴趣的蛋白质的 RNA的某些实施方案中,所述RNA可以与保护(protecting)或保护物(protector)分子或链一起呈递,该保护分子将至少部分地退火至代表所述人工分子复合物的实际效应分子的 RNA,以保护所述RNA效应分子免于细胞内的降解。
[0153] 根据本发明的人工分子复合物的合适配置示于图1-4。使用作为根据本发明的RTDD 和RT的“杂交核酸分子”的人工分子复合物示于图1A-D和图2A-C,但不限于其。取决于SSN,所述修复模板(RT)可采用ssDNA或dsDNA形式,并在使用CRISPR或Argonaute 蛋白作为SSN的情况下,所述修复模板(RT)能在3'末端、5'末端以共价或非共价方式附着所述至少一个向导核酸(sgRNA或gRNA或gDNA)序列,或其能位于gRNA内,如形成具有定义尺寸和形状的发夹二级结构。此设计允许所述gRNA和所述RT部分都能履行其功能,而不干扰所述至少一个感兴趣gRNA与感兴趣的CRISPR或Argonaute核酸酶的相互作用且同时将RT放置在紧密接近由所述至少一个CRISPR/gRNA Argonaute/gDNA对诱导的DNA断裂位点。
[0154] 在使用CRISPR核酸酶的某些实施方案中,所述人工分子复合物将包含杂合核酸序列,其包括至少一个RNA和至少一个DNA核酸序列或仅根据本发明的杂合RNA/DNA 核酸序列,或者由至少一个RNA和至少一个DNA核酸序列或仅根据本发明的杂合 RNA/DNA核酸序列组成,由此代表包括2种功能的含分子的嵌合RNA和DNA。首先,其包括含核糖核酸的向导核酸(gRNA)部分。此gRNA包括2个核苷酸序列部分,一个核苷酸序列是与感兴趣的CRISPR多肽相互作用必需的以及另一个核苷酸序列包括靶向结构域,其中所述靶向结构域能经碱基配对与毗邻相反链中PAM序列的感兴趣的互补 DNA靶序列杂交,此互补DNA靶序列因而代表根据本发明所述第一DNA靶序列。第二,所述杂合RNA/DNA核酸序列包括修复模板核酸序列部分,其可包含待引入感兴趣的DNA靶序列的所需编辑。此外,所述修复模板核酸序列可包括紧接所述DNA靶序列上游和下游(即左和右同源臂)的额外同源序列。各同源臂的长度和结合位置取决于所引入的变化的尺寸,并能为了最优效率而被调整。例如,具有互补性的修复模板可能产生最有效修复,所述互补性特异于首先由Cas9释放的切割的DNA链(如描述于 Richardson,et al.,Nature Biotechnology.2016,doi::10.1038/nbt.3481)。根据特定应用,所述修复模板可以是单链或双链DNA核苷酸序列。
[0155] 所述修复模板可包含相对于基因组DNA的多态性以破坏被所述核酸酶结合,否则所述修复模板成为CRISPR多肽切割的合适靶标。例如,所述PAM能突变成其不再存在,但基因的编码区不受影响,这对应于不改变编码氨基酸序列的沉默突变。在另一实施方式中,在所述人工分子复合物内使用核酸酶缺陷型CRISPR多肽作为SSN时,可能存在所述修复模板序列内的PAM序列。在一个实施方式中,所述RTDD/RT序列包括至少一个向导核酸序列和至少一个修复模板核酸序列,但该RTDD/RT杂合体也能包括其中所附适合基因组编辑的其它部分,如下进一步详述。在另一实施方式中,所述杂合 RTDD/RT序列由至少一个向导核酸序列和至少一个修复模板核酸序列组成。
[0156] 发现根据所用SSN而能存在最优RT尺寸,其提供核酸酶效率与同源臂尺寸的平衡以用于HR介导DSB修复的效率。
[0157] 在一个实施方式中,所述向导核酸序列或gRNA作为统一tracrRNA和crRNA元件的一个RNA核酸序列提供。在另一实施方式中,例如用Cpf1多肽或其变体或催化活性片段通过V型CRISPR系统运作时,所述gRNA包括crRNA元件。在另一实施方式中,所述gRNA能作为模拟许多CRISPR系统中自然环境的一个以上RNA核酸序列提供,若都需要,则在2个单独RNA分子上提供crRNA和tracrRNA。在某些实施方式中,此排列因而允许在分开的RNA链中具有2个元件(tracrRNA和crRNA)的可能性,如同在自然环境中。在一个实施方式中,提供供给crRNA的单独RNA核酸分子,并提供单独 RNA核酸分子,即存在超过一个RTDD。crRNA部分或tracrRNA部分能与修复模板(RT) 核酸序列缔合。例如,当归因于各分子相较gRNA:RT杂合体长度更短而选择离体化学合成tracrRNA:RT或crRNA:RT时,可优选提供tracrRNA:RT杂合体或
crRNA:RT,其中gRNA由统一crRNA和tracrRNA功能的单一RNA分子组成。
[0158] 因此,根据本发明的RTDD/RT序列适合任何感兴趣的细胞类型中以及体外环境中任何感兴趣的基因组的精确基因组编辑,所述细胞类型包括原核细胞和真核细胞,包括真菌、动物和植物细胞,并代表合适的物理连接工具以允许修复模板和SSN在基因组编辑期间的同步时空可用性。
[0159] 根据本发明的所有方面和实施方式,所述至少一个RTDD和所述至少一个修复模板核酸序列彼此缔合。根据本公开的术语“与...缔合”或“相缔合”应以广义解释,因此,根据本发明,其指RTDD(例如gRNA或生物素分子、FAM或地高辛)以与DNA修复模板物理缔合而提供,所述缔合是共价或非共价性质,本质上增加用于同源重组的修复模板可用性。与不加鉴别地扩增修复模板或过量提供修复模板而与RTDD不物理连接相反,所述修复模板核苷酸序列因而在DSB处与所述人工分子复合物的所述SSN一起呈递到感兴趣的DNA靶序列,其进而显著提高基因编辑方法的可预测性和特异性。
[0160] 在本发明所述的另一实施方式中,至少一各修复模板核酸序列通过共价和/或非共价键或附着附于至少一个RTDD序列。根据此实施方式,所述杂合RTDD和RT复合物能作为体外合成的分子提供,其随后能在感兴趣靶细胞中体外或体内或在感兴趣的体外测定内与感兴趣至少一个SSN缔合。所述细胞优选是真核细胞,包括真菌、动物或植物细胞。所述细胞也可以是原核细胞。此外,所述细胞可以是原核或真核宿主细胞,其携带在质粒上的或整合到基因组中的另一个生物体或病毒的异源靶序列。在该实施方案中,所述细胞用作宿主以对所述宿主细胞内提供的异源序列进行基因组工程。
[0161] 在本发明多个方面所述的一个实施方式中,至少一个修复模板核酸序列(RT)共价附着至少一个RTDD。共价结合或共价键是化学键,其涉及分子的原子或彼此共价附着的序列之间的电子对共享。
[0162] 在本发明多个方面所述的另一实施方式中,至少一个修复模板核酸序列非共价附着至少一个RTDD序列。非共价相互作用与共价键的差异在于其不涉及电子共享,而涉及分子/序列之间或分子/序列内电磁相互作用的更分散变化。非共价相互作用或结合因而包括静电作用、范德华力、П-效应和疏水效应。在核酸分子背景下,氢键作为静电作用非常重要。氢键(H键)是特定类型的偶极-偶极相互作用,涉及部分正的氢原子与高电负性和部分非共价结合所述氢原子的负的氧、氮、硫或氟原子之间的相互作用。
[0163] 本文所用的术语“杂交”指互补核酸即DNA和/或RNA的配对,使用一条核酸链通过碱基配对与互补链结合以形成杂交复合物的任何过程。杂交和杂交强度(即核酸之间的缔合强度)受一些因素影响,如核酸之间互补性的程度和长度、所涉及条件的严谨性、所形成杂合体的Tm以及核酸内的G:C比。术语杂交的复合物指两个核酸序列之间形成的复合物,这是通过在互补G和C碱基之间以及互补A和T/U碱基之间形成氢键。杂交的复合物或对应的杂交构建体能在两个DNA核酸分子、两个RNA核酸分子或DNA 与RNA核酸分子之间形成。对于所有考虑,所述核酸分子可以是体外或体内产生的自然出现核酸分子和/或人工或合成核酸分子。如上详述的杂交如能在DNA、RNA和 DNA/RNA序列之间形成的沃森克里克碱基对由特定氢键模式决定,其因而代表本发明所述非共价结合形式。
[0164] 关于本发明所述非共价结合,至少一个本发明的人工分子复合物的RTDD和本发明的至少一个修复模板序列能通过RNA-DNA碱基配对彼此缔合。
[0165] 另一非共价相互作用形式是至少一个修复模板序列与至少一个组分通过电荷缔合,所述组分是RTDD或SSN包含的RTDD。
[0166] 关于共价缔合或结合,所述至少一个RTDD和所述至少一个修复模板序列作为连续分子连接,在体内或体外生成。共价和非共价附着也能组合,如通过提供共价附着的 RTDD/修复模板序列,其还能包括额外的与共价附着的RTDD/修复模板序列非共价附着的修复模板核酸序列。在共价附着的RTDD/修复模板序列于体内至少部分生成且另一体内或体外生成的修复模板加入已有RTDD/修复模板复合物的情况中,此方法特别合适。
[0167] 同样由Nishimasu等,同上证明,gRNA根据本发明公开内容配置成与CRISPR多肽或其变体或催化活性片段相互作用,假设gRNA包括至少一个通常含异源双链构型的部分,其由CRISPR多肽以序列依赖性方式或序列非依赖性方式识别,所述序列依赖性方式即通过与RNA碱基(包括A、U、G和C)相互作用,所述序列非依赖性方式即通过 gRNA核苷酸序列的磷酸根与CRISPR多肽相互作用。
[0168] 根据本发明第一方面以及其它方面的某些实施方式,所述DNA靶序列位于细胞基因组内,优选原核或真核细胞,更优选真菌、动物或植物细胞,其中所述基因组包括核基因组以及其它基因组部分,包括质体的基因组。
[0169] “DNA靶序列”定义进行靶向基因组编辑的基因组区域。归因于所述RTDD和所述修复模板核酸序列本质上具有不同的功能的事实,可以存在多于一个的DNA靶区域,其对于本发明的人工分子复合物的不同组分可以是不同的。因此,一个DNA靶序列可以定义所述RTDD的序列部分互补于的感兴趣的DNA靶区域的区域,所述RTDD是 gRNA,而另一个DNA靶序列定义SSN和/或交互域将结合到的感兴趣的DNA靶区域的区域。所述修复模板核酸序列的至少一部分与基因组互补序列互补,所述序列也代表另外的DNA靶序列。所述DNA靶区域可以是感兴趣的DNA靶序列内的相同或优选不同而可能重叠的区域。
[0170] RTDD和/或SSN和/或相互作用结构域的靶位点与所述修复模板核酸序列(RT)的同源性位点之间的空间关系可以是可变的。这两个位点可以是相同的、可以是完全或部分重叠的、或者可以被感兴趣的基因组内的任何数量的核苷酸分开。所述RT可以与基因组DNA的两条链具有同源性,任选地呈现为双链构建体(例如质粒)或单独的任一条链,与靶向哪条链无关。有效的修复模板可以配置成具有对由SSN(例如Cas9)首先释放的切割的DNA链特异性的互补性(如Richardson,et al.,Nature Biotechnology.2016,doi: 10.1038/
nbt.3481中所述)。
[0171] 预测所述RTDD与所述RT之间的相互作用以及因此根据本发明的人工分子复合物的所述SSN与所述RT的紧密接近克服同源定向修复(HDR)/同源重组(HR)的通常的低效率,因为其确保相对至少一个SSN以化学计量方式原位存在的修复模板核苷酸序列在靶向基因组链断裂处的物理可用性,所述断裂通过所述至少一个SSN多肽在DNA靶序列中引入。
[0172] 因此,作为根据本发明的人工分子复合物的一部分的术语修复模板核酸序列(RT)意味着核苷酸序列,其可以是单链或双链DNA序列,其能够提供用于修饰和/或修复DNA 断裂的模板。
[0173] 在根据本发明的一个实施方案中,人工分子复合物是体外预组装的复合物,其中所述SSN、所述RTDD和所述RT以及任选的所述相互作用结构域组分或部分彼此共价附着或非共价缔合来提供。在一个实施方案中,所述RTDD/RT序列是预组装的,并且所述SSN和任选的所述相互作用结构域分别作为可转录的DNA或可翻译的RNA构建体或直接作为氨基酸序列递送到靶细胞中,并且所述RTDD/RT序列和/或所述SSN和任选的所述相互作用结构域在所述靶细胞内形成复合物。在另一个实施方案中,所述RTDD /RT序列以及所述SSN和任选的所述相互作用结构域在体外组装,并然后将任选包含其他分子(例如生物素或FAM或地高
辛)的核蛋白复合物引入感兴趣的靶细胞中或者引入包含至少一个待修饰的感兴趣的DNA
靶核苷酸序列的体外系统中。
[0174] 将功能性预组装的人工分子复合物引入靶细胞导致靶向双链断裂和同时修复和位点特异性修饰,归因于以下事实:所述至少一个位点特异性核酸酶(SSN)的活性立即伴随根据本发明的所述DNA靶序列位点处与DNA修复模板核苷酸序列的后续同源重组,所述DNA修复模板核苷酸序列连接所述RTDD,所述RTDD也直接与SSN相互作用。因此,由于在合适化学计量的修复模板和核酸酶组合物中,所述人工分子复合物可以以协同方式到达靶位点,阻碍高特异和可控制基因组编辑事件的RT或非特异NHEJ事件可用性不佳的缺点(参见上面的发明背景)能同时降低。另一个益处是修复模板的脱靶整合的可能性归因于其与蛋白质的物理缔合以及复合物的RTDD而降低,其中SSN和/或 RTDD本身不能整合到基因组中。
[0175] 根据本公开所述术语“靶向同源指导的修复”包括能通过根据本申请所述修复模板序列引入的任何改变类型,其可独立包括序列插入、至少一个序列位置编辑、缺失或重排,高等真核生物中基因组编辑方法的优选策略目前是插入、缺失或编辑,因为这些策略允许靶向敲入或敲除DNA靶序列内的感兴趣序列,或位点特异性修饰至少一个序列。
[0176] 使用CRISPR核酸酶作为离体或体内与根据本发明的杂交核酸序列协同形成的SSN 的人工分子复合物介导的靶向同源定向修复的实例可以在图3A至E中找到,图3A至 E说明了对于示例性SSN/向导核酸(RTDD)/修复模板(RT)复合物和对于给定的内源 DNA靶序列,DNA识别、结合、切割和随后修复的时间顺序。
[0177] 在根据本发明的各个方面的一个实施方案中,所述修复模板核酸序列和/或所述至少一个RTDD序列包含选自天然或非天然存在的核苷酸序列的核苷酸序列,包括合成的核苷酸序列,任选地包含主链和/或碱基修饰,其中所述向导核酸序列包含单链或部分单链 RNA核苷酸序列,并且其中所述修复模板核酸序列包含单链或双链DNA核苷酸序列。
[0178] 任何CRISPR基因组编辑方法的挑战在于,gRNA和作为SSN的功能性CRISPR多肽必须以功能性(未降解)方式被转运至包含基因组DNA(即DNA靶序列)的细胞核或任何其他区
室。由于RNA不如多肽或双链DNA稳定并且具有更高的转换率,特别是因为它可以容易地被核酸酶降解,在根据本发明的第一方面的一些实施方案中,作为RTDD 的gRNA和/或DNA修复模板核酸序列包含至少一个非天然存在的核苷酸。根据本发明增加gRNA和/或DNA修复模板核酸序列的稳定性的优选的主链修饰选自由以下组成的组:硫代磷酸修饰、甲基膦酸酯修饰、锁核酸修饰、O-(2-甲氧基乙基)修饰、二硫代磷酸酯修饰和肽核酸修饰。值得注意的是,所有所述主链修饰仍允许在两条核酸链之间形成互补碱基配对,但更耐受内源核酸酶的切割。取决于根据本发明使用的核酸酶,可能有必要不修饰gRNA的那些核苷酸位置,所述核苷酸位置参与与CRISPR多肽的序列非依赖性相互作用。所述信息可以源自可用于CRISPR核酸酶/gRNA复合物的可用结构信息。
[0179] 在根据本发明第一方面的某些实施方案中,设想所述RTDD和/或所述DNA修复模板RT核酸序列和/或所述相互作用结构域包含核苷酸和/或碱基修饰,所述核苷酸和/或碱基修饰优选在选择的而不是所有的核苷酸序列位置。这些修饰选自由以下组成的组:添加吖啶、胺、生物素、瀑布蓝、胆固醇、Cy3、Cy5、Cy5.5、Daboyl、地高辛、二硝基苯基、Edans、6-FAM、荧光素、3'-甘油、HEX、IRD-700、IRD-800、JOE、磷酸补骨脂素、若丹明、ROX、硫醇(SH)、间隔物、TAMRA、TET、AMCA-S"、SE、  Marina Pacific OregonRhodamine Rhodamine  Rhodol 和Texas 优选地,所
述添加物掺入用作RT和/或RTDD和/或相互作用结构域的核酸序列的3'或5'末端,作为本发明的人工分子复合物的一部分。该修饰具有以下有利效果:可以可视化细胞内RTDD和/或相互作用结构域和/或DNA修复模板核酸序列的细胞定位以研究各序列的分布、浓度和/或可用性。此外,可以研究本发明的人工分子复合物与内源分子的相互作用。研究这种相互作用或用于可视化如上详述的修饰或标记的核苷酸序列的方法可用于相应领域的技术人员。
[0180] 对于根据本发明的各个方面的任何实施方案,所述至少一个位点特异性核酸酶和/ 或所述至少一个修复模板核酸序列和/或所述至少一个相互作用结构域和/或所述至
少一个RTDD包括至少一个核定位序列(NLS)、质体定位序列(PLS),优选线粒体定位序列或叶绿体定位序列。因此,所述人工分子复合物的至少一个组分包含将所述复合物靶向核基因组的序列。在某些实施方案中,所述RTDD也可携带至少一个定位序列。优选地,所述人工分子复合物的所述SSN和/或所述相互作用结构域将包含至少一个NLS或至少一个PLS,或者它将包含至少一个NLS和至少一个PLS序列。该至少一个NLS或PLS 序列将整个人工分子复合物转运至细胞核。NLS或PLS标记的蛋白质可以作为NLS或 PLS标记的融合分子产生。
[0181] 对于实施方案,其中根据本发明的人工分子复合物用于体外目的,例如体外在质粒或任何其他载体上修饰基因组或基因组的一部分,可能不需要定位序列。定位序列有助于将所述人工分子复合物靶向感兴趣的靶细胞内相关区室中的至少一个感兴趣的DNA 靶序列。根据本发明的某些实施方案,所述定位序列可包含核定位序列、质体定位序列,优选线粒体定位序列或叶绿体定位序列。因此,所述至少一个SSN和/或所述至少一个 RTDD和/或所述至少一个相互作用结构域将包含至少一个相应的定位序列,优选地用于知道所述复合物至细胞的核基因组的核定位序列(NLS)。在一些实施方案中,所述SSN 和/或所述RT和/或所述至少一个相互作用结构域和/或所述RTDD可在氨基末端或氨基末端附近(对于肽和
蛋白质)包含约或大于约1、2、3、4、5、6、7、8、9、10或更多NLS,或者在羧酸末端或羧酸末端附近(对于肽和蛋白质)包含约或大于约1、2、3、4、5、6、 7、8、9、10或更多NLS,或这些的组合(例如,肽和蛋白质的氨基末端的一个或多个 NLS和羧基末端的一个或多个NLS)。所述人工分子复合物的基于非氨基酸的组分将携带定位序列,例如在5'-和/或3'-末端,正如对核酸序列的情况。此外,定位序列(优选合成的定位序列)也可以在分子内的任何位置添加,条件是它不会干扰所述分子复合物内的相互作用和/或本发明的人工分子复合物的结合、切割和修复能力。当存在多于一个 NLS存在时,可以独立地选择每个NLS,使得单个NLS可以存在于多于一个副本中和/ 或与一个或多个副本中存在的一个或多个其他NLS组合。
[0182] 在本发明的一个优选实施方案中,所述至少一个SSN和/或所述相互作用结构域将包含定位序列,并且可包含至多6个NLS。在一些实施方案中,当NLS的最近氨基酸在沿着来自N-或C-末端的多肽链的约1、2、3、4、5、10、15、20、25、30、40、50 或更多个氨基酸内时,认为NLS在所述人工分子复合物的氨基酸组分的N-或C-末端附近。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV(SEQ ID NO:1);来自核质的NLS(如核质二分NLS,带有序列KRPAATKKAGQAKKKK(SEQ ID NO:2));c-myc NLS,具有氨基酸序列 PAAKRVKLD(SEQ ID NO:3)或RQRRNELKRSP(SEQ ID NO:4);hRNPAI M9 NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:5);来自输入蛋白α的188结构域的序列 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:6); 
myoma T蛋白的序列VSRKRPRP(SEQ ID NO:7)和PPKKARED(SEQ ID NO:8);人p53 的序列
PXPKKKPL(SEQ ID NO:9),其中SEQ ID NO:9位置8处的"L"可选;小鼠c-abl IV的序列
SALIKKKKKMAP(SEQ ID NO:10);流感病毒NS1的序列DRLRR(SEQ ID NO:1 1)和PKQKKRK(SEQ ID NO:12);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:13);小鼠Mx1蛋白的序列
REKKKFLKRR(SEQ ID NO:14);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:15);和类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:
16)。在一些实施方式中,所述定为信号可以是质体定位信号,例如质体或线粒体定位信号。
合适的质体定位信号选自叶绿体转运肽或线粒体靶向肽。此外,获自HIV Tat蛋白的肽或编码其的序列可能适合将感兴趣构建体或分子靶向到感兴趣细胞和/或亚细胞区室内。合适的Tat肽衍生自 YGRKKRRQRRR(SEQ ID NO:17)或包括基序GRKKR(SEQ ID NO:18)。在另一个示例性实施方案中,衍生自酵母线粒体Cox4p(SEQ ID NO:30)的序列或衍生自人苹果酸脱氢酶线粒体前导序列(MLS)的序列(SEQ ID NO:31)或衍生自拟南芥硫辛酸合酶的序列 
(NCBI参考序列号:NP179682.1在本文中称为SEQ ID NO:32)可用于将根据本发明的人工分子复合物定位到线粒体基质中以修饰线粒体DNA。
[0183] 在特定实施方案中,将所述人工分子复合物靶向叶绿体可能是感兴趣的。在许多情况下,这种靶向可以通过称为叶绿体转运肽(CTP)或质体转运肽的N-末端延伸的存在来实现。如果表达的多肽要在植物质体(例如叶绿体)中区室化,则来自细菌来源的染色体转基因必须具有与编码表达多肽的序列融合的编码CTP序列的序列。因此,外源多肽向叶绿体的定位通常通过将编码CTP序列的多核苷酸序列可操作地连接到编码外源多肽(即根据本发明的至少一个SSN)的多核苷酸的5'区域的方式来实现。在转移到质体期间,在加工步骤中除去所述CTP。然而,加工效率可能受到所述CTP的氨基酸序列和肽的NH2末端附近的序列的影响。已经描述的靶向叶绿体的其他选择是玉米cab-m7信号序列(美国专利7,022,896,WO 97/41228)、豌豆谷胱甘肽还原酶信号序列(WO 97/41228) 和US 2009/029861A1中描述的CTP。
[0184] 根据本发明的各种定位序列可以编码在编码所述至少一个定位序列的质粒或表达盒上,以将所述定位序列可操作地连接到相应的分子,或者所述定位序列可以以合成方式附着到蛋白质、核酸或者形成本发明的人工分子复合物的另一个生物分子。
[0185] 在又一个实施方案中,除了至少一个定位序列之外或代替所述至少一个定位序列,可以使用核输出信号中的至少一种。
[0186] 在其中所述人工分子复合物以核酸序列形式借助于至少一个递送载体递送至细胞的实施方案中,所述定位信号可以作为编码定位信号的核酸序列以共价方式共价附着至所述至少一个SSN和/或相互作用结构域编码序列。
[0187] 在一个实施方案中,所述至少一个SSN和/或多肽相互作用结构域可以与荧光报告基因或蛋白质共价或非共价缔合。该报道因子可以作为DNA、作为mRNA、作为独立蛋白质、或作为与所述至少一个SSN和/或所述相互作用结构域多肽连接的融合蛋白来递送。
[0188] 根据本发明的RTDD/RT分子可以通过几种方法生产。它可以通过化学合成,在合成过程中适当地添加RNA碱基和在合成过程中适当地添加DNA碱基来制备。可选地, RTDD和/或RT可以彼此独立地合成,并且然后如上所述分子可以彼此缔合。另一种选择是使用T4 RNA连接酶或另一种能够将核酸与RNA(优选单链RNA)连接的酶。这里,所述RNA和DNA组分通过任何方法独立产生、混合、根据制造商的方案暴露于酶,并且它们将通过连接共价连接,即产生共价附着。将所述RTDD与所述RT共价键合的其他策略包括将它们中的每一个与其他连接化学基团或复合物(例如肽)连接。当杂交 RTDD/RT序列必须稍后在细胞内检测时,或当另一个功能应归因于杂交核酸序列时,这种类型的方法是特别合适的。所述RTDD和/或所述RT核酸序列的化学修饰对于稳定所述RTDD/RT序列和避免细胞酶降解以实现所述RTDD/RT序列和所述至少一个位点特异性核酸酶在感兴趣的DNA靶位点的高同时可用性非常重
要。。
[0189] 在其中所述RTDD是gRNA并且所述SSN是CRISPR核酸酶(优选Cas或Cpf1核酸酶)的实施方案中,可以存在多于一个RTDD。已经发现同时使用多个gRNA将增强基于CRISPR的基因激活或抑制,并且可以显著减少对基因驱动具有抗性的等位基因的出现。因此,作为RTDD的gRNA可以作为单个未加工的转录物呈现,并然后通过RNA 聚合酶II转录从核中的前体切除所述gRNA,同时避免gRNA输出至细胞质(Port and Bullock,Nat.Methods,2016,vol.13,no.10,852-854)。在那些实施方案中,所述gRNA可以tRNA-gRNA质粒呈递,使得内源性tRNA加工机器将释放多个功能性gRNA。
[0190] 根据本发明各个方面的某些实施方案,所述至少一个位点特异性核酸酶或编码其的序列,和所述至少一个相互作用结构域或编码其的序列,和/或所述至少一个修复模板对接结构域或编码其的序列通过至少一个接头结构域连接。该接头序列可用作分子间隔物以实现所述人工分子复合物的所述RTDD序列和所述修复模板核酸序列以及所述SSN 和任选的相互作用结构域组分的最佳几何结构,使得所有单个组分可完全发挥其功能。所述接头或系链区的长度和组成可以是重要的设计方面(例如对于某些RTDD和RT对)。在一个实施方案中,特别是RT的左同源臂的5'-末端可包含接头区。系链或接头可以采用多种形式。本领域技术人员基于本公开以及具有目前广泛用于基因组编辑的修复模板的通常设计参数的
知识可以从RT的左侧或右侧同源臂开始,允许RT的这一部分充当系链或柔性接头以允许RT朝向染色体靶标移动以及充当介导HR反应的同源性。
[0191] 在其中所述人工分子复合物包含至少一个SSN以及至少一个相互作用结构域(IA) 的实施方案中,所述SSN和所述IA可以通过合适的接头连接。
[0192] 要考虑的设计参数包括相对于作为SSN的CRISPR多肽的切割位点的修复模板同源性的几何结构,所述修复模板与之同源的感兴趣的DNA靶位点内的链,修复模板的大小,其可以影响无论是接头还是将引入接头的长度。接头序列可用于所述gRNA和所述修复模板的共价和非共价缔合。基于本公开并基于Nishimasu(同上),Tsai等(Nature Biotechnology,
32,569-576,(2014))或Shechner等(Nature Methods,12(7),664-670(2015), doi:
10.1038/nmeth.3433)中提供的信息,在使用几种杂合核酸的情况下,本领域技术人员因此可以为杂交核酸序列定义合适的接头区域以定义作为RTDD的gRNA与RT之间或不同gRNA和/或RT之间的特定序列,使得所述gRNA和所述RT部分都可以在没有任何空间限制的情况下完全发挥其功能。所述至少一个接头区域可包含至多10、15、20、 25、30、35、40、45、50、55、60、
65、70、75、80、85、90、95或100个额外的核苷酸至将所述至少一个gRNA与RT适当分离或优化所述gRNA和/或所述RT的定位。在某些实施方案中,所述接头序列可包含最多150、200、250、
500、1,000、1,500、2,000、 2,500、3,000、3,500、4,000、4,500或至少4,700或5,000个核苷酸以实现更好的所述gRNA 和/或所述RT的定位。
[0193] 对于包含核酸序列的任何RTDD与RT的非共价缔合,一种方法是在RTDD和RT 中提供部分互补序列,使得两个分子将天然地通过核酸碱基配对缔合。
[0194] 可以想到其他非共价缔合方法,例如使用分子的电荷以使所述RT与所述人工分子编辑复合物的某些组分充分缔合。在另一个实施方案中,所述人工分子复合物的至少一个组分可以包含标签和结合伴侣,即所述RTDD和所述SSN,或所述RTDD和所述相互作用结构域,和/或其RT部分分别包含标签的相应结合伴侣从而实现RTDD或相互作用结构域与RT之间的碱基配对和RTDD与SSN多肽之间的非共价相互作用,任选地除了RTDD或相互作用结构域与RT之间的碱基配对和RTDD与SSN多肽之间的缔合之外,以增加相互作用并因此增加人工分子复合物的稳定性。
[0195] 在人类细胞中,与标准gRNA对照相比,Cas9载有在3'末端的具有28bp额外序列的gRNA加上缔合的187个氨基酸(21.4kD)的Csy4蛋白在DSB诱导中维持至少90%活性(Tsai et al.,Nature Biotech.,32,2014)。这表明Cas9作为SSN对于绑定到sgRNA的3' 末端的货物有相当大的耐受性以及对于延伸的sgRNA分子有适当结构功能潜力。Cas9 的耐受性部分是由于核酸序列的游离3'端具有灵活性,其在标准gRNA中终止于保持在 Cas9蛋白质结构外部并且在大致垂直于保持活跃位点的表面的表面上的发夹中 (Nishimasu et al.,
2014;Anders et al.,2014)。此外,Shechner et al.("Multiplexable, locus-specific targeting of long RNAs with CRISPR-Display",Nature Methods,12(7), 664-670
(2015),doi:10.1038/nmeth.3433)显示长的非编码ssRNA分子可以转录附着 sgRNA的5'或
3'末端或sgRNA的内环中,而不会损失人细胞基因组中dCas9蛋白的序列特异性靶向活性。
维持序列特异性靶向活性的核糖核蛋白复合物适应高达4.8kb的 ssRNA。
[0196] 在根据本发明的各个方面的一个实施方案中,所述修复模板核酸序列在向导核酸序列的3'末端与RTDD(例如向导核酸序列)缔合,和/或所述修复模板核酸序列与所述 RTDD(例如向导核酸序列)的5'末端缔合,和/或所述修复模板核酸序列位于RTDD内,并因此形成所述RTDD的单独功能部分。
[0197] 令人惊讶的是,本发明的发明人发现,由于它通过CRISPR多肽(例如来自CRISPR II型系统的Cas9,或来自CRISPR V型系统的Cpf1或另一种CRISPR多肽效应子)递送至靶标,携带3'定位的DNA修复模板序列(RT)(单链或双链RT)的作为RTDD的gRNA 可以自由地与同源序列相互作用。当使用携带5'定位的DNA修复模板序列(单链或双链 RT,或两者,位于3'和5'的RT)的作为RTDD的gRNA时,进行类似的观察。因此,位于3'或5'意味着RT与gRNA的3'或5'末端共价附着,或者它可以意味着RT与对应于附着于gRNA的3'和/或5'区域的序列的区域杂交(即非共价结合)。此外,所述RT可以共价掺入在gRNA的茎环中,或者它可以与所述gRNA茎环非共价缔合以实现功能性杂交核酸构建体,其中所述RTDD和所述RT直接相互作
用。因此,发现如上所述在gRNA 的不同位置处与gRNA缔合的DNA被良好的耐受,并因此这种新形式的杂交复合物适合于将以下基因编辑原理的两个关键方面带到一起:(1)由RTDD/
gRNA介导的靶向的精确度和(2)由RT介导的有效和定点修复。此外存在协同效应,即使得gRNA和RT紧密接近以增加杂交构建体在感兴趣的DNA靶位点处和作为感兴趣的SSN的
CRISPR多肽一起的稳定性和可用性。
[0198] 在RT附着于基于RTDD的核酸(例如gRNA或gDNA)的3'或5'末端的情况下,作为本发明的人工分子复合物的一部分递送的该扩展修复模板核苷酸序列的长度几乎没有限制。RT的长度与RTDD的类型无关,而是由要引入的靶向的修改决定。典型的RT 序列可具有约20至8,000bp或甚至更长的长度,例如20至5,000bp、30至8,000bp、30 至5,000bp、40至8,000bp、
40至5,000bp、50至8,000bp、50至5,000bp、60至8,000bp、 60至5,000bp、70至8,000bp、70至
5,000bp、80至8,000bp、80至5,000bp、90至8,000bp、 90至5,000bp、100至8,000bp、100至5,
000bp的单链和/或双链DNA而没有观察到显著损失至少一个SSN的切割频率。如本领域技术人员所知,RT模板的长度强烈地由要实现/引入的修饰/插入的类型决定。在打算编码感兴趣的蛋白质的较大核酸序列的敲入的情况下,则RT序列的长度将具有以下长度:编码感兴趣的蛋白质的核酸构建体加上位于所述序列左侧和右侧的两个足够长的同源臂的长度。因此,原则上没有1,500bp的上限,但是所述RT可以具有高达5,000或甚至更多碱基对(bp)。例如,目前用质粒DNA 作为修复模板引入并在靶位点内生成修复模板的较大插入物采用
800bp和更大的左右同源臂,使得修复模板的总长度可以具有几千bp。核酸插入物的长度应设计成不抑制可在预实验中确定的感兴趣的位点特异性核酸酶。
[0199] 本发明的分子复合物的不同组分(即所述至少一个SSN、所述至少一个RTDD和所述至少一个RT、以及任选地至少一个相互作用结构域)以功能方式缔合。
[0200] 术语“以功能方式缔合”意味着使人工复合物的组分接触,使得所述SSN和所述RTDD可以彼此相互作用,优选通过如上详述的非共价缔合的形式。与至少一个RT序列相互作用的所述至少一个RTDD序列在所述至少RTDD序列与所述至少一个相应的 SSN或其感兴
趣的变体或催化活性片段接触之前、之后或同时独立地组装。在一个实施方案中,任选包含至少一个相互作用结构域的整个复合物在其被引入包含至少一个待编辑的感兴趣的DNA靶区域的靶细胞之前在体外缔合。在另一个实施方案中,在所述至少一个相互作用的RTDD/RT序列之前或之后,将至少一个SSN和任选的相互作用结构域引入所述至少一个靶细胞。可以通过转染多肽序列或通过用编码所述至少一个SSN 多肽的RNA转染或转化至少一个靶细胞或通过引入可在靶细胞中转录和翻译的编码至少一个SSN多肽的递送构建体将SSN多肽引
入靶细胞中。同样地,在某些实施方案中,所述RTDD序列和所述修复模板核酸序列可以作为体外提供和组装的构建体同时提供。可选地,可以在合适的递送载体的帮助下将所述RTDD序列和/或所述修复模板核酸序列转染或转化到靶细胞中。在一个优选的实施方案中,整个人工分子复合物在体外组装,并然后引入感兴趣的靶细胞中,以允许对基因组编辑构建体进行最佳的空间和化学计量控制。在另一个优选的实施方案中,在所述RTDD/RT序列之前将所述至少一个SSN 和任选的相互作用结构域多肽引入靶细胞,并然后将所述至少一个
RTDD/RT序列之后引入到感兴趣的靶细胞中。归因于与多肽相比RNA的固有的低稳定性,对于使用例如作为RTDD的gRNA的某些方法,顺序次序可能是优选的,使得引入的gRNA将立即被SSN结合并稳定(即对于CRISPR多肽已存在于细胞中的某些实施方案中)。不希望受理论束缚,与单独的向导RNA相比,向导核酸序列和修复模板核酸序列的离体组装也可以增强构建体的稳定性。
[0201] 目前,存在多种植物转化方法,以将遗传构建体形式的遗传物质引入感兴趣的植物细胞中,包括本领域技术人员已知的植物生物技术领域的生物学和物理学手段。常见的生物方式是用农杆菌(Agrobacterium spp.)转化,就多种不同植物材料而言农杆菌已使用了几十年。病毒载体介导的植物转化代表另一个向感兴趣的细胞引入遗传物质的策略。在植物生物学中物理方式发现应用是粒子轰击,也称为生物射弹转染或微粒介导的基因转移,其是指用于将包含感兴趣的核酸或遗传构建体的包被的微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。物理引入方式适合引入核酸(即RNA和/或DNA)以及蛋白。同样,存在特定转化或转染方法以向植物细胞特异性引入感兴趣的核酸或氨基酸构建体,包括电穿孔、微注射、纳米粒子和细胞穿透肽(CPP)。此外,存在基于化学的转染方法以引入遗传构建体和/或核酸和/或蛋白,尤其包括磷酸转染、用脂质体如阳离子脂质体转染、或阳离子聚合物转染,包括DEAD-葡聚糖或聚乙烯亚胺或其组合。因此,所述递送方法和递送载剂或货物本质上不同于用于其它真核细胞(包括动物和哺乳动物细胞)的递送工具,且各递送方法必须特定调整并优化,从而用于介导基因组编辑的感兴趣的构建体能以全功能和活性方式引入感兴趣的靶细胞的特定区室。上述递送技术(单独或组合)可用于将所述至少一个人工分子复合物或其至少一个亚组分,即根据本发明的至少一个SSN、至少一个RTDD、至少一个RT和任选至少一个IA或编码上述亚组分的序列在体内或体外插入靶细胞。
[0202] 在某些实施方案中,本发明的人工分子复合物的递送模式可选自PEG介导的 SSN-(IA)-RTDD-RT复合物的递送、PEG介导的编码SSN-(IA)-RTDD(所述RTDD例如是gRNA或gDNA)的质粒的递送并且平行递送RT、SSN-(IA)-RTDD-RT复合物的轰击、编码蛋白(SSN和任选的IA)-RTDD(例如gRNA/gDNA)的质粒的轰击并且平行递送RT,细胞穿透肽(CPP)介导的SSN-(IA)-RTDD-RT复合物的递送、SSN-(IA)-RTDD-RT复合物的脂质转染、编码蛋白质(SSN和任选的IA)-RTDD(例如gRNA/gDNA)的质粒的脂质转染并且平行递送RT、或蛋白质(SSN和任选的IA)的稳定表达和RTDD的瞬时递送或对于某些RTDD,编码RTDD的质粒的瞬时递送和rtDNA的平行递送。
[0203] 在某些实施方案中,gRNA的crRNA部分包含茎环或优化的茎环结构或优化的二级结构。在另一个实施方案中,所述成熟crRNA在顺向重复序列中包含茎环或优化的茎环结构,其中所述茎环或优化的茎环结构对切割活性是重要的。在某些实施方案中,所述成熟crRNA优选包含单个茎环。在某些实施方案中,所述顺向重复序列优选包含单个茎环。在某些实施方案中,通过引入影响茎环RNA双链体结构的突变来修饰效应蛋白复合物的切割活性。在优选的实施方案中,可以引入维持茎环的RNA双链体的突变,从而维持效应蛋白复合物的切割活性。在其他优选的实施方案中,可以引入破坏茎环的 RNA双链体结构的突变,从而完全消除所述效应蛋白复合物的切割活性。
[0204] 作为根据本发明的人工分子复合物的一部分的根据本发明的至少一个修复模板核酸序列的大小可以变化。取决于待修饰的DNA靶序列,它可以在约20bp至约5,000bp 或甚至8,000bp的范围内。
[0205] 用于产生特定突变或插入感兴趣的DNA靶区域的HOR模板需要围绕将被修饰的靶序列的一定量的同源性。在核酸酶缺陷型SSN(例如CRISPR多肽)的情况下,最好是由 SSN或融合伴侣(即,相互作用结构域)影响的修饰的插入位点距离DSB不超过100bp,理想情况下如果可能的话距离小于10bp,并且同源臂的总长度是设计这些时需要考虑的重要因素。较长的距离将起作用,但效率将可能较低,并且可能必需引入选择标记以确保存在引入感兴趣的DNA靶序列中的所需修饰。
[0206] 根据本发明的各个方面,所述至少一个修复模板核酸序列可以是单链或双链DNA 核酸分子。可以以一个或多个线性ss-或ds-DNA分子的形式提供所述至少一个修复模板核酸序列。然而,当离体组装分子复合物时,可能适合使用至少一个离体产生的单链或双链修复模板核酸序列,这特别适合于增加功能性SSN-RTDD-RT复合体的可用性,因为所有组分能以正确化学计量同时引入从而增加基因组编辑方法的特异性
[0207] 可以使用常规的现有技术方法完成较大核酸序列(单链或双链)的合成。应注意,对于某些实施方案,部分单链和/或部分双链修复模板核酸序列也可能是合适的。在引入人工分子复合物的多肽组分的同时或之前或之后,单链和/或双链核酸序列和任何类型的引入的任何组合都是可能的。在一个实施方案中,设想将根据第二方面的分子复合物引入靶细胞,其中所述靶细胞包含编码修复模板或额外的修复模板序列的额外的质粒载体,因为使用多于一个修复模板核酸序列对于某些基因组编辑方法是有益的,其中所述人工分子复合物然后可以在提供不同组分后在体内组装。通常,所述修复模板核酸序列在 DNA靶区域所在的靶细胞内该位点的高物理可用性对于允许高度精确的基因组编辑事件具有突出的重要性。在某些实施方案中,特别是单链(ss)DNA修复模板适于达到适当的平衡,所述适当的平衡为保持尽可能低的分子量同时为同源相互作用提供足够的长度以实现最佳的同源
定向修复。
[0208] 在根据本发明任一方面的一个实施方案中,所述至少一个SSN是CRISPR多肽,并且独立地选自由以下组成的组:来自以下的Cas多肽:链球菌属(Streptococcus spp.)包括化脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、金黄色葡萄球菌(Staphylococcus aureus),或奈瑟菌属(Neisseria spp.)包括脑膜炎奈瑟菌(Neisseria meningitides),棒杆菌(Corynebacter),萨特氏菌(Sutterella),军团菌(Legionella),密螺旋体(Treponema),产线菌(Filifactor),真细菌(Eubacterium),乳酸菌(Lactobacillus),支原体(Mycoplasma),拟杆菌(Bacteroides),Flaviivola,黄杆菌(Flavobacterium),Sphaerochaeta,固氮螺菌(Azospirillum),葡糖醋杆菌
(Gluconacetobacter),罗氏菌(Roseburia),细小棒菌 (Parvibaculum),硝酸盐裂解菌(Nitratifractor),支原体和弯曲杆菌(Campylobacter), Candidatus Micrarchaeum 
acidiphilum ARMAN-1,俭菌总门细菌(Parcubacteria)(GenBank: APG80656.1),硫化叶菌属(Sulfolobus spp.),包括冰岛硫化叶菌(Sulfolobus islandicus) HVE10/4(GenBank:
ADX81770.1)或REY15A(GenBank:ADX84852.1);或其中所述CRISPR多肽选自来自古细菌或细菌的Cpf1多肽,包括以下的Cpf1多肽:氨基酸球菌属(Acidaminococcus spp.)包括氨基酸球菌属BV3L6,毛螺菌(Lachnospiraceae spp.)包括毛螺菌ND2006、弗朗西斯氏菌
(Francisella spp.)包括新凶手弗朗西丝氏菌(Francisella novicida)U112,挑剔真杆菌(Eubacterium eligens),普氏菌(Prevotella spp.)或卟啉单胞菌 (Porphyromonas 
spp.),或其变体和/或功能片段和/或组合,包括CRISPR多肽切口酶或缺乏内切核苷酸活性的CRISPR多肽。
[0209] 在根据本发明的一个实施方案中,根据本发明的RTDD/RT序列可以与SSN切口酶(例如Cas9切口酶)使用,所述SSN切口酶是使脱靶突变最小化的突变体,其中使用成对的向导RNA,每个成对的向导RNA对Cas9衍生的切口酶突变体具有特异性。
[0210] 在一些实施方案中,所述至少一个SSN和任选的至少一个相互作用结构域作为体外表达、翻译或合成的多肽提供。在一些实施方案中,使用递送载体编码至少一个 CRISPR多肽,其中所述递送载体可额外包含调节序列或定位信号。SSN多肽相对于相应的野生型酶突变,使得突变的SSN酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力,所述靶序列也包含在根据本发明的各种实施方案中。例如,可以使用来自化脓性链球菌的Cas9的RuvC I催化结构域中的天冬氨酸-丙氨酸取代(D10A),其将来自切割感兴趣的DNA靶区域的两条链的核酸内切酶的Cas9转化为切割单链的切口酶。使Cas9多肽成为切口酶的突变的其他实例包括但不限于H840A、N854A和N863A。作为另一个实例,可以突变Cas9的两个或更多个催化结构域(RuvC I、RuvC II和RuvC III或HNH结构域)以产生基本上缺乏所有DNA切割活性的突变的Cas9。在一些实施方案中,D10A突变与H840A、N854A或N863A突变中的一个或多个组合以产生基本上缺乏所有DNA切割活性的Cas9酶。在一些实施方案中,当突变的酶的DNA切割活性为非突变形式的酶的DNA切割活性的约不超过25%、10%、5%、1%、0.1%、
0.01%或更低时,认为SSN酶基本上缺乏所有DNA切割活性;一个例子是与未突变的野生型形式相比,突变形式的DNA切割活性无效或可忽略不计。当所述酶不是来自化脓性链球菌的Cas9时,可以在对应于SpCas9的位置10、762、840、854、863和/或986(其可以例如通过标准序列比较工具确定)的任何或所有残基处进行突变。特别地,在来自化脓性链球菌的Cas9中优选任何或所有下列突变:D10A、E762A、H840A、N854A、N863A 和/或D986A;根据本公开内容还设想了对任何替代氨基酸的保守取代。对于某些实施方案,这些突变在其他Cas9中相应位置的相同或保守取代也是可能的,特别是来自化脓性链球菌的Cas9中的D10和H840。然而,在其他Cas9中,对应于来自化脓性链球菌的Cas9的D10和H840残基也是可能的。给定CRISPR蛋白的“直系同源物”或“直系同源”也可用于本发明的实践中。直系同源物是不同物种中的基因,其通过物种形成从共同的祖先基因进化而来。通常,直系同源物在进化过程中保持相同的功能。最优选地,作为SSN的Cas9酶来自或衍生自化脓链球菌Cas9,或金黄色葡萄球菌Cas9,或来自嗜热链球菌的野生型Cas9,其蛋白质序列在SwissProt数据库中以登录号G3ECR1 给出。类似地,化脓性链球菌Cas9或金黄色葡萄球菌Cas9以登录号Q99ZW2包含在SwissProt中。
[0211] 在一个实施方案中,根据本发明的作为RTDD序列的向导RNA被设计用于对选定的SSN酶或特定长度的多肽具有最佳活性(即识别性质),因此通过截短编码可在体外或体内转录或翻译的SSN酶的核酸分子或通过提供合成的SSN多肽,所述SSN酶可被截短为野生型SSN的催化活性片段,使其长度小于相应的野生型酶。产生嵌合SSN酶,其中所述酶的不同部分在不同的直向同源物之间调换或交换以获得具有定制特异性的嵌合酶也是可能的。
[0212] 因此,根据本发明的“变体”或“功能片段”包含衍生自野生型SSN和/或相互作用结构域和/或RTDD蛋白的任何SSN和/或相互作用结构域和/或RTDD蛋白或其截短形式,即与野生型酶具有一定程度的序列同源性,但是它已经以本文所述的某种方式被突变(修饰)。例如,Cas9衍生的核酸酶的酶活性在靶位点序列处产生双链断裂,其与向导序列的20个核苷酸杂交并且具有包括NGG/NRG的前间隔区邻近基序(PAM)序列实例或如本文所述在靶序列的20个核苷酸之后确定的PAM。通过产生具有切口酶活性或核酸酶死亡变体的SSN变体,可以改变该酶功能。此外,可以对根据本发明的SSN和/ 或相互作用结构域和/或RTDD多肽变体进行密码子优化以使SSN和/或相互作用结构域和/或RTDD多肽适应靶细胞(优选真核细
胞,优选动物或植物细胞)的密码子使用。
[0213] 在根据本发明的优选实施方案中,人工分子复合物的组分,特别是SSN或IA组分,或其催化活性片段仍然发挥野生型多肽的催化功能,和/或其他组分可以是密码子优化的,和/或所述SSN多肽和/或所述相互作用结构域和/或所述RTDD和/或所述RT可以与标签序列连接,以鉴定靶序列和/或所述人工分子复合物的位置。所述标签可以选自由以下组成的组:多组氨酸(His)-标签、谷胱甘肽-S-转移酶(GST)-标签、硫氧还蛋白-标签, FLAG-标签、具有荧光特性的标签,例如选自(E)GFP((增强的)绿色荧光蛋白)标签、 DsRed-标签、mCherry-标签、(t)dtomato-标签、mNeonGreen-标签等,或链霉抗生物素蛋白或链霉标签,麦芽糖结合蛋白(MBP)标签、允许靶向亚细胞区室(包括线粒体或细胞核) 的转运肽、snap-标签和/或分泌标签(允许分泌与其连接的氨基酸序列)、正常不在天然存在的非天然氨基酸、或上述标记的组合。人工分子复合物的蛋白质组分(例如所述SSN 和/或所述相互作用结构域)可包含任何额外的蛋白质序列,和任选两个结构域之间的接头序列。可以与所述至少一个人工分子复合物的任何组分融合的蛋白质结构域的实例包括但不限于表位标签、报告基因序列和具有以下一种或多种活性的蛋白质结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His) 标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡糖酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。CRISPR酶可以与编码蛋白质或蛋白质片段的基因序列融合,所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子,包括但不限于麦芽糖结合蛋白(MBP)、S标签、Lex A DNA结合结构域(DBD)融合物、GAL4 DNA结合结构域融合物和单纯疱疹病毒(HSV)BP16蛋白融合物。
[0214] 在一个实施方案中,所述人工分子复合物的至少一个组分可以是作为DNA切口酶的修饰的功能,和/或所述SSN多肽或其催化活性片段可以与具有另一个功能部分(优选具有酶功能的功能性多肽部分,优选具有染色质建模功能和/或刺激同源重组和/或修饰转录的功能部分)的融合分子的形式存在。当分析多细胞生物的组织内的至少一个经修饰的细胞时,优选这种标签和标记蛋白(尤其是荧光蛋白标签)具有明亮的荧光,使得它们甚至可以在复杂组织的更深层中确定。合适的荧光蛋白是可商购的,并且可以由本领域技术人员容易地选择用于特定目的。
[0215] 根据本发明的各种实施方案,所述SSN和/或相互作用结构域和/或RTDD多肽和/ 或所述RTDD和/或RT序列包含至少一个核定位序列和/或质体定位序列,例如线粒体定位序列或叶绿体定位序列,用于将所述SSN多肽有效靶向至包含待修饰的感兴趣的基因组DNA序列的细胞区室。这种定位序列的序列要求是分子生物学领域的本领域技术人员已知的。不妨碍所述SSN多肽或所述RT核苷酸序列的功能,所述定位序列与N 末端或C末端部分或各自分子的5'或3'末端相应融合,即共价连接。
[0216] 在一个实施方案中,或使用用于蛋白质生产的重组技术或通过合成相应的氨基酸序列,所述至少一个SSN多肽和任选的至少一个相互作用结构域(如果代表多肽序列)作为离体产生的多肽序列提供。在另一个实施方案中,SSN多肽和任选的至少一个相互作用结构域以RNA序列形式存在,其可以在引入感兴趣的靶细胞后翻译成相应的氨基酸序列。在又一个实施方案中,所述SSN多肽和任选的所述至少一个相互作用结构域多肽作为DNA构建体插入,所述DNA构建体或配置用于稳定表达或用于在感兴趣的细胞中瞬时表达,使得所述至少一个SSN多肽和任选的所述至少一个相互作用结构域多肽然后以组成型或诱导型方式在感兴趣的靶细胞中转录和翻译。用于将根据本发明的至少一个SSN多肽和任选的至少一个相互作用结构域多肽引入靶细胞的合适的DNA构建体和缔合方法是本领域技术人员已知的,而特别适用于植物细胞中的应用的引入根据本发明某些实施方案的至少一个SSN多肽和任选的至少一个相互作用结构域多肽的具体方式以下进一步详述。
[0217] 必须使用合适的递送构建体将所述人工分子复合物或其部分,即所述至少一个SSN 多肽、所述至少一个RTDD和所述至少一个RT和任选的所述至少一个相互作用结构域引入感兴趣的靶细胞中。当然,递送构建体的类型可以变化,这取决于以下事实:所述分子复合物是否在体外完全组装并随后引入靶细胞,或者所述分子复合物的不同组分是否分别引入细胞和然后通过感兴趣的靶细胞内的非共价相互作用组装所述组合物。引言通常通过使用合适的递送构建体进行引入。
[0218] 根据本发明的不同方面的各种实施方案,本文所用的术语“递送构建体”或“(递送)载体”是指用作任何生物学或化学或非化学或基于颗粒的方式和/或方法,所述方式和/方法用作将感兴趣的核苷酸和/或氨基酸序列转运到靶真核细胞中的货物。合适的递送构建体包含用于将核苷酸序列递送到靶细胞中的生物学手段,包括病毒载体、农杆菌属、细胞穿透肽(CPP)或化学递送构建体,包括纳米颗粒、脂质或聚合物囊泡、磷酸钙或其组合。脂质或聚合物囊泡可以选自例如脂质、脂质体、脂质包封系统、纳米颗粒(例如中孔二氧化硅纳米颗粒、小核酸-脂质颗粒制剂)、聚合物(例如阳离子聚合物如DEAE- 葡聚糖或聚乙烯亚胺和聚合物囊泡)。在一个实施方案中,所述聚合物选自由以下组成的组:线性聚合物、支化聚合物、树枝状聚合物(高度支化的有机化合物)和多糖。在另一个实施方案中,所述脂质包封系统包括磷脂、胆固醇、聚乙二醇(PEG)-脂质和将颗粒递送到靶细胞的亲脂性化合物的一种或多种。在进一步的实施方案中,所述递送构建体可以是中孔二氧化硅纳米颗粒。
[0219] 本文所用且适合提供根据本发明的所述至少一个分子复合物或至少一个杂合 RNA/DNA核酸序列的物理引入方法指,电穿孔、微注射、粒子轰击、声孔作用、磁转染或穿刺转染(impalefection),采用拉长的纳米结构和诸如纳米纤维或硅纳米线等纳米结构的阵列,其用质粒DNA功能化,以及指化学方法并且能依赖于使用微粒或纳米粒子或化学品,包括聚乙二醇(PEG)。
[0220] 例如,对于所述人工分子复合物的组分离体缔合的实施方案,所述递送载体可以是基于脂质的或聚合物载体。例如,基于脂质的或聚合物载体可选自脂质、脂质体、脂质包封系统、微粒、晶须、纳米粒子、小核酸-脂质颗粒、聚合物和聚合物囊泡。在一些实施方式中,所述聚合物能选自线性聚合物、支化聚合物、树状物和多糖。在另一实施方式中,所述脂质包封系统包括磷脂、胆固醇、聚乙二醇(PEG)-脂质和将颗粒递送到靶细胞的亲脂性化合物的一种或多种。
[0221] 对于哺乳动物细胞,用于各种治疗目的的免疫细胞的离体修饰在过去十年中通过过继转移特异性修饰的淋巴细胞(优选T细胞)而对抗几种肿瘤疾病已经引起了很大的兴趣。特别是CD8+T细胞淋巴细胞在这方面是有趣的靶标。描述了免疫应答源自达到类似尺寸和表型多样性的单一幼稚T细胞、单一初始和单一二级中心记忆T细胞,面临相当的随机变化,且能最终重建免疫活性抵御另外细菌病原体的致命感染,如CD8+T细胞和其后代在3代连续单细胞过继转移和感染驱动再扩增中的体内原基分布图所测 (Graf等,Immunity,41,
1 16-126,2014)。在来自造血细胞的从头胸腺T细胞发育后,完全成熟的抗原特异性T细胞能在个体内长时间维持,其中抗原可以是外来抗原,如在病毒或癌细胞上表达的抗原。因此,靶向修饰这种效应T细胞或其前体代表了提供用于免疫疗法的合适T细胞的重要策略。
幼稚T细胞通过称为干细胞记忆T细胞的阶段分化,其产生中枢记忆T细胞和效应记忆T细
胞,并最后产生效应T细胞,其中所述效应T 细胞代表最终分化的细胞,其最终可以识别并摧毁靶细胞。效应记忆T细胞和效应T细胞是T细胞的亚组,其具有向周围组织流通的能力。
目前提出了另一种亚组,即组织驻留记忆T细胞,其不再循环(参见例如Farber等,Nature Reviews Immunology, 14,24-35,2014)。
[0222] 此外,癌症的免疫治疗提供了一些第一个引人注目的临床病例,表明表达重组肿瘤反应性受体的T细胞的过继转移可以治愈其他抗治疗的恶性肿瘤(Brentjens等,2013; Grupp等,2013;Porter等,2011)以及在过继转移疗法中使用工程化T细胞已显示出治疗癌症的显著前景,特别是血液癌症。越来越多地,使用具有确定亚组和表型组成的遗传修饰的T细胞来增加癌症免疫疗法的成功(参见Riddell等,Cancer J.,20(2), 141-144,2014)。使用嵌合抗原受体修饰的T细胞作为血液恶性肿瘤和实体瘤的治疗正变得越来越普遍。为此,修饰T细胞以表达肿瘤定向的嵌合抗原受体(CAR)(参见例如, Anurathapan等,Molecular Therapy,22,623-633,2014)。用于重新靶向和重编程T细胞以增强其抗肿瘤功效的所谓的第二代CAR(例如,掺入CD2B或4-1BB信号传导结构域的靶向CD19的CAR)正变得越来越重要(参见例如Sjoukje等人,Nature Reviews Drug Discovery,14,499-509,2015)。
[0223] 因此,根据本发明的杂合RNA/DNA核酸序列代表了体内或离体修饰一个或多个哺乳动物细胞的重要工具(优选用于治疗疾病)。例如,淋巴细胞,更优选任何发育阶段的T细胞或自然杀伤(NK)细胞,以改变T细胞或NK细胞表达的基因以影响T细胞或 NK细胞的增殖、存活和/或具有高精度的功能以避免脱靶效应,所述脱靶效应可能对修饰的细胞或细胞群的治疗应用是有害的。
[0224] 在某些实施方案中,根据本发明的人工分子复合物因此适用于治疗疾病的方法,其中所述疾病的特征在于至少一个基因组突变,并且所述人工分子复合物被配置为靶向并修复所述至少一个基因组突变。因此,提供了使用根据前述权利要求中任一项的人工分子复合物治疗疾病的方法,其中所述疾病的特征在于至少一个基因组突变,并且所述人工分子复合物被配置为靶向并修复所述至少一个基因组突变。所述治疗方法可包括基因或基因组编辑或基因治疗。
[0225] 合适的细胞(特别是用于治疗方法,或用于修饰病毒基因组)包括真核细胞(例如动物) 和原核细胞和/或细胞系。由此类细胞产生的此类细胞或细胞系的非限制性实例包括 COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1 SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、 HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)和perC6细胞以及昆虫细胞如草地贪夜蛾(Spodopterafugiperda)
(Sf),或真菌细胞(例如酵母(Saccharomyces)、毕赤酵母(Pichia)和裂殖酵母
(Schizosaccharomyces))。在某些实施方案中,所述细胞系是CHO、 MDCK或HEK293细胞系。
合适的细胞还包括干细胞,例如非人胚胎干细胞、诱导的多能干细胞、造血干细胞、神经元干细胞和间充质干细胞。
[0226] 一方面,本发明提供了治疗有此需要的对象的方法,包括通过用本文讨论的人工分子复合物的组分或本文讨论的任何载体转化/转染所述对象来诱导基因编辑,并向所述对象施用诱导剂能量源。本发明包括这种多核苷酸或载体在制备药物中的用途,例如,用于治疗对象的这种药物或用于治疗对象的这种方法的这种药物。本发明包括本文讨论的多核苷酸或本文讨论的任何载体用于治疗有此需要的对象的方法,包括诱导基因编辑,其中该方法还包括向所述对象施用诱导剂能量源。在一个方面,在该方法中,还提供修复模板,例如由包括所述修复模板的载体递送。
[0227] 在一个实施方案中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,尤其是用于使用本发明的人工分子复合物的基因治疗(参见,例如,Balagaan,J Gene Med 2006;8:275-285)。在另一个实施方案中,还考虑了Retino 一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管生成抑制蛋白内皮抑素和血管抑制素,其通过视网膜下注射递送以治疗年龄相关性黄斑变性的网状形式(参见例如, Binley等
人,HUMAN GENE THERAPY 23:980-991(2012年9月)),并且可以修饰该载体用于本发明的SSN-RTDD-RT系统。目前,已经公开了如帕金森氏病治疗中的慢病毒载体,参见例如美国专利申请号2012/0295960A1和美国专利号7,303,910B2。还已经公开了用于治疗眼部疾病的慢病毒载体,参见例如美国专利申请号2006/0281180,2009/ 0007284、2011/01171818、
2009/0017543、2007/0054961和2010/0317109。还公开了用于递送至脑的慢病毒载体,参见例如美国专利申请号2011/0293571、2011/0293571、 2004/0013648、2007/0025970、2009/
011116106和美国专利号7,259,015。
[0228] 在另一个实施方案中,所述人工分子复合物或其组分可以在脂质体中施用,例如稳定的核酸-脂质颗粒(SNALP)(参见,例如,Morrissey等,Nature Biotechnology,第23卷,第8期,2005年8月)。考虑每日静脉内注射约1、3或5mg/kg/天的SNALP中靶向的特定CRISPR Cas。每日治疗可能超过约三天,并然后每周治疗约五周。在另一个实施方案中,还可以考虑以约1或2.5mg/kg的剂量通过静脉内注射施用特定包封的 SNALP(参见,例如,Zimmermann等,Nature Letters,第441卷,2006年5月4日)。所述SNALP制剂可含有脂质3-N-[(甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰氧基丙胺(PEG-C-DMA)、1,2-二亚油酰氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2- 二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC)和胆固醇,比例为2:40:10:48(参见,例如, Zimmermann等,Nature Letters,Vol.441,2006)。在另一个实施方案中,已经证明稳定的核酸-脂质颗粒(SNALP)是高度血管化的HepG2衍生的肝肿瘤的有效递送分子,但是在血管化不良的HCT-116衍生的肝肿瘤中则不是(参见例如Li,Gene Therapy(2012)19,775-780)。
[0229] 可以通过用25:1脂质/siRNA比率和48/40/10/2摩尔比的胆固醇/D-Lin-DMA/ DSPC/PEG-C-DMA用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA配制D-Lin-DMA 和PEG-C-DMA来制备所述SNALP脂质体。得到的SNALP脂质体的大小约为 80-100nm。
[0230] 在另一个实施方案中,SNALP可包含合成胆固醇(Sigma-Aldrich,St Louis,MO, USA)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids,Alabaster,AL,USA)、3-N-[(w-甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二甲苯基氧基丙胺、和阳离子1,2-二亚油烯氧基 -3-N,N-二甲基氨基丙烷(参见,例如,Geisbert等,Lancet 2010;375:1896-905)。可考虑施用(例如,推注静脉内输注)每剂量约2mg/kg总SSN/RTDD/RT的剂量。
[0231] 类似地,根据本发明的人工分子复合物可以代表用于修饰家畜或其他动物细胞中的遗传物质的有用工具。例如,纠正遗传疾病或编辑有利特征,例如肉、牛奶,例如乳糖含量降低的牛奶、或家畜或家禽中的产蛋量。
[0232] 因此,在一个实施方案中,提供了用于产生动物免疫细胞群的方法,包括将本发明的构建体体内或离体引入至少一个感兴趣的免疫细胞中以治疗疾病,优选为自身免疫疾病(例如I型糖尿病或类风湿性关节炎)或增殖性疾病(例如癌症,例如神经胶质瘤、黑素瘤、神经母细胞瘤、结肠癌、肺癌、乳腺癌前列腺癌、多药耐药性癌症以及涉及突变的p53基因的癌症)。
[0233] 形成基因组编辑靶标的大多数植物物种的优选组织是未成熟胚、胚性愈伤组织、完整植物的分生组织、花粉、花粉管或卵细胞、悬浮细胞或具有再生潜力的其他细胞类型。对于一些植物,优选的组织可以是原生质体或叶子。可以将任何可以处理然后再生成整株植物的细胞视为优选的组织或细胞。用于组织制备、再生和DNA递送的方案根据物种、组织类型、递送方法和其他因素而不同。常见的递送方法是用DNA或蛋白质包被的金或钨颗粒对细胞进行粒子轰击。其他递送方法是聚乙二醇(PEG)介导的转化、电穿孔、病毒感染、直接注入细胞和农杆菌介导的转化。在一些植物中,通过在受精后不久切割并将具有编辑试剂的液体施加到切割的花粉管中,可以将一些植物递送进行至受精卵细胞。对于动物细胞,优选哺乳动物细胞,电穿孔(即基于通过施加电脉冲在细胞膜中瞬间产生小孔的转染技术)可以代表用于引入根据本发明的至少一个分子复合物的合适方法。用于直接转染成功多种不同细胞类型的几种细胞类型(包括哺乳动物原代细胞、干细胞和难以转染的细胞系)特异性方案对于本领域技术人员是可获得的,它们适合作为根据本发明的至少一个分子复合物的递送工具。重要的是要注意,适合于递送的两种或更多种方法或试剂的组合可以提供优异的结果(这取决于必须编辑其基因组的细胞类型)并因此包括在本发明的范围内。
[0234] 在一个实施方案中,超荷电蛋白可用于递送根据本发明的人工分子复合物或其组分。超荷电蛋白是一类工程化或天然存在的蛋白质,具有异常高的正或负净理论电荷,并且可用于递送人工分子复合物或其组分或编码其的核酸分子。带有超负电荷和超正电荷的蛋白质都表现出显著的耐受热或耐化学诱导的聚集的能力。带有超正电荷的蛋白质也能够穿透哺乳动物细胞。将货物与这些蛋白质(例如质粒DNA,RNA或其他蛋白质) 缔合可以使这些大分子在体外和体内功能性地递送到哺乳动物细胞中。David Liu的实验室在2007年报告了超荷电蛋白的产生和表征(Lawrence等,2007,Journal of the American Chemical Society 129,101 10-101 12)。
[0235] RNA和质粒DNA的非病毒递送对于将人工分子复合物转移到哺乳动物细胞中特别有意义,这对于研究和治疗应用都是有价值的(Akinc等,2010,Nat.Biotech.26,561-569)。
将纯化的+36GFP蛋白(或其他带有超负电荷的蛋白,例如+48GFP)与RNA在适当的无血清培养基中混合,并允许在添加至细胞之前使其复合。在该阶段包含血清抑制超荷电蛋白-RNA复合物的形成并降低治疗的有效性。已发现以下方案对多种细胞系有效(McNaughton等,
2009,Proc.Natl.Acad.Sci.USA 106,6111-16116)(然而,应该进行改变蛋白质和RNA的剂量的预先实验以优化特定细胞系的程序):(1)在处理前一天,在48孔板中每孔铺1×10 5个细胞(例如HEK293,数量取决于细胞类型)。(2)在处理当天,在无血清培养基中稀释纯化的+
36GFP蛋白至终浓度200nM。加入RNA至终浓度为50nM。涡旋混合并在室温下孵育10分钟。(3)在孵育期间,从细胞中吸出培养基并用PBS洗涤一次。(4)孵育+36GFP和RNA后,将蛋白质-RNA复合物加入细胞中。(5)在37℃将细胞与复合物孵育4小时。(6)孵育后,吸出培养基并用
20U/mL肝素PBS洗涤三次。根据活性测定,用含血清培养基再孵育细胞48小时或更长时间。
(7)通过免疫印迹、qPCR、表型测定或其他合适的方法分析细胞。
[0236] 用于人工分子复合物的另一种优选递送方法是在体外组装RTDD-RT杂合核酸,并然后将该杂交体负载到体外产生的和任选纯化的SSN多肽中,然后将其应用于感兴趣的靶细胞。然而,其他有用的递送方法可以是将SSN多肽和任选的相互作用结构域递送到所述至少一个靶细胞中用于体内转录和/或表达,与SSN多肽递送同时、之前或特别是之后一起应用所述杂交核酸,所述相互作用结构域例如单体链霉抗生物素蛋白、具有给定特异性的
scFv、或DNA结合结构域,或作为mRNA的额外核酸酶结构域或作为任选地包含其他调节元件的遗传DNA构建体的额外核酸酶结构域。在RTDD与RT组分的非共价缔合的情况下,这些分子也可以分开递送;在RTDD是gRNA的情况下,所述gRNA可以作为RNA或作为可以在体内转录的DNA表达盒递送。在所述至少一个 SSN多肽或所述至少一个gRNA作为表达盒递送的情况下,其可优选从RNA或DNA 病毒复制子或病毒载体表达,特别是当靶细胞是植物细胞时。
[0237] 在优选的实施方案中,所述至少一个人工分子复合物离体缔合,所述复合物的不同组分(即任选地包含至少一个相互作用结构域的所述至少SSN、所述至少一个RTDD和所述至少一个RT修复模板核酸)在离体/体外化学或重组合成,并然后纯化不同的组分 (优选在组装之前)。在组装根据本发明的至少一个人工分子复合物之后,可以进行额外的纯化步骤。纯化核酸(包括DNA和RNA)、或多肽、或核糖核酸和核糖核蛋白复合物的方法对于本领域技术人员来说是容易获得的。提供高纯度和化学计量的分子复合物 (其可任选地在体外分析)允许提供高效的精确基因组编辑工具。
[0238] 对于依赖于非基于核酸或非基于氨基酸的分子作为RTDD或相互作用结构域的实施方案,例如生物素(维生素H)或其衍生物、荧光素或地高辛或任何其他SSN-RTDD或 RTDD-相互作用结构域相互作用或SSN-相互作用结构域相互作用的同源结合伴侣,优选所述RT是离体合成的,并然后所述RT与相应的分子化学连接。
[0239] 在根据本发明的各个方面的另一个实施方案中,除RTDD/RT外,还可以使用质粒形式或核酸寡核苷酸形式的常规修复模板核酸序列以进一步提高靶向基因组编辑事件的效率。通常,是否应用质粒或另一种双链DNA修复模板或者是否使用单链寡核苷酸作为修复模板的决定性因素取决于待引入的预期修饰的大小。本领域技术人员可以容易地定义另外的常规修复模板,其可以与根据本发明的杂交核酸构建体一起使用。通过递送载体(例如双生病毒载体)(在靶细胞是植物细胞的情况下)或通过直接转染或如本文还详述的用于引入根据本发明的RTDD/RT序列的引入,将那些常规修复模板引入至少一个感兴趣的靶细胞中。
[0240] 在一个方面,本发明提供了含有本文公开的任何一个或多个元件的试剂盒。在一些实施方案中,所述试剂盒包含如本文教导的载体系统和使用该试剂盒的说明书。元件可以单独提供或组合提供,并且可以提供在任何合适(例如小瓶、瓶子或管子)的容器中。所述试剂盒可包括gRNA和未结合的保护链以稳定所述gRNA。所述试剂盒可以包括作为RTDD的gRNA,其直接与感兴趣的RT相互作用并且任选地与结合所述向导序列至少部分的另外的保护链相互作用。因此,所述试剂盒可包括部分双链核苷酸序列形式的 gRNA。在一些实施例中,所述试剂盒包括一种或多种语言(例如多于一种语言)的说明书。所述说明书可以特异于本文描述的应用和方法。
[0241] 因此,在根据本发明的另一方面,提供了一种试剂盒,所述试剂盒包含本发明的所述至少一个人工分子复合物的所述至少一个组分并优选本发明的所述至少一个人工分子复合物的所有组分,其中所述至少一个分子复合物可以预先组装的形式提供,或优选其中所述至少一个分子复合物可以以其分开组分的形式提供,所述分开组分包含至少一个SSN多肽或编码其的可表达序列、至少一个RTDD序列和至少一个修复模板核酸序列。所述分子复合物的不同组分的分开提供(优选以用于核酸序列的干燥或冻干粉末的形式)保证了核
酸序列的更高稳定性,特别是RTDD/RT构建体的更高稳定性,特别是如果RNA序列比所述试剂盒内提供的多肽更不稳定。可以在合适的储存缓冲液内递送至少一个SSN蛋白和任选的至少一个与其相互作用或与其相连的相互作用结构域,所述合适的储存缓冲液例如对于
Cas9多肽为包含300mM NaCl、10mM Tris-HCl、0.1mM EDTA、1mM OTT、50%甘油,于25℃的pH值为7.4。所述试剂盒可进一步包含合适的反应缓冲液,所述反应缓冲液包含合适的离子(例如对于Cas9酶的Mg2+,其是相应 CRISPR多肽活性所需的)。
[0242] 在一些实施方案中,试剂盒包含用于利用本文所述的一个或多个元件的方法中的一个或多个反应物。可以在任何合适的容器中提供反应物。例如,试剂盒可以提供一种或多种反应或储存缓冲液。反应物可以以可用于特定测定的形式提供或者以在使用前需要添加一个或多个其他组分的形式提供(例如,以浓缩物或冻干形式)。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、酸盐缓冲液、Tris缓冲液、 MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方案中,所述缓冲剂是碱性的。在一些实施方案中,所述缓冲液具有约7至约10的pH。在一些实施方案中,所述试剂盒包含一个或多个对应于用于插入载体的向导序列的寡核苷酸,以便可操作地连接向导序列和调节元件。在一些实施方案中,所述试剂盒包含同源重组模板多核苷酸。在一些实施方案中,所述试剂盒包含一个或多个载体和/或一个或多个本文所述的多核苷酸。所述试剂盒可以有利地允许提供本发明系统的所有元件。
[0243] 可选地,所述试剂盒可以包含分别为冻干mRNA或冻干蛋白的SSN组分。在根据该方面的另一个实施方案中,除了包含SSN组分作为分子复合物的组分外,所述试剂盒可包含提供合适的递送载体或递送系统的其他组分。在根据该方面的另一个实施方案中,至少一个SSN多肽和至少一个RTDD/RT序列作为至少两个组分存在,所述多于一个SSN和/或RTDD/RT是相互相容的。所述至少一个SSN多肽可以作为待转化或待转染到感兴趣的细胞中的载体存在,而所述至少一个RTDD/RT序列可以作为分开的组分提供。因此,根据本发明的试剂盒可适于在存在多于一个组分的情况下同时或随后使用不同组分。任选地,根据该方面的试剂盒可包含使用说明书,特别是特异于待编辑的靶细胞的使用说明书。在根据本发明该方面的另一个优选实施方案中,所述试剂盒是特异性开发的以提供用于特定感兴趣的植物的性状开发试剂盒,所述性状开发试剂盒包括实现所需性状修饰的特异性工具。根据该实施方案,所述试剂盒包含特异性修复模板,其被配置为转移感兴趣的性状或治疗感兴趣的疾病或将感兴趣的DNA靶序列修饰进细胞(优选哺乳动物细胞或植物细胞)中的感兴趣的DNA靶基因座。此外,所述试剂盒包含合适的SSN酶或两个SSN切口酶,其作为复合物与至少一个RTDD缔合,其中所述 RTDD包含至少一个与所述至少一个SSN直接相互作用的第一序列部
分,配置为与至少一个修复模板核酸序列(RT)直接相互作用的第二序列部分,并且其中所述至少一个 RTDD被配置为与携带感兴趣的特定性状的修复模板缔合或能够与携带感兴趣的特定性状的修复模板缔合。
[0244] 根据一个实施方案的试剂盒是植物细胞以及性状特异性,并且所述试剂盒的使用允许快速靶向和修饰感兴趣的基因组DNA基因座以实现性状开发。在一个实施方案中,所述RTDD是gRNA,其中所述gRNA组分准备好设计为与PAM基序和感兴趣的 CRISPR酶相互作用,并且所提供的修复模板以便利的方式呈现待插入或修饰的序列。
[0245] 因此,在根据本发明的一个方面,提供了植物、植物细胞、植物材料或衍生物或其后代,其包含根据本发明的至少一个人工分子复合物或由根据本发明的至少一个人工分子复合物编辑。在根据本发明的另一方面,提供了已经用至少一个人工分子复合物修饰的植物、植物细胞、植物材料或衍生物或其后代。
[0246] 在根据本发明的又一方面,提供了修饰至少一个DNA靶序列的方法,包括以下步骤:(i)提供至少一个原核、真核或病毒细胞和/或基因组,其在感兴趣的基因组区域中包含至少一个基因组互补序列和至少一个DNA靶序列;(ii)提供如本文所定义的至少一个人工分子复合物;(iii)在合适的条件下使所述至少一个人工分子复合物与所述至少一个 DNA靶序列接触,以实现(a)所述至少一个位点特异性核酸酶与所述至少一个DNA靶序列的相互作用;(b)所述至少一个修复模板核酸序列与所述至少一个基因组互补序列的互补碱基配对,以实现所述至少一个互补序列的识别和由所述至少一个位点特异性核酸酶诱导至少一个DNA断裂,其中所述至少一个修复模板核酸序列指导在所述至少一个 DNA靶序列位点处的同源定向修复;以及(iv)获得至少一个原核、真核或病毒细胞和/ 或基因组,其包含所述至少一个DNA靶序列的修饰。
[0247] 归因于所述人工分子复合物可以在任何感兴趣的细胞类型中使用的事实,因此可以设计SSN/RTDD/RT对用于任何基因组的修饰,包括感兴趣的生物体的游离基因区域或表观遗传区域,所述游离基因区域或表观遗传区域包含感兴趣的原核、真核或病毒 DNA靶序列或表观遗传序列。对于修饰病毒基因组的实施方案,适合将病毒基因组或其相关部分转移到感兴趣的载体中并在携带包含所述病毒基因组的载体或其相关部分的合适的宿主细胞(例如,原核或真核细胞)内繁殖和修饰所述病毒基因组。
[0248] 如本文所用的“原核”细胞是指缺乏膜结合细胞核(胞核)、线粒体或任何其他膜结合细胞器并且包含古细菌和细菌的单细胞生物体。
[0249] 病毒基因组可以衍生自包含RNA或DNA编码的基因组的任何病毒。
[0250] 在一个实施方案中,将所述人工分子复合物的所述至少一个修复模板核酸序列和/ 或所述至少一个修复模板对接结构域独立于所述至少一个分子复合物的所述至少一
个位点特异性核酸酶而提供至所述至少一个原核或真核细胞,并且所述至少一个人工分子复合物在所述至少一个原核、真核或病毒细胞和/或基因组内组装或部分组装。
[0251] 在一个实施方案中,所述人工分子复合物的所述至少一个RTDD/RT序列独立于所述至少一个分子复合物的所述至少一个SSN多肽而提供至所述至少一个原核或真核细胞,并且所述至少一个人工分子复合物在所述至少一个原核或真核细胞内组装或部分组装。
[0252] 如上详述的至少一个人工分子复合物可以作为体外组装的复合物提供,所述体外组装的复合物然后被引入至至少一个感兴趣的靶细胞中。可选地,所述至少一个SSN多肽和/或所述至少一个RTDD序列和/或所述至少一个修复模板核酸序列中的一些或全部可以作为遗传RNA或DNA构建体插入并且可以在体内产生,使得所述至少一个分子复合物的最终组装在体内进行。在一个优选的实施方案中,所述至少一个分子复合物离体缔合,并且然后将所述至少一个分子复合物通过合适的递送载体同时提供至所述至少一个细胞,所述至少一个分子复合物包含至少一个SSN多肽、至少一个向导核酸序列和至少一个修复模板核酸序列,所述合适的递送载体允许将所述至少一个分子复合物功能性引入至包含至少一个感兴趣的DNA靶序列的所述至少一个靶细胞中。
[0253] 在另一个优选的实施方案中,所述至少一个SSN和任选的至少一个相互作用结构域作为融合蛋白在质粒上提供,所述质粒在包含待修饰的DNA靶序列的细胞内产生。然后可以离体产生所述人工分子复合物的其他组分。例如,诱导型载体系统可用于产生所述至少一个SSN和任选的至少一个相互作用结构域。一旦达到足够的表达水平,就可以将所述
RTDD/RT复合物引入靶细胞中,并且根据本发明的人工分子复合物可以原位组装。
[0254] 在另一个实施方案中,完整的至少一个人工分子复合物是离体组装的人工分子复合物。
[0255] 本文中根据本发明的方法的上下文中提及的“合适的条件”或“合适的反应条件”是指允许被转化或制造的细胞或生物体(包括原核或真核细胞)的生长和发育的条件,以及在至少一个感兴趣的细胞或生物体中实现稳定整合或瞬时引入感兴趣的遗传构建体所必需的条件。促进原核或细菌生长和/或转化的条件是本领域技术人员已知的(参见: Green和Sambrook,Molecular Cloning,A Laboratory Manual,2012,Cold Spring Harbor Laboratory Press)。对于各种不同的细胞系,促进动物细胞生长和/或将遗传物质引入动物(特别是哺乳动物细胞)的条件是本领域技术人员可获得的(参见Green和Sambrook,同
上)。促进植物或植物细胞生长和发育的条件(尤其包括温度、光、水、氧、矿物质营养素和土壤支持)可以针对不同植物物种而变化并且可以由本领域技术人员在本文提供的公开内容的知识中容易地确定。实现感兴趣的至少一个分子复合物的稳定整合或瞬时引入的其他合适条件取决于选择的用于引入感兴趣的至少一个分子复合物的转化方法、待转化的植物材料或植物细胞的发育阶段和待引入的感兴趣的至少一个分子复合物。本领域技术人员可以根据定义用于所述方法的合适的条件的本公开内容结合本文公开和请求保护的示例性分
子和合适的递送载体和递送技术来定义合适的条件。
[0256] 在根据本发明上述方法的一个实施方案中,所述至少一个真核细胞是植物细胞,优选来自选自由以下组成的组的植物的植物细胞:大麦(Hordeum vulgare)、球茎大麦 (Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉蜀黍属(Zea spp.)(包括玉米(Zea mays))、小米(Setaria italica)、小粒野生稻(Oryza 
minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale 
cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium 
distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜属(Beta spp.)(包括甜菜(Beta vulgaris))、小胡萝卜(Daucus 
pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄  (Solanum 
lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄 
(Vitis vinifera)、Erythrante guttata、黄花螺旋狸藻(Genlisea aurea)、黄瓜(Cucumis sativus)、川桑(Marus notabilis)、Arabidopsis arenosa、深山南芥(Arabidopsis 
lyrata)、拟南芥 (Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine nexuosa)、北美独行菜
(Lepidium virginicum)、荠菜花 (Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜 (Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica juncacea)、黑芥菜
(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.Sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago 
truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus 
scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypium 
sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia 
fournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus) 和韭(Allium tuberosum),或属于上述植物之一的任何变种或亚种。
[0257] 针对植物细胞作为靶标,例如,本领域技术人员可获得多种转化和/或转染方法。对于玉米原生质体,例如Sheen,J.2002.("A transient expression assay using maize mesophyll protoplasts.")中公开了合适的方法。对于拟南芥原生质体,可以从 doi.org/
10.1038/ngrot.2007.199获得合适的方案,或者可以从 http://www.nature.com/nprot/journal/v2/n7/full/nprot.2007.199.html获取。对于烟草和其他双子叶植物原生质体,可从www.plantphysiol.org/cgi/doi/10.1 104/pp.1 12.205179获得合适的方案。因此,具有本公开内容知识并且知道所引用的方案的本领域技术人员可以定义用于将根据本发
明的分子复合物引入源自单子叶植物或双子叶植物的植物原生质体的合适方法。
[0258] 原生质体对于测试基因编辑技术和反应物非常有用,但是对于基因编辑的植物的再生,它们并不总是优选的细胞类型,因为很少有植物物种从原生质体有效再生。在这些情况下,大多数植物物种的优选组织是未成熟胚、胚性愈伤组织、受精胚、完整植物的分生组织、花粉、花粉管或卵细胞、胚发生悬浮细胞或具有再生潜力的其他细胞类型。常见的物理递送方法是用DNA或蛋白质包被的金或钨颗粒对细胞进行粒子轰击,而常见的生物学辅助方法使用农杆菌或本文公开的(修饰的)病毒载体。
[0259] 根据本公开提及的“分生细胞”属于植物内的组织类型,其也称为分生组织或形成层或形成组织。与动物生物体中的干细胞一样,代表未分化细胞的植物的分生细胞具有开发和分化成特化细胞类型的内在能力,这取决于遗传倾向和进一步的环境和发育因素。在植物生物体中,分生组织不仅存在于胚胎发育期间,而且它们可以在植物的整个生命周期中发现,使得根据本公开的分生细胞或组织的靶向遗传修饰不限于植物胚胎或幼苗,但它也可以在较大的幼苗和更成熟的植物中进行,例如当靶向分生组织时,其构成生殖植物器官(例如雄穗或玉米穗)的基础。
[0260] 根据根据本发明的各个方面的一个实施方案,分生细胞可以是包含至少一个分生组织细胞或分生组织的植物的植物胚或幼苗的成熟或未成熟植物细胞。
[0261] 对于某些基因组编辑方法,可能期望编码表达盒的分子复合物的稳定整合,其中携带感兴趣的所需构建体或其部分的转基因生物体可以将稳定插入的构建体遗传给最初转化或转染的感兴趣的植物细胞的后代。所述稳定整合可以发生在生物体(优选真核生物体)的任何基因组区域,所述生物体包括核基因组以及核外基因组,包括质体的基因组。
[0262] 在通过引入感兴趣的分子复合物或其部分预期某种效果的情况下,可能预期瞬时引入,但所述构建体本身最初不应遗传至细胞的后代。归因于调节原因,这种方法可能特别适用于某些应用,特别是用植物细胞、组织、器官或材料作为包含待修饰的DNA靶序列的结构的某些应用。
[0263] 如本文所用的术语“靶向整合”或“功能性整合”是指将感兴趣的遗传构建体整合到至少一个细胞中,所述整合允许转录和/或翻译和/或催化活性和/或结合活性,所述结合活性包括核酸分子与另一核酸分子(包括DNA或RNA)的结合,或蛋白质与所述至少一个细胞内的靶结构的结合。在相关的情况下,所述功能性整合发生在所述至少一个细胞的某个细胞区室中,所述细胞区室包括细胞核、胞液、线粒体、叶绿体、液泡、膜、细胞壁等。因此,术语“功能性整合”-与上文详述的术语“稳定整合”相反-意味着通过任何转化、转染或转导的方式通过生物方式(包括农杆菌转化)或通过物理方式(包括粒子轰击)以及随后的步骤将感兴趣的分子复合物引入所述至少一个细胞中,其中所述分子复合物在将其引入其中的至少一个细胞内或至少一个细胞上发挥作用。取决于待引入的遗传构建体的性质,所述效果自然可以变化并且所述效果包括单独或组合地尤其是由遗传构建体编码的DNA转录为核糖核酸、RNA转录为氨基酸序列、细胞内RNA分子的活性(包括向导RNA的活性,或用于RNA干扰的miRNA或siRNA的活性),和/或结合活性,包括核酸分子与另一个核酸分子(包括DNA或RNA)的结合,或蛋白质与至少一个细胞内的靶结构的结合,或包括通过载体或遗传构建体瞬时地或以稳定的方式递送的序列的整合。所述效果还可以包括在所述至少一个细胞等之中代表酶或其催化活性部分的氨基酸序列的催化活性。在根据本公开内容的分子复合物的功能性整合之后实现的所述效果可以取决于本领域技术人员已知的感兴趣的遗传构建体所包
含的调节序列或定位序列的存在。
[0264] 如上所述,根据本发明的靶向多能(pluripotent)细胞或专能(multipotent)细胞的方法提供的优点是,转化的至少一个细胞(特别是分生细胞)的转化和进一步发育可以在植物中发生,从而避免了需要从中再生植物或植物材料的体外培养步骤的麻烦。然而,在某些实施方案中,取决于具体需要,可能适合于外植体或解剖植物细胞、组织、器官或材料用于进一步培养、筛选或测试。用于体外培养植物细胞、组织、器官或材料的几种方法是本领域技术人员可获得的。
[0265] 因此可能期望稳定整合,其中稳定地插入携带感兴趣的所需构建体或其部分的转基因植物,并且所述插入的构建体或其部分遗传至最初转化的感兴趣的植物细胞的后代。所述稳定整合可以发生在所述植物的任何基因组区域,包括核基因组以及核外基因组,包括植物细胞的质体基因组。此外,根据本发明的人工分子复合物可用于造成表观遗传修饰。
另一方面,本发明提供了功能评估和基因筛选的方法。因此,本发明的人工分子复合物可用于精确递送功能性结构域、激活或抑制基因或通过精确改变感兴趣的特定基因座上的甲基化位点来改变表观遗传状态。本发明的方法可用于产生可用于模拟和/或研究感兴趣的遗传或表观遗传状态的植物、动物或细胞,例如通过感兴趣的突变模型或疾病模型。如本文使用,“疾病”是指对象中的疾病、病症或适应症。例如,本发明的方法可用于产生包含与疾病相关的一个或多个核酸序列的修饰的动物或细胞,或其中与疾病相关的一个或多个核酸序列的表达改变的植物、动物或细胞。这种核酸序列可以编码疾病相关蛋白质序列,或者可以是疾病相关控制序列。因此,理解在本发明的实施方案中植物、对象、患者、生物体或细胞可以是非人对象、患者、生物体或细胞。因此,本发明提供了通过本发明方法产生的植物、动物或细胞,或其后代。所述后代可以是所产生的植物或动物的克隆,或者可以通过与同一物种的其他个体杂交的有性繁殖产生以将进一步期望的性状渗入其子代。在多细胞生物(特别是动物或植物)的情况下,所述细胞可以在体内或离体提供。在细胞培养的情况下,如果满足适当的培养条件,可以建立细胞系,并且优选地如果所述细胞适合地适应于该目的(例如干细胞)。还设想了由本发明产生的细菌细胞系。因此,还设想了细胞系。
[0266] 在通过引入感兴趣的遗传构建体或其部分期望特定效应(例如沉默效应,一种靶向操作,包含敲入或敲除)的情况下,则可能期望瞬时引入,但是所述构建体本身不应该遗传给最初转化的细胞的后代。
[0267] 在根据本发明的上述方面的又一个实施方案中,使用选自由以下组成的组的手段进行所述至少一个感兴趣的分子复合物或其部分(包括gRNA和/或RT)的引入:适用于粒子轰击的装置(包括基因枪,包括手持式基因枪(例如 GeneGun System,BIO-RAD) 或固定基因枪)、转化(包括使用农杆菌属或使用病毒载体的转化)、显微注射、电穿孔、晶须技术(包括碳化硅晶须技术)和化学品(例如,使用磷酸钙、树状物、脂质体或阳离子聚合物),和非化学成分,例如,使用电穿孔、声波、使用激光的光转染、原生质体融合、穿刺转染,通过将递送构建体注入动物(优选啮齿动物)器官(优选肝脏)的水动力学基因递送DNA、转染、或其组合。
[0268] 在某些实施方案中,所述至少一个真核细胞是分生植物细胞,并且在引入根据本发明的人工分子复合物后,在合适的条件下进一步培养所述植物细胞,直到实现花序成熟的发育阶段以获得包含由根据本发明的至少一个分子复合物介导的感兴趣的修饰的植物或植物材料。例如,本领域技术人员可以使用从体外培养的玉米雄穗中产生可发芽和存活的花粉的几种方案,例如在Pareddy DR et al.(1992)Maturation of maize pollen in vitro.Plant Cell Rep 1 1(10):535-539.doi:10.1007/BF00236273,Stapleton AE et 
al.(1992)  Immature maize spikelets develop and produce pollen in 
culture.Plant Cell Rep 1 1 (5-6):248-252或Pareddy DR et al.(1989)Production 
of normal,germinable and viable pollen from in vitro-cultured maize 
tassels.Theor Appl Genet 77(4):521-526中的例子。这些方案尤其基于切除雄穗、表面消毒和用带激动素的培养基培养以促进雄穗生长和成熟。在形成小穗后,可以进行连续的花药收获挤压后,花药将干燥直至花粉出来。可选地,可以切开花药并在液体培养基中脱落花粉,其后续用于对穗授粉
[0269] 如本文所用,“花序的成熟度”是指以下的状态:当包含至少一个分生细胞的植物的未成熟花序已达到发育阶段时,当获得了成熟花序(即雄花序(雄性)或雌花序(雌性)) 并因此存在花粉(雄性)胚子或胚珠(雌性)胚子或两者都存在。植物生殖期的所述阶段是特别重要的,因为获得的植物材料可以直接用于另外的植物的授粉或用于另一植物的花粉的受精。
[0270] 在根据本发明上述方法的另一个实施方案中,至少一个DNA靶序列的修饰是选自由以下组成的组的基因组编辑方法:产量提高;耐受非生物胁迫,包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、盐胁迫或水浸;耐受生物胁迫,包括虫耐受性、细菌耐受性、病毒耐受性、真菌耐受性或线虫耐受性;抗除草剂,包括草甘膦、草铵膦、ALS抑制剂和麦草畏;抗倒伏性;花期;抗落粒;种子颜色;胚乳组成;营养成分;表型标志物修饰或是代谢工程,包括基因组编辑以允许在至少一个植物细胞中的分子产药方法。表型标志物可以是共编辑方法的优选靶标,例如用于监控编辑效率。
[0271] 在另一个实施方案中,对原核细胞或病毒基因组进行性状开发,例如以提供具有适当修饰的代谢途径的原核细胞以产生感兴趣的产物或提供减毒的病毒基因组。
[0272] 在根据本发明上述方法的另一个实施方案中,所述至少一个DNA靶序列的修饰是基因组编辑方法以在至少一个真核细胞优选哺乳动物细胞,优选哺乳动物白细胞中离体修饰免疫细胞,以获得适合治疗病毒性疾病或免疫疗法特别是癌症免疫疗法的修饰细胞。
[0273] 根据本发明上面方法所述的一个优选实施方式是采用靶向方式修饰真核细胞优选至少一个植物细胞的方法,以提供遗传修饰的优选非转基因植物,其中所述方法尤其可以是用于性状开发的方法。例如,可在植物基因编码序列中引入高位点特异性取代1、2、 3或更多个核苷酸,从而产生一个或多个氨基酸取代,其将赋予对至少一种除草剂如草甘膦、草铵膦、麦草畏或乙酰乳酸合酶(ALS)抑制除草剂的耐受性。此外,在另一实施方式中,核苷酸结合位点-富含亮氨酸重复序列(NBS-LRR)植物基因的编码序列中的一个或多个氨基酸
取代将改变蛋白的病原体识别谱以优化植物的疾病抗性。在另一个实施方式中,小的增强子序列或转录因子结合位点可在植物基因内源启动子中修饰或可将小的增强子序列或转
录因子结合位点引入植物基因启动子从而改变启动子所调节植物基因的表达分布或强度。
所述表达分布能通过其它区域中的多种修饰、引入或缺失改变,所述其它区域如内含子、3'未翻译区、顺式或反式增强子序列。在另一实施方式中,植物细胞优选分生植物细胞的基因组可以一定方式修饰,从而产生自修饰的分生细胞生成的植物能产生农艺上或制药上感兴趣的化学物质或化合物,例如胰岛素或胰岛素类似物、抗体、具有感兴趣的酶功能的蛋白,或任何其它适合作为药物、膳食补充剂或保健品的药学上相关化合物。
[0274] 在另一方面,根据本发明的方法的性状编辑提供了一种性状编辑方法,以实现疾病和/或病况的治疗和/或预防植物中的昆虫感染/侵染,包括通过使用任何前述方法修饰所述植物的染色体或染色体外遗传材料。可通过本发明方法治疗的疾病和/或病况的非限制性实例包括炭疽病腐烂、曲霉穗腐病、普通玉米穗腐病、玉米穗腐病、普通玉米锈病,色二孢穗腐病(Diplodia Ear Rot)、色二孢条斑病(Diplodia Leaf Streak)、色二孢茎腐病 (Diplodia Stalk Rot)、霜霉病、眼斑病(Eyespot)、镰刀菌穗腐病(Fusarium Ear Rot)、镰刀菌茎腐病(Fusarium Stalk Rot)、赤霉菌穗腐病(Gibberella Ear Rot)、赤霉菌茎腐病 (Gibberella Stalk Rot)、玉米内州萎蔫病(Goss's Wilt and Leaf Blight)、灰斑病(Grey Leaf Spot)、丝黑穗病(Head Smut)、玉米大斑病(Northern Corn Leaf Blight)、褐斑病(Physoderma Brown Spot)、腐霉属(Pythium)、南叶枯病(Southern Leaf Blight)、南方锈病(Southern Rust)、斯图尔特的细菌枯萎病(Stewart's Bacterial Wilt)和枯萎病,以及其组合。
[0275] 可直接或间接引起本发明方法可治疗的疾病和/或病况的昆虫的非限制性实例包括粘虫(Armyworm)、亚洲花园甲虫(Asiatic Garden Beetle)、黑色地老虎(Black 
Cutworm)、褐色姬臭虫(Brown Marmorated Stink Bug)、褐色臭虫(Brown Stink Bug)、常见螟虫  (Common Stalk Borer)、玉米象鼻虫(Corn Billbugs)、玉米耳朵虫(Corn 
Earworm)、玉米叶蚜虫(Corn Leaf Aphid)、玉米根虫(Corn Rootworm)、丝饲玉米根虫
(Corn Rootworm Silk Feeding)、欧洲玉米螟(European Corn Borer)、秋季粘虫(Fall Armyworm)、葡萄肖叶甲 (Grape Colaspis)、啤酒花螟(Hop Vine Borer)、日本甲虫
(Japanese Beetle)、侦察秋季粘虫 (Scouting for Fall Armyworm)、秧苗甲虫(Seedcorn Beetle)、秧苗蛆(Seedcorn Maggot)、南方玉米叶甲虫(Southern Corn Leaf Beetle)、西南玉米螟(Southwestern Corn Borer)、六点黄蜘蛛(Spider Mite)、甘蔗甲虫(Sugarcane Beetle)、西部豆夜蛾(Western Bean Cutworm)、蛴螬(White Grub)和金针虫(Wireworms),及其组合。本发明的方法也适用于预防任何此类昆虫对植物的感染和/或侵染。
[0276] 可以通过此方法引入的性状非限制性示例是抗或耐受害虫,如根虫、钻心虫、切根虫、甲虫、蚜虫、叶蝉、象鼻虫、螨虫和臭虫。这些能通过修饰植物基因来完成,例如用于提高植物对害虫的天生抗性或降低其对所述虫害的吸引力。其它性状可以是抗或耐受线虫、细菌、真菌或病毒病体或其载体。其它性状仍可以是更有效的养分利用,如氮利用提高,改进或引入固氮作用效率,光合效率提高,例如C3植物转换成C4。其它性状可以是增强非生物胁迫耐受性,如温度、供水、盐度、pH、耐受日光暴露中的极端情况、氮利用效率、磷利用效率、水利用效率和作物或生物量产量。额外性状可以是涉及植物可编辑或可进料部分味道、表观、营养物或微生物分布的特征,或能涉及这些部分的存储寿命或品质。最终,性状可涉及农艺性状,如耐倒伏性、落粒、花期、熟成、突出、收获、植物结构、活力、尺寸、收率和其它特征。为了实现上述性状修饰,根据本发明的方法包括通过使用任何前述方法修饰植物或植物细胞的染色体或染色体外遗传材料。
[0277] 在根据本发明上面方法所述的一个实施方式中,所述靶细胞可以是原核细胞且修饰包括至少一个原核细胞的感兴趣的基因组靶区域中至少一个修饰,其中所述修饰适合调节或增加细菌抵御生物或非生物胁迫的抗性,包括对抗生素的抗性,或其中所述修饰适合改善至少一个原核细胞的噬菌体抗性。在另一个实施方式中,所述修饰包括向至少一个感兴趣的原核细胞的DNA靶位点插入感兴趣的基因,如向至少一个DNA靶位点插入感兴趣的插入编码荧光标志物蛋白或另一可选择标志物的序列。在另一个实施方式中,所述修饰包括敲除,即在至少一个原核细胞中缺失至少一个DNA靶位点。由于原核细胞将不会进一步分化,但可直接遗传至少一个感兴趣的引入修饰到其后代且由于原核细胞通常相较真核细胞具有极短世代时间,通过至少一个RTDD/RT以本发明所述至少一个人工分子复合物形式引入的修饰可迅速完成且可在极短时间段中获得和分析所得修饰细胞群。
[0278] 在某些实施方案中,根据本发明的上述方法可以进一步包括以下步骤:(v)鉴定和/ 或选择至少一个原核或真核细胞,其包含所述至少一个DNA靶序列中的修饰,或鉴定对在原核或真核细胞中繁殖的病毒基因组的修饰。
[0279] 用于分析或鉴定根据本公开的修饰的方法为本领域技术人员已知,所述修饰在至少一个原核或真核细胞基因组或病毒基因组中进行,所述方法包括但不限于聚合酶链式反应(PCR),包括实时定量PCR、多重PCR、RT-PCR、巢式PCR、分析PCR等,显微镜检查,包括亮和暗视野显微镜检查、分散着色、相衬、荧光、共焦、微分干涉相差、反卷积、电子显微镜、UV显微镜、IR显微镜、扫描探针显微镜,分析细胞代谢物,分析改变的修饰的细胞抗性谱,RNA分析,蛋白质组分析,用于确定功能性整合的功能测定,如感兴趣的标志物基因或转基因或者敲除的功能测定,Southern印迹分析,测序,包括深度测序和其组合。然后,能选择含所需修饰的细胞以用于进一步培养或任何其它下游制备步骤。
[0280] 在根据本发明的另一方面,提供制备植物或植物细胞的方法,包括以下步骤:(i) 如上详述实施在真核细胞中修饰至少一个DNA靶序列的方法,其中所述至少一个真核细胞是植物细胞;(ii)从来自步骤(i)的至少一个植物细胞获得至少一个植物或其后代;(iii) 任选地:确定在所述至少一个植物或其后代的至少一个细胞中所述至少一个DNA靶序列中的修饰。
[0281] 如上所述了用于实施该方面的合适的植物细胞、组织、器官和材料。根据本公开的术语“制备”应被广义地解释,并且包括对植物或植物细胞的遗传材料实施的任何形式的遗传操作。提供所述至少一个人工分子复合物可以以允许如上所述的不同组件的瞬时动作或稳定整合或其组合的方式,所述至少一个人工分子复合物包含至少一个RTDD/ RT序列,其包含至少一个修复模板对接结构域和至少一个修复模板核酸和至少一个 SSN多肽,任选地包含相互作用结构域。优选地,所述至少一个人工分子复合物或其不同组分以瞬时方式提供,使得不存在任何这些效应组分本身整合到感兴趣的靶细胞的基因组中,所述这些效应组分包括编码向导核酸RNA的序列、编码修复模板核酸DNA的序列、和编码CRISPR多肽的序列。
[0282] 在根据本发明所述上面制备方法的一个实施方式中,所述至少一种植物或植物细胞选自单子叶或双子叶植物,优选其中所述植物选自玉蜀黍属包括玉米、本氏烟草,或甜菜属包括甜菜或黑麦属包括黑麦,或小麦属包括普通小麦。
[0283] 如在整个本公开中详述的,根据本发明的方法是合适的并且可以修改为靶向属于所有生物界的细胞,由于使用RTDD/RT构建体(所述RTDD/RT构建体以功能性方式与与RTDD相互作用的合适的位点特异性核酸酶结合)的要点是物种和细胞无关的,条件是细胞中DNA修复具有同源重组机制,而由所述至少一个gRNA和所述至少一个RT 的共价或非共价相互作用决定。对于每个靶细胞和每个靶标必须单独确定的是(i)所述位点特异性核酸酶或其催化活性片段以及相互作用结构域(例如融合蛋白)的使用是否可能是合适;(ii)合适的RTDD-SSN或RTDD-相互作用结构域对,其通过识别同源结合伴侣允许所述组分的直接相互作用;以及(iii)合适的RT及其与RTDD的连接,其中所述RT 的设计与在由所述人工分子复合物的所述至少一个SSN切割的感兴趣的DNA靶序列上引入定制修复有关以及任选地(对于CRISPR核酸酶)(iv)必须如上所述相容的gRNA和 CRISPR多肽;(v)感兴趣的gRNA与感兴趣的DNA靶区域内的PAM位点的匹配;以及 (vi)所述DNA靶序列和待引入的靶修饰。对于任何公众可获得的测序基因组,可以因此基于本发明的公开内容在计算机中完成合适的核酸序列的设计。
[0284] 在根据本发明的又一方面,提供了根据本发明的至少一个RTDD/RT序列在原核或真核细胞中用于基因组编辑的用途,或根据本发明的人工分子复合物在原核或真核细胞中用于基因组编辑的用途。在该方面的一个实施方案中,所述用途是用于真核细胞(优选真菌)、动物或植物细胞或生物体,或在原核或真核细胞中繁殖的病毒生物体。
[0285] 根据本发明的各个方面和实施方案,真核细胞或用于修饰真核细胞(包括干细胞)的方法或用途明确地不包括任何克隆人类的过程、修饰人类的种系遗传相同性的过程或使用人类胚胎,或需要破坏人类胚胎从中获取细胞的方法。因此,特别地将人种系细胞或人胚胎排除出用根据本发明的人工分子复合物或方法修饰的靶细胞或生物体。
[0286] 参考以下非限制性实施例进一步描述本发明。实施例
[0287] 通过以下非限制性实施例进一步说明本发明。
[0288] 实施例1:适合与Cas或Cpf1或Argonaute多肽组合的作为RTDD/RT对的杂合核酸序列
[0289] 在一个实验中,有尾的sgRNA或sgDNA经互补碱基配对和RNA-DNA或DNA-DNA 连接单链修复模板来杂交。对于共价结合,合成的DNA寡核苷酸用ssRNA连接酶厂商操作共价连接RNA/DNA寡核苷酸3'末端。对于非共价结合,混合有部分互补序列的 RNA/DNA和DNA寡核苷酸并允许经沃森克里克碱基配对复合。成功的杂交能在凝胶迁移试验中确定。在凝胶迁移试验前用RNase和DNase酶处理杂合核酸等分样品表明,对于那些使用sgRNA的实验,一些杂合核酸由RNA构成而一些则由DNA构成。然后,核酸杂合体与重组Cas9蛋白或另一种
CRISPR核酸酶或Argonaute核酸酶复合。成功的复合可如下确认:用蛋白酶K、RNase、DNase和模拟处理,观察相对的凝胶迁移模式。生成重组Cas多肽,并随后通过外部商业实体或内部能力来纯化。所测试的作为RTDD 的向导核酸序列和修复模板(RT)核酸序列之间的杂合核酸序列的不同架构如图1以及图 2所示。
[0290] 实施例2:通过Cas9蛋白与杂合RNA-DNA核酸的复合物体外切割DNA靶
[0291] 在一个实验中,当与所述核酸杂合技术一起使用时,测试Cas9蛋白作为位点特异性核酸内切酶的功能。含至少一个sgRNA的靶位点的线性化质粒与如本发明所述的 Cas9-sgRNA-RT复合物混合。在适合核酸酶活性的条件下孵育后,包括就多种CRISPR 核酸酶和其变体而言本领域技术人员已知的正确pH、温度和辅因子等,DNA靶质粒在琼脂糖凝胶上运行并观察指示切割预期靶位点的带尺寸。体外切割靶DNA表明,与作为“货物”的sgRNA缔合的RT不干扰Cas9复合物作为位点特异性核酸内切酶的功能。
[0292] 实施例3:通过与杂合RNA-DNA核酸复合的Cas9蛋白进行体内编辑
[0293] 为证明靶基因能通过递送含Cas9蛋白和杂合RNA-DNA核酸的复合物来体内编辑,已转化质粒内所含非功能tdTomato基因通过交换单核苷酸来修复,以从tdTomato基因恢复荧光信号。为通过提供与靶链或非靶链有互补性的ssDNA修复模板来确定用于编辑的最优用途,比较携带任一链修复模板的复合物。
[0294] 实施例1中获得的杂合核酸RNA/DNA-Cas多肽复合物用于修复附加体质粒靶标,其编码带有从A到T的单点突变的tdTomato基因,所述突变在密码子位置51处产生早期终止信号。此质粒与含Cas9蛋白和杂合RNA-DNA核酸的编辑复合物通过PEG-或电穿孔介导的递送一起引入玉米原生质体。单链修复模板随后通过互补碱基配对连接 sgRNA。所述修复模板与切割位点下游的区域-80碱基对和上游-40碱基对互补。成功的编辑随之产生一些显示tdTomato荧光表型的细胞,这归因于tdTomato基因在其所含至少一个质粒中的修复。因此,用不同修复模板编辑的相对效率易通过测量各处理所产生荧光细胞的丰度来评价。
[0295] 实施例4:通过共价附着或通过互补碱基配对缔合的与RNA组分附着的RT复合的Cas9 蛋白的体内编辑
[0296] 为证明采用以多种方式生产的杂合核酸分子编辑,实施例3中鉴定的最优条件用于评价同一游离基因的质粒靶标的修复,带有杂合核酸共价连接或修复模板与sgRNA非共价碱基配对。
[0297] 在使用标志物尤其是荧光标志物的情况中,成功的编辑会产生一些显示荧光表型的细胞,这归因于荧光编码基因如tdTomato基因在其所含至少一个质粒中的修复。然后,用不同修复模板编辑的相对效率可通过测量各处理所产生荧光细胞的丰度来评价。
[0298] 实施例5:通过Cas9蛋白与核酸杂合体复合的体内编辑,所述杂合体通过连接RT与 sgRNA的5'或3'末端形成
[0299] 在一个实施例中,实施例3所述方法能用于鉴定对修复模板的偏好性,所述模板与sgRNA的5'或3'末端杂交或连接。这里能采用实施例4所确定的优选键共价性。根据 Tsai等("Dimeric CRISPR RNA-guided Fokl nucleases for highly specific genome editing", Nature Biotechnology,32,569-576(2014),doi:10.1038/nbt.2908)以及另外Shechner等 ("Multiplexable,locus-specific targeting of long RNAs with CRISPR-Display",Nature Methods,12(7),664-670(2015),doi:10.1038/nmeth.3433)提出的结
果,预期优选3'融合。
[0300] 成功的编辑产生一些显示荧光表型如tdTomato表型的细胞,这归因于tdTomato基因在其所含至少一个质粒中的修复。用不同修复模板编辑的相对效率可通过测量各处理所产生荧光细胞的丰度来评价。
[0301] 实施例6:确定sgRNA与修复模板之间的最优接头长度以用于通过与杂合核酸复合的 Cas9蛋白的体内编辑
[0302] 在一个示例中,使用sgRNA和修复模板之间的增加的接头长度以50碱基对递增至 500个碱基对的长度来鉴定同源重组的最优条件以修复实施例3所述靶标。采用一组接头长度会有助于确定杂合体内所需的必要灵活性以克服蛋白靶链几何结构。当用不同 CRISPR核酸酶和因而特定gRNA及个体修复模板(RT)操作来协调分子复合物相互作用并确保
CRISPR复合物在RT存在下也能发挥其效果时,这特别需要。实施例3的条件与实施例3-5内确定的优化参数一起使用。所述接头是与靶基因附近序列互补的DNA。
[0303] 在使用tdTomato标志物的情况中,成功的编辑会产生一些显示tdTomato荧光表型的细胞,这归因于tdTomato基因在其所含至少一个质粒中的修复。然后,用不同接头长度编辑的相对效率可通过测量各处理所产生荧光细胞的丰度来评价。同样,可使用任何其它感兴趣的可选择的标志物,包括适合感兴趣的细胞类型的任何荧光标志物、抗生素标志物、标签序列、调节序列等。
[0304] 实施例7:确定修复模板的最优配置以用于通过与杂合核酸复合的Cas9蛋白的体内编辑为确定用单链和双链修复模板的编辑,实施例3所述体内试验用于2种配置的相对比较。预期单链修复模板更佳,这是基于短sDNA寡核苷酸比短dsDNA寡核苷酸更低的分子量和发表的更高编辑速度。然而,在大序列需要编辑或插入的情况中可能必需使用双链修复模板。实施例4和6的最优条件能用于此实施例。
[0305] 成功的编辑事件产生一些显示荧光表型如tdTomato表型的细胞,这归因于tdTomato 基因在其所含至少一个质粒中的修复。用不同修复模板编辑的相对效率可通过测量各处理所产生荧光细胞的丰度来评价。
[0306] 实施例8:通过与杂合RNA-DNA核酸复合的Cas9蛋白体内编辑染色体靶标
[0307] 在一个实施例中,由实施例3-7优化的方法能用于对染色体靶基因编辑。在此,稳定插入早期终止密码子tdTomato盒的转基因玉米植物用于证明本发明对染色体靶标的效力。成功的编辑导致一些显示出tdTomato荧光表型的细胞,这归因于tdTomato基因在基因组DNA中的修复。编辑的效率可通过测量各处理所产生荧光细胞的丰度来评价。
[0308] 实施例9:通过与杂合RNA-DNA核酸复合的Cas9蛋白将基因盒体内插入染色体靶标中
[0309] 为证明本发明对将全长基因插入到染色体靶标的效力,tdTomato荧光报告基因和终止子整合入玉米hmg13基因,导致tdTomato荧光信号,这归因于hmg13内源启动子驱动的表达。所述结果能证明长插入物能用本发明方法完成且将有助于优化所述插入的条件。
[0310] 成功的编辑导致一些显示tdTomato荧光表型的细胞,这归因于可以确认tdTomato 基因插入hmg13靶标和后续tdTomato蛋白表达。然后,编辑各测试细胞类的对应效率可通过测量各处理所产生荧光细胞的丰度来评价。
[0311] 实施例10:使用细胞穿透肽将与杂合RNA-DNA核酸复合的Cas9蛋白递送到植物细胞中
[0312] 实施例8或9中鉴定的最优系统用于此实施例以测试基于PEG的转化相比细胞穿透肽(CPP)转化的有效性。先前的出版物和申请表明,使用CPP来递送将能使Cas9蛋白引入带细胞壁的细胞,所述Cas9蛋白与杂合RNA-DNA核酸复合。因此,CPP在Cas 融合蛋白内使用或经Cas蛋白上的N末端半胱氨酸与CPP上的N末端半胱氨酸之间形成的二硫键连接Cas。游离CPP也能用于协助Cas核酸复合物经核酸链上瞬时结合而输入。初始CPP可包括HIV TAT肽
(参见例如SEQ ID NO:17和18),或从中衍生的序列和/或(Arg)g序列。有效性能用实施例3-
9的优化方法通过原生质体系统中成功表达 tdTomato来测试。
[0313] 实施例11:其他CRISPR核酸酶
[0314] 如上所详述,根据本发明的杂合核酸序列适合不同CRISPR系统的多种CRISPR核酸酶。对于任何效应核酸酶如Cas9或Cpf1,gRNA和RT的最优条件及长度将必须如上面实施例1-10所详述进行评估以就各感兴趣的细胞类型的感兴趣的基因组编辑事件获得最佳结果。
此外,用Cas9切口酶的第一实验以与如上详述的相同的方式进行,采用一个以上gRNA和与至少一个gRNA缔合的个体RT的一或两个。初步结果证明这似乎是用于真核细胞中精确基因组编辑的有希望方法。
[0315] 实施例12:动物细胞构建体
[0316] 本发明方法能用于真核细胞,只要其能够进行同源重组。在第一个实例中,鼠T细胞或T细胞前体已经在体外被修饰以使其调整成适合癌症免疫疗法。可以证明,根据本发明的杂合核酸构建体在针对动物系统特定优化(密码子优化)和设计(PAM,靶位点)时,可用于感兴趣的真核细胞类型的高精度基因组编辑。因此,采用本发明所述方法修饰调节T细胞增殖或功能的表达基因可用于治疗,特别是在哺乳动物中,且更特别是通过用根据本发明的构建体修饰感兴趣的细胞类型来治疗对象中疾病或病症。
[0317] 实施例13:暴露的未成熟雄穗组织的转化/转染
[0318] 如上所详述,就转化植物细胞、组织、器官或全植物或其部分描述了多种物理/机械以及生物方式以将遗传物质引入到植物或植物靶结构。这些方法同样适合引入根据本发明的至少一个杂合RNA/DNA核酸序列和/或至少一个gRNA和/或至少一个修复模板和/ 或至少一个CRISPR多肽。暴露并因而获得分生细胞例如来自雄性玉米植物的雄穗组织后,可应用以下方法以转化此组织:
[0319] 关于生物方法,植物组织或其细胞能用农杆菌转化,包括根癌农杆菌(Agrobacterium tumefaciens)或毛根农杆菌(Agrobacterium rhizogenes)介导的转化。
此类转化为本领域技术人员熟知(参见例如Jones,H.D等,Review of methodologies and a protocol for the Agrobacterium-medialed transformation of wheat,plant 
methods,2005;或Frame,B.R.等,  Agrobacterium tumefaciens-mediated 
transformation of maize embryos using a standard binary vector system,Plant,
2002)。为此,含感兴趣的构建体的农杆菌培养物例如在液体 LB培养基中28℃培养过夜,所述培养基含有合适抗生素、10mM MES和200mM ACE。第二天,过夜培养物在4,400rpm离心15分钟并弃上清。沉淀随后在4,400rpm再次离心15分钟2分钟并弃去剩余的上清。沉淀重悬于(5ml H2O,10mM MES,10mM MgCl2+ 20μΜACE)。600nm处的光密度调整到1.5。可能稀释的悬液然后可进一步使用。
[0320] 经生物方式转化植物分生细胞或组织的另一可能性是使用病毒载体。病毒载体具有以下优势:其可作为DNA或RNA引入且引入到感兴趣的植物靶结构。此外,病毒载体或植物病毒具有扩散到不同细胞和组织的能力。
[0321] 出于本发明目的,病毒颗粒、病毒体外转录物或携带T-DNA编码病毒的农杆菌可经过滤(真空和非真空)引入到感兴趣的植物靶结构中。替代实验可用植物体液完成。为此,烟草或菠菜可用感兴趣的病毒感染以随后从植物体液分离所述感兴趣的病毒以感染另一植物靶结构,特别是用带有含病毒的植物体液感染来自不同植物的分生细胞或组织。
[0322] 尽管有转化感兴趣的雄穗结构的生物方式,可使用除了粒子轰击外的用于转化的物理/机械方式。
[0323] 一种合适方法是微注射。微注射能用于任何种类的所测试分生结构,优选采用带显微操纵器的显微镜。归因于某些分生结构如雄穗或穗分生组织的尺寸,微注射可在显微镜控制下进行,或在靶结构足够大的情况下无需显微镜协助即可进行。注射能用多种方法实施,以用于待引入感兴趣的植物靶结构的多种不同靶分子,包括双链血浆DNA、线性双链DNA、RNA和蛋白以及液体溶液中的病毒颗粒。这些不同分子可借助显微针或纳米针应用,所述针协助将靶分子注入感兴趣的分生细胞或结构。靶分子首先包被于针上,针随后插入感兴趣的分生细胞或结构。
[0324] 另一合适方式是粒子轰击,如使用粒子递送系统,此方法如上进一步公开。
[0325] 此技术的进一步开发是使用碳化硅(SiC)晶须(如 碳化硅晶须)和微注射的组合。为此,双链(任选地质粒)DNA、线性双链DNA、RNA、蛋白或根据本发明的分子核糖核-复合物、或病毒颗粒沉淀于碳化硅晶须上以经微注射针注入感兴趣的分生结构或细胞。此技术具有以下优势:不仅可能转染单细胞,而且归因于晶须扩散而有平行穿透不同细胞的可能性。此外,所述细胞得到的破坏更少,因为针不必穿透细胞且晶须尺寸相当小。
[0326] 实施例14:用于检测修饰的方式
[0327] 在使用荧光报告子的情况中,引入根据本发明的至少一个DNA靶序列的任何瞬时或稳定修饰能用荧光检测方式检测。由于雄穗组织如花药和干花粉具有强自发荧光,对于这些细胞和组织应使用其它方式。检测可因而通过其它分子方法完成并确认,如PCR,包括富集PCR、PCR-消化或富集PCR与PCR-消化的组合、定量PCR或测序或RT-PCR,包括深度或下一代测序或者Southern或Northern印迹分析。蛋白水平能通过蛋白质印迹等分析。如果表型可检测的性状被引入至少一个感兴趣的细胞,也可能实施测定以检测所述性状例如抗
性、荧光、形态突变表型或任何其它性状在所述至少一个修饰的细胞或其后代或衍生物中存在或不存在。上述检测方法为本领域技术人员已知。
[0328] 作为分析不同靶植物和其细胞中稳定整合事件的常规设置,可如下进行:首先,DNA 和/或RNA提取自不同材料,包括用编码荧光蛋白(如红色荧光蛋白)的不同构建体转化的例如雄穗、花药或花粉组织/细胞。总之,样品能经定量PCR(qPCR)分析。上面的样品中,数个样品将显示清晰即极强烈的红色(荧光)信号,这指示阳性事件且其随后可被选择。从这些样品将产生包括没有反转录酶的对照在内的cDNA,以排除后面结果与未消化DNA不相关。在有用于转录测量的阳性DNA信号的样品中,数个样品可显示清晰转录且其它显示潜在转录(在可清楚测量的边界处)。
[0329] 实施例15:Cas9和scFv的融合蛋白
[0330] 在一个实验中,作为SSN的Cas9核酸酶和作为相互作用结构域的抗荧光素的单链抗体的融合蛋白可以在体外或体内表达,并暴露于FAM标记的寡核苷酸以充当修复模板。合成RT并与FAM共价连接作为修复模板对接结构域。如上所述,通过指示修复的荧光信号或基于序列的修复频率测量来测量编辑效率。因此,可以分别产生和纯化具有针对对所选配体(例如FAM)的特异性亲和力的Cas9和scFv的SSN相互作用结构域对并然后可以交联或连接,或所述SSN和所述相互作用结构域(IA)可以作为融合分子产生。根据测定,可以将SSN-IA分子转染到细胞中或作为蛋白质添加到测定中,或者可以将构建体在载体上引入靶细胞(以组成型方式诱导或活化)以进行体内转录和翻译。此外,可以将编码SSN-IA的序列以待在体内翻译的RNA构建体引入包含带修饰的感兴趣的DNA靶序列的靶细胞中。SEQ ID NO:44
(Cas/mSA融合构建体)和SEQ ID NO: 45(Cas/scFv(FAM)融合构建体)显示根据本发明的示例性SSN-IA融合分子,其将 CRISPR衍生的SSN的功能与特异性蛋白质对其同源伴侣的极高结合亲和力相结合。
[0331] 图4A至C示意性地说明了使用SSN和作为IA的单体链霉抗生物素蛋白或scFv 的融合物的基因组工程方法。值得注意的是,单体链霉抗生物素蛋白或scFv或任何其他IA或
RTDD的使用不限于使用CRISPR或Argonaute核酸酶。
[0332] 实施例16:通过scFv连接的Cas9融合蛋白结合核酸
[0333] 为了证明实施例15的融合蛋白结合单链或双链修复模板的能力,将用荧光素(FAM) 标记的寡核苷酸重复所述的结合测定。FAM标记的寡核苷酸可以商购获得。可以通过蛋白质、DNA和荧光染料的共迁移以及相应的分子量增加来测试成功的相互作用。使用特异性向导RNA和含有相应靶标的线性化质粒的体外切割测定来测试融合蛋白的核酸酶部分的功能。在适合于核酸酶活性的条件下孵育后,所述条件包括本领域技术人员已知的针对各种CRISPR核酸酶及其变体的正确pH、温度和辅因子等,将DNA靶质粒在琼脂糖凝胶上电泳并观察指示在预期靶位点切割的条带大小。靶DNA的体外切割表明与核酸酶缔合的RT不会干扰Cas9复合物作为位点特异性核酸内切酶的正常功能。
[0334] 实施例17:Cas9和mSA2的融合蛋白
[0335] 在一个实验中,表达Cas9核酸酶和修饰的链霉抗生物素蛋白标签的融合蛋白(基于 SEQ ID NO:34)并暴露于作为修复模板的生物素标记的寡核苷酸,所述生物素充当 
RTDD并且所述寡核苷酸代表RT。通过指示修复的荧光信号或基于序列的修复频率测量来测量编辑效率。
[0336] 实施例18:通过mSA2连接的Cas9融合蛋白结合核酸
[0337] 为了证明实施例17的融合蛋白结合单链或双链修复模板的能力,用生物素标记的寡核苷酸重复所述的结合测定。生物素标记的寡核苷酸可以商购获得或使用末端脱氧核苷酸转移酶产生。可以通过蛋白质和DNA的共迁移以及相应的分子量增加来测试成功的相互作用。使用特异性向导RNA和含有相应靶标的线性化质粒的体外切割测定来测试融合蛋白的核酸酶部分的功能。在适合于核酸酶活性的条件下孵育后,包括本领域技术人员已知的针对各种CRISPR核酸酶及其变体的正确pH、温度和辅因子等,将DNA 靶质粒在琼脂糖凝胶上电泳并观察指示在预期靶位点切割的条带大小。靶DNA的体外切割表明与核酸酶缔合的RT不会干扰Cas9复合物作为位点特异性核酸内切酶的正常功能。
[0338] 实施例19:通过与FAM-或生物素标记的修复模板核酸复合的Cas9融合蛋白体内编辑游离基因靶标以恢复基因功能
[0339] 为了证明靶基因可以通过包含Cas9蛋白和FAM-或生物素标记的核酸的递送复合物在体内编辑,通过交换单个核苷酸修复转化质粒中包含的非功能性tdTomato基因以恢复来自tdTomato基因的荧光信号。为了通过提供与靶链或非靶链互补的ssDNA修复模板来确定编辑的最佳使用,比较携带任一链的修复模板的复合物。
[0340] 分别使用实施例16或18的核酸复合融合蛋白修复游离基因质粒靶标,其编码具有从A到T的单点突变的tdTomato基因,所述单点突变在密码子第51位产生早期终止信号。该质粒与包含Cas9-ScFV或Cas9-mSA2融合蛋白和FAM或生物素标记的核酸的编辑复合物一起通过PEG介导的递送被引入到玉米原生质体系统。成功编辑然后导致一些显示tdTomato荧光表型的细胞,这归因于tdTomato基因在其中包含的至少一个质粒中的修复。因此,通过测量每次处理产生的荧光细胞的丰度,可以容易地评估用不同修复模板进行编辑的相对效率。
[0341] 实施例20:通过与FAM-或生物素标记的修复模板核酸复合的Cas9融合蛋白体内编辑染色体靶标以将DNA序列整合到特定基因座中
[0342] 为了证明靶基因可以通过包含Cas9蛋白和FAM-或生物素标记的核酸的递送复合物在体内编辑,特定的已知DNA序列将整合到基因组DNA内的特定位点。
[0343] 表达Cas9和对荧光素具有亲和力的单链可变片段的融合蛋白(实施例16)或Cas9和经修饰的链霉抗生物素蛋白的融合蛋白(实施例18),并暴露于带标签的修复模板DNA 并用于在基因组基因座中整合已知的DNA序列。将通过靶位点处的荧光信号指示修复或分子测定来分析成功的编辑。
[0344] 实施例21:通过scFv连接的Argonaute融合蛋白结合核酸
[0345] 为了证明修复模板核酸与非CRISPR核酸酶结合的能力,进行结合测定显示使用 FAM标记的修复核酸寡核苷酸和Argonaute核酸酶(参见SEQ ID NO:46)和对FAM具有亲和力的单链可变片段(参见SEQ ID NO:43和45)的融合蛋白在共迁移研究中的重量增加。同样地,Argonaute SSN可以与单体链霉抗生物素蛋白(参见SEQ ID NO:42 和44)连接作为RT的结合复合物。使用特异性向导核酸和含有相应靶标的线性化质粒的体外切割测定来测试融合蛋白的核酸酶部分的功能。在适合于核酸酶活性的条件下孵育后,所述条件包括本领域技术人员已知的针对各种非CRISPR核酸酶及其变体的合适的pH、温度和辅因子等,将DNA靶质粒在琼脂糖凝胶上电泳并观察表示在预期靶位点切割的条带尺寸。靶DNA的体外切割表明与核酸酶缔合的RT不会干扰Argonaute复合物作为位点特异性核酸内切酶的正常功能。
[0346] 实施例22:通过与FAM标记的修复模板核酸复合的Argonaute融合蛋白体内编辑染色体靶标以将DNA序列整合到特定基因座中
[0347] 为了证明靶基因可以通过包含非CRISPR核酸酶Argonaute蛋白和FAM-或生物素标记的核酸的递送复合物在体内编辑,已知DNA序列将整合到基因组DNA内的特定位点。
[0348] 表达Argonaute核酸酶和对荧光素具有亲和力的单链可变片段的融合蛋白(参见实施例21)并暴露于带标签的修复模板DNA,并用于在基因组基因座中整合已知的DNA序列。
通过靶位点处的荧光信号指示修复或分子测定将分析成功的编辑。
[0349] 实施例23:CRISPR核酸酶(如Cas9或Cpf1)和RTDD1的融合蛋白
[0350] 为了证明绑定策略起作用,将纯化的CRISPR核酸酶如Cas9或Cpf1与RTDD1融合,在这种情况下,将其绑定至单链可变片段(SEQ ID NO:54)并在细菌大肠杆菌中表达。它在变性的连续梯度(4-10%)SDS凝胶上跑胶并显示蛋白质的数量和纯度。在该凝胶中染色蛋白质。图5的右图显示了该绑定。这是4%非变性丙烯酰胺凝胶(Blue Native PAGE)并且这里使用GelRed染色DNA。将FAM标记的(RTDD2-)修复模板在没有或有图5左图所示的核酸酶-RTDD1的核酸酶的缓冲液中孵育。如果蛋白质存在,则发生绑定,如通过在较高的分子量水平被检测的DNA所示图5中的箭头)。
[0351] 实施例24:HDR事件的检测
[0352] 为了证明下一代测序(更具体地是扩增子深度测序)能够在靶位点检测HDR事件,与链霉抗生物素蛋白变体融合的编码核酸酶(在这种情况下它是CRISPR核酸酶)与修复模
板一起转化到质粒上。所述修复模板具有5'生物素标签,并作为单链寡核苷酸递送。转化后
24小时,收集原生质体并提取DNA。使用一组引物扩增靶位点,所述引物被设计为不与修复模板的同源臂重叠。图6的第4行显示了正确的HDR事件。该事件取代序列
AAGGTGCTCGGCCCCGAGCTC(SEQ  ID  NO:52;编码氨基酸序列KVLGPEL)与 
AAGTGGTCCAGCGCCGCGACCTAGCTC(SEQ ID NO:53;编码氨基酸序列 KWSSAAT-L)。SEQ ID NO:
51是完整的修复模板,其证明同源臂没有延伸超过扩增子,这意味着具有剩余修复模板的PCR人为现象是不可能的。
[0353] 实施例25:修复模板的绑定提高了HDR效率
[0354] 对于该实验,将实施例24的组分转化到玉米叶原生质体中。在绑定的情况下,核酸酶(在这种情况下它是CRISPR核酸酶)与天然链霉抗生物素蛋白序列融合。在任一情况下,核酸酶以质粒的形式递送。修复模板DNA作为具有5'生物素标签的寡核苷酸递送。转化后24小时,收集原生质体并提取DNA。使用一组引物扩增靶位点,所述引物被设计为不与修复模板的同源臂重叠。扩增子深度测序(参见实施例24)和随后的计算分析允许定量靶位点处的INDEL和HDR事件。将HDR频率标准化为INDEL频率,作为双链断裂发生的量度。当修复模板与核酸酶绑定时,平均HDR频率从没有绑定的0.92% (±0.06%)增加至1.26%(±0.06%)(图7)。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈