用于靶向单链切割和靶向整合的方法和组合物专利检索- 作用于酯键的水解酶专利检索查询-专利查询网

用于靶向单链切割和靶向整合的方法和组合物
申请号	CN200980138296.0	申请日	2009-08-18	公开(公告)号	CN102159722A	公开(公告)日	2011-08-17
申请人	桑格摩生物科学股份有限公司;			发明人	汪建斌;
摘要	本发明公开了用于在靶序列中产生单链断裂的方法和组合物，该单链断裂促进一个或多个外源序列的靶向整合。
权利要求	1.一种含有一个DNA结合结构域和至少一个催化失活的切割结构域或切割半结构域的融合蛋白。 2.根据权利要求1的融合蛋白，其中DNA结合结构域包括锌指结构域。 3.根据权利要求2的融合蛋白，其中锌指结构域是非天然存在的。 4.根据权利要求1到3中任一项的融合蛋白，其中切割结构域是FokI切割半结构域。 5.一种编码权利要求1到4中任一项的融合蛋白的多核苷酸。 6.一种含有权利要求1到4中任一项的融合蛋白和包含一个锌指结构域和一个催化激活的切割半结构域的第二融合蛋白的蛋白复合物，其中催化失活的切割半结构域与第二融合蛋白的催化激活的切割半结构域形成异二聚体。 7.一种含有权利要求5的多核苷酸和编码包含一个锌指结构域和一个催化激活的切割半结构域的融合蛋白的第二多核苷酸的组合物，其中催化失活的切割半结构域与第二融合蛋白的催化激活的切割半结构域形成异二聚体。 8.一种含有权利要求1到4中任一项的融合蛋白，权利要求5的多核苷酸，权利要求6的蛋白复合物和/或权利要求7的组合物的分离的细胞或细胞系。 9.一种在细胞的靶双链序列中产生单链断裂的方法，该方法包括：提供权利要求6的蛋白复合物或权利要求7的组合物，其中异二聚体在靶双链序列中产生单链断裂。 10.根据权利要求9的方法，其中靶序列位于细胞染色质中。 11.一种插入外源序列到细胞中的目的区域中的方法，该方法包括：根据权利要求9的方法在目的区域中产生单链断裂；和在产生单链断裂之后提供被插入到目的区域中的外源序列。 12.根据权利要求11的方法，其中外源序列取代了野生型基因组序列。 13.一种失活细胞的目的区域中的靶序列的方法，该方法包括：根据权利要求9的方法在目的区域中产生单链断裂，和提供在目的区域中取代野生型序列的外源序列，其中外源序列部分或完全失活靶序列。
说明书全文	用于靶向单链切割和靶向整合的方法和组合物 [0001] 关于在联邦政府赞助研究下作出的发明的权利的声明 [0002] 不适用。技术领域 [0003] 本公开属于基因组工程、基因靶向、靶向染色体整合和蛋白表达领域。背景技术 [0004] 关于基因组生物学，尤其是确定许多基因组的完整核苷酸序列的重要感兴趣领域，是基因组序列的靶向改变。 [0005] 人工核酸酶，其连接核酸酶的切割结构域与设定的DNA结合蛋白(例如，与如来自FokI核酸酶切割结构域连接的锌指蛋白(ZFP))，已被用于真核细胞中的靶向切割。例如，锌指核酸酶介导的基因组编辑已显示出能通过(1)在活细胞的基因组中，特异性地在用于所需修饰的靶位点产生双链断裂，和(2)允许DNA修复的天然机制以“恢复”该断裂，在特定位点修饰人类基因组的序列。 [0006] 为了增加特异性，使用一对或多对用户设计的锌指核酸酶诱导切割事件，该锌指核酸酶在结合DNA时即二聚化以形成催化激活的核酸酶复合物。而且，使用一对或多对锌指核酸酶(ZFN)进一步增加了特异性，其包括仅仅在形成异二聚体后切割双链DNA的改造切割半结构域。参见，例如，美国专利公开No.20080131962，其通过引用全文并入本文。 [0007] 通过人工核酸酶产生的双链断裂(DSB)已经用于，例如，诱导靶向突变诱导细胞内DNA序列的靶向缺失和促进在预定染色体位点的靶向重组。参见，例如，美国专利公开 20030232410；20050208489；20050026157；20050064474；20060188987；20060063231；20070218528；20070134796；20080015164以及国际公开WO 07/014275和WO 2007/139982，其公开内容适用于所有目的地通过引用全文并入本文。因此，在靶基因组位点产生DSB的能力允许任意基因组的基因组编辑。 [0008] 有两种重要且不同的途径来修复DSB-同源重组和非同源末端连接(NHEJ)。同源重组需要存在同源序列作为模板(例如“供体”)，以指导细胞内修复过程，而且修复的结果是没有错误并且可预测的。对于同源重组，缺乏模板(或“供体”)序列，细胞一般会通过非同源末端连接(NHEJ)的不可预测和容易出错的过程修复DSB。 [0009] 单链断裂(SSB)，包括DNA缺口，是内源性活性氧物种和DNA代谢过程如DNA修复和复制中最常见的DNA损伤之一。参见，McKinnon等(2007)Annu Rev Genomics Hum Genet8：37-55；Okano等(2003)Mol Cell Biol 23：3974-3981。非凋亡细胞的染色体在整个基因组的大约50kb间隔处含有单链中断(SSB/缺口)。参见，例如，Szekvolgyi等(2007)Proc Natl Acad Sci USA104：14964-14969。大多数SSB/缺口可通过快速整体SSB修复过程进行修复，其可以分成4个基本步骤：通过聚(ADP-核糖)聚合酶-1(PARP-1)的SSB缺失，通过各种酶的DNA末端加工，通过DNA聚合酶的DNA缺口填补和通过DNA连接酶的DNA连接，参见Caldecott，K.W.(2008)Nat Rev Genet 9，619-31。Lee等(2004)Cell 117：171-184发现的数据表明，由突变的RAG蛋白诱导的缺口可以在哺乳动物细胞中启动同源性定向修复(HDR)。 [0010] 然而，以前没有表明改造ZFN可以诱导SSB/缺口，或这些SSB/缺口可以通过同源重组修复，或ZFN可用于通过同源重组促进转基因的靶向整合。因此，需要在双链DNA中产生单链断裂(缺口)，并通过在缺口位点的同源重组促进靶向整合，同时在哺乳动物/人类细胞中不产生倾向错误的NHEJ修复的方法和组合物。 [0011] 发明概述 [0012] 本发明公开了用于在任意目标双链靶序列中诱导靶向单链断裂的方法和组合物。还描述了在靶向单链切割之后促进同源重组和靶向整合的方法。因此，本发明描述了基因组的靶向调节。 [0013] 在一个方面，提供了在所需的双链靶序列中产生单链切割的人工(非天然存在)核酸酶。这里描述的核酸酶包括一个DNA结合结构域(例如，改造的锌指蛋白)和至少一个切割结构域或至少一个切割半结构域。在特定的实施方案中，核酸酶是包括锌指结构域的锌指核酸酶，该锌指结构域被改造以结合任意选择的序列(例如，基因)。这里描述的任意锌指蛋白可包括1、2、3、4、5、6或多个锌指蛋白，每一锌指蛋白具有一个结合选择的序列(例如，基因)中的靶亚位点的识别螺旋。切割结构域可以来源于任意核酸酶，例如，来自IIS型核酸酶如FokI的切割半结构域。在特定的实施方案中，切割半结构域包括改造的FokI切割半结构域，其与另一个切割半结构域(例如，二聚化结构域中改造的或野生型)形成异二聚体。在进一步的实施方案中，切割结构域(例如，改造的FokI切割半结构域)包括失活核酸酶结构域的催化结构域(酶促活性)的突变。 [0014] 在另一个方面中，本发明提供了包括一对锌指核酸酶的复合物和/或组合物，每个核酸酶包括一个改造的锌指结构域和一个FokI切割半结构域，其中切割半结构域形成二聚体(同源二聚体或异二聚体)。在特定的实施方案中，锌指核酸酶对中的一个锌指核酸酶包括第一催化激活的改造切割半结构域，另一个锌指核酸酶包括第二催化失活的改造切割半结构域，其中第一和第二改造切割半结构域形成专性异二聚体。 [0015] 在另一个方面中，提供了编码这里描述的任意核酸酶的多核苷酸。 [0016] 在另一个方面中，还提供了含有这里所述的任意蛋白和/或多核苷酸的分离的细胞。在特定的实施方案中，提供了通过靶向改变引入了外源序列到其中的细胞系。在特定的实施方案中，这些细胞系中的一个或多个选择的基因被失活(部分或全部)。在其他的实施方案中，细胞或细胞系包括一个或多个转录和/或翻译的外源序列，该外源序列已经被稳定或瞬时引入到细胞中。通过培养含有这里所述的任意蛋白和/或多核苷酸的细胞，在导致选择基因失活的细胞系中产生这种细胞系。 [0017] 还本发明提供了含有一个或多个转录和/或翻译的外源序列的转基因生物，该外源序列已经被稳定或瞬时引入到细胞中。进一步提供了含有通过这里提供的方法选择性失活的基因的转基因生物，或含有能改变内源序列的表达的外源序列的生物。这里所述的转基因生物可以是植物(例如农作物植物或烟草)或动物(例如，小鼠、大鼠、兔子、鱼等等)。在特定的实施方案中，转基因生物用于生产携带编码这里所述的核酸酶的一个或多个序列，和/或一个或多个外源序列(例如，使用这里所述的核酸酶通过靶向整合被插入到基因组中的序列)的生物的系。例如，这里公开了含有这里所述的核酸酶的转基因植物和植物系，该核酸酶在可诱导启动子的调控下。因此，可以在植物中在所需时间和/或植物的所需组织中，表达含有编码核酸酶的游离或整合序列的转基因植物和植物系。 [0018] 此外，本发明提供了在细胞中的靶双链序列中产生特定的单链断裂的方法。在特定的实施方案中，该方法包括引入一对或多对核酸酶(编码核酸酶的蛋白或多核苷酸)到细胞中。每个核酸酶对包括具有第一DNA结合结构域和第一催化激活切割半结构域的第一核酸酶，和具有第二DNA结合结构域和第二催化失活的切割半结构域的第二核酸酶。在以便每个核酸酶对的第一与第二切割半结构域形成二聚体并在靶序列中产生单链断裂的条件下，一对或多对核酸酶被引入到细胞中。 [0019] 在特定的实施方案中，第一和/或第二DNA结合结构域含有锌指蛋白(例如，改造的锌指蛋白)。进一步地，在这里所述的任意方法中，第一和第二切割半结构域可含有FokI切割半结构域，例如被改造以形成专性异二聚体的FokI切割半结构域。靶序列可以是任意双链序列，例如，细胞染色质中的序列如基因组序列或其部分。而且，靶序列可以是例如质粒或病毒中的染色体外的双链DNA序列。类似地，靶序列可以处于任意的细胞类型中，包括原核和真核细胞，如真菌细胞，植物细胞，动物细胞，哺乳动物细胞，灵长类动物细胞和人类细胞。 [0020] 单链断裂的位点可与催化激活的核酸酶结合的序列一致，或者它可以是相邻的(例如与结合位点的近端分隔1，2，3，4，5，6，7，8，9，10，11，12，13，14，15或更多个核苷酸)。可以通过递送融合蛋白到细胞中和/或通过递送编码一种或多种核酸酶的多核苷酸到细胞中，在细胞中表达融合蛋白，其中该多核苷酸，如DNA，被转录成mRNA，该mRNA然后翻译成融合蛋白。可选择地，RNA分子可以被递送到细胞中，该RNA分子然后被翻译以产生融合蛋白。在本发明公开的其他地方提供了将用于多核苷酸和多肽递送到细胞中的方法。 [0021] 本发明还提供了用于靶向重组的方法(用于，例如，染色体或者细胞染色质中目标区域中的序列的改变或取代)。例如，用野生型序列取代突变的基因组序列用于遗传疾病或遗传紊乱的治疗。此外，可以用突变序列取代野生型基因组序列，例如，来防止致癌基因产物或涉及不合宜的炎症性应答的基因产物的功能。进一步地，可以用一个或多个不同的等位基因取代基因的一个或多个等位基因(例如，双等位基因靶向整合)。 [0022] 在本发明公开的方法中，这里描述的一个或多个靶向核酸酶在靶序列的预定位点产生单链断裂，而且其与断裂区域中的核苷酸序列具有同源性的“供体”多核苷酸可以被导入到细胞中。这里已经显示单链断裂的存在有助于供体序列的整合。供体序列可以被物理整合或，可选地，供体多核苷酸用作模板用于通过同源重组修复断裂，其导致如供体中的全部或部分核苷酸序列导入到细胞染色质中。因此，细胞染色质中的最初序列可以被改变而且，在特定的实施方案中，可以被转变成供体多核苷酸中存在的序列。因此，术语“取代(“replace”)”或“取代的(“replacement”)”的使用可以理解为表示用另一个核苷酸序列取代一个核苷酸序列(也即，信息意义上的序列取代)，而且不必要求由另一个多核苷酸对一个多核苷酸进行物理或化学取代。 [0023] 另外，本发明提供了用第一核苷酸序列取代细胞染色质的目的区域(例如，基因组序列)的方法，该方法包括：(a)改造第一锌指结构结合结构域以结合目的区域中的第二序列；(b)提供第二锌指结构结合结构域以结合目的区域中的第三序列；(c)在细胞中表达第一融合蛋白，该第一融合蛋白含有第一锌指结构结合结构域和第一催化激活的切割半结构域；(d)在细胞中表达第二融合蛋白，该第二融合蛋白含有第二锌指结合结构域和第二催化失活的切割半结构域；和(e)使细胞与含有第一核苷酸序列的多核苷酸接触；其中第一融合蛋白与第二序列结合，第二融合蛋白与第三序列结合，从而定位切割半结构域以便在细胞染色质的目的区域中产生单链断裂，而且用第一核苷酸序列取代目的区域中的核苷酸序列。在特定的实施方案中，在目的区域的第二与第三序列之间的位点产生细胞染色质中的单链断裂。锌指结构核酸酶可作为蛋白和/或编码所述锌指结构核酸酶的一个或多个多核苷酸的方式提供给细胞。例如，可以导入两个多核苷酸到细胞中，每个多核苷酸含有编码两种融合蛋白之一的序列。可选择地，可以引入含有编码两种融合蛋白的序列的单个多核苷酸到细胞中。 [0024] 在这里描述的任意方法中，其他的锌指结构蛋白对可用于细胞内另外的靶位点的另外的双链和/或单链切割。 [0025] 因此，在一个实施方案中，用第一核苷酸序列取代细胞染色质中的目的区域(例如，基因组)的方法包括：(a)改造第一锌指结合结构域以结合目的区域中的第二序列；(b)提供第二锌指结合结构域以结合第三序列；和(c)使细胞与：(i)含有第一核苷酸序列的第一多核苷酸；(ii)含有第一融合蛋白的第二多核苷酸接触，第一融合蛋白含有第一锌指结合结构域和第一催化活性半切割第一结构域；和(iii)编码第二融合蛋白的第三多核苷酸，第二融合蛋白含有第二锌指结合结构域和第二催化失活的切割半结构域；其中表达第一和第二融合蛋白，第一融合蛋白与第二序列结合，第二融合蛋白与第三序列结合，从而定位切割半结构域以便在细胞染色质中的目的区域中产生单链断裂，并用第一核苷酸序列取代目的区域。 [0026] 在用于细胞染色质的目的区域中的序列的靶向重组和/或取代和/或改变的优选实施方案中，通过与外源“供体”核苷酸序列的同源重组来改变染色体的序列。如果存在与断裂区域同源的序列，通过细胞染色质中单链断裂的存在来刺激这种同源重组。值得注意的是，细胞染色质中的单链断裂不刺激非同源末端连接的细胞机理。 [0027] 在这里描述的任意方法中，第一核苷酸序列(“供体序列”)可含有与目的区域中的基因组序列同源但不相同的序列，从而刺激同源重组以插入非相同序列到目的区域中。因此，在特定的实施方案中，与目的区域中序列同源的供体序列部分显示与被取代的基因组序列有大约80到99％的(或这之间的任意整数)序列同一性。在其他的实施方案中，供体与基因组序列之间的同源性高于99％，例如如果供体与超过100个连续碱基对的基因组序列之间只有1个核苷酸不同。在特定的情况下，供体序列的非同源部分可含有目的区域中不存在的序列，以便引入新的序列到目的区域中。在这种情况下，非同源序列一般侧接于 50-1,000(或这之间的任意整数值)个碱基对，或大于1,000的任意数量的碱基对的序列，例如人工染色体中发现的那些序列，其与目的区域中的序列同源或相同。在其他的实施方案中，供体序列与第一序列是非同源的，而且通过非同源重组机制被插入到基因组中。 [0028] 这里描述的任意方法可用于通过供体序列的靶向整合，部分或完全失活细胞中的一个或多个靶序列，该靶向整合破坏目的基因的表达。本发明还提供了具有部分或完全失活的基因的细胞系。更进一步地，具有部分或完全失活的基因的植物细胞系可用于产生转基因植物。本发明还提供了包含这里所描述的核酸酶的植物细胞系，其中核酸酶的表达由诱导型启动子驱动。类似地，具有部分或完全失活的基因的哺乳动物生殖细胞，如卵母细胞，可用于产生转基因动物。 [0029] 此外，这里描述的靶向整合的方法还可用于整合一个或多个外源序列。外源核酸序列可包含，例如，一个或多个基因或cDNA分子，或任意类型的编码或非编码序列，以及一个或多个调控元件(例如，启动子)。另外，外源核酸序列可以产生一个或多个RNA分子(例如，小的发夹RNA(shRNA)，抑制RNA(RNAi)，小RNA(miRNA)，等等，)。 [0030] 在这里描述任意细胞、细胞系和方法中，细胞或细胞系可以是COS，CHO(例如，CHO-S，CHO-K1，CHO-DG44，CHO-DUXB11，CHO-DUKX，CHOK1SV)，VERO，MDCK，WI38，V79，B14AF28-G3，BHK，HaK，NS0，SP2/0-Ag14，HeLa，HEK293( 例如，HEK293-F，HEK293-H，TMHEK293-T)，PerC.6 (Crucell)；EBx (Sigma-Aldrich Group)，昆虫细胞如草地贪夜蛾(Spodoptera fugiperda，Sf)，或真菌细胞如酵母属，毕赤氏酵母属和裂殖酵母属细胞。 [0031] 在另一个方面中，本发明提供了含有这里描述的一个或多个核酸酶(或编码这些核酸酶的多核苷酸)的试剂盒，该试剂盒用于实施这里描述的方法。试剂盒任选地可包含试剂、缓冲液、细胞、合适的容器和说明书。 [0032] 根据作为一个整体的本公开，这些和其他方面对本领域技术人员是非常显而易见的。 [0033] 附图简述 [0034] 图1为描述示例性的锌指核酸酶(ZFN)结构，其包括失活的切割结构域的示意图。ZFN对只切割一条DNA链以形成单链断裂(SSB)，也称为缺口。 [0035] 图2，图A-C，描述了使用锌指核酸酶对进行双链靶的单链切割，其中一个核酸酶包括一个已经突变以失活核酸酶结构域的切割活性的切割结构域。 [0036] 图2A描述了通过用所述的ZFN对切割靶底物获得的双链切割产物的分析。从左至右，泳道表示：分子量阶梯，对照，靶向CCR5的ZFN对8196zKK:8267EL，其中KK和EL指改造的切割结构域，其形成专性的异质二聚体以产生双链断裂(参见，美国专利公开2008/0131962)，本申请中称为野生型8196zKK8267EL(WT)；靶向CCR5的ZFN对8196zKK:8267EL，其中8267EL蛋白在一个切割半结构域的催化结构域的450位置处还含有一个突变(D450N)，该突变失活ZFN对的一个切割半结构域；靶向CCR5的ZFN对 8196zKK:8267EL，其中8267EL蛋白在催化结构域的467位置处还含有一个突变(D467A)，该突变失活ZFN对的一个切割半结构域；另一个分子量阶梯，另一个对照；靶向CCR5的ZFN对8267RD:8196zDR，其中RD和DR指改造的切割结构域，其形成专性异质二聚体(参见，美国专利公开2008/0131962)，本申请中称作野生型8267RD:8196zDR(WT)；靶向CCR5的ZFN对8267RD:8196zDR，其中8196zDR蛋白在一个切割半结构域的催化结构域的450位置处还含有一个突变(D450N)，该突变失活ZFN对的一个切割半结构域；靶向CCR5的ZFN对 8267RD:8196zDR，其中8196zDR蛋白在催化结构域的467位置处还含有一个突变(D467A)，该突变失活ZFN对的一个切割半结构域。 [0037] 图2B描述了通过用所述的ZFN对切割靶底物获得的单链切割产物的分析。如上面图2A所述，泳道从左至右分别表示：分子量阶梯，对照，靶向CCR5的ZFN对8196zKK:8267EL(WT)；靶向 CCR5的ZFN对 8196zKK:8267EL(D450N)；靶向CCR5 的ZFN对8196zKK:8267EL(D467A)；另一个分子量阶梯，另一个对照；靶向CCR5的ZFN对 8267RD:8196zDR(WT)；靶向CCR5的ZFN8267RD:8196zDR示(D450N)；和靶向CCR5的ZFN对 8267RD:8196zDR(D467A)。 [0038] 图2C的简图描述了使用这里所述的突变切割结构域可能的切割模式，其表明由于在不同的DNA片断中放射性标记的定位，可以在放射自显影分析中检测到条带。 [0039] 图3，图A到E，描述了通过HDR依赖的单链退火(SSA)途径，K562细胞中ZFN诱导的SSB/缺口的修复。在缺乏(无ZFN，图3B)或存在图2A中如上所述的ZFN表达质粒时，K562细胞未处理(未处理，图3A)或用SSA-GFP报告DNA质粒转染：靶向CCR5的ZFN8196zKK:8267EL(WT，图3C)；靶向CCR5的ZFN8196zKK:8267EL(D450N，图3D)；靶向CCR5的ZFN8196zKK:8267EL(D467A，图3E)。转染后3天收集细胞，细胞用碘化丙锭(PI)孵育 5min染色非活细胞(PI+)后，进行细胞术分析。由于GFP供体序列侧接于CCR5序列，该CCR5序列与缺口位点旁邻的区域同源，GFP供体序列通过HDR依赖途径整合到CCR5基因中的断裂中。因此，观察到的GFP荧光信号增强则表明已经发生供体序列的靶向整合。在四分体的上角标明了每个四分体中细胞的百分数。数据证明含有D450N和D467A突变体的ZNF对能够整合GFP序列。 [0040] 图4，图A到D，描述了诱导靶基因中的双链或单链断裂后，外源序列(膜片供体(patch donor))的非同源末端连接(NHEJ)和靶向整合(TI)。图4A描述了每个泳道中，在含有如上所述的ZFN对的K562细胞中通过NHEJ对双链而不是单链断裂的修复。泳道号对应于表1中的样本号。图4B描述了用表1中表明的ZFN对进行CCR-5基因的单链或双链切割后，46bp CCR-5膜片供体分子的靶向整合。泳道号与样本号对应。图4C和4D描述了用单个锌指核酸酶或两个锌指核酸酶的组合(每个泳道中如上所述)处理的细胞中的同源重组事件。 [0041] 图5，图A和B，描述了靶向整合分析，和存在46bp CCR5-膜片供体时对用所示的ZFN组合转染的K562细胞进行的NHEJ分析。图5A显示了靶向整合分析，图5B显示了NHEJ分析。每个图下面的数字表示靶向整合或NHEJ的频率(％)。 [0042] 图6，图A和B，描述了靶向整合分析，和存在CCR5-tNGFR-outGFP供体时用表述的ZFN组合转染的K662细胞进行的NHEJ分析。图6A显示了NHEJ分析，图6B显示了通过Southern印迹进行的靶向整合分析。每个图下面的数字表示靶向整合或NHEJ的频率(％)。 [0043] 图7的图表描述了用表述的ZFN构建体转染的K562细胞中，在指示的时间点的53BP1+foci(指示DSB)。空心圆表示没有ZFN的对照细胞；实心圆表示用野生型ZFN转染的细胞；空心正方形表示用野生型ZFN与失活的ZFN(D450N)转染的细胞；和实心正方形表示用野生型ZFN与失活的ZFN(D467A)转染的细胞。 [0044] 图8描述了K562细胞中CXCR4基因座上的靶向整合分析。在缺乏(无ZFN)或存在CXCR4D450N ZFN：CXCR4-ZFN-L-EL-D450N+CXCR4-ZFN-R-KK时，用CXCR4-膜片供体DNA对K562细胞进行核转染。使细胞恢复4-7天，然后用相同的DNA再次进行核转染。重复该过程，进行总共4次核转染。最后一次核转染后3天收集细胞，用于gDNA制备和RFLP分析。通过箭头指示由TI对CXCR4修饰的预期位置。每条泳道下面的数字表示TI的频率(％)。 [0045] 发明详述 [0046] 本发明公开了用于细胞染色质的靶向单链切割和细胞核苷酸序列靶向改变的组合物和方法，例如，通过外源多核苷酸(含有与细胞核苷酸序列同源的一个或多个区域)与基因组序列之间同源重组后的靶向单链切割。基因组序列包括染色体，游离基因，细胞器基因组(例如，线粒体，叶绿体)，人工染色体中存在的那些序列，和细胞中存在的任意其他类型的核酸诸如，例如扩增的序列、双微染色体和内源或感染细菌与病毒的基因组。基因组序列可以是正常的(也即，野生型)或突变的；突变序列可包含，例如，插入，缺失，易位，重排和/或点突变。基因组序列还可以包含许多不同的等位基因之一。该组合物和方法还可以用于染色体外核苷酸序列例如质粒的靶向改变。 [0047] 可用于靶向单链切割和重组的组合物包括，含有切割半结构域和锌指结合结构域的融合蛋白，编码这些蛋白的多核苷酸，以及多肽与编码多肽的多核苷酸的组合。锌指结合结构域可包含一个或多个锌指结构(例如，2，3，4，5，6，7，8，9或更多个锌指结构)，而且可以进行改造操作以结合任意的基因组或游离基因序列。因此，通过确定目标靶基因组或游离基因区域，需要在该基因组或区域进行切割或重组，根据这里公开的方法，可以构建一个或多个融合蛋白，其含有催化激活和催化失活的切割半结构域和锌指结构域，该锌指结构域被改造操作以识别所述基因组或游离基因区域中的靶序列。细胞中这种融合蛋白(或蛋白)的存在，将导致融合蛋白与它的(它们的)结合位点结合，以及所述基因组或游离基因区域内或邻近所述基因组或游离基因区域处的单链切割。值得注意的是，如这里所示，如果外源多核苷酸也存在于这种细胞中，该外源多核苷酸具有与基因组或游离基因区域同源的区域，基因组或游离基因区域与外源多核苷酸之间高效率发生同源重组。 [0048] 概述 [0049] 本发明在这里公开的方法的实施，以及组合物的制备和使用，除非另有说明，应用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和本领域技术内相关领域中的常规技术。这些技术在文献中被充分说明。参见，例如，Sambrook等MOLECULAR CLONING：A LABORATOR Y MANUAL，第二版，Cold Spring Harbor Laboratory Press，1989和第三版，2001；Ausubel等CURRENT PROTOCOLS IN MOLECULAR BIOLOGY，Jo hn Wiley & Sons，New York，1987和定期更新；METHODS IN ENZYMOL OGY系列，Academic Press，San Diego；Wolffe，CHROMATIN STRUCTURE AND FUNCTION，第三版，Academic Press，San Diego，1998；METHODS IN ENZYMOLOGY，Vol.304，“Chromatin”(PM.Wassarman和A.P.Wolffe，编辑)，Academic Press，San Diego，1999；和METHODS IN MOLECULAR BIOLOGY，Vol.119，“Chromatin Protocols”(P.B.Becker编辑)Humana Press，Totowa，1999。 [0050] 定义 [0051] 术语“核酸”，“多核苷酸”和“寡核苷酸”可互换使用，指线性或环状构象，单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合体。为了本公开内容的目的，这些术语不被理解为是对聚合体长度的限制。该术语可包含天然核苷酸的已知类似物，以及在碱基、糖和/或磷酸酯部分(例如，硫代磷酯主链)被修饰的核苷酸。通常，特定核苷酸的类似物具有相同的碱基配对特异性；也即A的类似物将与T进行碱基配对。 [0052] 术语“多肽”、“肽”和“蛋白”可互换使用，指氨基酸残基的聚合物。该术语还应用于其中一个或多个氨基酸是对应的天然存在的氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。 [0053] “结合”指大分子(例如，蛋白与核酸之间)之间的序列特异的、非共价的相互作用。不是结合相互作用的所有组分都需要是序列特异性的(例如，与DNA主链中的磷酸酯残基接触)，只要该相互作用总体上是序列特异性的即可。这种相互作用通常特征在于解-6 -1离常数(Kd)为10 M 或更低。“亲合性”指结合的强度：增加的结合亲合性与较低的Kd相关。 [0054] “结合蛋白”是能与另一个分子非共价结合的蛋白。结合蛋白可与例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白结合蛋白)结合。在蛋白结合蛋白的情况中，它可与其自身结合(形成同源二聚体，同源三聚体，等等)和/或它可与一个不同蛋白或多个蛋白的一个或多个分子结合。结合蛋白可具有不止一种的结合活性。例如，锌指蛋白具有DNA结合、RNA结合和蛋白结合活性。 [0055] “锌指DNA结合蛋白”(或结合结构域)是一种蛋白或较大蛋白内的结构域，其通过一个或多个锌指结构以序列特异性的方式结合DNA，锌指结构是结合结构域内的氨基酸序列区域，其结构通过锌离子的配合稳定。术语“锌指DNA结合蛋白”通常缩写为锌指蛋白或ZFP。 [0056] 锌指结合结构域可以被“工程改造”以结合预定的核苷酸序列，例如通过天然存在锌指蛋白的识别螺旋区域的改造(改变一个或多个氨基酸)。因此，改造的锌指蛋白是非天然存在的蛋白。用于改造锌指蛋白的方法的非限制性实例是设计与选择。设计的锌指蛋白是非天然存在的蛋白，其设计/组成主要源自合理标准。用于设计的合理标准包括取代规则和用于处理储存现有ZFP设计和结合数据的数据库信息中的信息的计算机算法的应用。参见，例如，美国专利6,140,081；6,453,242和6,534,261；还参见WO 98/53058；WO98/53059；WO 98/53060；WO 02/016536和WO 03/016496。 [0057] “选择的”锌指蛋白是自然界中找不到的蛋白，其产生主要是来自实验处理如噬菌体展示、相互作用捕获或杂交体选择。参见，例如，US 5,789,538；US 5,925,523；US6,007,988；US 6,013,453；US 6,200,759；WO 95/19431；WO 96/06166；WO 98/53057；WO 98/54311；WO 00/27878；WO 01/60970；WO 01/88197和WO 02/099084。 [0058] 术语“序列”指任意长度的核苷酸序列，其可以DNA或RNA；可以是线性、环形或分支的，而且可以是单链或双链的。术语“供体序列”指插入到基因组中的核苷酸序列。供体序列可以是任意长度的，例如长度为2到10,000(或者之间的任意整数值或以上)个核苷酸之间，优选长度为大约100到1,000(或之间的任意整数)个核苷酸，更优选长度为大约200到500个核苷酸。可选择地，供体序列可以是人工染色体序列如细菌人工染色体(BAC)或酵母人工染色体(YAC)。 [0059] “同源但不相同的序列”指与第二序列享有一定程度的序列同一性的第一序列，但是其序列与第二序列的序列不相同。例如，含有突变基因的野生型序列的多核苷酸，与突变基因的序列是同源但不相同。在特定的实施方案中，两个序列之间的同源性程度足以允许利用正常的细胞机理进行它们之间的同源重组。两个同源但不相同的序列可以是任意长度的，而且它们的非同源性程度可以少到1个核苷酸(例如，用于通过靶向同源重组修正基因组的点突变)或大到10个或更多kb(例如，用于插入1个基因到染色体的预定异位位点)。含有同源不相同序列的两个多核苷酸的长度不必相同。例如，可以使用20到10,000个核苷酸的外源多核苷酸(也即，供体多核苷酸)，人工染色体或核苷酸对。 [0060] 用于确定核酸和氨基酸序列同一性的技术是本领域已知的。一般地，这种技术包括确定基因的mRNA的核苷酸序列和/或确定其编码的氨基酸序列，并与另一个核苷酸或氨基酸序列进行对比。也可以用这种方式测定和对比基因组序列。通常，同一性分别指两个多核苷酸或多肽序列的精确核苷酸与核苷酸或氨基酸与氨基酸的一致性。可通过测定它们的同一性百分比来对两个或多个序列(多核苷酸或氨基酸)进行对比。两个序列的同一性百分比，无论是核酸或氨基酸序列，是两个比对的序列之间的精确匹配的数目除以较短序列的长度并乘以100的数目。对于这里描述的序列，需要的序列同一性的程度范围为大约80％到100％以及二者之间的任意整数值。一般，序列之间的同一性百分比为至少70-75％，优选80-82％，更优选85-90％，更加优选92％，仍然更优选95％，最优选98％的序列同一性。 [0061] 可选地，可以通过在允许同源区域之间形成稳定的双螺旋的条件下进行多核苷酸的杂交，接着用单链特异性核酸酶消化，并测定消化片段的大小来测定多核苷酸之间的序列相似性程度。当两个序列在分子的测定的长度显示至少大约70％-75％，优选80％-82％，更优选85％-90％，更加优选92％，仍然更优选95％，和最优选98％序列同一性时，两个核酸，或两个多肽序列彼此是基本上同源的。如这里使用的，基本上同源还指与指定的DNA或多肽序列显示完全相同的序列。可以在例如，如特定系统中限定的严谨条件下在Southern杂交实验中测定基本上同源的DNA序列。测定合适的杂交条件在本领域技术范围内。参见，例如，Sambrook等，上文；Nucleic Acid Hybridization：A Practical Approach，editors B.D.Hames and S.J.Higgins，(1985)Oxford；Washington，DC；IRL Press)。 [0062] 可以如下测定两个核酸片段的选择性杂交。两个核酸分子之间的序列同一性程度影响这两个分子之间杂交事件的效率和强度。部分相同的核酸序列将至少部分抑制与靶分子完全相同的序列的杂交。可使用本领域公知的杂交分析(例如，Southern(DNA)印迹，Northern(RNA)印迹，溶液杂交，等等，参见Sambrook等，Molecular Cloning：A Laboratory Manual，第二版，(1989)Cold Spring Harbor，N.Y.)测定完全相同序列的杂交抑制。可使用不同程度的选择性，例如，使用从低到高严谨的不同条件，进行这种分析。如果应用低严谨条件，可使用缺乏甚至部分程度序列同一性的第二探针(例如，与靶分子具有小于大约30％序列同一性的探针)评价不存在非特异性结合，以便在不存在非特异性结合事件时，第二探针不会与靶杂交。 [0063] 杂交条件是本领域技术人员公知的(参见，例如，Nucleic Acid Hybridization：A Practical Approach，editors B.D.Hames and S.J.Higgins，(1985)Oxford；Washington，DC；IRL Press)。杂交严谨性指不利于包含不匹配核苷酸的杂交体形成的杂交条件的程度，同时较高严谨性与不匹配杂交体的较低耐受性相关。F影响杂交严谨性的因子是本领域技术人员公知的，其包括但不限于温度、pH、离子强度和有机溶剂如例如甲酰胺和二甲亚砜的浓度。如本领域技术人员已知的，杂交严谨性随较高的温度、较低的离子强度和较低的溶剂浓度而增加。 [0064] 关于杂交的严谨性条件，本领域公知的许多等价条件可以用于通过改变例如下列因子来建立特定严谨性：序列的长度和特性，不同序列的碱基组成、盐和其他杂交液组分的浓度，杂交液中存在或不存在封闭剂(例如，硫酸葡聚糖和聚乙二醇)，杂交反应温度和时间参数，以及改变洗涤条件。根据本领域的标准方法选择一组特定的杂交条件(参见，例如，Sambrook，等，Molecular Cloning：A Laboratory Manual，Second Edition，(1989)Cold Spring Harbor，N.Y.)。 [0065] “重组”指两个多核苷酸之间互换遗传信息的过程。为了本公开内容的目的，“同源重组(HR)”指特定形式的这种交换，其在例如细胞中双链断裂的修复期间发生。该过程需要核苷酸序列同源性，使用“供体”分子进行模板修复“靶”分子(也即，其经历双链断裂)，而且由于它导致遗传信息从供体到靶的递送而不同地称为“非交换型型基因转化”或“短序列基因转化换”。不希望受任何特定理论的束缚，这种转移可涉及在断裂靶与供体之间形成的异源双链DNA的错配修正，和/或“合成依赖的链退火”，其中供体用于再合成将成为部分靶的遗传信息和/或相关过程。这种特殊化的HR通常导致靶分子序列的改变以致供体多核苷酸的部分或全部序列被整合到靶多核苷酸中。 [0066] “切割”指DNA分子的共价主链的断裂。切割可以通过多种方法来启动，包括但不限于磷酸二酯键的酶水解或化学水解。单链切割指切割双链DNA/RNA的一条链，双链切割指切割两条链(例如，通过两个不同的单链切割事件)。在特定的实施方案中，融合多肽用于靶向的单链DNA切割。 [0067] “切割半结构域”指与第二多肽(相同的或不同的)结合而形成具有切割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”，“+和-切割半结构域”和“右和左切割半结构域”可交换使用，指二聚化的切割半结构域对。 [0068] “改造的切割半结构域”是已经被修饰以便与另一个切割半结构域(例如，另一个改造的切割半结构域)形成专性异二聚体的切割半结构域。也参见美国专利公开号2005/0064474；2007/0218528；2008/0131962和美国专利公开号12/217,185，其通过引用全文并入本文。 [0069] “染色质”指包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白(包括组蛋白和非组蛋白染色体蛋白)。大多数真核细胞染色质以核小体形式存在，其中核小体的核心包含大约150个碱基对的DNA，该DNA与包含双份各为组蛋白H2A、H2B、H3和H4的八聚体相关；且连接DNA在核小体核心之间延伸(取决于生物体的可变的长度)。组蛋白H1分子通常与连接DNA连接。为了本公开内容的目的，术语“染色质”意图涵盖细胞核蛋白的所有类型，原核生物的与真核生物的。细胞染色质包括染色体的和游离基因染色质。 [0070] “染色体”指包含全部或部分细胞基因组的染色质复合体。通常，细胞基因组的特征在于其核型，其是包含细胞基因组的所有染色体的集合。细胞基因组可包含一个或多个染色体。 [0071] “附加体”指含有不是细胞染色体核型一部分的核酸的复制的核酸、核蛋白复合体或其它结构。附加体的实例包括质粒和特定的病毒基因组。 [0072] “靶位点”或“靶序列”是以结合发生的充足条件为条件，定义结合分子将结合的核算部分的核酸序列。例如，序列5’-GAATTC-3’是Eco RI限制性内切核酸酶的靶位点。 [0073] “外源的”分子指正常情况下不存在于细胞中，但可以通过一种或多种遗传、生物化学或其它方法而导入细胞中的分子。“正常存在于细胞中”是相对于细胞的特定发育阶段和环境条件而确定的。因此，例如，仅存在于肌肉的胚胎发育过程中的分子是相对于成年肌肉细胞的外源分子。类似地，由热休克所诱导的分子是相对于未热休克细胞的外源分子。外源分子可以包含例如未发挥作用的内源分子的发挥作用的形式或正常发挥作用的内源分子的未发挥作用的形式。 [0074] 外源分子可以是小分子，诸如通过组合的化学方法所生成的，大分子如蛋白质、核酸、糖类、脂质、糖蛋白、脂蛋白、多糖，上述分子的任意修饰衍生物或任意包含一种或多种上述分子的复合体等等。核酸包括DNA和RNA，可以是单链或双链；可以是线性的、分枝的或环状的；而且可以是任意长度的。核酸包括那些能够形成双螺旋的核酸，以及形成三链体的核酸。参见，例如，美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重建因子、甲基化的DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰基转移酶酶(acetylase)、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶、及解旋酶。 [0075] 外源分子可以是与内源分子相同类型的分子，例如外源蛋白质或核酸。例如，外源核酸可以包含感染性病毒基因组、导入细胞中的质粒或游离基因、或正常情况下不存在于细胞中的染色体。用于将外源分子导入细胞中的方法对于本领域技术人员是已知的，并且包括但不限于脂质介导的递送(即脂质体，其包括中性脂质和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可以是与内源分子相同类型的分子，但是来源于与细胞来源不同的物种。例如，可以把人核酸序列引入到最初来源于小鼠或仓鼠的细胞系。 [0076] 比较而言，“内源”分子指正常存在于特定环境条件下处于特定发育阶段的特定细胞中的分子。例如，内源核酸可以包含染色体、线粒体、叶绿体或其它细胞器的基因组，或天然存在的游离基因核酸。另外的内源分子可以包括蛋白质，例如转录因子和酶。 [0077] “融合”分子指其中有两个或更多个亚基分子连接在一起的分子，优选共价连接。亚基分子可以是相同化学类型的分子，或者可以是不同化学类型的分子。第一种类型的融合分子的实例包括但不限于融合蛋白(例如ZFP DNA结合结构域与一个或多个切割结构域之间的融合物)和融合核酸(例如编码上文所述融合蛋白的核酸)。第二种类型的融合分子的实例包括但不限于形成三链体的核酸与多肽之间的融合物，及小沟结合物与核酸之间的融合物。 [0078] 融合蛋白在细胞中的表达可以源自将该融合蛋白递送至细胞或者通过将编码该融合蛋白的多核苷酸递送至细胞，其中所述多核苷酸被转录，而且转录物被翻译以生成所述融合蛋白。蛋白质在细胞中的表达还可以涉及反式剪接、多肽切割和多肽连接。在本公开内容的其他地方提供了用于多核苷酸和多肽递送到细胞的方法。 [0079] 为了本公开内容的目的，“基因”包括编码基因产物的DNA区域(见下文)，以及调节基因产物生成的所有DNA区域，无论此类调节序列是否邻近编码序列和/或被转录序列。因此，基因包括但不必限于启动子序列、终止子、翻译调节序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子(insulator)、边界元件、复制起点、基质附着位点和基因座调控区。 [0080] “基因表达”指基因中所含信息转化成基因产物。基因产物可以是基因的直接转录产物(例如mRNA、tRNA、rRNA、反义RNA、核酸酶、结构性RNA或任意其它类型的RNA)或通过mRNA翻译所生成的蛋白质。基因产物还包括通过加帽、多聚腺苷化、甲基化和编辑等过程所修饰的RNA，及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化所修饰的蛋白质。 [0081] 基因表达的“调控”指基因活性的变化。表达调控可以包括但不限于基因激活和基因抑制。基因失活指相较于不包括这里描述的ZFP的细胞而言，基因表达的任意减少。因此，基因失活可以是完全的(敲除)或部分的(例如，亚等位基因，其中基因显示低于正常表达水平或显示它影响的活性部分降低的突变基因的产物)。 [0082] “真核”细胞包括但不限于真菌细胞(如酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如，T细胞)。 [0083] “细胞系”指从原代培养物的组织培养中建立的细胞群体。因此，使用来源于细胞(或细胞系)的锌指核酸酶产生的细胞系，其中一个或多个靶基因已经被一个或多个锌指核酸酶部分或完全失活，而且其中该细胞(或细胞系)的后代在培养中经过多次传代以后保留部分或完全的失活表型。而且，当基因表达降低(knock-downs)或消除(敲除)时，细胞或细胞系在一个或多个指示基因的表达中是“缺陷”的。 [0084] “转基因”指包括核酸序列的任意动物或植物，该核酸序列被引入到细胞中并成为该动物或植物的基因组的一部分。该术语指遗传改造的动物或植物以及遗传改造的动物的后代。非人转基因动物包括脊椎动物如啮齿类动物，非人灵长类动物、绵羊、狗、牛、两栖动物、鸟、鱼、昆虫、爬行动物等等。该术语还包括在该动物或植物的某些而不是全部细胞中，其中发现引入的核酸序列的动物和植物，或者其中表达核酸序列基因的动物或植物，[0085] “目的区域”是细胞染色质的任意区域，诸如例如基因或者基因内或与临近基因的非编码序列，其中需要该区域结合外源分子。结合可以是为了靶向DNA切割和/或靶向重组的目的。目的区域可存在于例如染色体、游离基因、细胞器基因组(例如，线粒体、叶绿体)或感染的病毒基因组中。目的区域可位于基因的编码区内，转录的非编码区如例如前导序列、尾随序列或内含子内，或者位于编码区上游或下游的非转录区内。目的区域的长度可以短至单个核苷酸对或长达2,000个核苷酸对，或任何整数值的核苷酸对。 [0086] 术语“操作性连接”和“操作性连接的”(或“可操作连接的”)可互换使用，指并列的两个或多个组件(如序列元件)，其中各组件的安排能使其发挥正常功能，并能使至少一个组件介导对至少一个其它组件施加作用。例如，如果转录调节序列在对一种或多种转录调节因子的存在或缺失的反应中能调控编码序列的转录水平，那么该转录调节序列如启动子操作性连接于该编码序列。转录调节序列通常与编码序列顺式操作性连接，但不一定直接与其相邻。例如，增强子是操作性连接于编码序列的一种转录调节序列，虽然它们是不相邻的。 [0087] 就融合多肽而言，术语“操作性连接”可以指各组件与其它组件连接时可执行与不这样连接时同样的功能。例如，提到ZFP DNA结合域融合于切割结构域的融合多肽时，如果在此融合多肽中ZFP DNA结合域部分能够结合其靶位点和/或其结合位点，而切割结构域能够切割靶位点附近的DNA，那么该ZFPDNA结合结构域和切割结构域操作性相连。 [0088] 蛋白、多肽或核酸的“功能片段”是序列与全长蛋白、多肽或核酸不同但保留全长的蛋白、多肽或核酸相同功能的蛋白、多肽或核酸。功能片段的残基数量可以比对应的天然分子多、少或相同，和/或功能片段可含有一个或多个氨基酸或核苷酸取代。测定核酸功能(例如编码功能、与另一核酸杂交的能力)的方法是本领域熟知的。类似地，测定蛋白质功能的方法是熟知的。例如，可通过例如滤膜结合、电泳迁移率变换或免疫沉淀试验测定多肽的DNA结合功能。可通过凝胶电泳分析DNA切割。参见Ausubel等，如上。可通过例如免疫共沉淀、双杂交测定或互补(遗传和生化的)试验测定蛋白与另一种蛋白相互作用的能力。参见，例如，Fields等(1989)Nature 340：245-246；美国专利号5,585,245和PCT WO98/44350。 [0089] 这里使用的术语“抗体”包括获自多克隆和单克隆制品的抗体，以及下列抗体：杂交的(嵌合的)抗体分子(参见，例如，Winter等，Nature(1991)349：293-299；和美国专利No.4816567)；F(ab′)2和F(ab)片段；Fv分子(非共价异二聚体，参见，例如，Inbar 等，Proc Natl Acad Sci USA(1972)69：2659-2662；和 Ehrlich 等，Biochem(1980)19：4091-4096)；单链Fv分子(sFv)(参见，例如，Huston等，Proc Natl Acad Sci USA(1988)85：5879-5883)；二聚和三聚的抗体片段构建体；小抗体(参见，例如，Pack等，Biochem(1992)31：1579-1584；Cumber等，J Immunology(1992)149B：120-126)；人源化抗体分子(参见，例如，Riechmann等，Nature(1988)332：323-327；Verhoeyan等，Science(1988)239：1534-1536；和英国专利公开GB 2,276,169，其公开于1994年9月21日)；和获自这些分子的任意功能性片段，其中这些片段保留亲本抗体分子的免疫学结合特性。 [0090] 如这里使用的，术语“单克隆抗体”指具有同源性的抗体群体的抗体组合物。该术语不受抗体的种类或来源的限制，也不意图受它所产生的方式限制。该术语包含完整的免疫球蛋白以及片段如Fab，F(ab′)2，Fv及其他片段，以及显示亲本单克隆抗体分子的免疫学结合特性的嵌合和人源化同源性抗体群体。 [0091] 核酸酶 [0092] 这里描述的是人工核酸酶，其可用于在双链DNA中产生单链断裂(SSB，也称为“缺口”)。这里还描述了通过引入SSB到基因组中促进同源重组(例如，靶向整合)的方法。 [0093] A.切割结构域 [0094] 这里描述的核酸酶包括核酸酶(切割结构域，切割半结构域)。这里公开的融合蛋白的切割结构域部分可以获自任意的核酸内切酶或核酸外切酶。可以衍生自切割结构域的示例性核酸内切酶包括但不限于限制性内切核酸酶和归巢核酸内切酶。参见，例如，2002-2003产品目录，New England Biolabs，Beverly，MA；和Belfort等(1997)Nucleic Acids Res.25：3379-3388。切割DNA的其它酶是已知的(例如，S1核酸酶；绿豆核酸酶；胰腺DNA酶1；微球菌核酸酶；酵母HO核酸内切酶；还可参见Linn等(编)Nucleases，Cold Spring Harbor Laboratory Press，1993)。这些酶(或其功能性片段)中的一种或多种可以用作切割结构域和切割半结构域的来源。例如，兆碱基大范围核酸酶如SceI的切割结构域可以被部分失活以诱导SSB而不是DSB。 [0095] 类似地，切割半结构域可以衍生自任意核酸酶或其部分，如上文所提出的，为了切割活性其需要二聚化。一般而言，如果所述融合蛋白包含切割半结构域，那么切割作用需要两个融合蛋白。做为选择，可以使用包含两个切割半结构域的单个蛋白质。两个切割半结构域可以衍生自相同的核酸内切酶(或其功能性片段)，或者每个切割半结构域可以衍生自不同的核酸内切酶(或其功能性片段)。 [0096] 另外，两个融合蛋白的靶位点优选相对于彼此布置成使得两个融合蛋白与它们各自靶位点的结合以相对于彼此的下述空间取向放置切割半结构域，所述空间取向容许切割半结构域形成功能性切割结构域，例如通过二聚化。因此，在特定的实施方案中，靶位点的近边缘由5-8个核苷酸或由15-18个核苷酸分开。然而，任意整数数目的核苷酸或核苷酸对可以插入两个靶位点之间(例如从2个至50个核苷酸对或更多)。一般而言，切割位点位于靶位点之间 [0097] 限制性内切核酸酶(限制性酶)存在于许多物种中，而且能够序列特异性结合DNA(在识别位点)，并且在结合位点处或接近结合位点处切割DNA。特定的限制性内切酶(例如IIS型)在与识别位点远离的位点切割DNA，而且具有可分的结合和切割结构域。例如，IIS型酶Fok I催化DNA的双链切割，在一条链上距离其识别位点9个核苷酸处而在另一条上距离其识别位点13个核苷酸处进行。参见，例如，美国专利5,356,802；5,436,150和5,487,994；以及Li等(1992)Proc.Natl.Acad.Sci.USA 89：4275-4279；Li等(1993)Proc.Natl.Acad.Sci.USA 90：2764-2768；Kim等(1994a)Proc.Nat′l.Acad.Sci.USA 91：883-887；Kim等(1994b)J.Biol.Chem.269：31，978-31，982。因此，在一个实施方案中，融合蛋白包含来自至少一种IIS型限制性内切酶的切割结构域(或切割半结构域)和一个或多个锌指结合结构域，其可以或不可以被改造。 [0098] 切割结构域与结合结构域是可分的示例性IIS型限制性内切酶是FokI。这种特定的酶作为二聚体时是有活性的。Bitinaite等(1998)Proc.Natl.Acad.Sci.USA 95：10，570-10，575。因此，为了本公开内容的目的，所公开融合蛋白中所使用的Fok I酶部分被认为是切割半结构域。因此，对于使用锌指-Fok I融合物来对细胞序列进行的靶向双链切割和/或靶向取代，可以使用两个融合蛋白，每个包含Fok I切割半结构域，来重建具有催化激活的切割结构域。可选择地，也可以使用包含一个锌指结合结构域和两个Fok I切割半结构域的单个多肽分子。在本公开内容中其他地方提供了使用锌指-Fok I融合物来进行靶向切割和靶向序列改变的参数。 [0099] 切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如二聚化)以形成功能性切割结构域的能力的蛋白的任意部分。 [0100] 示例性的IIS型限制性内切酶描述于国际公开WO 07/014275中，其通过引用全文并入本文。其它的限制性内切酶也含有可分的结合和切割结构域，并且这些为本公开所涵盖。参见，例如，Roberts等(2003)Nucleic Acids Res.31：418-420。 [0101] 在特定的实施方案中，切割结构域包括一个或多个改造切割半结构域(也称为二聚化结构域突变体)，其最小化或防止均二聚化，如例如美国专利公开20050064474；20060188987和20080131962所述，其通过引用全文并入本文。Fok I的第446，447，479， 483，484，486，487，490，491，496，498，499，500，531，534，537和538位氨基酸残基是影响Fok I切割半结构域的二聚化的所有靶。 [0102] 形成专性异二聚体的Fok I的示例性改造切割半结构域包括一对切割半结构域，其中第一切割半结构域包括位于Fok I的第490和538位的氨基酸残基处突变，第二切割半结构域包括第486和499位氨基酸残基处的突变。 [0103] 例如，在特定的实施方案中，核酸酶组合用于其中切割结构域具有490位的突变，其用Lys(K)取代Glu(E)；538位的突变，其用Lys(K)取代Iso(I)；486位的突变，其用Glu(E)取代Gln(Q)；和499位的突变，其用Lys(K)取代Iso(I)。特别地，这里描述的改造切割半结构域，通过在一个切割半结构域中突变第490位(E→K)和538位(I→K)，以产生改造的切割半结构域来制备，其命名为“E490K:I538K”或“KK”，或通过突变另一个切割半结构域中的第486位(Q→E)和499位(I→L)，以产生改造的切割半结构域来制备，其命名为“Q486E:I499L”或“EL.”。 [0104] 形成专性异二聚体改造切割半结构域对(其中异常切割最小化或消除)的另一个实例是这样的切割半结构域对，其中一个切割半结构域在第487位突变(R→D，也称为“RD”)，另一个切割半结构域在483位突变(D→R，也称为“DR”)。 [0105] 这里描述的改造切割半结构域可以使用任意合适的方法制备，例如，通过野生型切割半结构域(Fok I)的定点诱变，如美国专利公开20050064474(参见，例如，实施例5)和WO 07/139898中所述。 [0106] 本发明的切割半结构域也可以包括核酸酶的催化结构域的再一个突变，其使切割半结构域失活。FokI的催化结构域中可以突变的氨基酸的非限制性实例包括450，467和/或469位氨基酸残基(如相对于野生型确定的)。在特定的实施方案中，在专性异二聚体的一个成员的催化结构域中进行一个或多个点突变，以便失活切割半结构域的催化活性。例如，450位可以从D突变成N，467位可以从D突变成A；以及469位可以从K突变成A。这些或其他位置的其他氨基酸可以被取代。 [0107] B.DNA结合结构域 [0108] 这里描述的核酸酶还包含至少一个DNA结合结构域。任意DNA结合结构域都可用于本文公开的组合物和方法中。在特定的实施方案中，DNA结合结构域包括锌指蛋白。锌指蛋白优选是非天然存在的，由于它被改造以结合选择的靶位点。参见，例如，Beerli等(2002)Nature Biotechnol.20：135-141；Pabo等(2001)Ann.Rev.Biochem.70：313-340；Isalan等(2001)Nature Biotechnol.19：656-660；Segal等(2001)Curr.Opin.Biotechnol.12：632-637；Choo等(2000)Curr.Opin.Struct.Biol.10：411-416。相较于天然存在的锌指蛋白，改造的锌指结合结构域可具有新的结合特异性。改造的方法包括但不限于合理设计和各种型式的选择。合理设计包括，例如，使用包括三联体(或四联体)核苷酸序列和单个锌指氨基酸序列的数据库，其中每个三联体或四联体核苷酸序列与结合特定的三联体或四联体序列的锌指的一个或多个氨基酸序列相关。参见，例如，共同拥有的美国专利6,453,242和6,534,261，其通过引用全文并入本文。 [0109] 示例性的选择方法，包括噬菌体展示和双杂交系统，公开于美国专利5,789,538；5,925,523；6,007,988；6,013,453；6,410,248；6,140,466；6,200,759和6,242,568；以及WO 98/37186；WO 98/53057；WO 00/27878；WO 01/88197和GB 2,338,237。另外，例如，共同拥有的WO 02/077227中描述了锌指结合结构域的结合特异性的增强。 [0110] 靶位点的选择；ZFP和用于融合蛋白(和编码其的多核苷酸)的设计和构建的方法是本领域技术人员已知的，而且美国专利申请公开20050064474和20060188987中进行了详细描述，其通过引用全文并入本文。 [0111] 另外，如这些和其他参考文献中公开的，锌指结构域和/或多指锌指蛋白可以用合适的接头序列连接到一起，接头序列包括例如，长度为5个或更多个氨基酸。也参见美国专利号6,479,626；6,903,185和7,153,949，用于长度为6个或更多个氨基酸的示例性接头序列。这里描述的蛋白可包括蛋白的各个锌指之间合适的接头的任意组合。 [0112] 做为选择，DNA结合结构域可以来源于核酸酶。例如，归巢核酸内切酶和大范围核酸酶如I-SceI，I-CeuI，PI-PspI，PI-Sce，I-SceIV，I-CsmI，I-PanI，I-SceII，I-PpoI，I-SceIII，I-CreI，I-TevI，I-TevII和I-TevIII的识别序列是已知的。也参见美国专利5,420,032；美国专利6,833,252；Belfort等(1997)Nucleic Acids Res.25：3379-3388； Dujon等(1989)Gene 82：115-118；Perler等(1994)Nucleic Acids Res.22，1125-1127； Jasin(1996)Trends Genet.12：224-228；Gimble 等 (1996)J.Mol.Biol.263：163-180； Argast等(1998)J.Mol.Biol.280：345-353和新英格兰生物实验室目录。另外，归巢核酸内切酶和大范围核酸酶的DNA结合特异性可以被改造以结合非天然的靶位点。参见，例如，Chevalier等(2002)Molec.Cell 10：895-905；Epinat等(2003)Nucleic Acids Res.31： 2952-2962；Ashworth 等 (2006)Nature 441：656-659；Paques 等 (2007)Current Gene Therapy 7：49-66；美国专利公开20070117128。 [0113] 在特定的实施方案中，这里描述的核酸酶包括一个DNA结合域和一个切割结构域，例如锌指蛋白和FokI切割半结构域。在其他的实施方案中，核酸酶包括一个DNA结合域和两个或多个切割结构域，例如包含一个催化激活的FokI切割半结构域和一个催化失活的FokI切割半结构域的锌指蛋白。当DNA结合结构域与它的靶位点结合并在靶位点附近产生单链切割时，切割半结构域能二聚化。 [0114] 递送 [0115] 这里描述的核酸酶(例如，ZFN)可通过任意合适的方法递送给靶细胞。适合的细胞包括但不限于真核(动物和/或植物)和原核细胞和/或细胞系。这种细胞或从这种细胞产生的细胞系的非限制性实例包括COS、CHO(例如，CHO-S，CHO-K1，CHO-DG44，CHO-DUXB11，CHO-DUKX，CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如，HEK293-F，HEK293-H，HEK293-T)，和perC6细胞以及昆虫细胞如地贪夜蛾(Spodoptera fugiperda，Sf)，或真菌细胞如酵母属细胞，毕赤氏酵母属细胞核裂殖酵母属细胞。在特定的实施方案中，细胞系是CHO-K1，MDCK或HEK293细胞系。另外，可以使用对双链断裂敏感的初级细胞。这些可包括，但不限于，CD34+人干细胞，胚胎干细胞，小鼠胚胎干细胞和诱导的多能细胞。已知可用于产生转基因生物的细胞，如小鼠胚胎干细胞和卵母细胞也可以使用。 [0116] 例如美国专利 6,453,242；6,503,717；6,534,261；6,599,692；6,607,882；6,689,558；6,824,978；6,933,113；6,979,539；7,013,219和7,163,824中描述了递送包含如这里所述的锌指蛋白的核酸酶的方法，其通过引用全文并入本文。 [0117] 可以使用含有编码一个或多个核酸酶(例如，ZFN)的序列的载体递送如这里所述的核酸酶。可以使用任意的载体体系，包括但不限于，质粒载体，逆转录病毒载体，慢病毒载体，腺病毒载体，痘病毒载体，疱疹病毒载体和腺病毒相关病毒载体，等等。也参见，美国专利6,534,261；6,607,882；6,824,978；6,933,113；6,979,539；7,013,219和7,163,824，其通过引用全文并入本文，还详细描述了组成型或诱导型启动子，其可与编码核酸酶的序列操作性连接以驱动这些核酸酶的表达。而且，任意这些载体显而易见可以包含一个或多个编码核酸酶的序列。因此，当引入一对或多对ZFN到细胞中时，可以在相同的载体或不同的载体中携带ZFN。当使用多个载体时，每个载体可包含编码一个或多个ZFN的序列。 [0118] 可以采用基于病毒和非病毒的常规基因转移方法将编码改造的ZFP引入细胞(例如，哺乳动物细胞)和靶组织中。也可以采用这种方法将编码ZFP的核酸体外施用给细胞。在特定的实施方案中，施用编码ZFP的核酸用于体内或体外基因治疗应用。非病毒载体递送系统包括DNA质粒，裸核酸，和与递送载体如脂质体或泊洛沙姆复合的核酸。病毒载体递送系统包括DNA和RNA病毒，递送给细胞后它们具有游离基因或整合的基因组。基因治疗方法的综述，参见Anderson，Science 256：808-813(1992)；Nabel & Feigner，TIBTECH 11：211-217(1993)；Mitani & Caskey，TIBTECH 11：162-166(1993)；Dillon，TIBTECH 11： 167-175(1993)；Miller，Nature 357：455-460(1992)；Van Brunt，Biotechnology 6(10)： 1149-1154(1988)；Vigne，Restorative Neurology and Neuroscience 8：35-36(1995)； Kremer & Perricaudet，British Medical Bulletin 51(1)：31-44(1995)；Haddada 等，Current Topics in Microbiology and Immunology Doerfler and (编辑)(1995)和Yu等Gene Therapy 1：13-26(1994)。 [0119] 核酸的非病毒递送方法包括电穿孔、脂转染、显微注射、生物射弹、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质：核酸偶联物、裸DNA、人工病毒颗粒和试剂强化的DNA吸收。也可采用例如Sonitron 2000系统(Rich-Mar)进行声穿孔，以递送核酸。 [0120] 其他的示例性核酸递送系统包括Amaxa Biosystems(Cologne，Germany)，Maxcyte，Inc.(Rockville，Maryland)，BTX Molecular Delivery Systems(Holliston，MA)和Copernicus Therapeutics Inc提供的系统，(参见例如US6008336)。脂转染描述于例如US 5,049,386，US 4,946,787；和US 4,897,355)，脂转染试剂是市售的(例如，TM TMTransfectam 和Lipofectin )。适用于多核苷酸的有效受体识别脂转染的阳离子和中性脂质包括Felgner，WO 91/17424，WO 91/16024。可以递送给细胞(体外施用)或靶组织(体内施用)。 [0121] 脂质：核酸复合物，包括靶向脂质体如免疫脂质复合物的制备是本领域技术人员熟知的(参见，例如，Crystal，Science 270：404-410(1995)；Blaese等，Cancer Gene Ther.2：291-297(1995)；Behr等，Bioconjugate Chem.5：382-389(1994)；Remy等，Bioconjugate Chem.5：647-654(1994)；Gao 等，Gene Therapy 2：710-722(1995)；Ahmad等，Cancer Res.52：4817-4820(1992)；美国专利号4,186,183，4,217,344，4,235,871，4,261,975，4,485,054，4,501,728，4,774,085，4,837,028和4,946,787)。 [0122] 用于递送编码工程改造的ZFP的核酸的基于RNA或DNA病毒的系统，利用了能将病毒靶向体内特定细胞和能将病毒负载运输至细胞核的高度进化过程。病毒载体可直接施用于患者(体内)，或用它们体外处理细胞，然后将修饰的细胞施用于患者(经体内)。递送ZFP的基于病毒的常规系统包括但不限于：用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒、牛痘和单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合入宿主基因组，常常导致插入的转基因长期表达。此外，在许多不同细胞类型和靶组织中观察到高转导效率。 [0123] 可通过掺入外来的包膜蛋白、扩展靶细胞的潜在靶群体改变逆转录病毒的趋向性(tropism)。慢病毒载体是能够转导或感染非分裂细胞的逆转录病毒载体，一般产生高病毒效价。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体由顺式作用长末端重复序列组成，包装容量高达6-10kb的外来序列。最小的顺式作用LTR足以复制和包装载体，然后用载体将治疗基因整合入靶细胞，以提供永久的转基因表达。广泛采用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人体免疫缺陷病毒(HIV)及其组合的载体(参见，例如Buchscher等，J.Virol.66：2731-2739(1992)；Johann等，J.Virol.66：1635-1640(1992)；Sommerfelt等，Virol.176： 58-59(1990)；Wilson 等，J.Virol.63：2374-2378(1989)；Miller 等，J.Virol.65： 2220-2224(1991)；PCT/US94/05700)。 [0124] 在优选瞬时表达的应用中，可采用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中高效转导，并且不需要细胞分裂。用这种载体获得了高效价和高水平表达。可在相对简单的系统中大量产生这种载体。腺相关病毒(“AAV”)载体也用于以靶核酸转导细胞，如在体外产生核酸和肽，以及用于体内和离体的基因治疗方法(参见例如West等，Virology 160：38-47(1987)；美国专利4,797,368；WO 93/24641；Kotin，Human Gene Therapy 5：793-801(1994)；Muzyczka，J.Clin.Invest.94：1351(1994)。许多文献，包括美国专利5,173,414；Tratschin等，Mol.Cell.Biol.5：3251-3260(1985)；Tratschin等，Mol.Cell.Biol.4：2072-2081(1984)；Hermonat和Muzyczka，PNAS 81：6466-6470(1984)；和Samulski等，J.Virol.63：03822-3828(1989)中描述了重组AAV载体的构建。 [0125] 在临床试验中，目前至少有六种病毒载体方法可用于基因转移，其利用的方法包括用插入辅助细胞系的基因补充载体缺陷，以产生转导物质。 [0126] pLASN和MFG-S是用于临床试验的逆转录病毒载体的实例(Dunbar等，Blood85：3048-305(1995)；Kohn 等，Nat.Med.1：1017-102(1995)；Malech 等，PNAS 94：22 12133-12138(1997))。PA317/pLASN是用于基因治疗实验的第一个治疗性载体。(Blaese等，Science 270：475-480(1995))。对于MFG-S包装载体已经观察到转导效率为50％或更高。(Ellem等，Immunol Immunother.44(1)：10-20(1997)；Dranoff等，Hum.Gene Ther.1： 111-2(1997)。 [0127] 重组腺相关病毒载体(rAAV)是有希望的另一种基因递送系统，它基于缺陷型和非病原细小病毒2型腺相关病毒。所有载体都衍生自仅保留侧接于转基因表达盒的AAV的145bp末端反向重复序列的质粒。由于整合入转导细胞的基因组中，有效的基因转移和稳定的转基因递送是这种载体系统的主要特征。(Wagner等，Lancet351：91171702-3(1998)，Kearns等，Gene Ther.9：748-55(1996))。 [0128] 复制缺陷型重组腺病毒载体(Ad)可高效的生产的，它们容易感染许多不同的细胞类型。工程改造大多数腺病毒载体，以使转基因替代其Ad E1a、E1b和/或E3基因；随后复制该缺陷型载体反过来在支持提供缺失的基因功能的人293细胞中被增殖。Ad载体可体内转导多种类型的组织，包括非分裂的分化细胞，如肝、肾和肌肉中的细胞。常规Ad载体具有大携带容量。临床试验所用Ad载体的一个实例包括肌肉内注射抗肿瘤免疫的多核苷酸治疗(Sterman等，Hum.Gene Ther.7：1083-9(1998))。腺病毒载体用于临床试验的基因转移的其它实例包括Rosenecker等，Infection 24：15-10(1996)；Sterman等，Hum.Gene Ther.9：71083-1089(1998)；Welsh等，Hum.Gene Ther.2：205-18(1995)；Alvarez等，Hum.Gene Ther.5：597-613(1997)；Topf 等，Gene Ther.5：507-513(1998)；Sterman 等，Hum.Gene Ther.7：1083-1089(1998)。 [0129] 用包装细胞形成能够感染宿主细胞的病毒颗粒。这种细胞包括293细胞、ψ2细胞或PA317细胞，293细胞能包装腺病毒，ψ2细胞或PA317细胞能包装逆转录病毒。通常用将核酸载体包装到病毒颗粒中的生产细胞系产生用于基因治疗的病毒载体。载体一般包含包装和随后整合入宿主(如果可行)所需的最少的病毒序列，其它病毒序列被编码待表达蛋白的表达盒替代。包装细胞系反过来提供丢失的病毒功能。例如，用于基因治疗的AAV载体一般仅具有包装和整合入宿主基因组所必需的AAV基因组的末端反向重复(ITR)序列。将病毒DNA包装到含有辅助质粒的细胞系中，该辅助质粒编码其它AAV基因，即rep和cap，但没有ITR序列。也用腺病毒作为辅助病毒感染该细胞系。辅助病毒促进AAV载体的复制和辅助质粒中AAV基因的表达。由于缺少ITR序列，不能包装大量的辅助质粒。可通过(例如)热处理降低腺病毒污染，腺病毒对热处理的敏感性高于AAV。 [0130] 在许多基因治疗应用中，需要以高度特异性将基因治疗载体递送至特定组织类型。因此，可修饰病毒载体，使其通过表达配体而对给定细胞具有特异性，该配体能与病毒外表面的病毒外壳蛋白形成融合蛋白。选择配体应对已知存在于目的细胞类型上的受体具有亲和力。例如Han等，Proc.Natl.Acad.Sci.USA 92：9747-9751(1995)报道，可修饰莫洛尼鼠白血病病毒使之表达与gp70融合的人异调蛋白，该重组病毒能感染表达人表皮生长因子受体的特定的人乳腺癌细胞。此原理可延伸至其它病毒-靶细胞对，其中靶细胞表达一种受体，而病毒表达包含该细胞表面受体的配体的融合蛋白。例如，可工程改造丝状噬菌体，使之表现对基本上任意所选细胞受体都具有特异性结合亲和力的抗体片段(如FAB或Fv)。虽然上述描述主要用于病毒载体，但同样的原理也可用于非病毒载体。可工程改造这些载体，使其含有有利于特定靶细胞摄取的特异性摄取序列。 [0131] 可通过给予患者个体，一般是通过全身给药(如静脉内、腹膜内、肌肉内、皮下或颅内输注)或局部应用体内递送基因治疗载体，如下所述。可选择地，可将载体离体递送至细胞中，例如，从患者个体体内取出细胞(如淋巴细胞、骨髓吸出物、活组织检查样品)或通用供体造血干细胞，然后，通常在选择掺入该载体的细胞后将该细胞再植入患者体内。 [0132] 本领域技术人员熟知用于诊断、研究或基因治疗的离体细胞转染方法(如将转染细胞再输注到宿主生物中)。在一个优选的实施方案中，细胞分离自受治疗的生物体，用ZFP核酸(基因或cDNA)转染，再输注回对象生物(如患者)内。本领域技术人员熟知适用于离体转染的各种细胞类型(参见，例如Freshney等，Culture of Animal Cells，A Manual of Basic Technique(动物细胞培养，基本技术手册)(第3版，1994)以及其中引用的参考文献中关于如何分离和培养患者细胞的论述)。 [0133] 在一个实施方案中，在细胞转染和基因治疗的离体方法中采用干细胞。采用干细胞的优点是它们可在体外分化为其它细胞类型，或者可将其引入哺乳动物(如细胞供体)中，随后迁移到骨髓中。用细胞因子如GM-CSF、IFN-γ和TNF-α使CD34+细胞体外分化为临床上重要的免疫细胞类型的方法是已知的(参见Inaba等，J.Exp.Med.176：1693-1702(1992))。 [0134] 用已知的方法分离用于转导和分化的干细胞。例如，用结合不需要的细胞，如CD4+和CD8+(T细胞)、CD45+(泛B细胞(panB cell))、GR-1(粒细胞)和Iad(分化的抗原递呈细胞)的抗体淘选骨髓细胞，从而分离骨髓细胞中的干细胞(参见Inaba等，J.Exp.Med.176：1693-1702(1992))。 [0135] 也可将含有治疗性ZFP核酸的载体(如逆转录病毒、腺病毒、脂质体等)直接给予生物进行体内细胞转导。可选择地，可施用裸DNA。通过通常用于使分子最终与血液或组织细胞接触的途径进行给药，这些途径包括但不限于：注射、输注、局部应用和电穿孔。已有适合施用这种核酸的方法，它们是本领域技术人员熟知的，虽然可采用一种以上途径施用具体组合物，但特定的途径常常可提供比其它途径更直接和更有效的反应。 [0136] 将DNA引入造血干细胞的方法公开于例如美国专利5,928,638。用于将转基因引入造血干细胞，如CD34+细胞的载体包括35型腺病毒。 [0137] 适用于将转基因引入免疫细胞(如T细胞)的载体包括非整合型的慢病毒载体。参见，例如Ory等(1996)Proc.Natl.Acad.Sci.USA 93：11382-11388；Dull等(1998)J.Virol.72：8463-8471；Zuffery 等 (1998)J.Virol.72：9873-9880；Follenzi 等 (2000)Nature Genetics 25：217-222。 [0138] 药用载体部分取决于施用的具体组合物，以及用于给予该组合物的具体方法。因此，可采用各种合适的药物组合物剂型，如下所述(参见，例如Remington’s Pharmaceutical Sciences(雷明顿药物科学)，第17版，1989)。 [0139] 如上所述，公开的方法和组合物可用于各种类型的细胞，包括但不限于，原核细胞，真菌细胞，Archaeal细胞，植物细胞，昆虫细胞，动物细胞，脊椎动物细胞，哺乳动物细胞和人细胞。用于蛋白表达的合适的细胞系是本领域技术人员熟知的，包括但不限于COS，CHO(例如，CHO-S，CHO-K1，CHO-DG44，CHO-DUXB11)，VERO，MDCK，WI38，V79，B14AF28-G3，BHK，HaK，NS0，SP2/0-Ag14，HeLa，HEK293(例如，HEK293-F，HEK293-H，HEK293-T)，perC6，昆虫细胞如草地贪夜蛾(Sf)，和真菌细胞如酵母属，毕赤酵母属和裂殖酵母属细胞。也可以使用这些细胞系的后代、变体和衍生物。另外，可以使用对双链断裂敏感的初级细胞。这些包括，但不限于，CD34+人干细胞，胚胎干细胞，小鼠胚胎干细胞和诱导的多能细胞。已知可用于产生转基因生物的细胞，如小鼠胚胎干细胞和卵母细胞也可以使用。 [0140] 应用 [0141] 本发明公开的组合物和方法可用于任意的应用，其中需要在选择的位置引入单链断裂。而且，如这里证明的，单链切割促进靶向整合到单链断裂的位点中(通过，同源重组)，而不诱导非同源末端连接(NHEJ)事件。 [0142] 因此，这里描述的组合物和方法可用于任意的核酸酶应用，其中特异性的靶向单链切割是需要的，和/或用外源序列(例如，同源，不相同的序列)取代任意的基因组序列。 [0143] 为靶向整合，对一个或多个锌指结合结构域进行改造改造以在预定切割位点处或接近预定切割位点处结合靶位点，并在细胞中表达含有改造锌指结合结构域的至少第一和第二切割半结构域(其形成二聚体)的融合蛋白。第一切割结构域被催化失活，并在融合蛋白的锌指部分与靶位点结合和切割半结构域二聚化后，在接近靶位点的DNA中产生单链切割。 [0144] 单链断裂的存在有助于外源序列通过同源重组进行整合。因此，含有至少一个待插入基因组中的外源序列的多核苷酸一般包括一个或多个与靶基因同源的区域，以促进同源重组。 [0145] 如这里所述可以引入任意目的序列(外源序列)。示例性外源序列包括但不限于任意多肽编码序列(例如，cDNA)、启动子序列、增强子序列和其他调节序列shRNA表达盒，抗原表位标签、标记基因、切割酶识别位点和各种类型的表达构建体。另外，外源核酸序列可以产生一个或多个RNA分子(例如，小的发夹RNA(shRNA)，抑制RNA(RNAi)，小RNA(miRNA)，等等，)。这些序列可使用标准的分子生物技术(克隆，合成，等等)容易地获TM得，和/或是市场上可买到的。例如，MISSION TRC shRNA文库可从Sigma Aldrich购买。 [0146] 标记基因包括但不限于编码介导抗生素抗性(例如氨苄青霉素抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的蛋白质的序列，编码有色的或荧光的或发光的蛋白质(例如绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白、萤光素酶)，细胞表面抗原(例如，ΔNGFR)，以及介导增强的细胞生长和/或基因扩增的蛋白质(例如二氢叶酸还原酶)的序列。抗原表位标签例如，例如，一个或多个拷贝的FLAG，His，myc，Tap，HA或任意可检测的氨基酸序列。 [0147] 在一个优选的实施方案中，外源序列包括编码需要在细胞中表达的任意多肽的多核苷酸，该多肽包括但不限于，抗体，抗原，酶，受体(细胞表面或核的)，激素，淋巴因子，细胞因子，报告多肽，生长因子，以及任意上述多肽的功能性片段。编码序列可以是例如cDNA。外源序列也可以编码转录调节因子。 [0148] 例如，外源序列包括编码患有遗传疾病的个体中缺乏或非功能性的多肽的序列，遗传疾病包括但不限于任意下列遗传疾病：软骨发育不全、全色盲、酸性麦芽糖酶缺陷、腺苷脱氨酶缺陷(OMIM号102700)、肾上腺脑白质营养不良、艾卡迪综合征、α-1抗胰蛋白酶缺陷、α-珠蛋白生成障碍性贫血、雄激素不敏感综合征、阿佩尔综合征、心律失常性右心室发育不良、共济失调-毛细血管扩张症、巴氏综合征(barth syndrome)、β-珠蛋白生成障碍性贫血、蓝色橡皮疱样痣综合征、卡纳万病、慢性肉芽肿性疾病(CGD)、猫叫综合征、囊性纤维化病、德尔肯病、外胚层发育不良、范科尼贫血、进行性骨化性纤维发育不良、脆性X综合征、半乳糖血症、高歇病、普遍性神经节苷脂贮积病(如GM1)、血色素沉着病、β-珠蛋白第6个密码子中的血红蛋白C突变(HbC)、血友病、亨廷顿病、赫尔利综合征、磷酸酶过少症、克兰费尔特综合征、克拉伯病、兰-吉综合征、白细胞粘附缺陷(LAD，OMIM号116920)、脑白质营养不良、QT间期延长综合征、马凡综合征、莫比乌斯综合征、粘多糖贮积症(MPS)、甲髌综合征、神经性尿崩症、神经纤维瘤病、耐-皮病(Neimann-Pick disease)、成骨不全、卟啉病、普拉德-威利综合征、早衰症、普罗第司综合征(Proteus syndrome)、视网膜母细胞瘤、雷特综合征、鲁宾斯坦-泰比综合征、圣菲利波综合征、重症联合免疫缺陷(SCID)、舒瓦克曼综合征、镰状细胞病(镰状细胞贫血)、史-麦综合征、斯蒂克勒综合征、泰-萨克斯病、血小板减少-桡骨缺失(TAR)综合征、特雷歇-柯林斯综合征、三体性、结节性硬化症、特纳综合征、尿素循环障碍、希普尔病、瓦尔敦堡综合征、威廉斯综合征、威尔逊病、威斯科特-奥尔德里奇综合征、X-联锁淋巴增殖综合征(XLP，OMIM号308240)。 [0149] 可通过单链切割后靶向整合治疗的其它示范性疾病包括：获得性免疫缺陷症、溶酶体贮积症(如高歇病、GM1、法布里病和泰-萨克斯病)、粘多糖沉积病(如亨特病(Hunter’s disease)、胡尔勒病)、血红蛋白病(如镰状细胞病、HbC、α-珠蛋白生成障碍性贫血、β-珠蛋白生成障碍性贫血)和血友病。 [0150] 在特定的实施方案中，外源序列包括标记基因(如上所述)和编码另外的功能的链接序列，该标记基因允许选择已经进行靶向整合的细胞。 [0151] 此外，尽管不是表达所需的，外源序列也可以是转录或翻译调节序列，例如，启动子，增强子，绝缘子，内部核糖体进入位点，编码2A肽和/或聚腺苷酸化信号的序列。 [0152] 这里所述的核酸酶还可以用于一个或多个基因组序列的失活(部分或完全)。例如，可通过错义或无义密码子靶向重组到编码区中，通过不相关序列(也即，“stuffer”序列)靶向重组到基因或它的调节区中，以破坏该基因或调节区，或通过剪接受体序列靶向重组到内含子中以引起转录物的错误剪接，来达到失活。 [0153] 例如，可以使用内源基因的ZFN介导的失活(例如，降低或敲除)，来产生涉及细胞程序死亡或蛋白质生产(例如，翻译后修饰如岩藻糖基化)的基因缺陷的细胞系。ZFN介导的失活还可以用于产生转基因生物(例如，植物或转基因动物)。 [0154] 可通过靶向切割感染或整合的病毒基因组治疗宿主中的病毒感染。此外，可通过靶向切割病毒受体的编码基因阻断这类受体的表达，从而防止病毒感染和/或病毒在宿主生物中传播。可通过靶向诱变病毒受体(如HIV的CCR5和CXCR4受体)的编码基因使受体无法结合于病毒，从而防止新的感染并阻断现有感染的传播。可靶向的病毒或病毒受体的非限制性实例包括：单纯疱疹病毒(HSV)如HSV-1和HSV-2、水痘带状疱疹病毒(VZV)、EB病毒(EBV)和巨细胞病毒(CMV)、HHV6和HHV7。肝炎病毒家族包括甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)、戊型肝炎病毒(HEV)和庚型肝炎病毒(HGV)。可靶向的其它病毒或其受体，包括但不限于：小核糖核酸病毒科(如脊髓灰质炎病毒等)；杯状病毒科；披膜病毒科(如风疹病毒、登革热病毒等)；黄病毒科；冠状病毒科；呼肠孤病毒科；双RNA病毒科；棒状病毒科(如狂犬病病毒等)；纤丝病毒科；副粘病毒科(如腮腺炎病毒、麻疹病毒、呼吸道合胞病毒等)；正粘病毒科(如A、B和C型流感病毒等)；本扬病毒科；沙粒病毒科；逆转录病毒科；慢病毒科(如HTLV-I；HTLV-II；HIV-1(也称为HTLV-III、LAV、ARV、hTLR等)HIV-II)；猿免疫缺陷病毒(SIV)、人乳头瘤病毒(HPV)、流感病毒和蜱媒脑炎病毒。参见，例如，Virology(病毒学)，第三版(W.K.Joklik编，1988)；Fundamental Virology(基础病毒学)，第二版(B.N.Fields和D.M.Knipe编，1991)中关于这些和其它病毒的描述。HIV受体，例如，包括CCR-5和CXCR-4。 [0155] 这里描述的方法和组合物在上下文中也可以体外使用，例如，作为工具用于在分离的DNA模板中引入位点特异性的缺口，用于核酸扩增(例如，克隆，文库产生)，用于检测样本中的核酸(例如，诊断遗传疾病和/或传染物的存在)，用于基因组步行，用于分析DNA甲基化作用等等。参见，例如，美国专利号7,314,714；7,112,423；7,090,804；6,884,586和6,395,523。例如，这里描述的产生缺口的核酸酶可以单独使用或与其他的酶组合使用以产生长的而且非互补的突出以及其他的结构。 [0156] 另外，这里描述的组合物可用于产生缺口的(nicked)或(或缺口的(gapped))双链DNA用于链易位扩增(SDA)，其是一种等温DNA扩增方法，提供对聚合酶链式反应(PCR)检测的快速(短至15分钟)替换。参见，例如，美国专利号5,523,204；Walker等(1992)Nucleic Acids Res.20(7)：1691-1696。迄今为止SDA的使用取决于修饰的硫代磷酸酯核苷酸，以产生半硫代磷酸酯DNA双螺旋，其位于修饰链上将是耐酶切割的，并导致酶促缺口而不是消化以驱动置换反应，或者位于改造的“切口酶”上，其不切割双链DNA。因此，这里描述的核酸酶可容易地适于目前应用SDA的任意应用中。从而，本发明的组合物可用于检测核酸序列，因此用于诊断遗传疾病和/或传染物的存在，如来自任意样本(例如，血液，尿，血浆，组织样本，分离的细胞，固定细胞，等等)的HPV，肝炎病毒(HCV，HBV，HAV)，HIV，结核分枝杆菌和沙眼衣原体。 [0157] 另外的体外应用包括产生核酸外切降解。例如，这里描述的产生缺口的核酸酶可与S1联合使用用于产生嵌套缺失。参见，例如，美国专利号7,244,560；6,867,028和6,828,098。实施例 [0158] 实施例1：具有突变的切割结构域的ZFN的设计和构建 [0159] 国际专利公开WO 2007/139982中描述的靶向CCR5的锌指蛋白，基本上如美国专利公开20050064474和国际专利公开WO 2005/014791中所述的与美国专利公开号2008/0131962中所述的改造切割结构域可操作连接。 [0160] 特别地，CCR5结合锌指蛋白，其命名为8196z，与具有(1)E490K和I538K突变的形成专性异二聚体的切割结构域融合形成锌指核酸酶(ZFN)，其命名为“8196zKK”，或(2)与具有D483R突变的形成专性异二聚体的切割结构域融合产生命名为“8196zDR”的ZFN。类似地，CCR5结合锌指蛋白，其命名为8267，与具有(1)Q486E和I599L突变的形成专性异二聚体的切割结构域融合形成命名为“8267EL”的ZFN，或(2)与具有R487D突变的形成专性异二聚体的切割结构域融合形式命名为“8267RD”的ZFN。 [0161] 所有4种ZFN的催化失活形式都通过450氨基酸残基(D到N，命名为D450N)；467位氨基酸残基(D到A，命名为D467A)；或469位氨基酸残基(K到A，命名为K469A)的定点诱变制备。 [0162] 实施例2：切割结构域与一个催化失活的切割结构域的二聚体诱导单链断裂[0163] 实施例1中所述的ZFN以各种成对组合使用并评估切割事件。特别地，使用TNT TMT7 Quick 偶联转录/翻译系统(Promega)合成实施例1中描述的ZFN变体。 [0164] 通过PCR扩增位于CCR5 ZFN结合区旁邻的CCR5序列产生292碱基对底物，来产生含有ZFN靶位点的合适底物。底物用T4多核苷酸激酶进行32P末端标记，并用下列ZFN对孵育：8196zKK和8267EL(WT)；8196zKK和8267EL，其中8267EL包括催化失活点突变D450N(D450N)；8196zKK和8267EL，其中8267EL包括催化失活点突变D467A(D467A)；8267RD和8196zDR(WT)；8267RD和8196zDR，其中8196zDR包括催化失活点突变D450N(D450N)；以及8267RD和8196zDR，其中8196zDR包括催化失活点突变D467A(D467A)。放射性标记的底物DNA和ZFN蛋白的混合物，如前面所述的于37℃孵育2hr(Miller等(2007)Nat.Biotech.25：778-785)，如下所述进行修饰。 [0165] 通过苯酚/氯仿提取裂解的DNA，并不处理(双链裂解产物)或用DNA变性溶液TM(1.0M 乙二醛，10mM NaH2PO4/Na2HPO4，pH 7.0，50％DMSO)处理，以在10％Ready gel TBE gel(Invitrogen)分离之前产生单链DNA。 [0166] 如图2A中所示，仅仅用ZFN对8196zKK+8267EL(WT)或8267RD+8196zDR(WT)高效产生双链裂解产物，其中左和右ZFN的FokI切割半结构域都是催化激活的。用所有ZFN对都存在亲本未切割的DNA(292bp)。当ZFN都催化激活时(8196zKK+8267EL(WT)或8267RD+8196zDR(WT)对)，观察到两个片段(～168bp和～124bp)。对于所有的ZFN对组合，其中ZFN之一通过指定的点突变催化失活，在CCR5靶DNA中都没有产生双链断裂。 [0167] 然而，如图2B所示，具有一个催化失活ZFN的ZFN对诱导单链断裂。特别地，当两个FokI切割半结构域都催化激活时在双链裂解产物中观察到的～168bp片段(图2A，从左边起泳道3和8)，在用ZFN对8196zKK+8267ELD450N和8196zKK+8267EL D467A(包含一个催化失活的切割结构域)处理的单链裂解产物中也观察到。参见，图2B，从左边起第4和5泳道。由于仅每条DNA链的5’末端被末端标记，所以没有观察到较小的～124bp片段(参见，图2C)。 [0168] 类似地，当两个FokI切割半结构域都催化激活时在双链裂解产物中观察到的～124bp片段(图2A，从左边起泳道3和8)，在用8267RD+8196zDRD450N或8267RD+8196zDR D467A(每个都包含一个催化失活的切割半结构域)处理的单链裂解产物中也观察到。参见，图2B，从左边起第9和10泳道。由于仅每条DNA链的5’末端被末端标记，所以在这些样本中没有观察到较大的～168bp片段(参见，图2C)。 [0169] 这些结果证明，使用切割半结构域的二聚体在双链DNA中产生SSB/缺口，其中一个切割半结构域被催化失活。 [0170] 实施例3：通过细胞中的单链退火修复SSB/缺口 [0171] A.酵母细胞 [0172] 为了评估SSB/缺口是否可以用作一种替换方法用于在靶向基因座诱导基于重组的基因组编辑，我们基本上如Doyon等(2008)Nat Biotechnol 26：702-8和美国专利公开No.20090111119中描述的在酵母中测试了该系统。 [0173] 用 ZFN 表达质粒：ZFN-L-EL-D450N+ZFN-R-KK(D450N)，ZFN-L-EL-D467A+ZFN-R-KK(D467A)或对照载体(对照)，转化SSA-MEL1报告酵母菌株，其中引入靶向CCR5ZFN的位点到MEL1基因的2各重叠与非功能片段之间。在葡萄糖介质中过夜培养，并分析半乳糖苷酶活性之前，在2％半乳糖中2到6小时诱导培养细胞的ZFN表达。 [0174] 相较于用对照载体处理的培养物中，在用D450N/WT(40.0-75.5mU)或D467A/WT(51.7-96.0mU)ZFN处理的培养物中，通过半乳糖诱导ZFN表达2-6小时的同时观察到显著增加的半乳糖苷酶活性，证明通过如这里所述的ZFN诱导的SSB/缺口是重组产生的，而且可通过酵母中的单链退火修复。 [0175] 为了确保ZFN通过SSB/缺口而不是DSB的SSA修复诱导MEL1表达，还评估了ZFN诱导DSB形成的能力。在缺乏同源模板序列时，DSB诱导对菌落中超过99.8％的酵母细胞是致命的。具有整合到HO基因座中的CCR5ZFN靶位点的酵母细胞，用ZFN表达质粒转化，并在含有以10倍连续稀释的葡萄糖或半乳糖的基本培养基中培养。仅仅期待其中ZFN没有诱导DSB的细胞幸免于ZFN表达的诱导。 [0176] 在存在葡萄糖(没有诱导ZFN表达)时，细胞生长较好，不管引入到这些细胞中的ZFN表达质粒。存在半乳糖时，我们观察到相较于用对照载体处理的培养物，当用WT/WT ZFN处理时，培养中幸存的酵母细胞的数目减少2-3log。相反，用ZFN变体之一(D450N或D467A)代替WT/WT ZFN之一的表达构建体转化的酵母，难以与用对照载体处理的那些培养物区分开。取自这些培养物的提取物的Western印迹分析证实ZFN蛋白的表达水平相似。 [0177] 由于观察到的致命性完全取决于整合的CCR5靶位点的存在，它不是由于野生型ZFN产生的随机DSB。因此，这些结果证实在活细胞的上下文中，产生SSB的ZFN通过SSB/缺口形成诱导SSA介导的修复，而且不催化DSB。 [0178] B.哺乳动物细胞 [0179] 为了评估哺乳动物细胞中SSB/缺口是否可以通过HDR依赖的SSA途径修复，K562细胞用ZFN表达质粒与SSA-GFP报告质粒共转染，其中具有重复同源序列的eGFP开放读框位于编码CCR5ZFN靶位点的一段DNA旁邻(HDR依赖所需的)，然后通过流式细胞术分析监控进行SSA介导的修复并表达GFP的细胞的数目。 [0180] 如图3中所示，在用D450N/WT(ZFN-L-EL-D450N+ZFN-R-KK+SSA-GFP报告基因，3.55％)或D467A/WT(ZFN-L-EL-D467A+ZFN-R-KK+CCR5-SSA-GFP报告基因，3.40％)处理的样本中，比在单独用SSA-GFP报告基因处理中样本(0.67％)中观察到显著更多的GFP+细胞，虽然它比用WT/WT ZFN(ZFN-L-EL+ZFN-R-KK+SSA-GFP报告基因，8.58％)处理的样本少2-3倍。 [0181] 这些数据表明由由产生SSB的ZFN产生的SSB/缺口，在哺乳动物细胞中也可以通过SSA途径修复。 [0182] 实施例4：单链断裂促进通过同源重组的靶整合 [0183] 还测定了ZFN诱导SSB/缺口促进同源重组和/或NHEJ的能力。 [0184] 简要地，单独用表1中所示的ZFN组合或用表1中所示的ZFN组合与CCR5膜片供TM体序列一起处理K562细胞。3天以后从处理的细胞收集基因组DNA，然后通过SurveyorTM 核酸酶分析和TaqMan qPCR分析检测NHEJ事件。另外，RFLP分析用于检测通过同源重组而致的靶向整合。 [0185] A.非同源末端连接 [0186] 如上所述，通过SurveyorTM核酸酶分析和TaqManTM qPCR分析评价NHEJ事件的百分比。简短地，如Miller等(2007)Nat.Biotech.25：778-785)中描述的进行SurveyorTM核酸酶分析。根据制造商的指导进行TaqmanTMqPCR分析，以测定在用CCR5 ZFN进行双链切割后，已知在大约10到30％细胞中出现的5bp插入的存在。因此，基于这种五聚体插入事件设计特异性引物，检测和最佳化。该分析能检测1个拷贝的含有五聚体插入序列的质粒DNA。该分析还可以很容易地检测基因组DNA样本中0.01％(1e-4)NHEJ事件。 [0187] 除了未切割的亲代DNA(292bp)，裂解的大片段(～168bp)与小片段(～124bp)的存在表明通过SurveyorTM核酸酶的切割，由于NHEJ诱导的DNA序列的修饰，和分析过程期间随后形成的DNA异源双螺旋。 [0188] 如表1和图 4A中所示，结果证明野生型(WT)ZFN，8196zKK+8267EL 或8267RD+8196zDR(标记1和9的泳道)的组合诱导DSB，其分别54.3％与36.7％通过NHEJ修复。也参见图5B，显示仅仅用野生型ZFN的NHEJ。 [0189] 相反，其他的ZFN组合都没有诱导双链断裂，这些ZFN组合中两个ZFN之一在FokI结构域含有催化失活的点突变，基于缺乏如通过放射性SurveyorTM核酸酶分析和高灵敏的TaqmanTM qPCR分析多检测的通过NHEJ进行的修复。参见，图5B。 [0190] 表1 [0191] [0192] 因此，ZFN对诱导的DNA SSB/缺口不能诱导NHEJ，ZFN对中一个ZFN如这里所述的催化失活。 [0193] B.靶向整合 [0194] 还评估了各种供体的靶向整合。测试的供体包括较小的46bp CCR5-膜片供体(R5-膜片供体)，其具有BglI限制性内切酶位点和2个CCR5 ZFN结合位点之间总共46bp的插入；1.6kb CCR5-GFP供体，其中eGFP表达盒位于与CCR5同源的序列旁邻(R5-GFP供体)；以及其他的供体，其用截断的NGFR报告基因取代CCR5-GFP供体的同源CCR5序列之间的eGFP标记，并把eGFP标记盒置于供体模板质粒(CCR5-NGFR-outGFP供体)上的同源CCR5序列外面。除非下面有特别说明，使用下列ZFN：8267-EL(或ZFN-L-EL)，8267-EL-D450N(或ZFN-L-EL-D450N)，8267-EL-D467A(ZFN-L-EL-D467A)和8196zKK(ZFN-R-KK)。 [0195] 存在较小的46bp CCR5-膜片供体时，通过限制性片段长度多态性(RFLP)分析来评估靶向整合，其中BglI消化的野生型PCR产物是2433bp，含有膜片的BglI消化片段的修饰CCR5PCR产物分别为1554bp和925bp。 [0196] 如图4B和表1中所示，野生型(WT)ZFN，8196zKK+8267EL或8267RD+8196zDR(标记1和9的泳道)的组合诱导DSB，其分别29.4％与28.4％通过同源重组修复。包含一个具有催化激活的FokI结构域的野生型ZFN的大多数组合在0.5-2.5％的DNA修复事件中诱导同源重组，而包含具有催化失活FokI结构域的2个ZFN的所有组合都不能诱导同源重组。此外，所有的单个ZFN，其具有野生型催化活性或催化失活的突变体，都不能单独诱导同源重组(图4C和4D)。 [0197] 另外，如图5A所示，在一个单独的实验中，用WT/WT ZFN(诱导DSB)处理的K562细胞显示在30.6％内源CCR5等位基因中CCR5-膜片供体的靶向整合(TI)。用D450N/WT或D467A/WT ZFN处理的细胞中，还显示在CCR5基因座的TI(分别为7.3和8.0％)，但是效率降低4倍。在用单个ZFN(WT，D450N或D467A)处理的任意样本中都没有检测到TI。 [0198] 还对来源于使用CCR5-膜片供体的实验中的未分选池的单细胞克隆进行了基因分型。用表2中所述的供体DNA和ZFN表达质粒的组合：ZFN-L-EL+ZFN-R-KK(WT)，ZFN-L-EL-D450N+ZFN-R-KK(D450N)或ZFN-L-EL-D467A+ZFN-R-KK(D467A)共转染K562细胞。通过有限稀释对未分选或分选池进行单细胞克隆。在显微镜下选择单细胞来源的克隆，并通过随后的基因分型分析进行检测。 [0199] 如表2所示，超过25％的扩展克隆是杂合体用于靶向整合到CCR5基因座中，其证实通过在K562细胞中诱导SSB/缺口的高频率的HDR驱动的基因组修饰。 [0200] 类似地，如上所述较大的1.6kb CCR5-GFP供体与WT/WT CCR5 ZFN和切口酶突变体ZFN对一起引入到K562细胞中，以评估GFP表达盒靶向整合到CCR5基因座中。简短地，如Moehle等(2007)Proc Natl Acad Sci USA 104：3055-3060中所述的，在加州大学(Berkeley，CA)的研究所，通过荧光激活的细胞分选(FACS)对GFP+细胞进行分选，这种分选的群体用于产生单细胞来源的克隆。 [0201] 来源于用WT/WT ZFN(ZFN-L-EL+ZFN-R-KK+CCR5-GFP)处理的样本的75个GFP+克隆中，70个克隆(93.3％)具有TI事件，58个克隆(77.3％)具有NHEJ事件。相反，用D450N/WT ZFN(ZFN-L-EL-D450N+ZFN-R-KK+CCR5-GFP)处理修饰的克隆显示没有基于NHEJ的修饰，而总共93个克隆中的61个(65.6％)显示TI事件。来源于用D467A/WT ZFN(ZFN-L-EL-D467A+ZFN-R-KK+CCR5-GFP)处理的细胞的95个克隆中的一个(1.1％)显示CCR5中NHEJ样突变，而67个克隆(70.5％)显示TI事件。参见，表2。 [0202] 为了使用CCR5-tNGFR-outGFP供体的实验，进行供体上编码序列的HDR驱动的TI的细胞，只表达NGFR标记而不是GFP(NGFR+GFP-)。eGFP(GFP+)的表达表明存在游离基因DNA或供体质粒在未知位点的随机整合。 [0203] 为了富集具有表面NGFR表达的细胞，细胞首先用抗NGFR mAb(BD Pharmingen)孵育，洗涤，然后用与CELLection Pan小鼠IgG试剂盒(Invitrogen)提供的Dynal珠子配合的山羊抗小鼠IgG孵育，接着通过磁场。然后按照制造商的指导(Invitrogen)，通过DNA酶I消化从富集的细胞除去珠子。做为选择，细胞是未染色的或用与PE(BD Pharmingen)配合的抗NGFR mAb孵育，然后使用流式细胞分选器基于GFP和/或NGFR表达水平进行分选。 [0204] 来源于用WT/WT ZFN(ZFN-L-EL+ZFN-R-KK+CCR5-tNGFR-outGFP)处理的细胞的分选的NGFR+GFP细胞池含有高水平(63.2％)的基于NHEJ的修饰，而在用下列ZFN：D450N/WT(ZFN-L-EL-D450N+ZFN-R-KK+CCR5-tNGFR-outGFP)或 D467A/WT(ZFN-L-EL-D467A+ZFN-R-TMKK+CCR5-tNGFR-outGFP)处理的细胞中没有检测到NHEJ修饰，如通过Surveyor 核酸酶分析测定的(图6A)。在分选的NGFR+GFP+细胞群体与未分选的池中也都观察到了NHEJ修饰水平的差异。 [0205] 虽然使用SurveyorTM核酸酶分析，用CCR5-tNGFR-outGFP供体与诱导缺口的ZFN(D450N/WT或D467A/WT)处理的细胞没有显示NHEJ，但是我们在来源于这些样本的分选的NGFR+GFP细胞中发现＞18％的CCR5等位基因具有靶向插入事件，如通过Southern印迹检测的(图6B)。而且，从用D450N/WT与D467A/WT ZFN处理的样本产生的单细胞来源的克隆证实，91个克隆中的71个(78％)和96个克隆中的74个(77.1％)分别在它们的基因组中具有TI(表2)。相反，在分选的NGFR+GFP+细胞中没有观察到TI事件，其将富集用于已经进行供体质粒的随机整合，来源于ZFN处理的样本的细胞。除了期待的TI条带外，在来源于WT/WT ZFN(ZFN-L-EL+ZFN-R-KK+CCR5-tNFR-outGFP)处理的样本的分选的NGFR+GFP+细胞中观察到许多Southern印迹条带，推测是由于CCR5上存在各种NHEJ修饰，供体DNA模板的随机整合，或供体质粒如游离基因DNA的稳定操持而导致。 [0206] 如表2所示，超过25％的扩展克隆是杂合体用于靶向整合到CCR5基因座中，其证实通过诱导SSB/缺口的高频率的HDR驱动的基因组修饰。 [0207] 表2 [0208] [0209] 因此，DNA中的单链断裂(缺口)可在哺乳动物(例如，人)细胞中诱导同源重组，而且可用于任意DNA序列的靶向整合，同时ZFN切割位点的开启或关闭靶NHEJ突变减少或消除。 [0210] 实施例5：Solexa 深度测序 [0211] 为了更进一步地评估SSB/缺口是否可以通过NHEJ途径修复，我们进行了来自WT/WT，D450/WT ZFN或对照处理的K562细胞的CCR5靶基因座的Solexa 深度测序。简而言之，使用位于供体分子的CCR5同源区外面的一对CCR5引物扩增基因组DNA。扩增的2.5kb CCR5片段进行凝胶纯化，并用作模板用于使用包含BpmI与XhoI限制性内切酶位点的引物的内部PCR反应。 [0212] 扩增子然后用BpmI与XhoI消化除去5’-末端16bp的PCR产物，以允许从接近推定的ZFN切割位点进行测序。消化的产物进行凝胶纯化并与适体连接，该适体具有BpmI或XhoI消化的DNA样末端，而且不包含对每个实验唯一的标签或3核苷酸“条码”。适体连接的PCR产物然后进行凝胶纯化，并使用Illumina基因组DNA引物(Illumina)进行PCR扩增。得到的PCR产物进行位于加利福尼亚研究所用于定量生物科学，加州大学(Berkeley，CA)的Solexa 深度测序。常规记录的计算机正本用于提取所有的序列，其是WT或与NHEJ介导的缺失或者插入一致。 [0213] 分析来自每个监测样本的大于485,000的优质序列读数(每个碱基＞99％置信度)。来源于WT/WT ZFN样本(ZFN-L-EL+ZFN-R-KK+CCR5-膜片)的序列表明713,186个序列中260,509个(36.5％)仿佛通过NHEJ修饰。参见，表3。 [0214] 表3：未分选池的Solexa 深度测序 [0215] [0216] [0217] *“WT”指野生型；“Ins”指插入；“Del”指缺失；“Uni”指唯一的插入或缺失[0218] 鲜明的对照，来自D450/WT ZFN(ZFN-L-EL-D450N+ZFN-R-KK+CCR5-膜片)的分析的序列，揭示944,605个序列中仅仅43个(0.0046％)显示与NHEJ一致的突变，NHEJ减少＞7,900倍。D450/WT ZFN处理的细胞中突变率处于分析的背景噪音范围内(0-0.0058％)，基于来自仅仅用供体DNA或供体与单个ZFN处理的样本的数据，推测是由于PCR扩增和测序步骤期间产生的误差而导致的。对照和ZFN样本中鉴定的少数唯一序列变体也支持了这种观点。如在WT/WT ZFN处理的样本中观察到的，如果这些修饰时由于NHEJ，将期待各种序列修饰中更大的差异。 [0219] 存在CCR5-膜片供体时，用D450N/WT处理的细胞具有7.3％的靶向整合事件，意思是使用ZFN对HDR比NHEJ存在＞1,500倍的偏好。应当注意，添加单个ZFN没有引起通过NHEJ对基因座的修饰，这提供了另外的证明，即DNA上以合适取向的2个ZFN的结合是DSB形成所需的。 [0220] 这些数据表明在诱导SSB的ZFN处理的样本中没有或非常低水平的NHEJ事件。这些数据更进一步证实HDR而非NHEJ选择性修复SSB/缺口。 [0221] 实施例6：通过具有催化失活的ZFN的ZFN对诱导的DSB形成的基因组广范围评估 [0222] SSB/缺口是由内源反应性氧物种或DNA代谢如DNA修复和复制期间产生的最频繁类型的DNA损伤之一，其可以使用完整的相反链作为模板，通过DNA聚合酶和连接酶精确地恢复。参加，Caldecott(2008)Nat Rev Genet 9：619-31。为了更进一步评估产生SSB的ZFN在基因组位点而不是指定的靶位点诱导低水平DSB的可能性，我们通过检测gH2AX和53BP1表达进行了DSB形成的基因组广范围评估，因为作为对DNA损伤的自然响应，gH2AX和53BP1被恢复到DSB的该位点。 [0223] 简短地，为了γH2AX的细胞内染色，在核转染后于不同的时间点(例如，1，2，3和7天)收集的细胞，用perm/洗涤缓冲液(溶于PBS的0.05％皂草苷，2.5％FBS和0.02％NaN3)渗透，然后用抗γH2AX单克隆抗体(Upstate)孵育，接着用Alexa Fluor488配合的山羊抗小鼠免疫球蛋白(Ig，Invitrogen)孵育。细胞然后使用Guava Easycyte 单细胞分析系统(Guava Technologies)进行分析。 [0224] 为了53BP1免疫细胞化学分析，收集细胞以通过cytospin(Thermo Scientific)制备载玻片并用抗53BP1兔多克隆抗体(Bethyl Laboratories)染色，接着用与免疫荧光显微镜连接的CCD摄像机(Nikon)拍照，如前面Perez等(2008)Nat Biotechnol 26：808-16详细所述的。 [0225] 在用于利用ZFN和供体转染细胞的实验条件下，转染后2天在用WT/WTZFN(ZFN-L-EL+ZFN-R-KK+CCR5-膜片，14.70％gH2AX+)处理的细胞中，而不是在用D450N/WT(ZFN-L-EL-D450N+ZFN-R-KK+CCR5- 膜片，0.33 ％gH2AX+) 处理的细胞中，观察到显著量的gH2AX表达。然而，在用D467A/WT(ZFN-L-EL-D467A+ZFN-R-KK+CCR5-膜片，4.34％gH2AX+)处理的细胞中观察到稍微更高的gH2AX表达，其与前面的结果一致，即D467A/WT WT对可保留少量的DSB活性。正如所料，在用WT/WT ZFN(ZFN-L-EL+ZFN-R-KK+CCR5-膜片，6.09±1.07foci/细胞，Ave±SD)中，比在用D450N/WT对(ZFN-L-EL-D450N+ZFN-R-KK+CCR5-膜片，0.84±0.17foci/细胞)处理的细胞中，其基本处于背景水平，观察到更多的53BP1+foci。相较于单独用CCR5-膜片供体转染的对照细胞(0.82±0.22foci/细胞)，在用D467A/WT(ZFN-L-EL-D467A+ZFN-R-KK+CCR5-膜片， 1.77±0.33foci/细胞)处理的细胞中观察到中度增加数量的53BP1+foci。转染以后一周之内，gH2AX和53BP1的表达恢复到背景水平(图7)。 [0226] 在这些实验条件下缺乏上调的gH2AX和53BP1表达，进一步证实如这里所述的ZFN相对于背景没有增加形成的DSB的数量，并提供了另外的支持，即在诱导SSB的ZFN处理的细胞中观察到的靶向整合确实通过缺口诱导的HDR而不是DSB诱导的HDR发生，而且提供了一种选择方法用于编辑人细胞的基因组，同时降低通过NHEJ开启靶和关闭靶诱变的可能性。 [0227] 实施例7：非CCR5内源基因座中SSB-ZFN启动的靶向整合 [0228] 为了进一步评估诱导SSB的ZFN是否可用于在基因座而不是CCR5基因座进行基因组编辑，我们测试了在CXCR4基因座D450N ZFN启动的靶向整合。如美国申请号61/210,636中所述的制备含有靶向CXCR4的锌指结构域的WT和D450N ZFN。接着，在缺乏(没有ZFN)或存在CXCR4 D450N ZFN：CXCR4-ZFN-L-EL-D450N+CXCR4-ZFN-R-KK时，用CXCR4膜片供体DNA核转染K562细胞。允许细胞回收4-7天，然后用相同的DNA再次核转染。重复该过程用于总共4次核转染。然后在最后一次核转染后3天收集细胞，用于gDNA制备和RFLP分析。 [0229] 如图8所示，特异性靶向位于人基因组的2号染色体上的内源CXCR4基因的D450N/WT ZFN对，还可以介导CXCR4基因座上显著量的TI。 [0230] 这些数据表明使用靶向的诱导SSB的ZFN介导HDR驱动的基因组编辑的策略可以广泛地应用，而且在各种靶基因座上普遍应用。 [0231] 实施例8：核酸序列检测 [0232] 根据标准技术收集怀疑包含传染物或来自怀疑患有遗传疾病的个体的血液或细胞样本。准备合适的引物用于靶核苷酸序列，其是遗传疾病或传染物特征性的。构建如这里所述的核酸酶，以在靶序列和/或扩增引物中诱导位点特异性的单链缺口。 [0233] 样本用合适的引物，核苷酸(用于扩增的dNTP)和酶混合物(包含合适的形成缺口的核酸酶和DNA聚合酶)孵育，以便当存在时，遗传疾病或传染物的特征性序列被扩增。可以可检测地标记一个或多个组分以便于检测。 [0234] 扩增的序列，如果有，然后使用标准技术例如凝胶电泳，流式细胞术，放射性标记等等进行检测。扩增序列的存在是存在遗传疾病或传染物的指示。 [0235] 实施例9：核酸序列检测 [0236] 根据标准技术收集怀疑包含传染物或来自怀疑患有遗传疾病的个体的血液或细胞样本。 [0237] 这里提到的所有专利，专利申请和出版物其通过引用全文并入本文。 [0238] 虽然为了清楚理解的目的以说明和举例的方式详细提供本说明书，但是对本领域技术人员显而易见的是，可在不背离本公开的精神和范围的情况下实施各种改变和修改。因此，上述描述和实施例不应被理解为是对本发明的限制。

意见反馈