RNA-引导的人类基因组工程化

申请号 CN201380073208.X 申请日 2013-12-16 公开(公告)号 CN105121641A 公开(公告)日 2015-12-02
申请人 哈佛大学校长及研究员协会; 发明人 乔治·M·丘奇; 普拉尚特·马利; 杨璐菡;
摘要 提供了一种改变真核细胞的方法,包括用编码与真核细胞的基因组DNA互补的RNA的核酸 转染 真核细胞,用编码与RNA相互作用并且以位点特异性方式切割基因组DNA的酶的核酸转染该真核细胞,其中该细胞表达该RNA和该酶,该RNA结合于互补的基因组DNA并且该酶以位点特异性方式切割该基因组DNA。
权利要求

1.一种改变真核细胞的方法,包括
用编码与所述真核细胞的基因组DNA互补的RNA的核酸转染所述真核细胞,用编码与所述RNA相互作用并且以位点特异性方式切割所述基因组DNA的酶的核酸转染所述真核细胞,
其中,所述细胞表达所述RNA和所述酶,所述RNA结合于互补的基因组DNA并且所述酶以位点特异性方式切割所述基因组DNA。
2.根据权利要求1所述的方法,其中,所述酶是Cas9。
3.根据权利要求1所述的方法,其中,所述真核细胞是酵母细胞、植物细胞或哺乳动物细胞。
4.根据权利要求1所述的方法,其中,所述RNA包括约10个至约250个之间的核苷酸。
5.根据权利要求1所述的方法,其中,所述RNA包括约20个至约100个之间的核苷酸。
6.一种改变人类细胞的方法,包括
用编码与真核细胞的基因组DNA互补的RNA的核酸转染所述人类细胞,用编码与所述RNA相互作用并且以位点特异性方式切割所述基因组DNA的酶的核酸转染所述人类细胞,
其中,所述人类细胞表达所述RNA和所述酶,所述RNA结合于互补的基因组DNA并且所述酶以位点特异性方式切割所述基因组DNA。
7.根据权利要求6所述的方法,其中,所述酶是Cas9。
8.根据权利要求6所述的方法,其中,所述RNA包括约10个至约250个之间的核苷酸。
9.根据权利要求6所述的方法,其中,所述RNA包括约20个至约100个之间的核苷酸。
10.一种在多个基因组DNA位点处改变真核细胞的方法,包括
用编码与所述真核细胞的基因组DNA上的不同位点互补的RNA的多个核酸转染所述真核细胞,
用编码与所述RNA相互作用并且以位点特异性方式切割所述基因组DNA的酶的核酸转染所述真核细胞,
其中,所述细胞表达所述RNA和所述酶,所述RNA结合于互补的基因组DNA并且所述酶以位点特异性方式切割所述基因组DNA。
11.根据权利要求10所述的方法,其中,所述酶是Cas9。
12.根据权利要求10所述的方法,其中,所述真核细胞是酵母细胞、植物细胞或哺乳动物细胞。
13.根据权利要求10所述的方法,其中,所述RNA包括约10个至约250个之间的核苷酸。
14.根据权利要求10所述的方法,其中,所述RNA包括约20个至约100个之间的核苷酸。

说明书全文

RNA-引导的人类基因组工程化

[0001] 相关申请数据
[0002] 本申请要求于2013年3月13日提交的美国临时申请号61/779,169和2012年12月17日提交的美国临时申请号61/738,355的优先权,通过引用将其全部内容结合在此用于所有目的。
[0003] 政府权益声明
[0004] 在国立卫生研究院授予的P50HG005550下用政府支持完成本发明。政府对本发明拥有某些权利。

背景技术

[0005] 细菌和古细菌的CRISPR系统依赖于与Cas蛋白复合的crRNA以直接降解在入侵的病毒和质粒DNA(1-3)内的互补序列。酿脓链球菌(S.pyogenes)II型CRISPR系统最近的体外重构表明正常地反式编码的tracrRNA融合的crRNA足以指导Cas9蛋白序列特异性地切割匹配crRNA的靶向DNA序列(4)。

发明内容

[0006] 本公开用数字引用文献,文献列在本公开的最后。对应于数字的文献通过引用结合至本说明书中,作为对应于该数字相当于全部引用的支持引用。
[0007] 根据本公开的一个方面,用包括与基因组DNA互补的RNA和与该RNA相互作用的酶的双组分系统转染真核细胞。由细胞表达该RNA和该酶。RNA/酶复合物的RNA随后结合至互补的基因组DNA。酶随后执行功能,如基因组DNA的切割。该RNA包括约10个核苷酸至约250个核苷酸之间。RNA包括约20个核苷酸至约100个核苷酸之间。根据某些方面,酶可以以位点特异性的方式执行任何希望的功能,对于该功能酶已经被工程化。根据一个方面,真核细胞是酵母细胞、植物细胞或哺乳动物细胞。根据一个方面,酶切割由RNA序列靶向的基因组序列(参见参考文献(4-6)),从而产生基因组改变的真核细胞。
[0008] 根据一个方面,本公开提供了一种通过将编码与基因组DNA互补的RNA的核酸包括进入细胞的基因组以及将编码在基因组DNA上执行希望的功能的酶的核酸包括进入细胞的基因组来遗传改变人类细胞的方法。根据一个方面,表达RNA和酶。根据一个方面,RNA与互补的基因组DNA杂交。根据一个方面,当RNA与互补的基因组DNA杂交时,酶被激活来以位点特异性方式执行希望的功能,如切割。根据一个方面,RNA和酶是细菌II型CRISPR系统的组分。
[0009] 根据一个方面,提供了一种改变真核细胞的方法,包括用编码与真核细胞的基因组DNA互补的RNA的核酸转染真核细胞,用编码与RNA相互作用并且以位点特异性方式切割基因组DNA的酶的核酸转染真核细胞,其中,细胞表达该RNA和该酶,该RNA结合于互补的基因组DNA并且该酶以位点特异性方式切割基因组DNA。根据一个方面,该酶是Cas9或修饰的Cas9或Cas9的同源物。根据一个方面,真核细胞是酵母细胞、植物细胞或哺乳动物细胞。根据一个方面,RNA包括约10至约250个核苷酸。根据一个方面,RNA包括约20至约100个核苷酸。
[0010] 根据一个方面,提供了一种改变人类细胞的方法,包括用编码与真核细胞的基因组DNA互补的RNA的核酸转染人类细胞,用编码与RNA相互作用并且以位点特异性方式切割基因组DNA的酶的核酸转染人类细胞,其中,人类细胞表达该RNA和该酶,该RNA结合于互补的基因组DNA并且该酶以位点特异性方式切割基因组DNA。根据一个方面,该酶是Cas9或修饰的Cas9或Cas9的同源物。根据一个方面,RNA包括约10至约250个核苷酸。根据一个方面,RNA包括约20至约100个核苷酸。
[0011] 根据一个方面,提供了一种在多个基因组DNA位点处改变真核细胞的方法,包括用编码与真核细胞基因组DNA上不同位点互补的RNA的多个核酸转染真核细胞,用编码与RNA相互作用并且以位点特异性方式切割基因组DNA的酶的核酸转染真核细胞,其中,细胞表达该RNA和该酶,该RNA结合于互补的基因组DNA并且该酶以位点特异性方式切割基因组DNA。根据一个方面,该酶是Cas9。根据一个方面,该真核细胞是酵母细胞、植物细胞或哺乳动物细胞。根据一个方面,该RNA包括约10至约250个核苷酸。根据一个方面,该RNA包括约20至约100个核苷酸。

具体实施方式

[0012] 根据一个方面,合成带有C-末端SV40核定位信号的Cas9蛋白的人类密码子最优化版本并将其克隆至哺乳动物表达系统中(图1A和图3A)。因此,图1涉及使用工程化的II型CRISPR系统的人类细胞中的基因组编辑。如图1A所示,在人类细胞中的RNA引导的基因靶向涉及共表达带有C-末端SV40核定位信号的Cas9蛋白与一个或多个由人类U6聚合酶III启动子表达的向导RNA(guide RNA,gRNA)。由gRNA识别靶序列后,Cas9解旋DNA双链体并且切割双链,但只有当正确的原间隔序列邻近基序(前间区序列邻近基序,protospacer adjacent motif,PAM)存在于3'端时。形式GN20GG的任何基因组序列原则上可以是被靶向的。如图1B所示,通过插入终止密码子和来自于AAVS1基因座的68bp基因组片段破坏基因组整合的GFP编码序列。用适当的供体通过同源重组(HR)恢复GFP序+列产生可以由FACS定量的GFP细胞。T1和T2gRNA靶序列在AAVS1片段内。下划线标出用于TAL效应子核酸酶异源二聚体(TALEN)两个一半的结合位点。如图1C所示,条形图描绘了由T1、T2诱导的HR效率,和在靶向位点处的通过FACS测定的TALEN介导的核酸酶活性。下面描述了代表性的FACS图和被靶向的细胞的显微图像(标尺为100微米)。数据是平均值+/-SEM(N=3)。
[0013] 根据一个方面,为了指导Cas9切割感兴趣的序列,由人类U6聚合酶III启动子表达crRNA-tracrRNA融合转录本,以下称为向导RNA(gRNA)。根据一个方面,通过细胞直接转录gRNA。这方面有利地避免重构由细菌的CRISPR系统采用的RNA加工机制(图1A和图3B)(参见参考文献(4,7-9))。根据一个方面,提供了一种用于改变基因组DNA的方法,使用由G和PAM(原间隔序列邻近基序)序列-NGG起始、接着是20bp crRNA靶的U6转录。根据这个方面,靶向基因组位点是以GN20GG的形式(见图3C)。
[0014] 根据一个方面,开发了类似于前面描述的(参见参考文献(10))在293T细胞中的GFP报告子分析(图1B)以测试在这里描述的基因组工程化方法的功能性。根据一个方面,建立了稳定的细胞系,其带有基因组整合的GFP编码序列,该编码序列通过插入终止密码子和来自于AAVS1基因座的68bp基因组片段而中断,其使得表达的蛋白片段无荧光。使用适当的修复供体的同源重组(HR)可以恢复正常GFP序列,其允许通过流式激活细胞分选+(FACS)以定量所产生的GFP细胞。
[0015] 根据一个方面,提供了一种同源重组(HR)的方法。构建了2个gRNA,T1和T2,其靶向插入的AAVS1片段(图1b)。比较了它们与靶向相同区域(参见参考文献(11))的先前描述的TAL效应子核酸酶异源二聚体(TALEN)的gRNA的的活性。使用所有三种靶向性试剂观察到成功的HR事件,连同使用T1和T2gRNA的分别接近3%和8%的基因修正率+(图1C)。这种RNA-介导的编辑过程是特别快速的,其中第一个可检测的GFP细胞在转染后~20小时出现,与AAVS1TALEN的~40小时相比较。仅仅在同时引入修复供体、Cas9蛋白和gRNA后观察到HR,确认所有组分都是基因组编辑所需要的(图4)。虽然没有注意到与Cas9/crRNA表达相关的明显的毒性,但是用ZFN和TALEN的工作已经示出了使仅一条链产生切口(nicking)进一步降低了毒性。因此,测试了Cas9D10A突变体(已知该突变体起体外切口酶的作用),产生了相似的HR但较低的非同源末端连接(NHEJ)率(图5)(参见参考文献(4,5))。与(4)其中示出相关的Cas9蛋白切割PAM的6bp上游两条链)相一致,NHEJ数据证实了大多数缺失或插入发生在靶向序列的3'端(图5B)。还证实了使靶向基因组位点突变阻止gRNA影响在该基因座处的HR,证明CRISPR-介导的基因组编辑是序列特异性的(图6)。已经示出了,在GFP基因中的2个gRNA靶向位点,并且还有来自于DNA甲基转移酶3a(DNMT3a)和DNMT3b基因的同源区域的三个另外的gRNA靶向片段可以序列特异性地诱导在工程化的报告细胞系中的显著HR(图7,图8)。这些结果共同证实在人类细胞中的RNA引导的基因组靶向诱导跨越多个靶向位点的强的HR。
[0016] 根据某些方面,修饰了天然的基因座。将gRNA用于靶向位于染色体19上的PPP1R12C基因中的AAVS1基因座,它在293T、K562和PGP1人类iPS细胞中跨越大多数组织(图2A)广泛表达(参见参考文献(12))并且通过被靶向的基因座的下一代测序分析结果。因此,图2涉及在多种细胞类型中的天然AAVS1基因座的RNA-引导的基因组编辑。如图2A所示,T1(红色)和T2(绿色)gRNA靶向在19号染色体AAVS1基因座内的PPP1R12C基因的内含子中的序列。如图2B所示,提供了通过下一代测序定量的、在表达Cas9和T1或T2gRNA后,在293T、K562和PGP1iPS细胞中由NHEJ引起的缺失的总数和位置。红色和绿色的短划线区分(demarcate)T1和T2gRNA靶向位点的边界。T1和T2gRNA的NHEJ频率在293T中分别是10%和25%,在K562中分别是13%和38%,以及在PGP1iPS细胞中分别是2%和4%。
如图2C所示,描绘了在AAVS1基因座处的用于HR的DNA供体架构(architecture),以及用于检测成功的靶向事件的测序引物(箭头)的位置。如图2D所示,在转染3天后PCR分析证明仅有表达供体、Cas9和T2gRNA的细胞表现出成功的HR事件。如图2E所示,通过PCR扩增子的桑格(Sanger)测序证实成功的HR,该PCR扩增子显示了在基因组供体和供体插入边界处预期的DNA基是存在的。如图2F所示,用嘌呤霉素选择293T细胞的成功地靶向+
克隆持续2周。示出了两种典型的GFP克隆的显微图像(标尺为100微米)。
[0017] 与GFP报告子分析的结果一致,对于所有三种细胞类型,在内源基因座处观察到高数量的NHEJ事件。这两个gRNA T1和T2在293T中分别实现了10和25%的NHEJ率,在K562中分别为13和38%,以及在PGP1-iPS细胞中分别为2和4%(图2B)。在任何这些细胞类型中诱导NHEJ所需的Cas9和crRNA表达没有观察到明显毒性(图9)。如所预期的,对于T1和T2,NHEJ介导的缺失以靶位点位置为中心,进一步验证这个靶向过程的序列特异性(图9、图10、图11)。T1和T2gRNA两者的同时引入产生了干涉19bp片段的高效率缺失(图10),证明使用这个方法,基因组基因座的多重(multiplex)编辑是可行的。
[0018] 根据一个方面,HR用于将dsDNA供体构建体(参见参考文献(13))或寡聚物供体整合进入天然AAVS1基因座(图2C、图12)。使用通过PCR(图2D、图12)和桑格测序(图2E)的两种方法证实HR-介导的整合。使用嘌呤霉素选择超过两周从修饰的细胞池中容易地获取293T或iPS克隆(图2F、图12)。这些结果证明Cas9能够在人类细胞中的内源基因座处有效地整合外源DNA。因此,本公开的一个方面包括使用同源重组和Cas9将外源DNA整合进入细胞的基因组的方法。
[0019] 根据一个方面,提供了一种RNA引导的基因组编辑系统,该系统可以容易地适用于通过简单地修饰gRNA表达载体的序列修饰其他基因组位点以匹配在感兴趣的基因座中的相容序列。根据这个方面,产生靶向在人类基因组中的基因的约40.5%的外显子的190,000个特异性gRNA可靶向的序列。这些靶序列并入与DNA阵列的多重合成相容的
200bp格式(参见参考文献(14))(图13)。根据此方面,提供了在人类基因组中的潜在靶位点的准备好的全基因组参考和用于多重gRNA合成的方法学。
[0020] 根据一个方面,提供了用于在细胞中多重基因组改变的方法,所述方法通过使用在这里描述的一个或多个或多种RNA/酶系统以在多个位置处改变细胞的基因组。根据一个方面,靶位点完美地匹配PAM序列NGG和在gRNA的3'端处的8-12碱基“种子序列”。根据某些方面,不要求剩下的8-12碱基的完美匹配。根据某些方面,Cas9在5'末端处将进行单个错配。根据某些方面,靶标基因座的潜在的染色质结构和表观遗传状态可以影响Cas9功能的效率。根据某些方面,具有较高特异性的Cas9同系物包括为有用的酶。本领域的技术人员将能够识别或工程化合适的Cas9同系物。根据一个方面,CRISPR可靶向的序列包括具有不同的PAM要求(参见参考文献(9))或定向进化的那些。根据一个方面,使Cas9核酸酶结构域中的一个失活增加HR与NHEJ的比率并且可以降低毒性(图3A,图5)(4,5),而使两个结构域失活可以使Cas9能够充当可重定目标(retargetable)DNA结合蛋白。本公开的实施方式在以下中具有广泛效用:合成生物学(参见参考文献(21、22)),基因网络的直接和多重扰动(参见参考文献(13、23))、以及靶向的离体(参见参考文献(24-26))和体内基因治疗(参见参考文献(27))。
[0021] 根据某些方面,提供了一种“可再功能化的(re-engineerable)有机体”作为模型系统用于生物学发现和体内筛选。根据一个方面,提供了带有可诱导的Cas9转基因的“可再功能化的小鼠”,并且靶向多个基因或调节元件的gRNA文库的局部递送(例如,使用腺相关病毒)允许筛选突变,该突变在靶标组织类型中导致肿瘤的发作。使用Cas9同系物或带有效应子结构域的无核酸酶变体(例如活化剂)允许在体内多重激活或抑制基因。根据这个方面,可以筛选使表型成为可能的因子如:组织再生、转分化等。根据某些方面,(a)使用DNA-阵列使得限定的gRNA文库的多重合成成为可能(见图13);和(b)使用大量非病毒或病毒递送方法,包装和递送小尺寸的gRNA(见图3b)。
[0022] 根据一个方面,通过使Cas9核酸酶结构域中的一个失活:或是使与RNA碱基配对的DNA链产生切口或是使其互补序列产生切口,实现了用用于基因组工程化应用的“切口酶”观察到的较低毒性。使两个结构域失活允许Cas9起可重定目标的DNA结合蛋白的作用。根据一个方面,Cas9可重定目标DNA结合蛋白是附着于
[0023] (a)用于调节靶标基因表达的转录激活或抑制结构域,包括但不限于染色质重塑(remodeling)、组蛋白修饰、沉默、隔离(insulation)、与转录机制(machinery)直接相互作用;
[0024] (b)核酸酶结构域如FokI以激活“高度特异性”基因组编辑,视相邻gRNA-Cas9复合物的二聚作用而定;
[0025] (c)用于可视化基因组基因座和染色体动学的荧光蛋白;或
[0026] (d)其他荧光分子,如蛋白质或核酸结合的有机荧光团、量子点、分子信标和回波探针或分子信标替换;
[0027] (e)使得全基因组3D架构的可编程操纵成为可能的多价配体-结合蛋白质结构域。
[0028] 根据一个方面,转录激活和抑制组件可以采用天然或合成垂直的(正交的,orthogonal)CRISPR系统,使得gRNA仅结合至Cas的激活剂或抑制剂类别。这允许一大组gRNA调整(tune)多个靶标。
[0029] 根据某些方面,RNA的使用提供了比mRNA多重的能力,部分是由于较小的尺寸--分别是100对2000个核苷酸的长度。当核酸递送是尺寸受限时(如在病毒包装中)这是特别有价值的。这使得切割、产生切口、激活、或抑制-或它们的组合的多个实例成为可能。容易靶向多个调节靶标的能力允许粗糙调整或精细调整或调节网络而不约束于具体调节因子的天然调节环路下游(例如,在将纤维细胞重新编程为IPSC中使用的4个mRNA)。多重应用的实例包括:
[0030] 1.建立用于人类(或动物)组织/器官移植的(主要的和次要的)组织相容性等位基因、单倍型和基因型。这方面产生例如在HLA纯合细胞系或人类源化的动物品种-或-能够将这样的HLA等位基因叠加(superimposing)至另外希望的细胞系或品种上的一组gRNA。
[0031] 2.在单个细胞(或细胞集合)中的多重顺式调控元件(CRE=用于转录、剪接、翻译、RNA和蛋白质折叠、降解等的信号)突变可以用于有效地研究复合物组的调节性相互作用,其可以发生在正常发展或病理的、合成的或药物的特定情节。根据一个方面,CRE是(或可以被制成)有点互相垂直的(即,低串扰),使得许多可以在一种设置在测试,例如,在昂贵动物胚胎时间系列中。一个示例性应用是用RNA荧光原位测序(FISSeq)。
[0032] 3.CRE突变的多重组合和/或CRE的表观遗传激活或抑制可用于将iPSC或ESC或其他干细胞或非干细胞改变或改编至用于在器官芯片中使用的任何细胞类型或细胞类型的组合,或者为了测试药物(小分子、蛋白质、RNA、细胞、动物、植物或微生物细胞、气溶胶和其他递送方法)、移植策略、个性化策略等目的其他细胞和器官培养物。
[0033] 4.制备多重突变体人类细胞用于在医学遗传学的诊断测试(和/或DNA测序)中使用。就人类基因组等位基因(或表观遗传标记)的染色体位置和结构可以影响临床遗传诊断精确度而言,重要的是具有在参照基因组的正确位置中而不是在异位(又名转基因)位置中或在合成DNA的单独片段中存在的等位基因。一种实施方式是每一个各自诊断人类SNP,或结构变体上的一系列单独的细胞系。可替代地,一种实施方式包括在相同细胞中的多重组的等位基因。在某些情况下,在单独检测的假设下,在一个基因(或多个基因)中的多重变化将是理想的。在其他情况下,等位基因的特定单倍型组合允许测试测序(基因型分析)方法,其精确地建立单倍型相(即,个人或体细胞类型中基因的一个或两个拷贝是否受影响。
[0034] 5.在微生物、植物、动物、或人类细胞中用工程化的Cas+gRNA系统可以靶向重复元件或内源性病毒元件以减少有害转座或帮助测序或其他分析性基因组/转录组/蛋白质组/诊断工具(其中,几乎完全相同的拷贝可能是有问题的)。
[0035] 在上述部分中通过号码识别的以下参考文献,通过引用将其全部内容结合于此。
[0036] 1.B.Wiedenheft,S.H.Sternberg,J.A.Doudna,Nature 482,331(Feb 16,2012).[0037] 2.D.Bhaya,M.Davison,R.Barrangou,Annual review of genetics45,273(2011).
[0038] 3.M.P.Terns,R.M.Terns,Current opinion in microbiology14,321(Jun,2011).
[0039] 4.M.Jinek et al.,Science 337,816(Aug 17,2012).
[0040] 5.G.Gasiunas,R.Barrangou,P.Horvath,V.Siksnys,Proceedings of the National Academy of Sciences of the United States of America 109,E2579(Sep25,2012).
[0041] 6.R.Sapranauskas et al.,Nucleic acids research 39,9275(Nov,2011).[0042] 7.T.R.Brummelkamp,R.Bernards,R.Agami,Science 296,550(Apr 19,2002).[0043] 8.M.Miyagishi,K.Taira,Nature biotechnology 20,497(May,2002).[0044] 9.E.Deltcheva et al.,Nature 471,602(Mar 31,2011).
[0045] 10.J.Zou,P.Mali,X.Huang,S.N.Dowey,L.Cheng,Blood 118,4599(Oct27,2011).
[0046] 11.N.E.Sanjana et al.,Nature protocols 7,171(Jan,2012).[0047] 12.J.H.Lee et al.,PLoS Genet 5,e1000718(Nov,2009).
[0048] 13.D.Hockemeyer et al.,Nature biotechnology 27,851(Sep,2009).[0049] 14.S.Kosuri et al.,Nature biotechnology 28,1295(Dec,2010).[0050] 15.V.Pattanayak,C.L.Ramirez,J.K.Joung,D.R.Liu,Nature methods8,765(Sep,2011).
[0051] 16.N.M.King,O.Cohen-Haguenauer,Molecular therapy:the journal of the American Society of Gene Therapy 16,432(Mar,2008).
[0052] 17.Y.G.Kim,J.Cha,S.Chandrasegaran,Proceedings of the National Academy of Sciences of the United States of America 93,1156(Feb 6,1996).[0053] 18.E.J.Rebar,C.O.Pabo,Science 263,671(Feb 4,1994).
[0054] 19.J.Boch et al.,Science 326,1509(Dec 11,2009).
[0055] 20.M.J.Moscou,A.J.Bogdanove,Science 326,1501(Dec 11,2009).[0056] 21.A.S.Khalil,J.J.Collins,Nature reviews.Genetics 11,367(May,2010).[0057] 22.P.E.Purnick,R.Weiss,Nature reviews.Molecular cell biology10,410(Jun,2009).
[0058] 23.J.Zou et al.,Cell stem cell 5,97(Jul 2,2009).
[0059] 24.N.Holt et al.,Nature biotechnology 28,839(Aug,2010).[0060] 25.F.D.Urnov et al.,Nature 435,646(Jun 2,2005).
[0061] 26.A.Lombardo et al.,Nature biotechnology 25,1298(Nov,2007).[0062] 27.H.Li et al.,Nature 475,217(Jul 14,2011).
[0063] 给出以下实施例作为本公开的代表。这些实施例不应解释为限制本公开的范围,因为考虑到本公开、附图和所附的权利要求,这些和其他等同实施方式将是显而易见的。
[0064] 实施例I
[0065] II型CRISPR-Cas系统
[0066] 根据一个方面,本公开的实施方式利用短RNA来识别外源核酸用于在真核细胞中的核酸酶活性。根据本公开的某些方面,改变真核细胞以将编码一种或多种短RNA和一种或多种核酸酶的核酸包括在其基因组内,该核酸酶通过短RNA与靶标DNA序列的结合而被失活。根据某些方面,可以在细菌或古细菌内识别示例性的短RNA/酶系统,如使用短RNA以指导外源核酸降解的(CRISPR)/CRISPR-相关的(Cas)系统。CRISPR(“规律成簇间隔的短回文重复”)防御涉及:从入侵的病毒或质粒DNA获取新靶标“间隔子”并将其整合至CRISPR基因座,表达和加工由间隔子重复单元组成的短引导性CRISPR RNA(crRNA),以及切割与间隔子互补的核酸(最常见DNA)。
[0067] 通常已知三类CRISPR系统并且被称为I型、II型或III型。根据一个方面,根据本公开切割dsDNA特别有用的酶是单一效应子酶Cas9,通常是II型(参见参考文献(1))。在细菌内,II型效应子系统由从包含间隔子的CRISPR基因座转录的长前-crRNA、多功能Cas9蛋白和对gRNA加工很重要的tracrRNA组成。tracrRNA杂交于使前-crRNA间隔子分离的重复区域,通过内源RNAe III启动dsRNA切割,其接着是通过Cas9在每个间隔子内的第二切割事件,产生保持与tracrRNA和Cas9相关联的成熟crRNA。根据一个方面,通常将本公开的真核细胞工程化以避免使用RNAe III和crRNA加工。参见参考文献(2)。
[0068] 根据一个方面,本公开的酶如Cas9解旋DNA双链体并且搜索匹配crRNA来切割的序列。靶标识别出现于在靶标DNA中的“原间隔序列(protospacer)”序列和在crRNA中的其余间隔子序列之间的互补性检测后。重要的是,只有当正确的原间隔序列邻近基序(PAM)也出现在3'端时Cas9切割DNA。根据某些方面,可以使用不同的原间隔序列邻近基序。例如,化脓性链球菌(S.pyogenes)系统要求NGG序列,其中N可以是任何核苷酸。嗜热链球菌(S.thermophilus)II型系统分别需要NGGNG(参见参考文献(3))和NNAGAAW(参见附图(4)),而不同的变形链球菌(S.mutans)系统容忍NGG或NAAR(见参考文献(5))。生物信息学分析已经产生在各种细菌中的大量的CRISPR基因座数据库,其可以用来识别另外有用的PAM并且扩展CRISPR可靶向序列的组(参见参考文献(6,7))。在嗜热链球菌中,Cas9在原间隔序列3'端之前3bp产生平端双链断裂(参见参考文献(8)),由Cas9蛋白中的两个催化结构域:切割DNA的互补链的HNH结构域和切割非互补链的RuvC样结构域(见图1A和图3)介导的过程。虽然酿脓链球菌系统没有被表征为相同平的精度,但是DSB形成也朝着原间隔序列3'端方向发生。如果两个核酸酶结构域中的一个是失活的,Cas9将在体外(参见参考文献(2))和人类细胞中(见图5)起切口酶的作用。
[0069] 根据一个方面,在真核细胞中,gRNA-指导的Cas9切割的特异性用作用于基因组工程化的机制。根据一个方面,gRNA的杂交不需要为100%以便使酶识别gRNA/DNA杂交体并影响切割。一些脱靶活性可以发生。例如,酿脓链球菌系统容忍体外20bp成熟间隔子序列中的前6个碱基错配。根据一个方面,当潜在的脱靶位点匹配(最后14bp)NGG存在于gRNA的人类参照基因组内时,较高严紧度在体内可能是有利的。总体上在参考文献(9)、(2)、(10)、和(4)中描述错配和酶活性的影响。
[0070] 根据某些方面,可以提高特异性。当干扰对gRNA-DNA杂交体的解链温度敏感时,富含AT的靶序列可以具有较少的脱靶位点。小心地选择靶标部位以避免在基因组中的其他地方具有至少14bp匹配序列的伪位点可以提高特异性。使用需要较长PAM序列的Cas9变体可以降低脱靶位点的频率。定向进化可以将Cas9特异性提高至足以完全排除脱靶活性的水平,理想地需要与最小的PAM匹配的完美的20bp gRNA。因此,对Cas9蛋白的修饰是本公开的代表性实施方式。这样,新方法允许在很短时间内的多轮进化(参见参考文献(11)并且可预见的。在参考文献(12,13)中描述了可用于本公开的CRISPR系统。
[0071] 实施例II
[0072] 质粒构建
[0073] Cas9基因序列是人类密码子优化的并且是通过分级融合PCR组装(hierarchical fusion PCR assembly)从IDT订购的9个500bp gBlocks而组装的。针对用于人类细胞工程化的II型CRISPR系统的图3A示出了cas9基因插入片段的表达形式和全序列。RuvC样和HNH基序,以及C-末端SV40NLS分别通过蓝色、褐色和橙色突出显示。以相似的方法构建Cas9_D10A。将得到的全长产物克隆至pcDNA3.3-TOPO载体(Invitrogen)。靶标gRNA表达构建体作为单独的455bp gBlocks直接购自于IDT,并且或将其克隆至pCR-BluntII-TOPO载体(Invitrogen)中或PCR扩增。图3B示出了基于U6启动子的用于向导RNA的表达方案和预测的RNA转录本二级结构。U6启动子的使用将RNA转录本的第1位置约束为“G”,从而使用这种方法可以靶向形式GN20GG的所有基因组位点。图3C示出了所使用的7个gRNA。
[0074] 通过带有终止密码子和68bp AAVS1片段(或其突变体;见图6)、或来自于DNMT3a和DNMT3b基因组基因座的58bp片段(见图8)的GFP序列的融合PCR组装(组装于来自于Addgene的EGIP慢病毒载体(质粒#26777)中)来构建涉及破碎GFP的用于HR报告子测定的载体。然后将这些慢病毒载体用于建立GFP报告子稳定系。使用在(14)中描述的方案构建在本研究中使用的TALEN。本研究中开发的所有DNA试剂获得自Addgene。
[0075] 实施例III
[0076] 细胞培养
[0077] 在mTeSR1(Stemcell Technologies)的Matrigel(BD Biosciences)-涂敷的板中维持PGP1iPS细胞。用TrypLE Express(Invitrogen)每5-7d传代培养物。K562细胞生长并维持在含有15%FBS的RPMI(Invitrogen)中。HEK 293T细胞培养在Dulbecco's改良的Eagle's培养基(DMEM,Invitrogen)高葡萄糖补充有10%胎血清(FBS,Invitrogen)、青霉素/链霉素(pen/strep,Invitrogen)和非必需基酸(NEAA,Invitrogen)。在湿度培养箱中在37℃和5%CO2下维持所有细胞。
[0078] 实施例IV
[0079] PGP1iPS、K562和293T的基因靶向
[0080] 在核转染之前,在Rho激酶(ROCK)抑制剂(Calbiochem)中培养PGP1iPS细胞2h。使用TrypLE Express(Invitrogen)收获细胞并且在具有1μg Cas9质粒、1μg gRNA和/或
6
1μg DNA供体质粒的P3试剂(Lonza)中重悬2×10个细胞,并根据厂商的说明书(Lonza)核转染。随后在补充有ROCK抑制剂的mTeSR1培养基中,在mTeSR1-涂敷的板上铺细胞最初24小时。对于K562,在具有1μg Cas9质粒、1μg gRNA和/或1μg DNA供体质粒的SF
6
试剂(Lonza)中重悬2×10个细胞,并根据厂商的说明书(Lonza)核转染。对于293T,按照厂商的方案使用Lipofectamine 2000用1μg Cas9质粒、1μg gRNA和/或1μg DNA供
6
体质粒转染0.1×10个细胞。用于内源AAVS1靶向的DNA供体是dsDNA供体(图2C)或
90mer寡核苷酸。前者具有侧翼短同源臂和SA-2A-嘌呤霉素-CaGGS-eGFP盒以富集成功靶向的细胞。
[0081] 以下评价靶向效率。在核转染后3天收获细胞,并且使用prepGEM(ZyGEM)提取~6
1×10个细胞的基因组DNA。引导PCR以扩增具有源自细胞的基因组DNA的靶向区域并且通过具有覆盖>200,000读取的MiSeq Personal Sequencer(Illumina)深度测序扩增子。
分析测序数据以评估NHEJ效率。分析的参照AAVS1序列是:
[0082] CACTTCAGGACAGCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCACCTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTATCTGTCCCCTCCACCCCACAGTGGGGCCACTAGGGACAGGATTGGTGACAGAAAAGCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATATTGGGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACACACCCCCATTTCCTGGA
[0083] 用于扩增人类基因组中的靶向区域的PCR引物是:
[0084] AAVS1-R
[0085] CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTacaggaggtgggggttagac
[0086] AAVS1-F.1
[0087] ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATtatattcccagggccggtta[0088] AAVS1-F.2
[0089] ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGtatattcccagggccggtta[0090] AAVS1-F.3
[0091] ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAAtatattcccagggccggtta[0092] AAVS1-F.4
[0093] ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCAtatattcccagggccggtta[0094] AAVS1-F.5
[0095] ACACTCTTTCCCTACACGACGCTCTTCCGATCTCACTGTtatattcccagggccggtta[0096] AAVS1-F.6
[0097] ACACTCTTTCCCTACACGACGCTCTTCCGATCTATTGGCtatattcccagggccggtta[0098] AAVS1-F.7
[0099] ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATCTGtatattcccagggccggtta[0100] AAVS1-F.8
[0101] ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCAAGTtatattcccagggccggtta[0102] AAVS1-F.9
[0103] ACACTCTTTCCCTACACGACGCTCTTCCGATCTCTGATCtatattcccagggccggtta[0104] AAVS1-F.10
[0105] ACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGCTAtatattcccagggccggtta[0106] AAVS1-F.11
[0107] ACACTCTTTCCCTACACGACGCTCTTCCGATCTGTAGCCtatattcccagggccggtta[0108] AAVS1-F.12
[0109] ACACTCTTTCCCTACACGACGCTCTTCCGATCTTACAAGtatattcccagggccggtta[0110] 为了分析在图2C中的使用DNA供体的HR事件,使用的引物是:
[0111] HR_AAVS1-F CTGCCGTCTCTCTCCTGAGT
[0112] HR_Puro-R GTGGGCTTGTACTCGGTCAT
[0113] 实施例V
[0114] 用于计算人类外显子CRISPR靶标的生物信息学方法和用于它们的多重合成的方法
[0115] 如下确定最大地靶向在人类外显子中的特定位置但是最小地靶向在基因组中的其他位置的一组gRNA基因序列。根据一个方面,通过23nt序列(最5'端的20nt精确互补所需位置,而三个最3'端的碱基必须是NGG的形式)实现了通过gRNA的最大有效靶向。另外,最5'端的nt必须是G以建立pol-III转录起始位点。然而,根据(2),只要最后14nt正常配对,针对20bp gRNA基因组靶标的20bp gRNA的六个最5'端的nt的错配不消除Cas9-介导的切割,但是沿着最后12nt配对的八个最5'端的nt的错配消除Cas9-介导的切割,而七个最5'端的错配和13个3'对没有被测试。关于脱靶效应保守的一个条件是,7个最5'端错配的情况(类似于6个的情况)允许切割,从而最3'端的13nt的配对足以进行切割。为了识别在应当是可切割的而没有脱靶切口的人类外显子内的CRISPR靶位点,检查形式5'-GBBBB BBBBB BBBBB BBBBB NGG-3'(形式1)的所有23bp序列,其中B代表在外显子位置处的碱基,对于其,没有形式5'-NNNNN NNBBB BBBBB BBBBB NGG-3′(形式2)的序列存在于人类基因组中的任何其他位置处。具体地,(i)下载来自于UCSC基因组浏览器(15-17)的GRCh37/hg19人类基因组的所有RefSeq基因的编码区域位置的BED文件。在该BED文件中的编码外显子位置包括一组在hg19基因组中的RefSeq mRNA登录号的346089映射。然而,一些RefSeq mRNA登录号映射于多个基因组位置(可能的基因重复),并且许多登录号映射于相同组的外显子位置的子集(相同基因的多种同种型)。为了明显区分重复的基因实例并且巩固通过多个RefSeq同种型登录号的相同基因组外显子实例的多个参考,(ii)添加唯一的数字后缀至具有多个基因组位置的705RefSeq登录号,并且(iii)将BEDTools(18)(v2.16.2-zip-87e3926)的mergeBed功能用于巩固重叠外显子位置至合并的外显子区。这些步骤降低最初设置的346089RefSeq外显子位置至192783不同基因组片段。使用UCSC Table Browser下载所有合并的外显子区域的hg19序列,在每一端上添加
20bp衬垫(填补物,padding)。(iv)使用定制的perl代码,在这种外显子序列内识别形式
1的1657793个实例。(v)随后针对形式2的脱靶发生的存在,过滤这些序列:对于每个合并的外显子形式1靶标,提取最3'端的13bp特异性(B)“核心”序列并且,对于每个核心产生的四个16bp序列5'-BBB BBBBB BBBBB NGG-3'(N=A,C,G和T),并且使用Bowtie版本
0.12.8(19)使用参数-116–v 0–k 2搜索整个hg19基因组用于精确匹配至这些6631172序列。拒绝存在不止一个匹配的任何外显子靶位点。注意,因为由序列NGG紧接的任何具体的13bp核心序列仅赋予平均15bp的特异性,在随机~3Gb序列(两条链)中应该存在与延伸的核心序列平均~5.6匹配。因此,拒绝1657793个最初识别的靶标中的大部分;然而
189864个序列通过这个过滤。这些包括在人类基因组中的CRISPR可靶向的外显子位置的组。在78028个合并的外显子区(占192783个合并的人类外显子区总数的~40.5%)中的189864个序列靶标位置,处于每个靶向外显子区域~2.4个位点的多重性。为了评估在基因水平下的靶向,聚簇(cluster)Ref Seq mRNA映射,使得任何两个重叠合并的外显子区域的RefSeq登录号(包括在(ii)中区分的基因重复)被计数为单一基因簇,189864个外显子特异性CRISPR位点靶向18872个基因簇中的17104个(所有基因簇中的~90.6%)每个靶向基因簇~11.1的多重性。(注意,尽管这些基因簇将表示单个转录基因的多种同种型的RefSeq mRNA登录号折叠(collapse)成为单个实体,它们也会折叠重叠的不同基因以及具有反义转录本的基因。)在原始RefSeq登录号水平,在总共43726个映射的RefSeq登录号(包括区别的基因重复)中的30563个(~69.9%)中的189864个序列靶向的外显子区域在每个靶向的映射的RefSeq登录号有~6.2位点的多重性。
[0116] 根据一个方面,通过将性能与因子(如碱基组成和两个gRNA的二级结构和基因组靶标(20,21),以及人类细胞系(对于其可获得该信息)中的这些靶标的表观遗传学状态(22))相关联可以提炼数据库。
[0117] 实施例VI
[0118] 多重合成
[0119] 将靶序列合并至200bp格式,该格式对于在DNA阵列上的多重合成是相容的(23,24)。根据一个方面,本方法允许从基于DNA阵列的寡核苷酸池靶向的取回(retrieval)的具体的gRNA序列或gRNA序列的池以及其快速克隆成共同表达载体(图13A)。具体地,合成来自于CustomArray Inc.的12k寡核苷酸池。此外,成功地取回来自于该文库的gRNA选择(图13B)。我们观察到每1000bp合成的DNA~4个突变的出错率。
[0120] 实施例VII
[0121] RNA引导的基因组编辑需要Cas9和向导RNA用于成功靶向
[0122] 使用描述于图1B的GFP报告子测定,针对成功地完成HR(在293T中)的能力检测修复DNA供体、Cas9蛋白和gRNA的所有可能组合。如图4所示,仅当所有3个组分存在时观察到GFP+细胞,证实这些CRISPR组件对于RNA引导的基因组编辑是必需的。数据是平均值+/-SEM(N=3)。
[0123] 实施例VIII
[0124] gRNA和Cas9介导的基因组编辑的分析
[0125] 使用(A)如前所述的、其结果示于图5A的GFP报告子测定,和(B)深度测序被靶向的基因座(在293T中)检查CRISPR介导的基因组编辑过程,其结果在图5B中示出。作为比较,测试Cas9的D10A突变,在较早报道中已经显示出该突变在体外试验中起切口酶的作用。如图5所示,Cas9和Cas9D10A两者可以以几乎相同的速率成功地完成HR。然而,深度测序确认了尽管Cas9在靶向的基因座处示出了强的NHEJ,D10A突变具有显著减小的NHEJ率(从其推定的仅使DNA产生切口的能力可预期的)。此外,与已知的Cas9蛋白生物化学相一致,NHEJ数据证实大多数碱基对缺失或插入发生在靶序列的3'端附近:最高峰是PAM位点的~3-4碱基上游,具有~9-10bp中值缺失频率。数据是平均值+/-SEM(N=3)。
[0126] 实施例IX
[0127] RNA引导的基因组编辑是靶序列特异性的
[0128] 类似于在图1B中描述的GFP报告子测定,开发各自带有不同的GFP报告子构建体的3个293T稳定系。通过AAVS1片段插入的序列区分这些(如图6中所示)。一个系携带野生型片段,而另外两个系在6bp处突变(以红色突出显示)。随后通过以下4种试剂中的一种靶向每个系:GFP-ZFN对,其可以靶向所有细胞类型因为其靶向的序列是在侧翼GFP片段中并且因此与细胞系一起(along)存在;AAVS1TALEN,其仅可以有效地靶向wt-AAVS1片段因为在另外两个系中的突变应该使得剩下的(left)TALEN不能结合它们的位点;T1gRNA,其还可以有效地靶向仅wt-AAVS1片段,因为在两个突变系中它的靶位点也被破坏;以及最后地T2gRNA,其应该能够靶向所有3种细胞系因为,不像T1gRNA,其靶位点在3个系之间是未改变的。ZFN修饰所有3种细胞类型,AAVS1TALEN和T1gRNA仅仅靶向wt-AAVS1细胞类型,而T2gRNA成功地靶向所有3种细胞类型。这些结果一起证实,向导RNA介导的编辑是靶序列特异性的。数据是平均值+/-SEM(N=3)。
[0129] 实施例X
[0130] 靶向至GFP序列的向导RNA使得强基因组编辑成为可能
[0131] 除了靶向AAVS1插入的2种gRNA之外,测试了在图1B(在293T中)中描述的靶向报告子的侧翼GFP序列的两种另外的gRNA。如图7所示,这些gRNA在这个工程化的基因座处也能够实现强的HR。数据是平均值+/-SEM(N=3)。
[0132] 实施例XI
[0133] RNA引导的基因组编辑是靶序列特异性的,并且显示与ZFN或TALEN类似的靶向效率
[0134] 类似于在图1B中描述的GFP报告子测定,开发各自带有不同的GFP受体构建体的两个293T稳定系。通过片段插入序列区分这些(如图8所示)。一个系携带来自于DNMT3a基因的58bp片段而另一个系带有来自于DNMT3b基因的同源58bp片段。以红色突出显示序列差异。随后通过以下6种试剂中的一种靶向每个系:GFP-ZFN对,可以靶向所有细胞类型,因为其靶向的序列是在侧翼GFP片段中并且因此与细胞系一起存在;一对TALEN,其潜在靶向DNMT3a或DNMT3b片段;一对gRNA,其仅仅可以潜在地靶向DNMT3a片段;并且最后地gRNA,其应该仅仅潜在地靶向DNMT3b片段。如图8所示,ZFN修饰所有3种细胞类型,并且TALEN和gRNA仅其相应各自靶标。此外,跨6种靶向试剂,靶向效率是可比较的。这些结果一起证实RNA-引导的编辑是靶序列特异性的并且显示与ZFN或TALEN相类似的靶向效率。数据是平均值+/-SEM(N=3)。
[0135] 实施例XII
[0136] 人类iPS细胞中RNA引导的NHEJ
[0137] 用在图9的左图片中示出的构建体核转染人类iPS细胞(PGP1)。在核转染4天后,通过深度测序通过评估在双链断裂(DSB)处的基因组缺失和插入率测量NHEJ率。图片1:在靶向区域处检测的缺失率。红色虚线:T1RNA靶向位点的边界;绿色虚线:T2RNA靶向位点的边界。以黑线绘制在每个核苷酸位置处的缺失发生并且计算做为携带缺失的读取的百分比的缺失率。图片2:在靶向区域处检测的插入率。红色虚线:T1RNA靶向位点的边界;
绿色虚线:T2RNA靶向位点的边界。以黑线绘制在那里检测到首次插入连接的基因组位置处的插入发生率并且计算做为携带插入的读取的百分比的插入率。图片3:缺失尺寸分布。
绘制在整个NHEJ群体中不同尺寸缺失的频率。图片4:插入尺寸分布。绘制在整个NHEJ群体中不同尺寸插入的频率。通过两个gRNA的iPS靶向是有效的(2-4%)、序列特异性的(如通过在NHEJ缺失分配位置中的移位所示),并且再次肯定图4的结果,基于NGS的分析也示出了Cas9蛋白和gRNA在靶标基因座处对于NHEJ事件是必需的。
[0138] 实施例XIII
[0139] K562细胞中RNA引导的NHEJ
[0140] 用在图10的左图片中示出的构建体核转染K562细胞。在核转染4天后,通过深度测序通过评估在DSB处的基因组缺失和插入率测量NHEJ率。图片1:在靶向区域处检测的缺失率。红色虚线:T1RNA靶向位点的边界;绿色虚线:T2RNA靶向位点的边界。以黑线绘制在每个核苷酸位置处的缺失发生并且计算做为携带缺失的读取的百分比的缺失率。图片2:在靶向区域处检测的插入率。红色虚线:T1RNA靶向位点的边界;绿色虚线:T2RNA靶向位点的边界。以黑线绘制在那里检测到首次插入连接的基因组位置处的插入发生率并且计算做为携带插入的读取的百分比的插入率。图片3:缺失尺寸分布。绘制在整个NHEJ群体中不同尺寸缺失的频率。图片4:插入尺寸分布。绘制在整个NHEJ群体中不同尺寸插入的频率。通过两个gRNA的K562靶向是有效的(13-38%)和序列特异性的(如通过在NHEJ缺失分配位置中的移位所示)。重要的是,正如通过在观察到的缺失尺寸频率直方图中的峰所显示的,同时引入T1和T2向导RNA导致干扰性19bp片段的高效率缺失,表明使用该方法,基因组基因座的多重编辑也是方便的。
[0141] 实施例XIV
[0142] 293T细胞中RNA引导的NHEJ
[0143] 用在图11的左图片中示出的构建体转染293T细胞。在核转染4天后,通过深度测序通过评估在DSB处的基因组缺失和插入率测量NHEJ率。图片1:在靶向区域处检测的缺失率。红色虚线:T1RNA靶向位点的边界;绿色虚线:T2RNA靶向位点的边界。以黑线绘制在每个核苷酸位置处的缺失发生并且计算做为携带缺失的读取的百分比的缺失率。图片2:在靶向区域处检测的插入率。红色虚线:T1RNA靶向位点的边界;绿色虚线:T2RNA靶向位点的边界。以黑线绘制在那里检测到首次插入连接的基因组位置处的插入发生率并且计算做为携带插入的读取的百分比的插入率。图片3:缺失尺寸分布。绘制在整个NHEJ群体中不同尺寸缺失的频率。图片4:插入尺寸分布。绘制在整个NHEJ群体中不同尺寸插入的频率。通过两个gRNA的293T靶向是有效的(10-24%)和序列特异性的(如通过在NHEJ缺失分配位置中的移位所示)。
[0144] 实施例XV
[0145] 使用dsDNA供体或短的寡核苷酸供体在内源AAVS1基因座处的HR
[0146] 如图12A所示,PCR筛选(参照图2C)确认21/24个随机挑取的293T克隆被成功靶向。如图12B所示,类似的PCR筛选确认3/7个随机挑取的PGP1-iPS克隆被成功靶向。如图12C所示,短90mer寡核苷酸在内源性AAVS1基因座处也可以获得强靶向(在此处示出K562细胞)。
[0147] 实施例XVI
[0148] 在人类基因组中向导RNA靶向基因的多重合成、取回和U6表达载体克隆的方法[0149] 产生靶向~40.5%的在人类基因组中的基因所有外显子的约190k生物信息计算的唯一gRNA位点的资源。如图13A所示,将gRNA靶位点合并至200bp格式,该格式对于在DNA阵列上的多重合成是相容的。具体而言,该设计允许(i)靶向的取回来自于DNA阵列寡核苷酸池的具体的gRNA靶标或gRNA靶标的池(通过如图中示意性所示的3轮连续的嵌套PCR);和(ii)快速克隆成共同的表达载体,其在使用AflII位点充当gRNA插入片段的Gibson组件介导的并入的接收者的线性化后。如图13B所示,该方法用于完成从通过CustomArray Inc合成的12k寡核苷酸库中靶向取回10个唯一的gRNA。
[0150] 实施例XVII
[0151] CRISPR介导的RNA-引导的转录激活
[0152] CRISPR-Cas系统具有在细菌中的适应性免疫防御系统和“切割”入侵的核酸的功能。根据一个方面,工程化CRISPR-CAS系统以在人类细胞中起作用,并且“切割”基因组DNA。这是通过将Cas9蛋白质(其具有核酸酶功能)引导至与在向导RNA中的间隔子互补的靶序列的短向导RNA实现的。‘切割’DNA的能力使得许多与基因组编辑相关的应用以及靶向的基因组调节成为可能。对于这一点,突变Cas9蛋白质以通过引入突变使其无核酸2+
酶,预测该突变取消与Mg (已知,它对于RuvC-样和HNH-样核酸酶结构域的功能是重要的)的结合:具体地,引入D10A、D839A、H840A和N863A突变的组合。将如此产生的Cas9无核酸酶蛋白质(正如通过测序分析通过其无法切割DNA的能力所证实的)并且在下文中称之为Cas9R-H-,随后结合至转录激活结构域(这里是VP64),使得CRISPR-cas系统能够以起RNA引导的转录因子的作用(见图14)。Cas9R-H-+VP64融合使得在所示的两个报告子处的RNA-引导的转录激活成为可能。具体地,FACS分析和免疫荧光成像均证明了该蛋白使得gRNA能够序列特异性靶向相应报告子,并且此外,正如通过表达dTomato荧光蛋白评估的,所得到的转录激活是在与通过传统的TALE-VP64融合蛋白诱导的那些相类似的水平。
[0153] 实施例XVIII
[0154] gRNA序列柔性及其应用
[0155] 通过系统地测定在gRNA的5′、中间和3′部分上的随机序列插入的范围,确定gRNA骨架序列至设计的序列插入的柔性:具体地,在gRNA序列中在gRNA的5′端、中间和3′端处制造1bp、5bp、10bp、20bp、和40bp插入物(插入的确切位置在图15中以“红色”突出)。随后通过gRNA在GFP报告子测定中诱导HR的能力,对该gRNA进行功能性测试(如本文所述)。显然,gRNA对5'和3'端处的序列插入是柔性的(正如通过保留的HR诱导活性测定的)。因此,本公开的方面涉及连接小分子反应性RNA适体,该适体可以引发gRNA活性的开始,或gRNA可视化。另外,本公开的方面涉及经由杂交将ssDNA供体束缚至gRNA,因此使得基因组靶标切割并且立即自然定位修复模板成为可能,其可以在容易出现错误的非同源末端连接处促进同源重组率。
[0156] 在实施例部分中通过数字确定的以下参考文献,通过引用将其全部内容结合于此用于所有目的。
[0157] 参考文献
[0158] 1.K.S.Makarova et al.,Evolution and classification of the CRISPR-Cas[0159] systems.Nature reviews.Microbiology 9,467(Jun,2011).
[0160] 2.M.Jinek et al.,A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337,816(Aug 17,2012).
[0161] 3.P.Horvath,R.Barrangou,CRISPR/Cas,the immune system of bacteria[0162] and archaea.Science 327,167(Jan 8,2010).
[0163] 4.H.Deveau et al.,Phage response to CRISPR-encoded resistance in[0164] Streptococcus thermophilus.Journal of bacteriology 190,1390(Feb,2008).[0165] 5.J.R.van der Ploeg,Analysis of CRISPR in Streptococcus mutans suggests frequent occurrence of acquired immunity against infection by M102-like[0166] bacteriophages.Microbiology 155,1966(Jun,2009).
[0167] 6.M.Rho,Y.W.Wu,H.Tang,T.G.Doak,Y.Ye,Diverse CRISPRs
[0168] evolving in human microbiomes.PLoS genetics 8,e1002441(2012).[0169] 7.D.T.Pride et al.,Analysis of streptococcal CRISPRs from human saliva reveals substantial sequence diversity within and between subjects over time.Genome research 21,126(Jan,2011).
[0170] 8.G.Gasiunas,R.Barrangou,P.Horvath,V.Siksnys,Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria.Proceedings of the National Academy of Sciences of the United States of America 109,E2579(Sep 25,2012).
[0171] 9.R.Sapranauskas et al.,The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli.Nucleic acids research39,9275(Nov,2011).
[0172] 10.J.E.Garneau et al.,The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA.Nature 468,67(Nov 4,2010).
[0173] 11.K.M.Esvelt,J.C.Carlson,D.R.Liu,A system for the continuous directed evolution of biomolecules.Nature 472,499(Apr 28,2011).
[0174] 12.R.Barrangou,P.Horvath,CRISPR:new horizons in phage resistance and strain identification.Annual review of food science and technology3,143(2012).
[0175] 13.B.Wiedenheft,S.H.Sternberg,J.A.Doudna,RNA-guided genetic silencing systems in bacteria and archaea.Nature 482,331(Feb 16,2012).
[0176] 14.N.E.Sanjana et al.,A transcription activator-like effector toolbox for genome engineering.Nature protocols 7,171(Jan,2012).
[0177] 15.W.J.Kent et al.,The human genome browser at UCSC.Genome Res12,996(Jun,2002).
[0178] 16.T.R.Dreszer et al.,The UCSC Genome Browser database:extensions and updates 2011.Nucleic Acids Res 40,D918(Jan,2012).
[0179] 17.D.Karolchik et al.,The UCSC Table Browser data retrieval tool.Nucleic Acids Res 32,D493(Jan 1,2004).
[0180] 18.A.R.Quinlan,I.M.Hall,BEDTools:a flexible suite of utilities for comparing genomic features.Bioinformatics 26,841(Mar 15,2010).
[0181] 19.B.Langmead,C.Trapnell,M.Pop,S.L.Salzberg,Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.Genome Biol 10,R25(2009).
[0182] 20.R.Lorenz et al.,ViennaRNA Package 2.0.Algorithms for molecular biology:AMB 6,26(2011).
[0183] 21.D.H.Mathews,J.Sabina,M.Zuker,D.H.Turner,Expanded sequence dependence of thermodynamic parameters improves prediction of RNA secondary structure.Journal of molecular biology 288,911(May 21,1999).
[0184] 22.R.E.Thurman et al.,The accessible chromatin landscape of the human genome.Nature 489,75(Sep 6,2012).
[0185] 23.S.Kosuri et al.,Scalable gene synthesis by selective amplification of DNA pools from high-fidelity microchips.Nature biotechnology28,1295(Dec,2010).
[0186] 24.Q.Xu,M.R.Schlabach,G.J.Hannon,S.J.Elledge,Design of240,000orthogonal 25mer DNA barcode probes.Proceedings of the National Academy of Sciences of the United States of America 106,2289(Feb 17,2009)。
QQ群二维码
意见反馈