首页 / 专利库 / 制造过程 / 原型 / 用于序列操纵的优化的CRISPR-CAS双切口酶系统、方法以及组合物

用于序列操纵的优化的CRISPR-CAS双切口酶系统、方法以及组合物

阅读:377发布:2022-10-09

专利汇可以提供用于序列操纵的优化的CRISPR-CAS双切口酶系统、方法以及组合物专利检索,专利查询,专利分析的服务。并且本 发明 提供了用于操纵靶序列的序列和/或活性的系统、方法、和组合物的递送、工程化和优化。提供了载体和载体系统、以及用于设计和使用此类载体的方法,其中这些载体和载体系统中的一些编码CRISPR复合物的一种或多种组分。还提供了在原核和真核细胞中引导CRISPR复合物形成以确保增强的靶标识别特异性并避免毒性的方法。,下面是用于序列操纵的优化的CRISPR-CAS双切口酶系统、方法以及组合物专利的具体信息内容。

1.一种通过对在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列进行操纵而使脱靶修饰最小化来修饰生物或非人类生物的方法,该方法包括递送非天然存在的或工程化的组合物,该组合物包含:
I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列,
II.第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列,以及
III.编码CRISPR酶的多核苷酸序列,该CRISPR酶包含至少一个或多个核定位序列并且包含一个或多个突变,
其中(a)、(b)和(c)以5’到3’方向排列,
其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和该第二tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,并且
其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导双链断裂,由此通过使脱靶修饰最小化来修饰该生物或该非人类生物。
2.如权利要求1所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生
5’突出端。
3.如权利要求2所述的方法,其中该5’突出端是至多200个基对。
4.如权利要求2所述的方法,其中该5’突出端是至多100个碱基对。
5.如权利要求2所述的方法,其中该5’突出端是至多50个碱基对。
6.如权利要求2所述的方法,其中该5’突出端是至少26个碱基对。
7.如权利要求2所述的方法,其中该5’突出端是至少30个碱基对。
8.如权利要求2所述的方法,其中该5’突出端是34-50个碱基对。
9.如权利要求2所述的方法,其中该5’突出端是至少15个碱基对。
10.如权利要求2所述的方法,其中该5’突出端是至少10个碱基对。
11.如权利要求2所述的方法,其中该5’突出端是至少1个碱基对。
12.如权利要求2所述的方法,其中该5’突出端是1-34个碱基对。
13.如权利要求1所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生钝切口。
14.如权利要求1所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生3’突出端。
15.如权利要求14所述的方法,其中该3’突出端是至多150个碱基对。
16.如权利要求14所述的方法,其中该3’突出端是至多100个碱基对。
17.如权利要求14所述的方法,其中该3’突出端是至多50个碱基对。
18.如权利要求14所述的方法,其中该3’突出端是至多25个碱基对。
19.如权利要求14所述的方法,其中该3’突出端是至少15个碱基对。
20.如权利要求14所述的方法,其中该3’突出端是至少10个碱基对。
21.如权利要求14所述的方法,其中该3’突出端是至少1个碱基对。
22.如权利要求14所述的方法,其中该3’突出端是1-100个碱基对。
23.如权利要求1所述的方法,其中编码该CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA。
24.如权利要求1所述的方法,其中包含编码该CRISPR酶的序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列的多核苷酸是RNA,并且是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。
25.如权利要求1所述的方法,其中该第一tracr配对序列和第二tracr配对序列共享
100%的一致性。
26.如权利要求1所述的方法,其中该第一tracr序列和第二tracr序列共享100%的一致性。
27.如权利要求1所述的方法,其中该CRISPR酶是Cas9酶。
28.如权利要求27所述的方法,其中该CRISPR酶是SpCas9。
29.如权利要求28所述的方法,其中该CRISPR酶在催化结构域中包含一个或多个突变。
30.如权利要求29所述的方法,其中该一个或多个突变是在RuvC结构域中。
31.如权利要求30所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
32.如权利要求31所述的方法,其中该CRISPR酶具有D10A突变。
33.如权利要求29所述的方法,其中该一个或多个突变是在HNH结构域中。
34.如权利要求33所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
35.如权利要求34所述的方法,其中该CRISPR酶具有H840A突变。
36.一种通过对在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列进行操纵而使脱靶修饰最小化来修饰生物或非人类生物的方法,该方法包括
递送非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含
I.第一调节元件,该第一调节元件可操作地连接至
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,和
(b)至少一种或多种tracr配对序列,
II.第二调节元件,该第二调节元件可操作地连接至
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,和
(b)至少一种或多种tracr配对序列,
III.第三调节元件,该第三调节元件可操作地连接至编码CRISPR酶的酶编码序列,以及
IV.第四调节元件,该第四调节元件可操作地连接至tracr序列,
其中组分I、II、III和IV位于该系统的相同或不同载体上,
在转录时,该tracr配对序列杂交到该tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,
其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,
其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,
其中编码CRISPR酶的多核苷酸序列是DNA或RNA,并且
其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导双链断裂,由此通过使脱靶修饰最小化来修饰该生物或该非人类生物。
37.如权利要求36所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’突出端。
38.如权利要求37所述的方法,其中该5’突出端是至多200个碱基对。
39.如权利要求37所述的方法,其中该5’突出端是至多100个碱基对。
40.如权利要求37所述的方法,其中该5’突出端是至多50个碱基对。
41.如权利要求37所述的方法,其中该5’突出端是至少26个碱基对。
42.如权利要求37所述的方法,其中该5’突出端是至少30个碱基对。
43.如权利要求37所述的方法,其中该5’突出端是34-50个碱基对。
44.如权利要求37所述的方法,其中该5’突出端是至少15个碱基对。
45.如权利要求37所述的方法,其中该5’突出端是至少10个碱基对。
46.如权利要求37所述的方法,其中该5’突出端是至少1个碱基对。
47.如权利要求37所述的方法,其中该5’突出端是1-34个碱基对。
48.如权利要求36所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生钝切口。
49.如权利要求36所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生3’突出端。
50.如权利要求49所述的方法,其中该3’突出端是至多150个碱基对。
51.如权利要求49所述的方法,其中该3’突出端是至多100个碱基对。
52.如权利要求49所述的方法,其中该3’突出端是至多50个碱基对。
53.如权利要求49所述的方法,其中该3’突出端是至多25个碱基对。
54.如权利要求49所述的方法,其中该3’突出端是至少15个碱基对。
55.如权利要求49所述的方法,其中该3’突出端是至少10个碱基对。
56.如权利要求49所述的方法,其中该3’突出端是至少1个碱基对。
57.如权利要求49所述的方法,其中该3’突出端是1-100个碱基对。
58.如权利要求36所述的方法,其中编码该CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA。
59.如权利要求36所述的方法,其中该第一tracr配对序列和第二tracr配对序列共享
100%的一致性。
60.如权利要求36所述的方法,其中该第一tracr序列和第二tracr序列共享100%的一致性。
61.如权利要求36所述的方法,其中该CRISPR酶是Cas9酶。
62.如权利要求61所述的方法,其中该CRISPR酶是SpCas9。
63.如权利要求62所述的方法,其中该CRISPR酶在催化结构域中包含一个或多个突变。
64.如权利要求63所述的方法,其中该一个或多个突变是在RuvC结构域中。
65.如权利要求64所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
66.如权利要求65所述的方法,其中该CRISPR酶具有D10A突变。
67.如权利要求63所述的方法,其中该一个或多个突变是在HNH结构域中。
68.如权利要求67所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
69.如权利要求68所述的方法,其中该CRISPR酶具有H840A突变。
70.如权利要求36所述的方法,其中这些病毒载体的一种或多种经由纳米粒子、外泌体、微囊泡、或基因枪进行递送。
71.一种通过借助于向含有和表达编码基因产物的双链DNA分子的细胞中引入工程化的、非天然存在的CRISPR-Cas系统使脱靶修饰最小化而修饰感兴趣的基因组座位的方法,该CRISPR-Cas系统包含具有一个或多个突变的Cas蛋白和两个分别靶向该DNA分子的第一链和第二链的指导RNA,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。
72.如权利要求71所述的方法,其中该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口从而产生5’突出端。
73.如权利要求71所述的方法,其中该5’突出端是至多200个碱基对。
74.如权利要求71所述的方法,其中该5’突出端是至多100个碱基对。
75.如权利要求71所述的方法,其中该5’突出端是至多50个碱基对。
76.如权利要求71所述的方法,其中该5’突出端是至少26个碱基对。
77.如权利要求71所述的方法,其中该5’突出端是至少30个碱基对。
78.如权利要求71所述的方法,其中该5’突出端是34-50个碱基对。
79.如权利要求71所述的方法,其中该5’突出端是至少15个碱基对。
80.如权利要求71所述的方法,其中该5’突出端是至少10个碱基对。
81.如权利要求71所述的方法,其中该5’突出端是至少1个碱基对。
82.如权利要求71所述的方法,其中该5’突出端是1-34个碱基对。
83.如权利要求71所述的方法,其中该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口从而产生钝切口。
84.如权利要求71所述的方法,其中该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口从而产生3’突出端。
85.如权利要求84所述的方法,其中该3’突出端是至多150个碱基对。
86.如权利要求84所述的方法,其中该3’突出端是至多100个碱基对。
87.如权利要求84所述的方法,其中该3’突出端是至多50个碱基对。
88.如权利要求84所述的方法,其中该3’突出端是至多25个碱基对。
89.如权利要求84所述的方法,其中该3’突出端是至少15个碱基对。
90.如权利要求84所述的方法,其中该3’突出端是至少10个碱基对。
91.如权利要求84所述的方法,其中该3’突出端是至少1个碱基对。
92.如权利要求84所述的方法,其中该3’突出端是1-100个碱基对。
93.如权利要求71所述的方法,其中这些指导RNA包括融合到tracr配对序列和tracr序列上的指导序列。
94.如权利要求71所述的方法,其中该Cas蛋白进行了密码子优化以便在真核细胞中表达。
95.如权利要求94所述的方法,其中该真核细胞是哺乳动物细胞。
96.如权利要求95所述的方法,其中该哺乳动物细胞是人类细胞。
97.如权利要求71所述的方法,其中该Cas蛋白是II型CRISPR-Cas蛋白。
98.如权利要求97所述的方法,其中该Cas蛋白是Cas9蛋白。
99.如权利要求98所述的方法,其中该Cas蛋白是SpCas9。
100.如权利要求99所述的方法,其中该Cas蛋白在催化结构域中包含一个或多个突变。
101.如权利要求100所述的方法,其中该一个或多个突变是在RuvC结构域中。
102.如权利要求101所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
103.如权利要求102所述的方法,其中该Cas蛋白具有D10A突变。
104.如权利要求100所述的方法,其中该一个或多个突变是在HNH结构域中。
105.如权利要求104所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
106.如权利要求105所述的方法,其中该Cas蛋白具有H840A突变。
107.如权利要求71所述的方法,其中该基因产物的表达被降低。
108.如权利要求71所述的方法,其中模板多核苷酸被进一步引入编码该基因产物的该DNA分子中,或者间插序列被精确切除从而允许5’突出端再退火和连接。
109.如权利要求71所述的方法,其中该基因产物的表达增加,或者该基因产物的活性或功能被改变。
110.如权利要求71所述的方法,其中该基因产物是蛋白质
111.一种工程化的、非天然存在的CRISPR-Cas系统,该系统包含具有一个或多个突变的Cas蛋白和分别靶向在细胞中编码基因产物的双链DNA分子的第一链和第二链的两个指导RNA,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。
112.如权利要求111所述的CRISPR-Cas系统,其中这些指导RNA包括融合到tracr配对序列和tracr序列上的指导序列。
113.如权利要求111所述的CRISPR-Cas系统,其中该Cas蛋白是II型CRISPR-Cas蛋白。
114.如权利要求113所述的CRISPR-Cas系统,其中该Cas蛋白是Cas9蛋白。
115.如权利要求114所述的CRISPR-Cas系统,其中该Cas蛋白是SpCas9。
116.如权利要求115所述的CRISPR-Cas系统,其中该Cas蛋白在催化结构域中包含一个或多个突变。
117.如权利要求116所述的CRISPR-Cas系统,其中该一个或多个突变是在RuvC结构域中。
118.如权利要求117所述的CRISPR-Cas系统,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
119.如权利要求118所述的CRISPR-Cas系统,其中该Cas蛋白具有D10A突变。
120.如权利要求116所述的CRISPR-Cas系统,其中该一个或多个突变是在HNH结构域中。
121.如权利要求120所述的CRISPR-Cas系统,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
122.如权利要求121所述的CRISPR-Cas系统,其中该Cas蛋白具有H840A突变。
123.如权利要求111所述的CRISPR-Cas系统,其中该Cas蛋白进行了密码子优化以便在真核细胞中表达。
124.如权利要求123所述的CRISPR-Cas系统,其中该真核细胞是哺乳动物细胞。
125.如权利要求124所述的CRISPR-Cas系统,其中该哺乳动物细胞是人类细胞。
126.如权利要求111所述的CRISPR-Cas系统,其中该基因产物的表达被降低。
127.如权利要求111所述的CRISPR-Cas系统,其中模板多核苷酸被进一步引入编码该基因产物的该DNA分子中,或者间插序列被精确切除从而允许5’或3’突出端再退火和连接。
128.如权利要求111所述的CRISPR-Cas系统,其中该基因产物的表达增加,或者该基因产物的活性或功能被改变。
129.如权利要求111所述的CRISPR-Cas系统,其中该基因产物是蛋白质。
130.一种工程化的非天然存在的载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含:
a)第一调节元件,该第一调节元件可操作地连接到两个CRISPR-Cas系统指导RNA的每一者上,这两个指导RNA分别靶向编码基因产物的双链DNA分子的第一链和第二链,b)第二调节元件,该第二调节元件可操作地连接至Cas蛋白,
其中组分(a)和(b)位于该系统的相同或不同载体上,
由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。
131.如权利要求130所述的载体系统,其中这些指导RNA包括融合到tracr配对序列和tracr序列上的指导序列。
132.如权利要求130所述的载体系统,其中该Cas蛋白是II型CRISPR-Cas蛋白。
133.如权利要求132所述的载体系统,其中该Cas蛋白是Cas9蛋白。
134.如权利要求133所述的载体系统,其中该Cas蛋白是SpCas9。
135.如权利要求134所述的载体系统,其中该Cas蛋白在催化结构域中包含一个或多个突变。
136.如权利要求135所述的载体系统,其中该一个或多个突变是在RuvC结构域中。
137.如权利要求136所述的载体系统,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
138.如权利要求137所述的载体系统,其中该Cas蛋白具有D10A突变。
139.如权利要求135所述的载体系统,其中该一个或多个突变是在HNH结构域中。
140.如权利要求139所述的载体系统,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
141.如权利要求140所述的载体系统,其中该Cas蛋白具有H840A突变。
142.如权利要求130所述的载体系统,其中该Cas蛋白进行了密码子优化以便在真核细胞中表达。
143.如权利要求142所述的载体系统,其中该真核细胞是哺乳动物细胞。
144.如权利要求143所述的载体系统,其中该哺乳动物细胞是人类细胞。
145.如权利要求130所述的载体系统,其中该基因产物是蛋白质。
146.如权利要求130所述的载体系统,其中该基因产物的表达被降低。
147.如权利要求130所述的载体系统,其中模板多核苷酸被进一步引入编码该基因产物的该DNA分子中,或者间插序列被精确切除从而允许5’或3’突出端再退火和连接。
148.如权利要求130所述的载体系统,其中该基因产物的表达增加,或者该基因产物的活性或功能被改变。
149.如权利要求130所述的载体系统,其中该系统的这些载体是病毒载体。
150.如权利要求130所述的载体系统,其中该系统的这些载体是经由纳米粒子、外泌体、微囊泡、或基因枪进行递送。
151.一种通过促进同源定向修复来修饰生物的方法,该生物在细胞中包含感兴趣基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列,该方法包括递送非天然存在的或工程化的组合物,该组合物包含:
I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列,
II.第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列,以及
III.编码CRISPR酶的多核苷酸序列,该CRISPR酶包含至少一个或多个核定位序列并且包含一个或多个突变,
IV.修复模板,其包含合成的或工程化的单链寡核苷酸,
其中(a)、(b)和(c)以5’到3’方向排列,
其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和该第二tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,
其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导双链断裂,并且其中通过同源重组将该修复模板引入该DNA双链体中,由此修饰该生物。
152.如权利要求151所述的方法,其中该修复模板进一步包含限制性内切核酸酶限制酶切位点。
153.如权利要求151所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’或3’突出端。
154.如权利要求153所述的方法,其中该5’突出端是1-200个碱基对。
155.如权利要求153所述的方法,其中该3’突出端是1-100个碱基对。
156.如权利要求151所述的方法,其中编码该CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA。
157.如权利要求151所述的方法,其中包含编码该CRISPR酶的序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列的多核苷酸是RNA,并且是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。
158.如权利要求151所述的方法,其中该第一tracr配对序列和第二tracr配对序列共享100%的一致性。
159.如权利要求151所述的方法,其中该第一tracr序列和第二tracr序列共享100%的一致性。
160.如权利要求151所述的方法,其中该CRISPR酶是Cas9酶。
161.如权利要求160所述的方法,其中该CRISPR酶是SpCas9。
162.如权利要求161所述的方法,其中该CRISPR酶在催化结构域中包含一个或多个突变。
163.如权利要求162所述的方法,其中该一个或多个突变是在RuvC结构域中。
164.如权利要求163所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
165.如权利要求164所述的方法,其中该CRISPR酶具有D10A突变。
166.如权利要求162所述的方法,其中该一个或多个突变是在HNH结构域中。
167.如权利要求166所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
168.如权利要求167所述的方法,其中该CRISPR酶具有H840A突变。
169.一种通过促进非同源末端连接(NHEJ)介导的连接来修饰生物的方法,该生物在细胞中包含感兴趣基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列,该方法包括
递送非天然存在的或工程化的组合物,该组合物包含:
I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列,
II.第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列,以及
III.编码CRISPR酶的多核苷酸序列,该CRISPR酶包含至少一个或多个核定位序列并且包含一个或多个突变,
IV.修复模板,其包含第一组突出端,
其中(a)、(b)和(c)以5’到3’方向排列,
其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和该第二tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,
其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导具有第二组突出端的双链断裂,
其中该第一组突出端与该第二组突出端是相容且匹配的,并且
其中通过连接将该修复模板引入该DNA双链体中,由此修饰该生物。
170.根据权利要求169所述的方法,其中该修复模板是合成的或工程化的双链寡核苷酸双链体。
171.根据权利要求169所述的方法,其中该修复模板是从一条被引入该细胞中并且经酶处理的DNA产生。
172.如权利要求169所述的方法,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’或3’突出端。
173.如权利要求172所述的方法,其中该5’突出端是1-200个碱基对。
174.如权利要求172所述的方法,其中该3’突出端是1-100个碱基对。
175.如权利要求169所述的方法,其中编码该CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA。
176.如权利要求169所述的方法,其中包含编码该CRISPR酶的序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列的多核苷酸是RNA,并且是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。
177.如权利要求169所述的方法,其中该第一tracr配对序列和第二tracr配对序列共享100%的一致性。
178.如权利要求169所述的方法,其中该第一tracr序列和第二tracr序列共享100%的一致性。
179.如权利要求169所述的方法,其中该CRISPR酶是Cas9酶。
180.如权利要求179所述的方法,其中该CRISPR酶是SpCas9。
181.如权利要求180所述的方法,其中该CRISPR酶在催化结构域中包含一个或多个突变。
182.如权利要求181所述的方法,其中该一个或多个突变是在RuvC结构域中。
183.如权利要求182所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A以及D986A。
184.如权利要求183所述的方法,其中该CRISPR酶具有D10A突变。
185.如权利要求181所述的方法,其中该一个或多个突变是在HNH结构域中。
186.如权利要求185所述的方法,其中该一个或多个突变选自下组,该组由以下各项组成:H840A、N854A和N863A。
187.如权利要求186所述的方法,其中该CRISPR酶具有H840A突变。
188.一种修饰细胞中的感兴趣座位处的DNA双链体的方法,该方法包括向该细胞递送:
I.包含以下项的第一多核苷酸:
(a)第一指导序列,该第一指导序列能够杂交到第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列;
II.包含以下项的第二多核苷酸:
(a)第二指导序列,该第二指导序列能够杂交到第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列;
以及
III.第三多核苷酸,其包含对CRISPR酶和一个或多个核定位序列进行编码的序列其中在所述第一多核苷酸和第二多核苷酸中的(a)、(b)和(c)是以5’到3’方向排列;
其中该第一靶序列在该DNA双链体的第一链上并且该第二靶序列在该DNA双链体的相对链上,并且在该第一指导序列和第二指导序列杂交到该双链体中的所述靶序列上时,该第一多核苷酸和该第二多核苷酸的5’端相对于彼此偏移该双链体的至少一个碱基对;
其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和第二tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,并且其中该DNA双链体的所述第一链在邻近所述第一靶序列处被切割,并且该DNA双链体的所述相对链在邻近所述第二靶序列处被切割,从而产生具有5’突出端或3’突出端的双链断裂。
189.一种修饰细胞中的感兴趣座位处的DNA双链体的方法,该方法包括向该细胞递送载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含:
I.包含调节元件的第一多核苷酸序列,该调节元件可操作地连接至
(a)第一指导序列,该第一指导序列能够杂交到第一靶序列上,和
(b)至少一种或多种tracr配对序列,
II.包含第二调节元件的第二多核苷酸序列,该第二调节元件可操作地连接至(a)第二指导序列,该第二指导序列能够杂交到第二靶序列上,和
(b)至少一种或多种tracr配对序列,
III.包含第三调节元件的第三多核苷酸序列,该第三调节元件可操作地连接至编码CRISPR酶的序列上,以及
IV.包含第四调节元件的第四多核苷酸序列,该第四调节元件可操作地连接至tracr序列上,
其中组分I、II、III和IV位于该系统的相同或不同载体上
其中该第一靶序列在该DNA双链体的第一链上并且该第二靶序列在该DNA双链体的相对链上,并且在该第一指导序列和第二指导序列杂交到该双链体中的所述靶序列上时,该第一多核苷酸和该第二多核苷酸的5’端相对于彼此偏移该双链体的至少一个碱基对;
其中在转录时,该第一tracr配对序列和该第二tracr配对序列杂交到tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,
其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的第一指导序列、和(2)杂交到tracr序列上的第一tracr配对序列复合的CRISPR酶,
其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的第二指导序列、和(2)杂交到tracr序列上的第二tracr配对序列复合的CRISPR酶,
并且其中该DNA双链体的所述第一链在邻近所述第一靶序列处被切割,并且该DNA双链体的所述相对链在邻近所述第二靶序列处被切割,从而产生具有5’突出端或3’突出端的双链断裂。
190.如权利要求188或189所述的方法,其中所述CRISPR酶是切口酶,任选地是在催化结构域中包含至少一个突变的Cas9酶。
191.如权利要求190所述的方法,其中所述至少一个突变是在RuvC结构域中并且任选地选自下组,该组由以下各项组成:D10A、E762A和D986A,或者是在HNH结构域中并且任选地选自下组,该组由以下各项组成:H840A、N854A和N863A。
192.根据权利要求190至191中任一项所述的方法,其中该第一多核苷酸与该第二多核苷酸的5’端之间的所述偏移大于-8bp、或-278至+58bp、或-200至+200bp、或多达或超过
100bp、或-4至20bp、或+23bp、或+16bp、或+20bp、或+16bp至+20bp、或-3至+18bp。
193.根据权利要求190至192中任一项所述的方法,其中该DNA双链体的所述第一链和所述相对链的所述切割发生在每条链上的PAM(原型间隔子邻近基序)的3’处,并且其中所述第一链上的所述PAM是以从30至150个碱基对与所述相对链上的所述PAM分开。
194.根据权利要求190至193中任一项所述的方法,其中所述突出端是至多200个碱基、至多100个碱基、或至多50个碱基。
195.根据权利要求194所述的方法,其中该突出端是至少1个碱基、至少10个碱基、至少
15个碱基、至少26个碱基或至少30个碱基。
196.根据权利要求194所述的方法,其中该突出端是在34与50个碱基之间或在1与34个碱基之间。
197.根据权利要求188至197中任一项所述的方法,其中编码该CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA,并且任选地其中I、II和III中的任一者或全部是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。
198.根据权利要求188至198中任一项所述的方法,其中该第一tracr配对序列和第二tracr配对序列共享100%的一致性和/或该第一tracr序列和第二tracr序列共享100%的一致性。
199.根据权利要求188所述的方法,其中I、II和III中的每者被提供于载体中,任选地其中每者被提供于相同或不同的载体中。
200.根据权利要求188至200中任一项所述的方法,其中所述感兴趣座位包含基因并且其中所述方法导致所述基因的表达的改变,或导致该基因产物的活性或功能的改变。
201.根据权利要求201所述的方法,其中所述基因产物是蛋白质,和/或其中所述表达、活性或功能的改变是所述表达、活性或功能的降低。
202.根据权利要求188至201中任一项所述的方法,该方法进一步包括:
-向该细胞递送双链寡脱核苷酸(dsODN),该双链寡脱氧核苷酸包含与通过所述双链断裂产生的突出端互补的突出端,其中所述dsODN被整合进该感兴趣座位中;或者-向该细胞递送单链寡脱氧核苷酸(ssODN),其中所述ssODN充当所述双链断裂的同源定向修复的模板。
203.根据权利要求188至201中任一项所述的方法,该方法用于预防治疗个体的疾病,任选地其中所述疾病是由所述感兴趣座位中的缺陷引起。
204.根据权利要求203所述的方法,其中该方法是在该个体的体内进行或针对取自该个体的细胞离体地进行,任选地其中将所述细胞返回到该个体。
205.一种试剂盒或组合物,包含:
I.包含以下项的第一多核苷酸:
(a)第一指导序列,该第一指导序列能够杂交到第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列;
II.包含以下项的第二多核苷酸:
(a)第二指导序列,该第二指导序列能够杂交到第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列;
以及
III.第三多核苷酸,其包含对CRISPR酶和一个或多个核定位序列进行编码的序列其中在所述第一多核苷酸和第二多核苷酸中的(a)、(b)和(c)是以5’到3’方向排列;
其中该第一靶序列在DNA双链体的第一链上并且该第二靶序列在该DNA双链体的相对链上,并且在该第一指导序列和第二指导序列杂交到该双链体中的所述靶序列上时,该第一多核苷酸和该第二多核苷酸的5’端相对于彼此偏移该双链体的至少一个碱基对,并且任选地其中I、II和III中的每者被提供于相同或不同的载体中。
206.根据权利要求205所述的试剂盒或组合物在根据权利要求188至204中任一项所述的方法中的用途。
207.根据权利要求205所述的试剂盒或组合物在制造药剂中的用途,任选地其中所述药剂是用于预防或治疗由所述感兴趣座位中的缺陷引起的疾病。

说明书全文

用于序列操纵的优化的CRISPR-CAS双切口酶系统、方法以及

组合物

相关应用和引用参考

[0001] 要求来自2013年6月17日提交的美国临时专利申请61/836,123、2013年7月17日提交的61/847,537、2013年8月5日提交的61/862,355、2013年8月28日提交的61/871,301、2013年12月12日提交的61/915,383、以及2013年12月12日提交的PCT/US 2013/074667的用于美国的目的的优先权,本申请也是部分继续申请。
[0002] 前述申请、以及在其中或在它们的审查程序期间引用的所有文献或(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献、以及在本文中引用或参考的所有文献(“本文引用的文献”)、在本文中引用的文献中引用或参考的所有文献,连同针对在本文中提及或通过引用结合在本文中的任何文献中的任何产品的任何制造商的说明书、说明、产品规格、和产品表,特此通过引用并入本文,并且可以在本发明的实践中采用。更具体地说,所有参考的文献均通过引用并入本文,其程度如同每个单独的文献被确切地并单独地指明通过引用而并入本文。发明领域
[0003] 本发明总体上涉及用于控制涉及序列靶向的基因表达的系统、方法和组合物的递送、工程化和优化,该序列靶向例如涉及规律间隔成簇短回文重复序列(CRISPR)及其组分的基因组干扰或基因编辑。关于联邦资助研究的声明
[0004] 本发明是在美国国立卫生研究院颁发的NIH先锋奖(Pioneer Award)(1DP1MH100706)的政府支持下完成的。美国政府享有本发明的某些权利。

发明背景

[0005] 在基因组测序技术和分析方法中的最新进展显著加速了对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能。精确的基因组靶向技术对于通过允许个体遗传元件的选择性干扰而使得因果性遗传变异的统性逆向工程成为可能、以及推进合成生物学、生物技术应用、和医学应用是需要的。虽然基因组编辑技术,如设计师锌指、转录激活子样效应因子(TALE)、或归巢大范围核酸酶(homing meganuclease)对于产生靶向的基因组干扰是可得的,但是仍然需要负担得起的、易于建立的、可扩展的、并且便于靶向真核基因组内的多个位置的新的基因组工程技术。发明概述
[0006] 该CRISPR-Cas系统不要求产生针对靶特异性序列的定制蛋白,相反,通过识别特异性DNA靶的短RNA分子可以对单个Cas酶进行程序设计。将该CRISPR-Cas系统添加到基因组测序技术和分析方法的组库中可以显著使该方法论简化并且提高对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。为了有效而无有害作用地利用CRISPR-Cas系统用于基因组编辑,了解这些基因组工程工具的工程化和优化方面是至关重要的,这些方面是请求保护的本发明的方面。
[0007] 对于具有一系列广泛应用的序列靶向的替代性且稳健的系统和技术存在着迫切需要。本发明的多个方面着手解决这种需要并且提供了相关优点。示例性CRISPR复合物包括与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交。该指导序列与tracr配对序列连接,该tracr配对序列进而与tracr序列杂交。
[0008] 在一个方面,本发明提供了用于使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。在一个方面,该细胞是真核细胞。在一个方面,该细胞是原核细胞。正因为如此,本发明的CRISPR复合物在例如基因或基因组编辑、基因治疗、药物发现、药物筛选、疾病诊断、以及预后中具有广阔的应用谱。示例性CRISPR复合物包括与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交。在一个方面,该指导序列与tracr配对序列连接,该tracr配对序列进而与tracr序列杂交。在一个方面,该CRISPR酶是切口酶。
[0009] 本发明的方面涉及在具备具有优化活性的指导RNA的CRISPR-Cas9系统中的、具有改进的靶标特异性的Cas9酶,其中Cas9酶在长度上小于野生型Cas9酶(和编码它的核酸分子),并涉及嵌合的Cas9酶,以及改进Cas9酶的靶标特异性或设计CRISPR-Cas9系统的方法,所述方法包括设计或制备具有优化活性的指导RNA和/或选择或制备具有比野生型Cas9更小的尺寸或长度的Cas9酶,由此将编码这种构建体的核酸包装到递送载体中是有利的(因为在该递送载体中对它的编码少于野生型Cas9)中,和/或产生嵌合Cas9酶。
[0010] 还提供了本发明的序列、载体、酶或系统在医学中的用途。还提供了它们在基因或基因组编辑中的用途。
[0011] 在本发明的另外方面,Cas9酶可以包含一个或多个突变,并且可以用作具有或不具有与功能结构域融合的通用DNA结合蛋白。这些突变可以是人工引入的突变或获得性和丢失性功能突变。这些突变可以包括但不限于催化结构域的一个中的突变(例如,在残基D10和H840处)。另外的突变已经得以表征并且可以用于本发明的构建体中。在本发明的一个方面,突变的Cas9酶可以融合至蛋白质结构域,例如像转录激活结构域。在一个方面,该转录激活结构域可以是VP64。本发明的其他方面涉及融合到结构域上的突变的Cas9酶,这些结构域包括但不限于,转录阻遏物、重组酶、转座酶、组蛋白重塑剂(histone remodeler)、DNA甲基转移酶、隐花色素、光可诱导/可控制结构域或化学可诱导/可控制结构域。
[0012] 在一个另外的实施例中,本发明提供了产生突变体tracrRNA和允许增强这些RNA在细胞中的性能的同向重复序列或突变体嵌合指导序列的方法。本发明的方面还提供了所述序列的选择。
[0013] 本发明的方面还提供了简化CRISPR复合物的组分的克隆和递送的方法。在本发明的优选实施例中,适合的启动子,如U6启动子,与DNA寡核苷酸一起扩增并且被定位为邻接且在编码指导RNA的序列上游。然后将生成的PCR产物转染到细胞中以驱动指导RNA的表达。本发明的方面还涉及体外转录的或从合成公司订购并且直接转染的指导RNA。
[0014] 在一个方面,本发明提供了通过使用更具活性的聚合酶来提高活性的方法。在一个方面,可以插入T7启动子,使其邻接且在编码指导RNA的序列上游。在一个优选的实施例中,这些指导RNA在T7启动子控制下的表达是由该细胞中的T7聚合酶的表达驱动的。在一个有利的实施例中,该细胞是真核细胞。在一个优选的实施例中,该真核细胞是人类细胞。在一个更优选的实施例中,该人类细胞是患者特异性细胞。
[0015] 在一个方面,本发明提供了用于降低Cas酶的毒性的方法。在某些方面,该Cas酶是如本文描述的任何Cas9,例如任何天然存在的细菌Cas9以及任何嵌合体、突变体、同源物或直向同源物。在一个方面,该Cas酶是切口酶。在一个实施例中,该Cas9以mRNA的形式递送到细胞中。这允许该酶的瞬时表达,由此降低毒性。在另一个实施例中,Cas9是在编码且表达Cas9酶的核苷酸构建体中递送至细胞中。在另一个实施例中,本发明还提供了在诱导型启动子的控制下表达Cas9的方法、在其中使用的构建体。
[0016] 在另一方面,本发明提供了用于改进CRISPR-Cas系统的体内应用的方法。在该优选实施例中,该Cas酶是本文描述的野生型Cas9或任何修改版本,包括任何天然存在的细菌Cas9以及任何嵌合体、突变体、同源物或直向同源物。在一个方面,该Cas酶是切口酶。本发明的一个有利方面提供了易于被包装到病毒载体以便递送的Cas9同源物的选择。Cas9直向同源物典型地共享3-4个RuvC结构域和一个HNH结构域的通用结构。最5'的RuvC结构域切割非互补链,而HNH结构域切割互补链。所有符号都是就指导序列而言的。
[0017] 在5'RuvC结构域中的催化残基是通过感兴趣的Cas9与其他Cas9直向同源物(来自化脓链球菌II型CRISPR座位、嗜热链球菌CRISPR座位1、嗜热链球菌CRISPR座位3以及凶手弗朗西斯菌(Franciscilla novicida)II型CRISPR座位)的同源性比较而鉴定的,并且保守性Asp残基被突变为丙酸以将Cas9转化成互补链切口酶。类似地,在HNH结构域中的保守性His和Asn残基被突变为丙氨酸以将Cas9转化为非互补链切口酶。
[0018] 在一些实施例中,该CRISPR酶是I型或III型CRISPR酶,优选II型CRISPR酶。这种II型CRISPR酶可以是任何Cas酶。一种Cas酶可以被鉴定为Cas9,因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地,该Cas9酶来自或衍生自spCas9或saCas9。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本文所述它在某些方面已经被突变(修饰)。
[0019] 应当理解的是,术语Cas和CRISPR酶在本文中通常可互换地使用,除非另外说明。如上提及的,在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶(可替代地称为SpCas9或spCas9)。然而,应当理解的是,本发明包括更多的来自其他微生物物种的Cas9s,如衍生自化脓链球菌的SpCas9、衍生自金黄色葡萄球菌的SaCas9、衍生自嗜热链球菌的St1Cas9等等。在本文中提供了另外的实例。
[0020] 本文中提供了在这种情形下针对人类进行优化(即,针对在人类中表达进行优化)的密码子优化序列的实例,参见SaCas9人类密码子优化序列。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官(如脑)的密码子优化是已知的。
[0021] 在另外的实施例中,本发明提供了通过产生嵌合Cas9蛋白而增强Cas9的功能的方法。这些方法可包括使一种Cas9同源物的N末端片段与另一种Cas9同源物的C末端片段融合。这些方法还允许选择这些嵌合蛋白所展示的新特性。
[0022] 应当理解的是,在本发明的方法中,在该生物是一种动物或植物的情况下,该修饰可以离体地或在体外例如在细胞培养物中进行,在一些情况下不在体内进行。在其他实施例中,可以在体内进行。
[0023] 在一个方面,本发明提供了一种通过操纵在感兴趣的基因组座位中的靶序列来修饰生物或非人类生物的方法,该方法包括:递送非天然存在的或工程化的组合物,该组合物包含:
A)-I.CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该多核苷酸序列包含:
(a)指导序列,该指导序列能够杂交到真核细胞中的靶序列上,
(b)tracr配对序列,和
(c)tracr序列,以及
II.对包含至少一个或多个核定位序列的CRISPR酶进行编码的多核苷酸序列,
其中(a)、(b)和(c)以5’到3’方向排列,
其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且
其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列、和(2)杂交到该
tracr序列上的该tracr配对序列复合的CRISPR酶,并且编码CRISPR酶的多核苷酸序列是DNA或RNA,
或者
(B)I.多核苷酸,其包含:
(a)指导序列,该指导序列能够杂交到原核细胞中的靶序列上,和
(b)至少一种或多种tracr配对序列,
II.编码CRISPR酶的多核苷酸序列,以及
III.包含tracr序列的多核苷酸序列,
其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且
其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列、和(2)杂交到该
tracr序列上的该tracr配对序列复合的CRISPR酶,并且编码CRISPR酶的多核苷酸序列是DNA或RNA。
[0024] 编码CRISPR酶的多核苷酸序列、指导序列、tracr配对序列或tracr序列的任一者或全部可以是RNA、DNA或RNA和DNA的组合。在一个方面,包括编码CRISPR酶的序列、指导序列、tracr配对序列或tracr序列的多核苷酸是RNA。在一个方面,包括编码CRISPR酶的序列、指导序列、tracr配对序列或tracr序列的多核苷酸是DNA。在一个方面,这些多核苷酸是DNA和RNA的混合物,其中这些多核苷酸(包括对CRISPR酶、指导序列、tracr配对序列或tracr序列中的一者或多者进行编码的序列)中的一些是DNA,并且这些多核苷酸中的一些是RNA。在一个方面,包括编码CRISPR酶的序列的多核苷酸是DNA,并且指导序列、tracr配对序列或tracr序列是RNA。包括编码CRISPR酶的序列、指导序列、tracr配对序列或tracr序列的一种或多种多核苷酸可以是经由纳米粒子、外泌体、微囊泡、或基因枪进行递送。
[0025] 应当理解的是,在提及多核苷酸的情况下,在该多核苷酸是RNA并且被认为‘包含’例如tracr配对序列的特征的情况下,该RNA序列包括该特征。在该多核苷酸是DNA并且被认为包含这样的tracr配对序列的特征的情况下,该DNA序列被或者可以被转录成包括该讨论中的特征的RNA。在该特征是蛋白质的情况下,如CRISPR酶,所提及的该DNA或RNA序列被或者可以被翻译(以及在DNA首先被转录的情况下)。另外,在编码CRISPR酶的RNA提供至细胞的情况下,应理解该RNA能够由递送至其中的该细胞翻译。
[0026] 因此,在某些实施例中,本发明提供了通过对在感兴趣基因组座位中的靶序列进行操纵来修饰生物(包括原核生物或真核生物,如植物或动物,例如包括人类或非人类哺乳动物的哺乳动物或非人类生物)的方法,该方法包括递送包含病毒或质粒载体系统的非天然存在的或工程化的组合物,该载体系统包含可操作地编码用于其表达的组合物的一种或多种病毒或质粒载体,其中该非天然存在的或工程化的组合物包括:(A)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该多核苷酸序列包含(a)能够杂交到真核细胞中的靶序列上的指导序列,(b)tracr配对序列,和(c)tracr序列,以及II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含零个或至少一个或多个核定位序列(或者任选地至少一个或多个核定位序列,因为一些实施例可不涉及NLS),其中(a)、(b)和(c)以5’到3’方向排列,其中组分I和II位于该系统的相同或不同载体上,其中当转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且其中该可杂交的复合物包含与(1)可杂交到该靶序列上的该指导序列和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,或
(B)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到(a)能够杂交到原核细胞中的靶序列上的指导序列,以及(b)至少一种或多种tracr配对序列,II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,以及III.第三调节元件,该第三调节元件可操作地连接到tracr序列上,其中组分I、II和III位于该系统的相同或不同载体上,其中当转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶。在一个方面,该CRISPR酶在催化结构域的一个中包含一个或多个突变。在一个方面,该CRISPR酶是切口酶。
[0027] 优选地,该载体可以是病毒载体,如慢病毒或杆状病毒或优选地腺病毒/腺病毒相关病毒载体,但是其他递送手段也是已知的(如酵母系统、微囊泡、基因枪/将载体附接到金纳米粒子上的手段)并且被提供。在一些实施例中,这些病毒载体或质粒载体的一种或多种可以经由纳米粒子、外泌体、微囊泡、或基因枪进行递送。
[0028] 通过操纵靶序列,申请人还打算靶序列的表观遗传操纵。这可以是靶序列的染色质状态的操纵,如借助于修饰靶序列的甲基化状态(即,甲基化或甲基化模式或CpG岛的添加或去除)、组蛋白修饰,从而增加或降低靶序列的可及性,或者借助于促进或减少3D折叠。
[0029] 应当理解的是,在提及一种通过对在感兴趣的基因组座位中的靶序列进行操纵来修饰生物(包括原核生物或真核生物,如植物或动物,例如包括人类或非人类哺乳动物的哺乳动物或非人类生物)的方法的情况下,这可适用于作为整体的生物(或哺乳动物)或者仅仅是来自这种生物的单个细胞或细胞群(如果该生物是多细胞的话)。在人类的情况下,例如,申请人特别地设想到单个细胞或细胞群,并且这些细胞可以优选地进行离体修饰,进而重新引入。在这种情况下,活组织检查或其他组织或生物流体样品可以必要的。在这方面,干细胞也是特别优选的。但是,当然还设想了体内实施例。
[0030] 在某些实施例中,本发明提供了治疗或抑制对其有需要的受试者(例如,哺乳动物或人类)或非人类受试者(例如,哺乳动物)中感兴趣基因组座位中的靶序列缺陷所引起的病症的方法,该方法包括通过对该靶序列进行操纵而修饰该人类受试者或非人类受试者,并且其中该病症对于借助于包括提供治疗的靶序列操纵的治疗或抑制是敏感的,该治疗包括:递送包含AAV载体系统的非天然存在的或工程化的组合物,该载体系统包含一种或多种AAV载体,所述载体包括可操作地编码用于其表达的组合物,其中在表达时该靶序列由该组合物操纵,其中该非天然存在的或工程化的组合物包括:(A)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该多核苷酸序列包含(a)能够杂交到真核细胞中的靶序列上的指导序列,(b)tracr配对序列,和(c)tracr序列,以及II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含零个或至少一个或多个核定位序列(或者任选地至少一个或多个核定位序列,因为一些实施例可不涉及NLS),其中(a)、(b)和(c)以5’到3’方向排列,其中组分I和II位于该系统的相同或不同载体上,其中当转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,或
(B)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到(a)能够杂交到原核细胞中的靶序列上的指导序列,以及(b)至少一种或多种tracr配对序列,II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,以及III.第三调节元件,该第三调节元件可操作地连接到tracr序列上,其中组分I、II和III位于该系统的相同或不同载体上,其中当转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶。
[0031] 本发明的一些方法可以包括诱导表达。在本发明的一些方法中,该生物或受试者是真核生物,包括例如植物或动物(包括包含人类在内的哺乳动物)或非人类真核生物或非人类动物或非人类哺乳动物。在本发明的一些方法中,该生物或受试者是植物。在本发明的一些方法中,该生物或受试者是哺乳动物或非人类哺乳动物。在本发明的一些方法中,该生物或受试者是藻类。在本发明的一些方法中,该病毒载体是AAV。在本发明的一些方法中,该病毒载体是慢病毒衍生的载体。在本发明的一些方法中,该病毒载体是用于植物中的农杆菌Ti或Ri质粒。在本发明的一些方法中,该CRISPR酶是Cas9。在本发明的一些方法中,该CRISPR酶在催化结构域的一个中包含一个或多个突变。在本发明的一些方法中,该CRISPR酶是Cas9切口酶。在本发明的一些方法中,该指导序列的表达是在T7启动子控制下,其是由T7聚合酶的表达驱动的。在本发明的一些方法中,该指导序列的表达是在U6启动子控制下。
[0032] 通过操纵靶序列,申请人意图改变靶序列,该操纵可以包括靶序列的表观遗传操纵。该表观遗传操纵可以是靶序列的染色质状态的操纵,如借助于修饰靶序列的甲基化状态(即,甲基化或甲基化模式或CpG岛的添加或去除)、组蛋白修饰,从而增加或降低靶序列的可及性,或者借助于促进或减少3D折叠。
[0033] 应当理解的是,在提及通过对在感兴趣基因组座位中的靶序列进行操纵来修饰生物或非人类生物的方法的情况下,这可适用于作为整体的生物或者仅仅是来自这种生物的单个细胞或细胞群(如果该生物是多细胞的话)。在人类的情况下,例如,申请人特别地设想到单个细胞或细胞群,并且这些细胞可以优选地进行离体修饰,进而重新引入。在这种情况下,活组织检查或其他组织或生物流体样品可以必要的。在这方面,干细胞也是特别优选的。但是,当然还设想了体内实施例。
[0034] 在某些实施例中,本发明提供了治疗或抑制对其有需要的受试者或非人类受试者中感兴趣基因组座位中的靶序列缺陷所引起的病症的方法,该方法包括通过对该靶序列进行操纵而修饰该受试者或非人类受试者,并且其中该病症对于借助于包括提供治疗的靶序列操纵的治疗或抑制是敏感的,该治疗包括:递送包含载体系统的非天然存在的或工程化的组合物,该载体系统包含一种或多种载体,所述载体包括可操作地编码用于其表达的组合物,其中在表达时该非天然存在的或工程化的组合物操纵该靶序列,其中该非天然存在的或工程化的组合物包括:(A)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该chiRNA多核苷酸序列包含(a)能够杂交到真核细胞中的靶序列上的指导序列,(b)tracr配对序列,和(c)tracr序列,以及II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含零个或至少一个或多个核定位序列(或者任选地至少一个或多个核定位序列,因为一些实施例可不涉及NLS),其中(a)、(b)和(c)以5’到3’方向排列,其中组分I和II位于该系统的相同或不同载体上,其中当转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,或
(B)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到(a)能够杂交到原核细胞中的靶序列上的指导序列,以及(b)至少一种或多种tracr配对序列,II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,以及III.第三调节元件,该第三调节元件可操作地连接到tracr序列上,其中组分I、II和III位于该系统的相同或不同载体上,其中当转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶。在用于真核细胞的实施例中,该载体系统包含病毒载体系统,例如AAV载体或AAV载体系统或慢病毒衍生的载体系统或烟草花叶病毒衍生的系统。
[0035] 本发明的一些方法可以包括诱导表达。在本发明的一些方法中,该生物或受试者是真核生物,包括例如植物或动物(包括包含人类在内的哺乳动物)或非人类真核生物或非人类动物。在本发明的一些方法中,该生物或受试者是植物。在本发明的一些方法中,该生物或受试者是哺乳动物或非人类哺乳动物。在本发明的一些方法中,该生物或受试者是藻类。在本发明的一些方法中,该病毒载体是AAV。在本发明的一些方法中,该病毒载体是慢病毒载体。在本发明的一些方法中,该病毒载体是烟草花叶病毒载体。在本发明的一些方法中,该CRISPR酶是Cas9。在本发明的一些方法中,该CRISPR酶在催化结构域的一个中包含一个或多个突变。在本发明的一些方法中,该CRISPR酶是Cas9切口酶。在本发明的一些方法中,该指导序列的表达是在T7启动子控制下,是由T7聚合酶的表达驱动的。在本发明的一些方法中,该指导序列的表达是在U6启动子控制下。
[0036] 在一些实施例中本发明包含一种递送CRISPR酶的方法,该方法包括向细胞递送编码该CRISPR酶的mRNA。在本发明的这些方法的一些中,该CRISPR酶是Cas9。
[0037] 在一些实施例中,本发明包括一种制备本发明的AAV载体的方法,该方法包括将含有编码AAV的一种或多种核酸分子或基本上由其组成的一种或多种质粒转染到可感染AAV的细胞中,并且提供对于AAV的复制和包装必须的AAV rep和/或cap。在一些实施例中,对于AAV的复制和包装必须的AAV rep和/或cap是通过用一种或多种辅助质粒或一种或多种辅助病毒转染这些细胞而提供的。在一些实施例中,该辅助病毒是痘病毒、腺病毒、疱疹病毒或杆状病毒。在一些实施例中,该痘病毒是痘病毒。在一些实施例中,这些细胞是哺乳动物细胞。并且在一些实施例中,这些细胞是昆虫细胞,并且该辅助病毒是杆状病毒。
[0038] 在植物中,病原体常常是宿主特异性的。例如,番茄尖镰孢菌番茄专化型(Fusarium oxysporum f.sp.lycopersici)引起番茄枯萎病,而且只攻击番茄,并且香石竹尖镰孢禾柄锈菌小麦专化型(F.oxysporum f.dianthii Puccinia graminis 
f.sp.tritici)只攻击小麦。植物具有抵抗大多数病原体的现有的和诱导性的防御。跨植物代的突变和重组事件导致产生敏感性的遗传变异性,特别是当病原体以比植物更高的频率繁殖时。在植物中可以存在非宿主抗性,例如,该宿主和病原体是不相容的。还可以存在平抗性,例如典型地由许多基因控制的针对所有种的病原体的部分抗性,以及垂直抗性,例如典型地由很少的基因控制的针对病原体的某些种而不是其他种的完全抗性。在基因对基因水平中,植物和病原体一起演化,并且在一者中的遗传变化使在另一者中的变化平衡。因此,使用自然变异,育种者针对产率、质量、均匀性、耐性、抗性将最有用的基因进行结合。抗性基因的来源包括天然或外来品种、传家宝品种(Heirloom Varieties)、近缘野生植物、以及诱导的突变,例如用诱变剂处理植物材料。利用本发明,向植物育种者提供了一种新的诱导突变的工具。因此,本领域的技术人员可以分析抗性基因的来源的基因组,并且在具有所希望的特征或性状的品种方面,采用本发明来诱导抗性基因的发生,这样具有比先前的诱变剂更好的精确性,并且因此加速并改良植物育种计划。
[0039] 本发明进一步包括本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA),其用于在医学中使用。在一些实施例中,本发明包括根据本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA),其用于在根据本发明的方法中使用。在一些实施例中,本发明提供了本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA)在离体基因或基因组编辑中的用途。在某些实施例中,本发明包括本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA)在用于离体基因或基因组编辑中或在根据本发明的方法中使用的药剂的制造中的用途。在本发明的一些方法中,该CRISPR酶在催化结构域的一个中包含一个或多个突变。在本发明的一些方法中,该CRISPR酶是Cas9切口酶。在一些实施例中,本发明包括本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA),其中该靶序列在其3’端的侧翼为5’-基序(称为原型间隔子邻近基序(PAM)),尤其是在该Cas9是(或衍生自)化脓链球菌或金黄色葡萄球菌Cas9的情况下。例如,适合的PAM是分别针对SpCas9或SaCas9酶(或衍生的酶)的5'-NRG或5'-NNGRR(其中N是任何核苷酸),如下文提及的。
[0040] 应当理解的是,SpCas9或SaCas9是来自或衍生自化脓链球菌或金黄色葡萄球菌Cas9的那些。
[0041] 本发明的方面包括提高CRISPR酶例如Cas9介导的基因靶向的特异性,以及降低经由CRISPR酶例如Cas9的脱靶修饰的可能性。在一些实施例中,本发明包括通过借助于操纵在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一和第二靶序列而使脱靶修饰最小化来修饰生物或非人类生物的方法,所述方法包括递送非天然存在的或工程化的组合物,该组合物包含:I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列,
II.第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列,以及
III.对包含零个或至少一个或多个核定位序列并且在CRISPR酶中包含一个或多个突
变的该CRISPR酶进行编码的多核苷酸序列,
其中I.和II.的(a)、(b)和(c)以5’到3’方向排列,其中当转录时,该第一tracr配对序列和第二tracr配对序列分别杂交到该第一tracr序列和第二tracr序列上,并且该第一指导序列和第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,并且其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列引导邻近该第二靶序列的DNA双链体的相对链的切割,从而诱导DNA中的断裂,由此通过使脱靶修饰最小化来修饰该生物或非人类生物。在一个方面,DNA中的第一切口和第二切口相对于彼此偏移该双链体的至少一个基对。在一个方面,该第一切口和该第二切口相对于彼此偏移而使得所得DNA断裂具有3’突出端。在一个方面,该第一切口和该第二切口相对于彼此偏移而使得所得DNA断裂具有5’突出端。在一个方面,该第一切口和该第二切口相对于彼此定位为使得该突出端是至少1nt、至少10nt、至少15nt、至少26nt、至少30nt、至少50nt或多于至少50nt。包括所得偏移双切DNA链的本发明的另外方面可以由本领域技术人员理解,并且双切系统的示例性用途提供在此。
[0042] 在本发明的一些方法中,编码CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA。在本发明的另外的实施例中,包括编码CRISPR酶的序列、该第一指导序列和第二指导序列、该第一tracr配对序列和第二tracr配对序列或该第一tracr序列和第二tracr序列的多核苷酸是RNA,并且是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。在本发明的某些实施例中,该第一和第二tracr配对序列共享100%的一致性和/或该第一和第二tracr序列共享100%的一致性。在本发明的优选实施例中,该CRISPR酶是一种Cas9酶,例如SpCas9。在本发明的一方面中,CRISPR酶在催化结构域的一个中包含一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该CRISPR酶具有D10A突变或H840A突变。
[0043] 在本发明的优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的相对链的切割从而产生5’突出端。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对或1-34个碱基对。在本发明的其他优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生钝切口或3’突出端。在本发明的实施例中,该3’突出端具有至多150、100或25个碱基对,或至少15、10或1个碱基对。在优选的实施例中,该3’突出端具有1-100个碱基对。
[0044] 在一些实施例中,本发明包括通过借助于操纵在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一和第二靶序列而使脱靶修饰最小化来修饰生物或非人类生物的方法,该方法包括递送非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接至
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,和
(b)至少一种或多种tracr配对序列,
II.第二调节元件,该第二调节元件可操作地连接至
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,和
(b)至少一种或多种tracr配对序列,
III.第三调节元件,该第三调节元件可操作地连接至编码CRISPR酶的酶编码序列,以及
IV.第四调节元件,该第四调节元件可操作地连接至tracr序列,
其中组分I、II、III和IV位于该系统的相同或不同载体上,并且当转录时,该tracr配对序列杂交到该tracr序列上并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,并且其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导双链断裂,由此通过使脱靶修饰最小化来修饰该生物或该非人类生物。
[0045] 在本发明的一些方法中,编码CRISPR酶的多核苷酸序列、该第一和第二指导序列、该第一和第二tracr配对序列或该第一和第二tracr序列中的任一者或全部是RNA。在本发明另外的实施例中,该第一和第二tracr配对序列共享100%的一致性和/或该第一和第二tracr序列共享100%的一致性。在本发明的优选实施例中,该CRISPR酶是一种Cas9酶,例如SpCas9。在本发明的一方面中,CRISPR酶在催化结构域的一个中包含一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该CRISPR酶具有D10A突变或H840A突变。因为在具有D10A或H840A突变的情况下CRISPR酶或Cas蛋白可以仍然促进残余NHEJ活性,遍及本申请,本发明包括通过在CRISPR酶或Cas蛋白中引入多个突变进一步降低NHEJ活性的、甚至更精确的切口酶的产生。D10A切口酶的更好版本可以包括突变D10A、E762A和D986A(或这些的一些子集),并且H840A切口酶的更好版本可以包括突变H840A、N854A和N863A(或这些的一些子集)。
[0046] 在本发明的一个另外的实施例中,这些病毒载体的一种或多种经由纳米粒子、外泌体、微囊泡、或基因枪进行递送。
[0047] 在本发明的优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’突出端。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对或1-34个碱基对。在本发明的其他优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生钝切口或3’突出端。在本发明的实施例中,该3’突出端具有至多150、100或25个碱基对,或至少15、10或1个碱基对。在优选的实施例中,该3’突出端具有1-100个碱基对。
[0048] 在一些实施例中,本发明包括一种通过借助于向含有和表达编码基因产物的双链DNA分子的细胞中引入工程化的、非天然存在的CRISPR-Cas系统使脱靶修饰最小化而修饰感兴趣的基因组座位的方法,该CRISPR-Cas系统包含具有一个或多个突变的Cas蛋白和两个分别靶向该DNA分子的第一链和第二链的指导RNA,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。
[0049] 在本发明的优选方法中,该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口导致一个5’突出端。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对或1-34个碱基对。在本发明的其他优选方法中,该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口产生3’突出端,其中该3’突出端是1-100个碱基对。
[0050] 本发明的实施例还包括包含融合到tracr配对序列和tracr序列上的指导序列的指导RNA。在本发明的一个方面,该Cas蛋白经密码子优化以便在真核细胞中表达,其中该真核细胞可以是哺乳动物细胞或人类细胞。在本发明另外的实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白,例如一种Cas9蛋白。在一个高度优选的实施例中,该Cas蛋白是一种Cas9蛋白,例如SpCas9。在本发明的多个方面中,该Cas蛋白在催化结构域的一个中具有一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该Cas蛋白具有D10A突变或H840A突变。
[0051] 本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。
[0052] 本发明还包括一种工程化的、非天然存在的CRISPR-Cas系统,该系统包含具有一个或多个突变的Cas蛋白和两个分别靶向在细胞中编码基因产物的双链DNA分子的第一链和第二链的指导RNA,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。
[0053] 在本发明的方面中,这些指导RNA可包含融合到tracr配对序列和tracr序列上的指导序列。在本发明的一个实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白。在本发明的一个方面,该Cas蛋白经密码子优化以便在真核细胞中表达,其中该真核细胞可以是哺乳动物细胞或人类细胞。在本发明另外的实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白,例如一种Cas9蛋白。在一个高度优选的实施例中,该Cas蛋白是一种Cas9蛋白,例如SpCas9。在本发明的多个方面中,该Cas蛋白在催化结构域的一个中具有一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该Cas蛋白具有D10A突变或H840A突变。
[0054] 本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’或3’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。
[0055] 本发明还包括包含一种或多种载体的工程化的、非天然存在的载体系统,所述载体包含:a)第一调节元件,该第一调节元件可操作地连接到两个CRISPR-Cas系统指导RNA的每一者上,这两个指导RNA分别靶向编码基因产物的双链DNA分子的第一链和第二链,
b)第二调节元件,该第二调节元件可操作地连接至Cas蛋白,
其中组分(a)和(b)位于该系统的相同或不同载体上,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。
[0056] 在本发明的方面中,这些指导RNA可包含融合到tracr配对序列和tracr序列上的指导序列。在本发明的一个实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白。在本发明的一个方面,该Cas蛋白经密码子优化以便在真核细胞中表达,其中该真核细胞可以是哺乳动物细胞或人类细胞。在本发明另外的实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白,例如一种Cas9蛋白。在一个高度优选的实施例中,该Cas蛋白是一种Cas9蛋白,例如SpCas9。在本发明的多个方面中,该Cas蛋白在催化结构域的一个中具有一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该Cas蛋白具有D10A突变或H840A突变。
[0057] 本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’或3’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。在本发明的优选实施例中,该系统的这些载体是病毒载体。一个另外的实施例中,该系统的载体经由纳米粒子、外泌体、微囊泡、或基因枪进行递送。
[0058] 本发明的方面提供了通过促进同源定向修复对包括在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列的生物进行修饰的方法,其中该方法可以包括递送非天然存在的或工程化的组合物,该组合物包含:I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列,
II.第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列,以及
III.编码CRISPR酶的多核苷酸序列,该CRISPR酶包含至少一个或多个核定位序列并且包含一个或多个突变,
IV.包含合成的或工程化的单链寡核苷酸的修复模板,
其中(a)、(b)和(c)以5’到3’方向排列,其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和第二tracr序列上并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导双链断裂,并且其中通过同源重组将修复模板引入该DNA双链体中,由此修饰该生物。
[0059] 在本发明的实施例中,该修复模板可以进一步包含限制性内切核酸酶限制酶切位点。在另外的实施例中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’或3’突出端。在本发明的优选实施例中,5’突出端是1-200个碱基对,并且3’突出端是1-100个碱基对。在其他方面,编码CRISPR酶的多核苷酸序列、该第一指导序列和第二指导序列、该第一tracr配对序列和第二tracr配对序列或该第一tracr序列和第二tracr序列中的任一者或全部是RNA。在又另外的方面中,包括编码CRISPR酶的序列、该第一指导序列和第二指导序列、该第一tracr配对序列和第二tracr配对序列或该第一tracr序列和第二tracr序列的多核苷酸是RNA,并且是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。在本发明另外的实施例中,该第一和第二tracr配对序列共享100%的一致性和/或该第一和第二tracr序列共享100%的一致性。在本发明的优选实施例中,该CRISPR酶是一种Cas9酶,例如SpCas9。在本发明的一方面中,CRISPR酶在催化结构域的一个中包含一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该CRISPR酶具有D10A突变或H840A突变。
[0060] 本发明的方面还提供了通过促进非同源末端连接(NHEJ)介导的连接对在细胞中包含感兴趣基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列的生物进行修饰的方法,这些方法可以包括递送非天然存在的或工程化的组合物,该组合物包含:I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:
(a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列,
II.第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:
(a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列,以及
III.编码CRISPR酶的多核苷酸序列,该CRISPR酶包含至少一个或多个核定位序列并且包含一个或多个突变,
IV.包含第一组突出端的修复模板,
其中(a)、(b)和(c)以5’到3’方向排列,其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和第二tracr序列上并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割,从而诱导具有第二组突出端的双链断裂,其中该第一组突出端与该第二组突出端是相容且匹配的,并且其中通过连接将修复模板引入该DNA双链体中,由此修饰该生物。
[0061] 在本发明的一些实施例中,该修复模板是合成的或工程化的双链寡核苷酸双链体,或者在其他实施例中该修复模板是从一条被引入该细胞中并且经酶处理的DNA产生。该酶处理可以是通过内源酶或通过已经被引入该细胞中的酶(例如,限制性内切核酸酶、核酸酶或一对切口酶)进行的,这样相容的突出端在该修复模板上产生。
[0062] 在另外的实施例中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’或3’突出端。在本发明的优选实施例中,5’突出端是1-200个碱基对,并且3’突出端是1-100个碱基对。在其他方面,编码CRISPR酶的多核苷酸序列、该第一指导序列和第二指导序列、该第一tracr配对序列和第二tracr配对序列或该第一tracr序列和第二tracr序列中的任一者或全部是RNA。在又另外的方面中,包括编码CRISPR酶的序列、该第一指导序列和第二指导序列、该第一tracr配对序列和第二tracr配对序列或该第一tracr序列和第二tracr序列的多核苷酸是RNA,并且是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。在本发明另外的实施例中,该第一和第二tracr配对序列共享100%的一致性和/或该第一和第二tracr序列共享100%的一致性。在本发明的优选实施例中,该CRISPR酶是一种Cas9酶,例如SpCas9。在本发明的一方面中,CRISPR酶在催化结构域的一个中包含一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:RuvC结构域中的D10A、E762A、和D986A,或者该一个或多个突变选自下组,该组由以下各项组成:在HNH结构域中的H840A、N854A和N863A。在一个高度优选的实施例中,该CRISPR酶具有D10A突变或H840A突变。
[0063] 在一个方面,本发明提供了修饰在一种真核细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包括与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。在一些实施例中,所述切割包括通过所述CRISPR酶切割在该靶序列位置的一条或两条链。在一些实施例中,所述切割导致靶基因的转录降低。在一些实施例中,该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一种突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中,该方法进一步包括将一种或多种载体递送到所述真核细胞,其中该一种或多种载体驱动下列一者或多者的表达:该CRISPR酶、连接到该tracr配对序列上的指导序列、以及该tracr序列。在一些实施例中,所述载体被递送到受试者内的真核细胞中。在一些实施例中,所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中,该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中,该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。
[0064] 在一个方面,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中该CRISPR复合物包括与杂交到在所述多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。在一些实施例中,该方法进一步包括将一种或多种载体递送到所述真核细胞,其中该一种或多种载体驱动下列一者或多者的表达:该CRISPR酶、连接到该tracr配对序列上的指导序列、以及该tracr序列。
[0065] 在一个方面,本发明提供了产生包含突变的疾病基因的模式真核细胞的方法。在一些实施例中,疾病基因是与患有或产生一种疾病的险的增加相关联的任何基因。在一些实施例中,该方法包括(a)向真核细胞中引入一种或多种载体,其中该一种或多种载体驱动下列一者或多者的表达:CRISPR酶、连接到tracr配对序列上的指导序列、以及tracr序列;和(b)允许一种CRISPR复合物结合到一个靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割,其中该CRISPR复合物包含与(1)可杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交到该tracr上的该tracr配对序列复合的CRISPR酶,由此产生包含突变的疾病基因的模式真核细胞。在一些实施例中,所述切割包括通过所述CRISPR酶切割在该靶序列位置的一条或两条链。在一些实施例中,所述切割导致靶基因的转录降低。在一些实施例中,该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一种突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。
[0066] 在一个方面,本发明提供了通过在一个或多个原核细胞中的基因中引入一个或多个突变来选择一种或多种原核细胞的方法,该方法包括:将一种或多种载体引入一种或多种原核细胞中,其中该一种或多种载体驱动下列一者或多者的表达:CRISPR酶、连接到tracr配对序列上的指导序列、tracr序列、以及编辑模板;其中该编辑模板包含消除CRISPR酶切的一个或多个突变;允许该编辑模板与靶多核苷酸在有待筛选的一种或多种细胞中进行同源重组;允许CRISPR复合物结合到靶多核苷酸上以实施在所述基因内的该靶多核苷酸的切割,其中该CRISPR复合物包含与(1)可杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交到该tracr上的该tracr配对序列复合的CRISPR酶,其中该CRISPR复合物与该靶多核苷酸的结合诱导细胞死亡,由此允许选择其中已经引入一个或多个突变的一种或多种原核细胞。在一个优选的实施例中,该CRISPR酶是Cas9。在本发明的另一方面,该有待选择的细胞可以是真核细胞。本发明的方面允许选择特异细胞,而不需要选择标记或可能包括反选择系统的两步法。
[0067] 在一个方面,本发明提供了用于修饰在一种真核细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包括与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。
[0068] 在其他实施例中,本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸的表达。
[0069] 在希望的情况下,为了实施在细胞中的表达的修饰,将包含tracr序列、连接到该tracr配对序列上的指导序列、编码CRISPR酶的序列的一种或多种载体递送到细胞。在一些方法中,该一种或多种载体包括:可操作地连接到编码所述CRISPR酶的酶编码序列上的调节元件,该CRISPR酶包含核定位序列;以及可操作地连接至tracr配对序列的调节元件和用于在该tracr配对序列的上游插入指导序列的一个或多个插入位点。当表达时,该指导序列指导CRISPR复合物与细胞中的一个靶序列的序列特异性结合。典型地,该CRISPR复合物包含与(1)可杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的CRISPR酶。
[0070] 在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当CRISPR复合物结合到细胞中的靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白质或微小RNA编码序列失活,这样使得该蛋白质不被产生。
[0071] 在某些实施例中,该CRISPR酶包含一个或多个突变D10A、E762A、H840A、N854A、N863A或D986A和/或该一个或多个突变在该CRISPR酶的RuvC1或HNH结构域中或者为如本文另外论述的突变。在一些实施例中,该CRISPR酶具有一个或多个在催化结构域中的突变,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该酶进一步包含一个功能结构域。在一些实施例中,突变的Cas9酶可以融合至蛋白质结构域,例如像转录激活结构域。在一个方面,转录激活结构域是VP64。在一些实施例中,转录阻遏结构域是KRAB。在一些实施例中,转录阻遏结构域是SID、或SID的多联体(即SID4X)。在一些实施例中,提供了一种表观遗传修饰酶。在一些实施例中,提供了激活结构域,它可以是P65激活结构域。
[0072] 在一些实施例中,该CRISPR酶是I型或III型CRISPR酶,优选II型CRISPR酶。这种II型CRISPR酶可以是任何Cas酶。一种Cas酶可以被鉴定为Cas9,因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地,该Cas9酶来自或衍生自spCas9或saCas9。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本文所述它在某些方面已经被突变(修饰)。
[0073] 本发明还提供了一种修饰细胞中的感兴趣座位处的DNA双链体的方法,该方法包括向该细胞递送:I.包含以下项的第一多核苷酸:
(a)第一指导序列,该第一指导序列能够杂交到第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列;
II.包含以下项的第二多核苷酸:
(a)第二指导序列,该第二指导序列能够杂交到第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列;
以及
III.第三多核苷酸,其包含对CRISPR酶和一个或多个核定位序列进行编码的序列
其中在所述第一多核苷酸和第二多核苷酸中的(a)、(b)和(c)是以5’到3’方向排列;
其中该第一靶序列在该DNA双链体的第一链上并且该第二靶序列在该DNA双链体的相
对链上,并且在该第一指导序列和第二指导序列杂交到该双链体中的所述靶序列上时,该第一多核苷酸和该第二多核苷酸的5’端相对于彼此偏移该双链体的至少一个碱基对;
其中在转录时,该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一
tracr序列和第二tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到该第一tracr序列上的该第一tracr配对序列复合的CRISPR酶,
其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到该第二tracr序列上的该第二tracr配对序列复合的CRISPR酶,
并且其中该DNA双链体的所述第一链在邻近所述第一靶序列处被切割,并且该DNA双链体的所述相对链在邻近所述第二靶序列处被切割,从而产生具有5’突出端或3’突出端的双链断裂。
[0074] 本发明还提供了一种修饰细胞中的感兴趣座位处的DNA双链体的方法,该方法包括向该细胞递送载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含:I.包含调节元件的第一多核苷酸序列,该调节元件可操作地连接至
(a)第一指导序列,该第一指导序列能够杂交到第一靶序列上,和
(b)至少一种或多种tracr配对序列,
II.包含第二调节元件的第二多核苷酸序列,该第二调节元件可操作地连接至
(a)第二指导序列,该第二指导序列能够杂交到第二靶序列上,和
(b)至少一种或多种tracr配对序列,
III.包含第三调节元件的第三多核苷酸序列,该第三调节元件可操作地连接至编码
CRISPR酶的序列上,以及
IV.包含第四调节元件的第四多核苷酸序列,该第四调节元件可操作地连接至tracr序列上,
其中组分I、II、III和IV位于该系统的相同或不同载体上
其中该第一靶序列在该DNA双链体的第一链上并且该第二靶序列在该DNA双链体的相
对链上,并且在该第一指导序列和第二指导序列杂交到该双链体中的所述靶序列上时,该第一多核苷酸和该第二多核苷酸的5’端相对于彼此偏移该双链体的至少一个碱基对;
其中在转录时,该第一tracr配对序列和该第二tracr配对序列杂交到tracr序列上,并且该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合,
其中该第一CRISPR复合物包含与(1)可杂交到该第一靶序列上的该第一指导序列、和(2)杂交到tracr序列上的该第一tracr配对序列复合的CRISPR酶,
其中该第二CRISPR复合物包含与(1)可杂交到该第二靶序列上的该第二指导序列、和(2)杂交到tracr序列上的该第二tracr配对序列复合的CRISPR酶,
并且其中该DNA双链体的所述第一链在邻近所述第一靶序列处被切割,并且该DNA双链体的所述相对链在邻近所述第二靶序列处被切割,从而产生具有5’突出端或3’突出端的双链断裂。
[0075] 在本发明的方法中,该CRISPR酶有利地是切口酶,任选地是在催化结构域中包含至少一个突变的Cas9酶。例如,在RuvC结构域中可以有至少一个突变,并且该突变任选地选自下组,该组由以下各项组成:D10A、E762A和D986A,或者该突变是在HNH结构域中并且任选地选自下组,该组由以下各项组成:H840A、N854A和N863A。在本发明的方法中,有利地该第一多核苷酸与该第二多核苷酸的5’端之间的偏移可以是大于-8bp、或-278至+58bp、或-200至+200bp、或多达或超过100bp、或-4至20bp、或+23bp、或+16、或+20、或+16至+20bp、或-3至+18bp;并且应理解在适当时针对bp可以使用术语核苷酸或nt。有利地,在本发明的方法中,该DNA双链体的所述第一链和所述相对链的切割发生在每条链上的PAM(原型间隔子邻近基序)的3’处,并且其中所述第一链上的所述PAM是以从30至150个碱基对与所述相对链上的所述PAM分开。在本发明的方法中,该突出端可以是至多200个碱基、至多100个碱基、或至多50个碱基;例如该突出端是至少1个碱基、至少10个碱基、至少15个碱基、至少26个碱基或至少30个碱基;或者,该该突出端可以是在34和50个碱基之间,或在1和34个碱基之间。有利地,在本发明的方法中,编码该CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA,并且任选地其中I、II和III中的任一者或全部是经由纳米粒子、外泌体、微囊泡、或基因枪递送的。在本发明的方法中,有利地,该第一tracr配对序列和第二tracr配对序列可以共享100%的一致性和/或该第一tracr序列和第二tracr序列共享
100%的一致性。例如,I、II和III中的每者可以被提供于载体中,任选地其中每者被提供于相同或不同的载体中。在本发明的方法中的感兴趣座位可以包含基因,并且其中所述方法导致所述基因的表达的改变,或导致该基因产物的活性或功能的改变。例如,该基因产物可以是蛋白质,和/或其中所述表达、活性或功能的改变是所述表达、活性或功能的降低。本发明的方法可以进一步包括:(a)向该细胞递送双链寡脱核苷酸(dsODN),该双链寡脱氧核苷酸包含与通过所述双链断裂产生的突出端互补的突出端,其中所述dsODN被整合进该感兴趣座位中;或–(b)向该细胞递送单链寡脱氧核苷酸(ssODN),其中所述ssODN充当所述双链断裂的同源定向修复的模板。本发明的方法可以用于预防或治疗个体的疾病,任选地其中所述疾病是由所述感兴趣座位中的缺陷引起。本发明的方法可以是在该个体的体内进行或针对取自该个体的细胞离体地进行,任选地其中将所述细胞返回到该个体。
[0076] 本发明还提供了一种试剂盒或组合物,该试剂盒或组合物包含:I.包含以下项的第一多核苷酸:
(a)第一指导序列,该第一指导序列能够杂交到第一靶序列上,
(b)第一tracr配对序列,和
(c)第一tracr序列;
II.包含以下项的第二多核苷酸:
(a)第二指导序列,该第二指导序列能够杂交到第二靶序列上,
(b)第二tracr配对序列,和
(c)第二tracr序列;
以及
III.第三多核苷酸,其包含对CRISPR酶和一个或多个核定位序列进行编码的序列
其中在所述第一多核苷酸和第二多核苷酸中的(a)、(b)和(c)是以5’到3’方向排列;
其中该第一靶序列在DNA双链体的第一链上并且该第二靶序列在该DNA双链体的相对
链上,并且在该第一指导序列和第二指导序列杂交到该双链体中的所述靶序列上时,该第一多核苷酸和该第二多核苷酸的5’端相对于彼此偏移该双链体的至少一个碱基对,并且任选地其中I、II和III中的每者被提供于相同或不同的载体中。
[0077] 本发明还提供了根据本发明的试剂盒或组合物在本发明的方法中的用途。本发明还提供了本发明的试剂盒或组合物在制造药剂中的用途,任选地其中所述药剂是用于预防或治疗由所述感兴趣座位中的缺陷引起的疾病。
[0078] 应当理解的是,术语Cas和CRISPR酶在本文中通常可互换地使用,除非另外说明。如上提及的,在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶。然而,应当理解的是,本发明包括更多的来自其他微生物物种的Cas9,如SpCas9、SaCa9、St1Cas9等等。
[0079] 本文中提供了在这种情形下针对人类进行优化(即,针对在人类中表达进行优化)的密码子优化序列的实例,参见SaCas9人类密码子优化序列。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官(如脑)的密码子优化是已知的。
[0080] 在一个方面,递送是以载体的形式。在一个方面,该载体可以是病毒载体,如慢病毒或杆状病毒或优选地腺病毒/腺病毒相关病毒载体,但是其他递送手段也是已知的(如酵母系统、微囊泡、基因枪/将载体附接到金纳米粒子上的手段)并且被提供。载体可能不仅是指病毒或酵母系统(例如,在感兴趣的核酸可被可操作地连接到启动子上并且在其控制下(就表达而言,从而最终提供加工的RNA)的情况下),而且引导核酸递送到宿主细胞中。虽然在本文的方法中该载体可以是病毒载体并且AAV在这里是有利的,但是可以采用如本文论述的其他病毒载体。例如,杆状病毒可以用于昆虫细胞中的表达。这些昆虫细胞进而可用于产生大量的其他载体,如适合于本发明递送的AAV载体。还设想了一种递送本发明CRISPR酶的方法,该方法包括向细胞递送编码该CRISPR酶的mRNA。应当理解的是,该CRISPR酶被截短,由少于一千个氨基酸或少于四千个氨基酸组成,是核酸酶或切口酶,是经密码子优化的,包含一个或多个突变,和/或包含嵌合CRISPR酶,或如本文论述的其他选项。AAV病毒载体是优选的。
[0081] 在某些实施例中,该靶序列在其3’端的侧翼或下游为适合于CRISPR酶(典型地Cas,并且尤其是Cas9)的PAM。
[0082] 例如,适合的PAM是分别针对SpCas9或SaCas9酶(或衍生的酶)的5'-NRG或5'-NNGRR。
[0083] 应当理解的是,SpCas9或SaCas9是来自或衍生自化脓链球菌或金黄色葡萄球菌Cas9的那些。
[0084] 因此,本发明的目的在于,在本发明中不涵盖任何先前已知的产品、制造该产品的过程、或使用该产品的方法,使得申请人保留和特此公开放弃任何先前已知的产品、过程、或方法的权利。进一步指出的是,在本发明的范围之内,本发明并不旨在涵盖任何产品、过程、或该产品的制造或使用该产品的方法,其不符合USPTO(35U.S.C.§112,第一段)或EPO(EPC的第83条)的书面说明和可实施性要求,使得申请人保留和特此公开放弃任何先前描述的产品、制造该产品的过程、或使用该产品的方法的权利。
[0085] 应注意,在本披露并且特别是在权利要求书和/或段落中,术语如“包括(comprise)”、“包括的(comprised)”、“包括了(comprising)”等等可具有在美国专利法中属于它的含义;例如,它们可以表示“包含(includes)”、“包含的(included)”、“包含了(including)”等等;并且这些术语如“基本上由……组成(consisting essentially of)”和“基本上由……组成(consists essentially of)”具有在美国专利法中归于它们的含义,例如,它们允许未被明确叙述的要素,但是排除在现有技术中发现或者影响本发明的基本或新颖特征的要素。
[0086] 这些和其他实施例披露于以下详细说明中,或者据其显而易见并且由其涵盖。附图简要说明
[0087] 本发明的新颖特征在所附权利要求书中具体提出。通过参考对说明性实施例进行叙述的以下详细说明,将获得对本发明的特征和优点的更好理解,在这些实施例中利用了本发明的原理,并且在这些附图中:
[0088] 图1显示了该CRISPR系统的示意模型。来自化脓链球菌(黄色)的Cas9核酸酶经由合成的指导RNA(sgRNA)而靶向基因组DNA,该指导RNA由20-nt指导序列(蓝色)和支架(红色)组成。与DNA靶(蓝色)的指导序列碱基对,直接地在必要的5’-NGG原型间隔子邻近基序(PAM;红紫色)的上游,并且Cas9在该PAM(红色三形)的上游约3bp介导了双链断裂(DSB)。
[0089] 图2显示了用于评价来自化脓链球菌的Cas9的切割特异性而进行的示意表示测定。相对于以%计的切割效率标出了指导RNA序列与靶DNA之间的单碱基对错配。
[0090] 图3是Cas基因的环状系统发生树
[0091] 图4A-F显示了揭示五个Cas9家族的线性系统发生分析,这五个家族包括三组大的Cas9(约1400个氨基酸)和两组小的Cas9(约1100个氨基酸)。
[0092] 图5显示了代表Cas9直向同源物的长度分布的曲线图。
[0093] 图6A-M显示了在突变点位于SpCas9基因内的情况下的序列。
[0094] 图7A显示了条件型Cas9、Rosa26靶向载体图谱。
[0095] 图7B显示了组成型Cas9、Rosa26靶向载体图谱。
[0096] 图8显示了在组成型和条件型Cas9构建体中的重要元件的示意图。
[0097] 图9显示了递送和体内小鼠脑Cas9表达数据。
[0098] 图10显示了Cas9和嵌合RNA到细胞中的RNA递送(A)GFP报告基因作为DNA或mRNA到Neuro-2A细胞中的递送。(B)针对作为RNA的Icam2基因的Cas9和嵌合RNA的递送导致测试的两个间隔子之一的切割。(C)针对作为RNA的F7基因的Cas9和嵌合RNA的递送导致测试的两个间隔子之一的切割。
[0099] 图11显示了DNA双链断裂(DSB)修复如何促进基因编辑。在易错非同源末端连接(NHEJ)途径中,DSB的末端由内源DNA修复机构加工并重新连接在一起,可导致在连接位点的随机插入/缺失(indel)突变。发生在基因编码区内的indel突变可产生移码和提前终止密码子,导致基因敲除。可替代地,处于质粒或单链寡脱氧核苷酸(ssODN)形式的修复模板可以被提供为利用同源定向修复(HDR)途径,该途径允许高保真和精确编辑。
[0100] 图12A-C显示了在HEK和HUES9细胞中的HDR的预期结果。(a)具有同源臂的靶向质粒或ssODN(有义或反义)可以用来编辑在靶基因组座位处由Cas9(红色三角形)切割的序列。为了分析HDR的效率,我们在靶座位中引入了HindIII位点(红条),用在同源区外部退火的引物进行PCR扩增。用HindIII消化该PCR产物揭示了HDR事件的存在。(b)相对于感兴趣基因组的有义方向或反义方向(s或a)定向的ssODN可以与Cas9组合使用,以实现有效的在该靶座位处的HDR介导的编辑。在该修饰(红条)的任一侧面上,推荐40bp、并且优选90bp的最小同源区。(c)使用野生型Cas9和Cas9切口酶(D10A)两者,显示了在EMX1座位中的HDR上的ssODN的作用的实例。每个ssODN含有90bp的同源臂,这些同源臂侧接两个限制性位点的12-bp插入片物。
[0101] 图13显示了囊性纤维化δF508突变的修复策略。
[0102] 图14(a)显示了在FXN内含子1中的GAA重复扩展的示意图并且(b)显示了所采用的使用该CRISPR/Cas系统切除该GAA扩展区的策略的示意图。
[0103] 图15显示了Tet1-3和Dnmt1、3a和3b座位的有效的SpCas9介导的靶向的筛选。通过使用不同的gRNA,在来自转染的N2A细胞的DNA上的Surveyor测定证明了有效的DNA切割。
[0104] 图16显示了使用AAV1/2递送系统中的2载体系统进行的多元基因组靶向策略。Tet1-3和Dnmt1、3a和3b gRNA在U6启动子的控制之下。GFP-KASH在人突触蛋白启动子的控制之下。限制性侧面显示了经由亚克隆的简单gRNA置换策略。显示了侧翼为两个核定位信号(NLS)的、HA标记的SpCas9。两种载体都以1:1比率通过AAV1/2病毒递送到脑中。
[0105] 图17显示了使用Surveyor测定进行的多元DNMT靶向载体#1的功能性的验证。用DNMT靶向载体#1(+)和SpCas9编码载体共转染N2A细胞,以便检测SpCas9介导的DNMT基因家族座位的切割。阴性对照是仅有gRNA(-)。收获细胞用于DNA纯化,并且在转染后48小时进行下游加工。
[0106] 图18显示了使用Surveyor测定进行的多元DNMT靶向载体#2的功能性的验证。用DNMT靶向载体#1(+)和SpCas9编码载体共转染N2A细胞,以便检测SpCas9介导的DNMT基因家族座位的切割。阴性对照是仅有gRNA(-)。收获细胞用于DNA纯化,并且在转染后48小时进行下游加工。
[0107] 图19显示了用于体内HA-SpCas9表达的短启动子和短polyA版本的示意性概述。从L-ITR到R-ITR的编码区的大小显示在右边。
[0108] 图20显示了用于体内HA-SaCas9表达的短启动子和短polyA版本的示意性概述。从L-ITR到R-ITR的编码区的大小显示在右边。
[0109] 图21显示了SpCas9和SaCas9在N2A细胞中的表达。在不同的短启动子的控制之下并且具有短polyA(spA)序列的、HA标记的SpCas9和SaCas9版本的代表性Western印迹。微管蛋白是加载对照。mCherry(mCh)是一种转染对照。收获细胞并进一步加工,以便在转染后48小时进行Western印迹。
[0110] 图22显示了有效的SaCas9介导的Tet3基因座位的靶向的筛选。通过使用具有NNGGGT PUM序列的不同的gRNA,在来自转染的N2A细胞的DNA上的Surveyor测定证明了有效的DNA切割。GFP转染的细胞和仅仅表达SaCas9的细胞是对照。
[0111] 图23显示了HA-SaCas9在小鼠脑中的表达。用在人突触蛋白启动子控制之下驱动HA-SaCas9表达的病毒注射到动物的齿状脑回中。在手术后2周将动物处死。使用兔单克隆抗体C29F4(细胞信号传导)检测HA标签。用DAPI染料将细胞核染成蓝色。
[0112] 图24显示了SpCas9和SaCas9在转导后7天的培养物中的皮层初级神经元中的表达。在不同的启动子的控制之下并且具有bgh或短polyA(spA)序列的、HA标记的SpCas9和SaCas9版本的代表性Western印迹。微管蛋白是加载对照。
[0113] 图25显示了在用携带具有不同启动子的SpCas9和多元gRNA构建体(显示在DNMT的最后一个小图上的实例)的AAV1粒子转导之后7天的初级皮层神经元的LIVE/DEAD染色。将AAV转导之后的神经元与未转导的对照神经元进行比较。红色细胞核指示渗透化处理的死细胞(小图的第二条线)。活细胞标记为绿色(小图的第三条线)。
[0114] 图26显示了用携带具有不同启动子的SaCas9的AAV1粒子转导之后7天的初级皮层神经元的LIVE/DEAD染色。红色细胞核指示渗透化处理的死细胞(小图的第二条线)。活细胞标记为绿色(小图的第三条线)。
[0115] 图27显示了在用携带用于TET和DNMT基因座位的SpCas9和gRNA多元体的AAV1病毒转导之后的神经元的形态学比较。未转导的神经元作为对照示出。
[0116] 图28显示了在初级皮层神经元中使用Surveyor测定进行的多元DNMT靶向载体#1的功能性的验证。用DNMT靶向载体#1和具有不同启动子的SpCas9病毒共转导细胞,以便检测SpCas9介导的DNMT基因家族座位的切割。
[0117] 图29显示了在脑中SpCas9切割的体内效率。用携带多元靶向DNMT家族基因座位的gRNA的AAV1/2病毒连同在2个不同的启动子(小鼠Mecp2和大鼠Map1b)控制之下的SpCas9病毒注射小鼠。在注射两周之后提取脑组织,并且基于由来自gRNA多元构建体的突触蛋白启动子驱动的GFP表达,使用FACS制备和分选细胞核。在gDNA提取之后,进行Surveyor测定。+指示GFP阳性细胞核,–为对照,来自相同动物的GFP阴性细胞核。在凝胶上的数字指示评估的SpCas9效率。
[0118] 图30显示了GFP-KASH标记的、来自海体神经元的细胞核的纯化。用GFP与KASH蛋白跨膜结构域的融合体标记细胞核膜的外层核膜(ONM)。在立体定向手术和AAV1/2注射之后一周GFP在脑中强表达。进行密度梯度离心步骤纯化来自完整脑的细胞核。显示了纯化的TM细胞核。通过 DyeCycle Ruby染色的染色质染色显示为红色,GFP标记的细胞核
为绿色。GFP+和GFP-细胞核的代表性FACS分布图(红紫色: DyeCycleTMRuby染色,
绿色:GFP)。
[0119] 图31显示了在小鼠脑中SpCas9切割的效率。用携带多元靶向TET家族基因座位的gRNA的AAV1/2病毒连同在2个不同的启动子(小鼠Mecp2和大鼠Map1b)控制之下的SpCas9病毒注射小鼠。在注射三周之后提取脑组织,基于由来自gRNA多元构建体的突触蛋白启动子驱动的GFP表达,使用FACS制备和分选细胞核。在gDNA提取之后,进行Surveyor测定。+指示GFP阳性细胞核,–为对照,来自相同动物的GFP阴性细胞核。在凝胶上的数字指示评估的SpCas9效率。
[0120] 图32显示了在培养物中的皮层神经元中的GFP-KASH表达。用携带靶向TET基因座位的gRNA多元构建体的AAV1病毒转导神经元。由于KASH结构域定位,最强信号位于细胞核周围。
[0121] 图33显示了(上)在指导RNA对之间的间隔的清单(如由两个PAM序列的排列模式指示)。当与SpCas9(D10A)切口酶一起使用时,仅有满足模式1、2、3、4的指导RNA对展现出indel。(下)凝胶图像显示,SpCas9(D10A)与满足模式1、2、3、4的指导RNA对的组合导致靶位点中的indel的形成。
[0122] 图34显示了用来产生U6-指导RNA表达盒的U6反向引物序列的清单。每个引物需要与U6正向引物“gcactgagggcctatttcccatgattc”配对,以便产生含有U6和所希望的指导RNA的扩增子
[0123] 图35显示了来自人Emx1座位的基因组序列图谱,显示了在图33中列出的24个模式的位置。
[0124] 图36显示了(右侧)指示当由不同指导RNA对靶向的Cas9切口酶切割之后存在可变5’突出端时在靶位点处的indel形成的凝胶图像。(左侧)为指示在右侧凝胶上的泳道数目和不同参数的表,这些参数包括鉴定所使用的指导RNA对和在由Cas9切口酶切割之后存在的5’突出端的长度。
[0125] 图37显示了来自人Emx1座位的基因组序列图谱,其显示了导致图36(右侧)的凝胶模式并且在实例30中进一步描述的不同的指导RNA对的位置。
[0126] 图38显示了指导序列延伸对Cas9活性的影响(A)示意图,显示具有靶向人EMX1基因内的座位(靶标1)的匹配或错配sgRNA序列的Cas9。(B)SURVEYOR测定凝胶,显示由携带20-nt和30-nt长的指导序列的sgRNA对靶标1进行的可比修饰。(C)Northern印记,显示延伸的sgRNA在HEK 293FT细胞中大多恢复为20-nt指导长度sgRNA。
[0127] 图39显示双切促进人类细胞中的高效基因组编辑(A)示意图,展示使用一对sgRNA指导的Cas9D10A切口酶(Cas9n)造成的DNA双链断裂。D10A突变使得Cas9仅仅能够切割与该sgRNA互补的链;一对sgRNA-Cas9n复合物可以同时在两条链上形成切口。sgRNA偏移被定义为给定sgRNA对的指导序列的PAM-远(5’)端之间的距离;正偏移需要互补于上链的sgRNA(sgRNA a)是在互补于下链的sgRNA(sgRNA b)的5’,这样常常产生5’-突出端。(B)双切诱导的NHEJ的效率,随着两个sgRNA之间的偏移距离而变化。对于使用的所有sgRNA的序列可以发现于表S1中。(n=3;误差条显示平均值±s.e.m.)(C)由Cas9n靶向的人EMX1座位的代表序列。分别通过蓝条和红紫色条指示sgRNA靶位点和PAM。下方,选定的序列显示了代表性indel。还参见图44和图45。
[0128] 图40显示了双切促进人类细胞中的高效基因组编辑(A)示意图,展示了Cas9n双切(红色箭头)人EMX1座位。选择与EMX1靶标1具有序列同源性的五个脱靶座位来针对Cas9n特异性进行筛选。(B)由Cas9n和一对sgRNA产生的中靶修饰率与由野生型Cas9和单一sgRNA介导的那些是可比的(左图)。Cas9-sgRNA 1复合物产生显著的脱靶诱变,而用Cas9n时未检测到脱靶座位修饰(右图)。(C)通过对转染的HEK 293FT细胞进行深度测序,针对indel修饰来检查sgRNA 1的五个脱靶座位。(n=3,误差条显示平均值±s.e.m.)(D)在脱靶位点处采用双切的Cas9n与只采用sgRNA 1的野生型Cas9的特异性比较。特异性比率计算为中靶/脱靶修饰率。(n=3;误差条显示平均值±s.e.m.)(E、F)双切使在两个另外的人VEGFA座位处的脱靶修饰最小化,而同时保持高特异性(中靶/脱靶修饰比率;n=3,误差条显示平均值±s.e.m.)。
[0129] 图41显示双切允许在人类细胞中经由HDR插入基因组中(A)示意图,展示了在由一对Cas9n酶产生的DSB处,经由单链寡脱氧核苷酸(ssODN)模板介导的HDR。包含HindIII限制性酶切位点的12-nt序列(红色)在由灰色虚线标记的位置处插入EMX1座位中;Cas9n-介导的切口距离HDR插入位点的距离以斜体指示在顶部。(B)限制酶切消化测定凝胶,显示了在HEK 293FT细胞中通过双切介导的HDR成功插入HindIII切割位点。上方条带是未修饰的模板;下方条带是HindIII切割产物。(C)在HUES62人类胚胎干细胞系中双切促进HDR。HDR频率是通过深度测序确定的。(n=3;误差条显示平均值±s.e.m.)。(D)HDR效率取决于Cas9或Cas9n-介导的切口的构型。当切口出现在ssODN同源臂(HDR插入位点)的中心附近时HDR被促进,产生5’-所得突出端。切口构型是以位置和链(红色箭头)以及突出端的长度(黑线)注解(左图)。每个切口距离HDR插入位点的距离(bp)是以斜体指示于黑线结尾处,并且sgRNA的位置是以粗体展示在EMX1座位的示意图上。显示了由采用配对sgRNA的情况下双切介导的(顶部图)或者由单一sgRNA与Cas9或Cas9n介导的(底部图,图45;n=3,误差条显示平均值±s.e.m.)HDR效率。
[0130] 图42显示多元切口形成促进了非-HR介导的基因整合和基因组缺失(A)示意图,显示携带互补于由Cas9双切产生的5’突出端的突出端的双链寡脱氧核苷酸(dsODN)供体片段的插入。dsODN被设计为去除天然EMX1终止密码子,并且在框内包含HA标签、3X FLAG标签、HindIII限制酶切位点、Myc表位标签、以及终止密码子,总计148bp。成功的插入是通过如所示的桑格测序(1/37筛选的克隆)来验证。修饰座位的氨基酸翻译显示于DNA序列之下。(B)四种sgRNA与Cas9n的共递送在DYRK1A座位中产生长范围的基因组缺失(从0.5kb高达6kb)。缺失是使用跨靶区域的引物(表S6)检测到的。
[0131] 图43显示了Cas9双切介导小鼠胚胎中的高效indel形成(A)示意图,展示了Cas9n双切小鼠Mecp2座位。显示共注射了体外转录的Cas9n-编码mRNA和匹配靶标92和93的sgRNA对的小鼠囊胚的代表性indel。(B)高效囊胚修饰是在多个浓度的sgRNA(1.5至50ng/uL)和野生型Cas9或Cas9n(ng/uL至100ng/uL)下实现的。
[0132] 图44A-F显示了与Cas9切口酶(D10A)一起使用的sgRNA对的清单,以鉴别用于跨多个基因进行双切的最优的靶位点间隔,与图39相关。N.D.:未检测到。N.T.:未测试[0133] 图45A-D显示了用于实例31中的sgRNA的清单。与图39相关。本发明的详细说明
[0134] 关于对CRISPR-Cas系统的一般信息:参考分别提交于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日的美国临时申请61/
758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130。还参考分别提交于2013年6月17日;2013年7月17日、2013年8月5日和2013年8月28日的美国临时专利申请
61/836,123、61/847,537、61/862,355和61/871,301。进一步参考分别提交于2012年12月12日和2013年1月2日的美国临时专利申请61/736,527和61/748,427。另外参考提交于2013年
3月15日的美国临时专利申请61/791,409。还参考提交于2013年3月15日的美国临时专利申请61/799,800。还参考各自提交于2013年6月17日的美国临时专利申请61/835,931、61/
835,936、61/836,127、61//836,101、61/836,123、61/836,080、和61/835,973。这些申请的每一个、以及在其中或在它们的审查程序期间引用的所有文件(“申请引用文件”)以及在这些申请引用文献中引用或参考的所有文件,连同其中提到的或在其中任何文件中提到并通过引用结合在其中的针对任何产品的任何说明书、说明、产品规格、和产品表,特此通过引用结合在此,并且可以在本发明的实践中采用。所有文件(例如,这些申请和申请引用文件)在如同每个单独文件被确切地且单独地指明为通过引用结合的相同程度上通过引用结合在此。
[0135] 另外关于CRISPR-Cas系统的一般信息,提及的是:使用CRISPR/Cas系统进行的多元基因组工程化(Multiplex genome engineering 
using CRISPR/Cas systems).丛(Cong),L.、兰(Ran),F.A.、科克斯(Cox)D.、林(Lin),S.、巴雷德(Barretto),R.、哈比卜(Habib),N.、徐(Hsu),P.D.、武(Wu),X.、江(Jiang),W.、马拉菲尼(Marraffini),L.A.,&张(Zhang),F《. 科学》(Science)2月15日;339(6121):819-23(2013);
使用CRISPR-Cas系统对细菌基因组进行RNA-指导的编辑(RNA-guided editing of 
bacterial genomes using CRISPR-Cas systems).江(Jiang)W.、比卡德(Bikard)D.、科克斯(Cox)D.、张(Zhang)F、马拉菲尼(Marraffini)LA《. 自然生物技术》(Nat Biotechnol Mar);31(3):233-9(2013);
通过CRISPR/Cas-介导的基因组工程化在多基因中携带突变的小鼠的一步产生
(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering).王(Wang)H.、杨(Yang)H.、奇瓦里拉(Shivalila)CS.、多拉蒂(Dawlaty)MM.、程(Cheng)AW.、张(Zhang)F.、耶尼施(Jaenisch)R《. 细胞》(Cell)5月9日;153(4):910-8(2013);
哺乳动物内源转录和外遗传状态的光控制(Optical control of mammalian 
endogenous transcription and epigenetic states).科纳曼(Konermann)S、布里格姆(Brigham)MD、特里维诺(Trevino)AE、徐(Hsu)PD、海登里希(Heidenreich)M、丛(Cong)L、普莱特(Platt)RJ、斯科特(Scott)DA、丘奇(Church)GM、张(Zhang)F《. 自然》(Nature).2013年
8月22日;500(7463):472-6.doi:10.1038/《自然》12466.电子版2013年8月23日;
通过RNA指导的CRISPR Cas9进行的双切以用于增强的基因组编辑特异性(Double 
Nicking by RNA-Guided CRISPR Cas9for Enhanced Genome Editing Specificity).兰(Ran),FA.、徐(Hsu),PD.、林(Lin),CY.、古滕伯格(Gootenberg),JS.、科纳曼(Konermann),S.、特里维诺(Trevino),AE.、斯科特(Scott),DA.、井上(Inoue),A.、马托巴(Matoba),S.、张(Zhang),Y.,&张(Zhang),F《. 细胞》(Cell)8月28日.pii:S0092-8674(13)01015-5.(2013);
RNA指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-
guided Cas9nucleases).徐(Hsu),P.、斯科特(Scott),D.、温斯坦(Weinstein),J.、兰(Ran),FA.、科纳曼(Konermann),S.、阿格瓦拉(Agarwala),V.、李(Li),Y.、法恩(Fine),E.、吴(Wu),X.、沙勒姆(Shalem),O.、克拉迪克(Cradick),TJ.、马拉菲尼(Marraffini),LA.、包(Bao),G.,&张(Zhang),F《. 自然生物技术》(Nat Biotechnol)doi:10.1038/nbt.2647(2013);
使用CRISPR-Cas9系统进行的基因组工程化(Genome engineering using the 
CRISPR-Cas9system).兰(Ran),FA.、徐(Hsu),PD.、赖特(Wright),J.、阿格瓦拉(Agarwala),V.、斯科特(Scott),DA.、张(Zhang),F《.自然工具》(Nature Protocols)十一月;8(11):2281-308.(2013);
在人类细胞中基因组规模CRISPR-Cas9敲除筛选(Genome-Scale CRISPR-
Cas9Knockout Screening in Human Cells).沙勒姆(Shalem),O.、桑耶纳(Sanjana),NE.、哈尔特宁(Hartenian),E.、史(Shi),X.、斯科特(Scott),DA.、迈克尔森(Mikkelson),T.、赫克尔(Heckl),D.、埃伯特(Ebert),BL.、罗特(Root),DE.、登奇(Doench),JG.、张(Zhang),F.《科学》(Science)12月12.(2013).[电子版先于印刷版];
在与指导RNA和靶DNA复合物中的cas9的晶体结构(Crystal structure of cas9in 
complex with guide RNA and target DNA).尼氏玛素(Nishimasu),H.、兰(Ran),FA.、徐(Hsu),PD.、科纳曼(Konermann),S.、舍哈塔(Shehata),SI.、多米耶(Dohmae),N.、石谷(Ishitani),R.、张(Zhang),F.、努尔基(Nureki),O《. 细胞》(Cell)2月27.(2014).156(5):
935-49;
在哺乳动物细胞中CRISPR内切核酸酶Cas9的基因组宽结合(Genome-wide binding 
of the CRISPR endonuclease Cas9in mammalian cells).吴(Wu)X.、斯科特(Scott)DA.、凯里兹(Kriz)AJ.、邱(Chiu)AC.、徐(Hsu)PD.、达东(Dadon)DB.、程(Cheng)AW.、特里维诺(Trevino)AE.、科纳曼(Konermann)S.、陈(Chen)S.、耶尼施(Jaenisch)R.、张(Zhang)F.、夏普(Sharp)PA《. 自然生物技术》(Nat Biotechnol.)(2014)4月20日.doi:10.1038/
nbt.2889,以及
用于基因组工程化的CRISPR-Cas9的开发与应用(Development and Applications 
of CRISPR-Cas9for Genome Engineering),徐(Hsu)等人,《细胞》(Cell)157,1262-1278(2014年6月5日)(徐2014),
将这些文献的每一个通过引用结合在此,并且简要讨论如下:
■丛(Cong)等人基于嗜热链球菌Cas9以及还有化脓链球菌Cas9两者改造了II型
CRISPR/Cas系统以用于在真核细胞中使用,并且证实了Cas9分子可以通过短RNA指导以诱导在人类和小鼠细胞中DNA的精确切割。他们的研究进一步显示Cas9在转化成一种切口酶时可以用来以最低诱变活性促进在真核细胞中的同源定向修复。另外,他们的研究证实多个指导序列可以被编码进单一CRISPR阵列中以使得能够在哺乳动物基因组内的内源性基因组座位位点处同时编辑若干,证实了RNA指导的核酸酶技术的容易可编程性和广泛可应用性。这种使用RNA以编程细胞内序列特异性DNA切割的能力定义了新一类的基因组编辑工具。这些研究进一步显示,其他CRISPR座位可能是可移植入哺乳动物细胞中的,并且还可以介导哺乳动物基因组切割。重要地,可以设想的是CRISPR/Cas系统的若干方面可以进一步改进以增加其效率和多功能性。
■江(Jiang)等人使用规律间隔成簇短回文重复(CRISPR)–关联的Cas9内切核酸酶,与双-RNA复合,以在炎链球菌和大肠杆菌的基因组中引入精确的突变。该途径依赖于在靶基因组位点处的双-RNA:Cas9-引导的切割,以杀死未突变的细胞,并且回避对选择性标记或反选择系统的需要。该研究报道通过改变短CRISPR RNA(crRNA)的序列以使单一-和多个多核苷酸变化被携带在编辑模板上而重编程双-RNA:Cas9特异性。该研究显示,同时使用两种crRNA使得多元诱变成为可能。另外,当该途径与重组工程组合使用时,在肺炎链球菌中使用描述的途径回收的接近100%的细胞包含希望的突变,并且在大肠杆菌中回收的65%包含突变。
■科纳曼(Konermann)等人解决了在本领域中对通用和稳固技术的需要,其使得能够基于CRISPR Cas9酶以及还有转录激活因子样效应子对DNA-结合结构域进行光调节和化学调节。
■如在本说明书中讨论的,来自微生物CRISPR-Cas系统的Cas9核酸酶通过20nt指导序列而靶向特异性基因组座位,其可以耐受与该DNA靶标的某些错配并由此促进不希望的脱靶诱变。为了解决此问题,兰(Ran)等人描述了将Cas9切口酶突变体与配对的指导RNA相组合以引入靶向的双链断裂的途径。因为基因组中的单独切口以高保真性被修复,所以同时经由适当补偿指导RNA而形成切口对于双链断裂是必需的,并且所述切口形成延伸了特异性识别的碱基的数目以用于靶标切割。作者证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50至1,500倍,并且从而促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。
■徐(Hsu)等人表征了在人类细胞中SpCas9靶向特异性以告知靶位点的选择并避免脱靶效应。该研究评价了在293T和293FT细胞中的>100个预测的基因组脱靶座位处>700个指导RNA变体和SpCas9-诱导的indel突变水平。这些作者示出SpCas9以序列依赖性方式耐受指导RNA与靶DNA之间在不同位置处的错配,对错配的数目、位置和分布敏感。这些作者进一步示出SpCas9-介导的切割不受DNA甲基化的影响,并且SpCas9和sgRNA的剂量可被滴定为使得脱靶修饰最小化。另外,为了促进哺乳动物基因组工程应用,这些作者报道提供基于网络的软件工具以指导靶序列的选择和验证连同脱靶分析。
■兰(Ran)等人描述了用于在哺乳动物细胞中Cas9-介导的经由非同源末端连接
(NHEJ)或同源定向修复(HDR)基因组编辑、连同产生修饰的细胞系(以用于下游功能研究)的一组工具。为了最小化脱靶切割,这些作者进一步描述了一种双-切口策略,使用的是Cas9切口酶突变体与配对的指导RNA。由这些作者提供的方案经实验得出用于选择靶位点、评价切割效率和分析脱靶活性的指南。这些研究显示,以靶设计开始,基因修饰可以在少至
1–2周内实现,并且修饰的克隆细胞系可以在2-3周内得以衍生。
■沙勒姆(Shalem)等人描述了新的在基因组广度范围上探询基因功能的方式。他们的研究显示,递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因,这些指导序列使得在人类细胞中阴性和阳性选择筛选两者成为可能。
首先,这些作者显示,使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑色素瘤模型中,这些作者针对基因进行筛选,这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B、和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的一致性以及高比率的命中确认,并且因此证实了采用Cas9进行基因组范围筛选的前景。
■尼氏玛素(Nishimasu)等人以2.5A°分辨率报道了与sgRNA复合的化脓链球菌Cas9以及其靶DNA的晶体结构。该结构揭示了一种由靶识别和核酸酶叶片组成的两叶片构造,其将sgRNA:DNA异源双链体容纳在它们的界面处的带正电的凹槽中。然而识别叶片对于结合sgRNA和DNA是至关重要的,核酸酶叶片包含HNH和RuvC核酸酶结构域,这些结构域适合地被定位为分别用于靶DNA的互补和非互补链的切割。核酸酶叶片还包含负责与原型间隔子邻近基序(PAM)相互作用的羧基-末端结构域。这种高分辨率结构和伴随的功能分析已经揭示了RNA-指导的由Cas9进行的DNA靶向的分子机制,由此为合理设计新的通用基因组编辑技术做好准备。
■吴(Wu)等人标定了在小鼠胚胎干细胞(mESC)中,来自化脓链球菌的无催化活性Cas9(dCas9)(加载有单一指导RNA(sgRNA))的基因组广度的结合位点。这些作者显示,测试的四种sgRNA中的每一种将dCas9靶向至数十和数千个之间的基因组位点,这些基因组位点频繁地通过sgRNA中的5-核苷酸种子区和NGG原型间隔子邻近基序(PAM)表征。染色质不可接近性降低了dCas9与具有匹配种子序列的其他位点的结合;因此70%的脱靶位点是与基因相关联的。这些作者显示,在用催化活性的Cas9转染的mESC中295dCas9结合位点的靶向测序鉴定出超过背景水平的仅一个突变位点。这些作者提出了一种针对Cas9结合和切割的两态模型,其中种子匹配触发了结合但是需要与靶DNA的广泛配对用于切割。
■徐(Hsu)2014是一篇综述文章,它大体讨论了CRISPR-Cas9的从酸奶到基因组编辑的历史,包括细胞的基因筛选,其在2014年6月5日之前提交的本说明书的谱系中的申请的信息、数据和发现中。徐2014的总体传授不涉及本说明书的特定模型、动物。
[0136] 本发明涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物的工程化和优化,该序列靶向例如涉及CRISPR-Cas系统及其组分的基因组干扰或基因编辑。在有利的实施例中,该Cas酶是Cas9。
[0137] 本发明方法的一个优点在于,该CRISPR系统避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶DNA的高度序列特异性的系统而实现的。
[0138] Cas9优化可以用来增强功能或者用来开发新的功能,人们可以产生嵌合Cas9蛋白。申请人已经产生的例子提供在实例6中。可以通过组合来自不同的Cas9同源物的片段而制成嵌合Cas9蛋白。例如,两种示例性嵌合Cas9蛋白来自本文描述的Cas9。例如,申请人使St1Cas9的N-末端(来自这种蛋白质的片段是粗体的)与SpCas9的C-末端融合。制造嵌合Cas9的益处包括下列任一项或全部:降低毒性;
改善在真核细胞中的表达;
特异性增强;
蛋白质分子量降低,通过组合来自不同Cas9同系物的最小结构域使蛋白质更小;和/或改变PAM序列要求。
[0139] 该Cas9可以用作通用的DNA结合蛋白。例如,如实例7中所示,通过使负责切割该DNA靶的两条链的两个催化结构域(D10和H840)突变,申请人使用Cas9作为通用的DNA结合蛋白。为了上调在靶座位的基因转录,申请人将转录激活结构域(VP64)融合到Cas9上。其他的转录激活结构域是已知的。如实例11中所示,转录激活是可能的。还如实例11中所示,使用结合到靶基因序列上的Cas9阻遏物(DNA结合域),基因阻遏(在β-连环蛋白基因的这种情况下)是可能的,由此阻遏其活性。
[0140] 还提供了转基因动物。优选实例包括含有Cas9(就编码Cas9的多核苷酸或该蛋白质自身而言)的动物。小鼠、大鼠和兔是优选的。为了用如本文示例的这些构建体产生转基因小鼠,人们可以将纯的线性DNA注射到来自假孕雌性(例如,CB56雌性)的受精卵的前核中。然后可以对首建者小鼠(founder)进行鉴定、基因分型,并与CB57小鼠回交。然后,例如通过桑格(Sanger)测序将这些构建体克隆和任选地进行证实。在例如一个或多个基因在模型中被敲除的情况下,设想了敲除。然而,还设想了敲入(单独或以组合方式)。产生了示例性敲入Cas9小鼠,并且这是示例性的,但是Cas9敲入是优选的。为了产生Cas9敲入小鼠,人们可以将相同的组成型和条件型构建体靶向到Rosa26座位上,如本文所述(图7A-B和8)。能够在产生转基因小鼠中采用CRISPR-Cas系统,这也被提供于原稿“通过CRISPR/Cas介导的基因组工程化来一步产生携带多个基因中的突变的小鼠(One-step generation of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering)”,王(Wang)等人,《细胞》(Cell)2013年5月9日;153(4):910-8.doi:10.1016/j.cell.2013.04.025.,电子出版于2013年5月2日,通过引用以其全文结合,其中证实了CRISPR/Cas介导的基因编辑允许小鼠胚胎干细胞中五个基因的高效的同时破坏。
[0141] 条件型Cas9小鼠的实用性:申请人已经在293细胞中显示,可以通过与Cre共表达而激活Cas9条件型表达构建体。申请人还显示,当表达Cre时,正确靶向的R1mESC可以具有活性Cas9。因为在Cas9之后为P2A肽切割序列并且然后为EGFP,申请人通过观察EGFP而鉴定成功表达。申请人已经表明在mESCs中的Cas9激活。这个相同的观念在于,什么使条件型Cas9小鼠如此有用。申请人可以将其条件型Cas9小鼠与普遍表达Cre的小鼠(ACTB-Cre系)杂交并且可以得到在每个细胞中表达Cas9的小鼠。应当仅仅采用嵌合的RNA的递送,以便诱导在胚胎小鼠或成年小鼠中的基因组编辑。有趣的是,如果条件型Cas9小鼠与在组织特异的启动子下表达Cre的小鼠杂交,在也表达Cre的组织中将会仅有Cas9。通过将嵌合的RNA递送到相同的组织中,此途径可以用来仅仅在精确的组织中编辑基因组。
[0142] 如上提及的,还提供了转基因动物,正如转基因植物一样,尤其是作物和藻类。转基因可用于在除了提供疾病模型之外的应用中。通过表达例如比通常在野生型中可见的更高的蛋白质、水化合物、营养素或维生素水平,这些应用可包括食物或饲料生产。在这方面,转基因植物,尤其是豆类和茎类,以及动物,尤其是哺乳动物,如家畜(奶牛绵羊、山羊和猪),而且还有禽类和食用昆虫,是优选的。
[0143] 转基因藻类或其他植物,如油菜,可以在植物油生物燃料例如像醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
[0144] 就体内递送而言,AAV相比于其他病毒载体是有利的,这是由于两个原因:o低毒性(这可以是由于纯化方法不需要细胞粒子的超速离心所致,而超速离心可能激活免疫反应)
o引起插入诱变的低概率,原因在于它未整合到宿主基因组中。
[0145] AAV具有4.5或4.75Kb的包装限制。这意味着Cas9以及启动子和转录终止子必须都配合在同一个病毒载体中。大于4.5或4.75Kb的构建体将导致病毒产生的显著降低。SpCas9是相当大的,其基因自身超过4.1Kb,使其难于包装到AAV中。因此本发明的实施例包括利用更短的Cas9同源物。例如:
[0146] 因此这些物种总体上是优选的Cas9物种。申请人已经示出了递送和体内小鼠脑Cas9表达数据。
[0147] 介导体内基因组修饰的、将Cas9编码核酸分子例如DNA包装到病毒载体中的两种方式是优选的:为了实现NHEJ介导的基因敲除:
单病毒载体:
含有两个或更多个表达盒的载体:
启动子-Cas9编码核酸分子-终止子
启动子-gRNA1-终止子
启动子-gRNA2-终止子
启动子-gRNA(N)-终止子(一直到载体的大小限制)
双病毒载体:
含有一个用于驱动Cas9表达的表达盒的载体1
启动子-Cas9编码核酸分子-终止子
含有一个或多个用于驱动一个或多个指导RNA表达的表达盒的载体2
启动子-gRNA1-终止子
启动子-gRNA(N)-终止子(一直到载体的大小限制)
为了介导同源定向修复。
除了上述单和双病毒载体途径之外,另外的载体可以用来递送同源定向修复模板。
[0148] 用来驱动Cas9编码核酸分子表达的启动子包括:AAV ITR可以用作一种启动子:这对于消除另外的启动子元件(可在载体中占用空间)的需要是有利的。空出来的另外的空间可以用来驱动另外的元件的表达(gRNA,等等)。同样,ITR活性是较弱的,因此可以用来降低由于Cas9的过表达所致的毒性。
对于遍存表达,可以使用启动子CMV、CAG、CBh、PGK、SV40、蛋白重链或轻链,等等。
对于脑表达,可以使用启动子:用于所有神经元的突触蛋白I、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT,等等。
对于肝脏表达,可以使用白蛋白启动子
对于肺表达,可以使用SP-B
对于内皮细胞,可以使用ICAM
对于造血细胞,可以使用IFNβ或CD45
对于成骨细胞,可以使用OG-2
用来驱动指导RNA的启动子可以包括:
Pol III启动子,如U6或H1
使用Pol II启动子和内含子盒来表达gRNA。
[0149] 关于AAV,AAV可以是AAV1、AAV2、AAV5或任何其组合。可以选择相对于有待被靶向的细胞的AAV的AAV;例如,可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂交体或衣壳AAV1、AAV2、AAV5或其任何组合;并且可以选择用于靶向心脏组织的AAV4。AAV8可用于递送到肝脏。以上启动子和载体是单独优选的。
[0150] RNA递送也是一种有用的体内递送方法。图9显示了递送和体内小鼠脑Cas9表达数据。有可能使用脂质体或纳米粒子将Cas9和gRNA(并且,例如,HR修复模板)递送到细胞中。因此,CRISPR酶如Cas9的递送和/或本发明的RNA的递送可以处于RNA的形式并且经由微囊泡、脂质体或纳米粒子来进行。例如,Cas9mRNA和gRNA可以被包装到脂质体粒子中用于体内递送。脂质体转染试剂例如来自生命技术公司(Life Technologies)的Invivofectamine以及市售的其他试剂可以有效地将RNA分子递送到肝脏中。
[0151] 提高NHEJ或HR效率也有助于递送。优选的是,NHEJ效率通过共表达末端加工酶(co-expressing end-processing enzyme)如Trex2而增强(杜米特拉切(Dumitrache)等人《遗传学》(Genetics)2011年8月;188(4):787–797)。优选的是,HR效率通过瞬时抑制NHEJ机构如Ku70和Ku86而增加。HR效率也可以通过共表达原核或真核同源重组酶如RecBCD、RecA而增加。
[0152] 本文描述了各种递送手段,并且进一步在这个部分中进行论述。
[0153] 病毒递送:该CRISPR酶,例如Cas9,和/或任何本发明的RNA,例如指导RNA,可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型、或其组合进行递送。Cas9以及一种或多种指导RNA可以包装到一种或多种病毒载体中。在一些实施例中,病毒载体可以,例如,通过肌肉注射递送到感兴趣组织中,而有时经由静脉内、经皮、鼻内、经口、粘膜、或其他递送方法进行病毒递送。这样的递送可以经由单剂量或多剂量来进行。本领域技术人员理解的是,本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化,如载体选择、靶细胞、生物、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型,等等。
[0154] 这样的剂量可以进一步含有,例如,载体(水、盐水、乙醇、甘油、乳糖、蔗糖磷酸、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油,等等)、稀释剂、药学上可接受的载体(例如,磷酸盐缓冲盐水)、药学上可接受的赋形剂、增强抗原性的佐剂、免疫刺激化合物或分子、和/或本领域已知的其他化合物。本文的佐剂可以含有抗原被吸附到其上的矿物质(明矾、氢氧化、磷酸铝)的悬浮液;或油包水乳剂,其中抗原溶液被乳化在油中(MF-59,弗氏不完全佐剂),有时包含有杀死的分枝杆菌(弗氏完全佐剂)以进一步增强抗原性(抑制抗原的降解和/或引起巨噬细胞的移入)。佐剂还包括免疫刺激分子,如细胞因子、共刺激分子,例如,免疫刺激DNA或RNA分子,如CpG寡核苷酸。这样一种剂量配方可由本领域技术人员容易地确定。该剂型可以进一步含有一种或多种药学上可接受的盐,例如像,无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐、等等;以及有机酸盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等等。另外,也可以存在辅助物质,如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂着色剂、微球体、聚合物、悬浮剂等等。另外,也可以存在一种或多种其他常规药用成分,如防腐剂保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等等,尤其是该剂型是可复原形式时。适合的示例性成分包括微晶纤维素羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白和它们的组合。药学上可接受的赋形剂的彻底论述可获自《雷明顿药物科学》(REMINGTON'S PHARMACEUTICAL SCIENCES)(马克出版公司,纽约,1991),通过引用将其并入本文。
[0155] 在本文的一个实施例中,递送是经由腺病毒进行的,其可以是含有至少1x105个腺病毒载体粒子(也称为粒子单位,pu)的单次加强剂量。在本文的一个实施例中,该剂量优选地是该腺病毒载体的至少约1x106个粒子(例如,约1x106-1x1012个粒子),更优选至少约1x107个粒子,更优选至少约1x108个粒子(例如,约1x108-1x1011个粒子或约1x108-1x1012个粒子),并且最优选至少约1x100个粒子(例如,约1*x109-1x1010个粒子或约1x109-1x1012个粒子),或者甚至至少约1x1010个粒子(例如,约1x1010-1x1012个粒子)。可替代地,该剂量包含不多于约1x1014个粒子,优选不多于约1x1013个粒子,甚至更优选不多于约1x1012个粒子,甚至更优选不多于约1x1011个粒子,并且最优选不多于约1x1010个粒子(例如,不多于约
1x109个粒子)。因此,该剂量可以含有单剂量的腺病毒载体,其具有例如,约1x106粒子单位(pu),约2x106pu、约4x106pu、约1x107pu、约2x107pu、约4x107pu、约1x108pu、约2x108pu、约
4x108pu、约1x109pu、约2x109pu、约4x109pu、约1x1010pu、约2x1010pu、约4x1010pu、约
1x1011pu、约2x1011pu、约4x1011pu、约1x1012pu、约2x1012pu、或约4x1012pu的腺病毒载体。参见,例如,在2013年6月4日授权的授予纳贝尔(Nabel)等人的美国专利号8,454,972B2中的腺病毒载体(通过引用并入本文)以及在其第29栏第36-58行的剂型。在本文的一个实施例中,该腺病毒是经由多剂量递送的。
[0156] 在本文的一个实施例中,该递送是经由AAV进行的。用于针对人类的AAV的体内递送的治疗有效剂量被认为处于含有从约1x1010到约1x1010个功能AAV/ml溶液的从约20到约50ml的盐水溶液的范围内。该剂量可以调整以便使治疗益处相对于任何副作用的平衡。在本文的一个实施例中,AAV剂量大致处于从约1x105到1x1050个基因组AAV、从约1x108到
1x1020个基因组AAV、从约1x1010到约1x1016个基因组、或约1x1011到约1x1016个基因组AAV的浓度范围内。人类剂量可以是约1x1013个基因组AAV。这样的浓度能以从约0.001ml到约
100ml、约0.05到约50ml、或约10到约25ml的载体溶液进行递送。通过建立剂量反应曲线的常规试验,本领域普通技术人员可以容易地确立其他有效剂量。参见,例如,2013年3月26日授权的授予哈加(Hajjar)等人的美国专利号8,404,658B2,在第27栏第45-60行。
[0157] 在本文的一个实施例中,该递送是经由质粒进行的。在这样的质粒组合物中,该剂量应当是足以引出反应的质粒的量。例如,在质粒组合物中的质粒DNA的适当量可以是从约0.1到约2mg,或从约1μg到约10μg。
[0158] 本文的剂量是基于平均70kg的个体。给药频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。
[0159] Cas9以及一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,使用来自以下文献的配方和剂量:例如,美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对AAV的配方、剂量)和5,846,946(针对DNA质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、AAV、和腺病毒的临床试验的出版物。例如,对于AAV,给药途径、配方和剂量可以如美国专利号8,454,972并且如涉及AAV的临床试验。对于腺病毒,给药途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送,给药途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床试验。剂量可以基于或推断为平均70kg的个体,并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。给药频率在医学或兽医学从业者(例如,医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特殊状况或症状。
[0160] 可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰,Cas9的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可以使用白蛋白启动子,而神经元特异性表达可以使用突触蛋白I启动子。
[0161] RNA递送:该CRISPR酶,例如Cas9,和/或任何本发明的RNA,例如指导RNA,也可以按RNA的形式递送。可以使用体外转录产生Cas9mRNA。例如,可以使用含有下列元件的PCR盒来合成Cas9mRNA:来自β珠蛋白-polyA尾(一串120个或更多的腺嘌呤)的T7_启动子-科扎克(kozak)序列(GCCACC)-Cas9-3’UTR。该盒可以用于经由T7聚合酶的转录。也可以使用体外转录从含有T7_启动子-GG-指导RNA序列的盒来转录指导RNA。
[0162] 为了增强表达并且降低毒性,可以使用假-U或5-甲基-C修饰该CRISPR酶和/或指导RNA。
[0163] 可以使用纳米粒子或脂质包膜同时递送CRISPR酶mRNA和指导RNA。
[0164] 例如,苏X(Su X)、弗里克J(Fricke J)、卡瓦纳DG(Kavanagh DG)、欧文DJ(Irvine DJ)(“使用脂质包封的pH响应性聚合物纳米粒子的体外和体内mRNA递送”(“In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles”《) 分子药理学》(Mol Pharm.)2011年6月6日;8(3):774-87.doi:10.1021/mp100390w.2011年4月1日电子版描述了生物可降解的核-壳结构纳米粒子,其具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核。这些被开发为用于体内mRNA递送。该pH响应性PBAE被选择为促进内体破裂,而该脂质表面层被选择为使聚阳离子核的毒性最小化。因此,这些对于递送本发明的RNA是优选的。
[0165] 此外,迈克尔S D科尔曼(Michael S D Kormann)等人(“在小鼠中递送化学修饰的mRNA之后治疗蛋白的表达”(Expression of therapeutic proteins after delivery of chemically modified mRNA in mice)《:自然生物技术》(Nature Biotechnology),第29卷,第154–157页,(2011)2011年1月9日在线公开)描述了脂质包膜用于递送RNA的用途。脂质包膜的用途在本发明中也是优选的。
[0166] mRNA递送方法用于当前的肝脏递送是特别有希望的。
[0167] 也可以单独递送CRISPR酶mRNA和指导RNA。可以在该指导RNA在给出时间以待CRISPR酶表达之前递送CRISPR酶mRNA。可以在给予指导RNA之前1-12小时(优选约2-6小时)给予CRISPR酶mRNA。
[0168] 可替代地,可以一起给予CRISPR酶mRNA和指导RNA。有利地,可以在初始给予CRISPR酶mRNA+指导RNA之后1-12小时(优选约2-6小时)给予指导RNA的第二加强剂量。
[0169] 为了实现基因组修饰的最有效水平,另外给予CRISPR酶mRNA和/或指导RNA可以是有用的。
[0170] 为了使毒性和脱靶效应最小化,重要的是控制所递送的CRISPR酶mRNA和指导RNA的浓度。CRISPR酶mRNA和指导RNA的最佳浓度可以通过在细胞或动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组座位处的修饰的范围而确定。例如,对于靶向人类基因组的EMX1基因中的5’-GAGTCCGAGCAGAAGAAGAA-3’的指导序列,可以使用深度测序来评定在下列两个脱靶位点处的修饰水平,1:5’-GAGTCCTAGCAGGAGAAGAA-3’和2:5’-GAGTCTAAGCAGAAGAAGAA-3’。对于体内递送,应当选择产生最高的中靶修饰水平同时使脱靶修饰水平最小化的浓度。
[0171] 可替代地,为了使毒性水平和脱靶效应最小化,可以用一对靶向感兴趣部位的指导RNA来递送CRISPR酶切口酶mRNA(例如,具有D10A或H840A突变的化脓链球菌Cas9)。这两个指导RNA需要如下间隔开。分别处于红色(单下划线)和蓝色(双下划线)的指导序列(这些实例是基于化脓链球菌Cas9需要的PAM)。
[0172] 该系统的进一步询问向申请人提供了5’突出端的证据(参见,例如,拉恩(Ran)等人,《细胞》(Cell)2013年9月12日;154(6):1380-9和2013年8月28日提交的美国临时专利申请序列号61/871,301)。申请人进一步鉴定了涉及当与两种指导RNA结合时通过Cas9切口酶突变体的有效切割的参数,并且这些参数包括但不限于该5’突出端的长度。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对或1-34个碱基对。在本发明的其他优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生钝切口或3’突出端。在本发明的实施例中,该3’突出端具有至多150、100或25个碱基对,或至少15、10或1个碱基对。在优选的实施例中,该3’突出端具有1-
100个碱基对。
[0173] 本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。
[0174] 只有产生在这些指导序列(大于-8bp的偏移)之间具有小于8bp重叠的5’突出端的sgRNA对才能介导可检测的indel形成。重要的是,当与野生型Cas9配对时,在这些分析中使用的每个指导对于有效诱导indel是重要的,表明这些指导对的相对位置在预测双切割活性中是最重要的参数。
[0175] 由于Cas9n和Cas9H840A切割DNA的相对链,对于一个给定的sgRNA对而言,用Cas9H840A取代Cas9n会导致该突出端类型的倒转。例如,将产生具有Cas9n的5’突出端的一对sgRNA原则上会相反地产生相应的3’突出端。因此,导致具有Cas9n的3’突出端产生的sgRNA对可以与Cas9H840A一起使用,以产生一个5’突出端。出人意料地,申请人利用被设计为产生5’和3’突出端两者(偏移范围从–278到+58bp)的一组sgRNA对测试了Cas9H840A,但是不能观察indel形成。可能需要进一步的工作来鉴定用于sgRNA配对的必要的设计规则,以允许经由Cas9H840A进行双切割。
[0176] 用于脑的额外的递送选项包括将处于DNA或RNA形式的CRISPR酶和指导RNA封装到脂质体中并且结合到用于跨血脑屏障(BBB)递送的分子特洛伊木马上。分子特洛伊木马已经显示对于将B-gal表达载体递送到非人类灵长动物的脑中是有效的。可以使用相同的途径来递送含有CRISPR酶和指导RNA的递送载体。例如,夏CF(Xia CF)和博阿多RJ(Boado RJ)、帕德瑞吉WM(Pardridge WM)“使用亲和素-生物素技术经由人胰岛素受体的siRNA的抗体介导的靶向”(“Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology.”《分子药理学》(Mol Pharm.)2009年5月-6月;6(3):747-51.doi:10.1021/mp800194)描述了如何将短干扰RNA(siRNA)递送到培养物中以及体内的细胞,并且可以与受体特异性单克隆抗体(mAb)和亲和素-生物素技术联合使用。作者还报道,就亲和素-生物素技术而言,由于在靶向mAb与siRNA之间的键是稳定的,在静脉给予该靶向的siRNA之后,体内观察到在远处部位(例如脑)的RNAi效应。
[0177] 张(Zhang)Y、斯库拉彻兹凯(Schlachetzki)F、巴德里智(Pardridge)WM.(“在静脉内给药之后向灵长类脑进行全局非病毒基因转移(Global non-viral gene transfer to the primate brain following intravenous administration).”2003年1月;7(1):11-8.)描述了编码报道分子如萤光素酶的表达质粒如何被包封在“人工病毒”的内部,该“人工病毒”包含85nm的聚乙二醇化的免疫脂质体,其在体内与针对人胰岛素受体(HIR)的单克隆抗体(MAb)一起靶向到恒河猴脑。该HIRMAb使得携带外源基因的脂质体在静脉注射之后经历跨血脑屏障的转胞吞作用和跨神经元质膜的胞吞作用。与大鼠比较,在恒河猴的脑中的萤光素酶基因表达水平高50倍。通过组织化学和共聚焦显微镜检查都证明了β-半乳糖苷酶基因在灵长动物脑中的广泛神经元表达。作者指明,这种途径使得在24小时内的可逆成年转基因可行。因此,免疫脂质体的使用是优选的。这些可以与抗体结合靶向特定的组织或细胞表面蛋白。
[0178] 其他递送手段或RNA也是优选的,如经由纳米粒子(卓(Cho)S.、金伯格(Goldberg)M.、松(Son)S.、许(Xu)Q.、杨(Yang)F.、梅(Mei)Y.、博加特廖夫(Bogatyrev)S.、朗格(Langer)R.和安德森(Anderson)D.,“用于将小干扰RNA递送到内皮细胞的脂质样纳米粒子”(Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells),《先进功能材料》(Advanced Functional Materials),19:3112-
3118,2010)或外泌体(施罗德(Schroeder)A.、莱文斯(Levins)C.、科特斯(Cortez)C.、朗格(Langer)R.、和安德森(Anderson)D.,“用于siRNA递送的基于脂质的纳米治疗剂”(Lipid-based nanotherapeutics for siRNA delivery),《内科学杂志》(Journal of Internal Medicine),267:9-21,2010,PMID:20059641)。事实上,已经表明外泌体在递送siRNA中特别有用,其为与CRISPR系统有一些相似之处的系统。例如,尔·安达卢西(El-Andaloussi)等人“外泌体诱导的体外和体内siRNA递送”(“Exosome-mediated delivery of siRNA in vitro and in vivo.”《)自然-实验手册》(Nat Protoc.)2012年12月;7(12):2112-26.doi:
10.1038/nprot.2012.131。电子版2012年11月15日描述了外泌体对于跨不同的生物屏障的药物递送是有希望的工具并且可以用于体外和体内递送siRNA。其途径在于通过转染一种包含与肽配体融合的外泌体蛋白的表达载体产生靶向外泌体。然后将这些外泌体纯化并且从转染的细胞上清液中表征,然后将siRNA加载到外泌体中。
[0179] 基因的靶向缺失是优选的。例子示例于实例12中。因此优选的是涉及胆固醇生物合成、脂肪酸生物合成、以及其他代谢障碍的基因,编码涉及淀粉样蛋白以及其他疾病的错误折叠蛋白的基因,导致细胞转化的癌基因,潜伏病毒基因,以及导致负显性疾病(dominant-negative disorder)、其他失调的基因。在这里作为示例,申请人提出使用病毒或纳米粒子递送系统向对其有需要的受试者或患者的肝脏、脑、眼、上皮、造血、或另一种组织进行CRISPR-Cas系统的基因递送,该受试者或患者具有代谢障碍、淀粉样变性、蛋白聚积相关疾病、由于基因突变和基因异位所致的细胞转化、基因突变的负显性作用、潜伏病毒感染、以及其他相关症状。
[0180] CRISPR-Cas系统的治疗应用包括青光眼、淀粉样变性、和亨廷顿病。这些示例于实例14中,并且在其中描述的特征是单独地或以组合方式优选的。
[0181] 作为一个实例,可以治疗或预防由HIV-1引起的慢性感染。为了实现这个目标,可以产生靶向绝大多数HIV-1基因组的CRISPR-Cas指导RNA,同时考虑HIV-1株变体,以使覆盖面和效力最大。通过宿主免疫系统的常规腺病毒或慢病毒介导的感染,可以实现CRISPR-Cas系统的递送。取决于途径,宿主免疫细胞可以是a)分离的、用CRISPR-Cas转导的、选择的、并且重新引入该宿主中的或b)通过全身递送CRISPR-Cas系统体内转导的。第一种途径允许产生抗性免疫群体,而第二种更可能靶向宿主体内的潜伏病毒储库。这在实例部分中更详细地论述。
[0182] 还可以设想的是,本发明产生一个基因敲除细胞文库。每个细胞可以有单基因被敲除。这被示例于实例17中。
[0183] 人们可以制作ES细胞的文库,其中每个细胞有单基因被敲除,并且ES细胞的整个文库将有每个单基因被敲除。此文库对于筛选细胞过程以及疾病的基因功能是有用的。为了制作这个细胞文库,人们可以将由诱导型启动子(例如,多西环素诱导型启动子)驱动的Cas9整合到ES细胞中。另外,人们可以将靶向特异性基因的单个指导RNA整合到ES细胞中。为了制作ES细胞文库,人们可以简单地将ES细胞与编码靶向人类基因组中的每个基因的指导RNA的基因的文库混合。人们可以首先将单个BxB1attB位点引入到人ES细胞的AAVS1座位中。然后可以使用BxB1整合酶来促进单独的指导RNA基因整合到AAVS1座位中的BxB1attB位点中。为了促进整合,每个指导RNA基因可以被包含在携带单个attP位点的质粒上。这样,BxB1将使基因组中的attB位点与含有指导RNA的质粒上的attP位点重组。为了生成该细胞文库,人们可以采用具有整合的单个指导RNA的细胞的文库,并且诱导Cas9表达。在诱导之后,Cas9介导由该指导RNA指定的位点处的双链断裂。
[0184] 蛋白质治疗剂的长期给药可以引出针对该特殊蛋白质的不可接受的免疫反应。蛋白质药物的免疫原性可以归因于少数免疫显性辅助性T淋巴细胞(HTL)表位。降低包含在这些蛋白质内的这些HTL表位的MHC结合亲和力可以产生具有更低免疫原性的药物(腾格里S(Tangri S)等人“具有降低免疫原性的合理工程化的治疗蛋白”(“Rationally engineered therapeutic proteins with reduced immunogenicity”《免疫学杂志》(J Immunol.)2005年3月15日;174(6):3187-96。)在本发明中,可以具体地遵循首先由腾格里(Tangri)等人针对促红细胞生成素提出并且随后开发的方法来降低该CRISPR酶的免疫原性。因此,定向演化或合理设计可以用来降低在宿主物种(人类或其他物种)中的CRISPR酶(例如Cas9)的免疫原性。
[0185] 在实例28中,申请人使用了3种感兴趣的指导RNA,并且这些指导RNA能够将仅仅发生在一个小的细胞亚群中的有效体内DNA切割可视化。实质上,申请人在此显示的是靶向的体内切割。具体地说,这提供了也可以在高级生物(如哺乳动物)中实现特异性靶向的概念证明。还强调的多元方面在于,可以同时使用多重指导序列(即,分开的靶标)(从共同递送的意义上说)。换言之,申请人使用了多重途径,其中几种不同的序列被同时而独立地靶向。
[0186] 适合的用于产生AAV(本发明的一种优选的载体)的方案的实例提供在实例29中。
[0187] 三核苷酸重复障碍是优选的有待治疗的病症。这些也示例于本文中。
[0188] 根据另一个方面,提供了一种用于治疗具有在CFTR基因中的突变的受试者的基因治疗方法,并且该方法包括任选地经由一种生物相容性药用载体向受试者的细胞给予治疗有效量的CRISPR-Cas基因治疗粒子。优选地,该靶DNA包含突变δF508。通常,优选的是该突变被修复为野生型。在这种情况下,该突变是三个核苷酸的缺失,这些核苷酸包括在位置508处的针对苯丙氨酸(F)的密码子。因此,在这种情况下的修复要求将缺失密码子重新引入该突变体中。
[0189] 为了实施这个基因修复策略,优选的是将一个腺病毒/AAV载体系统引入该宿主细胞、多个细胞或患者中。优选地,该系统包含Cas9(或Cas9切口酶)和指导RNA连同腺病毒/AAV载体系统,其包含含有F508残基的同源性修复模板。这可以经由较早论述的递送方法之一引入受试者。该CRISPR-Cas系统可以由该CFTRδ508嵌合指导RNA指导。它靶向有待切割或切割的CFTR基因组座位的特定位点。在切割之后,将修复模板经由同源重组插入切割位点中,从而校正导致囊性纤维化或引起囊性纤维化相关症状的缺失。这种利用适当的指导RNA引导递送并提供CRISPR系统的系统性引入的策略可以用来靶向基因突变,以编辑或另外地操纵如那些在表B中的引起代谢障碍、肝脏、肾和蛋白质病和障碍的基因。
[0190] 对于CFTRδ508嵌合指导RNA的实例,参见如下实例,该实例使用腺相关病毒(AAV)粒子证明了CRISPR-Cas系统在对其有需要的受试者或患者的气道中的基因转移或基因递送,所述受试者或患者患有囊性纤维化或囊性纤维化(CF)相关症状。具体地说,他们示例了囊性纤维化δF508突变的修复策略。这种策略类型可应用于所有生物。特别提到CF,适合的患者可以包括:人类、非人类灵长动物、犬、猫、牛、马和其他家养动物。在这种情况下,申请人利用包含Cas9酶的CRISPR-Cas系统来靶向δF508或其他CFTR诱导的突变。
[0191] 在这种情况下,这些经治疗的受试者的每一侧肺接受支气管内递送的药学上有效量的雾化AAV载体系统,同时自然地呼吸。像这样,通常对于AAV递送而言,雾化递送是优选的。腺病毒或AAV粒子可以用于递送。每一者都可操作地连接至一个或多个调节序列上的适合的基因构建体可以被克隆到递送载体中。在这种情况下,提供下列构建体作为实例:用于Cas9的Cbh或EF1a启动子、用于嵌合指导RNA的U6或H1启动子。一种优选的安排是使用靶向嵌合指导物的CFTRδ508、用于δF508突变的修复模板以及密码子优化的Cas9酶(优选的Cas9是具有核酸酶或切口酶活性的那些),所述酶具有任选地一个或多个核定位信号或序列(NLS),例如,两个(2)NLS。还设想了没有NLS的构建体。
[0192] 为了鉴定该Cas9靶位点,申请人分析了人CFTR基因组座位并且鉴定了该Cas9靶位点。优选地,一般而言并且在这种CF的情况下,该PAM可以含有NGG或NNAGAAW基序。
[0193] 因此,在CF的情况下,本方法包括操纵在感兴趣的基因组座位中的靶序列,该方法包括
[0194] 递送包含病毒载体系统的非天然存在的或工程化的组合物,该病毒载体系统包含一种或多种病毒载体,该一种或多种病毒载体可操作地编码用于其表达的组合物,其中该非天然存在的或工程化的组合物包括:
[0195] 非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含
[0196] I.第一调节元件,该第一调节元件可操作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该第一多核苷酸序列包含
[0197] (a)指导序列,该指导序列能够杂交到适合的哺乳动物细胞中的CF靶序列上,[0198] (b)tracr配对序列,和
[0199] (c)tracr序列,以及
[0200] II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含至少一个或多个核定位序列,
[0201] 其中(a)、(b)和(c)以5’到3’方向排列,
[0202] 其中组分I和II位于该系统的相同或不同载体上,
[0203] 其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且
[0204] 其中该CRISPR复合物包含与(1)可杂交到该靶序列上的该指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶。就CF而言,优选的靶DNA序列包含该CFTRδ508突变。上文描述了优选的PAM。优选的CRISPR酶是任何Cas(在本文中描述,但是特别地描述于实例16中)。
[0205] 对于CF的替代物包括任何基因缺陷并且这些实例是众所周知的。本发明的另一个优选方法或用途是用于校正EMP2A和EMP2B基因的缺陷,这些基因已经被鉴定为与拉福拉病(Lafora disease)相关。
[0206] 在一些实施例中,“指导序列”可以与“指导RNA”不同。指导序列可以是指在该指导RNA内的大约20bp的序列,其指定该靶位点。
[0207] 在一些实施例中,该Cas9是(或衍生自)SpCas9。在这样的实施例中,优选的突变是在SpCas9的任何或所有的10、762、840、854、863和/或986位置或在其他Cas9的相应位置(其可以例如通过标准序列比较工具进行确定)。具体地说,在SpCas9中的任何或所有下列突变是优选的:D10A、E762A、H840A、N854A、N863A和/或D986A;并且还设想了这些置换氨基酸中的任何的保守性取代。在其他Cas9中的相应位置处的相同取代(或这些突变的保守性取代)也是优选的。特别优选的是在SpCas9中的D10和H840。然而,在其他Cas9中,相应于SpCas9D10和H840的残基也是优选的。这些是有利的,因为它们提供了切口酶活性。
[0208] 将易于清楚的是,可以按照相似的方式治疗具有其他疾病的宿主。本文提供了由突变引起的遗传疾病的一些实例,但是更多的疾病是已知的。以上策略可以应用于这些疾病。
[0209] 本发明使用核酸来结合靶TDNA序列。这是有利的,因为产生核酸要容易且价廉得多,并且特异性可以根据其中寻求同源性的拉伸长度而变化。例如多指的复杂3-D复杂定位是不需要的。
[0210] 术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式,是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针、和引物。该术语还涵盖具有合成骨架的核酸样结构,参见,例如,埃克斯坦(Eckstein),1991;巴塞加(Baserga)等人,1992;米利根(Milligan),1993;WO 97/03211;WO 96/39154;马塔(Mata),1997;施特劳斯-绍库普(Strauss-Soukup),1997;和扎姆斯塔(Samstag),1996。多核苷酸可以包含一个或多个经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后,如通过与标记的组分缀合来进一步修饰。
[0211] 如本文所用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。
[0212] 如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。
[0213] 术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。
[0214] “互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、
25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、
90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。
[0215] 如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例描述于蒂森(Tijssen)(1993)的《生物化学和分子生物学中的实验室技术-核酸探针杂交》(Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes),第I部分,第二章,“杂交原理概述和核酸探针分析策略”(“Overview of principles of hybridization and the strategy of nucleic acid probe assay”),爱思唯尔(Elsevier),纽约。在提及一个多核苷酸序列时,那么也设想了互补的或部分互补的序列。能够在高严格条件下杂交到参考序列上的这些序列是优选的。通常,为了使杂交率最大化,选择了相对低严格性的杂交条件:低于热熔点(Tm)约20℃到25℃。Tm是50%的特异性靶序列在具有规定的离子强度和pH的溶液中杂交到完全互补的探针上的温度。通常,为了要求杂交序列的至少约85%的核苷酸互补性,高严格洗涤条件被选择为低于Tm约5℃到15℃。为了要求杂交序列的至少约70%的核苷酸互补性,中等严格洗涤条件被选择为低于Tm约15℃到30℃。高容许(极低严格性)洗涤条件可以低至在Tm之下50℃,从而允许在杂交序列之间的高水平错配。本领域技术人员将认识到,在杂交和洗涤阶段中的其他物理和化学参数也可以改变,从而影响来自在靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高严格条件包括在50%甲酰胺、5×SSC和1%SDS中在42℃下孵育,或者在5×SSC和1%SDS中在65℃下孵育,在
0.2×SSC和0.1%SDS中在65℃下洗涤。
[0216] “杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。
[0217] 如本文使用的,术语“基因组座位(locus)”或“座位(locus)”(复数是座位(loci))是在染色体上的基因或DNA序列的特定位置。“基因”是指编码多肽或RNA链的DNA或RNA的段(stretch),其在生物中发挥功能作用并且因此是活生物体遗传的分子单元。出于本发明的目的,可以考虑包括调节基因产物的产生的区域的基因,而不论这样的调节序列是否接近编码和/或转录的序列。因此,基因包括而不必限于,启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点和座位控制区。
[0218] 如本文使用的“基因组座位的表达”或“基因表达”是藉此在功能性基因产物的合成中使用来自基因的信息的过程。基因表达的产物常常是蛋白质,但是在非蛋白质编码基因如rRNA基因或tRNA基因中,产物是功能性RNA。基因表达的过程由所有已知的生物利用-产生功能性产物以便存活的真核生物(包括多细胞生物)、原核生物(细菌和古细菌)以及病毒。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达,而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。如本文使用的“表达”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA,表达可以包括真核细胞中mRNA的剪接。
[0219] 术语“多肽”、“肽”和“蛋白质”在本文可互换地使用,是指具有任何长度的氨基酸的聚合物。该聚合物可以是可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物;这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵,如与标记组分的缀合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及D和L旋光异构体、以及氨基酸类似物和肽模拟物。
[0220] 如本文使用的,术语“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。
[0221] 正如在本发明的多个方面中所描述,序列一致性与序列同源性有关。可以通过肉眼、更通常地借助于可得的序列比较程序来进行同源性比较。这些可商购的计算机程序可以计算在两个或更多个序列之间的同源性的百分比(%)并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列一致性。在一些优选的实施例中,本文描述的dTALE的封端区具有与本文提供的封端区氨基酸序列至少95%一致性或共享一致性的序列。
[0222] 可以通过本领域已知的许多计算机程序(例如BLAST或FASTA等等)来生成序列同源性。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(美国威斯康星大学;德弗罗(Devereux)等人,1984《,核酸研究》(Nucleic Acids Research)12:387)。可以进行序列比较的其他软件的实例包括但不限于,BLAST软件包(参见奥苏贝尔
(Ausubel)等人,1999,出处同上–第18章)、FASTA(阿尔丘尔(Atschul)等人,1990《,分子生物学杂志》(J.Mol.Biol.),403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人,1999,出处同上,7-58页到7-60页)。然而,优选使用GCG Bestfit程序。
[0223] 可以计算在连续序列上的序列同源性百分比(%),即,将一个序列与另一个序列比对,并且将一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接进行比较,一次比较一个残基。这被称为“无空位”比对。典型地,这样的无空位比对仅仅在较少数目的残基上进行。
[0224] 虽然这是一种非常简单和一致的方法,但是它未能考虑的是,例如,在其他方面完全相同的序列对中,一个插入或缺失可以引起随后的氨基酸残基被排除在比对之外,因此当进行全局比对时可能导致在同源性%上的大幅降低。因此,大多数序列比较方法被设计为产生考虑到可能的插入和缺失的优化比对,而没有过度地使总体同源性或一致性评分不利。这是通过在序列比对中插入“空位”来实现的,以便试图将局部同源性或一致性最大化。
[0225] 然而,这些更复杂的方法向出现在该比对中的每个空位分配“空位罚分”,从而对于相同数目的一致的氨基酸而言,具有尽可能少的空位的序列比对-反映了在这两个比较的序列之间的更高关联性-可以比具有许多空位者实现更高的得分。“亲合空位成本”(“Affinity gap costs”)典型地用于对空位的存在要求相对高的成本并对空位中的每个后续残基施加较小的罚分。这是最常用的空位评分系统。高空位罚分当然将产生具有更少空位的最佳比对。大多数比对程序允许修改空位罚分。然而,当使用这种序列比较软件时优选使用默认值。例如当使用GCG威斯康星Bestfit软件包时,氨基酸序列的默认空位罚分为对于每个空位的-12,以及对于每个延伸的-4。
[0226] 因此计算最大同源性%首先要求产生最佳比对,考虑空位罚分。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(德弗罗(Devereux)等人,1984,《核酸研究》(Nucleic Acids Research)12p387)。可以进行序列比较的其他软件的实例包括但不限于,BLAST软件包(参见奥苏贝尔(Ausubel)等人,1999《精编分子生物学实验指南》(Short Protocols in Molecular Biology),第4次编辑–第18章)、FASTA(阿尔丘尔(Altschul)等人,1990《分子生物学杂志》(J.Mol.Biol)403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人,1999《,精编分子生物学实验指南》(Short Protocols in Molecular Biology),7-58页到7-60页)。然而,对于一些应用,优选使用GCG Bestfit程序。一种新的工具,称为BLAST 2序列,也可用于比较蛋白质和核苷酸序列(参见《欧洲微生物学会联合会微生物学快报》(FEMS Microbiol Lett.)1999174(2):247-50;《欧洲微生物学会联合会微生物学快报》1999177(1):187-8以及在国立卫生研究院的网址的国家生物技术信息中心的网址)。
[0227] 虽然最终同源性%可以按照一致性进行测量,但是比对过程自身典型地不是基于全或无配对比较(all-or-nothing pair comparison)。相反,通常使用尺度相似性评分矩阵(scaled similarity score matrix),基于化学相似性或进化距离对各个成对比较评分。通常使用的这种矩阵的实例为BLOSUM62矩阵-BLAST系列程序的默认矩阵。GCG威斯康星程序通常使用公开的默认值或自定义符号比较表(更多细节详见用户手册)。对于一些应用,优选使用GCG软件包的公共默认值,或在其他软件情况下的默认矩阵,如BLOSUM62。
[0228] 可替代地,可以基于类似于CLUSTAL(希金斯DG(Higgins DG)和夏普PM(Sharp PM)(1988),《基因》(Gene)73(1),237-244)的一种算法,使用在DNASISTM(日立软件公司(Hitachi Software))中的多重比对特征来计算同源性百分比。一旦软件已经产生最佳比对,就有可能计算同源性%,优选序列一致性%。软件典型地这样进行,作为序列比较的一部分,并且产生数字结果。
[0229] 这些序列也可以具有氨基酸残基的缺失、插入或取代,其产生沉默变化并生成功能上等同的物质。可以基于氨基酸特性(如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的相似性做出有意氨基酸取代,并且因此它在将氨基酸集合成官能团中是有用的。可以仅仅基于氨基酸的侧链特性将它们集合在一起。然而,包括突变数据同样是更有用的。出于结构原因,如此衍生的氨基酸的集合很有可能是保守性的。这些集合可以被描述为文氏图形式(Venn diagram)(利文斯敦C.D.(Livingstone C.D.)和巴顿G.J.(Barton G.J.)(1993)“蛋白质序列比对:用于残基保守些的分级分析的策略”(“Protein sequence alignments:a strategy for the hierarchical analysis of residue conservation”)《生物科学计算应用》(Comput.Appl.Biosci).9:745-756)(泰勒(Taylor)W.R.(1986“) 氨基酸保守性的分类”(“The classification of amino acid conservation”)《理论生物学杂志》(J.Theor.Biol.)119;205-218)。例如可以根据下表做出保守性取代,该表描述了普遍接受的氨基酸的文氏图分组。
[0230] 本发明的实施例包括可包含同源取代(本文使用取代和置换两者来表示现有氨基酸残基或核苷酸与替代残基和核苷酸之间的互换)的序列(多核苷酸或多肽两者),该同源取代,即,在氨基酸的情况下发生同类取代(like-for-like substitution),如碱性对碱性、酸性对酸性、极性对极性。也可以发生非同源取代,即,从一类残基到另一类残基,或者可替代地涉及包含非天然氨基酸如氨酸(在下文称为Z)、二氨基丁酸鸟氨酸(在下文称为B)、正亮氨酸鸟氨酸(在下文称为O)、吡啶基丙氨酸、噻吩基丙氨酸、基丙氨酸和苯基甘氨酸。
[0231] 变体氨基酸序列可以包括适合的可插入在该序列的任何两个氨基酸残基之间的间隔基团,包括除了氨基酸间隔物(如甘氨酸或β-丙氨酸)之外的烷基基团,如甲基、乙基或丙基基团。一个另外的变化形式,其涉及处于类肽形式的一个或多个氨基酸残基的存在,也是本领域技术人员熟知的。为避免疑义,“该类肽形式”用来指代变体氨基酸残基,其中该α-碳取代基在该残基的氮原子上,而不是在该α-碳上。用于制备处于该类肽形式的肽的方法是本领域已知的,例如西蒙RJ(Simon RJ)等人,PNAS(1992)89(20),9367-9371和豪威尔DC(Horwell DC),《生物技术趋势》(Trends Biotechnol.)(1995)13(4),132-134。
[0232] 除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,这些在本领域的技能之内。参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis),《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次编辑(1989)《;当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑,(1987));《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司):《PCR2:实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson)、B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)编辑(1995))、哈洛(Harlow)和拉内(Lane)编辑(1988《) 抗体:实验室手册》(ANTIBODIES,A LABORATORY MANUAL),以及《动物细胞培养》(ANIMAL CELL CULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。
[0233] 在一个方面,本发明提供了在CRISPR-Cas系统的工程化和优化中使用的载体。
[0234] 如本文使用的,“载体”是一种允许或促进一个实体从一个环境转移到另一个环境中的工具。它是一种复制子,如质粒、噬菌体、或粘粒,另一个DNA片段可以插入其中,从而引起该插入的片段的复制。通常,当与适当的控制元件关联时,一种载体能够复制。一般而言,术语“载体”是指一种核酸分子,其能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括DNA、RNA、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(AAV))的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。
[0235] 重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。关于重组和克隆方法,提及2004年9月2日以US 2004-0171156A1公开的美国专利申请10/815,730,该专利的内容通过引用以其全文并入本文。
[0236] 本发明的多个方面涉及用于嵌合的RNA与Cas9的双顺反子载体。用于嵌合的RNA与Cas9的双顺反子表达载体是优选的。一般而言并且特别地,在这个实施例中,Cas9优选由CBh启动子驱动。嵌合RNA可以优选地由U6启动子驱动。理想地,将这两者结合。嵌合的指导RNA典型地由20bp指导序列(N)组成并且这可以接合到tracr序列上(从下链的第一个“U”到该转录物的结尾)。该tracr序列可以在如指示的不同位置被截短。指导序列和tracr序列被该tracr配对序列隔开,该tracr配对序列可以是GUUUUAGAGCUA。这之后可以是如所示的环序列GAAA。这两者都是优选的实例。申请人已经通过SURVEYOR测定证明了在人EMX1和PVALB座位处的Cas9介导的indel。ChiRNA由其“+n”标志指示,并且crRNA是指指导序列和tracr序列被表达为分开的转录物的杂交体RNA。贯穿本申请,嵌合RNA也可以被称为单指导、或合成指导RNA(sgRNA)。该环优选地是GAAA,但是并并限于这个序列或者实际上在长度上仅仅为4bp。实际上,用于在发夹结构中使用的优选环形成序列在长度上为四个核苷酸,并且最优选地具有序列GAAA。然而,可以使用更长或更短的环序列,正如可替代的序列。这些序列优选地包括三联体(例如,AAA)、和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。
[0237] 术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚U序列)。这样的调节序列例如描述于戈德尔(Goeddel),《基因表达技术:酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(San Diego),加利福尼亚州(1990)中。调节元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。调节元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,载体包含一个或多个pol III启动子(例如1、2、3、4、5或更多个pol I启动子)、一个或多个pol II启动子(例如1、2、3、4、5或更多个pol II启动子)、一个或多个pol I启动子(例如1、2、3、
4、5或更多个pol I启动子)或其组合。pol III启动子的实例包括但不限于U6和H1启动子。
pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见,例如,波沙特(Boshart)等人《,细胞》(Cell)41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、和EF1α启动子。还被术语“调节元件”涵盖的是增强子元件,如WPRE;CMV增强子;在HTLV-I的LTR中的R-U5’片段《分子细胞生物学》
(Mol.Cell.Biol.,第8(1)卷,第466-472页,1988);SV40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31页,1981)。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的核酸编码的融合蛋白或肽(例如,成簇的规律间隔的短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白,等等)。关于调节序列,提及美国专利申请10/491,026,该专利的内容通过引用以其全文并入本文。关于启动子,提及PCT公开WO 2011/028929和美国申请12/511,940,这些专利的内容通过引用以其全文并入本文。
[0238] 载体可以被设计为用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质、或酶)。例如,CRISPR转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于Goeddel(戈德尔),《基因表达技术:酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(San Diego),加利福尼亚州(Calif.)(1990年)中。可替代地,重组表达载体可在体外例如使用T7启动子调节序列和T7聚合酶来转录和翻译。
[0239] 载体可以被引入原核生物或原核细胞中并且在其中增殖。在一些实施例中,原核生物用来扩增有待引入真核细胞中的载体的多个拷贝,或者作为有待引入真核细胞中的载体的产生中的中间载体(例如,扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中,原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸,如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上,如该重组蛋白的氨基端上。这样的融合载体可以用于一个或多个目的,如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解性;以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常,在融合表达载体中,将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(发玛西亚生物技术有限公司(Pharmacia Biotech Inc);史密斯和约翰逊,1988《. 基因》(Gene)67:31-40)、pMAL(纽英伦生物技术公司(New England Biolabs),贝弗利(Beverly),马萨诸塞州(Mass.))以及pRIT5(发玛西亚公司,皮斯卡塔韦(Piscataway),新泽西州(N.J.)),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合至靶重组蛋白。
[0240] 适合的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann(阿姆兰)等人,(1988年《) 基因》(Gene)69:301-315)以及pET 11d(Studier(斯图迪尔)等人,《基因表达技术:酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(San Diego),加利福尼亚州(Calif.)(1990年)60-89。
[0241] 在一些实施例中,载体是酵母表达载体。用于在酵母酿酒中表达的载体的实例包括pYepSec1(巴尔戴利(Baldari)等人,1987,《欧洲分子生物学学会杂志》(EMBO J)6:229-234)、pMFa(库尔坚(Kurjan)和赫斯库伍特兹(Herskowitz),1982,《细胞》(Cell)30:933-
943)、pJRY88(舒尔茨(Schultz)等人,1987《,基因》(Gene)54:113-123)、pYES2(Invitrogen Corporation(英杰公司),San Diego(圣地亚哥),Calif(加利福尼亚州))、以及picZ(Invitrogen Corp(英杰公司),San Diego(圣地亚哥),Calif(加利福尼亚州))。
[0242] 在一些实施例中,使用杆状病毒载体,载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如,SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(史密斯(Smith)等人,1983,《分子细胞生物学》(Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和萨莫斯(Summers),1989,《病毒学》(Virology)170:31-39)。
[0243] 在一些实施例中,使用哺乳动物表达载体,载体能够驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pCDM8(德(Seed),1987《,自然》(Nature)329:840)和pMT2PC(考夫曼(Kaufman)等人,1987,《欧洲分子生物学学会杂志》(EMBO J.)6:
187-195)。当用于哺乳动物细胞中时,表达载体的控制功能典型地由一种或多种调节元件提供。例如,常用的启动子来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40、以及本文所述和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他适合的表达系统参见例如萨姆布鲁克(Sambrook)等人的《分子克隆实验指南》(Molecular Cloning:A Laboratory Manual.)(第2版)的第16和第17章,冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港(Cold Spring Harbor),纽约,1989。
[0244] 在一些实施例中,重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如,使用组织特异型调节元件来表达核酸)。组织特异型调节元件是本领域中已知的。适合的组织特异型启动子的非限制性实例包括白蛋白启动子(肝脏特异性的;平克特(Pinkert)等人,1987《. 基因发育》(Genes Dev.)1:268-277),淋巴特异性启动子(卡里曼(Calame)和伊顿(Eaton),1988《. 免疫学进展》(Adv.Immunol)43:235-275),特别是T细胞受体的启动子(维纳图(Winoto)和巴尔迪莫(Baltimore),1989《.欧洲分子生物学学会杂志》(EMBO J.)8:729-733)和免疫球蛋白(巴纳吉(Baneiji)等人,1983《. 细胞》(Cell)33:729-
740;奎恩(Queen)和巴尔迪莫(Baltimore),1983《. 细胞》(Cell)33:741-748),神经元特异性启动子(例如,神经丝启动子;伯恩(Byrne)和鲁德尔(Ruddle),1989《.美国科学院院刊》(Proc.Natl.Acad.Sci USA)86:5473-5477),胰腺特异性启动子(艾德兰德(Edlund)等人,
1985《. 科学》(Science)230:912-916),以及乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育型调节启动子,例如,鼠科动物同源框蛋白(hox)启动子凯赛尔((Kessel)和格鲁斯(Gruss),1990《. 科学》(Science)249:
374-379)和α-甲胎蛋白启动子(卡姆皮斯(Campes)和蒂尔曼(Tilghman),1989《.基因发育》(Genes Dev.)3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,该专利的内容通过引用以其全文并入本文。本发明的其他实施例可涉及病毒载体的使用,关于它提及美国专利申请13/092,085,该专利的内容通过引用以其全文并入本文。组织特异型调节元件是本领域中已知的,并且在这个方面提及美国专利7,776,321,该专利的内容通过引用以其全文并入本文。
[0245] 在一些实施例中,调节元件可操作地连接至CRISPR系统的一个或多个元件,从而驱动该CRISPR系统的该一个或多个元件的表达。一般而言,CRISPR(规律间隔成簇短回文重复),也称为SPIDR(SPacer间隔开的同向重复),构成通常对于特定细菌物种而言特异性的DNA基因座的家族。该CRISPR座位包含在大肠杆菌中被识别的间隔开的短序列重复(SSR)的一个不同类(石野(Ishino)等人,《细菌学杂志》(J.Bacteriol.),169:5429-5433[1987];和中田(Nakata)等人,《细菌学杂志》(J.Bacteriol.),171:3553-3556[1989])、以及相关基因。类似的间隔开的SSR已经鉴定于地中海富盐菌(Haloferax mediterranei)、化脓链球菌、鱼腥藻属、和结核分枝杆菌中(参见,格鲁恩(Groenen)等人,《分子微生物学》(Mol.Microbiol.),10:1057-1065[1993];霍(Hoe)等人,《新发感染性疾病》(Emerg.Infect.Dis.),5:254-263[1999];马斯波尔(Masepohl)等人,《生物化学与生物物理学学报》(Biochim.Biophys.Acta)1307:26-30[1996];以及莫吉卡(Mojica)等人,《分子微生物学》,17:85-93[1995])。这些CRISPR座位典型地不同于其他SSR的重复结构,这些重复已被称为规律间隔的短重复(SRSR)(詹森(Janssen)等人,《OMICS:整合生物学杂志》(OMICS J.Integ.Biol.),6:23-33[2002];以及莫吉卡(Mojica)等人,《分子微生物学》(Mol.Microbiol.),36:244-246[2000])。一般而言,这些重复是以簇存在的短元件,其被具有基本上恒定长度的独特间插序列规律地间隔开(莫吉卡(Mojica)等人,[2000],同上)。虽然重复序列在菌株之间是高度保守的,许多间隔开的重复和这些间隔区的序列一般在菌株与菌株之间不同(冯·埃姆登(van Embden)等人,《细菌学杂志》(J.Bacteriol.),182:
2393-2401[2000])。已经在40种以上的原核生物中鉴定出CRISPR座位(参见,例如,詹森(Janssen)等人,《分子微生物学》(Mol.Microbiol.),43:1565-1575[2002];以及莫吉卡(Mojica)等人,[2005]),包括但不限于:气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球菌属(Archaeoglobus)、盐盒菌属(Halocarcula)、甲烷杆菌属(Methanobacterium)、甲烷球菌属(Methanococcus)、甲烷八叠球菌属
(Methanosarcina)、甲烷火菌属(Methanopyrus)、焦球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、热原体属(Thermoplasma)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、紫单胞菌属
(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、利斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、好热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、固氮弓菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、粘球菌属
(Myxococcus)、弯曲杆菌属(Campylobacter)、类杆菌属(Wolinella)、不动杆菌属
(Acinetobacter)、欧文菌属(Erwinia)、埃希菌属(Escherichia)、军团杆菌属
(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光细菌属(Photobacterium)、沙菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、密螺旋体属(Treponema)、和栖热袍菌属(Thermotoga)。
[0246] 一般而言,“CRISPR系统”总共是指转录物和涉及CRISPR相关(“Cas”)基因的表达或指导其活性的其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“同向重复”和在内源CRISPR系统背景下的tracrRNA加工的部分同向重复)、指导序列(在内源CRISPR系统背景下也称为“间隔子(spacer)”)、或来自CRISPR座位的其他序列和转录物。在本发明的实施例中,术语指导序列和指导RNA可互换地使用。在一些实施例中,CRISPR系统的一个或多个元件来源于I型、II型、或III型CRISPR系统。在一些实施例中,CRISPR系统的一个或多个元件来源于包含内源CRISPR系统的特殊生物,如化脓链球菌。一般而言,CRISPR系统的特征为促进在靶序列的位点处的CRISPR复合物(在内源CRISPR系统的背景下也称为原型间隔子)的形成的元件。在CRISPR复合物形成的背景下,“靶序列”是指指导序列被设计为对其具有互补性的序列,其中在靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。
[0247] 在一些实施例中,可以通过计算机搜索重复基序来鉴定同向重复,其满足下列标准的任一项或全部:
[0248] 1.发现一个在II型CRISPR座位侧翼的基因组序列的2Kb窗口;
[0249] 2.跨从20到50bp;以及
[0250] 3.以20到50bp间隔开。
[0251] 在一些实施例中,可以使用这些标准中的2条,例如1和2、2和3、或1和3。在一些实施例中,可以使用所有这3条标准。
[0252] 在一些实施例中,随后可以通过满足下列标准的任一项或全部的序列来预测候选tracrRNA:
[0253] 1.与同向重复同源的序列(在Geneious中搜索的具有高达18-bp错配的基序);
[0254] 2.在转录方向上的预测的不依赖Rho的转录终止子的存在;以及
[0255] 3.在tracrRNA与同向重复之间的稳定发夹二级结构。
[0256] 在一些实施例中,可以使用这些标准中的2条,例如1和2、2和3、或1和3。在一些实施例中,可以使用所有这3条标准。
[0257] 在一些实施例中,嵌合的合成指导RNA(sgRNA)设计可以在同向重复与tracrRNA之间掺入至少12bp的双链体结构。
[0258] 在本发明的优选实施例中,该CRISPR系统是一个II型CRISPR系统,并且该Cas酶是Cas9,其催化DNA切割。通过来源于化脓链球菌或Cas9或任何密切相关的Cas9的酶促作用,产生了在靶位点序列处的双链断裂,所述靶位点序列杂交到该指导序列的20个核苷酸上并且具有在该靶序列的20个核苷酸之后的原型间隔子相邻基序(PAM)序列(实例包括NGG/NRG或可以如本文所述进行确定的PAM)。经由Cas9的对于位点特异性DNA识别和切割的CRISPR活性是由该指导序列、部分杂交到该指导序列上的tracr序列以及该PAM序列定义的。该CRISPR系统的更多方面描述于卡吉诺夫(Karginov)和汉农(Hannon)的“CRISPR系统:在细菌和古细菌中的小RNA指导的防御”(The CRISPR system:small RNA-guided defence in bacteria and archaea),《分子细胞学杂志》(Mole Cell)2010,1月15日;37(1):7。
[0259] II型CRISPR座位来自化脓链球菌SF370,该座位含有四个基因Cas9、Cas1、Cas2和Csn1的聚簇以及两个非编码RNA元件tracrRNA和由非重复序列的短段(间隔子,每个约30bp)间隔开的重复序列(同向重复)的特征性阵列。在此系统中,以四个连续步骤产生靶向的DNA双链断裂(DSB)(图2A)。第一步,从CRISPR座位转录两个非编码RNA前-crRNA阵列和tracrRNA。第二步,将tracrRNA杂交到前-crRNA的同向重复上,然后将其加工成含有单独的间隔子序列的成熟crRNA。第三步,该成熟crRNA:tracrRNA复合物经由在crRNA的间隔子区与原型间隔子DNA之间形成异源双链体而指导Cas9到由原型间隔子和对应的PAM组成的DNA靶标。最后,Cas9介导PAM上游的靶DNA的切割,以在原型间隔子内产生一个DSB(图2A)。图2B证明了该密码子优化的Cas9的核定位。为了促进转录精确起始,选择基于RNA聚合酶III的U6启动子,以驱动tracrRNA的表达(图2C)。类似地,研发基于U6启动子的构建体,以表达由单个间隔子组成的前-crRNA阵列,该单个间隔子侧翼为两个同向重复(DR,还被术语“tracr配对序列”所涵盖;图2C)。将起始间隔子设计成靶向人EMX1座位(图2C)中的33-碱基对(bp)靶位点(满足Cas9的NGG识别基序的30-bp原型间隔子加3-bp CRISPR基序(PAM)序列),该座位是大脑皮层的发育中的一个关键基因。
[0260] 典型地,在内源CRISPR系统的背景下,CRISPR复合物(包含杂交到靶序列上并且与一种或多种Cas蛋白复合的指导序列)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条链的切割。不希望受到理论的束缚,该tracr序列(其可以包含或其组成为野生型tracr序列的全部或部分(例如野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85个、或更多个核苷酸))也可以形成CRISPR复合物的一部分,如通过沿着该tracr序列的至少一部分杂交到与该指导序列可操作地连接的tracr配对序列的全部或部分上。在一些实施例中,将驱动CRISPR系统的一个或多个元件的表达的一种或多种载体引入到宿主细胞中,使得该CRISPR系统的这些元件的表达在一个或多个靶位点指导CRISPR复合物的形成。例如,Cas酶、连接到tracr配对序列上的指导序列、以及tracr序列可以各自可操作地连接到在分开的载体上的分开的调节元件上。
可替代地,从相同或不同调节元件表达的二个或更多个元件可以结合在单个载体中,其中提供该CRISPR系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单个载体中的CRISPR系统元件可以按照任何适合的取向排列,如一个元件相对于第二元件位于5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且取向为相同或相对的方向。在一些实施例中,单个启动子驱动编码CRISPR酶的转录物以及该指导序列、tracr配对序列(任选地可操作地连接到该指导序列上)、和嵌入在一个或多个内含子序列之内(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或者全部都在单个内含子中)的tracr序列中的一者或多者的表达。在一些实施例中,该CRISPR酶、指导序列、tracr配对序列、和tracr序列可操作地连接到相同的启动子上并且从其表达。
[0261] 在一些实施例中,载体包含一个或多个插入位点,如限制性核酸内切酶识别序列(也称为“克隆位点”)。在一些实施例中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。在一些实施例中,载体包含在tracr配对序列的上游、并且任选地在可操作地连接到该tracr配对序列上的调节元件的下游的插入位点,使得在将指导序列插入到该插入位点中之后并且在表达时该指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合。在一些实施例中,载体包含一个或多个插入位点,每个插入位点位于两个tracr配对序列之间,从而允许在每个位点插入指导序列。在这样一种安排中,两种或更多种指导序列可以包含单指导序列的两个或更多个拷贝、两种或更多种不同的指导序列、或这些的组合。当使用多个不同的指导序列时,可以使用单个表达构建体使CRISPR活性靶向到细胞内的多个不同的相应靶序列。例如,单个载体可以包含约或多于约1、2、3、4、5、6、7、8、9、10、
15、20种、或更多种指导序列。在一些实施例中,可以提供约或多于约1、2、3、4、5、6、7、8、9、
10个、或更多种这样的含有靶序列的载体,并且任选地将其递送到细胞中。
[0262] 在一些实施例中,一个载体包含可操作地连接到编码CRISPR酶(如Cas蛋白)的酶编码序列上的调节元件。Cas蛋白的非限制性实例包括:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8,Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修饰形式。在一些实施例中,未修饰的CRISPR酶如Cas9具有DNA切割活性。在一些实施例中,该CRISPR酶指导在靶序列位置处(例如在该靶序列之内和/或在该靶序列的互补物之内)的一条链或两条链的切割。在一些实施例中,该CRISPR酶指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个、或更多个碱基对之内的一条链或两条链的切割。在一些实施例中,一个载体编码相对于相应的野生型酶被突变的CRISPR酶,使得该突变的CRISPR酶缺乏切割含有一个靶序列的靶多核苷酸的一条链和两条链的能力。例如,在来自化脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸到丙氨酸取代(D10A)将Cas9从切割两条链的核酸酶转化成切口酶(切割单条链)。致使Cas9为切口酶的其他突变实例包括而不限于H840A、N854A、和N863A。作为一个另外的实例,Cas9的两个或更多个催化结构域(RuvC I、RuvC II、和RuvC III或该HNH结构域)可以被突变为产生实质上缺乏所有DNA切割活性的突变的Cas9。在一些实施例中,D10A突变与H840A、N854A、或N863A突变的一者或多者相组合,以便产生实质上缺乏所有DNA切割活性的Cas9酶。在一些实施例中,当该突变的CRISPR酶的DNA切割活性比它的非突变形式低约25%、10%、5%、1%、0.1%、0.01%、或更少时,则该酶被考虑为实质上缺乏所有DNA切割活性。
[0263] 另外,将SpCas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)工程化,以将核酸酶转化为切口酶(SpCas9n)(参见例如萨普拉诺萨克斯(Sapranauskas)等人,2011,《核酸研究》(Nucleic Acis Research),39:9275;加索纳斯(Gasiunas)等人,2012,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA),109:E2579),这样使得带切口的基因组DNA经历高保真同源定向修复(HDR)。Surveyor测定确认到,SpCas9n在EMX1原型间隔子靶标处不产生indel。靶向EMX1的嵌合crRNA(同样具有tracrRNA组分)与SpCas9的共表达在靶位点中产生indel,而与SpCas9n的共表达则不然(n=3)。此外,327个扩增子的测序未检测到由SpCas9n诱导的任何indel。选择相同的座位,以通过用靶向EMX1、hSpCas9或hSpCas9n的嵌合的RNA以及用于在原型间隔子附近引入一对限制酶切位点(HindIII和NheI)的HR模板共转染HEK 293FT细胞而测试CRISPR介导的HR。
[0264] 本文描述了优选的直向同源物。一种Cas酶可以被鉴定为Cas9,因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地,该Cas9酶来自或衍生自spCas9或saCas9。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本文所述它在某些方面已经被突变(修饰)。
[0265] 应当理解的是,术语Cas和CRISPR酶在本文中通常可互换地使用,除非另外说明。如上提及的,在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶。然而,应当理解的是,本发明包括更多的来自其他微生物物种的Cas9s,如SpCas9、SaCa9、St1Cas9等等。
[0266] 本文中提供了在这种情形下针对人类进行优化(即,针对在人类中表达进行优化)的密码子优化序列的实例,参见SaCas9人类密码子优化序列。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官(如脑)的密码子优化是已知的。
[0267] 在一些实施例中,编码CRISPR酶的酶编码序列经密码子优化,以便在特定的细胞如真核细胞中表达。这些真核细胞可以是特定生物的那些或来源于特定生物,如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗、或非人类哺乳动物或灵长动物。在一些实施例中,对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法、以及还有作为这样的方法的结果的动物,可以被排除在外。
[0268] 一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个、或更多个密码子同时维持该天然氨基酸序列而修饰一个核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于具有特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使RNA(mRNA)的翻译效率相关,而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的性质和特定的转运RNA(tRNA)分子的可用性。细胞内选定的tRNA的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在www.kazusa.orjp/codon/(2002年7月9日访问)上可获得的密码子使用数据库(“Codon Usage Database”)中,并且这些表可以通过不同的方式调整适用。参见,中村Y.(Nakamura Y.)等人,“从国际DNA序列数据库中制表的密码子使用:2000年的状态。”(Codon usage tabulated from the international DNA sequence databases:
status for the year 2000.《) 核酸研究》(Nucl.Acids Res.)28:292(2000年)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可得的,如基因制造(Gene Forge)(Aptagen公司;雅各布斯(Jacobus),PA),也是可得的。在一些实施例中,在编码CRISPR酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)相应于对于特定氨基酸最频繁使用的密码子。
[0269] 在一些实施例中,一种载体编码包含一个或多个核定位序列(NLS)如约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS的CRISPR酶。在一些实施例中,该CRISPR酶包含在或接近于氨基端的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS,在或接近于羧基端约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS,或这些的组合(例如在氨基端的一个或多个NLS以及在羧基端的一个或多个NLS)。当存在多于一个NLS时,每一个可以被选择为不依赖于其他NLS,使得在多于一个拷贝中可以存在单个NLS和/或与在一个或多个拷贝中存在一个或多个其他NLS相组合。在本发明的一个优选实施例中,该CRISPR酶包含至多6个NLS。在一些实施例中,当NLS的最近的氨基酸是在从N端或C端沿着该多肽链的约1、2、3、4、
5、10、15、20、25、30、40、50个、或更多个氨基酸之内时,NLS可以被视为接近该N端或C端。NLS的非限制性实例包括来源于以下项的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV;来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK的核质蛋白二分NLS);c-myc NLS,其具有氨基酸序列PAAKRVKLD或RQRRNELKRSP;hRNPA1M9NLS,其具有序列
NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY;来自输入蛋白-α的IBB结构域的序列
RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白的序列VSRKRPRP和PPKKARED;
人p53的序列POPKKKPL;小鼠c-abl IV的序列SALIKKKKKMAP;流感病毒NS1的序列DRLRR和PKQKKRK;肝炎病毒δ抗原的序列RKLKKKIKKL;小鼠Mx1蛋白的序列REKKKFLKRR;人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK;以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK。
[0270] 一般而言,该一个或多个NLS具有足够的强度,以便在真核细胞的核中驱动该CRISPR复合物以可检测到的量积聚。一般而言,核定位活性的强度可以驱动在该CRISPR酶中的NLS的数目、所使用的一个或多个特定的NLS、或这些因素的组合。可以通过任何适合的技术进行细胞核中积聚的检测。例如,一种检测标记可以融合到CRISPR酶上,使得细胞内的位置可以被可视化,如与检测细胞核的位置的手段(例如,对于细胞核特异的染料,如DAPI)相结合。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白质的方法分析其内容物,如免疫组织化学、Western印迹或酶活性测定。如通过测定CRISPR复合物形成的作用(例如,测定在靶序列处的DNA切割或突变、或测定由于CRISPR复合物形成和/或CRISPR酶活性的影响而改变的基因表达活性),与没有暴露于CRISPR酶或复合物、或暴露于缺乏该一个或多个NLS的CRISPR酶的对照相比较,还可以间接地确定细胞核中的积聚。
[0271] 一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对是,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯罗斯-惠勒变换(Burrows-Wheeler Transform)的算法(例如伯罗斯-惠勒比对工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司;在www.novocraft.com可获得)、ELAND(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)、以及Maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、
22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。可以通过任何适合的测定法来评估指导序列引导CRISPR复合物与靶序列的序列特异性结合的能力。
例如,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文所述的Surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的CRISPR复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在一个试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。
[0272] 指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。示例性靶序列包括在靶基因组中为独特的那些。例如,对于化脓链球菌Cas9,在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGG的Cas9靶位点,其中NNNNNNNNNNNNXGG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGG的化脓链球菌Cas9靶位点,其中NNNNNNNNNNNXGG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。对于嗜热链 球 菌 CR I S P R 1 C a s 9 ,在 基因 组 中 的 独 特 靶 序 列 可以 包 括 形式MMMMMMMMNNNNNNNNNNNNXXAGAAW的Cas9靶位点,其中NNNNNNNNNNNNXXAGAAW(N是A、G、T、或C;X可以是任何物;并且W是A或T)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXXAGAAW的嗜热链球菌CRISPR1Cas9靶位点,其中
NNNNNNNNNNNXXAGAAW(N是A、G、T、或C;X可以是任何物;并且W是A或T)在该基因组中单次出现。对 于化脓 链球菌C as9 ,在基因 组中的 独特靶 序列可以 包括形式
MMMMMMMMNNNNNNNNNNNNXGGXG的Cas9靶位点,其中NNNNNNNNNNNNXGGXG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式
MMMMMMMMMNNNNNNNNNNNXGGXG的化脓链球菌Cas9靶位点,其中NNNNNNNNNNNXGGXG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。在这些序列的每一个中,“M”可以是A、G、T、或C,并且在序列鉴定中不必考虑为是独特的。
[0273] 在一些实施例中,指导序列被选择为降低在该指导序列内的二级结构程度。在一些实施例中,在最佳地折叠时,该指导序列的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、或更少的核苷酸参与自我互补碱基配对。可以通过任何适合的多核苷酸折叠算法来确定最佳折叠。一些算法是基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold,正如祖克(Zuker)和施蒂格勒(Stiegler《) 核酸研究》(Nucleic Acids Res.)9(1981),133-148)所描述。折叠算法的另一个实例是使用由维也纳大学(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)研发的在线网络服务器RNAfold(参见例如A.R.格鲁伯(A.R.Gruber)等人,2008,《细胞》(Cell)106(1):23-24;以及PA卡尔(PA Carr)和GM丘奇(GM Church),2009,《自然生物技术》(Nature Biotechnology)27(12):1151-62)。
[0274] 一般而言,tracr配对序列包括与tracr序列具有足够互补性以促进下列一项或多项的任何序列:(1)在含有相应tracr序列的细胞中的侧翼为tracr配对序列的指导序列的切除;以及(2)在靶序列处的CRISPR复合物的形成,其中该CRISPR复合物包含杂交到tracr序列上的tracr配对序列。通常,互补程度是就tracr配对序列与tracr序列沿着这两个序列的较短者的长度的最佳比对而言。可以通过任何适合的比对算法来确定最佳比对,并且可以可以进一步对二级结构做出解释,如在该tracr序列或tracr配对序列之内的自我互补性。在一些实施例中,在进行最佳比对时,在该tracr序列与tracr配对序列之间沿着这两者的较短者的长度的互补程度是约或多于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。在一些实施例中,该tracr序列在长度上为约或多于约5、6、7、
8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个、或更多个核苷酸。在一些实施例中,该tracr序列和tracr配对序列被包含在单个转录物中,使得在这两者之间的杂交产生具有二级结构(如发夹)的转录物。在本发明的一个实施例中,该转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施例中,该转录物具有两个、三个、四个或五个发夹。在本发明的一个另外的实施例中,该转录物具有至多五个发夹。在一个发夹结构中,在该环的最终“N”和上游的序列5’的部分相应于该tracr配对序列,并且该环的序列3’的部分相应于该tracr序列。另外的包含指导序列、tracr配对序列、和tracr序列的单一多核苷酸的非限制性实例如下(列出为5’到3’),其中“N”代表指导序列的碱基,小写字体的第一区代表tracr配对序列,且小写字体的第二区代表tracr序列,并且该最后的多聚T序列代表转录终止子:(1)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT;
(2)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT;(3)
NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT;(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT;(5)
NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT;以及(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT。在一些实施例中,序列(1)到(3)与来自嗜热链球菌CRISPR1的Cas9结合使用。在一些实施例中,序列(4)到(6)与来自化脓链球菌的Cas9结合使用。在一些实施例中,该tracr序列是一个与包含该tracr配对序列的转录物分开的转录物。
[0275] 在一些实施例中,还提供了重组模板。重组模板可以是如本文所述的另一个载体的组分,其被包含在一个分开的载体中,或者被提供为一个分开的多核苷酸。在一些实施例中,重组模板被设计为用作在同源重组中的模板,如在被作为CRISPR复合物的一部分的CRISPR酶切开或切割的靶序列之内或在其附近。模板多核苷酸可以具有任何适合的长度,如约或多于约10、15、20、25、50、75、100、150、200、500、1000个、或更多个核苷酸长度。在一些实施例中,该模板多核苷酸与包含该靶序列的多核苷酸的一部分互补。当进行最佳比对时,模板多核苷酸可能与靶序列的一个或多个核苷酸(例如约或多于约1、5、10、15、20个、或更多个核苷酸)重叠。在一些实施例中,当一个模板序列与包含靶序列的多核苷酸进行最佳比对时,该模板多核苷酸的最近的核苷酸在距离该靶序列的约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个、或更多个核苷酸之内。
[0276] 在一些实施例中,该CRISPR酶是包含一个或多个异源蛋白结构域(例如除了该CRISPR酶之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白质,以及任选地在任何两个结构域之间的连接序列。可以融合到CRISPR酶上的蛋白质结构域的实例包括但不限于,表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白质结构域:甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签、和硫氧还蛋白(Trx)标签。报告基因的实例包括,但不限于,谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖酸糖苷酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以包括蓝色荧光蛋白(BFP)的自发荧光蛋白。CRISPR酶可以融合到编码一种蛋白质或蛋白质片段的基因序列上,所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子,其包括,但不限于,麦芽糖结合蛋白(MBP)、S-tag、Lex A DNA结合结构域(DBD)融合物、GAL4DNA结合结构域融合物、以及单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的结构域描述于US 20110059502中,通过引用将其并入本文。在一些实施例中,使用标记的CRISPR酶来鉴定靶序列的位置。
[0277] 在一些实施例中,CRISPR酶可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于,电磁辐射、声能、化学能热能。可诱导系统的实例包括四环素诱导型启动子(Tet-开或Tet-关)、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。在一个实施例中,该CRISPR酶可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)的一部分。光的组分可以包括CRISPR酶、光响应细胞色素异二聚体(例如,来自拟南芥)、以及转录激活/抑制结构域。诱导型DNA结合蛋白和关于使用它们的方法的其他实例提供在US 61/736465和US 61/721,283中,特此通过引用以其全文并入。
[0278] 在一些方面,本发明提供了以下方法,这些方法包括向宿主细胞递送一种或多种多核苷酸,如或如在此描述的一种或多种载体、其一种或多种转录物和/或一种或多种自其转录的蛋白。在一些方面,本发明进一步提供了通过这样的方法产生的细胞以及包括这样的细胞或由这样的细胞产生的动物。在一些实施例中,将与(并且任选地与其复合)指导序列组合的CRISPR酶递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码CRISPR系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如在此描述的载体的转录物)、裸核酸以及与递送赋形剂(如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述,参见安德森(Anderson),《科学》(Science)256:808-813(1992);纳贝尔(Nabel)&费尔格纳(Felgner),TIBTECH 11:211-217(1993);三谷(Mitani)&卡斯基(Caskey),TIBTECH 11:162-166(1993);狄龙(Dillon),TIBTECH 11:167-175(1993);米勒(Miller),《自然》(Nature)357:455-460(1992);范·布朗特(Van Brunt),《生物技术》(Biotechnology)6(10):1149-1154(1988);维涅(Vigne)《,恢复神经学和神经科学》(Restorative Neurology and Neuroscience)8:35-36(1995);克雷默(Kremer)&佩里科德特(Perricaudet),《英国医学公报》(British Medical Bulletin)51(1):31-44(1995);哈嗒嗒(Haddada)等人,在《微生物学和免疫学当前主题》(Current Topics in Microbiology and Immunology)中多尔夫勒(Doerfler)和博姆 (编辑)(1995);以及余(Yu)等人,《基因疗法》(Gene 
Therapy)1:13-26(1994)。
[0279] 核酸的非病毒递送方法包括脂转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸DNA、人工病毒体以及DNA的试剂增强的摄取。脂转染描述于例如美国专利号5,049,386、4,946,787和4,897,355中并且脂转染试剂是市售的(例如,TransfectamTM和LipofectinTM)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括Felgner(费尔格纳),WO 91/17424;WO 91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。
[0280] 脂质:核酸复合物(包括靶向的脂质体,如免疫脂质复合物)的制备是本领域的技术人员熟知的(参见例如,克丽丝特尔(Crystal)《,科学》(Science)270:404-410(1995);布莱泽(Blaese)等人,《癌症基因疗法》(Cancer Gene Ther.)2:291-297(1995);贝尔(Behr)等人《,生物共轭化学》(Bioconjugate Chem.)5:382-389(1994);雷米(Remy)等人,《生物共轭化学》5:647-654(1994);高(Gao)等人《,基因疗法》(Gene Therapy)2:710-722(1995);艾哈迈德(Ahmad)等人,《癌症研究》(Cancer Res.)52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及
4,946,787)。
[0281] 使用RNA或DNA病毒基的系统递送核酸利用将病毒靶向体内的特定细胞并将病毒有效负荷(payload)运至细胞核中的高度进化的过程。可以将病毒载体直接给予至患者(体内)或可以使用它们在体外处理细胞,并且任选地,可以将修饰的细胞给予至患者(离体)。常规的病毒基的系统可以包括用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合进宿主基因组中是可能的,这通常导致插入转基因的长期表达。另外,已经在不同细胞类型和靶组织中观察到高转导效率。
[0282] 可以通过掺入外源包膜蛋白,扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。
因此,逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成,这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用LTR对于载体的复制和包装而言是足够的,然后使用这些载体将治疗基因整合进靶细胞中,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的那些(参见例如,布赫谢尔(Buchscher)等人《,病毒学杂志》(J.Virol.)66:2731-2739(1992);约翰(Johann)等人,《病毒学杂志》66:1635-1640(1992);佐姆内尔费尔特(Sommnerfelt)等人,《病毒学》(Virol.)176:58-59(1990);威尔逊(Wilson)等人,《病毒学杂志》63:2374-
2378(1989);米勒(Miller)等人,《病毒学杂志》65:2220-2224(1991);PCT/US 94/05700)。
[0283] 在瞬时表达是优选的应用中,可以使用腺病毒基系统。腺病毒基载体在许多细胞类型中能够具有非常高的转导效并且无需细胞分裂。用这样的载体,已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。
[0284] 还可以使用腺相关病毒(“AAV”)载体转导具有靶核酸的细胞,例如,在体外产生核酸和肽,以及用于体内和离体基因疗法程序(参见例如,韦斯特(West)等人,《病毒学》(Virology)160:38-47(1987);美国专利号4,797,368;WO 93/24641;科丁(Kotin),《人类基因疗法》(Human Gene Therapy)5:793-801(1994);缪斯科斯卡(Muzyczka),《临床研究杂志》(J.Clin.Invest.)94:1351(1994))。重组AAV载体的构建描述于多个出版物中,包括美国专利号5,173,414;特拉特斯金(Tratschin)等人,《分子与细胞生物学》(Mol.Cell.Biol.)5:3251-3260(1985);特拉特斯金等人,《分子与细胞生物学》4:2072-
2081(1984);埃尔莫奈特(Hermonat)&缪斯科斯卡(Muzyczka),《美国国家科学院院刊》(PNAS)81:6466-6470(1984);以及萨穆尔斯基(Samulski)等人《,病毒学杂志》(J.Virol.)
63:03822-3828(1989)。
[0285] 典型地使用包装细胞形成能够感染宿主细胞的病毒粒子。这样的细胞包括包装腺病毒的293细胞和包含逆转录病毒的ψ2细胞或PA317细胞。在基因疗法中使用的病毒载体通常由将核酸载体包装进病毒粒子的细胞系产生。这些载体典型地包含包装并且随后整合进宿主所需的最低量序列,其他病毒序列由用于有待表达的一个或多个多核苷酸的表达盒替换。失去的病毒功能典型地由包装细胞系反式地提供。例如,在基因疗法中使用的AAV载体典型地仅具有来自AAV基因组的ITR序列,这些序列为包装并整合进宿主基因组所需。将病毒DNA包装进以下细胞系中,该细胞系包含编码辅助质粒的其他AAV基因,即rep和cap,但缺少ITR序列。该细胞系还可以被作为辅助者的腺病毒感染。该辅助病毒促进AAV载体的复制和从辅助质粒表达AAV基因。由于缺少ITR序列,未以显著的量包装该辅助质粒。可以通过例如与AAV相比腺病毒更加敏感的热处理减少腺病毒的污染。
[0286] 因此,AAV被认为是用作转导载体的理想候选物。这样的AAV转导载体可以包括足够的顺式作用功能,以在反式地提供的腺病毒或疱疹病毒或痘病毒(例如,牛痘病毒)辅助功能的存在下进行复制。可以使用重组AAV(rAAV)将外源基因携带进多种谱系的细胞中。在这些载体中,将AAV cap和/或rep基因从病毒基因组中缺失并且用选择的DNA区段置换。当前的AAV载体可以容纳多达插入DNA的4300个碱基。
[0287] 存在多种产生rAAV的方式,并且本发明提供了rAAV以及用于制备rAAV的方法。例如,将包含希望的病毒构建体或基本上由其组成的一个或多个质粒转染进AAV感染的细胞中。此外,将第二或另外的辅助质粒共转染进这些细胞中,以提供重组病毒构建体的复制和包装必需的AAV rep和/或cap基因。在这些条件下,AAV的rep和/或cap蛋白反式地作用,以刺激rAAV构建体的复制和包装。转染后两至三天,收获rAAV。传统地,从细胞中收获rAAV连同腺病毒。然后,通过热处理使污染的腺病毒失活。在本发明中,有利地不从细胞自身收获rAAV,而是从细胞上清液收获rAAV。因此,在初始方面,本发明提供了制备rAAV,并且除前述内容之外,可以通过以下方法制备rAAV,该方法包括或基本由以下组成:用包含外源DNA(包括供表达的DNA)和辅助病毒(例如,腺病毒、疱疹病毒、痘病毒如牛痘病毒)的rAAV感染易感细胞,其中该rAAV缺少功能性cap和/或rep(以及提供该rAAV缺少的cap和/或rev功能的辅助病毒(例如,腺病毒、疱疹病毒、痘病毒如牛痘病毒));或用包含外源DNA(包括供表达的DNA)的rAAV感染易感细胞,其中该重组体缺少功能性cap和/或rep,并且用提供该rAAV缺少的cap和/或rep功能的质粒转染所述细胞;或用包含外源DNA(包括供表达的DNA)的rAAV感染易感细胞,其中该重组体缺少功能性cap和/或rep,其中所述细胞提供该重组体缺少的cap和/或rep功能;或用缺少功能性cap和/或rep的AAV和用于将外源DNA插入该重组体中这样使得由该重组体表达该外源DNA并且用于提供rep和/或cap功能的质粒转染易感细胞,由此转染产生包含该外源DNA(包括供表达的DNA)的缺少功能性cap和/或rep的rAAV。
[0288] 该rAAV可以来自如在此描述的AAV,并且有利地可以是rAAV1、rAAV2、AAV5或具有杂交体或衣壳的rAAV,该rAAV可以包括AAV1、AAV2、AAV5或其任何组合。可以相对于有待被rAAV靶向的细胞而选择rAAV的AAV;例如,可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂交体或衣壳AAV1、AAV2、AAV5或其任何组合;并且可以选择用于靶向心脏组织的AAV4。
[0289] 除293细胞之外,可以在本发明的实践中使用的其他细胞以及这些细胞的某些体外AAV血清型的相对感染性(参见格林,D.(Grimm,D.)等人《,病毒学杂志》(J.Virol.)82:5887-5911(2008))如下:
[0290] 本发明提供了包含或基本上由编码CRISPR(规律间隔成簇短回文重复)系统的外源核酸分子组成的rAAV,例如,多个盒,该多个盒包括第一盒或由其组成,该第一盒包括或基本上由启动子、编码CRISPR相关(Cas)蛋白(假定的核酸酶或解旋酶蛋白)(例如,Cas9)的核酸分子和终止子组成,以及两个或更多个,有利地直到载体的包装尺寸极限,例如总共(包括第一盒)五个盒,这些盒包括或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如,每个盒示意性地由启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子表示(其中N是可以插入的处于载体的包装尺寸极限的上限的数目)),或两个或更多个单独的rAAV,每个rAAV包含一个或多于一个CRISPR系统盒,例如,第一rAAV包含第一盒,该第一盒包括或基本上由启动子、编码Cas(例如,Cas9)的核酸分子和终止子组成,并且第二rAAV包含多个,四个,盒,这些盒包括或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如,每个盒示意性地由启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子表示(其中N是可以插入的处于载体的包装尺寸极限的上限的数目))。由于rAAV是一种DNA病毒,因此涉及AAV或rAAV的在此讨论中的核酸分子有利地是DNA。在一些实施例中,启动子有利地是人类突触蛋白I启动子(hSyn)。
[0291] 用于将核酸递送至细胞的另外的方法是本领域的技术人员已知的。参见例如通过引用结合在此的US 20030087817。
[0292] 在一些实施例中,用一种或多种在此描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中,当细胞天然地出现在受试者体内时将其转染。在一些实施例中,被转染的细胞取自受试者。在一些实施例中,该细胞来源于取自受试者的细胞,如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人类胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-
2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-
7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-
1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、维洛(Vero)细胞、WM39、WT-
49、X63、YAC-1、YAR及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如,美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(马纳萨斯(Manassus),弗吉尼亚州))。在一些实施例中,使用用一种或多种在此描述的载体转染的细胞建立新的细胞系,该新的细胞系包括一种或多种载体来源的序列。在一些实施例中,使用用如在此描述的CRISPR系统的组分转染(如通过用一种或多种载体进行瞬时转染或用RNA进行转染)且通过CRISPR复合物的活性修饰的细胞建立新的细胞系,该新的细胞系包括以下细胞,这些细胞包含吸水但是缺少任何其他外源序列。在一些实施例中,在评估一种或多种测试化合物中使用用一种或多种在此描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。
[0293] 在一些实施例中,使用一种或多种在此描述的载体产生非人转基因动物或转基因植物。在一些实施例中,该转基因动物是一种哺乳动物,如小鼠、大鼠或兔。用于产生转基因植物和动物的方法在本领域是已知的,并且通常以如在此描述的细胞转染方法开始。
[0294] 随着作物基因组学的最新进展,使用CRISPR-Cas系统进行有效且符合成本效益的基因编辑和操纵的能力将允许快速选择并比较单个和多元遗传操作,以转化这样的基因组,以便改善生产并增强性状。在此方面,参考美国专利和出版物:美国专利号6,603,061-农杆菌介导的植物转化法(Agrobacterium-Mediated Plant Transformation Method);美国专利号7,868,149-植物基因组序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-转具有增强的农艺性状的基因植物(Transgenic Plants with Enhanced Agronomic Traits),将每者的所有内容和披露通过引用以其全文结合在此。在本发明的实践中,莫雷尔(Morrell)等人“作物基因组学:进展与应用(Crop genomics:advances and applications)”《遗传学自然评论》(Nat Rev Genet.)2011年12月29日;13(2):85-96的内容和披露也通过引用以其全文并入本文。在本发明的一个有利实施例中,该CRISPR/Cas9系统被用以工程化微藻类。该CRISPR-Cas系统能够用于植物系统中,这还提供于原稿“使用CRISPR/Cas系统在植物中高效编辑基因组(Efficient Genome Editing in Plants using a CRISPR/Cas System)”冯(Feng)等人《细胞研究》(Cell Res.)2013年8月20日,doi:10.1038/cr.2013.114.[电子出版先于印刷],通过引用以其全文结合,其中证实了工程化的CRISPR/Cas复合物可以用于在植物基因组的特定位点产生双链断裂,以实现在双子叶植物和单子叶植物两者中的靶向基因组修饰。因此,加上必要的变更,此处对动物细胞的提及也可适用植物细胞,除非另外是显然的。
[0295] 在一个方面,本发明提供了修饰真核细胞中的靶多核苷酸的方法,这些方法可以在体内、离体或在体外。在一些实施例中,该方法包括从人或非人动物或植物(包括微藻)取样细胞或细胞群,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物(包括微藻)中。对于重新引入的细胞,特别优选的是这些细胞是干细胞。
[0296] 在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包括与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。
[0297] 在一个方面,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中该CRISPR复合物包括与杂交到在所述多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。事实上,这些取样、培养和重新引入选择跨本发明的多个方面而适用。
[0298] 确实,在本发明的任何方面,该CRISPR复合物可以包括与杂交到靶序列上的指导序列复合的CRISPR酶,其中所述指导序列可以连接到tracr配对序列上,该tracr配对序列进而可以杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。
[0299] 在一个方面,本发明提供了以下试剂盒,这些试剂盒包含披露于以上方法和组合物中的元件中的任何一个或多个。元件可以单独地或组合地提供,并且可以被提供于任何适合的容器中,如小瓶、瓶子或管。在一些实施例中,该试剂盒包括一种或多种语言,例如多于一种语言的说明书。
[0300] 在一些实施例中,试剂盒包括一种或多种用于在利用在此描述的元件中的一种或多种的方法中使用的试剂。试剂可以被提供于任何适合的容器中。例如,试剂盒可以提供一种或多种反应或存储缓冲液。可以按在具体测定中可用的形式或按在使用之前需要添加一种或多种其他组分的形式(例如按浓缩或冻干形式)提供试剂。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施例中,该缓冲液是碱性的。在一些实施例中,该缓冲液具有从约7至约10的pH。在一些实施例中,该试剂盒包括一个或多个寡核苷酸,该一个或多个寡核苷酸对应于用于插入进载体中的指导序列,以便可操作地连接该指导序列和调节元件。在一些实施例中,该试剂盒包括同源重组模板多核苷酸。
[0301] 在一个方面,本发明提供了用于使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。正因为如此,本发明的CRISPR复合物在例如基因疗法、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性CRISPR复合物包括与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交。该指导序列与tracr配对序列连接,该tracr配对序列进而与tracr序列杂交。
[0302] 在一个实施例中,本发明提供了一种切割靶多核苷酸的方法。该方法包括使用CRISPR复合物修饰靶多核苷酸,该CRISPR复合物结合到该靶多核苷酸上并且实施所述靶多核苷酸的切割。典型地,当被引入进细胞中时,本发明的CRISPR复合物在基因组序列中产生一个断裂(例如,单链或双链断裂)。例如,可以使用该方法切割细胞中的疾病基因。
[0303] 由该CRISPR复合物产生的断裂可以通过修复过程进行修复,如易出错的非同源末端连接(NHEJ)途径或高保真同源定向修复(HDR)(图11)。在这些修复过程期间,可以将外源多核苷酸模板引入进基因组序列中。在一些方法中,该HDR过程被用于修饰基因组序列。例如,将外源多核苷酸模板引入进细胞中,该外源多核苷酸模板包括有待整合的、侧翼为上游序列和下游序列的序列。上游和下游序列与染色体中的整合位点的任一侧都具有序列相似性。
[0304] 在希望的情况下,供体多核苷酸可以是DNA,例如DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、一段线性DNA、PCR片段、裸核酸或与递送赋形剂(如脂质体或泊洛沙姆)复合的核酸。
[0305] 该外源多核苷酸模板包括有待整合的序列(例如,突变的基因)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的多核苷酸或非编码RNA(例如,微小RNA)。因此,供整合的序列可以可操作地连接到一个或多个适当的控制序列上。可替代地,有待整合的序列可以提供一种调节功能。
[0306] 选择外源多核苷酸模板中的上游和下游序列,以促进感兴趣的染色体序列与供体多核苷酸之间的重组。该上游序列是一个与供整合的靶向位点的上游的基因组序列具有序列相似性的核酸序列。类似地,该下游序列是一个与供整合的靶向位点的染色体序列下游具有序列相似性的核酸序列。外源多核苷酸模板中的上游和下游序列与靶向的基因组序列可以具有75%、80%、85%、90%、95%或100%序列一致性。优选地,外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约99%或100%序列一致性。
[0307] 上游或下游序列可以包括从约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、
2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约
2000bp、约600bp至约1000bp或更具体地约700bp至约1000bp。
[0308] 在一些方法中,该外源多核苷酸模板可以进一步包括一种标记。这样的一种标记使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择性标记。可以使用重组技术构建本发明的外源多核苷酸模板(参见例如,萨姆布鲁克(Sambrook)等人,2001和奥苏贝尔(Ausubel)等人,1996)。
[0309] 在一种用于通过整合外源多核苷酸模板而修饰靶多核苷酸的示例性方法中,通过CRISPR复合物将双链断裂引入进基因组序列中,经由同源重组一个外源多核苷酸模板而修复该断裂,这样使得将该模板整合进基因组中。双链断裂的存在促进模板的整合。
[0310] 在其他实施例中,本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸的表达。
[0311] 在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当CRISPR复合物结合到细胞中的靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白质或微小RNA编码序列失活,这样使得该蛋白质不被产生。
[0312] 在一些方法中,可以使控制序列失活,这样使得它不再作为控制序列起作用。如在此使用,“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子,它们是控制序列。
[0313] 失活的靶序列可以包括缺失突变(即,缺失一个或多个核苷酸)、插入突变(即,插入一个或多个核苷酸)或无义突变(即,用另一个核苷酸取代一个单核苷酸,这样使得引入终止密码子)。在一些方法中,靶序列的失活导致该靶序列的“敲除(knock-out)”。
[0314] 可以使用本发明的方法产生可以用作疾病模型的植物、动物或细胞。如在此使用,“疾病”是指受试者的疾病、障碍或适应症。例如,可以使用本发明的方法产生以下动物或细胞,该动物或细胞在一个或多个与疾病相关的核酸序列中包括修饰,或以下植物、动物或细胞,一个或多个与疾病相关的核酸序列的表达在该植物、动物或细胞中被改变。这样的核酸序列可以编码疾病相关蛋白序列或可以是疾病相关控制序列。因此,应该理解的是在本发明的实施例中,植物、受试者、患者、生物或细胞可以是非人受试者、患者、生物或细胞。因此,本发明提供了由本发明方法产生的植物、动物或细胞或其子代。该子代可以是产生的植物或动物的克隆或可以通过与同一物种的其他个体杂交而由有性繁殖产生,以在其后代中基因渗入另外的令人希望的性状。在多细胞生物(特别是动物或植物)的情况下,该细胞可以是在体内或离体的。在该细胞处于培养中的情况下,如果满足适当的培养条件并且优选地,如果该细胞适合地适于此目的(例如,干细胞),则可以建立细胞系。还设想了通过本发明产生的细菌细胞系。因此,还设想了细胞系。
[0315] 在一些方法中,可以使用疾病模型研究突变对动物或细胞的影响以及使用在疾病研究中常用的措施对疾病的发展和/或进展的影响。可替代地,这样的一种疾病模型有用于研究药物活性化合物对疾病的影响。
[0316] 在一些方法中,可以使用疾病模型评估潜在的基因疗法策略的效力。也就是说,可以将疾病相关基因或多核苷酸进行修饰,这样使得疾病发展和/或进展被抑制或减少。具体而言,该方法包括修饰疾病相关基因或多核苷酸,这样使得产生一种改变的蛋白质,其结果是,该动物或细胞具有改变的反应。因此,在一些方法中,可以将基因修饰动物与易患该疾病的动物进行比较,这样使得可以评估基因疗法事件的效果。
[0317] 在另一个实施例中,本发明提供了一种研发生物活性剂的方法,该生物活性剂调制与疾病基因相关的细胞信号传导事件。该方法包括使测试化合物与细胞接触,该细胞包括一种或多种载体,这一种或多种载体驱动CRISPR酶、连接到tracr配对序列上的指导序列和tracr序列中的一种或多种的表达;并且检测读出的变化,该变化指示与例如包含在该细胞中的疾病基因的突变相关的细胞信号传导事件的减少或增加。
[0318] 可以与用于筛选细胞功能变化的本发明的方法组合构建细胞模型或动物模型。可以使用这样的一种模型研究由本发明的CRISPR复合物修饰的基因组序列对感兴趣的细胞功能的影响。例如,可以使用细胞功能模型研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地,可以使用细胞功能模型研究修饰的基因组序列对感知觉的影响。在一些这样的模型中,修饰一个或多个与该模型中的信号传导生化学途径相关的基因组序列。
[0319] 已经具体研究了若干疾病模型。这些疾病模型包括新生(de novo)自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征性自闭症(安格曼综合征(Angelman Syndrome))基因UBE3A。这些基因以及所得的自闭症模型当然是优选的,但用于显示本发明的跨基因和对应的模型的广阔的适用性。
[0320] 可以通过当将测试模型细胞和对照细胞与候选试剂接触时,测定它们之间的对应的基因的mRNA水平差异而确定一个或多个与信号传导生化途径相关的基因组序列的改变的表达。可替代地,通过检测编码的多肽或基因产物的水平差异而确定与信号传导生化途径相关的序列的差异表达。
[0321] 为了在mRNA转录物或对应的多核苷酸水平上测定试剂诱导的变化,首先根据本领域的标准方法提取包含在样品中的核酸。例如,可以根据陈述于萨姆布鲁克(Sambrook)等人(1989)中的程序使用各种水解酶分离mRNA或遵循由制造商提供的随附说明书通过核酸结合树脂提取mRNA。然后,根据本领域广泛已知的方法或基于在此示例的方法,通过扩增程序或常规的杂交测定(例如Northern印迹分析)检测包含在提取的核酸样品中的mRNA。
[0322] 出于本发明的目的,扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组DNA聚合酶,如TaqGoldTM、T7DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是PCR。具体而言,可以使分离的RNA经受逆转录测定,该测定与定量聚合酶链式反应(RT-PCR)耦合,以便定量与信号传导生化途径相关的序列的表达水平。
[0323] 在扩增测定中可以实时地执行基因表达水平的检测。在一个方面,可以用荧光DNA结合剂直接使扩增产物可视化,这些荧光DNA结合剂包括但不限于DNA嵌入剂和DNA沟结合剂。因为掺入进双链DNA分子中的嵌入剂的量典型地与扩增DNA产物的量成比例,可以常规地通过使用本领域的常规光学系统定量嵌入的染料的荧光而确定扩增产物的量。适于本申请的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶(homidium)、光辉霉素、多吡啶钌、安曲霉素等。
[0324] 在另一个方面,可以在扩增反应中利用其他荧光标记物(如序列特异的探针),以促进扩增产物的检测和定量。基于探针的定量扩增依赖于希望的扩增产物的序列特异的检测。它利用荧光的靶标特异的探针(例如, 探针),从而导致增加的特异性和敏感性。用于进行基于探针的定量扩增的方法本领域是确立的并且教导于美国专利号5,210,
015中。
[0325] 在又另一个方面,可以使用与以下序列具有序列同源性的杂交探针进行常规的杂交测定,这些序列与信号传导生化途径相关。典型地,在杂交反应中,允许探针和与信号传导生化途径相关的序列形成稳定的复合物,这些序列被包含在来源于测试受试者的生物样品内。本领域的技术人员应该意识到的是,在将反义核酸用作探针核酸的情况下,提供于样品中的靶多核苷酸被选择为与该反义核酸的序列互补。相反地,在核苷酸探针是有义核酸的情况下,该靶多核苷酸被选择为与该有义核酸的序列互补。
[0326] 可以在不同严格度条件下进行杂交。用于实践本发明的适合的杂交条件是这样的,使得探针和与信号传导生化途径相关的序列之间的识别相互作用既是充分特异的又是充分稳定的。增加杂交反应的严格度的条件在本领域是广泛已知且公开的。参见例如,(萨姆布鲁克(Sambrook)等人,(1989);非放射性原位杂交应用手册(Nonradioactive In Situ Hybridization Application Manual),宝灵曼公司(Boehringer Mannheim),第二版)。可以使用固定在任何固体支持物上的探针进行杂交测定,所述固体支持物包括但不限于硝化纤维、玻璃、以及多种基因阵列。如描述于美国专利号5,445,934中,在高密度基因芯片上执行优选的杂交测定。
[0327] 对于在杂交测定过程中形成的探针-靶标复合物的常规检测,将核苷酸探针络合至可检测标记物上。适于在本发明中使用的可检测标记物包括通过光化学、生物化学、光谱学、免疫化学、电学、光学或化学手段可检测的任何组合物。多种多样的适当的可检测标记物在本领域是已知的,包括荧光或化学发光标记物、放射性同位素标记物、酶或其他配体。在优选的实施例中,可能希望的是利用荧光标记物或酶标签,如地高辛、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、亲和素/生物素复合物。
[0328] 用于检测或定量杂交强度的检测方法将典型地取决于以上选择的标记物。例如,可以使用照相底片或感光成像仪检测放射性标记物。可以使用检测发射光的光检测器检测并定量荧光标记物。典型地通过为酶提供底物并测量由酶对底物的作用而产生的反应产物来检测酶标记物;并且最后,通过简单地使着色的标记物可视化而检测比色标记物。
[0329] 还可以通过检查对应的基因产物确定与信号传导生化途径相关的序列的试剂诱导的表达变化。确定蛋白质水平典型地涉及a)使包含在生物样品中的蛋白质与特异性结合到与信号传导生化途径相关的蛋白质上的试剂接触;并且(b)鉴定这样形成的任何试剂:蛋白质复合物。在此实施例的一个方面,特异性结合与信号传导生化途径相关的蛋白质的该试剂是一种抗体,优选单克隆抗体。
[0330] 通过在将允许在该试剂和与信号传导生化途径相关的蛋白质之间形成复合物的条件下,通过使该试剂与来源于测试样品的与信号传导生化途径相关的蛋白质的样品接触而进行该反应。可以根据本领域中的标准程序直接地或间接地检测复合物的形成。在直接检测方法中,这些试剂提供有可检测的标记物并且未反应的试剂可以从复合物中除去;由此剩余的标记物的量指示形成的复合物的量。对于这样的方法,优选的是选择即使在严格洗涤条件过程中仍附接至这些试剂上的标记物。优选的是,该标记物不干扰结合反应。在替代方案中,间接检测程序可以使用包含用化学方法或酶方法引入的标记物的试剂。令人希望的标记物通常不干扰所得的试剂:多肽复合物的结合或稳定性。然而,标记物典型地被设计成是用于有效结合并且因此产生可检测的信号的抗体可及的。
[0331] 适于检测蛋白质水平的多种多样的标记物在本领域是已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物以及化学发光化合物。
[0332] 可以通过标准定量测定定量在结合反应过程中形成的试剂:多肽复合物的量。如上所示,可以通过仍留在结合位点处的标记物的量直接测量试剂:多肽复合物的形成。在一个替代方案中,测试与信号传导生化途径相关的蛋白质与标记的类似物结合特定试剂上的位点的竞争能力。在此竞争测定中,捕获的标记物的量与存在于测试样品中的与信号传导生化途径相关的蛋白质序列的量成反比。
[0333] 多种用于蛋白质分析的基于以上概括的总则的技术在本领域是可获得的。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹层”免疫测定、免疫放射测定、原位免疫测定(使用例如,胶体金、酶或放射性同位素标记物)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定以及SDS-PAGE。
[0334] 特异性识别或结合到与信号传导生化途径相关的蛋白质上的抗体对于执行前述蛋白质分析而言是优选的。在希望的情况下,可以使用识别特定类型的翻译后修饰(例如,信号传导生化途径诱导的修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化以及磷酸化。这些抗体可以购自商业供应商。例如,特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体可以获得自多个供应商,包括英杰公司和珀金埃尔默公司(Perkin Elmer)。抗磷酸酪氨酸抗体在检测响应于ER应激而在其酪氨酸残基上存在差异磷酸化的蛋白质中是特别有用的。这样的蛋白质包括但不限于真核翻译起始因子2α(eIF-2α)。可替代地,可以通过用展示出希望的翻译后修饰的靶蛋白免疫宿主动物或抗体产生细胞而使用常规的多克隆或单克隆抗体技术产生这些抗体。
[0335] 在实践主题方法中,可以令人希望的是,在不同身体组织中、在不同细胞类型中和/或在不同亚细胞结构中辨别与信号传导生化途径相关的蛋白质的表达谱。可以通过使用能够结合到优先表达于某些组织、细胞类型或亚细胞结构中的蛋白质标记的组织特异的、细胞特异的或亚细胞结构特异的抗体进行这些研究。
[0336] 还可以通过检查基因产物相对于对照细胞的活性变化而确定与信号传导生化途径相关的基因的改变的表达。与信号传导生化途径相关的蛋白质的试剂诱导的活性变化的测定将取决于处于研究之下的生物活性和/或信号传导途径。例如,在该蛋白质是一种激酶的情况下,可以通过本领域已知的多种测定确定它磷酸化一种或多种下游底物的能力的变化。代表性测定包括但不限于用抗体进行免疫印迹和免疫沉淀,这些抗体是如识别磷酸化蛋白质的抗磷酸酪氨酸抗体。此外,可以通过高通量化学发光测定检测激酶活性,如AlphaScreenTM(可获得自珀金埃尔默公司)和eTagTM测定(陈-辉(Chan-Hui)等人(2003《)临床免疫学》(Clinical Immunology)111:162-174)。
[0337] 在与信号传导生化途径相关的蛋白质是使得细胞内pH条件波动的信号传导级联的一部分的情况下,可以将pH敏感的分子(如荧光pH染料)用作报道分子。在与信号传导生化途径相关的蛋白质是一种离子通道的另一个实例中,可以监测膜电位和/或细胞内离子浓度的波动。多种商业试剂盒和高通量装置特别适于快速且稳健地筛选离子通道调节剂。代表性仪器包括FLIPRTM(分子设备公司(Molecular Devices,Inc.))和VIPR(奥罗拉生物科学公司(Aurora Biosciences))。这些仪器能够同时检测微板的1000多个样品孔中的反应,并且能够提供一秒内或甚至一毫秒内的实时测量和功能数据。
[0338] 在实践在此披露的任何方法中,可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中,这些方法包括但不限于,显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中,通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中,通过核转染将这个或这些载体引入进细胞中。
[0339] CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。
[0340] 靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
[0341] CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。
[0342] CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生化途径相基因和多核苷酸,如分别提交于2012年12月12日和2013年1月2日、标题均为用于序列操纵的系统方法和组合物(SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION)的分别具有博德(Broad)参考号BI-2011/008/WSGR案卷号44063-701.101和BI-2011/008/WSGR案卷号44063-701.102的美国临时专利申请61/736,527和61/748,427中所列举,将所有这些申请的内容通过引用以其全文结合在此。
[0343] 靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
[0344] 疾病相关基因和多核苷酸的实例列于表A和B中。在万维网上可获得的疾病具体信息可获得自约翰斯·霍普金斯大学的麦考斯克-纳森遗传医学研究所(McKusick-Nathans Institute of Genetic Medicine,Johns Hopkins University)(巴尔的摩,马里兰州)和国立医学图书馆的国家生物技术信息中心(National Center for Biotechnology Information,National Library of Medicine)(贝塞斯达,马里兰州)。信号传导生化途径相关基因和多核苷酸的实例列于表C中。
[0345] 这些基因和途径的突变可以导致产生不当的蛋白质或以不当的量影响功能的蛋白质。通过引用而特此结合来自于2012年12月12日提交的美国临时申请61/736,527和2013年1月2日提交的61/748,427的基因、疾病和蛋白质的另外的实例。这样的基因、蛋白质和途径可以是CRISPR复合物的靶多核苷酸。表A
表B:
表C:
[0346] 本发明的实施例还涉及与敲除基因、扩增基因以及修复与DNA重复不稳定性和神经障碍相关的具体突变有关的方法和组合物(罗伯特D.·威尔斯(Robert D.Wells)、芦沢哲夫(Tetsuo Ashizawa),遗传不稳定性与神经疾病(Genetic Instabilities and Neurological Diseases),第二版,学术出版社(Academic Press),2011年10月13日-《医学》(Medical))。已经发现串联重复序列的特定方面对超过二十种人类疾病负责(重复不稳定新见:RNA·DNA杂交体的作用(New insights into repeat instability:role of RNA·DNA hybrids).麦基弗EI(McIvor EI)、波拉克U(Polak U)、纳皮尔拉拉M(Napierala M)《.RNA生物学》(RNA Biol.)2010年9月-10月;7(5):551-8)。可以利用CRISPR-Cas系统校正基因组不稳定性缺陷。
[0347] 本发明的一个另外的方面涉及利用CRISPR-Cas系统校正EMP2A和EMP2B基因缺陷,这些基因已经被鉴定为与拉福拉病(Lafora disease)相关。拉福拉病是一种由可以作为青年期的癫痫发作而开始的进行性肌阵挛性癫痫表征的常染色体隐性病症。该疾病的少数病可以由尚未鉴定的基因的突变引起。该疾病引起发作、肌肉痉挛、行走困难、痴呆,并且最终引起死亡。当前没有疗法被证明有效对抗疾病进展。与癫痫相关的其他遗传异常还可以靶向CRISPR-Cas系统并且基础遗传学进一步描述于由朱利亚诺阿文济尼(Giuliano Avanzini)、杰弗里L.诺贝尔斯(Jeffrey L.Noebels)编辑的《癫痫与遗传癫痫遗传学》(Genetics of Epilepsy and Genetic Epilepsies),马里亚尼儿科神经学基金会
(Mariani Foundation Paediatric Neurology):20;2009)中。
[0348] 在本发明的又另一个方面,该CRISPR-Cas系统可以用来矫正几种基因突变引起的眼部缺陷,其进一步描述于《眼的遗传疾病》(Genetic Diseases of the Eye),第二次编辑,由伊莱亚斯(Elias)I.特拉布勒西(Traboulsi)编辑,牛津大学出版社,2012年。
[0349] 本发明的若干另外的方面涉及校正与范围广泛的遗传性疾病相关的缺陷,这些遗传性疾病在专题小节遗传性障碍(Genetic Disorders)下被进一步描述于国立卫生研究院的网站(网址为health.nih.gov/topic/GeneticDisorders)。遗传性脑病可以包括但不限于,肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征(Aicardi Syndrome)、阿尔佩斯病(Alpers'Disease)、阿尔茨海默病、巴特综合征(Barth Syndrome)、巴藤病(Batten Disease)、CADASIL、小脑变性、费波瑞病(Fabry's Disease)、格斯特曼-施特劳斯纳病(Gerstmann-Straussler-Scheinker Disease)、亨廷顿病以及其他三联体重复障碍、莱氏病(Leigh's Disease)、莱施-奈恩综合征、门克斯病、线粒体肌病以及NINDS空洞脑(Colpocephaly)。这些疾病在小节遗传性脑部障碍(Genetic Brain Disorders)下被进一步描述于国立卫生研究院的网站。
[0350] 在一些实施例中,该病症可以是瘤形成。在一些实施例中,在该病症是瘤形成的情况下,有待被靶向的基因是列于表A中的那些基因中的任一种(在这种情况下是PTEN等)。在一些实施例中,该病症可以是年龄相关性黄斑变性。在一些实施例中,该病症可以是一种精神分裂症障碍。在一些实施例中,该病症可以是一种三核苷酸重复障碍。在一些实施例中,该病症可以是脆性X综合征。在一些实施例中,该病症可以是一种分泌酶相关障碍。在一些实施例中,该病症可以是一种朊病毒相关障碍。在一些实施例中,该病症可以是ALS。在一些实施例中,该病症可以是一种药物成瘾。在一些实施例中,该病症可以是自闭症。在一些实施例中,该病症可以是阿尔茨海默病。在一些实施例中,该病症可以是炎症。在一些实施例中,该病症可以是帕金森病
[0351] 与帕金森病相关的蛋白质的实例包括但不限于α-突触核蛋白、DJ-1、LRRK2、PINK1、帕金蛋白、UCHL1、Synphilin-1以及NURR1。
[0352] 成瘾相关的蛋白质的实例可以包括例如ABAT。
[0353] 炎症相关蛋白的实例可以包括例如由Ccr2基因编码的单核细胞趋化蛋白-1(MCP1)、由Ccr5基因编码的C-C趋化因子受体类型5(CCR5)、由Fcgr2b基因编码的IgG受体IIB(FCGR2b,亦称CD32)或由Fcer1g基因编码的FcεR1g(FCER1g)蛋白。
[0354] 心血管疾病相关蛋白的实例可以包括例如IL1B(白介素1,β)、XDH(黄嘌呤脱氢酶)、TP53(肿瘤蛋白p53)、PTGIS(前列腺素I2(前列腺环素)合酶)、MB(肌红蛋白)、IL4(白介素4)、ANGPT1(血管生成素1)、ABCG8(ATP-结合盒,亚家族G(WHITE),成员8)或CTSK(组织蛋白酶K)。
[0355] 阿尔茨海默病相关蛋白的实例可以包括例如由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样改性剂激活酶1(UBA1)或由UBA3基因编码的NEDD8-激活酶E1催化亚基蛋白(UBE1C)。
[0356] 自闭症谱系障碍相关蛋白的实例可以包括例如由BZRAP1基因编码的苯二氮卓受体(外周)相关蛋白1(BZRAP1)、由AFF2基因编码的AF4/FMR2家族成员2蛋白(AFF2)(亦称MFR2)、由FXR1基因编码的脆性X智力迟钝常染色体同系物1蛋白(FXR1)或由FXR2基因编码的脆性X智力迟钝常染色体同系物2蛋白(FXR2)。
[0357] 黄斑变性相关蛋白的实例可以包括例如由ABCR基因编码的ATP-结合盒,亚家族A(ABC1)成员4蛋白(ABCA4)、由APOE基因编码的载脂蛋白E蛋白(APOE)或由CCL2基因编码的趋化因子(C-C基序)配体2蛋白(CCL2)。
[0358] 精神分裂症相关蛋白的实例可以包括NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISC1、GSK3B及其组合。
[0359] 涉及肿瘤抑制的蛋白质的实例可以包括例如ATM(共济失调性毛细血管扩张突变的)、ATR(共济失调性毛细血管扩张和Rad3相关的)、EGFR(表皮生长因子受体)、ERBB2(v-erb-b2红白血病病毒癌基因同系物2)、ERBB3(v-erb-b2红白血病病毒癌基因同系物3)、ERBB4(v-erb-b2红白血病病毒癌基因同系物4)、Notch 1、Notch 2、Notch 3或Notch 4。
[0360] 与分泌酶障碍相关的蛋白质的实例可以包括例如PSENEN(早老素增强子2同系物(秀丽隐杆线虫))、CTSB(组织蛋白酶B)、PSEN1(早老素1)、APP(淀粉样蛋白β(A4)前体蛋白)、APH1B(前咽缺陷1同系物B(秀丽隐杆线虫))、PSEN2(早老素2(阿尔茨海默病4))或BACE1(β-位点APP-切割酶1)。
[0361] 与肌萎缩性侧索硬化相关的蛋白质的实例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性侧索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)以及VAGFC(血管内皮生长因子C)及其任何组合。
[0362] 与朊病毒病相关的蛋白质的实例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性侧索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)以及VAGFC(血管内皮生长因子C)及其任何组合。
[0363] 与朊病毒病症中的神经退行性疾病相关的蛋白质的实例可以包括例如A2M(α-2-巨球蛋白)、AATF(凋亡拮抗转录因子)、ACPP(前列腺的酸性磷酸酶)、ACTA2(肌动蛋白α2平滑肌主动脉)、ADAM22(ADAM金属肽酶结构域)、ADORA3(腺苷A3受体)或ADRA1D(α-1D肾上腺素能受体(Alpha-1D adrenergic receptor或Alpha-1D adrenoreceptor))。
[0364] 与免疫缺陷相关的蛋白质的实例可以包括例如A2M[α-2-巨球蛋白];AANAT[芳烷基胺N-乙酰转移酶];ABCA1[ATP-结合盒,亚家族A(ABC1),成员1];ABCA2[ATP-结合盒,亚家族A(ABC1),成员2];或ABCA3[ATP-结合盒,亚家族A(ABC1),成员3]。
[0365] 与三核苷酸重复障碍相关的蛋白质的实例包括例如AR(雄激素受体)、FMR1(脆性X智力迟钝1)、HTT(亨廷顿蛋白)或DMPK(强直性肌营养不良蛋白激酶)、FXN(弗氏共济失调蛋白(frataxin))、ATXN2(共济失调蛋白2)。
[0366] 与神经传递障碍相关的蛋白质的实例包括例如SST(生长抑素)、NOS1(一氧化氮合酶1(神经元的))、ADRA2A(肾上腺素能的,α-2A-,受体)、ADRA2C(肾上腺素能的,α-2C-,受体)、TACR1(速激肽受体1)或HTR2c(5-羟色胺(血清素)受体2C)。
[0367] 神经发育相关序列的实例包括例如A2BP1[共济失调蛋白2-结合蛋白1]、AADAT[氨基己二酸氨基转移酶],AANAT[芳烷基胺N-乙酰转移酶]、ABAT[4-氨基丁酸氨基转移酶]、ABCA1[ATP-结合盒,亚家族A(ABC1),成员1]或ABCA13[ATP-结合盒,亚家族A(ABC1),成员13]。
[0368] 可用本发明系统治疗的优选病症的另外的实例可以选自:艾卡迪-古铁雷斯综合征(Aicardi-Goutières Syndrome);亚历山大病;阿伦-赫恩登-达德利综合征(Allan-Herndon-Dudley Syndrome);POLG相关障碍;α-甘露糖苷贮积症(II和III型);阿尔斯特伦综合征( Syndrome);安格曼;综合征;共济失调-毛细血管扩张;神经元蜡样-脂褐质沉积;β-地中海贫血;双侧视神经萎缩和1型(婴儿)视神经萎缩;视网膜母细胞瘤(双侧的);卡纳万病(Canavan Disease);脑-眼-面-骨骼综合征(Cerebrooculofacioskeletal Syndrome)1[COFS1];脑黄瘤病;科尼利亚迪兰吉综合征(Cornelia de Lange Syndrome);MAPT相关障碍;遗传性朊病毒病;德拉韦综合征(Dravet Syndrome);早期发病家族性阿尔茨海默病;弗里德赖希共济失调[FRDA];多发性畸形;岩藻糖苷贮积症;福山(Fukuyama)先天性肌营养不良;半乳糖唾液酸贮积症;戈谢病(Gaucher Disease);有机酸血症;噬血细胞淋巴组织细胞增生症;早衰症;粘脂贮积症II;婴儿游离唾液酸贮积病;
PLA2G6相关神经变性;耶韦尔和朗格-尼尔森综合征(Jervell and Lange-Nielsen 
Syndrome);结合性大疱性表皮松解;亨廷顿病;克拉伯病(Krabbe Disease)(婴儿的);线粒体DNA相关雷吉综合征(Mitochondrial DNA-Associated Leigh Syndrome)和NARP;莱施-奈恩综合征;LIS1相关无脑回;洛氏综合征(Lowe Syndrome);槭糖尿病;MECP2复制综合征;
ATP7A相关转运障碍;LAMA2相关肌营养不良;芳基硫酸酯酶A缺乏;I、II或III型粘多糖贮积症;过氧化物酶体生物发生障碍,齐薇格谱系综合征(Zellweger Syndrome Spectrum);
伴随脑铁累积障碍的神经变性;酸性鞘磷脂酶缺乏;C型尼曼-皮克病;甘氨酸脑病;ARX相关障碍;尿素循环障碍;COL1A1/2相关成骨不全;线粒体DNA缺失综合征;PLP1相关障碍;佩里综合征(Perry Syndrome);费伦-麦克德米德综合征(Phelan-McDermid Syndrome);II型糖原贮积症(蓬佩病(Pompe Disease))(婴儿的);MAPT相关障碍;MECP2相关障碍;1型肢近端型点状软骨发育不全(Rhizomelic Chondrodysplasia Punctata Type 1);罗伯茨综合征(Roberts Syndrome);桑德霍夫病(Sandhoff Disease);辛德勒病(Schindler Disease)-1型;腺苷脱氨酶缺乏;史-伦-奥三氏综合征;脊髓性肌萎缩;婴儿发病脊髓小脑性共济失调;
己糖胺酶A缺乏;1型致死性发育不良;胶原VI型相关障碍;I型乌谢尔综合征(Usher Syndrome);先天性肌营养不良;沃尔夫-赫奇霍恩综合征(Wolf-Hirschhorn Syndrome);溶酶体酸脂酶缺乏;以及着色性干皮病。
[0369] 如将是显而易见的,设想的是可以使用本发明系统靶向任何感兴趣的多核苷酸序列。使用本发明系统进行治疗可能是有用的病症或疾病的一些实例被包括在上表中并且当前与那些病症相关的基因的实例也被提供于此。然而,示例的基因并不是穷尽性的。
[0370] 例如,“野生型StCas9”是指来自嗜热链球菌的野生型Cas9,其蛋白质序列在登录号G3ECR1下给出于SwissProt数据库中。类似地,化脓链球菌Cas9在登录号Q99ZW2下被包括在SwissProt中。
[0371] 使用CRISPR-Cas系统进行有效且符合成本效益的基因编辑和操纵的能力将允许快速选择并比较单个和多元遗传操作,以转化这样的基因组,以便改善生产并增强性状。在此方面,参考美国专利和出版物:美国专利号6,603,061-农杆菌介导的植物转化法(Agrobacterium-Mediated Plant Transformation Method);美国专利号7,868,149-植物基因组序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/
0100536-转具有增强的农艺性状的基因植物(Transgenic Plants with Enhanced 
Agronomic Traits),将每者的所有内容和披露通过引用以其全文结合在此。在本发明的实践中,莫雷尔(Morrell)等人“作物基因组学:进展与应用(Crop genomics:advances and applications)”《遗传学自然评论》(Nat Rev Genet.)2011年12月29日;13(2):85-96的内容和披露也通过引用以其全文并入本文。
实例
[0372] 以下实例出于说明本发明的不同实施例的目的而给出并且并不意在以任何方式限制本发明。本发明实例连同在此描述的方法目前代表优选的实施例,是示例性的,并且并不旨在限制本发明的范围。涵盖在如由权利要求书的范围所定义的本发明的精神内的在此的变化以及其他用途是本领域普通技术人员可以想到的。实例1:用于简化克隆和递送的方法改进。
[0373] 并非在质粒上编码U6-启动子和指导RNA,申请人用DNA寡核苷酸扩增了U6启动子,以添加到指导RNA上。可以将生成的PCR产物转染到细胞中,以驱动指导RNA的表达。
[0374] 允许产生由靶向人EMX1座位的U6-启动子::指导RNA组成的PCR产物的示例性引物对:
[0375] 正向引物:AAACTCTAGAgagggcctatttcccatgattc
[0376] 反向引物(携带指导RNA,该指导RNA已加下划线):acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTTGTTTCCAAAACAGCATAGCTCTAAAACCCCTAGTCATTGGAGGTGACGGTGTTTCGTCCTTTCCACaag
实例2:用于改善活性的方法改进:
[0377] 并非使用pol3启动子(特别是RNA聚合酶III(例如U6或H1启动子)在真核细胞中表达指导RNA,申请人在真核细胞中表达T7聚合酶,以使用T7启动子驱动指导RNA的表达。
[0378] 此系统的一个实例可以涉及引入三段DNA:
[0379] 1.Cas9的表达载体
[0380] 2.T7聚合酶的表达载体
[0381] 3.包含融合到T7启动子上的指导RNA的表达载体实例3:用于减少Cas9的毒性的方法改进:将Cas9以mRNA的形式递送。
[0382] 将Cas9以mRNA的形式递送使得可以在细胞中瞬时表达Cas9,以减少毒性。例如,可以使用以下引物对扩增人源化SpCas9:
[0383] 正向引物(用以添加到用于体外转录的T7启动子上):TAATACGACTCACTATAGGAAGTGCGCCACCATGGCCCCAAAGAAGAAGCGG
[0384] 反向引物(用以添加到polyA尾上):GGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTttcttaCTTTTTCTTTTTTGCCTGGCCG
[0385] 申请人用处于RNA或DNA盒形式的指导RNA将Cas9mRNA转染进细胞中,以驱动指导RNA在真核细胞中的表达。实例4:用于减少Cas9的毒性的方法改进:使用诱导型启动子
[0386] 申请人仅当需要进行基因组修饰时才瞬时开启Cas9表达。可诱导系统的实例包括四环素诱导型启动子(Tet-开或Tet-关)、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。实例5:用于体内应用的Cas9系统的改进
[0387] 申请人执行了具有小分子量的Cas9的宏基因组检索。大多数Cas9同系物相当大。例如,SpCas9的长度为1368aa左右,这对于容易包装进供递送的病毒载体中而言太大。从存放在GenBank中的序列生成表示出Cas9同系物的长度分布的图表(图5)。一些序列可能已经被错误注释并且因此每个长度的准确频率不一定是精确的。尽管如此,但是它提供了对Cas9蛋白分布的模糊认识并且表明存在较短的Cas9同系物。
[0388] 通过计算分析,申请人发现在细菌菌株弯曲杆菌属中,存在两个具有少于1000个氨基酸的Cas9蛋白。下文呈现了来自空肠弯曲杆菌的一种Cas9的序列。以此长度,CjCas9可以被容易地包装进AAV、慢病毒、腺病毒以及其他用于稳健地递送进原代细胞和递送进动物模型体内的病毒载体中。在本发明的一个优选实施例中,使用来自金黄色葡萄球菌的Cas9蛋白。
[0389] >空肠弯曲杆菌Cas9(CjCas9)
[0390]MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK。
[0391] 此CjCas9的假定的tracrRNA元件是:
[0392]TATAATCTCATAAGAAATTTAAAAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTAAAATT
[0393] 同向重复序列是:
[0394] ATTTTACCATAAAGAAATTTAAAAAGGGACTAAAAC
[0395] CjCas9的嵌合的指导RNA的一个实例是:
[0396]NNNNNNNNNNNNNNNNNNNNGUUUUAGUCCCGAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU
实例6:Cas9优化
[0397] 用于增强功能或用于开发新的功能,申请人通过组合来自不同Cas9同系物的片段而产生了嵌合的Cas9蛋白。例如,嵌合的Cas9蛋白的两个实例:
[0398] 例如,申请人将St1Cas9(来自此蛋白的片段为粗体)的N-末端与SpCas9(来自此蛋白的片段被加下划线)的C-末端融合。
[0399] >St1(N)Sp(C)Cas9
[0400]NQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
[0401] >Sp(N)St1(C)Cas9
[0402]MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARE[0403] 制备嵌合的Cas9的益处包括:
[0404] 减少毒性
[0405] 改善在真核细胞中的表达
[0406] 增强特异性
[0407] 减少蛋白质的分子量,通过组合来自不同Cas9同系物的最小结构域使得蛋白质更小。
[0408] 改变PAM序列要求实例7:将Cas9作为通用DNA结合蛋白而利用
[0409] 通过使负责切割DNA靶标的两条链的两个催化结构域(D10和H840)突变,申请人使用Cas9作为通用DNA结合蛋白。为了上调在靶座位的基因转录,申请人将转录激活结构域(VP64)融合到Cas9上。申请人推测见到Cas9-VP64融合蛋白的较强的核定位应该是重要的,因为转录因子激活强度是在靶标处花费的时间的函数。因此,申请人克隆了一套Cas9-VP64-GFP构建体,将它们转染进293细胞中并在转染后12小时在荧光显微镜下评估其定位。
[0410] 将相同的构建体克隆为2A-GFP而非直接融合,以便在功能上测试不存在庞大GFP干扰的构建体。申请人选择用Cas9反式激活因子靶向Sox2座位,因为这对于细胞重新编程可以是有用的并且该座位已经被验证为TALE-TF介导的转录激活的靶标。对于Sox2座位,申请人选择了转录起始位点(TSS)附近的八个靶标。每个靶标的长度均为20bp,具有一个相邻的NGG原型间隔子邻近基序(PAM)。将每个Cas9-VP64构建体与每个PCR产生的嵌合的crispr RNA(chiRNA)共转染进293细胞中。转染后72小时,使用RT-qPCR评估转录激活。
[0411] 为了进一步优化转录激活因子,申请人滴定了转染进293细胞中的chiRNA(Sox2.1和Sox2.5)与Cas9(NLS-VP64-NLS-hSpCas9-NLS-VP64-NLS)的比例,并使用RT-qPCR进行定量。这些结果指示可以将Cas9用作通用DNA结合结构域,以上调靶座位处的基因转录。
[0412] 申请人设计了第二代构建体。(参见以下清单)。pLenti-EF1a-GFP-2A-6xHis-NLS-VP64-NLS-hSpCsn1(D10A,H840A)-NLS
pLenti-EF1a-GFP-2A-6xHis-NLS-VP64-NLS-hSpCsn1(D10A,H840A)
pLenti-EF1a-GFP-2A-6xHis-NLS-VP64-NLS-NLS-hSpCsn1(D10A,H840A)
pLenti-EF1a-GFP-2A-6xHis-NLS-hSpCsn1(D10A,H840A)-NLS
pLenti-EF1a-GFP-2A-6xHis-NLS-hSpCsn1(D10A,H840A)
pLenti-EF1a-GFP-2A-6xHis-NLS-NLS-hSpCsn1(D10A,H840A)
[0413] 申请人使用这些构建体通过RT-qPCR评估转录激活(VP64融合的构建体)和阻遏(仅有Cas9)。申请人使用抗-His抗体评估每个构建体的细胞定位,使用Surveyor核酸酶测定评估核酸酶活性,并使用凝胶迁移测定评估DNA结合亲和性。在本发明的一个优选实施例中,该凝胶迁移测定是EMSA凝胶迁移测定。实例8:Cas9转基因和基因敲入小鼠
[0414] 为了产生表达Cas9核酸酶的小鼠,申请人提交了两个通用策略转基因和基因敲入。可以应用这些策略产生任何其他感兴趣的模式生物,例如大鼠。对于这些通用策略中的每个策略,申请人制备了组成型活性Cas9和条件表达的Cas9(Cre重组酶依赖性的)。在以下背景下表达组成型活性Cas9核酸酶:pCAG-NLS-Cas9-NLS-P2A-EGFP-WPRE-bGHpolyA。pCAG是启动子,NLS是核定位信号,P2A是肽切割序列,EGFP是增强型绿色荧光蛋白,WPRE是土拨鼠肝炎病毒转录后调节元件,并且bGHpolyA是牛生长激素poly-A信号序列(图7A-B)。该条件版本在启动子之后NLS-Cas9-NLS之前具有一个另外的终止盒元件loxP-SV40polyA x3-loxP(即pCAG-loxP-SV40polyAx3-loxP-NLS-Cas9-NLS-P2A-EGFP-WPRE-bGHpolyA)。这些重要的表达元件可以如在图8中可视化。组成型构建体应该在整个发育过程中在所有细胞类型中进行表达,而条件型构建体将仅当同一细胞正在表达Cre重组酶时才允许Cas9表达。当Cre处于组织特异的启动子的表达之下时,后一版本才将允许Cas9的组织特异的表达。此外,可以通过将Cre置于诱导型启动子(如TET on或off系统)的表达之下而在成年小鼠中诱导Cas9表达。
[0415] Cas9构建体的验证:以三种方式在功能上验证每个质粒:1)瞬时转染进293个细胞中,随后确认GFP表达;2)瞬时转染进293细胞中,随后使用识别P2A序列的抗体进行免疫荧光;以及3)瞬时转染,随后是Surveyor核酸酶测定。取决于感兴趣的细胞,这些293细胞可以是293FT或293T细胞。在一个优选的实施例中,这些细胞是293FT细胞。条件型和组成型构建体的Surveyor的结果分别示于凝胶的顶行和底行。在存在和不存在靶向hEMX1座位的嵌合的RNA(嵌合的RNA hEMX1.1)的情况下测试每个构建体。结果指示,构建体仅在嵌合的RNA的存在下才可以成功地靶向hEMX1座位(并且在条件型构建体的情况下,是Cre)。将凝胶定量并且将结果呈现为三个样品的平均的切割效率和标准差。
[0416] 转基因的Cas9小鼠:为了产生具有构建体的转基因小鼠,申请人将纯的线性DNA注射进来自假怀孕的CB56雌鼠的受精卵的原核中。对首建者小鼠进行鉴定、基因分型,并与CB57小鼠回交。将构建体成功地克隆并通过桑格测序进行证实。
[0417] 基因敲入Cas9小鼠:为了产生Cas9基因敲入小鼠,申请人将相同的组成型和条件型构建体靶向Rosa26座位。申请人通过将每个构建体克隆进具有以下元件的Rosa26靶向载体中而将其完成:Rosa26短同源臂-组成型/条件型Cas9表达盒-pPGK-Neo-Rosa26长同源臂-pPGK-DTA。pPGK是赋予对新霉素的抗性的阳性选择标记Neo、1kb短臂,4.3kb长臂以及由PGK驱动的阴性选择白喉毒素(DTA)的启动子。
[0418] 将这两种构建体在R1mESC中电穿孔并且在应用新霉素选择之前,允许生长2天。挑选存活5-7天的单独的菌落并使其在单独的孔中生长。5-7天后,收获菌落,将一半冷冻并且将另一半用于基因分型。通过基因组PCR进行基因分型,其中一个引物在供体质粒(AttpF)内退火并且另一引物在短同源臂(Rosa26-R)外退火。在针对条件构建体情况下收获的22个菌落中,7个是阳性的(左侧)。在针对组成型构建体情况下收获的27个菌落中,零个是阳性的(右侧)。可能的是Cas9在mESC中引起一定水平的毒性并且出于此原因,不存在阳性克隆。为了对其进行测试,申请人将Cre表达质粒引入正确靶向的条件型Cas9细胞中并且在多天后在培养物中发现了极低的毒性。正确靶向的条件型Cas9细胞中的Cas9的减少的拷贝数(1-2个拷贝/个细胞)足以允许稳定表达和相对地没有细胞毒性。此外,此数据指示,Cas9拷贝数决定毒性。电穿孔后,每个细胞都应该得到若干拷贝的Cas9并且这可能是为什么在组成型Cas9构建体的情况下没有发现阳性菌落。这提供了较强的证据,即利用条件型Cre依赖性策略应该显示出减少的毒性。申请人将正确靶向的细胞注射进囊胚中并植入雌性小鼠体内。鉴定并回交嵌合体。对首建者小鼠进行鉴定和基因分型。
[0419] 条件型Cas9小鼠的实用性:申请人已经在293细胞中显示,可以通过与Cre共表达而激活Cas9条件型表达构建体。申请人还显示,当表达Cre时,正确靶向的R1mESC可以具有活性Cas9。因为在Cas9之后为P2A肽切割序列并且然后为EGFP,申请人通过观察EGFP而鉴定成功表达。这个相同的观念在于,什么使条件型Cas9小鼠如此有用。申请人可以将其条件型Cas9小鼠与普遍表达Cre的小鼠(ACTB-Cre系)杂交并且可以得到在每个细胞中表达Cas9的小鼠。应当仅仅采用嵌合的RNA的递送,以便诱导在胚胎小鼠或成年小鼠中的基因组编辑。有趣的是,如果条件型Cas9小鼠与在组织特异的启动子下表达Cre的小鼠杂交,在也表达Cre的组织中将会仅有Cas9。通过将嵌合的RNA递送到相同的组织中,此途径可以用来仅仅在精确的组织中编辑基因组。
实例9:Cas9多样性和嵌合的RNA
[0420] CRISPR-Cas系统是一种由跨细菌和古生菌的相异物种利用的针对侵入型外源DNA的获得性免疫机制。II型CRISPR-Cas系统由一套编码负责将外源DNA“捕获”进CRISPR座位中的蛋白质的基因以及一套编码负责“执行”DNA切割机制的蛋白质的基因组成;这些包括DNA核酸酶(Cas9)、非编码反式激活cr-RNA(tracrRNA)以及侧翼为同向重复的外源DNA衍生的间隔子阵列(crRNA)。当被Cas9成熟后,tracrRNA和crRNA双链体指导Cas9核酸酶到由间隔子指导序列规定的靶DNA序列,并且在靶DNA中介导短序列基序附近的DNA中的双链断裂,该导短序列基序为切割所需并且对于每种CRISPR-Cas系统而言是特异的。II型CRISPR-Cas系统发现在整个细菌界中并且在用于靶标切割的Cas9蛋白序列和尺寸、tracrRNA和crRNA同向重复序列、这些元件的基因组组织以及基序要求方面高度相异。一个物种可以具有多种相异的CRISPR-Cas系统。
[0421] 申请人评价了来自基于与已知Cas9的序列同源性和与已知亚结构域直向同源的结构鉴定的细菌种类的207个假定的Cas9,这些亚结构域包括HNH内切核酸酶结构域和RuvC内切核酸酶结构域[信息来自尤金库宁(Eugene Koonin)和基拉马卡洛娃(Kira Makarova)]。基于此套的蛋白质序列保守的系统发生分析揭示了五个Cas9家族,包括三组大的Cas9(约1400个氨基酸)和两组小的Cas9(约1100个氨基酸)(参见图3和4A-F)。
[0422] 申请人还已经使用体外方法优化了Cas9指导RNA。实例10:Cas9突变
[0423] 在此实例中,申请人显示以下突变可以将SpCas9转化为切口酶:D10A、E762A、H840A、N854A、N863A、D986A。
[0424] 申请人提供了显示出序列突变点位于SpCas9基因内何处的序列(图6A-M)。申请人还显示,这些切口酶仍能够介导同源重组。此外,申请人显示,具有这些突变的SpCas9(单独地)不诱导双链断裂。
[0425] 所有Cas9直向同源物共享3-4个RuvC结构域和一个HNH结构域的通用结构。最5'的RuvC结构域切割非互补链,而HNH结构域切割互补链。所有符号都是就指导序列而言的。
[0426] 在5'RuvC结构域中的催化残基是通过感兴趣的Cas9与其他Cas9直向同源物(来自化脓链球菌II型CRISPR座位、嗜热链球菌CRISPR座位1、嗜热链球菌CRISPR座位3以及凶手弗朗西斯菌(Franciscilla novicida)II型
CRISPR座位)的同源性比较而鉴定的,并且保守性Asp残基被突变为丙氨酸以将Cas9转化成互补链切口酶。类似地,在HNH结构域中的保守性His和Asn残基被突变为丙氨酸以将Cas9转化为非互补链切口酶。
实例11:Cas9转录激活和Cas9阻遏物
[0427] Cas9转录激活
[0428] 已经设计了第二代构建体并且将其用于待测试的流水线中(表1)。将使用这些构建体通过RT-qPCR评估转录激活(VP64融合的构建体)和阻遏(仅有
Cas9)。申请人还将使用抗His抗体评估每个构建体的细胞定位,使用Surveyor核酸酶测定评估核酸酶活性,并且使用凝胶迁移测定评估DNA结合亲和性。
[0429] Cas阻遏物
[0430] 先前已经显示,可以将dCas9用作通用DNA结合结构域,以阻遏基因表达。申请人报告了改进的dCas9设计以及至阻遏物结构域KRAB和SID4x的dCas9融合。从表1中的建立用于使用Cas9来调制转录的质粒文库中,通过qPCR在功能上表征了以下阻遏物质粒:pXRP27、pXRP28、pXRP29、pXRP48、pXRP49、pXRP50、pXRP51、pXRP52、pXRP53、pXRP56、pXRP58、pXRP59、pXRP61以及pXRP62。
[0431] 将每个dCas9阻遏物质粒都与两个靶向β-连环蛋白基因的编码链的指导RNA共转染。转染后72小时,分离RNA并通过RT-qPCR定量基因表达。内源对照基因为GAPDH。将两个验证的shRNA用作阳性对照。阴性对照是某些未用gRNA转染的质粒,这些质粒被表示为“pXRP##对照”。当使用指定的靶向策略时,质粒pXRP28、pXRP29、pXRP48以及pXRP49可以阻遏β-连环蛋白基因。这些质粒对应于没有功能性结构域的dCas9(pXRP28和pXRP28)和融合到SID4x上的dCas9(pXRP48和pXRP49)。
[0432] 另外的工作研究:重复以上实验,靶向不同基因,利用其他gRNA确定最优靶向位置和多元阻遏。
[0433] 表1实例12:涉及胆固醇生物合成、脂肪酸生物合成以及其他代谢障碍的基因,编码涉及淀粉样蛋白以及其他疾病的错误折叠蛋白的基因,导致细胞转化的癌基因,潜伏病毒基因,以及导致负显性障碍(在其他障碍中)的基因的靶向缺失。
[0434] 申请人证明使用病毒或纳米粒子递送系统向对其有需要的受试者或患者的肝脏、脑、眼、上皮、造血或另一组织进行CRISPR-Cas系统的基因递送,该受试者或患者罹患代谢障碍、淀粉样变性和蛋白聚积相关疾病、由于基因突变和基因转位所致的细胞转化、基因突变的负显性作用、潜伏病毒感染以及其他相关症状。
[0435] 研究设计:患有代谢障碍、淀粉样变性和蛋白聚积相关疾病的对其有需要的受试者或患者,包括但不限于人类、非灵长类人类、犬、猫、牛、马、其他家养动物以及相关哺乳动物。CRISPR-Cas系统由嵌合的指导RNA指导并靶向有待切割的人类基因组座位的一个特定位点。切割和非同源末端连接介导的修复之后,移码突变导致基因的敲除。
[0436] 申请人选择靶向涉及上述障碍的基因的指导-RNA,使其以最小脱靶活性对内源座位特异。可以将两个或更多个指导RNA编码进单个CRISPR阵列中,以在DNA中诱导同时的双链断裂,从而导致受影响的基因或染色体区域的微小缺失。
[0437] 基因靶标的鉴定和设计
[0438] 对于每个候选疾病基因,申请人都选择了包括蛋白质编码外显子的感兴趣DNA序列、包括并侧翼于已知的负显性突变位点的序列、包括并侧翼于病理重复序列的序列。对于基因敲除途径,离起始密码子最近的早期编码外显子为实现完全敲除提供了最佳选择并使截短的蛋白质产物保留部分功能的可能性最小化。
[0439] 申请人分析了紧邻NGG基序(对于SpCas9系统)或NNAGAAW(对于St1Cas9系统)的5’的所有可能的可靶向的20-bp序列的感兴趣的序列。申请人选择了用于在基因组中识别独特的单个RNA-指导的Cas9的序列,以使基于计算算法的脱靶效应最小化,以确定特异性。
[0440] 将指导序列克隆进递送系统中
[0441] 将指导序列合成为双链的20-24bp寡核苷酸。对寡核苷酸进行5’-磷酸化处理和退火以形成双链体后,取决于递送方法,将寡核苷酸连接进适合的载体中:
[0442] 基于病毒的递送方法
[0443] 已经在别处描述了基于AAV的载体(PX260、330、334、335)
[0444] 基于慢病毒的载体使用类似的克隆策略,即将指导序列直接连接进单个载体中,该载体携带一个U6启动子驱动的嵌合的RNA支架和一种EF1a启动子驱动的Cas9或Cas9切口酶。
[0445] 在别处描述了病毒产生。
[0446] 基于纳米粒子的RNA递送方法
[0447] 1.将指导序列合成为编码T7启动子—指导序列—嵌合的RNA的寡核苷酸双链。通过PCR方法将一个T7启动子添加到Cas9的5’上。
[0448] 2.将T7驱动的Cas9和指导-嵌合的RNA在体外转录,并且使用商业试剂盒为Cas9mRNA进一步加帽和A-添尾(A-tailed)。根据试剂盒说明书纯化RNA产物。
[0449] 流体动力尾静脉递送方法(用于小鼠)
[0450] 如在上文和在本申请别处所描述的,将指导序列克隆进AAV质粒中。
[0451] 细胞系的体外验证
[0452] 转染
[0453] 1.DNA质粒转染
[0454] 使用基于脂质、化学或电穿孔的方法将携带指导序列的质粒转染进人类胚肾(HEK293T)或人类胚胎干(hES)细胞、其他相关细胞类型中。对于HEK293T细胞(~260,000个细胞)的24孔转染,使用Lipofectamine2000将总共500ng的DNA转染进每个单孔中。对于hES细胞的12孔转染,使用Fugene HD将总共1ug的DNA转染进单孔中。
[0455] 2.RNA转染
[0456] 将如上所述的纯化RNA用于转染进HEK293T细胞中。根据制造商的说明,可以使用Lipofectamine 2000将1-2ug的RNA转染进~260,000个细胞中。Cas9和嵌合RNA的RNA递送显示于图10中。
[0457] 体外indel形成的测定
[0458] 转染后72小时收获细胞并且测定作为双链断裂的指征的indel形成。
[0459] 简言之,使用高保真聚合酶PCR扩增靶序列周围的基因组区域(~400-600bp扩增子尺寸)。将产物纯化,归一化至相等浓度,并从95℃缓慢退火至4℃,以允许形成DNA异源双链体。退火后,使用Cel-I酶切割异源双链体,并且将生成的产物在聚丙烯酰胺凝胶上分离并计算indel效率。
[0460] 动物的体内原理论证
[0461] 递送机制
[0462] 在别处描述了AAV或慢病毒产生。
[0463] 纳米粒子配制品:将RNA混合进纳米粒子配制品中
[0464] 使用商业试剂盒在小鼠中执行DNA质粒的流体动力尾静脉注射。
[0465] 将Cas9和指导序列作为病毒、纳米粒子-包衣的RNA混合物或DNA质粒而递送,并注射进受试动物体内。一个平行组的对照动物注射无菌盐水、Cas9和GFP或指导序列以及单独的GFP。
[0466] 注射后三周,测试动物的症状的改善并将其处死。针对indel形分析相关器官系统。表型测定包括HDL、LDL、脂质的血液水平。
[0467] indel形成的测定
[0468] 使用商业试剂盒从组织中提取DNA;将如针对体外证明所描述的进行indel测定。
[0469] CRISPR-Cas系统的治疗应用可适合于实现候选疾病基因的组织特异的且暂时受控的靶向缺失。实例包括涉及胆固醇和脂肪酸代谢、淀粉样蛋白疾病、负显性疾病、潜伏病毒感染(在其他障碍中)的基因。
[0470] 用于在座位位处引入靶向的indel的单个指导-RNA的实例
[0471] 用于在基因座位位处引入染色体微小缺失的指导-RNA对的实例实例13:携带引起疾病的突变的基因的修复的靶向整合;酶缺陷以及其他相关疾病的重构。
[0472] 研究设计I.基因靶标的鉴定和设计
·描述于实例16中
II.将指导序列和修复模板克隆进递送系统中
·以上描述于实例16中
·申请人将DNA修复模板克隆为包括具有疾病等位基因的同源臂以及野生型修复模板
III.细胞系的体外验证
a.以上转染描述于实例16中;将Cas9、指导RNA和修复模板共转染进相关细胞类型中。
b.体外修复的测定
i.申请人在转染后72小时收获细胞并测定修复
ii.简言之,申请人使用高保真聚合酶PCR扩增了修复模板周围的基因组区域。针对突变体等位基因的减少的发生率,申请人对产物进行了测序。
IV.动物的体内原理论证
a.以上递送机制描述于实例16和29中。
b.体内修复的测定
i.如描述于体外证明中的,申请人进行了修复测定。
V.治疗应用
CRISPR-Cas系统可适合于实现候选疾病基因的组织特异的且暂时受控的靶向缺失。实例包括涉及胆固醇和脂肪酸代谢、淀粉样蛋白疾病、负显性疾病、潜伏病毒感染(在其他障碍中)的基因。
[0473] 修复模板的一个单个错义突变的实例:实例14:CRISPR-Cas系统在青光眼、淀粉样变性和亨廷顿病中的治疗应用
[0474] 青光眼:申请人设计了靶向mycilin(MYOC)基因的第一个外显子的指导RNA。申请人使用腺病毒载体(Ad5)包装Cas9以及靶向MYOC基因的指导RNA两者。申请人将腺病毒载体注射进小梁网中,其中的细胞已经牵涉于青光眼的病理生理学中。申请人最初在携带突变的MYOC基因的小鼠模型中对其进行了测试,以察看它们是否改善视敏度并降低眼压。人类中的治疗应用利用类似的策略。
[0475] 淀粉样变性:申请人设计了靶向肝脏中的运甲状腺素蛋白(TTR)基因的第一个外显子的指导RNA。申请人使用AAV8包装Cas9以及靶向TTR基因的第一个外显子的指导RNA。AAV8已经显示具有有效的肝脏靶向并且将被静脉内给予。可以使用肝脏特异的启动子(如白蛋白启动子)或使用组成型启动子驱动Cas9。pol3启动子驱动指导RNA。
[0476] 可替代地,申请人利用质粒DNA的流体动力递送来敲除TTR基因。申请人递送了一个编码Cas9的质粒和靶向TTR的外显子1的指导RNA。
[0477] 作为一种另外的替代途径,申请人给予了RNA的组合(Cas9的mRNA和指导RNA)。可以使用脂质体(如来自生命技术公司的Invivofectamine)包装RNA并静脉内递送。为了减少RNA诱导的免疫原性、增加Cas9表达的水平和指导RNA稳定性,申请人使用5’加帽修饰了Cas9mRNA。申请人还将修饰的RNA核苷酸掺入了Cas9mRNA和指导RNA中,以增加其稳定性并减少免疫原性(例如TLR的激活)。为了增加效率,申请人给予了多剂量的病毒、DNA或RNA。
[0478] 亨廷顿病:申请人基于患者的HTT基因中的等位基因特异的突变设计了指导RNA。例如,在对HTT而言杂合的、具有扩增的CAG重复的患者体内,申请人鉴定了对于突变HTT等位基因而言独特的核苷酸序列并将其用于设计指导RNA。申请人保证突变甲基位于指导RNA的最后9bp内(诸位申请人已经确定具有区别靶标尺寸与指导RNA之间的单个DNA碱基错配的能力)。
[0479] 申请人将突变HTT等位基因特异的指导RNA和Cas9包装进AAV9中并递送进亨廷顿病患者的纹状体中。经由开颅术将病毒立体定向地注射进纹状体中。已知AAV9有效地转导神经元。申请人使用神经元特异的启动子(如人类突触蛋白I)驱动Cas9。实例15:CRISPR-Cas系统在HIV中的治疗应用
[0480] 慢性病毒感染是显著的发病率和死亡率的来源。虽然针对这些病毒中的许多病毒存在有效靶向病毒复制的不同方面的常规的抗病毒疗法,但是由于“病毒潜伏期”当前治疗形式在本质上通常是非治愈性的。就其本质而言,病毒潜伏期由病毒生命周期中的未进行活性病毒产生的休眠期表征。在此阶段过程中,病毒在很大程度上能够逃避免疫监视和常规治疗两者,从而允许它在宿主体内建立长期存在的病毒储库,从这些病毒储库随后重新激活可以允许病毒继续繁殖和传播。病毒潜伏期的关键在于通过游离型或前病毒潜伏而完成的稳定地维持病毒基因组,该游离型或前病毒潜伏分别将病毒基因组存储在细胞质中或将它整合在宿主基因组中。在不存在预防初次感染的有效疫苗接种的情况下,由潜伏贮存器表征的慢性病毒感染和溶解活性的发作可以具有显著的后果:人乳头瘤病毒(HPV)可以导致宫颈癌,丙型肝炎病毒(HCV)容易诱发肝细胞癌,并且人类免疫缺陷病毒最终摧毁宿主免疫系统,从而使得对机会性感染易感。因此,这些感染需要终生使用当前可获得的抗病毒治疗。更复杂的事情是这些病毒基因组中的许多的较高的可突变性,这导致了对其而言不存在有效疗法的抗性菌株的进化。
[0481] CRISPR-Cas系统是一种能够以可以多元的、序列特异的方式诱导双链DNA断裂(DSB)的细菌获得性免疫系统并且最近已经在哺乳动物细胞系统内重构。已经显示,用一个或众多指导-RNA靶向DNA可以分别导致间插序列的indel和缺失两者。因此,这一新的技术代表了一种手段,通过该手段可以在单个细胞中以较高效率和特异性完成靶向和多元DNA诱变。结果,递送直接针对病毒DNA序列的CRISPR-Cas系统甚至在不存在正在进行的病毒产生的情况下仍可以允许靶向破坏和缺失潜伏的病毒基因组。
[0482] 作为一个实例,被HIV-1慢性感染代表了一个全球性健康问题,其中影响的个人为3300万并且年发生率为260万次感染。使用同时靶向病毒复制的多个方面的高效抗逆转录病毒疗法(HAART)已经允许在很大程度上将HIV感染作为一种慢性而非晚期病疾进行管理。
不进行治疗的话,HIV进展为AIDS通常在9-10年内发生,从而导致耗竭宿主免疫系统并且机会性感染的出现通常将在之后不久导致死亡。继发于病毒潜伏期,HAART的中断总是导致病毒反跳。此外,针对通过可获得的手段无法控制的HIV抗性菌株,甚至可以在疗法方面选择暂时中断。另外,HAART治疗的费用是显著的:在美国每年每人$10,000-15,0000。因此,直接靶向HIV基因组而非病毒复制过程的治疗途径代表了一种手段,通过该手段潜伏的贮存器的根除可以允许治愈性治疗选择。
[0483] HIV-1靶向的CRISPR-Cas系统的研发和递送代表了一种可与现存的靶向DNA诱变的手段可区分的独特途径,即具有众多治疗意义的ZFN和TALEN。CRISPR介导的DSB对HIV-1基因组的靶向破坏和缺失以及与HAART结合的indel可以允许同时预防活性病毒产生以及宿主体内的潜伏的病毒储库的耗竭。
[0484] 一旦整合进宿主免疫系统内,CRISPR-Cas系统允许产生HIV-1抗性亚群体,该亚群体即使在不存在彻底的病毒根除的情况下仍可以允许维持和重构宿主免疫活性。这可以通过破坏病毒基因组而潜在地预防初次感染,从而预防病毒产生和整合,代表了一种“疫苗接种”手段。CRISPR-Cas系统的多元性质允许同时靶向单独细胞内的基因组的多个方面。
[0485] 如在HAART中,通过需要同时获取多个获得性突变而使病毒通过诱变而进行的逃避最小化。可以同时靶向HIV-1的多种菌株,这使重复感染的机会最小化并防止随后产生新的重组菌株。核苷酸而非蛋白质介导的CRISPR-Cas系统的序列特异性允许快速产生治疗而无需显著改变递送机制。
[0486] 为了将其完成,申请人产生了靶向绝大多数HIV-1基因组的CRISPR-Cas指导RNA,同时考虑了HIV-1株变体,以使覆盖面和效力最大。HIV-1亚型和变体之间的基因组保守的序列分析应该允许靶向基因组的侧翼保守区,目的是缺失间插病毒序列或诱导将破坏病毒基因功能的移码突变。
[0487] 通过宿主免疫系统的常规腺病毒或慢病毒介导的感染,申请人完成了CRISPR-Cas系统的递送。取决于途径,宿主免疫细胞可以是a)分离的、用CRISPR-Cas转导的、选择的、并且重新引入该宿主中的或b)通过全身递送CRISPR-Cas系统体内转导的。第一种途径允许产生抗性免疫群体,而第二种更可能靶向宿主体内的潜伏病毒储库。实例16:囊性纤维化中的δF508或其他突变的靶向校正
[0488] 本发明的一个方面提供了一种药物组合物,该药物组合物可以包括一种CRISPR-Cas基因疗法粒子和一种生物相容的药物载体。根据另一个方面,一种用于治疗在CFTR基因中具有突变的受试者的基因疗法方法包括向受试者的细胞给予治疗有效量的CRISPR-Cas基因疗法粒子。
[0489] 此实例展示了使用腺相关病毒(AAV)粒子的CRISPR-Cas系统在对其有需要的受试者或患者的气道中的基因转移或基因递送,所述受试者或患者患有囊性纤维化或囊性纤维化相关症状。
[0490] 研究设计:对其有需要的受试者或患者:相关的人类、非灵长类人类、犬、猫、牛、马以及其他家养动物。此研究测试了通过AAV载体对CRISPR-Cas系统进行基因转移的效力。申请人确定了足以进行基因表达的转基因水平并利用了一种包括靶向δF508或其他CFTR诱导的突变的Cas9酶的CRISPR-Cas系统。
[0491] 这些经治疗的受试者的每一侧肺接受支气管内递送的药学上有效量的雾化AAV载体系统,同时自然地呼吸。对照受试者接受等量的具有内部对照基因的假型AAV载体系统。该载体系统可以与一种药学上可接受的生物或相容的药物载体一起递送。给予载体三周或适当的时间间期后,测试经治疗的受试者的囊性纤维化相关症状的改善。
[0492] 申请人使用了一种腺病毒或一种AAV粒子。
[0493] 申请人将以下各自可操作地连接到一种或多种调节序列(对于Cas9而言是Cbh或EF1a启动子,对于嵌合的指导RNA是U6或H1启动子)上的基因构建体克隆进一种或多种腺病毒或AAV载体或任何其他相容的载体中:靶向嵌合的指导RNA的CFTRδ508(图13B),δF508突变的修复模板(图13C)以及具有任选地一个或多个核定位信号或序列(NLS)(例如,两个(2)NLS)的密码子优化的Cas9酶。
[0494] Cas9靶位点的鉴定
[0495] 申请人分析了人类CFTR基因组座位并鉴定了Cas9靶位点(图13A)。(PAM可以包含一个NGG或一个NNAGAAW基序)。
[0496] 基因修复策略
[0497] 申请人经由先前讨论的递送方法之一将包括Cas9(或Cas9切口酶)和指导RNA的腺病毒/AAV载体系统连同包括包含F508残基的同源性修复模板的腺病毒/AAV载体系统一起引入受试者体内。CRISPR-Cas系统由CFTRδ508嵌合的指导RNA指导并靶向有待切口或切割的CFTR基因组座位的一个特定位点。在切割之后,将修复模板经由同源重组插入切割位点中,从而校正导致囊性纤维化或引起囊性纤维化相关症状的缺失。可以采用用来指导递送并提供CRISPR系统的系统性引入的此策略来靶向基因突变,以编辑或另外地操纵如那些在表B中的引起代谢、肝脏、肾和蛋白质疾病和障碍的基因。实例17:基因敲除细胞文库的产生
[0498] 此实例展示了如何产生其中的每个细胞都具有单基因被敲除的细胞文库:
[0499] 申请人制备了ES细胞的文库,其中每个细胞都具有单基因被敲除,并且ES细胞的整个文库将有每个单基因的敲除。此文库对于筛选细胞过程以及疾病的基因功能是有用的。
[0500] 为了制备此细胞文库,申请人将由诱导型启动子(例如,多西环素诱导型启动子)驱动的Cas9整合到ES细胞中。另外,申请人将靶向特异的基因的单个指导RNA整合到ES细胞中。为了制备ES细胞文库,申请人简单地将ES细胞与编码靶向人类基因组中的每个基因的指导RNA的基因的文库混合。申请人首先将单个BxB1attB位点引入人类ES细胞的AAVS1座位中。然后,申请人使用BxB1整合酶来促进各个的指导RNA基因整合到AAVS1座位中的BxB1attB位点中。为了促进整合,每个指导RNA基因都被包含在携带单个attP位点的质粒上。这样,BxB1将使基因组中的attB位点与含有指导RNA的质粒上的attP位点重组。
[0501] 为了产生该细胞文库,申请人采用具有整合的单个指导RNA的细胞的文库,并且诱导Cas9表达。在诱导之后,Cas9介导由该指导RNA指定的位点处的双链断裂。为了验证此细胞文库的多样性,申请人进行了全外显子组测序,以保证申请人能够在每个单靶向基因中观察到突变。此细胞文库可以用于多种应用(包括基于全文库的筛选),或可以被分选进各个细胞克隆中以促进快速产生具有各个人类基因被敲除的克隆细胞系。实例18:使用Cas9工程化微藻
[0502] 递送Cas9的方法
[0503] 方法1:申请人使用在组成型启动子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制之下表达Cas9的载体递送Cas9和指导RNA。
[0504] 方法2:申请人使用在组成型启动子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制之下表达Cas9和T7聚合酶的载体递送Cas9和T7聚合酶。将使用包含驱动指导RNA的T7启动子的载体递送该指导RNA。
[0505] 方法3:申请人将Cas9mRNA和体外转录的指导RNA递送到藻类细胞中。RNA可以在体外转录。Cas9mRNA将由Cas9的编码区以及来自的Cop1的3’UTR组成,以保证Cas9mRNA的稳定。
[0506] 用于同源重组,申请人提供了一个另外的同源定向修复模板。
[0507] 在β-2微管蛋白启动子的控制之下驱动Cas9的表达的盒的序列(之后为Cop1的3’UTR)。TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT
[0508] 在β-2微管蛋白启动子的控制之下驱动T7聚合酶的表达的盒的序列(之后为Cop1的3’UTR):TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACatgcctaagaagaagaggaaggttaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaaggacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggtcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggactgcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgacaaggttccgttccctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctacaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatctgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtacgattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaaGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT[0509] 由T7启动子驱动的指导RNA的序列(T7启动子,N表示靶向序列):
gaaatTAATACGACTCACTATANNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt
[0510] 基因递送:
[0511] 来自衣藻资源中心(Chlamydomonas Resource Center)的莱茵衣藻株CC-124和CC-125将被用于电穿孔。电穿孔方案遵循来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方案。
[0512] 而且,申请人产生组成性地表达Cas9的莱茵衣藻系。这可以通过使用pChlamy1(使用PvuI线性化)并选择潮霉素抗性菌落而完成。以下是包含Cas9的pChlamy1的序列。以此方式实现基因敲除,简单地需要递送指导RNA的RNA。对于同源重组,申请人递送了指导RNA以及线性化同源重组模板。
[0513] pChlamy 1-Cas9:TGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGTTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGTCGCTGAGGCTTGACATGATTGGTGCGTATGTTTGTATGAAGCTACAGGACTGATTTGGCGGGCTATGAGGGCGGGGGAAGCTCTGGAAGGGCCGCGATGGGGCGCGCGGCGTCCAGAAGGCGCCATACGGCCCGCTGGCGGCACCCATCCGGTATAAAAGCCCGCGACCCCGAACGGTGACCTCCACTTTCAGCGACAAACGAGCACTTATACATACGCGACTATTCTGCCGCTATACATAACCACTCAGCTAGCTTAAGATCCCATCAAGCTTGCATGCCGGGCGCGCCAGAAGGAGCGCAGCCAAACCAGGATGATGTTTGATGGGGTATTTGAGCACTTGCAACCCTTATCCGGAAGCCCCCTGGCCCACAAAGGCTAGGCGCCAATGCAAGCAGTTCGCATGCAGCCCCTGGAGCGGTGCCCTCCTGATAAACCGGCCAGGGGGCCTATGTTCTTTACTTTTTTACAAGAGAAGTCACTCAACATCTTAAAATGGCCAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGGAGATTCGAGGTACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAACATATGATTCGAATGTCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGACACAAGAATCCCTGTTACTTCTCGACCGTATTGATTCGGATGATTCCTACGCGAGCCTGCGGAACGACCAGGAATTCTGGGAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGCCGCTGGCCCGCCGAGCCCTGGAGGAGCTCGGGCTGCCGGTGCCGCCGGTGCTGCGGGTGCCCGGCGAGAGCACCAACCCCGTACTGGTCGGCGAGCCCGGCCCGGTGATCAAGCTGTTCGGCGAGCACTGGTGCGGTCCGGAGAGCCTCGCGTCGGAGTCGGAGGCGTACGCGGTCCTGGCGGACGCCCCGGTGCCGGTGCCCCGCCTCCTCGGCCGCGGCGAGCTGCGGCCCGGCACCGGAGCCTGGCCGTGGCCCTACCTGGTGATGAGCCGGATGACCGGCACCACCTGGCGGTCCGCGATGGACGGCACGACCGACCGGAACGCGCTGCTCGCCCTGGCCCGCGAACTCGGCCGGGTGCTCGGCCGGCTGCACAGGGTGCCGCTGACCGGGAACACCGTGCTCACCCCCCATTCCGAGGTCTTCCCGGAACTGCTGCGGGAACGCCGCGCGGCGACCGTCGAGGACCACCGCGGGTGGGGCTACCTCTCGCCCCGGCTGCTGGACCGCCTGGAGGACTGGCTGCCGGACGTGGACACGCTGCTGGCCGGCCGCGAACCCCGGTTCGTCCACGGCGACCTGCACGGGACCAACATCTTCGTGGACCTGGCCGCGACCGAGGTCACCGGGATCGTCGACTTCACCGACGTCTATGCGGGAGACTCCCGCTACAGCCTGGTGCAACTGCATCTCAACGCCTTCCGGGGCGACCGCGAGATCCTGGCCGCGCTGCTCGACGGGGCGCAGTGGAAGCGGACCGAGGACTTCGCCCGCGAACTGCTCGCCTTCACCTTCCTGCACGACTTCGAGGTGTTCGAGGAGACCCCGCTGGATCTCTCCGGCTTCACCGATCCGGAGGAACTGGCGCAGTTCCTCTGGGGGCCGCCGGACACCGCCCCCGGCGCCTGATAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT
[0514] 对于所有修饰的莱茵衣藻细胞而言,申请人使用了PCR、SURVEYOR核酸酶测定和DNA测序,以验证成功的修饰。实例19:Cas9靶向多种疾病类型的用途
[0515] 涉及蛋白质编码序列中的突变的疾病:
[0516] 可以通过靶向负显性等位基因而靶向显性障碍。申请人使用Cas9靶向负显性等位基因中的独特序列并经由NHEJ引入突变。NHEJ诱导的indel可能能够在负显性等位基因中引入移码突变并消除负显性蛋白。如果该基因是充分单的(haplo-sufficient),这可以起作用(例如MYOC突变诱导的青光眼和亨廷顿病)。
[0517] 可以通过修复两个等位基因中的疾病突变而靶向隐性障碍。对于分裂细胞,申请人使用Cas9在突变位点附近引入双链断裂并使用外源重组模板增加同源重组率。对于分裂细胞,这可以经由携带互补突出端的外源DNA片段的NHEJ介导的连接使用催化两个等位基因中的突变序列的替换的多元切口酶活性而实现。
[0518] 申请人还使用Cas9引入保护性突变(例如,用于预防HIV感染的CCR5的失活、用于减少胆固醇或将A673T引入APP中以减少阿尔茨海默病的可能性的PCSK9的失活)。
[0519] 涉及非编码序列的疾病
[0520] 申请人使用Cas9破坏启动子区域中的非编码序列,以改变转录因子结合位点并改变增强子或阻遏物元件。例如,可以使用Cas9切除造血干细胞中的Klf1增强子EHS1,以减少BCL11a水平并重新激活分化的红细胞中的胎珠蛋白基因表达
[0521] 申请人还使用Cas9破坏5’或3’非翻译区中的功能性基序。例如,用于强直性肌营养不良的治疗,可以使用Cas9除去DMPK基因中的CTG重复扩展。实例20:多元切口酶
[0522] 也可以使用在本申请中详细说明的Cas9的优化和教导的方面产生Cas9切口酶。申请人使用与指导RNA对组合的Cas9切口酶,以产生具有限定的突出端的DNA双链断裂。当使用两对指导RNA时,可能的是切除间插DNA片段。如果外源DNA段被这两对指导RNA切割以产生可与基因组DNA相容的突出端,则可以将该外源DNA片段连接进该基因组DNA中,以替换被切除的片段。例如,可以将其用于除去亨廷顿蛋白(huntintin)(HTT)基因中的三核苷酸重复扩展,以治疗亨廷顿病。
[0523] 通过提供了带有较少数目的CAG重复的外源DNA,则可能能够产生带有相同突出端的DNA片段并可以被连接进HTT基因组座位中并替换被切除的片段。
[0524] 将外源DNA片段连接进基因组中无需同源重组机器并且因此可以在有丝分裂后细胞(如神经元)中使用此方法。实例21:CRISPR系统的递送
[0525] 可以将Cas9及其嵌合的指导RNA或tracrRNA和crRNA的组合作为DNA或RNA而递送。递送均作为RNA(正常的或包含碱基或骨架修饰)分子的Cas9和指导RNA可以用来减少Cas9蛋白在细胞中坚持的时间量。这可以减少靶细胞中的脱靶切割活性的水平。由于递送作为mRNA的Cas9花费时间翻译成蛋白质,所以可能有利的是在递送Cas9mRNA后若干小时递送指导RNA,以使可供与Cas9蛋白相互作用的指导RNA的水平最大化。
[0526] 在指导RNA量有限的情况下,可以令人希望的是引入作为mRNA的Cas9和呈DNA表达盒形式的指导RNA,用驱动指导RNA的表达的启动子。以此方式,可获得的指导RNA的量将经由转录而放大。
[0527] 可以引入多种递送系统,以向宿主细胞中引入Cas9(DNA或RNA)和指导RNA(DNA或RNA)。这些递送系统包括使用脂质体、病毒载体、电穿孔、纳米粒子、纳米线(沙莱克(Shalek)等人,《纳米快报》(Nano Letters),2012)、外来体。可以使用分子特洛伊木马脂质体(巴德里智(Pardridge)等人,《冷泉港草案》(Cold Spring Harb Protoc);2010;doi:10.1101/pdb.prot5407)地递送Cas9和指导RNA跨过血脑屏障。
实例22:Cas9直向同源物
[0528] 申请人分析了Cas9直向同源物(图3和4A-F),以鉴定相关的PAM序列和对应的嵌合指导RNA。这一套展开的PAM可以提供跨基因组的更广泛的靶向并且还显著增加独特靶位点的数目并且提供在基因组中鉴定具有增加水平的特异性的新颖Cas9的潜力。申请人将金黄色葡萄球菌金黄色种Cas9的PAM确定为NNGRR。金黄色葡萄球菌金黄色种Cas9又称SaCas9。
[0529] 可以通过测试每种Cas9容忍指导RNA及其DNA靶标之间的错配的能力评价Cas9直向同源物的特异性。例如,已经通过测试指导RNA中的突变对切割效率的影响表征了SpCas9的特异性。用指导序列与靶DNA之间的单个或多个错配建立指导RNA文库。基于这些发现,可以基于以下准则选择SpCas9的靶位点:
[0530] 为了最大化SpCas9编辑具体基因的特异性,应该在感兴趣的座位内选择一个靶位点,这样使得潜在的‘脱靶’基因组序列遵守以下四个约束:首先,它们的后面不应该是具有的5’-NGG或NAG序列的PAM。其次,它们与靶序列的整体序列相似性应该是最小化的。第三,最大数目的错配应该位于脱靶位点的PAM-近侧区内。最后,最大数目的错配应该是连续的或由少于四个碱基隔开。
[0531] 可以使用类似的方法评价其他Cas9直向同源物的特异性和建立在靶标种类的基因组内选择特定靶位点的标准。实例23:三核苷酸重复障碍的治疗策略
[0532] 如先前在应用中所提及的,CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸并且这些疾病相关基因中的一些可以属于一套称为三核苷酸重复障碍的遗传障碍(还称为三核苷酸重复扩展障碍、三联体重复扩展障碍或密码子反复障碍)。
[0533] 这些疾病由以下突变引起,在这些突变中,某些基因的三核苷酸重复超过了通常在基因中可以变化的正常的稳定的阈值。更多的重复扩展障碍的发现已经允许基于基础的相似特征将这些障碍分类为多个类别。由特定基因的蛋白质编码部分中的CAG重复扩展引起的亨廷顿病(HD)和脊髓小脑共济失调被包括在类别I中。具有倾向于使得它们表型相异的扩展并包括在量值上通常较小并且还发现于基因的外显子中的扩展的疾病或障碍被包括在类别II中。类别III包括由比类别I或II大得多的并且通常位于蛋白质编码区外的重复扩展表征的障碍或疾病。类别III疾病或障碍的实例包括但不限于脆性X综合征、强直性肌营养不良、两种脊髓小脑共济失调、青少年肌阵挛性癫痫以及弗里德赖希共济失调。
[0534] 还可以采用类似的治疗策略(像下文针对弗里德赖希共济失调提及的策略)解决其他三核苷酸重复或扩展障碍。例如,可以使用几乎相同的策略治疗的另一种三联体重复疾病是强直性肌营养不良1(DM1),其中在3'UTR中存在扩展的CTG基序。在弗里德赖希共济失调中,该疾病由线粒体型共济失调蛋白(FXN)的第一个内含子中的GAA三核苷酸的扩展引起。一种使用CRISPR的治疗策略是从第一个内含子上切除GAA重复。认为扩展的GAA重复影响DNA结构并且导致募集关闭线粒体型共济失调蛋白(frataxin)基因的异染色质的形成(图14A)。
[0535] 下文列出了优于其他治疗策略的竞争优势:
[0536] siRNA敲低在此情况下是不适用的,因为疾病归因于线粒体型共济失调蛋白的减少的表达。病毒基因疗法当前处于探索之中。使用HSV-1基的载体在动物模型中递送线粒体型共济失调蛋白基因并且已经显示出治疗效果。然而,基于病毒的线粒体型共济失调蛋白递送的长期效力受若干问题的困扰:首先,难于将线粒体型共济失调蛋白的表达调节为与健康个体中的天然水平相匹配,并且其次,线粒体型共济失调蛋白长期过量表达导致细胞死亡。
[0537] 可以使用核酸酶切除GAA重复,以恢复健康基因型,但是锌指核酸酶和TALEN策略需要递送两对高效核酸酶,这对于递送以及核酸酶工程化两者而言都是困难的(通过ZFN或TALEN有效切除基因组DNA难于实现)。
[0538] 与以上策略相比之下,CRISPR-Cas系统具有清晰的优势。Cas9酶更有效并且更具多元性,这意味着可以同时设置一个或多个靶标。到目前为止,在人类细胞中Cas9对基因组DNA的有效切除>30%并且可以高达30%,并且在未来可以得到改进。此外,相对于某些三核苷酸重复障碍(像亨廷顿病(HD)),如果在两个等位基因之间存在差异,则可以解决编码区中的三核苷酸重复。确切地,如果HD患者对于突变的HTT而言是杂合的并且在野生型与突变的HTT等位基因之间存在核苷酸差异(如SNP),则可以使用Cas9特异性靶向突变的HTT等位基因。ZFN或TALEN将不具有基于单碱基差异而区分两个等位基因的能力。
[0539] 在采用使用CRISPR-Cas 9酶解决弗里德赖希共济失调的策略中,申请人设计了若干侧翼于GAA扩展的指导RNA靶向位点并且选择了最有效且特异的位点(图14B)。
[0540] 申请人递送了靶向FXN的内含子1的指导RNA连同Cas9的组合,以介导GAA扩展区域的切除。可以使用AAV9介导将Cas9有效递送进脊髓中。
[0541] 如果将邻近GAA扩展的Alu元件认为是重要的,则对可以被靶向的位点的数目可以存在约束,但是申请人可以采用避免将其破坏的策略。
[0542] 替代性策略:
[0543] 并非使用Cas9修饰基因组,申请人还可以使用基于Cas9(核酸酶活性缺陷的)的DNA结合结构域直接激活FXN基因,以将转录激活结构域靶向FXN基因。申请人可能不得不解决Cas9介导的人工转录激活的稳健性,以保证当与其他方法相比时它足够稳健(特朗布莱(Tremblay)等人,转录激活因子样效应蛋白诱导线粒体型共济失调蛋白的表达(Transcription Activator-Like Effector Proteins Induce the Expression of the Frataxin Gene);《人类基因疗法》(Human Gene Therapy).2012年8月,23(8):883-890)。
实例24:用于使用Cas9切口酶使脱靶切割最小化的策略
[0544] 如先前在本申请中所提及的,可以经由一个或多个以下突变将Cas9突变,以介导单链切割:D10A、E762A和H840A。
[0545] 为了经由NHEJ介导基因基因敲除,申请人使用了Cas9的切口酶版本连同两个指导RNA。由每个单独的指导RNA产生的脱靶切口可以无需突变而首先被修复,仅当靶位点彼此相邻时才发生双链断裂(这可以经由NHEJ而导致突变)。由于通过双切口引入的双链断裂不是钝的,末端加工酶(如TREX1)的共表达将增加NHEJ活性的水平。
[0546] 处于表格形式的以下靶标列表是针对涉及以下疾病的基因:
[0547] 拉福拉病-靶标GSY1或PPP1R3C(PTG)以减少神经元中的糖原。
[0548] 高胆固醇血症-靶标PCSK9
[0549] 在间隔子(0至3bp)中具有不同数目的核苷酸的靶序列成对列出(L和R)。每个间隔子都还可以独自地与野生型Cas9一起使用,以在靶座位处引入双链断裂。
[0550] 用于改善指导RNA的稳定性并增加特异性的替代性策略
[0551] 1.可以经由硫酯键而非磷酸酯键(像在天然RNA中)连接指导RNA的5’中的核苷酸。硫酯键可以防止指导RNA被内源RNA降解机械熟化。
[0552] 2.指导RNA的指导序列(5’20bp)中的核苷酸可以使用桥接的核酸(BNA)作为碱基,以改进结合特异性。实例25:用于快速、多元基因组编辑的CRISPR-Cas
[0553] 本发明的方面涉及以下方案和方法,通过这些方案和方法,可以在靶标设计后3-4天内测试基因修饰的效率和特异性,并且可以在2-3周内得到修饰的克隆细胞系。
[0554] 可编程的核酸酶是用于以高精度介导基因组改变的强大技术。可以使用来自微生物CRISPR获得性免疫系统的RNA-指导的Cas9核酸酶通过简单地在其指导RNA中指定一个20-nt靶向序列而在真核细胞中促进有效的基因组编辑。申请人描述了一套用于应用Cas9以在哺乳动物细胞中促进有效的基因组编辑并产生用于下游功能研究的细胞系的方案。以靶标设计开始,可以在3-4天内实现有效且特异的基因修饰,并且可以在2-3内得到修饰的克隆细胞系。
[0555] 工程化生物系统和生物的能力跨基础科学、医药和生物技术拥有巨大的应用潜力。促进内源基因组座位的精确编辑的可编程的序列特异的内切核酸酶现在允许在广泛的物种中系统地询问遗传元件和致病性遗传变异,包括先前用基因方法不易处理的那些。近年来已经出现了多种基因组编辑技术,包括锌指核酸酶(ZFN)、转录激活因子样效应核酸酶(TALEN)和RNA-指导的CRISPR-Cas核酸酶系统。前两种技术使用将内切核酸酶催化结构域束缚为模块化DNA-结合蛋白用于在特定基因组座位处诱导靶向的DNA双链断裂(DSB)的共同策略。相比之下,Cas9是一种通过与靶DNA进行沃森-克里克碱基配对而由小RNA指导的核酸酶,呈现了一种易于设计、有效且很好地适于多种细胞类型和生物的高通量和多元基因编辑的系统。在此,申请人描述了一套用于应用最近研发的Cas9核酸酶在哺乳动物细胞中促进有效的基因组编辑并产生用于下游功能研究的细胞系的方案。
[0556] 像ZFN和TALEN一样,Cas9通过刺激靶基因组座位处的DSB而促进基因组编辑。当被Cas9切割后,靶座位经历两种主要途径之一进行DNA损伤修复,即易错非同源末端连接(NHEJ)或高保真同源定向修复(HDR)途径。两种途径都可以用于实现希望的编辑结果。
[0557] NHEJ:在不存在修复模板的情况下,NHEJ过程重新连接DSB,这可以留下一个处于indel突变形式的瘢痕。可以利用此过程实现基因敲除,因为发生在编码外显子内的indel可以导致移码突变并形成提前终止密码子。还可以采用多个DSB在基因组中介导较大的缺失。
[0558] HDR:同源定向修复是NHEJ的一种主要的替换性DNA修复途径。尽管HDR典型地以低于NHEJ的频率发生,但是可以利用它在存在外源引入的修复模板的情况下在靶座位处产生精确的限定的修饰。该修复模板可以处于类似于具有侧翼于插入序列的同源臂的常规DNA靶向构建体而设计的双链DNA的形式,或单链DNA寡核苷酸(ssODN)的形式。后者提供了一种用于在基因组中进行小编辑的有效且简单的方法,如引入用于探测致病性遗传变异的单核苷酸突变。不同于NHEJ,HDR通常仅在分裂细胞中有活性并且其效率取决于细胞类型和状态而变化。
[0559] CRISPR概述:相比之下,CRISPR-Cas系统最低是一个由Cas9核酸酶和短指导RNA组成的双组分系统。将Cas9重新靶向不同座位或同时编辑多个基因简单地需要克隆一个不同的20-bp寡核苷酸。尽管Cas9核酸酶的特异性尚未彻底阐明,CRISPR-Cas系统的简单的沃森-克里克碱基配对似乎比ZFN或TALEN结构域的碱基配对更可预测。
[0560] II型CRISPR-Cas(规律间隔成簇短回文重复)是一种使用Cas9切割外源遗传元件的细菌获得性免疫系统。Cas9由一对非编码RNA指导,即一个可变的crRNA和一个必需的辅助tracrRNA。包含一个20-nt指导序列的crRNA经由沃森-克里克碱基配对通过定位靶DNA而确定特异性。在天然细菌系统中,共转录多种crRNA,以指向针对不同靶标的Cas9。在来源于化脓链球菌的CRISPR-Cas系统中,靶DNA必须紧接在一个5’-NGG/NRG原型间隔子邻近基序(PAM)之前,该基序可以针对其他CRISPR系统而变化。
[0561] CRISPR-Cas通过异源表达人类密码子优化的Cas9和必需的RNA组分而在哺乳动物细胞中重构。此外,可以将crRNA和tracrRNA融合以产生嵌合的合成的指导RNA(sgRNA)。Cas9因此可以通过改变sgRNA内的20-nt指导序列而重新指向任何感兴趣的靶标。
[0562] 鉴于其易于实施和多种能力,Cas9已经被用于经由NHEJ和HDR两者而产生携带特异的突变的工程化真核细胞。另外,直接将sgRNA和编码Cas9的mRNA注射进胚胎中已经使得可以快速产生具有多个修饰的等位基因的转基因小鼠;这些结果拥有编辑以另外的方式可用基因方法易处理的生物的前景。
[0563] 在其催化结构域之一中携带破坏的突变的Cas9已经被工程化为切口而非切割DNA,从而允许单链断裂和优先通过HDR进行修复,从而潜在地减少来自脱靶DSB的不想要的indel。另外,具有两个突变的DNA切割催化残基的Cas9突变体已经被适配成使得可以在大肠杆菌中进行转录调节,从而展示了功能化Cas9用于相异应用的潜力。本发明的某些方面涉及用于多元编辑人类细胞的Cas9的构建和应用。
[0564] 申请人已经提供了人类密码子优化的核定位序列侧翼的Cas9,以促进真核基因编辑。申请人描述了设计20-nt指导序列的考虑因素、用于快速构建sgRNA并对其进行功能验证的方案,并且最后使用Cas9核酸酶在人类胚肾(HEK-293FT)和人类干细胞(HUES9)系中介导基于NHEJ和HDR的两种基因组修饰。此方案可以被同样地应用于其他细胞类型和生物。
[0565] sgRNA的靶标选择:在用于基因靶向的20-nt指导序列的选择中存在两个主要考虑因素:1)靶序列应该在化脓链球菌Cas9的5’-NGG PAM之前,和2)指导序列应该被选择为使脱靶活性最小化。申请人提供了一种采用感兴趣的输入序列并鉴定适合的靶位点的在线Cas9靶向设计工具。为了用实验方法评估每个sgRNA的脱靶修饰,申请人还为每个预期靶标提供了计算预测的脱靶位点,这些位点是根据申请人对碱基配对错配的身份、位置和分布的作用的定量特异性分析排列的。
[0566] 关于计算预测的脱靶位点的详细信息如下:
[0567] 脱靶切割活性的考虑因素:类似于其他核酸酶,Cas9可以按减少的频率切割基因组中的脱靶DNA靶标。给定的指导序列展现出脱靶活性的程度取决于以下因素的组合,包括酶浓度、利用的特定指导序列的热力学以及类似序列在靶基因组中的丰度。对于Cas9的常规应用,重要的是考虑使脱靶切割水平最小化并且还能够检测脱靶切割的存在的方式。
[0568] 最小化脱靶活性:对于在细胞系中应用,申请人推荐了以下两个步骤来减少脱靶基因组修饰的水平。首先,使用我们的在线CRISPR靶标选择工具可以计算评估给定的指导序列具有脱靶位点的可能性。通过在基因组中彻底检索作为与指导序列类似的序列的脱靶序列而进行这些分析。sgRNA与其靶DNA之间的错配碱基的作用的综合性实验研究揭示到错配耐受是1)位置依赖性的-指导序列的3’末端的8-14bp比5’碱基更不耐受错配,2)数量依赖性的-通常超过3个错配是不被容忍的,3)指导序列依赖性的-一些指导序列比其他指导序列更不耐受错配,以及4)浓度依赖性的-脱靶切割对转染DNA的量高度敏感。申请人的靶位点分析网络工具(在网站enome-engineering.org/tools可获得)整合了这些标准,以为靶基因组中的可能的脱靶位点提供预测。其次,申请人推荐滴定Cas9和sgRNA表达质粒的量,以使脱靶活性最小化。
[0569] 脱靶活性的检测:使用申请人的CRISPR靶向网络工具可以产生最可能的脱靶位点以及进行那些位点的SURVEYOR或测序分析的引物的列表。对于使用Cas9产生的同基因克隆,申请人强烈推荐对这些候选脱靶位点进行测序,以检查任何不希望的突变。值得注意的是可能在未被包括在预测候选物列表中的位点中存在脱靶修饰并且应该进行全基因组测序以完全验证不存在脱靶位点。此外,在于同一基因组内诱导若干DSB的多元测定中,可能存在较低的转位事件率并且可以使用多种技术(如深度测序)对其进行评价。
[0570] 在线工具为1)制备sgRNA构建体、2)测定靶标修饰效率和3)评估潜在的脱靶位点处的切割所需的所有寡核苷酸和引物提供了序列。值得注意的是因为用于表达sgRNA的U6RNA聚合酶III启动子偏好鸟嘌呤(G)核苷酸作为其转录物的第一个碱基,所以在20-nt指导序列未以G开始的情况下,在sgRNA的5’附加一个额外的G。
[0571] sgRNA构建和递送途径:取决于希望的应用,可以将sgRNA作为1)包含表达盒的PCR扩增子或2)sgRNA表达质粒而递送。基于PCR的sgRNA递送将默认sgRNA序列附加到用于扩增U6启动子模板的反向PCR引物上。可以将生成的扩增子与包含Cas9的质粒(PX165)共转染。此方法最适于快速筛选多个候选sgRNA,因为可以在获得sgRNA-编码引物后仅仅几个小时进行用于功能测试的细胞转染。因为此简单方法省却了基于质粒的克隆和序列验证的需要,所以它特别适于测试或共转染大量用于产生较大的敲除文库或其他规模敏感的应用的sgRNA。注意的是,与基于质粒的sgRNA递送所需的~20-bp寡核苷酸相比,sgRNA-编码引物超过100-bp。
[0572] sgRNA的表达质粒的构建也是简单且快速的,涉及使用一对部分互补的寡核苷的单个克隆步骤。在将寡核苷酸对退火后,可以将生成的指导序列插入带有Cas9和具有sgRNA序列的剩余部分的不变支架两者的质粒(PX330)中。还可以将转染质粒修饰为使得可以产生用于体内递送的病毒。
[0573] 除基于PCR和质粒的递送方法之外,还可以将Cas9和sgRNA两者作为RNA而引入进细胞中。
[0574] 修复模板的设计:传统地,靶向的DNA修饰具有包含侧翼于改变位点的同源臂的基于质粒的供体修复模板的所需用途。每侧的同源臂的长度可以变化,但是典型地长于500bp。可以使用此方法产生较大的修饰,包括插入报告基因(如荧光蛋白或抗生素抗性标记)。靶向质粒的设计和构建已经在别处进行了描述。
[0575] 最近,已经使用单链DNA寡核苷酸(ssODN)代替靶向质粒,用于在限定的座位内进行短修饰而无需克隆。为了实现较高的HDR效率,ssODN在每侧包含至少40bp的与靶区域同源的侧翼序列,并且可以相对于靶座位以有义或反义方向定向。
[0576] 功能测试
[0577] SURVEYOR核酸酶测定:申请人通过SURVEYOR核酸酶测定或PCR扩增子测序检测了indel突变。申请人的在线CRISPR靶标设计工具为两个途径提供了推荐的引物。然而,也可以手动地设计SURVEYOR或测序引物,以从基因组DNA扩增感兴趣的区域并使用NCBI引物-BLAST避免非特异的扩增子。SURVEYOR引物应该被设计为在Cas9靶标的任一侧扩增300-400bp(对于总共600-800bp的扩增子而言),以允许通过凝胶电泳而清晰地可视化切割条带。为了防止形成过量的引物二聚体,SURVEYOR引物应该被设计为典型地长度为25-nt之下并且解链温度为~60℃。申请人推荐在SURVEYOR核酸酶消化过程期间针对特异的PCR扩增子以及不存在非特异的切割的情况测试每对候选引物。
[0578] 质粒-或ssODN-介导的HDR:可以经由修饰的区域的PCR-扩增和测序检测HDR。为此目的,PCR引物应该在由同源臂跨越的区域外退火,以避免错误地检测到残余的修复模板(HDR Fwd(正向)和Rev(反向),图12)。对于ssODN介导的HDR,可以使用SURVEYOR PCR引物。
[0579] 通过测序检测indel或HDR:申请人通过桑格或下一代深度测序(NGS)检测了靶向的基因组修饰。对于前者,可以使用SURVEYOR或HDR引物扩增来自修饰的区域的基因组DNA。应该将扩增子亚克隆进供转化的质粒(如pUC19)中;可以对单独的菌落测序,以揭示克隆基因型。
[0580] 申请人为较短的扩增子设计了下一代测序(NGS)引物,这些扩增子典型地在100-200bp尺寸范围内。对于检测NHEJ突变,重要的是设计在引发区和Cas9靶位点之间具有至少
10-20bp的引物,以允许检测较长的indel。申请人为两步PCR方法提供了指南,以为多元深度测序附加条形码适配子。归因于Illumina平台的通常较低水平的假阳性indel,申请人推荐了该平台。然后可以通过读取比对程序(如ClustalW、Geneious或简单的序列分析脚本)进行脱靶分析(先前所述)。
[0581] 材料与试剂
[0582] sgRNA制备:
[0583] 超纯的无DNA酶RNA酶蒸馏水(生命技术公司,目录号10977-023)
[0584] Herculase II融合聚合酶(安捷伦技术公司,目录号600679)
[0585] 关键。标准Taq聚合酶,缺少3’-5’外切核酸酶校正活性,具有较低的保真性并且可以导致扩增错误。Herculase II是一种以最小优化而产生高产率的PCR产物的高保真聚合酶(保真性与Pfu相当)。可以替代其他高保真聚合酶。
[0586] Herculase II反应缓冲液(5x;安捷伦技术公司,包括聚合酶)
[0587] dNTP混合溶液(各自25mM;Enzymatics公司,目录号N205L)
[0588] MgCl2(25mM;赛默飞世尔科技公司,目录号R0971)
[0589] QIAquick凝胶提取试剂盒(凯杰公司,目录号28704)
[0590] QIAprep spin miniprep试剂盒(凯杰公司,目录号27106)
[0591] UltraPure TBE缓冲液(10X;生命技术公司,目录号15581-028)
[0592] SeaKem LE琼脂糖(龙沙公司,目录号50004)
[0593] SYBR Safe DNA染色剂(10,000x;生命技术公司,目录号S33102)
[0594] 1-kb Plus DNA梯(生命技术公司,目录号10787-018)
[0595] TrackIt CyanOrange上样缓冲液(生命技术公司,目录号10482-028)
[0596] 快速消化BbsI(FastDigest BpiI)(费尔芒斯/赛默飞世尔科技公司,目录号FD1014)
[0597] Fermentas Tango缓冲液(费尔芒斯/赛默飞世尔科技公司,目录号BY5)
[0598] DL-二硫苏糖醇(DTT;费尔芒斯/赛默飞世尔科技公司,目录号R0862)
[0599] T7DNA连接酶(Enzymatic公司,目录号L602L)
[0600] 关键的:不替代更常用的T4连接酶。T7连接酶在粘性末端具有比平头末端高1,000倍的活性并且具有比可商购的浓缩T4连接酶高的整体活性。
[0601] T72X Rapid Ligation缓冲液(包括T7DNA连接酶,Enzymatics公司,目录号L602L)[0602] T4多核苷酸激酶(新英格兰生物实验室,目录号M0201S)
[0603] T4DNA连接酶反应缓冲液(10X;新英格兰生物实验室,目录号B0202S)
[0604] 腺苷5’-三磷酸(10mM;新英格兰生物实验室,目录号P0756S)
[0605] PlasmidSafe ATP-依赖性DNA酶(Epicentre,目录号E3101K)
[0606] One Shot Stbl3化学感受态大肠杆菌(E.coli)(生命技术公司,目录号C7373-03)[0607] SOC培养基(新英格兰生物实验室,目录号B9020S)
[0608] LB培养基(西格玛公司,目录号L3022)
[0609] LB琼脂培养基(西格玛公司,目录号L2897)
[0610] 氨苄西林,无菌过滤的(100mg ml-1;西格玛公司,目录号A5354)
[0611] 哺乳动物细胞培养:
[0612] HEK293FT细胞(生命技术公司,目录号R700-07)
[0613] 杜尔贝科最低伊格尔培养基(Dulbecco's minimum Eagle’s medium)(DMEM,1X,高葡萄糖;生命技术公司,目录号10313-039)
[0614] 杜尔贝科最低伊格尔培养基(DMEM,1X,高葡萄糖,无酚红;生命技术公司,目录号31053-028)
[0615] 杜尔贝科磷酸盐缓冲盐水(DPBS,1X;生命技术公司,目录号14190-250)
[0616] 胎牛血清,合格的且热灭活的(生命技术公司,目录号10438-034)
[0617] Opti-MEM I减血清培养基(FBS;生命技术公司,目录号11058-021)
[0618] 青霉素-链霉素(100x;生命技术公司,目录号15140-163)
[0619] TrypLETMExpress(1X,无酚红;生命技术公司,目录号12604-013)
[0620] Lipofectamine 2000转染试剂(生命技术公司,目录号11668027)
[0621] Amaxa SF Cell Line 4D- X Kit S(32RCT;龙沙公司,目录号V4XC-2032)
[0622] HUES 9细胞系(哈佛干细胞科学(HARVARD STEM CELL SCIENCE))
[0623] Geltrex无LDEV的减少的生长因子基膜基质(生命技术公司,目录号A1413201)[0624] mTeSR1培养基(干细胞技术公司(Stemcell Technologies),目录号05850)
[0625] Accutase细胞脱离溶液(干细胞技术公司,目录号07920)
[0626] ROCK抑制剂(Y-27632;密理博公司(Millipore),目录号SCM075)
[0627] Amaxa P3Primary Cell 4D- X Kit S(32RCT;龙沙公司,目录号V4XP-3032)
[0628] 基因分型分析:
[0629] QuickExtract DNA提取溶液(Epicentre,目录号QE09050)
[0630] 检验员、RFLP分析或测序的PCR引物(参见引物表)
[0631] Herculase II融合聚合酶(安捷伦技术公司,目录号600679)
[0632] 关键。因为Surveyor测定对单碱基错配敏感,所以特别重要的是使用高保真聚合酶。可以替代其他高保真聚合酶。
[0633] Herculase II反应缓冲液(5x;安捷伦技术公司,包括聚合酶)
[0634] dNTP混合溶液(各自25mM;Enzymatics公司,目录号N205L)
[0635] QIAquick凝胶提取试剂盒(凯杰公司,目录号28704)
[0636] Taq缓冲液(10x;金斯瑞公司(Genscript),目录号B0005)
[0637] 用于标准凝胶电泳的SURVEYOR突变检测试剂盒(转基因组学公司,目录号706025)[0638] UltraPure TBE缓冲液(10x;生命技术公司,目录号15581-028)
[0639] SeaKem LE琼脂糖(龙沙公司,目录号50004)
[0640] 4%-20%TBE Gels 1.0mm,15孔(生命技术公司,目录号EC62255BOX)
[0641] Hi-Density TBE样品缓冲液(5X;生命技术公司,目录号LC6678)
[0642] SYBR Gold核酸凝胶染色剂(10,000X;生命技术公司,目录号S-11494)
[0643] 1-kb Plus DNA梯(生命技术公司,目录号10787-018)
[0644] TrackIt CyanOrange上样缓冲液(生命技术公司,目录号10482-028)
[0645] 快速消化HindIII(FastDigest HindIII)(费尔芒斯/赛默飞世尔科技公司,目录号FD0504)
[0646] 设备
[0647] 过滤的无菌移液管(康宁公司)
[0648] 标准1.5ml微量离心管(艾本德公司(Eppendorf),目录号0030125.150)
[0649] Axygen 96孔PCR平板(VWR,目录号PCR-96M2-HSC)
[0650] Axygen 8-Strip PCR管(飞世尔科技公司(Fischer Scientific),目录号14-222-250)
[0651] Falcon管,聚丙烯,15ml(BD福尔肯公司,目录号352097)
[0652] Falcon管,聚丙烯,50ml(BD福尔肯公司,目录号352070)
[0653] 带有细胞滤网帽的圆底管,5ml(BD福尔肯公司,目录号352235)
[0654] 皮氏培养皿(60mm×15mm;BD生物科学公司(BD Biosciences),目录号351007)[0655] 组织培养平板(24孔;BD福尔肯公司,目录号353047)
[0656] 组织培养平板(96孔,平底;BD福尔肯公司,目录号353075)
[0657] 组织培养皿(100mm;BD福尔肯公司,353003)
[0658] 带有可编程的温度步进功能的96孔热循环仪(应用生物系统公司Veriti(Applied Biosystems Veriti),目录号4375786)。
[0659] 台式微量离心机5424,5804(艾本德公司)
[0660] 凝胶电泳系统(PowerPac基础电源,伯乐公司,目录号164-5050,和Sub-Cell GT系统凝胶托盘,伯乐公司,目录号170-4401)
[0661] Novex XCell SureLock Mini-Cell(生命技术公司,目录号EI0001)
[0662] 数字凝胶成像系统(GelDoc EZ,伯乐公司,目录号170-8270,和蓝色样品托盘,伯乐公司,目录号170-8273)
[0663] 蓝光透射仪和橙色过滤器护目镜(SafeImager 2.0;英杰公司,目录号G6600)[0664] 凝胶定量软件(Bio-Rad,ImageLab,包括GelDoc EZ,或可在网站rsbweb.nih.gov/ij/获得的来自国立卫生研究院的开放源ImageJ)UV分光光度计(NanoDrop 2000c,赛默飞世尔科技公司)
[0665] 试剂准备
[0666] 三硼酸EDTA(TBE)电泳溶液:将TBE缓冲液稀释于蒸馏水中成1X工作溶液,用于铸造琼脂糖凝胶并用作供凝胶电泳用的缓冲液。可以将缓冲液存储在室温(18℃-22℃)下持续至少1年。
[0667] ·ATP,10mM将10mM ATP分为50-μl等分部分并存储在-20℃下,持续长达1年;避免重复的冻融循环。
[0668] ·DTT,10mM在蒸馏水中制备10mM DTT溶液并以20-μl等分部分存储在-70℃下,持续长达2年;用于每个反应,使用一个新的等分部分,因为DTT容易被氧化。
[0669] ·D10培养基用于培养HEK293FT细胞,通过给DMEM补充1X GlutaMAX和10%(vol/vol)胎牛血清而制备D10培养基。如在该方案中所指示,此培养基还可以补充有1X青霉素-链霉素。可以提前制备D10培养基并存储在4℃下,持续长达1个月。
[0670] ·mTeSR1培养基用于培养人类胚胎干细胞,通过补充5X添加物(包括mTeSR1基础培养基)和100ug/ml Normocin而制备mTeSR1培养基。
[0671] 程序
[0672] 靶向组分的设计以及在线工具的使用·定时1d
[0673] 1|输入靶基因组DNA序列。申请人提供了一种在线Cas9靶向设计工具,该工具采用感兴趣的输入序列,鉴定并排列适合的靶位点,并计算预测每个预期靶标的脱靶位点。可替代地,可以通过鉴定正好位于任何5’-NGG的上游的20-bp序列而手动地选择指导序列。
[0674] 2|订购如通过该在线工具所指定的必需的寡核苷酸和引物。如果手动地选择位点,则应该设计寡核苷酸和引物。
[0675] sgRNA表达构建体的制备
[0676] 3|为了产生sgRNA表达构建体,可以使用基于PCR或质粒的方案。
[0677] (A)经由PCR扩增·定时2h
[0678] (i)申请人制备了稀释的U6PCR模板。申请人推荐使用PX330作为PCR模板,但是可以同样地将任何含U6质粒用作PCR模板。申请人用ddH2O将模板稀释至浓度为10ng/ul。注意的是,如果将已经包含U6驱动的sgRNA的质粒或盒用作模板,则需要进行凝胶提取,以保证产物仅包含预期的sgRNA而不包含从模板带入的痕量sgRNA。
[0679] (ii)申请人制备了稀释的PCR寡核苷酸。将U6-Fwd和U6-sgRNA-Rev引物在ddH2O中稀释至终浓度为10uM(将10ul的100uM引物添加至90ul ddH2O中)。
[0680] (iii)U6-sgRNA PCR反应。申请人按照需要为每个U6-sgRNA-Rev引物和预混合液设置了以下反应:
[0681] (iv)申请人使用以下循环条件在来自步骤(iii)的反应上进行了PCR反应:
[0682] (v)反应完成后,申请人使产物在凝胶上跑胶,以验证成功的单条带扩增。用1X SYBR Safe染料在1X TBE缓冲液中铸造2%(wt/vol)琼脂糖凝胶。使5ul的PCR产物在该凝胶中以15V cm-1跑胶20-30min。成功的扩增子应该产生单个的370-bp产物并且模板应该是不可见的。应该不必对PCR扩增子进行凝胶提取。
[0683] (vi)申请人根据制造商的指导,使用QIAquick PCR纯化试剂盒纯化了PCR产物。将DNA在35ul的缓冲液EB或水中洗脱。可以将纯化的PCR产物存储在4℃或-20℃下。
[0684] (B)将sgRNA克隆进含Cas9的双顺反子表达载体中·定时3d
[0685] (i)制备sgRNA寡核苷酸插入片段。申请人将每个sgRNA设计的寡核苷酸的顶链和底链再悬浮至终浓度为100uM。如下使寡核苷酸磷酸化和退火:
[0686] (ii)使用以下参数在热循环仪中退火:
[0687] 37℃持续30m
[0688] 95℃持续5m
[0689] 以5℃/m降至25℃
[0690] (iii)申请人通过将1ul的寡核苷酸添加至199ul室温ddH2O中而以1:200稀释了磷酸化且退火的寡核苷酸。
[0691] (iv)将sgRNA寡核苷酸克隆进PX330中。申请人为每个sgRNA设置了Golden Gate反应。申请人还推荐设置了一种无插入物,仅PX330作为阴性对照。
[0692] (v)将Golden Gate反应孵育总共1h:
[0693] 循环数                    条件
[0694] 1-6                       37℃持续5m,21℃持续5m
[0695] (vi)申请人用PlasmidSafe外切核酸酶处理了Golden Gate反应,以消化任何残余的线性化DNA。此步骤是任选的但被强烈推荐。来自步骤4的Golden Gate反应      11ul
10X PlasmidSafe缓冲液           1.5ul
ATP,10mM                        1.5ul
PlasmidSafe外切核酸酶           1ul
[0696] 总计                         15ul
[0697] (vii)申请人将PlasmidSafe反应在37℃下孵育了30min,随后在70℃下失活30min。暂停点:完成后,可以将反应冷冻并且稍后继续。环状DNA应该至少1周是稳定的。
[0698] (viii)转化。申请人根据与细胞一起提供的方案将PlasmidSafe处理的质粒转化进感受态大肠杆菌菌株中。申请人推荐Stbl3用于迅速转化。简言之,申请人将来自步骤(vii)的5ul的产物添加进20ul的冷化学感受态Stbl3细胞中。然后将其在冰上孵育10m,在42℃下热休克30s,立即返回冰上持续2m,添加100ul的SOC培养基,并且将其在包含100ug/ml氨苄西林的LB平板上铺板,并在37℃下孵育过夜。
[0699] (ix)第2天:申请人检查了平板的菌落生长情况。典型地,在阴性对照平板上不存在菌落(仅连接了BbsI-消化的PX330,没有退火的sgRNA寡核苷酸),并且在PX330-sgRNA克隆平板上存在数十至数百个菌落。
[0700] (x)申请人从每个平板中挑选了2-3个菌落,以检查sgRNA的正确插入。申请人使用无菌移液管尖端将单菌落接种进3ml具有100ug/ml氨苄西林的LB培养基的培养物中。在37℃下孵育并振荡过夜。
[0701] (xi)第3天:申请人根据制造商的说明书使用QiAprep Spin miniprep试剂盒从过夜培养物中分离出质粒DNA。
[0702] (xii)序列验证CRISPR质粒。申请人通过使用U6-Fwd引物从U6启动子测序证实了每个菌落的序列。任选的:使用以下引物表中列出的引物对Cas9基因进行测序。
[0703] 申请人参考了PX330克隆载体序列的测序结果,以检查20bp指导序列插入在U6启动子与sgRNA支架的剩余部分之间。可以在网站crispr.genome-engineering.org找到处于GenBank载体图谱格式的PX330图谱的细节和序列(*.gb文件)。
[0704] (任选的)设计ssODN模板·定时3d提前计划
[0705] 3|设计和订购ssODN。有义或反义ssODN可以直接从供应商购买。申请人推荐设计在任一侧上具有至少40bp和用于优化HDR效率的90bp的同源臂。在申请人的经验中,反义寡核苷酸具有稍微更高的修饰效率。
[0706] 4|申请人将ssODN ultramer再悬浮并稀释至终浓度为10uM。不将有义和反义ssODN合并或退火。存储在-20℃下。
[0707] 5|注意对于HDR应用,申请人推荐将sgRNA克隆进PX330质粒中。
[0708] sgRNA的功能验证:细胞培养和转染·定时3-4d
[0709] CRISPR-Cas系统已经被用于多种哺乳动物细胞系中。每个细胞系的条件可以变化。以下方案详细说明了HEK239FT细胞的转染条件。注意对于ssODN介导的HDR转染,使用Amaxa SF Cell Line Nucleofector试剂盒优化ssODN的递送。将在下节中对其进行描述。
[0710] 7|HEK293FT维持。根据制造商的推荐维持细胞。简言之,申请人在37℃和5%CO2下将细胞培养在D10培养基(补充有10%胎牛血清的GlutaMax DMEM)中。
[0711] 8|为了传代,申请人移除培养基并且通过将DPBS轻轻地添加到容器的侧面而将其冲洗一次,以便移动细胞。申请人将2ml的TrypLE添加至T75烧瓶中并在37℃下孵育5m。添加10ml的温D10培养基以失活并将其转移至50ml Falcon管中。申请人通过轻轻地研磨而使细胞解离,并且必要时重新接种新的烧瓶。申请人典型地使细胞以1:4或1:8的分传比每2-3d传代一次,绝不允许细胞达到大于70%的汇合。当达到传代数15时,细胞系被重新启动。
[0712] 9|制备供转染用的细胞。在以1.3x105个细胞/孔的接种密度和500ul的接种体积进行转染之前16-24h,申请人将良好解离的细胞在24孔平板上铺板在没有抗生素的D10培养基中。根据制造商手册按需要按比例放大或缩小。建议不要铺比推荐的密度多的细胞,因为这样做可以降低转染效率。
[0713] 10|在转染的当天,细胞的汇合最佳为70%-90%。根据制造商的方案,可以用Lipofectamine 2000或Amaxa SF Cell Line Nucleofector试剂盒转染细胞。
[0714] (A)对于克隆进PX330中的sgRNA,申请人转染了500ng的序列已证实的CRISPR质粒;如果转染超过一种质粒,以等摩尔比例混合并且总共不超过500ng。
[0715] (B)对于通过PCR扩增的sgRNA,申请人将以下项混合:PX165(仅有Cas9)           200ng
sgRNA扩增子(各自)         40ng
pUC19                     填充总DNA至500ng
[0716] 申请人推荐在技术上一式三份地转染用于可靠地定量并包括转染对照(例如GFP质粒)以监测转染效率。另外,可以将PX330克隆质粒和/或sgRNA扩增子作为阴性对照而单独地转染,用于下游的功能测定。
[0717] 11|申请人将Lipofectamine复合物轻轻地添加至细胞中,因为HEK293FT细胞可以容易地从平板上脱离并导致转染效率较低。
[0718] 12|申请人在转染后24h通过使用荧光显微镜估计对照(例如,GFP)转染中的荧光细胞的分数而检查了细胞的效率。典型地,超过70%的细胞被转染。
[0719] 13|申请人给培养基补充了另外500ul的温D10培养基。将D10非常缓慢地添加至孔的侧面并且不要使用冷的培养基,因为细胞可以容易地脱离开。
[0720] 14|在收获用于indel分析之前,将细胞在转染后孵育总共48-72h。48h后indel效率未显著增加。
[0721] (任选的)CRISPR质粒和ssODN或靶向质粒的共转染用于进行HR·定时3-4d
[0722] 15|线性化靶向质粒。如果可能的话,通过在同源臂之一的附近或在任一同源臂的远端在载体骨架中的限制酶切位点处切割一次而将靶向载体线性化。
[0723] 16|申请人使少量的线性化质粒在未切割的质粒旁边在0.8%-1%琼脂糖凝胶上跑胶,以检查成功的线性化。线性化质粒应该跑到超螺旋质粒的上方。
[0724] 17|申请人用QIAQuick PCR纯化试剂盒纯化了线性化质粒。
[0725] 18|制备供转染用的细胞。申请人在T75或T225烧瓶中培养HEK293FT。在转染当天之前,为重组的细胞计数订计划。对于Amaxa条状比色皿格式,每个转染使用2x106个细胞。
[0726] 19|制备供转染用的平板。申请人将1ml的温D10培养基添加进12孔平板的每个孔中。将平板置于恒温箱中,以保持培养基是温的。
[0727] 20|核转染。申请人根据适于以下步骤的Amaxa SF Cell Line Nucleofector 4D试剂盒制造商的说明书转染HEK293FT细胞。
[0728] a.用于ssODN和CRISPR共转染,将以下DNA预混合在PCR管中:pCRISPR质粒(Cas9+sgRNA)    500ng
ssODN模板(10uM)            1ul
[0729] b.用于HDR靶向质粒和CRISPR共转染,将以下DNA预混合在PCR管中:CRISPR质粒(Cas9+sgRNA)    500ng
线性化靶向质粒            500ng
[0730] 对于转染对照,参见上节。另外,申请人推荐转染单独的ssODN或靶向质粒作为阴性对照。
[0731] 21|解离为单细胞。申请人移除培养基并用DPBS轻轻地冲洗一次,注意不要移动细胞。将2ml的TrypLE添加至T75烧瓶中并在37℃下孵育5m。添加10ml的温D10培养基以失活并将其在50ml Falcon管中轻轻地研磨。推荐轻轻地研磨细胞并解离为单细胞。较大的团块将降低转染效率。申请人从悬浮液中取了一个10ul的等分部分并将其稀释于90ul的D10培养基中用于计数。申请人对细胞进行了计数并计算了转染所需的细胞数目和悬浮液体积。申请人使用Amaxa Nucleocuvette条典型地每个条件转染2x105个细胞,并且推荐计算比所需多20%的细胞,以调节在随后的吸移步骤中的体积损失。将所需体积转移至新的Falcon管中。
[0732] 23|申请人使新管以200x g旋降,持续5m。
[0733] 如由Amaxa所推荐的,申请人通过将SF溶液与S1添加物混合而制备了转染溶液。对于Amaxa条状比色皿,每个转染需要总共20ul的补充SF的溶液。同样地,申请人推荐计算比所需多20%的体积。
[0734] 25|申请人从来自步骤23的沉淀细胞中完全移除培养基并将其轻轻地再悬浮于适当体积(20ul/2x105个细胞)的补充S1的SF溶液中。不要将细胞在SF溶液中留延长的时间段。
[0735] 26|将20ul的再悬浮的细胞吸移进来自步骤20的每个DNA预混合液中。轻轻地吸移以混合并转移至Nucleocuvette条室中。针对每个转染条件将其重复。
[0736] 使用由Amaxa推荐的Nucleofector 4D程序CM-130将细胞电穿孔。
[0737] 28|申请人轻轻地并缓慢地将100ul的温D10培养基吸移进每个Nucleocuvette条室中,并将全部体积转移至来自步骤19的预加温的平板中。关键。细胞在此阶段是非常脆弱的并且粗鲁的吸移可以引起细胞死亡。孵育24h。在此时,可以从阳性转染对照中的荧光细胞的分数估计转染效率。核转染典型地产生大于70%-80%的转染效率。申请人将1ml温D10培养基缓慢地添加至每个孔中而未移动细胞。将细胞孵育总共72h。
[0738] 人类胚胎干细胞(HUES 9)培养和转染·定时3-4d
[0739] 维持hESC(HUES9)系。申请人常规地用mTesR1培养基将HUES9细胞系维持在无进料器的条件中。申请人通过添加5X包括基础培养基和100ug/ml Normocin的添加物而制备了mTeSR1培养基。申请人制备了进一步补充有10uM Rock抑制剂的mTeSR1培养基的一个10ml的等分部分。包衣组织培养平板。将冷的GelTrex 1:100地稀释于冷的DMEM中并包衣100mm组织培养平板的整个表面。
[0740] 将平板在37℃下置于恒温箱中持续至少30m。在37℃下解冻一小瓶15ml Falcon管中的细胞,添加5ml的mTeSR1培养基,并在200x g下沉淀5m。抽出GelTrex包衣并用约1x106个细胞接种10ml的包含Rock抑制剂的mTeSR1培养基。转染后24h换为正常的mTeSR1培养基并且每天重新给料。细胞传代。每天用新鲜的mTeSR1培养基为细胞重新给料并在达到70%汇合之前传代。抽出mTeSR1培养基并用DPBS将细胞洗涤一次。通过添加2ml Accutase并在37℃下孵育3-5m而使细胞解离。向脱离开的细胞中添加10ml mTeSR1培养基,转移至15ml Falcon管中并轻轻地再悬浮。在具有10uM Rock抑制剂的mTeSR1培养基中在GelTrex包衣的平板上重新铺板。铺板后24h换为正常的mTeSR1培养基。
[0741] 转染。申请人推荐在使用Amaxa P3Primary Cell 4-D Nucleofector试剂盒(龙沙公司)转染之前,在解冻后将细胞培养至少1周。转染之前2h,用新鲜的培养基为对数期生长细胞重新给料。用accutase解离为单细胞或不超过10个细胞的小聚簇并轻轻地再悬浮。为核转染所需的细胞数目计数并以200x g旋降,持续5m。完全地移除培养基并再悬浮于推荐体积的补充S1的P3核转染溶液中。在1X Rock抑制剂的存在下,将电穿孔的细胞轻轻地铺进包衣的平板中。
[0742] 检查转染是否成功并且在核转染后24h开始每天用普通的mTeSR1培养基重新给料。典型地,申请人用Amaxa核转染观察到大于70%的转染效率。收获DNA。转染后48-72h,使用accutase使细胞解离并通过添加5x体积的mTeSR1而失活。将细胞以200x g旋降,持续5m。可以将沉淀的细胞直接加工,用于使用QuickExtract溶液提取DNA。推荐不要不用accutase而机械地解离细胞。推荐不要在未灭活accutase的情况下或不按以上推荐的速度使细胞旋降;这样做可以导致细胞溶解。
[0743] 通过FACS分离克隆细胞系。定时·2-3h亲身实践的;2-3周扩展
[0744] 可以在转染后24h通过FACS或通过连续稀释进行克隆分离。
[0745] 54|制备FACS缓冲液。可以在补充有1X青霉素/链霉素的普通D10培养基中分选无需使用彩色荧光分选的细胞。如果还需要彩色荧光分选,则用无酚DMEM或DPBS替代正常的DMEM。补充1X青霉素/链霉素并通过.22umSteriflip过滤器进行过滤。
[0746] 55|准备96孔平板。申请人向每个孔中添加了100ul补充有1X青霉素/链霉素的D10培养基并根据希望的克隆数目的需要准备了平板的数目。
[0747] 56|制备供FACS用的细胞。申请人通过完全吸除培养基并向24孔平板的每个孔中添加100ul TrypLE而使细胞解离。孵育5m并添加400ul温D10培养基。
[0748] 57|将再悬浮的细胞转移至15ml Falcon管中并轻轻地研磨20次。建议在显微镜下进行检查,以保证解离单细胞。
[0749] 58|将细胞以200x g旋降,持续5分钟。
[0750] 59|申请人抽出培养基,并且将细胞再悬浮于200ul的FACS培养基中。
[0751] 60|通过35um目过滤器将细胞过滤进标记的FACS管中。申请人推荐使用带有细胞滤网帽的BD Falcon 12x 75mm管。将细胞放在冰上直到分选。
[0752] 61|申请人将单细胞分选进从步骤55准备的96孔平板中。申请人推荐在每个平板上的一个单个指定的孔中,分选100个细胞作为阳性对照。
[0753] 注意。可以将细胞的剩余部分保存和用于以群体水平进行基因分型,以测量整体修饰效率。
[0754] 62|申请人将细胞返回恒温箱总并允许它们扩增2-3周。分选后5d,添加100ul的温D10培养基。必要时,每3-5d更换100ul的培养基。
[0755] 63|分选后1周检查菌落的“克隆”外观:从中心点辐射的圆菌落。划出空的或可能已经接种有双联体或多联体的孔。
[0756] 64|当超过60%的细胞汇合时,申请人准备了一套用于传代的复制平板。将100ul的D10培养基添加至复制平板中的每个孔中。申请人通过上下剧烈吸移20次而直接将细胞解离。将20%的再悬浮体积铺进准备的复制平板中,以保存克隆系。之后每2-3d更换培养基并相应地传代。
[0757] 65|使用剩余的80%细胞进行DNA分离和基因分型。
[0758] 任选的:通过稀释分离克隆细胞系。定时·2-3h亲身实践的;2-3周扩展
[0759] 66|申请人如上所述地将细胞从24孔平板上解离。确保解离成单细胞。可以使用细胞滤网防止细胞聚集。
[0760] 67|在每个条件下对细胞的数目计数。将每个条件连续稀释于D10培养基中至终浓度为0.5个细胞/100ul。对于每个96孔平板,申请人推荐稀释至终计数为12ml的D10中有60个细胞。推荐将细胞数目的精确计数用于适当的克隆稀释。可以在中间的连续稀释阶段中对细胞重新计数以保证精确度。
[0761] 68|使用多通道移液管将100ul的稀释的细胞吸移进96孔平板的每个孔中。
[0762] 注意。可以将细胞的剩余部分保存和用于以群体水平进行基因分型,以测量整体修饰效率。
[0763] 69|铺板后~1周申请人检查了菌落的“克隆”外观:从中心点辐射的圆菌落。划出可能已经接种有双联体或多联体的孔。
[0764] 70|申请人将细胞返回恒温箱总并允许它们扩增2-3周。如在上节中详细说明的,根据需要为细胞重新给料。
[0765] 用于CRISPR切割效率的SURVEYOR测定。定时·5-6h
[0766] 在测定转染细胞的切割效率之前,申请人推荐使用以下描述的方案在阴性(未转染的)对照样品上通过SURVEYOR核酸酶消化步骤测试每个新的SURVEYOR引物。偶然地,甚至单条带的干净的SURVEYOR PCR产物可以产生非特异的SURVEYOR核酸酶切割条带并潜在地干扰准确的indel分析。
[0767] 71|收获细胞的DNA。将细胞解离并以200x g旋降,持续5m。注意。根据需要在此阶段需要复制平板,以保存转染细胞系。
[0768] 72|完全地抽出上清液。
[0769] 73|申请人根据制造商的说明书使用QuickExtract DNA提取溶液。申请人典型地为24孔平板的每个孔使用50ul的溶液并为96孔平板的每个孔使用10ul的溶液。
[0770] 74|申请人用ddH2O将提取的DNA归一化至终浓度为100-200ng/ul。暂停点:可以将提取的DNA存储在-20℃下,持续若干个月。
[0771] 75|设置SURVEYOR PCR。使用由申请人的在线/计算机算法工具提供的SURVEYOR引物将以下项预混合:
[0772] 76|申请人为每个反应添加了100-200ng的来自步骤74的归一化的基因组DNA模板。
[0773] 77|使用以下循环条件进行PCR反应,持续不超过30个扩增循环:
[0774] 78|申请人使2-5ul的PCR产物在1%凝胶上跑胶,以检查单条带产物。尽管将这些PCR条件设计为与大部分SURVEYOR引物对一起工作,但是一些引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。
[0775] 79|申请人使用QIAQuick PCR纯化试剂盒与归一化洗脱液纯化了PCR反应至20ng/ul。暂停点:可以将纯化的PCR产物存储在-20℃下。
[0776] 80|DNA异源双链体形成。如下设置退火反应:
[0777] Taq PCR缓冲液,10X             2ul
[0778] 归一化的DNA(20ng/ul)          18ul
[0779] 总体积                        20ul
[0780] 81|使用以下条件使反应退火:
[0781] 82|SURVEYOR核酸酶S消化。申请人制备了预混合液并将冰上的以下组分添加至来自步骤81的退火的异源双链体,总终体积为25ul:
[0782] 83|使孔涡旋并旋降。将反应在42℃下孵育1h。
[0783] 84|任选的:可以添加2ul来自SURVEYOR试剂盒的终止溶液。暂停点。可以将消化的产物存储在-20℃下用于稍后的分析。
[0784] 85|可视化SURVEYOR反应。可以在2%琼脂糖凝胶上使SURVEYOR核酸酶消化产物可视化。用于更好地拆分,可以使产物在4%-20%梯度聚丙烯酰胺TBE凝胶上跑胶。申请人用推荐的加样缓冲液加样了10ul的产物并根据制造商的说明书在凝胶上跑胶。典型地,申请人跑胶直到溴酚蓝染料已经迁移到凝胶的底部。同一凝胶上包括DNA梯和阴性对照。
[0785] 86|申请人用稀释于TBE中的1X SYBR Gold染料将凝胶染色。将凝胶轻轻地摇动15m。
[0786] 87|申请人使用定量成像系统使凝胶成像而未过度暴露这些条带。阴性对照应该仅具有一个对应于PCR产物的尺寸的条带,但是可以偶尔具有其他尺寸的非特异的切割条带。如果它们与靶切割条带在尺寸上不同,则这些条带将不干扰分析。由申请人的在线/计算机算法工具提供的靶切割条带尺寸的总和应该等于PCR产物的尺寸。
[0787] 88|估计切割强度。申请人使用ImageJ或其他凝胶定量软件定量了积分强度。
[0788] 89|对于每个泳道,申请人使用以下公式计算了切割的PCR产物的分数(f切割):f切割=(b+c)/(a+b+c),其中a是未消化的PCR产物的积分强度并且b和c是每个切割产物的积分强度。90|可以使用以下公式基于双链体形成的二项式概率分布估计切割效率:
[0789] 91
[0790] 用于评估CRISPR切割效率的桑格测序。定时·3d
[0791] 初始步骤与SURVEYOR测定的步骤71-79相同。注意:如果将适当的限制酶切位点附加至正向和反向引物上,则可以将SURVEYOR引物用于桑格测序。对于克隆进推荐的pUC19骨架中,可以使用EcoRI用于Fwd引物并使用HindIII用于Rev引物。
[0792] 92|扩增子消化。如下设置消化反应:
[0793] 93|pUC19骨架消化。如下设置消化反应:
[0794]
[0795] 94|申请人使用QIAQuick PCR纯化试剂盒纯化了消化反应。暂停点:可以将纯化的PCR产物存储在-20℃下。
[0796] 95|申请人如下以1:3载体:插入片段比例将消化的pUC19骨架与桑格扩增子连接:
[0797]
[0798] 96|转化。申请人根据与细胞一起提供的方案将PlasmidSafe处理的质粒转化进感受态大肠杆菌菌株中。申请人推荐Stbl3用于迅速转化。简言之,将5ul来自步骤95的产物添加进20ul的冰冷的化学感受态Stbl3细胞中,在冰上孵育10m,在42℃下热休克30s,立即返回冰上持续2m,添加100ul的SOC培养基,并在包含100ug/ml氨苄西林的LB平板上铺板。将其在37℃下孵育过夜。
[0799] 97|第2天:申请人检查了平板的菌落生长情况。典型地,在阴性对照平板上不存在菌落(仅连接了EcoRI-HindIII消化的pUC19,没有桑格扩增子插入片段),并且在pUC19-桑格扩增子克隆平板上存在数十至数百个菌落。
[0800] 98|第3天:申请人根据制造商的说明书使用QIAprep Spin miniprep试剂盒从过夜培养物中分离出质粒DNA。
[0801] 99|桑格测序。申请人通过使用pUC19-For引物从pUC19骨架测序证实了每个菌落的序列。申请人参照了预期的基因组DNA序列的测序结果,以检查Cas9诱导的NHEJ突变的存在。%编辑效率=(#修饰的克隆)/(#总克隆)。重要的是挑选合理数目的克隆(>24),以产生准确的修饰效率。
[0802] 微小缺失的基因分型。定时·2-3d亲身实践的;2-3周扩展
[0803] 100|如上所述的,用一对靶向有待缺失的区域的sgRNA转染细胞。
[0804] 101|转染后24h,如上所述的,通过FACS或连续稀释分离克隆系。
[0805] 102|将细胞扩增2-3周。
[0806] 103|如上所述的,申请人使用10ul QuickExtract溶液从克隆系中收获了DNA并用ddH2O将基因组DNA归一化至终浓度为50-100ng/ul。
[0807] 104|PCR扩增修饰的区域。如下设置PCR反应:
[0808] 注意:如果缺失尺寸超过1kb,用In-Fwd和In-Rev引物设置一套平行的PCR反应,以筛选野生型等位基因的存在。
[0809] 105|为了筛选倒置,如下设置PCR反应:
[0810] 注意:引物作为外-Fwd+内Fwd或外-Rev+内-Rev而配对。
[0811] 106|申请人为每个反应添加了100-200ng的来自步骤103的归一化的基因组DNA模板。
[0812] 107|使用以下循环条件进行PCR反应:
[0813] 108|申请人使2-5ul的PCR产物在1%-2%凝胶上跑胶,以检查产物。尽管将这些PCR条件设计为与大部分引物一起工作,但是一些引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。
[0814] 经由HDR针对靶向修饰进行基因分型。定时·2-3d,2-3h亲身实践的
[0815] 109|如上所述的,申请人使用QuickExtract溶液收获了DNA并用TE将基因组DNA归一化至终浓度为100-200ng/ul。
[0816] 110|PCR扩增修饰的区域。如下设置PCR反应:
[0817] 111|申请人为每个反应添加了100-200ng的来自步骤109的基因组DNA模板并按以下程序跑胶。
[0818] 112|申请人使5ul的PCR产物在0.8%-1%凝胶上跑胶,以检查单条带产物。引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。
[0819] 113|申请人使用QIAQuick PCR纯化试剂盒纯化了PCR反应。
[0820] 114|在HDR实例中,将HindIII限制酶切位点插入EMX1基因中。通过限制酶切消化PCR扩增子而对其进行检测:
[0821] i.将DNA在37℃下消化10m:
[0822] ii.申请人使10ul具有加样染料的消化的产物在4%-20%梯度聚丙烯酰胺TBE凝胶上跑胶,直到二甲苯蓝条带已经迁移到凝胶的底部。
[0823] iii.申请人用1X SYBR Gold染料将凝胶染色同时摇动15m。
[0824] iv.如上在SURVEYOR测定章节中所述的,使切割产物成像并对其进行定量。通过以下公式估计HDR效率:(b+c)/(a+b+c),其中a是未消化的HDR PCR产物的积分强度,并且b和c是HindIII-切割片段的积分强度。
[0825] 115|可替代地,可以克隆来自步骤113的纯化的PCR扩增子并使用桑格测序或NGS进行基因分型。
[0826] 深度测序和脱靶分析·定时1-2d
[0827] 在线CRISPR靶标设计工具针对每个鉴定的靶位点产生了候选基因组脱靶位点。可以通过SURVEYOR核酸酶测定、桑格测序或下一代深度测序进行这些位点处的脱靶分析。鉴于这些位点中的许多处的修饰率较低或不可检测的可能性,申请人推荐用Illumina Miseq平台进行深度测序,用于获得较高的灵敏度和精确度。方案将随测序平台而变化;在此,申请人简要地描述了一种用于附接测序适配子的融合PCR方法。
[0828] 116|设计深度测序引物。为较短的扩增子设计下一代测序(NGS)引物,这些扩增子典型地在100-200bp尺寸范围内。可以使用NCBI引物-Blast手动地设计引物或用在线CRISPR靶标设计工具产生(网站为genome-engineering.org/tools)。
[0829] 117|从Cas9靶向的细胞中收获基因组DNA。用ddH2O将QuickExtract基因组DNA归一化至100-200ng/ul。
[0830] 118|初始文库制备PCR。使用来自步骤116的NGS引物准备初始文库制备PCR
[0831]
[0832] 119|为每个反应添加100-200ng的归一化的基因组DNA模板。
[0833] 120|使用以下循环条件进行PCR反应,持续不超过20个扩增循环:
[0834] 121|使2-5ul的PCR产物在1%凝胶上跑胶,以检查单条带产物。与基因组DNAPCR一样,NGS引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。
[0835] 122|使用QIAQuick PCR纯化试剂盒纯化PCR反应并用洗脱液归一化至20ng/ul。暂停点:可以将纯化的PCR产物存储在-20℃下。
[0836] 123|Nextera XT DNA样品制备试剂盒。遵循制造商的方案,用独特的条形码为每个样品产生Miseq测序就绪的文库。
[0837] 124|分析测序数据。可以通过读取比对程序(如ClustalW、Geneious或简单的序列分析脚本)进行脱靶分析。
[0838] 定时
[0839] 步骤1-2设计并合成sgRNA寡核苷酸和ssODN:1-5d,取决于供应商而可变
[0840] 步骤3-5构建CRISPR质粒或PCR表达盒:2h至3d
[0841] 步骤6-53转染进细胞系中:3d(1h亲身实践时间)
[0842] 步骤54-70任选地衍生克隆系:1-3周,取决于细胞类型而可变
[0843] 步骤71-91经由SURVEYOR对NHEJ进行功能验证:5-6h
[0844] 步骤92-124经由桑格或下一代深度测序进行基因分型:2-3d(3-4h亲身实践时间)[0845] 解决在此的实例涉及的情况
[0846] 讨论
[0847] 可以容易地将CRISPR-Cas多元化,以促进同时修饰若干基因并以较高效率介导染色体微小缺失。申请人使用了两种sgRNA展示以高达68%的效率同时靶向HEK293FT细胞中的人类GRIN2B和DYRK1A座位。同样地,可以使用一对sgRNA介导微小缺失,如切除外显子,可以通过PCR在克隆水平上对微小缺失进行基因分型。注意的是外显子接合的精确位置可以变化。申请人还展示了使用ssODN和靶向载体在HEK 293FT和HUES9细胞中用Cas9的野生型和切口酶突变体两者介导HDR(图12)。注意的是申请人还不能使用Cas9切口酶在HUES9细胞中检测到HDR,这可能是归因于在HUES9细胞中效率较低或修复活性方面的潜在差异。尽管这些值是典型的,但是给定的sgRNA的切割效率仍存在一些可变性,并且在个别情况下某些sgRNA可能不工作,究其原因仍是未知的。申请人推荐为每个座位设计两种sgRNA,并在预期的细胞类型中测试其效率。实例26:NLS
[0848] Cas9转录调节剂:申请人着手将Cas9/gRNA CRISPR系统变成通用的DNA结合系统,在该系统中可以执行超过DNA切割的功能。例如,通过将一个或多个功能结构域融合到无催化活性的Cas9上,申请人已经给予了新颖的功能,如转录激活/抑制、甲基化/脱甲基化或染色质修饰。为了完成此目标,申请人通过将两个核酸酶活性必需的残基D10和H840变为丙氨酸而制备了无催化活性的Cas9突变体。通过突变这两个残基,Cas9的核酸酶活性被消除同时维持结合靶DNA的能力。申请人决定聚焦以测试申请人的假设的功能结构域是转录激活因子VP64和转录阻遏物SID和KRAB。
[0849] Cas9核定位:申请人假设最有效的Cas9转录调节剂将牢固地定位于细胞核,在细胞核中它将对转录具有最大的影响。此外,细胞质中的任何残余的Cas9都可能具有不想要的作用。申请人确定野生型Cas9因为不包括多个核定位信号(NLS)而不定位进细胞核中(尽管CRISPR系统无需具有一个或多个NLS,但是有利地具有至少一个或多个NLS)。因为需要多个NLS序列,所以推断难于将Cas9进入细胞核中并且融合到Cas9上的任何另外的结构域都可能破坏核定位。因此,申请人制备了四种具有不同NLS序列的Cas9-VP64-GFP融合构建体(pXRP02-pLenti2-EF1a-NLS-hSpCsn1(10A,840A)-NLS-VP64-EGFP、pXRP04-pLenti2-EF1a-NLS-hSpCsn1(10A,840A)-NLS-VP64-2A-EGFP-NLS、pXRP06-pLenti2-EF1a-NLS-EGFP-VP64-NLS-hSpCsn1(10A,840A)-NLS、pXRP08-pLenti2-EF1a-NLS-VP64-NLS-hSpCsn1(10A,840A)-NLS-VP64-EGFP-NLS)。将这些构建体克隆进处于人类EF1a启动子的表达之下的lenti骨架中。还添加了WPRE元件,用于更稳健地表达蛋白质。使用Lipofectame 2000将每个构建体转染进HEK 293FT细胞中并在转染后24小时成像。当融合蛋白在该融合蛋白的N-末端和C-末端上都具有NLS序列时获得最佳核定位。观察到的最高核定位出现在具有四个NLS元件的构建体中。
[0850] 为了更稳健地理解NLS元件对Cas9的影响,申请人通过将同一α输入蛋白NLS序列融合在三个串联重复的看着为零的N-末端或C-末端而制备了16个Cas9-GFP融合。使用Lipofectame 2000将每个构建体转染进HEK293FT细胞中并在转染后24小时成像。值得注意地,NLS元件的数目不与核定位的范围直接相关。在C-末端上添加NLS比在N-末端上添加对核定位具有更大的影响。
[0851] Cas9转录激活因子:申请人通过靶向Sox2座位并通过RT-qPCR定量转录激活而在功能上对Cas9-VP64蛋白进行了测试。选择了八个DNA靶位点来跨Sox2的启动子。使用Lipofectame 2000将每个构建体转染进HEK293FT细胞中并且在转染后72小时,从细胞中提取总RNA。在40ul反应中,将1ug的RNA反转录成cDNA(qScript Supermix)。将2ul的反应产物添加进单个的20ul TaqMan测定qPCR反应中。在生物和技术上一式三份地进行每个实验。没有RT对照并且没有模板对照反应显示出无扩增。不显示出强烈的核定位的构建体pXRP02和pXRP04导致无激活。对于的确显示出较强的核定位的构建体pXRP08,观察到适度的激活。可以在指导RNA Sox2.4和Sox2.5的情况下观察到统计学上有义意的激活。实例27:体内小鼠数据
[0852] 材料与试剂Herculase II融合聚合酶(安捷伦技术公司,目录号600679)
10x NE缓冲液4(NEB,目录号B7004S)
BsaI HF(NEB,目录号R3535S)
T7 DNA连接酶(Enzymatic公司,目录号L602L)
快速消化缓冲液,10X(赛默飞世尔科技公司,目录号B64)
快速消化NotI(赛默飞世尔科技公司,目录号FD0594)
FastAP碱性磷酸酶(赛默飞世尔科技公司,目录号EF0651)
Lipofectamine2000(生命技术公司,目录号11668-019)
胰蛋白酶(生命技术公司,目录号15400054)
Forceps#4(西格玛公司,目录号Z168777-1EA)
Forceps#5(西格玛公司,目录号F6521-1EA)
10x汉克氏平衡盐溶液(Hank’s Balanced Salt Solution)(西格玛公司,目录号
H4641-500ML)
青霉素/链霉素溶液(生命技术公司,目录号P4333)
Neurobasal(生命技术公司,目录号21103049)
B27添加物(生命技术公司,目录号17504044)
L-谷氨酰胺(生命技术公司,目录号25030081)
谷氨酸盐(西格玛公司,目录号RES5063G-A7)
β-巯基乙醇(西格玛公司,目录号M6250-100ML)
HA兔抗体(细胞信号传导,目录号3724S)
细胞成像试剂盒(生命技术公司,目录号R37601)
30G世界精密仪器(World Precision Instrument)注射器(世界精密仪器(World 
Precision Instruments),目录号NANOFIL)
立体定位仪(科夫仪器(Kopf Instruments))
UltraMicroPump3(世界精密仪器,目录号UMP3-4)
蔗糖(西格玛公司,目录号S7903)
氯化钙(西格玛公司,目录号C1016)
乙酸镁(西格玛公司,目录号M0631)
Tris-HCl(西格玛公司,目录号T5941)
EDTA(西格玛公司,目录号E6758)
NP-40(西格玛公司,目录号NP40)
苯甲基磺酰氟(西格玛公司,目录号78830)
氯化镁(西格玛公司,目录号M8266)
氯化钾(西格玛公司,目录号P9333)
β-甘油磷酸酯(西格玛公司,目录号G9422)
甘油(西格玛公司,目录号G9012)
DyeCycleTMRuby Stain(生命技术公司,目录号S4942)
FACS Aria Flu-act-细胞分选仪(美国剑桥MIT的科赫研究所(Koch Institute)
DNAeasy Blood&Tissue试剂盒(凯杰公司,目录号69504)
[0853] 程序
[0854] 构建在脑中体内使用的gRNA多元体申请人设计并PCR扩增了靶向小鼠TET和DNMT家族成员的单个的gRNA(如在此描述的)。
在N2a细胞系中评估靶向效率(图15)。为了在体内获得若干基因的同时修饰,在AAV包装的载体中对有效的gRNA进行多元化(图16)。为了促进系统效率的进一步分析,申请人向该系统上添加了与人类突触蛋白I启动子的控制之下的GFP-KASH结构域融合蛋白一致的表达盒(图16)。此修饰允许在神经元群体中进一步分析系统效率(更详细的程序参见章节分选细胞核与体内结果)。
[0855] 使用以下引物使用Herculase II融合聚合酶PCR扩增该系统的所有4个部分:第一U6Fw:
gagggtctcgtccttgcggccgcgctagcgagggcctatttcccatgattc
第一gRNA Rv:
ctcggtctcggtAAAAAAgcaccgactcggtgccactttttcaagttgataacggactagc
cttattttaacttgctaTTTCtagctctaaaacNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCAC
第二U6Fw:
gagggtctcTTTaccggtgagggcctatttcccatgattcc
第二gRNA Rv:
ctcggtctcctcAAAAAAgcaccgactcggtgccactttttcaagttgataacggactagc
cttattttaacttgctaTTTCtagctctaaaacNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCAC
第三U6Fw:
gagggtctcTTTgagctcgagggcctatttcccatgattc
第三gRNA Rv:
ctcggtctcgcgtAAAAAAgcaccgactcggtgccactttttcaagttgataacggactag
ccttattttaacttgctaTTTCtagctctaaaacNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCA
hSyn_GFP-kash Fw:gagggtctcTTacgcgtgtgtctagac
hSyn_GFP-kash Rv:
ctcggtctcAaggaCAGGGAAGGGAGCAGTGGTTCACGCCTGTAATCCCAGCAATTTGGGA 
GGCCAAGGTGGGTAGATCACCTGAGATTAGGAGTTGC
(NNNNNNNNNNNNNNNNNNNN是反向互补序列靶向的基因组序列)
[0856] 申请人使用了Golden Gate策略在单步反应中组装了该系统的所有部分(1:1分子比):
[0857] 使用Herculase II融合聚合酶和以下引物PCR扩增Golden Gate反应产物:Fw 5’cctgtccttgcggccgcgctagcgagggcc
Rv 5’cacgcggccgcaaggacagggaagggagcag
[0858] 使用NotI限制酶切位点将PCR产物克隆进AAV骨架中在ITR序列之间:PCR产物消化:
[0859] AAV骨架消化:
[0860] 在37℃下孵育20min后,使用QIAQuick PCR纯化试剂盒纯化样品。如下以1:3载体:插入片段比例连接标准化的样品:
[0861] 用连接反应产物转化细菌后,申请人用桑格测序确认了获得的克隆。
[0862] 与Cas9构建体共转染后,在N2a细胞中测试阳性DNA克隆(图17和18)。
[0863] 设计用于AAV递送的新的Cas9构建体
[0864] 尽管其具有独特的功能,AAV递送系统具有包装限制-为了成功地在体内递送表达盒,则它的尺寸不得不<4.7kb。为了减少SpCas9表达盒的尺寸并促进递送,申请人测试了若干改变:不同启动子、较短的polyA信号以及最后是较小版本的来自金黄色葡萄球菌的Cas9(SaCas9)(图19和20)。所有测试的启动子先前已经被测试并且公开为在神经元中有活性,包括小鼠Mecp2(格雷(Gray)等人,2011)、大鼠Map1b和截短的大鼠Map1b(刘(Liu)和费舍尔(Fischer),1996)。替代性合成polyA序列先前也已显示具有功能(莱维特(Levitt)等人,1989;格雷(Gray)等人,2011)。在用Lipofectamine 2000转染后,在N2a细胞中表达所有克隆的构建体,并用Western印迹法进行测试(图21)。
[0865] 在初级神经元中测试AAV多元系统
[0866] 为了确认研发的系统在神经元中的功能性,申请人使用体外初级神经元培养物。根据先前由班克(Banker)和戈斯林(Goslin)(班克和戈斯林,1988)公开的方案制备小鼠皮层神经元。
[0867] 第16天,从胚胎中获得神经元细胞。胚胎提取自安乐死的怀孕雌鼠,并且将头部置于冰冷的HBSS中。然后,用镊子(#4和#5)从头骨中提取大脑并将其转移至另一个更换的冰冷的HBSS中。在立体显微镜和#5镊子的辅助下在填充有冰冷的HBSS的皮氏培养皿中进行另外的步。将半球彼此分离并与脑干分离并清除脑膜。然后,非常谨慎地解剖海马体并将其置于填充有冰冷的HBSS的15ml锥形管中。可以使用在海马体解剖后留下的皮层,在除去脑干残留物和嗅球后使用类似的方案进行另外的细胞分离。将分离的海马体用10ml冰冷的HBSS洗涤三次并通过在37℃下于HBSS中用胰蛋白酶孵育15min而解离(4ml HBSS,添加10μl 2.5%胰蛋白酶/海马体)。胰酶消化后,将海马体非常谨慎地洗涤三次,以用预加热至37℃的HBSS除去任何痕量的胰蛋白酶并在温HBSS中解离。申请人通常使用1ml移液管尖端在1ml HBSS中解离获得自10-12个胚胎的细胞并稀释解离的细胞直到4ml。将细胞以250个细胞/mm2的密度铺板并在37℃和5%CO2下培养长达3周。
[0868] HBSS435ml H2O
50ml 10x汉克氏平衡盐溶液
16.5ml 0.3M HEPES pH 7.3
5ml青霉素-链霉素溶液
过滤(0.2μm)并存储在4℃下
[0869] 神经元铺板培养基(100ml)97ml Neurobasal
2ml B27添加物
1ml青霉素-链霉素溶液
250μl谷氨酰胺
125μl谷氨酸
[0870] 用来自HEK293FT细胞的过滤培养基的浓缩AAV1/2病毒或AAV1病毒转导神经元,培养4-7天之间并且在转导后在培养物中保存至少一周,以允许递送的基因表达。
[0871] AAV驱动的系统的表达
[0872] 申请人使用Western印迹法确认了AAV递送后SpCas9和SaCas9在神经元培养物中的表达(图24)。转导后一周,用β-巯基乙醇在NuPage SDS加样缓冲液中收集神经元,以使蛋白质在95℃下变性5min。将样品在SDS PAGE凝胶上分离并转移到PVDF膜上,用于进行WB蛋白质检测。用HA抗体检测Cas9蛋白。
[0873] 用荧光显微镜确认来自gRNA多元AAV的Syn-GFP-kash的表达(图32)。
[0874] 毒性
[0875] 为了评估具有CRISPR系统的AAV的毒性,申请人在病毒转导后一周测试了神经元的整体形态(图27)。另外,申请人用 细胞成像试剂盒测试了设计的系统的潜在的毒性,该试剂盒允许区分培养物中的活细胞和死细胞。它是基于细胞内酯酶活性的存在(如通过将非荧光钙黄绿素AM酶促转化为强烈的绿色荧光钙黄绿素所确定的)。另一方面,该试剂盒的红色的细胞不通透性组分仅进入具有受损膜的细胞并结合到死细胞中的产荧光DNA上。两种荧光团都可以容易地用荧光显微镜在活细胞中可视化。AAV驱动的Cas9蛋白和多元gRNA构建体在初级皮层神经元中的表达耐受性良好并且无毒(图25和26),这指示设计的AAV系统适于体内测试。
[0876] 病毒产生
[0877] 根据描述于麦克卢尔(McClure)等人,2011中的方法产生浓缩的病毒。上清液病毒产生出现在HEK293FT细胞中。
[0878] 脑部手术
[0879] 对于病毒载体注射,通过腹膜内注射用氯胺/甲苯噻嗪混合物(氯胺酮剂量为100mg/kg并且甲苯噻嗪剂量为10mg/kg)麻醉的10-15周龄的雄性C57BL/6N小鼠。将腹膜内给予Buprenex用作优先购买的镇痛剂(1mg/kg)。使用内定位螺柱齿条将动物固定在Kopf立体定位仪中,以维持头骨不动。使用手持电钻,在前囟后面-3.0mm且在海马体的CA1区域中的供注射的侧面3.5mm处钻出一个洞(1-2mm)。使用深度为2.5mm的30G世界精密仪器注射器,注射总体积为1ul的AAV病毒粒子溶液。通过流速为0.5ul/min的‘世界精密仪器UltraMicroPump3’注射监测注射,以防止损伤组织。当完成注射时,以0.5mm/min的速度缓慢地移除注射针。注射后,用6-0爱惜良(Ethilon)缝合线将皮肤缝合。在手术后,给动物供应1mL乳酸林格氏溶液(皮下的)并放在温度受控的(37℃)环境中,直到恢复走动。术后3周,通过深度麻醉将动物处以安乐死,随后除去组织,用于细胞核分选或用4%多聚甲醛灌注用于免疫化学。
[0880] 分选细胞核与体内结果
[0881] 申请人设计了一种用GFP特异地在遗传上标记gRNA靶向的神经元细胞核的方法,用于标记的细胞核的荧光激活细胞分选术(FACS)以及DNA、RNA和核内蛋白的下游加工。为了这个目的,诸位申请人的多元靶向载体被设计成表达在GFP与小鼠细胞核膜蛋白结构域KASH(斯塔尔DA(Starr DA),2011,《当代生物学分(Current biology))之间的融合蛋白和用于靶向特定的感兴趣的基因座位的3个gRNA(图16)。在人类突触蛋白启动子的控制之下表达GFP-KASH,以特异性标记神经元。该融合蛋白GFP-KASH的氨基酸是:MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKSGLRSREEEEETDSRMPHLDSPGSSQPRRSFLSRVIRAALPLQLLLLLLLLLACLLPASEDDYSCTQANNFARSFYPMLRYTNGPPPT
[0882] AAV1/2介导的递送进入脑后一周,观察到GFP-KASH的稳健表达。对于FACS和标记的细胞核的下游加工,术后3周将海马体解剖并加工,用于使用梯度离心步骤进行细胞核纯化。为了这个目的,使用2ml Dounce均质机(西格玛公司)将组织在320mM蔗糖、5mM CaCl、3mM Mg(Ac)2、10mM Tris pH 7.8、0.1mM EDTA、0.1%NP40、0.1mM苯甲基磺酰氟(PMSF)、1mMβ-巯基乙醇中匀化。根据制造商的方案,将匀浆在4℃下以3.500rpm以25%至29%
梯度离心30min。将细胞核沉淀物再悬浮于340mM蔗糖、2mM MgCl2、25mM KCl、
65mM甘油磷酸酯、5%甘油、0.1mM PMSF、1mMβ-巯基乙醇中并向标记的细胞核中添加DyeCycleTM Ruby Stain(生命技术公司)(为DNA提供近红外发射)。使用Aria 
Flu-act-细胞分选仪和BDFACS Diva软件通过FACS分选标记的和纯化的细胞核。最后,使用DNAeasy Blood&Tissue试剂盒(凯杰公司),将分选的GFP+和GFP-细胞核用于纯化基因组DNA,用于对靶向的基因组区域进行Surveyor测定分析。可以容易地使用同一途径从靶向的细胞中纯化出细胞核RNA或蛋白质,用于下游加工。由于2-载体系统(图16),诸位申请人在此途径中使用有效的Cas9介导的DNA切割预期仅在脑中的一小部分的细胞中出现(用多元靶向载体和Cas9编码载体两者共转染的细胞)。在此描述的方法使得诸位申请人可以从表达3种感兴趣的gRNA并且因此应该会经历Cas9介导的DNA切割的细胞群体中特异地纯化出DNA、RNA和核内蛋白。通过使用此方法,诸位申请人能够可视化仅发生在一小部分的细胞中的有效的体内DNA切割。
[0883] 实质上,申请人在此显示的是靶向的体内切割。此外,申请人使用了一种多元途径,其中同时但是独立地靶向若干不同序列。呈现的系统可以适于研究脑部病理病症(基因敲除,例如帕金森病)并且还为进一步研发脑中的基因组编辑工具开辟了一个领域。通过将核酸酶活性替换为基因转录调节剂或表观遗传调节剂,可以回答关于脑中的基因调节和表观改变不仅在病理病症而且在生理过程(如学习和记忆形成)中的作用的整个范围的科学问题。最后,呈现的技术可以应用于更复杂的哺乳动物系统(如灵长类)中,该技术允许克服当前的技术局限。实例28:模型数据
[0884] 已经具体研究了若干疾病模型。这些疾病模型包括新生(de novo)自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征性自闭症(安格曼综合征(Angelman Syndrome))基因UBE3A。这些基因以及生成的自闭症模型当然是优选的,但是显示本发明可以被应用于任何基因并且因此任何模型都是可能的。
[0885] 申请人已经使用Cas9核酸酶在人类胚胎干细胞(hESC)中制备了这些细胞系。通过用Cbh-Cas9-2A-EGFP和pU6-sgRNA瞬时转染hESC而建立了这些系。为最经常地靶向相同外显子的每个基因设计了两种sgRNA,在这些外显子中患者无义(敲除)突变最近已经由自闭症患者的全外显子组测序研究得到描述。为此项目特异建立了Cas9-2A-EGFP和pU6质粒。实例29:AAV产生系统或方案
[0886] 在此提供了为高通量筛选用途研发并且与其一起工作特别好的AAV产生系统或方案,但是它在本发明中也具有较广泛的适用性。操纵内源基因表达提出了各种挑战,因为表达率取决于许多因素,包括调节元件、mRNA加工和转录物稳定性。为了克服此挑战,申请人研发了一种用于供递送的基于腺相关病毒(AAV)的载体。AAV具有一个基于ssDNA的基因组并且因此较不易受重组影响。
[0887] AAV1/2(血清型AAV1/2,即杂交体或嵌合体AAV1/AAV2衣壳AAV)肝素纯化的浓缩病毒方案
[0888] 培养基:D10+HEPES500ml瓶DMEM高葡萄糖+Glutamax(GIBCO)
50ml Hyclone FBS(热灭活的)(赛默飞世尔)
5.5ml HEPES溶液(1M,GIBCO)
细胞:低传代HEK293FT(产生病毒时传代<10次,解冻新的传代2-4次的细胞用于产生病毒,生长直到3-5次传代)
[0889] 转染试剂:聚乙烯亚胺(PEI)“Max”将50mg PEI“Max”溶解于50ml无菌的超纯H20中
将pH调节至7.1
用0.22um fliptop过滤器过滤
封口膜将管和包裹物密封
在-20℃下将等分部分冷冻(用于存储,也可以立即使用)
[0890] 细胞培养在D10+HEPES中培养低传代HEK293FT
每天传代1:2与1:2.5之间
有利地不允许达到细胞超过85%的汇合
[0891] 对于T75-温10ml HBSS(-Mg2+,-Ca2+,GIBCO)+1ml TrypLE Express(GIBCO)/烧瓶至37℃(水浴)
完全地抽出培养基
-轻轻地添加10ml温HBSS(以完全洗掉培养基)
-添加1ml TrypLE/烧瓶
-将烧瓶在恒温箱(37℃)中放置1min
-摇动烧瓶以使细胞脱离开
-添加9ml D10+HEPES培养基(37℃)
-上下吸移5次,以产生单细胞悬浮液
-以1:2-1:2.5(对于T75,是12ml培养基)比例分离(如果细胞生长更缓慢,则丢弃并解冻新的批次,它们未处于最佳生长)
-当存在足够的细胞时即转移至T225中(对于易于处理大量的细胞)
[0892] AAV产生(5*15cm培养皿尺度/构建体):将21.5ml培养基中的1千万个细胞铺进15cm培养皿中
在37℃下孵育18-22小时
在80%汇合处转染是理想的
[0893] 每个平板预温的22ml培养基(D10+HEPES)
[0894] 准备具有DNA混合物的管(使用无内毒素大量质粒提取DNA(endofree maxiprep DNA)):5.2ug感兴趣的质粒载体
4.35ug AAV 1血清型质粒
4.35ug AAV 2血清型质粒
10.4ug pDF6质粒(腺病毒辅助基因)涡旋至混合
添加434uL DMEM(无血清!)
添加130ul PEI溶液
涡旋5-10秒
向预温的培养基添加DNA/DMEM/PEI混合物
简单地涡旋至混合
将15cm培养皿中的培养基替换为DNA/DMEM/PEI混合物
返回37℃恒温箱中
收获之前孵育48h(确保培养基没有变得太酸)
[0895] 收获病毒:1.将培养基谨慎地从15cm培养皿中抽出(有利地不要移动细胞)
2.向每个平板中添加25ml RT DPBS(英杰公司)并用细胞刮棒轻轻地移除细胞。将悬浮液收集在50ml管中。
3.将细胞在800x g下沉淀10分钟。
4.丢弃上清液
[0896] 暂停点:希望的话,将细胞沉淀物冷冻在-80C下5.将沉淀物再悬浮于150mM NaCl、20mM Tris pH 8.0中,每个组织培养平板使用10ml。
6.在dH2O中制备10%脱氧胆酸钠的新鲜溶液。向每个组织培养平板中添加1.25ml的此溶液至终浓度为0.5%。添加benzonase核酸酶,至终浓度为50个单位/ml。将管充分混合。
7.在37℃下孵育1小时(水浴)。
8.通过在3000x g下离心15min除去细胞碎片。转移至干净的50ml管中并且保证已经除去所有的细胞碎片,以防止堵塞肝素柱。
[0897] AAV1/2的肝素柱纯化:1.使用蠕动泵设置HiTrap肝素柱,这样使得溶液以每分钟1ml流过该柱。重要的是保证没有将气泡引入进该肝素柱中。
2.使用蠕动泵,用10ml 150mM NaCl、20mM Tris(pH 8.0)平衡该柱。
3.病毒的结合:向柱上施加50ml病毒溶液并允许流过。
4.洗涤步骤1:用20ml 100mM NaCl、20mM Tris(pH 8.0)洗涤柱。(使用蠕动泵)
5.洗涤步骤2:使用3ml或5ml注射器继续用1ml 200mM NaCl、20mM Tris(pH 8.0)洗涤该柱,随后用1ml 300mM NaCl、20mM Tris(pH 8.0)洗涤。
丢弃流过物(flow-through)。
(在以上病毒溶液流过50min过程中准备具有不同缓冲液的注射器)
6.洗脱使用5ml注射器和轻压(流速<1ml/min)通过施加以下项将病毒从该柱上洗脱下来:
1.5ml 400mM NaCl,20mM Tris,pH 8.0
3.0ml 450mM NaCl,20mM Tris,pH 8.0
1.5ml 500mM NaCl,20mM Tris,pH 8.0
将这些收集在15ml离心管中。
[0898] AAV1/2的浓度:1.浓缩步骤1:使用具有100,000分子量截留的Amicon ultra 15ml离心过滤装置浓缩洗脱的病毒。将柱洗脱物加样进浓缩器中并在2000x g下离心2分钟(在室温下)。检查浓缩体积-它应该是大约500μl。必要的话,以1min间隔离心,直到达到正确体积。
2.缓冲液交换:向过滤装置中添加1ml无菌DPBS,以1min间隔离心,直到达到正确体积(500ul)。
3.浓缩步骤2:向Amicon Ultra 0.5ml 100K过滤装置中添加500ul浓缩物。在6000g下离心2min。检查浓缩体积-它应该是大约100μl。必要的话,以1min间隔离心,直到达到正确体积。
4.回收:倒置滤芯并插入新鲜的收集管中。在1000g下离心2min。
等分并在-80℃下冷冻
每个注射位点典型地需要1ul,因此推荐小的等分部分(例如5ul)(避免冻融病毒)。
使用qPCR确定DNA酶I-抗性GC粒子效价(参见分离方案)
[0899] 材料Amicon Ultra,0.5ml,100K;密理博公司;UFC510024
Amicon Ultra,15ml,100K;密理博公司;UFC910024
Benzonase核酸酶;西格玛-奥德里奇公司,E1014
HiTrap肝素柱体;西格玛-奥德里奇公司;54836
脱氧胆酸钠;西格玛-奥德里奇公司;D5670
[0900] AAV1上清液产生方案培养基:D10+HEPES
500ml瓶DMEM高葡萄糖+Glutamax(英杰公司)
50ml Hyclone FBS(热灭活的)(赛默飞世尔)
5.5ml HEPES溶液(1M,GIBCO)
细胞:低传代HEK293FT(产生病毒时传代<10次)
解冻新的传代2-4次的细胞用于产生病毒,生长直到2-5次传代
转染试剂:聚乙烯亚胺(PEI)“Max”
将50mg PEI“Max”溶解于50ml无菌的超纯H20中
将pH调节至7.1
用0.22um fliptop过滤器过滤
用封口膜将管和包裹物密封
在-20℃下将等分部分冷冻(用于存储,也可以立即使用)
细胞培养
在D10+HEPES中培养低传代HEK293FT每天传代1:2与1:2.5之间
有利地一定让细胞达到超过85%的汇合
对于T75
-温10ml HBSS(-Mg2+,-Ca2+,GIBCO)+1ml TrypLE Express(GIBCO)/烧瓶至37℃(水浴)
-完全地抽出培养基
-轻轻地添加10ml温HBSS(以完全洗掉培养基)
-添加1ml TrypLE/烧瓶
-将烧瓶在恒温箱(37℃)中放置1min
-摇动烧瓶以使细胞脱离开
-添加9ml D10+HEPES培养基(37℃)
-上下吸移5次,以产生单细胞悬浮液
-以1:2-1:2.5(对于T75,是12ml培养基)比例分离(如果细胞生长更缓慢,则丢弃并解冻新的批次,它们未处于最佳生长)
-当存在足够的细胞时即转移至T225中(对于易于处理大量的细胞)
AAV产生(单个15cm培养皿尺度)
将21.5ml培养基中的1千万个细胞铺进15cm培养皿中
在37℃下孵育18-22小时
在每个平板80%汇合处转染是理想的
预温的22ml培养基(D10+HEPES)
准备具有DNA混合物的管(使用无内毒素大量质粒提取DNA(endofree maxiprep 
DNA)):
5.2ug感兴趣的质粒载体
8.7ug AAV 1血清型质粒
10.4ug DF6质粒(腺病毒辅助基因)
涡旋至混合
添加434uL DMEM(无血清!)添加130ul PEI溶液
涡旋5-10秒
向预温的培养基添加DNA/DMEM/PEI混合物
简单地涡旋至混合
将15cm培养皿中的培养基替换为DNA/DMEM/PEI混合物
返回37℃恒温箱中
收获之前孵育48h(有利地进行监测,以保证培养基没有变得太酸)
[0901] 收获病毒:从15cm培养皿中除去上清液
用0.45um过滤器过滤(较低的蛋白质结合)等分并在-80℃下冷冻
转导(24孔格式中的原代神经元培养物,5DIV)
将有待转导的神经元的每个孔中的完全neurobasal培养基替换为新鲜的neurobasal
(通常替换每个孔中的500ul中的400ul)
在37℃水浴中解冻AAV上清液
在恒温箱中平衡30min
向每个孔中添加250ul AAV上清液
在37℃下孵育24h
移除培养基/上清液并替换为新鲜的完全neurobasal
48h后表达开始可见,感染后6-7天左右饱和
具有GOI的pAAV质粒的构建体不应该超过4.8kb(包括两个ITRS)。
[0902] 人类密码子优化序列(即针对在人类中的表达而优化的)序列的实例:下面提供了SaCas9:ACCGGTGCCACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGTATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGCCAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGAAGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTGAGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGAAGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTGGAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGGAAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTCAATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAGGCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAACCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGAGATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAACGCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGAAACTGGAATACTATGAGAAGTTCCAGATCATCGAAAACGTGTTTAAGCAGAAGAAAAAGCCTACACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACAAGCACTGGAAAACCAGAGTTCACCAATCTGAAAGTGTATCACGATATTAAGGACATCACAGCACGGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCAGAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATCGAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATCTGATTCTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATCTTTAACCGGCTGAAGCTGGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTCATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGCACAGAAGATGATCAATGAGATGCAGAAACGAAACCGGCAGACCAATGAACGCATTGAAGAGATTATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGCAGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATTCAACTACGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGACAATTCCTTTAACAACAAGGTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTAGTTCAGATTCCAAGATCTCTTACGAAACCTTTAAAAAGCACATTCTGAATCTGGCCAAAGGAAAGGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCCGTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGAATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGGGTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCACCATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGGACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGAAATCGAGACAGAACAGGAGTACAAGGAGATTTTCATCACTCCTCACCAGATCAAGCATATCAAGGATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATGACACCCTGTATAGTACAAGAAAAGACGATAAGGGGAATACCCTGATTGTGAACAATCTGAACGGACTGTACGACAAAGATAATGACAAGCTGAAAAAGCTGATCAACAAAAGTCCCGAGAAGCTGCTGATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACGAGAAGAACCCACTGTATAAGTACTATGAAGAGACTGGGAACTACCTGACCAAGTATAGCAAAAAGGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGACATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGATTCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAAAAAGGAGAACTACTATGAAGTGAATAGCAAGTGCTACGAAGAGGCTAAAAAGCTGAAAAAGATTAGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAACTGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACATCACTTACCGAGAGTATCTGGAAAACATGAATGATAAGCGCCCCCCTCGAATTATCAAAACAATTGCCTCTAAGACTCAGAGTATCAAAAAGTACTCAACCGACATTCTGGGAAACCTGTATGAGGTGAAGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCTAAGAATTC
实例30:使用Cas9切口酶和两种指导RNA最小化脱靶切割
[0903] Cas9是一种可以在20bp RNA指导的帮助下靶向基因组中的特定位置的RNA-指导的DNA核酸酶。然而,该指导序列可以容忍指导序列与DNA-靶序列之间的一些错配。当该指导RNA将Cas9靶向具有几个与该指导序列不同的碱基的脱靶序列时,归因于脱靶切割的可能性,该灵活性是不令人希望的。对于所有实验应用(基因靶向、作物工程、治疗应用等),重要的是能够改进Cas9介导的基因靶向的特异性并减少Cas9的脱靶修饰的可能性。
[0904] 申请人研发了一种使用与两种指导RNA组合的Cas9切口酶突变体以促进基因组中的靶向的双链断裂而无脱靶修饰的方法。可以通过使其切割活性无效而从Cas9核酸酶产生Cas9切口酶突变体,这样使得并非切割DNA双链体的两条链,仅仅切割一条链。可以通过在Cas9核酸酶的一个或多个结构域(例如Ruvc1或HNH)中诱导突变而产生Cas9切口酶。这些突变可以包括但不限于Cas9催化结构域中的突变,例如在SpCas9中,这些突变可以在位置D10或H840处。这些突变可以包括但不限于SpCas9中的D10A、E762A、H840A、N854A、N863A或D986A,但是可以通过在其他CRISPR酶或Cas9直向同源物中在对应的位置处诱导突变而产生切口酶。在本发明的一个最优选的实施例中,该Cas9切口酶突变体是一种具有D10A突变的SpCas9切口酶。
[0905] 这工作的方式是与Cas9切口酶组合的每个指导RNA都将诱导双螺旋DNA靶标的靶向的单链断裂。由于每个指导RNA切口一条链,所以最终结果是双链断裂。此方法消除脱靶突变的原因是因为非常不可能存在与两种指导序列都具有较高水平的相似性的脱靶位点(20bp+2bp(PAM)=22bp针对每个指导的特异性,并且两种指导意味着任何脱靶位点将不得不具有接近于44bp的同源序列)。尽管仍可能的是单独的指导可能具有脱靶,但是那些脱靶将仅仅是带切口的,这不可能会被诱变的NHEJ过程修复。因此,DNA双链切口的多元化提供了一种强有力的引入靶向的DNA双链断裂而无脱靶诱变效应的方式。
[0906] 申请人进行了以下实验,这些实验涉及用编码Cas9(D10A)切口酶的质粒以及一种或多种指导物的DNA表达盒共转染HEK293FT细胞。申请人使用Lipofectamine 2000转染了细胞,并且在转染后转染48或72小时收获了细胞。如在本文先前所描述的,使用SURVEYOR核酸酶测定检测双切口诱导的NHEJ(图33、34和35)。
[0907] 申请人进一步鉴定了涉及当与两种指导RNA结合时通过Cas9切口酶突变体的有效切割的参数,并且这些参数包括但不限于该5’突出端的长度。针对具有至少26个碱基对的5’突出端报道了有效的切割。在本发明的一个优选实施例中,5’突出端是至少30个碱基对并且更优选至少34个碱基对。长达200个碱基对的突出端对于切割而言可以是可接受的,然而少于100个碱基对的5’突出端是优选的并且少于50个碱基对的5’突出端是最优选的(图
36和37)。
实例31:通过RNA指导的CRISPR Cas9进行双切以用于增强的基因组编辑特异性
[0908] 靶基因组编辑技术已经使得宽范围的研究和医学应用成为可能。来自微生物CRISPR-Cas系统的Cas9核酸酶通过20nt指导序列而靶向特异性基因组座位,其可以耐受与该DNA靶标的某些错配并由此促进不希望的脱靶诱变。如在实例30中简要描述的,在此实例中申请人进一步描述了将Cas9切口酶突变体与配对的指导RNA相组合以引入靶向的双链断裂的途径。由于基因组中的单独切口以高保真性被修复,所以同时经由适当偏移指导RNA而形成切口对于双链断裂是必需的,并且所述切口形成有效地延伸了特异性识别的碱基的数目以用于靶标切割。申请人证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50-1,000倍,并且促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。因此这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。
[0909] 以精确且靶向的形式扰乱基因组的能力对于理解对生物学和疾病的遗传贡献是至关重要的。细胞系或动物模型的基因组工程化已经传统地通过随机诱变或低效基因靶向完成。为了促进基因组编辑,可编程的序列特异性DNA核酸酶技术已经使得能够高效地对内源基因组序列进行靶向修饰,特别是在已经证实遗传上难处理的物种中。来自微生物CRISPR(规律间隔成簇短回文重复)-Cas系统的RNA-指导的Cas9核酸酶是用于刺激真核细胞中靶向双链DNA断裂(DSB)的稳固且通用的工具,其中所得细胞修复机制-非同源末端连接(NHEJ)或同源定向修复(HDR)途径-可以用于诱导易错或限定的改变。
[0910] 来自化脓链球菌的Cas9核酸酶可以由嵌合单一指导RNA(sgRNA)引导至在5’-NGG原型间隔子邻近基序(PAM)前面的任何基因组座位。在sgRNA内的20-nt指导序列将Cas9经由沃森-克里克碱基配对引导至基因组靶标,并且可以容易地编程为靶向希望的基因组座位。Cas9特异性的最近研究已经证实,尽管该20-nt指导序列内的每个碱基都对总体特异性做出贡献,但是该指导RNA与其互补靶DNA序列之间的多个错配可以取决于错配的数量、位置和碱基一致性而被耐受,导致潜在的脱靶DSB和indel形成。这些不想要的突变可以潜在地限制Cas9针对需要高水平精度的基因组编辑应用的实用性,这些基因组编辑应用例如产生用于测试因果遗传变异的等基因细胞系或者基于体内和离体基因组编辑的疗法。
[0911] 为了改进Cas9介导的基因组编辑的特异性,申请人开发了新颖策略,即将Cas9的D10A突变体切口酶版本(Cas9n)与一对与靶位点的相对链互补的偏移sgRNA组合。一对Cas9切口酶使两条DNA链均形成切口,导致位点特异性DSB和NHEJ,而单独的切口主要由高保真碱基切除修复途经(BER)修复。配对核酸酶策略,其可涉及用于工程化一种系统以减轻脱靶活性的可能性,可以参考玛丽(Mali)等人,2013a题目为用于靶标特异性筛选的CAS9转录激活因子和用于协作基因组工程化的配对切口酶(CAS9transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering)的论文。以类似于二聚锌指核酸酶(ZFN)和转录激活因子样效应器核酸酶(TALEN)的方式,其中DNA切割需要两种引导FokI核酸酶单体的独立特异性编码的DNA结合分子的协同相互作用,该双切策略使得由每个单独Cas9n-sgRNA复合物造成的脱靶诱变最小化,同时保持了类似于野生型Cas9的那些的中靶修饰率。在此申请人定义了对于选择促进有效双切的sgRNA对而言至关重要的参数,比较了野生型Cas9和具有双切的Cas9n的特异性,并且证实了可以在细胞中以及在小鼠受精卵中使用双切来实现的各种各样的实验应用。
[0912] 指导序列的延伸未改进Cas9靶向特异性:Cas9靶向是由在sgRNA内的20-nt指导序列与靶DNA之间的碱基配对促进的。申请人推理,切割特异性可能通过增加指导RNA与其靶座位之间的碱基配对长度而得以改进。申请人得到U6驱动的表达三个具有20-nt(sgRNA 1)或30-nt指导序列(sgRNA 2和sgRNA 3)的sgRNA的表达盒,所述指导序列靶向人EMX1基因内的座位(图38A)。
[0913] 申请人和其他人已经在先前显示尽管在指导序列的PAM-远端区域与靶DNA之间的单一碱基错配被Cas9良好耐受,但在此区域中的多个错配可以显著影响中靶活性。为了确定另外的PAM-远端碱基(21-30)是否可以影响整体靶向特异性,申请人将sgRNA 2和sgRNA 3设计为包含10个另外的由10个完全匹配碱基或8个错配碱基(碱基21-28)组成的碱基。出人意料地,申请人观察到在HEK 293FT细胞中这些延伸的sgRNA在靶座位处介导相似水平的修饰,而不论这些另外的碱基是否与基因组靶标互补(图38B)。随后的Northern印记揭示了sgRNA 2和sgRNA 3两者中的大多数被处理为与sgRNA 1相同的长度,包含相同的20-nt指导序列而没有另外碱基(图38C)。
[0914] Cas9切口酶与配对的偏移指导RNA产生高效的NHEJ:在指导序列的延伸未能改进Cas9靶向特异性的情况下,申请人寻求用于增加在指导序列与其DNA靶标之间的整体碱基配对长度的替代策略。Cas9酶包含两个保守核酸酶结构域:HNH和RuvC,它们分别切割与指导RNA互补和非互补的DNA链。催化残基的突变(在RuvC中的D10A和在HNH中的H840A)将Cas9转变为DNA切口酶。单链切口优先通过高保真RER途径来修复,申请人推理,由一对靶向靶座位的相对链的sgRNA引导的两个Cas9切口酶可以介导DSB,同时使得脱靶活性最小化(图39A)。
[0915] 多种因素可以影响导致indel形成的协作切口形成,这些因素包括在两个邻近Cas9分子之间或两个Cas9-sgRNA复合物之间的位阻、突出端类型、以及序列背景;这些中的一些可以通过测试具有不同的靶序列以及偏移的多个sgRNA对(给定sgRNA对的指导序列的PAM-远(5’)端之间的距离)来表征。为了系统地评估sgRNA偏移可能如何影响随后的修复和indel的产生,申请人首先设计了靶向人EMX1基因组座位的以一个范围的偏移距离(从大约-200至200bp)分开的多组sgRNA对,以产生5’-和3’-突出端产物两者(图39A,图44)。申请人然后评估了在D10A Cas9突变体(称为Cas9n;H840A Cas9突变体称为Cas9H840A)的情况下每个sgRNA对在人HEK 293FT细胞中产生indel的能力。对于具有从-4至20bp的偏移的sgRNA对而言,观察到稳固的NHEJ(高达40%),在偏移高达100-bp的对中具有适度的indel形成(图39B,左图)。申请人随后通过测试在两个其他基因组座位DYRK1A和GRIN2B处的相似地偏移的sgRNA对概括了这些发现(图39B,右图)。明显的是,跨所有三种检查的座位,只有产生在这些指导序列(大于-8bp的偏移)之间具有小于8bp重叠的5’突出端的sgRNA对才能介导可检测的indel形成(图39C)。重要的是,当与野生型Cas9配对时(图44),在这些分析中使用的每个指导物对于有效诱导indel是重要的,表明这些指导对的相对位置在预测双切割活性中是最重要的参数。
[0916] 由于Cas9n和Cas9H840A切割DNA的相对链,对于一个给定的sgRNA对而言,用Cas9H840A取代Cas9n会导致该突出端类型的倒转。例如,将产生具有Cas9n的5’突出端的一对sgRNA原则上会相反地产生相应的3’突出端。因此,导致具有Cas9n的3’突出端产生的sgRNA对可以与Cas9H840A一起使用,以产生一个5’突出端。出人意料地,申请人利用被设计为产生5’和3’突出端两者(偏移范围从-278到+58bp)的一组sgRNA对测试了Cas9H840A,但是不能观察indel形成。可能需要进一步的工作来鉴定用于sgRNA配对的必要的设计规则,以允许经由Cas9H840A进行双切割。
[0917] 双切介导高效基因组编辑,具有改进的特异性:已经确立了双切(DN)介导高效NHEJ,其水平与野生型Cas9诱导的那些可比,申请人接着通过测量DN的脱靶活性研究DN是否具有与野生型Cas9相比的改进的特异性。申请人共递送Cas9n与sgRNA 1和sgRNA 9(以+23bp偏移隔开),以靶向HEK 293FT细胞中的人EMX1座位(图40A)。该DN构型产生了与由野生型Cas9(与每个单独sgRNA配对)产生的那些相似的中靶indel水平(图40B,左图)。引人注目地,不像野生型Cas9,DN在先前通过SURVEYOR测定(图40B,右图)验证的sgRNA 1脱靶位点OT-4处不产生可检测修饰,表明DN可以潜在地降低脱靶修饰的可能性。
[0918] 使用深度测序以评估在5个不同sgRNA 1脱靶座位处的修饰(图40A),申请人在野生型Cas9+sgRNA 1的情况下在所有位点处观察到显著诱变(图40C)。相比之下,由Cas9n在测试的5个脱靶位点进行的切割是几乎不能超出背景测序误差而被检测到的。使用中靶和脱靶修饰水平的比率作为特异性的度量,申请人发现相对于野生型Cas9和sgRNA的一种,Cas9n与一对sgRNA能够实现高100多倍的特异性(图40D)。申请人通过对靶向VEGFA座位的两个sgRNA对(+16和+20bp的偏移)进行深度测序而进行了另外的脱靶分析,具有相似的结果(图40E)。在这些脱靶座位(表4)处的DN能够实现与野生型Cas9相比高200倍至超过1500倍的特异性(图40F,图44)。综上,这些结果证实Cas9介导的双切使脱靶诱变最小化,并且适用于以提高的特异性进行基因组编辑。
[0919] 双切促进高效同源定向修复、NHEJ介导的DNA插入、以及基因组微小缺失:DSB可以刺激同源定向修复(HDR)以使得能够对基因组靶位点进行高度精确的编辑。为了评价DN诱导的HDR,申请人用分别偏移-3和+18bp的多对sgRNA靶向人EMX1座位(产生31-和52-bp 5’突出端),并且引入带有HindIII限制酶切位点的单链寡脱氧核苷酸(ssODN)作为HDR修复模板(图41A)。每个DN sgRNA对以高于单一指导Cas9n切口酶的频率的且与野生型Cas9的频率相当的频率成功地诱导HDR(图41B)。另外,在真核干细胞或源自患者的诱导性多能干细胞中的基因组编辑代表了用于产生并研究新疾病范例以及开发新疗法的关键机遇。由于在人类胚胎干细胞(hESC)中诱导HDR的单一切口途径已经获得有限的成功,所以申请人尝试在HUES62hES细胞系中进行DN并且观察到成功的HDR(图41C)。
[0920] 为了进一步表征偏移sgRNA间隔如何影响HDR的效率,申请人接着在HEK 293FT细胞中对一组sgRNA对进行了测试,其中至少一个sgRNA的切割位点位于靠近重组位点处(与HDR ssODN供体模板臂重叠)。申请人观察到产生5’突出端并且使得至少一个切口出现于同源臂的22bp内的sgRNA对能够诱导HDR,该HDR的水平与野生型Cas9介导的HDR水平相当且其水平显著高于单一Cas9n-sgRNA切口形成的HDR水平。相比之下,在采用产生3’-突出端或对相同DNA链进行双切的sgRNA对的情况下,申请人未观察到HDR(图41D)。
[0921] 用以产生定义的突出端的能力可以使得能够经由NHEJ介导的连接而精确插入包含相容突出端的供体修复模板。为了探索用于转基因插入的该替代策略,申请人采用Cas9n和被设计为在终止密码子附近产生43bp 5’-突出端的sgRNA对靶向EMX1座位,并且提供具有匹配突出端的双链寡核苷酸(dsODN)双链体(图42A)。包含多个表位标签和限制酶切位点的退火的dsODN插入物被成功地以3%(1/37,这是通过对克隆的复制子进行桑格测序筛选)的频率整合到靶标中。因此,这种基于连接的策略展示了用于将编码短修饰物(如蛋白质标签)或重组位点的dsODN插入内源座位中的有效途径。
[0922] 另外,在HEK 293FT细胞中,申请人将sgRNA对的组合(每个组合4个sgRNA)靶向到DYRK1A座位上以协助基因组微小缺失。申请人产生一组sgRNA以介导0.5kb、1kb、2kb、和6kb缺失(图42B,图45:sgRNA 32、sgRNA 33、sgRNA 54-61)并且经由对预测的缺失大小进行PCR筛选跨这些范围而验证了成功的多元切口形成介导的缺失。
[0923] 双切使得能够在小鼠受精卵中进行高效基因组修饰:新近工作证实了共递送野生型Cas9mRNA连同多个sgRNA可以介导单步产生携带多个等位基因修饰的转基因小鼠。考虑到曾经使用一些sgRNA实现体内基因组修饰的能力,申请人力求评估在小鼠受精卵中由Cas9n造成的多个切口形成的效率。将野生型Cas9或Cas9n mRNA和sgRNA胞质共注射进单细胞小鼠受精卵中允许成功地靶向Mecp2座位(图43A)。为了鉴别Cas9n mRNA和sgRNA用于高效基因靶向的最佳浓度,申请人滴定了Cas9mRNA(从100ng/uL至3ng/uL),同时保持了在1:20的Cas9:sgRNA摩尔比率的sgRNA水平。所有针对Cas9双切而测试的浓度介导在筛选的至少80%的胚胎中的修饰,与野生型Cas9实现的水平相似(图43B)。综上,这些结果表明了基于双切的基因组编辑的多种应用。
[0924] 讨论:考虑到基因组修饰的永久性质,特异性对于灵敏性应用是非常重要的,例如旨在将特定基因变体与生物学过程或疾病表型和基因疗法相关联起来的研究。申请人已经探索了用以改进Cas9的靶向特异性的策略。虽然简单地延伸sgRNA的指导序列长度并未改进靶向特异性,但将两个适当偏移的sgRNA与Cas9n相组合有效地产生了indel,同时使得不想要的切割最小化,因为单独的脱靶单链切口经由碱基切除修复高保真地被修复。在先前已经针对人类细胞中的Cas9核酸酶报道了显著的脱靶诱变的情况下,该DN途径可以为快速且准确的基因组编辑提供可推广的解决方案。控制成功的Cas9双切口酶介导的基因靶向的间隔参数的表征揭示了超过100-bp长的有效的偏移窗,从而在sgRNA对的选择中允许高度的灵活性。先前的计算机分析已经揭示,基于5’-NGG PAM在人类基因组中对于化脓链球菌Cas9每12-bp的平均靶向范围,这表明适当的sgRNA对应当能够针对基因组内的大多数座位易于鉴别。另外,申请人已经证明DN介导的indel频率在人类和小鼠细胞两者中在多个基因和座位处可与野生型Cas9修饰的频率相比,从而证实了这个策略针对高精度基因组工程的可再现性(图44)。
[0925] Cas9双切途径基本上类似于基于ZFN和TALEN的基因组编辑系统,其中需要在两个半-核酸酶结构域之间的协作以实现在靶位点处的双链断裂。ZFN和TALEN系统的系统研究已经揭示了给定的ZFN和TALEN对的靶向特异性可以高度依赖于核酸酶构造(同二聚体或异二聚体核酸酶)或靶序列,并且在一些情况下TALEN可以是高度特异性的。虽然已经显示野生型Cas9系统展示高水平的脱靶诱变,但DN系统是有希望的解决方案,并且使RNA指导的基因组编辑达到与ZFN和TALEN相似的特异性水平。
[0926] 另外,Cas9可以靶向的容易性和效率使得DN系统成为尤其有吸引力的。然而,使用DN进行的DNA靶向将可能面临与ZFN和TALEN相似的脱靶挑战,其中在脱靶位点处的协作切口形成可能依然发生,尽管具有显著降低的可能性。考虑到Cas9特异性和sgRNA突变分析的广泛表征以及在此研究中鉴别的NHEJ-介导sgRNA偏移范围,计算机途径可以用于针对给定的一对sgRNA评价可能的脱靶位点。为了协助sgRNA对选择,申请人开发了在线网络工具,其鉴别具有用于双切应用的最佳间隔的sgRNA组合(可在网址genome-engineering.org获得)。
[0927] 虽然先前已经显示Cas9n协助在中靶位点处的HDR,其效率大幅低于野生型Cas9的效率。通过比较,双切策略保持了高的中靶效率,同时将脱靶修饰降低至背景水平。虽然如此,对DN脱靶活性的进一步表征(特别是经由使用DN途径产生的细胞或整个生物的全基因组测序和靶向深度测序)可以是评价Cas9n DN在需要超高精度基因组编辑的生物技术应用或临床应用中的实用性所需要的。另外,已经显示Cas9n在某些sgRNA的中靶位点处诱导低水平的indel,如在玛丽(Mali)等人的题目为“用于靶标特异性筛选的CAS9转录激活因子和用于协作基因组工程化的配对切口酶(CAS9transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering)”(2013)论文中指示的,这可以是由于残余的双链断裂活性并且通过对Cas9催化活性的进一步的结构-功能研究来避免。总体上,Cas9n介导的多元切口形成充当用于高度精确且高效的靶向基因组工程的可定制平台,并且有望在生物技术、基础科学以及医学中扩大应用范围。
[0928] 实验程序
[0929] 细胞培养和转染:在37℃下,伴随5%CO2孵育,将人类胚肾(HEK)细胞系293FT(生命技术公司)或小鼠Neuro 2a(西格玛-奥德里奇公司)细胞系维持在补充有10%胎牛血清(海可隆公司(HyClone))、2mM GlutaMAX(生命技术公司)、100U/mL青霉素及100μg/mL链霉素的杜尔贝科改良伊格尔培养基(Dulbecco’s modified Eagle’s Medium)(DMEM)中。
[0930] 将细胞以120,000个细胞/孔的密度在转染之前24小时接种到24-孔板(康宁(Corning))上。遵循制造商推荐的方案,使用Lipofectamine 2000(生命技术公司)在80%-
90%汇合率时转染细胞。将总共500ng Cas9质粒以及100ng U6-sgRNA PCR产物进行转染。
[0931] 将人类胚胎干细胞系HUES62(哈佛干细胞研究所中心(Harvard Stem Cell Institute core))维持在补充有100ug/ml Normocin(InvivoGen)的mTesR培养基(干细胞技术(Stemcell Technologies))中的GelTrex(生命技术公司)上的无进料器的条件中。遵循制造商方案用Amaxa P3原代细胞4-D核转染仪试剂盒(龙沙公司(Lonza))转染HUES62细胞。
[0932] 用于基因组修饰的SURVEYOR核酸酶测定:将293FT和HUES62细胞用DNA进行转染,如上所述。转染后,在基因组DNA提取之前,将细胞在37℃下孵育72小时。遵循制造商的方案,使用QuickExtract DNA提取溶液(Epicentre)提取基因组DNA。简言之,将沉淀的细胞重悬于QuickExtract溶液中并在65℃下孵育15分钟,68℃下孵育15分钟,并且在98℃下孵育10分钟。
[0933] 对于每个基因而言,将在CRISPR靶位点侧翼的基因组区域进行PCR扩增(表2),并且遵循制造商的方案,使用QiaQuick Spin柱(凯杰公司)纯化产物。将总共400ng的纯化的PCR产物与2μl 10X Taq DNA聚合酶PCR缓冲液(Enzymatics公司)和超纯水混合,至终体积为20μl,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-2℃/s从95℃降至85℃,以-0.25℃/s从85℃降至25℃,并且在25℃保持1分钟。重退火后,遵循制造商推荐的方案,将产物用SURVEYOR核酸酶和SURVEYOR增强子S(转基因组学公司
(Transgenomics))处理,并且在4%-20%Novex TBE聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用SYBR Gold DNA染色剂(生命技术公司)染色30分钟并用Gel Doc凝胶成像系统(伯乐公司)成像。基于相对条带强度进行量化。通过式100x(1-(1-(b+c)/(a+b+c))1/
2)确定Indel百分比,其中a是未消化的PCR产物的积分强度,而b和c是每个切割产物的积分强度。
[0934] 人细胞中的tracrRNA表达的Northern印迹分析如先前在丛(Cong)等人2013年中所述的进行Northern印迹。简言之,将RNA使用mirPremier微RNA分离试剂盒(西格玛)进行提取,并且加热至95℃持续5min,之后加载在8%变性聚丙烯酰胺凝胶上(SequaGel,国家诊断公司(National Diagnostics))。之后,将RNA转移至一种预杂交的Hybond N+膜(通用电气医疗公司(GE Healthcare))并且与Stratagene UV交联剂(Stratagene)交联。将探针用具有T4多核苷酸激酶(新英格兰生物实验室(New England Biolabs)))的[γ-32P]ATP(珀金埃尔默公司)标记。在洗涤后,将膜暴露于荧光屏一小时并且用感光成像仪(Typhoon)扫描。
[0935] 深度测序以评估靶向特异性:在基因组DNA提取之前72小时,将HEK 293FT细胞如上所述的进行铺板和转染。通过融合PCR方法针对每个基因的在CRISPR靶位点侧翼的基因组区域进行扩增(引物序列参见表3)以将亿明达P5适配子连同独特的样品特异性条形码附接至该靶标。遵循制造商建议的方案,将PCR产物使用EconoSpin96孔滤板(时代生命科学公司)纯化。
[0936] 将带条形码并纯化的DNA样品通过Qubit 2.0荧光计(生命技术公司)定量并且以等摩尔比率池化。然后用亿明达MiSeq个人测序仪(生命技术公司)对测序文库进行测序。
[0937] 测序数据分析,indel检测和同源重组检测:将MiSeq读数通过至少30的平均Phred质量(Q得分)连同与条形码以及扩增子正向引物匹配的完美序列过滤。如在Python difflib模块中所实施的,通过针对包括靶位点的上游和下游30个核苷酸的座位序列(总共
80bp)进行拉特克利夫-欧博谢尔普(Ratcliff-Obershelp)字符串比较来分析来自中靶和脱靶座位的读数。解析所得编辑操作,并且如果发现插入或缺失操作,则将读数计数为indel。如果其比对的部分落到MiSeq读数本身外或如果多于5个碱基未被调用,则所分析的靶区被舍弃。
[0938] 针对每个样品的阴性对照提供了将indel的包含或排除作为假定的切割事件的一个量规。对于同源重组的定量,首先将读数在indel检测工作流中处理,并且然后检查同源重组模板CCAGGCTTGG的存在。
[0939] 微注射入小鼠受精卵中:将Cas9mRNA和sgRNA模板用T7启动子序列缀合的引物来扩增。在凝胶纯化后,将Cas9和Cas9n用mMESSAGE mMACHINE T7Ultra试剂盒(生命技术公司)进行转录。将sgRNA用MEGAshortscript T7试剂盒(生命技术公司)进行转录。将RNA通过MEGAclear试剂盒(生命技术公司)进行纯化并且冷冻在-80℃。
[0940] 通过注射7.5I.U.的PMSG(哈伯(Harbor),UCLA)和hCG(密理博),从8周龄超数排卵的BDF1雌性收集MII-阶段的卵母细胞。将它们转移至补充有10mg/ml牛血清白蛋白(BSA;西格玛-奥德里奇)的HTF培养基中,并且用从成年C57BL/6雄性小鼠的尾附睾获得的获能精子授精。在受精后六个小时,使用压电冲击驱动的显微操作器(普里梅技术有限公司(Prime Tech Ltd.),茨城,日本)将在M2培养基(密理博)中的mRNA和sgRNA注射进受精卵。Cas9mRNA和Cas9n mRNA以及sgRNA的浓度描述于文本和图6B中。在显微注射之后,将受精卵培养在37℃的5%CO2和95%空气的润湿气氛中的KSOM(密理博)中。
[0941] 从囊胚胚胎进行基因组提取:在体外培养胚胎持续6天后,将扩展的囊胚用在PBS中的0.01%BSA进行洗涤,并且单独地收集到0.2mL管中。添加五微升的基因组提取溶液(50mM Tris-HCl,pH 8.0,0.5%曲通-X100,1mg/ml蛋白酶K),并且将样品孵育在65℃持续3小时,随后孵育在95℃持续10min。然后将样品进行扩增以用于如上所述的靶向深度测序。表2|用于SURVEYOR测定的引物。与实验程序相关。
表3|用于产生扩增子以用于下一代测序的引物。与实验程序相关。
表4|VEGFA脱靶位点序列。与实验程序相关。
sgRNA 脱靶位点 脱靶序列(5’至3’)
96. OT-96.1 GGATGGAGGGAGTTTGCTCCTGG
98. OT-98.1 CGCCCTCCCCACCCCGCCTCCGG
98. OT-98.2 TACCCCCCACACCCCGCCTCTGG
98. OT-98.3 GGGCCCCTCCACCCCGCCTCTGG
98. OT-98.4 CTACCCCTCCACCCCGCCTCCGG
表5|用于筛选多元切口形成诱导的EMX1座位中的微小缺失的引物与实验程序相关。
所有序列均处于5’至3’方向。对于U6转录,加下划线的一串T充当转录终止子。
>sgRNA,包含+85tracrRNA(化脓链球菌SF370)
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgta
aacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacacc gttttagagctagaaa
TTTTTTT
(指导序列是大写字母“N”的粗体段,并且tracrRNA片段是粗体序列,之后是加下划线的T串)
>3xFLAG-NLS-SpCas9-NLS
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAGCGTCCTGCTGCTACTAAGAAAGCTGGTCAAGCTAAGAAAAAGAAA
>3xFLAG-NLS-SpCas9n-NLS(D10A切口酶突变是粗体高亮的)
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTG
ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAGCGTCCTGCTGCTACTAAGAAAGCTGGTCAAGCTAAGAAAAAGAAA
T7-SpCas9-NLS(T7启动子加有下划线)
GCCACCGGTTAATACGACTCACTATAGGGCCACCATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACC
T7-SpCas9n-NLS(D10A核酸酶突变是粗体高亮的;T7启动子加有下划线)
GCCACCGGTTAATACGACTCACTATAGGGCCACCATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTG ATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAACC
>dsODN连接插入物fwd
AGCAGGCCAATGGGGAGGACATCGATGTCACCTCCAATGACTAcTACCCATACGATGTTCCAGATTACGCTATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGaagcttgaaATGGCATCAATGCAGAAGCTGATCTCAGAGGAGGACCTGtaa
>dsODN连接插入物rev
TAGTCATTGGAGGTGACATCGATGTCCTCCCCATTGGCCTGCTTTACAGGTCCTCCTCTGAGATCAGCTTCTGCATTGATGCCATTTCAAGCTTCTTATCGTCATCGTCTTTGTAATCAATATCATGATCCTTGTAGTCTCCGTCGTGGTCCTTATAGTCCATAGCGTAATCTGGAACATCGTATGGGTAG
实例32:通过RNA指导的CRISPR Cas9进行双切的进一步表征
[0942] 双切特异性:当多个指导RNA(sgRNA)靶向靶DNA时,用于Cas9多元切口形成的靶向间隔可以通过采用Cas9PAM识别的严格性的放松来增加。申请人已经在实例31(兰(Ran)等人,通过RNA指导的CRISPR Cas9进行双切以用于增强的基因组编辑特异性(Double nicking by RNA-guided CRISPR Cas9for enhanced genome editing specificity),《细胞》(Cell),2013年9月12日;154(6):1380-9)中证实了两个适当偏移的sgRNA可以在特定的‘sgRNA偏移’参数内被靶向以产生indel。申请人证实了当偏移sgRNA被非NGG PAM(特别是NGN和NNG)靶向时可以形成高效的indel。显现出Cas9可以潜在地耐受转变的PAM或在第二或第三个PAM碱基位置处仅具有一个G核苷酸的PAM。
[0943] 用于双切的Cas9诱变:申请人测试了Cas9切口酶突变体当仅被一个sgRNA靶向时产生indel的能力。单链DNA断裂是通过高保真非NHEJ修复途径修复的。然而,其他团体做的工作可以表明Cas9(D10A)切口酶和一个sgRNA造成显著诱变(玛丽(Mali)等人,《科学》(Science)2013)。申请人在存在于化脓链球菌Cas9内的两个另外的(一共3个)RuvC催化结构域中产生突变,制成了Cas93KO[Cas9(D10A、E762A、和D986A)],并且对其针对AAVS1座位进行测试(sgRNA指导序列:ggggccactagggacaggat)。申请人发现与D10A切口酶突变体相比,Cas93KO造成更低的indel诱变(参见下表,其中数据是3个生物重复的平均值)。
[0944] 对小鼠胚胎的特定编辑:申请人滴定了在小鼠受精卵中的Cas9剂量(从10ng/uL至0.01ng/uL),并且确定了用于通过双切进行特定Cas9编辑的最佳剂量。在10ng/uL情况下,申请人证实用野生型Cas9时88%的编辑率,并且通过D10A双切时83%的编辑率。在10ng/uL下D10A+L sgRNA展现0%的indel,而在1、0.1和0.01ng/uL的情况下wt Cas9没有展现indel。
[0945] 对于该实例的这些关于细胞培养和转染方案以及SURVEYOR核酸酶测定基因组修饰的实验细节进一步描述于实例31中。
[0946] 虽然已经在此示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不偏离本发明的情况下众多变化、改变和取代现在将被本领域的普通技术人员想到。应该理解的是,在实践本发明中可以采用在此描述的本发明的实施例的不同替代方案。参考文献
1.丁(Ding),Q.等人,一种用于产生人类干细胞基的疾病模型的TALEN基因组编辑系统(A TALEN genome-editing system for generating human stem cell-based disease models)《. 细胞-干细胞》(Cell Stem Cell)12,238-251(2013)。
2.索德奈尔(Soldner),F.等人,产生在两个早期发作的帕金森蛋白点突变处排他地相异的同基因多能干细胞(Generation of isogenic pluripotent stem cells differing exclusively at two early onset Parkinson point mutations)《. 细胞》(Cell)146,
318-331(2011)。
3.卡尔松(Carlson),D.F.等人,家畜中的有效的TALEN介导的基因敲除(Efficient TALEN-mediated gene knockout in livestock)《. 美国国家科学院院刊》(Proc Natl Acad Sci U S A)109,17382-17387(2012)。
4.格尤特思(Geurts),A.M.等人,经由胚胎微注射锌指核酸酶敲除大鼠(Knockout 
Rats via Embryo Microinjection of Zinc-Finger Nucleases)《. 科学》(Science)325,
433-433(2009)。
5.高须(Takasu),Y.等人,使用锌指核酸酶mRNA注射靶向诱变家蚕(Targeted 
mutagenesis in the silkworm Bombyx mori using zinc finger nuclease mRNA 
injection)《.昆虫生物化学与分子生物学》(Insect Biochem Molec)40,759-765(2010)。
6.渡边(Watanabe),T.等人,使用锌指和TAL效应器核酸酶在半变态昆虫中进行非转基因基因组修饰(Non-transgenic genome modifications in a hemimetabolous insect using zinc-finger and TAL effector nucleases)《.自然通讯》(Nat Commun)3(2012)。
7.波蒂厄斯(Porteus),M.H.&巴尔的摩(Baltimore),D.,嵌合的核酸酶刺激人类细胞中的基因靶向(Chimeric nucleases stimulate gene targeting in human cells)《. 科学》(Science)300,763(2003)。
8.米勒(Miller),J.C.等人,用于高度特异的基因组编辑的改进的锌指核酸酶构造(An improved zinc-finger nuclease architecture for highly specific genome 
editing)《.自然生物技术》(Nat Biotechnol)25,778-785(2007)。
9.桑德尔(Sander),J.D.等人,通过情境依赖性组装的无选择性锌指核酸酶工程
(CoDA)(Selection-free zinc-finger-nuclease engineering by context-dependent assembly(CoDA))《.自然方法》(Nat Methods)8,67-69(2011)。
10.伍德(Wood),A.J.等人,使用ZFN和TALEN跨物种进行靶向的基因组编辑(Targeted genome editing across species using ZFNs and TALENs)《. 科学》(Science)333,307(2011)。
11.克里斯汀(Christian),M.等人,用TAL效应器核酸酶靶向DNA双链断裂(Targeting DNA double-strand breaks with TAL effector nucleases)《. 遗传学》(Genetics)186,
757-761(2010)。
12.张(Zhang),F.等人,有效构建用于调控哺乳动物转录的序列特异的TAL效应器
(Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription)《.自然生物技术》(Nat Biotechnol)29,149-153(2011)。
13.米勒(Miller),J.C.等人,用用于有效基因组编辑的TALE核酸酶构造(A TALE 
nuclease architecture for efficient genome editing)《. 自然生物技术》(Nat Biotechnol)29,143-148(2011)。
14.雷荣(Reyon),D.等人,用于高通量基因组编辑的TALEN的FLASH组装(FLASH 
assembly of TALENs for high-throughput genome editing)《. 自然生物技术》(Nat Biotechnol)30,460-465(2012)。
15.博赫(Boch),J.等人,打破TAL-III型效应器的DNA结合特异性的密码(Breaking the code of DNA binding specificity of TAL-type III effectors).《科学》
(Science)326,1509-1512(2009)。
16.莫斯科(Moscou),M.J.&保达诺夫(Bogdanove),A.J.,简单的密码管理由TAL效应器进行的DNA识别(A simple cipher governs DNA recognition by TAL effectors)《. 科学》(Science)326,1501(2009)。
17.萨亚纳(Sanjana),N.E.等人,用于基因组工程的转录激活因子样效应器工具箱(A transcription activator-like effector toolbox for genome engineering)《.自然-实验手册》(Nat Protoc)7,171-192(2012)。
18.德沃(Deveau),H.、加尔诺(Garneau),J.E.&莫万诺(Moineau),S.,CRISPR-Cas系统及其在噬菌体-细菌相互作用中的角色(CRISPR-Cas system and its role in phage-bacteria interactions).微生物学年鉴(Annu Rev Microbiol)64,475-493(2010)。
19.霍瓦特(Horvath),P.&巴尔朗勾(Barrangou),R.,CRISPR-Cas,细菌和古细菌的免疫系统(CRISPR-Cas,the immune system of bacteria and archaea)《. 科学》(Science)
327,167-170(2010)。
20.马卡洛夫(Makarova),K.S.等人,CRISPR-Cas系统的进化与分类(Evolution and classification of the CRISPR-Cas systems)《. 自然微生物学综述》(Nat Rev 
Microbiol)9,467-477(2011)。
21.布哈雅(Bhaya),D.、戴维森(Davison),M.&巴郎镐(Barrangou),R.,细菌和古细菌中的CRISPR-Cas系统:用于获得性防御和调节的通用小RNA(CRISPR-Cas systems in bacteria and archaea:versatile small RNAs for adaptive defense and 
regulation)《. 遗传学年评》(Annu Rev Genet)45,273-297(2011)。
22.丛(Cong),L.等人,使用CRISPR-Cas系统进行的多元基因组工程化(Multiplex 
genome engineering using CRISPR/Cas systems).《科学》(Science)339,819-823(2013)。
23.玛丽,P.等人,经由Cas9进行RNA-指导的人类基因组工程化(RNA-guided human genome engineering via Cas9)《. 科学》(Science)339,823-826(2013b)。
24.季聂克(Jinek),M.等人,人类细胞中的RNA编程的基因组编辑(RNA-programmed genome editing in human cells).eLife 2,e00471(2013)。
25.丘(Cho),S.W.、吉姆(Kim),S.、吉姆(Kim),J.M.&吉姆(Kim),J.S.,在人细胞中用Cas9RNA-指导的核酸内切酶进行的靶标基因组工程化(Targetedgenome engineering in human cells with the Cas9RNA-guided endonuclease).《自然生物技术》(Nat 
Biotechnol)31,230-232(2013)。
26.加尔诺(Garneau),J.E.等人,CRISPR-Cas细菌免疫系统切割噬菌体和质粒DNA(The CRISPR-Cas bacterial immune system cleaves bacteriophage and plasmid DNA)《.自然》(Nature)468,67-71(2010)。
27.季聂克(Jinek),M.等人,在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶(A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity)《. 科学》(Science)337,816-821(2012)。
28.加斯诺斯(Gasiunas),G.、巴郎镐(Barrangou),R.、霍瓦特(Horvath),P.&西克斯尼斯(Siksnys),V.,Cas9-crRNA核糖核蛋白复合体在细菌中针对获得性免疫介导特异的DNA切割(Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria)《.美国国家科学院院刊》(Proc Natl Acad Sci U S A)
109,E2579-2586(2012)。
29.乌尔诺夫(Urnov),F.D.、雷巴尔(Rebar),E.J.、福尔摩斯(Holmes),M.C.、张(Zhang),H.S.&格雷戈里,P.D.(Gregory,P.D.),用工程化的锌指核酸酶进行的基因组编辑(Genome editing with engineered zinc finger nucleases)《. 遗传学自然评论》(Nat Rev Genet)11,636-646(2010)。
30.徐(Hsu),P.D.&张(Zhang),F.,使用靶向的基因组工程技术剖分神经功能
(Dissecting neural function using targeted genome engineering technologies).《ACS化学神经科学》(ACS Chem Neurosci)3,603-610(2012)。
31.佩雷斯(Perez),E.E.等人,使用锌指核酸酶通过基因组编辑在CD4(+)T细胞中建立HIV-1抗性(Establishment of HIV-1resistance in CD4(+)T cells by genome editing using zinc-finger nucleases)《.自然生物技术》(Nat Biotechnol)26,808-816(2008)。
32.丛(Cong),L.等人,使用CRISPR-Cas系统进行的多元基因组工程化(Multiplex 
Genome Engineering Using CRISPR-Cas Systemss)《. 科学》(Science)339,819-823(2013)。
33.陈(Chen),F.Q.等人,使用ssDNA寡核苷酸用锌指核酸酶进行高效基因组编辑
(High-frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases)《.自然方法》(Nat Methods)8,753-U796(2011)。
34.比德尔(Bedell)、V.M.等人,使用高效率TALEN系统进行体内基因组编辑(In vivo genome editing using a high-efficiency TALEN system)《. 自然》(Nature)491,114-U133(2012)。
35.萨利赫-德哈利(Saleh-Gohari),N.&荷雷德(Helleday),T.,保守同源重组优先修复人类细胞中的处于细胞周期的S期的DNA双链断裂(Conservative homologous 
recombination preferentially repairs DNA double-strand breaks in the S phase of the cell cycle in human cells)《. 核酸研究》(Nucleic Acids Res)32,3683-3688(2004)。
36.戴尔特彻瓦(Deltcheva),E.等人,通过反式编码的小RNA和宿主因子RNA酶III进行的CRISPR RNA成熟(CRISPR RNAmaturation by trans-encoded small RNA and host factor RNase III)《.自然》(Nature)471,602-607(2011)。
37.萨普拉诺斯卡斯(Sapranauskas),R.等人,嗜热链球菌CRISPR-Cas系统在大肠杆菌中提供免疫力(The Streptococcus thermophilus CRISPR-Cas system provides 
immunity in Escherichia coli).《核酸研究》(Nucleic Acids Res)39,9275-9282(2011)。
38.黄(Hwang),W.Y.等人,使用CRISPR-Cas系统在斑马鱼中进行有效的基因组编辑
(Efficient genome editing in zebrafish using a CRISPR-Cas system)《.自然生物技术》(Nat Biotechnol)31,227-229(2013)。
39.王(Wang),H.等人,在通过CRISPR-Cas介导的基因组工程一步产生携带多个基因突变的小鼠(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR-Cas-Mediated Genome Engineering)《. 细胞》(Cell)153,910-918(2013)。
40.沈(Shen),B.等人,经由Cas9/RNA介导的基因靶向产生基因修饰的小鼠
(Generation of gene-modified mice via Cas9/RNA-mediated gene targeting)《. 细胞研究》(Cell Res)23,720-723(2013)。
41.齐(Qi),L.S.等人,改变CRISPR作为RNA-指导的平台以用于基因表达的序列特异性控制《. 细胞》(Cell)152,1173-1183(2013)。
42.杜施(Tuschl),T.,扩展小RNA干扰(Expanding small RNA interference)《.自然生物技术》(Nat Biotechnol)20,446-448(2002)。
43.斯米蒂斯(Smithies),O.、格雷格(Gregg),R.G.、博格斯(Boggs),S.S.、科拉雷斯基(Koralewski),M.A.&库切尔拉帕提(Kucherlapati),R.S.,提供同源重组将DNA序列插入人类染色体β-珠蛋白座位中(Insertion of DNA sequences into the human chromosomal beta-globin locus by homologous recombination)《. 自然》(Nature)317,230-234(1985)。
44.托马斯(Thomas),K.R.、福尔杰(Folger),K.R.&卡佩基(Capecchi),M.R.,将基因高频靶向哺乳动物基因组中的特定位点(High frequency targeting of genes to 
specific sites in the mammalian genome)《. 细胞》(Cell)44,419-428(1986)。
45.黑斯蒂(Hasty),P.、里维拉-佩雷斯(Rivera-Perez),J.&布兰得利(Bradley),A.,胚胎干细胞中的基因靶向所需的同源性长度(The length of homology required for gene targeting in embryonic stem cells)《. 分子与细胞生物学》(Mol Cell Biol)11,
5586-5591(1991)。
46.吴(Wu),S.、应(Ying),G.X.、吴(Wu),Q.&卡佩基(Capecchi),M.R.,一种用于构建基因靶向载体的方案:产生钙粘素家族及以外的基因敲除小鼠(A protocol for 
constructing gene targeting vectors:generating knockout mice for the cadherin family and beyond)《.自然-实验手册》(Nat Protoc)3,1056-1076(2008)。
47.格斯钦(Guschin),D.Y.等人,用于监测内源性基因修饰的快速和一般分析(A 
rapid andgeneral assay formonitoring endogenousgenemodification)《. 方法分子生物学》(Methods Mol Biol)649,247-256(2010)。
48.奥利韦拉(Oliveira),T.Y.等人,转位捕获测序:一种用于高通量标绘染色体重排的方法(Translocation capture sequencing:a method for high throughput mapping of chromosomal rearrangements)《. 免疫学方法杂志》(J Immunol Methods)375,176-181(2012)。
49.戴尔特彻瓦(Deltcheva),E.等人,通过反式编码的小RNA和宿主因子RNA酶III进行的CRISPR RNA成熟(CRISPR RNAmaturation by trans-encoded small RNA and host factor RNase III)《.自然》(Nature)471,602-607(2011)。
50.伯根哈根(Bogenhagen),D.F.&布朗(Brown),D.D.,转录终止所需的非洲蟾蜍5S DNA中的核苷酸序列(Nucleotide sequences in Xenopus5S DNA required for 
transcription termination)《. 细胞》(Cell)24,261-270(1981)。
51.布尔特曼(Bultmann),S.等人,通过组合设计者TALE和抑制表观遗传修饰剂而靶向转录激活沉默的oct4多能性基因(Targeted transcriptional activation of silent oct4pluripotency gene by combining designer TALEs and inhibition of 
epigenetic modifiers)《. 核酸研究》(Nucleic Acids Res)40,5368-5377(2012)。
52.沃尔顿(Valton),J.等人,克服转录激活因子样效应器(TALE)DNA结合结构域对胞嘧啶甲基化的敏感性(Overcoming transcription activator-like effector(TALE)DNA binding domain sensitivity to cytosine methylation)《. 生物化学杂志》(J Biol Chem)287,38427-38432(2012)。
53.克里斯汀(Christian),M.等人,用TAL效应器核酸酶靶向DNA双链断裂(Targeting DNA double-strand breaks with TAL effector nucleases)《. 遗传学》(Genetics)186,
757-761(2010)。
54.墨索里诺(Mussolino),C.等人,新颖的TALE核酸酶支架允许与较低的毒性组合的较高的基因组编辑活性(A novel TALE nuclease scaffold enables high genome 
editing activity in combination with low toxicity)《. 核酸研究》(Nucleic acids research)39,9283-9293(2011)。
55.博维斯-沃佐维奇(Bobis-Wozowicz),S.、奥斯克(Osiak),A.、拉赫曼(Rahman),S.H.&凯思曼(Cathomen),T.,使用锌指核酸酶的多能干细胞中的靶向基因组编辑
(Targeted genome editing in pluripotent stem cells using zinc-finger 
nucleases)《. 方法》(Methods)53,339-346(2011)。
56.江(Jiang),W.、比卡德(Bikard),D.、科克斯(Cox),D.、张(Zhang),F.&马拉菲尼(Marraffini),L.A.,使用CRISPR-Cas系统对细菌基因组进行RNA指导的编辑(RNA-guided editing of bacterial genomes using CRISPR-Cas systems)《. 自然生物技术》(Nat Biotechnol)31,233-239(2013)。
57.米凯利斯(Michaelis),L.M.,Maud“Die kinetik der invertinwirkung.”《生物化学》(Biochem.)z(1913)。
58.马赫福兹(Mahfouz),M.M.等人,具有新颖的DNA结合特异性的从头工程化的转录激活因子样效应器(TALE)杂合核酸酶产生双链断裂(De novo-engineered transcription activator-like effector(TALE)hybrid nuclease with novel DNA binding 
specificity creates double-strand breaks)《. 美国国家科学院院刊》(Proc Natl Acad Sci U S A)108,2623-2628(2011)。
59.威尔逊(Wilson),E.B.,可能的推断、继承法则与统计推断(Probable inference,the law of succession,and statistical inference)《. 美国统计协会杂志》(J Am Stat Assoc)22,209-212(1927)。
60.腾格里(Tangri)S等人,具有减少的免疫原性的合理工程化的治疗性蛋白质
(Rationally engineered therapeutic proteins with reduced immunogenicity),《免疫学杂志》(J Immunol.)2005年5月15日;174(6):3187-96。
61.雷明顿药物科学(REMINGTON’S PHARMACEUTICAL SCIENCES)(马克出版公司(Mack Pub.Co.),新泽西州1991)
62.洛佩斯(Lopes),V.S.等人,使用腺相关病毒用大MYO7A cDNA进行的视网膜基因治疗(Retinal gene therapy with a large MYO7A cDNA using adeno-assocaited 
virus)《. 基因治疗》(Gene Ther),2013年1月24日,doi:10.1038/gt 2013.3.[Epub优先出版]
63.卡普利特(Kaplitt),M.G.等人,用携带腺相关病毒(AAV)的GAD基因对帕金森病进行基因治疗的安全性与可容许性:开放标签的I期试验(Safety and tolerability of gene therapy with an adeno-associated virus(AAV)borne GAD gene for Parkinson’s disease:an open label,phase I trial)《. 柳叶刀》(Lancet).2007年6月23日;369(9579):2097-105。
64.纳斯瓦尼(Nathwani),A.C.等人,腺病毒相关病毒载体介导的B型血友病的基因转移(Adenovirus-associated virus vector-mediated gene transfer in hemophilia B)《. 新英格兰医学杂志》(N Engl J Med.)2011年12月22日;365(25):2357-65.doi:
10.1056/NEJMoa1108046.电子出版日2011年12月10日。
65.格雷(Gray)SJ、福蒂(Foti)SB、施瓦兹(Schwartz)JW、帕夏博纳(Bachaboina)L、泰勒-布雷克(Taylor-Blake)B、科尔曼(Coleman)J、埃莱尔(Ehlers)MD、泽尔卡(Zylka)MJ、麦克考恩(McCown)TJ、萨穆尔斯基(Samulski)RJ.,使用自互补载体优化外周和中枢神经系统中的重组腺相关病毒介导的基因表达的启动子(Optimizing promoters for recombinant adeno-associated virus-mediated gene expression in the peripheral and central nervous system using self-complementary vectors)《. 人类基因治疗》(Hum Gene Ther.)2011年9月;22(9):1143-53.doi:10.1089/hum.2010.245。
66.刘(Liu)D、费舍尔(Fischer)I.,两个替代性启动子指导大鼠微管相关蛋白质1B基因的神经元特异性表达(Two alternative promoters direct neuron-specific 
expression of the rat microtubule-associated protein 1B gene)《. 神经科学杂志》(J Neurosci.)1996年8月15日;16(16):5026-36。
67.莱维特(Levitt)N.、布里格斯(Briggs)D.、吉尔(Gil)A.、普劳德富特(Proudfoot)N.J.,高效的合成的聚(A)位点的定义(Definition of an efficient synthetic poly(A)site)《. 基因开发》(Genes Dev)1989;3:1019-1025。
68.麦克卢尔(McClure)C、科尔(Cole)KL、伍尔夫(Wulff)P、克卢格曼(Klugmann)M、默里(Murray)AJ,重组腺相关病毒载体的产生和滴度测定(Production and titering of recombinant adeno-associated viral vectors)《. 可视化实验杂志》(J Vis Exp),2011年11月27日;(57):e3348.doi:10.3791/3348。
69.班克(Banker)G、戈斯林(Goslin)K,神经元细胞培养物中的发育(Developments in neuronal cell culture)《.自然》(Nature).1988年11月10日;336(6195):185-6。
70.常(Chang),N.、孙(Sun),C.、高(Gao),L.、朱(Zhu),D.、徐(Xu),X.、朱(Zhu),X.、熊(Xiong),J.W.、以及习(Xi),J.J.(2013),在斑马胚胎中用RNA指导的Cas9核酸酶进行基因组编辑(Genome editing with RNA-guided Cas9nuclease in zebrafish embryos),《细胞研究》(Cell research)23,465-472。
71.迪安欧威(Dianov),G.L.和胡布谢尔(Hubscher),U.(2013),哺乳动物碱基切除修复:被遗忘的天使长(Mammalian base excision repair:the forgotten archangel),《核酸研究》(Nucleic acids research)41,3483-3490。
72.弗里德兰(Friedland),A.E.、楚尔(Tzur),Y.B.、埃斯威尔特(Esvelt),K.M.、科拉亚科沃(Colaiacovo)、M.P.、丘奇(Church),G.M.以及卡拉尔科(Calarco),J.A.(2013),在秀丽隐杆线虫中经由CRISPR-Cas9系统进行可遗传的基因组编辑(Heritable genome editing in C.elegans via a CRISPR-Cas9system),《自然方法》(Nature methods)10,
741-743。
73.付(Fu),Y.、福登(Foden),J.A.、哈提尔(Khayter),C.、马埃德尔(Maeder),M.L.、瑞勇(Reyon),D.、容(Joung),J.K.以及桑德尔(Sander),J.D.(2013),在人类细胞中由CRISPR-Cas核酸酶诱导的高频率脱靶诱变(High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells),《自然生物技术》(Nature biotechnology)。
74.格拉兹(Gratz),S.J.、卡明斯(Cummings),A.M.、纽伦(Nguyen),J.N.、哈姆(Hamm),D.C.、多诺霍(Donohue),L.K.、哈里森(Harrison),M.M.、维尔丹格(Wildonger),J.和O'康纳(Connor)-贾尔斯(Giles),K.M.(2013),采用CRISPR RNA指导的Cas9核酸酶对果蝇进行基因组编辑(Genome Engineering of Drosophila with the CRISPR RNA-Guided 
Cas9Nuclease),《基因组学》(Genetics)194,1029-1035。
75.徐(Hsu),P.D.、斯科特(Scott),D.A.、温斯坦(Weinstein),J.A.、兰(Ran),F.A.、科纳曼(Konermann),S.、阿格瓦拉(Agarwala),V.、李(Li),Y.、法恩(Fine),E.J.、吴(Wu),X.、沙勒姆(Shalem),O.等人(2013),RNA指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-guided Cas9nucleases),《自然生物技术》(Nature 
biotechnology)。
76.玛丽(Mali),P.、阿赫(Aach),J.、斯特兰杰斯(Stranges),P.B.、埃斯威尔特(Esvelt),K.M.、慕斯博纳(Moosburner),M.、卡苏里(Kosuri),S.、杨(Yang),L.以及丘奇(Church),G.M.(2013a),用于靶标特异性筛选的CAS9转录激活因子和用于协作基因组工程化的配对切口酶(CAS9transcriptional activators for target specificity 
screening and paired nickases for cooperative genome engineering),《自然生物技术》(Nature biotechnology)。
77.马雷斯卡(Maresca),M.、林(Lin),V.G.、郭(Guo),N.以及杨(Yang),Y.(2013),强制连接关卡的重组(ObLiGaRe):专门设计的核酸酶介导的通过非同源末端连接的靶向整合(Obligate ligation-gated recombination(ObLiGaRe):custom-designed nuclease-mediated targeted integration through nonhomologous end joining),《基因组研究》(Genome research)23,539-546。
78.帕塔纳亚克(Pattanayak),V.、林(Lin),S.、桂灵儿(Guilinger),J.P.、马(Ma),E.、杜德纳(Doudna),J.A.、以及刘(Liu),D.R.(2013),脱靶DNA切割的高通量剖析揭示RNA编程的Cas9核酸酶特异性(High-throughput profiling of off-target DNA cleavage 
reveals RNA-programmed Cas9nuclease specificity),《自然生物技术》(Nature biotechnology)。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈