首页 / 专利库 / 疗法 / 给药 / 肠内给药 / 通过核递送CRISPR/CAS9追踪并操纵细胞RNA

通过核递送CRISPR/CAS9追踪并操纵细胞RNA

阅读:501发布:2020-10-15

专利汇可以提供通过核递送CRISPR/CAS9追踪并操纵细胞RNA专利检索,专利查询,专利分析的服务。并且本 发明 提供了靶向RNA的Cas9多肽及其使用方法。,下面是通过核递送CRISPR/CAS9追踪并操纵细胞RNA专利的具体信息内容。

1.一工程化核蛋白复合物,其包含:
(a)Cas9多肽,和
(b)重组或合成单向导RNA(sgRNA),其被改造或设计为包含:
(1)在其5'末端,通过杂交(与靶RNA杂交或结合)识别靶RNA的一RNA序列,和
(2)在其3'末端:(i)能够结合或缔合Cas9多肽的RNA序列(结合Cas9多肽的“支架序列”),或(ii)接头,其与所述Cas9多肽结合或共价或非共价连接1所述sgRNA的5'RNA杂交或结合末端,
其中任选地所述核蛋白复合物不包含PAMmer寡核苷酸,
且任选地所述Cas9多肽:
(6)是或来源于细菌或古细菌Cas9多肽,
(7)缺少对应的野生型(WT)Cas9多肽的结构域或结构域的一部分,其中所述结构域任选地是Cas9的HNH和/或RuvC核酸酶结构域,包含ββα-金属折叠,所述ββα-金属折叠包含或包括Cas9多肽的活性部位或其组合;
(8)缺乏DNA酶或DNA切割的能或活性、切口酶活性或其组合,其中任选地,通过修饰(突变)或去除全部或部分HNH和/或RuvC Cas9的核酸酶结构域、Cas9多肽DNA酶活性位点或包含Cas9多肽活性位点的ββα-金属折叠或其组合,以去除DNase或DNA切割能力或活性,(9)缺少Cas9的HNH和/或RuvC核酸酶结构域、Cas9多肽DNase活性位点、包含Cas9多肽活性位点的ββα-金属折叠或其组合的全部或部分,从而任选地减小多肽的尺寸,任选地促进将Cas9编码核苷酸包装在病毒或其他递送载体中,或
(10)是WT Cas9多肽的变体,并且具有一个或多个基酸突变,其导致相对于相应的WT Cas9多肽的DNase或核酸酶活性降低,
或任选地,古细菌或细菌Cas9多肽是、包含或源自:地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀性巴氏杆菌(Pasteu rella multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9 CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor salsuginis str)DSM 16511株、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis),灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare),Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus  johnsonii)、伪中间型葡萄球菌(Staphylococcus 
pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema denticola)、嗜军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus)和新凶手弗朗西菌(Francisella novicida)(任选地是新凶手弗朗西菌Cpfl)或格氏嗜盐杆菌(Natronobacterium gregoryi)的Argonaute蛋白,其被修饰或赋予新用途以靶向RNA,其中任选地sgRNA 3'末端或“支架序列”包含每一个这些相应细菌或古细菌生物中的野生型(WT)或源自野生型的同源向导核酸的全部或部分。
2.根据权利要求1所述工程化的核蛋白复合物,其中所述sgRNA的5'RNA-杂交或结合末端的长度在约15到25,或20、21、22个核苷酸之间,并且能够结合或缔合所述Cas9多肽的所述RNA序列的长度在约85和100或90、91、92、93、94或95个核苷酸之间,
并且任选地,所述Cas9多肽被改造以适于与效应多肽、靶向剂、酶,和/或可被检测部分缔合、融合或结合或共价或非共价地连接,其中任选地,所述效应多肽包含RNA修饰多肽,其中任选地,所述Cas9多肽是重组或合成多肽,
其中任选地,所述靶RNA是(或通过杂交识别或杂交至或结合到所述靶RNA的RNA序列,与以下RNA反向互补):信使RNA(mRNA)、核糖体RNA(rRNA)、信号识别颗粒RNA(SRP RNA)、转运RNA(tRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、反义RNA(aRNA)、长非编码RNA(lncRNA)、微小RNA(miRNA)、piwi-相互作用RNA(piRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、反转座子RNA、病毒基因组RNA、或病毒非编码RNA。
3.根据权利要求1或2中任一项所述工程核蛋白复合物,其中所述Cas9多肽与所述效应多肽、靶向剂、可检测部分或RNA修饰多肽非共价缔合。
4.根据权利要求1或2中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与所述效应多肽、靶向剂、可检测部分融合或共价相连,
并任选地,效应多肽是或包含RNA修饰多肽,并且任选地,所述靶向剂是或包含:细胞质多聚腺苷酸化元件结合蛋白(CPEB)、锌指结合蛋白(ZBP)、TIA-1(3'UTR mRNA结合蛋白)、PSF(剪接体的种蛋白组分)或PSF的DNA-结合结构域(DBD)、脆性X智力低下蛋白(FMRP)、IGF-II mRNA结合蛋白(IMP)-1(IMP1)、IMP2、IMP3、细胞骨架结合蛋白、跨膜蛋白,或包含这些前述蛋白结构域的组合以产生组合运输现象的工程化蛋白,
并且任选地,该酶参与化合物合成的修饰,任选地,其中所述化合物是多肽或核酸,并且任选地,靶RNA上的Cas9多肽的缔合在生物合成途径中产生中间产物的局部积累,与游离的生物合成酶相比,以放大生产医学上或技术上有用的化合物。
5.权利要求1-4中任一项所述工程化核蛋白复合物,其中所述RNA修饰多肽包含剪接因子或RNA剪接结构域,任选地为含有RBFOX2结构域的蛋白质、已知的影响RNA剪接的蛋白质或RNA切割结构域(核酸内切酶),任选地含有PIN结构域的蛋白质。
6.根据权利要求1-5中任一项所述工程化核蛋白复合物,其中所述Cas9多肽通过所述接头共价结合至所述单向导RNA(sgRNA)。
7.根据权利要求1-6中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在3'末端支架序列中携带RNA二级结构延伸或包含所述RNA二级结构。
8.根据权利要求1至7中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)包含一个或多个点突变,其通过去除部分或完全转录终止序列或通过反式核酸酶的作用使sgRNA在转录后不稳定的序列,使得单向导RNA的表达平提高至少约5%、10%、15%或更多。
9.根据权利要求1-8中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在5'端包含改变或附加的核苷酸或化学部分,其使所述单向导RNA稳定以防止被降解。
10.根据权利要求9所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)的5'端的所述附加的核苷酸或化学部分选自2'O-甲基、硫代磷酸酯和硫代膦酰基乙酸酯键和碱基组成的组,以及任选地,用于化学稳定的所述改变或附加化学部分包含2'-F核酸(LNA)、2'-O-甲酰乙基或解锁核酸(UNA)。
11.根据权利要求1-10中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含一种或多种甲基膦酸酯、硫代磷酸酯或硫代磷酸酯键,任选地将所述sgRNA上的RNA核酸酶活性降低至少约5%、10%、15%或更多。
12.根据权利要求1-11中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在5'末端包含改变或附加的核苷酸或化学部分,其将RNA靶向性提高至少约5%、
10%、15%或更多。
13.根据权利要求1-12中任一项所述工程化核蛋白复合物,其中所述单向导RNA在所述sgRNA的间隔区或支架区中包含2'-氟、2'O-甲基和/或2'-甲基乙基碱基修饰,以提高靶向识别或降低单向导RNA上的核酸酶活性至少约5%、10%、15%或更多。
14.根据权利要求1-13中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含足够的与所述靶RNA反义的序列,以允许其在生理条件下与靶RNA的至少约5%、10%、15%,或约5%和20%之间或更多进行杂交。
15.根据权利要求1-14中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含与所述靶RNA的至少一部分反义或互补的序列,其中所述部分任选地至少为约5%、10%、15%或更多的靶RNA,或为约5%至20%之间或更多的目标RNA。
16.根据权利要求1-15中任一项所述工程化核蛋白复合物,还包含CRISPR-靶向RNA(crRNA)和反式激活cRNA(tracrRNA),其中所述Cas9多肽与结合了反式激活cRNA(tracrRNA)的CRISPR-靶向RNA(crRNA)复合或连接,或共价或非共价缔合。
17.根据权利要求1-16中任一项所述工程化核蛋白复合物,其中所述RNA修饰多肽进一步与一反义寡核苷酸复合,或共价或非共价连接。
18.根据权利要求17所述工程化核蛋白复合物,其中所述反义寡核苷酸包含至少一个修饰的核苷酸。
19.根据权利要求18所述工程核蛋白复合物,其中所述至少一个修饰的核苷酸选自2'OMe RNA和2'OMe DNA核苷酸。
20.根据权利要求1-19中任一项所述工程化核蛋白复合物,其中所述核蛋白复合物还包含PAMmer寡核苷酸,并且任选地所述PAMmer还携带保持由sgRNA所赋予的靶特异性所需的5'端突出。
21.根据权利要求20所述工程化核蛋白复合物,其中所述PAMmer寡核苷酸包含一个或多个修饰的碱基或接头。
22.根据权利要求21所述工程化核蛋白复合物,其中所述一个或多个修饰的碱基或接头选自锁核酸和稳定核酸酶的接头组成的组。
23.根据权利要求1至22中任一项所述工程化核蛋白复合物,其中所述工程化核蛋白复合物被改造以适于被输送到细胞的细胞核。
24.根据权利要求23所述工程化核蛋白复合物,其中所述工程化核蛋白复合物被改造以适于与靶RNA共同被运送到所述细胞核外。
25.根据权利要求23或24中所述工程化核蛋白复合物,其中所述CAS9多肽包含或进一步包含,任选地融合到或连接到核定位信号、一个或多个连接肽、XTEN肽或任选地SV40核定位信号。
26.根据权利要求1-25中任一项所述工程化核蛋白复合物,其中所述Cas9多肽无核酸酶活性。
27.根据权利要求1-26中任一项所述工程化核蛋白复合物,其中所述靶RNA包含重复序列,并且通过杂交(与靶RNA杂交或结合)识别的所述5'末端RNA序列包含一能够杂交到或互补到所述重复序列上的序列。
28.根据权利要求27所述工程化核蛋白复合物,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
29.根据权利要求27或28所述工程化核蛋白复合物,其中所述靶RNA与疾病或病症或感染相关,并且任选地所述疾病或病症由RNA微卫星重复扩增引起或与之相关。
30.根据权利要求29所述工程核蛋白复合物,其中所述疾病、病症或感染选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良、脆性X染色体综合征、病毒或细菌感染、其中任选地所述病毒感染是疱疹病毒科或单纯疱疹病毒、人免疫缺陷病毒、Epstein-Barr病毒、肝炎病毒、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、寨卡病毒、肠病毒、人乳头瘤病毒(HPV)、流感病毒、尔堡病毒、埃博拉病毒、腮腺炎病毒、巨细胞病毒、轮状病毒、疹病毒、水痘带状疱疹病毒、严重急性呼吸综合征(SARS)冠状病毒、副粘病毒科或麻疹病毒、西尼罗河病毒、黄热病病毒或登革热病毒感染。
31.根据权利要求1-30中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与效应多肽缔合,其中所述多肽是毒蛋白。
32.根据权利要求1-31中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与效应多肽、靶向剂、酶或可检测试剂或部分融合、结合或缔合,其中任选地所述Cas9多肽是重组或合成多肽。
33.根据权利要求32所述工程化核蛋白复合物,其中所述可检测试剂或部分包含已融合或连接于所述Cas9多肽的可检测多肽或组合物。
34.根据权利要求33所述工程化核蛋白复合物,其中所述可检测多肽包含当所述可检测多肽处于细胞核时失活的多肽。
35.根据权利要求34所述工程化核蛋白复合物,其中当所述可检测多肽处于细胞核内时,所述可检测多肽不可检测,但当所述可检测多肽不在细胞核内时,所述可检测多肽是可检测的。
36.根据权利要求35所述工程化核蛋白复合物,其中所述可检测多肽当其不在细胞核内时通过与另一种可检测试剂缔合而成为可检测的。
37.根据利要求32-36中任一项所述工程化核蛋白复合物,其中所述可检测多肽是荧光、分裂荧光或发光多肽,或所述可检测试剂或部分包含荧光,分裂荧光或发光试剂。
38.根据权利要求37所述工程化核蛋白复合物,其中所述荧光多肽包含或者是绿色荧光蛋白(GFP)或增强的GFP。
39.根据权利要求1-38中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)包含一个或多个点突变,所述点突变通过去除部分或全长的转录终止序列或通过反式作用核酸酶的作用在转录后使单导向RNA不稳定的序列,其将单向导RNA表达水平提高至少5%、10%、15%或更多。
40.根据权利要求1-39中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与一结合反式激活cRNA(tracrRNA)的CRISPR-靶向RNA(crRNA)复合。
41.根据权利要求1-40中任一项所述工程化核蛋白复合物,其中所述Cas9多肽进一步与反义寡核苷酸复合,其中所述反义寡核苷酸包含与靶RNA中的序列互补的PAMmer寡核苷酸。
42.根据权利要求41所述工程化核蛋白复合物,其中所述PAMmer寡核苷酸包含至少一个修饰的核苷酸。
43.根据权利要求20所述工程化核蛋白复合物,其中所述至少一种修饰的核苷酸选自
2'OMe RNA和2'OMe DNA核苷酸。
44.根据权利要求1-43中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于被递送至细胞的细胞核。
45.根据权利要求44所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于和靶RNA共同被输出到所述细胞核以外。
46.包含编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地为一种或多种载体,其中所述载体任选地为、包含或来源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
47.一细胞包含,或其中含有:
(a)根据权利要求1-45中任一项所述工程化的核蛋白复合物;或
(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地为一种或多种载体,
其中任选地所述细胞是哺乳动物细胞或人类细胞。
48.编码权利要求1-45中任一项所述工程化核蛋白复合物的嵌合核酸,其中任选地所述核酸是重组或合成核酸,其中任选地所述核酸可操作地连接于组成型或可诱导的启动子。
49.根据权利要求48所述核酸,其中所述Cas9多肽、sgRNA、PAMmer寡核苷酸、效应多肽、可检测部分或其组合中的一种或多种的表达受可调节或组成型启动子控制。
50.包含权利要求48或49所述核酸的载体,其中任选地,所述载体为、包含或来源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
51.一种细胞或组织,其包含:根据权利要求1-45中任一项所述工程化核蛋白复合物;
根据权利要求48或49所述核酸;或根据权利要求50所述载体。
52.一种治疗预防、改善或减轻哺乳动物或人类受试者中疾病或病症或感染症状的方法,包括给予所述哺乳动物或人类受试者:
(a)根据权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于和一效应多肽缔合或结合或共价或非共价连接,其中任选地所述效应多肽包含RNA修饰多肽;或
(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地为一种或多种载体,其中所述Cas9多肽被改造以适于和效应多肽缔合或结合或共价或非共价连接,其中任选地所述效应多肽包含RNA修饰多肽,并且其中所述一种或多种核酸在胞内表达并表达所述工程化核蛋白复合物,
(c)药物组合物,包含
(i)权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于与效应多肽缔合或结合或共价或非共价连接,其中任选地所述效应多肽包含RNA修饰多肽;或
(ii)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地一种或多种载体,其中所述Cas9多肽被改造以适于与效应多肽缔合或共价或不共价共价连接,其中任选地所述效应多肽包含RNA修饰多肽和任选地赋形剂,
并且任选地所述药物组合物配制用于肠内或肠胃外递送;或用于经静脉内(IV)递送;

(d)权利要求51所述细胞或组织;
从而修饰细胞中的RNA并治疗、预防或改善或减轻疾病或病症的症状或感染,其中任选地,将所述工程化核蛋白复合物或编码所述Cas9多肽的核酸或载体携带或包含在纳米颗粒、颗粒、胶束或脂质体或脂质复合物、聚合物囊泡、多聚复合物或树枝状聚合物中,其任选地还可以包含或表达细胞穿透部分或肽。
53.根据权利要求52所述方法,其中编码所述工程化核蛋白复合物的一种或全部组分的一种或多种核酸由单个载体携带或包含,或各组分(所述Cas9多肽、所述sgRNA、所述效应多肽或组分的组合)被携带或包含于单独的载体中,
并且任选地所述载体是腺病毒载体,或腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
54.根据权利要求52或53所述方法,其中所述Cas9多肽、所述sgRNA、所述PAMmer寡核苷酸、所述效应多肽或其组合中的一种或多种的表达受可调节或组成型启动子控制。
55.根据权利要求52-54中任一项所述方法,其中编码所述单向导导RNA(sgRNA)的核酸由编码所述Cas9多肽的核酸携带或包含在相同的载体中,任选地为腺病毒或AAV载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
56.根据权利要求52-55中任一项所述方法,其中编码所述sgRNA的核酸和编码所述Cas9多肽的核酸被携带或包含在不同载体中,任选地为腺病毒或AAV载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
57.根据权利要求52-56中任一项所述方法,其中编码所述效应多肽的核酸,任选地RNA修饰多肽由相同载体携带或携带或包含在单独的载体中,任选地为AAV载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
58.根据权利要求52-57中任一项所述方法,其中所述地疾病或病症由选自CTG、CCTG、CAG、GGGGCC及其任何组合的重复序列引起。
59.根据权利要求52-58所述方法,其中所述疾病,病症或感染由RNA微卫星重复扩增引起或与之相关,或选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓肌肉萎缩、脊髓小脑共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良、脆性X染色体综合征、病毒或细菌感染、其中任选地所述病毒感染是疱疹病毒或单纯疱疹病毒、人免疫缺陷埃博病毒、EB病毒、肝炎病毒、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、寨卡病毒、肠道病毒、人乳头瘤病毒(HPV)、流感病毒、马尔堡病毒、埃博拉病毒、腮腺炎病毒、巨细胞病毒、轮状病毒、风疹病毒、水痘带状疱疹病毒、严重急性呼吸综合征(SARS)冠状病毒、副粘病毒科或麻疹病毒、西尼罗病毒、黄热病病毒或登革热病毒感染。
60.根据权利要求52-59中任一项所述方法,其中所述给药途径选自口服、肺部、腹膜内(ip)、静脉内(iv)、肌内(im)、皮下(sc)、经皮、面颊、鼻、舌下、眼睛、直肠和阴道
61.一种表达权利要求1-45中任一项所述工程化核蛋白复合物的方法,其包括在所述细胞表达所述核蛋白复合物的条件下,将权利要求46或50的载体或权利要求48或49的核酸引入细胞中。
62.一种追踪靶RNA或测量细胞中靶RNA量的方法,包括对细胞施用权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接至可检测部分,并使所述工程化核蛋白复合物结合所述细胞中的所述靶RNA,以确定所述靶的RNA在所述细胞中的位置或确定所述细胞中所述靶RNA的量。
63.根据权利要求61的方法,其中所述工程化核蛋白复合物结合所述细胞的核中的所述靶RNA,并随后从所述核中与所述靶RNA共同输出。
64.根据权利要求63或64中任一项所述方法,其中使用荧光显微镜或其等同物来确定所述细胞中所述靶RNA的位置或所述细胞中所述靶RNA的量。
65.一种体外或体内修饰细胞中靶RNA的量或结构的方法,其包括在所述细胞中的所述靶RNA的量或结构被修饰的条件下,允许权利要求1-45中任一项所述工程化核蛋白复合物与所述细胞中的所述靶RNA结合,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接到效应多肽,其中任选地所述效应多肽包含RNA修饰多肽。
66.一种体外或体内修饰细胞中一靶RNA的量或结构的方法,包括在所述细胞中所述靶RNA的量或结构被修饰的条件下,表达权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种组分,其中所述Cas9多肽被改造以适于缔合,或结合或共价或非共价连接到效应多肽上,其中任选地所述效应多肽包含RNA修饰多肽,其中所述工程化核蛋白复合物的所述一种或多种组分包含Cas9多肽、sgRNA、PAMmer寡核苷酸、效应蛋白、可检测部分或其组合。
67.一种测量一样品中RNA量或动力学的方法,其包括:引入权利要求1-45中任一项所述工程化核蛋白复合物进入所述样品,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价地连接一可检测部分;并且
观察、检测或测量所述样品中可检测试剂的量。
68.根据权利要求67所述方法,其包括在表达所述Cas9多肽的条件下将权利要求48或
49所述核酸或权利要求46或50所述载体引入所述样品。
69.根据权利要求67或68所述方法,还包括引入单向导RNA。
70.根据利要求67-69中任一项所述方法,还包括引入PAMmer寡核苷酸。
71.根据权利要求67-70中任一项所述方法,其中所述样品包含或来源自组织、活检、血清或血液样本或痰样本。
72.根据权利要求67-71中任一项所述方法,其中所述样本包含多个细胞。
73.根据权利要求67-72中任一项所述方法,包括测量所述样品中的靶RNA的表达水平或丰度。
74.根据权利要求67-73中任一项所述方法,其包括基于所述样品中所述靶RNA的表达水平或丰度诊断所述样品或所述样品来源的个体的疾病,病症或感染,并且任选地,所述靶RNA源自病毒或细菌感染,其中任选地所述病毒感染是疱疹病毒科或单纯疱疹病毒、人免疫缺陷病毒、EB病毒、肝炎病毒、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、寨卡病毒、肠道病毒、人乳头瘤病毒(HPV)、流感病毒、马尔堡病毒、埃博拉病毒、腮腺炎病毒、巨细胞病毒、轮状病毒、风疹病毒、水痘带状疱疹病毒、严重急性呼吸系统综合症(SARS)冠状病毒、副粘液病毒科或麻疹病毒、西尼罗河病毒、黄热病毒或登革热病毒感染。
75.根据权利要求67-74中任一项所述方法,其中所述靶RNA包含重复序列。
76.根据权利要求75所述方法,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC和其任何组合。
77.根据权利要求75或76所述方法,其中所述重复序列与疾病、病症或感染相关。
78.根据权利要求77所述方法,其中所述疾病或病症由RNA微卫星重复扩增引起或与之相关,或选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良和脆性X综合征。
79.一种修饰样品中的靶RNA的方法,包括:
引入权利要求1-44中任一项所述工程化核蛋白复合物进入所述样品,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接至一效应多肽,其中任选地所述效应多肽包含一RNA将多肽修饰成所述样品;和
使用所述RNA修饰多肽修饰所述样品中的所述靶RNA。
80.根据权利要求79所述方法,其包括在表达所述Cas9多肽的条件下将权利要求45或
49所述核酸或权利要求50所述载体引入所述样品中。
81.根据利要求79或80所述方法,还包括引入单向导RNA。
82.根据权利要求79-81中任一项所述方法,还包括引入PAMmer寡核苷酸。
83.根据权利要求79-82中任一项所述方法,其中所述样品包括组织。
84.根据权利要求79-83中任一项所述方法,所述样本包括多个细胞。
85.根据权利要求79-84中任一项所述方法,包括改变所述样品中的靶RNA的量。
86.根据权利要求85所述方法,其中所述靶RNA包含重复序列。
87.根据权利要求86所述方法,其中所述重复序列选CTG、CCTG、CAG、GGGGCC及其任何组合。
88.根据权利要求86或87所述方法,其中所述重复序列与疾病相关。
89.根据权利要求88所述方法,其中所述疾病由RNA微卫星重复扩增引起或与之相关,或选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良和脆性X综合征。
90.一种药物组合物,包含
(a)权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接到效应多肽,其中任选地所述效应多肽包含RNA修饰多肽;或
(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地一种或多种载体,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接到效应多肽,其中任选地所述效应多肽包含RNA修饰多肽,
和任选地赋形剂,
并且任选地所述药物组合物的配制适于肠内或肠胃外递送,或者适于静脉内(IV)递送。
91.根据权利要求90所述药物组合物,其中所述工程化核蛋白复合物或编码所述核蛋白复合物的核酸或载体承载在纳米颗粒、颗粒、胶束或脂质体或脂质复合体、聚合物体、聚合物复合物或树状聚合物中,优选地其还可以包含或表达细胞穿透部分或肽。
92.根据权利要求91所述药物组合物,其中所述纳米颗粒或颗粒包含脂质、聚合物、水凝胶或其组合。
93.根据权利要求90-93中任一项所述药物组合物,其中所述sgRNA与所述Cas9多肽包含在相同的载体中,或与所述Cas9多肽包含在不同的载体中。
94.根据权利要求90-94中任一项所述药物组合物,其中编码所述Cas9多肽的核酸和编码所述sgRNA的核酸在一个或多个载体中携带,任选地为腺病毒载体或腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
95.一种重组或合成的Cas9多肽,其中所述地Cas9多肽:
(a)是或来源于细菌或古细菌Cas9多肽;和
(b)
(i)缺少相应的野生型(WT)Cas9多肽的结构域或结构域的一部分,其中任选地所述结构域是Cas9的HNH和/或RuvC核酸酶结构域,包含ββα-金属折叠,所述ββα-金属折叠包含或包括Cas9多肽活性位点,或其组合;
(ii)缺少DNase或DNA切割能力或活性,或切口酶活性,其中任选地,所述DNase或DNA切割能力或活性通过修饰(突变)或去除全部或部分Cas9的HNH和/或RuvC核酸酶结构域、Cas9多肽DNA酶活性位点或包含Cas9多肽活性位点的ββα-金属折叠或其组合,
(iii)缺少全部或部分:Cas9的HNH和/或RuvC核酸酶结构域,Cas9多肽DNase活性位点或包含Cas9多肽活性位点的ββα-金属折叠,或其组合,从而任选地减少了所述多肽的尺寸,任选地促进了将Cas9编码核苷酸包装在病毒或其他递送载体中,或
(iv)是WT Cas9多肽的变体,并且具有一个或多个氨基酸突变,导致相对于相应的WT Cas9多肽的DNase或核酸酶活性降低,
并且任选地,所述古细菌或细菌Cas9多肽是,包含或源自:地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀性巴氏杆菌(Pasteu rella multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor salsuginis str)DSM 16511株、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis),灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare),Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus  johnsonii)、伪中间型葡萄球菌(Staphylococcus 
pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema denticola)、嗜肺军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus)和新凶手弗朗西菌(Francisella novicida)(任选地是新凶手弗朗西菌Cpfl)或格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute蛋白,其被修饰或赋予新用途以靶向RNA,
其中任选地,所述Cas9多肽还包含sgRNA,其中任选地所述sgRNA包含能够结合或缔合所述Cas9多肽的“支架序列”,所述Cas9多肽包含全部或部分或源自野生型(WT)野生型(WT)细菌或古细菌生物体的同源的向导核酸,其产生Cas9多肽,
并且任选地所述sgRNA在其5'末端还包含通过杂交(与靶RNA杂交或结合)识别靶RNA的RNA序列,
并且任选地,所述Cas9多肽被改造以适于缔合、融合或结合或共价或非共价连接至效应多肽、靶向剂、酶和/或可检测部分,其中任选地所述效应多肽包含RNA修饰多肽。
96.一种编码权利要求95所述Cas9多肽的重组或合成核酸,其中任选地,所述核酸是编码权利要求95所述Cas9多肽和sgRNA的嵌合核酸。
97.一种载体,其包含或含有权利要求98所述核酸,其中任选地所述载体为、包含或源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
98.一种细胞或组织,其包含或含有权利要求95所述Cas9多肽或权利要求96所述核酸。
1.一种工程化核蛋白复合物,包含:
(a)无核酸酶活性Cas9多肽,其中所述无核酸酶活性Cas9多肽缺少对应的野生型(WT)Cas9多肽的结构域或结构域的一部分,其中所述结构域包含HNH核酸酶结构域、RuvC核酸酶结构域、包含活性位点的ββα-金属折叠或其任意组合,并且其中所述无核酸酶活性Cas9多肽缺乏DNase活性、DNA切割活性、切口酶活性或其任意组合;

(b)重组或合成单向导RNA(sgRNA),包含:
(1)在其5'末端,与靶RNA杂交或结合的RNA序列,和
(2)在其3'末端:
(i)Cas9多肽支架,其含有能够结合、杂交或连接所述无核酸酶活性Cas9多肽的RNA序列,

(ii)接头,其将所述sgRNA的5末端与所述无核酸酶活性Cas9多肽结合或共价或非共价连接,
其中所述核蛋白复合物不包含PAMmer寡核苷酸。
2.根据权利要求1所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽包含分离或源自古细菌或细菌Cas9多肽的序列,所述古细菌或细菌Cas9多肽的序列分离或源自选自以下的组:地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella  tularensis 
subsp.novicida)、多杀性巴氏杆菌(Pasteu rella multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9 CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor salsuginis str)DSM 16511株、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis),灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare),Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、伪中间型葡萄球菌(Staphylococcus pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema denticola)、嗜肺军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus)和新凶手弗朗西菌(Francisella novicida)。
3.根据权利要求1所述工程化核蛋白复合物,其中所述sgRNA或所述Cas9多肽支架的3'末端包含分离或源自地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀性巴氏杆菌(Pasteu rella multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9 CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor salsuginis str)DSM 16511株、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis),灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare),Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、伪中间型葡萄球菌(Staphylococcus pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema denticola)、嗜肺军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus)和新凶手弗朗西菌(Francisella novicida)中的一种或多种的野生型(WT)同源向导核酸的序列。
4.根据权利要求1所述工程化核蛋白复合物,其中所述sgRNA的5'末端的长度在约15至
25个核苷酸之间,并且其中所述Cas9多肽支架的RNA序列的长度在约85和100个核苷酸之间。
5.根据权利要求4所述工程化核蛋白复合物,其中所述sgRNA的5'端长度为20、21或22个核苷酸。
6.权利要求4或5的工程化核蛋白复合物,其中所述Cas9多肽支架的RNA序列长度为90、
91、92、93、94或95个核苷酸。
7.根据权利要求4-6中任一项所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽共价或非共价连接至效应多肽、靶向剂、酶、可检测部分或其组合。
8.根据权利要求4-7中任一项所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽与效应多肽、靶向剂、可检测部分或RNA修饰多肽非共价连接。
9.根据权利要求4-7中任一项所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽与效应多肽、靶向剂、可检测部分或RNA修饰多肽共价连接。
10.根据权利要求7-9中任一项所述工程化核蛋白复合物,其中所述效应多肽包含一RNA修饰多肽。
11.根据权利要求7-9中任一项所述工程化核蛋白复合物,其中所述靶向剂包含(a)细胞质聚腺苷酸化元件结合蛋白(CPEB)、锌指结合蛋白(ZBP)、TIA-1、PSF、PSF的DNA结合结构域(DBD)、脆性X智力低下蛋白(FMRP)II mRNA结合蛋白(IMP)-1(IMP 1)、IMP2、
1MP3、细胞骨架结合蛋白,跨膜蛋白,或
(b)包含(a)的蛋白质结构域的组合的工程化蛋白。
12.根据权利要求8-11中任一项所述工程化核蛋白复合物,其中所述RNA修饰多肽包含剪接因子或RNA剪接结构域、含有RBFOX2结构域的蛋白、已知影响RNA剪接的蛋白、RNA切割结构域或含有PTN结构域的蛋白。
13.根据权利要求12所述工程化核蛋白复合物,其中所述RNA切割结构域包含一内切核酸酶。
14.根据权利要求1-13中任一项所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽通过接头共价连接至所述单向导RNA(sgRNA)。
15.根据权利要求1-14中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)的3'末端在所述Cas9多肽支架中包含RNA二级结构。
16.根据权利要求1-15中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)包含去除转录终止序列的一个或多个点突变。
17.根据权利要求1-16中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在5'端包含改变、附加的核苷酸或化学部分,其使所述单向导RNA稳定以防降解。
18.权利要求17所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)的5'末端处的所述附加的核苷酸或化学部分选自2'-O-甲基、硫代磷酸酯、硫代膦酰基乙酸酯键,硫代膦酰乙酸酯碱基、2'-F、锁核酸(LNA)、2'-O-甲氧基乙基和解锁核酸(UNA)。
19.根据权利要求1-18中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含将sgRNA上的RNA核酸酶活性降低至少约5%、10%、15%或者更多的一种或多种膦酸甲酯键、硫代磷酸乙酸酯键或硫代磷酸酯键。
20.根据权利要求1-19中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在5'端包含改变、附加的核苷酸或化学部分,其将RNA靶向性提高至少约5%、10%、
15%或更多。
21.根据权利要求1-20中任一项所述工程化核蛋白复合物,其中所述单向导RNA在sgRNA的Cas9多肽支架中包含2'-氟、2'-O-甲基和/或2'-甲氧基乙基碱基修饰,以提高所述单向导RNA上的靶标识别或降低核酸酶活性至少约5%、10%、15%或更多。
22.根据权利要求1-21中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含与所述靶RNA的至少一部分互补的序列,其中所述部分为所述靶RNA的至少约5%、10%、15%或更多。
23.根据权利要求22所述工程化核蛋白复合物,其中所述单向导RNA包含与所述靶RNA的至少一部分互补的序列,其中所述部分在所述靶RNA的约5%至20%之间。
24.根据权利要求1-23中任一项所述工程化核蛋白复合物,还包含CRISPR靶向RNA(crRNA)和反式激活cRNA(tracrRNA),其中所述无核酸酶活性Cas9多肽与CRISPR靶向RNA(crRNA)结合反式激活cRNA(tracrRNA)相复合、共价连接或非共价连接。
25.根据权利要求1-24中任一项所述工程化核蛋白复合物,其中所述RNA修饰多肽进一步与反义寡核苷酸相复合、共价连接或非共价连接。
26.根据权利要求25所述工程化核蛋白复合物,其中所述反义寡核苷酸包含至少一个修饰的核苷酸。
27.根据权利要求26所述工程化核蛋白复合物,其中所述至少一个修饰的核苷酸包含
2'-O-Me RNA或2'-O-Me DNA核苷酸。
28.根据权利要求1-27中任一项所述工程化核蛋白复合物,其中所述工程化核蛋白复合物适于递送至细胞的核。
29.根据权利要求28所述工程化核蛋白复合物,其中所述工程化核蛋白复合物适于与靶RNA共同导出至所述核以外。
30.根据权利要求28或29中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与核定位信号、一个或多个接头肽,一个或多个XTEN肽或一SV40核定位信号共价或非共价连接。
31.根据权利要求1-30中任一项所述工程化核蛋白复合物,其中所述Cas9多肽无核酸酶活性。
32.根据权利要求1-31中任一项所述工程化核蛋白复合物,其中所述靶RNA包含重复序列,并且其中与所述靶RNA杂交或结合的所述sgRNA的5'末端包含一能够杂交至所述重复序列的序列。
33.根据权利要求32所述工程化核蛋白复合物,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
34.根据权利要求32或33所述工程化核蛋白复合物,其中所述靶RNA与疾病、病症或感染相关。
35.根据权利要求34所述工程化核蛋白复合物,其中所述疾病或病症由RNA微卫星重复扩增引起或与其相关。
36.根据权利要求34或35所述工程化核蛋白复合物,其中所述疾病、病症或感染选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X-伴有震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良、脆性X染色体综合征、病毒感染、细菌感染、疱疹病毒科或单纯疱疹病毒感染、人免疫缺陷病毒感染、EB病毒感染、肝炎病毒感染、甲型肝炎感染、乙型肝炎感染、丙型肝炎感染、丁型肝炎感染、戊型肝炎感染、寨卡病毒感染、肠道病毒感染、人乳头瘤病毒(HPV)感染、流感病毒感染、马尔堡病毒感染、埃博拉病毒感染、腮腺炎病毒感染、巨细胞病毒感染、轮状病毒感染、风疹病毒感染、水痘带状疱疹病毒感染、严重急性呼吸综合征(SARS)感染、冠状病毒感染、副粘病毒科或麻疹病毒感染、西尼罗河病毒感染、黄热病病毒感染或登革热病毒感染。
37.根据权利要求1-36中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与效应多肽缔合,其中所述多肽是毒性蛋白。
38.根据权利要求1-37中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与效应多肽、靶向剂、酶或可检测试剂或部分共价或非共价连接,其中所述Cas9多肽是重组或合成多肽。
39.根据权利要求38所述工程化核蛋白复合物,其中所述可检测试剂或部分包含可检测多肽。
40.根据权利要求39所述工程化核蛋白复合物,其中所述可检测多肽包含当所述可检测多肽处于细胞核时失活的多肽。
41.根据权利要求40所述工程化核蛋白复合物,其中当所述可检测多肽处于细胞核内时,所述可检测多肽不可检测,但当所述可检测多肽不在细胞核内时,所述可检测多肽是可检测的。
42.根据权利要求41所述工程化核蛋白复合物,其中所述可检测多肽当其不在细胞核内时是可检测的,并且其中所述可检测多肽通过与另一可检测试剂缔合而被可检测。
43.根据权利要求39-42中任一项所述工程化核蛋白复合物,其中所述可检测多肽包含荧光多肽、分裂的荧光多肽或发光多肽。
44.根据权利要求43所述工程化核蛋白复合物,其中所述荧光多肽包含绿色荧光蛋白(GFP)或增强的GFP。
45.一种载体,其包含编码权利要求1-44中任一项所述工程化核蛋白复合物的核酸、一种或多种核酸、载体或一种或多种载体,其中所述载体包含或源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人类免疫缺陷病毒(HIV)或合成载体。
46.一种细胞,其包含:
(a)权利要求1-44中任一项所述工程化核蛋白复合物;或
(b)编码权利要求1-44中任一项所述工程化核蛋白复合物的核酸、一种或多种核酸或载体或一种或多种载体,
其中所述细胞是哺乳动物细胞或人细胞。
47.编码权利要求1-44中任一项所述工程化核蛋白复合物的嵌合核酸,其中所述核酸是重组核酸或合成核酸,并且其中所述核酸可操作地连接于组成型或诱导型启动子。
48.根据权利要求47所述核酸,其中所述无核酸酶活性Cas9多肽、所述sgRNA、所述效应多肽、所述可检测多肽或其组合的一种或多种的表达受可调节或组成型启动子控制。
49.包含根据权利要求47或48所述核酸的载体,其中所述载体包含或源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
50.一种细胞或组织,其包含:根据权利要求1-44中任一项所述工程化核蛋白复合物;
根据权利要求47或48所述核酸;或根据权利要求49所述载体。
51.一种组合物,其包含根据权利要求1-44中任一项所述工程化核蛋白复合物、根据权利要求47或48所述核酸、根据权利要求49所述载体或根据权利要求50所述细胞或组织。
52.一种治疗、预防、改善或减轻哺乳动物或人类受试者中疾病或病症、感染的症状的方法,包括向所述哺乳动物或人受试者施用根据权利要求51所述组合物,其中所述组合物修饰细胞中的RNA并由此治疗、预防、改善或减轻所述疾病、病症或感染的症状。
53.根据权利要求52所述方法,其中纳米颗粒、颗粒、胶束、脂质体、脂质复合物、聚合物囊泡、聚复合物或树枝状聚合物包含或携带所述工程化核蛋白复合物、所述一种或多种编码所述工程化核蛋白复合物的核酸或一种或多种编码所述工程化核蛋白复合物的载体。
54.根据权利要求53所述方法,其中所述纳米颗粒、所述颗粒、所述胶束、所述脂质体、所述脂质复合物、所述聚合物囊泡、所述聚复合物或所述树枝状聚合物进一步包含或表达细胞穿透部分或肽。
55.根据权利要求52-54中任一项所述方法,其中单一载体含有或携带编码所述工程化核蛋白复合物或其一种或多种组分的核酸;或者其中单个载体含有或携带所述工程化核蛋白复合物的每种组分。
56.根据权利要求55所述方法,其中所述工程化核蛋白复合物的一种或多种组分包含所述无核酸酶活性Cas9多肽、所述sgRNA和所述效应多肽。
57.根据权利要求55或56所述方法,其中所述载体包含或衍生自腺病毒载体、腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
58.根据权利要求52-57中任一项所述方法,其中所述无核酸酶活性Cas9多肽、所述sgRNA、所述效应多肽或其组合的一种或多种的表达受可调节或组成型启动子控制。
59.根据权利要求52-58中任一项所述方法,其中所述相同载体含有或携带所述单向导RNA(sgRNA)和编码所述核酸酶失活Cas9多肽的核酸,并且其中所述载体包含或源自腺病毒载体、腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
60.根据权利要求52-58中任一项所述方法,其中不同载体含有或携带所述sgRNA和所述编码无核酸酶活性Cas9多肽的核酸,并且其中所述载体包含或衍生自腺病毒载体、腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
61.根据权利要求52-60中任一项所述方法,其中不同载体含有或携带编码效应多肽的核酸和RNA修饰多肽、并且其中所述载体包含或源自腺病毒载体、腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
62.根据权利要求52-61中任一项所述方法,其中所述疾病或病症由选自CTG、CCTG、CAG、GGGGCC及其任何组合的重复序列引起。
63.根据权利要求52-62中任一项所述方法,其中所述疾病、病症或感染是
(a)由RNA微卫星重复扩增引起或与之相关,或
(b)选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良症、眼咽肌营养不良症、脆性X综合症、病毒感染、细菌感染、疱疹病毒科或单纯疱疹病毒感染、人免疫缺陷病毒感染、EB病毒感染、肝炎病毒感染、甲型肝炎感染、乙型肝炎感染、丙型肝炎病毒感染、丁型肝炎病毒感染、戊型肝炎病毒感染、寨卡病毒感染、肠道病毒感染、人乳头瘤病毒(HPV)感染、流感病毒感染、马尔堡病毒感染、埃博拉病毒感染、腮腺炎病毒感染、巨细胞病毒感染、轮状病毒感染、风疹病毒感染、水痘带状疱疹病毒感染、严重急性呼吸综合征(SARS)感染、冠状病毒感染、副粘病毒科或麻疹病毒感染、西尼罗河病毒感染、黄热病毒感染或登革热病毒感染。
64.根据权利要求52-63中任一项所述方法,其中所述组合物通过口服、肺部、腹膜内(ip)、静脉内(iv)、肌肉内(im)、皮下(sc)、经皮、面颊、鼻、舌下、眼睛、直肠和阴道中的一种途径施用。
65.一种表达权利要求1-44中任一项所述工程化核蛋白复合物的方法,包括将权利要求45或49的一载体或权利要求47或48的一核酸导入一细胞中,在此条件下所述细胞表达所述核蛋白复合物。
66.一种追踪靶RNA或测量细胞中靶RNA的含量的方法,包括向所述细胞施用权利要求
1-44中任一项所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽共价或非共价地连接于一可检测部分,以允许工程化核蛋白复合物结合到所述细胞中的所述靶RNA,并确定所述靶RNA在所述细胞中的位置或确定所述细胞中所述靶RNA的含量。
67.根据权利要求66所述方法,其中所述工程化核蛋白复合物结合到所述细胞的细胞核中的所述靶RNA,并随后从所述细胞核与所述靶RNA共同输出。
68.根据权利要求66或67所述的方法,其中使用荧光显微镜或其等同物来确定所述细胞中所述靶RNA的位置或所述细胞中所述靶RNA的含量。
69.一种在体外或体内修饰细胞中靶RNA的量或结构的方法,包括使权利要求1-44中任一项所述工程化核蛋白复合物在所述细胞中结合所述靶RNA,在结合条件下所述细胞中所述靶RNA的量或结构被修饰,其中所述无核酸酶活性Cas9与效应多肽共价或非共价连接,并且其中所述效应多肽包含RNA修饰多肽。
70.一种在体外或体内修饰细胞中一靶RNA的量或结构的方法,包括在细胞中表达根据权利要求1-44中任一项所述工程化核蛋白复合物的一种或多种组分,在此条件下所述细胞中所述靶RNA的量或结构被修饰,其中所述无核酸酶活性Cas9多肽与效应多肽共价或非共价连接,其中所述效应多肽包含RNA修饰多肽,其中所述工程化核蛋白复合物的一种或多种组分包含无核酸酶活性Cas9多肽、sgRNA、效应蛋白、可检测部分及其组合。
71.一种测量样品中的RNA含量或动力学的方法,包括:
将根据权利要求1-44中任一项所述工程化核蛋白复合物导入所述样品中;并测量所述样品中可检测试剂的量,其中所述无核酸酶活性Cas9多肽与可检测部分共价或非共价连接。
72.根据权利要求71所述方法,包括在表达所述无核酸酶活性Cas9多肽的条件下,将权利要求47或48所述核酸或权利要求45或49所述载体导入所述样品中。
73.根据权利要求71或72所述方法,其中所述样品包含或源自组织、组织活检、血清、血液样本或痰样品。
74.根据权利要求71-73中任一项所述方法,其中所述样品包含多个细胞。
75.根据利要求71-74中任一项所述方法,包括测量所述样品中的靶RNA的表达水平或丰度。
76.根据权利要求71-75中任一项所述方法,包括诊断衍生所述样品的个体的疾病、病症或感染,包括测量所述样品中所述靶RNA的表达水平或丰度。
77.根据权利要求76所述方法,其中所述靶RNA源自病毒或细菌感染。
78.根据利要求76或77所述方法,其中所述病毒感染是疱疹病毒科或单纯疱疹病毒感染、人免疫缺陷病毒感染、EB病毒感染、肝炎病毒感染、甲型肝炎感染、乙型肝炎感染、丙型肝炎感染、丁型肝炎感染、戊型肝炎感染、寨卡病毒感染、肠道病毒感染、人乳头瘤病毒(HPV)感染、流感病毒感染、马尔堡病毒感染、埃博拉病毒感染、腮腺炎病毒感染、巨细胞病毒感染、轮状病毒感染、风疹病毒感染、水痘带状疱疹病毒感染、严重急性呼吸综合症(SARS)感染、冠状病毒感染、副粘病毒科或麻疹病毒感染、西尼罗河病毒感染、黄热病病毒感染或登革热病毒感染。
79.根据权利要求71-78中任一项所述方法,其中所述靶RNA包含重复序列。
80.根据权利要求79所述的方法,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
81.根据权利要求79或80所述方法,其中所述疾病或病症是
(a)由RNA微卫星重复扩增引起或与之相关,或者
(b)选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良症、眼咽肌营养不良和脆性X综合征。
82.一种修饰样品中的靶RNA的方法,包括:
将根据权利要求1-44中任一项所述工程化核蛋白复合物导入所述样品中,其中所述无核酸酶活性Cas9多肽与一效应多肽共价或非共价连接,其中所述效应多肽包含RNA修饰多肽,由此使用所述RNA修饰多肽修饰所述样品中的所述靶RNA。
83.根据权利要求82所述方法,包括在表达所述无核酸酶活性Cas9多肽的条件下,将权利要求47或48所述核酸或权利要求49的一载体导入所述样品中。
84.根据权利要求82或83所述方法,还包括引入PAMmer寡核苷酸。
85.根据权利要求82-84中任一项所述方法,其中所述样品包括组织。
86.根据权利要求82-85中任一项所述方法,其中所述样品包含多个细胞。
87.根据权利要求82-86中任一项所述方法,其包括修饰所述样品中的靶RNA的量。
88.根据权利要求87所述方法,其中所述靶RNA包含重复序列。
89.根据权利要求88所述方法,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
90.根据权利要求88或89所述方法,其中所述重复序列与疾病相关。
91.根据权利要求90所述的方法,其中所述疾病
(a)由RNA微卫星重复扩增引起或与之相关,或
(b)选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良症、眼咽肌营养不良和脆性X综合征。
92.一种药物组合物,包含
(a)根据权利要求1-44中任一项所述工程化核蛋白复合物,其中所述无核酸酶活性Cas9多肽共价或非共价连接至效应多肽,并且其中所述效应多肽包含RNA修饰多肽;或(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的核酸、一种或多种核酸、载体或一种或多种载体,其中所述无核酸酶活性Cas9多肽共价或非共价连接至效应多肽,并且其中效应多肽包含RNA修饰多肽,
其中所述药物组合物被配制成用于肠内递送、肠胃外递送或静脉内(IV)递送。
93.根据权利要求92所述药物组合物,还包含赋形剂。
94.根据权利要求92或93所述药物组合物,其中纳米颗粒、颗粒、胶束、脂质体、脂质复合物、聚合物囊泡、多聚复合物、或树枝状聚合物包含或携带所述工程化核蛋白复合物,编码所述核蛋白复合物的核酸或编码所述核蛋白复合物的载体。
95.根据权利要求94所述药物组合物,其中所述纳米颗粒或所述颗粒包含脂质、聚合物、水凝胶或其组合。
96.根据权利要求92-95中任一项所述药物组合物,其中所述sgRNA和所述无核酸酶活性Cas9多肽包含在相同的载体或不同的载体中。
97.根据权利要求92-96中任一项所述药物组合物,其中所述编码无核酸酶活性Cas9多肽的核酸和所述sgRNA携带于一个或多个载体,其中所述一种或多种载体包含或源自腺病毒载体、腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。

说明书全文

通过核递送CRISPR/CAS9追踪并操纵细胞RNA

任何优先权申请通过引用并入

根据37CFR1.57,在与本申请一起提交的申请数据表中确定了外国或国内优先权要求的所有申请通过引用并入本申请。具体而言,本申请要求于2015年11月23日提交的题为“TRACKING AND MANIPULATING CELLULAR RNA VIA NUCLEAR DELIVERY OF CRISPR/CAS9”的美国临时申请序列号62/259014的优先权,其公开内容在此通过引用全部并入本申请。

关于联邦资助研发的声明

发明在美国国立卫生研究院授予的NIH拨款/合同号HG004659和NS075449的政府支

持下完成。政府对本发明享有一定的权利。

序列表、表格或计算机程序列表的引用

本申请与电子格式的序列表一起提交。序列表以名为UCSD097-001WO_SEQLIST.TXT的文件提供,该文件于2016年11月22日创建,大小为105Kb。序列表的电子格式信息通过引用整体并入本申请。

发明背景

发明领域
本申请涉及基因工程,并且在可选的实施方案中,提供了已经被工程化以结合RNA的Cas9多肽。

背景技术

当前追踪RNA、确定RNA的量或修饰RNA的量或结构的方法具有各种缺点。本发明提供了用于实施他们的改进方法和组合物。

发明内容

在以下编号的权利要求中描述了一些实施方案:
1.一工程化核蛋白复合物,其包含:
(a)Cas9多肽,和
(b)重组或合成单向导RNA(sgRNA),其被改造或设计为包含:
(1)在其5'末端,通过杂交(与靶RNA杂交或结合)识别靶RNA的一RNA序列,和
(2)在其3'末端:(i)能够结合或缔合Cas9多肽的RNA序列(结合Cas9多肽的“支架
列”),或(ii)接头,其与所述Cas9多肽结合或共价或非共价连接1所述sgRNA的5'RNA杂交或结合末端,
其中任选地所述核蛋白复合物不包含PAMmer寡核苷酸,
且任选地所述Cas9多肽:
(1)是或来源于细菌或古细菌Cas9多肽,
(2)缺少对应的野生型(WT)Cas9多肽的结构域或结构域的一部分,其中所述结构域任选地是Cas9的HNH和/或RuvC核酸酶结构域,包含ββα-金属折叠,所述ββα-金属折叠包含或包括Cas9多肽的活性部位或其组合;
(3)缺乏DNA酶或DNA切割的能或活性、切口酶活性或其组合,其中任选地,通过修饰(突变)或去除全部或部分HNH和/或RuvC Cas9的核酸酶结构域、Cas9多肽DNA酶活性位点或包含Cas9多肽活性位点的ββα-金属折叠或其组合,以去除DNase或DNA切割能力或活性,(4)缺少Cas9的HNH和/或RuvC核酸酶结构域、Cas9多肽DNase活性位点、包含Cas9多肽活性位点的ββα-金属折叠或其组合的全部或部分,从而任选地减小多肽的尺寸,任选地促进将Cas9编码核苷酸包装在病毒或其他递送载体中,或
(5)是WT Cas9多肽的变体,并且具有一个或多个基酸突变,其导致相对于相应的WT Cas9多肽的DNase或核酸酶活性降低,
或任选地,古细菌或细菌Cas9多肽是、包含或源自:地中海富盐菌(Haloferax 
mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀性巴氏杆菌(Pasteu rella 
multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9 CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor salsuginis str)DSM 16511株、食清洁剂细小棒菌
(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis),灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter 
diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare),Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus  johnsonii)、伪中间型葡萄球菌(Staphylococcus 
pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema 
denticola)、嗜军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus)和新凶手弗朗西菌(Francisella novicida)(任选地是新凶手弗朗西菌Cpfl)或格氏嗜盐杆菌(Natronobacterium gregoryi)的Argonaute蛋白,其被修饰或赋予新用途以靶向RNA,其中任选地sgRNA 3'末端或“支架序列”包含每一个这些相应细菌或古细菌生物中的野生型(WT)或源自野生型的同源向导核酸的全部或部分。
2.根据权利要求1所述工程化的核蛋白复合物,其中所述sgRNA的5'RNA-杂交或结合末端的长度在约15到25,或20、21、22个核苷酸之间,并且能够结合或缔合所述Cas9多肽的所述RNA序列的长度在约85和100或90、91、92、93、94或95个核苷酸之间,
并且任选地,所述Cas9多肽被改造以适于与效应多肽、靶向剂、酶,和/或可被检测部分缔合、融合或结合或共价或非共价地连接,其中任选地,所述效应多肽包含RNA修饰多肽,其中任选地,所述Cas9多肽是重组或合成多肽,
其中任选地,所述靶RNA是(或通过杂交识别或杂交至或结合到所述靶RNA的RNA序列,与以下RNA反向互补):信使RNA(mRNA)、核糖体RNA(rRNA)、信号识别颗粒RNA(SRP RNA)、转运RNA(tRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、反义RNA(aRNA)、长非编码RNA(lncRNA)、微小RNA(miRNA)、piwi-相互作用RNA(piRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、反转座子RNA、病毒基因组RNA、或病毒非编码RNA。
3.根据权利要求1或2中任一项所述工程核蛋白复合物,其中所述Cas9多肽与所述效应多肽、靶向剂、可检测部分或RNA修饰多肽非共价缔合。
4.根据权利要求1或2中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与所述效应多肽、靶向剂、可检测部分融合或共价相连,
并任选地,效应多肽是或包含RNA修饰多肽,并且任选地,所述靶向剂是或包含:细胞质多聚腺苷酸化元件结合蛋白(CPEB)、锌指结合蛋白(ZBP)、TIA-1(3'UTR mRNA结合蛋白)、PSF(剪接体的种蛋白组分)或PSF的DNA-结合结构域(DBD)、脆性X智力低下蛋白(FMRP)、IGF-II mRNA结合蛋白(IMP)-1(IMP1)、IMP2、IMP3、细胞骨架结合蛋白、跨膜蛋白,或包含这些前述蛋白结构域的组合以产生组合运输现象的工程化蛋白,
并且任选地,该酶参与化合物合成的修饰,任选地,其中所述化合物是多肽或核酸,并且任选地,靶RNA上的Cas9多肽的缔合在生物合成途径中产生中间产物的局部积累,与游离的生物合成酶相比,以放大生产医学上或技术上有用的化合物。
5.权利要求1-4中任一项所述工程化核蛋白复合物,其中所述RNA修饰多肽包含剪接因子或RNA剪接结构域,任选地为含有RBFOX2结构域的蛋白质、已知的影响RNA剪接的蛋白质或RNA切割结构域(核酸内切酶),任选地含有PIN结构域的蛋白质。
6.根据权利要求1-5中任一项所述工程化核蛋白复合物,其中所述Cas9多肽通过所述接头共价结合至所述单向导RNA(sgRNA)。
7.根据权利要求1-6中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在3'末端支架序列中携带RNA二级结构延伸或包含所述RNA二级结构。
8.根据权利要求1至7中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)包含一个或多个点突变,其通过去除部分或完全转录终止序列或通过反式核酸酶的作用使sgRNA在转录后不稳定的序列,使得单向导RNA的表达平提高至少约5%、10%、15%或更多。
9.根据权利要求1-8中任一项所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)在5'端包含改变或附加的核苷酸或化学部分,其使所述单向导RNA稳定以防止被降解。
10.根据权利要求9所述工程化核蛋白复合物,其中所述单向导RNA(sgRNA)的5'端的所述附加的核苷酸或化学部分选自2'O-甲基、硫代磷酸酯和硫代膦酰基乙酸酯键和碱基组成的组,以及任选地,用于化学稳定的所述改变或附加化学部分包含2'-F核酸(LNA)、2'-O-甲酰乙基或解锁核酸(UNA)。
11.根据权利要求1-10中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含一种或多种甲基膦酸酯、硫代磷酸酯或硫代磷酸酯键,任选地将所述sgRNA上的RNA核酸酶活性降低至少约5%、10%、15%或更多。
12.根据权利要求1-11中任一项所述工程化核蛋白复合物,其中所述单向导RNA
(sgRNA)在5'末端包含改变或附加的核苷酸或化学部分,其将RNA靶向性提高至少约5%、
10%、15%或更多。
13.根据权利要求1-12中任一项所述工程化核蛋白复合物,其中所述单向导RNA在所述sgRNA的间隔区或支架区中包含2'-氟、2'O-甲基和/或2'-甲基乙基碱基修饰,以提高靶向识别或降低单向导RNA上的核酸酶活性至少约5%、10%、15%或更多。
14.根据权利要求1-13中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含足够的与所述靶RNA反义的序列,以允许其在生理条件下与靶RNA的至少约5%、10%、15%,或约5%和20%之间或更多进行杂交。
15.根据权利要求1-14中任一项所述工程化核蛋白复合物,其中所述单向导RNA包含与所述靶RNA的至少一部分反义或互补的序列,其中所述部分任选地至少为约5%、10%、15%或更多的靶RNA,或为约5%至20%之间或更多的目标RNA。
16.根据权利要求1-15中任一项所述工程化核蛋白复合物,还包含CRISPR-靶向RNA
(crRNA)和反式激活cRNA(tracrRNA),其中所述Cas9多肽与结合了反式激活cRNA
(tracrRNA)的CRISPR-靶向RNA(crRNA)复合或连接,或共价或非共价缔合。
17.根据权利要求1-16中任一项所述工程化核蛋白复合物,其中所述RNA修饰多肽进一步与一反义寡核苷酸复合,或共价或非共价连接。
18.根据权利要求17所述工程化核蛋白复合物,其中所述反义寡核苷酸包含至少一个修饰的核苷酸。
19.根据权利要求18所述工程核蛋白复合物,其中所述至少一个修饰的核苷酸选自2'OMe RNA和2'OMe DNA核苷酸。
20.根据权利要求1-19中任一项所述工程化核蛋白复合物,其中所述核蛋白复合物还包含PAMmer寡核苷酸,并且任选地所述PAMmer还携带保持由sgRNA所赋予的靶特异性所需的5'突出端。
21.根据权利要求20所述工程化核蛋白复合物,其中所述PAMmer寡核苷酸包含一个或多个修饰的碱基或接头。
22.根据权利要求21所述工程化核蛋白复合物,其中所述一个或多个修饰的碱基或接头选自锁核酸和稳定核酸酶的接头组成的组。
23.根据权利要求1至22中任一项所述工程化核蛋白复合物,其中所述工程化核蛋白复合物被改造以适于被输送到细胞的细胞核。
24.根据权利要求23所述工程化核蛋白复合物,其中所述工程化核蛋白复合物被改造以适于与靶RNA共同被运送到所述细胞核外。
25.根据权利要求23或24中所述工程化核蛋白复合物,其中所述CAS9多肽包含或进一步包含,任选地融合到或连接到核定位信号、一个或多个连接肽、XTEN肽或任选地SV40核定位信号。
26.根据权利要求1-25中任一项所述工程化核蛋白复合物,其中所述Cas9多肽无核酸酶活性。
27.根据权利要求1-26中任一项所述工程化核蛋白复合物,其中所述靶RNA包含重复序列,并且通过杂交(与靶RNA杂交或结合)识别的所述5'末端RNA序列包含一能够杂交到或互补到所述重复序列上的序列。
28.根据权利要求27所述工程化核蛋白复合物,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
29.根据权利要求27或28所述工程化核蛋白复合物,其中所述靶RNA与疾病或病症或感染相关,并且任选地所述疾病或病症由RNA微卫星重复扩增引起或与之相关。
30.根据权利要求29所述工程核蛋白复合物,其中所述疾病、病症或感染选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良、脆性X染色体综合征、病毒或细菌感染、其中任选地所述病毒感染是疱疹病毒科或单纯疱疹病毒、人免疫缺陷病毒、Epstein-Barr病毒、肝炎病毒、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、寨卡病毒、肠病毒、人乳头瘤病毒(HPV)、流感病毒、尔堡病毒、埃博拉病毒、腮腺炎病毒、巨细胞病毒、轮状病毒、疹病毒、水痘带状疱疹病毒、严重急性呼吸综合征(SARS)冠状病毒、副粘病毒科或麻疹病毒、西尼罗河病毒、黄热病病毒或登革热病毒感染。
31.根据权利要求1-30中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与效应多肽缔合,其中所述多肽是毒蛋白。
32.根据权利要求1-31中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与效应多肽、靶向剂、酶或可检测试剂或部分融合、结合或缔合,其中任选地所述Cas9多肽是重组或合成多肽。
33.根据权利要求32所述工程化核蛋白复合物,其中所述可检测试剂或部分包含已融合或连接于所述Cas9多肽的可检测多肽或组合物。
34.根据权利要求33所述工程化核蛋白复合物,其中所述可检测多肽包含当所述可检测多肽处于细胞核时失活的多肽。
35.根据权利要求34所述工程化核蛋白复合物,其中当所述可检测多肽处于细胞核内时,所述可检测多肽不可检测,但当所述可检测多肽不在细胞核内时,所述可检测多肽是可检测的。
36.根据权利要求35所述工程化核蛋白复合物,其中所述可检测多肽当其不在细胞核内时通过与另一种可检测试剂缔合而成为可检测的。
37.根据利要求32-36中任一项所述工程化核蛋白复合物,其中所述可检测多肽是荧
光、分裂荧光或发光多肽,或所述可检测试剂或部分包含荧光,分裂荧光或发光试剂。
38.根据权利要求37所述工程化核蛋白复合物,其中所述荧光多肽包含或者是绿色荧光蛋白(GFP)或增强的GFP。
39.根据权利要求1-38中任一项所述工程化核蛋白复合物,其中所述单向导RNA
(sgRNA)包含一个或多个点突变,所述点突变通过去除部分或全长的转录终止序列或通过反式作用核酸酶的作用在转录后使单导向RNA不稳定的序列,其将单向导RNA表达水平提高至少5%、10%、15%或更多。
40.根据权利要求1-39中任一项所述工程化核蛋白复合物,其中所述Cas9多肽与一结合反式激活cRNA(tracrRNA)的CRISPR-靶向RNA(crRNA)复合。
41.根据权利要求1-40中任一项所述工程化核蛋白复合物,其中所述Cas9多肽进一步与反义寡核苷酸复合,其中所述反义寡核苷酸包含与靶RNA中的序列互补的PAMmer寡核苷酸。
42.根据权利要求41所述工程化核蛋白复合物,其中所述PAMmer寡核苷酸包含至少一个修饰的核苷酸。
43.根据权利要求20所述工程化核蛋白复合物,其中所述至少一种修饰的核苷酸选自
2'OMe RNA和2'OMe DNA核苷酸。
44.根据权利要求1-43中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于被递送至细胞的细胞核。
45.根据权利要求44所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于和靶RNA共同被输出到所述细胞核以外。
46.包含编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地为一种或多种载体,其中所述载体任选地为、包含或来源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
47.一细胞包含,或其中含有:
(a)根据权利要求1-45中任一项所述工程化的核蛋白复合物;或
(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地为一种或多种载体,
其中任选地所述细胞是哺乳动物细胞或人类细胞。
48.编码权利要求1-45中任一项所述工程化核蛋白复合物的嵌合核酸,其中任选地所述核酸是重组或合成核酸,其中任选地所述核酸可操作地连接于组成型或可诱导的启动子。
49.根据权利要求48所述核酸,其中所述Cas9多肽、sgRNA、PAMmer寡核苷酸、效应多肽、可检测部分或其组合中的一种或多种的表达受可调节或组成型启动子控制。
50.包含权利要求48或49所述核酸的载体,其中任选地,所述载体为、包含或来源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
51.一种细胞或组织,其包含:根据权利要求1-45中任一项所述工程化核蛋白复合物;
根据权利要求48或49所述核酸;或根据权利要求50所述载体。
52.一种治疗预防、改善或减轻哺乳动物或人类受试者中疾病或病症或感染症状的方法,包括给予所述哺乳动物或人类受试者:
(a)根据权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于和一效应多肽缔合或结合或共价或非共价连接,其中任选地所述效应多肽包含RNA修饰多肽;或
(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地为一种或多种载体,其中所述Cas9多肽被改造以适于和效应多肽缔合或结合或共价或非共价连接,其中任选地所述效应多肽包含RNA修饰多肽,并且其中所述一种或多种核酸在胞内表达并表达所述工程化核蛋白复合物,
(c)药物组合物,包含
(i)权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于与效应多肽缔合或结合或共价或非共价连接,其中任选地所述效应多肽包含RNA修饰多肽;或
(ii)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地一种或多种载体,其中所述Cas9多肽被改造以适于与效应多肽缔合或共价或不共价共价连接,其中任选地所述效应多肽包含RNA修饰多肽和任选地赋形剂,
并且任选地所述药物组合物配制用于肠内或肠胃外递送;或用于经静脉内(IV)递送;

(d)权利要求51所述细胞或组织;
从而修饰细胞中的RNA并治疗、预防或改善或减轻疾病或病症的症状或感染,
其中任选地,将所述工程化核蛋白复合物或编码所述Cas9多肽的核酸或载体携带或包含在纳米颗粒、颗粒、胶束或脂质体或脂质复合物、聚合物囊泡、多聚复合物或树枝状聚合物中,其任选地还可以包含或表达细胞穿透部分或肽。
53.根据权利要求52所述方法,其中编码所述工程化核蛋白复合物的一种或全部组分的一种或多种核酸由单个载体携带或包含,或各组分(所述Cas9多肽、所述sgRNA、所述效应多肽或组分的组合)被携带或包含于单独的载体中,
并且任选地所述载体是腺病毒载体,或腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
54.根据权利要求52或53所述方法,其中所述Cas9多肽、所述sgRNA、所述PAMmer寡核苷酸、所述效应多肽或其组合中的一种或多种的表达受可调节或组成型启动子控制。
55.根据权利要求52-54中任一项所述方法,其中编码所述单向导导RNA(sgRNA)的核酸由编码所述Cas9多肽的核酸携带或包含在相同的载体中,任选地为腺病毒或AAV载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
56.根据权利要求52-55中任一项所述方法,其中编码所述sgRNA的核酸和编码所述
Cas9多肽的核酸被携带或包含在不同载体中,任选地为腺病毒或AAV载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
57.根据权利要求52-56中任一项所述方法,其中编码所述效应多肽的核酸,任选地RNA修饰多肽由相同载体携带或携带或包含在单独的载体中,任选地为AAV载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
58.根据权利要求52-57中任一项所述方法,其中所述地疾病或病症由选自CTG、CCTG、CAG、GGGGCC及其任何组合的重复序列引起。
59.根据权利要求52-58所述方法,其中所述疾病,病症或感染由RNA微卫星重复扩增引起或与之相关,或选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓肌肉萎缩、脊髓小脑共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良、脆性X染色体综合征、病毒或细菌感染、其中任选地所述病毒感染是疱疹病毒或单纯疱疹病毒、人免疫缺陷埃博病毒、EB病毒、肝炎病毒、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、寨卡病毒、肠道病毒、人乳头瘤病毒(HPV)、流感病毒、马尔堡病毒、埃博拉病毒、腮腺炎病毒、巨细胞病毒、轮状病毒、风疹病毒、水痘带状疱疹病毒、严重急性呼吸综合征(SARS)冠状病毒、副粘病毒科或麻疹病毒、西尼罗病毒、黄热病病毒或登革热病毒感染。
60.根据权利要求52-59中任一项所述方法,其中所述给药途径选自口服、肺部、腹膜内(ip)、静脉内(iv)、肌内(im)、皮下(sc)、经皮、面颊、鼻、舌下、眼睛、直肠和阴道
61.一种表达权利要求1-45中任一项所述工程化核蛋白复合物的方法,其包括在所述细胞表达所述核蛋白复合物的条件下,将权利要求46或50的载体或权利要求48或49的核酸引入细胞中。
62.一种追踪靶RNA或测量细胞中靶RNA量的方法,包括对细胞施用权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接至可检测部分,并使所述工程化核蛋白复合物结合所述细胞中的所述靶RNA,以确定所述靶的RNA在所述细胞中的位置或确定所述细胞中所述靶RNA的量。
63.根据权利要求61的方法,其中所述工程化核蛋白复合物结合所述细胞的核中的所述靶RNA,并随后从所述核中与所述靶RNA共同输出。
64.根据权利要求63或64中任一项所述方法,其中使用荧光显微镜或其等同物来确定所述细胞中所述靶RNA的位置或所述细胞中所述靶RNA的量。
65.一种体外或体内修饰细胞中靶RNA的量或结构的方法,其包括在所述细胞中的所述靶RNA的量或结构被修饰的条件下,允许权利要求1-45中任一项所述工程化核蛋白复合物与所述细胞中的所述靶RNA结合,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接到效应多肽,其中任选地所述效应多肽包含RNA修饰多肽。
66.一种体外或体内修饰细胞中一靶RNA的量或结构的方法,包括在所述细胞中所述靶RNA的量或结构被修饰的条件下,表达权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种组分,其中所述Cas9多肽被改造以适于缔合,或结合或共价或非共价连接到效应多肽上,其中任选地所述效应多肽包含RNA修饰多肽,其中所述工程化核蛋白复合物的所述一种或多种组分包含Cas9多肽、sgRNA、PAMmer寡核苷酸、效应蛋白、可检测部分或其组合。
67.一种测量一样品中RNA量或动力学的方法,其包括:引入权利要求1-45中任一项所述工程化核蛋白复合物进入所述样品,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价地连接一可检测部分;并且
观察、检测或测量所述样品中可检测试剂的量。
68.根据权利要求67所述方法,其包括在表达所述Cas9多肽的条件下将权利要求48或
49所述核酸或权利要求46或50所述载体引入所述样品。
69.根据权利要求67或68所述方法,还包括引入单向导RNA。
70.根据利要求67-69中任一项所述方法,还包括引入PAMmer寡核苷酸。
71.根据权利要求67-70中任一项所述方法,其中所述样品包含或来源自组织、活检、血清或血液样本或痰样本。
72.根据权利要求67-71中任一项所述方法,其中所述样本包含多个细胞。
73.根据权利要求67-72中任一项所述方法,包括测量所述样品中的靶RNA的表达水平或丰度。
74.根据权利要求67-73中任一项所述方法,其包括基于所述样品中所述靶RNA的表达水平或丰度诊断所述样品或所述样品来源的个体的疾病,病症或感染,并且任选地,所述靶RNA源自病毒或细菌感染,其中任选地所述病毒感染是疱疹病毒科或单纯疱疹病毒、人免疫缺陷病毒、EB病毒、肝炎病毒、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、寨卡病毒、肠道病毒、人乳头瘤病毒(HPV)、流感病毒、马尔堡病毒、埃博拉病毒、腮腺炎病毒、巨细胞病毒、轮状病毒、风疹病毒、水痘带状疱疹病毒、严重急性呼吸系统综合症(SARS)冠状病毒、副粘液病毒科或麻疹病毒、西尼罗河病毒、黄热病毒或登革热病毒感染。
75.根据权利要求67-74中任一项所述方法,其中所述靶RNA包含重复序列。
76.根据权利要求75所述方法,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC和其任何组合。
77.根据权利要求75或76所述方法,其中所述重复序列与疾病、病症或感染相关。
78.根据权利要求77所述方法,其中所述疾病或病症由RNA微卫星重复扩增引起或与之相关,或选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良和脆性X综合征。
79.一种修饰样品中的靶RNA的方法,包括:
引入权利要求1-44中任一项所述工程化核蛋白复合物进入所述样品,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接至一效应多肽,其中任选地所述效应多肽包含一RNA将多肽修饰成所述样品;和
使用所述RNA修饰多肽修饰所述样品中的所述靶RNA。
80.根据权利要求79所述方法,其包括在表达所述Cas9多肽的条件下将权利要求45或
49所述核酸或权利要求50所述载体引入所述样品中。
81.根据利要求79或80所述方法,还包括引入单向导RNA。
82.根据权利要求79-81中任一项所述方法,还包括引入PAMmer寡核苷酸。
83.根据权利要求79-82中任一项所述方法,其中所述样品包括组织。
84.根据权利要求79-83中任一项所述方法,所述样本包括多个细胞。
85.根据权利要求79-84中任一项所述方法,包括改变所述样品中的靶RNA的量。
86.根据权利要求85所述方法,其中所述靶RNA包含重复序列。
87.根据权利要求86所述方法,其中所述重复序列选CTG、CCTG、CAG、GGGGCC及其任何组合。
88.根据权利要求86或87所述方法,其中所述重复序列与疾病相关。
89.根据权利要求88所述方法,其中所述疾病由RNA微卫星重复扩增引起或与之相关,或选自肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脊髓小脑性共济失调、脆性X相关性震颤/共济失调综合征、脊髓球肌营养不良、眼咽肌营养不良和脆性X综合征。
90.一种药物组合物,包含
(a)权利要求1-45中任一项所述工程化核蛋白复合物,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接到效应多肽,其中任选地所述效应多肽包含RNA修饰多肽;或
(b)编码权利要求1-45中任一项所述工程化核蛋白复合物的一种或多种核酸,任选地一种或多种载体,其中所述Cas9多肽被改造以适于缔合或结合或共价或非共价连接到效应多肽,其中任选地所述效应多肽包含RNA修饰多肽,
和任选地赋形剂,
并且任选地所述药物组合物的配制适于肠内或肠胃外递送,或者适于静脉内(IV)递
送。
91.根据权利要求90所述药物组合物,其中所述工程化核蛋白复合物或编码所述核蛋白复合物的核酸或载体承载在纳米颗粒、颗粒、胶束或脂质体或脂质复合体、聚合物体、聚合物复合物或树状聚合物中,优选地其还可以包含或表达细胞穿透部分或肽。
92.根据权利要求91所述药物组合物,其中所述纳米颗粒或颗粒包含脂质、聚合物、水凝胶或其组合。
93.根据权利要求90-93中任一项所述药物组合物,其中所述sgRNA与所述Cas9多肽包含在相同的载体中,或与所述Cas9多肽包含在不同的载体中。
94.根据权利要求90-94中任一项所述药物组合物,其中编码所述Cas9多肽的核酸和编码所述sgRNA的核酸在一个或多个载体中携带,任选地为腺病毒载体或腺相关病毒(AAV)载体、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
95.一种重组或合成的Cas9多肽,其中所述地Cas9多肽:
(a)是或来源于细菌或古细菌Cas9多肽;和
(b)
(i)缺少相应的野生型(WT)Cas9多肽的结构域或结构域的一部分,其中任选地所述结构域是Cas9的HNH和/或RuvC核酸酶结构域,包含ββα-金属折叠,所述ββα-金属折叠包含或包括Cas9多肽活性位点,或其组合;
(ii)缺少DNase或DNA切割能力或活性,或切口酶活性,其中任选地,所述DNase或DNA切割能力或活性通过修饰(突变)或去除全部或部分Cas9的HNH和/或RuvC核酸酶结构域、Cas9多肽DNA酶活性位点或包含Cas9多肽活性位点的ββα-金属折叠或其组合,
(iii)缺少全部或部分:Cas9的HNH和/或RuvC核酸酶结构域,Cas9多肽DNase活性位点或包含Cas9多肽活性位点的ββα-金属折叠,或其组合,从而任选地减少了所述多肽的尺寸,任选地促进了将Cas9编码核苷酸包装在病毒或其他递送载体中,或
(iv)是WT Cas9多肽的变体,并且具有一个或多个氨基酸突变,导致相对于相应的WT Cas9多肽的DNase或核酸酶活性降低,
并且任选地,所述古细菌或细菌Cas9多肽是,包含或源自:地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀性巴氏杆菌(Pasteu rella 
multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor salsuginis str)DSM 16511株、食清洁剂细小棒菌
(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis),灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter 
diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare),Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus  johnsonii)、伪中间型葡萄球菌(Staphylococcus 
pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema 
denticola)、嗜肺军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus)和新凶手弗朗西菌(Francisella novicida)(任选地是新凶手弗朗西菌Cpfl)或格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute蛋白,其被修饰或赋予新用途以靶向RNA,
其中任选地,所述Cas9多肽还包含sgRNA,其中任选地所述sgRNA包含能够结合或缔合所述Cas9多肽的“支架序列”,所述Cas9多肽包含全部或部分或源自野生型(WT)野生型(WT)细菌或古细菌生物体的同源的向导核酸,其产生Cas9多肽,
并且任选地所述sgRNA在其5'末端还包含通过杂交(与靶RNA杂交或结合)识别靶RNA的RNA序列,
并且任选地,所述Cas9多肽被改造以适于缔合、融合或结合或共价或非共价连接至效应多肽、靶向剂、酶和/或可检测部分,其中任选地所述效应多肽包含RNA修饰多肽。
96.一种编码权利要求95所述Cas9多肽的重组或合成核酸,其中任选地,所述核酸是编码权利要求95所述Cas9多肽和sgRNA的嵌合核酸。
97.一种载体,其包含或含有权利要求98所述核酸,其中任选地所述载体为、包含或源自腺病毒、腺相关病毒(AAV)、逆转录病毒、单纯疱疹病毒、人免疫缺陷病毒(HIV)或合成载体。
98.一种细胞或组织,其包含或含有权利要求95所述Cas9多肽或权利要求96所述核酸。
99.一种Cas9多肽,其被工程化以识别靶RNA,并被改造以适于与一RNA修饰多肽缔合。
100.根据权利要求99所述Cas9多肽,其中所述Cas9多肽被改造以适于非共价地与所述RNA修饰多肽缔合。
101.根据权利要求100所述Cas9多肽,其中所述Cas9多肽与所述RNA修饰多肽融合。
102.根据权利要求99-101中任一项所述Cas9多肽,其中所述RNA修饰多肽是剪接因子。
103.根据权利要求99-102中任一项所述Cas9多肽,其中所述Cas9多肽与单向导RNA复合。
104.根据权利要求103所述Cas9多肽,其中所述单向导RNA在所述单向导RNA支架序列中携带二级结构的延伸。
105.根据权利要求103或104中任一项所述Cas9多肽,其中所述单向导RNA包含一个或多个点突变,所述点突变通过去除部分或全长转录终止序列或去除在转录后通过反式作用核酸酶的作用使单向导RNA不稳定的序列来提高所述单向导RNA的表达水平。
106.根据权利要求103-105中任一项所述Cas9多肽,其中所述单向导RNA在5'末端包含使所述单向导RNA稳定以防被降解的改变。
107.根据权利要求103-106中任一项所述Cas9多肽,其中所述单向导RNA在5'端包含改进RNA靶向性的改变。
108.根据权利要求107中任一项所述Cas9多肽,其中所述单向导RNA的5'端的所述改变选自2'O-甲基、硫代磷酸酯和硫代膦酰基乙酸酯键和碱基。
109.根据权利要求103-108中任一项所述Cas9多肽,其中所述单向导RNA包含位于所述sgRNA的间隔区或支架区中的2'-氟、2'O-甲基和/或2'-甲氧基乙基碱基修饰,以提高靶标识别或降低所述单向导RNA上的核酸酶活性。
110.根据权利要求103-109中任一项所述Cas9多肽,其中所述单向导RNA包含降低所述靶RNA上的核酸酶活性的一种或多种甲基膦酸酯、硫代磷酸酯或硫代磷酸酯键。
111.根据权利要求103-110中任一项所述Cas9多肽,其中所述单向导RNA与所述靶RNA的至少一部分杂交。
112.根据权利要求103-111中任一项所述Cas9多肽,其中所述单向导RNA包含与所述靶RNA的至少一部分互补的序列。
113.根据权利要求103-112中任一项所述Cas9多肽,其中所述Cas9多肽与成簇的规律间隔短回文重复(CRISPR)-靶向RNA(crRNA)和反式激活cRNA(tracrRNA)的组合复合。
114.根据权利要求103-113中任一项所述Cas9多肽,其中所述RNA修饰多肽进一步与反义寡核苷酸复合。
115.根据权利要求114所述Cas9多肽,其中所述反义寡核苷酸包含至少一个修饰的核苷酸。
116.根据权利要求115所述Cas9多肽,其中所述至少一个修饰的核苷酸选自2'OMe RNA和2'OMe DNA核苷酸。
117.根据权利要求114-116中任一项所述Cas9多肽,其中所述反义寡核苷酸包含
PAMmer寡核苷酸。
118.根据权利要求117所述Cas9多肽,其中所述PAMmer寡核苷酸包含一个或多个修饰的碱基或接头。
119.根据权利要求118所述Cas9多肽,其中所述一个或多个修饰的碱基或接头选自锁核酸和稳定核酸酶的接头组成的组。
120.根据权利要求119中任一项所述Cas9多肽,其中所述Cas9多肽被改造以适于递送至细胞的细胞核。
121.根据权利要求120所述Cas9多肽,其中所述Cas9多肽被改造以适于与靶RNA共同输出到所述细胞核外。
122.根据权利要求120或121中任一项所述Cas9多肽,其中所述Cas9多肽包含核定位信号。
123.根据权利要求99-122中任一项所述Cas9多肽,其中所述Cas9多肽是无核酸酶的。
124.根据权利要求103-123中任一项所述Cas9多肽,其中所述靶RNA包含重复序列。
125.根据权利要求124所述Cas9多肽,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
126.根据权利要求124或125所述Cas9多肽,其中所述靶RNA与一疾病相关。
127.根据权利要求126所述Cas9多肽,其中所述疾病选自强直性肌营养不良,亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症和脆性X综合征。
128.一种治疗或改善人受试者中疾病的方法,包括向所述人受试者施用一编码权利要求99-127中任一项所述Cas9多肽的核酸。
129.根据权利要求128所述方法,其中所述编码Cas9多肽的核酸由腺相关病毒(AAV)载体携带。
130.根据权利要求128或129所述方法,还包括施用编码sgRNA的核酸。
131.根据权利要求130所述方法,其中所述编码sgRNA的核酸由所述AAV载体携带。
132.根据权利要求131所述方法,其中所述编码sgRNA的核酸由第二AAV载体携带。
133.根据权利要求128-132中任一项所述方法,其中所述疾病由选自CTG、CCTG、CAG、GGGGCC及其任何组合的重复序列引起。
134.根据权利要求128-133中任一项所述方法,所述疾病选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症和脆性X综合征。
135.根据权利要求128-134中任一项所述方法,其中所述给药途径选自口服、肺部、腹膜内(ip)、静脉内(iv)、肌内(im)、皮下(sc)、透皮、面颊、鼻、舌下、眼睛、直肠和阴道。
136.一种药物组合物,其包含一编码权利要求99-127中任一项所述Cas9多肽的核酸和赋形剂。
137.根据权利要求136所述药物组合物,其中编码Cas9多肽的核酸携带在纳米颗粒中。
138.根据权利要求137所述药物组合物,其中所述纳米颗粒包含脂质、,聚合物、水凝胶或其组合。
139.根据权利要求136-138中任一项所述药物组合物,还包含编码所述sgRNA的核酸。
140.根据权利要求136-139中任一项所述药物组合物,其中编码所述Cas9多肽的核酸或编码所述sgRNA的核酸在一种或多种腺相关病毒(AAV)载体中携带。
141.一种经工程化改造以识别靶RNA的Cas9多肽,其中所述Cas9多肽与可检测试剂缔合。
142.根据权利要求141所述Cas9多肽,其中所述可检测试剂包含与所述Cas9多肽融合的可检测多肽。
143.根据权利要求142所述Cas9多肽,其中所述可检测多肽包含当所述可检测多肽处于细胞核时失活的多肽。
144.根据权利要求143所述Cas9多肽,其中当所述可检测多肽处于细胞核内时,所述可检测多肽不可检测,但当所述可检测多肽不在细胞核内时,所述可检测多肽是可检测的。
145.根据权利要求144所述Cas9多肽,其中所述可检测多肽当其不在所述细胞的细胞核中时,通过与可检测的另一种试剂的缔合而可被检测。
146.根据权利要求141-145中任一项所述Cas9多肽,其中所述可检测多肽是荧光多肽。
147.根据权利要求146所述Cas9多肽,其中所述荧光多肽包含增强的GFP。
148.根据权利要求141-147中任一项所述Cas9多肽,其中所述Cas9多肽与单向导RNA复合。
149.根据权利要求148所述Cas9多肽,其中所述单向导RNA在所述单向导RNA支架序列中携带二级结构的延伸。
150.根据权利要求148或149中任一项所述Cas9多肽,其中所述单向导RNA包含一个或多个点突变,其通过去除部分或全长转录终止序列或去除在转录后通过反式作用核酸酶的作用使单向导RNA不稳定的序列来提高所述单向导RNA的表达水平。
151.根据权利要求148-150中任一项所述Cas9多肽,其中所述单向导RNA在5'末端包含使所述单向导RNA稳定以防被降解的改变。
152.根据权利要求148-151中任一项所述Cas9多肽,其中所述单向导RNA在5'末端包含改进RNA靶向性的改变。
153.根据权利要求148-152中任一项所述Cas9多肽,其中所述单向导RNA的5'端的所述改变选自2'O-甲基、硫代磷酸酯和硫代膦酰基乙酸酯键和碱基。
154.根据权利要求148-153中任一项所述Cas9多肽,其中所述单向导RNA包含位于所述sgRNA的间隔区或支架区中的2'-氟、2'O-甲基和/或2'-甲氧基乙基碱基修饰,以提高靶标识别或降低所述单向导RNA上的核酸酶活性。
155.根据权利要求148-154中任一项所述Cas9多肽,其中所述单向导RNA包含降低靶
RNA上的核酸酶活性的一种或多种甲基膦酸酯、硫代磷酸酯或硫代磷酸酯键。
156.根据权利要求148-155中任一项所述Cas9多肽,其中所述单向导RNA与靶RNA的至少一部分杂交。
157.根据权利要求148-156中任一项所述Cas9多肽,其中所述单向导RNA包含与靶RNA的至少一部分互补的序列。
158.根据权利要求148-157中任一项所述Cas9多肽,其中所述Cas9多肽与CRISPR-靶向RNA(crRNA)结合反式激活cRNA(tracrRNA)复合。
159.根据权利要求148-158中任一项所述Cas9多肽,其中所述Cas9多肽进一步与反义寡核苷酸复合,所述反义寡核苷酸与靶RNA中的序列互补。
160.根据权利要求159所述Cas9多肽,其中所述反义寡核苷酸包含至少一个修饰的核苷酸。
161.根据权利要求160所述Cas9多肽,其中所述至少一个修饰的核苷酸选自2'OMe RNA和2'OMe DNA核苷酸。
162.根据权利要求159-161中任一项所述Cas9多肽,其中所述反义寡核苷酸包含
PAMmer寡核苷酸。
163.根据权利要求162所述Cas9多肽,其中所述PAMmer寡核苷酸包含一个或多个修饰的碱基或接头。
164.根据权利要求163所述Cas9多肽,其中所述一个或多个修饰的碱基或接头选自锁核酸和稳定核酸酶的接头组成的组。
165.根据权利要求141-164中任一项所述Cas9多肽,其中所述Cas9多肽被改造以适于递送至细胞的细胞核。
166.根据权利要求165所述Cas9多肽,其中所述Cas9多肽被改造以适于与靶RNA共同输出到所述细胞核外。
167.根据权利要求165或166中任一项所述Cas9多肽,其中所述Cas9多肽包含核定位信号。
168.根据权利要求141-177中任一项所述Cas9多肽,其中所述Cas9多肽是无核酸酶的。
169.根据权利要求141-168中任一项所述Cas9多肽,其中所述靶RNA包含重复序列。
170.根据权利要求169所述Cas9多肽,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
171.根据权利要求169或170所述Cas9多肽,其中所述靶RNA与疾病相关。
172.根据权利要求171所述Cas9多肽,其中所述疾病选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩和脆性X综合征。
173.一种编码权利要求141-172中任一项所述Cas9多肽的核酸。
174.一种包含权利要求173所述核酸的载体。
175.一种包含权利要求173所述核酸或权利要求174所述载体的细胞。
176.一种表达权利要求141-172中任一项所述Cas9多肽的方法,包括在细胞表达所述Cas9多肽的条件下,将权利要求172所述核酸或权利要求174所述载体引入所述细胞中。
177.一种追踪靶RNA或测量细胞中靶RNA的量的方法,其包括使权利要求141-172中任一项所述Cas9多肽结合所述细胞中的所述靶RNA,并确定所述靶RNA在所述细胞中的位置或确定所述细胞中的所述靶RNA的量。
178.根据权利要求177所述方法,其中所述Cas9多肽在所述细胞的细胞核中与所述靶RNA结合,且随后与所述靶RNA从所述细胞核共同输出。
179.根据权利要求177或178中任一项所述方法,其中使用荧光显微镜来确定所述细胞中所述靶RNA的位置或所述细胞中所述靶RNA的量。
180.一编码权利要求99-127中任一项所述Cas9多肽的核酸。
181.一种包含权利要求180所述核酸的载体。
182.一种包含权利要求180所述核酸或权利要求181所述载体的细胞。
183.一种表达权利要求99-127中任一项所述Cas9多肽的方法,包括在细胞表达所述
Cas9多肽的条件下,将权利要求180所述核酸或权利要求181所述载体引入所述细胞中。
184.一种修饰细胞中一靶RNA的量或结构的方法,其包括在所述细胞中的所述靶RNA的量或结构被修饰的条件下使权利要求99-127中任一项所述Cas9多肽结合所述靶RNA。
185.一种测量样品中RNA含量或动力学的方法,包括:将权利要求141-172中任一项所述Cas9多肽引入所述样品;并观察所述样品中的可检测试剂。
186.根据权利要求185所述方法,其包括在表达所述Cas9多肽的条件下,将权利要求
131所述核酸或权利要求132所述载体引入所述样品。
187.根据权利要求87或88所述方法,还包括引入一单向导RNA。
188.根据权利要求87-89中任一项所述方法,还包括引入一反义寡核苷酸。
189.根据权利要求87-90中任一项所述方法,其中所述样品包含组织。
190.根据权利要求87-91中任一项所述的方法,其中所述样品包含多个细胞。
191.根据权利要求87-92中任一项所述方法,包括测量所述样品中的靶RNA的含量。
192.根据权利要求93所述方法,包括基于所述样品中的所述靶RNA的含量来诊断所述样品的疾病状况。
193.根据权利要求94所述方法,其中所述疾病选自肌强直性营养不良,亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症和脆性X综合征。
194.一种修饰样品中的靶RNA的方法,包括:
将权利要求141-172中任一项所述Cas9多肽引入所述样品中;并使用所述RNA修饰多肽修饰所述样品中的所述靶RNA。
195.根据权利要求96所述方法,其包括在表达所述Cas9多肽的条件下将权利要求180所述核酸或权利要求181所述载体引入所述样品。
196.根据权利要求194或195所述方法,还包括引入单向导RNA。
197.根据权利要求194-196中任一项所述方法,还包括引入反义寡核苷酸。
198.根据权利要求194-197中任一项所述方法,其中所述样品包含组织。
199.根据权利要求194-198中任一项所述方法,其中所述样品包含多个细胞。
200.根据权利要求194-199中任一项所述方法,包括修饰所述样品中的靶RNA。
201.根据权利要求200所述方法,其中所述靶RNA包含重复序列。
202.根据权利要求201所述方法,其中所述重复序列选自CTG、CCTG、CAG、GGGGCC及其任何组合。
203.根据权利要求201或202所述方法,其中所述重复序列与疾病相关。
204.根据权利要求203所述方法,其中所述疾病选自强直性肌营养不良,亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症和脆性X综合征。
附图说明
图1.与DNA或RNA结合的化脓性链球菌Cas9和单向导RNA(sgRNA)复合物。A:Cas9:sgRNA复合体可能需要称为原始间隔区相邻基序(P AM)的DNA NGG基序。在DNA结合的情况下,PAM由DNA靶标本身提供。Cas9靶向DNA的机制已有大量描述(Sander JD,Joung JK.CRISPR-Cas systems for editing,regulating and targeting genomes.Nat Biotechnol.2014;32(4):347-55;Sternberg SH,Redding S,Jinek  M,Greene EC,Doudna JA.DNA 
interrogation by the CRISPR RNA-guided endonuclease Cas9.Nature.2014;507(7490):62-7;Wu X,riz AJ,Sharp PA.Target specificity of the CRISPR-Cas9 
system.Quant Biol.2014;2(2):59-70;Jiang F,Taylor DW,Chen JS,ornfeld JE,Zhou,Thompson AJ,Nogales E,Doudna JA.Structures of a CRISPR-Cas9 R-loop complex primed for DNA cleavage.Science.2016;351(6275):867-71)。B:在可选的实施方案中,靶向RNA的Cas9(RCas9)依赖于称为PAMmer的短寡核苷酸来提供PAM基序。通过使用错配的PAMmer,实现了RCas9对RNA的特异性,同时避免了编码DNA。PAMmer还携带5'突出端,其是维持由sgRNA赋予的靶特异性所需的。因此,假设PAMmer的5'末端与靶RNA至少部分去杂交,因为Cas9介导的PAMmer:靶RNA双链体的解开可能耗费能量,其当sgRNA与靶RNA杂交时得以恢复。
图2.示例RCas9应用领域的总结。A-D描述了可通过如本文提供的示例性RCas9系统操纵RNA命运的手段。A:核酸酶活性版本的Cas9,可以切割siRNA-难以控制的RNA靶标。B:相反,基因表达可以通过阻止靶RNA降解的拴链因子来扩增。C:在可选的实施方案中,通过将Cas9融合至运输剂,可将RNAs强制或引导至细胞中的不同作用位点,用于局部翻译或其他活动,例如RNA核酸酶活性。D:在可选的实施方案中,通过将Cas9与剪接因子融合来调节前体mRNA的加工,以强制进行差异外显子选择。E:在可选的实施方案中,随着RNA命运改变,RCas9被用于通过分裂发光或荧光蛋白及时追踪追踪RNA丰度,所述分裂发光或荧光蛋白的互补由RNA上相邻Cas9蛋白的结合指导。F:在可选的实施方案中,在FACS分离和随后的研究中使用分裂荧光蛋白,通过罕见细胞的RNA含量,来揭示它们的存在。G:在可选的实施方案中,分裂毒蛋白或将前药转化为其活性形式的分裂毒蛋白通过与Cas9融合以RNA依赖性方式互补。
图3.用靶向RNA的Cas9靶向mRNA。(A)在可选的实施方案中,人细胞中mRNA的RNA-靶向需要向细胞核递送三种组分:SV40核定位信号标记的核酸酶失活的Cas9和融合至C端的EGFP或mCherry(dCas9-EGFP),具有由U6聚合酶III启动子驱动表达的sgRNA,以及由DNA和具有磷酸二酯主链的2'-O-甲基RNA碱基组成的PAMmer。sgRNA和PAMmer与靶mRNA的相邻区域反义,所述靶mRNA编码不携带PAM序列的DNA。在细胞核中形成RCas9/mRNA复合物后,复合物被输出到细胞质中。(B)将RCas9系统和靶向GAPDH的3’UTR的sgRNA和PAMmer、或靶向λ噬菌体序列的sgRNA和PAMmer递送至HE 293T细胞,所述λ噬菌体序列不应存在于人细胞中(靶向序列“N/A”)。细胞核用白色虚线标出。(C)报道了具有细胞质RCas9信号的细胞部分。(D)构建携带与MS2适体相邻的RCas9的靶位点的海肾荧光素酶mRNA。将PEST蛋白质降解信号附加到荧光素酶上,以显示RCas9与mRNA结合的任何翻译效应。(E)与单独的非靶向sgRNA和PAMmer或EGFP相比,在瞬时转染靶向荧光素酶mRNA的RCas9系统后,进行EGFP的RNA免疫沉淀。在类似实验中,比较靶向和非靶向条件之间海肾荧光素酶mRNA和蛋白质的量,其显示RNA丰度(F)或海肾荧光素酶蛋白质(G)的量没有显著变化,这与在MCP-EGFP存在的情况下mRNA的增量加相反。比例尺代表10微米。
图4.用RCas9跟踪β-肌动蛋白mRNA定位。(A)将示例RCas9系统递送至U2OS细胞,并对细胞进行FISH检测β-肌动蛋白mRNA。具有靶向β肌动蛋白mRNA的sgRNA和PAMmer的RCas9与来自λ噬菌体的一段序列反义的非靶向性sgRNA和PAMmer进行比较(“-”sgRNA和“-”PAMmer)。
右侧的假彩色图像用虚线描绘了原子核。(B)使用在每种条件下在60-80个细胞中具有重叠信号的细胞质区域百分比的累积分布来汇总RCas9逐像素分析和Mander重叠系数形式的FISH共定位。显示在右边的频率直方图显示了每个单独条件的重叠程度。在靶向β-肌动蛋白mRNA的sgRNA存在时(p=0.035,双尾Mann-Whitney检验),PAMmer的存在产生了RCas9和FISH之间显著的更明显的共定位。比例尺代表20微米。
图5.追踪mRNA运输至应激颗粒。(A)将靶向β-肌动蛋白mRNA的示例性RCas9系统递送至表达与mCherry融合的G3BP1的HEK293T细胞,G3BP1是已知被有效地转运至应激颗粒的蛋白质。我们用亚砷酸钠氧化应激细胞并测量RCas9和G3BP1的定位。(B)我们测量了应激细胞(200μM亚砷酸钠)中的RCas9和G3BP1信号分布,并报道了RCas9焦点(foci)中G3BP1+应激颗粒的部分。误差条是从三个生物学重复中(总共90-120个细胞)的每一个中的30-40个细胞计算的标准偏差,并且RCas9焦点定义为RCas9信号的累积比周围具有重叠G3BP1焦点的细胞质信号的亮度>50%。(C)使用携带靶向β-肌动蛋白mRNA的RCas9的细胞对运输至应激颗粒的RNA进行实时成像。在零时间,对细胞进行成像并施用亚砷酸钠。60分钟后,对细胞再次成像,并且RCas9和G3BP1阳性应激颗粒的比较显示,仅在存在靶向β-肌动蛋白mRNA的sgRNA和PAMmer的情况下,才存在密切相关的焦点。(D)在类似的实验中,在应激颗粒中靶向β-actin mRNA的RCas9信号的累积随时间追踪。在每个条件下每8分钟追踪8-11个应激颗粒,持续32分钟,其中窄线代表单个颗粒,粗线代表每种条件的平均信号(详细程序参见方法)。
误差条代表标准误差,比例尺表示5微米。
图6.在靶向GAPDH的sgRNA种子序列中存在错配时,dCas9-GFP的核输出程度。引入靶向GAPDH的3'UTR的sgRNA的种子序列中的0、4、8或12个碱基错配,并用RCas9系统转染。共聚焦显微镜评估细胞质信号的程度。一个8碱基错配足以消除细胞质信号。进一步地,非靶向对照与完全错配的种子序列(12个碱基错配)没有区别。细胞核用白色虚线标出。比例尺代表
10微米。
图7A.可选的实施方案(“排列1,排列2”)以及示例性RNA靶向Cas9(RCas9)的用途。排列
1和2描述了在一些实施方案中哪些可能是用示例性靶向RNA的Cas9来测量和操纵RNA的最小组分。所述RCas9系统由化脓性链球菌Cas9蛋白、单向导RNA和被称为PAMmer(排列1)的短寡核苷酸组成,或仅由化脓性链球菌(Streptococcus pyogenes)Cas9蛋白和单向导RNA组成。每个应用例(1-3)描述了RCas9系统在活细胞环境中的不同技术或生物医学示例应用。
应用例1描述了追踪靶RNA,例如含重复序列的RNA的存在、定位和运动,以及在诊断和研究中的应用(支持该应用例的数据在图7B和7C中描述)。含有重复序列的RNA导致许多疾病,包括强直性肌营养不良、家族性ALS、亨廷顿舞蹈病以及许多其他病症。应用例2描述了RCas9在活细胞中的示例性治疗应用,其使用融合内切核酸酶(效应物)蛋白的Cas9摧毁被靶向的RNA。这一普遍原理可以用来切割各种引起疾病的RNA,这些RNA引发了从神经退化到癌症的各种病症。图7D中描述了在靶向导致强直性肌营养不良的含重复序列RNA的情况下支持该应用的数据。RNA剪接应用例3描述了用RCas9改变RNA剪接。功能失调的RNA剪接与许多疾病有关,包括癌症和脊髓性肌萎缩(SMA)。该应用例涉及包含剪接因子或其他改变RNA剪接的蛋白质的效应子,所述效应子靶向前体mRNA以改变剪接。图7E描述了支持该应用例的数据。
图7B-7C.数据显示有效识别含重复序列的RNA(应用例1)。通过将Cas9与荧光蛋白融
合,排列1和2均产生信号分布,其揭示含CUG重复序列的RNA的存在和位置。将这些重复序列用RCas9测量的结果与追踪CUG重复序列(CUG RNA荧光原位杂交,“FISH”)的成熟方法进行比较。下面描述了详细的方法。
图7D.使用示例性RCas9系统显示RNA切割的数据(应用例2)。在此,使用RCas9系统的排列1和2靶向人活细胞中引起强直性肌营养不良(由重复CUG RNA碱基组成)的RNA。应用切割RNA的RCas9系统(应用例2)的排列2导致含CUG重复序列的RNA的量大幅度减少(相比于目前没有RCas9系统~35%RNA水平,最左侧的条)。条形图表示Northern点印迹的定量(下)。
图7E.使用示例性RCas9系统展示RNA剪接改变的数据(应用例3)。在此,剪接由携带外显子6-8的人SMN2的迷你基因组成的前mRNA。通过靶向与外显子7下游的FOX2融合的RCas9,促进了差异剪接的外显子7被包含。已知促进该外显子的包含是脊髓性肌萎缩症的有效治疗方法。条形图是SMN2迷你基因的RT-PCR定量结果。所述迷你基因携带与RCas9结合位点相邻的MS2适体位点,其被与FOX2(MS2-FOX2)融合的MS2外壳蛋白强烈结合。这作为一个阳性对照来证明该外显子受FOX2结合调节。一阴性对照也显示在条形图的最右侧,涉及用GFP替代FOX2,表明需要FOX2来调节该外显子。
图7F.使用示例性RCas9系统展示RNA切割的数据(应用例2)。I型强直性肌营养不良
(DM1)的一个分子标志是MBNL1蛋白在CTG重复序列RNA团簇中的结合(Ho等,2005,J Cell Sci;Batra等,2014,Mol Cell)。在这里,证明了RCas9系统的排列1导致MBNL1蛋白的重新分布,其与不存在重复序列RNA时观察到的分布相同(比较中间和底部行)。图7B-D证明RCas9能够切割CTG重复RNA。该数据表明,在RCas9介导的RNA切割发生时,相关分子表型(MBNL1分布)被逆转为健康模式。
图7G.使用示例性RCas9系统展示RNA切割的数据(应用例2)。在此,使用RCas9系统的排列2在人活细胞中靶向产生C9orf72-1相关ALS(由重复序列GGGGCC(SEQ ID NO:19)RNA碱基组成)的RNA。切割RNA的RCas9系统(应用例2)的排列2的应用导致重复RNA的量的大幅度减少,以至通过FISH(底部图像)都检测不到。图8A.全长和截短的Cas9蛋白。域结构图描述以保持靶向RNA的Cas9破坏致病性CTG重复序列扩增RNA的能力的方式截断Cas9蛋白。这种Cas9蛋白的新型变体以前从未被展示过,并且与全长Cas9或本领域以前使用的其他Cas蛋白不同。此外,该截短的Cas9(称为“ΔHNH”)通过在腺相关病毒(AAV)中包装和递送促进RCas9系统的治疗应用。AAV是一种使用的越来越多的用于递送编码治疗系统例如RCas9的方法,但递送的DNA被限制在~4.5kb。该截短版本的Cas9有助于将整个RCas9系统包装在一个AAV载体中,为RCas9的许多治疗应用提供便利。全长的Cas9域结构如上所示,接着是下面的Cas9截短变体“仅有Rec”和“ΔHNΗ”域结构。ΔHNH截短缺失来自全长(FL)Cas9蛋白的
775-909位残基。
图8B.数据显示与使用具有截短的Cas9蛋白的RCas9系统相比,使用具有全长Cas9蛋白的RCas9系统降解CTG重复序列。用编码CTG重复序列的质粒将靶向RNA的Cas9系统(Cas9蛋白或与PIN核酸内切酶融合的截短形式连同一靶向CTG重复序列的单向导RNA(sgRNA)或一非靶向性(NT)sgRNA一起)转染进入COSM6细胞。通过Northern印迹检测CTG重复RNA,来比较RCas9系统在各种截短排列中的能力,U6snRNA作为上样对照。与PIN结构域融合的全长Cas9和ΔHNH都支持CTG重复序列的RNA的切割,但仅在存在靶向所述重复序列的sgRNA的情况下。
图8C.图8B的Northern印迹信号的定量。全长Cas9和ΔHNH Cas9截短均支持CTG RNA的有效切割(>95%损失)。
优选实施例具体实施方式
说明书中提及的所有出版物、专利和专利申请通在此过引用整体并入本文,以达到其程度如同每个单独的出版物、专利或专利申请被明确且单独地指出通过引用并入的所有目的。例如,出于所有目的,PCT/US 14/53301通过引用整体并入本文。
术语定义
除非另外定义,否则本文使用的所有技术术语具有与本公开所属领域的本领域普通技术人员通常理解的相同的含义。如在本说明书和所附权利要求中所使用的,除非上下文另外明确指出,否则单数形式“一个”、“一种”和“所述”包括复数形式。除非另有说明,否则本文对“或”的任何提及旨在涵盖“和/或”。
如本文所用,术语“缔合”或“与......缔合”可表示两个或更多个部分,例如化学基团、核苷酸、寡核苷酸、蛋白质或肽,以共价或非共价方式相互连接。例如,蛋白质可以与核苷酸、荧光剂或另一种蛋白质结合。缔合可意指两种或更多种蛋白质或肽形成融合蛋白。缔合可以是物理缔合。在一些情况下,两种或更多种蛋白质或肽彼此“栓系”、“附着”或“连接”。
缔合可以是两种蛋白质或肽之间的共价键。
如本文所用,“多肽”包括蛋白质、蛋白质片段和肽,无论是从天然来源分离的、通过重组技术产生的还是化学合成的。多肽可以具有一个或多个修饰,例如翻译后修饰(例如糖基化等)或任何其它修饰(例如聚乙二醇化等)。多肽可以含有一个或多个非天然存在的氨基酸(例如具有侧链修饰的氨基酸)。本文所述的多肽通常包含至少约10个氨基酸。
如本文所使用的,术语“样品”可以指包含靶标的组合物。用于通过所公开的方法、装置和系统分析的合适的样品包括细胞、组织、器官或生物体或获取自细胞、组织、器官或生物体的组合物。
如本文所用,术语“特异性结合”是指特异性结合对的结合特异性。在其他潜在靶标的存在下,通过特定靶多核苷酸序列的靶特异性核酸序列杂交是这种结合的一个特征。特异性结合涉及两种不同的核酸分子,其中一种核酸分子通过化学或物理途径与第二种核酸分子特异性杂交。这两种核酸分子在这种意义上的相关在于,它们彼此的结合使得它们能够将它们的结合配偶体与具有相似特征的其他测定成分区分开来。结合组分对的成员称为配体和受体(抗配体),特异性结合对(SBP)成员和SBP配偶体等。
如本文可互换使用的“多核苷酸”或“核苷酸”是指任何长度的核苷酸的聚合物,并且包括DNA和RNA。多核苷酸或核苷酸序列可以是双链或单链的。当多核苷酸或核苷酸序列是单链时,它可以指两条互补链中的任一条。核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、修饰的核苷酸或碱基和/或其类似物,或可以通过DNA或RNA聚合酶掺入聚合物的任何底物。多核苷酸可以包含修饰的核苷酸,例如甲基化的核苷酸及其类似物。如果存在,可以在组装聚合物之前或之后进行对核苷酸结构的修饰。核苷酸序列可以被非核苷酸组分打断。聚合后可以进一步修饰多核苷酸,例如通过与标记组分缀合。其他类型的修饰包括例如“帽子”,用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰,例如具有不带电荷的接头的修饰(例如甲基膦酸酯、磷酸三酯、磷酰胺酯、氨基甲酸盐)和带有电荷的接头的修饰(例如硫代磷酸盐、二硫代磷酸盐等),含有侧链部分的修饰,例如蛋白质(如核酸酶、毒素、抗体、信号肽、ply-L-赖氨酸等),含有嵌入剂的修饰(如吖啶、补骨脂素等),含有螯合剂的修饰(如金属、放射性金属、、氧化金属等),含烷基化剂的修饰、具有修饰的接头的修饰(如α-端基异构体核酸等)以及未修饰形式的多核苷酸。此外,通常存在于糖中的任何羟基可以例如被膦酸酯基团、磷酸酯基团取代,被标准保护基团保护,或被活化以制备另外的连接到其他核苷酸的接头,或者可以被缀合到固体支持物上。5'和3'末端OH可被磷酸化或被1至20个原子的胺或有机封端基团取代。其他羟基也可以衍生成标准保护基团。多核苷酸还可以包含本领域通常已知的核糖或脱氧核糖的糖的类似形式,包括例如2'-O-甲基-2'-O-烯丙基、2'-氟代或2'-叠氮基-核糖,碳环糖类似物、α-端基异构糖,差向异构糖如阿拉伯糖、木糖或来苏糖、吡喃糖、呋喃糖、景天庚糖、无环类似物和无碱基核苷类似物如甲基核糖苷。一个或多个磷酸二酯键可以被可选的连接基团取代。这些可选的连接基团包括但不限于以下实施方案,其中磷酸盐被P(O)S(“硫代酸盐”)、P(S)S(“二硫代酸盐”)、“(O)NR 2(“酰胺化物”)、P(O)R、P(O)OR'、CO或CH2(“甲缩”),其中每个R或R'独立地为H或取代或未取代的烷基(1-
20C),任选地含有一醚键(-O-)、芳基、链烯基、环烷基、环烯基或芳基。并非多核苷酸中的所有连接都要相同,前述说明适用于本文所指的所有多核苷酸,包括RNA和DNA。
本文所用的“寡核苷酸”通常是指短的,通常为单链的,通常是合成的多核苷酸,其长度通常但不一定是小于约200个核苷酸。术语“寡核苷酸”和“多核苷酸”不是相互排斥的。以上关于多核苷酸的描述同样且完全适用于寡核苷酸。
如本文所用,术语“同源的”,“基本上同源的”和“基本同源”表示具有至少50%、60%、
70%、80%或90%同一性的氨基酸序列,其中一个序列是与参考序列的氨基酸相比。当与参考序列的对应部分比对时,通过比较彼此来计算序列同一性或同源性的百分比。
如本文所用,“互补或匹配”是指两个核酸序列具有至少50%的序列同一性。优选地,两条核酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的序列同一性。“互补或匹配”还意味着两个核酸序列可以在低、中和/或高严格条件下杂交。
如本文所用,“基本上互补或基本匹配”是指两个核酸序列具有至少90%的序列同一性。优选地,两条核酸序列具有至少95%、96%、97%、98%、99%或100%的序列同一性。或者,“基本上互补或基本匹配”是指两个核酸序列可以在高度严格条件下杂交。
如本文所用,“改进”是指至少约1%、2%、5%、10%、15%、20%、25%、30%、35%、
40%、35%50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、
175%、200%、225%、275%、300%、350%、400%、450%、500%、600%、700%、800%、
900%,1000%或更多或任何列出的值之间的任何值。或者,“改善”可意指至少约1倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍、500倍、1000倍、2000倍或更多或任何列出的值之间的任何值。
如本文所用,“复合”意指非共价连接或缔合。
如本文所用,“无核酸酶”可以指具有降低的核酸酶活性、降低的内切或外切DNA酶活性或RNA酶活性、降低的切口酶活性或降低切割DNA和/或RNA的能力的多肽。
如本文所用,“减少的核酸酶活性”是指核酸酶、切口酶、DNA酶或RNA酶活性降低至少约
1%、2%、5%、10%、15%、20%、25%、30%、35%、40%、35%、50%、55%、60%、65%、70%、
75%、80%、85%、90%、95%、100%或更多或任何列出的值之间的值。或者,“减少的核酸酶活性”可以指降低至少约1倍、1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍、500倍、1000倍、2000倍或更多或任何列出的值之间的任何值。
如本文所用,“一种或多种运输剂”可指将核蛋白复合物引导至细胞中所需位置的任何多肽,如细胞质多聚腺苷酸化元件结合蛋白(CPEB)、锌指结合蛋白(ZBP)、TIA-1(3'UTR mRNA结合蛋白)、PSF(剪接体的蛋白质组分)或PSF的DNA结合结构域(DBD)、脆性X智力低下蛋白(FMRP)、IGF-II mRNA-结合蛋白(IMP-1(IMP1)、IMP2、IMP3、细胞骨架结合蛋白,跨膜蛋白或包含这些前述蛋白的结构域的组合的工程化蛋白以产生组合运输现象。
通常,杂交体的稳定性是离子浓度和温度的函数。典型地,杂交反应在较低严格性条件下进行,随后进行变化的但严格性较高的洗涤。中度严格杂交是指允许核酸分子例如探针结合互补核酸分子的条件。杂交的核酸分子通常具有至少60%的同一性,包括例如至少
70%、75%、80%、85%、90%或95%同一性中的任何一种。中度严格条件是等同于在42℃下在50%甲酰胺,5×Denhardt's溶液,5×SSPE,0.2%SDS中杂交,随后在42℃下在0.2×SSPE,0.2%SDS中洗涤的条件。高度严格条件例如可以通过在42℃在50%甲酰胺,5×Denhardt's溶液,5×SSPE,0.2%SDS中杂交,然后在0.1×SSPE和0.1%SDS中在65℃下洗涤来提供。
低度严格杂交是指等同于在22℃下在10%甲酰胺,5×Denhardt's溶液,6×SSPE,
0.2%SDS中杂交,然后在1×SSPE,0.2%SDS中于37℃洗涤的条件。Denhardt溶液含有1%Ficoll,1%聚乙烯吡咯烷和1%血清白蛋白(BSA)。20×SSPE(氯化钠、磷酸钠、乙二胺四乙酸(EDTA))含有3M氯化钠,0.2M磷酸钠和0.025M(EDTA)。其他合适的中度严格性和高度严格性杂交缓冲液和条件对于本领域技术人员来说是熟知的。
靶向RNA的Cas9多肽(RCas9)
本文公开的一些实施方案提供了已经工程化改造以识别靶RNA的Cas9多肽,其中所述Cas9多肽与效应物缔合。在一些实施方案中,Cas9多肽是化脓链球菌(Streptococcus pyogenes)Cas9多肽。在一些实施方案中,Cas9多肽在化脓链球菌Cas9多肽中包含例如D10A、H840A或两者(SEQ ID NO:31)突变。
一些实施方案涉及如本文提供的包含Cas9多肽的核蛋白复合物的一种形式,该复合物涉及成簇的规律间隔短回文重复序列(CRISPR)/Cas9或CRISPR/Cas9,其为被重新调整用途或工程化改造以在活细胞中靶向RNA而非DNA的系统。这种重新调整用途的或工程化改造的包含Cas9多肽的核蛋白复合物结合RNA,在本文中被称为RCas9。CRISPR通过简单地程序化识别人类细胞中的DNA并支持成像和基因表达调控中的相关技术,彻底改变了基因组工程。
我们已经开发了一种类似的手段,使用RCas9或CRISPR/Cas9靶向RNA。在一些实施方案中,本文提供的核蛋白复合物包含Cas9蛋白,单向导RNA(sgRNA)和任选地(化学修饰或合成的)反义PAMmer寡核苷酸。所述PAMmer是一种反义寡核苷酸,用于模拟Cas9通过与靶RNA杂交识别的DNA底物。Cas9蛋白和sgRNA组件一起,允许识别任何假定的RNA序列。
因此,在可选的实施方案中,本文提供的组合物和方法为基础生物学和治疗的许多领域中持久未决的问题提供了解决方案。作为基础生物学和药物开发的工具,该技术已经支持无损测量活细胞中的RNA定位和基因表达(参见下文的讨论)。从治疗的度来看,本文提供的组合物和方法允许通过改变RNA剪接或RNA编辑来靶向地改变RNA组合物,以逆转涉及疾病如癌症和神经退行性病变的RNA特征。如本文所提供的核蛋白复合物作为第一种简单可重编程的、核酸引导的RNA结合蛋白,与现有技术状态截然不同。
在一些实施方案中,本文提供的示例核蛋白复合物缔合或包含可检测试剂例如荧光
剂、荧光蛋白、酶或类似物等。在一些实施方案中,所述荧光蛋白是绿色荧光蛋白(GFP)、增强型GFP(EGFP(SEQ ID NO:30))、蓝色荧光蛋白或其衍生物(EBFP、EBFP2、石青、mKalamal)、青色荧光蛋白或其衍生物(ECFP、Cerulean、CyPet、mTurquoise2)、黄色荧光蛋白及其衍生物(YFP、Citrine、Venus、YPet)、UnaG、dsRed、eqFP611、Dronpa、TagRFP、KFP、EosFP、Dendra、IrisFP等等,或其片段。在一些实施方案中,可以将荧光蛋白分成两半,每一半与Cas9多肽融合,从而当两个Cas9多肽结合相邻的RNA靶时,荧光蛋白的两个半部彼此靠近并产生荧光信号。例如,荧光蛋白Venus可以分成两部分:N端部分和C端部分。在一些实施方案中,N端部分包含残基1-155或1-173(SEQ ID NO:25)。在一些实施方案中,N端部分包含I152L突变(SEQ ID NO:24;I 152L减少背景互补突变体,来自Kodama等,Biotechniques.2010年11月
49(5):793-805)。在一些实施方案中,C-末端部分包含残基155-238(SEQ ID NO:26)。在一些实施方案中,所述酶是荧光素酶(Gaussia、Renilla、萤火虫变体)、烟草蚀刻病毒(TEV)蛋白酶、泛素、辣根过氧化物酶或毒素如白喉毒素等。在一些实施方案中,所述酶分成两半,每个半部与Cas9多肽融合,以使当两个Cas9多肽结合相邻的RNA靶时,酶的两半彼此靠近并产生酶活性。在一些实施方案中,所述酶参与化合物合成的修饰。在一些实施方案中,所述化合物是多肽或核酸。在一些实施方案中,与游离的生物合成酶相比,靶RNA上Cas9多肽的缔合在生物合成途径中产生中间产物的局部积累,以扩大医学上或技术上有用的化合物的产生。
在一些实施方案中,本文所提供的核蛋白复合体与效应多肽,如切割RNA的核酸酶如PIN结构域蛋白,如人SMG6(SEQ ID NO:27),或其片段相缔合。在一些实施方案中,本文所提供的核蛋白复合体与RNA结合蛋白,如人RBFX1(SEQ ID NO:28)、人RBFX2(SEQ ID NO:29),或其类似物,或其片段缔合。在一些实施方案中,CAS9多肽与剪接因子或其片段缔合。在一些实施方案中,所述核酸酶、RNA结合蛋白或剪接因子可以被分成两半,每一半都与CAS9多肽融合,从而当两个CAS9多肽结合到相邻RNA靶时,所述核酸酶、RNA结合蛋白或剪接因子的两半相互靠近并产生酶活性。
在一些实施方案中,本文提供的核蛋白复合物还缔合或包含一个或多个核定位信号、一个或多个稳定的惰性连接肽如XTEN肽或其组合。XTEN肽已被用来通过增加流体动力学半径而延长翻译融合的生物药物的血清半衰期,作为化学聚乙二醇化的基于蛋白质功能的类似物。由于XTEN肽是化学稳定的、非阳离子的、非疏水的,并且预测采用一种延伸的、非结构化构象,基于XTEN的连接肽可以作为稳定的、惰性的连接序列将CaS9多肽连接到效应多肽如RNA修饰多肽,或是可检测的部分。
截短的Cas9多肽
能够结合RNA的化脓链球菌Cas9的截短形式在它们特异性改变靶RNA而非DNA序列的能力方面是有利的,同时减小了Cas9蛋白的大小以适应腺相关病毒载体(AAV)。在一些实施方案中,核蛋白复合物包含截短形式的Cas9,所述截短形式的Cas9缺少部分或全部切割DNA的HNH、RuvC结构域或其组合的,其通过消除Cas9的DNA切割能力来促进这两个重要特征(产生无核酸酶的Cas9)并减小其大小。在一些实施方案中,能够递送约4.5kb的AAV载体用于包装转基因。在一些实施方案中,使用能够包装更大转基因的AAV如约4.6kb、4.7kb、4.8kb、
4.9kb、5.0kb、5.1kb、5.2kb、5.3kb、5.4kb、5.5kb、5.6kb、5.7kb、5.8kb 5.9kb、6.0kb、
6.1kb、6.2kb、6.3kb、6.4kb、6.5kb、6.6kb、6.7kb、6.8kb、6.9kb、7.0kb、7.5kb、8.0kb、
9.0kb、10.0kb、11.0kb、12.0kb、13.0kb、14.0kb、15.0kb或更大。
在其它实施方案中,核蛋白复合物包含截短物,所述截短物缺失与特定DNA残基接触的全部或部分其他结构域(如PAMmer-相互作用结构域或PAM-1D结构域),全部或部分Rec结构域或其组合,进一步提供保持Cas9结合RNA的能力的减小的尺寸。通过将无核酸酶的Cas9与效应物例如PIN域或作用于RNA但不作用于DNA的其他效应物融合,这些实施方案提供了改变RNA而不靶向编码DNA的手段。
在一些实施方案中,将Cas9活性位点(10和840)突变为丙氨酸(D10A和H840A)以消除化脓链球菌Cas9的切割活性,产生核酸酶缺陷型或dCas9。RuvC结构域分布在dCas9一级结构的3个非连续部分(残基1-60,719-775和910-1099)中。Rec叶由残基61-718组成。HNH结构域由残基776-909组成。PAM-ID域由残基1100-1368组成。
REC叶可被认为是识别sgRNA和靶DNA/RNA的结构支架。NUC叶含有两个核酸酶结构域
(HNH和RuvC),加上识别PAM序列的PAM相互作用结构域(PAM-ID)。在一些实施方案中,98-核苷酸sgRNA可类似地分成两个主要结构组分:第一个含有靶特异性向导或“间隔区”段(核苷酸1-20)加重复序列-四元环–反向重复序列和茎–环1(SL1)区域;第二个包含茎环2和3(SL2、SL3)。在一些实施方案中,所述引导-通过-SL1RNA区段主要由Cas9REC叶片结合。在一些实施方案中,SL2-SL3区段主要由NUC叶片结合。
一项最近的研究表明1368-氨基酸的化脓链球菌Cas9可以分裂成包含REC叶(氨基酸
56-714)和NUC叶(融合到729-1368的氨基酸1-57)的两种多肽,其可以反式组合形成功能性核酸酶(Wright AV,Sternberg SH,Taylor DW,Staahl BT,Bardales JA,Kornfeld JE,Doudna JA.Synthesis design of a split-Cas9 enzyme complex.Proc Natl Acad Sci USA.2015;12(10):2984-9)。研究结果表明,缺少整个NUC叶片的Cas9构建体可以以高亲和力与sgRNA组装;尽管其亲和力比全长Cas9显著更低。目前尚不清楚这一范围内的亲和力变化如何影响CRISPR/Cas9的DNA编辑效率或其靶向细胞中RNA的能力。
在一些实施方案中,工程化改造SpCas9的最小构建体,其将以高亲和力识别靶RNA序列,并将其融合的PIN RNA内切酶结构域引导至模型RNA进行降解。在一些实施方案中,最小的构建体将是仅含REC的构建体。在一些实施方案中,构建体将包含最小化程度低一些的构建体,其缺乏HNH、PAM-ID、每个结构域的部分、缺乏两个结构域或其组合。在一些实施方案中,通过在残基775和909之间插入五残基柔性接头来切除HNH结构域(ΔHHN)。在一些实施例中,全部或部分PAM-ID被移除。在一些实施方案中,在残基1098处截短Cas9(ΔPAM-ID#
1),将残基1138和1345与8-残基接头(ΔPAM-ID#2)融合,或将残基1138与1200融合和将
1218与1339融合(分别为5残基和2残基的接头:ΔPAM-ID#3)用于除去全部或部分PAM-ID。
所述ΔPAM-ID#2和3构建体将保留有助于sgRNA的重复序列-反向-重复序列(残基1099-
1138)与SL2-SL3(残基1200-1218和1339-1368)区段结合的PAM-ID元件。在一些实施方案中,HNH缺失将与三个PAM-ID缺失相组合。
在一些实施方案中,所述核蛋白复合物可以包含Cas9多肽,其缺少全部或部分(1)HNH结构域、(2)至少一个RuvC核酸酶结构域、(3)Cas9多肽DNA酶活性位点、(4)包含Cas9多肽活性位点的ββα-金属折叠,或(5)Cas9多肽,其与相应的野生型(WT)Cas9多肽相比缺少全部或部分HNH结构域、至少一个RuvC核酸酶结构域、Cas9多肽DNA酶活性位点和/或包含Cas9多肽活性位点的ββα-金属折叠,并且其中所述复合物可以包含或可以不包含PAMmer寡核苷酸。
单向导RNA(sgRNA)
在一些实施方案中,本文提供的核蛋白复合物与单向导RNA(sgRNA)复合。在一些实施方案中,所述单向导RNA在单向导RNA支架序列中携带二级结构的延伸。在一些实施方案中,单向导RNA包含一个或多个点突变,其通过去除部分或完全转录终止序列或通过反式作用核酸酶的作用在转录后使单向导RNA去稳定化的序列来提高单向导RNA的表达水平。在一些实施方案中,单向导RNA在5'末端包含稳定所述单向导RNA免于降解的改变。在一些实施方案中,单向导RNA在5'端包含改进RNA靶向的改变。在一些实施方案中,所述单向导RNA的5'末端的改变选自2'O-甲基、硫代磷酸酯和硫代膦酰基乙酸酯键和碱。在一些实施方案中,单向导RNA在sgRNA的间隔区或支架区中包含2'-氟、2'O-甲基和/或2'-甲氧基乙基碱基修饰以改善单向导RNA上的靶识别或降低核酸酶活性。在一些实施方案中,单向导RNA包含降低靶RNA上的核酸酶活性的一种或多种甲基膦酸酯、硫代磷酸酯、或硫代磷酸酯键。
在一些实施方案中,所述单向导RNA可以识别靶RNA,例如通过与靶RNA杂交。在一些实施方案中,单向导RNA包含与靶RNA互补的序列。在一些实施方案中,单向导RNA的长度为、大约、小于或大于10nt、20nt、30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt、110nt、120nt、
130nt、140nt、150nt、160nt、170nt、180nt、190nt、200nt、300nt、400nt、500nt、1,000nt、2,
000nt或上述任何两个值之间的范围。在一些实施方案中,单向导RNA可包含一个或多个修饰的核苷酸。
在可选的实施方案中,多种RNA靶标可以被单向导RNA识别。例如,靶RNA可以是信使RNA(mRNA)、核糖体RNA(rRNA)、信号识别颗粒RNA(SRP RNA)、转运RNA(tRNA)、小核RNA(snRNA)、小核仁RNA(snoRNA)、反义RNA(aRNA)、长非编码RNA(IncRNA)、microRNA(miRNA)、piwi相互作用RNA(piRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、逆转录转座子RNA、病毒基因组RNA、病毒非编码RNA、或类似物。在一些实施方案中,靶RNA可以是涉及诸如癌症、神经退行性病变、皮肤病症、内分泌病症、肠道疾病、感染性病症、神经疾病、肝脏疾病、心脏疾病、自身免疫性疾病或类似病症的疾病发生或治疗靶标的RNA。
在一些实施方案中,靶RNA可包含重复序列。例如,所述重复序列可以是CTG、CCTG、CAG、GGGGCC或其任何组合。在一些实施方案中,重复序列与疾病相关,例如肌强直性营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症、脆性X综合征等。
PAMmer寡核苷酸
在一些实施方案中,本文提供的核蛋白复合物与反义寡核苷酸进一步复合,所述反义寡核苷酸与靶RNA中的序列互补。在一些实施方案中,反义寡核苷酸包含PAMmer寡核苷酸。
在一些实施方案中,反义寡核苷酸包含至少一个修饰的核苷酸。在一些实施方案中,所述至少一种修饰的核苷酸选自2'OMe RNA和2'OMe DNA核苷酸。在一些实施方案中,PAMmer寡核苷酸包含一个或多个修饰的碱基或接头。在一些实施方案中,所述一个或多个修饰的碱基或连接选自锁核酸和核酸酶稳定的连接。在一些实施方案中,所述反义寡核苷酸与紧邻靶RNA的序列互补。例如,所述反义寡核苷酸可与来自靶RNA的约10nt、20nt、30nt、40nt、50nt、
60nt、70nt、80nt、90nt、100nt的序列互补。在一些实施方案中、所述反义寡核苷酸的长度为、大约、小于或大于10nt、20nt、30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt、110nt、
120nt、130nt、140nt、150nt、160nt、170nt、180nt、190nt、200nt、300nt、400nt、500nt、1,
000nt、2000nt,或上述任何两个值之间的范围。在一些实施方案中,所述反义寡核苷酸包含RNA、DNA或两者。
编码Cas9多肽的核酸
本文公开的一些实施方案提供编码如本文提供的核蛋白复合物Cas9多肽,sgRNA或融合蛋白的核酸,任选地与效应物或可检测部分缔合,如可检测试剂或RNA修饰多肽,例如,RNA内切核酸酶。
核酸可以是天然存在的核酸DNA,RNA或人工核酸,包括肽核酸(PNA),吗啉代和锁核酸(LNA),以及乙二醇核酸(GNA)和苏糖核酸(TNA)。单链和双链核酸均可用于本公开。在一些实施方案中,核酸是重组DNA分子。
在一些实施方案中,本文编码的Cas9多肽包含古细菌或细菌Cas9多肽。在一些实施方案中,Cas9多肽是、包含或来源于:地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西菌新凶手亚种(Francisella tularensis subsp.novicida)、多杀性巴氏杆菌(Pasteu rella multocida)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)LMD-9 CRISPR 3、红嘴鸥弯曲杆菌(Campylobacter lari)CF89-12株、鸡毒支原体菌(Mycoplasma gallisepticum str.)株F、硝化裂化器菌(Nitratifractor 
salsuginis str)DSM16511株、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis)、灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510,螺旋体球菌巴迪菌株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare)、Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动型支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis),巴斯德链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、伪中间型葡萄球菌(Staphylococcus pseudintermedins)、产线龈沟菌(Filifactor alocis)、牙密螺旋体(Treponema denticola)、嗜肺军团杆菌巴黎株(Legionella pneumophila str.Paris)、华德萨特菌(Sutterella wadsworthensis)、白喉棒状杆菌(Corynebacter diphtheriae)、金黄葡萄球菌(Streptococcus aureus);新凶手弗朗西菌(Francisella novicida)(任选地是新凶手弗朗西菌Cpfl)或格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute蛋白,其被修饰或赋予新用途以靶向RNA,其中任选地sgRNA 3'末端或“支架序列”包含每一个这些相应细菌或古细菌生物中的野生型(WT)或源自野生型的同源向导核酸的全部或部分。
如本文所用,“有效地连接”或“有效连接”是指一部分线性DNA序列可影响同一DNA分子的其他部分的情况。例如,当启动子控制编码序列的转录时,其与编码序列有效地连接。
本文公开的一些实施方案提供了基因工程重组载体,其包含编码示例性Cas9多肽、
sgRNA或示例性Cas9多肽的融合蛋白的核酸分子,所述示例性Cas9多肽任选地与效应物或可检测部分缔合,如可检测试剂或RNA修饰多肽,例如RNA内切核酸酶。使用的载体可包括适用于在选定的宿主中表达的载体,无论是原核的还是真核的,例如噬菌体、质粒和病毒载体。病毒载体可以是可复制型或复制缺陷型逆转录病毒载体。病毒繁殖通常仅在包含复制缺陷型载体的互补型宿主细胞中发生,例如,当在本文提供的方法中使用复制缺陷型逆转录病毒载体时,不会发生病毒复制。载体可以包含Kozak序列(Lodish等,Molecular Cell Biology,第4版,1999)并且还可以包含ATG起始密码子。在真核宿主中起作用的启动子包括SV40、LTR、CMV、EF-1a、唐鱼β-肌动蛋白启动子等。
在设计瞬时和稳定表达载体时考虑了拷贝数和位置效应。拷贝数可以通过例如二氢叶酸还原酶扩增来增加。位置效应可通过例如中国仓鼠延伸因子-1载体pDEF38(CHEF1)、泛染色质开放元件(UCOE)、人支架/基质附着区(S/MAR)和人工染色体表达(ACE)载体,以及通过使用本领域已知的位点特异性整合方法进行优化。含有载体和目的基因的表达构建体将进一步包含用于转录起始和终止的位点,并且在转录区域中包含用于翻译的核糖体结合位点。由构建体表达的转录本的编码部分可以包括在起点的翻译起始密码子和适当位于待翻译多肽末端的终止密码子(UAA、UGA或UAG)。
考虑到上述因素,适合表达示例性Cas9多肽、sgRNA和/或Cas9多肽的融合蛋白的示例性载体,任选地与效应物或可检测部分相关联,如可检测试剂或RNA修饰多肽在细菌中包括pTT载体,可从例如生物技术研究所(蒙特利尔,加拿大)获得,pQE70、pQE60和pQE-9可获取自Qiagen(Mississauga,安大略,加拿大);源自pcDNA3的载体,可从Invitrogen(Carlsbad,CA)获得;pBS载体、Phagescript载体、Bluescript载体、pNH8A、pNH6a、pNH18A、pNH46A可从Stratagene(La Jolla,CA)获得;以及ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5可从Pharmacia(Peapack,NJ)获得。在合适的真核载体中有可从Stratagene(La Jolla,CA)获得的pWLNEO、pSV2CAT、pOG44、pXT1和pSG;和可从Pharmacia(Peapack、NJ)获得的pSVK3、pBPV、pMSG和pSVL。
用于表达示例性Cas9多肽、sgRNA或Cas9多肽的融合蛋白的载体,任选地与效应物或可检测部分如可检测试剂或RNA修饰多肽、包括包含pTT载体骨架的载体相关联(Durocher等Nucl.Acids Res.30:E9(2002))。简而言之,可通过获得例如来自Clontech(Palo Alto,CA)的pIRESpuro/EGFP(pEGFP)和pSEAP基础载体制备pTT载体的骨架,以及pcDNA3.1、
pCDNA3.1/Myc-(His)6和pCEP4载体可以从例如Invitrogen(Carlsbad,CA)获得。如本文所用,所述pTT5骨架载体可产生pTT5-Gateway载体并用于在哺乳动物细胞中瞬时表达蛋白质。例如,可以将pTT5载体衍生为pTT5-A、pTT5-B、pTT5-D、pTT5-E、pTT5-H和pTT5-I。如本文所用,pTT2载体可以产生用于在哺乳动物细胞系中稳定表达的构建体。
pTT载体可以通过删除潮霉素(Bsml和Sail酶切,然后补平和连接)和EBNA1(ClaI和
Nsil酶切,然后补平和连接)表达框来制备。ColEI复制起点(包括β内酰胺酶开放阅读框(ORF)的3'末端的Fspl-SalI片段)可以用来自含有pMBI复制起点(和相同的β内酰胺酶ORF的3'末端)的pcDNA3.1的Fspl-Sal1片段替代。可以在用HindIII和EcoRV消化的pcDNA3.1/Myc-His中进行同框连接后,将Myc-(His)6C末端融合标签加至SEAP中(来自pSEAP-basic的HindIII-HpaI片段)。质粒随后可以在LB培养基中培养的大肠杆菌(DH5α)中扩增并使用MAXI制备柱(Qiagen,Mississauga,安大略,加拿大)纯化。为了定量,质粒随后可以稀释于例如50mM Tris-HCl pH7.4,并且可在260nm和280nm测量吸光度。具有在约1.75和约2.00之间的A260/A280比率的质粒制剂适合用于生产Fc-融合构建体。
表达载体pTT5允许由巨细胞病毒(CMV)启动子驱动的cDNA的染色体外复制。质粒载体pCDNA-pDEST40是Gateway适应型载体,其可以利用CMV启动子进行高水平表达。SuperGlo GFP变体(sgGFP)可以从Q-Biogene(Carlsbad,CA)获得。制备pCEP5载体可以通过使用Sail和XbaI酶依次消化和自我连接来去除pCEP4的CMV启动子和聚腺苷酸化信号,从而产生质粒pCEP4Δ来完成。将编码CMV5-poly(A)表达框的pAdCMV5(Massie等人,J.Virol.72:2289-
2296(1998))的GbIII片段连接到BglII-线性化的pCEP4Δ中,得到pCEP5载体。
用于表达示例性Cas9多肽、sgRNA或Cas9多肽的融合蛋白的载体,任选地与效应物或可检测部分如可检测试剂或RNA修饰多肽相缔合,可以包括包含优化用于CHO-S或源自CHO-S的细胞,如pDEF38(CHEF1)的载体和类似载体(Running Deer等,Biotechnol.Prog.20:880-
889(2004))。CHEF载体含有导致在CHO细胞及其衍生细胞中高度持续表达的DNA元件。它们可包括但不限于阻止转基因转录沉默的元件。
载体可以包括用于在宿主中繁殖的选择性标记。在可选的实施方案中,使用选择性标记,其允许基于它们在存在或不存在抑制基本细胞功能的化学剂或其他试剂存在下繁殖的能力来选择转化细胞。选择性标记在表达标记的细胞上赋予表型,从而可以在合适的条件下鉴定所述细胞。因此,合适的标记包括编码蛋白质的基因,当细胞在合适的选择性培养基中生长时,编码赋予其耐药性或敏感性的蛋白质,赋予颜色或改变被编码选择性标记的分子转染的那些细胞的抗原特性。
合适的选择性标记包括在真核细胞培养物中针对新霉素抗性的二氢叶酸还原酶或
G418;和用于在大肠杆菌和其他细菌中培养的四环素、卡那霉素或氨苄青霉素抗性基因。合适的选择性标记还包括细胞毒性标记和药物抗性标记,由此通过细胞在含有一种或多种细胞毒素或药物的培养基上生长的能力来选择细胞;营养缺陷型标记,通过该标志物选择细胞在具有或不具有特定营养物或补充物的限定培养基如胸苷和次黄嘌呤下生长的能力;代谢标记,由其选择细胞在含有确定物质,例如合适的糖作为唯一碳源的确定的培养基上生长的能力;和赋予细胞在发色底物上形成有色集落或引起细胞发荧光的能力的标志物。
如上所述,用于表达示例性Cas9多肽、sgRNA或任选地与效应物或可检测部分(例如可检测试剂或RNA修饰多肽)相缔合的示例性Cas9多肽的融合蛋白的载体也可以构建于逆转录病毒载体。一种这样的载体,即对应到小鼠染色体6的ROSA geo逆转录病毒载体与逆转录病毒转录的反向方向、位于剪接受体序列下游的报道基因构建(美国专利号6,461,864;
Zambrowicz等人,Proc.Natl.Acad.Sci.94:3789-3794(1997))。用ROSA geo逆转录病毒载体感染胚胎干(ES)细胞,通过在ES细胞中随机逆转录病毒基因捕获,产生了ROSA geo26(ROSA26)小鼠品系。
包含编码示例性Cas9多肽、sgRNA或Cas9多肽的融合蛋白的核酸(任选地包含在一个或多个载体中)的DNA插入片段,任选地与效应物或可检测部分相缔合,如可检测试剂或RNA修饰多肽可有效地连接至合适的启动子,如噬菌体λPL启动子;大肠杆菌lac、trp、phoA和tac启动子;SV40早期和晚期的启动子;和逆转录病毒LTR的启动子。合适的载体和启动子还包括具有增强子的pCMV载体,pcDNA3.1;具有增强子和内含子的pCMV载体、pCIneo;具有增强子、内含子和分成三部分的前导序列的pCMV载体,pTT2和CHEF1。其他合适的载体和启动子为本领域技术人员所熟知。启动子序列至少包括以高于背景的可检测水平启动目的基因转录所需的最少数目的碱基或元件。在启动子序列内可以有转录起始位点,以及负责RNA聚合酶结合的蛋白质结合结构域(一致序列)。在可选的实施方案中,真核启动子通常但不总是包含“TATA”框和“CAT”框。
本文公开的一些实施方案提供了用于体内表达示例性Cas9多肽,sgRNA或示例性Cas9多肽的融合蛋白的载体,所述示例性Cas9多肽任选地与效应物或可检测部分例如可检测试剂或在包括人在内的动物的在以组织特异性方式起作用的启动子的控制下的RNA修饰多肽。例如,如在PCT/US06/00668中所记载,驱动Cas9多肽sgRNA表达的启动子、或Cas9多肽的融合蛋白的启动子与驱动与效应物或可检测部分、如可检测试剂或RNA修饰多肽相缔合,所述启动子可以是肝脏特异性的。
可将附加的氨基酸区域,特别是带电氨基酸添加到多肽的N端以改善在随后的整个处理和储存中宿主细胞纯化时的稳定性和持续性。而且,可以将氨基酸部分添加到多肽中以促进纯化。在最终制备多肽之前,可以去除或可以不去除这些氨基酸。任选地与效应物或可检测部分,如可检测试剂或RNA修饰多肽相缔合的Cas9多肽或Cas9多肽的融合蛋白可以与标记序列,如肽融合,其有助于融合多肽的纯化。标记氨基酸序列中的一种可以是六组氨酸肽,如在pQE载体(Qiagen,Mississauga,安大略,加拿大)中提供的,其中许多可商购获得。
如Gentz等人,Proc.Natl.Acad.Sci.86:821-824(1989)中所记载,例如,六组氨酸为融合蛋白的纯化提供了便利。另一种用于纯化的肽标签,即血凝素HA标签,对应于来源于流感血凝素蛋白的表位(Wilson等人,Cell 37:767-778(1984))。任何上述标记可以使用本文提供的多核苷酸或多肽进行工程化改造。
表达构建体可以进一步含有用于转录起始、终止的位点,并且在转录区域中包含用于翻译的核糖体结合位点。由构建体表达的转录本的编码部分可以包括起始时的翻译起始密码子和适当位于待翻译多肽末端的终止密码子(UAA、UGA或UAG)。
表达Cas9多肽的细胞
本文公开的一些实施方案提供了包含编码示例性Cas9多肽、sgRNA或与效应物或可检测部分,如可检测试剂或RNA修饰多肽缔合的示例性Cas9多肽的融合蛋白的一种或多种核酸(例如一种或多种载体)的细胞系。在一些实施方案中,转染的细胞系可以是原核细胞系、真核细胞系、酵母细胞系、昆虫细胞系、动物细胞系、哺乳动物细胞系、人细胞系等。在哺乳动物细胞中表达的蛋白质已被适当地糖基化。哺乳动物细胞可产生Cas9多肽、sgRNA或Cas9多肽的融合蛋白,任选地与效应物或可检测部分,如本公开内容中的可检测试剂或RNA修饰多肽相缔合。有用的哺乳动物宿主细胞系的实例有HEK293、CHO、sp2/0、NSO、COS、BHK、PerC6。许多其他细胞也可以用作表达和生产宿主,并因此包含在本公开内容中。
对于融合蛋白的重组生产,基于分子克隆的流程使用分子克隆方法,例如在Sambrook和Russel《分子克隆》(第3版,CSHL Press,2001)中所述的方法。编码融合蛋白的DNA序列可以通过常规技术,例如通过全基因合成或剪接的DNA片段获得。可以使用多种载体。载体组分通常包括但不限于以下一种或多种:用于分泌表达蛋白质的信号序列,一种或多种标记基因,包括用于在真核细胞中进行稳定细胞系筛选的选择标记基因,复制起点,增强子元件,启动子和转录终止序列以及poly A等。
动物细胞的转染通常涉及打开细胞膜中的瞬时孔或“洞”,以允许物质的摄取。可以转染遗传物质(例如超螺旋质粒DNA或siRNA构建体)或甚至蛋白质如抗体。将外源DNA导入真核细胞有多种方法。可以使用磷酸、通过电穿孔或通过将阳离子脂与物质混合以产生脂质体来进行转染,所述脂质体与细胞膜融合并将其货物存放在其内部。许多材料已被用作转染载体,其可以分为三种:(阳离子)聚合物、脂质体和纳米颗粒。
可以通过沉淀、超速离心或层析方法包括离子交换层析、分子筛层析、亲和层析、免疫亲和层析、HPLC等,从细胞中回收与效应物或可检测部分,如可检测试剂或RNA修饰多肽缔合的示例性Cas9多肽或示例性Cas9多肽的融合蛋白。可以使用RP-HPLC来进一步纯化回收的融合蛋白。当与效应物或可检测部分,如可检测试剂或RNA修饰多肽缔合的Cas9多肽或Cas9多肽的融合蛋白分泌时,可以使用来自Millipore、Amicon、Pellicon等的市售超滤膜来浓缩上清液。
在一些实施方案中,蛋白A亲和层析可用于回收与效应物或可检测部分,如可检测试剂或RNA修饰多肽缔合的Cas9多肽或Cas9多肽的融合蛋白。蛋白A是由几种金黄色葡萄球菌菌株产生的细胞壁组分,并且可以以重组方式制备。它由单个多肽链组成,重约42,000道尔顿,含有很少或不含碳水化合物。蛋白A特异性结合大多数免疫球蛋白分子的Fc区,包括IgG(Sjoquist等,Eur.J.Biochem.29:572-578(1972);Hjelm等,Eur.J.Biochem.57:395-403(1975))。
蛋白G亲和层析也可用于纯化与效应物或可检测部分,如可检测试剂或RNA修饰多肽缔合的Cas9多肽或Cas9多肽的融合蛋白。蛋白G是由G群链球菌产生的细菌细胞壁蛋白,也可以以重组方式制备。与蛋白质A一样,蛋白质G主要通过Fc区与大多数哺乳动物免疫球蛋白结合(Bjorck等,J.Immunol.133:969-974(1984);Guss等,EMBO J.5:1567-1575(1986);
Akerstrom等,J.Biol.Chem.261:10,240-10,247(1986))。使用Cas9结合分子的亲和层析可以进一步用于纯化本公开的Cas9多肽。例如,蛋白A/G是组合了蛋白A和蛋白G的IgG结合特征的基因工程蛋白。蛋白A/G是基因融合产物,其尤其可由非致病性芽孢杆菌分泌。蛋白质A/G通常重约50,000道尔顿,并被设计为含有来自蛋白A的四个Fc结合结构域和来自蛋白G的两个Fc结合结构域(Sikkema,Amer.Biotech.Lab.7:42(1989);Eliasson等人,
J.Biol.Chem.263:4323-4327(1988))。
跟踪或测量靶RNA量的方法
本文公开的一些实施方案提供了在样品,如细胞中追踪靶RNA或测量靶RNA的量的组合物和方法,包括允许本文公开的示例性Cas9多肽结合所述靶RNA细胞,并确定所述靶RNA在所述细胞中的位置或确定所述靶RNA在所述细胞中的量。在一些实施方案中,将本文公开的与可检测试剂缔合的Cas9多肽引入样品。在一些实施方案中,将识别所述靶RNA的单向导RNA和/或反义寡核苷酸(例如PAMmer寡核苷酸)进一步引入样品。
在一些实施方案中,示例性Cas9多肽结合所述细胞的细胞核中的所述靶RNA,并随后从所述细胞核与所述靶RNA共同输出。在一些实施方案中,使用荧光显微镜确定所述细胞中所述靶RNA的位置或所述细胞中所述靶RNA的量。
在一些实施方案中,本文提供的方法包括测量所述样品中靶RNA的含量。在一些实施方案中,所述方法包括基于所述样品中所述靶RNA的含量诊断所述样品的疾病状况。在一些实施方案中,所述疾病选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症和脆性X综合征等。
修饰靶RNA的方法
本文公开的一些实施方案提供了修饰样品中的靶标的方法,包括将本文公开的示例性Cas9多肽引入样品中,并使用RNA修饰多肽修饰所述样品中的所述靶RNA,所述RNA修饰多肽在可选的实施方案中可以连接或融合示例性Cas9多肽。在一些实施方案中,将与本文公开的RNA修饰多肽缔合的示例性Cas9多肽引入样品。在一些实施方案中,将识别靶RNA的单向导RNA(sgRNA)和/或反义寡核苷酸(例如PAMmer寡核苷酸)进一步引入到样品中,并且在一些实施方案中,sgRNA与Cas9多肽缔合或共表达。
在一些实施方案中,RNA修饰多肽可以使靶RNA片段化。在一些实施方案中,RNA修饰多肽可以改变靶RNA的剪接。
在一些实施方案中,所述方法包括通过修饰所述样品中的所述靶RNA来治疗所述样品的病症。在一些实施方案中,所述疾病选自强直性肌营养不良、亨廷顿舞蹈病、家族性ALS、癌症、脊髓性肌萎缩症和脆性X综合征等。
目前在活细胞中靶向RNA的方法依赖于与反义寡核苷酸(ASO)或工程化的RNA结合蛋白的核酸碱基配对。ASO可以明确地识别目标RNA,但是其功能受到限制,无法破坏靶RNA或作为阻止其他核酸或蛋白与RNA结合的手段。工程化RNA结合蛋白设计困难并且昂贵,必须针对每个RNA靶进行完全重新设计,对结构性RNA靶向性差,并且它们对RNA的亲和力可能不可预测地变化。与ASO相反,工程化RNA结合蛋白可以携带多种蛋白因子来改变靶RNA,用于RNA跟踪的治疗。某些Cas9多肽及其使用方法在2014年12月11日提交的名称为Methods and Compositions for Modifying a Single-Stranded Target Nucleic Acid,并且公开号为WO2015/089277的PCT/US2014/069730中进行了讨论,其公开内容通过引用被全部并入本文。
在另外的实施方案中,本文提供的示例性RCas9多肽和RCas9复合物通过允许基于核酸碱基配对的简单程序化和强RNA结合,同时携带任何蛋白因子以实现靶RNA选择效果,从而将两种手段的优点相结合。在另外的实施方案中,本文提供的示例性RCas9多肽和RCas9复合物还包含CRISPR相关技术,其包括可以募集反式作用蛋白因子,光和药物可激活Cas蛋白和光遗传学相容Cas蛋白的修饰的单向导RNA。
目前还没有广泛使用的与活细胞相容的RNA定位跟踪方法。FISH方案需要破坏目的细胞/组织,但人们对活细胞中的非破坏性RNA追踪有很大的兴趣。在另外的实施方案中,本文提供的示例性靶向RNA的Cas9多肽和RCas9复合物可以填补这个重要的空白。
就改变RNA剪接调控而言,PUF蛋白剪接因子或2'-O-甲基和2'-O-2-甲氧基乙基RNA寡核苷酸具有缺点(Wang Y,Cheong CG,Hall TM,Wang Z.2009.Engineering splicing factors with designed specificities.Nat Methods 6:825-830)。如上所述,由于PUF蛋白质和寡核苷酸的弱点,没有广泛使用的剪接调节因子。在另外的实施方案中,可以使用本文记载的示例性RCas9技术来解决对用于基础研究和治疗的剪接调控进行改善的需要。
本文描述的一些实施方案涉及用于活细胞中RNA追踪的RCas9的设计和应用。在一些实施方案中,RCas9包含与荧光蛋白融合的Cas9蛋白的突变体、在哺乳动物细胞中由U6聚合酶III启动子驱动表达的单向导RNA、以及由2'OMe RNA和DNA碱基组成的反义寡核苷酸。这些组分可以用转染试剂递送到细胞核并结合mRNA形成RCas9复合物。随后所述RCas9复合物从核中输出,同时结合靶RNA,允许通过荧光显微镜追踪靶mRNA定位。其他实施方案允许测量细胞中的RNA丰度或Cas9与剪接因子或其他RNA修饰酶的融合,以改变用于治疗或研究的RNA特征。在一些实施方案中,RCas9被递送至细胞核并且随后与待定位、检测或测量的靶mRNA共同输出。
本文已经将RCas9RNA追踪与成熟的RNA追踪方法进行了比较。成熟的方法如荧光原位杂交需要杀死目的细胞,而RCas9在活细胞中提供高质量的RNA追踪测量。此外,RCas9支持在活细胞中追踪细胞质中转移的RNA。为响应mRNA检测,我们还展示了从细胞核共同输出RCas9。通过将分裂的或失活的蛋白质附加到RCas9,并定位另一半或活化肽至细胞质中,我们已经成功地重建了裂解蛋白质活性以响应RNA丰度。
在一些实施方案中,本文提供的RCas9用于追踪踪活细胞中的RNA。目前的RNA追踪方法需要杀死目的细胞。许多疾病的特点改变了RNA定位模式,药物开发将需要追踪患病细胞内源性RNA和响应药物治疗的方法。
在一些实施方案中,本文提供的RCas9用于基于基因表达的细胞的非破坏性分离。
RCas9系统可用于创建活细胞中RNA丰度的荧光读数。这可以允许从患者血液或患者活组织检查中分离循环癌细胞。这些稀有细胞可以使用RCas9根据其基因表达进行分离,并进行扩展和研究,在肿瘤形成大到足以用MRI或PET成像的很久以前就可以进行癌症检测。
在一些实施方案中,本文提供的RCas9用于改变活细胞中的RNA组成。与RNA修饰酶融合的Cas9强制结合的能力将为迅速发展的RNA代谢和加工领域提供了基础工具。人类基因组计划已将其重点转向研究RNA的重要性,而却严重缺乏用于研究和利用RNA加工结果的工程化工具。
由于Cas9蛋白和向导RNA的同时细胞递送能够识别特定的DNA序列,化脓链球菌
CRISPR-Cas系统作为基因组编辑和基因调节工具已经得到广泛应用。如本文所提供的,可以以RNA可编程方式结合和切割RNA的Cas9的发现和改造,证明了本文提供的示例性系统和方法作为通用核酸识别技术的效用。在另外的实施方案中,如本文提供的示例性靶向RNA的Cas9(RCas9)允许鉴定和操作活细胞中的RNA底物,使细胞基因表达的研究成为可能,并且可以最终产生患者和疾病特异性诊断和治疗工具。这里我们描述了RCas9的开发,并将其与先前的RNA靶向方法比较,包括工程化的RNA结合蛋白和其他类型的CRISPR-Cas系统。提供了从转录动力学的实时成像到患者特异性疗法及其在合成生物学中应用的示例性替代用途。
引言
人类基因组计划在十多年前完成,并为理解健康和疾病中细胞行为的遗传基础奠定了基础。自那时起,努力已经转向了解功能遗传元件的重要性以及它们如何影响基因表达(The ENCODE Project Consortium.2012.Annual encyclopedia of DNA elements in the human genome.Nature 489:57-74)。由于个体的所有细胞都含有大体相同的DNA,因此细胞类型(例如心肌细胞和神经元)之间的功能区别与基因组中具有转录活性的部分密切相关。因此,测量单个细胞内转录的RNA揭示了细胞的特性,并区分了健康状态和疾病状态。
例如,一组关注的RNA转录本组的表达水平鉴定了自闭症谱系障碍模型中神经元发育中的疾病相关畸变(Pasca SP,Portmann T,Voineagu I,Yazawa M,et al.201 1.Using iPSC-derived neurons to uncover cellular phenotypes associated with Timothy 
syndrome.Nat Med 17:1657-62)。作为另一个例子,某些称为microRNA(miR)的小的非编码RNA的表达越来越被认为是致癌转化的特征性标记。肿瘤miRNA特征可以用作生物标记,用于指示恶性肿瘤的类型和相关的临床结果(Lu J,Getz G,Miska EA,Alvarez-Saavedra E等人,2005,MicroRNA expression profiles classify human cancers.Nature 435:834-
8;Mac enzie TA,Schwartz GN,Calderone HM,Graveel CR,et al.2014.Stromal Expression of miR-21Identifies High-Risk Group in Triple-Negative Breast Cancer.Am J Pathol 184:3217-25)。这些研究和其他研究明确表明,追踪体内富含信息的RNA将是疾病建模、诊断和潜在治疗的关键。
由于表达特定RNA对细胞状态和行为的影响明显,揭示影响这些RNA加工的机制变得非常重要。转录后,编码蛋白的RNA经历一系列成熟步骤,包括可变剪接、核输出和亚细胞靶向、更替和时空限制性翻译。这些步骤由RNA结合蛋白(RBP)介导,并且这些因子和它们的RNA靶标的功能障碍导致人类疾病(Gerstberger S,Hafner M,Ascano M,Tuschl 
T.2014.Evolutionary conservation and expression of human RNA-binding proteins and their role in human genetic disease.Adv Exp Med Biol 825:1-55)。功能获得性扩增的RNA元件引起的RBPs的亚细胞分布的改变也成为人类疾病的常见主题。例如,C90RF72基因内的内含子六核苷酸重复序列的扩增最近被认为是两种常见神经退行性疾病——额颞叶退行性病变和肌萎缩侧索硬化中突变最频繁的基因位点(De Jesus-
Hernandez M,Mackenzie IR,Boeve BF,Boxer AL,et al.201 1.Expanded GGGGCC 
hexanucleotide repeat in noncoding region of C90RF72 causes chromosome 9p-linked FTD and ALS.Neuron 72:245-56;Renton AE,Majounie E,Waite A,Simon-
Sanchez J,et al.2011.A hexanucleotide repeat expansion in C90RF72 is the cause of chromosome 9p21-linked ALS-FTD.Neuron 72:257-68)。靶向内源性RNA加工的体内方法将开辟对发育和疾病的基本生物学理解以及治疗的新途径。最近的一项公开已经提高了对RNA向导的RNA识别的潜力的认识(O'Connell MR,Oakes BL,Sternberg SH,East-Seletsky A,et al.2014.Programmable RNA recognition and cleavage by CRISPR/Cas9.Nature 516:263-6)。在此,我们重点关注作为RNA编程的RNA识别技术的重新赋予Cas9新用途和工程化改造Cas9的潜力,所述Cas9是已被用于识别在哺乳动物细胞中DNA的化脓链球菌CRISPR-CAS系统的效应核酸酶。
目前的RNA识别模式及其局限性
设计者RNA识别因子的开发将支持生物学和医学方面的各种进步。除了靶向调控RNA加工和丰度外,设计者RBP可以产生响应于RNA识别的全新活性,如产生用于无创检测细胞状态的信号,促进信号蛋白及其底物仅在特定细胞类型中的结合,或者甚至消融显示特定表达谱的细胞。这种广泛的潜力在促进设计者RNA识别因子的开发上取得了不同程度的成功。
理想的RNA识别系统能够与内源性RNA强特异性结合,并显示足够的模性以实现简单和可预测的靶向性。基于工程化天然核酸结合蛋白,针对可编程RNA识别的进展已出现,其对于某些应用是强大的,但受限于有限的可编程性,识别的识别序列过短而无法具有特异性和/或需要大型蛋白质重复序列文库来靶向所有可能的RNA序列。与通过蛋白质直接识别核酸相反,CRISPR-Cas(成簇的规律间隔短回文重复序列)系统形成细菌适应性免疫系统,并识别与RNA向导蛋白结合的侵入核酸。
一种明显的策略是改变或串联天然RNA结合蛋白结构域。典型的RNA识别蛋白质结构域例如KH和RRM的鉴定,导致了鉴定和调节它们的天然RNA靶标的尝试(Beuth B,Pennell S,Arnvig KB,Martin SR,et al.2005.Structure of a Mycobacterium tuberculosis NusA-RNA complex.EMBO J 24:3576-87;Braddock DT,Louis JM,Baber JL,Levens D,et al.2002.Structure and dynamics of KH domains from FBP bound to single-
stranded DNA.Nature 415:1051-6;Laird-Offringa I A,Belasco JG.1995.Analysis of RNA-binding proteins by in vitro genetic selection:identification of an amino acid residue important for locking U1A onto its RNA target.Proc Natl Acad Sci USA 92:11859-63)。这些结构域以4-5个连续核苷酸的组结合RNA。因此,需要超过1000个蛋白质结构域的文库来识别所有5碱基RNA序列。相反地,PUF蛋白含有识别单个RNA核苷酸的重复结构域,因此原则上只需要4个重复就能识别所有可能的RNA序列。在2001年,天然PUF蛋白的晶体结构首先被描述(Wang X,Zamore PD,Hall TM,2001.Prystal structure of a Pumilio homology domain.Mol Cell 7:855-65),其揭示了特定RNA碱基的识别,其大部分由氨基酸侧链而非骨架决定。自其最初发现以来,PUF蛋白的RNA特异性已被解码
(Filipovska A,Razif MF,Nygard KK,Rackham O.2011.A universal code for RNA recognition by PUF proteins.Nat Chem Biol 7:425-7),并且已经设计了针对各种RNA靶标的PUF(Wang Y,Cheong CG,Hall TM,Wang Z.2009.Engineering splicing factors with designed specificities.Nat Methods6:825-30)。此外,PUF已经成功地与核酸酶活性结构域融合以靶向并破坏疾病相关RNA(Zhang W,Wang Y,Dong S,Choudhury R,et al.2014.Treatment of type 1myotonic dystrophy by engineering site-specific RNA endonucleases that target(CUG)(n)repeats.Molecular therapy:J Am Soc Gene Ther 22:312-20)。然而,PUF蛋白只能识别8个连续的碱基,而局部的二级结构可能对RNA亲和力有很强的影响,从而限制了它们的应用(Zhang W,Wang Y,Dong S,Choudhury R,et al.2014.Treatment of type 1myotonic dystrophy by engineering site-specific RNA endonucleases that target(CUG)(n)repeats.Molecular therapy:J Am Soc Gene Ther 22:312-20)。
Cas9用于RNA引导的核酸识别
尽管PUF、KH和RRM蛋白依赖蛋白质-RNA相互作用来识别RNA,但是核酸碱基配对代表了更简单的RNA识别手段。CRISPR-Cas细菌免疫系统利用RNA介导的碱基配对来识别DNA,并已成功用于在哺乳动物细胞中靶向DNA(Mali P,Yang LH,Esvelt KM,Aach J等2013.RNA-Guided Human Genome Engineering via Cas9.Science 339:823-6;Cho SW,Kim S,Kim JM,Kim JS.2013.Targeted genome engineering in human cells with the Cas9RNA-guided endonuclease.Nat Biotechnol 31:230-2;Hwang WY,Fu YF,Reyon D,Maeder ML等,2013.Efficient genome editing in zebrafish using a CRISPR-Cas system.Nat Biotechnol 31:227-9;Jinek M,East A,Cheng A,Lin S等,2013.RNA-programmed genome editing in human cells.eLife 2e00471)。在细菌和古细菌中,CRISPR-Cas形成适应性免疫系统的功能核心,其通常由与称为反式激活CRISPR RNA(tracrRNA)和CRIPSR RNA
(crRNA)的一对RNA结合的核酸酶组成。tracrRNA和crRNA指导CRISPR核酸酶通过碱基配对至入侵的质粒或噬菌体DNA,使之被核酸酶切割(图1A)。最近,来自化脓链球菌的II型CRISPR-Cas系统通过创建被称为单向导RNA(sgRNA)的tracrRNA和crRNA的人工组合而被重新用于靶向哺乳动物DNA(Mali P,Yang LH,Esvelt KM,Aach J,et al.2013.RNA-Guided Human Genome Engineering via Cas9.Science 339:823-6;Cong L,Ran FA,Cox D,Lin S,et al.2013.Multiplex genome engineering using CRISPR/Cas systems.Science 
339:819-23)。通过允许经由sgRNA序列实现容易的DNA靶向性,RNA编程的Cas9被迅速证明是基因组编辑和转录调节的一种流行的手段。最近Cas9应用于RNA靶向可能支持基于RNA编程而非工程结合蛋白的可编程RNA识别的类似转变。
靶向RNA的Cas9(RCas9)是来自Doudna实验室的近期工作的主题,其证实了Cas9体外强特异性结合ssRNA以及随后的Cas9切割ssRNA。在图1中,我们将这种新的Cas9识别RNA的方法与识别DNA的方法进行比较。通过Cas9靶向DNA需要两个特征:被称为原型间隔区相邻基序(PAM)的NGG序列,和携带与PAM相邻的反义序列的sgRNA(图1A)。Cas9的RNA靶向也需要这两个特征,尽管PAM基序由杂交反义寡核苷酸(PAMmer)提供,所述PAMer与靶RNA杂交后与sgRNA反义序列相邻(图1B)。
O'Connell和Oakes等人还证明了需要PAM基序以外的PAMmer5'延伸来产生由sgRNA编
程的特异性RNA识别。较短的缺乏这种延伸的PAMmer促进Cas9:sgRNA结合,其独立于sgRNA序列,但sgRNA编程的RNA识别的序列特异性通过PAMmer延伸重新形成。这种效应可能是由于Cas9介导的PAMmer-RNA目标双链体解链的能量消耗,其仅在sgRNA与其靶标杂交时才恢复。由于sgRNA是可编码的,并且很小(约100个碱基),因此有可能产生大型sgRNA文库来靶向特定的基因网络或筛选转录组。相反,工程化RNA识别蛋白的大小不易支持大规模筛选。
尽管与生产和分配大型修饰寡核苷酸PAMmer库相关的成本将成为这一规模工作的障碍,但未来的发展可能允许使用最低限度修饰的寡核苷酸,并利用低成本、高通量的寡核苷酸合成技术。
上述研究仅在体外进行,靶向RNA的Cas9(RCas9)在活细胞或生物体内的强度和特异性尚不清楚。类似于最近在基因组DNA上CRISPR-Cas脱靶活性的测量(Cencic R,Miura H,Malina A,Robert F,et al.2014.Protospacer adjacent motif(PAM)-distal sequences engage CRISPR Cas9 DNA target cleavage.PLoS One 9:el 09213;uscu C,Arslan S,Singh R,Thorpe J,et al.2014.Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease.Nat Biotechnol 32:677-83),为了评估其作为细胞内RNA编程的RNA结合蛋白的潜力,需要广泛验证RCas9结合特异性。化脓链球菌靶向核酸的CRISPR-Cas系统的综合能力正与其已经广为人知的DNA靶向能力一起正在变得成熟。信息框强调了RCas9在体内适用时必须克服的主要挑战。
信息框:RCas9的体内应用
评估RCas9对于活体中RNA靶向潜力一般从检查已报道的Cas9用于基因组编辑的体内
应用开始。通过各种手段已经实现了Cas9和同源sgRNA的递送,包括使用编码Cas9和sgRNA的病毒(Swiech L,Heidenreich M,Banerjee A,Habib N,et al.2015.In vivo 
interrogation of gene function in the mammalian  brain using CRISPR-
Cas9.Nature Biotechnol33:102-6;Maddalo D,Manchado E,Concepcion CP,Bonetti C,et al.2014.In vivo engineering of oncogenic chromosomal rearrangements with the CRISPR/Cas9 system.Nature 516:423-7)、允许Cas9药物诱导表达的转基因动物(Dow LE,Fisher J,O'Rourke KP,Muley A,et al.2015.Inducible in vivo genome editing with CRISPR-Cas9.Nature Biotechnol doi:10.1038/nbt.3155),以及通过阴离子融合蛋白和阳离子脂质递送Cas9蛋白和sgRNA(Zuris JA,Thompson DB,Shu Y,Guilinger JP,et al.2015.Cationic lipid-mediated delivery of proteins enables efficient 
protein-based genome editing in vitro and in vivo.Nature Biotechnol 33:73-
80)。例如,通过RCas9将与Cas9融合的剪接因子靶向目的pre-mRNA来调节RNA剪接,可以用适当的血清型分类腺病毒在中枢神经系统中实施。Cas9及其sgRNA的药物诱导和组织特异性表达,可实现其他组织中的剪接调节。但是在所有情况下,必须确定将RCas9PAMmer递送到适当组织的有效方法。通过限制Cas9或sgRNA向目的组织的表达或递送并进行PAMmer的全身施用,可能实现组织特异性RCas9活性。高稳定性的修饰的寡核苷酸如2'-O-(2-甲氧基乙基)-RNA,支持了体内反义RNA的有效递送和靶向(Meng L,Ward AJ,Chun S,Bennett CF,et al.2015.Towards a therapy for Angelman syndrome by targeting a long non-coding RNA.Nature 518:409-12;Hua Y,Sahashi,Hung G,Rigo F,et al.2010.Antisense correction of SMN2 splicing in the CNS rescues necrosis in a type III SMA mouse model.Genes Dev 24:1634-44;Passini MA,Bu J,Richards AM,Kinnecom C,et al.201 1.Antisense oligonucleotides delivered to the mouse CNS ameliorate symptoms of severe spinal muscular atrophy.Science Transl Med 3:72 ra18),并且可能证明在RCas9系统中也很有用。因此,虽然这些和类似的方法已经用于体内递送RCas9系统的一个或两个组分,但是仍然需要了解哪种组合可以有效重组所有三种组分。需要对PAMmer进行进一步修饰,以防止因RNAse H识别造成靶RNA降解,所述RNAse H是降解RNA-DNA杂交体中RNA的细胞酶。对于维持靶向特异性,同时避免招募RNAi机制,仔细调整PAMmer长度和修饰将是重要的。尽管RCas9似乎不能在体外切割DNA,但在体内是否可能发生无意的DNA靶向仍有待观察。最终,RCas9在体内的成功最终将依赖于其特异性以及RCas9是否破坏靶RNA的稳定或干扰其翻译。
调节转录后基因表达
如本文所提供的,示例性RCas9多肽利用Cas9的固有核酸内切核酸酶活性,通过剪切特定转录本来减弱基因表达(图2A)。尽管RNA干扰(RNAi)支持有效的RNA识别和切割,基于RCas9的基因敲除可用于RNAi机制不存在或不活跃的隔室或细胞器中。在另外的实施方案中,RCas9对RNA的高亲和力以及sgRNA和PAMmer的双重识别,允许比siRNA或反义寡核苷酸更加特异的RNA减少。表1将示例性RCas9的此种和其他应用与当前方法进行比较,表2将RCas9对RNA的敲除与RNAi进行了更详细的比较。
表1.示例性RCas9应用小结
表2.RNAi与示例性RCas9用于基因敲除的比较
增强而非降低基因表达的有效方法一直以来都难以捉摸。在另一实施方案中,通过将Cas9融合至稳定成熟信使RNA的因子,本文提供的组合物和方法增强了来自特定转录本的蛋白质生产(图2B)。在另一实施方案中,称为CRISPR干扰(CRISPRi)的CRISPR-Cas系统的另一种排列依赖与无核酸酶的Cas9(dCas9)融合的转录调节剂(其可通过结合特定基因组基因位点来增强或抑制基因表达(Gilbert LA,Larson  MH,Morsut L,Liu Z,et 
al.2013.CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes.Cell 154:442-51;Qi LS,Larson MH,Gilbert LA,Doudna JA,et 
al.2013.Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.Cell 152:1 173-83)。虽然该方法能够强烈影响基因表达,但不允许RNA和蛋白质基因产物效果的分离。通过将Cas9与翻译增强因子融合,RCas9可以在不改变RNA丰度的情况性,增强特定基因的蛋白表达,以测量蛋白质基因产物的特定的重要性。
细胞控制基因产物活性的另一种手段是通过RNA定位。在神经元中,细胞的胞体可以与突触相隔数厘米或更多,这对积累足够浓度突触蛋白质提出了挑战。在从细胞核输出后,参与突触结构和活性的mRNA如突触后密度蛋白95(PSD-95)(Muddashetty RS,Nalavadi VC,Gross C,Yao X,et al.201 1.Reversible inhibition of PSD-95 mRNA translation by miR-125a,FMRP phosphorylation,and mGluR signaling.Mol Cell 42:673-88)通过树突被转运,其在其作用位点附近被翻译(图2C)。通过将Cas9与转运因子融合,RCas9系统可用于强制转运至细胞的选定区域,如突触前或突触后终端。在损伤后神经元过程再生的情况下,有一些证据表明,编码细胞骨架成分的RNA定位对于轴突的再生是关键的(Shestakova EA,Singer RH,Condeelis J.2001.The physiological significance of beta-actin mRNA localization in determining cell polarity and directional motility.Proc Natl Acad Sci USA98:7045-50;Donnelly CJ,Willis DE,Xu M,Tep C,et al.201 
1.Limited availability of ZBP1restricts axonal mRNA localization and nerve regeneration capacity.EMBO J 30:4665-77)。在这种情况下,操纵RNA定位的能力可能是再生疗法的重要组成部分。
在另一实施方案中,示例性RCas9用于改变RNA的组成。前体mRNA剪接是mRNA生物合成中的关键步骤,将剪接因子栓系至前体mRNA已显示改变了序列的包含或排除(Graveley BR,Maniatis T.1998.Arginine/serine-rich domains of SR proteins can function as activators of pre-mRNA splicing.Mol Cell 1:765-71)。例如,已显示剪接因子RBFOX2影响外显子的包含,取决于它是否结合到替代外显子的上游或下游(Lovci MT,Ghanem D,Marr H,Arnold J,et al.2013.Rbfox proteins regulate alternative mRNA splicing through evolutionarily conserved RNA bridges.Nat Struct Mol Biol 20:
1434-42;Weyn-Vanhentenryck SM,Mele A,Yan Q,Sun S,et al.2014.HITS-CLIP and integrative modeling define the Rbfox spl icing-regulatory network linked to brain development and autism.Cell Rep 6:1139-52;Yeo GW,Coufal NG,Liang TY,Peng GE,et al.2009.An RNA code for the FOX2 splicing regulator revealed by mapping RNA-protein interactions in stem cells.Nat Struct Mol Biol 16:130-7)。
在另一实施方案中,通过仔细选择剪接因子并将它们融合至示例性Cas9,可以产生设计者剪接因子,其对剪接位点选择的影响可以通过RCas9序列的结合来确定。例如,脊髓性肌萎缩症是SMN1基因缺失导致神经元死亡所致,但有证据表明,SMN2剪接的强制改变在SMN1缺陷细胞可产生SMN2同种型,其恢复了SMN1的活性(Hua Y,Vickers TA,Okunola HL,Bennett CF,et al.2008.Antisense masking of an hnRNP A1/A2 intronic splicing silencer corrects SMN2 splicing in transgenic mice.Am J Hum Genet 82:834-48)。在另一实施方案中,这种类型的靶向剪接改变用于本文提供的组合物和方法中,以逆转由异常剪接引起的多种疾病(Nissim-Rafinia M,Kerem B.2002.Splicing regulation as a 
potential genetic modifier.Trends Genet 18:123-7)。
这些仅是本文提供的用于调节细胞RNA组成和细胞行为的示例性RCas9的几个例子。在另一实施方案中,作为通用核酸识别蛋白,本文提供的Cas蛋白允许将特定RNA靶向基因组基因位点。例如,长非编码RNA(IncRNA)可以识别特定的基因组基因位点并引导相关的染色质修饰因子对基因组架构造成显着影响(Geisler S,Coller J.2013,RNA in unexpected places:long non-coding RNA functions in various cellular contexts.Nat Rev Mol Cell Biol 14:699-712)。在另一实施方案中,示例性RCas9与利用正交sgRNA的另一个Cas蛋白融合,可用于以类似方式改变基因组架构。通过将被靶向的RNA带到所选的基因组位点的附近,这种DNA和RNA结合的Cas融合物可以支持在任何基因组环境下对IncRNA功能的研究。在另一实施方案中,使用具有正交sgRNA的多个Cas蛋白还允许例如通过利用既无核酸酶活性又具有活力的Cas蛋白同时且显著改变多个RNA。然而,在另一实施方案中,目前还不清楚其他Cas蛋白是否能够识别RNA,因此RCas9是否可以同时靶向多个RNA仍有待观察(Esvelt KM,Mali P,Braff JL,Moosburner M,et al.2013.Orthogonal Cas9 proteins for RNA-guided gene regulation and editing.Nat Methods 10:1116-21)。
成像应用
最近开发的几种RNA识别工具已能够对活细胞中的特定的RNA种类进行成像,但存在一些缺点(精彩综述参见(Rath AK,Rentmeister A.2014.Genetically encoded tools for RNA imaging in living cells.Curr Opin Biotechnol 31C:42-9))。以类似于通过与荧光蛋白融合使蛋白质可视化的方式,依赖于包含在目的RNA中的序列标签的一组基于RNA的系统可以使RNA可视化。这些标签被与RNA标签强烈且特异性结合的蛋白质部分识别。一种流行的方法利用与荧光蛋白融合的噬菌体MS2外壳蛋白(MCP)(Bertrand E,Chartrand P,Schaefer M,Shenoy SM,et al.1998.Localization of ASH1 mRNA particles in living yeast.Mol Cell 2:437-45)识别短RNA结构基序(所谓的'发夹')。由于来自未结合探针的背景荧光导致的低信噪比可以通过包含串联重复识别元件的长阵列来改进,该方法允许活细胞中高度丰富RNA的有效成像(Park  HY,Lim H,Yoon  YJ,Follenzi A,et 
al.2014.Visualization of dynamics of single endogenous mRNA labeled in live mouse.Science343:422-4),但是人们担心这样的大标签会显着干扰典型RNA的行为。另一种方法是掺入与外源小分子荧光团结合的人工RNA序列标签(Paige JS,Wu KY,Jaffrey SR.201 1.RNA mimics of green fluorescent protein.Science 333:642-6;Strack RL,Disney MD,Jaffrey SR.2013.A superfolding Spinach2 reveals the dynamic nature of trinucleotide repeat-containing RNA.Nat Methods 10:1219-24)。通过将荧光团固定在该适体标签中,可以通过增加量子产率、分离荧光团-猝灭剂对或通过FRET产生荧光信号(Paige JS,Wu Y,Jaffrey SR.2011.RNA  mimics  of  green fluorescent 
protein.Science 333:642-6;Strack RL,Disney MD,Jaffrey SR.2013.A superfolding Spinach2 reveals the dynamic nature of trinucleotide repeat-containing 
RNA.Nat Methods 10:1219-24;Sunbul M,Jaschke A.2013.Contact-mediated quenching for RNA imaging in bacteria with a fluorophore-binding aptamer.Angew Chem Int Ed Engl 52:13401-4;Shin I,Ray J,Gupta V,Ilgu M,et al.2014.Live-cell imaging of Pol II promoter activity to monitor gene expression with RNA IMAGEtag reporters.Nucleic Acids Res 42:e90)。抑制背景荧光的第三种方法是表达两种多肽,将所述两种多肽募集至RNA靶标时,通过利用天然或人工RNA结合结构域重构功能性荧光蛋白(Rackham O,Brown CM.2004.Visualization of RNA-protein interactions in living cells:FMRP and IMP1 interact on mRNAs.EMBO J 23:3346-55)。尽管这三种方法都非常有用,并且被广泛用于研究RNA转运和定位的动力学,但它们需要通过对内源基因位点进行遗传修饰或通过强制表达外源标记版本的RNA来获取一种标记形式的目的RNA。为了说明,来源于在β-肌动蛋白基因的3'-非翻译区(UTR)中携带24个MS2发夹的基因敲入小鼠的细胞允许实时观察来自修饰的等位基因的转录,包括观察到血清刺激时的转录爆发(Lionnet T,Czaplinski,Darzacq X,Shav-Tal Y,et al.2011.A transgenic mouse for in vivo detection of endogenous labeled mRNA.Nature Methods 8:165-70)。然而,MCP-GFP融合蛋白需要外源性递送至细胞,并且该系统仅限于高度表达的RNA。此外,由于未结合探针,MS2发夹的不完全占据减少了局部信号并产生了显著的背景噪声(Fusco D,Accornero N,Lavoie B,Shenoy SM,et al.2003.Single mRNA molecules demonstrate probabilistic movement in living mammalian cells.Curr Biol:13:161-7)。另一种技术,即分子信标,允许对未修饰的转录本进行成像,但缺点是高噪声和繁琐的递送(Tyagi S,Kramer FR.1996.Molecular beacon:Probes that fluoresce upon hybridization.Nat 
Biotechnol 14:303-8)。RCas9可以通过允许高特异性和低噪声地直接识别未标记的RNA来规避这些问题。
本文提供的示例性替代RCas9应用允许同时显现一种或多种内源RNA的丰度和/或定
位。通过将示例性无核酸酶Cas9与荧光蛋白融合,有可能使特定RNA或RNA剪接变体的定位可视化。在另一实施方案中,一对示例性Cas9蛋白与分裂的荧光蛋白例如Venus的两半融合(Ozawa T,Natori Y,Sato M,Umezawa Y.2007.Imaging dynamics of endogenous 
mitochondrial RNA in single living cells.Nat Methods 4:413-9)并靶向RNA上的相邻位点(图2E)。这将允许以比完整荧光蛋白更低的背景进行RNA定位的可视化或者测量单个细胞的RNA含量。在另一实施方案中,该分裂蛋白的手段用于靶向差异剪接地转录本中的相邻外显子,从而允许鉴定和分离表达特定RNA剪接异构体的单个细胞。在另一实施方案中,利用正交sgRNA鉴定示例性Cas蛋白可以允许同时靶向多个转录本以进行定位或丰度测量,从而允许对单细胞的RNA动态进行多重活细胞测量。
在另一实施方案中,提供了用于活细胞中内源RNA定位和丰度测量的组合物和方法的应用。例如,体干细胞的表征仍然困难,因为很少存在有表面标记用于这些稀有细胞基于细胞分选的鉴定和纯化。基因表达谱分析仍然是鉴定稀有细胞类型的最有效方式,并且在另一实施方案中,本文提供的示例性RCas9能够进行这种类型的非破坏性测量,从而稀有细胞可以单独保存、扩增和研究。
在另一实施方案中,提供了用于RNA定位的组合物和方法,其在细胞对损伤、应激以及某些促进细胞极性的行为如神经元突起的延伸的反应中是重要的。应激颗粒是一类RNA和蛋白质簇,其隔离mRNA和蛋白质,并且典型地响应氧化应激、热、病毒感染或缺氧而形成(Kedersha N,Anderson P.2007.Mammalian stress granules and processing 
bodies.Methods Enzymol 431:61-81)。RNA颗粒的异常形成牵涉许多疾病,但这些结构的RNA组分才刚开始被阐述。在另一实施方案中,本文提供的组合物和方法可以将运输至应激颗粒的内源性RNA图像化,并支持应激颗粒在健康和疾病中的作用的研究。为了理解RNA颗粒在疾病中的重要性,示例性RCas9可以用于响应应激、疾病或药物筛选的颗粒形成的时间分辨测量,或用于RNA定位可能在疾病进展或损伤组织再生中起作用的药物筛选。
合成生物学应用
本文提供了具有工业、临床和其他技术用途的方法和组合物。与所有以工程为导向的学科一样,本文提供的模块化、可塑性平台可针对各类不同应用进行调整。本文提供的示例性RCas9系统的高度模块化和可编程属性可用作合成生物学中的平台技术。例如,在另一实施方案中,分裂的酶与Cas9蛋白融合,其活性在与靶RNA结合后恢复,例如在检测到癌症相关的RNA后与分裂的死亡诱导蛋白互补(图2G)。在另一实施方案中,通过使用RNA构架本文提供的示例性Cas9融合蛋白之间的相互作用,来重新改造涉及连续的蛋白质/蛋白质相互作用的通路。在另一实施方案中,本文提供的支架蛋白可以结合激酶及其底物以强烈影响信号传导途径的输出,并且示例性RCas9多肽用于蛋白质/蛋白质相互作用的构架,以基因表达依赖性的方式控制信号传导。另一个研究团队采用的方法是将参与药物前体甲羟戊酸生产的酶相互结合,从而提高了该小分子的产量(Dueber JE,Wu GC,Malmirchegini GR,Moon TS,et al.2009.Synthetic protein scaffolds provide modular control over metabolic flux.Nat Biotechnol 27:753-9)。原则上,示例性Cas9融合蛋白在靶RNA上的强共同结合,提供了对连续蛋白质相互作用或对代谢物穿梭的控制的新的水平。
结论、普遍的关注和可选的方案
RNA靶向方法的进展从RBP结构域被改造以适应作为序列特异性决定子开始,到RCas9通过简单核酸杂交进行靶标识别,其准备与DNA靶向技术的发展紧密平行。这里,锌指和TAL效应核酸酶最近被通过Cas9结合的sgRNA进行DNA识别所取代。虽然对于DNA靶向应用,Cas9及其sgRNA在哺乳动物细胞中足够稳定且无毒,但是RCas9系统的所有三种组分(Cas9,sgRNA和PAMmer)是否可以有效递送,以及如果有效递送,其能否成功合作结合靶RNA还有待观察。RNA编程的RNA识别的可选的方案即将出现。已经知晓III-B型CRISPR-Cas系统靶向并切割RNA,作为其在细菌免疫中的正常活性的一部分。详细表征了这些来自嗜热栖热菌的CRISPR系统的效应复合物(Thermus thermophilus)(Staals RH,Zhu Y,Taylor DW,
ornfeld JE,et al.2014.RNA Targeting by the Type III-A CRISPR-Cas Csm Complex of Thermus thermophilus.Mol Cell 56:518-30)和火球菌(Yeo GW,Coufal NG,Liang TY,Peng GE,et al.2009.An RNA code for the FOX2splicing regulator revealed by mapping RNA-protein interactions in stem cells.Nat Struct Mol Biol 16:130-7),并且体外重建了其核酸酶活性。虽然这些复合物识别RNA的天然能力很有吸引力,但每个复合物都由1-4个拷贝的6种不同蛋白质组成,这可能对其体内重建提出挑战。来自
Francisella novicida的Cas9以RNA引导的方式靶向该生物体中的特定内源性RNA,尽管对该系统靶向选择的RNA的靶向的灵活性仍不清楚(Sampson TR,Saroj SD,Llewellyn AC,Tzeng YL,et al.2013.A CRISPR/Cas system mediates bacterial innate immune evasion and virulence.Nature 497:254-7)。
在另一实施方案中,示例性RCas9多肽通过简单碱基配对识别未标记的内源性RNA,这代表了RNA靶向中的重大进展,并且在诊断或治疗应用中是特别关键的。在另一实施方案中,本文提供的示例性RCas9多肽和系统被有效地递送至细胞,协同识别RNA,具有最小的不需要的去稳定作用或靶RNA的改变,同时还避免了靶向基因组DNA和脱靶转录本,从而提供了RCas9在基础和应用生物学和医学中的新应用。
本文提供的数据表明,本文提供的示例性RCas9多肽和系统对通过CRISPR/Cas9核酸编程性识别和对活细胞中未标记的mRNA定位的和追踪是有效的。
概要
在另一实施方案中,本文提供了RCas9多肽,并且使用来自化脓链球菌的CRISPR/Cas9进行RNA程序性基因组编辑的系统已经实现了多种生物体中基因组基因位点的快速和容易的改变。在另一实施方案中,本文提供了靶向RNA的灵活手段以允许类似于基于CRISPR/Cas的基因组工具的内源RNA转录本的改变和成像,但是大多数RNA追踪方法依赖于外源标签的掺入。这里,我们表明示例性核酸酶失活的化脓链球菌CRISPR/Cas9可以以核酸编程的方式,结合RNA并允许在活细胞中进行内源性RNA追踪。我们表明,只有当靶向mRNA的sgRNA存在时,核定位的靶向RNA 的Cas9(RCas9)才输出到细胞质,且靶向mRNA的sgRNA分布与荧光原位杂交成像的相关性良好。我们还展示了β肌动蛋白mRNA运输到应激颗粒的时间分辨测量。我们的结果确立了本文提供的示例性RCas9可用于以可编程的方式结合和追踪活细胞中的RNA,而不需要遗传编码的标签。
引言
成簇的规律间隔短回文重复(CRISPR)通过编码指导CRISPR相关(Cas)核酸酶到侵入遗传物质的CRISPR RNA,形成细菌和古细菌中适应性免疫系统的基础(Wiedenheft,B.,Sternberg,S.H.,and Doudna,J.A.(2012).RNA-guided genetic silencing systems in bacteria and archaea.Nature 482,331-338)。来自化脓链球菌II型CRISPR系统的Cas9已被重新用于真核生物体内基因组改造(Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Tsai,S.Q.,Sander,J.D.,Peterson,R.T.,Yeh,J.R.,and Joung,J.(2013).Efficient genome editing in zebrafish using a CRISPR-Cas system.Nat Biotechnol 31,227-229;Li,D.,Qiu,Z.,Shao,Y.,Chen,Y.,Guan,Y.,Liu,M.,Li,Y.,Gao,N.,Wang,L.,Lu,X.,et al.(2013a).Heritable gene targeting in the mouse and rat using a CRISPR-Cas system.Nat Biotechnol 31:681-683;Nakayama,T.,Fish,M.B.,Fisher,M.,Oomen-
Hajagos,J.,Thomsen,G.H.,and Grainger,R.M.(2013).Simple and efficient CRISPR/Cas9-mediated targeted mutagenesis in Xenopus tropicalis.Genesis 51,835-843;
Sander,J.D.,and Joung,J.K.(2014).CRISPR-Cas systems for editing,regulating and targeting genomes.Nat Biotechnol 32,347-355;Yang,D.,Xu,J.,Zhu,T.,Fan,J.,Lai,L.,Zhang,J.,and Chen,Y.E.(2014).Effective gene targeting in rabbits using RNA-guided Cas9nucleases.J Mol Cell Biol 6,97-99),并被迅速证明是用于其他应用如基因表达调节(Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P.,and Lim,W.A.(2013).Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.Cell 152,1 173-1 183)和成像(Chen,B.,Gilbert,L.A.,Cimini,B.A.,Schnitzbauer,J.,Zhang,W.,Li,G.W.,Park,J.,Blackburn,E.H.,Weissman,J.S.,Qi,L.S.,et al.(2013).Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system.Cell 155,1479-
1491)的DNA靶向的有效手段。Cas9及其相关的单向导RNA(sgRNA)需要两个关键特征来靶向DNA:5'-NGG-3'(其中'N'=任何核苷酸)形式的称为前间区序列邻近基序(PAM)的短DNA序列以及与sgRNA反义的在相反DNA链上的相邻序列。通过完全由sgRNA中的短间隔序列确定特异性来支持DNA识别,CRISPR/Cas9为基因组提供了独特灵活性和易于操作性。相反,操纵细胞RNA含量仍然存在问题。虽然存诸多通过RNA干扰和反义寡核苷酸减弱基因表达的有力手段,但在转录后基因表达调控的其他关键方面如可变剪接、亚细胞运输和时空限制性翻译在很大程度上是难以处理的。
类似于锌指核酸酶的组装(Urnov,FD,Rebar,EJ,Holmes,MC,Zhang,HS,and Gregory,PD(2010).Genome editing with engineeringered zinc finger nucleases.Nat Rev Genet 11,636-646)和转录激活剂样效应核酸酶(TALEN)识别特定的DNA序列,为识别特定的RNA序列所做的努力集中在改造RNA结合结构域上。例如,Pumilio和FBF同源性(PUF)蛋白带有能够识别单个碱基的明确定义的模块。然而,每个模块必须针对每个RNA靶标重新设计和验证,且最多只能识别8个连续的碱基,这限制了它们在转录组中唯一地识别RNA底物的效用。将蛋白质招募到特定RNA底物的另一种方法是将RNA适体引入到靶RNA中,从而使得同源适体结合蛋白如MS2外壳蛋白能够特异性和强结合(Fouts,D.E.,True,H.L.,and 
Celander,D.W.(1997).Functional recognition of fragmented operator sites by R17/MS2 coat protein,a translational repressor.Nucleic Acids Res25,4464-
4473)。这种方法能够随着时间推移,以高灵敏度追踪活细胞中的RNA定位(Buxbaum,A.R.,Wu,B.,and Singer,R.H.(2014).Single beta-actin mRNA detection in neurons 
reveals a mechanism for regulating its translatability.Science 343,419-422),但是依赖于对细胞中靶RNA繁琐的基因操作,并且不适合于识别任意的RNA序列。类似于基于CRISPR/Cas9的DNA识别,仅基于核酸特异性的可编程RNA识别而不需要遗传操作或RNA结合蛋白库,将大大地扩展研究人员修饰哺乳动物转录组并且实现转录组工程化的能力。
尽管CRISPR/Cas9系统已经发展为识别双链DNA,但最近的体外研究已经表明,通过提供PAM作为外源添加的与靶RNA杂交的寡核苷酸(PAMmer)的一部分,可用Cas9对RNA进行可编程靶向(O'Connell,M.R.,Oakes,B.L.,Sternberg,S.H.,East-Seletsky,A.,Kaplan,M.,and Doudna,J.A.(2014).Programmable RNA recognition and cleavage by CRISPR/Cas9.Nature 516,263-266)。通过利用依赖于PAM序列的Cas9靶标搜索机制(Sternberg,SH,Redding,S.,Jinek,M.,Greene,EC,and Doudna,JA(2014).CRISPR RNA-guided endonuclease Cas9.Nature 507,62-67),PAMmer/RNA杂交体中错配的PAM序列允许独占地靶向RNA而不是编码DNA。Cas9在无细胞提取物中RNA识别的高亲和力和特异性以及Cas9靶向基因组的成功,体现了CRISPR/Cas9支持活细胞中可编程RNA靶向的潜力。
为了评估CRISPR/Cas9作为活细胞中可编程RNA结合蛋白的潜力,我们测量了核定位信号标记的核酸酶缺陷型Cas9-GFP融合体的核输出程度。我们证明,单独的sgRNA就足以促进Cas9融合体的核输出,而不影响靶mRNA的丰度或由靶mRNA编码的蛋白质的丰度。为了评估RNA靶向的Cas9(RCas9)信号模式是否与成熟的未标记的RNA标记方法一致,我们比较了RCas9和靶向β-肌动蛋白mRNA的荧光原位杂交(FISH)的分布。我们观察到FISH和RCas9共定位之间的高度相关性,这取决于PAMmer的存在,表明PAM对于高效RNA靶向的重要性。与成熟的未标记RNA定位测量如FISH相反,RCas9支持RNA定位的时间分辨测量。我们通过追踪β-肌动蛋白在氧化应激诱导的RNA/蛋白质积聚,也称为应激颗粒中的定位来证明这种能力。这项工作确立了RCas9在活细胞中结合RNA的能力,并且为通过CRISPR/Cas9操纵除基因组之外的转录组奠定了基础。
实施例
实施例1:在存在靶向GAPDH mRNA的sgRNA的条件下从细胞核输出靶向RNA的Cas9
作为对RCas9识别人细胞中特定mRNA底物的能力的初步评估,我们测试了在同源sgRNA和设计成识别mRNA的PAMmer存在的条件下,含有核定位信号的增强GFP(EGFP)标签的Cas9是否可以与该mRNA一起共同被输出细胞核(图3A)。将无核酸酶活性Cas9(dCas9)夹在N-末端的一个SV40核定位信号序列和C-末端的两个SV40核定位信号序列之间,并与EGFP编码序列融合并克隆到哺乳动物表达载体(NLS-dCas9-2xNLS-EGFP,缩写为dCas9-GFP)。在单独的表达载体中,U6snRNA聚合酶III启动子驱动了一种修饰的sgRNA,其具有延伸的茎环结构,改善了与Cas9的结合,并具有去除了一段部分转录终止序列的突变(Chen,B.,Gilbert,L.A.,Cimini,B.A.,Schnitzbauer,J.,Zhang,W.,Li,G.W.,Park,J.,Blackburn,E.H.,Weissman,J.S.,Qi,L.S.,et al.(2013).Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system.Cell 155,1479-1491)。使用标准的亚磷酰胺化学合成法将PAMmer合成为混合了DNA和2'-O-甲基(2'OMe)的RNA寡核苷酸,并使用HPLC纯化(关于靶标、sgRNA和PAMmer序列参见表3-4)。作为对概念的验证,我们设计了一种sgRNA-PAMmer对来靶向GAPDH mRNA的3'非翻译区(3'UTR)(图3B)。作为阴性对照,我们设计了一对sgRNA-PAMmer,其靶向在人细胞中不存在的λ噬菌体(“N/A”sgRNA和PAMmer)。我们观察到,用阴性对照sgRNA和PAMmer共转染的瞬时转染dCas9-GFP几乎全部在核内,有3%的细胞的细胞质中含GFP信号(图3B和3C)。当阴性对照PAMmer用靶向GAPDH的PAMmer取代时,结果是相同的。然而,在共转染靶向GAPDH的sgRNA质粒后,我们证明24%和17%的细胞分别在有和无靶向GAPDH的PAMmer的细胞质中具有GFP信号(图3B和3C)。在两种情况下,与非靶向sgRNA相比,靶向GAPDH的sgRNA导致具有细胞质GFP信号的细胞比例显著增加。我们还观察到sgRNA种子序列中少至4个碱基错配时,就有核输出的减少(参见图6)。总体而言,这些结果与先前的体外RNA-pull down实验一致,该实验证明Cas9:sgRNA的RNA结合独立于PAMmer,但得到PAMmer的加强(O'Connell等,2014)。因此,我们通过编程sgRNA-PAMmer识别活细胞中特异性丰富的mRNA证明RCas9可以重新定位到细胞质中。
表3:RNA靶序列
表4:PAMmer(PAM为粗体)和sgRNA(间隔为粗体)序列
实施例2:用靶向RNA的Cas9识别mRNA不会改变RNA翻译或稳定性
为了进一步表征RCas9与靶mRNA之间的相互作用,我们将RCas9导向海肾荧光素酶的3'非翻译区(UTR),该区域携带有用于RNA追踪的常用的MS2噬菌体RNA标签(Fouts,D.E.,True,H.L.,and Celander,D.W.(1997).Functional recognition of fragmented 
operator sites by R17/MS2 coat protein,a translational repressor.Nucleic Acids Res 25,4464-4473)和先前验证过的sgRNA:PAMmer对靶向的序列(O'Connell,M.R.,Oakes,B.L.,Sternberg,S.H.,East-Seletsky,A.,Kaplan,M.,and Doudna,J.A.(2014).Programmable RNA recognition and cleavage by CRISPR/Cas9.Nature 516,263-266)(图3D)。用识别EGFP的抗体进行的RNA免疫沉淀显示,在同源sgRNA和PAMmer存在时,与非靶向sgRNA或加扰的PAMmer或单独的EGFP蛋白(图3E)相比,荧光素酶mRNA与dCas9-EGFP的结合增加了四倍。我们接下来通过定量RT-PCR测量RCas9靶向对荧光素酶mRNA丰度的影响。我们观察到,在靶向或非靶向RCas9系统或单独的EGFP存在下,MS2标记的荧光素酶mRNA的丰度没有显着差异。相反地,与识别MS2适体的MS2外壳蛋白(MCP)融合的EGFP的共表达具有显著的稳定作用,这可能是由于MS2系统抑制RNA降解(Garcia,J.F.,and Parker,R.(2015).MS2 coat proteins bound to yeast mRNAs block 5'to 3'degradation and trap mRNA decay products:implications for the localization of mRNAs by MS2-MCP system.RNA 21,1393-1395)(图3F)。我们还考虑了RCas9靶向性对翻译的潜在影响(图3G),并观察到与非靶向性RCas9相比,靶向sgRNA和PAMmer的存在不会引起蛋白质水平的显著变化。我们的研究结果表明,RCas9与sgRNA和PAMmer一起对RNA的识别避免了通过MCP标记的GFP靶向性相关的RNA和蛋白质水平的扰动。
实施例3:靶向RNA的Cas9信号分布与成熟的未标记的RNA定位测量方法相关
为了评估RCas9信号分布是否与测量RNA定位的正交方法相一致,我们靶向β-肌动蛋白的3'UTR(“+”sgRNA和“+”PAMmer),并将dCas9-2xNLS-mCherry信号与β-actin mRNA的RNA荧光原位杂交(FISH)(图4A)和非靶向sgRNA及PAMmer(“-”sgRNA和“-”PAMmer,序列对应于λ噬菌体)进行比较。通过比较描述FISH和RCas9之间的逐像素重叠的Mander重叠系数
(Manders,E.M.,Stap,J.,Brakenhoff,G.J.,van Driel,R.,and Aten,J.A.(1992)
.Dynamics of three-dimensional replication patterns during the S-phase,
analysed by double labelling of DNA and confocal microscopy.J Cell Sci 103(Pt 
3),857-862)(图4B),我们确定在靶向β-actin mRNA的sgRNA和PAMmer同时存在时,sgRNA是FISH和RCas9之间的共定位具有最大重叠的主要原因。非靶向PAMmer导致重叠显著减少(图
4B)(p=0.035,Mann-Whitney Test),并在细胞质中产生RCas9信号的扩散模式,与FISH显示的高度定位模式形成对比(图4A)。这个结果与在无细胞系统中观察到的RCas9与非靶向PAMmer的较弱结合一致(O'Connell,M.R.,Oakes,B.L.,Sternberg,S.H.,East-Seletsky,A.,Kaplan,M.,and Doudna,J.A.(2014).Programmable RNA recognition and cleavage by CRISPR/Cas9.Nature 516,263-266)。非靶向sgRNA导致RCas9信号的大部分保留在核内,细胞质RCas9信号与FISH之间的相关性较低(图4A-B)。我们得出结论,FISH和RCas9信号分布之间的最大重叠需要同源sgRNA和PAMmer的同时存在.
实施例4:随时间追踪RNA运输至应激颗粒
除了促进本地翻译之外,mRNA的运输还可以影响蛋白质生产的时间规划(Buchan,
J.R.,and Parker,R.(2009).Eukaryotic stress granules:the ins and outs of 
translation.Mol Cell36,932-941)。因此,我们测定了RCas9是否支持追踪mRNA到称为应激颗粒的蛋白质-RNA聚集体。应激颗粒是翻译沉默的蛋白质和RNA聚集物,可异常形成,并能够影响神经系统疾病进展(Li,Y.R.,King,O.D.,Shorter,J.,and Gitler,A.D.(2013b).Stress granules as crucibles of ALS pathogenesis.J Cell Biol 201,361-372),但是可以在活细胞中追踪内源RNA向这些结构运动的手段有限(Bertrand,E.,Chartrand,P.,Schaefer,M.,Shenoy,S.M.,Singer,R.H.,and Long,R.M.(1998).Localization of ASH 
1mRNA particles in living yeast.Mol Cell 2,437-445)。由于已知β-肌动蛋白mRNA在氧化应激过程中定位于应激颗粒(Unsworth,H.,Raguz,S.,Edwards,H.J.,Higgins,C.F.,and Yague,E.(2010).mRNA escape from stress granule sequestration is dictated by localization to the endoplasmic reticulum.FASEB J 24,3370-3380),我们使用RCas9和融合于Ras GTPase活化蛋白结合蛋白1(G3BP1)的mCherry同时追踪β-肌动蛋白mRNA,其中G3BP1是广泛报道的应激颗粒标志物(Tourriere,H.,Chebli,K.,Zekri,L.,Courselaud,B.,Blanchard,J.M.,Bertrand,E.,and Tazi,J.(2003).The RasGAP-
associated endoribonuclease G3BP assembles stress granules.J Cell Biol160,
823-831)。在应用亚砷酸钠诱导细胞应激之后,我们仅在靶向β-actin mRNA的RCas9系统存在时,观察到RCas9信号积累到G3BP1阳性焦点,而在非靶向的sgRNA和PAMmer存在的情况下观察不到该现象(图5A )。我们量化RCas9-和G3BP1-焦点之间的重叠程度,并确定大部分应激颗粒具有重叠的RCas9-焦点(图5B)。接下来我们在活细胞中随时间追踪应激细胞中的RCas9信号(图5C)。我们观察到,RCas9信号在G3BP1阳性焦点中的累积在一种方式上取决于靶向β-肌动蛋白mRNA的sgRNA和PAMmer的存在(图5C)。我们还观察到,应激颗粒中RCas9信号的积累速率和程度取决于应激剂钠亚砷酸盐的剂量(图5D)。这些结果体现了RCas9作为产生时间分辨的、定量的RNA定位测量手段的潜力。
讨论
据我们所知,这项工作展示了第一个原理证明,即RCas9可以用于活细胞中特异性结合靶RNA例如mRNA,其特异性完全由简单编程的sgRNA和PAMmers确定。在另一实施方案中,提供了RCas9多肽和系统(复合物),其支持识别长度足以用于转录组中的独特区分的RNA序列,其与工程化RNA结合蛋白例如PUF蛋白形成对比(Cheong,C.G.,and Hall,T.M.(2006).Engineering RNA sequence specificity of Pumilio repeats.Proc Natl Acad Sci USA 103,13635-13639;Wang,X.,McLachlan,J.,Zamore,P.D.,and Hall,T.M.(2002).Modular recognition of RNA by a human pumilio-homology domain.Cell 110,501-
512),后者的缺点在于RNA识别序列短,并且需要针对每个RNA靶标进行蛋白质设计、装配和验证。其他CRISPR/Cas系统已经证明在细菌中(Hale,C.R.,Zhao,P.,Olson,S.,Duff,M.O.,Graveley,B.R.,Wells,L.,Terns,R.M.,and Terns,M.P.(2009).RNA-guided RNA 
cleavage by a CRISPR RNA-Cas protein complex.Cell 139,945-956;Sampson,T.R.,Saroj,S.D.,Llewellyn,A.C.,Tzeng,Y.L.,and Weiss,D.S.(2013).A CRISPR/Cas system mediates bacterial innate immune evasion and virulence.Nature 497,254-257)或真核生物中(Price,A.A.,Sampson,T.R.,Ratner,H.,Grakoui,A.,and Weiss,D.S.(2015).Cas9-mediated targeting of viral RNA in eukaryotic cells.Proc Natl Acad Sci USA 112,6164-6169)的RNA结合,尽管这些系统不能区别RNA与DNA靶标,其作为特征的RNA靶向规则仍然不清楚,或者依赖于难以在哺乳动物细胞中重构的大的蛋白质复合物。进一步工作需要改变sgRNA间隔区长度(Fu,Y.,Sander,J.D.,Reyon,D.,Cascio,V.M.,and Joung,J..(2014).Improving CRISPR-Cas nuclease specificity using truncated guide RNAs.Nat Biotechnol 32,279-284)和PAMmer长度及化学修饰来确定最佳RCas9参数。
在一些实施方案中,本文提供的核蛋白复合物不包含PAMmer寡核苷酸。在“用于修饰单链靶核酸的方法和组合物”(WO 2015089277A1)中描述的RCas9系统利用了PAMmer寡核苷酸。通过使用包含RCas9多肽和单向导RNA但不包含PAMmer寡核苷酸的独特的核蛋白复合物来靶向RNA,我们已经表明该系统在没有PAMmer的情况下能识别和改变靶RNA。尽管没有PAMmer,我们对该系统的研究结果表明了(1)被靶向的RNA的高效改变;(2)活体真核细胞中的RNA识别。这种双组分系统的完全可编码属性使我们的系统能够在治疗的背景下通过病毒载体、纳米颗粒或其他支持DNA递送的赋形剂进行部署。由于需要化学修饰来稳定和保护其免受细胞酶活性的影响,PAMmer不能在DNA中编码,因此早期系统需要未完全编码的PAMmer。
如本文所提供的示例性RCas9的另一应用,通过靶向分裂的荧光蛋白或邻接于可变剪接的外显子的剪接因子来测量或改变RNA剪接。在另一实施方案中,本文提供的示例性RCas9的核酸可编程属性允许多重RNA靶向性(Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,
Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,et al.(2013).Multiplex genome engineering using CRISPR/Cas systems.Science 339,819-823)和结合正交sgRNA的Cas9蛋白的使用(Esvelt,K.M.,Mali,P.,Braff,J.L.,Moosburner,M.,Yaung,S.J.,and Church,G.M.(2013).Orthogonal Cas9 proteins for RNA-guided gene regulation and editing.Nat Methods 10,1116-1121),其可以同时支持多个靶RNA上的不同活性。在另一实施方案中,如本文提供的示例性RCas9赋予的RNA靶向性支持开发传感器,该传感器识别特定的健康或疾病相关基因表达模式,并通过改变基因表达或靶RNA上串联的酶来重新编程细胞行为(Delebecque,C.J.,Lindner,A.B.,Silver,P.A.,and Aldaye,F.A.(2011).Organization of intracellular reactions with rationally designed RNA assemblies.Science 333,470-474;Sachdeva,G.,Garg,A.,Godding,D.,Way,J.C.,and Silver,P.A.(2014).In vivo co-localization of enzymes on RNA scaffolds increases metabolic production in a geometrically dependent manner.Nucleic Acids Res 42,9493-9503)。目前在另一实施方案中,正在朝Cas9在体内递送作出努力(Dow,L.E.,Fisher,J.,O'Rourke,K.P.,Muley,A.,Kastenhuber,E.R.,Livshits,G.,
Tschaharganeh,D.F.,Socci,N.D.,and Lowe,S.W.(2015).Inducible in vivo genome editing with CRISPR-Cas9.Nat Biotechnol 33,390-394;Swiech,L.,Heidenreich,M.,Banerjee,A.,Habib,N.,Li,Y.,Trombetta,J.,Sur,M.,and Zhang,F.(2015))。在另一实施方案中,本文提供的示例性RCas9可用于使用CRISPR-Cas9体内询问哺乳动物脑中的基因功能(Nat Biotechnol 33,102-106;Zuris,J.A.,Thompson,D.B.,Shu,Y.,Guilinger,J.P.,Bessen,J.L.,Hu,J.H.,Maeder,M.L.,Joung,J.K.,Chen,Z.Y.,and Liu,D.R.(2015)。在另一实施方案中,提供了本文提供的示例性RCas9经阳离子脂质介导的递送,实现在体内和体外进行有效的基于蛋白的基因组编辑(Nat Biotechnol 33,73-80),并且这些努力与现有的寡核苷酸化学技术相结合(Bennett,C.F.,and Swayze,E.E.(2010).RNA targeting therapeutics:molecular mechanisms of antisense oligonucleotides as a 
therapeutic platform.Annu Rev Pharmacol Toxicol 50,259-293)可以支持本文提供的RCas9系统的体内递送,用于靶向调节活生物体中RNA加工的许多特征。
实验步骤
质粒构建,PAMmer合成和靶位点选择
从pHR-SFFV-dCas9-BFP-KRAB(来自Stanley Qi&Jonathan Weissman的赠品,Addgene质粒#46911)中扩增dCas9-2xNLS序列,在N末端标记SV40核定位信号(NLS),并使用Gibson组装法与pcDNA 3.1(Invitrogen,Carlsbad CA)中的EGFP或mCherry融合。还构建了N端缺少NLS的版本。为了构建sgRNA支架构建体,从IDT购买了具有修饰的sgRNA支架的人U6聚合酶III启动子(Chen等,2013)作为gBlock,其在sgRNA支架的5'末端具有BbsI限制性酶切位点(参见图6序列)并使用Gibson组装法克隆到pBlueScript II S(+)(Agilent,Santa Clara,CA)的多克隆位点中。将编码sgRNA序列的磷酸化寡核苷酸连接到Bbs1消化的sgRNA支架构建体中,以产生靶向GAPDH、β-肌动蛋白和海肾荧光素酶mRNA的3'UTR的sgRNA(参见图6)。用于pull-down和丰度实验的荧光素酶-PEST构建体修饰自质粒xyz(Jens Lykke-Anderson,UCSD的赠品)。pCMV-海肾荧光素酶是相同构建体的版本,但缺乏MS2和RCas9靶位点。
用IDT反义寡核苷酸设计工具和微阵列探针设计工具Picky(Chou等,2004)和OligoWiz(Wernersson和Nielsen,2005)的组合选择RCas9靶位点。我们设计了针对高可信度位点的PAMmer,其在PAM序列5'端以外有8个碱基。PAMmer由混合的2'OMe RNA和DNA碱基组成,并通过HPLC(Integrated DNA Technologies,Coralville IA)纯化。
细胞系
在补充有10%胎牛血清、谷氨酰胺和非必需氨基酸(Invitrogen)的达尔伯克氏改良伊格尔培养基(DMEM)中培养U20S和HEK293T细胞。每3-4天使用标准方法用TrypLE EXPRESS(Invitrogen)对细胞进行传代,并在37℃和5%CO2的加湿培养箱中持续培养。
RCas9靶向GAPDH和β-肌动蛋白mRNA
如上述培养的U2OS细胞在~80%汇合度传代。在37℃,用溶于PBS的20μg/mL纤连蛋白包被玻璃底96孔板或腔室载玻片2小时,然后吸出纤连蛋白溶液,并在每个孔中接种20,000个细胞。16小时后,根据厂家说明,使用Lipofectamine 3000(Invitrogen)将sgRNA和dCas9-2xNLS-EGFP质粒转染细胞。在这些实验中,共转染pCMV-Renilla荧光素酶,以使不同剂量的sgRNA和dCas9中的总转染蛋白质载量相同。sgRNA与dCas9-EGFP(携带N端NLS)质粒的重量比分别为5:1至2.5:1,其中dCas9-EGFP的量固定在总转染材料的10%。质粒转染后,立即根据厂家说明,使用Lipofectamine RNAiMax(Invitrogen)转染PAMmers。转染后24小时,用PBS洗涤细胞,并用含3.7%多聚甲醛的PBS固定,用70%乙醇在4℃下透化1小时,并用带DAPI(Invitrogen)的Prolong Gold Antifade固定剂固定。使用Olympus FV1000共焦显微镜进行共聚焦显微成像。
通过测量单个细胞的细胞核和细胞质中的平均信号,分析在靶向GAPDH的3'UTR的
sgRNA和PAMmer存在下RCas9的核输出。平均细胞质信号大于平均核信号的10%的细胞被认为具有细胞质信号。
RNA免疫沉淀
将如上所述培养的HEK293T细胞在80%汇合度进行传代,并将600,000个细胞接种在用聚-L-赖氨酸包被的6孔组织培养板的每个孔中。16小时后,用如上所述RCas9系统(具有2×内部NLS标签的dCas9-GFP)或编码MS2-EGFP或EGFP的质粒与编码由CMV启动子驱动的模型海肾荧光素酶mRNA的质粒一起共转染细胞。30小时后,吸出生长培养基并用PBS洗涤细胞。
将含1%多聚甲醛的PBS施加到细胞上,在室温下孵育10分钟,然后吸出溶液并用冷PBS洗涤细胞两次。接下来,用冷PBS将细胞从孔中刮下,并将细胞悬液以800×g离心4分钟以沉淀细胞。细胞再次洗涤一次,然后重悬于含蛋白酶抑制剂(Roche)的RIPA缓冲液中,并在BIORUPTORTM声波仪(50%占空比,1分钟周期)中超声5分钟。在高速离心后沉淀不溶物质,将上清液施用于用小鼠抗GFP抗体(Roche)包被的蛋白G DYNABEADSTM(Invitrogen)。在4℃过夜孵育后,保留珠子上清液并用含0.02%Tween-20的RIPA缓冲液洗涤珠子3次,并用DNA酶缓冲液(350mM Tris-HCl,pH 6.5;50mM MgCl2;5mM DTT)洗涤珠子1次。将珠子重悬于DNase缓冲液中,并加入TURBOTM DNA酶(Invitrogen)至0.08单位/μL。珠子在37℃孵育30分钟,然后加入蛋白酶(NEB)至0.1U/μL并在37℃下振荡温育30分钟。接下来,将尿素添加至
2.5M,并在37℃下将珠子振荡孵育30分钟。收集珠上清液并进行两次连续的苯酚:氯仿:异TM
戊醇(25:24:1)萃取,接着进行三次氯仿萃取。使用随机六聚体引物用SuperScript III(Invitrogen)沉淀RNA并逆转录,用qPCR将珠子上的海肾荧光素酶RNA的相对丰度与上清液进行比较(关于引物序列参见表5)。
表5:qPCR引物序列
GAPDH正向引物 AAGGTGAAGGTCGGAGTCAAC(SEQ ID NO:14)
GAPDH反向引物 GGGGTCATTGATGGCAACAATA (SEQ ID NO:15)
海肾荧光素酶正向引物 GTAACGCTGCCTCCAGCTAC(SEQ ID NO:16)
海肾荧光素酶反向引物 GTGGCCCACAAAGATGATTT(SEQ ID NO:17)
测量RCas9对RNA稳定性和翻译的影响
如上所述培养HEK293T细胞,传代并铺板于96-或12-孔组织培养板中,并在24h后用
RCas9系统(具有2×内部NLS标签的dCas9-GFP)和在3'UTR中携带MS2和RCas9结合位点的海肾荧光素酶构建体共转染。在蛋白质丰度测量中,将少量CMV驱动的萤火虫荧光素酶载体(总转染质粒的5%)共转染作为转染对照。对于RNA稳定性测量,在转染后24小时分离RNA,用DNase处理,使用dT(20)引物,根据厂家说明用Superscript III(Invitrogen)逆转录。然后使用qPCR测量海肾荧光素酶cDNA相对于GAPDH的量。对于翻译研究,根据厂家说明,使用双荧光素酶试剂盒(Promega)测量海肾和萤火虫荧光素酶蛋白。
β-肌动蛋白mRNA荧光原位杂交
在靶向β-肌动蛋白的RCas9系统转染后24小时,将识别人β-肌动蛋白mRNA并用Quasar 
670TM(VSMF-2003-5,Biosearch Technologies,Inc.,Petaluma,CA)标记的Stellaris FISH探针与细胞杂交。根据厂家说明进行杂交。使用Olympus FV1000TM共聚焦显微镜进行共聚焦显微成像。
荧光原位杂交和RCas9重叠分析
使用来自图像分析软件FIJI TM的Coloc2插件进行靶向β-肌动蛋白mRNA的FISH和
RCas9(具有2×内部NLS标签的dCas9-GFP)之间的共定位分析(Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,Preibisch,S.,Rueden,C,Saalfeld,S.,Schmid,B.,et al.(2012))。选择具有相似dCas9-EGFP转染水平的单个细胞的细胞质,并使用默认参数进行Coloc 2分析。对描述FISH信号与RCas9在各种条件下超过
60个细胞的重叠程度的Mander重叠系数进行汇编,并用双尾Mann-Whitney U检验计算p值。
追踪β-肌动蛋白mRNA运输至应激颗粒
使用CRISPR/Cas9将mCherry与Ras GTP酶活化蛋白结合蛋白1(G3BP1)的C末端融合,对HEK293T细胞系进行基因修饰。简言之,构建了供体质粒,其由mCherry ORF,嘌呤霉素选择框和位于侧翼的靶向G3BP1基因位点的1.5kb同源臂组成。将靶向G3BP1的C末端的sgRNA序列克隆到pSpCas9(BB)-2A-GFP(pX458)(Feng Zhang的赠品,Addgene质粒#48138)中,并根据厂家说明,使用Fugene HD(Roche)与供体质粒共转染。转染48小时后,细胞用1μg/mL嘌呤霉素在生长培养基中选择14天,并通过PCR筛选选择mCherry阳性克隆。
将具有至少一个修饰的等位基因的克隆铺板在纤连蛋白包被的玻璃腔室载玻片上,并用如上所述靶向β肌动蛋白mRNA的3'UTR的RCas9系统转染。转染24小时后,将细胞用具有平台培养箱的Zeiss LSM 810TM共焦显微镜成像,并将浓度范围为50至200μM的亚砷酸钠施用于细胞。将细胞在37℃,潮湿的空气和5%CO2中持续培养并定期成像。
β-肌动蛋白mRNA运输至应激颗粒的分析
在具有重叠G3BP1-mCherry基因位点的区域中,记录每个时间点RCas9通道的平均信号强度。将G3BP1-mCherry基因位点周围的RCas9通道的平均信号强度记录为背景,并从之前的值中减去以产生经过背景调节的应激颗粒中的RCas9信号。
实施例5:使用RCas9跟踪和操作RNA重复
质粒构建,PAMmer合成和转染
dCas9-2xNLS序列从pHR-SFFV-dCas9-BFP-KRAB(Stanley Qi&Jonathan Weissman的赠与,Addgene质粒#46911)中扩增,在C末端上用两个SV40核定位信号(NLS)标记并使用Gibson组装法与pCDNA 3.1(Invitrogen,Carlsbad CA)中的EGFP或mCherry融合。为了构建sgRNA支架构建体,购买了来自IDT的具有修饰的sgRNA支架的人U6聚合酶III启动子(Chen等人,2013)作为gBlock,其在sgRNA支架的5'末端具有两个BbsI限制性酶切位点(参见表
1),并使用Gibson组装法克隆到pBlueScript II SK(+)TM(Agilent,Santa Clara,CA)的多克隆位点。编码sgRNA序列的磷酸化寡核苷酸(在RNA反义链上具有突出端5'CACC,并且在有义链上具有5'AAAC)连接到Bbs1消化的sgRNA支架构建体中,以产生靶向特异性转录本的sgRNA(参见表1)。SMA迷你基因构建体获赠自Adrian Krainer实验室。DM1相关的120个CTG重复序列存在于pCDNA3.1质粒骨架中的CMV启动子的下游,用于在哺乳动物细胞系中表达。
通过扩增来自SMG6基因的人cDNA的PIN结构域构建pCDNA3.1PIN-XTEN-dCas9-2XNLS。XTEN接头是一种灵活的接头,用于分离相邻的蛋白质结构域。pCDNA 3.1 FOX2-dCas9-2xNLS是通过扩增来自Open Biosystem Human ORFeomeTM的FOX2而构建的,并使用Gibson组装法与dCas9-2XNLS组装。
在所有实验中,根据厂家说明使用Lipofectamine 3000(Life Technologies,
Carlsbad,CA)。在每一个96孔板中总共转染100ng质粒,转染5ng的Cas9质粒和25ng的sgRNA质粒。在成像实验中,将GFP标记版的Cas9与20ng CAG或GGGGCC(SEQ ID NO:19)重复序列质粒一起使用。在切割实验中,将相同量的重复序列质粒与PIN9标记版的Cas9一起使用。在RNA剪接实验中,不同量的pCDNA 3.1 FOX2-dCas9-2xNLS在96孔板的每个孔中按0-25ng的量转染。图7B-C,F-G由在COS-7细胞中进行的实验产生,图D-E在HEK293T细胞中进行。
对于MBNL1重新分配实验(图7F),按厂家说明,使用Lipofectamine 3000单独转染
pcDNA3.1 MBNL1-EGFP或转染pcDNA 3.1MBNL1-EGFP、pCDNA 3.1 CTG105和RCas9-PIN或转染pcDNA 3.1 MBNL1-EGFP、pCDNA 3.1CTG105、sgRNA和RCas9-PIN到CosM6细胞中。用PBS洗涤细胞,用4%PFA固定10分钟,并在4℃用冷的70%乙醇透化过夜。细胞用2×SSC和40%甲酰胺再水合15分钟。如前所述使用CAG10-Cy3探针对细胞进行RNA FISH。使用Zeiss荧光显微镜在20×和60×放大倍数下观察EGFP和Cy3荧光。
PAMmers由混合的2'OMe  RNA和DNA碱基构成,并通过HPLC(Integrated DNA 
Technologies,Coralville IA)纯化。
细胞系
HEK293T和COS-7细胞在补充有10%胎牛血清、谷氨酰胺、青霉素/链霉素和非必需氨基酸(Invitrogen)的达尔伯克氏改良伊格尔培养基(DMEM)中生长。使用标准方法每3-4天用TrypLE EXPRESS(Invitrogen)将细胞进行传代,并持续在37℃和5%CO2的加湿培养箱中培养。
RT-PCR
对于SMN2迷你基因剪接实验,根据厂家说明,使用Qiagen RNAeasyTM柱提取RNA,进行DNAse处理、逆转录(Superscript IIITM,Life Technologies)和PCR(Phusion聚合酶,Life Technologies)。PCR产物在琼脂糖凝胶跑电泳,并使用Sybr Safe凝胶染色剂(Life Technologies)通过UV成像仪成像。
RNA FISH
从细胞培养载玻片中除去培养基,用PBS(pH7.4)轻柔洗涤细胞。细胞在室温下用4%PFA固定10分钟,随后在PBS中用PBS洗涤5次,每次3分钟。在预冷的70%乙醇中将载玻片在4℃孵育过夜。弃去乙醇,并在室温下在溶于2×SSC的40%甲酰胺中将载玻片重新水化10分钟(20ml去离子甲酰胺,5ml 20×SSC,25ml超纯/DEPC水)。在孵育进行的同时,将冻干的DNA探针(CAG10-cy3(SEQ ID NO:23)或GGGGCC-cy3(SEQ ID NO:19))在水中重新溶解至500ng/μL。将所需体积的探针用移液器加入到PCR管中,在99℃加热10分钟并立即在上冷却10分钟。使用所需体积的预杂交缓冲液(参见配方)在加湿腔室或培养箱中37℃孵育细胞15分钟。将探针加入杂交缓冲液中(参见下面的配方)。将细胞与在预杂交缓冲液(杂交缓冲液=预杂交缓冲液+探针)中制备的DNA探针在37℃下加湿腔室或培养箱中杂交2小时。细胞用
40%甲酰胺/2×SSC在37-37℃洗涤3次,每次30分钟。在室温下用PBS洗涤切片5分钟,然后用固定剂-含DAPI的VECTASHIELDTM(vector labs H1200)将其固定。
Northern斑点印迹
材料:Bio-Rad Bio-DotTM设备(1706545),HYBOND+尼龙膜(GE HealthCare),Whatman纸,
溶液:10mM EDTA,20×SSC(Lonza 51205),10×SSC(用来自20×SSC的无RNA酶的水稀
释),37%甲醛,dH2O
根据厂家说明,使用Tri试剂(Sigma Aldrich)提取RNA。每泳道使用5μgRNA。RNA可以在-80℃保存6个月待用。
对于样品制备,将5μg(对于每个样品)重悬浮于无RNA酶的水中的RNA用无RNase水稀释至50ul。30μL 20×SSC和20μL 37%甲醛添加到每个样品中。将样品在60℃孵育30分钟,然后置于在冰上待用。
按照厂家的方案组装Bio-Rad Bio-DotTM装置(1706545),通过使乙醇通过孔用乙醇洗涤并且干燥。然后拆开该设备。将Hybond+TM尼龙膜和3张Whatman纸剪成Bio-Dot的大小。将Hybond+膜在无RNase水中浸泡5分钟,然后转移至10×SSC缓冲液5分钟。然后将Bio-Dot装置重新组装如下:从上到下组装>Hybond+尼龙膜,组装3×WhatmanTM纸、垫片、垫片支撑板、真空歧管并将装置拧紧并连接到实验室真空组件。打开真空,一个安静的封条被认为是良好封条的标志。将要使用的孔进行水合并在真空开启时由200μL 10×SSC通过两次进行测试。然后关闭真空加样5分钟,然后打开真空。在样品通过真空过膜后,用200μL 10×SCC洗涤孔两次。关闭真空,拆卸Bio-Dot组件,并使用“Auto-Crosslink”设置在UV STRATALINKER TM中使膜交联,该设置相当于1200mJ,样品侧朝上。此时,可将膜干燥并在室温下储存长达一个月。
为了进行探测,用10×SSC将膜水合,并用1×SSC(用无RNA酶的20×SSC稀释)洗涤。将
膜与含有500μL 1mg/ml酵母tRNA(Thermo Fisher Scientific 15401-029)的10mL 
TM
Express-Hyb 杂交溶液(Clonetech 636831)在硼酸盐杂交管(Thermo Scientific ELED-1 10113)中预先杂交,在杂交炉(Thermo Scientific 6240TS)中50℃下保持2小时。
在预杂交步骤过程中,用T4PNK将CAG CAG CAG CAG CAG CAG CAG CAG(SEQ ID NO:23)DNA探针用γ-P32ATP(Perkin Elmer BLU502Z)在下面的反应中进行末端标记:
20μL 500ng/μL CAG 10探针
10μL 10×PNK缓冲液(NEB)
5μL T4-PNK(NEB)
5μLγ-P32ATP(Perkin Elemer)
60μL水
反应在37℃孵育30分钟。按照厂家的方案,使用GE Lifesciences G-50柱(28-9034-
08)清洗探针。探针在10℃煮沸5分钟,然后置于冰上待用。将探针直接加入到预杂交缓冲液中(预杂交2小时后),并在45℃进行杂交过夜(12-16小时)。杂交后,弃去Express-Hyb缓冲液,并将膜取出到小玻璃方形烤盘/储液器中,并在室温下用含有0.1%SDS的1×SSC洗涤10分钟。在室温下用含有0.1%SDS的0.5×SSC洗涤3次,每次10分钟。然后将膜用KimWipesTM(KimTech)吸干并包裹在Saran包装中。膜在具有增感屏(GE Healthcare)的放射自显影匣(GE Healthcare)中暴露于放射自显影胶片(Thermo Fisher Scientific),-80℃下4小时。
表6:PAMmer(PAM序列粗体)和sgRNA序列
缓冲液配方
20×标准柠檬酸钠(SSC)缓冲液
组分 配方
3M氯化钠(FW 58.44) 175.3g
300mM柠檬酸钠(FW 294.1) 88.2g
d2H2O 补至1L
(用HCl调pH至7.0,用d2H2O补至终体积)
甲酰胺/SSC缓冲液
预杂交缓冲液
剧烈振荡直至硫酸葡聚糖溶解。溶液将是粘性的。或者,可以使用200mM氧腺苷复合物代替硫酸氧钒。氧钒复合物是一种RNase抑制剂,可以制造或购买自NEB(Cat.#S1402S)。
或者,可以使用RNAsin。
杂交缓冲液
最初不加探针进行制备。剧烈振荡直至硫酸葡聚糖溶解。溶液将是粘性的。将变性的探针添加到预冷的缓冲液中。
实施例6:使用靶向RNA的Cas9系统在人和/或动物模型中靶向破坏致病RNA
靶向RNA的Cas9系统用于治疗患有由RNA微卫星重复扩增引起的疾病的人类患者(例如引起强直性肌营养不良、C9orf72-1相关联的ALS和亨廷顿舞蹈病的微卫星重复扩增RNA)。
在另一实施方案中,本文提供的靶向RNA的Cas9系统或核蛋白复合物包含两种组分:1)无核酸酶活性Cas9多肽,任选地与效应多肽和/或可检测部分融合,和2)靶向含重复序列的单向导RNA(sgRNA)。
所述效应多肽可以是但不限于以下蛋白之一:RNA切割结构域(核酸内切酶),如含有PIN结构域的蛋白;荧光蛋白;或RNA剪接结构域(剪接因子),如含有RBFOX2结构域的蛋白质或已知的影响RNA剪接的蛋白质。
所述单向导RNA可以是但不限于以下之一:靶向引起强直性肌营养不良的含CTG重复序列的RNA的sgRNA;靶向导致C9orf72相关联的ALS的含有GGGGCC重复序列的RNA的sgRNA;靶向导致亨廷顿舞蹈病的含CAG重复序列的RNA的sgRNA;或靶向由含重复RNA(微卫星重复扩增疾病,如脆性X综合征、脊髓小脑性共济失调、脆性X相关性震颤/共济失调、脊髓球肌营养不良,、眼咽肌营养不良及其他)引起的其他疾病的sgRNA。
在另一实施方案中,靶向RNA的Cas9系统在由载体,如腺病毒或腺伴随病毒(AAV)携带的DNA中编码,并且可以通过以下方法之一递送至适当的组织:使用表现特定组织亲和性的特定AAV血清型(如靶向神经元或肌肉的AAV-9);将编码RCas9系统的裸DNA注射进入组织如肌肉或肝脏;使用由脂质、聚合物或其他携带编码治疗性RCas9系统的DNA或RNA的合成或天然材料组成的纳米颗粒;或上述中的任何方式,其中RCas9系统在两种分别的病毒或DNA分子之间分开,以便:一种病毒编码Cas9蛋白质,另一种病毒编码sgRNA;或者一种病毒编码Cas9蛋白一部分,而另一种病毒编码Cas9蛋白的另一部分和sgRNA。在Cas9的部分在分别的载体上编码的实施方案中,Cas9的编码部分可以彼此相互作用从而形成功能性Cas9蛋白。
例如,在一些实施方案中,将Cas9的部分改造以通过蛋白质剪接或互补来补充,以产生功能性Cas9蛋白质(参见Wright等,Rational design of a split-Cas9enzyme complex.PNAS 
112:2984-2989(2015),其内容通过引用整体并入本文)。
在另一实施方案中,为了使用本文提供的示例性RNA-靶向Cas9系统来治疗人受试者或动物,编码靶向RNA的Cas9系统的载体,如AVV可以例如通过以下方法注射:
1.同时在骨骼肌组织(肌内)多个位点(相关适应症:强直性肌营养不良)-每次注射
1011-1014GC(基因组拷贝)到主要肌群如腹肌、肱二头肌、三角肌、竖脊肌、腓肠肌、比目鱼肌、臀肌、腿筋、背阔肌、斜方肌、斜肌、胸大肌、四头肌、斜方肌和/或三头肌;
2.静脉内递送靶向肌肉的AAV血清型,如AAV-9或AAV-6或新型的靶向肌肉血清型(相关指征:强直性肌营养不良)-每次注射1011-1014GC,共注射1012-1017GC;
3.脊髓软膜下注射显示神经元亲和性的AAV-6、AAV-9或另一种血清型(相关适应症:
ALS)-以单次或多次剂量注射1011-1017GC;
4.颅内注射显示神经元亲和性的AAV-6、AAV-9或另一种血清型(相关适应症:亨廷顿舞蹈病、脊髓小脑性共济失调、脆性X染色体综合征)-以单次或多次剂量注射1011-1017GC。
实施例7:治疗人受试者的强直性肌营养不良症
在用于治疗人类受试者中强直性肌营养不良症的一些实施方案中,修饰的RCas9内切核酸酶系统、核酸、遗传构建体或病毒载体(如慢病毒或AAV载体)可以通过本领域已知的方法配制。另外,可以设想任何给药途径。在另一实施方案中,通过任何常规施用途径施用RCas9内切核酸酶系统、核酸、遗传构建体和病毒载体(如慢病毒或AAV载体),包括但不限于经口、肺部、腹膜内(ip)、静脉内(iv)、肌肉内(im)、皮下(sc)、透皮、面颊、鼻腔、舌下、眼睛、直肠和阴道。另外,对神经系统的直接施用可包括但不限于脑内、脑室内、侧脑室内、鞘内、蛛网膜下池内、椎管内或椎管周围的给药途径,使用经由颅内或椎间针或带有或不带有装置的导管。提供了本文所述治疗效果的任何给药剂量或给药频率适合用于本治疗。在一个具体的实施方案中,通过肌内途径向受试者施用编码根据本公开内容的RCas9内切核酸酶系统的病毒载体。在该实施方案的具体变体中,载体是如上定义的AAV载体,特别是AAV9载体。在一些实施方案中,人受试者可以接受单次载体注射。另外,可以采用标准的制药方法来控制作用的持续时间。这些是本领域众所周知的且包括控释制剂,并且可以包括合适的大分子,例如聚合物、聚酯、聚氨基酸、聚乙烯吡咯烷酮、乙烯乙酸乙烯酯、甲基纤维素、羧甲基纤维素或鱼精蛋白硫酸盐。另外,药物组合物可以包含含有本公开内容的RCas9内切核酸酶系统的纳米颗粒。
实施例8:治疗小鼠模型中的强直性肌营养不良并测量这些治疗的效果
可以使用的小鼠模型包括:在人骨骼肌动蛋白3'UTR中表达250个CUG重复的HSALR转基因小鼠、GGGGCC(G4C2)转基因小鼠和各种人类HTT转基因小鼠模型。
向成年小鼠的腓肠肌或胫骨前肌分别注射30至100μL含有或不含有AAV载体(AAV-6、AAV-2或AAV-9)的生理溶液。对于每只小鼠,一块肌肉注射AAV GFP-ACT3,对侧肌肉注射含有任何转基因(MCS)或GFP或仅有载体(PBS)的对照AAV。注射后六周,如前所述测量肌肉的等距收缩特性。然后,杀死小鼠,收集肌肉并在液氮冷却的异戊烷中快速冷冻并储存在-80℃下。
在生理水平上,已经确定在DM1小鼠模型中观察到的肌强直由肌肉特异性氯离子通道Clc-1外显子7a的异常剪接产生。肌强直以导致持续放电和延迟力松弛的肌肉过度兴奋为特征。一种评估神经营养不良疗法疗效的方法是通过RNA测序或RT-PCR来检测Clc-1外显子
7a的剪接。此外,可以在诱导收缩之后与对照对侧肌肉相比测定治疗剂对肌肉力量松弛的效果。强直性肌营养不良相关肌肉的电活动的逆转将通过在小鼠全身麻醉下在后肢肌肉(胫前肌、腓肠肌和股肌)和前肢肌肉(远端前肢屈肌间隔、三头肌)使用30号同心针电极通过肌电图进行测定。每块肌肉至少进行10次针刺,肌强直放电将按照4分制进行分级,其中0对应无肌强直,1表示在<50%插入时偶尔出现肌强直放电,2表示在>50%以上插入出现肌强直放电,或3表示几乎所有插入都有肌强直放电。
在至少一些前述实施例中,在一个实施例中使用的一个或多个元件可以在另一个实施例中互换使用,除非这种替换技术上不可行。本领域技术人员应理解,在不偏离所要求保护的主题的范围的情况下,可以对上述方法和结构进行各种其他省略、添加和修改。如所附权利要求所限定,所有这样的修改和改变旨在落入本主题的范围内。
关于本文中基本上任何复数和/或单数术语的使用,本领域技术人员可以根据上下文和/或应用其他术语,适当地将复数转化为单数和/或将单数转化为复数。为了清楚起见,这里可明确地阐述各种单数/复数排列。
本领域技术人员应理解,通常地,本文中使用的术语,特别是所附权利要求书(例如所附权利要求书的主体)中的术语一般旨在作为“开放”术语(例如,术语“包括”应被解释为“包括但不限于”,术语“具有”应被解释为“至少具有”)。本领域技术人员应进一步理解,如果意图引用权利要求陈述的具体数目,则这样的意图将在权利要求中明确陈述,并且在没有这样的陈述的情况下,不存在这样的意图。例如,作为对理解的帮助,以下所附权利要求可以包含介绍性短语“至少一个”和“一个或多个”的使用以引入权利要求陈述。然而,这些短语的使用,不应被解释为暗示由不定冠词“一”或“一个”引入的权利要求列举将含有这种引入的权利要求列举的任何特定权利要求限于仅包含一个这种列举的实施例,即使相同的权利要求包括介绍性短语“一个或多个”或“至少一个”以及不定冠词如“一”或“一个”(例如,“一”和/或“一个”应解释为表示“至少一个”或“一个或多个”);对于使用定冠词用于引入权利要求列举也是如此。此外,即使明确列举了具体数量的引入的权利要求,本领域技术人员将认识到,应该将这样的列举解释为意味着至少的所列举的数目(例如,纯粹列举“两个叙述”,没有其他修饰语,意味着至少两个列举,或两个或更多个列举)。此外,在类似于使用了“A、B和C等中的至少一个”等的惯例的情况下,一般而言,这种句构意图在于本领域技术人员应理解该惯例的含义(例如,“具有A、B和C中的至少一个的系统”将包括但不限于系统仅具有A、仅具有B、仅具有C、一起具有A和B、一起具有A和C、一起具有B和C、和/或一起具有A、B和C等)。本领域技术人员将应进一步理解,无论是在说明书、权利要求书还是附图中,实际上任何呈现两个或更多个替代术语的分离的词语和/或短语应当被理解为设想包括术语中的一个、任何一个或两个术语的可能性。例如,短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。
另外,本公开内容的特征或方面在记载中涉及到马库什组的情况下,本领域技术人员应认识到,本公开内容因此也记载涉及马库什组的任何单个成员或亚组成员。
如本领域技术人员应理解的,为了任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还包括任何和所有可能的子范围以及子范围的组合它们。任何列出的范围都可以被容易地识别为充分描述并且使相同的范围被分解成至少相等的一半、三分之一、四分之一、五分之十、十分之一等等。作为非限制性示例,本文讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。本领域技术人员还应理解,诸如“至多”、“至少”、“大于”、“小于”及类似的所有用语包括所列举的数字,并且是指可以随后分解成如上所述的子范围的范围。最后,本领域技术人员应理解,范围包括每个单独的成员。因此,例如,具有1-3项的组是指具有1、2或3项的组。类似地,具有1-5项的组是指具有1、2、3、4或5项的组等等。
本文列出的所有参考文献通过引用明确地整体并入本文,包括以下参考文献:
参考文献
Bashor CJ,Helman NC,Yan  S,Lim WA.2008.Using engineered scaffold 
interactions to reshape MAP kinase pathway signaling dynamics.Science 319:
1539-43.
Batra et al,2014,Loss of MBNL Leads to Disruption of Developmentally 
Regulated Alternative Polyadenylation in RNA-Mediated Disease;Mol Cell.56(2):
311-322.
Bennett,C.F.,and Swayze,E.E.(2010).RNA targeting therapeutics:molecular 
mechanisms of antisense oligonucleotides as a therapeutic platform.Annu Rev Pharmacol Toxicol 50,259-293.Bertrand,E.,Chartrand,P.,Schaefer,M.,Shenoy,S.M.,Singer,R.H.,and Long,R.M.(1998).Localization of ASH 1mRNA particles in living yeast.Mol Cell 2,437-445.
Beuth B,Pennell S,Arnvig KB,Martin SR,et al.2005.Structure of a 
Mycobacterium tuberculosis NusA-RNA complex.EMBO J24:3576-87.
Braddock DT,Louis JM,Baber JL,Levens D,et al.2002.Structure and dynamics of KH domains from FBP bound to single-stranded DNA.Nature 415:1051-6.
Buchan,J.R.,and Parker,R.(2009).Eukaryotic stress granules:the ins and 
outs of translation.Mol Cell 36,932-941.
Buxbaum,A.R.,Wu,B.,and Singer,R.H.(2014).Single beta-actin mRNA detection in neurons reveals a mechanism for regulating its translatability.Science 
343,419-422.
Cencic R,Miura H,Malina A,Robert F,et al.2014.Protospacer adjacent motif
(PAM)-distal sequences engage CRISPR Cas9 DNA target cleavage.PLoS One 9:
el09213.
Chen,B.,Gilbert,L.A.,Cimini,B.A.,Schnitzbauer,J.,Zhang,W.,Li,G.W.,Park,
J.,Blackburn,E.H.,Weissman,J.S.,Qi,L.S.,Huang,B.(2013).Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system.Cell 
155,1479-1491.
Cheong,C.G.,and Hall,T.M.(2006).Engineering RNA sequence specificity of 
Pumilio repeats.Proc Natl Acad Sci U S A 103,13635-13639.
Cho SW,Kim S,Kim JM,Kim JS.2013.Targeted genome engineering in human 
cells with the Cas9 RNA-guided endonuclease.Nat Biotechnol 31:230-2.
Chou,H.H.,Hsia,A.P.,Mooney,D.L.,and Schnable,P.S.(2004).Picky:oligo 
microarray design for large genomes.Bioinformatics 20,2893-2902.
Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,et al.(2013).Multiplex genome engineering using CRISPR/Cas systems.Science 339,819-823.
DeJesus-Hernandez M,Mackenzie IR,Boeve BF,Boxer AL,et al.2011.Expanded 
GGGGCC hexanucleotide repeat in noncoding region of C90RF72 causes chromosome 
9p-linked FTD and ALS.Neuron 72:245-56.
Delebecque,C.J.,Lindner,A.B.,Silver,P.A.,and Aldaye,F.A.(201 1)
.Organization of intracellular reactions with rationally designed RNA 
assemblies.Science 333,470-474.
Donnelly CJ,Willis DE,Xu M,Tep C,et al.2011.Limited availability of ZBP1 restricts axonal mRNA localization and nerve regeneration capacity.EMBO J 30:
4665-77.
Doudna lab patent:https://patentscope.wipo.int/search/en/detail.jsf?docId=WO2015089277&recNum=2&maxRec=2924&office=&prevFilter=&sortOption=&queryString=EN_ALL%3Anmr+AND+PA%3A%22THE+REGENTS+OF+THE+UNIVERSITY+OF+CALIFORNIA%22&tab=PCT+Biblio.
Dow,L.E.,Fisher,J.,O'Rourke,P.,Muley,A.,astenhuber,E.R.,Livshits,G.,
Tschaharganeh,D.F.,Socci,N.D.,and Lowe,S.W.(2015).Inducible in vivo genome editing with CRISPR-Cas9.Nat Biotechnol 33,390-394.
Dow LE,Fisher J,O'Rourke KP,Muley A,et al.2015.Inducible in vivo genome 
editing with CRISPR-Cas9.Nature Biotechnol doi:10.1038/nbt.3155.
Dueber JE,Wu GC,Malmirchegini GR,Moon TS,et al.2009.Synthetic protein 
scaffolds provide modular control over metabolic flux.Nat Biotechnol 27:753-
9.
Esvelt,M.,Mali,P.,Braff,J.L.,Moosburner,M.,Yaung,S.J.,and Church,G.M.
(2013).Orthogonal Cas9 proteins for RNA-guided gene regulation and 
editing.Nat Methods 10,1116-1121.
Filipovska A,Razif MF,Nygard KK,Rackham O.2011.A universal code for RNA 
recognition by PUF proteins.Nat Chem Biol 7:425-7.
Fouts,D.E.,True,H.L.,and Celander,D.W.(1997).Functional recognition of 
fragmented  operator sites by  R17/MS2 coat protein,a  translational 
repressor.Nucleic Acids Res 25,4464-4473.
Fu,Y.,Sander,J.D.,Reyon,D.,Cascio,V.M.,and Joung,J.(2014).Improving 
CRISPR-Cas nuclease specificity using truncated guide RNAs.Nat Biotechnol 32,
279-284.
Fusco D,Accornero N,Lavoie B,Shenoy SM,et al.2003.Single mRNA molecules 
demonstrate probabilistic movement in living mammalian cells.Curr Biol:13:
161-7.
Garcia,J.F.,and Parker,R.(2015).MS2 coat proteins bound to yeast mRNAs 
block 5'to 3'degradation and trap mRNA decay products:implications for the localization of mRNAs by MS2-MCP system.RNA 21,1393-1395.
Geisler S,Coller J.2013.RNA in unexpected places:long non-coding RNA 
functions in diverse cellular contexts.Nat Rev Mol Cell Biol 14:699-712.
Gerstberger S,Hafner M,Ascano M,Tuschl T.2014.Evolutionary conservation 
and expression of human RNA-binding proteins and their role in human genetic disease.Adv Exp Med Biol 825:1-55.
Gilbert LA,Larson MH,Morsut L,Liu Z,et al.2013.CRISPR-mediated modular 
RNA-guided regulation of transcription in eukaryotes.Cell 154:442-51.
Graveley BR,Maniatis T.1998.Arginine/serine-rich domains of SR proteins 
can function as activators of pre-mRNA splicing.Mol Cell 1:765-71.
Hale,C.R.,Zhao,P.,Olson,S.,Duff,M.O.,Graveley,B.R.,Wells,L.,Terns,R.M.,
and Terns,M.P.(2009).RNA-guided RNA cleavage by a CRISPR RNA-Cas protein complex.Cell 139,945-956.
Halo et al"NanoFlares for the detection,isolation,and culture of live 
tumor cells from human blood"PNAS doi:10.1073/pnas.l418637111.
Hendel,A.,Bak,R.O.,Clark,J.T.,Kennedy,A.B.,Ryan,D.E.,Roy,S.,Steinfeld,I.,Lunstad,B.D.,Kaiser,R.J.,Wilkens,A.B.,Bacchetta,R.,Tsalenko,A.,Dellinger,D.,Bruhn,L.,Porteus,M.H.(2015).Chemically modified guide RNAs enhance CRISPR-Cas genome editing in human primary cells.Nature Biotechnology 33,985-989.
Ho et al,2005,Colocalization of muscleblind with RNA foci is separable 
from mis-regulation of alternative splicing in myotonic dystrophy.J Cell Sci.118(13):2923-2933.
Hua Y,Vickers TA,Okunola HL,Bennett CF,et al.2008.Antisense masking of an hnRNP A1/A2 intronic splicing silencer corrects SMN2 splicing in transgenic mice.Am J Hum Genet 82:834-48.
Hua Y,Sahashi K,Hung G,Rigo F,et al.2010.Antisense correction of SMN2 
splicing in the CNS rescues necrosis in a type III SMA mouse model.Genes Dev 
24:1634-44.
Hua et al"Peripheral SMN restoration is essential for long-term rescue of a severe spinal muscular atrophy mouse model."Nature.201 1 Oct 5;478(7367):
123-6.doi:10.1038/naturel0485.
Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Tsai,S.Q.,Sander,J.D.,Peterson,
R.T.,Yeh,J.R.,and Joung,J.K.(2013).Efficient genome editing in zebrafish using a CRISPR-Cas system.Nat Biotechnol 31,227-229.
Jiang F,Taylor DW,Chen JS,Kornfeld JE,Zhou K,Thompson AJ,Nogales E,Doudna JA.Structures  of  a  CRISPR-Cas9  R-loop  complex  primed  for  DNA 
cleavage.Science.2016;351(6275):867-71.
Jinek M,East A,Cheng A,Lin S,et al.2013.RNA-programmed genome editing in human cells.eLife 2:e00471.
Kanadia RN,Johnstone KA,Mankodi A,Lungu C,Thornton CA,Esson D,Timmers AM,Hauswirth WW,Swanson MS.A muscleblind knockout model for myotonic 
dystrophy.Science.2003;302(5652):1978-80.
Kedersha N,Anderson P.2007.Mammalian stress granules and processing 
bodies.Methods Enzymol 431:61-81.
Kuscu C,Arslan S,Singh R,Thorpe J,et al.2014.Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease.Nat 
Biotechnol 32:677-83.
Laird-Offringa IA,Belasco JG.1995.Analysis of RNA-binding proteins by in vitro genetic selection:identification of an amino acid residue important for locking U1A onto its RNA target.Proc Natl Acad Sci USA 92:11859-63.
Li,D.,Qiu,Z.,Shao,Y.,Chen,Y.,Guan,Y.,Liu,M.,Li,Y.,Gao,N.,Wang,L.,Lu,X.,et al.(2013a).Heritable gene targeting in the mouse and rat using a CRISPR-Cas system.Nat Biotechnol 31,681-683.
Li,Y.R.,King,O.D.,Shorter,J.,and Gitler,A.D.(2013b).Stress granules as 
crucibles of ALS pathogenesis.J Cell Biol 201,361-372.
Lionnet T,Czaplinski K,Darzacq X,Shav-Tal Y,et al.201 1.A transgenic 
mouse for in vivo detection of endogenous labeled mRNA.Nature Methods 8:165-
70.
Long C,Amoasii L,Mireault AA,McAnally JR,Li H,Sanchez-Ortiz  E,
Bhattacharyya S,Shelton JM,Bassel-Duby R,Olson EN.Postnatal genome editing partially restores dystrophin expression in a mouse model of muscular 
dystrophy.Science.2016;351(6271):400-3.
Lovci MT,Ghanem D,Marr H,Arnold J,et al.2013.Rbfox proteins regulate 
alternative mRNA splicing through evolutionarily conserved RNA bridges.Nat Struct Mol Biol 20:1434-42.
Lu J,Getz G,Miska EA,Alvarez-Saavedra E,et al.2005.MicroRNA expression 
profiles classify human cancers.Nature 435:834-8.
MacKenzie TA,Schwartz GN,Calderone HM,Graveel CR,et al.2014.Stromal 
Expression of miR-21 Identifies High-Risk Group in Triple-Negative Breast Cancer.Am J Pathol 184:3217-25.
Maddalo D,Manchado E,Concepcion CP,Bonetti C,et al.2014.In vivo 
engineering of oncogenic chromosomal rearrangements with the CRISPR/Cas9 system.Nature 516:423-7.
Mali P,Yang LH,Esvelt KM,Aach J,et al.2013.RNA-Guided Human Genome 
Engineering via Cas9.Science 339:823-6.
Manders,E.M.,Stap,J.,Brakenhoff,G.J.,van Driel,R.,and Aten,J.A.(1992)
.Dynamics of three-dimensional replication patterns during the S-phase,
analysed by double labelling of DNA and confocal microscopy.J Cell Sci 103(Pt 
3),857-862.
Meng L,Ward AJ,Chun S,Bennett CF,et al.2015.Towards a therapy for 
Angelman syndrome by targeting a long non-coding RNA.Nature 51 8:409-12.
Miyanohara A,Kamizato K,Juhas S,Juhasova J,Navarro M,Marsala S,Lukacova 
N,Hruska-Plochan M,Curtis E,Gabel B,Ciacci J,Ahrens ET,Kaspar BK,Cleveland D,Marsala M.Potent spinal parenchymal AAV9-mediated gene delivery by subpial injection in adult rats and pigs.Mol Ther Methods Clin Dev.2016;3:16046.[0237] Mouisel E,Blondet B,Escourrou P,Chatonnet A,Molgo J,Ferry A.Outcome of acetylcholinesterase deficiency for neuromuscular functioning.Neurosci Res.2006;55(4):389-96.
[0238] Muddashetty RS,Nalavadi VC,Gross C,Yao X,et al.201 1.Reversible inhibition of PSD-95 mRNA translation by miR-125a,FMRP phosphorylation,and mGluR signaling.Mol Cell 42:673-88.[0239]Nakayama,T.,Fish,M.B.,Fisher,M.,Oomen-Hajagos,J.,Thomsen,G.H.,and Grainger,R.M.(2013).Simple and efficient CRISPR/Cas9-mediated targeted mutagenesis in Xenopus tropicalis.Genesis 51,
835-843.
Nissim-Rafinia M,Kerem B.2002.Splicing regulation as a potential genetic modifier.Trends Genet 18:123-7.
O'Connell,M.R.,Oakes,B.L.,Sternberg,S.H.,East-Seletsky,A.,Kaplan,M.,and 
Doudna,J.A.(2014).Programmable RNA recognition and cleavage by CRISPR/
Cas9.Nature 516,263-266.Orengo JP,Chambon P,Metzger D,Mosier DR,Snipes GJ,Cooper TA.Expanded CTG repeats within the DMPK 3'UTR causes severe skeletal muscle wasting in an inducible mouse model for myotonic dystrophy.Proc Natl Acad Sci U S A.2008;105(7):2646-51.
Ozawa T,Natori Y,Sato M,Umezawa Y.2007.Imaging dynamics of endogenous 
mitochondrial RNA in single living cells.Nat Methods 4:413-9.
Paige JS,Wu KY,Jaffrey  SR.201 1.RNA mimics of green fluorescent 
protein.Science 333:642-6.
Park HY,Lim H,Yoon YJ,Follenzi A,et al.2014.Visualization of dynamics of single endogenous mRNA labeled in live mouse.Science 343:422-4.
Pasca SP,Portmann T,Voineagu I,Yazawa M,et al.201 1.Using iPSC-derived 
neurons to uncover cellular phenotypes associated with Timothy syndrome.Nat Med 17:1657-62.
Passini  MA,Bu  J,Richards AM,Kinnecom C,et al.201 1.Antisense 
oligonucleotides delivered to the mouse CNS ameliorate symptoms of severe spinal muscular atrophy.Science Transl Med3:72ral 8.
Price,A.A.,Sampson,T.R.,Ratner,H.K.,Grakoui,A.,and Weiss,D.S.(2015).Cas9-mediated targeting of viral RNA in eukaryotic cells.Proc Natl Acad Sci U S A 
7/2,6164-6169.
Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P.,and Lim,W.A.(2013).Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.Cell 152,1 173-1 183.[0250]Rackham O,Brown CM.2004.Visualization of RNA-protein interactions in living cells:FMRP and IMP1 interact on mRNAs.EMBO J 23:3346-55.Rath  A,Rentmeister 
A.2014.Genetically encoded tools for RNA imaging in living cells.Curr Opin Biotechnol 31 C:42-9.
Renton AE,Majounie E,Waite A,Simon-Sanchez J,et al.2011.A hexanucleotide repeat expansion in C90RF72 is the cause of chromosome 9p21-linked ALS-
FTD.Neuron 72:257-68.
Sachdeva,G.,Garg,A.,Godding,D.,Way,J.C.,and Silver,P.A.(2014).In vivo co-localization of enzymes on RNA scaffolds increases metabolic production in a geometrically dependent manner.Nucleic Acids Res 42,9493-9503.
Sampson,T.R.,Saroj,S.D.,Llewellyn,A.C.,Tzeng,Y.L.,and Weiss,D.S.(2013).A CRISPR/Cas system mediates  bacterial innate  immune evasion and 
virulence.Nature 497,254-257.
Sander,J.D.,and Joung,J.K.(2014).CRISPR-Cas systems for editing,
regulating and targeting genomes.Nat Biotechnol 32,347-355.
Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,Preibisch,S.,Rueden,C,Saalfeld,S.,Schmid,B.,et al.(2012).Fiji:an open-source platform for biological-image analysis.Nat Methods 9,676-682.
Shestakova EA,Singer RH,Condeelis J.2001.The physiological significance 
of beta-actin mRNA localization in determining cell polarity and directional motility.P'roc Natl Acad Sci USA 98:7045-50.
Shin I,Ray J,Gupta V,Ilgu M,et al.2014.Live-cell imaging of Pol II 
promoter activity to  monitor  gene expression with  RNA  IMAGEtag 
reporters.Nucleic Acids Res 42:e90.
Staals RH,Zhu Y,Taylor DW,ornfeld JE,et al.2014.RNA Targeting by the Type III-A CRISPR-Cas Csm Complex of Thermus thermophilus.Mol Cell 56:518-30.
Stepto A,Gallo JM,Shaw CE,Hirth F.Modelling C90RF72 hexanucleotide repeat expansion in amyotrophic lateral sclerosis and frontotemporal dementia.Acta Neuropathol.2014;127(3):377-89.
Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.,and Doudna,J.A.(2014).DNA interrogation by the CRISPR RNA-guided endonuclease Cas9.Nature 507,62-67.Strack RL,Disney MD,Jaffrey SR.2013.A superfolding Spinach2 reveals the 
dynamic nature of trinucleotide repeat-containing RNA.Nat Methods 10:1219-24.Sunbul M,Jaschke A.2013.Contact-mediated quenching for RNA imaging in 
bacteria with a fluorophore-binding aptamer.Angew Chem Int Ed Engl 52:13401-
4.
Swiech,L.,Heidenreich,M.,Banerjee,A.,Habib,N.,Li,Y.,Trombetta,J.,Sur,M.,
and Zhang,F.(2015).In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9.Nat Biotechnol 33,102-106.
The ENCODE Project Consortium.2012.An integrated encyclopedia of DNA 
elements in the human genome.Nature 489:57-74.
Tourriere,H.,Chebli,K.,Zekri,L.,Courselaud,B.,Blanchard,J.M.,Bertrand,E.,and Tazi,J.(2003).The RasGAP-associated endoribonuclease G3BP assembles 
stress granules.J Cell Biol160,823-831.
Tyagi S,Kramer FR.1996.Molecular beacons:Probes that fluoresce upon 
hybridization.Nat Biotechnol 14:303-8.
Unsworth,H.,Raguz,S.,Edwards,H.J.,Higgins,C.F.,and Yague,E.(2010).mRNA 
escape from stress granule sequestration is dictated by localization to the endoplasmic reticulum.FASEB J 24,3370-3380.
Urnov,F.D.,Rebar,E.J.,Holmes,M.C.,Zhang,H.S.,and Gregory,P.D.(2010)
.Genome editing with engineered zinc finger nucleases.Nat Rev Genet 11,636-
646.
Wang X,Zamore PD,Hall TM.2001.Crystal structure of a Pumilio homology 
domain.Mol Cell7:855-65.
Wang,X.,McLachlan,J.,Zamore,P.D.,and Hall,T.M.(2002).Modular recognition of RNA by a human pumilio-homology domain.Cell 110,501-512.
Wang Y,Cheong CG,Hall TM,Wang Z.2009.Engineering splicing factors with 
designed specificities.Nat Methods 6:825-830.[0273]Wernersson,R.,and Nielsen,H.B.(2005).OligoWiz 2.0—integrating sequence feature annotation into the design of microarray probes.Nucleic Acids Res 33,W611-615.
Weyn-Vanhentenryck SM,Mele A,Yan Q,Sun S,et al.2014.HITS-CLIP and 
integrative modeling define the Rbfox splicing-regulatory network linked to brain development and autism.Cell Rep 6:1139-52.
Wheeler TM,Lueck JD,Swanson MS,Dirksen RT,Thornton CA.Correction of ClC-1 splicing eliminates chloride channelopathy and myotonia in mouse models of myotonic dystrophy.J Clin Invest.2007;1 17(12):3952-7.
Wiedenheft,B.,Sternberg,S.H.,and Doudna,J.A.(2012).RNA-guided genetic 
silencing systems in bacteria and archaea.Nature 482,331-338.
Wright AV,Sternberg SH,Taylor DW,Staahl BT,Bardales JA,Kornfeld JE,Doudna JA.Rational design of a split-Cas9 enzyme complex.Proc Natl Acad Sci U S A.2015;1 12(10):2984-9.
Wu X,Kriz AJ,Sharp PA.Target specificity of the CRISPR-Cas9 system.Quant Biol.2014;2(2):59-70.
Yang,D.,Xu,J.,Zhu,T.,Fan,J.,Lai,L.,Zhang,J.,and Chen,Y.E.(2014).Effective gene targeting in rabbits using RNA-guided Cas9 nucleases.J Mol Cell Biol 6,
97-99.
Yang Y,Wang L,Bell P,McMenamin D,He Z,White J,Yu H,Xu C,Morizono H,
Musunuru K,Batshaw ML,Wilson JM.A dual AAV system enables the Cas9-mediated correction of a metabolic liver disease in newborn mice.Nat Biotechnol.2016;
34(3):334-8.
Yeo GW,Coufal NG,Liang TY,Peng GE,et al.2009.An RNA code for the FOX2 
splicing regulator revealed by mapping RNA-protein interactions in stem 
cells.Nat Struct Mol Biol 16:130-7.
Zhang W,Wang Y,Dong S,Choudhury R,et al.2014.Treatment of type 1 myotonic dystrophy by engineering site-specific RNA endonucleases that target(CUG)(n)repeats.Molecular therapy:J Am Soc Gene Ther 22:312-20.
Zuris,J.A.,Thompson,D.B.,Shu,Y.,Guilinger,J.P.,Bessen,J.L.,Hu,J.H.,
Maeder,M.L.,Joung,J.,Chen,Z.Y.,and Liu,D.R.(2015).Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo.Nat Biotechnol 33,73-80.
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈