首页 / 专利库 / 人工智能 / 串联 / 新型碱基转换编辑系统用于基因治疗的应用

新型基转换编辑系统用于基因治疗的应用

阅读:48发布:2021-06-07

专利汇可以提供新型基转换编辑系统用于基因治疗的应用专利检索,专利查询,专利分析的服务。并且本 发明 首次创新提出了新型 碱 基转换编辑系统在 基因 治疗 中的应用,该系统除了保留单碱基基因编辑系统的功能—即实现 指定 位点单个碱基C/G到T/A的转换,以及实现A/T到G/C转换,同时也能实现指 定位 点C/G到T/A、和A/T到G/C的转换,所述碱基转换编辑系统包括sgRNA、能够靶向识别DNA序列的核酸酶、胞嘧啶脱 氨 酶、腺苷脱氨酶、尿嘧啶糖苷酶 抑制剂 。本发明还提出包含该碱基转换编辑系统的药物组合物,以及其在基因编辑、基因治疗、药物筛选、模型动物的构建中的用途。,下面是新型基转换编辑系统用于基因治疗的应用专利的具体信息内容。

1.一种用于基因治疗的药物或组合物,其特征在于,其包含如式(I)所示的第一载体或第一核酸构建体,和如式(II)所示的第二载体或第二核酸构建体,
PII-X1-L1-X2(T1-T2)-L2-X3-PolyA   式(I);
PIII-Y1-PII-Y2-L3-Y3-PolyA   式(II);
其中,PII为II型启动子;
X1为胞嘧啶脱酶的编码序列;
X2为腺嘌呤脱氨酶的编码序列,或具有DNA或RNA腺嘌呤脱氨功能的各个物种中的类似酶类;
X3为能够靶向识别DNA序列的核酸酶的编码序列,包括:突变型Cas9核酸酶的编码序列;
或以DNA,RNA为向导序列、靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9相关同源蛋白;或以蛋白质模识别DNA的工具系统,包括锌指核酸酶ZFN、转录激活样效应因子TALE;
PIII为III型启动子;
Y1为sgRNA的骨架序列,该sgRNA是能够与指定靶点序列互补配对的导向RNA;
Y2为尿嘧啶糖苷酶抑制剂的编码序列;
L3为自剪接多肽,选自T2A、P2A、E2A、F2A之一或其组合;
Y3为筛选标记蛋白表达序列;
L1、L2为无或连接序列;
上述“-”表示连接键或核苷酸连接序列。
2.如权利要求1所述的药物或组合物,其特征在于,所述式(I)中,PII选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子或其组合;X1为来源大鼠胞嘧啶脱氨酶或人胞嘧啶脱氨酶的编码序列;X2为细菌来源的腺嘌呤脱氨酶的编码序列;X3为带有D10A突变的可以实现切割靶向链Cas9核酸酶的编码序列;PolyA为BGH序列或SV40的PolyA序列,或其他PolyA序列。
3.如权利要求1所述的药物或组合物,其特征在于,所述式(II)中,PIII为H1启动子、U6启动子或其组合;Y1为spCas9核酸酶的sgRNA的骨架序列;所述Y2为人源尿嘧啶糖苷酶抑制剂UGI;所述L3是自剪接多肽T2A;所述Y3为绿色荧光蛋白;所述PolyA是BGH序列。
4.如权利要求1-3之任一项所述的药物或组合物,其特征在于,所述sgRNA的任意位置含有C且同时5-8位对应于出现A且能与对应的指定位点进行互补配对,从而除了实现指定位点单个基C/G到T/A的转换,还可以实现A/T到G/C转换,也能同时实现指定位点C/G到T/A、以及A/T到G/C转换。
5.如权利要求4所述的药物或组合物,其特征在于,所述Cas9核酸酶选自来源于酿酒酵母Cas9的突变体spCas9n,或选自能识别其它PAM的Cas9突变体,或选自识别PAM:NNGRRT的黄色葡萄球菌来源的SaCas9n,或选自识别PAM:NNNRRT的黄色葡萄球菌来源SaCas9n突变体,或选自来源于Cas9家族的、能识别TTTN PAM 2类的效应蛋白Cpf1,或选自与Cas9功能类似的其他物种中的CRISPR蛋白,以及在此基础上构建的能提高精确性或能识别更广泛PAM的Cas9突变体。
6.如权利要求5所述的药物或组合物,其特征在于,所述药物或组合物用于真核细胞、细菌,酵母,动物细胞、植物细胞的个体或植株。
7.如权利要求6所述的药物或组合物,其特征在于,所述真核细胞为人293T细胞、人U2OS细胞、人iPS细胞或其它真核细胞。
8.如权利要求1-3之任一项所述的药物或组合物,其特征在于,当X1是AID时,第一载体是ACBE-N-AID,其具有SEQ ID NO.1所示的氨基酸序列;或者,当X1是Apobec1时,第一载体是ACBE-N-Apobec1,其具有SEQ ID NO.2所示的氨基酸序列。
9.如权利要求8所述的药物或组合物,其特征在于,所述AID或Apobec1可选自细菌、小鼠来源或其物种来源的胞嘧啶脱氨酶;或者,所述腺嘌呤脱氨酶的编码序列包括串联的野生型TadA腺嘌呤脱氨酶T1和突变型TadA*腺嘌呤脱氨酶T2,其中TadA及TadA﹡选自大肠杆菌来源腺嘌呤脱氨酶或其它细菌属来源的腺嘌呤脱氨酶。
10.如权利要求9所述的药物或组合物,其特征在于,胞嘧啶脱氨酶还包括以RNA为底物的胞嘧啶脱氨酶经过修饰改造后能够以DNA为底物进行胞嘧啶脱氨酶。
11.如权利要求9所述的药物或组合物,其特征在于,腺嘌呤脱氨酶还包括具有DNA或者RNA腺嘌呤脱氨功能的各个物种中的类似酶类。
12.如权利要求1-3之任一项所述的药物或组合物,其特征在于,所述第二载体或第二核酸构建体为U6-sgRNA-CMV-UGI-T2A-GFP。
13.如权利要求12所述的药物或组合物,其特征在于,所述Cas9核酸酶还包括其他的以DNA,RNA为向导序列,靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9相关同源蛋白;还包括以蛋白质模块识别DNA的工具系统,包括锌指核酸酶ZFN、转录激活样效应因子TALE。
14.如权利要求13所述的药物或组合物,其特征在于,所述尿嘧啶糖苷酶抑制剂还可为人源、小鼠来源或其组合;所述筛选标记蛋白还包括绿色光蛋白、黄色荧光蛋白或红色荧光蛋白或其组合。
15.如权利要求1-3之任一项所述的药物或组合物用于对宿主或其细胞的药物靶点的筛选或有效药物的筛选的用途,其特征在于,所述宿主或其细胞选自真核生物、细菌、酵母、动物或其细胞、植物或其细胞。
16.如权利要求15所述的用途,其特征在于,所述用途是对真核生物、细菌、酵母、动物或其细胞、植物或其细胞进行双碱基编辑,通过检测其对于给定药物的敏感性或钝性,从而确定和筛选有效的药物或药物靶点、构建蛋白质新功能突变体和筛选体系。
17.如权利要求1-3之任一项所述的药物或组合物用于对宿主或其细胞进行基因治疗的用途,其特征在于,所述宿主或其细胞选自动物或其细胞。
18.如权利要求17所述的用途,其特征在于,所述用途是对宿主或其细胞进行双碱基编辑,通过使得单碱基突变或双碱基突变回复为野生型碱基,从而治疗因单碱基突变或双碱基突变引起的遗传病或其他疾病、对基因表达调控序列的改变,从而改变致病基因的产生或者使具有治疗效果的基因表达升高或者相应变化。
19.如权利要求1-3之任一项所述的药物或组合物用于构建基因突变的动物模型的用途,其特征在于,所述动物是包括原生动物在内的各种低等和高等动物。
20.如权利要求19的用途,其特征在于,所述动物模型是果蝇、斑鱼、爪蟾、小鼠、大鼠、猴、兔、禽类。
21.如权利要求20所述的用途,其特征在于,所述用途是对动物进行双碱基编辑,通过使得动物具有遗传疾病的单碱基突变或双碱基突变恢复为野生型碱基,或者使得正常动物的野生型碱基出现与遗传疾病或其他功能障碍相关的单碱基突变或双碱基突变,从而构建基因突变的动物模型。
22.如权利要求20所述的用途,其特征在于,所述用途包括向所述胚胎中的细胞导入所述的碱基转换编辑系统或包含所述碱基转换编辑系统的组合物、试剂盒、工程化细胞或重组细胞的步骤;其中,所述sgRNA根据待突变靶序列进行设计,包括靶标结合区和Cas9核酸酶识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述Cas9核酸酶识别区能被所述Cas9核酸酶识别并结合。
23.一种基因治疗方法,其特征在于,所述方法包括向受试者施用如权利要求1-3之任一项所述的用于基因治疗的药物或组合物或包含所述药物或组合物的细胞或重组细胞;所述治疗方法应用于治疗的疾病包括肿瘤癌症、遗传性疾病或功能障碍。
24.一种在细胞内产生点突变的方法,其特征在于,所述方法包括向所述细胞中导入所述如权利要求1-3之任一项所述的用于基因治疗的药物或组合物、或包含所述药物或组合物的试剂盒、工程化细胞或重组细胞的步骤;其中,所述sgRNA根据待突变靶序列进行设计,包括靶标结合区和Cas9核酸酶识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述Cas9核酸酶识别区能被所述Cas9核酸酶识别并结合,从而在所述细胞的特定窗口内实现单个碱基C/G到T/A、或A/T到G/C的的转换,或实现C/G到T/A、和A/T到G/C的两种类型碱基同时转换。

说明书全文

新型基转换编辑系统用于基因治疗的应用

技术领域

[0001] 本发明涉及基因编辑技术领域,具体涉及一种新型碱基转换编辑系统用于基因治疗的应用。

背景技术

[0002] 基因编辑技术属于一种新的DNA序列定点改造的分子生物学工具,能在一段人工设计的RNA序列引导下,识别特定的配对DNA序列,通过同时具有胞嘧啶脱酶和腺嘌呤脱氨酶的作用,将在特定窗口内除了实现单个碱基C/G到T/A的转换,还可以实现A/T到G/C转换,同时也能实现C/G到T/A,A/T到G/C同时转换,形成两种类型碱基的转换,对这一段DNA的蛋白质编码、基因转录调控、非编码RNA的序列进行改造,实现一系列新的生物学功能变化,可以广泛用于DNA改造相关的应用,例如生物材料的改进、动植物的品种改良(基因改造和性状提升)、功能基因筛选等。
[0003] 随着基因编辑技术的崛起,人们开始使用ZFN、TALEN、CRISPR/Cas等技术对各种功能基因进行编辑进行研究。其中ZFN技术是由一种能够靶向特定DNA序列的锌指蛋白组合和Type II核酸内切酶(如FokI)融合组成的人工重组蛋白。一般情况下,FokI被改造成需要通过二聚体发挥作用,所以需要一对靶向特定序列的ZFN,FokI才能够切开DNA。目前,ZFN技术已用于原核,真核细胞的基因编辑,基因功能的筛选等领域。虽然ZFN技术已经在很大程度上使得基因编辑简单化,不过其自身也存在一些不容忽视的缺陷。比如对于不同的靶点序列需要构建不同的ZFN表达载体,减缓了实验速度,且锌指对于DNA的特异性会受到上下游锌指结构的影响,使得研究人员不得不对构建好的锌指进行特异性筛选,从而再次使得实验变的繁琐且费时。
[0004] TALEN技术与ZFN技术类似,是将能够与特定DNA序列结合的类转录激活效应元件与FokI、meganuclease等核酸酶融合形成人工核酸酶。TALEN的DNA结合域与ZFN类似也是由多个元件(TALE)构成,每个TALE模由34个氨基酸组成其中第12、13位氨基酸负责识别特异的DNA碱基。相比ZFN,TALEN的优点在于每一个TALE模块识别的DNA碱基是相互独立且一一对应的,所以在特异性和效率上TALEN比ZFN更高。不过其缺点也与ZFN类似:对于新的靶点需要重新构建对应的TALEN序列,而且切割DNA的活性不够高。
[0005] 近几年出现的CRISPR/Cas技术由于其高效和灵活性正被越来越多的使用到基因编辑研究中。CRISPR/Cas来源于古细菌的一种抵御质粒、噬菌体等外源DNA片段入侵的获得性免疫机制。CRISPR/Cas9基因编辑系统的核心是一个RNA-蛋白复合物,由能与基因组中靶DNA序列互补结合的sgRNA和Cas9核酸酶两部分组成。当该复合物与靶位点结合之后,会激活Cas9核酸酶的活性,从而切割靶DNA,产生双链断裂(DSB)的DNA损伤。DSB进一步激活细胞内的DNA损伤修复机制,主要包括易错的非同源末端连接(nonhomologous end joining,NHEJ)以及高保真的同源重组修复(homologous recombination,HDR)。非同源末端连接的修复方式会在靶位点处产生DNA片段的插入或缺失(indels),导致移码突变,从而造成靶基因的功能丧失,成为无效等位基因(null allele)。当通过同源重组的方式进行修复时,需要内源的同源序列或者外源导入的同源序列作为修复模板,在靶位点处敲入外源片段或引入点突变。但是,在细胞中,同源重组的效率远远低于非同源末端连接,导致靶位点处修复结果不可控,并倾向于产生核苷酸的插入和缺失。此外,利用该系统进行基因编辑可能会产生脱靶效应,在基因组非靶向位置诱发DSB,影响脱靶位点基因或附近基因的正常功能。
[0006] 随着基因编辑技术能够在基因组上实现单个碱基的定点编辑,从而为细胞突变、遗传育种的领域提供有工具,已经有国内外研究机构开展这方面的研究,并取得了研究成果。
[0007] 2016年4月,哈佛大学生物化学家David Liu报道了一种新的基因编辑工具-单碱基编辑系统。单碱基编辑系统主要由sgRNA和融合蛋白两部分组成,其中融合蛋白一般由改造的Cas9蛋白、胞嘧啶脱氨酶和尿嘧啶糖基化酶抑制剂三者构成。sgRNA通过与靶位点互补配对,引导融合蛋白结合到靶位点发挥作用。融合蛋白中的胞嘧啶脱氨酶能够使非互补链中相应的胞嘧啶C经脱氨基作用转变为尿嘧啶U,而DNA复制进一步使得U被T代替,而互补链上原来与C的互补碱基嘌呤G将会变成腺嘌呤A,而尿嘧啶糖基化酶抑制剂则能够抑制U的切除,最终实现非互补链上的C替换为T和互补链上G替换为A的精确编辑。2017年10月,David Liu实验室又报道了另外一种新的基因编辑工具-单碱基编辑系统。即将腺嘌呤脱氨酶替换上述的胞嘧啶脱氨酶,同样是通过sgRNA与靶位点互补配对,引导融合蛋白结合到靶位点发挥作用。融合蛋白中的腺嘌呤脱氨酶能够使非互补链中相应的胞嘧啶A经脱氨基作用转变为肌苷I,而DNA上被当作G进行读码与复制,在其互补链也会引起相应的T到C的替换,最终实现非互补链上的A替换为G和互补链上的T替换为C的精确编辑。
[0008] 例如,中国发明专利申请201710437122.0、“基于碱基编辑的基因敲除方法及其应用”公开了一种基于碱基编辑的基因敲除方法及其应用。该基因敲除方法包括:选定待敲除基因的编码区的20bp–NGG目标序列,使其包含完整的目标密码子CAA、CAG或CGA;利用sgRNA序列来将BE3定位到目标序列以使目标密码子中的目标单碱基C变成T从而相应引入终止密码子TAA或TAG、TGA以实现基因敲除。虽然该方法涉及单碱基编辑技术,并没有对单碱基编辑技术提出进一步改进,例如没有提出单个碱基A/T到G/C基因组定点编辑的原始创新和相关原理,更没有提出同时两种不同原理和编辑方式并存的创新思路和相关原理,其仍然是通过将单个碱基C/G编辑成T/A从而实现基因敲除的目的。
[0009] 中国发明专利申请201710383003.1、“一种定点突变的人工载体系统及定点突变方法”公开了一种用于稻基因组碱基定点替换的人工系统及定点突变方法。该方法包括2种调控元件,能够将水稻中的所述靶位点处的C突变为T、A或G;或将所述靶位点处的G突变为A、T或C。虽然该方法能够实现单个碱基C/G到T/A基因组定点编辑,但其仍然是基于胞嘧啶去氨酶介导的单碱基替换技术,也没有提出单个碱基A/T到G/C基因组定点编辑的原始创新和相关方法,更没有提出同时两种不同原理和编辑方式并存的创新思路和相关方法。
[0010] 专利申请WO2015089406、“用于基因编辑的CAS变体”公开了一种改造的Cas9蛋白变体和脱氨酶结构域的融合蛋白,其中脱氨酶选自胞苷脱氨酶(例如APOBEC1家族脱氨酶、ACF1/ASE脱氨酶)、腺嘌呤脱氨酶(如ADAT家族脱氨酶)。该专利申请提出既可以使用修饰的胞苷脱氨酶或腺嘌呤脱氨酶,用于对靶DNA序列修饰与疾病或失调相关的点突变,例如修正C→T和/或G→A点突变,以实现单个碱基C/G到T/A基因组定点编辑。
[0011] 在以上研究结果中,虽然HDR能引入精确的突变,但是其效率较低,约为0.1%-5%。同时由于Cas9介导的HDR依赖于DSB的产生,不可避免的激活NHEJ修复方式,出现较高频率的非预期的碱基改变,也有可能产生脱靶切割。如何能在不引入双链断裂的情况下进行精确的基因修饰成为极具挑战的前沿技术难题。此外,在已有的研究结果中,基因编辑系统或是单独发挥C/G编辑为T/A(胞苷脱氨酶),或是单独发挥A/T编辑为G/C(腺嘌呤脱氨酶),如果直接将两种系统同时转入细胞中,由于两种酶的作用位点是类似的,将其同时融合到cas9上,那么在一个等位基因上只能实现某一种碱基的编辑,不能实现两种单碱基的改变,并且还存在胞嘧啶脱氨酶的突变窗口过于狭窄(仅4-8个碱基),以及腺嘌呤脱氨酶的活性不高的缺陷。
[0012] 随着基因编辑技术的发展突飞猛进,可以预料其将广泛用于食品安全、物种改良等广大领域。但是最新的研究成果主要集中在欧美发达国家,并已经进入中国开始申请相关技术保护。因此,为了提高中国的研究水平,保护中国科研成果,以实现“中国制造2025战略发展规划中涉及生物医药”中抢占技术领先点,必须提供一种新的碱基编辑技术,以实现中国在科技创新上弯道超车,尽快赶超和领先欧美先进水平,以确保该技术为中国人民所用。

发明内容

[0013] 由于现有技术中公开的是胞嘧啶脱氨酶融合CRISPR/Cas9或将腺嘌呤脱氨酶融合CRISPR/Cas9的单碱基突变技术,不能实现双碱基同时突变。相比较现有技术,本发明首次创新提出一种融合了经过改造的胞嘧啶脱氨酶与腺嘌呤脱氨酶两种脱氨酶,经一次转染步骤,能在给定突变窗口内实现C/G到T/A,A/T到G/C两种碱基类型的同时突变的碱基转换编辑系统。
[0014] 因此,本发明第一目的是提供一种用于对基因组突变窗口进行编辑的碱基转换编辑系统或组合物,其包含用于表达含有能够靶向识别DNA序列的核酸酶(如Cas9核酸酶或Cas9蛋白)、胞嘧啶脱氨酶和腺嘌呤脱氨酶的融合蛋白的第一载体或第一核酸构建体,和用于表达sgRNA及尿嘧啶糖苷酶抑制剂的第二载体或第二核酸构建体。
[0015] 本发明中,所述第一载体或第一核酸构建体包括5’-3’的式(I)结构:
[0016] PII-X1-L1-X2(T1-T2)-L2-X3-PolyA  式(I);
[0017] 其中,PII为II型启动子,选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子、或其他的RNA聚合酶II型启动子或其组合。
[0018] X1选自胞嘧啶脱氨酶的编码序列,或以RNA为底物的胞嘧啶脱氨酶经过修饰改造后能够以DNA为底物进行脱氨的胞嘧啶脱氨酶,其来源于大鼠、小鼠、人、细菌或噬菌体等及其组合;优选地,选自AID或Apobec1。
[0019] X2为腺嘌呤脱氨酶的编码序列,或具有DNA或RNA腺嘌呤脱氨功能的各个物种中的类似酶类(如ADAR)等,其来源于大鼠、小鼠、人、细菌或噬菌体等及其组合,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;在优选的方案中,X2为串联的野生型腺嘌呤脱氨酶T1(即野生型TadA腺嘌呤脱氨酶)和突变型腺嘌呤脱氨酶T2(即突变型TadA*的腺嘌呤脱氨酶)。
[0020] X3包括突变型Cas9核酸酶的编码序列;或以DNA,RNA为向导序列、靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9等相关同源蛋白;还包括以蛋白质模块识别DNA的工具系统,包括锌指核酸酶(ZFN)、转录激活样效应因子(TALE)等;优选地,X3为带有D10A突变的可以实现切割靶向链的Cas9核酸酶的编码序列(即SpCas9n)。
[0021] PolyA为BGH序列或SV40的PolyA序列,或其他PolyA序列;优选地,所述PolyA是BGH序列。
[0022] L1、L2为无或连接序列;优选地,L1是带有NLS的连接序列,具体为SEQ ID No.52:SGGSPKKRKVGSSGS,L2是32个氨基酸的长度连接序列,具体为SEQ ID No.53:SGGSSGGSSGSETPGTSESATPESSGGSSGGS。
[0023] 上述“-”表示连接键或核苷酸连接序列。
[0024] 本发明中,所述第二载体包括5’-3’的式(II)结构:
[0025] PIII-Y1-PII-Y2-L3-Y3-PolyA  式(II);
[0026] 其中,PIII为III型启动子;选自H1启动子、U6启动子,或其他的RNA聚合酶III型启动子或其组合;
[0027] Y1为sgRNA的骨架序列,该sgRNA是能够与指定靶点序列互补配对的导向RNA;
[0028] PII为II型启动子;
[0029] Y2为尿嘧啶糖苷酶抑制剂的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合;优选地,所述尿嘧啶糖苷酶抑制剂为人源尿嘧啶糖苷酶抑制剂UGI。
[0030] PolyA为BGH序列或SV40的PolyA序列,或其他PolyA序列;优选地,所述PolyA是BGH序列。
[0031] L3为自剪接多肽,选自T2A、P2A、E2A、F2A之一或其组合。
[0032] Y3为筛选标记蛋白表达序列;优选地,所述Y3为绿色荧光蛋白。
[0033] 上述“-”表示连接键或核苷酸连接序列。
[0034] 在一个实施方案中,所述式(I)中,PII选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子或其组合;X1为来源大鼠胞嘧啶脱氨酶或人胞嘧啶脱氨酶的编码序列;X2为细菌来源的腺嘌呤脱氨酶的编码序列,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;X3为带有D10A突变的可以实现切割靶向链的Cas9核酸酶的编码序列;PolyA为BGH序列或SV40的PolyA序列,或其他polyA序列。
[0035] 在另一实施方案中,所述式(II)中,PIII为H1启动子、U6启动子或其组合;Y1为spCas9核酸酶的sgRNA的骨架序列,且与式(I)所使用的Cas9核酸内切酶相对应;所述Y2选自人源尿嘧啶糖苷酶抑制剂UGI;所述L3是自剪接多肽T2A;所述Y3为绿色荧光蛋白;所述PolyA是BGH序列。
[0036] 在一个优选实施方案中,sgRNA的任意位置含有C且同时5-8位对应于出现A且能与对应的指定位点进行互补配对,从而除了实现指定位点单个碱基C/G到T/A的转换,还可以实现A/T到G/C转换,也能同时实现指定位点C/G到T/A,以及A/T到G/C转换。
[0037] 在一个具体实施方案中,Cas9核酸酶选自来源于酿酒酵母Cas9的突变体spCas9n,或选自能识别其它PAM的的Cas9突变体,或选自识别PAM:NNGRRT的黄色葡萄球菌来源的SaCas9n,或选自识别PAM:NNNRRT的黄色葡萄球菌来源SaCas9n突变体,或选自来源于Cas9家族的、能识别TTTN PAM 2类的效应蛋白Cpf1,或选自与cas9功能类似的其他物种中的CRISPR蛋白,以及在此基础上构建的能提高精确性或能识别更广泛PAM的Cas9突变体。
[0038] 在上述任一实施方案中,所述双碱基编辑系统编辑的对象还包括来自真核细胞、细菌、酵母、动物细胞、植物细胞的个体或植株。在一个优选实施方案中,其中所述真核细胞为人293T细胞、人U2OS细胞、人iPS细胞或其它真核细胞。
[0039] 在上述任一实施方案中,所述突变窗口是指从距离PAM远端数起第-3-20位碱基胞嘧啶(C)及从距离PAM远端数起第5-8位碱基腺嘌呤(A)的核苷酸序列。本发明碱基转换编辑系统的突变窗口为距离PAM远端数起第-3-20位碱基胞嘧啶(C)及从距离PAM远端数起第5-8位碱基腺嘌呤(A)的核苷酸序列。
[0040] 在上述任一实施方案中,其中所述尿嘧啶糖苷酶抑制剂还可为大鼠、小鼠、细菌或噬菌体来源或其组合。
[0041] 还在上述任一实施方案中,所述筛选标记蛋白还可包括绿色光蛋白、黄色荧光蛋白、红色荧光蛋白或其组合。
[0042] 在上述任一实施方案中,所述包含融合蛋白的第一载体的式(I)(即PII-X1-L1-X2(T1-T2)-L2-X3-PolyA)中,
[0043] X1是AID或Apobec1;
[0044] L1是带有NLS的连接序列,具体为SEQ ID No.52:SGGSPKKRKVGSSGS;L2是32个氨基酸的长度连接序列,具体为SEQ ID No.53:SGGSSGGSSGSETPGTSESATPESSGGSSGGS;
[0045] T1是野生型TadA腺嘌呤脱氨酶;
[0046] T2是突变型TadA*的腺嘌呤脱氨酶;
[0047] X3是带有D10A突变的Cas9,即SpCas9n;
[0048] PolyA是BGH序列。
[0049] 在一个优选实施方案中,当X1是AID时,第一载体是ACBE-N-AID,其具有如SEQ ID NO.1所示的氨基酸序列:
[0050] MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPSGGSPKKKRKVGSSGSSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSPKKKRKV*。
[0051] 在另一优选实施方案中,当X1是Apobec1时,第一载体是ACBE-N-Apobec1,其具有SEQ ID NO.2所示的氨基酸序列。
[0052] MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSPKKKRKVGSSGSSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSPKKKRKV*
[0053] 在其他优选实施方案中,所述AID或Apobec1可选自细菌、小鼠来源或其它物种来源的胞嘧啶脱氨酶。在另外优选实施方案中,TadA及TadA*选自大肠杆菌来源腺嘌呤脱氨酶或其它细菌属来源的腺嘌呤脱氨酶。
[0054] 在上述任一实施方案中,胞嘧啶脱氨酶不局限于本发明中使用的Apobec1和AID,凡是具有胞嘧啶脱氨功能的任何物种的酶都可以经过改造,替代本发明中使用的两种酶,还应当包括可以以RNA为底物的胞嘧啶脱氨酶经过修饰改造后能够以DNA为底物进行胞嘧啶脱氨酶。腺嘌呤脱氨酶除了本发明中使用的TadA及其突变体,还应当包括ADAR等具有DNA或者RNA腺嘌呤脱氨功能的各个物种中的类似酶类。
[0055] 在一具体实施方案中,本发明通过将胞嘧啶脱氨酶和腺嘌呤脱氨酶与Cas9核酸酶进行融合,形成ACBE-N-AID,ACBE-N-Apobec1,可在特定窗口内除了实现单个碱基C/G到T/A的转换,A/T到G/C转换;同时也能实现C/G到T/A、和A/T到G/C的同时转换,形成两种类型碱基的转换。
[0056] 在上述任一实施方案中,所述第二载体包括U6-sgRNA-CMV-UGI-T2A-GFP。
[0057] 在上述任一实施方案中,结合特定DNA的工具除了本发明中使用的Cas9,也包括其他的以DNA,RNA为向导序列,靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9等相关同源蛋白;还包括以蛋白质模块识别DNA的工具系统,包括锌指核酸酶(ZFN)、转录激活样效应因子(TALE)等。
[0058] 本发明第二目的是提供上述碱基转换编辑系统或组合物的构建方法,所述方法包括:将所述胞嘧啶脱氨酶、野生型和突变型腺嘌呤脱氨酶、Cas9核酸酶、尿嘧啶糖苷酶按一定顺序进行融合构建,从而实现在Cas9核酸酶的介导下,在特定窗口内实现单个碱基C/G到T/A或A/T到G/C的单碱基转换,还可以实现C/G到T/A,和A/T到G/C的两种类型碱基同时转换。
[0059] 在一个实施方案中,其中该构建方法的步骤包括:
[0060] (1)通过PCR扩增和分子克隆技术,构建如式(I)所示的第一载体或第一核酸构建体,PII-X1-L1-X2(T1-T2)-L2-X3-PolyA  式(I);
[0061] (2)通过PCR扩增和分子克隆技术,构建如式(II)所示的第二载体或第二核酸构建体:PIII-Y1-PII-Y2-L3-Y3-PolyA  式(II);
[0062] (3)将第一载体或第一核酸构建体与第二载体或第二核酸构建体,按照质量比例1:2进行混合,例如第一核酸构建体:第二核酸构建体质量比为250ng:500ng;
[0063] 其中,
[0064] PII为II型启动子,选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子、或其他的RNA聚合酶II型启动子或其组合;
[0065] X1为胞嘧啶脱氨酶的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合;
[0066] X2为腺嘌呤脱氨酶的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;
[0067] X3为突变型Cas9核酸酶的编码序列;或以DNA,RNA为向导序列、靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9相关同源蛋白;或以蛋白质模块识别DNA的工具系统,包括锌指核酸酶ZFN、转录激活样效应因子TALE。
[0068] L1、L2为无或连接序列;
[0069] PIII为III型启动子;
[0070] Y1为sgRNA的骨架序列,该sgRNA是能够与指定靶点序列互补配对的导向RNA;
[0071] Y2为人源尿嘧啶糖苷酶抑制剂的编码序列;
[0072] L3为自剪接多肽,选自T2A、P2A、E2A、F2A之一或其组合;
[0073] Y3为筛选标记蛋白表达序列;
[0074] 上述“-”表示连接键或核苷酸连接序列。
[0075] 在一个实施方案中,所述PII选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子或其组合;X1为AID或Apobec1;X2为细菌来源的腺嘌呤脱氨酶的编码序列,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;X3为带有D10A突变的可以实现切割靶向链Cas9核酸酶的编码序列;PolyA为BGH序列或SV40的PolyA序列,或其他PolyA序列。
[0076] 在另一实施方案中,所述PIII为H1启动子、U6启动子或其组合;Y1为spCas9核酸酶的sgRNA的骨架序列,且与式(I)所使用的Cas9核酸内切酶相对应;所述Y2选自人源尿嘧啶糖苷酶抑制剂UGI;所述L3是自剪接多肽T2A;所述Y3为绿色荧光蛋白;所述PolyA是BGH序列。
[0077] 在上述任一实施方案中,所述第一载体包括或第一核酸构建体是ACBE-N-AID或ACBE-N-Apobec1。
[0078] 在上述任一实施方案中,所述第二载体或第二核酸构建体包括U6-sgRNA-CMV-UGI-T2A-GFP。
[0079] 在上述任一实施方案中,其中该构建方法的步骤包括:
[0080] (1)通过PCR扩增和分子克隆技术,构建第一载体或第一核酸构建体:CMV-AID/Apobec1-TadA-TadA*-Cas9n(即ACBE-N-AID/Apobec1);
[0081] (2)通过PCR扩增和分子克隆技术,构建第二载体或第二核酸构建体:U6-sgRNA-CMV-UGI-T2A-GFP。
[0082] (3)将第一载体或第一核酸构建体与第二载体或第二核酸构建体,按照质量比1:2的比例进行混合。
[0083] 其中,该构建方法还包括步骤(4),将两种载体(第一载体或第一核酸构建体与第二载体或第二核酸构建体)转染到宿主细胞,例如真核细胞、细菌、酵母、动物细胞、植物细胞之一或其组合。在一个优选实施方案中,其中该碱基转换编辑系统需要在宿主细胞内孵育120h或更长时间。
[0084] 本发明还提供了由上述构建方法构建得到的碱基转换编辑系统或组合物。
[0085] 本发明第三目的是提供利用上述任一构建方案得到的碱基转换编辑系统或组合物,对宿主基因组进行碱基转换编辑的方法,该方法可在Cas9介导下,在特定窗口内实现单个碱基C/G到T/A、或A/T到G/C的单碱基转换,还可以实现C/G到T/A、和A/T到G/C的两种类型碱基同时转换。
[0086] 在一个实施方案中,其中所述碱基转换编辑系统包括如式(I)和(II)所示的第一载体和第二载体,并且二者按数量比例1:2进行混合,然后转入宿主细胞中,其中所述宿主细胞选自真核细胞、细菌、酵母、动物细胞和植物细胞之一或其组合。其中,[0087] PII-X1-L1-X2(T1-T2)-L2-X3-PolyA  式(I);
[0088] PIII-Y1-PII-Y2-L3-Y3-PolyA  式(II);
[0089] 其中,
[0090] PII为II型启动子;
[0091] X1为胞嘧啶脱氨酶的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合;
[0092] X2为腺嘌呤脱氨酶的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;
[0093] X3为突变型Cas9核酸酶的编码序列;
[0094] L1、L2为无或连接序列;
[0095] PIII为III型启动子;
[0096] Y1为sgRNA的骨架序列,该sgRNA是能够与指定靶点序列互补配对的导向RNA;
[0097] Y2为尿嘧啶糖苷酶抑制剂的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合;
[0098] L3为自剪接多肽,选自T2A、P2A、E2A、F2A之一或其组合;
[0099] Y3为筛选标记蛋白表达序列;
[0100] 上述“-”表示连接键或核苷酸连接序列。
[0101] 在一个实施方案中,所述PII选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子或其组合,或其他的RNA聚合酶II型启动子;X1为AID或Apobec1;X2为细菌来源的腺嘌呤脱氨酶的编码序列,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;X3为带有D10A突变的可以实现切割靶向链Cas9核酸酶的编码序列;PolyA为BGH序列或SV40的PolyA序列,或其他polyA序列。
[0102] 在另一实施方案中,所述PIII为H1启动子、U6启动子或其组合,或其他的RNA聚合酶III型启动子;Y1为spCas9核酸酶的sgRNA的骨架序列,且与式(I)所使用的Cas9核酸内切酶相对应;所述Y2选自人源尿嘧啶糖苷酶抑制剂UGI;所述L3是自剪接多肽T2A;所述Y3为绿色荧光蛋白;所述PolyA是PA序列。
[0103] 在上述任一实施方案中,其中该细胞还包括被上述式(I)、(II)所转染的宿主细胞,例如真核细胞、细菌,酵母,动物细胞、植物细胞。
[0104] 在上述任一实施方案中,所述第一载体或第一核酸构建体是ACBE-N-AID或ACBE-N-Apobec1。
[0105] 在上述任一实施方案中,所述第二载体或第二核酸构建体包括U6-sgRNA-CMV-UGI-T2A-GFP。
[0106] 本发明第四个目的是提供一种试剂盒,其包括如上所述的碱基转换编辑系统或组合物。
[0107] 在一个实施方案中,所述试剂盒还包括合适的试剂、缓冲液和/或说明书
[0108] 本发明第五个目的是提供包含所述碱基转换编辑系统的工程化细胞或重组细胞,其包含但不限于作为宿主细胞的真核细胞、细菌、酵母、动物细胞、植物细胞。
[0109] 本发明第六个目的是提供上述的或通过上述方法所制备的碱基转换编辑系统或组合物试剂盒,或包含所述碱基基因组编辑系统的试剂盒或工程化细胞或重组细胞,用于对宿主或宿主细胞进行碱基转换编辑的用途,其中所述碱基转换编辑系统能在宿主或宿主细胞的特定窗口内实现单个碱基C/G到T/A、或A/T到G/C的转换,还可以实现C/G到T/A、和A/T到G/C的两种类型碱基同时转换。
[0110] 在一个实施方案中,所述宿主或宿主细胞选自真核细胞、细菌、酵母、动物细胞或植物细胞;所述用途是使细胞内产生点突变,包括向所述细胞中导入所述碱基转换编辑系统或所述组合物,或包含所述碱基基因组编辑系统的试剂盒或所述工程化细胞或重组细胞的步骤;其中,所述sgRNA根据待突变靶序列进行设计,包括靶标结合区和Cas9核酸酶识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述Cas9核酸酶识别区能被所述Cas9核酸酶识别并结合。
[0111] 在一个具体实施方案中,所述用途是对宿主或宿主细胞(如真核细胞、细菌、酵母,动物细胞或植物细胞)进行双碱基编辑,以获得改善的生长性能。在优选的实施方案中,所述改善的生长性能包括但不限于:品种的改良、目的产物产量的提高、生长速度的提高、抗病性或抗逆性的提高、子代数目的提高、动物肉质的改善、食物味的改善、人源化蛋白质产品的获得等。
[0112] 在另一实施方案中,所述用途是对宿主细胞的功能基因的筛选,所述细胞选自真核细胞、细菌、酵母,动物细胞或植物细胞。在一个具体实施方案中,所述用途是对真核细胞、细菌、酵母,动物细胞或植物细胞进行双碱基编辑,对目的基因进行功能验证、功能失活、敲除、恢复、新功能的获得。
[0113] 还在另一实施方案中,本发明提供了将所述碱基转换编辑系统或组合物用于对宿主或其细胞的药物靶点的筛选或有效药物的筛选的用途,所述宿主或其细胞选自真核生物、细菌、酵母、动物或其细胞、植物或其细胞。在一个具体实施方案中,所述用途是对真核生物、细菌、酵母、动物或其细胞、植物或其细胞进行双碱基编辑,通过检测其对于给定药物的敏感性或钝性,从而确定和筛选有效的药物或药物靶点、构建蛋白质新功能突变体和筛选体系。
[0114] 还在另一实施方案中,本发明提供了将所述碱基转换编辑系统或组合物用于对宿主或其细胞进行基因治疗的用途,所述宿主或其细胞选自动物或其细胞。在一个具体实施方案中,所述动物是哺乳类动物,具体的是人,所述用途是对动物进行碱基转换编辑,通过使得单碱基突变或双碱基突变恢复为野生型碱基,从而治疗因单碱基突变或双碱基突变引起的遗传病或其他疾病、对基因表达调控序列的改变,从而改变致病基因的产生或者使具有治疗效果的基因表达升高或者相应变化。
[0115] 还在其他实施方案中,本发明提供了将所述碱基转换编辑系统或组合物用于构建基因突变的动物模型的用途,所述动物是包括原生动物在内的各种低等和高等动物,具体地是果蝇、斑鱼、爪蟾、小鼠、大鼠、猴、兔、禽类等各种动物。在具体的实施方案中,所述用途是对动物进行双碱基编辑,通过使得动物具有遗传疾病的单碱基突变或双碱基突变恢复为野生型碱基,或者使得正常动物的野生型碱基出现与遗传疾病或其他功能障碍相关的单碱基突变或双碱基突变,从而构建基因突变的动物模型。在另一具体实施方案中,所述用途包括向胚胎中的导入所述的碱基转换编辑系统或所述的组合物或所述试剂盒或所述工程化的细胞或重组细胞的步骤;其中,所述sgRNA根据待突变靶序列进行设计,包括靶标结合区和Cas9核酸酶识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述Cas9核酸酶识别区能被所述Cas9核酸酶识别并结合。
[0116] 在另外的实施方案中,所述用途是对胞嘧啶脱氨酶的活性检测。在具体实施方案中,通过将胞嘧啶脱氨酶进行不同的碱基突变,然后将含有该突变的胞嘧啶脱氨酶的碱基转换编辑系统导入细胞,并检测同一靶点单个碱基C/G到T/A的单碱基转换效率,即完成检测胞嘧啶脱氨酶的活性。
[0117] 还在另外的实施方案中,所述用途是对腺嘌呤脱氨酶的活性检测。在具体实施方案中,通过将腺嘌呤脱氨酶进行不同的碱基突变,然后含有该突变的腺嘌呤脱氨酶的碱基转换编辑系统导入细胞,并检测同一靶点单个碱基A/T到G/C的单碱基转换效率,即完成检测腺嘌呤脱氨酶的活性。
[0118] 本发明第七个目的是提供一种基因治疗方法,所述方法包括向受试者施用一个或多个上述任一方案所述的碱基转换编辑系统或所述试剂盒或所述工程化的细胞或重组细胞。所述治疗方法应用于治疗的疾病包括肿瘤癌症、遗传性疾病或功能障碍等。
[0119] 本发明第八个目的是提供一种用于基因治疗的药物或组合物,其包含如式(I)所示的第一载体或第一核酸构建体,和如式(II)所示的第二载体或第二核酸构建体。
[0120] PII-X1-L1-X2(T1-T2)-L2-X3-PolyA  式(I);
[0121] PIII-Y1-PII-Y2-L3-Y3-PolyA  式(II);
[0122] 其中,PII为II型启动子,选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子、或其他的RNA聚合酶II型启动子或其组合;
[0123] X1为胞嘧啶脱氨酶的编码序列,或以RNA为底物的胞嘧啶脱氨酶经过修饰改造后能够以DNA为底物进行脱氨的胞嘧啶脱氨酶,其来源于大鼠、小鼠、人、细菌或噬菌体等及其组合;优选地,选自AID或Apobec1;
[0124] X2为腺嘌呤脱氨酶的编码序列,或具有DNA或RNA腺嘌呤脱氨功能的各个物种中的类似酶类(如ADAR)等,其来源于大鼠、小鼠、人、细菌或噬菌体等及其组合,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;在优选的方案中,X2为串联的野生型腺嘌呤脱氨酶T1(即野生型TadA腺嘌呤脱氨酶)和突变型腺嘌呤脱氨酶T2(即突变型TadA*的腺嘌呤脱氨酶);
[0125] X3为突变型Cas9核酸酶的编码序列;或以DNA,RNA为向导序列、靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9等相关同源蛋白;还包括以蛋白质模块识别DNA的工具系统,包括锌指核酸酶(ZFN)、转录激活样效应因子(TALE)等;优选地,X3为带有D10A突变的可以实现切割靶向链的Cas9核酸酶的编码序列(即SpCas9n);
[0126] PolyA为BGH序列或SV40的PolyA序列,或其他PolyA序列;优选地,所述PolyA是PA序列;
[0127] L1、L2为无或连接序列;优选地,L1是带有NLS的连接序列,具体为SEQ ID No.52:SGGSPKKRKVGSSGS;L2是32个氨基酸的长度连接序列,具体为SEQ ID No.53:SGGSSGGSSGSETPGTSESATPESSGGSSGGS;
[0128] PIII为III型启动子;选自H1启动子、U6启动子,或其他的RNA聚合酶III型启动子或其组合;
[0129] Y1为sgRNA的骨架序列,该sgRNA是能够与指定靶点序列互补配对的导向RNA;
[0130] Y2为尿嘧啶糖苷酶抑制剂的编码序列,其来源于大鼠、小鼠、人、细菌或噬菌体及其组合;优选地,为人源尿嘧啶糖苷酶抑制剂-UGI;
[0131] L3为自剪接多肽,选自T2A、P2A、E2A、F2A之一或其组合;
[0132] Y3为筛选标记蛋白表达序列;优选地,所述Y3为绿色荧光蛋白;
[0133] 上述“-”表示连接键或核苷酸连接序列。
[0134] 在一个实施方案中,所述式(I)中,PII选自CMV启动子、CAG启动子、PGK启动子、EF1α启动子或其组合;X1为来源大鼠胞嘧啶脱氨酶或人胞嘧啶脱氨酶的编码序列;X2为细菌来源的腺嘌呤脱氨酶的编码序列,其包括串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2;X3为带有D10A突变的可以实现切割靶向链的Cas9核酸酶的编码序列;PolyA为BGH序列或SV40的PolyA序列,或其他polyA序列。
[0135] 在另一实施方案中,所述式(II)中,PIII为H1启动子、U6启动子或其组合;Y1为spCas9核酸酶的sgRNA的骨架序列,且与式(I)所使用的Cas9核酸内切酶相对应;所述Y2选自人源尿嘧啶糖苷酶抑制剂UGI;所述L3是自剪接多肽T2A;所述Y3为绿色荧光蛋白;所述PolyA是PA序列。
[0136] 在一个优选实施方案中,sgRNA的任意位置含有C且同时5-8位对应于出现A且能与对应的指定位点进行互补配对,从而除了实现指定位点单个碱基C/G到T/A的转换,还可以实现A/T到G/C转换,也能同时实现指定位点C/G到T/A,以及A/T到G/C转换。
[0137] 在一个具体实施方案中,Cas9核酸酶选自来源于酿酒酵母Cas9的突变体spCas9n,或选自能识别其它PAM的(如VQR-Cas9)的Cas9突变体,或选自识别PAM:NNGRRT的黄色葡萄球菌来源的SaCas9n,或选自识别PAM:NNNRRT的黄色葡萄球菌来源SaCas9n突变体,或选自来源于Cas9家族的、能识别TTTN PAM 2类的效应蛋白Cpf1,或选自与cas9功能类似的其他物种中的CRISPR蛋白,以及在此基础上构建的能提高精确性或能识别更广泛PAM的Cas9突变体。
[0138] 在上述任一实施方案中,所述药物或组合物还包括来自真核细胞、细菌,酵母,动物细胞、植物细胞的个体或植株。在一个优选实施方案中,其中述真核细胞为人293T细胞、人U2OS细胞、人iPS细胞或其它真核细胞。
[0139] 在上述任一实施方案中,所述突变窗口是指从距离PAM远端数起第-3-20位碱基胞嘧啶(C)及从距离PAM远端数起第5-8位碱基腺嘌呤(A)的核苷酸序列。在一个优选实施方案中,本发明碱基转换编辑系统的突变窗口为距离PAM远端数起第-3-20位碱基胞嘧啶(C)及从距离PAM远端数起第5-8位碱基腺嘌呤(A)的核苷酸序列。
[0140] 在上述任一实施方案中,其中所述尿嘧啶糖苷酶抑制剂还可为大鼠、小鼠、细菌或噬菌体来源或其组合。
[0141] 还在上述任一实施方案中,所述筛选标记蛋白还包括绿色光蛋白、黄色荧光蛋白或红色荧光蛋白或其组合。
[0142] 在上述任一实施方案中,所述包含融合蛋白的第一载体的式I(即PII-X1-L1-X2(T1-T2)-L2-X3-PolyA)中,
[0143] X1是AID或Apobec1;
[0144] L1是带有NLS的连接序列,具体为SEQ ID No.52:SGGSPKKRKVGSSGS;L2是32个氨基酸的长度连接序列,具体为SEQ ID No.53:SGGSSGGSSGSETPGTSESATPESSGGSSGGS。
[0145] T1是野生型TadA腺嘌呤脱氨酶;
[0146] T2是突变型TadA*的腺嘌呤脱氨酶;
[0147] X3是带有D10A突变的Cas9,即SpCas9n;
[0148] PolyA是BGH序列。
[0149] 在一个优选实施方案中,当X1是AID时,第一载体是ACBE-N-AID,其具有SEQ ID NO.1所示的氨基酸序列;在另一优选实施方案中,当X1是Apobec1时,第一载体是ACBE-N-Apobec1,其具有SEQ ID NO.2所示的氨基酸序列。
[0150] 在其他优选实施方案中,所述AID或Apobec1可选自细菌、小鼠来源或其它物种来源的胞嘧啶脱氨酶。在另外优选实施方案中,TadA及TadA﹡选自大肠杆菌来源腺嘌呤脱氨酶或其它细菌属来源的腺嘌呤脱氨酶。
[0151] 在上述任一实施方案中,胞嘧啶脱氨酶不局限于本发明中使用的Apobec1和AID,凡是具有胞嘧啶脱氨功能的任何物种的酶都可以经过改造,替代本发明中使用的两种酶,还应当包括可以以RNA为底物的胞嘧啶脱氨酶经过修饰改造后能够以DNA为底物进行胞嘧啶脱氨酶。腺嘌呤脱氨酶除了本发明中使用的TadA及其突变体,还应当包括ADAR等具有DNA或者RNA腺嘌呤脱氨功能的各个物种中的类似酶类。
[0152] 在上述任一实施方案中,所述第二载体包括U6-sgRNA-CMV-UGI-T2A-GFP。
[0153] 在上述任一实施方案中,结合特定DNA的工具除了本发明中使用的Cas9,也包括其他的以DNA,RNA为向导序列,靶向特定DNA序列的蛋白质及相关系统,包括Cpf1及其同源基因、SaCas9等相关同源蛋白;还包括以蛋白质模块识别DNA的工具系统,包括锌指核酸酶(ZFN)、转录激活样效应因子(TALE)等。
[0154] 本发明第九个目的是提供一种在细胞内产生点突变的方法,所述方法包括向所述细胞中导入所述碱基转换编辑系统或所述组合物或所述试剂盒或所述工程化的细胞或重组细胞的步骤;其中,所述sgRNA根据待突变靶序列进行设计,包括靶标结合区和Cas9核酸酶识别区,所述靶标结合区能特异性结合待突变的核酸序列,所述Cas9核酸酶识别区能被所述Cas9核酸酶识别并结合,从而在细胞的特定窗口内实现单个碱基C/G到T/A、或A/T到G/C的转换,还实现C/G到T/A和A/T到G/C的双两种类型碱基同时转换。
[0155] 本发明原理
[0156] 现有技术中公开的单碱基编辑系统中,主要是胞嘧啶脱氨酶融合CRISPR/Cas9的系统(Base Editor/单碱基编辑系统,即BE系统),例如在Cas9n的介导下能实现在特定窗口内C(胞嘧啶)到T(胸腺嘧啶)的突变,其中起主要作用的是胞嘧啶脱氨酶,在细胞内,胞嘧啶脱氨酶能将C脱去氨基变为U,同时表达的尿嘧啶糖苷酶抑制剂能抑制细胞内切除修复,经过DNA的复制与修复,最终将DNA中的C突变为T碱基。其中,CBE(Cas9n介导的BE系统)中以BE3应用最为广泛。
[0157] 最近出现的单碱基编辑系统中,主要是将腺嘌呤脱氨酶融合CRISPR/Cas9(Adenine Base Editor/腺嘌呤碱基编辑系统,即ABE系统)的单碱基突变系统。其中,ABE是指在Cas9n的介导下能实现在特定窗口内A(腺嘌呤)到G(鸟嘌呤)的突变,其中起主要作用是腺嘌呤脱氨酶TadA,在细胞内,腺嘌呤脱氨酶TadA能将A脱去氨基变为I(肌苷),它可以与C配对,在DNA水平被视为G读码与复制,从而实现DNA水平的A到G的突变。ABE中以ABE7.10效率最高。
[0158] 由于自然存在的野生腺嘌呤脱氨酶TadA不能直接以DNA为底物,并且David Liu等也尝试将不同物种来源的针对RNA的野生腺苷脱氨酶与Cas9n融合,但均没有编辑活性,因此现有技术中需要对其进行突变改造。然而,发明人发现,现有技术在对涉及野生型TadA或突变型TadA*的ABE系统进行进一步改造过程中,如果将突变型TadA*融合于nCas9端,结果发现完全失去了脱氨功能。如果在ABE系统中分别表达野生型TadA或突变型TadA*,能提高编辑效率,例如引入突变产生ABE3.1(ABE2.9+L84F+H123Y+I157F),将效率提高至29%±2.6%。然而,其缺点在于在不同靶点间的编辑效率差异很大且在突变窗口内对Y(Y为T或C)AC序列有明显偏好性,如果A两侧不是Y和C,效率则显著下降。
[0159] 然而,相比较现有技术,本发明首次创新提出了融合了胞嘧啶脱氨酶与腺嘌呤脱氨酶两种脱氨酶,由此构建的碱基转换编辑系统或组合物,经一次转染步骤,能实现C/G到T/A和A/T到G/C的双碱基单独或同时转换。
[0160] 为了实现该发明目的,一方面,本发明在现有技术的基础上,尝试将双脱氨酶(即胞嘧啶脱氨酶和腺嘌呤脱氨酶)与Cas9构建融合载体。然后,实验发现并非所有的双脱氨酶构建的方案都适宜,并且不同的融合方式,碱基转换编辑的效率有比较大的差别,需要反复摸索和大胆尝试。例如,试验发现,将胞嘧啶脱氨酶融合到C端以后再额外表达尿嘧啶糖苷酶抑制剂的编码序列(如UGI),则不出现或者出现较低的C/G到T/A,A/T到G/C的同时突变。在此基础上,如果将尿嘧啶糖苷酶抑制剂的编码序列(如UGI)直接融合到第一载体上的C端,双碱基同时突变的效率非常低。因此,本发明意外地发现尿嘧啶糖苷酶抑制剂的编码序列的构建位置对于碱基转换编辑系统的双碱基同时编辑的效率至关重要。在一优选的实施方式中,本发明构建方法将两种脱氨酶同时构建到能够靶识别DNA序列的核酸酶(如Cas9核酸酶)的N端上进行融合表达,重新设计了脱氨酶的突变类型、组合方式及顺序,即胞嘧啶脱氨酶-野生型腺嘌呤脱氨酶-优化的突变型腺嘌呤脱氨酶-优化的Cas9核酸酶(D10)。并通过比较实验,选择引入串联的野生型腺嘌呤脱氨酶T1和突变型腺嘌呤脱氨酶T2的组合方式。这种组合并非普通的腺嘌呤脱氨酶组合,而是利用了野生型腺嘌呤脱氨酶T1保持单链DNA的结合能力,以及突变型腺嘌呤脱氨酶T2保持腺嘌呤脱氨基的功能,从而发挥该组合促进融合蛋白既有较好的单链结合活性,又具备较好的腺嘌呤脱氨基的功能,从而能具备较为优秀的碱基转换编辑活性。
[0161] 另一方面,根据以上的意外发现,本发明还改造了尿嘧啶糖基化酶抑制剂的表达方式。尿嘧啶糖基化酶抑制剂是为了抑制细胞内源性的尿嘧啶糖苷酶,从而抑制U的切除修复,从而保持C到T较高较精确的突变效率。在现有技术中,尿嘧啶糖基化酶抑制剂(如UGI)通常与Cas9酶进行融合蛋白,但本发明发现将UGI融合到第一载体Cas9的C端,发现相应的靶点效率非常低或者几乎没有突变活性。因此,本发明选择将尿嘧啶糖基化酶抑制剂与sgRNA进行共表达。不同于式(I)中的一个启动子驱动表达融合蛋白,本发明选择在式(II)中通过不同启动子分别驱动尿嘧啶糖基化酶抑制剂与sgRNA进行表达,既不会干扰sgRNA靶向识别特异性位点,同时能发挥尿嘧啶糖基化酶抑制剂通过抑制U的切除修复而保持C到T较高较精确的突变效率。
[0162] 根据以上两个方面,本发明设计了一系列的双基因编辑系统,试验表明其具有理想的双碱基突变效率。进一步地,经过优化设计,本发明优选构建了具有不同序列的式(I)的核酸构建体,即ACBE-N-AID或ACBE-N-Apobec1。这2种核酸构建体都能与第二载体进行组合,并高效完成双基因精确突变的作用。
[0163] 综上,本发明提出的能同时实现指定位点嘧啶和嘌呤碱基置换的基因组编辑系统,通过Cas9n按一定顺序同时融合两种脱氨酶(胞嘧啶脱氨酶与腺嘌呤脱氨酶),对于给定的基因组位点,除了实现单个碱基C/G到T/A的转换,还可以实现A/T到G/C转换,也能实现C/G到T/A,A/T到G/C的同时转换,并且不引入DSB(double strands breaks),插入与缺失(indels),脱靶效应极低,更加安全高效。
[0164] 本发明提出的双碱基类型基因编辑系统,打破了现有工具只能实现嘌呤或者嘧啶之间单一类型碱基转换的不足,进一步丰富了碱基编辑的工具箱。
[0165] 本领域中,所述特定位点、特定窗口、给定窗口、工作窗口、工作靶点、突变窗口的含义相同,均指从距离PAM远端数起第-3-20位碱基胞嘧啶(C)及从距离PAM远端数起第5-8位碱基腺嘌呤(A)的核苷酸序列。
[0166] 本发明中,所述AID的氨基酸序列如下SEQ ID NO.3所示;所述Apobec1的氨基酸序列如下SEQ ID NO.4所示;所述TadA的氨基酸序列如下SEQ ID NO.5所示;所述TadA*的氨基酸序列如下SEQ ID NO.6所示;所述Cas9n的氨基酸序列如下SEQ ID NO.7所示。
[0167] 技术效果
[0168] 相对于现有技术的单碱基基因编辑,本发明有益效果还包括,首次提出碱基转换编辑的构思。且相对于单碱基编辑所用的胞嘧啶脱氨酶融合CRISPR/Cas9的BE系统,本发明技术创新贡献以及所克服的技术难点在于包括如何确定Cas9核酸酶按一定顺序同时融合特定类型的两种脱氨酶(胞嘧啶脱氨酶与腺嘌呤脱氨酶)的技术手段,通过不同的融合构建来实现本发明系统有效工作。其中,所述的“一定顺序”具体是指胞嘧啶脱氨酶-腺嘌呤脱氨酶(野生型)-腺嘌呤脱氨酶(突变型)-Cas9核酸酶(D10)。
[0169] 单一的嘧啶或者嘌呤碱基编辑工具(CBE/BE、ABE)能通过单一碱基的改变对编码基因进行功能性改变,而本发明碱基转换编辑系统(包括ACBE-N-AID,ACBE-N-Apobec1)系统不但能够保留前述单一碱基突变的功能,还能实现A,C同时突变。但是ABE或CBE这些单一碱基的变化对于非编码的DNA片段(例如基因转录调控区、外显子内含子剪切信号、非编码RNA)的功能影响可能很小,而本发明的ACBE系统,不但可以实现编码区基因功能的改变(多样性更高),对于功能基因的筛选和动植物品种改良等多个方面起到非常重要的作用。
[0170] 本发明系统可以引起众多碱基发生变化,对于酶活功能性突变的筛选等编码区的序列改变相关应用,提供了更为高效、复杂的DNA修饰工具。
[0171] 本发明创新及有益效果还包括:
[0172] 本发明通过将通过Cas9n按一定顺序同时融合两种脱氨酶(胞嘧啶脱氨酶与腺嘌呤脱氨酶),对于给定的基因组位点,除了实现单个碱基C/G到T/A的转换,还可以实现A/T到G/C转换,也能实现C/G到T/A,A/T到G/C同时转换,一定程度打破了目前只能编辑一种碱基的可能性,进一步丰富了碱基编辑的工具箱。通过这一工具可以实现较大范围的DNA碱基改变,对于编码蛋白的功能激活或者失活、非编码的调控区功能改变、非编码RNA相关基因的活性或者miRNA靶点改造有着ABE或者CBE不可比拟的优势。附图说明
[0173] 图1表示本发明碱基转换编辑系统中,构建不同顺序的第一核酸构建体的示意图。其中,AID为人源胞嘧啶脱氨酶,Apobec1为大鼠来源胞嘧啶脱氨酶,NLS为核定位信号,TadA为腺嘌呤脱氨酶,TadA*突变型的腺嘌呤脱氨酶,SpCas9n为带有D10A突变的Cas9,BGH为PolyA序列,UGI为糖苷酶抑制剂。其中,
[0174] 图1-1为ABE7.10-AID构建体示意图,其中突变的Cas9n间隔在串联的腺嘌呤脱氨酶与胞嘧啶脱氨酶之间;
[0175] 图1-2为ABE7.10-Apobec1构建体示意图,其中突变的Cas9n间隔在串联的腺嘌呤脱氨酶与胞嘧啶脱氨酶之间;
[0176] 图1-3为ACBE-2.1-AID构建体示意图,其中突变的Cas9n间隔在串联的腺嘌呤脱氨酶与胞嘧啶脱氨酶之间,并且尿嘧啶糖苷酶抑制剂被构建到第一载体上;
[0177] 图1-4为ACBE-2.1-Apobec1构建体示意图,其中突变的Cas9n间隔在串联的腺嘌呤脱氨酶与胞嘧啶脱氨酶之间,并且尿嘧啶糖苷酶抑制剂被构建到第一载体上;
[0178] 图1-5为ACBE-3.1-AID构建体示意图,其中胞嘧啶脱氨酶只与突变型腺嘌呤脱氨酶相连,并构建在第一载体上;
[0179] 图1-6为ACBE-3.1-Apobec1构建体示意图,其中胞嘧啶脱氨酶只与突变型腺嘌呤脱氨酶相连,并构建在第一载体上;
[0180] 图1-7为本发明的第一载体ACBE-N-AID构建体示意图,其中各元件连接顺序依次是胞嘧啶脱氨酶-腺嘌呤脱氨酶(野生型)-腺嘌呤脱氨酶(突变型)-Cas9核酸酶(D10),并且未连接尿嘧啶糖苷酶抑制剂;
[0181] 图1-8为本发明的第一载体ACBE-N-Apobec1构建体示意图,其中各元件连接顺序依次是胞嘧啶脱氨酶-腺嘌呤脱氨酶(野生型)-腺嘌呤脱氨酶(突变型)-Cas9核酸酶(D10),并且未连接尿嘧啶糖苷酶抑制剂。
[0182] 图2表示本发明中的第二载体或第二核酸构建体(即靶点质粒)示意图。其中,UGI为尿嘧啶糖苷酶抑制剂,T2A(图中缩写为元件2A,T2A为2A的一种)为自剪接多肽,GFP为绿色荧光蛋白,PA为PolyA序列,U6为III型启动子。
[0183] 图3为不同的ACBE工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图其中,
[0184] 图3-1表示现有的BE3和对照的ABE7.10的工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0185] 图3-2表示对照的ABE7.10-AID工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0186] 图3-3表示对照的ABE7.10-Apobec1工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0187] 图3-4表示本发明的ACBE2.1-AID工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0188] 图3-5表示本发明的ACBE2.1-Apobec1工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0189] 图3-6表示本发明的ACBE-N-AID工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0190] 图3-7表示本发明的ACBE-N-Apobec1工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0191] 图3-8表示表示对照的ACBE-3.1-AID工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图;
[0192] 图3-9表示表示对照的ACBE-3.1-Apobec1工作系统对靶点EMX1-BE3-sg1深度测序突变状况及效率的结果图.
[0193] 图4表示本发明的ACBE-N-AID和ACBE-N-Apobec1工作系统对于不同靶点所展现的各种DNA改变的类型和效率统计,以及在突变窗口内各个位置引起C到T、或A到G突变碱基变化效率的统计图。其中,BE3,ABE7.10为对照;
[0194] 其中,
[0195] 图4-1表示本发明的ACBE-N-AID,ACBE-N-Apobec1对于靶点PD-1-sg1引起DNA改变的类型和效率统计,以及在突变窗口内各个位置引起C到T、或A到G突变碱基变化效率的统计图;
[0196] 图4-2表示本发明的ACBE-N-AID,ACBE-N-Apobec1对于靶点PD-1-sg2引起DNA改变的类型和效率统计,以及在突变窗口内各个位置引起C到T、或A到G突变碱基变化效率的统计图;
[0197] 图4-3表示本发明的ACBE-N-AID,ACBE-N-Apobec1对于靶点PD-1-sg3引起DNA改变的类型和效率统计,以及在突变窗口内各个位置引起C到T或A到G突变碱基变化效率的统计图;
[0198] 图4-4表示本发明的ACBE-N-AID,ACBE-N-Apobec1对于靶点VEGFA-sg2引起DNA改变的类型和效率统计,以及在突变窗口内各个位置引起C到T或A到G突变碱基变化效率的统计图。

具体实施方式

[0199] 结合以下具体实施例,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
[0200] 实施例1、第二载体或第二核酸构建体的构建
[0201] 1.来源于人的基因座EMX1,PD-1,VEGFA的靶点序列
[0202] 根据CRISPR/Cas9及BE3,ABE7.10的工作原理,在NCBI中,获取人的基因座(如EMX1,PD-1,VEGFA)上C或A同时出现在ACBE窗口内的靶点,如下表1所示。
[0203] 表1.来源于人的基因座EMX1,PD-1,VEGFA的靶点序列
[0204]靶点名称   序列(5`-3`)
EMX1-BE3-sg1 SEQ ID NO.8 AAGGACGGCGGCACCGGCGGGGG
PD-1-sg1 SEQ ID NO.9 CTGCAGCTTCTCCAACACATCGG
PD-1-sg2 SEQ ID NO.10 CAGCAACCAGACGGACAAGCTGG
PD-1-sg3 SEQ ID NO.11 GGACCGCAGCCAGCCCGGCCAGG
PD-1-sg4 SEQ ID NO.12 CTTCCACATGAGCGTGGTCAGGG
VEGFA-sg2 SEQ ID NO.13 GGCGAGCCGCGGGCAGGGGCCGG
[0205] 2.根据靶向序列分别设计sgRNAoligo
[0206] 靶点质粒(靶点质粒即可以插入任意靶sgRNA的质粒,也即第二载体)的构建如图2所示,其中,UGI为尿嘧啶糖苷酶抑制剂,T2A(图中缩写为元件2A)为自剪接多肽,GFP为绿色荧光蛋白,PA为PolyA序列,U6为III型启动子。将所述靶点质粒用BbsI酶切后即可连入不同的靶点。
[0207] 2.靶序列sgRNA oligo设计原则:
[0208] CRISPR/Cas9中Cas9识别PAM(NGG),sgRNA以U6为启动子,需要G作为转录起始位点,同时U6-SpsgRNA-CMV-UGI-T2A-GFP以BbsI酶切位点连入靶点,因此,sgRNA oligo-up 5’端需要补充CACC,sgRNA oligo-up 5’端需要补充AAAC。具体设计序列如表2。
[0209] 表2.来源于人的基因座EMX1,PD-1,VEGFA的靶点oligo设计
[0210]
[0211] 3.靶点质粒的构建
[0212] 合成sgRNA oligo。
[0213] 将oligo用纯水溶解,终浓度为100μM。
[0214] 退火。两条互补oligo各取10μL混合,并放入沸水浴煮5min后,自然降温至室温,约2小时。
[0215] 连接。将U6-SpsgRNA-CMV-UGI-T2A-GFP用BbsI酶切后的载体与分别与退火后的sgRNA按以下反应体系进行连接反应。
[0216]
[0217] 室温连接60min后,取5μL转化至50μL感受态细菌中,涂卡那霉素抗性板,37℃培养过夜。
[0218] 从过夜培养的培养板中,挑取2个克隆,接种于4-5mL培养液,摇床37℃,220r/min培养过夜。
[0219] 摇菌培养过夜后,提取质粒,并用M13R测序验证,对质粒测序确认。
[0220] 实施例2、ABE7.10基因编辑载体或核酸构建体的构建
[0221] 在ABE7.10(addgene#102919)基础上,分别将AID、Apobec1,通过PCR克隆至ABE7.10的C端,并将野生的TadA克隆至ABE7.10的N端,得到如图1-1和1-2所示的质粒或构建体。
[0222] 实施例3、不同碱基转换编辑系统ACBE的设计与构建
[0223] 1.在图1-1和图1-2的基础上,设计其他不同的碱基转换编辑系统,即分别将AID、Apobec1通过PCR克隆至ABE7.10的C端,N端,或分别替换ABE7.10中N端野生的TadA,或克隆至C端以后再克隆一个T2A-UGI,即可分别得到如图1所示的质粒。所用引物如下表3所示:
[0224] 表3构建不同的碱基转换编辑系统的引物序列
[0225]
[0226]
[0227] 2.构建U6-sgRNA-CMV-UGI-T2A-GFP
[0228] 如下表4所列引物,分别从BE3(addgene#73021),PX458(addgene#48138)质粒通过PCR扩增出CMV,UGI,T2A-GFP,组装至U6-sgRNA(EcoRV+NotI)质粒上。
[0229] 表4构建不同的碱基转换编辑系统的引物序列
[0230]
[0231] 3.ACBE-N-AID、ACBE-N-Apobec1突变内源基因EMX1工作窗口及工作效率的检测[0232] 3.1.质粒转染
[0233] 第1天用293T细胞铺种24孔板
[0234] 3.1.1消化HEK293T细胞,按照2.0×105cell/孔接种24孔板。
[0235] 注:细胞复苏后,一般需传代2次后方可用于转染实验。
[0236] 第2天转染
[0237] 3.1.2观察各孔细胞状态。
[0238] 注:要求转染前细胞密度应为80%-95%,且状态正常。
[0239] 3.1.3为保证数据的准确性和实验的可重复性,用无菌水稀释质粒,将各组质粒浓度稀释至一致,或保证各组之间的质粒样品体积相同。
[0240] 组别设置如下:
[0241] Blank:空白对照,仅包括培养的细胞和培养基;
[0242] 处理组,每孔分别为不同的工作系统,分别为:
[0243] ACBE(可为不同的工作系统):U6-SpsgRNA(可为不同的靶点)-CMV-UGI-T2A-GFP=250ng:500ng
[0244] 设置n=3孔/组。
[0245] 3.1.4向1.5mLEP管中加入DMEM(无血清,无抗生素)。
[0246] 3.1.5将DNA质粒加入到第(3.1.4)步的EP管中,混匀。
[0247] 3.1.6将PEI加入到第(3.1.5)步的EP管中,混匀,室温静置20分钟。
[0248] 3.1.7将转染混合液加到24孔板中,轻轻敲击24孔板以混匀。
[0249] 3.1.8 37℃,5%CO2,培养120h后,通过FACS分选GFP阳性细胞。
[0250] 3.2.分选GFP阳性细胞及突变效率检测
[0251] 第5天流式分选GFP阳性细胞
[0252] 3.1.9 120h后,流式分选GFP阳性细胞。
[0253] 3.1.10用天根细胞基因组提取试剂盒提取分选的GFP阳性细胞基因组DNA。
[0254] 3.1.11对提取的细胞基因组进行PCR,其中,细胞基因组包括有目的靶点约200bp,对各靶点进行PCR,然后利用Hi-TOM基因编辑位点检测试剂盒(诺禾致源)准备测序样品,进行高通量测序,统计分析ACBE对内源性基因突变情况。结果如图3所示。
[0255] 对于相同靶点EMX1-BE3-sg1而言,图3的结果表明:
[0256] 所有双碱基同时突变比例,均是在靶点-10到+10(即靶点范围上下游的统计结果),将同一条DNA上存在两种类型同时突变的DNA在总的reads中的比例。
[0257] 图3-1表示现有的BE3和对照的ABE7.10,其仅能实现单碱基C/G到T/A、或A/T到G/C的突变,并且其突变效率分别为28%,20%。
[0258] 图3-2表示对照的ABE7.10-AID,其能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的双碱基的同时突变,但其突变效率仅为4.62%,其原因可能是将AID放置于C端时影响突变效率。
[0259] 图3-3表示对照的ABE7.10-Apobec1,其能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的双碱基的同时突变,但其突变效率仅为5.64%,其原因可能是将Apobc1放置于C端时影响突变效率。
[0260] 图3-4表示对照的ACBE2.1-AID,其能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的双碱基的同时突变,但其突变效率仅为4.18%,不能提高其碱基转换编辑效率,其原因可能是将T2A-UGI放置于C端时影响突变效率。
[0261] 图3-5表示对照的ACBE2.1-Apobec1,其能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的双碱基的同时突变,但其突变效率仅为3.48%,不能提高其碱基转换编辑效率,其原因可能是将T2A-UGI放置于C端时影响突变效率。
[0262] 图3-6表示本发明的ACBE-N-AID,其不仅能保留原有的C/G到T/A,或A/T到G/C的突变,也能高效实现C/G到T/A,以及A/T到G/C的同时突变。如果将含有C到T、A到G同时突变的reads结果相加,那么两种碱基同时突变效率为10.45%。
[0263] 图3-7表示本发明的ACBE-N-Apobec1,其不仅能保留原有的C/G到T/A,或A/T到G/C的突变,也能高效实现C/G到T/A,以及A/T到G/C的同时突变。如果将含有C到T、A到G同时突变的reads结果相加,两种碱基同时突变效率为10.26%。
[0264] 图3-8表示对照的ACBE-3.1-AID,其能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的突变双碱基的同时突变,但其突变效率仅为4.21%。
[0265] 图3-9表示对照的ACBE-3.1-Apobec1,其能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的突变双碱基的同时突变,但其突变效率仅为4.20%。
[0266] 由图3的结果可知,本发明的ACBE-N-Apobec1和ACBE-N-AID,由于优化的组合顺序,能更好的同时发挥脱氨酶结合单链DNA和催化腺苷突变的能力,其特点如下:
[0267] 类比于BE3,ABE7.10(见图3-1、图3-2)的突变窗口为4-7位的C或A,其突变窗口过于狭窄(仅5个碱基)。相比而言,本发明不同的碱基转换编辑系统均能实现保留原有的C/G到T/A,或A/T到G/C的突变,也能实现C/G到T/A,以及A/T到G/C的双碱基的同时突变。
[0268] 相对于BE3,在EMX1-BE3-sg1处,本发明不同碱基转换编辑系统C/G到T/A在C6位的效率下降了约8.71~27.02%,但其在C6至C15突变效率有所提高,即整体C/G到T/A的突变窗口右移;其中以ACBE-N-AID最优,最佳活性窗口为C9~C15,其突变效率达到14.43~21.13%;其次为ACBE-3.1-AID,其最佳活性窗口为C5~C14,其突变效率达到12.17~
19.34%;ACBE-3.1-AID相对于ACBE-N-AID少了一个TadA,体积较小,在包装入AAV后进行基因治疗上更具备优势。
[0269] 相对于ABE7.10,本发明不同碱基转换编辑系统A/T到G/C突变窗口未发生较大改变,依然只能突变A5,但其效率均有所提高,提高率在8%以上,
[0270] 在所有工作系统中,本发明ACBE-N-AID产生的不同突变类型的DNA最多,为19种,同时双碱基同时突变的DNA也最多,为10.45%;ACBE-N-Apobec1产生的不同类型的DNA不多,但其双碱基同时突变的DNA排其次,为10.26%。
[0271] 实施例4、本发明工作系统对4个不同靶点的突变效率的比较
[0272] 根据实施例3的方法,将本发明ACBE-N-AID、ACBE-N-Apobec1分别验证靶点PD-1-sg1、PD-1-sg2、PD-1-sg3、VEGFA-sg2的突变类型以及各自突变效率的比较。
[0273] 结果如图4-1至4-4所示。
[0274] ACBE-N-AID和ACBE-N-Apobec1均比对照ABE7.10,在A-G的突变中仅在靶点PD-1-sg3中突变效率略低于对照,在PD-1-sg1、PD-1-sg2、VEGFA-sg2的A-G的突变效率均有不同程度的提高。因此,对于A/T到G/C的突变,本发明两种工作系统ACBE-N-AID和ACBE-N-Apobec1的工作窗口未变,但其效率也有不同程度的提高
[0275] 另外,由本发明两种工作系统ACBE-N-AID和ACBE-N-Apobec1在不同靶点的突变效率的比较可知,ACBE-N-AID比ACBE-N-Apobec1能产生更多突变类型的DNA,且效率更高。其中C/G到T/A到突变窗口为-4~18位,其中以C7~C14效率最高,为20~50%,与BE3只能引起4-7位C/G到T/A的约最高37%的突变效率相比,其窗口更加广泛,且效率更高。。
[0276] 综上所述,通过本发明所述碱基转换编辑系统,可以实现较大范围的DNA碱基突变,对于编码蛋白的功能激活或者失活、非编码的调控区功能改变、非编码RNA相关基因的活性或者miRNA靶点改造有着ABE或者CBE不可比拟的优势。同时,对于给定的碱基替换突变,利用Cas9介导的同源重组实现的双碱基置换效率低于10%,且易导致双链断裂,较高的插入缺失突变及较高的脱靶效应。因此,本发明碱基转换编辑系统更加安全高效。
[0277] 本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈