基因敲除方法 |
|||||||
申请号 | CN201610439385.0 | 申请日 | 2016-06-17 | 公开(公告)号 | CN107513538A | 公开(公告)日 | 2017-12-26 |
申请人 | 北京大学; | 发明人 | 魏文胜; 周悦欣; 张鸿敏; | ||||
摘要 | 本 发明 涉及供体构建体,以及基因敲除方法及其系统和 试剂 盒 。本发明的基因敲除方法通过非同源末端连接将供体构建体中包含的标记物基因插入到细胞基因组中的双链断裂 位置 上,通过表达的标记物富集基因被敲除的细胞,提高了通过序列特异性核酸酶产生基因敲除的效率。 | ||||||
权利要求 | 1.提供供体构建体,所述供体构建体是线性供体DNA或可在细胞中被切割产生线性供体DNA,所述线性供体DNA由中间向两端依次包含:表达盒;位于表达盒5'端的由反向终止密码子组成的短的序列延伸和位于表达盒3'端的由正向终止密码子组成的短的序列延伸;位于5'端和/或3'端的靶序列,所述靶序列含有可被所述序列特异性核酸酶切割的靶位点;位于两端的保护序列;其中所述表达盒包含由启动子驱动的标记物基因; |
||||||
说明书全文 | 基因敲除方法发明领域 [0001] 本发明涉及基因编辑技术,具体涉及基因敲除方法。 背景技术[0002] 基因编辑技术彻底改变了对基因功能的实验研究。三种主要的技术,ZFN(锌指核酸酶)[1],TALENs(转录激活物样效应子核酸酶)[2-4]和CRISPR/Cas9系统[5-7],使用不同的机制产生序列特异性双链断裂(double-strand breaks,DSBs)并随后引发天然修复系统完成序列特异性修饰[8,9]。这些技术在功能基因研究[10]、染色体位点的动态和实时成像[11,12]、疾病突变的校正[13]、基因治疗[14]等方面具有广泛的应用。CRISPR/Cas9系统因其高效性和易于操作,变得特别受欢迎。CRISPR/Cas9系统原本被细菌免疫系统用来抵御外源病毒或质粒,在II类CRISPR系统中,Cas9核酸内切酶在sgRNA的引导下切割双链DNA,造成基因组双链断裂,利用细胞基因组修复的不稳定性产生修复错误(碱基的缺失或插入),从而产生基因编辑的效果。 [0003] 虽然CRISPR/Cas9系统在基于设计的和序列特异性的基因组研究中具有前所有未有的优势,但CRISPR/Cas9系统引发的基因编辑在细胞群体中仍然属于稀有事件,要得到真正的基因被编辑的单克隆,需要进行繁琐的劳动,因此该系统在技术上仍然具有挑战性,即使是对于在哺乳动物细胞中产生基因敲除这样的简单任务来说[15]。已进行了各种努力来提高产生基因敲除的方案的效率,例如整合CRISPR/Cas9系统以永久表达Cas9和sgRNA[16]、预先产生稳定表达Cas9的细胞系[17]、增强非同源末端连接(NHEJ)途径[18]、通过同时破坏能实现特异性药物选择的单独基因来富集基因-靶向事件[19]、以及使用代理报告子(surrogate reporter)富集基因敲除[20,21]。但是,各种缺点限制了这些技术的广泛应用。特别是,在哺乳动物细胞中产生多基因敲除仍然是难以完成的任务。当使用传统方法时,即使是敲除单个基因有时也是长时间的,繁重的和高风险的任务[22],因为它们缺乏对含有靶基因修饰的稀少克隆的有效富集。 [0004] 如果靶基因的破坏可以导致能够用于富集的表型变化,可以容易地获得基因敲除克隆,例如Hela CSPG4-/-细胞赋予了对艰难梭菌(Clostridium difficile)毒素B的抗性[23]。但是,该策略无法通用。传统方法是要共转染表达抗生素抗性或荧光蛋白的质粒[23,24],但是这种方法不会富集含有靶向修饰的少量细胞。 [0005] 已报道,外源dsDNA片段可能通过不同的修复机制被整合到具有DSBs的染色体位点上。通过同源重组(HR)修复需要构建长侧翼序列,整合效率较低,而通过非同源末端连接(Non-Homologous end joing,NHEJ)DNA修复的整合效率[27,28]通常高于同源重组修复[29]。已有研究使用CRISPR/Cas引发的NHEJ介导外源线性供体DNA的插入,以达到基因敲入的目的[30-34]。 发明内容[0007] 根据本发明的一个方面,提供供体构建体,所述供体构建体是线性供体DNA或可在细胞中被切割产生线性供体DNA,所述线性供体DNA由中间向两端依次包含:表达盒;位于表达盒5'端的由反向终止密码子组成的短的序列延伸和位于表达盒3'端的由正向终止密码子组成的短的序列延伸;位于5'端和/或3'端的靶序列,所述靶序列含有可被所述序列特异性核酸酶切割的靶位点;位于两端的保护序列;其中所述表达盒包含由启动子驱动的标记物基因。 [0008] 在本发明中,所述线性供体DNA是双链线性供体DNA。 [0009] 在优选的实施方案中,所述供体构建体是线性供体DNA。 [0010] 在一些实施方案中,所述序列特异性核酸酶是锌指核酸酶(ZFN)。 [0011] 在另一些实施方案中,所述序列特异性核酸酶是转录激活物样效应子核酸酶(TALEN)。 [0012] 在另一些实施方案中,所述序列特异性核酸酶是Cas9核酸酶。 [0013] 在另一些实施方案中,所述序列特异性核酸酶是NgAgo核酸酶。 [0014] 在一些实施方案中,所述线性供体DNA仅在5'端或3'端具有靶序列。 [0015] 在一些实施方案中,所述线性供体DNA在两端分别具有靶序列。 [0016] 在一些实施方案中,所述线性供体DNA中两端的靶序列相同。 [0017] 在一些实施方案中,所述线性供体DNA中两端的靶序列不同。在进一步的实施方案中,所述线性供体DNA中两端的不同靶序列来自于相同的基因。在其它进一步的实施方案中,所述线性供体DNA中两端的不同靶序列来自于不同的基因。 [0018] 在优选的实施方案中,所述标记物基因是抗生素抗性基因或荧光蛋白基因。 [0019] 在优选的实施方案中,保护序列的长度为5-30bp,最优选20bp。 [0020] 根据本发明的另一个方面,提供在细胞中产生基因敲除的方法,所述方法包括以下步骤: [0021] (1)向细胞中引入能切割细胞基因组中特定靶位点的序列特异性核酸酶和供体构建体; [0022] 其中所述供体构建体是线性供体DNA或可在细胞中被切割产生线性供体DNA,所述线性供体DNA由中间向两端依次包含:表达盒;位于表达盒5'端的由反向终止密码子组成的短的序列延伸和位于表达盒3'端的由正向终止密码子组成的短的序列延伸;位于5'端和/或3'端的靶序列,所述靶序列含有可被所述序列特异性核酸酶切割的靶位点;位于两端的保护序列;所述表达盒包含由启动子驱动的标记物基因; [0023] 其中线性供体DNA通过非同源末端连接被插入到细胞基因组中的特定靶位点; [0024] (2)筛选所述标记物表达阳性的细胞。 [0025] 在本发明中,所述线性供体DNA是双链线性供体DNA。 [0026] 在优选的实施方案中,所述供体构建体是线性供体DNA。 [0027] 在一些实施方案中,所述线性供体DNA仅在5'端或3'端具有靶序列。 [0028] 在一些实施方案中,所述线性供体DNA在两端分别具有靶序列。 [0029] 在一些实施方案中,所述线性供体DNA中两端的靶序列相同。 [0030] 在一些实施方案中,所述线性供体DNA中两端的靶序列不同。在进一步的实施方案中,所述线性供体DNA中两端的不同靶序列来自于相同的基因。在其它进一步的实施方案中,所述线性供体DNA中两端的不同靶序列来自于不同的基因。 [0031] 在一些实施方案中,所述序列特异性核酸酶是锌指核酸酶(ZFN)。 [0032] 在另一些实施方案中,所述序列特异性核酸酶是转录激活物样效应子核酸酶(TALEN)。 [0033] 在另一些实施方案中,所述序列特异性核酸酶是Cas9核酸酶。 [0034] 在优选的实施方案中,所述方法还包括向细胞中引入识别细胞基因组中特定靶位点的向导RNA(gRNA),线性供体DNA中的靶序列包含被所述gRNA识别的靶位点。 [0035] 在一些实施方案中,所述gRNA是sgRNA。 [0036] 在更优选的实施方案中,所述方法还包括向细胞中引入识别细胞基因组中单个特定靶位点的sgRNA,包含被所述sgRNA识别的靶位点的靶序列位于线性供体DNA的5'端和/或3'端。在一些实施方案中,包含被所述sgRNA识别的靶位点的靶序列来自于细胞基因组中的单个基因。在一些实施方案中,包含被所述sgRNA识别的靶位点的靶序列是细胞基因组中两个或多个基因的共有序列,条件是所述共有序列与所述两个或多个基因的任何一个上与共有序列对应位置处的序列具有不超过一个碱基的差异。 [0037] 在另一些更优选的实施方案中,所述方法还包括向细胞中引入识别细胞基因组中一个基因上的两个特定靶位点的两个sgRNA,分别包含被所述两个sgRNA识别的两个靶位点的两个靶序列分别位于两个线性供体DNA中,或者分别位于同一个线性供体DNA的两端。 [0038] 在另一些更优选的实施方案中,所述方法还包括向细胞中引入识别细胞基因组中两个或更多个特定靶位点的两个或多个sgRNA,分别包含被所述两个或多个sgRNA识别的两个或更多个靶位点的两个或更多个靶序列分别位于同一个线性供体DNA的两端或者位于不同的线性供体DNA中。其中所述细胞基因组中两个或更多个特定靶位点分别位于不同的基因上。 [0039] 在另一些实施方案中,所述序列特异性核酸酶是NgAgo核酸酶。 [0040] 在优选的实施方案中,所述方法还包括向细胞中引入引入识别细胞基因组中特定靶位点的向导DNA(gDNA),其中线性供体DNA中的靶序列包含被所述gDNA识别的靶位点。 [0041] 本发明中,所述基因敲除可以是单个基因敲除或多基因敲除。所述多基因敲除是两个基因或更多个基因的敲除,例如三个、四个、五个或更多个基因的敲除。 [0042] 在优选的实施方案中,所述标记物基因是抗生素抗性基因或荧光蛋白基因。 [0043] 在一个优选的实施方案中,通过药物抗性筛选细胞。 [0044] 在另一个优选的实施方案中,通过FACS方法筛选细胞。 [0045] 在优选的实施方案中,保护序列的长度为5-30bp,最优选20bp。 [0046] 根据本发明的另一个方面,提供用于基因敲除的系统或试剂盒,其中包括:能切割细胞基因组中特定靶位点的序列特异性核酸酶和供体构建体; [0047] 其中所述供体构建体是线性供体DNA或可在细胞中被切割产生线性供体DNA,所述线性供体DNA由中间向两端依次包含:表达盒;位于表达盒5'端的由反向终止密码子组成的短的序列延伸和位于表达盒3'端的由正向终止密码子组成的短的序列延伸;位于5'端和/或3'端的靶序列,所述靶序列含有可被所述序列特异性核酸酶切割的靶位点;位于两端的保护序列;所述表达盒包含由启动子驱动的标记物基因。 [0048] 本发明中,线性供体DNA是双链线性供体DNA。 [0049] 在一些实施方案中,所述供体构建体是线性供体DNA。在另一些实施方案中,所述供体构建体是环形供体构建体且可在细胞中被切割产生线性供体DNA。 [0050] 在一些实施方案中,所述序列特异性核酸酶是锌指核酸酶(ZFN)。 [0051] 在另一些实施方案中,所述序列特异性核酸酶是转录激活物样效应子核酸酶(TALEN)。 [0052] 在另一些实施方案中,所述序列特异性核酸酶是Cas9核酸酶。 [0053] 在优选的实施方案中,所述系统或试剂盒还包括识别细胞基因组中特定靶位点的sgRNA,其中线性供体DNA中的靶序列包含被所述sgRNA识别的靶位点。 [0054] 在一些实施方案中,所述gRNA是sgRNA。 [0055] 在另一些实施方案中,所述序列特异性核酸酶是NgAgo核酸酶。 [0056] 在优选的实施方案中,所述系统或试剂盒还包括识别细胞基因组中特定靶位点的gDNA,其中线性供体DNA中的靶序列包含被所述gDNA识别的靶位点。 [0057] 在优选的实施方案中,所述标记物基因是抗生素抗性基因或荧光蛋白基因。 [0058] 在优选的实施方案中,保护序列的长度为5-30bp,最优选20bp。 [0059] 本发明中,所述切割是产生双链断裂(DSBs)。 [0060] 本发明可以通过将标记物基因插入到基因敲除的切割靶位点上,通过标记物有效富集具有产生基因敲除的稀少克隆。本发明对于sgRNAs设计困难的基因的靶向,以及在需要同时靶向几个基因敲除的情况下,是特别有用的。该方法有助于各种产生DNA双链断裂的基因编辑系统,特别是CRISPR系统在基因及其功能的生物医学领域的更广泛应用。附图说明 [0061] 图1是通过嘌呤霉素选择来富集在HeLa细胞中的ANTXR1基因上含有Cas9/gRNA靶向突变的细胞的供体设计和实验验证。(a)线性供体在ANTXR1基因上的sgRNA-或pgRNA靶向位点的基于NHEJ的敲入的示意图,基因组位点和线性供体上具有gRNA的切割位点sg1和sg2,终止密码子用***标记,箭头指向阅读框的方向。(b)用供体(加gRNA或不加gRNA)转染的细胞的嘌呤霉素抗性克隆的MTT染色。(c)用sgRNA/pgRNA(加(深色条)或不加(浅色条)它们相应的供体)转染的HeLa细胞的ANTXR1敲除率比较,ANTXR1敲除率表示为具有PA/LFnDTA抗性的细胞的百分比。在进行PA/LFnDTA抗性分析之前用嘌呤霉素(1μg/ml)选择 细胞。误差线表示s.d.(n=3),t-test,**P<0.01,***P<0.001。(d)使用不同的gRNAs及其供体富集ANTXR1敲除细胞的总结。 [0062] 图2是通过供体介导的嘌呤霉素抗性选择在混合群落和单克隆中富集ANTXR1敲除细胞的实验验证。(a)不同HeLa细胞组使用或不使用PA/LFnDTA处理的图像。用sgRNA或pgRNA加或不加它们相应的线性供体转染获得混合细胞,比例尺为200μm。(b)对具有嘌呤霉素抗性(puro+)单克隆的线性供体整合的ANTXR1位点的PCR验证,克隆从sgRNA2ANTXR1/DonorANTXR1-sg2(左)或pgRNAANTXR1/DonorANTXR1-pg(右)转染的HeLa细胞获得。 [0063] 图3是通过嘌呤霉素选择富集HeLa细胞中HEBGF破坏事件的供体设计和实验验证。(a)靶向HBEGF基因的供体设计。(b)用线性供体DonorHBEGF-sg1(加或不加Cas9/sgRNA)转染的细胞中嘌呤霉素抗性克隆的MTT染色。(c)不同HeLa细胞组使用或不使用DT(40ng/ml)处理的图像。用sgRNA(sgRNA1HBEGF)(加或不加它的相应线性供体(DonorHBEGF-sg1))转染获得混合细胞,比例尺为200μm。(d)用sgRNA(sgRNA1HBEGF)、表达Cas9的质粒和含有嘌呤霉素抗性基因(浅色条)的报告质粒,或者用sgRNA、表达Cas9的质粒和线性供体(DonorHBEGF-sg1)(深色条)转染的HeLa细胞的HBEGF敲除率,HBEGF敲除率表示为对具有DT抗性的细胞的百分比。在分析DT抗性之前用嘌呤霉素(1μg/ml)选择细胞。误差线表示s.d.(n=3),t-test,***P< 0.001。 [0064] 图4是通过EGFP富集HEK293T细胞中HBEGF破坏事件的供体设计和实验验证。(a)靶向HBEGF基因的供体设计。(b)不同HEK293T细胞组使用或不使用DT(40ng/ml)处理的的图像。用sgRNA(sgRNA2HBEGF)(加或不加它们相应的线性供体(DonorHBEGF-sg2))转染获得混合细胞,比例尺200μm。(c)用表达mCherry的sgRNA(sgRNA2HBEGF)质粒和表达Cas9的质粒(浅色条),或者用sgRNA、表达Cas9的质粒和线性供体(DonorHBEGF-sg2,EGFP)(深色条)转染的HEK293T细胞的HBEGF敲除率,HBEGF敲除率用对DT具有抗性的细胞的百分比表示。在分析DT抗性之前用FACS选择细胞。误差线表示s.d.(n=3),t-test,***P<0.05。 [0065] 图5是通过嘌呤霉素选择富集HeLaOC细胞中ANTXR1破坏事件的供体设计和实验验证。(a)靶向ANTXR1的供体设计。供体在5'端含有一个sgRNA切割位点(DonorANTXR1-sg1或DonorANTXR1-sg2)或在两端含有两个gRNAs(DonorANTXR1-pg)。(b)是用供体(加gRNA或不加gRNA)转染的细胞中嘌呤霉素抗性克隆的MTT染色。(c)不同HeLaOC细胞组使用或不使用PA/LFnDTA处理的图像。用sgRNA或pgRNA加或不加它的相应线性供体转染获得混合细胞, 比例尺为200μm。(d)用sgRNAs加或不加它们的相应供体转染的HeLaOC细胞的ANTXR1敲除率,ANTXR1敲除率表示为为具有PA/LFnDTA抗性的细胞的百分比。在分析PA/LFnDTA抗性之前用嘌呤霉素(1μg/ml)选择细胞。误差线表示s.d.(n=3),t-test,***P<0.001。(e)对嘌呤霉素抗性单克隆的线性供体整合的ANTXR1位点的PCR验证。(f)使用不同的gRNAs和它们的供体富集ANTXR1敲除细胞的总结。 [0066] 图6是在HeLaOC细胞中通过splinkerette PCR(spPCR)分析对供体插入进行脱靶评估。(a)用于spPCR分析的接头(adaptor)和引物的设计。Splink1和Splink2引物与接头序列匹配,引物R1和R2与线性供体序列匹配。(b)spPCR反应结果。 [0067] 图7是通过嘌呤霉素选择富集HeLaOC细胞中的HBEGF破坏事件的供体设计和实验验证。(a)靶向HBEGF的供体设计。供体在5'端含有一个sgRNA切割位点(DonorHBEGF-sg1或DonorHBEGF-sg2)或在两端含有两个gRNAs(DonorHBEGF-pg)。(b)用供体(加或不加sgRNA/pgRNA)转染的细胞中嘌呤霉素抗性克隆的MTT染色。(c)对嘌呤霉素抗性单克隆的线性供体整合的HBEGF位点的PCR验证。(d)使用不同的gRNAs和它们的供体的HBEGF敲除细胞富集的总结。 [0068] 图8是在HeLaOC细胞中一步产生两个或多个基因敲除的供体设计和实验验证。(a)线性供体在PSEN1和PSEN2基因上的sgRNA-或pgRNA靶向位点的基于NHEJ的敲入的示意图。(b-c)基因组中PSEN1和PSEN2的部分编码序列,含有sgRNA编码区域(加下划线)和突变等位基因的测序分析。克隆1(b)来自于用pgRNAPSEN1+PSEN2/DonorPSEN1+PSEN2转染的HeLaOC细胞。克隆 2(c)来自于用pgRNAPSEN1+PSEN2/DonorPSEN1+DonorPSEN2转染的HeLaOC细胞。阴影区域的核苷酸代表引导Cas9进行DNA识别和切割的PAM序列。虚线表示缺失,高字母表示核苷酸插入,背景中的浅灰色箭头表示供体中CMV启动子的方向。(d)HSPA基因家族的多序列比对分析,显示其共有序列,靶向五个HSPA家族基因的共有序列的sgRNA,以及用于富集含有多基因突变的细胞的通用线性供体(DonorHSPA)的设计。黑色阴影核苷酸代表所有五个HSPA基因的共有序列。深灰色阴影核苷酸代表三个或四个HSPA基因的共有序列,浅灰色阴影核苷酸代表非共有核苷酸。(e)在缺少和存在DonorHSPA的条件下,在进行了嘌呤霉素选择后,sgRNAHSPA在五个靶基因上引发的indels。误差线表示s.d.(n=3),t-test,**P<0.01,***P<0.001。(f)含有sgRNA靶向区域(加下划线)的HeLa克隆3的基因组中HSPA1A,HSPA1B,HSPA1L和HSPA6基因的部分编码序列。克隆3来自于用sgRNAHSPA/DonorHSPA转染的HeLaOC细胞。阴影部分的核苷酸代表PAM序列,虚线代表缺失。背景中的浅灰色箭头表示供体中的CMV启动子方向。 [0069] 图9是HeLaOC细胞中PSEN1和PSEN2sgRNA效率评价和单个克隆识别。(a)通过T7E1分析对在PSEN1和PSEN2位点对sgRNAPSEN1、sgRNAPSEN2和pgRNAPSEN导致的indels效率进行评价。误差线表示s.d.(n=3)。(b)用供体(加或不加pgRNAPSEN)转染的细胞中嘌呤霉素抗性克隆的MTT染色。(c)嘌呤霉素抗性单克隆的线性供体整合的PSEN1(L3/R3)和PSEN2(L4/R4)两个位点的PCR结果。 [0070] 图10是用或不用供体转染的混合细胞中HSPA家族基因的靶区域的测序图。sgRNA靶位点用阴影标出,这些测序分析中不包括含有供体插入的靶区域。 [0071] 图11是五个HSPA家族基因,HSPA1A、HSPA1B、HSPA1L、HSPA6和HSPA2的靶位点上的供体插入的单克隆鉴别。(a)嘌呤霉素抗性单克隆在所有五个基因位点上的线性供体整合的PCR验证结果。(b)四个基因位点HSPA1A、HSPA1B、HSPA1L、HSPA6中供体插入结果的总结。具体实施方案 [0072] 本发明提供了新的供体构建体和基因敲除方法,该方法利用线性供体DNA提高通过序列特异性核酸酶产生基因敲除的效率。本发明的线性供体DNA上包含至少一个可以被序列特异性核酸酶切割的靶位点。根据细胞基因组中的靶位点设计线性供体DNA中包含的靶位点,使得能够切割细胞基因组中靶位点的序列特异性核酸酶也能切割线性供体DNA中包含的靶位点。将序列特异性核酸酶和供体构建体引入细胞后,序列特异性核酸酶在细胞中特定靶位点产生双链断裂(DSBs)时,会同时切割线性供体DNA中包含的至少一个靶位点,由此可以使得线性供体DNA以较高的效率通过非同源末端连接(Non-Homologous end joining,NHEJ)途径被插入到细胞基因组中被切割的靶位点上,随后通过该标记物对细胞进行选择,可以有效地富集因在基因组的特定靶位点被切割而产生基因敲除的细胞,极大地提高通过序列特异性核酸酶产生基因敲除的效率。 [0073] 已有报道,如果同源等位基因中的一个被修饰,则靶等位基因的突变频率通常较高[25,26]。因此,虽然不希望受到理论的限制,但发明人推测,如果能够在靶等位基因的一个上的特定位点插入供体,并选择表达供体含有的标记物基因的克隆,可能能够富集那些所有等位基因都被修饰的稀有事件。 [0074] 本发明中,“基因敲除”是通过基因编辑实现基因功能的丧失。通常所追求的基因敲除效果是两个等位基因同时敲除,此时对应蛋白丧失功能,得到基因敲除细胞系。如果只有一个 等位基因被敲除,则蛋白还能发挥部分作用,仅仅是蛋白功能下调。利用本发明的线性供体DNA和本发明的方法,可以有效富集两个等位基因都被敲除的细胞。 [0075] 本发明的供体构建体是双链DNA。本发明的供体构建体本身即可以是线性供体DNA。或者本发明的供体构建体可以是包含线性供体DNA的环形DNA分子,当被引入到细胞中时,在细胞中被切割产生线性供体DNA。在细胞中切割环形供体构建体产生线性供体DNA的方法是本领域熟知的。例如,环形构建体中可以在线性供体DNA的5'端上游和3'端下游进一步包含另一种序列特异性核酸酶的切割位点。 [0076] 在本发明的方法中,可以进一步包括向细胞引入另一种序列特异性核酸酶,该序列特异性核酸酶在细胞中切割环形构建体中线性供体DNA的5'端上游和3'端下游的序列,由此产生线性供体DNA。 [0077] 本发明的线性供体DNA中,“反向终止密码子”是指该密码子的方向与表达盒的阅读框的方向相反。“正向终止密码子”是指该密码子的方向与表达盒的阅读框的方向相同。终止密码子的作用是:无论线性供体被正向或者反向插入基因组,两个三联终止密码子都能中止内源及外源基因表达。 [0078] 本发明的线性供体DNA中“保护序列”可以是任意序列,优选保护序列与同一线性供体DNA中的靶序列不同。保护序列的长度可以是5-30bp,优选20bp。保护序列的作用是保护线性供体DNA中的靶序列不被细胞中的酶(例如核酸外切酶)切割。 [0079] 本文中所述的“标记物基因”是指其表达可以被选择或富集的任何标记物基因,即当该标记物基因在细胞中表达时,可以通过一定方式选择和富集表达该标记物基因的细胞。可用于本发明的标记物基因包括但不限于在表达后可以用FACS分选的荧光蛋白基因,或者可以利用抗生素进行筛选的抗性基因,或者表达后可以被对应抗体识别并通过免疫染色或磁珠吸附进行筛选的蛋白基因。可用于本发明的抗性基因包括但不限于针对杀稻瘟菌素(Blasticidin)、遗传霉素(Geneticin,G-418)、潮霉素(Hygromycin B)、霉酚酸(Mycophenolic Acid)、嘌呤霉素(Puromycin)、博莱霉素(Zeocin)或新霉素(Neomycin)的抗性基因。可用于本发明的荧光蛋白基因包括但不限于蓝色荧光蛋白(Cyan Fluorescent Protein)、绿色荧光蛋白(Green Fluorescent Protein)、黄色荧光蛋白(Yellow Fluorescent Protein)、橙色荧光蛋白(Orange Fluorescent Protein)、红色荧光蛋白(Red Fluorescent Protein)、远红色荧光蛋白(Far-Red Fluorescent Protein)或可切换荧光蛋白(Switchable Fluorescent Proteins)的基因。 [0080] 序列特异性核酸酶的实例包括锌指核酸酶(ZFN)。锌指核酸酶是非自然存在的,人工改造的核酸内切酶,由锌指蛋白结构域和非特异性核酸内切酶结构域组成。锌指蛋白结构域由一系列Cys2-His2锌指蛋白串联组成,每个锌指蛋白识别并结合3′到5′方向DNA链上一个特异的三联体碱基以及5′到3′方向的一个碱基。多个锌指蛋白可以串联起来形成一个锌指蛋白组,识别一段特异的碱基序列,具有很强的特异性。与锌指蛋白组相连的非特异性核酸内切酶来自FokI羧基端96个氨基酸残基组成的DNA剪切域。每个FokI单体与一个锌指蛋白组相连构成一个ZFN,识别特定的位点,当两个识别位点相距恰当的距离时(6~8bp),两个单体ZFN相互作用产生酶切功能,从而达到DNA定点剪切的目的。针对靶序列设计8~10个锌指结构域,将这些锌结构域连在DNA核酸酶上,便可实现靶序列的双链断裂(Double strand breaks,DSBs),进而诱发DSBs修复机制,对基因组中的特定位点进行定向改造。 [0081] 序列特异性核酸酶的另一实例包括转录激活物样效应子核酸酶(TALEN)。转录激活物样效应子核酸酶主要由Fok I内切酶结构域和TALE蛋白的DNA结合结构域组合而成。TALE蛋白含有多个33-35个氨基酸组成的重复肽段,而每一个肽段都能够识别一个碱基。与ZFN一样,TALEN也能使DNA靶序列断裂,形成DSBs,进而激活DNA损伤修复机制,对基因组进行定点改造。 [0082] 可用于本发明的序列特异性核酸酶系统的另一种实例包括Cas9/CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats,成簇的规律间隔的短回文重复序列)系统。Cas9/CRISPR系统利用RNA指导的DNA结合对靶DNA进行序列特异性切割,由crRNA(CRISPR-derived RNA)通过碱基配对与tracrRNA(trans-activating RNA)结合形成tracrRNA/crRNA复合物,此复合物引导核酸酶Cas9蛋白在与crRNA配对的靶序列上的特定位置处剪切双链DNA。与crRNA配对的靶序列通常是位于基因组PAM(原间隔区邻近基序)位点(NNG)上游的约20个核苷酸的序列。 [0083] Cas9蛋白对靶位点的切割需要借助向导RNA。术语“向导RNA”又称gRNA(guide RNA),gRNA通常包括crRNA上与靶序列互补的核苷酸和由crRNA与tracrRNA碱基配对形成的RNA支架(Scaffold),能够识别与crRNA配对的靶序列。gRNA可以与Cas9蛋白形成复合体并将Cas9蛋白带至靶序列并切割其中的靶位点。 [0084] gRNA通常以sgRNA(single guide RNA)的形式使用。sgRNA又称“单链向导RNA”,是crRNA和trancrRNA融合而成的一条RNA链。 [0085] 可用于本发明的序列特异性核酸酶系统的另一种实例包括NgAgo核酸酶及其gDNA。NgAgo核酸酶可以与5'端磷酸化的单链向导DNA(gDNA)为结合,对与该gDNA互补的靶序列进行切割,造成DNA双链断裂。 [0086] 本发明的线性供体DNA可以仅在一端具有靶序列,也可以在两端分别具有靶序列。线性供体DNA两端的靶序列可以不同。当需要在细胞基因组中两个不同靶位点上进行切割而产生基因敲除时,可以提供两个线性供体DNA,每个线性供体DNA分别包含一个相应的靶序列,也可以提供一个线性供体DNA,该线性供体DNA的每一端包含一个相应的靶序列。当需要在细胞基因组中多个不同靶位点上进行切割而产生基因敲除时,可以提供适当数量的线性供体DNA,每个线性供体DNA的一端或两端分别包含多个不同相应靶序列中的一个。例如可以提供与靶位点数量相同的线性供体DNA,每个线性供体DNA分别包含一个相应的靶序列。或者可以提供少于靶位点数量的线性供体DNA,其中全部或部分线性供体DNA的两端分别包含多个不同相应靶序列中的一个,其它线性供体DNA每个分别包含其它相应靶序列中的一个。 [0087] 序列特异性核酸酶可以以蛋白质的形式或者以其编码核酸序列(例如mRNA或cDNA)的形式被引入细胞。编码序列特异性核酸酶的核酸可以被包含在质粒或病毒载体中被引入细胞,例如通过转染被引入细胞。编码序列特异性核酸酶的核酸也可以通过电穿孔、脂质体、显微注射等方式被直接递送到细胞中。 [0088] 供体构建体可以通过任何适合于将核酸引入细胞中的方法递送,例如通过转染被引入细胞中。 [0089] 在使用Cas9/CRISPR系统和NgAgo核酸酶产生基因敲除的情况下,还要将sgRNA或gDNA引入细胞。可以通过任何适合于将RNA或DNA引入细胞中的方法递送sgRNA或gDNA。sgRNA可以以分离的RNA的形式被引入细胞。可以使用本领域中已知的任何体外转录系统通过体外转录来制备分离的sgRNA。还可以通过包含编码sgRNA的序列和启动子的载体将sgRNA引入细胞。所述载体可以是病毒载体或质粒。引入细胞的方式可以是转染。可以向细胞中引入两个或更多个分别针对不同靶位点的sgRNA,以引导Cas9切割细胞基因组中两个或更多个不同靶位点上进行切割而产生基因敲除。所述两个或更多个sgRNA可以被包含在不同的载体中,也可以被包含在同一个载体中,例如包含一对gRNA(paired gRNA)的载体,或者包含更多个sgRNA的载体。 [0090] 在本发明的方法中,当向细胞中引入两个或更多个分别针对不同靶位点的sgRNA时,同时引入包含被这些sgRNA识别的靶序列的线性供体DNA。由于线性供体DNA可以仅在5'端或 3'端含有靶序列,也可以在两端分别含有靶序列,sgRNA的数量和线性供体DNA的数量可以不同,可以是一个sgRNA对应一个线性供体DNA,也可以是两个sgRNA对应两个线性供体DNA。 [0091] 优选地,本发明中,在使用Cas9/CRISPR系统产生基因敲除的情况下,可以将Cas9、sgRNA和线性供体DNA同时引入细胞,或者,例如,可以先将Cas9引入细胞,再将sgRNA和线性供体DNA引入细胞。在一些实施方案中,用包含Cas9的载体、包含sgRNA的载体和线性供体DNA共转染细胞。在另一些实施方案中,将Cas9和sgRNA在体外组装成蛋白和RNA复合体,并与线性供体DNA共转染细胞。在另一些实施方案中,将Cas9和sgRNA通过慢病毒稳定表达进细胞,并用线性供体DNA转染细胞。在其它的实施方案中,先将Cas9在细胞中稳定表达,再用包含sgRNA的载体和线性供体DNA共转染细胞。 [0092] 在本发明提供的提供用于基因敲除的系统或试剂盒中,序列特异性核酸酶可以是蛋白质的形式或者编码核酸序列(例如mRNA或cDNA)的形式,例如是包含编码序列特异性核酸酶的核酸的质粒或病毒载体的形式。在使用Cas9/CRISPR系统的情况下,sgRNA可以是分离的RNA的形式,或者是包含编码sgRNA的序列和启动子的载体的形式,例如病毒载体或质粒载体。 [0093] 本文所述的细胞可以是任何真核细胞,例如分离的动物细胞,例如全能细胞、多能细胞、成体干细胞、受精卵或体细胞等。在一些实施方案中,所述细胞是脊椎动物细胞。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是人细胞。在一些实施方案中,所述细胞是牛、山羊、绵羊、猫、狗、马、啮齿类动物、鱼、灵长类动物的细胞。在一些实施方案中,啮齿类动物包括小鼠、大鼠、兔。 [0094] 本发明的方法可用于在细胞中的单个基因或多个基因上进行靶向基因敲除,例如靶向两个、三个、四个、五个或更多个基因敲除。针对多个基因的靶向基因敲除可以同时进行或先后进行。例如,可以将针对两个或更多个靶基因的序列特异性核酸酶或序列特异性核酸酶系统全部引入细胞后,再进行富集筛选。或者可以先将针对一个或更多个靶基因的序列特异性核酸酶或序列特异性核酸酶系统引入细胞后并进行富集筛选后,再将针对其它靶基因的序列特异性核酸酶或序列特异性核酸酶系统引入细胞后并进行富集筛选。针对不同的靶基因可以使用不同的标记物/标记物基因。例如,在使用Cas9/CRISPR系统产生基因敲除的情况下,可以向细胞中引入两个或更多个分别针对不同靶位点的sgRNA时,同时引入包含被这些sgRNA识别的靶序列的线性供体DNA,如前所述。当这些不同靶位点位于不同的基因上时,即可实 现多个基因的基因敲除。还可以通过使用细胞基因组中两个或多个基因的共有序列设计sgRNA和线性供体DNA中的靶序列,此时可以向细胞中引入识别细胞基因组中单个特定靶位点的sgRNA,同时引入包含被所述sgRNA识别的靶序列的线性供体DNA,其中被所述sgRNA识别的靶序列是细胞基因组中两个或多个基因的共有序列,条件是所述共有序列与所述两个或多个基因的任何一个上与共有序列对应位置处的序列具有不超过一个碱基的差异。两个碱基的差异可能会破坏sgRNA的识别,如实施例7所证明的。 [0095] 本发明的线性供体DNA进行的基因编辑所针对的靶基因没有特别限制,只要其能通过Cas9/CRISPR系统产生双链断裂。靶基因可以是外显子、内含子或调节序列,或其任意组合。 [0096] 本发明中所使用的术语“包括”或“包含”表示“包括但不限于”、“基本上由……组成”或“由……组成”。 [0097] 结合以下实施例和附图对本发明进行进一步说明,它们仅用于举例说明,并非要限制本发明的范围。如果没有特别指明,实施例均按照常规实验条件,如Sambrook等分子克隆实验手册(Sambrook J&Russell DW,Molecular cloning:a laboratory manual,2001),或按制造商提供的说明进行。 [0098] 实施例1利用线性供体DNA富集HeLa细胞中ANTXR1基因上的敲除事件 [0099] 1.sgRNA的设计 [0100] 设计两个靶向HeLa细胞中ANTXR1基因的第一外显子的sgRNA,通过T7E1测定验证它们在靶位点上产生缺失或插入突变(Indels)的效率,验证结果如表1所示。其中sgRNA1ANTXR1针对的靶序列在本实施例中被称为sg1,sgRNA2ANTXR1针对的靶序列在本实施例中被称为sg2。 [0101] 表1靶向HeLa细胞中ANTXR1基因的第一外显子的sgRNA [0102] [0103] 2.线性供体DNA的构建 [0104] 共构建了两种线性供体DNA(DonorANTXR1-sg2和DonorANTXR1-pg),其结构参考图1a。 [0105] DonorANTXR1-sg2从5'至3'端分别包括:20bp的保护序列,sg2,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0106] DonorANTXR1-pg从5'至3'端分别包括:20bp的保护序列,sg1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,sg2,20bp的保护序列。 [0107] 作为对照的线性供体DNA(Donorno cut)从5'至3'端分别包括:20bp的保护序列,20bp的随机序列,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子, 20bp的保护序列。其中随机序列不同于sg1或sg2。 [0108] 3.转染 [0109] 用表达Cas9的质粒、sgRNA2ANTXR1或pgRNAANTXR1、以及它们相应的供体共转染HeLa细胞,作为对照,单独用线性供体DNA(DonorANTXR1-sg2、DonorANTXR1-pg和Donorno cut)转染HeLa细胞,并加入嘌呤霉素进行抗性筛选,获得混合群落(pooled population)和单克隆(single clones),用MTT(3-(4,5-二甲基噻唑-2-基)-2,5-二苯基溴化四唑)染色,结果如图1b所示。 [0110] 从接受sgRNA2ANTXR1和它的相应供体DonorANTXR1-sg2,以及从接受pgRNAANTXR1和它的相应供体DonorANTXR1-pg的样品获得了许多具有嘌呤霉素抗性(puro+)的细胞克隆。仅用供体转染均只产生很少的嘌呤霉素抗性克隆,这可能是由于线性供体向染色体上的整合是稀少的且随机的。此外,对照供体Donorno cut与表达Cas9的质粒和sgRNA2ANTXR1共转染也未能产生显著量的puro+克隆(参见图1b最右图),这表明sgRNA介导的Cas9在供体上的切割对于有效的供体整合是重要的。pgRNAANTXR1介导的双重切割DonorANTXR1-pg的整合比sgRNA2ANTXR1加上DonorANTXR1-sg2具有更高的效率;然而,无论用哪种线性供体DNA,都产生了足够的puro+克隆,可用于后续的突变体鉴别。 [0111] 4.基因敲除效率的验证 [0112] 另外用表达Cas9的质粒和sgRNA2ANTXR1或pgRNAANTXR1,加或不加它们相应的供体,共转染HeLa细胞,利用嘌呤霉素(1μg/ml)筛选获得混合群落和单克隆,其中不加相应供体时与表达嘌呤霉素抗性基因的质粒共转染。由于HeLa细胞中ANTXR1基因的敲除导致细胞对嵌合炭疽毒素(PA/LFnDTA)的抗性[17],用PA/LFnDTA(PA:150ng/ml;LFnDTA:100ng/ml)处理嘌呤霉素筛选获得的混合群落和单克隆,以比较线性供体DNA对ANTXR1敲除效率的影响。不同细胞用PA/LFnDTA处理后的图像如图2a所示。通过计算puro+混合群落中具有该毒素抗性的细胞的百分比确定ANTXR1敲除效率,如图1c所示,与单独使用sgRNA2ANTXR1或pgRNAANTXR1单独相比,线性供体DNA的使用将基因敲除效率提高了6-8倍。对puro+单克隆的线性供体整合的ANTRX1位点进行PCR验证,PCR扩增中使用的L1/R1引物序列如表2所示。结果如图2b所示,可以看出,从puro+细胞混合物中分离的大部分克隆在sgRNA靶向位点含有 供体插入物(还参见图1d)。由图1d还可以看出,接近90%的携带供体片段的细胞是真正的基因敲除克隆。 [0113] 表2用于扩增HeLa细胞中线性供体整合的ANTRX1位点的引物 [0114]引物对 序列 L1/R1 5'-AAGCGGAGGACAGGATTGGG-3'/5'-CCTCTGTGGCCCTGGAGATG-3' [0115] 实施例2利用线性供体DNA富集HeLa细胞中HBEGF基因上的敲除事件 [0116] 由于具有单-或双-切割位点的供体都能够极大地提高对在靶位点具有修饰的细胞的选择,为方便起见,在本实施例中,仅使用单切割供体。 [0117] 1.sgRNA的设计 [0118] 设计两个靶向HeLa细胞中HBEGF基因的sgRNA,通过T7E1测定验证它们在靶位点上产生Indels的效率,验证结果如表3所示。其中sgRNA1HBEGF针对的靶序列在本实施例中被称为sg1,sgRNA2HBEGF针对的靶序列在本实施例中被称为sg2。 [0119] 表3靶向HeLa细胞中HBEGF基因的sgRNA [0120] [0121] 2.线性供体DNA的构建 [0122] 构建一种线性供体DNA(DonorHBEGF-sg1),其结构参考图3a。 [0123] DonorHBEGF-sg1从5'至3'端分别包括:20bp的保护序列,sg1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0124] 3.转染 [0125] 用表达Cas9的质粒、sgRNA1HBEGF、以及它相应的供体DonorHBEGF-sg1共转染HeLa细胞,作为对照,单独用供体DonorHBEGF-sg1转染HeLa细胞,并加入嘌呤霉素进行抗性筛选,获得混合群落(pooled population)和单克隆(single clones),用MTT染色,结果如图3b所示。 [0126] 与实施例1的结果类似,只有供体加上sgRNA获得大量的puro+克隆。这个结果再次证明供体插入取决于特异性的sgRNA/Cas9介导的DSBs。 [0127] 4.基因敲除效率的验证 [0128] 另外用表达Cas9的质粒和sgRNA1HBEGF,加或不加它相应的供体DonorHBEGF-sg1,共转染HeLa细胞,利用嘌呤霉素(1μg/ml)筛选获得混合群落和单克隆,其中不加相应供体时与表达嘌呤霉素抗性基因的质粒共转染。由于HBEGF基因编码白喉毒素(DT)受体,在HeLa细胞中将其敲除会导致细胞对DT的抗性[17],用DT(40ng/ml)处理嘌呤霉素筛选获得的混合群落和单克隆,以比较线性供体DNA对HBEGF敲除效率的影响。不同细胞用DT处理后的图像如图3c所示。通过计算puro+混合群落中具有DT抗性的细胞的百分比确定HBEGF敲除效率,如图3d所示。由图3c和图3d可知,与单独使用sgRNA1HBEGF相比,线性供体DNA的使用大大提高了HBEGF基因敲除效率。 [0129] 实施例3利用线性供体DNA富集HEK293T细胞中HBEGF基因上的敲除事件 [0130] 1.sgRNA的设计和线性供体DNA的构建 [0131] 设计靶向HEK293T细胞中HBEGF基因的sgRNA2HBEGF,并构建线性供体DNA(DonorHBEGF-sg2),供体从5'至3'端分别包括:20bp的保护序列,sg2,反向终止密码子,CMV启动子驱动的EGFP基因,正向终止密码子,20bp的保护序列,参见图4a。 [0132] 2.基因敲除效率的验证 [0133] 用表达Cas9的质粒和sgRNA2HBEGF,加或不加它相应的供体DonorHBEGF-sg2,共转染HEK293T细胞,通过FACS筛选细胞,加供体的组通过FACS筛选EGFP阳性细胞,不加供体的组通过FACS筛选mCherry阳性的细胞。用DT(40ng/ml)处理FACS选择的细胞,以比较线性供体DNA对HBEGF敲除效率的影响。不同细胞用DT处理后的图像如图4b所示。通过计算EGFP阳性细胞中具有DT抗性的细胞的百分比确定HBEGF敲除效率,如图4c所示。与单独使用sgRNA2HBEGF相比,线性供体DNA的使用大大提高了HBEGF基因敲除效率。 [0134] 实施例4利用线性供体DNA富集HeLaOC细胞中ANTXR1基因上的敲除事件 [0135] 1.HeLaOC细胞系的建立 [0136] 根据已有的方法建立HeLaOC细胞系[17],该细胞系稳定表达Cas9。 [0137] 2.sgRNA的设计和线性供体DNA的构建 [0138] 设计两个靶向HeLaOC细胞中ANTXR1基因的sgRNA(sgRNA1ANTXR1和sgRNA2ANTXR1)并构建三个线性供体DNA(DonorANTXR1-sg1、DonorANTXR1-sg2和DonorANTXR1-pg),见图5a。其中sgRNA1ANTXR1针对的靶序列在本实施例中被称为sg1,sgRNA2ANTXR1针对的靶序列在本实施例中被称为sg2。 [0139] DonorANTXR1-sg1从5'至3'端分别包括:20bp的保护序列,sg1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0140] DonorANTXR1-sg2从5'至3'端分别包括:20bp的保护序列,sg2,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0141] DonorANTXR1-pg从5'至3'端分别包括:20bp的保护序列,sg1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,sg2,20bp的保护序列。 [0142] 3.转染 [0143] 用表达Cas9的质粒、sgRNA1ANTXR1或sgRNA2ANTXR1或pgRNAANTXR1、以及它们相应的供体共转染HeLaOC细胞,作为对照,单独用线性供体DNA(DonorANTXR1-sg1、DonorANTXR1-sg2和DonorANTXR1-pg)转染HeLaOC细胞,并加入嘌呤霉素进行抗性筛选,用MTT染色,结果如图5b所示。 [0144] 与在HeLa细胞中的结果类似,只有供体加上sgRNA获得大量的puro+克隆。 [0145] 4.基因敲除效率的验证 [0146] 另外用表达Cas9的质粒和sgRNA1ANTXR1或sgRNA2ANTXR1或pgRNAANTXR1,加或不加它们相应的供体,共转染HeLaOC细胞,用嘌呤霉素(1μg/ml)进行筛选。用PA/LFnDTA处理筛选获得的细胞,不同细胞用PA/LFnDTA处理后的图像如图5c所示。通过计算puro+混合群落中具有该毒素抗性的细胞的百分比确定ANTXR1敲除效率,如图5d所示,与单独使用sgRNA相比,线性供体DNA的使用大大提高了ANTXR1基因敲除效率。 [0147] 对puro+的单个克隆,对供体DonorANTXR1-sg1在ANTXR1基因上的整合位点进行PCR验证,发现puro+的大部分克隆在sgRNA靶向位点含有供体插入物(图5e和图5f),大部分携带供体片段的细胞是真正的基因敲除克隆(图5f)。 [0148] 对~500bp(长度相应于野生型ANTXR1基因)的PCR片段和~1.8kb(长度相应于野生型ANTXR1基因加上供体插入物)的PCR片段进行基因组测序,结果如表4所示。 [0149] 表4~500bp的PCR片段和~1.8kb的PCR片段的基因组测序结果 [0150] 靶位点:ANTXR1(Chr2,HeLaoc) [0151] [0152] 从PCR验证结果(图5e)和测序结果(表4)可以看到,大部分克隆只含有一个供体插入。但是,在供体阳性克隆中,绝大多数等位基因在靶位点被编辑(或者说发生突变),但是单独的sgRNA在不使用供体富集的情况下产生插入或缺失突变(indels)的效率很低。这一发现显然证明供体插入与sgRNA或pgRNA的作用密切相关。 [0153] 5.供体对CRISPR/Cas系统的脱靶效应的影响 [0154] 为了检查外部供体的使用是否会影响CRISPR/Cas系统的脱靶效果,通过splinkerette PCR分析找到全基因组的整合位点[35-37]。 [0155] 本实施例中通过splinkerette PCR分析在嘌呤霉素选择之后验证单个克隆中和混合细胞克隆中脱靶的插入。如果在ANTXR1基因上具有正确的供体插入,用引物Splink2/R1和Splink2/R2扩增分别会产生711-和927-bp的产物(参见图6a)。 [0156] 为了进行splinkerette PCR分析,我们随机选择了在HeLaOC细胞中靶向ANTXR1的10个具有供体插入的单个克隆和4个puro+混合克隆。根据splinkerette PCR结果(图6b),与那些没有用供体转染的克隆类似,通过供体富集的单个克隆或混合群落没有可检测到的脱靶效应。 [0157] 实施例5利用线性供体DNA富集HeLaOC细胞中HBEGF基因上的敲除事件 [0158] 1.sgRNA的设计和线性供体DNA的构建 [0159] 设计两个靶向HeLaOC细胞中HBEGF基因的sgRNA(sgRNA1HBEGF和sgRNA2HBEGF)并构建三个线性供体DNA(DonorHBEGF-sg1、DonorHBEGF-sg2和DonorHBEGF-pg),见图7a。其中sgRNA1HBEGF针对的靶序列在本实施例中被称为sg1,sgRNA2HBEGF针对的靶序列在本实施例中被称为sg2。 [0160] DonorHBEGF-sg1从5'至3'端分别包括:20bp的保护序列,sg1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0161] DonorHBEGF-sg2从5'至3'端分别包括:20bp的保护序列,sg2,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0162] DonorHBEGF-pg从5'至3'端分别包括:20bp的保护序列,sg1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,sg2,20bp的保护序列。 [0163] 3.转染 [0164] 用表达Cas9的质粒、sgRNA1HBEGF或sgRNA2HBEGF或pgRNAHBEGF、以及它们相应的供体共转染HeLaOC细胞,作为对照,单独用线性供体DNA(DonorHBEGF-sg1、DonorHBEGF-sg2和DonorHBEGF-pg)转染HeLaOC细胞,并加入嘌呤霉素进行抗性筛选,结果如图7b所示。 [0165] 与在HeLa细胞中的结果类似,只有供体加上sgRNA获得大量的puro+克隆。 [0166] 4.基因敲除效率的验证 [0167] 对puro+的单个克隆,对供体DonorHBEGF-sg1在HBEGF基因上的整合位点进行PCR验证,PCR扩增中使用的L2/R2引物序列如表5所示。发现从puro+的大部分克隆在sgRNA靶向位点含有供体插入物(图7c和图7d),大部分携带供体片段的细胞是真正的基因敲除克隆(图7d)。 [0168] 表5用于扩增HeLaOC细胞中线性供体整合的HBEGF位点的引物 [0169]引物对 序列 L2/R2 5'-GCCGCTTCGAAAGTGACTGG-3'/5'-GATCCCCCAGTGCCCATCAG-3' [0170] 实施例6利用线性供体DNA在HeLaOC细胞中进行双基因敲除 [0171] 1.sgRNA的设计 [0172] 选定HeLaOC细胞中的两个靶基因:PSEN1和PSEN2,设计分别靶向这两个靶基因的两个sgRNA,通过T7E1测定验证它们在靶位点上产生Indels的效率,结果如表6所示。其中sgRNAPSEN1针对的靶序列在本实施例中被称为sgPSEN1,sgRNAPSEN2针对的靶序列在本实施例中被称为sgPSEN2。 [0173] 表6靶向HeLaOC细胞中的PSEN1和PSEN2基因的sgRNA [0174] [0175] 2.线性供体DNA的构建 [0176] 构建两种类型的供体,一种具有两个单独的供体(DonorPSEN1+DonorPSEN2),每个供体具有相应sgRNA的靶序列,另一种供体(DonorPSEN)在两端分别具有两个sgRNA靶序列,如图8a所示。DonorPSEN1或DonorPSEN2在其5'末端具有sgRNAPSEN1或sgRNAPSEN2切割位点。DonorPSEN1+PSEN2在5'端具有sgRNAPSEN1切割位点,在3'端具有sgRNAPSEN2切割位点。其中: [0177] DonorPSEN1从5'至3'端分别包括:20bp的保护序列,sgPSEN1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0178] DonorPSEN2从5'至3'端分别包括:20bp的保护序列,sgPSEN2,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列。 [0179] DonorPSEN从5'至3'端分别包括:20bp的保护序列,sgPSEN1,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,sgPSEN2,20bp的保护序列。 [0180] 3、转染和基因敲除效率的验证 [0181] 用表达Cas9的质粒、sgRNAPSEN1或sgRNAPSEN2共转染HeLaOC细胞,或者用表达Cas9的质粒、pgRNAPSEN共转染HeLaOC细胞,以在PSEN1和PSEN2基因的特定位点上产生indels。对indels产生效率进行T7E1分析[26](使用的引物见表7),结果如图9a所示,它们的共转染都只显示出普通活性。 [0182] 用表达Cas9的质粒、pgRNAPSEN、和DonorPSEN共转染HeLaOC细胞,或者用表达Cas9的质粒、pgRNAPSEN、和DonorPSEN1+DonorPSEN2共转染HeLaOC细胞,并加入嘌呤霉素进行抗性筛选,可以获得puro+克隆(见图9b)。与前面实施例的结果类似,供体加上pgRNA获得大量的puro+克隆。 [0183] 对于每种转染结果,取puro+的单个克隆,对供体DonorPSEN和DonorPSEN1+DonorPSEN2在PSEN1和PSEN2基因上的整合位点进行PCR验证,PCR扩增中所使用的引物如表7所示,其中L3/R3用于扩增PSEN1上的整合位点,L4/R4用于扩增PSEN2上的整合位点,PCR验证结果如图9c所示,两个基因上都含有供体插入的克隆用方框标出,选择克隆1和克隆2进一步进行基因组测序分析,两个克隆都显示出PSEN1和PSEN2的破坏(图8b和图8c)。 [0184] 表7用于扩增HeLaOC细胞中线性供体整合的PSEN1和PSEN2位点的引物 [0185]引物对 序列 L3/R3 5'-TGGTGTCTCAGGCGGTTCTA-3'/5'-TGAACTATGAGGCGCTGCAC-3' L4/R4 5'-TGACTTTCGTGGCTATGCGT-3'/5'-CTAGCACCCAGGCATCCAAA-3' [0186] 实施例7利用线性供体DNA在HeLaOC细胞中进行多基因敲除 [0187] 1.靶基因的选择和sgRNA的设计 [0188] 选择HeLaOC细胞中的HSPA基因家族,该基因家族有五个基因,HSAPA1A、HSPA1B、HSBA1L、HSPA6和HSPA2,它们具有同源性。设计同时靶向HSAPA1A、HSPA1B和HSBA1L的sgRNAHSPA,该sgRNA的靶序列与HSPA6上的相应序列有一个错配,与HSPA2有两个错配。如图8d所示。 [0189] 2.线性供体DNA的构建 [0190] 构建线性供体DonorHSPA,从5'至3'端分别包括:20bp的保护序列,sgHSPA,反向终止密码子,CMV启动子驱动的嘌呤霉素抗性基因,正向终止密码子,20bp的保护序列(图8d)。 [0191] 3.转染和基因敲除效率的验证 [0192] 用表达Cas9的质粒和sgRNAHSPA,加或不加其相应的供体DonorHSPA,共转染HeLaOC细胞,引发indels,并通过嘌呤霉素进行抗性筛选,。其中不加供体的组与表达嘌呤霉素抗性基因的质粒共转染。通过T7E1测定(使用的引物见表8)评价所有五个基因的indels效率,结果如图8e所示,与单独的sgRNAHSPA相比较,使用供体HSPA使得在HSPA1A位点的突变率提高大约5.5倍,在HSPA1B位点的突变率提高大约6.1倍,在HSPA1L位点的突变率提高大约3.4倍,在HSPA6位点的突变率提高大约6.6倍,有趣的是,在HSPA2基因上,无论是否使用供体,都没有检测到indels,表明两个错配完全破坏了sgRNAHSPA的识别,而且,更重要的是,使用供体进行选择没有增加脱靶效应的风险。 [0193] 对与供体共转染和不与供体共转染获得的混合细胞中HSPA家族基因中的靶区域进行测序,结果如图10所示,结果表明无论在HSPA家族基因位点上是否有供体转染,细胞混合测序结果都与T7E1测定的结果一致。 [0194] 值得注意的是,T7E1测定证明所选择的群体高度富集携带有靶突变的细胞,与传统的不使用供体的方法相比,富集系数是大约753(5.5*6.1*3.4*6.6)。考虑到这种计算未考虑具有供体插入的基因,实际的效率提高甚至更高。 [0195] 对具有嘌呤霉素抗性的单个克隆,在五个靶位点上进行PCR验证,用于扩增所有五个基因的靶位点使用的特异性引物(L5/R5,L6/R6,L7/R7,L8/R8,L9/R9)列在表8中。结果如图11a和11b所示。选择其中在至少两个靶基因上具有供体插入的六个克隆(在图中用方框标识出并分别编号为1-6)进行基因组序列分析,结果如图11b所示,克隆3在四个基因的相应位 点上具有修饰:在HSPA1A、HSPA1B和HSPA1L上具有移码突变,产生完全的敲除,在HSPA6上具有两个框内突变(图8f)。 [0196] 表8用于扩增HeLaOC细胞中HSPA家族的五个基因靶位点的引物 [0197]引物对 序列 L5/R5 5'-GAGAGTGACTCCCGTTGTCC-3'/5'-ACATTGCAAACACAGGAAATTGAG-3' L6/R6 5'-GTGTTGAGTTTCCGGCGTTC-3'/5'-TCGCTTGTTCTGGCTGATGT-3' L7/R7 5'-GCACTCTCCCAAAACAGTATCTTA-3'/5'-GTGCCTCCACCCAGATCAAA-3' L8/R8 5'-GGGTGAGGCGCAAAAGGATA-3'/5'-ACACCAGCGTCAATGGAGAG-3' [0198] 以上实施例1-7中所使用的材料和方法如下: [0199] 细胞培养和转染 [0200] HeLa、HeLaOC和HEK293T细胞被保持在添加有10%胎牛血清(FBS,兰州百灵生物技术有限公司,兰州,中国)的Dulbecco’s modified Eagle’s培养基(DMEM,10-013-CV,Corning,Tewksbury,MA,USA)中,温度为37℃,通入5%CO2。为了进行转染,将所有细胞接种于6孔板上,并用X-tremeGENE HP(06366546001,Roche,Mannheim,Germany)转染,根据供应商的说明进行。简单地说,将2μg DNA和4μl X-tremeGENE HP加入到200μl Opti-MEM I Reduced Serum Medium(31985088,Thermo Fisher Scientific,Grand Island,NY,USA)中。在室温将混合物温育15分钟,然后加入到细胞中。 [0201] 表达gRNA的质粒的克隆 [0202] 对于表达sgRNA的质粒,单独设计每个sgRNA编码序列的寡核苷酸(见表9),并进行合成(北京睿博兴科生物技术有限公司)。 [0203] 表9用于sgRNA或pgRNA构建的引物 [0204] [0205] [0206] 用1×TE将寡核苷酸溶解至浓度为10μM,用TransTaq HiFi BufferⅡ(K10222,北京全式金生物技术有限公司)混合成对寡核苷酸,加热至95℃保持3分钟,然后缓慢冷却至4℃。在37℃将这些退火的寡核苷酸对磷酸化30分钟,加热失活后,使用“Golden Gate”法将产物连接到sgRNA骨架载体中。对于表达pgRNA的质粒,用含有两个gRNA编码序列的引物扩增gRNA的scaffold序列和U6启动子(表5),然后纯化PCR产物并使用“Golden Gate”法连接到sgRNA骨架载体中。与先前报道的sgRNA骨架载体[17]相比,本发明的sgRNA骨架载体对sgRNA骨架进行了修改[38],并且用mCherry编码序列取代了EGFP序列。 [0207] T7E1测定 [0208] 使用DNeasy Blood&Tissue kit(69504,Qiagen,Hilden,Germany)提取基因组DNA,对含有gRNA靶序列的基因组区域进行PCR扩增。测定中使用的引物序列如表2、表5、表7、表8所示。所使用的引物序列如在50μl体系中取300-500ng的PCR产物与10×NEB Buffer2混合,95℃加热3分钟后缓慢冷却到室温。所得产物加入0.5μl T7E1在37℃温育15min,进行琼脂糖凝胶电泳,电泳图用Image J图像分析软件分析条带切割的效率,指示sgRNA产生Indels的效率。 [0209] 线性供体构建 [0210] 预先生成含有CMV驱动的嘌呤霉素抗性基因或EGFP基因的供体和终止密码子的序列,并克隆到pEASY-T5-Zero克隆载体(CT501-02,北京全式金生物技术有限公司)中,作为通用模板。使用含有sgRNA切割靶位点和保护序列的引物扩增模板,引物序列如表10所示。 [0211] 表10用于线性供体构建的引物 [0212] [0213] 基于NHEJ的供体插入和细胞选择 [0214] 在HeLaOC细胞中,用1μg纯化的线性供体PCR产物和1μg sgRNA/pgRNA转染细胞,转染后两周,用1μg/ml的嘌呤霉素处理细胞。在HeLa和HEK293T细胞中,用1μg供体和0.5μgsgRNA/pgRNA以及0.5μg Cas9质粒转染细胞。然后在转染后两周用1μg/ml的嘌呤霉素处理细胞,或者通过荧光激活的细胞分选(FACS)确定EGFP阳性,这取决于使用哪种类型的供体。 [0215] Splinkerette PCR [0216] Splinkerette PCR方法先前已有报道(Potter,C.J.&Luo,L.Splinkerette PCR for mapping transposable elements in Drosophila.PLoS One5,e10168(2010);Uren,A.G.et al.A high-throughput splinkerette-PCR method for the isolation and sequencing of retroviral insertion sites.Nat Protoc4,789-798(2009);Yin,B.&Largaespada,D.A.PCR-based procedures to isolate insertion sites of DNA elements.Biotechniques43,79-84(2007))。所使用的引物和接头(adaptor)序列如表11所示。 [0217] 表11用于Splinkerette PCR的引物 [0218] [0219] 参考文献 [0220] 1.Kim,Y.G.,Cha,J.&Chandrasegaran,S.Hybrid restriction enzymes:zinc finger fusions to Fok I cleavage domain.Proc Natl Acad Sci U S A93,1156-1160(1996). [0221] 2.Boch,J.et al.Breaking the code of DNA binding specificity of TAL-type III effectors.Science326,1509-1512(2009). [0222] 3.Moscou,M.J.&Bogdanove,A.J.A simple cipher governs DNA recognition by TAL effectors.Science326,1501(2009). [0223] 4.Miller,J.C.et al.A TALE nuclease architecture for efficient genome editing.Nat Biotechnol29,143-148(2011). [0224] 5.Jinek,M.et al.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science337,816-821(2012). [0225] 6.Mali,P.et al.RNA-guided human genome engineering via Cas9.Science339,823-826(2013). [0226] 7.Cong,L.et al.Multiplex Genome Engineering Using CRISPR/Cas Systems.Science339,819-823(2013). [0227] 8.Phillips,E.R.&McKinnon,P.J.DNA double-strand break repair and development.Oncogene26,7799-7808(2007). [0228] 9.Chapman,J.R.,Taylor,M.R.&Boulton,S.J.Playing the end game:DNA double-strand break repair pathway choice.Mol Cell47,497-510(2012). [0229] 10.Gilbert,L.A.et al.CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes.Cell154,442-451(2013). [0230] 11.Ma,H.et al.Multicolor CRISPR labeling of chromosomal loci in human cells.Proc Natl Acad Sci U S A112,3002-3007(2015). [0231] 12.Chen,B.et al.Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system.Cell155,1479-1491(2013). [0232] 13.Li,H.L.,Gee,P.,Ishida,K.&Hotta,A.Efficient genomic correction methods in human iPS cells using CRISPR-Cas9 system.Methods(2015). [0233] 14.Savic,N.&Schwank,G.Advances in therapeutic CRISPR/Cas9 genome editing.Translational research:the journal of laboratory and clinical medicine168,15-21(2016). [0234] 15.Miyaoka,Y.et al.Isolation of single-base genome-edited human iPS cells without antibiotic selection.Nat Methods11,291-293(2014). [0235] 16.Fu,Y.et al.High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells.Nat Biotechnol31,822-826(2013). [0236] 17.Zhou,Y.et al.High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells.Nature509,487-491(2014). [0237] 18.Yu,C.et al.Small Molecules Enhance CRISPR Genome Editing in Pluripotent Stem Cells.Cell Stem Cell16,142-147(2015). [0238] 19.Liao,S.,Tammaro,M.&Yan,H.Enriching CRISPR-Cas9 targeted cells by co-targeting the HPRT gene.Nucleic Acids Res43,e134(2015). [0239] 20.Kim,H.et al.Surrogate reporters for enrichment of cells with nuclease-induced mutations.Nat Methods8,941-943(2011). [0240] 21.Ramakrishna,S.et al.Surrogate reporter-based enrichment of cells containing RNA-guided Cas9 nuclease-induced mutations.Nature communications5,3378(2014). [0241] 22.Wang,T.,Wei,J.J.,Sabatini,D.M.&Lander,E.S.Genetic screens in human cells using the CRISPR-Cas9 system.Science343,80-84(2014). [0242] 23.Yuan,P.et al.Chondroitin sulfate proteoglycan 4 functions as the cellular receptor for Clostridium difficile toxin B.Cell Res25,157-168(2015).[0243] 24.Yang,J.et al.ULtiMATE System for Rapid Assembly of Customized TAL Effectors.PLoS One8,e75649(2013). [0244] 25.Perez,E.E.et al.Establishment of HIV-1 resistance in CD4+T cells by genome editing using zinc-finger nucleases.Nat Biotechnol26,808-816(2008).[0245] 26.Kim,H.J.,Lee,H.J.,Kim,H.,Cho,S.W.&Kim,J.S.Targeted genome editing in human cells with zinc finger nucleases constructed via modular assembly.Genome Res19,1279-1288(2009). [0246] 27.Lackner,D.H.et al.A generic strategy for CRISPR-Cas9-mediated gene tagging.Nature communications6,10237(2015). [0247] 28.Auer,T.O.&Del Bene,F.CRISPR/Cas9 and TALEN-mediated knock-in approaches in zebrafish.Methods(2014). [0248] 29.Li,K.,Wang,G.,Andersen,T.,Zhou,P.&Pu,W.T.Optimization of Genome Engineering Approaches with the CRISPR/Cas9 System.PLoS One9,e105779(2014).[0249] 30.Orlando,S.J.et al.Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology.Nucleic Acids Res38,e152(2010). [0250] 31.Sakuma,T.,Nakade,S.,Sakane,Y.,Suzuki,K.T.&Yamamoto,T.MMEJ-assisted gene knock-in using TALENs and CRISPR-Cas9 with the PITCh systems.Nat Protoc11,118-133(2016). [0251] 32.Nakade,S.et al.Microhomology-mediated end-joining-dependent integration of donor DNA in cells and animals using TALENs and CRISPR/ Cas9.Nature communications5,5560(2014). [0252] 33.Cristea,S.et al.In vivo cleavage of transgene donors promotes nuclease-mediated targeted integration.Biotechnol Bioeng110,871-880(2013).[0253] 34.Chen,F.et al.High-frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases.Nat Methods8,753-755(2011).[0254] 35.Potter,C.J.&Luo,L.Splinkerette PCR for mapping transposable elements in Drosophila.PLoS One 5,e10168(2010). [0255] 36.Uren,A.G.et al.A high-throughput splinkerette-PCR method for the isolation and sequencing of retroviral insertion sites.Nat Protoc 4,789-798(2009). [0256] 37.Yin,B.&Largaespada,D.A.PCR-based procedures to isolate insertion sites of DNA elements.Biotechniques 43,79-84(2007). [0257] 38.Peng,J.,Zhou,Y.,Zhu,S.&Wei,W.High-throughput screens in mammalian cells using the CRISPR-Cas9system.FEBS J 282,2089-2096(2015). |