首页 / 专利库 / 疗法 / 电离辐射 / 检测基因组编辑

检测基因组编辑

阅读:1038发布:2020-06-11

专利汇可以提供检测基因组编辑专利检索,专利查询,专利分析的服务。并且提供方法、组合物和 试剂 盒 ,用于定量细胞基因组或细胞群的基因组中双链断裂的数量或 频率 。,下面是检测基因组编辑专利的具体信息内容。

1.一种用于定量细胞基因组中的双链断裂点数量的方法,所述方法包括:
a)从所述细胞提供基因组核酸,其中所述基因组核酸在细胞中的双链断裂点插入有外源供体多核苷酸或其部分;
b)将基因组核酸片段化以产生多个基因组核酸片段,其中至少一个基因组核酸片段含有所述插入的供体多核苷酸或其部分;
c)产生包含环状基因组核酸片段和扩增引物对的多个混合物分区,其中所述扩增引物对与供体多核苷酸或其部分的相反链互补,并且其中所述扩增引物对定向为使得,当在环化前与含有所述插入的供体多核苷酸或其部分的基因组核酸片段杂交时,5'端彼此接近并且3'端彼此远离;
d)用该扩增引物对扩增基因组核酸片段,以选择性地在包括含有所述插入的供体多核苷酸或其部分的一个或多个基因组片段的混合物分区中产生扩增子
e)检测扩增子;和
f)计数含扩增子的混合物分区的数量,从而定量细胞基因组中的双链断裂点的数量。
2.如权利要求1所述的方法,其中,生成包含环状基因组核酸片段的多个混合物分区包括使该基因组核酸片段环化,并将环化的基因组核酸片段划分成多个混合物分区。
3.如权利要求1所述的方法,其中,生成包含环状基因组核酸片段的多个混合物分区包括将所述基因组核酸片段划分成多个混合物分区并使所述分区中的基因组片段环化。
4.如权利要求1所述的方法,其中所述方法还包括对细胞群进行a)-f),从而定量细胞群的基因组中的双链断裂点的数量。
5.如权利要求1所述的方法,其中所述双链断裂点中的至少一个由外源基因组编辑试剂诱导。
6.如权利要求1所述的方法,其中所述双链断裂点中的至少一个由化学诱变剂或电离辐射诱导。
7.如权利要求1所述的方法,其中所述供体多核苷酸是双链供体多核苷酸。
8.如权利要求7所述的方法,其中所述双链供体多核苷酸包含5'或3'硫代磷酸酯连接。
9.如权利要求7所述的方法,其中所述双链供体多核苷酸包含5'和3'硫代磷酸酯连接。
10.如权利要求7所述的方法,其中所述双链供体多核苷酸包含钝的5'和3'端。
11.如权利要求7所述的方法,其中所述双链供体多核苷酸是5'磷酸化的。
12.如权利要求7-11中任一项所述的方法,其中所述双链供体多核苷酸的长度为20-
150bp。
13.如权利要求12所述的方法,其中所述双链供体多核苷酸的长度为25至50bp。
14.如权利要求12所述的方法,其中所述双链供体多核苷酸的长度为34bp。
15.如权利要求1所述的方法,其中所述供体多核苷酸是单链的。
16.如权利要求1所述的方法,其中所述扩增引物对的5'端与所述供体多核苷酸的相反链上的重叠区域杂交。
17.如权利要求16所述的方法,其中所述重叠区域的长度为1、2、3、4、5、6、7、8、9或10个核苷酸。
18.如权利要求1-15中任一项所述的方法,其中所述方法包括将包含所述插入的供体多核苷酸或其部分的环状基因组核酸片段线性化,并扩增该线性化的环状基因组核酸片段。
19.如权利要求18所述的方法,其中所述线性化包括切割所述插入的供体多核苷酸或其部分。
20.如前述权利要求中任一项所述的方法,其中所述片段化包括所述基因组DNA的随机剪切。
21.如权利要求1-19中任一项所述的方法,其中所述片段化包括使基因组DNA与核酸酶接触
22.如权利要求21所述的方法,其中使基因组DNA与核酸酶接触在适于产生约256bp的平均片段长度的条件下进行。
23.如权利要求21所述的方法,其中所述核酸酶切割四基对识别位点。
24.如权利要求2至23中任一项所述的方法,其中所述环化包括连接。
25.如前述权利要求中任一项所述的方法,其中检测扩增子包括在双链DNA扩增子的存在下检测插入染料的荧光增加。
26.如权利要求25所述的方法,其中定量所述混合物分区中所述插入染料的荧光增加,从而检测所述混合物分区中的扩增子的大小。
27.如前述权利要求中任一项所述的方法,其中所述方法还包括通过在特异性检测所述内源基因组序列的探针存在下扩增所述内源核酸序列来检测所述基因组的内源性核酸序列。
28.如权利要求1-26中任一项所述的方法,其中所述方法还包括检测与所述生物体的基因组异源并通过连接两个内源性非连续基因组核酸片段产生的异源序列,其中检测所述异源序列包括在存在特异性检测该异源序列的探针的情况下扩增该异源序列。
29.如权利要求27或28所述的方法,其中所述探针是解探针或分子信标。
30.如权利要求27或28所述的方法,其中所述探针检测靠近定靶基因组编辑试剂切割位点的序列。
31.如权利要求30所述的方法,其中所述方法包括计数含有扩增子和靠近定靶基因组编辑试剂切割位点的序列的混合物分区的数量,由此检测多个定靶基因组插入。
32.如权利要求31所述的方法,其中所述方法包括比较i)与ii)的比例,其中:
i)是包含扩增子和靠近定靶基因组编辑试剂切割位点的序列的多个混合物分区的数量;和
ii)是含有扩增子的混合物分区的数量,
从而通过基因组编辑试剂或方法确定定靶基因组编辑的比率。
33.如权利要求30所述的方法,其中所述方法包括计数含有扩增子并且不含靠近定靶基因组编辑试剂切割位点的序列的混合物分区的数量,由此检测多个脱靶基因组插入。
34.如权利要求33所述的方法,其中所述方法包括比较i)与ii)的比例,其中:
i)是包含扩增子并且不含靠近定靶基因组编辑试剂切割位点的序列的混合物分区的数量;和
ii)是含有扩增子的混合物分区的数量,
从而通过基因组编辑试剂或方法确定脱靶基因组插入的比率。
35.如前述权利要求中任一项所述的方法,其中所述多个混合物分区包括乳液液滴。
36.如权利要求1-32中任一项所述的方法,其中所述多个混合物分区包括微升,纳升、或皮升的孔或反应室。
37.一种用于检测或定量细胞基因组中的双链断裂点数量的方法,包括:
提供基因组核酸片段,其中所述基因组核酸片段的至少一部分包含插入的外源供体寡核苷酸;
对片段分区;
在适于选择性地扩增包括含插入的片段的分区的条件下孵育分区;
检测分区中的选择性扩增产物;和
定量其中检测到选择性扩增产物的分区的数量。

说明书全文

检测基因组编辑

[0001] 相关申请的交叉引用
[0002] 本申请要求于2015年3月17日提交的美国临时申请62/134,517号的优先权,该文通过引用全文纳入本文用于所有目的。

背景技术

[0003] 双链断裂点可以通过各种不同的机制在细胞的基因组中出现。例如,化学诱变剂,高强度磁场电离辐射可引入双链断裂点。作为另一个实例,可以通过各种基因组编辑试剂或方法将双链断裂点引入基因组。
[0004] 理想的基因组编辑试剂只会在基因组中的一个或多个“定靶”位点产生双链断裂点。然而,目前的基因组编辑试剂常在基因组中的一个或多个“脱靶”位点产生双链断点。在某些情况下,这种脱靶位点与定靶位点高度同源。对于已知序列并且具有少量高度同源的
脱靶部位的基因组,可以使用任何数量的可用方法鉴定和测定这种高度同源的脱靶位点。
然而,脱靶编辑的位置,数量和频率通常是不可预测的。此外,由化学诱变剂,高强度磁场或电离辐射引入的双链断裂本质上是不可预测的。
[0005] 通过全基因组下一代测序可以确定细胞整个基因组中双链断裂的定性和定量。然而,这可能是相当昂贵和耗时的,并且对于测定细胞群(例如,从生物体的样品获得的细胞群)或用于优化基因组编辑试剂和方法来说是不切实际的。
发明内容
[0006] 在第一方面,本发明提供定量细胞基因组中双链断裂点数量的方法,所述方法包括:a)从所述细胞提供基因组核酸,其中所述基因组核酸在细胞中的双链断点插入有外源
供体多核苷酸或其部分;b)将基因组核酸片段化以产生多个基因组核酸片段,其中至少一
个基因组核酸片段含有所述插入的供体多核苷酸或其部分;c)产生包含环状基因组核酸片
段和扩增引物对的多个混合物分区,其中所述扩增引物对与供体多核苷酸或其部分的相反
链互补,并且其中所述扩增引物对定向为使得,当在环化前与含有所述插入的供体多核苷
酸或其部分的基因组核酸片段杂交时,5'端彼此接近并且3'端彼此远离;d)用该扩增引物
对扩增基因组核酸片段,以选择性地在包括含有所述插入的供体多核苷酸或其部分的一个
或多个基因组片段的混合物分区中产生扩增子;e)检测扩增子;和f)计数含扩增子的混合
物分区的数量,从而定量细胞基因组中的双链断裂点的数量。
[0007] 在第二方面,本发明提供检测或定量细胞基因组中双链断裂点数量的方法,所述方法包括:提供基因组核酸片段,其中所述基因组核酸片段的至少一部分包含插入的外源
供体寡核苷酸;对片段分区;在适于选择性地扩增包括含插入的片段的分区的条件下孵育
分区;检测分区中的选择性扩增产物;和定量其中检测到选择性扩增产物的分区的数量。
[0008] 在一些实施方式中,生成包含循环基因组核酸片段的多个混合物分区包括使该基因组核酸片段环化,并将环化的基因组核酸片段划分成多个混合物分区。在一些实施方式
中,生成包含循环基因组核酸片段的多个混合物分区包括将所述基因组核酸片段划分成多
个混合物分区并使所述分区中的基因组片段环化。在一些实施方式中,所述方法还包括对
细胞群进行a)-f),从而定量细胞群的基因组中的双链断裂点的数量。在一些实施方式中,所述双链断点中的至少一个由外源基因组编辑试剂诱导。在一些实施方式中,所述双链断
裂点中的至少一个由化学诱变剂或电离辐射诱导。
[0009] 在一些实施方式中,供体多核苷酸是双链供体多核苷酸。在一些情况中,所述双链供体多核苷酸包含5'或3'硫代磷酸酯连接。在一些情况中,所述双链供体多核苷酸包含5'和3'硫代磷酸酯连接。在一些情况中,所述双链供体多核苷酸包含钝的5'和3'端。在一些情况中,所述双链供体多核苷酸是5’磷酸化的。在一些情况中,所述双链供体多核苷酸的长度为20-150bp。在一些情况中,所述双链供体多核苷酸的长度为25-50bp。在一些情况中,所述双链供体多核苷酸的长度为30-40bp。在一些情况中,双链供体多核苷酸的长度为34bp。
[0010] 在一些实施方式中,供体多核苷酸是单链。在一些实施方式中,所述扩增引物对的5'端与所述供体多核苷酸的相反链上的重叠区域杂交。在一些实施方式中,所述重叠区域
长度为1、2、3、4、5、6、7、8、9或10个核苷酸。在一些实施方式中,所述方法包括将包含所述插入的供体多核苷酸或其部分的环状基因组核酸片段线性化,并扩增该线性化的环状基因组
核酸片段。在一些情况中,所述线性化包括切割所述插入的供体多核苷酸或其部分。
[0011] 在一些实施方式中,所述片段化包括所述基因组DNA的随机剪切。在一些实施方式中,其中所述片段化包括使基因组DNA与核酸酶接触。在一些情况中,使基因组DNA与核酸酶接触在适于产生约256bp的平均片段长度的条件下进行。在一些情况中,核酸酶剪切(例如
识别并剪切)四基对识别位点。在一些情况中,环化包括连接。
[0012] 在一些实施方式中,检测扩增子包括在双链DNA扩增子的存在下检测插入染料的荧光增加。在一些情况中,定量所述混合物分区中所述插入染料的荧光增加,从而检测所述混合物分区中的扩增子的大小。在一些实施方式中,所述方法还包括通过在特异性检测所
述内源基因组序列的内源参照探针存在下扩增所述内源核酸序列来检测所述基因组的内
源性核酸序列。
[0013] 在一些实施方式中,所述方法还包括检测与所述生物体的基因组异源并通过连接两个内源性非连续基因组核酸片段产生的异源序列,其中检测所述异源序列包括在存在特
异性检测该异源序列的异源参照探针的情况下扩增该异源序列。在一些实施方式中,所述
方法还包括检测与所述生物体的基因组异源并通过环化(例如连接)基因组核酸片段产生
的异源序列,其中检测所述异源序列包括在存在特异性检测该异源序列的异源参照探针的
情况下扩增该异源序列。在一些情况中,参照探针是性探针或分子信标。
[0014] 在一些情况中,参照探针检测靠近定靶基因组编辑试剂切割位点的序列。在一些情况中,所述方法包括计数含有扩增子和靠近定靶基因组编辑试剂切割位点的序列的混合
物分区的数量,由此检测多个定靶基因组插入。在一些情况中,所述方法包括比较i)和ii)的比例,其中:i)是包含扩增子和靠近定靶基因组编辑试剂切割位点的序列的混合物分区
的数量;和ii)是含有扩增子的混合物分区的数量,从而通过基因组编辑试剂或方法确定定靶基因组编辑的比率。
[0015] 在一些实施方式中,所述方法包括计数含有扩增子并且不含靠近定靶基因组编辑试剂切割位点的序列的混合物分区的数量,由此检测多个脱靶基因组插入。在一些情况中,所述方法包括比较i)和ii)的比例,其中:i)是包含扩增子并且不含靠近定靶基因组编辑试剂切割位点的序列的混合物分区的数量;和ii)是含有扩增子的混合物分区的数量,从而通过基因组编辑试剂或方法确定脱靶基因组插入的比率。
[0016] 在一些实施方式中,所述多个混合物分区包括乳液液滴。在一些实施方式中,所述多个混合物分区包括微升、纳升、或皮升的孔或反应室。
[0017] 附图简要说明
[0018] 图1:描述用于定量细胞中双链断点的方法的流程图。在该实施方式中,将双链供体寡核苷酸(dsODN)插入到细胞基因组中的双链断点中。基因组DNA被分离,用识别四碱基
对切割位点的限制酶消化,通过连接环化,分成小滴,并通过选择性扩增含有dsODN或其部分的片段而进行定量。
[0019] 图2:描绘了用于检测基因组编辑试剂的脱靶基因组切割,基因组编辑试剂的定靶切割或其组合的各种扩增和检测方案。Rev和For分别表示反向和正向扩增引物。Pro表示选择性地检测靠近定靶基因组编辑试剂切割位点的序列的探针。
[0020] 图3:可以在用于检测脱靶和定靶基因组编辑的基于分区的试验中提供的数据的图示。在该实施方式中,双阳性分区表现出用于在第一检测通道(Ch1)中扩增含有dsODN的
片段的阳性信号(例如通过插入染料检测)。如果片段还包含在第二检测通道(Ch2)中靠近
定靶基因组编辑试剂切割位点的序列(例如由核酸探针检测到),则双阳性分区可以表现出
不同的阳性信号。在两个检测通道中存在阳性信号可以指示dsODN的定靶插入,因此可以进行定靶编辑。单阳性分区可以显示针对在第一检测通道中扩增含有dsODN的片段的阳性信
号(例如,通过插入染料检测),但是缺少针对靠近定靶基因组编辑试剂切割位点的序列的
阳性信号。这样的单个阳性分区对应于脱靶切割和/或编辑位点。
[0021] 图4:描述细胞基因组中双链断裂点的定量试验的一部分的实施方式。在该实施方式中,将基因组DNA片段化,分成液滴,然后进行环化。实线表示基因组DNA。虚线表示插入的外源供体寡核苷酸。
[0022] 图5:描述细胞基因组中双链断裂点的定量试验的一部分的实施方式。在该实施方式中,包含含有插入的外源供体的环化基因组DNA片段的分区经历使用重叠的扩增引物的
扩增条件。引物与靶序列的相反链杂交,其5'端重叠。
[0023] 图6:描绘了一种替代实施方式,其中用限制酶切割环化片段,其切割外源供体寡核苷酸内的序列。与外源供体寡核苷酸的已知序列(虚线)互补的正向和反向引物(箭头)使
得能够选择性扩增含有外源供体寡核苷酸的基因组片段。可以在初始分区中执行线性化,
或者在分区已组合(例如,液滴破碎)之后执行。在某些情况下,可以重新划分线性化的片
段。
[0024] 定义
[0025] 除非另外定义,本文中使用的所有技术和科学术语具有本领域普通技术人员通常所理解的同样含义。参见例如Lackie,DICTIONARY OF CELLAND MOLECULAR BIOLOGY(《细胞和分子生物学词典》),埃尔斯威尔出版社(Elsevier)(第4版2007);Sambrook等,MOLECULAR CLONING,A LABORATORY MANUAL《( 分子克隆,实验室手册》),冷泉港实验室出版社(冷泉港,纽约1989)。术语“一个”或“一种”意在表示“一个(种)或多个(种)”。当术语“包含”及其各种变体例如“包括”和“含有”位于叙述步骤或要素之前的时候,是用来表示添加其它的步骤或要素是任选的,并且是非排它性的。本发明的实践中可以使用与本文所述类似或等价的任
何方法、装置和材料。本文提供的以下定义是用来帮助理解本文经常用到的某些术语,不对本发明的范围构成限制。
[0026] 如本文所用,术语“双链断裂”,“双链断裂点”等指细胞中双链基因组DNA的切割位点,其中在双链基因组DNA的相反链上的近端磷酸二酯键对被水解。可以例如通过限制性内切核酸酶、Cas9核酸酶、切口酶(例如TALEN、锌指或CRISPR/Cas基切口酶)、化学诱变剂、电离辐射或高强度磁场产生这种双链断裂。通常,双链基因组DNA的相反链上的水解的近端磷酸二酯键对彼此在约1,000;900,800,700,600,550,500,450,400,350,300,250,200,150,100,75,50,25,18,15,14,13,12,11,10,9,8个,7个,6个,5个,4个,3个,2个或1个核苷酸之内。
[0027] 如本文所用,术语“基因组编辑试剂”是指能够特异性切割或切开基因组序列以产生双链断裂的试剂(例如,通常含有核酸酶或切口酶的试剂)。可引入双链断裂点的示例性基因组编辑试剂包括但不限于,CRISPR/Cas9试剂,TALENS,锌指核酸酶,工程化大范围核酸酶及其组合。在一些情况下,基因组编辑试剂含有或包括能够将近端切口位点特异性引入
基因组序列的靶向的切口酶对。基因组编辑试剂可以被配置为引入可以插入外源供体寡核
苷酸的切割或缺口对位点。
[0028] 如本文所用,“定靶”基因组编辑试剂切割位点是指与基因组编辑试剂靶向的切割位点完全同源的基因组编辑试剂切割位点。类似地,“脱靶”基因组编辑试剂切割位点是指因1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个取代、缺失或插入而与目标位点不同的切割位点。
[0029] 如本文所用,术语“线性化”是指通过将片段的两个自由端接合(例如,连接)而被环化,然后通过切割环化的基因组核酸片段进行线性化的基因组核酸片段。环化基因组核酸片段可以通过在环化片段中切割插入的供体寡核苷酸而线性化。相反,术语“线性”是指未被环化的基因组核酸片段。
[0030] 本文所用术语“划分”、“分区”或“划分的”、“分区的”指将样品分为多个部分或多个分区或“混合物分区”。混合物分区可以是固体或流体。在一些实施方式中,混合物分区是固体分区,例如微通道、微孔或微胶囊。在一些实施方式中,混合物分区是流体分区,例如液滴。在一些实施方式中,流体分区(如液滴)是不互溶的流体(如水和油)的混合物,或乳液。在一些实施方式中,流体分区(如液滴)是水性液滴,其被不互溶的运载体流体(如油)包围。
在其它实施方式中,液体分区是与相邻水性液滴在物理或化学上分开的水性液滴,使得一
个液滴的内容物不会扩散到相邻液滴中。
[0031] 核酸或其部分与另一核酸“杂交”的某些条件使得生理缓冲液(例如,pH 6-9,25-150mM盐酸盐)中限定温度下的非特异性杂交最少。在一些情况中,核酸或其部分与一组靶
核酸之间共有的保守序列杂交。在一些情况中,如果包括与超过一个核苷酸伴侣互补的“通用”核苷酸在内有至少约6、8、10、12、14、16或18个连续的互补核苷酸,引物或其部分能杂交至引物结合位点。或者,如果在至少约12、14、16或18(例如10-50,12-35,15-35,12-30,15-
30,12-25,15-25,12-18,或15-18)个连续的互补核苷酸中有不到1或2个互补错配,引物或
其部分能杂交至引物结合位点。在一些实施方式中,发生特异性杂交的限定温度是室温。在一些实施方式中,发生特异性杂交的限定温度高于室温。在一些实施方式中,发生特异性杂交的限定温度至少约37、40、42、45、50、55、60、65、70、75或80℃。在一些实施方式中,发生特异性杂交的限定温度是37、40、42、45、50、55、60、65、70、75或80℃。在一些实施方式中,发生特异性杂交的限定温度是45-75℃、45-70℃、45-65℃、45-60℃、45-55℃、50-75℃、50-70℃、50-65℃、50-60℃或50-55℃。
[0032] 本文所用的“核酸”表示DNA、RNA、单链、双链、或更高度聚集的杂交基序及其任意化学修饰。修饰包括但不限于,提供整合入其它电荷、极化性、氢键、静电相互作用、与核酸配体碱基或核酸配体整体的连接点和作用点的化学基团的那些修饰。这类修饰包括但不限于,肽核酸(PNA)、磷酸二酯基团修饰(例如,硫代磷酸酯、甲基膦酸酯)、2'-位糖修饰、5-位嘧啶修饰、8-位嘌呤修饰、环外胺处的修饰、4-硫尿核苷的取代、5-溴或5-碘-尿嘧啶的取代、骨架修饰、甲基化、不常见的碱基配对组合如异碱基(isobases)、异胞苷和异胍
(isoguanidine)等。核酸也可包含非天然碱基,如硝基吲哚。修饰还可包括3'和5'修饰,包括但不限于用荧光团(例如,量子点)或其他部分加帽。
[0033] 术语“探针”指与目标分子特异性相互作用或特异性结合目标分子的分子(例如蛋白质、核酸、适体等)。与目标分子特异性相互作用或特异性结合目标分子的分子的非限制性示例包括核酸(如寡核苷酸)、蛋白质(如抗体、转录因子、锌指蛋白、非抗体蛋白支架等)和适体。探针可被偶联(例如共价偶联至可检测标记物)。
[0034] 术语“基因组核酸”,“基因组DNA”等是指细菌或真核DNA。基因组DNA可以是来自细胞染色体的一个或多个或全部的DNA。基因组DNA可以进一步地或者可选地包括来自细胞的一个或多个或全部的细胞器的DNA。
[0035] 术语“标记物”和“可检测标记物”可互换地指可通过光谱、光化学、生物化学、免疫化学、化学或其它物理手段检测的组合物。例如,可用的标记物包括荧光染料、发光剂、放射性同位素(如32P、3H)、高电子密度试剂、酶、生物素、地高辛或半抗原以及可被检测的蛋白质、核酸或其他实体,例如通过将放射性标记物整合至与目标分子特异性反应的探针(例如寡核苷酸、抗体或肽)中。可以采用本领域已知的用于使抗体偶联所述标记物的任何方法,例如,使用如下文献中所述的方法:Hermanson,《生物结合技术》(Bioconjugate Techniques)1996,圣迭戈的学术出版社有限公司(Academic Press,Inc.)。
[0036] “连接”至标记物的分子(例如本文所述经标记探针)是共价(通过接头或化学键)或非共价(通过离子、范德华、静电或氢键)地结合标记物的分子,从而可通过检测与该分子结合的标记物来检测是否存在该分子。
[0037] 在外源供体寡核苷酸的上下文中,术语“外源性”是指不是天然存在于细胞基因组中的供体寡核苷酸。外源供体寡核苷酸可以通过例如细胞的非同源端接合或同源性定向修复途径的一种或多种组件或活性而插入细胞基因组中的双链断裂点。

具体实施方式

[0038] 本文描述了用于测定细胞基因组中或细胞群的基因组中的双链断裂的方法和组合物(参见例如图1)。本文描述的方法和组合物可用于评估外源性损伤的毒性(例如,暴露
于化学诱变剂,强磁场或电离辐射)。本文所述的方法和组合物也可用于评估或优化基因组编辑试剂或方法的保真度。例如,可以在细胞或细胞群上进行基因组编辑,并且本文所述的方法或组合物可用于检测和/或定量定靶或脱靶基因组编辑或其组合。本文所述的方法和
组合物还可用于定量或监测宿主生物体中基因组编辑的细胞的数量或频率。
[0039] 所述方法包括提供包含插入的供体多核苷酸的基因组DNA,并产生其中包含插入的DNA片段被选择性扩增(例如通过反向PCR)并通过划分进行定量的条件。
[0040] I.方法
[0041] 本文描述的是定量细胞基因组中的双链断裂点的方法。这样的定量可以包括一个或多个以下步骤:a)从所述细胞提供基因组核酸,其中所述基因组核酸在细胞中的双链断
点插入有外源供体多核苷酸或其部分;b)将基因组核酸片段化以产生多个基因组核酸片
段,其中至少一个基因组核酸片段含有所述插入的供体多核苷酸或其部分;c)产生含有环
形或线性化基因组核酸片段和扩增引物或扩增引物对的多个混合物分区,所述引物或引物
对适于在含有插入的供体多核苷酸或其部分的基因组核酸片段的分区中选择性扩增靶模
板;d)在一定条件下用该扩增引物或扩增引物对扩增基因组核酸片段,以选择性地在包括
含有所述插入的供体多核苷酸或其部分的一个或多个基因组片段的混合物分区中产生扩
增子;e)检测扩增子;和f)计数含扩增子的混合物分区的数量,从而定量细胞基因组中的双链断裂点的数量。
[0042] a)提供来自细胞或细胞群的基因组核酸
[0043] 基因组核酸可以从各种细胞提供。例如,细胞或细胞群可能受到外源性损伤,例如化学诱变剂,强磁场或电离辐射。作为另一个实例,细胞或细胞群可以与基因组编辑试剂接触。示例性的基因组编辑试剂包括但不限于CRISPR/Cas9试剂(例如CRISPR/Cas9核酸酶,切口酶或切口酶对),TALENS(例如,TALEN核酸酶,切口酶或切口酶对),锌指核酸酶(例如锌指核酸酶,切口酶或切口酶对),工程改造的大范围核酸酶(例如大范围核酸酶,切口酶或切口酶对)及其组合。示例性的CRISPR/Cas9试剂包括但不限于下述中描述的那些:美国专利申请号:2014/0248702;2014/0315985;2013/0130248;和2014/0068797;美国专利号8,697,
359;和Ran等,Nature.2015年4月9日;520(7546):186-91,Zetsche等,Cell.2015年10月22
日;163(3):759-71,和Slaymaker等,Science.2016年1月1日;351(6268):84-8。示例性的
TALEN试剂包括但不限于在Miller等,Nat Biotechnol.2011年2月;29(2):143-8中所述的
那些。
[0044] 外源性损伤或基因组编辑试剂可以在一个或多个细胞中引入一个或多个双链断裂点。外源供体多核苷酸可以同时或依次与一个或多个细胞接触。接触可以在适于将供体
多核苷酸插入一个或多个双链断裂点的条件下进行。然后可以从一个或多个细胞获得基因
组核酸,并提供用于如本文所述的双链断裂点试验。
[0045] 细胞或细胞群可以受到外源性损伤或者体外或体内与基因组编辑试剂接触。例如,原代细胞或细胞系可能受到外源性损伤或体外与基因组编辑试剂接触。原代细胞可以
从宿主中提取并经受外源性损伤或与基因组编辑试剂接触,然后根据本文所述的一种或多
种方法测定双链断裂点。外源供体多核苷酸可以同时或依次与一个或多个细胞接触。在一
些情况下,外源供体多核苷酸可以在与基因组编辑试剂接触之前与一种或多种细胞接触,
使得在编辑试剂切割期间存在足够的供体多核苷酸。一个或多个细胞与供体多核苷酸的接
触可以在适于将供体多核苷酸插入一个或多个双链断裂点的条件下进行。
[0046] 作为另一个例子,宿主生物体可能受到外源性损伤(例如,暴露于化学诱变剂,强磁场或电离辐射)或与基因组编辑试剂接触,然后可以提取和分析细胞以确定双链断裂点
的数量或频率。在一些情况下,在宿主受到外源性损伤或在适合于将供体多核苷酸插入一
个或多个双链断裂点的条件下与基因组编辑试剂接触之后,从宿主中提取原代细胞,然后
一部分细胞可以根据本文所述的一种或多种方法测定双链断裂点。在一些情况下,提取的
细胞的其余部分用于额外的或替代的应用。例如,可以测定其余的提取细胞的增殖,增殖潜力,活力,细胞毒活性等。在一些情况下,在进行基因组编辑之前或之后,从宿主中提取细胞,对一部分基因组编辑的细胞测定定靶和/或脱靶编辑,并且一部分基因组编辑的细胞被引回到相同或不同的宿主。
[0047] 在一些情况下,将含有供体多核苷酸(例如,来自宿主或异源细胞的细胞)的编辑的细胞引入宿主中,随后从宿主获得一个或多个样品。可以使用本文所述的方法来测定来
自一个或多个样品的细胞,以监测或测定宿主中编辑的细胞的数量或频率。
[0048] 基因组DNA可以根据需要从细胞中纯化。
[0049] b)片段化基因组核酸
[0050] 基因组核酸可以通过本领域已知的多种方法进行片段化。例如,基因组核酸可以通过物理,化学或酶学方法进行片段化。物理剪切可以包括超声处理、雾化(例如,如WO/
1992/007091所述)、使含有核酸的液体培养基通过高压孔(例如使用法国压力机)、流体力
学剪切或高效液相色谱法。酶切片段化可以用核酸酶进行。在一些情况下,用非特异性核酸酶如DNA酶I或微球菌核酸酶进行片段化。在一些情况下,用一种或多种限制性内切酶进行
片段化(参见例如图4)。示例性核酸酶或核酸酶混合物还包括但不限于含有T7-内切酶,非
特异性核酸酶创伤弧菌,片段酶(NEB),转座酶或其组合的那些。片段化的基因组核酸可以是单链或双链的,或其组合。
[0051] 在一个实施方式中,在dUTP存在下扩增基因组核酸,并将所得的含有尿嘧啶的扩增的基因组核酸与尿嘧啶DNA糖基化酶接触以获得片段。在一些情况下,在dUTP存在下,基因组核酸在扩增前被片段化。例如,基因组核酸可以在适于产生大片段的条件(例如平均尺寸为长度至少约1,000;2,000;5,000;10,000;30,000碱基对或更大的片段)下进行片段化。
可以任选地纯化大片段,并在dUTP存在下扩增以纳入尿嘧啶。然后可以将扩增子与尿嘧啶
DNA糖基化酶接触以获得较小的片段。
[0052] 在一些实施方式中,片段化导致单链端或双链端,邻近所述端的序列是随机的或未知的。与端相邻的序列可以是或至少2个碱基,3个碱基,4个碱基,5个碱基,6个碱基,8个碱基,10个碱基,20个碱基,30个碱基或50个碱基。这种随机或未知的片段端可以通过例如物理剪切基因组核酸,使核酸与非特异性核酸酶接触或使纳入尿嘧啶的基因组核酸扩增子
片段化来获得。
[0053] 在一些实施方式中,片段化导致单链端或双链端,邻近所述端的序列是已知的或非随机的。与端相邻的序列可以是或至少2个碱基,3个碱基,4个碱基,5个碱基,6个碱基,8个碱基,10个碱基,20个碱基,30个碱基或50个碱基。这种非随机或已知的片段端可以通过例如使核酸与一种或多种限制性核酸内切酶接触来获得。在一个实施方式中,基因组核酸
通过在插入的外源供体多核苷酸的区域处或内不发生片段化的方法进行片段化。例如,基
因组核酸可以用在外源供体多核苷酸序列内不裂解的一种或多种限制性内切核酸酶进行
片段化。
[0054] 片段化可以在适于产生片段大小或片段大小范围的条件下进行。片段大小或片段大小范围可以是片段大小或片段大小范围的平均值(例如,平均值或中值)。例如,片段大小可以是或约为50、75、100、100、150、150、175、200、225、250、256、275、300、325、300、325、
350、375、4400、450、425、450、475、500、525、550、575、600、650、700、750、800、850、900、950或1000个碱基或碱基对或更多。作为另一个实例,片段大小范围可以是或大约为50、75、
100、125、150、175、2200、225、250、256、275、300、325、350、4400、425、450、475或500个碱基或碱基对至约75、100、125、150、175、200、225、250、256、275、300、325、350、4400、425、450、
475、500;525、550、575、600、650、700、750、800、800、890、900、950或1000个碱基或碱基对,或更多。
[0055] 在一些实施方式中,基因组核酸被选择用于提供一个或多个前述片段大小或大小范围的一种或多种限制性内切核酸酶片段化。在一些情况下,基因组核酸用识别和切割四
碱基对位点的限制性内切核酸酶片段化。假设基因组中有随机分布的核苷酸,这样的“四切割器”预期产生平均约44的片段大小范围,等于256碱基对。在一些情况下,基因组核酸被一种或多种限制性内切核酸酶片段化以提供一个或多个前述片段大小或大小范围,以及互补
或部分互补的单链突出端。这样的“粘性端”可以促进片段的环化(例如,在有限稀释或分区中的分子内环化)。
[0056] 在一些情况下,片段化在适于产生一个或多个前述片段大小或片段大小范围的条件下进行。例如,可以改变物理剪切的温度,时间,程度或强度,核酸内切酶浓度或尿嘧啶掺入量(例如通过纳入反应中的尿嘧啶的浓度来进行控制),以获得所需的片段大小或片段大
小范围。可以处理由一种或多种酶片段化的基因组核酸,以使片段化酶失活。例如,如果片段化酶是金属依赖性的,则基因组核酸可以与螯合剂接触。作为另一个实例,片段化酶可以被热灭活。在一些情况下,将基因组核酸与一种或多种前述特异性或非特异性片段化酶接
触,然后当实现所选择的片段大小或尺寸范围时,片段化酶失活。
[0057] 在一些情况下,将基因组核酸片段化,然后提取或纯化选定的片段大小或片段大小范围。提取或纯化选定的片段大小或大小范围的方法包括UPLC,尺寸排阻层析,凝胶电
泳,固相可逆固定化(例如,使用 XP珠),毛细管电泳等。所选择的片段大小或片
段大小范围可以在与一种或多种其它片段化酶灭活方法或一种或多种核酸纯化方法结合
之前、之后或同时进行提取或纯化。
[0058] 可以纯化片段化的基因组核酸。用于纯化片段化的基因组核酸的方法和组合物包括但不限于苯酚,氯仿或苯酚:氯仿:异戊醇提取;乙醇或异丙醇沉淀;阴离子交换色谱;胶色谱;固相可逆固定;HPLC,尺寸排阻层析,凝胶电泳,毛细管电泳或其组合。片段化的基因组核酸可以在与一种或多种其它片段酶灭活方法或一种或多种片段大小或片段大小范
围提取方法之前、之后或同时进行纯化。
[0059] c)产生多个混合物分区
[0060] 片段化的基因组核酸可以分成多个混合物分区。用于划分样品(例如,片段化的基因组核酸的样品)的方法和组合物描述于例如公开的专利申请WO 2010/036,352,US 2010/
0173,394,US 2011/0092,373和US 2011/0092,376中,其全部内容通过引用并入本文。多个混合物分区可以是多个乳液液滴,或多个微孔等。
[0061] 片段化的基因组核酸可以在环化之前或在环化之后分区。例如,基因组核酸片段可以被环化,然后分成多个混合物分区。作为另一个实例,基因组核酸片段可以划分成多个混合物分区并在其中进行环化。可以通过使用DNA连接酶连接进行基因组片段的环化。在一些实施方式中,在分区之前在稀释条件下进行环化,使得分子内环化对于分子间环化有利。
在一些实施方式中,在使得至少或至少约10%、20%、25%、30%、35%、40%、45%、50%、
55%、60%65%、70%、75%、80%、85%、90%、95%、97.5%、98%、99%、99.5%、99.75%、
99.9%或更多的环化是分子内的条件下进行环化。在一些实施方式中,全部或基本上全部
的环化是分子内的。
[0062] 在一些实施方式中,将基因组核酸片段环化以产生环状基因组核酸片段,然后通过在包含在供体多核苷酸内的序列处切割这种该环化的基因组核酸片段来使包含插入的
外源供体多核苷酸的部分基因组核酸片段线性化。在某些情况下,分区前进行环化和线性
化。在某些情况下,在分区之前执行环化、划分环化片段,然后在分区中执行线性化。在某些情况下,分区中进行环化和线性化。线性化可以使用例如在供体寡核苷酸序列中识别和切
割的限制性内切核酸酶进行。
[0063] 可将基因组核酸片段(例如,环化,线性或线性化)与一种或多种扩增引物,探针,酶或其组合混合,然后分区。另外或可替代地,基因组核酸片段(例如,环化,线性或线性化的)可以划分成混合物分区,其含有一个或多个扩增引物,探针,酶或它们的组合。另外或替代地,可以将基因组核酸片段(例如,环化,线性或线性化,并且任选与一个或多个扩增引物,探针或酶组合)划分成多个混合物分区,然后一个或多个扩增引物,探针,酶或其组合可被引入到多个混合物分区中。将试剂(例如,基因组片段,探针,酶,引物,盐,缓冲液,二价阳离子等)递送到一个或多个混合物分区的方法和组合物包括本领域已知的微流体方法;液滴或微胶囊合并,聚结,熔化,破裂或降解(例如,如US2015/0027,892;US 2014/0227,684;
WO 2012/149,042和WO 2014/028,537中所述);液滴注入方法(例如WO 2010/151,776中所
述);及其组合。
[0064] 如本文所述,混合物分区可以是皮孔、纳米孔或微孔。混合物分区可以是皮反应室、纳米反应室或微反应室,例如皮胶囊、纳米胶囊或微胶囊。混合物分隔可以是皮通道、纳米通道或微通道。混合物分区可以是液滴,例如乳液液滴。
[0065] 基因组核酸的片段(例如,环化,线性或线性化的)可被划分成任何数量的分区。一般地,选择分区的数量以确保少数、明显少数、很少、基本没有或没有分区含有多个基因组核酸片段。因此,在单个分区中扩增后存在多个扩增子或可检测信号可以指示一个或多个可检测序列元件存在于相同的片段中。确保适当分区所需的分区数量取决于许多因素,包
括但不限于:(a)要查询的基因组的大小和/或数量;(b)片段化方法;(c)产生的基因组核酸片段的数量和大小;(d)双链断裂点分析的所需分辨率;和(e)所需的统计学显著性。一般而言,分区的数量为至少约500、1000、10000或20000、30000、50000或更多。
[0066] 在一些实施方式中,诸如基因组核酸片段(例如,环化,线性或线性化),缓冲液,酶(例如用于扩增和/或测序的聚合酶,连接酶,或其组合),底物,核苷酸,探针,引物,盐等在分区前混合在一起,然后将样品分区。在一些情况中,试剂包括连接酶和/或聚合酶并且在将试剂混合在一起之后不久划分样品,使得基本上全部、或大部分的连接酶和/或聚合酶活性出现在划分之后。在其它情况中,在连接酶和/或聚合酶缓慢或完全不进行的温度下混合试剂,然后划分样品,并且调节反应温度以使连接和/或聚合酶反应进行。例如,可在上、小于5℃、或0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20-25、25-30或30-35℃或更高温度下合并试剂。一般而言,本领域技术人员会知晓如何选择温度,在该温度下,一种或多种连接酶或聚合酶没有活性或有最低的活性。在一些情况中,采用温度和时间的组合以避免划分之前的明显连接和/或聚合。
[0067] 在一些情况下,可以使用一种或多种热启动连接酶和/或聚合酶(例如热起始DNA依赖性DNA聚合酶或热启动连接酶)混合试剂。因此,可将基因组核酸片段、探针、缓冲液、盐、核苷酸、标记、酶等混合并分区。随后,可通过加热分区混合物以激活这一种或多种热启动的酶来引发连接和/或聚合反应,包括多轮聚合和/或扩增。
[0068] 另外,试剂可混合在一起,而没有一种或多种引发酶促反应(例如,聚合、连接和/或扩增)所必需的试剂。混合物然后可被划分到一组第一分区混合物中,然后可通过融合这组第一分区混合物和提供必要试剂的一组第二分区混合物来提供一种或多种必要试剂。替代地,可向第一分区混合物中加入必要试剂,而不形成第二分区混合物。例如,必要试剂可分散到第一分区混合物油包水液滴的组中。作为另一个示例,缺失的试剂可加入含有所述
第一分区混合物组的一组微通道中。
[0069] 在一些实施方式中,试剂可混合在一起以形成反应混合物并被划分。随后,可向分区中加入一种或多种其它试剂。例如,可向分区中注射一种或多种试剂。在一些情况中,可向分区和流体之间的界面施加电场以打破界面并使至少一部分的流体进入分区。作为另一个示例,一种或多种试剂可通过微流体技术导向微米或纳米尺寸孔中的分区中。用于向分
区注射试剂的方法、组合物和装置包括但不限于WO/2010/0151,776所述的那些。
[0070] 可通过融合分区、注射、微流体或其它方式加入的试剂包括但不限于连接试剂(如连接酶),扩增试剂(如一种或多种扩增引物或聚合酶),检测试剂(例如,插入染料或核酸探针),测序试剂或其组合。作为一个示例,可向分区中加入DNA依赖性DNA聚合酶(和任选的一种或多种引物)以扩增分区中的核酸片段,或其部分。
[0071] 在一些实施方式中,液滴包含乳液组合物,即不互溶的流体(如水和油)的混合物。在一些实施方式中,液滴是水性液滴,其被不互溶的运载体流体(如油)包围。在一些实施方式中,液滴是油性液滴,其被不互溶的运载体流体(如水性溶液)包围。在一些实施方式中,本文所述液滴是相对稳定的并在两种或更多种液滴之间具有最小聚结。在一些实施方式
中,由样品生成的液滴中少于0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、
0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%与其他液滴聚结。这些乳液还可具有有限的絮凝,一种分散相从薄片中悬浮液产生的过程。在一些情况下,这种稳定性或最小的聚结维持长达4、6、8、10、12、24或48小时或更长(例如,在室温或约0、2、4、6、8、10或12℃)。
[0072] 在一些实施方式中,使油相流过包含待检测基因组核酸片段的水性样品,从而形成液滴。在一些实施方式中,包含待检测的基因组核酸片段的水性样品还包含缓冲的溶液
和插入染料。在一些实施方式中,包含待检测的基因组核酸片段的水性样品还包括缓冲的
溶液,任选的插入染料,和用于检测一种或多种DNA序列元件(例如内源或异源DNA序列元
件)的一种或多种探针。
[0073] 该油相可包含氟化基础油,其可通过与氟化表面活性剂(如全氟聚醚)联用而进一步稳定。在一些实施方式中,该基础油包括以下一种或多种:HFE 7500、FC-40、FC-43、FC-70或另一种常见氟化油。在一些实施方式中,该油相包含阴离子含氟表面活性剂。在一些实施方式中,该阴离子含氟表面活性剂是Ammonium Krytox(Krytox-AS)、Krytox FSH的铵盐或
Krytox FSH的吗啉代衍生物。Krytox-AS的浓度可以是约0.1%、0.2%、0.3%、0.4%、
0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、2.0%、3.0%或4.0%(w/w)。在一些实施方式中,Krytox-AS的浓度是约1.8%。在一些实施方式中,Krytox-AS的浓度是约1.62%。Krytox 
FSH的吗啉代衍生物的浓度可以是约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、
0.8%、0.9%、1.0%、2.0%、3.0%或4.0%(w/w)。在一些实施方式中,Krytox FSH的吗啉代衍生物的浓度是约1.8%。在一些实施方式中,Krytox FSH的吗啉代衍生物的浓度是约
1.62%。
[0074] 在一些实施方式中,该油相还包含用于调节油性质(如蒸气压、粘度或表面张力)的添加剂。非限制性示例包括全氟辛醇和1H,1H,2H,2H-全氟癸醇。在一些实施方式中,1H,
1H,2H,2H-全氟癸醇添加至约0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、
0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.25%、1.50%、1.75%、2.0%、
2.25%、2.5%、2.75%或3.0%(w/w)的浓度。在一些实施方式中,1H,1H,2H,2H-全氟癸醇添加至约0.18%(w/w)的浓度。
[0075] 在一些实施方式中,该乳液配制为生成具有类液界面膜的高度单分散液滴,其可通过加热转化为具有类固界面膜的微胶囊;这类微胶囊可作为生物反应器以通过一段时间
的孵育保持其含量。转化为微胶囊可在一经加热后即发生。例如,这类转化可发生在大于约
40°、50°、60°、70°、80°、90°或95℃的温度下。加热过程期间,流体或矿物油覆盖物可用于阻止蒸发。过量的连续相油可在加热前去除或留在原位。这些微胶囊可在大范围的热和机械
处理下抗聚结和/或絮凝。
[0076] 在将液滴转化成微胶囊之后,这些微胶囊可储存于约-70°、-20°、0°、3°、4°、5°、6°、7°、8°、9°、10°、15°、20°、25°、30°、35°或40℃下。在一些实施方式中,这些微胶囊可用于储存或运输分区混合物。例如,可在一个位置处收集样品,划分到含有酶、缓冲剂和/或引物或其它探针的液滴中,任选地可进行一个或多个聚合反应,然后可加热该分区以进行微囊
化,并且可储存或运输微胶囊用于进一步分析。
[0077] 这些微胶囊分区可含有一种或多种探针(如本文所述经标记探针)并可抗聚结,特别是在高温下。因此,这些胶囊可在非常高的密度(例如每单位体积的分区数)下孵育。在一些实施方式中,可每毫升孵育超过100000、500000、1000000、1500000、2000000、2500000、
5000000或10000000个分区。在一些实施方式中,样品-探针孵育发生在单个孔中,例如微量滴定板的孔,此时各分区之间不具有内部混合。这些微胶囊还可含有孵育所需的其他组分。
[0078] 在一些实施方式中,将基因组核酸片段分为至少500个分区、1000个分区、2000个分区、3000个分区、4000个分区、5000个分区、6000个分区、7000个分区、8000个分区、10,000个分区、15,000个分区、20,000个分区、30,000个分区、40,000个分区、50,000个分区、60,
000个分区、70,000个分区、80,000个分区、90,000个分区、100,000个分区、200,000个分区、
300,000个分区、400,000个分区、500,000个分区、600,000个分区、700,000个分区、800,000个分区、900,000个分区、1,000,000个分区、2,000,000个分区、3,000,000个分区、4,000,
000个分区、5,000,000个分区、10,000,000个分区、20,000,000个分区、30,000,000个分区、
40,000,000个分区、50,000,000个分区、60,000,000个分区、70,000,000个分区、80,000,
000个分区、90,000,000个分区、100,000,000个分区、150,000,000个分区、或200,000,000个分区。
[0079] 在一些实施方式中,该基因组核酸片段样品被划分到足够数量的分区中,使得全部、基本全部或至少大部分分区具有不超过5个基因组核酸片段(例如约0.5、1、2、3、4或5个基因组核酸片段分子)。在一些实施方式中,该样品被划分到足够数量的分区中,使得全部、基本全部或至少大部分分区含有不超过1个基因组核酸片段(例如约0.05、0.1、0.2、0.3、
0.4、0.5、0.75或1个基因组核酸片段分子)。在一些实施方式中,各分区中存在平均不超过
5、4、3、2、1、0.75、0.5、0.4、0.3、0.2、0.1或0.05个基因组核酸片段分子。在一些实施方式中,各分区中存在平均约0.05、0.1、0.2、0.3、0.4、0.5、0.75、1、2、3、4或5个基因组核酸片段分子。在一些实施方式中,在含有基因组核酸片段分子的分区群中,分区中基因组核酸片段分子的模数为1或0。
[0080] 在一些实施方式中,分区含有过量的检测试剂。例如,在一些实施方式中,分区含有平均超过约1(例如,1、2、3、4、5、6、7、8、10、12、15、20、40、50、100、150、200、250、300、350、400、500、750、1000或更多)种引物、引物对、或用于检测靶DNA序列元件的探针分子(例如内源、外源或异源DNA序列元件)或其组合。在一些实施方式中,分区中存在用于检测多种靶
DNA序列元件的多种检测试剂。例如,可在一个或多个分区中检测1、2、3、4、5、6、7、8、9、10或更多种不同的靶DNA序列元件。
[0081] 在一些实施方式中,生成的液滴在形状和/或尺寸方面基本均匀。例如,在一些实施方式中,这些液滴在平均直径方面基本均匀。在一些实施方式中,生成的液滴的平均直径为约0.001微米、约0.005微米、约0.01微米、约0.05微米、约0.1微米、约0.5微米、约1微米、约5微米、约10微米、约20微米、约30微米、约40微米、约50微米、约60微米、约70微米、约80微米、约90微米、约100微米、约150微米、约200微米、约300微米、约400微米、约500微米、约600微米、约700微米、约800微米、约900微米或约1000微米。在一些实施方式中,生成的液滴的平均直径为小于约1000微米、小于约900微米、小于约800微米、小于约700微米、小于约600微米、小于约500微米、小于约400微米、小于约300微米、小于约200微米、小于约100微米、小于约50微米,或小于约25微米。在一些实施方式中,生成的液滴在形状和/或尺寸方面是不均匀的。
[0082] 在一些实施方式中,生成的液滴在体积上基本均匀。例如,液滴体积的标准偏差可以低于约1皮升、5皮升、10皮升、100皮升、1nL或低于约10nL。在一些情况中,液滴体积的标准偏差可低于平均液滴体积的约10-25%。在一些实施方式中,生成的液滴的平均体积为约0.001nL、约0.005nL、约0.01nL、约0.02nL、约0.03nL、约0.04nL、约0.05nL、约0.06nL、约
0.07nL、约0.08nL、约0.09nL、约0.1nL、约0.2nL、约0.3nL、约0.4nL、约0.5nL、约0.6nL、约
0.7nL、约0.8nL、约0.9nL、约1nL、约1.5nL、约2nL、约2.5nL、约3nL、约3.5nL、约4nL、约
4.5nL、约5nL、约5.5nL、约6nL、约6.5nL、约7nL、约7.5nL、约8nL、约8.5nL、约9nL、约9.5nL、约10nL、约11nL、约12nL、约13nL、约14nL、约15nL、约16nL、约17nL、约18nL、约19nL、约20nL、约25nL、约30nL、约35nL、约40nL、约45nL或约50nL。
[0083] d)扩增
[0084] 进行扩增以选择性地扩增含有插入的供体多核苷酸的片段。这通过使用在插入的供体多核苷酸中彼此“反向”定向(←→)的引物对来实现,但是由于片段的环化而能够扩增由环化形成的序列。通过切割插入的供体多核苷酸使环化片段线性化可以保留由环化提供
的可扩增性。这种方法是有时被称为“反向”或“反向PCR”的变体。
[0085] “扩增”指将溶液(例如混合物分区中的溶液)置于足以扩增多核苷酸的条件下的步骤(如果反应的所有组分是完整的)。扩增反应的组分包括,例如,引物、多核苷酸模板、聚合酶、核苷酸等。术语“扩增”一般是指靶核酸的“指数型”增长。然而,本文所用的“扩增”也可指核酸的选择靶序列数量的线性增长,如由循环测序或线性扩增所得。
[0086] 术语“扩增反应”指用于以线性或指数方式倍增核酸靶序列拷贝的各种体外方法。这类方法包括但不限于聚合酶链反应(PCR);DNA连接酶链反应(参见美国专利号4,683,195
和4,683,202,PCR Protocols:A Guide to Methods and Applications(PCR方案:方法和
应用指南)(Innis等编,1990))(LCR);基于QBeta RNA复制酶和基于RNA转录的扩增反应(例如,涉及T7、T3或SP6引导的RNA聚合),例如转录扩增系统(TAS),基于核酸序列的扩增
(NSABA),和自主维持序列复制(3SR);等温扩增反应(例如,单引物等温扩增(SPIA));以及本领域技术人员已知的其它方法。
[0087] 术语“扩增反应混合物”指包含用于扩增靶核酸的各种试剂的水性溶液。这些试剂包括酶、水性缓冲剂、盐、扩增引物、靶核酸和三磷酸核苷。扩增反应混合物还可包含稳定剂和其它添加剂以优化效率和特异性。根据上下文,混合物可以是完全或是不完全的扩增反应混合物。
[0088] “聚合酶链反应”或“PCR”是指靶双链DNA的特定区段或子序列得以几何级数式扩增的一种方法。PCR是本领域技术人员所熟知的;参见例如,美国专利号4,683,195和4,683,202;和《PCR方案:方法和应用指南》,Innis等编,1990。示例性PCR反应条件一般包括两步或三步循环。两步循环具有变性步骤,之后是杂交/延伸步骤。三步循环包括变性步骤,之后是杂交步骤,之后是独立的延伸步骤。
[0089] “引物”指与靶核酸上的序列杂交并且用作核酸合成的起始点的多核苷酸序列。引物可以是各种长度的并且通常长度小于50个核苷酸,例如长度为12-30个核苷酸。可基于本领域技术人员已知的原理设计用于PCR的引物的长度和序列,参见例如Innis等(同上)。引物可以是DNA、RNA或DNA部分与RNA部分的嵌合体。在一些情况中,引物可包括一个或多个带修饰或非天然的核苷碱基。扩增引物对可以配置成与插入的外源供体寡核苷酸或其片段的
相反链杂交,其中杂交的引物对定向成使得在片段环化前它们的5'端靠近,并且它们的3'
端远离。
[0090] 在环化过程中,与引物的3'端相比,5'端保持相对更近(更近端),并且可以扩增被引物(由环化产生)侧接的区域。在循环后,含有插入的供体多核苷酸的片段可以通过选择性切割供体多核苷酸序列而线性化(参见例如图6)。引物与含有插入的和切割的供体多核
苷酸的线性化片段杂交的方向可以与初始或环化片段相比反转。因此,引物可以被配置为
与插入的和切割的外源供体寡核苷酸或其片段的一部分的相反链杂交,其中杂交的引物对
被定向成使得它们的5'端远离,并且其3'端靠近。
[0091] 在一些情况下,引物对的5'端与具有插入的外源供体寡核苷酸或其片段的环化或线性化的基因组核酸片段的相反链杂交,与其重叠或重叠约1、2、3、4、5、6、7、8、9、10、11、
12、13、14、15、16、17、18、19或20个核苷酸(参见例如图5)。在一些情况下,一个或多个引物被标记(例如可检测地标记)。
[0092] 可以用与插入的供体多核苷酸序列杂交(例如,特异性或严格杂交)的引物或引物对进行扩增。一种或多种引物可以被配置为在适于扩增的条件下,在含有插入的外源供体
寡核苷酸或其片段的环状化或随后线性化的基因组核酸片段和合适的扩增试剂存在下提
供扩增产物。例如,扩增引物对可以被配置为,当与含有插入的供体多核苷酸或其部分的初始基因组核酸片段杂交时,与供体多核苷酸或其部分的相反链互补,并且被定向为使得5'
端彼此靠近并且3'端彼此远离。
[0093] 扩增可以在存在双链核酸的情况下提供可检测信号的插入染料存在下进行。因此,在扩增成功产生扩增子的分区中,插入染料将增加荧光,并提供可检测的信号,指示在该分区中存在含有插入的外源供体多核苷酸的基因组核酸片段。或者,插入染料可以被递
送至分区以检测含有插入的外源供体多核苷酸和/或其扩增子的基因组核酸片段的存在与
否。插入染料可用于检测定靶基因组和脱靶基因组编辑的总量,或检测由基因组编辑试剂
或外源性损伤诱导的双链断裂点的总量。
[0094] 可以在特异性检测靶核酸序列存在的探针的存在下进行扩增。例如,可以在特异性检测细胞基因组内源的靶核酸序列的标记探针的存在下进行扩增。在含有具有该内源序
列的基因组核酸片段的分区中,扩增将产生表明存在内源序列的可检测信号。又例如,可以在特异性检测细胞基因组异源的靶核酸序列的标记探针的存在下进行扩增。在一些情况
中,通过环化基因组核酸片段产生异源序列。在含有具有该异源序列的基因组核酸片段(例如,环化或线性化)的分区中,扩增将导致表明该异源序列存在的可检测信号。
[0095] e)检测和定量
[0096] 在一些实施方式中,在分区或多个分区中检测含有插入的外源供体寡核苷酸的基因组核酸片段的存在与否。在分区中存在含有插入的外源供体寡核苷酸的基因组核酸片段
表明基因组DNA在衍生其的细胞中含有双链断裂点。在一些情况下,在分区中检测的含有插入的外源供体寡核苷酸的基因组核酸片段的频率或数量表示衍生该片段的细胞或细胞群
的基因组中的双链断裂点的频率或数量。
[0097] 可以使用数字读出试验,例如数字分析来计数插入的外源供体寡核苷酸或其片段在基因组或基因组群体中的频率。因此,可以确定在一种或多种基因组中的双链断裂的频
率。可以通过检测包含如本文所述的扩增子的分区的频率来确定频率(参见例如图2)。通
常,数字分析的过程包括针对样品的一个或多个分区确定分区中基因组片段的存在是否为
阳性或阴性(例如,高于或低于信号的截止值),该基因组片段中已插入外源供体寡核苷酸。
[0098] 在一些实施方式中,如果在分区中检测到其中插入外源供体寡核苷酸的基因组片段的至少一部分的扩增产物,则分区对于该片度的存在是“阳性”。在一些实施方式中,通过检测随着扩增产物的产生而增加荧光的插入染料所产生的信号的存在来检测扩增产物。在
一些实施方式中,通过检测由与探针连接的标记物(例如,与探针如寡核苷酸、蛋白质、肽或适体探针连接的荧光、化学发光、放射性或酶标记物)生成的信号的存在来检测扩增产物。
在一些实施方式中,通过检测两种标记的探针都存在于同一分区中时生成,但同一分区中
不存在一种或全部两种探针时不生成的信号产生来检测分区中两种或更多种探针。在一些
实施方式中,如果没有检测到包含插入的外源供体寡核苷酸或其部分的基因组片段的扩增
产物,则分区对于靶分子的存在是“阴性”。
[0099] 在一些实施方式中,所述方法还包括例如作为对照,例如归一化对照,混合物分区中的内源和/或异源多核苷酸序列的特异性检测。例如,可以在特异性检测细胞基因组内源的对照核酸序列的标记探针的存在下进行扩增。在含有具有该内源对照序列的基因组核酸片段的分区中,扩增将产生表明存在内源序列的可检测信号。
[0100] 作为另一示例,可以在特异性检测细胞基因组异源的对照核酸序列的标记探针的存在下进行扩增。在一些情况下,通过使基因组核酸片段环化来产生异源序列,由此,环化产生不存在于细胞的完整基因组中的连续核苷酸序列。在含有具有该异源序列的基因组核
酸片段(例如,环化或环化然后线性化)的分区中,扩增将导致表明该异源序列存在的可检
测信号。如本文所述,该序列的检测可以例如用于控制连接效率。
[0101] 内源和/或异源序列及其检测可用作参考或归一化信号。在一些情况下,内源序列可以用作参考或归一化信号以指示试验的效率。例如,可以通过使细胞与外源供体寡核苷
酸在适合于将外源供体寡核苷酸插入细胞基因组中的双链断裂点的条件下接触,提取基因
组核酸,片段化,划分和环化(例如在分区之前或之后的环化),任选地线性化(例如,在分区之前或之后),然后检测包含具有插入的外源供体的环状或线性化的基因组核酸片段寡核
苷酸或其部分,从而评估已知数量的细胞中双链断裂点的存在和定量。还可以检测到含有
存在于细胞基因组中的内源性参考序列的分区。检测到内源性参考序列的分区的存在或数
量可以指示试验已成功执行。检测内源性参考序列的分区的数量也可以指示与试验中使用
的基因组数量成比例的值。这可以用于标准化其中检测到具有插入的外源供体寡核苷酸或
其片段的基因组核酸片段的分区的数量。该归一化因子可用于确定检查的基因组群体(和
衍生基因组的细胞)中插入的供体寡核苷酸数量的绝对数量,从而推断细胞基因组中双链
断裂点的量或频率。
[0102] 类似地,也可以检测包含不存在于细胞基因组中但是通过使基因组核酸片段环化(和任选地随后线性化)而产生的异源参考序列的分区。可以将包含异源参考序列的分区的
数量与包含内源参考序列的分区的数量进行比较。与内源性参考序列相比,含有通过环化
产生的异源参考序列的分区的存在或量可以用于指示环化步骤的效率。检测到内源和/或
异源参考序列的分区的存在或量也可以指示试验已经成功地进行。
[0103] 在一些情况下,可以检测含有外源对照多核苷酸的分区。例如,多个基因组核酸片段(例如,在环化和/或线性化之前或之后)可以与已知量的对照多核苷酸混合,然后分区。含有对照多核苷酸的分区的检测和计数可以指示成功执行划分和/或检测,允许对所得数
据进行归一化,从而进行绝对定量等。
[0104] 在一些实施方式中,可以例如使用特异性检测近端序列的探针来检测包含具有靠近基因组编辑试剂切割位点的序列的基因组片段的分区。靠近基因组编辑切割位点的序列
可以在基因组编辑切割位点的约1、2、3、4、5、6、7、8、9、10、12、14、15、18、20、22、25、30、35、
40、45、50、60、70、80、90、100、125、150、175、225、250、300、325、350、375、400、425、450、475、
500、550、600、650、700、750、1000个碱基对或千碱基对内。类似地,可以检测分区,其包含具有插入的外源供体寡核苷酸或其部分的基因组片段以及靠近基因组编辑试剂切割位点的
序列。
[0105] 在一些情况下,通过单个探针(例如,对通过将供体寡核苷酸插入基因组编辑试剂靶位点产生的序列进行检测的探针)来检测近端序列和供体寡核苷酸(或其片段)序列。例
如,探针可以至少部分地与通过插入形成的连接序列杂交。在一些情况下,通过两个探针检测近端序列和供体寡核苷酸(或其片段)。在一些情况下,通过用插入染料检测至少一部分
基因组片段的扩增来检测基因组片段中供体寡核苷酸的存在,其中使用与至少一部分插入
的供体寡核苷酸杂交的引物进行扩增。在一些情况下,扩增在环化或线性化的基因组核酸
片段上进行。在这样的实施方式中,可以使用例如与靠近基因组编辑试剂位点的序列的至
少一部分特异性杂交的探针来检测基因组编辑试剂位点附近的序列的存在。
[0106] 在一些情况下,可以检测和/或定量含有靠近基因组编辑试剂切割位点的序列和插入的外源供体寡核苷酸或其部分的分区。在一些情况下,可以检测和/或定量包含具有靠近基因组编辑试剂切割位点的序列的基因组片段和但不包含插入的外源供体寡核苷酸或
其部分的分区。在一些情况下,可以检测和/或定量包含插入的外源供体寡核苷酸或其部分但不包含具有靠近基因组编辑试剂切割位点的序列的基因组片段的分区。
[0107] 包含具有插入的外源供体寡核苷酸或其片段以及靠近基因组编辑试剂切割位点的序列的基因组片段的分区的检测和/或定量因此可以指示定靶基因组编辑的数量或频
率。包含具有接近基因组编辑试剂切割位点的序列但缺少插入的外源供体寡核苷酸或其部
分的基因组片段的分区的检测和/或定量可以指示未成功编辑的基因组编辑试剂切割位点
的数量或频率。包含插入的外源供体寡核苷酸或其部分但缺少具有靠近基因组编辑试剂切
割位点的序列的基因组片段的分区的检测和/或定量可以指示由基因组编辑试剂进行的脱
靶基因组切割的数量或频率。在一些情况下,将指示的定靶基因组编辑的数量或频率与指
示的脱靶基因组编辑的数量或频率进行比较,从而指示与脱靶基因组编辑相比的定靶基因
组编辑的比率。
[0108] 因此,在一些实施方式中,本文所述的方法可以包括比较i)与ii)的比例,其中i)是含有扩增子和靠近定靶基因组编辑试剂切割位点的序列的混合物分区的数量;和ii)是
含有扩增子的混合物分区的数量,从而确定通过基因组编辑试剂或方法的定靶基因组编辑
的比率。类似地,本文方法可包括计数含有扩增子并且不含接近定靶基因组编辑试剂切割
位点的序列的混合物分区的数量,由此检测多个脱靶基因组插入。此外,本文所述的方法可以包括比较i)与ii)的比例,其中i)是含有扩增子并且不含有靠近定靶基因组编辑试剂切
割位点的序列的混合物分区的数量;和ii)是含有扩增子的混合物分区的数量,从而确定通过基因组编辑试剂或方法的脱靶基因组插入的比率。
[0109] 在一些实施方式中,检测和/或定量在可以区分两个或更多(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多)可区分信号的装置中进行。因此,例如,可以通过插入染料在一个通道上检测到含有插入的供体多核苷酸或其扩增子的片段。可以使用该装置的其他
通道来同时检测靠近定靶基因组编辑试剂切割位点的序列,和/或一个或多个前述对照序
列,例如由环化生成的内源参考序列、外源对照多核苷酸、或其组合(参见例如图3)。
[0110] 在一些情况下,可以如本文所述测定细胞、细胞系或细胞群,而不用与基因组编辑试剂接触以确定双链断裂的基础比率和/或供体寡核苷酸插入的基础比率。基础比率可用于标准化已经与基因组编辑试剂接触的细胞,细胞系或细胞群的试验。或者,可以如本文所述测定细胞、细胞系或细胞群,而不用与基因组编辑试剂接触以评估外源性损伤的暴露(例如化学诱变剂,强磁场或电离辐射)。
[0111] 在一些情况下,可以将细胞,细胞系或细胞群与供体寡核苷酸接触,而不暴露或基本不暴露于外源性损伤(例如,化学诱变剂,强磁场或电离辐射)和/或不接触基因组编辑试剂。可以使用本文所述的方法测定供体寡核苷酸插入双链断裂,以确定双链断裂点的基数和/或双链断裂点插入的基础比率。基础比率可用于标准化本文所述的一种或多种试验。
[0112] 在一些实施方式中,检测方法包括荧光检测。使用荧光检测累积的扩增产物的方法是本领域所熟知的。合适的方法的示例包括,例如,使用插入染料、使用与5'核酸酶切割联用的标记的探针和使用结构化的探针。
[0113] 使用插入染料采用与双链DNA结合的荧光化合物。在该类型的方法中,扩增产物(其在一些情况中是双链的)结合溶液中的染料分子以形成复合物。使用合适的染料,可能
区分在溶液中保持游离的染料分子和与扩增产物结合的染料分子。例如,某些染料仅当与
双链DNA如扩增产物结合时高效发出荧光。这类染料的示例包括但不限于SYBR绿和Pico绿
(来自分子探针公司(Molecular Probes)(俄勒冈州尤金市))、溴化乙啶、碘化丙啶、色霉
素、吖啶橙、Hoechst 33258,TOTO-I、YOYO-1和DAPI(4',6-二眯基-2-苯基吲哚盐酸盐)。例如,Zhu等,Anal.Chem.66:1941-1948(1994)提供了关于使用插入染料的其它描述。
[0114] 在一些实施方式中,插入染料可用于区分包含和不包含具有插入的外源供体寡核苷酸或其片段的基因组核酸片段的分区。在一些情况中,可使用插入染料在单阳性、双阳性和多重阳性(例如,对3、4、5或更多种结构上不同的具有插入的外源供体寡核苷酸或其片段的基因组核酸片段阳性)分区之间区分。例如,在一些情况中,含2种或更多种不同靶序列和检测该靶序列的扩增子的插入染料的分区可提供比仅含一种靶序列扩增子的分区更强的
可检测信号。类似地,仅含1种靶序列扩增子和插入染料的分区可提供比不含靶序列扩增子的分区更高的可检测信号。作为另一个示例,可改变用于扩增特定靶序列的引物的浓度以
改变在终点扩增(例如,PCR)反应中生成的扩增子的量。因此,用插入染料进行检测可基于信号强度区分不同靶序列扩增子的存在或缺失。可在例如McDermott等,Anal.Chem.,2013,
85(23),第11619–11627页;和US/2014/0178889中找到用于对靶序列扩增子进行多重检测的方法、组合物和装置。
[0115] 荧光核酸酶试验是可与本文所述的装置和方法成功联用的扩增产物定量方法的另一个示例。这种监测扩增产物形成的方法的基础是使用双重标记的荧光寡核苷酸探针测
量扩增子累积,这是一种在文献中被经常称为“TaqMan”法的方法。
[0116] 这类试验中所用的探针可以是用2种不同的荧光染料或一种荧光染料和一种非荧光猝灭部分标记的短(例如,长度为约20-25个碱基)多核苷酸。在一些情况中,该探针的5'末端接合报告染料,而3'末端接合荧光或非荧光淬灭部分。在其它情况中,染料可在探针上的其它位置处接合。探针可被设计成与靶核酸上的探针结合位点具有至少实质序列互补性
(例如与内源或异源参考序列的至少一部分,靠近基因组编辑切割位点的序列或靠近定靶
基因组编辑切割位点的序列的实质序列互补性)。与侧接探针结合位点的区域结合的上游
和下游PCR引物也可包括在反应混合物中。当所述发荧光探针完整时,荧光剂和淬灭剂部分之间发生能量转移,淬灭荧光剂的发射。PCR延伸阶段中,探针被切割(例如通过核酸聚合酶例如Taq聚合酶的5'核酸酶活性,或通过切割结合探针的单独提供的核酸酶活性),从而使
荧光剂和淬灭剂部分分离。这导致报告发射强度的增加,可用合适的检测器测量。有关检测PCR产物的荧光方法的其他细节参见例如Gelfand的美国专利5,210,015、Livak等的美国专
利5,538,848、和Haaland的美国专利5,863,736,它们通过引用全文纳入本文,以及Heid,
C.A.等,Genome Research,6:986-994(1996);Gibson,U.E.M等,Genome Research 6:995-
1001(1996);Holland,P.M.等,Proc.Natl.Acad.Sci.USA 4 88:7276-7280,(1991);和
Livak,K.J.等,“PCR方法和应用”(PCR Methods and Applications)357-362(1995)。
[0117] 结构化探针(例如,“分子信标”)提供了另一种检测累积扩增产物的方法。通过分子信标,探针与扩增产物的互补区域杂交时探针构象的改变导致可检测信号的产生。除了靶标特异性部分以外,所述探针包括其他部分,通常一部分在5'端另一部分在3'端,它们彼此互补。一端部分通常接合报告染料,而另一端部分通常接合淬灭剂染料。溶液中两种端部分可彼此杂交以形成茎环结构。该构象中,报告染料和淬灭剂足够接近,以致报告染料的荧光被淬灭剂有效淬灭。相反,杂交探针产生线性化构象,其中降低了猝灭程度。因此,通过监控报告染料的发射变化可以间接监控扩增产物的形成。此类探针及其使用方法还参见例如
Piatek,A.S.等,Nat.Biotechnol.16:359-63(1998);Tyagi,S.和Kramer,F.R.,Nature 
Biotechnology 14:303-308(1996);和Tyagi,S.等,Nat.Biotechnol.16:49-53(1998)。
[0118] 在一些实施方式中,能够检测单个信号或多个信号的检测器被用于分析各分区中是否存在目标分子。例如,在一些实施方式中,使用单色或双色读取器(例如荧光检测器)。
阳性计数分区的分数可以使得能够确定要检测的DNA序列元件(例如,具有插入的外源供体
寡核苷酸或其部分的基因组核酸片段)的绝对浓度或相对浓度。在某些情况下,阳性计数分区的分数可以使得能够确定细胞或细胞群体具有双链断裂点、已经在靶位点成功编辑、和/或包含脱靶编辑的位点的相对或绝对频率。
[0119] 一旦确定各样品分区的二态“阳性或阴性”结果,即可使用基于泊松统计的算法分析分区的数据以定量细胞或细胞群的基因组中双链断裂点的数量,其中划分、片段化、环化和任选地随后的线性化片段衍生自该细胞或细胞群。定量一种或多种目标分子的浓度或含量的统计学方法描述于例如WO 2010/036352,其通过引用全文纳入本文。可以使用类似的
算法来分析其中观察到或可获得双阳性,单阳性(+-或-+)或双阴性结果的试验。
[0120] 在某些情况下,可以通过效率因子来调节“阳性”或“是”和“否”分区的数量和/或频率,以解释成功的外源供体寡核苷酸插入的预期效率。效率因子可以是常数。例如,可以经验确定或假设外源供体寡核苷酸仅以、仅以约或至少约1%、2%、3%、4%、5%、6%、7%、8%9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、
24%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、
40%、41%%、43%、44%、45%、46%、47%、48%、49%、50%以上的双链断裂或基因组编辑试剂切割产物存在或生成的次数而被成功插入。因此,可以应用效率因子来相应地调整试
验数据以确定双链断裂点、定靶基因组编辑、脱靶基因组编辑或其组合的绝对数量或频率。
或者,可以基于试验条件假设、确定或进一步调整效率因子。例如,可以基于在实验中使用的基因组编辑试剂或供体寡核苷酸来调整效率因子。例如,如果在试验中使用的条件下,外源供体寡核苷酸的插入预计发生在约50%的双链断裂点中,则外源供体寡核苷酸插入的检
测率可以乘以2,以适应该预期效率并获得绝对双重断裂点定量。
[0121] II.组合物
[0122] 本文描述的是外源供体寡核苷酸。外源供体寡核苷酸可以是单链或双链的。在一些情况下,外源供体寡核苷酸或其部分是双链的。在一些情况下,外源供体寡核苷酸是双链的并且具有一个或多个5'和/或3'单链(例如,粘性)端。在一些情况下,外源供体寡核苷酸是双链的,具有钝的5'和/或3'端。外源供体寡核苷酸可以是DNA,RNA或其组合。在某些情况下,外源供体寡核苷酸是DNA。在一些情况下,外源供体寡核苷酸被磷酸化(例如5'和/或3'磷酸化)。在某些情况下,外源供体寡核苷酸被5'磷酸化。
[0123] 外源供体寡核苷酸可以含有与核苷酸碱基之间天然存在的磷酸二酯键不同的一个或多个核苷酸连接。在一些情况下,外源供体寡核苷酸含有一种或多种修饰(例如,碱基修饰、或碱基之间的一个或多个磷酸二酯键的修饰),其增加外源供体寡核苷酸或其片段的体内稳定性或降低体内降解(例如核酸酶消化)。
[0124] 外源供体寡核苷酸可以含有一个或多个硫代磷酸酯连接。在一些情况下,外源供体寡核苷酸在5'末端核苷酸和5'倒数第二核苷酸之间含有硫代磷酸酯连接。在一些情况
下,外源供体寡核苷酸可以含有或可以进一步含有5'倒数第二核苷酸与5'倒数第三核苷酸
之间的硫代磷酸酯连接。在一些情况下,外源供体寡核苷酸可以含有或可以进一步含有5'
倒数第三核苷酸与5'倒数第四核苷酸之间的硫代磷酸酯连接。在某些情况下,一个或多个
前述5'硫代磷酸酯连接位于双链外源供体寡核苷酸的一条链上。在某些情况下,一个或多
个前述5'硫代磷酸酯连接位于双链外源供体寡核苷酸的不同链上。在某些情况下,一个或
多个前述5'硫代磷酸酯连接位于双链外源供体寡核苷酸的相反链上。
[0125] 在一些情况下,外源供体寡核苷酸在3'末端核苷酸和3'倒数第二核苷酸之间含有硫代磷酸酯连接。在一些情况下,外源供体寡核苷酸可以含有或可以进一步含有3'倒数第
二核苷酸与3'倒数第三核苷酸之间的硫代磷酸酯连接。在一些情况下,外源供体寡核苷酸
可以含有或可以进一步含有3'倒数第三核苷酸与3'倒数第四核苷酸之间的硫代磷酸酯连
接。在某些情况下,一个或多个前述3'硫代磷酸酯连接位于双链外源供体寡核苷酸的一条
链上。在某些情况下,一个或多个前述3'硫代磷酸酯连接位于双链外源供体寡核苷酸的不
同链上。在某些情况下,一个或多个前述3'硫代磷酸酯连接位于双链外源供体寡核苷酸的
相反链上。
[0126] 在一些情况下,外源供体寡核苷酸含有前述5'和/或3'硫代磷酸酯连接中的一个或多个的组合。例如,外源供体寡核苷酸可以是双链外源供体寡核苷酸,其在一个、两个或不同链上含有一个,两个或三个前述5'硫代磷酸酯连接。作为另一示例,外源供体寡核苷酸可以是双链外源供体寡核苷酸,其在一个、两个或不同链上含有一个,两个或三个前述3'硫代磷酸酯连接。作为另一示例,外源供体寡核苷酸可以是双链外源供体寡核苷酸,其在一
个、两个或不同的链上含有一个、两个或三个前述5'硫代磷酸酯连接,并且在一个、两个或不同的链上包含一个、两个或三个前述3'硫代磷酸酯连接。
[0127] 在一些情况下,外源性供体寡核苷酸是双链寡核苷酸,其具有两个5'磷酸化钝端并且在一条链的5'末端和5'倒数第二核苷酸之间以及5'倒数第二和5'倒数第三核苷酸之
间具有硫代磷酸酯连接。在一些情况下,外源性供体寡核苷酸是双链寡核苷酸,其具有两个
5'磷酸化钝端并且在两条链的5'末端和5'倒数第二核苷酸之间以及5'倒数第二和5'倒数
第三核苷酸之间具有硫代磷酸酯连接。在一些情况下,外源性供体寡核苷酸是双链寡核苷
酸,其具有两个5'磷酸化钝端并且在一条链的3'末端和3'倒数第二核苷酸之间以及3'倒数
第二和3'倒数第三核苷酸之间具有硫代磷酸酯连接。
[0128] 在一些情况下,外源性供体寡核苷酸是双链寡核苷酸,其具有两个5'磷酸化钝端并且在两条链的3'末端和3'倒数第二核苷酸之间以及3'倒数第二和3'倒数第三核苷酸之
间具有硫代磷酸酯连接。在某些情况下,外源供体寡核苷酸是双链寡核苷酸,其具有两个5'磷酸化的钝端并且在一或两条链的5'和3'端的末端和倒数第二个核苷酸之间具有硫代磷
酸酯键。在某些情况下,外源供体寡核苷酸是双链寡核苷酸,其具有两个5'磷酸化的钝端并且在一或两条链的5'和3'端的末端和倒数第二个核苷酸之间以及倒数第二个核苷酸和倒
数第三个核苷酸之间具有硫代磷酸酯键。
[0129] 在一些情况下,外源供体寡核苷酸是长度为约12至约150bp的双链寡核苷酸,例如任何前述的双链外源供体寡核苷酸。在一些情况下,双链外源供体寡核苷酸长度在约20至
约75bp之间。在一些情况下,双链外源供体寡核苷酸长度在约30至约75bp之间。在一些情况下,双链外源供体寡核苷酸长度在约25至约50bp之间。在一些情况下,双链外源供体寡核苷酸长度在约25至约40bp之间。在一些情况下,双链外源供体寡核苷酸长度为或约为34bp。上述外源供体寡核苷酸,其类似物或其组合中的任何一种可以与细胞接触或者在适合于将外
源供体寡核苷酸或其片段插入到细胞基因组的双链断裂点中的条件下与该细胞基因组接
触并检测以定量细胞基因组中的双链断裂点。
[0130] 本文描述的是具有插入的外源供体的寡核苷酸或其片段的分区(例如,在乳剂液滴或微孔中划分)的基因组核酸片段。类似地,本文描述的是包含具有插入的外源供体寡核苷酸或其片段的基因组核酸片段的混合物分区(例如,在乳剂液滴中或含有乳剂液滴或在
微孔中的混合物分区)。本文还描述了多个分区(例如,在乳剂液滴或微孔中划分)基因组核酸片段,其中至少一个包含插入的外源供体寡核苷酸或其片段。本文还描述了含有基因组
核酸片段的多个混合物分区(例如,在乳液液滴中或含有乳液液滴或在微孔中的混合物分
区),其中至少一个基因组核酸片段具有插入的外源供体寡核苷酸,或其片段。例如,所述多个分区核酸片段或多个混合物分区可以是、约是、至少或至少约2、3、4、5、6、8、10、15、20、
25、30、35、40、45、50,60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、
375、400、425、450、475、500、550、600、650、700、750、800、900、1000、1250、1500、2000、3000、
4000、5000、7500、9000、10,000、12,000、15000、20,000、50000、75000、100,000或更多这样的分区核酸片段或含有该分区核酸片段的混合物分区。
[0131] III.试剂盒
[0132] 本文描述的是用于进行本文所述的任何方法或其组合或用于产生本文所述的任何组合物或其组合的试剂盒。这样的试剂盒可以包括下述的一个或多个:外源供体寡核苷
酸,特异性检测由细胞的基因组核酸片段的环化所产生的异源序列的扩增的探针,特异性
检测细胞的内源基因组序列的扩增的探针,特异性检测靠近(例如定靶)基因组编辑试剂切
割位点片段化试剂(例如缓冲液,盐和/或酶)的序列的扩增的探针,用于划分基因组核酸片段(例如,线性、环化或线性化的片段)的试剂,环化试剂(例如缓冲液、盐和/或酶如聚合酶和/或连接酶),线性化试剂(例如引物,缓冲液,盐和/或酶),扩增试剂(例如,引物,缓冲液,盐和/或酶如聚合酶),插入染料或具有不存在于细胞的基因组中的序列的外源对照多核苷
酸。在一些情况下,对照多核苷酸的序列不存在于细胞基因组的环化片段中。在一些情况
下,对照多核苷酸的序列不存在于外源供体寡核苷酸中。
[0133] 通过引用将本文引用的所有专利、专利申请和其它公开文献包括GenBank登录号全文纳入本文用于所有目的。
[0134] 实施例
[0135] 仅以说明的形式而非限制的形式提供以下实施例。本领域技术人员不难了解,可改变或调整各种非关键参数而获得基本相同或相似的结果。
[0136] 实施例1
[0137] 在适于产生靶双链断裂点并将外源供体寡核苷酸插入一个或多个靶双链断裂点的条件下,将细胞与基因组编辑试剂和外源供体寡核苷酸接触。基因组核酸被提取、片段化和环化。将环化的片段与扩增试剂和分区混合。分区在适于在含有基因组片段的分区中产
生扩增子的条件下孵育,所述基因组片段中插入有外源供体寡核苷酸或其部分。检测并定
量含有此类扩增子的分区。包含这种扩增子的分区的数量表示所接触细胞的基因组中的双
链断裂点的数量。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈