首页 / 专利库 / 专利权 / 申请 / 国际申请 / 权利要求 / 分子库制备方法以及其组合物和用途

分子库制备方法以及其组合物和用途

阅读:655发布:2020-06-12

专利汇可以提供分子库制备方法以及其组合物和用途专利检索,专利查询,专利分析的服务。并且本公开描述了用于制备目标核酸序列的分子库的方法以及其组合物和用途。所述方法包含使核酸样品与多个衔接子 接触 ,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增一个或多个目标核酸序列;消化所得第一扩增产物;修复被消化的目标 扩增子 ;以及在第二扩增中扩增被修复的产物,由此产生目标核酸序列的分子库。多种衔接子组合物中的每一种包含固定结构和目标核酸序列以及任选的一个或多个标签序列。所公开的方法可以在单一、仅添加型工作流程反应中进行,可实现高度多重化的目标分子库的快速产生,所述分子库任选地包括独特标签序列。所得分子库组合物适用于多种应用,包括测序应用。,下面是分子库制备方法以及其组合物和用途专利的具体信息内容。

1.一种用于制备目标核酸序列的分子库的方法,其包含:
(a)使核酸样品与多个衔接子接触,所述衔接子能够在其中所述目标核酸经历第一扩增的条件下扩增所述样品中的一个或多个目标核酸序列;
(b)消化所得第一扩增产物以减少或消除所得引物二聚体并制备经部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复所述经部分消化的目标扩增子;以及(c)使用通用引物在第二扩增中扩增所述经修复的目标扩增子,
由此产生目标核酸序列的分子库;
其中,所述多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列和可裂解部分以及任选的一个或多个标签序列;并且其中包括至少两个且最多十万个目标特异性衔接子对,
其中,所述衔接子的目标核酸序列包括至少一个可裂解部分并且所述通用固定结构序列不包括所述可裂解部分。
2.根据权利要求1所述的方法,其中至少一个衔接子中包括任选的标签序列,并且所述衔接子序列中包括侧接所述标签序列的任一个末端的可裂解部分。
3.根据权利要求1所述的方法,其中每个通用序列的熔融温度高于所存在的每个目标核酸序列和每个标签序列的熔融温度。
4.根据权利要求1所述的方法,其在单一、仅添加型工作流程反应中进行,可实现高度多重化的目标分子库的快速产生。
5.根据权利要求2所述的方法,其中所有所述衔接子包含带有侧接所述标签序列的任一个末端的可裂解基团的标签序列。
6.根据权利要求1或权利要求2所述的方法,其中步骤(b)的消化和修复是在单一步骤中进行的。
7.根据权利要求1所述的方法,其中所述步骤(b)的消化和修复是在不同温度下,以短暂分开的方式进行的。
8.根据前述权利要求中任一项所述的方法,其中所述方法的一个或多个步骤是以手动模式或自动模式或其组合进行的。
9.根据权利要求8所述的方法,其中所述方法的每个步骤是以自动模式进行。
10.根据前述权利要求中任一项所述的方法,其进一步包含至少一个纯化步骤。
11.根据权利要求10所述的方法,其中纯化步骤仅在步骤(c)之后进行。
12.根据权利要求10所述的方法,其中第一纯化步骤在步骤(b)之后进行并且第二纯化步骤在步骤(c)之后进行。
13.根据权利要求10所述的方法,其中分子库由步骤(a)的所述第一扩增产生的衔接子-二聚体副产物从所得分子库中去除。
14.根据权利要求10所述的方法,其中扩增后所得的目标核酸的富集体含有数量减少的衔接子-二聚体副产物。
15.根据权利要求14所述的方法,其中衔接子-二聚体副产物全部被消除。
16.根据前述权利要求中任一项所述的方法,其中所述能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。
17.根据权利要求2所述的方法,其中所述多个衔接子的每个目标特异性对可包括高达
16,777,216个包含不同标签序列的不同衔接子组合。
18.根据权利要求17所述的方法,其中每个所产生的目标特异性扩增子序列包括至少1个不同序列且可高达107个不同序列。
19.根据前述权利要求中任一项所述的方法,其进一步包含对所得目标核酸序列的分子库的序列进行分析。
20.根据权利要求19所述的方法,其中分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。
21.根据权利要求19或权利要求20所述的方法,其进一步包含测定所述样品中的至少一个所述目标核酸序列的丰度。
22.根据权利要求20所述的方法,其中分析是通过高通量下一代测序来进行的。
23.根据权利要求22所述的方法,其中测序是以双向方式进行的,因此对于任何既定扩增子可产生正向链和反向链的序列读段。
24.根据前述权利要求中任一项所述的方法,其中消化试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。
25.根据前述权利要求中任一项所述的方法,其中修复试剂包含以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFiDNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌(E.coli)DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。
26.根据权利要求6或权利要求7所述的方法,其中步骤(b)中的多个有间隙的聚核苷酸产物同时与所述消化和修复试剂接触,或步骤(b)中的多个有间隙的聚核苷酸产物依序与所述消化和修复试剂接触。
27.根据前述权利要求中任一项所述的方法,其中所述消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。
28.根据前述权利要求中任一项所述的方法,其中所述消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。
29.一种组合物,其包含由根据前述权利要求中任一项所述的方法产生的核酸分子库。
30.一种根据权利要求29所述的组合物的用途,其用于分析核酸分子库的序列。
31.一种用于制备目标核酸序列的分子库的方法,其包含:
(d)使核酸样品与多个衔接子接触,所述衔接子能够在其中所述目标核酸经历第一扩增的条件下扩增所述样品中的一个或多个目标核酸序列;
(e)消化所得第一扩增产物以减少或消除所得引物二聚体并制备经部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复所述经部分消化的目标扩增子;以及(f)使用通用引物在第二扩增中扩增所述经修复的目标扩增子,
由此产生目标核酸序列的分子库;
其中,所述多个衔接子中的每一个均包含通用固定结构序列、一个或多个标签序列、目标核酸序列和可裂解部分;并且其中包括至少两个且可高达十万个目标特异性衔接子对;
其中,所述衔接子的目标核酸序列包括至少一个可裂解部分,所述可裂解部分侧接所述标签序列的任一个末端,并且所述通用固定结构序列不包括所述可裂解部分。
32.根据权利要求31所述的方法,其中每个通用序列的熔融温度高于所存在的每个目标核酸序列和每个标签序列的熔融温度。
33.根据权利要求31所述的方法,其在单一、仅添加型工作流程反应中进行,可实现高度多重化的目标分子库的快速产生。
34.根据权利要求31所述的方法,其中所有所述衔接子包含带有侧接所述标签序列的任一个末端的可裂解基团的标签序列。
35.根据权利要求31所述的方法,其中步骤(b)的消化和修复是在单一步骤中进行的。
36.根据权利要求31所述的方法,其中所述步骤(b)的消化和修复是在不同温度下,以短暂分开的方式进行的。
37.根据权利要求31至36中任一项所述的方法,其中所述方法的一个或多个步骤是以手动模式或自动模式或其组合进行的。
38.根据权利要求37所述的方法,其中所述方法的每个步骤是以自动模式进行的。
39.根据权利要求31至38中任一项所述的方法,其进一步包含至少一个纯化步骤。
40.根据权利要求39所述的方法,其中纯化步骤仅在步骤(c)之后进行。
41.根据权利要求40所述的方法,其中第一纯化步骤在步骤(b)之后进行并且第二纯化步骤在步骤(c)之后进行。
42.根据权利要求41所述的方法,其中分子库由步骤(a)的所述第一扩增产生的衔接子-二聚体副产物从所得分子库中去除。
43.根据权利要求41所述的方法,其中扩增后所得的目标核酸的富集体含有数量减少的衔接子-二聚体副产物。
44.根据权利要求43所述的方法,其中衔接子-二聚体副产物全部被消除。
45.根据权利要求31至43中任一项所述的方法,其中所述能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。
46.根据权利要求31所述的方法,其中所述多个衔接子的每个目标特异性对可包括高达16,777,216个包含不同标签序列的不同衔接子组合。
47.根据权利要求46所述的方法,其中每个所产生的目标特异性扩增子序列包括至少1个不同序列且可高达107个不同序列。
48.根据权利要求31至47中任一项所述的方法,其进一步包含对所得所述目标核酸序列的分子库的序列进行分析。
49.根据权利要求48所述的方法,其中分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。
50.根据权利要求48或权利要求49所述的方法,其进一步包含测定所述样品中的至少一个所述目标核酸序列的丰度。
51.根据权利要求49所述的方法,其中分析是通过高通量下一代测序来进行的。
52.根据权利要求51所述的方法,其中测序以双向方式进行,因此对于任何既定扩增子可产生正向链和反向链的序列读段。
53.根据权利要求31至52中任一项所述的方法,其中消化试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。
54.根据权利要求31至53中任一项所述的方法,其中修复试剂包含以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。
55.根据权利要求54或权利要求55所述的方法,其中步骤(b)中的多个有间隙的聚核苷酸产物同时与所述消化和修复试剂接触,或步骤(b)中的多个有间隙的聚核苷酸产物依序与所述消化和修复试剂接触。
56.根据权利要求31至56中任一项所述的方法,其中所述消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。
57.根据权利要求31至56中任一项所述的方法,其中所述消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。
58.一种组合物,其包含由根据权利要求31至57中任一项所述的方法产生的核酸分子库。
59.一种根据权利要求58所述的组合物的用途,其用于分析核酸分子库的序列。
60.根据权利要求59所述的用途,其用于测定样品中是否存在低频率出现的等位基因。
61.一种组合物,其包含多个核酸衔接子,其中所述多个衔接子中的每一个包含5'-通用固定结构序列、一个或多个标签序列以及3'-目标核酸序列,其中每个衔接子包含可裂解部分;
其中,所述衔接子的目标核酸序列包括至少一个可裂解部分,所述可裂解部分侧接所述标签序列的任一个末端,并且所述通用固定结构序列不包括所述可裂解部分;和其中包括至少两个且可高达十万个目标特异性衔接子对。
62.根据权利要求61所述的组合物,其中每个衔接子通用序列的熔融温度高于同一个衔接子中存在的每个目标核酸序列和每个标签序列的熔融温度。
63.根据权利要求61所述的组合物,其中所述组合物可实现高度多重化的目标分子库的快速产生。
64.根据权利要求61所述的组合物,其中所有所述衔接子包含带有侧接所述标签序列的任一个末端的可裂解基团的标签序列。
65.根据权利要求61至64中任一项所述的组合物,其中所述能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。
66.根据权利要求61所述的组合物,其中所述多个衔接子的每个目标特异性对可包括高达16,777,216个包含不同标签序列的不同衔接子组合。
67.根据权利要求66所述的组合物,其中每个所产生的目标特异性扩增子序列包括至少1个不同序列且可高达107个不同序列。
68.根据权利要求61至67中任一项所述的组合物,其中所述衔接子是单链或双链的。
69.一种试剂盒,其包含根据权利要求61至68中任一项所述的衔接子组合物。
70.根据权利要求69所述的试剂盒,其进一步包含扩增试剂、消化试剂和修复试剂。

说明书全文

分子库制备方法以及其组合物和用途

[0001] 相关申请
[0002] 本申请案根据35USC§119(e)要求2017年6月30日提交的美国临时申请案第62/527,893号、2018年1月6日提交的美国临时申请案第62/614,362号和2018年6月15日提交的美国临时申请案第62/685,424号中的每一个的优先权和权利。前述申请案中的每一个的全部内容以全文引用的方式并入本文中。
[0003] 序列表
[0004] 本申请案在此以引用的方式并有与此同时提交的电子序列表材料。电子序列表中的材料以2018年6月27日创建的标题为“20180627_LT01273_ST25.txt”的文本(.txt)文档形式提交,其文件大小是359KB并且以全文引用的方式并入本文中。

技术领域

[0005] 本发明涉及用于制备目标核酸序列的分子库的方法以及其组合物和用途。

发明内容

[0006] 提供用于制备目标核酸序列的分子库的方法,以及其组合物和用途。方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增一个或多个目标核酸序列;消化所得第一扩增产物;修复被消化的目标扩增子;以及在第二扩增中扩增被修复的产物,由此产生目标核酸序列的分子库。多种衔接子组合物中的每一种包含固定结构和目标核酸序列以及任选的一个或多个标签序列。所提供的方法可以在单一、仅添加型工作流程反应中进行,实现高度多重化的目标分子库的快速产生,所述分子库任选地包括独特标签序列。所得分子库组合物适用于多种应用,包括测序应用。
[0007] 本发明的一个方面包含用于制备目标核酸序列的分子库的方法。在某些实施例中,所述方法包含使核酸样品与多个衔接子接触,其中一对衔接子中的每一个能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列。所述方法进一步包含消化所得第一扩增产物以减少或消除任何引起反应的引物二聚体,并且制备部分消化的扩增子,由此制备所得有间隙的、双链部分消化的扩增子。所述方法进一步包含修复部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增被修复的产物,由此产生目标核酸序列的分子库。所提供的方法中使用多个衔接子中的每一个均包含5'通用固定结构序列和3'目标核酸序列以及可裂解部分。包括两对或更多对目标特异性衔接子以用于所提供的方法中,其中每个3'目标特异性序列包含可裂解部分。任选地,包括一个或多个标签序列。
[0008] 在本发明的另一方面中,提供用于制备具有独特标签序列的目标核酸序列的分子库的方法。在某些实施例中,所述方法包含使核酸样品与多个衔接子接触,其中一对衔接子中的每一个能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列。所述方法进一步包含消化所得第一扩增产物以减少或消除任何引起反应的引物二聚体,并且制备部分消化的扩增子,由此制备所得有间隙的、双链部分消化的扩增子。所述方法进一步包含修复部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增被修复的产物,由此产生目标核酸序列的分子库。所提供的方法中使用多个衔接子中的每一个均包含5'通用固定结构序列、一个或多个独特标签序列和3'目标核酸序列以及可裂解部分。包括两对或更多对目标特异性衔接子以用于所提供的方法中,其中每个3'目标特异性序列包含可裂解部分,每个标签序列由可裂解部分侧接,并且每个通用固定结构不具有可裂解部分。
[0009] 在另一方面中,提供组合物。在某些实施例中,提供一种组合物,其包含由本文中所描述的方法产生的核酸分子库。在其它实施例中,提供包含多个核酸衔接子的组合物,其中多个衔接子中的每一个均包含5'通用固定结构序列、一个或多个独特标签序列以及3'目标核酸序列,其中每个衔接子包含可裂解部分。在某些实施例中,衔接子的目标核酸序列包括至少一个可裂解部分,所包括的可裂解部分侧接标签序列的任一个末端并且通用固定结构序列不包括可裂解部分。在某些实施例中,组合物包括至少两对并且可高达十万对目标特异性衔接子。
[0010] 此外,使用所提供的组合物和包含所提供的组合物的试剂盒分析核酸分子库的序列是本发明的其它方面。在一些实施例中,对所得分子库的序列能够检测相关样品中的低频率出现的等位基因进行分析。
[0011] 本说明书中提及的所有公开案、专利案和专利申请案都以引用的方式并入本文中,其引用的程度如同每个单独的公开案、专利案或专利申请案经特定并且单独地指示以引用的方式并入一般。附图说明
[0012] 需要用于从复杂样品产生目标分子库的有效方法以用于多种核酸分析。本发明尤其提供用于制备目标核酸序列的分子库的方法,其实现高度多重化的目标分子库的快速产生,所述分子库任选地包括独特标签序列;并且所得分子库组合物适用于多种应用,包括测序应用。本发明的新颖特征以所附权利要求书中的特性给出;并且参考以下阐述说明性实施例(其中利用本发明的原理)的详细描述和随附图式将更全面地理解本发明的特征和优点,其中:
[0013] 图1描绘本发明的工作流程方法,其实现有效的快速、高度多重化的分子库制备。
[0014] 图2描绘来自实例2A中的实验说明的结果。
[0015] 图3描绘来自实例2B中的实验说明的结果。
[0016] 图4A-4C描绘来自实例4中的实验说明的结果。
[0017] 图5描绘来自实例5中的实验说明的结果。
[0018] 图6A-6C描绘来自实例6中的实验说明的结果。
[0019] 图7描绘本发明的工作流程的另一方面,其实现衔接子序列的添加以有助于双向测序。
[0020] 图8描绘本发明的工作流程的另一方面,其实现在Illumina平台上进行测序。

具体实施方式

[0021] 本文中使用的章节标题仅用于组织目的并且不应理解为以任何方式限制所描述的主题。本申请案中所引用的所有文献和类似材料,包括(但不限于)专利案、专利申请案、论文、书籍、专著和互联网网页,都以全文引用的方式明确地併入以用于任何目的。当并入的参考文献中的术语的定义呈现为与本发明教示中提供的定义不同时,应以本发明教示中提供的定义为准。应了解,在本发明教示中论述的温度、浓度、时间等之前存在暗示的“约”,使得微小并且非实质的偏差在本文中的本发明教示的范围内。在本申请案中,除非另外明确陈述,否则单数的使用包括复数。应注意,除非明确地并且肯定地限于一个指示物,否则如本说明书中所使用的单数形式“一(a/an)”和“所述”和任何词的单数用途包括多个指示物。此外,“包含(comprise/comprises/comprising)”、“含有(contain/contains/containing)”以及“包括(include/includes/including)”的使用并不打算是限制性的。应理解,一般说明仅是例示性和解释性的,并且不限制本发明。
[0022] 除非另外定义,否则结合本文中所述的本发明使用的科学和技术术语应具有所属领域的技术人员通常理解的含义。此外,除非上下文另外需要,否则单数术语应包括复数并且复数术语应包括单数。一般来说,本文中所使用的与细胞和组织培养、分子生物学以及蛋白质和寡核苷酸或聚核苷酸化学和杂交结合使用的命名法是所属领域中众所周知并且常用的命名法。标准技术用于例如核酸纯化和制备、化学分析、重组核酸以及寡核苷酸合成。酶促反应和纯化技术是根据制造商的说明书或如所属领域中通常所实现或如本文中所描述来进行。本文中所述的技术和程序通常根据所属领域中众所周知以及如本发明的说明书通篇中所引用和论述的各个一般性和较特定的参考文献中所述的常规方法来进行。参见例如Sambrook等人《, 分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》(第三版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.2000)。除非具体提供,否则与本文中所描述的实验室程序和技术结合使用的任何命名法是所属领域中众所周知和常用的。如根据本文中提供的实施例所用,除非另外指示,否则以下术语应理解为具有以下含义:
[0023] 如本文中所使用,“扩增”或“扩增反应”和其衍生物通常指用于将核酸分子(称为模板核酸分子)的至少一部分复写或复制到至少一个其它核酸分子中的作用或过程。其它核酸分子任选地包括与模板核酸分子的至少一些部分基本上一致或基本上互补的序列。模板目标核酸分子可以是单链或双链的。其它所得复制的核酸分子可以独立地是单链或双链的。在一些实施例中,扩增包括模板依赖性活体外酶催化反应,其用于产生目标核酸分子的至少某一部分的至少一个拷贝,或产生与目标核酸分子的至少某一部分互补的目标核酸序列的至少一个拷贝。扩增任选地包括核酸分子的线性或指数复制。在一些实施例中,使用等温条件进行这类扩增;在其它实施例中,这类扩增可以包括热循环。在一些实施例中,扩增是多重扩增,其包括在单次扩增反应中同时扩增多个目标序列。至少一些目标序列可以位于单次扩增反应中所包括的相同核酸分子或不同目标核酸分子上。在一些实施例中,“扩增”包括基于DNA和/或RNA的核酸(单独或呈组合形式)的至少某一部分的扩增。扩增反应可以包括单链或双链核酸衬底并且可以进一步包括所属领域的一般技术人员已知的任何扩增方法。在一些实施例中,扩增反应包括聚合酶链反应(PCR)。在一些实施例中,扩增反应包括等温扩增。
[0024] 如本文中所使用,“扩增条件”和派生词(例如用于扩增的条件等)通常指适用于扩增一个或更多个核酸序列的条件。扩增可以是线性或指数的。在一些实施例中,扩增条件包括等温条件或可以包括热循环条件,或等温和热循环条件的组合。在一些实施例中,适用于扩增一个或多个目标核酸序列的条件包括聚合酶链反应(PCR)条件。通常,扩增条件指足以扩增核酸(如一个或多个目标序列)或扩增接合到或连接到一个或多个衔接子的经扩增的目标序列(例如衔接子连接的经扩增的目标序列)的反应混合物。通常,扩增条件包括用于扩增或核酸合成的催化剂,例如聚合酶;与待扩增的核酸具有一定程度的互补性的引物;以及用于促进与核酸杂交后引物的延伸的核苷酸,如三磷酸核苷(dNTP)。扩增条件需要引物与核酸的杂交或粘接,引物的延伸和变性步骤,其中经延伸的引物与经历扩增的核酸序列分离。通常但非必须,扩增条件可以包括热循环。在一些实施例中,扩增条件包括多个++ ++循环,其中重复粘接、延伸和分离的步骤。通常,扩增条件包括阳离子,如Mg 或Mn (例如MgCl2等),并且还可以任选地包括各种离子强度调节剂。
[0025] 如本文中所使用,“目标序列”、“目标核酸序列”或“相关目标序列”和其衍生物通常指可以根据本公开扩增或合成的任何单链或双链核酸序列,包括怀疑或预期样品中存在的任何核酸序列。在一些实施例中,在添加目标特异性引物或附接的衔接子之前,目标序列以双链形式存在并且包括待扩增或合成的具体核苷酸序列的至少一部分或其补体。目标序列可以包括可与适用于扩增或合成反应的引物在聚合酶延伸之前杂交的核酸。在一些实施例中,所述术语指核酸序列,其序列一致性、核苷酸的次序或位置由本发明的方法中的一种或多种测定。
[0026] 如本文中所使用,术语“部分”和其变化形式在关于既定核酸分子(例如引物或模板核酸分子)使用时,包含核酸分子的长度(包括核酸分子的部分或整个长度)内的任何数目的相邻核苷酸。
[0027] 如本文中所使用,当关于两种或更多种组分使用时,“接触”和其派生词通常是指用于促进或实现参考组分的接近、靠近、混合物或共混而未必需要这类组分的物理接触的任何过程,并且包括含有所述参考组分中的任一种或多种的溶液的彼此混合。参考组分可以任何具体顺序或组合接触并且组分的具体引述顺序不受限制。举例来说,“使A与B和C接触”涵盖其中A首先与B接触,接着与C接触的实施例,以及其中C与A接触,接着与B接触的实施例,以及其中A与C的混合物与B接触的实施例等。此外,这类接触未必需要接触过程的最终结果是包括所有参考组分的混合物,只要在接触过程期间的某一点,所有参考组分同时存在或同时包括于相同混合物或溶液中即可。举例来说,“使A与B和C接触”可以包括其中C首先与A接触以形成第一混合物,所述第一混合物接着与B接触以形成第二混合物,接着从第二混合物去除C的实施例;任选地,接着也可以去除A,仅留下B。当待接触的参考组分中的一个或多个包括多个物质时(例如,“使目标序列与多个目标特异性引物和聚合酶接触”),那么多个物质中的每个成员可以被视为接触过程中的单独组分,使得接触可以包括使多个物质中的任一个或多个成员与所述多个物质中的任何其它成员和/或任何其它参考组分以任何顺序或组合接触(例如,一些但非全部所述多个目标特异性引物可以与目标序列接触,接着与聚合酶接触,并且接着与所述多个目标特异性引物中的其它成员接触)。
[0028] 如本文中所使用,术语“引物”和其派生词通常指可与相关目标序列杂交的任何聚核苷酸。在一些实施例中,引物也可以用于引发核酸合成。典型地,引物充当衬底,其上可由聚合酶聚合核苷酸;然而,在一些实施例中,引物可以变成并入合成的核酸链中并且提供另一引物可杂交的位点以引发与所合成的核酸分子互补的新链的合成。引物可以包含核苷酸或其类似物的任何组合,其可以任选地连接以形成任何合适长度的线形聚合物。在一些实施例中,引物是单链寡核苷酸或聚核苷酸。(在本发明中,术语“聚核苷酸”和“寡核苷酸”在本文中可以互换地使用并且未必指示两个核苷酸之间长度的任何差异)。在一些实施例中,引物是双链的。如果是双链的,那么在用于制备延伸产物之前,首先处理引物以分离其各链。优选的是,引物是寡脱氧核苷酸。引物必须足够长以引发延伸产物的合成。引物的长度将取决于许多因素,包括温度、引物的来源以及使用方法。在一些实施例中,当暴露于扩增或合成条件时,引物充当用于扩增或合成的起始点;这类扩增或合成可以模板依赖性方式进行并且任选地形成与至少一部分目标序列互补的引物延伸产物。例示性扩增或合成条件可以包括使引物与聚核苷酸模板(例如包括目标序列的模板)、核苷酸和诱导剂(如聚合酶)在合适的温度和pH值下接触,以诱导目标特异性引物的末端上核苷酸的聚合。如果是双股,那么在用于制备引物延伸产物之前,可以任选地处理引物以分离其各链。在一些实施例中,引物是寡脱氧核苷酸或寡核糖核苷酸。在一些实施例中,引物可包括一个或多个核苷酸类似物。目标特异性引物的确切长度和/或组成(包括序列)可以影响许多特性,包括熔融温度(Tm)、GC含量、次要结构的形成、重复核苷酸主结构、所预测的引物延伸产物的长度、跨越相关核酸分子的覆盖度的程度、单次扩增或合成反应中的引物数目、引物内是否存在核苷酸类似物或经修饰的核苷酸等。在一些实施例中,引物可以在扩增或合成反应内与相容的引物配对以形成由正向引物和反向引物组成的引物对。在一些实施例中,引物对中的正向引物包括基本上与核酸分子的一个链的至少一部分互补的序列,并且引物对中引物的反向引物包括基本上与所述链的至少一部分一致的序列。在一些实施例中,正向引物和反向引物能够与核酸双螺旋的相对链杂交。任选地,正向引物引发第一核酸链的合成,并且反向引物引发第二核酸链的合成,其中第一和第二链基本上彼此互补,或可以杂交以形成双链核酸分子。在一些实施例中,扩增或合成产物的一端由正向引物定义并且扩增或合成产物的另一端由反向引物定义。在一些实施例中,当需要扩增或合成冗长引物延伸产物(如扩增外显子、编码区或基因)时,可以产生若干引物对而非跨越所需长度以实现所述区域的足够扩增。在一些实施例中,引物可以包括一个或多个可裂解基团。在一些实施例中,引物长度在约10到约60个核苷酸、约12到约50个核苷酸和约15到约40个核苷酸长度范围内。典型地,当在存在dNTP和聚合酶的情况下暴露于扩增条件时,引物能够与相应的目标序列杂交并且进行引物延伸。在一些情况下,具体核苷酸序列或引物的一部分在扩增反应开始时是已知的或可以通过本文中所公开的方法中的一种或多种测定。在一些实施例中,引物在引物内的一个或多个位置包括一个或多个可裂解基团。
[0029] 如本文中所使用,“目标特异性引物”和其派生物通常指单链或双链聚核苷酸,通常是寡核苷酸,其包括至少一个与包括目标序列的核酸分子的至少一部分至少50%互补,通常至少75%互补或至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%或至少99%互补或一致的序列。在这类情况下,目标特异性引物和目标序列描述成彼此“相对应”。在一些实施例中,目标特异性引物能够与其相应目标序列的至少一部分(或目标序列的补体)杂交;这类杂交可以任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施例中,目标特异性引物不能与目标序列或其补体杂交,但能够与包括目标序列的核酸链的一部分或其补体杂交。在一些实施例中,目标特异性引物包括至少一个与目标序列本身的至少一部分至少75%互补,通常至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%互补或更通常至少99%互补的序列;在其它实施例中,目标特异性引物包括至少一个与除目标序列以外的核酸分子的至少一部分至少75%互补,通常至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%互补或更通常至少99%互补的序列。在一些实施例中,目标特异性引物基本上不与样品中的其它目标序列互补;任选地,目标特异性引物基本上不与样品中的其它核酸分子互补。在一些实施例中,样品中不包括或对应于目标序列(或目标序列的补体)的核酸分子称为“非特异性”序列或“非特异性核酸”。在一些实施例中,目标特异性引物经设计以包括基本上与其相应目标序列的至少一部分互补的核苷酸序列。在一些实施例中,目标特异性引物与包括其相应目标序列的核酸分子的至少一部分至少95%互补或至少99%互补或一致(跨越其整个长度)。在一些实施例中,目标特异性引物可与其相应目标序列的至少一部分至少90%、至少95%互补、至少98%互补或至少99%互补或一致(跨越其整个长度)。在一些实施例中,正向目标特异性引物和反向目标特异性引物定义目标特异性引物对,其可以用于经由模板依赖性引物延伸来扩增目标序列。通常,目标特异性引物对中的每个引物包括至少一个与包括相应目标序列的核酸分子的至少一部分基本上互补,但与样品中的至少一个其它目标序列小于
50%互补的序列。在一些实施例中,扩增可在单次扩增反应中使用多个目标特异性引物对进行,其中每个引物对包括正向目标特异性引物和反向目标特异性引物,各自包括至少一个与样品中的相应目标序列基本上互补或基本上一致的序列,并且每个引物对具有不同的相应目标序列。在一些实施例中,目标特异性引物可以在其3'端或其5'端与扩增反应中的任何其它目标特异性引物是基本上非互补的。在一些实施例中,目标特异性引物可以包括在扩增反应中与其它目标特异性引物的最小交叉杂交。在一些实施例中,目标特异性引物包括在扩增反应混合物中与非特异性序列的最小交叉杂交。在一些实施例中,目标特异性引物包括最小自身互补性。在一些实施例中,目标特异性引物可包括位于3'端的一个或多个可裂解基团。在一些实施例中,目标特异性引物可以包括位于目标特异性引物的中心核苷酸附近或周围的一个或多个可裂解基团。在一些实施例中,更多个目标特异性引物中的一个仅包括目标特异性引物的5'端处的不可裂解核苷酸。在一些实施例中,任选地在相同扩增反应中,与一个或多个不同目标特异性引物相比,目标特异性引物包括引物的3'端或
5'端处的最小核苷酸序列重叠。在一些实施例中,单一反应混合物中的1、2、3、4、5、6、7、8、
9、10种或更多种目标特异性引物包括以上实施例中的一个或多个。在一些实施例中,单一反应混合物中基本上所有的多种目标特异性引物包括以上实施例中的一个或多个。
[0030] 如本文中所使用,术语“衔接子”表示可以用于相关聚核苷酸的操作的核酸分子。在一些实施例中,衔接子用于一个或多个目标核酸的扩增。在一些实施例中,衔接子用于测序反应中。在一些实施例中,衔接子具有一个或多个不具有5'磷酸残基的末端。在一些实施例中,衔接子包含至少一个引发位点、由至少一个引发位点组成或主要由至少一个引发位点组成。这类含有衔接子的引发位点可以称为“引物”衔接子。在一些实施例中,衔接子引发位点可以适用于PCR过程。在某些实施例中,衔接子包括与样品内的至少一个目标序列(本文中称为基因特异性目标序列、目标特异性序列或目标特异性引物)的3'端或5'端基本上互补的核酸序列。在一些实施例中,衔接子包括与样品中存在的任何目标序列的3'端或5'端基本上不互补的核酸序列。在一些实施例中,衔接子包括与目标核酸序列基本上不互补的单链或双链线形寡核苷酸。在一些实施例中,衔接子包括基本上与样品中的至少一个并且优选一些或全部核酸分子不互补的核酸序列。在一些实施例中,合适的衔接子长度在约
10-75个核苷酸、约12-50个核苷酸和约15-40个核苷酸长度范围内。通常,衔接子可以包括核苷酸和/或核酸的任何组合。在一些方面中,衔接子在一个或多个位置处包括一个或多个可裂解基团。在一些实施例中,衔接子包括与引物(例如通用引物)的至少一部分基本上一致性或基本上互补的序列。在一些实施例中,衔接子包括标签序列以帮助分类、鉴别或测序。在一些实施例中,衔接子充当用于目标序列的扩增的底物,尤其在合适的温度和pH值下,在存在聚合酶和dNTP的情况下。
[0031] 如本文中所使用,“聚合酶”和其派生词通常指可以催化核苷酸(包括其类似物)聚合成核酸链的任何酶。典型地但未必,这类核苷酸聚合可以模板依赖性方式进行。这类聚合酶可以包括(但不限于)天然存在的聚合酶和其任何子单元和截短物、突变型聚合酶、变异型聚合酶、重组、融合或以其它方式工程改造的聚合酶、经化学修饰的聚合酶、合成分子或组件以及保留催化这类聚合的能的任何类似物、衍生物或其片段。任选地,聚合酶可以是包含一个或多个突变的突变型聚合酶,所述突变涉及用其它基酸置换一个或多个氨基酸,来自聚合酶的一个或多个氨基酸的插入或缺失或两个或更多个聚合酶的部分的连接。典型地,聚合酶包含可以进行核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些例示性聚合酶包括(但不限于)DNA聚合酶和RNA聚合酶。如本文中所使用,术语“聚合酶”和其变化形式还指包含至少两个彼此连接的部分的融合蛋白质,其中第一部分包含可以催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包含第二多肽的第二部分。在一些实施例中,第二多肽可以包括报导子酶或增强持续合成能力的结构域。任选地,聚合酶可以具有5'核酸外切酶活性或末端转移酶活性。在一些实施例中,聚合酶可以任选地再活化,例如通过使用热、化学物质或将新的量的聚合酶再添加到反应混合物中。在一些实施例中,聚合酶可以包括可任选地再活化的热起始聚合酶和/或基于适体的聚合酶。
[0032] 如本文中所使用,术语“一致性”和“一致”和其变化形式,当关于两种或更多种核酸序列使用时,是指两种或更多种序列(例如,核苷酸或多肽序列)的序列类似性。在两种或更多种同源序列的情况下,序列或其子序列的一致性或同源性百分比表示相同(即,约70%一致性,优选地75%、80%、85%、90%、95%、98%或99%一致性)的全部单体单元(例如,核苷酸或氨基酸)的百分比。一致性百分比可以在规定区内,当出于比较窗内的最大对应而比较和比对时,或在指定区内,如使用BLAST或BLAST 2.0序列比较算法用下文所描述的默认参数或通过手动比对和目视检查所测量。当氨基酸平或核苷酸水平存在至少85%一致性时,序列被称为“基本上一致”。优选地,一致性存在于至少约25、50或100个残基长的区域内或至少一个所比较的序列的整个长度上。用于测定序列一致性百分比和序列类似性的典型算法是BLAST和BLAST 2.0算法,其描述于Altschul等人《, 核算研究(Nuc.Acids Res.)》25:3389-3402(1977)中。其它方法包括由Smith和Waterman,《应用数学进展
(Adv.Appl.Math.)》2:482(1981)以及Needleman和Wunsch,《分子生物学杂志
(J.Mol.Biol.)》48:443(1970)描述的算法等。两个核酸序列基本上一致的另一个指示是,两个分子或其互补序列在严格杂交条件下彼此杂交。
[0033] 如本文中所使用,术语“互补”和“补体”以及其派生词指可在反平行定向中(如在杂交双螺旋中)的两个或更多个独立相应位置经历累积基配对的任何两个或更多个核酸序列(例如部分或全部模板核酸分子、目标序列及/或引物)。这类碱基配对可以根据任何现有规则集合进行,例如根据沃森-克里克碱基配对规则(Watson-Crick base pairing rules)或根据一些其它碱基配对范例。任选地,第一与第二核酸序列之间可以存在“完全”或“总体”互补性,其中第一核酸序列中的每个核苷酸可以经历与第二核酸序列上的相应的反平行位置中的核苷酸的稳定化碱基配对相互作用。“部分”互补性描述一个核酸序列的至少20%但少于100%的残基与另一个核酸序列中的残基互补的核酸序列。在一些实施例中,一个核酸序列中的至少50%但少于100%的残基与另一个核酸序列中的残基互补。在一些实施例中,一个核酸序列中的至少70%、80%、90%、95%或98%但少于100%的残基与另一个核酸序列中的残基互补。当一个核酸序列中的至少85%的残基与另一个核酸序列中的残基互补时,序列被称为“基本上互补”。在一些实施例中,两个互补或基本上互补序列能够在标准或严格杂交条件下彼此杂交。“不互补”描述其中一个核酸序列中的少于20%的残基与另一个核酸序列中的残基互补的核酸序列。当一个核酸序列中的少于15%的残基与另一个核酸序列中的残基互补时,序列被称为“基本上不互补”。在一些实施例中,两个不互补或基本上不互补序列无法在标准或严格杂交条件下彼此杂交。“错配”存在于不互补的两个相对核苷酸中的任何位置。互补核苷酸包括在生理条件下,在DNA复制期间通过彼此相对的DNA聚合酶有效并入的核苷酸。在典型实施例中,在彼此位于反平行位置的核苷酸及/或聚核苷酸的核碱基之间,互补核苷酸可以彼此形成碱基对,如通过特异性沃森-克里克型氢键(Watson-Crick type hydrogen bonding)形成的A-T/U和G-C碱基对,或通过某种其它类型的碱基配对范例形成的碱基对。其它人工碱基对的互补性可以是基于其它类型的氢键和/或碱基的疏水性和/或碱基之间的形状互补性。
[0034] 如本文中所使用,“扩增的目标序列”和其衍生物通常是指使用目标特异性引物和本文所提供的方法进行目标序列的扩增/扩增目标序列而产生的核酸序列。扩增的目标序列相对于目标序列可以是同义(第二轮和后续偶数轮扩增中产生的正链)或反义(即,在第一轮和后续奇数轮扩增期间产生的负链)中的任一种。出于本公开的目的,被扩增的目标序列通常与反应中另一个被扩增的目标序列的任何部分小于50%互补。
[0035] 如本文中所使用,术语“接合”和其派生词通常指用于将两个或更多个分子共价连接在一起(例如使两个或更多个核酸分子彼此共价连接)的动作或方法。在一些实施例中,接合包括核酸的相邻核苷酸之间的结合口。在一些实施例中,接合包括形成第一核酸分子的末端与第二核酸分子的末端之间的共价键。在一些实施例中,例如其中待接合的核酸分子包括常规核苷酸残基的实施例,接合可以包括形成一个核酸的5'磷酸基与第二核酸的3'羟基之间的共价键,从而形成经接合的核酸分子。在一些实施例中,可以使用任何用于在相邻核苷酸之间使5'磷酸与3'羟基接合或结合的方法。在例示性实施例中,可以使用酶,如连接酶。
[0036] 如本文中所使用,“连接酶”和其派生词通常指任何能够催化两个衬底分子的接合的试剂。在一些实施例中,连接酶包括能够催化核酸的相邻核苷酸之间的接口的接合的酶。在一些实施例中,连接酶包括能够催化一个核酸分子的5'磷酸与另一个核酸分子的3'羟基之间形成共价键,从而形成经接合的核酸分子的酶。合适的连接酶可以包括(但不限于)T4 DNA连接酶;T7 DNA连接酶;Taq DNA连接酶,以及大肠杆菌(E.coli)DNA连接酶。
[0037] 如本文中所定义,“可裂解基团”通常指在并入核酸后可以在适当条件下裂解的任何部分。举例来说,可以将可裂解基团并入目标特异性引物、经扩增的序列、衔接子或样品的核酸分子中。在例示性实施例中,目标特异性引物可以包括可裂解基团,其变成并入经扩增的产物中并且接着在扩增之后裂解,从而从经扩增的产物去除一部分或所有目标特异性引物。可以使可裂解基团裂解或通过任何可接受的手段以其它方式从目标特异性引物、经扩增的序列、衔接子或样品的核酸分子去除。举例来说,可以通过酶促、热学、光氧化或化学处理从目标特异性引物、经扩增的序列、衔接子或样品的核酸分子去除可裂解基团。在一个方面中,可裂解基团可以包括非天然存在的核碱基。举例来说,寡脱氧核苷酸可以包括一个或多个RNA核碱基,如可以通过尿嘧啶糖基化酶去除的尿嘧啶。在一些实施例中,可裂解基团可以包括一个或多个经修饰的核碱基(如7-甲基嘌呤、8-侧氧基-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个经修饰的核苷(即,7-甲基鸟苷、8-侧氧基-脱氧鸟苷、黄苷、肌苷、二氢尿苷或5-甲基胞啶)。可以通过酶促、化学或热学手段从核酸去除经修饰的核碱基或核苷酸。在一个实施例中,可裂解基团可以包括在暴露于紫外光(即,溴脱氧尿苷)时,可以在扩增(或合成)之后从引物去除的部分。在另一实施例中,可裂解基团可以包括甲基化胞嘧啶。通常,甲基化胞嘧啶可以由引物裂解,例如在诱导扩增(或合成)之后、在亚硫酸氢钠处理时。在一些实施例中,可裂解部分可以包括限制位点。举例来说,引物或目标序列可以包括对一种或多种限制酶具有特异性的核酸序列,并且在扩增(或合成)之后,引物或目标序列可以用一种或多种限制酶处理使得去除可裂解基团。通常,可以在一个或多个位置包括一个或多个可裂解基团以及目标特异性引物、经扩增的序列、衔接子或样品的核酸分子。
[0038] 如本文中所使用,“消化”、“消化步骤”和其派生词通常指用于使可裂解基团裂解或以其它方式从目标特异性引物、经扩增的序列、衔接子或样品的核酸分子去除的任何方法。在一些实施例中,消化步骤涉及化学、热、光氧化或消化过程。
[0039] 如本文中所使用,术语“杂交”符合其在所属领域中的用途,并且通常指用于使两个核酸分子经历碱基配对相互作用的方法。当一个核酸分子的任何部分与另一个核酸分子的任何部分碱基配对时,两个核酸分子分子称为杂交;未必需要两个核酸分子跨越其整个各别长度杂交并且在一些实施例中,至少一个核酸分子可包括不与另一个核酸分子杂交的部分。短语“在严格条件下杂交”和其派生词通常指可在存在高杂交温度和低离子强度的条件下进行目标特异性引物与目标序列的杂交的条件。如本文中所使用,短语“标准杂交条件”和其派生词通常指可在存在低杂交温度和高离子强度的情况下进行引物与寡核苷酸(即,目标序列)的杂交的条件。在一个例示性实施例中,标准杂交条件包括在约50-55℃下,含有约100mM硫酸镁、约500mM Tris-硫酸盐(pH 8.9)和约200mM硫酸铵的水性环境或其等效物。
[0040] 如本文中所使用,当关于核酸分子(例如目标序列或经扩增的目标序列)使用时,术语“末端”和其派生词可以包括核酸分子的末端30个核苷酸、末端20和甚至更通常末端15个核苷酸。包含一连串相邻核苷酸的线形核酸分子通常包括至少两个末端。在一些实施例中,核酸分子的一端可以包括3'羟基或其等效物,并且可以称为“3'端”和其派生词。任选地,3'端包括未连接到单核苷酸戊糖环的5'磷酸基的3'羟基。典型地,3'端包括经定位与包括未连接的3'羟基的核苷酸相邻的一个或多个5'连接的核苷酸,通常经定位与3'羟基相邻的30个核苷酸,通常末端20个并且甚至更通常末端15个核苷酸。通常,一个或多个连接的核苷酸可以表示成寡核苷酸中存在的核苷酸的百分比,或可以与未连接的3'羟基相邻的许多连接的核苷酸形式提供。举例来说,3'端可以占寡核苷酸的核苷酸长度的小于50%。在一些实施例中,3'端不包括任何未连接的3'羟基,但可以包括任何能够充当核苷酸经由引物延伸和/或核苷酸聚合进行的连接的位点的部分。在一些实施例中,例如当参考目标特异性引物时,术语“3'端”可包括3'端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施例中,当参考目标特异性引物时,术语“3'端”可以包括位于核苷酸位置10的核苷酸或更少的来自3'端的核苷酸。如本文中所使用,“5'端”和其派生词通常指核酸分子(例如目标序列或经扩增的目标序列)的末端,其包括自由5'磷酸基或其等效物。在一些实施例中,5'端包括未连接到相邻单核苷酸戊糖环的3'羟基的5'磷酸基。通常,5'端包括经定位与5'磷酸相邻的一个或多个连接的核苷酸,通常经定位与包括5'磷酸基的核苷酸相邻的30个核苷酸,通常末端20个并且甚至更通常末端15个核苷酸。通常,一个或多个连接的核苷酸可以表示成寡核苷酸中存在的核苷酸的百分比,或可以与5'磷酸相邻的许多连接的核苷酸形式提供。举例来说,5'端可以小于寡核苷酸的核苷酸长度的50%。在另一个例示性实施例中,5'端可以包括与包括末端5'磷酸的核苷酸相邻的约15个核苷酸。在一些实施例中,5'端不包括任何未连接的5'磷酸基,但可以包括任何能够充当与3'羟基或另一个核酸分子的3'端的连接位点的部分。在一些实施例中,例如当参考目标特异性引物时,术语“5'端”可以包括5'端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施例中,当参考目标特异性引物时,术语“5'端”可以包括位于位置10处的核苷酸或更少的来自5'端的核苷酸。在一些实施例中,目标特异性引物的5'端可以仅包括不可裂解核苷酸,例如不含如本文中所公开的一个或多个可裂解基团的核苷酸,或可由所属领域的一般技术人员容易地测定的可裂解核苷酸。聚核苷酸的“第一末端”和“第二末端”是指聚核苷酸的5'端或3'端。聚核苷酸的第一末端或第二末端可以是聚核苷酸的5'端或3'端;术语“第一”和“第二”不意图表示所述末端具体是5'端或3'端。
[0041] 如本文中所使用,“标签”、“条形码”、“独特标签”或“标签序列”和其派生词通常是指衔接子内的独特短(6-14个核苷酸)核酸序列或可以充当用于区分或分离样品中的多个经扩增的目标序列的‘钥匙’的引物。出于本公开的目的,将条形码或独特标签序列并入衔接子或引物的核苷酸序列。如本文中所使用,“条形码序列”表示核酸固定的序列,其足以实现鉴别相关核酸序列的样品或来源。条形码序列可以但未必是可以用于实现鉴别的原始核酸序列的小区段。在某些实施例中,条形码的长度是5-20个核酸。在一些实施例中,条形码包含类似核苷酸,如L-DNA、LNA、PNA等。如本文中所使用,“独特标签序列”表示具有至少一个随机序列和至少一个固定序列的核酸序列。独特标签序列(单独或与第二独特标签序列结合)足以实现样品中单一目标核酸分子的鉴别。独特标签序列可以但未必包含原始目标核酸序列的小区段。在某些实施例中,独特标签序列的长度是2-50个核苷酸或碱基对,或2-25个核苷酸或碱基对,或2-10个核苷酸或基座对。独特标签序列可以包含至少一个穿插有固定序列的随机序列。
[0042] 如本文中所使用,“可比较的最大最小熔融温度”和其派生词通常是指在可裂解基团的消化之后,单一衔接子或目标特异性引物的每个核酸片段的熔融温度(Tm)。比较由衔接子或目标特异性引物产生的每个核酸片段的杂交温度以测定防止来自目标特异性引物或衔接子的核酸序列或其片段或部分与各别目标序列杂交所需的最大最小温度。在已知最大杂交温度之后,有可能操作衔接子或目标特异性引物,例如通过使一个或多个可裂解基团的位置沿引物的长度移动,以相对于每个核酸片段获得可比较的最大最小熔融温度,从而最佳化分子库制备的消化和修复步骤。
[0043] 如本文中所使用,“仅添加”和其派生词通常是指其中向第一或单一反应混合物中添加试剂和组分的一系列步骤。通常,所述系列步骤不包括将反应混合物从第一容器移动到第二容器以完成所述系列步骤。通常,仅添加方法不包括在含有反应混合物的容器外部操作反应混合物。通常,仅添加方法适合自动和高通量。
[0044] 如本文中所使用,“聚合条件”和其派生词通常是指适用于核苷酸聚合的条件。在典型实施例中,这类核苷酸聚合是由聚合酶催化。在一些实施例中,聚合条件包括用于引物延伸(任选地以模板依赖性方式中),引起产生合成核酸序列的条件。在一些实施例中,聚合条件包括聚合酶链反应(PCR)。通常,聚合条件包括使用反应混合物,其足以合成核酸并且包括聚合酶和核苷酸。聚合条件可以包括用于使目标特异性引物粘接到目标序列和引物在存在聚合酶之情况下以模板依赖性方式延伸的条件。在一些实施例中,聚合条件可以使用热循环实施。此外,聚合条件可以包括多个循环,其中重复粘接、延伸和分离两个核酸链的步骤。通常,聚合条件包括阳离子,如MgCl2。通常,一个或多个核苷酸聚合以形成核酸链包括核苷酸经由磷酸二酯键彼此连接,然而,在具体核苷酸类似物的情形下,有可能存在其它连接。
[0045] 如本文中所使用,术语“核酸”是指天然核酸、人工核酸、其类似物或其组合,包括聚核苷酸和寡核苷酸。如本文中所使用,术语“聚核苷酸”和“寡核苷酸”可以互换地使用并且意指单链和双链核苷酸聚合物,包括(但不限于)通过核苷酸间磷酸二酯连接键(例如3'-5'和2'-5'反向连接)连接的2'-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA),例如3'-3'和
5'-5'支链结构,或类似核酸。聚核苷酸具有相关抗衡离子,如H+、NH4+、三烷基铵、Mg2+、Na+等。寡核苷酸可以完全由脱氧核糖核苷酸构成,完全由核糖核苷酸构成,或由其嵌合混合物构成。寡核苷酸可以包含核碱基和糖类似物。聚核苷酸的尺寸通常在几个,例如5-40个单体单元(当其在所属领域中更普遍被称为寡核苷酸时)到数千个单体核苷酸单元(当其在所属领域中更普遍被称为聚核苷酸时)范围内;然而,出于本公开的目的,寡核苷酸和聚核苷酸都可以具有任何合适的长度。除非另外表示,否则每当表示寡核苷酸序列时,应理解,核苷酸从左到右呈5'到3'顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷,并且“U”表示脱氧尿苷。如本文中所论述和所属领域中已知,因为单核苷酸通常经由一个核苷酸的5'磷酸或等效基团连接到其相邻核苷酸的3'羟基或等效基团(任选地经由磷酸二酯或其它合适的连接)而反应以形成寡核苷酸,因此寡核苷酸和聚核苷酸被称为具有“5'端”和“3'端”。
[0046] 如本文中所使用,术语“聚合酶链反应”(“PCR”)是指以引用的方式并入的K.B.Mullis的美国专利案第4,683,195号和第4,683,202号的方法,所述专利描述一种用于在不克隆或纯化的情况下增加基因组DNA混合物中的相关聚核苷酸的片段的浓度的方法。这种用于扩增相关聚核苷酸的方法由以下组成:将大量过量的两种寡核苷酸引物引入含有所需相关聚核苷酸的DNA混合物,接着在存在DNA聚合酶的情况下进行精确的热循环序列。
两种引物与相关双链聚核苷酸的其相应链互补。为了实现扩增,使混合物变性,并且接着使引物粘接到相关聚核苷酸分子内的其互补序列。在粘接之后,用聚合酶使引物延伸以形成一对新的互补链。变性、引物粘接和聚合酶延伸的步骤可以重复多次(即,变性、粘接和延伸构成一个“循环”;可以存在许多“循环”)以获得高浓度的经扩增的所需相关聚核苷酸的片段。所需相关聚核苷酸的经扩增的片段(扩增子)的长度是通过引物相对于彼此的相对位置测定,并且因此这一长度是可控参数。借助于重复所述过程,所述方法被称为“聚合酶链反应”(在下文中称为“PCR”)。因为相关聚核苷酸的所需经扩增的片段变成混合物中的主要核酸序列(就浓度来说),所以其被称为“PCR扩增的”。如本文中所定义,包括多个目标核酸分子的样品内的目标核酸分子是经由PCR扩增。在上文所论述的方法的一个改进中,目标核酸分子可以使用多个不同引物对,在一些情况下,每个相关目标核酸分子一个或多个引物对进行PCR扩增,由此形成多重PCR反应。使用多重PCR,有可能同时从样品扩增多种相关核酸分子以形成经扩增的目标序列。还可能通过若干种不同方法(例如,用生物分析仪或qPCR定量,用经标记的探针杂交;并入生物素化的引物,接着进行抗生物素蛋白-酶结合物检测;将经32P标记的脱氧核苷酸三磷酸酯(如dCTP或dATP)并入经扩增的目标序列)检测经扩增的目标序列。任何寡核苷酸序列可以用合适的引物集合扩增,从而实现目标核酸分子从基因组DNA、cDNA、福尔林固定的石蜡包埋型DNA、细针穿刺活检(fine-needle biopsies)和多种其它来源的扩增。具体来说,由如本文中所公开的多重PCR方法产生的经扩增的目标序列本身是用于后续PCR扩增或多种下游分析法或操作的有效衬底。
[0047] 如本文中所定义,“多重扩增”是指使用至少一种目标特异性引物进行的样品内的两种或更多种目标序列的选择性和非随机扩增。在一些实施例中,进行多重扩增,使得一些或全部目标序列在单一反应容器内扩增。既定多重扩增的“重数”或“重”通常是指在所述单一多重扩增期间扩增的不同目标特异性序列的数目。在一些实施例中,重数可以是约12重、24重、48重、96重、192重、384重、768重、1536重、3072重、6144重或更多重。
[0048] 制备核酸分子库的方法
[0049] 本发明提供的方法包含实现适用于下游分析的高度多重化的分子库的快速制备的有效程序。参见图1。如果需要,所述方法任选地实现一个或多个独特标签序列的并入。某些方法包含实现极快速的分子库产生的流线型、仅添加程序。
[0050] 在本发明的一个方面中,提供用于制备目标核酸序列的分子库的方法。在一些实施例中,方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分并且通用固定结构序列不包括可裂解部分。在其中至少一个衔接子包括任选的标签序列的某些实施例中,侧接标签序列的任一个末端的衔接子序列中包括可裂解部分。
[0051] 在本发明的一个方面中,提供用于制备目标核酸序列的经标记的分子库的方法。在一些实施例中,方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分,通用固定结构序列不包括可裂解部分,并且可裂解部分侧接标签序列的任一个末端。
[0052] 在某些实施例中,每个通用序列的可比较的最大最小熔融温度高于衔接子中存在的每个目标核酸序列和每个标签序列的可比较的最大最小熔融温度。
[0053] 在一些实施例中,每个衔接子包含如本文中进一步描述的独特标签序列,并且各自进一步包含侧接每个衔接子中的标签序列的任一个末端的可裂解基团。在其中使用独特taq序列的某些实施例中,每个所产生的目标特异性扩增子序列包括至少1个不同序列和可高达107个不同序列。在某些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。
[0054] 在一些实施例中,方法包含使多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在一些实施例中,方法包含使多个有间隙的聚核苷酸产物依序与消化试剂和修复试剂接触。
[0055] 适用于本文中所提供的方法中的消化试剂包含任何能够使衔接子中的可裂解位点裂解的试剂,并且在某些实施例中,包括(但不限于)以下中的一个或组合:尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、TaqDNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。
[0056] 适用于本文中所提供的方法中的修复试剂包含任何能够修复有间隙的扩增子的试剂,并且在某些实施例中,包括(但不限于)以下中的一个或组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。
[0057] 因此,在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β中的一个或组合;以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或其组合。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。
[0058] 在一些实施例中,方法包含在单个步骤中进行消化和修复步骤。在其它实施例中,方法包含在不同温度下,以短暂分开的方式进行消化和修复步骤。
[0059] 在某些实施例中,进行本发明的方法,其中步骤的一个或多个方法是以手动模式进行。在具体实施例中,进行本发明的方法,其中方法的每个步骤是以手动方式进行。在某些实施例中,进行本发明的方法,其中方法的一个或多个步骤是以自动模式进行。在具体实施例中,进行本发明的方法,其中方法的每个步骤是自动进行。在某些实施例中,进行本发明的方法,其中方法的一个或多个步骤是以手动和自动模式的组合方式进行。
[0060] 在一些实施例中,本发明的方法包含至少一个纯化步骤。举例来说,在某些实施例中,仅在经修复的扩增子的第二扩增之后进行纯化步骤。在某些实施例中,利用两个纯化步骤,其中在消化和修复之后进行第一纯化步骤,并且在经修复的扩增子的第二扩增之后进行第二纯化步骤。
[0061] 在某些实施例中,纯化步骤包含进行固相粘附反应、固相固定反应或凝胶电泳。在某些实施例中,纯化步骤包含使用固相可逆固定(SPRI)珠粒进行的分离。在特定实施例中,纯化步骤包含使用SPRI珠粒进行的分离,其中SPRI珠粒包含顺磁珠
[0062] 在一些实施例中,方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子,接着纯化经修复的扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库;并且接着纯化所得分子库。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分并且通用固定结构序列不包括可裂解部分。在其中至少一个衔接子包括任选的标签序列的某些实施例中,侧接标签序列的任一个末端的衔接子序列中包括可裂解部分。
[0063] 在一些实施例中,方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子,接着纯化经修复的扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库;并且接着纯化所得分子库。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分,通用固定结构序列不包括可裂解部分,并且可裂解部分侧接标签序列的任一个末端。
[0064] 在一些实施例中,方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子,接着纯化经修复的扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库;并且接着纯化所得分子库。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分并且通用固定结构序列不包括可裂解部分。在其中至少一个衔接子包括任选的标签序列的某些实施例中,侧接标签序列的任一个末端的衔接子序列中包括可裂解部分。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β中的一个或组合;以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或其组合。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。
[0065] 在一些实施例中,方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子,接着纯化经修复的扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库;并且接着纯化所得分子库。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分,通用固定结构序列不包括可裂解部分,并且可裂解部分侧接标签序列的任一个末端。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β中的一个或组合;以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或其组合。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。
[0066] 在某些实施例中,在单一、仅添加工作流程反应中进行本发明的方法,实现高度多重化的目标分子库的快速产生。举例来说,在一个实施例中,用于制备目标核酸序列的分子库的方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库,以及纯化所得分子库。在某些实施例中,纯化包含在第二扩增之后产生分子库后进行的单个或重复的分离步骤;并且其中在单一反应容器中进行方法的其它步骤而无需将步骤中产生的任何产物的一部分(等分试样)转移到另一个反应容器中。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分并且通用固定结构序列不包括可裂解部分。在其中至少一个衔接子包括任选的标签序列的某些实施例中,侧接标签序列的任一个末端的衔接子序列中包括可裂解部分。
[0067] 在另一实施例中,提供用于制备目标核酸序列的经标记的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库,以及纯化所得分子库。在某些实施例中,纯化包含单个或重复分离步骤;并且其中任选地在单一反应容器中进行方法的其它步骤而无需将步骤中产生的任何产物的一部分转移到另一个反应容器中。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分,通用固定结构序列不包括可裂解部分,并且可裂解部分侧接标签序列的任一个末端。
[0068] 在一个实施例中,用于制备目标核酸序列的分子库的方法包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库,以及纯化所得分子库。
[0069] 在一些实施例中,消化试剂包含以下中的任一个或任何组合:尿嘧啶DNA糖基化酶(UDG)、AP核酸内切酶(APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在某些实施例中,消化试剂包含以下中的任一个或任何组合:尿嘧啶DNA糖基化酶(UDG)、AP核酸内切酶(APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β,其中消化试剂不含甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)。
[0070] 在某些实施例中,消化试剂包含以5'-3'方向降解之单链DNA核酸外切酶。在某些实施例中,裂解试剂包含使无碱基位点降解的单链DNA核酸外切酶。在本文中的某些实施例中,消化试剂包含RecJf核酸外切酶。在具体实施例中,消化试剂包含APE1和RecJf,其中裂解试剂包含脱嘌呤/脱嘧啶核酸内切酶。在某些实施例中,消化试剂包含AP核酸内切酶(APE1)。
[0071] 在某些实施例中,修复试剂包含至少一种DNA聚合酶;其中间隙填充试剂包含以下中的任一个或任何组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶和/或SuperFi U DNA聚合酶。在某些实施例中,修复试剂进一步包含多个核苷酸。
[0072] 在一些实施例中,修复试剂包含ATP依赖性或ATP独立性连接酶;其中修复试剂包含以下中的任一个或任何组合:大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶、9°N DNA连接酶。
[0073] 在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β中的一个或组合;以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或其组合。在具体实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中,纯化包含在第二扩增之后产生分子库后进行的单个或重复的分离步骤;并且其中在单一反应容器中进行方法的步骤而无需将步骤中产生的任何产物的一部分转移到另一个反应容器中直到第一纯化。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和任选的一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分并且通用固定结构序列不包括可裂解部分。在其中至少一个衔接子包括任选的标签序列的某些实施例中,侧接标签序列的任一个末端的衔接子序列中包括可裂解部分。
[0074] 在另一实施例中,提供用于制备目标核酸序列的经标记的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,由此产生有间隙的双链扩增子。所述方法进一步包含修复经部分消化的目标扩增子;接着,使用通用引物在第二扩增中扩增经修复的目标扩增子,由此产生目标核酸序列的分子库,以及纯化所得分子库。在某些实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG).脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β中的一个或组合;以及Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶中的任一个或其组合。在具体实施例中,消化和修复试剂包含以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、T7 DNA连接酶。在某些实施例中,纯化包含在第二扩增之后产生分子库后进行的单个或重复的分离步骤;并且其中在单一反应容器中进行方法的其它步骤而无需将步骤中产生的任何产物的一部分(等分试样)转移到另一个反应容器中。本文中的方法中使用的多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列以及可裂解部分和一个或多个标签序列。所提供的方法中包括至少两个并且可高达十万个目标特异性衔接子对,其中每个衔接子的目标核酸序列包括至少一个可裂解部分,通用固定结构序列不包括可裂解部分,并且可裂解部分侧接标签序列的任一个末端。
[0075] 在一些实施例中,基本上从所得分子库去除由方法中的第一扩增步骤产生的衔接子-二聚体副产物。在某些实施例中,扩增后所得的目标核酸的富集体含有数量减少的衔接子-二聚体副产物。在具体实施例中,衔接子二聚体副产物全部被消除。
[0076] 在一些实施例中,在少于4小时内制备分子库。在一些实施例中,在少于3小时内制备、富集和测序分子库。在一些实施例中,在2到3小时内制备、富集和测序分子库。在一些实施例中,在约2.5小时内制备分子库。在一些实施例中,在约2.75小时内制备分子库。在一些实施例中,在约3小时内制备分子库。
[0077] 组合物
[0078] 本发明的其它方面包含组合物,其包含多个核酸衔接子,以及根据本发明的方法制备的分子库组合物。所提供的组合物适合与本文中所描述的方法结合使用以及用于所属领域中已知的其它分析和应用。
[0079] 因此,提供包含多个核酸衔接子的组合物,其中多个衔接子中的每一个均包含5'通用固定结构序列、任选的一个或多个标签序列以及3'目标核酸序列,其中每个衔接子包含可裂解部分,其中衔接子的目标核酸序列包括至少一个可裂解部分,并且当存在标签序列时,可裂解部分侧接标签序列的任一个末端,并且其中通用固定结构序列不包括可裂解部分。所提供的组合物中包括至少两个并且可高达十万个目标特异性衔接子对。所提供的组合物实现高度多重化的目标分子库的快速产生。
[0080] 在一些实施例中,所提供的组合物包含多个核酸衔接子,其中多个衔接子中的每一个均包含5'通用固定结构序列、一个或多个标签序列以及3'目标核酸序列,其中每个衔接子包含可裂解部分;其中衔接子的目标核酸序列包括至少一个可裂解部分,可裂解部分侧接标签序列的任一个末端并且通用固定结构序列不包括可裂解部分。所提供的组合物中包括至少两个并且可高达十万个目标特异性衔接子对。所提供的组合物实现高度多重化、经标记的目标分子库的快速产生。
[0081] 引物/衔接子组合物可以是单链或双链的。在某些实施例中,衔接子组合物包含单链衔接子。在某些实施例中,衔接子组合物包含双链衔接子。在某些实施例中,衔接子组合物包含单链和双链衔接子的混合物。
[0082] 在一些实施例中,组合物包括多个能够扩增一个或多个目标核酸序列的衔接子,其包含能够扩增至少两个不同目标核酸序列的多个衔接子对,其中目标特异性引物序列与组合物中的其它目标特异性引物序列基本上不互补。在一些实施例中,组合物包含至少25、50、75、100、150、200、250、300、350、400、450、500、750、1000、1250、1500、1750、2000、2250、
2500、2750、3000、3250、3500、3750、4000、4500、5000、5500、6000、7000、8000、9000、10000、
11000或12000个或更多个目标特异性衔接子对。在一些实施例中,目标特异性对的长度包含约15个核苷酸到约40个核苷酸,其中至少一个核苷酸由可裂解基团置换。在某些实施例中,可裂解基团是尿苷核苷酸。在一些实施例中,目标特异性衔接子对被设计成扩增与临床或病理学病状相关联的基因组的外显子、基因、外显子组或区域,例如扩增包含一种或多种与癌症(例如癌、结肠癌、乳癌等)相关联的突变(例如驱动突变)的一个或多个位点,或扩增与遗传性疾病(例如囊肿性纤维化、肌营养不良等)相关联的突变。在一些实施例中,当与目标序列杂交并且如本文中所提供的扩增时,目标特异性衔接子对产生长度为约100到约
600个碱基对的衔接子接合的经扩增的目标序列的分子库。在一些实施例中,与分子库中的其它衔接子接合的经扩增的目标序列的其余部分相比,没有一个衔接子接合的经扩增的目标序列在分子库中过表达超过30%。在一些实施例中,在GC含量、经扩增的目标序列长度或各别目标序列的熔融温度(Tm)方面,衔接子接合的经扩增的目标序列分子库是基本上同源的。
[0083] 在一些实施例中,本发明的组合物中的衔接子对的目标特异性引物序列是目标特异性序列,其可以扩增核酸分子的特异性区域。在一些实施例中,目标特异性衔接子可以扩增基因组DNA或cDNA。在一些实施例中,目标特异性衔接子可以扩增哺乳动物核酸,如(但不限于)人DNA或RNA、鼠类DNA或RNA、DNA或RNA、犬科动物DNA或RNA、马DNA或RNA或任何其它相关哺乳动物。在其它实施例中,目标特异性衔接子包括与扩增相关植物核酸相关的序列。在其它实施例中,目标特异性衔接子包括与扩增传染剂(例如细菌和/或病毒核酸)相关的序列。在一些实施例中,选择性扩增所需的核酸的量是约1ng到1微克。在一些实施例中,选择性扩增一个或多个目标序列所需的核酸的量是约1ng、约5ng或约10ng。在一些实施例中,选择性扩增目标序列所需的核酸的量是约10ng到约200ng。
[0084] 如本文中所描述,多个衔接子中的每一个均包含5'通用固定结构序列。在某些实施例中,通用固定结构序列包含扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中,每个衔接子通用固定结构序列的可比较的最大最小熔融温度高于同一个衔接子中存在的每个目标核酸序列和每个标签序列的可比较的最大最小熔融温度。优选地,所提供的衔接子的通用固定结构序列与相关的独特标签序列和/或目标核酸序列的任何部分不呈现显著互补性和/或杂交。在某些实施例中,第一通用固定结构序列包含扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中,第二通用固定结构序列包含扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中,第一和第二通用固定结构序列对应于正向和反向通用固定结构序列并且在某些实施例中,多个目标特异性衔接子对中的每一个均包括相同的第一和第二通用固定结构序列。在根据本发明的方法的分子库产生中,靶向这类正向和反向通用固定结构序列以及通用引物以进行经修复的扩增子的第二扩增。在某些实施例中,第一5'通用固定结构序列包含两个通用固定结构序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合);并且第二5'通用序列包含两个通用固定结构序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合),其中5'第一和第二通用固定结构序列与相关目标核酸序列的任何部分不呈现显著杂交。
[0085] 通用扩增引物或通用引物的结构和特性是所属领域的技术人员众所周知的,并且可以实施以与所提供的方法和组合物一起使用以适合特异性分析平台。相应地调整本文中提供的衔接子的通用固定结构序列以适应优选的通用引物序列。举例来说,如本文中所描述,在所属领域中已描述具有任选的条形码序列的通用P1和A引物并且用于Ion Torrent测序平台(Ion XpressTM Adapters,Thermo Fisher Scientific)上的测序。类似地,所属领域中描述和已知的额外和其它通用衔接子/引物序列(例如可以在例如https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_
1000000002694-01.pdf发现Illumina通用衔接子/引物序列;可以在例如https://
s3.amazonaws.com/files.pacb.com/pdf/Guide_Pacific_Biosciences_Template_
Preparation_and_Sequencing.pdf发现PacBio通用衔接子/引物序列;等)可以与本文中提供的方法和组合物结合使用。可以使用标准自动核酸合成仪器和所属领域中常用的试剂容易地制备适合与本发明的衔接子一起使用的核苷酸序列的合适的通用引物。包括一种单一类型的通用引物或单独类型的两种不同通用引物(或甚至混合物)(例如适用于第二扩增中的经修复的扩增子的扩增的一对通用扩增引物)用于本发明的方法中。通用引物任选地包括不同标签(条形码)序列,其中标签(条形码)序列不与衔接子杂交。在第二通用扩增中并入扩增子的条形码序列可例如用于样品源的有效鉴别。
[0086] 在某些实施例中,衔接子进一步包含位于5'第一通用固定结构序列与3'目标特异性序列之间的独特标签序列,并且其中独特标签序列不呈现与相关独特标签序列和/或目标核酸序列的任何部分的显著互补性和/或杂交。在某些实施例中,多个引物衔接子对具有104-109个不同标签序列组合。因此,在某些实施例中,每个所产生的目标特异性衔接子对包含104-109个不同标签序列。在某些实施例中,多个引物衔接子包含每个目标特异性衔接子,其包含至少1个不同的独特标签序列并且可高达105个不同的独特标签序列。在某些实施例中,多个引物衔接子包含每个目标特异性衔接子,其包含至少1个不同的独特标签序列并且可高达105个不同的独特标签序列。在某些实施例中,每个所产生的目标特异性扩增子包含至少两个并且可高达109个包含不同标签序列的不同衔接子组合,其各自具有两个不同的独特标签序列。在某些实施例中,多个引物衔接子包含每个目标特异性衔接子,其包含4096个不同标签序列。在某些实施例中,每个所产生的目标特异性扩增子包含高达16,777,216个包含不同标签序列的不同衔接子组合,其各自具有两个不同的独特标签序列。
[0087] 在某些实施例中,多个衔接子中的单独引物衔接子包括独特标签序列(例如包含于标签衔接子中),其包含与固定标签序列相间的不同随机标签序列。在一些实施例中,至少一个独特标签序列包含至少一个随机序列和至少一个固定序列,或包含在两侧上由固定序列侧接的随机序列,或包含在两侧上由随机序列侧接的固定序列。在某些实施例中,独特标签序列包括固定序列,其长度是2-2000个核苷酸或碱基对。在某些实施例中,独特标签序列包括随机序列,其长度是2-2000个核苷酸或碱基对。
[0088] 在一些实施例中,独特标签序列包括具有至少一个穿插有固定序列的随机序列的序列。在一些实施例中,多个独特标签中的单独标签具有结构(N)n(X)x(M)m(Y)y,其中“N”表示由A、G、C、T、U或I产生的随机标签序列,并且其中“n”是2-10,其表示“N”随机标签序列的核苷酸长度;其中“X”表示固定标签序列,并且其中“x”是2-10,其表示“X”随机标签序列的核苷酸长度;其中“M”表示由A、G、C、T、U或I产生的随机标签序列,其中随机标签序列“M”与随机标签序列“N”不同或相同,并且其中“m”是2-10,其表示“M”随机标签序列的核苷酸长度;并且其中“Y”表示固定标签序列,其中“Y”的固定标签序列与“X”的固定标签序列相同或不同,且其中“y”是2-10,其表示“Y”随机标签序列的核苷酸长度。在一些实施例中,固定标签序列“X”在多个标签中相同。在一些实施例中,固定标签序列“X”在多个标签中不同。在一些实施例中,固定标签序列“Y”在多个标签中相同。在一些实施例中,固定标签序列“Y”在多个标签中不同。在一些实施例中,多个单链衔接子内的固定标签序列“(X)x”和“(Y)y”是序列比对锚。
[0089] 在一些实施例中,独特标签序列内的随机序列由“N”表示,且固定序列由“X”表示。因此,独特标签序列由N1N2N3X1X2X3或N1N2N3X1X2X3N4N5N6X4X5X6表示。任选地,独特标签序列可以具有随机序列,其中一些或全部核苷酸位置随机地选自由以下组成的组:A、G、C、T、U和I。
举例来说,随机序列内的各位置处的核苷酸独立地选自A、G、C、T、U或I中的任一个,或选自这六种不同类型的核苷酸的子集。任选地,随机序列内的各位置处的核苷酸独立地选自A、G、C或T中的任一个。在一些实施例中,第一固定标签序列“X1X2X3”是多个标签中的相同或不同序列。在一些实施例中,第二固定标签序列“X4X5X6”是多个标签中的相同或不同序列。在一些实施例中,多个衔接子内的第一固定标签序列“X1X2X3”和第二固定标签序列“X4X5X6”是序列比对锚。
[0090] 在一些实施例中,独特标签序列包含序列5'-NNNACTNNNTGA-3',其中“N”表示由A、G、C或T随机产生的随机序列内的位置,计算为46(或4^6)的有可能的不同随机标签的数目是约4096,并且两个独特标签的有可能的不同组合是412(或4^12)的数目是约1678万。在一些实施例中,5'-NNNACTNNNTGA-3'中的带下划线的部分是序列比对锚。
[0091] 在一些实施例中,独特标签序列内的固定序列是可以用于产生错误校正测序资料的序列比对锚。在某些实施例中,独特标签序列内的固定序列是可以用于产生错误校正测序读段家族的序列比对锚。
[0092] 本文中提供的衔接子包含至少一个可裂解部分。在某些实施例中,可裂解部分在3'目标特异性序列内。在某些实施例中,可裂解部分位于5'第一通用固定结构序列与3'目标特异性序列之间的接合点处或其附近。在某些实施例中,可裂解部分位于5'第一通用固定结构序列与独特标签序列之间的接合点处或其附近,和位于独特标签序列与3'目标特异性序列之间的接合点处或其附近。可裂解部分可以存在于经修饰的核苷酸、核苷或核碱基中。在一些实施例中,可裂解部分可以包括不在相关目标序列中天然存在的核碱基。
[0093] 在某些实施例中,多个衔接子中的至少一个可裂解部分是尿嘧啶碱基、尿苷或脱氧尿苷核苷酸。在某些实施例中,可裂解部分在3'目标特异性序列内并且位于5'通用固定结构序列与独特标签序列和/或3'目标特异性序列之间的接面处,其中多个衔接子中的至少一个可裂解部分可由尿嘧啶DNA糖基化酶(UDG)裂解。在一些实施例中,可裂解部分裂解,产生敏感无碱基位点,其中至少一个能够在无碱基位点上反应的酶产生包含可延伸的3'端的间隙。在某些实施例中,所得间隙包含5'-脱氧核糖磷酸基。在某些实施例中,所得间隙包含可延伸的3'端和5'可接合磷酸基。
[0094] 在另一实施例中,肌苷可以并入基于DNA的核酸中作为可裂解基团。在一个例示性实施例中,EndoV可用于在肌苷残基附近裂解。在另一个例示性实施例中,酶hAAG可用于裂解来自产生无碱基位点的核酸的肌苷残基。
[0095] 当存在可裂解部分时,衔接子中至少一个可裂解部分的位置不显著改变多个双链衔接子中的任何既定双链衔接子的熔融温度(Tm)。来自多个双链衔接子的任何两个既定双链衔接子的熔融温度(Tm)基本上相同,其中任何两个既定双链衔接子的熔融温度(Tm)彼此相差不超过10℃。然而,在多个衔接子中的每一个内,序列区域的熔融温度不同,使得例如通用固定结构序列的可比较的最大最小熔融温度高于任何衔接子的独特标签序列和/或目标特异性序列的可比较的最大最小熔融温度。可以调节可比较的最大最小熔融温度的这种局部差异以最佳化扩增子的消化和修复,并且最终改良本文中所提供的方法的有效性。
[0096] 还提供包含由本发明的方法产生的核酸分子库的组合物。因此,提供包含多个扩增后所得目标核酸扩增子的组合物,其中多个扩增子中的每一个均包含5'通用固定结构序列、任选的第一独特标签序列、中间目标核酸序列、任选的第二独特标签序列以及3'通用固定结构序列。所提供的组合物中包括至少两个并且可高达十万个目标特异性扩增子。所提供的组合物包括高度多重化的目标分子库。在一些实施例中,所提供的组合物包含多个核酸扩增子,其中多个扩增子中的每一个均包含5'通用固定结构序列、第一独特标签序列、中间目标核酸序列、第二独特标签序列以及3'通用固定结构序列。所提供的组合物中包括至少两个并且可高达十万个目标特异性经标记的扩增子。所提供的组合物包括高度多重化的经标记的目标分子库。
[0097] 在一些实施例中,分子库组合物包括多个目标特异性扩增子,其包含至少两个不同目标核酸序列的多重物。在一些实施例中,组合物包含至少25、50、75、100、150、200、250、300、350、400、450、500、750、1000、1250、1500、1750、2000、2250、2500、2750、3000、3250、
3500、3750、4000、4500、5000、5500、6000、7000、8000、9000、10000、11000或12000个或更多个目标特异性扩增子。在一些实施例中,目标特异性扩增子包含与临床或病理学病状相关联的基因组的一个或多个外显子、基因、外显子组或区域,例如包含一个或多个位点的扩增子,所述位点包含与癌症(例如肺癌、结肠癌、乳癌等)相关联的一个或多个突变(例如驱动突变),或包含与遗传性疾病(例如囊肿性纤维化、肌营养不良等)相关联的突变的扩增子。
在一些实施例中,目标特异性扩增子包含衔接子接合的扩增子目标序列的分子库,其长度是约100到约750个碱基对。
[0098] 如本文中所描述,多个扩增子中的每一个均包含5'通用固定结构序列。在某些实施例中,通用固定结构序列包含扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。优选地,所提供的衔接子的通用固定结构序列与相关的独特标签序列和/或目标核酸序列的任何部分不呈现显著互补性和/或杂交。在某些实施例中,第一通用固定结构序列包含扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中,第二通用固定结构序列包含扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列中的任一个或任何组合。在某些实施例中,第一和第二通用固定结构序列对应于正向和反向通用固定结构序列并且在某些实施例中,多个目标特异性扩增子中的每一个均包括相同的第一和第二通用固定结构序列。在根据本发明的方法的产生所得扩增产物时,靶向这类正向和反向通用固定结构序列以及通用引物以进行初级分子库组合物的第二扩增。在某些实施例中,第一5'通用固定结构序列包含两个通用固定结构序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合);并且第二5'通用序列包含两个通用固定结构序列(例如扩增引物结合序列、测序引物结合序列和/或捕获引物结合序列的组合),其中5'第一和第二通用固定结构序列与相关目标核酸序列的任何部分不呈现显著杂交。
[0099] 通用扩增引物或通用引物的结构和特性是所属领域的技术人员众所周知的,并且可以实施以与所提供的方法和组合物一起使用以适合特异性分析平台。相应地调整本文中提供的衔接子和扩增子的通用固定结构序列以适应优选的通用引物序列。举例来说,如本文中所描述,在所属领域中已描述具有任选的条形码序列的通用P1和A引物并且用于Ion Torrent测序平台(Ion XpressTM Adapters,Thermo Fisher Scientific)上的测序。类似地,所属领域中描述和已知的额外和其它通用衔接子/引物序列(例如可以在例如https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf发现Illumina通用衔接子/引物序列;可以在例如https://
s3.amazonaws.com/files.pacb.com/pdf/Guide_Pacific_Biosciences_Template_
Preparation_and_Sequencing.pdf发现PacBio通用衔接子/引物序列;等)可以与本文中提供的方法和组合物结合使用。可以使用标准自动核酸合成仪器和所属领域中常用的试剂容易地制备适合与本发明的分子库一起使用的核苷酸序列的合适的通用引物。一种单一类型或单独类型的两个不同通用引物(或甚至混合物)(例如一对适用于扩增初级分子库的通用扩增引物)可用于产生本发明的分子库。通用引物任选地包括标签(条形码)序列,其中标签(条形码)序列不与衔接子序列或目标核酸序列杂交。在第二通用扩增中并入扩增子的条形码序列可以例如用于有效鉴别样品源,由此产生带条形码的分子库。因此,所提供的组合物包括高度多重化的带条形码的目标分子库。所提供的组合物还包括高度多重化的带条形码的经标记的目标分子库。
[0100] 在某些实施例中,扩增子分子库包含位于5'第一通用固定结构序列与3'目标特异性序列之间的独特标签序列,并且其中独特标签序列不呈现与独特标签序列和/或目标核酸序列的任何部分的显著互补性和/或杂交。在某些实施例中,多个扩增子具有104-109个不同标签序列组合。因此,在某些实施例中,分子库中的多个扩增子中的每一个均包含104-109个不同标签序列。在某些实施例中,分子库中的多个扩增子中的每一个均包含至少1个不同独特标签序列和可高达105个不同独特标签序列。在某些实施例中,分子库中的每个目标特异性扩增子包含至少两个并且可高达109个包含不同标签序列的不同组合,其各自具有两个不同的独特标签序列。在某些实施例中,分子库中的多个扩增子中的每一个均包含标签序列,其包含4096个不同标签序列。在某些实施例中,分子库中的每个目标特异性扩增子包含高达16,777,216个包含不同标签序列的不同组合,其各自具有两个不同独特标签序列。
[0101] 在某些实施例中,分子库中的多个扩增子中的单独扩增子包括独特标签序列(例如包含于标签衔接子序列中),其包含与固定标签序列相间的不同随机标签序列。在一些实施例中,至少一个独特标签序列包含至少一个随机序列和至少一个固定序列,或包含在两侧上由固定序列侧接的随机序列,或包含在两侧上由随机序列侧接的固定序列。在某些实施例中,独特标签序列包括固定序列,其长度是2-2000个核苷酸或碱基对。在某些实施例中,独特标签序列包括随机序列,其长度是2-2000个核苷酸或碱基对。
[0102] 在一些实施例中,独特标签序列包括具有至少一个穿插有固定序列的随机序列的序列。在一些实施例中,多个独特标签中的单独标签具有结构(N)n(X)x(M)m(Y)y,其中“N”表示由A、G、C、T、U或I产生的随机标签序列,并且其中“n”是2-10,其表示“N”随机标签序列的核苷酸长度;其中“X”表示固定标签序列,并且其中“x”是2-10,其表示“X”随机标签序列的核苷酸长度;其中“M”表示由A、G、C、T、U或I产生的随机标签序列,其中随机标签序列“M”与随机标签序列“N”不同或相同,并且其中“m”是2-10,其表示“M”随机标签序列的核苷酸长度;并且其中“Y”表示固定标签序列,其中“Y”的固定标签序列与“X”的固定标签序列相同或不同,且其中“y”是2-10,其表示“Y”随机标签序列的核苷酸长度。在一些实施例中,固定标签序列“X”在多个标签中相同。在一些实施例中,固定标签序列“X”在多个标签中不同。在一些实施例中,固定标签序列“Y”在多个标签中相同。在一些实施例中,固定标签序列“Y”在多个标签中不同。在一些实施例中,多个扩增子内的固定标签序列“(X)x”和“(Y)y”是序列比对锚。
[0103] 在一些实施例中,独特标签序列内的随机序列由“N”表示,且固定序列由“X”表示。因此,独特标签序列由N1N2N3X1X2X3或N1N2N3X1X2X3N4N5N6X4X5X6表示。任选地,独特标签序列可以具有随机序列,其中一些或全部核苷酸位置随机地选自由以下组成的组:A、G、C、T、U和I。
举例来说,随机序列内的各位置处的核苷酸独立地选自A、G、C、T、U或I中的任一个,或选自这六种不同类型的核苷酸的子集。任选地,随机序列内的各位置处的核苷酸独立地选自A、G、C或T中的任一个。在一些实施例中,第一固定标签序列“X1X2X3”是多个标签中的相同或不同序列。在一些实施例中,第二固定标签序列“X4X5X6”是多个标签中的相同或不同序列。在一些实施例中,多个扩增子内的第一固定标签序列“X1X2X3”和第二固定标签序列“X4X5X6”是序列比对锚。
[0104] 在一些实施例中,独特标签序列包含序列5'-NNNACTNNNTGA-3',其中“N”表示由A、G、C或T随机产生的随机序列内的位置,计算为46(或4^6)的有可能的不同随机标签的数目是约4096,并且两个独特标签的有可能的不同组合是412(或4^12)的数目是约1678万。在一些实施例中,5'-NNNACTNNNTGA-3'中的带下划线的部分是序列比对锚。
[0105] 在一些实施例中,独特标签序列内的固定序列是可以用于产生错误校正测序资料的序列比对锚。在某些实施例中,独特标签序列内的固定序列是可以用于产生错误校正测序读段家族的序列比对锚。
[0106] 试剂盒、系统
[0107] 本文中还提供用于使用本发明的第一或第二方面的方法制备目标核酸的分子库的试剂盒。试剂盒的实施例包含能够产生第一扩增产物的如本文中所定义的至少一对目标特异性衔接子的供应源,以及任选的至少一对能够粘接到衔接子的通用固定结构并且引发扩增产物的合成的通用扩增引物的供应源,所述扩增产物将包括接合到通用序列的相关目标序列。衔接子和/或引物可以提供于准备好使用的试剂盒中,或更优选地以在使用之前需要稀释的浓缩物形式,或甚至呈需要在使用之前复原的冻干或干燥形式。在某些实施例中,试剂盒进一步包括用于稀释或复原组分的合适的稀释剂的供应源。任选地,试剂盒进一步包含用于在产生如本文所提供的分子库时进行扩增、消化、修复和/或纯化的试剂、缓冲液、酶、dNTP等的供应源。这类试剂的非限制性实例描述于随附范例的材料和方法部分中。试剂盒中任选地供应的其它组分包括适用于纯化使用所提供的方法制备的分子库的组分。在一些实施例中,提供用于产生目标特异性分子库的试剂盒,其包含多个具有5'通用固定结构序列、3'目标特异性序列和可裂解基团的目标特异性衔接子;DNA聚合酶;衔接子;dATP;dCTP;dGTP;dTTP以及消化试剂。在一些实施例中,试剂盒进一步包含一种或多种抗体、修复试剂、任选地包含核酸条形码的通用引物、纯化溶液或柱。
[0108] 包含在试剂盒中的衔接子的具体特征在本文中关于本发明的其它方面的地方描述。通用扩增引物的结构和特性是所属领域的技术人员众所周知的,并且可以实施以与所提供的方法和组合物一起使用以适应特异性分析平台(例如本文中所描述,已在所属领域中描述通用P1和A引物并且用于Ion Torrent测序平台上的测序)。类似地,所属领域中描述和已知的额外和其它通用衔接子/引物序列(例如Illumina通用衔接子/引物序列、PacBio通用衔接子/引物序列等)可以与本文中提供的方法和组合物结合使用。可以使用标准自动核酸合成仪器和所属领域中常用的试剂容易地制备适合与试剂盒中所包括的衔接子一起使用的核苷酸序列的合适的引物。试剂盒可以包括一种单一类型的通用引物或单独类型的两个不同通用引物(或甚至混合物)(例如一对适用于在第一扩增中扩增经衔接子修饰的模板的扩增引物)的供应源。试剂盒可以包含至少一对用于根据本发明的方法的相关样品的第一扩增的衔接子,加至少两个不同的扩增引物,其任选地携带不同标签(条形码)序列,其中标签(条形码)序列不与衔接子杂交。试剂盒可以用于扩增至少两个不同样品,其中分别根据本发明的方法扩增每个样品并且第二扩增包含使用具有条形码的单一通用引物,且接着在分子库制备之后合并所制备的样品分子库。在某些实施例中,试剂盒包括用于本文中所描述的第二扩增步骤的不同的通用引物对。在此情形中,‘通用’引物对可以具有基本上一致的核苷酸序列,但在某一其它特征或修饰方面不同。
[0109] 还提供系统,例如用于实践本文所提供的方法和/或包含本文中提供的组合物的系统。在一些实施例中,系统有助于以自动模式进行的方法。在某些实施例中,系统有助于高通量模式。在某些实施例中,系统包括例如流体操作元件、流体容纳元件、用于实现和保持所需反应温度的热源和/或散热器,和/或能够视需要将系统的组件从一个位置移动到另一个位置的机器人元件(例如多孔盘操作元件)。
[0110] 样品
[0111] 如本文中所定义,“样品”和其衍生物以其最广泛含义使用并且包括疑似包括目标核酸的任何样本、培养物等。在一些实施例中,样品包含DNA、RNA、嵌合核酸、杂交核酸、核酸的多重形式或前述中的两种或更多种的任何组合。在某些实施例中,适合与本发明的方法一起使用的样品包括任何含有一个或多个相关目标核酸的生物学、临床、手术、农业、基于大气或水生的样本。在一些实施例中,样品包括从动物(如人或哺乳动物来源)获得的核酸分子。在另一实施例中,样品包括从非哺乳动物来源(如植物、细菌、病毒或真菌)获得的核酸分子。在一些实施例中,核酸分子的来源可以是存档或灭绝的样品或物种。在某些实施例中,样品包括例如由来源制备的经分离的核酸样品,如基因组DNA、RNA,或所制备的样品,例如新鲜冷冻或福尔马林固定石蜡包埋(FFPE)的核酸样本。还设想来自单一个体的样品;来自遗传相关成员的核酸样品的集合;来自非遗传相关成员的多个核酸样品;来自单一个体的多个核酸样品(匹配),如肿瘤样品和正常组织样品;或来自单一来源的遗传物质,其含有两种不同形式的遗传物质,如从母体个体获得的母体和胎儿DNA,或在含有植物或动物DNA的样品中存在污染性细菌DNA。在一些实施例中,核酸材料的来源包括从新生儿获得的核酸(例如用于初生儿筛检的血液样品)。在一些实施例中,所提供的方法包含来自单一核酸样品的多个目标特异性序列的扩增。在一些实施例中,所提供的方法包含来自两个或更多个核酸样品或物种的两个或更多个目标序列的目标特异性扩增。在某些实施例中,所提供的方法包含来自单一样品的高度多重化的目标核酸序列的扩增。在具体实施例中,所提供的方法包含来自超过一个样品(各自来自相同来源生物体)的高度多重化的目标核酸序列的扩增。
[0112] 在某些实施例中,样品包含目标核酸和非目标核酸的混合物。在某些实施例中,样品包含多个初始聚核苷酸,其包含一个或多个目标核酸的混合物并且可以包括一个或多个非目标核酸。在某些实施例中,包含多个聚核苷酸的样品包含原始样品的一部分或等分试样;在一些实施例中,样品包含多个聚核苷酸,其是整个原始样品。在某些实施例中,样品包含在不同时间点从相同来源或相同个体分离的多个初始聚核苷酸。
[0113] 在一些实施例中,核酸样品包括来自生物体液的不含细胞的核酸、来自组织的核酸、来自活检组织的核酸、来自针刺活检的核酸、来自单一细胞的核酸或来自两个或更多个细胞的核酸。在某些实施例中,单一反应混合物含有1-100ng多个初始聚核苷酸。在某些实施例中,多个初始聚核苷酸包含福尔马林固定石蜡包埋(FFPE)的样品;基因组DNA;RNA;不含细胞的DNA或RNA;循环肿瘤DNA或RNA;新鲜冷冻样品,或前述中的两种或更多种的混合物;并且在某些实施例中,多个初始聚核苷酸包含核酸参考标准。在一些实施例中,样品包括从活检体、肿瘤、刮片、拭子、血液、粘液、尿液、血浆、精液、毛发、激光捕获显微解剖、手术切除和其它临床或实验室获得的样品获得的核酸分子。在一些实施例中,样品是流行病学、农业、法医或病原性样品。在某些实施例中,样品包括参考物。在某些实施例中,样品是正常组织或有据可查的肿瘤样品。在某些实施例中,参考物是标准核酸序列(例如Hg19)。
[0114] 目标核酸序列分析
[0115] 本发明的所提供的方法和组合物尤其适用于扩增、任选地标记和制备目标序列以用于后续分析。因此,在一些实施例中,本文中所提供的方法包括对所得分子库制备物进行分析。举例来说,方法包含分析目标核酸的聚核苷酸序列并且在合适时,分析添加到目标核酸中的任何标签序列。在其中扩增多个目标核酸区域的某些实施例中,所提供的方法包括测定多个目标核酸的聚核苷酸序列。所提供的方法进一步任选地包括使用第二标签序列(例如条形码序列)鉴别目标序列的来源(或提供其它关于样品源的信息)。在某些实施例中,提供所制备的分子库组合物的用途,其用于分析核酸分子库的序列。
[0116] 在具体实施例中,提供所制备的经标记的分子库组合物的用途,其用于进一步分析目标核酸分子库的序列。在某些实施例中,序列测定包含测定样品中至少一个目标序列的丰度。在某些实施例中,测定核酸分子库的序列包含测定样品中的低频率出现的等位基因。在某些实施例中,测定核酸分子库的序列包含测定多个聚核苷酸中是否存在突变型目标核酸。在一些实施例中,测定是否存在突变型目标核酸包含侦测多个聚核苷酸中至少一个突变型目标核酸的丰度水平。举例来说,这类测定包含侦测至少一个突变型目标核酸占样品中原始多个聚核苷酸的0.05%到1%、侦测至少一个突变型目标核酸占样品中聚核苷酸的约1%到约5%和/或侦测样品中至少85%-100%的目标核酸。在一些实施例中,测定是否存在突变型目标核酸包含侦测和鉴别样品中的拷贝数目变化和/或遗传融合序列。
[0117] 在一些实施例中,借助于本公开的教示内容产生的经扩增的目标序列的核酸测序包括重新测序或靶向再测序。在一些实施例中,核酸测序进一步包括针对参考核酸序列比较经扩增的目标序列的核酸测序结果。在一些实施例中,目标分子库序列的核酸测序进一步包括测定核酸序列内存在或不存在突变。在一些实施例中,核酸测序包括鉴别与疾病(例如癌症和/或遗传性疾病)相关联的遗传标记。
[0118] 在一些实施例中,所制备的所公开的方法的目标序列的分子库用于具有或不具有进一步纯化或操作的各种下游分析或分析法中。在某些实施例中,分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在某些实施例中,通过高通量下一代测序进行分析。在具体实施例中,以双向方式进行测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。
[0119] 在一些实施例中,接着进一步操作根据本文中所提供的方法制备的分子库以用于其它分析。举例来说,\所制备的分子库序列用于所属领域中已知的下游富集技术中,如桥式扩增或emPCR以产生模板分子库,其接着用于下一代测序中。在一些实施例中,目标核酸分子库用于富集应用和测序应用中。举例来说,使用任何合适的DNA测序平台实现所提供的目标核酸分子库的序列测定。在一些实施例中,所公开的方法的分子库序列或随后制备的模板分子库用于单核苷酸多形现象(SNP)分析、基因分型或表观遗传分析、拷贝数目变化分析、基因表达分析、基因突变分析(包括(但不限于)检测、预后和/或诊断)、罕见或低频率出现的等位基因突变的检测和分析、核酸测序(包括(但不限于)重新测序、靶向重测序)以及合成组装分析。在一个实施例中,所制备的分子库序列用于检测等位基因出现率小于5%的突变。在一些实施例中,本文中所公开的方法用于检测核酸群体中的等位基因出现率小于4%、3%、2%或为约1%的突变。在另一实施例中,对如本文中所描述制备的分子库进行测序以检测和/或鉴别来自核酸分子群体的生殖系或体细胞突变。在某些实施例中,使测序衔接子接合到所制备的分子库的末端,产生适用于核酸测序的多个分子库。
[0120] 在一些实施例中,提供用于制备目标特异性扩增子分子库的方法,以用于多种下游过程或分析法,如核酸测序或克隆扩增。在一些实施例中,使用桥式扩增或emPCR来扩增分子库以产生适用于核酸测序的多个克隆模板。举例来说,任选地在目标特异性扩增之后进行二级和/或三级扩增过程,包括(但不限于)分子库扩增步骤和/或克隆扩增步骤。“克隆扩增”是指产生单个分子的多个拷贝。使用所属领域中已知的各种方法进行克隆扩增。举例来说,乳液PCR是一种方法,并且涉及在油相内,在水性气泡中分离单独DNA分子和涂有引物的珠粒。接着,聚合酶链反应(PCR)用所分离的分子库分子的克隆拷贝涂布各珠粒,并且接着固定这些珠粒以用于后续测序。乳液PCR用于由Marguilis等人以及Shendure和Porreca等人公开的方法(也称为“聚合酶克隆测序”,由Agencourt商业化并且最近由Applied Biosystems获得)中。Margulies等人,(2005)《自然(Nature)》437:376-380;Shendure等人,《科学(Science)》309(5741):1728-1732。另一用于克隆扩增的方法是“桥式PCR”,其中在引物连接到固体表面时扩增片段。这些方法以及其它克隆扩增方法都产生许多实体上分离的位置,其各自含有来源于单一分子聚核苷酸片段的多个拷贝。因此,在一些实施例中,使用例如桥式扩增或emPCR来扩增一个或多个目标特异性扩增子以产生适用于核酸测序的多个克隆模板。
[0121] 在一些实施例中,至少一个待克隆扩增的分子库序列连接到负载物或粒子。负载物可以包含任何合适的材料并且具有任何合适的形状,包括例如平坦、球形或颗粒。在一些实施例中,负载物是如美国公开申请案第20100304982号中所描述的支架聚合粒子,其以全文引用的方式并入本文中。在某些实施例中,方法包含在负载物(例如测序负载物)上沉积至少一部分分子库序列的富集体,其中负载物包含测序反应位点的阵列。在一些实施例中,分子库序列的富集体连接到负载物上的测序反应位点,其中负载物包含102-1010个测序反应位点的阵列。
[0122] 序列测定意指测定与核酸序列相关的信息并且可以包括鉴别或测定核酸的部分和全部序列信息。可以在不同程度的统计可靠性或置信度下测定序列信息。在某些实施例中,序列分析包括高通量、低深度检测,如通过qPCR、rtPCR和/或所属领域中已知的阵列杂交检测方法进行。在一些实施例中,测序分析包括深度序列评估的测定,如通过桑格测序(Sanger sequencing)或其它高通量下一代测序方法进行。下一代测序意指使用以本质上大规模平行方式(例如其中以例如平行方式读取许多序列)测定许多(通常数千到数十亿个)核酸序列的方法或使用本身可以平行化的超高通量连续方法进行序列测定。因此,在某些实施例中,本发明的方法包括测序分析,其包含大规模平行测序。这类方法包括(但不限于)焦磷酸测序(例如由454Life Sciences,Inc.,Branford,Conn.商业化);接合测序(例如由SOLiDTM技术,Life Technologies,Inc.,Carlsbad,Calif.商业化);使用经修饰的核苷酸TM TM进行的合成测序(如由TruSeq 和HiSeg 技术,Illumina,Inc.,San Diego,Calif.;
HeliScope TM,Helicos Biosciences Corporation,Cambridge,Mass.;和PacBio
或RS系统,Pacific Biosciences of California,Inc.,Menlo Park,Calif.商业化)、通过离子检测技术进行的测序(例如Ion Torrent TM技术,Life Technologies,Carlsbad,Calif.);DNA纳米球的测序(Complete Genomics,Inc.,Mountain View,Calif.);基于纳米孔的测序技术(例如由Oxford Nanopore Technologies,LTD,Oxford,UK开发)和类似的高度平行化测序方法。
[0123] 举例来说,在某些实施例中,借助于本公开的教示内容产生的分子库的产率足以用于多种下游应用,包括使用Ion TorrentTM PGM系统(例如PCR介导的核酸片段分子库添加TM TM到Ion Sphere 粒子上)(Life Technologies,产品号4467389)或Ion Torrent Proton 系统的Ion XpressTM模板试剂盒。举例来说,用于从扩增子分子库制备模板分子库的说明可以见于Ion Xpress模板试剂盒用户指南(Life Technologies,产品号4465884)中,其以全文引用的方式并入本文中。用于将后续模板分子库装载到Ion TorrentTM Chip上以用于核酸测序的说明描述于离子测序用户指南(Ion Sequencing User Guide,产品号4467391)中,其以全文引用的方式并入本文中。类似地,可以使用经调适的方法进行使用其它平台(例如PacBio、Illumina、Helicos、Complete Genomics、Oxford Nanopore)进行的测序,以根据由每个各别平台提供的说明和指导并入相关模板制备。
[0124] 可以通过将测序引物粘接到固相扩增反应的产物来提供测序反应的起始点。在这方面,在模板分子库形成期间添加的一个或两个衔接子可以包括核苷酸序列,其实现测序引物粘接到由完全基因组或模板分子库的固相扩增衍生的扩增产物。取决于本发明的实施例的实施方式,可以在来自单一测序引物的单一读段中或在来自两个不同测序引物的多个读段中测定标签序列和/或目标核酸序列。在来自两个测序引物的两个读段的情况下,以任一种顺序进行‘标签读段’和‘目标序列读段’,并且进行合适的变性步骤以在完成第一测序读段之后去除所粘接的引物。
[0125] 在一些实施例中,测序仪与应用参数或软件服务器耦合,以测定扩增后所得目标核酸分子的序列。在某些实施例中,测序仪与应用参数或软件的服务器耦合,以测定样品中是否存在低频率出现的突变等位基因。
[0126] 实施例
[0127] 在一个实施例中,提供用于制备目标核酸序列的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复经部分消化的目标扩增子;以及使用通用引物在第二扩增中扩增经修复的目标扩增子,其中多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列和可裂解部分,其中包括至少两个并且可高达十万个目标特异性衔接子对,并且其中衔接子的目标核酸序列包括至少一个可裂解部分且通用固定结构序列不包括可裂解部分。多个衔接子中的每一个任选地包含一个或多个标签序列。由此,这类方法产生目标核酸序列的分子库。在一些实施例中,在单一步骤中进行消化和修复。在具体实施例中,消化中的多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在其它实施例中,在不同温度下,以短暂分开的方式进行消化和修复步骤。在具体实施例中,消化中的多个有间隙的聚核苷酸产物依序与消化和修复试剂接触。在某些实施例中,以手动模式或自动模式或其组合进行方法的一个或多个步骤。在具体实施例中,以自动模式进行方法的每个步骤。在某些实施例中,前述方法进一步包含至少一个纯化步骤。在具体实施例中,仅在第二通用扩增步骤之后进行纯化步骤。在其它具体实施例中,在消化和修复步骤之后进行纯化并且在第二通用扩增之后进行另一次纯化。在一些实施例中,从所得分子库去除由第一扩增产生的衔接子-二聚体副产物,并且在某些实施例中,扩增后所得目标核酸的富集体含有降低的量的衔接子-二聚体副产物。在某些实施例中,衔接子-二聚体副产物全部被消除。在前述方法中,能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。在一些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。在某些实施例中,每个所产生的目标特异性扩增子序列包括至少1个不同序列并且可高达107个不同序列。在一些实施例中,前述方法进一步包含分析目标核酸序列的所得分子库的序列。这类分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在其它实施例中,前述方法进一步包含测定样品中至少一个目标核酸序列的丰度。在某些实施例中,这类测定是通过高通量下一代测序进行。在具体实施例中,以双向方式进行这类测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。在某些实施例中,前述方法包含消化试剂,其选自以下中的任一个或其组合:
尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在一些实施例中,前述方法方法包含修复试剂,其选自以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。在具体实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。在更具体的实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。在优选实施例中,前述方法产生包含核酸分子库的组合物。在尤其优选实施例中,所产生的包含核酸分子库的组合物适用于序列分析。在特定实施例中,用途包含测定样品中的低频率出现的等位基因。
[0128] 在一个实施例中,提供用于制备目标核酸序列的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复经部分消化的目标扩增子;以及使用通用引物在第二扩增中扩增经修复的目标扩增子,其中多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列和可裂解部分,并且至少一个衔接子中包括标签序列,并且可裂解部分侧接标签序列的任一个末端,其中包括至少两个并且可高达十万个目标特异性衔接子对,并且其中衔接子的目标核酸序列包括至少一个可裂解部分且通用固定结构序列不包括可裂解部分。由此,这类方法产生目标核酸序列的分子库。在一些实施例中,在单一步骤中进行消化和修复。在具体实施例中,消化中的多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在其它实施例中,在不同温度下,以短暂分开的方式进行消化和修复步骤。在具体实施例中,消化中的多个有间隙的聚核苷酸产物依序与消化和修复试剂接触。在某些实施例中,以手动模式或自动模式或其组合进行方法的一个或多个步骤。在具体实施例中,以自动模式进行方法的每个步骤。在某些实施例中,前述方法进一步包含至少一个纯化步骤。在具体实施例中,仅在第二通用扩增步骤之后进行纯化步骤。在其它具体实施例中,在消化和修复步骤之后进行纯化并且在第二通用扩增之后进行另一次纯化。在一些实施例中,从所得分子库去除由第一扩增产生的衔接子-二聚体副产物,并且在某些实施例中,扩增后所得目标核酸的富集体含有降低的量的衔接子-二聚体副产物。在某些实施例中,衔接子-二聚体副产物全部被消除。在前述方法中,能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。在一些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。在某些实施例中,每个所产生的目标特异性扩增子序列包括至少1个不同序列并且可高达107个不同序列。在一些实施例中,前述方法进一步包含分析目标核酸序列的所得分子库的序列。这类分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在其它实施例中,前述方法进一步包含测定样品中至少一个目标核酸序列的丰度。在某些实施例中,这类测定是通过高通量下一代测序进行。在具体实施例中,以双向方式进行这类测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。在某些实施例中,前述方法包含消化试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在一些实施例中,前述方法方法包含修复试剂,其选自以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。在具体实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。在更具体的实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。在优选实施例中,前述方法产生包含核酸分子库的组合物。在尤其优选实施例中,所产生的包含核酸分子库的组合物适用于序列分析。在特定实施例中,用途包含测定样品中的低频率出现的等位基因。
[0129] 在一个实施例中,提供用于制备目标核酸序列的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复经部分消化的目标扩增子;以及使用通用引物在第二扩增中扩增经修复的目标扩增子,其中多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列和可裂解部分,其中包括至少两个并且可高达十万个目标特异性衔接子对,并且其中衔接子的目标核酸序列包括至少一个可裂解部分且通用固定结构序列不包括可裂解部分,并且每个通用序列的熔融温度高于存在的每个目标核酸序列和每个标签序列的熔融温度。多个衔接子中的每一个任选地包含一个或多个标签序列。由此,这类方法产生目标核酸序列的分子库。在一些实施例中,在单一步骤中进行消化和修复。在具体实施例中,消化中的多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在其它实施例中,在不同温度下,以短暂分开的方式进行消化和修复步骤。在具体实施例中,消化中的多个有间隙的聚核苷酸产物依序与消化和修复试剂接触。在某些实施例中,以手动模式或自动模式或其组合进行方法的一个或多个步骤。在具体实施例中,以自动模式进行方法的每个步骤。在某些实施例中,前述方法进一步包含至少一个纯化步骤。在具体实施例中,仅在第二通用扩增步骤之后进行纯化步骤。在其它具体实施例中,在消化和修复步骤之后进行纯化并且在第二通用扩增之后进行另一次纯化。在一些实施例中,从所得分子库去除由第一扩增产生的衔接子-二聚体副产物,并且在某些实施例中,扩增后所得目标核酸的富集体含有降低的量的衔接子-二聚体副产物。在某些实施例中,衔接子-二聚体副产物全部被消除。在前述方法中,能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。在一些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。在某些
7
实施例中,每个所产生的目标特异性扩增子序列包括至少1个不同序列并且可高达10个不同序列。在一些实施例中,前述方法进一步包含分析目标核酸序列的所得分子库的序列。这类分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在其它实施例中,前述方法进一步包含测定样品中至少一个目标核酸序列的丰度。在某些实施例中,这类测定是通过高通量下一代测序进行。在具体实施例中,以双向方式进行这类测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。在某些实施例中,前述方法包含消化试剂,其选自以下中的任一个或其组合:
尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在一些实施例中,前述方法方法包含修复试剂,其选自以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。在具体实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。在更具体的实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。在优选实施例中,前述方法产生包含核酸分子库的组合物。在尤其优选实施例中,所产生的包含核酸分子库的组合物适用于序列分析。在特定实施例中,用途包含测定样品中的低频率出现的等位基因。
[0130] 在一个实施例中,提供用于制备目标核酸序列的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复经部分消化的目标扩增子;以及使用通用引物在第二扩增中扩增经修复的目标扩增子,其中多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列和可裂解部分,其中包括至少两个并且可高达十万个目标特异性衔接子对,并且其中衔接子的目标核酸序列包括至少一个可裂解部分且通用固定结构序列不包括可裂解部分。多个衔接子中的每一个任选地包含一个或多个标签序列。在单一、仅添加工作流程反应中进行这类方法,实现高度多重化的目标分子库的快速产生,由此产生目标核酸序列的分子库。在一些实施例中,在单一步骤中进行消化和修复。在具体实施例中,消化中的多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在其它实施例中,在不同温度下,以短暂分开的方式进行消化和修复步骤。在具体实施例中,消化中的多个有间隙的聚核苷酸产物依序与消化和修复试剂接触。在某些实施例中,以手动模式或自动模式或其组合进行方法的一个或多个步骤。在具体实施例中,以自动模式进行方法的每个步骤。在某些实施例中,前述方法进一步包含至少一个纯化步骤。在具体实施例中,仅在第二通用扩增步骤之后进行纯化步骤。在其它具体实施例中,在消化和修复步骤之后进行纯化并且在第二通用扩增之后进行另一次纯化。在一些实施例中,从所得分子库去除由第一扩增产生的衔接子-二聚体副产物,并且在某些实施例中,扩增后所得目标核酸的富集体含有降低的量的衔接子-二聚体副产物。在某些实施例中,衔接子-二聚体副产物全部被消除。在前述方法中,能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。在一些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。在某些实施例中,7
每个所产生的目标特异性扩增子序列包括至少1个不同序列并且可高达10个不同序列。在一些实施例中,前述方法进一步包含分析目标核酸序列的所得分子库的序列。这类分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在其它实施例中,前述方法进一步包含测定样品中至少一个目标核酸序列的丰度。在某些实施例中,这类测定是通过高通量下一代测序进行。在具体实施例中,以双向方式进行这类测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。在某些实施例中,前述方法包含消化试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在一些实施例中,前述方法方法包含修复试剂,其选自以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。在具体实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:
尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。在更具体的实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。在优选实施例中,前述方法产生包含核酸分子库的组合物。在尤其优选实施例中,所产生的包含核酸分子库的组合物适用于序列分析。在特定实施例中,用途包含测定样品中的低频率出现的等位基因。
[0131] 在一个实施例中,提供用于制备目标核酸序列的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复经部分消化的目标扩增子;以及使用通用引物在第二扩增中扩增经修复的目标扩增子,其中多个衔接子中的每一个均包含通用固定结构序列和目标核酸序列和可裂解部分,并且所有衔接子包含具有侧接标签序列的任一个末端的可裂解基团的标签序列,其中包括至少两个并且可高达十万个目标特异性衔接子对,并且其中衔接子的目标核酸序列包括至少一个可裂解部分且通用固定结构序列不包括可裂解部分。由此,这类方法产生目标核酸序列的分子库。在一些实施例中,在单一步骤中进行消化和修复。在具体实施例中,消化中的多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在其它实施例中,在不同温度下,以短暂分开的方式进行消化和修复步骤。在具体实施例中,消化中的多个有间隙的聚核苷酸产物依序与消化和修复试剂接触。在某些实施例中,以手动模式或自动模式或其组合进行方法的一个或多个步骤。在具体实施例中,以自动模式进行方法的每个步骤。在某些实施例中,前述方法进一步包含至少一个纯化步骤。在具体实施例中,仅在第二通用扩增步骤之后进行纯化步骤。在其它具体实施例中,在消化和修复步骤之后进行纯化并且在第二通用扩增之后进行另一次纯化。
在一些实施例中,从所得分子库去除由第一扩增产生的衔接子-二聚体副产物,并且在某些实施例中,扩增后所得目标核酸的富集体含有降低的量的衔接子-二聚体副产物。在某些实施例中,衔接子-二聚体副产物全部被消除。在前述方法中,能够扩增一个或多个目标核酸序列的多个衔接子包含能够扩增至少两个不同目标核酸序列的多个衔接子对。在一些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。在某些实施例中,每个所产生的目标特异性扩增子序列包括至少1个不同序列并且可高达107个不同序列。在一些实施例中,前述方法进一步包含分析目标核酸序列的所得分子库的序列。这类分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在其它实施例中,前述方法进一步包含测定样品中至少一个目标核酸序列的丰度。在某些实施例中,这类测定是通过高通量下一代测序进行。在具体实施例中,以双向方式进行这类测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。在某些实施例中,前述方法包含消化试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在一些实施例中,前述方法方法包含修复试剂,其选自以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。在具体实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。在更具体的实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。在优选实施例中,前述方法产生包含核酸分子库的组合物。在尤其优选实施例中,所产生的包含核酸分子库的组合物适用于序列分析。在特定实施例中,用途包含测定样品中的低频率出现的等位基因。
[0132] 在一个实施例中,提供用于制备目标核酸序列的分子库的方法,其包含使核酸样品与多个衔接子接触,所述衔接子能够在其中目标核酸经历第一扩增的条件下扩增样品中的一个或多个目标核酸序列;消化所得第一扩增产物以减少或消除所得引物二聚体并且制备部分消化的目标扩增子,从而产生有间隙的双链扩增子,并进而修复经部分消化的目标扩增子;以及使用通用引物在第二扩增中扩增经修复的目标扩增子,其中多个衔接子中的每一个均包含通用固定结构序列、一个或多个标签序列、目标核酸序列和可裂解部分;并且其中包括至少两个且可高达十万个目标特异性衔接子对,并且其中衔接子的目标核酸序列包括至少一个可裂解部分,可裂解部分侧接标签序列的任一个末端且通用固定结构序列不包括可裂解部分。在某些实施例中,每个通用序列的熔融温度高于存在的每个目标核酸序列和每个标签序列的熔融温度。由此,这类方法产生目标核酸序列的分子库。在具体实施例中,在单一、仅添加工作流程反应中进行这类方法,实现高度多重化的目标分子库的快速产生。在一些实施例中,在单一步骤中进行消化和修复。在具体实施例中,消化中的多个有间隙的聚核苷酸产物同时与消化和修复试剂接触。在其它实施例中,在不同温度下,以短暂分开的方式进行消化和修复步骤。在具体实施例中,消化中的多个有间隙的聚核苷酸产物依序与消化和修复试剂接触。在某些实施例中,以手动模式或自动模式或其组合进行方法的一个或多个步骤。在具体实施例中,以自动模式进行方法的每个步骤。在某些实施例中,前述方法进一步包含至少一个纯化步骤。在具体实施例中,仅在第二通用扩增步骤之后进行纯化步骤。在其它具体实施例中,在消化和修复步骤之后进行纯化并且在第二通用扩增之后进行另一次纯化。在一些实施例中,从所得分子库去除由第一扩增产生的衔接子-二聚体副产物,并且在某些实施例中,扩增后所得目标核酸的富集体含有降低的量的衔接子-二聚体副产物。在某些实施例中,衔接子-二聚体副产物全部被消除。在前述方法中,能够扩增两个或更多个目标核酸序列的多个衔接子包含能够扩增目标核酸序列的多个衔接子对。在某些实施例中,所有衔接子包含带有侧接标签序列的任一个末端的可裂解基团的标签序列。在一些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个包含不同标签序列的不同衔接子组合。在某些实施例中,每个所产生的目标特异性扩增子序列包括至少1个
7
不同序列并且可高达10个不同序列。在一些实施例中,前述方法进一步包含分析目标核酸序列的所得分子库的序列。这类分析包含通过传统测序反应进行的测序、高通量下一代测序、靶向多重阵列序列检测或前述中的两种或更多种的任何组合。在其它实施例中,前述方法进一步包含测定样品中至少一个目标核酸序列的丰度。在某些实施例中,这类测定是通过高通量下一代测序进行。在具体实施例中,以双向方式进行这类测序,由此产生任何既定扩增子的正向链和反向链中的序列读段。在某些实施例中,前述方法包含消化试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、RecJf、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Nth核酸内切酶III、核酸内切酶VIII、聚核苷酸激酶(PNK)、Taq DNA聚合酶、DNA聚合酶I和/或人DNA聚合酶β。在一些实施例中,前述方法方法包含修复试剂,其选自以下中的任一个或其组合:Phusion DNA聚合酶、Phusion U DNA聚合酶、SuperFi DNA聚合酶、Taq DNA聚合酶、人DNA聚合酶β、T4 DNA聚合酶和/或T7 DNA聚合酶、SuperFiU DNA聚合酶、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、Taq DNA连接酶和/或9°N DNA连接酶。在具体实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、脱嘌呤核酸内切酶(例如APE1)、Taq DNA聚合酶、Phusion U DNA聚合酶、SuperFiU DNA聚合酶、7DNA连接酶。在更具体的实施例中,前述方法包含消化和修复试剂,其选自以下中的任一个或其组合:尿嘧啶DNA糖基化酶(UDG)、甲酰胺基嘧啶[fapy]-DNA糖基化酶(fpg)、Phusion U DNA聚合酶、Taq DNA聚合酶、SuperFiU DNA聚合酶、T4 PNK和T7 DNA连接酶。在优选实施例中,前述方法产生包含核酸分子库的组合物。在尤其优选实施例中,所产生的包含核酸分子库的组合物适用于序列分析。在特定实施例中,用途包含测定样品中的低频率出现的等位基因。
[0133] 在一个实施例中,提供一种组合物,其包含多个核酸衔接子,其中多个衔接子中的每一个均包含5'通用固定结构序列、一个或多个标签序列和3'目标核酸序列,其中每个衔接子包含可裂解部分,衔接子的目标核酸序列包括至少一个可裂解部分,可裂解部分侧接标签序列的任一个末端且通用固定结构序列不包括可裂解部分,并且包括至少两个且可高达十万个目标特异性衔接子对。在某些实施例中,每个衔接子通用序列的熔融温度高于同一个衔接子中存在的每个目标核酸序列和每个标签序列的熔融温度。所提供的组合物实现高度多重化的目标分子库的快速产生。在具体实施例中,组合物包含能够扩增至少两个不同目标核酸序列的多个衔接子对。在某些实施例中,多个衔接子的每个目标特异性对包括高达16,777,216个不同衔接子组合,其包含不同标签序列。在某些实施例中,组合物各自产生由多个衔接子的目标特异性对产生的目标特异性扩增子,从而产生至少1个不同序列且可高达107个不同序列。前述组合物包含衔接子,其中其是单链或双链的。其它实施例提供试剂盒,其包含前述实施例中的任一个的衔接子组合物。在某些实施例中,这类试剂盒进一步包含扩增试剂、消化试剂和修复试剂中的任一种或多种。在某些实施例中,这类试剂盒进一步包含扩增试剂、消化试剂和修复试剂。
[0134] 范例
[0135] 实例1
[0136] 本发明所提供的方法包含能够获得快速、高度多重化的PCR的流线型程序。参见图1。本发明任选地实现视需要并入一个或多个独特标签序列。本发明的例示性方法包含以下方案:
[0137] 实例1A
[0138] 材料和方法
[0139] 可以在分析RNA和DNA的样品中进行任选的反转录(RT)反应方法(10μL反应物):
[0140] 材料
[0141] 在微管或微孔中混合2μL  5x SuperScriptTM  VILOTM(Thermo Fisher Scientific),
[0142] ≤8μL体积的DNA+RNA样品用于≤20ng总量的DNA+RNA样品(全部核酸(TNA)的约1%RNA样品);
[0143] 将不含核酸酶的H2O添加到试管/孔上以达到10μL总反应体积;
[0144] 方法:
[0145] 42℃保持30分钟
[0146] 85℃保持1分钟
[0147] 保持4℃(无限期)
[0148] 扩增:
[0149] 材料
[0150]
[0151] 扩增:
[0152] 98℃保持2分钟
[0153] 3个以下循环:
[0154] 98℃保持30秒
[0155] 64℃保持2分钟
[0156] 62℃保持2分钟
[0157] 60℃保持4分钟
[0158] 58℃保持2分钟
[0159] 72℃保持30秒
[0160] 72℃保持2分钟
[0161] 保持4℃(无限期)。
[0162] 消化、填充、接合:
[0163] 材料
[0164]
[0165] 方法
[0166] 混合以上材料,添加到反应混合物中。
[0167] 培育:
[0168] 30℃保持20分钟
[0169] 55℃保持20分钟
[0170] 25℃保持10分钟
[0171] 98℃保持2分钟
[0172] 保持4℃(无限期)
[0173] 使用35μl 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得经修复的样品。
[0174] 扩增:
[0175] 材料
[0176] 1μl P1和A-通用引物,任选地含有条形码序列(Ion XpressTM Adapters,Thermo Fisher Scientific)
[0177] 方法
[0178] 培育:
[0179] 98℃保持2分钟
[0180] 22个以下循环:
[0181] 98℃保持15秒
[0182] 64℃保持15秒
[0183] 72℃保持15秒
[0184] 72℃保持5分钟
[0185] 保持4℃(无限期)
[0186] 使用35μl 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得样品。任选地,重复纯化步骤1次到2次。
[0187] 实例1B
[0188] 材料和方法
[0189] 可以在分析RNA和DNA的样品中进行任选的反转录(RT)反应方法(10μL反应物):
[0190] 材料
[0191] 在微管或微孔中混合2μL  5x SuperScriptTM  VILOTM(Thermo Fisher Scientific),
[0192] ≤8μL体积的DNA+RNA样品用于≤20ng总量的DNA+RNA样品(全部核酸(TNA)的约1%RNA样品);
[0193] 将不含核酸酶的H2O添加到试管/孔上以达到10μL总反应体积;
[0194] 方法:
[0195] 42℃保持30分钟
[0196] 85℃保持1分钟
[0197] 保持4℃(无限期)
[0198] 扩增:
[0199] 材料
[0200]
[0201] 扩增:
[0202] 98℃保持2分钟
[0203] 3个以下循环:
[0204] 98℃保持30秒
[0205] 64℃保持2分钟
[0206] 62℃保持2分钟
[0207] 60℃保持4分钟
[0208] 58℃保持2分钟
[0209] 72℃保持30秒
[0210] 72℃保持2分钟
[0211] 保持4℃(无限期)。
[0212] 消化、填充、接合:
[0213] 材料
[0214]
[0215] 方法
[0216] 混合以上材料,添加到反应混合物中。
[0217] 培育:
[0218] 30℃保持20分钟
[0219] 55℃保持20分钟
[0220] 25℃保持10分钟
[0221] 98℃保持2分钟
[0222] 保持4℃(无限期)
[0223] 扩增:
[0224] 材料
[0225] 1μl P1和A-通用引物,任选地含有条形码序列(Ion XpressTM Adapters,Thermo Fisher Scientific)
[0226] 方法
[0227] 培育:
[0228] 98℃保持2分钟
[0229] 22个以下循环:
[0230] 98℃保持15秒
[0231] 64℃保持15秒
[0232] 72℃保持15秒
[0233] 72℃保持5分钟
[0234] 保持4℃(无限期)
[0235] 使用35μl 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得样品。任选地,可以重复纯化步骤1次到2次。
[0236] 实例1C
[0237] 材料和方法
[0238] 可以在分析RNA和DNA的样品中进行任选的反转录(RT)反应方法(10μL反应物):
[0239] 材料
[0240] 在微管或微孔中混合2μL  5x SuperScriptTM  VILOTM(Thermo Fisher Scientific),
[0241] ≤8μL体积的DNA+RNA样品用于≤20ng总量的DNA+RNA样品(全部核酸(TNA)的约1%RNA样品);
[0242] 将不含核酸酶的H2O添加到试管/孔上以达到10μL总反应体积;
[0243] 方法:
[0244] 42℃保持30分钟
[0245] 85℃保持1分钟
[0246] 保持4℃(无限期)
[0247] 扩增:
[0248] 材料
[0249]
[0250] 扩增
[0251] 在96孔盘的孔中组合反应材料混合物,使用以下方法扩增:
[0252] 99℃保持2分钟
[0253] 3进行以下循环:
[0254] 99℃保持30秒
[0255] 64℃保持2分钟
[0256] 62℃保持2分钟
[0257] 60℃保持4分钟
[0258] 58℃保持2分钟
[0259] 72℃保持30秒
[0260] 72℃保持2分钟
[0261] 保持4℃(无限期)
[0262] 消化、填充、接合:
[0263] 材料
[0264]
[0265] 方法
[0266] 混合以上材料,添加到反应混合物中
[0267] 培育:
[0268] 30℃保持15分钟
[0269] 50℃保持15分钟
[0270] 55℃保持15分钟
[0271] 25℃保持10分钟
[0272] 98℃保持2分钟
[0273] 保持4℃(无限期)
[0274] 扩增
[0275] 材料
[0276] 1μl P1和A-条形码-通用引物,任选地含有条形码序列(Ion XpressTM Adapters,Thermo Fisher Scientific)
[0277] 方法
[0278] 将以上材料添加到反应孔中,扩增:
[0279] 99℃保持2分钟
[0280] 20个循环:
[0281] 99℃保持20秒
[0282] 64℃保持20秒
[0283] 72℃保持20秒
[0284] 72℃保持5分钟
[0285] 保持4℃(无限期)
[0286] 使用1X 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得样品。任选地,可以重复纯化步骤1次到2次。
[0287] 实例1D
[0288] 材料和方法
[0289] 可以在分析RNA和DNA的样品中进行任选的反转录(RT)反应方法(10μL反应物):
[0290] 材料
[0291] 在微管或微孔中混合2μL  5x SuperScriptTM  VILOTM(Thermo Fisher Scientific),
[0292] ≤8μL体积的DNA+RNA样品用于≤20ng总量的DNA+RNA样品(全部核酸(TNA)的约1%RNA样品);
[0293] 将不含核酸酶的H2O添加到试管/孔上以达到10μL总反应体积;
[0294] 方法:
[0295] 42℃保持30分钟
[0296] 85℃保持1分钟
[0297] 保持4℃(无限期)
[0298] 扩增:
[0299] 材料
[0300]
[0301] 任选地,反应中可以包括对照物(例如Acrometrix Oncology Hotspot Control(Thermo Fisher Scientific))
[0302] 扩增
[0303] 在96孔盘的孔中组合反应材料混合物,密封,涡旋并且离心盘,使用以下方法扩增:
[0304] 99℃保持1秒
[0305] 3进行以下循环:
[0306] 99℃保持30秒
[0307] 64℃保持2分钟
[0308] 60℃保持6分钟
[0309] 72℃保持30秒
[0310] 接着72℃保持2分钟
[0311] 保持4℃(无限期)
[0312] 消化、填充、接合:
[0313] 材料
[0314]
[0315] 方法
[0316] 混合以上材料,添加到反应混合物中,密封盘,涡旋并且离心培育:
[0317] 30℃保持15分钟
[0318] 50℃保持15分钟
[0319] 55℃保持15分钟
[0320] 25℃保持10分钟
[0321] 98℃保持2分钟
[0322] 保持4℃(无限期)
[0323] 扩增
[0324] 材料
[0325] 1μl每种P1和A-条形码-通用引物,任选地带条形码的序列(Ion XpressTM Adapters,Thermo Fisher Scientific);或1μL每种10μM BC1-Ah,和1μL 10μM P1-P1h(IonCodeTM Barcode Adapters,Thermo Fisher Scientific),用于单向分子库
[0326] 方法
[0327] 将以上材料添加到反应孔中,密封盘,涡旋并且离心,接着扩增:
[0328] 99℃保持15秒
[0329] 5个循环:
[0330] 99℃保持15秒
[0331] 62℃保持20秒
[0332] 72℃保持20秒
[0333] 15个循环:
[0334] 99℃保持15秒
[0335] 70℃保持40秒
[0336] 72℃保持5分钟
[0337] 保持4℃(无限期)
[0338] 使用1X 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得样品。
[0339] 任选地,可以重复纯化1次到2次。
[0340] 实例1E
[0341] 材料和方法
[0342] 扩增:
[0343] 材料
[0344]
[0345]
[0346] 扩增
[0347] 在96孔盘的孔中组合反应材料混合物,密封盘,涡旋并且离心,使用以下方法扩增:
[0348] 99℃保持1秒
[0349] 3个以下循环:
[0350] 99℃保持30秒
[0351] 64℃保持2分钟
[0352] 60℃保持6分钟
[0353] 72℃保持30秒
[0354] 72℃保持2分钟
[0355] 保持4℃(无限期)
[0356] 消化、填充、接合:
[0357] 材料
[0358]
[0359]
[0360] 方法
[0361] 混合以上材料,添加到反应混合物中,密封盘,涡旋并且离心
[0362] 培育:
[0363] 30℃保持15分钟
[0364] 50℃保持15分钟
[0365] 55℃保持15分钟
[0366] 25℃保持10分钟
[0367] 98℃保持2分钟
[0368] 保持4℃(无限期)
[0369] 扩增
[0370] 材料
[0371] 1μL 10μM BC1-Ah、1μL 10μM P1-Uh、1.5μL 10μM BC1-Uh以及1.5μL10μM P1-Ah。本文中用于双向分子库制备。BC1-Ah包含条形码序列和本文中的正向衔接子的通用A固定结构的互补序列;BC1-Uh包含条形码序列和本文中的反向衔接子B、C、D或E中的任一个的通用固定结构的互补序列;P1-Uh包含Ion衔接子P1衔接子序列、条形码序列以及本文中的反向衔接子B、C、D或E中的任一个的通用B、C、D或E固定结构的互补序列;P1-Ah包含Ion衔接子P1衔接子序列、条形码序列以及本文中的正向衔接子的A固定结构的通用固定结构的互补序列。参见图7。
[0372] 方法
[0373] 江以上材料添加到反应孔中,密封盘,涡旋,离心,接着扩增:
[0374] 99℃保持15秒
[0375] 5个循环:
[0376] 99℃保持15秒
[0377] 62℃保持20秒
[0378] 72℃保持20秒
[0379] 15个循环:
[0380] 99℃保持15秒
[0381] 70℃保持40秒
[0382] 72℃保持5分钟
[0383] 保持4℃(无限期)
[0384] 使用1X 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得样品。
[0385] 任选地,可以重复纯化1次到2次。
[0386] 实例1F
[0387] 材料和方法
[0388] 可以在分析RNA和DNA的样品中进行任选的反转录(RT)反应方法(10μL反应物):
[0389] 材料
[0390] 在微管或微孔中混合2μL  5x SuperScriptTM  VILOTM(Thermo Fisher Scientific),
[0391] ≤8μL体积的DNA+RNA样品用于≤20ng总量的DNA+RNA样品(全部核酸(TNA)的约1%RNA样品);
[0392] 将不含核酸酶的H2O添加到试管/孔上以达到10μL总反应体积;
[0393] 方法:
[0394] 42℃保持30分钟
[0395] 85℃保持1分钟
[0396] 保持4℃(无限期)
[0397] 扩增:
[0398] 材料
[0399]
[0400] 任选地,反应中可以包括对照物(例如Acrometrix Oncology Hotspot Control(Thermo Fisher Scientific))
[0401] 扩增
[0402] 在96孔盘的孔中组合反应材料混合物,密封,涡旋并且离心盘,使用以下方法扩增:
[0403] 99℃保持1秒
[0404] 3进行以下循环:
[0405] 99℃保持30秒
[0406] 64℃保持2分钟
[0407] 60℃保持6分钟
[0408] 72℃保持30秒
[0409] 接着72℃保持2分钟
[0410] 保持4℃(无限期)
[0411] 消化、填充、接合:
[0412] 材料
[0413]
[0414]
[0415] 方法
[0416] 混合以上材料,添加到反应混合物中,密封盘,涡旋并且离心
[0417] 培育:
[0418] 30℃保持15分钟
[0419] 50℃保持15分钟
[0420] 55℃保持15分钟
[0421] 25℃保持10分钟
[0422] 98℃保持2分钟
[0423] 保持4℃(无限期)
[0424] 扩增
[0425] 材料
[0426] 1μl以下中的每一种:(1)P5-索引-A-固定结构引物;(2)P5-索引-I-固定结构引物;(3)P7-索引-A-固定结构引物;以及(4)P7-索引-I-固定结构引物。参见表F。
[0427] 方法
[0428] 将以上材料添加到反应孔中,密封盘,涡旋并且离心,接着扩增:
[0429] 99℃保持15秒
[0430] 5个循环:
[0431] 99℃保持15秒
[0432] 62℃保持20秒
[0433] 72℃保持20秒
[0434] 15个循环:
[0435] 99℃保持15秒
[0436] 70℃保持40秒
[0437] 72℃保持5分钟
[0438] 保持4℃(无限期)
[0439] 使用1X 珠粒(Beckman Coulter,Inc.)根据制造商说明纯化所得样品。
[0440] 任选地,可以重复纯化1次到2次。
[0441] 实例2
[0442] 所提供的方法的第一步骤包含数轮扩增,例如三到六轮扩增,并且在某些实例中,使用针对每个基因特异性目标序列的正向和反向衔接子进行的三轮扩增。每个衔接子含有5'通用序列和3'基因特异性目标序列。在某些实施例中,衔接子任选地包含位于5'通用与
3'基因特异性目标序列与之间的独特标签序列。
[0443] 在其中利用独特标签序列的特定实施例中,每个基因特异性目标衔接子对在每个衔接子中包括多个不同的独特标签序列。举例来说,每个基因特异性目标衔接子包含最多4096个TAG。因此,每个目标特异性衔接子对包含至少四个且高达16,777,216个可能的组合。
[0444] 每个所提供的衔接子在正向和反向衔接子序列中的特定位置处包含代替胸腺嘧啶的可裂解尿嘧啶。对于所有具有独特标签序列的正向和反向衔接子来说,尿嘧啶的位置是一致的,其中尿嘧啶(U)(当存在时)侧接独特标签序列的5'和3'端;并且U存在于每个基因特异性目标序列区域中,但每个基因特异性目标序列的位置将不可避免地不同。设计侧接每个独特标签序列(UT)并且在基因特异性序列区域中的尿嘧啶且计算这类序列的Tm,以促进在低于通用固定结构序列的熔融温度的温度下的片段解离,所述通用固定结构序列被设计成在所选择的温度下保持杂交。有可能存在UT区域的侧接序列中的U中的变化,然而,设计保持熔融温度低于每个正向和反向衔接子上的通用固定结构序列的熔融温度。例示性衔接子序列结构包含:
[0445] 正向衔接子:
[0446] ------A固定结构-----------*UT*--------基因特异性--
[0447] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0448] Rev衔接子B
[0449] CTCTATGGGCAGTCGGTGAT-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0450] -----B固定结构---------------*UT*-----------基因特异性-------
[0451] SEQ ID NO:2
[0452] Rev衔接子C
[0453] TCTAGTCGGTCAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0454] -----C固定结构-------------UT--------------基因特异性-------
[0455] SEQ ID NO:3
[0456] Rev衔接子D
[0457] TCTAGTGCTGCAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0458] -----D固定结构-------------UT--------------基因特异性-------
[0459] SEQ ID NO:4
[0460] Rev衔接子E
[0461] TGACAAGGCGTAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0462] -----E固定结构-------------UT--------------基因特异性-------
[0463] SEQ ID NO:5
[0464] 其中,每个N是选自A、C、G或T的碱基并且使用UT区域的恒定区段作为锚序列以确保可变(N)部分的正确鉴别。UT的恒定和可变区可以经显著修饰(例如替代性恒定序列,>3N/区段),只要UT区域的Tm保持低于通用固定结构区域的Tm即可。重要的是,每个正向(例如TCTGTACGGTGACAAGGCG(SEQ ID NO:6))和反向(例如CTCTATGGGCAGTCGGTGAT(SEQ ID NO:
7))通用固定结构序列中不存在可裂解尿嘧啶。
[0465] 用于扩增的酶类包括(但不限于):Phusion U DNA聚合酶;SuperFi U DNA聚合酶;Taq DNA聚合酶;Veraseq Ultra DNA聚合酶。SuperFi U DNA聚合酶是高保真度SuperFi DNA聚合酶的经修饰的版本,可以从Thermo Fisher Scientific购得。SuperFiU DNA包含尿嘧啶结合袋(例如AA 36)和B族聚合酶催化域(例如AA 762)中的修饰。SuperFiU描述于2017年6月26日提交的美国临时专利申请案第62/524,730号和2018年6月25日提交的国际专利申请案第PCT/EP2018/066896号中,其各自以引用的方式并入本文中。聚合酶利用尿嘧啶和/或任何包括于衔接子序列中的替代性可裂解残基(例如肌苷等)的能力可能有限。在某些实施例中,可能宜使用聚合酶的混合物以减少酶特异性PCR误差。
[0466] 方法的第二步骤涉及所得扩增子以及任何未使用的含有尿嘧啶的衔接子的部分消化。举例来说,当并入尿嘧啶作为可裂解位点时,消化和修复包括来自所得引物、引物二聚体和扩增子的尿苷单磷酸的酶促裂解,和熔融DNA片段,接着通过聚合酶填充和接合来修复有间隙的扩增子。这一步骤减少并且可能消除多重PCR中的引物-二聚体产物。在一些情况下,在单一步骤中进行消化和修复。在某些情况下,可能需要短暂分开消化和修复步骤。举例来说,热不稳定聚合酶抑制剂可以与方法结合使用,使得在较低温度(25-40℃)下进行消化,接着通过升高温度足以破坏聚合酶-抑制剂相互相用(例如聚合酶-Ab),但未高到足以熔融通用固定结构序列来启动修复。
[0467] 尿嘧啶-DNA糖基化酶(UDG)可以用于去除尿嘧啶,留下无碱基位点,其可以通过若干酶或酶组合起作用,包括(但不限于):APE 1-脱嘌呤/脱嘧啶核酸内切酶;FPG-甲酰胺基嘧啶[fapy]-DNA糖基化酶;Nth-核酸内切酶III;EndoVIII-核酸内切酶VIII;PNK-聚核苷酸激酶;Taq-水生栖热菌(Thermus aquaticus)DNA聚合酶;DNA pol I-DNA聚合酶I;Polβ-人DNA聚合酶β。在具体实施方案中,所述方法使用人脱嘌呤/脱嘧啶核酸内切酶,APE1。APE1活性留下3'-OH和5'脱氧核糖-磷酸(5'-dRP)。可以通过多种酶实现去除5'-dRP,包括recJ、聚合酶β、Taq、DNA pol I或任何具有5'-3'核酸外切酶活性的DNA聚合酶。通过这些酶中的任一种去除5'-dRP可以产生可接合的5'-磷酸端。在另一种实施方案中,UDG活性去除尿嘧啶并且留下无碱基位点,其由FPG去除,留下3'和5'-磷酸。接着,由T4 PNK去除3'-磷酸,留下聚合酶可延伸的3'-OH。接着,可以由聚合酶β、fpg、Nth、Endo VIII、Taq、DNA pol I或任何其它具有5'-3'核酸外切酶活性的DNA聚合酶去除5'-脱氧核糖磷酸。在具体实施方案中,利用Taq DNA聚合酶。
[0468] 修复填充方法可以由几乎任何聚合酶实现,可能是用于步骤1中的扩增的扩增聚合酶或步骤2中添加的任何聚合酶,包括(但不限于):Phusion DNA聚合酶;Phusion U DNA聚合酶;SuperFi DNA聚合酶;SuperFi U DNA聚合酶;TAQ;Polβ;T4 DNA聚合酶;以及T7 DNA聚合酶。扩增子的接合修复可以由多种连接酶进行,包括(但不限于):T4 DNA连接酶;T7 DNA连接酶;Taq DNA连接酶。在所述方法的具体实施方案中,利用Taq DNA聚合酶并且由T7DNA连接酶实现接合修复。
[0469] 分子库制备的最后一个步骤涉及使用通用引物通过标准PCR方案扩增经修复的扩增子,所述通用引物含有与所制备的扩增子的5'和3'端上的通用固定结构序列互补的序列。举例来说,A-通用引物和P1通用引物(Ion Express Adaptor Kit(Thermo Fisher Scientific,Inc.)的每个部分)可以任选地含有样品特异性条形码。最后一个分子库扩增步骤可以由多种聚合酶进行,包括(但不限于):Phusion DNA聚合酶;Phusion U DNA聚合酶;SuperFi DNA聚合酶;SuperFi U DNA聚合酶;Taq DNA聚合酶;Veraseq Ultra DNA聚合酶。
[0470] 2A,在一个特定实施方案中,使用本文中提供的组合物设计方法设计衔接子,包括以上实例2中描述的通用固定结构-独特标签-基因特异性目标序列,并且使用ONCOMINETM Focus Research Panel(Thermo Fisher Scientific,Inc.)目标序列和ION AMPLISEQTM Designer(Thermo Fisher Scientific,Inc)靶向基因。利用上文所描述的正向和反向衔接子,其包含
[0471] 正向衔接子:
[0472] ------A固定结构-----------*UT*--------基因特异性--
[0473] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0474] Rev衔接子B
[0475] CTCTATGGGCAGTCGGTGAT-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0476] -----B固定结构---------------*UT*-----------基因特异性-------
[0477] SEQ ID NO:2
[0478] 对目标具有特异性的目标序列如表A中所示,并且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生预计16,777,216个不同的独特标签组合。根据上文关于实例1A所描述的方法进行分子库制备。使用甲酰胺基嘧啶[fapy]-DNA糖基化酶(FPG)/UDG酶进行消化,预期其在所有尿嘧啶位置处产生无碱基位点,预期FPG在无碱基位点的5'和3'侧上裂解(留下3'-磷酸和5'磷酸)并且去除3'磷酸(由例如T4PNK)应产生可延伸的3'-OH和可接合的5'-磷酸。然而,如由BioAnalyzer迹线所示(参见图2),这种方法始终未能产生可回收的产物。然而,可以通过添加额外的修复后纯化步骤来挽救所述方法。纯化过程可以是在随后的扩增步骤之前灭活和去除修复酶的任何物质。如果利用endoVIII,那么获得类似结果。
[0479] 2B.在另一个特定实施方案中,如章节2A关于ONCOMINETM Focus分析法的目标中所描述制备衔接子。参见表B。利用上文所描述的正向和反向衔接子,其包含
[0480] 正向衔接子:
[0481] ------A固定结构-----------*UT*--------基因特异性--
[0482] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0483] 反向衔接子是Rev衔接子B、Rev衔接子C、Rev衔接子D、Rev衔接子E中的任一个:
[0484] Rev衔接子B
[0485] CTCTATGGGCAGTCGGTGAT-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0486] -----B固定结构---------------*UT*-----------基因特异性-------
[0487] SEQ ID NO:2
[0488] Rev衔接子C
[0489] TCTAGTCGGTCAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0490] -----C固定结构-------------UT--------------基因特异性-------
[0491] SEQ ID NO:3
[0492] Rev衔接子D
[0493] TCTAGTGCTGCAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0494] -----D固定结构-------------UT--------------基因特异性-------
[0495] SEQ ID NO:4
[0496] Rev衔接子E
[0497] TGACAAGGCGTAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0498] -----E固定结构-------------UT--------------基因特异性-------
[0499] SEQ ID NO:5
[0500] 对目标具有特异性的目标序列如表B中所示,并且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生预计16,777,216个不同的独特标签组合。根据上文关于实例1C所描述的方法进行分子库制备。参见图3,表1。用每个反向衔接子对产生类似的成功测序结果。
[0501] 实例3
[0502] 对所制备的分子库进行测序,并且进行分析。测序可以通过多种已知方法进行,包括(但不限于)合成测序、接合测序和/或杂交测序。已使用Ion Torrent平台(Thermo Fisher Scientific,Inc.)在本文中的实例中进行测序,然而,分子库可以使用任何其它平台,例如Illumina、PacBio等制备和被调适成用于分析,例如测序。可以使用多个度量分析结果以评估性能,例如:
[0503] ○家族数量(捕获的输入DNA,ng)。家族的数量是映射到单独目标的家族数量的测量值。在这种情况下,每个独特分子标签是一个家族。
[0504] ○均匀性是由至少0.2倍平均读段深度覆盖的目标碱基的百分比的测量值。使用这一度量确保技术不会选择性地使某些目标扩增不足。
[0505] ○阳性/阴性:当具有已知突变的对照样品用于分析时(例如Acrometrix Oncology Hotspot Control DNA,Thermo Fisher Scientific,Inc.),可以追踪真阳性的数目。
[0506] ■真阳性:存在并且正确鉴别的关于突变数目的真阳性通知的数目。
[0507] ■假阳性(FP):(热点和完全目标)测定存在,但已知在样品中不存在的关于突变数目的假阳性通知的数目。
[0508] ■假阴性(FN)(如果使用acrometrix穿刺):存在,但未鉴别的关于突变数目的假阴性通知的数目。
[0509] ○命中目标/脱靶是在目标区域中对准/未对准的定位读段的百分比。使用这一度量确保技术主要扩增面板设计所针对的目标。
[0510] ○追踪低质量以确保数据值得分析。这一度量是总系统度量并且不与这种技术直接相关。
[0511] 实例4
[0512] 本发明的一个益处是能够结合所提供的方法使用Ampliseq.com设计器。使用本文中提供的组合物设计方法设计衔接子,包括以上实例2中描述的通用固定结构-独特标签-基因特异性目标序列,并且使用ONCOMINETM Focus Research Panel(Thermo Fisher Scientific,Inc.)目标序列和ION AMPLISEQTM Designer(Thermo Fisher Scientific,Inc)靶向基因。利用上文所描述的正向和反向衔接子,其包含
[0513] 正向衔接子:
[0514] ------A固定结构-----------*UT*--------基因特异性--
[0515] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0516] Rev衔接子B
[0517] CTCTATGGGCAGTCGGTGAT-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0518] -----B固定结构---------------*UT*-----------基因特异性-------
[0519] SEQ ID NO:2
[0520] 对目标具有特异性的目标序列如表A中所示,并且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生预计16,777,216个不同的独特标签组合。使用20ng基因组DNA和约1%Acrometrix OncomineTM Hotspot Control(AOHC)DNA(Thermo Fisher Scientific,Inc.),根据以上实例1C中所描述的方案制备分子库。使用Ion 520/530Templating/Sequencing试剂盒和仪器(Thermo Fisher Scientific,Inc.)对所制备的分子库进行测序。面板性能(例如产率、均匀性)指示技术能够有效地使用设计器流水线。参见图4A-4C。
[0521] 使用AOHC DNA的结果(表1中展示)说明,使用这种方案,可以有效地鉴别AOHC中的大部分真阳性(71或75)并且重要的是,不产生任何假阳性。
[0522] 表1
[0523]
[0524]
[0525] 实例5
[0526] 根据本文中提供的组合物设计方法设计衔接子,包括以上实例2中描述的通用固定结构-独特标签-基因特异性目标序列,并且使用BRCA Research Panel(Thermo Fisher Scientific,Inc.)目标序列和ION AMPLISEQTM Designer(Thermo Fisher Scientific,Inc)靶向基因。利用上文所描述的正向和反向衔接子,其包含正向衔接子:
[0527] ------A固定结构-----------*UT*--------基因特异性--
[0528] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0529] Rev衔接子B
[0530] CTCTATGGGCAGTCGGTGAT-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0531] -----B固定结构---------------*UT*-----------基因特异性-------
[0532] SEQ ID NO:2
[0533] 对目标具有特异性的目标序列如表C中所示,并且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生估计16,777,216个不同的独特标签组合。使用20ng基因组DNA,根据以上实例1C中所描述的方案制备分子库。使用Ion 520/530 Templating/Sequencing试剂盒和仪器(Thermo Fisher 
Scientific,Inc.)对所制备的分子库进行测序。与实例5类似,面板性能(例如产率、均匀性)指示技术能够使用设计器流水线。参见图5和表1。
[0534] 实例6
[0535] 除了分子库扩增步骤利用两个引物对(以将两个通用序列置放于扩增子的每个末端上,例如每个末端上A-通用固定结构和P1-通用固定结构)以实现双向测序以外,使用本文中提供的组合物设计方法设计引物并且使用以上实例4中所描述的面板目标序列靶向肿瘤学基因。使用Ion 520/530 Templating/Sequencing试剂盒和仪器(Thermo Fisher Scientific,Inc.)对所制备的分子库进行测序。参见图7。本发明的面板性能(例如产率、均匀性)指示技术能够使用设计器流水线并且有效产生DNA的两条链的测序数据。参见图6A-6C和表1。
[0536] 实例7
[0537] 使用本文中提供的组合物设计方法设计引物并且靶向广泛多种肿瘤学目标序列。利用上文所描述的正向和反向衔接子,其包含
[0538] 正向衔接子:
[0539] ------A固定结构-----------*UT*--------基因特异性--
[0540] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0541] Rev衔接子C
[0542] TCTAGTCGGTCAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0543] -----C固定结构-------------UT--------------基因特异性-------
[0544] SEQ ID NO:3
[0545] 表2A:家族产生、覆盖和均匀性
[0546]
[0547] 表2B:敏感性、特异性以及FP/lib,仅热点
[0548]
[0549]
[0550] 对目标具有特异性的目标序列如表D中所示,并且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生估计16,777,216个不同的独特标签组合。以任选的反转录酶步骤为起始物质,如实例1D中所描述处理含有19.8ng无细胞DNA和0.2ng总RNA的样品。所列举的一些样品的总RNA含有5个掺入的融合构筑体。参见表D。使用Ion 520/530Templating/Sequencing试剂盒和仪器(Thermo Fisher Scientific,Inc.)对所制备的分子库进行测序。本发明的面板性能(例如产率、均匀性、分子转化、敏感性)指示技术可以有效地将输入DNA转化成分子库并且检测出现率低至0.1%到0.5%的突变。参见表2A-2B。此外,结果确认技术可以有效地将输入DNA和cDNA转化成分子库并且检测出现率为约1%的融合物。参见表3A-3B。
[0551] 表3A融合物
[0552]
[0553] 表3B:家族产生、覆盖和均匀性(无活化)
[0554]
[0555]
[0556] 实例8
[0557] 使用本文中提供的组合物设计方法设计引物并且使用短串联重复序列(STR)靶向基因,所述短串联重复序列适用于高分辨率基因分型和复杂混合物的分析。利用上文所描述的正向和反向衔接子,其包含正向衔接子:
[0558] ------A固定结构-----------*UT*--------基因特异性--
[0559] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0560] Rev衔接子E
[0561] TGACAAGGCGTAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0562] -----E固定结构-------------UT--------------基因特异性-------
[0563] SEQ ID NO:5
[0564] 对目标具有特异性的目标序列如表E中所示,并且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生估计16,777,216个不同的独特标签组合。在不存在任选的反转录酶步骤情况下,如实例1D中所描述处理含有1到10ng基因组DNA的样品。使用Ion 520/530Templating/Sequencing试剂盒和仪器(Thermo Fisher Scientific,Inc.)对所制备的分子库进行测序。本发明的面板性能(例如产率、均匀性)指示具有挑战性的STR目标(其通常在扩增期间缩短1个或更多个重复序列)也可以有效转化成分子库。结果在输入DNA的滴定水平上是一致的。参见表4。当使用Torrent Suite Molecular Diagnostics插件,根据制造商说明评估相同目标以比较结果与标准操作程序时,使用本文中所提供的组合物和方法产生的结果在每个重复区域内产生更一致的信号,和更少的卡顿(数据未展示)。
[0565] 表4:
[0566]
[0567] 实例9
[0568] 使用本文中提供的组合物设计方法设计引物并且如以上实例6中所描述靶向肿瘤学基因目标序列,其中利用两个引物对进行分子库扩增(以将两个通用序列置放于扩增子的每个末端上,例如每个末端上的A-通用固定结构和P1-通用固定结构)以实现双向测序。如根据以上实例1E的方法所描述,在无任选的RT步骤的情况下,对含有掺入AOHC对照物的样品进行分子库制备。参见图7。使用Ion 520/530Templating/Sequencing试剂盒和仪器(Thermo Fisher Scientific,Inc.)对所制备的分子库进行测序,接着分别分析单向序列结果以及由双向测序分析的结果。本发明的面板性能(例如产率、均匀性、敏感性)指示技术能够使用设计器流水线并且有效地产生DNA的两条链的测序数据,并且双向序列分析引起所测量的插入缺失假阳性减少。参见表5。
[0569] 表5
[0570]   双向,单向分析 双向,双向分析真阳性 67 67
敏感性 91.8 91.8
SNP、INDEL中的TP 65;2 65;2
假阴性 6 6
SNP、INDEL中的假阳性 1:2 1:0
[0571] 实例10
[0572] 对于每个Ion条形码衔接子,A衔接子中包括单一条形码。在P1衔接子上添加第二组条形码可以通过滤出所鉴别的污染读段来有效地降低结果中的污染假影水平。使用本文中提供的组合物设计方法设计引物并且靶向广泛多种肿瘤学目标序列。与以上实例7中所描述类似并且使用实例1D的方法处理含有20ng基因组DNA的样品,然而,也利用额外带条形码的P1衔接子,其中将条形码12mer序列插入反向衔接子的P1衔接子序列中。用A和P1衔接子中的条形码8处理用于分子库制备的含有基因组DNA的样品。也用条形码1、2、3、4、5、6、7和9(各自在P1和A带条形码的衔接子中)处理其它样品(但不包含基因组DNA)。本发明的面板性能(例如产率、均匀性、转化)指示其它条形码可以有效地鉴别污染。参见表6。
[0573] 表6:
[0574] 反向条形码 检测到的读段 总百分比bc1 332 0.001%
bc2 54 0.000%
bc3 261 0.001%
bc4 481 0.001%
bc5 9,908 0.019%
bc6 8,532 0.016%
bc7 2,656 0.005%
bc8 52,089,480 99.941%
bc9 1,403 0.003%
bc10 7,131 0.014%
[0575] 实例11
[0576] 在另一个特定实施方案中,如实例2A关于ONCOMINETM Focus Assay的目标所描述(如表B中)以及实例6中所描述制备衔接子,器重对目标具有特异性的目标序列如表D中所示且以每个基因特异性目标序列计,衔接子各自包含4096个独特标签序列,对于每个基因特异性目标序列对,产生预计16,777,216个不同的独特标签组合。利用正向和反向衔接子,其包含正向衔接子:
[0577] ------A固定结构------------*UT*-------基因特异性--
[0578] TCTGTACGGTGACAAGGCG-U-NNNACTNNNTGA-U-GAGGACCGUCGCTUGGT SEQ ID NO:1[0579] Rev衔接子I:
[0580] TGACAAGGCGTAGTCACGG-U-NNNACTNNNTGA-U-CCTTCTGCAUGGTATTCTTTCTCTUCC
[0581] -----I固定结构---------------*UT*-----------基因特异性-------
[0582] SEQ ID NO:1705
[0583] 根据上文关于实例1F所描述的方法进行分子库制备。还参见图8。已调适工作流程以使用扩增引物使分子库能够在Illumina平台上进行测序操作。设计(图8中示意性展示)含有:(1)P5移植引物区域;(2)P5索引(A-H)区域;(3)P5测序/索引读段引物区域;(4)A-固定结构区域;(5)UT区域;(6)基因特异性插入物;(7)UT区域;(8)I-固定结构区域;(9)P7测序/索引读段引物区域;(10)P7索引(1-12)区域;以及(11)P7移植引物区域。由肿瘤学面板制得3个分子库,其分别包含具有idex5-01-idex7-5、idex5-02-index7-6和idex5-7-idex7-7的表D的目标。由Focus面板制得2个分子库,其分别包含具有idex5-01-idex7-5和idex5-7-idex7-7的表B的目标。参见表F。所有制得的分子库都具有19.6ng g24385,其具有0.4ng插入AOHC,因此可以检测0.1%等位基因出现率。
[0584] 表F
[0585]
[0586]
[0587]
[0588]
[0589] 为了模拟DNA样品中存在的少量突变型变异体(0.1%),使用经纯化的基因组DNA并且掺入少量AcroMetrix Oncology Hotpot Control质体。使用这些样品作为对照样品以用于说明分子库制备方法目的,并且评估通过这种分析方法检测的少量突变型变异体的敏感性和特异性。生物分析仪结果与分子库结构设计匹配,并且分子库的产率和纯度与根据上文所描述的其它方法制备的分子库处于同等水平。用每个衔接子对产生类似的成功测序结果。
[0590] MiSeq测序操作成功地产生丛集,并且产生测序和索引读段。与使用540芯片在Ion S5上进行的标准AmpliSeq HD版本相比,在Illumina MiSeq上进行的面板的测序结果指示类似性能。参见表7。
[0591] 表7
[0592]   MiSeq S5 540原始读段准确性(%) 99.31 99.27
定位读段 12,994,280 17,855,575
平均深度 46,674 62,429
命中目标(%) 98.91 98.64
覆盖分析均匀性(%) 97.86 97.98
半双重均匀性(%) 86.62 83.64
0.1%MegaMix TP 140 138
0.1%MegaMix FN 11 13
0.1%MegaMix FP 58 38
[0593] 虽然已经在本文中展示和描述了本发明的优选实施例,但所属领域的技术人员应显而易见,这类实施例是仅作为实例而提供。所属领域的技术人员现将在不脱离本发明的情况下意识到大量变化形式、改变以及取代。应理解,本文中描述的本发明的实施例的各种替代例可以用于实践本发明。所附权利要求书旨在限定本发明的范围,并且由此覆盖这些权利要求和其等效物的范围内的方法和结构。
[0594] 表A
[0595]
[0596]
[0597]
[0598]
[0599]
[0600] 表B
[0601]
[0602]
[0603]
[0604]
[0605]
[0606]
[0607]
[0608]
[0609]
[0610]
[0611]
[0612]
[0613]
[0614] 表C
[0615]
[0616]
[0617]
[0618]
[0619]
[0620]
[0621]
[0622] 表D
[0623]
[0624]
[0625]
[0626]
[0627]
[0628]
[0629]
[0630]
[0631]
[0632]
[0633]
[0634]
[0635]
[0636]
[0637]
[0638]
[0639]
[0640] 表E
[0641]
[0642]
[0643]
[0644]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈