首页 / 专利库 / 纳米技术 / 微流体技术 / 无酶且无扩增的测序

无酶且无扩增的测序

阅读:228发布:2022-04-17

专利汇可以提供无酶且无扩增的测序专利检索,专利查询,专利分析的服务。并且本 发明 涉及测序探针、方法、 试剂 盒 和装置,其提供具有长读取长度和低误差率的无酶、无扩增和无文库的核酸测序。使用的序列探针包含靶结合域和 条形码 域;其中所述靶结合域包含至少四个核苷酸,且能够结合靶核酸;其中所述条形码域包含合成主链,所述条形码域包含至少第一附接区域,所述第一附接区域包含能够被第一互补核酸分子结合的核酸序列,且其中所述第一附接区域的所述核酸序列确定由所述靶结合域的第一个核苷酸结合的所述靶核酸的第一核苷酸的 位置 和身份。,下面是无酶且无扩增的测序专利的具体信息内容。

1.包含靶结合域和条形码域的测序探针;
其中所述靶结合域包含至少四个核苷酸,并且能够结合靶核酸;
其中所述条形码域包含合成主链,所述条形码域包含至少第一附接区域,所述第一附接区域包含能够被第一互补核酸分子结合的核酸序列且其中所述第一附接区域的所述核酸序列确定由所述靶结合域的第一个核苷酸结合的所述靶核酸中的第一个核苷酸的位置和身份。
2.权利要求1的测序探针,其中所述合成主链包含多糖、多核苷酸、肽、肽核酸或多肽。
3.权利要求1或权利要求2的测序探针,其中所述合成主链包含单链DNA。
4.权利要求1至3中任一项的测序探针,其中所述测序探针在所述靶结合域和所述条形码域之间包含双链DNA间隔物。
5.权利要求1至3中任一项的测序探针,其中所述测序探针在所述靶结合域和所述条形码域之间包含与双链DNA具有类似机械性能的基于聚合物的间隔物。
6.权利要求4至5中任一项的测序探针,其中所述双链DNA间隔物具有1个基对至100个碱基对的长度。
7.权利要求4至6中任一项的测序探针,其中所述双链DNA间隔物具有2个碱基对至50个碱基对的长度。
8.权利要求1至7中任一项的测序探针,其中所述第一附接区域与至少一个侧接单链多核苷酸相邻。
9.权利要求1至8中任一项的测序探针,其中所述第一互补核酸是RNA、DNA或PNA。
10.权利要求1至9中任一项的测序探针,其中所述第一互补核酸分子包含可检测标记物。
11.权利要求1至9中任一项的测序探针,其中所述靶结合域中的第一核苷酸是修饰的核苷酸或核酸类似物。
12.权利要求1至11中任一项的测序探针,其中所述条形码域包含至少第二附接区域,所述第二附接区域包含能够被第二互补核酸分子结合的核酸序列且其中所述第二附接区域的所述核酸序列确定由所述靶结合域的第二个核苷酸结合的所述靶核酸中的第二个核苷酸的位置和身份且
其中所述第一互补核酸分子不同于所述第二互补核酸分子。
13.权利要求12的测序探针,其中所述第二附接区域与至少一个侧接单链多核苷酸相邻。
14.权利要求12的测序探针,其中所述第二互补核酸是RNA、DNA或PNA。
15.权利要求14中任一项的测序探针,其中所述第二互补核酸分子包含可检测标记物。
16.权利要求12的测序探针,其中所述靶结合域中的第二核苷酸是修饰的核苷酸或核酸类似物。
17.权利要求12的测序探针,其中确定所述靶核酸中的第一核苷酸的位置和身份的所述第一附接区域的核酸序列和确定所述靶核酸中的第二核苷酸的位置和身份的所述第二附接区域的核酸序列不同,甚至当所述靶核酸中的第一个核苷酸和所述靶核酸中的第二个核苷酸相同时。
18.权利要求1至17中任一项的测序探针,其中所述靶结合域中的核苷酸的数目等于所述条形码域中的附接区域的数目。
19.权利要求1至17中任一项的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少一个。
20.权利要求19的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少两个。
21.权利要求20的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少三个。
22.权利要求21的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少四个。
23.权利要求22的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少五个。
24.权利要求23的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少六个。
25.权利要求24的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少七个。
26.权利要求17的测序探针,其中所述靶结合域包含至少七个核苷酸,并且能够结合所述靶核酸。
27.权利要求26的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少一个。
28.权利要求26的测序探针,其中所述靶结合域包含至少十个核苷酸,并且能够结合所述靶核酸。
29.权利要求28的测序探针,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少一个。
30.权利要求28的测序探针,其中所述靶结合域包含十个核苷酸,并且所述条形码域包含六个附接区域。
31.权利要求1的测序探针,其中所述条形码域包含至少两个第一附接区域,其中所述至少两个第一附接区域包含能够被第一互补核酸分子结合且确定由所述靶结合域的第一个核苷酸结合的靶核酸中的第一个核苷酸的位置和身份的相同核酸序列。
32.权利要求31的测序探针,其中条形码域中的每个位置具有相同数目的附接区域。
33.权利要求1的测序探针,其中条形码域中的每个位置具有相同数目的附接区域。
34.权利要求33的测序探针,其中条形码域中的每个位置具有一个附接区域。
35.权利要求33的测序探针,其中条形码域中的每个位置具有多于一个附接区域。
36.权利要求1的测序探针,其中条形码域中的至少一个位置具有更大数目的附接区域作为另一位置。
37.权利要求1至36中任一项的测序探针,其中所述第一附接区域与所述合成主链中的修饰单体连接。
38.权利要求37的测序探针,其中所述修饰的单体是修饰的核苷酸。
39.权利要求1至38中任一项的测序探针,其中所述第一附接区域从所述合成主链分支。
40.权利要求12的测序探针,其中所述第二附接区域从所述合成主链分支。
41.权利要求17的测序探针,其中所述至少六个附接区域中的每一个从所述合成主链分支。
42.权利要求1至41中任一项的测序探针,其中所述靶结合域和所述合成主链是可操作地连接的。
43.权利要求12的测序探针,其中所述条形码域包含至少第三附接区域,所述第三附接区域包含能够被第三互补核酸分子结合的核酸序列且其中所述第三附接区域的所述核酸序列确定由所述靶结合域的第三个核苷酸结合的所述靶核酸中的第三个核苷酸的位置和身份且
其中所述第三互补核酸分子不同于所述第一和第二互补核酸分子。
44.权利要求43的测序探针,其中所述第三附接区域与至少一个侧接单链多核苷酸相邻。
45.权利要求43的测序探针,其中所述条形码域包含至少第四附接区域,所述第四附接区域包含能够被第四互补核酸分子结合的核酸序列且其中所述第四附接区域的所述核酸序列确定由所述靶结合域的第四个核苷酸结合的所述靶核酸中的第四个核苷酸的位置和身份且
其中所述第四互补核酸分子不同于所述第一、第二和第三互补核酸分子。
46.权利要求45的测序探针,其中所述第四附接区域与至少一个侧接单链多核苷酸相邻。
47.权利要求45的测序探针,其中所述条形码域包含至少第五附接区域,所述第五附接区域包含能够被第五互补核酸分子结合的核酸序列且其中所述第五附接区域的所述核酸序列确定由所述靶结合域的第五个核苷酸结合的所述靶核酸中的第五个核苷酸的位置和身份且
其中所述第五互补核酸分子不同于所述第一、第二、第三和第四互补核酸分子。
48.权利要求47的测序探针,其中所述第五附接区域与至少一个侧接单链多核苷酸相邻。
49.权利要求47的测序探针,其中所述条形码域包含至少第六附接区域,所述第六附接区域包含能够被第六互补核酸分子结合的核酸序列且其中所述第六附接区域的所述核酸序列确定由所述靶结合域的第六个核苷酸结合的所述靶核酸中的第六个核苷酸的位置和身份且
其中所述第六互补核酸分子不同于所述第一、第二、第三、第四和第五互补核酸分子。
50.权利要求49的测序探针,其中所述第六附接区域与至少一个侧接单链多核苷酸相邻。
51.权利要求1至50中任一项的测序探针,其中附接区域包含核酸序列的一个至五十个拷贝。
52.权利要求51的测序探针,其中所述附接区域包含所述核酸序列的两个至三十个拷贝。
53.权利要求1至52中任一项的测序探针,其包含可操作地连接至合成主链的多个拷贝的靶结合域。
54.权利要求1至53中任一项的测序探针,其中每个互补核酸分子包含可检测标记物。
55.权利要求1至54中任一项的测序探针,其中每个互补核酸分子与一级核酸分子直接连接。
56.权利要求1至54中任一项的测序探针,其中每个互补核酸分子经由核酸间隔物与一级核酸分子间接连接。
57.权利要求55或权利要求56的测序探针,其中每个互补核酸分子包含约8个核苷酸至约20个核苷酸。
58.权利要求57的测序探针,其中每个互补核酸分子包含约10个核苷酸。
59.权利要求58的测序探针,其中每个互补核酸分子包含约12个核苷酸。
60.权利要求59的测序探针,其中每个互补核酸分子包含约14个核苷酸。
61.权利要求55至60中任一项的测序探针,其中每个一级核酸分子与至少一个二级核酸分子杂交。
62.权利要求61的测序探针,其中每个一级核酸分子与至少两个二级核酸分子杂交。
63.权利要求62的测序探针,其中每个一级核酸分子与至少三个二级核酸分子杂交。
64.权利要求63的测序探针,其中每个一级核酸分子与至少四个二级核酸分子杂交。
65.权利要求64的测序探针,其中每个一级核酸分子与至少五个二级核酸分子杂交。
66.权利要求61至65中任一项的测序探针,其中一个或多个二级核酸分子包含至少一个可检测标记物。
67.权利要求61至65中任一项的测序探针,其中每个二级核酸分子与至少一个包含至少一个可检测标记物的三级核酸分子杂交。
68.权利要求67的测序探针,其中每个二级核酸分子与至少两个包含至少一个可检测标记物的三级核酸分子杂交。
69.权利要求68的测序探针,其中每个二级核酸分子与至少三个包含至少一个可检测标记物的三级核酸分子杂交。
70.权利要求69的测序探针,其中每个二级核酸分子与至少四个包含至少一个可检测标记物的三级核酸分子杂交。
71.权利要求70的测序探针,其中每个二级核酸分子与至少五个包含至少一个可检测标记物的三级核酸分子杂交。
72.权利要求71的测序探针,其中每个二级核酸分子与至少六个包含至少一个可检测标记物的三级核酸分子杂交。
73.权利要求71的测序探针,其中每个二级核酸分子与至少七个包含至少一个可检测标记物的三级核酸分子杂交。
74.权利要求61至71中任一项的测序探针,其中至少一个二级核酸分子包含不与一级核酸分子杂交且不与三级核酸分子杂交的区域。
75.权利要求74的测序探针,其中每个二级核酸分子包含不与一级核酸分子杂交且不与三级核酸分子杂交的区域。
76.权利要求74或权利要求75的测序探针,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含与一级核酸分子连接的互补核酸分子的核苷酸序列。
77.权利要求74至76中任一项的测序探针,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域位于所述二级核酸分子的末端。
78.权利要求74至77中任一项的测序探针,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含约8个核苷酸至约20个核苷酸。
79.权利要求78的测序探针,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含约10个核苷酸。
80.权利要求79的测序探针,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含约12个核苷酸。
81.权利要求80的测序探针,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含约14个核苷酸。
82.核酸测序方法,其包括以下步骤:
(1)使至少一个测序探针与固定至基质的靶核酸杂交;其中所述测序探针包含:
靶结合域和条形码域;
其中所述靶结合域包含至少四个核苷酸,并且能够结合固定的靶核酸;
其中所述条形码域包含合成主链,所述条形码域包含至少第一附接区域,所述第一附接区域包含能够被第一互补核酸分子结合的核酸序列且其中所述第一附接区域的所述核酸序列确定由所述靶结合域的第一个核苷酸结合的所述固定的靶核酸中的第一个核苷酸的位置和身份和
(2)使包含可检测标记物的第一互补核酸分子或包含可检测标记物的第一报告复合物的第一互补核酸分子与第一附接区域结合;
(3)检测结合的第一互补核酸分子的可检测标记物或第一报告复合物的结合的第一互补核酸分子的可检测标记物;和
(4)鉴定固定的靶核酸中的第一核苷酸的位置和身份。
83.权利要求82的方法,其还包括以下步骤:
(5)使所述第一附接区域与缺乏可检测标记物的第一杂交核酸分子接触,从而未结合所述第一互补核酸分子且使缺乏可检测标记物的所述第一杂交核酸分子与所述第一附接区域结合;
(6)使包含可检测标记物的第二互补核酸分子或包含可检测标记物的第二报告复合物的第二互补核酸分子与所述第二附接区域结合,所述第二附接区域包含确定由所述靶结合域的第二个核苷酸结合的固定的靶核酸中的第二个核苷酸的位置和身份的核酸序列;
(7)检测结合的第二互补核酸分子的可检测标记物或第二报告复合物的结合的第二互补核酸分子的可检测标记物;和
(8)鉴定固定的靶核酸中的第二核苷酸的位置和身份。
84.权利要求82或权利要求83的方法,其中步骤(5)和(6)依次或同时发生。
85.权利要求82至84中任一项的方法,其中重复步骤(5)至(8),直到所述条形码域中的每个附接区域已被包含可检测标记物的互补核酸分子或包含可检测标记物的报告复合物的互补核酸分子依次结合,且已检测依次结合的互补核酸分子的可检测标记物或报告复合物的依次结合的互补核酸分子的可检测标记物,
从而对于所述测序探针的靶结合域杂交的固定的靶核酸的区域,鉴定核苷酸的线性顺序。
86.权利要求82至85中任一项的方法,其中所述靶核酸首先通过至少使所述靶核酸的第一位置与包含选择性结合至基质的第一亲和标签的第一捕获探针结合而固定至基质。
87.权利要求86的方法,其中所述靶核酸通过应用足以延伸在第一位置固定至基质的靶核酸的而伸长。
88.权利要求87的方法,其中所述力是重力、流体动力、电磁力、流动-拉伸、后退弯月面技术或其组合。
89.权利要求86至88中任一项的方法,其中所述靶核酸进一步通过使所述靶核酸的至少第二位置与包含选择性结合至基质的亲和标签的至少第二捕获探针结合而固定至基质。
90.权利要求89的方法,其中所述靶核酸在约3个至约10个位置固定至基质。
91.权利要求89的方法,其中一旦所述靶核酸的第二位置固定至所述基质,就可以去除所述力。
92.权利要求82的方法,其中所述靶核酸在一个或多个位置固定至基质。
93.权利要求82至92中任一项的方法,其中延长所述固定的靶核酸。
94.权利要求82至93中任一项的方法,其中所述合成主链包含多糖、多核苷酸、肽、肽核酸或多肽。
95.权利要求82至94中任一项的方法,其中所述合成主链包含单链DNA或单链RNA或单链PNA。
96.权利要求82至95中任一项的方法,其中所述测序探针在所述靶结合域和所述条形码域之间包含双链DNA间隔物。
97.权利要求82至96中任一项的方法,其中所述第一附接区域与至少一个侧接单链多核苷酸相邻。
98.权利要求82至97中任一项的方法,其中所述第一互补核酸是RNA、DNA或PNA或其它多核苷酸类似物。
99.权利要求82至98中任一项的方法,其中所述靶结合域中的第一核苷酸是修饰的核苷酸或核酸类似物。
100.权利要求82的方法,其中所述条形码域包含至少第二附接区域,所述第二附接区域包含能够被第二互补核酸分子结合的核酸序列且其中所述第二附接区域的所述核酸序列确定由所述靶结合域的第二个核苷酸结合的所述固定的靶核酸中的第二个核苷酸的位置和身份且
其中所述第一互补核酸分子不同于所述第二互补核酸分子。
101.权利要求100的方法,其中所述第二附接区域与至少一个侧接单链多核苷酸或多核苷酸类似物相邻。
102.权利要求100的方法,其中所述第二互补核酸是RNA、DNA或PNA。
103.权利要求100的方法,其中所述靶结合域中的第二核苷酸是修饰的核苷酸或核酸类似物。
104.权利要求83至103中任一项的方法,其中所述第一互补核酸分子和缺乏可检测标记物的第一杂交核酸分子包含相同的核酸序列。
105.权利要求82至104中任一项的方法,其中缺乏可检测标记物的第一杂交核酸分子包含与相邻于所述第一附接区域的侧接单链多核苷酸互补的核酸序列。
106.权利要求105的方法,其中所述靶结合域包含至少三个核苷酸,且其中所述条形码域包含至少第三附接区域,所述第三附接区域包含能够被第三互补核酸分子结合的核酸序列,且其中所述第三附接区域的所述核酸序列确定由所述靶结合域的第三个核苷酸结合的所述靶核酸中的第三个核苷酸的位置和身份。
107.权利要求106的方法,其中所述第三附接区域与至少一个侧接单链多核苷酸或多核苷酸类似物相邻。
108.权利要求106或权利要求107的方法,其中所述靶结合域包含至少四个核苷酸,且其中所述条形码域包含至少第四附接区域,所述第四附接区域包含能够被第四互补核酸分子结合的核酸序列,且其中所述第四附接区域的所述核酸序列确定由所述靶结合域的第四个核苷酸结合的所述靶核酸中的第四个核苷酸的位置和身份。
109.权利要求108的方法,其中所述第四附接区域与至少一个侧接单链多核苷酸相邻。
110.权利要求108或权利要求109的方法,其中所述靶结合域包含至少五个核苷酸,且其中所述条形码域包含至少第五附接区域,所述第五附接区域包含能够被第五互补核酸分子结合的核酸序列,且其中所述第五附接区域的所述核酸序列确定由所述靶结合域的第五个核苷酸结合的所述靶核酸中的第五个核苷酸的位置和身份。
111.权利要求110的方法,其中所述第五附接区域与至少一个侧接单链多核苷酸相邻。
112.权利要求110或权利要求111的方法,其中所述靶结合域包含至少六个核苷酸,且所述条形码域包含至少第六附接区域,所述第六附接区域包含能够被第六互补核酸分子结合的核酸序列,且其中所述第六附接区域的所述核酸序列确定由所述靶结合域的第六个核苷酸结合的所述靶核酸中的第六个核苷酸的位置和身份。
113.权利要求112的方法,其中所述第六附接区域与至少一个侧接单链多核苷酸相邻。
114.权利要求82至113中任一项的方法,其中所述靶结合域中的核苷酸的数目等于所述条形码域中的附接区域的数目。
115.权利要求82至113中任一项的方法,其中所述靶结合域中的核苷酸的数目比所述条形码域中的附接区域的数目多至少一个。
116.权利要求82至113中任一项的方法,其中至少第一附接区域从所述合成主链分支。
117.权利要求116的方法,其中所述第二附接区域从所述合成主链分支。
118.权利要求117的方法,其中所述至少六个附接区域中的每一个从所述合成主链分支。
119.权利要求82至118中任一项的方法,其中所述条形码域包含至少两个第一附接区域,其中所述至少两个第一附接区域包含能够被第一互补核酸分子结合且确定由所述靶结合域的第一个核苷酸结合的靶核酸中的第一个核苷酸的位置和身份的相同核酸序列。
120.权利要求119的方法,其中条形码域中的每个位置具有相同数目的附接区域。
121.权利要求82的方法,其中条形码域中的每个位置具有相同数目的附接区域。
122.权利要求121的方法,其中条形码域中的每个位置具有一个附接区域。
123.权利要求121的方法,其中条形码域中的每个位置具有多于一个附接区域。
124.权利要求82的方法,其中条形码域中的至少一个位置具有更大数目的附接区域作为另一位置。
125.权利要求82至124中任一项的方法,其中附接区域包含核酸序列的一个至五十个拷贝。
126.权利要求125的方法,其中所述附接区域包含所述核酸序列的两个至三十个拷贝。
127.权利要求82至126中任一项的方法,其中所述测序探针包含可操作地连接至合成主链的多个拷贝的靶结合域。
128.权利要求82至127中任一项的方法,其中每个包含可检测标记物的报告复合物包含与一级核酸分子直接连接的互补核酸分子。
129.权利要求80至128中任一项的方法,其中每个包含可检测标记物的报告复合物包含经由核酸间隔物与一级核酸分子间接连接的互补核酸分子。
130.权利要求82至129中任一项的方法,其中每个包含可检测标记物的报告复合物包含经由聚合间隔物与一级核酸分子间接连接的互补核酸分子,所述聚合间隔物具有与核酸间隔物类似的机械性能。
131.权利要求82至130中任一项的方法,其中每个互补核酸分子包含约8个核苷酸至约
20个核苷酸。
132.权利要求82至131中任一项的方法,其中每个互补核酸分子包含约10个核苷酸。
133.权利要求82至132中任一项的方法,其中每个互补核酸分子包含约12个核苷酸。
134.权利要求82至133中任一项的方法,其中每个互补核酸分子包含约14个核苷酸。
135.权利要求82至134中任一项的方法,其中每个一级核酸分子与至少一个二级核酸分子杂交。
136.权利要求135的方法,其中每个一级核酸分子与至少两个二级核酸分子杂交。
137.权利要求136的方法,其中每个一级核酸分子与至少三个二级核酸分子杂交。
138.权利要求137的方法,其中每个一级核酸分子与至少四个二级核酸分子杂交。
139.权利要求138的方法,其中每个一级核酸分子与至少五个二级核酸分子杂交。
140.权利要求135至139中任一项的测序探针,其中一个或多个二级核酸分子包含至少一个可检测标记物。
141.权利要求135至139中任一项的方法,其中每个二级核酸分子与至少一个包含至少一个可检测标记物的三级核酸分子杂交。
142.权利要求141的方法,其中每个二级核酸分子与至少两个包含至少一个可检测标记物的三级核酸分子杂交。
143.权利要求142的方法,其中每个二级核酸分子与至少三个包含至少一个可检测标记物的三级核酸分子杂交。
144.权利要求143的方法,其中每个二级核酸分子与至少四个包含至少一个可检测标记物的三级核酸分子杂交。
145.权利要求144的方法,其中每个二级核酸分子与至少五个包含至少一个可检测标记物的三级核酸分子杂交。
146.权利要求145的方法,其中每个二级核酸分子与至少六个包含至少一个可检测标记物的三级核酸分子杂交。
147.权利要求146的方法,其中每个二级核酸分子与至少七个包含至少一个可检测标记物的三级核酸分子杂交。
148.权利要求135至147中任一项的方法,其中至少一个二级核酸分子包含不与一级核酸分子杂交且不与三级核酸分子杂交的区域。
149.权利要求148的方法,其中每个二级核酸分子包含不与一级核酸分子杂交且不与三级核酸分子杂交的区域。
150.权利要求148或权利要求149的方法,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含与一级核酸分子直接连接的互补核酸分子的核苷酸序列。
151.权利要求148至150中任一项的方法,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域位于所述二级核酸分子的末端。
152.权利要求148至151中任一项的方法,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含约8个核苷酸至约20个核苷酸。
153.权利要求152的方法,其中不与一级核酸分子杂交且不与三级核酸分子杂交的区域包含约12个核苷酸。
154.核酸测序的方法,其包括以下步骤:
(1)使测序探针的第一群体与固定至基质的靶核酸杂交,其中所述第一群体中的每个测序探针包含:
靶结合域和条形码域;
其中所述靶结合域包含至少四个核苷酸,并且能够结合靶核酸;
其中所述条形码域包含合成主链,所述条形码域包含第一附接区域,所述第一附接区域包含能够被第一互补核酸分子结合的核酸序列,且其中所述第一附接区域的所述核酸序列确定由所述靶结合域的第一个核苷酸结合的所述靶核酸中的第一个核苷酸的位置和身份,且
所述条形码域还包含至少第二附接区域,所述第二附接区域包含能够被第二互补核酸分子结合的核酸序列,且其中所述第二附接区域的所述核酸序列确定由所述靶结合域的第二个核苷酸结合的所述靶核酸中的第二个核苷酸的位置和身份,且
其中所述第一互补核酸分子不同于所述第二互补核酸分子,
其中所述第一群体中的每个测序探针在约相同条件下从固定的靶核酸去杂交;
(2)使各自包含可检测标记物的多个第一互补核酸分子或各复合物包含可检测标记物的多个第一报告复合物的多个第一互补核酸分子与第一群体中的各测序探针中的第一附接区域结合;
(3)检测各结合的第一互补核酸分子或各第一报告复合物的各第一互补核酸分子的可检测标记物,
(4)鉴定通过第一群体中的测序探针杂交的固定的靶核酸中的多个第一核苷酸的位置和身份;
(5)使第一群体的每个测序探针的各第一附接区域与多个各自缺乏可检测标记物的第一杂交核酸分子接触,从而未结合包含可检测标记物的第一互补核酸分子或各第一报告复合物的第一互补核酸分子且使缺乏可检测标记物的第一杂交核酸分子与每个第一附接区域结合;
(6)使各自包含可检测标记物的多个第二互补核酸分子或各复合物包含可检测标记物的多个第二报告复合物的多个第二互补核酸分子与第一群体中的各测序探针中的第二附接区域结合;
(7)检测各结合的第二互补核酸分子或各第二报告复合物的各第二互补核酸分子的可检测标记物,
(8)鉴定通过第一群体中的测序探针杂交的固定的靶核酸中的多个第二核苷酸的位置和身份;和
(9)重复步骤(5)至(8),直到已鉴定固定的靶核酸中对应于第一群体中的各测序探针的靶结合域的各核苷酸。
155.权利要求154的方法,其中使所述第一群体中的各测序探针从所述固定的靶核酸去杂交的条件包括添加离液剂、还原剂、改变pH、改变盐浓度、改变温度或流体动力中的一种或多种。
156.权利要求155的方法,其中所述离液剂选自丁醇、乙醇盐酸胍、乙酸锂、高氯酸锂、氯化镁、苯酚、丙醇、十二烷基硫酸钠、十二烷基硫酸锂、甲酰胺、硫脲和尿素。
157.权利要求155的方法,其中所述还原剂选自TCEP(三(2-羧乙基)膦)、DTT(二硫苏糖醇)和β-巯基乙醇。
158.权利要求155的方法,其中所述改变温度是升高温度。
159.权利要求154的方法,其中步骤(5)和(6)依次或同时发生。
160.权利要求154或权利要求159的方法,其还包括以下步骤:
(10)将测序探针的第一群体的每个测序探针从所述核酸去杂交;
(11)去除第一群体的每个去杂交的测序探针;
(12)使至少测序探针的第二群体与固定的靶核酸杂交,其中所述第二群体中的每个测序探针包含:
靶结合域和条形码域;
其中所述靶结合域包含至少四个核苷酸,并且能够结合靶核酸;
其中所述条形码域包含合成主链,所述条形码域包含第一附接区域,所述第一附接区域包含能够被第一RNA分子结合的核酸序列,且其中所述第一附接区域的所述核酸序列确定由所述靶结合域的第一个核苷酸结合的所述靶核酸中的第一个核苷酸的位置和身份,且所述条形码域包含至少第二附接区域,所述第二附接区域包含能够被第二互补核酸分子结合的核酸序列,且其中所述第二附接区域的所述核酸序列确定由所述靶结合域的第二个核苷酸结合的所述靶核酸中的第二个核苷酸的位置和身份,且其中所述第一互补核酸分子不同于所述第二互补核酸分子,
其中所述第二群体中的每个测序探针在约相同条件下与固定的靶核酸去杂交;并且在与第一群体中的测序探针不同的条件与来自固定的靶核酸去杂交;
(13)使各自包含可检测标记物的多个第一互补核酸分子或各复合物包含可检测标记物的多个第一报告复合物的多个第一互补核酸分子与第二群体中的各测序探针中的第一附接区域结合;
(14)检测各结合的第一互补核酸分子或各第一报告复合物的各第一互补核酸分子的可检测标记物,
(15)鉴定通过第二群体中的测序探针杂交的固定的靶核酸中的多个第一核苷酸的位置和身份;
(16)使所述第二群体的各测序探针的各第一附接区域与多个缺乏可检测标记物的第一杂交核酸分子接触,从而未结合包含可检测标记物的第一互补核酸分子或各第一报告复合物的第一互补核酸分子且使缺乏可检测标记物的第一杂交核酸分子与各第一附接区域结合;
(17)使各自包含可检测标记物的多个第二互补核酸分子或各复合物包含可检测标记物的多个第二报告复合物的多个第二互补核酸分子与第二群体中的各测序探针中的第二附接区域结合;
(18)检测各结合的第二互补核酸分子或各第二报告复合物的各第二互补核酸分子的可检测标记物;
(19)鉴定通过第二群体中的测序探针杂交的固定的靶核酸中的多个第二核苷酸的位置和身份;和
(20)重复步骤(16)至(20),直到已鉴定固定的靶核酸中对应于第二群体中的各测序探针的靶结合域的各核苷酸。
161.权利要求160的方法,其中步骤(16)和(17)依次或同时发生。
162.权利要求160或权利要求161的方法,其中使所述第二群体中的各测序探针从所述固定的靶核酸去杂交的条件包括添加离液剂、还原剂、改变pH、改变盐浓度、改变温度或流体动力中的一种或多种。
163.权利要求162的方法,其中所述离液剂选自丁醇、乙醇、盐酸胍、乙酸锂、高氯酸锂、氯化镁、苯酚、丙醇、十二烷基硫酸钠、硫脲和尿素。
164.权利要求162的方法,其中所述还原剂选自TCEP(三(2-羧乙基)膦)、DTT(二硫苏糖醇)和β-巯基乙醇。
165.权利要求162的方法,其中所述改变温度是升高温度。
166.权利要求160至165中任一项的方法,其中所述第二群体中的各测序探针从固定的靶核酸去杂交的温度高于所述第一群体中的测序探针从靶核酸去杂交的温度。
167.权利要求166的方法,其中用一种或多种额外的探针群体重复步骤(10)至(20)。
168.权利要求167的方法,其还包括组装固定的靶核酸的每个区域的核苷酸的每个鉴定的线性顺序、从而鉴定固定的靶核酸的序列的步骤。
169.权利要求168的方法,其中组装的步骤包括具有存储在其上的可执行程序的非暂时计算机可读存储介质,其中所述程序指示微处理器以排列靶核酸的每个区域的核苷酸的每个鉴定的线性顺序,从而获得核酸的序列。
170.权利要求154至169中任一项的方法,其中测序探针的群体包含针对所述靶核酸中的特定感兴趣区域的额外测序探针。
171.权利要求170的方法,其中所述感兴趣的区域包含突变或SNP等位基因。
172.权利要求170的方法,其中所述感兴趣的区域不包含已知突变或SNP等位基因。
173.权利要求154至172中任一项的方法,其中测序探针的群体包含较少针对所述靶核酸中的特定不感兴趣区域的测序探针。
174.权利要求154至173中任一项的方法,其中缩短测序探针群体中的靶结合域的长度以增加靶核酸的特定区域中的探针的覆盖度。
175.权利要求154至174中任一项的方法,其中增加测序探针群体中的靶结合域的长度以减小靶核酸的特定区域中的探针的覆盖度。
176.权利要求154至175中任一项的方法,其中将测序探针群体区室化成测序探针的离散的较小集合。
177.权利要求176的方法,其中所述区室化基于所述测序探针中的靶结合域的预测解链温度。
178.权利要求176的方法,其中所述区室化基于所述测序探针中的靶结合域的序列基序。
179.权利要求176的方法,其中所述区室化基于经验推导的规则。
180.权利要求176至179中任一项的方法,其中测序探针的不同集合可以使用不同的反应条件与所述靶核酸反应。
181.权利要求180的方法,其中所述反应条件基于温度。
182.权利要求180的方法,其中所述反应条件基于盐浓度。
183.权利要求180的方法,其中所述反应条件基于缓冲液含量。
184.权利要求176至183中任一项的方法,其中进行区室化以覆盖具有均匀覆盖度的靶核酸。
185.权利要求176至183中任一项的方法,其中进行区室化以覆盖具有已知覆盖度概况的靶核酸。
186.权利要求154至185中任一项的方法,其中所述靶核酸为约4至1,000,000个核苷酸的长度,直至完整染色体或其片段的长度。
187.权利要求154至186中任一项的方法,其中附接区域包含核酸序列的一个至五十个拷贝。
188.权利要求187的方法,其中所述附接区域包含所述核酸序列的两个至三十个拷贝。
189.权利要求154至188中任一项的方法,其中所述测序探针包含可操作地连接至合成主链的多个拷贝的靶结合域。
190.权利要求82至189中任一项的方法,其中经由测序探针与缺乏可检测标记物的杂交核酸分子的接触而加速互补核酸分子从测序探针去结合的速率。
191.权利要求154至190中任一项的方法,其中当探针群体的第一等分试样从所述靶核酸去杂交且所述探针群体的第二等分试样与所述靶核酸杂交时,所述探针群体的第二等分试样以前没有与靶核酸杂交。
192.用于执行根据权利要求82至191中任一项的方法的装置。
193.权利要求192的装置,其包含如图24中所示的可消耗测序卡。
194.试剂盒,其包含基质,多个权利要求1至81中任一项的测序探针,至少一种捕获探针,至少一种包含可检测标记物的互补核酸分子,至少一种缺乏可检测标记物的互补核酸分子和使用说明书
195.权利要求193的试剂盒,其还包含如图24中所示的可消耗测序卡。

说明书全文

无酶且无扩增的测序

[0001] 相关申请的交叉引用本申请要求2014年11月 21日提交的美国临时申请号62/082,883的权益。上述专利
请的内容通过引用以其整体并入本文。
[0002] 序列表本申请含有已经经由EFS-Web以ASCII格式提交且在此通过引用以其整体并入的序列
表。所述ASCII拷贝,在2015年11月19日生成,被命名为NATE-025_ST25.txt,且大小为20,
860字节。
[0003] 发明背景目前存在各种核酸测序的方法,即确定核酸分子内核苷酸的精确顺序的方法。目前方
法需要酶促地(例如PCR和/或通过克隆)扩增核酸。需要进一步酶促聚合来通过光检测装置
产生可检测信号。这种扩增和聚合步骤是昂贵和/或耗时的。因此,本领域需要无扩增和无
酶的核酸测序方法。本发明解决了这些需求。
[0004] 发明概述本发明提供测序探针、方法、试剂盒和装置,其提供具有长读取长度和低误差率的无
酶、无扩增和无文库的核酸测序。此外,所述方法、试剂盒和装置具有快速的样品至答案
(sample-to-answer)能。这些特征对于在临床环境中的测序特别有用。
[0005] 本文提供了包含靶结合域和条形码域的测序探针。所述靶结合域和条形码域可以可操作地连接,例如共价连接。测序探针任选地包含靶结合域和条形码域之间的间隔物。所
述间隔物可以是具有适当机械性能的任何聚合物,例如(1至100个核苷酸,例如2至50个核
苷酸的)单链或双链DNA间隔物。双链DNA间隔物的非限制性实例包括SEQ ID NO: 25至SEQ 
ID NO: 29覆盖的序列。
[0006] 所述靶结合域包含至少四个核苷酸(例如,4、5、6、7、8、9、10、11、12或更多个),并且能够结合靶核酸(例如DNA、RNA和PNA)。所述条形码域包含合成的主链,所述条形码域至少具有包含一个或多个附接区域的第一位置。所述条形码域可以具有1、2、3、4、5、6、7、8、9、
10、11、12或更多个位置;每个位置具有一个或多个(例如,一个至五十个)附接区域;每个附接区域包含至少一个(即一个至五十个,例如十个至三十个拷贝的核酸序列)能够可逆结合
至互补核酸分子(RNA或DNA)。条形码域中的某些位置可具有比其它位置更多的附接区域;
可选地,条形码域中的每个位置具有相同数量的附接区域。第一附接区域的核酸序列确定
由靶结合域的第一个核苷酸结合的靶核酸中的第一个核苷酸的位置和身份,而第二附接区
域的核酸序列确定由靶结合域的第二个核苷酸结合的靶核酸中的第二个核苷酸的位置和
身份。同样,第六附接区域的核酸序列确定由靶结合域的第六个核苷酸结合的靶核酸中的
第六个核苷酸的位置和身份。在实施方案中,合成的主链包含多糖、多核苷酸(例如单链或
双链DNA或RNA)、肽、肽核酸或多肽。靶结合域中的核苷酸数目等于或大于条形码域中的位
置数(例如,1、2、3、4或更多)。条形码域的特定位置中的每个附接区域可以包括相同核酸序列的一个拷贝和/或相同核酸序列的多个拷贝。然而,附接区域将包括与条形码域的不同位
置的附接区域不同的核酸序列,甚至当两个附接区域都标识相同类型的核苷酸(例如腺嘌
呤、胸腺嘧啶、胞嘧啶、嘌呤、尿嘧啶和其类似物)时。附接区域可以在合成主链中连接至修饰的单体,例如修饰的核苷酸,从而相对于主链产生分支。附接区域可以是合成主链的多
核苷酸序列的一部分。一个或多个附接区域可以与至少一个侧接单链多核苷酸相邻,也就
是说,附接区域可以可操作地连接至5'侧接单链多核苷酸和/或3'侧接单链多核苷酸。具有
或不具有一个或两个侧接单链多核苷酸的附接区域可以与缺乏可检测标记物的杂交核酸
分子杂交。缺乏可检测标记物的杂交核酸分子可以长度为约4至约20个核苷酸之间,例如12
个核苷酸或更长。
[0007] 附接区域可以由包含可检测标记物的互补核酸结合。每个互补核酸可以包含可检测标记物。
[0008] 可选地,附接区域可以由作为报告复合物的一部分(包含可检测标记物)的互补核酸结合。互补核酸(包含可检测标记物或报告复合物)可以长度为约4至约20个核苷酸之间,
例如约8、10、12和14个核苷酸或更多。在报告复合物中,互补核酸与一级核酸分子(直接或
间接)连接。互补核酸可以经由单链或双链核酸接头(例如,包含1至100个核苷酸的多核苷
酸)间接连接至一级核酸分子。一级核酸与一个或多个(例如,1、2、3、4、5、6、7、8、9、10或更多个)二级核酸杂交。每个二级核酸与一个或多个(例如,1、2、3、4、5、6、7、8、9、10或更多个)三级核酸杂交;三级核酸包含一个或多个可检测标记物。一个或每个二级核酸可以包含不
与一级核酸分子杂交且不与三级核酸分子杂交的区域(“额外手柄”);该区域可以长度为四
个或更多个(例如,约6至约40个,例如约8、10、12和14个)核苷酸。不与一级核酸分子杂交并且不与三级核酸分子杂交的区域可以包含与一级核酸分子连接的互补核酸分子的核苷酸
序列。该区域可以位于其末端远端的与一级核酸杂交的第二核酸的末端。通过具有包含互
补核酸的核苷酸序列的“额外手柄”,报告复合物结合测序探针的可能性和速度大大增加。
在本发明的任何实施方案或方面中,当报告复合物包含“额外手柄”时,报告复合物可以经
由报告复合物的互补核酸或经由“额外手柄”与测序探针杂交。因此,例如,短语“结合第一附接区域  ... 第一报告复合物的第一互补核酸分子”将根据其明确含义理解,并且也被理
解为意指“结合第一附接区域 ... 第一报告复合物的“额外手柄”。
[0009] 在实施方案中,术语“条形码域”和“合成主链”是同义的。
[0010] 本文提供了用于使用本发明的测序探针对核酸测序的方法。所述方法包括以下步骤:(1)使本发明的至少一个测序探针与(例如,在1、2、3、4、5、6、7、8、9、10或更多个位置)固定至基质的靶核酸杂交;(2)使具有可检测标记物(例如,荧光标记物)的第一互补核酸分子
(RNA或DNA)或包含可检测标记物(例如,荧光标记物)的第一报告复合物的第一互补核酸分
子与第一附接区域结合;(3)检测可检测标记物,和(4)鉴定固定的靶核酸中的第一核苷酸
的位置和身份。任选地,固定的靶核酸在被探针结合之前是延长的。所述方法还包括以下步
骤:(5)使第一附接区域(具有或不具有一个或两个侧接单链多核苷酸)与缺乏可检测标记
物的第一杂交核酸分子接触, 从而未结合具有可检测标记物的第一互补核酸分子或包含
可检测标记物的第一报告复合物的第一互补核酸分子且使缺乏可检测标记物的第一杂交
核酸与至少第一附接区域结合;(6)使具有可检测标记物的第二互补核酸分子或包含可检
测标记物的第二报告复合物的互补核酸分子与第二附接区域结合;(7)检测可检测标记物;
和(8)鉴定固定的靶核酸中的第二核苷酸的位置和身份。重复步骤(5)至(8),直到已鉴定固
定的靶核酸中对应于靶结合域的每个核苷酸。步骤(5)和(6)可以同时或依次发生。每个(例
如,第一、第二、第三、第四、第五、第六、第七、第八、第九、第十或更高)互补核酸分子(具有可检测标记物或报告复合物的一部分)与其相应的(即,第一、第二、第三、第四、第五、第六、第七、第八、第九、第十或更高)缺乏可检测标记物的杂交核酸分子具有相同的核酸序列。通过用第一和/或第二捕获探针结合靶核酸的第一位置和/或第二位置而将靶核酸固定至基
质;每个捕获探针包含选择性结合基质的亲和标签。第一和/或第二位置可以在靶核酸的末
端处或附近。所述基质可以是本领域已知的任何固体支持物,例如包被的载玻片和微流体
装置(例如用链霉抗生物素蛋白包被)。位于靶核酸的末端的远端的其它位置可以与基质选
择性结合。可以通过施加足以延伸靶核酸的力(例如重力、流体动力、电磁力、流动拉伸、后退弯月面技术(receding meniscus technique)及其组合)来伸长核酸。
[0011] 本文提供了用于使用本发明的一种探针群体或本发明的多种探针群体对核酸测序的方法。所述方法包括以下步骤:(1)使(本发明的)测序探针的第一群体与固定至基质的
靶核酸杂交(其中在约相同条件(例如离液剂的平、温度、盐浓度、pH和流体动力)下,第一群体中的每个测序探针与固定的靶核酸去杂交);(2)使各自具有可检测标记物的多个第一
互补核酸分子或各复合物包含可检测标记物的多个第一报告复合物的多个第一互补核酸
分子与第一群体中的各测序探针中的第一附接区域结合;(3)检测可检测标记物;(4)鉴定
通过第一群体中的测序探针杂交的固定的靶核酸中的多个第一核苷酸的位置和身份;(5)
使第一群体的每个测序探针的每个第一附接区域与多个缺乏可检测标记物的第一杂交核
酸分子接触,从而未结合具有可检测标记物或报告复合物的第一互补核酸分子,且使缺乏
可检测标记物的第一杂交核酸分子与每个第一附接区域结合;(6)使各自具有可检测标记
物的多个第二互补核酸分子或各复合物包含可检测标记物的多个第二报告复合物的多个
第二互补核酸分子与第一群体中的各测序探针中的第二附接区域结合;(7)检测可检测标
记物;和(8)鉴定通过第一群体中的测序探针杂交的固定的靶核酸中的多个第二核苷酸的
位置和身份。在步骤(9)中,重复步骤(5)至(8),直到已鉴定固定的靶核酸中对应于第一群
体中的各测序探针的靶结合域的每个核苷酸。步骤(5)和(6)可以同时或依次发生。从而,对
于测序探针的第一群体中的测序探针的靶结合域杂交的固定的靶核酸的区域,鉴定核苷酸
的线性顺序。
[0012] 在实施方案中,当使用多个群体(即,多于一个群体)的探针时,所述方法还包括以下步骤:(10)将第一群体的每个测序探针从核酸去杂交;(11)去除第一群体的每个去杂交
的测序探针;(12)杂交至少本发明的测序探针的第二群体,其中第二群体中的每个测序探
针在约相同条件下与固定的靶核酸去杂交,并且在与第一群体中的测序探针不同的条件与
来自固定的靶核酸去杂交;(13)使各自具有可检测标记物的多个第一互补核酸分子或各复
合物包含可检测标记物的多个第一报告复合物的多个第一互补核酸分子与第二群体中的
各测序探针中的第一附接区域结合;(14)检测可检测标记物;(15)鉴定通过第二群体中的
测序探针杂交的固定的靶核酸中的多个第一核苷酸的位置和身份;(16)使第二群体的每个
测序探针的每个第一附接区域与多个缺乏可检测标记物的第一杂交核酸分子接触,从而未
结合(具有可检测标记物或来自报告复合物的)第一互补核酸分子,且使缺乏可检测标记物
的第一杂交核酸分子与每个第一附接区域结合;(17)使各自具有可检测标记物的多个第二
互补核酸分子或各复合物包含可检测标记物的多个第二报告复合物的多个第二互补核酸
分子与第二群体中的各测序探针中的第二附接区域结合;(18)检测可检测标记物;(19)鉴
定通过第二群体中的测序探针杂交的固定的靶核酸中的多个第二核苷酸的位置和身份;和
(20)重复步骤(16)至(19),直到对于通过测序探针的第二群体中的测序探针的靶结合域杂
交的固定的靶核酸的区域,已鉴定核苷酸的线性顺序。步骤(16)和(17)可以同时或依次发
生。
[0013] 第二群体中的每个测序探针可以在与第一群体中的测序探针从靶核酸去杂交的平均条件不同的条件(例如,更高的温度、更高的离液剂的水平、更高的盐浓度、更高的流速和不同的pH)下从固定的靶核酸去杂交。
[0014] 然而,当使用多于两个探针群体时,则两个连续群体中的探针可以在不同条件下去杂交,并且非连续群体中的探针可以在相似的条件下去杂交。作为实例,第一群体和第三
群体中的探针可以在相似的条件下去杂交。在实施方案中,连续的探针群体在越来越更严
格的条件(例如更高的离液剂水平、盐浓度和温度)下去杂交。对于微流体装置,使用温度作
为实例,第一探针群体可以在第一温度下保持杂交,但在高于第一温度的第二温度下去杂
交。第二探针群体可以在第二温度下保持杂交,但在高于第二温度的第三温度下去杂交。在
该实例中,流过用于初始探针群体的靶核酸的溶液(包含本方法所需的试剂)的温度低于流
过用于后续探针群体的靶核酸的溶液。
[0015] 在一些实施方案中,在已使用探针群体之后,将探针群体从靶核酸去杂交,并且使用相同的探针群体的新等分试样。例如,在已将第一探针群体杂交、检测和去杂交之后,将
第一探针群体的后续等分试样杂交。可选地,作为实例,可以将第一探针群体去杂交并用第
二探针群体替代;一旦已检测和去杂交第二群体,将第一探针群体的后续等分试样与靶核
酸杂交。因此,后续群体中的探针可以与已先前测序的靶核酸的区域杂交(从而获得重复
和/或验证的序列信息)或后续群体中的探针可以与未先前测序的靶核酸的区域杂交(从而
获得新的序列信息)。因此,当先前读取值不令人满意(由于任何原因)和/或改进由测序读
取导致的比对的准确性时,可以将探针群体重新等分。
[0016] 在类似条件下杂交和去杂交的探针可以具有相似的其靶结合域的长度、GC含量或重复基的频率及其组合。寡核苷酸的Tm和长度之间的关系教导于例如Sugimoto等人, 
Biochemistry, 34, 11211-6。
[0017] 当使用多于两个探针群体时,如对于测序探针的第一和第二群体所述的步骤用附加的探针群体(例如,10至100至1000个群体)重复。使用的探针群体的数量将取决于多种因
素,包括但不限于靶核酸的大小,每个群体中唯一探针的数量,所需的测序探针间的重叠程
度以及探针至目标区域的富集。
[0018] 探针群体可以含有针对靶核酸中的特定感兴趣的区域(例如含有突变(例如,点突变)或SNP等位基因的区域)的额外测序探针。探针群体可含有较少的针对靶核酸中的较不
感兴趣的特定区域的测序探针。
[0019] 可以将测序探针群体区室化成测序探针的离散的较小集合。区室化可以基于测序探针中的靶结合域的预测解链温度和/或测序探针中的靶结合域的序列基序。区室化可以
基于经验推导的规则。使用不同的反应条件,例如基于温度、盐浓度和/或缓冲液含量,不同的测序探针集合可以与靶核酸反应。可以进行区室化以覆盖具有均匀覆盖度的靶核酸。可
以进行区室化以覆盖具有已知覆盖度概况的靶核酸。
[0020] 可以缩短测序探针群体中的靶结合域的长度以增加靶核酸的特定区域中的探针的覆盖度。可以增加测序探针群体中的靶结合域的长度以减少靶核酸的特定区域中的探针
的覆盖度,例如高于测序装置的分辨极限。
[0021] 可选地或另外地,可以增加群体中的测序探针的浓度以增加靶核酸的特定区域中的探针的覆盖度。可以降低测序探针的浓度以减少靶核酸的特定区域中的探针的覆盖度,
例如高于测序装置的分辨极限。
[0022] 用于对核酸测序的方法还包括组装固定的靶核酸的每个区域的核苷酸的每个鉴定的线性顺序、从而鉴定固定的靶核酸的序列的步骤。组装的步骤使用具有存储在其上的
可执行程序的非暂时计算机可读存储介质,其指示微处理器以排列核苷酸的每个鉴定的线
性顺序,从而获得核酸的序列。组装可以“实时”发生,即在从测序探针收集数据的同时,而不是在已收集所有数据之后。
[0023] 靶核酸,即测序的靶核酸,可以长度在约4至1,000,000个核苷酸之间。靶标可以包括整个、完整的染色体或其长度,其长度大于1,000,000个核苷酸。
[0024] 本文提供了用于进行本发明的方法的装置。
[0025] 本文提供了包括本发明的测序探针和用于进行本发明的方法的试剂盒。在实施方案中,所述试剂盒包括能够经由捕获探针固定核酸的基质,本发明的多种测序探针,至少一
种捕获探针,至少一种具有可检测标记物的互补核酸分子,至少一种缺乏可检测标记物的
互补核酸分子,以及使用说明书。在实施方案中,所述试剂盒包含约或至少4096种独特的测
序探针。4096是包括每个可能的六聚体组合所必需的独特探针(即,对于条形码域中具有六
个附接区域的探针)的最小数量。此处,实现“4096”,是因为对于六个位置有四个核苷酸选项:46。对于在条形码域中具有四个附接区域的探针集合,将仅需要256种(即44种)独特探
针。对于在其靶结合域中具有8个核苷酸的探针集合,将需要48种(即65,536种)独特探针。
对于在其靶结合域中具有10个核苷酸的探针集合,将需要410种(即1,048,576种)独特探针。
[0026] 在实施方案中,所述试剂盒包含约或至少二十四种不同的具有可检测标记物的互补核酸分子,和约或至少二十四种不同的缺乏可检测标记物的杂交核酸分子。作为非限制
性实例,互补核酸可以结合具有SEQ ID NO: 1至24之一的序列的附接区域。可以包括在条
形码域中的额外示例性序列列于SEQ ID NO: 42至SEQ ID NO: 81中。实际上,核苷酸序列
不受限制;优选地,其缺乏与已知核苷酸序列的实质的同源性(例如,50%至99.9%);这有
助于避免互补核酸和靶核酸的不期望的杂交。
[0027] 任何上述方面和实施方案可以与任何其它方面或实施方案组合。
[0028] 除非另有定义,本文所用的所有技术和科学术语和本发明所属领域普通技术人员通常理解的具有相同含义。在说明书中,单数形式也包括复数形式,除非上下文另有明确规
定;作为实例,术语“一(a)”、“一(an)”和“该(the)”被理解为是单数或复数,且术语“或”被理解为包括性的。通过实例的方式,“一个要素”意指一个或多个元素。在整个说明书中,词语“包含(comprising)”或变型诸如“包含(comprises)”或“包含(comprising)”将被理解为暗示包括所述要素、整数或步骤或要素、整数或步骤的组群,但不排除任何其它要素、整数
或步骤或要素、整数或步骤的组群。约可以被理解为在所示值的10%、9%、8%、7%、6%、5%、4%、
3%、2%、1%、0.5%、0.1%、0.05%或0.01%内。除非从上下文另外清楚,否则本文提供的所有数值都通过术语“约”进行修饰。
[0029] 尽管与本文所述的方法和材料类似或等效的方法和材料也可以用于实施或测试本发明,但下文描述合适的方法和材料。本文提到的所有出版物、专利申请、专利和其它参
考文献全文通过引用并入。本文引用的参考文献不被承认是所请求保护的发明的现有技
术。在冲突的情况下,将以本说明书,包括定义,为准。此外,材料、方法和实例仅是说明性的,并不旨在进行限制。本发明的其它特征和优点从以下详述和权利要求将是显而易见的。
[0030] 附图简述本专利或申请文件含有至少一个以颜色绘制的图。本专利或专利申请公开的具有彩图
的拷贝在请求和支付必要费用后由专利和商标局提供。
[0031] 当结合附图进行时,上述和进一步的特征将从详述更清楚地理解。
[0032] 图1至图5显示本发明的示例性测序探针的示意图。
[0033] 图6A至图6D是显示本发明的测序探针的变体的示意图。
[0034] 图7显示本发明的测序探针的靶结合域的示意图;所述域包括零个、两个或四个具有通用碱基的核苷酸。
[0035] 图8A至图8E说明本发明的测序方法的步骤。
[0036] 图9A显示本发明的测序方法的初始步骤。
[0037] 图9B显示包含可检测标记物的报告复合物的示意图。
[0038] 图9C显示各自包含可检测标记物的多个报告复合物。
[0039] 图9D至9G显示图9A中开始的测序方法的进一步步骤。
[0040] 图10显示图9D和图9E中显示的步骤的替代说明,以及由此获得的示例性数据。所示测序探针的片段具有SEQ ID NO: 82的序列。
[0041] 图11说明图10中显示的方法的变型。所示测序探针的片段同样具有SEQ ID NO: 82的序列。
[0042] 图12说明本发明的方法。
[0043] 图13将本发明的测序方法中所需的步骤与其它测序方法所需的步骤进行比较。
[0044] 图14和图15例举可通过本发明获得的性能测量。
[0045] 图16比较了本发明和各种其它测序方法/装置的测序速率、读数和临床效用。
[0046] 图17表明本发明的测序方法的低原始误差率。所示模板序列具有SEQ ID NO: 83的序列。
[0047] 图18将可从本发明获得的测序数据与其它测序方法进行比较。
[0048] 图19表明本发明的测序方法的单碱基特异性。所示的模板和探针序列(从上至下)具有SEQ ID NO: 84至SEQ ID NO: 88的序列。
[0049] 图20A显示本发明的报告复合物的各种设计。
[0050] 图20B显示从图20A中显示的报告复合物获得的荧光计数。
[0051] 图20C显示用于构建本发明的报告复合物的示例性配方。
[0052] 图21A显示包含“额外手柄”的报告复合物的设计。
[0053] 图21B显示从具有“额外手柄”的报告复合物获得的荧光计数。
[0054] 图22A和图22B显示本发明的报告复合物的两种示例性设计的杂交动力学。
[0055] 图23显示与图8至图12中显示的方法不同的方法中使用的本发明的测序探针的示意图。
[0056] 图24显示可用于本发明中的可消耗测序卡的示意图。
[0057] 图25显示如实施例3中所述的10聚体的错配检测。所示核苷酸(从上至下)具有SEQ ID NO: 89至SEQ ID NO: 99的序列。
[0058] 图26显示根据实施例3中所述的靶结合域的大小的杂交能力。由于非常高的报告物浓度,背景很高,并且没有预先纯化。所示核苷酸(从上至下)具有SEQ ID NO: 100至SEQ 
ID NO: 104的序列。
[0059] 图27显示单个斑点相比于全长报告物之间的比较。单个斑点的结果显示杂交速度是全长条形码的1000倍(条件100nM靶标,30分钟杂交)。
[0060] 发明详述本发明提供测序探针、方法、试剂盒和装置,其提供具有长读取长度和低误差率的无
酶、无扩增和无文库的核酸测序。
[0061] 测序探针本发明涉及包含靶结合域和条形码域的测序探针。本发明的测序探针的非限制性实例
显示于图1至6中。
[0062] 图1显示本发明的测序探针的示意图。该示例性测序探针具有六个核苷酸的靶结合域,其各自对应于条形码域中的位置(其包含一个或多个附接区域)。注意第一附接区域;
其对应于靶结合域中由第一核苷酸结合的靶核酸的核苷酸。注意条形码域上的第三个位
置。注意包含两个附接区域的第五个位置。条形码域上的每个位置都可以具有多个附接区
域。例如,位置可以具有1至50个附接区域。条形码域中的某些位置可具有比其它位置更多
的附接区域(如此处位置5相对于位置1至4和6所示);可选地,条形码域中的每个位置具有
相同数量的附接区域(参见例如图2、3、5和6)。尽管未显示,但每个附接区域包含能够可逆
结合至互补核酸分子(RNA或DNA)的至少一个(即一个至五十个,例如十个至三十个)拷贝的
核酸序列。在图1中,附接区域对于组成条形码域的线性多核苷酸分子是必不可少的。
[0063] 图2显示本发明的测序探针的示意图。该示例性测序探针具有六个核苷酸的靶结合域,其各自对应于条形码域中的附接区域。注意第一附接区域;其对应于靶结合域中由第
一核苷酸结合的靶核酸的核苷酸。圈出条形码域的第四位置,其包含条形码域的一部分和
两个第四附接区域。注意两个第六附接区域。在此,每个位置具有两个附接区域;然而,条形码域上的每个位置可以具有一个附接区域或多个附接区域,例如2至50个附接区域。尽管未
显示,但每个附接区域包含能够可逆结合至互补核酸分子(RNA或DNA)的至少一个(即一个
至五十个,例如十个至三十个)拷贝的核酸序列。在图2中,条形码域是连接附接区域的线性
多核苷酸分子;附接区域对于多核苷酸分子不是必不可少的。
[0064] 图3显示本发明的测序探针的另一个示意图。该示例性测序探针具有四个核苷酸的靶结合域,其中这四个核苷酸对应于条形码域中的四个位置。每个位置显示具有三个连
接的附接区域。
[0065] 图4显示本发明的测序探针的另一个示意图。该示例性测序探针具有十个核苷酸的靶结合域。然而,只有前六个核苷酸对应于条形码域中的六个位置。添加第七至第十个核
苷酸(由“n1至n4”指示)以增加靶结合域的长度,从而影响探针将杂交并保持与靶核酸杂交
的可能性。在实施方案中,“n”核苷酸可以在对应于条形码域中的位置的核苷酸之前。在实施方案中,“n”核苷酸可以在对应于条形码域中的位置的核苷酸之后。在图4中,显示了四个“n”核苷酸;然而,靶结合域可以包括多于四个“n”核苷酸。“n”核苷酸可以具有通用碱基(例如,肌苷、2'-脱肌苷(次黄嘌呤脱氧核苷酸)衍生物、硝基吲哚、硝基吲唑类似物和疏水性芳族非氢键键合基团),其可以与四个典型碱基中任一个碱基配对
[0066] 本发明的另一个测序探针显示于图5中。此处,“n”核苷酸在对应于条形码域中的位置的核苷酸之前和之后。显示的示例性测序探针具有十个核苷酸的靶结合域。然而,靶结
合域中只有三至八个核苷酸对应于条形码域中的六个位置(第一至第六)。添加第一、第二、
第九和第十核苷酸(由“n1至n4”指示)以增加靶结合域的长度。在图5中,显示了四个“n”核苷酸;然而,靶结合域可以包括多于或少于四个“n”核苷酸。
[0067] 图6A至图6D显示图1的测序探针的变体。在图6A中,条形码域中靶结合域中的核苷酸的线性顺序和附接区域的线性顺序从左至右进行(相对于图示)。在图6B中,条形码域中
靶结合域中的核苷酸的线性顺序和附接区域的线性顺序从右至左进行(相对于图示)。在图
6C中,靶结合域中的核苷酸的线性顺序相对于条形码域中的附接区域的线性顺序反转。在
本发明的任何探针中,只要设计探针、使得靶结合域中的每个核苷酸对应于靶结合域中的
一个或多个附接域,则靶结合域中的核苷酸和条形码域中的附接区域缺乏严格顺序;图6D
中显示缺乏严格顺序。本发明的任何探针(例如,图1至5中例举的那些)可具有如图6中所示
的核苷酸和附接区域的顺序。
[0068] 所述靶结合域具有至少四个核苷酸,例如至少4、5、6、7、8、9、10、11、12或更多个核苷酸。所述靶结合域优选为多核苷酸。所述靶结合域能够结合靶核酸。
[0069] 探针可以包括可操作地连接至合成主链的多个拷贝的靶结合域。
[0070] 可以设计探针以控制杂交和/或去杂交的可能性以及这些发生的速率。通常,探针的Tm越低,探针将与/从靶核酸去杂交越快且可能性越高。因此,使用较低Tm探针将减少与
靶核酸结合的探针的数量。
[0071] 靶结合域的长度部分地影响探针杂交并保持与靶核酸杂交的可能性。通常,靶结合域越长(更多数目的核苷酸),靶核苷酸中将存在互补序列的可能性越小。相反,靶结合域
越短,靶核苷酸中将存在互补序列的可能性越大。例如,四聚体序列将位于靶核酸中的概率
为1/256,相比之下,六聚体序列将位于靶核酸中的概率为1/4096。因此,当与更长探针的集合相比时,对于给定的核酸区段,较短探针的集合将可能在更多位置结合。
[0072] 图7显示10聚体靶结合域。在一些实施方案中,所述靶结合域包括与四个典型核苷酸(A、G、C和T)中的任一个碱基配对的四个通用碱基(鉴定为“Ub”)。在实施方案中,所述靶结合域包括一个至六个(例如2个和4个)通用碱基。靶结合域可以不包括通用核苷酸。图7指
出,在靶结合域中具有6个特定核苷酸的“完整”探针群体将需要4096个独特探针,并且具有
10个特定核苷酸的“完整”探针群体将需要约 100万个独特探针。
~
[0073] 在一些情况下,优选具有较短靶结合域的探针以增加给定核酸区段中的读数,由此富集靶核酸或靶核酸的一部分、特别是特别感兴趣的部分的覆盖度,例如当检测突变或
SNP等位基因时。
[0074] 然而,可优选具有更少数量的与靶核酸结合的探针,因为存在区域中太多探针可引起其可检测标记物重叠、从而防止分辨两个临近探针。这解释如下。考虑到一个核苷酸长
度为0.34nm,并且考虑到测序装置的横向(x-y)空间分辨率为约200nm,测序装置的分辨极
限为约588个碱基对(即1个核苷酸/0.34nm x 200nm)。也就是说,当两个探针在彼此的约
588个碱基对之内时,上述测序装置将不能分辨来自与靶核酸杂交的两个探针的信号。因
此,取决于测序装置的分辨率,两个探针将需要在其可检测标记物可以被分辨为不同的“斑
点”之前间隔分开约600bp。所以,在最佳间距下,每600bp的靶核酸应该有单一探针。可以使用各种软件方法(例如,利用荧光强度值和波长依赖比率)来监测、限制和潜在地去卷积在
靶核酸的可分辨区域内杂交的探针的数量且相应地设计探针群体。此外,可以选择提供更
离散信号的可检测标记物(例如,荧光标记物)。此外,文献中的方法(例如,Small和
Parthasarthy: “Superresolution localization methods.” Annu. Rev. Phys Chem., 
2014; 65:107-25)描述了结构照明和各种超分辨率方法,其减少高达10's的纳米的测序显
微镜的分辨极限。使用更高分辨率测序装置允许使用具有较短靶结合域的探针。
[0075] 如上所提及,设计探针的Tm可以影响与靶核酸杂交的探针的数量。可选地或另外地,可以增加群体中的测序探针的浓度以增加靶核酸的特定区域中的探针的覆盖度。可以
降低测序探针的浓度以减少靶核酸的特定区域中的探针的覆盖度,例如高于测序装置的分
辨极限。
[0076] 术语“靶核酸”应当意指其序列将通过本发明的探针、方法和装置测定的核酸分子(DNA、RNA或PNA)。通常,术语“靶核酸”、“核酸分子”、“核酸序列”、“核酸”、“核酸片段”、“寡核苷酸”和“多核苷酸”可互换使用,并且意在包括,但不限于,可具有各种长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸或其类似物)的聚合形式。核酸的非限制性实例包括基因、基因
片段、外显子、内含子、基因间DNA(包括但不限于异染色体DNA)、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、小干扰RNA (siRNA)、非编码RNA(ncRNA)、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、序列的分离的DNA、序列的分离的RNA、核酸探针和引物。
[0077] 本方法直接对获得自样品(例如来自生物体的样品)的核酸分子测序,优选不进行转化(或扩增)步骤。作为实例,对于基于RNA的测序,本方法不需要在可获得序列之前将RNA
分子转化为DNA分子(即经由cDNA的合成)。由于不需要扩增或转化,当核酸在样品中或当其
获得自样品时,本发明中测序的核酸将保留核酸中存在的任何独特碱基和/或表观遗传标
记物。在本领域已知的测序方法中丢失了这种独特碱基和/或表观遗传标记物。
[0078] 靶核酸可以获得自核酸的任何样品或来源,例如任何细胞、组织或生物体,在体外,化学合成仪等等。靶核酸可以通过任何本领域公认的方法获得。在实施方案中,核酸获
得自临床受试者的血液样品。可以使用本领域熟知的方法和试剂从来源或样品提取、分离
或纯化核酸。
[0079] 包含靶核酸的核酸分子可以通过本领域已知的任何方式片段化。优选地,片段化通过酶促或机械方式进行。机械方式可以是超声处理或物理剪切。酶促方式可以通过用核
酸酶(例如脱氧核糖核酸酶I(DNase I))或一种或多种限制性内切核酸酶消化来进行。
[0080] 当包含靶核酸的核酸分子是完整的染色体时,应当采取步骤以避免将染色体片段化。
[0081] 靶核酸可以包括如本领域熟知的天然或非天然核苷酸,包括修饰的核苷酸。
[0082] 本发明的探针可以具有约20纳米至约50纳米的总长度(包括靶结合域、条形码域和任何任选域)。探针的主链可以是包含约120个核苷酸的多核苷酸分子。
[0083] 所述条形码域包含合成主链。合成主链和靶结合域可操作地连接,例如共价附接或经由接头附接。合成主链可以包括任何材料,例如多糖、多核苷酸、聚合物、塑料、纤维、肽、肽核酸或多肽。优选地,合成主链是刚性的。在实施方案中,所述主链包含六个DNA双螺旋的“DNA折纸(DNA origami)”(参见例如Lin等人, “Submicrometre geometrically 
encoded fluorescent barcodes self-assembled from DNA.” Nature Chemistry; 2012 
Oct; 4(10): 832-9)。条形码可以由DNA折纸拼贴制成(Jungmann等人, “Multiplexed 3D 
cellular super-resolution imaging with DNA-PAINT and Exchange-PAINT”, Nature 
Methods, Vol. 11, No. 3, 2014)。
[0084] 所述条形码域包含多个位置,例如一个、二个、三个、四个、五个、六个、七个、八个、九个、十个或更多个位置。位置数可以小于、等于或大于靶结合域中核苷酸的数量。优选与主链域中的位置数相比在靶结合域中包括额外的核苷酸,例如一个、二个、三个、四个、五
个、六个、七个、八个、九个、十个或更多个核苷酸。条形码域的长度不受限,只要对于如上所述的至少四个位置存在足够的空间。
[0085] 条形码域中的每个位置对应于靶结合域中的核苷酸,因此对应于靶核酸中的核苷酸。作为实例,条形码域中的第一位置对应于靶结合域中的第一个核苷酸,并且条形码域中
的第六位置对应于靶结合域中的第六个核苷酸。
[0086] 条形码域中的每个位置包含至少一个附接区域,例如一个至五十个或更多个附接区域。条形码域中的某些位置可以具有比其它位置更多的附接区域(例如,第一位置可以具
有三个附接区域,而第二位置可以具有两个附接位置);可选地,条形码域中的每个位置具
有相同数量的附接区域。每个附接区域包含能够被互补核酸分子(例如,DNA或RNA)可逆结
合的至少一个(即一个至五十个,例如十个至三十个)拷贝的核酸序列。在实例中,第一附接
区域中的核酸序列确定由靶结合域的第一个核苷酸结合的靶核酸中的第一个核苷酸的位
置和身份。每个附接区域可以在合成主链中连接至修饰的单体(例如修饰的核苷酸),使得
附接区域从合成主链分支。在实施方案中,附接区域对于多核苷酸主链是必不可少的;也就
是说,主链是单个多核苷酸,并且附接区域是单个多核苷酸序列的部分。在实施方案中,术
语“条形码域”和“合成主链”是同义的。
[0087] 附接区域中的核酸序列确定由测序探针的靶结合域的核苷酸结合的靶核酸中的核苷酸的位置和身份。在探针中,每个附接区域将具有独特的总体序列。实际上,条形码域
上的每个位置可以具有包含核酸序列的附接区域,所述核酸序列编码四种核苷酸之一,即
对腺嘌呤、胸腺嘧啶/尿嘧啶、胞嘧啶和鸟嘌呤之一具有特异性。此外,第一位置的附接区域(并且例如编码胞嘧啶)将包括不同于第二位置的附接区域(并且例如编码胞嘧啶)的核酸
序列。因此,对于编码胸腺嘧啶的第一位置的附接区域中的核酸序列,将不存在鉴定对应于
靶结合域的第一个核苷酸的靶核酸中的腺嘌呤的互补核酸分子的结合。此外,对于第二位
置的附接区域,将不存在鉴定对应于靶结合域的第一个核苷酸的靶核酸中的腺嘌呤的互补
核酸分子的结合。
[0088] 条形码域上的每个位置可以包括一个或多个(最多五十个,优选十个至三十个)附接区域;因此,每个附接区域可以结合一个或多个(最多五十个,优选十个至三十个)互补核
酸分子。作为实例,图1中的探针具有包含两个附接区域的第五位置,并且图2中的探针具有
具有六个附接区域的第二位置。在实施方案中,位置的附接区域的核酸序列是相同的;因
此,结合那些附接区域的互补核酸分子是相同的。在替代实施方案中,位置的附接区域的核
酸序列是不同的;因此,结合那些附接区域的互补核酸分子是不同的,例如各自包含不同的
核酸序列和/或可检测的标记物。因此,在替代实施方案中,附接至附接区域的不同核酸分
子(例如其可检测标记物)的组合提供了用于鉴定靶核酸中的核苷酸的代码。
[0089] 仅为了说明的目的,表1提供了用于测序探针的附件区域的示例性序列,所述测序探针在其条形码域中具有最多六个位置和在与其结合的互补核酸上的可检测标记物。
[0090] 表 1:靶结合域中的核苷酸/条形码域中的位置 核苷酸 附接区域中的核酸序列(5'至3') 互补核酸的可检测标记物 SEQ ID NO
1 A ATACATCTAG GFP 1
1 G GATCTACATA RFP 2
1 C TTAGGTAAAG CFP 3
1 U/T TCTTCATTAC YFP 4
2 A ATGAATCTAC GFP 5
2 G TCAATGTATG RFP 6
2 C AATTGAGTAC CFP 7
2 U/T ATGTTAATGG YFP 8
3 A AATTAGGATG GFP 9
3 G ATAATGGATC RFP 10
3 C TAATAAGGTG CFP 11
3 U/T TAGTTAGAGC YFP 12
4 A ATAGAGAAGG GFP 13
4 G TTGATGATAC RFP 14
4 C ATAGTGATTC CFP 15
4 U/T TATAACGATG YFP 16
5 A TTAAGTTTAG GFP 17
5 G ATACGTTATG RFP 18
5 C TGTACTATAG CFP 19
5 U/T TTAACAAGTG YFP 20
6 A AACTATGTAC GFP 21
6 G TAACTATGAC RFP 22
6 C ACTAATGTTC CFP 23
6 U/T TCATTGAATG YFP 24
[0091] 如表1中所见,第一附接区域的核酸序列可以是SEQ ID NO: 1至SEQ ID NO: 4之一,且第二附接的核酸序列可以是SEQ ID NO: 5至SEQ ID NO: 8之一。当靶核酸中的第一
个核苷酸是腺嘌呤时,第一附接区域的核酸序列将具有SEQ ID NO: 1的序列,并且当靶核
酸中的第二个核苷酸是腺嘌呤时,第二附接区域的核酸序列将具有SEQ ID NO: 5的序列。
[0092] 在实施方案中,互补核酸分子可以被可检测标记物结合。在替代实施方案中,互补核酸与包含可检测标记物的报告复合物相结合。
[0093] 互补核酸的核苷酸序列不受限制;优选地,其缺乏与已知核苷酸序列的实质的同源性(例如,50%至99.9%);这有助于避免互补核酸和靶核酸的不期望的杂交。
[0094] 可用于本发明的报告复合物的实例显示于图9B中。在该实例中,互补核酸连接至一级核酸分子,其进而与多个二级核酸分子杂交,所述二级核酸分子各自进而与其上附接
一个或多个可检测标记物的多个三级核酸分子杂交。
[0095] 在实施方案中,一级核酸分子可以包含约90个核苷酸。二级核酸分子可以包含约87个核苷酸。三级核酸分子可以包含约15个核苷酸。
[0096] 图9C显示示例性报告复合物的群体。包括在图9C的左上小图中的是与探针的附接区域1杂交的四个复合物。对于可存在于探针的靶结合域的核苷酸位置1的每个可能的核苷
酸,存在一种类型的报告复合物。在此,在进行本发明的序列方法的同时,如果探针的报告
域的位置1被具有“蓝色”可检测标记物的报告复合物结合,则靶结合域中的第一个核苷酸
被鉴定为腺嘌呤。可选地,如果位置1由具有“绿色”可检测标记物的报告复合物结合,则靶结合域中的第一个核苷酸被鉴定为胸腺嘧啶。
[0097] 报告复合物可以具有各种设计。例如,一级核酸分子可以与至少一个(例如,1、2、3、4、5、6、7、8、9、10或更多个)二级核酸分子杂交。每个二级核酸分子可以与至少一个(例如,1、2、3、4、5、6、7、8、9、10或更多个)三级核酸分子杂交。示例性报告复合物显示于图20A中。在此,“4x3”报告复合物具有与四个二级核酸分子杂交的一个一级核酸分子(其与互补
核酸分子连接),所述二级核酸分子各自与三个三核酸分子(各自包含可检测标记物)杂交。
在该图中,复合物的每个互补核酸长度为12个核苷酸(“12个碱基”);然而,互补核酸的长度不受限制,并且可以小于12个或多于12个核苷酸。右下方复合物包括其互补核酸和其一级
核酸分子之间的间隔物。所述间隔物被鉴定为20至40个核苷酸长;然而,间隔物的长度是非
限制性的,并且其可以短于20个核苷酸或长于40个核苷酸。
[0098] 图20B显示从图20A中所示的四个示例性报告复合物获得的可变平均(荧光)计数。在图20B中,将10pM生物素化的靶模板附接至链霉抗生物素蛋白包被的流动室表面上,将
10nM的报告复合物流至流动室上;孵育1分钟后,洗涤流动室,将流动室成像,并计数荧光特征。
[0099] 在实施方案中,所述报告复合物是“预构建的”。也就是说,在将复合物与探针接触之前,将复合物中的每个多核苷酸杂交。用于预构建五个示例性报告复合物的示例性配方显示于图20C中。
[0100] 图21A显示替代的报告复合物,其中二级核酸分子具有与三级核酸分子不杂交并且在一级核酸分子远端的“额外手柄”。在该图中,每个“额外手柄”为12个核苷酸长(“12聚体”);然而,它们的长度不受限制,并且可以小于12个或多于12个核苷酸。在实施方案中,“额外手柄”各自包含互补核酸的核苷酸序列;因此,当报告复合物包含“额外手柄”时,报告复合物可以经由报告复合物的互补核酸或经由“额外手柄”与测序探针杂交。因此,报告复
合物结合测序探针的可能性增加。“额外手柄”设计还可以改善杂交动力学。不受理论束缚,“额外手柄”基本上增加报告复合物的互补核酸的有效浓度。
[0101] 图21B显示使用针对图20B描述的程序从具有“额外手柄”的五个示例性报告复合物获得的可变平均(荧光)计数。
[0102] 图22A和22B显示两个示例性报告复合物的杂交动力学和荧光强度。到约5分钟,总计数开始至平台期,表明添加的大多数报告复合物已经发现可用的靶标。
[0103] 可检测部分、标记物或报告物可以以各种方式(包括直接或间接附接可检测部分、诸如荧光部分、比色部分等)结合至互补核酸或三级核酸分子。本领域技术人员可以参考针
对标记核酸的参考文献。荧光部分的实例包括但不限于黄色荧光蛋白(YFP)、绿色荧光蛋白
(GFP)、青色荧光蛋白(CFP)、红色荧光蛋白(RFP)、伞形、荧光素、异硫氰酸荧光素、罗丹明、二氯三嗪胺荧光素、花菁、丹酰氯、藻青蛋白、藻红蛋白等。荧光标记物及其与核苷酸和/或寡核苷酸的附接描述于许多综述,包括Haugland, Handbook of Fluorescent Probes 
and Research Chemicals, 第九版 (Molecular Probes, Inc., Eugene, 2002); Keller 
and Manak, DNA Probes, 第2版 (Stockton Press, New York, 1993); Eckstein, 编辑 
Oligonucleotides and Analogues: A Practical Approach (IRL Press, Oxford, 
1991);和Wetmur, Critical Reviews in Biochemistry and Molecular Biology, 26:
227-259 (1991)。适用于本发明的具体方法公开于以下参考文献样本中:美国专利号4,
757,141;5,151,507;和5,091,519。在一个方面,一种或多种荧光染料用作标记的靶序列的标记物,例如如由美国专利号5,188,934(4,7-二氯荧光素染料);5,366,860(光谱可分辨的
罗丹明染料);5,847,162(4,7-二氯罗丹明染料);4,318,846(醚取代的荧光素染料);5,
800,996(能量转移染料);Lee等人5,066,580(黄嘌呤染料);5,688,648(能量转移染料);等
所公开。标记也可以用量子点进行,如以下专利和专利公开中所公开:美国专利号6,322,
901;6,576,291;6,423,551;6,251,303;6,319,426;6,426,513;6,444,143;5,990,479;6,
207,392;2002/0045045;和2003/0017264。如本文所用,术语“荧光标记物”包含通过一个或多个分子的荧光吸收和/或发射性能传递信息的信号传导部分。这种荧光性能包括荧光强
度、荧光寿命、发射光谱特征、能量转移等。
[0104] 容易掺入核苷酸和/或寡核苷酸序列中的市售荧光核苷酸类似物包括但不限于Cy3-dCTP、Cy3-dUTP、Cy5-dCTP、Cy5-dUTP (Amersham Biosciences, Piscataway, NJ)、荧光素- 12-dUTP、四甲基罗丹明-6-dUTP、TEXAS RED™-5-dUTP、CASCADE BLUE™-7-dUTP、
BODIPY TMFL-14-dUTP、BODIPY TMR-14-dUTP、BODIPY TMTR-14-dUTP、RHODAMINE GREEN™-
5-dUTP、OREGON GREENR™ 488-5-dUTP、TEXAS RED™- 12-dUTP、BODIPY TM 630/650- 14-
dUTP、BODIPY TM 650/665- 14-dUTP、ALEXA FLUOR™ 488-5-dUTP、ALEXA FLUOR™ 532-5-
dUTP、ALEXA FLUOR™ 568-5-dUTP、ALEXA FLUOR™ 594-5-dUTP、ALEXA FLUOR™ 546- 14-
dUTP、荧光素- 12-UTP、四甲基罗丹明-6-UTP、TEXAS RED™-5-UTP、mCherry、CASCADE BLUE™-7-UTP、BODIPY TM FL-14-UTP、BODIPY TMR-14-UTP、BODIPY TM TR-14-UTP、RHODAMINE GREEN™-5-UTP、ALEXA FLUOR™ 488-5-UTP、LEXA FLUOR™ 546- 14-UTP (Molecular 
Probes, Inc. Eugene, OR)等。可选地,可以使用例如亚磷酰胺盐(phosphoroamidite)或
NHS化学在寡核苷酸合成期间加入上述荧光团和本文提及的那些。本领域已知用于定制合
成具有其它荧光团的核苷酸的方案(参见,Henegariu等人 (2000) Nature Biotechnol. 
18:345)。2-基嘌呤是可以在其合成期间直接掺入寡核苷酸序列的荧光碱基。核酸也可以
先用插入染料诸如DAPI、YOYO-1、溴化乙锭、花青染料(例如SYBR Green)等进行染色。
[0105] 可用于合成后附接的其它荧光团包括但不限于ALEXA FLUOR™ 350、ALEXA FLUOR™ 405、ALEXA FLUOR™ 430、ALEXA FLUOR™ 532、ALEXA FLUOR™ 546、ALEXA FLUOR™ 
568、ALEXA FLUOR™ 594、ALEXA FLUOR™ 647、BODIPY 493/503、BODIPY FL、BODIPY R6G、BODIPY 530/550、BODIPY TMR、BODIPY 558/568、BODIPY 558/568、BODIPY 564/570、BODIPY 
576/589、BODIPY 581/591、BODIPY TR、BODIPY 630/650、BODIPY 650/665、Cascade Blue、Cascade Yellow、Dansyl、丽丝胺罗丹明B、Marina Blue、Oregon Green 488、Oregon Green 
514、Pacific Blue、Pacific Orange、罗丹明6G、罗丹明绿、罗丹明红、四甲基罗丹明、得克萨斯红(可得自Molecular Probes, Inc., Eugene, OR)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7 (Amersham Biosciences, Piscataway, NJ)等。还可以使用FRET串联荧光团,包括但不限
于PerCP-Cy5.5、PE-Cy5、PE-Cy5.5、PE-Cy7、PE-Texas Red、APC-Cy7、PE-Alexa染料(610、
647、680)、APC-Alexa染料等。
[0106] 金属或金颗粒可用于增强来自荧光标记的核苷酸和/或寡核苷酸序列的信号(Lakowicz等人 (2003) BioTechniques 34:62)。
[0107] 寡核苷酸序列的其它合适的标记物可以包括荧光素(FAM、FITC)、洋地黄毒苷、二硝基苯酚(DNP)、丹酰基、生物素、溴脱氧尿苷(BrdU)、六组氨酸(6xHis)、磷酸-氨基酸(例
如,P-tyr、P-ser、P-thr)等。在一个实施方案中,以下半抗原/抗体对用于检测,其中各抗体用可检测标记物衍生化:生物素/α-生物素、洋地黄毒苷/a-洋地黄毒苷、二硝基苯酚(DNP)/a-DNP、5-羧基荧光素(FAM)/a-FAM。
[0108] 本文描述的可检测标记物是光谱可分辨的。参考多个荧光标记物的“光谱可分辨的”是指标记物的荧光发射带足够不同,即足够不重叠,可以基于相应标记物通过标准光检
测系统生成的荧光信号来区分附接各自标记物的分子标签,所述标准光检测系统例如采用
带通滤光器和光电倍增管等的系统,如美国专利号4,230,558;4,811,218;等,或Wheeless
等人, 第21-76页,Flow Cytometry:Instrumentation and Data Analysis (Academic 
Press, New York, 1985)中所述的系统所例举的。在一个方面,光谱可分辨的有机染料,诸
如荧光素、罗丹明等,意味着波长发射最大值间隔分开至少20nm,另一方面间隔分开至少
40nm。在另一个方面,光谱可分辨的螯合的镧系元素化合物、量子点等意味着波长发射最大
值间隔分开至少10nm,在另一个方面,分开至少15nm。
[0109] 测序方法本发明涉及用于使用本发明的测序探针对核酸测序的方法。所述方法的实例显示于图
8至12中。
[0110] 所述方法包括使本发明的至少一个测序探针与(例如,在1、2、3、4、5、6、7、8、9、10或更多个位置)固定至基质的靶核酸可逆地杂交。
[0111] 所述基质可以是本领域已知的任何固体支持物,例如包被的载玻片和微流体装置,其能够固定靶核酸。在某些实施方案中,所述基质是表面、膜、珠、多孔材料、电极或阵列。所述靶核酸可以固定至本领域技术人员显而易见的任何基质上。
[0112] 在实施方案中,所述靶核酸由捕获探针结合,所述捕获探针包含与靶核酸的一部分互补的域。所述部分可以是靶核酸的末端,或可以不是朝向末端。
[0113] 示例性有用的基质包括包含选自配体、抗原、水化合物、核酸、受体、凝集素和抗体的结合部分的基质。所述捕获探针包含能够与基质的结合部分结合的结合部分。包含反应性部分的示例性的有用的基质包括但不限于包含环氧基、、金、酰肼、巯基、NHS-酯、胺、硫醇、羧酸酯、来酰亚胺、羟甲基膦、亚氨酯、异氰酸酯、羟基、五氟苯基酯、补骨脂素、吡啶基二硫化物或乙烯基砜、聚乙二醇(PEG)、水凝胶或其混合物的表面。这样的表面可以从商
业来源获得或根据标准技术制备。包含反应性部分的示例性有用的基质包括但不限于
OptArray-DNA NHS基团(Accler8)、Nexterion Slide AL (Schott)和Nexterion Slide E 
(Schott)。
[0114] 在实施方案中,捕获探针的结合部分是生物素,且基质包含抗生物素蛋白(例如链霉抗生物素蛋白)。包含抗生物素蛋白的有用的基质是市售的,包括TB0200 (Accelr8)、
SAD6、SAD20、SAD100、SAD500、SAD2000 (Xantec)、SuperAvidin (Array-It)、链霉抗生物素蛋白载玻片(目录号#MPC 000, Xenopore)和STREPTAVIDINnslide (目录号#439003, 
Greiner Bio-one)。
[0115] 在实施方案中,捕获探针的结合部分是抗生物素蛋白(例如,链霉抗生物素蛋白),且基质包含生物素。市售的包含生物素的有用的基质包括但不限于Optiarray-生物素
(Accler8)、BD6、BD20、BD100、BD500和BD2000 (Xantec)。
[0116] 在实施方案中,捕获探针的结合部分可以包含能够通过光活化与基质结合的反应性部分。所述基质可以包含光反应性部分,或者纳米报告物的第一部分可以包含光反应部
分。光反应性部分的一些实例包括芳基叠氮化物,例如N((2-吡啶基二硫基)乙基)-4-叠氮
基水杨酰胺;氟化芳基叠氮化物,诸如4-叠氮基-2,3,5,6-四氟苯甲酸;基于二苯甲酮的试
剂,诸如4-苯甲酰基苯甲酸的琥珀酰亚胺酯;和5-溴-脱氧尿苷。
[0117] 在实施方案中,捕获探针的结合部分可以经由本领域技术人员显而易见的其它结合对固定至基质。
[0118] 在结合至基质之后,可以通过施加足以延伸靶核酸的力(例如重力、流体动力、电磁力“电拉伸”、流动拉伸、后退弯月面技术及其组合)来伸长核酸。
[0119] 所述靶核酸可以由第二捕获探针结合,所述第二捕获探针包含与靶核酸的第二部分互补的域。所述部分可以是靶核酸的末端,或可以不是朝向末端。第二捕获探针的结合可
以在靶核酸的延伸之后或期间发生,或者第二捕获探针可以与未延伸的靶核酸结合。第二
捕获探针可具有如上所述的结合。
[0120] 捕获探针可以包含可检测标记物(即基准点)或与可检测标记物(即基准点)缔合。
[0121] 捕获探针能够从样品分离靶核酸。在此,将捕获探针加入包含靶核酸的样品。捕获探针经由捕获探针的区域结合靶核酸,所述捕获探针的区域与靶核酸的区域互补。当靶核
酸接触包含结合捕获探针的结合部分的部分的基质时,核酸被固定至基质上。
[0122] 为了确保使用者从高片段化的样品尽可能多地“捕获”靶核酸分子,包括多个捕获探针、每个捕获探针与靶核酸的不同区域互补是有帮助的。例如,可以存在三个捕获探针集
合,其中第一集合与靶核酸的靠近其5'末端的区域互补,第二集合与靶核酸中间的区域互
补,且第三集合靠近其3'末端。这可以概括到每个靶核酸的“n个感兴趣区域”。在该实例中,片段化的靶核酸的每个单独集合与包含或结合生物素标签的捕获探针结合。输入样品的1/
n(其中n =靶核酸中不同区域的数目)被分离用于每个集合室。捕获探针结合感兴趣的靶核
酸。然后将靶核酸经由捕获探针的生物素固定至附接至基质的抗生物素蛋白分子。任选地,
将靶核酸例如经由流动或静电力拉伸。所有n个集合可以同时拉伸和结合,或者为了最大化
完全拉伸分子的数量,可以首先拉伸和结合集合1(其捕获最多5'区域);然后可以拉伸和结
合集合2(其捕获靶区域的中间);最后,可以拉伸和结合集合3。
[0123] 所需的不同捕获探针的数量与靶核酸片段的大小成反比。换句话说,对于高度片段化的靶核酸,将需要更多的捕获探针。对于具有高度片段化和降解的靶核酸的样品类型
(例如,福尔马林固定石蜡包埋的组织),包括多个捕获探针集合可以是有用的。另一方面,
对于具有长靶核酸片段的样品,例如体外获得的分离的核酸,在5'末端的单个捕获探针可
以是足够的。
[0124] 靶核酸在两个捕获探针之间或在一个捕获探针之后且在靶核酸的末端之前的区域在本文中称为“缺口”。该缺口是靶核酸可用于由本发明的测序探针结合的一部分。最小
缺口是靶结合域长度(例如,4至10个核苷酸),并且最大缺口是整个染色体的大部分。
[0125] 固定的靶核酸显示于图12中。在此,两个捕获探针被鉴定为“5′捕获探针”和“3′捕获探针”。
[0126] 图8A显示与靶核酸结合的测序探针的示意图。在此,靶核酸具有胸苷(T)。在顶部显示包含可检测标记物或报告复合物的第一互补核酸集合,集合的每个成员具有不同的可
检测标记物(例如,胸苷通过绿色信号鉴定)和不同的核苷酸序列。靶结合域中的第一个核
苷酸结合靶核酸中的T。探针的第一附接区域包括一个或多个核苷酸序列,其指示探针的靶
结合域中的第一个核苷酸结合胸苷。因此,仅胸苷的互补核酸结合条形码域的第一位置。如
所示,包含可检测标记物的编码胸腺嘧啶的第一互补核酸或包含可检测标记物的报告复合
物与探针的条形码域的第一位置的附接区域结合。
[0127] 互补核酸或报告复合物的集合的数量与条形码域中的位置数相同。因此,对于具有六个位置的条形码域,将在探针上循环六个集合。
[0128] 可选地,在使靶核酸与探针接触之前,探针可以在其第一位置与包含可检测标记物的互补核酸或报告复合物杂交。因此,当与其靶核酸接触时,探针能够从其第一位置发射
可检测信号,并且不必提供针对条形码域上的第一位置的互补核酸或报告复合物的第一集
合。
[0129] 图8B继续图8A中所示的方法。在此,与条形码域的第一位置的附接区域结合的胸苷的第一个互补核酸(或报告复合物)已被用于胸苷且缺乏可检测标记物的第一杂交核酸
替代。用于胸苷且缺乏可检测标记物的第一杂交核酸替代包含可检测标记物的先前结合的
互补核酸或先前结合的报告复合物。因此,条形码域的位置1不再发射可检测信号。
[0130] 在实施方案中,包含可检测标记物的互补核酸或报告复合物可以从附接区域除去,但未用缺乏可检测标记物的杂交核酸替代。这可以例如通过添加离液剂、增加温度、改
变盐浓度、调节pH和/或应用流体动力来进行。在这些实施方案中,需要较少的试剂(即,缺
乏可检测标记物的杂交核酸)。
[0131] 图8C继续请求保护的本发明的方法。在此,所述靶核酸具有胞苷(C)和其之前的胸苷(T)。互补核酸或报告复合物的第二集合显示在顶部,集合的每个成员具有不同的可检测
标记物和不同的核苷酸序列。此外,第一集合的互补核酸或报告复合物的互补核酸的核苷
酸序列不同于第二集合的那些的核苷酸序列。然而,碱基特异性可检测标记物对于互补核
酸的集合是共同的,例如胸苷通过绿色信号鉴定。在此,靶结合域中的第二个核苷酸结合靶
核酸中的C。探针的第二附接区域具有核苷酸序列,其指示探针的靶结合域中的第二个核苷
酸结合胞苷。因此,仅来自第二集合和用于胞苷的包含可检测标记物的互补核酸或报告复
合物结合条形码域的第二位置。如所示,编码胞苷的第二互补核酸或报告复合物在探针的
条形码域的第二位置结合。
[0132] 在实施方案中,图8C中所示的步骤在图8B中所示的步骤之后。在此,一旦(图8A的)互补核酸或报告复合物的第一集合已经被(图8B中)缺乏可检测标记物的第一杂交核酸替
代,则提供互补核酸或报告复合物的第二集合(如图8C中所示)。可选地,图8C中所示的步骤
与图8B中所示的步骤同时进行。在此,与互补核酸或报告复合物的第二集合(如图8C中所
示)同时提供缺乏可检测标记物的第一杂交核酸(如图8B中所示)。
[0133] 图8D继续图8C中所示的方法。在此,条形码域上的第一至第五位置由包含可检测标记物的互补核酸或报告复合物结合,并且已被替换为缺乏可检测标记物的杂交核酸。条
形码域的第六位置目前由包含可检测标记物的互补核酸或报告复合物结合,其将靶结合域
中的第六位置鉴定为与鸟嘌呤(G)结合。
[0134] 如上所提及,包含可检测标记物的互补核酸或报告复合物可以从附接区域除去,但未用缺乏可检测标记物的杂交核酸替代。
[0135] 如果需要,可以通过掺入加速可检测标记物的交换速率的小单链寡核苷酸来加速可检测标记物交换速率(例如,“Toe-Hold” Probes;参见,例如,Seeling等人, “Catalyzed Relaxation of a Metastable DNA Fuel”; J. Am. Chem. Soc. 2006, 128(37), 
pp12211-12220)。
[0136] 可在条形码域的最终位置(图8D中的第六位置)上替换互补核酸或报告子复合物;然而,当用测序探针被替换为另一个测序探针时,这可能是不必要的。实际上,图8D的测序
探针现在可以从靶核酸去杂交并除去,并且被替换为还没有被任何互补核酸结合的第二
(重叠的或非重叠的)测序探针,如图8E中所示。第二探针群体中可以包括图8E中的探针。
[0137] 像图8A至8E一样,图9A和9D至9G显示本发明的方法步骤;然而,图9A和9D至9G清楚地显示报告复合物(包含可检测标记物)与测序探针的附接区域结合。图9D和9E显示与报告
复合物杂交的探针发射的荧光信号。图9D和9E显示靶核酸具有“T-A”的序列。
[0138] 图10概述图9D和9E中所示的步骤。在图的顶部显示示例性探针的核苷酸序列并鉴定探针的重要域。该探针在其靶结合域和其条形码域之间包含任选的双链DNA间隔物。条形
码域依次包含“侧接1”部分、“AR-1”部分、“AR-1/侧接2”部分、“AR-2”部分和“AR-2/侧接3”部分。在步骤1中,“AR-1检测”与探针的“AR-1”和“AR-1/侧接2”部分杂交。“AR-1检测”对应于编码第一位置胸苷的报告复合物或包含可检测标记物的互补核酸。因此,步骤1对应于图
9D。在步骤2中,“缺乏1”与探针的“侧接1”和“AR-1”部分杂交。“缺乏1”对应于对探针的第一附接区域特异性的缺乏可检测标记物的杂交核酸(如图9E中显示为覆盖第一附接区域的黑
色条)。通过在报告复合物或互补核酸5'的“侧接1”位置杂交,杂交核酸更有效地将报告复
合物/互补核酸从探针置换。“侧接”部分也称为“Toe-Holds”。在步骤3中,“AR-2检测”与探针的“AR-2”和“AR-2/侧接3”部分杂交。“AR-2检测”对应于报告复合物或包含可检测标记物的编码第二位置鸟嘌呤的互补核酸。因此,步骤3对应于图9E。在该实施方案中,依次提供缺乏可检测标记物的杂交核酸和包含可检测标记物的互补核酸/报告复合物。
[0139] 可选地,同时提供缺乏可检测标记物的杂交核酸和包含可检测标记物的互补核酸/报告复合物。该替代实施方案显示于图11中。在步骤2中,提供“缺乏1”(缺乏可检测标记物的杂交核酸)连同“AR-2检测”(编码第二位置鸟嘌呤的报告复合物)。该替代实施方案可
以比图10中所示的实施方案更加有效,因为它将两个步骤组合成一个。
[0140] 图12说明本发明的方法。在此,将靶核酸捕获并固定在两个位置,从而产生探针能够结合的“缺口”。将第一探针群体杂交至靶核酸上,并检测可检测的标记物。用第二探针群体、第三探针群体至超过100个探针群体重复初始步骤。约100个探针群体的使用提供靶核
酸中每个核苷酸的约5倍的覆盖度。图12基于检测来自一个视场(FOV)的信号所需的时间提
供了读取时间的估计速率。
[0141] 探针沿靶核酸长度的分布对于可检测信号的分辨是至关重要的。如上所论述,两个可检测标记物的分辨极限为约600个核苷酸。优选地,探针群体中的每个测序探针将彼此
结合不近于600个核苷酸。如上所论述,600个核苷酸是典型测序装置的分辨极限。在这种情
况下,测序探针将提供单次读取值;这在图12中显示在最左边的分辨限制点。
[0142] 随机地,但部分取决于靶结合域的长度、探针的Tm和所用探针的浓度,群体中两个不同的测序探针可在彼此的600个核苷酸内结合。在这种情况下,无序多次读取值将从单个
分辨限制点发出;这在图12中显示在第二个分辨限制点。
[0143] 替代地或另外地,可以降低群体中的测序探针的浓度以减少靶核酸的特定区域中的探针的覆盖度,例如高于测序装置的分辨极限,从而从分辨限制点产生单个读数。
[0144] 图23显示不同于图8至12中使用的测序探针的示意图。在此,条形码域上的每个位置由包含可检测标记物的互补核酸或报告复合物结合。因此,在该实例中,可以读取六个核
苷酸序列而不需要依次替换互补核酸。此测序探针的使用将减少获得序列信息的时间,因
为省略所述方法的许多步骤。然而,该探针将受益于不重叠的可检测标记物,例如,荧光团
被非重叠波长的光激发或荧光团发射不重叠波长的光。
[0145] 所述方法还包括组装固定的靶核酸的每个区域的核苷酸的每个鉴定的线性顺序、从而鉴定固定的靶核酸的序列的步骤。组装的步骤使用具有存储在其上的可执行程序的非
暂时计算机可读存储介质。该程序指示微处理器以排列靶核酸的每个区域的核苷酸的每个
鉴定的线性顺序,从而获得核酸的序列。组装可以“实时”发生,即在从测序探针收集数据的同时,而不是在已收集所有数据之后。
[0146] 上述方面和实施方案中的任一个可以与此处在概述和/或详述部分中公开的任何其它方面或实施方案组合。
[0147] 定义:在某些示例性实施方案中,如本文所用的术语“退火”和“杂交”可互换使用以表示形成
稳定的双链体。在一个方面,稳定的双链体是指双链体结构在诸如以下的条件下不被严格
洗涤破坏:双链体的链的Tm以下约5℃或以上约5℃的温度和低单价盐浓度,例如小于0.2M,
或小于0.1M或本领域技术人员已知的盐浓度。术语“完美匹配的”当参考双链体使用时是指
构成双链体的多核苷酸和/或寡核苷酸链与彼此形成双链结构,使得每条链中的每个核苷
酸经历与另一条链中的核苷酸的Watson-Crick碱基配对。术语“双链体”包括但不限于可以
采用的核苷类似物诸如脱氧肌苷、具有2-氨基嘌呤碱基的核苷、PNA等的配对。两个寡核苷
酸之间的双链体中的“错配”意味着双链体中的一对核苷酸不能进行Watson-Crick键合。
[0148] 如本文所用,术语“杂交条件”将通常包括小于约1M、更通常小于约500mM且甚至更通常小于约200mM的盐浓度。杂交温度可以低至5℃,但通常大于22℃,更通常大于约30℃,
并且经常超过约37℃。杂交通常在严格条件,例如探针将与其靶序列特异性杂交的条件下
进行。严格条件是序列依赖性的,并且在不同情况下是不同的。较长的片段可需要较高的杂
交温度用于特异性杂交。由于其它因素可影响杂交的严格性,包括互补链的碱基组成和长
度,有机溶剂的存在和碱基错配的程度,参数的组合比单独任一个的绝对测量更重要。
[0149] 通常,选择严格条件以便在定义的离子强度和pH下比特定序列的Tm低约5℃。示例性严格条件包括在pH 7.0至8.3和至少25℃的温度下至少0.01M至不超过1M Na离子浓度
(或其它盐)的盐浓度。例如,5X SSPE (750 mM NaCl, 50 mM磷酸钠,5mM EDTA,pH7.4)和
25-30℃的温度的条件适用于等位基因特异性探针杂交。对于严格条件,参见例如
Sambrook, Fritsche和Maniatis, “Molecular Cloning A Laboratory Manual, 2nd 
Ed.” Cold Spring Harbor Press (1989)和Anderson Nucleic Acid Hybridization, 第
1版, BIOS Scientific Publishers Limited (1999)。如本文所用,术语“与…特异性杂
交”或“与…特异性杂交”或类似术语是指分子在严格条件下实质上与一个或多个特定核苷
酸序列结合、双链化或杂交。
[0150] 与探针的特定位置缔合的可检测标记物可以“读取”(例如其检测到的荧光)一次或多次;“读取”可以与术语“碱基呼叫(basecall)”同义。多次读取改善准确性。当检测到从单个初始靶分子得到的序列信息的连续序列段时,靶核酸序列被“读取”;通常,这经由多通道共有物产生(如下所定义)。如本文所用,术语“覆盖度”或“覆盖深度”是指靶标区域已被测序(经由离散读取值)并与参考序列比对的次数。读取覆盖度是映射至特定参考目标序列
的总读数;碱基覆盖度是在特定基因组位置进行的碱基呼叫的总数。
[0151] 如本文所用,“hybe和seq循环”是指检测特定探针或探针群体上的每个附接区域所需的所有步骤。例如,对于能够检测靶核酸上的六个位置的探针,一个“hybe和seq循环”将至少包括使探针与靶核酸杂交,使互补核酸/报告复合物与探针的条形码域上的六个位
置中每一个的附接区域杂交,并且检测与六个位置中的每一个缔合的可检测标记物。
[0152] 术语“k-聚体探针”与本发明的探针同义。
[0153] 当比对来自离散读取的两个或更多个序列时,可以组合重叠部分以产生单个共有序列。在重叠部分具有相同碱基的位置(比对的单一列),这些碱基成为共有物。可以使用各
种规则来产生在重叠序列之间存在不一致的位置的共有物。简单多数规则将列中最常见碱
基用作共有物。“多通道共有物”是来自单个靶分子的所有离散探针读数的比对。根据应用
的探针群体/投票的总循环次数,单个靶分子内的每个碱基位置可以用不同的冗余或重叠
水平进行查询;通常,冗余增加碱基呼叫的置信水平。
[0154] “原始精确度”是系统正确地鉴定碱基的固有能力的量度。原始精确度取决于测序技术。“共有精确度”是系统使用额外读数和统计能力来正确地鉴定碱基的能力。“特异性”是指每次运行总读数映射至预期靶标的读数的百分比。“均匀性”是指靶区域的序列覆盖度
的变异性;高均匀性与低变异性相关。该特征通常被报告为所有靶向区域的平均覆盖深度
的≥20%所覆盖的靶向区域的分数。随机误差(即固有测序化学误差)可以用相同靶核酸的
“多次通过”测序容易地校正;考虑到足够数量的通过,可以实现实质上“完美共有”或“无误差”测序。
[0155] 本文描述的方法可以使用能够实现方法和/或记录结果的任何设备来实现和/或记录结果。可以使用的设备的实例包括但不限于电子计算设备,包括所有类型的计算机。当
本文描述的方法在计算机中实现和/或记录时,能够含有计算机程序的任何计算机可读介
质中可以含有可用于配置计算机以实施所述方法的步骤的计算机程序。可以使用的计算机
可读介质的实例包括但不限于磁盘、CD-ROM、DVD、ROM、RAM、非暂时性计算机可读介质以及其它存储器和计算机存储设备。可用于配置计算机以实施方法的步骤、组装序列信息和/或
记录结果的计算机程序也可以通过电子网络,例如通过因特网、内联网或其它网络提供。
[0156] “可消耗的测序卡”(图24)可并入本领域已知的荧光成像设备中。具有许多变化特征的任何荧光显微镜都能够执行该测序读取。例如:宽场灯、激光、LED、多光子、共聚焦或全内反射照明可用于激发和/或检测。在荧光显微镜的发射检测通道上,具有基于滤光片或基
于光栅的光谱分辨(一个或多个光谱分辨发射波长)的相机(单个或多个)和/或光电倍增管
(单个或多个)是可能的。标准计算机可以控制可消耗的测序卡,流经卡的试剂和通过荧光
显微镜的检测。
[0157] 测序数据可以通过任何数量的标准下一代测序组装器进行分析(参见例如,Wajid和Serpedin, “Review of general algorithmic features for genome assemblers for 
next generation sequencers” Genomics, proteomics & bioinformatics, 10 (2), 
58-73, 2012)。将在显微镜的单个衍射限制区域内获得的测序数据“局部组装”,以从衍射
斑点内的多个读数产生共有序列。然后将多个衍射点组装的读数一起映射,以产生代表整
个靶向基因集合的连续序列,或全基因组的从头组装。
[0158] 与本发明相关的额外教导描述于以下的一者或多者中:U.S. 8,148,512、U.S. 7,473,767、U.S. 7,919,237、U.S. 7,941,279、U.S. 8,415,102、U.S. 8,492,094、U.S. 8,
519,115、U.S. 2009/0220978、U.S. 2009/0299640、U.S. 2010/0015607、U.S. 2010/
0261026、U.S. 2011/0086774、U.S. 2011/0145176、U.S. 2011/0201515、U.S. 2011/
0229888、U.S. 2013/0004482、U.S. 2013/0017971、U.S. 2013/0178372、U.S. 2013/
0230851、U.S. 2013/0337444、U.S. 2013/0345161、U.S. 2014/0005067、U.S. 2014/
0017688、U.S. 2014/0037620、U.S. 2014/0087959、U.S. 2014/0154681和U.S. 2014/
0162251,其各自通过引用以其整体并入本文。
实施例
[0159] 实施例1:本发明对靶核酸测序的方法是快速的下面描述了本发明的方法中且如图8至12中所示的步骤的时序。
[0160] 本发明需要最少的样品制备。例如,如图13中所示,样品中的核酸可以在2小时或更短或准备时间后开始读取;这是比Ion Torrent (AmpliSeq™)或Illumina (TruSight)
测序所需显著更少的时间,其分别需要约12或9小时准备时间。
[0161] 图14中显示示例性运行的计算,并且图15中显示循环时间的计算。
[0162] 探针群体与固定的靶核酸的结合需要约60秒。可以通过在合成主链上利用多个拷贝的靶结合域来加速该反应。用微流体控制的流体交换装置,洗去未结合的探针需要约半
秒。
[0163] 添加互补核酸的第一个集合(包含可检测的标记物)并将其结合至条形码域的第一位置中的附接区域需要约15秒。
[0164] 针对四种不同的颜色对每个视场(FOV)进行成像,每种颜色表示单一碱基。放置在5'捕获探针或3'捕获探针(或两者)上的基准点可有助于在两个位置之间仅读取排成一行
的(与缺口靶核酸的存在一致的)那些光学条形码。也可以将基准点添加至每个视场,以便
在测序过程中的连续步骤后产生图像的相等比对。所有四个图像都可以在单个FOV获得,然
后光学读取装置可以移动至新FOV,或者以一种颜色采用所有FOV,然后以第二颜色重新成
像。单个FOV可以在约半秒内读取。移动至下一FOV花费约半秒。因此,读取“n”个FOV的时间等于“n” × 1秒)。
[0165] 具有可检测标记物的互补核酸通过加热或用过量缺乏可检测标记物的互补核酸洗涤而从条形码域的第一位置去除。如果需要,可以通过掺入加速可检测标记物的交换速
率的小单链寡核苷酸来加速可检测标记物交换速率(例如,“Toe-Hold”探针;参见例如,
Seeling等人, “Catalyzed Relaxation of a Metastable DNA Fuel”; J. Am. Chem. 
Soc. 2006, 128(37), pp 12211-12220)。可以对FOV重新成像,以证实在继续移动之前除
去具有可检测标记物的所有互补核酸。这花费约十五秒。可以重复该步骤,直到达到背景信
号水平。
[0166] 重复上述步骤或探针的条形码域中的剩余位置。
[0167] 读取的总时间等于m(碱基读取) × (15秒+ n FOV × 1秒+ 15秒)。例如,当条形码域中的位置数为6和20个FOV时,读取的时间等于6 X (30 + 20 + 15)或390秒。
[0168] 将第一群体的探针去杂交。这花费约六十秒。
[0169] 对于第二和随后的探针群体重复上述步骤。如果通过解链温度(Tm)组织测序探针的群体,则每个探针群体将需要多次杂交以确保每个碱基被覆盖至所需深度(这由误差率
驱动)。此外,通过分析运行期间的杂交读取值,可在实际测定整个序列之前识别很好地测
序的每个单个基因。因此,可以重复循环,直到满足特定期望的误差频率(或覆盖度)。
[0170] 使用上述时序时,连同一些缺口核酸结合密度估计值,可以估计本发明的Nanostring (NSTG)-下一代测序仪的通量。
[0171] 测序仪的净通量通过如下给出:分数碱基占据率 X <缺口长度> X 每个FOV的缺口数 X 每个光学条形码的碱基数 / 
[60秒(探针与靶核酸杂交) + 0.5秒(洗涤)+ m:条形码域中的位置数 X (15秒(结合互补
核酸) + nfovsX1 + 15秒(未结合互补核酸)) + 60秒(探针与靶核酸去杂交)]。
[0172] 因此,在一个实例中,单个缺口核酸的总“循环”(从图10中所示的方法加在一起):60秒(探针与靶核酸杂交) + 0.5秒(洗涤) + m-碱基 X (15秒(结合互补核酸) + 
nFOV X 1 + 15秒(未结合互补核酸)) + 60秒(探针与靶核酸去杂交)。使用m = 6,nFOV = 
20,产生时间 = 60 + 0.5 + 390 + 60 = 510.5秒。
[0173] 假设:缺口的核酸区域的1%占据率,每个缺口4000个碱基,和每个FOV的5000个缺口的核酸片段,以及6的m和20的nFOV(如上所述)产生以下净通量:
0.01X 4000 X 5000 X 20 = 每510.5秒4,000,000个6-碱基读取值 = 47,012.73 个
碱基/秒。
[0174] 因此,在该实例中,每24小时连续测量的净通量= 4.062千兆碱基(Gb)/天。替代估计每天最多12 Gb。参见图12。
[0175] 如图14中所示,对100个不同靶核酸(“100-plex”)测序所需的运行时间为约4.6小时;对1000个不同靶核酸(“1000-plex”)测序所需的运行时间为约16小时。
[0176] 图16比较了本发明和各种其它测序方法/装置的测序速率、读数和临床效用。
[0177] 实施例2:本发明的方法具有低误差率图17显示,当省略末端位置时,本发明具有约2.1%的原始误差率。
[0178] 对于请求保护的发明,与测序相关的误差率与完全匹配的(m+n)-聚体和单碱基错配的(m-1+n)-聚体之间的自由能差异相关。m+n之和是靶结合域中的核苷酸数,且m代表条
形码域中的位置数。可以使用方程进行杂交选择性的估计(参见,Owczarzy, R. (2005), 
Biophys. Chem., 117:207-215 and Integrated DNA Technologies website: at the 
World Wide Web  (www) idtdna.com/analyzer/Applications/Instructions/
Default.aspxAnalyzerDefinitions=true#MismatchMeltTemp):
其中Ka是从预测的热力学参数获得的结合平衡常数,
Theta代表精确互补序列和单碱基错配序列(预期其在指定杂交温度下退火至靶标)的
结合百分比。T是Kelvins中的杂交温度,H°()和 S°(熵)是从序列和公开的最近邻近热
力学参数计算的解链参数,R是理想气体常数(1.987 cal.K-1mole-1),[链1/2]是寡核苷酸
的摩尔浓度,且-273.15的常数将温度从开尔文转化为摄氏度。从以下出版物获得DNA/DNA
碱基对(参见,Allawi,H., SantaLucia, J. Biochemistry, 36, 10581)、RNA/DNA碱基对
(参见,Sugimoto等人, Biochemistry, 34, 11211-6)、RNA/RNA碱基对(参见,Xia,T.等人, Biochemistry, 37, 14719)的最准确、最近邻近参数。
[0179] 作为从NSTG测序仪预期的近似误差率的估计的实例如下。对于(m + n)等于8’聚体。考虑以下8-聚体条形码及其单碱基错配。
(序列的区域)
(对具有完美匹配的光学条形码测序)
(对具有单碱基错配(G-T)配对的光学条形码测序)。
[0180] 使用基于上述方程的IDT计算器得到:在17.4℃(完美匹配情况的Tm),(50% / 0.3%)将是在Tm下与该序列杂交的正确光学条
形码与不正确条形码的比率,得到该序列的估计误差率为0.6%。
[0181] 非常高的GC含量测序计算得到:(序列的区域)
(对具有完美匹配的光学条形码测序)
(对具有单碱基错配(G-A)错配对的光学条形码测序)。
[0182] 在41.9℃(完美匹配情况的Tm),(50% / 0.4%)将是在Tm下与该序列杂交的正确光学条形码与不正确条形码的比率,得到该序列的估计误差率为0.8%。
[0183] 8聚体对的数目的检查得到0.2%至1%的范围内的误差率分布。尽管上述计算与使用的条件不同,但是当与误差率可以显著(>> 10%)的其它单分子测序技术(诸如Pacific 
Biosciences and Oxford Nanopore技术)相比,这些计算提供了本发明的方法将具有相对
低的固有误差率的指示。
[0184] 图18表明本发明的原始精确度高于其它测序方法。因此,本发明在比其它测序方法所需的更少的通过之后提供来自单一靶标的共有序列。此外,在30次或更多次通过之后,
本发明可以获得“完全一致/无误差”测序(即,99.9999%/Q60),而PacBio测序方法(例如)在
70次通过之后不能达到这样的一致。
[0185] 实施例3:本发明具有单碱基对分辨能力图19显示本发明具有单碱基分辨率并且具有低误差率(取决于特定核苷酸取代,在0%
至1.5%的范围内)。
[0186] 使用与条形码杂交和使用正常的NanoString基因表达结合技术固定至盒的表面的靶RNA进行另外的实验(参见例如, Geiss等人, “Direct multiplexed measurement of 
gene expression with color-coded probe pairs”; Nature Biotechnology, 26, 317 
- 325 (2008)).测量了具有不同的靶结合域长度和具有完美匹配的条形码(连接至完美10
聚体匹配序列的YGBYGR-2um光学条形码)与RNA靶标杂交的能力(图26)。靶结合域的更长长
度得到更高的计数。其还显示,10-聚体靶结合域足以注册高于背景的序列。单独单碱基改
变的匹配中的每一个都用替代光学条形码合成。计数正确与不正确的光学条形码的比率
(图24和25)。
[0187] 10聚体检测SNP的能力,真实序列高于背景>15000个计数,而不正确的序列高于背景最多> 400个计数。在正确探针存在的情况下,预期误差率为实际序列的3%。注意,该数
据(本质上)是更糟糕的情况。只有10碱基对杂交序列连接至6.6千碱基光学条形码报告分
子(Gen2型)。没有进行特定条件优化。然而,该数据确实表明,NanoString下一代测序方法
能够分辨序列的单碱基对。
[0188] 上述研究中利用的详细材料和方法如下:杂交方案探针B加代码集
• 取25ul要素(194代码集)
• 将5ul探针B + 互补序列添加至靶标(100uM)
• 添加15ul Hyb缓冲液(14.56 X SSPE 0.18% Tween 20)
SSPE (150mM NaCl, NaH2PO4xH2O 10mM, Na2EDTA 10mM)
• 在上孵育10分钟
• 添加150ul G珠子(40ul 10mg/ml的G珠子加110 ul 5x SSPE 0.1% Tween 20)
• 在室温孵育10分钟
• 用0.1SSPE 0.1% Tween 20使用磁性收集器洗涤三次
• 在45℃下在100ul 0.1x SSPE中洗脱10分钟。
[0189] 靶标杂交方案(750mM NaCl)• 取20ul上述洗脱样品
• 添加10ul hyb缓冲液
• 添加1ul靶标(100nM生物素化RNA)
• 在冰上孵育30分钟
取15ul并结合至链霉抗生物素蛋白载玻片20分钟,用G钩拉伸流体,用nCounter计数。
[0190] 材料要素194代码集
寡核苷酸购自IDT
SSPE (150mM NaCl, NaH2PO4xH2O 10mM, Na2EDTA 10mM)
Hyb缓冲液(14.56 X SSPE 0.18% Tween 20)。
[0191] 表 2:12、11、..、8聚体的探针B序列。(SEQ ID NO: 30至SEQ ID NO: 34)
[0192] 表 3:靶序列(以粗体;SEQ ID NO: 35)
[0193] 表 4:10聚体错配的探针B序列(以粗体;SEQ ID NO: 36至SEQ ID NO: 41)
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈