多核苷酸装配的组合物和方法

申请号 CN200980154897.0 申请日 2009-11-19 公开(公告)号 CN102282255A 公开(公告)日 2011-12-14
申请人 阿迈瑞斯公司; 发明人 扎克·塞贝; 雷蒙德·洛; 杰弗里·A·尤伯萨克斯; 苏尼尔·S·钱德兰; 埃里克·杰迪戴亚·迪安; 达伦·M·普拉特; 肯尼思·俊树·竹冈;
摘要 本 发明 提供组合物和从大量组分多核苷酸快速装配为一个或多个装配好的多核苷酸的方法。本发明的方法使用环形核酸载体,所述载体包含DNA 片段 D,侧邻于可 退火 接头序列、可退火接头序列对LA和LB、或可退火接头序列/引物结合片段对LA和PB或PA和LB。限制性内切酶消化包含用于装配的DNA片段的大量载体以产生大量DNA片段,包括元件PA-D-LB、LA-D-LB、和LA-D-PB,或D-LB、LA-D-LB、和LA-D。可退火接头序列LA和LB提供了DNA片段的互补末端,其用于宿主细胞介导的同源重组或同时在聚合酶循环装配反应中与引物结合片段PA和PB反应,从而使多种DNA片段有序装配成为一个或多个装配好的多核苷酸。
权利要求

1.一种组合物,其包含:
(a)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0、选自组D0的任意的DNA片段、可退火接头序列LB0、和第二限制性酶切位点RB0;
(b)一个或多个中间核酸分子,其中每个中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn、第一可退火接头序列LAn、选自组Dn的任意DNA片段、第二可退火接头序列LBn、和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
(c)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm、第一可退火接头序列LAm、选自组Dm的任意DNA片段、和第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;
其中切断RA0至RBm的限制性酶切位点并变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示从1到m的整数,并且其中每个组D0,...Dn,...Dm独立地由一个或多个DNA片段组成。
2.权利要求1的组合物,其中每个所述一个或多个第一核酸分子进一步包含一个引物结合片段PA,PA对于所述选自组D0的DNA片段位于5’位置,并且其中每个所述一个或多个最后核酸分子进一步包含一个引物结合片段PB,PB对于选自组Dm的DNA片段位于3’位置。
3.权利要求1或2的组合物,其中切断RA0至RBm的限制性酶切位点并变性所获得的线形核酸分子之后,相比于所述组合物中的其它可退火接头序列或它们的互补物,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物选择性杂交。
4.权利要求1或2的组合物,其中每个可退火接头LB(p-1)与可退火接头序列LAp或其互补物在序列上是相同的。
5.权利要求1或2的组合物,其包含一个第一核酸分子和一个最后核酸分子。
6.权利要求1或2的组合物,其中RA0至RBm的每个限制性酶切位点都可以被IIS型限制性核酸内切酶切断。
7.权利要求1或2的组合物,其中RA0至RBm的所述限制性酶切位点可以被相同的IIS型限制性核酸内切酶切断。
8.权利要求1或2的组合物,其中RA0至RBm的所述限制性酶切位点可以被限制性核酸内切酶SapI或LguI切断。
9.权利要求1的组合物,其中两个或多个可退火接头序列各自独立地是至少24个核苷酸长,并具有至少60℃的解链温度
10.权利要求1或2的组合物,其中两个或多个可退火接头序列各自独立地具有至少
70%的G-C含量和至少70℃的解链温度。
11.权利要求1或2的组合物,其中两个或多个可退火接头序列各自独立地具有至少
30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
12.权利要求1或2的组合物,其中两个或多个可退火接头序列具有选自由SEQ ID NO:
1-23或其互补物所组成的组的序列。
13.权利要求1或2的组合物,其中每个可退火接头序列具有选自由SEQ ID NO:1-23或其互补物所组成的组的序列。
14.权利要求1或2的组合物,其中每个引物结合片段具有选自由SEQ ID NO:24-25或其互补物所组成的组的序列。
15.权利要求1或2的组合物,其进一步包含一个或多个能够切断RB0到RBm之间的限制性酶切位点的限制性核酸内切酶。
16.权利要求8的组合物,其进一步包含SapI或LguI限制性核酸内切酶。
17.一种组合物,其包含用可以切断RA0到RBm的限制性酶切位点的限制性核酸内切酶消化权利要求1或2所述的组合物后所形成的多个线形核酸分子。
18.权利要求17的组合物,其中每个线形核酸分子包含粘性末端。
19.权利要求2的组合物,其进一步包含与引物结合片段PA互补的第一引物,或其互补物,和与引物结合片段PB互补的第二引物,或其互补物。
20.权利要求1或2的组合物,其进一步包含DNA聚合酶。
21.一种组合物,其包含用SapI或LguI限制性核酸内切酶消化权利要求8所述组合物后所形成的多个线形核酸分子。
22.一种载体,其选自:
(a)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;
(b)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、和限制性酶切位点RB;
(c)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、引物结合片段PA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;
(d)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;和(e)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、引物结合片段PB、和限制性酶切位点RB;
其中限制性酶切位点RA和RB分别可以被IIS型限制性核酸内切酶切断。
23.权利要求22的载体,其中每个可退火接头序列独立地是至少24个核苷酸长度并具有至少60℃的解链温度。
24.权利要求22的载体,其中每个可退火接头序列独立地具有至少70%的G-C含量并具有至少70℃的解链温度。
25.权利要求22的载体,其中每个可退火接头序列各自独立地具有至少30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
26.权利要求22的载体,其中可退火接头序列LA和/或可退火接头序列LB具有选自由SEQ ID NO:1-23或其互补物组成的组的序列。
27.权利要求22的载体,其中引物结合片段PA和/或引物结合片段PB具有选自由SEQ ID NO:24-25或其互补物组成的组的序列。
28.权利要求22的载体,其中限制性酶切位点RA和RB可以被相同的IIS型限制性内切酶切断。
29.权利要求22的载体,其中限制性酶切位点RA和RB被限制性内切酶SapI或LguI切断。
30.一种载体,其选自:
(a)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、限制性酶切位点RY、DNA片段D、限制性酶切位点RZ、可退火接头序列LB、和限制性酶切位点RB;
(b)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、限制性酶切位点RY、DNA片段D、限制性酶切位点RZ、和限制性酶切位点RB;
(c)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、引物结合片段PA、限制性酶切位点RY、DNA片段D、限制性酶切位点RZ、可退火接头序列LB、和限制性酶切位点RB;
(d)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、限制性酶切位点RY、DNA片段D、限制性酶切位点RZ、可退火接头序列LB、和限制性酶切位点RB;和
(e)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、限制性酶切位点RY、DNA片段D、限制性酶切位点RZ、引物结合片段PB、和限制性酶切位点RB;
其中限制性酶切位点RA和RB分别可以被IIS型限制性核酸内切酶切断。
31.权利要求30的载体,其中每个可退火接头序列独立地是至少24个核苷酸长度并具有至少60℃的解链温度。
32.权利要求30的载体,其中每个可退火接头序列独立地具有至少70%的G-C含量并具有至少70℃的解链温度。
33.权利要求30的载体,其中每个可退火接头序列独立地具有至少30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
34.权利要求30的载体,其中可退火接头序列LA和/或可退火接头序列LB具有选自由SEQ ID NO:1-23或其互补物组成的组的序列。
35.权利要求30的载体,其中引物结合片段PA和/或引物结合片段PB具有选自由SEQ ID NO:24-25或其互补物组成的组的序列。
36.权利要求30的载体,其中限制性酶切位点RA和RB可以被相同的IIS型限制性内切酶切断。
37.权利要求30的载体,其中限制性酶切位点RA和RB可以被限制性内切酶SapI或LguI切断。
38.权利要求30的载体,其中限制性酶切位点RY和RZ可以被同样的限制性内切酶切断。
39.权利要求30的载体,其中限制性酶切位点RY和RZ可以被IIS型限制性内切酶切断。
40.权利要求30的载体,其中限制性酶切位点RY和RZ可以被SchI切断。
41.一种用于装配多核苷酸的试剂盒,所述试剂盒包括:
(a)权利要求30所要求的一个或多个载体;
(b)能够切断所述限制性酶切位点RA和RB的一种或多种IIS型限制性内切酶;和(c)能够切断所述限制性酶切位点RY和RZ的一种或多种限制性内切酶。
42.一种核酸分子文库,其包含以下每种载体的至少一种:
(a)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;
(b)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;和(c)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、和限制性酶切位点RB;
其中所述限制性酶切位点RA和RB分别可以被IIS型限制性内切酶切断。
43.一种核酸分子文库,其包含以下每种载体的至少一种:
(a)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、引物结合片段PA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;
(b)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、可退火接头序列LB、和限制性酶切位点RB;和(c)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA、可退火接头序列LA、DNA片段D、引物结合片段PB、和限制性酶切位点RB;
其中所述限制性酶切位点RA和RB分别可以被IIS型限制性内切酶切断。
44.权利要求42或43的文库,其中两个或多个可退火接头序列各自独立地是至少24个核苷酸长度并具有至少60℃的解链温度。
45.权利要求42或43的文库,其中两个或多个可退火接头序列各自独立地具有至少
70%的G-C含量并具有至少70℃的解链温度。
46.权利要求42或43的文库,其中两个或多个可退火接头序列各自独立地具有至少
30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
47.权利要求42或43的文库,其中可退火接头序列LA和可退火接头序列LB具有选自由SEQ ID NO:1-23或其互补物组成的组的序列。
48.权利要求43的文库,其中引物结合片段PA和引物结合片段PB具有选自由SEQ ID NO:24-25或其互补物组成的组的序列。
49.权利要求42或43的文库,其中所述DNA片段D包含选自由选择性标记、启动子、基因组靶向序列、编码表位标签的核酸序列、感兴趣的基因、编码终止密码子的核酸序列和编码lacZ的核酸组成的组的核酸序列。
50.权利要求42或43的文库,其中限制性酶切位点RA和RB可以被同样的IIS型限制性核酸内切酶切断。
51.权利要求42或43的文库,其中限制性酶切位点RA和RB被限制性内切酶SapI或LguI切断。
52.一种核酸分子文库,其包含每种下列核酸分子的至少一个:
(a)第一核酸分子,其中该第一核酸分子为环形并以5’至3’的方向包含:第一限制性酶切位点RA0、选自组D0的任何DNA片段、可退火接头序列LB0、和第二限制性酶切位点RB0;
(b)中间核酸分子,其中该中间核酸分子n为环形并以5’至3’的方向包含:第一限制性酶切位点RAn、第一可退火接头序列LAn、选自组Dn的任何DNA片段、第二可退火接头序列LBn、和第二限制性酶切位点RBn,其中n代表从1到中间核酸分子数目的整数;和(c)最后核酸分子,其中该最后核酸分子为环形并以5’至3’的方向包含:第一限制性酶切位点RAm、第一可退火接头序列LAm、选自组Dm的任何DNA片段、第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;
其中RA0至RBm的每个限制性酶切位点均被IIS性限制性内切酶所切断;
其中切断RA0至RBm的限制性酶切位点并变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数,并且其中每个组D0,...Dn,...Dm独立地由一个或多个DNA片段组成。
53.权利要求52的文库,其中所述第一核酸分子进一步包含位于选自组D0的所述DNA片段的5’位置的一个引物结合片段PA,并且所述最后核酸分子进一步包含位于选自组Dm的所述DNA片段的3’位置的一个引物结合片段PB。
54.权利要求52或53的文库,其中两个或多个可退火接头序列各自独立地是至少24个核苷酸长度并具有至少60℃的解链温度。
55.权利要求52或53的文库,其中两个或多个可退火接头序列各自独立地具有至少
70%的G-C含量和至少70℃的解链温度。
56.权利要求52或53的文库,其中两个或多个可退火接头序列各自独立地具有至少
30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
57.权利要求52或53的文库,其中两个或多个可退火接头序列独立地选自由SEQ ID NO:1-23或其互补物组成的组。
58.权利要求52或53的文库,其中每个可退火接头序列独立地选自由SEQID NO:1-23或其互补物组成的组。
59.权利要求53的文库,其中每个引物结合片段独立地选自由SEQ ID NO:24-25或其互补物所组成的组。
60.权利要求52或53的文库,其包含两个第一核酸分子和两个最后核酸分子,其中一个所述第一核酸分子包含DNA片段D01,该片段包含基因组靶向序列的第一片段,而另一个第一核酸分子包含DNA片段D02,该片段包含基因组靶向序列的第二片段,其中DNA片段D01和D02相对于这两个第一核酸分子的限制性酶切位点RA0和RB0以同样的方向排列;
其中一个最后核酸分子包含DNA片段Dm1,该片段编码选择性标记的第一非功能片段,而另一个第一核酸分子包含DNA片段Dm2,该片段编码选择性标记的第二非功能片段,其中DNA片段Dm1和Dm2相对于这两个最后核酸分子的限制性酶切位点RAm和RBm以相反的方向排列;
并且其中所述选择性标记的第一非功能片段和选择性标记的第二非功能片段通过间隙修复而进行的重组导致功能性选择性标记的建立。
61.一种从多个组分多核苷酸产生装配好的多核苷酸的方法,该方法包括以下步骤:
(a)用一种或多种IIS型限制性内切酶消化装配组合物以产生组分组合物,所述装配组合物包含:
(i)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0、选自组PA的任意引物结合片段、选自组D0的任意DNA片段、可退火接头序列LB0、和第二限制性酶切位点RB0;
(ii)一个或多个中间核酸分子,其中每个中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn、第一可退火接头序列LAn、选自组Dn的任意DNA片段、第二可退火接头序列LBn、和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
(iii)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm、第一可退火接头序列LAm、选自组Dm的任意DNA片段、选自组PB的任意引物结合片段、第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;其中切断RA0至RBm的限制性酶切位点并变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示从1到m的整数,并且其中每个组D0,...Dn,...Dm由一个或多个DNA片段组成;

(b)使组分组合物接触DNA聚合酶、三磷酸核糖核苷和一个或多个第一引物和一个或多个第二引物,在适合核酸分子变性的条件下,退火可退火接头序列LB(p-1)至可退火接头序列LAp,并从此延伸;其中每个所述第一引物能够与选自组PA的所述引物结合片段之一杂交,并且每个第二引物能够与选自组PB的所述引物结合片段之一杂交;并且将所述组分组合物进行聚合酶链式反应,
其中以5’到3’方向包含分别选自组D0,...Dn,...和Dm的一个DNA片段的多核苷酸被装配起来。
62.权利要求61的方法,其中一种或多种所述IIS型限制性内切酶能够切断RA0至RBm的限制性酶切位点。
63.权利要求61的方法,其中所述装配组合物包含一个第一核酸分子和一个最后核酸分子。
64.权利要求61的方法,其中两个或多个可退火接头序列各自独立地是至少24个核苷酸长,并具有至少60℃的解链温度。
65.权利要求61的方法,其中两个或多个可退火接头序列各自独立地具有至少70%的G-C含量和至少70℃的解链温度。
66.权利要求61的方法,其中两个或多个可退火接头序列各自独立地具有至少30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
67.权利要求61的方法,其中每个可退火接头LB(p-1)与可退火接头序列LAp在序列上是相同的。
68.权利要求61的方法,其中所述RA0至RBm的限制性酶切位点可以被相同的IIS型限制性内切酶切断。
69.权利要求61的方法,其中所述RA0至RBm的限制性酶切位点可以被限制性内切酶SapI或LguI切断,并且步骤(a)的限制性内切酶是SapI或LguI。
70.权利要求61的方法,其中两个或多个可退火接头序列的各自独立地选自由SEQ ID NO:1-23或其互补物组成的组的序列。
71.权利要求61的方法,其中每个可退火接头序列独立地选自由SEQ ID NO:1-23或其互补物组成的组的序列。
72.权利要求61的方法,其中每个引物结合片段选自由SEQ ID NO:24-25或其互补物组成的组。
73.权利要求61的方法,其中所述DNA聚合酶是Pfu。
74.一种产生包含多核苷酸的宿主细胞的方法,该方法包含如下步骤:
(a)用一个或多个根据权利要求61的方法装配的多核苷酸转化宿主细胞;和(b)筛选包含所述一个或多个装配好的多核苷酸的宿主细胞。
75.权利要求74的方法,其中所述装配好的多核苷酸包含选择性标记,并且步骤(b)包含在选择性培养基中增殖宿主细胞。
76.权利要求74的方法,其进一步包含用线形化的质粒转化所述宿主细胞,其中所述质粒包含:
(i)与引物结合片段PA同源的第一区域;和
(ii)与引物结合片段PB同源的第二区域,
其中所述第一同源区域和第二同源区域具有足够的长度以起始宿主细胞介导的所述多核苷酸和所述质粒之间的同源重组,以在宿主细胞中形成环形质粒。
77.一种制备包含多核苷酸的宿主细胞的方法,该方法包含以下步骤:
(a)用组合物转化宿主细胞,所述组合物包含:
(i)一个或多个线形核酸分子,其中每个分子以5’至3’方向包含:选自组D0的任意DNA片段和可退火接头序列LB0;
(ii)可选地,一个或多个中间线形核酸分子,其中每个中间线形核酸分子以5’至3’方向包含:第一可退火接头序列LAn、选自组Dn的任意DNA片段、和第二可退火接头序列LBn,其中n表示从1到中间核酸分子数目的整数;和
(iii)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:可退火接头序列LAm、和选自组Dm的任意DNA片段,其中m表示比中间核酸分子数目大1的整数;
其中n是在1到(m-1)范围内变化的整数;
其中组D0,...Dn,...Dm分别由一个或多个DNA片段组成;
其中每个可退火接头序列LB(p-1)包含可退火接头序列LAp的同源区域,其具有足够长度以起始宿主细胞介导的LB(p-1)和LAp之间的同源重组,其中p表示从1到m的整数,其中所述同源重组导致多核苷酸的装配;和
(b)筛选包含装配好的多核苷酸的宿主细胞,其中所述装配好的多核苷酸以5’到3’方向包含:分别选自组D0,...Dn,...Dm的每一组的一个DNA片段。
78.权利要求77的方法,其中:
(a)一个或多个第一线形核酸分子的每个进一步包含与所述宿主细胞基因组的第一整合位点同源的第一区域;和
(b)一个或多个最后线形核酸分子的每个进一步包含与所述宿主细胞基因组的第二整合位点同源的第二区域,
其中所述同源区域第一同源区域和第二同源区域具有足够长度以起始宿主细胞介导的与所述第一整合位点和第二整合位点之间的同源重组,其中所述同源重组导致装配好的多核苷酸整合进入所述宿主细胞基因组。
79.权利要求77的方法,其中可退火接头序列LB(p-1)和LAp的至少一个同源重组形成了编码选择性标记基因的核酸序列。
80.权利要求77的方法,其中步骤(a)进一步包含用线形化质粒转化所述宿主细胞,其中所述线形化质粒包含:
(i)与一个或多个第一线形核酸分子同源的第一区域;和
(ii)与一个或多个最后线形核酸分子同源的第二区域,其中所述第一同源区域和第二同源区域具有足够长度以起始宿主细胞介导的装配好的多核苷酸和所述质粒之间的同源重组以在宿主细胞中形成环形化质粒。
81.权利要求77的方法,其中所述组合物包含一个第一核酸分子和一个最后核酸分子。
82.权利要求77的方法,其中两个或多个可退火接头序列具有至少70%的G-C含量和至少70℃的解链温度。
83.权利要求77的方法,其中两个或多个可退火接头序列具有至少30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
84.权利要求77的方法,其中每个可退火接头序列LB(p-1)与可退火接头序列LAp在序列上是相同的。
85.包含由权利要求77的方法制备的多核苷酸的宿主细胞。
86.一种制备包含多核苷酸的宿主细胞的方法,所述方法包含如下步骤:
(a)用一种或多种IIS型限制性内切酶消化组合物,所述组合物包含:
(i)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0、引物结合片段PA、选自组D0的任意DNA片段、可退火接头序列LB0、和第二限制性酶切位点RB0;
(ii)可选地,一个或多个中间线形核酸分子,其中每个中间线形核酸分子n以5’至3’方向包含:第一限制性酶切位点RAn、第一可退火接头序列LAn、选自组Dn的任意DNA片段、第二可退火接头序列LBn、和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
(iii)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm、可退火接头序列LAm、选自组Dm的任意DNA片段、引物结合片段PB、第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;其中切断的RA0至RBm限制性酶切位点并变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中p表示从1到m的整数,其中n是在
1到(m-1)范围内的整数,并且其中每个组D0,...Dn,...Dm由一个或多个DNA片段组成;
其中所述一种或多种IIS型限制性内切酶能够切断RA0至RBm的限制性酶切位点;和(b)用从步骤(a)获得的消化的组合物转化宿主细胞,其中每个可退火接头序列LB(p-1)包含与可退火接头序列LAp的同源区域,其具有足够长度以起始宿主细胞介导的LB(p-1)和LAp之间的同源重组,其中所述同源重组导致所述多核苷酸的装配,其中p表示从1到m的整数;和
(c)选择包含所述装配好的多核苷酸的宿主细胞,其中所述装配好的多核苷酸以5’到
3’方向包含选自D0,...Dn,...和Dm每一组的一个DNA片段。
87.权利要求86的方法,其中:
(a)一个或多个第一线形核酸分子的每个进一步包含与宿主细胞基因组的第一整合位点同源的第一区域;和
(b)一个或多个最后线形核酸分子的每个进一步包含与宿主细胞基因组的第二整合位点同源的第二区域,
其中所述第一同源区域和第二同源区域具有足够长度以起始宿主细胞介导的与所述第一整合位点和第二整合位点之间的同源重组,其中所述同源重组导致装配好的多核苷酸整合进入宿主细胞基因组。
88.权利要求86的方法,其中可退火接头序列LB(p-1)和LAp的至少一个同源重组形成了编码选择性标记基因的核酸序列。
89.权利要求86的方法,其中步骤(b)进一步包含用线形化质粒转化宿主细胞,其中所述线形化质粒包含:
(i)与一个或多个第一线形核酸分子同源的第一区域;和
(ii)与一个或多个最后线形核酸分子同源的第二区域,其中所述第一同源区域和第二同源区域具有足够长度以起始宿主细胞介导的装配好的多核苷酸和所述质粒之间的同源重组以在宿主细胞中形成环形化质粒。
90.权利要求86的方法,其中两个或多个可退火接头序列各自独立地是至少24个核苷酸长,并具有至少60℃的解链温度。
91.权利要求86的方法,其中两个或多个可退火接头序列各自独立地具有至少70%的G-C含量和至少70℃的解链温度。
92.权利要求86的方法,其中两个或多个可退火接头序列各自独立地具有至少30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
93.权利要求86的方法,其中每个可退火接头LB(p-1)与可退火接头序列LAp或其互补物在序列上是相同的。
94.权利要求86的方法,其中RA0至RBm的每个限制性酶切位点都可以被相同的IIS型限制性核酸内切酶切断。
95.权利要求86的方法,其中所述的RA0至RBm限制性酶切位点可以被限制性核酸内切酶SapI或LguI切断,并且步骤(a)的限制性内切酶是SapI或LguI。
96.包含由权利要求86的方法制备的多核苷酸的宿主细胞。
97.包含选自SEQ ID NO:1-25的序列的多核苷酸。
98.包含权利要求97的多核苷酸的宿主细胞。
99.一种制备载体的方法,该方法包含:
(a)用一种或多种能够切断限制性位点RY和RZ的限制性内切酶消化载体,所述载体选自,所述载体选自:
(i)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA、限制性酶切位点RY、限制性酶切位点RZ、可退火接头序列LB、和限制性酶切位点RB;
(ii)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA、可退火接头序列LA、限制性酶切位点RY、限制性酶切位点RZ、和限制性酶切位点RB;
(iii)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA、引物结合片段PA、限制性酶切位点RY、限制性酶切位点RZ、可退火接头序列LB、和限制性酶切位点RB;
(iv)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA、可退火接头序列LA、限制性酶切位点RY、限制性酶切位点RZ、可退火接头序列LB、和限制性酶切位点RB;和
(v)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA、可退火接头序列LA、限制性酶切位点RY、限制性酶切位点RZ、引物结合位点PB、和限制性酶切位点RB;
其中所述消化产生线形化载体;

(b)使所述线形化载体在连接酶存在下接触线形DNA片段D,其中所述接触产生包含DNA片段D的环形载体,其中限制性酶切位点RA和RB分别可以被IIS型限制性内切酶切断。
100.一种制备载体的方法,该方法包含:
(a)用一种或多种能够切断限制性酶切位点RY和RZ的限制性内切酶消化由环形多核苷酸组成的载体,该多核苷酸以5’至3’的方向包含:限制性酶切位点RA、限制性酶切位点RY、限制性酶切位点RZ、和限制性酶切位点RB,其中所述消化产生线形化载体;和(b)使所述线形化载体在连接酶存在下接触线形多核苷酸,所述线形多核苷酸选自:
(i)线形多核苷酸,以5’至3’的方向包含:DNA片段D、和可退火接头序列LB;
(ii)线形多核苷酸,以5’至3’的方向包含:可退火接头序列LA、和DNA片段;
(iii)线形多核苷酸,以5’至3’的方向包含:引物结合片段PA、DNA片段D、和可退火接头序列LB;
(iv)线形多核苷酸,以5’至3’的方向包含:可退火接头序列LA、DNA片段D、和可退火接头序列LB;和
(v)线形多核苷酸,以5’至3’的方向包含:可退火接头序列LA、DNA片段D、和引物结合片段PB;
其中所述接触产生包含DNA片段D的环形载体,其中限制性酶切位点RA和RB分别可以被IIS型限制性内切酶切断。
101.权利要求99或100的方法,其中每个可退火接头序列独立地是至少24个核苷酸长,并具有至少60℃的解链温度。
102.权利要求99或100的方法,其中每个可退火接头序列独立地具有至少70%的G-C含量和至少70℃的解链温度。
103.权利要求99或100的方法,其中每个可退火接头序列独立地具有至少30%的A-T含量和至少65℃的解链温度,并包含基序
5’ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。
104.权利要求99或100的方法,其中可退火接头序列LA和/或可退火接头序列LB选自由SEQ ID NO:1-23或其互补物组成的组。
105.权利要求99或100的方法,其中引物结合片段PA和/或PB选自由SEQID NO:
24-25或其互补物组成的组。
106.权利要求99或100的方法,其中限制性酶切位点RA和RB可以被相同的IIS型限制性内切酶切断。
107.权利要求99或100的方法,其中限制性酶切位点RA和RB可以被SapI或LguI限制性内切酶切断。
108.权利要求99或100的方法,其中限制性酶切位点RY和RZ可以被相同的限制性内切酶切断。
109.权利要求99或100的方法,其中限制性酶切位点RY和RZ可以被IIS型限制性内切酶切断。
110.权利要求99或100的方法,其中限制性酶切位点RY和RZ可以被SchI切断。

说明书全文

多核苷酸装配的组合物和方法

[0001] 本申请要求根据35U.S.C.§119(e)的于2008年11月19日提交的美国临时申请号61/116109和于2009年3月23日提交的美国临时专利申请号61/162230的利益,其内容在此整体引用作为参考。1.发明领域
[0002] 本申请一般地涉及重组DNA技术领域,尤其是大量的DNA片段有序装配为装配好的多核苷酸的改进的方法。
[0003] 2.发明背景
[0004] 多核苷酸的重组可以用本领域公知的多种方法来完成。重组核酸的传统技术使用限制性内切酶和连接酶以创造新的核酸分子。重组分子例如克隆和表达载体可以用于将感兴趣的核酸序列整合进入宿主细胞的基因组,和/或驱动一个或多个感兴趣的基因的表达。在所述细胞中用载体来驱动感兴趣的基因的表达,例如在酵母细胞中,需要载体包含使感兴趣的基因能够复制和表达的必要的遗传元件。这些元件可以包括,例如,感兴趣的基因,启动子序列,终止子序列,选择性标记,整合位点,等等。
[0005] 用传统的基于限制性内切酶和连接酶的方法将元件装配进单一的载体是耗时而又费的。每个亚克隆步骤,即将新的核酸片段引入已存在的多核苷酸,需要在引入新加片段之前对所得到的克隆进行筛选和表征。通过平末端连接而产生的克隆需要确认所述片段以正确的方向引入。另一方面,粘性末端连接需要受体片段上用于产生粘性末端的限制性酶切位点也存在于供体片段上,但又不能在供体片段中打断感兴趣的序列的位点。因此,选择可使用的限制性酶切位点完全依赖于要加入的组合物片段,并且每个案例都必须小心考虑。另外,这些方法经常将外源核酸序列引入到所获得的克隆中,所述序列能够干扰需要的基因产物的结构和功能。进一步限制基限制性内切酶的克隆方法效率的因素是能够在一个反应中连接在一起的核酸分子数量的固有限制。
[0006] 聚合酶链式反应(PCR)是一种强大的技术,通过其可以体外扩增特定的多核苷酸,包括基因组DNA、cDNA和mRNA。PCR典型的包括在一定条件下使目标核酸的分离的互补链接触两个寡核苷酸引物,所述条件允许在两条链上的互补引物延伸产物的形成。这些链作为需要的核酸序列合成拷贝的模板。通过在自动系统中重复分离和合成步骤,可以实现目标序列的指数复制。
[0007] PCR的一种方法,称为“重叠区扩增拼接法”(“SOE”,参见例如美国专利号5023171),使得不用限制性内切酶或连接酶而在精确接点装配DNA分子变得方便。用于重组的组分片段使用独特设计的引物在分离的聚合酶链式反应中产生,所述引物产生具有彼此互补末端的扩增子。在这些扩增子的混合和变性中,在3’末端具有互补序列的链彼此重叠并作为引物。这些重叠区通过DNA聚合酶延伸而产生核酸分子,在该分子中原始序列被“拼接”在一起。PCR的后继循环扩增了所获得的拼接多核苷酸。
[0008] 尽管在结合大量核酸片段方面相对传统的基于连接酶的方法更加高效,SOE却需要时间来优化引物序列和扩增条件以产生需要的产物。要拼接在一起的片段之间的每个接点必须分别考虑,并且必须为每个片段涉及一对引物,以使得这些末端兼容。设计PCR引物的传统考虑,例如解链温度、G-C含量、避免发卡和二聚化形成和错误引导位点的严格性,必须被更加仔细的考虑,因为在SOE反应中将被拼接的片段的数量增加了。
[0009] 因此,尽管重组DNA技术发展了,仍然存在提供快速而有序地装配多核苷酸的改进方法的需求。尤其需要的方法是能简化大量多核苷酸的装配,其具有最少的对中间产物的操作和和表征,而不需要引物优化步骤。这些和其它需求都可以通过本发明的组合物和方法来满足。
[0010] 3.发明概述
[0011] 本发明提供的组合物和方法允许快速而有序地装配或“缝合”组分多核苷酸,成为装配好的多核苷酸。在一些实施方式里,本发明的方法提供使用环形核酸装配载体。在某些实施方式里,装配载体包含组分多核苷酸,其中所述组分多核苷酸包括一个DNA片段,其侧翼是:(i)3’端的可退火接头;(ii)5’端的引物结合片段和3’端的可退火接头;(iii)3’端和5’端的可退火接头;(iv)5’端的可退火接头和3’端的引物结合片段;或(v)5’端的可退火接头。
[0012] 在一些实施方式里,多个组分多核苷酸可以通过在单一反应器里提供多个装配载体来缝合在一起。在某些实施方式里,反应器里的组分多核苷酸可以从装配载体分离。在某些实施方式里,所述组分多核苷酸然后可以被变性,可退火接头序列可以被退火为邻近的组分多核苷酸的互补链,而所述组分多核苷酸可以通过重复区延伸拼接法(SOE)缝合进入装配好的多核苷酸,然后进行PCR。在其它实施方式里,从装配载体分离的组分多核苷酸可以在用所述组分多核苷酸转化的宿主细胞体内通过同源重组而装配进入装配好的多核苷酸。装配好的多核苷酸可以进一步在宿主细胞体内结合并介导同源重组。
[0013] 多核苷酸装配的效率可以通过提供与装配载体一起使用的可退火接头序列的标准试剂盒来促进,例如,如SEQ ID NO:1-23所描述的。可退火接头序列在装配反应中提供相邻组分多核苷酸之间的重叠序列。理想地,可退火接头序列在RNA和DNA平均缺乏明显的二级结构,不以不希望的方式与另一个发生交叉反应,并具有相对较高的解链温度(Tm)。从而,多个组分多核苷酸可以被缝合在一起而不需要为每个组分多核苷酸设计独特的引物,因此节约了时间和劳动力。本发明提供的组合物和方法可以用于装配多种类型的多核苷酸,包括合成性基因,结构体,克隆载体,表达载体,染色体,基因组,肽文库等等。
[0014] 在一个方面,本发明提供了载体,即装配载体,可用于从多个组分多核苷酸装配一个或多个装配好的多核苷酸。
[0015] 在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,以及限制性酶切位点RB(即5’-RA-LA-D-LB-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB(即5’-RA-D-LB-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,和限制性酶切位点RB(即5’-RA-LA-D-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,引物结合片段PA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB(即5’-RA-PA-D-LB-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,引物结合片段PB,和限制性酶切位点RB(即5’-RA-LA-D-PB-RB-3’).在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB(即5’-RA-LA-D-LB-RB-3’)。示例性的装配载体在图1B和图2中提供。
[0016] 在一些实施方式里,引物结合片段(即,PA或PB)可以是不与用于产生装配好的多核苷酸的可退火接头序列互补的任何核苷酸序列。在一些实施方式里,引物结合片段包括限制性内切酶识别位点和/或切断位点。在一些实施方式里,引物结合片段包含允许的接头序列之一的核酸序列(例如,SEQID NO:1-23之一),或其互补物,不用于特定的装配反应。在一些实施方式里,引物结合片段PA的核酸序列选自SEQ ID NO:24,25和其互补物。在一些实施方式里,引物结合片段PB的核酸序列选自SEQ ID NO:24,25和其互补物。在优选实施方式里,引物结合片段PA和引物结合片段PB在序列上不完全相同。
[0017] 在一些实施方式里,两个或多个可退火接头序列为至少24个核苷酸长度并具有至少60℃的Tm。
[0018] 在一些实施方式里,两个或多个可退火接头序列具有至少70%的G-C含量和至少70℃的Tm,并且不形成明显的二级DNA结构。在一些实施方式里,可退火接头序列LA的核酸序列选自SEQ ID NO:1-8及其互补物。在一些实施方式里,可退火接头序列LB的核酸序列选自SEQ ID NO:1-8及其互补物。在一些实施方式里,可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:1-8及其互补物。
[0019] 在一些实施方式里,两个或多个可退火接头序列具有至少30%的A-T含量和至少65℃的Tm,并且不形成明显的二级DNA或RNA结构。在一些实施方式里,两个或多个可退火接头序列具有低G-C含量和至少65℃的Tm,并包含基序5’-ANNNNNNNNANNNAANTANNTTNANA-
3’,其中A代表腺嘌呤,N代表任何核苷酸,而T代表胸腺嘧啶。在一些实施方式里,可退火接头序列LA的核酸序列选自SEQ ID NO:9-23及其互补物。在一些实施方式里,可退火接头序列LB的核酸序列选自SEQ ID NO:9-23及其互补物。在一些实施方式里,可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:9-23及其互补物。
[0020] 多个组分多核苷酸的顺序装配可以通过可退火接头序列的选择来控制,所述可退火接头序列在装配载体中侧邻于DNA片段。从而,在一些实施方式里,为了确保组分多核苷酸能够以有序方式被装配进去,在特定装配载体中的可退火接头序列/可退火接头序列对的序列是不互补的。相似的,在一些实施方式里,在特定装配载体中的引物结合片段/可退火接头序列对的序列是不互补的。
[0021] 在一个特别的实施方式里,限制性酶切位点RA和RB可以被同样的限制性内切酶切断,以利于从装配载体中切除组分多核苷酸。在一些实施方式里,限制性酶切位点RA或RB可以被限制性内切酶切断并留下5’或3’突出。在另一个实施方式里,限制性酶切位点RA或RB被限制性内切酶切断并留下平末端。在一些实施方式里,限制性酶切位点RA和RB可以被同样的限制性内切酶切断。在另外的实施方式里,限制性酶切位点RA和RB可以被IIS型限制性内切酶切断。在一些实施方式里,限制性酶切位点RA和RB可以被相同的IIS型限制性内切酶切断。在一个特别的实施方式里,限制性酶切位点RA和RB被SapI或LguI限制性内切酶所切断。
[0022] 在另一个方面,本发明提供输入载体,其用于制备包含DNA片段的装配载体。
[0023] 在一些实施方式里,所述输入载体是环形多核苷酸并以5’至3’的方向包含:限制性酶切位点RA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB(即,5’-RA-RY-D-RZ-LB-RB-3’)。在一些实施方式里,所述输入载体是环形多核苷酸并以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,和限制性酶切位点RB(即,5’-RA-LA-RY-D-RZ-RB-3’)。在一些实施方式里,所述输入载体是环形多核苷酸并以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB(即,5’-RA-LA-RY-D-RZ-LB-RB-3’)。在一些实施方式里,所述输入载体是环形多核苷酸并以5’至3’的方向包含:限制性酶切位点RA,引物结合片段PA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB(即,5’-RA-PA-RY-D-RZ-LB-RB-3’)。在一些实施方式里,所述输入载体是环形多核苷酸并以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,引物结合片段PB,和限制性酶切位点RB(即,5’-RA-LA-RY-D-RZ-PB-RB-3’)。图1A提供了示例性的输入载体。
[0024] 用能够切断RY和RZ的一种或多种限制性内切酶消化输入载体可以建立能够接受DNA片段的线形载体。DNA片段通过标准克隆技术连接入RY和RZ位点以形成本发明的装配载体。在一些实施方式里,输入载体的限制性酶切位点RY和RZ可以被同样的限制性内切酶切断。在一些实施方式里,输入载体的限制性酶切位点RY和RZ可以被IIS型限制性内切酶切断。在一些实施方式里,输入载体的限制性酶切位点RY和RZ可以被相同的IIS型限制性内切酶切断。在一个特别的实施方式里,所述IIS型限制性内切酶是SchI或MlyI。
[0025] 在一些实施方式里,输入载体的限制性酶切位点RA和RB可以被同样的限制性内切酶切断。在一些实施方式里,输入载体的限制性酶切位点RA和RB可以被IIS型限制性内切酶切断。在一些实施方式里,输入载体的限制性酶切位点RA和RB可以被相同的IIS型限制性内切酶切断。在一个特别的实施方式里,所述IIS型限制性内切酶是SapI或LguI。
[0026] 在另一方面,本发明提供装配组合物,其包含多种装配载体,所述装配载体用于从多种组分多核苷酸装配为一种或多种装配好的多核苷酸。在一些实施方式里,所述装配组合物包含:
[0027] (a)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0、选自组D0的任意的DNA片段、可退火接头序列LB0,和第二限制性酶切位点RB0;
[0028] (b)一个或多个中间核酸分子,其中每个中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn、第一可退火接头序列LAn、选自组Dn的任意DNA片段、第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
[0029] (c)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm、第一可退火接头序列LAm、选自组Dm的任意DNA片段、和第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;
[0030] 其中切断限制性酶切位点RA0至RBm,变性所获得的线形核酸分子,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数,并且其中每个组D0,...Dn,...Dm独立地由一个或多个DNA片段组成。
[0031] 在某些实施方式里,一个或多个第一核酸分子进一步包含一个引物结合片段PA位于所述选自组D0的DNA片段的5’位置。在某些实施方式里,一个或多个最后核酸分子进一步包含一个引物结合片段PB位于所述选自组Dm的DNA片段的3’位置。
[0032] 在某些实施方式里,装配组合物包含两个或更多个中间核酸分子。在某些实施方式里,装配组合物包含三个或更多个中间核酸分子。在某些实施方式里,装配组合物包含四个或更多个中间核酸分子。在某些实施方式里,装配组合物包含五个或更多个中间核酸分子。在某些装配方式里,所述组合物包含六个或更多个中间核酸分子。在某些实施方式里,装配组合物包含七个或更多个中间核酸分子。在某些实施方式里,装配组合物包含八个或更多个中间核酸分子。在某些实施方式里,装配组合物包含九个或更多个中间核酸分子。在某些实施方式里,装配组合物包含十个或更多个中间核酸分子。在某些实施方式里,装配组合物包含十五个或更多个中间核酸分子。在某些实施方式里,装配组合物包含二十个或更多个中间核酸分子。
[0033] 在某些实施方式里,m等于1。在某些实施方式里,m等于2。在某些实施方式里,m等于3。在某些实施方式里,m等于4。在某些实施方式里,m等于5。在某些实施方式里,m等于6。在某些实施方式里,m等于7。在某些实施方式里,m等于8。在某些实施方式里,m等于9。在某些实施方式里,m等于10。在某些实施方式里,m等于或大于10。
[0034] 在一些实施方式里,切断RA0至RBm的限制性酶切位点和变形所获得的线形核酸分子之后,相比于装配组合物中的其它可退火接头序列或它们的互补物,每个可退火接头序列LB(p-1)能够选择性地与可退火接头序列LAp的互补物杂交。在一些实施方式里,每个可退火接头序列L(p-1)在序列上与可退火接头序列LAp相同。
[0035] 在一个特别的实施方式里,RA0至RBm的限制性酶切位点可以被同样的限制性内切酶切断从而利于从装配载体中切除组分多核苷酸。在一些实施方式里,RA0至RBm的限制性酶切位点可以被SapI和/或LguI限制性内切酶切断。
[0036] 在另一方面,本发明提供包含多种线形核酸分子的组分组合物,其中所述线形核酸分子能通过用一种或多种能够切断RA0至RBm的限制性酶切位点的限制性内切酶消化装配组合物而形成,其中所述装配组合物包含:
[0037] (a)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0,选自组D0的任意DNA片段,可退火接头序列LB0,和第二限制性酶切位点RB0;
[0038] (b)一个或多个中间核酸分子,其中每个中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn,第一可退火接头序列LAn,选自组Dn的任意DNA片段,第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
[0039] (c)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm,第一可退火接头序列LAm,选自组Dm的任意DNA片段,第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;
[0040] 其中切断RA0至RBm的限制性酶切位点,变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数,并且其中每个组D0,...Dn,...Dm由一个或多个DNA片段组成。
[0041] 在某些实施方式里,一个或多个第一核酸分子进一步包含引物结合片段PA位于选自组D0的DNA片段的5’位置。在某些实施方式里,一个或多个最后核酸分子进一步包含引物结合片段PB位于选自组Dm的DNA片段的3’位置。
[0042] 在某些实施方式里,组分组合物包含两个或更多个中间核酸分子。在某些实施方式里,组分组合物包含三个或更多个中间核酸分子。在某些实施方式里,组分组合物包含四个或更多个中间核酸分子。在某些实施方式里,组分组合物包含五个或更多个中间核酸分子。在某些装配方式里,所述组合物包含六个或更多个中间核酸分子。在某些实施方式里,组分组合物包含七个或更多个中间核酸分子。在某些实施方式里,组分组合物包含八个或更多个中间核酸分子。在某些实施方式里,组分组合物包含九个或更多个中间核酸分子。在某些实施方式里,组分组合物包含十个或更多个中间核酸分子。在某些实施方式里,组分组合物包含十五个或更多个中间核酸分子。在某些实施方式里,组分组合物包含二十个或更多个中间核酸分子。
[0043] 在某些实施方式里,m等于1。在某些实施方式里,m等于2。在某些实施方式里,m等于3。在某些实施方式里,m等于4。在某些实施方式里,m等于5。在某些实施方式里,m等于6。在某些实施方式里,m等于7。在某些实施方式里,m等于8。在某些实施方式里,m等于9。在某些实施方式里,m等于10。在某些实施方式里,m等于或大于10。
[0044] 在另一方面,本发明提供一种用于依照本发明提供的方法来装配多种多核苷酸的试剂盒。在一些实施方式里,所述试剂盒包含:(a)一种或多种本文描述的输入载体;(b)一种或多种能够切断输入载体的限制性酶切位点RA和RB的限制性内切酶;和(c)一种或多种能够切断输入载体的限制性酶切位点RY和RZ的限制性内切酶。
[0045] 在另一方面,本发明提供一种核酸分子文库。在一些实施方式里,所述文库的核酸分子包含第一限制性酶切位点RA,DNA片段D,可退火接头序列LB,和第二限制性酶切位点RB。在一些实施方式里,所述文库的核酸分子包含第一限制性酶切位点RA,引物结合片段PA,DNA片段D,可退火接头序列LB,和第二限制性酶切位点RB。在一些实施方式里,所述文库的核酸分子包含第一限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和第二限制性酶切位点RB。在一些实施方式里,所述文库的核酸分子包含第一限制性酶切位点RA,可退火接头序列LA,DNA片段D,和第二限制性酶切位点RB。在一些实施方式里,所述文库的核酸分子包含第一限制性酶切位点RA,可退火接头序列LA,DNA片段D,引物结合片段PB,和第二限制性酶切位点RB。
[0046] 在一些实施方式里,所述文库包含下列每种载体的至少一种:
[0047] (a)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;
[0048] (b)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;和[0049] (c)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,和限制性酶切位点RB0。
[0050] 在一些实施方式里,所述文库包含下列每种载体的至少一种:
[0051] (a)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA,引物结合片段PA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;
[0052] (b)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;和[0053] (c)环形多核苷酸组成的载体,所述多核苷酸以5’至3’的方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,引物结合片段PB,和限制性酶切位点RB0。
[0054] 在一些实施方式里,所述DNA片段D包含核酸序列,所述核酸序列选自选择性标记,启动子,基因组靶向序列,编码表位标签的核酸序列,和编码感兴趣的基因的核酸序列,编码终止密码子和lacZ的核酸序列。
[0055] 在一些实施方式里,所述文库包含下列每种核酸分子的至少一种:
[0056] (a)第一核酸分子,其中所述第一核酸分子是环形并以5’至3’方向包含:第一限制性酶切位点RA0,DNA片段D0,可退火接头序列LB0,和第二限制性酶切位点RB0;
[0057] (b)中间核酸分子,其中所述中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn,第一可退火接头序列LAn,DNA片段Dn,第二可退火接头序列LBn,和第二限制性酶切位点RBn,并且其中n表示从1到中间核酸分子数目的整数;和
[0058] (c)最后核酸分子,其中所述最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm,可退火接头序列LAm,DNA片段Dm,第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;
[0059] 其中切断RA0至RBm的限制性酶切位点,变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数。在一些实施方式里,第一核酸分子进一步包含引物结合片段PA位于选自D0的DNA片段的5’位置。在一些实施方式里,最后核酸分子进一步包含引物结合片段PB位于选自Dm的DNA片段的3’位置。
[0060] 在某些实施方式里,所述文库包含两种或更多种中间核酸分子。在某些实施方式里,所述文库包含三种或更多种中间核酸分子。在某些实施方式里,所述文库包含四种或更多种中间核酸分子。在某些实施方式里,所述文库包含五种或更多种中间核酸分子。在某些装配方式里,所述文库包含六种或更多种中间核酸分子。在某些实施方式里,所述文库包含七种或更多种中间核酸分子。在某些实施方式里,所述文库包含八种或更多种中间核酸分子。在某些实施方式里,所述文库包含九种或更多种中间核酸分子。在某些实施方式里,所述文库包含十种或更多种中间核酸分子。在某些实施方式里,所述文库包含十五种或更多种中间核酸分子。在某些实施方式里,所述文库包含二十种或更多种中间核酸分子。
[0061] 在某些实施方式里,m等于1。在某些实施方式里,m等于2。在某些实施方式里,m等于3。在某些实施方式里,m等于4。在某些实施方式里,m等于5。在某些实施方式里,m等于6。在某些实施方式里,m等于7。在某些实施方式里,m等于8。在某些实施方式里,m等于9。在某些实施方式里,m等于10。在某些实施方式里,m等于或大于10。
[0062] 在另一方面,本发明提供从多种组分多核苷酸装配为一种或多种装配好的多核苷酸的方法,包含如下步骤:
[0063] (a)用一种或多种限制性内切酶消化装配组合物以产生组分组合物,所述装配组合物包含:
[0064] (i)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0,选自组PA的任意引物结合片段,选自组D0的任意DNA片段,可退火接头序列LB0,和第二限制性酶切位点RB0;
[0065] (ii)一个或多个中间核酸分子,其中每个中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn,第一可退火接头序列LAn,选自组Dn的任意DNA片段,第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
[0066] (iii)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm,第一可退火接头序列LAm,选自组Dm的任意DNA片段,选自组PB的任意引物结合片段,第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;其中切断RA0至RBm的限制性酶切位点,变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数,并且其中每个组D0,...Dn,...Dm由一个或多个DNA片段组成;
[0067] 其中所述一种或多种限制性内切酶能够切断RA0至RBm的限制性酶切位点;和[0068] (b)使组分组合物接触DNA聚合酶,三磷酸核糖核苷和一个或多个第一引物和一个或多个第二引物,在适合核酸分子变性的条件下,退火可退火接头序列LB(p-1)至可退火接头序列LAp,并从此延伸;其中每个所述第一引物能够与选自组PA的所述引物结合片段之一杂交,而每个第二引物能够与选自组PB的所述引物结合片段之一杂交;并且将所述组分组合物进行聚合酶链式反应,
[0069] 其中以5’到3’方向包含分别选自组D0,...Dn,...和Dm的一个DNA片段的多核苷酸被装配起来,p表示从1到m的整数。
[0070] 在某些实施方式里,装配组合物包含两个或更多个中间核酸分子。在某些实施方式里,装配组合物包含三个或更多个中间核酸分子。在某些实施方式里,装配组合物包含四个或更多个中间核酸分子。在某些实施方式里,装配组合物包含五个或更多个中间核酸分子。在某些装配方式里,所述组合物包含六个或更多个中间核酸分子。在某些实施方式里,装配组合物包含七个或更多个中间核酸分子。在某些实施方式里,装配组合物包含八个或更多个中间核酸分子。在某些实施方式里,装配组合物包含九个或更多个中间核酸分子。在某些实施方式里,装配组合物包含十个或更多个中间核酸分子。在某些实施方式里,装配组合物包含十五个或更多个中间核酸分子。在某些实施方式里,装配组合物包含二十个或更多个中间核酸分子。
[0071] 在某些实施方式里,m等于1。在某些实施方式里,m等于2。在某些实施方式里,m等于3。在某些实施方式里,m等于4。在某些实施方式里,m等于5。在某些实施方式里,m等于6。在某些实施方式里,m等于7。在某些实施方式里,m等于8。在某些实施方式里,m等于9。在某些实施方式里,m等于10。在某些实施方式里,m等于或大于10。
[0072] 在一些实施方式里,装配组合物包含一个第一核酸分子和一个最后核酸分子。在其它实施方式里,装配组合物包含多于一个第一核酸分子和多于一个最后核酸分子,这种装配方法提供了以组合的方式将多种组分多核苷酸有序装配为多个装配好的多核苷酸的有序装配方法。在某些实施方式里,装配组合物包含至少两种核酸分子,所述核酸分子包含相同的可退火接头序列LA和LB,和相同的引物结合片段PA或PB,或者相同的可退火接头序列对LA和LB,或者相同的可退火接头序列/引物结合片段对LA和PB,或者LB和PA。
[0073] 在另一方面,本发明提供产生包含装配好的多核苷酸的宿主细胞的方法。在一些实施方式里,所述方法包含用由本文描述的多核苷酸装配方法产生的装配好的多核苷酸转化宿主细胞。在其它实施方式里,所述方法包含用由本文描述的多核苷酸装配方法产生的多种装配好的多核苷酸转化宿主细胞。在一个特别的实施方式里,所述宿主细胞通过同源重组将两种或多种装配好的多核苷酸组合进入一种或多种组合的多核苷酸。在另外的实施方式里,所述方法包含用多个组分多核苷酸转化所述宿主细胞并且允许宿主细胞通过同源重组产生一种或多种装配好的组合多核苷酸。
[0074] 在另一方面,本发明提供产生多种宿主细胞的方法,所述宿主细胞包含大量装配好的多核苷酸。在一些实施方式里,所述多种宿主细胞通过用包含多种装配好的多核苷酸的组合物转化宿主细胞而产生,其中所述装配好的多核苷酸由组分多核苷酸组合装配而产生。在其它实施方式里,所述多种宿主细胞通过用包含多种装配好的多核苷酸的组合物转化宿主细胞而产生,其中所述装配好的多核苷酸的至少两种包含选择性标记的非功能性片段,其通过宿主细胞介导的同源重组而产生功能性选择性标记,然后筛选包含组合多核苷酸的宿主细胞。在另外的实施方式里,所述多种宿主细胞通过用组分组合物转化宿主细胞的组合方法而产生,其中所述组分组合物包含多种组分多核苷酸,至少两种组分多核苷酸包含同样的可退火接头序列LA或LB或者同样的可退火序列对LA和LB,然后筛选包含装配好的多核苷酸的宿主细胞。
[0075] 在另一方面,本发明提供具有选自SEQ ID NO:1-25的序列的多核苷酸。
[0076] 在另一方面,本发明提供包含选自SEQ ID NO:1-25的一个或多个序列的多核苷酸。4.附图说明
[0077] 图1A提供了用于制备本发明的装配载体的输入载体的示意图。该载体包含限制性酶切位点RA0,引物结合片段PA或可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,引物结合片段PB或可退火接头序列LB,和限制性酶切位点RB。
[0078] 图1B提供了制备输入载体的示例性方法,所述输入载体接受DNA片段以形成装配载体。示例性地,RY=RZ=SchI。用能够产生平末端的IIS型限制性内切酶SchI消化,导致载体与连接位点分离从并开放从而与DNA片段(D)融合。D通过平末端连接进入输入载体可以通过传统方法实现,并施用例如T4DNA连接酶。
[0079] 图2展示了包含多个装配载体(第一,中间,和最后)的装配组合物的示意图,分别包含感兴趣的DNA片段(D0,Dn,Dm)。第一核酸分子包含第一限制性酶切位点RA0,引物结合片段PA,DNA片段D0,可退火接头序列LB0,和第二限制性酶切位点RB0。一个或多个中间核酸分子包含第一限制性酶切位点RAn,第一可退火接头序列LAn,DNA片段Dn,第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;而最后核酸分子包含第一限制性酶切位点RAm,可退火接头序列LAm,DNA片段Dm,引物结合片段PB,第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数。
[0080] 图3展示了装配的示例性方法,即,从四种(4)组分多核苷酸“缝合”为装配好的多核苷酸。将包含用于装配的DNA片段的装配载体注入单独一个试管中并用SapI消化以从装配载体骨架中释放组分多核苷酸片段。在SapI加热失活之后,所述组分多核苷酸片段用于变性条件,继之以退火条件且足够互补可退火接头对的杂交。在DNA聚合酶和dNTP存在下的引物延伸之后,加入与PA和PB互补的引物,继之以传统的PCR扩增。作为装配反应的结果,产生了包含组分多核苷酸D0,D1,D2,和D3以5’到3’方向装配起来的装配好的多核苷酸。
[0081] 图4显示了pRYSE载体图。
[0082] 图5显示了通过装配2到4组分多核苷酸(装配表7中的1到6)而获得的装配好的多核苷酸,使用不同的方法以移除SapI限制性内切酶(柱纯化或加热失活),不同的装配载体DNA浓度(5ng(低DNA浓度)或50ng(高DNA浓度)的最小片段,和相等摩尔浓度的所有其它片段),和PCR扩增的不同退火温度(54℃和72℃)。
[0083] 图6显示了通过装配6或9组分多核苷酸(装配表7中的7,和13到16)而获得的装配好的多核苷酸,使用不同的DNA聚合酶(Phusion(New Engl和Biolabs,Ipswich,MA)和PfuUltraII(Stratagene/Agilent,La Jolla,CA))。
[0084] 图7显示了pMULE载体图。该pMULE输入载体不同于pRYSE输入载体之处在于它缺少引物结合片段或可退火接头序列。
[0085] 图8显示了通过宿主细胞介导的同源重组来组合装配好的多核苷酸进入组合多核苷酸的示例性方法,其中组合多核苷酸被整合进入宿主细胞的染色体。装配好的多核苷酸A包含编码选择性标记的第一非功能性片段的DNA片段Dm1和编码上游基因组靶向序列的DNA片段D01。装配好的多核苷酸B包含编码选择性标记的第二非功能性片段的DNA片段Dm2和编码下基因组靶向序列的DNA片段D02。宿主细胞在DNA片段Dm1和Dm2的同源区域联合装配好的多核苷酸A和装配好的多核苷酸B,以形成包含功能性选择性标记的组合多核苷酸,并利用DNA片段D01和D02编码的基因组靶向序列来将组合多核苷酸通过同源重组插入到其染色体中。
[0086] 图9显示了通过宿主细胞中同源重组而产生装配好的多核苷酸和将所述装配好的多核苷酸整合进入宿主细胞的染色体的示例性方法。第一步,用限制性内切酶消化包含装配载体的装配组合物,导致组分多核苷酸从装配载体骨架中切除出来。第二步,组分多核苷酸被引入宿主细胞,在这里它们在可退火接头序列的同源区域结合起来从而形成装配好的多核苷酸,并且该装配好的多核苷酸整合进入宿主细胞的染色体。
[0087] 图10显示了在同一个反应中从七种(7)组分多核苷酸装配得到多种装配好的多核苷酸的示例性方法。将包含用于装配的DNA片段的装配载体注入一个单独的试管,并用SqpI消化以从装配载体骨架中释放组分多核苷酸。在SapI加热失活之后,所述组分多核苷酸片段用于变性条件,继之以退火条件且足够互补可退火接头对的杂交。在DNA聚合酶和dNTP存在下的引物延伸之后,加入与PA和PB互补的引物,继之以传统的PCR扩增。作为装配反应的结果,产生了包含组分多核苷酸D01/02,D1/2,D3,和D41/42以5’到3’方向装配起来的装配好的多核苷酸。
[0088] 图11显示了产生包含组合的组合多核苷酸的多种宿主细胞的示例性方法。装配好的多核苷酸A1和A2,分别包含相同的上游基因组靶向序列和相同的选择性标记的第一非功能性部分,和装配好的多核苷酸B1和B2,分别包含相同的下游基因组靶向序列和相同的选择性标记的第二非功能性部分,通过宿主细胞介导的同源重组组合性结合起来一产生4种不同的组合多核苷酸,A1/B1,A1/B2,A2/B1,和A2/B2,分别包含功能性选择性标记,其能够被插入染色体以产生四种不同的宿主细胞。
[0089] 图12A显示了实施例10中的组分多核苷酸,所述组分多核苷酸用于高通量产生组合的装配好的多核苷酸和包含组合的装配好的多核苷酸和组合多核苷酸的酵母细胞,以及所期望的装配好的多核苷酸和组合多核苷酸。US=上游基因组靶向序列,DS=下游基因组靶向序列,P=多种启动子序列,G=多种蛋白质编码序列,URA=选择性标记的5’片段,RA3=选择性标记的3’片段,PA=引物结合片段PmeI-5’,PB=引物结合片段PmeI-3’,LB0=可退火接头序列RYSE 2,LAn1=可退火接头序列RYSE 2,LBn1=可退火接头序列RYSE15,LAn2=可退火接头序列RYSE 3,LBn2=可退火接头序列RYSE16,LAn3=可退火接头序列RYSE 15,LBn3=可退火接头序列RYSE 3,LAn4=可退火接头序列RYSE 16,LBn4=可退火接头序列RYSE 4,LAm1=可退火接头序列RYSE 3,LAm2=可退火接头序列RYSE 4,LAm3=可退火接头序列RYSE 3。
[0090] 图12B显示了示例性的装配好的多核苷酸(方框内),其由实施例10所描述的方法产生并在1%琼脂糖凝胶上拆分。
[0091] 图12C显示了如实施例10所描述获得的示例性细胞克隆的酶切分析。
[0092] 图13A显示了实施例11所用的装配好的多核苷酸和组分多核苷酸,及通过装配和宿主细胞的染色体整合而获得的期望的染色体位点。
[0093] 图13B显示了由实施例11产生的包含染色体整合了的装配好的多核苷酸的酵母细胞转化株的cPCR分析结果。
[0094] 图14显示了实施例12使用的组分多核苷酸,其用于高通量产生包含染色体整合了的组合的装配好的多核苷酸和组合的组合多核苷酸的酵母细胞,和通过装配以及宿主细胞介导的同源重组而组合后获得的组合多核苷酸。US=上游基因组靶向序列,DS=下游基因组靶向序列,P=多种启动子序列,G=多种蛋白质编码序列,URA=选择性标记的5’片段,RA3=选择性标记的3’片段,PA=引物结合片段PmeI-5’,PB=引物结合片段PmeI-3’,LB0=可退火接头序列RYSE 2,LAn1=可退火接头序列RYSE 2,LBn1=可退火接头序列RYSE15,LAn2=可退火接头序列RYSE 3,LBn2=可退火接头序列RYSE16,LAn3=可退火接头序列RYSE 15,LBn3=可退火接头序列RYSE 3,LAn4=可退火接头序列RYSE 16,LBn4=可退火接头序列RYSE 4,LAm1=可退火接头序列RYSE 3,LAm2=可退火接头序列RYSE 4,LAm3=可退火接头序列RYSE 3。
[0095] 5.发明详述
[0096] 5.1定义
[0097] 如本文所述,术语“多核苷酸”是指由核苷酸单位组成的聚合物,如本领域技术人员所理解的。优选的核苷酸单位包括但不限于包含腺嘌呤(A),乌嘌呤(G),胞嘧啶(C),胸腺嘧啶(T),和尿嘧啶(U)。有用的修饰的核苷酸单位包括但不限于:4-乙酰胞苷,5-(羧基羟基甲基)尿苷,2-O-甲基胞苷,5-羧基甲基基甲基-2-硫代尿苷,5-羧基甲基氨基-甲基尿苷,二氢尿苷,2-O-甲基假尿苷,2-O-甲基乌苷,肌苷,N6-异戊基腺苷,1-甲基腺苷,1-甲基假尿苷,1-甲基乌苷,1-甲基肌苷,2,2-二甲基乌苷,2-甲基腺苷,2-甲基乌苷,
3-甲基胞苷,5-甲基胞苷,N6-甲基腺苷,7-甲基乌苷,5-甲基氨基甲基尿苷,5-甲氧基氨基甲基-2-硫代尿苷,5-甲氧基尿苷,5-甲氧羰基甲基-2-硫代尿苷,5-甲氧羰基甲基尿苷,2-甲基硫代-N6-异戊基腺苷,尿苷-5-氧乙酸-甲酯,尿苷-5-氧乙酸,wybutoxosine,wybutosine,假尿苷,q核苷,2-硫代胞苷,5-甲基-2-硫代尿苷,2-硫代尿苷,4-硫代尿苷,
5-甲基尿苷,2-O-甲基-5-甲基尿苷,2-O-甲基尿苷,等等。多核苷酸包括天然存在的核酸例如脱氧核糖核酸(“DNA”)和核糖核酸(“RNA”),以及核酸类似物。核酸类似物包括包含以下的物质:非天然存在的基,以与天然存在的二磷酸键不同的方式参与与其它核苷的连接的核苷,或包含通过二磷酸键之外的连接而连接的碱基。因此,核酸类似物包含,示例性的和非限制性的,硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨基磷酸酯,烷磷酸酯,甲基磷酸酯,手性-甲基磷酸酯,2-O-甲基核苷酸,肽-核酸(PNA),等等。
[0098] 如本文所述,“组分多核苷酸”是指可以用本文描述的多核苷酸装配方法装配在一起而形成“装配好的多核苷酸”的多核苷酸序列。当多种装配载体被一种或多种限制性内切酶消化而从装配载体中释放组分多核苷酸之后,获得的组分多核苷酸的群体能够包含将被装配进入装配好的多核苷酸的所有DNA片段。
[0099] 如本文所述,“装配好的多核苷酸”是指由本文所述的多核苷酸装配方法所制造的多核苷酸。所述装配好的多核苷酸能够包含两种或更多组分多核苷酸。在一些实施方式里,装配好的多核苷酸包含2,3,4,5,6,7,8,9,10,11,12,13,14,15或更多组分多核苷酸。装配好的多核苷酸长度可以在大约100到大约20000个核苷酸范围内。在一些实施方式里,装配好的多核苷酸的长度在大约200到大约10000,大约200到大约8000,大约200到大约5000,大约200到大约3000,或大约200到大约1000个核苷酸范围内。在其它实施方式里,装配好的多核苷酸的长度在大约200到大约2000,大约2000到大约5000,大约5000到大约10000,大约10000到大约20000,或大于20000个核苷酸的范围内。
[0100] 本文使用常规标注来描述多核苷酸序列:单链多核苷酸序列的左手末端是5’-末端;双链多核苷酸序列的左手方向是指向其5’-方向。
[0101] 如本文所述,术语“DNA片段”,在下文实施例中可选地称为“Bit”,指任何分离的或未分离的DNA分子。有用的实例包括但不限于蛋白质编码序列,报告基因,荧光标记编码序列,启动子,增强子,终止子,内含子,外显子,聚-A尾,多克隆位点,核酸定位信号,mRNA稳定信号,选择性标记,整合位点,表位标签编码序列,降解信号,或任何其它天然存在或人工合成的DNA分子。在一些实施方式里,DNA片段可以是天然来源的。可选地,DNA片段可以是完全的合成来源的,体外合成。进一步,DNA片段可以包含任何分离的天然存在的DNA分子的组合,或任何分离的天然存在的DNA分子和人工合成的DNA分子的组合。例如,DNA片段可以包含异源启动子可操作地连接蛋白质编码序列,蛋白质编码序列连接聚-A尾,蛋白质编码序列在框内连接表位标签编码序列,等等。
[0102] “互补”是指两个多核苷酸的相互作用的表面拓扑学上相容或匹配,如本领域技术人员所理解的。因此,两个序列如果他们能够相互杂交而形成稳定的反平行的、双链核酸结构,则他们相互“互补”。如果第一多核苷酸的核苷酸序列与第二多核苷酸的多核苷酸结合伴侣的核苷酸序列完全相同,或者第一多核苷酸能够在严格杂交条件下与第二多核苷酸杂交,则该第一多核苷酸与第二多核苷酸互补。因此,序列为5’-TATAC-3’的多核苷酸与序列为5’-GTATA-3’的多核苷酸互补。
[0103] “引物”是指这样的多核苷酸序列,它能够特异性地杂交多核苷酸模板序列,例如,引物结合片段,并能够在适合的合成条件下提供合成互补多核苷酸的起始点,即,在核苷酸和能够催化合成反应的试剂(例如DNA聚合酶)存在的条件下。引物与多核苷酸模板序列互补,但是不需要与多核苷酸模板序列精确互补。例如,引物可以与多核苷酸模板序列的互补物具有至少80,85,90,95,96,97,98,或99%的相同。引物可以具有可变的长度但是通常至少15个碱基。在一些实施方式里,引物在15和35个碱基长度之间。在一些实施方式里,引物为大于35个碱基长度。在其它实施方式里,引物具有解链温度(Tm)至少50℃,所述解链温度是指在该温度下DNA双链体的一半将分离形成单链。在其它实施方式里,引物具有50℃和70℃之间的Tm。在另外的实施方式里,引物不形成明显的DNA或RNA二级结构,从而不影响与多核苷酸模板序列的杂交效率。
[0104] 如本文所述,术语“引物结合片段”是这样的多核苷酸序列,它与引物结合以提供在适合合成的条件下合成互补多核苷酸的起始点。在一些实施方式里,引物结合序列是本发明的可退火接头之一。在已知的装配组合物之内的装配载体或组分多核苷酸之中,当不存在互补接头时,序列成为引物结合序列而不是可退火接头。在一些实施方式里,引物结合片段作为基因组靶向序列起作用,例如,上游或下游基因靶向序列。
[0105] 如本文所述,术语“接头序列”和“可退火接头序列”可交替地使用,指包含在本文所述的输入载体和装配载体之内的多核苷酸序列。特别是,可退火接头序列在输入载体或装配载体之内侧邻于DNA片段。在从装配载体切除组分多核苷酸和变性该组分多核苷酸之后,可退火接头能够在多核苷酸装配反应中特异性杂交相邻组分多核苷酸的互补可退火接头序列,如本文所述。可退火接头序列,在与互补接头链退火后,能提供合成互补多核苷酸的起始点。
[0106] 如本文所述,术语“载体”在参考文献中用于指细胞内能够复制的染色体外的核酸分子,插入序列能够可操作地连接载体以使插入序列复制。有用的实例包括但不限于环形DNA分子例如质粒构建体,噬菌体构建体,黏粒载体,等等,以及线形核酸构建体(例如,λ噬菌体构建体,细菌人工染色体(BAC),酵母人工染色体(YAC),等等)。载体可以包括表达信号例如启动子和/或终止子,选择性标记例如赋予抗生素抗性的基因,和一个或多个限制性酶切位点,插入序列可以克隆进入其中。载体可以具有其它独特的特性(例如其能够适应的DNA插入片段的大小)。
[0107] 如本文所述,术语“输入载体”是指这样的克隆载体质粒,它能够在用于本发明提供的多核苷酸装配方法的装配载体的制备中作为亲本载体。输入载体包含两个可退火接头序列,或一个可退火接头序列和一个引物结合片段,其侧邻于限制性酶切位点,所述位点可用于引入DNA片段以形成装配载体。如本文所述,“装配载体”是指已经引入DNA片段的输入载体。装配载体在本文描述的多核苷酸装配方法中用来提供组分多核苷酸,以装配进入装配好的多核苷酸。
[0108] 如本文所述,术语“装配载体”指这样的载体,其包含一个可退火接头序列,两个可退火接头序列,或一个可退火接头序列和一个引物结合片段,以及一个DNA片段。
[0109] 如本文所述,术语“限制性酶”或“限制性内切酶”是指这样一类催化分子的成员,其结合同一类DNA序列并在该序列中的一个精确位置切断该DNA分子。限制性内切酶包括IIS型限制性内切酶。这种酶与其它限制性内切酶的不同之处在于其识别序列与切断序列相分离。IIS型限制性酶的一些实例包括AlwI,BsaI,BbsI,BbuI,BsmAI,BsrI,BsmI,BspMI,Earl,Esp3I,FokI,HgaI,HphI,LguI,MboII,Mn1I,PleI,SapI,SchI,SfaNi,等等。很多这些限制性内切酶可以商业上获得并为本领域技术人员所熟知。
[0110] 如本文所述,术语“可退火接头序列双链体”是指一个可退火接头序列链与充分互补的可退火接头序列链以反平行连接方式联合。互补不需要完美;可退火接头序列双链体可以包含错配碱基对或不配对碱基,尽管在特别的实施方式里,可退火接头序列双链体包含两个具有完美互补性的可退火接头序列链。
[0111] 如本文所述,术语“基因组靶向序列”是指在宿主细胞的基因组上一定位置的核酸序列,在该位置本发明的多核苷酸通过宿主细胞介导的同源重组而插入其中。术语“上游基因组靶向序列”和“下游基因组靶向序列”是指在宿主细胞基因组中相对位于上游和下游的基因组靶向序列。
[0112] 如本文所述,术语“染色体靶向序列”是指宿主细胞的染色体上一定位置的核酸序列,在该位置本发明的多核苷酸通过宿主细胞介导的同源重组而插入其中。术语“上游染色体靶向序列”和“下游染色体靶向序列”是指在宿主细胞染色体中相对位于上游和下游的染色体靶向序列。
[0113] 5.2多核苷酸装配方法
[0114] 在一方面,本发明提供了将多种组分多核苷酸有序装配为一种或多种装配好的多核苷酸的快速、牢固和高通量的方法。本发明的方法使用环形核酸载体,称为装配载体,其分别包含DNA片段D,侧邻于可退火接头序列(即,LA或LB),一对可退火接头序列(即,LA和LB),或可退火接头序列和引物结合片段(即,LA和PB或者LB和PA),和一对限制性酶切位点,RA和RB(图1B)。限制性内切酶在限制性酶切位点RA和RB消化多种装配载体产生了多种组分多核苷酸,所述组分多核苷酸包含元件5’-LA-D-3’,5’-D-LB-3’,5’-LA-D-LB-3’,5’-LA-D-PB-3’,或5’-LB-D-PA-3’(图3)。在本发明的方法里,可退火接头序列LA和LB提供具有互补末端的组分多核苷酸,以用于结合重叠延伸装配反应,继之以聚合酶链式反应(SOE/PCR)以使组分多核苷酸以有序顺序装配进入装配好的多核苷酸。
[0115] 特别是,所述方法能用于将多个功能性DNA元件装配进入单一的装配好的多核苷酸,所述功能性DNA元件包括但不限于蛋白质编码序列,报告基因,荧光标记编码基因,启动子,增强子,终止子,内含子,外显子,聚-A尾,多克隆位点,核定位信号,mRNA定位信号,选择性标记,整合位点,表位标签编码序列,和降解信号。该方法可用于装配任何类型的装配好的多核苷酸,包括但不限于合成基因,构建体,克隆载体,表达载体,染色体,基因组整合构建体,基因组,和DNA文库。进一步,所述方法可用于在单一反应中装配DNA片段,而不需要处理和表征中间产物。
[0116] 在一些实施方式里,所述方法也可用于将多种组分多核苷酸装配为装配好的多核苷酸,其中所述组分多核苷酸不是来源于装配载体(即,通过本领域公知的标准过程获得的DNA片段,例如PCR扩增,化学合成,等等,其侧邻于一或两个可退火接头序列,LA和/或LB,或可退火接头序列和引物结合片段(即,LA和PB或者LB和PA))。不来源于装配载体的组分多核苷酸可以在SOE/PCR反应或者宿主细胞介导的同源重组之前的任何步骤中加入装配反应,以装配进入装配好的多核苷酸。因此,在一些实施方式里,该装配方法可以用于装配:(1)组分多核苷酸,其来自装配载体,该装配载体包含一个或两个可退火接头序列,或一个可退火接头序列和一个引物结合片段,通过消化所述装配载体而产生组分多核苷酸;(2)非载体DNA片段,侧邻于一个或两个可退火接头序列,或一个可退火接头序列和一个引物结合片段,和(3)其组合。
[0117] 在一些实施方式里,本发明提供将多种组分多核苷酸装配进入一种或多种装配好的多核苷酸的方法,包含如下步骤:
[0118] (a)用一种或多种限制性内切酶消化装配组合物以产生组分组合物,所述装配组合物包含:
[0119] (i)一个或多个第一核酸分子,其中每个第一核酸分子是环形的并以5’至3’方向包含:第一限制性酶切位点RA0,选自组PA的任意引物结合片段,选自组D0的任意DNA片段,可退火接头序列LB0,和第二限制性酶切位点RB0;
[0120] (ii)一个或多个中间核酸分子,其中每个中间核酸分子n是环形的并以5’至3’的方向包含:第一限制性酶切位点RAn,第一可退火接头序列LAn,选自组Dn的任意DNA片段,第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
[0121] (iii)一个或多个最后核酸分子,其中每个最后核酸分子是环形的并以5’至3’的方向包含:第一限制性酶切位点RAm,第一可退火接头序列LAm,选自组Dm的任意DNA片段,选自组PB的任意引物结合片段,第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;其中切断RA0至RBm的限制性酶切位点,变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数,并且其中每个组D0,...Dn,...Dm由一个或多个DNA片段组成;
[0122] 其中所述一种或多种限制性内切酶能够切断RA0至RBm的限制性酶切位点;和[0123] (b)使组分组合物接触DNA聚合酶,三磷酸脱氧核糖核苷和一个或多个第一引物和一个或多个第二引物,在适合核酸分子变性的条件下,退火可退火接头序列LB(p-1)至可退火接头序列LAp,并从此延伸;其中每个所述第一引物能够与选自组PA的所述引物结合片段之一杂交,而每个第二引物能够与选自组PB的所述引物结合片段之一杂交;并且将所述组分组合物进行聚合酶链式反应,
[0124] 其中以5’到3’方向包含分别选自组D0,...Dn,...和Dm的一个DNA片段的多核苷酸被装配起来。在所述方法里,p表示从1到m的整数。
[0125] 图3为示意性性目的描述了本发明的装配方法的一个实施方式。在该实例里,总共四种组分多核苷酸装配产生了装配好的多核苷酸。但是,本发明提供的装配方法可以用于将任意数量的组分多核苷酸装配进入一种或多种装配好的多核苷酸。在一些实施方式里,本发明提供的方法导致2,3,4,5,6,7,8,9,10,11,12,13,14,15,或更多组分多核苷酸被装配进入一种或多种装配好的多核苷酸。
[0126] 在图3示意的实例里,装配组合物包含四个输入装配载体,表示为“第一”,“中间1(int1)”,“中间2(int2)”,和“最后”,装配好的多核苷酸由所述装配组合物产生。每个装配载体分别包含DNA片段侧邻于一个可退火接头序列和一个引物结合片段,或者两个可退火接头序列。特别地,DNA片段D0侧邻于5’引物结合片段PA和3’可退火接头序列LB0。DNA片段D1侧邻于5’和3’可退火接头序列LA1和LB1,而DNA片段D2侧邻于5’和3’可退火接头序列LA2和LB2。DNA片段D3侧邻于3’引物结合片段PB和5’可退火接头序列LA3。装配载体中的元件5’-PA-D-LB-3’,5’-LA-D-LB-3’,或5’-LA-D-PB-3’进一步侧邻于SapI限制性酶切位点。
[0127] 在图3展示的装配反应的第一步,装配组合物被用SapI消化,导致组分多核苷酸被从装配载体骨架中切除出来而成为组分组合物,所述组分多核苷酸包含元件5’-PA-D-LB-3’,5’LA-D-LB-3’,或5’-LA-D-PB-3’。由于SapI是IIS型限制性内切酶,其识别位点在其切断位点的远端,而其切断发生在其识别序列之外。这一性质使IIS型限制性内切酶尤其适用于根据本发明提供的方法来装配多核苷酸,因为不包含限制性酶切位点伤痕的多核苷酸可以被装配起来,这是不同于用非IIS型限制性内切酶切断限制性酶切位点RA和RB的结果。参考图2,RA0,RAn,和RAm的IIS型识别位点分别在其对应切断位点的
5’端,而RB0,RAn,和RAm的IIS型识别位点分别在其对应切断位点的3’端。因此,限制性酶切位点RA0到RBm是定向的从而其被一种或多种能够切断RA0到RBm的IIS型限制性内切酶所切断,导致了RA0从D0分离,LB0从RB0分离,RAn从LAn分离,LBn从RBn分离,RAm从LAm分离,和Dm从RBm分离,结果产生的线形核酸分子包含D0,LB0,RAn,LBn,LAm或Dm而不包含RA0到RBm的任何一个。从而,获得的组分多核苷酸不包括限制性内切酶的识别或切断位点的任何痕迹。因此本发明的装配多核苷酸的方法可以用于多次转化宿主细胞而不引入重复序列,后者可能导致遗传不稳定性
[0128] 随后,限制性内切酶可选地失活。如果需要失活,本领域公知的失活核酸内切酶活性的任何方法都可以使用,包括基于柱或凝胶的纯化方法。一种方便的方法是加热失活,例如,65℃20分钟,仅需要很少或不需要在反应试管外操作所述组分组合物。
[0129] 组分多核苷酸之间的互补末端的重叠链形成的序列双链体启动了组分多核苷酸装配进入装配好的多核苷酸。特别是,可退火接头序列设计为可退火接头序列LB0能杂交可退火接头序列LA1的互补物,可退火接头序列LB1能杂交可退火接头序列LA2的互补物,而可退火接头序列LB2能杂交可退火接头序列LA3的互补物。从而,在装配反应的第二步,组分多核苷酸用于变性条件(例如,加热)以产生单链组分多核苷酸,并且伴随着或者在装配反应的变性步骤之后接触耐热DNA聚合酶和三磷酸脱氧核糖核苷。
[0130] 耐热DNA聚合酶可以是本领域技术人员认为合适的任何耐热DNA聚合酶。适合用于本方法的耐热DNA聚合酶包括但不限于Thermus thermophilus(Tth)DNA聚合酶,Thermus aquaticus(Taq)DNA聚合酶,Thermotoga neopolitana(Tne)DNA聚合酶,TMThermotoga maritima(Tma)DNA聚合酶,Therm℃℃cus lit和alis(Tli或VENT )DNA聚合TM
酶,Pyr℃℃cus furiosus(Pfu或DEEPVENT )DNA聚合酶,Pyr℃℃cus woosii(Pwo)DNA聚合酶,Bacillus sterothermophilus(Bst)DNA聚合酶,Sulfolobus acid℃aldarius(SAC)DNA聚合酶,Thermoplasma acidophilum(Tac)DNA聚合酶,Thermus flavus(Tfl/Tub)DNATM
聚合酶,Thermus ruber(Tru)DNA聚合酶,Thermus br℃kianus(DYNAZYME )DNA聚合酶,Methanobacterium thermoautotrophicum(Mth)DNA聚合酶,及其突变物,变体,和其衍生物。优选具有高保真性(即,校对机制)和低错配率的耐热DNA聚合酶。在某些实施方式TM
里,DNA聚合酶是Phusion DNA聚合酶(New Engl和Biolabs,Ipswich,MA)。在其它实施TM
方式里,DNA聚合酶是PfuUltra II Fusion DNA聚合酶(Strategene/Agilent,La Jolla,CA)。
[0131] 然后将装配反应置于允许从重叠可退火接头序列的3’羟基部分开始链延伸的条件下,期间耐热DNA聚合酶填充重叠的可退火接头序列之间的部分。装配反应经受一定数量的变性/退火/延伸的重复循环(例如,5-15个循环),期间形成了足量的双链的装配好的多核苷酸。在该循环期间,组分多核苷酸即作为引物也作为模板以产生装配好的多核苷酸的全长模板。在某些实施方式里,PCR的所述退火和延伸步骤都在72℃下进行。
[0132] 与可退火接头序列LA和LB相比,引物结合片段PA和PB设计为相互之间或者与任何可退火接头序列或DNA片段之间都不重叠,但是作为用于扩增全长的装配好的多核苷酸的引物的结合位点。因此,在装配反应的4和5,加入与引物结合片段PA和PB互补的引物,该组合物置于传统PCR扩增条件下。PCR扩增条件可以是本领域技术人员认为合适的任何PCR扩增条件,包括如《PCR Technology:Principles和Applications f和DNA Amplification》,ed.HA Erlich,Stockton Press,New Y和k,N.Y.(1989);《PCR Prot℃ols:A Guide to methods和Applications》,eds.Innis,Gelfl和,Snisky,和White,Academic Press,San Diego,Calif(1990);Mattila et al.(1991)Nucleic Acids Res.19:4967;Eckert,K.A.和Kunkel,T.A.(1991)PCR Methods和Applications 1:17;和U.S.专利号4,683,202和4,965,188中所描述的,它们分别引入本文作为参考。在某些实施方式里,装配反应的PCR步骤包含大约35个循环的变性,退火和延伸,在与引物结合片段PA和PB互补的引物存在的条件下。在某些实施方式里,PCR的退火和延伸步骤可以都在72℃下进行。但是,本领域技术人员将明白成功扩增的最佳条件依赖于所用的耐热DNA聚合酶和可退火接头序列,这些条件从而可以调整。
[0133] 任选地,装配好的多核苷酸可以通过本领域技术人员抑制的任何技术来纯化,例如,凝胶电泳纯化方法,然后用于各种目的。例如,装配好的多核苷酸可以插入表达载体骨架以进行序列验证。
[0134] 5.3制备包含装配好的多核苷酸的宿主细胞的方法
[0135] 在另一方面,本发明提供制备包含装配好的多核苷酸的宿主细胞的方法。在一些实施方式里,装配好的多核苷酸是至少3kb大小。在其它实施方式里,装配好的多核苷酸是至少5kb大小。在其它实施方式里,装配好的多核苷酸是至少6,7,8,9或10kb大小。在其它实施方式里,装配好的多核苷酸为大于10kb大小。在其它实施方式里,装配好的多核苷酸为大于15kb大小。在其它实施方式里,装配好的多核苷酸为大于20kb大小。
[0136] 在一些实施方式里,提供的方法包含用由本文描述的多核苷酸装配方法产生的装配好的多核苷酸转化宿主细胞。装配好的多核苷酸可以再转化之前环形化,也可以以线形分子转化。装配好的多核苷酸可以在宿主细胞内以染色体外多核苷酸来维持。可选地,装配好的多核苷酸可以整合进入宿主细胞的基因组,例如,通过宿主细胞介导的同源重组。为了通过同源重组将装配好的多核苷酸整合进入基因组,装配好的多核苷酸必须在一个末端包含具有上游基因组靶向序列的核酸序列,而在另一个末端包含具有下游基因组靶向序列的核酸序列。从而,要整合进入宿主细胞染色体的装配好的多核苷酸是从这样的装配组合物产生的,所述装配组合物包含包括上游染色体整合序列的第一核酸分子和包括下游染色体整合序列的最后核酸分子,每个染色体靶向序列都足够长度以起始宿主细胞介导的它与染色体之间的同源重组。
[0137] 在其它实施方式里,所述方法包含用由本文描述的多核苷酸装配方法产生的大量装配好的多核苷酸转化宿主细胞。在一个特别的实施方式里,宿主细胞通过同源重组将两个或更多装配好的多核苷酸组合进入单一的组合多核苷酸。包含组合多核苷酸的宿主细胞转化体由于表达选择性标记而被筛选出来,所述选择性标记在组合装配好的多核苷酸的过程中产生。所述方法对通过同源重组将相对大的多核苷酸片段插入目标多核苷酸尤其有用。为了发生染色体整合,组合多核苷酸必须分别包含上游基因组靶向序列位于选择性标记的编码序列的5’或3’位置,和下游基因组靶向序列位于选择性标记的编码序列的3’或5’位置。本文所用的基因组整合包括染色体整合,即,多核苷酸整合进入宿主细胞的染色体。Saccharomyces cerevisiae中合适的染色体整合位点包括但不限于NDT80,HO,GAL2,和GAL1-GAL10-GAL7位点。该方法也可以用于产生包含染色体外维持的多核苷酸的宿主细胞,例如,质粒和表达载体。当组合多核苷酸不包含相同的可退火接头序列或DNA片段排列为正向重复的时候,染色体整合的和染色体外保持的组合多核苷酸的稳定性都会增加,否则这种正向重复会起始额外的同源重组事件并导致组分多核苷酸片段的切除。因此,在一些实施方式里,装配好的多核苷酸包含独特的可退火接头序列和DNA片段。在其它实施方式里,装配好的多核苷酸包含一个或多个同样的可退火接头序列或DNA片段,但它们在装配好的多核苷酸组合之后在组合多核苷酸中以反向重复来排列。
[0138] 图8示意了示例性的组合多核苷酸的制备和通过同源重组将组合的多核苷酸整合进入宿主细胞的染色体中。能够同源重组的宿主细胞吸收了两种装配好的多核苷酸A和B。每种装配好的多核苷酸分别包含DNA片段Dm,其编码选择性标记的一个片段,其中装配好的多核苷酸A的DNA片段Dm1编码选择性标记的第一片段,而装配好的多核苷酸B的DNA片段Dm2编码选择性标记的第二片段,其中DNA片段Dm1和DNA片段Dm2包含足够起始宿主细胞介导的同源重组的同源区域,并且其中DNA片段Dm1和DNA片段Dm2均不能产生功能性选择性标记,但是通过宿主细胞介导的同源重组,产生了功能性的选择性标记。每种装配好的多核苷酸分别进一步包含DNA片段D0。其编码染色体靶向序列并具有足够长度以起始宿主细胞介导的同源重组,其中装配好的多核苷酸A的DNA片段D01编码上游染色体靶向序列,而装配好的多核苷酸B的DNA片段D02编码下游染色体靶向序列。一旦进入细胞,宿主细胞将在DNA片段Dm1和Dm2的同源区域组合装配好的多核苷酸A和装配好的多核苷酸B,以形成组合的多核苷酸。此外,宿主细胞使用DNA片段D01和D02编码的染色体靶向序列而使组合的多核苷酸通过同源重组插入其染色体。包含组合的多核苷酸的宿主细胞很容易基于其产生的功能性选择性标记而鉴别出来。
[0139] 在其它实施方式里,所述方法包含用多种组分多核苷酸转化宿主细胞,并允许宿主细胞通过同源重组产生一种或多种装配好的多核苷酸。装配好的多核苷酸可以在宿主细胞内染色体外保持或者整合进入宿主细胞的染色体。图9示意了通过宿主细胞中同源重组而产生示例性的装配好的多核苷酸和将装配好的多核苷酸整合进入宿主细胞染色体。第一步,包含装配载体的装配组合物用IIS型限制性例如SapI或LguI内切酶消化导致组分多核苷酸从装配载体骨架中切除出来。在该实施方式里,D0和D3可以是上游或下游染色体靶向序列,这种情况下第一装配载体和最后装配载体中具有引物结合片段是可选的。或者,这两个引物结合片段能够作为上游和下游基因组靶向序列起作用。
[0140] 一旦切除出来,每个切除的组分多核苷酸分别包含可退火接头序列LB,其同源于另一种组分多核苷酸的可退火接头序列LA,并具有足够长度以起始宿主细胞介导的同源重组。从第一装配载体切下的组分多核苷酸进一步包含上游染色体靶向序列,而从最后装配载体切下的组分多核苷酸进一步包含下游染色体靶向序列,其中两个染色体靶向序列都具有足够长度以在宿主细胞中起始宿主细胞介导的与染色体之间的同源重组。限制性内切酶随后被失活。在所述方法的第二步,组分组合物被引入能够同源重组的宿主细胞。一旦进入细胞,宿主细胞在可退火接头序列之间的同源区域组合所述组分多核苷酸以形成装配好的多核苷酸,而装配好的多核苷酸整合进入染色体。包含装配好的多核苷酸的宿主细胞可以通过基于装配好的多核苷酸的DNA片段编码的选择性标记而容易地鉴别出来。
[0141] 任何宿主细胞可以用于本文描述的方法。在特定的实施方式里,合适的宿主细胞是能够基于序列互补性而组合多核苷酸的宿主细胞,所述序列互补性例如本发明提供的选择性标记片段,基因组靶向序列,和可退火接头序列。这种宿主细胞的示意性实例包括但不限于Saccharomyces cerevisiae。适合这些宿主细胞摄入DNA的条件是本领域熟知的。
[0142] 包含装配好的多核苷酸或组合多核苷酸的宿主细胞转化体可以由于装配好的多核苷酸或者组合多核苷酸编码的选择性标记的表达而被容易地鉴别出来,所述选择性标记允许通过促进或者抑制细胞的生长来选择。选择性标记可以由装配组合物的装配载体中出现的单独DNA片段来编码。可选地,选择性标记的非功能性片段可以由装配组合物的多种装配载体中或者多种装配好的多核苷酸中出现的DNA片段来编码,而功能性选择性标记仅分别由装配好的多核苷酸或者组合多核苷酸产生。
[0143] 本领域已知多种选择性标记(例如参见Kaufinan,Meth.Enzymol.,185:487(1990);Kaufman,Meth.Enzymol.,185:537(1990);Srivastava和Schlessinger,Gene,nd
103:53(1991);Romanos et al.,in DNA Cloning 2:Expression Systems,2 Edition,pages 123-167(IRL Press 1995);Markie,MethodsMol.Biol.,54:359(1996);Pfeifer et al.,Gene,188:183(1997);Tucker和Burke,Gene,199:25(1997);Hashida-Okado et al.,FEBS Letters,425:117(1998))。在一些实施方式里,选择性标记是药物抗性标记。药物抗性标记使细胞能够对一种外源药物解毒,否则该药物将杀死细胞。药物抗性标记的示意性实例包括但不限于赋予对抗生素的抗性,例如氨苄青霉素,四环素,卡那霉素,博莱霉素,TM
链霉素,潮霉素,新霉素,Zeocin ,等等。在其它实施方式里,选择性标记是营养缺陷型标记。营养缺陷型标记允许细胞在缺乏某种必要组分的培养基里生长的时候能够合成必要组分(通常是氨基酸)。选择性营养缺陷型基因序列包括,例如,hisD,其允许在组氨醇存在的情况下在组氨酸缺乏的培养基里生长。其它选择性标记包括博莱霉素抗性基因,金属硫蛋白基因,潮霉素B-磷酸转移酶基因,AURI基因,腺苷脱氨基酶基因,氨基糖苷磷酸转移酶基因,二氢叶酸还原酶基因,胸苷激酶基因,黄嘌呤-乌嘌呤磷酸核糖转移酶基因,等等。
[0144] 营养缺陷型也可以用于鉴别包含染色体整合的装配好的多核苷酸或组合多核苷酸的宿主细胞转化株,当装配好的多核苷酸或组合多核苷酸的整合导致中断了宿主细胞需要用来合成细胞生长所必须的组分的基因的时候,使细胞成为营养缺陷突变体。
[0145] 包含染色体整合的装配好的多核苷酸或组合多核苷酸的宿主细胞转化株也可以通过筛选具有其它特性的宿主细胞转化株而鉴别出来,所述特性由单独DNA片段或者组合DNA片段编码,例如,表达发光的肽,或宿主细胞单克隆的分子分析,例如,通过限制性酶图谱,PCR扩增,或者分离装配好的多核苷酸或染色体整合为点的序列分析。
[0146] 5.4多核苷酸装配的组合方法和宿主细胞的制备
[0147] 在另一方面,本发明提供将多种组分多核苷酸有序装配进入多种装配好的多核苷酸的快速,牢固,和高通量的方法。该方法依赖于使用包含装配载体的装配组合物,其中所述装配载体分别包含DNA片段D,侧邻于可退火接头序列LA或LB,一对可退火接头序列LA和LB,或者一个可退火接头序列和一个引物结合片段,即,LA和PB或者LB和PA,侧邻于一对限制性酶切位点RA和RB(图1B)。但是,为了用本发明公开的方法产生多样的装配好的多核苷酸,选择可退火接头序列和引物结合片段以使得多于一种的组分多核苷酸的组合能在反应中被装配进入装配好的多核苷酸。因此,在某些实施方式里,装配组合物包含至少两种装配载体,其具有相同可退火接头序列LA或LB或者相同引物结合片段PA或PB,但是至于DNA片段则不相同。在其它实施方式,装配组合物包含至少两种装配载体,其具有同样的可退火接头序列对LA和LB,或者同样的可退火接头序列可退火接头序列和引物结合片段对,即,LA和PB或者LB和PA,至于DNA片段则不相同。
[0148] 图10描述了在同一个反应中由七种(7)组分多核苷酸产生多种装配好的多核苷酸的示例性方法。包含要装配的DNA片段的装配载体注入一个单一的试管,用SapI消化以从装配载体骨架中释放组分多核苷酸片段。加热失活SapI之后,组分多核苷酸经历变性条件,继之以退火条件使足够互补的可退火接头序列对杂交。随后在DNA聚合酶和dNTP存在下引物延伸,加入与引物结合片段PA和PB互补的引物,以PCR扩增八种(8)不同的全长的装配好的多核苷酸,包括在各种可能的组合下装配的DNA片段D01/02,D1/2,D3,和D41/42。单独的装配好的多核苷酸可以从混合的装配好的多核苷酸的组合物中分离出来,例如,通过另个轮PCR扩增并使用与DNA片段D01,D02,D41,和D42的区域互补的引物。可选地,可以使用包含一组引物结合片段PA和/或PB的第一装配载体和最后装配载体并使用仅杂交选择的引物结合片段PA和PB的亚组的引物,通过PCR扩增而使一系列装配好的多核苷酸分离出来。分离的装配好的多核苷酸可以用于,例如,转化宿主细胞以产生包含装配好的多核苷酸的多种宿主细胞。可选择地,宿主细胞可以用混合的装配好的多核苷酸的组合物直接转化,而包含每种装配好的多核苷酸的宿主细胞转化株可以被分离出来,例如,通过宿主细胞单克隆的分子分析,或者通过选择包含选择性标记的宿主细胞转化株,或者展现由单独DNA片段或DNA片段组合编码的其它特性的细胞转化株。
[0149] 在其它实施方式里,包含多种通过组合方法装配的多核苷酸的多种宿主细胞通过如下方法产生:用包含多种装配好的多核苷酸的组合物转化宿主细胞,其中至少两种装配好的多核苷酸包含选择性标记的非功能性片段,在此基础上同源重组能产生功能性选择性标记,然后筛选包含组合的多核苷酸的宿主细胞。图11示意了产生多种包含组合的多核苷酸的宿主细胞的组合性尝试。在该实例里,装配好的多核苷酸A1和A2,分别包含相同的上游染色体靶向序列和相同的选择性标记的第一部分,而装配好的多核苷酸B1和B2,分别包含相同的下游染色体靶向序列和相同的选择性标记的第二部分,被通过宿主细胞介导的同源重组组合性组合起来,以产生四种不同的组合多核苷酸,A1/B1,A1/B2,A2/B1,和A2/B2,它们可以被插入染色体以产生四种不同的宿主细胞。
[0150] 在另外的其它实施方式里,包含通过组合方法装配和组合的多种多核苷酸的多种宿主细胞由以下方法产生:用包含多种组分多核苷酸的组分组合物转化宿主细胞,其中至少两种组分多核苷酸包含选择性标记的非功能性片段,在此基础上同源重组能产生功能性选择性标记,然后筛选包含组合多核苷酸的宿主细胞。
[0151] 5.5输入载体
[0152] 在另一方面,本发明提供了载体,即,输入载体,它可以用于制备装配载体。在一些实施方式里,输入载体是环形多核苷酸并包含选择性标记,复制起始位点,和中间的DNA片段,它侧邻两个限制性酶切位点,后者有利于在本发明提供的方法中亚克隆用于装配的不同的DNA片段。输入载体进一步包含一个或两个可退火接头序列,或者一个可退火接头序列和一个引物结合片段,侧邻于限制性酶切位点。输入载体进一步包含额外的一对限制性酶切位点位于DNA片段的外侧,例如,在所述一个或两个可退火接头序列或者所述可退火接头序列和引物结合片段的外侧。从而,在一些实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,和限制性酶切位点RB。在其它实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB。在其它实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,引物结合片段PA或者可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,引物结合片段PB或者可退火接头序列LB,和限制性酶切位点RB。
[0153] 在一些实施方式里,输入载体的DNA片段D的序列是lac Z报告基因。lacZ报告基因用于通过蓝/白筛选来区分于转化了包含lacZ之外的DNA片段的载体克隆,例如,在制备本文所描述的装配载体的过程中。
[0154] 在一些实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,和限制性酶切位点RB(即,
[0155] 5’-RA-LA-RY-D-RZ-RB-3’)。在一些实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB(即,
[0156] 5’-RA-RY-D-RZ-LB-RB-3’)。在一些实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB(即,5’-RA-LA-RY-D-RZ-LB-RB-3’)。在一些实施方式里,输入载体是环形多核苷酸并以5’至
3’方向包含:限制性酶切位点RA,引物结合片段PA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可退火接头序列LB,和限制性酶切位点RB(即,
[0157] 5’-RA-PA-RY-D-RZ-LB-RB-3’)。在一些实施方式里,输入载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,引物结合片段PB,和限制性酶切位点RB(即,5’-RA-LA-RY-D-RZ-PB-RB-3’)。图1A提供了一个示例性的输入载体。
[0158] 引物结合片段可以是与用于制造装配好的多核苷酸的任意可退火接头序列不互补的任何核苷酸序列。在一些实施方式里,两个引物结合片段包括限制性内切酶识别和切断位点。在一些实施方式里,引物结合片段仅仅是不用于特定的装配反应接头序列。在一些实施方式里,引物结合片段PA的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PA和引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在优选实施方式里,PA和PB在序列上是不完全相同的。
[0159] 在一些实施方式里,可退火接头序列LA或LB的核酸序列为至少24个核苷酸并具有至少60℃的Tm。在一些实施方式里,可退火接头序列LA的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。
[0160] 限制性酶切位点RY和RZ可用作克隆位点以引入各种DNA片段,从而产生装配载体。在一些实施方式里,RY和RZ在序列上不相同。在一些实施方式里,RY和RZ可以被相同的限制性内切酶切断。在一些实施方式里,RY和RZ在序列上相同。在一些实施方式里,限制性酶切位点RY和RZ可以被产生交错末端的限制性内切酶切断,即,末端具有5’或3’突出。在其它实施方式里,限制性酶切位点RY和RZ可以被产生平末端的限制性内切酶切断。
[0161] 尽管限制性酶切位点RY和RZ可以是本领域已知的任何限制性酶切位点,被IIS型限制性内切酶识别的限制性酶切位点尤其有用。IIS型限制性内切酶具有与其切断区域不同的DNA结合区域。因此,它们识别一个特定的序列但是在一定距离之外切断。例如,IIS型限制性内切酶SchI(也称为MlyI)结合包含序列GAGTC的识别位点,而切断距离识别位点四个(4)碱基对处,形成平末端DNA分子。IIS型限制性酶切位点在由输入载体制备装配载体时尤其有用。例如,在这样的亚克隆过程中,其中输入载体的DNA片段,例如lacZ,用感兴趣的DNA片段代替,则具有IIS型限制性内切酶的lacZ的切除能够导致该限制性酶切位点识别序列的完全移除。从而,在连接所述感兴趣的DNA片段和线形化输入载体之后,可退火接头序列或者引物结合片段与新引入的DNA片段之间的额外序列是最小的。
[0162] 因此,在一些实施方式里,限制性酶切位点RY和RZ是本领域已知的任何IIS型限制性内切酶能够识别和切断的限制性酶切位点。合适的IIS型限制性内切酶包括但不限于下列核酸内切酶及其同裂酶,以字母顺序排列:Alw26I(BsmAI),AlwI(AclWI,BinI),AsuHPI(HphI),BbvI(Bst71I),BcefI,BstF5I(BseGI,FokI),FauI,HgaI,SapI(LguI),MboII,PleI,SapI,SchI(MlyI),SfaNI,和 TspRI,AceIII,BbsI(BbvII,BpiI,BpuAI),Bce83I,BciVI,BfiI(BmrI),BpmI(GsuI),BsaI(Eco31I),BseRI,BsgI,BsmBI(Esp3I),BsmFI,BspMI,BsrDI(Bse3DI),Bsu6I(Eam1104I,EarI,Ksp632I),Eco57I,FauI,MmeI,RleAI,TaqII,和Tth111II。在特别的实施方式里,限制性酶切位点RY和RZ能够被SchI限制性内切酶识别和切断。
[0163] 在一些实施方式里,RA和RB在序列上不相同。在一些实施方式里,RA和RB可以被相同的限制性内切酶切断。在一些实施方式里,RA和RB在序列上相同。在一些实施方式里,限制性酶切位点RA和RB可以被产生交错末端的限制性内切酶切断,即,末端具有5’或3’突出。在其它实施方式里,限制性酶切位点RA和RB可以被产生平末端的限制性内切酶切断。
[0164] 尽管限制性酶切位点RA和RB可以是本领域已知的任何限制性酶切位点,在一种或多种生物的DNA(例如,cDNA)内相对不频繁的限制性酶切位点(即,不常见切断点)尤其有用。在一些实施方式里,限制性酶切位点RA和RB被在人类DNA中相对不频繁的限制性酶切位点的限制性内切酶识别和切断。在一些实施方式里,限制性酶切位点RA和RB被在鼠DNA中相对不频繁的限制性酶切位点的限制性内切酶识别和切断。在一些实施方式里,限制性酶切位点RA和RB被在酵母DNA中相对不频繁的限制性酶切位点的限制性内切酶识别和切断,例如,在Saccharomyces cerevisiae,Pichia pastoris,Kluyveromyces lactis,Arxula adeninivorans,或者Hansenula polymorpha的DNA中。在一些实施方式里,限制性酶切位点RA和RB被在细菌DNA中几乎没有限制性酶切位点的限制性内切酶识别和切断,例如,在Escherichia coli或者Bacillus subtilis的DNA中。
[0165] 在一些实施方式里,限制性酶切位点RA和RB被IIS型限制性内切酶识别和切断,其识别位点是例如包含PA/LA-D-PB/LB的多核苷酸序列的末梢。在一些实施方式里,限制性酶切位点RA和RB各自独立的可以被选自下列的限制性内切酶切断:MssI,NruI(Bsp68I,MluB2I,Sbo13I,SpoI),SnaBI(BstSNI,Eco105I),SrfI, 和 SwaI(BstRZ246I,BstSWI,MspSWI,SmiI),HpaI,HincII,PshAI,OliI,AluI,Alw26I,BalI,DraI,DpnI,Ec和47III,Ec和CRI,Ec和V,FokI,HaeIII,HincII,MboI,MspA1I,NaeI,RsaI,PvuII,ScaI,SmaI,SspI,StuI,XmnI,EcaBC3I,SciI,HincII,DraI,BsaBI,Cac8I,Hpy8I,MlyI,PshAI,SspD51,BfrBI,BsaAI,BsrBI,BtrI,CdiI,CviJI,CviRI,Eco47III,Eco78I,EcoICRI,FnuDII,FspAI,HaeI,LpnI,MlyI,MslI,MstI,NaeI,NlaIV,NruI,NspBII,OliI,PmaCI,PshAI,PsiI,SrfI,StuI,XcaI,XmnI,ZraI,及其同裂酶。在一个特别的实施方式里,限制性酶切位点RA和RB被SapI或LguI限制性内切酶识别并切断。LguI是SapI的同裂酶,具有相同的识别和切断特异性。
[0166] 在一些实施方式里,本发明提供的输入载体也包含一个或多个在载体的复制,保持,或整合(例如,复制起点)中起作用的核酸序列,以及一个或多个选择性标记。复制起点是一种独特的多核苷酸,包含多个短重复序列并可以被多亚基起始结合蛋白所识别,从而在装配DNA复制酶在起始位点起着关键性作用。本发明提供的输入载体和装配载体中使用的合适的复制起点包括但不限于E.coli oriC,colE1质粒origin,2μ和ARS(均用于酵母系统),sfl,SV40EBV oriP(用于哺乳动物系统),或者在pSC101中发现的这些。选择性标记是载体中的有用元件,因为它们提供促进或抑制细胞生长而筛选成功转化了包含选择性标记的载体并表达该标记的细胞的方法。
[0167] 在一些实施方式里,任何载体均可用于构建本发明提供的输入载体。特别是,本领域已知的载体和商业上可获得的载体(及其变体或衍生物)可以被加工为包括限制性酶切位点RA,可选的引物结合片段PA或可退火接头序列LA,限制性酶切位点RY,DNA片段D,限制性酶切位点RZ,可选的引物结合片段PB或可退火接头序列LB,和限制性酶切位点RB,以用于本发明提供的方法。这种载体可以例如从以下源获得:Vector Laboratories Inc.,InVitrogen,Promega,Novagen,NEB,Clontech,Boehringer Mannheim,Pharmacia,EpiCenter,OriGenes Technologies Inc.,Stratagene,Perkin Elmer,Pharmingen,Life Technologies,Inc.,和Research Genetics。尤其吸引人的常规载体种类包括真核和/或原核克隆载体,表达载体,融合载体,双杂交或反向双杂交载体,用于不同宿主的穿梭载体,突变载体(mutagenesis vector),转录载体,接受大的插入片段的载体,等等。感兴趣的其它载体包括病毒源载体(M13载体,噬菌体λ载体,腺病毒载体,和反转录病毒载体),高、低和合适拷贝数目的载体,具有兼容性复制子以用于在单一宿主中组合的载体(PACYC184和pBR322)和真核附加体(episomal)复制载体(pCDM8)。
[0168] 在一个特别的实施方式里,用于本发明提供的方法的输入载体是pRYSE载体,其具有SEQ ID NO:207到221的核苷酸序列。图4提供了pRYSE载体的示意图,而pRYSE载体的制备在下文实施例1中描述。
[0169] 5.6装配载体
[0170] 在另一方面,本发明提供了载体,即,装配载体,用于将多种组分多核苷酸装配进入一种或多种装配好的多核苷酸。在一些实施方式里,装配载体是环形多核苷酸并包含选择性标记,复制起点,和DNA片段,该DNA片段侧邻于可退火接头序列、可退火接头序列对或者可退火接头序列/引物结合片段对,并侧邻于一对限制性酶切位点。限制性酶切位点有益于在装配反应中将组分多核苷酸从装配载体骨架上切除出来。因此,在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,引物结合片段PA或可退火接头序列LA,DNA片段D,和限制性酶切位点RB。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,DNA片段D,引物结合片段PB或可退火接头序列LB,和限制性酶切位点RB。在某些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,引物结合片段PA或可退火接头序列LA,DNA片段D,引物结合片段PB或可退火接头序列LB,和限制性酶切位点RB。
[0171] 在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,和限制性酶切位点RB(即,5’-RA-LA-D-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB(即,5’-RA-D-LB-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB(即,5’-RA-LA-D-LB-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,引物结合片段PA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB(即,
5’-RA-PA-D-LB-RB-3’)。在一些实施方式里,装配载体是环形多核苷酸并以5’至3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,引物结合片段PB,和限制性酶切位点RB(即,5’-RA-LA-D-PB-RB-3’)。图1B和图2提供了示例性的装配载体。
[0172] 在一些实施方式里,引物结合片段PA的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PA和引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在优选实施方式里,PA和PB在序列上是不完全相同的。
[0173] 在一些实施方式里,可退火接头序列LA或LB的核酸序列为至少24个核苷酸并具有至少60℃的Tm。在一些实施方式里,可退火接头序列LA的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。
[0174] 在一些实施方式里,RA和RB在序列上不相同。在一些实施方式里,RA和RB可以被相同的限制性内切酶切断。在一些实施方式里,RA和RB在序列上相同。在一些实施方式里,限制性酶切位点RA和RB可以被产生交错末端的限制性内切酶切断,即,末端具有5’或3’突出。在其它实施方式里,限制性酶切位点RA和RB可以被产生平末端的限制性内切酶切断。
[0175] 尽管限制性酶切位点RA和RB可以是本领域已知的任何限制性酶切位点,在一种或多种生物的DNA(例如,cDNA)内相对不频繁出现的限制性酶切位点(即,不常见切断点)尤其有用。在一些实施方式里,限制性酶切位点RA和RB被在人类DNA中相对不频繁出现的限制性酶切位点的限制性内切酶识别和切断。在一些实施方式里,限制性酶切位点RA和RB被在鼠DNA中相对不频繁出现的限制性酶切位点的限制性内切酶识别和切断。在一些实施方式里,限制性酶切位点RA和RB被在酵母DNA中相对不频繁出现的限制性酶切位点的限制性内切酶识别和切断,例如,在Saccharomyces cerevisiae,Pichia pastoris,Kluyveromyces lactis,Arxula adeninivorans,或者Hansenula polymorpha的DNA中。在一些实施方式里,限制性酶切位点RA和RB被在细菌DNA中几乎不存在的限制性酶切位点的限制性内切酶识别和切断,例如,在Escherichia coli或者Bacillus subtilis的DNA中。
[0176] 在一些实施方式里,限制性酶切位点RA和RB被IIS型限制性内切酶识别和切断。IIS型限制性内切酶的示意性实例包括但不限于:MssI,NruI(Bsp68I,MluB2I,Sbo13I,SpoI),SnaBI(BstSNI,Eco105I),SrfI,和SwaI(BstRZ246I,BstSWI,MspSWI,SmiI),HpaI,HincII,PshAI,OliI,AluI,Alw26I,BalI,DraI,DpnI,Ec和47III,Ec和CRI,Ec和V,FokI,HaeIII,HincII,MboI,MspA1I,NaeI,RsaI,PvuII,ScaI,SmaI,SspI,StuI,XmnI,EcaBC3I,SciI,HincII,DraI,BsaBI,Cac8I,Hpy8I,MlyI,PshAI,SspD51,BfrBI,BsaAI,BsrBI,BtrI,CdiI,CviJI,CviRI,Eco47III,Eco78I,EcoICRI,FnuDII,FspAI,HaeI,LpnI,MlyI,MslI,MstI,NaeI,NlaIV,NruI,NspBII,OliI,PmaCI,PshAI,PsiI,SrfI,StuI,XcaI,XmnI,ZraI,及其同裂酶。在一个特别的实施方式里,限制性酶切位点RA和RB被SapI或LguI限制性内切酶识别并切断。
[0177] 优选地,装配载体的DNA片段不包含能切断所述装配载体中RA和RB任一限制性酶切位点的限制性内切酶识别和切断的核酸序列。这使得所述DNA片段在装配反应的第一阶段能保持完整,期间组分多核苷酸被从装配载体骨架中切除出来。在特别的实施例里,所述DNA不含SapI/LguI位点,而RA和RB能被SapI或LguI切断。在将所述DNA片段连接进入输入载体之前或之后,可以通过定点突变(参见Carter,Bi℃hem.J.237:1-7(1986);Zoller和Smith,Methods Enzymol.154:329-50(1987)),盒式诱变,限制性选择诱变(Wells et al.,Gene 34:315-323(1985)),寡核苷酸借到的(定点)诱变,PCR诱变,或其它已知技术可以用于修饰所述DNA片段中的任何序列。
[0178] 在一些实施方式里,本发明提供的装配载体也包含一个或多个在载体的复制,保持,或整合(例如,复制起点)中起作用的核酸序列,以及一个或多个选择性标记。复制起点是独特的多核苷酸,包含多个短重复序列并可以被多亚基起始结合蛋白所识别,从而在装配DNA复制酶在起始位点起关键性作用。本发明提供的输入载体和装配载体中使用的合适的复制起点包括但不限于E.coli OriC,colE1质粒origin,2μ和ARS(均用于酵母系统),sfl,SV40EBV oriP(用于哺乳动物系统),或者在pSC101中发现的这些。选择性标记是载体中的有用元件,因为它们提供通过促进或抑制细胞生长而筛选成功转化了包含选择性标记的载体并表达该标记的细胞的方法。
[0179] 在一些实施方式里,任何载体均可用于构建本发明提供的装配载体。特别是,本领域已知的载体和商业上可获得的载体(及其变体或衍生物)可以被加工为包含限制性酶切位点RA,可选的引物结合片段PA或可退火接头序列LA,DNA片段D,可选的引物结合片段PB或可退火接头序列LB,和限制性酶切位点RB,以用于本发明提供的方法。这种载体可以例如从以下来源获得:Vector Laboratories Inc.,InVitrogen,Promega,Novagen,NEB,Clontech,Boehringer Mannheim,Pharmacia,EpiCenter,OriGenes Technologies Inc.,Stratagene,Perkin Elmer,Pharmingen,Life Technologies,Inc.,和Research Genetics。尤其吸引人的常规载体种类包括真核和/或原核克隆载体,表达载体,融合载体,双杂交或反向双杂交载体,用于不同宿主的穿梭载体,突变载体(mutagenesis vector),转录载体,接受大的插入片段的载体,等等。感兴趣的其它载体包括病毒源载体(M13载体,噬菌体λ载体,腺病毒载体,和反转录病毒载体),高,低和合适拷贝数目的载体,具有兼容性复制子以用于在单一宿主中组合的载体(PACYC184和pBR322)和真核附加体(episomal)复制载体(pCDM8)。
[0180] 装配载体可以由输入载体制备。为了从输入载体制备装配载体,输入载体用一种或多种可以切断RY和RZ限制性内切酶消化,从而线形化所述载体,使其能接受DNA片段。所述DNA片段可以通过标准克隆技术连接进RY和RZ位点以形成本发明的装配载体。例如,所述DNA片段可以从以下途径获得:通过本领域已知的标准程序从克隆DNA(例如,DNA“文库”),通过化学合成,通过cDNA克隆,或者通过基因组DNA克隆,或其片段,从确定的细胞纯化,或通过PCR扩增和克隆。参见,例如,Sambrook et al.,Molecular Cloning,A Laboratory Manual,3d.ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York(2001);Glover,D.M.(ed.),DNA Cloning:A Practical Approach,
2d.ed.,MRL Press,Ltd.,Oxford,U.K.(1995)。
[0181] 装配载体也可以从另一个载体来制备,所述载体不包含可退火接头序列,可退火接头序列对,或者侧邻于DNA片段插入位点的可退火接头序列/引物结合片段对。为了从这样的载体来制备装配载体,所述载体用一种或多种能在适合插入DNA片段的位点切断该载体的限制性内切酶消化,例如在多克隆位点,从而线形化该载体使其能接受DNA片段。要插入的DNA片段可以通过本领域已知的标准过程来获得,例如,克隆,化学合成,或PCR扩增。所述DNA片段包含侧邻于可退火接头序列、可退火接头序列对或者可退火接头序列/引物结合片段对的DNA片段。从而,在一些实施方式里,所述DNA片段以5’至3’方向包含:可退火接头序列LA或者引物结合片段PA,DNA片段D,和可退火接头序列LB或引物结合片段PB(即,5’-LA-D-LB-3’或5’-PA-D-LB-3’或5’-LA-D-PB-3’)。在一些实施方式里,所述DNA片段以5’至3’方向包含:DNA片段D,和可退火接头序列LB或引物结合片段PB(即,
5’-D-LB-3’或5’-D-PB-3’)。在一些实施方式里,所述DNA片段以5’至3’方向包含:可退火接头序列LA或引物结合片段PA,和DNA片段D(即,5’-LA-D-3’或5’-PA-D-3’)。所述DNA片段可以进一步包含一对限制性酶切位点,其侧邻于可退火接头序列、可退火接头序列对或者可退火接头序列/引物结合片段对,并且限制性内切酶切断产生的末端与线形化DNA的片段将要插入的载体所产生的末端相匹配。可选的,所述DNA片段可以在产生时就包含这样的匹配末端而不需要额外的限制性内切酶消化来产生匹配末端。DNA片段与线形化载体连接产生装配载体之后,用于产生匹配末端的限制性酶切位点被保持以作为装配载体的限制性酶切位点RA和RB。或者,所述连接可以移除原始限制性酶切位点但是另外的限制性酶切位点可以出现在线形化的载体中,并作为装配载体的限制性酶切位点RA和RB。
[0182] 下文实施例6提供了从输入载体(即,pRYSE)或者从另一个载体(即,pMULE载体)产生装配载体的示例性方法。
[0183] 5.7可退火接头序列
[0184] 在另一方面,本发明提供了可退火接头序列,其侧邻于位于输入载体和装配载体之内的DNA片段。可退火接头序列在装配反应中提供相邻组分多核苷酸之间的序列重叠,从而起动组分多核苷酸装配进入装配好的多核苷酸。从而,在优选的实施方式里,输入载体和装配载体的可退火接头序列LA和LB被优化以在装配反应期间为互补可退火接头序列提供有效和准确的引发。
[0185] 在一些实施方式里,可退火接头序列的长度足够长以提供与其互补可退火接头序列的足够特异性,同时足够短以在装配反应的退火温度下能容易地退火。在一些实施方式里,可退火接头序列的长度是足够长以允许宿主细胞介导的与互补可退火接头序列之间的同源重组。
[0186] 在一些实施方式里,可退火接头序列为大约5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,或80个核苷酸长度。在一些实施方式里,可退火接头序列为至少10,12,14,
16,18,20,22,24,26,28,或30个核苷酸长度。在一些实施方式里,可退火接头序列为大于
30,40,50,60,70,80,90,100,500,1000,5000,或10,000个核苷酸长度。在一些实施方式里,可退火接头为至少18和核苷酸长度并且是可以被3整除的数字,从而当连接在编码DNA片段中时,能便于通读接头的转录物。在特别的实施方式里,可退火接头是18,21,24,27,
30,33,36,39,42,45,48,51,54,57,或60个核苷酸长度。
[0187] 在一些实施方式里,可退火接头序列具有相对高的解链温度(Tm),即,在该温度下退火的可退火接头序列双链体的一半将分离以成为单链。可退火接头的Tm可以根据SantaLucia,PNAS,95:-1460-1465(1998)用最接近邻居算法计算得出。相对高的Tm可以在装配反应中提供更高特异性的配对。相对高的Tm也可以允许PCR的退火和延伸步骤的组合,或者减少调整PCR的退火和延伸步骤之间的温度所需要的时间的量,从而使用本发明的装配方法具有更高的效率。因此,在一些实施方式里,可退火接头序列双链体具有大约60℃-80℃的Tm。在一些实施方式里,可退火接头序列双链体具有大约65℃-75℃的Tm。在一些实施方式里,可退火接头序列双链体具有大于50℃,55℃,6℃,65℃,70℃,75℃,80℃,
85℃,或90℃的Tm。
[0188] 在一些实施方式里,可退火接头序列在本文描述的方法的条件下不通过分子内(即,在相同分子内)作用形成明显的二级结构(例如,发卡,自二聚体),在DNA水平或RNA水平或DNA和RNA水平均如此。DNA出现二级结构会导致装配反应产生很少或没有产生装配好的多核苷酸。RNA出现二级结构会导致翻译效率降低,当退火接头序列用于将包含启动子和蛋白质编码序列的组分多核苷酸装配为装配好的多核苷酸时,可退火接头序列位于启动子和蛋白质编码序列之间,这时候RNA的二级结构尤其具有重要影响。从而,用于本发明的装配方法的可退火接头序列被设计为不形成RNA和/或DNA二级结构。可退火接头序列形成RNA或DNA二级结构的能力可以使用软件工具来确定,例如,IDT Oligo Analyzer(Integrated DNA Technologies,Coralville,IA),mFold(Zuker 2003 Nucleic Acids Res.31(13),3406-15),或 RNAfold(Hofacker & Stadler(2006)Bioinformatics22(10):1172-6)。通常来说,这些工具计算序列从线形转变为折叠状态的吉布斯自由能(ΔG)。ΔG越大,则该序列越不会形成二级结构。从而,在一些实施方式中,可退火接头序列被设计为具有从线形转变为折叠状态的大的ΔG值。在一些实施方式里,可退火接头序列设计为从线形转变为折叠状态的ΔG值等于或大于Saccharomyces cerevisiae基因组中高表达基因的编码序列的直接上游的n个碱基由线形转变为折叠状态的ΔG值,其中n表示可退火接头序列中的碱基数目的整数。在一些实施方式里,可退火接头序列为36个碱基长度并具有从线形转变为折叠状态的ΔG值为-1或更大。
[0189] 在一些实施方式里,可退火接头序列被设计为避免不希望出现的分子间作用(即,在不同分子间)。从而,在一些实施方式里,可退火接头序列基本上不与包含可退火接头序列的装配载体(例如,载体骨架序列)的其它任何序列退火,和/或不与在本发明提供的多核苷酸装配方法所需要的互补可退火接头序列之外的装配组合物的其它载体退火。在一些实施方式,可退火接头序列基本上不与本发明提供的装配组合物的装配载体中的其它可退火接头序列退火。
[0190] 在一些实施方式里,可退火接头序列具有高G-C含量,即,可退火接头序列中乌嘌呤和胞嘧啶的数量占可退火接头序列中碱基总数的百分比高。具有高G-C含量的可退火接头序列通常在本发明的方法中很有用,因为高G-C含量通常提供了高Tm,后者从而可以在装配反应中提供更高特异性的配对,并且允许SOE/PCR的退火和延伸步骤的组合,从而节约时间和程序。在一些实施方式里,可退火接头序列的G-C含量在大约20-80%之间。在一些实施方式里,可退火接头序列的G-C含量在大约40-60%之间。在一些实施方式里,可退火接头序列的G-C含量为大约40,45,50,55,60或70%。在特定的实施方式里,可退火接头序列具有大于70%的G-C含量。SEQ IDNO:1-8是具有高G-C含量且不形成明显二级DNA结构,并具有70℃或更高Tm的可退火接头序列的示意性实例。
[0191] 在一些实施方式里,可退火接头序列具有高A-T含量,即,可退火接头序列中腺嘌呤和胸腺嘧啶的数量占可退火接头序列中碱基总数的百分比高。高的A-T含量可以减小可退火接头序列形成二级结构的倾向,这在可退火接头序列用于将包含启动子和蛋白质编码序列的组分多核苷酸装配为装配好的多核苷酸的过程中尤其有用,其中可退火接头序列位于所述启动子和蛋白质编码序列之间。在一些实施方式里,可退火接头序列的A-T含量在大约20-80%之间。在一些实施方式里,可退火接头序列的A-T含量在大约40-60%之间。在一些实施方式里,可退火接头序列的A-T含量为大约30,35,40,45,50,55,或60%。在一些实施方式里,可退火接头序列具有大于30%的A-T含量。在一些实施方式里,可退火接头序列的最3’端的26个碱基的序列符合下列共有基序:
[0192] 5’-ANNNNNNNNANNNAANTANNTTNANA-3’,其中A代表腺嘌呤,N代表任意核苷酸,T代表胸腺嘧啶。该共有基序在Saccharomyces cerevisiae基因组中高表达基因的起始密码子的上游26个碱基出频繁出现。SEQ ID NO:9-23是包含该共有基序,具有相对高的A-T含量,不形成明显的RNA或DNA二级结构,并具有60℃或更高的Tm的可退火接头序列的示意性实例。
[0193] 在一些实施方式里,可退火接头序列包含一个或多个限制性酶切位点。可退火接头序列中含有限制性酶切位点使得从输入或装配载体中切除DNA片段的同时能将限制性酶切位点RA和RB保持在输入载体或装配载体之中。可退火接头序列的限制性酶切位点有利于正向克隆DNA片段进入其它输入或装配载体。这一特征有利于高效构建包含同样的DNA片段但是具有不同可退火接头序列对或者引物结合片段/可退火接头序列对的装配载体,例如,以产生包含下文所述的不同可退火接头序列的装配载体的文库。这一特征也可以在构建包含所述DNA片段的其它装配载体时避免需要再扩增和测序该DNA片段。从而,在一些实施方式里,可退火接头序列包含独特的限制性酶切位点。在一些实施方式里,所述限制性酶切位点是7碱基对限制性酶切位点,即,它可以被识别7碱基对核酸序列的限制性内切酶切断。在一些实施方式里,所述限制性酶切位点是8碱基对限制性酶切位点。在特别的实施方式里,可退火接头序列内的限制性酶切位点可以被MreI,FseI,SbfI,AsiSI,NotI,AscI,或BbvCI识别和切断。
[0194] 在一些实施方式里,可退火接头序列包含使其在连接至编码DNA片段后能通读转录物的序列。在一些实施方式里,可退火接头序列允许以5’至3’和3’至5’方向通读转录物。在这些实施方式里,可退火接头序列的长度优选地为被三(3)整除的数目的核苷酸。
[0195] 在特别的实施方式里,可退火接头序列不包含在Escherichia coli(E.coli)或者Saccharomyces cerevisiae(S.cerevisiae)中的稀有密码子。E.coli或S.cerevisiae中异源基因的有效表达可以被不常见密码子负面影响,而当稀有密码子被更常见密码子取代时,异源蛋白的表达水平通常会提高。参见,例如,Williams et al.,Nucleic Acids Res.16:10453-10467,1988和Hoog et al.,Gene 43:13-21,1986。从而,包含读通序列的可退火接头序列优选不包含E.coli或S.cerevisiae中的稀有密码子,以便于包含可退火接头序列的装配好的多核苷酸编码的蛋白质的有效表达。
[0196] 在一些实施方式里,可退火接头序列系列是即将进入的宿主生物中没有的独特序列。在一些实施方式里,可退火接头序列系列是在E.coli中没有的独特序列。在其它实施方式里,可退火接头序列系列是在S.cerevisiase中没有的独特序列。
[0197] 在一些实施方式里,合适的可退火接头序列在测试性装配好的多核苷酸里鉴别。测试性装配好的多核苷酸包含要测试的可退火接头序列和允许可退火接头序列测试的其它元件。例如,为了测试可退火接头是否适合装配包含启动子序列的第一组分多核苷酸和包含要在装配好的多核苷酸中处于所述启动子控制之下的蛋白质编码序列的第二组分多核苷酸,可以从第一组分多核苷酸和第二组分多核苷酸来装配测试性装配好的多核苷酸,其中所述第一组分多核苷酸以5’至3’方向包含:引物结合片段或可退火接头序列,包含启动子的DNA片段,和要测试的可退火接头序列,而所述第二组分多核苷酸以5’至3’方向包含:要测试的可退火接头序列,编码报告基因(例如,绿色荧光蛋白(GFP))的DNA片段,和引物结合片段或可退火接头序列。测试性装配好的多核苷酸可以在体内或体外测试其表达报告基因的效率。可以装配相似的测试性多核苷酸以测试用于装配包含含其它元件的DNA片段的组分多核苷酸的可退火接头序列的合适性,所述其它元件例如增强子,终止子,聚-A尾,核定位信号,mRNA稳定化信号,选择性标记,表位标签编码序列,降解信号,等等。测试性装配好的多核苷酸可以包含额外的组分多核苷酸,后者使允许测试例如基因组靶向序列和选择性标记,它们使得可以在体内测试中将测试性装配好的多核苷酸引入宿主细胞并筛选阳性转化株。
[0198] 表1展示了根据SEQ ID NO:1-23的示例性可退火接头序列的Tm,限制性酶切位点,和通读氨基酸。
[0199]
[0200] 5.8文库
[0201] 在另一方面,本发明提供包了含多种装配载体的文库。该文库能有利于将多种组分多核苷酸高效装配进一个或多个装配好的多核苷酸并在原核或真核细胞中起作用,从而有利于产生独特的生物,例如,细菌或酵母的重组株,而不需要使用耗费时间的基于限制性内切酶和连接酶的克隆技术。本发明提供的装配方法和组合物有利于在表达构建体中的有效替换或引入功能性DNA单位,例如启动子、增强子、复制起点等等,从而能提供宿主生物体内的表达构建体的复制和/或表达的有效优化。
[0202] 所述文库可以包含在单一组合物或容器内装配的多种装配载体,例如,包含适合实现本发明提供的装配方法的组合物。可选地,所述文库可以包含不在同一组合物或容器内装配的多种装配载体。在一些实施方式里,所述文库包含至少3、至少6、至少10、至少20、至少50、或者多于50种装配载体,每种分别包含DNA片段。
[0203] 在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体分别以5’至3’方向包含:第一限制性酶切位点RA,DNA片段D,可退火接头序列LB,和第二限制性酶切位点RB。在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体分别以5’至3’方向包含:第一限制性酶切位点RA,引物结合片段PA或第一可退火接头序列LA,DNA片段D,和第二限制性酶切位点RB。在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体分别以5’至3’方向包含:第一限制性酶切位点RA,第一可退火接头序列LA,DNA片段D,可退火接头序列LB或引物结合片段PB,和第二限制性酶切位点RB。在一些实施方式里,所述文库的每种载体中的可退火接头序列对或可退火接头序列/引物结合片段对不包含相同序列。在一些实施方式里,每种装配载体中的可退火接头序列LA和/或LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,每种装配载体中的引物结合片段PA或PB的核酸序列选自SEQ ID NO:24和25。
[0204] 在一些实施方式里,所述文库包含下列载体的每种的至少一种:
[0205] (a)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;
[0206] (b)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;和[0207] (c)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,和限制性酶切位点RB0。
[0208] 在一些实施方式里,所述文库包含下列载体的每种的至少一种:
[0209] (a)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA,引物结合片段PA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;
[0210] (b)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,可退火接头序列LB,和限制性酶切位点RB;和[0211] (c)由环形多核苷酸组成的载体,该多核苷酸以5’到3’方向包含:限制性酶切位点RA,可退火接头序列LA,DNA片段D,引物结合片段PB,和限制性酶切位点RB0。
[0212] 在一些实施方式里,引物结合片段PA的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PA和引物结合片段PB的核酸序列选自SEQ ID NO:24和25。
[0213] 在一些实施方式里,所述文库的任何可退火接头序列LA和任何可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,所述文库的至少一个可退火接头序列LA和至少一个可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,所述文库的每个可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。
[0214] 在一些实施方式里,DNA片段D包含选自下列的核酸序列:选择性标记,启动子,基因组靶向序列,编码表位标签的核酸序列,编码感兴趣的基因的核酸序列,编码终止密码子的核酸序列,和lacZ。
[0215] 在一些实施方式里,所述文库包含下列核酸分子每种的至少一种:
[0216] (a)第一核酸分子,其中所述第一核酸分子为环形并以5’至3’的方向包含:第一限制性酶切位点RA0,选自组D0的任何DNA片段,可退火接头序列LB0,和第二限制性酶切位点RB0;
[0217] (b)中间核酸分子,其中所述中间核酸分子n为环形并以5’至3’的方向包含:第一限制性酶切位点RAn,第一可退火接头序列LAn,选自组Dn的任何DNA片段,第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n代表从1到中间核酸分子数目的整数;和[0218] (c)最后核酸分子,其中每个最后核酸分子为环形的并以5’至3’的方向包含:第一限制性酶切位点RAm、第一可退火接头序列LAm、选自组Dm的任何DNA片段、第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数;
[0219] 其中切断RA0至RBm的限制性酶切位点,变性所获得的线形核酸分子之后,每个可退火接头序列LB(p-1)能够与可退火接头序列LAp的互补物杂交,其中n是在1到(m-1)范围内的整数,其中p表示一个从1到m的整数,并且其中每个组D0,...Dn,...Dm独立地由一个或多个DNA片段组成。在一些实施方式里,第一核酸分子进一步包含引物结合片段PA位于选自D0的DNA片段的5’位置。在一些实施方式里,最后核酸分子进一步包含引物结合片段PB位于选自Dm的DNA片段的3’位置。
[0220] 在一些实施方式里,切断RA0至RBm的限制性酶切位点,变性所获得的线形核酸分子之后,与组分组合物中的其它可退火接头序列和其互补物相比,每个可退火接头序列LB(p-1)能够选择性地与可退火接头序列LAp的互补物杂交。在一些实施方式里,每个可退火接头序列LB(p-1)在序列上与可退火接头序列LAp相同。
[0221] 在一个特别的实施方式里,RA0到RBm的限制性酶切位点可以被相同的限制性内切酶切断,以利于从装配载体中切除组分多核苷酸。在一些实施方式里,RA0到RBm的限制性酶切位点可以被SapI和LguI限制性内切酶切断。
[0222] 在一些实施方式里,引物结合片段PA的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,引物结合片段PA和引物结合片段PB的核酸序列选自SEQ ID NO:24和25。在优选实施方式里,引物结合片段PA和引物结合片段PB的核酸序列不相同。
[0223] 在一些实施方式里,所述文库的任何可退火接头序列LA和任何可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,所述文库的至少一个可退火接头序列LA和至少一个可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,所述文库的每个可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,所述组合物中的每个可退火接头序列LA的核酸序列是彼此不同的。在一些实施方式里,所述组合物中的每个可退火接头序列LB的核酸序列是彼此不同的。
[0224] 在一个特别的实施方式里,所述文库包含下列核酸分子:
[0225] (a)两种第一核酸分子,其中一种第一核酸分子以5’至3’方向包含:第一限制性酶切位点RA0,引物结合片段PA,DNA片段D01,可退火接头序列LB0,和第二限制性酶切位点RB0,其中另一种第一核酸分子以5’至3’方向包含:第一限制性酶切位点RA0,引物结合片段PA,DNA片段D02,可退火接头序列LB0,和第二限制性酶切位点RB0,其中DNA片段D01编码第一基因组靶向序列,其中DNA片段D02编码在靶向基因组中位于第一基因靶向序列下游的第二基因组靶向序列,其中DNA片段D02和DNA片段D01位于相对引物结合片段PA和可退火接头序列LB0相反的方向;
[0226] (b)至少一种中间核酸分子,以5’至3’方向包含:第一限制性酶切位点RAn,第一可退火接头序列LAn,DNA片段Dn,第二可退火接头序列LBn,和第二限制性酶切位点RBn,其中n表示从1到中间核酸分子数目的整数;和
[0227] (c)两种最后核酸分子,其中一种最后核酸分子以5’至3’方向包含:第一限制性酶切位点RAm,可退火接头序列LAm,DNA片段Dm1,引物结合片段PB,和第二限制性酶切位点RBm,其中另一种最后核酸分子以5’至3’方向包含:第一限制性酶切位点RAm,可退火接头序列LAm,DNA片段Dm2,引物结合片段PB,和第二限制性酶切位点RBm,其中m表示比中间核酸分子数目大1的整数,其中DNA片段Dm1编码选择性标记的第一片段,其中DNA片段Dm2编码选择性标记的第二片段,其中DNA片段Dm2DNA片段Dm1位于相对于可退火接头序列LAm和引物结合片段PB相反的方向,其中DNA片段Dm1n和DNA片段Dm2均产生非功能性选择性标记,但是在经过同源重组之后DNA片段Dm1n和Dm2产生功能性标记;
[0228] 其中每个可退火接头序列LB(p-1)分别与可退火接头序列LAp相同,其中p表示从1到m的整数。
[0229] 在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体包含相同的可退火接头序列,可退火接头序列对或可退火接头序列/引物结合片段对,但是在序列上与其对应的DNA片段D不同。
[0230] 在其它实施方式里,所述文库包含多种装配载体,其中每种装配载体包含相同的DNA片段D,其侧邻于独特的可退火接头序列,可退火接头序列对或可退火接头序列/引物结合片段对。这种文库可以有利于相对于装配进入装配好的多核苷酸的其它DNA片段,将DNA片段D快速装配进入特定的位置或方向。
[0231] 在一些实施方式里,所述文库的成员包含具有共有结构或功能性特征的DNA片段。例如,文库可以包含含有同样的功能性DNA单位的多种装配载体。示例性功能性DNA单位包括但不限于蛋白质编码序列,报告基因,荧光标记,启动子,增强子,终止子,内含子,外显子,聚-A尾,多克隆位点,核定位信号,核输出信号,mRNA稳定化信号,选择性标记,整合位点,表位标签,和降解信号。在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体包含相同的启动子。所述装配载体可以包含本领域已知的任何原核或真核启动子序列。示例性的真核启动子包括但不限于金属硫蛋白启动子,组成型腺病毒主要晚期启动子(constitutive adenovirus major late promoter),地塞米松诱导的MMTV启动子,SV40启动子,MRPpolIII启动子,组成型MPSV启动子,RSV启动子,四环素诱导的CMV启动子(例如人即刻早期CMV启动子),和组成型CMV启动子。在特别的实施方式里,装配载体包含酵母启动子序列。示例性的酵母启动子包括但不限于PGAL3,PGAL7,PCTR3,PMET3,PPGK1,PTDH1,PTDH3,PFBA1,PTEF1,PENO1,PENO2,PCYC1,PTDH2,PCUP1,PGAL80,PGAL2,PBNA6,PTMA29,PSBP1,PPUP3,PACS2,PTPO1,PRPT1,PAAT2,PAHP1,PSSE1,PTEF2,PNPL3,PPET9,PTUB2,POLE1,PCPR1,PIPPP1,和PSOD1。
[0232] 在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体包含相同的终止子序列。所述装配载体可以包含本领域已知的任何原核或真核终止子序列。在特别的实施方式里,装配载体包含酵母终止子序列。示例性的酵母终止子包括但不限于TADH1,TENO1,TENO2,TCYC1,TNDT80,TTDH3,TTDH1,和TPGK1。
[0233] 在一些实施方式里,所述文库包含多种装配载体,其中每种装配载体包含相同的选择性标记序列。所述装配载体可以包含本领域已知的任何原核或真核选择性标记。示例性的选择性标记包括但不限于抗生素抗性标记(例如,卡那霉素、氨苄青霉素、氯霉素、庆大霉素或三甲氧苄二氨嘧啶的抗性编码基因)和代谢标记(例如,氨基酸合成基因或转移RNA基因)。
[0234] 5.9试剂盒
[0235] 在另一方面,本发明提供了用于装配多核苷酸的试剂盒,所述试剂盒包含下列中的两个或更多:(a)一种或多种本文所述的输入载体;(b)能切断所述一种或多种输入载体的限制性酶切位点RA和RB的一种或多种限制性内切酶;(c)能切断所述一种或多种输入载体的限制性酶切位点RY和RZ的一种或多种限制性内切酶;和(d)能与所述一种或多种输入载体的引物结合片段退火的寡核苷酸引物引物。
[0236] 在一些实施方式里,所述试剂盒的每种输入载体的限制性酶切位点RA和RB被SapI限制性内切酶识别和切断,而所述试剂盒包含SapI限制性内切酶。在一些实施方式里,所述试剂盒的每种输入载体的限制性酶切位点RY和RZ被SchI(或MlyI)限制性内切酶识别和切断,而所述试剂盒包含SchI(或MlyI)限制性内切酶。
[0237] 在一些实施方式里,所述试剂盒中的一种或多种输入载体的引物结合片段PA的核酸序列选自SEQ ID NO:24和25。在一些实施方式里,所述试剂盒中的一种或多种输入载体的引物结合片段PB的核酸序列选自SEQ IDNO:24和25。在优选实施方式里,引物结合片段PA和引物结合片段PB的核酸序列不相同。
[0238] 在一些实施方式里,所述试剂盒中的一种或多种输入载体的可退火接头序列LA的核酸序列选自SEQ ID NO:1-23。在一些实施方式里,所述试剂盒中的一种或多种输入载体的可退火接头序列LB的核酸序列选自SEQ IDNO:1-23。在一些实施方式里,所述试剂盒中的所有输入载体的可退火接头序列LA和可退火接头序列LB的核酸序列选自SEQ ID NO:1-23。
[0239] 在一些实施方式里,所述试剂盒包含pRYSE载体#1,其序列在本文中提供为SEQ ID NO:221。在一些实施方式里,所述试剂盒包含pRYSE载体#2,其序列在本文中提供为SEQ ID NO:207。在一些实施方式里,所述试剂盒包含pRYSE载体#3,其序列在本文中提供为SEQ ID NO:208。在一些实施方式里,所述试剂盒包含pRYSE载体#4,其序列在本文中提供为SEQ ID NO:209。在一些实施方式里,所述试剂盒包含pRYSE载体#5,其序列在本文中提供为SEQ ID NO:210。在一些实施方式里,所述试剂盒包含pRYSE载体#6,其序列在本文中提供为SEQ ID NO:211。在一些实施方式里,所述试剂盒包含pRYSE载体#7,其序列在本文中提供为SEQ ID NO:212。在一些实施方式里,所述试剂盒包含pRYSE载体#8,其序列在本文中提供为SEQ ID NO:213。在一些实施方式里,所述试剂盒包含pRYSE载体#9,其序列在本文中提供为SEQ ID NO:214。在一些实施方式里,所述试剂盒包含pRYSE载体#10,其序列在本文中提供为SEQ ID NO:215。在一些实施方式里,所述试剂盒包含pRYSE载体#11,其序列在本文中提供为SEQ ID NO:216。在一些实施方式里,所述试剂盒包含pRYSE载体#12,其序列在本文中提供为SEQ ID NO:217。在一些实施方式里,所述试剂盒包含pRYSE载体#13,其序列在本文中提供为SEQ ID NO:218。在一些实施方式里,所述试剂盒包含pRYSE载体#14,其序列在本文中提供为SEQ ID NO:219。在一些实施方式里,所述试剂盒包含pRYSE载体#15,其序列在本文中提供为SEQ ID NO:220。
[0240] 在一些实施方式里,所述试剂盒进一步包含使用本文所描述的多核苷酸装配方法的说明书。在一些实施方式里,多核苷酸聚合酶,例如耐热DNA聚合酶(例如,Pfu DNA聚合酶),和三磷酸脱氧核糖核苷(dNTPs)也包含在所述试剂盒里。在一些实施方式里,分别包含要装配进入装配好的多核苷酸的组分多核苷酸的两种或更多装配载体可以由所述试剂盒提供。例如,可以提供装配载体可以包含用于标定和/或作为阳性对照使用的组分多核苷酸,以鉴别所述试剂盒的正确操作。其它实例包括但不限于包含如下组分多核苷酸的装配载体:蛋白质编码序列,报告基因,荧光标记编码序列,启动子,增强子,终止子,外显子,聚-A尾,多克隆位点,核定位信号,mRNA稳定化信号,选择性标记,整合位点,表位标签编码序列,和降解信号。6.实施例
[0241] 本发明由下列实施例来说明,但并不意味着以任何方式限定。实施例中描述的Saccharyomices cerevisiae构建体源于Saccharyomices cerevisiae株CEN.PK2。与Saccharyomices cerevisiae株S288c不同,菌株CEN.PK2的基因组序列是不能公开获得的。所描述的有些构建体是序列证实的,因此所提供的序列是真实的源自CEN.PK2的构建体。对于未序列证实的构建体,所提供的序列是基于菌株S288c公开的基因组序列,因此可能包含与真实的源自CEN.PK2的构建体的序列的多态性差异。
[0242] 实施例1
[0243] 本实施例描述制备pRYSE载体的方法。pRYSE载体以5’至3’方向包含:第一SapI限制性内切酶识别位点,第一可退火接头序列或引物结合片段,第一SchI限制性内切酶识别位点,绿色荧光蛋白(GFP)或lacZ标记基因,第二SchI限制性内切酶识别位点,第二可退火接头序列或引物结合片段,和第二SapI限制性内切酶识别位点。
[0244] 用PCR引物JCB158-17A(SEQ ID NO:227)和JCB158-17B(SEQ ID NO:228)以定点诱变的方式将pUC19的bla基因中的SchI限制性内切酶识别位点从pUC19移除之后,从pUC19载体(GenBank accession L09137)以引物JCB158-17C(SEQ ID NO:229)和JCB158-17D(SEQ ID NO:230)PCR扩增编码β-乳糖酶的DNA片段。PCR产物通过凝胶纯化,然后连接至TOPO载体(Invitrogen,Carlsbad,CA),通过限制性内切酶SphI和MfeI完全消化该构建体之后所述PCR产物被重新释放出来,产生“bla DNA片段”。
[0245] DNA片 段 1040(SEQ ID NO:224)、1041(SEQ ID NO:225)和 1042(SEQ ID NO:226)通过人工合成(Biosearch Technologies,Novato,CA)。DNA片段1040和1041用限制性内切酶BstXI完全消化,每个消化的片段分别连接至2.65kb的载体骨架,所述载体骨架通过用限制性内切酶SacI和KpnI完全切断pAM1466(SEQ ID NO:223;由Biosearch Technologies,Novato,CA人工合成)而产生。1040_pAM1466 DNA构建体用限制性内切酶BsmBI和BstXI完全消化,反应混合物用凝胶电泳拆分,含有1040DNA片段的大约3.5kb的DNA片段通过凝胶纯化。1041_pAM1466 DNA构建体用限制性内切酶BsaI和BstXI完全消化,反应混合物用凝胶电泳拆分,含有1041DNA片段的大约0.9kb的DNA片段通过凝胶纯化。连接纯化得到的DNA片段,产生DNA构建体1040_1041_pAM1466。使用引物JO36(SEQ ID NO:
69)和JO37(SEQ ID NO:70)来产生1040_1041 DNA片段,使用引物JO38(SEQ ID NO:71)和JO39(SEQ ID NO:72)来产生具有与所述1040_1041DNA片段的末端序列相重叠的末端片段的1042DNA片段,使用引物JO39(含有SphI限制性内切酶识别位点)(SEQ ID NO:72)和JO36(包含MfeI限制性内切酶识别位点)(SEQ ID NO:69)来连接这两个PCR产物,通过PCR“缝合”反应而将DNA片段1042连接到DNA构建体1040_1041上。1040_1041_1042PCR产物用SphI和MfeI限制性内切酶完全消化,反应混合物用凝胶电泳拆分,大约2.4kb的
1040_1041_1042 DNA片段用凝胶纯化,纯化的DNA片段连接凝胶纯化的bla片段,产生“1040_1041_1402_bla”DNA构建体。
[0246] 编码GFP基因的1040_1041_1042_bla DNA构建体的片段用PCR引物1和2(见表2)PCR扩增。对于扩增的GFP片段,通过使用在第一轮PCR反应中产生的凝胶提取的GFP片段作为模板、使用PCR引物3和4(见表2)PCR扩增从而将末端SacI和XhoI限制性内切酶识别位点加入所述GFP片段。扩增的PCR产物用凝胶提取,用XhoI和SacI限制性内切酶完全消化,所述限制性内切酶加热至65℃20分钟使其失活,消化后的PCR产物用柱纯化,然后与1040_1041_1042_bla DNA片段经XhoI和SacI限制性内切酶完全消化后通过凝胶纯化的获得的大约2.2kb的DNA片段相连接。获得的载体用PCR引物5和6(见表3)PCR扩增,反应混合物用凝胶电泳拆分,用凝胶纯化大约2.2kb的“pRYSE载体骨架”。
[0247]
[0248]
[0249]
[0250] lacZ基因从pUC19载体使用引物S012(SEQ ID NO:65)和S028(SEQ IDNO:66)PCR扩增,所述引物分别包含SchI限制性内切酶识别位点。反应混合物用凝胶电泳拆分,大约0.5kb的PCR产物用凝胶纯化,纯化的PCR产物与每个pRYSE载体骨架连接。在获得的载体上用PCR引物L012(SEQID NO:231)和L013(SEQ ID NO:232)实行定点诱变以从复制的起始处移除SchI限制性内切酶识别位点。最后,用PCR引物S036(SEQ ID NO:67)和S037(SEQ ID NO:68)实行第二次定点诱变以从lacZ片段中移除SchI限制性内切酶识别位点,从而产生pRYSE载体1到15(见图4的pRYSE载体的质粒图,和SEQ ID NO:207-221的pRYSE
1-15的核苷酸序列)。
[0251] 实施例2
[0252] 本实施例描述制备pRYSE载体的可选方法。
[0253] 用SEQ ID NO:207-221作为模板,可以人工合成制备pYRSE载体1到15(例如,通过Biosearch Technologies,Novato,CA)。用SEQ ID NO:221作为模板,其中的Pme1-5’引物结合片段和/或RYSE 1可退火接头序列变为另一个合适的可退火接头序列或引物结合片段(见表1),可以人工合成制备包含不同的可退火接头序列的其它pRYSE。
[0254] 实施例3
[0255] 本实施例描述制备pMULE载体的方法,所述载体以5’至3’的方向包含:第一SapI限制性内切酶识别位点,第一SchI限制性内切酶识别位点,lacZ标记基因,第二SchI限制性内切酶识别位点,和第二SapI限制性内切酶识别位点。所述pMULE载体用于克隆Mule。
[0256] 用引物K162(SEQ ID NO:109)和K163(SEQ ID NO:110)PCR扩增pRYSE载体8的骨架。反应混合物用凝胶电泳解析,大约2.2kb的载体骨架用凝胶纯化。用SchI限制性内切酶完全消化pRYSE载体而产生包含lacZ基因的DNA片段,加热至65℃20分钟使酶失活,反应混合物用凝胶电泳解析,凝胶纯化大约0.5kb的DNA片段。包含lacZ基因的纯化DNA片段与纯化的载体骨架连接,产生pMULE载体(见图7的质粒图)。
[0257] 实施例4
[0258] 本实施例描述制备“Bit”的方法。“Bit”是可插入pRYSE载体以产生装配载体的DNA片段,所述装配载体包含可以通过本发明公开的方法装配进入装配好的多核苷酸的多核苷酸组分。Bit可以编码感兴趣的基因或遗传元件(例如,启动子,终止子,选择性标记,多克隆位点)。Bit用表4所描述的模板和引物PCR扩增。
[0259]
[0260]
[0261]
[0262]
[0263]
[0264] PCR扩增使用Phusion DNA聚合酶(New England Biolabs,Ipswich,MA)根据生产商建议的流程来进行。PCR结果用凝胶电泳拆分,Bit用凝胶纯化,纯化的Bit用T4多核苷酸激酶(PNK)(New England Biolabs,Ipswich,MA)根据生产商建议的流程来处理。PNK加热至65℃20分钟失活,样品储存在-20℃。
[0265] 实施例5
[0266] 本实施例描述制备“MULE”的方法。MULE是可以插入pMULE载体从而产生装配的载体的DNA片段,所述装配的载体包含可以用本文公开的方法装配进入装配好的多核苷酸的多核苷酸组分。MULE可以编码感兴趣的基因或遗传元件(例如,启动子、终止子、选择性标记、整合位点、表位标签、定位信号、降解信号、荧光标记、多克隆位点),并侧邻于可退火接头序列对或可退火接头序列/引物结合片段对。MULE从模板用引物PCR扩增,所述引物的3’端与目标序列退火,而5’端包含可退火接头序列或引物结合片段(合适的可退火接头序列见表1),如表5所描述。
[0267]
[0268]
[0269]
[0270] PCR扩增使用Phusion DNA聚合酶(New England Biolabs,Ipswich,MA)根据生产商建议的流程来进行。PCR结果用凝胶电泳来分析,MULE用凝胶纯化,纯化的Bit用T4多核苷酸激酶(PNK)(New England Biolabs,Ipswich,MA)根据生产商建议的流程来处理。PNK加热至65℃20分钟失活,样品储存在-20℃。
[0271] 实施例6
[0272] 本实施例描述将Bit插入pRYSE载体或将MULE插入pMULE载体以形成装配载体的方法。
[0273] pRYSE载体1到8和pRYSE载体15用SchI限制性内切酶完全消化,消化的DNA片段用南极磷酸酶(Antarctic Phosphatase)(New England Biolabs,Ipswich,MA)处理。磷酸酶加热至65℃20分钟失活,反应混合物用凝胶电泳解析,大约2.2kb的pRYSE载体骨架(缺少lacZ)用凝胶纯化。纯化的pRYSE载体骨架与表6所描述的Bit连接,以形成装配载体。
[0274] pMULE载体用SchI限制性内切酶完全消化,反应混合物用凝胶电泳解析,大约2.2kb的pMULE载体骨架(缺少lacZ)用凝胶纯化。用磷酸酶(例如南极磷酸酶(New
England Biolabs,Ipswich,MA),CIAP(New England Biolabs,Ipswich,MA),SAP(New England Biolabs,Ipswich,MA;Fermentas,Glen Burnie,MD),或FastAP(Fermentas,Glen Burnie,MD))处理纯化的pMULE载体骨架,磷酸酶加热失活(例如65℃20分钟),pMULE载体骨架与MULE连接,从而形成装配载体。
[0275]
[0276]
[0277] 装配载体转化化学感受态TOP10大肠杆菌亲本细胞(Invitrogen,Carlsbad,CA)。宿主细胞转化体用含100ug/ml羧苄青霉素和40ug/ml X-gal的Luria Bertoni(LB)琼脂进行筛选。单独的白色克隆从LB琼脂转移至含5mL的LB液体培养基和羧苄青霉素的培养试管中,培养液在37℃摇床以250rpm培养过夜。提取质粒DNA,测序以确认克隆含有正确的序列并且方向正确。细胞保存在含有由400uL无菌50%甘油和600uL液体培养基组成的
1mL储存液的-80℃冷冻管里。
[0278] 实旋例7
[0279] 本实施例描述用装配载体和/或MULE将组分多核苷酸装配到装配的多核苷酸中的方法。
[0280] 装配载体(见表7)置于同一个试管中(333fmole的每个RABit)并用LguI限制性内切酶(Fermentas,Glen Burnie,MD)消化。限制性内切酶通过柱浓缩移除或加热至65℃20分钟失活。对涉及MULE或装配的多核苷酸的装配反应,333fmole的MULE或组装的多核苷酸(见表7)置于一个试管中或加入消化的装配载体。样品分为3个30uL反应体系;向每个反应混合物加入水,缓冲液,dNTP,和DNA聚合酶,起始第一个轮PCR扩增。样品置于中,向反应混合物中加入0.5uM的每种末端引物(表7),并进行第二轮PCR扩增。3个PCR反应混合物合并在一个试管,反应混合物用凝胶电泳解析,PCR产物用凝胶纯化。
[0281]
[0282]
[0283] 如图5和6所示,组分多核苷酸2到9被正确的装配进入7.7kb长的装配的多核苷酸。
[0284] 实施例8
[0285] 本实施例描述由本文公开的方法使用装配的多核苷酸来制备遗传改变了的宿主微生物的方法。
[0286] 将Phase I-A和Phase I-B装配的多核苷酸(见表7)克隆进入TOPO Zero Blunt II克隆载体(Invitrogen,Carlsbad,CA),分别产生质粒TOPO-Phase I-A和TOPO-Phase I-B。所述构建体在含50ug/ml卡那霉素的LB琼脂上生长的TOP10细胞(Invitrogen,Carlsbad,CA)中增殖。每个质粒用NotI限制性内切酶完全消化,Phase I-A和Phase I-B插入片段用凝胶纯化试剂盒(Qiagen,Valencia,CA)凝胶提取,等摩尔量的纯化的DNA片段用T4DNA连接酶(New England Biolabs,Ipswich,MA)连接,产生质粒TOPO-Phase I。所述构建体在含50ug/ml卡那霉素的LB琼脂上生长的TOP10细胞(Invitrogen,Carlsbad,CA)中增殖。
[0287] 将Phase II完整装配的多核苷酸(见表7)克隆进入TOPO Zero Blunt II克隆载体(Invitrogen,Carlsbad,CA),产生质粒TOPO-Phase II。所述构建体在含50ug/ml卡那霉素的LB琼脂上生长的TOP10细胞(Invitrogen,Carlsbad,CA)中增殖。
[0288] 将Phase III-A和Phase III-B装配的多核苷酸(见表7)克隆进入TOPOZeroBlunt II克隆载体(Invitrogen,Carlsbad,CA),分别产生质粒TOPO-Phase III-A和TOPO-Phase III-B。所述构建体在含50ug/ml卡那霉素的LB琼脂上生长的TOP10细胞(Invitrogen,Carlsbad,CA)中增殖。每个质粒用BamHI和SbfI限制性内切酶完全消化,Phase III-A和Phase III-B插入片段用凝胶纯化试剂盒(Qiagen,Valencia,CA)凝胶提取,等摩尔量的纯化的DNA片段用T4DNA连接酶(New England Biolabs,Ipswich,MA)连接,产生Phase III完整装配的多核苷酸。将Phase III完整装配的多核苷酸(见表7)克隆进入TOPOZero Blunt II克隆载体(Invitrogen,Carlsbad,CA),产生质粒TOPO-Phase III。
所述构建体在含50ug/ml卡那霉素的LB琼脂上生长的TOP10细胞(Invitrogen,Carlsbad,CA)中增殖。
[0289] 对于酵母细胞转化,25ml的酵母浸出粉胨葡萄糖(YPD)培养基用于培养单个克隆的起始宿主菌株。培养物在30℃和200rpm旋转振荡下生长过夜。测量培养液的OD600,随后用培养液孵育50ml的YPD培养基至OD600达到0.15。新孵育的培养液在30℃和200rpm旋转振荡下生长至OD600达到0.7-0.9,这时候用1μg的DNA转化细胞。然后允许细胞在YPD培养基中恢复4小时,之后平铺在含有鉴别宿主细胞转化体的选择试剂的琼脂上。
[0290] 通过将活性干PE-2酵母(于1994年在Santelisa Vale由 ,Brazil所分离)悬浮于5mL的包含100ug/mL羧苄青霉素和20ug/mL卡那霉素的YPD培养基中而获得起始宿主菌株Y1198。培养物在30℃和200rpm旋转振荡下孵育过夜。然后将10uL培养物平铺于YPD平板上并使其干燥。细胞连续分散为单个克隆,在30℃下孵育2天。挑选12个单个克隆,置于一个新的YPD平板上,30℃生长过夜。克隆菌株的身份通过分析其染色体大小来区分,通过Bio-Rad CHEF DR II系统(Bio-Rad,Hercules,CA)使用Bio-Rad CHEF基因组DNA插头试剂盒(Bio-Rad,Hercules,CA)根据生产商的说明来进行。挑选了一个克隆并作为菌株Y1198保存。
[0291] 菌株Y1661,Y1662,Y1663和Y1664由菌株Y1198通过呈递单倍体菌株而产生。菌株1198在一个滚轮中的玻璃试管中的5mL的YPD培养基中在30℃下生长过夜。测量其OD600,细胞稀释在含2%醋酸的5mL YP培养基中,使其OD600为0.2。培养物在滚轮中的玻璃试管中30℃下生长过夜。测量其OD600,然后通过5000g离心2分钟来收集4OD600*mL的细胞。细胞用无菌水冲洗一次,然后重悬于3mL的含0.02%子糖的2%醋酸钾中。细胞在滚轮中的玻璃试管中在30℃下生长3天。通过显微镜确认孢子形成。33uL培养物转移至1.5mL的微量离心管中,以14000rpm离心2分钟。细胞块重悬于含2uL的10mg/mL酵母裂解酶100T(MPBiomedicals,Solon,OH)的50uL无菌水中,细胞在30℃水浴中孵育10分钟。试管转移至冰上,加入150uL冰冷的水。将10uL混合物加入12mL的YPD平板中,用Singer MSM 300解剖显微镜(Singer,Somerset,UK)分开四分体。YPD平板在30℃下孵育
3天,之后孢子转移至新鲜的YPD平板中,并30℃生长过夜。来自8个四孢子四分体的每个孢子的交配类型用克隆PCR分析。挑选具有2个MATA和2个MATalpha孢子的单独的4孢子四分体,保存为菌株Y1661(MATA),Y1662(MATA),Y1663(MATalpha)和Y1664(MATalpha)。
[0292] 宿主菌株1515通过用PmeI限制性内切酶完全消化的质粒TOPO-Phase I转化菌株Y1664而产生。宿主细胞转化株在含300ug/mL潮霉素B的YPD培养基上筛选。
[0293] 通过用PmeI限制性内切酶完全消化的质粒TOPO-Phase II转化菌株Y1515而产生宿主菌1762。宿主细胞转化株在含100ug/mL诺尔丝菌素的YPD培养基上选择。
[0294] 经过表达质粒pAM404和PmeI限制性内切酶完全消化的质粒TOPO-Phase III两步转化通过菌株Y1762而获得宿主菌1770。表达质粒pAM404源自质粒pAM353,后者通过向pRS425-Gall载体(Mumberg et.al.(1994)Nucl.Acids.Res.22(25):5767-5768)插入编码β-法尼烯合成酶的核苷酸序列而产生。所述核苷酸插入序列可以人工合成,以Artemisia annua(GenBank accession number AY835398)的β-法尼烯合成酶的编码序列为模板,并通过Saccharomyces cerevisiae中表达的密码子优化(SEQ ID NO:121)。所述人工合成的核苷酸序列侧邻5’BamHI和3’XhoI限制性酶切位点,并且因此可以克隆进克隆载体的互补限制性酶切位点例如标准的票UC或pACYC源载体。所述人工合成的核苷酸序列通过DNA合成构建体经BamHI和XhoI限制性内切酶完全消化而分离出来。反应混合物通过凝胶电泳拆分,凝胶回收大约1.7kb的含β-法尼烯合成酶编码序列的DNA片段,分离的DNA片段连接至pRS425-Gall载体的BamHI XhoI限制性酶切位点,产生表达质粒pAM353。编码β-法尼烯合成酶的核苷酸序列从pAM353用引物GW-52-84pAM326 BamHI(SEQ ID NO:188)和GW-52-84pAM326NheI(SEQ ID NO:189)经PCR扩增。得到的PCR产物用BamHI和NheI限制性内切酶完全消化,凝胶电泳回收反应混合物,凝胶提取大约1.7kb的含β-法尼烯合成酶编码序列的DNA片段,分离的DNA片段连接进入载体pAMl78(SEQ ID NO:122)的BamHI NheI限制性酶切位点,产生表达载体pAM404。pAM404的宿主细胞转化株用缺少蛋氨酸和亮氨酸的完全合成培养基(Complete Synthetic Medium,CSM)筛选。pAM404和Phase III完全装配的核苷酸的宿主细胞转化株用缺少蛋氨酸和亮氨酸并含200ug/mL的G418的CSM筛选。
[0295] 宿主菌1793通过URA3敲除构建体(SEQ ID NO:123)转化菌株Y1770而产生。所述敲除构建体用以下方法产生:首先产生DNA片段URA3US(从Saccharomyces cerevisiae菌株CEN.PK2基 因组DNA用 PCR引物KMH33-276-21-URA3 5’.fwd(SEQ ID NO:147)和 KMH34-276-21-URA35’.rev(SEQ ID NO:148) 产 生 ) 和 URA3DS( 从 Saccharomyces cerevisiae菌 株CEN.PK2 基 因 组DNA 用PCR 引 物 KMH35-276-21-URA3 3’.fwd(SEQ ID NO:149)和KMH36-276-21-URA3 3’.rev(SEQ ID NO:150)产生),随后用PCR引物KMH33-276-21-URA3 5’.fwd和KMH36-276-21-URA3 3’.rev将这2个DNA片段缝合在一起。宿主细胞转化株用含5-FOA的YPD培养基筛选。
[0296] 宿主菌株YAAA由Phase I标记循环装配的多核苷酸(见表7)转化菌株Y1793而产生。宿主细胞转化株在缺乏蛋氨酸和尿嘧啶的CSM上筛选。URA3标记通过以下步骤来去除:YPD培养基上30℃并200rpm旋转振荡培养细胞过夜,然后将细胞平铺于含5-FOA的琼脂上。标记去除通过克隆PCR来确认。
[0297] 宿主菌株YBBB由Phase II标记循环装配的多核苷酸(见表7)转化菌株YAAA而产生。宿主细胞转化株在缺乏蛋氨酸和尿嘧啶的CSM上筛选。URA3标记通过以下步骤来去除:YPD培养基上30℃并200rpm旋转振荡培养细胞过夜,然后将细胞平铺于含5-FOA的琼脂上。标记去除通过克隆PCR来确认。
[0298] 宿主菌株Y1912由Phase III标记循环装配的多核苷酸(见表7)转化菌株YBBB而产生。宿主细胞转化株在缺乏蛋氨酸和尿嘧啶的CSM上筛选。URA3标记通过以下步骤来去除:YPD培养基中在30℃并200rpm旋转振荡培养细胞过夜,然后将细胞平铺于含5-FOA的琼脂上。标记去除通过克隆PCR来确认。
[0299] 宿主菌株Y1913由STE5敲除的装配的多核苷酸(见表7)转化菌株Y1912而产生。宿主细胞转化株在缺乏蛋氨酸和尿嘧啶的CSM上筛选。
[0300] 宿主菌株Y1915从菌株Y1913产生,从pAM404中分离菌株Y1913并用IME1敲除的装配的多核苷酸(见表7)转化获得的菌株。菌株Y1913在非选择性YPD培养基中在30℃以200rpm旋转振荡增殖。大约100个细胞平铺在YPD固体培养基上并30℃生长3天,然后重新平铺在缺少蛋氨酸和亮氨酸的CSM平板中,30℃再生长3天。分离的细胞通过其在含亮氨酸的矿物培养基上生长的能力和其在缺乏亮氨酸的培养基上不能生长而被鉴定。一个单独的这种克隆被挑选出来并用IME1敲除的装配的多核苷酸转化。宿主细胞转化体在缺乏蛋氨酸和尿嘧啶的CSM上筛选。
[0301] 实施例9
[0302] 本实施例描述筛选可退火接头序列的方法,所述可退火接头序列用于通过本文描述的发明方法将编码启动子的组分多核苷酸和蛋白编码序列装配进入装配好的多核苷酸。
[0303] 如表8所描述,通过PCR扩增编码启动子并紧随两个不同的候选可退火接头序列(可退火接头序列RYSE 15(R15;SEQ ID NO:15)和可退火接头序列RYSE 7(R7;SEQ ID NO:7))的MULE以及编码GFP并且之前有2个可退火接头序列的MULE。
[0304]
[0305] PCR反应通过凝胶电泳拆分,凝胶纯化MULE,纯化的MULE用于装配测试性的装配好的多核苷酸。在其之后,用于装配的(见表9)MULE和装配载体(见表6)置于同一个试管中(每种装配载体333fmole,每种MULE667fmole),并用LguI限制性内切酶(Fermentas,Glen Burnie,MD)消化。限制性内切酶加热至65℃20分钟使其失活。样品分为3个30uL反应体系;水、缓冲液、dNTP和DNA聚合酶加入每个反应混合物中,起始PCR扩增的第一轮。末端引物加入反应混合物,进行PCR扩增的第二轮(见表9)。3个PCR反应混合物合并在一个试管里,反应混合物用凝胶电泳解析,凝胶纯化PCR产物。
[0306]
[0307] 测试性的装配好的多核苷酸用于转化具有URA3缺陷和GALlery80位点删除的Saccharomyces cerevisiae宿主菌株。宿主细胞转化体用缺少尿嘧啶的CSM筛选,装配好的多核苷酸正确整合进入基因组通过克隆PCR来确认。来自每次转化的两个经鉴定的克隆被挑选进360uL含2%蔗糖的乌食种子培养基(Bird Seed Medium,BSM),培养物在30℃和999rpm旋转振荡下孵育48小时。从每个孔取14.4uL并转移进96孔包被板上含4%蔗糖的1.1mL BSM中,30℃和999rpm旋转振荡下培养另外6小时,然后100uL的每种培养物转移到干净底部的96孔板的孔中以检测GFP表达。每个孔的GFP表达在M5Plate Reader分光光度计(Molecular Devices,Sunnyvale,CA)上通过测量485nm激发后的515nm辐射来检测。通过测量的GFP浓度除以每份培养液的OD600来使GFP浓度相对于细胞生长标准化。
[0308] 如表10所示,相比于可退火接头序列RYSE7,可退火接头序列RYSE15使增加的GAL1、TDH3和CYC1启动子驱动测试性的装配好的多核苷酸中GFP报告基因的表达。
[0309]
[0310] 实施例10
[0311] 本实施例描述多核苷酸高通量组合装配的方法,和高通量制备包含组合的组装的多核苷酸的宿主细胞的方法。
[0312] 本实施例所用的组分多核苷酸,以及从这些组分多核苷酸产生的期望的装配好的和组合的多核苷酸,在图12A中示意性展示。组分多核苷酸包含编码上游和下游染色体靶向序列的DNA片段(US和DS),6个不同启动子(P),35个不同的蛋白(G),和URA3选择标签的5’和3’片段(分别是URA和RA3),侧邻于可退火接头序列对或引物结合片段/可退火接头序列对。
[0313] 组分多核苷酸通过用LguI限制性内切酶消化RABit或MULE而从装配载体中释放出来。在这之后,设置如下表所示的96孔板(“LguI消化板”),这些板在37℃下孵育75分钟,之后LguI限制性内切酶在PCR仪器中加热至65℃20分钟使其失活。
[0314]
[0315] 组分多核苷酸通过SOE来装配。对每个LguI消化板,设置三份96孔板(“SOE/PCR板”)并在PCR仪器中按下表所示进行热循环:
[0316]
[0317]
[0318] 装配好的多核苷酸用PCR扩增。每个SOE/PCR板接受添加的试剂并在PCR仪器中热循环,如下表所示。SOE/PCR板相应的孔汇集在96深孔板块上,装配好的多核苷酸用Omega Biotek E-Z 循环-纯化试剂盒(Omega Bio-Tek Inc.,Norcross,GA)按照生产商建议的步骤纯化(大约终体积为45uL)。
[0319]
[0320] 图12B展示了示例性装配好的多核苷酸(方框中)溶于1%琼脂糖凝胶。
[0321] 纯化的装配好的多核苷酸用LguI限制性内切酶消化以产生用于克隆的粘性末端。之后,设置96孔板(“LguI装配好的多核苷酸消化板”)如下表所示,这些板在37℃下孵育60分钟,之后在PCR仪器中LguI限制性内切酶加热至65℃20分钟使其失活。TM
LguI消化的装配好的多核苷酸用ZR-96Zymoclean 凝胶DNA回收试剂盒(Zymo Research Corporation,Orange,CA)按照生产生推荐的步骤纯化。
[0322]
[0323] 装配好的多核苷酸连接至基于pUC-19的载体骨架。当插入片段没有连接至该载体时,pTRC启动子(即,Saccharomyces cerevisiae的TRC基因的启动子)驱动GluRS的表达并杀死宿主细胞。设置96孔板(“连接板”)如下表所示,这些板在24℃下孵育15TM分钟,然后16℃过夜。连接产物用ZR-96DNAClean & Concentrator -5(Zymo Research Corporation,Orange,CA)按照生产商建议的步骤纯化。
[0324]
[0325] 连接产物电穿孔进入大肠杆菌感受态细胞。设置预冷的96孔电穿孔板,并如下表所示进行电穿孔。
[0326]
[0327] 设置包含250uL预温的SOC的1.1mL的96孔培养板(“培养板”),从每个孔取100uL的SOC并在电穿孔之后立即加入电穿孔细胞。混合所述SOC和细胞,每种混合物的
100uL转移回培养板。培养板在37℃下在Multitron II培养摇床(ATR Biotech,Laurel,MD)中孵育1小时。两份细胞稀释物(3ul和240ul)平铺在包含50ug/mL卡那霉素的LB琼脂上,37℃下孵育过夜。挑选克隆并在每孔包含1mL LB培养基和卡那霉素的97深孔板中生长,提取DNA用于LguI限制性内切酶进行限制性酶切位点分析。24个包含大约8kb的组合多核苷酸的示例性克隆的中22个的这种限制性酶切位点分析结果显示在图12C中。
[0328] 包含染色体整合的组合多核苷酸的酵母细胞通过宿主细胞介导的末端染色体靶向序列和装配好的多核苷酸的选择性标记片段之间的同源重组而产生。之后,设置96孔PCR板(“酵母转化板”)并在PCR仪器中进行热休克转化,如下表所示。
[0329]
[0330]
[0331] 酵母转化板以2000g旋转2分钟,弃去上清液,细胞块用200uL ddH2O洗3次。细胞块用100uL冷的乌食种子培养基(BSM)重悬,所述BSM来自事先预冷的每孔含360uLBSM的冷96孔培养板(“种子板”)。悬浮细胞转移到种子版,Multitron II培养摇床中30℃下生长过夜。种子板3000g旋转5分钟,移除所有液体只保留60uL,盖好的种子板以1000rpm振荡以重悬细胞块。
[0332] 实施例11
[0333] 本实施例描述通过宿主细胞介导的同源重组来产生包含装配好的多核苷酸的酵母细胞的方法。
[0334] 本实施例所用的装配好的多核苷酸和组分多核苷酸,及期望通过装配和染色体整合获得的染色体位点,在图13A中示例性地表示。
[0335] 酵母细胞转化用下表所描述的方法进行。热休克之后,细胞被离心,弃去上清,细胞重悬于400uL ddH2O,宿主细胞转化株通过将100-200uL的细胞悬浮液平铺在缺乏尿嘧啶的琼脂上来筛选。
[0336]
[0337] 装配好的多核苷酸的成功整合通过cPCR使用cPCR引物A、B、E和F(染色体整合位点的5’连接)或cPCR引物C、D、G和H(染色体整合位点的3’连接)来确认(图13A)。如图13B所示,分析的所有8个克隆都产生了600bp的PCR条带,这表明发生了期望的装配好的多核苷酸的阳性染色体整合事件,而没有出现自身位点会产生的950bp的PCR条带。
[0338] 实施例12
[0339] 本实施例描述高通量制备通过宿主细胞介导的同源重组而产生的包含组合装配的和组合的组合多核苷酸的酵母细胞的方法。
[0340] 本实施例所用的组分多核苷酸,和通过宿主细胞介导的同源重组来装配和组合而获得的期望的组合多核苷酸,在图14A中示例性的表示。所述组分多核苷酸包含编码下列的DNA片段:上游和下游染色体靶向序列(US和DS),6个不同的启动子(P),35个不同的蛋白(G),和RUA3选择性标记的5’和3’片段(分别是URA和RA3),侧邻于可退火接头序列对或引物结合片段/可退火接头序列对。
[0341] 组分多核苷酸通过用LguI限制性内切酶消化RABit或MULE而从装配载体中释放出来。之后,设置96孔板(“LguI消化板”)如下表所示,这些板在37℃下孵育75分钟,之后LguI限制性内切酶在PCR仪器中加热至65℃20分钟使其失活。
[0342]
[0343] 为了制备包含染色体整合的组合的组装好的多核苷酸和组合的组合多核苷酸的酵母细胞,设置96孔PCR板(“酵母转化板”),在PCR仪器中进行热休克转化,如下表所示。
[0344]
[0345]
[0346] 酵母转化板以2000g旋转2分钟,弃去上清,细胞块用200uL ddH2O洗三次。细胞块用100uL冷的乌食种子培养基(BSM)重悬,所述BSM来自事先预冷的每孔含360uLBSM的冷96孔培养板(“种子板”)。悬浮细胞转移到种子版,Multitron II培养摇床中30℃下生长过夜。种子板3000g旋转5分钟,移除所有液体只保留60uL,盖好的种子板以1000rpm振荡以重悬细胞块。挑选并分析具有功能性URA3选择性标记的酵母细胞转化体的克隆。
[0347] 本说明书中所引用的所有出版物、专利和专利申请都纳入本文作为参考,如同每个单独的出版物或专利申请都专地和独立地指明纳入作为参考。尽管为了清楚和易于理解的目的,上述发明以示例性或实施例的形式描述了一些细节,但是很显然具有本领域常规技术的人员根据本发明的教导可以做出另外的改变和修饰,而不脱离所附加的权利要求的精神和范围。上文所描述的本发明的实施方式仅仅是实例性的,本领域技术人员可以认识到,或者能够使用仅仅常规实验而确认,本文所描述的特定方法的大量等同替代。所有这些等同替代被认为是在本发明的范围之内并以权利要求来覆盖。另外,如说明书和权利要求书中所用到的,单数形式的“一”或“这”包含复数形式,除非其内容做出其他明确的指示。
QQ群二维码
意见反馈