首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 用于核酸组装的组合物和方法

用于核酸组装的组合物和方法

申请号 CN201680081641.1 申请日 2016-12-21 公开(公告)号 CN109069667A 公开(公告)日 2018-12-21
申请人 GEN9股份有限公司; 发明人 I·萨埃姆;
摘要 本公开的方面涉及用于多核苷酸组装的组合物和方法。在一些实施方式中,提供了终止子寡核苷酸。
权利要求

1.一种包括Y—X—Z—O茎环的非天然产生的核酸序列,其中:
a.Y是5-30个核苷酸长度的核苷酸序列;
b.X是3-12个核苷酸长度的核苷酸序列,其中的各核苷酸在Y和Z形成茎时不与X内的任何其它核苷酸配对
c.Z是5-50个核苷酸长度的核苷酸序列,并且与Y具有至少70%的互补性;并且d.O不存在或者是从Y和Z之间形成的所述茎突出的突出端。
2.如权利要求1所述的核酸序列,其中,X形成环。
3.如权利要求1或2所述的核酸序列,其中,O包括简并序列。
4.如权利要求1或2所述的核酸序列,其包括一个或多个dT-生物素。
5.如权利要求1或2所述的核酸序列,其中,Y—X—Z具有序列SEQ ID NO:1。
6.一种非天然产生的核酸序列的文库,各成员包括Y—X—Z—O茎环,其中:
a.Y是5-30个核苷酸长度的核苷酸序列;
b.X是3-12个核苷酸长度的核苷酸序列,其中的各核苷酸在Y和Z形成茎时不与X内的任何其它核苷酸碱基配对;
c.Z是5-50个核苷酸长度的核苷酸序列,并且与Y具有至少70%的互补性;并且d.O是从Y和Z之间形成的所述茎突出的突出端,并且包括具有N个简并位置的简并序列;
其中,所述文库包括至少4N个成员。
7.如权利要求6所述的文库,各成员包括一个或多个dT-生物素。
8.如权利要求6或7所述的文库,其中,所有成员具有相同的Y—X—Z。
9.如权利要求8所述的文库,其中,所述Y—X—Z具有序列SEQ ID NO:1。
10.一种修饰核酸分子的方法,其包括将权利要求1-9中任一项所述的核酸序列附连于所述核酸分子。
11.如权利要求11所述的方法,其中,所述附连包括连接。
12.一种组装靶核酸的方法,其包括:
a.组装5’末端构建寡核苷酸、至少一个中心构建寡核苷酸和3’末端构建寡核苷酸,其中各构建寡核苷酸具有两个粘性末端,至少一个粘性末端与另一个构建寡核苷酸的粘性末端相容,因此当以预定顺序完全组装时,所述构建寡核苷酸形成靶核酸或其亚构建体,其中所述5’末端构建寡核苷酸具有5’引物结合位点并且所述3’末端构建寡核苷酸具有3’引物结合位点;
b.将终止子附连于来自步骤(a)的组装产物的两端,其中所述终止子具有与所述组装产物的突出端相容的突出端;和
c.使用针对所述5’引物结合位点和3’引物结合位点的引物,选择性地扩增完全组装产物。
13.一种组装靶核酸的方法,其包括:
a.组装5’末端构建寡核苷酸、至少一个中心构建寡核苷酸和3’末端构建寡核苷酸,其中所述至少一个中心构建寡核苷酸各自具有两个粘性末端,其各自与另一个构建寡核苷酸的粘性末端相容,因此当以预定顺序完全组装时,所述构建寡核苷酸形成靶核酸或其亚构建体,其中所述5’末端构建寡核苷酸具有5’钝端并且所述3’末端构建寡核苷酸具有3’钝端;
b.将终止子附连于来自步骤(a)的部分组装产物,其中所述终止子具有与所述部分组装产物的突出端相容的突出端,并且其中所述终止子包括标签;并且
c.使用所述标签的结合伴侣,移除所述部分组装产物。
14.如权利要求13所述的方法,其中,所述5’末端构建寡核苷酸具有5’引物结合位点,并且所述3’末端构建寡核苷酸具有3’引物结合位点,其中,所述方法还包括使用针对所述
5’引物结合位点和所述3’引物结合位点的引物扩增完全组装产物。
15.如权利要求13或14所述的方法,其中,所述标签是生物素,并且所述结合伴侣是亲和素、链霉亲和素和中性亲和素中的一种或多种。

说明书全文

用于核酸组装的组合物和方法

[0001] 相关申请的交叉引用
[0002] 本申请要求2015年12月21日提交的美国临时专利申请号62/270,131的优先权和权益,其公开通过引用全文的方式纳入本文。

技术领域

[0003] 本公开涉及用于体外核酸合成和组装的组合物和方法。

背景技术

[0004] 重组和合成核酸在研究、工业、农业和医学中有许多应用。可以使用重组和合成核酸来表达和获得大量的多肽,包含酶、抗体、生长因子、受体和其它可用于多种医学、工业或农业目的的多肽。也可以使用重组和合成核酸来产生遗传修饰的生物体,包括修饰的细菌、酵母哺乳动物植物和其它生物体。遗传修饰的生物体可以用于研究(例如,疾病的动物模型、理解生物过程的工具等)、工业(例如,作为蛋白表达的宿主生物体、用于产生工业产物的生物反应器、环境补救的工具、分离或修饰具有工业应用的天然化合物等)、农业(例如,具有增加的产率或增加的对疾病或环境压的抗性的经修饰作物等)和用于其它应用。重组和合成核酸也可以用作治疗组合物(例如,用于修饰基因表达、用于基因治疗等)或用作诊断工具(例如,病症的探针等)。
[0005] 已经开发了多种技术用于修饰存在的核酸(例如,天然产生的核酸)来产生重组核酸。例如,可以使用核酸扩增、诱变、核酸酶消化、连接、克隆和其它技术的多种组合来产生许多不同的重组核酸。经常使用化学合成的多核苷酸作为用于核酸扩增、诱变和克隆的引物或衔接子。
[0006] 也开发了用于从头核酸组装的技术,其中制备(例如,化学合成)和组装核酸来产生较长的感兴趣的靶核酸。例如,已经开发了不同的多重组装技术用于将寡核苷酸组装成能用于研究、工业、农业和/或医学的较大的合成核酸。然而,目前可用的组装技术的一个限制是相对高的错误率以及无法组装某些基因(由于例如高GC含量或难以解析)。如此,存在对于改善组装方法的需求。发明内容
[0007] 本公开的一个方面涉及一种包括Y—X—Z—O茎环的非天然产生的核酸序列,其中:
[0008] a.Y是5-30个核苷酸长度的核苷酸序列;
[0009] b.X是3-12个核苷酸长度的核苷酸序列,其中的各核苷酸在Y和Z形成茎时不与X内的任何其它核苷酸配对
[0010] c.Z是5-50个核苷酸长度的核苷酸序列,并且与Y具有至少70%的互补性;并且
[0011] d.O不存在或者是从Y和Z之间形成的所述茎突出的突出端。
[0012] 在一些实施方式中,X形成环。应当注意的是,Y可以是X的5’或是X的3’。换言之,O可以是5’突出物(protrusion)/突出端(overhang)或3’突出物/突出端。
[0013] O可以包括简并序列(具有例如N个简并位置,其可以是或者可以不是连续的,其中N是任意整数)。核酸序列可以包括一个或多个dT-生物素。在一实施方式中,Y—X—Z部分具有序列SEQ ID NO:1。
[0014] 另一方面涉及一种非天然产生的核酸序列的文库,各成员包括Y—X—Z—O茎环,其中:
[0015] a.Y是5-30个核苷酸长度的核苷酸序列;
[0016] b.X是3-12个核苷酸长度的核苷酸序列,其中的各核苷酸在Y和Z形成茎时不与X内的任何其它核苷酸碱基配对;
[0017] c.Z是5-50个核苷酸长度的核苷酸序列,并且与Y具有至少70%的互补性;并且
[0018] d.O是从Y和Z之间形成的所述茎突出的5’或3’突出端,并且包括具有N个简并位置的简并序列;
[0019] 其中,所述文库包括至少4N个成员。
[0020] 在一些实施方式中,该文库的各成员可以包含一个或多个dT-生物素。所有成员或其子集可以具有相同的Y—X—Z。在一实施方式中,各成员或该文库成员的子集的Y—X—Z部分具有序列SEQ ID NO:1。
[0021] 另一方面涉及一种修饰核酸分子的方法,其包括将本文所公开的核酸序列(例如,终止子)附连于所述核酸分子。在一些实施方式中,该附连步骤包括连接。
[0022] 另一方面还涉及一种组装靶核酸的方法,其包括:
[0023] a.组装5’末端构建寡核苷酸、至少一个中心构建寡核苷酸和3’末端构建寡核苷酸,其中各构建寡核苷酸具有两个粘性末端,至少一个粘性末端与另一个构建寡核苷酸的粘性末端相容,因此当以预定顺序完全组装时,构建寡核苷酸形成靶核酸或其亚构建体(subconstruct),其中所述5’末端构建寡核苷酸具有5’引物结合位点并且所述3’末端构建寡核苷酸具有3’引物结合位点;
[0024] b.将终止子附连于来自步骤(a)的组装产物的两端,其中所述终止子具有与所述组装产物的突出端相容的突出端;和
[0025] c.使用针对所述5’引物结合位点和3’引物结合位点的引物,选择性地扩增完全组装产物。
[0026] 本文还提供了另一种组装靶核酸的方法,其包括:
[0027] a.组装5’末端构建寡核苷酸、至少一个中心构建寡核苷酸和3’末端构建寡核苷酸,其中所述至少一个中心构建寡核苷酸各自具有两个粘性末端,其各自与另一个构建寡核苷酸的粘性末端相容,因此当以预定顺序完全组装时,所述构建寡核苷酸形成靶核酸或其亚构建体,其中所述5’末端构建寡核苷酸具有5’钝端并且所述3’末端构建寡核苷酸具有3’钝端;
[0028] b.将终止子附连于来自步骤(a)的部分组装产物,其中所述终止子具有与所述部分组装产物的突出端相容的突出端,并且其中所述终止子包括标签;并且
[0029] c.使用所述标签的结合伴侣,移除所述部分组装产物。
[0030] 在一些实施方式中,5’末端构建寡核苷酸具有5’引物结合位点,而3’末端构建寡核苷酸具有3’引物结合位点,其中,该方法还包括使用针对5’引物结合位点和3’引物结合位点的引物扩增完全组装产物。在某些实施方式中,为了促进部分组装产物的去除,标签可以是生物素,并且结合伴侣可以是亲和素、链霉亲和素和中性亲和素(NeutrAvidin)中的一种或多种。附图说明
[0031] 图1显示了终止子寡核苷酸在亚构建体的亚组装(subassembly)期间的示例性应用。
[0032] 图2A-2B显示了终止子寡核苷酸在靶标组装期间的示例性应用。
[0033] 图3显示了生物素-终止子寡核苷酸在亚组装期间的示例性应用。
[0034] 图4显示了具有生物素以及不具有生物素的终止子寡核苷酸的示例性设计。
[0035] 图5显示了示例性组装策略。
[0036] 图6显示了示例性终止子寡核苷酸。
[0037] 发明详述
[0038] 本公开的方面涉及用于组装核酸分子的组合物和方法。本公开的方面还涉及用于使用包含发夹的终止子寡核苷酸由寡核苷酸(例如,构建寡聚物(oligo)或亚构建体)组装多核苷酸(例如,靶核酸或亚组装中间体)的组合物和方法。在一些实施方式中,本文所公开的终止子寡核苷酸可以改善组装效率和/或准确性,并且可以协助去除不需要或错误的组装产物。
[0039] 为了组装靶核酸,一种策略是分析该靶核酸的序列并且将其解析成彼此之间具有相容(例如,互补)粘性末端的两个或更多个构建寡核苷酸,从而这两个或更多个构建寡核苷酸能被一起组装(例如,连接)成靶核酸。组装可以使用分级、顺序和/或一步组装进行。仅举例来说,将寡核苷酸A、B、C和D(各自为构建寡核苷酸)分级组装成A+B+C+D靶标可以包括首先组装A+B和C+D(各自为亚构建体或亚组装),然后A+B+C+D。顺序组装可以包括组装A+B(原代亚构建体或亚组装体(subassembly)),然后A+B+C(二级亚构建体或亚组装体),最终A+B+C+D(靶标)。一步组装将A、B、C和D组合在一个反应中以产生A+B+C+D。应当注意的是,可以将不同的策略混合,其中构建寡核苷酸的一部分使用一种策略组装,而另一部分使用不同的策略。
[0040] 构建寡核苷酸可以是化学合成的,例如,在如下具体描述的固体支持物上化学合成。在一些实施方式中,可以合成足够量的构建寡核苷酸,从而使在不需要扩增一种或多种构建寡核苷酸的情况下实现直接亚组装或完全组装。在某些实施方式中,化学合成后的构建寡核苷酸可首先经亚组装成亚构建体,其可以被扩增(例如,在基于聚合酶的反应中),并且然后经进一步的组装成为二级亚构建体或最终靶标。在一些实施方式中,可以在组装之前扩增一种或多种构建寡核苷酸。
[0041] 为了促进扩增,一种或多种构建寡核苷酸和/或亚构建体可以被设计成包括一个或多个引物结合位点,在聚合酶链式反应中,引物可以与之结合或者退火。引物结合位点可以被设计成对所有构建寡核苷酸或其子集或两种或更多种亚构建体为通用的(即,相同
的)。通用引物结合位点(和对应的通用引物)可以被用于在聚合酶链式反应中扩增具有这样的通用引物结合位点的所有构建寡核苷酸或亚构建体。还可以设计对一种或多种选择构建寡核苷酸和/或亚构建体具有特异性的引物结合位点,从而允许靶向且特异性扩增所述选择构建寡核苷酸和/或亚构建体。在一些实施方式中,一种或多种构建寡核苷酸和/或亚构建体可在一端或两端包含巢式或连续引物结合物位点,其中一种或多种外引物和内引物可以与之结合。在一示例中,构建寡核苷酸和/或亚构建体各自具有针对外引物对和内引物对的结合位点。外引物对中的一个或两个可以是通用引物。或者,外引物对中的一个或两个可以是独特的引物。在一些实施方式中,在组装前,单独扩增各构建寡核苷酸。构建寡核苷酸还可以被汇集至一个或多个库(pool)中用于扩增。在一个示例中,在单一的库中扩增所有的构建寡核苷酸。在某些实施方式中,扩增的构建寡核苷酸经由基于聚合酶的组装或连接来组装。扩增的构建寡核苷酸可以被分级地或连续地或以一步反应组装成靶核酸。
[0042] 一个或多个引物结合位点可以被设计成被纳入最终靶核酸的构建寡核苷酸的部分。在一些实施方式中,各引物结合位点的全部或部分可以是构建寡核苷酸中心部分外侧的侧接区域形式,其中,中心部分被纳入最终靶核酸,而侧接区域需要在组装前被去除。为此,一个或多个限制位点可以被设计成允许侧接区域的去除。
[0043] 可以通过利用终止子寡核苷酸来促进上述一个或多个步骤。例如,亚组装和/或组装期间,可能会存在不完整的亚组装或组装产物(例如,其中该亚构建体或最终构建体缺失一个或多个构建寡核苷酸)。这些不完整的产物难以从完整且正确组装的产物分离或去除,这是由于它们大小相近。在后续基于聚合酶的扩增中,不完整的分子常与完整组装产物一起扩增。为了抑制不完整的产物的扩增,终止子寡核苷酸可以被附连于亚组装或组装产物的一个或两个末端,因此不完整产物的扩增是不被支持的且不影响完整组装产物的扩增。终止子寡核苷酸可以包含一种或多种标签,如生物素和/或地高辛,其可以通过其结合伴侣结合以供后续去除。以此方式,可以富集和/或纯化正确的组装产物。
[0044] 定义
[0045] 方便起见,将说明书实施例和所附权利要求中使用的特定术语汇集在此。除非另外定义,否则,本文中所使用的所有技术和科学术语都具有本文所属领域普通技术人员通常所理解的含义。
[0046] 本文使用冠词“一个”和“一种”表示一个或一个以上的(即至少一个)该冠词语法上的宾语。举例而言,“一个元件”表示一个元件或者一个以上的元件。
[0047] 本文所用术语“约”表示在20%以内,更优选10%以内并且最优选5%以内。术语“基本上”表示超过50%,更优选超过80%并且最优选超过90%或95%。
[0048] 本文所用“多个/多种”表示超过1个/种,例如,2、3、4、、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个/种,例如25、30、40、50、60、70、80、90、100、200、300、400、
500或更多个/种,或其间任何整数。
[0049] “组装”表示其中短DNA序列(构建寡核苷酸)以特定顺序附连以形成较长DNA序列(靶标)的过程。“亚组装体”表示这样的中间步骤或产物,其中构建寡核苷酸的子集附连以形成一亚构建体,其为最终靶标的部分。
[0050] “CEL”或“粘性末端连接”指使用彼此之间至少部分互补的粘性末端以预设计的顺序接合DNA片段的过程。粘性末端可以通过限制性酶消化生成,或可以在固体支持物上直接合成。
[0051] 本文所用“芯片”指具有附连于平坦表面的许多寡核苷酸的DNA微阵列。芯片上的寡核苷酸可以是任何长度。在一些实施方式中,寡核苷酸是约200个核苷酸或更少。寡核苷酸可以是双链或单链的。
[0052] 术语“互补”或“互补性”表示,按照标准沃森克里克互补规则,两个核酸序列能够至少部分碱基配对。例如,两个粘性末端可以是部分互补的,其中一个突出端的区域与另一个突出端的区域或全部互补且退火缺口可以通过在聚合酶和单个核苷酸存在的情况下进行链延伸而被填充,然后或同时进行连接反应。
[0053] “构建体”指包括完整靶序列的DNA序列。通常认为,该构建体是已经组装的。“亚构建体”表示完整靶序列的部分,其通常是分级组装期间的中间产物。
[0054] 本文所用“洗出液”指从芯片切割或以其它方式去除并汇集到溶液中的多个寡核苷酸的混合物。
[0055] 本文所用“文库”指寡核苷酸(例如,终止子)的多样收集物或混合物。在某些实施方式中,文库可以包括至少2、3、4、5、6、7、8、9、10…24、34、44、54…N4个成员,其中N是任意整数(例如,代表终止子中简并部分长度)。
[0056] “核酸”、“核酸序列”、“寡核苷酸”、“多核苷酸”、“基因”或本文所用其他语法等同形式表示共价接合在一起的至少两个核苷酸,脱核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸是任意长度的聚合物,包括例如,20、50、100、200、300、500、1000、2000、3000、
5000、7000、10,000等。如本文所用,“寡核苷酸”可以是包括至少两个共价结合的核苷酸残基的核酸分子。在一些实施方式中,寡核苷酸长度可以是10-1000个核苷酸。例如,寡核苷酸长度可以是10-500个核苷酸,或500-1000个核苷酸。在一些实施方式中,寡核苷酸长度可以是约20-约300个核苷酸(例如,约30-250、40-220、50-200、60-180,或约65或约150个核苷酸)、约100-约200个核苷酸、约200-约300个核苷酸、约300-约400个核苷酸,或约400-约500个核苷酸。然而,可以使用更短或更长的寡核苷酸。寡核苷酸可以是单链或双链核酸。本文使用的术语“核酸”、“多核苷酸”、“寡核苷酸”可互换使用,并且指核苷酸的天然产生或非天然产生、合成的聚合物形式。总言之,术语“核酸”包括“多核苷酸”和“寡核苷酸”,其中“多核苷酸”可以表示较长的核酸(例如,超过1,000个核苷酸,超过5,000个核苷酸,超过10,000个核苷酸等),而“寡核苷酸”可以表示较短的核酸(例如,10-500个核苷酸,20-400个核苷酸,
40-200个核苷酸,50-100个核苷酸等)。
[0057] 本公开所述核酸分子可以从天然产生的核苷酸形成,例如形成脱氧核糖核酸(DNA)或核糖核酸(RNA)分子。或者,天然产生的核酸可以包括结构修饰以改变其性质,诸如肽核酸(PNA)或定核酸(LNA)中的情况。用天然产生的碱基或人工碱基的核酸分子的固相合成为本领域熟知。应理解,这些术语包含从核苷酸类似物中生成的RNA或DNA的等同物、类似物和应用于要描述的实施方式时的单链或双链多核苷酸。本公开中可用的核苷酸包含例如天然产生的核苷酸(例如核糖核苷酸或脱氧核糖核苷酸),或者核苷酸的天然或合成修
饰、或者人工碱基。在一些实施方式中,核酸的序列不存在于自然界(例如,cDNA或互补的DNA序列,或人工设计的序列)。
[0058] 通常在核酸中,核苷通过磷酸二酯键接合。当用字母序列表示核酸时,应理解核苷从左至右是5’至3’的顺序。按照IUPAC注释法,“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧苷,“T”表示脱氧胸苷,“U”表示核糖核苷,尿苷。另外,也存在当超过一种核苷酸可能出现在该位置时使用的字母:“W”(即,弱键)表示A或T,“S”(强键)表示G或C,“M”(对于基)表示A或C,“K”(对于)表示G或T,“R”(对于嘌呤)表示A或G,“Y”(对于嘧啶)表示C或T,“B”表示C、G或T,“D”表示A、G或T,“H”表示A、C或T,“V”表示A、C或G并且“N”表示任何碱基A、C、G或T(U)。应理解核酸序列并不限于4种天然的脱氧核苷酸,但也可包括核糖核苷或非天然核苷酸。核苷酸序列中的“/”或括号中给出的核苷酸表示替代性的核苷酸,例如作为DNA序列中T的替代的RNA序列中替代性的U。因此,U/T或U(T)指示可以是U或T的一个核苷酸位置。同样,A/T表示核苷酸A或T;G/C表示核苷酸G或C。由于U和T之间的功能同一性,因此本文对于U或T的任何描述均应当被认为是公开了T或U中的另一个。例如,述及序列UUCG(位于RNA)时应当也被理解为公开了序列TTCG(位于对应DNA)。仅处于简化的目的,本文仅描述这些选项中的一个。互补核苷酸或碱基是那些能够碱基配对的碱基,诸如A和T(或U);G和C;G和U。
[0059] “解析”当用作动词时表示使靶序列断裂成用于组装的相容片段的过程。在一些实施方式中,相容片段具有相容粘性末端,其使得片段能够以预定顺序连接。当将“解析(解析物)”用作名词时,其指可以被组装在一起形成更大的DNA序列的片段的集合。
[0060] 总之,“茎环”序列(可与“发夹”互换使用)表示这样的序列,其中彼此之间反向互补的单一DNA或RNA分子内的至少两个区域被一个或多个非互补区域分隔,因此该互补区域杂交并形成“茎”,而该非互补区域形成“环”。
[0061] “靶标”指具有已知核苷酸序列(例如,如客户所预定)的待使用本文所公开的一种或多种方法合成或组装的核酸。
[0062] “终止子”、“终止子寡核苷酸”或“终止子寡聚物”表示包括茎环的核酸序列,其中茎部分的游离端可以附连(例如,连接)另一核酸序列(例如,构建寡核苷酸或亚构建体)。茎部分可以被设计成具有高解链温度(例如,高于65℃、高于68℃,高于70℃或高于72℃)。附连之后,当温度低于茎部分解链温度时,茎部分倾向于自退火(self-anneal),从而防止了其附连的核酸参与进一步的反应,诸如聚合酶链式反应。终止子还可以被设计成包括一个或多个标签(例如,生物素和地高辛),以在结合其结合伴侣后促进终止子的去除(与其附连的核酸一起)。
[0063] 本文使用的“包含”、“包括”、或“具有、“含有”、“涉及”及其变化意为涵盖其后列出的项目和其等同物以及外加的项目。“由……组成”应被理解为封闭式的、与之相关的是有限范围的元素或特征。“基本由……组成”将范围限制在指定的元素或步骤但不排除那些并不实质上影响相关发明基础和新颖特征的元素或步骤。
[0064] 合适领域的普通技术人员能够一般理解本文所使用的重组核酸技术、合成生物学和分子生物学领域内的其它术语。
[0065] 合成寡核苷酸
[0066] 通常,寡核苷酸合成涉及许多化学步骤,其在整个合成过程中以循环重复的方式进行,每个循环向正在增长的寡核苷酸链添加一个核苷酸。循环中涉及的化学步骤是:去保护步骤,其释放官能团以供进一步链延伸,偶联步骤,其将核苷酸纳入待合成的寡核苷酸中,以及寡核苷酸合成中所用特定化学所需的其他步骤,诸如亚磷酰胺化学所需的氧化步骤。任选地,可以将加帽步骤插入该循环中,所述加帽步骤阻断在偶联步骤中不被延长的那些官能团。在寡核苷酸合成是以3'→5'方向进行的情况下,核苷酸可以被添加到末端核苷酸的5'-羟基,或者在寡核苷酸合成是以5'→3'方向进行的情况下,核苷酸可以被添加到末端核苷酸的3’-羟基。
[0067] 为清楚起见,双链核酸的两条互补链在本文中被称为正链(P)和负链(N)。这种名称并不意在暗示链是编码序列的正义链和反义链。它们仅仅是指核酸(例如,靶核酸,中间体核酸片段等)的两条互补链,无关核酸的序列或功能。因此,在一些实施方式中,P链可以是编码序列的正义链,而在其它实施方式中,P链可以是编码序列的反义链。应理解,本文提及的互补核酸或互补核酸区域是指具有互相反向互补使得它们能够以天然DNA典型的反向平行方式杂交的核酸或其区域。
[0068] 在本公开的一些方面中,根据本文所述方法合成或制备的寡核苷酸可以被用作结构单元(building block),用于感兴趣靶多核苷酸的组装。
[0069] 寡核苷酸可以在固体支持物上合成。本文使用的术语“固体支持物”、“支持物”和“基质”可互换使用,并且是指多孔或无孔的溶剂不溶性材料,在其上合成或固定聚合物例如核酸。本文使用的“多孔”是指所述材料包含有基本一致直径(例如纳米范围内)的孔。多孔材料可以包含但不限于,纸张、合成过滤器等。在这种多孔材料中,所述反应可以在孔中进行。所述支持物能有很多形状中的任意一种,例如销、条、板、盘、杆、弯曲、圆柱形结构、颗粒(包含珠、纳米颗粒)等。在一些实施方式中,支持物是平面的(例如,芯片)。所述支持物可有可变宽度。
[0070] 支持物可以是亲性的或能够呈现出亲水性的。所述支持物可以包含无机粉末如二氧化硫酸镁、和氧化;天然聚合材料,特别是纤维素材料和纤维素衍生材料,例如包含纤维的纸,如滤纸、色谱纸等;合成或改性天然产生的聚合物,如硝酸纤维素、乙酸纤维素、聚(氯乙烯)、聚丙烯酰胺、交联葡聚糖、琼脂糖、聚丙烯酸酯、聚乙烯、聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二酯)、尼龙、聚(丁酸乙烯酯)、聚偏二氟乙烯(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金属等;这些材料或单独使用或与其它材料联用。
[0071] 在一些实施方式中,多种不同的单链寡核苷酸被固定在固体支持物的不同特征部处。在一些实施方式中,结合支持物的寡核苷酸可通过其5'末端或其3'末端附连。在一些实施方式中,结合支持物的寡核苷酸可以通过核苷酸序列(如简并结合序列)、接头(如光可切割的接头或化学接头)固定在支持物上。应理解,3’末端是指所述5’末端的下游序列,而5’末端是指所述3’末端的上游序列。例如,寡核苷酸可通过不参与后续反应的核苷酸序列或接头固定在支持物上。
[0072] 本公开的某些实施方式可以利用固体支持物,其包括惰性基质和多孔反应层。多孔反应层可以提供用于固定预合成的寡核苷酸或用于合成寡核苷酸的化学功能性。在一些实施方式中,阵列的表面可以用这样的物质处理或包覆,所述物质包括合适的反应基团,用于固定或共价连接核酸。可以使用本领域已知的,具有用于寡核苷酸固定或原位合成的合适反应基团的任何材料。
[0073] 在一些实施方式中,可以处理多孔反应层从而包括羟基反应基团。例如,多孔反应层可以包括蔗糖
[0074] 根据本公开的一些方面,以3’磷酰基寡核苷酸封端的寡核苷酸可以3'→5'方向在固体支持物上合成,所述固体支持物具有与其连接的化学磷酸化试剂。在一些实施方式中,合成寡核苷酸之前,磷酸化试剂可与多孔层偶联。在示例性的实施方式中,磷酸化试剂可以与蔗糖偶联。例如,磷酸化试剂可以是2-[2-(4,4'-二甲氧基三苯甲基氧基)乙基磺酰基]乙基-(2-氰乙基)-(N,N-二异丙基)-亚磷酰胺。在一些实施方式中,3'磷酸化的寡核苷酸可以从固体支持物释放,并且根据本文所述方法进行后续修饰。在一些实施方式中,3’磷酸化的寡核苷酸可以使用氢氧化铵从固体支持物释放。
[0075] 在一些实施方式中,可以设计用于组装的合成的寡核苷酸(例如序列、大小和数量)。可使用标准DNA合成化学(例如,亚磷酰胺方法)来生产合成的寡核苷酸。可使用如本文详述的任何合适技术在固体支持物(如微阵列)上合成合成的寡核苷酸。可在扩增之前将寡核苷酸从微阵列上洗脱下来或在微阵列上扩增寡核苷酸。应理解,不同的寡核苷酸可以被设计为具有不同的长度。
[0076] 在一些实施方式中,寡核苷酸是合成的(例如,在阵列形式上),如美国专利号7,563,600、美国专利申请号13/592,827和WO 2014/004393中所述,其通过引用将其全部内容纳入本文。例如,在常见支持物上原位合成单链寡核苷酸,其中在基质上的分开或离散的特征部(或点)上合成各寡核苷酸。在一些实施方式中,单链寡核苷酸结合到所述支持物或特征部的表面上。本文所用的术语“阵列”是指为进一步反应存储、定向(routing)、扩增和释放寡核苷酸或互补寡核苷酸的离散特征部的排列。阵列可以是平面的。在一实施方式中,所述支持物或阵列是可寻址的:所述支持物包含在所述支持物上特定预定位置(即“地址”)上的两个或更多离散的可寻址特征部。因此,阵列上的各寡核苷酸分子位于所述支持物上已知和确定的位置。各寡核苷酸序列能从其在所述支持物上的位置来确定。另外,可寻址的支持物或阵列能够直接控制单独分离的体积如液滴。可以选择限定特征的大小来使得在所述特征上形成微体积的液滴,每个液滴保持互相分离。如本文所述,多个特征通常(但不必需)由特征部间的间隔分离从而确保两个相邻部位之间的液滴不会融合。特征部间通常在其表面上不携带任何寡核苷酸,并且对应惰性空间。在一些实施方式中,特征部间和特征部可在其亲水性或疏水性性质上不同。
[0077] 寡核苷酸可以是单链核酸。然而,在一些实施方式中,可以如本文所述使用双链寡核苷酸。在某些实施方式中,寡核苷酸可以是化学合成的,如本文所述。在一些实施方式中,核酸(例如,合成寡核苷酸)可以在使用前扩增。所得的产物可以是双链的。一个或多个修饰的碱基(例如,核苷酸类似物)可以被纳入。修饰的例子包括但不限于下述的一种或多种:甲基化的碱基,如胞嘧啶和鸟嘌呤;通用碱基,如硝基吲哚、dP和dK、肌苷、尿嘧啶;卤代碱基,如BrdU;荧光标记的碱基;非-放射性标记物,如生物素(作为dT的衍生物)和地高辛(DIG);2,4-二硝基苯基(DNP);放射性核苷酸;偶联后修饰,如dR-NH2(脱氧核糖-Neb);吖啶(6-氯-
2-甲氧基吖啶);和间隔物磷酰胺,其在合成中使用以向序列添加间隔物“臂”,如C3、C8(辛二醇)、C9、Cl2、HEG(六甘醇)和Cl8。
[0078] 在各种实施方式中,合成的单链或双链寡核苷酸可以是非天然产生的,例如,未甲基化的或以某种方式修饰的(例如,体外化学或生物化学修饰),因此它们变成半-甲基化的(只有一条链被甲基化)或部分-甲基化的(一条链或两条链上只有常规甲基化位点的部分被甲基化)或超甲基化(一条链或两条链上超出常规甲基化位点被甲基化),或具有非天然产生的甲基化模式(一条链或两条链上常规甲基化位点中的一些被甲基化,和/或常规未甲基化的位点被甲基化)。与之相反,天然产生的DNA通常包含表观遗传修饰,如通过DNA甲基转移酶(DNMT)的体内甲基化,例如在DNA胞嘧啶环的C-5位置。DNA甲基化由Jin等,基因和癌症(Genes&Cancer)2011年6月;2(6):607–617综述,通过引用其全部内容将其纳入本文。
[0079] 终止子寡核苷酸的设计
[0080] 在一方面,本文提供了非天然产生的人工终止子。在一些实施方式中,终止子可以包括一个或多个茎环序列。在一些情况中,茎环序列可以是约7至约200个核苷酸长度,10-100个核苷酸长度之间,15-80个核苷酸长度之间,20-50个核苷酸长度之间,或25-40个核苷酸长度之间。茎环序列可以更短或更长,这取决于设计。
[0081] 各茎环内,可以设计一个或多个环结构。环结构可以是完全环,其中位于环的底部并且与茎的连接的两个核苷酸是互补的(例如,A-T或G-C)。通常,位于茎顶部的环是完全环。如果位于环的底部并且与茎连接的两个核苷酸不形成碱基对(例如,A和A、T和T、A和G、T和C等),环还可以是半环。茎环可以具有一个或多个完全环和/或半环。将位于环底部并与茎连接的两个核苷酸排除在外,环的大小可为3-12个核苷酸之间任意的大小,或4-10个核苷酸之间,或5-8个核苷酸之间,如果宿主是细菌,诸如大肠杆菌(E.coli)。如果宿主是酵母或哺乳动物细胞,则环大小可以更大,例如,多达15个核苷酸或多达20个核苷酸或更大。
[0082] 茎部分在两个碱基配对的片段之间并不需要具有100%的互补性。出于方便,茎中的一个片段被称为正片段或+片段,而另一个是负片段或-片段。在一些实施方式中,茎在两个碱基配对的片段之间可以具有至少约98%,至少约95%,至少约90%,至少约85%,至少约80%,至少约75%,至少约70%,至少约60%,至少约50%的互补性。当存在小于100%互补性时,相较于负片段,正片段可能包含一个或多个错配,一个或多个插入(连续形式,从而形成环,或非连续形式)和/或一个或多个缺失(连续形式,从而在负片段上形成环,或非连续形式)。
[0083] 茎部分可以被设计成具有高解链温度(例如,高于65℃、高于68℃,高于70℃或高于72℃)。如此,当温度低于茎部分解链温度时,茎部分倾向于自退火,从而形成发夹结构。一旦附连于另一核酸,发夹可以起到防止其附连的核酸参与进一步反应(如聚合酶链式反应)的作用。为此,茎部分可以被设计成具有高GC含量,例如,高于50%,高于60%,或高于
70%。
[0084] 在某些实施方式中,茎部分的游离末端可以附连(例如,连接)于另一核酸序列(例如,构建寡核苷酸或亚构建体)。茎部分的游离末端可以是钝端的或包含粘性末端。该粘性末端可以是5’或3’突出端。突出端可以是任意长度,例如,1-100个核苷酸,1-50个核苷酸,1-20个核苷酸或2-10个核苷酸。在一些实施方式中,突出端为4-8、4-6或4个核苷酸长。突出端可以包含简并序列以实现与基本上任何序列的退火和连接。例如,突出端可以是4个核苷酸长的简并序列,并且具有4^4=256种可能的序列。在一些实施方式中,可以提供终止子的文库,其中包括简并突出端部分所有可能的序列,其具有通用茎环序列或超过一个茎环序列。
[0085] 终止子还可以被设计成包括一个或多个标签,以在结合其结合伴侣后促进该终止子(和/或与其附连的核酸)的去除。标签可以是生物素和/或地高辛。可以根据本领域已知的方法标记终止子。标签可以直接地经标记的核苷酸(例如,使用生物素化的/地高辛化的核苷酸)或间接地经携带反应基团的核苷酸类似物的纳入以及后续的生物素化/地高辛化,经由酶促方式被导入该终止子。寡核苷酸也可以根据York等(Nucleic Acids Research,2012年,第40卷,1号e4)中所述方法被生物素化,通过引用其全部内容将其纳入本文。
[0086] 标记的终止子(以及其附连的分子)可以被亲和性纯化和/或去除。本领域普通技术人员将会理解,生物素的结合伴侣包括亲和素、链霉亲和素和中性亲和素。地高辛(DIG)结合伴侣包括抗-DIG抗体。结合伴侣可以与诸如珠、柱或任何其它固体表面的捕获手段偶联,以促进标记的终止子以及其附连的分子的后续去除。
[0087] 在一些实施方式中,本公开提供了包括Y—X—Z—O茎环的非天然产生的核酸序列,其中:Y是5-30个核苷酸长度的核苷酸序列;X是3-12个核苷酸长度的核苷酸序列,其中各核苷酸不与X内任何其它核苷酸碱基配对;Z是5-50个核苷酸长度的核苷酸序列,并且与Y具有至少70%互补性;并且O不存在或者是从Y和Z之间形成的茎突出的突出端。X是茎环的环部分并且可以是3-8个核苷酸长度,4-6个核苷酸长度或5-6个核苷酸长度,在一些实施方式中。在一些实施方式中,茎环可以包括一个或多个dT-生物素。在一些示例中,茎环可以具有序列SEQ ID NO.:1,如图6所示。
[0088] 在一些实施方式中,Y所拥有的G/C含量是至少60%,至少50%,或至少40%。Y对于X可能是5’,或者对于X是3’。在某些实施方式中,Y可以是12-18个核苷酸长度,14-16个核苷酸长度,16-18个核苷酸长度,17-19个核苷酸查过浓度,15-30个核苷酸长度,18-27个核苷酸长度,21-24个核苷酸长度,24-28个核苷酸长度,或25-29个核苷酸长度。在一些实施方式中,Y具有10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。
[0089] Y的长度决定Z的长度(通过互补性),其可被选择具有与Y基本上相同的核苷酸长度。Z可以具有与Y相同的长度,并且可以与Y具有一个或多个错配。Z还可以相较于Y具有一个或多个插入,因此当与Y退火时形成一个或多个突出物或环。发夹的茎,基本互补的Y和Z的长度,决定碱基对中的茎长度。茎并不需要如本文所述的100%互补,但是可以具有对于Y和Z有限的非互补对立(opposing)碱基。
[0090] 具体而言,Y和Z可以分别是m和n个核苷酸长度,其中Y由核苷酸y1至ym组成,而Z由核苷酸z1至zn组成。优选地,z1与y1互补,而zn与ym互补,因此发夹的茎的端点互补。Y和Z可以是至少60%互补,优选至少70%,至少80%、至少82%、至少84%、至少85%、至少86%、至少88%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%互补。互补性最优选是至少70%、优选至少75%、至少80%、至少85%、至少
90%、至少95%或至少100。有可能出现诸如错配、插入和/或缺失的非互补性,但是其应当是有限的。一些有限的非互补性可被设置在彼此邻近的位置以形成一个或多个额外的环。
[0091] 在钝端终止子的情况中,O可以不存在。当终止子具有粘性末端时,O还可以是5’或3’突出端。O可以是1-100个核苷酸、1-50个核苷酸、1-20个核苷酸、2-10核苷酸、4-8个核苷酸、4-6个核苷酸或4个核苷酸长。O可以包括简并序列。
[0092] 还可以将终止子设计为包括一个或多个限制性酶(RE)位点。该RE位点可以是任何II型RE位点,如IIP型或IIS型,和修饰的或杂交位点。IIP型酶识别4-8碱基对长度的对称(或回文)DNA序列,并且通常在该序列内切割。例如:EcoRI、HindIII、BamHI、NotI、PacI、MspI、HinP1I、BstNI、NciI、SfiI、NgoMIV、EcoRI、HinfI、Cac8I、AlwNI、PshAI、BglI、XcmI、HindIII、NdeI、SacI、PvuI、EcoRV、NciI、TseI、PspGI、BglII、ApoI、AccI、BstNI和NciI。IIS型限制性酶使单双链充识别位点切下0-20个碱基。示例包括但不限于:BstF5I、BtsCI、BsrDI、BtsI、AlwI、BccI、BsmAI、EarI、MlyI(钝)、PleI、BmrI、BsaI、BsmBI、FauI、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuAI、BspCNI、BspMI、SfaNI、HgaI、BseRI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpuEI、BsgI、MmeI、BseGI、Bse3DI、BseMI、AcIWI、Alw26I、Bst6I、BstMAI、Eam1104I、Ksp632I、PpsI、SchI(钝)、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstV1I、Eco57I、Eco57MI、GsuI和BcgI。这类酶和关于它们的识别位点和切割位点的信息可从供应商如新英格兰生物实验室公司(New England Biolabs,Inc.,美国萨诸塞州伊普斯威奇)处得到。
[0093] RE位点可经甲基化,因此它们可用诸如MspJI、SgeI和FspEI的甲基化-敏感型核酸酶消化。这样的核酸酶共享IIM型和IIS型特性;因此,其只识别甲基化-特异性的4-bp位点mCNNR(N=A或T或C或G;R=A或G),并且切割该识别序列外侧的DNA。
[0094] 如图4所示,终止子可以包括超过一个RE位点,例如,2、3或多个RE位点。一个或多个RE位点可以是IIS型位点,诸如AarI和BsaI位点。一个或多个RE位点可以是IIP型位点,诸如SarI。一个或多个RE位点可以被诸如FspEI的杂交型IIS-M RE识别。
[0095] 可以化学合成终止子或终止子的文库。在一些实施方式中,可以在芯片上合成终止子,该芯片可以是与携带构建寡核苷酸的芯片相同的或不同的芯片。合成后,终止子可以被切割,并且从芯片洗脱至与构建寡核苷酸相同的洗出液或不同的洗出液。
[0096] 在一些实施方式中,终止子在茎部分和/或环部分可以被生物素化(例如,经由dT-生物素)。可以根据本领域已知的方法生物素化终止子。例如,寡核苷酸可以根据York等(Nucleic Acids Research,2012年,第40卷,1号e4)中所述方法被生物素化,通过引用其全部内容将其纳入本文。生物素化产物可以使用亲和素、链霉亲和素和中性亲和素(其可以例如结合珠、柱或其它表面)亲和纯化。
[0097] 终止子寡核苷酸在组装中的应用
[0098] 在一些实施方式中,本文公开的终止子寡聚物可以被用于一个或多个组装步骤中。例如,亚组装和/或组装期间,可能会存在不完整的亚组装或组装产物(例如,其中该亚构建体或最终构建体缺失一个或多个构建寡核苷酸)。这些不完整的产物难以从完整且正确组装的产物分离或去除,这是由于它们大小相近。在后续基于聚合酶的扩增中,不完整的分子常与正确组装产物一起扩增。为了抑制不完整的产物的扩增,终止子寡核苷酸可以被附连于亚组装或组装产物的一个或两个末端,因此不完整产物的扩增是不被支持的且不影响正确组装产物的扩增。
[0099] 图1显示了终止子寡核苷酸在亚构建体(例如,600-900核苷酸长度)的亚组装期间的示例性应用。步骤1中,在亚组装的早期,构建寡核苷酸A、B和C存在于溶液中,例如,来自合成构建寡核苷酸的芯片的洗出液。构建寡核苷酸A、B和C还可以是来自芯片的直接洗出液的扩增产物,其使用(1)针对通用其中的一个或多个通用引物结合位点的一种或多种通用引物,或(2)针对其中的一个或多个个体引物结合位点的一种或多种特异性引物,或(3)(1)和(2)两者。如果通用引物结合位点是外来的并且不是待组装的靶核酸的部分,那么可以使用限制性酶消化来去除外来的序列并且产生所需粘性末端。粘性末端的同一性决定组装的特定顺序,即,各对粘性末端是足够独特的,以确保A的3’末端只与B的5’末端退火和连接,并且B的3’末端只与C的5’末端退火和连接。
[0100] 参照图1,步骤1,A和C可以各自被设计成具有用于后续扩增亚组装产物(步骤4)的引物区域,以及用于后续与末端寡聚物连接(步骤3)的粘性末端。引物区域可以是通用的或特异性的。引物区域可以被设计成被纳入最终靶核酸的构建寡核苷酸的部分。在一些实施方式中,各引物区域的全部或部分可以是构建寡核苷酸的中心部分外侧的侧接区域形式,其中,中心部分被纳入最终靶核酸,而侧接区域需要在组装前被移除。为此,一个或多个限制位点可以被设计成允许侧接区域的去除。
[0101] 图1的步骤2中,在亚组装的后期,存在完整组装产物(A+B+C)以及不完整组装产物(A+B)和(B+C)。
[0102] 图1的步骤3中,亚组装产物与终止子寡聚物连接。此外,终止子寡聚物可以自连接形成双发夹。终止子寡聚物可以各自具有简并序列的突出端(例如,4个核苷酸长)以实现与任何其它突出端的退火和连接。
[0103] 图1的步骤4中,使用这样的引物扩增连接的亚组装产物,所述引物对如上所述构建寡核苷酸A和C中预设计的引物区域具有特异性。不希望于限制于理论,认为由于一个或多个下述原因,不完整的组装产物的扩增被减少或抑制:(1)处于PCR延伸温度(例如,72℃或其它温度,取决于使用的聚合酶和生产商的推荐值),终止子中茎部分的高解链温度允许终止子保持其茎环结构,这防止聚合酶进一步作用;和(2)终止子物理接合双链核酸的两条互补链,并且使它们彼此之间更容易退火(由于分子内反应),与引物(分子间反应)相反。
[0104] 终止子在这样的情况中特别有用,在所述情况中,靶核酸具有因为例如高GC含量、低GC含量、二级机构和/或重复序列等原因而难以扩增或组装的区域。如图1,步骤4a和4b所示,完整组装产物可以被扩增。
[0105] 组装后,两个或更多个亚构建体可以组装成最终靶标。图2A-2B显示了终止子寡核苷酸在靶标组装期间的示例性应用。在该示例中的终止子寡聚物包含RE位点和标签。应当注意的是,生物素仅作为示例性的目的用作示例,也可以使用其它标签,诸如DIG。此外,可以在终止子中工程改造超过一个RE位点。
[0106] 在步骤1中,图2A,在亚组装末期,获取高纯度的亚构建体,这可以通过例如减小亚构建体的长度实现。各亚构建体在两个末端可以具有通用或独特引物区域。引物区域可以通过限制性酶消化去除以暴露所需钝端或粘性末端。例如,如图2A的步骤2中所示,可以设计两个末端亚构建体,从而在经历消化后,它们各自具有一个钝端和一个粘性末端,而中心亚构建体具有两个粘性末端。因此,在与终止子连接后,两个末端亚构建体各自连接有一个终止子,而中心构建体具有在两个末端连接的两个终止子,如步骤2所示。同样存在自连接的终止子。其后在步骤3中,外来终止子和自连接终止子可以通过尺寸选择去除。例如,可使用来自贝克曼库尔特公司(Beckman Coulter)的固相可逆固定(SPRI)珠。在步骤4中,图2B,终止子附连的亚构建体可以经由例如之前在终止子寡核苷酸中经工程改造的限制性酶位点进行消化并且连接相容的粘性末端。消化和连接反应可以在单釜式(one-pot)反应中发生。结果是部分或不完整组装产物(例如,归因于不完全的消化)仍然具有与之附连的终止子,而完整组装靶标不含终止子。可以使用基于链霉亲和素珠或蛋白质浆液的纯化去除不完整组装产物。然后可以对完整组装产物进行进一步扩增、测序和/或将其克隆到载体。
[0107] 另一组装策略使用生物素标记的终止子以促进亚组装。图3显示了生物素-终止子寡核苷酸在亚组装期间的示例性应用。步骤1-3与图1类似,不同之处在于末端构建寡核苷酸各自具有不与终止子连接的钝端。因此,完整的亚组装产物不与终止子连接,而不完整的亚组装产物与终止子连接。在步骤4中,使用基于链霉亲和素珠或蛋白质浆液的纯化对完整的亚组装产物进行纯化,然后扩增。
[0108] 图5显示了进一步的示例性组装策略。在靶标或其部分是无法解析(un-parseable)(即无法将序列解析成用于组装的相容片段)的情况中这是特别有用的。一个示例是大型多聚-A轨(A)n或其它重复序列,其中不可能保证n数量个A被组装。如图5,步骤1所示,无法解析的元件可以与突出端(例如,4个核苷酸长)附接并且与辅助片段组装,所述辅助片段包含一个或多个甲基化的RE位点(例如,FspEI位点)或被诸如MlyI的钝端生成型酶所识别的位点。在如步骤2中所示的组装后,产生了环状分子。该环状分子可以是载体主链。
在步骤3中,使用例如FspEI或MlyI,环状分子被消化以去除辅助片段。辅助片段使用例如SPRI珠被清除。可以连接剩下的消化产物以形成分子内键。
[0109] 靶多核苷酸可以在单釜式反应中产生,所有的构建寡核苷酸在该单釜式反应中混合并连接在一起。也可以连续地(一个个连接寡核苷酸)或分级地(将寡核苷酸的亚库连接成一个或多个亚构建体,然后将其连接成最终靶构建体)进行连接。应当注意的是,构建寡核苷酸中的一个或多个,亚构建体中的一个或多个,和/或最终靶构建体可以是非天然产生的,例如,未经甲基化的或以某种方式修饰的(例如,体外化学或生物化学修饰的),因此它们变成半-甲基化的或部分-甲基化的或超甲基化的,或具有非天然产生的甲基化模式。这样的非天然产生的甲基化或甲基化模式可以被用于调节例如基因表达。
[0110] 任选地,在组装前扩增构建寡核苷酸。在一些实施方式中,所有的构建寡核苷酸可以在不扩增的情况下组装在一起(例如,当构建寡核苷酸以相对均一且足够的量提供时)。在某些实施方式中,只有构建体寡核苷酸的子集(例如,代表性不足的(underrepresented)那些)在组装前被扩增。组装可以在一步中,或在多于一步中分级地,或通过一次添加一个构建寡核苷酸连续地,或以上述的任何组合实现,其中的一些构建寡核苷酸以一种方法组装而另一些使用另一方法组装。在一个示例中,在没有扩增的情况下,构建寡核苷酸可以首先被组装成两种或更多种亚构建体。亚构建体可以任选地被扩增,并且然后以一个步骤或多个步骤组装成具有预定靶序列的最终构建体。
[0111] 本公开的方法和组合物可以被用于组装长型多核苷酸(例如,10kb或更长)。在某些实施方式中,由芯片合成的小型寡核苷酸(例如,100-800bp或500-800bp)可以使用或不使用本公开的方法和组合物被首先组装成中间体多核苷酸。然后可以将该中间体多核苷酸克隆到质粒,其可以被导入宿主,经由培养扩增,分离和纯化,使用本公开的方法和组合物切割,然后进行进一步的组装。该过程可以重复数次,直到最终长型产物被组装。
[0112] 此外,或者作为直接连接或聚合酶辅助的组装的替代,也可以使用其它方法来组装本公开的切割产物。在一些实施方式中,切割产物可以经由SLiCE(无缝连接克隆提取)进行同源重组,例如Zhang等,Nucleic acids research 40.8(2012):e55-e55和美国专利公开号20130045508中所述,通过引用将其全部内容纳入本文。简言之,SLiCE是一种限制性位点独立性克隆/组装方法,其基于细菌细胞提取物中同源短区域(15–52bp)之间的体外重组,所述细菌细胞提取物源自经工程改造以包含优化的λ原噬菌体Red重组系统的RecA缺陷型菌株。也可以使用其它重组方法,诸如在酵母或噬菌体中的重组。切割产物可以进行例如Gibson等,Nature Methods 6(5):343–345和美国专利号20090275086和20100035768中所述的吉布森(Gibson)组装,通过引用将其全部内容纳入本文。在吉布森组装中,将包含与邻近DNA片段重叠的约20-40碱基对的DNA片段与三种酶混合,所述三种酶为核酸外切酶、DNA聚合酶和DNA连接酶。在一管式(one-tube)反应中,核酸外切酶产生突出端,从而使得邻近DNA片段可以退火,DNA聚合酶掺入核苷酸以填充任何缺口,而连接酶共价地接合DNA片段。
[0113] 本文所公开的终止子寡聚物和引物中的一个或多个可以被甲基化,从而使得终止子附连的产物或扩增的产物可以被诸如MspJI、SgeI和FspEI的甲基化-敏感型核酸酶消化。这样的核酸酶共享IIM型和IIS型特性;因此,其只识别甲基化-特异性的4-bp位点mCNNR(N=A或T或C或G;R=A或G),并且切割该识别序列外侧的DNA。甲基化的引物及其应用在Chen等,Nucleic Acids Research,2013,第41卷,第8号,e93中公开,通过引用其全部内容将其纳入本文。
[0114] 应当理解的是,本公开的组合物和细胞能够在生物技术的各种领域中应用,并且特别是合成生物技术中。例如,可以使用本公开的方法。
[0115] 本公开的各个方面可以单独使用、组合使用、或者以前面描述的实施例中未具体讨论的各种配置使用,因此在其应用上不限于在前面的描述中阐述的或者在附图中示出的部件的细节和布置。例如,一个实施方式中描述的方面可以以任何方式与其他实施方式中描述的方面组合。
[0116] 在权利要求中使用诸如“第一”,“第二”,“第三”等来修饰权利要求的顺序术语本身并不意味着一个权利要求要素相对于另一要素的任何优先级、优先顺序或顺序、或者执行方法的行为的时间顺序,而是仅被用作标记,以区分具有某一名称的一个权利要求要素与具有相同名称的另一要素(但使用了序数词则)来区分权利要求要素。
[0117] 而且,本文所用的词语和术语是为了描述目的,而不是限制性的。本文使用“包含”、“包括”、或“具有”、“含有”、“涉及”及其变化意味着涵盖其后列出的项目及其等价物以及额外的项目。“基本上由...组成”是指包括其后列出的项目,并且对未列举的项目开放,这些项目不实质上影响本发明的基本和新颖性。
[0118] 通过引用纳入
[0119] 通 过 E F S - W e b 在 2 0 1 6 年 1 2 月 2 1 日 创 建 的 名 为“127662015301SequenceListing.txt”的具有424字节大小的ASCII文本文件通过引用其全部内容纳入本文。
[0120] 本文提到的所有发表物、专利和序列数据库条目在此通过引用全文纳入,就好像各个单独发表物或专利特定和单独地表明通过引用纳入。
QQ群二维码
意见反馈