首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 带标签DNA片段的产生

带标签DNA片段的产生

申请号 CN201480072947.1 申请日 2014-12-11 公开(公告)号 CN105899683A 公开(公告)日 2016-08-24
申请人 凯杰有限公司; 发明人 约安娜·安德里欧; 方南; 德科·洛斐尔特; 安尼卡·彼得罗夫斯基;
摘要 本 发明 涉及用于产生靶DNA的带标签DNA 片段 和与其相关的核酸分子的新方法、 试剂 盒 和用途。
权利要求

1.一种用于产生靶DNA的带标签DNA片段的方法,所述方法包括:
(i)将所述靶DNA与整合酶和包含整合酶识别位点的至少一种DNA接头分子相接触,以获得反应混合物,
(ii)将所述反应混合物在其中所述整合酶催化所述至少一种接头分子的3’加工和链转移反应的条件下温育,其中
(a)所述靶DNA被片段化以产生多个靶DNA片段,并且
(b)所述至少一种DNA接头分子被连接到所述多个靶DNA片段中的每个的至少一个末端,
以产生所述靶DNA的多个带标签DNA片段。
2.权利要求1的方法,其特征在于在步骤(ii)(b)中,所述至少一种DNA接头分子被连接到所述多个靶DNA片段中的每个的两个末端。
3.权利要求1或2的方法,其特征在于所述至少一种DNA接头分子还包含用于寡核苷酸退火的位点,优选地所述用于寡核苷酸退火的位点被构造成用于PCR引物和/或测序引物退火。
4.权利要求1或2的方法,其在步骤(ii)后还包括下述步骤:
(ii)′对所述靶DNA的所述多个带标签DNA片段进行PCR,以向所述至少一种DNA接头分子添加用于寡核苷酸退火的位点,优选地所述用于寡核苷酸退火的位点被构造成用于PCR引物和/或测序引物退火。
5.前述权利要求任一项的方法,其特征在于所述整合酶选自反转录病毒整合酶,包括HIV整合酶,以及源自于反转录病毒整合酶的整合酶。
6.前述权利要求任一项的方法,其特征在于所述至少一种DNA接头分子由包含互补核苷酸序列并彼此特异性杂交的两个核酸分子构成,所述接头分子选自:
接头1(SEQ ID no.1+SEQ ID no.2),
接头2(SEQ ID no.3+SEQ ID no.2),
接头3(SEQ ID no.6+SEQ ID no.2),
接头4(SEQ ID no.7+SEQ ID no.2),
接头5(SEQ ID no.8+SEQ ID no.4),
接头6(SEQ ID no.9+SEQ ID no.4),
接头7(SEQ ID no.8+SEQ ID no.5),
接头8(SEQ ID no.9+SEQ ID no.5),
接头9(SEQ ID no.14+SEQ ID no.15),
接头10(SEQ ID no.10+SEQ ID no.11),
接头11(SEQ ID no.12+SEQ ID no.13)。
7.前述权利要求任一项的方法,其在步骤(ii)和/或(ii)′后还包括下述步骤:
(iii)纯化所述靶DNA的所述多个带标签DNA片段。
8.前述权利要求任一项的方法,其特征在于它在一个反应容器内进行。
9.一种用于产生靶DNA的带标签DNA片段的试剂盒,所述试剂盒包含:
(i)整合酶,以及
(ii)包含整合酶识别位点的至少一种DNA接头分子。
10.权利要求9的试剂盒,其还包含至少一对PCR引物,所述至少一对PCR引物被构造成在PCR反应中向所述至少一种DNA接头分子添加用于寡核苷酸退火的位点,优选地所述用于寡核苷酸退火的位点被构造成用于PCR引物和/或测序引物退火。
11.权利要求9的试剂盒,其特征在于所述至少一种DNA接头分子还包含用于寡核苷酸退火的位点,优选地所述用于寡核苷酸退火的位点被构造成用于PCR引物和/或测序引物退火。
12.前述权利要求任一项的试剂盒,其特征在于所述整合酶选自反转录病毒整合酶,包括HIV整合酶,以及源自于反转录病毒整合酶的整合酶。
13.前述权利要求任一项的试剂盒,其特征在于所述至少一种DNA接头分子由包含互补核苷酸序列并彼此特异性杂交的两个核酸分子构成,所述接头分子选自:
接头1(SEQ ID no.1+SEQ ID no.2),
接头2(SEQ ID no.3+SEQ ID no.2),
接头3(SEQ ID no.6+SEQ ID no.2),
接头4(SEQ ID no.7+SEQ ID no.2),
接头5(SEQ ID no.8+SEQ ID no.4),
接头6(SEQ ID no.9+SEQ ID no.4),
接头7(SEQ ID no.8+SEQ ID no.5),
接头8(SEQ ID no.9+SEQ ID no.5),
接头9(SEQ ID no.14+SEQ ID no.15),
接头10(SEQ ID no.10+SEQ ID no.11),
接头11(SEQ ID no.12+SEQ ID no.13)。
14.整合酶在产生靶DNA的带标签DNA片段的文库中的用途,优选地所述带标签DNA片段的文库是用于DNA测序的文库,所述DNA测序优选地通过下一代测序来进行。
15.一种核酸分子,其包含选自SEQ ID no.1至15的核苷酸序列。

说明书全文

带标签DNA片段的产生

[0001] 本发明涉及用于产生靶DNA的带标签DNA片段和与其相关的核酸分子的新方法、试剂盒和用途。

技术领域

[0002] 本发明涉及分子生物学领域,更具体来说涉及DNA片段的产生,特别是涉及靶DNA的多个带标签DNA片段或相应的文库的产生。

背景技术

[0003] 对于现代分子生物学技术中的许多应用来说,需要带标签的DNA片段。例如,在诸如下一代测序(NGS)的应用中,待测序的DNA必须以片段化形式提供,然后扩增最终作为测序反应的底物的簇。此外,必须向模板的两个末端添加接头序列,以确保标引、片段的扩增并提供对测序引物特异性的序列。
[0004] 目前,使用不同方法来处理模板并产生带标签的DNA片段或其相应的文库。这些已知方法是基于核酸的物理或酶促消化以及随后的酶反应来制备适合用于测序的末端,例如片段的酶促末端修复、A添加和接头连接。
[0005] 在本领域中描述了一种制备带标签DNA片段的文库的方法,所述方法包括在一个步骤中进行酶促片段化和接头连接。两个反应都由被称为转座酶的酶执行,所述转座酶使用小的dsDNA转座子样分子同时对模板或靶DNA进行片段化和加标签。所述片段化和同时的接头连接是基于转座酶的使用。这种技术被公开在WO 2010/048605A1中。它也是NexteraTM DNA试剂盒的主题。
[0006] 然而,使用转座酶和dsDNA转座子样分子进行片段化和同时的接头连接具有几个缺点。链转移反应隐含的切割和粘贴机制是复杂的。转座酶反应可引起dsDNA转座子样分子和靶DNA两者的核苷酸序列的变化。因此,随后的DNA测序反应可能产生不正确的结果。此外,转座酶的相对长的识别序列需要被包含在所述dsDNA转座子样分子中。这些序列或者被设计成测序引物的一部分并造成在与不同平台和/或文库索引一起使用中灵活性较低,或者作为每个测序模板的一部分被测序,造成测序能的浪费。
[0007] 针对这一背景,本发明的目标是提供一种产生靶DNA的带标签DNA片段的方法,在所述方法中与现有技术相关的问题可以被减少或避免。
[0008] 本发明满足了这些以及其他需求。

发明内容

[0009] 本发明提供了一种用于产生靶DNA的带标签DNA片段的方法,所述方法包括:
[0010] (i)将所述靶DNA与整合酶和包含整合酶识别位点的至少一种DNA接头分子相接触,以获得反应混合物,
[0011] (ii)将所述反应混合物在所述整合酶催化所述至少一种接头分子的3’加工和链转移反应的条件下温育,其中
[0012] (a)所述靶DNA被片段化以产生多个靶DNA片段,并且
[0013] (b)所述至少一种DNA接头分子被连接到所述多个靶DNA片段中的每个的至少一个末端,
[0014] 以产生所述靶DNA的多个带标签DNA片段。
[0015] 本发明还提供了整合酶在产生靶DNA的带标签DNA片段的文库中的用途。
[0016] 本发明人令人吃惊地认识到,整合酶可用于产生靶DNA的带标签DNA片段或产生由这些带标签DNA片段构成的文库。与WO 2010/048605中所公开的基于转座酶的片段化和同时的接头连接相反,由于整合酶与转座酶相比具有较低选择性,本发明的方法提供了具有更好的覆盖均匀度的解决方案。整合酶的酶反应复杂性较低,并且DNA接头分子的链转移或整合不改变核苷酸序列,因此确保了随后测序反应中的高精度。整合酶识别位点比转座酶识别位点短,使得带标签DNA片段或其得到的文库更加灵活。
[0017] 本发明的方法允许在仅仅一个步骤中产生多个带标签DNA片段或文库,并将工作时间从1天减少到1至2小时。获得的带标签DNA片段可用于不同NGS平台中。
[0018] 当在本文中使用时,“靶DNA”是指经历反应混合物以产生其带标签片段的任何目标双链DNA(dsDNA)。“靶DNA”可以源自于任何体内或体外来源,包括源自于一个或多个细胞、组织、器官或生物体,不论是活的还是死的,是原核还是真核,或源自于任何生物来源或环境来源。通常但不是排他地,“靶DNA”是指核苷酸序列将通过测序例如下一代测序(NGS)来阐明的这种dsDNA。
[0019] 当在本文中使用时,“DNA片段”是指靶DNA的一部分或片段或区段,其从更长的DNA分子切下或释放出来或断裂下来,使得它不再连接到母体分子。
[0020] 当在本文中使用时,“整合酶”是指具有由反转录病毒例如HIV产生的反转录病毒整合酶的酶活性的蛋白质。它能够将DNA接头分子优选地经由它的整合酶识别位点,通过DNA接头分子或相应的整合酶识别位点的3’加工整合到靶DNA中,并将所述DNA接头分子转移到所述靶DNA,由此产生所述靶DNA的带标签DNA片段。
[0021] 当在本文中使用时,“DNA接头分子”是指被连接到靶DNA的片段的一个或两个末端以便提供标签的dsDNA分子。通常,“DNA接头分子”具有约5至100bp之间的长度。因此,“DNA接头分子”不能等同于例如在WO 2010/048605A1中所使用的dsDNA转座子样分子。
[0022] 当在本文中使用时,“整合酶识别位点”是指dsDNA或相应的DNA接头分子的区段或序列,其被整合酶特异性且选择性地识别和结合,从而允许所述DNA接头分子整合和/或转移到所述靶DNA。“整合酶识别位点”包括或可以体现为被称为长末端重复序列(LTR)的核苷酸序列。
[0023] 当在本文中使用时,“加标签”是指将DNA接头分子连接到靶DNA分子的过程。经历加标签或含有标签的DNA被称为“带标签的”,例如“带标签DNA”。
[0024] “催化所述至少一种DNA接头分子的加工和链转移反应”的条件对于本领域技术人员来说是公知的。这种条件为整合酶提供了允许后者发挥其酶活性的环境。这种条件还确保整合酶、靶DNA和DNA接头分子能够相互作用以允许整合酶反应。
[0025] 带标签DNA片段或多个DNA片段的产生还包括产生带标签片段的文库的概念。
[0026] 本发明的方法远不是显而易见的。
[0027] 到目前为止,将病毒核酸整合到宿主DNA中的原理仅仅被用于开发可用于测试整合酶的活性及其抑制剂的测定法。就此而言,可以参考下列关于1型HIV整合酶的出版物:Inayoshi等,(2010),转录因子YY1与反转录病毒整合酶相互作用并促进莫罗尼鼠类白血病病毒cDNA在宿主染色体中的整合(Transcription factor YY1interacts with retroviral integrases and facilitates integration of moloney murine leukemia virus cDNA into the host chromosomes),J.Virol.84(16),p.8250-8261;Goodarzi等,(1995),反转录病毒样DNA被人类免疫缺陷病毒1型整合酶的协调整合(Concerted integration of retrovirus-like DNA by human immunodeficiency virus type 
1integrase),J.Virol.69(10),p.6090-6097;Ellison等,(1994),整合酶与病毒DNA末端之间的稳定复合物介导人类免疫缺陷病毒的体外整合(A stable complex between integrase and viral DNA ends mediates human immunodeficiency virus integration in vitro),Proc.Natl.Acad.Sci.USA 91(15),p.7316-7320;Yoshinaga等,(1995),1型人类免疫缺陷病毒的整合信号序列内的基在体外的不同作用(Different roles of bases within the integration signal sequence of human 
immunodeficiency virus type 1 in vitro),J.Virol.69(5),p.3233-3236;Quashie等,(2012),靶向HIV整合酶的新的治疗策略(Novel therapeutic strategies targeting HIV integrase),BMC Med.10,p.34;Pruss等,(1994),人类免疫缺陷病毒整合酶引导向核小体核心内严重DNA扭曲位点的整合(Human immunodeficiency virus integrase directs integration to sites of severe DNA distortion within the nucleosome core),Proc.Natl.Acad.Sci.USA 91(13),p.5913-5917;Tsuruyama等,(2010),体外HIV-1选择性整合到靶序列中以及修饰序列的诱饵效应(In vitro HIV-1 selective integration into the target sequence and decoy-effect of the modified sequence),PLoS One.5(11),e13841;Hansen等,(1999),源自于HIV载体的用于体外快速测定法的整合复合物(Integration complexes derived from HIV vectors for rapid assays in vitro),Nat.Biotechnol.17(6),p.578-582;Delelis等,(2008),整合酶和整合:HIV-1整合酶的生物化学活性(Integrase and integration:biochemical activities of HIV-1 integrase),Retrovirology 5,p.114。
[0028] 下面的出版物涉及AMV整合酶:Narezkina等,(2004),禽肉瘤病毒整合位点的基因组广度的分析(Genome-wide analyses of avian sarcoma virus integration sites),J.Virol.78(21),p.11656-11663;Yao等,(2003),禽反转录病毒整合酶增强的转入基因在哺乳动物细胞DNA中的体内整合(Avian retrovirus integrase-enhanced transgene integration into mammalian cell DNA in vivo),Biotechniques 35(5),p.1072-1078。
[0029] 下面的出版物聚焦于绵羊髓鞘脱落病毒的整合酶:Katzman等,(1994),纯化的绵羊髓鞘脱落病毒整合酶的体外活性(In vitro activities of purified visna virus integrase),J.Virol.68(6),p.3558-3569。
[0030] 下面的出版物涉及M-MuLV的整合酶:Dildine等,(1998),嵌合的Ty3/莫罗尼鼠类白血病病毒整合酶蛋白在体内有活性(A chimeric Ty3/moloney murine leukemia virus integrase protein is active in vivo),J.Virol.72(5),p.4297-4307。
[0031] 所谓的ZAM整合酶是下述出版物的主题:Faye等,(2008),由LTR-反转录转座子编码的高特异性整合酶的功能特征(Functional characteristics of a highly specific integrase encoded by an LTR-retrotransposon),PLoS One.3(9),e3185。
[0032] HIV、AMV、MuLV整合酶是下述出版物的主题:Dolan等,(2009),确定HIV-1整合酶上的DNA底物结合位点(Defining the DNA substrate binding sites on HIV-1integrase),J.Mol.Biol.385(2),p.568-579。
[0033] 然而,现有技术没有提到将整合酶用于产生靶DNA的带标签DNA片段或相应地由其构成的文库。
[0034] 本发明隐含的目的由此得以完全解决。
[0035] 根据本发明的方法的另一种发展,在步骤(ii)(b)中,所述至少一种DNA接头分子被连接到所述多个靶DNA片段中的每个的两个末端。
[0036] 这种措施具有下述优点:所述靶DNA的带标签DNA片段将以准备在后续反应例如通过NGS的测序反应中加工的方式提供。
[0037] 根据本发明的方法的优选实施方式,所述至少一种DNA接头分子还包含用于寡核苷酸、优选为PCR引物和/或测序引物退火的位点(“引物退火位点”,PAS)。
[0038] 这种措施具有下述优点:所述带标签DNA片段已被提供成“准备扩增”或“准备测序”的状态。
[0039] 所述用于寡核苷酸退火的位点可以被构造成使寡核苷酸引物退火以例如在下一代测序反应(NGS)的情形中通过DNA聚合酶进行延伸,或使寡核苷酸退火以进行捕获或连接反应。所述DNA接头分子可以包含与所述退火位点分隔开的整合酶识别位点或相应的LTR,例如所述整合酶识别位点位于它的第一末端,所述退火位点位于它的第二末端。
[0040] 根据另一个实施方式,本发明的方法在步骤(ii)后还包括下述步骤:(ii)′对所述靶DNA的所述多个带标签DNA片段进行PCR,以向所述至少一种DNA接头分子添加用于寡核苷酸退火的位点,优选地所述用于寡核苷酸退火的位点被构造成用于PCR引物和/或测序引物退火。
[0041] 通过这种可选方法,可以使用仅仅包含整合酶识别位点(IRS)的DNA接头分子。在获得所述带标签DNA片段后,将后者与至少一对PCR引物温育,所述至少一对PCR引物被构造成在PCR反应中向所述至少一种DNA接头分子添加用于寡核苷酸例如PCR引物和/或测序引物退火的位点。所述PCR引物对的第一PCR引物也可以包含能够杂交到所述DNA接头分子的IRS的IRS。所述第一PCR引物还可以包含用于寡核苷酸例如PCR引物和/或测序引物退火的位点。然后,所述PCR引物对的第二PCR引物可以被构造成杂交到所述第一PCR引物,优选地杂交到所述用于寡核苷酸退火的位点。因此,所述PCR引物对的所述第一PCR引物可能长于所述第二PCR引物。对包含所述带标签DNA片段和所述至少一对PCR引物(长和短PCR引物)的所述反应混合物在适合于扩增所述带标签DNA片段的条件下进行PCR,将导致所述带标签DNA片段的富集。并行地,然后通过在所述PCR中添加用于寡核苷酸退火的位点来完成所述带标签DNA片段的DNA接头分子。
[0042] 根据本发明的方法的优选实施方式,所述整合酶选自反转录病毒整合酶,包括HIV整合酶,以及源自于反转录病毒整合酶的整合酶。
[0043] 这种措施具有下述优点:提供了已被证明能提供最佳结果的整合酶。其他适合的整合酶是AMV整合酶、绵羊髓鞘脱落病毒整合酶、MuLV整合酶、ZAM整合酶。
[0044] 当在本文中使用时,“源自于反转录病毒整合酶的整合酶”是指一组具有反转录病毒整合酶的3’加工和链转移活性的酶。根据本发明,源自于反转录病毒整合酶的整合酶也涵盖包含催化整合所必需的所谓的DDE基序的这种整合酶。这些衍生的整合酶可能不含非功能性结构域。这种衍生的整合酶的实例是已被本发明人使用的HIV-1来源的整合酶。它包含HIV-1整合酶的由50至212号基酸构成的“核心”,但是缺少初始的N端和最后的C端氨基酸。
[0045] 根据本发明的方法的另一个优选发展,所述至少一种DNA接头分子由包含互补的核苷酸序列并彼此特异性杂交的两个核酸分子构成,所述接头分子选自:
[0046] 接头1(SEQ ID no.1+SEQ ID no.2),
[0047] 接头2(SEQ ID no.3+SEQ ID no.2),
[0048] 接头3(SEQ ID no.6+SEQ ID no.2),
[0049] 接头4(SEQ ID no.7+SEQ ID no.2),
[0050] 接头5(SEQ ID no.8+SEQ ID no.4),
[0051] 接头6(SEQ ID no.9+SEQ ID no.4),
[0052] 接头7(SEQ ID no.8+SEQ ID no.5),
[0053] 接头8(SEQ ID no.9+SEQ ID no.5),
[0054] 接头9(SEQ ID no.14+SEQ ID no.15),
[0055] 接头10(SEQ ID no.10+SEQ ID no.11),
[0056] 接头11(SEQ ID no.12+SEQ ID no.13)。
[0057] 这种措施具有下述优点:提供了特别适合于本发明方法的这种DNA接头分子。
[0058] 已约定,括号中叙述的第一个序列是指dsDNA接头序列的第一链,括号中叙述的第二个序列是dsDNA接头分子的第二链。
[0059] 根据本发明方法的另一个发展,所述方法还包括:
[0060] (iii)纯化该靶DNA的所述多个带标签DNA片段。
[0061] 这种措施具有下述优点:所述整合酶、非片段化靶DNA、靶DNA和接头DNA的未带标签的片段等通过例如使用QIAquick柱被除去,从而提供了带标签DNA片段的纯化的文库以供进一步使用。
[0062] 如果本发明的方法在一个反应容器内进行,这将是优选的。
[0063] 这种措施体现了“一步”法的原则。尽管本发明的方法被细分成(i)、(ii)和(iii),但这种细分仅仅旨在说明所述方法事件的时间顺序。然而,所述方法的使用者只需在规定条件下产生反应混合物,由此在一个步骤中自动生产所述靶DNA的多个带标签DNA片段或带标签DNA片段的文库。
[0064] 本发明的另一个主题内容涉及一种用于产生靶DNA的带标签DNA片段的试剂盒,所述试剂盒包含:
[0065] (i)整合酶,以及
[0066] (ii)包含整合酶识别位点的至少一种DNA接头分子。
[0067] 就本发明的方法而言,所述至少一种DNA接头分子还包含用于寡核苷酸退火、优选地用于PCR引物和/或测序引物退火的位点。
[0068] 本发明的试剂盒中包含的整合酶选自:反转录病毒整合酶,包括HIV整合酶,源自于反转录病毒整合酶的整合酶。其他适合的整合酶是AMV整合酶、绵羊髓鞘脱落病毒整合酶、MuLV整合酶、ZAM整合酶。
[0069] 根据本发明的试剂盒的另一种发展,所述至少一种DNA接头分子由包含互补的核苷酸序列并彼此特异性杂交的两个核酸分子构成,所述接头分子选自:
[0070] 接头1(SEQ ID no.1+SEQ ID no.2),
[0071] 接头2(SEQ ID no.3+SEQ ID no.2),
[0072] 接头3(SEQ ID no.6+SEQ ID no.2),
[0073] 接头4(SEQ ID no.7+SEQ ID no.2),
[0074] 接头5(SEQ ID no.8+SEQ ID no.4),
[0075] 接头6(SEQ ID no.9+SEQ ID no.4),
[0076] 接头7(SEQ ID no.8+SEQ ID no.5),
[0077] 接头8(SEQ ID no.9+SEQ ID no.5),
[0078] 接头9(SEQ ID no.14+SEQ ID no.15),
[0079] 接头10(SEQ ID no.10+SEQ ID no.11),
[0080] 接头11(SEQ ID no.12+SEQ ID no.13)。
[0081] 试剂盒是可用于执行本发明的方法的各个要素的组合,其中所述要素被优化以一起用于所述方法中。所述试剂盒还含有用于执行本发明的方法的手册。这种试剂盒统一了执行本发明的方法所需的所有必需要素,由此使错误的险最小化。因此,这种试剂盒还允许不太熟练的实验室工作人员执行本发明的方法。
[0082] 本发明的方法的特点、特征和优点经必要修改后适用于本发明的试剂盒和相应的用途。
[0083] 本发明的试剂盒可以包含超过一种例如两种、三种或四种或更多不同的整合酶,以及超过一种DNA接头分子,例如两种、三种、四种等的不同DNA接头分子。所述试剂盒还可以含有一种或多种不同的缓冲组合物,以便为整合酶和整合反应产生最佳环境,还可以含有参比靶DNA等。
[0084] 本发明的另一个主题内容涉及一种核酸分子,其包含选自SEQ ID no.1至15的核苷酸序列。
[0085] 本发明的核酸分子特别适合用于本发明的方法。具体来说,所述核酸分子可以彼此杂交以便形成适合在本发明的方法中直接使用的DNA接头分子。所述杂交安排如下:
[0086] SEQ ID no.1+SEQ ID no.2:接头1
[0087] SEQ ID no.3+SEQ ID no.2:接头2
[0088] SEQ ID no.6+SEQ ID no.2:接头3
[0089] SEQ ID no.7+SEQ ID no.2:接头4
[0090] SEQ ID no.8+SEQ ID no.4:接头5
[0091] SEQ ID no.9+SEQ ID no.4:接头6
[0092] SEQ ID no.8+SEQ ID no.5:接头7
[0093] SEQ ID no.9+SEQ ID no.5:接头8
[0094] SEQ ID no.14+SEQ ID no.15:接头9
[0095] SEQ ID no.10+SEQ ID no.11:接头10
[0096] SEQ ID no.12+SEQ ID no.13:接头11
[0097] 除非另有定义,否则在本文中使用的所有技术和科学术语一般具有与本发明所属领域的普通技术人员所通常理解的相同的含义。
[0098] 不言而喻,上面提到的特点和仍将在下面解释的特点不仅可以以相应指定的组合使用,而且可以以其他组合或独自使用,而不背离本发明的范围。
[0099] 其他特点、特征和优点可以由优选实施方式和附图的描述推断。
[0100] 在附图中:
[0101] 图1示出的图说明了在涉及整合酶的HIV-1整合(左侧)和涉及转座酶的Tn5转座(右侧)中事件顺序的差异。
[0102] 图2示出的图说明了本发明方法的实施方式(A)和关于通过所述方法产生的带标签质粒DNA片段的详细情况(B)。
[0103] 图3示出了琼脂糖凝胶的照片,证实了通过本发明的方法成功产生了带标签的质粒DNA片段。
[0104] 图4示出了使用两种不同循环条件和两种不同反应缓冲液产生的片段化和连接有接头的基因组DNA的电泳图。
[0105] 图5示出的图说明了本发明方法的另一个实施方式。
[0106] 图6示出了使用各种不同的片段化接头和PCR引物混合物产生的片段化和连接有接头的基因组DNA的电泳图。
[0107] 图7示出了使用不同温育温度获得的片段化和连接有接头的基因组DNA的电泳图。实施例
[0108] 本发明方法的中心特点是使用整合酶而不是使用例如如WO 2010/048605中所公开的在现有技术的片段化和同时的接头连接中使用的转座酶。
[0109] 反转录病毒DNA的整合是反转录病毒复制必须履行的步骤,因为原病毒DNA是生产性感染的模板。由整合酶催化的整合过程可以被分成两个顺序反应。第一个反应被称为3’加工,对应于特异性核酸内切反应,其将病毒DNA末端制备成能够胜任随后通过酯交换反应共价插入到宿主细胞基因组中,也被称为链转移。整合酶首先结合到病毒DNA的每个末端处被称为整合酶识别序列(IRS)的短序列或相应的长末端重复序列(LTR),并催化被称为3’加工的内切核苷酸切割,其中从病毒DNA的每个末端消除二核苷酸(denucleotide)。然后将得到的切开的DNA用作整合或链转移的底物,引起病毒DNA共价插入到被感染细胞的基因组中。该第二个反应在病毒DNA分子的两个末端同时发生,其中两个相反插入点之间的偏距(offset)为正好5个碱基对。
[0110] 在图1中,在HIV-1整合(左侧)与Tn5转座(右侧)的比较中说明了这些事件。HIV-1:I)供体DNA;II)整合酶催化的3’加工;III)整合酶催化的链转移;IV)链转移的产物;V)DNA修复的链转移产物。Tn5转座子:1)供体DNA;2)3’加工;3-4)5’加工,其由环形成(3)和平末端DNA的产生(4)构成;5)链转移;6)修复的链转移产物。
[0111] 图2示出了本发明方法的图解说明。将各自包含整合酶识别位点(IRS)和引物退火位点(PAS)的两个DNA接头分子(接头1和2)与整合酶(INT)以及待片段化和加标签的靶DNA温育;参考图2A上方部分。
[0112] 整合酶(INT)结合到接头分子接头1和2的IRS和靶DNA,并催化3’加工和链转移;参考图2A中间部分。
[0113] 在图2A的下方部分中,示出了整合酶反应的结果,即在其两个末端处具有连接的接头的片段化和带标签的靶DNA,其中所述接头通过接头相应的IRS区段连接,从而将PAS暴露在所述片段化和带标签的靶DNA的末端。
[0114] 在图2B中,更详细示出了所述片段化和带标签的靶DNA。所述片段化和带标签的靶DNA在其末端处包含PAS区段,允许PCR引物的退火和后者在3’方向上的延伸。
[0115] 在本发明的方法中,整合酶反应被用于将基因组DNA片段化并将DNA接头分子连接到两个末端。然后可以将DNA接头分子用于例如产生的带标签和片段化的靶DNA的扩增以及随后的簇产生和测序。
[0116] 示例性使用了两种不同的HIV整合酶,即密码子优化、内部表达和纯化的HIV-1来源的整合酶,其具有如SEQ ID no.16所示序列的171个氨基酸。所述HIV-1来源的整合酶大小为18.97kDa,并包含由50至212号氨基酸表示的HIV整合酶的核心结构域。这种整合酶被称为“QHIN 1”。所述HIV-1来源的整合酶催化去整合反应而不是整合(3’加工和转移)。∈=27965;pI(理论值):pH 7.82;突变:F185K(溶解性)。
[0117] 第二种整合酶是可商购的野生型HIV-1整合酶(BioProducts MD,LLC,Middletown,MD,United States of America)。这种整合酶被称为“BPHIN 1”。
[0118] 设计了不同的接头分子,以包含用于HIV-1整合酶的识别位点和可用于文库扩增和随后在Illumina NGS平台上测序的序列。下面的表1包含了本发明人用于形成DNA接头分子的序列:
[0119]
[0120] 表1:用于产生DNA接头分子的序列
[0121] 接头分子通过将前面列出的寡核苷酸以不同比率彼此混合来形成。首先在98℃进行2分钟的变性步骤以消除所述寡核苷酸的推测的二级结构,然后将探针缓慢冷却下来以允许互补的寡核苷酸退火。下面的表2示出了不同接头的制剂。
[0122]
[0123] 表2:DNA接头分子
[0124] 在第一种可行性测定法中,使用IN接头1至11与密码子优化的内部表达的HIV-1来源的整合酶(QHIN 1)的组合对细菌质粒DNA(pGL2)同时进行片段化和接头连接。
[0125] 实验安排如下:
[0126]
[0127] *缓冲液2x:10mM MnCl2,40mM HEPES(pH 7.5),2mM二硫苏糖醇,0.1%Nonidet P40,1mM CHAPS,40mM NaCl。
[0128] 在37℃温育10min以形成整合复合物。
[0129]
[0130] 在37℃温育1h进行质粒靶DNA的片段化和同时的接头连接。
[0131] 在温育后,将片段化并连接有接头的DNA用QIAquick柱和反应清理方案进行纯化。琼脂糖凝胶分析显示没有片段,因为质粒和片段的浓度太低而不能在琼脂糖凝胶上被观察到。然后使用接头特异性引物扩增片段化并连接有接头的DNA。对于IN接头1和2来说,没有可商购的PCR引物。对于IN接头3至8来说,使用Illumina P1和P2引物,对于IN接头9来说使用RB引物,对于IN接头10和11来说使用U5LTR和U3LTD引物。
[0132] 在下表中列出了所使用的PCR引物的序列。
[0133]PCR引物: 序列 SEQ ID no.
引物P1 AAT GAT ACG GCG ACC ACC GA 17
引物P2 CAA GCA GAA GAC GGC ATA CGA 18
U5LTR正向 GTGTGCCCGTCTGTTGTGT 19
U5LTR反向 CCACACTACCAAAAAGGTCTGA 20
U3LTR正向 ACTCCAAGCAAAGGCAAGAT 21
U3LTR反向 TGGGAAGTAGCCTTGTGTGTT 22
RB引物 AG GAT CCG AGT GAA TTA GCC CT 23
[0134] 表3:使用的PCR引物
[0135] 下面列出了PCR设置方案和循环条件。
[0136]MMX 浓度 在RXN中的浓度 μL
HotStarTq MMX 2x   1x 25
正向引物 10μM 0,3μM 1.5
反向引物 10μM 0,3μM 1.5
或引物混合物 10μM 0,3μM 3
模板     5
无Rnase     17
总体积     50
[0137]
[0138] 在2%琼脂糖凝胶中分析扩增子,其显示出质粒DNA的片段化,其中尺寸在250至1000bp之间(图3A)。
[0139] 为了观察所述片段化是否是由PCR中剩余的接头引起的效应,使用相同的片段化并连接过的样品进行第二个PCR,并将仅使用接头的PCR作为“无模板对照”(NTC)。仅使用接头(NTC)时没有获得扩增子。图3B示出了琼脂糖凝胶,利用所述琼脂糖凝胶将扩增的片段化并连接过的DNA与相应的接头扩增(NTC)进行并排分析。
[0140] 在第二个实验中,使用第二种HIV-1整合酶(野生型HIV整合酶;Bio Products MD,LLC,Middletown,MD,USA)(BPHIN 1),使用性能最好的接头对质粒DNA(pGL2)进行片段化和连接。在这个测定法中使用IN接头7和成对的IN接头7与8。
[0141] 测定法
[0142]
[0143] *缓冲液2x:10mM MnCl2,40mM HEPES(pH 7.5),2mM二硫苏糖醇,0.1%Nonidet P40,1mM CHAPS,40mM NaCl。
[0144] 在37℃温育10min
[0145]
[0146] 在37℃温育1h
[0147] 使用Illumina引物P1和P2扩增所述片段化并连接有接头的靶DNA,并在琼脂糖凝胶上进行分析。结果示出在图3C中。再一次获得了质粒的片段化,其中片段尺寸在150至500bp之间。
[0148] 为了测试这些结果是否是来自于非特异性质粒扩增的假象,与所述片段化并连接有接头的质粒DNA平行地使用P1和P2引物对所述质粒进行扩增,并在琼脂糖电泳中进行分析。结果示出在图3D中。可以看出,使用质粒和接头时在凝胶图像中没有获得扩增。
[0149] 在通过使用质粒作为靶DNA测试本发明后,下一步是测试通过本发明的方法是否能够使用基因组DNA作为靶DNA来产生文库。在下面的实验中,使用大肠杆菌(E.coli)DNA作为靶DNA来产生片段化的DNA,在片段的末端上带有可用于这些片段的扩增和随后在NGS平台上测序的接头。
[0150] 对于下面的设置来说,使用性能最好的接头IN_接头_7和IN_接头_8。平行地测试储存在两种不同缓冲液(D和W)中的QHIN_1。将来自于大肠杆菌的100ng基因组DNA作为靶DNA来进行片段化和接头连接。
[0151] 实验设置:
[0152] QHIN_1储存缓冲液
[0153] D:Dar缓冲液
[0154] 25mM Tris-HCl pH7,4
[0155] 1M NaCl
[0156] 7,5mM CHAPS
[0157] 1mM DTT
[0158] 50%甘油
[0159] W:Wang50缓冲液
[0160] 20mM HEPES pH7,35
[0161] 1M NaCl
[0162] 1mM DTT
[0163] 50%甘油
[0164] 使用0.2μM接头制备两种主混合物(MMX)。
[0165]
[0166] 在温育后,将样品用QiaQuick柱纯化,并使用两种不同的循环条件用引物P1和P2进行PCR扩增,以便调查在常规循环之前是否需要补全链中由整合引起的间隙。
[0167] PCR设置被描述在下面的表中:
[0168]
[0169] 循环条件
[0170]
[0171]
[0172] 在PCR后,使用Agencourt AMPure XP珠子除去剩余的接头和引物,并通过毛细管电泳和使用Agilent DNA芯片分析探针。
[0173] 图4示出了所有样品的电泳图:
[0174] 1:D 100 1;Dar缓冲液/100ng gDNA/1.循环
[0175] 2:W 100 1;Wang50缓冲液/100ng gDNA/1.循环
[0176] 3:D 100 2;Dar缓冲液/100ng gDNA/2.循环
[0177] 4:W 100 2;Wang50缓冲液/100ng gDNA/2.循环。
[0178] 在这里,可以看到扩增的DNA的片段,其主要尺寸分布在1000-5000bp之间。这意味着发生了片段化和接头连接,并且产生的片段可以使用引物P1和P2来扩增。
[0179] 进行了进一步的实验以优化片段的尺寸分布,而没有给出不同的结果(数据未示出)。这是本发明人试图使用仅包含整合酶识别位点(IRS)的短接头进行片段化,然后通过添加引物退火位点(PAS)在PCR上完成接头序列的原因。这个实施方式的原理示出在图5中。在将靶DNA同时片段化和连接接头(上方部分)后,然后对连接的片段进行PCR(下方部分)。
在所述PCR中使用两对PCR引物。第一对PCR引物由各自包含能够与连接有接头的DNA片段的整合酶识别位点(IRS)杂交的IRS并各自包含引物退火位点(PAS1或PAS2)的两条引物构成。
第二对PCR引物由各自分别能够与引物退火位点PAS1或PAS2杂交的两条引物(P1和P2)构成。在随后的PCR中,将连接有接头的DNA片段扩增,并通过添加引物退火位点PAS 1和PAS2来完成所述接头。
[0180] 因此,对于进一步的片段化实验来说,使用包含IRS但没有PAS的片段化接头(IN_接头1;IN_接头_2)、PCR引物混合物-1(21/21plus_IN_4(SEQ ID no.6);21/21plus_IN_5(SEQ ID no.7);引物P1(SEQ ID no.17);引物P2(SEQ ID no.18))或PCR引物混合物-2(6/6plus_IN_6(SEQ ID no.8);6/6plus_IN_7(SEQ ID no.9);引物P1(SEQ ID no.17);引物P2(SEQ ID no.18))。“长的”PCR引物21/21plus_IN_4和21/21plus_IN_5或6/6plus_IN_6和6/
6plus_IN_7分别包含IRS和PAS。“短的”PCR引物P1和P2可以杂交到相应的PAS。
[0181] 将来自于大肠杆菌的100ng gDNA用来自于上表的接头和引物制剂进行处理,并在Agilents Bioanalyzer上使用Agilent DNA芯片进行分析。图6示出了使用引物混合物1(A;C)和引物混合物2(B;D)扩增后片段的分布。
[0182] 3:1.IN1;IN接头1/引物混合物1
[0183] 1:1.N1_0;IN接头1/引物混合物1_无模板对照
[0184] 7:2.IN1;IN接头1/引物混合物2
[0185] 5:2.N1_0;IN接头1/引物混合物2_无模板对照
[0186] 4:1.IN2;IN接头2/引物混合物1
[0187] 2:1.N2_0;IN接头2/引物混合物1_无模板对照
[0188] 8:2.IN2;IN接头2/引物混合物2
[0189] 6:2.N2_0;IN接头2/引物混合物2_无模板对照
[0190] 可以看出,通过使用IN_接头2和PCR引物混合物1产生了最佳结果,这是因为获得了更好的片段分布。
[0191] 为了优化片段化,计划使用IN接头2进行进一步实验。
[0192] 测试了不同浓度和温育温度以及纯化程序,以获得文库的更好的尺寸分布并除去残留接头。
[0193] 图7示出了在不同温育温度下100ng大肠杆菌gDNA的片段化和接头连接。令人吃惊的是,在这里使用的内部HIV-整合酶(QHIN_1)显示出相当高的热稳定性,其允许文库在更高温度下温育并产生文库的更好的尺寸分布。
[0194] A:
[0195] 1:30;IN接头_2复合物与靶DNA在30℃下温育
[0196] 3:37;IN接头2复合物与靶DNA在37℃下温育
[0197] 5:40;IN接头2复合物与靶DNA在40℃下温育
[0198] 7:45;IN接头2复合物与靶DNA在45℃下温育
[0199] B:
[0200] 1:37;IN接头2复合物与靶DNA在37℃下温育
[0201] 3:50;IN接头2复合物与靶DNA在50℃下温育
[0202] 5:55;IN接头2复合物与靶DNA在55℃下温育
[0203] 7:60;IN/接头2复合物与靶DNA在60℃下温育
[0204] 根据示出的数据,本发明人能够使用HIV-1-整合酶和gDNA重现质粒片段化的结果。所述测定法已被优化以产生具有适用于几种NGS平台的尺寸分布的文库。
[0205] 概述上述结果,本发明人已成功测试了不同的整合酶,以开发本发明的用于在仅仅一个步骤中产生带标签靶DNA的片段文库的方法。
QQ群二维码
意见反馈