核苷酸序列的概率导向分离(PINS)

申请号 CN201380073618.4 申请日 2013-12-20 公开(公告)号 CN105189781B 公开(公告)日 2017-06-06
申请人 赛普有限责任公司; 发明人 托马斯·奎斯特; 玛丽·尤斯特·米克尔森;
摘要 本 发明 涉及一种体外方法,其中逐步地提高含有目标DNA 片段 的靶核苷酸序列的 频率 ,其通过多轮1)稀释含有目标DNA片段的样品至多个复制品(分离)、2)随机扩增复制品中的DNA(浓缩)、3)在至少一个稀释并扩增的复制品中检测目标DNA片段(选择)并且重复步骤1)~3)直到通过标准的测序技术能够对目标DNA片段进行测序。
权利要求

1.一种从包含DNA分子群的混合多核苷酸样品富集靶DNA分子的体外方法,其包含步骤:
(a)提供含有所述靶DNA分子的混合多核苷酸样品,其中所述靶DNA分子包含一个或多个至少10个核苷酸的独特连续序列,
(b)连续稀释所述混合多核苷酸样品直到在混合多核苷酸的稀释样品中检测所述靶DNA分子的概率低于0.75,和
(c)通过制备等分试样的方式,产生足够数量的所述混合多核苷酸的稀释样品的复制品直到在复制稀释样品的至少一个中检测所述靶DNA分子的概率为至少0.75;
(d)在所述复制稀释样品中扩增所述DNA分子群以提高所述DNA分子群在每个样品中的丰度;
(e)检测所述靶DNA分子在步骤(d)中扩增的所述复制稀释样品中的存在或不存在,其中所述靶DNA分子在所述复制稀释样品中的频率与步骤(a)中的所述混合多核苷酸样品相比得到了提高;
(f)连续稀释至少一个在步骤(e)中被检测为含有所述靶DNA分子的复制稀释样品直到在稀释样品中检测所述靶DNA分子的概率低于0.75,并且重复步骤(c)至(e)或重复步骤(c)至(f)至少一次,
其中,使用超几何分布等式来计算样品中检测所述靶DNA分子的概率:

其中:
x=稀释的测试样品中的阳性的数目
n=稀释的测试样品的体积*1000
M=原始样品中靶DNA分子的数目
N=原始样品的体积*1000。
2.根据权利要求1所述的方法,其中,在步骤(b)中,连续稀释所述混合多核苷酸样品直到在混合多核苷酸的稀释样品中检测所述靶DNA分子的概率低于0.50。
3.根据权利要求1所述的方法,其中,在步骤(b)中,连续稀释所述混合多核苷酸样品直到在混合多核苷酸的稀释样品中检测所述靶DNA分子的概率低于0.25。
4.根据权利要求1所述的方法,其中,在步骤(c)中,通过制备等分试样的方式,产生足够数量的所述混合多核苷酸的稀释样品的复制品直到在复制稀释样品的至少一个中检测所述靶DNA分子的概率为0.80~0.95。
5.根据权利要求1所述的方法,其中在步骤(a)的混合多核苷酸样品中,所述靶DNA分子相对于非靶DNA分子的频率为10-2和10-7之间。
6.根据权利要求1所述的方法,其中在步骤(a)的混合多核苷酸样品中,所述靶DNA分子相对于非靶DNA分子的频率为10-4和10-7之间。
7.根据权利要求1-6中任一项所述的方法,其中对步骤(b)中所述混合多核苷酸样品的连续稀释品进行扩增以提高所述DNA分子群在每个样品中的丰度,随后为检测所述靶DNA分子在每个扩增的样品中的存在或不存在的步骤,并由此确定为获得在其中检测所述靶DNA分子的概率低于0.75的稀释样品所需的连续稀释的次数。
8.根据权利要求1-6中任一项所述的方法,其中在步骤(d)中通过选自于随机简并引物PCR、接头连接PCR、简并寡核苷酸引物(DOP)PCR和多重置换扩增的技术来扩增所述DNA分子群。
9.根据权利要求7所述的方法,其中在步骤(d)中通过选自于随机简并引物PCR、接头连接PCR、简并寡核苷酸引物(DOP)PCR和多重置换扩增的技术来扩增所述DNA分子群。
10.根据权利要求1所述的方法,进一步包含步骤(g)在所述靶DNA分子上进行核酸序列分析以确定所述靶DNA分子的核苷酸序列的至少一部分。
11.根据权利要求1-6中任一项所述的方法,其中通过PCR检测在所述靶DNA分子中所述一个或多个至少10个核苷酸的独特连续序列的存在。
12.根据权利要求1-6中任一项所述的方法,其中通过与所述靶DNA分子的杂交来检测在所述靶DNA分子中所述一个或多个至少10个核苷酸的独特连续序列的存在。
13.根据权利要求1所述的方法,其中所述靶DNA分子包含至少两个至少10个核苷酸的独特连续序列,并且其中所述靶DNA分子包含50~100,000个核酸基对。
14.根据权利要求1所述的方法,其中所述靶DNA分子包含至少两个至少10个核苷酸的独特连续序列,并且其中所述靶DNA分子包含150~3,000个核酸碱基对。
15.根据权利要求1所述的方法,其中所述靶DNA分子包含至少两个至少10个核苷酸的独特连续序列,并且其中所述靶DNA分子包含150~1500个核酸碱基对。
16.根据权利要求1-6中任一项所述的方法,其中对于每次重复步骤(c)~(e),步骤(f)的稀释样品的总稀释度提高2~20倍。
17.根据权利要求1-6中任一项所述的方法,其中在步骤(c)中制备的复制稀释样品的数量为2~500。
18.根据权利要求1-6中任一项所述的方法,其中所述靶DNA分子来源于细胞的基因组。
19.根据权利要求18所述的方法,其中所述细胞选自于细菌细胞、真菌细胞、和哺乳动物细胞。
20.根据权利要求1-6中任一项所述的方法,其中所述靶DNA分子来源于病毒基因组或哺乳动物基因组或它们的组合。

说明书全文

核苷酸序列的概率导向分离(PINS)

技术领域

[0001] 本发明涉及一种分离包含已知核苷酸序列元件(即,编码保守活性位点或结构域的序列)的复杂核苷酸片段的方法,即,该方法可适用于高通量筛选含有已知序列元件的DNA片段。

背景技术

[0002] 一般介绍
[0003] 分子诊断和其它以DNA为基础的方法在诸如Discovery、R&D、和诊断的各个分支等部已经获得了越来越多的关注。但是,不论检测或筛选所分析的是何种靶,所有的以DNA为基础的方法均面临着同样的挑战,即相对于背景DNA生成足够量的可用的靶。
[0004] 通过提高低丰度的靶DNA的存在,在以复杂的混合DNA样本中不期望的背景DNA为代价下,能够使用传统的分子方法,诸如克隆文库构建、天然产物的发现、PCR诊断、杂交、测序、宏基因组学、以及各种其他分子方法。
[0005] 以下描述了当前使用的方法以及低丰度、混合DNA样本的挑战。
[0006] PCR诊断
[0007] 近年来,已广泛地开发了用于临床生物中传染病的常规诊断的PCR检测。PCR适用于直接在临床样本中细菌的快速检测,允许相关疾病的早期、灵敏和特异性的实验室确认[1]。另外,其允许抗生素抗性基因或基因突变的存在的快速评估。组合病原体检测、它们的耐抗生素性的机制、它们的毒因子以及临床样品中的细菌负荷的方法能在这些感染患者的护理中带来深刻变化。因此,当前正在开发复杂的多重PCR检测以开拓分子诊断的领域。
[0008] 但是,从混合样品基于PCR的诊断经常与挑战相联系,因为PCR产物的存在可以源自混合复杂样品中多于一种DNA的源。特定的抗生素基因的存在结合特定的细菌菌株的存在并不一定意味着抗性细菌菌株存在于原始样品中。其仅表明,在样品中同时存在抗性基因和细菌菌株,它们不一定源自相同的细胞。已经建议了防止这种问题的方法,其中通过特异性引物靶向抗生素抗性基因的整合位点,也称为靶向特异性细菌菌株。但是,由此需要知道准确的整合位点并且这限制了这种方法的使用。
[0009] DNA测序
[0010] DNA序列的知识在基础生物学研究和在诸如诊断、生物技术、法医生物学以及生物系统学等许多应用领域已成为不可缺少的。使用现代DNA测序技术获得的快速测序和成本降低一直有助于DNA序列的测序,并且全世界测序的DNA总量迅速增加。
[0011] 虽然纯样品的测序是现在的标准程序,但DNA的混合样品的测序仍然具有挑战性、其昂贵且费时。当靶片段以较低的频率存在于混合核苷酸样品中时,例如在签、粪便或血液样品中,首先必须做出克隆或片段文库,然后对所述完整的文库进行测序,或者做出更小的PCR片段并且对其进行测序。完整文库的测序昂贵且耗时,而PCR片段的测序仅在所述序列在非常大的程度上是已知的条件下才是可能的并且会返回相对短的片段,这种相对短的片段不能被分配到同一分子或生物体。如果仅知道靶序列的一部分,那么PCR将是不可能的并且需要宏基因组测序。
[0012] 因此,需要一种用于提高核苷酸分子的混合样品中的稀有核苷酸分子的频率的方法,以便降低测序混合样品的成本和时间。
[0013] 宏基因组学
[0014] 宏基因组学是指一般的测序方法,其中将DNA的复杂混合物区分为小的片断(fractions)并且单独地测序。该系统不依赖于培养性并因此同时适用于可以及不可以在实验室培养的样品。
[0015] 虽然宏基因组学在某些情况下可以被应用到所描述的复杂样品,但是经常的情况是,研究人员更偏好基因组的或基因组混合物的特定子集,而非基因组的一个样品或混合样品的整个序列[2]。因此,仍然强烈需要灵活的靶向方法,其匹配各种技术和研究的个性化要求。虽然此种技术确实存在,但是它们经常基于杂交试验,并且以具有广泛的序列知识为前提条件或者具有低的灵敏度。
[0016] 因此,如果宏基因组学旨在用于分析稀少的/低丰度的DNA片段或靶,则存在对复杂混合物中预定义的子片断的特异性富集的强烈需求。
[0017] 发现
[0018] 不同的行业有不同的动机,以探索处于未发掘的微生物多样性中的广袤的资源。当前,白色(工业)生物技术似乎在可持续发展的现代社会的建立中发挥了核心作用。一种普遍接受的假设是,只有天然微生物生物多样性的一个小的细分可用于筛选。在1990年,Torsvijk et al.[3]估计,充其量只有1%的土壤样品的天然存在的微生物多样性可以在实验室条件下培养。因此,在尚未知的天然产物的发现中以及在使得能够进入存在于天然和环境样品的未知的大多数DNA的生物技术中存在巨大的潜力。遗憾的是,如果要获取那些以其它方式无法获得的信息,则需要大量的测序。
[0019] 编码工业相关蛋白质或酶的DNA片段的靶向富集将大大减少所需的测序量。

发明内容

[0020] 本发明提供了用于从混合的多核苷酸样品富集和/或分离靶DNA分子的体外方法,其包含步骤:
[0021] a)提供含有所述靶DNA分子的混合核苷酸样品,其中所述靶DNA分子包含一个或多个至少10个核苷酸的独特连续序列(unique consecutive sequence),
[0022] b)连续稀释所述混合多核苷酸样品直至在稀释的样品中检测所述靶DNA分子的概率低于0.75,优选低于0.50或甚至更优选地低于0.25,和
[0023] c)复制足够数量的稀释的样品直至在至少一个所述复制稀释样品中检测所述靶DNA分子的概率为至少0.75,优选0.80~0.95;
[0024] d)扩增所述复制稀释样品中的DNA以提高每个样品中的DNA丰度;
[0025] e)检测所述靶DNA分子在步骤(d)中扩增的所述复制稀释样品中的存在或不存在,其中所述靶DNA分子在所述复制稀释样品中的频率与步骤(a)中的混合多核苷酸样品相比被提高;
[0026] f)连续稀释含有所述DNA分子的至少一个复制稀释样品直至在稀释的样品中检测所述靶DNA分子的概率低于0.75,并且重复步骤(c)至(e)或(f)至少一次。附图说明
[0027] 图1:
[0028] 本图示出了来自初始混合物的九个阴性PCR反应的2%琼脂糖凝胶。框出区域指示在凝胶中将存在阳性PCR产物。框外部的PCR产物为非特异性产物且在本上下文中被忽略。
[0029] 图2:
[0030] 本图示出了在第一轮PINS之后的十个PCR样品的2%琼脂糖凝胶。五个样品(A、B、C、D&I)含有预期大小的PCR产物,而剩余的五个样品则不含有。在凝胶中用箭头标识了正确的产物大小(左侧)。其它位置的PCR产物(未用箭头标识的)为非特异性产物且在本上下文中被忽略。
[0031] 图3:
[0032] 本图示出了在样品#10再扩增后的十个PCR样品的2%琼脂糖凝胶。六个样品(A、C、E、F、I&J)含有预期大小的PCR产物,而剩余的四个样品则不含有。在凝胶中用箭头标识了正确的产物大小(左侧)。其它位置的PCR产物(未用箭头标识的)为非特异性产物且在本上下文中被忽略。
[0033] 图4:
[0034] 本图示出了在PCR之前使用2E-1稀释的第二轮PINS后的十个PCR样品的2%琼脂糖凝胶。五个样品(C、D、E、G&I)含有预期大小的PCR产物,而剩余的四个样品则不含有。在凝胶中用箭头标识了正确的产物大小(左侧)。其它位置的PCR产物(未用箭头标识的)为非特异性产物且在本上下文中被忽略。
[0035] 图5:
[0036] 本图示出了使用下列参数的两轮PINS的示意图:
[0037] A:初始样品–具有0.028ng/μl。
[0038] B:10Phi样品,由A创建,使用3.5μl“A”作为模板。
[0039] C:一个样品,(三个中)全部3个PCR产物为阳性。
[0040] D:通过使用3.5μl样品#10在50的总反应体积中再扩增的样品“C”。
[0041] E:10Phi样品,在每个反应中使用1.0μl作为模板由“D”创建。
[0042] F&G:两个样品,其中(三个中)全部3个PCR产物均为阳性。
[0043] H:合并样品“F”&“G”。
[0044] I:增益,计算为从初始浓度到第一轮PINS后的结果。
[0045] J:增益,使用在相同稀释度下的直接比较,从第一轮PINS计算至第二轮PINS。
[0046] K:增益,使用在不同稀释度下的比较,从第一轮PINS计算至第二轮PINS。
[0047] L:增益,从初始样品计算至完成(靶/ng)。
[0048] 图6:
[0049] 本图示出了从包含靶HPV18-DNA分子的初始混合多核苷酸样品产生的十个阴性PCR反应的2%琼脂糖凝胶。框出区域指示了在凝胶中将会存在阳性PCR产物。框外部的PCR产物为非特异性产物且在本上下文中被忽略。
[0050] 图7:
[0051] 本图示出了设计用于检测靶HPV18-DNA分子的存在的三个PCR的产物的2%琼脂糖凝胶。泳道#1为阳性对照PCR反应;泳道#2为PINS(MDA-介导的)富集的含有2.5靶拷贝/μl的混合核苷酸样品的PCR产物;且泳道#3为阴性PCR对照。箭头指示了~667bp的DNA分子在琼脂糖凝胶中的相对迁移率。
[0052] 图8:
[0053] 本图示出了通过再扩增图7中所示的靶HPV18-DNA分子获得的PCR产物的2%琼脂糖凝胶。箭头指示了~667bp的DNA分子在琼脂糖凝胶中的相对迁移率。
[0054] 图9:
[0055] PINS富集的靶HPV18-DNA分子的检索序列与HPV18序列(HPU89349)的比对,显示所述序列完美一致,零错配。
[0056] 图10:
[0057] 检索到的编码内切葡聚糖酶(endoglucanase)的微生物基因的序列的引物和局部比对。
[0058] 图11:
[0059] 本图示出了通过PINS富集的编码内切葡聚糖酶的基因的核苷酸序列。用于RGW的限制性位点(MboI、EcoRI和HindIII)被插入到框中。-35&-10示出了推定的启动子位点的位置且SD为核糖体结合位点(ShineDalgarno)位置。EndoGlu-Fw&EndoGlu-Re为在PINS过程中使用的引物。ORF指示了开放阅读框的位置。

具体实施方式

[0060] 本发明涉及一种体外方法,其中含有目标DNA片段(所关注的DNA片段,DNA fragment of interest)的靶核苷酸序列的频率被逐步增加,其通过多轮1)在多个复制品(复制体,replicate)中稀释含有目标DNA片段的样品(分离)、2)随机扩增复制品中的DNA(浓缩)、3)在至少一个稀释并扩增的复制品中检测目标DNA片段(选择)并且重复步骤1)~3)直到通过标准的测序技术能够对目标DNA片段进行测序。
[0061] 本发明基于的原则是:如果存在于混合样品中的所选定的目标DNA片段所处于的稀释度下寻找它的概率较小,那么所述目标DNA片段在该稀释度下的频率比在混合样品中的高,并且其频率可以进一步通过多轮选择(如上所述)来增加,直到其可以通过标准方法诸如Sanger测序或焦磷酸测序或类似的DNA序列的检测或通过PCR、杂交或其他检测方法来进行测序。
[0062] 本发明的方法是出人意料地有效的,由此筛选的程度可以从根据传统筛选方法[17]的在克隆文库中筛选数十万个克隆降低至筛选小于几百个DNA样品(表1)。
[0063] 表1:PINS的效率
[0064]
[0065] PINS(probability-directed isolation of nucleotide sequence)的每个循环提供了目标基因元件的普遍率(prevalence)的约10x的提高。可以计算出为了将普遍率从起始平提高至期望的终水平所需的测试的数目,即需要78次测试以将普遍率从1/106提高至1/102(基于估计的10x/循环)。
[0066] I:PINS
[0067] 体外PINS方法的必要步骤进一步描述如下:
[0068] a)包含靶DNA分子的混合多核苷酸样品
[0069] 选择已知包含靶DNA分子的混合多核苷酸样品用于进行PINS。选择一个或多个位于靶DNA分子中的至少10(或15)个独特核苷酸的核苷酸序列,用于通过期望的方法来筛选和检测DNA分子,诸如PCR检测,使用杂交探针的或类似的DNA检测。典型地,混合多核苷酸的靶DNA分子样品的频率低于10-2,其可以例如处于10-3和10-7之间。
[0070] b)混合多核苷酸样品的初级稀释
[0071] 通过所需的稀释次数连续稀释所述混合多核苷酸样品直到在稀释样品中检测靶DNA分子的概率低于0.75,(这种样品为指定的稀释度(N))。连续稀释优选地具有大于1:1的稀释因子(dilution factor),优选在1:2~1:20之间,例如1:10。将每个稀释的样品放置在独立的容器中,诸如微量滴定板中的孔、塑料管或类似容器。
[0072] 可以使用各种方法来识别稀释系列中的样品(N),其中检测靶DNA分子的概率低于0.75。例如,可以将所述混合多核苷酸样品的连续稀释品(serial dilutions)扩增以提高每个样品中DNA的丰度,随后为检测每个扩增样品中所述靶DNA分子的存在或不存在。将稀释系列中的能够检测到靶DNA分子的最稀的样品指定为“P”。稀释系列中指定为“N”的下一个稀释度为稀释系列中不能检测到靶DNA分子的最浓的样品(the least diluted sample)。将a)中相对于DNA样品的“N”的稀释因子指定为Dt,并且将P和N之间的稀释因子指定为D。
[0073] 可替代地,混合多核苷酸样品中的靶DNA分子的频率和丰度可以通过实时PCR来确定,由其可以计算出为制备样品(N)所需的稀释度(参见实施例1)。
[0074] 可替代地,可以通过以杂交为基础的检测或通过检测靶序列的RNA或蛋白质产物的检测法来检测靶DNA分子。
[0075] c)创建具有稀释度N的复制稀释样品
[0076] 生成充足数目的稀释样品(N)的复制品,直到在至少一个所述复制稀释样品中检测靶DNA分子的概率为1。复制品的适合数目处于2和500之间,优选至少为10~20个复制品。典型地,适合数目的复制品将对应于用来创建稀释系列的稀释因子,即,如果稀释因子为1:
10,那么约10个复制品应当是足够的。将每个稀释样品放置在独立的容器中,诸如微量滴定板的孔、塑料管或类似容器。
[0077] d)基因组DNA扩增
[0078] 使用总DNA扩增的任何方法来扩增每个复制的稀释样品中的DNA以提高每个样品中DNA的丰度。适合的扩增方法包括简并寡核苷酸引物PCR(Degenerate Oligonucleotide Primed PCR,DOP-PCR)、多重置换扩增(Multiple Displacement Amplification,MDA)[4]、随机引物PCR(randomly primed PCR)或类似。
[0079] e)从复制稀释样品(+/-)中筛选靶DNA
[0080] 使用期望的检测技术对步骤d)的基因组扩增后的复制样品(N)进行筛选,以确定靶DNA分子的存在。在显示含有靶DNA分子的至少一个或多个筛选的样品(样品+)中,靶DNA分子的频率相对于其在步骤(a)中的混合多核苷酸样品中的频率会提高。
[0081] 然后连续稀释这些样品+的一个或多个直到在稀释样品中检测靶DNA分子的概率低于0.75。典型地,这种样品的总稀释度为Dt增加因子D。使用这种样品,重复步骤(c)至(e)至少一次,优选地直到靶DNA分子已经扩增至靶DNA分子的核苷酸序列或其部分能够容易测序的程度,如以下f)中所描述的。步骤(c)至(e)的重复次数一般为至少1,但是更有可能需要2、3、4、5或6或更多次重复,由此靶DNA分子达到的最终频率大于10-3,优选大于10-1。
[0082] f)富集的靶DNA分子的表征
[0083] 一旦靶DNA分子的频率得到了充分地提高,可以使DNA接受直接DNA测序。使用期望的DNA测序方法,诸如Sanger测序、焦磷酸测序或类似的方法,来实施靶DNA分子的测序;用于检测的PCR扩增的靶DNA片段以及侧接靶DNA片段的5’和3’方向的核苷酸序列。
[0084] 表2中罗列了可以如何实施PINS方法的实例。
[0085] 用于执行PINS的方案
[0086] 将原始DNA样品指定为样品N0
[0087] 在微量滴定板的孔A1~A8中制备样品N0的10倍稀释品。执行MDA(可选地):N0->N0MDA。转移等分试样的N0->N0MDA至PCR板并且执行PCR以检测靶DNA分子。
[0088] 表2
[0089]
[0090] 选择N0x 10-4A5或N0MDA x 10-4A5=样品N1
[0091] 制备20个复制等分试样的样品N1并且加入到稀释板上的A1~C4中(表3)。在所有的复制品上执行MDA以扩增每个复制品中的总DNA,随后进行PCR以检测每个扩增的DNA中的靶DNA分子。
[0092] 表3
[0093] 循环1
[0094]
[0095] 选择(N1A3+MDA+N1B6+MDA+N1C2+MDA)并稀释10-5=样品N2
[0096] 制备20个等分试样的样品N2并且加入到稀释板上的A1-C4中(表4)。在所有的复制品上执行MDA以扩增每个复制品中的总DNA,随后执行PCR以检测扩增的DNA中的靶DNA分子。
[0097] 表4
[0098] 循环2
[0099]
[0100] 选择(N2A5+MDA+N2B2+MDA)并稀释10-6=样品N3
[0101] 制备20个等分试样的样品N2并且加入到稀释板上的A1-C4中(表5)。在所有的复制品上执行MDA以扩增每个复制品中的总DNA,随后执行PCR以检测扩增的DNA中的靶DNA分子。
[0102] 表5
[0103] 循环3
[0104]
[0105]
[0106] 选择(N3B3+MDA+N3B5+MDA+N3C1+MDA)并且测定靶DNA分子的丰度。如果其足够用于分析诸如测序,所选择的样品可以直接使用;否则可以施用附加的PINS循环。
[0107] II:多重PINS
[0108] 可以改编PINS以进行多重PINS。多重PINS采用了附加特征,该附加特征设计用于检测所分析的混合多核苷酸样品中的至少10(或15)个核苷酸的第2连续序列,其通过使用序列特异性引物扩增这种第2连续序列以生成第2靶DNA片段。如果在PINS的每个循环第1和第2连续序列共纯化,那么它们必须位于同一个MDA-扩增的靶DNA分子上。
[0109] III:通过PINS和多重PINS分析的样品
[0110] III.i混合多核苷酸样品
[0111] 可以将PINS应用于已知包含靶DNA分子的混合多核苷酸的样品。混合多核苷酸样品包含DNA分子群(例如,染色体DNA分子或质粒DNA分子),其中处于该群中的个体DNA分子相对于它们的DNA中的至少10(或15)个核酸基对的已知连续序列而不同,由此包含所述已知连续序列的靶分子不同于并且可以区分于样品中的非靶分子。混合多核苷酸的样品可以附加地包含单链RNA或DNA多核苷酸。混合多核苷酸样品中的DNA分子群包含靶DNA分子。
[0112] 靶DNA分子包含一个或多个至少10(或15)个独特核酸碱基对(或核苷酸)的已知连续序列。通过选择包含至少10个核酸碱基对(或核苷酸)的这种连续序列的靶DNA分子,可以从混合多核苷酸样品中选择靶DNA分子。通过选择包含至少10(或15)个核酸碱基对(或核苷酸)的至少两个连续序列的靶DNA分子,可以从混合多核苷酸样品中选择所述靶DNA分子,其中所述两个连续序列被包含在50~100,000个核酸碱基对、优选150~3,000个核酸碱基对、更优选150~1500个核酸碱基对的DNA分子中。
[0113] 在靶DNA分子在混合多核苷酸样品中的频率低于10-3的情况下,本发明的方法是特别适合的。在靶DNA分子在混合多核苷酸的样品中的频率为10-4、10-5、10-6、10-7或更低的情况下,本发明的方法也适用。在许多情况下,混合多核苷酸的样品来源于包含基因组DNA的细胞群,而在其它情况下,样品可以来源于其中多核苷酸为不同来源的样品,诸如从自然采集的样品。不论其来源如何,靶DNA分子的频率定义为:含有靶DNA的基因组或基因组等效物的数目除以总基因组等效物的数目。靶DNA分子在混合多核苷酸的样品中的频率,通过一式三份制备稀释系列、检测靶的存在或不存在、以及使用例如最大可能数方法(most probable number method)来确定靶的数目来确定。测量DNA的浓度并且通过将这种浓度除以基因组的平均分子量来确定总基因组等效物的数目。
[0114] III.ii混合多核苷酸样品的来源
[0115] 根据本发明的一个实施方式,靶DNA分子来源于细胞的基因组,其中所述基因组可以为染色体或染色体外DNA。另外,靶DNA分子可以来源于细胞,其中所述细胞选自于微生物细胞、植物细胞、动物细胞、或哺乳动物细胞。哺乳动物细胞可以为人类细胞。微生物细胞可以为细菌细胞、酵母细胞或真菌细胞。
[0116] 另外,靶DNA分子可以来源于真菌菌丝(真菌菌丝体)或真菌孢子。
[0117] 在靶DNA分子来源于一种或多种细胞时,所述细胞可以为多细胞组织或多细胞生物体的一部分。
[0118] 另外,靶DNA分子可以来源于一种或多种病毒颗粒,其中所述病毒具有RNA或DNA基因组。可替代地,靶DNA分子可以来源于包含来源于病毒的整合DNA的宿主基因组。靶DNA分子还可以来源于噬菌体
[0119] 不论靶DNA或RNA分子的来源如何,靶DNA或RNA分子存在于混合多核苷酸的样品中,其中所述混合多核苷酸可以来源于从自然采集的样品,例如土壤样品、水样品或空气样品。可替代地,所述样品可以来源于多细胞生物,诸如哺乳动物,例如动物或人类受试者。当样品来源于哺乳动物时,所述样品(例如,活组织检查)可以来源于体液(例如,血液、血浆、血清、淋巴和尿液)、来源于粪便或来源于身体组织或器官。样品所来源的多细胞生物可以是活的生物或者可以是死的生物体。
[0120] III.iii混合多核苷酸样品的制备
[0121] 包含靶DNA分子的混合多核苷酸的样品可以由从自然采集的样品或从生物体(例如,活组织检查)制备。用于选择性提取包含DNA或RNA的多核苷酸的方法在本领域中是已知的[5]。当靶DNA分子来源于细胞时,通常需要细胞破碎或细胞通透(细胞透化,cell permeabilisation)的步骤,以便从细胞中释放出总核酸分子(包括DNA或RNA),该步骤之后是选择性提取包含DNA或RNA的多核苷酸的随后步骤。
[0122] 在靶DNA分子来源于RNA基因组的情况下,该RNA基因组或其部分首先反转录以提供cDNA分子,其中该cDNA的核苷酸序列对应于该RNA基因组(为其反转录物)。
[0123] IV.适用于PINS的随机扩增DNA的方法
[0124] 已经建议了一系列的不同方法以用于一般性的扩增DNA,诸如随机简并引物PCR、接头连接PCR、或简并寡核苷酸引物(DOP)PCR以及多重置换扩增(MDA)。已经证明MDA在执行全基因组扩增(WGA)即使是很少量的DNA中是有效的[6]。与更传统的以PCR为基础的WGA方法相比,MDA产生具有更高分子量的DNA分子,具有更好的基因组覆盖率。MDA采用了具有两种酶活性的链置换聚合酶:DNA合成(聚合酶)以及在3’-至5’-方向降解单链DNA的核酸外切活性(exonucleolytic activity),其实例为噬菌体phi29DNA聚合酶,其属于真核B型DNA聚合酶(UniProtKB/TrEMBL:Q38545)。其它有用的聚合酶包括BstI聚合酶。
[0125] V.靶DNA分子的序列确定
[0126] 通过PINS对靶DNA分子的分离是基于所述DNA分子中一个或多个至少15个核苷酸的独特的连续序列的检测。当检测基于PCR时,其中所述一个或多个独特的连续序列被扩增以产生靶DNA片段,可以确定这种片段的核苷酸序列。另外,侧接在5’和3’方向的靶DNA片段的核苷酸序列可以通过快速基因组步移技术(rapid genome walking,RGW)来确定[7]。RGW是一种简单的以PCR为基础的方法,用于确定大DNA分子中从已知序列开始的上游或下游的序列,诸如大分子DNA片段。RGW使用PCR能够个别扩增大DNA分子中的多达6kb。以在先前循环中获得的序列为基础,使用新的引物,通过采用多个循环的RGW能够简单地延伸序列。典型地文库由大的靶DNA分子的纯化样品来构建,其通过分别使用四个不同的限制性酶来消化DNA并且将产物连接至特别设计的衔接头(adaptor)来进行。然后使用退火至衔接头或DNA中已知序列的引物,使用期望的DNA测序方法,诸如Sanger测序、焦磷酸测序、通过合成的测序、连接或两碱基-编码测序(two base-coding sequencing)或类似的方法,对连接的DNA进行测序[8]。
[0127] VI.PINS和多重PINS的应用
[0128] VI.i PINS和多重PINS的研究和开发应用
[0129] 使用PINS以分离或富集提取自从自然采集的样品的混合多核苷酸样品中的靶DNA,提供了对存在于自然中且常常不能作为纯性培养物(无污染培养物,axenic culture)获得的微生物的基因组或其部分的直接途径。PINS特别有用于分离或富集编码参与生产化学结构单元(chemical building block)或活性剂的酶的DNA,所述化学结构单元或活性剂诸如:
[0130] ·酸(诸如来酸、天冬酸、丙二酸、丙酸、琥珀酸、富马酸、柠檬酸、乙酸、谷氨酸、衣康酸、乙酰丙酸(levulinic acid)、烟酸(acotinic acid)、葡糖二酸、葡糖酸和乳酸),
[0131] ·氨基酸(诸如丝氨酸、赖氨酸、苏氨酸),
[0132] ·醇(乙醇、丁醇、丙二醇、丁二醇、阿拉伯糖醇)和
[0133] ·其它高价值产物(诸如乙偶姻、糠和左旋葡聚糖)
[0134] ·抗生素,抗癌化合物(例如,肽-聚化合物(peptide-polyketides);内酰胺类似物)
[0135] 因此,PINS特别有用于分离或富集编码选自于化还原酶、转移酶、水解酶、裂合酶(裂解酶,lyase)、异构酶或连接酶的酶的靶DNA。多重PINS特别有用于分离或富集包含编码两种或更多种酶的两种或更多种开放阅读框的操纵子的靶DNA,其中所述酶可以为多功能酶复合物的一部分,因为该技术能够利用MDA扩增中的聚合酶(如Phi29)的高保真度以生成多达100000bp的大的扩增DNA片段。
[0136] VI.ii PINS和多重PINS的诊断应用
[0137] PINS或多重PINS可以用来分析来源于多细胞生物的样品(诸如活组织检查)或获自于受试者(例如,人类或动物受试者)的体液或粪便的样品中的靶DNA,以用于诊断或监测医学指征或疾病的进展。
[0138] 通过PINS或多重PINS来分离或富集并检测来源于感染物(infectious agent)的基因组的靶DNA或RNA分子,能够协助诊断受试者中范围广泛的医学指征,诸如由感染物(例如微生物或病毒)引起的疾病,其中所述靶DNA分子是在来源于活组织检查或从受试者获得的体液样品的混合多核苷酸的样品中检测的。
[0139] 多重PINS在靶DNA分子分离中的使用提供了附加特征,即可以确定疾病的附加诊断特征。例如,在感染物的基因组包含赋予对某些治疗剂以抗性的抗性基因的情况下,抗性基因与描述感染物的序列在PINS程序中的共富集将表明,所述感染物携带了所述抗性基因。
[0140] PINS或多重PINS也可以用来协助在受试者中诊断由病毒剂的存在引起的或起因于病毒剂的存在的疾病的诊断。在获自患者的活组织检查或体液样品中,通过PINS可以检测源自病毒基因组的DNA的存在和/或染色体整合,其通过测序包含所述病毒DNA序列的整个DNA片段进行。使用多重PINS,通过追踪病毒DNA和整合位点DNA序列的共富集,可以确定病毒DNA在已知整合位点的存在或不存在。
[0141] VII.PINS和扩增中的偏差(bias)
[0142] PINS以具体选择样品为基础,其中发生了来自复杂的混合DNA样品的期望DNA区域的扩增。尽管以Phi29为基础的扩增(MDA)已经被重复地描述为当前可用的最可靠的基因组扩增,然而已知其引入了显著的偏差。Pan et al.[18]一般性地表明,避免了扩增偏差的复杂DNA池的高特异性全基因组扩增(WGA)仍然是一项挑战。另外,使用替代的扩增方法诸如DOP-PCR和随机引物PCR也看到了类似的观察结果。这两种扩增方法被描述为在再现位点表现(locus representation)上不那么有效[19],产生更大偏差的扩增产物。虽然偏差表面上不可避免,且与存在的反应模板的量无关[20],但是模板独立性产物(TIP)或在扩增期间导致的偏差的量表面上与反应中DNA模板的量呈负相关,并且在一些研究口已经记录为占总收率的70~75%[18]。将全基因组扩增应用到PINS方法中以扩增DNA,并因此可以预期到,涉及基因组扩增中偏差的这些一般性的挑战也适用于PINS。作为包含WGA的多步的程序,由此可以预期到,应该能够看到相对于靶DNA分子的显著偏差。因此,采用了WGA的多步的程序诸如PINS应该不会被视为是能够富集混合样品中DNA的特定区域的方法。
[0143] 令人惊奇的是,尽管靶DNA分子的初始浓度非常低,但是在应用PINS技术时未看到TIP/偏差的挑战。在PINS体系中观察到的最小的负面TIP/偏差显著地低于从扩增过程获得的总体增益,由此,净结果(net result)是每个循环的靶DNA分子的大量富集。
[0144] 所述方法不需要稀释的初始DNA模板,因为高浓度的DNA也可以有效地进行PINS。在这种情况下,仅需要通过WGA方法的少数几倍扩增。
[0145] 实施例
[0146] 下列实施例说明了为什么PINS优于用于富集和/或分离靶DNA分子的其它方法(诸如枪克隆和宏基因组学)或者是用于富集和/或分离靶DNA分子的其它方法(诸如鸟枪克隆和宏基因组学)的补充。采用传统的宏基因组学替代实施例1中使用的PINS,将需要测序2*106个具有3*109碱基平均大小的基因组。因此,总共需要至少6*1015个碱基对以便获得HPV18的序列。在两轮PINS之后,HPV18靶的频率增加了79倍并因此现在仅需要测序4.47*
1013个碱基对。附加多轮的PINS可以进一步降低所需的测序量。
[0147] 材料和一般方法
[0148] 以下材料和方法将应用于以下实施例中:
[0149] 酶和试剂:如果没有其他说明,酶是由MBI Fermentas(德国)提供的并根据供应商的建议进行使用。
[0150] 扩增和检测方法:如果没有其他说明,以下程序和条件被采用于通过PCR的DNA片段扩增;通过MDA的基因组扩增;以及使用RGW的DNA片段向侧翼区的延伸。通过2%琼脂糖凝胶电泳来检测靶DNA片段。
[0151] PCR扩增:
[0152] PCR反应为:在20μl反应中进行,通过混合:无核酸酶的水(7μl)、10μl 2x SSO Advance Sybr TR-混合物(BioRad)、5μM fw-引物(1μl)、6μM Re-引物(1μl)、和1μl DNA模板。所述2x SSO Advance Sybr TR-混合物的组成为:dNTP、Sso7d融合聚合酶、MgCl2、Green I、和稳定剂。
[0153] PCR扩增条件为:在温度(94℃/65.8℃/72℃)下(15秒/15秒/15秒)x25。PCR反应是在BioRad Connect RT-PCR仪器中进行的。
[0154] MDA扩增:
[0155] 根据下述的方案进行MDA:
[0156] 混合I:变性和重新退火:
[0157] 2.5μl 2x退火缓冲液(33mM Tris-乙酸盐(在37℃下pH 7.9)、10mM Mg-乙酸盐、66mM K-乙酸盐、0.1mg/mL BSA)
[0158] 0.5μl水
[0159] 1μl外切酶抗性随机六聚体引物(Exo-resistant random hexamer primers)(Thermo Scientific)
[0160] (1μl DNA模板)*
[0161] 混合II-扩增
[0162] 7.5μl水
[0163] 4μl 2mM dNTP
[0164] 2μl Phi29缓冲液(Thermo Scientific)
[0165] 1μl焦磷酸酶0.01U/μl(Thermo Scientific)
[0166] 0.5μl Phi29聚合酶(Thermo Scientific)
[0167] 方案
[0168] 1.首先制备未添加DNA模板*的混合(混合物,mix)1并且将4μl混合1加入到每个微离心管中。然后通过将DNA模板1μl放置在微离心管的盖上而加入DNA模板到混合中。对管进行离心,在离心之后立即转移到上。
[0169] 2.然后将混合1(来自步骤1)从冰上转移至94℃(预热的PCR仪器)上并且保持在94℃下三分钟,然后转移回冰上。
[0170] 3.然后向混合1(来自步骤2)中加入混合2的15μl。
[0171] 4.将最终混合物(混合1+混合2)在30℃下温育16小时(PCR仪器)。在温育结束时,将最终混合物的温度升高至65℃保持10分钟以失活聚合酶。
[0172] DNA定量:
[0173] 使用QuantusTM荧光计(Promega)按照制造商所描述的进行DNA定量。
[0174] 凝胶电泳:使用BioRad SubCell Equipment在2%琼脂糖凝胶电泳的基础上评价PCR结果。凝胶在80V在1%琼脂糖中运行20~30分钟。通过将溴化乙锭(0.5μg/ml)浇在凝胶上进行可视化
[0175] 通过加载2μl在0.7%琼脂糖凝胶上来验证MDA扩增。所有的MDA凝胶均在80V在0.7%琼脂糖中运行约30分钟。
[0176] 在所有的琼脂糖凝胶上的分子标记物为Fermentas 1bk+标记(ladder),带大小(75、200、300、400、500、1000、2000、3000、4000、5000、7000、10,000、20,000)。
[0177] 概率的计算
[0178] 使用超几何分布(hypergeometric distribution)来计算检测样品中的靶DNA分子的概率,其中所述群为液体的原始样本体积,其中所述靶存在(阳性)或不存在,并且测试的样品为从原始样品中取出的液体的体积。因为核酸分子仅贡献体积的很小一部分,因此群体积以及测试样品体积在计算中均乘以1000。
[0179] 对于100μl样品,群体大小为100000。如果100μl样品含有四个靶DNA分子,那么在含有原始100μl样品的3.5μl的稀释样品(测试样品=3500)中检测靶DNA分子的概率为:
[0180] P=1-超几何分布(0;3500;4;100000)=0.133
[0181] 如果分析来自同一原始样品的各3.5μl的10个复制稀释测试样品,那么在至少一个所述复制稀释样品中检测靶DNA分子的概率为:
[0182] P=1-超几何分布(0;35000;4;100000)=0.821
[0183] 超几何分布的等式为:
[0184]
[0185] 其中:
[0186] x=(稀释的)测试样品中的阳性的数目
[0187] n=(稀释的)测试样品的体积*1000
[0188] M=原始样品(群)中靶DNA分子的数目
[0189] N=原始样品(群)的体积*1000
[0190] 实施例1:来自人类DNA的混合样品的编码HPV-18病毒的多核苷酸的富集的方法[0191] 1.0创建用于富集的混合物
[0192] 由掺有(spiked)来源于HeLa细胞的DNA的参照DNA制备混合多核苷酸样品。HeLa细胞作为纯化的DNA样品获自于New England Biolabs(100μg/ml)。参照DNA提取自来源于人类志愿者的细胞。通过选择的靶PCR引物[SEQ ID NO:1和SEQ ID NO:2]有效地扩增了HeLa DNA中的靶DNA分子,而人类参照DNA使用这种引物对未产生扩增产物。在设置所述混合物之前,使用MDA方案独立地扩增了两种类型的DNA。在MDA扩增之后,在一式三份10倍稀释的HeLa DNA上使用最可能数(MPN)计算,MDA扩增的HeLa DNA中的靶DNA拷贝的量确定为71750拷贝/μl。以1:2,500,000倍数将靶DNA稀释在未稀释的MDA扩增的参照DNA(采用连续稀释)中以创建含有0.029靶拷贝/μl且具有0.187μg/μl总DNA浓度的最终掺混的混合物。因此,靶DNA拷贝在初始混合多核苷酸样品中的初始量计算为:(0.029靶拷贝/μl):(0.187μg/μl)=0.153靶拷贝/μg DNA。混合DNA样品的总体积为45μl。在3.5μl混合多核苷酸样品中检测靶DNA分子的概率为0.078(1-超几何分布(0;3500;1;45000));即低于0.75。3.5μl为在第一轮PINS中使用的样品的体积。
[0193] 1.1定义用于选择编码HPV18的靶DNA分子的引物
[0194] 来自HPV18的DNA序列获自于GenBank(GQ180790),手工设计了下列2个引物以靶向HPV18基因组(GenBank登录号:GQ180790)中的96bp的DNA片段:
[0195] 正向引物:GTTTAGTGTGGGCCTGTGC[SEQ ID NO:1]
[0196] 反向引物:GGCATGGGAACTTTCAGTGT[SEQ ID NO:2]
[0197] 1.2初始混合物-低于检测限
[0198] 进行PCR分析以验证在初始多核苷酸混合物中的靶DNA分子的数目低于PCR的检测限。使用九个多核苷酸混合物样品(每个具有1μl初始混合物)作为用于使用引物对[SEQ ID NO:1和2]进行PCR扩增的DNA模板,但是在任一所述样品中均没有发现预期的96bp的PCR产物。在图1中可以发现显示来自初始混合物的个体阴性PCR样品的琼脂糖凝胶。
[0199] 1.3第一轮PINS
[0200] 如上所述,将步骤1中制备的混合多核苷酸样品的十个单独的3.5μl样品选择用于在20μl体积中的MDA扩增,其中在扩增之前在3.5μl混合多核苷酸样品中检测靶DNA分子的概率为0.078(1-超几何分布(0;3500;1;45000));即低于0.75。如上所述,使用1.1.中的靶特异性PCR引物对,通过PCR扩增来对1μl一式三份等分试样的每个MDA扩增的样品(#1~#10)筛选靶DNA分子的存在,随后通过琼脂糖凝胶电泳以可视化PCR产物(图2)。因为分析了十个复制样品,在所述十个复制稀释样品中至少一个中检测靶DNA分子的概率为0.778(1-超几何分布(0;35000;1;45000)),即高于0.75。#10是唯一一个在所有三个复制品中发现产生了正确尺寸的阳性PCR产物的样品。使用相同的条件通过PCR分析了来自#10的十个附加样品(每个具有1μl模板),并且(10个中的)5个产生了正确的PCR产物。通过组合来自第一次筛选的(3个中的)3个以及随后的筛选,其中(10个中的)5个为阳性的结果,总共观察到了(13个中的)8个阳性,均源自于#10。总DNA在样品#10中的浓度量化为0.222μg/μl。在图2中可以找到显示了来自第二次筛选的10个PCR产物的琼脂糖凝胶。
[0201] 经计算,在MDA扩增后的靶DNA分子的丰度为:(8/13靶DNA拷贝/μl):(0.208μg/μl)=2.96靶DNA拷贝/μg。因此,在第一轮扩增中通过PINS获得的频率的提高为:(2.96靶/μg):(0.153靶/μg)=19.36倍。
[0202] #10的再扩增
[0203] 为了在进展至第2轮PINS之前生成充足量的模板,通过使用50μl MDA反应混合物扩增了来自#10的3.5μl模板。通过PCR分析十个1μl等分试样来验证了#10的再扩增的结果,其中在10个PCR反应中的6个中检测到了靶DNA分子(0.60靶DNA拷贝/μl)。这种结果良好地对应于靶DNA分子在#10中的初始频率,#10中为8/13(0.62)。通过以靶拷贝/μl样品的频率除以总DNA浓度,靶DNA分子的相对丰度计算为:(0.6靶/μl):(0.222μg/μl)=2.70靶/μg。
[0204] 令人惊讶的是,在再扩增过程中,仅以有限的程度发生了明显的扩增偏差。图3中可以找到显示了来自再扩增的十个PCR反应产物的琼脂糖凝胶。
[0205] 1.4第二轮PINS
[0206] 将十个来源于第1轮PINS的再扩增的#10的1μl等分试样的样品在MDA反应混合物中稀释20倍,由此将靶DNA分子稀释至频率0.03靶DNA分子/μl。在1μl等分试样的稀释样品中检测靶DNA分子(HPV18)的概率为1-超几何分布(0;1000;30;50000)=0.455,即低于0.75。使用上述的MDA方案扩增每个等分试样。在十个MDA反应之中,在两个反应样品#8和#
10中检测了靶DNA分子,其中(3个中的)3个复制PCR反应对于靶是阳性的。在所述十个复制样品中至少一个中检测靶的概率为1-超几何分布(0;10000;30;50000)=0.9988,即高于
0.75。
[0207] 将样品#8和#10汇集在同一样品中并且稀释2*10-1(5-倍)。通过PCR分析1μl等分试样的这种稀释品,在(10个中的)5个PCR反应中检测到了靶DNA分子,如凝胶中所示(图4)。由于汇集的样品被稀释2*10-1(5-倍),靶的量计算为:5靶/10μl测试样品体积*5=2.5靶/μl。由于汇集样品的总DNA含量测量为0.207μg/μl,那么靶DNA分子的频率计算为2.5靶/μl除以
0.207μg总DNA/μl;其对应于12.08靶/μg DNA。
[0208] 图5中列示了两轮PINS所遵循的方案的概述。
[0209] 1.5通过两轮PINS计算的靶分子DNA的富集
[0210] 通过从初始混合物(0.153靶/μg)计算至最终样品(12.08靶/μg),在连续两轮PINS扩增后达到了79.05的总增益。
[0211] 在第一轮PINS之前的HPV18靶的丰度为1/1.97*106HPV18阳性基因组等效物/总基因组等效物。在第一和第二轮PINS后的相应丰度分别为1.02*105和2.49*104。这种富集是使用21个测试来实现的,而传统测试(诸如测序)对所需数目的需求被降低了79倍,如表1中可以看到的。
[0212] 实施例2
[0213] 使用PINS以促进存在于混合多核苷酸样品中的靶DNA分子的测序,其中靶DNA的量低于通过PCR的检测限,这在本实施例中得到了证明。所选定的靶DNA分子为处于HPV18基因组中的多核苷酸。这种靶DNA分子在混合样品中的量对应于0.0286拷贝/μl。所述混合样品是按照实施例中的描述来制备的。使用标准PCR方案,添加至PCR反应中的模板溶液的量通常为1μl,且其通过PCR的阳性检测所需的最小靶DNA浓度为1拷贝/μl。因此,靶DNA分子在所述混合多核苷酸样品中的量相比PCR扩增和随后测序所需的量而低35倍(approximately 35times below)。该实施例证实了PINS是如何被用来确定混合样品中靶DNA的序列的,否则其通过已知的以标准PCR为基础的程序是不能完成的。
[0214] 2.1通过PCR不能检测到混合多核苷酸样品中的靶HPV18DNA分子
[0215] 为了验证每μl混合多核苷酸样品(对应于在MDA扩增之前的实施例1的混合多核苷酸样品)中的靶DNA分子的拷贝数低于PCR的检测限,PCR扩增了一系列的十个重复样品(根据材料和一般方法中给出的方案),改变在于使用50个循环并且使用优化的扩增参数:94℃/65.8°/72℃,其中每个温度维持15秒。在扩增过程中使用的HPV-特异性引物为:
[0216] HPV-264f:5’-GTGGTGTATAGAGACAGTATACC-3’[SEQ ID NO:3]
[0217] HPV-911f:5’-CCTTCTGGATCAGCCATTGT[SEQ ID NO:4]
[0218] HPV18基因组中的靶DNA分子的阳性扩增会生成667bp的PCR产物(图6中框出)。如所预期的,由于低丰度,(十个中)无反应产生正确尺寸的扩增,证实了靶DNA分子在混合多核苷酸样品中的量较低(图6)。
[0219] 2.2PINS促进混合多核苷酸样品中的靶HPV18DNA分子的富集以允许其PCR检测[0220] 通过实施实施例1中所描述的PINS,混合多核苷酸样品中的靶DNA分子的初始拷贝数(0.0286靶拷贝/μl)提高至2.5靶拷贝/μl的最终量。通过上述的PCR使用1μl的MDA扩增的样品,对通过在初始混合多核苷酸样品上执行第1轮PINS生成的MDA扩增产物进行分析。如图7所示,获得了预期尺寸(667bp)的PCR产物。低水平的非特异性扩增初始的混合多核苷酸样品生成了可检测的低背景,如图7中泳道#2中的拖影(smear)。通过凝胶分离(gel-out)(GeneJet Gel-out试剂盒,Thermo Fischer Scientific)分离泳道#2中的可检测的~667bp产物并且PCR再扩增以提高靶DNA分子的量,从而允许随后的测序(泳道#A,图8)。
[0221] 2.3通过PINS获得的靶HPV18DNA分子的验证
[0222] 使用两个引物[SEQ ID NO:3和4]对分离自泳道#A(图8)的纯化产物进行正向和反向测序。获取的序列与HPV18(HPU89349)的序列的比对产生了具有零错配的完美对比(图9)。本实施例确认了PINS将稀少序列富集至可以对它们的序列进行确定的水平的效力。
[0223] 实施例3:从土壤样品分离编码内切葡聚糖酶的核苷酸片段的方法
[0224] 3.1定义用于选择编码内切葡聚糖酶的靶DNA分子的引物
[0225] 从GenBank检索了编码内切葡聚糖酶和假定内切葡聚糖酶的多重微生物基因,并且使用用于多重序列的ClustalW比对[9]将它们的核苷酸序列进行比对。由所述对比,确定了保守核酸序列的区域并且设计了用于靶向具有这些保守DNA序列之一的DNA分子的一组引物。图10中示出了引物以及编码内切葡聚糖酶的获取基因的序列的部分比对。
[0226] 估计所选择的引物会产生481bp的PCR扩增产物。但是,由于天然样品中的模板的来源和序列是未知的,所以PCR产物的尺寸会偏离所预期的尺寸。
[0227] 3.2.从土壤样品中提取DNA
[0228] 采集森林土壤的样品(8个)作为多样化土壤微生物的来源。如Kvist et.al[10]所描述的,使用珠磨法(Bead Beating)从所述8个不同的样品中提取DNA。使用MDA Repli-g Mini试剂盒,使用如上定义的MDA扩增条件(材料与一般方法)扩增每种提取物。通过在0.7%琼脂糖凝胶上可视化来验证扩增的DNA的质量
[0229] 3.3确定靶DNA分子的存在和丰度:
[0230] 进行初始的PCR分析以评价,使用选定的引物[SEQ ID NO:5和6]、使用所选定的PCR条件:94℃(30秒)+60℃(30秒)+72℃(30秒)并且进行30个循环是否能够观察到靶DNA序列。
[0231] (八个中的)一个MDA扩增样品产生了阳性PCR扩增,而其余7个未显示扩增的迹象。在琼脂糖凝胶上估计PCR产物大致具有正确的预期尺寸。通过实行实时PCR(RT-PCR),使用引物[SEQ ID NO:5和6]确定了靶DNA分子(编码假定内切葡聚糖酶)的丰度并且使用引物[SEQ ID NO:7和8]与16S rRNA基因进行比较(其中将所述16S rRNA基因用作总细菌DNA丰度的量度)。发现,与假定内切葡聚糖酶相比,16S rRNA基因在数量上高约550,000。定量显示,16S rRNA基因存在9.4E6个拷贝,而内切葡聚糖酶仅检测到17个拷贝。因此,需要10-2的稀释度以产生样品(N),因为每个等分试样的样品将平均地含有0.17个模板。
[0232] 3.4施用PINS工序以富集并分离靶DNA分子及其侧翼区:
[0233] 将发现含有靶DNA分子的DNA样品经受如下的PINS:
[0234] 3.4.1:第1轮PINS
[0235] 基于上述检测到的量化,使用1:10的稀释因子(D)创建稀释系列,目的在于建立多个复制稀释(N),10-2。制备了二十个同样的10-2稀释度的样品,并且使用Repli-g Mini试剂盒(Qiagen)进行基因组扩增。使用PCR引物[SEQ ID NO:5和6]和上述1.3中描述的RT-PCR条件个别地分析每个扩增的样品。20个样品中的三个产生了阳性PCR扩增,具有预期尺寸的DNA产物。相关联的PINS分析的输出数据列示如下:
[0236] PINS数据#1
[0237] PINS定量数(quant no):24.3
[0238] 稀释因子:10
[0239] 下一个稀释:10-3
[0240] 下一个复制中的样品:20
[0241] 3.4.2:第2轮PINS
[0242] 基于来自前一轮的PINS-软件分析(PINS#1),总共评估了至少20个复制样品以用于下一轮的复制。因此,制备了20个稀释度为10-3的样品(即相对于先前样品的总稀释度(Dt)提高了10倍稀释度(D)),并且使用Repli-g MDA试剂盒扩增了个别样品的每一个。随后使用引物[SEQ ID NO:5和6]通过RT-PCR分析每个样品,其显示(20个中的)一个样品产生了预期尺寸的DNA产物。选择该样品用于进一步的进度。PINS分析输出数据列示如下。
[0243] PINS数据PINS#2
[0244] PINS定量数:230
[0245] 稀释因子:9.6
[0246] 下一个稀释:10-4
[0247] 下一个复制中的样品:20
[0248] 3.4.3:第3轮PINS
[0249] 基于PINS#2计算的值,据估计,再次需要至少20个样品以用于下一轮的富集。软件提议的稀释度为10-4并且制备了20个样品。使用Repli-g Mini试剂盒扩增了所述20个样品,并且随后使用引物[SEQ ID NO:5和6]进行RT-PCR扩增,其中四个样品产生了预期尺寸的DNA产物。合并这四个样品并且用于下一轮的复制。PINS分析输出数据列示如下。
[0250] PINS数据PINS#3
[0251] PINS定量数:2840
[0252] 稀释因子:12
[0253] 下一个稀释:8.4*10-6
[0254] 下一个复制中的样品:25
[0255] 3.4.4:第4轮PINS
[0256] 基于PINS#3计算的值,现有总共创建了25个具有稀释度8.4*10-6的样品。使用Repli-g Mini试剂盒扩增个体复制稀释样品的每一个。使用引物[SEQ ID NO:5和6]的RT-PCR分析显示,两个样品产生了预期尺寸的DNA产物。PINS分析输出数据列示如下。
[0257] PINS数据PINS#4
[0258] PINS定量数:27200
[0259] 稀释因子:12
[0260] 下一个稀释:8.8*10-7
[0261] 下一个复制中的样品:25
[0262] 3.4.5:第5轮PINS
[0263] 基于PINS#4计算的值,现有总共创建了25个稀释度为8.8-10-7的样品。并且使用Repli-g Mini试剂盒扩增个体样品的每一个。使用引物[SEQ ID NO:6和6]的RT-PCR分析显示,两个样品产生了预期尺寸的DNA产物。
[0264] PINS软件结果列示如下。
[0265] PINS数据PINS#5
[0266] PINS定量数:365000
[0267] 将这轮分析中的两个阳性样品合并成一个样品,并且使用引物[SEQ ID NO:5和6]在靶基因上进行RT-PCR并且在同一样品中使用引物[SEQ ID NO:7和8]在16S rRNA基因上进行RT-PCR。5轮MDA扩增后的总DNA的水平(通过rRNA基因测量)与初始观察相比没有显著变化,但是靶DNA与总DNA的比率现有计算为365000/9200000=约1/25。先前的研究已经表明,比率1:100足以通过RGW获得基因组数据。使用RGW的接头连接引物将各个所述扩增引物结合。
[0268] 3.4.6:通过PINS富集的靶DNA分子的测序
[0269] 使用5个PINS循环来将靶DNA分子的存在提高到通过传统的测序方法能够测序放置的整个基因以及包含所述靶向DNA分子的潜在操纵子的程度。因此,实施了RGW技术[7],其中生成了3个富集有靶DNA分子的DNA样品的随机文库,其通过制备3个限制性消化物(EcoRI、HindIII和BglII/MboI),然后各自使用包含兼容的5'突出端的RGW引物(例如,引物对[SEQ ID NO:5]和[SEQ ID NO:6])退火所述消化物,以形成低聚-盒(cassette)。在PCR扩增中,将用于筛选的靶DNA分子特异性引物[SEQ ID NO:5和6]与RGW引物[SEQ ID NO:5]组合使用以生成较大的PCR产物,该PCR产物跨越了靶DNA分子和它的侧翼区。
[0270]
[0271] 最初,使用所述工序生成了两个DNA序列,并且基于所获得的序列的引物的附加设计产生了完整组装的由3996bp基因构成的一个ORF(图11)。该基因在EndoGlu-fw(5’)末端的上游196bp的位置具有ATG启动密码子。核糖体结合位点(ShineDalgarno)及相关的-10&-35框位于ATG启动密码子的5’方向。另外,在3’方向上未发现与基因的明显连,说明该基因可能不是较大的操纵子的一部分。
[0272] 实施例4:使用PINS以连接常见的基因组起源的多个遗传元件
[0273] 本实施例说明了使用PINS以检测混合样品(例如取自患者)中mecA基因的存在并且确定所述基因是否起源于存在于样品中的葡萄球菌(Staphylococci)的基因组。这种分析依赖于使用PINS以监测位于mecA基因的上游约13000个碱基对处的金黄色葡萄球菌基因的同时共扩增。设计本实验以利用phi29聚合酶对多重置换扩增(MDA)的高保真度,允许在扩增过程中生成多达+70000bp的基因组片段。如果在实施PINS后,使用特异于mecA基因以及特异于金黄色葡萄球菌(SA)的引物产生的PCR产物的水平达到了相当(可比拟)的数量,这表明所述PCR产物来源于同一基因组,即MRSA,因为它们已在MDA的范围内被共扩增。使用在PINS后测序的PCR产物的组装以确认mecA起源于金黄色葡萄球菌的基因组。
[0274] 4.1引物设计
[0275] 从GenBank数据库检索了用于编码mecA的微生物基因的多个序列并且使用用于多序列比对的ClustalW来比对这些序列[9]。定位了具有100%序列同一性的比对区域并且用于引物设计。所得到的靶向mecA的引物为:
[0276] MR-fw:5’-CAAACTACGGTAACATTGATCGCAAC-3’[SEQ ID NO:16]
[0277] MR-Re:5’–CAATATGTATGCTTTGGTCTTTCTGC–3’[SEQ ID NO:17]
[0278] 并且预计它们会产生126bp PCR产物。
[0279] 从抗性(OrfX)的SCCmec整合位点的约13,000bp 5’上游设计了用于靶向金黄色葡萄球菌的菌株特异性引物[14]。引物序列为:
[0280] SA-fw:5’-CGTGAAGAAACAGAACGAATGATTC-3’[SEQ ID NO:18],
[0281] SA-Re:5’-GCCTCTAGAATATTTCATCGCATTTG-3’[SEQ ID NO:19],
[0282] 并且预期它们会产生267bp PCR产物。
[0283] 4.2初级生物样品采集和DNA提取及定量
[0284] 使怀疑含有MRSA的样品接受PINS分析。通过使用“棉签拭子(cotton-stick-swab)”从患者采集所述样品。使用A&A Biotechnology(Poland)DNA拭子提取试剂盒从所述拭子提取总DNA。
[0285] 将所提取的DNA用作用于10-倍连续稀释的模板。使用1μl模板,在具有两组引物MR(MR-fw和MR-Re)和SA(SA-fw和SA-re)的每一个的25μl RT-反应混合中,通过实时(RT)PCR直接分析每个稀释管。
[0286] 从靶向MR(mecA)的所述RT-PCR分析中测量Ct数值,并且将其与在同一循环程序中的平行样品中运行的内标进行比较以转换为绝对数量/拷贝。MR(mecA)的数量经计算为1.70*102,而SA(金黄色葡萄球菌)经计算以1.34*103的量存在。从该RT分析可以明显地看到,所述样品含有比mecA靶更多的葡萄球菌靶。两个产物的比率接近1/8(MR/SA)。
[0287] 4.3应用PINS程序来富集以及用于靶DNA分子诊断mecA和葡萄球菌
[0288] 4.3.1:第1轮PINS#1
[0289] 基于在初始样品中检测的靶DNA分子的水平,制备了10个复制的样品N(稀释度1.7*10-3)。通过向所述十个复制样品的每一个施用Repli-g Ultra-fast并且随后通过施用RT-PCR分析以检测MR靶DNA分子,发现10个样品中的一个样品(“样品E”)产生了大量的MR-PCR产物,而其它9个样品不包含可检测水平的MR PCR产物。在该MR阳性样品中,RT-PCR定量
3 3
显示,MR-PCR产物的丰度为1.27*10 并且样品中SA-PCR产物的丰度为1.31*10。两个靶DNA分子的所述比率现在已经移向相当水平,从约1:8的初始比率移向高达更接近1:1的比率。
[0290] 4.3.2:第2轮PINS#2
[0291] 基于具有稀释度1.27*10-3的阳性“E”样品(2.3.1),建立了另一个稀释系列,并且-4再次制备了10个复制样品N(稀释度1.27*10 )。使用Repli-g Ultra-fast MDA试剂盒扩增每个所述样品。从所述分析的RT-PCR可以明显地看到,可以在10个样品中的9个中检测到MR,并且阳性样品中的MR的丰度为1.32*104。可比较的分析表明,SA-PCR产物的水平未提高,因为SA的丰度保持相同:1.31*104。两个产物的比率再次非常接近1:1。已经采用了PINS以获得x10的额外放大系数,但是未获得任何显著变化的靶丰度,我们得出所述数量不能被进一步增大的结论,表明存在(接近)纯的样品。因此,额外多轮的PINS不会产生更高水平的纯度。因此,下一步骤为对扩增的模板进行测序,以评价抗性基因mecA和相邻基因的同一性,并且验证存在MRSA,而非MR和SA作为独立的DNA分子位于同一样品中。
[0292] 4.3.3:测序MR靶DNA分子中的mecA和相邻基因
[0293] 使用设计用于靶向已知MRSA(GenBank,NCBI)的引物来产生用于测序和组装的重叠PCR产物。生成了不同长度的24个PCR产物,并且通过PCR、测序和组装产生了2475bp.和19186bp.的两个连续序列。通过RGW[7]获得了额外的789bp并且建立了足够的重叠以将所述两个组装合并为一个大的22450bp的组装。核苷酸BLAST[11]示出了接近相同匹配(>
99.9%)于数据库中的多个MRSA菌株。
[0294] 总结:
[0295] 经评估,通过第一轮PINS使MR的丰度提高了8倍。通过在非靶向背景上进行分析,明显的是,MR和SA之间的比率在第一轮(PINS#1)产生了明确的偏差,而在后一轮的扩增(PINS#2)中保持了这一比率。因此,结论是,两个靶DNA分子起源于同一DNA片段,因为即使在多轮PINS选择中仅使用了MR靶DNA分子,但是非靶SA以相等的量存在。从该分析可以明确看到,虽然非抗性葡萄球菌大概也存在于初始混合物中,但是可以得出结论,MR抗性起源于金黄色葡萄球菌而非起源于其它含有mecA的细菌,诸如凝固酶阴性葡萄球菌[12]。虽然MR可以存在于非葡萄球菌菌株中,但是其明显地与SA一起被扩增,原因在于两个靶向DNA分子在MDA扩增过程中共扩增。因此,尽管所述引物序列在基因组中被13000kb分开,但仍有可能将两种性质分配至基因组的相同部分,并足以诊断MRSA的存在。另外,测序验证了这种观察结果,并且明显的是,所述DNA接近相同于(+99.9%)已知的MRSA基因组序列。
[0296] 参考文献
[0297] 1.Maurin,M.,Real-time  PCR as a diagnostic tool for bacterial diseases.Expert Rev Mol Diagn,2012.12(7):p.731-54.
[0298] 2.Shendure,J.and H.Ji,Next-generation DNA sequencing.Nat Biotechnol,2008.26(10):p.1135-45.
[0299] 3.Torsvik,V.,J.Goksoyr,and F.L.Daae,High diversity in DNA of soil bacteria.Appl Environ.Microbiol,1990.56(3):p.782-787.
[0300] 4.Lasken,R.S.and S.Huges,Multiple displacement amplification of genomic DNA,in Whole Genome Amplification,S.Huges,Editor 2005,Scion Publishing Ltd.2005:Oxfordshire.p.99-118.
[0301] 5.Sambrook,J.and D.W.Russell,Molecular Cloning a laboratory manual2001:Cold Spring Harbor Laboratory Press.
[0302] 6.Raghunathan,A.,et al.,Genomic DNA amplification from a single bacterium.Applied and Environmental Microbiology,2005.71(6):p.3342-3347.[0303] 7.Kilstrup,M.and K.N.Kristiansen,Rapid genome walking:a simplified oligo-cassette mediated polymerase chain reaction using a single genome-specific primer.Nucleic Acids Res,2000.28(11):p.e55.
[0304] 8.Liu,L.,et al.,Comparison of next-generation sequencing systems.J Biomed Biotechnol,2012.2012:p.251364.
[0305] 9.Chenna,R.,et al.,Multiple sequence alignment with the Clustal series of programs.Nucleic Acids Res.,2003.31(13):p.3497-3500.
[0306] 10.Kvist,T.,et al.,Diversity of thermophilic and non-thermophilic crenarchaeota at 80 degrees C.FEMS Microbiol.Lett.,2005.244(1):p.61-68.[0307] 11.Altschul,S.F.,et  al.,Basic  local  alignment  search tool.J.Mol.Biol.,1990.215(3):p.403-410.
[0308] 12.Huletsky,A.,et al.,Identification of methicillin-resistant Staphylococcus aureus carriage in less than 1 hour during a hospital surveillance program.Clin Infect Dis,2005.40(7):p.976-81.。
QQ群二维码
意见反馈