首页 / 专利库 / 生物学 / 羊水 / 外来体相关核酸的测序和分析

外来体相关核酸的测序和分析

阅读:1028发布:2021-02-22

专利汇可以提供外来体相关核酸的测序和分析专利检索,专利查询,专利分析的服务。并且本 发明 提供了一系列步骤,其制备从细胞外囊泡分离出来的核酸(RNA和/或DNA),以供测序。这使得各种各样的RNAs和/或DNAs能够被有效地检测到。然后可以使用这些来识别各种属性,例如基因表达、可变剪接以及检测 体细胞 突变和生殖系突变,包括单核苷酸变体(SNV)和结构变化(插入/缺失、融合、倒置)。,下面是外来体相关核酸的测序和分析专利的具体信息内容。

1.一种对来自生物样品的核酸进行测序的方法,其包括:
(a) 提供生物样品;
(b) 在足以将来自生物样品的无细胞DNA和细胞外囊泡保留在捕获表面上或在捕获表面内的条件下,使生物样品与固体捕获表面接触
(c) 当无细胞DNA和细胞外囊泡在捕获表面上或在捕获表面内时,使捕获表面与溶解试剂接触,从而从捕获表面释放DNA和RNA并产生匀浆;
(d) 从匀浆中提取DNA、RNA或两者;
(e) 选择性地从匀浆或从提取的DNA、提取的RNA或两者中除去核糖体DNA或RNA序列;
(f) 将RNA反转录成cDNA;
(g) 从提取的DNA、反转录的cDNA或提取的DNA和反转录的cDNA两者,构建双链DNA库;
(h) 任选地扩增来自库的DNA、RNA或DNA和RNA两者;
(i) 从cDNA或双链DNA库选择性地富集核酸序列;和
(j) 对包含cDNA、双链DNA或cDNA和双链DNA两者的库进行测序。
2. 权利要求1的方法,其还包括在步骤(e)之前或之后,用DNase,例如DNase I和/或修饰的DNase I,预处理匀浆、提取的RNA或提取的DNA和RNA的步骤。
3.权利要求1的方法,其还包括在步骤(e)中,在库构建过程中的任意一步,选择性地从RNA、cDNA、双链DNA除去核糖体DNA或RNA序列。
4.任一项前述权利要求的方法,其还包括在步骤(d)之前或之后,向匀浆和/或提取的DNA、提取的RNA或提取的DNA和RNA两者中添加外源RNA或DNA掺杂剂的步骤。
5.权利要求1的方法,其中步骤(j)是同时对来自生物样品的RNA和DNA两者进行测序。
6. 任一项前述权利要求的方法,其还包括在步骤(d)之前或之后,用DNase,例如DNase I预处理匀浆的步骤,接着在匀浆中添加外源RNA掺杂剂的步骤。
7.任一项前述权利要求的方法,其还包括在步骤(d)之前或之后,将外源RNA或DNA掺杂剂以1:100、1:1000、1:10,000、1:100,000、1:1,000,000、1:10,000,000的稀释度添加至匀浆和/或提取的RNA、提取的DNA或提取的DNA和RNA两者中的步骤。
8. 任一项前述权利要求的方法,其中选择性地除去核糖体RNA、cDNA、双链DNA的步骤包括使用酶试剂例如RNase H或限制性内切酶消化;利用基于杂交的生物素化探针富集和链霉抗生物素结合的顺磁性珠。
9.任一项前述权利要求的方法,其中从RNA、cDNA和/或双链DNA库选择性地富集核酸序列的步骤利用基于PCR的方法、互补寡核苷酸和/或基于杂交的生物素化探针富集和链霉抗生物素结合的顺磁性珠。
10.任一项前述权利要求的方法,其中RNA、cDNA和/或双链DNA分子用独特的分子指标(独特的分子标记、独特的标识符、随机条形码)标记,这使得识别模板、重复数据删除、纠错和拷贝数计数成为可能;独特的分子指标可通过引物退火、衔接子连接和酶法来附接。
11.任一项前述权利要求的方法,其中核酸包含具有超过200个核苷酸,例如超过300个核苷酸或甚至超过500个核苷酸的长RNA。
12. 任一项前述权利要求的方法,其中生物样品含有少至约0.5 mL的体积,例如约0.5 mL-约20 mL、约0.5 mL-约10 mL、约0.5 mL-约5 mL、约0.5 mL-约4 mL或甚至约0.5 mL-约2 mL的体积。
13.任一项前述权利要求的方法,其中生物样品选自血液、血浆、血清、尿液、痰液、脊髓液、脑脊液、胸腔积液、乳头抽吸液、淋巴液;呼吸道、肠道和泌尿生殖道的液体;泪液、唾液、乳汁、来自淋巴系统的液体、精液、脑脊液、器官系统内液体、腹肿瘤囊内液、羊水及其组合。
14.任一项前述权利要求的方法,其中生物样品是血液、血浆或血清。
15.任一项前述权利要求的方法,其中固体捕获表面是膜,例如柱膜或者是珠子。
16.任一项前述权利要求的方法,其中固体捕获表面是包含再生纤维素的膜。
17. 任一项前述权利要求的方法,其中固体捕获表面是一种膜,其具有范围在2-5 µm之间或至少3 µm的孔径。
18.任一项前述权利要求的方法,其中固体捕获表面包含一个以上的膜,例如至少两个膜或甚至至少三个膜。
19.任一项前述权利要求的方法,其中固体捕获表面包含三个膜,其中这三个膜彼此直接相邻。
20.任一项前述权利要求的方法,其中固体捕获表面是磁性的。
21.任一项前述权利要求的方法,其中固体捕获表面是一种珠,其是离子交换(IEX)珠,为带正电的或是带负电的。
22.任一项前述权利要求的方法,其中固体捕获表面被季胺、硫酸盐、磺酸盐、叔胺或其组合官能化。
23.任一项前述权利要求的方法,其中固体捕获表面被季铵盐R-CH2-N+(CH3)3官能化。
24.任一项前述权利要求的方法,其中固体捕获表面包含IEX珠,其是磁性、高容量IEX珠,例如强磁性、高容量珠或甚至强铁磁性、高容量、含化铁的磁性聚合物
25.任一项前述权利要求的方法,其中固体捕获表面包含IEX珠,其表面没有暴露于易氧化的液体。
26.任一项前述权利要求的方法,其中固体捕获表面包含具有珠电荷与暴露表面的高比例的IEX珠。
27.任一项前述权利要求的方法,其中步骤(d)还包括在从匀浆提取DNA、RNA或DNA和RNA两者之前,向匀浆添加蛋白沉淀缓冲剂。
28.任一项前述权利要求的方法,其中步骤(d)还包括酶消化。
29.任一项前述权利要求的方法,其中步骤(d)包括蛋白酶消化。
30.任一项前述权利要求的方法,其中步骤(d)用或不用在前从固体表面洗脱材料进行。
31.任一项前述权利要求的方法,其中步骤(d)包括使用蛋白酶、DNAse、RNase或其组合进行消化。
32.任一项前述权利要求的方法,其中步骤(d)还包括蛋白沉淀缓冲剂,其包含过渡金属离子、缓冲剂或过渡金属离子和缓冲剂两者。
33. 任一项前述权利要求的方法,其中步骤(a)还包括通过过滤生物样品,例如使用
0.8 µm过滤器过滤来处理生物样品。
34.任一项前述权利要求的方法,其中步骤(b)还包括在生物样品与捕获表面接触后的离心步骤。
35.任一项前述权利要求的方法,其中步骤(b)还包括在生物样品与捕获表面接触后洗涤捕获表面。
36.任一项前述权利要求的方法,其中步骤(d)还包括在匀浆中加入核酸对照掺杂剂。
37.任一项前述权利要求的方法,其中该方法还包括使蛋白沉淀洗脱物与胶柱结合;
以及从硅胶柱洗脱提取物的步骤。
38.任一项前述权利要求的方法,其中该方法被用于从生物样品中高通量分离核酸。
39.任一项前述权利要求的方法,其中步骤(d)包括使用一种或多种化学品以增强小RNA与固体表面的结合,例如最适浓度的异丙醇、乙酸钠和糖原。
40.任一项前述权利要求的方法,其中步骤(b)利用选自以下的结合条件的最佳组合:
阳离子浓度、阴离子浓度、洗涤剂、pH、时间和温度,及其任何组合。

说明书全文

外来体相关核酸的测序和分析

[0001] 相关申请本申请要求2016年10月21日提交的美国临时申请号62/410,974和2017年7月25日提交的美国临时申请号62/536,545的权益,其内容通过引用以其整体结合到本文中。
发明领域
[0002] 本发明属于分子生物学技术领域。更具体地说,本发明属于分子诊断学技术领域。在分子生物学中,以核酸形式存在的分子,例如RNA和DNA,可以从人体样品材料(如组织和各种生物流体)中分离出来,并通过多种方法进一步分析。
[0003] 背景来自生物流体的外来体和其它细胞外囊泡的全面核酸测序,包括RNA测序,有望进行极为敏感的诊断,从而检测疾病,患者分层和监测治疗反应。术语外来体在此用于描述由细胞释放的任何细胞外膜结合的囊泡。
[0004] 对于从体外或离体系统分离的外来体内的长RNA载荷,人们基本缺乏了解。以往的调查外来体RNA载荷的研究主要集中在小RNA部分。这些研究中报道的带注释的长RNAs的比例相对较小,转录覆盖率较低,这使得许多人得出结论,认为外来体只携带蛋白编码和非编码RNA的短片段,并对关于其通过外来体调节基因表达和细胞间通讯的潜在功能能提出了疑问。
[0005] 目前从细胞外囊泡中分离DNA和/或DNA及核酸(包括至少RNA)的方法包括超速离心、超滤(例如使用100 kDa滤器)、聚合物沉淀技术和/或基于大小的过滤。然而,对替代方法存在需要,所述替代方法高效和有效分离细胞外囊泡,并任选地提取其中所含的核酸,优选细胞外囊泡RNA,以及对其中所含的核酸进行测序,以用于各种应用,包括诊断目的。
[0006] 因此,对细胞外囊泡内的核酸进行可靠测序和分析仍存在需要。本公开内容涉及这些和其它重要目的。
[0007] 发明概述本发明提供了对来自生物样品的核酸测序的方法,包括提供生物样品;在足以在捕获表面上或在捕获表面内保留无细胞DNA和细胞外囊泡的条件下,使生物样品与固体捕获表面接触;当无细胞DNA和细胞外囊泡在捕获表面上或在捕获表面内时,使捕获表面与溶解试剂接触,从而从捕获表面释放DNA和RNA并产生匀浆;从匀浆中提取DNA、RNA或两者;选择性地从匀浆或从提取的DNA、提取的RNA或两者中除去核糖体DNA或RNA序列;将RNA反转录成cDNA;从提取的DNA、反转录的cDNA或提取的DNA和反转录的cDNA两者构建双链DNA库;任选地扩增来自库的DNA、RNA或DNA和RNA两者;从cDNA或双链DNA库中选择性地富集核酸序列;
和对包含cDNA、双链DNA或cDNA和双链DNA两者的库进行测序。
[0008] 在某些实施方案中,该方法还包括在有选择地除去核糖体DNA或RNA序列之前或之后,用DNase,例如DNase I和/或修饰的DNase I对匀浆、提取的RNA或提取的DNA和RNA进行预处理的步骤。在其它实施方案中,该方法还包括在库构建过程中的任意一步,从RNA、cDNA、双链DNA选择性地除去核糖体DNA或RNA序列。
[0009] 在某些实施方案中,该方法包括同时对来自生物样品的RNA和DNA进行测序。
[0010] 在某些实施方案中,该方法还包括从匀浆中提取DNA、RNA或两者之前或之后,将外源RNA或DNA掺杂剂(spike)加入到匀浆和/或提取的DNA、提取的RNA或提取的DNA和RNA两者中的步骤。在某些实施方案中,该方法还包括在从匀浆中提取DNA、RNA或两者之前或之后,用DNase,例如DNase I预处理匀浆的步骤,接着在匀浆中添加外源RNA掺杂剂的步骤。在某些实施方案中,该方法还包括在从匀浆中提取DNA、RNA或两者之前或之后,将外源RNA或DNA掺杂剂按1:100、1:1000、1:10,000、1:100,000、1:1,000,000、1:10,000,000的稀释度加入到匀浆和/或提取的RNA、提取的DNA或提取的DNA和RNA两者中的步骤。
[0011] 在某些实施方案中,选择性地除去核糖体RNA、cDNA、双链DNA包括使用酶试剂例如,RNase H或限制性内切酶消化;利用基于杂交的生物素化探针富集和链霉抗生物素结合顺磁性珠。在某些实施方案中,利用基于PCR的方法、互补寡核苷酸和/或基于杂交的生物素化探针富集和链霉抗生物素结合顺磁性珠,从RNA、cDNA和/或双链DNA库选择性地富集核酸序列。在某些实施方案中,RNA、cDNA和/或双链DNA分子用独特的分子指标(独特的分子标记、独特的标识符、随机条形码)标记,这使得识别模板、重复数据删除(de-duplication)、纠错和拷贝数计数成为可能。独特的分子指标可通过引物退火、衔接子连接和酶法来附接。
[0012] 在某些实施方案中,核酸包含具有超过200个核苷酸,例如超过300个核苷酸或甚至超过500个核苷酸的长RNA。
[0013] 在某些实施方案中,生物样品含有少至约0.5 mL的体积,例如约0.5 mL-约20 mL、约0.5 mL-约10 mL、约0.5 mL-约5 mL、约0.5 mL-约4 mL或甚至约0.5 mL-约2 mL的体积。在某些实施方案中,生物样品选自血液、血浆、血清、尿液、痰液、脊髓液、脑脊液、胸腔积液、乳头抽吸液、淋巴液;呼吸道、肠道和泌尿生殖道的液体;泪液、唾液、乳汁、来自淋巴系统的液体、精液、脑脊液、器官系统内液体、腹肿瘤囊内液、羊水及其组合。在某些实施方案中,生物样品是血液、血浆或血清。
[0014] 在某些实施方案中,固体捕获表面是膜,例如柱膜或者是珠子。固体捕获表面可以是一种包含再生纤维素的膜。固体捕获表面可以是一种具有孔径范围在2-5 µm之间或至少3 µm的膜。固体捕获表面可包含一个以上的膜,例如至少两个膜或甚至至少三个膜。固体捕获表面可包含三个膜,其中这三个膜彼此直接相邻。
[0015] 在某些实施方案中,固体捕获表面是磁性的。在某些实施方案中,固体捕获表面是珠,其是离子交换(IEX)珠,为带正电的或是带负电的。固体捕获表面可以用季胺、硫酸盐、磺酸盐、叔胺或其组合官能化。固体捕获表面可以用季铵盐R-CH2-N+(CH3)3官能化。
[0016] 在某些实施方案中,固体捕获表面包含IEX珠,其是磁性、高容量IEX珠,例如强磁性、高容量珠或甚至强铁磁性、高容量、含化铁的磁性聚合物。固体捕获表面可包含IEX珠,其没有暴露于易氧化的液体的表面。固体捕获表面可包含具有珠电荷与暴露表面的高比例的IEX珠。
[0017] 在某些实施方案中,提取步骤还包括在从匀浆提取DNA、RNA或DNA和RNA两者之前向匀浆添加蛋白沉淀缓冲剂。在某些实施方案中,提取步骤还包括酶消化。提取步骤可包括蛋白酶消化。在某些实施方案中,提取步骤用或不用先从固体表面洗脱材料进行。在某些实施方案中,提取步骤包括使用蛋白酶、DNAse、RNase或其组合的消化。在某些实施方案中,提取步骤还包括蛋白沉淀缓冲剂,其包含过渡金属离子、缓冲剂或过渡金属离子和缓冲剂两者。
[0018] 在某些实施方案中,该方法还包括通过过滤生物样品,例如通过使用0.8 µm过滤器过滤来处理生物样品。在某些实施方案中,该方法还包括在生物样品与捕获表面接触后的离心步骤。在某些实施方案中,该方法还包括在生物样品与捕获表面接触后洗涤捕获表面。
[0019] 在某些实施方案中,该方法还包括在匀浆中加入核酸对照掺杂剂(spike-in)。
[0020] 在某些实施方案中,该方法还包括使蛋白沉淀洗脱物与胶柱结合;以及从硅胶柱中洗脱提取物的步骤。在某些实施方案中,该方法用于从生物样品中高通量分离核酸。在某些实施方案中,该方法包括使用一种或多种化学品增强小RNA与固体表面的结合,例如最适浓度的异丙醇、乙酸钠和糖原。在某些实施方案中,该方法采用选自以下的结合条件的最佳组合:阳离子浓度、阴离子浓度、洗涤剂、pH、时间和温度,及其任何组合。
[0021] 现将详细描述本发明的各个方面和实施方案。将理解,在不偏离本发明范围的情况下可对细节进行修改。此外,除上下文另有要求外,单数词应包括复数,复数词应包括单数。
[0022] 所有已确定的专利、专利申请和出版物通过引用明确结合到本文中,目的是描述和公开例如可结合本发明使用的此类出版物中所描述的方法。这些出版物仅为其在本申请提交日期之前的公开内容而提供。这方面不应被解释为承认发明人无权因在前发明或任何其它原因而早于这样的公开内容。有关这些文件的日期的所有声明或有关这些文件的内容的所有陈述均以申请人可获得的信息为基础,并且不构成关于这些文件的日期或内容的正确性的任何承认。
[0023] 附图简述图1是一系列生物分析仪图,显示了RNA谱图,这是由在RNASeq库中长RNA转录物的扩增和结合所产生的。
[0024] 图2是一幅显示各种条件的转录物相关性的图表。合成掺杂剂的使用显示了0.999的复制之间的相关性,证明了库复制之间的良好的相关性和再现性。
[0025] 图3说明了以(从左到右)基因间、内含子、其它基因组、转录组和未映射的形式出现的读取所占的比例,其中x-轴提供了读取的百分比。
[0026] 图4还说明了以(左至右) ERCC、Ig、miscRNA、ncRNA、蛋白编码基因、假基因、rRNA、重复序列、小RNA和tRNA的形式出现的读取所占的比例,其中x-轴提供了读取的百分比。
[0027] 图5是一个按读取的比例绘制注释分布的图表,不包括核糖体RNA,其中y-轴表示读取的百分比,x-轴表示RNA类型。
[0028] 图6是在没有(左)和有(右)核糖体耗竭的情况下,作为读取的百分比绘制核糖体基因28S、18S、12S和16S的图表。
[0029] 图7说明比较基因、仅蛋白编码转录物和所有转录物的Gencode v24注释的百分比。
[0030] 图8绘制通过所有转录物(左),以及扩增非编码RNAs (右)的转录物数目的注释分布。
[0031] 图9是一个图表,其将总共86,799份覆盖的转录物绘制成x-轴上覆盖的转录物(仅为外显子)的百分比和y-轴上覆盖的转录物的分数。
[0032] 图10是绘制x-轴上(log2标度)的分子数目相对于y-轴上(同样为log2标度)每百万分之转录物数的曲线图。
[0033] 图11列出了发现在血浆外来体长RNA中提供的基因本体论最高类别的表格。
[0034] 图12是一幅图表,其示出根据本文提供的改进工作流程的各种检查条件的ERCC相关性。
[0035] 图13是转录物中5'至3'覆盖变化(左)和ERCC掺杂剂中5'至3'覆盖变化(右)的图,其中x-轴是沿转录物的归一化距离,而y-轴是归一化覆盖率。
[0036] 图14是提供血浆外来体最终库大小分布的生物分析仪图。
[0037] 图15是根据本文提供的改进工作流程实施的示例性算法的示意图。
[0038] 图16提供RNASeq流水线的概述。
[0039] 图17显示映射度量(图17A),UHR、仅RNA和RNA+cfDNA作为基覆盖的%的碱基覆盖率(图17B)和每个泛癌靶的读取图(图17C)。
[0040] 图18显示映射度量(图18A),cfDNA和cfDNA+RNA作为碱基覆盖的%的碱基覆盖率(图18B)和每个靶标的覆盖深度图(图18C)。
[0041] 图19显示映射度量(图19A),UHR、仅RNA和RNA+cfDNA作为碱基覆盖的%的碱基覆盖率(图19B)和基因读取覆盖图(图19C)。
[0042] 图20绘制了三个独立的为液体活检优化的RNASeq库准备工作流程。
[0043] 图21展示了各种核糖体RNA耗竭方法。
[0044] 图22展示了总RNA和总核酸(cfDNA+RNA)的库制备方法。
[0045] 图23是显示对于从血浆中构建的6个独立库复制体,以总RNASeq测定为基础的ERCC外源RNA掺杂剂的检测极限的图。
[0046] 图24是RNASeq浏览器,显示QC度量和分析结果。
[0047] 图25是差异表达浏览器,显示和评估差异表达分析的结果。
[0048] 图26是一个示意图,其比较了外来体样品的两个现成过程(方法4和方法5)与将这些单独的流合并成单一方法的改进过程(方法6)。
[0049] 图27注释未映射的、其它基因组、基因间、内含子和转录组的覆盖率,作为每个样品的输入读取百分比的量度。
[0050] 图28注释作为每百万分之读数的生物类型ERCC、污染物、rRNA、蛋白编码基因、ncRNA、小RNA、tRNA、假基因、miscRNA和Ig的每一个。
[0051] 图29是显示插入物长度(核苷酸数目)对比密度的图。
[0052] 图30绘制按y-轴上基因数目的x-轴上基因生物类型。
[0053] 图31提供了对所有基因(顶部)、有用的转录组(中间)和mRNA (底部),按在或高于阈值处检测到的数目基因的检测阈值RPM的图。
[0054] 图32绘制了x-轴上覆盖的转录物(仅外显子)的百分比对比y-轴上的总转录物的分数的图。
[0055] 图33显示ERCC转录物的检测极限。
[0056] 图34绘制在转录物(5’至3’)上归一化的位置对比归一化覆盖率的图。
[0057] 图35注释未映射的、其它基因组、基因间、内含子和转录组覆盖率,作为每个样品的输入读取百分比的度量。
[0058] 图36注释作为每百万分之读数的生物类型ERCC、污染物、rRNA、蛋白编码基因、ncRNA、小RNA、tRNA、假基因、miscRNA和Ig的每一个。
[0059] 图37是显示插入物长度(核苷酸数目)对比密度的图。
[0060] 图38绘制按y-轴上基因数目的x-轴上基因生物类型。
[0061] 图39提供了对所有基因(顶部)、有用的转录组(中间)和mRNA (底部),按在或高于阈值处检测到的基因数目的检测阈值RPM的图。
[0062] 图40绘制了x-轴上覆盖的转录物(仅外显子)的百分比对比y-轴上的总转录物的分数的图。
[0063] 图41通过标出转录物长度对比转录物分数,强调覆盖率超过80%的转录物的大小。
[0064] 图42显示ERCC转录物的检测极限。
[0065] 图43绘制在转录物(5’至3’)上归一化的位置对比归一化覆盖率的图。
[0066] 发明详述本发明提供一系列步骤,用于制备从外来体中分离出来的核酸(RNA和/或DNA),以供测序。这使得有效检测各种各样的RNAs和/或DNAs成为可能。然后,这些可用于识别各种属性,如基因表达、可变剪接、融合转录物、环状RNA以及检测体细胞和生殖细胞突变,包括单核苷酸变体(SNV)和结构变体(插入/缺失、融合、倒置)。
[0067] 在一个实施方案中,本发明提供了将多个工作流程(例如,RNA和DNA的单独处理条件)组合成一个单一工作流程的能力,以允许以更有效的方式分析外来体样品。
[0068] 在一个实施方案中,本发明提供了一种工作流程,它特异性地富集了感兴趣目标的样品,从而实现了更深层次的序列覆盖。所述工作流程提供了在特定样品中定向捕获cDNA或dsDNA的能力,例如通过富集样品中感兴趣的基因子集和/或通过消耗没有意义的其它基因。
[0069] 根据一个实施方案,本发明提供一个专设计的平台,以将来自外来体的短RNA转录物和长RNA转录物包含到RNA测序工作流程中。如本文所用的,术语“长RNA”指具有大于200个核苷酸,例如超过300个核苷酸或甚至超过500个核苷酸的RNA并可包括长的非-编码RNA、mRNA和环状RNA。
[0070] 根据一个实施方案,本发明提供一个将来自外来体的DNA单独处理或与RNA(短RNA和长RNA转录物)混合处理成测序工作流程的平台。
[0071] 用作测序工作流程输入的生物流体的体积可以低至≥0.5 ml且没有上限(图16)。
[0072] 从如本文所述的生物样品开始,例如人血浆、血清、血液、尿液、脑脊液等,将核酸与外来体和其它无细胞来源分离。或者,核酸可以来源于组织来源,如参考标准品和FFPE材料。
[0073] 外来体衍生的核酸可以单独包括RNA或DNA或可以作为RNA和DNA的混合物,如图17 (RNA & RNA+DNA)和图18 (DNA & RNA+DNA)所示,其说明这些核酸组合的测序。外来体衍生的核酸可包括外来体内包含的物质或与外来体表面结合的物质。DNA成分可以是外来体的或其它无细胞来源(cfDNA)。
[0074] 在一个实施方案中,本文所述的用于进一步纯化具有相关核酸的细胞外囊泡的外来体分离方法还包括:1) 超速离心,通常与蔗糖密度梯度液或蔗糖缓冲相结合,使相对低密度的外来体浮起。通过顺序差动离心分离外来体,结合蔗糖梯度超速离心,可提供较高的外来体富集率。2) 选自聚乙二醇、右旋糖酐、葡聚糖硫酸酯、葡聚糖乙酸酯、聚乙烯醇、聚醋酸乙烯酯或聚硫酸乙烯酯的排除体积聚合物,其中,排除体积聚合物的相对分子质量为1000-35000道尔顿,与0-1M的添加剂氯化钠一起使用。3)  尺寸排除色谱法,例如SephadexTM G200柱基质。4) 使用顺磁性珠(包括免疫-沉淀)的选择性免疫亲和力或基于电荷的捕获,例如通过使用针对表面抗原抗体,包括但不限于EpCAM、CD326、KSA、TROP1;
选择抗体可与顺磁性微球结合。5) 用离液剂如硫氰酸胍盐直接沉淀。
[0075] 在分离外来体后,对样品进行如下所述的方法。简言之,在一个实施方案中,工作流程从外来体RNA分离开始,然后对其中DNA可能干扰分析的应用进行DNase处理。
[0076] 在另一个实施方案中,在外来体RNA分离后,样品可以用DNase处理,也可以不经处理。在某些实施方案中,DNase处理对于其中DNA可能干扰分析的应用是有用的。在其它实施方案中,在对其中DNA的贡献具有分析意义时,对样品不进行处理。
[0077] 这里考虑的DNase处理包括野生型DNase I及其蛋白工程或其它修饰形式。商业上可获得的例子包括,但不限于ArcticZymes:Heat & Run gDNA清除试剂盒;New England Biolabs:DNase I;Sigma Aldrich: DNase I;ThermoFisher Scientific:Turbo DNase;和ThermoFisher Scientific:Ambion DNase I。
[0078] 在某些实施方案中,合成RNA或DNA标准的掺杂剂,在此也称为“合成掺杂剂”,在DNase步骤之前或之后作为质量控制度量或在测序库准备之前的任何步骤执行。外源材料例如合成核酸,可用作样品质量控制试剂,定量试剂,可使检测限,动态范围和技术重现性研究和/或能够检测特定序列的研究。
[0079] 商业上提供的合成掺杂剂包括,但不限于Dharmacon:Solaris RNA掺杂剂对照试剂盒;Exiqon:RNA掺杂剂试剂盒;Horizon Diagnostics:参考标准,Lexogen:spike-in RNA变体对照混合物;Thermo Fisher Scientific:ERCC RNA掺杂剂对照混合物;和Qbeta RNA掺杂剂、酵母或拟南芥RNA。
[0080] 在某些实施方案中,合成掺杂剂在不同稀释度下加入到样品中。在某些实施方案中,要加入到样品中的掺杂剂的稀释度可以在1:1000-1:10,000,000的范围内,包括,但不限于1:1000、1:10,000、1:100,000、1:1,000,000和甚至1:10,000,000的稀释度。要添加到样品中的掺杂剂的特定稀释度是根据样品中存在的核酸的数量和/或质量和/或来源来确定的。
[0081] 接着,样品可以经历反转录反应或未处理。在某些实施方案中,当有兴趣将RNA转换为cDNA时,样品中的RNA被反转录。在某些实施方案中,当只需要单链cDNA时,只进行第一步合成。在某些实施方案中,当需要双链DNA时,第一链和第二链都被合成。在某些实施方案中,当在只研究样品中的DNA部分有意义时,该样品是未经处理的。在某些实施方案中,cDNA处理步骤包括,例如但不限于通过用尿嘧啶-N-糖基化酶处理和/或通过NGS衔接子序列的取向、RNA的切割、RNA的碎片化、非规范核苷酸的掺入、衔接子序列的退火或连接、第二链合成等来保持链信息。
[0082] 在某些实施方案中,样品经受碎片化或未经处理。碎片化可以通过使用酶的或非酶的处理来实现,也可以通过用RNA或dsDNA对材料进行物理剪切来实现。在某些实施方案中,RNA和/或dsDNA的碎片化在二价阳离子存在下,通过热变性进行。基于样品中存在的核酸的数量和/或质量和/或来源来确定样品的碎片化时间的特定持续时间。在某些实施方案中,碎片化时间的特定持续时间的范围在从0分钟至30分钟。
[0083] 在某些实施方案中,在末端修复和聚腺苷化之后,使用基于连接的方法将测序衔接子添加到材料中。在某些实施方案中,采用基于PCR的方法,将测序衔接子添加到材料中。样品中的核酸,其已经通过以上描述的任何实施方案,并且现在具有序列衔接子,在此将被描述为‘库’,当提及包含在序列衔接子的上下文中的核酸片段时,在样品或‘库片段’中的核酸片段的全部集合时。衔接子序列中包含独特的分子指数(UMI)、独特的标识符或分子标记为读取重复数据删除和增强对样品中核酸分子的输入数目的估计提供了额外的益处。
[0084] 在某些实施方案中,使用基于珠的分离技术,库可以经受一种处理,从而可库的组成进一步修改,以便:1) 除去不需要的产物(包括但不限于;残余衔接子、引物、缓冲剂、酶、衔接子二聚体);2) 具有一定的尺寸范围(通过改变珠或珠缓冲剂与样品的比率,可以在样品中包括或排除低分子量和/或高分子量产物);3) 以最小体积洗脱浓缩样品。这个过程通常被称为‘清理’步骤或者样品被‘清除’,并将在此称为‘清理’步骤。基于珠的分离技术可包括但不限于顺磁性珠。如果需要或希望,可进行一次或多次基于珠的清理。
[0085] 根据本文的方法,市场上可买到的有用的顺磁性珠包括,但不限于Beckman Coulter:Agencourt AMPure XP;Beckman Coulter:Agencourt RNAclean XP;Kapa Biosystems:Kapa  Pure珠;Omega Biosystems:MagBind TotalPure NGS珠;和ThermoFisher Scientific: Dynabeads。
[0086] 在某些实施方案中,所述珠经历水化步骤,其中干燥的珠粒被水化液例如水,特别是无核酸酶的水所覆盖,再悬浮,并允许在大约20℃-40℃的温度下孵育,例如约20℃-约25℃,持续从约1分钟到约10分钟,例如约5分钟-约10分钟的时间。在一个优选的实施方案中,所述珠被允许在室温下孵育5分钟以再水化。
[0087] 在某些实施方案中,在基于珠的清理后,所述库使用靶向衔接子序列的通用引物进行大规模扩增。可以修改扩增循环的数量,以产生用于下游处理步骤所需的足够的产物。在某些实施方案中,将使用较少的周期,以尽量减少可能导入的偏差。在某些实施方案中,将使用更多的循环来生成一个分子浓度较高的库。在某些实施方案中,进行了一轮可选的qPCR,以确定库的最佳PCR扩增周期数。在库扩增之后,如上所述再次重复基于珠的清理。
[0088] 其次,利用(但不限于)荧光技术(例如Qubit dsDNA HS分析和/或Agilent Bioanalyzer HS DNA分析),对库的数量和质量进行量化。
[0089] 在某些实施方案中,样品的等分试样可用于基于杂交的富集过程(参见图17-19)。该方法利用与样品中包含的感兴趣的基因组序列区域互补的核苷酸探针的杂交,随后利用选择用于感兴趣序列的缓冲液的一系列洗液,同时洗掉不需要的材料。探针-序列杂种可以被选择用于,但不限于,链霉抗生物素-生物素化学品。该过程可用于富集基因组或转录组序列的任何部分或混合物,包括但不限于外显子区、非翻译区(UTR)、基因间区域和内含子区域,这些区域可以覆盖全部基因编码区或基因内外的特定热点位置。杂交探针板可用于将来自少量靶(1或20)的任何数目的靶序列富集到许多靶(>1,000),包括但不限于具有~
20,000个基因的总蛋白编码转录组(见图4),总的非编码转录组,包括长的非编码、长的基因间非编码、重复序列例如Alu、HerV、Line等、反义和小的非编码转录组或上述任何组合,针对广泛疾病或疾病相关途径的大型面板,具有>1,000个基因或更少的病理状态(见图17-
18)和针对重点疾病或与疾病相关的途径的、有50-500个基因(例如实体肿瘤)的中型面板。
在某些实施方案中,样品将不会被浓缩,在这种情况下,将对全部样品进行测序(图20-22)。
示例性商业杂交试剂盒包括,例如,Agilent’s SureSelect Exome V2;ArcherDx’s Comprehensive Solid Tumor;Asuragen Quantidex NGS Pan Cancer Kit;ClonTech’s SMARTer Target RNA Capture;IDT’s Pan-Cancer Panel;Illumina’s Trusight RNA Pan-Cancer Panel;Illumina’s TruSight Tumor 170;Illumina’s RNA Access;New England BioLabs’s NEBNext Direct Cancer HotSpot Panel;NuGEN’s Ovation Fusion Panel Target Enrichment System V2;Roche’s SeqCap EZ Exome v3.0 Kit;和Roche’s Avenio ctDNA Expanded Kit。
[0090] 在某些实施方案中,当对总样品进行分析时,核糖体序列(cDNA、RNA或cfDNA)有时会影响低丰度转录物的检测,在这种情况下,最好删除或耗竭核糖体序列的样品(见图21),此处也称为“核耗竭”。选择性除去大量但不需要的序列,包括但不限于核糖体序列和/或球蛋白基因序列,可以在RNA序列水平上完成,这在只分离和分析RNA时是合适的或者在dsDNA (库)水平,在分析cDNA和/或cfDNA时是合适的。核糖体序列特异性耗竭可以用类似于(但不限于) RNase H或限制性内切酶消化的酶试剂来完成。也可利用基于杂交的生物素化探针富集和链霉抗生物素结合顺磁性珠来特异性捕获和除去核糖体序列,从而实现耗竭。
[0091] 在某些实施方案中,核糖体耗竭也可包括一个或多个引物退火的额外周期,例如一个额外的周期,两个额外的周期,三个额外的周期或者五个或更多的额外周期。
[0092] 在某些实施方案中,在基于杂交的目标富集或核糖体耗竭过程之后,将使用识别测序衔接子的通用引物对剩余的样品材料进行扩增。基于PCR的扩增将根据需要使用足够多的周期来生成足够数量的产物供后续步骤使用,而不会使用可能给材料带来偏差的过多周期。
[0093] 在某些实施方案中,在基于杂交的目标富集或核糖体耗竭过程之后,剩余的样品材料将使用如上文所述的基于珠的顺磁性方法进行清理。清洗可以发生在如上文所述的额外的扩增周期之前、之后或之前和之后。
[0094] 在某些实施方案中,随后使用但不限于荧光测定技术如Qubit dsDNA HS分析和/或Agilent生物分析仪HS DNA分析对库的数量和质量进行量化。然后,所述库可以在任何下一代测序平台上进行标准化、多路复用和测序。
[0095] 在某些实施方案中,然后,如有必要,对测序数据进行多路分解,而转录物/基因计数是根据现有的基因组或转录组参考序列或重新组装的基因组或转录物来生成的(见图16、图24)。然后,每个序列上的UMI标记可以用来识别由于PCR复制而产生的片段。对于库大小、GC-偏差、序列偏差、测序深度,计数都是标准化的。然后,这些计数可以用来进行基因表达分析,对属于不同条件(例如肿瘤/正常)的样品之间进行差异表达分析,以生成一份潜在生物标记物的列表,但不限于所述可区分样品类型的应用程序(图25)。参考比对数据可用于分析序列变体,例如但不限于单核苷酸多态性、插入/缺失、融合、倒置和重复扩增。
[0096] 样品分离本发明提供核酸测序和/或分析方法,该核酸包括至少来自细胞外囊泡的RNA,所述方法是捕获无细胞DNA和细胞外囊泡到表面,然后裂解细胞外囊泡,以释放其中所含的核酸,特别是RNA,并从捕获表面洗脱DNA和/或DNA和包含至少RNA的核酸。
[0097] 微泡由真核细胞脱落或从质膜芽出至细胞的外部。这些膜囊泡大小不均,直径范围约10 nm-约5000 nm之间。由直径< 0.8µm的细胞脱落的所有膜囊泡在本文统称为“细胞外囊泡”或“微泡”。这些细胞外囊泡包括微泡、微泡样颗粒、prostasome、dexosome、texosome、核外粒体、oncosomes、凋亡小体、反转录病毒样颗粒和人内源性反转录病毒(HERV)颗粒。通过细胞内多囊泡体的胞吐作用释放的小微泡(直径大约10-1000nm,且更多的是30-200 nm)在本领域中被称为“微泡”。
[0098] 已知外来体含有RNA类型,包括mRNA (信使RNA)和miRNA (微RNA)。然而,对于从体外或离体系统分离到的外来体中的长RNA载量,人们还缺乏基本的了解。以往的调查外来体RNA载量的研究主要集中在小分子RNA部分。这些研究中报道的带注释的长RNAs的比例相对较小,转录覆盖率较低,这使得许多人得出结论,认为外来体只携带蛋白编码和非编码RNA的短片段,并对关于其通过外来体调节基因表达和细胞间通讯的潜在功能能力提出了疑问。
[0099] 如本文显示的,血浆外来体中存在各种各样的RNA。已根据本文的方法鉴定的RNA类型包括图5中鉴定的RNA类型。在某些实施方案中,通过本文的方法鉴定的RNA类型包括,但不限于核糖体RNA、SINE RNA、LINE RNA、Alu RNA、HERVs、球蛋白RNA,以及其它类型的长非-编码RNAs和/或如其它地方所述的重复序列,例如在gencodegenes.org/gencode_biotypes.html中所述的。
[0100] 所述方法和试剂盒使用以下通用程序从样品中分离和提取核酸,例如DNA和/或DNA和核酸(包括至少RNA)。首先,样品中的核酸,例如DNA和/或DNA和细胞外囊泡部分,结合于捕获表面,例如膜滤器,并清洗捕获表面。然后,使用洗脱试剂进行膜上溶解和释放核酸,例如DNA和/或DNA和RNA,从而形成洗脱液。之后,洗脱液与包括过渡金属和缓冲剂的蛋白沉淀缓冲剂接触。cfDNA和/或DNA和核酸(至少包括来自细胞外囊泡的RNA)然后使用各种公认的技术中的任何一种,例如,结合到硅胶柱,接着洗涤和洗脱,从蛋白质沉淀洗脱液中分离。
[0101] 在某些实施方案中,洗脱缓冲液包含变性剂、洗涤剂、缓冲物质和/或其组合,以保持规定的溶液pH。在某些实施方案中,洗脱缓冲液包含强变性剂。在某些实施方案中,洗脱缓冲液包括强变性剂和还原剂。
[0102] 在某些实施方案中,洗脱缓冲液含有硫氰酸胍(GTC),这是一种变性剂,其破坏囊泡膜,使核酸酶失活,并调整用于固相吸附的离子强度。
[0103] 在某些实施方案中,洗脱缓冲液含有洗涤剂,例如吐温、Triton X-100等,以协助细胞外囊泡膜的破裂并支持生物标记物从捕获表面的有效洗脱。
[0104] 在某些实施方案中,洗脱缓冲液含有还原剂,如β-巯基乙醇(BME),以减少分子内二硫键Cys-Cys,并协助使洗脱液中存在的蛋白,特别是RNases变性。
[0105] 在某些实施方案中,洗脱缓冲剂含有GTC、洗涤剂和还原剂。
[0106] 在某些实施方案中,蛋白沉淀缓冲剂中的过渡金属离子是锌。在某些实施方案中,锌以氯化锌形式存在于蛋白沉淀缓冲剂中。
[0107] 在某些实施方案中,蛋白沉淀缓冲剂中的缓冲剂是乙酸钠(NaAc)。在某些实施方案中,缓冲剂的pH ≤ 6.0的NaAc。
[0108] 在某些实施方案中,蛋白沉淀缓冲剂包含氯化锌和pH ≤ 6.0的NaAc缓冲剂。
[0109] 目前分离DNA和/或DNA和核酸(至少包括来自细胞外囊泡的RNA)的方法包括有害物质、超速离心、超滤,例如使用100 kD滤器、聚合物沉淀技术和/或基于大小的过滤。然而,需要替代方法来高效和有效地分离细胞外囊泡,并且任选地提取其中所含的核酸,例如在某些实施方案中,细胞外囊泡RNA,应用于各种应用,包括诊断目的。
[0110] 本文提供的分离和提取的方法和/或试剂盒采用一种使用结合无细胞DNA和/或微泡的亲和膜的基于旋转柱的纯化过程。本公开内容的方法和试剂盒允许在单个柱上使用0.2直到4mL的体积来并行运行大数量的临床样品的能力。使用本文提供的程序分离的无细胞DNA是高纯度的。分离的RNA纯度很高,直到溶解前都由囊泡膜保护,完整的囊泡可以从膜上洗脱。该程序能够耗竭从血浆输入的几乎所有无细胞DNA,且与市售可得的循环DNA分离试剂盒相比,其DNA产量相当或更高。所述程序能够消耗从血浆输入的几乎所有mRNA,与超速离心或直接溶解相比,其mRNA/miRNA产量相当或更好。与市售可得的试剂盒和/或以前的分离方法相比,所述方法和/或试剂盒富集了miRNAs的微泡结合部分,而且它们很容易扩展到大量的输入材料。这种规模扩大的能力使针对所关注的低丰度转录物的研究成为可能。
与市场上的其它市售可得产品相比,本公开内容的方法和试剂盒提供了独特的能力,其由本文提供的实施例证实。
[0111] 所述方法和试剂盒使用以下一般程序从生物样品中分离和提取核酸,例如DNA和/或DNA和核酸(至少包括RNA)。首先,样品,包括cfDNA和细胞外囊泡部分,结合于膜过滤器,并且清洗过滤器。之后,使用基于GTC的试剂进行膜上溶解并释放核酸,例如DNA和/或DNA和RNA。之后进行蛋白质沉淀。核酸,例如DNA和/或DNA和RNA,然后结合到硅胶柱上,洗涤,然后洗脱。提取的核酸,例如DNA和/或DNA和RNA,然后可以进一步分析,例如,使用各种下游检测的任一种。
[0112] 在某些实施方案中,根据以下步骤分离核酸。在加入溶解试剂后,将蛋白沉淀缓冲剂加入到匀浆中,并将该溶液强烈混合短暂的一段时间。然后溶液在室温下以12,000 x g离心3 min。之后,可以使用各种公认的分离和/或提取核酸的方法的任一种对溶液进行处理。
[0113] 分离的核酸,例如DNA和/或DNA和RNA,然后可以使用各种下游检测的任一种进行进一步分析。在某些实施方案中,DNA和RNA的联合检测用于提高对有效突变的敏感性。循环核酸中可检测到的突变有多个潜在来源。例如,活的肿瘤细胞是从样品的细胞外囊泡部分中分离的RNA和DNA的潜在来源,而濒死的肿瘤细胞是无细胞DNA的潜在来源,例如凋亡囊泡DNA和来自坏死肿瘤细胞的无细胞DNA。由于变体核酸在循环中的频率相对较低,检测灵敏度的最大化变得非常重要。DNA和RNA的联合分离为评估疾病进展和患者对治疗的反应提供了全面的临床信息。然而,与本文提供的方法和试剂盒相比,用于检测循环核酸的商用试剂盒只能从血浆中(即从濒死细胞中)分离cfDNA。本领域普通技术人员将理解,突变或其它生物标记物的更多拷贝导致提高识别突变和其它生物标记物的敏感性和准确性。
[0114] 本公开内容的方法可用于从血浆样品中分离所有DNA。本公开内容的方法对于同一样品体积可以相似的水平分离DNA和RNA,并且可以将RNA和DNA相互分开。与市售可得的分离试剂盒相比,本公开内容的这些方法捕获相同或更多的无细胞DNA (cfDNA)、相同或更多的mRNA和更多的miRNA。
[0115] 本公开内容的方法也可用于RNA和DNA的共纯化。本公开内容的方法(本文中也称为程序)可以使用0.2-4 mL,例如0.5-4 mL的血浆或血清从外来体和其它细胞外囊泡中分离RNA和DNA。兼容血浆管的列表包括含有添加剂EDTA、柠檬酸钠和柠檬酸盐-磷酸盐-葡萄糖的血浆。含肝素的血浆会抑制RT-qPCR。
[0116] 然后将单独或用结合缓冲液稀释的样品加载到具有捕获膜的旋转柱上,以500 x g离心1分钟。弃掉穿柱液,然后将柱子放回同一收集管中。之后加入洗涤缓冲液,将柱以5000 x g离心5分钟,以除去柱上的残余体积。注:离心后,将旋柱从收集管中移除,使柱不与穿柱液接触。然后将旋转柱转移到一个新的收集管中,并将基于GTC的洗脱缓冲液加入到膜中。之后,将旋转柱以5000 x g离心5 min,收集含有溶解的外来体的匀浆。然后进行蛋白沉淀。
[0117] 本文提供的方法可用于从生物样品中分离和检测DNA。囊泡RNA被认为源自活细胞,例如,害病组织中的活细胞。无细胞DNA (cfDNA)被认为源自濒死细胞,如害病组织中的坏死细胞。因此,cfDNA可以作为治疗反应的指标,而RNA是在增加中的抗性突变的指标。
[0118] 本文提供的方法可以用于检测血液中的罕见突变,因为该方法提供足够灵敏的方法,其可应用于足够数量的核酸。生物液体中实际DNA和RNA分子分子的数量非常有限,本方法提供了一种分离方法,其提取足够小体积的与突变检测相关的血液的所有分子,用于进行有效的下游处理和/或分析。
[0119] 在某些实施方案中,样品分离和分析技术包括在例如WO 2014/107571和WO 2016/007755中描述的称为EXO50和/或EXO52的方法,各自通过引用以其整体并入本文。还包括了市场上可在商标EXOLUTIONTM、EXOLUTION PLUSTM、EXOLUTIONTM UPREP、EXOLUTION HTTM、UPREPTM、EXOEASYTM、EXORNEASYTM下销售的液体活检平台,分别购自Exosome Diagnostics, Inc., 以及QIAamp Circulating Nucleic Acids Kit、DNeasy Blood & Tissue Kits、AllPrep DNA/RNA Mini Kit和AllPrep DNA/RNA/Protein Mini Kit,分别从Qiagen购得。
[0120] 如本文所用的,术语“核酸”指的是DNA和RNA。核酸可以是单链的,也可以是双链的。在某些情况下,核酸是DNA。在某些情况下,核酸是RNA。RNA包括但不限于信使RNA、转移RNA、核糖体RNA、非编码RNAs、微RNA和HERV元件。
[0121] 如本文所用的,术语“生物样品”指含有生物材料例如DNA、RNA和蛋白的样品。
[0122] 在某些实施方案中,生物样品可合适地包含来自受试者的体液。体液可以是从受试者身体的任何地方(例如外周部位)分离出来的液体,包括但不限于,例如血液、血浆、血清、尿液、痰液、脊髓液、脑脊液、胸腔积液、乳头抽吸液、淋巴液、呼吸道、肠道和泌尿生殖道的液体、泪液、唾液、乳汁、淋巴系统的液体、精液、器官系统内液体体、腹水、肿瘤囊内液、羊水和细胞培养上清液及其组合。生物样品也可以包括粪便或盲肠样品或从中分离的上清液。
[0123] 在某些实施方案中,生物样品可以适当地包含细胞培养上清液。
[0124] 在某些实施方案中,生物样品可以适当地包括来自受试者的组织样品。组织样品可以从受试者身体的任何地方分离出来。
[0125] 体液的适当样品体积是例如,在约0.1m1到约30m1液体的范围内。液体的体积可能取决于几个因素,例如使用的液体类型。例如,血清样品的体积可以为约0.1m1-约4m1,例如在某些实施方案中,约0.2ml-4ml。血浆样品的体积可以是约0.1ml-约4ml,例如,在某些实施方案中,0.5ml-4ml。尿液样品的体积可以为约10 m1-约30 m1,例如,在某些实施方案中,约20 ml。
[0126] 虽然本文提供的实例使用了血浆样品,但技术人员将认识到这些方法适用于各种生物样品。
[0127] 本公开内容的方法和试剂盒适用于来自人受试者的样品。此外,本公开内容的方法和试剂盒适用于来自非人受试者的样品,例如啮齿动物、非人灵长类动物、伴侣动物(例如猫、狗、)和/或农场动物(例如鸡)。
[0128] 术语“受试者”旨在包括被证明或预期具有含核酸的颗粒的所有动物。在特定的实施方案中,受试者是哺乳动物、人或非人灵长类动物、狗、猫、马、、其它农场动物或啮齿动物(例如小鼠、大鼠、豚鼠等等)。人受试者可以是没有明显异常,例如疾病的正常人。人受试者可以是有明显异常,例如疾病的人。明显异常可以由本人或是由医护人员观察到。术语“受试者”、“患者”和“个体”在本文可以互换使用。
[0129] 虽然本文提供的有效实施例使用膜作为捕获表面,但应当理解,捕获表面的形式,例如珠或过滤器(在本文也称为膜),不影响本文所提供的方法从生物样品中有效捕获细胞外囊泡的能力。
[0130] 根据本文提供的方法,多种表面具有捕获细胞外囊泡的能力,但并不是所有的表面都会捕获细胞外囊泡(一些表面不捕获任何东西)。
[0131] 本公开内容还描述了一种利用一次性塑料部件和离心设备从生物或临床样品中分离和浓缩细胞外囊泡的装置。例如,该装置包括含捕获表面(即膜过滤器)的柱子、将捕获表面固定在外壳与内管之间的夹具以及收集管。外壳包括允许液体通过的大型网状结构,且优选在柱的一端。内管将捕获表面固定在适当位置,且优选是略微圆锥形的。收集管可以是商业产品,即50ml Falcon管。所述柱优选适合离心,即,尺寸与标准离心机和微型离心机相容。
[0132] 在捕获表面为膜的实施方案中,从生物样品中分离细胞外囊泡部分的装置至少包含一个膜。在某些实施方案中,该装置包括一、二、三、四、五或六个膜。在某些实施方案中,该装置包括三个膜。在该装置包括多于一个膜的实施方案中,所述膜全部在柱子的一端彼此直接相邻。在该装置包括多于一个膜的实施方案中,膜都是彼此相同的,即具有相同的电荷和/或具有相同的官能团。
[0133] 应当注意的是,通过比细胞外囊泡小的孔径过滤捕获并不是本文所提供的方法的主要捕获机制。但是,过滤器的孔径是非常重要的,例如因为mRNA会卡在20 nm的过滤器上,而无法被回收,而微RNA却很容易被洗脱掉,例如因为过滤器的孔径是有效表面捕获区域中的一个重要参数。
[0134] 本文提供的方法使用各种捕获表面中的任何一种。在某些实施方案中,捕获表面是膜,这里也称为过滤器或膜过滤器。在某些实施方案中,捕获表面是市场上可买到的膜。在某些实施方案中,捕获表面是带电的商业可用膜。在某些实施方案中,捕获表面是中性的。在某些实施方案中,捕获表面选自PALL Corporation的Mustang®离子交换膜;
Sartorius AG的Vivapure  ® Q膜;Sartobind Q或Vivapure® Q Maxi H;Sartorius AG的Sartobind  ® D;Sartorius AG的Sartobind (S);Sartorius AG 的Sartobind  ® Q;
Sartorius AG的Sartobind  ® IDA;Sartorius AG 的Sartobind® Aldehyde;Sigma的Whatman® DE81;EMD Millipore的快速捕获病毒分离纯化柱;Thermo Scientific* Pierce强阳离子和阴离子交换旋转柱。
[0135] 在捕获表面带电荷的实施方案中,捕获表面可以是从0.65um带正电荷的Q PES真空过滤器(Millipore)、3-5um带正电荷的Q RC旋转柱过滤器(Sartorius)、0.8um带正电荷的Q PES自制旋转柱过滤器(Pall)、0.8um带正电荷的Q PES注射器过滤器(Pall)、0.8um带负电荷的S PES自制旋转柱过滤器(Pall)、0.8um带负电荷的S PES注射器过滤器(Pall)和50 nm带负电荷的尼龙注射器过滤器(Sterlitech)中选出的带电荷过滤器。在某些实施方案中,带电荷的过滤器不封装在注射过滤装置中,因为在这些实施方案中,核酸可能更难从过滤器中分离出。在某些实施方案中,带电荷过滤器封装于柱子的一端。
[0136] 在捕获表面为膜的实施方案中,膜可以由各种合适的材料制成。在某些实施方案中,所述膜是聚醚砜(PES) (例如,来自Millipore或PALL Corp.)。在某些实施方案中,膜是再生纤维素(RC) (例如,来自Sartorius或Pierce)。
[0137] 在某些实施方案中,捕获表面是带正电荷的膜。在某些实施方案中,捕获表面是Q+膜,它是带正电荷的膜,是含有季胺的阴离子交换器。例如,Q膜被季铵盐R-CH2-N (CH3)3官能化。在某些实施方案中,捕获表面是带负电荷的膜。在某些实施方案中,捕获表面是S膜,它是带负电荷的膜,是带有磺酸基的阳离子交换器。例如,S膜被磺酸R-CH2-SO3-官能化。在某些实施方案中,捕获表面是D膜,它是一种弱碱性阴离子交换器,含有二乙胺基,R-CH2-NH+(C2H5)2。在某些实施方案中,捕获表面是金属螯合膜。例如,该膜是一种用基二乙酸-N(CH2COOH-)2官能化的IDA膜。在某些实施方案中,捕获表面是用基-CHO官能化的微孔膜。
在其它实施方案中,该膜是一种弱碱性阴离子交换器,含有二乙基氨基乙基(DEAE)纤维素。
并不是所有的带电荷膜都适用于本文提供的方法,例如,使用Sartorius Vispure S膜旋转柱分离的RNA显示出RT-qPCR抑制作用,因此不适合与PCR相关的下游检测。
[0138] 在捕获表面带电荷的实施方案中,细胞外囊泡可以用带正电荷的过滤器分离。
[0139] 在捕获表面带电荷的实施方案中,细胞外囊泡捕获期间的pH≤7。在某些实施方案中,pH大于4并且小于或等于8。
[0140] 在捕获表面为带正电荷的Q过滤器的实施方案中,缓冲系统包括含250 mM Bis Tris丙烷pH 6.5-7.0的洗涤缓冲液。在捕获表面为带正电荷的Q过滤器的实施方案中,溶解缓冲液是基于GTC的试剂。在捕获表面为带正电荷的Q过滤器的实施方案中,溶解缓冲液是以一个体积存在。在捕获表面为带正电荷的Q过滤器的实施方案中,溶解缓冲液以多于一个体积存在。
[0141] 根据膜材料,膜的孔径范围为3 µm-20 nm。例如,在其中捕获表面是市场上可买到的PES膜的实施方案中,膜具有20nm (Exomir)、0.65µm (Millipore)或0.8µm (Pall)的孔径。在其中捕获表面是市场上可买到的RC膜的实施方案中,膜具有在3-5µm范围内的孔径(Sartorius, Pierce)。
[0142] 捕获表面的表面电荷可以是正电荷、负电荷或中性的。在某些实施方案中,捕获表面是一个或多个带正电荷的珠子。
[0143] 本文提供的方法包括溶解试剂。在某些实施方案中,用于膜上溶解的试剂是基于GTC的试剂。在某些实施方案中,所述溶解试剂是基于高盐的缓冲液。
[0144] 本文提供的方法包括各种缓冲液,其包括上样和洗涤缓冲液。上样和洗涤缓冲液可以具有高或低离子强度。盐浓度(如NaCl浓度)可以为0-2.4 M。缓冲液可以包括各种组分。在某些实施方案中,缓冲液包括以下一种或多种组分:Tris、Bis-Tris、Bis-Tris-丙烷、咪唑、柠檬酸、甲基丙二酸、乙酸、乙醇胺、二乙醇胺、三乙醇胺(TEA)和磷酸钠。在本文提供的方法中,上样和洗涤缓冲液的pH是很重要的。在上样前,当血浆样品为pH≤5.5时,过滤器容易堵塞(血浆根本不会穿柱),而在pH较高时,由于细胞外囊泡的不稳定性,细胞外囊泡的RNA回收率较低。在中性pH下,来自细胞外囊泡的RNA回收率最佳。在某些实施方案中,所使用的缓冲液为1X浓度、2X浓度、3X浓度或4X浓度。例如,上样或结合缓冲液为2X浓度,而洗涤缓冲液为1X浓度。
[0145] 在某些实施方案中,所述方法包括一个或多个洗涤步骤,例如,在将生物样品与捕获表面接触之后。在某些实施方案中,洗涤剂被添加到洗涤缓冲液中,以便于除去非特异性结合(即污染物、细胞碎片和循环蛋白复合物或核酸),以获得更纯净的微泡部分细胞外囊泡部分。适合使用的洗涤剂包括但不限于:十二烷基硫酸钠(SDS)、吐温-20、吐温-80、Triton X-100、Nonidet P-40 (NP-40)、Brij-35、Brij-58、辛基葡萄糖苷、辛基硫葡萄糖苷、CHAPS或CHAPSO。
[0146] 在某些实施方案中,捕获表面,例如膜,被置于用于离心的装置中,例如,旋转柱;或用于真空系统的装置中,例如真空过滤器夹具;或用于压力过滤的装置中,例如注射器过滤器。在某些实施方案中,捕获表面被置于旋转柱或真空系统中。
[0147] 提取核酸前从生物样品中分离细胞外囊泡因为以下几个原因而具有优势:(1)从细胞外囊泡中提取核酸提供了选择性地分析由液体样品中分离疾病或肿瘤特异性细胞外囊泡与其它细胞外囊泡所获得的疾病或肿瘤特异性核酸的机会;(2)与直接从液体样品中提取核酸而不首先分离细胞外囊泡获得的产率/完整性相比,含有核酸的细胞外囊泡以更高完整性产生显著更高产率的核酸种类;(3)可扩展性,例如,为了检测低水平表达的核酸,可以使用本文所述的方法从较大体积的样品中浓缩细胞外囊泡,从而提高灵敏度;(4)提取的核酸纯度更高或质量/完整性更高,因为在核酸提取步骤之前排除了生物样品中天然存在的蛋白质、脂质、细胞碎片、细胞和其它潜在污染物以及PCR抑制剂;和5)在核酸提取方法上有更多的选择可以采用,因为分离的细胞外囊泡部分的体积小于起始样品的体积,这使得使用小体积柱过滤器从这些部分或颗粒中提取核酸成为可能。
[0148] 本领域已描述了从生物样品中分离微泡的几种方法。例如,Raposo等的论文(Raposo et al., 1996),Skog等的论文(Skog et al., 2008)和Nilsson等的论文(Nilsson et al., 2009)描述了差速离心的一种方法。美国专利号6,899,863和6,812,023介绍了离子交换和/或凝胶渗透色谱的方法。蔗糖密度梯度或细胞器电泳方法在美国专利号7,198,923中作了介绍。Taylor和Gercel Taylor的论文(Taylor and Gercel-Taylor, 2008)提出了磁激活细胞分选(MACS)方法。Cheruvanky等的论文(Cheruvanky et al., 
2007)提出了一种纳米薄膜超滤浓缩的方法。Miranda等的出版物(Miranda et al., 2010)描述了Percoll梯度分离方法。此外,微泡可以通过微流装置从受试者的体液中识别和分离(Chen et al., 2010)。在核酸生物标记物的研究和开发以及商业应用中,需要以一致、可靠和实用的方式从生物样品中提取高质量的核酸。
[0149] 因此,本发明的目的是提供一种从生物样品例如体液中快速和容易分离含核酸的粒子,以及从分离的粒子中提取高质量核酸的方法。本发明的方法可适合配合和并入在实验室或临床环境中或在现场使用的紧密装置或半自动或全自动仪器中。
[0150] 在某些实施方案中,在从生物样品中分离和提取核酸,例如DNA和/或DNA和RNA之前,没有对样品进行预处理。
[0151] 在某些实施方案中,在对细胞外囊泡进行分离、纯化或富集之前,对样品进行预处理步骤,以除去生物样品中存在的大的不需要的颗粒、细胞和/或细胞碎片和其它污染物。预处理步骤可以通过一个或多个离心步骤(例如,差速离心)或一个或多个过滤步骤(例如,超滤)或其组合来实现。在进行超过一个离心预处理步骤的情况下,生物样品可首先以较低的转速离心,然后以较高的转速离心。如有需要,可进一步进行适当的离心预处理步骤。或者或除了一个或多个离心预处理步骤之外,生物样品也可以被过滤。例如,生物样品可首先以20,000 g离心1小时,以除去不需要的大颗粒;然后可过滤样品,例如,通过0.8 µm过滤器进行过滤。
[0152] 在某些实施方案中,样品被预过滤以除去大于0.8 µm的粒子。在某些实施方案中,样品包含添加剂例如EDTA、柠檬酸钠和/或柠檬酸盐-磷酸盐-葡萄糖。在某些实施方案中,样品不含肝素,因为肝素会对RT-qPCR和其它核酸分析产生负面影响。在某些实施方案中,在纯化和/或核酸分离和/或提取之前,样品与缓冲液混合。在某些实施方案中,缓冲液是结合缓冲液。
[0153] 在某些实施方案中,在将生物样品与捕获表面接触之前或之后进行一个或多个离心步骤,以分离细胞外囊泡并浓缩从生物部分中分离出来的细胞外囊泡。为除去大的不需要的颗粒、细胞和/或细胞碎片,样品可以约100-500g的低速离心,例如,在某些实施方案中,约250-300g。或者或另外,可以更高的速度离心样品。适宜的离心速度可达约200,000g;例如,从约2,000g至低于约200,000g。在某些实施方案中使用的速度为约15,000g以上和小于约200,000g或约15,000g以上和小于约100,000g或约15,000g以上和小于约50,000g。更优选的速度是从约18,000g到约40,000g或约30,000g;以及从约18,000g到约25,000g。在某些实施方案中,离心速度为约20,000g。通常情况下,适宜的离心时间是从约5分钟至约2小时,例如,从约10分钟到约1.5小时或从约15分钟到约1小时。可使用约0.5小时的时间。有时,在某些实施方案中,将生物样品以约20,000g离心约0.5小时是有用的。然而,上述速度和时间可适合以任何组合使用(例如,从约18,000g至约25,000g或从约30,000g至约40,
000g持续约10分钟-约1.5小时或约15分钟-约1小时或约0.5小时等)。一个或多个离心步骤可在低于环境的温度下进行,例如在约0-10℃,例如约1-5℃,例如约3℃或约4℃。
[0154] 在某些实施方案中,在生物样品与捕获表面接触之前或之后执行一个或多个过滤步骤。可以使用尺寸在约0.1至约1.0 µm范围内的过滤器,例如,约0.8 µm或0.22 µm。还可以使用减少孔隙率的过滤器进行连续过滤。
[0155] 在某些实施方案中,在生物样品与捕获表面接触之前或之后进行一个或多个浓缩步骤,以减少在色谱阶段处理的样品体积。浓缩可通过对样品高速离心(例如10,000和100,000 g之间),使细胞外囊泡沉降。这可包括一系列差速离心。所获得的沉淀中的细胞外囊泡可占较小的体积和在适当的缓冲液中以进行该过程的后续步骤。浓缩步骤也可以通过超滤进行。事实上,这种超滤既浓缩了生物样品,又对细胞外囊泡部分进行了额外的纯化。在另一个实施方案中,过滤是超滤,例如切向流超滤。切向流超滤包括在由确定截止阈值的膜分隔的两个隔室(滤出液和保留液)之间浓缩和分馏溶液。分离是通过在保留液室中施加流动和在该隔室与滤出液室之间施加跨膜压力来实现的。不同的系统可以用来进行超滤,如螺旋膜(Millipore, Amicon)、扁平膜或中空纤维(Amicon, Millipore, Sartorius, Pall, GF, Sepracor)。在本发明的范围内,使用截止阈值在1000 kDa以下,例如在某些实施方案中,在100 kDa至1000 kDa之间或例如在某些实施方案中,在100 kDa至600 kDa之间的膜是有利的。
[0156] 在某些实施方案中,在生物样品与捕获表面接触之前或之后进行一个或多个尺寸排除色谱步骤或凝胶渗透色谱步骤。为了进行凝胶渗透色谱步骤,在某些实施方案中使用了从二氧化硅、丙烯酰胺、琼脂糖、葡聚糖、乙二醇-甲基丙烯酸酯共聚物或其混合物(例如琼脂糖-葡聚糖混合物)中选择的载体。例如,这样的载体包括但不限于:SUPERDEX® 200HR (Pharmacia)、TSK G6000 (TosoHaas)或SEPHACRYL® S (Pharmacia)。
[0157] 在某些实施方案中,在生物样品与捕获表面接触之前或之后进行一个或多个亲和色谱步骤。一些细胞外囊泡也可以用某些表面分子来表征。由于微泡是从细胞质膜的萌芽形成的,因此这些微泡通常都具有它们的起源细胞上存在的许多相同的表面分子。在这里使用的“表面分子”共同指存在于微泡的表面上或膜中或膜上的抗原、蛋白、脂类、水化合物和标记物。这些表面分子可以包括,例如,受体、肿瘤相关抗原、膜蛋白修饰(例如糖基化结构)。例如,从肿瘤细胞萌发的微泡通常在其细胞表面上显示肿瘤相关抗原。因此,亲和色谱或亲和排阻色谱也可与本文提供的方法结合使用,用于从特定供体细胞类型中分离、鉴定和/或富集特定群体的微泡(Al-Nedawi et al., 2008; Taylor and Gercel-Taylor, 2008)。例如,肿瘤(恶性或非恶性)微泡携带肿瘤相关表面抗原,并可通过这些特定的肿瘤相关表面抗原检测、分离和/或富集。在一个例子中,表面抗原是上皮细胞粘附分子(EpCAM),其对于来自、结直肠、乳腺、前列腺、头颈和肝来源的癌的微泡具有特异性,而对血液细胞来源的微泡无特异性(Balzar et al., 1999;Went et al., 2004)。此外,肿瘤特异性微泡还可以表现为某些表面标记物的缺乏,例如CD80和CD86。在这些情况下,对于肿瘤特异性标记的进一步分析可以排除带有这些标记物的微泡,例如通过亲和排阻色谱法。例如,可以通过使用不同的载体、树脂、珠、抗体、适体、适体类似物、分子印迹聚合物或本领域已知的特异性靶向微泡上的所需表面分子的其它分子,实现亲和色谱。
[0158] 在某些实施方案中,在细胞外囊泡分离和/或核酸提取之前,可将一个或多个对照粒子或一个或多个核酸添加到样品中,以用作内部对照,以评估细胞外囊泡纯化和/或核酸提取的效率或质量。本文所描述的方法提供了有效的分离和对照核酸以及细胞外囊泡部分。这些对照核酸包括来自Q-β噬菌体的一个或多个核酸,来自病毒颗粒的一个或多个核酸或任何其它对照核酸(例如,至少一个对照靶基因),这些对照核酸是天然存在的或通过重组DNA技术改造。在某些实施方案中,对照核酸的数量在添加到样品之前已知。使用实时PCR分析,可以定量检测对照靶基因。对照靶基因的定量可用于确定细胞外囊泡纯化或核酸提取过程的效率或质量。
[0159] 在某些实施方案中,对照核酸是来自Q-β噬菌体的核酸,这里称为“Q-β对照核酸”。本文所述方法中使用的Q-β对照核酸可以是天然存在的病毒对照核酸,也可以是重组或工程改造的对照核酸。Q-β是光滑病毒科的一个成员,特征为线性的单链RNA基因组,它由三个编码四种病毒蛋白的基因组成:外壳蛋白、成熟蛋白、溶解蛋白和RNA复制酶。当Q-β粒子本身用作对照时,由于其大小与微泡的平均水平相似,Q-β可以很容易地使用与本文所述的分离微泡使用的相同纯化方法,从生物样品中纯化。此外,Q-β病毒单链基因结构复杂度低,有利于其用作基于扩增的核酸检测的对照。Q-β粒子包含对照靶基因或对照靶序列,其经检测或测量用于定量样品中Q-β粒子的量。例如,对照靶基因是Q-β外壳蛋白基因。当Q-β粒子本身作为对照时,在生物样品中加入Q-β粒子后,使用本文描述的提取方法,提取来自Q-β粒子的核酸,以及来自生物样品的核酸。当使用来自Q-β的核酸,例如来自Q-β的RNA被用作对照时,Q-β核酸与生物样品中的核酸一起用本文描述的提取方法提取。Q-β对照靶基因的检测可以通过RT-PCR分析测定,例如,与感兴趣的生物标记物同时测定。10倍稀释的对照靶基因的至少2、3或4个已知浓度的标准曲线可以用来确定拷贝数。检测到的拷贝数和添加的Q-β粒子的数量或检测到的拷贝数和添加的Q-β核酸(例如Q-βRNA)的数量,可以经比较以检测分离和/或提取过程的质量。
[0160] 在某些实施方案中,50、100、150、200、250、300、350、400、450、500、1,000或5,000拷贝的Q-β粒子或Q-β核酸,例如,Q-β RNA,添加到体液样品中。在某些实施方案中,100拷贝的Q-β粒子或Q-β核酸,例如Q-β RNA,添加到体液样品中。当Q-β粒子本身被用作对照时,可以根据Q-β噬菌体感染靶细胞的能力来计算Q-β粒子的拷贝数。因此,Q-β粒子的拷贝数与Q-β噬菌体的菌落形成单位有关。
[0161] 任选地,在细胞外囊泡分离或核酸提取之前,可将对照粒子添加到样品中,以用作内部对照,以评价细胞外囊泡纯化和/或核酸提取的效率或质量。本文所述方法提供了对照粒子和细胞外囊泡部分的有效分离。这些对照粒子包括Q-β噬菌体、病毒颗粒或任何其它含有对照核酸(例如,至少一个对照靶基因)的粒子,这些核酸可能是天然存在的或通过重组DNA技术改造。在某些实施方案中,对照粒子的数量在添加到样品之前已知。使用实时PCR分析,可以对对照靶基因进行定量。对照靶基因的定量可用于确定细胞外囊泡纯化或核酸提取过程的效率或质量。
[0162] 在某些实施方案中,Q-β粒子在核酸提取之前被添加到尿液样品中。例如,Q-β粒子在超滤之前和/或预过滤步骤之后添加到尿液样品中。
[0163] 在某些实施方案中,本文所述的方法和试剂盒包括一个或多个过程中对照。在某些实施方案中,过程中对照是检测和分析指示样品质量的参考基因(即生物样品例如生物液体样品的质量的指示物)。在某些实施方案中,过程中对照是检测和分析指示血浆质量的参考基因(即血浆样品的质量的指示物)。在某些实施方案中,参考基因通过额外的qPCR进行分析。
[0164] 在某些实施方案中,过程中对照是用于反转录酶和/或PCR性能的过程中对照。这些过程中对照包括但不限于,参考RNA(在这里也称为ref.RNA),它是在RNA分离之后和反转录之前加入的。在某些实施方案中,ref.RNA是对照,诸如Q-β。在某些实施方案中,ref.RNA通过额外的PCR进行分析。
[0165] 核酸提取本发明涉及利用捕获表面改进细胞外囊泡的分离、纯化或富集。本公开的方法提供一种高浓缩细胞外囊泡部分,用于从所述细胞外囊泡中提取高质量核酸。用本文描述的方法获得的核酸提取物可用于需要或优选高质量核酸提取物的各种应用,例如用于疾病或医学状况的诊断、预后或监测。
[0166] 最近的研究表明,微泡内的核酸具有生物标记物的作用。例如,WO 2009/100029特别描述了从GBM患者血清的微泡中提取的核酸用于医学诊断、预后和治疗评估。WO 2009/100029还描述了从人类尿液的微泡中提取的核酸用于同样的目的。从微泡中提取的核酸的使用被认为潜在避免了活检的需要,突出了微泡生物学的巨大诊断潜力(Skog et al., 
2008)。
[0167] 分离的细胞外囊泡的质量或纯度可直接影响提取的细胞外囊泡核酸的质量,进而直接影响用于疾病诊断、预后和/或监测的生物标记物检测的效率和敏感性。鉴于准确和敏感的诊断试验在临床领域的重要性,从生物样品中分离高浓缩细胞外囊泡部分的方法是有必要的。为了满足这一需要,在此描述了用于从生物样品中分离细胞外囊泡的方法,以从生物样品中提取高质量核酸。如本文显示的,本文描述的方法从生物样品中分离出高浓缩的细胞外囊泡部分,并且其中随后从高浓缩的细胞外囊泡部分中提取高质量的核酸。这些提取的高质量的核酸可用于测量或评估有助于疾病或其它医学状况的诊断、预后和/或监测的生物标记物是否存在。
[0168] 如本文所用的,提及核酸提取的术语“高质量”是指能够检测到18S和28S rRNA的提取,例如在某些实施方案中,其比例为约1:1至约1:2;和/或例如,在某些实施方案中,大约为1:2。理想情况下,采用本文所述方法获得的高质量核酸提取物还具有对于低蛋白生物样品(如尿液)大于或等于5的RNA完整数或对于高蛋白生物样品(如血清)大于或等于3的RNA完整数和从20 ml低蛋白生物样品或1 ml高蛋白生物样品的核酸产率大于或等于50 pg/ml。
[0169] 高质量的RNA提取是需要的,因为RNA的降解会对提取的RNA的下游评估产生不利影响,如基因表达和mRNA分析,以及非编码RNA(如小RNA和微RNA)的分析。本文描述的方法能够从生物样品中分离出的细胞外囊泡中提取高质量的核酸,从而能够对细胞外囊泡中的核酸进行准确的分析。
[0170] 在从生物样品分离细胞外囊泡后,核酸可从分离或富集的细胞外囊泡部分提取。为了实现这一点,在某些实施方案中,可以首先将细胞外囊泡溶解。细胞外囊泡的溶解和核酸的提取可以采用本领域已知的各种方法来实现,包括在PCT公开号WO 2016/007755和WO 
2014/107571中所述的方法,其各自的内容通过引用以其整体结合到本文中。在某些实施方案中,可以根据本领域已知的标准程序和技术使用蛋白沉淀来实现核酸提取。这些方法还可以使用核酸结合柱捕获细胞外囊泡中所含的核酸。一旦结合,就可以用适合破坏核酸与结合柱之间的相互作用的缓冲液或溶液洗脱核酸,从而洗脱核酸。
[0171] 在某些实施方案中,核酸提取方法还包括消除或减轻阻止从生物样品中提取高质量核酸的不利因素的步骤。这些不利因素是各种各样的,因为不同的生物样品可能含有不同种类的不利因素。在某些生物样品中,例如,DNA过量等因素可能影响从这些样品的核酸提取的质量。在其它样品中,内源性RNase过量等因素可能影响熊这些样品的核酸提取的质量。许多试剂和方法可以用来消除这些不利因素。这些方法和试剂在本文中统称为“提取增强操作”。在某些情况下,提取增强操作可能涉及在生物样品中添加核酸提取增强剂。为了消除诸如内源性RNases等不利因素,本文定义的这种提取增强剂可包括但不限于RNase抑制剂,诸如Superase-in (可市售获自Ambion Inc.)或RnaseINplus (可市售获自Promega Corp.)或其它以类似方式发挥作用的试剂;蛋白酶(其可用作Rnase抑制剂);DNase;还原剂;诱饵底物,如合成RNA和/或载体RNA;可与Rnase结合的可溶性受体;小干扰RNA (siRNA);RNA结合分子,如抗RNA抗体、碱性蛋白或伴侣蛋白;RNase变性物质,如高渗透压溶液、洗涤剂或其组合。
[0172] 例如,提取增强操作可包括在核酸提取之前,在生物样品和/或分离的细胞外囊泡部分中添加Rnase抑制剂;例如,在某些实施方案中,对于体积等于或大于1 μl的样品,RNase抑制剂的浓度大于0.027 AU (I X);或者,对于体积等于或大于1 μl的样品,RNase抑制剂的浓度大于0.135 AU (5X);或者,对于体积等于或大于1 μl的样品,RNase抑制剂的浓度大于0.27 AU (10X);或者,对于体积等于或大于1 μl的样品,RNase抑制剂的浓度大于0.675 AU (25X);或者,对于体积等于或大于1 μl的样品,RNase抑制剂的浓度大于1.35 AU (50X);其中I X 浓度是指0.027 AU或更多的RNase抑制剂被用来处理从1 μl或更多体液中分离的细胞外囊泡的酶条件,5X浓度指的是0.135 AU或更多的RNase抑制剂被用来处理从1 μl或更多体液中分离的细胞外囊泡的酶条件,10X蛋白酶浓度指的是0.27 AU或更多的RNase抑制剂被用来处理从1 μl或更多体液中分离出的颗粒的酶条件,25X浓度指的是用
0.675 AU或更多的RNase抑制剂处理从1 μl或更多体液中分离的细胞外囊泡的酶条件和
50X蛋白酶浓度指的是用1.35 AU或更多的RNase抑制剂被用来处理从1 μl或更多体液中分离出的颗粒的酶条件。在某些实施方案中,RNase抑制剂是一种蛋白酶,在这种情况下,1 AU是对应于每分钟1 μmol酪氨酸的释放folin阳性氨基酸和肽的蛋白酶活性。
[0173] 这些增强剂可以各种方式发挥其作用,例如通过抑制RNase活性(例如,RNase抑制剂),通过蛋白的普遍降解(例如蛋白酶)或通过结合和保护RNAs的伴侣蛋白(例如RNA-结合蛋白)来发挥其作用。在所有情况下,这样的提取增强剂消除或至少减轻生物样品中或与分离粒子有关的一些或全部不利因素,否则这些不利因素会阻止或干扰从分离粒子中提取出高质量的核酸。
[0174] 在某些实施方案中,提取的18S和28S rRNAs的量化可用于检测核酸提取的质量。
[0175] 核酸生物标记物的检测在某些实施方案中,提取的核酸包含DNA和/或DNA和RNA。在所提取的核酸包括DNA和RNA的实施方案中,在进一步扩增之前,RNA被反转录成互补DNA (cDNA)。这样的反转录可以单独进行,也可以与扩增步骤结合进行。一种结合反转录和扩增步骤的方法的例子是反转录聚合酶链反应(RT-PCR),它可以进一步改进成为定量的,例如,美国专利号5,639,606所述的定量RT-PCR,其为本教导通过引用并入本文。该方法的另一个例子包括两个独立的步骤:第一步反转录将RNA转化为cDNA,第二步用定量PCR对cDNA的量进行定量。如下面的例子所示,使用本公开的方法从含有核酸的粒子中提取的RNA包括多种转录物,包括但不限于核糖体18S和28S rRNA、微RNA、转移RNA、与疾病或医学状况相关的转录物,以及对诊断、预后和医学状况监测具有重要意义的生物标记物。
[0176] 例如,RT-PCR分析检测了每个反应的Ct值(循环阈值)。在RT-PCR中,通过累积荧光信号来检测阳性反应。Ct值被定义为荧光信号超越阈值(即超过背景水平)所需的循环数。Ct值与样品中靶核酸或对照核酸的量成反比(即Ct值越低,样品中的对照核酸含量越大)。
[0177] 在另一个实施方案中,对照核酸的拷贝数可以使用各种公认技术中的任何一种来测量,包括但不限于RT-PCR。可以使用本领域已知的方法,例如通过产生和利用校准或标准曲线,来检测对照核酸的拷贝数。
[0178] 在某些实施方案中,一种或多种生物标记物可以是一个基因畸变或其集合体,在本文用于指含核酸颗粒中的核酸量以及核酸变体。具体而言,基因畸变包括但不限于一个基因(例如癌基因)或一组基因的过度表达、一个基因(如肿瘤抑制基因,例如p53或RB)或一组基因的表达不足、一个或一组基因的剪接变体的可选产生,基因拷贝数变体(CNV) (例如,DNA双微体) (Hahn, 1993)、核酸修饰(例如甲基化、乙酰化和磷酸化)、单核苷酸多态性(SNPs)、染色体重排(例如倒置、缺失和重复)和一个或一组基因的突变(插入、缺失、重复、错义、无义、同义或任何其它核苷酸改变),在许多情况下,所述突变最终影响基因产物的活性和功能,导致可选转录剪接变体和/或基因表达水平的变化或上述任意的组合。
[0179] 分离的粒子中存在的核酸的分析是定量和/或定性的。对于定量分析,对分离的粒子中特定目的核酸的数量(表达水平),无论是相对的还是绝对的,用本领域已知的方法测量(下文所述)。对于定性分析,在分离的细胞外囊泡中特定目的核酸的种类,无论是野生型还是突变型,用本领域已知的方法来鉴定。
[0180] 本发明还包括从生物样品中分离细胞外囊泡并对核酸测序的方法的各种用途,用于(i) 辅助诊断受试者,(ii) 监测受试者疾病或其它医学状况的进展或复发或(iii) 辅助评估正经历或预期针对疾病或其它医学状况的治疗的受试者的治疗效果;其中,检测了由本方法获得的核酸提取物中是否存在一种或多种生物标记,并且该一种或多种生物标记分别与疾病或其它医学状况的诊断、进展或复发或治疗效果相关。
[0181] 在某些实施方案中,在分析微泡之前扩增其核酸是有益的或在其它方面可取的。核酸扩增的方法是在本领域中普遍使用且广为熟知的,本文对其中的许多例子进行了描述。如有需要,可以进行扩增,使其可以是定量的。定量扩增使得各种核酸相对量的定量检测成为可能,从而产生基因或表达谱。
[0182] 核酸扩增方法包括,但不限于聚合酶链反应(PCR) (美国专利号5,219,727)及其变体,如原位聚合酶链反应(美国专利号5,538,871),定量聚合酶链反应(美国专利号5,219,727),嵌套聚合酶链反应(美国专利号5,556,773),自持序列复制及其变体(Guatelli et al., 1990),转录扩增系统及其变体(Kwoh et al., 1989),Qb复制酶及其变体(Miele et al., 1983),冷-PCR (Li et al., 2008),BEAMing (Li et al., 2006)或任何其它核酸扩增方法,之后使用本领域技术人员所熟知的技术检测扩增的分子。当核酸分子数量非常少的情况下,为检测核酸分子而设计的检测方案尤为有用。为这些方法的教导,上述参考并入本文。在其它实施方案中,不进行核酸扩增的步骤。而是,直接对提取的核酸进行分析(例如,通过下一代测序)。
[0183] 这样的基因畸变的检测可以通过技术人员已知的各种技术来完成。例如,核酸的表达水平、可选剪接变体、染色体重排和基因拷贝数可通过微阵列分析(见例如,美国专利号6,913,879、7,364,848、7,378,245、6,893,837和6,004,755)和定量PCR来检测。尤其可以用lllumina Infinium II全基因组基因分型分析法或Agilent人类基因组CGH微阵列检测拷贝数的变化(Steemers et al., 2006)。核酸修饰可通过例如美国专利号7,186,512和专利公布WO2003/023065中所描述的方法进行测定。尤其是甲基化谱可由Illumina DNA Methylation OMA003 Cancer Panel检测。SNPs和突变可通过与等位基因特异性探针杂交、酶突变检测、错配异双链体的化学切割mutations可be detected (Cotton et al., 1988)、错配碱基的核糖核酸酶切割(Myers et al., 1985)、质谱分析(美国专利号6,994,
960、7,074,563和7,198,893),核酸测序、单链构象多态性(SSCP) (Orita et al., 1989)、变性梯度凝胶电泳(DGGE) (Fischer and Lerman, 1979a;Fischer and Lerman, 1979b)、温度梯度凝胶电泳(TGGE) (Fischer and Lerman, 1979a;Fischer and Lerman, 1979b)、限制性片段长度多态性(RFLP) (Kan and Dozy, 1978a;Kan and Dozy, 1978b)、寡核苷酸连接测定(OLA)、等位基因特异性PCR (ASPCR) (美国专利号5,639,611)、连接链式反应(LCR)及其变体(Abravaya et al., 1995;Landegren et al., 1988;Nakazawa et al., 
1994)、流式细胞术异双链体分析(WO/2006/113590)及其组合/改良检测。值得注意的是,基因表达水平可通过基因表达连续分析(SAGE)技术来检测(Velculescu et al., 1995)。一般说来,分析基因畸变的方法在许多出版物中都有报道,不限于本文引用的那些,且也可供技术人员使用。合适的分析方法将取决于分析的具体目的、患者的状况/病史以及待检测、监测或治疗的具体癌症、疾病或其它医学状况。为这些方法的教导,前述参考文献并入本文。
[0184] 许多生物标记物与受试者是否存在疾病或其它医学状况有关。因此,根据本文公开的方法,从分离的粒子提取的核酸中检测是否存在生物标记物或生物标记物的组合,有助于受试者的疾病或其它医学状况的诊断。
[0185] 此外,许多生物标记物可能有助于对受试者的疾病或医学状况进行监测。因此,根据本公开的方法,在从分离的粒子提取的核酸中检测这样的生物标记物的存在与否,可有助于监测受试者的疾病或其它医学状况的进展和复发。
[0186] 还发现许多生物标记物影响特定患者的治疗效果。因此,根据本公开的方法,从分离的粒子提取的核酸中检测这样的生物标记物的存在与否,可有助于评估给定患者的给定治疗的有效性。在从患者的生物样品分离的粒子中提取的核酸中,这些生物标记物的鉴定可以指导对患者的治疗的选择。
[0187] 在本发明上述各方面的某些实施方案中,疾病或其它医学状况是肿瘤性疾病或状况(例如,癌症或细胞增殖性疾病)。
[0188] 在某些实施方案中,提取的核酸,例如外来体RNA,基于对一种或一组生物标记物的检测进行进一步分析。在某些实施方案中,进一步分析使用基于机器学习的建模、数据挖掘方法和/或统计分析进行。在某些实施方案中,对数据进行分析以鉴别或预测患者的疾病后果。在某些实施方案中,对数据进行分析以在患者群体内将患者分层。在某些实施方案中,对数据进行分析以识别或预测患者是否对治疗有抵抗性。在某些实施方案中,数据用于检测受试者的无进展存活进展。
[0189] 在某些实施方案中,对数据进行分析,以便在检测到生物标记物或生物标记物组合时为受试者选择治疗选项。在某些实施方案中,治疗选项是用疗法的组合进行治疗。
[0190] 测序技术在某些实施方案中,“下一代”测序(NGS)或高通量测序实验根据本发明的方法进行。这些测序技术允许识别样品中存在的低丰度或高丰度核酸或者用更常规的杂交方法无法检测到的核酸。NGS通常包含核苷酸的添加,然后加入洗涤步骤。
[0191] 用于总RNA测序的商用试剂盒(其保留哺乳动物RNA和非常低的输入RNA的链信息)在这方面是有用的,包括但不限于Clontech: SMARTer stranded total RNASeq试剂盒;Clontech: SMARTSeq v4 ultra low input RNASeq试剂盒;Illumina: Truseq stranded total RNA library prep试剂盒;Kapa Biosystems: Kapa stranded RNASeq library preparation试剂盒;New England Biolabs: NEBNext ultra directional library prep试剂盒;Nugen: Ovation Solo RNASeq试剂盒;和Nugen: Nugen Ovation RNASeq系统v2。
实施例
[0192] 虽然这里提供的实施例使用了用于离心和/或过滤目的各种膜和设备,但应该理解,这些方法可以用于任何捕获表面和/或外壳设备,以便有效地捕获细胞外囊泡和释放其中所含的核酸,特别是RNA。
[0193] 实施例1样品分离
样品通常是从商业来源获取的,并通过EXO50和/或EXO52方法进行分离,如在例如WO 
2014/107571和WO 2016/007755中所述。
[0194] 长RNASeq工作流程方法1:样品分离后,样品用DNaseⅠ酶和/或修饰的DNase I I酶处理,遵循制造商的指南:一般孵育从约10分钟到约2小时,例如约10分钟到约60分钟,并在从约30℃-约40℃,例如约35℃-约37℃的温度下。
[0195] DNase处理后,以根据样品调整的稀释度将外源合成RNA掺杂剂加入到样品中。合成掺杂剂可以在DNase处理之前或DNase处理后添加到样品中。随后,该样品或者使用商用试剂/协议经受RNA碎片化或者样品未被碎片化。
[0196] 然后遵循制造商的指南,用市场上可买到的试剂对样品进行第一链cDNA合成(反转录)。
[0197] 然后遵循制造商的指南,使用基于PCR的技术和市场上可买到的试剂,将基于Illumina的NGS衔接子添加到cDNA中。
[0198] 在基于PCR的NGS衔接子添加后,一般遵循制造商的指南,通常使用市场上可买到的试剂,使样品经过一两轮基于顺磁性珠的库清理。
[0199] AMPure清理后,使用市售试剂和方案对样品进行核糖体耗竭。
[0200] 然后使用商用试剂和方案,对样品进行多个PCR扩增周期。基于PCR的扩增周期可以在从10到30个周期的范围内。
[0201] PCR扩增后,使用商业上可用的试剂和方案,使样品经过一两轮基于顺磁性珠的库清理。
[0202] 在此阶段,最终的NGS库和样品都要经过标准NGS QC测试,包括生物分析仪(碎片大小分析和浓度)和量子位(浓度)。样品被稀释至1-4nM浓度,然后在准备测序前汇集在一起。标准测序准备包括样品变性和稀释至用于在测序仪器上聚集的pM浓度。
[0203] 长RNASeq工作流程方法3:分离后,一般遵循制造商的指南,用DNase I酶处理样品,一般孵育从约10分钟至约2小时,例如约10分钟-约60分钟或约30分钟,并且在从约30℃至约40℃,例如约35℃-约37℃的温度下。
[0204] 在DNase处理后,以根据样品调整的稀释度将外源合成RNA掺杂剂加入到样品中。
[0205] 接下来,使用商业上可用的试剂和方案,使样品经过另一轮DNase处理和引物退火。
[0206] 然后遵循制造商的指南,用市场上可买到的试剂对样品进行第一链cDNA合成(反转录)。
[0207] 然后使用市场上可买到的NGS试剂,使样品经历一系列cDNA处理步骤。
[0208] 然后使用商业上可用的试剂和指南,对样品进行第二链cDNA合成(反转录)、末端修复和衔接子头连接。在衔接子连接之后,使用市场上可买到的试剂,使样品经受一轮或多轮基于顺磁性珠的库清理。对标准方案进行修改,以更改工作流程的珠子水化时间和洗脱量,如实施例中所述。
[0209] 然后,进行定量PCR (qPCR),以确定使用市场上可买到的试剂对要测试的样品的最佳扩增周期。
[0210] 然后,根据前一步骤中确定的循环数,使用商用试剂和方案对样品进行PCR扩增。
[0211] PCR扩增后,使用商用试剂和方案,使样品经过一两轮基于顺磁性珠的库清理,尽管标准的试剂盒方案已经被修改,仍为工作流程额外提供了一个珠子水化步骤然后,使样品经受标准生物分析仪(BioAnalyzer)或Qubit分析,以确定样品浓度。多达10 ng的库被推进到工作流程的下一步骤。
[0212] 然后使用商用试剂和方案,使样品经受核糖体耗竭。已修改标准试剂盒方案以为工作流程添加一个额外的引物退火周期。
[0213] 然后,使用商用试剂和方案,通过完成多个周期的PCR扩增,使样品经受第二轮的PCR扩增。
[0214] PCR扩增后,使用商用试剂和方案,使样品经受一轮或两轮基于顺磁性珠的库清理。对方案进行修改,以更改工作流程的水化时间,如实施例中所述。
[0215] 在此阶段,本发明人现在具有最终的NGS库,样品经过标准NGS QC测试,包括生物分析仪(碎片大小分析和浓度)和量子位(浓度)。样品被稀释至1-4nM浓度,然后在准备测序前汇集在一起。标准测序准备包括样品变性和稀释至用于在测序仪器上聚集的pM浓度。
[0216] 富集工作流程使RNA、DNA或合并的RNA和DNA经历以下的工作流程。样品使用商用试剂和指南,用DNase I处理或不经处理。
[0217] 然后,使样品经历溶解或不经溶解。在样品上执行第一链cDNA合成(反转录),并且如果必要,第二链cDNA合成(即DNA聚合酶反应)在第一链cDNA合成后在样品上执行。
[0218] 遵循商用试剂和指南,使样品经受末端修复和衔接子连接。在衔接子连接后,使用商用试剂和指南,使样品经受一轮基于顺磁性珠的清理。
[0219] 根据商用试剂和指南,使样品经受第一PCR扩增。在PCR后,使样品经受基于杂交的目标富集和/或从方法1或方法3 (RNA、DNA或RNA和DNA)生成的最终NGS库。探针是生物素化的,具有60bp、80bp或120bp大小的特定序列。在序列特定的位置,探针的镶嵌密度(tiling density)或重叠度可以是1x,2x,3x,4x等。
[0220] 使用商业上可获得的试剂和指南,使探针与样品中感兴趣的特定序列杂交。杂交后,样品经受链霉抗生物素轭合的顺磁性珠,以捕获特定序列并除去不需要的序列。不需要的序列、缓冲剂和酶的清洗是通过洗涤除去的,而对样品中感兴趣的特定序列则与链霉亲和素结合的顺磁珠结合在一起。
[0221] 用链霉抗生物素轭合的顺磁性珠进行特异序列杂交和捕获一次或多次,杂交时间约为2至约24小时。
[0222] 杂交后,根据制造商的指南,对序列特异的捕获样品进行第二次PCR扩增,但增加扩增周期以提高产率。
[0223] 在某些实施方案中,样品通过基于顺磁性珠的库或使用过滤器自旋柱进行一次清理。样品在较低体积的洗脱缓冲液中洗脱,以提高最终浓度(即ng/ul, nM)。
[0224] 在此阶段,本发明人现在具有最终丰富的NGS库,样品经过标准NGS QC测试,包括生物分析仪(碎片大小分析和浓度)和量子位(浓度)。样品被稀释至1-4nM浓度,然后在准备测序前汇集在一起。标准测序准备包括样品变性和稀释至用于在测序仪器上聚集的PM浓度。
[0225] 实施例2本发明人已经开发了一个新的平台,其被专门设计以包括从外来体进入RNA测序工作流程的短和长RNA转录物。利用Exosome Diagnostics提供的ExoLution或ExoLution Plus并从人血浆开始,本发明人分离并使获得的高质量的总外来体RNA经受本发明人的长RNASeq工作流程方法1。
[0226] 简言之,工作流程从外来体RNA分离开始,然后对DNA可能干扰分析的应用进行DNase处理。有时会在DNase步骤之前或之后执行合成RNA标准的掺杂剂,作为质量控制指标。
[0227] RNA是利用混合寡核苷酸和具有模板转换活性的反转录酶反转录的。然后使用PCR添加带有或不带条形码的DNA寡核苷酸衔接子。利用顺磁性珠从较小的寡核苷酸中清理cDNA。核糖体序列有时会影响低丰度转录物的检测,因此可以通过利用核糖体耗竭步骤选择性地除去。在切割或除去核糖体序列后,利用PCR方法对未切割的库分子进行富集。接下来是使用顺磁性珠进行的另一次清理。然后,这些库可以被量化并进行测序。
[0228] 本实验的目的是开发适合于血浆外来体的一种链式、全长RNASeq平台。
[0229] 样品:2mL,正常人血浆, 48位个体的血池,性别平衡。在样品中加入合成掺杂剂作为对照,以提高灵敏度、技术重现性和成链性(stranded-ness)。
[0230] 适合于外来体RNASeq的变量的识别和优化/变量的组合:DNase处理、RNA/cDNA碎片化、扩增、核糖体RNA耗竭。
[0231] 这些图显示了这些方法的惊人结果。特别是,图1提供了显示长RNA转录物在RNASeq库中的扩增和结合的生物分析仪扫描,包括外来体RNA大小分布和外来体最终库大小分布。从小RNA和长RNA片段都可以发现扩增的cDNA。
[0232] 图2显示根据该方法的库复制之间的良好相关性和重现性。通过确定适宜的血浆外来体RNA条件,本发明人使库复制之间的重退火从0.7提高到0.97。利用外源RNA掺杂剂相关性测定的复制之间的技术重现性为0.999。97%至99%的转录物保留更正的链信息。图3表明变量的优化增加了读图映射与转录组的比例。特别是,修改这些参数可以使40-45%的读图映射到转录组。类似地,图4显示变量的优化使重复读取最小化,并增加了蛋白编码读数。
[0233] 图5显示血浆外来体中的RNA按RNA分型(但不包括核糖体RNA)的广泛多样性。
[0234] 图6显示核糖体RNAs在28S、18S、12S和16S核糖体基因中的高效耗竭(包括无核糖体耗竭(左)和有核糖体耗竭(右))。
[0235] 图7显示血浆外来体的转录组覆盖率。
[0236] 图8显示血浆外来体RNA负载的多样性。
[0237] 图9显示了长RNA的丰度,即在外来体中的完整的转录物覆盖率,以及在外来体中转录覆盖率的双峰分布。
[0238] 图10显示该方法提供外来体中的分子的高度灵敏的检测作用。
[0239] 图11-15中提供了根据该方法生成的附加数据。图12显示出库复制之间掺杂剂的良好相关性,而图13显示转录本的5’端具有更高的覆盖率。在RNASeq库中,长RNA转录物的扩增和结合作为血浆外来体最终库大小分布在图14中提供。
[0240] 总之,该方法为外来体上长RNASeq的研究提供了一种新的途径。它显示了RNA转录物检测的良好重退火(R>0.97),对转录物的高度敏感性检测(LOD @15M读数 = 12分子),以及核糖体转录物的高效耗竭。此外,根据该方法,在外来体中可检测到广泛的蛋白编码和长的非编码RNAs。该方法识别出外来体中具有完全覆盖的大量的长转录物。
[0241] 实施例3本发明人已经开发了一个新的平台,其被专门设计以包括从外来体进入RNA测序工作流程的短和长RNA转录物。本发明人进一步扩展了这些工作流程,以便还处理DNA,无论是单独处理还是与RNA一起混合处理。本发明人进一步扩展了这些工作流程,以特异性地富集感兴趣的目标样品,从而能够实现更深层次的序列覆盖。使用从Exosome Diagnostics获得的ExoLutionTM、EXOLution HT TM、UPrepTM、EXOEasyTM、EXORNeasyTM或ExoLution PlusTM,并从人血浆开始,本发明人分离并使获得的高质量的总外来体RNA经受本发明人的长RNASeq工作流程方法1和/或方法3。
[0242] 描述的测序工作流程是在从生物流体中分离出核酸之后开始的(图16)。用作测序工作流程输入的生物流体的体积可以低至≥0.5 ml,没有上限(图16)。核酸可以来源于外来体和/或其它无细胞来源。
[0243] 该样品的等分试样可用于基于杂交的富集过程(参见图17-19)。该方法利用与样品中包含的感兴趣基因组序列区域互补的核苷酸探针的杂交,随后利用选择用于感兴趣序列的缓冲液的一系列洗液,同时洗掉不需要的材料。探针-序列杂种可以被选择用于,但不限于,链霉抗生物素-生物素化学品。该过程可用于富集基因组序列的任何部分或混合物,包括但不限于外显子区域和内含子区域,这些区域可以覆盖全部基因编码区或基因内的特定热点位置。杂交探针组可用于将来自少量靶(1或20)的任何数目的靶序列富集到许多靶(>1,000),包括但不限于具有 20,000个基因的总蛋白编码转录组(见图19),针对广泛疾~病或疾病相关途径的具有>1,000个基因的大型面板(见图17-18)和针对重点疾病或与疾病相关的途径的、具有50-500个基因的中型面板(例如实体肿瘤)。
[0244] 图17显示了使用泛癌面板(Pan Cancer panel)进行样品浓缩的过程。对样品进行库准备,然后对1,387个与癌症有关的目标进行了浓缩。对仅含RNA或得自液体活检的RNA和cfDNA混合物的样品进行了调查。市场上可买到的RNA (UHR)可作为对照样品包括在内。图17A显示了库的映射度量,说明了生成的极高百分比的目标读数。图17B显示了碱基覆盖率指标,显示面板中的大部分核苷酸在所有三个样品中都覆盖>1x。图17C绘制每个目标映射的读取数,说明了处理仅包含RNA和RNA+cfDNA的样品的能力,以及当在同一个样品中同时分析RNA和cfDNA时读取计数的增加。
[0245] 图18显示了使用泛癌捕获面板(Pan Cancer capture panel)进行浓缩的过程。对样品进行库准备,然后对1,387个与癌症有关的目标进行了浓缩。对仅含cfDNA或得自液体活检的RNA和cfDNA混合物的样品进行了调查。市场上可买到的RNA (UHR)可作为对照样品包括在内。图18A显示了库的映射度量,说明了生成的极高百分比的目标读数。图18B显示了碱基覆盖率指标,显示当使用相同数量的起始血浆时,cfDNA+RNA提供了比cfDNA单独更好的目标覆盖率。图18C绘制每个目标映射的读取数,说明了处理仅包含cfDNA和RNA+cfDNA的样品的能力,以及当cfDNA包含RNA贡献时,覆盖深度的增加。
[0246] 图19演示了使用一个完整的Exome捕获面板进行浓缩的过程。对样品进行库准备,然后对代表总蛋白编码转录组的大约20,000个目标组进行富集。对仅含有cfDNA或得自液体活检的RNA和cfDNA混合物的样品进行了调查。市场上可买到的RNA (UHR)可作为对照样品包括在内。图19A显示了库的映射度量,说明了生成的极高百分比的目标读数。图19B展示了碱基覆盖率指标。图19C显示每个目标映射的读取数,说明了处理仅包含cfDNA和RNA+cfDNA的样品的能力。
[0247] 实施例4在样品未被富集的情况下,将对全部样品进行测序(图20-22)。
[0248] 图20展示了两个独立的RNASeq库库准备工作流程,这些工作流程已经对外来体液体活检进行了优化。为了最大限度地减少变体,从对照血浆池中分离出复制的RNA提取物。然后使用两个优化工作流中的一个处理复制物(每个方法6个)。样品不进行核糖体耗竭。对所有样品进行深度测序,并对所有样品进行下采样,以对供分析的读取的计数归一化。图
20A显示了库复制之间的转录物的高重退火检测。图20B显示在目标度量上映射到转录组的读取的比例说明是高的。图20C显示每个生物类型的读取比例。
[0249] 当总样品被分析时,核糖体序列(cDNA、RNA、dsDNA或cfDNA)有时会影响低丰度转录物的检测,在这种情况下,最好是删除或耗竭核糖体序列的样品(见图21)。核糖体序列的选择性除去可以在RNA 序列水平、cDNA水平或在dsDNA (库)水平上完成。核糖体序列特异性耗竭可以用类似但不限于RNase H或限制性内切酶消化的酶试剂来完成。也可以利用基于杂交的生物素化探针富集和链霉亲和素结合顺磁性珠来特异性捕获和除去核糖体序列,利用基于杂交的生物素化探针富集和链霉抗生物素结合顺磁性珠来特异性捕获和除去核糖体序列,从而实现耗竭。
[0250] 图21展示了各种核糖体RNA耗竭的途径。为了使变体最小化,从对照血浆池中分离了复制的RNA提取物。为了进一步避免变体,所有样品都是使用相同的RNASeq库程序准备的。个别样品接受三种商业上可用的核糖体序列耗竭方法之一(称为试剂1、试剂2和试剂3),这三种方法在RNA或cDNA水平上都可能出现缺失。对于试剂1,条件A指市场上可买到的方案,而条件B指已确定的最佳方案。一个未耗竭核糖体RNA的样品被作为未处理的对照品包括在内。对所有样品进行深度测序,并对样品进行下采样,使读取计数正常化以供分析。
图21A显示,转录组读取的比例说明了最佳条件的选择如何能极大地影响耗竭的效能和随后的相关RNAs的收获。图21B提供了已耗竭的样品与未耗竭的样品的比较,这进一步说明选择最有效地耗竭不需要的核糖体RNAs的最佳条件的重要性,同时保持初始库的多样性(紫色)和最小化损失(粉红色),以及允许解释与处理相比的额外的RNAs (蓝色)。在这里,使用试剂1的条件B被发现导致最理想的核糖体耗竭,导致蛋白编码读数提高17倍,与无耗竭的
93.5%的重叠和96.5%的新转录物被检测到。
[0251] 图22展示了总RNA和总核酸(cfDNA+RNA)库的制备方法。采用以下3种方法之一从对照血浆中分离核酸:一种是只分离高质量的RNA,而另外两种不同的方法是除了分离RNA外,还分离cfDNA。为了最大限度地减少可变性,准备了来自这些库中每个库的样品,使用相同的方法进行测序。图22A显示,使用此库方法生成了高度可复制的库,并且这两种分离方法都生成高度相似的起始原料。图22B提供了映射度量,而图22C提供了转录物覆盖率,其显示与仅用RNA比较,通过将RNA和cfDNA组合在一起而检测到的转录覆盖率增加。图22D提供了仅用于RNA (顶部)、cfDNA+RNA方法1 (中间)和方法2 (底部)鉴定的转录物。通过将样品中的RNA和DNA结合在一起,并使它们经历相同的工作流程,总转录物(编码和非编码)的检测率从47.4% (仅RNA)提高到99.6% (RNA + cfDNA),蛋白编码转录物检测从66.5% (仅RNA)提高到99.9% (RNA +cfDNA),lincRNA检测从14.7% (仅RNA)提高到>99% (RNA + cfDNA)。
[0252] 图23显示了从血浆中构建的6个独立的库复制体中基于总RNASeq分析的外源RNA掺杂剂的检测极限。该图显示在减少到10个或更少的分子时RNA的检测结果仍一致。这种分析的动态范围跨越5个数量级,从10到180万个分子。
[0253] 在库量化之后,所述库被标准化、复用,并使用下一代测序平台进行测序。如果有必要的话,测序数据会被分解,且转录物/基因计数是通过对现有基因组或转录组参考序列的映射或者根据重新组装的基因组或转录物生成的(见图16,图24)。图24提供了一个示例性RNASeq浏览器来显示QC度量和分析结果。
[0254] 然后,每个序列上的UMI标记可以用来识别由于PCR复制而产生的片段。对于库大小、GC-偏差、序列偏差、测序深度,计数都被标准化。然后,可以使用这些计数在涉及不同条件(例如肿瘤/正常)的样品之间执行差异表达分析,生成一组生物标记物,其可区分样品类型,如图25所示,它提供了一个示例性差异表达浏览器,以显示和评估差异表达分析的结果。
[0255] 参考比对数据可用于分析序列变体,例如但不限于单核苷酸多态性、插入/缺失、融合、倒置和重复扩增。
[0256] 实施例5一种基于杂交的目标富集的现成商用试剂盒,用于组织分析,包括福尔马林固定的石蜡包埋(FFPE)组织,用于检验是否适用于细胞外囊泡样品(exoRNA和cfDNA)。该试剂盒包含检测融合、插入/缺失、单核苷酸多态性和拷贝数变体的目标。
[0257] 为了测试对外来体样品采用现成方法的可行性,本发明人检查了方法4和方法5的两个过程,如图26所示。对表1中列出的目标富集参数进行了研究,本发明人发现ExoRNA和cfDNA可与低输入对照RNA (通用人类参考RNA)和DNA  (正常基因组DNA)相媲美。对于exoRNA和cfDNA,目标富集的预期范围(映射到目标特定序列的读数)为70%-99%。
[0258] exo RNA和cfDNA映射到转录组的读数百分比为30%-95%,内含子区为5%-60%,基因间区为0.2%-10%。
[0259] 在exoRNA和cfDNA中,目标序列碱基的覆盖率>90%,一次读取。
[0260] 本发明人发现平均覆盖深度大于30,000x是检测低频突变的必要条件。
[0261] 实施例6本实验的目的是通过一套可市售获得的泛癌试剂盒(图26中的方法6),研究外来体样品(exoRNA和cfDNA组合)的可行性。创建该试剂盒以用于检测FFPE和癌样品中的RNA转录物和融合物。
[0262] 本发明人研究了exoRNA、cfDNA,exoRNA和cfDNA组合的目标富集。将外来体样品的目标富集结果与所用的通用人类参考RNA对照比较。
[0263] 对于exoRNA、cfDNA和exoRNA和cfDNA组合,目标富集的预期范围(映射到目标特定序列的读数)为75%-99%。
[0264] 对于exoRNA和cfDNA组合,映射到转录组的读数百分比为35%-95%,内含子区域为8%-45%,基因间区域为0.4%-5%。
[0265] 在exoRNA和cfDNA组合中,一次读取的目标序列碱基完全覆盖在80%以上。
[0266] 如图17所示,exoRNA和cfDNA的组合为每个基因提供了更多的读取覆盖率和更多的目标富集。
[0267] 实施例7本研究的目的是调查:(1) 不同的碎片化时间对总RNASeq数据的影响;(2) DNase处理的作用;(3) 核糖体耗竭的作用;和(4) 合成掺杂剂的作用。该方法是如上概述的长RNASeq的工作流程方法1,在使用EXO-50方法从正常人类血浆的2ml样品中分离RNA之后。
[0268] 一般来说,使样品经受DNase处理,接着经受合成掺杂剂和单核耗竭步骤。样品如表3中所述。
[0269] 分析样品的映射统计如图27-28中所示,并显示复制物之间的一致性。参照图27,可以看出,在所有样品中,大约有40-50%的读数映射到转录组中。
[0270] 如图28所示,30-40%的读取映射到核糖体RNAs和40-50%的读取映射到蛋白编码RNA中。
[0271] 插入大小分布在不同库的复制之间相对一致,如图29所示。
[0272] 还研究了转录组的覆盖率,如图30和图31所示。库检测超过10,000个蛋白编码基因。蛋白编码基因在外来体中最丰富,接着是处理的假基因和lincRNA。
[0273] 所有样品和复制物的转录物覆盖也相对一致,如图32中所示。
[0274] 图33演示了合成掺杂剂转录物的检测极限。合成掺杂剂的动态范围超过5个数量级。
[0275] 图34显示了在所有库中显示的5’-3’转录物覆盖率。
[0276] 实施例8该实施例的目的是用长RNASeq工作流程方法3从正常人血浆外来体构建RNASeq库,并研究(1)扩增周期数;(2)核糖体耗竭效应;该方法是在使用EXO-50方法从2ml正常人血浆样品中分离RNA之后,如上所述的使用合成掺杂剂的长RNASeq工作流程方法3。
[0277] 一般来说,使样品经受DNase处理、核糖体耗竭、合成掺杂剂的添加、反转录,可变数目的扩增周期,并根据工作流程方法3进一步处理(包括清理步骤)。样品如在表4中鉴定。
[0278] 所分析样品的映射统计数据如图35-36所示。如在图35中所示,在所有样品中,大多数读取映射到转录组。
[0279] 如图36所示,在样品1和2中,库中核糖体读数的比例最低,在样品1和2中,也观察到蛋白编码和misc RNA读取的比例最高。
[0280] 插入大小分布在复制和所有样品之间高度一致,如图37所示。
[0281] 如图38所示,研究了转录组的覆盖范围。总的来说,转录组覆盖范围在复制物和所有样品之间是一致的。
[0282] 图39显示,总的来说,在不同的检测阈值下,不同样品之间的基因检测是一致的。
[0283] 在不同的检测阈值下,不同样品之间的转录物覆盖总体上是一致的,如图40所示。
[0284] 图41突出显示具有>80%覆盖率的转录物的大小。
[0285] 图42显示,在样品1-7中观察到的ERCC掺杂剂检测水平与样品8-9不同。
[0286] 图43显示了用长RNASeq工作流程方法3库观察到的转录物长度的相对一致的覆盖范围,它在复制物之间和所有样品之间是一致的。
[0287] 其它实施方案虽然本发明已结合其详细描述进行了说明,但上述描述意在说明而不是限制本发明的范围,该范围由附加权利要求书的范围界定。其它方面、优点和修改都在以下范围内。
[0288] 参考文献Abravaya, K., J.J. Carrino, S. Muldoon, and H.H. Lee. 1995 用改进的连接酶链式反应检测点突变(Detection of point mutations with a modified ligase chain reaction) (Gap-LCR). Nucleic Acids Res. 23:675-82.
Al-Nedawi, K., B. Meehan, J. Micallef, V. Lhotak, L. May, A. Guha, and J. Rak. 2008. 由肿瘤细胞衍生的微泡介导致癌受体EGFRvIII的细胞间转移(Intercellular transfer of the oncogenic receptor EGFRvIII by microvesicles derived from tumour cells). Nat Cell Biol. 10:619-24.
Balzar, M., M.J. Winter, C.J. de Boer, and S.V. Litvinov. 1999. 17-1A抗原的生物学(biology of the 17-1A antigen) (Ep-CAM). J Mol Med. 77:699-712.Cheruvanky, A., H. Zhou, T. Pisitkun, J.B. Kopp, M.A. Knepper, P.S. Yuen, and R.A. Star. 2007. 使用纳米膜超滤浓缩器快速分离尿外来体生物标记(Rapid isolation of urinary exosomal biomarkers using a nanomembrane ultrafiltration concentrator). Am J Physiol Renal Physiol. 292:F1657-61.
Cotton, R.G., N.R. Rodrigues, and R.D. Campbell. 1988. 单碱基对错配的胞嘧啶和胸腺嘧啶与羟胺和四氧化锇的反应性及其在突变研究中的应用(Reactivity of cytosine and thymine in single-base-pair mismatches with hydroxylamine and osmium tetroxide and its application to the study of mutations). Proc Natl Acad Sci U S A. 85:4397-401.
Fischer, S.G., and L.S. Lerman 1979a. 二维凝胶电泳中DNA限制性片段的长度无关分离(Length -independent separation of DNA restriction fragments in two-dimentional gel electrophoresis). Cell. 16:191-200.
Fischer, S.G., and L.S. Lerman 1979b. DNA限制性内切酶片段的二维电泳分离(Two-dimentional electrophoretic separation of restriction enzyme fragments of DNA). Methods Enzymol. 68:183-91.
Guatelli, J.C., K.M. Whitfield, D.Y. Kwoh, K.J. Barringer, D.D. Richman, and T.R. Gingeras. 1990. 反转录病毒复制后的多酶反应建模的体外扩增(Isothermal, in vitro amplification of nucleic acids by a multienzyme reaction modeled after retroviral replication). Proc Natl Acad Sci U S A. 87:1874-8.Hahn, P.J. 1993. 双微染色体的分子生物学(Molecular biology of double-minute chromosomes). Bioessays. 15:477-84.
Kwoh, D.Y., G.R. Davis, K.M. Whitfield, H.L. Chappelle, L.J. DiMichele, and T.R. Gingeras. 1989. 基于转录的人类免疫缺陷病毒1型基于珠的夹心杂交格式的扩增系统及检测(Transcription-based amplification system and detection of amplified human immunodeficiency virus type 1 with a bead-based sandwich hybridization format). Proc Natl Acad Sci U S A. 86:1173-7.
Landegren, U., R. Kaiser, J. Sanders, and L. Hood. 1988. 一种连接酶介导的基因检测技术(A ligase-mediated gene detection technique). Science. 241:1077-
80.
Li, J., L. Wang, H. Mamon, M.H. Kulke, R. Berbeco, and G.M. Makrigiorgos. 
2008. 用COLD-PCR代替PCR丰富了变体的DNA序列,并重新定义了基因检测的灵敏度(Replacing PCR with COLD-PCR enriches variant DNA sequences and redefines the sensitivity of genetic testing). Nat Med. 14:579-84.
Miele, E.A., D.R. Mills, and F.R. Kramer. 1983. 重组RNA的自催化复制(Autocatalytic replication of a recombinant RNA). J Mol Biol. 171:281-95.Myers, R.M., Z. Larin, and T. Maniatis. 1985. 在RNA:DNA duplexes双工中的错配处通过核糖核苷酸裂解检测单碱基取代(Detection of single base substitutions by ribonuclease cleavage at mismatches in RNA:DNA duplexes). Science. 230:
1242-6.
Nagrath, S., L.V. Sequist, S. Maheswaran, D.W. Bell, D. Irimia, L. Ulkus, M.R. Smith, E.L. Kwak, S. Digumarthy, A. Muzikansky, P. Ryan, U.J. Balis, R.G. Tompkins, D.A. Haber, and M. Toner. 2007. 微芯片技术在癌症患者中分离稀有循环肿瘤细胞(Isolation of rare circulating tumour cells in cancer patients by microchip technology). Nature. 450:1235-9.
Nakazawa, H. D. English, P.L. randell, K. Nakazawa, N. Martel, B.K. Armstrong, and H. Yamasaki. 1994. UV与皮肤癌:正常皮肤的特异性p53基因突变作为生物学相关性暴露量度(UV and skin cancer: specific p53 gene mutation in normal skin as a biologically relevant exposure measurement). Proc Natl Acad Sci USA. 91:360-4.
Orita, M., H. Iwahana, H. Kanazawa, K. Hayashi, and T. Sekiya. 1989. 人DNA作为单链构象多态性的凝胶电泳检测(Detection of polymorphisms of human DNA by gel electrophoresis as single-strand conformation polymorphisms). Proc Natl Acad Sci U S A. 86:2766-70.
Raposo, G., H.W. Nijman, W. Stoorvogel, R. Liejendekker, C.V. Harding, C.J. Melief, and H.J. Geuze. 1996. B淋巴细胞分泌抗原递呈囊泡(B lymphocytes secrete antigen-presenting vesicles). J Exp Med. 183:1161-72.
Skog, J., T. Wurdinger, S. van Rijn, D.H. Meijer, L. Gainche, M. Sena-Esteves, W.T. Curry, Jr., B.S. Carter, A.M. Krichevsky, and X.O. Breakefield. 
2008.  胶质母细胞瘤微泡运输RNA和蛋白,促进肿瘤生长并提供诊断性生物标记(Glioblastoma microvesicles transport RNA and proteins that promote tumour growth and provide diagnostic biomarkers). Nat Cell Biol. 10:1470-6.Steemers, F.J., W. Chang, G. Lee, D.L. Barker, R. Shen, and K.L. 
Gunderson. 2006. 用单碱基延伸分析全基因组基因分型(Whole-genome genotyping with the single-base extension assay). Nat Methods. 3:31-3.
Taylor, D.D., and C. Gercel-Taylor. 2008. 作为卵巢癌诊断生物标记的肿瘤衍生的外来体的微RNA特征(MicroRNA signatures of tumor-derived exosomes as diagnostic biomarkers of ovarian cancer). Gynecol Oncol. 110:13-21.Went, P.T., A. Lugli, S. Meier, M. Bundi, M. Mirlacher, G. Sauter, and S. Dirnhofer. 2004. 在人类癌症中常见的EpCam蛋白表达(Frequent EpCam protein expression in human carcinomas). Hum Pathol. 35:122-8。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈