首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 人工神经网络 / 自组织映射 / 整合式单细胞和游离血浆RNA分析

整合式单细胞和游离血浆RNA分析

阅读:330发布:2020-05-12

专利汇可以提供整合式单细胞和游离血浆RNA分析专利检索,专利查询,专利分析的服务。并且本 发明 提供一种 鉴别 表达标记以区分病状的不同 水 平的方法,所述方法包含分析和比较来自 生物 样品的不同区域的游离RNA分子读段。,下面是整合式单细胞和游离血浆RNA分析专利的具体信息内容。

1.一种鉴别表达标记以区分不同平的病状的方法,所述方法包含:
对于从一个或多个第一个体获得的多个细胞中的每个细胞:
分析来自所述细胞的RNA分子以获得读数的集合,从而获得读数的多个集合;
对于读数的所述集合中的每个读数:
通过计算机系统鉴别对应于所述读数的参考序列中的表达区域;
对于多个表达区域中的每一个:
确定对应于所述表达区域的读数的量;
使用对应于所述区域的读数的所述量确定所述表达区域的表达评分,从而确定包含所述多个表达区域的所述表达评分的多维表达点;
通过计算机系统,使用对应于所述多个细胞的所述多维表达点将所述多个细胞分组成多个簇,所述多个簇少于所述多个细胞;
对于所述多个簇中的每个簇,确定在所述簇的细胞中以指定比率表达的情况比其它簇的细胞更多的一个或多个优先表达区域的集合;
对于多个游离RNA样品中的每一个:
分析多个游离RNA分子以获得多个游离读数,其中所述多个游离RNA样品来自第二个体的多个队列,其中所述多个队列中的每个队列具有不同水平的所述病状;以及对于一个或多个优先表达区域的所述多个集合中的一个或多个优先表达区域的每个集合:
使用对应于一个或多个优先表达区域的所述集合的游离读数,测量相应簇的特征评分;
基于所述特征评分,将一个或多个优先表达区域的所述集合中的一个或多个鉴别为用于对未来样本进行分类,以区分不同水平的所述病状的一个或多个表达标记。
2.根据权利要求1所述的方法,其中:
所述病状是妊娠相关病状,
所述第一个体是各自怀有胎儿的女性个体,
所述多个细胞是胎盘细胞,
所述第二个体是各自怀有胎儿的女性个体。
3.根据权利要求2所述的方法,其中所述游离RNA样品从所述第二个体的血浆或血清获得。
4.根据权利要求2所述的方法,其中所述妊娠相关病状是先兆子痫。
5.根据权利要求4所述的方法,其中所述水平是先兆子痫的严重程度。
6.根据权利要求4所述的方法,其中:
每个队列包括具有不同孕龄的子队列,并且
一个或多个优先表达区域的第一集合是针对第一孕龄区分不同水平的所述病状的第一表达标记。
7.根据权利要求1所述的方法,其中所述病状是癌症。
8.根据权利要求7所述的方法,其中所述病状的所述水平是癌症是否存在、癌症不同阶段、肿瘤的不同尺寸、癌症对治疗的反应、或癌症的严重程度或进展的另一种量度。
9.根据权利要求7所述的方法,其中所述多个簇中的第一簇的一个或多个优先表达区域的第一集合是第一表达标记,所述第一表达标记区分第一组织的癌症的水平,其中所述第一簇包括来自所述第一组织的细胞。
10.根据权利要求9所述的方法,其中:
所述第一组织来自肝脏,从而使所述第一簇包括肝细胞
所述肝细胞包含肿瘤细胞和非肿瘤细胞,或所述肝细胞不包含肿瘤细胞,并且所述癌症是肝细胞癌。
11.根据权利要求1所述的方法,其中:
所述病状是系统性红斑狼疮(SLE),并且
所述多个细胞是肾细胞。
12.根据权利要求1所述的方法,其进一步包含:
对于所述多个细胞中的每个细胞:
在所述计算机系统的存储器中存储与对应于所述细胞的唯一码相关的读数的所述集合,
其中鉴别对应于所述读数的所述参考序列中的所述表达区域包括使用所述读数和所述参考序列的多个表达区域执行比对程序,以及
其中确定对应于所述多个细胞中的第一细胞的第一表达区域的读数的量使用(1)对应于所述第一细胞的所述唯一码,以便鉴别对应于所述第一细胞的读数,和(2)所述第一细胞的读数的所述集合的所述比对程序的结果。
13.根据权利要求1所述的方法,其进一步包含:
获得包含所述多个细胞的样品;
分离所述多个细胞中的每个细胞,以使得能够分析特定细胞的所述RNA分子。
14.根据权利要求13所述的方法,其进一步包含:
用所述多个细胞中每个细胞的唯一码标记所述细胞的RNA分子,以使得相关读数包括所述唯一码和
在所述计算机系统的存储器中存储与对应于读数的每个集合的所述细胞的所述唯一码相关的读数的所述集合。
15.根据权利要求1所述的方法,其中:
所述指定比率包含由所述簇的细胞的平均表达评分和其它簇的细胞的平均表达评分确定的值。
16.根据权利要求1所述的方法,其中:
将所述多个细胞分组成所述多个簇包含对所述多维表达点执行降维方法,或通过使用基于的方法进行。
17.根据权利要求16所述的方法,其中:
将所述多个细胞分组成所述多个簇包含执行降维方法,并且
所述降维方法包含主成分分析(PCA)或扩散映射。
18.根据权利要求16所述的方法,其中:
将所述多个细胞分组成所述多个簇包含使用基于力的方法,并且
所述基于力的方法包含t分布随机邻居嵌入(t-SNE)。
19.根据权利要求1所述的方法,其进一步包含:
通过将第一簇的一个或多个优先表达区域的所述集合与已知在第一类型的细胞中优先表达的一个或多个区域进行比较,鉴别出所述多个簇中的所述第一簇包括所述第一类型的细胞。
20.根据权利要求19所述的方法,其中所述第一类型的细胞包含蜕膜细胞、内皮细胞、血管平滑肌细胞、基质细胞、树突状细胞、霍夫鲍尔细胞、T细胞、成红细胞、绒毛外滋养层细胞、细胞滋养层细胞、合体滋养层细胞、B细胞、单核细胞、肝细胞样细胞、胆管细胞样细胞、成肌纤维细胞样细胞、内皮细胞、淋巴细胞或骨髓细胞。
21.根据权利要求1所述的方法,其中所述第一个体与所述第二个体相同。
22.根据权利要求1所述的方法,其中所述特征评分是所述相应簇的所述优先表达区域的表达水平的平均值。
23.根据权利要求1所述的方法,其中鉴别用于对未来样本进行分类以区分不同水平的所述病状的一个或多个优先表达区域的所述集合中的一个或多个包含鉴别与所述簇中其它队列的所述特征评分在统计学上不同的队列和簇的特征评分。
24.根据权利要求1所述的方法,其进一步包含:
从对来自从第三个体获得的生物样品的游离RNA分子进行的分析接收多个游离读数;
对于第一表达标记的每个优先表达区域:
确定所述优先表达区域的读数的量,和
将一个或多个优先表达区域的读数的所述量与一个或多个参考值进行比较;以及基于一个或多个优先表达区域的读数的所述量与一个或多个参考值的比较,确定所述第三个体的所述病状的水平。
25.根据权利要求24所述的方法,其进一步包含:
分析来自从所述第三个体获得的所述生物样品的多个游离RNA分子,以获得多个游离读数。
26.根据权利要求24所述的方法,其中将一个或多个优先表达区域的读数的所述量与一个或多个参考值进行比较包含将每个优先表达区域的读数的所述量与每个优先表达区域的参考值进行比较。
27.根据权利要求24所述的方法,其中将一个或多个优先表达区域的读数的所述量与一个或多个参考值进行比较包含:
由一个或多个优先表达区域的读数的所述量计算整体评分,和
将所述整体评分与一个参考值进行比较。
28.一种确定个体的病状的水平的方法,所述方法包含:
从对来自从所述个体获得的生物样品的游离RNA分子进行的分析接收多个游离读数;
对于一个或多个表达标记的每个优先表达区域,通过根据权利要求1所述的方法确定所述一个或多个表达标记:
确定所述优先表达区域的读数的量,和
将读数的所述量与一个或多个优先表达区域的参考值进行比较,与一个或多个参考值进行比较;以及
基于每个优先表达区域的读数的所述量与一个或多个参考值的比较,确定所述个体的所述病状的所述水平。
29.一种确定个体的病状的水平的方法,所述方法包含:
从对来自从所述个体获得的生物样品的游离RNA分子进行的分析接收多个游离读数;
确定与所述病状相关的时间参数的值;
使用所述时间参数的所述值,确定在所述时间参数的所述值的时间的所述病状的表达标记,所述表达标记包含优先表达区域的一个或多个集合;
对于所述表达标记的每个优先表达区域:
确定对应于所述优先表达区域的读数的量;
将一个或多个优先表达区域的读数的所述量与一个或多个参考值进行比较;以及基于一个或多个优先表达区域的读数的所述量与一个或多个参考值的比较,确定所述个体的所述病状的所述水平。
30.根据权利要求29所述的方法,其中:
所述病状是妊娠相关病状,并且
所述个体是怀有胎儿的女性。
31.根据权利要求30所述的方法,其中所述妊娠相关病状是先兆子痫。
32.根据权利要求30所述的方法,其中所述时间参数是孕龄,其表示为妊娠一周、妊娠一个月或妊娠三月期。
33.根据权利要求30所述的方法,其中所述病状是癌症。
34.根据权利要求33所述的方法,其中所述时间参数是治疗持续时间、自癌症诊断以来的时间或手术后生存时间。
35.根据权利要求29所述的方法,其中将一个或多个优先表达区域的读数的所述量与一个或多个参考值进行比较包含将每个优先表达区域的读数的所述量与每个优先表达区域的参考值进行比较。
36.根据权利要求29所述的方法,其中将一个或多个优先表达区域的读数的所述量与一个或多个参考值进行比较包含:
由一个或多个优先表达区域的读数的所述量计算整体评分,和
将所述整体评分与一个参考值进行比较。
37.一种计算机产品,其包含计算机可读介质,所述计算机可读介质存储用于控制计算机系统以执行根据权利要求1到36中任一项所述的方法的多个指令。
38.一种系统,其包含被配置成执行根据权利要求1到36中任一项所述的方法的一个或多个处理器。

说明书全文

整合式单细胞和游离血浆RNA分析

背景技术

[0001] 个人的健康取决于身体中不同器官系统的正常运作和相互作用。每个器官系统由专用于实现这种目的的多细胞组织组成。在一项估计中,人体由平均37.2万亿个细胞构成。在人类中已识别出四种基本组织类型,即上皮组织、结缔组织、神经组织和肌肉组织。人类疾病源于细胞功能或发育异常。在癌症中,易受损细胞在基因组中获得破坏性的遗传和表观遗传变化。这类改变导致基因表达改变,并且引起异常增殖或癌细胞行为的其它标志。
[0002] 在一个实例中,造血系统的主要功能之一是维护血液组织整体上在循环中的适当周转,并且人类血液含有不同类型的血细胞。离心可以将人类全血分离为红细胞(red blood cell/erythrocyte)和白细胞(white blood cell/leukocyte)。已通过细胞的宏观或微观形态、对某些类型的组织化学或免疫组织化学染色反应性、对某些类型的外部刺激的细胞反应、特征性细胞RNA表达谱或细胞DNA的表观遗传修饰,展现不同类型血细胞的更详细分类。
[0003] 在另一实例中,人类胎盘是在妊娠期间调节母体和胎儿动态平衡的必需器官。其是一种盘状实体器官,起源于胎儿,并且由多个单元的树状绒毛结构组成,在显微镜下树状绒毛结构内衬有单核和多核细胞(滋养层细胞),负责植入母体子宫并且调节胎母界面(fetomaternal interface)。异常滋养层细胞植入和发育与妊娠期间潜在致死性高血压病症(如先兆子痫)有关。
[0004] 在另一实例中,肝脏是功能肝细胞(liver cell/hepatocyte)、引流胆管细胞(胆管上皮细胞(cholangiocyte))和专门用于代谢功能的其它结缔组织类型细胞的构成的主要实体器官。已知乙型肝炎病毒(HBV)感染肝细胞,整合到肝脏中的肝细胞基因组中,并且导致慢性肝细胞死亡和炎症(慢性肝炎)。对肝炎的反复修复反应将肝细胞替换为形成疤痕的细胞(纤维细胞),从而导致肝硬化。在延长的细胞死亡和再生期间,肝细胞基因组中遗传突变的积累导致肝细胞恶性转化,即肝细胞癌(HCC)。在一些地区,例如香港,HBV相关HCC占肝癌的约80%。
[0005] 检测器官系统中的细胞异常和疾病的存在通常需要所关注器官的直接组织取样(活检),其可能带来侵入性程序的感染和出血险。通过成像(如超声扫描)的非侵入性评估提供器官的形态和特定功能信息,如血流量。肝脏超声检查已用于慢性HBV肝炎患者的肝癌筛检,并且子宫动脉多普勒分析(Doppler analysis)用于妊娠早期的先兆子痫预测。然而,这些需要训练有素的操作员进行评估,并且不能直接评估细胞畸变。
[0006] 期望检测器官系统中细胞异常和疾病存在的非侵入性方法。解决了这些和其它改进。发明内容
[0007] 本技术的实施例涉及整合式单细胞和游离血浆RNA转录组学。实施例允许确定可以用于鉴别、确定或诊断个体的病状或病症的表达区域。本文所描述的方法分析某些表达区域的游离RNA分子。先前确定所分析的特定表达区域,以指示某种类型的细胞或细胞分组。结果,所述特定表达区域处游离读数的量可能与组织或器官中的细胞数目相关。所述组织或器官中的细胞数目可能会因细胞死亡、癌转移或其它动学而改变。所述组织或器官中细胞数目的变化随后可以反映在游离RNA的某些表达区域中。
[0008] 本发明技术中的实例方法包括从获自多个第一个体的细胞RNA分子分析读数。根据在每个簇而不是其它簇中优先表达的区域将RNA分子分组成簇。这些簇可以与某些类型的细胞相关。分别地,从具有不同平的病状的多个第二个体获得游离RNA样品。分析游离RNA样品以确定一个或多个表达区域的一个或多个集合,所述表达区域可以用于区分不同水平的病状。随后可以将一个或多个表达区域的一个或多个集合用作表达标记,以将将来的样品分类为不同水平的病状。
[0009] 对游离RNA样品首先通过分析细胞确定的表达区域进行分析,可以提供一种确定个体的病状水平的更少噪声并且更精确的方法。因为不同类型的细胞可能随病状水平而变化,所以可以使用几个表达区域来跟踪病状。与使用针对病状的单一基因组标记相比,本文所描述的方法还可以提供更强的信号。另外,本文所描述的方法简化了筛检过程,使得为获得与病状的相关度需要分析的表达区域较少。
[0010] 参考以下详细描述和附图可以获得对本发明的实施例的性质和优点的较好理解。

附图说明

[0011] 图1是说明根据本发明的实施例,使用妊娠和先兆子痫作为实例的细胞动态监测和畸变发现中的单细胞和血浆RNA转录组学的整合分析的示意图。
[0012] 图2是根据本发明的实施例,鉴别表达的标记以区分不同水平的病状的方法的框流程图
[0013] 图3是根据本发明的实施例,在确定病状水平时使用时间相关子队列的方法的框流程图。
[0014] 图4是显示根据本发明的实施例的用作分析个体的孕妇信息的表。
[0015] 图5显示了根据本发明的实施例,通过t-SNE分析的20,518个胎盘细胞的计算单细胞转录组学聚类模式。
[0016] 图6显示了根据本发明的实施例,在2维投影中导致在限定的细胞组处聚类表达的几种基因的重叠表达。
[0017] 图7A显示了根据本发明的实施例,数据集中的每个簇的胎儿和母体来源的分类。
[0018] 图7B显示了柱状图,其比较根据本发明的实施例,每个细胞亚组中表达Y染色体编码基因的细胞的百分比。
[0019] 图7C显示了双轴散点图,其显示根据本发明的实施例,原始t-SNE聚类分布中的预测胎儿/母体来源的细胞的分布。
[0020] 图7D显示了根据本发明的实施例,P5-7亚组中的基质和骨髓标记的表达模式。
[0021] 图7E显示了根据本发明的实施例,通过计算机生成的P5细胞与人工P4/P7重合体(duplet)聚类的t-SNE分析。
[0022] 图7F显示了根据本发明的实施例,编码胎盘细胞的不同亚组中的人类白细胞抗原的基因的表达模式的双轴散点图。
[0023] 图7G是根据本发明的实施例,总结每个细胞子组的标注性质的表。
[0024] 图7H显示了根据本发明的实施例,不同单细胞转录组学数据集中的细胞子组组成异质性。
[0025] 图8显示了根据本发明的实施例,通过t-SNE分析的胎盘细胞和公开外周血单核血细胞的计算单细胞转录组学聚类模式。
[0026] 图9是根据本发明的实施例,总结合并的PBMC和胎盘数据中不同细胞类型的标注性质的表。
[0027] 图10A显示了双轴t-SNE图,其显示根据本发明的实施例,外周血单核细胞(PBMC)和胎盘细胞的聚类模式。
[0028] 图10B显示了根据本发明的实施例,总结胎盘/PBMC合并数据集中的每个细胞子组的标注性质的表。
[0029] 图10C显示了双轴散点图,其显示根据本发明的实施例,胎盘细胞和PBMC的不同子组之间的特定标记基因的表达模式。
[0030] 图10D是根据本发明的实施例,显示不同PBMC和胎盘细胞簇中细胞类型特异性特征基因的平均表达的热图。
[0031] 图10E显示了根据本发明的实施例,比较人类白细胞、肝脏和胎盘中不同细胞类型特异性基因的表达水平的箱线图。
[0032] 图10F显示了根据本发明的实施例,文献中数据集的母体血浆RNA谱的细胞特征分析。
[0033] 图11显示了根据本发明的实施例,妊娠期间母体血浆RNA谱中的胎盘细胞动力学。
[0034] 图12A显示了根据本发明的实施例,先兆子痫的绒毛外滋养层细胞(extravillous trophoblast;EVTB)特征。
[0035] 图12B显示了根据本发明的实施例,先兆子痫EVTB簇中的细胞死亡相关基因。
[0036] 图13显示了根据本发明的实施例,先兆子痫和对照个体的不同细胞的特征评分。
[0037] 图14A显示了根据本发明的实施例,先兆子痫的绒毛外滋养层细胞(EVTB)特征。
[0038] 图14B显示了根据本发明的实施例,来自四名先兆子痫患者的胎盘活检的单细胞转录组,并且比较了在正常足月(normal term)和先兆子痫的胎盘之间表达HLA-G的EVTB簇中的簇内转录组学异质性。
[0039] 图15显示了根据本发明的实施例,来自晚期妊娠(third trimester)对照和重度早期先兆子痫(PE)患者的母体血浆样品中EVTB的细胞特征评分水平的比较。
[0040] 图16显示了根据本发明的实施例,胎盘细胞和PBMC的基因列表。
[0041] 图17是根据本发明的实施例,胎盘细胞和PBMC中基因列表的表达的热图。
[0042] 图18是根据本发明的实施例,在健康对照与患有活动性SLE的患者之间来源于单细胞转录组学分析的血浆RNA的B细胞特异性基因特征的比较。
[0043] 图19显示了根据本发明的实施例,样品名称和样品的临床病状。
[0044] 图20显示了根据本发明的实施例,已知对人类肝脏中的某些类型的细胞具有特异性的所选基因的表达模式。
[0045] 图21显示了根据本发明的实施例,通过PCA-t-SNE可视化的HCC和相邻的非肿瘤肝细胞的计算单细胞转录组学聚类模式。
[0046] 图22显示了根据本发明的实施例,HCC/肝脏单细胞RNA转录组学数据集中的细胞类型特异性基因的鉴别。
[0047] 图23是根据本发明的实施例,列出HCC/肝脏单细胞分析的细胞类型特异性基因的表。
[0048] 图24显示了根据本发明的实施例,健康对照、不伴随肝硬化的慢性HBV、伴随肝硬化的慢性HBV和HCC术前和HCC术后患者的血浆中不同细胞类型的细胞特征评分的比较。
[0049] 图25显示了根据本发明的实施例,在非HCC HBV(伴随或不伴随肝硬化)相对于HBV-HCC患者的区分中的不同方法的接收者操作特征曲线。
[0050] 图26显示了根据本发明的实施例,通过t-SNE分析将肝细胞样细胞组分离成五个子组。
[0051] 图27显示了根据本发明的实施例,肝细胞样细胞组的五个子组中的细胞来源。
[0052] 图28是根据本发明的实施例,显示肝细胞样细胞组的五个子组中优先表达区域的表达的表达热图。
[0053] 图29是根据本发明的实施例,在肝细胞样细胞组的子组中优先表达的基因列表的表。
[0054] 图30示出了根据本发明的实施例的系统。
[0055] 图31显示了可与根据本发明的实施例的系统和方法一起使用的示例性计算机系统框图
[0056] 术语
[0057] “组织”对应于集合在一起作为功能单元的一组细胞。可以在单个组织中发现多于一种类型的细胞。不同类型的组织可以由不同类型的细胞(例如肝细胞、泡细胞或血细胞)组成,但也可以对应于来自不同生物体(母亲相对于胎儿)的组织或对应于健康细胞相对于肿瘤细胞。
[0058] “生物样品”是指从个体(例如,人类,如孕妇、患有癌症的人或疑似患有癌症的人、器官移植接受者或疑似患有涉及器官的疾病过程(例如,心肌梗塞中的心脏、中风中的大脑或贫血中的造血系统)的个体取得,并且含有一个或多个所关注的核酸分子任何样品。生物样品可以是体液,如血液、血浆、血清、尿液、阴道液、水囊肿(例如睾丸)液、阴道冲洗液、胸膜液、腹水液、脑脊髓液、唾液、汗液、泪液、痰液、支气管肺泡灌洗液、乳头排出液、来自身体不同部分(例如甲状腺、乳房)的吸入液等。也可以使用粪便样品。在各种实施例中,已富集了游离DNA的生物样品(例如,通过离心方案获得的血浆样品)中的大多数DNA可以是游离的,例如大于50%、60%、70%、80%、90%、95%或99%的DNA可以是游离的。离心方案可以包括例如3,000g×10分钟,获得流体部分,并且再次在例如30,000g下再离心10分钟以去除残余细胞。样品中的游离DNA可以来源于各种组织的细胞,并且因此样品可以包括游离DNA的混合物。
[0059] “核酸”可以指单链或双链形式的脱核糖核苷酸或核糖核苷酸和其聚合物。术语可以涵盖含有已知核苷酸类似物或修饰的主链残基或键的核酸,这些核苷酸是合成、天然存在和非天然存在的,其与参考核酸具有相似的结合特性,并且以与参考核苷酸相似的方式代谢。此类类似物的实例可以包括但不限于硫代磷酸酯、基磷酸酯、膦酸甲酯、手性膦酸甲酯、2-O-甲基核糖核苷酸、肽-核酸(PNA)。
[0060] 除非另外指出,否则具体核酸序列还隐含地涵盖其保守地修饰的变体(例如,简并密码子取代)和互补序列,以及明确地指示的序列。具体地,简并密码子取代可以通过产生序列来实现,在所述序列中,一个或多个所选的(或全部)密码子的第三位被混合基和/或脱氧肌苷残基取代(Batzer等人,《核酸研究(Nucleic Acid Res.)》19:5081(1991);Ohtsuka等人《,生物化学杂志(J.Biol.Chem.)》260:2605-2608(1985);Rossolini等人《, 分子和细胞探针(Mol.Cell.Probes)》8:91-98(1994))。术语核酸可与基因、cDNA、mRNA、寡核苷酸和多核苷酸互换使用。
[0061] 如本公开中所使用,术语“截断值”或量意思指用于在两个或更多个分类状态之间进行判断(例如,细胞是否与一种类型的细胞相似)的数值或量。举例来说,如果参数大于截止值,则不将细胞视为所述类型的细胞,或如果参数小于截止值,则将细胞视为所述类型的细胞或未确定。

具体实施方式

[0062] 细胞被动或主动释放细胞核酸分子(DNA或RNA)到细胞外环境中。这些细胞外游离核酸分子可以在循环血浆中检测到。在妊娠中,据估计来源于胎儿的RNA分率从妊娠早期的仅3.7%增加到妊娠晚期的11.28%(1,2)。由于RNA转录是细胞类型特异性的,因此我们认为有可能通过分析血浆中对所关注的细胞类型具有特异性的多种游离RNA转录物的谱来推断细胞类型特异性变化和畸变,而无需直接取样组织。
[0063] 在妊娠健康评估的设定中,几个组已探索了使用胎儿特异性DNA多态性、器官特异性DNA甲基化(3)、DNA片段产生模式(4,5)和组织特异性RNA转录物(2)以分离循环游离胎儿核酸的库中的胎盘贡献,并且获得胎盘贡献的整体变化。然而,这些方法不足以检查胎盘中不同胎儿和母体成分的动力学和在细胞水平上区分不同妊娠期病理中胎盘的特定病理变化。
[0064] 一个困难是RNA转录物的来源的查明。已经显示,母体血浆中的胎儿RNA来源于胎盘(6),并且认为来源于其它非胎盘胎儿组织的RNA转录物也已最近在母体血浆中报道(2)。这些RNA转录物的组织来源通常根据多个组织样品的整个组织基因表达谱的比较来推断。
如上文所描述,生物组织由源自不同发育谱系的多种类型的细胞构成。因此,来自整个组织的表达谱提供了对群体的平均估计,扭曲了组织的实际异质组成,并且偏向组织样品中具有最高细胞数目的细胞,如胎盘中的滋养层细胞。先前的研究已展现,有可能基于单细胞转录组学RNA谱剖析复杂生物器官的细胞异质性,并且鉴别细胞类型特异性基因(7-10)。因此,确定器官的代表性组织样品的单独单细胞的RNA表达谱而不是将组织样品按均质化体分析在技术上是可行的。
[0065] 不清楚源组织(例如在妊娠中的胎盘)的细胞异质性信息是否保留在血浆RNA中。如果可以通过血浆RNA分析获得所关注的器官的不同细胞类型的信号,则可以分别或组合地对这类信号进行定量和分析,以检测例如妊娠期间胎盘,或携带癌症的器官,或自身免疫性疾病中的血细胞的细胞病理学和疾病。
[0066] 血浆中的游离循环RNA的生物学特性和降解机制与细胞RNA不同,例如,血浆RNA与血浆中的可过滤物质相关,并且可以在某些转录物中显示5'优势(preponderance)(11,12)。单个细胞类型特异性标记从组织到血浆的外推不是直接的,例如,尽管胎儿脐带血中的表达水平高,在恒河猴(Rhesus)D阴性孕妇的血浆中也无法容易地检测到来自胎儿造血组织的胎儿恒河猴D mRNA(13)。另外,已知游离循环RNA的库由不同的组织来源贡献,并且造血组织和血细胞是主要成分。
[0067] 我们开发了一种分析方法来实现这一目标。我们将细胞异质性的单细胞转录组学RNA信息整合到血浆RNA分析中,并且得出了一种度量标准,用于量化和监测自身免疫性疾病、癌症和产前病状中游离血浆中复杂器官的不同细胞成分的信号。
[0068] I.总体概览
[0069] 图1是说明使用妊娠和先兆子痫作为实例的细胞动态监测和畸变发现中单细胞和血浆RNA转录组学的整合分析的图示。然而,方法可以应用于自身免疫性疾病、癌症和其它病状。图1提供了技术的总体概览。方面的额外细节和其它实施例将在后面讨论。
[0070] 在图解110中,在怀孕女性114中显示胎儿112。胎盘116维护胎母界面的妊娠期健康。
[0071] 图解120显示胎盘116的一部分,并且显示器官由提供不同功能的多种类型细胞构成。在这一实例中,源器官(胎盘)组织解离成单个细胞。先兆子痫用作图解110和120中的病状,但实施例可以应用于其它病状,产生相似程序和图示。举例来说,图解110可以显示肝脏,并且图解120可以显示肝脏组织中的不同细胞。
[0072] 可以进行胎盘或所关注的其它器官的活检。随后,例如在分离单个细胞之后,来自活检的细胞可以进行转录组学谱分析。转录组学谱分析可以确定多个基因组区域的表达水平。在这些各个区域的表达水平可以用于鉴别在某些区域(例如,对于一种簇优先表达的区域)具有相似表达水平的细胞簇。
[0073] 图解130显示了单细胞转录组学谱可以通过各种技术,如微量滴定板格式化化学或基于微流体液滴的技术来获得。可以进行几次活检,使得细胞不限于来自单个个体的细胞。在一些情况下,也可以获得来自单独来源的细胞(例如,外周血单核细胞[PBMC]),以与来自活检的细胞分析合并。可以分别地获得单细胞RNA结果。可以使用计算机系统合并结果,并且随后去除批次偏差。在癌症中,带有肿瘤的组织细胞可以与血液相关细胞谱系(如淋巴和骨髓细胞)一起分析。
[0074] 图解140显示了胎盘细胞可以基于转录相似性(例如,在优先表达区域中的相似表达水平)被分组成不同的簇。分组成簇可以基于来自某些基因的RNA读数的相似模式。所述模式可以基于来自基因的读数的绝对或相对(例如,排序的)量。举例来说,某个簇可能具有读数数目最多的第一基因和读数数目第二多的第二基因。作为另一个实例,模式可以是在特定簇中唯一存在的具有相似表达水平(绝对量、相对比例或相对排序)的几个基因,或可以是特定簇中在表达水平方面具有独特顺序的几个基因。
[0075] 共有相似模式的细胞可以在2维或更高维空间中聚类在一起。举例来说,基于单细胞转录组学数据中所有可测量基因的两个细胞之间的皮尔逊相关系数(Pearson's correlation coefficient)可以用于测量表达谱的相似性。也可以使用其它统计数据,例如欧几里得距离(Euclidean distance)、平方欧几里得距离、余弦相似度、曼哈顿距离(Manhattan distance)、最大距离、最小距离、氏距离(Mahalanobis distance)或通过一组权重调整的前述距离。可以使用主成分分析(PCA)或本文中所描述的其它技术执行分组。每个簇可以对应于一种类型的细胞或一种类别的细胞。如果使用多于一种的细胞来源(例如,胎盘和PBMC),则可以对合并数据集执行聚类分析
[0076] 在图解150中,鉴别每个细胞类型的细胞类型特异性标记并且通过表达特异性在计算上过滤,以产生细胞类型特异性基因集。图解150中的每个图,如图152、154和156,代表一种特定基因。已知这些基因在特定类型的细胞中高度表达。每个图中更多的红色数据点表示所关注基因的更高表达。因此,与其它簇相比,与相对更多的红色数据点相对应的基因表明与特定簇的相关性更高。图解150中的簇对应于图解140中相同定位的簇。举例来说,图154和156中显示的基因显示与图解140中的簇142的相关性。图154和156中表示的基因可以视为簇142的优先表达区域。
[0077] 图解150的结果可以是将图解140中的特定簇鉴别为对应于特定类型的细胞。以这种方式,可以使用针对特定类型的细胞的优先表达区域的先前知识与具有相似转录谱的细胞簇的组合,以鉴别所述细胞类型的新的优先表达区域。在一些实施例中,不需要已知特定细胞类型(例如,肝脏、胚胎等)的原始细胞,因为仍然已知这些细胞是相同类型的。并且,当在后续步骤中进行测试时,知道细胞簇的优先表达区域为不同水平的病状提供足够的辨别力可能就足够了。
[0078] 图解160显示了游离样品(如血浆)在确定不同的簇或细胞类型的优先表达区域后进行测试。从多个个体测试了多个游离样品。可以将个体分组成具有不同水平的病状的队列。在先兆子痫的情况下,病状水平可以是先兆子痫的严重程度,或简单地是先兆子痫的存在。对每种细胞类型中优先表达基因的表达进行定量和汇总,以计算血浆RNA谱中细胞类型特异性特征的值。
[0079] 图解170显示了某些基因的表达水平的整体值可以用于依序(在本实例中为妊娠进展)监测血浆中相对应的细胞组分的动态变化,或用于在健康妊娠与罹患特定疾病(本实例中为早产先兆子痫)的患者之间鉴别细胞类型特异性畸变(本实例中为绒毛外滋养层细胞)。在图解170中,水平轴是孕龄,并且图显示了针对不同队列的测量结果,其中某些孕龄处的大分隔说明表达标记(针对细胞簇确定的优先表达基因的集合)可以区分队列。因此,这种表达标记可以用于鉴别相对于未患有病状,患有病状的个体。
[0080] A.确定表达标记的示例方法
[0081] 图2显示了一个实施例,其包括鉴别表达标记物以区分不同水平的病状的方法200。作为实例,病状水平可以是病状是否存在、病状的严重程度、病状的阶段、病状的前景、病状对治疗的反应或病状的严重程度或进展的另一种量度。
[0082] 病状可以是妊娠相关病状。作为实例,妊娠相关病状可以包括先兆子痫、子宫内生长受限、侵入性胎盘形成、早产、新生儿溶血病、胎盘功能不全、胎儿水肿、胎儿畸形、HELLP综合征、系统性红斑狼疮(SLE)或母亲的其它免疫疾病。妊娠相关病状可以包括以母体或胎儿组织中基因相对表达水平异常为特征的病症。在一些实施例中,妊娠相关病状可以是孕龄。
[0083] 在其它实施例中,病状可以包括癌症。作为实例,癌症可以包括肝细胞癌、肺癌、结肠直肠癌、鼻咽癌、乳腺癌或任何其它癌症。病状可以包括癌症与病症(例如,乙型肝炎感染)的组合。作为实例,癌症的水平可以是癌症是否存在、癌症分期(例如,早期和晚期)、肿瘤大小、癌症对治疗的反应、或癌症的严重程度或进展的另一种量度。病状可以包括自身免疫性疾病,包括系统性红斑狼疮(SLE)。
[0084] 可以获得包括多个细胞的样品。可以分离多个细胞中的每个细胞以使得能够分析特定细胞的RNA分子。样品可以利用活检获得。胎盘组织样品可以通过绒毛膜绒毛取样(CVS)、羊膜穿刺术或从足月分娩的胎盘获得。器官组织样品(例如,针对癌症)可以利用手术活检获得。一些样品可能不涉及切口或切割,例如,获得血液(例如,针对血液癌)。
[0085] 在框202处,分析来自细胞的RNA分子,以获得读数的集合。对从一个或多个第一个体获得的多个细胞中的每个细胞重复分析,并且因此分析获得读数的多个集合。可以以各种方式执行分析,例如,测序或使用探针(例如,荧光探针),如可以使用微阵列或PCR或本文所提供的其它示例技术来实施。这类程序可以涉及例如通过扩增或捕获进行的富集程序。
[0086] 多个细胞中的每个细胞的RNA分子可以标记有细胞的唯一码,使得相关读数包括唯一码。另外,对于多个细胞中的每个细胞,与对应于细胞的唯一码相关的读数集合可以存储在计算机系统的存储器中。计算机系统可以是用于RNA分析的专用计算机系统,包括本文所描述的任何计算机系统。
[0087] 如果病状是妊娠相关病状,则第一个体可以是各自怀有胎儿的女性个体。多个细胞可以包括胎盘细胞、羊膜细胞或绒毛膜细胞。如果病状是癌症,则第一个体可以是患有或未患有癌症的个体,其中多个细胞可以包括来自各种器官的细胞,例如包括肝细胞。如果病症是系统性红斑狼疮(SLE),则第一个体可以是患有或未患有SLE的个体,其中多个细胞可以包括肾细胞、胎盘细胞或PBMC。
[0088] 读数集合可以包括序列读数,包括通过大规模并行测序(包括配对端测序)随机获得的序列读数。还可以通过反转录PCR(RT-PCR)、使用探针以识别以鉴别某一区域的存在、数字PCR(基于液滴或基于孔的数字PCR),蛋白质印迹法、RNA印迹法、荧光原位杂交法(FISH)、基因表达系列分析(SAGE)、微阵列或测序来获得读数集合。
[0089] 在框204处,对于多个读数集合中的每个读数,由计算机系统鉴别对应于读数的参考序列中的表达区域。参考序列可以是人类参考转录组(例如,从UCSC refGene下载的数据或从头组装的转录物)和/或人类参考基因组(例如UCSC Hg19)。对于多个细胞中的每个细胞,对于读数集合中的每个读数,重复鉴别参考序列中的表达区域。鉴别对应于读数的参考序列可以包括使用读数和参考序列的多个表达区域执行比对程序。
[0090] 在框206处,对于多个表达区域中的每一个,确定对应于表达区域的读数的量。还针对多个细胞中的每个细胞的多个表达区域中的每一个重复确定读数的量。作为实例,读数的量可以是读数的数目、读数的总长度、读数的百分比或读数的比例。读数的量可以是唯一分子标识符(UMI)的数目。UMI用于标记原始RNA分子。
[0091] 确定对应于第一细胞的第一表达区域的读数的量可以使用对应于第一细胞的唯一码,以便鉴别对应于第一细胞的读数,以便确定哪些读数对应于特定区域,例如源自所述区域,所述读数也可以利用基于探针的技术来确定。确定读数的量还可以使用针对第一细胞的读数集合的比对程序的结果。唯一码可以是用分子的实际RNA序列测序的条形码。条形码可以不同于UMI,因为条形码用于确定细胞,而UMI用于标记原始RNA分子。来自同一细胞的两个RNA分子将具有相同的条形码,但UMI不同。
[0092] 在框208处,对于多个表达区域中的每一个,使用对应于区域的序列读数的量来确定表达区域的表达评分。结果,确定了包括多个表达区域的表达评分的多维表达点。每个细胞的多维表达点可以包括每个表达区域的细胞中的表达评分。举例来说,多维表达点可以是具有基因1的表达评分、基因2的表达评分、基因3的表达评分等的阵列。对于多个细胞中的每个细胞的多个表达区域中的每一个,还重复确定表达区域的表达评分。稍后提供表达评分的实例,但可以包括区域的绝对读数数、区域的比例读数数或其它标准化量的读数数。
[0093] 在框210处,使用对应于多个细胞的多维表达点,将多个细胞分组成多个簇。多个簇可以小于多个细胞。将多个细胞分组成多个簇可以包括执行多维表达点的主成分分析和执行降维方法(如主成分分析(PCA)或扩散映射),或通过使用基于力的方法(如t分布随机邻居嵌入(t-distributed stochastic neighbor embedding;t-SNE))。可以使用来自t-SNE或其它图的空间参数来确定簇。举例来说,可以在图中簇与另一簇之间存在最小空间的地方确定簇。分组可以是表达区域的读数量的结果或读数量的模式。
[0094] 簇可以进一步分组成子簇或子组。簇可以进一步划分,因为先验知识可以指示存在细胞的子类别。另外,可以使用数据统计法来继续对簇、子簇等进行分组。分组可以继续进行,直到簇内的变化最小化或达到目标值为止。另外,分组可以继续进行,以实现最佳数目的聚类来最大化平均轮廓(Peter J.Rousseeuw(1987)“. Silhouettes:对聚类分析的解释和验证的图形辅助。(Silhouettes:a Graphical Aid to the Interpretation and Validation of Cluster Analysis.)”《计算和应用数学(Computational and Applied Mathematics)》.20:53-65)或间隙统计量(R.Tibshirani,G.Walther和T.Hastie(斯坦福大学(Stanford University),2001).http://web.stanford.edu/~hastie/Papers/gap.pdf)。间隙统计量用于意指具有随机均匀分布的参考数据集(计算模拟)与观察到的簇之间的簇内变化的偏差。
[0095] 在框212处,对于多个簇中的每个簇,确定在所述簇的细胞中以指定比率表达的情况比与其它簇的细胞更多的一个或多个优先表达区域的集合。指定比率可以包括由针对所述簇的细胞的平均表达评分和针对其它簇的细胞的平均表达评分确定的值。举例来说,指定比率可以等于其它簇的细胞的标准差的数量(例如,一个、两个或三个)。在其它实施例中,指定比率可以是z评分,其描述所述簇的细胞的平均表达评分高于其它簇的细胞的平均表达评分的标准差的数量。在一些实施例中,指定比率可以是超过其它簇的细胞的平均表达评分的某一百分比。指定比率可以表示截止或阈值,以指示与其它簇的细胞的平均表达评分的统计差异。
[0096] 可以通过将第一簇的一个或多个优先表达区域的集合与已知优先在第一类细胞中表达的一个或多个区域进行比较,将多个簇中的第一簇鉴别为包括第一类型的细胞。举例来说,已知基质细胞优先表达某个区域。随后可以推断至少所述区域在一个或多个优先表达区域的集合中的簇是基质细胞。簇与细胞类型的关联可以基于一个以上的优先表达区域。在一些实施例中,簇可能不与细胞类型相关,因为细胞类型的鉴别可能不用于进一步分析。
[0097] 示例类型的细胞可以包括蜕膜细胞、内皮细胞、血管平滑肌细胞、基质细胞、树突状细胞、霍夫鲍尔(Hofbauer)细胞、T细胞、成红细胞、绒毛外滋养层细胞、细胞滋养层细胞(cytotrophoblast)、合体滋养层细胞(syncytiotrophoblast)、B细胞、单核细胞、肝细胞样细胞、胆管细胞样细胞、成肌纤维细胞样细胞、内皮细胞、淋巴细胞或骨髓细胞。
[0098] 在框214处,分析多个游离RNA分子以获得多个游离读数。对多个游离RNA样品中的每个游离RNA样品重复分析。多个游离RNA样品来自多个第二个体的队列。多个队列中的每个队列可以具有不同水平的病状。举例来说,多个队列可以包括没有病状的队列、病状处于早期的队列、病状处于中期的队列。
[0099] 队列可以具有描述第二个体的其它特征的子队列。举例来说,子队列可以具有与病状或第二个体相关的相同时间方面。子队列可以是病状的持续时间、病状的治疗持续时间、自诊断以来的时间或手术后生存时间。在一些实施例中,子队列可以具有第二个体的相同性别、相同种族、相同地理位置、相同年龄或其它相同特征。
[0100] 游离RNA样品可以从第二个体的血浆或血清(或其它生物样品,包括游离RNA)中获得。第二个体可以是与第一个体相同的个体。然而,在一些实施例中,第二个体可以与第一个体不同。在其它实施例中,第二个体的一些个体与第一个体相同,而第二个体的一些个体与第一个体的其余部分不同。
[0101] 如果病状是妊娠相关病状,则第二个体可以是各自怀有胎儿的女性个体。每个队列可以包括对于与所述队列相关的相同水平病状具有不同孕龄的子队列。子队列也可以包括女性个体的相似年龄、胎儿父亲的相似年龄或女性个体的相似生活方式。
[0102] 如果病状是癌症,则所述第二个体可以包括患有肿瘤的个体,并且可以任选地包括未患有肿瘤的个体。癌症的子队列可以是患有显示相似分子阳性的癌症(例如,HER2阳性子队列的乳腺癌)的患者。在一些实施例中,子队列可以是患有癌症,伴有其它临床并发症(如糖尿病)的个体。子队列可以具有相似年龄、性别、肿瘤解剖结构、转移状态或生活方式。
[0103] 在框216处,对于一个或多个优先表达区域的多个集合的一个或多个优先表达区域的每个集合,使用对应于一个或多个优先表达区域的所述集合的游离读数,测量对应簇的特征评分。对多个游离RNA样品中的每个游离RNA样品的一个或多个优先表达区域的每个集合重复测量。
[0104] 特征评分可以以各种方式确定,例如作为相对应的簇的一个或多个优先表达区域的表达水平的平均值。平均值可以是均值、中值或众数。
[0105] 特征评分可以根据以下计算:
[0106]
[0107] 其中S是特征评分,n是集合中细胞特异性表达区域的总数,并且E是细胞特异性表达区域的表达水平。
[0108] 在框218处,基于特征评分,将一个或多个优先表达区域的集合中的一个或多个鉴别为用于对未来样本进行分类,以区分不同水平的病状的一个或多个表达标记。表达标记是指一个或多个优先表达区域全体的集合。
[0109] 可以通过鉴别与簇中其它队列的特征评分在统计学上不同的队列和簇的特征评分,鉴别优先表达区域。举例来说,具有所述病状的队列的优先表达区域可以具有在统计学上高于不具有所述病状的队列的优先表达区域的特征评分。可以通过设置几个标准差来确定统计差异,所述队列的特征评分比其它队列更高。统计差异可以通过t检验或另一适合的统计检验来确定。
[0110] 一个或多个优先表达区域的集合的全部或一部分一部分可以用作表达标记。一个或多个优先表达区域的第一集合可以是区分第一孕龄的不同水平病状的第一表达标记。
[0111] 多个簇的第一簇的一个或多个优先表达区域的第一集合可以是区分第一组织的癌症水平的第一表达标记物。第一簇可包括来自第一组织的细胞。第一组织可以来自肝脏,并且第一簇可以包括肝细胞。组织细胞可以包括肿瘤细胞和非肿瘤细胞,或在一些实施例中,细胞可以不包括肿瘤细胞。在一些实施例中,组织细胞可以包括正常细胞和异常细胞,异常细胞可能是病理性的。在实施例中,第一组织可以来自肺、喉、胃、胆囊、胰、肠、结肠、肾脏、前列腺、乳、骨、肝脏、血细胞(包括T细胞、B细胞、嗜中性粒细胞、单核细胞、巨噬细胞)、巨核细胞、凝血细胞和自然杀伤细胞)以及骨髓、脾脏、结肠、鼻咽、食道、脑或心脏,并且第一簇可以是来自相应组织的细胞。
[0112] 在一些实施例中,细胞的分析可以包括多个类型的细胞的分析。举例来说,可以分析胎盘细胞的一个或多个优先表达区域的集合。另外,还可以分析PBMC的一个或多个优先表达区域的另一集合。由于来自胎盘和PBMC的RNA分子都可能存在于游离血浆样品中,因此可以在游离样品中鉴别胎盘和PBMC中的表达标记,以用于对未来样品进行分类以区分不同水平的病状。也可以分析白细胞。分析血浆中多种类型的细胞可以帮助理解血浆中的组织细胞动力学。举例来说,使用PBMC或白细胞可以帮助阐明血细胞排出RNA进入血液循环的可能性。在更多单细胞转录组学数据可用于更多组织(例如,肾脏、肺、结肠、心脏、脑、小肠、膀胱、睾丸、卵巢、乳)的情况下,可以更好地理解和监测关于细胞来源的血浆RNA的动力学。方法也可以使游离RNA与细胞类型相关。通过游离RNA分析理解某些类型细胞的量的增加和减少,可以更多地理解潜在病状并且更好地理解如何治疗病状。
[0113] 方法200和本文所描述的其它方法的优点包括可以比其它技术更高效和更精确地鉴别表达标记。本文所描述的方法可以允许使用多个区域而不是仅一个基因组标记来区分不同水平的病状。结果,所述方法对于在测量来自区域的量时可能出现的实验误差可能更加稳健。特定大组织包括多种细胞亚型。举例来说,白细胞包括T细胞、B细胞和嗜中性粒细胞等,其中嗜中性粒细胞是主要群体(>70%)。使用常规方法确定白细胞与其它组织之间差异表达基因(例如,基因组标记),所得标记将在T细胞、B细胞和嗜中性粒细胞之间共享相似模式,并且可能不是任何类型的血细胞所独有的。结果,血浆RNA结果中所见的任何变化都可能无法有效地区分血细胞类型,这将降低确定病状水平的灵敏度和准确度。举例来说,在患有B细胞淋巴瘤的患者中,由于B细胞增殖,将预期B细胞增加。然而,常规方法会发现来自白细胞的信号增加,但无法告知促进信号增加的根源。常规方法将无法提供为诊断提供信息的线索。但是,基于单细胞RNA的标记使我们能够追踪导向起源细胞的动态变化。
[0114] 实施例还具有在信号与背景相比低时,区分来自特定来源的基因的优点。举例来说,组织或器官(例如,肝脏)的特定细胞类型中的基因信号在循环的RNA分子中可能弱,这是因为血细胞来源的RNA以及所述组织或器官中的其它细胞类型的压倒性背景。使用单细胞RNA结果,方法能够去除与背景共享重叠信号的基因,并且特异性地聚集显示与疾病相关的细胞类型的特定表达水平的基因。举例来说,与血细胞相比,根据肝脏组织的RNA序列数据,ALB转录物对肝脏具有特异性。然而,由于与背景肝细胞相比,ALB表达水平在肿瘤细胞中缺乏特异性并且单个标记的信号弱,因此ALB表达水平无法用于区分HCC个体和HBV携带者。通过使用单细胞RNA测序方法,我们可以揭示相对于背景肝细胞的肿瘤细胞特异性转录物,并且聚集更多标记以增加单噪比,如此文件后文中所描述的接收者操作特征(ROC)曲线所证明。
[0115] B.确定个体病状水平的示例方法
[0116] 方法可以包括确定第三个体的病状水平。第三个体可以是与包括在第一个体或第二个体中的任何个体不同的个体。方法可以进一步包括从对来自从第三个体获得的生物样品的游离RNA分子进行的分析接收多个游离读数。在一些实施例中,可以分析获自第三个体的生物样品的多个游离RNA分子,以获得多个游离读数。游离RNA分子的分析可以通过本文所描述的任何适合方法进行。对于第一表达标记的每个优先表达区域,确定优先表达区域的读数的量。读数的量可以是本文所描述的任何量。
[0117] 将一个或多个优先表达区域的读数的量与一个或多个参考值进行比较。比较可以包括将每个优先表达区域的读数的量与每个优先表达区域的参考值进行比较。随后,可以将读数的量超过参考值的优先表达区域的总数用于比较,并且可能需要满足或超过某一数目或百分比。举例来说,读数的量超过相应参考值的优先表达区域的总数可以满足或超过表达标记中优先表达区域的数目的50%、60%、70%、80%、90%或100%,以便确定病状水平。在一些实施例中,比较可以包括由一个或多个优先表达区域的读数的量计算整体评分,并且将整体评分与一个参考值进行比较。可以由对多个优先表达区域的读数的量求和计算整体评分,所述多个优先表达区域可以包括表达标记的所有优先表达区域。如果整体评分超过参考值,则可以确定病状水平。
[0118] 一个或多个参考值可以由先前测试的个体(包括多个第二个体)先前确定。参考值可以基于未患有病状的个体的平均值,并且参考值可以是指示统计学上不同值的截止。举例来说,参考值可以超出优先表达区域的平均读数量一个、两个或三个标准差。
[0119] 基于对一个或多个优先表达区域的读数的量与一个或多个参考值的比较,确定第三个体的病状水平。读数的量与一个或多个参考值之间的间隔可以指示对病状水平的确定的置信度。举例来说,与当读数的量远大于参考值时相比,刚好大于参考值的读数的量可以指示病状水平的置信度或概率较低。
[0120] 在一些实施例中,多个表达标记可以用于相等的多个病状水平。可以将优先表达区域的集合的读数的量与适合于多个病状水平中的每个水平的参考值进行比较。在一些情况下,对于多个病状水平,读数的量可以超过参考值。可以基于在每个水平下超出一个或多个参考值的程度来确定病状水平。可以将其中大多数超出参考值的水平确定为病状水平。
[0121] 方法可以进一步包括治疗第三个体的病状。如果病状是先兆子痫,则治疗可以包括提高产前医师访视频率、卧床休息或引产。如果病状是癌症,则治疗可以包括手术、放射疗法、化学疗法、免疫疗法、靶向疗法、激素疗法、干细胞移植或精准医学。
[0122] 在一些实施例中,确定第三个体中的病状水平可以与用于鉴别一个或多个表达标记的方法分别地进行。举例来说,可以提供或已知一种或多种表达标记。随后可以如上文所描述对包括来自第三个体的游离RNA分子的生物样品进行分析,以确定第三个体的病状水平。
[0123] C.使用时间信息选择表达标记的示例方法
[0124] 如上文所描述,子队列的特征可为具有与病状或第二个体相关的相同时间方面。图3显示了使用时间相关子队列来确定个体的病状水平的方法300。病状可以包括妊娠相关病状、先兆子痫、癌症、SLE或本文所描述的任何其它病状。
[0125] 在框302处,接收来自对来自获自个体的生物样品的游离RNA分子的分析的多个游离读数。可以以本文所描述的任何方式接收多个游离读数。方法可以进一步包括,如本文所描述,获得包括游离RNA分子的生物样品,并且随后分析游离RNA分子以获得游离读数。
[0126] 在框304处,确定与病状相关的时间参数的值。如果病状是妊娠相关病状,则时间参数可以是孕龄。孕龄可以表示为妊娠一周、妊娠一个月或妊娠三月期。如果病状是癌症,则时间参数可以是癌症的治疗持续时间、自癌症诊断以来的时间或手术后生存时间。
[0127] 在框306处,使用时间参数的值来确定在所述时间参数的值的时间的病状的表达标记。所述表达标记包括优先表达区域的一个或多个集合。确定可以包括不仅针对病状水平优先表达的区域分析表达区域,而且进一步针对处于或接近于时间参数值优先表达的区域分析表达区域。换句话说,表达标记物的确定可以使用上文所描述的子队列。区域的优先表达可以取决于特定的一个或多个子队列。举例来说,对于妊娠相关病状,区域可以在早期妊娠(first trimester)而不是晚期妊娠中优先表达。
[0128] 在框308处,对于表达的标记的每个优先表达区域,确定对应于优先表达区域的读数的量。读数的量可以是本文所描述的任何量。可以通过与优先表达区域比对来确定读数的量。
[0129] 在框310处,可以将一个或多个优先表达区域的读数的量与一个或多个参考值进行比较。如上文所描述,比较可以包括将每个优先表达区域的量与优先表达区域的对应参考值进行比较,或比较可以包括针对从多个表达区域到单个参考值的量的整体评分。比较可以包括本文描述的任何比较技术。
[0130] 在框312处,基于对一个或多个优先表达区域的读数的量与一个或多个参考值的比较,确定个体的病状水平。作为实例,病状水平可以是病状是否存在、病状的严重程度、病状的阶段、病状的前景、病状对治疗的反应或病症的严重程度或进展的另一量度。方法可以进一步包括病状水平的置信度水平或概率。置信度可以基于与参考值相比的读数的量的间隔或比率。根据所确定的病状水平,可以开发治疗计划以降低对个体造成伤害的风险。方法可以进一步包括根据治疗计划治疗个体。
[0131] II.胎盘的整合式单细胞和游离血浆RNA分析
[0132] 确定细胞中一个或多个优先表达区域的集合,并且随后鉴别一个或多个优先表达区域的集合中的一个或多个的方法可以与胎盘细胞一起使用,以确定妊娠相关病状的水平。
[0133] 母体血浆中循环游离胎儿核酸的发现已使得能够通过检测致病突变、等位基因和染色体失衡,开发胎儿非整倍体和单基因性疾病的非侵入性产前诊断(52,53)。尽管已证明循环游离胎儿核酸来源于胎盘,但仍然难以使用游离胎儿核酸和常规大体积组织转录组谱分析研究胎盘病理学。一个重大的障碍是胎盘中的高细胞异质性,这不能通过总DNA定量分析、靶向来源于滋养层细胞的转录物分析或器官特异性转录物监测来解决。先前研究报告在妊娠期间多个RNA转录物的定量变化(20,21)。然而,将游离核酸的循环库与其细胞来源连接起来存在差距。妊娠期间胎盘非滋养层细胞组分的游离核酸动力学的讨论也很少。单细胞转录组学技术的进步为我们提供了一个将胎盘研究与妊娠期间循环游离核酸连接起来的机会。
[0134] 胎盘在妊娠期间子宫-胎盘界面建立和胎儿体内平衡的维持中起必需作用(1)。其为遗传和发育异质的器官,由来自胚胎和胚胎外谱系的母体来源和胎儿来源的细胞构成。在组织学上,盘状人类胎盘由多叶绒毛单元组成。人类胎盘在植入时展现“受控侵入”的独特过程。滋养层细胞的独特类型,绒毛外滋养层细胞(EVTB)在妊娠期间从绒毛迁移以浸润母体蜕膜。其参与子宫螺旋动脉的重塑,并且与母体淋巴细胞相互作用,以防止胎儿的异体排斥。绒毛滋养层细胞(包括多核合体滋养层细胞(SCTB)和绒毛细胞滋养层细胞(VCTB))排列在与母体血液直接接触的胎盘绒毛表面。整个胎盘绒毛结构由基质细胞支持,由胎儿巨噬细胞(霍夫鲍尔细胞)驻留,并且由胎儿毛细血管系统灌注。
[0135] 临床上,胎盘功能不全与多个主要妊娠期并发症(如先兆子痫毒血症(PET))有关(2)。PET是一种多系统并且潜在致命的妊娠病状,其特征在于妊娠≥20周时新发高血压和蛋白尿。其作为孕产妇和围产期合并症的主要原因,影响3%到6%的妊娠。其可以发展为系统性孕产妇疾病,伴随血小板减少、肝功能紊乱、肾衰竭和癫痫发作,导致显著胎儿生长限制甚至胎儿死亡。已提出有缺陷的胎盘植入和系统性血管炎为PET的主要病理机制(2,3)。
[0136] 尽管胎盘具有临床意义,但具有胎盘病变的患者与健康妊娠年龄匹配对照之间的直接胎盘组织比较是不可行的,这是由于对直接胎盘活检的侵入性的伦理关注。实际上,已实行几个临床方法,如超声成像和母体血清蛋白标记,以非侵入性地监测妊娠期间的胎盘健康(4,5)。研究显示,胎盘是母体血浆中循环游离胎儿核酸的主要来源器官(6-8)。也已报道患有PET(9-12)和早产病状(13-15)的患者的母体血浆中总游离胎儿DNA的水平和所选胎盘特异性RNA转录物显著升高,支持游离RNA在胎盘健康的非侵入性监测中的作用。然而,绝大多数母体造血背景已在检测胎盘信号中(16)产生重大困难。先前的研究已尝试通过微阵列分析、大规模并行转录组或表观基因组测序来提供对母体血浆核酸的更全面的评定(17-23)。几个组已探索了使用胎儿特异性DNA多态性、器官特异性DNA甲基化(22)、DNA片段产生模式(24,25)和器官特异性RNA转录物(21)以分离循环游离胎儿核酸的库中的胎盘贡献,并且获得胎盘贡献的总体变化。然而,仍未知母体血浆游离核酸分析是否可以用于剖析动态和异质胎儿和母体胎盘组分,并且在细胞水平上解析不同妊娠病变中的胎盘复杂变化。
[0137] 我们探索了基于液滴的单细胞数字转录组学技术的使用,以全面表征人类胎盘的转录组学异质性。我们以无偏方式分析了来自多个正常胎盘和PET胎盘的超过24,000个非标记选择胎盘细胞的单细胞转录组。使用这个全面的数据集,我们成功地展现了妊娠进展期间母体血浆中的纵向细胞动力学,并且从母体血浆游离RNA非侵入性地鉴别了先兆子痫胎盘中的潜在细胞病理。我们的研究展现了单细胞和血浆游离转录组学研究的整合和协同分析方法的潜力。
[0138] A.剖析人类胎盘的细胞异质性
[0139] 本章节为图1先前所描述的内容提供了额外的细节,以用于使用妊娠和先兆子痫在细胞动态监测和畸变发现中对单细胞和血浆RNA转录组进行整合分析。我们着手使用大规模的基于液滴的单细胞数字转录组学谱分析,获得对人类胎盘的细胞异质性的全面理解(26)(图1)。原则上也可适用允许需要或不需要组织解离来定量单个细胞的RNA表达谱的其它基于非液滴的技术,如通过RNA原位杂交进行转录物计数、通过组合条形码进行单细胞RNA谱分析。
[0140] 我们在多个新鲜剖宫产分娩的胎盘(两个男婴和两个女婴)的限定位置收集了活检,并且在不进行表面标记预选的情况下将组织解离成单细胞悬浮液。我们从六个不同的胎盘实质活检中获得了20,518个胎盘细胞的单细胞转录组。获得细胞的单细胞转录组可以是图2的框202和204。图4显示了作为分析个体的六名健康孕妇和四名严重先兆子痫孕妇的信息。每个文库中检测到的平均基因数为1,006(792-1,333),每个细胞平均覆盖21,471(16,613-36,829)个读数。
[0141] 通过t随机邻域嵌入(t-SNE)聚类分析在我们的数据集中鉴别胎盘细胞的12个主要簇(P1-12)。聚类分析用图1中的图解140并且用图2的框210描述。
[0142] 图5更详细地显示了胎盘在转录上的细胞异质性和聚类。图中的每个点代表来自单细胞的转录组学数据,每个点的接近度与转录组相似性相关。基于PCA-t-SNE中的空间接近度和文献中已知的细胞类型特异性标记表达的表达模式,对簇进一步着色并且分组成子组(P1-12)。
[0143] 图6显示覆盖文献中已知对特定类型的胎盘细胞具有特异性的几种基因的表达,引起2维投影中在限定的细胞组处的聚类表达。已知对人类胎盘中某些类型细胞具有特异性的所选基因(在每个方框图中都有标题)的表达模式(表达定量为对数转换UMI计数,范围为0-2)。图中的每个点代表来自单细胞的转录组学数据。灰色指示没有表达,并且橘红色的阴影越亮指示表达水平越高。
[0144] 细胞簇的生物标识可以通过某些已知的细胞类型特异性基因的表达模式可以直接推断。举例来说,已知CD34基因在胎盘血管的内皮细胞中特异性表达,因此显示高表达水平的CD34的P2簇的细胞可能是内皮细胞。
[0145] 在所关注的器官是由来自不同遗传来源的细胞构成的情况下,例如,胎盘,其中母体血液和蜕膜细胞可以存在于胎盘活检中并且在单细胞RNA谱中检测到,可以通过利用RNA转录物中存在的细胞来源之间的遗传差异来推断细胞簇的遗传标识。
[0146] 此外,我们对母亲和胎儿的全基因组SNP模式进行基因分型,以通过在每个子组中比较胎儿对母体特异性RNA SNP的比率,并且通过检查携带男性胎儿的孕妇胎盘中细胞中Y染色体编码的转录物的存在,在遗传上区分单个细胞的胎母来源。胎儿和母体来源的分析在下文进一步详细描述。
[0147] 图7A-H显示了人类胎盘中细胞异质性的剖析和细胞标识的标注。图7A显示了比较每个细胞子组中母体或胎儿来源的分率的百分比柱状图。图7B显示了比较每个细胞子组中表达Y染色体编码的基因的细胞的百分比的柱状图。图7C显示了显示如图5中的原始t-SNE聚类分布中的预测胎儿/母体来源的细胞分布的双轴散点图。由于没有基因分型信息可用于胎母来源预测,因此尚未绘制来自PN2文库的数据。图7D显示了P5-7子组中基质(COL1A1、COL3A1、THY1和VIM)和骨髓(CSF1R、CD14、AIF1和CD53)标记的表达模式。图7E是显示P5细胞与计算机生成的人工P4/P7重合体聚类的t-SNE分析,表明P5细胞可能是多重的。图7F是显示在胎盘细胞的不同子组之间编码人白细胞抗原的基因的表达模式的双轴散点图。图7G是总结每个细胞子组的标注性质的表。图7H显示了不同单细胞转录组学数据集中的细胞子组组成异质性。PN3P/PN3C和PN4P/PN4C代表成对的活检,其取自脐带插入位点的近端(PN3C/PN4C),和胎盘盘周围的远端(PN3P/PN4P)。
[0148] 我们的分析显示除P1、P6、P8和P9外的所有簇是主要胎儿来源的(图7A、C)。P1在转录上对应于母体蜕膜细胞,具有已知蜕膜标记基因DKK1、IGFBP1和PRL的强表达(图6)。标识与我们通过胎母SNP比率分析推断的胎母来源一致,其将P1分类为完全母体。P6表达树突状标记CD14、CD52、CD83、CD4和CD86,可能代表母体子宫树突状细胞(图6)。同时,P8表达高水平的T淋巴细胞标记,例如CD3G和GZMA。胎母SNP比率分析表明P8是胎儿和母体淋巴细胞的混合物(图7A-C)。同样,P9中成人和胎儿血红蛋白基因(如HBA1、HBB和HBG1)和编码血红素生物合成酶ALAS2的基因的同质表达表明,其由胎儿脐带和母体来源的红细胞构成。确定在某些细胞的情况下,超过其它细胞优先表达某些区域类似于图2的框212。
[0149] 胎儿子组的其余部分(P2-5、7、10-12)可大致分类成四组,即血管(P2-3)、基质(P4)、巨噬细胞(P5、P7)和滋养层(P11-13)细胞。P2细胞通常表达强血管内皮细胞标记,例如CD34、PLVAP和ICAM。在P2簇中也可以发现几种母本来源的细胞(图7C)。P3细胞显示血管平滑肌细胞的特征,表达MYH11和CNN1。P4细胞大簇表达细胞外基质蛋白ECM1和纤维调节蛋白(FMOD)的mRNA,这两者都是绒毛基质细胞的标记。与母体P6细胞相似,胎儿P5和P7簇也高度表达活化单核细胞/巨噬细胞基因CD14、CSF1R(编码CD115)、CD53和AIF1。尽管如此,胎儿P5和P7子组显示CD163和CD209的额外表达,两者都是胎盘驻留巨噬细胞(霍夫鲍尔细胞)的标记(图7D)。与P7细胞相比,P5子组还显示与P4基质细胞共享的成纤维细胞和间充质基因的普遍表达,如THY1(编码CD90)、胶原蛋白基因(COL3A1、COL1A1)和VIM(图7D)。这些结果提高了在单细胞囊封过程中P5子组可能由P4和P7细胞的重合体构成的可能性。为了证实这一假设,我们进行计算机重合体模拟分析(图7E),并且我们的结果指示P5细胞与模拟数据紧密相似,并且因此很可能代表重合体。
[0150] 滋养层细胞簇(P10-12)可以分别基于滋养层亚型特异性基因PAPPA2、PARP1和CGA的表达,分成三个子组,即绒毛外滋养层(P10:EVTB)、绒毛细胞滋养层(P11:VCTB)和合体滋养层(P12:(SCTB)(图6)。涉及重要妊娠激素产生的基因,包括CYP19A1(编码用于雌激素合成的芳香酶)、CGA(人类绒毛膜促性腺激素)和GH2(人类胎盘生长激素),都在SCTB中特异性表达(P12)。众所周知,胎盘EVTB表达非典型形式的人类白细胞抗原(HLA)的,如HLA-G,以用子宫NK细胞促进胎儿的母体的免疫耐受(27-29)。实际上,我们在EVTB(P10)子组中检测到HLA-G的强表达以及HLA-C和HLA-E的相关表达(图7F)。HLA基因在VCTB和SCTB中的表达一般很少,而典型HLA-A在非滋养层细胞(P1-9)中特异性表达。编码HLA II类分子(如HLA-DP、HLA-DQ和HLA-DR)的基因的表达集中在P6和P7中,这与其在母体树突状细胞和胎儿巨噬细胞中的抗原呈递功能一致。在鉴别具有优先表达的基因之前,可能不需要鉴别如同特定细胞类型的簇。
[0151] 先前大块组织转录组学谱分析已显示从胎盘的不同位点取出的活检之间的显著空间异质性(30)。我们的数据集中不同文库的组成异质性的比较也反映了这类变化。我们在两个不同个体的脐带插入的近端(PN3C和PN4C)和远端(PN3P和PN4P)位点包括了两个成对胎盘薄壁组织活检。(图4)。我们发现与其它细胞相比,P1蜕膜细胞在PN1文库中的代表性显著不足。实际上,PN1中的P2胎儿内皮细胞分率显著高于其它文库,表明在PN1活检中胎盘胎儿表面的脐脉血管系统的贡献很高。相反,PN2文库含有最高分率的P1蜕膜细胞、P6母体子宫树突状细胞和P10 EVTB。PN2文库可能在更深的胎母界面处捕获了更多的细胞。从成对的近端和远端中间切片获得的活检的细胞组成具有更高的可比性,仅远端位点处的蜕膜细胞显著减少,并且EVTB增加,但个体间变化仍然很高(图7H)。这些研究结果突出了胎盘中的细胞异质性和单细胞分析方法的必要性。
[0152] 可以在血浆RNA分析中使用的细胞类型特异性标记的鉴别可以使用额外过滤,因为众所周知血浆RNA的库在尤其造血来源中由多个器官来源作出了贡献(2,6)。肝脏特异性RNA ALB在血浆中也易于检测(15)。为了提高细胞类型特异性,我们分析了胎盘数据集以及来自公开数据集的健康供体的外周血单核细胞的单细胞转录组学数据(14)(图8)。
[0153] 对于我们的数据,分别获得胎盘单细胞RNA结果和PBMC单细胞RNA测序结果。我们首先将胎盘单细胞RNA结果和PBMC单细胞RNA测序结果进行计算机合并,随后通过计算去除批次偏差并且进行聚类分析。之后,我们鉴别了特定簇中存在的优先表达基因(基因组区域)。这类簇可以是胎盘细胞或PBMC细胞或胎盘与PBMC细胞的混合物。在另一实施例中,还可以同时进行对来源于不同组织或器官的细胞的实验,并且使用条形码技术来追踪来源的样品。
[0154] 图8显示了通过t-SNE可视化产生的胎盘细胞和公开外周血单核血细胞的计算单细胞转录组学聚类模式。图中的每个点代表来自单细胞的转录组学数据,每个点的接近度与RNA表达谱的相似性相关。根据已知细胞类型特异性标记表达的空间接近度和表达模式,对簇进一步着色并且分组成子组(P1-14)。组的着色对应于图5的着色。基于计算聚类分析中的表达区域和空间接近度,簇对应于图9所示的类型。
[0155] 我们推断,对于细胞类型特异性的基因:1)其应在测试细胞类型的细胞中以足够高的水平表达和2)其不应在其它非测试细胞中的以显著水平表达,即在测试细胞中需要最小表达阈值,在非测试细胞中需要最大表达阈值。3)表达差异量值应有意义地大,其可以通过最小阈值来定量,所述最小阈值可以是通过某些单位或数学上变换的参数定量的绝对表达差异,例如相对倍数变化、对数变换变化倍数、标准差或标准化标准差Z评分。在无法获得比较组中某一组织的单细胞RNA转录组学谱的情况下,对全组织RNA谱进行比较可以进一步确保细胞类型特异性基因的组织特异性,使所关注基因不应显示在其它组织中的表达高于测试细胞类型的组织。
[0156] B.妊娠期间胎盘细胞动力学的非侵入性阐明
[0157] 先前母体血浆转录学谱分析的研究显示,某些胎盘特异性转录物和整体分率胎盘贡献随妊娠年龄增加(21,34)。我们假设可有可能通过在单胎盘细胞水平上建立细胞类型特异性基因特征,剖析母体血浆游离RNA中单个胎盘细胞组分的动态变化。我们通过z评分比较鉴别了P1-12子组中的细胞类型特异性特征基因。但是,已知母体血浆中来源于胎盘的游离RNA与来源于造血源的游离RNA以混合物形式循环。在性别不匹配的骨髓移植接受者中的供体特异性血浆DNA分析和母体血浆中的组织特异性DNA甲基化分析显示,血浆中循环DNA的约70%和10%分别是造血和肝脏来源(16,22)。为了进一步确保细胞类型表达特异性,我们通过重新分析公开外周血单核细胞(PBMC)单细胞转录组学谱和来自人类lincRNA目录项目(Human lincRNA Catalog Project)的组织转录组数据,过滤胎盘特征基因(26,35)(图10A-E)。
[0158] 图10A-E显示了对母体游离RNA中细胞类型特异性特征基因集合的鉴别和对胎盘细胞动力学的非侵入性阐明。图10A显示了显示外周血单核细胞(PBMC)和胎盘细胞的聚类模式的双轴t-SNE图。PBMC数据从Zheng等人下载(26)。图10A中的簇使用与PBMC单细胞测序数据合并的胎盘单细胞RNA测序结果和如图1中的图解140的类似技术确定。图10B显示了总结胎盘/PBMC合并数据集中的每个细胞子组的标注性质的表。图10C显示了显示胎盘细胞和PBMC的不同子组中的特定标记基因的表达模式的双轴散点图。
[0159] 图10D是显示了不同PBMC和胎盘细胞簇中细胞类型特异性特征基因的平均表达的热图。最左边的垂直列中指示的颜色对应于图10A中的细胞簇着色。垂直列中与颜色相关的特定行显示了用于将细胞分组成图10A的簇的基因。最顶部的行上指定颜色对应于特定基因的细胞类型特异性。红色框指示特定基因在特定簇中具有相对较高的表达水平,表明所述基因与细胞类型强相关。蓝色框指示一个基因在特定簇中具有相对较低的表达水平,并且所述特定基因与细胞类型弱相关。
[0160] 图10E显示了比较人类白细胞、肝脏和胎盘中不同细胞类型特异性基因的表达水平的箱线图。比较了胎盘、肝脏和白细胞的整个组织谱中每种细胞类型特异性基因的表达水平,并且仅选择了在其相应来源组织、胎盘或白细胞中展现最高表达水平的基因。随后,我们排除了含有少于10个差异表达基因的细胞簇或其中差异表达基因在胎盘与白细胞/肝脏之间未显示出充分分离(P值>0.05)的细胞簇。在PBMC-胎盘数据集中的14个细胞簇中,未鉴别针对簇P5的特定基因,并且只有少于五个基因通过了针对簇P6、P9和P11的过滤器。代表胎盘霍夫鲍尔巨噬细胞的P7基因特征集合由于与白细胞的分离不充分而从额外分析中排除。
[0161] 图10F显示了Koh等人的母体血浆RNA谱的细胞特征分析(21)。在Koh中,在妊娠的三个妊娠期中的每一个和产后6周收集数据。热图显示了早期妊娠母体血浆(T1)、中期妊娠(second trimester)母体血浆(T2)、晚期妊娠母体血浆(T3)和产后母体血浆(PP)中不同细胞特征基因集中单个细胞类型特异性基因的表达水平(左栏图)。线图显示了在妊娠的不同阶段中单个细胞类型特征基因集的平均细胞特征评分的变化(右栏图)。特征分析可以并行于图2描述的框216和218。
[0162] 随后,我们研究Tsui等人(20)的单独数据集中,来自不同妊娠阶段的母体血浆RNA谱的对应细胞类型特异性特征基因集中的纵向表达动力学。图11显示了妊娠期间母体血浆RNA谱中的胎盘细胞动力学。每幅图左栏中的热图显示了非妊娠女性血浆(A组)、早期妊娠母体血浆(B组)、中期/晚期妊娠母体血浆(C组)、分娩前母体血浆(D组)和早期分娩后母体血浆(E组)的中不同细胞特征基因集中单个细胞类型特异性基因的表达水平。每幅图右栏中的线图显示了不同血浆组中单个细胞类型特征基因集的平均细胞特征评分的变化。
[0163] 在Tsui数据集的情况下,细胞类型特异性特征的动态模式与妊娠期间的已知生物变化一致。与非妊娠对照相比,我们观察到早期妊娠的母体血浆RNA中的合体滋养层细胞(SCTB)特征显著上调(图11)。趋势在分娩前的母体血浆中达到峰值,随后在分娩后24小时迅速降到非妊娠对照水平。在绒毛外滋养层细胞(EVTB)、胎盘基质细胞和血管平滑肌细胞特征中也可以发现类似模式。这些模式对应于妊娠早期的胎盘基质、SCTB和EVTB组分的快速生长和胎盘分娩后的清除。有趣的是,直到分娩后24小时,在母体血浆中仍可观察到蜕膜细胞的特征。这可以通过胎盘分娩后可继续从残留母体蜕膜组织释放游离RNA的事实来解释。相反,我们发现B细胞的特征在整个妊娠期间继续下降,而T细胞的特征首先下降,并且随后在分娩前恢复到非妊娠水平。一致地,通过流式细胞术对妊娠相关淋巴细胞减少的先前研究显示,T和B细胞水平随妊娠的进展下降(36-38)并且外周B细胞恢复可能迟于T细胞发生(37)。同时,单核细胞的特征显示了更可变的模式,在妊娠早期上调,在分娩前下降并且反弹,与妊娠期间与骨髓免疫活化的研究结果一致(36,39-41)。我们观察到在Tsui数据集中发现的细胞特征的动态模式与Koh数据集一致(图10F)。这些细胞增加和减少的模式可能无法用可能与特定细胞类型不相关的常规基因组标记观察到。
[0164] 这些研究结果证明了细胞类型特异性特征分析剖析母体血浆RNA谱中单个细胞组分动力学在的能力。特征评分中的一个或特征评分的组合可以用于确定未来样品的孕龄。
[0165] C.从母体血浆中游离RNA破译先兆子痫胎盘中的细胞畸变
[0166] 我们接下来证明在血浆RNA中进行特征基因集表达分析可以检测复杂疾病中的细胞畸变。我们从香港威尔斯亲王医院(Prince of Wales Hospital,Hong Kong)妇产科招募了10名晚期妊娠正常妊娠对照和6名罹患严重早产先兆子痫的妇女。在血浆分离后,我们立即通过将TRIzol(安必逊(Ambion))与血浆以3:1的比例混合来保存血浆RNA,并且使用RNeasy微型试剂盒(凯杰(Qiagen))进行提取。我们在LightCycler 96系统(罗氏(Roche))上通过NanoDrop ND-2000分光光度计(英杰(Invitrogen))和靶向GAPDH的实时定量PCR定量RNA。我们通过Ovation RNA-seq系统V2(NuGEN)进行了cDNA反转录和第二链合成。使用科瓦里斯(Covaris)S2超声发生器(科瓦里斯)将扩增并且纯化的cDNA超声处理成250bp片段,并且通过Ovation RNA-seq系统V2(NuGEN)构建RNA-seq文库。所有文库均在LightCycler 96系统(罗氏)上通过Qubit(英杰)和实时定量PCR进行定量,并且随后在NextSeq 500系统(启迪公司(Illumina))上测序。
[0167] 我们推断,先兆子痫胎盘中的细胞病理学可能影响释放和因此母体血浆中细胞类型特异性RNA的水平。因此,可以通过将先兆子痫患者的母体血浆中不同细胞类型特异性特征的表达水平与健康妊娠对照进行比较,揭示病理的细胞来源。
[0168] 我们比较健康晚期妊娠对照与罹患严重早期先兆子痫患者之间的多种细胞类型的特征基因集表达。我们在绒毛外滋养层细胞的特征基因集中发现了特定并且显著的升高。这与先前报道一致,即先兆子痫胎盘中的滋养层细胞凋亡增加(20-27)。
[0169] 引人注目地,我们发现,EVTB特征在用不同血浆RNA文库制备化学分析的两个独立队列中的先兆子痫患者中一致地上调(P=0.045,双尾双样本威尔科克森符号秩检验(Wilcoxon signed rank test))(图12A、图14A)。这些结果指出,先兆子痫中来源于EVTB的游离RNA向母体循环的释放增加。随后,我们直接在组织水平上验证了这一发现。我们表征了来自四名先兆子痫患者的胎盘活检的单细胞转录组,并且比较了正常足月和先兆子痫胎盘之间表达HLA-G的EVTB簇中的簇内转录组学异质性,以揭示不同生物过程中的异常(图14B)。基因集富集分析还证实了先兆子痫EVTB簇中细胞死亡相关基因的显著富集(图12B)。
图13显示了蜕膜细胞、内皮细胞和合体滋养层细胞的特征评分对于先兆子痫和对照个体不具有统计学上不同的特征评分,而EVTB的特征评分在统计学上不同。
[0170] 图B10显示了来自晚期妊娠对照和严重早期PE患者的母体血浆样品中绒毛外滋养层细胞的细胞特征评分水平的比较(p<0.05)。进行双样本双尾威尔科克森符号秩检验以检验统计显著性。先兆子痫(PE)胎盘的特征评分水平与对照显著不同。
[0171] 这些结果表明,先兆子痫胎盘中的EVTB具有较高水平的细胞死亡。这一结论与先前报道一致,即先兆子痫中滋养层细胞凋亡(尤其对于侵入性滋养层细胞)增加(44-51)。这些为先兆子痫患者母体血浆中EVTB特征的上调提供了机制解释。简单地说,我们证明了血浆游离RNA细胞特征分析作为非侵入性无假设探索工具揭示复杂器官来源的隐藏细胞病理学的能力,并且为先兆子痫的分子诊断提供非侵入性方法。这些结果显示,检测通过游离血浆RNA中单细胞RNA表达谱分析发现的细胞类型特异性转录物变化的分析方法可以用于检测、区分和监测影响复杂器官的病理。
[0172] D.讨论
[0173] 单细胞转录组学分析关于胎盘生物学的潜力可以见于最近的研究中,其中Pavlicev等人对来自人足月胎盘的87个显微解剖胎盘细胞进行谱分析,并且成功地推断潜在细胞间通信(54)。在这一当前研究中,我们利用微流体单细胞转录组学技术的力量建立了人类胎盘的大规模细胞转录组学图谱,对来自正常足月和先兆子痫胎盘的超过24,000个非标记选择细胞进行谱分析。我们使用遗传和转录信息两者标注了单个细胞的胎母来源,以提供包括蜕膜细胞、驻留免疫细胞、血管和基质细胞的胎盘细胞异质性的全面图片。
[0174] 最后,我们证明了将单细胞转录组学分析与血浆循环RNA分析整合,在正常妊娠进展期间和先兆子痫胎盘的细胞病理学中非侵入性地剖析复杂细胞动力学可行性。在检测母体血浆中低水平的游离RNA方面的高技术变化阻碍了使用有限的已知标记得出细胞动力学信息。我们通过从大规模单细胞转录组学谱分析中从头发现细胞类型特异性特征基因,和利用所有细胞类型特异性基因的信息的基因集分析基础克服了这个问题。可以在两个独立的母体血浆RNA数据集中观察到可比细胞动力学模式(20,21)。游离RNA细胞特征分析所揭示的滋养层细胞和造血细胞类型的细胞动力学与妊娠期间造血系统和胎盘的已知变化中的一些一致。更重要的是,这一分析允许以无假设的方式发现EVTB特征的差异表达作为PET患者细胞畸变中的一种,这反映了组织水平的病理学。由于在健康孕妇中进行侵入性胎盘活检是不可行的,因此游离RNA细胞类型特异性特征分析将成为探索性体内研究中的重要分子工具,以区分不同形式的胎盘功能障碍的细胞病理学并且提供临床诊断信息。随着大规模单细胞转录组学技术的成本效益持续提高和人类细胞图谱计划(Human Cellular Atlas Initiative)的对主要人体器官中所有细胞亚型的细胞转录组学异质性进行谱分析的努力(26,56-58),可以预见,可以将相同方法扩展到其它情况,如游离肿瘤RNA中的肿瘤克隆动力学剖析和其它妊娠疾病中细胞病理学的非侵入性探索。
[0175] 简单地说,我们的研究建立了正常和先兆子痫胎盘的大规模单细胞转录组学图谱,并且展示单细胞转录组学和血浆游离RNA的整合分析作为新颖非侵入性工具阐明复杂生物系统中的细胞动力学和畸变并且进行分子诊断的能力。
[0176] E.材料和方法
[0177] 1.个体、样品收集和加工
[0178] 本研究得到机构伦理委员会批准,并且在研究的性质和可能后果得到解释后获得了知情同意书。在知情同意的情况下,从香港威尔斯亲王医院妇产科招募健康或重度先兆子痫孕妇(图4)。我们招募了患有早发先兆子痫的患者,其需要在妊娠24-33+6周时分娩,在妊娠20周后发展至少2次间隔4小时血压≥140/90mmHg,在24小时内尿蛋白≥300mg,或如果无法进行24小时采集,则蛋白质/肌酐比值≥30mg/mmol或在中流或导管尿液样本的量杆分析中≥2+读数2次。仅招募剖宫产分娩的患者。
[0179] 对于每一种情况,在选择性剖宫产之前将20mL的孕妇外周血收集到含EDTA的试管中。如先前所描述,通过双离心方案分离血浆(20)。对于胎盘实质活检,在分娩后,在剥离膜后,从离脐带插入5cm远的2cm深的区域新鲜解剖1cm3的胎盘组织。在一些情况下,还从胎盘边缘(外周)获取组织取样的外周位点。随后将解剖组织在PBS中洗涤。随后根据制造商方案,使用脐带解离试剂盒(美天旎生物技术(Miltenyi Biotech))对组织进行酶消化。裂解红细胞,并且通过ACK缓冲液(英杰)去除。用100μm过滤器(美天旎生物技术)去除细胞碎片,并且将单细胞悬液再次在PBS(英杰)中洗涤三次。在显微镜下确认成功解离。
[0180] 2.血浆和大块组织RNA提取和文库制备
[0181] 在血浆分离后,立即通过通过将TRIzol(安必逊)与血浆以3:1的比率混合来保存血浆RNA。随后使用RNeasy微型试剂盒(凯杰)提取血浆RNA。在LightCycler 96系统(罗氏)上通过NanoDrop ND-2000分光光度计(英杰)和实时定量PCR对所有提取的RNA进行定量。通过Ovation RNA-seq系统V2(NuGEN)根据制造商方案进行cDNA反转录和第二链合成。使用科瓦里斯S2超声发生器(科瓦里斯)将扩增并且纯化的cDNA超声处理成250bp片段。根据制造商的说明书,通过Ovation RNA-seq系统V2(NuGEN)完成RNA-seq文库构建。所有文库均在LightCycler 96系统(罗氏)上通过Qubit(英杰)和实时定量PCR进行定量。
[0182] 3.单细胞囊封、液滴内RT-PCR和测序文库制备
[0183] 如所描述,使用Chromium单细胞3'试剂盒(10x Genomics),产生单细胞RNA-seq文库(26)。简单来说,根据制造商的说明书将未经事先选择的单细胞悬液(细胞浓度在200到1000个细胞/微升PBS之间)与RT-PCR主混合物混合,并且与单细胞3'凝胶珠粒和分配油一起负载到单细胞3'芯片(10XGenomics)中。来自单细胞的RNA转录物唯一地条形码化,并且在液滴内反转录。cDNA分子被预先扩增并且合并,随后根据制造商的说明书构建文库。在LightCycler 96系统(罗氏)上通过Qubit和实时定量PCR对所有文库进行定量。预先扩增的cDNA和测序文库的大小概况分别由安捷伦(Agilent)高灵敏度D5000和高灵敏度D1000 ScreenTape系统(安捷伦)检查。
[0184] 4.测序、比对和基因表达定量
[0185] 根据制造商的建议,用具有双索引(98/14/8/10-bp)格式的定制成对端(PE)对所有单细胞文库进行测序。将数据比对定位到人类参考基因组中,并且使用如Zheng等人所描述的Cell Ranger单细胞软件套件(1.0版本)定量为独特分子标识符(UMI)的数目(26)。简单地说,基于8bp样本索引、10bp UMI标签和14bp GemCode条形码对样本进行多路分解。含有cDNA序列的98bp长的读数1使用STAR(59)对照hg19人类参考基因组进行比对。如Zheng等人所描述,进行UMI定量、GemCode和基于通过汉明距离(Hamming distance)的误差检测的细胞条形码过滤(26)。
[0186] 对于血浆RNA文库的比对,修整接头序列和片段末端的低质量碱基(即,质量评分,<5),并且使用TopHat(v2.0.4),用以下参数将读数与人类参考基因组(hg19)进行比对:transcriptome-mismatches=3;mate-std-dev=50;genome-read-mismatches=3,对末端比对选项以及标注基因模型文件从UCSC(http://genome.ucsc.edu/)下载。通过内部脚本对基因表达进行定量,脚本对与Ensembl GTF(GRCh37.p13)中标注的基因的外显子区域重叠的读数数进行定量。
[0187] 所有文库分别在MiSeq系统(启迪公司)或NextSeq 500系统(启迪公司)上使用Miseq试剂v3的试剂盒(启迪公司)或NextSeq 500高输出V2试剂盒(启迪公司)测序。
[0188] 5.胎儿和母体来源确定
[0189] 为了区分细胞的遗传起源,首先通过iScan系统(启迪公司)分别使用血沉棕黄层和胎盘组织来测定母体和胎儿基因型。由于活检材料的限制,无法获得病例M12491(PN2)的基因型信息。随后鉴别了由测序读数覆盖的信息性SNP,其中当SNP在母亲中杂合(A/B)并且在胎儿中纯合(A/A)时,SNP被分类为母体特异性。反之亦然分类胎儿特异性SNP。接下来,我们如下计算等位基因比率(R):
[0190]
[0191] B:来源特异性SNP B的等位基因计数
[0192] A:常见SNP A的等位基因计数。
[0193] 针对每个细胞获得胎儿特异性等位基因比率(Rf)和母体特异性等位基因比率(Rm)。细胞将标注为1)胎儿来源,如果Rf>Rm;2)母体来源,Rm>Rf;3)未确定,如果Rm=Rf或如果没有覆盖任何信息性SNP的读数。
[0194] 6.重合体模拟
[0195] 首先从PN3C数据集提取1365个P4细胞和526个P7细胞的基因表达矩阵。为了模拟100个重合体数据点,将重合体的转录组建模为1个P4细胞与1个P7细胞的随机混合物。将人工重合体的基因表达水平设定为两个细胞的平均值。随后进行PCA。PCA分析后的前10个因子进一步用于进行t-SNE聚类。分别在PCA和t-SNE的聚类步骤中使用R中的prcomp和Rtsne软件包
[0196] 7.细胞特异性基因的鉴别
[0197] 外 周 血 单 核 细 胞 的 单 细 胞 转 录 组 学 数 据 取 自 h t t p s : / /support.10xgenomics.com/single-cell/datasets处的10X Genomics的公共领域。数据集先前公开(26)。将PBMC数据集与胎盘数据集合并,并且使用cellrangerRkit 0.99.0版软件包通过随机读数子取样标准化。使用前10个主成分,用cellrangerRkit软件包中的内置函数进行t-SNE聚类。基于已知标记基因表达和空间接近度,在双轴t-SNE图中对细胞簇进行拓扑鉴别。
[0198] 细胞类型特异性基因选择标准如下:
[0199] 1.表达z评分大于3的基因,并且
[0200] 基因表达z评分如下计算:
[0201]
[0202] zg:基因的z评分g
[0203] gA:细胞类型A的平均表达水平,(log2变换标准化UMI计数)
[0204] 非A细胞中的平均表达水平
[0205] 非A细胞中的表达的标准差。
[0206] 2.测试细胞类型中的平均基因表达水平(log2变换标准化UMI)大于阈值(>0.1),并且
[0207] 3.非测试细胞中的平均基因表达水平(log2变换标准化UMI)小于阈值(<0.01)并且
[0208] 4.来自人类lincRNA目录项目(14,16)的肝脏、胎盘和白细胞的完整组织谱的基因表达水平(对数变换FPKM)显示其源器官的最高表达,即与肝脏和白细胞相比,来自标注为胎盘细胞的细胞组中的基因在胎盘的完整组织谱中显示最高的表达;与肝脏和胎盘相比,来自标注为白细胞的细胞组中的基因(P8、P9、P13和P14基因)在白细胞的完整组织谱中显示最高的表达。
[0209] 平均表达水平可以是均值、中值或众数。阈值尽管列为0.01和0.1,但可以根据所需特异度或灵敏度而不同。阈值可以从0.005、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4或0.5中选择。PBMC-胎盘数据集中的14个细胞簇中,未鉴别出针对簇P5的特定基因,并且只有少于5个基因通过了针对簇P6、P9和P11的过滤器。由于鉴别出的基因数目低,因此未在这四个簇中进行细胞动力学分析。将胎盘、肝脏和白细胞的大块组织谱中的基因表达水平进行比较,以进一步选择在胎盘中显示最高表达特异性的基因集。胎盘细胞和外周血细胞基因集中的基因必须分别在胎盘和白细胞大块谱中显示最高表达。大块组织表达数据集在线取自人类lincRNAs目录项目(35)http://
www.broadinstitute.org/genome_bio/human_lincrnas/。由于胎盘和白细胞/肝脏分离不充分,将P7区域从进一步分析中移除(图10E)。基因列表可以在图16中找到,并且基因热图在图17中显示。基因列表可以是胎盘细胞和PBMC的优先表达区域的集合。
[0210] 8.特征评分分析
[0211] 我们推断,使用单个RNA转录物作为标记来监测血浆RNA中的细胞动力学由于血浆中RNA的低水平将经受大规模并行RNA测序的检测变异。通过考虑定义的基因集中的多个细胞类型特异性基因,可以改善所述问题。
[0212] 因此,我们通过可定量复合参数(S:细胞特征评分)测量血浆RNA谱中单个细胞类型特异性特征基因集的表达水平。在一个实例中,我们计算了基因集中基因的log2变换表达水平的算术平均值,作为血浆RNA中S的量度。
[0213]
[0214] S:特征评分
[0215] n:基因集中细胞特异性基因的总数目
[0216] E:细胞特异性基因的表达水平
[0217] 在实施例中,取决于组成性细胞类型特异性基因的表达水平的限制,细胞类型特异性特征评分的范围可以是0到无穷大。其单位还取决于定量RNA表达的方式的单位。尽管如此,血浆RNA谱中所关注的不同细胞组分的细胞类型特异性特征评分不是分数表示,并且不一定总和为100%。这意味着血浆RNA谱中一种特定细胞类型的特征评分的改变可能不一定导致所关注疾病中无关的其它细胞类型的特征评分的倒数变化。特征评分的计算可以是测量特征评分的一种方式,如图2的框216中所描述。
[0218] 9.胎盘细胞动力学分析
[0219] 我们重新分析来自Tsui等人(20)的母体血浆RNA谱。另外,我们遵循Tsui等人(20)描述的方法,由2名健康孕妇(第24周-第30周妊娠)和2名罹患严重先兆子痫的孕妇产生新血浆RNA数据。血浆RNA谱使用DESeq2(60)通过尺寸因子标准化。计算每个血浆RNA谱的细胞类型特异性特征评分,作为特定特征基因集的平均标准化计数水平。将母体血浆样品分组成5组(A:非妊娠;B:早期妊娠(第13周-第20周);C:中期/晚期妊娠(第24周-第30周);D:分娩前;E:产后24小时)。随后将每个组的平均特征评分以各自与非妊娠水平的变化形式进行比较,以说明妊娠进展中的细胞动力学。或者,Koh等人(21)的母体血浆RNA-seq谱取自SRP042027。数据用STAR(59)比对。选择可定位读数>1,000,000并且样品遍及四个不同的时间点(第1三月期、第2三月期、第3三月期和产后6周)的病例用于进一步分析(病例2、15、24和32)。如上文所描述,计算每个组的平均特征评分。随后将变化可视化为各自与早期妊娠孕妇水平的变化。由于血浆谱中检测到的特征基因数目低(<50%),因此未分析P4(基质细胞)的动力学。
[0220] 10.PET与正常母体血浆中的胎盘细胞特征表达比较
[0221] 在C组(中期/晚期妊娠血浆)与2个先兆子痫毒血症(PET)的患者之间比较不同细胞类型特异性特征的母体血浆RNA水平(数据在图14A中显示)。招募5名PET患者和8名健康晚期妊娠孕妇的新队列,以验证Tsui数据集中差异性EVTB细胞特征表达的研究结果。在这个新队列中,使用类似于Koh等人(21)的Ovation RNA-Seq系统V2(NuGEN)产生血浆RNA谱,并且如上文所描述进行分析。PET与健康对照之间的EVTB特征差异的统计显著性通过双尾双样本威尔科克森符号秩检验确定。
[0222] 11.微阵列基因分型和单核苷酸多态性(SNP)鉴别
[0223] 从母体血沉棕黄层和胎盘组织活检提取的基因组DNA用的InfiniumOmni2.5-8V1.2试剂盒和iScan系统(启迪公司)进行基因分型。使用Birdseedv2算法执行SNP调用。将胎盘的胎儿基因型与母体的血沉棕黄层基因型进行比较,以鉴定胎儿特异性SNP等位基因。
如果SNP在母亲中是纯合并且在胎儿中是杂合的,则认为SNP提供信息。
[0224] 12.统计分析
[0225] 统计分析的细节在上文相应章节中描述。我们认为小于0.05的P值统计显著。
[0226] III.癌症和SLE的整合式单细胞和游离血浆RNA分析
[0227] 针对妊娠和先兆子痫描述的整合式单细胞和游离血浆RNA分析可以应用于可能不与妊娠相关的病状。举例来说,分析可以用于确定系统性红斑狼疮(SLE)和癌症的表达标记。
[0228] A.检测自身免疫性系统性红斑狼疮(SLE)的血细胞畸变
[0229] 在另一实例中,我们证明这种分析方法可以用于在非妊娠疾病中揭示其它生物系统的畸变。在这一范例中,我们研究了从香港威尔斯亲王医院医学与治疗科招募的两名罹患系统性红斑(SLE)的患者的血浆游离RNA谱。两者在循环系统存在抗dsDNA抗体并且具有蛋白尿中。胎盘细胞和PBMC细胞用于这一分析。我们显示在我们的先前分析中发现的B细胞特异性特征水平在SLE患者中持续降低(图18)。这与B细胞异常已识别为SLE的主要病理机制的事实一致(28)。
[0230] B.在乙型肝炎病毒感染患者中检测肝癌
[0231] 在另一实例中,我们证明在癌症患者中检测和监测治疗中的应用。作为示例,我们从HBV相关肝细胞癌(HCC)和其相邻非肿瘤组织的4个肿瘤切除活检中分析了单细胞RNA转录组谱非标记选择细胞(样品2140、2138、2096和2058)。图C21显示了样品名称和样品的临床状况。
[0232] 用PBS缓冲液洗涤肿瘤和非肿瘤肝脏组织,并且在37摄氏度下由0.5%胶原蛋白酶A(西格玛奥德里奇(Sigma Aldrich))消化解离约1小时。将组织轻轻研磨并且用100μm滤网(美天旎生物技术)过滤,以去除大碎片。在室温下,用ACK缓冲液(英杰)将红细胞溶解1分钟,随后用肝细胞洗涤介质(赛默飞世尔科技(Thermo Fisher Scientific))再次洗涤细胞,随后用70μm滤网(美天旎生物技术)最终过滤。在显微镜下确认成功解离。
[0233] 使用Chromium单细胞3'文库和凝胶珠粒试剂盒V2(10x Genomics)产生单细胞转录组学文库。将细胞负载到单细胞3'芯片(10X Genomics)中,每个样品约有4000个细胞目的用于靶向细胞回收。来自单细胞的RNA转录物唯一地条形码化,并且在液滴内反转录。将cDNA分子预先扩增并且合并,随后根据方案说明进行文库构建。在LightCycler 96系统(罗氏)上通过Qubit和实时定量PCR对所有文库进行定量。预先扩增的cDNA和测序文库的大小概况分别由安捷伦高灵敏度D5000和高灵敏度D1000 ScreenTape系统(安捷伦)检查。在大规模并行测序仪(HiSeq2500,启迪公司)上对文库进行测序。将测序读数定位到人类参考基因组,并且使用10X Genomics的Cell Ranger管道2.0版本,以唯一分子标识符(UMI)的数目的形式对基因表达进行定量。
[0234] 为了从Cell Ranger管道加工后的数据中去除质量差细胞,我们去除没有显示管家基因ACTB的表达的细胞,或源自线粒体编码基因的总UMI计数的分率>20%的细胞,或在源样品中与总UMI计数在第5百分位以下或在第95百分位以上的细胞,或在源样品中几个基因在第5百分位以下或在第95百分位以上的细胞。进行主成分分析,并且选择捕获数据集中最显著变化的前5个主成分用于二维t随机邻域嵌入。
[0235] 基于t-SNE投影中细胞的接近度和知道细胞标记的表达,我们针对细胞类型特异性标记的发现,将细胞的生物标识标注为六个细胞组:肝细胞样细胞、胆管细胞样细胞、成肌纤维细胞样细胞、内皮细胞、淋巴细胞和骨髓细胞。
[0236] 图20显示了已知对人类肝脏中的某些类型的细胞具有特异性的所选基因(在每个图中都有标题)的表达模式(表达定量为对数变换UMI计数)。图中的每个点代表来自单细胞的转录组学数据。灰色指示没有表达,并且橘红色的阴影越亮指示表达水平越高。
[0237] 图21显示了通过PCA-t-SNE可视化产生的HCC和相邻的非肿瘤肝细胞的计算单细胞转录组学聚类模式。图中的每个点代表来自单细胞的转录组学数据,每个点的接近度与RNA表达谱的相似性相关。如图20中所指出,基于已知细胞类型特异性标记表达的空间接近度和表达模式,将簇进一步着色并且分组成6个子组。括号中的数字指示相应细胞类型中的细胞数目。
[0238] 在这个实例中,我们再次使用Z评分统计数据作为差异阈值(Z>=3)、标准化UMI计数<0.2/细胞类型作为比较细胞类型中的最大阈值和标准化UMI计数>=1UMI/细胞类型作为测试细胞组中的最小阈值,选择细胞类型特异性基因。
[0239] 1.表达z评分大于3的基因,并且
[0240] 基因表达z评分如下计算:
[0241]
[0242] zg:基因的z评分g
[0243] gA:测试细胞类型A中的基因g的平均表达水平(标准化UMI计数)
[0244] 其它非A比较细胞类型中基因g的平均表达水平的均值(标准化UMI计数)[0245] 其它非A比较细胞类型中的平均表达的标准差。
[0246] 2.测试细胞类型中的平均表达水平(标准化UMI)大于阈值(>=1UMI/细胞),并且[0247] 3.其它比较细胞类型中的平均表达水平(标准化UMI)小于阈值(<0.2UMI/细胞类型)
[0248] 图22显示了在HCC/肝脏单细胞RNA转录组学数据集中细胞类型特异性基因的鉴别。每种标注细胞类型的细胞类型特异性基因均在表达热图中显示。括号中的数字指示相应细胞类型中细胞类型特异性基因的总数目。图23显示了细胞类型特异性基因的列表。列表中的基因中的任一个可以在一个或多个优先表达区域的集合中。
[0249] 在本实施例中不一定需要与其它人体器官/组织(例如胎盘和PBMC)的完整组织或单细胞的表达谱进行比较,这是因为患者非妊娠,并且HCC/肝单细胞RNA转录组学数据集已含有两大组血细胞(淋巴和骨髓细胞)。
[0250] 随后,我们证明了细胞类型特异性基因集检测和监测患有肝细胞癌和慢性乙型肝炎伴随或不伴随肝硬化的患者的效用。
[0251] 在这个实例中,我们招募并且分析健康对照(n=8)、患有乙型肝炎病毒(HBV)感染和肝硬化的患者(n=23)、患有乙型肝炎病毒(HBV)感染并且无肝硬化的患者(n=18)、患有乙型肝炎病毒(HBV)相关肝细胞癌的患者(n=12)和在24小时前接受HBV相关肝细胞切除手术的患者(n=7)的血浆RNA谱。慢性HBV感染由乙型肝炎病毒表面抗原(HBsAg)的存在定义,并且肝硬化由声波成像证据定义。类似于母体血浆样品,如所描述加工血浆RNA样品。
[0252] 图24显示了来自健康对照、不伴随肝硬化的慢性HBV、伴随肝硬化的慢性HBV、HCC术前、HCC术后患者的血浆样品中不同细胞类型的细胞特征评分的比较(从左到右)。对于方差的非参数分析进行克鲁斯卡尔-沃利斯秩检验(Kruskal-Wallis test by ranks),并且进行双样本双尾威尔科克森符号秩检验,以检验显示统计显著性(K-W p<0.05)的细胞类型中样本组之间的统计显著性。调整p值以便进行通过本亚明-霍赫贝格(Benjamini-Hochberg)方法的多次检验*p<0.05,**p<0.01。Y轴表示如所描述计算的细胞特征评分。括号中的数字指示相应细胞类型中细胞类型特异性基因的总数目。
[0253] 血浆RNA谱中每种细胞类型的特征评分的比较显示,与其它患者组相比,肝细胞样细胞特征在确诊肝细胞癌的患者中显著升高。肿瘤切除后24小时,HCC患者中的信号减弱。相反,与健康对照相比,患有HCC的患者的淋巴细胞特征评分显著降低。
[0254] 在另一实例中,我们证明组合一个以上的细胞特征评分的分析可以改进通过血浆RNA分析进行的HBV相关HCC患者与非HCC HBV患者的区分。Chan等人先前显示,血浆RNA中单一肝特异性转录物ALB通过实时定量PCR分析的靶向检测可以用于检测肝脏病理,如移植监测、HCC和肝硬化(30)。因此,我们比较了ALB转录物检测和血浆RNA细胞类型特异性特征评分测量在区分HBV相关HCC患者与伴随和不伴随肝硬化的非HCC HBV患者时的诊断性能。
[0255] 图25显示了在非HCC HBV(伴随或不伴随肝硬化)相对于HBV-HCC患者的区分中不同方法的接收者操作特征曲线。左图显示了使用血浆中单一肝脏特异性转录物ALB的水平、肝细胞样与淋巴样细胞特征评分的比率和肝细胞样与骨髓细胞特征评分的比率的性能的比较。右图比较了单独的ALB、单独的肝细胞样、单独的淋巴和单独的骨髓特征评分的诊断性能。括号中的数字表示曲线下面积。给出了德朗检验(DeLong's test)的p值。
[0256] 接收者操作特征曲线分析显示,肝细胞样细胞的细胞类型特异性特征评分(0.7907)具有比ALB转录物(0.6423)高的曲线下面积(德朗检验p=0.02531)。如果使用肝细胞样细胞与淋巴细胞的比率(0.815)或肝细胞样细胞与骨髓细胞的比率(0.8049),则曲线下面积进一步增加。这些结果表明,可以利用不同细胞类型特异性特征的定量关系的数学变换来改进血浆RNA诊断。
[0257] 在另一实例中,我们基于t-SNE投影上的聚类模式,进一步将肝细胞样细胞组分离成5个子组(H1-5),如图26所示。在图26中,括号中的数字表示每个子组中的细胞数目。图26基于图21中的相同细胞。图21中的肝细胞样簇通过空间模式可以存在子组。另外,我们预期肝细胞可以包括正常肝细胞和肿瘤细胞。
[0258] 图27显示了五个子组中细胞的来源。对细胞文库来源的分析显示,H1主要由来自相邻非肿瘤肝脏组织的细胞构成。H2、H3、H4和H5分别由来自四个组织供体的肿瘤组织的细胞控制。
[0259] 将其它簇划分成子组或将子组划分成进一步的子组可为可能的。分析子组的决策可以取决于关于组织的先验知识(例如,生物假设驱动)和/或统计分析(例如,k均值统计)。
[0260] 举例来说,在肿瘤单细胞RNA结果中,我们预期至少六个隐藏细胞类型,包括浸润性淋巴细胞和骨髓细胞、正常肝细胞、肿瘤细胞、内皮细胞和胆管细胞。因此,我们尝试首先使用k均值聚类结果加上已知标记的表达模式来定位六个簇。一旦我们看到血浆RNA结果中肝脏簇的信号升高,则我们决定根据2维t-SNE图中显示的子簇的形状进一步对肝脏簇进行亚型化,因为我们预期肿瘤细胞将存在于肝脏簇中。肝脏簇中存在五个亚子组,其显示相对清晰的边界。
[0261] 或者,我们可以使用一些统计方法来确定应考虑的簇的数目。举例来说,(1)当总簇内变化最小化时,我们可以停止查看子组的子组。总簇内变化反映了应被最小化的聚类的紧凑性(参考Kaufman,L.and P.J.Rousseeuw,《发现数据中的组(Finding Groups in Data)》(约翰·威利父子公司(John Wiley&Sons),纽约(New York),1990);(2)最优簇数可以是使平均轮廓最大化的簇数(Peter J.Rousseeuw(1987).“Silhouettes:对聚类分析的解释和验证的图形辅助。”《计算和应用数学》.20:53-65);(3)最优簇数也可以是使间隙统计量最大化的簇数(R.Tibshirani,G.Walther和T.Hastie(斯坦福大学,2001).http://web.stanford.edu/~hastie/Papers/gap.pdf)。间隙统计量用于意指具有随机均匀分布的参考数据集(计算模拟)与观察到的簇之间的簇内变化的偏差。
[0262] H1-H5子组的细胞子组特异性基因鉴别使用Z评分统计作为差异阈值(Z>=3)、标准化UMI计数<0.5/细胞类型作为比较细胞类型中的最大阈值和标准化UMI计数>=1UMI/细胞类型作为测试细胞组中的最小阈值,鉴别出16个H1-H5特异性基因。
[0263] 图28是显示健康对照、不伴随肝硬化的HBV患者、伴随肝硬化的HBV患者、HBV相关HCC的患者以及24到48小时前接受HCC切除手术的患者的血浆RNA谱中的H2子组特异性基因GPC3、H3子组特异性基因REG1A、和H4子组特异性基因AKR1B10的表达的表达热图。我们发现3种基因(REG1A、GPC3和AKR1B10)在手术前在HCC患者的血浆RNA中特异性表达、在健康对照中完全不存在并且在伴随或不伴随肝硬化的非HCC HBV患者中不存在(特异度=100%,49/
49)。组合所有三种基因的检测,HCC检测的灵敏度为66.67%(8/12)。图29显示了子组特异性基因的列表。
[0264] IV.结论
[0265] 我们说明使用所关注的组织的单细胞RNA转录组学信息,由非细胞材料(如血浆RNA)进行细胞信息推导的概念。可以根据基于在源组织的单细胞RNA转录组学数据集中鉴别的细胞类型特异性而选择的血浆中某些RNA转录物的表达水平,计算定量特征评分,以检测病理学并且监测源组织的变化。我们使用妊娠进展、严重早期先兆子痫的检测、自身免疫性系统性红斑狼疮和肝癌为例对此进行了说明。其可适用于对疾病进行亚分型,如分离非HCC HBV感染与HBV相关HCC患者,和使用以肝癌切除术前和术后患者的变化作为实例,对治疗结果进行亚分型。
[0266] 这种方法可扩展到游离DNA分析中的基因组和表观基因组分析,其中细胞类型特异性基因组突变或细胞类型特异性表观基因组变化(例如,DNA甲基化、组蛋白修饰)可以首先在所关注的组织中在单细胞水平下限定,并且在游离DNA谱图中定量。
[0267] V.示例系统
[0268] 图30示出了根据本发明的一个实施例的系统3000。所示系统包括样品3005,如样品固持器3010内的游离DNA分子,其中样品3005可以与分析剂3008接触以提供物理特征3015的信号。在一些实施例中,样品3005可以是具有核酸物质的单细胞。样品固持器的实例可以是流动槽,其包括分析剂的探针和/或引物,或液滴通过其移动的管(液滴包括分析剂)。通过检测器3020检测来自样品的物理特性3015,如荧光强度值。检测器可以间隔地(例如,周期性间隔)进行测量以获得构成数据信号的数据点。在一个实施例中,模数转换器多次将来自检测器的模拟信号转换成数字形式。数据信号3025从检测器3020发送到逻辑系统
3030。数据信号3025可以存储在本地存储器3035、外部存储器3040或存储装置3045中。
[0269] 逻辑系统3030可以是或可以包括计算机系统、ASIC、微处理器等。其还可以包括以下或与以下耦接:显示器(例如,监视器、LED显示器等)和用户输入装置(例如,鼠标键盘、按钮等)。逻辑系统3030和其它组件可以是独立或网络连接的计算机系统的一部分,或其可以直接连接到或结合在热循环仪装置中。逻辑系统3030还可包括在处理器3050中执行的优化软件。
[0270] 本文提及的计算机系统中的任一种可以利用任何合适数目的子系统。这类子系统的实例显示在图31中的计算机设备10中。在一些实施例中,计算机系统包括单一计算机设备,其中子系统可以是计算机设备的组件。在其它实施例中,计算机系统可以包括具有内部组件的多个计算机设备,每个计算机设备是子系统。计算机系统可以包括台式计算机和膝上型计算机、平板计算机、移动电话和其它移动装置。
[0271] 图31中显示的子系统通过系统总线75互连。显示了附加的子系统,如打印机74、键盘78、(多个)存储装置79、耦接到显示适配器82的监视器76等。耦接到I/O控制器71的外围设备和输入/输出(I/O)装置可以通过任何数目的所属领域中已知的连接件(如输入/输出(I/O)端口77(例如,USB、 ))连接到计算机系统。举例来说,可以使用I/O端口77或外部接口81(例如,以太网、Wi-Fi等)将计算机系统10连接到广域网(如因特网)、鼠标输入装置或扫描仪。通过系统总线75互连允许中央处理器73与每个子系统通信并且控制来自系统存储器72或(多个)存储装置79(例如,固定磁盘(如硬盘驱动器)或光盘)的多条指令的执行,以及子系统之间的信息交换。系统存储器72和/或(多个)存储装置79可以体现为计算机可读介质。另一子系统是数据收集装置85,如相机、麦克风、加速计等。本文提及的数据中的任何一种可以从一个组件输出到另一个组件,并且可以输出到用户。
[0272] 计算机系统可以包括例如通过外部接口81或通过内部接口连接在一起的多个相同组件或子系统。在一些实施例中,计算机系统、子系统或设备可以通过网络进行通信。在这类情况下,一台计算机可以视为是客户端,并且另一台计算机可以视为服务器,其中每台计算机可以是同一计算机系统的一部分。客户端和服务器可以各自包括多个系统、子系统或组件。
[0273] 实施例的方面可以使用硬件(例如,专用集成电路现场可编程门阵列)和/或以模块化或集成方式用大体上可编程处理器使用计算机软件以控制逻辑的形式实施。如本文所使用,处理器包括单核处理器、在同一集成芯片上的多核处理器,或在单个电路板上或网络化的多个处理单元。基于本文中提供的公开内容和教示,所属领域普通技术人员会知道并且意识到使用硬件和硬件与软件的组合实施本发明的实施例的其它方式和/或方法。
[0274] 本申请中描述的任何软件组件或功能可以实施为使用任何适当计算机语言(例如Java、C、C++、C#、Objective-C、Swift)或脚本语言(如Perl或Python),使用例如传统或面向对象技术由处理器执行的软件代码。软件代码可以存储为用于存储和/或传输的计算机可读介质上的一系列指令或命令。适合的非暂时性计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、如硬盘驱动器或软盘磁性介质或如光盘(CD)或DVD(数字通用光盘)的光学介质、闪存等。计算机可读介质可以是这类存储或传输装置的任何组合。
[0275] 这类程序也可以使用载波信号来编码和传输,所述载波信号适合于通过符合多种协议的有线、光学和/或无线网络(包括因特网)传输。因此,计算机可读介质可以使用以这类程序编码的数据信号产生。以程序代码编码的计算机可读介质可以与兼容装置一起封装或与其它装置分开地提供(例如,通过因特网下载)。任何此类计算机可读介质可以驻留在单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或内,并且可以存在于系统或网络内的不同计算机产品上或内。计算机系统可以包括监视器、打印机,或用于向用户提供本文所提及的任何结果的其它合适的显示器。
[0276] 本文所描述的方法中的任一个可以完全或部分用计算机系统执行,所述计算机系统包括一个或多个处理器,所述处理器可以经配置以执行所述操作。因此,实施例可以涉及经配置以执行本文中所描述的任何方法的操作的计算机系统,所述计算机系统可能具有用于执行相应操作或相应操作组的不同组件。尽管以编号的操作呈现,但本文中的方法的操作可以同时或按不同的顺序执行。另外,这些操作的一部分可以与其它方法的其它操作的一部分一起使用。此外,操作的全部或部分可以是任选的。另外,方法中的任一个的操作中的任一个可以利用用于执行这些操作的模块、单元、电路或其它方法执行。
[0277] 本文中所用的章节标题仅出于组织目的并且不应理解为限制所描述的主题。
[0278] 应理解,本文中所描述的方法不限于本文中所描述的具体方法论、方案、主题和测序技术并且因此可以变化。还应理解,本文中所用的术语仅出于描述具体实施例的目的而并不打算限制本文所描述的方法和组合物的范围,所述范围将仅由所附权利要求书限制。尽管本文中已经展示和描述本公开的一些实施例,但所属领域的技术人员将显而易见,这类实施例是仅作为实例提供。所属领域的技术人员现将在不脱离本公开的情况下意识到大量变型、变化以及取代。应理解,本文中描述的本公开的实施例的各种替代例可以用于实践本公开。所附权利要求书旨在限定本公开的范围,并且由此覆盖这些权利要求和其等效物的范围内的方法和结构。
[0279] 参考实例应用来描述若干个方面以用于说明。除非另外指示,否则任何实施例可以与任何其它实施例组合。应理解,阐述许多具体细节、关系和方法以提供对本文中所描述的特征的完整理解。然而,所属领域的技术人员将容易认识到,本文中所描述的特征可以在不存在一个或多个具体细节的情况下或使用其它方法实践。本文中所描述的特征不限于动作或事件的所说明排序,因为一些动作可以按不同次序和/或与其它动作或事件同时发生。此外,并非需要所有所说明的动作或事件来实施根据本文中所描述的特征的方法。
[0280] 尽管本文中已经展示和描述本发明的一些实施例,但所属领域的技术人员将显而易见,这类实施例是仅作为实例提供。不希望本发明受说明书内提供的特定实例限制。尽管已经参考上述说明书描述本发明,但本文中的实施例的描述和说明并不打算以限制意义理解。所属领域的技术人员现在将在不脱离本发明的情况下意识到大量变型、变化以及取代。
[0281] 此外,应理解,本发明的所有方面都不限于本文中阐述的特定描绘、配置或相对比例,其取决于多种条件和变量。应理解,本文中所描述的本发明的实施例的各个替代方案都可以用于实践本发明。因此预期本发明也应涵盖任何这类替代方案、修改、变型或等效物。所附权利要求书旨在限定本发明的范围,并且因此覆盖这些权利要求和其等效物的范围内的方法和结构。
[0282] 在提供数值范围的情况下,应理解还专门公开所述范围的上限与下限之间的每个中间值,直到下限单位的十分之一(除非上下文另外明确规定)。涵盖所述范围内的任何所述值或中间值与那个所述范围内的任何其它所述值或中间值之间的每个较小范围。这些较小范围的上限和下限可以独立地包括在所述范围内或排除在其外,并且每个范围(其中两个极限之一、没有一个、或都包括在所述较小范围内)也涵盖在本发明内,服从所述范围中任何特别排除的限值。在所述范围包括界限值中的一个或两个的情况下,还包括排除那些所包括的界限值中的任一个或两个的范围。
[0283] 除非上下文另外明确规定,否则如本文和所附权利要求书中所用,单数形式“一(a/an)”和“所述(the)”包括多个指示物。因此,例如,对“一种方法”的引用包括多种这类方法,并且对“所述粒子”的引用包括对一种或多种粒子和所属领域的技术人员已知的其等效物的引用,以此类推。出于明确性和理解的目的,现已详细描述了本发明。但是,应了解,在所附权利要求书的范围内可以实践某些变化和修改。
[0284] VI.参考文献
[0285] 本文提及的所有专利、专利申请、公开案和描述都出于所有目的以全文引用的方式并入。不承认任何一者是现有技术
[0286] 1.G.J.Burton,A.L.Fowden《, 胎盘:一个多方面暂时性器官(The placenta:a multifaceted,transient organ)》《.伦敦皇家学会自然科学会报B生物科学(PhilosTrans R Soc Lond B Biol Sci)》370,20140066(2015).
[0287] 2.T.Chaiworapongsa,P.Chaemsaithong,L.Yeo,R.Romero《, 先兆子痫,第1部分:对其病理生理学的当前理解(Pre-eclampsia part 1:current understanding of its pathophysiology)》《.自然评论:肾病学(Nat Rev Nephrol)》10,466-480(2014).[0288] 3.S.J.Fisher,《为什么先兆子痫中的胎盘形成异常?(Why is placentation abnormal in preeclampsia?)》《美国妇产科杂志(Am J Obstet Gynecol)》213,S115-122(2015).
[0289] 4.A.M.Vintzileos,C.V.Ananth,J.C.Smulian《, 在胎盘植入异常的临床管理中使用超声波(Using ultrasound in the clinical management of  placental implantation abnormalities)》《. 美国妇产科杂志》213,S70-77(2015).
[0290] 5.H.Zeisler,E.Llurba,F.Chantraine,M.Vatish,A.C.Staff,M.Sennstrom,M.Olovsson,S.P.Brennecke,H.Stepan,D.Allegranza,P.Dilba,M.Schoedl,M.Hund,S.Verlohren《, sFlt-1:PlGF比率在疑似先兆子痫妇女中的预测价值(Predictive Value of the sFlt-1:PlGF Ratio in Women with Suspected Preeclampsia)》《.新英格兰医学杂志(N Engl J Med)》374,13-22(2016).
[0291] 6.S.S.Chim,Y.K.Tong,R.W.Chiu,T.K.Lau,T.N.Leung,L.Y.Chan,C.B.Oudejans,C.Ding,Y.M.Lo《, 检测母体血浆中乳腺丝抑蛋白基因的胎盘表观遗传特征(Detection of the placental epigenetic signature of the maspin gene in maternal plasma)》.《美国国家科学院院刊(Proc Natl Acad Sci U S A)》102,14753-14758(2005).[0292] 7.M.Alberry,D.Maddocks,M.Jones,M.Abdel Hadi,S.Abdel-Fattah,N.Avent,P.W.Soothill《, 无胚胎妊娠中母体血浆中的游离胎儿DNA:确认来源是滋养层细胞(Free fetal DNA in maternal plasma in anembryonic pregnancies:confirmation that the origin is the trophoblast)》《. 产前诊断(Prenat Diagn)》27,415-418(2007).[0293] 8.B.H.Faas,J.de Ligt,I.Janssen,A.J.Eggink,L.D.Wijnberger,J.M.vanVugt,L.Vissers,A.Geurts van Kessel《,使用通过连接的大规模并行测序进行胚胎非整倍体的非侵入性产前诊断和母体血浆中的游离胎儿DNA来源于细胞滋养层细胞的证据(Non-invasive prenatal diagnosis of fetal aneuploidies using massively parallel sequencing-by-ligation and evidence that cell-free fetal DNA in the maternal plasma originates from cytotrophoblastic cells)》.《生物疗法专家意见(Expert Opin Biol Ther)》12增刊1,S19-26(2012).
[0294] 9.Y.M.Lo,T.N.Leung,M.S.Tein,I.L.Sargent,J.Zhang,T.K.Lau,C.J.Haines,C.W.Redman《,先兆子痫母体血清中的胎儿DNA定量异常(Quantitative abnormalities of fetal DNA in maternal serum in preeclampsia)》子痫前期孕妇血清中胎儿DNA的定量异常《. 临床化学(Clin Chem)》45,184-188(1999).
[0295] 10.E.K.Ng,T.N.Leung,N.B.Tsui,T.K.Lau,N.S.Panesar,R.W.Chiu,Y.M.Lo《,先兆子痫母体血浆中循环的释放促皮质素激素的mRNA浓度提高(The concentration of circulating corticotropin-releasing hormone mRNA in maternal plasma is increased in preeclampsia)》《. 临床化学》49,727-731(2003).
[0296] 11.A.Martin,I.Krishna,M.Badell,A.Samuel《, 游离胎儿DNA的量能否预测先兆子痫:系统性综述(Can the quantity of cell-free fetal DNA predict preeclampsia:a systematic review)》《产前诊断》34,685-691(2014).
[0297] 12.Y.G.Zhang,H.L.Yang,Y.Long,W.L.Li《, 血细胞中环状RNA与血浆蛋白因子组合用于先兆子痫的早期预测(Circular RNA in blood corpuscles combined with plasma protein factor for early prediction of pre-eclampsia)》《.BJOG》123,2113-2118(2016).
[0298] 13.T.N.Leung,J.Zhang,T.K.Lau,N.M.Hjelm,Y.M.D.Lo《, 作为早产标记的母体血浆胎儿DNA(Maternal plasma fetal DNA as a marker for pretermlabour)》《柳. 叶刀(The Lancet)》352,1904-1905(1998).
[0299] 14.A.Farina,E.S.LeShane,R.Romero,R.Gomez,T.Chaiworapongsa,N.Rizzo,D.W.Bianchi《, 母体血清中胎儿游离DNA水平高:自发早产的危险因素(High levels of fetal cell-free DNA in maternal serum:a risk factor for spontaneous preterm delivery)》《. 美国妇产科杂志》193,421-425(2005).
[0300] 15.T.R.Jakobsen,F.B.Clausen,L.Rode,M.H.Dziegiel,A.Tabor,《高水平胎儿DNA与自发早产的风险增加相关(High levels of fetal DNA are associated with increased risk of spontaneous preterm delivery)》《. 产前诊断》32,840-845(2012).[0301] 16.Y.Y.Lui,K.W.Chik,R.W.Chiu,C.Y.Ho,C.W.Lam,Y.M.Lo《,性别不匹配的骨髓移植后血浆和血清中游离DNA的主要造血源(Predominant hematopoietic origin of cell-free DNA  in plasma and serum after sex-mismatched bone marrow transplantation)》《. 临床化学》48,421-427(2002).
[0302] 17.N.B.Tsui,S.S.Chim,R.W.Chiu,T.K.Lau,E.K.Ng,T.N.Leung,Y.K.Tong,K.C.Chan,Y.M.Lo《, 基于系统性微阵列的母体血浆中胎盘mRNA的鉴别:针对非侵入性产前基因表达谱分析(Systematic micro-array based identification of placental mRNA in maternal plasma:towards non-invasive prenatal gene expression profiling)》.《医学遗传学杂志(J Med Genet)》41,461-467(2004).
[0303] 18.F.M.Lun,R.W.Chiu,K.Sun,T.Y.Leung,P.Jiang,K.C.Chan,H.Sun,Y.M.Lo《, 通过全基因组亚硫酸氢盐测序母体血浆DNA进行非侵入性产前甲基组学分析(Noninvasive prenatal methylomic analysis by genomewide bisulfite sequencing of maternal plasma DNA)》《. 临床化学》59,1583-1594(2013).
[0304] 19.X.Huang,T.Yuan,M.Tschannen,Z.Sun,H.Jacob,M.Du,M.Liang,R.L.Dittmar,Y.Liu,M.Liang,M.Kohli,S.N.Thibodeau,L.Boardman,L.Wang《,通过深度测序表征来源于人类血浆的外泌体RNA(Characterization of human plasma-derived exosomal RNAs by deep sequencing)》《. BMC基因组学(BMC Genomics)》14,319(2013).
[0305] 20.N.B.Tsui,P.Jiang,Y.F.Wong,T.Y.Leung,K.C.Chan,R.W.Chiu,H.Sun,Y.M.Lo,《用于全基因组转录组学分析和妊娠相关转录物鉴别的母体血浆RNA测序(Maternal plasma RNA sequencing for genome-wide transcriptomic profiling and identification of pregnancy-associated transcripts)》《. 临床化学》60,954-962(2014).
[0306] 21.W.Koh,W.Pan,C.Gawad,H.C.Fan,G.A.Kerchner,T.Wyss-Coray,Y.J.Blumenfeld,Y.Y.El-Sayed,S.R.Quake《, 非侵入性体内监测人类组织特异性全局基因表达(Noninvasive in vivo monitoring of tissue-specific global gene expression in humans)》《. 美国国家科学院院刊》111,7361-7366(2014).
[0307] 22.K.Sun,P.Jiang,K.C.Chan,J.Wong,Y.K.Cheng,R.H.Liang,W.K.Chan,E.S.Ma,S.L.Chan,S.H.Cheng,R.W.Chan,Y.K.Tong,S.S.Ng,R.S.Wong,D.S.Hui,T.N.Leung,T.Y.Leung,P.B.Lai,R.W.Chiu,Y.M.Lo《,通过全基因组甲基化测序对非侵入性产前、癌症和移植评定进行血浆DNA组织定位(Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal,cancer,and transplantation assessments)》《. 美国国家科学院院刊》112,E5503-5512(2015).
[0308] 23.Y.Qin,J.Yao,D.C.Wu,R.M.Nottingham,S.Mohr,S.Hunicke-Smith,A.M.Lambowitz《, 通过使用热稳定II组内含子逆转录酶对人类血浆RNA进行高通量测序(High-throughput sequencing of human plasma RNA by using thermostable group II intron reverse transcriptases)》《. RNA》22,111-128(2016).
[0309] 24.M.W.Snyder,M.Kircher,A.J.Hill,R.M.Daza,J.Shendure《, 游离DNA包含告知其来源组织的体内核小体印迹(Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin)》《. 细胞(Cell)》164,57-68(2016).[0310] 25.K.C.Chan,P.Jiang,K.Sun,Y.K.Cheng,Y.K.Tong,S.H.Cheng,A.I.Wong,I.Hudecova,T.Y.Leung,R.W.Chiu,Y.M.Lo,《(Second generation noninvasive fetal genome analysis reveals de novo mutations,single-base parental inheritance,and preferred DNA ends)》第二代无创胎儿基因组分析揭示了从头突变,单亲本遗传,优先选择DNA末端《. 美国国家科学院院刊》113,E8159-E8168(2016).
[0311] 26.G.X.Zheng,J.M.Terry,P.Belgrader,P.Ryvkin,Z.W.Bent,R.Wilson,S.B.Ziraldo,T.D.Wheeler,G.P.McDermott,J.Zhu,M.T.Gregory,J.Shuga,L.Montesclaros,J.G.Underwood,D.A.Masquelier,S.Y.Nishimura,M.Schnall-Levin,P.W.Wyatt,C.M.Hindson,R.Bharadwaj,A.Wong,K.D.Ness,L.W.Beppu,H.J.Deeg,C.McFarland,K.R.Loeb,W.J.Valente,N.G.Ericson,E.A.Stevens,J.P.Radich,T.S.Mikkelsen,B.J.Hindson,J.H.Bielas《, 单细胞的大规模并行数字转录谱分析(Massively parallel digital transcriptional profiling of single cells)》《.自然通讯(Nat Commun)》8,14049(2017).
[0312] 27.S.Kovats,E.K.Main,C.Librach,M.Stubblebine,S.J.Fisher,R.DeMars《, 人类滋养层细胞中表达的I类抗原HLA-G(A class I antigen,HLA-G,expressed in human trophoblasts)》《. 科学(Science)》248,220-223(1990).
[0313] 28.S.Djurisic,T.V.Hviid《, 妊娠和先兆子痫中的HLA Ib类分子和免疫细胞(HLA Class Ib Molecules and Immune Cells in Pregnancy and Preeclampsia)》《.免疫学前沿(Front Immunol)》5,652(2014).
[0314] 29.J.Trowsdale,A.Moffett《, 妊娠中NK受体与MHC I类分子的相互作用(NK receptor interactions with MHC class I molecules in pregnancy)》《.免疫学研讨会(Semin Immunol)》20,317-320(2008).
[0315] 30.R.Sood,J.L.Zehnder,M.L.Druzin,P.O.Brown《, 人类胎盘中的基因表达模式(Gene expression patterns in human placenta)》《.美国国家科学院院刊》103,5478-5483(2006).
[0316] 31.C.Trapnell,D.Cacchiarelli,J.Grimsby,P.Pokharel,S.Li,M.Morse,N.J.Lennon,K.J.Livak,T.S.Mikkelsen,J.L.Rinn《, 由单细胞的伪时间排序展现细胞结局决策的动力学和调节子(The dynamics and regulators of cell fate decisions are revealed by pseudotemporal ordering of single cells)》《. 自然:生物技术(Nat Biotechnol)》32,381-386(2014).
[0317] 32.S.Mi,X.Lee,X.P.Li,G.M.Veldman,H.Finnerty,L.Racie,E.LaVallie,X.Y.Tang,P.Edouard,S.Howes,J.C.Keith,J.M.McCoy《, Syncytin是人类胎盘形态发生中所涉及的受制逆转录病毒包膜蛋白(Syncytin is a captive retroviral envelope protein involved in human placental morphogenesis)》《. 自然(Nature)》403,785-789(2000).
[0318] 33.J.Sugimoto,M.Sugimoto,H.Bernstein,Y.Jinno,D.Schust《,新颖人类内源性逆转录病毒蛋白抑制细胞-细胞融合(A novel human endogenous retroviral protein inhibits cell-cell fusion)》《. 科学报告(Sci Rep)》3,1462(2013).
[0319] 34.E.K.Ng,N.B.Tsui,T.K.Lau,T.N.Leung,R.W.Chiu,N.S.Panesar,L.C.Lit,K.W.Chan,Y.M.Lo《, 胎盘来源的mRNA可在母体血浆中容易地检测到(mRNA of placental origin is readily detectable in maternal plasma)》《. 美国国家科学院院刊》100,4748-4753(2003).
[0320] 35.M.N.Cabili,C.Trapnell,L.Goff,M.Koziol,B.Tazon-Vega,A.Regev,J.L.Rinn《,人类大基因间非编码RNA的整合标注揭示全局特性和特定子类别(Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses)》《. 基因与发育(Genes Dev)》25,1915-1927(2011).[0321] 36.H.Valdimarsson,C.Mulholland,V.Fridriksdottir,D.V.Coleman《,妊娠中白细胞血液计数和淋巴细胞反应的纵向研究:单核细胞-淋巴细胞比率的显著早期提高(A longitudinal study of leucocyte blood counts and lymphocyte responses in pregnancy:a marked early increase of monocyte-lymphocyte ratio)》《. 临床与实验免疫学(Clin Exp Immunol)》53,437-443(1983).
[0322] 37.M.Watanabe,Y.Iwatani,T.Kaneda,Y.Hidaka,N.Mitsuda,Y.Morimoto,N.Amino《, 正常妊娠期间和之后T、B和NK淋巴细胞亚群的变化(Changes in T,B,and NK lymphocyte subsets during and after normal pregnancy)》《.美国生殖免疫学杂志(Am J Reprod Immunol)》37,368-377(1997).
[0323] 38.J.Lima,C.Martins,M.J.Leandro,G.Nunes,M.J.Sousa,J.C.Branco,L.M.Borrego,《从妊娠晚期到产后健康孕妇的B细胞表征:前瞻性观察研究(Characterization of B cells in healthy pregnant women from late pregnancy to post-partum:a prospective observational study)》.《BMC妊娠分娩(BMC Pregnancy Childbirth)》16,139(2016).
[0324] 39.W.C.Andrews,R.W.Bonsnes,《妊娠期间的白细胞(The leucocytes during pregnancy)》《. 美国妇产科杂志》61,1129-1135(1951).
[0325] 40.R.M.Pitkin,D.L.Witte《, 妊娠中的血小板和白细胞计数(Platelet and leukocyte counts in pregnancy)》《. 美国医学会杂志(JAMA)》242,2696-2698(1979).[0326] 41.A.J.Balloch,M.N.Cauchi《, 来源于患者群体的妊娠血液学参数参考范围(Reference ranges for haematology parameters in pregnancy derived from patient populations)》《. 临床和实验室血液学(Clin Lab Haematol)》15,7-14(1993).[0327] 42.P.Brennecke,S.Anders,J.K.Kim,A.A.Kolodziejczyk,X.Zhang,V.Proserpio,B.Baying,V.Benes,S.A.Teichmann,J.C.Marioni,M.G.Heisler《, 考虑单细胞RNA-seq实验中的技术噪声(Accounting for technical noise in single-cell RNA-seq experiments)》《. 自然:方法(Nat Methods)》10,1093-1095(2013).
[0328] 43.A.A.Kolodziejczyk,J.K.Kim,J.C.Tsang,T.Ilicic,J.Henriksson,K.N.Natarajan,A.C.Tuck,X.Gao,M.Buhler,P.Liu,J.C.Marioni,S.A.Teichmann《, 多能状态的单细胞RNA测序解模块化转录变异((Single CellRNA-Sequencing of Pluripotent States Unlocks Modular Transcriptional Variation)》《. 细胞:干细胞(Cell Stem Cell)》17,471-485(2015).
[0329] 44.E.DiFederico,O.Genbacev,S.J.Fisher《, 先兆子痫与子宫壁内胎盘细胞滋养层细胞的广泛凋亡相关(Preeclampsia is associated with widespread apoptosis of placental cytotrophoblasts within the uterine wall)》《. 美国病理学杂志(Am J Pathol)》155,293-301(1999).
[0330] 45.F.Reister,H.G.Frank,J.C.Kingdom,W.Heyl,P.Kaufmann,W.Rath,B.Huppertz《, 巨噬细胞诱导的细胞凋亡限制先兆子痫妇女子宫壁中的血管内滋养层细胞侵入(Macrophage-induced apoptosis limits endovascular trophoblast invasion in the uterine wall of preeclamptic women)》《.实验室研究(Lab Invest)》81,1143-1152(2001).
[0331] 46.D.N.Leung,S.C.Smith,K.F.To,D.S.Sahota,P.N.Baker《,先兆子痫并发妊娠中胎盘细胞凋亡增加(Increased placental apoptosis in pregnancies complicated by preeclampsia)》《. 美国妇产科杂志》184,1249-1250(2001).
[0332] 47.N.Ishihara,H.Matsuo,H.Murakoshi,J.B.Laoag-Fernandez,T.Samoto,T.Maruo《, 先兆子痫或子宫内生长迟缓并发人类足月胎盘中合体滋养层细胞凋亡增加(Increased apoptosis in the syncytiotrophoblast in human term placentas complicated by either preeclampsia or intrauterine growth retardation)》《. 美国妇产科杂志(American Journal of Obstetrics and Gynecology)》186,158-166(2002).[0333] 48.P.K.Lala,C.Chakraborty《, 调节滋养层细胞迁移和浸润性的因素:导致先兆子痫和胎儿损伤的可能紊乱(Factors regulating trophoblast migration and invasiveness:possible derangements contributing to pre-eclampsia and fetal injury)》《. 胎盘(Placenta)》24,575-587(2003).
[0334] 49.M.Kadyrov,J.C.Kingdom,B.Huppertz《, 母体贫血和早发型先兆子痫/子子宫内生长受限并发妊娠胎盘床螺旋动脉中的发散滋养层细胞侵入和细胞凋亡(Divergent trophoblast invasion and apoptosis in placental bed spiral arteries from pregnancies complicated by maternal anemia and early-onset preeclampsia/intrauterine growth restriction)》《. 美国妇产科杂志》194,557-563(2006).[0335] 50.S.Z.Tomas,I.K.Prusac,D.Roje,I.Tadin《, 先兆子痫并发妊娠胎盘中滋养层细胞凋亡(Trophoblast apoptosis in placentas from pregnancies complicated by preeclampsia)》《. 妇产科研究(Gynecol Obstet Invest)》71,250-255(2011).[0336] 51.M.S.Longtine,B.Chen,A.O.Odibo,Y.Zhong,D.M.Nelson《, 先兆子痫、IUGR或先兆子痫伴随IUGR并发妊娠中绒毛滋养层的细胞凋亡增加并且限于滋养层细胞(Villous trophoblast apoptosis is elevated and restricted to cytotrophoblasts in pregnancies complicated by preeclampsia,IUGR,or preeclampsia with IUGR)》《. 胎盘》33,352-359(2012).
[0337] 52.Y.M.Lo,K.C.Chan,H.Sun,E.Z.Chen,P.Jiang,F.M.Lun,Y.W.Zheng,T.Y.Leung,T.K.Lau,C.R.Cantor,R.W.Chiu《, 母体血浆DNA测序揭示了胎儿的全基因组遗传和突变谱(Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus)》.《科学转化医学(SciTransl Med)》2,61ra91(2010).
[0338] 53.W.W.Hui,P.Jiang,Y.K.Tong,W.S.Lee,Y.K.Cheng,M.I.New,R.A.Kadir,K.C.Chan,T.Y.Leung,Y.M.Lo,R.W.Chiu《, 基于通用单倍型的单基因疾病非侵入性产前测试(Universal Haplotype-Based Noninvasive Prenatal Testing for Single Gene Diseases)》《临床化学》63,513-524(2017).
[0339] 54.M.Pavlicev,G.P.Wagner,A.R.Chavan,K.Owens,J.Maziarz,C.Dunn-Fletcher,S.G.Kallapur,L.Muglia,H.Jones《, 人类胎盘的单细胞转录组学:推断母体-胎儿界面的细胞通信网络(Single-cell transcriptomics of the human placenta:inferring the cell communication network of the maternal-fetal interface)》.《基因组研究(Genome Res)》,(2017).
[0340] 55.L.Ji,J.Brkic,M.Liu,G.Fu,C.Peng,Y.L.Wang《, 胎盘滋养层细胞分化:生理调节和与先兆子痫的病理相关性(Placental trophoblast cell differentiation:physiological regulation and pathological relevance to preeclampsia)》《.分子方面医学(Mol Aspects Med)》34,981-1023(2013).
[0341] 56.E.Z.Macosko,A.Basu,R.Satija,J.Nemesh,K.Shekhar,M.Goldman,I.Tirosh,A.R.Bialas,N.Kamitaki,E.M.Martersteck,J.J.Trombetta,D.A.Weitz,J.R.Sanes,A.K.Shalek,A.Regev,S.A.McCarroll《, 使用纳升液滴对单个细胞进行高度并行全基因组表达谱分析(Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets)》《. 细胞》161,1202-1214(2015).
[0342] 57.A.M.Klein,L.Mazutis,I.Akartuna,N.Tallapragada,A.Veres,V.Li,L.Peshkin,D.A.Weitz,M.W.Kirschner《, 应用于胚胎干细胞的单细胞转录组学的液滴条形码(Droplet barcoding for single-cell transcriptomics applied to embryonic stem cells)》《. 细胞》161,1187-1201(2015).
[0343] 58.T.M.Gierahn,M.H.Wadsworth第2,T.K.Hughes,B.D.Bryson,A.Butler,R.Satija,S.Fortune,J.C.Love,A.K.Shalek《, 便携式、低成本的高通量单细胞RNA测序(Seq-Well:portable,low-cost RNA sequencing of single cells at high throughput)》Seq-Well:《.自然:方法》,(2017).
[0344] 59.A.Dobin,C.A.Davis,F.Schlesinger,J.Drenkow,C.Zaleski,S.Jha,P.Batut,M.Chaisson,T.R.Gingeras,《STAR:超快速通用RNA-seq比对仪(STAR:ultrafast universal RNA-seq aligner)》《. 生物信息学(Bioinformatics)》29,15-21(2013).[0345] 60.M.I.Love,W.Huber,S.Anders《, 用DESeq2对RNA-seq数据的变化倍数和分散度进行适度估计(Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2)》《. 基因组生物学(Genome Biol)》15,550(2014).
[0346] 61.Pang WW等人(2009)《用于鉴别循环胎盘RNA标记以进行胎儿生长评定的策略(A strategy for identifying circulating placental RNA markers for fetal growth assessment)》《. 产前诊断》29(5):495-504.
[0347] 62.Muraro MJ等人(2016)《人类胰腺单细胞转录组图谱(A Single-Cell Transcriptome Atlas of the Human Pancreas)》《. 细胞系统(Cell Syst)》3(4):385-394e383.
[0348] 63.Zeisel A等人(2015)《脑结构(Brain structure)》《. (通过单细胞RNA-seq揭示小鼠皮质和海马中的细胞类型)》《. 科学》347(6226):1138-1142.
[0349] 64.Patel AP等人(2014)《单细胞RNA-seq突出显示原发性成胶质细胞瘤的肿瘤内异质性(Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma)》《. 科学》344(6190):1396-1401.
[0350] 65.Ng EK等人(2002)《癌症患者和健康个体的血浆中存在可过滤和不可过滤的mRNA(Presence of filterable and nonfilterable mRNA in the plasma of cancer patients and healthy individuals)》《. 临床化学》48(8):1212-1217.
[0351] 66.Wong BC等人(2005)《母体血浆中的循环胎盘RNA与多数5'mRNA片段相关:对非侵入性产前诊断和监测的影响(Circulating placental RNA in maternal plasma is associated with a preponderance of 5'mRNA fragments:implications for noninvasive prenatal diagnosis and monitoring)》《. 临床化学》51(10):1786-1795.[0352] 67.Chiu RW等人(2005)《胎儿恒河猴D mRNA在母体血浆中不可检测(Fetal rhesus D mRNA is not detectable in maternal plasma)》《. 临床化学》51(11):2210-2211.
[0353] 68.Sanz I(2014)《SLE中B细胞靶向的基本原理(Rationale for  B  cell targeting in SLE)》《. 免疫病理学研讨会(Semin Immunopathol)》36(3):365-375.[0354] 69.Chan RW,Wong J,Lai PB,Lo YM,Chiu RW《. 连续血浆白蛋白mRNA监测对于肝脏移植后管理的潜在临床效用(The potential clinical utility of serial plasma albumin mRNA monitoring for the post-liver transplantation management)》《.临床生物化学(Clin Biochem)》2013;46(15):1313-9.
[0355] 70.Chan RW,Wong J,Chan HL,Mok TS,Lo WY,Lee V等人《肝脏病理中来源于肝脏的血浆白蛋白mRNA的异常浓度(Aberrant concentrations of liver-derived plasma albumin mRNA in liver pathologies)》《. 临床化学》2010;56(1):82-9.
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈