选定的细胞亚群中鉴别多个表位的方法

申请号 CN201580069538.0 申请日 2015-12-21 公开(公告)号 CN107110849B 公开(公告)日 2019-07-26
申请人 豪夫迈·罗氏有限公司; 发明人 盖瑞·P·诺兰;
摘要 本 发明 公开了用于 鉴别 混合细胞群体内的亚群的方法。所述方法包括使所述混合细胞群体与至少一种独特结合剂 接触 ,其中所述至少一种独特结合剂被设计成与所述亚群中存在的靶分子结合,并且其中所述至少一种独特结合剂附接至代表所述靶分子的身份的表位特异性条码。所述方法进一步包括将两个或更多个可测定 聚合物 亚单位依次附接至所述表位特异性条码,以创建与所述至少一种独特结合剂结合的、代表个 体细胞 的身份的独特细胞起源条码;以及将所述表位特异性条码和细胞起源条码解码,从而鉴别所述混合细胞群体内的亚群。
权利要求

1.一种用于检测细胞亚群中的一种或多种靶分子的方法,所述方法包括:
a)使包含复杂细胞混合物的样品与两种独特结合剂接触,其中所述两种独特结合剂为被设计成与靶mRNA的彼此紧邻的互补区段杂交的邻近寡核苷酸探针,并且其中所述两种寡核苷酸探针中的至少一种附接至代表所述靶分子的身份的寡核苷酸表位特异性条码;
b)采用桥寡核苷酸将所述邻近寡核苷酸探针连接在一起;
c)采用裂分-合并组合合成法将两个或更多个寡核苷酸可测定聚合物亚单位依次附接至所述表位特异性条码,以创建代表独特的邻近寡核苷酸探针所结合的个体细胞的身份的独特细胞起源条码;以及
d)将与所述邻近寡核苷酸探针相关联的所述表位特异性条码和细胞起源条码选择性地扩增和测序,以鉴别表达靶RNA的细胞亚群。
2.如权利要求1所述的方法,其中所述独特结合剂包含能够与细胞内核酸序列杂交的核酸序列,其中所述细胞内核酸序列为病毒基因组核酸序列。
3.如权利要求2所述的方法,其中所述病毒基因组为HIV病毒基因组。
4.如权利要求1所述的方法,其中步骤(d)的选择性扩增包括进行连续两轮或更多轮的多重巢式扩增反应。
5.如权利要求4所述的方法,其中每个连续轮次的扩增均采用设计成与所述可测定聚合物亚单位杂交的一组引物,该可测定聚合物亚单位位于构成在步骤(d)中所鉴别的细胞起源条码的两个或更多个可测定聚合物亚单位位置的序列中的不同位置。

说明书全文

选定的细胞亚群中鉴别多个表位的方法

[0001] 交叉引用
[0002] 本申请要求提交于2014年12月19日的第62/094,917号美国临时申请、提交于2014年12月19日的第62/094,919号美国临时申请以及提交于2014年12月19日的第62/094,924号美国临时申请的权益,所有这些申请都通过引用以其全文并入本文以用于所有目的。
[0003] 发明背景
[0004] 虽然人体中的所有细胞都含有相同的遗传物质,但同组的基因并非在所有这些细胞中都是活性的。基因表达模式的改变可对生物学功能具有深远的影响。了解基因产物(蛋白质)产生和调节的动学及其相互作用对于了解例如遗传和/或环境诱导的健康障碍的机制将是至关重要的,并且可能为发现新的诊断和治疗靶标提供基础。因此,用于在个体细胞中监测基因表达谱和检测完整蛋白质的特定变体(例如,剪接变体、点突变、翻译后修饰以及环境或治疗诱导的修饰)的技术,以及用于随时间定量其平的技术,可能有助于开发新的诊断和治疗程序。此外,在单个细胞中同时对多个而不仅是一个靶分子进行这些分析正变得越来越重要。
[0005] 目前可用的方法常需要大量的生物样品,并且/或者将不提供细胞特异性信息。另外,由于复杂样品分析中固有的挑战,进行多重测量常常是特别困难的。因此,对能够精确和灵敏地对复杂细胞群体的个体细胞中的靶分子进行检测、鉴别和定量的方法存在需要。此外,常常期望对样品中选定细胞亚群的个体细胞进行这些分析,并保留关于一种或多种靶分子的存在与否的细胞特异性信息。

发明内容

[0006] 本公开内容描述了用于检测单个细胞中的多个靶核酸序列的方法、组合物和试剂盒。所公开的方法总体上适用于检测核酸靶分子,并且特别适用于检测存在于细胞混合物中的单个细胞中的mRNA靶分子,其中个体细胞的起源信息得到保留。
[0007] 本文公开了用于鉴别单个细胞中的靶核酸分子的方法,该方法包括:a)提供第一寡核苷酸邻近探针(proximity probe),其包含表位特异性条码序列和能够与靶核酸序列的第一区段杂交的第一靶标识别序列;b)提供第二寡核苷酸邻近探针,其包含能够与靶核酸序列的第二区段杂交的第二靶标识别序列,其中靶核酸序列的第一区段和第二区段是不同的并且彼此相隔指定数目N个核苷酸;以及c)提供桥寡核苷酸,其包含两个探针识别序列,其中第一探针识别序列能够与第一寡核苷酸邻近探针的区段杂交,并且第二探针识别序列能够与第二寡核苷酸邻近探针的区段杂交,从而创建包含所述表位特异性条码的靶标特异性探针复合物。
[0008] 在一些实施方案中,采用连接酶或聚合酶反应将所述第一和第二邻近探针与桥寡核苷酸共价接合。在一些实施方案中,所述方法进一步包括以有序的方式将两个或更多个可测定聚合物亚单位附接至所述靶标特异性探针复合物,以创建代表所述单个细胞的身份的独特细胞起源条码。在一些实施方案中,所述两个或更多个可测定聚合物亚单位在连续轮次的裂分-合并合成(split-pool synthesis)中附接至所述靶标特异性探针复合物。在一些实施方案中,所述附接包括与寡核苷酸模板分子的杂交,其中该模板分子的一端与所述靶标特异性探针复合物互补,并且其中在杂交后采用连接酶反应将所述可测定聚合物亚单位与靶标特异性探针复合物共价接合。在一些实施方案中,所述寡核苷酸模板分子包含位于所述模板分子序列中与所述可测定聚合物亚单位杂交的部分之间的终止代码序列,从而抑制所述寡核苷酸模板分子在扩增反应期间的扩增。在一些实施方案中,所述终止代码序列包括聚-dT序列。在一些实施方案中,所述终止代码序列包括聚-T序列。在一些实施方案中,所述终止代码序列包括三连接体。在一些实施方案中,所述第一或第二寡核苷酸邻近探针的至少一种进一步包含一种或多种引物序列。在一些实施方案中,所述细胞起源条码进一步包含一种或多种引物序列。在一些实施方案中,至少一种所述引物序列为扩增引物序列。在一些实施方案中,所公开的方法进一步包括对整套细胞起源条码及其相关的表位特异性条码的一部分或全部进行扩增和测序。在一些实施方案中,至少一种所述引物序列为测序引物序列。在一些实施方案中,所述靶核酸分子为DNA分子。在一些实施方案中,所述靶核酸分子为RNA分子。在一些实施方案中,该RNA分子为mRNA分子。在一些实施方案中,所述寡核苷酸邻近探针为DNA分子。在一些实施方案中,所述寡核苷酸邻近探针的长度为10至200个核苷酸。在一些实施方案中,所述靶标识别序列的长度为5至50个核苷酸。在一些实施方案中,所述表位特异性条码的长度为5至50个核苷酸。在一些实施方案中,N在1至20之间。在一些实施方案中,N在20至40之间。在一些实施方案中,N在40至100之间。在一些实施方案中,所述桥寡核苷酸为DNA分子。在一些实施方案中,所述桥分子的探针识别序列的长度为5至50个核苷酸。在一些实施方案中,所述可测定聚合物亚单位包含核酸序列。在一些实施方案中,所述方法是多重的(multiplexed)。在一些实施方案中,所述方法进一步包括额外的引物与所述细胞起源条码的末端的附接。在一些实施方案中,所述寡核苷酸邻近探针之一进一步包含所述桥寡核苷酸。在一些实施方案中,所述桥寡核苷酸用作用于附接一个或多个可测定聚合物亚单位的模板分子。在一些实施方案中,使用两个或更多个模板分子来组装所述细胞起源条码。
[0009] 本文还公开了用于检测靶mRNA序列的方法,该方法包括:(a)裂解细胞样品以释放mRNA;(b)使裂解的细胞样品与多个珠子接触,其中珠子包含能够与所释放的mRNA分子杂交的多个栓系的(tethered)寡核苷酸序列;(c)使第一寡核苷酸邻近探针与所述多个珠子上所杂交的mRNA分子退火,其中第一寡核苷酸邻近探针包含表位特异性条码序列和能够与靶核酸序列的第一区段杂交的第一靶标识别序列;(d)使第二寡核苷酸邻近探针与所述多个珠子上所杂交的mRNA分子退火,其中第二寡核苷酸邻近探针包含能够与靶核酸序列的第二区段杂交的第二靶标识别序列,并且其中靶核酸序列的第一和第二区段是不同的并且彼此相隔指定数目N个核苷酸;(e)使桥寡核苷酸与所述多个珠子上所杂交的寡核苷酸邻近探针退火,其中该桥寡核苷酸包含两个探针识别序列,其中第一探针识别序列能够与第一寡核苷酸邻近探针的区段杂交,并且第二探针识别序列能够与第二寡核苷酸邻近探针的区段杂交,从而创建包含所述表位特异性条码的靶标特异性探针复合物;以及(f)将退火的寡核苷酸邻近探针与桥寡核苷酸连接,以创建共价接合的靶标特异性探针复合物。
[0010] 在一些实施方案中,所述多个栓系的寡核苷酸序列进一步包含一个或多个引物序列。在一些实施方案中,所述多个栓系的寡核苷酸序列包含聚-dT靶标识别序列。在一些实施方案中,所述方法进一步包括使用一种或多种靶标特异性引物扩增包含所述表位特异性条码的所述靶标特异性探针复合物。在一些实施方案中,所述方法进一步包括对扩增产物进行测序,以检测或定量一种或多种mRNA序列的存在与否。
[0011] 本文公开了一种组合物,其包含:(a)第一寡核苷酸邻近探针,其包含表位特异性条码和第一靶标识别序列,其中第一靶标识别序列能够与靶核酸分子序列的第一区段杂交;(b)第二寡核苷酸邻近探针,其包含第二靶标识别序列,其中第二靶标识别序列能够与靶核酸分子序列的第二区段杂交;以及(c)桥寡核苷酸,其包含第一和第二探针识别序列,其中第一探针识别序列与第一寡核苷酸邻近探针的区段杂交,并且第二探针识别序列与第二寡核苷酸邻近探针的区段杂交。
[0012] 在一些实施方案中,所述组合物进一步包含靶核酸分子。在一些实施方案中,所述组合物进一步包含含有至少一个可测定聚合物亚单位的细胞起源条码,其中所述至少一个可测定聚合物亚单位附接至所述寡核苷酸邻近探针之一上。在一些实施方案中,第一和第二靶标识别序列各自与相应的第一和第二靶序列区段在10-30个基对的范围上至少80%互补。在一些实施方案中,所述桥寡核苷酸的第一和第二探针识别序列各自与第一和第二寡核苷酸邻近探针的对应区段在10-30个碱基对的范围上至少80%互补。在一些实施方案中,第一和第二寡核苷酸邻近探针与所述桥寡核苷酸共价连接。在一些实施方案中,所述组合物进一步包含一种或多种引物。在一些实施方案中,至少一种所述引物为扩增引物。在一些实施方案中,至少一种所述引物为测序引物。
[0013] 本文还公开了一种试剂盒,其包含:(a)第一寡核苷酸邻近探针,其包含表位特异性条码和能够与靶核酸序列的第一区段杂交的第一靶标识别序列;(b)第二寡核苷酸邻近探针,其包含能够与靶核酸序列的第二区段杂交的第二靶标识别序列;以及(c)桥寡核苷酸,其包含两种探针识别序列,其中第一探针识别序列能够与第一寡核苷酸邻近探针的区段杂交,并且第二探针识别序列能够与第二寡核苷酸邻近探针的区段杂交;其中所述试剂盒提供了用于检测和定量个体细胞或细胞混合物中的靶核酸分子的手段。
[0014] 在一些实施方案中,所述试剂盒进一步包含用于细胞起源条码的裂分-合并合成的多个可测定聚合物亚单位。在一些实施方案中,所述试剂盒进一步包含用于可测定聚合物亚单位的酶偶联或化学偶联的试剂。在一些实施方案中,至少一个所述寡核苷酸邻近探针进一步包含一种或多种引物。在一些实施方案中,从所述多个可测定聚合物亚单位合成的细胞起源条码进一步包含一种或多种引物。在一些实施方案中,至少一种所述引物为扩增引物。在一些实施方案中,至少一种所述引物为测序引物。
[0015] 本公开内容还描述了用于检测包含复杂细胞混合物的生物样品中选定细胞亚群内的单个细胞中的多个靶分子的方法、组合物和试剂盒。
[0016] 本文公开了用于鉴别混合细胞群体内的亚群的方法、组合物和试剂盒,该方法包括:(a)使混合细胞群体与独特结合剂接触,其中该独特结合剂被设计成与存在于所述亚群中的靶分子结合,并且其中该独特结合剂附接至代表靶分子的身份的表位特异性条码;(b)将两个或更多个可测定聚合物亚单位依次附接至所述表位特异性条码,以创建与所述独特结合剂结合的、代表个体细胞的身份的独特细胞起源条码;以及(c)将所述表位特异性条码和细胞起源条码解码,从而鉴别所述混合细胞群体内的亚群。
[0017] 在一些实施方案中,所述表位特异性条码和可测定聚合物亚单位包含寡核苷酸序列。在一些实施方案中,采用裂分-合并组合合成法将所述两个或更多个可测定聚合物亚单位附接至所述表位特异性条码。在一些实施方案中,将每次出现的所述表位特异性条码与相关细胞起源条码的所述两个或更多个可测定聚合物亚单位连接以形成可被扩增和测序的缀合物。在一些实施方案中,所公开的方法进一步包括表位特异性条码-细胞起源条码缀合物的扩增。在一些实施方案中,所述解码步骤包括对扩增的表位特异性条码-细胞起源条码缀合物的一部分或全部进行测序。在一些实施方案中,与所述亚群相关的细胞起源条码的数目与所述混合群体中的细胞总数之比提供了所述混合群体内含有所述靶分子的细胞的比例(fraction)的量度。在一些实施方案中,使用两种或更多种独特结合剂来鉴别所述亚群。在一些实施方案中,使用两种或更多种独特结合剂来鉴别两个或更多个亚群。在一些实施方案中,至少一种独特结合剂被设计成与选自DNA、组蛋白、管家蛋白质和普通蛋白质的靶分子结合。在一些实施方案中,利用与至少一种独特结合剂相关联的表位特异性条码-细胞起源条码缀合物的解码来鉴别包含死细胞、细胞碎片、细胞簇或其组合的亚群。在一些实施方案中,根据在条码化的实体中检测到的DNA的量、蛋白质的量或DNA与蛋白质之比来鉴别所述亚群。在一些实施方案中,所公开的方法进一步包括将与至少第二独特结合剂相关联的表位特异性条码-细胞起源条码缀合物解码,以鉴别存在于所述混合细胞群体的个体细胞中的至少第二靶分子,同时将包含死细胞、细胞碎片、细胞簇或其组合的亚群的细胞起源条码从进一步的分析中排除。在一些实施方案中,所述至少一种独特结合剂为针对选自DNA、组蛋白和管家蛋白质的靶分子的抗体或抗体片段。在一些实施方案中,所述至少一种独特结合剂为选自小檗碱、溴化乙锭、原黄素、道诺霉素、更生霉素、多柔比星、柔红霉素和沙利度胺的DNA嵌入分子。在一些实施方案中,所述至少一种独特结合剂包含选自琥珀酰亚胺酯、磺基琥珀酰亚胺酯、四氟苯基酯、磺基二氯苯酚酯、异硫氰酸酯和磺酰氯的胺反应性探针。
[0018] 本文还公开了用于检测细胞亚群中的一种或多种靶分子的方法、组合物和试剂盒,该方法包括:(a)使包含复杂细胞混合物的样品与两种或更多种独特结合剂接触,其中所述两种或更多种独特结合剂被设计成与不同靶分子结合,并且其中所述两种或更多种独特结合剂附接至代表靶分子的身份的表位特异性条码;(b)将两个或更多个可测定聚合物亚单位依次附接至所述表位特异性条码,以创建与一种或多种独特结合剂结合的、代表个体细胞的身份的独特细胞起源条码;(c)将与至少第一独特结合剂相关联的表位特异性条码和细胞起源条码选择性地扩增和测序,以鉴别细胞亚群;以及(d)将附接至与步骤(c)中鉴别的那些细胞亚群相匹配的细胞起源条码的、与至少第二独特结合剂相关联的表位特异性条码选择性地扩增和测序,以检测所指定细胞亚群的个体细胞中至少第二靶分子的存在与否。
[0019] 在所公开的方法、组合物和试剂盒的一些实施方案中,所述表位特异性条码和可测定聚合物亚单位包含寡核苷酸序列。在一些实施方案中,采用裂分-合并组合合成法将所述两个或更多个可测定聚合物亚单位附接至所述表位特异性条码。在一些实施方案中,将每次出现的表位特异性条码与相关细胞起源条码的所述两个或更多个可测定聚合物亚单位连接以形成可被扩增和测序的缀合物。在一些实施方案中,至少一种独特结合剂包含能够与细胞内核酸序列杂交的核酸序列。在一些实施方案中,所述至少一种独特结合剂包含能够与病毒基因组核酸序列杂交的核酸序列。在一些实施方案中,所述至少一种独特结合剂包含能够与HIV病毒基因组核酸序列杂交的核酸序列。在一些实施方案中,至少一种独特结合剂包括针对细胞表面标志物的抗体或抗体片段。在一些实施方案中,步骤(d)的选择性扩增包括进行连续两轮或更多轮的多重巢式扩增反应。在一些实施方案中,每个连续轮次的扩增均采用设计成与可测定聚合物亚单位杂交的一组引物,该可测定聚合物亚单位位于构成在步骤(c)中鉴别的细胞起源条码的两个或更多个可测定聚合物亚单位位置的序列中的不同位置。在一些实施方案中,第一轮扩增中采用的引物组与位于细胞起源条码中最远离表位特异性条码的位置处的可测定聚合物亚单位杂交,并且其中每个连续轮次的扩增均采用与位于更靠近表位特异性条码的位置处的可测定聚合物亚单位杂交的一组引物。
[0020] 本文公开了用于检测选定细胞亚群中的一种或多种靶蛋白分子的方法、组合物和试剂盒,该方法包括:(a)使包含复杂细胞混合物的样品与包含用于蛋白质的非特异性标记的胺反应性探针的非特异性结合剂接触,其中该非特异性结合剂附接至非特异性蛋白质条码;(b)使所述样品与设计为结合存在于所述亚群中的靶分子的第一独特结合剂接触,并且其中第一独特结合剂附接至代表靶分子的身份的表位特异性条码;(c)将两个或更多个可测定聚合物亚单位依次附接至所述非特异性条码和表位特异性条码,以创建代表个体细胞的身份的独特细胞起源条码;(d)使用一组珠子对来自细胞已经裂解的一部分样品的一种或多种靶蛋白分子进行免疫沉淀,其中每个珠子包含结合一种靶蛋白分子的固定化抗体和包含抗体特异性条码的固定化引物,并且其中该固定化引物能够与同该抗体的靶蛋白分子相关联的非特异性条码-细胞起源条码复合物的一端杂交;(e)进行引物延伸反应以创建抗体特异性条码-非特异性条码-细胞起源条码复合物;(f)对抗体特异性条码-非特异性条码-细胞起源条码复合物的集合进行扩增和测序;以及(g)通过将所述一种或多种靶蛋白分子的细胞起源条码列表与同至少第一独特结合剂相关联的细胞起源条码列表进行比较,来确定一种或多种感兴趣的靶蛋白分子是否存在于由至少第一独特结合剂限定的个体细胞的亚群中。
[0021] 在一些实施方案中,所述非特异性条码、表位特异性条码和可测定聚合物亚单位包含寡核苷酸序列。在一些实施方案中,将每次出现的所述非特异性条码或表位特异性条码与相关细胞起源条码的所述两个或更多个可测定聚合物亚单位连接以形成可被扩增和测序的缀合物。在一些实施方案中,所述胺反应性探针选自琥珀酰亚胺酯、磺基琥珀酰亚胺酯、四氟苯基酯、磺基二氯苯酚酯、异硫氰酸酯和磺酰氯。在一些实施方案中,所述第一独特结合剂包括抗体、抗体片段或核酸序列。在一些实施方案中,将所述包含胺反应性探针的非特异性结合剂替换为包含用于与mRNA分子非特异性杂交的聚-dT寡核苷酸探针序列的非特异性结合剂,并且其中该非特异性结合剂附接至非特异性mRNA条码。在一些实施方案中,本文公开的方法、组合物和试剂盒进一步包括将步骤(d)的珠子替换为包含与一种或多种感兴趣的mRNA分子的一部分或全部互补的固定化探针序列(每个珠子一种独特探针序列)以及包含mRNA特异性条码的固定化引物的珠子,并且其中该固定化引物能够与同该固定化探针序列的靶mRNA分子相关联的非特异性条码-细胞起源条码复合物的一端杂交。在一些实施方案中,本文公开的方法、组合物和试剂盒进一步包括在步骤(g)中通过将所述一种或多种靶mRNA分子的细胞起源条码列表与同至少第一独特结合剂相关联的细胞起源条码列表进行比较,来确定一种或多种感兴趣的靶mRNA分子是否存在于由至少第一独特结合剂限定的细胞亚群中。
[0022] 本文还公开了在对包含细胞混合物的样品中的个体细胞中的靶分子进行检测时将细胞亚群从进一步的分析中排除的方法、组合物和试剂盒,该方法包括:(a)使细胞混合物与第一组独特结合剂接触,其中每种独特结合剂均被设计成与靶分子结合,并且其中每种独特结合剂均附接至表位特异性条码,该表位特异性条码对于该组中的所有独特结合剂而言是相同的;(b)使所述细胞混合物与第二组独特结合剂接触,其中第二组的每种独特结合剂均被设计成与靶分子结合,该靶分子不同于第一组独特结合剂的靶分子,并且其中第二组的每种独特结合剂均附接至代表该靶分子的身份的独特表位特异性条码;(c)依次附接两个或更多个可测定聚合物亚单位,以创建与至少一种独特结合剂结合的、代表个体细胞的身份的一组独特细胞起源条码;(d)将与第一组独特结合剂相关联的表位特异性条码和细胞起源条码选择性地扩增和测序,以鉴别亚群;(e)将与第二组独特结合剂相关联的表位特异性条码和细胞起源条码选择性地扩增和测序;以及(f)通过比较步骤(d)和(e)中生成的细胞起源条码列表,来确定在排除步骤(d)中鉴别的细胞后第二组独特结合剂的靶分子是否存在于所述样品的剩余个体细胞中。
[0023] 在一些实施方案中,步骤(e)的选择性扩增包括进行连续两轮或更多轮的多重巢式扩增。在一些实施方案中,每个连续轮次的扩增均采用设计成与可测定聚合物亚单位杂交的一组引物,该可测定聚合物亚单位位于构成步骤(d)中鉴别的细胞起源条码的两个或更多个可测定聚合物亚单位的序列中的不同位置。在一些实施方案中,第一轮扩增中采用的引物组与位于细胞起源条码中最远离表位特异性条码的位置处的可测定聚合物亚单位杂交,并且其中每个连续轮次的扩增均采用与位于更靠近所述表位特异性条码的位置处的可测定聚合物亚单位杂交的一组引物。在一些实施方案中,所述细胞起源条码包含四个可测定聚合物亚单位。在一些实施方案中,所述表位特异性条码和细胞起源条码进一步包含扩增引物。在一些实施方案中,所述表位特异性条码和细胞起源条码进一步包含测序引物。在一些实施方案中,所述表位特异性条码和细胞起源条码进一步包含Illumina测序引物。
在一些实施方案中,所述可测定聚合物亚单位包含长度约为15至35个核苷酸的寡核苷酸序列。在一些实施方案中,所述可测定聚合物亚单位包含具有长度为3至10个核苷酸的可变编码区、其任一端侧翼为6至12个核苷酸的退火区的寡核苷酸序列。在一些实施方案中,所述可测定聚合物亚单位包含具有7个核苷酸的可变编码区、其任一端侧翼为长度为9个核苷酸的退火区的寡核苷酸序列。在一些实施方案中,该7个核苷酸的编码区被设计用于提供错误检测和校正能力。在一些实施方案中,所公开的方法、组合物和试剂盒进一步包括对包含细胞混合物的样品中的个体细胞中存在的一种或多种靶分子的量进行定量。
[0024] 本文还公开了一种组合物,其包含:(a)扩增的寡核苷酸条码产物,其编码单个细胞中存在的靶分子的身份,其中该寡核苷酸条码包含:(i)表位特异性条码序列;以及(ii)细胞起源条码序列。
[0025] 在一些实施方案中,所述组合物进一步包含一种或多种扩增引物。在一些实施方案中,所述组合物进一步包含一种或多种测序引物。在一些实施方案中,所述一种或多种测序引物为Illumina测序引物。
[0026] 本文还公开了一种组合物,其包含:(a)独特结合剂,其能够与感兴趣的靶分子结合或杂交;以及(b)共价附接的寡核苷酸序列,其中该寡核苷酸序列包含表位特异性条码以及一个或多个连接体序列,并且其中该连接体序列能够与其他寡核苷酸杂交或共价附接。
[0027] 在一些实施方案中,所述独特结合剂为抗体或抗体片段。在一些实施方案中,所述独特结合剂为设计用于与感兴趣的靶序列杂交的寡核苷酸探针。
[0028] 本文还公开了一种组合物,其包含:(a)可测定聚合物亚单位,其中该可测定聚合物亚单位为寡核苷酸,该寡核苷酸包含:(i)可变编码区;以及(ii)一个或多个连接体序列,其中该连接体序列能够与其他寡核苷酸杂交或共价附接。
[0029] 本文还公开了一种试剂盒,其包含:(a)一种或多种独特结合剂,其进一步包含表位特异性条码;(b)一组可测定聚合物亚单位,其用于细胞起源条码的组合合成;(c)酶偶联试剂或化学偶联试剂;以及(d)一组PCR扩增引物,其包括设计成与该组可测定聚合物亚单位中的每一个个体可测定聚合物亚单位杂交的引物;其中所述试剂盒提供对包含细胞混合物的样品检测和定量个体细胞中的靶分子的说明书和方法。
[0030] 在一些实施方案中,所述一种或多种独特结合剂包括抗体或抗体片段。在一些实施方案中,所述一种或多种独特结合剂包括能够与病毒基因组核酸序列杂交的核酸序列。在一些实施方案中,所述一种或多种独特结合剂包括能够与HIV病毒基因组核酸序列杂交的核酸序列。
[0031] 本文还公开了非暂时性计算机可读介质,其存储有提供对表位特异性条码-细胞起源条码缀合物组的测序数据进行解码和分组的分析能力的程序。在一些实施方案中,该程序进一步提供数据可视化工具。
[0032] 本公开内容还描述了用于检测靶RNA序列的方法、组合物和试剂盒,其包括:(a)使包含多个RNA序列的样品与寡核苷酸探针接触,其中该寡核苷酸探针包含能与靶RNA序列杂交的靶标识别区以及靶标特异性条码;(b)以顺序的方式将一个或多个可测定聚合物亚单位附接至所述寡核苷酸探针,以创建细胞起源条码;(c)进行逆转录反应,以创建包含所述细胞起源条码、靶标特异性条码、所述靶标识别区以及所述靶RNA序列的一部分或全部的cDNA拷贝的分子复合物;(d)进行扩增反应,以扩增该分子复合物;以及(e)对该扩增的分子复合物进行测序。
[0033] 在一些实施方案中,所述靶RNA序列为mRNA序列。在一些实施方案中,所述靶标识别区包含与所述靶RNA序列的一部分互补的序列。在一些实施方案中,所述靶标识别区包含聚-dT序列。在一些实施方案中,所述分子复合物进一步包含一种或多种引物。在一些实施方案中,所述引物中的一种或多种为扩增引物。在一些实施方案中,所述引物中的一种或多种为测序引物。在一些实施方案中,所述扩增反应为PCR反应。在一些实施方案中,所述PCR反应采用至少一种扩增引物,其包含与靶RNA序列的一部分或全部的cDNA拷贝互补的识别区和测序引物二者。在一些实施方案中,所述方法进一步包括在逆转录反应之后,向cDNA拷贝的3’端添加聚-dG尾,并且其中所述PCR反应采用包含聚-dC识别区和测序引物二者的至少一种扩增引物。在一些实施方案中,所述PCR反应采用包含与靶RNA序列的一部分或全部的cDNA拷贝互补的半随机识别序列和测序引物二者的至少一种扩增引物。在一些实施方案中,所述半随机识别序列被设计用于使从cDNA分子中对应于靶RNA序列的3’端的点起32至128个核苷酸内发生引发事件的可能性最大化。在一些实施方案中,所述半随机识别序列的设计基于cDNA序列,并且采取NNNXXX的一般形式,其中NNN为任意随机的一组三个核苷酸,而XXX为特定的一组三个核苷酸,其被选择为与从cDNA分子中对应于靶RNA序列的3’端的点起约64个核苷酸的位置处的cDNA序列互补。在一些实施方案中,所公开的方法进一步包括在进行PCR扩增之前添加一种或多种阻断寡核苷酸序列,其中阻断寡核苷酸与对应于管家基因或其他不想要的靶RNA序列的mRNA序列互补,由此防止不想要的扩增产物的形成。在一些实施方案中,所述样品包含单个细胞。
[0034] 本文还公开了用于扩增靶寡核苷酸序列的半随机引物,该引物包含(M)i(X)j(N)k形式的寡核苷酸序列,其中(M)i和(N)k为长度分别为i和k的任意随机寡核苷酸核苷酸序列,并且其中(X)j为长度为j的特定寡核苷酸序列,该特定寡核苷酸序列被选择为与相对于靶寡核苷酸序列的3’端的指定位置处的靶寡核苷酸序列互补。
[0035] 在一些实施方案中,选择(X)j,使得所述半随机引物在扩增反应中使用时与指定位置处的靶寡核苷酸序列杂交,并且该扩增反应产生长度约为Z个核苷酸的产物。在一些实施方案中,Z在50至1000之间。在一些实施方案中,Z在100至300之间。在一些实施方案中,Z为250。在一些实施方案中,i的值为0至6。在一些实施方案中,j的值为3至6。在一些实施方案中,k的值为0至6。
[0036] 援引并入
[0037] 本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如特别地和单独地指出每个单独的出版物、专利或专利申请通过引用而并入。附图说明
[0038] 本发明的新特征在随附的权利要求中具体阐述。通过参考以下对在其中利用到本发明原理的说明性实施方案加以阐述的详细描述和附图,将会获得对本发明的特征和优点的更好的理解,附图中:
[0039] 图1显示了分子复合物的一个实施方案的示意图,其包含独特结合剂(UBA)、表位特异性条码(ESB)以及组装以创建细胞起源条码(COB)的一系列可测定聚合物亚单位(APS)。
[0040] 图2显示了分子复合物的一个实施方案的示意图,其包含独特结合剂(UBA)、包含9个核苷酸代码的表位特异性条码(ESB)(下图)以及包含4个APS代码(SC1-SC4)的细胞起源条码(COB)。在该非限制性实例中,ESB通过与共价附接至UBA上的寡核苷酸连接体的互补区退火而附接至UBA(上图)。每个APS代码包含7个核苷酸代码(下图),在任一末端的侧翼为与夹板(splint)寡核苷酸(夹板6)互补的退火序列,该夹板寡核苷酸本身与ESB的互补区退火。在通过与夹板寡核苷酸退火而组合组装COB后,(在箭头指示的位置处)连接APS亚单位以形成包含ESB和COB的单个共价分子复合物。
[0041] 图3显示了所公开的方法和组合物的表位特异性条码和细胞起源条码的分子组件以及它们组装形成分子条码化复合物的图示。
[0042] 图4显示了所公开的方法和组合物的一个实施方案中的UBA-ESB组件的示意图,及其在检测个体细胞中的多个表位中的应用。在一些实施方案中,该UBA-ESB复合物进一步包含用于组装细胞起源条码的共同连接体(CL)。
[0043] 图5示出了用于创建独特细胞起源条码的裂分-合并合成途径的第一轮。在用多个UBA-ESB复合物处理细胞样品后,将样品分成一系列等份,并将第一APS偶联至个体细胞内结合的UBA-ESB复合物,其中用不同的APS处理每个样品等份。
[0044] 图6示出了用于创建独特细胞起源条码的裂分-合并合成途径的后续轮次。在图5所示的第一轮APS偶联后,将样品等份合并、混合并重新分配成新的一系列等份。然后将第二APS单元偶联至在第一偶联步骤中生成的结合的UBA-ESB-APS复合物,其中再次用不同的APS处理每个样品等份。进行反复轮次的样品等分、偶联反应和细胞样品合并的裂分-合并导致一组基本上独特的细胞起源条码的合成。
[0045] 图7示出了用于靶mRNA分子检测和条码化的邻近探针组的一个实例,该探针组包含一对寡核苷酸邻近探针15和19,每个探针均包含与靶mRNA序列互补的序列区,并且这一对探针可采用桥寡核苷酸20相接合,并且可进一步包含一个或多个引物序列、表位特异性条码区和用于采用本公开内容的组合物和方法创建独特细胞起源条码的共同连接体区。
[0046] 图8示出了用于靶向特定mRNA分子的邻近探针组的另一实例。
[0047] 图9示出了用于以独特细胞起源条码标记细胞内每次出现的靶mRNA分子的过程的实例。在该实例中,UBA包含与CD4mRNA杂交的序列特异性寡核苷酸探针。
[0048] 图10示出了用于靶mRNA分子检测和条码化的邻近探针组的另一实例,除了两个邻近探针序列之外,其还采用两个夹板分子和桥寡核苷酸。
[0049] 图11示出了用于创建图10所示的邻近探针组的寡核苷酸序列的非限制性实例。
[0050] 图12示出了用于靶mRNA分子检测和条码化的邻近探针组的另一非限制性实例,其采用单个组合的夹板-桥寡核苷酸来接合两个邻近探针。
[0051] 图13示出了用于创建图12所示的邻近探针组的寡核苷酸序列的非限制性实例。
[0052] 图14示出了用于靶mRNA分子检测和条码化的邻近探针组的另一非限制性实例,其采用单个组合的夹板-桥寡核苷酸来接合两个邻近探针。
[0053] 图15示出了用于将包含编码区SC1–SC4的APS组装成独特细胞起源条码的夹板寡核苷酸的非限制性实例。下图说明了用于对包含抗体或抗体片段的UBA进行条码化的寡核苷酸的一个实例。
[0054] 图16示出了用于将包含编码区SC1–SC3的APS组装成独特细胞起源条码的夹板寡核苷酸分子的非限制性实例。在所公开的方法和组合物的一些实例中,UBA可为抗体。在其他实例中,UBA可包含寡核苷酸探针序列,例如,对RNA或mRNA序列为特异性的寡核苷酸探针。所组装的细胞起源条码可进一步包含一个或多个扩增引物和/或测序引物序列。
[0055] 图17示出了用于将包含编码区SC1–SC3的APS组装成可包含PCR扩增引物和测序引物的独特细胞起源条码的夹板寡核苷酸分子的非限制性实例。
[0056] 图18示出了采用通用聚-T引物序列对mRNA分子进行条码化的方法的非限制性实例。
[0057] 图19示出了采用靶mRNA序列特异性引物将mRNA分子进行条码化的方法的非限制性实例。
[0058] 图20示出了用于将包含编码区SC1–SC3的APS组装成特定mRNA靶分子(或寡核苷酸标记的抗体)的独特细胞起源条码的邻近探针组和夹板寡核苷酸分子的非限制性实例。
[0059] 图21示出了通过将第二夹板分子(夹板SP-V5)与采用第一夹板分子(夹板SP-V4)组装的生长中的COB的5’端杂交而延长COB长度(即,子代码区的数目)的非限制性实例。
[0060] 图22示出了用于组装APS以创建靶mRNA分子的独特细胞起源条码的邻近探针组(包括可进一步包含“桥”序列和一个或多个“夹板”寡核苷酸分子的靶标特异性探针对)的非限制性实例,其中互补序列识别事件的数目及其邻近性要求组合起来提供提高的靶标检测特异性。
[0061] 图23示出了用于组装APS以创建靶mRNA分子的独特细胞起源条码的邻近探针组(包括可进一步包含桥序列和一个或多个夹板寡核苷酸分子的靶标特异性探针对)的其他非限制性实例,其中互补序列识别事件的数目及其邻近性要求组合起来提供提高的靶标检测特异性。
[0062] 图24示出了一个实施方案,其使用所公开的组合物和条码化方法来鉴别包含混合细胞群体的样品内的罕见细胞(例如,含有HIV病毒核酸序列的细胞)的亚群,并在所鉴别的亚群的个体细胞中检测特定的一组靶分子,例如蛋白X。
[0063] 图25示出了一个实施方案,其使用所公开的组合物和方法来对罕见细胞(例如,含有HIV病毒核酸序列的细胞)的条码化群体进行重新取样,以在个体细胞的基础上检测特定的一组靶分子,例如蛋白X,其中在进行条码化时,感兴趣的靶分子是未知的。
[0064] 图26示出了用于将自环化寡核苷酸条码附接至抗体或抗体片段的方法,其中该寡核苷酸经由连接体(左侧)或经由与连接寡核苷酸退火(右侧)而附接至蛋白质分子。寡核苷酸标记的抗体使得能够通过使用免疫PCR反应来检测低丰度的蛋白质,其中通过定量PCR或测序来扩增并检测与结合的抗体相对应的寡核苷酸条码。
[0065] 图27示出了采用含有可光解的键的发夹寡核苷酸结构,用独特细胞起源条码对每次出现的结合的抗体-EST(表位特异性标签)复合物进行条码化的过程的非限制性实例。
[0066] 图28示出了在图27所示的COB组装过程中使用的发夹形成寡核苷酸序列的非限制性实例。
[0067] 图29示出了用于鉴别含有一种或多种感兴趣的靶RNA分子的个体细胞的所公开方法的一个实施方案。包含靶标特异性寡核苷酸探针序列或聚-dT寡核苷酸探针序列的UBA附接至UBA代码序列(即ESB)。在与固定的透化细胞中的靶RNA序列杂交后,进行逆转录和条码化反应以创建包含用于鉴别起源细胞的独特细胞特异性条码的UBA-ESB-COB缀合物。在所公开的方法的一些实施方案中,使用还包含测序引物的靶标特异性引物来选择性地扩增与一种或多种感兴趣的靶RNA分子相关联的细胞起源条码,从而创建扩增产物,可对该扩增产物进行测序以解码RNA靶标的身份以及其中检测到靶RNA分子的个体细胞的身份。
[0068] 图30示出了用于鉴别含有一种或多种感兴趣的靶RNA分子的个体细胞的所公开方法的备选实施方案。包含靶标特异性寡核苷酸探针序列或聚-dT寡核苷酸探针序列的UBA附接至UBA代码序列(即ESB)。在与固定的透化细胞中的靶RNA序列杂交后,进行逆转录、聚-dG添加和条码化反应,以创建包含用于鉴别起源细胞的独特细胞特异性条码的UBA-ESB-COB缀合物。在该非限制性实例中,使用任选地还包含测序引物的聚-dC引物来扩增所有UBA-ESB-COB缀合物。然后,可使用进一步包含测序引物的靶标特异性引物来选择性地扩增与一种或多种感兴趣的靶RNA分子相关联的细胞起源条码,从而创建扩增产物,可对该扩增产物进行测序以解码RNA靶标的身份以及其中检测到靶RNA分子的个体细胞的身份。
[0069] 图31示出了用于鉴别含有一种或多种感兴趣的靶RNA分子的个体细胞的所公开方法的又一实施方案。包含靶标特异性寡核苷酸探针序列或聚-dT寡核苷酸探针序列的UBA附接至UBA代码序列(即ESB)。在与固定的透化细胞中的靶RNA序列杂交后,进行逆转录和条码化反应,以创建包含用于鉴别起源细胞的独特细胞特异性条码的UBA-ESB-COB缀合物。在所公开的方法的一些实施方案中,使用还包含测序引物的半随机引物(例如,具有序列NNNGAG)来选择性地扩增与一种或多种感兴趣的靶RNA分子相关联的细胞起源条码,从而创建扩增产物,可对该扩增产物进行测序以解码RNA靶标的身份以及其中检测到靶RNA分子的个体细胞的身份。选择该半随机引物的非随机部分,以使该引物将会在从聚-dT或靶标特异性序列(用来探测靶RNA)的位置起32至128个核苷酸的位置处与UBA-ESB-COB缀合物互补和杂交的可能性最大化,从而确保所扩增的产物具有适当的长度,以优化现代高通量测序系统的测序容量的有效利用。具体实施方案
[0070] 本公开内容是先前在公开的专利申请PCT/US2012/023411和PCT/US2013/054190中描述的方法、组合物和试剂盒的扩展,所述专利申请通过引用并入本文。特别地,本公开内容描述了用于检测单个细胞中的多种靶核酸序列,更具体地,检测单个细胞中的多种靶mRNA序列的方法、组合物和试剂盒,其采用设计用于使背景信号的非特异性杂交和扩增最小化的邻近探针,从而改善检测灵敏性和特异性。在一些实施方案中,将所公开的方法应用于检测包含复杂细胞混合物的生物样品中的选定细胞亚群内的多种靶mRNA序列。特别地,本公开内容描述了用于检测包含复杂细胞混合物的生物样品中选定细胞亚群内的单个细胞中的多种靶分子的方法、组合物和试剂盒。
[0071] 本公开内容提供了在先前公开的技术上的改进,所公开的方法提供了以下手段:(i)鉴别细胞群体内的死细胞、细胞碎片或细胞簇并将其从进一步分析中消除,从而改善针对复杂细胞混合物所收集的细胞特异性数据的质量,以及(ii)根据特异性细胞内或细胞外标志物的存在而鉴别复杂细胞混合物内的罕见细胞或选定细胞亚群,并将后续分析限制于选定的一组细胞,从而改善所收集的数据的特异性。
[0072] 单细胞水平下的多重测试是所公开的方法的关键优势,并且提供了许多潜在的益处,包括提高对个体细胞内的生理学过程的了解、降低对样品量的需求(与多重测量的数目成比例)、提高测试准确性(通过消除与重复测试相关的样品处理和测量误差)以及显著节省劳力和成本。
[0073] I.定义
[0074] 如本文所用的,短语“独特结合剂”(UBA)是指在所公开的方法中使用的多种检测试剂中的一种。每种UBA均能够与单个靶分子种类结合或杂交。正是结合或杂交的这种特异性使得能够检测给定个体细胞中的靶分子。
[0075] 如本文所用的,术语“表位”在更普遍的意义上用来指被独特结合剂识别的靶分子(包括但不限于蛋白质、肽、DNA、RNA、mRNA、寡核苷酸、脂质、碳水化合物和小分子)或靶分子的部分。与上文引用的公开专利申请一样,术语“表位”和“靶分子”在本文中可互换使用,以指代通过本文所述的方法检测和/或定量的感兴趣分子(或其部分)。
[0076] 如本文所用的,短语“表位特异性条码”(ESB)是指与特异性表位或靶分子相关联的独特代码。在一些实施方案中,ESB是能够编码靶分子的身份的分子或分子组装体。合适的ESB分子或分子组装体的实例包括但不限于肽序列、寡核苷酸序列、共价或非共价连接的但可区分的纳米颗粒串,等等。
[0077] 如本文所用的,短语“可测定聚合物亚单位”(APS)是指包含不同信息包的分子构件,其中该分子构件能够以有序的方式连接以创建细胞起源条码。合适的可测定聚合物亚单位的实例包括但不限于基酸、肽、寡核苷酸、纳米颗粒等。
[0078] 如本文所用的,短语“细胞起源条码”(COB)是指可测定聚合物亚单位的有序组装体,其创建编码个体细胞的身份的分子或分子组装体。合适的COB分子或分子组装体的实例包括但不限于肽序列、寡核苷酸序列、共价或非共价连接的但可区分的纳米颗粒串,等等。
[0079] 如本文所用的,短语“共同连接体”(CL)是指可直接或间接附接至UBA、ESB或APS亚单位以用于组装分子条码的连接体部分。
[0080] 如本文所用的,术语“夹板”是指用于组装APS以形成细胞起源条码的模板分子。在一些实施方案中,夹板(或模板,或退火引物)分子为寡核苷酸。
[0081] 如本文所用的,术语“子代码”(SC)是指包含在APS内的独特编码区和/或可检测分子,其中两个或多个APS的串联组合创建具有可检测代码或信号的单个COB,该可检测代码或信号将其与所有其他COB区分开来。
[0082] 如本文所用的,短语“终止代码”是指设计用于防止夹板或模板分子复制或扩增的夹板或模板分子的区段。
[0083] 如本文所用的,短语“组合合成”是指使得能够在包含最少数目的化学偶联步骤的单个过程中合成大量化合物(数十至数千至数十万个,或更多)的合成方法。
[0084] 如本文所用的,短语“裂分-合并合成”是指组合合成方法的一个实例,其中在进行偶联反应之前将反应混合物分成几个不同的等份,并且其中每个等份接收待偶联的不同单体或组分。偶联反应后,在进行下一轮偶联之前,将等份组合(合并)、混合并分配(裂分)成新的一组等份。
[0085] 如本文所用的,短语“邻近探针”是指能够与同一靶分子的不同区段杂交的一对探针分子中的每一个。在一些实施方案中,邻近探针可以是能够与同一靶寡核苷酸分子的不同区段杂交的寡核苷酸探针对。在一些实施方案中,被该探针识别的靶寡核苷酸的不同区段彼此紧邻。
[0086] 如本文所用的,短语“桥分子”(或“桥”)是指连接体分子,只有当两个对应的邻近探针与其相应的靶分子结合或杂交时,其才能与这两个对应的邻近探针结合或杂交。在一些实施方案中,桥分子是能够同时与一对寡核苷酸接近探针中的每一个杂交的寡核苷酸。
[0087] II.测定方法的概述
[0088] 本公开内容的方法、组合物和试剂盒提供了使用一组新型检测试剂和条码化试剂来检测单个细胞(包括选定的细胞亚群)中的多个靶分子的手段。在所公开的方法的一些实施方案中,能够检测来自选定细胞亚群的单个细胞中的多个靶分子。通常,该方法包括使用独特结合剂(UBA)来检测感兴趣的靶分子,使用表位特异性条码(ESB)来编码被UBA识别的靶分子的身份,以及使用可测定聚合物亚单位(APS)来创建鉴别个体细胞的独特细胞起源条码(COB),从而允许根据指定的一组生物标志物来确定包含复杂细胞混合物的样品中的选定细胞亚群,并随后将一个或多个靶分子的检测与选定细胞亚群中的个体细胞相关联。
[0089] 独特结合剂包括在所公开的方法中使用的检测试剂。每种UBA对于单个靶分子种类均是特异性的,并提供使得能够检测给定个体细胞中的靶分子的结合或杂交特异性。在所公开的方法的许多实施方案中,将细胞样品与一种或多种UBA一起温育(在细胞固定和/或透化之前或之后),随后冲洗掉未结合的UBA。然后,随后可使用表位特异性条码(ESB)鉴别与样品细胞之上或之内的靶分子结合的那些UBA。每种ESB均包含与特定靶分子的UBA相关联的独特代码(图1)。在所公开的方法的其他实施方案中,在进行测定之前将ESB(直接或间接地)附接至UBA。在一些实施方案中,在将样品与UBA一起温育(例如,作为测定程序的一部分)后,将ESB附接至UBA。
[0090] 除了用来鉴别特定靶分子的ESB之外,所公开的方法、组合物和试剂盒还提供了用于创建细胞起源条码的组件,该细胞起源条码提供将检测到的靶分子划归于特定个体细胞的手段。每个个体COB均包含与特定起源细胞相关的独特代码。因此,通过其相关ESB鉴别的个体细胞的UBA集合将共有共同COB,该共同COB与样品中所有其他细胞的COB不同。
[0091] 在一些实施方案中,COB由附接至结合的UBA-ESB复合物的两个或更多个可测定聚合物亚单位组成(图1),其中这组APS进一步包含一组子代码(SC)(图2)。每个SC均包含独特编码区和/或可检测分子,其中两个或多个APS的串联组合创建具有可检测代码或信号的个体COB,该可检测代码或信号将该个体COB与整套COB中的所有其他COB区分开来。本公开内容的某些方面涉及经由裂分-合并合成法(图3-6)通过将一系列APS连接在一起而进行的COB组合合成,其中可使用指定的一组APS和限定数目的裂分-合并偶联轮次合成的独特COB的总数显著大于样品中个体细胞的数目,从而确保任意两个个体细胞具有相同COB的可能性极低。
[0092] 如在上文引用的公开专利申请中所述,可采用多种技术进行ESB-COB复合物的解码,从而鉴别存在于样品的个体细胞中的靶分子。在一些实施方案中,通过扩增和测序来解码ESB-COB复合物。因此,本公开内容的某些方面提供了使用多个UBA-ESB复合物和一组APS对细胞进行条码化的方法,其中每个APS均包含独特的SC,并且其中对于给定的细胞,每个UBA-ESB-COB复合物的COB均相同,但与所有其他细胞的那些不同,并且其中整套ESB-COB复合物的扩增和测序允许对与样品或选定细胞亚群中的每个个体细胞相关的整套靶分子进行分类。在公开的方法、组合物和试剂盒的一些实施方案中,通过设计和使用靶标特异性或半随机扩增引物来实现感兴趣的UBA-ESB-COB复合物的选择性扩增,所述引物产生仅包含感兴趣的和适当长度的那些序列的扩增产物,从而优化现代高通量测序系统的测序容量的有效利用。
[0093] III.组合物
[0094] A.独特结合剂(UBA)
[0095] UBA是分子或分子组装体,其被设计成与至少一种靶分子或其部分结合或杂交,并且在适当条件下可形成包含UBA和靶分子的分子复合物。靶分子的实例包括但不限于蛋白质、肽、核酸、DNA、RNA、mRNA、脂质、碳水化合物、有机小分子、药物分子、有机单体和离子。为方便起见,大多数本文所述的方法、组合物和试剂盒都在UBA与靶蛋白或靶mRNA结合的语境下进行解释。但是,这些方法、组合物和试剂盒还可应用于其他靶分子。
[0096] 在一些实施方案中,UBA包含至少一个识别元件,该识别元件允许其与至少一种靶分子、至少一种靶分子的至少一部分、至少一种靶分子替代物、靶分子替代物的至少一部分或它们的组合发生结合或相互作用。UBA通常以序列特异性方式、构象特异性方式或二者组合的方式与靶分子结合或相互作用。合适的分子识别相互作用的实例包括但不限于抗体-抗原结合、受体-配体结合、适体-靶标结合、酶-底物识别、寡核苷酸探针-靶序列杂交等。相应地,适用于构建UBA的识别元件包括但不限于抗体、受体、酶、拟肽、适体、肽适体、核酸适体、寡核苷酸探针序列等。
[0097] 在一些实施方案中,UBA包含至少一个共同连接体(CL)元件,该元件允许其与编码靶分子的身份的ESB和/或编码特定个体分子的身份的COB相附接或杂交。共同连接体可直接或间接附接至UBA。在一些实施方案中,该共同连接体可为寡核苷酸分子。在一些实施方案中,该共同连接体可为共价附接至UBA的寡核苷酸序列,但在一些实施方案中,其可非共价地附接至UBA。
[0098] 在一些实施方案中,UBA进一步包含捕获区,该捕获区可用于UBA的分离和/或UBA在表面上的固定。在一些实施方案中,该捕获区可为亲和标签、珠子、载玻片或阵列。在一些实施方案中,该捕获区为相关联的ESB,例如,该ESB可为可检测的珠子,如具有独特光谱特征的珠子(例如,结合有发射可见光、近红外光或红外光的特定荧光团的珠子)。
[0099] 在一些实施方案中,UBA包括作为识别元件的抗体(图2)。如本文所用的,术语“抗体”在广义上使用,不仅包括完整的抗体分子,包括但不限于免疫球蛋白A、免疫球蛋白G和免疫球蛋白M,而且包括特异性地与至少一个表位结合的抗体分子的任何免疫反应性组分。这类免疫反应性组分包括但不限于Fab片段、Fab'片段、Fab'2片段、单链抗体片段(scFv)、迷你抗体(miniantibodies)、双抗体、交联抗体片段、AffibodyTM分子、环肽(cyclotides)分子等。使用抗体工程或蛋白质工程技术得到的免疫反应性产物也明显被包括在如本文所用的术语“抗体”的含义内。关于抗体和/或蛋白质工程的详细描述,包括相关方案,可见于例如J.Maynard和G.Georgiou,Ann.Rev.Biomed.Eng.2:339 76(2000);Antibody 
Engineering,R.Kontermann和S.Dubel编,Springer Lab Manual,Springer Verlag(2001);美国专利5,831,012;和Antibody Engineering Protocols,S.Paul,Humana Press(1995)。
[0100] 本领域技术人员将会理解抗体可从多种来源获得,包括但不限于多克隆抗体、单克隆抗体、单特异性抗体、重组表达的抗体、人源化抗体、植物抗体等;并且可从各种动物物种获得,包括兔、小鼠、山羊、大鼠、人、、豚鼠、鸡、绵羊、驴、人等。许多抗体可从多个供应商购买到,并且可从许多合约实验室获得定制的抗体。关于抗体的详细描述,包括关于生产和使用的相关方案,尤其可见于Current Protocols in Immunology,Coligan等人编,John Wiley&Sons(1999年,包括截至2003年8月的更新内容);The Electronic Notebook;Basic Methods in Antibody Production and Characterization,G.Howard和D.Bethel编,CRC Press(2000);Monoclonal Antibodies:Principles and Practice,第3版,J.Goding,Academic Press(1996);Using Antibodies,E.Harlow和D.Lane,Cold Spring Harbor Lab Press(1999);以及Monoclonal Antibodies:A Practical Approach,P.Shepherd和C.Dean,Oxford University Press(2000)。
[0101] 在一些实施方案中,本文所述的抗体附接至核酸,例如共同连接体寡核苷酸或包含寡核苷酸序列的ESB。同时包含连接体和ESB的寡核苷酸序列的一个非限制性实例为:
[0102] 5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT NNNNNNNNN CGTCAGACAGGGAGC-3’[0103] 其中NNNNNNNNN序列是对所附接的抗体而言为特异性的9个核苷酸的代码。用于将核酸与抗体相附接的方法是本领域公知的,并且任何合适的方法均包括在本文公开的方法、组合物和试剂盒中,例如,在一些实施方案中,可采用Gullberg等人,(2004),PNAS 101(22):228420-8424和Boozer等人,(2004),Analytical Chemistry 76(23):6967-6972中描述的方法将抗体与核酸分子相附接,二者均通过引用而并入本文。在一些实施方案中,可通过随机偶联至游离胺而将抗体与核酸分子相附接。在一些实施方案中,可采用10:1的核酸:抗体比例,通过随机偶联至游离胺而将抗体与核酸分子相附接。在一些实施方案中,可采用Kozlov等人,(2004),Biopolymers 5:73(5):621-630中描述的方法将抗体与核酸分子相附接,其在此通过引用而并入本文。在一些实施方案中,可采用肼化学法将抗体与核酸分子相附接。在一些实施方案中,可采用如Nolan(2005),Nature Methods 2:11-12中所述的“tadpoles”将抗体与核酸分子相附接,其在此通过引用而并入本文。通常,可采用包括本文所述方法在内的本领域已知用于生成工程化抗体的任何合适方法将抗体与核酸分子相附接。
[0104] 在公开的方法、组合物和试剂盒的一些实施方案中,UBA包含作为识别元件的核酸序列。核酸识别元件可包括靶标特异性识别序列,或通用靶标识别序列。合适的靶标识别序列的实例包括但不限于用于与普通mRNA分子杂交的聚-dT探针序列;用于与特定靶mRNA杂交的反义DNA探针序列,设计成与HIV病毒序列杂交的寡核苷酸序列,等等。核酸序列的长度优选为至少15个核苷酸,并且更优选为至少20个核苷酸。在一些实施方案中,靶标特异性识别序列的长度为约10至500、20至400、30至300、40至200或50至100个核苷酸。在其他实施方案中,靶标特异性序列的长度为约30至70、40至80、50至90,或60至100、30至120、40至140或50至150个核苷酸。
[0105] 在公开的方法、组合物和试剂盒的一些实施方案中,UBA包含成组的寡核苷酸探针,例如,一对邻近探针以及桥寡核苷酸序列,它们被设计为以比采用单个寡核苷酸识别序列可实现的更高的特异性与感兴趣的靶核酸分子例如mRNA分子杂交。使用桥分子(例如,桥寡核苷酸分子)的本公开内容的邻近寡核苷酸探针组的实例在图7、8、10和12中示出。本公开内容的寡核苷酸探针组的其他实例在图22和23中示出。在公开的方法和组合物的一些实施方案中,桥分子可并入用于组装COB的夹板分子中,并且其也可合并有一个或多个引物序列。
[0106] 参考图7作为示例,本公开内容的包含邻近探针组的UBA包含两个寡核苷酸序列,15和19,其每一个均被设计成与靶mRNA分子的互补区段杂交。通常,这两个邻近探针将被设计成与彼此紧邻的靶mRNA区段,例如,相隔N个核苷酸的两个靶序列区杂交,其中N的范围为
1至200个核苷酸。在许多实施方案中,该邻近探针中的一个或另一个将进一步包含表位特异性条码序列。在一些实施方案中,桥连寡核苷酸20被设计成与每一个个体邻近探针上的互补序列区杂交,从而形成特异性识别靶mRNA的分子复合物,并且其可进一步包含扩增引物序列和测序引物序列,以及/或者用于组装独特细胞起源条码的共同连接体。在一些实施方案中,通过在与桥连分子退火后进行连接而将两个邻近探针接合,从而形成可被扩增和测序的共价连接的分子复合物。在一些实施方案中,用于组装夹板分子和APS以形成COB的共同连接体位于探针复合物的5’端(图7)。在一些实施方案中,该共同连接体位于探针复合物的3’端(图8)。在一些实施方案中,靶标特异性探针组包含两个靶标特异性邻近探针,用于将包含SC的APS组装成独特COB的两个夹板分子,以及桥连分子(图10)。在一些实施方案中,该靶标特异性探针组包含两个靶标特异性邻近探针和自身用作夹板的桥连分子(图
12)。
[0107] 在一些实施方案中,所述UBA可进一步包含含有一个或多个引物的核酸序列,其中该引物用于特定UBA探针序列、ESB编码序列、COB序列或它们的组合的扩增和/或测序。任何合适的引物序列均可用于扩增和/或测序,例如,Illumina引物可用于对UBA-ESB-COB组装体或缀合物或其部分进行测序。
[0108] 在一些实施方案中,所述UBA可包含用于识别和结合基因组DNA或染色体DNA结构的非特异性结合剂,包括但不限于,例如,结合DNA或组蛋白的抗体,或ESB可与之附接的DNA嵌入分子如小檗碱、溴化乙锭、原黄素、道诺霉素、更生霉素、多柔比星、柔红霉素或沙利度胺。
[0109] 在一些实施方案中,所述UBA可包含针对蛋白质的非特异性结合剂,包括但不限于,例如,ESB可与之附接的选自琥珀酰亚胺酯、磺基琥珀酰亚胺酯、四氟苯基酯、磺基二氯苯酚酯、异硫氰酸酯和磺酰氯的胺反应性探针。
[0110] B.表位特异性条码(ESB)
[0111] 本公开内容的表位特异性条码提供了与特定靶分子相关的独特代码。ESB为分子或分子组装体,其被设计用于与UBA或其部分相附接或结合,并且在适当条件下可形成包含ESB、UBA和靶分子的分子复合物。
[0112] 在一些实施方案中,ESB包含至少一个共同连接体区,该共同连接体区允许其与至少一个UBA和/或至少一个APS通常以序列特异性方式、构象特异性方法或二者组合的方式结合或相互作用。ESB与其关联的UBA和/或APS之间的合适的分子结合相互作用的实例包括但不限于抗体-抗原结合、受体-配体结合、适体-靶标结合、酶-底物相互作用、寡核苷酸探针-靶序列杂交等。ESB与其关联的UBA和/或APS之间的相互作用通常由离子键合、氢键合或范德华力驱动。在一些实施方案中,ESB与关联的UBA和/或APS之间的附接可以是共价的。在一些实施方案中,该附接是非共价的。在一些实施方案中,在进行测定之前将ESB(直接或间接地)附接至UBA。在其他实施方案中,在将样品与UBA一起温育后将ESB与UBA结合或相附接,即,作为测定程序的一部分。
[0113] 在公开的方法和组合物的一些实施方案中,所述ESB包含编码所附接的UBA的身份的至少一个编码区。在一些实施方案中,该ESB为寡核苷酸序列,并且该编码区包含长度为5至15个核苷酸的寡核苷酸序列。在一些实施方案中,该编码区为长度为9个核苷酸的寡核苷酸序列(图2)。
[0114] 在许多实施方案中,所述ESB为进一步包含一个或多个引物的寡核苷酸序列,并且可采用任何核酸扩增方法来扩增ESB核酸序列的部分或全部,以及/或者关联的COB,该核酸扩增方法包括但不限于本领域公知的聚合酶链反应(PCR)、支链反应或滚环扩增方法。
[0115] 图26示出了用于将自环化寡核苷酸条码附接至抗体或抗体片段的方法的非限制性实例,其中该寡核苷酸经由连接体(左侧)或经由与连接寡核苷酸退火(右侧)而附接至蛋白质分子。寡核苷酸标记的抗体使得能够通过使用免疫PCR反应来检测低丰度的蛋白质,其中通过定量PCR或测序来扩增并检测与结合的抗体对应的寡核苷酸条码。
[0116] 在一些实施方案中,所述ESB进一步包含捕获区,该捕获区可用于UBA-ESB复合物的分离和/或UBA-ESB复合物在固体表面上的固定。在一些实施方案中,该捕获区可为亲和标签、珠子、载玻片或阵列。在一些实施方案中,该捕获区为ESB,例如,该ESB可为可检测的珠子,如具有独特光谱特征的珠子(例如,结合有发射可见光、近红外光或红外光的特定荧光团的珠子)。在一些实施方案中,该UBA直接或间接附接至ESB的捕获区。
[0117] C.细胞起源条码(COB)
[0118] 本文公开的方法、组合物和试剂盒进一步提供了用于创建细胞起源条码的手段,其中每个COB均提供可与特定起源细胞相关的独特代码。在一些实施方案中,COB与一个或多个结合的UBA-ESB复合物的附接(例如,采用共同连接体寡核苷酸)鉴别出UBA/ESB复合物所结合的靶分子的起源细胞。在一些实施方案中,本公开内容的COB为分子实体(或组装体、复合物或缀合物),其可包含(i)能够与关联于UBA-ESB复合物的共同连接体寡核苷酸杂交的共同连接体序列,(ii)与特定起源细胞相关的独特代码,以及(iii)一个或多个引物序列,或它们的组合。
[0119] 在一些实施方案中,COB是由两个或更多个APS组成的模化结构。在一些实施方案中,COB是由以线性组合的方式附接的两个或更多个APS组成的模块化结构。在一些实施方案中,该COB包含以线性组合的方式附接的多个APS,其中该APS包含确定分子量的小分子。在一些实施方案中,该COB包含以线性组合的方式附接的2、3、4、5、6、7、8、9、10个或更多个独特APS。在一些实施方案中,如在上文引用的公开专利申请中更全面描述的,COB包含若干个APS的线性组合,例如四个APS的线性组合,它们采用裂分-合并组合合成法组装(图4-6)。相邻APS的线性附接可采用多种技术来实现,例如,通过化学偶联相邻APS,或通过将个体APS与包含设计成与个体APS上的互补序列区退火的两组或更多组序列区的模板(夹板)核酸分子杂交,随后连接相邻的APS。模板核酸分子或夹板可包含至少一个核酸序列,如以下的至少一部分:线性病毒基因组或可被制成线性的病毒基因组,例如,腺病毒、肝炎病毒、疱疹病毒、轮状病毒等的基因组;噬菌体,如λ、M13、 T系列噬菌体等,包括包含克隆盒、多连接体等的其衍生物;质粒,如pBR322和pUC系列质粒等,包括包含克隆盒、多连接体等的其衍生物;合成模板;包含人工序列的模板;等等。本领域技术人员将会理解,基本上任一段核酸都可充当用于制备COB的模板,只要其大小足以包括用于至少两个APS的退火区,或者其可与至少一个其他核酸序列组合,使得该组合的序列的大小足以包括用于至少两个APS的退火区。
[0120] 在一些实施方案中,模板或夹板分子的APS识别序列组各自被包含1、2、3个或更多个碳原子的连接体隔开,该连接体充当聚合酶活性的“终止”信号或终止代码,从而防止核酸扩增步骤期间整个模板分子的不想要的扩增。
[0121] 在一些实施方案中,多个APS可包括一组独特设计的包含一个或多个子代码(SC)区的核酸序列,其中对于所述多个APS中的每个个体APS而言,该子代码序列均是独特的。在一些实施方案中,该SC区或序列的长度为约3、4、5、6、7、8、9、10个或超过10个核苷酸。在一些实施方案中,该子代码包含独特的一组具有限定长度、例如7个核苷酸的核酸序列(图2),其被设计用于提供错误校正能力。在一些实施方案中,这组子代码包含7个核苷酸的序列,该序列被设计为使得该组中序列的任何成对组合均表现出限定的“遗传距离”,或错配碱基的数目,例如,距离为3。在这种情况下,对在测定的最终步骤中鉴别的COB组中的子代码的考察允许在进行测定数据的最终分析之前检测杂交或扩增错误。
[0122] 在一些实施方案中,所述APS进一步包含一个或多个共同连接体(CL)区或序列(例如,共同连接体寡核苷酸),以便促进该APS彼此之间的附接,或与ESB或与用于组装COB的模板分子的附接。因此,在一些实施方案中,该共同连接体区包含设计成与模板分子上的互补序列杂交的退火区。该共同连接体可直接或间接地附接至APS分子的剩余部分,并且促进该APS共价或非共价地组装成COB。在一些实施方案中,该共同连接体序列可包含长度为约10个至约25个核苷酸的寡核苷酸序列或串联重复序列。在一些实施方案中,该APS包含在SC区侧翼的两个共同连接体序列。在一些实施方案中,共同连接体序列还可附接在COB的5'端或3'端,并且可用于例如通过将与该共同连接体序列互补的序列附接至固体支持体或基底而将COB捕获并固定在表面上,以用于检测或成像目的。
[0123] 在一些实施方案中,所述APS或CL进一步包含允许随后对所检测到的COB的数目进行定量的随机标签区。用于制备和使用这类随机标签区的方法是本领域已知的,例如,参见Casbon等人(2011),Nucleic Acids Research 39(12):e81。该随机标签区可充当分子计数器,用来估计与每个序列变体相关联的模板分子的数目。在一些实施方案中,在进行扩增反应例如PCR扩增之前,将分子计数器并入ESB、APS、CL或组装的COB中。可将包含简并碱基区(DBR)的分子计数器文库并入ESB、APS、CL或组装的COB中。文库中独特DBR的数目通常受该DBR的长度和碱基组成所限制。例如,包含单个核苷酸的DBR将会允许四种不同的可能计数器,每个碱基一种。可通过使用更长的DBR,例如,对应于48=65,536个独特序列的八核苷酸DBR,实现更大的独特计数器序列文库。分子计数器可用于确定序列变体是否与单个模板分子相关联,或者可替代地,是否与多个模板分子相关联。因此,与一个序列变体相关联的不同DBR序列的数目可充当初始模板分子数目的直接量度。该信息可补充或替代由每个序列变体的读取数目所提供的信息,该读取数目包括,例如,在进行PCR扩增反应后获得的读取数目。DBR还可用于确定序列变体来源于扩增反应期间的聚合酶错误,或者其为在进行PCR扩增反应之前存在的真正原始变体的可能性。
[0124] 在一些实施方案中,COB的元件可存在于单个分子实体(单COB)或两个不同的分子实体(双COB)中。每个分子实体可由一个分子或通过共价或非共价方式彼此附接的多于一个分子组成。在一些实施方案中,双COB的每个组件具有与相同靶分子上的不同位点结合的靶分子特异性UBA-ESB复合物。当使用双COB系统时,其中一个COB可以是如下所述标记的或未标记的。在一些实施方案中,未标记的COB可包含捕获区。
[0125] 在一些实施方案中,设计成与SC杂交的互补寡核苷酸序列用于将可检测分子例如标记物或标记物单体与COB的每个SC相附接。例如,可通过将一个或多个可检测的标记物分子共价并入该互补寡核苷酸序列中而直接标记该互补寡核苷酸序列。或者,例如,可通过将生物素或其他能够提供特异性的高亲和力配体相互作用的分子并入该互补寡核苷酸序列中而间接标记该互补寡核苷酸序列。在这类情况下,该配体(例如,在生物素并入的情况下为抗生物素蛋白或链霉亲和素)可共价附接至可检测分子。在与SC相附接的可检测分子没有直接并入互补寡核苷酸序列中的情况下,该互补序列充当该可检测分子与SC之间的桥,并且可被称为桥连分子,例如,桥连核酸。
[0126] 可以用多种标记物或标记物单体中的任一种,例如,放射性同位素、荧光团、染料、酶、纳米颗粒、质量标签、化学发光标记、生物素或本领域已知的其他标记物或标记物单体(它们可直接(例如,通过光发射)或间接(例如,通过荧光标记抗体的结合)检测),来标记本公开内容的COB和组成该COB的APS分子。在一些实施方案中,用一种或多种标记物单体标记COB中的一个或多个SC,并且由附接至COB的SC的标记物单体所提供的信号构成鉴别出UBA(或UBA-ESB-COB)所结合的靶标(或细胞)的可检测代码。在一些实施方案中,来自SB的给定信号的缺乏(例如,暗点)也可构成可检测代码的一部分。可与本文所述的COB一起使用的标记物单体的其他实例,以及用于将标记物单体并入COB中的方法,在美国专利7,473,767和第10/542,458、12/324,357、11/645,270和12/541,131号美国申请中描述,其通过引用而全文并入本文。
[0127] D.引物
[0128] 在公开的方法、组合物和试剂盒的一些实施方案中,使用靶标特异性引物、通用引物、半随机引物或其组合选择性地扩增感兴趣靶标的UBA-ESB-COB复合物,以便优化用于检测和定量个体细胞中的靶分子的测序反应的成本效益和通量。
[0129] 所公开的方法、组合物和试剂盒的靶标特异性引物的一个实例在图29中示出,并且其包含位于该分子的5’端附近的测序引物区(“引物1”),以及位于该分子的3’端附近的靶标特异性序列区。在一些实施方案中,该测序引物区包括Illumina测序引物序列。通常,该测序引物区的长度将为约18至30个核苷酸。在一些实施方案中,该测序引物区的长度将为20至25个核苷酸。该靶标特异性序列区被设计成与感兴趣的靶序列互补。通常,该靶标特异性序列区的长度将为6至30个核苷酸。在一些实施方案中,该靶标特异性序列区的长度将为18至22个核苷酸。在一些实施方案中,该测序引物区和靶标特异性序列区将会相隔长度为0至30个核苷酸的连接体区。
[0130] 所公开的方法、组合物和试剂盒的通用引物的一个实例在图30中示出,并且其包含位于该分子的5’端附近的测序引物区(“引物1”),以及位于该分子的3’端附近的聚-C序列区。在一些实施方案中,该测序引物区包括Illumina测序引物序列。通常,该测序引物区的长度将为约18至30个核苷酸。在一些实施方案中,该测序引物区的长度将为20至25个核苷酸。该聚-C序列区被设计成与在靶RNA序列的逆转录之后添加至靶标-UBA-ESB-COB复合物的3’端的聚-G序列互补。在一些实施方案中,该聚-C序列区的长度为4至30个核苷酸。在一些实施方案中,该聚-C序列区的长度为6至20个核苷酸。在一些实施方案中,该聚-C序列区的长度为6至12个核苷酸。在一些实施方案中,该测序引物区和聚-C序列区序列区将会相隔长度为0至30个核苷酸的连接体区。
[0131] 所公开的方法、组合物和试剂盒的半随机引物的一个实例在图31中示出,并且其包含位于该分子的5’端附近的测序引物区(“引物1”),以及位于该分子的3’端附近的半随机序列区(例如,“NNNGAG”),其中NNN为随机的三核苷酸序列。在一些实施方案中,该测序引物区包括Illumina测序引物序列。通常,该测序引物区的长度将为约18至30个核苷酸。在一些实施方案中,该测序引物区的长度将为20至25个核苷酸。在一些实施方案中,该半随机序列为(M)i(X)j(N)k的形式,其中(M)i和(N)k为长度分别为i和k的任意随机寡核苷酸核苷酸序列,并且其中(X)j为长度为j的特定寡核苷酸序列,该特定寡核苷酸序列被选择为与相对于靶寡核苷酸序列的3’端在指定位置处的靶寡核苷酸序列互补。在一些实施方案中,i和k的值可为0至6。在一些实施方案中,j的值可为3至6。在一些实施方案中,该半随机引物被设计成与相对于靶序列的3’端在指定位置处的靶寡核苷酸序列互补,从而产生长度为约Z个核苷酸的扩增产物,并且其中Z的值可为50-1000。在一些实施方案中,该半随机序列被设计成与cDNA序列部分地互补,该cDNA序列在从靶RNA序列的cDNA拷贝与UBA探针序列之间的接合处起约64个核苷酸的位置处。在一些实施方案中,该半随机序列被设计成与cDNA序列部分地互补,该cDNA序列在从靶RNA序列的cDNA拷贝与原始UBA探针序列的接合处起128至32个核苷酸的位置处。在一些实施方案中,该半随机序列的非随机部分的长度为2至10个核苷酸。在一些实施方案中,该半随机序列的非随机部分的长度为3至6个核苷酸。在一些实施方案中,该半随机序列的随机部分的长度为2至10个核苷酸。在一些实施方案中,该半随机序列的随机部分的长度为3至6个核苷酸。在一些实施方案中,该测序引物区和半随机序列区将会相隔长度为0至30个核苷酸的连接体区。
[0132] IV.方法
[0133] A.细胞与UBA-ESB复合物的温育
[0134] 在所公开的方法的许多实施方案中,在适合与个体细胞的表面上或个体细胞内的特定分子靶标结合或杂交的条件下,将细胞悬浮液或样品与一种或多种UBA-ESB复合物一起温育。在一些实施方案中,一个或多个感兴趣的靶标可为细胞内靶标,并且可采用本领域已知的任意方法将细胞固定并透化,例如,通过向细胞样品添加冷甲醇并温育较短的一段时间,随后吸出甲醇、冲洗并用牛血清白蛋白酪蛋白溶液封闭,之后与UBA-ESB一起温育。
[0135] B.细胞起源条码(COB)的组装
[0136] 用于对单个细胞进行条码化以及组装相关的细胞起源条码的方法先前已在公开的专利申请PCT/US2012/023411和PCT/US2013/054190中描述,所述专利申请通过引用并入本文。可通过包括本文简要描述的方法在内的本领域已知的任何合适的方法进行COB组装或合成。在一些实施方案中,可通过逐步添加包含寡核苷酸的可测定聚合物亚单位(APS)来组装COB。在一些实施方案中,COB经由共同连接体(CL)附接至UBA-ESB复合物,该共同连接体自身可为寡核苷酸,并且其可为APS自身的一部分,或单独的分子组件。在一些实施方案中,ESB、APS和CL都可包含寡核苷酸序列。因此,在通过ESB、APS和CL上的互补或基本上互补的退火区之间的杂交而组装后,可连接组装的寡核苷酸,以在ESB-APS、相邻APS或相邻APS-CL单元之间形成共价键。可在寡核苷酸ESB、APS或CL的任一端或两端上提供退火区。
[0137] 在一些实施方案中,通过进行一轮或多轮裂分合并合成而将APS添加至结合的UBA-ESB,其中每一轮均包括将细胞样品裂分成多个等份,将每个等份与不同APS(包含不同SC)一起温育以允许APS与生长中的UBA-ESB-APS链之间的互补序列的退火,连接(在寡核苷酸ESB和APS的情况下),冲洗,以及等份的合并。如果APS不包含并入的CL区,则该循环还可包括温育步骤,其中使CL与生长中的UBA-ESB-APS链退火。在一些实施方案中,可将对于逐步合成的每个步骤为特异性的退火区并入该反应的寡核苷酸组分中。在这种情况下,使用步骤特异性退火区可使其中先前添加步骤失败的对于任意细胞的COB的进一步组装停止。
[0138] 通过进行逐步裂分-合并组装和合成可实现的COB文库的多样性(即,理论上可能的独特COB的数目)取决于可用于每一轮的独特APS的数目,以及用于组装COB的轮次总数。例如,对于采用两轮组装/合成和10种独特APS创建的COB(即,对于具有两个APS位置的COB),独特COB序列的总数为210=1,024。或者,对于采用四轮组装/合成和10种独特APS创建的COB(即,对于具有四个APS位置的COB),独特COB序列的总数为410=1,048,576。通常,期望设计COB文库,使得可用的独特条码的总数显著大于待标记的个体细胞的数目,从而确保任意两个细胞用相同细胞起源条码标记的可能性极低。
[0139] 在一些实施方案中,使用退火引物(即,模板分子或“夹板”)将APS缝合在一起和/或与CL相缝合。该退火引物可包含与CL或前一轮逐步合成期间添加的APS互补的第一互补区。该退火引物还可包含与当前轮次正在添加的APS互补的第二互补区。因此,该退火引物可与连续轮次的两个寡核苷酸亚单位杂交,从而将它们缝合在一起。在一些实施方案中,每一轮次的退火引物的第一互补区均与其他轮次的退火引物的第一互补区不同。在一些实施方案中,每一轮次的退火引物的第二互补区均与其他轮次的退火引物的第二互补区不同。在一些实施方案中,不同轮次的退火引物的第一或第二互补区在轮次之间共享。在一些实施方案中,使用模板或“夹板”(即,延伸的CL分子)组装APS,其中该夹板包含多组退火区,该多组退火区被设计成允许个体APS的逐步杂交和连接以创建完整的COB。
[0140] 在一些实施方案中,CL或“夹板”寡核苷酸包含一对或多对环退火区。相应地,可将APS设计成与CL或夹板杂交以创建环几何结构,即,通过在CL的每一端与环退火区杂交。在一些实施方案中,可将环退火区设计成对裂分-合并合成的轮次而言是特异性的,使得连续轮次的添加和杂交沿着夹板填充APS位置。随后可采用任何本领域已知的方法,例如,通过连接,将APS连接在一起。在一些实施方案中,可将APS设计用于确保其不在对其他合成轮次为特异性的环退火区处与夹板有效杂交。因此,如果来自特定轮次的APS由于一些原因而丢失,则在后续轮次添加的APS不大可能正确地连接,由此降低了下游分析错误的可能性。或者,即使APS丢失,偶尔也可能合成COB,该COB的位置的侧翼是一对环退火区。然后可相应地分析所得的COB,并可将其丢弃或者可以备选地处理所检索到的信息。
[0141] 图15示出了用于将APS组装成包含编码区SC1–SC4的独特细胞起源条码的夹板寡核苷酸分子的一个实例。下图说明了用于对抗体或抗体片段进行条码化的寡核苷酸的一个实例,但其同样适用于包含寡核苷酸探针的UBA。
[0142] 图16-19示出了用于将APS组装成包含编码区SC1–SC3并进一步包含扩增引物和/或测序引物的独特细胞起源条码的夹板寡核苷酸分子的实例。在一些实施方案中,该测序引物可包括Illumina测序引物。还示出了进一步包含9个核苷酸的表位特异性条码区的、用于将寡核苷酸与抗体附接的寡核苷酸连接体序列的实例(图17)。在一些实施方案中,可通过与包含荧光团的寡核苷酸检测探针杂交来检测细胞起源条码序列的一部分或全部(图17,上图)。
[0143] 图21示出了通过将第二夹板分子(夹板SP-V5)与采用第一夹板分子(夹板SP-V4)组装的生长中的COB的5’端杂交而延长COB长度(即,子代码区的数目)的实例。在该实例中,使用包含SC区和测序引物(SeqP1)二者的修饰的APS创建第三编码区(SC3’),从而提供与第二夹板(夹板SP-V5)杂交的5’序列。更大数目的子代码区的使用使得能够创建数目大得多的用于标记来自个体细胞的mRNA或蛋白质靶分子的独特细胞起源条码。在一些实施方案中,使用更长长度的单个夹板寡核苷酸来组装更大数目的APS以创建COB。
[0144] 图27示出了采用包含含有可光解的键的发夹寡核苷酸结构的APS,用独特细胞起源条码对每次出现的结合的抗体-EST(表位特异性标签,或表位特异性条码)复合物进行条码化的过程的非限制性实例。将包含含有第一编码区SC1的发夹结构的APS与附接至结合的抗体的EST退火并连接。在退火并连接后,将样品暴露于UV(300nm)光以使可光解的键断裂,从而创建可用于与下一个APS发夹杂交的游离5’-磷酸末端序列。采用上述裂分-合并合成方法,利用重复轮次的退火、连接和UV光暴露来创建一组独特COB。在图27所示的非限制性实例中,最终APS发夹结构包括Illumina引物序列。用于创建图27所示方法的发夹结构的这组寡核苷酸序列的非限制性实例在图28中示出。
[0145] C.用于检测条码的方法
[0146] 用于扩增和检测表位特异性条码和细胞起源条码的方法已在公开的专利申请PCT/US2012/023411和PCT/US2013/054190中更全面地描述,所述申请通过引用而并入本文。在一些实施方案中,对组装的UBA-ESB-COB或ESB-COB产物进行扩增,并任选地将结果与来自参比样品的相似靶核酸的扩增进行比较。可通过本领域已知的任何方法进行核酸扩增。在一些情况下,通过聚合酶链反应(PCR)来扩增连接的产物。可使用的PCR技术的实例包括但不限于定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时PCR(RT-PCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、实时限制性片段长度多态性PCR(RT-PCR-RFLP)、热启动PCR、巢式PCR、原位聚合酶群落(polonony)PCR、原位滚环扩增(RCA)、桥式PCR、picotiterPCR和乳液PCR。其他合适的扩增方法包括连接酶链反应(LCR)、转录扩增、自动维持序列复制、靶多核苷酸序列的选择性扩增、共有序列引物聚合酶链反应(CP-PCR)、任意引物聚合酶链反应(AP-PCR)、简并寡核苷酸引物PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可用的其他扩增方法包括美国专利5,242,794、5,494,810、4,988,617和6,582,938中描述的方法。在一些实施方案中,扩增在细胞内进行。
[0147] 在公开的方法、组合物和试剂盒的一些实施方案中,使用靶标特异性引物或半随机引物来选择性地扩增感兴趣靶标的UBA-ESB-COB复合物,以便优化用于检测和定量个体细胞中的靶分子的测序反应的通量并使其运行成本最低。
[0148] 在一些实施方案中,使用如图29所图示的靶标特异性引物来选择性地扩增与感兴趣的靶标或一组靶标相关的那些细胞起源条码,从而减少花费在对与例如管家基因转录物及其他常见转录物相关的条码化物质进行测序上的测序容量的量。
[0149] 在一些实施方案中,使用如图30所图示的通用引物来预扩增所有条码化的物质,随后采用一种或多种靶标特异性引物进行选择性扩增,以扩增与感兴趣的靶标或一组靶标相关的那些细胞起源条码,从而减少花费在对与例如管家基因转录物及其他常见转录物相关的条码化物质进行测序上的测序容量的量。
[0150] 在一些实施方案中,使用如图31所图示的半随机引物来选择性地扩增与感兴趣的靶标或一组靶标相关的那些细胞起源条码,从而减少花费在对与例如管家基因转录物及其他常见转录物相关的条码化物质进行测序上的测序容量的量。该半随机序列被设计成在从靶RNA序列的cDNA拷贝与原始UBA探针序列之间的接合处起约64个核苷酸的位置处与cDNA序列部分地互补(经由该序列的非随机部分),从而确保扩增产物的长度与商用高通量测序系统的读取长度大致相同,以确保测序容量和通量的最优利用。在一些实施方案中,该半随机序列被设计成在从靶RNA序列的cDNA拷贝与原始UBA探针序列的接合处起128至32个核苷酸的位置处与cDNA序列部分地互补。
[0151] 在任意实施方案中,可通过测序实现UBA-ESB-COB、ESB-COB或COB文库的检测或定量分析。可通过本领域已知的任何适当方法或系统,例如通过采用Illumina HiSeq 2000测序系统,经由所有寡核苷酸标签的完全测序来检测APS亚单位或整个COB。可通过本领域公知的经典Sanger测序方法实现测序。还可采用高通量测序系统和/或新一代测序系统实现测序,其中一些测序系统允许在经测序的核苷酸掺入生长链之时或之后立即检测该经测序的核酸,即,实时或基本实时地检测序列。在一些情况下,高通量测序每小时生成至少1,000、至少5,000、至少10,000、至少20,000、至少30,000、至少40,000、至少50,000、至少100,
000或至少500,000个序列读取;其中每个读取为每个读取至少50、至少60、至少70、至少80、至少90、至少100、至少120、至少150、至少200或至少250个碱基。
[0152] D.多重测试
[0153] 在某些实施方案中,在多重分析中执行检测方法,其中在同一分析(即,在单一反应混合物中)中检测多个靶分子。在一些实施方案中,该分析是杂交分析或亲和结合分析,其中同时检测多个靶分子。在一些实施方案中,该分析是杂交分析或亲和结合分析,其中在单细胞中同时检测多个靶分子。在某些实施方案中,在同一分析中检测的多个靶分子是至少2个不同的靶分子、至少5个不同的靶分子、至少10个不同的靶分子、至少20个不同的靶分子、至少50个不同的靶分子、至少75个不同的靶分子、至少100个不同的靶分子、至少200个不同的靶分子、至少500个不同的靶分子,至少750个不同的靶分子或至少1,000个不同的靶分子。在其他实施方案中,在同一分析中检测的多个靶分子是最多达5个不同的靶分子、最多达10个不同的靶分子、最多达20个不同的靶分子、最多达50个不同的靶分子、最多达100个不同的靶分子、最多达150个不同的靶分子、最多达200个不同的靶分子、最多达500个不同的靶分子、最多达750个不同的靶分子、最多达1,000个不同的靶分子、最多达2,000个靶分子或最多达5,000个靶分子。在另外其他的实施方案中,所检测的多个靶分子处于前述不同靶分子的数目之间的任何范围内,例如但不限于20至50个不同的靶分子、50至200个不同的靶分子、100至1000个不同的靶分子、500至5000个不同的靶分子等等。
[0154] E.定量检测
[0155] 除了由本公开内容的UBA-ESB-COB复合物提供的定性分析能力及基于其的分析技术之外,在一些实施方案中,该UBA-ESB-COB还可独特地适用于进行定量分析。通过提供在UBA-ESB-COB与其相关的靶分子之间的1:1结合化学计量,例如在UBA-ESB复合物包含用于独特地标记靶分子的每个实例的短随机序列(图10)的实施方案中,可鉴别出样品中存在的靶分子的全部或代表性部分,并对其进行计数。各个分子种类的这种单独计数提供了用于确定生物样品中靶分子的绝对或相对浓度的准确且直接的方法。此外,寻址和计数单个分子的能力允许利用测定小型化的益处,包括高灵敏性、最低样品量需求、由小体积中的溶液相动力学提供的快速反应速率,以及最终非常低的试剂成本。
[0156] F.mRNA靶分子的检测
[0157] 用于检测特定mRNA靶分子以及用独特细胞起源条码对其每次出现进行标记的过程的非限制性实例在用于检测CD4mRNA的图9中示出。将CD4反向引物添加至已固定并透化的细胞样品并使其退火,随后进行逆转录(RT)反应以创建CD4mRNA分子的一部分的cDNA拷贝。在去除mRNA分子(例如,通过用RNA酶H处理)后,使夹板衔接子与该cDNA退火。该夹板衔接子用于使夹板分子退火,随后使用该夹板分子以组合的方式组装包含SC区的两个或多个APS(包含代码SC1-SC3的三个APS在图9中示出),以创建独特COB。在一些实施方案中,用于与靶分子杂交的反向引物包括对靶核酸分子为特异性的序列识别区(图18)。在一些实施方案中,该序列识别区的长度为10至20个核苷酸。在一些实施方案中,该序列识别区为六聚体(图19)。在一些实施方案中,该寡核苷酸探针被设计成通过例如采用聚-T序列识别区与普通mRNA分子非特异性地杂交(图17)。在一些实施方案中,该夹板分子还用于添加一种或多种扩增引物和/或测序引物。在一些实施方案中,使退火的分子复合物经历连接,以创建可被扩增和测序的共价分子组装体。
[0158] 图18示出了采用通用聚-T(或聚-dT)引物序列对mRNA分子进行条码化的方法的非限制性实例。在将聚-T引物序列添加至细胞样品后,进行逆转录反应,随后使“夹板”寡核苷酸退火并用于将包含编码区SC1-SC3的APS组装成可采用Illumina引物扩增和测序的独特细胞起源条码。
[0159] 图19示出了采用靶mRNA序列特异性引物将mRNA分子进行条码化的方法的非限制性实例,该引物例如
[0160] GCTCCCTGTCTGACG XXXXXXXXXXX
[0161] 在将序列特异性引物添加至细胞样品后,进行逆转录反应,随后使“夹板”寡核苷酸退火并用于将包含编码区SC1-SC3的APS组装成可采用Illumina引物扩增和测序的独特细胞起源条码。在一些实施方案中,可在采用Illumina引物扩增和测序之前,使用内部引物进行一轮或多轮巢式PCR扩增。在一些实施方案中,六聚体引物,例如
[0162] GCTCCCTGTCTGACG NNNNNN
[0163] 用于与靶mRNA分子杂交。
[0164] 在一些实施方案中,采用邻近探针组检测靶mRNA分子,该邻近探针组的组合物如上所述。通过创造两个序列识别事件同时发生并且彼此紧邻的要求,一对邻近寡核苷酸探针(每一个均包含与相同靶mRNA的非重叠但紧密间隔的序列区互补的靶标识别序列)的使用提供了减少的非特异性探针杂交和提高的靶标检测特异性。
[0165] 图7示出了用于靶mRNA分子(或普通RNA分子)检测和条码化的邻近探针组(即,UBA)的一个实施方案,该探针组包含一对寡核苷酸邻近探针15和19,每个探针均包含与靶mRNA序列互补的序列区,并且随后可采用桥寡核苷酸(20)将其接合。该邻近探针可进一步包含一个或多个引物序列、表位特异性条码区和/或用于采用本公开内容的组合物和方法创建独特细胞起源条码的共同连接体区。将邻近探针组添加至已固定并透化的细胞样品,使该探针与靶mRNA分子退火,随后将其连接以创建含有表位特异性条码(即靶标特异性条码)和允许扩增整个复合物的引物的分子复合物。可冲洗掉未结合的探针分子,并且可采用上述裂分-合并合成法对样品的个体细胞进行条码化。在细胞条码化程序之后,采用PCR扩增或其他任何合适的核酸扩增技术扩增包含UBA-ESB-COP的分子复合物,并进行测序,以基于个体细胞来鉴别和定量哪些mRNA分子存在于样品中。
[0166] 图8示出了使用邻近探针组来用独特COB对特定靶mRNA分子进行条码化的另一实施方案。在该实施方案中,如图7的实例所示,安排引物和共同连接体的位置,使得COB附接至探针复合物的3’端而不是5’端。
[0167] 图10示出了用于靶mRNA分子检测和条码化的邻近探针组的另一实施方案,除了两个邻近探针序列之外,其还采用两个夹板分子和桥寡核苷酸。每个夹板分子均包含与一个邻近探针互补的序列区,以及与桥寡核苷酸的一部分互补的序列区。在该实例中,表位特异性条码被RNA特异性代码(RSC)区替代,两个邻近探针上各一个,该RNA特异性代码区包含用于鉴别被邻近探针识别的mRNA序列的7核苷酸代码。该邻近探针可进一步包含用于扩增和测序的引物序列。每个邻近探针还可包含用于测序和扩增偏倚校正的短随机序列区。用于创建图10的邻近探针组的寡核苷酸序列的实例在图11中示出。
[0168] 图12示出了用于靶mRNA分子检测和条码化的邻近探针组的另一实施方案,其采用单个组合的夹板-桥寡核苷酸来接合两个邻近探针。用于创建图12的邻近探针组的寡核苷酸序列的非限制性实例在图13中示出。
[0169] 图14示出了用于靶mRNA分子检测和条码化的邻近探针组的另一实施方案,其采用单个组合的夹板-桥寡核苷酸来接合两个邻近探针。
[0170] 图20示出了用于将包含编码区SC1–SC3的APS组装成特定mRNA靶分子(或寡核苷酸标记的抗体)的独特细胞起源条码的邻近探针组和夹板寡核苷酸分子的另一实例。在该实例中,一个邻近探针分子(探针2)被延伸以进一步包含能够与探针1的短序列区杂交的内部“桥”寡核苷酸序列,从而缩短了包含在后续扩增和测序步骤中的靶mRNA测序区的长度。
[0171] 图22和23示出了用于组装APS以创建靶mRNA分子的独特细胞起源条码的邻近探针组(包括可进一步包含桥序列和一个或多个夹板寡核苷酸分子的靶标特异性探针对)的实例,其中互补序列识别事件的数目及其邻近性要求组合起来提供提高的靶标检测特异性。
[0172] 在一些实施方案中,本文公开的邻近探针组可用于在不进行额外的细胞起源条码化步骤的情况下检测特定mRNA序列。例如,在一些实施方案中,可将细胞样品裂解以释放mRNA,随后使样品与多个珠子接触,其中珠子包含能够例如通过使用聚-T序列区而与所释放的mRNA分子杂交的多个栓系的寡核苷酸序列。在从细胞样品中释放的mRNA杂交后,使第一寡核苷酸邻近探针与所述多个珠子上所杂交的mRNA分子退火,其中第一寡核苷酸邻近探针包含表位特异性条码序列和能够与靶核酸序列的第一区段杂交的第一靶标识别序列。同时或随后,使第二寡核苷酸邻近探针与珠子上所杂交的mRNA分子退火,其中第二寡核苷酸邻近探针包含能够与靶核酸序列的第二区段杂交的第二靶标识别序列,并且其中靶核酸序列的第一和第二区段是不同的并且彼此相隔指定数目N个核苷酸。然后同时或随后使桥寡核苷酸与所述多个珠子上所杂交的寡核苷酸邻近探针退火,其中该桥寡核苷酸包含两个探针识别序列,其中第一探针识别序列能够与第一寡核苷酸邻近探针的区段杂交,并且第二探针识别序列能够与第二寡核苷酸邻近探针的区段杂交,从而创建包含表位特异性条码的靶标特异性探针复合物。在一些实施方案中,连接退火的组分(即,该寡核苷酸邻近探针对和桥寡核苷酸)以创建共价接合的靶标特异性探针复合物。在许多实施方案中,所述多个栓系的寡核苷酸序列进一步包含一个或多个引物序列,例如,扩增引物或测序引物。在一些实施方案中,采用PCR反应以及一个或多个靶标特异性引物扩增该靶标特异性探针复合物。在一些实施方案中,对PCR扩增产物进行测序,以检测或定量样品中一种或多种mRNA序列的存在与否。
[0173] F.全细胞与死细胞、细胞碎片或细胞簇之间的区别
[0174] 当进行测定以鉴别包含复杂细胞混合物的样品中的个体细胞中的多种靶分子时,可能期望将全细胞与死细胞、细胞碎片或细胞簇相区分,使得可将后者的数据从后续分析中排除,从而改善数据质量。在涉及包含数百万细胞的样品并且其中每个细胞被单独条码化的研究中,细胞碎片、细胞双联体或更大的细胞簇的存在可产生错误数据形式的“噪音”,这指示存在具有其不应该具有的标志物的细胞。因此,本公开内容的方法、组合物和试剂盒提供了用于将感兴趣的单个细胞与样品中存在的死细胞、细胞碎片或细胞簇相区分的手段。
[0175] 在一些实施方案中,通过对每个“细胞”的DNA与蛋白质之比进行分析而实现感兴趣的单个细胞与样品中存在的死细胞、细胞碎片或细胞簇之间的区分。在一些实施方案中,通过对每个“细胞”所检测到的DNA的量进行分析而实现感兴趣的单个细胞与死细胞、细胞碎片或细胞簇之间的区分。在又一其他实施方案中,通过对每个“细胞”所检测到的蛋白质的量进行分析而实现区分。
[0176] 在一些实施方案中,可通过选择在为了鉴别特定一组靶分子而选定的UBA组中包含针对基因组DNA或染色体DNA结构的一种或多种UBA,例如结合剂,包括但不限于结合DNA或组蛋白的抗体,或DNA嵌入分子(如小檗碱、溴化乙锭、原黄素、道诺霉素、更生霉素、多柔比星、柔红霉素或沙利度胺),来确定每个“细胞”的DNA的量。在测定完成后,从如通过细胞起源条码(COB)鉴别的、针对每个细胞检测到的DNA特异性UBA-ESB复合物的数目来确定每个“细胞”的DNA的量。在一些实施方案中,将回收的DNA特异性UBA-ESB复合物的数目与采用同一组DNA导向的UBA以及已知浓度的基因组DNA或染色体DNA在类似温育条件下生成的校准曲线进行比较可能是有用的,从而在DNA特异性UBA与基因组DNA或染色体DNA结构之间的结合化学计量不是1:1的情况下校正结合化学计量。在一些实施方案中,通过在将细胞样品固定并透化之前与针对基因组DNA或染色体DNA结构的一种或多种UBA进行温育,利用相同的方法来区分全细胞与“死”细胞。
[0177] 在一些实施方案中,可通过选择在为了鉴别特定一组靶分子而选定的UBA组中包含非特异性地针对蛋白质的一种或多种UBA,例如,包括但不限于胺反应性部分,如琥珀酰亚胺酯、磺基琥珀酰亚胺酯、四氟苯基酯、磺基二氯苯酚酯、异硫氰酸酯或磺酰氯,或特异性针对常见蛋白质的一种或多种UBA,例如,针对肌动蛋白或其他管家蛋白质的抗体,来确定每个“细胞”的蛋白质的量。在测定完成后,从如通过细胞起源条码(COB)鉴别的、针对每个细胞检测到的非特异性蛋白质UBA-ESB复合物的数目来确定每个“细胞”的蛋白质的量。在一些实施方案中,将回收的非特异性蛋白质UBA-ESB复合物(或在使用针对肌动蛋白或其他管家蛋白质的抗体的情况下,为特异性蛋白质UBA-ESB复合物)的数目与采用同一组蛋白质导向的UBA以及已知浓度的蛋白质在类似温育条件下生成的校准曲线进行比较可能是有用的,从而在非特异性蛋白质UBA与蛋白质之间的结合化学计量不是1:1的情况下校正结合化学计量。或者,在一些实施方案中,给定蛋白质或一组蛋白质的表面上可接近的胺基团的平均数目根据蛋白质结构数据来计算,随后用于根据为每个细胞回收的非特异性蛋白质UBA-ESB复合物的数目来确定每个细胞的蛋白质的量。
[0178] G.用于鉴别罕见细胞的方法
[0179] 当进行测定以鉴别包含复杂细胞混合物的样品中的个体细胞中的多种靶分子时,常常期望鉴别该复杂混合物内的特定细胞亚群并将后续分析集中于该亚群,从而提高数据的特异性。在涉及包含数百万细胞的样品并且其中每个细胞被单独条码化的研究中,罕见细胞的存在可构成总细胞群体的低达0.01%。因此,本公开内容的方法、组合物和试剂盒提供了用于将感兴趣的细胞亚组与样品中存在的大多数细胞相区分的手段。
[0180] 在一些实施方案中,可通过在为了鉴别特定一组靶分子而选定的UBA组中包含针对特定细胞内或细胞表面标志物的一种或多种UBA,包括但不限于,设计成与病毒基因组序列例如HIV病毒序列杂交的寡核苷酸探针序列,或抗CD1、CD3、CD8或CD4的抗体,来鉴别特定的细胞亚组。通过对附接至用于鉴别细胞亚群的UBA-ESB复合物的那些COB进行选择性扩增和测序,从而生成符合用于限定该亚群的选择标准的所有细胞的列表(如通过其各自的COB鉴别的),来将后续分析限制于选定的细胞亚群。
[0181] 可采用选定的细胞亚群的COB列表来确定与该亚群相关的其他UBA-ESB的完整列表。在一些实施方案中,使用该COB列表来设计引物组,例如,在使用4个APS(均包含SC)构建COB的情况下的4组引物(参见图24),以进行一组嵌套的多重PCR轮次。从距UBA最远的APS位置(或UBA将附接的ESB-COB缀合物的末端)开始,将第一组引物设计成与在第一组(最外侧)APS的SC的侧翼,即,在APS1位置的SC1序列组的侧翼的退火区杂交,第二组引物与序列的APS2–APS1组互补,第三组引物与序列的APS3–APS2–APS1组互补,而第四组引物与序列的APS4–APS3–APS2–APS1组互补。在每一步中,采用与位于ESB远侧的引物序列互补的第二引物,例如,Illumina引物序列,使用若干轮PCR选择性地扩增COB集合的亚组。因此,用每个引物组连续进行若干轮PCR扩增将仅选择性地扩增感兴趣的表位特异性条码-细胞起源条码缀合物,即与选定细胞亚群相关的表位特异性条码。在一些实施方案中,退火步骤包括进行从98℃起的缓慢降温,以允许“最佳”引物找到正确的互补链。在一些实施方案中,选择所使用的聚合酶和连接酶以使同源双链体形成最大化。在一些实施方案中,该退火步骤之后是用核酸酶例如EcoR1的处理,该核酸酶在进行下一扩增循环之前于合适的测定条件下切割同源双链体DNA,从而去除由模板驱动的偶然退火事件。采用任一种本领域已知的测序方法或系统对所得PCR产物进行测序,或随后进行序列特异性定量PCR,允许鉴别哪些靶分子存在于选定细胞亚群的个体细胞内。
[0182] H.用于从进一步的分析中过滤出选定细胞亚群的方法
[0183] 当进行测定以鉴别包含复杂细胞混合物的样品中的个体细胞中的多种靶分子时,常常期望过滤出该复杂混合物内的特定细胞亚群并将后续分析集中于剩余细胞,从而提高数据的特异性。例如,在一些应用中,可能期望鉴别细胞群体中的成熟B细胞(采用针对细胞表面标志物如CD19、CD38、BCMA等的抗体)并将其从进一步的考虑中除去,使得后续分析可集中在存在的任何干细胞上。因此,本公开内容的方法、组合物和试剂盒还可提供用于将特定的细胞群体从进一步的分析中除去的手段。在一些实施方案中,这通过用相同ESB标记多个UBA(例如,一组抗体)而实现,使得在该测定的结合步骤后,指定UBA组的ESB-COB缀合物的选择性扩增和测序提供有待从进一步的分析中排除的细胞列表。选择性扩增和测序可如上所述进行。
[0184] I.用于检测选定细胞亚群中的其他靶分子的重新取样
[0185] 当进行测定以鉴别包含复杂细胞混合物的样品中的个体细胞中的多种靶分子时,常常期望对条码化的细胞悬浮液重新取样,以确定选定亚群中是否还存在其他靶分子。因此,本公开内容的方法、组合物和试剂盒还提供用于在进行初始细胞条码化程序之后的时间点重新取样以检测一种或多种感兴趣的靶分子的手段。在一些实施方案中,通过在用于进行初始细胞条码化的原始UBA组中包含非特异性地针对蛋白质的一种或多种UBA,例如,包括但不限于胺反应性部分如琥珀酰亚胺酯、磺基琥珀酰亚胺酯、四氟苯基酯、磺基二氯苯酚酯、异硫氰酸酯或磺酰氯,来实现条码化细胞悬浮液的个体细胞中一种或多种感兴趣的靶分子的检测。在如上所述进行选择性扩增和测序以获得与选定亚群的细胞相关的细胞起源条码列表后,将条码化细胞悬浮液的等份裂解并与包含例如针对一种感兴趣的其他靶分子的固定化抗体和栓系的二级引物(图25)的珠子一起温育,该二级引物包含用于鉴别固定在给定珠子上的抗体的、引物序列下游的代码序列。可使用多个珠子,其中所述多个珠子包含例如针对多种靶分子的固定化抗体,以及其相应的二级引物,并且其中任何单个珠子均包含单一类型的固定化抗体。在靶分子(例如,靶蛋白)的免疫沉淀后,采用合适的聚合酶,例如,Taq DNA聚合酶、Klenow DNA聚合酶I等进行二级引物延伸反应,随后扩增以生成包含抗体代码序列和细胞起源条码序列的扩增产物。然后,细胞起源条码与针对感兴趣的选定亚群鉴别的COB列表的比较允许在个体细胞的基础上鉴别和定量选定亚群中感兴趣的其他靶分子的存在。
[0186] 在一些实施方案中,通过在细胞条码化步骤中使用针对普通mRNA分子的非特异性UBA,例如包含聚-T(或聚-dT)序列的UBA,并使用包含对感兴趣mRNA分子为特异性的固定化寡核苷酸探针的一组珠子以及固定化的二级引物,利用类似的方法检测选定细胞亚群中感兴趣的mRNA分子。
[0187] V.试剂盒
[0188] 本公开内容还描述了用于对分子和细胞进行条码化的试剂盒,其中该试剂盒包含如上所述的一种或多种组合物。在一些实施方案中,该试剂盒可包含一种或多种靶标特异性UBA-ESB复合物,或用于将预合成的ESB附接至用户提供的UBA的试剂。在一些实施方案中,本文公开的试剂盒的UBA包含一种或多种抗体,其可进一步包含编码相关联抗体的身份的附接的ESB。在一些实施方案中,本文公开的试剂盒的UBA包含设计成与选定的核酸靶标杂交的一种或多种寡核苷酸探针,并且其可进一步包含编码相关联靶探针的身份的附接的ESB。在一些实施方案中,所公开的试剂盒可额外包含或作为独立产品而包含APS组以及将该APS组组装成细胞起源条码可能需要的任何其他酶或试剂。在一些实施方案中,该APS组包含设计用于在分析的测序步骤提供错误检测和校正能力的成组子代码区。在一些实施方案中,所公开的试剂盒可额外包含或作为独立产品包含用于选择性地扩增选定细胞亚群的表位特异性条码的引物组。
[0189] VI.应用
[0190] 本文公开的组合物、方法和试剂盒可用于诊断、预后、治疗、患者分类、药物开发、治疗选择和筛选目的。所公开的组合物、方法和试剂盒提供了可在单细胞水平上从单个生物样品中一次分析许多不同靶分子的优势。例如,这使得若干个诊断试验能够在一个样品上进行。
[0191] 应用的实例包括但不限于:生物标志物发现、药物发现的靶标验证、基因表达谱分析、蛋白质表达谱分析、蛋白质组分析、代谢组学研究、翻译后修饰研究(例如,用于监测糖基化、磷酸化、乙酰化及其他氨基酸修饰)、药代动力学研究(例如,药物代谢、ADME谱分析和毒性研究)、特异性血清或粘膜抗体水平的分析;非核酸诊断指示物的评价、病原体检测、外来抗原检测,等等。
[0192] VII.计算机软件
[0193] 本文还公开了存储在非暂时性计算机可读介质上的计算机软件包,其提供了对从表位特异性条码-细胞起源条码缀合物组获得的测序数据进行解码和分组的分析能力。由这类软件包提供的能力的实例包括序列比对和比较工具、分层聚类工具、扩增和/或测序错误检测和校正工具、数据可视化工具等。
[0194] 虽然本文已经显示和描述了本发明的优选实施方案,但对于本领域中技术人员显而易见的是,此类实施方案仅通过举例的方式提供。在不偏离本发明的情况下,本领域技术人员现将想到众多更改、改变和替换。应当理解,在实施本发明的过程中可采用本文所述的本发明实施方案的各种替代方案。以下权利要求旨在限定本发明的范围,从而涵盖这些权利要求的范围内的方法和结构及其等效方案。
QQ群二维码
意见反馈