首页 / 专利库 / 疗法 / 癌症免疫疗法 / 高通量识别患者特异性新表位作为癌症免疫疗法的治疗靶点

高通量识别患者特异性新表位作为癌症免疫疗法治疗靶点

阅读:534发布:2020-05-17

专利汇可以提供高通量识别患者特异性新表位作为癌症免疫疗法治疗靶点专利检索,专利查询,专利分析的服务。并且提出了能够选择 肿瘤 新表位的系统和方法,所述肿瘤新表位针对各种标准进行过滤。在具体的预期方面,过滤包括其中确定导致新表位的突变为位于癌症驱动基因的步骤。,下面是高通量识别患者特异性新表位作为癌症免疫疗法治疗靶点专利的具体信息内容。

1.一种选择用于癌症的免疫治疗的新表位的方法,其包括:
从患者获得来自肿瘤组织和匹配的正常组织的组学数据,并使用组学数据来确定多个基于表达错义的患者和肿瘤特异性的新表位;
通过患者的HLA类型过滤所述基于表达错义的患者和肿瘤特异性的新表位,从而获得HLA匹配的新表位;和
通过受HLA匹配的新表位影响的基因类型来过滤HLA匹配的新表位,从而获得癌症驱动新表位。
2.根据权利要求1所述的方法,其中所述组学数据包括选自全基因组测序数据、全外显子组测序数据、RNAseq数据和定量蛋白质组学数据的至少两个组学数据。
3.根据前述权利要求中任一项所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
4.根据前述权利要求中任一项所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
5.根据前述权利要求中任一项所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
6.根据前述权利要求中任一项所述的方法,其中使用多个不同的个体新表位序列对每个新表位进行通过HLA类型来过滤新表位的步骤,其中改变的基酸在新表位序列内具有不同的位置。
7.根据权利要求6所述的方法,其中所述个体新表位序列的长度为7至20个氨基酸。
8.根据前述权利要求中任一项所述的方法,其中通过HLA类型来过滤的步骤包括由患者组学数据确定HLA类型。
9.根据前述权利要求中任一项所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
10.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和
11.根据权利要求1所述的方法,其中HLA匹配的新表位对患者的至少一种MHC I类亚型或至少一种MHC II类亚型的亲和力等于或小于150nM。
12.根据前述权利要求中任一项所述的方法,其中受影响的基因类型是选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的癌症的癌症驱动基因。
13.根据前述权利要求中任一项所述的方法,其中受影响的基因类型是表1中列出的癌症驱动基因。
14.根据前述权利要求中任一项所述的方法,其还包括确定受影响的基因类型的机能障碍的步骤。
15.根据前述权利要求中任一项所述的方法,其还包括产生针对靶向由受影响的基因类型编码的蛋白质的非免疫治疗药物的推荐的步骤。
16.根据前述权利要求中任一项所述的方法,其还包括使用癌症驱动新表位来制备免疫治疗剂的步骤。
17.根据权利要求16所述的方法,其中所述免疫治疗剂包含具有对癌症驱动新表位结合特异性的合成抗体、合成的癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
18.根据权利要求1所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
19.根据权利要求1所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
20.根据权利要求1所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
21.根据权利要求1所述的方法,其中使用多个不同的个体新表位序列对每个新表位进行通过HLA类型来过滤新表位的步骤,其中改变的氨基酸在新表位序列内具有不同的位置。
22.根据权利要求21所述的方法,其中所述个体新表位序列的长度为7至20个氨基酸。
23.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤包括从患者组学数据中确定HLA类型。
24.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
25.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和力。
26.根据权利要求1所述的方法,其中HLA匹配的新表位对患者的至少一种MHC I类亚型或至少一种MHC II类亚型的亲和力等于或小于150nM。
27.根据权利要求1所述的方法,其中受影响的基因类型是选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的癌症的癌症驱动基因。
28.根据权利要求1所述的方法,其中受影响的基因类型是表1中列出的癌症驱动基因。
29.根据权利要求1所述的方法,其还包括确定受影响的基因类型的机能障碍的步骤。
30.根据权利要求1所述的方法,其还包括产生针对靶向由受影响的基因类型编码的蛋白质的非免疫治疗药物的推荐的步骤。
31.根据权利要求1所述的方法,其还包括使用癌症驱动新表位来制备免疫治疗剂的步骤。
32.根据权利要求31所述的方法,其中所述免疫治疗剂包含具有对癌症驱动新表位结合特异性的合成抗体、合成的癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
33.一种使用免疫疗法治疗患者癌症的方法,其包括:
从患者获得来自肿瘤组织和匹配的正常组织的组学数据,并使用组学数据来确定多个基于表达错义的患者和肿瘤特异性的新表位;
从基于表达错义的患者和肿瘤特异性的新表位得到癌症驱动新表位;和
向患者施用免疫治疗剂,所述免疫治疗剂包含具有对癌症驱动新表位结合特异性的合成抗体、合成的癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
34.根据权利要求33所述的方法,其中所述组学数据包括选自全基因组测序数据、全外显子组测序数据、RNAseq数据和定量蛋白质组学数据的至少两个组学数据。
35.根据权利要求33至34中任一项所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
36.根据权利要求33至35中任一项所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
37.根据权利要求33至36中任一项所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
38.根据权利要求33至37中任一项所述的方法,其中得到癌症驱动新表位的步骤包括通过患者的HLA类型过滤患者和肿瘤特异性的新表位的步骤。
39.根据权利要求38所述的方法,其中通过HLA类型过滤的步骤使用多个不同的个体新表位序列,其中改变的氨基酸在新表位序列内具有不同的位置,并且其中个体新表位序列的长度为7至20个氨基酸。
40.根据权利要求38至39中任一项所述的方法,其中通过HLA类型来过滤的步骤包括从患者组学数据中确定HLA类型。
41.根据权利要求38至40中任一项所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
42.根据权利要求38至41中任一项所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和力。
43.根据权利要求33至42中任一项所述的方法,其中癌症驱动新表位位于选自ALL、
AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的基因中。
44.根据权利要求33至42中任一项所述的方法,其中所述癌症驱动基因列于表1中。
45.根据权利要求33至44中任一项所述的方法,其还包括施用非免疫治疗药物的步骤,所述非免疫治疗药物靶向包含癌症驱动新表位的蛋白质。
46.根据权利要求33所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
47.根据权利要求33所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
48.根据权利要求33所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
49.根据权利要求33所述的方法,其中得到癌症驱动新表位的步骤包括通过患者的HLA类型过滤患者和肿瘤特异性的新表位的步骤。
50.根据权利要求49所述的方法,其中通过HLA类型过滤的步骤使用多个不同的个体新表位序列,其中改变的氨基酸在新表位序列内具有不同的位置,并且其中个体新表位序列的长度为7至20个氨基酸。
51.根据权利要求49所述的方法,其中通过HLA类型来过滤的步骤包括从患者组学数据中确定HLA类型。
52.根据权利要求49所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
53.根据权利要求49所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和力。
54.根据权利要求33所述的方法,其中癌症驱动新表位位于选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的基因中。
55.根据权利要求33所述的方法,其中所述癌症驱动基因列于表1中。
56.根据权利要求33所述的方法,其还包括施用非免疫治疗药物的步骤,所述非免疫治疗药物靶向包含癌症驱动新表位的蛋白质。
57.一种免疫治疗组合物,其包含:与(i)合成的抗体相结合的载体,所述合成的抗体对患者特异性的癌症驱动新表位具有结合特异性,与(ii)合成的患者特异性的癌症驱动新表位结合的载体,与(iii)编码患者特异性的癌症驱动新表位的核酸结合的载体,或与(iv)嵌合抗原受体结合的载体,所述嵌合抗原受体对患者特异性的癌症驱动新表位具有结合特异性。
58.根据权利要求57所述的免疫治疗组合物,其中所述载体包含单一蛋白质或包含药学上可接受的聚合物
59.根据权利要求57所述的免疫治疗组合物,其中所述载体是免疫活性细胞。
60.根据权利要求59所述的免疫治疗组合物,其中所述免疫活性细胞是CD8+T细胞或NK细胞。
61.根据权利要求57所述的免疫治疗组合物,其中所述载体是重组病毒。
62.根据权利要求57所述的免疫治疗组合物,其还包含适用于注射或输注的药学上可接受的载体。
63.免疫治疗剂在治疗癌症中的用途,其中所述免疫治疗剂包含具有对患者特异性的癌症驱动新表位结合特异性的合成抗体、合成的患者特异性的癌症驱动新表位、编码患者特异性的癌症驱动新表位的核酸、携带对患者特异性的癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码患者特异性的癌症驱动新表位的核酸的重组病毒中的至少一种。
64.根据权利要求63所述的用途,其中合成抗体与NK细胞或与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
65.根据权利要求63所述的用途,其中患者特异性的合成癌症驱动新表位与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
66.根据权利要求63所述的用途,其中编码患者特异性的癌症驱动新表位的核酸包含在免疫活性细胞或病毒中,或与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
67.一种重组免疫活性细胞,其包含编码嵌合抗原受体或编码患者特异性的癌症驱动新表位的核酸,所述嵌合抗原受体对患者特异性的癌症驱动新表位具有结合特异性。
68.根据权利要求67所述的重组免疫活性细胞,其中所述免疫活性细胞是CD8+T细胞或NK细胞、或NK92衍生物
1.一种选择用于癌症的免疫治疗的新表位的方法,其包括:
从患者获得来自肿瘤组织和匹配的正常组织的组学数据,并使用组学数据来确定多个基于表达错义的患者和肿瘤特异性的新表位;
通过患者的HLA类型过滤所述基于表达错义的患者和肿瘤特异性的新表位,从而获得HLA匹配的新表位;和
通过受HLA匹配的新表位影响的基因类型来过滤HLA匹配的新表位,从而获得癌症驱动新表位。
2.根据权利要求1所述的方法,其中所述组学数据包括选自全基因组测序数据、全外显子组测序数据、RNAseq数据和定量蛋白质组学数据的至少两个组学数据。
3.根据前述权利要求中任一项所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
4.根据前述权利要求中任一项所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
5.根据前述权利要求中任一项所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
6.根据前述权利要求中任一项所述的方法,其中使用多个不同的个体新表位序列对每个新表位进行通过HLA类型来过滤新表位的步骤,其中改变的氨基酸在新表位序列内具有不同的位置。
7.根据权利要求6所述的方法,其中所述个体新表位序列的长度为7至20个氨基酸。
8.根据前述权利要求中任一项所述的方法,其中通过HLA类型来过滤的步骤包括由患者组学数据确定HLA类型。
9.根据前述权利要求中任一项所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
10.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和力。
11.根据权利要求1所述的方法,其中HLA匹配的新表位对患者的至少一种MHC I类亚型或至少一种MHC II类亚型的亲和力等于或小于150nM。
12.根据前述权利要求中任一项所述的方法,其中受影响的基因类型是选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的癌症的癌症驱动基因。
13.根据前述权利要求中任一项所述的方法,其中受影响的基因类型是选自AURKA、
BAP1、BRCA1、BRCA2、CCND2、CCND3、CCNE1、CDK4、CDK6、CDKN1B、CDKN2A、CDKN2B、EGF4、ERBB2、FBXW7、FGFR1、FGFR2、FGFR3、IGF1R、MDM2、MDM4、MET、NF1、PTEN、SMARCA4、SMARCB1、STK11和TP53的癌症驱动基因。
14.根据前述权利要求中任一项所述的方法,其还包括确定受影响的基因类型的机能障碍的步骤。
15.根据前述权利要求中任一项所述的方法,其还包括产生针对靶向由受影响的基因类型编码的蛋白质的非免疫治疗药物的推荐的步骤。
16.根据前述权利要求中任一项所述的方法,其还包括使用癌症驱动新表位来制备免疫治疗剂的步骤。
17.根据权利要求16所述的方法,其中所述免疫治疗剂包含具有对癌症驱动新表位结合特异性的合成抗体、合成的癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
18.根据权利要求1所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
19.根据权利要求1所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
20.根据权利要求1所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
21.根据权利要求1所述的方法,其中使用多个不同的个体新表位序列对每个新表位进行通过HLA类型来过滤新表位的步骤,其中改变的氨基酸在新表位序列内具有不同的位置。
22.根据权利要求21所述的方法,其中所述个体新表位序列的长度为7至20个氨基酸。
23.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤包括从患者组学数据中确定HLA类型。
24.根据权利要求1所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
25.(删除)
26.(删除)
27.根据权利要求1所述的方法,其中受影响的基因类型是选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的癌症的癌症驱动基因。
28.根据权利要求1所述的方法,其中受影响的基因类型是选自AURKA、BAP1、BRCA1、BRCA2、CCND2、CCND3、CCNE1、CDK4、CDK6、CDKN1B、CDKN2A、CDKN2B、EGF4、ERBB2、FBXW7、FGFR1、FGFR2、FGFR3、IGF1R、MDM2、MDM4、MET、NF1、PTEN、SMARCA4、SMARCB1、STK11和TP53的癌症驱动基因。
29.根据权利要求1所述的方法,其还包括确定受影响的基因类型的机能障碍的步骤。
30.根据权利要求1所述的方法,其还包括产生针对靶向由受影响的基因类型编码的蛋白质的非免疫治疗药物的推荐的步骤。
31.根据权利要求1所述的方法,其还包括使用癌症驱动新表位来制备免疫治疗剂的步骤。
32.根据权利要求31所述的方法,其中所述免疫治疗剂包含具有对癌症驱动新表位结合特异性的合成抗体、合成的癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
33.一种使用免疫疗法治疗患者癌症的方法,其包括:
从患者获得来自肿瘤组织和匹配的正常组织的组学数据,并使用组学数据来确定多个基于表达错义的患者和肿瘤特异性的新表位;
从基于表达错义的患者和肿瘤特异性的新表位得到癌症驱动新表位;和
向患者施用免疫治疗剂,所述免疫治疗剂包含具有对癌症驱动新表位结合特异性的合成抗体、合成的癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
34.根据权利要求33所述的方法,其中所述组学数据包括选自全基因组测序数据、全外显子组测序数据、RNAseq数据和定量蛋白质组学数据的至少两个组学数据。
35.根据权利要求33至34中任一项所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
36.根据权利要求33至35中任一项所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
37.根据权利要求33至36中任一项所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
38.根据权利要求33至37中任一项所述的方法,其中得到癌症驱动新表位的步骤包括通过患者的HLA类型过滤患者和肿瘤特异性的新表位的步骤。
39.根据权利要求38所述的方法,其中通过HLA类型过滤的步骤使用多个不同的个体新表位序列,其中改变的氨基酸在新表位序列内具有不同的位置,并且其中个体新表位序列的长度为7至20个氨基酸。
40.根据权利要求38至39中任一项所述的方法,其中通过HLA类型来过滤的步骤包括从患者组学数据中确定HLA类型。
41.根据权利要求38至40中任一项所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
42.根据权利要求38至41中任一项所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和力。
43.根据权利要求33至42中任一项所述的方法,其中癌症驱动新表位位于选自ALL、
AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的基因中。
44.根据权利要求33至42中任一项所述的方法,其中所述癌症驱动基因列于表1中。
45.根据权利要求33至44中任一项所述的方法,其还包括施用非免疫治疗药物的步骤,所述非免疫治疗药物靶向包含癌症驱动新表位的蛋白质。
46.根据权利要求33所述的方法,其中确定多个基于表达错义的患者和肿瘤特异性的新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。
47.根据权利要求33所述的方法,其还包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标志、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性的新表位的步骤。
48.根据权利要求33所述的方法,其中所述肿瘤组织是实体瘤组织,并且其中所述匹配的正常组织是血液。
49.根据权利要求33所述的方法,其中得到癌症驱动新表位的步骤包括通过患者的HLA类型过滤患者和肿瘤特异性的新表位的步骤。
50.根据权利要求49所述的方法,其中通过HLA类型过滤的步骤使用多个不同的个体新表位序列,其中改变的氨基酸在新表位序列内具有不同的位置,并且其中个体新表位序列的长度为7至20个氨基酸。
51.根据权利要求49所述的方法,其中通过HLA类型来过滤的步骤包括从患者组学数据中确定HLA类型。
52.根据权利要求49所述的方法,其中通过HLA类型来过滤的步骤被实施到至少4位数的深度。
53.根据权利要求49所述的方法,其中通过HLA类型来过滤的步骤包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和力。
54.根据权利要求33所述的方法,其中癌症驱动新表位位于选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的基因中。
55.根据权利要求33所述的方法,其中所述癌症驱动基因列于表1中。
56.根据权利要求33所述的方法,其还包括施用非免疫治疗药物的步骤,所述非免疫治疗药物靶向包含癌症驱动新表位的蛋白质。
57.一种免疫治疗组合物,其包含:与(i)合成的抗体相结合的载体,所述合成的抗体对患者特异性的癌症驱动新表位具有结合特异性,与(ii)合成的患者特异性的癌症驱动新表位结合的载体,与(iii)编码患者特异性的癌症驱动新表位的核酸结合的载体,或与(iv)嵌合抗原受体结合的载体,所述嵌合抗原受体对患者特异性的癌症驱动新表位具有结合特异性。
58.根据权利要求57所述的免疫治疗组合物,其中所述载体包含单一蛋白质或包含药学上可接受的聚合物。
59.根据权利要求57所述的免疫治疗组合物,其中所述载体是免疫活性细胞。
60.根据权利要求59所述的免疫治疗组合物,其中所述免疫活性细胞是CD8+T细胞或NK细胞。
61.根据权利要求57所述的免疫治疗组合物,其中所述载体是重组病毒。
62.根据权利要求57所述的免疫治疗组合物,其还包含适用于注射或输注的药学上可接受的载体。
63.免疫治疗剂在治疗癌症中的用途,其中所述免疫治疗剂包含具有对患者特异性的癌症驱动新表位结合特异性的合成抗体、合成的患者特异性的癌症驱动新表位、编码患者特异性的癌症驱动新表位的核酸、携带对患者特异性的癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码患者特异性的癌症驱动新表位的核酸的重组病毒中的至少一种。
64.根据权利要求63所述的用途,其中合成抗体与NK细胞或与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
65.根据权利要求63所述的用途,其中合成的患者特异性的癌症驱动新表位与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
66.根据权利要求63所述的用途,其中编码患者特异性的癌症驱动新表位的核酸包含在免疫活性细胞或病毒中,或与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
67.一种重组免疫活性细胞,其包含编码嵌合抗原受体或编码患者特异性的癌症驱动新表位的核酸,所述嵌合抗原受体对患者特异性的癌症驱动新表位具有结合特异性。
68.根据权利要求67所述的重组免疫活性细胞,其中所述免疫活性细胞是CD8+T细胞或NK细胞、或NK92衍生物。

说明书全文

高通量识别患者特异性新表位作为癌症免疫疗法治疗靶点

[0001] 本申请要求2016年2月12日提交的序号为62/294665的美国临时申请的优先权,该申请通过引用并入本文。

技术领域

[0002] 本发明的领域是组学数据的计算分析以预测治疗选择,特别是因为它涉及基于新表位的免疫治疗中靶表位的选择。

背景技术

[0003] 该背景描述包括可以用于理解本发明的信息。这并不是指本文提供的任何信息是现有技术或与当前要求保护的发明相关,或者具体或隐含地引用的任何出版物是现有技术。
[0004] 本文中的所有出版物和专利申请均通过引用并入,其与明确地和单独地指出每个单独的出版物或专利申请通过引用并入的程度相同。如果并入的参考文献中术语的定义或用法与本文提供的术语的定义不一致或相反,则适用本文提供的术语定义,并且该术语在该参考文献中的定义不适用。
[0005] 常见的靶向特定癌症的某些抗原的癌症免疫疗法在一些患者中引起显著反应。不幸的是,尽管表达相同的抗原,但许多患者对这种免疫疗法没有应答。这种失败的一个可能原因可能是免疫系统的多种效应细胞可能不是以足够的量存在,或者可能已经耗尽。此外,患者之间的细胞内抗原加工和HLA变异性可能导致抗原和/或抗原显示的加工不充分,导致治疗无效或缺乏应答。
[0006] 为了增加免疫治疗的靶点的选择,最近已经考虑了随机突变,因为肿瘤细胞中的一些随机突变可能产生独特的肿瘤特异性抗原(新表位)。因此,并且至少在概念上,新表位可以为免疫疗法提供独特的精确靶点。另外,已经显示出细胞溶解性T细胞应答可以由非常少量的肽触发(例如,Sykulev等人,Immunity,第4卷,第6期,第565-571页,1996年6月1日)。此外,由于许多癌症中相对大量的突变,可能的靶点数量相对较高。鉴于这些发现,将癌症新表位作为治疗靶点的识别引起了很多关注。不幸的是,目前的数据似乎表明全部或几乎全部的癌症新表位对于患者和特定肿瘤是独特的,因此未能提供关于哪种新表位可以用于治疗有效的免疫治疗剂的任何具体指示。
[0007] 为了克服与大量可能的免疫治疗靶点相关的至少一些问题,可以针对突变类型(例如,以确定错义或无义突变)、转录平以确认突变基因的转录并确认蛋白质的表达,来过滤新表位。此外,如WO2016/172722中所述,可以进一步分析如此过滤的新表位用于特异性结合至患者的HLA系统。虽然这种系统有利地减少了相对大量的潜在新表位,但这些新表位相对于治疗结果的重要性仍然不确定。
[0008] 因此,即使在本领域中已知多种新表位的识别方法,但它们中的全部或几乎全部都存在一个或多个缺点。因此,期望具有用于新表位识别的改进的系统和方法,该系统和方法增加免疫疗法中治疗应答的可能性。

发明内容

[0009] 本发明的主题涉及用于选择用于靶向新表位的免疫疗法的新表位的多种组合物和方法,所述新表位不仅在肿瘤细胞上表达和呈现,而且还赋予肿瘤细胞功能优势。最优选地,预期的新表位包括癌症驱动突变。因此,预期的组合物和方法将使肿瘤细胞及其突变的驱动受到体液和细胞免疫应答,从而增加治疗效果的可能性。
[0010] 在本发明主题的一个方面,发明人预期了一种选择用于癌症的免疫治疗的新表位的方法,该方法包括从患者获得来自肿瘤组织和匹配的正常组织的组学数据的步骤,以及使用该组学数据来确定多种基于经表达错义的患者和肿瘤特异性新表位。在其他步骤中,基于经表达错义的患者和肿瘤特异性新表位通过患者的HLA类型过滤,从而获得HLA匹配的新表位,并且在更进一步的步骤中,通过受HLA匹配的新表位影响的基因类型来过滤HLA匹配的新表位,从而获得癌症驱动新表位。
[0011] 在这种方法中,进一步预期组学数据包括选自全基因组测序数据、全外显子组测序数据、RNAseq数据和定量蛋白质组学数据的至少两个组学数据,和/或确定多个基于表达错义的患者和肿瘤特异性新表位的步骤包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。根据需要,预期的方法还可以包括通过选自单核苷酸多态性、短的缺失和插入多态性、微卫星标记物、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤所述基于表达错义的患者和肿瘤特异性新表位的步骤。更典型地,肿瘤组织是实体瘤组织,并且匹配的正常组织是血液。
[0012] 有利地,使用多个不同的个体新表位序列对每个新表位进行通过HLA类型来过滤患者和肿瘤特异性的新表位的步骤,其中改变的基酸在新表位序列内具有不同的位置。例如,个体的新表位序列的长度可以为7至20个氨基酸。
[0013] 还预期了通过HLA类型来过滤的步骤可以包括从患者组学数据中确定HLA类型。通常但非必要地,通过HLA类型来过滤的步骤被实施至至少2位数的深度,更典型地至至少4位数。另外,或替代地,通过HLA类型来过滤的步骤还可以包括确定新表位对患者的至少一种MHC I类亚型和至少一种MHC II类亚型的亲和。例如,HLA匹配的新表位对患者的至少一种MHC I类亚型或至少一种MHC II类亚型的亲和力可以等于或小于150nM。
[0014] 关于受影响的基因类型,一般预期基因类型是癌症驱动基因和/或乘客基因,通常用于选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的癌症。例如,表1列出了合适的癌症驱动基因。
[0015] 需要时,合适的方法还可以包括确定受影响的癌症驱动基因中的功能障碍的步骤。在这种情况下,可以针对靶向至由受影响的癌症驱动基因编码的蛋白质的非免疫治疗药物产生推荐。此外,还预期本文提出的方法还可以包括使用癌症驱动新表位来制备免疫治疗剂的步骤。例如,合适的免疫治疗剂可以包括具有对癌症驱动新表位结合特异性的合成抗体、合成癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
[0016] 因此,发明人还预期了使用免疫疗法来治疗患者癌症的方法。这种方法包括以下步骤:从患者获得来自肿瘤组织和匹配的正常组织的组学数据,并使用组学数据来确定多个基于表达错义的患者和肿瘤特异性新表位。在另一个步骤中,癌症驱动新表位来源于基于表达错义的患者和肿瘤特异性新表位。在又一个步骤中,向患者施用免疫治疗剂,所述免疫治疗剂包括具有对癌症驱动新表位结合特异性的合成抗体、合成癌症驱动新表位、编码癌症驱动新表位的核酸、携带对癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码癌症驱动新表位的核酸的重组病毒中的至少一种。
[0017] 如前,预期组学数据通常会包括选自全基因组测序数据、全外显子组测序数据、RNAseq数据和定量蛋白质组学数据的至少两个组学数据,和/或确定多个基于表达错义的患者和肿瘤特异性新表位的步骤可以包括位置导向的来自肿瘤组织和匹配的正常组织的组学数据的同步比对。所预期的方法还可以包括选自单核苷酸多态性、短的缺失和插入多态性、微卫星标记物、短串联重复、杂合序列、多核苷酸多态性和经命名的变体的至少一个先验已知的分子变异来过滤基于表达错义的患者和肿瘤特异性新表位的其他步骤。
[0018] 通常,但并非必须地,源于癌症驱动新表位的步骤会包括通过患者的HLA类型来过滤患者和肿瘤特异性的新表位的步骤(其可以使用多个不同的个体新表位序列,其中改变的氨基酸在新表位序列内具有不同的位置,其中个体新表位序列的长度可以为7至20个氨基酸)。此外,通过HLA类型来过滤的步骤可以包括由患者组学数据确定HLA类型,和/或可以实施至至少4位数的深度,和/或可以包括确定新表位与患者的至少一个MHCI类亚型和至少一个MHC II类亚型的亲和力。
[0019] 所预期的癌症驱动新表位可以位于选自ALL、AML、BLCA、BRCA、CLL、CM、COREAD、ESCA、GBM、HC、HNSC、LUAD、LUSC、MB、NB、NSCLC、OV、PRAD、RCCC、SCLC、STAD、THCA和UCEC的基因中,并且将示例性的癌症驱动基因列于表1中。此外,所预期的方法可以包括施用靶向至包含癌症驱动基因的蛋白质的非免疫治疗药物的步骤。
[0020] 因此,发明人还预期了一种免疫治疗组合物,其包含:与(i)合成抗体相结合的载体,所述合成抗体与患者特异性癌症驱动新表位具有结合特异性,与(ii)合成的患者特异性癌症驱动新表位结合的载体,与(iii)编码患者特异性癌症驱动新表位的核酸结合的载体,或与(iv)嵌合抗原受体结合的载体,所述嵌合抗原受体对患者特异性癌症驱动新表位具有结合特异性。
[0021] 合适的载体可以包含单一蛋白质,或可以包含药学上可接受的聚合物。或者,载体也可以是免疫活性细胞(例如,CD8+T细胞或NK细胞)或重组病毒。根据需要,可以包括适于注射或输注的药学上可接受的载体。
[0022] 因此,从不同度来看,发明人还预期了免疫治疗剂在治疗癌症中的用途,其中免疫治疗剂包含具有对患者特异性癌症驱动新表位结合特异性的合成抗体、合成的患者特异性癌症驱动新表位、编码患者特异性癌症驱动新表位的核酸、携带对患者特异性癌症驱动新表位具有结合特异性的嵌合抗原受体的免疫活性细胞、以及包含编码患者特异性癌症驱动新表位的核酸的重组病毒中的至少一种。
[0023] 例如,合成抗体可以结合至NK细胞或结合至包含单一蛋白质或包含药学上可接受的聚合物的载体,和/或患者特异性合成癌症驱动物新表位可以结合至包含单一蛋白质或包含药学上可接受的聚合物的载体。或者,编码患者特异性癌症驱动新表位的核酸可以包含在免疫活性细胞或病毒中,或与包含单一蛋白质或包含药学上可接受的聚合物的载体结合。
[0024] 因此,本发明人还预期了重组免疫活性细胞(例如,CD8+T细胞或NK细胞、或NK92衍生物),其包含编码嵌合抗原受体或编码患者特异性癌症驱动新表位的核酸,所述嵌合抗原受体对患者特异性癌症驱动新表位具有结合特异性。
[0025] 从以下优选实施方案的详细描述以及附图中,本发明主题的各种目的、特征、方面和优点将变得更加明显,附图中相同的数字表示相同的部件。

附图说明

[0026] 图1是跨多种癌症的新表位频率和编码变异频率的示例性图示,以及跨多种癌症的独特新表位的频率的图示。
[0027] 图2是用于多种癌症的HLA匹配的新表位的频率的示例性图示,以及癌症驱动基因内独特新表位的频率的图示。

具体实施方式

[0028] 发明人现在已经发现,通过靶向表达的患者和肿瘤特异性的新表位可以进一步改善基于新表位的免疫疗法,所述新表位赋予肿瘤细胞功能优势。最优选地,新表位将位于由已知的、预测的或怀疑的癌症驱动基因编码的蛋白质中。因此,预期针对这种癌症驱动新表位的免疫应答不仅会导致细胞毒性免疫应答,还会导致针对癌症驱动蛋白的体液应答。例如,在癌症驱动基因是KIT(肥大细胞/干细胞生长因子受体)并且包括新表位的情况下,与KIT新表位结合的抗体不仅可以标记蛋白质用于NK细胞和T细胞的细胞毒性破坏,而且还可以抑制通过受体通路发出信号,从而抑制癌症驱动功能。
[0029] 为此,预期可以在优选使用患者肿瘤材料(例如,活组织检查样品)和匹配的正常组织(非肿瘤,通常是同一患者的健康组织)的过程中识别癌症驱动新表位。然后可以对患者样品进行组学分析以获得组学数据,最典型的是基因组学数据(例如全基因组序列数据、全外显子组数据等)、转录组学数据(尤其是RNAseq数据)、和/或蛋白质组学数据(这可能是定性的或定量的)。然后,可以使用组学数据来识别和过滤(表达的和HLA匹配的患者和肿瘤特异性)癌症驱动新表位,如下面更详细描述的。因此,确定的癌症驱动新表位可以使用多种治疗方式用于免疫治疗,包括基于细胞的治疗、癌症疫苗治疗性抗体等。
[0030] 新表位可以表征为在肿瘤细胞中所表达的随机突变,所述肿瘤细胞产生独特的和肿瘤特异性的抗原。因此,从不同的角度来看,可以通过考虑突变的类型(例如,删除、插入、颠换、转换,易位)和突变的影响(例如,无义、错义、框架移位等)来识别新表位,这可以作为第一内容过滤器,通过该过滤器消除沉默的和其他非相关(例如,非表达)的突变。还应当理解,新表位序列可以定义为具有相对短的长度(例如,7至11聚体)的序列段,其中这样的段会包括氨基酸序列中的变化。最典型地,改变的氨基酸将位于中心氨基酸位置处或附近。例如,典型的新表位可以具有A4-N-A4、或A3-N-A5、或A2-N-A7、或A5-N-A3、或A7-N-A2的结构,其中A是蛋白氨基酸且N是改变的氨基酸(相对于野生型或相对于匹配的正常)。例如,本文预期的新表位序列包括具有相对短的长度的序列段(例如,5至30聚体,更典型地7至11聚体,或12至25聚体),其中此类区段包括氨基酸序列中的改变。
[0031] 因此,应当理解,根据改变的氨基酸的位置,可以在包括改变的氨基酸的许多新表位序列中呈现单一氨基酸改变。有利地,这种序列的变异性允许多个新表位的选择,因此增加了潜在有用靶点的数量,所述潜在有用靶点然后可以基于一种或多于一种期望的性状(例如,对患者HLA类型的最高亲和力、最高结构稳定性等)来选择。最典型地,新表位的计算长度为2至50个氨基酸,更典型地为5至30个氨基酸,最典型地为9至15个氨基酸,改变的氨基酸优选地位于中心或以改善其与MHC的结合的方式的其他方式就位。例如,当表位由MHC-I复合物呈递时,典型的新表位长度为约8至11个氨基酸,而通过MHC-II复合物呈递的典型新表位的长度为约13至17个氨基酸的长度。如将容易理解的,由于新表位中改变的氨基酸的位置可以不是中心的,因此实际的肽序列和新表位的实际拓扑结构可以显著变化。
[0032] 当然,应该理解的是,新表位的识别或发现可以从多种生物材料开始,该生物材料包括新鲜的活组织检查、冷冻或以其他方式保存的组织或细胞样品、循环肿瘤细胞、外排体、各种体液(尤其是血液)等。因此,合适的组学分析方法包括核酸测序、特别是在DNA上操作的NGS方法(例如,Illumina测序、离子流测序、454焦磷酸测序、纳米孔测序等)、RNA测序(例如,RNAseq、基于逆转录的测序等),以及蛋白质测序或基于质谱的测序(例如,SRM、MRM、CRM等)。
[0033] 因此,特别是对于基于核酸的测序,应特别认识到肿瘤组织的高通量基因组测序使得能够快速识别新表位。然而,必须理解的是,在如此获得的序列信息与标准参考进行比较的情况下,正常发生的患者间变异(例如,由于SNP、短插入缺失、不同重复数目等)以及杂合性会导致相对大量的潜在假阳性新表位。值得注意的是,当将患者的肿瘤样品与同一患者的匹配的正常(即非肿瘤)样品进行比较时,可以消除这种不准确性。
[0034] 在本发明主题的一个特别优选的方面,通过肿瘤和匹配的正常样品的全基因组测序和/或外显子组测序(通常在至少10x、更通常至少20x的覆盖深度下)来进行DNA分析。或者,也可以由先前序列确定的已建立的序列记录(例如,SAM、BAM、FASTA、FASTQ或VCF文件)来提供DNA数据。因此,数据集可以包括未处理或已处理的数据集,并且示例性数据集包括具有BAMBAM格式、SAMBAM格式、FASTQ格式、或FASTA格式的数据集。然而,特别优选的是,数据集以BAMBAM格式或BAMBAM diff对象提供(参见例如US2012/0059670A1和US2012/0066001A1)。此外,应该注意的是,数据集反映了同一患者的肿瘤和匹配的正常样品,从而获得患者和肿瘤特异性信息。因此,可以排除不产生肿瘤的遗传种系改变(例如,沉默突变、SNP等)。当然,应该认识到肿瘤样品可能来自初始肿瘤、治疗开始时的肿瘤、复发性肿瘤或转移部位等。在大多数情况下,患者的匹配正常样品可以是血液或来自与肿瘤相同组织类型的非患病组织。
[0035] 同样,序列数据的计算分析可以以多种方式执行。然而,在最优选的方法中,通过位置导向的肿瘤和正常样品的同步比对在计算机中进行分析,例如,在US2012/0059670A1和US2012/0066001A1中公开的使用BAM文件和BAM服务器。这种分析有利地减少了假阳性新表位并显著降低了对记忆和计算资源的需求。
[0036] 应当注意,应该读取针对计算机的任何语言以包括任何合适的计算设备组合,包括服务器、接口、系统、数据库、主体、对等点、引擎、控制器、或单独或共同操作的其他类型的计算设备。应当理解,计算设备包括处理器,该处理器被配置为执行存储在有形的、非暂时性的计算机可读存储介质(例如,硬盘驱动器、固态驱动器、RAM、闪存、ROM等)上的软件指令。软件指令优选地配置计算设备以提供作用、职责或其他功能,如下面关于公开的装置所讨论的。此外,所公开的技术可以体现为计算机程序产品,其包括存储软件指令的非暂时性计算机可读介质,该软件指令使得处理器执行与基于计算机的算法、过程、方法或其他指令的实施相关联的所公开的步骤。在特别优选的实施方案中,各种服务器、系统、数据库、或使用标准化协议或算法的接口交换数据,其可能基于HTTP、HTTPS、AES、公私密钥交换、web服务API、已知金融交易协议、或其他电子信息交换方法。设备之间的数据交换可以通过分组交换网、因特网、LAN、WAN、VPN、或其他类型的分组交换网;电路交换网;细胞交换网;或其他类型的网络进行。
[0037] 从不同的角度来看,可以建立患者和癌症特异性的计算机模拟的序列采集,其具有5至25个氨基酸的预定长度并且包括至少一个改变的氨基酸。对于每个改变的氨基酸,这种收集通常包括至少两个、至少三个、至少四个、至少五个、或至少六个成员,其中改变的氨基酸的位置不相同。然后,可以将这种采集用于进一步过滤(例如,通过亚细胞定位、转录/表达水平、MHC-I和/或MHC-II亲和力等),如下文更详细描述的。
[0038] 例如,并且使用对肿瘤和匹配的正常序列数据的同步位置导向分析,发明人先前识别了来自多种癌症和患者的多种癌症新表位,包括以下癌症类型:BLCA、BRCA、CESC、COAD、DLBC、GBM、HNSC、KICH、KIRC、KIRP、LAML、LGG、LIHC、LUAD、LUSC、OV、PRAD、READ、SARC、SKCM、STAD、THCA和UCEC。所有新表位数据均可以在国际申请PCT/US16/29244中找到,该申请通过引用并入本文。
[0039] 取决于癌症的类型和阶段,应当注意,当给予患者检查点抑制剂时,并非所有经识别的新表位都必然导致患者在治疗上同样有效的反应。实际上,本领域众所周知,只有一部分新表位会产生免疫反应。为了增加治疗上所需的反应的可能性,可以进一步过滤新表位。当然,应当理解,为了本文提供的方法的目的,下游分析不需要考虑沉默突变。然而,优选的突变分析除了提供突变类型(例如,缺失、插入、颠换、转换、易位)之外还将提供突变影响的信息(例如,无义、错义等)并且可以由此作为第一内容过滤器,经由第一内容过滤器可以消除沉默突变。例如,可以选择新表位用于进一步考虑,其中突变是移码、无义和/或错义突变。
[0040] 在进一步的过滤方法中,新表位也可以经历亚细胞定位参数的详细分析。例如,如果新表位被识别为具有膜相关的位置(例如,位于细胞的细胞膜外部)和/或如果计算机模拟的结构计算确认了新表位可能是溶剂暴露的,或呈现结构稳定的表位(例如,J Exp Med 2014)等,则可以选择该新表位序列用于进一步考虑。
[0041] 关于过滤新表位,通常预期新表位特别适用于本文,其中组学(或其他)分析显示新表位实际被表达。可以以本领域已知的所有方式进行新表位的表达和表达水平的识别,优选的方法包括定量RNA(hnRNA或mRNA)分析和/或定量蛋白质组学分析。最典型地,包含新表位的阈值水平将是相应匹配的正常序列的表达水平的至少20%、至少30%、至少40%、或至少50%的表达水平,从而确保(新)表位对免疫系统是至少潜在“可见的”。因此,通常优选组学分析还包括基因表达分析(转录组学分析)以帮助识别具有突变的基因的表达水平。
[0042] 本领域已知有许多转录组学分析方法,并且认为所有已知方法都适用于本文。例+如,优选的材料包括mRNA和初级转录物(hnRNA),并且RNA序列信息可以从逆转录的polyA -RNA获得,其转而又从同一患者的肿瘤样品和匹配的正常(健康)样品获得。同样地,应当注意,虽然polyA+-RNA通常优选作为转录组的代表,但其他形式的RNA(hn-RNA、非多腺苷酸化RNA、siRNA、miRNA等)也被认为适用于本文。优选的方法包括定量RNA(hnRNA或mRNA)分析和/或定量蛋白质组学分析,尤其包括RNAseq。在其他方面,使用基于RNA-seq、qPCR和/或rtPCR的方法进行RNA定量和测序,尽管多种替代方法(例如,基于固相杂交的方法)也被认为是合适的。从另一个角度来看,转录组学分析可能是合适的(单独地或与基因组分析组合地)以识别并定量具有癌症和患者特异性突变的基因。
[0043] 类似地,可以以多种方式进行蛋白质组学分析以确定新表位的RNA的实际转译,并且本文预期了所有已知的蛋白质组学分析方式。然而,特别优选的蛋白质组学方法包括基于抗体的方法和质谱法。此外,应该注意的是,蛋白质组学分析不仅可以提供关于蛋白质本身的定性或定量信息,还可以包括其中蛋白质具有催化或其他功能活性的蛋白质活性数据。用于进行蛋白质组学测定的一种示例性技术在US7473532中描述,其通过引用并入本文。其他合适的识别并甚至定量蛋白质表达的方法包括各种质谱分析(例如,选择性反应监测(SRM)、多反应监测(MRM)和连续反应监测(CRM))。因此,应当理解,上述方法将提供患者和肿瘤特异性新表位,该新表位可以通过含有新表位的蛋白质的亚细胞定位(例如,膜定位)、表达强度(例如,与同一患者的匹配的正常相比过表达)等被进一步过滤。
[0044] 在过滤的又一个方面,可以将新表位与包含已知人序列(例如患者或患者集合)的数据库进行比较,以避免使用人相同的序列。此外,过滤还可以包括去除由于患者中的SNP引起的新表位序列,其中SNP存在于肿瘤和匹配的正常序列中。例如,dbSNP(单核苷酸多态性数据库)是由国家生物技术信息中心(NCBI)与国家人类基因组研究所(NHGRI)合作开发和主持的不同物种内和跨越不同物种的遗传变异的免费公共档案。虽然数据库的名称仅暗示一类多态性的集合(单核苷酸多态性(SNP)),但它实际上包含相对广泛的分子变异:(1)SNP、(2)短缺失和插入多态性(indel/DIP)、(3)微卫星标记物或短串联重复(STR)、(4)多核苷酸多态性(MNP)、(5)杂合序列、和(6)经命名的变体。dbSNP接受明显中性的多态性、对应于已知表型的多态性和无变异的区域。使用如上所述的这种数据库和其他过滤选项,可以过滤患者和肿瘤特异性新表位以除去那些已知序列,产生具有多个具有显著减少的假阳性的新表位序列的序列组。
[0045] 然而,尽管过滤,应该认识到并非所有新表位都对免疫系统可见,因为新表位也需要呈递在患者的MHC复合物上。实际上,只有一部分新表位具有足够的用于呈递的亲和性,并且MHC复合物的大量多样性将排除使用大多数(如果不是全部)常见的新表位。因此,在免疫治疗的背景下,应当显而易见的是,新表位在新表位与MHC复合物结合并由MHC复合物呈递的情况下更有效。从另一个角度来看,用检查点抑制剂治疗成功需要经由MHC复合物呈递多个新表位,其中新表位必须对患者的HLA类型具有最小亲和力。因此,应当理解,有效的结合和呈递是新表位序列和患者的特定HLA类型的组合功能。最典型地,HLA类型确定包括至少三种MHC-I亚型(例如,HLA-A、HLA-B、HLA-C)和至少三种MHC-II亚型(例如,HLA-DP、HLA-DQ、HLA-DR),优选地,每个亚型被确定至至少2位数的深度或至少4位数的深度。然而,本文还预期了更大的深度(例如,6位数、8位数)。
[0046] 一旦确定患者的HLA类型(使用已知的化学或计算机模拟确定),便计算或从数据库获得HLA类型的结构解决方案,然后将其用于计算机模拟中的对接模型以确定(通常已过滤的)新表位对HLA结构解决方案的结合亲和力。如下面将进一步讨论的,用于确定结合亲和力的合适系统包括NetMHC平台(参见例如,Nucleic Acids Res.2008年7月1日;36(Web Server期):W509-W512)。然后选择对先前确定的HLA类型具有高亲和力(例如,小于100nM、小于75nM、小于50nM)的新表位连同对MHC-I/II亚型的了解以用于治疗创建。
[0047] 可以使用本领域众所周知的湿化学中的各种方法进行HLA确定,并且认为所有这些方法都适用于本文。然而,在特别优选的方法中,还可以使用包含大多数或所有已知和/或常见HLA类型的参考序列从计算机模拟中的组学数据来预测HLA类型,如下文更详细显示的。
[0048] 例如,在根据本发明主题的一种优选方法中,通过数据库或测序仪提供相对大量的映射到染色体6p21.3(或发现HLA等位基因的位置/附近位置的任何其他位置)的患者序列读数。最典型地,序列读数将具有约100至300个基的长度并且包括元数据,包括读取质量、比对信息、方向、位置等。例如,合适的格式包括SAM、BAM、FASTA、GAR等。并非限制本发明的主题,通常优选的是,患者序列读数提供至少5x、更通常至少10x、甚至更通常至少20x、最通常至少30x的覆盖深度。
[0049] 除了患者序列读数之外,预期的方法还使用一种或多于一种的参考序列,其包括多种已知且不同的HLA等位基因的序列。例如,典型的参考序列可以是合成(没有相应的人或其他哺乳动物对应物)序列,其包括具有HLA类型的多个HLA等位基因的至少一种HLA类型的序列段。例如,合适的参考序列包括至少50种不同HLA-A等位基因的已知基因组序列的集合。或者,或另外地,参考序列还可以包括用于HLA-A的至少50个不同等位基因的已知RNA序列的集合。当然,如下面更详细地进一步讨论的,参考序列不限于HLA-A的50个等位基因,而是可以具有关于HLA型和等位基因的数量/组成的替代组成。最典型地,参考序列将是计算机可读格式,并且将由数据库或其他数据存储设备提供。例如,合适的参考序列格式包括FASTA、FASTQ、EMBL、GCG或GenBank格式,并且可以直接由公共数据储存库(例如,IMGT、国际ImMunoGeneTics信息系统、或等位基因频率网数据库、EUROSTAM,URL:www.allelefrequencies.net)的数据获得或构建。或者,参考序列也可以基于一个或多于一个预定标准由个体已知的HLA等位基因构建,该预定标准例如等位基因频率、种族等位基因分布、常见或稀有等位基因类型等。
[0050] 使用参考序列,现在可以经由de Bruijn图处理患者序列读数以识别具有最佳拟合的等位基因。在这种情况下,应该注意的是,每个个体携带每个HLA类型的两个等位基因,并且这些等位基因可以非常相似,或者在一些情况下甚至相同。这种高度的相似性对传统的比对方案构成了重大问题。发明人现在已经发现HLA等位基因、以及甚至非常密切相关的等位基因可以使用这样的方法来解析,其中通过将序列读数分解成相对小的k-mer(通常具有10至20个碱基的长度)并通过实施加权投票过程来构建de Bruijn图,在加权投票过程中基于与等位基因序列相匹配的序列读数的k-mer,每个患者序列读数为每个等位基因提供投票(“定量阅读支持”)。然后,等位基因的累积最高投票表明最可能的经预测的HLA等位基因。另外,通常优选的是,与等位基因匹配的每个片段也用于计算该等位基因的总覆盖度和覆盖深度。
[0051] 可以根据需要进一步改进或精确评分,尤其是在许多最高命中相似的情况下(例如,其得分的很大一部分来自k-mer的高度共享的集合)。例如,分数精确化可以包括加权方案,其中将与当前最高命中基本上相似(例如,>99%或其他预定值)的等位基因从将来的考虑因素中移除。然后,通过因子(例如,0.5)对当前最高命中使用的k-mer的计数重新加权,并且通过对这些加权计数求和来重新计算每个HLA等位基因的得分。重复该选择过程以找到新的最高命中。使用RNA序列数据甚至可以进一步提高方法的准确性,所述RNA序列数据能够识别由肿瘤表达的等位基因,其有时可以是DNA中存在的2个等位基因中的仅1个。在预期的系统和方法的其他有利的方面,可以处理DNA或RNA、或DNA和RNA的组合,以进行高度准确且可以由肿瘤或血液DNA或RNA衍生的HLA预测。其他方面,用于高精度计算机模拟的HLA分型的合适方法和考虑因素描述于国际PCT/US16/48768中,其通过引用并入本文。
[0052] 一旦确定了患者和肿瘤特异性的新表位和HLA类型,便可以通过将新表位与HLA对接并确定最佳结合物(例如,最低KD,例如,小于500nM、或小于250nM、或小于150nM、或小于50nM)来进行进一步的计算分析,例如,使用NetMHC。应当理解,这种方法不仅会识别真实的针对患者和肿瘤的特定新表位,而且还识别最可能在细胞上呈现的那些新表位,并且因此最可能引发具有治疗效果的免疫应答。当然,还应当理解,在将编码表位的核酸作为有效负载包含在病毒中之前,可以在体外对所识别的HLA匹配的新表位进行生物化学验证,如下面进一步讨论的。
[0053] 当然,应该理解的是,患者的HLA类型与患者和癌症特异性的新表位的匹配可以使用除NetMHC之外的系统来完成,并且合适的系统包括NetMHC II、NetMHCpan、IEDB分析资源(URL immuneepitope.org)、RankPep、PREDEP、SVMHC、Epipredict、HLABinding等(参见,例如J Immunol Methods 2011;374:1-4)。应该注意的是在计算最高亲和力时,可以使用在被移动(上文)的经改变的氨基酸的位置处的新表位序列的集合。或者,或另外地,可以通过添加N-和/或C-末端修饰来实现对新表位的修饰,以进一步增加经表达的新表位与患者的HLA类型的结合。因此,新表位可以如所识别的是天然的,或被进一步修饰以更好地匹配特定的HLA类型。此外,如果需要,可以计算相应的野生型序列(即没有氨基酸改变的新表位序列)的结合,以确保高差异亲和力。例如,新表位与其相应的野生型序列之间的MHC结合中特别优选的高差异亲和力是至少2倍、至少5倍、至少10倍、至少100倍、至少500倍、至少1000倍等。
[0054] 一旦完成新表位的所需过滤水平(例如,通过肿瘤相对于正常、和/或表达水平、和/或亚细胞定位、和/或患者特异性的HLA匹配、和/或已知变异来过滤的新表位),预期进一步的过滤步骤,其考虑受新表位影响的基因类型。例如,合适的基因类型包括癌症驱动基因、与细胞分裂的调节相关的基因、与凋亡相关的基因、以及与信号转导相关的基因。然而,在特别优选的方面,癌症驱动基因是特别优选的(其可以跨越多种基因类型的功能,包括受体基因、信号转导基因、转录调节基因等)。在其他预期的方面,合适的基因类型还可以是已知的乘客基因和参与代谢的基因。
[0055] 如前所述,可以预期的是靶向癌症驱动基因被认为提供增强的治疗效果,因为针对癌症驱动因子编码的蛋白质的免疫应答不仅会促进针对肿瘤细胞的基于细胞的细胞毒性作用,而且还促进对具有癌症驱动新表位的癌症驱动基因编码的蛋白质的功能性干扰。从另一个角度来看,在免疫治疗方法和更传统的基于蛋白质功能的方法二者中,使用本文预期的系统和方法的治疗应答均会靶向癌细胞。因此,预期进一步分析经过滤的新表位以确定它们与特定基因的关联(例如,经过滤的新表位存在于转录基因的外显子中或存在于mRNA中),并且该基因随后被识别为属于期望的基因类型,特别是作为癌症驱动基因。例如,癌症驱动基因中存在的新表位是经识别的癌症驱动新表位。
[0056] 关于作为癌症驱动基因的基因识别或其他测定(例如,预测),多种方法和预测算法是本领域已知的,并且被认为适用于本文。例如,合适的算法包括MutsigCV(Nature 2014,505(7484):495-501)、ActiveDriver(Mol Syst Biol 2013,9:637)、MuSiC(Genome Res 2012、22(8):1589-1598)、OncodriveClust(Bioinformatics 2013,29(18):2238-
2244)、OncodriveFM(Nucleic Acids Res 2012,40(21):e169)、OncodriveFML(Genome Biol 2016,17(1):128)、Tumor Suppressor and Oncogenes(TUSON)(Cell 2013,155(4):
948-962)、20/20+(https://github.com/KarchinLab/2020plus)、以及oncodriveROLE(Bioinformatics(2014)30(17):i549-i555)。
[0057] 还可以使用概率通路分析工具识别癌症驱动基因,并且特别优选的工具包括PARADIGM(Bioinformatics,2010,第26卷(第237页-第245页))。PARADIGM通过从观察数据集D中得出推论,在遗传路径图φ的背景下评估基因的活性。路径图φ描述了隐藏的基因表达变量、它们相应的观察数据、和任何调节输入和输出之间的联系。变量通过因子相互连接,该因子编码约束相互联系的变量的概率依赖性。然后,PARADIGM在衍生自φ的因子图上使用置信传播算法,通过组合基因表达、拷贝数和遗传相互作用来计算每个基因、复合物、蛋白质家族和细胞过程的推断通路水平(IPL)。阳性IPL反映了该基因在肿瘤中是活性的可能性(并且因此可能是癌症驱动基因),阴性IPL反映了该基因在肿瘤中相对于正常的是非活性的可能性。这些方法通过计算Shift(PARADIGM-SHIFT)得分可以进一步改进,该得分基于将观察到的基因活动的下游结果与其调整输入的预期结果进行比较的直觉,如于其他处所描述的(Bioinformatics(2012)28(18):i640-i646)。
[0058] 或者,或另外地,癌症驱动基因的识别还可以采用已知癌症驱动基因的多种来源及其与特定癌症的关联。例如,驱动突变的Intogen  Catalog(2016.5;URL:www.intogen.org)包含由Cancer Genome Interpreter在28个肿瘤类型的泛癌组群的6792个外显子组中进行的驱动分析的结果。根据现有技术的临床和实验数据来识别经验证的致癌突变,而通过OncodriveMUT方法预测了未知显著性突变的影响。同样,Intogen Cancer Drivers Database(2014.12;URL:www.intogen.org)包含在Rubio-Perez和Tamborero等人(Cancer Cell 27(2015),第382至396页)中被识别为驱动子的基因的信息。
[0059] 此外,下表1提供了最常见的癌症驱动基因的示例性选择及其在特定癌症中的作用。
[0060]
[0061]
[0062] 表1
[0063] 用于特定癌症并且适合与本文提供的教导结合使用的其他示例性的癌症驱动基因包括以下:
[0064] ALL(急性淋巴细胞白血病)驱动基因包括CNOT1、CNOT3、FBXW7、FLT3、KRAS、NF1、NRAS、PTEN、RB1、RPL5、SH2B3和TP53。
[0065] AML(急性骨髓性白血病)驱动基因包括ASXL1、BCOR、CBFB、CEBPA、CHD4、CUL1、DIS3、DNMT3A、EGFR、EZH2、FLT3、IDH1、IDH2、KDM6A、KIT、KRAS、MED12、NF1、NPM1、NRAS、PHF6、PRPF8、PTPN11、RAD21、RUNX1、STAG2、SUZ12、TET2、THRAP3、TP53、U2AF1和WT1。
[0066] BLCA(膀胱癌)驱动基因包括ACSL6、ACTB、ACTG1、ADAM10、AFF4、AHNAK、AHR、ANK3、APC、AQR、ARFGAP1、ARFGEF2、ARHGAP26、ARHGAP35、ARID1A、ARID1B、ATR、BAP1、BCLAF1、BCOR、BLM、BMPR2、BRAF、BRCA1、CAD、CARM1、CASP8、CAST、CAT、CCAR1、CCT5、CDH1、CDK12、CDKN1A、CDKN1B、CDKN2A、CEP290、CHD3、CHD9、CHEK2、CIC、CLASP2、CLSPN、CLTC、CNOT1、COPS2、CSDE1、CTCF、CTNNB1、CUL2、DDX3X、DDX5、DICER1、DIS3、DLG1、EEF1B2、EIF2AK3、EIF4A2、EIF4G1、ELF1、ELF3、EP300、ERBB2IP、ERBB3、ERCC2、FAM123B、FAT1、FBXW7、FGFR2、FGFR3、FKBP5、FLT3、FN1、FUS、G3BP2、GNAS、GOLGA5、GPS2、HLA-A、HNRPDL、HRAS、HSP90AA1、HSP90AB1、HSPA8、IDH1、IREB2、IRS2、KDM6A、KEAP1、KLF6、LIMA1、MAP3K1、MAP3K4、MAP4K3、MECOM、MED12、MED24、MET、MGA、MLH1、MLL2、MLL3、MTOR、MYH10、MYH11、NAP1L1、NCF2、NCOR2、NDRG1、NFE2L2、NOTCH1、NRAS、NUP107、NUP98、PCDH18、PCSK6、PHF6、PIK3CB、PIP5K1A、PTEN、PTPRU、RAD21、RASA1、RB1、RBM5、RHOA、RPSAP58、SETD2、SETDB1、SF3A3、SF3B1、SFPQ、SMAD4、SMC1A、SOS1、SOS2、STAG1、STAG2、STK4、SUZ12、TAF1、TAOK1、TAOK2、TBL1XR1、TBX3、TGFBR2、THRAP3、TNPO1、TP53、TP53BP1、TRIO、TSC1、TXNIP、ZFP36L2、ZMYM2和ZNF814。
[0067] BRCA(乳腺癌)驱动基因包括ACO1、ACSL6、ACTB、ACVR1B、AFF4、AHNAK、AKAP9、AKT1、ANK3、APC、AQR、ARFGEF2、ARHGAP35、ARID1A、ARID2、ARID4B、ARNTL、ASH1L、ASPM、ATF1、ATIC、ATM、ATR、BAP1、BCOR、BMPR2、BNC2、BPTF、BRAF、BRCA1、BRCA2、CAD、CARM1、CASP8、CAST、CBFB、CCAR1、CCT5、CDH1、CDK12、CDKN1B、CEP290、CHD4、CHD9、CHEK2、CIC、CLASP2、CLSPN、CLTC、CNOT3、CSDE1、CSNK1G3、CTCF、CUL1、DDX3X、DDX5、DHX15、DIS3、EGFR、EIF1AX、EIF2C3、EIF4A2、EIF4G1、ELF1、EP300、ERBB2、ERBB2IP、ERCC2、FBXW7、FLT3、FMR1、FN1、FOXA1、FOXP1、FUBP1、FUS、G3BP2、GATA3、GOLGA5、GPS2、HCFC1、HLA-A、HLF、HNRPDL、HSPA8、IDH1、ITSN1、KALRN、KDM5C、KEAP1、KLF4、KRAS、LCP1、LPHN2、LRP6、MACF1、MAP2K4、MAP3K1、MAX、MECOM、MED12、MED23、MED24、MGA、MKL1、MLH1、MLL、MLL2、MLL3、MLLT4、MSR1、MTOR、MUC20、MYB、MYH11、MYH14、MYH9、NCOR1、NDRG1、NF1、NF2、NOTCH1、NOTCH2、NR4A2、NRAS、NSD1、NUP107、NUP98、PAX5、PBRM1、PCDH18、PCSK6、PHF6、PIK3CA、PIK3CB、PIK3R1、PIK3R3、PIP5K1A、POLR2B、PRKAR1A、PRKCZ、PTEN、PTGS1、PTPRU、RB1、RBBP7、RBM5、RFC4、RHEB、RPGR、RPL5、RUNX1、SEC24D、SETD2、SETDB1、SF3B1、SFPQ、SMAD4、SMARCA4、SOS1、SOS2、SPTAN1、SRGAP1、STAG1、STAG2、STIP1、STK11、STK4、SUZ12、SVEP1、TAF1、TBL1XR1、TBX3、TCF12、TCF7L2、TFDP1、TGFBR2、THRAP3、TNPO1、TOM1、TP53、TRIO、ZFP36L1和ZFP36L2。
[0068] CLL(慢性淋巴细胞白血病)驱动基因包括ACTG1、ANK3、ARID1A、ATM、BCOR、CLSPN、CNOT3、CREBBP、DDX3X、EGFR、EP300、ERBB2IP、FBXW7、FGFR2、FGFR3、HNRPDL、IDH1、IRF2、KDM6A、KRAS、MED12、MLL、MLL2、MLL3、MTOR、MYD88、NCOR1、NF1、NOTCH1、NRAS、PBRM1、PLCB1、RB1、SETDB1、SF3B1、STAG2、TP53和XPO1。
[0069] CM(皮肤黑色素瘤)驱动基因包括ACO1、ACSL3、ACTG1、ACTG2、ACVR1B、ACVR2A、AFF4、AHCTF1、AHNAK、AHR、AKT1、ANK3、AQR、ARFGAP1、ARFGEF2、ARHGAP26、ARHGAP29、ARHGAP35、ARHGEF2、ARHGEF6、ARID1B、ARID2、ASPM、ATF1、ATIC、ATP6AP2、ATRX、B2M、BAP1、BAZ2B、BCLAF1、BLM、BMPR2、BNC2、BPTF、BRAF、BRCA1、BRWD1、C15orf55、CASP1、CASP8、CAST、CAT、CBFB、CCAR1、CCT5、CDC73、CDH1、CDK4、CDKN1A、CDKN2A、CEP290、CHD1L、CHD3、CHD6、CHD9、CHEK2、CIC、CLASP2、CLCC1、CLOCK、CLSPN、CLTC、CNOT3、COL1A1、COPS2、CRTC3、CSDA、CSNK1G3、CTCF、CTNNB1、CUL1、CUL2、CUL3、CYLD、CYTH4、DDX3X、DDX5、DHX15、DICER1、DIS3、DLG1、DNMT3A、EIF1AX、EIF2AK3、EIF4A2、EIF4G1、EIF4G3、ELF1、ELF3、EP300、ERBB2IP、ERBB3、EZH2、FAF1、FANCI、FAS、FBXW7、FCRL4、FGFR3、FMR1、FN1、FOXP1、FUBP1、FXR1、G3BP2、GATA3、GNG2、GOLGA5、HDAC3、HDAC9、HLA-A、HLA-B、HLF、HNRPDL、HRAS、HSPA8、IDH1、IDH2、IREB2、IRF7、ITGA9、ITSN1、JMY、KDM5C、KDM6A、KLF4、KLF6、KRAS、LCP1、LDHA、LNPEP、LRP6、LRPPRC、MAGI2、MAP2K1、MAP2K4、MAP3K1、MAP3K11、MAP3K4、MAP4K3、MAT2A、MCM3、MCM8、MECOM、MED17、MED24、MEN1、MFNG、MKL1、MLH1、MLL3、MSR1、NCF2、NCKAP1、NCOR1、NDRG1、NF1、NF2、NFATC4、NFE2L2、NOTCH1、NPM1、NR2F2、NR4A2、NRAS、NTN4、NUP107、NUP98、PAX5、PCDH18、PER1、PHF6、PIK3C2B、PIK3CA、PIK3CB、PIK3R1、PIK3R3、PIP5K1A、PLCB1、POLR2B、POM121、PPP2R1A、PPP2R5A、PPP2R5C、PPP6C、PRRX1、PSMA6、PTEN、PTGS1、RAC1、RAD21、RAD23B、RASA1、RASA2、RB1、RBBP7、RGS3、RHEB、RHOA、RHOT1、RPL22、RPL5、RTN4、RUNX1、SEC24D、SETDB1、SF3A3、SF3B1、SFPQ、SMAD2、SMAD4、SMC1A、SMURF2、SOS1、SOS2、SOX9、SPOP、STAG1、STAG2、STK11、SUZ12、SVEP1、SYK、SYNCRIP、TAOK1、TBX3、TCF12、TCF4、TFDP1、TFDP2、TGFBR2、TJP2、TNPO1、TP53、TRERF1、USP6、VHL、VIM、WASF3、WIPF1、WNK1、WT1、XRN1、YBX1、ZC3H11A、ZFP36L2、ZMYM2、ZNF638和ZNF814。
[0070] COREAD(大肠腺癌)驱动基因包括ACO1、ACSL6、ACVR1B、AKAP9、APC、ARID1A、ARNTL、ASPM、ATM、ATRX、AXIN2、BCOR、BMPR2、BPTF、BRAF、BRWD1、CAD、CASP8、CDC73、CDK12、CDKN1B、CEP290、CHD4、CHD9、CLSPN、CNOT1、CREBBP、CTCF、CTNNB1、CUL1、DIS3、DNMT3A、EGFR、ELF3、FAM123B、FBXW7、FN1、FOXP1、FXR1、GATA3、GNAS、GOLGA5、IDH2、ITSN1、KRAS、LPHN2、MAP2K1、MAP3K4、MECOM、MED12、MED24、MGA、MLL2、MSR1、MYH10、NF1、NR2F2、NR4A2、NRAS、NTN4、NUP107、NUP98、PCBP1、PIK3CA、PIK3R1、POLR2B、PPP2R1A、PTEN、PTGS1、PTPN11、PTPRU、RAD21、RBM10、RTN4、RUNX1、SF3B1、SMAD2、SMAD4、SMC1A、SOS2、SOX9、SRGAP3、STAG2、SYNCRIP、TAF1、TBX3、TCF12、TCF7L2、TGFBR2、TP53、TP53BP1、TRIO、WIPF1、WT1和ZC3H11A。
[0071] DLBC(弥漫性大B淋巴细胞瘤)驱动基因包括ACTB、AKAP9、ARID1A、CHD4、CREBBP、FBXO11、MLL2、MYC、SMARCA4和TP53。
[0072] ESCA(食管癌)驱动基因包括ACO1、ACSL6、ACVR1B、ADAM10、AFF4、AHR、ARFGEF2、ARHGAP26、ARHGAP35、ARID1A、ARID2、ARNTL、ASPM、ATM、ATR、ATRX、BAP1、BCLAF1、BLM、BPTF、CAPN7、CDH1、CDKN1B、CDKN2A、CEP290、CHD4、CIC、CLTC、CNOT1、CNOT3、CREBBP、CSNK1G3、CTNNB1、CUL3、DDX5、DLG1、EEF1A1、EGFR、EIF2AK3、EIF4G1、ELF3、EP300、ERBB2IP、ERCC2、EZH2、FBXW7、FGFR2、FLT3、HGF、HLA-B、IREB2、IRS2、ITSN1、KALRN、KDM6A、LRP6、MACF1、MAP2K4、MAP3K4、MED12、MET、MGA、MLL2、MSR1、MTOR、NCKAP1、NFE2L2、NSD1、NUP107、NUP98、PAX5、PIK3CA、PTPRU、RAD21、RBM10、RHOA、RTN4、SETD2、SF3B1、SHMT1、SMAD4、SMARCA4、SMC1A、SOX9、SPTAN1、SRGAP3、SYNCRIP、TAF1、TAOK1、TAOK2、TBX3、TP53、TP53BP1、TRIO、WT1、ZC3H11A、ZFP36L2和ZNF814。
[0073] GBM(多形性成胶质细胞瘤)驱动基因包括ACAD8、ADAM10、AKAP9、ANK3、AQR、ARFGEF2、ARHGAP35、ARHGEF6、ARID1A、ARID2、ATRX、BAP1、BPTF、BRAF、BRCA1、CAD、CARM1、CASP1、CHD8、CLOCK、CLTC、CNOT1、CSDE1、CUL1、DIS3、EGFR、EZH2、FAT1、FN1、HDAC9、HSP90AB1、IDH1、KALRN、KDM5C、KDM6A、KDR、KRAS、LRP6、MAP3K4、MAP4K3、MAX、MEN1、MET、MLL、NCF2、NCOR1、NEDD4L、NF1、NFATC4、NR2F2、NUP107、PAX5、PBRM1、PCDH18、PIK3CA、PIK3CB、PIK3R1、PRPF8、PTEN、PTPN11、RB1、RPL5、RPSAP58、SF3B1、SIN3A、SOS1、SOX9、SPTAN1、STAG2、TGFBR2、TJP1、TP53、TRIO、WT1和ZNF814。
[0074] HC(肝癌)驱动基因包括ACVR2A、APC、ARHGAP35、ARID1A、ARID1B、ARID2、ASH1L、ATRX、BLM、BPTF、CEP290、CNOT1、CTNNB1、FLT3、IDH1、ITSN1、MACF1、MLL3、MYH10、NF1、NFATC4、NFE2L2、PBRM1、PIK3CA、PTEN、RTN4、SETDB1、SF3B1、TBL1XR1和TP53。
[0075] HNSC(头颈部鳞状细胞癌)驱动基因包括ACAD8、ACTB、ACTG1、ACVR2A、ADAM10、AHR、AKT1、APAF1、APC、ARFGAP1、ARFGEF2、ARHGAP35、ARHGEF6、ARID1B、ARID2、ATIC、ATM、ATP6AP2、ATR、ATRX、B2M、BAP1、BAZ2B、BCL11A、BMPR2、BNC2、BPTF、BRAF、BRCA1、BRWD1、CAD、CARM1、CASP1、CASP8、CAT、CCAR1、CCT5、CDH1、CDK12、CDKN1B、CDKN2A、CEP290、CHD9、CIITA、CLASP2、CLSPN、CNOT4、COL1A1、CSNK2A1、CTCF、CTNNB1、CUL1、CUL3、CYLD、DDX3X、DICER1、DNMT3A、EEF1A1、EGFR、EIF2C3、ELF1、ELF4、EP300、EPHA2、EZH2、FAT1、FAT2、FBXW7、FGFR2、FLT3、FMR1、FN1、FOXP1、FUBP1、G3BP2、GNAS、GPSM2、HLA-A、HLA-B、HNRPDL、HRAS、HSPA8、IREB2、IRF6、IRS2、KALRN、KDM5C、KDM6A、KLF6、LAMA2、LPHN2、MACF1、MAP3K1、MAP4K3、MED17、MEF2C、MEN1、MGA、MGMT、MLL、MLL2、MSR1、MTOR、MUC20、MYH9、NCF2、NCKAP1、NCOR1、NEDD4L、NF1、NFATC4、NFE2L2、NOTCH1、NOTCH2、NR4A2、NSD1、NUP107、PABPC3、PAX5、PBRM1、PCDH18、PIK3CA、PIK3R1、PIK3R3、POLR2B、PPP2R1A、PPP2R5C、PRPF8、PRRX1、PSIP1、RAC1、RAD21、RASA1、RASGRP1、RHOA、RPL22、RPSAP58、RUNX1、SEC24D、SF3B1、SIN3A、SMAD2、SMARCA4、SMC1A、SOX9、SPOP、SPTAN1、STAG2、STIP1、TAOK1、TAOK2、TBL1XR1、TBX3、TCF12、TCF4、TFDP1、TFDP2、TGFBR2、THRAP3、TJP2、TP53、TRIO、TRIP10、U2AF1、WHSC1、ZC3H11A和ZNF750。
[0076] LGG(低级别胶质瘤)驱动基因包括ACO1、ARFGEF2、ARHGAP26、ARHGEF6、ARID1A、ARID1B、ARID2、ATRX、CAD、CDK12、CHEK2、CIC、DDX3X、EEF1B2、EGFR、EIF1AX、FAM123B、FAT1、FUBP1、HGF、IDH1、IDH2、KAT6B、MAX、MECOM、MET、MLL、MLL2、MTOR、NCOR1、NEDD4L、NF1、NF2、NOTCH1、PIK3CA、PIK3R1、PTEN、PTPN11、RASA1、RB1、SETD2、SMARCA4、TAF1、TCF12、TJP1、TP53、TRIO、ZMYM2、ZNF292和ZNF814。
[0077] LUAD(腺癌)驱动基因包括ACAD8、ACO1、ACTG1、ACTG2、ACVR1B、ACVR2A、ADAM10、AFF4、AKT1、ARFGAP1、ARHGAP26、ARID1A、ATIC、ATP6AP2、BAP1、BAZ2B、BLM、BMPR2、BRAF、BRWD1、CAPN7、CARM1、CASP8、CAT、CCAR1、CCT5、CDH1、CDK12、CDKN1B、CDKN2A、CHD1L、CHEK2、CIC、CLASP2、CLSPN、CNOT3、CNOT4、COL1A1、COPS2、CREBBP、CRNKL1、CSNK1G3、CTCF、CTNNB1、CUL2、CUL3、CYLD、DDX3X、DDX5、DHX15、DNMT3A、EEF1B2、EFTUD2、EGFR、EIF2AK3、EIF2C3、EIF4A2、EIF4G1、EP300、EPHA4、EPHB2、ERBB2IP、ERCC2、EZH2、FAT1、FBXW7、FGFR2、FMR1、FN1、FUBP1、FXR1、G3BP1、G3BP2、GNAI1、GNG2、GPSM2、HLA-A、HSP90AA1、HSP90AB1、HSPA8、IDH1、IREB2、IRS2、KDM6A、KDR、KEAP1、KLF6、KRAS、LCP1、LDHA、LPHN2、MAP2K1、MAP2K4、MAP3K1、MAP3K4、MAP4K1、MAP4K3、MAX、MED17、MED24、MEN1、MET、MGA、MKL1、MLH1、MLL、MLL3、MMP2、MSR1、MYB、MYH10、NCK1、NCKAP1、NEDD4L、NF1、NF2、NFE2L2、NPM1、NRAS、NTN4、NTRK2、NUP107、NUP98、PAX5、PBRM1、PCSK6、PHF6、PIK3R1、PIK3R3、PIP5K1A、POLR2B、PPP2R1A、PPP2R5A、PRPF8、PRRX1、PSMA6、PSMD11、PTEN、PTGS1、PTPN11、RAD23B、RASA1、RB1、RBM10、RBM5、RHEB、RTN4、SETD2、SETDB1、SF3B1、SFPQ、SHMT1、SIN3A、SMAD2、SMAD4、SMARCA4、SMC1A、SOX9、SPRR3、STAG1、STIP1、STK11、STK4、SVEP1、SYNCRIP、TAOK1、TAOK2、TBL1XR1、TCF12、TCF4、TCF7L2、TFDP1、TGFBR2、TNPO1、TOM1、TP53、TP53BP1、U2AF1、UPF3B、ZMYM2和ZNF814。
[0078] LUSC(肺小细胞癌)驱动基因包括ABL2、ACAD8、ACO1、ACSL6、ACTG2、ACVR1B、ADAM10、AFF4、AQR、ARFGEF2、ARHGEF6、ARID1A、ARID1B、ARNTL、B2M、BLM、CASP8、CAST、CCAR1、CDC73、CDH1、CDKN1A、CDKN2A、CHD1L、CHD3、CHEK2、CIC、CLASP2、CLOCK、CNOT3、CNOT4、COPS2、CSDA、CSDE1、CTNNB1、CTTN、CUL1、DDX3X、DHX15、DHX9、DLG1、EEF1A1、EGFR、EIF2C3、EIF4A2、ELF1、ERBB2IP、EZH2、FGFR2、FGFR3、FMR1、FN1、FOXP1、FUBP1、FXR1、G3BP2、GATA3、GNAI1、GOLGA5、GPSM2、HLA-A、HLF、HRAS、HSP90AA1、HSP90AB1、HSPA8、IDH1、IREB2、IRS2、ITSN1、KDM5C、KEAP1、KRAS、MAP2K1、MAP3K1、MAP3K4、MED17、MED24、MEN1、MET、MKL1、MLH1、MLL、MLL2、MUC20、MYB、NCF2、NCK1、NDRG1、NF1、NFATC4、NFE2L2、NOTCH1、NR4A2、NTN4、NUP107、NUP98、PAX5、PCDH18、PCSK6、PHF6、PIK3CA、PIK3CB、PIK3R3、PIP5K1A、PPP2R5C、PRPF8、PTEN、PTPN11、RAD21、RASA1、RB1、RBM10、RGS3、RPL5、RTN4、SEC24D、SETD2、SETDB1、SF3A3、SF3B1、SIN3A、SMAD2、SMAD4、SPTAN1、SRGAP3、STAG1、STK11、STK4、SUZ12、SYNCRIP、TAOK2、TBL1XR1、TBX3、TFDP1、TFDP2、TGFBR2、THRAP3、TJP2、TNPO1、TOM1、TP53、UPF3B、WIPF1、WT1、ZC3H11A和ZFP36L2。
[0079] MB(成神经管细胞瘤)驱动基因包括ARID1A、ARID1B、ARID2、BCLAF1、BCOR、CCAR1、CREBBP、CTNNB1、DDX3X、FBXW7、FMR1、KDM6A、MGA、MLL2、MLL3、NF1、PIK3CA、PRKAR1A、PTCH1、SMARCA4、SMO、TAF1、TCF4和TP53。
[0080] MM(多发性骨髓瘤)驱动基因包括APC、ARHGAP35、ARID2、BRAF、CASP8、CEP290、CHD9、DDX3X、FAM46C、FXR1、KRAS、MECOM、NF1、NRAS、NSD1、PIK3CA、SF3B1和TP53。
[0081] NB(成神经细胞瘤)驱动基因包括AHR、ALK、ANK3、ARID1A、ATM、ATRX、CEP290、COL1A1、CREBBP、EIF2C3、KLF4、LRP6、MACF1、MECOM、MET、MLL2、MYCN、NF1、NOTCH1、NRAS、PBRM1、PIK3CA、PIK3CB、PTPN11、STAG1、TAF1和TRIO。
[0082] NSCLC(非小细胞肺癌)驱动基因包括AKAP9、APC、HGF、KALRN、KEAP1、KRAS、MLL3、RB1、SEC24D、SMARCA4和TP53。
[0083] OV(卵巢癌)驱动基因包括ACO1、ACTG1、AFF4、ARID1A、ASH1L、ASPM、ATF1、ATIC、ATR、ATRX、BAP1、BAZ2B、BMPR2、BRAF、BRCA1、BRCA2、CASP1、CCAR1、CCT5、CDK12、CHD1L、CHD4、CLASP2、CLSPN、CSDE1、CTNNB1、CUL2、DDX5、DLG1、DNMT3A、EIF2AK3、EIF4A2、ERBB2IP、F8、FAM123B、FBXW7、FLT3、FMR1、GNAS、GOLGA5、GPS2、HDAC3、HGF、HSP90AA1、ITSN1、KRAS、LPHN2、MAP3K4、MAP4K3、MECOM、MED12、MKL1、MLH1、MLL2、MYH10、NCKAP1、NDRG1、NF1、NOTCH1、NR4A2、NRAS、NSD1、PIK3CA、POLR2B、PTEN、RB1、RHOA、SETD2、SETDB1、SIN3A、SOS1、STAG1、STAG2、TBX3、TCF7L2、TFDP1、TGFBR2、TJP1、TOM1、TP53、TP53BP1、TRIO和YBX1。
[0084] PAAD(胰腺癌)驱动基因包括ACVR1B、AHNAK、ANK3、ARHGAP35、ARID1A、ARID2、ATM、CREBBP、EP300、EPC1、KRAS、MAP2K4、MLL3、PBRM1、PCDH18、PCSK6、SF3B1、SMAD4、SMARCA4、TGFBR2和TP53。
[0085] PRAD(前列腺腺癌)驱动基因包括ADCY1、AHNAK、AKAP9、APC、AQR、ARFGAP3、ARID1B、ATIC、ATM、ATRX、BCLAF1、BCOR、BNC2、BPTF、BRAF、CASP1、CAT、CDC27、CDH1、CDKN1B、CEP290、CHD1L、CHD3、CHD4、CHEK2、CNOT1、CNOT3、CNTNAP1、CTNNB1、CUL2、CUL3、EEF1B2、EGFR、EIF2AK3、EIF4G1、EP300、ERCC2、FAT1、FGFR2、FIP1L1、FN1、FRG1、G3BP2、GNAS、HGF、HNF1A、HRAS、HSP90AB1、HSPA8、IDH1、IRS2、KDM6A、KEAP1、MECOM、MED12、MLL2、MYH10、NAP1L1、NKX3-1、NOTCH1、NOTCH2、NUP98、PCDH18、PIK3CB、PLXNA1、PRPF8、PTEN、RPSAP58、SCAI、SETDB1、SMAD4、SMARCA1、SMARCB1、SPOP、SVEP1、TAOK2、TBL1XR1、TBX3、THRAP3、TJP1、TJP2、TP53、TP53BP1、TRIO、WHSC1L1、WNT5A、ZFHX3和ZNF814.
[0086] RCCC(肾透明细胞癌)驱动基因包括ACO1、ACTG1、AHR、AKT1、ARHGAP26、ARID1A、ARID1B、ARID2、ASH1L、ATF1、ATM、BAP1、BCLAF1、BCOR、BMPR2、CAD、CAT、CCAR1、CDC73、CDH1、CHEK2、CLTC、CNOT3、CNOT4、COPS2、CSDA、CTCF、CUL1、DDX3X、DDX5、DHX15、DICER1、DIS3、EEF1A1、EGFR、EIF2AK3、EIF2C3、EIF4A2、EIF4G1、ELF1、ERBB2IP、EZH2、FAM123B、FLT3、FMR1、FUS、G3BP2、HDAC9、HLF、HNRPDL、HSP90AB1、IDH1、ITSN1、KDM5C、KDM6A、KEAP1、LCP1、LPHN2、LRP6、MAX、MED17、MED24、MET、MGA、MKL1、MLL3、MTOR、NCOR1、NFE2L2、NTN4、NUP98、PABPC1、PBRM1、PCDH18、PCSK6、PHF6、PIK3R1、PIP5K1A、PPP2R1A、PSMA6、PSME3、PTEN、RASA1、RPL22、RPL5、SEC24D、SETD2、SHMT1、SIN3A、SMAD2、SMC1A、SOX9、SRGAP3、TAOK2、TBL1XR1、TCF12、TJP1、TJP2、TP53BP1、TRIO、VHL、WHSC1L1、WT1、ZFP36L2和ZNF814。
[0087] SCLC(小细胞肺癌)驱动基因包括AHNAK、AHR、AKAP9、ANK3、ARID1A、ARID1B、ARID2、ASH1L、ASPM、ATR、ATRX、BAZ2B、BCLAF1、BMPR2、BNC2、BRWD1、CCT5、CDK12、CHD1L、CHEK2、CLSPN、CREBBP、DICER1、EIF2AK3、EP300、FAM123B、FAT1、FN1、GNAS、HGF、HSP90AB1、ITSN1、KALRN、KDM6A、MED12、MLL、MLL2、MLL3、MNDA、MSR1、MTOR、MYB、NCKAP1、NF1、NOTCH1、NR4A2、NUP107、PIK3CA、PTEN、PTPRU、RAD21、RB1、SIN3A、SOS1、SOS2、SPTAN1、TAF1、TBX3、TJP1、TP53和ZC3H11A。
[0088] STAD(胃腺癌)驱动基因包括ACAD8、ACSL6、ACTG2、ACVR1B、ACVR2A、ADAM10、AFF4、AKAP9、ANK3、APC、AQR、ARFGEF1、ARHGAP26、ARHGAP35、ARHGEF6、ARID1A、ARID1B、ARID4A、ASH1L、ATIC、ATP6AP2、ATR、ATRX、BAP1、BCOR、BPTF、BRAF、BRCA1、CAD、CAPN7、CASP8、CAT、CCAR1、CCT5、CDC73、CDH1、CDKN2A、CEP290、CHD1L、CHD3、CHEK2、CLASP2、CLOCK、CLTC、CNOT1、CNOT4、COL1A1、COPS2、CSDA、CSDE1、CSNK1G3、CTNNB1、CUL1、CUL2、CUL3、CYLD、DDX5、DHX15、DIS3、DLG1、DNMT3A、EEF1A1、EGFR、EIF2AK3、EIF4A2、EIF4G1、ELF3、EPHA1、ERBB2IP、ERCC2、EZH2、FAM123B、FAS、FGFR2、FLT3、FOXP1、FUBP1、G3BP2、GATA3、GNA11、GNAI1、GOLGA5、HDAC3、HLA-A、HLA-B、HNRPDL、HSP90AB1、IREB2、IRF2、IRS2、KDM6A、KLF4、KLF6、KRAS、LCP1、LPHN2、MACF1、MAP2K1、MAP2K4、MAP3K1、MECOM、MED12、MED17、MET、MKL1、MLH1、MSR1、MYH11、MYH9、NAP1L1、NCK1、NCKAP1、NEDD4L、NFE2L2、NR2F2、NR4A2、NSD1、NUP107、NUP98、PCSK5、PHF6、PIK3CA、PIK3CB、PIK3R1、PIP5K1A、POLR2B、PPP2R1A、PRRX1、PTEN、PTGS1、PTPN11、PTPRF、PTPRU、RAD21、RASA1、RBBP7、RBM5、RHOA、RPL22、RTN4、RUNX1、SETD2、SF3B1、SIN3A、SMAD2、SMAD4、SMARCA4、SMC1A、SOS1、SOS2、SOX9、SPOP、SRGAP3、STARD13、STIP1、STK4、SUZ12、TAF1、TAOK2、TBL1XR1、TBX3、TCF4、TCF7L2、TFDP1、THRAP3、TJP1、TJP2、TNPO1、TNPO2、TP53、TP53BP1、WIPF1、WT1、ZC3H11A和ZMYM2。
[0089] THCA(甲状腺癌)驱动基因包括AHNAK、AKAP9、ARHGAP26、ARID2、BPTF、BRAF、CDK12、CHD3、CTNNB1、DICER1、EIF1AX、GNAS、HNRPDL、HRAS、KRAS、LDHA、MLL、MLL3、NCK1、NRAS、NSD1、PIK3CA、PPM1D、PPP2R1A、PRPF8、PTEN、RPSAP58、TJP1、TP53、TRIO、WIPF1和ZC3H11A。
[0090] UCEC(子宫内膜癌)驱动基因包括ACACA、ACTB、ACTG1、AHR、AKT1、ALK、ANK3、ARAP3、ARHGAP35、ARHGEF6、ARID1A、ARID5B、ARNTL、ATF1、ATIC、ATM、ATR、AXIN1、BAZ2B、BCLAF1、BMPR2、BRAF、BRCA1、CAPN7、CARM1、CAST、CAT、CCND1、CDKN1B、CHD3、CHD4、CHD9、CHEK2、CLOCK、CLTC、CNOT4、CSNK1G3、CTCF、CTNNB1、CTNND1、CUL1、CUX1、DEPDC1B、DHX15、DHX35、DICER1、DIS3、DNMT3A、EGFR、EIF1AX、EIF2AK3、EIF2C3、EIF4A2、EIF4G1、EP300、ERBB3、FAM123B、FAS、FBXW7、FGFR2、FLT3、FOXA2、FUBP1、FXR1、G3BP2、GNAI1、GPS2、GPSM2、HDAC3、HGF、IDH1、ING1、INPP4A、INPPL1、IREB2、KDM6A、KLF4、KRAS、MAP2K4、MAP3K1、MAX、MED17、MET、MGA、MKL1、MLH1、MLH3、MUC20、MYB、MYH10、NCF2、NCKAP1、NCOR1、NDRG1、NEDD4L、NF2、NFE2L2、NR2F2、NRAS、NUP93、PCDH18、PGR、PHF6、PIK3CA、PIK3R1、PIK3R3、PLCG1、PLXNB2、PPP2R1A、PPP2R5A、PPP2R5C、PRPF8、PRRX1、PTEN、PTPN11、RAD21、RAD23B、RBBP7、RBM5、RHEB、ROBO2、RPL22、RPL5、RTN4、RUNX1、SEC31A、SHMT1、SMAD2、SMC1A、SOX17、SPOP、SRGAP3、STIP1、SUZ12、SYNCRIP、TBL1XR1、TBX3、TFDP1、TGFBR2、TP53、TP53BP1、U2AF1、VHL、WIPF1、ZC3H11A、ZFHX3、ZFP36L2、ZMYM2和ZNF814。
[0091] 在识别经过滤的新表位作为癌症驱动新表位后,可以使用癌症驱动新表位的序列信息来制备一种或多于一种的免疫治疗剂。在其他药剂中,特别优选的是,患者可以使用用核酸构建体遗传修饰的病毒进行治疗,所述核酸构建体导致至少一种经鉴定的新表位的表达,以启动针对肿瘤的免疫应答。例如,合适的病毒包括腺病毒、腺相关病毒、甲病毒、疱疹病毒、慢病毒等。然而,特别优选腺病毒。此外,进一步优选病毒是复制缺陷型和非免疫原性病毒,其通常通过所选病毒蛋白(例如E1、E3蛋白)的靶向缺失来实现。通过删除E2b基因功能可以进一步增强这种期望的性质,并且可以使用最近报道的基因修饰的人293细胞来实现高滴度的重组病毒(例如,J Virol.1998年2月;72(2):926-933)。最典型地,所需的核酸序列(用于从病毒感染的细胞表达)处于本领域众所周知的适当的调节元件的控制之下。无论重组病毒的类型,可以预期的是病毒可用于在体外或体内感染患者(或非患者细胞)细胞。例如,病毒可以经皮下注射或静脉注射以感染患者抗原呈递细胞。或者,可以体外感染免疫活性细胞(例如,NK细胞、T细胞、巨噬细胞、树突细胞等),然后输血至患者。或者,免疫疗法不需要依赖病毒,但可以被核酸疫苗接种或其他重组载体影响,所述其他重组载体导致新表位(例如,作为单一肽、串联小基因等)在期望细胞、特别是免疫活性细胞中的表达。
[0092] 同样地,除(病毒)表达载体之外的其他免疫治疗剂也被认为是合适的,并且包括基因工程细胞(并尤其是各种免疫活性细胞),该基因工程细胞表达对癌症驱动新表位具有亲和力的嵌合抗原受体或表达具有对与癌症驱动新表位特异性结合的抗体的亲和力的CD16受体。例如,预期的免疫治疗剂包括NK细胞(例如,aNK细胞、haNK细胞、或taNK细胞,可从NantKwest商业获得,9920Jefferson Blvd.Culver City,CA 90232)或基因修饰的T细胞(例如,表达T细胞受体),或用HLA匹配的患者和癌症特异性的新表位离体刺激的T细胞。
[0093] 或者,也可以将癌症驱动新表位作为肽来施用,其任选地与载体蛋白结合,从而起到癌症疫苗的作用。在进一步预期的方面,癌症驱动新表位也可以用于制备特异性结合癌症驱动新表位的抗体。如WO2016/172722中所述,此类抗体可以是人、人源化或完全合成的抗体。
[0094] 此外,还应该认识到,一旦新表位被识别为癌症驱动新表位,便可以选择靶向至由携带癌症驱动新表位的癌症驱动基因编码的蛋白质的药物。例如,在癌症驱动基因编码受体的情况下,可以施用针对受体(或其配体)的受体拮抗剂或抑制剂或抗体,所述受体拮抗剂或抑制剂或抗体对受体具有特异性。类似地,在癌症驱动基因编码激酶的情况下,可以向患者施用激酶抑制剂。因此,应当理解,癌症驱动新表位的识别可以提供使用免疫系统和突变蛋白质的功能靶向突变蛋白质的组合治疗选择。
[0095] 因此,发明人还预期了一种免疫治疗组合物,其包括:与(i)合成抗体相结合的载体,所述合成抗体与对患者特异性的癌症驱动新表位具有结合特异性,与(ii)合成的患者特异性的癌症驱动新表位结合的载体,与(iii)编码患者特异性的癌症驱动新表位的核酸结合的载体,或与(iv)嵌合抗原受体结合的载体,所述嵌合抗原受体对患者特异性的癌症驱动新表位具有结合特异性。例如,当免疫治疗组合物配制成疫苗时,载体通常包含单一载体蛋白(例如KLH或白蛋白)或适于接种疫苗的药学上可接受的聚合物。另一方面,当免疫治疗组合物用作基于细胞或病毒的组合物时,载体通常包括免疫活性细胞(例如,CD8+T细胞、树突细胞或NK细胞)或重组病毒(例如,腺病毒),该重组病毒包括编码癌症驱动新表位的核酸。如本领域常用的,免疫治疗组合物通常包括适于注射或输注的药学上可接受的载体。
[0096] 实施例
[0097] 数据集:如下所示的各种癌症的TCGA WGS和RNAseq数据从加利福尼亚大学圣克鲁兹分校(UCSC)癌症基因组学中心(https://cghub.ucsc.edu/)下载。基于完整的WGS数据的可用性选择TCGA样品以帮助进行计算机内HLA分型。有条件时,使用相应样品的RNAseq数据。
[0098] 识别肿瘤变异和新表位:单核苷酸变体(SNV)和插入/缺失(插入缺失标记)基本上如US2012/0059670A1和US2012/0066001A1中公开的方式使用BAM文件通过肿瘤和正常样品的位置导向同步比对来识别。由于HLA-A等位基因主要与9-mer肽片段结合,因此发明人着重于9-mer新表位的识别。通过产生源自经识别的SNV或插入缺失标记的9-mer氨基酸链的所有可能排列来识别新表位(即,每个9-mer在独特位置具有改变的氨基酸)。作为减少特定新表位的可能的脱靶效应的方式,发明人过滤了抗每个已知人基因产生的所有可能的9-mer肽序列的经识别的新表位。此外,发明人还从dbSNP(URL:www.ncbi.nlm.nih.gov/SNP/)过滤出单核苷酸多态性,以解释在测序数据中可能遗漏的稀有蛋白质序列。通过RNA表达以及观察到的编码变体的等位基因频率进一步对新表位进行排序,以抵消由肿瘤异质性引起的问题。
[0099] HLA分型:HLA分型数据不适用于TCGA样品;因此,发明人使用基本上如PCT/US16/48768中所述的WGS、RNAseq数据和HLA森林算法进行了计算机内HLA分型。简而言之,Burrows-Wheeler比对算法用于将测序读数与IMGT/HLA数据库内的每个不同HLA等位基因比对(URL:www.ebi.ac.uk/ipd/imgt/hla/)。每个比对都基于碱基保守性给出分数,并考虑阅读质量分数。然后,每个HLA等位基因将具有一个得分总和,用于说明每个读数与某个HLA等位基因比对的程度,并且选择具有最高得分的等位基因作为初级等位基因分型。然后,通过去除与初级等位基因分型完全对齐的读数来进行二级等位基因分型,然后重新对未与初级等位基因比对的读数打分。使用该方法,发明人获得了对于至少4位数的水平的所有样品的HLA-A、HLA-B、HLA-C和HLA-DRB1的分型结果。
[0100] 新表位-HLA亲和力测定:NetMHC 3.4(URL:www.cbs.dtu.dk/services/NetMHC-3.4/)被用于预测新表位是否会与特定的HLA等位基因结合。为了减少复杂性空间,发明人选择限制对HLA-A等位基因的结合分析,因为它们是最充分表征的HLA等位基因并且具有最佳的结合亲和力模型。由于NetMHC 3.4工具不具有针对每个经识别的HLA-A等位基因的模型,如果患者的HLA-A分型不能用于NetMHC 3.4,则选择HLA超型用于结合预测。保留具有经预测的结合亲和力<500nM蛋白质浓度的新表位用于进一步分析。然而,其他更严格的结合标准(<250nM、或<150nM、或<50nM)也被认为是合适的。
[0101] 癌症类型的编码突变和新表位负荷:有条件时,WGS数据和相应的RNAseq数据用于建立23个癌症分类中750个患者样品的每兆碱基编码DNA的潜在新表位和体细胞编码变体的基线,如图1所示。在这里,显示了TCGA内23个癌症分类中750个患者样品的新表位和变体的计数。上图显示了新表位的计数,而下图显示了变体的计数。y轴显示每兆碱基编码DNA的计数(人类基因组组装(hg)19为88MB)。x轴显示每个癌症分类,括号中显示患者样品的数量。由方表示中位数样品计数。下面的饼图表示所有癌症类型中新表位和正常表位的百分比(此处:在匹配的正常组织或已知的SNP数据库中发现)。
[0102] 从图1可以容易地看出,突变和新表位负荷在不同的癌症类型中变化,黑素瘤和鳞状细胞肺癌具有最高的新表位负荷,并且甲状腺癌和急性髓性白血病具有最低新表位负荷。针对已知人类序列的数据库过滤假定的新表位以消除潜在的脱靶效应,其揭示了仅有10%的经识别的新表位映射到已知蛋白质的片段;因此,大多数突变产生独特的蛋白质序列。然而,即使独特的新表位的比例相对较高,也不能推测其表达和呈现。实际上,如下面更详细地进一步显示的,应该认识到,表达和呈现的新表位的数量显著低于仅通过测序识别的新表位的数量。
[0103] 使用TCGA数据集和上述方法,发明人通过肿瘤相比正常的(DNA+)、经表达的肿瘤相比正常的(DNA+,RNA+)、以及经表达的HLA匹配的肿瘤相比正常的(DNA+,RNA+,netMHC+)来过滤新表位。这里,发明人将该分析限制于含有HLA-A*02:01等位基因的样品,该等位基因高频率出现在北美洲。值得注意的是,如图2中图解所示,经预测的新表位、经表达的新表位、以及对HLA-A*02:01具有亲和力的新表位的数量分别为211、285、89351和1732。校正不同的样品大小,经预测的新表位、经表达的新表位和对HLA-A*02:01具有亲和力的新表位的平均数分别为23272、9619和138。然后,使用如上所述的已知的癌症驱动基因的集合来分析未经过滤和经过滤的新表位在所需基因类型内(这里:癌症驱动基因)的位置。有趣的是,正如图2的饼图所示,在所有癌症中,只有6%的新表位发生在癌症驱动基因中,这有助于进一步将其他令人困惑的大量潜在靶向减少到具有潜在的高影响的相对少数目的靶向。此外,特别是在经过滤的新表位的数量相对较少的情况下,癌症驱动新表位的识别将提供选择用于治疗的新表位的机会,否则治疗将无法实现。
[0104] 本文中对数值范围的描述仅旨在用作单独提及落入该范围内的每个单个值的简写方法。除非本文另有说明,否则将各个单独的值并入本说明书中,如同其在本文中单独引用一样。除非本文另有说明或上下文明显矛盾,否则本文所述的所有方法均可以以任何合适的顺序进行。关于本文的某些实施例提供的任何和所有示例或示例性语言(例如“诸如”)的使用仅旨在更好地说明本发明,而不是对要求保护的本发明的范围构成限制。说明书中的任何语言都不应被解释为表示对于本发明的实践必不可少的任何未要求保护的要素。
[0105] 对于本领域技术人员显而易见的是,在不脱离本文的发明构思的情况下,除了已经描述的那些之外的更多修改是可能的。因此,除了所附权利要求的范围之外,本发明的主题不受限制。此外,在解释说明书和权利要求时,所有术语应以与上下文一致的最广泛的方式解释。特别地,术语“包括”和“包含”应该被解释为以非排他的方式指代元件、组件或步骤,指示所引用的元件、组件或步骤可以存在、或者被利用、或与未明确引用的其他元件、组件或步骤组合。当说明书权利要求涉及选自A、B、C……和N的至少一种时,文本应解释为只需要组中的一个元素,而不是A加N、或B加N等。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈