首页 / 专利库 / 遗传学 / PER基因 / 甲病毒新抗原载体

甲病毒新抗原载体

阅读:931发布:2020-07-21

专利汇可以提供甲病毒新抗原载体专利检索,专利查询,专利分析的服务。并且本文公开了甲病毒载体,其包括源自受试者的 肿瘤 的新 抗原 编码核酸序列。还公开了与载体相关的核苷酸、细胞和方法,包括它们作为 疫苗 的用途。,下面是甲病毒新抗原载体专利的具体信息内容。

1.一种用于递送新抗原表达系统的组合物,其包含:
所述新抗原表达系统,
其中所述新抗原表达系统包含一个或多个载体,
所述一个或多个载体包含:
(a)RNA甲病毒骨架,其中所述RNA甲病毒骨架包含:
(i)至少一个启动子核苷酸序列,和
(ii)至少一个聚腺苷酸化(poly(A))序列;和
(b)新抗原盒,其中所述新抗原盒包含:
(i)至少一个源自受试者体内存在的肿瘤的新抗原编码核酸序列,其包含:
(I)至少一个源自所述肿瘤的肿瘤特异性和受试者特异性MHC I类新抗原编码核酸序
列,并包含:
(A)具有至少一个改变的MHC I类表位编码核酸序列,所述改变使所编码的肽序列不同
于由野生型核酸序列编码的相应肽序列,和
(B)任选地,5'接头序列,和
(C)任选地,3'接头序列;
(ii)任选地,可操作地连接于所述新抗原编码核酸序列的第二启动子核苷酸序列;和
(iii)任选地,至少一个MHC II类抗原编码核酸序列;
(iv)任选地,至少一个编码GPGPG基酸接头序列的核酸序列(SEQ ID NO:56);和
(v)任选地,至少一个第二poly(A)序列,其中所述第二poly(A)序列是所述甲病毒的原生poly(A)序列或外源poly(A)序列。
2.一种用于递送新抗原表达系统的组合物,其包含:
所述新抗原表达系统,
其中所述新抗原表达系统包含一个或多个载体,
所述一个或多个载体包含:
(a)RNA甲病毒骨架,其中所述RNA甲病毒骨架包含以SEQ ID NO:6所示的核酸序列,其
中所述RNA甲病毒骨架序列包含26S启动子核苷酸序列和poly(A)序列,其中所述26S启动子序列是所述RNA甲病毒骨架的内源序列,并且其中所述poly(A)序列是所述RNA甲病毒骨架的内源序列;和
(b)在所述26S启动子核苷酸序列与所述poly(A)序列之间整合的新抗原盒,其中所述
新抗原盒包含:
(i)至少一个源自受试者体内存在的肿瘤的新抗原编码核酸序列,其包含:
(I)至少10个肿瘤特异性和受试者特异性MHC I类新抗原编码核酸序列,它们彼此线性
连接并且各自包含:
(A)具有至少一个改变的MHC I类表位编码核酸序列,所述改变使所编码的肽序列不同
于由野生型核酸序列编码的相应肽序列,其中所述MHC I表位编码核酸序列编码长度为7-
15个氨基酸的MHC I类表位,
(B)5'接头序列,其中所述5'接头序列编码所述MHC I表位的原生N端氨基酸序列,并且其中所述5'接头序列编码长度为至少3个氨基酸的肽,
(C)3'接头序列,其中所述3'接头序列编码所述MHC I表位的原生N端酸序列,并且其中所述3'接头序列编码长度为至少3个氨基酸的肽,并且
其中所述新抗原盒可操作地连接于所述26S启动子核苷酸序列,其中所述MHC I类新抗
原编码核酸序列中的每一者编码长度为13至25个氨基酸的多肽,并且其中每个MHC I类新抗原编码核酸序列的每个3'端与以下MHC I类新抗原编码核酸序列的5'端连接,其中例外为所述新抗原盒中的最终MHC I类新抗原编码核酸序列;和
(ii)至少两个MHC II类抗原编码核酸序列,其包含:
(I)PADRE MHC II类序列(SEQ ID NO:48),
(II)破伤类毒素MHC II类序列(SEQ ID NO:46),
(III)编码连接所述PADRE MHC II类序列和所述破伤风类毒素MHC II类序列的GPGPG
氨基酸接头序列的第一核酸序列,
(IV)编码连接所述至少两个MHC II类抗原编码核酸序列的5'端与至少20个肿瘤特异
性和受试者特异性MHC I类新抗原编码核酸序列的GPGPG氨基酸接头序列的第二核酸序列,(V)任选地,编码所述至少两个MHC II类抗原编码核酸序列的3'端处的GPGPG氨基酸接
头序列的第三核酸序列。
3.如权利要求1所述的组合物,其中所述新抗原盒的每个元件的有序序列以下式描述,其从5'至3'包含:
Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
其中P包含所述第二启动子核苷酸序列,其中a=0或1,
N包含所述MHC I类表位编码核酸序列之一,其中c=1,
L5包含所述5'接头序列,其中b=0或1,
L3包含所述3'接头序列,其中d=0或1,
G5包含所述至少一个编码GPGPG氨基酸接头的核酸序列之一,其中e=0或1,
G3包含所述至少一个编码GPGPG氨基酸接头的核酸序列之一,其中g=0或1,
U包含所述至少一个MHC II类抗原编码核酸序列之一,其中f=1,
X=1至400,其中对于每个X,相应的Nc是表位编码核酸序列,并且
Y=0、1或2,其中对于每个Y,相应的Uf是抗原编码核酸序列。
4.如权利要求3所述的组合物,其中对于每个X,相应的Nc是不同的MHC I类表位编码核酸序列。
5.如权利要求3或4所述的组合物,其中对于每个Y,相应的Uf是不同的MHC II类抗原编码核酸序列。
6.如权利要求3至5中任一项所述的组合物,其中
a=0,b=1,d=1,e=1,g=1,h=1,X=20,Y=2,
所述至少一个启动子核苷酸序列是由所述RNA甲病毒骨架提供的单个26S启动子核苷
酸序列,
所述至少一个聚腺苷酸化poly(A)序列是由所述RNA甲病毒骨架提供的至少100个连续
A核苷酸的poly(A)序列,
每个N编码长度为7-15个氨基酸的MHC I类表位,
L5是编码所述MHC I表位的原生N端氨基酸序列的原生5'接头序列,并且其中所述5'接
头序列编码长度为至少3个氨基酸的肽,
L3是编码所述MHC I表位的原生核酸末端序列的原生3'接头序列,并且其中所述3'接
头序列编码长度为至少3个氨基酸的肽,
U是PADRE II类序列和破伤风类毒素MHC II类序列中的每一者,
所述RNA甲病毒骨架是以SEQ ID NO:6所示的序列,并且
所述MHC I类新抗原编码核酸序列中的每一者编码长度为13至25个氨基酸的多肽。
7.如前述权利要求中任一项所述的组合物,所述组合物还包含纳米颗粒递送媒介物。
8.如权利要求7所述的组合物,其中所述纳米颗粒递送媒介物是脂质纳米粒子(LNP)。
9.如权利要求8所述的组合物,其中所述LNP包含可电离的氨基脂质。
10.如权利要求9所述的组合物,其中所述可电离的氨基脂质包含MC3样(二亚油基甲
基-4-二甲基氨基丁酸酯)分子。
11.如权利要求7至10中任一项所述的组合物,其中所述纳米颗粒递送媒介物包封所述
新抗原表达系统。
12.如权利要求8所述的组合物,其还包含多个LNP,其中所述LNP包含:
所述新抗原表达系统;
阳离子脂质;
非阳离子脂质;和
抑制所述LNP聚集的缀合脂质,其中所述多个LNP中至少约95%的LNP:
(a)具有非层状形态;或者
(b)是电子致密的。
13.如权利要求12所述的组合物,其中所述非阳离子脂质是(1)磷脂和(2)胆固醇或胆
固醇衍生物的混合物。
14.如权利要求12或13所述的组合物,其中所述抑制所述LNP聚集的缀合脂质是聚乙二
醇(PEG)-脂质缀合物。
15.如权利要求14所述的组合物,其中所述PEG-脂质缀合物选自:PEG-二酰基甘油
(PEG-DAG)缀合物,PEG二烷基丙基(PEG-DAA)缀合物,PEG-磷脂缀合物,PEG-神经酰胺(PEG-Cer)缀合物,及其混合物。
16.如权利要求15所述的组合物,其中所述PEG-DAA缀合物是选自以下的成员:PEG-二
癸氧基丙基(C10)缀合物,PEG-二月桂氧基丙基(C12)缀合物,PEG-二肉豆蔻酰氧基丙基(C14)缀合物,PEG-二棕榈酰氧基丙基(C16)缀合物,PEG-二硬脂酰氧基丙基(C18)缀合物,及其混合物。
17.如权利要求12至16中任一项所述的组合物,其中所述LNP的非层状形态包括反六
形(HII)或立方相结构。
18.如权利要求12至17中任一项所述的组合物,其中所述阳离子脂质占所述LNP中存在
的总脂质的约10摩尔%至约50摩尔%。
19.如权利要求12至17中任一项所述的组合物,其中所述阳离子脂质占所述LNP中存在
的总脂质的约20摩尔%至约50摩尔%。
20.如权利要求12至17中任一项所述的组合物,其中所述阳离子脂质占所述LNP中存在
的总脂质的约20摩尔%至约40摩尔%。
21.如权利要求12至20中任一项所述的组合物,其中所述非阳离子脂质占所述LNP中存
在的总脂质的约10摩尔%至约60摩尔%。
22.如权利要求12至20中任一项所述的组合物,其中所述非阳离子脂质占所述LNP中存
在的总脂质的约20摩尔%至约55摩尔%。
23.如权利要求12至20中任一项所述的组合物,其中所述非阳离子脂质占所述LNP中存
在的总脂质的约25摩尔%至约50摩尔%。
24.如权利要求12至23中任一项所述的组合物,其中所述缀合脂质占所述LNP中存在的
总脂质的约0.5摩尔%至约20摩尔%。
25.如权利要求12至23中任一项所述的组合物,其中所述缀合脂质占所述LNP中存在的
总脂质的约2摩尔%至约20摩尔%。
26.如权利要求12至23中任一项所述的组合物,其中所述缀合脂质占所述LNP中存在的
总脂质的约1.5摩尔%至约18摩尔%。
27.如权利要求12至26中任一项所述的组合物,其中大于95%的所述LNP具有非层状形
态。
28.如权利要求12至27中任一项所述的组合物,其中大于95%的所述LNP是电子致密
的。
29.如权利要求8至28中任一项所述的组合物,其还包含多个LNP,其中所述LNP包含:
阳离子脂质,其占所述LNP中存在的总脂质的50摩尔%至65摩尔%;
抑制LNP聚集的缀合脂质,其占所述LNP中存在的总脂质的0.5摩尔%至2摩尔%;和
非阳离子脂质,其包含:
(a)磷脂和胆固醇或其衍生物的混合物,其中所述磷脂占所述LNP中存在的总脂质的4
摩尔%至10摩尔%,并且所述胆固醇或其衍生物占所述LNP中存在的总脂质的30摩尔%至
40摩尔%;
(b)磷脂和胆固醇或其衍生物的混合物,其中所述磷脂占所述LNP中存在的总脂质的3
摩尔%至15摩尔%,并且所述胆固醇或其衍生物占所述LNP中存在的总脂质的30摩尔%至
40摩尔%;或
(c)所述LNP中存在的总脂质的高达49.5摩尔%,并包含磷脂和胆固醇或其衍生物的混
合物,其中所述胆固醇或其衍生物占所述LNP中存在的总脂质的30摩尔%至40摩尔%。
30.如权利要求8至28中任一项所述的组合物,其还包含多个LNP,其中所述LNP包含:
阳离子脂质,其占所述LNP中存在的总脂质的50摩尔%至85摩尔%;
抑制LNP聚集的缀合脂质,其占所述LNP中存在的总脂质的0.5摩尔%至2摩尔%;和
非阳离子脂质,其占所述LNP中存在的总脂质的13摩尔%至49.5摩尔%。
31.如权利要求29所述的组合物,其中所述磷脂包含二棕榈酰磷脂酰胆(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)或其混合物。
32.如权利要求29或30所述的组合物,其中所述缀合脂质包含聚乙二醇(PEG)-脂质缀
合物。
33.如权利要求32所述的组合物,其中所述PEG-脂质缀合物包含PEG-二酰基甘油(PEG-
DAG)缀合物、PEG-二烷氧基丙基(PEG-DAA)缀合物或其混合物。
34.如权利要求33所述的组合物,其中所述PEG-DAA缀合物包含PEG-二肉豆蔻酰氧基丙
基(PEG-DMA)缀合物、PEG-二硬脂酰氧基丙基(PEG-DSA)缀合物或其混合物。
35.如权利要求32至34中任一项所述的组合物,其中所述缀合物的PEG部分具有约2,
000道尔顿的平均分子量。
36.如权利要求29至35中任一项所述的组合物,其中所述缀合脂质占所述LNP中存在的
总脂质的1摩尔%至2摩尔%。
37.如权利要求8至36中任一项所述的组合物,其中所述LNP包含具有式I结构的化合
物:
或其药学上可接受的盐、互变异构体、前药或立体异构体,其中:
1 2
L 和L各自独立地是-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x-、-S-S-、-C(=O)S-、-SC(=O)-、-RaC(=O)-、-C(=O)Ra-、-RaC(=O)Ra-、-OC(=O)Ra-、-RaC(=O)O-或直接键;
G1是C1-C2亚烷基、-(C=O)-、-O(C=O)-、-SC(=O)-、-RaC(=O)-或直接键;
-C(=O)-、-(C=O)O-、-C(=O)S-、-C(=O)Ra-或直接键;
G是C1-C6亚烷基;
Ra是H或C1-C12烷基;
R1a和R1b在每次出现时独立地是:(a)H或C1-C12烷基;或(b)R1a是H或C1-C12烷基,并且R1b和其所键合的原子一起与相邻R1b和其所键合的碳原子一起形成碳-碳双键;
R2a和R2b在每次出现时独立地是:(a)H或C1-C12烷基;或(b)R2a是H或C1-C12烷基,并且R2b和其所键合的碳原子一起与相邻R2b和其所键合的碳原子一起形成碳-碳双键;
R3a和R3b在每次出现时独立地是:(a)H或C1-C12烷基;或(b)R3a是H或C1-C12烷基,并且R3b和其所键合的碳原子一起与相邻R和其所键合的碳原子一起形成碳-碳双键;
R4a和R4b在每次出现时独立地是:(a)H或C1-C12烷基;或(b)R4a是H或C1-C12烷基,并且R4b和其所键合的碳原子一起与相邻R4b和其所键合的碳原子一起形成碳-碳双键;
R5和R6各自独立地是H或甲基;
R7是C4-C20烷基;
8 9 8 9
R和R各自独立地是C1-C12烷基;或者R和R与其所连接的氮原子一起形成5元、6元或7
元杂环;
a、b、c和d各自独立地是1至24的整数;并且x是0、1或2。
38.如权利要求8至36中任一项所述的组合物,其中所述LNP包含具有式II的结构的化
合物:
或其药学上可接受的盐、互变异构体、前药或立体异构体,其中:
L1和L2各自独立地是-O(C=O)-、-(C=O)O-或碳-碳双键;
R1a和R1b在每次出现时独立地是(a)H或C1-C12烷基,或(b)R1a是H或C1-C12烷基,并且R1b和其所键合的碳原子一起与相邻R1b和其所键合的碳原子一起形成碳-碳双键;
R2a和R2b在每次出现时独立地是(a)H或C1-C12烷基,或(b)R2a是H或C1-C12烷基,并且R2b和其所键合的碳原子一起与相邻R2b和其所键合的碳原子一起形成碳-碳双键;
R3a和R3b在每次出现时独立地是(a)H或C1-C12烷基,或(b)R3a是H或C1-C12烷基,并且R3b和其所键合的碳原子一起与相邻R3b和其所键合的碳原子一起形成碳-碳双键;
R4a和R4b在每次出现时独立地是(a)H或C1-C12烷基,或(b)R4a是H或C1-C12烷基,并且R4b和其所键合的碳原子一起与相邻R4b和其所键合的碳原子一起形成碳-碳双键;
R5和R6各自独立地是甲基或环烷基;
7
R在每次出现时独立地是H或C1-C12烷基;
R8和R9各自独立地是未被取代的C1-C12烷基;或者R8和R9与其所连接的氮原子一起形成包含一个氮原子的5元、6元或7元杂环;
a和d各自独立地是0至24的整数;b和c各自独立地是1至24的整数;并且e是1或2,
其条件是:
R1a、R2a、R3a或R4a中的至少一个是C1-C12烷基,或者L1或L2中的至少一个是-O(C=O)-或-(C=O)O-;并且
R1a和R1b当a为6时不是异丙基或者当a为8时不是正丁基。
39.如权利要求37或39所述的组合物,其还包含一种或多种赋形剂,所述赋形剂包含中性脂质、类固醇和聚合物缀合脂质。
40.如权利要求39所述的组合物,其中所述中性脂质包含以下中的至少一种:1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DSPC)、1,2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸胆碱(DMPC)、1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱(POPC)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)和1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)。
41.如权利要求40所述的组合物,其中所述中性脂质是DSPC。
42.如权利要求39至41中任一项所述的组合物,其中所述化合物与所述中性脂质的摩
尔比在约2:1至约8:1范围内。
43.如权利要求39至42中任一项所述的组合物,其中所述类固醇是胆固醇。
44.如权利要求43所述的组合物,其中所述化合物与胆固醇的摩尔比在约2:1至1:1范
围内。
45.如权利要求39至44中任一项所述的组合物,其中所述聚合物缀合脂质是聚乙二醇
化脂质。
46.如权利要求45所述的组合物,其中所述化合物与所述聚乙二醇化脂质的摩尔比在
约100:1至约25:1范围内。
47.如权利要求45或46所述的组合物,其中所述聚乙二醇化脂质是PEG-DAG、PEG聚乙烯(PEG-PE)、PEG-琥珀酰基-二酰基甘油(PEG-S-DAG)、PEG-cer或PEG二烷氧基丙基氨基甲酸酯。
48.如权利要求45或46所述的组合物,其中所述聚乙二醇化脂质具有以下结构III:
或其药学上可接受的盐、互变异构体或立体异构体,其中:
R10和R11各自独立地是含有10至30个碳原子的直链或支链的饱和或不饱和的烷基链,其中所述烷基链任选地被一个或多个酯键中断;并且
z具有30至60范围内的平均值。
49.如权利要求48所述的组合物,其中R10和R11各自独立地是具有12至16个碳原子的直链的饱和烷基链。
50.如权利要求48或49中任一项所述的组合物,其中所述平均z是约45。
51.如权利要求8至50中任一项所述的组合物,其中所述LNP在与聚阴离子核酸混合时
自组装成非双层结构。
52.如权利要求51所述的组合物,其中所述非双层结构的直径在60nm至120nm之间。
53.如权利要求51所述的组合物,其中所述非双层结构的直径为约70nm、约80nm、约
90nm或约100nm。
54.如权利要求7至53中任一项所述的组合物,其中所述纳米颗粒递送媒介物具有约
100nm的直径。
55.如权利要求1、3至5或7至54中任一项所述的组合物,其中所述新抗原盒整合在所述至少一个启动子核苷酸序列与所述至少一个poly(A)序列之间。
56.如权利要求1、3至5或7至55中任一项所述的组合物,其中所述至少一个启动子核苷酸序列可操作地连接于所述新抗原编码核酸序列。
57.如权利要求1、3至5或7至56中任一项所述的组合物,其中所述一个或多个载体包含一个或多个+-链RNA载体。
58.如权利要求57所述的组合物,其中所述一个或多个+-链RNA载体包含5'7-甲基
(m7g)帽。
59.如权利要求57或58所述的组合物,其中所述一个或多个+-链RNA载体通过体外转录
产生。
60.如权利要求1、3至5或7至59中任一项所述的组合物,其中所述一个或多个载体在哺乳动物细胞内自我复制。
61.如权利要求1、3至5或7至60中任一项所述的组合物,其中所述RNA甲病毒骨架包含
奥拉病毒、摩根堡病毒、委内瑞拉脑炎病毒、罗斯河病毒、塞姆利基森林病毒、辛德毕斯病毒或马雅鲁病毒的至少一个核苷酸序列。
62.如权利要求1、3至5或7至60中任一项所述的组合物,其中所述RNA甲病毒骨架包含
委内瑞拉马脑炎病毒的至少一个核苷酸序列。
63.如权利要求61或62所述的组合物,其中所述RNA甲病毒骨架包含至少用于非结构蛋
白介导扩增的序列,26S启动子序列,poly(A)序列,由所述奥拉病毒、所述摩根堡病毒、所述委内瑞拉马脑炎病毒、所述罗斯河病毒、所述塞姆利基森林病毒、所述辛德毕斯病毒或所述马雅鲁病毒的核苷酸序列编码的非结构蛋白1(nsP1)基因、nsP2基因、nsP3基因和nsP4基因。
64.如权利要求61或62所述的组合物,其中所述RNA甲病毒骨架包含至少用于非结构蛋
白介导扩增的序列,26S启动子序列,和由所述奥拉病毒、所述摩根堡病毒、所述委内瑞拉马脑炎病毒、所述罗斯河病毒、所述塞姆利基森林病毒、所述辛德毕斯病毒或所述马雅鲁病毒的核苷酸序列编码的poly(A)序列。
65.如权利要求63或64所述的组合物,其中用于非结构蛋白介导扩增的序列选自:甲病毒5'UTR、51-nt CSE、24-nt CSE、26S亚基因组启动子序列、19-nt CSE、甲病毒3'UTR或其组合。
66.如权利要求63至65中任一项所述的组合物,其中所述RNA甲病毒骨架不编码结构病
毒粒子蛋白衣壳E2和E1。
67.如权利要求66所述的组合物,其中插入所述新抗原盒来代替所述奥拉病毒、所述摩根堡病毒、所述委内瑞拉马脑炎病毒、所述罗斯河病毒、所述塞姆利基森林病毒、所述辛德毕斯病毒或所述马雅鲁病毒的核苷酸序列内的结构病毒粒子蛋白。
68.如权利要求61或62所述的组合物,其中所述委内瑞拉马脑炎病毒包含SEQ ID NO:3
或SEQ ID NO:5的序列。
69.如权利要求61或62所述的组合物,其中所述委内瑞拉马脑炎病毒包含SEQ ID NO:3
或SEQ ID NO:5的序列,其还包含碱基对7544与11175之间的缺失。
70.如权利要求69所述的组合物,其中所述RNA甲病毒骨架包含以SEQ ID NO:6或SEQ 
ID NO:7所示的序列。
71.如权利要求69或70所述的组合物,其中在第7544位插入所述新抗原盒以代替SEQ 
ID NO:3或SEQ ID NO:5的序列中所示的碱基对7544与11175之间的缺失。
72.如权利要求67至71所述的组合物,其中所述新抗原盒的插入提供了包含所述nsP1-
4基因和所述至少一个抗原编码核酸序列的多顺反子RNA的转录,其中所述nsP1-4基因和所述至少一个抗原编码核酸序列在单独的开放阅读框中。
73.如权利要求1、3至5或7至72中任一项所述的组合物,其中所述至少一个启动子核苷酸序列是由所述RNA甲病毒骨架编码的原生26S启动子核苷酸序列。
74.如权利要求1、3至5或7至72中任一项所述的组合物,其中所述至少一个启动子核苷酸序列是外源RNA启动子。
75.如权利要求1、3至5或7至74中任一项所述的组合物,其中所述第二启动子核苷酸序列是26S启动子核苷酸序列。
76.如权利要求1、3至5或7至74中任一项所述的组合物,其中所述第二启动子核苷酸序列包含多个26S启动子核苷酸序列,其中每个26S启动子核苷酸序列提供一个或多个单独的开放阅读框的转录。
77.如前述权利要求中任一项所述的组合物,其中所述一个或多个载体的大小各为至
少300nt。
78.如前述权利要求中任一项所述的组合物,其中所述一个或多个载体的大小各为至
少1kb。
79.如前述权利要求中任一项所述的组合物,其中所述一个或多个载体的大小各为
2kb。
80.如前述权利要求中任一项所述的组合物,其中所述一个或多个载体的大小各小于
5kb。
81.如前述权利要求中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列
中的至少一者编码由MHC I类在所述肿瘤细胞上递呈的多肽序列或其部分。
82.如权利要求1、3至5或7至81中任一项所述的组合物,其中每个抗原编码核酸序列彼此直接连接。
83.如权利要求1、3至5或7至82中任一项所述的组合物,其中所述至少一个抗原编码核酸序列中的至少一者连接于具有编码接头的核酸序列的不同抗原编码核酸序列。
84.如权利要求83所述的组合物,其中所述接头连接两个MHC I类序列或将MHC I类序
列连接于MHC II类序列。
85.如权利要求84所述的组合物,其中所述接头选自:(1)连续甘氨酸残基,长度为至少
2、3、4、5、6、7、8、9或10个残基;(2)连续丙氨酸残基,长度为至少2、3、4、5、6、7、8、9或10个残基;(3)两个精氨酸残基(RR);(4)丙氨酸、丙氨酸、酪氨酸(AAY);(5)长度为至少2、3、4、5、6、
7、8、9或10个氨基酸残基的共有序列,其由哺乳动物蛋白酶体有效加工;和(6)侧接源自同源蛋白质的抗原并且长度为至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或2-20个氨基酸残基的一个或多个原生序列。
86.如权利要求83所述的组合物,其中所述接头连接两个MHC II类序列或将MHC II类
序列连接于MHC I类序列。
87.如权利要求86所述的组合物,其中所述接头包含序列GPGPG。
88.如权利要求1、3至5或7至87中任一项所述的组合物,其中所述至少一个抗原编码核酸序列的至少一个序列可操作地或直接地连接到单独或连续的序列,所述单独或连续的序列增强所述至少一个抗原编码核酸序列的表达、稳定性、细胞运输、加工和递呈,和/或免疫原性。
89.如权利要求88所述的组合物,其中所述单独或连续的序列包含以下中的至少一者:
泛素序列、经修饰以增加蛋白酶体靶向的泛素序列(例如,所述泛素序列在第76位含有Gly至Ala取代)、免疫球蛋白信号序列(例如IgK)、主要组织相容性I类序列、溶酶体相关膜蛋白(LAMP)-1、人树突状细胞溶酶体相关膜蛋白和主要组织相容性II类序列;任选地其中所述经修饰以增加蛋白酶体靶向的泛素序列是A76。
90.如前述权利要求中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列
中的至少一者编码相对于翻译的相应野生型核酸序列对其相应MHC等位基因的结合亲和增加的多肽序列或其部分。
91.如前述权利要求中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列
中的至少一者编码相对于翻译的相应野生型核酸序列对其相应MHC等位基因的结合稳定性增加的多肽序列或其部分。
92.如前述权利要求中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列
中的至少一者编码相对于翻译的相应野生型核酸序列对其相应MHC等位基因上递呈的可能性增加的多肽序列或其部分。
93.如前述权利要求中任一项所述的组合物,其中所述至少一个改变包括点突变、移码突变、非移码突变、缺失突变、插入突变、剪接变体、基因组重排或蛋白酶体产生的剪接抗原。
94.如前述权利要求中任一项所述的组合物,其中所述肿瘤选自:癌、黑素瘤、乳腺癌、卵巢癌、前列腺癌、肾癌、胃癌、结肠癌、睾丸癌、头颈癌、胰腺癌、膀胱癌、脑癌、B细胞淋巴瘤、急性骨髓性白血病、成人急性淋巴母细胞性白血病、慢性骨髓性白血病、慢性淋巴细胞性白血病、T细胞淋巴细胞性白血病、非小细胞肺癌和小细胞肺癌。
95.如权利要求1、3至5或7至94中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列包含至少2-10、2、3、4、5、6、7、8、9或10个核酸序列。
96.如权利要求1、3至5或7至94中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列包含至少11-20、15-20、11-100、11-200、11-300、11-400、11、12、13、14、15、16、17、
18、19、20或多至400个核酸序列。
97.如权利要求1、3至5或7至94中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列包含至少2-400个核酸序列并且其中所述新抗原编码核酸序列中的至少两个编码所述肿瘤细胞表面上由MHC I类递呈的多肽序列或其部分。
98.如权利要求2或6所述的组合物,其中所述新抗原编码核酸序列中的至少两个编码
所述肿瘤细胞表面上由MHC I类递呈的多肽序列或其部分。
99.如前述权利要求中任一项所述的组合物,其中当施用于所述受试者并被翻译时,由所述至少一个新抗原编码核酸序列编码的所述新抗原中的至少一者被递呈在抗原递呈细胞上,产生靶向所述肿瘤细胞表面上的所述新抗原中的至少一者的免疫应答。
100.如前述权利要求中任一项所述的组合物,其中所述至少一个新抗原编码核酸序列
当施用于所述受试者并被翻译时,在抗原递呈细胞上递呈所述MHC I类或II类新抗原中的至少一者,产生靶向所述肿瘤细胞表面上的所述新抗原中的至少一者的免疫应答,并且任选地其中所述至少一个新抗原编码核酸序列中的每一者的表达由所述至少一个启动子核苷酸序列驱动。
101.如权利要求1、3至5或7至100中任一项所述的组合物,其中每个MHC I类新抗原编
码核酸序列编码长度为8至35个氨基酸,任选地长度为9-17、9-25、8、9、10、11、12、13、14、
15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个氨基酸的多肽序列。
102.如权利要求1、3至5或7至101中任一项所述的组合物,其中存在所述至少一个
MHCII类抗原编码核酸序列。
103.如权利要求1、3至5或7至101中任一项所述的组合物,其中存在所述至少一个MHC II类抗原编码核酸序列并且其包含至少一个MHC II类新抗原编码核酸序列,所述序列包含至少一个改变,所述改变使得所编码的肽序列不同于由野生型核酸序列编码的相应肽序列。
104.如权利要求1、3至5或7至103中任一项所述的组合物,其中所述至少一个MHC II类抗原编码核酸序列的长度为12-20、12、13、14、15、16、17、18、19、20或20-40个氨基酸。
105.如权利要求1、3至5或7至104中任一项所述的组合物,其中存在所述至少一个MHC II类抗原编码核酸序列并且其包含至少一个通用MHC II类抗原编码核酸序列,任选地其中所述至少一个通用序列包含破伤风类毒素和PADRE中的至少一者。
106.如权利要求1、3至5或7至105中任一项所述的组合物,其中所述至少一个启动子核苷酸序列或所述第二启动子核苷酸序列是诱导型的。
107.如权利要求1、3至5或7至105中任一项所述的组合物,其中所述至少一个启动子核苷酸序列或所述第二启动子核苷酸序列是非诱导型的。
108.如权利要求1、3至5或7至107中任一项所述的组合物,其中所述至少一个poly(A)
序列包含所述甲病毒的原生poly(A)序列。
109.如权利要求1、3至5或7至107中任一项所述的组合物,其中所述至少一个poly(A)
序列包含所述甲病毒的外源poly(A)序列。
110.如权利要求1、3至5或7至109中任一项所述的组合物,其中所述至少一个poly(A)
序列可操作地连接于所述至少一个抗原编码核酸序列中的至少一者。
111.如权利要求1、3至5或7至110中任一项所述的组合物,其中所述至少一个poly(A)
序列是至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个或至少90个连续A核苷酸。
112.如权利要求1、3至5或7至110中任一项所述的组合物,其中所述至少一个poly(A)
序列是至少100个连续A核苷酸。
113.如前述权利要求中任一项所述的组合物,其中所述新抗原盒还包含以下中的至少
一者:内含子序列、土拨鼠肝炎病毒转录后调控元件(WPRE)序列、内部核糖体进入序列(IRES)序列、编码2A自裂解肽序列的核苷酸序列、编码弗林蛋白酶裂解位点的核苷酸序列、或已知增强可操作地连接于所述至少一个抗原编码核酸序列中的至少一者的mRNA的核输出、稳定性或翻译效率的5'或3'非编码区中的序列。
114.如前述权利要求中任一项所述的组合物,其中所述新抗原盒还包含报告基因,其
包括但不限于绿色荧光蛋白(GFP)、GFP变体、分泌型碱性磷酸酶、荧光素酶、荧光素酶变体或可检测的肽或表位。
115.如权利要求114所述的组合物,其中所述可检测的肽或表位选自HA标签、Flag标
签、His标签或V5标签。
116.如前述权利要求中任一项所述的组合物,其中所述一个或多个载体还包含编码至
少一种免疫调节物的一个或多个核酸序列。
117.如权利要求116所述的组合物,其中所述免疫调节物是抗CTLA4抗体或其抗原结合
片段、抗PD-1抗体或其抗原结合片段、抗PD-L1抗体或其抗原结合片段、抗4-1BB抗体或其抗原结合片段、或抗OX-40抗体或其抗原结合片段。
118.如权利要求117所述的组合物,其中所述抗体或其抗原结合片段是Fab片段、Fab'
片段、单链Fv(scFv)、呈单特异性或连接在一起的多特异性的单结构域抗体(sdAb)(例如骆驼科抗体结构域)、或全长单链抗体(例如具有通过柔性接头连接的重链和轻链的全长
IgG)。
119.如权利要求117或118所述的组合物,其中所述抗体的重链和轻链序列是由自裂解
序列如2A或IRES分开的连续序列;或所述抗体的重链和轻链序列由柔性接头如连续甘氨酸残基连接。
120.如权利要求116所述的组合物,其中所述免疫调节物是细胞因子。
121.如权利要求120所述的组合物,其中所述细胞因子是IL-2、IL-7、IL-12、IL-15或IL-21或其各自变体中的至少一者。
122.如权利要求1、3至5或7至121中任一项所述的组合物,其中所述至少一个MHC I类
新抗原编码核酸序列通过执行以下步骤来选择:
(a)获得来自所述肿瘤的外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少
一者,其中所述肿瘤核苷酸测序数据用于获得代表新抗原集合中的每一者的肽序列的数据;
(b)将每个新抗原的肽序列输入到递呈模型中,以产生所述新抗原中的每一者在所述
肿瘤的肿瘤细胞表面上由所述MHC等位基因中的一者或多者递呈的数值可能性集合,所述数值可能性集合已至少基于所接收的质谱数据鉴定;以及
(c)基于所述数值可能性集合选择所述新抗原集合的子集,以产生经选择的新抗原集
合,其用于产生所述至少一个MHC I类新抗原编码核酸序列。
123.如权利要求2或6所述的组合物,其中所述MHC I类表位编码核酸序列中的每一者
通过执行以下步骤来选择:
(a)获得来自所述肿瘤的外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少
一者,其中所述肿瘤核苷酸测序数据用于获得代表新抗原集合中的每一者的肽序列的数据;
(b)将每个新抗原的肽序列输入到递呈模型中,以产生所述新抗原中的每一者在所述
肿瘤的肿瘤细胞表面上由所述MHC等位基因中的一者或多者递呈的数值可能性集合,所述数值可能性集合已至少基于所接收的质谱数据进行鉴定;以及
(c)基于所述数值可能性集合选择所述新抗原集合的子集,以产生经选择的新抗原集
合,其用于产生至少20个MHC I类新抗原编码核酸序列。
124.如权利要求122所述的组合物,其中所述经选择的新抗原集合的数量为2-20个。
125.如权利要求122至124所述的组合物,其中所述递呈模型表示以下两者之间的依赖
性:
(a)所述MHC等位基因中的一对特定等位基因和在肽序列特定位置处特定氨基酸的存
在;和
(b)在所述肿瘤细胞表面上由所述对MHC等位基因中的特定等位基因递呈在所述特定
位置处包含所述特定氨基酸的此类肽序列的可能性。
126.如权利要求122至125所述的组合物,其中选择所述经选择的新抗原集合包括基于
所述递呈模型选择相对于未经选择的新抗原在所述肿瘤细胞表面上递呈的可能性增加的新抗原。
127.如权利要求122至126所述的组合物,其中选择所述经选择的新抗原集合包括基于
所述递呈模型选择相对于未经选择的新抗原能够在所述受试者中诱导肿瘤特异性免疫应答的可能性增加的新抗原。
128.如权利要求122至127所述的组合物,其中选择所述经选择的新抗原集合包括基于
所述递呈模型选择相对于未经选择的新抗原能够由专职抗原递呈细胞(APC)递呈于初始T细胞的可能性增加的新抗原,任选地其中所述APC是树突状细胞(DC)。
129.如权利要求122至128所述的组合物,其中选择所述经选择的新抗原集合包括基于
所述递呈模型选择相对于未经选择的新抗原经由中心或外周耐受性受抑制的可能性降低的新抗原。
130.如权利要求122至129所述的组合物,其中选择所述经选择的新抗原集合包括基于
所述递呈模型选择相对于未经选择的新抗原能够在所述受试者中诱导针对正常组织的自身免疫应答的可能性降低的新抗原。
131.如权利要求122至130所述的组合物,其中外显子组或转录组核苷酸测序数据是通
过对所述肿瘤组织进行测序而获得。
132.如权利要求131所述的组合物,其中所述测序是下一代测序(NGS)或任何大规模平
行测序方法。
133.如前述权利要求中任一项所述的组合物,其中所述新抗原盒包含由所述新抗原盒
中的相邻序列形成的连接表位序列。
134.如权利要求133所述的组合物,其中至少一个或每个连接表位序列对MHC的亲和力
大于500nM。
135.如权利要求133或134所述的组合物,其中每个连接表位序列是非自身的。
136.如前述权利要求中任一项所述的组合物,其中所述新抗原盒不编码包含经翻译的
野生型核酸序列的非治疗性MHC I类或II类表位核酸序列,其中所述非治疗性表位经预测显示于所述受试者的MHC等位基因上。
137.如权利要求136所述的组合物,其中所述经预测的非治疗性MHC I类或II类表位序
列是由所述新抗原盒中的相邻序列形成的连接表位序列。
138.如权利要求133至137所述的组合物,其中所述预测是基于通过将所述非治疗性表
位的序列输入到递呈模型中而产生的递呈可能性。
139.如权利要求133至138中任一项所述的组合物,其中所述新抗原盒中的所述至少一
个抗原编码核酸序列的顺序通过包括以下的一系列步骤来确定:
(a)产生对应于所述至少一个抗原编码核酸序列的不同顺序的候选新抗原盒序列集
合;
(b)对于每个候选新抗原盒序列,基于所述候选新抗原盒序列中非治疗性表位的递呈
来确定递呈评分;以及
(c)选择与低于预定阈值的递呈评分相关的候选盒序列作为用于新抗原疫苗的所述新
抗原盒序列。
140.一种药物组合物,其包含如前述权利要求中任一项所述的组合物和药学上可接受
的载体。
141.如权利要求140所述的组合物,其中所述组合物还包含佐剂。
142.如权利要求140或141所述的药物组合物,其中所述组合物还包含免疫调节物。
143.如权利要求142所述的药物组合物,其中所述免疫调节物是抗CTLA4抗体或其抗原
结合片段、抗PD-1抗体或其抗原结合片段、抗PD-L1抗体或其抗原结合片段、抗4-1BB抗体或其抗原结合片段、或抗OX-40抗体或其抗原结合片段。
144.一种分离的核苷酸序列或分离的核苷酸序列集合,其包含如前述组合物权利要求
中任一项所述的新抗原盒和从SEQ ID NO:3或SEQ ID NO:5的序列获得的一种或多种元件,任选地其中所述一种或多种元件选自非结构蛋白介导扩增所必需的序列、26S启动子核苷酸序列、poly(A)序列和以SEQ ID NO:3或SEQ ID NO:5所示序列的nsP1-4基因,并且任选地其中所述核苷酸序列是cDNA。
145.如权利要求144所述的分离的核苷酸序列,其中所述序列或分离的核苷酸序列集
合包含插入在以SEQ ID NO:6或SEQ ID NO:7所示序列的第7544位的如前述组合物权利要求中任一项所述的新抗原盒。
146.如权利要求144或145所述的分离的核苷酸序列,其还包含:
从SEQ ID NO:3或SEQ ID NO:5的序列获得的所述一种或多种元件5'的T7或SP6 RNA聚
合酶启动子核苷酸序列;和
任选地,所述poly(A)序列3'的一个或多个限制性位点。
147.如权利要求144所述的分离的核苷酸序列,其中如前述组合物权利要求中任一项
所述的新抗原盒插入在SEQ ID NO:8或SEQ ID NO:9的第7563位。
148.一种载体或载体集合,其包含如权利要求144至147所述的核苷酸序列。
149.一种分离的细胞,其包含如权利要求144至148所述的核苷酸序列或分离的核苷酸
序列集合,任选地其中所述细胞是BHK-21、CHO、HEK293或其变体、911、HeLa、A549、LP-293、PER.C6或AE1-2a细胞。
150.一种试剂盒,其包含如前述组合物权利要求中任一项所述的组合物和使用说明
书。
151.一种用于治疗患有癌症的受试者的方法,所述方法包括向所述受试者施用如前述
组合物权利要求中任一项所述的组合物或如权利要求140至143中任一项所述的药物组合物。
152.如权利要求151所述的方法,其中源自肿瘤的所述至少一个MHC I类新抗原编码核
酸序列是源自所述患有癌症的受试者的肿瘤。
153.如权利要求151所述的方法,其中所述至少一个MHC I类新抗原编码核酸序列不是
源自所述患有癌症的受试者的肿瘤。
154.一种用于在受试者中诱导免疫应答的方法,所述方法包括向所述受试者施用如前
述组合物权利要求中任一项所述的组合物或如权利要求140至143中任一项所述的药物组合物。
155.如权利要求151至154所述的方法,其中所述组合物经肌肉内(IM)、皮内(ID)、皮下(SC)或静脉内(IV)施用。
156.如权利要求151至154所述的方法,其中所述组合物经肌肉内施用。
157.如权利要求151至156中任一项所述的方法,所述方法还包括施用一种或多种免疫
调节物,任选地其中所述免疫调节物是在施用所述组合物或药物组合物之前、同时或之后施用。
158.如权利要求157所述的方法,其中所述一种或多种免疫调节物选自:抗CTLA4抗体
或其抗原结合片段、抗PD-1抗体或其抗原结合片段、抗PD-L1抗体或其抗原结合片段、抗4-
1BB抗体或其抗原结合片段、或抗OX-40抗体或其抗原结合片段。
159.如权利要求157或158所述的方法,其中所述免疫调节物经静脉内(IV)、肌肉内
(IM)、皮内(ID)或皮下(SC)施用。
160.如权利要求159所述的方法,其中所述皮下施用是在所述组合物或药物组合物施
用部位附近或者靠近一个或多个载体或组合物引流淋巴结。
161.如权利要求151至160中任一项所述的方法,其还包括向所述受试者施用第二疫苗
组合物。
162.如权利要求161所述的方法,其中所述第二疫苗组合物在施用如权利要求151至
160中任一项所述的组合物或药物组合物之前施用。
163.如权利要求161所述的方法,其中所述第二疫苗组合物在施用如权利要求151至
160中任一项所述的组合物或药物组合物之后施用。
164.如权利要求162或163所述的方法,其中所述第二疫苗组合物与如权利要求151至
160中任一项所述的组合物或药物组合物相同。
165.如权利要求162或163所述的方法,其中所述第二疫苗组合物与如权利要求151至
160中任一项所述的组合物或药物组合物不同。
166.如权利要求165所述的方法,其中所述第二疫苗组合物包含编码至少一个抗原编
码核酸序列的黑猩猩腺病毒载体。
167.如权利要求166所述的方法,其中由所述黑猩猩腺病毒载体编码的所述至少一个
抗原编码核酸序列与如上述组合物权利要求中任一项所述的至少一个抗原编码核酸序列相同。
168.一种制造一个或多个如上述组合物权利要求中任一项所述的载体的方法,所述方
法包括:
(a)获得包含RNA甲病毒骨架和新抗原盒的线性化DNA序列;
(b)通过将所述线性化DNA序列添加到体外转录反应中来体外转录所述线性化DNA序
列,所述体外转录反应包含将所述线性化DNA序列转录成RNA的所有必需组分,任选地还包括将m7g帽体外添加到所得RNA中;以及
(c)从所述体外转录反应中分离出所述一个或多个载体。
169.如权利要求168所述的制造方法,其中所述线性化DNA序列通过线性化DNA质粒序
列或通过使用PCR扩增来产生。
170.如权利要求169所述的制造方法,其中所述DNA质粒序列使用细菌重组或全基因组
DNA合成或在细菌细胞中使用合成DNA扩增的全基因组DNA合成中的一种产生。
171.如权利要求168所述的制造方法,其中从所述体外转录反应中分离所述一个或多
个载体涉及苯酚氯仿提取、基于二氧化柱的纯化或类似RNA纯化方法中的一种或多种。
172.一种制造如前述组合物权利要求中任一项所述的组合物来递送新抗原表达系统
的方法,所述方法包括:
(a)提供纳米颗粒递送媒介物的组分;
(b)提供所述新抗原表达系统;以及
(c)提供足以使所述纳米颗粒递送媒介物和所述新抗原表达系统产生用于递送所述新
抗原表达系统的组合物的条件。
173.如权利要求172所述的制造方法,其中所述条件通过微流体混合来提供。

说明书全文

甲病毒新抗原载体

[0001] 序列表
[0002] 本申请含有序列表,其已经由EFS-Web提交并且特此通过引用整体并入本文。创建于20XX年X月XX日的所述ASCII拷贝,命名为XXXXXUS_sequencelisting.txt,并且大小为X,
XXX,XXX个字节。

背景技术

[0003] 基于肿瘤特异性新抗原的治疗疫苗作为新一代个性化癌症免疫疗法具有广阔的前景。1–3鉴于产生新抗原的可能性相对较高,具有高突变负荷的癌症,如非小细胞
(NSCLC)和黑素瘤成为此类疗法的特别具有吸引的靶标。4,5早期有证据显示,基于新抗原
6
的疫苗接种能够引起T细胞反应 并且靶向新抗原的细胞疗法在某些情况下能够在选择的
患者中引起肿瘤消退。7
[0004] 新抗原疫苗设计的一个问题是在受试者肿瘤内存在的众多编码突变中,哪种突变可以产生“最佳的”治疗性新抗原,例如能够引起抗肿瘤免疫并使肿瘤消退的抗原。
[0005] 提出的初步方法并入了使用下一代测序的基于突变的分析、RNA基因表达及候选新抗原肽的MHC结合亲和力预测8。然而,提出的这些方法都无法模拟整个表位产生过程,该
过程除含有基因表达和MHC结合外,还含有许多步骤(例如TAP转运、蛋白酶体裂解和/或TCR
识别)9。因此,现有的方法可能会有低阳性预测值(PPV)降低的问题。(图1A)
[0006] 事实上,多个团队所进行的关于由肿瘤细胞递呈的肽的分析显示,预计使用基因表达和MHC结合亲和力递呈的肽中不到5%可以在肿瘤表面MHC上发现10,11(图1B)。近期观察
到的针对仅突变数量的检查点抑制剂反应无法提高对结合受限的新抗原的预测准确性进
一步支持了结合预测与MHC递呈之间的这一低相关性。12
[0007] 现有的递呈预测方法的这一低阳性预测值(PPV)提出了有关基于新抗原的疫苗设计的问题。如果使用PPV低的预测方法来设计疫苗,则大多数患者不太可能接受治疗性新抗
原,且少数患者可能要接受一种以上新抗原(即使假设所有递呈的肽都具有免疫原性)。因
此,用当前方法进行新抗原疫苗接种不太可能在众多具有肿瘤的受试者中取得成功。(图
1C)
[0008] 此外,先前的方法仅使用顺式作用突变来产生候选新抗原,而在很大程度上忽视了考虑neo-ORF的其它来源,包括在多种肿瘤类型中出现且导致许多基因异常剪接的剪接
因子的突变13,以及产生或移除蛋白酶裂解位点的突变。
[0009] 最后,由于文库构建、外显子组和转录组捕捉、测序或数据分析的条件并非最佳条件,故肿瘤基因组和转录组分析的标准方法可能会遗漏产生候选新抗原的体细胞突变。同
样,标准肿瘤分析方法可能会无意中促成序列伪影或生殖系多态性作为新抗原,而分别导
致疫苗能力的低效使用或自身免疫的险。
[0010] 除了当前新抗原预测方法的挑战之外,可用于人中新抗原递送的可用载体系统也存在某些挑战,其中许多源自人。举例来说,许多人由于先前的自然暴露而对人病毒具有预
先存在的免疫力,并且这种免疫力可能是使用重组人病毒进行新抗原递送以用于癌症治疗
的主要障碍。
发明内容
[0011] 本文公开了一种用于递送新抗原表达系统的组合物,其包含:新抗原表达系统,其中所述新抗原表达系统包含一个或多个载体,所述一个或多个载体包含:(a)RNA甲病毒骨
架,其中所述RNA甲病毒骨架包含:(i)至少一个启动子核苷酸序列,和(ii)至少一个聚腺苷
酸化(poly(A))序列;和(b)新抗原盒,其中所述新抗原盒包含:(i)至少一个源自受试者体
内存在的肿瘤的新抗原编码核酸序列,其包含:(I)至少一个源自所述肿瘤的肿瘤特异性和
受试者特异性MHC I类新抗原编码核酸序列,并包含:(A)具有至少一个改变的MHC I类表位
编码核酸序列,所述改变使所编码的肽序列不同于由野生型核酸序列编码的相应肽序列,
和(B)任选地5'接头序列,和(C)任选地3'接头序列;(ii)任选地,可操作地连接于所述新抗
原编码核酸序列的第二启动子核苷酸序列;和(iii)任选地,至少一个MHC II类抗原编码核
酸序列;(iv)任选地,至少一个编码GPGPG基酸接头序列的核酸序列(SEQ ID NO:56);和
(v)任选地,至少一个第二poly(A)序列,其中所述第二poly(A)序列是甲病毒的原生poly
(A)序列或外源poly(A)序列。
[0012] 本文还公开了一种用于递送新抗原表达系统的组合物,其包含:新抗原表达系统,其中所述新抗原表达系统包含一个或多个载体,所述一个或多个载体包含:(a)RNA甲病毒
骨架,其中所述RNA甲病毒骨架包含以SEQ ID NO:6所示的核酸序列,其中所述RNA甲病毒骨
架序列包含26S启动子核苷酸序列和poly(A)序列,其中所述26S启动子序列是所述RNA甲病
毒骨架的内源序列,并且其中所述poly(A)序列是所述RNA甲病毒骨架的内源序列;和(b)在
所述26S启动子核苷酸序列与所述poly(A)序列之间整合的新抗原盒,其中所述新抗原盒包
含:(i)至少一个源自受试者体内存在的肿瘤的新抗原编码核酸序列,其包含:(I)至少10个
肿瘤特异性和受试者特异性MHC I类新抗原编码核酸序列,它们彼此线性连接并且各自包
含:(A)具有至少一个改变的MHC I类表位编码核酸序列,所述改变使所编码的肽序列不同
于由野生型核酸序列编码的相应肽序列,其中所述MHC I表位编码核酸序列编码长度为7-
15个氨基酸的MHC I类表位,(B)5'接头序列,其中所述5'接头序列编码MHC I表位的原生N
端氨基酸序列,并且其中所述5'接头序列编码长度为至少3个氨基酸的肽,(C)3'接头序列,
其中所述3'接头序列编码所述MHC I表位的原生N端氨基酸序列,并且其中所述3'接头序列
编码长度为至少3个氨基酸的肽,并且其中所述新抗原盒可操作地连接于所述26S启动子核
苷酸序列,其中所述MHC I类新抗原编码核酸序列中的每一个编码长度为13至25个氨基酸
的多肽,并且其中每个MHC I类新抗原编码核酸序列的每个3'端与以下MHC I类新抗原编码
核酸序列的5'端连接,其中例外为所述新抗原盒中的最终MHC I类新抗原编码核酸序列;和
(ii)至少两个MHC II类抗原编码核酸序列,其包含:(I)PADRE MHC II类序列(SEQ ID NO:
48),(II)破伤风类毒素MHC II类序列(SEQ ID NO:46),(III)编码连接所述PADRE MHC II
类序列和所述破伤风类毒素MHC II类序列的GPGPG氨基酸接头序列的第一核酸序列,(IV)
编码连接所述至少两个MHC II类抗原编码核酸序列的5'端与至少20个肿瘤特异性和受试
者特异性MHC I类新抗原编码核酸序列的GPGPG氨基酸接头序列的第二核酸序列,(V)任选
地,编码所述至少两个MHC II类抗原编码核酸序列的3'端处的GPGPG氨基酸接头序列的第
三核酸序列。
[0013] 在一些方面,所述新抗原盒的各元件的有序序列以下式描述,其从5'至3'包含:
[0014] Pa-(L5b-Nc-L3d)X-(G5e-Uf)Y-G3g
[0015] 其中P包含第二启动子核苷酸序列,其中a=0或1,N包含MHC I类表位编码核酸序列之一,其中c=1,L5包含5'接头序列,其中b=0或1,L3包含3'接头序列,其中d=0或1,G5
包含至少一个编码GPGPG氨基酸接头的核酸序列之一,其中e=0或1,G3包含至少一个编码
GPGPG氨基酸接头的核酸序列之一,其中g=0或1,U包含至少一个MHC II类抗原编码核酸序
列之一,其中f=1,X=1至400,其中对于每个X,相应的Nc是表位编码核酸序列,并且Y=0、1或2,其中对于每个Y,相应的Uf是抗原编码核酸序列。在一些方面,对于每个X,相应的Nc是
不同的MHC I类表位编码核酸序列。在一些方面,对于每个Y,相应的Uf是不同的MHC II类抗
原编码核酸序列。
[0016] 在一些方面,a=0,b=1,d=1,e=1,g=1,h=1,X=20,Y=2,至少一个启动子核苷酸序列是由RNA甲病毒骨架提供的单个26S启动子核苷酸序列,至少一个聚腺苷酸化poly(A)序列是由RNA甲病毒骨架提供的至少100个连续A核苷酸的poly(A)序列,每个N编码长度
为7-15个氨基酸的MHC I类表位,L5是编码MHC I表位的原生N端氨基酸序列的原生5'接头
序列,并且其中5'接头序列编码长度为至少3个氨基酸的肽,L3是编码MHC I表位的原生核
酸末端核酸序列的原生3'接头序列,并且其中3'接头序列编码长度为至少3个氨基酸的肽,
U是PADRE II类序列和破伤风类毒素MHC II类序列中的每一者,RNA甲病毒骨架是以SEQ ID 
NO:6所示的序列,并且MHC I类新抗原编码核酸序列中的每一者编码长度为13至25个氨基
酸的多肽。
[0017] 在一些方面,任何上述组合物还包含纳米颗粒递送媒介物。在一些方面,所述纳米颗粒递送媒介物可以是脂质纳米粒子(LNP)。在一些方面,所述LNP包含可电离的氨基脂质。
在一些方面,所述可电离的氨基脂质包含MC3样(二亚油基甲基-4-二甲基氨基丁酸酯)分
子。在一些方面,所述纳米颗粒递送媒介物包封新抗原表达系统。
[0018] 在一些方面,任何上述组合物还包含多个LNP,其中所述LNP包括:新抗原表达系统;阳离子脂质;非阳离子脂质;和抑制LNP聚集的缀合脂质,其中所述多个LNP中至少约
95%的LNP:具有非层状形态;或者是电子致密的。
[0019] 在一些方面,所述非阳离子脂质是(1)磷脂和(2)胆固醇或胆固醇衍生物的混合物。
[0020] 在一些方面,所述抑制LNP聚集的缀合脂质是聚乙二醇(PEG)-脂质缀合物。在一些方面,所述PEG-脂质缀合物选自:PEG-二酰基甘油(PEG-DAG)缀合物、PEG二烷基丙基
(PEG-DAA)缀合物、PEG-磷脂缀合物、PEG-神经酰胺(PEG-Cer)缀合物及其混合物。在一些方
面,所述PEG-DAA缀合物是选自以下的成员:PEG-二癸氧基丙基(C10)缀合物、PEG-二月桂氧
基丙基(C12)缀合物、PEG-二肉豆蔻酰氧基丙基(C14)缀合物、PEG-二棕榈酰氧基丙基(C16)缀
合物、PEG-二硬脂酰氧基丙基(C18)缀合物及其混合物。
[0021] 在一些方面,新抗原表达系统完全包封在LNP中。
[0022] 在一些方面,LNP的非层状形态包括反六形(HII)或立方相结构。
[0023] 在一些方面,阳离子脂质占LNP中存在的总脂质的约10摩尔%至约50摩尔%。在一些方面,阳离子脂质占LNP中存在的总脂质的约20摩尔%至约50摩尔%。在一些方面,阳离
子脂质占LNP中存在的总脂质的约20摩尔%至约40摩尔%。
[0024] 在一些方面,非阳离子脂质占LNP中存在的总脂质的约10摩尔%至约60摩尔%。在一些方面,非阳离子脂质占LNP中存在的总脂质的约20摩尔%至约55摩尔%。在一些方面,
非阳离子脂质占LNP中存在的总脂质的约25摩尔%至约50摩尔%。
[0025] 在一些方面,缀合脂质占LNP中存在的总脂质的约0.5摩尔%至约20摩尔%。在一些方面,缀合脂质占LNP中存在的总脂质的约2摩尔%至约20摩尔%。在一些方面,缀合脂质
占LNP中存在的总脂质的约1.5摩尔%至约18摩尔%。
[0026] 在一些方面,大于95%的LNP具有非层状形态。在一些方面,大于95%的LNP是电子致密的。
[0027] 在一些方面,任何上述组合物还包含多个LNP,其中所述LNP包含:阳离子脂质,其占LNP中存在的总脂质的50摩尔%至65摩尔%;抑制LNP聚集的缀合脂质,其占LNP中存在的
总脂质的0.5摩尔%至2摩尔%;和非阳离子脂质,其包含:磷脂和胆固醇或其衍生物的混合
物,其中磷脂占LNP中存在的总脂质的4摩尔%至10摩尔%,并且胆固醇或其衍生物占LNP中
存在的总脂质的30摩尔%至40摩尔%;磷脂和胆固醇或其衍生物的混合物,其中磷脂占LNP
中存在的总脂质的3摩尔%至15摩尔%,并且胆固醇或其衍生物占LNP中存在的总脂质的30
摩尔%至40摩尔%;或LNP中存在的总脂质的高达49.5摩尔%,并包含磷脂和胆固醇或其衍
生物的混合物,其中胆固醇或其衍生物占LNP中存在的总脂质的30摩尔%至40摩尔%。
[0028] 在一些方面,任何上述组合物还包含多个LNP,其中所述LNP包含:阳离子脂质,其占LNP中存在的总脂质的50摩尔%至85摩尔%;抑制LNP聚集的缀合脂质,其占LNP中存在的
总脂质的0.5摩尔%至2摩尔%;和非阳离子脂质,其占LNP中存在的总脂质的13摩尔%至
49.5摩尔%。
[0029] 在一些方面,所述磷脂包含二棕榈酰磷脂酰胆(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)或其混合物。
[0030] 在一些方面,所述缀合脂质包含聚乙二醇(PEG)-脂质缀合物。在一些方面,所述PEG-脂质缀合物包含PEG-二酰基甘油(PEG-DAG)缀合物、PEG-二烷氧基丙基(PEG-DAA)缀合
物或其混合物。在一些方面,所述PEG-DAA缀合物包含PEG-二肉豆蔻酰氧基丙基(PEG-DMA)
缀合物、PEG-二硬脂酰氧基丙基(PEG-DSA)缀合物或其混合物。在一些方面,所述缀合物的
PEG部分具有约2,000道尔顿的平均分子量。
[0031] 在一些方面,所述缀合脂质占LNP中存在的总脂质的1摩尔%至2摩尔%。
[0032] 在一些方面,所述LNP包含具有式I结构的化合物:
[0033]
[0034] 或其药学上可接受的盐、互变异构体、前药或立体异构体,其中:L1和L2各自独立地是-O(C=O)-、-(C=O)O-、-C(=O)-、-O-、-S(O)x-、-S-S-、-C(=O)S-、-SC(=O)-、-RaC(=O)-、-C(=O)Ra-、-RaC(=O)Ra-、-OC(=O)Ra-、-RaC(=O)O-或直接键;G1是C1-C2亚烷基、-(C=O)-、-O(C=O)-、-SC(=O)-、-RaC(=O)-或直接键;-C(=O)-、-(C=O)O-、-C(=O)S-、-C(=O)Ra-或直接键;G是C1-C6亚烷基;Ra是H或C1-C12烷基;R1a和R1b在每次出现时独立地是:
(a)H或C1-C12烷基;或(b)R1a是H或C1-C12烷基,并且R1b和其所键合的原子一起与相邻R1b和其所键合的碳原子一起形成碳-碳双键;R2a和R2b在每次出现时独立地是:(a)H或C1-C12烷
2a 2b 2b
基;或(b)R 是H或C1-C12烷基,并且R 和其所键合的碳原子一起与相邻R 和其所键合的碳
原子一起形成碳-碳双键;R3a和R3b在每次出现时独立地是:(a)H或C1-C12烷基;或(b)R3a是H
或C1-C12烷基,并且R3b和其所键合的碳原子一起与相邻R和其所键合的碳原子一起形成碳-
碳双键;R4a和R4b在每次出现时独立地是:(a)H或C1-C12烷基;或(b)R4a是H或C1-C12烷基,并
4b 4b 5 6
且R 和其所键合的碳原子一起与相邻R 和其所键合的碳原子一起形成碳-碳双键;R和R
各自独立地是H或甲基;R7是C4-C20烷基;R8和R9各自独立地是C1-C12烷基;或者R8和R9与其
所连接的氮原子一起形成5元、6元或7元杂环;a、b、c和d各自独立地是1至24的整数;并且x
是0、1或2。
[0035] 在一些方面,所述LNP包含具有式II结构的化合物:
[0036]
[0037] 或其药学上可接受的盐、互变异构体、前药或立体异构体,其中:L1和L2各自独立地是-O(C=O)-、-(C=O)O-或碳-碳双键;R1a和R1b在每次出现时独立地是(a)H或C1-C12烷基,
1a 1b 1b
或(b)R 是H或C1-C12烷基,并且R 和其所键合的碳原子一起与相邻R 和其所键合的碳原子
一起形成碳-碳双键;R2a和R2b在每次出现时独立地是(a)H或C1-C12烷基,或(b)R2a是H或C1-
C12烷基,并且R2b和其所键合碳原子一起与相邻R2b和其所键合的碳原子一起形成碳-碳双
键;R3a和R3b在每次出现时独立地是(a)H或C1-C12烷基,或(b)R3a是H或C1-C12烷基,并且R3b和
3b 4a 4b
其所键合的碳原子一起与相邻R 和其所键合的碳原子一起形成碳-碳双键;R 和R 在每次
出现时独立地是(a)H或C1-C12烷基,或(b)R4a是H或C1-C12烷基,并且R4b和其所键合的碳原子
一起与相邻R4b和其所键合的碳原子一起形成碳碳双键;R5和R6各自独立地是甲基或环烷
基;R7在每次出现时独立地是H或C1-C12烷基;R8和R9各自独立地是未被取代的C1-C12烷基;
或者R8和R9与其所连接的氮原子一起形成包含一个氮原子的5元、6元或7元杂环;a和d各自
独立地是0至24的整数;b和c各自独立地是1至24的整数;并且e是1或2,其条件是:R1a、R2a、R3a或R4a中的至少一个是C1-C12烷基,或者L1或L2中的至少一个是-O(C=O)-或-(C=O)O-;
并且R1a和R1b当a为6时不是异丙基或者当a为8时不是正丁基。
[0038] 在一些方面,任何上述组合物还包含一种或多种赋形剂,所述赋形剂包含中性脂质、类固醇和聚合物缀合脂质。在一些方面,所述中性脂质包含1,2-二硬脂酰基-sn-甘油-
3-磷酸胆碱(DSPC)、1,2-二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)、1,2-二肉豆蔻酰基-sn-
甘油-3-磷酸胆碱(DMPC)、1-棕榈酰基-2-油酰基-sn-甘油-3-磷酸胆碱(POPC)、1,2-二油酰
基-sn-甘油-3-磷酸胆碱(DOPC)和1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)中的至少
一种。在一些方面,所述中性脂质是DSPC。
[0039] 在一些方面,所述化合物与中性脂质的摩尔比在约2:1至约8:1的范围内。
[0040] 在一些方面,所述类固醇是胆固醇。在一些方面,所述化合物与胆固醇的摩尔比在约2:1至1:1的范围内。
[0041] 在一些方面,所述聚合物缀合脂质是聚乙二醇化脂质。在一些方面,所述化合物与聚乙二醇化脂质的摩尔比在约100:1至约25:1的范围内。在一些方面,所述聚乙二醇化脂质
是PEG-DAG、PEG聚乙烯(PEG-PE)、PEG-琥珀酰基-二酰基甘油(PEG-S-DAG)、PEG-cer或PEG二
烷氧基丙基氨基甲酸酯。在一些方面,所述聚乙二醇化脂质具有以下结构III:
[0042]
[0043] 或其药学上可接受的盐、互变异构体或立体异构体,其中:R10和R11各自独立地是含有10至30个碳原子的直链或支链的饱和或不饱和的烷基链,其中所述烷基链任选地被一
个或多个酯键中断;并且z具有30至60范围内的平均值。在一些方面,R10和R11各自独立地是
具有12至16个碳原子的直链的饱和烷基链。在一些方面,平均z是约45。
[0044] 在一些方面,LNP在与聚阴离子核酸混合时自组装成非双层结构。在一些方面,所述非双层结构的直径介于60nm和120nm之间。在一些方面,所述非双层结构的直径为约
70nm、约80nm、约90nm或约100nm。在一些方面,其中纳米颗粒递送媒介物具有约100nm的直
径。
[0045] 在一些方面,新抗原盒整合在至少一个启动子核苷酸序列与至少一个poly(A)序列之间。在一些方面,至少一个启动子核苷酸序列可操作地连接于新抗原编码核酸序列。
[0046] 在一些方面,所述一个或多个载体包含一个或多个+-链RNA载体。在一些方面,所述一个或多个+-链RNA载体包含5'7-甲基苷(m7g)帽。在一些方面,通过体外转录产生一
个或多个+-链RNA载体。在一些方面,一个或多个载体在哺乳动物细胞内自我复制。
[0047] 在一些方面,所述RNA甲病毒骨架包含奥拉病毒(Aura virus)、摩根堡病毒(Fort Morgan virus)、委内瑞拉脑炎病毒(Venezuelan equine encephalitis virus)、罗斯河
病毒(Ross River virus)、塞姆利基森林病毒(Semliki Forest virus)、辛德毕斯病毒
(Sindbis virus)或马雅鲁病毒(Mayaro virus)的至少一个核苷酸序列。在一些方面,所述
RNA甲病毒骨架包含委内瑞拉马脑炎病毒的至少一个核苷酸序列。在一些方面,所述RNA甲
病毒骨架包含至少用于非结构蛋白介导扩增的序列,26S启动子序列,poly(A)序列,由奥拉
病毒、摩根堡病毒、委内瑞拉马脑炎病毒、罗斯河病毒、塞姆利基森林病毒、辛德毕斯病毒或
马雅鲁病毒的核苷酸序列编码的非结构蛋白1(nsP1)基因、nsP2基因、nsP3基因和nsP4基
因。在一些方面,所述RNA甲病毒骨架包含至少用于非结构蛋白介导扩增的序列,26S启动子
序列,和由奥拉病毒、摩根堡病毒、委内瑞拉马脑炎病毒、罗斯河病毒、塞姆利基森林病毒、
辛德毕斯病毒或马雅鲁病毒的核苷酸序列编码的poly(A)序列。在一些方面,所述非结构蛋
白介导扩增的序列选自:甲病毒5'UTR、51-nt CSE、24-nt CSE、26S亚基因组启动子序列、
19-nt CSE、甲病毒3'UTR或其组合。
[0048] 在一些方面,所述RNA甲病毒骨架不编码结构病毒粒子蛋白衣壳E2和E1。在一些方面,插入新抗原盒以代替奥拉病毒、摩根堡病毒、委内瑞拉马脑炎病毒、罗斯河病毒、塞姆利
基森林病毒、辛德毕斯病毒或马雅鲁病毒的核苷酸序列内的结构病毒粒子蛋白。
[0049] 在一些方面,委内瑞拉马脑炎病毒(VEE)包含菌株TC-83。在一些方面,委内瑞拉马脑炎病毒包含以SEQ ID NO:3或SEQ ID NO:5所示的序列。在一些方面,委内瑞拉马脑炎病
毒包含SEQ ID NO:3或SEQ ID NO:5的序列,其还包含碱基对7544与11175之间的缺失。在一
些方面,RNA甲病毒骨架是以SEQ ID NO:6或SEQ ID NO:7所示的序列。在一些方面,插入新
抗原盒以代替SEQ ID NO:3或SEQ ID NO:5的序列中所示的碱基对7544与11175之间的缺
失。
[0050] 在一些方面,新抗原盒的插入提供了包含nsP1-4基因和至少一个抗原编码核酸序列的多顺反子RNA的转录,其中所述nsP1-4基因和所述至少一个抗原编码核酸序列在单独
的开放阅读框中。
[0051] 在一些方面,至少一个启动子核苷酸序列是由RNA甲病毒骨架编码的原生26S启动子核苷酸序列。在一些方面,至少一个启动子核苷酸序列是外源RNA启动子。在一些方面,第
二启动子核苷酸序列是26S启动子核苷酸序列。在一些方面,第二启动子核苷酸序列包含多
个26S启动子核苷酸序列,其中每个26S启动子核苷酸序列提供一个或多个单独的开放阅读
框的转录。
[0052] 在一些方面,一个或多个新抗原表达载体的大小各为至少300nt。在一些方面,一个或多个新抗原表达载体的大小各为至少1kb。在一些方面,一个或多个新抗原表达载体的
大小各为2kb。在一些方面,一个或多个新抗原表达载体的大小各小于5kb。
[0053] 在一些方面,至少一个新抗原编码核酸序列中的至少一者编码由MHC I类在肿瘤细胞上递呈的多肽序列或其部分。在一些方面,每个抗原编码核酸序列彼此直接连接。在一
些方面,至少一个抗原编码核酸序列中的至少一者连接于具有编码接头的核酸序列的不同
抗原编码核酸序列。在一些方面,接头连接两个MHC I类序列或将MHC I类序列连接于MHC 
II类序列。在一些方面,接头选自:(1)连续甘氨酸残基,长度为至少2、3、4、5、6、7、8、9或10个残基;(2)连续丙氨酸残基,长度为至少2、3、4、5、6、7、8、9或10个残基;(3)两个精氨酸残基(RR);(4)丙氨酸、丙氨酸、酪氨酸(AAY);(5)长度为至少2、3、4、5、6、7、8、9或10个氨基酸残基的共有序列,其由哺乳动物蛋白酶体有效加工;和(6)侧接源自同源蛋白质的抗原并且
长度为至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或2-20个氨基酸残基的一个或多个原生序列。在一些方面,接头连接两个MHC II类序列或将MHC II类序列连接
于MHC I类序列。在一些方面,接头包含序列GPGPG。
[0054] 在一些方面,至少一个抗原编码核酸序列中的至少一个序列可操作地或直接地连接到单独或连续的序列,所述单独或连续的序列增强至少一个抗原编码核酸序列的表达、
稳定性、细胞运输、加工和递呈,和/或免疫原性。在一些方面,单独或连续的序列包含以下
中的至少一者:泛素序列、经修饰以增加蛋白酶体靶向的泛素序列(例如,泛素序列在第76
位含有Gly至Ala取代)、免疫球蛋白信号序列(例如IgK)、主要组织相容性I类序列、溶酶体
相关膜蛋白(LAMP)-1、人树突状细胞溶酶体相关膜蛋白和主要组织相容性II类序列;任选
地其中经过修饰以增加蛋白酶体靶向的泛素序列是A76。
[0055] 在一些方面,至少一个新抗原编码核酸序列中的至少一者编码相对于翻译的相应野生型核酸序列对其相应MHC等位基因的结合亲和力增加的多肽序列或其部分。在一些方
面,至少一个新抗原编码核酸序列中的至少一者编码相对于翻译的相应野生型核酸序列对
其相应MHC等位基因的结合稳定性增加的多肽序列或其部分。在一些方面,至少一个新抗原
编码核酸序列中的至少一者编码相对于翻译的相应野生型核酸序列对其相应MHC等位基因
上递呈的可能性增加的多肽序列或其部分。
[0056] 在一些方面,至少一个突变包括点突变、移码突变、非移码突变、缺失突变、插入突变、剪接变体、基因组重排或蛋白酶体产生的剪接抗原。
[0057] 在一些方面,肿瘤选自:肺癌、黑素瘤、乳腺癌、卵巢癌、前列腺癌、肾癌、胃癌、结肠癌、睾丸癌、头颈癌、胰腺癌、膀胱癌、脑癌、B细胞淋巴瘤、急性骨髓性白血病、成人急性淋巴母细胞性白血病、慢性骨髓性白血病、慢性淋巴细胞性白血病、T细胞淋巴细胞性白血病、非小细胞肺癌和小细胞肺癌。
[0058] 在一些方面,至少一个新抗原编码核酸序列包含至少2-10、2、3、4、5、6、7、8、9或10个核酸序列。在一些方面,至少一个新抗原编码核酸序列包含至少11-20、15-20、11-100、11-200、11-300、11-400、11、12、13、14、15、16、17、18、19、20或多至400个核酸序列。
[0059] 在一些方面,至少一个新抗原编码核酸序列包含至少2-400个核酸序列并且其中所述新抗原编码核酸序列中的至少两者编码肿瘤细胞表面上由MHC I类递呈的多肽序列或
其部分。在一些方面,新抗原编码核酸序列中的至少两者编码肿瘤细胞表面上由MHC I类递
呈的多肽序列或其部分。在一些方面,当施用于受试者并被翻译时,由至少一个新抗原编码
核酸序列编码的至少一个新抗原被递呈在抗原递呈细胞上,产生靶向肿瘤细胞表面上至少
一个新抗原的免疫应答。在一些方面,至少一个新抗原编码核酸序列当施用于受试者并被
翻译时,在抗原递呈细胞上递呈MHC I类或II类新抗原中的至少一者,产生靶向肿瘤细胞表
面上至少一个新抗原的免疫应答,并且任选地其中至少一个新抗原编码核酸序列中的每一
者的表达由至少一个启动子核苷酸序列驱动。
[0060] 在一些方面,每个MHC I类新抗原编码核酸序列编码长度为8至35个氨基酸,任选地长度为9-17、9-25、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、
28、29、30、31、32、33、34或35个氨基酸的多肽序列。
[0061] 在一些方面,存在至少一个MHC II类抗原编码核酸序列。在一些方面,存在至少一个MHC II类抗原编码核酸序列并且其包含至少一个MHC II类新抗原编码核酸序列,所述序
列包含至少一个突变,使其不同于相应的野生型亲本核酸序列。在一些方面,至少一个MHC 
II类抗原编码核酸序列的长度为12-20、12、13、14、15、16、17、18、19、20或20-40个氨基酸。
在一些方面,存在至少一个MHC II类抗原编码核酸序列并且其包含至少一个通用MHC II类
抗原编码核酸序列,任选地其中所述至少一个通用序列包含破伤风类毒素和PADRE中的至
少一者。
[0062] 在一些方面,至少一个启动子核苷酸序列或第二启动子核苷酸序列是诱导型的。在一些方面,至少一个启动子核苷酸序列或第二启动子核苷酸序列是非诱导型的。
[0063] 在一些方面,至少一个poly(A)序列包含甲病毒原生的poly(A)序列。在一些方面,至少一个poly(A)序列包含甲病毒外源的poly(A)序列。在一些方面,至少一个poly(A)序列
可操作地连接于至少一个抗原编码核酸序列中的至少一者。在一些方面,至少一个poly(A)
序列为至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个或至少90
个连续A核苷酸。在一些方面,至少一个poly(A)序列为至少100个连续A核苷酸。
[0064] 在一些方面,新抗原盒还包含以下中的至少一者:内含子序列、土拨鼠肝炎病毒转录后调控元件(WPRE)序列、内部核糖体进入序列(IRES)序列、编码2A自裂解肽序列的核苷
酸序列、编码弗林蛋白酶(Furin)裂解位点的核苷酸序列、或已知增强可操作地连接于至少
一个抗原编码核酸序列中的至少一者的mRNA的核输出、稳定性或翻译效率的5'或3'非编码
区中的序列。
[0065] 在一些方面,新抗原盒还包含报告基因,其包括但不限于绿色荧光蛋白(GFP)、GFP变体、分泌型碱性磷酸酶、荧光素酶、荧光素酶变体,或可检测的肽或表位。在一些方面,可
检测的肽或表位选自HA标签、Flag标签、His标签或V5标签。
[0066] 在一些方面,一个或多个载体还包含编码至少一种免疫调节物的一个或多个核酸序列。在一些方面,免疫调节物为抗CTLA4抗体或其抗原结合片段、抗PD-1抗体或其抗原结
合片段、抗PD-L1抗体或其抗原结合片段、抗4-1BB抗体或其抗原结合片段、或抗OX-40抗体
或其抗原结合片段。在一些方面,抗体或其抗原结合片段为Fab片段、Fab'片段、单链Fv
(scFv)、呈单特异性或连接在一起的多特异性的单结构域抗体(sdAb)(例如骆驼科抗体结
构域)、或全长单链抗体(例如具有通过柔性接头连接的重链和轻链的全长IgG)。在一些方
面,抗体的重链和轻链序列是由自裂解序列如2A或IRES分开的连续序列;或抗体的重链和
轻链序列由柔性接头如连续甘氨酸残基连接。
[0067] 在一些方面,免疫调节物是细胞因子。在一些方面,细胞因子是IL-2、IL-7、IL-12、IL-15或IL-21或其各自变体中的至少一者。
[0068] 此外,本文公开了包含新抗原盒的腺病毒载体,所述新抗原盒包含:源自受试者体内存在的肿瘤的多个抗原编码核酸序列,所述多个序列包含:至少两个MHC I类新抗原编码
核酸序列,其各自包含至少一个使其不同于相应的野生型亲本核酸序列的改变;和任选地
至少一个MHC II类抗原编码核酸序列;和至少一个启动子序列,其可操作地连接于所述多
个序列中的至少一个序列。
[0069] 在一些方面,腺病毒载体为黑猩猩腺病毒(ChAd)载体,任选地C68载体。在一些方面,腺病毒载体包含以SEQ ID NO:1所示的序列。在一些方面,腺病毒载体包含以SEQ ID 
NO:1所示的序列,不同之处在于所述序列完全缺失或功能缺失选自以下的至少一个基因:
以SEQ ID NO:1所示的序列的黑猩猩腺病毒E1A、E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5基因,任选地其中所述序列完全缺失或功能缺失:以SEQ ID NO:1所示的序列的(1)E1A和E1B;
(2)E1A、E1B和E3;或(3)E1A、E1B、E3和E4。在一些方面,腺病毒载体包含获自SEQ ID NO:1序列的基因或调控序列,任选地其中所述基因选自:以SEQ ID NO:1所示的序列的黑猩猩腺病
毒反向末端重复序列(ITR)、E1A、E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5基因。
[0070] 在一些方面,新抗原盒插入腺病毒载体中的E1区、E3区和/或允许并入新抗原盒的任何缺失的AdV区。
[0071] 在一些方面,腺病毒载体的至少一个启动子序列是诱导型的。在一些方面,腺病毒载体的至少一个启动子序列是非诱导型的。在一些方面,腺病毒载体的至少一个启动子序
列是CMV、SV40、EF-1、RSV、PGK或EBV启动子序列。
[0072] 在一些方面,腺病毒载体的新抗原盒还包含可操作地连接于多个序列中的至少一者的至少一个polyA序列,任选地其中所述polyA序列位于所述多个序列中的至少一个序列
的3'。
[0073] 在一些方面,腺病毒载体由第一代、第二代或辅助依赖性腺病毒载体之一产生。
[0074] 在一些方面,腺病毒载体包含以SEQ ID NO:1所示序列的碱基对编号577与3407之间的一个或多个缺失,并且任选地其中腺病毒载体还包含碱基对27,141与32,022之间或碱
基对27,816与31,332之间的一个或多个缺失。在一些方面,腺病毒载体还包含以SEQ ID 
NO:1所示序列的碱基对编号3957与10346之间、碱基对编号21787与23370之间以及碱基对
编号33486与36193之间的一个或多个缺失。
[0075] 在一些方面,至少一个MHC I类新抗原编码核酸序列通过执行以下步骤来选择:(a)获得来自肿瘤的外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少一者,其中
所述肿瘤核苷酸测序数据用于获得代表新抗原集合中的每一者的肽序列的数据;(b)将每
个新抗原的肽序列输入到递呈模型中,以产生新抗原中的每一者在肿瘤的肿瘤细胞表面上
由MHC等位基因中的一者或多者递呈的数值可能性集合,所述数值可能性集合已至少基于
所接收的质谱数据鉴定;以及(c)基于所述数值可能性集合选择所述新抗原集合的子集,以
产生经选择的新抗原集合,其用于产生至少一个MHC I类新抗原编码核酸序列。
[0076] 在一些方面,至少一个MHC I类新抗原编码核酸序列中的每一者通过执行以下步骤来选择:(a)获得来自肿瘤的外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少
一者,其中所述肿瘤核苷酸测序数据用于获得代表新抗原集合中的每一者的肽序列的数
据;(b)将每个新抗原的肽序列输入到递呈模型中,以产生新抗原中的每一者在肿瘤的肿瘤
细胞表面上由MHC等位基因中的一者或多者递呈的数值可能性集合,所述数值可能性集合
已至少基于所接收的质谱数据进行鉴定;以及(c)基于所述数值可能性集合选择所述新抗
原集合的子集,以产生经选择的新抗原集合,其用于产生至少一个MHC I类新抗原编码核酸
序列。
[0077] 在一些方面,经选择的新抗原集合的数量为2-20个。
[0078] 在一些方面,递呈模型表示以下两者之间的依赖性:MHC等位基因中的一对特定等位基因和在肽序列特定位置处特定氨基酸的存在;与在肿瘤细胞表面上由该对MHC等位基
因中的特定等位基因递呈在该特定位置处包含特定氨基酸的此类肽序列的可能性。
[0079] 在一些方面,选择经选择的新抗原集合包括基于递呈模型选择相对于未经选择的新抗原在肿瘤细胞表面上递呈的可能性增加的新抗原。在一些方面,选择经选择的新抗原
集合包括基于递呈模型选择相对于未经选择的新抗原能够在受试者中诱导肿瘤特异性免
疫应答的可能性增加的新抗原。在一些方面,选择经选择的新抗原集合包括基于递呈模型
选择相对于未经选择的新抗原能够由专职抗原递呈细胞(APC)递呈于初始T细胞的可能性
增加的新抗原,任选地其中所述APC是树突状细胞(DC)。在一些方面,选择经选择的新抗原
集合包括基于递呈模型选择相对于未经选择的新抗原经由中心或外周耐受性受抑制的可
能性降低的新抗原。在一些方面,选择经选择的新抗原集合包括基于递呈模型选择相对于
未经选择的新抗原能够在受试者中诱导针对正常组织的自身免疫应答的可能性降低的新
抗原。在一些方面,外显子组或转录组核苷酸测序数据通过对肿瘤组织进行测序而获得。在
一些方面,测序是下一代测序(NGS)或任何大规模平行测序方法。
[0080] 在一些方面,新抗原盒包含由新抗原盒中的相邻序列形成的连接表位序列。在一些方面,至少一个或每个连接表位序列对MHC的亲和力大于500nM。在一些方面,每个连接表
位序列是非自身的。在一些方面,新抗原盒不编码包含经翻译的野生型核酸序列的非治疗
性MHC I类或II类表位核酸序列,其中所述非治疗性表位经预测显示于受试者的MHC等位基
因上。在一些方面,经预测的非治疗性MHC I类或II类表位序列是由新抗原盒中的相邻序列
形成的连接表位序列。在一些方面,预测是基于通过将非治疗性表位的序列输入到递呈模
型中而产生的递呈可能性。在一些方面,新抗原盒中的至少一个抗原编码核酸序列的顺序
通过包括以下的一系列步骤来确定:(a)产生对应于所述至少一个抗原编码核酸序列的不
同顺序的候选新抗原盒序列集合;(b)对于每个候选新抗原盒序列,基于候选新抗原盒序列
中非治疗性表位的递呈来确定递呈评分;以及(c)选择与低于预定阈值的递呈评分相关的
候选盒序列作为用于新抗原疫苗的新抗原盒序列。
[0081] 本文还公开了一种药物组合物,其包含本文公开的任何组合物(例如本文公开的基于甲病毒或基于ChAd的载体)和药学上可接受的载体。在一些方面,所述药物组合物还包
含佐剂。在一些方面,所述药物组合物还包含免疫调节物。在一些方面,所述免疫调节物是
抗CTLA4抗体或其抗原结合片段、抗PD-1抗体或其抗原结合片段、抗PD-L1抗体或其抗原结
合片段、抗4-1BB抗体或其抗原结合片段、或抗OX-40抗体或其抗原结合片段。
[0082] 本文还公开了分离的核苷酸序列或分离的核苷酸序列集合,其包含任何上述组合物权利要求的新抗原盒和从SEQ ID NO:3或SEQ ID NO:5的序列获得的一种或多种元件,任
选地其中所述一种或多种元件选自非结构蛋白介导扩增所必需的序列,26S启动子核苷酸
序列,poly(A)序列和以SEQ ID NO:3或SEQ ID NO:5所示序列的nsP1-4基因,并且任选地其
中所述核苷酸序列是cDNA。在一些方面,所述序列或分离的核苷酸序列集合包含插入在以
SEQ ID NO:6或SEQ ID NO:7所示序列的第7544位的本文公开的新抗原盒。在一些方面,分
离的核苷酸序列还包含从SEQ ID NO:3或SEQ ID NO:5的序列获得的一种或多种元件5'的
T7或SP6 RNA聚合酶启动子核苷酸序列,和任选地poly(A)序列3'的一个或多个限制性位
点。在一些方面,本文公开的新抗原盒插入在SEQ ID NO:8或SEQ ID NO:9的第7563位。在另
一方面,以SEQ ID NO:8或SEQ ID NO:9所示的序列还包含在第17位插入的另一个腺嘌呤核
苷酸。
[0083] 本文还公开了一种分离的核苷酸序列,其包含本文公开的新抗原盒和本文公开的至少一种启动子。在一些方面,分离的核苷酸序列还包含基于ChAd的基因。在一些方面,基
于ChAd的基因从SEQ ID NO:1的序列获得,任选地其中所述基因选自以SEQ ID NO:1所示序
列的黑猩猩腺病毒ITR、E1A、E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5基因,并且任选地其中核苷酸序列是cDNA。
[0084] 本文还公开了一种分离的细胞,其包含本文公开的分离的核苷酸序列,任选地其中所述细胞是BHK-21、CHO、HEK293或其变体、911、HeLa、A549、LP-293、PER.C6或AE1-2a细
胞。
[0085] 本文还公开了一种载体,其包含本文公开的分离的核苷酸序列。
[0086] 本文还公开了一种试剂盒,其包含本文公开的载体或组合物和使用说明书
[0087] 本文还公开了一种用于治疗患有癌症的受试者的方法,所述方法包括向所述受试者施用本文公开的载体或本文公开的药物组合物。在一些方面,源自肿瘤的至少一个MHC I
类新抗原编码核酸序列来源于患有癌症的受试者的肿瘤。在一些方面,至少一个MHC I类新
抗原编码核酸序列不是源自患有癌症的受试者的肿瘤。
[0088] 本文还公开了一种用于在受试者中诱导免疫应答的方法,所述方法包括向所述受试者施用本文所述的任何组合物、载体或药物组合物。
[0089] 在一些方面,所述载体或组合物经肌肉内(IM)、皮内(ID)、或皮下(SC)、或静脉内(IV)施用。
[0090] 在一些方面,本文所述的方法还包括施用一种或多种免疫调节物,任选地其中所述免疫调节物在施用组合物或药物组合物之前、同时或之后施用。在一些方面,所述一种或
多种免疫调节物选自:抗CTLA4抗体或其抗原结合片段、抗PD-1抗体或其抗原结合片段、抗
PD-L1抗体或其抗原结合片段、抗4-1BB抗体或其抗原结合片段、或抗OX-40抗体或其抗原结
合片段。在一些方面,所述免疫调节物经静脉内(IV)、肌肉内(IM)、皮内(ID)或皮下(SC)施
用。在一些方面,皮下施用是在组合物或药物组合物施用部位附近或者靠近一个或多个载
体或组合物引流淋巴结。
[0091] 在一些方面,本文所述的方法还包括向受试者施用第二疫苗组合物。在一些方面,所述第二疫苗组合物在施用上述组合物或药物组合物之前施用。在一些方面,所述第二疫
苗组合物在施用上述组合物或药物组合物之后施用。在一些方面,所述第二疫苗组合物与
上述组合物或药物组合物相同。在一些方面,所述第二疫苗组合物不同于上述组合物或药
物组合物。在一些方面,所述第二疫苗组合物包含编码至少一个抗原编码核酸序列的黑猩
猩腺病毒载体。在一些方面,由黑猩猩腺病毒载体编码的至少一个抗原编码核酸序列与任
何上述组合物或载体的至少一个抗原编码核酸序列相同。
[0092] 本文还公开了一种制造任何上述组合物的一个或多个载体的方法,所述方法包括:获得包含RNA甲病毒骨架和新抗原盒的线性化DNA序列;通过将所述线性化DNA序列添加
到体外转录反应中来体外转录线性化DNA序列,所述体外转录反应包含将线性化DNA序列转
录成RNA的所有必需组分,任选地还包括将m7g帽体外添加到所得RNA中;以及从体外转录反
应中分离出所述一个或多个载体。在一些方面,线性化DNA序列通过线性化DNA质粒序列或
通过使用PCR扩增来产生。在一些方面,使用细菌重组或全基因组DNA合成或在细菌细胞中
使用合成DNA扩增的全基因组DNA合成中的一种产生DNA质粒序列。在一些方面,从体外转录
反应中分离一个或多个载体涉及苯酚氯仿提取、基于二氧化柱的纯化或类似RNA纯化方
法中的一种或多种。
[0093] 本文还公开了一种制造本文公开的任何组合物的方法,所述方法包括:提供纳米颗粒递送媒介物的组分;提供新抗原表达系统;以及提供足以使所述纳米颗粒递送媒介物
和所述新抗原表达系统产生用于递送新抗原表达系统的组合物的条件。在一些方面,所述
条件通过微流体混合来提供。
[0094] 本文还公开了一种制造本文公开的腺病毒载体的方法,所述方法包括:获得包含至少一个启动子序列和新抗原盒的质粒序列;将所述质粒序列转染到一个或多个宿主细胞
中;以及从所述一个或多个宿主细胞中分离腺病毒载体。
[0095] 在一些方面,分离包括:裂解宿主细胞以获得包含腺病毒载体的细胞裂解物;以及从所述细胞裂解物中纯化腺病毒载体。
[0096] 在一些方面,使用细菌重组或全基因组DNA合成或在细菌细胞中使用合成DNA扩增的全基因组DNA合成中的一种产生质粒序列。在一些方面,一个或多个宿主细胞是CHO、
HEK293或其变体、911、HeLa、A549、LP-293、PER.C6和AE1-2a细胞中的至少一者。在一些方
面,从细胞裂解物中纯化腺病毒载体涉及色谱分离、离心、病毒沉淀和过滤中的一种或多
种。
附图说明
[0097] 参照以下描述和附图将更好地理解本发明的这些和其它特征、方面和优势,在附图中:
[0098] 图1A显示当前用于鉴定新抗原的临床方法。
[0099] 图1B显示<5%的预测结合肽被递呈在肿瘤细胞上。
[0100] 图1C显示新抗原预测特异性问题的影响。
[0101] 图1D显示结合预测不足以进行新抗原鉴定。
[0102] 图1E显示MHC-I递呈的概率随肽长度的变化。
[0103] 图1F显示由Promega动态范围标准生成的示例性肽谱。
[0104] 图1G显示添加特征如何增加模型阳性预测值。
[0105] 图2A是根据一个实施方案用于鉴定患者体内肽递呈可能性的环境的概述。
[0106] 图2B和图2C示出了根据一个实施方案的获得递呈信息的方法。
[0107] 图3是一个高级框图,示出了根据一个实施方案的递呈鉴定系统的计算机逻辑组件。
[0108] 图4A示出了根据一个与MHC I类等位基因有关的实施方案的示例训练数据集。图4B示出了根据一个与MHC II类等位基因有关的实施方案的示例训练数据集。
[0109] 图5示出了与MHC等位基因相关联的示例网络模型。
[0110] 图6A示出了根据一个实施方案由MHC等位基因共享的示例网络模型NNH(·)。图6B示出了根据另一实施方案由MHC等位基因共享的示例网络模型NNH(·)。
[0111] 图7示出了使用示例网络模型生成与一个MHC等位基因相关联的肽的递呈可能性。
[0112] 图8示出了使用示例网络模型生成与一个MHC等位基因相关联的肽的递呈可能性。
[0113] 图9示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的递呈可能性。
[0114] 图10示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的递呈可能性。
[0115] 图11示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的递呈可能性。
[0116] 图12示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的递呈可能性。
[0117] 图13A示出了通过质谱法确定的肽递呈的性能结果,其比较了各种肽递呈模型。示出了使用仿射依赖性函数gh(·)和expit函数f(·)并针对HLA-A*02:01和HLA-B*07:02的
质谱数据子集(“MS”)进行训练的等式(12)中所示的独立等位基因递呈模型的最大值的结
果。还示出了基于亲和力预测NETMHCpan“亲和力”和基于稳定性预测NETMHCstab“稳定性”
现有技术平模型。数据显示了在10%召回率下的阳性预测值(PPV),并且误差条(如实
线所示)显示95%置信区间。
[0118] 图13B示出了通过T细胞表位确定的肽递呈的性能结果,其比较了各种肽递呈模型。示出了使用仿射依赖性函数gh(·)和expit函数f(·)并针对HLA-A*02:01的质谱数据
子集进行训练的等式(12)中所示的独立等位基因递呈模型的最大值的结果。还示出了基于
亲和力预测NETMHCpan“亲和力”和基于稳定性预测NETMHCstab“稳定性”的现有技术水平模
型。数据显示了在10%召回率下的阳性预测值(PPV),并且误差条(如实线所示)显示95%置
信区间。
[0119] 图13C示出了通过质谱法测定的关于示例总和函数模型(等式(13))、示例函数总和模型(等式(19))和示例二阶模型(等式(23))的肽递呈的性能结果,用于预测肽递呈。第
一列是指当每个递呈模型应用于测试集时接收者操作特征(ROC)的曲线下面积(AUC),第二
列是指负对数似然损失的值,并且第三列是指在10%召回率下的阳性预测值(PPV)。
[0120] 图13D示出了通过质谱法测定的两个示例递呈模型的肽递呈的性能结果,所述模型在有和没有单等位基因质谱数据的情况下进行了训练。第一列是指当每个递呈模型应用
于测试集时接收者操作特征(ROC)的曲线下面积(AUC),第二列是指负对数似然损失的值,
并且第三列是指在10%召回率下的阳性预测值(PPV)。
[0121] 图13E示出了通过质谱法测定的两个示例递呈模型的肽递呈的性能结果,所述模型在有和没有单等位基因质谱数据的情况下进行了训练。“相关性”是指指示肽是否递呈于
测试数据中的相应等位基因上的实际标记与用于预测的标记之间的相关性。
[0122] 图13F示出了通过在没有单等位基因质谱数据下训练的递呈模型预测的九聚体中第2位(P2)和第9位(P9)的常见锚残基的频率
[0123] 图13G示出了通过质谱法对于并入C端和N端侧接序列作为等位基因相互作用变量的示例递呈模型和并入C端和N端侧接序列作为等位基因非相互作用变量的示例递呈模型
确定的肽递呈的性能结果。第一列是指当每个递呈模型应用于测试集时接收者操作特征
(ROC)的曲线下面积(AUC),第二列是指负对数似然损失的值,并且第三列是指在10%召回
率下的阳性预测值(PPV)。
[0124] 图13H示出了通过质谱法测定的mRNA丰度与肿瘤细胞上递呈的肽频率之间的依赖性。水平轴指示以每百万条读段数的转录物数(TPM)的四分位数表示的mRNA表达。垂直轴指
示以相应mRNA表达水平四分位数表示的基因递呈的表位的百分率。每条实线是有关从肿瘤
样品得到的两个测量值的曲线,其与相应质谱数据和mRNA表达测量值相关联。
[0125] 图13I示出了通过质谱法对于示例递呈模型“MHCflurry+RNA过滤器”测定的肽递呈的性能结果,该示例递呈模型是与目前现有技术水平模型相似的模型,其基于与标准基
因表达过滤器的亲和力预测来预测肽递呈,该过滤器从蛋白质中去除mRNA定量测量值小于
3.2FPKM的所有肽。“示例模型,无RNA”模型是等式(21)中所示的“S型函数总和”示例递呈模型。“示例模型,有RNA”模型是等式(19)中所示的“S型函数总和”递呈模型,其通过对数函数并入mRNA定量数据。数据显示了在20%召回率下的阳性预测值(PPV)。
[0126] 图13J示出了当预测肽递呈时考虑肽长度的递呈模型和不考虑肽长度的现有技术水平模型对于不同肽长度的肽递呈的概率。曲线“真值(盲测数据)”显示了样品测试数据集
中根据肽长度递呈的肽的比例。如果忽略肽长度的现有技术水平模型应用于同一测试数据
集进行递呈预测,则曲线“忽略长度的模型”指示预测的测量值。“示例模型,有RNA”模型是等式(19)中所示的“S型函数总和”递呈模型,其通过对数函数并入mRNA定量数据。
[0127] 图13K是使用质谱法从人肿瘤细胞和肿瘤浸润淋巴细胞(TIL)上的II类MHC等位基因洗脱的肽长度的直方图。
[0128] 图13L示出了两个示例数据集的mRNA定量与每个残基递呈的肽之间的依赖性。
[0129] 图13M比较了使用两个示例数据集训练和测试的示例递呈模型的性能结果。
[0130] 图13N是描绘使用质谱法对于包含HLA II类分子的总共39个样品中每个样品测序的肽数量的直方图。
[0131] 图13-O是描绘其中鉴定出特定MHC II类分子等位基因的样品的数量的直方图。
[0132] 图13P是描绘对于一系列肽长度的每个肽长度,在总共39个样品中由MHC II类分子递呈的肽的比例的直方图。
[0133] 图13Q是描绘39个样品中所存在的基因的基因表达与MHC II类分子递呈基因表达产物的发生率之间的关系的线图。
[0134] 图13R是比较具有不同输入的相同模型在预测肽测试数据集中的肽将被MHC II类分子递呈的可能性时的性能的线图。
[0135] 图13S是比较四个不同模型在预测肽测试数据集中的肽将被MHC II类分子递呈的可能性时的性能的线图。
[0136] 图13T是比较使用两个不同标准的同类最佳现有技术模型和具有两个不同输入的本文公开的递呈模型在预测肽测试数据集中的肽将被MHC II类分子递呈的可能性时的性
能的线图。
[0137] 图14示出用于实施图1和图3中所示的实体的示例计算机。
[0138] 图15示出体外T细胞活化分析的开发。示意性展示该分析,其中将疫苗盒递送到抗原递呈细胞引起独特肽抗原的表达、加工和MHC限制性递呈。经工程改造成具有匹配特定
肽-MHC组合的T细胞受体的报告T细胞经活化,引起荧光素酶表达。
[0139] 图16A示出对短盒中接头序列的评估并且显示在相对于彼此相同的位置中串接的五个I类MHC限制性表位(表位1至5),接着是两个通用II类MHC表位(MHC-II)。使用不同接头
产生各种迭代。在一些情况下,T细胞表位彼此直接连接。在其它情况下,T细胞表位侧接于
其天然序列的一侧或两侧上。在其它迭代中,T细胞表位由非天然序列AAY、RR及DPP连接。
[0140] 图16B示出对短盒中接头序列的评估并且显示关于嵌入所述短盒中的T细胞表位的序列信息。
[0141] 图17示出对添加到模型疫苗盒中的细胞靶向序列的评估。所述靶向盒用泛素(Ub)、信号肽(SP)和/或跨膜(TM)结构域延伸该短盒设计,特征在于紧邻五个标志物人T细
胞表位(表位1至5)以及两个小鼠T细胞表位SIINFEKL(SII)和SPSYAYHQF(A5),并且使用非
天然接头AAY-或天然接头侧接两侧上的T细胞表位(25聚体)。
[0142] 图18示出对短盒中接头序列的体内评估。A)使用HLA-A2转基因小鼠进行疫苗盒的体内评估的实验设计。
[0143] 图19A示出对21聚体长盒中表位位置的影响的体内评估并且显示长盒的设计需要用25聚体天然序列中所包含的另外的熟知T细胞I类表位(表位6至21)隔开的包含在25聚体
天然序列中的五个标志物I类表位(表位1至5)(接头=天然侧接序列),以及两个通用II类
表位(MHC-II0,其中仅I类表位的相对位置改变。
[0144] 图19B示出对21聚体长盒中表位位置的影响的体内评估并且显示关于所用T细胞表位的序列信息。
[0145] 图20A示出临床前IND授权研究(IND-enabling study)的最终盒设计并且显示最终盒的设计包含在25聚体天然序列中所包含的20个MHC I表位(接头=天然侧接序列)以及
2个通用MHC II类表位,所述20个MHC I表位由6个非人灵长类动物(NHP)表位、5个人表位、9
个鼠类表位构成。
[0146] 图20B示出临床前IND授权研究的最终盒设计并且显示递呈在非人灵长类动物、小鼠和人来源的I类MHC上的所用T细胞表位的序列信息,以及2个通用MHC II类表位PADRE和
破伤风类毒素的序列。
[0147] 图21A示出在转染之后产生ChAdV68.4WTnt.GFP病毒。使用磷酸方案,用ChAdV68.4WTnt.GFP DNA转染HEK293A细胞。在转染之后10天观察到病毒复制,并且使用光
显微镜(40×放大倍率)观测到ChAdV68.4WTnt.GFP病毒斑
[0148] 图21B示出在转染之后产生ChAdV68.4WTnt.GFP病毒。使用磷酸钙方案,用ChAdV68.4WTnt.GFP DNA转染HEK293A细胞。在转染之后10天观察到病毒复制,并且使用荧
光显微镜在40×放大倍率下观测到ChAdV68.4WTnt.GFP病毒斑块。
[0149] 图21C示出在转染之后产生ChAdV68.4WTnt.GFP病毒。使用磷酸钙方案,用ChAdV68.4WTnt.GFP DNA转染HEK293A细胞。在转染之后10天观察到病毒复制,并且使用荧
光显微镜在100×放大倍率下观测到ChAdV68.4WTnt.GFP病毒斑块。
[0150] 图22A示出转染之后产生ChAdV68.5WTnt.GFP病毒。使用脂染胺(lipofectamine)方案,用ChAdV68.5WTnt.GFP DNA转染HEK293A细胞。在转染之后10天观察到病毒复制(斑
块)。制备溶解产物并用于再感染T25烧瓶中的293A细胞。3天后,使用光学显微镜(40×放大
倍率)观测到ChAdV68.5WTnt.GFP病毒斑块并拍照。
[0151] 图22B示出转染之后产生ChAdV68.5WTnt.GFP病毒。使用脂染胺方案,用ChAdV68.5WTnt.GFP DNA转染HEK293A细胞。在转染之后10天观察到病毒复制(斑块)。制备
溶解产物并用于再感染T25烧瓶中的293A细胞。3天后,使用荧光显微镜在40×放大倍率下
观测到ChAdV68.5WTnt.GFP病毒斑块并拍照。
[0152] 图22C示出转染之后产生ChAdV68.5WTnt.GFP病毒。使用脂染胺方案,用ChAdV68.5WTnt.GFP DNA转染HEK293A细胞。在转染之后10天观察到病毒复制(斑块)。制备
溶解产物并用于再感染T25烧瓶中的293A细胞。3天后,使用荧光显微镜在100×放大倍率下
观测到ChAdV68.5WTnt.GFP病毒斑块并拍照。
[0153] 图23示出病毒粒子制造方案。
[0154] 图24示出甲病毒源性VEE自我复制型RNA(srRNA)载体。
[0155] 图25示出在用VEE-荧光素酶srRNA接种C57BL/6J小鼠之后的体内报告基因表达。显示出在各种时间点用VEE-荧光素酶srRNA免疫接种C57BL/6J小鼠(每只小鼠10ug,两侧肌
肉内注射,MC3包封)之后的代表性荧光素酶信号图像。
[0156] 图26A示出在带有B16-OVA肿瘤的小鼠中免疫接种用MC3LNP配制的VEE srRNA之后14天测量的T细胞反应。向带有B16-OVA肿瘤的C57BL/6J小鼠注射10ug VEE-荧光素酶srRNA
(对照)、VEE-UbAAY srRNA(Vax)、VEE-荧光素酶srRNA和抗CTLA-4(aCTLA-4)或VEE-UbAAY 
srRNA以及抗CTLA-4(Vax+aCTLA-4)。此外,在第7天开始,用抗PD1 mAb治疗所有小鼠。每组
由8只小鼠组成。在免疫接种之后14天,处死小鼠并收集脾和淋巴结。通过IFN-γELISPOT评
定SIINFEKL特异性T细胞反应并且以每106个脾细胞的斑点形成细胞(SFC)数报道。线表示
中值。
[0157] 图26B示出在带有B16-OVA肿瘤的小鼠中免疫接种用MC3 LNP配制的VEE srRNA之后14天测量的T细胞反应。向带有B16-OVA肿瘤的C57BL/6J小鼠注射10ug VEE-荧光素酶
srRNA(对照)、VEE-UbAAY srRNA(Vax)、VEE-荧光素酶srRNA和抗CTLA-4(aCTLA-4)或VEE-
UbAAY srRNA以及抗CTLA-4(Vax+aCTLA-4)。此外,在第7天开始,用抗PD1 mAb治疗所有小
鼠。每组由8只小鼠组成。在免疫接种之后14天,处死小鼠并收集脾和淋巴结。通过MHCI-五
聚体染色评定SIINFEKL特异性T细胞反应,以五聚体阳性细胞占CD8阳性细胞的百分比报
道。线表示中值。
[0158] 图27A示出在带有B16-OVA肿瘤的小鼠中进行异源初免/加强免疫之后的抗原特异性T细胞反应。向带有B16-OVA肿瘤的C57BL/6J小鼠注射表达GFP的腺病毒(Ad5-GFP)并用经
MC3 LNP配制的VEE-荧光素酶srRNA(对照)加强免疫或者注射Ad5-UbAAY并用VEE-UbAAY 
srRNA(Vax)加强免疫。还用IgG对照mAb治疗对照组和Vax组。第三组用Ad5-GFP初免/VEE-荧
光素酶srRNA加强免疫与抗CTLA-4的组合(aCTLA-4)治疗,而第四组用Ad5-UbAAY初免/VEE-
UbAAY加强免疫与抗CTLA-4的组合(Vax+aCTLA-4)治疗。此外,在第21天开始,用抗PD-1mAb
治疗所有小鼠。通过IFN-γELISPOT测量T细胞反应。在用腺病毒免疫接种后14天,处死小鼠
并收集脾和淋巴结。
[0159] 图27B示出在带有B16-OVA肿瘤的小鼠中进行异源初免/加强免疫之后的抗原特异性T细胞反应。向带有B16-OVA肿瘤的C57BL/6J小鼠注射表达GFP的腺病毒(Ad5-GFP)并用经
MC3 LNP配制的VEE-荧光素酶srRNA(对照)加强免疫或者注射Ad5-UbAAY并用VEE-UbAAY 
srRNA(Vax)加强免疫。还用IgG对照mAb治疗对照组和Vax组。第三组用Ad5-GFP初免/VEE-荧
光素酶srRNA加强免疫与抗CTLA-4的组合(aCTLA-4)治疗,而第四组用Ad5-UbAAY初免/VEE-
UbAAY加强免疫与抗CTLA-4的组合(Vax+aCTLA-4)治疗。此外,在第21天开始,用抗PD-1mAb
治疗所有小鼠。通过IFN-γELISPOT测量T细胞反应。在用腺病毒免疫接种后14天以及在用
srRNA加强免疫后14天(初免之后第28天),处死小鼠并收集脾和淋巴结。
[0160] 图27C示出在带有B16-OVA肿瘤的小鼠中进行异源初免/加强免疫之后的抗原特异性T细胞反应。向带有B16-OVA肿瘤的C57BL/6J小鼠注射表达GFP的腺病毒(Ad5-GFP)并用经
MC3 LNP配制的VEE-荧光素酶srRNA(对照)加强免疫或者注射Ad5-UbAAY并用VEE-UbAAY 
srRNA(Vax)加强免疫。还用IgG对照mAb治疗对照组和Vax组。第三组用Ad5-GFP初免/VEE-荧
光素酶srRNA加强免疫与抗CTLA-4的组合(aCTLA-4)治疗,而第四组用Ad5-UbAAY初免/VEE-
UbAAY加强免疫与抗CTLA-4的组合(Vax+aCTLA-4)治疗。此外,在第21天开始,用抗PD-1mAb
治疗所有小鼠。通过MHC I类五聚体染色测量T细胞反应。在用腺病毒免疫接种后14天,处死
小鼠并收集脾和淋巴结。
[0161] 图27D示出在带有B16-OVA肿瘤的小鼠中进行异源初免/加强免疫之后的抗原特异性T细胞反应。向带有B16-OVA肿瘤的C57BL/6J小鼠注射表达GFP的腺病毒(Ad5-GFP)并用经
MC3LNP配制的VEE-荧光素酶srRNA(对照)加强免疫或者注射Ad5-UbAAY并用VEE-UbAAY 
srRNA(Vax)加强免疫。还用IgG对照mAb治疗对照组和Vax组。第三组用Ad5-GFP初免/VEE-荧
光素酶srRNA加强免疫与抗CTLA-4的组合(aCTLA-4)治疗,而第四组用Ad5-UbAAY初免/VEE-
UbAAY加强免疫与抗CTLA-4的组合(Vax+aCTLA-4)治疗。此外,在第21天开始,用抗PD-1mAb
治疗所有小鼠。通过MHC I类五聚体染色测量T细胞反应。在用腺病毒免疫接种后14天以及
在用srRNA加强免疫后14天(初免之后第28天),处死小鼠并收集脾和淋巴结。
[0162] 图28A示出在带有CT26(Balb/c)肿瘤的小鼠中进行异源初免/加强免疫之后的抗原特异性T细胞反应。对小鼠免疫接种Ad5-GFP并且在腺病毒初免之后15天,用经MC3 LNP配
制的VEE-荧光素酶srRNA(对照)加强免疫,或者用Ad5-UbAAY进行初免并用VEE-UbAAY 
srRNA(Vax)加强免疫。还用IgG对照mAb治疗对照组和Vax组。向另一个组施用Ad5-GFP/VEE-
荧光素酶srRNA初免/加强免疫与抗PD-1的组合(aPD1),而第四组接受Ad5-UbAAY/VEE-
UbAAY srRNA初免/加强免疫与抗PD-1mAb的组合(Vax+aPD1)。使用IFN-γELISPOT测量T细
胞对AH1肽的反应。在用腺病毒免疫接种后12天,处死小鼠并收集脾和淋巴结。
[0163] 图28B示出在带有CT26(Balb/c)肿瘤的小鼠中进行异源初免/加强免疫之后的抗原特异性T细胞反应。对小鼠免疫接种Ad5-GFP并且在腺病毒初免之后15天,用经MC3 LNP配
制的VEE-荧光素酶srRNA(对照)加强免疫,或者用Ad5-UbAAY进行初免并用VEE-UbAAY 
srRNA(Vax)加强免疫。还用IgG对照mAb治疗对照组和Vax组。向另一个组施用Ad5-GFP/VEE-
荧光素酶srRNA初免/加强免疫与抗PD-1的组合(aPD1),而第四组接受Ad5-UbAAY/VEE-
UbAAY srRNA初免/加强免疫与抗PD-1mAb的组合(Vax+aPD1)。使用IFN-γELISPOT测量T细
胞对AH1肽的反应。在用腺病毒免疫接种后12天以及在用srRNA加强免疫后6天(初免之后第
21天),处死小鼠并收集脾和淋巴结。
[0164] 图29示出ChAdV68引起针对小鼠中小鼠肿瘤抗原的T细胞反应。对小鼠免疫接种ChAdV68.5WTnt.MAG25mer,并且在C57BL/6J雌性小鼠中测量针对MHC I类表位SIINFEKL
(OVA)的T细胞反应并在Balb/c小鼠中测量针对MHC I类表位AH1-A5的T细胞反应。递呈在
ELISpot分析中测量的每106个脾细胞的平均斑点形成细胞(SFC)。误差条表示标准偏差。
[0165] 图30示出在CT26肿瘤模型中单次免疫接种ChAdV6、ChAdV+抗PD-1、srRNA、srRNA+抗PD-1或单独抗PD-1之后的细胞免疫应答。使用ELISpot测量来自每组的6只小鼠的脾细胞
中抗原特异性IFN-γ的产生。结果呈现为每106个脾细胞的斑点形成细胞(SFC)。每个组的
中值以水平线指示。P值使用Dunnett多重比较检验确定;***P<0.0001,**P<0.001,*P<
0.05。ChAdV=ChAdV68.5WTnt.MAG25mer;srRNA=VEE-MAG25mer srRNA。
[0166] 图31示出在CT26肿瘤模型中单次免疫接种ChAdV6、ChAdV+抗PD-1、srRNA、srRNA+抗PD-1或单独抗PD-1之后的CD8 T细胞反应。使用ICS测量CD8 T细胞中抗原特异性IFN-γ
的产生并且结果呈现为抗原特异性CD8 T细胞占总CD8 T细胞的百分比。每个组的中值以水
平线指示。P值使用Dunnett多重比较检验确定;***P<0.0001,**P<0.001,*P<0.05。ChAdV=
ChAdV68.5WTnt.MAG25mer;srRNA=VEE-MAG25mer srRNA。
[0167] 图32示出在CT26肿瘤模型中用ChAdV/srRNA异源初免/加强免疫、srRNA/ChAdV异源初免/加强免疫或srRNA/srRNA同源初免/加强免疫进行免疫接种之后的肿瘤生长情况。
还示出与在初免和加强免疫期间施用或不施用抗PD1的初免/加强免疫的比较。每周两次测
量肿瘤体积并且呈现研究的前21天的平均肿瘤体积。研究起始时每组22-28只小鼠。误差条
表示平均值的标准误差(SEM)。P值使用Dunnett检验确定;***P<0.0001,**P<0.001,*P<
0.05。ChAdV=ChAdV68.5WTnt.MAG25mer;srRNA=VEE-MAG25mer srRNA。
[0168] 图33示出在CT26肿瘤模型中用ChAdV/srRNA异源初免/加强免疫、srRNA/ChAdV异源初免/加强免疫或srRNA/srRNA同源初免/加强免疫进行免疫接种之后的存活情况。还示
出与在初免和加强免疫期间施用或不施用抗PD1的初免/加强免疫的比较。P值使用对数秩
检验确定;***P<0.0001,**P<0.001,*P<0.01。ChAdV=ChAdV68.5WTnt.MAG25mer;srRNA=
VEE-MAG25mersrRNA。
[0169] 图34示出使用ELISpot测量的抗原特异性细胞免疫应答。在第一次加强免疫之后1、2、3、4、5、6、8、9或10周,使用ELISpot测量VEE-MAG25mer srRNA-LNP1(30μg)(图34A)、VEE-MAG25mer srRNA-LNP1(100μg)(图34B)、或VEE-MAG25mer srRNA-LNP2(100μg)(图34C)
同源初免/加强免疫或ChAdV68.5WTnt.MAG25mer/VEE-MAG25mer srRNA异源初免/加强免疫
组(图34D)的PBMC中针对六个不同mamu A01限制性表位的抗原特异性IFN-γ产生情况(每
组6只恒河猴)。结果以堆叠条形图格式对于各表位以每106个PBMC的平均斑点形成细胞
(SFC)呈现。将每只动物的值相对于放血前(第0周)的水平进行归一化。
[0170] 图35显示使用ELISpot测量的抗原特异性细胞免疫应答。在免疫接种之前以及在初始免疫接种之后4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24周,使用ELISpot测量在用ChAdV68.5WTnt.MAG25mer/VEE-MAG25mer srRNA异源初免/加强免疫方
案免疫接种后的PBMC中针对六个不同mamu A01限制性表位的抗原特异性IFN-γ产生情况。
结果以堆叠条形图格式对于每个表位以每106个PBMC的平均斑点形成细胞(SFC)呈现(每组
6只恒河猴)。
[0171] 图36显示使用ELISpot测量的抗原特异性细胞免疫应答。在免疫接种之前以及在初始免疫接种之后4、5、6、7、8、10、11、12、13、14或15周,使用ELISpot测量在用VEE-
MAG25mer srRNA LNP2同源初免/加强免疫方案免疫接种后的PBMC中针对六个不同mamu 
A01限制性表位的抗原特异性IFN-γ产生情况。结果以堆叠条形图格式对于每个表位以每
106个PBMC的平均斑点形成细胞(SFC)呈现(每组6只恒河猴)。
[0172] 图37显示使用ELISpot测量的抗原特异性细胞免疫应答。在免疫接种之前以及在初始免疫接种之后4、5、6、7、8、10、11、12、13、14或15周,使用ELISpot测量在用VEE-
MAG25mer srRNA LNP1同源初免/加强免疫方案免疫接种后的PBMC中针对六个不同mamu 
A01限制性表位的抗原特异性IFN-γ产生情况。结果以堆叠条形图格式对于每个表位以每
106个PBMC的平均斑点形成细胞(SFC)呈现(每组6只恒河猴)。
[0173] 图38示出确定两个示例盒序列的距离度量。

具体实施方式

[0174] I.定义
[0175] 一般说来,权利要求书和说明书中使用的术语意图解释为具有与本领域普通技术人员所理解的普通含义。为清楚起见,以下定义某些术语。如果普通含义与所提供的定义之
间存在矛盾,应使用所提供的定义。
[0176] 如本文所用,术语“抗原”是诱导免疫应答的物质。
[0177] 如本文所用,术语“新抗原”是具有至少一个使其不同于相应野生型抗原的改变的抗原,例如经由肿瘤细胞中的突变或特异性针对肿瘤细胞的翻译后修饰。新抗原可以包括
多肽序列或核苷酸序列。突变可以包括移码或非移码插入缺失、错义或无义取代、剪接位点
改变、基因组重排或基因融合,或产生neoORF的任何基因组或表达改变。突变还可以包括剪
接变体。特异性针对肿瘤细胞的翻译后修饰可以包括异常磷酸化。特异性针对肿瘤细胞的
翻译后修饰还可以包括蛋白酶体产生的剪接抗原。参见Liepe等人,A large fraction of 
HLA class I ligands are proteasome-generated spliced peptides;Science.2016年
10月21日;354(6310):354-358。
[0178] 如本文所用,术语“肿瘤新抗原”是存在于受试者的肿瘤细胞或组织中但不存在于受试者的相应正常细胞或组织中的新抗原。
[0179] 如本文所用,术语“基于新抗原的疫苗”是基于一个或多个新抗原(例如多个新抗原)的疫苗构建体。
[0180] 如本文所用,术语“候选新抗原”是产生可代表新抗原的新序列的突变或其它畸变。
[0181] 如本文所用,术语“编码区”是编码蛋白质的基因的部分。
[0182] 如本文所用,术语“编码突变”是在编码区中出现的突变。
[0183] 如本文所用,术语“ORF”意指开放阅读框。
[0184] 如本文所用,术语“NEO-ORF”是由突变或其它畸变如剪接而产生的肿瘤特异性ORF。
[0185] 如本文所用,术语“错义突变”是引起一个氨基酸被另一个氨基酸取代的突变。
[0186] 如本文所用,术语“无义突变”是引起氨基酸被终止密码子取代或引起典型起始密码子移除的突变。
[0187] 如本文所用,术语“移码突变”是引起蛋白质框架改变的突变。
[0188] 如本文所用,术语“插入缺失”是一个或多个核酸的插入或缺失。
[0189] 如本文所用,在两个或更多个核酸或多肽序列的上下文中,术语“同一性”百分比是指当出于最大对应性比较和比对时,两个或更多个序列或子序列具有指定百分比的核苷
酸或氨基酸残基是相同的,如使用下文所述的序列比较算法(例如BLASTP和BLASTN,或技术
人员可用的其它算法)之一测量或通过目测检查所测量。取决于应用,“同一性”百分比可以
存在于所比较的序列区域上,例如在功能结构域上,或者存在于待比较的两个序列的全长
上。
[0190] 关于序列比较,通常一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机中,必要时指定子序列坐标,并且指定序列
算法程序参数。然后,序列比较算法基于指定程序参数计算测试序列相对于参考序列的序
列同一性百分比。或者,可以通过组合在所选序列位置(例如序列基序)处特定核苷酸,或对
于翻译的序列来说特定氨基酸的存在或不存在来确定序列相似性或不相似性。
[0191] 用于比较的最佳序列比对可以例如通过Smith和Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法;Needleman和Wunsch,J.Mol.Biol.48:443(1970)的同源性比对
算法;Pearson和Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)的相似性搜索方法;这
些算法的计算机化实施(Wisconsin Genetics软件包中的GAP、BESTFIT、FASTA和TFASTA;
Genetics Computer Group,575Science Dr.,Madison,Wis.);或通过目测检查(一般参见
Ausubel等人,见下文)来进行。
[0192] 适于测定序列同一性和序列相似性百分比的算法的一个实例是Altschul等人,J.Mol.Biol.215:403-410(1990)中描述的BLAST算法。执行BLAST分析的软件可通过国家生
物技术信息中心(National Center for Biotechnology Information)公开获得。
[0193] 如本文所用,术语“无终止或通读”是引起天然终止密码子移除的突变。
[0194] 如本文所用,术语“表位”是抗原中通常由抗体或T细胞受体结合的特异性部分。
[0195] 如本文所用,术语“免疫原性”是例如通过T细胞、B细胞或两者引发免疫应答的能力。
[0196] 如本文所用,术语“HLA结合亲和力”、“MHC结合亲和力”意指特异性抗原与特异性MHC等位基因之间的结合亲和力。
[0197] 如本文所用,术语“诱饵”是用于从样品富集DNA或RNA的特定序列的核酸探针。
[0198] 如本文所用,术语“变体”是受试者的核酸与用作对照的参考人基因组之间的差异。
[0199] 如本文所用,术语“变体识别(variant call)”是对通常由测序确定的变体存在的算法确定。
[0200] 如本文所用,术语“多态性”是生殖系变体,即在个体的所有携带DNA的细胞中发现的变体。
[0201] 如本文所用,术语“体细胞变体”是在个体的非生殖系细胞中产生的变体。
[0202] 如本文所用,术语“等位基因”是基因的一种形式,或基因序列的一种形式,或蛋白质的一种形式。
[0203] 如本文所用,术语“HLA型”是HLA基因等位基因的补体。
[0204] 如本文所用,术语“无义介导的衰变”或“NMD”是由过早终止密码子所致的细胞对mRNA的降解。
[0205] 如本文所用,术语“躯干突变”是起源于肿瘤发展早期且存在于大多数肿瘤细胞中的突变。
[0206] 如本文所用,术语“亚克隆突变”是起源于肿瘤发展后期且仅存在于肿瘤细胞子集中的突变。
[0207] 如本文所用,术语“外显子组”是编码蛋白质的基因组的子集。外显子组可以是基因组的集合外显子。
[0208] 如本文所用,术语“逻辑回归”是来自统计的二进制数据的回归模型,其中因变量等于1的概率的逻辑被建模为因变量的线性函数。
[0209] 如本文所用,术语“神经网络”是用于分类或回归的机器学习模型,其由多层线性变换,接着是通常经由随机梯度下降和反向传播训练的逐元素非线性组成。
[0210] 如本文所用,术语“蛋白质组”是由细胞、细胞群或个体表达和/或翻译的全部蛋白质的集合。
[0211] 如本文所用,术语“肽组”是由MHC-I或MHC-II在细胞表面上递呈的所有肽的集合。肽组可以指细胞或细胞集合(例如肿瘤肽组,意味着构成肿瘤的所有细胞的肽组的联合)的
特性。
[0212] 如本文所用,术语“ELISPOT”意指酶联免疫吸附斑点分析,这是一种用于监测人和动物的免疫应答的常用方法。
[0213] 如本文所用,术语“葡聚糖肽多聚体”是在流式细胞测量术中用于抗原特异性T细胞染色的基于葡聚糖的肽-MHC多聚体。
[0214] 如本文所用,术语“耐受性或免疫耐受性”是对一种或多种抗原(例如自身抗原)免疫无反应性的状态。
[0215] 如本文所用,术语“中心耐受性”是通过缺失自身反应性T细胞克隆或通过促进自身反应性T细胞克隆分化成免疫抑制性调节性T细胞(Treg)而在胸腺中遭受的耐受性。
[0216] 如本文所用,术语“外周耐受性”是通过下调或不激活经受中心耐受性的自身反应性T细胞或促进这些T细胞分化成Treg而在外周遭受的耐受性。
[0217] 术语“样品”可以包括借助于包括静脉穿刺、排泄、射精、按摩、活组织检查、针抽吸、灌洗样品、刮取、手术切口或干预在内的手段,或本领域中已知的其它手段从受试者获
取单个细胞或多个细胞或细胞碎片或体液等分试样。
[0218] 术语“受试者”涵盖人或非人,无论体内、离体或体外,雄性或雌性的细胞、组织或生物体。术语受试者包括含人在内的哺乳动物。
[0219] 术语“哺乳动物”涵盖人和非人,并且包括但不限于人、非人灵长类动物、犬科动物、猫科动物、鼠科动物、科动物、马科动物和猪科动物。
[0220] 术语“临床因素”是指受试者状况的量度,例如疾病活动性或严重程度。“临床因素”涵盖受试者健康状况的所有标志物,包括非样品标志物,和/或受试者的其它特征,例如
但不限于年龄和性别。临床因素可以是可在确定条件下评估来自受试者的样品(或样品群
体)或受试者而获得的评分、值或值集合。临床因素也可以由标志物和/或其它参数(例如基
因表达替代物)进行预测。临床因素可以包括肿瘤类型、肿瘤亚型和吸烟史。
[0221] 术语“源于肿瘤的抗原编码核酸序列”是指例如经由RT-PCR直接从肿瘤提取的核酸序列;或通过肿瘤测序获得的序列数据,然后使用测序数据例如经由本领域中已知的各
种合成或基于PCR的方法合成核酸序列。
[0222] 术语“甲病毒”是指披膜病毒科(Togaviridae)的成员,并且是正义单链RNA病毒。甲病毒通常分类为旧世界,例如辛德毕斯、罗斯河、马雅鲁、基孔肯尼亚(Chikungunya)和塞
姆利基森林病毒,或新世界,例如东部马脑炎、奥拉、摩根堡或委内瑞拉马脑炎及其衍生病
毒株TC-83。甲病毒通常是自我复制的RNA病毒。
[0223] 术语“甲病毒骨架”是指允许病毒基因组自我复制的甲病毒的最小序列。最小序列可包括用于非结构蛋白质介导的扩增的保守序列、非结构蛋白质1(nsP1)基因、nsP2基因、
nsP3基因、nsP4基因和polyA序列,以及用于亚基因组病毒RNA表达的序列,包括26S启动子
元件。
[0224] 术语“用于非结构蛋白质介导的扩增的序列”包括本领域技术人员熟知的甲病毒保守序列元件(CSE)。CSE包括(但不限于)甲病毒5'UTR、51-nt CSE、24-nt CSE或其它26S亚
基因组启动子序列、19-nt CSE和甲病毒3'UTR。
[0225] 术语“RNA聚合酶”包括催化由DNA模板产生RNA多核苷酸的聚合酶。RNA聚合酶包括(但不限于)源自噬菌体的聚合酶,包括T3、T7和SP6。
[0226] 术语“脂质”包括疏水性和/或两亲性分子。脂质可以是阳离子、阴离子或中性的。脂质可以是合成或天然来源的,并且在一些情况下是可生物降解的。脂质可包括胆固醇、磷
脂、脂质缀合物包括(但不限于)聚乙二醇(PEG)缀合物(聚乙二醇化脂质)、蜡、油、甘油酯、
脂肪和脂溶性维生素。脂质也可包括二亚油基甲基-4-二甲基胺基丁酸酯(MC3)和MC3样分
子。
[0227] 术语“脂质纳米粒子”或“LNP”包括使用含脂质膜围绕水性内部形成的小泡样结构,也称为脂质体。脂质纳米粒子包括具有通过表面活性剂稳定的固体脂质核心的基于脂
质的组合物。核心脂质可以是脂肪酸、酰基甘油、蜡和这些表面活性剂的混合物。生物膜
质,例如磷脂、鞘磷脂、胆汁盐(牛磺胆酸钠)和固醇(胆固醇),可用作稳定剂。脂质纳米粒子
可使用限定比率的不同脂质分子形成,包括(但不限于)限定比率的一种或多种阳离子脂
质、阴离子脂质或中性脂质。脂质纳米粒子可将分子包封在外膜壳内,并且随后可与靶细胞
接触以将包封的分子递送到宿主细胞胞溶质。脂质纳米粒子可用非脂质分子修饰或官能
化,包括在其表面上。脂质纳米粒子可为单层的(单层)或多层的(多层)。脂质纳米粒子可与
核酸复合。单层脂质纳米粒子可与核酸复合,其中核酸在水性内部。多层脂质纳米粒子可与
核酸复合,其中核酸在水性内部,或者形成或包夹在其间。
[0228] 缩写:MHC:主要组织相容性复合物;HLA:人白细胞抗原或人MHC基因座;NGS:下一代测序;PPV:阳性预测值;TSNA:肿瘤特异性新抗原;FFPE:福尔马林固定、石蜡包埋;NMD:无义介导的衰变;NSCLC:非小细胞肺癌;DC:树突状细胞。
[0229] 除非上下文另外清楚地规定,否则如本说明书和所附权利要求中所用,单数形式“一个(种)”和“所述”包括多个指示物。
[0230] 除非特别说明或从上下文中可以明显看出,否则如本文所用,术语“约”应理解为在本领域的正常公差范围内,例如在平均值的2个标准偏差内。约可以理解为所述值的
10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%或0.01%内。除非上下文另有明确说明,否则本文提供的所有数值均由术语约修饰。
[0231] 本文中未直接定义的任何术语应理解为具有与本发明领域内所理解的通常与之相关的含义。本文论述的某些术语是为了向从业人员描述本发明各方面的组合物、装置、方
法等以及其制备或使用提供额外的指导。应了解,相同的事物可以按超过一种方式表示。因
此,替代性措辞和同义词可以用于本文所论述的任何一个或多个术语。无论本文中是否阐
述或论述术语都无关紧要。提供了一些同义词或可取代的方法、材料等。除非明确陈述,否
则对一个或数个同义词或等效物的叙述不排除其它同义词或等效物的使用。实例,包括术
语实例的使用只是出于说明的目的,且并非在本文中限制本发明各方面的范围和含义。
[0232] 说明书正文内引用的所有参考文献、颁布的专利和专利申请都是以引用的方式整体并入本文中用于所有目的。
[0233] II.鉴定新抗原的方法
[0234] 本文公开了用于鉴定来自受试者肿瘤的新抗原的方法,这些新抗原可能被递呈于肿瘤或免疫细胞(包括专职抗原递呈细胞如树突状细胞)的细胞表面上,和/或可能是免疫
原性的。举例来说,一种此类方法可以包括以下步骤:从受试者的肿瘤细胞获得外显子组、
转录组或全基因组肿瘤核苷酸测序数据中的至少一者,其中所述肿瘤核苷酸测序数据被用
于获得代表新抗原集合中的每一者的肽序列的数据,并且其中每个新抗原的肽序列包含使
其不同于相应野生型肽序列的至少一个改变;将每个新抗原的肽序列输入到一个或多个递
呈模型中以产生所述新抗原各自被一个或多个MHC等位基因递呈于受试者肿瘤细胞的肿瘤
细胞表面或肿瘤中存在的细胞上的数值可能性集合,所述数值可能性集合已被至少基于接
收到的质谱数据进行鉴定;以及基于所述数值可能性集合选择所述新抗原集合的子集,以
产生经选择的新抗原的集合。
[0235] 递呈模型可以包括针对包含相应标记集合的参考数据集合(也称为训练数据集)训练的统计回归或机器学习(例如深度学习)模型,其中所述参考数据集合是从多个不同受
试者中的每一者获得,其中任选地,一些受试者可以患有肿瘤,并且其中所述参考数据集合
包含以下中的至少一者:代表来自肿瘤组织的外显子组核苷酸序列的数据、代表来自正常
组织的外显子组核苷酸序列的数据、代表来自肿瘤组织的转录组核苷酸序列的数据、代表
来自肿瘤组织的蛋白质组序列的数据和代表来自肿瘤组织的MHC肽组序列的数据,以及代
表来自正常组织的MHC肽组序列的数据。参考数据可以另外包括工程改造成表达预定MCH等
位基因且随后暴露于合成蛋白质的单等位基因细胞系、正常和肿瘤人细胞系,以及新鲜和
冷冻原始样品的质谱数据、测序数据、RNA测序数据和蛋白质组数据,以及T细胞分析(例如
ELISPOT)。在某些方面,参考数据集合包括每种形式的参考数据。
[0236] 递呈模型可以包含至少部分从参考数据集合得到的特征集合,并且其中所述特征集合包含等位基因依赖性特征和等位基因非依赖性特征中的至少一种。在某些方面,包括
每一特征。
[0237] 本文还公开了通过从受试者的一个或多个肿瘤细胞中鉴定一个或多个可能递呈于肿瘤细胞表面上的新抗原来产生用于构建个性化癌症疫苗的输出的方法。举例来说,一
种这样的方法可以包括以下步骤:从受试者的肿瘤细胞和正常细胞获得外显子组、转录组
或全基因组核苷酸测序数据中的至少一者,其中所述核苷酸测序数据用于获得代表通过比
较来自肿瘤细胞的核苷酸测序数据与来自正常细胞的核苷酸测序数据而鉴定的新抗原集
合中的每一者的肽序列的数据,并且其中每个新抗原的肽序列包含使其不同于从受试者正
常细胞中鉴定出的相应野生型肽序列的至少一个改变;将每个新抗原的肽序列编码成相应
的数值向量,每个数值向量包括有关构成肽序列的多个氨基酸和肽序列中的氨基酸位置集
合的信息;使用计算机处理器将所述数值向量输入到深度学习递呈模型中,以生成所述新
抗原集合的递呈可能性集合,所述集合中的每个递呈可能性表示一个或多个II类MHC等位
基因在受试者的肿瘤细胞表面上递呈相应新抗原的可能性,即深度学习递呈模型;基于所
述递呈可能性集合,选择所述新抗原集合的子集,以生成经选择的新抗原集合;以及基于所
述经选择的新抗原集合,生成用于构建个性化癌症疫苗的输出。
[0238] 在一些实施方案中,所述递呈模型包括至少基于训练数据集鉴定的多个参数,以及表示作为输入接收的数值向量与基于数值向量和参数作为输出生成的递呈可能性之间
的关系的函数。在某些实施方案中,训练数据集包括通过质谱法获得的测量在多个样品中
的至少一者中鉴定存在的与至少一个II类MHC等位基因结合的肽的存在的标记,编码为包
括有关构成肽序列的多个氨基酸和肽序列中的氨基酸位置集合的信息的数值向量的训练
肽序列,以及与所述训练肽序列相关的至少一个HLA等位基因。
[0239] 树突状细胞递呈初始T细胞特征可以包括以下中的至少一者:上述特征。疫苗中抗原的剂量和类型(例如肽、mRNA、病毒等):(1)树突状细胞(DC)摄取抗原类型的途径(例如内
吞作用、微胞吞作用);和/或(2)抗原被DC摄取的功效。疫苗中佐剂的剂量和类型。疫苗抗原
序列的长度。疫苗施用的次数和部位。基线患者免疫功能(例如,通过近期感染史、血液计数
等度量)。对于RNA疫苗:(1)树突状细胞中mRNA蛋白质产物的周转率;(2)如在体外或体内实
验中测量的在树突状细胞摄取后mRNA的翻译速率;和/或(3)如在体内或体外实验中测量的
在树突状细胞摄取后mRNA翻译的数量或次数。肽中蛋白酶裂解基序的存在,任选地对通常
在树突状细胞中表达的蛋白酶提供额外权重(如通过RNA-seq或质谱法测量)。典型的活化
树突状细胞中蛋白酶体和免疫蛋白酶体的表达水平(可以通过RNA-seq、质谱法、免疫组织
化学或其它标准技术测量)。所讨论的个体中特定MHC等位基因的表达水平(例如通过RNA-
seq或质谱法测量),任选地在活化树突状细胞或其它免疫细胞中特异性测量。在表达特定
MHC等位基因的其他个体中特定MHC等位基因递呈肽的概率,任选地在活化树突状细胞或其
它免疫细胞中特异性测量。在其他个体中由同一家族分子(例如HLA-A、HLA-B、HLA-C、HLA-
DQ、HLA-DR、HLA-DP)中的MHC等位基因递呈肽的概率,任选地在活化树突状细胞或其它免疫
细胞中特异性测量。
[0240] 免疫耐受逃避特征可以包括以下中的至少一者:经由对一种或数种细胞类型进行蛋白质质谱直接测量自身肽组。通过采用自身蛋白质所有k聚体(例如5-25)子串的联合来
估计自身肽组。使用与上述应用于所有非突变自身蛋白质的递呈模型类似的递呈模型估计
自身肽组,任选地考虑生殖系变体。
[0241] 可以使用由至少一个模型提供的多个新抗原至少部分地基于数值可能性进行排序。在排序后,可以根据选择标准进行选择,以选出经排序的新抗原的子集。在选择后,可以
提供经排序的肽的子集作为输出。
[0242] 经选择的新抗原集合的数量可以是20个。
[0243] 递呈模型可以表示以下两者之间的依赖性:MHC等位基因中的一对特定等位基因和在肽序列特定位置处特定氨基酸的存在;与在肿瘤细胞表面上由该对MHC等位基因中的
特定等位基因递呈在该特定位置处包含特定氨基酸的此类肽序列的可能性。
[0244] 本文公开的方法还可以包括将一个或多个递呈模型应用于相应新抗原的肽序列以生成一个或多个MHC等位基因各自的依赖性评分,所述依赖性评分指示该MHC等位基因是
否将至少基于相应新抗原的肽序列中氨基酸的位置递呈相应新抗原。
[0245] 本文公开的方法还可以包括变换依赖性评分以产生每个MHC等位基因的相应独立等位基因可能性,由此指示相应MHC等位基因将递呈相应新抗原的可能性;以及组合独立等
位基因可能性以产生数值可能性。
[0246] 该变换依赖性评分的步骤可以将相应新抗原的肽序列的递呈建模为相互排斥的。
[0247] 本文公开的方法还可以包括变换依赖性评分的组合以产生数值可能性。
[0248] 所述变换依赖性评分的组合的步骤可以将相应新抗原的肽序列的递呈建模为在MHC等位基因之间存在干扰。
[0249] 所述数值可能性集合可以通过至少一个等位基因非相互作用特征进一步鉴定,并且本文公开的方法也可以包括将不与一个或多个递呈模型中的一者相互作用的等位基因
应用于等位基因非相互作用特征以产生等位基因非相互作用特征的依赖性评分,所述依赖
性评分指示相应新抗原的肽序列是否将基于等位基因非相互作用特征而被递呈。
[0250] 本文公开的方法还可以包括将所述一个或多个MHC等位基因中的每个MHC等位基因的依赖性评分与等位基因非相互作用特征的依赖性评分组合;变换每个MHC等位基因的
组合的依赖性评分以产生所述MHC等位基因的相应独立等位基因可能性,由此指示相应MHC
等位基因将递呈相应新抗原的可能性;以及组合独立等位基因可能性以产生数值可能性。
[0251] 本文公开的方法还可以包括变换每个MHC等位基因的依赖性评分与等位基因非相互作用特征的依赖性评分的组合以产生数值可能性。
[0252] 递呈模型的数值参数集合可以基于训练数据集进行训练,所述训练数据集包括被鉴定为存在于多个样品中的至少一个训练肽序列集合以及与每个训练肽序列相关的一个
或多个MHC等位基因,其中训练肽序列是通过对从来源于该多个样品的MHC等位基因洗脱的
分离肽进行质谱法来鉴定。
[0253] 样品还可以包括工程改造成表达单个MHC I类或II类等位基因的细胞系。
[0254] 样品还可以包括工程改造成表达多个MHC I类或II类等位基因的细胞系。
[0255] 样品还可以包括从多个患者获得或得到的人细胞系。
[0256] 样品还可以包括从多个患者获得的新鲜或冷冻的肿瘤样品。
[0257] 样品还可以包括从多个患者获得的新鲜或冷冻的组织样品。
[0258] 样品还可以包括使用T细胞分析鉴定的肽。
[0259] 训练数据集可以另外包括与以下相关的数据:样品中存在的训练肽集合的肽丰度;样品中训练肽集合的肽长度。
[0260] 训练数据集可以通过经由比对,将训练肽序列的集合与包含已知蛋白质序列的集合的数据库相比较而产生,其中训练蛋白质序列的集合比训练肽序列长并且包括训练肽序
列。
[0261] 训练数据集可以基于对细胞系进行或已进行核苷酸测序以获得来自细胞系的外显子组、转录组或全基因组测序数据中的至少一者来产生,所述测序数据包括至少一个包
括改变的核苷酸序列。
[0262] 训练数据集可以基于获得来自正常组织样品的外显子组、转录组和全基因组正常核苷酸测序数据中的至少一者来产生。
[0263] 训练数据集可以另外包括与样品相关的蛋白质组序列相关的数据。
[0264] 训练数据集可以另外包括与样品相关的MHC肽组序列相关的数据。
[0265] 训练数据集可以另外包括与至少一种分离肽的肽-MHC结合亲和力测量相关的数据。
[0266] 训练数据集可以另外包括与至少一种分离肽的肽-MHC结合稳定性测量相关的数据。
[0267] 训练数据集可以另外包括与样品相关的转录组相关的数据。
[0268] 训练数据集可以另外包括与样品相关的基因组相关的数据。
[0269] 训练肽序列的长度可以在k聚体的范围内,其中k对于MHC I类而言在8-15之间(包括端点)或对于MHC II类而言在6-30之间(包括端点)。
[0270] 本文公开的方法还可以包括使用独热编码方案(one-hot encoding scheme)编码肽序列。
[0271] 本文公开的方法还可以包括使用左填充独热编码方案编码训练肽序列。
[0272] 治疗患有肿瘤的受试者的方法包括进行本文所述的任何新抗原鉴定方法的步骤,并且还包括获得包含经选择的新抗原集合的肿瘤疫苗,以及将所述肿瘤疫苗施用于所述受
试者。
[0273] 本文公开的方法还可以包括鉴定一个或多个T细胞,所述T细胞针对子集中的至少一个新抗原具有抗原特异性。在一些实施方案中,鉴定包括在使一个或多个抗原特异性T细
胞扩增的条件下,将一个或多个T细胞与子集中的一个或多个新抗原共培养。在其它实施方
案中,鉴定包括在允许T细胞和四聚体之间结合的条件下,使一个或多个T细胞与包含子集
中一个或多个新抗原的四聚体接触。在其它实施方案中,本文公开的方法还可以包括鉴定
一个或多个已鉴定T细胞的一个或多个T细胞受体(TCR)。在某些实施方案中,鉴定一个或多
个T细胞受体包括对一个或多个已鉴定T细胞的T细胞受体序列进行测序。本文公开的方法
可以进一步包括对多个T细胞进行基因工程改造以表达一个或多个已鉴定T细胞受体中的
至少一者;在使多个T细胞扩增的条件下培养所述多个T细胞;以及将扩增的T细胞注入受试
者体内。在一些实施方案中,对多个T细胞进行基因工程改造以表达一个或多个已鉴定T细
胞受体中的至少一者包括将一个或多个已鉴定T细胞的T细胞受体序列克隆到表达载体中;
以及用所述表达载体转染多个T细胞中的每一者。在一些实施方案中,本文公开的方法还包
括在扩增一个或多个已鉴定T细胞的条件下培养所述一个或多个已鉴定T细胞;以及将扩增
的T细胞注入受试者体内。
[0274] 本文还公开了一种分离T细胞,其针对子集中的至少一个经选择的新抗原具有抗原特异性。
[0275] 本文还公开了一种用于制造肿瘤疫苗的方法,其包括以下步骤:从受试者的肿瘤细胞获得外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少一者,其中该肿瘤核
苷酸测序数据用于获得代表新抗原集合中的每一者的肽序列的数据,并且其中每个新抗原
的肽序列包含使其不同于相应野生型肽序列的至少一个改变;将每个新抗原的肽序列输入
到一个或多个递呈模型中,以产生新抗原中的每一者在受试者肿瘤细胞的肿瘤细胞表面上
由一个或多个MHC等位基因递呈的数值可能性集合,该数值可能性集合已至少基于所接收
的质谱数据进行鉴定;以及基于该数值可能性集合选择该新抗原集合的子集,以产生经选
择的新抗原集合;以及产生或已产生包含该经选择的新抗原集合的肿瘤疫苗。
[0276] 本文还公开了一种包括经选择的新抗原集合的肿瘤疫苗,该经选择的新抗原集合通过执行包括以下步骤的方法来选择:从受试者的肿瘤细胞获得外显子组、转录组或全基
因组肿瘤核苷酸测序数据中的至少一者,其中该肿瘤核苷酸测序数据用于获得代表新抗原
集合中的每一者的肽序列的数据,并且其中每个新抗原的肽序列包含使其不同于相应野生
型肽序列的至少一个改变;将每个新抗原的肽序列输入到一个或多个递呈模型中,以产生
新抗原中的每一者在受试者肿瘤细胞的肿瘤细胞表面上被一个或多个MHC等位基因递呈的
数值可能性集合,该数值可能性集合已至少基于所接收的质谱数据进行鉴定;以及基于该
数值可能性集合选择该新抗原集合的子集,以产生经选择的新抗原集合;以及产生或已产
生包含该经选择的新抗原集合的肿瘤疫苗。
[0277] 肿瘤疫苗可包括核苷酸序列、多肽序列、RNA、DNA、细胞、质粒或载体中的一者或多者。
[0278] 肿瘤疫苗可包括在肿瘤细胞表面上递呈的一个或多个新抗原。
[0279] 肿瘤疫苗可包括在受试者中具有免疫原性的一个或多个新抗原。
[0280] 肿瘤疫苗可能不包括在受试者中诱导针对正常组织的自身免疫应答的一个或多个新抗原。
[0281] 肿瘤疫苗可包括佐剂。
[0282] 肿瘤疫苗可包括赋形剂。
[0283] 本文公开的方法还可包括基于递呈模型选择相对于未经选择的新抗原在肿瘤细胞表面上递呈的可能性增加的新抗原。
[0284] 本文公开的方法还可包括基于递呈模型选择相对于未经选择的新抗原能够在受试者中诱导肿瘤特异性免疫应答的可能性增加的新抗原。
[0285] 本文公开的方法还可包括基于递呈模型选择相对于未经选择的新抗原能够由专职抗原递呈细胞(APC)递呈于初始T细胞的可能性增加的新抗原,任选地其中该APC是树突
状细胞(DC)。
[0286] 本文公开的方法还可包括基于递呈模型选择相对于未经选择的新抗原经由中心或外周耐受性受抑制的可能性降低的新抗原。
[0287] 本文公开的方法还可包括基于递呈模型选择相对于未经选择的新抗原能够在受试者中诱导针对正常组织的自身免疫应答的可能性降低的新抗原。
[0288] 外显子组或转录组核苷酸测序数据可通过对肿瘤组织进行测序而获得。
[0289] 测序可是下一代测序(NGS)或任何大规模平行测序方法。
[0290] 数值可能性集合可通过至少MHC-等位基因相互作用特征来进一步鉴定,所述特征包含以下中的至少一者:经预测的MHC等位基因与新抗原编码肽结合的亲和力;经预测的新
抗原编码肽-MHC复合物的稳定性;新抗原编码肽的序列和长度;如通过质谱蛋白质组学或
其它手段所评定,在来自表达特定MHC等位基因的其它个体的细胞中递呈具有类似序列的
新抗原编码肽的概率;所讨论的受试者中特定MHC等位基因的表达水平(例如,如通过RNA-
seq或质谱法所测量);在表达特定MHC等位基因的其他不同受试者中由特定MHC等位基因递
呈的总体新抗原编码肽序列独立性概率;在其他不同受试者中由同一家族分子(例如HLA-
A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)中的MHC等位基因递呈的总体新抗原编码肽序列
独立性概率。
[0291] 数值可能性集合通过至少MHC-等位基因非相互作用特征来进一步鉴定,所述特征包含以下中的至少一者:在其源蛋白序列内侧接新抗原编码肽的C端和N端序列;新抗原编
码肽中蛋白酶裂解基序的存在,任选地根据相应蛋白酶在肿瘤细胞中的表达加权(如通过
RNA-seq或质谱法所测量);如在适当细胞类型中所测量的源蛋白的周转率;源蛋白的长度,
任选地考虑在肿瘤细胞中最高度表达的特异性剪接变体(“同种型”),如通过RNA-seq或蛋
白质组质谱法所测量,或如DNA或RNA序列数据中所检测的生殖系或体细胞剪接突变的批注
所预测;蛋白酶体、免疫蛋白酶体、胸腺蛋白酶体或其它蛋白酶在肿瘤细胞中的表达水平
(其可通过RNA-seq、蛋白质组质谱法或免疫组织化学测量);新抗原编码肽的源基因的表达
(例如,如通过RNA-seq或质谱法所测量);新抗原编码肽的源基因在细胞周期的各种阶段期
间的典型组织特异性表达;源蛋白和/或其结构域的综合特征目录,如例如uniProt或PDB 
http://www.rcsb.org/pdb/home/home.do中可见;描述含有该肽的源蛋白的结构域特性的
特征,例如:二级或三级结构(例如α螺旋对β折叠);替代性剪接;在其他不同受试者中由所
讨论的新抗原编码肽的源蛋白递呈肽的概率;由于技术偏差,肽将不会由质谱法检测到或
过量表示的概率;通过RNASeq(其无需含有肽的源蛋白)所测量的提供关于肿瘤细胞、基质
或肿瘤浸润淋巴细胞(TIL)状态的信息的各种基因模块/通路的表达;新抗原编码肽的源基
因在肿瘤细胞中的拷贝数;肽结合于TAP的概率或经测量或经预测的肽对TAP的结合亲和
力;TAP在肿瘤细胞中的表达水平(其可通过RNA-seq、蛋白质组质谱法、免疫组织化学测
量);存在或不存在肿瘤突变,包括(但不限于):已知癌症驱动基因(例如EGFR、KRAS、ALK、
RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3)及编码抗原递呈机制中所涉及的蛋白质的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或编码蛋白酶体或免疫蛋白酶体组分的基因中的任一者)中的驱动突变。递呈依
赖于肿瘤中经受功能丧失性突变的抗原递呈机制的组分的肽具有降低的递呈概率;存在或
不存在功能性生殖系多态性,包括(但不限于):在编码抗原递呈机制中所涉及的蛋白质的
基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或编码蛋白酶体或免疫蛋白酶体组分的基因中的任一者)中;肿瘤类型(例如NSCLC、黑素
瘤);临床肿瘤亚型(例如鳞状肺癌对非鳞状肺癌);吸烟史;该肽的源基因在相关肿瘤类型
或临床亚型中的典型表达,任选地通过驱动突变分层。
[0292] 至少一个改变可为移码或非移码插入缺失、错义或无义取代、剪接位点改变、基因组重排或基因融合、或产生neoORF的任何基因组或表达改变。
[0293] 肿瘤细胞可选自:肺癌、黑素瘤、乳癌、卵巢癌、前列腺癌、肾癌、胃癌、结肠癌、睾丸癌、头颈癌、胰腺癌、脑癌、B细胞淋巴瘤、急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴细胞性白血病、T细胞淋巴细胞性白血病、非小细胞肺癌和小细胞肺癌。
[0294] 本文公开的方法还可包括获得包含经选择的新抗原集合或其子集的肿瘤疫苗,任选地另外包括向受试者施用该肿瘤疫苗。
[0295] 当呈多肽形式时,经选择的新抗原集合中的至少一个新抗原可包括以下中的至少一者:对于长度为8-15、8、9、10、11、12、13、14或15个氨基酸的MHC I类多肽,对于长度为6-
30、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸的MHC II类多肽,与MHC的结合亲和力为IC50值小于1000nM,在亲本蛋白质序列中在
该多肽内部或附近存在促进蛋白酶体裂解的序列基序,以及存在促进TAP转运的序列基序。
对于MHC II类,在肽内部或附近存在促进通过细胞外或溶酶体蛋白酶(例如组织蛋白酶)裂
解或HLA-DM催化的HLA结合的序列基序。
[0296] 本文还公开了一种产生用于鉴定可能在肿瘤细胞的肿瘤细胞表面上递呈的一个或多个新抗原的模型的方法,其包括以下步骤:接收包含与从源于多个样品的主要组织相
容性复合体(MHC)洗脱的多个分离肽相关的数据的质谱数据;通过至少鉴定样品中存在的
训练肽序列集合和与每个训练肽序列相关的一个或多个MHC获得训练数据集;使用包含训
练肽序列的训练数据集来训练递呈模型的数值参数集合,所述递呈模型提供来自肿瘤细胞
的肽序列在肿瘤细胞表面上由一个或多个MHC等位基因递呈的多个数值可能性。
[0297] 递呈模型可表示以下两者之间的依赖性:存在肽序列的特定位置处的特定氨基酸;与由肿瘤细胞上的MHC等位基因中的一者递呈在该特定位置处含有该特定氨基酸的肽
序列的可能性。
[0298] 样品还可包括经工程改造以表达单个MHC I类或II类等位基因的细胞系。
[0299] 样品还可包括经工程改造以表达多个MHC I类或II类等位基因的细胞系。
[0300] 样品还可包括获自或源自多个患者的人细胞系。
[0301] 样品还可包括获自多个患者的新鲜或冷冻的肿瘤样品。
[0302] 样品还可包括使用T细胞分析鉴定的肽。
[0303] 训练数据集可另外包括与以下相关的数据:样品中存在的训练肽集合的肽丰度;样品中的训练肽集合的肽长度。
[0304] 本文公开的方法还可包括通过将训练肽序列集合与包含已知蛋白质序列集合的数据库经由比对进行比较来获得基于训练肽序列的训练蛋白质序列集合,其中所述训练蛋
白质序列集合比训练肽序列更长且包括训练肽序列。
[0305] 本文公开的方法还可包括对细胞系执行或已执行质谱法以获得该细胞系的外显子组、转录组或全基因组核苷酸测序数据中的至少一者,所述核苷酸测序数据包括至少一
个包括突变的蛋白质序列。
[0306] 本文公开的方法还可包括:使用独热编码方案编码训练肽序列。
[0307] 本文公开的方法还可包括从正常组织样品获得外显子组、转录组和全基因组正常核苷酸测序数据中的至少一者;以及使用正常核苷酸测序数据训练递呈模型的参数集合。
[0308] 训练数据集可另外包括与样品相关的蛋白质组序列相关的数据。
[0309] 训练数据集可另外包括与样品相关的MHC肽组序列相关的数据。
[0310] 训练数据集可另外包括与至少一种分离肽的肽-MHC结合亲和力测量相关的数据。
[0311] 训练数据集可另外包括与至少一种分离肽的肽-MHC结合稳定性测量相关的数据。
[0312] 训练数据集可另外包括与样品相关的转录组相关的数据。
[0313] 训练数据集可另外包括与样品相关的基因组相关的数据。
[0314] 本文公开的方法还可包括使参数集合逻辑回归。
[0315] 训练肽序列的长度可在k聚体的范围内,其中k对于MHC I类而言在8-15之间(包括端点)或对于MHC II类而言在6-30之间(包括端点)。
[0316] 本文公开的方法还可包括使用左填充独热编码方案编码训练肽序列。
[0317] 本文公开的方法还可包括使用深度学习算法确定参数集合的值。
[0318] 本文公开了用于鉴定可能在肿瘤细胞的肿瘤细胞表面上递呈的一个或多个新抗原的方法,其包括执行以下步骤:接收包含与从源自多个新鲜或冷冻肿瘤样品的主要组织
相容性复合体(MHC)洗脱的多个分离肽相关的数据的质谱数据;通过至少鉴定肿瘤样品中
存在且递呈在与各训练肽序列相关的一个或多个MHC等位基因上的训练肽序列集合来获得
训练数据集;基于训练肽序列获得训练蛋白质序列集合;以及使用训练蛋白质序列和训练
肽序列训练递呈模型的数值参数集合,所述递呈模型提供来自肿瘤细胞的肽序列在肿瘤细
胞表面上由一个或多个MHC等位基因递呈的多个数值可能性。
[0319] 递呈模型可表示以下两者之间的依赖性:MHC等位基因中的一对特定等位基因和在肽序列特定位置处特定氨基酸的存在;与在肿瘤细胞表面上由该对MHC等位基因中的特
定等位基因递呈在该特定位置处包含特定氨基酸的此类肽序列的可能性。
[0320] 本文公开的方法还可包括选择新抗原的子集,其中新抗原的子集是因为相对于一个或多个不同肿瘤新抗原各自在肿瘤细胞表面上递呈的可能性增加而被选择。
[0321] 本文公开的方法还可包括选择新抗原的子集,其中新抗原的子集是因为相对于一个或多个不同肿瘤新抗原各自能够在受试者中诱导肿瘤特异性免疫应答的可能性增加而
被选择。
[0322] 本文公开的方法还可包括选择新抗原的子集,其中新抗原的子集是因为相对于一个或多个不同肿瘤新抗原各自能够由专职抗原递呈细胞(APC)递呈于初始T细胞的可能性
增加而被选择,任选地其中该APC是树突状细胞(DC)。
[0323] 本文公开的方法还可包括选择新抗原的子集,其中新抗原的子集是因为相对于一个或多个不同肿瘤新抗原各自经由中心或外周耐受性受抑制的可能性降低而被选择。
[0324] 本文公开的方法还可包括选择新抗原的子集,其中新抗原的子集是因为相对于一个或多个不同肿瘤新抗原各自能够在受试者中诱导针对正常组织的自身免疫应答的可能
性降低而被选择。
[0325] 本文公开的方法还可包括选择新抗原的子集,其中新抗原的子集是因为相对于APC各自将在肿瘤细胞中经差异性翻译后修饰的可能性降低而被选择,任选地其中该APC是
树突状细胞(DC)。
[0326] 除非另外指明,否则本文方法的实践将采用本领域技能范围内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。这些技术在文献中充分解释。参见例如
T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman and 
Company,1993);A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,现行版);
Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版,1989);Methods In 
Enzymology(S.Colowick和N.Kaplan编,Academic  Press,Inc.);Remington's 
Pharmaceutical Sciences,第18版(Easton,Pennsylvania:Mack Publishing Company,
1990);Carey和Sundberg Advanced Organic Chemistry第3版.(Plenum Press)A卷和B卷
(1992)。
[0327] III.鉴定新抗原中的肿瘤特异性突变
[0328] 本文还公开用于鉴定某些突变(例如癌细胞中存在的变体或等位基因)的方法。具体来说,这些突变可存在于患有癌症的受试者的癌细胞的基因组、转录组、蛋白质组或外显
子组中,而非受试者的正常组织中。
[0329] 如果肿瘤中的基因突变引起肿瘤中特有的蛋白质的氨基酸序列变化,则认为其可用于免疫靶向肿瘤。有用的突变包括:(1)非同义突变,导致蛋白质中的氨基酸不同;(2)通
读突变,其中终止密码子被修饰或缺失,导致翻译在C端具有新颖肿瘤特异性序列的较长蛋
白质;(3)剪接位点突变,导致在成熟mRNA中包含内含子且因此导致特有的肿瘤特异性蛋白
质序列;(4)染色体重排,在2种蛋白质的接合处产生具有肿瘤特异性序列的嵌合蛋白质(即
基因融合);(5)框移突变或缺失,导致具有新颖肿瘤特异性蛋白质序列的新的开放阅读框。
突变还可包括非移码插入缺失、错义或无义取代、剪接位点改变、基因组重排或基因融合、
或产生neoORF的任何基因组或表达改变中的一个或多个。
[0330] 由例如肿瘤细胞中的剪接位点、移码、通读或基因融合突变产生的具有突变的肽或突变多肽可通过对肿瘤与正常细胞中的DNA、RNA或蛋白质进行测序来鉴定。
[0331] 突变还可包括先前鉴定的肿瘤特异性突变。已知肿瘤突变可见于癌症体细胞突变目录(COSMIC)数据库。
[0332] 多种方法可用于检测个体的DNA或RNA中特定突变或等位基因的存在。本领域中的进步已提供精确、容易且便宜的大规模SNP基因分型。举例来说,已描述数种技术,包括动态
等位基因特异性杂交(DASH)、微孔板阵列对角线凝胶电泳(MADGE)、焦磷酸测序、寡核苷酸
特异性连接、TaqMan系统以及各种DNA“芯片”技术,例如Affymetrix SNP芯片。这些方法利
用通常通过PCR扩增靶基因区。仍有其它方法,基于通过侵入性裂解产生小信号分子,接着
进行质谱法或固定化挂探针和滚环扩增。下文汇总本领域中已知用于检测特异性突变的
数种方法。
[0333] 基于PCR的检测手段可包括同时多重扩增多个标志物。举例来说,选择PCR引物以产生大小不重叠且可同时分析的PCR产物是本领域中所熟知的。或者,可用经差异性标记且
因此可各自经差异性检测的引物扩增不同的标志物。当然,基于杂交的检测手段允许样品
中多个PCR产物的差异检测。本领域中已知其它技术以允许多个标志物的多重分析。
[0334] 已开发数种方法以便于基因组DNA或细胞RNA中单核苷酸多态性的分析。举例来说,单碱基多态性可通过使用特殊化核酸外切酶抗性核苷酸来检测,如例如Mundy,C.R.(美
国专利第4,656,127号)中所公开。根据该方法,允许与紧靠着多形位点3'的等位基因序列
互补的引物与获自特定动物或人的靶分子杂交。如果靶分子上的多形位点含有与所存在的
特定核酸外切酶抗性核苷酸衍生物互补的核苷酸,则该衍生物将并入到杂交引物的末端
上。这种并入使得引物对核酸外切酶具有抗性,从而允许其检测。由于样品的核酸外切酶抗
性衍生物的身份是已知的,故引物已对核酸外切酶具有抗性的发现揭露靶分子的多形位点
中存在的核苷酸与反应中所用的核苷酸衍生物互补。这种方法的优势在于其不需要确定大
量无关序列数据。
[0335] 可使用基于溶液的方法确定多形位点的核苷酸的身份。Cohen,D.等人(法国专利2,650,840;PCT申请第WO91/02087号)。如在美国专利第4,656,127号的芒迪方法(Mundy 
method)中,采用与紧靠着多形位点3'的等位基因序列互补的引物。该方法使用经标记的双
脱氧核苷酸衍生物确定该位点的核苷酸的身份,如果该核苷酸与多形位点的核苷酸互补,
则将并入到引物的末端上。
[0336] 称为遗传位分析或GBA的替代方法由Goelet,P.等人(PCT申请第92/15712号)描述。Goelet,P.等人的方法使用经标记的终止子和与多形位点3'序列互补的引物的混合物。
所并入的经标记的终止子因此通过所评估的靶分子的多形位点中存在的核苷酸确定且与
其互补。与Cohen等人(法国专利2,650,840;PCT申请第WO91/02087号)的方法相比,Goelet,
P.等人的方法可为非均相分析,其中引物或靶分子固定于固相。
[0337] 已描述数种用于分析DNA中多形位点的引物引导的核苷酸并入程序(Komher,J.S.等人,Nucl.Acids.Res.17:7779-7784(1989);Sokolov,B.P.,Nucl.Acids Res.18:3671
(1990);Syvanen,A.-C.等人,Genomics 8:684-692(1990);Kuppuswamy,M.N.等人,
Proc.Natl.Acad.Sci.(U.S.A.)88:1143-1147(1991);Prezant,T.R.等人,Hum.Mutat.1:
159-164(1992);Ugozzoli,L.等人,GATA 9:107-112(1992);Nyren,P.等人,
Anal.Biochem.208:171-175(1993))。这些方法与GBA的不同之处在于其利用并入经标记的
脱氧核苷酸来区分多形位点处的碱基。在这种格式中,由于信号与并入的脱氧核苷酸的数
量成比例,故在同一核苷酸的操作中发生的多态性可产生与操作的长度成比例的信号
(Syvanen,A.-C.等人,Amer.J.Hum.Genet.52:46-59(1993))。
[0338] 许多方案直接从数百万个单独的DNA或RNA分子中并行获取序列信息。实时单分子合成测序技术依赖于荧光核苷酸的检测,因为其并入到与正测序的模板互补的DNA的新生
链中。在一种方法中,将长度为30-50个碱基的寡核苷酸在5'端共价锚定于玻璃盖玻片上。
这些锚定链执行两种功能。首先,如果模板被配置成具有与表面结合的寡核苷酸互补的捕
捉尾部,则其充当靶模板链的捕捉位点。它们还充当模板引导的引物延伸的引物,形成序列
阅读的基础。捕捉引物充当固定位点以便使用多个合成、检测及化学裂解染料接头来移除
染料的循环进行序列测定。各循环由以下组成:添加聚合酶/经标记的核苷酸混合物,冲洗,
成像和染料的裂解。在一个替代方法中,聚合酶被荧光供体分子修饰并固定在载玻片上,而
各核苷酸用连接至γ-磷酸的受体荧光部分进行颜色编码。系统检测经荧光标记的聚合酶
与经荧光修饰的核苷酸之间的相互作用,因为核苷酸并入到从头链中。也存在其它合成测
序技术。
[0339] 可使用任何适合的合成测序平台鉴定突变。如上所述,目前可用四种主要合成测序平台:来自Roche/454Life Sciences的基因组测序仪、来自Illumina/Solexa的1G分析
仪、来自Applied BioSystems的SOLiD系统和来自Helicos Biosciences的Heliscope系统。
合成测序平台也已由Pacific BioSciences和VisiGen Biotechnologies描述。在一些实施
方案中,将要测序的多个核酸分子结合于支撑物(例如固体支撑物)。为将核酸固定于支撑
物上,可在模板的3'和/或5'端添加捕捉序列/通用引发位点。核酸可通过将捕捉序列与共
价连接于支撑物的互补序列杂交而结合于支撑物。捕捉序列(也称为通用捕捉序列)是与连
接至支撑物的序列互补的核酸序列,其可双重充当通用引物。
[0340] 作为捕捉序列的替代方案,偶联对(例如抗体/抗原、受体/配体或如例如美国专利申请第2006/0252077号中所述的抗生物素蛋白-生物素对)的一个成员可连接于各片段,而
被捕捉在用该偶联对的相应第二成员涂布的表面上。
[0341] 在捕捉后,可例如通过单分子检测/测序来分析序列,例如,如实施例和美国专利第7,283,337号中所述,包括模板依赖性合成测序。在合成测序中,表面结合的分子在聚合
酶存在下暴露于多个经标记的三磷酸核苷酸。模板的序列通过并入到生长链的3'端的经标
记的核苷酸的顺序来确定。这可实时进行或可以分步重复模式进行。对于实时分析,可将不
同的光学标记并入各核苷酸并且可利用多个激光刺激并入的核苷酸。
[0342] 测序还可包括其它大规模平行测序或下一代测序(NGS)技术和平台。大规模平行测序技术和平台的额外实例是Illumina HiSeq或MiSeq、Thermo PGM或Proton、Pac Bio RS 
II或Sequel、Qiagen的Gene Reader和Oxford Nanopore MinION。可使用其它类似的当前大
规模平行测序技术,以及这些技术的后代。
[0343] 可利用任何细胞类型或组织来获得用于本文所述的方法的核酸样品。举例来说,DNA或RNA样品可获自肿瘤或体液,例如通过已知技术(例如静脉穿刺)获得的血液或唾液。
或者,可对干燥样品(例如头发或皮肤)执行核酸测试。另外,可从肿瘤获得样品用于测序并
且可从正常组织获得另一样品用于测序,其中正常组织具有与肿瘤相同的组织类型。可从
肿瘤获得样品用于测序并且可从正常组织获得另一样品用于测序,其中正常组织相对于肿
瘤具有不同的组织类型。
[0344] 肿瘤可包括肺癌、黑素瘤、乳腺癌、卵巢癌、前列腺癌、肾癌、胃癌、结肠癌、睾丸癌、头颈癌、胰腺癌、脑癌、B细胞淋巴瘤、急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴细胞性白血病、T细胞淋巴细胞性白血病、非小细胞肺癌和小细胞肺癌中的一个或多个。
[0345] 或者,可使用蛋白质质谱法鉴定或验证与肿瘤细胞上的MHC蛋白质结合的突变肽的存在。肽可从肿瘤细胞或从肿瘤免疫沉淀的HLA分子酸洗脱,然后使用质谱法鉴定。
[0346] IV.新抗原
[0347] 新抗原可包括核苷酸或多肽。举例来说,新抗原可为编码多肽序列的RNA序列。可用于疫苗中的新抗原可因此包括核苷酸序列或多肽序列。
[0348] 本文公开了包含通过本文公开的方法鉴定的肿瘤特异性突变的分离肽、包含已知肿瘤特异性突变的肽和通过本文公开的方法鉴定的突变多肽或其片段。新抗原肽可描述于
其编码序列的上下文中,其中新抗原包括编码相关多肽序列的核苷酸序列(例如DNA或
RNA)。
[0349] 由新抗原核苷酸序列编码的一个或多个多肽可包含以下中的至少一者:对于长度为8-15、8、9、10、11、12、13、14或15个氨基酸的MHC I类肽,与MHC的结合亲和力为IC50值小于1000nM,在肽内部或附近存在促进蛋白酶体裂解的序列基序,以及存在促进TAP转运的序
列基序。对于长度为6-30、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、
25、26、27、28、29或30个氨基酸的MHC II类肽,在肽内部或附近存在促进通过细胞外或溶酶
体蛋白酶(例如组织蛋白酶)裂解或HLA-DM催化的HLA结合的序列基序。
[0350] 一个或多个新抗原可递呈在肿瘤的表面上。
[0351] 一个或多个新抗原在具有肿瘤的受试者中可为免疫原性的,例如能够在受试者中引发T细胞反应或B细胞反应。
[0352] 在疫苗生产背景下,对于具有肿瘤的受试者,可不考虑在受试者中诱导自身免疫应答的一个或多个新抗原。
[0353] 至少一个新抗原肽分子的大小可包含(但不限于)约5个、约6个、约7个、约8个、约9个、约10个、约11个、约12个、约13个、约14个、约15个、约16个、约17个、约18个、约19个、约20个、约21个、约22个、约23个、约24个、约25个、约26个、约27个、约28个、约29个、约30个、约31个、约32个、约33个、约34个、约35个、约36个、约37个、约38个、约39个、约40个、约41个、约42个、约43个、约44个、约45个、约46个、约47个、约48个、约49个、约50个、约60个、约70个、约80个、约90个、约100个、约110个、约120个或更多个氨基分子残基,以及其中可导出的任何范
围。在具体实施方案中,新抗原肽分子等于或小于50个氨基酸。
[0354] 新抗原肽和多肽可为:对于MHC I类,15个残基或更小的长度且通常由约8至约11个残基、特别是9或10个残基组成;对于MHC II类,6-30个残基(包括端点)。
[0355] 如果需要,可以数种方式设计较长的肽。在一种情况下,当HLA等位基因上肽的递呈可能性经预测或已知时,较长的肽可由以下任一者组成:(1)个别递呈的具有朝向各相应
基因产物的N端及C端延伸2-5个氨基酸的肽;(2)所递呈的肽中的一些或全部与各自的延伸
序列的串接。在另一种情况下,当测序揭露肿瘤中所存在的长(>10个残基)新表位序列(例
如归因于产生新颖肽序列的移码、通读或内含子包含)时,较长的肽将由以下组成:(3)新颖
肿瘤特异性氨基酸的整个延伸段,因此绕过对基于计算或活体外测试选择最强HLA递呈的
较短肽的需要。在两种情况下,使用较长的肽允许患者细胞进行内源性加工,并且可引起更
有效的抗原递呈和诱导T细胞反应。
[0356] 新抗原肽和多肽可递呈在HLA蛋白质上。在一些方面,新抗原肽和多肽以比野生型肽更大的亲和力递呈在HLA蛋白质上。在一些方面,新抗原肽或多肽的IC50可至少小于
5000nM、至少小于1000nM、至少小于500nM、至少小于250nM、至少小于200nM、至少小于
150nM、至少小于100nM、至少小于50nM或更小。
[0357] 在一些方面,新抗原肽和多肽在施用于受试者时不诱导自身免疫应答和/或引起免疫耐受性。
[0358] 还提供了包含至少两种或更多种新抗原肽的组合物。在一些实施方案中,组合物含有至少两种不同的肽。至少两种不同的肽可源自相同的多肽。不同的多肽意指肽根据长
度、氨基酸序列或两者而变化。所述肽源自已知或已发现含有肿瘤特异性突变的任何多肽。
可例如在COSMIC数据库中发现可获得新抗原肽的适合的多肽。COSMIC策划关于人癌症体细
胞突变的综合信息。该肽含有肿瘤特异性突变。在一些方面,肿瘤特异性突变为特定癌症类
型的驱动突变。
[0359] 具有所需活性或特性的新抗原性肽和多肽可经修饰以提供某些所需属性,例如改进的药理学特征,同时增加或至少保留未修饰肽的实质上所有生物活性以结合所需MHC分
子并活化适当T细胞。举例来说,新抗原肽和多肽可进行各种变化,例如保守或非保守取代,
其中这些变化可在其使用中提供某些优势,例如改进的MHC结合、稳定性或递呈。保守取代
意指氨基酸残基用生物学和/或化学上类似的另一个氨基酸残基置换,例如一个疏水性残
基置换另一个,或一个极性残基置换另一个。取代包括以下组合,例如Gly、Ala;Val、Ile、
Leu、Met;Asp、Glu;Asn、Gln;Ser、Thr;Lys、Arg;以及Phe、Tyr。单氨基酸取代的效应也可使用D-氨基酸探测。这类修饰可使用熟知的肽合成程序进行,如例如Merrifield,Science 
232:341-347(1986),Barany和Merrifield,The Peptides,Gross和Meienhofer编(N.Y.,
Academic Press),第1-284页(1979);以及Stewart和Young,Solid Phase Peptide 
Synthesis,(Rockford,Ill.,Pierce),第2版(1984)中所述。
[0360] 肽和多肽用各种氨基酸模拟物或非天然氨基酸修饰可在提高肽和多肽的体内稳定性方面特别有用。稳定性可以多种方式加以分析。举例来说,肽酶和各种生物介质(例如
血浆和血清)已用于测试稳定性。参见例如Verhoef等人,Eur.J.Drug Metab 
Pharmacokin.11:291-302(1986)。肽的半衰期可使用25%人血清(v/v)分析方便地确定。方
案一般如下。汇集的人血清(AB型,非加热不活化)在使用之前通过离心去脂。血清然后用
RPMI组织培养基稀释至25%并用于测试肽稳定性。在预定时间间隔下,移出少量反应溶液
并添加至6%三氯乙酸或乙醇水溶液中。将混浊的反应样品冷却(4℃)15分钟,然后旋转集
结沉淀的血清蛋白质。然后使用稳定性特异性色谱条件通过逆相HPLC确定肽的存在。
[0361] 肽和多肽可经修饰以提供除改进的血清半衰期以外的所需属性。举例来说,肽诱导CTL活性的能力可通过与含有至少一个能够诱导T辅助细胞反应的表位的序列连接来增
强。免疫原性肽/T辅助细胞缀合物可通过间隔分子连接。间隔子通常由相对较小的中性分
子如氨基酸或氨基酸模拟物构成,其在生理条件下实质上不带电。间隔子通常选自例如
Ala、Gly或非极性氨基酸或中性极性氨基酸的其它中性间隔子。应理解,任选地存在的间隔
子无需由相同残基组成,且因此可以是杂寡聚物或均寡聚物。当存在时,间隔子将通常为至
少一个或两个残基,更通常三至六个残基。或者,肽可在无间隔子的情况下连接到T辅助肽。
[0362] 新抗原肽可直接或经由在肽的氨基或羧基端处的间隔子连接到T辅助肽。新抗原肽或T辅助肽的氨基端可经酰化。示例性T辅助肽包括破伤风类毒素830-843、流感307-319、
疟疾环子孢子382-398和378-389。
[0363] 蛋白质或肽可通过本领域技术人员已知的任何技术制造,包括通过标准分子生物学技术表达蛋白质、多肽或肽;从天然来源分离蛋白质或肽;或化学合成蛋白质或肽。先前
已公开对应于各种基因的核苷酸和蛋白质、多肽和肽序列,并且可见于本领域一般技术人
员已知的计算机化数据库中。一个此类数据库是位于美国国家卫生研究院(National 
Institutes of Health)网站的国家生物技术信息中心的Genbank和GenPept数据库。已知
基因的编码区可使用本文所公开或本领域一般技术人员应知晓的技术扩增和/或表达。或
者,蛋白质、多肽和肽的各种市售制剂已为本领域技术人员所知。
[0364] 在另一方面,新抗原包括编码新抗原肽或其部分的核酸(例如多核苷酸)。多核苷酸可为例如DNA、cDNA、PNA、CNA、RNA(例如mRNA)、单链和/或双链、或原生或稳定形式的多核苷酸,例如具有硫代磷酸骨架的多核苷酸,或其组合,并且其可含有或可不含内含子。另一
方面提供一种能够表达多肽或其部分的表达载体。不同细胞类型的表达载体在本领域中已
熟知并且无需过度实验便可选择。一般来说,DNA以适当定向插入到表达载体如质粒中且以
正确阅读框进行表达。如果需要,DNA可连接于由所需宿主识别的适当转录和翻译调节控制
核苷酸序列,而此类控制件一般可用于表达载体中。载体然后经由标准技术引入至宿主中。
指导可见于例如Sambrook等人(1989)Molecular Cloning,A Laboratory Manual,Cold 
Spring Harbor Laboratory,Cold Spring Harbor,N.Y.中。
[0365] V.疫苗组合物
[0366] 本文还公开了一种能够引起特异性免疫应答(例如肿瘤特异性免疫应答)的免疫原性组合物,例如疫苗组合物。疫苗组合物通常包含例如使用本文所述的方法选择的多个
新抗原。疫苗组合物也可称为疫苗。
[0367] 疫苗可含有1至30个肽;2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个不同的肽;6、7、8、9、10、11、12、13或14个不同的肽;或
12、13或14个不同的肽。肽可包括翻译后修饰。疫苗可含有1至100或更多个核苷酸序列;2、
3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、
31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、
56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、
81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个不同的核苷酸序列;6、7、8、9、10、11、12、13或14个不同的核苷酸序列;或12、13或14个不同的核苷酸序列。疫苗可含有1至30个新抗原序列;2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、
19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、
44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、
69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、
94、95、96、97、98、99、100或更多个不同的新抗原序列;6、7、8、9、10、11、12、13或14个不同的新抗原序列;或12、13或14个不同的新抗原序列。
[0368] 在一个实施方案中,选择不同的肽和/或多肽或其编码核苷酸序列,以使得肽和/或多肽能够与不同的MHC分子(例如不同的MHC I类分子和/或不同的MHC II类分子)缔合。
在一些方面,一种疫苗组合物包含能够与最常出现的MHC I类分子和/或不同的MHC II类分
子缔合的肽和/或多肽的编码序列。因此,疫苗组合物可包含能够与至少2个优选的、至少3
个优选的、或至少4个优选的MHC I类分子和/或不同的MHC II类分子缔合的不同片段。
[0369] 疫苗组合物能够引起特异性细胞毒性T细胞反应和/或特异性辅助T细胞反应。
[0370] 疫苗组合物可另外包含佐剂和/或载体。有用的佐剂和载体的实例在下文中给出。组合物可与载体缔合,例如蛋白质或抗原递呈细胞,例如能够将肽递呈于T细胞的树突状细
胞(DC)。
[0371] 佐剂是混合到疫苗组合物中增加或以其它方式修饰对新抗原的免疫应答的任何物质。载体可为骨架结构,例如能够与新抗原缔合的多肽或多糖。任选地,佐剂是共价或非
共价结合的。
[0372] 佐剂提高对抗原的免疫应答的能力通常显现为免疫介导性反应的显著或实质性增加或疾病症状的减少。举例来说,体液免疫的提高通常显现为针对抗原所产生的抗体的
效价显著增加,并且T细胞活性的增加通常显现为细胞增殖、或细胞毒性、或细胞因子分泌
增加。佐剂也可改变免疫应答,例如通过将主要体液或Th反应变为主要细胞或Th反应。
[0373] 适合的佐剂包括(但不限于)1018ISS、矾、盐、Amplivax、AS15、BCG、CP-870,893、CpG7909、CyaA、dSLIM、GM-CSF、IC30、IC31、咪喹莫特(Imiquimod)、ImuFact IMP321、IS Patch、ISS、ISCOMATRIX、JuvImmune、LipoVac、MF59、单磷酰基脂质A、Montanide IMS 1312、Montanide ISA 206、Montanide ISA 50V、Montanide ISA-51、OK-432、OM-174、OM-197-MP-
EC、ONTAK、PepTel载体系统、PLG微粒、雷西莫特(resiquimod)、SRL172、病毒颗粒和其它病
毒样颗粒、YF-17D、VEGF捕获剂、R848、β-葡聚糖、Pam3Cys、Aquila的源于皂素的QS21刺激子(Aquila Biotech,Worcester,Mass.,USA)、分支杆菌提取物和合成细菌细胞壁模拟物,以
及其它专用佐剂,例如Ribi的Detox.Quil或Superfos。例如不完全弗氏佐剂或GM-CSF的佐
剂是有用的。先前已描述特异性针对树突状细胞的数种免疫佐剂(例如MF59)及其制备
(Dupuis M等人,Cell Immunol.1998;186(1):18-27;Allison A C;Dev Biol Stand.1998;
92:3-11)。也可使用细胞因子。数种细胞因子已直接关联于:影响树突状细胞迁移至淋巴组
织(例如TNF-α)、加速树突状细胞成熟变为T-淋巴细胞的有效抗原递呈细胞(例如GM-CSF、
IL-1和IL-4)(美国专利第5,849,589号,其以全文引用的方式明确并入本文中)以及充当免
疫佐剂(例如IL-12)(Gabrilovich  D I等人,J Immunother  Emphasis Tumor 
Immunol.1996(6):414-418)。
[0374] 还已报道CpG免疫刺激性寡核苷酸增强佐剂在疫苗环境中的效应。也可使用其它TLR结合分子,例如结合RNA的TLR 7、TLR 8和/或TLR 9。
[0375] 有用佐剂的其它实例包括(但不限于)经化学修饰的CpG(例如CpR、Idera)、聚(I:C)(例如聚i:CI2U)、非CpG细菌DNA或RNA以及免疫活性小分子和抗体,例如环磷酰胺、舒尼
替尼(sunitinib)、贝伐单抗(bevacizumab)、西乐葆(celebrex)、NCX-4016、西地那非
(sildenafil)、他达拉非(tadalafil)、伐地那非(vardenafil)、索拉菲尼(sorafinib)、XL-
999、CP-547632、帕佐泮尼(pazopanib)、ZD2171、AZD2171、伊匹单抗(ipilimumab)、曲美木
单抗(tremelimumab)和SC58175,其可起治疗作用和/或充当佐剂。佐剂和添加剂的量和浓
度可容易由本领域技术人员确定而无需过度实验。额外佐剂包括集落刺激因子,例如颗粒
球巨噬细胞集落刺激因子(GM-CSF,沙格司亭(sargramostim))。
[0376] 疫苗组合物可包含多于一种不同的佐剂。此外,治疗组合物可包含任何佐剂物质,包括以上各者中的任一者或其组合。此外预期,疫苗和佐剂可一起或以任何适当的顺序分
开施用。
[0377] 载体(或赋形剂)可独立于佐剂存在。载体的功能可例如为增加特定突变体的分子量以提高活性或免疫原性,赋予稳定性,增加生物活性或增加血清半衰期。此外,载体可辅
助递呈肽至T细胞。载体可为本领域技术人员已知的任何适合的载体,例如蛋白质或抗原递
呈细胞。载体蛋白质可为(但不限于)匙孔螺血氰蛋白、血清蛋白质(例如转蛋白)、牛血清
白蛋白、人血清白蛋白、甲状腺球蛋白或卵白蛋白、免疫球蛋白或激素,例如胰岛素或棕榈
酸。为用于人免疫接种,载体一般为生理学上可接受的载体,其为人可接受的且为安全的。
然而,破伤风类毒素和/或白喉类毒素为适合的载体。或者,载体可为葡聚糖,例如琼脂糖。
[0378] 细胞毒性T细胞(CTL)识别与MHC分子结合的肽形式的抗原,而非完整外来抗原本身。MHC分子本身位于抗原递呈细胞的细胞表面上。因此,如果存在肽抗原、MHC分子和APC的
三聚体复合物,则可能活化CTL。相应地,如果不仅肽用于活化CTL,而且如果另外添加具有
相应MHC分子的APC,则可加强免疫应答。因此,在一些实施方案中,疫苗组合物另外含有至
少一种抗原递呈细胞。
[0379] 新抗原还可包括于基于病毒载体的疫苗平台中,例如牛痘、禽痘、自我复制甲病毒、马拉巴病毒(marabavirus)、腺病毒(参见例如Tatsis等人,Adenoviruses,Molecular 
Therapy(2004)10,616-629)或慢病毒,包括(但不限于)第二、第三或杂交第二/第三代慢病
毒以及任一代的重组慢病毒,其经设计以靶向特定细胞类型或受体(参见例如Hu等人,
Immunization Delivered by Lentiviral Vectors for Cancer and Infectious 
Diseases,Immunol Rev.(2011)239(1):45-61;Sakuma等人,Lentiviral vectors:basic 
to translational,Biochem J.(2012)443(3):603-18;Cooper等人,Rescue of splicing-
mediated intron loss maximizes expression in lentiviral vectors containing 
the human ubiquitin C promoter,Nucl.Acids Res.(2015)43(1):682-690;Zufferey等
人,Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene 
Delivery,J.Virol.(1998)72(12):9873-9880)。取决于上述基于病毒载体的疫苗平台的包
装能力,这种方法可递送编码一个或多个新抗原肽的一个或多个核苷酸序列。序列可侧接
非突变序列,可由接头分开或可在前面有一个或多个靶向亚细胞区室的序列(参见例如
Gros等人,Prospective identification of neoantigen-specific lymphocytes in the 
peripheral blood of melanoma patients,Nat Med.(2016)22(4):433-8;Stronen等人,
Targeting of  cancer neoantigens with donor-derived T cell receptor 
repertoires,Science.(2016)352(6291):1337-41;Lu等人,Efficient identification 
of mutated cancer antigens recognized by T cells associated with durable 
tumor regressions,Clin Cancer Res.(2014)20(13):3401-10)。在引入到宿主后,经感染
细胞表达新抗原,从而引发针对肽的宿主免疫(例如CTL)反应。用于免疫方案中的牛痘载体
和方法描述于例如美国专利第4,722,848号中。另一种载体为卡介苗(Bacille Calmette 
Guerin,BCG)。BCG载体描述于Stover等人(Nature 351:456-460(1991))中。根据本文描述,
用于新抗原的治疗性施用或免疫接种的各种其它疫苗载体,例如伤寒沙氏菌
(Salmonella typhi)载体等对于本领域技术人员将为显而易见的。
[0380] V.A.新抗原盒
[0381] 鉴于本文所提供的教导内容,用于选择一个或多个新抗原、克隆及构建“盒”及其插入至病毒载体中的方法在本领域的技能内。“新抗原盒”意指经选择的新抗原或多个新抗
原与转录新抗原且表达转录产物所必需的其它调控元件的组合。新抗原或多个新抗原可以
允许转录的方式可操作地连接于调控元件。此类组件包括可驱动被病毒载体转染的细胞中
表达新抗原的常规调控元件。因此,新抗原盒也可含有经选择的启动子,其连接于新抗原并
且与其它任选的调控元件一起位于重组载体的经选择的病毒序列内。
[0382] 有用的启动子可以是组成型启动子或经调控(诱导型)启动子,其将能够控制待表达的新抗原的量。举例来说,合乎需要的启动子是细胞巨大病毒即刻早期启动子/增强子的
启动子[参见例如Boshart等人,Cell,41:521-530(1985)]。另一种合乎需要的启动子包括
劳斯肉瘤(Rous sarcoma)病毒LTR启动子/增强子。另一种启动子/增强子序列是鸡细胞质
β-肌动蛋白启动子[T.A.Kost等人,Nucl.Acids Res.,11(23):8287(1983)]。其它适合或合
乎需要的启动子可由本领域技术人员选择。
[0383] 新抗原盒还可包括与病毒载体序列异源的核酸序列,包括提供转录本的有效聚腺苷酸化信号(poly(A)、poly-A或pA)的序列及具有功能性剪接供体和受体位点的内含子。本
发明的示例性载体中使用的普通poly-A序列源自乳多泡病毒SV-40。poly-A序列一般可在
基于新抗原的序列之后及在病毒载体序列之前插入盒中。普通内含子序列也可源自SV-40,
并且称为SV-40T内含子序列。新抗原盒也可含有位于启动子/增强子序列与新抗原之间的
此类内含子。这些和其它普通载体元件的选择是常规的[参见例如Sambrook等人,
“Molecular Cloning.A Laboratory Manual.”,第2版,Cold Spring Harbor Laboratory,
New York(1989)和其中引用的参考文献]并且许多此类序列可从商业和工业来源以及
Genbank获得。
[0384] 新抗原盒可具有一个或多个新抗原。举例来说,给定盒可包括1-10、1-20、1-30、10-20、15-25、15-20、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个新抗原。新抗原可彼此直接连接。新抗原也可用接头彼此连接。新抗原可相对于彼此呈任一
定向,包括N至C或C至N。
[0385] 如上所述,新抗原盒可位于病毒载体中任何经选择的缺失位点,例如E1基因区缺失或E3基因区缺失的位点等可经选择的位点。
[0386] 可以使用下式描述新抗原盒,以从5'到3'描述每个元件的有序序列:
[0387] (Pa-(L5b-Nc-L3d)X)Z-(P2h-(G5e-Uf)Y)W-G3g
[0388] 其中P和P2包含启动子核苷酸序列,N包含MHC I类表位编码核酸序列,L5包含5'接头序列,L3包含3'接头序列,G5包含编码氨基酸接头的核酸序列,G3包含编码氨基酸接头的
至少一个核酸序列之一,U包含MHC II类抗原编码核酸序列,其中对于每个X,相应的Nc是表
位编码核酸序列,其中对于每个Y,相应的Uf是抗原编码核酸序列。可以通过选择存在的元
件数来进一步定义组成和有序序列,例如其中a=0或1,其中b=0或1,其中c=1,其中d=0
或1,其中e=0或1,其中f=1,其中g=0或1,其中h=0或1,X=1至400,Y=0、1、2、3、4或5,Z=1至400,并且W=0、1、2、3、4或5。
[0389] 在一个实例中,存在的元件包括其中a=0,b=1,d=1,e=1,g=1,h=0,X=10,Y=2,Z=1和W=1,描述了其中不存在其它启动子(即仅存在由RNA甲病毒骨架提供的启动子核苷酸序列),存在20个MHC I类表位,对于每个N存在5'接头,对于每个N存在3'接头,存在2
个MHC II类表位,存在连接两个MHC II类表位的接头,存在将两个MHC II类表位的5'端连
接到最后一个MHC I类表位的3'端的接头,以及存在将两个MHC II类表位的3'端连接到RNA
甲病毒骨架的接头。将新抗原盒的3'端连接到RNA甲病毒骨架的实例包括直接连接到RNA甲
病毒骨架提供的3'UTR元件,例如3'19-nt CSE。将新抗原盒的5'端连接到RNA甲病毒骨架的
实例包括直接连接到26S启动子序列、甲病毒5'UTR、51nt CSE或24nt CSE。
[0390] 其它实例包括:其中a=1描述其中存在不同于RNA甲病毒骨架提供的启动子核苷酸序列的启动子;其中a=1且Z为大于1,其中存在多个除RNA甲病毒骨架提供的启动子核苷
酸序列以外的启动子,每个驱动1个或更多个不同的MHC I类表位编码核酸序列的表达;其
中h=1描述其中存在一个单独的启动子来驱动MHC II类抗原编码核酸序列的表达;并且其
中g=0描述MHC II类抗原编码核酸序列(如果存在)与RNA甲病毒骨架直接连接。
[0391] 其它实例包括其中存在的每个MHC I类表位可以具有5'接头、3'接头、都不具有或两者都有的情况。在同一新抗原盒中存在多于一个MHC I类表位的实例中,一些MHC I类表
位可能同时具有5'接头和3'接头,而其它MHC I类表位可能具有5'接头、3'接头或两者都没
有。在同一新抗原盒中存在多于一个MHC I类表位的其它实例中,一些MHC I类表位可能具
有5'接头或3'接头,而其它MHC I类表位可能具有5'接头、3'接头或两者都没有。
[0392] 在同一新抗原盒中存在多于一个MHC II类表位的实例中,一些MHC II类表位可能同时具有5'接头和3'接头,而其它MHC II类表位可能具有5'接头、3'接头或两者都没有。在
同一新抗原盒中存在多于一个MHC II类表位的其它实例中,一些MHC II类表位可能具有5'
接头或3'接头,而其它MHC II类表位可能具有5'接头、3'接头或两者都没有。
[0393] 启动子核苷酸序列P和/或P2可以与RNA甲病毒骨架提供的启动子核苷酸序列相同。举例来说,由RNA甲病毒骨架提供的启动子序列Pn和P2可各自包含26S亚基因组启动子。
启动子核苷酸序列P和/或P2可以不同于RNA甲病毒骨架提供的启动子核苷酸序列,也可以
彼此不同。
[0394] 5'接头L5可以是原生序列或非天然序列。非天然序列包括但不限于AAY、RR和DPP。3'接头L3也可以是原生序列或非天然序列。另外,L5和L3可以都是原生序列,可以都是非天
然序列,或者一个可以是原生的而另一个可以是非天然的。对于每个X,氨基酸接头的长度
可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、
28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、
53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、
78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸。对于每个X,氨基酸接头的长度也可以是至少3、至少4、至少5、至少6、至少7、至少
8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少
19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个氨基酸。
[0395] 对于每个Y,氨基酸接头G5的长度可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、
41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、
66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、
91、92、93、94、95、96、97、98、99、100个或更多个氨基酸。对于每个Y,氨基酸接头的长度也可以是至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个氨基酸。
[0396] 氨基酸接头G3的长度可以是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、
44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、
69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、
94、95、96、97、98、99、100个或更多个氨基酸。G3的长度也可以是至少3、至少4、至少5、至少
6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个氨基酸。
[0397] 对于每个X,每个N可以编码长度为7-15个氨基酸的MHC I类表位。对于每个X,每个N也可以编码长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、
26、27、28、29或30个氨基酸的MHC I类表位。对于每个X,每个N也可以编码长度为至少5、至
少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少
17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少
28、至少29或至少30个氨基酸的MHC I类表位。
[0398] V.B.免疫检查点
[0399] 本文所述的载体,例如本文所述的C68载体或本文所述的甲病毒载体,可包含编码至少一种新抗原的核酸,并且同一或另一载体可包含编码至少一种免疫调节物(例如抗体,
例如scFv)的核酸,其结合于免疫检查点分子且阻断免疫检查点分子的活性。载体可包含新
抗原盒和一个或多个编码检查点抑制剂的核酸分子。
[0400] 可靶向用于阻断或抑制的说明性免疫检查点分子包括(但不限于)CTLA-4、4-1BB(CD137)、4-1BBL(CD137L)、PDL1、PDL2、PD1、B7-H3、B7-H4、BTLA、HVEM、TIM3、GAL9、LAG3、TIM3、B7H3、B7H4、VISTA、KIR、2B4(属于CD2家族的分子并且在所有NK、γδ和记忆CD8+(αβ)T细胞上表达)、CD160(也称为BY55)和CGEN-15049。免疫检查点抑制剂包括抗体或其抗原结
合片段、或其它结合蛋白,其结合且阻断或抑制以下中的一个或多个的活性:CTLA-4、PDL1、
PDL2、PD1、B7-H3、B7-H4、BTLA、HVEM、TIM3、GAL9、LAG3、TIM3、B7H3、B7H4、VISTA、KIR、2B4、CD160和CGEN-15049。说明性免疫检查点抑制剂包括曲美木单抗(CTLA-4阻断抗体)、抗
OX40、PD-L1单克隆抗体(抗B7-H1;MEDI4736)、伊匹单抗、MK-3475(PD-1阻断剂)、纳武单抗
(Nivolumamb)(抗PD1抗体)、CT-011(抗PD1抗体)、BY55单克隆抗体、AMP224(抗PDL1抗体)、
BMS-936559(抗PDL1抗体)、MPLDL3280A(抗PDL1抗体)、MSB0010718C(抗PDL1抗体)和
Yervoy/伊匹单抗(抗CTLA-4检查点抑制剂)。抗体编码序列可使用本领域中的普通技能经
工程改造至例如C68的载体中。示例性方法描述于Fang等人,Stable antibody expression 
at therapeutic levels using the 2A peptide.Nat Biotechnol.2005年5月;23(5):
584-90.电子版2005年4月17日中;其以引用的方式并入本文中用于所有目的。
[0401] V.C.疫苗设计和制造的额外考虑
[0402] V.C.1.确定覆盖所有肿瘤亚克隆的肽集合
[0403] 躯干肽,意指由所有或大部分肿瘤亚克隆递呈的那些肽,可优先包括于疫苗中。53任选地,如果不存在经预测以高概率递呈且具有免疫原性的躯干肽,或如果经预测以高概
率递呈且具有免疫原性的躯干肽的数量足够小以致额外非躯干肽可包括于疫苗中,则其它
肽可通过估计肿瘤亚克隆的数量和身份且选择肽以使疫苗所覆盖的肿瘤亚克隆的数量达
到最大而进行优先排序。54
[0404] V.C.2.新抗原优先排序
[0405] 在应用所有上述新抗原过滤器后,与疫苗技术可支持的相比,更多候选新抗原仍可包含于疫苗中。另外,可保留关于新抗原分析的各个方面的不确定性,并且候选疫苗新抗
原的不同特性之间可存在折衷。因此,可考虑整合式多维模型代替选择过程的各步骤中的
预定过滤器,将候选新抗原置于具有至少以下轴的空间中且使用整合方法优化选择。
[0406] 1.自身免疫或耐受性的风险(生殖系的风险)(自身免疫的风险较低通常为优选的)
[0407] 2.测序伪影的概率(伪影的概率较低通常为优选的)
[0408] 3.免疫原性的概率(免疫原性的概率较高通常为优选的)
[0409] 4.递呈的概率(递呈的概率较高通常为优选的)
[0410] 5.基因表达(较高表达通常为优选的)
[0411] 6.HLA基因的覆盖率(参与新抗原集合递呈的HLA分子数量越大可降低肿瘤经由HLA分子的下调或突变逃避免疫攻击的概率)
[0412] 7.HLA类的覆盖率(同时覆盖HLA-I和HLA-II可能会增加治疗反应的概率并降低肿瘤逃避的概率)
[0413] 另外,任选地,如果预测新抗原是由患者的全部或部分肿瘤中失去或失活的HLA等位基因递呈的,则可以从疫苗接种中除名(例如排除)新抗原。HLA等位基因的丢失可能通过
体细胞突变、杂合性丢失或基因座的纯合缺失而发生。检测HLA等位基因体细胞突变的方法
是本领域中众所周知的,例如(Shukla等人,2015)。同样充分描述了检测体细胞LOH和纯合
缺失(包括HLA基因座)的方法。(Carter等人,2012;McGranahan等人,2017;Van Loo等人,
2010)。
[0414] V.D.甲病毒
[0415] V.D.1.甲病毒生物学
[0416] 甲病毒是披膜病毒科的成员,且为正义单链RNA病毒。甲病毒也可称为自我复制RNA或srRNA。成员通常分类为旧世界,例如辛德毕斯、罗斯河、马雅罗、基孔肯尼亚及塞姆利
基森林病毒,或新世界,例如东部马脑炎、奥拉、摩根堡、或委内瑞拉马脑炎及其衍生病毒株
TC-83(Strauss Microbrial Review 1994)。天然甲病毒基因组通常约12kb长,其中前三分
之二含有编码非结构蛋白(nsP)的基因,所述非结构蛋白形成用于病毒基因组自我复制的
RNA复制复合物,并且最后三分之一含有编码用于病毒粒子产生的结构蛋白的亚基因组表
达盒(Frolov RNA 2001)。
[0417] 甲病毒的模型生命周期涉及数个不同步骤(Strauss Microbrial Review 1994,Jose Future Microbiol 2009)。在病毒附着于宿主细胞后,病毒粒子与内吞区室内的膜融
合,导致基因组RNA最终释放至胞溶质中。以正链定向并包含5'甲基鸟苷酸帽和3'polyA尾
部的基因组RNA经翻译以产生形成复制复合物的非结构蛋白nsP1-4。在感染早期,正链然后
由复合物复制成负链模板。在当前模型中,复制复合物随着感染进展被进一步加工,使得所
得经加工的复合物转换成将负链转录成全长正链基因组RNA以及含有结构基因的26S亚基
因组正链RNA。甲病毒的数个保守序列元件(CSE)已鉴定为可能在各种RNA复制步骤中起作
用,包括:负链模板的正链RNA复制中的5'UTR的互补序列、基因组模板的负链合成复制中的
51-nt CSE、负链的亚基因组RNA转录中的在nsP与26S RNA之间的接合区中的24-nt CSE,以
及正链模板的负链合成中的3'19-nt CSE。
[0418] 在各种RNA物种复制后,病毒粒子然后通常在病毒的天然生命周期中组装。26S RNA经翻译且所得蛋白质经进一步加工以产生结构蛋白,其包括衣壳蛋白、糖蛋白E1和E2以
及两个小多肽E3和6K(Strauss 1994)。发生病毒RNA的衣壳化,衣壳蛋白通常仅特异性针对
包装的基因组RNA,接着病毒粒子组装且在膜表面出芽。
[0419] V.D.2.甲病毒作为递送载体
[0420] 甲病毒先前已经工程改造以用作表达载体系统(Pushko 1997,Rheme 2004)。甲病毒提供数种优势,特别是在可能需要异源抗原表达的疫苗环境中。由于在宿主胞溶质中自
我复制的能力,故甲病毒载体一般能够在细胞内产生高拷贝数的表达盒,从而导致高水平
异源抗原产生。另外,载体一般为瞬时的,从而使得生物安全性得以改进以及减少对载体的
免疫耐受性的诱导。与其它标准病毒载体(例如人腺病毒)相比,公众一般也缺乏对甲病毒
载体预先存在的免疫性。基于甲病毒的载体也一般导致对经感染细胞的细胞毒性反应。在
一定程度上,细胞毒性在疫苗环境中对于适当违禁引发对所表达的异源抗原的免疫应答可
为重要的。然而,所需细胞毒性的程度可为平衡作用,且因此已开发数种减毒甲病毒,包括
VEE的TC-83病毒株。因此,本文所述的新抗原表达载体的实例可利用甲病毒骨架,其允许高
水平的新抗原表达,引发对新抗原的稳固免疫应答,不引发对载体本身的免疫应答,并且可
以安全方式使用。此外,新抗原表达盒可经设计以经由优化载体使用的甲病毒序列(包括但
不限于源自VEE或其减毒衍生物TC-83的序列)而引发不同水平的免疫应答。
[0421] 已使用甲病毒序列工程改造数种表达载体设计策略(Pushko1997)。在一个策略中,甲病毒载体设计包括在结构蛋白基因下游插入26S启动子序列元件的第二拷贝,接着是
异源基因(Frolov 1993)。因此,除天然非结构蛋白和结构蛋白之外,也产生表达异源蛋白
的额外亚基因组RNA。在此系统中,存在用于产生感染性病毒粒子的所有元件,因此可能发
生在未感染细胞中反复轮表达载体的感染。
[0422] 另一种表达载体设计利用辅助病毒系统(Pushko 1997)。在此策略中,结构蛋白由异源基因替代。因此,在由仍完整的非结构基因介导病毒RNA的自我复制之后,26S亚基因组
RNA提供异源蛋白的表达。传统上,表达结构蛋白的额外载体然后例如通过细胞系的共转染
以反式供应,以产生感染性病毒。系统详细描述于USPN 8,093,021中,其出于所有目的以全
文引用的方式并入本文中。辅助载体系统提供限制形成感染性粒子的可能性的益处,因此
提高生物安全性。另外,辅助载体系统减小总载体长度,潜在提高复制和表达效率。因此,本
文所述的新抗原表达载体的实例可利用结构蛋白由新抗原盒替代的甲病毒骨架,所得载体
降低生物安全问题,同时由于整体表达载体尺寸减小而促进有效表达。
[0423] V.D.3.体外甲病毒产生
[0424] 甲病毒递送载体一般是正义RNA多核苷酸。本领域中熟知的用于产生RNA的适宜技术为体外转录IVT。在此技术中,首先通过本领域技术人员熟知的技术产生所需载体的DNA
模板,包括标准分子生物学技术,例如克隆、限制性消化、连接、基因合成及聚合酶链反应
(PCR)。DNA模板在期望转录成RNA的序列的5'端处含有RNA聚合酶启动子。启动子包括(但不
限于)噬菌体聚合酶启动子,例如T3、T7或SP6。DNA模板然后与适当RNA聚合酶、缓冲剂及核
苷酸(NTP)一起温育。所得RNA多核苷酸可任选地经进一步修饰,包括(但不限于)添加5'帽
结构,例如7-甲基鸟苷或相关结构,以及任选地修饰3'端以包括聚腺苷酸(polyA)尾部。RNA
可然后使用本领域中熟知的技术纯化,例如苯酚-氯仿提取。
[0425] V.D.4.经由脂质纳米粒子递送
[0426] 在疫苗载体设计中考虑的一个重要方面是针对载体本身的免疫性(Riley 2017)。这可以呈对载体本身(例如某些人腺病毒系统)预先存在的免疫性形式,或呈在疫苗施用后
对载体产生免疫性的形式。如果进行相同疫苗的多次施用(例如分开的初免和加强剂量),
或如果使用相同疫苗载体系统递送不同新抗原盒,则后者为重要的考虑因素。
[0427] 在甲病毒载体的情况下,标准递送方法是先前论述的辅助病毒系统,其以反式提供衣壳、E1和E2蛋白质以产生感染性病毒粒子。然而,重要的是注意E1和E2蛋白质通常是中
和抗体的主要靶标(Strauss1994)。因此,如果中和抗体靶向感染性粒子,则使用甲病毒载
体将所关注的新抗原递送到靶细胞的功效可能会降低。
[0428] 病毒粒子介导的基因递送的替代方案是使用纳米材料递送表达载体(Riley 2017)。重要的是,纳米材料媒介物可由非免疫原性材料制成且一般避免引发对递送载体本
身的免疫性。这些材料可包括(但不限于)脂质、无机纳米材料和其它聚合材料。脂质可为阳
离子、阴离子或中性的。材料可为合成或天然来源的,并且在一些情况下是可生物降解的。
脂质可包括脂肪、胆固醇、磷脂、脂质缀合物,包括(但不限于)聚乙二醇(PEG)缀合物(聚乙
二醇化脂质)、蜡、油、甘油酯和脂溶性维生素。
[0429] 脂质纳米粒子(LNP)是有吸引力的递送系统,因为脂质的两亲性使得能够形成膜和囊泡状结构(Riley 2017)。一般来说,这些囊泡通过吸收至靶细胞的膜中并将核酸释放
至胞溶质中来递送表达载体。另外,LNP可经进一步修饰或官能化以有助于靶向特定细胞类
型。LNP设计中的另一考虑因素是靶向效率与细胞毒性之间的平衡。脂质组合物一般包括阳
离子、中性、阴离子及两性脂质的确定的混合物。在一些情况下,包括特定脂质以防止LNP聚
集,防止脂质氧化,或提供有助于额外部分附着的功能性化学基团。脂质组合物可影响整体
LNP大小和稳定性。在一个实例中,脂质组合物包含二亚油基甲基-4-二甲基氨基丁酸酯
(MC3)或MC3样分子。MC3和MC3样脂质组合物可经配制以包括一种或多种其它脂质,例如PEG
或PEG结合的脂质、固醇或中性脂质。
[0430] 直接暴露于血清的核酸载体(例如表达载体)可具有数种不期望的结果,包括核酸由血清核酸酶降解或游离核酸对免疫系统的脱靶刺激。因此,包封甲病毒载体可用于避免
降解,同时也避免潜在的脱靶影响。在某些实例中,甲病毒载体完全包封在递送媒介物内,
例如在LNP的水性内部。甲病毒载体包封在LNP内可通过本领域技术人员熟知的技术来进
行,例如在微流体液滴生成装置上进行的微流体混合和液滴生成。这些装置包括(但不限
于)标准T形接合装置或流动聚焦装置。在一个实例中,所需脂质制剂(例如含有MC3或MC3样
的组合物)与甲病毒递送载体和其它所需药剂并行提供至液滴生成装置,使得递送载体和
所需药剂完全包封在基于MC3或MC3样的LNP内部。在一个实例中,液滴生成装置可控制所产
生的LNP的尺寸范围及尺寸分布。举例来说,LNP的尺寸可在1至1000纳米直径范围内,例如
1、10、50、100、500或1000纳米。在液滴生成后,包封表达载体的递送媒介物可经进一步处理或修饰以使其准备用于施用。
[0431] V.E.黑猩猩腺病毒(ChAd)
[0432] V.E.1.用黑猩猩腺病毒递送病毒
[0433] 用于递送一个或多个新抗原(例如经由新抗原盒)的疫苗组合物可通过提供黑猩猩来源的腺病毒核苷酸序列、多种新颖载体和表达黑猩猩腺病毒基因的细胞系来产生。黑
猩猩C68腺病毒(在本文中也称为ChAdV68)的核苷酸序列可用于新抗原递送的疫苗组合物
中(参见SEQ ID NO:1)。源自C68腺病毒的载体的使用进一步详细描述于USPN 6,083,716
中,其出于所有目的以全文引用的方式并入本文中。
[0434] 在另一方面,本文提供一种重组腺病毒,其包含黑猩猩腺病毒如C68的DNA序列和可操作地连接于引导其表达的调控序列的新抗原盒。重组病毒能够感染哺乳动物细胞、优
选人细胞,并且能够在细胞中表达新抗原盒产物。在这种载体中,原生黑猩猩E1基因和/或
E3基因和/或E4基因可缺失。新抗原盒可插入至这些基因缺失位点中的任一者中。新抗原盒
可包括新抗原,针对其激活的免疫应答为所需的。
[0435] 在另一方面,本文提供一种被黑猩猩腺病毒如C68感染的哺乳动物细胞。
[0436] 在另一方面,提供一种新颖的哺乳动物细胞系,其表达黑猩猩腺病毒基因(例如来自C68)或其功能片段。
[0437] 在另一方面,本文提供一种用于将新抗原盒递送到哺乳动物细胞中的方法,其包括以下步骤:向细胞中引入有效量的已经工程改造以表达新抗原盒的黑猩猩腺病毒,例如
C68。
[0438] 另一方面提供一种用于在哺乳动物宿主中引发免疫应答以治疗癌症的方法。所述方法可包括以下步骤:向宿主施用有效量的重组黑猩猩腺病毒如C68,其包含编码免疫应答
所靶向的来自肿瘤的一个或多个新抗原的新抗原盒。
[0439] 还公开了一种非猿猴哺乳动物细胞,其表达获自SEQ ID NO:1序列的黑猩猩腺病毒基因。该基因可选自:SEQ ID NO:1的腺病毒E1A、E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5。
[0440] 还公开了一种包含黑猩猩腺病毒DNA序列的核酸分子,该黑猩猩腺病毒DNA序列包含获自SEQ ID NO:1序列的基因。该基因可选自:SEQ ID NO:1的所述黑猩猩腺病毒E1A、
E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5基因。在一些方面,核酸分子包含SEQ ID NO:1。在一些方面,核酸分子包含SEQ ID NO:1序列,其缺少选自以下的至少一个基因:SEQ ID NO:1的
E1A、E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5基因。
[0441] 还公开了一种载体,其包含获自SEQ ID NO:1的黑猩猩腺病毒DNA序列以及可操作地连接于一个或多个调控序列的新抗原盒,该一个或多个调控序列引导盒在异源宿主细胞
中的表达,任选地其中所述黑猩猩腺病毒DNA序列至少包含用于复制及病毒粒子衣壳化所
必需的顺式元件,所述顺式元件侧接新抗原盒和调控序列。在一些方面,黑猩猩腺病毒DNA
序列包含选自以下的基因:SEQ ID NO:1的E1A、E1B、E2A、E2B、E3、E4、L1、L2、L3、L4和L5基因序列。在一些方面,载体可缺乏E1A和/或E1B基因。
[0442] 本文还公开经本文所公开的载体转染的宿主细胞,该载体例如经工程改造以表达新抗原盒的C68载体。本文还公开经由将本文所公开的载体引入细胞中而表达其中引入的
经选择的基因的人细胞。
[0443] 本文还公开了一种用于将新抗原盒递送到哺乳动物细胞的方法,其包括向该细胞中引入有效量的本文所公开的载体,例如经工程改造以表达新抗原盒的C68载体。
[0444] 本文还公开了一种用于产生新抗原的方法,其包括将本文所公开的载体引入哺乳动物细胞中,在适合的条件下培养细胞以及产生新抗原。
[0445] V.E.2.表达E1的互补细胞系
[0446] 为了产生缺失本文所述的基因中的任一者的重组黑猩猩腺病毒(Ad),缺失基因区的功能若对于病毒的复制和感染性必不可少,则可通过辅助病毒或细胞系(即互补或包装
细胞系)供应至重组病毒。举例来说,为了产生复制缺陷型黑猩猩腺病毒载体,可使用表达
人或黑猩猩腺病毒的E1基因产物的细胞系;这种细胞系可包括HEK293或其变体。可遵循产
生表达黑猩猩E1基因产物的细胞系的方案(USPN 6,083,716的实例3和4),以产生表达任何
经选择的黑猩猩腺病毒基因的细胞系。
[0447] AAV增强分析可用于鉴定表达黑猩猩腺病毒E1的细胞系。这种分析可用于鉴定通过使用例如来自其它物种的其它未表征的腺病毒的E1基因制备的细胞系中的E1功能。该分
析描述于USPN 6,083,716的实例4B中。
[0448] 经选择的黑猩猩腺病毒基因(例如E1)可在启动子的转录控制下用于在经选择的亲本细胞系中表达。诱导型或组成型启动子可用于此目的。在诱导型启动子中包括可由锌
诱导的绵羊金属硫蛋白启动子,或可由糖皮质激素、特别是地塞米松(dexamethasone)诱导
的小鼠乳腺肿瘤病毒(MMTV)启动子。其它诱导型启动子,例如以引用的方式并入本文中的
国际专利申请WO95/13392中所鉴定的那些诱导型启动子,也可用于产生包装细胞系。此外
也可采用控制黑猩猩腺病毒基因表达的组成型启动子。
[0449] 亲本细胞可经选择以产生表达任何所需C68基因的新颖细胞系。这种亲本细胞系可为(但不限于)HeLa[ATCC寄存编号CCL 2]、A549[ATCC寄存编号CCL 185]、KB[CCL 17]、
Detroit[例如Detroit 510、CCL 72]和WI-38[CCL 75]细胞。其它适合的亲本细胞系可获自
其它来源。亲本细胞系可包括CHO、HEK293或其变体、911、HeLa、A549、LP-293、PER.C6或AE1-
2a。
[0450] 表达E1的细胞系可用于产生重组黑猩猩腺病毒E1缺失的载体。使用基本上相同的程序构建的表达一种或多种其它黑猩猩腺病毒基因产物的细胞系可用于产生缺失编码那
些产物的基因的重组黑猩猩腺病毒载体。此外,表达其它人Ad E1基因产物的细胞系也可用
于产生黑猩猩重组Ad。
[0451] V.E.3.作为载体的重组病毒粒子
[0452] 本文所公开的组合物可包含病毒载体,其将至少一个新抗原递送至细胞。这种载体包含黑猩猩腺病毒DNA序列如C68和可操作地连接于引导盒表达的调控序列的新抗原盒。
C68载体能够在经感染的哺乳动物细胞中表达盒。C68载体可能功能性缺失一个或多个病毒
基因。新抗原盒包含在一个或多个调控序列如启动子控制下的至少一个新抗原。任选的辅
助病毒和/或包装细胞系可向黑猩猩病毒载体供应缺失的腺病毒基因的任何必需产物。
[0453] 术语“功能性缺失”意指移除或以其它方式改变(例如通过突变或修饰)足够量的基因区,使得基因区不再能够产生一种或多种基因表达的功能性产物。可导致功能性缺失
的突变或修饰包括(但不限于)无义突变,例如引入过早的终止密码子和去除典型和非典型
的起始密码子,改变mRNA剪接或其它转录加工的突变,或其组合。如果需要,可去除整个基
因区。
[0454] 形成本文所公开的载体的核酸序列的修饰,包括序列缺失、插入和其它突变,可使用标准分子生物学技术产生并且在本发明的范围内。
[0455] V.E.4.病毒质粒载体的构建
[0456] 可用于本发明的黑猩猩腺病毒C68载体包括重组缺陷型腺病毒,即在E1a或E1b基因中功能性缺失且任选地携带其它突变(例如其它基因中的温度敏感性突变或缺失)的黑
猩猩腺病毒序列。预期这些黑猩猩序列也可用于形成来自其它腺病毒和/或腺相关病毒序
列的杂交载体。由人腺病毒制备的同源腺病毒载体描述于公开的文献中[参见例如上文所
引用的Kozarsky I和II,以及其中引用的参考文献,美国专利第5,240,846号]。
[0457] 在构建可用于将新抗原盒递送至人(或其它哺乳动物)细胞的黑猩猩腺病毒C68载体时,可在载体中采用一系列腺病毒核酸序列。包含最小黑猩猩C68腺病毒序列的载体可与
辅助病毒结合使用以产生感染性重组病毒粒子。辅助病毒提供最小黑猩猩腺病毒载体的病
毒感染性和繁殖所需的基本基因产物。当在另外的功能性病毒载体中仅产生黑猩猩腺病毒
基因的一个或多个经选择的缺失时,可通过在经选择的包装细胞系中繁殖病毒而在病毒载
体生产过程中供应缺失的基因产物,该包装细胞系提供反式缺失的基因功能。
[0458] V.E.5.重组最小腺病毒
[0459] 最小的黑猩猩Ad C68病毒是仅含有复制及病毒粒子衣壳化所必需的腺病毒顺式元件的病毒粒子。也就是说,载体含有腺病毒的顺式作用5'和3'反向末端重复(ITR)序列
(其充当复制起点)以及原生5'包装/增强子结构域(其含有用于包装线性Ad基因组所必需
的序列和E1启动子的增强子元件)。参见例如在国际专利申请WO96/13597中所描述且以引
用的方式并入本文中的用于制备“最小”人Ad载体的技术。
[0460] V.E.6.其它缺陷型腺病毒
[0461] 重组复制缺乏型腺病毒也可比最小黑猩猩腺病毒序列含有更多。这些其它Ad载体可通过病毒基因区的各个部分的缺失以及通过任选地使用辅助病毒和/或包装细胞系形成
的感染性病毒粒子来表征。
[0462] 作为一个实例,适合的载体可通过使C68腺病毒立即早期基因E1a和延迟早期基因E1b的全部或足够部分缺失来形成,从而消除其正常的生物功能。当在含有提供相应反式基
因产物的功能性腺病毒E1a和E1b基因的黑猩猩腺病毒转化的互补细胞系上生长时,复制缺
陷型E1缺失病毒能够复制并产生感染性病毒。基于与已知腺病毒序列的同源性,预期与本
领域的人重组E1缺失腺病毒一样,所得重组黑猩猩腺病毒能够感染许多细胞类型并且可表
达新抗原,但无法在大部分不携带黑猩猩E1区DNA的细胞中复制,除非细胞以极高感染倍率
感染。
[0463] 作为另一个实例,C68腺病毒延迟早期基因E3的全部或一部分可从形成重组病毒的一部分的黑猩猩腺病毒序列消除。
[0464] 也可构建具有E4基因缺失的黑猩猩腺病毒C68载体。另一个载体可在延迟早期基因E2a中含有缺失。
[0465] 也可在黑猩猩C68腺病毒基因组的晚期基因L1至L5中的任一者中获得缺失。类似地,中间基因IX和IVa2中的缺失可用于一些目的。可在其它结构性或非结构性腺病毒基因
中获得其它缺失。
[0466] 上述缺失可单独使用,即腺病毒序列可仅含有E1缺失。或者,可以任何组合使用有效破坏或降低其生物活性的完整基因或其部分的缺失。举例来说,在一个示例性载体中,腺
病毒C68序列可缺失E1基因和E4基因,或缺失E1、E2a和E3基因,或缺失E1和E3基因,或在缺
失或不缺失E3的情况下缺失E1、E2a和E4基因等等。如上文所论述,这些缺失可与其它突变
(例如温度敏感性突变)组合使用,以达成所需结果。
[0467] 将包含新抗原的盒任选地插入至黑猩猩C68 Ad病毒的任何缺失区中。或者,如果需要,则可将盒插入至现有基因区中以破坏该区的功能。
[0468] V.E.7.辅助病毒
[0469] 取决于用于携带新抗原盒的病毒载体的黑猩猩腺病毒基因含量,可使用辅助腺病毒或非复制性病毒片段来提供足够的黑猩猩腺病毒基因序列以产生含有该盒的感染性重
组病毒粒子。
[0470] 有用的辅助病毒含有经选择的腺病毒基因序列,其不存在于腺病毒载体构建体中和/或不由载体转染的包装细胞系表达。辅助病毒可为复制缺陷型并且除上述序列之外,还
含有多种腺病毒基因。辅助病毒可与本文所述的表达E1的细胞系组合使用。
[0471] 对于C68,“辅助”病毒可以是通过用SspI剪切C68基因组的C端形成的片段,其从病毒的左端除去约1300bp。这种经剪切的病毒然后与质粒DNA共转染至表达E1的细胞系中,由
此通过与质粒中的C68序列同源重组形成重组病毒。
[0472] 辅助病毒也可形成聚阳离子缀合物,如Wu等人,J.Biol.Chem.,264:16985-16987(1989);K.J.Fisher和J.M.Wilson,Biochem.J.,299:49(1994年4月1日)中所述。辅助病毒
可任选地含有报告基因。许多这类报告基因是本领域中已知的。与腺病毒载体上的新抗原
盒不同,辅助病毒上报告基因的存在允许独立地监测Ad载体和辅助病毒。这种第二报告基
因用于纯化后能够将所得重组病毒与辅助病毒分离。
[0473] V.E.8.病毒粒子的组装和细胞系的感染
[0474] 将经选择的腺病毒DNA序列、新抗原盒和其它载体元件组装到各种中间质粒及穿梭载体中,以及使用所述质粒及载体产生重组病毒粒子都可使用常规技术实现。这些技术
包括常规cDNA克隆技术、体外重组技术(例如吉布森组装(Gibson assembly))、腺病毒基因
组的重叠寡核苷酸序列的使用、聚合酶链反应以及提供所需核苷酸序列的任何适合的方
法。采用标准转染和共转染技术,例如CaPO4沉淀技术或脂质体介导的转染方法,例如脂染
胺。所采用的其它常规方法包括病毒基因组的同源重组、琼脂覆层中病毒的蚀斑、测量信号
产生的方法等。
[0475] 例如,在构建并组装所需含有新抗原盒的病毒载体后,可在辅助病毒存在下将载体体外转染至包装细胞系中。同源重组发生在辅助序列与载体序列之间,其允许载体中的
腺病毒新抗原序列复制且包装至病毒粒子衣壳中,从而产生重组病毒载体粒子。
[0476] 所得重组黑猩猩C68腺病毒可用于将新抗原盒转移到经选择的细胞中。在使用包装细胞系中生长的重组病毒的体内实验中,E1缺失的重组黑猩猩腺病毒在将盒转移到非黑
猩猩(优选人)细胞中展现效用。
[0477] V.E.9.重组病毒载体的用途
[0478] 所得含有新抗原盒的重组黑猩猩C68腺病毒(如上所述,通过腺病毒载体和辅助病毒或腺病毒载体及包装细胞系的合作产生)因此提供一种有效的基因转移媒介物,其可将
新抗原体内或离体递送至受试者。
[0479] 上述重组载体根据公开的基因疗法施用于人。携带新抗原盒的黑猩猩病毒载体可施用于患者,优选悬浮于生物相容性溶液或药学上可接受的递送媒介物中。适合的媒介物
包括无菌盐水。已知为药学上可接受的载体并且是本领域技术人员所熟知的其它水性和非
水性等张无菌注射溶液以及水性和非水性无菌悬浮液可用于此目的。
[0480] 黑猩猩腺病毒载体是以足以转导人细胞并提供足够水平的新抗原转移和表达的量施用,从而提供治疗益处而无过度不良效应或具有医学上可接受的生理效应,其可由医
药领域的技术人员来确定。常规和药学上可接受的施用途径包括(但不限于)直接递送至肝
脏、鼻内、静脉内、肌肉内、皮下、皮内、经口和其它肠胃外施用途径。如果需要,施用途径可以组合。
[0481] 病毒载体的剂量主要将取决于例如以下因素:所治疗的病状,患者的年龄、体重和健康状况,并且因此可在不同患者中变化。剂量将经调节以平衡治疗益处与任何副作用,并
且这些剂量可根据采用重组载体的治疗应用而变化。可监测新抗原表达水平以确定剂量施
用频率。
[0482] 重组复制缺陷型腺病毒可以“药学有效量”施用,也就是说,在施用途径中有效转染所需细胞并提供经选择的基因的足够表达水平以提供疫苗益处(即一些可测量的保护性
免疫水平)的重组腺病毒的量。包含新抗原盒的C68载体可与佐剂一起共施用。佐剂可与载
体(例如矾)分开或在载体内编码,特别是在佐剂为蛋白质时。佐剂是本领域中众所周知的。
[0483] 常规且药学上可接受的施用途径包括(但不限于)鼻内、肌肉内、气管内、皮下、皮内、经直肠、经口和其它肠胃外施用途径。如果需要,可组合或调整施用途径,视免疫原或疾
病而定。举例来说,在狂犬病预防中,皮下、气管内和鼻内途径为优选的。施用途径主要将取
决于所治疗疾病的性质。
[0484] 可监测对新抗原的免疫水平以确定是否需要增强剂。举例来说,在评定血清中的抗体效价后,可能需要任选的加强免疫。
[0485] VI.治疗和制造方法
[0486] 还提供一种通过向受试者施用一个或多个新抗原(例如使用本文公开的方法鉴定的多个新抗原)在受试者中诱导肿瘤特异性免疫应答,针对肿瘤接种疫苗,治疗和或缓解受
试者的癌症症状的方法。
[0487] 在一些方面,受试者已诊断患有癌症或具有患癌症的风险。受试者可为人、狗、猫、马或需要肿瘤特异性免疫应答的任何动物。肿瘤可为任何实体肿瘤,例如乳房肿瘤、卵巢肿
瘤、前列腺肿瘤、肺肿瘤、肾脏肿瘤、胃肿瘤、结肠肿瘤、睾丸肿瘤、头颈部肿瘤、胰脏肿瘤、脑肿瘤、黑素瘤和其它组织器官肿瘤,以及血液肿瘤,例如淋巴瘤和白血病,包括急性骨髓性
白血病、慢性骨髓性白血病、慢性淋巴细胞性白血病、T细胞淋巴细胞性白血病和B细胞淋巴
瘤。
[0488] 新抗原可以足以诱导CTL反应的量施用。
[0489] 新抗原可以单独或与其它治疗剂组合施用。治疗剂是例如化学治疗剂、辐射或免疫疗法。可针对特定癌症施用任何适合的治疗性治疗。
[0490] 另外,可向受试者进一步施用抗免疫抑制剂/免疫刺激剂,例如检查点抑制剂。举例来说,可向受试者进一步施用抗CTLA抗体或抗PD-1或抗PD-L1。通过抗体阻断CTLA-4或
PD-L1可增强患者对癌细胞的免疫应答。具体来说,已显示在按照疫苗接种方案时CTLA-4阻
断是有效的。
[0491] 可以确定包括在疫苗组合物中的各新抗原的最佳量和最佳给药方案。举例来说,可制备用于静脉内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹膜内(i.p.)注射、肌
肉内(i.m.)注射的新抗原或其变体。注射方法包括s.c.、i.d.、i.p.、i.m.和i.v.。DNA或RNA
注射方法包括i.d.、i.m.、s.c.、i.p.和i.v.。疫苗组合物的其它施用方法是本领域技术人
员已知的。
[0492] 疫苗可经编译以使得组合物中存在的新抗原的选择、数量和/或量具有组织、癌症和/或患者特异性。举例来说,肽的精确选择可通过亲本蛋白质在给定组织中的表达模式来
指导。选择可取决于癌症的具体类型、疾病状态、较早的治疗方案、患者免疫状态以及当然
患者的HLA单倍型。此外,疫苗可根据特定患者的个人需要而含有个别化组分。实例包括根
据新抗原在特定患者中的表达改变新抗原的选择或在第一轮或治疗方案之后调整二次治
疗。
[0493] 对于待用作癌症疫苗的组合物,在正常组织中大量表达的具有类似正常自身肽的新抗原可以避免或以低量存在于本文所述的组合物中。另一方面,如果已知患者的肿瘤表
达大量特定新抗原,则用于治疗这种癌症的相应药学组合物可大量存在和/或可包括多于
一种特异性针对这种特定新抗原或这种新抗原的途径的新抗原。
[0494] 可向已患有癌症的个体施用包含新抗原的组合物。在治疗应用中,组合物以足以引发对肿瘤抗原的有效CTL反应且治愈或至少部分遏制症状和/或并发症的量施用于患者。
足以实现此目标的量定义为“治疗有效剂量”。对这种用途有效的量将取决于例如组合物、
施用方式、所治疗疾病的阶段和严重程度、患者的体重及一般健康状况,以及处方医师的判
断。应记住,组合物一般可用于严重的疾病状态,也就是说,危及生命或可能危及生命的情
形,尤其当癌症已转移时。在这些情况下,鉴于外来物质的最小化和新抗原的相对无毒性,
主治医师可能且可能感觉需要施用实质性过量的这些组合物。
[0495] 对于治疗用途,可在检测或手术移除肿瘤时开始投药。此后是加强剂量,直到症状至少实质上减弱且此后持续一段时间。
[0496] 用于治疗性治疗的药学组合物(例如疫苗组合物)意欲肠胃外、局部、经鼻、经口或局部施用。药学组合物可以经肠胃外施用,例如静脉内、皮下、皮内或肌肉内施用。组合物可
在手术切除部位施用以诱导针对肿瘤的局部免疫应答。本文公开了用于肠胃外施用的组合
物,其包含新抗原和疫苗组合物溶解或悬浮于可接受的载体(例如水性载体)中的溶液。可
使用多种水性载体,例如水、缓冲水、0.9%生理食盐水、0.3%甘氨酸、玻尿酸等。这些组合
物可以通过常规的熟知灭菌技术灭菌,或者可经无菌过滤。所得水溶液可封装以按原样使
用或冻干,冻干制剂在施用之前与无菌溶液组合。组合物可含有接近生理条件所需要的药
学上可接受的辅助物质,例如pH调节剂和缓冲剂、张力调节剂、湿润剂等,例如乙酸钠、乳酸
钠、氯化钠、氯化氯化钙、脱水山梨糖醇单月桂酸酯、三乙醇胺油酸酯等。
[0497] 新抗原也可以经由脂质体施用,脂质体使其靶向特定的细胞组织,例如淋巴组织。脂质体也可用于增加半衰期。脂质体包括乳液、泡沫、胶束、不溶性单层、液晶、磷脂分散体、层状层等。在这些制剂中,有待递送的新抗原作为脂质体的一部分单独或与结合于例如淋
巴细胞中普遍存在的受体的分子(例如结合于CD45抗原的单克隆抗体)或与其它治疗性或
免疫原性组合物一起并入。因此,用所需新抗原填充的脂质体可引导至淋巴细胞的位点,在
此脂质体然后递送经选择的治疗性/免疫原性组合物。脂质体可由标准的形成囊泡的脂质
形成,其一般包括中性和带负电荷的磷脂和固醇(例如胆固醇)。脂质的选择一般通过考虑
例如脂质体大小、脂质体在血流中的酸不稳定性和稳定性来指导。多种方法可用于制备脂
质体,如例如Szoka等人,Ann.Rev.Biophys.Bioeng.9;467(1980);美国专利第4,235,871
号、第4,501,728号、第4,501,728号、第4,837,028号和第5,019,369号中所述。
[0498] 为了靶向免疫细胞,有待并入到脂质体中的配体可包括例如特异性针对所需免疫系统细胞的细胞表面决定子的抗体或其片段。脂质体悬浮液可以一定剂量静脉内、局部、表
面等施用,该剂量尤其根据投药方式、所递送的肽以及所治疗疾病的阶段而变化。
[0499] 出于治疗或免疫目的,编码肽和任选地一种或多种本文所述的肽的核酸也可施用于患者。多种方法方便地用于将核酸递送至患者。举例来说,核酸可以“裸DNA”形式直接递
送。这种方法描述于例如Wolff等人,Science 247:1465-1468(1990)以及美国专利第5,
580,859号和第5,589,466号中。核酸也可使用弹道式递送施用,如例如美国专利第5,204,
253号中所述。可施用仅包含DNA的粒子。或者,DNA可黏附于粒子,例如金粒子。在存在或不
存在电穿孔的情况下,用于递送核酸序列的方法可包括病毒载体、mRNA载体和DNA载体。
[0500] 核酸也可以与阳离子化合物(例如阳离子脂质)复合递送。脂质介导的基因递送方法描述于例如9618372WOAWO 96/18372;9324640WOAWO 93/24640;Mannino和Gould-
Fogerite,BioTechniques6(7):682-691(1988);美国专利第5,279,833号;Rose美国专利第
5,279,833号;9106309WOAWO 91/06309;以及Felgner等人,Proc.Natl.Acad.Sci.USA 84:
7413-7414(1987)中。
[0501] 新抗原还可以包括于基于病毒载体的疫苗平台中,例如牛痘、禽痘、自我复制甲病毒、马拉巴病毒、腺病毒(参见例如Tatsis等人,Adenoviruses,Molecular Therapy(2004)
10,616-629)或慢病毒,包括(但不限于)第二、第三或杂交第二/第三代慢病毒以及任一代
的重组慢病毒,其经设计以靶向特定细胞类型或受体(参见例如Hu等人,Immunization 
Delivered by Lentiviral Vectors for Cancer and Infectious Diseases,Immunol 
Rev.(2011)239(1):45-61;Sakuma等人,Lentiviral vectors:basic to translational,
Biochem J.(2012)443(3):603-18;Cooper等人,Rescue of splicing-mediated intron 
loss maximizes expression in lentiviral vectors containing the human 
ubiquitin C promoter,Nucl.AcidsRes.(2015)43(1):682-690;Zufferey等人,Self-
Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery,
J.Virol.(1998)72(12):9873-9880)。取决于上述基于病毒载体的疫苗平台的包装能力,这
种方法可递送编码一个或多个新抗原肽的一个或多个核苷酸序列。序列可侧接非突变序
列,可由接头分开或可在前面有一个或多个靶向亚细胞区室的序列(参见例如Gros等人,
Prospective identification of neoantigen-specific lymphocytes in the 
peripheral blood of melanoma patients,Nat Med.(2016)22(4):433-8;Stronen等人,
Targeting of  cancer neoantigens with donor-derived T cell receptor 
repertoires,Science.(2016)352(6291):1337-41;Lu等人,Efficient identification 
of mutated cancer antigens recognized by T cells associated with durable 
tumor regressions,Clin Cancer Res.(2014)20(13):3401-10)。在引入宿主中后,经感染
细胞表达新抗原,从而引发针对肽的宿主免疫(例如CTL)反应。可用于免疫方案中的牛痘载
体和方法描述于例如美国专利第4,722,848号中。另一种载体是BCG(卡介苗)。BCG载体描述
于Stover等人(Nature 351:456-460(1991))中。根据本文描述,可用于新抗原的治疗性施
用或免疫接种的各种其它疫苗载体,例如伤寒沙门氏菌载体等对于本领域技术人员将是显
而易见的。
[0502] 施用核酸的手段使用编码一个或多个表位的袖珍基因构建体。为产生编码经选择在人细胞中表达的CTL表位(袖珍基因)的DNA序列,逆翻译表位的氨基酸序列。使用人密码
子使用表来指导各氨基酸的密码子选择。这些编码表位的DNA序列直接邻接,产生连续多肽
序列。为了优化表达和/或免疫原性,可将额外元件并入到袖珍基因设计中。可经逆翻译且
包括于袖珍基因序列中的氨基酸序列的实例包括:辅助T淋巴细胞、表位、前导(信号)序列
和内质网滞留信号。另外,可通过包括相邻于CTL表位的合成(例如聚丙氨酸)或天然存在的
侧接序列来改进CTL表位的MHC递呈。通过组装编码袖珍基因的正链和负链的寡核苷酸而将
袖珍基因序列转化成DNA。重叠寡核苷酸(30-100个碱基长)是在适当条件下使用熟知技术
合成、磷酸化、纯化和黏接的。寡核苷酸的末端使用T4 DNA连接酶连接。编码CTL表位多肽的
这种合成袖珍基因可以然后克隆到所期望的表达载体中。
[0503] 可制备经纯化的质粒DNA以便使用多种制剂注射。其中最简单的是冻干DNA在无菌磷酸盐缓冲生理食盐水(PBS)中复原。已描述多种方法,并且可使用新技术。如上文所指出,
核酸宜用阳离子脂质配制。另外,统称为保护性、相互作用性、非缩合性(PINC)的糖脂、促融
脂质体、肽和化合物也可与经纯化的质粒DNA复合以影响诸如以下变量:稳定性、肌肉内分
散或运输至特定器官或细胞类型。
[0504] 还公开了一种制造肿瘤疫苗的方法,其包括执行本文公开的方法的步骤;以及产生包含多个新抗原或多个新抗原的子集的肿瘤疫苗。
[0505] 本文所公开的新抗原可使用本领域中已知的方法制造。举例来说,产生本文所公开的新抗原或载体(例如包括编码一个或多个新抗原的至少一个序列的载体)的方法可包
括在适于表达新抗原或载体的条件下培养宿主细胞,其中该宿主细胞包含至少一个编码新
抗原或载体的多核苷酸;以及纯化新抗原或载体。标准纯化方法包括色谱技术、电泳、免疫、
沉淀、透析、过滤、浓缩和色谱聚焦技术。
[0506] 宿主细胞可包括中国仓鼠卵巢(CHO)细胞、NS0细胞、酵母或HEK293细胞。宿主细胞可用一个或多个包含至少一个编码本文所公开的新抗原或载体的核酸序列的多核苷酸转
化,任选地其中该经分离的多核苷酸另外包含可操作地连接于编码新抗原或载体的至少一
个核酸序列的启动子序列。在某些实施方案中,经分离的多核苷酸可为cDNA。
[0507] VII.新抗原使用和施用
[0508] 可使用疫苗接种方案给予受试者一种或多种新抗原。初免疫苗和加强疫苗可用于向受试者给药。初免疫苗可基于C68(例如SEQ ID NO:1或2中所示的序列)或srRNA(例如SEQ 
ID NO:3或4中所示的序列),并且加强疫苗可基于C68(例如SEQ ID NO:1或2中所示的序列)
或srRNA(例如SEQ ID NO:3或4中所示的序列)。各载体通常包括包含新抗原的盒。盒可包括
约20种新抗原,其由间隔子(例如通常包围各抗原的天然序列)或其它非天然间隔序列(例
如AAY)分开。盒还可包括MHCII抗原,例如破伤风类毒素抗原和PADRE抗原,其可视为通用II
类抗原。盒还可包括靶向序列,例如泛素靶向序列。另外,各疫苗剂量可与检查点抑制剂
(CPI)结合(例如同时、之前或之后)施用于受试者。CPI可包括抑制CTLA4、PD1和/或PDL1的
那些,例如抗体或其抗原结合部分。这些抗体可包括曲美木单抗或德瓦鲁单抗
(durvalumab)。
[0509] 初免疫苗可注射(例如肌肉内)于受试者。可使用每一剂量双侧注射。举例来说,可使用一次或多次ChAdV68(C68)注射(例如总剂量1×1012个病毒粒子);可使用选自0.001至
1ug RNA、特别是0.1或1ug范围的低疫苗剂量的一次或多次自我复制RNA(srRNA)注射;或者
可使用选自1至100ug RNA、特别是10或100ug范围的高疫苗剂量的一次或多次srRNA注射。
[0510] 可在初免疫苗接种之后注射(例如肌肉内)疫苗加强剂(加强疫苗)。加强疫苗可在初免后约每1、2、3、4、5、6、7、8、9或10周,例如每4周和/或8周施用。可使用每一剂量双侧注射。举例来说,可使用一次或多次ChAdV68(C68)注射(例如总剂量1×1012个病毒粒子);可使
用选自0.001至1ug RNA、特别是0.1或1ug范围的低疫苗剂量的一次或多次自我复制RNA
(srRNA)注射;或者可使用选自1至100ug RNA、特别是10或100ug范围的高疫苗剂量的一次
或多次srRNA注射。
[0511] 也可向受试者施用抗CTLA-4(例如曲美木单抗)。举例来说,抗CTLA4可在肌肉内疫苗注射(ChAdV68初免或srRNA低剂量)部位附近皮下施用,以确保引流至同一淋巴结。曲美
木单抗为CTLA-4的选择性人IgG2 mAb抑制剂。目标抗CTLA-4(曲美木单抗)皮下剂量通常为
70-75mg(特别是75mg),其剂量范围为例如1-100mg或5-420mg。
[0512] 在某些情况下,可使用抗PD-L1抗体,例如德瓦鲁单抗(MEDI4736)。德瓦鲁单抗为一种选择性、高亲和力人IgG1 mAb,其阻断PD-L1结合于PD-1和CD80。德瓦鲁单抗一般每4周
以20mg/kg i.v.施用。
[0513] 可在疫苗施用之前、期间和/或之后进行免疫监测。除其它参数外,这种监测可告知安全性和功效。
[0514] 为了进行免疫监测,通常使用PBMC。PBMC可在初免疫苗接种之前以及在初免疫苗接种之后(例如4周及8周)分离。PBMC可仅在加强疫苗接种之前以及在每次加强疫苗接种之
后(例如4周和8周)收集。
[0515] 可评定T细胞反应作为免疫监测方案的一部分。可使用本领域中已知的一种或多种方法测量T细胞反应,例如ELISpot、细胞内细胞因子染色、细胞因子分泌和细胞表面捕
捉、T细胞增殖、MHC多聚体染色或通过细胞毒性分析。针对疫苗中编码的表位的T细胞反应
可通过使用ELISpot分析测量细胞因子(例如IFN-γ)的诱导而从PBMC监测。针对疫苗中编
码的表位的特异性CD4或CD8 T细胞反应可通过使用流式细胞测量术测量胞内或胞外捕捉
的细胞因子(例如IFN-γ)的诱导而从PBMC监测。针对疫苗中编码的表位的特异性CD4或
CD8T细胞反应可通过使用MHC多聚体染色测量表达特异性针对表位/MHC I类复合物的T细
胞受体的T细胞群体而从PBMC监测。针对疫苗中编码的表位的特异性CD4或CD8 T细胞反应
可通过在3H-胸苷、溴脱氧尿苷和羧基荧光素-二乙酸酯-琥珀酰亚胺酯(CFSE)并入后测量T
细胞群的离体扩增而从PBMC监测。特异性针对疫苗中编码的表位的源于PBMC的T细胞的抗
原识别能力和溶解活性可通过铬释放分析或替代性比色细胞毒性分析来功能性评定。
[0516] VIII.新抗原鉴定
[0517] VIII.A.新抗原候选物鉴定
[0518] 已描述关于肿瘤及正常外显子组及转录组的NGS分析的研究方法且将其应用于新抗原鉴定空间。6,14,15以下实施例考虑在临床环境中对新抗原鉴定的灵敏度及特异性更大
的某些优化。这些优化可分为两个领域,即与实验室方法相关的那些优化和与NGS数据分析
相关的那些优化。
[0519] VIII.A.1.实验室方法优化
[0520] 此处提出的方法改进通过将对靶向癌症小组16中可靠的癌症驱动基因评定开发的概念扩展至新抗原鉴定所必需的全外显子组及转录组环境来解决来自肿瘤含量低和体积
小的临床样品的高精确性新抗原发现的挑战。具体来说,这些改进包括:
[0521] 1.靶向整个肿瘤外显子组的深度(>500×)独特的平均覆盖率,以检测由于低肿瘤含量或亚克隆状态而以低突变等位基因频率出现的突变。
[0522] 2.靶向整个肿瘤外显子组的均匀覆盖率,在<100×覆盖<5%的碱基,以使得错过新抗原的可能最低,例如通过:
[0523] a.采用基于DNA的捕捉探针及单个探针QC17
[0524] b.包括不良覆盖区的额外诱饵
[0525] 3.靶向整个正常外显子组的均匀覆盖率,其中在<20×下覆盖<5%的碱基,以便最少的新抗原对于体细胞/生殖系状态可能保持未分类(且因此不能用作TSNA)
[0526] 4.为使所需测序总量减到最少,序列捕捉探针将经设计以仅用于基因的编码区,因为非编码RNA无法产生新抗原。额外优化包括:
[0527] a.用于HLA基因的补充探针,其富含GC且通过标准外显子组测序很难捕捉18
[0528] b.排除由于诸如以下因素而经预测产生极少或不产生候选新抗原的基因:表达不足、蛋白酶体消化次优或异常序列特征。
[0529] 5.肿瘤RNA将同样在高深度(>100M读段)下测序,以便能够进行变体检测、基因和剪接变体(“同种型”)表达定量以及融合检测。来自FFPE样品的RNA将使用基于探针的富集19
来提取,其中相同或类似探针用于捕捉DNA中的外显子组。
[0530] VIII.A.2.NGS数据分析优化
[0531] 分析方法的改进解决常见研究突变调用方法的次优灵敏度和特异性,并且具体考虑临床环境中与新抗原鉴定相关的定制。这些包括:
[0532] 1.使用HG38参考人基因组或后续版本进行比对,因为其含有较佳反映群体多态性的多个MHC区组装,与先前的基因组版本相反。
[0533] 2.通过合并来自不同程序5的结果来克服单个变体调用者20的局限性
[0534] a.用一套工具从肿瘤DNA、肿瘤RNA和正常DNA中检测单核苷酸变体和插入缺失,所述工具包括:基于肿瘤和正常DNA比较的程序,例如Strelka21及Mutect22;以及并入肿瘤
DNA、肿瘤RNA及正常DNA的程序,例如UNCeqR,其在低纯度样品中特别有利23。
[0535] b.插入缺失将用进行局部再组装的程序来确定,例如Strelka和ABRA24。
[0536] c.结构重排将使用专用工具来确定,例如Pindel25或Breakseq26。
[0537] 3.为检测及防止样品调换,将在选定数量的多形位点比较来自同一患者的样品的变体调用。
[0538] 4.假性调用的广泛过滤将例如通过以下来执行:
[0539] a.移除在正常DNA中发现的变体,在低覆盖率情况下可能使用放松的检测参数,并且在插入缺失情况下使用容许的接近准则
[0540] b.移除归因于低映像质量或低碱基质量的变体27。
[0541] c.即使在相应的正常情况下没有观察到,也移除源自复发序列伪影的变体27。实例包括主要在一条链上检测的变体。
[0542] d.移除不相关的对照集合中所检测的变体27
[0543] 5.使用seq2HLA28、ATHLATES29或Optitype中的一者从正常外显子组精确调用HLA并且也将外显子组与RNA测序数据组合28。其它潜在优化包括采用专门的HLA分型分析,例如
长读段DNA测序30,或调适连接RNA片段以保持连续性的方法31。
[0544] 6.由肿瘤特异性剪接变体产生的neo-ORF的稳固检测将通过使用CLASS32、Bayesembler33、StringTie34或其参考引导模式中的类似程序从RNA-seq数据组装转录本来
进行(即,使用已知的转录本结构而非试图从每个实验中全部重新创建转录本)。虽然
Cufflinks35通常用于此目的,但其经常产生难以置信的大量剪接变体,其中许多比全长基
因短得多,并且可能无法恢复简单的阳性对照。编码序列和无义介导的衰变可能性将通过
例如SpliceR36和MAMBA37的工具来确定,其中重新引入突变序列。基因表达将通过例如
Cufflinks35或Express(Roberts和Pachter,2013)的工具来确定。野生型和突变体特异性表
达计数和/或相对水平将通过开发用于这些目的的工具(例如ASE38或HTSeq39)来确定。可能
的过滤步骤包括:
[0545] a.移除视为不充分表达的候选neo-ORF。
[0546] b.移除经预测会触发无义介导的衰变(NMD)的候选neo-ORF。
[0547] 7.仅在RNA中观察到的不能直接验证为肿瘤特异性的候选新抗原(例如neoORF)将根据额外参数归类为可能的肿瘤特异性,例如通过考虑:
[0548] a.仅存在支持肿瘤DNA的顺式作用移码或剪接位点突变
[0549] b.在剪接因子中存在确证的肿瘤DNA-仅反式作用的突变。举例来说,在用R625突变型SF3B1进行的三个独立发表的实验中,尽管一个实验检查葡萄膜黑素瘤患者40,第二个
检查葡萄膜黑素瘤细胞系41且第三个检查乳腺癌患者42,但表达出最大差异剪接的基因为
一致的。
[0550] c.对于新颖的剪接同种型,在RNASeq数据中存在确证的“新颖”剪接连接读段。
[0551] d.对于新颖的重新排列,肿瘤DNA中存在确证的近似外显子读段,而正常DNA中不存在
[0552] e.不存在基因表达纲要,例如GTEx43(即使得生殖系起源不太可能)
[0553] 8.通过直接比较组装的DNA肿瘤与正常读段(或来自此类读数的k聚体)来补充基于参考基因组比对的分析,以避免基于比对和批注的错误和伪影。(例如对于在生殖系变体
或重复内容缺失附近出现的体细胞变体)
[0554] 在具有聚腺苷酸化RNA的样品中,RNA-seq数据中的病毒和微生物RNA的存在将使用RNA CoMPASS44或类似方法评定,以鉴定可预测患者反应的其它因素。
[0555] VIII.B.HLA肽的分离和检测
[0556] 在裂解及溶解组织样品后,使用经典免疫沉淀(IP)方法进行HLA-肽分子的分离(55-58)。澄清的溶解物用于HLA特异性IP。
[0557] 免疫沉淀使用与珠粒偶联的抗体来进行,其中抗体特异性针对HLA分子。对于泛I类HLA免疫沉淀,使用泛I类CR抗体,对于II类HLA-DR,使用HLA-DR抗体。在过夜温育期间,抗
体共价连接于NHS-琼脂糖珠粒。在共价连接后,将珠粒洗涤并等分用于IP。(59,60)免疫沉
淀也可以用未共价结合至珠粒的抗体进行。通常使用包被有蛋白A和/或蛋白G的琼脂糖或
磁性珠粒将抗体固定在柱上来完成此操作。下面列出了一些可用于选择性富集MHC/肽复合
物的抗体。
[0558] 抗体名称 特异性W6/32 I类HLA-A、B、C
L243 II类–HLA-DR
Tu36 II类–HLA-DR
LN3 II类–HLA-DR
Tu39 II类–HLA-DR、DP、DQ
[0559] 将澄清的组织溶解物添加至抗体珠粒中进行免疫沉淀。在免疫沉淀后,从溶解物移除珠粒且将溶解物储存用于额外实验,包括额外IP。洗涤IP珠粒以移除非特异性结合且
使用标准技术从珠粒洗脱HLA/肽复合物。使用分子量旋转柱或C18分级分离从肽移除蛋白
质组分。所得肽通过SpeedVac蒸发变干且在一些情况下,在MS分析之前储存在-20C下。
[0560] 干燥的肽在适于反相色谱法的HPLC缓冲液中复原且装载于C-18微毛细管HPLC柱上,以便在Fusion Lumos质谱仪(Thermo)中梯度洗脱。在Orbitrap检测器中以高分辨率
集肽质量/电荷(m/z)的MS1谱,接着在经选择的离子的HCD片段化后,在离子阱检测器中收
集MS2低分辨率扫描。另外,可使用CID或ETD片段化方法或三种技术的任何组合来获得MS2
谱,以达到肽的更大的氨基酸覆盖率。MS2谱也可在Orbitrap检测器中以高分辨率质量精度
测量。
[0561] 使用Comet(61,62)对来自各分析的MS2谱进行蛋白质数据库搜索,并且使用Percolator(63-65)对肽鉴定进行评分。使用PEAKS studio(Bioinformatics Solutions 
Inc.)进行其它测序,并且可以使用其它搜索引擎或测序方法,包括光谱匹配和从头测序
(97)。
[0562] VIII.B.1.支持综合HLA肽测序的MS检测极限研究
[0563] 使用肽YVYVADVAAK,使用装载于LC柱上的不同量的肽确定检测极限。所测试的肽的量为1pmol、100fmol、10fmol、1fmol和100amol。(表1)结果示于图1F中。这些结果表明,最低检测极限(LoD)在埃摩尔范围(10-18)中,动态范围跨越五个数量级,并且信号噪声比足以
在低飞摩尔范围(10-15)测序。
[0564] 表1
[0565] 肽m/z 装载于柱上 1e9个细胞中的拷贝数/细胞566.830 1pmol 600
562.823 100fmol 60
559.816 10fmol 6
556.810 1fmol 0.6
553.802 100amol 0.06
[0566] IX.递呈模型
[0567] IX.A.系统综述
[0568] 图2A是根据一个实施方案,用于鉴定患者中肽递呈的可能性的环境100的概述。环境100提供背景以引入递呈鉴定系统160,其本身包括递呈信息存储器165。
[0569] 递呈鉴定系统160是一个或多个如以下关于图14所论述体现在计算系统中的计算机模型,其接收与MHC等位基因集合相关的肽序列且确定肽序列将由相关MHC等位基因集合
中的一个或多个递呈的可能性。递呈鉴定系统160可应用于I类和II类MHC等位基因。这在各
种情形下均有用。递呈鉴定系统160的一个具体使用情况是其能够接收与来自患者110的肿
瘤细胞的MHC等位基因集合相关的候选新抗原的核苷酸序列且确定候选新抗原将由肿瘤的
相关MHC等位基因中的一个或多个递呈的可能性和/或在患者110的免疫系统中诱导免疫原
性反应。可选择由系统160确定的具有高可能性的那些候选新抗原以包括于疫苗118中,这
种抗肿瘤免疫应答可由提供肿瘤细胞的患者110的免疫系统引发。
[0570] 递呈鉴定系统160经由一个或多个递呈模型来确定递呈可能性。具体来说,递呈模型产生给定肽序列是否将由相关MHC等位基因集合递呈的可能性,并且是基于存储在存储
器165中的递呈信息产生的。举例来说,递呈模型可产生肽序列“YVYVADVAAK”是否将由等位
基因集合HLA-A*02:01、HLA-A*03:01、HLA-B*07:02、HLA-B*08:03、HLA-C*01:04、HLA-A*06:
03、HLA-B*01:04在样品的细胞表面上递呈的可能性。递呈信息165含有关于肽是否结合于
不同类型的MHC等位基因以使得那些肽由MHC等位基因递呈的信息,其在模型中根据肽序列
中氨基酸的位置而确定。递呈模型可基于递呈信息165预测未识别的肽序列是否将与相关
MHC等位基因集合相关联地递呈。如先前所述,递呈模型可应用于I类和II类MHC等位基因。
[0571] IX.B.递呈信息
[0572] 图2示出根据一个实施方案获得递呈信息的方法。递呈信息165包括两个一般类别的信息:等位基因相互作用信息和等位基因非相互作用信息。等位基因相互作用信息包括
影响依赖于MHC等位基因类型的肽序列的递呈的信息。等位基因非相互作用信息包括影响
与MHC等位基因类型无关的肽序列的递呈的信息。
[0573] IX.B.1.等位基因相互作用信息
[0574] 等位基因相互作用信息主要包括经鉴定的肽序列,已知所述肽序列已由来自人、小鼠等的一种或多种经鉴定的MHC分子递呈。值得注意的是,这可包括或可不包括获自肿瘤
样品的数据。所递呈的肽序列可从表达单个MHC等位基因的细胞鉴定。在这种情况下,所递
呈的肽序列一般从经工程改造以表达预定MHC等位基因且随后暴露于合成蛋白质的单等位
基因细胞系收集。在MHC等位基因上递呈的肽通过例如酸洗脱的技术分离且通过质谱法鉴
定。图2B示出这种情况的实例,其中在预定MHC等位基因HLA-A*01:01上递呈的示例肽
YEMFNDKS经分离并通过质谱法鉴定。图2D示出这种情况的另一个实例,其中在预定MHC等位
基因HLA-DRB1*12:01上递呈的示例肽YEMFNDKSQRAPDDKMF经分离并通过质谱法鉴定。因为
在这些情况下,肽是通过经工程改造以表达单个预定MHC蛋白质的细胞来鉴定,所以所递呈
的肽和与其结合的MHC蛋白质之间的直接关联是确定已知的。
[0575] 所递呈的肽序列也可从表达多个MHC等位基因的细胞收集。通常在人中,细胞表达6种不同类型的MHC-I分子和多至12种不同类型的MHC-II分子。如此递呈的肽序列可从经工
程改造以表达多个预定MHC等位基因的多等位基因细胞系鉴定。如此递呈的肽序列也可从
组织样品(正常组织样品或肿瘤组织样品)鉴定。尤其在这种情况下,MHC分子可从正常或肿
瘤组织免疫沉淀。递呈于多个MHC等位基因上的肽可类似地通过例如酸洗脱的技术分离且
通过质谱法鉴定。图2C示出这种情况的一个实例,其中六种示例肽YEMFNDKSF、
HROEIFSHDFJ、FJIEJFOESS、NEIOREIREI、JFKSIFEMMSJDSSU和KNFLENFIESOFI递呈于经鉴定
的MHC等位基因HLA-A*01:01、HLA-A*02:01、HLA-B*07:02、HLA-B*08:01、HLA-C*01:03和
HLA-C*01:04上,经分离且通过质谱法鉴定。在另一个实例中,图2C示出其中六种示例肽
YEMFNDKSF、HROEIFSHDFJ、FJIEJFOESS、NEIOREIREI、JFKSIFEMMSJDSSUIFLKSJFIEIFJ和
KNFLENFIESOFI递呈于经鉴定的I类MHC等位基因HLA-A*01:01、HLA-A*02:01、HLA-B*07:02、
HLA-B*08:01以及II类MHC等位基因HLA-DRB1*10:01、HLA-DRB1:11:01上,经分离且通过质
谱法鉴定。与单等位基因细胞系相反,在这些实例中,所递呈的肽和与其结合的MHC蛋白质
之间的直接关联可为未知的,因为所结合的肽在鉴定之前与MHC分子分离。
[0576] 等位基因相互作用信息还可包括质谱离子流,其取决于肽-MHC分子复合物的浓度和肽的离子化效率。离子化效率在肽与肽之间以序列依赖性方式变化。一般来说,离子化效
率在肽与肽之间在约两个数量级内变化,而肽-MHC复合物的浓度在与之相比较大的范围内
变化。
[0577] 等位基因相互作用信息还可包括给定MHC等位基因与给定肽之间的结合亲和力的测量或预测(94,95,96)。一个或多个亲和力模型可产生此类预测。举例来说,再回到图1D中
所示的实例,递呈信息165可包括肽YEMFNDKSF与I类等位基因HLA-A*01:01之间的1000nM的
结合亲和力预测。IC50>1000nm的肽极少由MHC递呈,且较低IC50值增加递呈概率。递呈信息
165可包括肽KNFLENFIESOFI与II类等位基因HLA-DRB1:11:01之间的结合亲和力预测。
[0578] 等位基因相互作用信息还可包括对MHC复合物稳定性的测量或预测。一个或多个稳定性模型可产生此类预测。更稳定的肽-MHC复合物(即具有较长半衰期的复合物)更可能
以高拷贝数递呈在肿瘤细胞和遭遇疫苗抗原的抗原递呈细胞上。举例来说,再回到图2C中
所示的实例,递呈信息165可包括I类分子HLA-A*01:01的半衰期为1小时的稳定性预测。递
呈信息165还可包括II类分子HLA-DRB1:11:01的半衰期的稳定性预测。
[0579] 等位基因相互作用信息还可包括经测量或经预测的肽-MHC复合物形成反应速率。以较高速率形成的复合物更可能以高浓度递呈在细胞表面上。
[0580] 等位基因相互作用信息还可包括肽的序列和长度。MHC I类分子通常偏好递呈长度在8与15个肽之间的肽。60-80%的递呈肽的长度为9。来自数个细胞系的递呈肽长度的直
方图示于图5中。MHC II类分子通常偏好递呈长度在6与30个肽之间的肽。
[0581] 等位基因相互作用信息还可包括新抗原编码肽上激酶序列基序的存在,以及新抗原编码肽上特异性翻译后修饰的不存在或存在。激酶基序的存在影响翻译后修饰的概率,
翻译后修饰可增强或干扰MHC结合。
[0582] 等位基因相互作用信息还可包括翻译后修饰过程中所涉及的蛋白质(例如激酶)的表达或活性水平(如由RNA seq、质谱法或其它方法测量或预测)。
[0583] 等位基因相互作用信息还可包括来自表达特定MHC等位基因的其他个体的细胞中具有类似序列的肽的递呈概率,如通过质谱蛋白质组学或其它手段评定。
[0584] 等位基因相互作用信息还可包括所讨论的个体中特定MHC等位基因的表达水平(例如通过RNA-seq或质谱所测量)。与高水平表达的MHC等位基因结合最强的肽比与低水平
表达的MHC等位基因结合最强的肽更可能被递呈。
[0585] 等位基因相互作用信息还可包括表达特定MHC等位基因的其他个体中由特定MHC等位基因递呈的总体新抗原编码肽序列独立性概率。
[0586] 等位基因相互作用信息还可包括在其他个体中由同一家族分子(例如HLA-A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)中的MHC等位基因递呈的总体肽序列独立性概率。举例来
说,HLA-C分子通常以低于HLA-A或HLA-B分子的水平表达,且因此,由HLA-C递呈肽凭经验比
由HLA-A或HLA-B递呈的可能性低。对于另一个实例,HLA-DP通常以低于HLA-DR或HLA-DQ的
水平表达;因此,由HLA-DP递呈肽凭经验比由HLA-DR或HLA-DQ递呈的可能性低。
[0587] 等位基因相互作用信息还可包括特定MHC等位基因的蛋白质序列。
[0588] 以下部分列出的任何MHC等位基因非相互作用信息也可经建模为MHC等位基因相互作用信息。
[0589] IX.B.2.等位基因非相互作用信息
[0590] 等位基因非相互作用信息可包括在其源蛋白序列内侧接新抗原编码肽的C端序列。对于MHC-I,C端侧接序列可影响肽的蛋白酶体加工。然而,在将肽转运至内质网且遇到
细胞表面上的MHC等位基因之前,C端侧接序列由蛋白酶体从肽裂解。因此,MHC分子不接收
关于C端侧接序列的信息,且因此,C端侧接序列的效应无法根据MHC等位基因类型而变化。
举例来说,再回到图2C中所示的实例,递呈信息165可包括从肽的源蛋白鉴定的递呈肽
FJIEJFOESS的C端侧接序列FOEIFNDKSLDKFJI。
[0591] 等位基因非相互作用信息还可包括mRNA定量测量。举例来说,可获得提供质谱训练数据的相同样品的mRNA定量数据。如稍后参照图13H所述,RNA表达经鉴定为肽递呈的强
预测因子。在一个实施方案中,mRNA定量测量是从软件工具RSEM鉴定。RSEM软件工具的具体
实施可见于Bo Li和Colin N.Dewey.RSEM:accurate transcript quantification from 
RNA-Seq data with or without a reference genome.BMC Bioinformatics,12:323,
2011年8月。在一个实施方案中,mRNA定量以片段/千碱基转录本/百万定位读段(FPKM)为单
位测量。
[0592] 等位基因非相互作用信息还可包括在其源蛋白序列内侧接肽的N端序列。
[0593] 等位基因非相互作用信息还可包括肽序列的源基因。可以将源基因定义为肽序列的Ensembl蛋白家族。在其它实例中,源基因可以被定义为肽序列的源DNA或源RNA。可以例
如将源基因表示为编码蛋白质的一串核苷酸,或者根据已知编码特定蛋白质的指定的一组
已知DNA或RNA序列来更分类地表示。在另一个实例中,等位基因非相互作用信息还可包括
从例如Ensembl或RefSeq的数据库中提取的肽序列的源转录本或同种型或潜在的源转录本
或同种型的集合。
[0594] 等位基因非相互作用信息还可包括肽中蛋白酶裂解基序的存在,任选地根据肿瘤细胞中相应蛋白酶的表达加权(如通过RNA-seq或质谱法所测量)。含有蛋白酶裂解基序的
肽不大可能递呈,因为其将更容易由蛋白酶降解,且因此在细胞内会更不稳定。
[0595] 等位基因非相互作用信息还可包括在适当细胞类型中所测量的源蛋白的周转率。较快周转率(即较低半衰期)增加递呈概率;然而,如果在不同细胞类型中测量,则这种特征
的预测能力较低。
[0596] 等位基因非相互作用信息还可包括源蛋白的长度,任选地考虑在肿瘤细胞中最高度表达的特异性剪接变体(“同种型”),如通过RNA-seq或蛋白质组质谱法所测量,或如由
DNA或RNA序列数据中所检测的生殖系或体细胞剪接突变的批注所预测。
[0597] 等位基因非相互作用信息还可包括蛋白酶体、免疫蛋白酶体、胸腺蛋白酶体或其它蛋白酶在肿瘤细胞中的表达水平(其可通过RNA-seq、蛋白质组质谱法或免疫组织化学测
量)。不同的蛋白酶体具有不同的裂解位点偏好。将赋予与其表达水平成比例的各类型蛋白
酶体的裂解偏好较大的权重。
[0598] 等位基因非相互作用信息还可包括肽的源基因的表达(例如,如通过RNA-seq或质谱法所测量)。可能的优化包括调节所测量的表达以考虑肿瘤样品内基质细胞和肿瘤浸润
性淋巴细胞的存在。来自较高度表达的基因的肽更可能被递呈。来自表达水平不可检测的
基因的肽可排除考虑。
[0599] 等位基因非相互作用信息还可包括新抗原编码肽的源mRNA将经受无义介导的衰变的概率,如由无义介导的衰变的模型(例如来自Rivas等人,Science 2015的模型)所预
测。
[0600] 等位基因非相互作用信息还可包括肽的源基因在细胞周期的各种阶段期间的典型组织特异性表达。以总体低水平表达(如通过RNA-seq或质谱蛋白质组学所测量)但已知
在细胞周期的特定阶段期间以高水平表达的基因相比以极低水平稳定表达的基因可能产
生更多递呈肽。
[0601] 等位基因非相互作用信息还可包括源蛋白的综合特征目录,如例如uniProt或PDB http://www.rcsb.org/pdb/home/home.do中可所给出。这些特征可尤其包括:蛋白质的二
级和三级结构、亚细胞定位11、基因本体(GO)项。具体来说,这种信息可含有在蛋白质水平
起作用的批注(例如5'UTR长度),以及在特定残基水平起作用的批注(例如残基300与310之
间的螺旋基序)。这些特征还可包括转角基序、折叠基序和无序残基。
[0602] 等位基因非相互作用信息还可包括描述含有肽的源蛋白的域特性,例如:二级或三级结构(例如α螺旋对β折叠);替代性剪接。
[0603] 等位基因非相互作用信息还可包括描述在肽的源蛋白中在肽的位置处存在或不存在递呈热点的特征。
[0604] 等位基因非相互作用信息还可包括在其他个体中由所讨论的肽的源蛋白递呈肽的概率(在调节那些个体中源蛋白的表达水平和那些个体的不同HLA类型的影响之后)。
[0605] 等位基因非相互作用信息还可包括由于技术偏差,肽将不会由质谱法检测到或过量表示的概率。
[0606] 如通过基因表达分析(例如RNASeq)、微阵列、靶向组(例如Nanostring)所测量的各种基因模块/途径的表达,或通过例如RT-PCR的分析(其无需含有肽的源蛋白)测量的基
因模块的单/多基因代表,提供关于肿瘤细胞、基质或肿瘤浸润性淋巴细胞(TIL)状态的信
息。
[0607] 等位基因非相互作用信息还可包括肽的源基因在肿瘤细胞中的拷贝数。举例来说,来自肿瘤细胞中经受纯合缺失的基因的肽可经指定递呈概率为零。
[0608] 等位基因非相互作用信息还可包括肽与TAP结合的概率或肽与TAP的经测量或经预测的结合亲和力。更可能与TAP结合的肽或以较高亲和力结合TAP的肽更可能被MHC-I递
呈。
[0609] 等位基因非相互作用信息还可包括TAP在肿瘤细胞中的表达水平(其可通过RNA-seq、蛋白质组质谱法、免疫组织化学测量)。对于MHC-I,较高TAP表达水平增加所有肽递呈
的概率。
[0610] 等位基因非相互作用信息还可包括存在或不存在肿瘤突变,其包括(但不限于):
[0611] i.已知癌症驱动基因(例如EGFR、KRAS、ALK、RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3)中的驱动突变
[0612] ii.在编码抗原递呈机制中所涉及的蛋白质的基因(例如,B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或编码蛋白酶体或免疫蛋白酶体组
分的基因中的任一者)中。递呈依赖于肿瘤中经受功能丧失性突变的抗原递呈机制的组分
的肽具有降低的递呈概率。
[0613] 存在或不存在功能性生殖系多态性,其包括(但不限于):
[0614] i.在编码抗原递呈机制中所涉及的蛋白质的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或编码蛋白酶体或免疫蛋白酶体组
分的基因中的任一者)中
[0615] 等位基因非相互作用信息还可包括肿瘤类型(例如NSCLC、黑素瘤)。
[0616] 等位基因非相互作用信息还可包括HLA等位基因的已知功能,如由例如HLA等位基因后缀所反映。举例来说,等位基因名称HLA-A*24:09N中的N后缀指示未表达且因此不可能
递呈表位的剔除式等位基因;完整HLA等位基因后缀命名法描述于https://
www.ebi.ac.uk/ipd/imgt/hla/nomenclature/suffixes.html。
[0617] 等位基因非相互作用信息还可包括临床肿瘤亚型(例如鳞状肺癌对非鳞状肺癌)。
[0618] 等位基因非相互作用信息还可包括吸烟史。
[0619] 等位基因非相互作用信息还可包括晒伤史、太阳曝晒史或暴露于其它诱变剂的历史。
[0620] 等位基因非相互作用信息还可包括肽的源基因在相关肿瘤类型或临床亚型中的典型表达,任选地通过驱动突变分层。通常在相关肿瘤类型中以高水平表达的基因更可能
被递呈。
[0621] 等位基因非相互作用信息还可包括所有肿瘤中、或相同类型的肿瘤中、或具有至少一个共享MHC等位基因的个体的肿瘤中、或具有至少一个共享MHC等位基因的个体的相同
类型的肿瘤中的突变频率。
[0622] 在突变的肿瘤特异性肽的情况下,用于预测递呈概率的特征列表还可包括突变的批注(例如错义、通读、移码、融合等)或预测突变是否导致无义介导的衰变(NMD)。举例来
说,由于纯合早期终止突变而在肿瘤细胞中不翻译的蛋白质区段的肽可经指定递呈概率为
零。NMD使得mRNA翻译降低,其降低递呈概率。
[0623] IX.C.递呈鉴定系统
[0624] 图3是示出根据一个实施方案的递呈鉴定系统160的计算机逻辑组件的高级框图。在该示例实施方案中,递呈鉴定系统160包括数据管理模块312、编码模块314、训练模块316
和预测模块320。递呈鉴定系统160也由训练数据存储器170和递呈模型存储器175构成。模
型管理系统160的一些实施方案具有与此处所述不同的模块。类似地,功能可以不同于此处
描述的方式分布于模块当中。
[0625] IX.C.1.数据管理模块
[0626] 数据管理模块312从递呈信息165产生多组训练数据170。每组训练数据含有多个数据实例,其中每个数据实例i含有一组自变量zi,其包括至少一个经递呈或未经递呈的肽
序列pi、一个或多个与该肽序列pi相关联的相关MHC等位基因ai;以及一个因变量yi,其表示
递呈鉴定系统160有意预测自变量的新值的信息。
[0627] 在本说明书其余部分通篇提及的一个特定实施方式中,因变量yi是一种二元标记,指示肽pi是否经一个或多个相关MHC等位基因ai递呈。然而,应了解,在其它实施方式中,取决于自变量zi,因变量yi可以表示递呈鉴定系统160有意进行预测的任何其它种类的信
息。举例来说,在另一实施方式中,因变量yi也可为指示所鉴定的数据实例的质谱离子电流
的数值。
[0628] 数据实例i的肽序列pi是具有ki个氨基酸的序列,其中ki可以随数据实例i而在一定范围内变化。举例来说,该范围对于MHC I类可以为8-15或对于MHC II类为6-30。在系统
160的一个特定实施方式中,一个训练数据集中的所有肽序列pi可以具有相同长度,例如9。
肽序列中的氨基酸数量可以根据MHC等位基因的类型(例如人中的MHC等位基因等)而变化。
i i
数据实例i的MHC等位基因a指示存在的与相应肽序列p相关联的MHC等位基因。
[0629] 数据管理模块312还可包括另外的等位基因相互作用变量,例如与训练数据170中所包含的肽序列pi和相关MHC等位基因ai有关的结合亲和力bi和稳定性si预测值。举例来
说,训练数据170可以含有肽pi与ai中指示的相关MHC分子中的每一个之间的结合亲和力预
i i
测值b。作为另一实例,训练数据170可以含有关于a中指示的MHC等位基因中的每一个的稳
定性预测值si。
[0630] 数据管理模块312还可包括等位基因非相互作用变量wi,例如与肽序列pi有关的C端侧接序列和mRNA定量测量值。
[0631] 数据管理模块312还鉴定未经MHC等位基因递呈的肽序列以产生训练数据170。一般来说,这涉及鉴定源蛋白质的“较长”序列,其包括递呈前的递呈肽序列。当递呈信息含有
经工程改造的细胞系时,数据管理模块312鉴定所述细胞所暴露的合成蛋白质中未递呈于
所述细胞的MHC等位基因上的一系列肽序列。当递呈信息含有组织样品时,数据管理模块
312鉴定递呈肽序列来源的源蛋白质,且鉴定源蛋白质中未递呈于组织样品细胞的MHC等位
基因上的一系列肽序列。
[0632] 数据管理模块312也可利用随机氨基酸序列人工产生肽,且鉴定所产生的序列为不递呈于MHC等位基因上的肽。这可以通过随机地产生肽序列实现,允许数据管理模块312
容易地产生大量不递呈于MHC等位基因上的肽的合成数据。由于实际上MHC等位基因递呈小
百分率的肽序列,因此合成产生的肽序列极可能不由MHC等位基因递呈,即使所述序列包括
在经细胞加工的蛋白质中。
[0633] 图4A示出根据一个实施方案的一组示例训练数据170A。具体来说,训练数据170A中的前3个数据实例指示由包含等位基因HLA-C*01:03的单等位基因细胞系得到的肽递呈
信息以及3个肽序列QCEIOWARE、FIEUHFWI和FEWRHRJTRUJR。训练数据170A中的第四个数据
实例指示由包含等位基因HLA-B*07:02、HLA-C*01:03、HLA-A*01:01的多等位基因细胞系得
到的肽信息以及肽序列QIEJOEIJE。第一个数据实例指示肽序列QCEIOWARE未经等位基因
HLA-C*01:03递呈。如前两段中所论述,肽序列可以由数据管理模块312随机产生或从递呈
肽的源蛋白质鉴定。训练数据170A也包括肽序列-等位基因对的1000nM的结合亲和力预测
值和1小时半衰期的稳定性预测值。训练数据170A还包括等位基因非相互作用变量,例如肽
FJELFISBOSJFIE的C端侧接序列和102TPM的mRNA定量测量值。第四个数据实例指示,肽序列
QIEJOEIJE经等位基因HLA-B*07:02、HLA-C*01:03或HLA-A*01:01之一递呈。训练数据170A
还包括有关等位基因中的每一个的结合亲和力预测值和稳定性预测值,以及该肽的C端侧
接序列和该肽的mRNA定量测量值。
[0634] 图4B示出根据一个实施方案的另一组示例训练数据170A。具体来说,训练数据170A中的第一个数据实例指示来自涉及II类等位基因HLA-DRB3:01:01的单等位基因细胞
系和肽序列QCEIOWAREFLKEIGJ的肽递呈信息。第一个数据实例表明等位基因HLA-DRB3:01:
01未递呈肽序列QCEIOWAREFLKEIGJ。
[0635] IX.C.2.编码模块
[0636] 编码模块314将训练数据170中所包含的信息编码成可以用于产生一个或多个递呈模型的数字表示。在一个实施方式中,编码模块314经预定的20字母氨基酸字母表独热编
码序列(例如肽序列或C端侧接序列)。具体来说,具有ki个氨基酸的肽序列pi表示为具有
i i i
20·ki个元素的行向量,其中p20·(j-1)+1、p20·(j-1)+2、…、p20·j当中对应于字母表中在该肽序列第j位的氨基酸的单一元素的值为1。另外,其余元素的值为0。举例来说,对于给定字母
表{A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y},数据实例i的具有3个氨基酸的肽序列
EAF可以由具有60个元素的行向量表示:pi=[0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 
0 0]。C端侧接序列ci,以及MHC等位基因的蛋白质序列dh,和递呈信息中的其它序列数据可
以与上文所描述类似的方式编码。
[0637] 当训练数据170含有氨基酸长度不同的序列时,编码模块314也可通过添加PAD字符以扩充预定字母表,将所述肽编码成相等长度的向量。举例来说,这可以通过用PAD字符
对该肽序列左侧填充直至该肽序列的长度达到训练数据170中具有最大长度的肽序列来进
行。因此,当具有最大长度的肽序列具有kmax个氨基酸时,编码模块314将各序列以数字方式
表示为具有(20+1)·kmax个元素的行向量。举例来说,对于扩充的字母表{PAD,A,C,D,E,F,
G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y}和kmax=5的最大氨基酸长度,该具有3个氨基酸的示例
肽序列EAF可以由具有105个元素的行向量表示:pi=[1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 
0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 
0 0 0 0 0 0 0 0 0 0 0]。C端侧接序列ci或其它序列数据可以与上文所描述类似的方式
编码。因此,肽序列pi或ci中的每个自变量或每一列表示在该序列特定位置处特定氨基酸的
存在。
[0638] 尽管以上编码序列数据的方法是参照具有氨基酸序列的序列描述,但该方法也可类似地扩展至其它类型的序列数据,例如DNA或RNA序列数据等。
[0639] 编码模块314也将数据实例i的一个或多个MHC等位基因ai编码为具有m个元素的行向量,其中各元素h=1,2,…,m对应于唯一鉴定的MHC等位基因。对应于所鉴定的数据实
例i的MHC等位基因的元素的值为1。另外,其余元素的值为0。举例来说,m=4种唯一鉴定的
MHC等位基因类型{HLA-A*01:01,HLA-C*01:08,HLA-B*07:02,HLA-C*01:03}当中对应于多
等位基因细胞系的数据实例i的等位基因HLA-B*07:02和HLA-C*01:03可以由具有4个元素
的行向量表示:ai=[0 0 1 1],其中a3i=1且a4i=1。作为另一个实例,对应于所鉴定的数据实例i的MHC等位基因的元素的值为1。另外,其余元素的值为0。举例来说,m=4种唯一鉴定
的MHC等位基因类型{HLA-A*01:01,HLA-C*01:08,HLA-B*07:02,HLA-DRB1*10:01}当中对应
于多等位基因细胞系的数据实例i的等位基因HLA-B*07:02和HLA-DRB1*10:01可以由具有4
个元素的行向量表示:ai=[0 0 1 1],其中a3i=1且a4i=1。尽管本文中用4种经鉴定的MHC
等位基因类型描述实例,但MHC等位基因类型的数量实际上可以为数百种或数千种。如先前
所论述,每个数据实例i通常含有至多6种不同的与肽序列pi相关联的MHC I类等位基因类
型,和/或至多4种不同的与肽序列pi相关联的MHC II类DR等位基因类型,和/或至多12种不
同的与肽序列pi相关联的MHC II类等位基因类型。
[0640] 编码模块314也将各数据实例i的标记yi编码为具有来自集合{0,1}的值的二元变量,其中值1指示肽xi经相关MHC等位基因ai之一递呈,并且值0指示肽xi未经相关MHC等位基
因ai中的任一个递呈。当因变量yi表示质谱离子电流时,编码模块314可以另外使用各种函
数,例如对于在[0,∞]之间的离子电流值具有[-∞,∞]的范围的对数函数缩放所述值。
[0641] 编码模块314可以将有关肽pi和相关MHC等位基因h的一对等位基因相互作用变量xhi表示为行向量,其中等位基因相互作用变量的数字表示相继地串接。举例来说,编码模块
314可以将xhi表示为等于[pi]、[pi bhi]、[pi shi]或[pi bhi shi]的行向量,其中bhi是肽pi和相关MHC等位基因h的结合亲和力预测值,并且类似地适用于有关稳定性的shi。或者,等位基
因相互作用变量的一个或多个组合可以个别地存储(例如以个别向量或矩阵形式)。
[0642] 在一个实例中,编码模块314通过将结合亲和力的测量值或预测值并入等位基因相互作用变量xhi中来表示结合亲和力信息。
[0643] 在一个实例中,编码模块314通过将结合稳定性的测量值或预测值并入等位基因相互作用变量xhi中来表示结合稳定性信息。
[0644] 在一个实例中,编码模块314通过将结合缔合速率的测量值或预测值并入等位基因相互作用变量xhi中来表示结合缔合速率信息。
[0645] 在一个实例中,对于由I类MHC分子递呈的肽,编码模块314将肽长度表示为向量其中 是指针函数,并且Lk表示肽pk的长度。
向量Tk可以包括在等位基因相互作用变量xhi中。在另一个实例中,对于由II类MHC分子递呈
的肽,编码模块314将肽长度表示为向量
其中 是指
i
针函数,并且Lk表示肽pk的长度。向量Tk可以包括在等位基因相互作用变量xh中。
[0646] 在一个实例中,编码模块314通过将基于RNA-seq的MHC等位基因表达水平并入等位基因相互作用变量xhi中来表示MHC等位基因的RNA表达信息。
[0647] 类似地,编码模块314可以将等位基因非相互作用变量wi表示为行向量,其中等位i i i i i
基因非相互作用变量的数字表示相继地串接。举例来说,w 可以是等于[c]或[c m w]的
行向量,其中wi是表示除肽pi的C端侧接序列和与该肽有关的mRNA定量测量值mi外的任何其
它等位基因非相互作用变量的行向量。或者,等位基因非相互作用变量的一个或多个组合
可以个别地存储(例如以个别向量或矩阵形式)。
[0648] 在一个实例中,编码模块314通过将周转率或半衰期并入等位基因非相互作用变量wi中来表示源蛋白质的周转率。
[0649] 在一个实例中,编码模块314通过将蛋白质长度并入等位基因非相互作用变量wi中来表示源蛋白质或同种型的长度。
[0650] 在一个实例中,编码模块314通过将包括β1i、β2i、β5i次单元在内的免疫蛋白酶体特异性蛋白酶体次单元的平均表达水平并入等位基因非相互作用变量wi中来表示免疫蛋
白酶体的活化。
[0651] 在一个实例中,编码模块314通过将源蛋白质的丰度并入等位基因非相互作用变量wi中来表示肽的源蛋白质或肽的基因或转录本的RNA-Seq丰度(通过例如RSEM的技术,以
FPKM、TPM为单位定量)。
[0652] 在一个实例中,编码模块314通过将利用例如Rivas等人,Science,2015中的模型估计的肽的源转录本经历无义介导的衰变(NMD)的概率并入等位基因非相互作用变量wi中
来表示该概率。
[0653] 在一个实例中,编码模块314例如通过使用例如经RNA-Seq评定的路径中每个基因的RSEM,接着计算该路径中所有基因的概括统计量,例如平均值,以TPM为单位定量该路径
中基因的表达,以此表示基因模块或路径的活化状态。该平均值可以并入等位基因非相互
作用变量wi中。
[0654] 在一个实例中,编码模块314通过将拷贝数并入等位基因非相互作用变量wi中来表示源基因的拷贝数。
[0655] 在一个实例中,编码模块314通过将测量或预测的TAP结合亲和力(例如以纳摩尔浓度为单位)包括在等位基因非相互作用变量wi中来表示TAP结合亲和力。
[0656] 在一个实例中,编码模块314通过将利用RNA-seq测量(且通过例如RSEM以TPM为单位定量)的TAP表达水平包括在等位基因非相互作用变量wi中来表示TAP表达水平。
[0657] 在一个实例中,编码模块314在等位基因非相互作用变量wi中将肿瘤突变表示为指针变量的向量(即,如果肽pk来自具有KRAS G12D突变的样品,则dk=1,否则为0)。
[0658] 在一个实例中,编码模块314将抗原递呈基因中的生殖系多态性表示为指针变量的向量(即,如果肽pk来自在TAP中具有物种生殖系多态性的样品,则dk=1)。所述指针变量
可以包括在等位基因非相互作用变量wi中。
[0659] 在一个实例中,编码模块314经肿瘤类型(例如NSCLC、黑素瘤、结肠直肠癌等)的字母表将肿瘤类型表示为长度一独热编码的向量。这些独热编码的变量可以包括在等位基因
非相互作用变量wi中。
[0660] 在一个实例中,编码模块314通过用不同后缀处理4数字的HLA等位基因来表示MHC等位基因后缀。举例来说,出于该模型的目的,HLA-A*24:09N被视为与HLA-A*24:09不同的
等位基因。或者,由于以N后缀结尾的HLA等位基因不表达,因此可以将所有肽中经加N后缀
的MHC等位基因递呈的概率设定成零。
[0661] 在一个实例中,编码模块314经肿瘤亚型(例如肺腺癌、肺鳞状细胞癌等)的字母表将肿瘤亚型表示为长度一独热编码的向量。这些独热编码的变量可以包括在等位基因非相
互作用变量wi中。
[0662] 在一个实例中,编码模块314将抽烟史表示为二元指针变量(如果患者有抽烟史,则dk=1,否则为0),该变量可以包括在等位基因非相互作用变量wi中。或者,抽烟史可以经
抽烟严重程度的字母表编码为长度一独热编码的变量。举例来说,抽烟状态可以在1-5级量
表上评级,其中1级指示非抽烟者,且5级指示当前重度抽烟者。由于抽烟史主要与肺肿瘤相
关,因此当训练有关多个肿瘤类型的模型时,这种变量也可定义为当患者有抽烟史时等于1
并且肿瘤类型是肺肿瘤,否则为0。
[0663] 在一个实例中,编码模块314将晒伤史表示为二元指针变量(如果患者有重度晒伤k i
史,则d =1,否则为0),该变量可以包括在等位基因非相互作用变量w中。由于重度晒伤主
要与黑素瘤相关,因此当训练有关多个肿瘤类型的模型时,这个变量也可定义为当患者有
重度晒伤史时等于1并且肿瘤类型是黑素瘤,否则为0。
[0664] 在一个实例中,编码模块314通过使用参考数据库如TCGA将有关人基因组中各基因或转录本的特定基因或转录本表达水平分布表示为表达水平分布的概括统计量(例如平
均值、中值)。具体来说,对于肿瘤类型为黑素瘤的样品中的肽pk,不仅可以将肽pk的源基因
或转录本的经测量基因或转录本表达水平包括在等位基因非相互作用变量wi中,而且如通
过TCGA所测量的黑素瘤中肽pk的源基因或转录本的平均和/或中值基因或转录本表达水平
也包括在内。
[0665] 在一个实例中,编码模块314经突变类型(例如错义、移码、NMD诱导等)的字母表将突变类型表示为长度一独热编码的变量。所述独热编码的变量可以包括在等位基因非相互
作用变量wi中。
[0666] 在一个实例中,编码模块314在等位基因非相互作用变量wi中将蛋白质层面的蛋白质特征表示为批注值(例如5'UTR长度)。在另一实例中,编码模块314通过在等位基因非
相互作用变量wi中包括指针变量来表示肽pi的源蛋白质的残基层面的批注,如果肽pi与螺
旋基序重叠则等于1,否则等于0,或者如果肽pi完全包含在螺旋基序内则等于1。在另一实
例中,表示肽pi中包含在螺旋基序批注内的残基的比例的特征可以包括在等位基因非相互
作用变量wi中。
[0667] 在一个实例中,编码模块314将人蛋白质组中蛋白质或同种型的类型表示为指针向量ok,该向量的长度等于人蛋白质组中蛋白质或同种型的数量,并且如果肽pk来自蛋白质
i,则相应元素oki为1,否则为0。
[0668] 在一个实例中,编码模块314将肽pi的源基因G=基因(pi)表示为具有L个可能类别的分类变量,其中L表示索引的源基因1,2,…,L的数目的上限。
[0669] 编码模块314也可将有关肽pi和相关MHC等位基因h的变量zi的总体集合表示为行向量,其中等位基因相互作用变量xi和等位基因非相互作用变量wi的数字表示相继地串接。
i i i i
举例来说,编码模块314可以将zh表示为等于[xh w]或[Wi xh]的行向量。
[0670] X.训练模块
[0671] 训练模块316构建一个或多个递呈模型,所述模型产生肽序列是否会由与所述肽序列相关联的MHC等位基因递呈的可能性。具体来说,已知肽序列pk和与该肽序列pk相关联
k k
的一组MHC等位基因a ,每个递呈模型产生估计值uk,其指示该肽序列p将由相关MHC等位基
因ak中的一个或多个递呈的可能性。
[0672] X.A.综述
[0673] 训练模块316基于由存储于165中的递呈信息产生的存储于存储器170中的训练数据集构建该一个或多个递呈模型。一般来说,不管递呈模型的具体类型如何,所有所述递呈
模型均捕捉训练数据170中自变量与因变量之间的相关性以使损失函数减到最小。具体来
说,损失函数l(yi∈S,ui∈S;θ)表示训练数据170中一个或多个数据实例S的因变量yi∈S值与由递呈模型产生的数据实例S的估计可能性ui∈S之间的偏差。在本说明书其余部分通篇所提及
的一个特定实施方式中,损失函数(yi∈S,ui∈S;θ)是由以下等式(1a)提供的负对数可能性函数:
[0674]
[0675] 然而,实际上可以使用另一损失函数。举例来说,当对质谱离子电流进行预测时,损失函数是由以下等式1b提供的均方损失:
[0676]
[0677] 递呈模型可以是一种参数模型,其中一个或多个参数θ在数学上指明自变量与因变量之间的相关性。通常,使损失函数(yi∈S,ui∈S;θ)减到最小的参数型递呈模型的各种参数是经由基于梯度的数值优化算法,例如批量梯度算法、随机梯度算法等确定的。或者,递
呈模型可以是一种非参数模型,其中模型结构由训练数据170决定且并不严格基于固定参
数集合。
[0678] X.B.独立等位基因模型
[0679] 训练模块316可以在独立等位基因基础上构建递呈模型以预测肽的递呈可能性。在这种情况下,训练模块316可以基于由表达单一MHC等位基因的细胞产生的训练数据170
中的数据实例S训练递呈模型。
[0680] 在一个实施方式中,训练模块316通过下式使特定等位基因h对于肽pk的估计递呈可能性uk模型化:
[0681]
[0682] 其中肽序列xhk表示肽pk和相应MHC等位基因h的编码等位基因相互作用变量,f(·)是任何函数且为便于说明,在本文通篇称为变换函数。另外,gh(·)是任何函数,为便
于说明,在本文通篇称为依赖性函数(dependency function),并且基于所测定的MHC等位
基因h的一组参数θh产生对于等位基因相互作用变量xhk的依赖性评分。有关各MHC等位基因
h的参数集合θh的值可以通过使有关θh的损失函数减到最小来测定,其中i是由表达单一MHC
等位基因h的细胞产生的训练数据170的子集S中的每一实例。
[0683] 依赖性函数gh(xhk;θh)的输出值表示至少基于等位基因相互作用特征xhk,且特定言之,基于肽pk的肽序列中的氨基酸位置的针对MHC等位基因h的依赖性评分,其指示MHC等
位基因h是否会存在于相应新抗原中。举例来说,如果MHC等位基因h可能递呈肽pk,则有关
MHC等位基因h的依赖性评分可以具有较高值,而如果不可能递呈,则可能具有较低值。变换
函数f(·)将输入变换成,且更确切地说,在这种情况下将由gh(xhk;θh)产生的依赖性评分
变换成适当值以指示肽pk会被MHC等位基因递呈的可能性。
[0684] 在本说明书其余部分通篇提及的一个特定实施方式中,f(·)是对于适当域范围具有在[0,1]内的范围的函数。在一个实例中,f(·)是由以下提供的expit函数:
[0685]
[0686] 作为另一实例,当域z的值等于或大于0时,f(·)也可以是由以下提供的双曲正切函数:
[0687] f(z)=tanh(z)    (5)
[0688] 或者,当质谱离子电流的预测值超出范围[0,1]时,f(·)可以是任何函数,例如恒等函数、指数函数、对数函数等。
[0689] 因此,可以通过将有关MHC等位基因h的依赖性函数gh(·)应用于肽序列pk的经编码形式以产生相应依赖性评分来产生肽序列pk会被MHC等位基因h递呈的独立等位基因可
能性。依赖性评分可以通过变换函数f(·)变换以产生肽序列pk会被MHC等位基因h递呈的
独立等位基因可能性。
[0690] X.B.1有关等位基因相互作用变量的依赖性函数
[0691] 在本说明书通篇提及的一个特定实施方式中,依赖性函数gh(·)是由下式提供的仿射函数:
[0692]
[0693] 该函数将xhk中的每个等位基因相互作用变量与所测定的相关MHC等位基因h的参数集合θh中的相应参数线性地组合。
[0694] 在本说明书通篇提及的另一特定实施方式中,依赖性函数gh(·)是由下式提供的网络函数:
[0695]
[0696] 以具有布置在一个或多个层中的一系列节点的网络模型NNh(·)表示。一个节点可以经由连接来连接至其它节点,所述连接各自在参数集合θh中具有相关参数。在一个特
定节点处的值可以表示为通过与该特定节点相关联的激发函数所映像的相关参数加权的
连接至该特定节点的节点的值的总和。与仿射函数相比,由于递呈模型可以并入具有不同
氨基酸序列长度的非线性及工艺数据,因此网络模型是有利的。具体来说,通过非线性建
模,网络模型可以捕捉在肽序列中不同位置处的氨基酸之间的相互作用以及这种相互作用
如何影响肽递呈。
[0697] 一般来说,网络模型NNh(·)可以经结构化为前馈网络,例如人工神经网络(ANN)、回旋神经网络(CNN)、深度神经网络(DNN),和/或循环网络,例如长短期记忆网络(LSTM)、双
向循环网络、深度双向循环网络等。
[0698] 在本说明书其余部分通篇所提及的一个实例中,h=1,2,…,m中的每个MHC等位基因与独立网络模型相关,并且NNh(·)表示来自与MHC等位基因h相关联的网络模型的输出。
[0699] 图5示出与任意MHC等位基因h=3相关的示例网络模型NN3(·)。如图5中所示,关于MHC等位基因h=3的网络模型NN3(·)包括在层l=1处的三个输入节点、在层l=2处的四
个节点、在层l=3处的两个节点和在层l=4处的一个输出节点。网络模型NN3(·)与一组十
个参数θ3(1),θ3(2),…,θ3(10)相关。网络模型NN3(·)接受关于MHC等位基因h=3的三个等
位基因相互作用变量x3k(1)、x3k(2)和x3k(3)的输入值(包括经编码的多肽序列数据和所用
任何其它训练数据的个别数据实例)且输出值NN3(x3k)。网络函数还可以包括一个或多个网
络模型,每个模型以不同的等位基因相互作用变量作为输入。
[0700] 在另一实例中,经鉴定的MHC等位基因h=1,2,…,m与单一网络模型NNH(·)相关联,并且NNh(·)表示与MHC等位基因h相关联的单一网络模型的一个或多个输出。在此类实
例中,参数集合θh可以对应于该单一网络模型的一组参数,且因此,参数集合θh可以为所有
MHC等位基因所共享。
[0701] 图6A示出MHC等位基因h=1,2,…,m共享的示例网络模型NNH(·)。如图6A中所示,该网络模型NNH(·)包括m个输出节点,各自对应于MHC等位基因。网络模型NN3(·)接受有关
MHC等位基因h=3的等位基因相互作用变量x3k并输出m个值,包括对应于MHC等位基因h=3
的值NN3(x3k)。
[0702] 在又一实例中,单一网络模型NNH(·)可以是在已知MHC等位基因h的等位基因相k
互作用变量xh 和经编码的蛋白质序列dh情况下,输出依赖性评分的网络模型。在此类实例
中,参数集合θh可以再次对应于单一网络模型的一组参数,且因此,参数集合θh可以为所有
MHC等位基因所共享。因此,在此类实例中,NNh(·)可以表示在该单一网络模型的输入[xhk 
dh]已知情况下,该单一网络模型NNH(·)的输出。由于训练数据中未知的MHC等位基因的肽
递呈概率只能通过鉴定其蛋白质序列进行预测,因此这种网络模型是有利的。
[0703] 图6B示出MHC等位基因共享的示例网络模型NNH(·)。如图6B中所示,网络模型NNH(·)接受MHC等位基因h=3的等位基因相互作用变量和蛋白质序列作为输入,且输出对应
于MHC等位基因h=3的依赖性评分NN3(x3k)。
[0704] 在又一实例中,依赖性函数gh(·)可以表示为:
[0705]
[0706] 其中g'h(xhk;θ'h)是具有一组参数θ'h的仿射函数、网络函数等,其中有关MHC等位0
基因的等位基因相互作用变量的参数集合中的偏差参数θh表示MHC等位基因h的基线递呈
概率。
[0707] 在另一实施方式中,偏差参数θh0可以为MHC等位基因h的基因家族所共享。也就是说,MHC等位基因h的偏差参数θh0可以等于θ基因(h)0,其中基因(h)是MHC等位基因h的基因家族。举例来说,I类MHC等位基因HLA-A*02:01、HLA-A*02:02和HLA-A*02:03可以指定给“HLA-
A”基因家族,并且这些MHC等位基因中的每一个的偏差参数θh0可以是共享的。作为另一个实
例,II类MHC等位基因HLA-DRB1:10:01、HLA-DRB1:11:01和HLA-DRB3:01:01可以指定给
“HLA-DRB”基因家族,并且这些MHC等位基因中的每一个的偏差参数θh0可以是共享的。
[0708] 再回到等式(2),作为一个实例,在使用仿射依赖性函数gh(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=3递呈的可能性可以由下式产生:
[0709]
[0710] 其中x3k是所鉴定的MHC等位基因h=3的等位基因相互作用变量,并且θ3是通过损失函数最小化测定的MHC等位基因h=3的参数集合。
[0711] 作为另一实例,在使用独立网络变换函数gh(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=3递呈的可能性可以通过下式产生:
[0712]
[0713] 其中x3k是所鉴定的MHC等位基因h=3的等位基因相互作用变量,并且θ3是所测定的与MHC等位基因h=3相关联的网络模型NN3(·)的参数集合。
[0714] 图7示出使用示例网络模型NN3(·)产生与MHC等位基因h=3相关联的肽pk的递呈可能性。如图7中所示,网络模型NN3(·)接受有关MHC等位基因h=3的等位基因相互作用变
量x3k并产生输出NN3(x3k)。该输出被函数f(·)映像以产生估计的递呈可能性uk。
[0715] X.B.2.具有等位基因非相互作用变量的独立等位基因
[0716] 在一个实施方式中,训练模块316并入等位基因非相互作用变量且通过下式使肽pk的估计递呈可能性uk模型化:
[0717]
[0718] 其中wk表示关于肽pk的经编码等位基因非相互作用变量,gw(·)是基于所测定的等位基因非相互作用变量wk的一组参数θw的有关等位基因非相互作用变量的函数。具体来
说,有关各MHC等位基因h的参数集合θh和有关等位基因非相互作用变量的参数集合θw的值
可以通过使关于θh及θw的损失函数减到最小来测定,其中i是由表达单一MHC等位基因的细
胞产生的训练数据170的子集S中的每一实例。
[0719] 依赖性函数gw(wk;θw)的输出表示基于等位基因非相互作用变量的影响进行的等k
位基因非相互作用变量的依赖性评分,其指示肽p是否会被一个或多个MHC等位基因递呈。
举例来说,如果肽pk与已知会积极地影响肽pk的递呈的C端侧接序列相关,则等位基因非相
互作用变量的依赖性评分可能具有较高值,并且如果肽pk与已知会不利地影响肽pk的递呈
的C端侧接序列相关,则可能具有较低值。
[0720] 根据等式(8),肽序列pk会被MHC等位基因h递呈的独立等位基因可能性可以通过将有关MHC等位基因h的函数gh(·)应用于肽序列pk的经编码形式以产生等位基因相互作用
变量的相应依赖性评分来产生。有关等位基因非相互作用变量的函数gw(·)也应用于等位
基因非相互作用变量的经编码形式以产生等位基因非相互作用变量的依赖性评分。将两个
k
评分合并,并且通过变换函数f(·)变换该合并的评分以产生肽序列p会被MHC等位基因h
递呈的独立等位基因可能性。
[0721] 或者,训练模块316可以通过将等位基因非相互作用变量wk添加至等式(2)中的等位基因相互作用变量xhk中而在预测值中包括等位基因非相互作用变量wk。因此,递呈可能
性可以通过下式得到:
[0722]
[0723] X.B.3有关等位基因非相互作用变量的依赖性函数
[0724] 与有关等位基因相互作用变量的依赖性函数gh(·)类似,有关等位基因非相互作用变量的依赖性函数gw(·)可以是仿射函数或网络函数,其中独立网络模型与等位基因非
相互作用变量wk相关联。
[0725] 具体来说,依赖性函数gw(·)是由下式提供的仿射函数:
[0726] gw(wk;θw)=wk·θw,
[0727] 该函数将等位基因非相互作用变量wk与参数集合θw中的相应参数线性地组合。
[0728] 依赖性函数gw(·)也可为由下式提供的网络函数:
[0729] gh(wk;θw)=NNw(wk;θw),
[0730] 其由具有参数集合θw中的相关参数的网络模型NNw(·)表示。网络函数还可以包括一个或多个网络模型,每个网络模型采用不同的等位基因非交互变量作为输入。
[0731] 在另一实例中,有关等位基因非相互作用变量的依赖性函数gw(·)可以由下式提供:
[0732]
[0733] 其中g'w(wk;θ'w)是仿射函数、具有等位基因非相互作用参数集合θ'w的网络函数等,mk是肽pk的mRNA定量测量值,h(·)是变换该定量测量值的函数,并且θwm是有关等位基
因非相互作用变量的参数集合中的参数,其与该mRNA定量测量值组合以产生mRNA定量测量
值的依赖性评分。在本说明书其余部分通篇提及的一个特定实施方案中,h(·)是对数函
数,然而,实际上,h(·)可以是多种不同函数中的任一种。
[0734] 在又一实例中,有关等位基因非相互作用变量的依赖性函数gw(·)可以由下式提供:
[0735]
[0736] 其中g'w(wk;θ'w)是仿射函数、具有等位基因非相互作用参数集合θ'w的网络函数k k o
等,o 是以上描述的表示人蛋白质组中有关肽p的蛋白质和同种型的指针向量,并且θw 是
与指针向量组合的有关等位基因非相互作用变量的参数集合中的一组参数。在一种变化形
式中,当ok的维度及参数集合θwo明显较高时,可以在测定参数值时将参数正则项如
添加至损失函数中,其中||·||表示L1范数、L2范数、组合等。超参数λ的最佳值可以通过适
当方法确定。
[0737] 在另一实例中,有关等位基因非相互作用变量的依赖性函数gw(·)可以由下式提供:
[0738]
[0739] 其中g'w(wk;θ'w)是仿射函数、具有等位基因非相互作用参数集合θ'w的网络函数等,(基因(pk=l))是指针函数,如果肽pk是来自如上文关于等位基因非相互作用变量所
述的源基因l,则其等于1,并且θwl是指示源基因l的“抗原性”的参数。在一种变化形式中,当L明显较高并且因此参数数量θwl=1,2,…,L明显较高时,可以在测定参数值时将参数正则项如添加至损失函数中,其中||·||表示L1范数、L2范数、组合等。超参数λ的最佳值
可以通过适当方法确定。
[0740] 实际上,可以将等式(10)、(11)和(12)中的任一个的附加项组合以生成有关等位基因非相互作用变量的依赖性函数gw(·)。举例来说,可以将等式(10)中表示mRNA定量测
量的术语h(·)和等式(12)中表示源基因抗原性的术语与任何其它仿射或网络函数一起相
加,以生成有关等位基因非相互作用变量的依赖性函数。
[0741] 再回到等式(8),作为一个实例,在使用仿射变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=3递呈的可能性可以由下式产生:
[0742]
[0743] 其中wk是所鉴定的有关肽pk的等位基因非相互作用变量,并且θw是所测定的等位基因非相互作用变量的参数的集合。
[0744] 作为另一实例,在使用网络变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基k
因中,肽p会被MHC等位基因h=3递呈的可能性可以通过下式产生:
[0745]
[0746] 其中wk是所鉴定的有关肽pk的等位基因相互作用变量,并且θw是所测定的等位基因非相互作用变量的参数的集合。
[0747] 图8示出使用示例网络模型NN3(·)和NNw(·)产生与MHC等位基因h=3相关联的肽k
p的递呈可能性。如图8中所示,网络模型NN3(·)接受有关MHC等位基因h=3的等位基因相
互作用变量x3k并产生输出NN3(x3k)。网络模型NNw(·)接受有关肽pk的等位基因非相互作用
变量wk并产生输出NNw(wk)。将所述输出合并且通过函数f(·)映像以产生估计递呈可能性
uk。
[0748] X.C.多等位基因模型
[0749] 训练模块316也可在存在两个或更多个MHC等位基因的多等位基因环境中构建递呈模型以预测肽的递呈可能性。在这种情况下,训练模块316可以基于由表达单一MHC等位
基因的细胞、表达多个MHC等位基因的细胞或其组合产生的训练数据170中的数据实例S训
练递呈模型。
[0750] X.C.1.实施例1:独立等位基因模型的最大值
[0751] 在一个实施方式中,训练模块316使与一组多个等位基因H相关联的肽pk的估计递呈可能性uk随基于表达单等位基因的细胞所测定的集合H中每一MHC等位基因h的递呈可能
性ukh∈H的变化模型化,如上文结合等式(2)-(11)所描述。具体来说,递呈可能性uk可以是ukh∈H的任何函数。在一个实施方式中,如等式(12)中所示,该函数是最大函数,并且递呈可能
性uk可以测定为集合H中每一MHC等位基因h的递呈可能性最大值。
[0752]
[0753] X.C.2.实施例2.1:总和函数模型
[0754] 在一个实施方式中,训练模块316通过下式使肽pk的估计递呈可能性uk模型化:
[0755]
[0756] 其中元素ahk对于与肽序列pk相关联的多个MHC等位基因H为1并且xhk表示编码的有关肽pk和相应MHC等位基因的等位基因相互作用变量。有关每一MHC等位基因h的参数集合θh
的值可以通过使关于θh的损失函数减到最小来测定,其中i由表达单一MHC等位基因的细胞
和/或表达多个MHC等位基因的细胞产生的训练数据170的子集S中的每个实例。依赖性函数
gh可以呈以上X.B.1部分中介绍的依赖性函数gh中的任一种的形式。
[0757] 根据等式(13),肽序列pk会被一个或多个MHC等位基因h递呈的递呈可能性可以通过将依赖性函数gh(·)应用于有关MHC等位基因H中的每一个的肽序列pk的经编码形式以产
生等位基因相互作用变量的相应评分来产生。将每个MHC等位基因h的评分合并,且通过变
换函数f(·)变换以产生肽序列pk会被MHC等位基因集合H递呈的递呈可能性。
[0758] 等式(13)的递呈模型与等式(2)的独立等位基因模型的不同之处在于,每个肽pk的相关等位基因的数量可以大于1。换句话说,对于与肽序列pk相关联的多个MHC等位基因
H,ahk中多于一个元素的值可以为1。
[0759] 例如,在使用仿射变换函数gh(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0760]
[0761] 其中x2k、x3k是鉴定的有关MHC等位基因h=2、h=3的等位基因相互作用变量,并且θ2、θ3是测定的有关MHC等位基因h=2、h=3的参数集合。
[0762] 作为另一实例,在使用网络变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基k
因中,肽p会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0763]
[0764] 其中NN2(·)、NN3(·)是鉴定的有关MHC等位基因h=2、h=3的网络模型,并且θ2、θ3是所测定的有关MHC等位基因h=2、h=3的参数集合。
[0765] 图9示出使用示例网络模型NN2(·)和NN3(·)产生与MHC等位基因h=2、h=3相关联的肽pk的递呈可能性。如图9中所示,网络模型NN2(·)接受有关MHC等位基因h=2的等位
基因相互作用变量x2k并产生输出NN2(x2k),并且网络模型NN3(·)接受有关MHC等位基因h=
3的等位基因相互作用变量x3k并产生输出NN3(x3k)。将所述输出合并且通过函数f(·)映像
以产生估计递呈可能性uk。
[0766] X.C.3.实施例2.2:利用等位基因非相互作用变量的总和函数模型
[0767] 在一个实施方式中,训练模块316并入等位基因非相互作用变量且通过下式使肽pk的估计递呈可能性uk模型化:
[0768]
[0769] 其中wk表示编码的有关肽pk的等位基因非相互作用变量。具体来说,有关每一MHC等位基因h的参数集合θh和有关等位基因非相互作用变量的参数集合θw的值可以通过使关
于θh和θw的损失函数减到最小来测定,其中i是由表达单一MHC等位基因的细胞和/或表达多
个MHC等位基因的细胞产生的训练数据170的子集S中的每一实例。依赖性函数gw可以呈以
上X.B.3部分中介绍的依赖性函数gw中的任一种的形式。
[0770] 因此,根据等式(14),肽序列pk会被一个或多个MHC等位基因H递呈的递呈可能性可以通过将函数gh(·)应用于有关MHC等位基因H中的每一个的肽序列pk的经编码形式以产
生有关每个MHC等位基因h的等位基因相互作用变量的相应依赖性评分来产生。有关等位基
因非相互作用变量的函数gw(·)也应用于等位基因非相互作用变量的经编码形式以产生
等位基因非相互作用变量的依赖性评分。将所述评分合并,且通过变换函数f(·)变换该合
并的评分以产生肽序列pk会被MHC等位基因H递呈的递呈可能性。
[0771] 在等式(14)的递呈模型中,每个肽pk的相关等位基因的数量可以大于1。换句话说,对于与肽序列pk相关联的多个MHC等位基因H,ahk中多于一个元素的值可以为1。
[0772] 例如,在使用仿射变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0773]
[0774] 其中wk是所鉴定的有关肽pk的等位基因非相互作用变量,并且θw是所测定的等位基因非相互作用变量的参数的集合。
[0775] 作为另一实例,在使用网络变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0776]
[0777] 其中wk是所鉴定的有关肽pk的等位基因相互作用变量,并且θw是所测定的等位基因非相互作用变量的参数的集合。
[0778] 图10示出使用示例网络模型NN2(·)、NN3(·)和NNw(·)产生与MHC等位基因h=2、h=3相关联的肽pk的递呈可能性。如图10中所示,网络模型NN2(·)接受有关MHC等位基因h
=2的等位基因相互作用变量x2k并产生输出NN2(x2k)。网络模型NN3(·)接受有关MHC等位基
因h=3的等位基因相互作用变量x3k并产生输出NN3(x3k)。网络模型NNw(·)接受有关肽pk的
等位基因非相互作用变量wk并产生输出NNw(wk)。将所述输出合并且通过函数f(·)映像以
产生估计递呈可能性uk。
[0779] 或者,训练模块316可以通过在等式(15)中将等位基因非相互作用变量wk添加至等位基因相互作用变量xhk而在预测值中包括等位基因非相互作用变量wk。因此,递呈可能
性可以通过下式提供:
[0780]
[0781] X.C.4.实施例3.1:使用隐式独立等位基因可能性的模型
[0782] 在另一实施方式中,训练模块316通过下式使肽pk的估计递呈可能性uk模型化:
[0783]
[0784] 其中元素ahk对于与肽序列pk相关联的多个MHC等位基因h∈H为1,u'kh是MHC等位基因h的隐式独立等位基因递呈可能性,向量v是元素vh对应于ahk·u'kh的向量,s(·)是映像
元素v的函数,并且r(·)是限幅函数(clipping function),其将输入值削减至给定范围
中。如以下更详细地描述,s(·)可以是求和函数或二阶函数,但应了解,在其它实施方案
中,s(·)可以是任何函数,例如最大函数。有关隐式独立等位基因可能性的参数集合θ的值
可以通过使关于θ的损失函数减到最小来测定,其中i是由表达单一MHC等位基因的细胞和/
或表达多个MHC等位基因的细胞产生的训练数据170的子集S中的每个实例。
[0785] 使等式(17)的递呈模型中的递呈可能性随各自对应于肽pk会被个别MHC等位基因h递呈的可能性的隐式独立等位基因递呈可能性u'kh的变化模型化。隐式独立等位基因可能
性与X.B部分的独立等位基因递呈可能性的不同之处在于,隐式独立等位基因可能性参数
可以从多等位基因环境习得,其中除单等位基因环境外,经递呈的肽与相应MHC等位基因之
间的直接关联也是未知的。因此,在多等位基因环境中,递呈模型不仅可以估计肽pk是否会
被作为整体的一组MHC等位基因H递呈,而且也可提供指示最可能递呈肽pk的MHC等位基因h
的个别可能性u'kh∈H。其优势在于,递呈模型可以在不存在有关表达单一MHC等位基因的细
胞的训练数据情况下产生隐式可能性。
[0786] 在本说明书其余部分通篇提及的一个特定实施方式中,r(·)是具有范围[0,1]的函数。举例来说,r(·)可以是限幅函数:
[0787] r(z)=min(max(z,0),1),
[0788] 其中选择z与1之间的最小值作为递呈可能性uk。在另一实施方式中,当域z的值等于或大于0时,r(·)是由下式提供的双曲正切函数:
[0789] r(z)=tanh(z)。
[0790] X.C.5.实施例3.2:函数总和模型
[0791] 在一个特定实施方式中,s(·)是求和函数,并且递呈可能性通过对隐式独立等位基因递呈可能性求和得到:
[0792]
[0793] 在一个实施方式中,MHC等位基因h的隐式独立等位基因递呈可能性通过下式产生:
[0794]
[0795] 由此通过下式估计出递呈可能性:
[0796]
[0797] 根据等式(19),肽序列pk会被一个或多个MHC等位基因H递呈的递呈可能性可以通过将函数gh(·)应用于有关MHC等位基因H中的每一个的肽序列pk的经编码形式以产生等位
基因相互作用变量的相应依赖性评分来产生。每个依赖性评分先通过函数f(·)变换以产
生隐式独立等位基因递呈可能性u'kh。将独立等位基因可能性u'kh合并,并且可以将限幅函
数应用于该合并的可能性以将值削减至范围[0,1]中以产生肽序列pk会被MHC等位基因集
合H递呈的递呈可能性。依赖性函数gh可以呈以上X.B.1部分中介绍的依赖性函数gh中的任
一种的形式。
[0798] 例如,在使用仿射变换函数gh(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0799]
[0800] 其中x2k、x3k是鉴定的有关MHC等位基因h=2、h=3的等位基因相互作用变量,并且θ2、θ3是测定的有关MHC等位基因h=2、h=3的参数集合。
[0801] 作为另一实例,在使用网络变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0802]
[0803] 其中NN2(·)、NN3(·)是鉴定的有关MHC等位基因h=2、h=3的网络模型,并且θ2、θ3是所测定的有关MHC等位基因h=2、h=3的参数集合。
[0804] 图11示出使用示例网络模型NN2(·)和NN3(·)产生与MHC等位基因h=2、h=3相关联的肽pk的递呈可能性。如图9中所示,网络模型NN2(·)接受有关MHC等位基因h=2的等位
基因相互作用变量x2k并产生输出NN2(x2k),并且网络模型NN3(·)接受有关MHC等位基因h=
3的等位基因相互作用变量x3k并产生输出NN3(x3k)。每个输出均通过函数f(·)映像且合并
以产生估计递呈可能性uk。
[0805] 在另一实施方式中,当对质谱离子电流的对数进行预测时,r(·)是对数函数并且f(·)是指数函数。
[0806] X.C.6.实施例3.3:利用等位基因非相互作用变量的函数总和模型
[0807] 在一个实施方式中,MHC等位基因h的隐式独立等位基因递呈可能性通过下式产生:
[0808]
[0809] 由此通过下式产生递呈可能性:
[0810]
[0811] 以并入等位基因非相互作用变量对肽递呈的影响。
[0812] 根据等式(21),肽序列pk会被一个或多个MHC等位基因H递呈的递呈可能性可以通过将函数gh(·)应用于有关MHC等位基因H中的每一个的肽序列pk的经编码形式以产生有关
每个MHC等位基因h的等位基因相互作用变量的相应依赖性评分来产生。有关等位基因非相
互作用变量的函数gw(·)也应用于等位基因非相互作用变量的经编码形式以产生等位基
因非相互作用变量的依赖性评分。将等位基因非相互作用变量的评分与等位基因相互作用
变量的依赖性评分中的每一个合并。通过函数f(·)变换每一合并的评分以产生隐式独立
等位基因递呈可能性。将隐式可能性合并,并且可以将限幅函数应用于该合并的输出以将
k
值削减至范围[0,1]中以产生肽序列p会被MHC等位基因H递呈的递呈可能性。依赖性函数gw
可以呈以上X.B.3部分中介绍的依赖性函数gw中的任一种的形式。
[0813] 举例来说,在使用仿射变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基因中,肽pk会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0814]
[0815] 其中wk是所鉴定的有关肽pk的等位基因非相互作用变量,并且θw是所测定的等位基因非相互作用变量的参数的集合。
[0816] 作为另一实例,在使用网络变换函数gh(·)、gw(·)鉴定的m=4种不同MHC等位基k
因中,肽p会被MHC等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0817]
[0818] 其中wk是所鉴定的有关肽pk的等位基因相互作用变量,并且θw是所测定的等位基因非相互作用变量的参数的集合。
[0819] 图12示出使用示例网络模型NN2(·)、NN3(·)和NNw(·)产生与MHC等位基因h=2、h=3相关联的肽pk的递呈可能性。如图12中所示,网络模型NN2(·)接受有关MHC等位基因h
=2的等位基因相互作用变量x2k并产生输出NN2(x2k)。网络模型NNw(·)接受有关肽pk的等
位基因非相互作用变量wk并产生输出NNw(wk)。将输出合并且通过函数f(·)映像。网络模型
NN3(·)接受有关MHC等位基因h=3的等位基因相互作用变量x3k并产生输出NN3(x3k),再次
将该输出与相同网络模型NNw(·)的输出NNw(wk)合并且通过函数f(·)映像。将两个输出合
并以产生估计递呈可能性uk。
[0820] 在另一实施方式中,MHC等位基因h的隐式独立等位基因递呈可能性通过下式产生:
[0821]
[0822] 由此通过下式产生递呈可能性:
[0823]
[0824] X.C.7.实施例4:二阶模型
[0825] 在一个实施方式中,s(·)是二阶函数,并且肽pk的估计递呈可能性uk通过下式提供:
[0826]
[0827] 其中元素u'kh是MHC等位基因h的隐式独立等位基因递呈可能性。有关隐式独立等位基因可能性的参数集合θ的值可以通过使关于θ的损失函数减到最小来测定,其中i是由
表达单一MHC等位基因的细胞和/或表达多个MHC等位基因的细胞产生的训练数据170的子
集S中的每个实例。隐式独立等位基因递呈可能性可以呈以上描述的等式(18)、(20)和(22)
中所示的任何形式。
[0828] 在一个方面,等式(23)的模型可以暗示存在肽pk会同时被两个MHC等位基因递呈的可能,其中两个HLA等位基因的递呈在统计学上是独立的。
[0829] 根据等式(23),肽序列pk会被一个或多个MHC等位基因H递呈的递呈可能性可以通过组合隐式独立等位基因递呈可能性并且从总和中减去每对MHC等位基因将同时递呈肽pk
的可能性以产生肽序列pk会被MHC等位基因H递呈的递呈可能性来产生。
[0830] 例如,在使用仿射变换函数gh(·)鉴定的m=4种不同HLA等位基因中,肽pk会被HLA等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0831]
[0832] 其中x2k、x3k是鉴定的有关HLA等位基因h=2、h=3的等位基因相互作用变量,并且θ2、θ3是测定的有关HLA等位基因h=2、h=3的参数集合。
[0833] 作为另一实例,在使用网络变换函数gh(·)、gw(·)鉴定的m=4种不同HLA等位基因中,肽pk会被HLA等位基因h=2、h=3递呈的可能性可以通过下式产生:
[0834]
[0835] 其中NN2(·)、NN3(·)是所鉴定的有关HLA等位基因h=2、h=3的网络模型,并且θ2、θ3是测定的有关HLA等位基因h=2、h=3的参数集合。
[0836] XI.A实施例5:预测模块
[0837] 预测模块320接受序列数据并使用递呈模型选择序列数据中的候选新抗原。具体来说,序列数据可以是从患者的肿瘤组织细胞提取的DNA序列、RNA序列和/或蛋白质序列。
预测模块320将序列数据处理成多个具有8-15个氨基酸(对于MHC-I)或6-30个氨基酸(对于
MHC-II)的肽序列pk。举例来说,预测模块320可以将给定序列“IEFROEIFJEF”处理成三个具
有9个氨基酸的肽序列,即“IEFROEIFJ”、“EFROEIFJE”和“FROEIFJEF”。在一个实施方案中,预测模块320可以通过将从患者的正常组织细胞提取的序列数据与从患者的肿瘤组织细胞
提取的序列数据相比较以鉴定含有一个或多个突变的部分,由此鉴定出呈突变肽序列的候
选新抗原。
[0838] 递呈模块320将一个或多个递呈模型应用于经处理的肽序列以估计所述肽序列的递呈可能性。具体来说,预测模块320可以通过将递呈模型应用于候选新抗原来选择一个或
多个可能在肿瘤HLA分子上递呈的候选新抗原肽序列。在一个实施方式中,递呈模块320选
出估计递呈可能性超过预定阈值的候选新抗原序列。在另一实施方式中,递呈模型选出N个
具有最高估计递呈可能性的候选新抗原序列(其中N一般是可以在疫苗中递送的最大表位
数量)。包括选择用于给定患者的候选新抗原的疫苗可以注射至患者体内以诱导免疫应答。
[0839] XI.B.实施例6:盒设计模块
[0840] XI.B.1综述
[0841] 盒设计模块324基于v个选择用于注射至患者体内的候选肽产生疫苗盒序列。具体来说,对于纳入容量v的疫苗中的一组所选肽pk(k=1,2,…,v),盒序列通过串接一系列治
k k
疗性表位序列p'(k=1,2,…,v)来提供,所述表位序列各自包括相应肽p的序列。在一个实
施方案中,盒设计模块324可以直接彼此相邻地串接表位。举例来说,疫苗盒C可以表示为:
[0842]
[0843] 其中p'ti表示该盒的第i个表位。因此,ti对应于在该盒第i位处所选肽的指数k=1,2,…,v。在另一个实施方案中,盒设计模块324可以在相邻表位之间用一个或多个任选的
接头序列串接表位。举例来说,疫苗盒C可以表示为:
[0844]
[0845] 其中l(ti,tj)表示置放于该盒的第i个表位p'ti与第j=i+1个表位p'j=i+1之间的接头序列。盒设计模块324确定在该盒不同位置处布置的所选表位p'k(k=1,2,…,v),以及置
放于所述表位之间的任何接头序列。可以基于本说明书中所描述的方法中的任一种装载盒
序列C作为疫苗。
[0846] 在一个实施方案中,可以基于由预测模块320确定的与超过预定阈值的递呈可能性相关联的所选肽产生治疗性表位集合,其中所述递呈可能性由递呈模型测定。然而,应了
解,在其它实施方案中,可以基于多种方法中的任一种或多种(单独或组合形式),例如基于
针对患者的I类或II类HLA等位基因的结合亲和力或预测的结合亲和力、针对患者的I类或
II类HLA等位基因的结合稳定性或预测的结合稳定性、随机取样等产生治疗性表位的集合。
[0847] 在一个实施方案中,治疗性表位p'k可以对应于所选肽pk本身。在另一个实施方案中,除所选肽外,治疗性表位p'k还可包括C端和/或N端侧接序列。举例来说,盒中所包括的
表位p'k可以表示为序列[nk pk ck],其中ck是连接所选肽pk的C端的C端侧接序列,并且nk是
连接至所选肽pk的N端的N端侧接序列。在本说明书其余部分通篇提及的一个实例中,N端和
C端侧接序列是处于源蛋白质环境中的治疗性疫苗表位的原生N端和C端侧接序列。在本说
明书其余部分通篇提及的一个实例中,治疗性表位p'k表示固定长度的表位。在另一实例
中,治疗性表位p'k可以表示可变长度的表位,其中表位的长度可以取决于例如C-或N-侧接
序列的长度而变化。举例来说,C端侧接序列ck和N端侧接序列nk各自可具有2-5个残基的变
k
化的长度,由此产生16种可能的表位p'选择。
[0848] 在一个实施方案中,盒设计模块324通过考虑横跨该盒中一对治疗性表位之间的接合点的接合点表位的递呈来产生盒序列。接合点表位由于在该盒中串接治疗性表位和接
头序列的过程而在该盒中产生的新颖非自身但不相关的表位序列。接合点表位的新颖序列
ti tj ti tj
不同于该盒的治疗性表位本身。跨越表位p' 和p' 的接合点表位可以包括与p' 或p' 重
叠且不同于治疗性表位p'ti和p'tj本身的序列的任何表位序列。具体来说,在存在或不存在
任选接头序列l(ti,tj)的情况下,该盒的表位p'ti与相邻表位p'tj之间的接合点各自可以与
n(ti,tj)接合点表位en(ti,tj)(n=1,2,…,n(ti,tj))相关联。接合点表位可以是与表位p'ti和p'tj两者至少部分重叠的序列,或者可以是与置放于表位p'ti与p'tj之间的接头序列至少部分
重叠的序列。接合点表位可以通过I类MHC、II类MHC或两者递呈。
[0849] 图38显示两个示例盒序列:盒1(C1)和盒2(C2)。每个盒具有v=2的疫苗容量,并且包括治疗性表位p't1=p1=SINFEKL和p't2=p2=LLLLLVVVV,以及在该两个表位之间的接头
序列l(t1,t2)=AAY。具体来说,盒C1的序列通过[p1 l(t1,t2)p2]提供,而盒C2的序列通过[p2 l(t1,t2)p1]提供。盒C1的示例接合点表位en(1,2)可以是横跨该盒中的表位p'1和p'2两者的序列,例如EKLAAYLLL、KLAAYLLLLL和FEKLAAYL,并且可以是横跨该盒中的接头序列和单一所选表
位的序列,例如AAYLLLLL和YLLLLLVVV。类似地,盒C2的示例接合点表位em(2,1)可以是例如
VVVVAAYSIN、VVVVAAY和AYSINFEK的序列。尽管两个盒涉及相同序列p1,l(c1,c2)和p2集合,但
所鉴定的接合点表位集合取决于该盒内治疗性表位的有序序列而不同。
[0850] 在一个实施方案中,盒设计模块324产生降低在患者中递呈接合点表位的可能性的盒序列。具体来说,当将盒注射至患者体内时,接合点表位有可能被患者的HLA I类或HLA 
II类等位基因递呈,并且分别刺激CD8或CD4 T细胞反应。由于T细胞与接合点表位的反应没
有治疗益处,且可能因抗原竞争而减弱针对该盒中所选治疗性表位的免疫应答,故此类反
应常常是不合需要的。76在一个实施方案中,盒设计模块324迭代一个或多个候选盒,且确定
与盒序列相关联的接合点表位的递呈评分低于数字阈值的盒序列。接合点表位递呈评分是
与该盒中接合点表位的递呈可能性相关联的量,并且较高的接合点表位递呈评分值指示该
盒的接合点表位会被HLA I类或HLA II类或两者递呈的可能性较高。
[0851] 在一个实施方案中,盒设计模块324可以确定候选盒序列中与最低接合点表位递呈评分相关联的盒序列。在一个实例中,给定盒序列C的递呈评分是基于分别与该盒C中的
接合点相关联的一组距离度量d(en(ti,tj),n=1,2,…,n(ti,tj))=d(ti,tj)确定。具体来说,距离度量d(ti,tj)指明跨越相邻治疗性表位p'ti和p'tj对的一个或多个接合点表位会被递呈的可
能性。然后,可以通过将函数(例如求和、统计函数)应用于有关盒C的距离度量集合来确定
盒C的接合点表位递呈评分。在数学上,递呈评分通过以下提供:
[0852]
[0853] 其中h(·)是将每一接合点的距离度量映射至评分的某种函数。在本说明书其余部分通篇提及的一个特定实例中,函数h(·)是整个盒距离度量的求和。
[0854] 盒设计模块324可以迭代一个或多个候选盒序列,确定候选盒的接合点表位递呈评分,且鉴定与低于阈值的接合点表位递呈评分相关联的最佳盒序列。在本说明书其余部
分通篇提及的一个特定实施方案中,关于给定接合点的距离度量d(·)可以由利用本说明
书VII及VIII部分中所描述的递呈模型测定的递呈可能性或经递呈接合点表位的预期数量
的总和来提供。然而,应了解,在其它实施方案中,距离度量可以由单独或与如以上示例的
模型的模型组合的其它因素得到,其中这些其它因素可以包括从以下任一种或多种(单独
或组合形式)得出距离度量:对于I类HLA或II类HLA的HLA结合亲和力或稳定性测量值或预
测值,以及基于HLA质谱或T细胞表位数据训练的有关I类HLA或II类HLA的递呈或免疫原性
模型。在一个实施方案中,距离度量可以组合关于I类HLA和II类HLA递呈的信息。举例来说,
距离度量可以是预测以低于阈值的结合亲和力结合患者的I类HLA或II类HLA等位基因中的
任一个的接合点表位的数量。在另一实例中,距离度量可以是预测会被患者的I类HLA或II
类HLA等位基因中的任一个递呈的表位的预期数量。
[0855] 盒设计模块324可以进一步检查该一个或多个候选盒序列以鉴定候选盒序列中的接合点表位中的任一个是否为设计使用该疫苗的给定患者的自身表位。为实现此目的,盒
设计模块324针对已知数据库如BLAST检查接合点表位。在一个实施方案中,盒设计模块可
以配置成通过将有关表位ti,tj对的距离度量d(ti,tj)设定为极大值(例如100)来设计避免接
合点自身表位的盒,其中将表位ti串接至表位tj的N端使得形成接合点自身表位。
[0856] 再回到图38中的实例,盒设计模块324确定(例如)通过长度对于I类MHC为8至15个氨基酸或对于II类MHC为6至30个氨基酸的所有可能接合点表位en(t1,t2)=en(1,2)的递呈可能
性求和提供的盒C1中单一接合点(t1,t2)的距离度量d(t1,t2)=d(1,2)=0.39。由于盒C1中不存在其它接合点,因此接合点表位递呈评分也通过0.39提供,该评分是有关盒C1的整个距离
度量的求和。盒设计模块324也确定通过长度对于I类MHC为8至15个或对于II类MHC为9至30
个氨基酸的所有可能接合点表位en(t1,t2)=en(2,1)的递呈可能性求和提供的盒C2中单一接合
点的距离度量d(t1,t2)=d(2,1)=0.068。在此实例中,也通过单一接合点的距离度量0.068提
供盒C2的接合点表位递呈评分。盒设计模块324输出C2的盒序列作为最佳盒,因为接合点表
位递呈评分低于C1的盒序列。
[0857] 在一些情况下,盒设计模块324可以执行蛮力方法且迭代全部或大部分可能的候选盒序列以选出具有最小接合点表位递呈评分的序列。然而,由于疫苗容量v增加,因此这
类候选盒的数量可能极大。举例来说,对于v=20个表位的疫苗容量,盒设计模块324必须迭
代约1018个可能的候选盒,才能确定具有最低接合点表位递呈评分的盒。对于盒设计模块
324在合理的时间量内完成以产生用于患者的疫苗而言,此确定在计算上可能较为繁琐(就
所需的计算处理资源而言)且有时难以处理。另外,考虑到每一候选盒的可能接合点表位,
甚至可能更为繁琐。因此,盒设计模块324可以基于迭代明显少于蛮力方法中的候选盒序列
数量的候选盒数量来选择盒序列。
[0858] 在一个实施方案中,盒设计模块324产生随机产生或至少伪随机产生的候选盒的子集,且选择与低于预定阈值的接合点表位递呈评分相关联的候选盒作为盒序列。另外,盒
设计模块324可以从该小组中选择具有最低接合点表位递呈评分的候选盒作为盒序列。举
例来说,盒设计模块324可以针对v=20个所选表位集合产生约1百万个候选盒子集,且选出
具有最小接合点表位递呈评分的候选盒。尽管产生随机盒序列子集并从该子集中选出具有
低接合点表位递呈评分的盒序列可能不如蛮力方法好,但其需要明显较少的计算资源,由
此使其实施在技术上是可行的。另外,相对于这种更高效的技术,执行蛮力方法可能仅引起
接合点表位递呈评分的微小或甚至可忽略的改进,因此,从资源分配的观点看,蛮力方法是
不值得实施的。
[0859] 在另一个实施方案中,盒设计模块324通过将盒的表位序列用非对称旅行商问题(TSP)公式表示来确定改进的盒配置。鉴于节点列表和每对节点之间的距离,TSP确定与最
短总距离相关联的节点的序列以访问每个节点恰好一次且返回至原始节点。举例来说,根
据城市A、B及C且已知彼此之间的距离,TSP的解决方案产生一个闭合的城市序列,对于该序
列,访问每个城市恰好一次所行进的总距离系可能途径当中最短的。TSP的非对称形式确定
当一对节点之间的距离不对称时节点的最佳序列。举例来说,从节点A行进至节点B的“距
离”可以不同于从节点B行进至节点A的“距离”。
[0860] 盒设计模块324通过解决非对称TSP来确定改进的盒序列,其中每一节点对应于一个治疗性表位p'k。从对应于表位p'k的节点到对应于表位p'm的另一节点的距离通过接合点
表位距离度量d(k,m)提供,而从对应于表位p'm的节点到对应于表位p'k的节点的距离由可能
不同于距离度量d(k,m)的距离度量d(m,k)提供。通过使用非对称TSP解决改进的最佳盒,盒设
计模块324可以寻找使所有在该盒的表位之间的接合点的递呈评分降低的盒序列。非对称
TSP解决方案指示对应于应当在盒中串接表位以使该盒的所有接合点的接合点表位递呈评
分减到最小的次序的治疗性表位序列。具体来说,已知治疗性表位集合k=1,2,…,v,盒设
计模块324确定该盒中每一对可能的有序治疗性表位的距离度量d(k,m),k,m=1,2,…,v。换
句话说,对于给定的表位对k,m,确定在表位p'k之后串接治疗性表位p'm的距离度量d(k,m)和
在表位p'm之后串接治疗性表位p'k的距离度量d(m,k),因为这些距离度量可能彼此不同。
[0861] 在一个实施方案中,盒设计模块324通过整数线性规划问题来解决非对称TSP。具体来说,盒设计模块324产生通过以下提供的(v+1)×(v+1)路径矩阵P:
[0862]
[0863] v×v矩阵D是一种非对称距离矩阵,其中每个元素D(k,m)(k=1,2,…,v;m=1,2,…,v)对应于从表位p'k至表位p'm的接合点的距离度量。P的行k=2,…,v对应于原始表位
的节点,而第1行及第1列对应于“重像节点(ghost node)”,该节点与所有其它节点的距离
为零。将“重像节点”添加至矩阵中编码疫苗盒是线性而非圆形的概念,因此在第一个与最
后一个表位之间不存在接合点。换句话说,该序列并非圆形,并且假定在该序列中,第一个
表位并未串接在最后一个表位之后。使xkm表示二元变量,如果存在有向路径(即,该盒中的
k m
表位-表位接合点),其中表位p'串接至表位p'的N端,则其值为1,否则为0。此外,使E表示
所有v个治疗性疫苗表位的集合,且使 表示表位的子集。对于任何此类子集S,使out
(S)表示表位-表位接合点的数量xkm=1,其中k是S中的表位并且m是E\S中的表位。根据已知
路径矩阵P,盒设计模块324发现解决以下整数线性规划问题的路径矩阵X:
[0864]
[0865] 其中Pkm表示路径矩阵P的元素P(k,m),满足以下限制条件:
[0866]
[0867]
[0868] xkk=0,k=1,2,...,v+1
[0869] out(S)≥1,
[0870] 前两条限制条件保证每个表位在该盒中恰好出现一次。最后一个限制条件确保该盒是连接的。换句话说,由x编码的盒是连接的线性蛋白质序列。
[0871] 等式(27)的整数线性规划问题中有关xkm(k,m=1,2,…,v+1)的解答指示可以用于推断低于接合点表位的递呈评分的该盒的一个或多个治疗性表位序列的节点及重像节点
的闭合序列。具体来说,值xkm=1指示存在从节点k至节点m的“路径”,或换句话说,在改进的m k
盒序列中,治疗性表位p'应当串接在治疗性表位p'之后。xkm=0的解答指示不存在此类路
径,或换句话说,在改进的盒序列中,治疗性表位p'm不应串接在治疗性表位p'k之后。总起来
说,等式(27)的整数规划问题中的值xkm表示节点及重像节点的序列,其中路径输入且存在
每个节点恰好一次。举例来说,值x重像,1=1、x13=1、x32=1和x2,重像=1(否则为0)可以指示节点和重像节点的序列重像→1→3→2→重像。
[0872] 一旦解决该序列,就从该序列删除重像节点以产生仅具有对应于该盒中的治疗性表位的原始节点的改进序列。该改进序列指示应当在该盒中串接所选表位以改善递呈评分
的次序。举例来说,由前一段中的实施例继续,可以删除重像节点以产生改进序列1→3→2。
该改进序列指示在该盒中串接表位的一种可能方式,即p1→p3→p2。
[0873] 在一个实施方案中,当治疗性表位p'k是可变长度表位时,盒设计模块324确定对应于不同长度的治疗性表位p'k和p'm的候选距离度量,并鉴定距离度量d(k,m)作为最小候选
距离度量。举例来说,表位p'k=[nk pk ck]和p'm=[nm pm cm]可以各自包括可在(在一个实
施方案中)2-5个氨基酸间变化的相应N端和C端侧接序列。因此,基于置放于接合点中的4个
可能的nk长度值及4个可能的cm长度值,表位p'k与p'm之间的接合点与16组不同的接合点表
位相关联。盒设计模块324可以确定每组接合点表位的候选距离度量,并确定距离度量d(k,m)
作为最小值。盒设计模块324然后可以构建路径矩阵P并解决等式(27)中的整数线性规划问
题以确定盒序列。
[0874] 相较于随机取样方法,使用整数规划问题解决盒序列需要测定分别对应于疫苗中的一对治疗性表位的v×(v-1)距离度量。相较于随机取样方法,经由此方法确定的盒序列
可以产生具有明显较少接合点表位递呈的序列,同时可能需要明显较少的计算资源,尤其
是在所产生的候选盒序列数量很大时。
[0875] XI.B.2.通过随机取样与非对称TSP产生的盒序列的接合点表位递呈的比较
[0876] 通过随机取样1,000,000个排列(盒序列C1)以及通过解决等式(27)中的整数线性规划问题(盒序列C2)产生两个包括v=20个治疗性表位的盒序列。基于等式(14)中所描述
的递呈模型确定距离度量,且因此确定递呈评分,其中f是S型函数,xhi是肽pi的序列,gh
(·)是神经网络函数,w包括侧接序列、肽pi的每百万条读段中每一千个碱基的转录本数
(transcripts per kilobase million,TPM)的对数、肽pi的蛋白质的抗原性和肽pi的起源
的样品ID,并且侧接序列和log TPM的gw(·)分别是神经网络函数。神经网络函数gh(·)各
自包括含一个隐藏层的多层感知器(MLP)的一个输出节点,其具有输入维度231(11个残基
×21个字符/残基,包括填充字符在内)、宽度256、隐藏层中的修正线性单元(ReLU)激活函
数、输出层中的线性激活函数,及训练数据集中每个HLA等位基因一个输出节点。侧接序列
的神经网络函数是含一个隐藏层的MLP,其具有输入维度210(N端侧接序列的5个残基+C端
侧接序列的5个残基×21个字符/残基,包括填充字符在内)、宽度32、隐藏层中的ReLU激活
函数及输出层中的线性激活函数。RNA log TPM的神经网络函数是含一个隐藏层的MLP,其
具有输入维度1、宽度16、隐藏层中的ReLU激活函数及输出层中的线性激活函数。构建HLA等
位基因HLA-A*02:04、HLA-A*02:07、HLA-B*40:01、HLA-B*40:02、HLA-C*16:02及HLA-C*16:
04的递呈模型。比较指示该两个盒序列的预期经递呈接合点表位数量的递呈评分。结果显
示,通过解决等式(27)产生的盒序列的递呈评分相对于通过随机取样产生的盒序列的递呈
评分有约4倍改进。
[0877] 具体来说,v=20个表位通过以下提供:
[0878] p’1=YNYSYWISIFAHTMWYNIWHVQWNK
[0879] p’2=IEALPYVFLQDQFELRLLKGEQGNN
[0880] p’3=DSEETNTNYLHYCHFHWTWAQQTTV
[0881] p’4=GMLSQYELKDCSLGFSWNDPAKYLR
[0882] p’5=VRIDKFLMYVWYSAPFSAYPLYQDA
[0883] p’6=CVHIYNNYPRMLGIPFSVMVSGFAM
[0884] p’7=FTFKGNIWIEMAGQFERTWNYPLSL
[0885] p’8=ANDDTPDFRKCYIEDHSFRFSQTMN
[0886] p’9=AAQYIACMVNRQMTIVYHLTRWGMK
[0887] p’10=KYLKEFTQLLTFVDCYMWITFCGPD
[0888] p’11=AMHYRTDIHGYWIEYRQVDNQMWNT
[0889] p’12=THVNEHQLEAVYRFHQVHCRFPYEN
[0890] p’13=QTFSECLFFHCLKVWNNVKYAKSLK
[0891] p’14=SFSSWHYKESHIALLMSPKKNHNNT
[0892] p’15=ILDGIMSRWEKVCTRQTRYSYCQCA
[0893] p’16=YRAAQMSKWPNKYFDFPEFMAYMPI
[0894] p’17=PRPGMPCQHHNTHGLNDRQAFDDFV
[0895] p’18=HNIISDETEVWEQAPHITWVYMWCR
[0896] p’19=AYSWPVVPMKWIPYRALCANHPPGT
[0897] p’20=HVMPHVAMNICNWYEFLYRISHIGR。
[0898] 在第一个实施例中,用该20个治疗性表位随机产生1,000,000个不同的候选盒序列。产生所述候选盒序列各自的递呈评分。经鉴定具有最低递呈评分的候选盒序列为:
[0899]
[0900] 且具有预期数量的经递呈接合点表位的递呈评分为6.1。该1,000,000个随机序列的中值递呈评分是18.3。实验显示,可以通过鉴定随机取样的盒当中的盒序列,明显减少经
递呈的接合点表位的预期数量。
[0901] 在第二个实施例中,通过解决等式(27)中的整数线性规划问题来鉴定盒序列C2。具体来说,测定一对治疗性表位之间每一可能接合点的距离度量。使用所述距离度量解答
有关整数规划问题的解决方案。通过此方法鉴定的盒序列是:
[0902]
[0903] 且递呈评分为1.7。盒序列C2的递呈评分相对于盒序列C1的递呈评分显示约4倍改进,且相对于该1,000,000个随机产生的候选盒的中值递呈评分显示约11倍改进。在
2.30GHz Intel Xeon E5-2650 CPU的单个线程上,用于产生盒C1的运行时间是20秒。在相
同CPU的单个线程上,用于产生盒C2的运行时间是1秒。因此,在此实施例中,通过解决等式
(27)的整数规划问题鉴定的盒序列以降低20倍的计算成本产生约4倍优化的解决方案。
[0904] 结果显示,相较于由随机取样鉴定的盒序列,整数规划问题有可能以较少的计算资源可能地提供经递呈接合点表位数量较少的盒序列。
[0905] XI.B.3.通过MHCflurry与递呈模型产生的用于盒序列选择的接合点表位递呈的比较
[0906] 在本实施例中,包括v=20个治疗性表位的盒序列通过随机取样1,000,000个排列,以及通过解决等式(27)中的整数线性规划问题产生,其中该表位是基于肿瘤/正常外显
子组测序、肿瘤转录组测序和肺癌样品的HLA分型来选择。基于通过MHCflurry预测的接合
点表位数量确定距离度量且因此确定递呈评分,MHCflurry是以低于多种阈值(例如50-
1000nM或更高,或更低)的亲和力结合患者的HLA的HLA-肽结合亲和力预测器。在本实施例
中,选作治疗性表位的20个非同义体细胞突变选自根据以上XI.B部分中的递呈模型,通过
对突变排序而在肿瘤样品中鉴定的98个体细胞突变。然而,应了解,在其它实施方案中,可
以基于其它标准选择治疗性表位;例如基于稳定性的标准,或例如递呈评分、亲和力例如此
类标准的组合。此外,还应了解,用于对疫苗中所包括的治疗性表位区分优先级的标准不必
与用于确定盒设计模块324中使用的距离度量D(k,m)的标准相同。
[0907] 患者的I类HLA等位基因是HLA-A*01:01、HLA-A*03:01、HLA-B*07:02、HLA-B*35:03、HLA-C*07:02、HLA-C*14:02。
[0908] 具体来说,在本实施例中,v=20个治疗性表位是
[0909]
[0910] 下表中自本实施例得到的结果比较了如经由三种示例方法所发现的通过MHCflurry预测以低于阈值栏中的值的亲和力结合患者的HLA的接合点表位的数量(其中nM
表示纳摩尔浓度)。对于第一种方法,经由以上描述的旅行商问题(ATSP)公式发现具有1秒
运行时间的最佳盒。对于第二种方法,优化盒通过取得在1百万个随机样品之后发现的最佳
盒确定。对于第三种方法,在该1百万个随机样品中发现接合点表位的中值数量。
[0911]
[0912]
[0913] 本实施例的结果说明,可以使用多种标准中的任一种鉴定给定盒设计是否满足设计要求。具体来说,如通过先前实施例所展示,从许多候选物选出的盒序列可以通过具有最
低接合点表位递呈评分或至少低于所鉴定的阈值的此类评分的盒序列指定。本实施例表
示,可以使用另一标准,例如结合亲和力,指明给定盒设计是否满足设计要求。对于此标准,
可以设定临限结合亲和力(例如50-1000,或更大或更小),指明盒设计序列应具有少于某一
临限数量的超过阈值(例如0)的接合点表位,并且可以使用多种方法中的任一种(例如表中
所示的方法一至三)鉴定给定候选盒序列是否满足所述要求。这些示例方法进一步说明,取
决于所用方法,可能需要设定不同的阈值。可以设想其它标准,例如基于稳定性的标准,或
例如递呈评分、亲和力等的标准的组合。
[0914] 在另一实施例中,使用相同HLA类型和来自此部分(XI.C)中先前内容的20个治疗性表位,而非使用基于结合亲和力预测的距离度量来产生相同盒,关于表位m,k的距离度量
是经预测患者的I类HLA等位基因会以超过一系列阈值的递呈概率(在0.005与0.5概率之
间,或更高,或更低)递呈的跨越m至k接合点的肽的数量,其中递呈概率由以上XI.B部分中
的递呈模型确定。本实施例进一步说明认为可以用于鉴定给定候选盒序列是否满足用于疫
苗的设计要求的标准的广度。
[0915]
[0916] 以上实施例已鉴定出用于确定候选盒序列是否满足设计要求的标准可以随实施方式变化。这些实施例分别说明,高于或低于标准的接合点表位数量的计数可以为确定候
选盒序列是否满足该标准时使用的计数。举例来说,如果标准是满足或超过对于HLA的临限
结合亲和力的表位的数量,则候选盒序列具有大于还是少于该数量可以确定该候选盒序列
是否满足用作选择用于疫苗的盒的标准。如果该标准是超过临限递呈可能性的接合点表位
的数量,则情况类似。
[0917] 然而,在其它实施方案中,可执行除计数外的计算以确定候选盒序列是否满足设计标准。举例来说,实际上可以测定超过或低于阈值的接合点表位的比例,例如是否顶部
X%的接合点表位具有超过某一阈值Y的递呈可能性,或是否X%的接合点表位具有小于或
大于Z nM的HLA结合亲和力,代替超出/低于某一阈值的表位计数。这些仅仅是实施例,一般
来说,标准可以基于任一个别接合点表位的任何属性,或由所述接合点表位中的一些或全
部的聚合得到的统计数据。此处,X一般可以是在0与100%之间的任何数(例如75%或更小)
并且Y可以是在0与1之间的任何值,并且Z可以是适合于相关标准的任何数。这些值可以取
决于所用模型及标准,以及所用训练数据的质量,凭经验确定。
[0918] 因此,在某些方面,具有高递呈概率的接合点表位可以被移除;具有低递呈概率的接合点表位可以得到保留;紧密结合的接合点表位,即结合亲和力低于1000nM或500nM或某
一其它阈值的接合点表位可以被移除;和/或较弱结合的接合点表位,即结合亲和力超过
1000nM或500nM或某一其它阈值的接合点表位可以得到保留。
[0919] 尽管以上实施例使用以上描述的递呈模型实施方式鉴定出候选序列,但所述原理同样地适用于基于其它类型的模型,例如基于亲和力、稳定性等的模型鉴定盒序列中布置
的表位的实施方式。
[0920] XII.实施例7:显示出示例递呈模型性能的实验结果
[0921] 基于测试数据T测试以上描述的各种递呈模型的有效性,所述测试数据是未用于训练递呈模型的训练数据170的子集或来自训练数据170的具有与训练数据170类似的变量
及数据结构的独立数据集。
[0922] 指示递呈模型的性能的相关度量是:
[0923]
[0924] 其指示正确预测的会在相关HLA等位基因上递呈的肽实例的数量与经预测会在HLA等位基因上递呈的肽实例的数量的比率。在一个实施方式中,如果相应可能性估计值ui
大于或等于给定阈值t,则预测测试数据T中的肽pi会在一个或多个相关HLA等位基因上递
呈。指示递呈模型的性能的另一相关度量是:
[0925]
[0926] 其指示正确预测的会在相关HLA等位基因上递呈的肽实例的数量与已知会在HLA等位基因上递呈的肽实例的数量的比率。指示递呈模型的性能的另一相关度量是接收者操
作特征曲线(ROC)的曲线下面积(AUC)。ROC将召回率相对于假阳性率(FPR)作图,FPR由下式
提供:
[0927]
[0928] XII.A.基于质谱数据的递呈模型性能与目前先进技术模型的比较
[0929] 图13A比较如本文中所示的示例递呈模型与目前先进技术模型基于多等位基因质谱数据预测肽递呈的性能结果。结果显示,示例递呈模型在预测肽递呈方面的性能明显优
于基于亲和力和稳定性预测的目前先进技术模型。
[0930] 具体来说,使用仿射依赖性函数gh(·)和expit函数f(·),图13A显示为“MS”的示例递呈模型是等式(12)中显示的独立等位基因递呈模型的最大值。示例递呈模型是基于来
自IEDB数据集的单等位基因HLA-A*02:01质谱数据的子集(数据集“D1”)(数据可以见于
http://www.iedb.org/doc/mhc_ligand_full.zip)及来自IEDB数据集的单等位基因HLA-
B*07:02质谱的子集(数据集“D2”)(数据可以见于http://www.iedb.org/doc/mhc_ligand_
full.zip)。从训练数据中去除测试集中来自源蛋白质的含有经递呈肽的所有肽,使得该示
例递呈模型不是简单地记录经递呈抗原的序列。
[0931] 图13A中显示为“亲和力”的模型是与目前先进技术模型类似的模型,该模型基于亲和力预测值NETMHCpan预测肽递呈。NETMHCpan的实施方式详细提供于http://
www.cbs.dtu.dk/services/NetMHCpan/。图13A中显示为“稳定性”的模型是与目前先进技
术模型类似的模型,该模型基于稳定性预测值NETMHCstab预测肽递呈。NETMHCstab的实施
方式详细提供于http://www.cbs.dtu.dk/services/NetMHCstab-1.0/。测试数据是来自
Bassani-Sternberg数据集的多等位基因JY细胞系HLA-A*02:01和HLA-B*07:02质谱数据的
子集(数据集“D3”)(数据可以见于www.ebi.ac.uk/pride/archive/projects/PXD000394)。
误差条(如实线所指示)显示95%置信区间。
[0932] 如图13A的结果中所示,相对于基于MHC结合亲和力预测值或MHC结合稳定性预测值来预测肽递呈的目前先进技术模型,基于质谱数据训练的示例递呈模型在10%召回率下
具有明显较高的PPV值。具体来说,示例递呈模型的PPV比基于亲和力预测值的模型高约
14%,且其PPV比基于稳定性预测值的模型高约12%。
[0933] 这些结果展示,相较于基于MHC结合亲和力或MHC结合稳定性预测值预测肽递呈的目前先进技术模型,示例递呈模型具有明显较佳的性能,即使该示例递呈模型未基于含有
经递呈肽的蛋白质序列进行训练。
[0934] XII.B.基于T细胞表位数据的递呈模型性能与目前先进技术模型的比较
[0935] 图13B比较如本文中所述的另一示例递呈模型与目前先进技术模型基于T细胞表位数据预测肽递呈的性能结果。T细胞表位数据含有被细胞表面上的MHC等位基因递呈且由
T细胞识别的肽序列。结果显示,即使基于质谱数据训练示例递呈模型,所述示例递呈模型
在预测T细胞表位方面的性能仍明显优于基于亲和力及稳定性预测值的目前先进技术模
型。换句话说,图13B的结果指示,示例递呈模型不仅在基于质谱测试数据预测肽递呈方面
的性能优于目前先进技术模型,而且示例递呈模型在预测实际上由T细胞识别的表位方面
的性能也明显优于目前先进技术模型。由此指示,本文中所提供的多种递呈模型可以更佳
地鉴定可能在免疫系统中诱导免疫原性反应的抗原。
[0936] 具体来说,使用仿射变换函数gh(·)和expit函数f(·),图13B中显示为“MS”的示例递呈模型是基于数据集D1的子集训练的等式(2)中显示的独立等位基因递呈模型。从训
练数据中去除测试集中来自源蛋白质的含有经递呈肽的所有肽,使得该递呈模型不是简单
地记录经递呈抗原的序列。
[0937] 将所述模型分别应用于测试数据,该测试数据是基于HLA-A*02:01T细胞表位数据的质谱数据的子集(数据集“D4”)(数据可以见于www.iedb.org/doc/tcell full v3.zip)。
图13B中显示为“亲和力”的模型是与目前先进技术模型类似的模型,该模型基于亲和力预
测值NETMHCpan预测肽递呈,并且图13B中显示为“稳定性”的模型是与目前先进技术模型类
似的模型,该模型基于稳定性预测值NETMHCstab预测肽递呈。误差条(如实线所指示)显示
95%信赖区间。
[0938] 如图13A的结果中所示,相较于基于MHC结合亲和力或MHC结合稳定性预测值预测肽递呈的目前先进技术模型,基于质谱数据训练的独立等位基因递呈模型在10%召回率下
具有明显较高的PPV值,即使该递呈模型未基于含有经递呈肽的蛋白质序列进行训练。具体
来说,独立等位基因递呈模型的PPV比基于亲和力预测值的模型高约9%,且其PPV比基于稳
定性预测值的模型高约8%。
[0939] 这些结果表明,基于质谱数据训练的示例递呈模型在预测由T细胞识别的表位方面的性能明显优于目前先进技术模型。
[0940] XII.C.基于质谱数据的不同递呈模型性能的比较
[0941] 图13C比较示例总和函数模型(等式(13))、示例函数总和模型(等式(19))和示例二阶模型(等式(23))基于多等位基因质谱数据预测肽递呈的性能结果。结果显示,函数总
和模型和二阶模型的性能优于总和函数模型。这是因为总和函数模型暗示,多等位基因环
境中的等位基因会干扰彼此的肽递呈,而实际上,肽的递呈是有效地独立的。
[0942] 具体来说,图13C中标记为“总和S型函数”的示例递呈模型是利用网络依赖性函数gh(·)、恒等函数f(·)和expit函数r(·)的总和函数模型。标记为“S型函数总和”的示例
模型是利用网络依赖性函数gh(·)、expit函数f(·)和恒等函数r(·)的等式(19)中的函
数总和模型。标记为“双曲正切”的示例模型是利用网络依赖性函数gh(·)、expit函数f
(·)和双曲正切函数r(·)的等式(19)中的函数总和模型。标记为“二阶”的示例模型是使
用含网络依赖性函数gh(·)和expit函数f(·)的等式(18)中显示的隐式独立等位基因递
呈可能性形式的等式(23)中的二阶模型。每个模型是基于数据集D1、D2及D3的子集训练。将
示例递呈模型应用于测试数据,该测试数据是不与训练数据重叠的数据集D3的随机子集。
[0943] 如图13C中所示,第一列是指当将各递呈模型应用于测试集时ROC的AUC,第二列是指可能性损失的负对数值,且第三列是指在10%召回率下的PPV。如图13C中所示,递呈模型
“S型函数总和”、“双曲正切”和“二阶”的性能在10%召回率下约15-16%的PPV下大致相当,而模型“总和S型函数”的性能在约11%下略微较低。
[0944] 如先前在X.C.4部分中所论述,结果显示,递呈模型“S型函数总和”、“双曲正切”和“二阶”相较于“总和S型函数”模型具有较高PPV值,因为所述模型正确地解释多等位基因环境中的每个MHC等位基因如何独立地递呈肽。
[0945] XII.D.在基于和不基于单等位基因质谱数据训练情况下递呈模型性能的比较
[0946] 图13D比较利用与不利用单等位基因质谱数据训练的两个示例递呈模型针对多等位基因质谱数据预测肽递呈的性能结果。结果指示,在无单等位基因数据下训练的示例递
呈模型的性能与利用单等位基因数据训练的示例递呈模型的性能相当。
[0947] 示例模型“利用A2/B7单等位基因数据”是利用网络依赖性函数gh(·)、expit函数f(·)和恒等函数r(·)的等式(19)中的“S型函数总和”递呈模型。该模型是基于数据集D3
的子集以及来自IEDB数据库的多种MHC等位基因的单等位基因质谱数据训练(数据可以见
于:http://www.iedb.org/doc/mhc_ligand_full.zip)。示例模型“无A2/B7单等位基因数
据”是相同模型,但基于多等位基因D3数据集的子集训练,无等位基因HLA-A*02:01和HLA-
B*07:02的单等位基因质谱数据,而是利用其它等位基因的单等位基因质谱数据。在多等位
基因训练数据内,细胞系HCC1937表达HLA-B*07:02,但不表达HLA-A*02:01,并且细胞系
HCT116表达HLA-A*02:01,但不表达HLA-B*07:02。将示例递呈模型应用于测试数据,该测试
数据是不与训练数据重叠的数据集D3的随机子集。
[0948] 如图13D中所示,基于MHC等位基因HLA-A*02:01的隐式独立等位基因递呈可能性进行预测的性能明显优于基于MHC等位基因HLA-A*02:01而非MHC等位基因HLA-B*07:02的
单等位基因测试数据进行预测的性能。关于MHC等位基因HLA-B*07:02显示类似结果。
[0949] 这些结果指示,递呈模型的隐式独立等位基因递呈可能性可以正确地预测及区分结合基序与个别MHC等位基因,即使并不了解训练数据中肽与每一个别MHC等位基因之间的
直接关联。
[0950] XII.E.在不基于单等位基因质谱数据训练情况下独立等位基因预测性能的比较
[0951] 图13E显示基于图13D中所示的分析中保持的等位基因HLA-A*02:01和HLA-B*07:02的单等位基因质谱数据,图13D中显示的“无A2/B7单等位基因数据”和“利用A2/B7单等位
基因数据”示例模型的性能。结果指示,即使该示例递呈模型未利用该两个等位基因的单等
位基因质谱数据进行训练,该模型仍能够学习到各MHC等位基因的结合基序。
[0952] “相关性”一列是指指示肽是否在测试数据中的相应等位基因上递呈的实际标记与用于预测的标记之间的相关性。如图13E中所示,“A2模型预测B7”指示当基于有关MHC等
位基因HLA-A*02:01的隐式独立等位基因递呈可能性估计值,针对单等位基因HLA-B*07:02
数据预测肽递呈时该模型的性能。类似地,“A2模型预测A2”指示当基于有关MHC等位基因
HLA-A*02:01的隐式独立等位基因递呈可能性估计值,针对单等位基因HLA-A*02:01预测肽
递呈时该模型的性能。“B7模型预测B7”指示当基于有关MHC等位基因HLA-B*07:02的隐式独
立等位基因递呈可能性估计值,针对单等位基因HLA-B*07:02数据预测肽递呈时该模型的
性能。“B7模型预测A2”指示当基于有关MHC等位基因HLA-B*07:02的隐式独立等位基因递呈
可能性估计值,针对单等位基因HLA-A*02:01预测肽递呈时该模型的性能。
[0953] 如图13E中所示,有关HLA等位基因的隐式独立等位基因可能性的预测能力明显高于有关预定等位基因的预测能力,且明显低于有关其它HLA等位基因的预测能力。与图13D
中显示的结果类似,示例递呈模型正确地习得区分个别等位基因HLA-A*02:01与HLA-B*07:
02的肽递呈,即使肽递呈与这些等位基因之间的直接关联在多等位基因训练数据中不存
在。
[0954] XII.F.独立等位基因预测中频繁出现的锚定残基匹配已知的典型锚定基序
[0955] 图13F显示在图13D中显示的“无A2/B7单等位基因数据”示例模型所预测的九聚体当中在2位及9位处的共同锚定残基。如果估计可能性超过5%,则预测所述肽将会被递呈。
结果显示,所鉴定的在MHC等位基因HLA-A*02:01和HLA-B*07:02上递呈的肽中的最常见锚
定残基与先前已知的所述MHC等位基因的锚定基序相配。这指示,正如预期的,基于肽序列
中氨基酸的特定位置,示例递呈模型正确地学习肽结合。
[0956] 如图13F中所示,已知在2位处的氨基酸L/M和在9位处的氨基酸V/L是HLA-A*02:01的典型锚定残基基序(如https://link.springer.com/article/10.1186/1745-7580-4-2
的表4中所示),并且已知在2位处的氨基酸P和在9位处的氨基酸L/V是HLA-B*07:02的典型
锚定残基基序。在该模型鉴定的肽的2位和9位处的最常见锚定残基基序与已知的该两个
HLA等位基因的典型锚定残基基序相配。
[0957] XII.G.利用和不利用等位基因非相互作用变量的递呈模型性能的比较
[0958] 图13G比较并入C端和N端侧接序列作为等位基因相互作用变量的示例递呈模型与并入C端和N端侧接序列作为等位基因非相互作用变量的示例递呈模型之间的性能结果。结
果显示,并入C端和N端侧接序列作为等位基因非相互作用变量使模型性能明显改善。更具
体来说,鉴定所有不同MHC等位基因共有的适用于肽递呈的特征并使其模型化,由此使所有
MHC等位基因共享所述等位基因非相互作用变量的统计强度以改善递呈模型性能非常有意
义。
[0959] 示例“等位基因相互作用”模型是使用等式(22)中的隐式独立等位基因递呈可能性形式的函数总和模型,其并入C端和N端侧接序列作为等位基因相互作用变量,并且利用
网络依赖性函数gh(·)和expit函数f(·)。示例“等位基因非相互作用”模型是等式(21)中
显示的函数总和模型,其并入C端和N端侧接序列作为等位基因非相互作用变量,且利用网
络依赖性函数gh(·)和expit函数f(·)。等位基因非相互作用变量是经由独立网络依赖性
函数gw(·)模型化。两个模型都基于数据集D3的子集以及来自IEDB数据库的多种MHC等位
基因的单等位基因质谱数据训练(数据可以见于:http://www.iedb.org/doc/mhc_ligand_
full.zip)。将所述递呈模型分别应用于测试数据集,该测试数据集是不与训练数据重叠重
叠的数据集D3的随机子集。
[0960] 如图13G中所示,在示例递呈模型中并入C端和N端侧接序列作为等位基因非相互作用变量相对于使其模型化作为等位基因相互作用变量实现约3%的PPV值改进。一般来
说,这是因为“等位基因非相互作用”示例递呈模型能够通过利用独立网络依赖性函数使影
响模型化而在所有MHC等位基因中共享等位基因非相互作用变量的统计强度,同时极少增
加计算能力。
[0961] XII.H.经递呈肽与mRNA定量之间的依赖性
[0962] 图13H显示通过质谱法测定的mRNA丰度与肿瘤细胞上递呈的肽的频率之间的依赖性。结果表明,mRNA表达与肽递呈之间存在较强的依赖性。
[0963] 具体来说,图13H中的水平轴指示以每百万条读段数的转录本数(TPM)的四分位数表示的mRNA表达水平。图13H中的垂直轴指示由相应mRNA表达水平四分位数中的基因递呈
的表位的百分率。每一实线是有关从肿瘤样品得到的两个测量值的曲线,其与相应质谱数
据和mRNA表达测量值相关联。如图13H中所示,mRNA表达水平与相应基因中的肽的百分率之
间存在较强正相关性。具体来说,RNA表达水平的顶四分位数中的基因递呈肽的可能性是底
四分位数的20倍以上。另外,经由RNA未检测到的基因基本上不递呈肽。
[0964] 结果指示,通过并入mRNA定量测量值可以大幅改进递呈模型的性能,因为这些测量值有利地预测肽递呈。
[0965] XII.I.在并入RNA定量数据下递呈模型性能的比较
[0966] 图13I显示两个示例递呈模型的性能,其中之一是基于质谱肿瘤细胞数据训练,另一个并入mRNA定量数据和质谱肿瘤细胞数据。正如自图13H所预期的,结果指示,由于mRNA
表达水平是肽递呈的有力指标,通过在示例递呈模型中并入mRNA定量测量值使性能明显改
进。
[0967] “MHCflurry+RNA过滤器”是与基于亲和力预测值预测肽递呈的目前先进技术模型类似的模型。其使用MHCflurry以及标准基因表达过滤器实施,该过滤器利用mRNA定量测量
值移除蛋白质中小于3.2FPKM的所有肽。MHCflurry的实施方式详细提供于https://
github.com/hammerlab/mhcflurry/和http://biorxiv.org/content/early/2016/05/22/
054775。“示例模型,无RNA”模型是利用网络依赖性函数gh(·)、网络依赖性函数gw(·)和
expit函数f(·)的等式(21)中显示的“S型函数总和”示例递呈模型。“示例模型,无RNA”模
型经由网络依赖性函数gw(·)并入C端侧接序列作为等位基因非相互作用变量。
[0968] “示例模型,有RNA”模型是利用网络依赖性函数gh(·)、在等式(10)中经由对数函数并入mRNA定量数据的网络依赖性函数gh(·)和expit函数f(·)的等式(19)中显示的“S
型函数总和”递呈模型。“示例模型,有RNA”模型经由网络依赖性函数gw(·)并入C端侧接序
列作为等位基因非相互作用变量且经由对数函数并入mRNA定量测量值。
[0969] 每个模型均基于来自IEDB数据集的单等位基因质谱数据、来自Bassani-Sternberg数据集的多等位基因质谱数据的7个细胞系和20个质谱肿瘤样品的组合进行训
练。将每个模型应用于包括5,000个提供的来自7个肿瘤样品的蛋白质的测试集,其构成来
自总计52,156,840个肽的9,830个经递呈肽。
[0970] 如图13I的前两个条形图中所示,“示例模型,无RNA”模型在20%召回率下PPV值为21%,而目前先进技术模型的PPV值为约3%。由此指示PPV值的18%的初始性能改进,甚至
在不并入mRNA定量测量值下也如此。如图13I的第三个条形图中所示,将mRNA定量中并入递
呈模型中的“示例模型,有RNA”模型显示约30%的PPV值,相较于不利用mRNA定量测量值的
示例递呈模型,性能增加近10%。
[0971] 因此,结果指示,正如自图13H中的发现所预期的,mRNA表达实际上是肽预测的有力预测因子,其能够在极少增加计算复杂度情况下明显改进递呈模型的性能。
[0972] XII.J.测定的有关MHC等位基因HLA-C*16:04的参数的实例
[0973] 图13J比较在不同肽长度下,由关于图13I描述的“示例模型,有RNA”递呈模型产生的结果与当预测肽递呈时不考虑肽长度的目前先进技术模型预测的结果之间的肽递呈概
率。结果指示,图13I的“示例模型,有RNA”示例递呈模型捕捉不同长度肽间的可能性变化。
[0974] 水平轴指示长度为8、9、10和11的肽样品。垂直轴指示视肽长度而定的肽递呈概率。曲线“真值(盲测数据)”显示在样品测试数据集中视肽长度变化的经递呈肽的比例。递
呈可能性随肽长度而变化。举例来说,如图13J中所示,具有典型HLA-A2 L/V锚定基序的10
聚体肽的递呈可能性比具有相同锚定残基的9聚体低约3倍。曲线“忽略长度的模型”指示在
将忽略肽长度的目前先进技术模型应用于相同测试数据集进行递呈预测时的预测测量值。
这些模型可以是4.0版之前的NetMHC版本、3.0版之前的NetMHCpan版本,和MHCflurry,不考
虑肽递呈随肽长度的变化。如图13J中所示,经递呈肽的比例在不同肽长度值间将是恒定
的,指示这些模型将无法捕捉肽递呈随长度的变化。曲线“示例模型,有RNA”指示由“示例模型,有RNA”递呈模型产生的测量值。如图13J中所示,由“示例模型,有RNA”模型产生的测量值近似地遵循“真值(盲测数据)”中显示的测量值且正确地考虑在长度8、9、10和11下的不
同肽递呈程度。
[0975] 因此,结果显示,如本文中所示的示例递呈模型不仅产生有关9聚体肽的改进的预测,而且也改进对在8-15之间的其它长度的肽的预测,所述肽在I类HLA等位基因中的经递
呈肽中占高达40%。
[0976] XII.K.测定的有关MHC等位基因HLA-C*16:04的参数的实例
[0977] 以下显示所测定的有关以h指示的MHC等位基因HLA-C*16:04的独立等位基因递呈模型(等式(2))的变化形式的一组参数:
[0978]
[0979] 其中relu(·)是修正线性单元(RELU)函数,并且Wh1、bh1、Wh2和bh2是测定的该模型的参数集合θ。等位基因相互作用变量xhk由肽序列组成。Wh1的尺寸是(231×256),bh1的尺寸
是(1×256),Wh2的尺寸是(256×1)并且bh2是标量。出于证实的目的,bh1、bh2、Wh1和Wh2的值详细地描述于PCT公开WO2017106638中,该公开的所有教导内容均通过引用并入本文。
[0980] XII.L.MHC II实施例1
[0981] 确定MHC II类新抗原的方法在国际申请PCT/US2018/028438中进行了更详细的描述,该申请的所有教导内容均通过引用并入本文。
[0982] 图13K是使用质谱法从人肿瘤细胞和肿瘤浸润淋巴细胞(TIL)上的II类MHC等位基因洗脱的肽长度的直方图。具体来说,对HLA-DRB1*12:01纯合子等位基因(“数据集1”)和
HLA-DRB1*12:01、HLA-DRB1*10:01多等位基因样品(“数据集2”)进行质谱肽组学。结果表
明,从II类MHC等位基因上洗脱的肽长度范围为6-30个氨基酸。图13K中所示的频率分布类
似于使用现有技术水平的质谱技术从II类MHC等位基因洗脱的肽的长度分布,如参考文献
91的图1C所示。
[0983] 图13L示出mRNA定量与数据集1和数据集2的每个残基的递呈肽之间的依赖性。结果表明,对于II类MHC等位基因,mRNA表达与肽递呈之间存在强烈的依赖性。
[0984] 具体来说,图13B中的水平轴以每百万条读段数的log10转录本(TPM)bin形式表示mRNA表达。图13L中的垂直轴表示每个残基的肽递呈作为对应于在10-2的mRNA表达的最低bin的倍数。一条实线是关于数据集1的mRNA定量和肽递呈的曲线,而另
一条实线是关于数据集2的曲线。如图13L所示,相应基因中每个残基的mRNA表达和肽递呈
之间存在强烈的正相关性。具体来说,来自RNA表达的101比底bin的递呈可能性高5倍。
[0985] 结果表明,通过结合mRNA定量测量,可以大大提高递呈模型的性能,因为这些测量值可以强烈预测肽递呈。
[0986] 图13M比较了使用数据集1和数据集2训练和测试的示例递呈模型的性能结果。对于示例递呈模型的每组模型特征,图13M描绘了当模型特征集合中的特征被分类为等位基
因相互作用特征或者当模型特征集合中的特征被分类为等位基因非相互作用特征变量时
在10%召回率下的PPV值。如图13M中所示,对于示例递呈模型的每个模型特征集合,当模型
特征集合中的特征被分类为等位基因相互作用特征时鉴定的在10%召回率下的PPV值示于
左侧,而当模型特征集合中的特征被分类为等位基因非相互作用特征时鉴定的在10%召回
率下的PPV值示于右侧。应注意,出于图13M的目的,肽序列的特征总是被分类为等位基因相
互作用特征。结果表明,递呈模型在10%召回率下的PPV值达到从14%至29%之间变化,这
比随机预测的PPV显著更高(约500倍)。
[0987] 该实验考虑了长度为9-20的肽序列。数据分为训练集、验证集和测试集。将来自数据集1和数据集2的50个残基段的肽段分配给训练和测试集。去除蛋白质组中任何地方重复
的肽,确保没有肽序列同时出现在训练集和测试集中。通过去除非递呈的肽,训练和测试集
中的肽递呈发生率增加了50倍。这是因为数据集1和数据集2是来自人肿瘤样品,其中只有
一小部分细胞是II类HLA等位基因,导致肽产率比II类HLA等位基因的纯样品低约10倍,由
于质谱灵敏度的不完善,这仍然被低估了。训练集包含1,064个递呈肽和3,810,070个非递
呈肽。测试集包含314个递呈肽和807,400个非递呈肽。
[0988] 示例模型1是等式(22)中的函数总和模型,其使用网络依赖性函数gh(·)、expit函数f(·)和恒等函数r(·)。网络依赖性函数gh(·)被构造为具有256个隐藏节点和整流
线性单元(ReLU)激活的多层感知器(MLP)。除肽序列外,等位基因相互作用变量w还包含独
热编码的C端和N端侧接序列,指示肽pi的源基因G=基因(pi)的索引的分类变量,以及指示
mRNA定量测量的变量。示例模型2与示例模型1相同,不同之处在于等位基因相互作用变量
中省略了C端和N端侧接序列。示例模型3与示例模型1相同,不同之处在于等位基因相互作
用变量中省略了源基因的索引。示例模型4与示例模型1相同,不同之处在于等位基因相互
作用变量中省略了mRNA定量测量。
[0989] 示例模型5是等式(20)中的函数总和模型,其具有网络依赖性函数gh(·)、expit函数f(·)、恒等函数r(·),和等式(12)的依赖性函数gw(·)。依赖性函数gw(·)还包括以
mRNA定量测量为输入并构造为具有16个隐藏节点和ReLU激活的MLP的网络模型,以及以C-
侧接序列为输入并构造为具有32个隐藏节点和ReLU激活的MLP的网络模型。网络依赖性函
数gh(·)被构造为具有256个隐藏节点和整流线性单元(ReLU)激活的多层感知器。示例模
型6与示例模型5相同,不同之处在于省略了C端和N端侧接序列的网络模型。示例模型7与示
例模型5相同,不同之处在于等位基因非相互作用变量中省略了源基因的索引。示例模型8
与示例模型5相同,不同之处在于省略了用于mRNA定量测量的网络模型。
[0990] 测试集中递呈肽的发生率为约1/2400,因此,随机预测的PPV也将为约1/2400=0.00042。如图13M中所示,性能最好的递呈模型达到约29%的PPV值,大约比随机预测的PPV
值高500倍。
[0991] XII.M.MHC II实施例2
[0992] 图13N是描绘使用质谱法对总共39个包含HLA II类分子的样品中的每个样品进行测序的肽数量的直方图。此外,对于多个样品中的每个样品,图13N中所示的直方图描绘了
使用质谱在不同q值阈值下测序的肽数量。具体来说,对于多个样品中的每个样品,图13N描
绘了q值小于0.01,q值小于0.05和q值小于0.2的使用质谱法测序的肽数量。
[0993] 如上所述,图13N的39个样品中的每个样品都包含HLA II类分子。更具体来说,图13N的39个样品中的每个样品都包含HLA-DR分子。HLA-DR分子是HLA II类分子的一种类型。
甚至更具体来说,图13N的39个样品中的每个样品都包含HLA-DRB1分子、HLA-DRB3分子、
HLA-DRB4分子和/或HLA-DRB5分子。HLA-DRB1分子、HLA-DRB3分子、HLA-DRB4分子和HLA-
DRB5分子是HLA-DR分子的类型。
[0994] 尽管使用包含HLA-DR分子,尤其是HLA-DRB1分子、HLA-DRB3分子、HLA-DRB4分子和HLA-DRB5分子的样品来进行该特定实验,但在替代的实施方案中,可以使用包含一种或多
种任何类型的HLA II类分子的样品来进行该实验。举例来说,在替代的实施方案中,可以使
用包含HLA-DP和/或HLA-DQ分子的样品进行相同的实验。使用相同的技术对任何类型的MHC 
II类分子建模并且仍然获得可靠结果的这种能力是本领域技术人员众所周知的。举例来
说,Jensen,Kamilla Kjaergaard等人76是最近的科学论文的一个实例,该论文使用相同的
方法对HLA-DR分子以及HLA-DQ和HLA-DP分子的结合亲和力进行建模。因此,本领域技术人
员将理解,本文描述的实验和模型可用于单独或同时对不仅HLA-DR分子而且任何其它MHC 
II类分子建模,同时仍产生可靠的结果。
[0995] 为了对总共39个样品中的每个样品的肽进行测序,对每个样品进行质谱分析。然后用Comet搜索样品的所得质谱图并用Percolator评分,以对肽进行测序。然后,针对多个
不同的Percolator q值阈值,鉴定样品中测序的肽数量。具体来说,对于样品,确定了在
Percolator q值小于0.01下,Percolator q值小于0.05下和Percolator q值小于0.2下测
序的肽数量。
[0996] 对于39个样品中的每个样品,在图13N中描绘了在每个不同的Percolator q值阈值下测序的肽数量。举例来说,如图13N所示,对于第一个样品,在q值小于0.2下使用质谱法
测序约4000个肽,在q值小于0.05下使用质谱法测序约2800个肽,并且在q值小于0.01下使
用质谱法测序约2300个肽。
[0997] 总体而言,图13N展示了使用质谱法在低q值下对包含MHC II类分子的样品中的大量肽进行测序的能力。换句话说,图13N中描述的数据证明了使用质谱法可靠地对MHC II类
分子可能递呈的肽进行测序的能力。
[0998] 图13O是描绘了其中鉴定出特定MHC II类分子等位基因的样品数量的直方图。更具体来说,对于总共39个包含HLA II类分子的样品,图13O描述了其中鉴定出某些MHC II类
分子等位基因的样品数量。
[0999] 如上文关于图13N所讨论,图13N的39个样品中的每个样品都包含HLA-DRB1分子、HLA-DRB3分子、HLA-DRB4分子和/或HLA-DRB5分子。因此,图13O描绘了其中鉴定出HLA-
DRB1、HLA-DRB3、HLA-DRB4和HLA-DRB5分子的某些等位基因的样品数量。为了鉴定样品中存
在的HLA等位基因,对样品执行HLA II类DR分型。然后,为了确定其中已鉴定出特定HLA等位
基因的样品数量,可将使用HLA II类DR分型鉴定出HLA等位基因的样品数量简单地求和。举
例来说,如图13O所示,在总共39个样品中,有19个样品包含HLA II类分子等位基因HLA-
DRB4*01:03。换句话说,在总共39个样品中,有19个样品包含HLA-DRB4分子的等位基因HLA-
DRB4*01:03。总体而言,图13O描绘了从包含HLA II类分子的39个样品中鉴定各种HLA II类
分子等位基因的能力。
[1000] 图13P是描绘了对于一系列肽长度中的每个肽长度,在总共39个样品中由MHC II类分子递呈的肽的比例的直方图。为了确定总共39个样品中每个样品中每个肽的长度,如
上文关于图13N所讨论,使用质谱法对每个肽进行测序,然后简单地定量测序的肽中的残基
数。
[1001] 如上所述,MHC II类分子通常递呈长度在9-20个氨基酸之间的肽。因此,图13P描绘了对于在9-20个氨基酸之间(包括端点)的每个肽长度,在39个样品中由MHC II类分子递
呈的肽的比例。举例来说,如图13P所示,在39个样品中由MHC II类分子递呈的肽中约22%
包含14个氨基酸的长度。
[1002] 基于图13P中描述的数据,在39个样品中由MHC II类分子递呈的肽的模态长度被确定为14和15个氨基酸长度。在39个样品中对于由MHC II类分子递呈的肽鉴定出的这些模
态长度与由MHC II类分子递呈的肽的模态长度的先前报道一致。另外,也与先前的报道一
致,图13P的数据表明,由来自39个样品的MHC II类分子所递呈的肽中超过60%包含并非14
和15个氨基酸的长度。换句话说,图13P指示,虽然由MHC II类分子递呈的肽的长度最常见
为14或15个氨基酸,但由MHC II类分子递呈的肽的长度大部分不是14或15个氨基酸。因此,
一个不良的假设是假定所有长度的肽都具有相等的被MHC II类分子递呈的概率,或者仅包
含长度为14或15个氨基酸的肽被MHC II类分子递呈。如下面关于图13T的详细讨论,这些错
误的假设当前被用于许多目前现有技术水平模型中,以预测由MHCII类分子进行的肽递呈,
因此,由这些模型所预测的递呈可能性通常是不可靠的。
[1003] 图13Q是描绘对于39个样品中所存在基因的基因表达与由MHCII类分子递呈基因表达产物的发生率之间的关系的线图。更具体来说,图13Q描绘了基因表达与由基因表达产
生的残基比例之间的关系,所述残基形成由MHC II类分子递呈的肽的N端。为了定量总共39
个样品中每个样品的基因表达,对每个样品中包含的RNA进行RNA测序。在图13Q中,基因表
达是通过RNA测序以每百万条读段数的转录本(TPM)为单位进行测量的。为了确定39个样品
中每个样品的基因表达产物的递呈发生率,对每个样品进行HLA II类DR肽组学数据的鉴
定。
[1004] 如图13Q所示,对于39个样品,MHC II类分子的基因表达水平与表达的基因产物的残基递呈之间存在强烈的相关性。具体来说,如图13Q所示,由最少表达的基因表达产生的
肽相比于由最多表达的基因表达产生的肽被MHC II类分子递呈的可能性小100倍以上。更
简单来说,更高表达的基因产物更频繁地由MHC II类分子递呈。
[1005] 图13H-J是比较各种递呈模型在预测肽测试数据集中的肽将由测试数据集中存在的至少一个MHC II类分子递呈的可能性时的性能的线图。如图13H-J所示,通过对于由模型
作出的每个预测鉴定真阳性率与假阳性率的比率来确定模型在预测测试数据集中存在的
肽将由至少一个MHC II类分子递呈的可能性时的性能。对于给定模型鉴定的这些比率,可
以ROC(接收者操作特征)曲线可视化,在线图中x轴定量假阳性率并且y轴定量真阳性率。曲
线下面积(AUC)用于定量模型的性能。具体来说,相对于具有较小AUC的模型,具有较大AUC
的模型具有较高的性能(即,较大的准确性)。在图13H-J中,斜率为1的黑色虚线(即,真阳性
率与假阳性率的比率为1)描绘了随机猜测肽递呈可能性的预期曲线。虚线的AUC为0.5。关
于上文第XII节的顶部,详细讨论了ROC曲线和AUC度量。
[1006] 图13R是在给定不同集合的等位基因相互作用和等位基因非相互作用变量下,五个示例递呈模型在预测肽测试数据集中的肽将由MHC II类分子递呈的可能性的性能的线
图。换句话说,图13R量化了各种等位基因相互作用和等位基因非相互作用变量对于预测肽
将由MHC II类分子递呈的可能性的相对重要性。
[1007] 用于生成图13R线图的ROC曲线的五个示例递呈模型的每个示例递呈模型的模型架构由五个S型函数总和模型的总体组成。总体中的每个S型函数总和模型都配置为对每个
样品最多四个独特的HLA-DR等位基因进行模型肽递呈。此外,将总体中的每个S型函数总和
模型配置为基于以下等位基因相互作用和等位基因非相互作用变量对肽递呈可能性进行
预测:肽序列、侧接序列、RNA表达(以TPM为单位)、基因标识符和样品标识符。总体中每个S
型函数总和模型的等位基因相互作用分量是一个隐藏层MLP,其具有ReLu激活作为256个隐
藏单元。
[1008] 在使用示例模型预测肽测试数据集中的肽将由MHC II类分子递呈的可能性之前,对示例模型进行训练和验证。为了训练、验证并最终测试示例模型,上面针对39个样品描述
的数据被分为训练、验证和测试数据集。
[1009] 为了确保没有肽出现在训练、验证和测试数据集中的一个以上中,执行以下程序。首先,从总共39个样品中去除在蛋白质组中一个以上位置出现的所有肽。然后,将来自总共
39个样品的肽划分为10个相邻肽的肽段。来自总共39个样品中的肽的每个肽段都被唯一地
分配给训练数据集、验证数据集或测试数据集。通过这种方式,没有肽出现在训练、验证和
测试数据集中的一个以上数据集中。
[1010] 在总共39个样品中的28,081,944个肽中,训练数据集包含来自总共39个样品中的38个样品的MHC II类分子递呈的21,077个肽。训练数据集中包含的21,077个肽长度在9到
20个氨基酸之间(包括端点)。使用ADAM优化器和早期停止,在训练数据集上训练用于生成
图13R中的ROC曲线的示例模型。
[1011] 验证数据集由同样来自训练数据集中使用的38个样品的MHC II类分子递呈的2,346个肽组成。验证集仅用于早期停止。
[1012] 测试数据集包含由MHC II类分子递呈的肽,所述MHC II类分子是使用质谱法从肿瘤样品中鉴定出来的。具体来说,测试数据集包含由MHC II类分子递呈的203个肽,所述MHC 
II类分子,具体来说HLA-DRB1*07:01、HLA-DRB1*15:01、HLA-DRB4*01:03和HLA-DRB5*01:01
分子,从肿瘤样品中鉴定出来。测试数据集中包括的肽不包含在上述训练数据集中。
[1013] 如上所述,图13R量化了各种等位基因相互作用变量和等位基因非相互作用变量对于预测肽将由MHC II类分子递呈的可能性的相对重要性。同样如上所述,用于生成图13R
的线图的ROC曲线的示例模型被配置为基于以下等位基因相互作用和等位基因非相互作用
变量对肽递呈可能性进行预测:肽序列、侧接序列、RNA表达(以TPM为单位)、基因标识符和
样品标识符。为了量化这五个变量中的四个变量(肽序列、侧接序列、RNA表达和基因标识
符)用于预测肽将由MHC II类分子递呈的可能性的相对重要性,在四个变量的不同组合下,
使用来自测试数据集的数据对上述五个示例模型中的每个示例模型进行测试。具体来说,
对于测试数据集的每个肽,示例模型1基于肽序列、侧接序列、基因标识符和样品标识符,但
不基于RNA表达,生成肽递呈可能性的预测。类似地,对于测试数据集的每个肽,示例模型2
基于肽序列、RNA表达、基因标识符和样品标识符,但不基于侧接序列,生成肽递呈可能性的
预测。类似地,对于测试数据集的每个肽,示例模型3基于侧接序列、RNA表达、基因标识符和
样品标识符,但不基于肽序列,生成肽递呈可能性的预测。类似地,对于测试数据集的每个
肽,示例模型4基于侧接序列、RNA表达、肽序列和样品标识符,但不基于基因标识符,生成肽
递呈可能性的预测。最后,对于测试数据集的每个肽,示例模型5基于侧接序列、RNA表达、肽
序列、样品标识符和基因标识符的所有五个变量生成肽递呈可能性的预测。
[1014] 图13R的线图中描绘了这五个示例模型中每个模型的性能。具体来说,五个示例模型中的每一个都与ROC曲线相关联,该曲线描绘了该模型作出的每个预测的真阳性率与假
阳性率的比率。举例来说,图13R描绘了示例模型1的曲线,该示例模型基于肽序列、侧接序
列、基因标识符和样品标识符但不基于RNA表达来生成肽递呈可能性的预测。图13R描绘了
示例模型2的曲线,该示例模型基于肽序列、RNA表达、基因标识符和样品标识符但不基于侧
接序列来生成肽递呈可能性的预测。图13R还描绘了示例模型3的曲线,该示例模型基于侧
接序列、RNA表达、基因标识符和样品标识符但不基于肽序列来生成肽递呈可能性的预测。
图13R还描绘了示例模型4的曲线,该示例模型基于侧接序列、RNA表达、肽序列和样品标识
符但不基于基因标识符来生成肽递呈可能性的预测。最后,图13R描绘了示例模型5的曲线,
该示例模型基于侧接序列、RNA表达、肽序列、样品标识符和基因标识符的所有五个变量来
生成肽递呈可能性的预测。
[1015] 如上所述,通过鉴定ROC曲线的AUC来量化模型在预测肽将由MHC II类分子递呈的可能性时的性能,该ROC曲线描绘了对于模型作出的每个预测的真阳性率与假阳性率的比
率。相对于具有较小AUC的模型,具有更大AUC的模型具有更高的性能(即,更大的准确性)。
如图13R所示,基于侧接序列、RNA表达、肽序列、样品标识符和基因标识符的所有五个变量
生成肽递呈可能性的预测的示例模型5的曲线达到最高AUC为0.98。因此,使用所有五个变
量生成肽递呈预测的示例模型5达到最佳性能。基于肽序列、RNA表达、基因标识符和样品标
识符但不基于侧接序列生成肽递呈可能性的预测的示例模型2的曲线达到第二最高AUC为
0.97。因此,侧接序列可以被鉴定为用于预测肽将由MHC II类分子递呈的可能性的最不重
要的变量。基于侧接序列、RNA表达、肽序列和样品标识符但不基于基因标识符生成肽递呈
可能性的预测的示例模型4的曲线达到第三最高AUC为0.96。因此,基因标识符可以被鉴定
为用于预测肽将由MHC II类分子递呈的可能性的第二最不重要的变量。基于侧接序列、RNA
表达、基因标识符和样品标识符但不基于肽序列生成肽递呈可能性预测的示例模型3的曲
线达到最低AUC为0.88。因此,肽序列可以被鉴定为用于预测肽将由MHC II类分子递呈的可
能性的最重要的变量。基于肽序列、侧接序列、基因标识符和样品标识符但不基于RNA表达
生成肽递呈可能性预测的示例模型1的曲线实现第二最低AUC为0.95。因此,RNA表达可以被
鉴定为用于预测肽将由MHC II类分子递呈的可能性的第二最重要的变量。
[1016] 图13S是比较四种不同的递呈模型在预测肽测试数据集中的肽将由MHC II类分子递呈的可能性时的性能的线图。
[1017] 图13S中测试的第一个模型在本文中称为“完全非相互作用模型”。完全非相互作k
用模型是上述递呈模型的一个实施方案,其中将等位基因非相互作用变量w和等位基因相
互作用变量xhk输入到单独的依赖性函数例如神经网络中,然后将这些单独的依赖性函数的
输出相加。具体来说,完全非相互作用模型是上述递呈模型的一种实施方案,其中将等位基
因非相互作用变量wk输入到依赖性函数gw中,将等位基因相互作用变量xhk输入到单独的依
赖性函数gh中,并且将依赖性函数gw和依赖性函数gh的输出相加在一起。因此,在一些实施
方案中,完全非相互作用模型使用如上所示的等式8确定肽递呈的可能性。此外,上文关于
第X.B.2.节的顶部、第X.B.3.节的底部、第X.C.3.节的顶部和第X.C.6.节的顶部详细讨论
了完全非相互作用模型的实施方案,其中将等位基因非相互作用变量wk输入到依赖性函数
gw中,将等位基因相互作用变量xhk输入到单独的依赖性函数gh中,并且将依赖性函数gw和依
赖性函数gh的输出相加。
[1018] 图13S中测试的第二个模型在本文中称为“完全相互作用模型”。所述完全相互作用模型是上述递呈模型的一个实施方案,其中将等位基因非相互作用变量wk直接串接到等
位基因相互作用变量xhk,然后输入到依赖性函数例如神经网络中。因此,在一些实施方案
中,完全相互作用模型使用如上所示的等式9确定肽递呈的可能性。此外,上文关于第
X.B.2.节的底部、第X.C.2.节的底部和第X.C.5.节的底部详细讨论了完全相互作用模型的
实施方案,其中将等位基因非相互作用变量wk与等位基因相互作用变量xhk串接,然后将所
述变量输入到依赖性函数中。
[1019] 在图13S中测试的第三模型在本文中称为“CNN模型”。所述CNN模型包括卷积神经网络,并且类似于上述的完全非相互作用模型。然而,CNN模型的卷积神经网络的层与完全
非相互作用模型的神经网络的层不同。具体来说,CNN模型的卷积神经网络的输入层接受20
聚体肽串并且随后嵌入20聚体肽串作为(n,20,21)张量。CNN模型的卷积神经网络的后续层
包括尺寸为5且步长为1的1-D卷积核层,全局最大池化层,p=0.2的退出层以及最后一个具
有ReLu激活的密集34节点层。
[1020] 在图13S中测试的第四个也是最后一个模型在本文中称为“LSTM模型”。所述LSTM模型包括长的短期记忆神经网络。LSTM模型的长的短期记忆神经网络的输入层接受20聚体
肽串,随后嵌入所述20聚体肽串作为(n,20,21)张量。LSTM模型的长的短期记忆神经网络的
后续层包括具有128个节点的长的短期记忆层,p=0.2的退出层以及最后一个具有ReLu激
活的密集34节点层。
[1021] 在使用图13S的四个模型中的每一个模型预测肽测试数据集中的肽将由MHC II类分子递呈的可能性之前,使用上述38个样品的训练数据集对模型进行训练并使用上述验证
数据集进行验证。在模型的这种训练和验证之后,使用上述排除的第39个样品测试数据集
对四个模型中的每个模型进行测试。具体来说,对于四个模型中的每一个,将测试数据集的
每个肽输入到模型中,随后所述模型输出肽的递呈可能性。
[1022] 图13S的线图中描绘了四个模型中的每个模型的性能。具体来说,这四个模型中的每个模型都与ROC曲线相关联,该曲线描绘了由所述模型作出的每个预测的真阳性率与假
阳性率的比率。举例来说,图13S描绘了CNN模型的ROC曲线、完全相互作用模型的ROC曲线、
LSTM模型的ROC曲线和完全非相互作用模型的ROC曲线。
[1023] 如上所述,通过鉴定ROC曲线的AUC来量化模型在预测肽将由MHC II类分子递呈的可能性时的性能,该ROC曲线描绘了对于所述模型作出的每个预测的真阳性率与假阳性率
的比率。相对于具有较小AUC的模型,具有更大AUC的模型具有更高的性能(即,更大的准确
性)。如图13S所示,完全相互作用模型的曲线达到最高AUC为0.982。因此,完全相互作用模
型达到最佳性能。完全非相互作用模型的曲线达到第二最高AUC为0.977。因此,完全非相互
作用模型达到第二最佳性能。CNN模型的曲线达到最低AUC为0.947。因此,CNN模型达到最差
性能。LSTM模型的曲线达到第二最低AUC为0.952。因此,LSTM模型达到第二最差性能。然而,
应注意,在图13S中测试的所有模型的AUC均大于0.9。因此,尽管它们之间存在架构差异,但
是在图13S中测试的所有模型都能够实现相对准确的肽递呈预测。
[1024] 图13T是比较给定两个不同标准的两个示例同类最佳现有技术模型以及给定两个不同集合的等位基因相互作用和等位基因非相互作用变量的两个示例递呈模型在预测肽
测试数据集中的肽将由MHCII类分子递呈的可能性的性能的线图。具体来说,图13T是比较
以下模型性能的线图:利用最小NetMHCII 2.3预测的结合亲和力作为标准来生成预测的示
例同类最佳现有技术模型(示例模型1),利用最小NetMHCII 2.3预测的结合等级作为标准
来生成预测的示例同类最佳现有技术模型(示例模型2),基于MHC II类分子类型和肽序列
生成肽递呈可能性预测的示例递呈模型(示例模型4),以及基于MHC II类分子类型、肽序
列、RNA表达、基因标识符和侧接序列生成肽递呈可能性的预测的示例递呈模型(示例模型
3)。
[1025] 图13T中用作示例模型1和示例模型2的同类最佳现有技术模型是NetMHCII 2.3模型。NetMHCII 2.3模型基于MHC II类分子类型和肽序列生成肽递呈可能性的预测。使用
NetMHCII 2.3网站(www.cbs.dtu.dk/services/NetMHCII/,PMID 29315598)对
NetMHCII2.3模型进行测试76。
[1026] 如上所述,根据两个不同的标准对NetMHCII 2.3模型进行测试。具体来说,示例模型1模型根据最小NetMHCII 2.3预测的结合亲和力生成肽递呈可能性的预测,并且示例模
型2根据最小NetMHCII 2.3预测的结合等级生成肽递呈可能性的预测。
[1027] 用作示例模型3和示例模型4的递呈模型是本文公开的递呈模型的实施方案,其使用经由质谱法获得的数据进行训练。如上所述,所述递呈模型基于两个不同集合的等位基
因相互作用和等位基因非相互作用变量生成肽递呈可能性的预测。具体来说,示例模型4基
于MHC II类分子类型和肽序列(由NetMHCII 2.3模型使用的相同变量)生成肽递呈可能性
的预测,而示例模型3基于MHC II类分子类型、肽序列、RNA表达、基因标识符和侧接序列生
成肽递呈可能性的预测。
[1028] 在使用图13T的示例模型预测肽测试数据集中的肽将由MHC II类分子递呈的可能性之前,对所述模型进行训练和验证。NetMHCII 2.3模型(示例模型1和示例模型2)使用其
自身的训练和验证数据集基于存入免疫表位数据库(IEDB,www.iedb.org)中的HLA-肽结合
亲和力测定进行训练和验证。已知用于训练NetMHCII 2.3模型的训练数据集几乎只包含15
聚体肽。另一方面,使用上文关于图13R所述的训练数据集来训练示例模型3和4,并且使用
上文关于图13R所述的验证数据集对其进行验证。
[1029] 在训练和验证模型之后,使用测试数据集对每个模型进行测试。如上所述,NetMHCII 2.3模型是在几乎仅包含15聚体肽的数据集上训练的,这意味着NetMHCII 3.2无
法为不同权重的肽赋予不同的优先级,从而降低了NetMHCII 3.2对于包含所有长度的肽的
HLA II类递呈质谱数据的预测性能。因此,为了在不受变量肽长度影响的模型之间提供合
理的比较,测试数据集仅包含15聚体肽。具体来说,测试数据集包含933个15聚体肽。测试数
据集中的933个肽中有40个被MHC II类分子递呈,具体来说被HLA-DRB1*07:01、HLA-DRB1*
15:01、HLA-DRB4*01:03和HLA-DRB5*01:01分子递呈。测试数据集中包括的肽不包含在上述
训练数据集中。
[1030] 为了使用测试数据集测试示例模型,对于每个示例模型,对于测试数据集中的933个肽中的每个肽,所述模型生成所述肽的递呈可能性预测。具体来说,对于测试数据集中的
每个肽,示例1模型通过根据测试数据集中的四个HLA II类DR等位基因的最小NetMHCII 
2.3预测的结合亲和力对肽进行评级,使用MHC II类分子类型和肽序列生成MHC II类分子
对肽的递呈评分。类似地,对于测试数据集中的每个肽,示例2模型通过根据测试数据集中
的四个HLA II类DR等位基因的最小NetMHCII 2.3预测的结合等级(即四分位数归一化的结
合亲和力)对肽进行评级,使用MHC II类分子类型和肽序列生成MHCII类分子对肽的递呈评
分。对于测试数据集中的每个肽,示例4模型基于MHC II类分子类型和肽序列生成MHC II类
分子对肽的递呈可能性。类似地,对于测试数据集中的每个肽,示例模型3基于MHC II类分
子类型、肽序列、RNA表达、基因标识符和侧接序列生成MHC II类分子对肽的递呈可能性。
[1031] 图13T的线图中描绘了四个示例模型中每个模型的性能。具体来说,四个示例模型中的每一个都与ROC曲线相关联,该ROC曲线描绘了所述模型作出的每个预测的真阳性率与
假阳性率的比率。举例来说,图13T描绘了利用最小NetMHCII 2.3预测的结合亲和力来生成
预测的示例1模型的ROC曲线,利用最小NetMHCII 2.3预测的结合等级来生成预测的示例2
模型的ROC曲线,基于MHC II类分子类型和肽序列来生成肽递呈可能性的示例4模型的ROC
曲线,以及基于MHC II类分子类型、肽序列、RNA表达、基因标识符和侧接序列来生成肽递呈
可能性的示例3模型的ROC曲线。
[1032] 如上所述,通过鉴定ROC曲线的AUC来量化模型在预测肽将由MHC II类分子递呈的可能性时的性能,该ROC曲线描绘了对于模型作出的每个预测的真阳性率与假阳性率的比
率。相对于具有较小AUC的模型,具有较大AUC的模型具有更高的性能(即,更大的准确性)。
如图13T所示,基于MHC II类分子类型、肽序列、RNA表达、基因标识符和侧接序列生成肽递
呈可能性的示例3模型的曲线达到最高AUC为0.95。因此,基于MHC II类分子类型、肽序列、
RNA表达、基因标识符和侧接序列生成肽递呈可能性的示例3模型达到最佳性能。基于MHC 
II类分子类型和肽序列生成肽递呈可能性的示例4模型的曲线达到第二最高AUC为0.91。因
此,基于MHC II类分子类型和肽序列生成肽递呈可能性的示例4模型达到第二最佳性能。利
用最小NetMHCII 2.3预测的结合亲和力生成预测的示例1模型的曲线达到最低AUC为0.75。
因此,利用最小NetMHCII 2.3预测的结合亲和力生成预测的示例1模型达到最差性能。利用
最小NetMHCII 2.3预测的结合等级来生成预测的示例2模型的曲线达到第二最低AUC为
0.76。因此,利用最小NetMHCII 2.3预测的结合等级生成预测的示例2模型达到第二最差性
能。
[1033] 如图13T所示,示例模型1和2与示例模型3和4之间的性能差异很大。具体来说,NetMHCII 2.3模型(利用最小NetMHCII 2.3预测的结合亲和力或最小NetMHCII 2.3预测的
结合等级的标准)的性能比本文公开的递呈模型(基于MHC II类分子类型和肽序列,或者基
于MHC II类分子类型、肽序列、RNA表达、基因标识符和侧接序列产生肽递呈可能性)的性能
低几乎25%。因此,图13T证明,与当前同类最佳现有技术模型NetMHCII 2.3模型相比,本文
公开的递呈模型能够实现显著更准确的递呈预测。
[1034] 更进一步,如上所述,NetMHCII 2.3模型是在几乎只包含15聚体肽的训练数据集上进行训练的。因此,没有训练NetMHCII 2.3模型来获知哪些肽长度更有可能被MHC II类
分子递呈。因此,NetMHCII 2.3模型不会根据肽长度对其MHC II类分子递呈肽的可能性的
预测进行加权。换句话说,对于长度超过15个氨基酸的模态肽长度的肽,NetMHCII 2.3模型
不会修改其对MHC II类分子递呈肽的可能性的预测。因此,NetMHCII 2.3模型高估了长度
大于或小于15个氨基酸的肽的递呈可能性。
[1035] 另一方面,本文公开的递呈模型是使用经由质谱法获得的肽数据来训练的,因此可以在包括所有不同长度的肽的训练数据集上进行训练。因此,本文公开的递呈模型能够
获知哪些肽长度更有可能被MHC II类分子递呈。因此,本文公开的递呈模型可以根据肽长
度对MHC II类分子递呈肽的可能性的预测进行加权。换句话说,本文公开的递呈模型能够
针对长度超过15个氨基酸的模态肽长度的肽修改其MHC II类分子递呈肽的可能性的预测。
因此,与当前同类最佳现有技术模型NetMHCII 2.3模型相比,本文公开的递呈模型能够对
长度大于或小于15个氨基酸的肽实现显著更准确的递呈预测。这是使用本文公开的递呈模
型预测MHC II类分子递呈肽的可能性的一个优势。
[1036] XII.N.对于MHC II等位基因确定的参数的实例
[1037] 下面示出对于多等位基因递呈模型(等式(16))的变体确定的一组参数,所述模型生成对于II类MHC等位基因HLA-DRB1*12:01和HLA-DRB1*10:01的隐式独立等位基因递呈可
能性:
[1038] u=expit(relu(X·W1+b1)·W2+b2),
[1039] 其中relu(·)是校正线性单元(RELU)函数,W1、b1、W2和b2是对于模型确定的参数集合θ。等位基因相互作用变量X包含在(1×399)矩阵中,该矩阵由每个输入肽1行独热编码
和中间填充的肽序列组成。W1的尺寸是(399×256),b1的尺寸是(1×256),W2的尺寸是(256
×2),并且b2是(1×2)。输出的第一列表示通过等位基因HLA-DRB1*12:01对肽序列进行递
呈的隐式独立等位基因概率,并且输出的第二列表示通过等位基因HLA-DRB1*10:01对肽序
列进行递呈的隐式独立等位基因概率。出于演示目的,在国际申请PCT/US2018/028438中详
细描述了W1、b1、W2和b2的值,所述申请在此通过引用将其全部教导内容并入本文。
[1040] XIII.示例计算机
[1041] 图14示出用于实施图1和图3中所示的实体的示例计算机1400。计算机1400包括耦合至芯片组1404的至少一个处理器1402。芯片组1404包括内存控制器集线器1420和输入/
输出(I/O)控制器集线器1422。内存1406和图形适配器1412耦合至内存控制器集线器1420,
并且显示器1418耦合至图形适配器1412。存储装置1408、输入装置1414和网络适配器1416
耦合至I/O控制器集线器1422。计算机1400的其它实施方案具有不同架构。
[1042] 存储装置1408是非暂时性计算机可读存储媒体,例如硬盘驱动器、紧密光盘只读存储器(CD-ROM)、DVD或固态内存装置。内存1406保存处理器1402所使用的指令和数据。输
接口1414是触摸屏界面、鼠标轨迹球或其它类型的指向装置、键盘或其某一组合,并且
用于将数据输入计算机1400中。在一些实施方案中,计算机1400可以被配置成经由用户的
示意动作从输入接口1414接收输入(例如命令)。图形适配器1412将图像和其它信息显示于
显示器1418上。网络适配器1416将计算机1400耦合至一个或多个计算机网络
[1043] 计算机1400经调适以执行计算机程序模块以提供本文所描述的功能。如本文所用,术语“模块”是指用于提供指定功能的计算机程序逻辑。因此,模块可以在硬件固件和/或软件中实施。在一个实施方案中,程序模块存储于存储装置1408上,装载至内存1406中并
由处理器1402执行。
[1044] 图1的实体所使用的计算机1400的类型可以根据实施方案和实体所需的处理功率而变化。举例来说,递呈鉴定系统160可以在单一计算机1400中或在通过网络(例如在服务
器群中)彼此连通的多台计算机1400中运行。计算机1400可以缺少以上描述的组件中的一
部分,例如图形适配器1412和显示器1418。
[1045] XIV.新抗原递送载体实施例
[1046] 以下是执行本发明的特定实施方案的实施例。所述实施例仅出于说明目的提供,而不打算以任何方式限制本发明的范围。已作出努力来确保所使用数字(例如量、温度等)
的精确性,但一些实验误差和偏差当然应是允许的。
[1047] 除非另外指明,否则本发明将采用在本领域技能范围内的蛋白质化学、生物化学、重组DNA技术和药理学常规方法实行。所述技术在文献中有充分解释。参见例如
T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman and 
Company,1993);A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,现行版);
Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版,1989);Methods In 
Enzymology(S.Colowick和N.Kaplan编,Academic  Press,Inc.);Remington's 
Pharmaceutical Sciences,第18版(Easton,Pennsylvania:Mack Publishing Company,
1990);Carey和Sundberg Advanced Organic Chemistry第3版(Plenum Press)第A和B卷
(1992)。
[1048] XIV.A.新抗原盒设计
[1049] 可以通过疫苗接种递送刺激相应细胞免疫应答的多个I类MHC限制性肿瘤特异性新抗原(TSNA)。在一个实例中,疫苗盒经工程改造而以单一基因产物形式编码多个表位,其
中所述表位系嵌入其天然的周围肽序列内或通过非天然接头序列隔开。鉴定出会潜在地影
响抗原加工和递呈且因此影响TSNA特异性CD8 T细胞反应的量值和广度的若干设计参数。
在本实例中,设计并构建出若干模型盒以评估:(1)是否可以针对并入单一表达盒中的多个
表位产生稳定T细胞反应;(2)什么使得最佳接头置放于表达盒内的TSNA之间,引起所有表
位的最佳加工和递呈;(3)所述表位在盒内的相对位置是否影响T细胞反应;(4)盒内表位的
数量是否影响针对个别表位的T细胞反应的量值或质量;(5)添加细胞靶向序列是否改善T
细胞反应。
[1050] 产生两个读取结果以评估抗原递呈和对模型盒内的标志物表位具有特异性的T细胞反应:(1)体外基于细胞的筛选,其允许通过专门工程改造的报告T细胞的活化进行衡量,
来评定抗原递呈(Aarnoudse等人,2002;Nagai等人,2012);以及(2)使用HLA-A2转基因小鼠
(Vitiello等人,1991),通过其相应表位特异性T细胞反应评定盒来源的人源表位的疫苗接
种后免疫原性的体内分析(Cornet等人,2006;Depla等人,2008;Ishioka等人,1999)。
[1051] XIV.B.新抗原盒设计评估
[1052] XIV.B.1.方法与材料
[1053] TCR和盒设计及克隆
[1054] 当通过A*0201递呈时,所选TCR识别肽NLVPMVATV(PDB#5D2N)、CLGGLLTMV(PDB#3REV)、GILGFVFTL(PDB#1OGA)、LLFGYPVYV(PDB#1AO7)。构建含有2A肽连接的TCR次单元(β然
后是α)、EMCV IRES和2A连接的CD8次单元(β然后是α和嘌呤霉素抗性基因)的转移载体。对
开放阅读框序列进行密码子优化且由GeneArt合成。
[1055] 产生用于体外表位加工和递呈研究的细胞系
[1056] 肽购自ProImmune或Genscript,在含10mM三(2-羧基乙基)膦(TCEP)的水/DMSO(2:8,v/v)中稀释至10mg/mL。除非另外指出,否则细胞培养基和补充剂是来自Gibco。热灭活胎
牛血清(FBShi)来自Seradigm。QUANTI-Luc底物、吉欧霉素(Zeocin)和嘌呤霉素来自
InvivoGen。将Jurkat-Lucia NFAT细胞(InvivoGen)维持在补充有10%FBShi、丙酸钠和
100μg/mL吉欧霉素的RPMI 1640中。转导后,这些细胞立即另外接受0.3μg/mL嘌呤霉素。在
伊氏培养基(Iscove's Medium,IMDM)加20%FBShi中培养T2细胞(ATCCCRL-1992)。U-87MG
(ATCC HTB-14)细胞维持在补充有10%FBShi的MEM伊格尔培养基(MEM Eagles Medium)中。
[1057] Jurkat-Lucia NFAT细胞含有NFAT诱导性Lucia报告构建体。Lucia基因在通过接合T细胞受体(TCR)活化时,将利用腔肠素的荧光素酶分泌至培养基中。这种荧光素酶可使
用QUANTI-Luc荧光素酶检测试剂测量。用慢病毒转导Jurkat-Lucia细胞以表达抗原特异性
TCR。HIV源性慢病毒转移载体是从GeneCopoeia获得,并且表达VSV-G(pCMV-VsvG)、Rev
(pRSV-Rev)和Gag-pol(pCgpV)的慢病毒支持质粒(support plasmid)是从Cell Design 
Labs获得。
[1058] 通过使用40μl脂染胺和20μg DNA混合物(以重量计4:2:1:1的转移质粒:pCgpV:pRSV-Rev:pCMV-VsvG),用脂染胺2000(Thermo Fisher)转染T75烧瓶中50-80%汇合的
HEK293细胞,来制备慢病毒。使用Lenti-X系统(Clontech)浓缩8-10mL含病毒的培养基,且
使病毒再悬浮于100-200μl新鲜培养基中。使用此体积覆盖相等体积的Jurkat-Lucia细胞
(在不同实验中使用5×10E4-1×10E6个细胞)。在含0.3μg/ml嘌呤霉素的培养基中培养之
后,分选细胞以获得克隆性。使用装载肽的T2细胞测试这些Jurkat-Lucia TCR克隆的活性
和选择性。
[1059] 体外表位加工和递呈分析
[1060] 常规地使用T2细胞,通过TCR检查抗原识别。T2细胞缺乏用于抗原加工的肽转运蛋白(TAP缺陷型)并且不能在内质网中装载内源性肽以在MHC上递呈。然而,T2细胞可以容易
地装载外源肽。将五个标志物肽(NLVPMVATV、CLGGLLTMV、GLCTLVAML、LLFGYPVYV、
GILGFVFTL)以及两个不相关的肽(WLSLLVPFV、FLLTRICT)装载至T2细胞上。简言之,对T2细
胞计数且用IMDM加1%FBShi稀释至1×106个细胞/毫升。添加肽以产生10μg肽/1×106个细
胞。接着在37℃下温育细胞90分钟。用IMDM加20%FBShi洗涤细胞两次,稀释至5×10E5个细
胞/毫升并将100μL涂铺至96孔Costar组织培养板中。对Jurkat-LuciaTCR克隆计数并在
RPMI 1640加10%FBShi中稀释至5×10E5个细胞/毫升,且将100μL添加至T2细胞中。培养板
在37℃和5%CO2下温育过夜。然后以400g离心培养板3分钟并将20μL上清液移至白色平底
Greiner板中。QUANTI-Luc底物是根据说明书制备且以每孔50μL添加。在Molecular 
Devices SpectraMax iE3x上读取荧光素酶表达。
[1061] 为了测试腺病毒盒的标志物表位递呈,使用U-87MG细胞作为替代抗原递呈细胞(APC)且用腺病毒载体转导。收集U-87MG细胞并以5×10E5个细胞/100μl涂铺于96孔Costar
组织培养板中的培养基中。在37℃温育培养板约2小时。用MEM加10%FBShi将腺病毒盒稀释
至MOI为100、50、10、5、1和0并将其以每孔5μl添加至U-87 MG细胞中。再在37℃下温育培养
板约2小时。对Jurkat-Lucia TCR克隆计数并在RPMI加10%FBShi中稀释至5×10E5个细胞/
毫升,且将其以每孔100μL添加至U-87MG细胞中。接着,在37℃及5%CO2下温育培养板约24
小时。以400g离心培养板3分钟并将20μL上清液移至白色平底Greiner板中。QUANTI-Luc底
物是根据说明书制备且以每孔50μL添加。在Molecular Devices SpectraMax iE3x上读取
荧光素酶表达。
[1062] 用于免疫原性研究的小鼠品系
[1063] 转基因HLA-A2.1(HLA-A2 Tg)小鼠是从Taconic Labs,Inc获得。这些小鼠携带由嵌合I类分子组成的转基因,该嵌合I类分子包含人HLA-A2.1前导序列、α1和α2结构域以及
鼠科H2-Kbα3、跨膜和细胞质域(Vitiello等人,1991)。用于所述研究的小鼠是基于C57Bl/6
背景的野生型BALB/cAnNTac雌性和纯合HLA-A2.1 Tg雄性的第一代后代(F1)。
[1064] 腺病毒载体(Ad5v)免疫接种
[1065] 经由两侧肌肉内注射至胫前肌中对HLA-A2 Tg小鼠免疫接种1×1010至1×106个腺病毒载体病毒粒子。在免疫接种后12天测量免疫应答。
[1066] 淋巴细胞分离
[1067] 从新鲜收集的经免疫接种小鼠的脾和淋巴结分离淋巴细胞。使用GentleMACS组织解离器,根据制造商的说明书,在含有10%胎牛血清与青霉素和链霉素的RPMI(完全RPMI)
中解离组织。
[1068] 离体酶联免疫斑点(enzyme-linked immunospot,ELISPOT)分析
[1069] ELISPOT分析是根据ELISPOT统一准则(Janetzki等人,2015),利用小鼠IFNg 5
ELISpotPLUS试剂盒(MABTECH)进行。将1×10 个脾细胞与10uM指定肽一起在涂有IFNg抗体
的96孔板中温育16小时。使用碱性磷酸酶使斑点显色。对反应定时10分钟并通过用自来水
流过板来淬灭反应。使用AID vSpot读取器谱图对斑点计数。对于ELISPOT分析,将饱和度>
50%的孔记录为“太多而无法计数”。将复制孔的偏差>10%的样品从分析中排除。然后,使
用下式,针对孔汇合度校正斑点计数:斑点计数+2×(斑点计数×汇合度%/[100%-汇合
度%])。通过用抗原刺激的孔减去阴性肽刺激孔中的斑点计数来校正阴性背景。最后,将标
记为太多而无法计数的孔设定成最高观察校正值,四舍五入至最接近的百分数。
[1070] 离体细胞内细胞因子染色(ICS)和流式细胞测量术分析
[1071] 将密度为2-5×106个细胞/毫升的新鲜分离的淋巴细胞与10uM指定肽一起温育2小时。两小时之后,添加布雷菲尔德菌素A(brefeldin A)达到5ug/ml浓度且将细胞与刺激
剂一起再温育4小时。刺激之后,用可固定的存活力染料eFluor780,根据制造商的方案标记
活细胞,并用以1:400稀释的抗CD8 APC(克隆53-6.7,BioLegend)染色。对于细胞内染色,使
用1:100稀释的抗IFNg PE(克隆XMG1.2,BioLegend)。将样品收集在Attune NxT流式细胞仪
(Thermo Scientific)上。使用FlowJo对流式细胞测量术数据绘图并分析。为了评定抗原特
异性反应的程度,计算响应于各肽刺激剂的IFNg+的CD8+细胞百分比以及总IFNg+细胞数
量/1×106个活细胞。
[1072] XIV.B.2.新抗原盒设计的体外评估
[1073] 作为新抗原盒设计评估的实例,开发体外基于细胞的分析以评定在模型疫苗盒内的所选人表位是否被抗原递呈细胞表达、加工和递呈(图15)。在识别后,经工程改造成表达
五种对明确表征的肽-HLA组合具有特异性的TCR之一的Jurkat-Lucia报告T细胞变得活化
且将活化T细胞核因子(NFAT)易位至核中,引起荧光素酶报告基因的转录活化。通过生物发
光定量个别报告CD8 T细胞系的抗原刺激。
[1074] 通过用表达构建体转导慢病毒来改进个别Jurkat-Lucia报告株,该表达构建体包括通过P2A核糖体跳跃序列(skip sequence)分离以确保等摩尔量翻译产物的抗原特异性
TCRβ和TCRα链(Banu等人,2014)。将第二CD8β-P2A-CD8α元件添加至慢病毒构建体中提供亲
代报告细胞系所缺乏的CD8辅助受体的表达,因为细胞表面上的CD8对于与靶pMHC分子的结
合亲和力至关重要并且通过接合其胞质尾区增强信号传导(Lyons等人,2006;Yachi等人,
2006)。
[1075] 在慢病毒转导之后,使Jurkat-Lucia报告细胞在嘌呤霉素选择下扩增,经历单细胞荧光辅助细胞分选(FACS)且测试单克隆群的荧光素酶表达。由此得到具有功能性细胞反
应的针对特定肽抗原1、2、4和5的稳定转导的报告细胞系。(表2)。
[1076] 表2:体外T细胞活化分析的发展。如通过荧光素酶的诱导所测量的肽特异性T细胞识别指示疫苗盒抗原的有效加工和递呈。
[1077]   短盒设计表位 AAY
1 24.5±0.5
2 11.3±0.4
3* n/a
4 26.1±3.1
5 46.3±1.9
[1078] *尚未产生的针对表位3的报告T细胞
[1079] 在另一实例中,对于一系列短盒,所有标志物表位均并入相同位置中(图16A)且仅分隔HLA-A*0201限制性表位的接头(图16B)是变化的。将报告T细胞个别地与被表达这些短
盒的腺病毒构建体感染的U-87抗原递呈细胞(APC)混合,并且相对于未感染对照组测量荧
光素酶表达。通过匹配报告T细胞识别模型盒中的全部四个抗原,展示多个抗原的有效加工
和递呈。T细胞反应的量值在很大程度上遵循天然和AAY-接头的类似趋势。从基于RR-接头
的盒释放的抗原显示较低荧光素酶诱导(表3)。被设计以破坏抗原加工的DPP-接头制造的
疫苗盒引起低表位递呈(表3)。
[1080] 表3:短盒中接头序列的评估。在体外T细胞活化分析中的荧光素酶诱导指示,除基于DPP的盒外,所有接头都有助于盒抗原的有效释放。仅T细胞表位(无接头)=9AA,天然接
头一侧=17AA,天然接头两侧=25AA,非天然接头=AAY、RR、DPP
[1081]
[1082] *尚未产生的针对表位3的报告T细胞
[1083] 在另一实例中,构建另外一系列的短盒,所述盒除人和小鼠表位外,还含有定位于该盒的N端或C端上的靶向序列如泛素(Ub)、MHC和Ig-κ信号肽(SP)和/或MHC跨膜(TM)基序。
(图17)。当通过腺病毒载体递送至U-87APC时,报告T细胞再次展示多个盒源性抗原的有效
加工和递呈。然而,各种靶向特征对于T细胞反应的量值无实质影响(表4)。
[1084] 表4:添加至模型疫苗盒的细胞靶向序列的评估。采用体外活化分析证实,四个HLA-A*0201限制性标志物表位从模型盒有效释放并且靶向序列没有实质改善T细胞识别和
活化。
[1085]
[1086] *尚未产生的针对表位3的报告T细胞
[1087] XIV.B.3.新抗原盒设计的体内评估
[1088] 作为新抗原盒设计评估的另一实例,疫苗盒经设计以含有5个已知以HLA-A*02:01限制性方式刺激CD8 T细胞的明确表征的人I类MHC表位(图16A、17、19A)。为了评估体内免
疫原性,将含有这些标志物表位的疫苗盒并入腺病毒载体中并用于感染HLA-A2转基因小鼠
(图18)。该小鼠模型携带的转基因部分地由人HLA-A*0201和小鼠H2-Kb组成,因此编码由人
HLA-A2.1前导序列、连接至鼠类α3的α1和α2域、跨膜和细胞质H2-Kb域组成的嵌合I类MHC分
子(Vitiello等人,1991)。所述嵌合分子允许HLA-A*02:01限制性抗原递呈,同时维持CD8辅
助受体与MHC上的α3域的物种相配的相互作用。
[1089] 对于短盒,如通过IFN-γELISPOT所测定,所有标志物表位产生T细胞反应,其程度比通常所报道的程度强约10-50倍(Cornet等人,2006;Depla等人,2008;Ishioka等人,
1999)。在评估的所有接头中,各自含有通过天然氨基酸序列侧接的极小表位的25聚体序列
多联体产生最大且最广泛的T细胞反应(表5)。细胞内细胞因子染色(ICS)和流式细胞测量
术分析揭示,抗原特异性T细胞反应是源自CD8 T细胞。
[1090] 表5:短盒中接头序列的体内评估。ELISPOT数据指示,HLA-A2转基因小鼠在用1e11腺病毒病毒粒子感染后17天,针对盒中的所有I类MHC限制性表位产生T细胞反应。
[1091]
[1092] 在另一实例中,构建一系列长疫苗盒并将其并入腺病毒载体中,其紧邻着原始的5个标志物表位含有另外16个具有已知CD8T细胞反应性的HLA-A*02:01、A*03:01和B*44:05
表位(图19A、B)。这些长盒的尺寸近似地模仿最终临床盒设计,并且只有表位相对于彼此的
位置是不同的。对于长疫苗盒与短疫苗盒,CD8 T细胞反应在量值及广度方面是相当的,证
实(a)添加更多表位不会实质影响针对原始表位集合的免疫应答的量值,以及(b)表位在盒
中的位置不会实质影响随之而来的针对其的T细胞反应(表6)。
[1093] 表6:有关长盒中表位位置的影响的体内评估。ELISPOT数据指示,对于长疫苗盒与短疫苗盒,HLA-A2转基因小鼠在用5e10腺病毒病毒粒子感染后17天,产生的T细胞反应的量
值相当。
[1094]
[1095] *疑似技术失误引起T细胞反应的缺乏。
[1096] XIV.B.4.用于免疫原性和毒理学研究的新抗原盒设计
[1097] 总体而言,有关模型盒评估的研究结果(图16-19,表2-6)证实,对于模型疫苗盒,当采用“珠串(string of beads)”法在基于腺病毒的载体的背景下编码约20个表位时,实
现强大的免疫原性。所述表位通过串接25聚体序列组装,所述序列各自嵌入在两侧上通过
其天然、周围肽序列(例如在每一侧上的8个氨基酸残基)侧接的极小CD8 T细胞表位(例如9
个氨基酸残基)。如本文所用,“天然”或“原生”侧接序列是指给定表位在该表位处于其源蛋白质内的天然存在环境中的N端和/或C端侧接序列。举例来说,HCMV pp65 MHC I表位
NLVPMVATV通过原生5'序列WQAGILAR侧接于其5'端上且通过原生3'序列QGQNLKYQ侧接于其
3'端上,由此产生在HCMV pp65源蛋白质内发现的25聚体肽WQAGILARNLVPMVATVQGQNLKYQ。
天然或原生序列也可指编码通过原生侧接序列侧接的表位的核苷酸序列。每个25聚体序列
直接连接至后面的25聚体序列。在极小CD8 T细胞表位大于或小于9个氨基酸的实例中,侧
接肽长度可以经调整以使得总长度仍为25聚体肽序列。举例来说,10个氨基酸的CD8 T细胞
表位可以通过8个氨基酸的序列和7个氨基酸侧接。多联体之后是两个通用的II类MHC表位,
包括所述表位是为了刺激CD4 T辅助细胞并改善疫苗盒抗原的总体体内免疫原性。
(Alexander等人,1994;Panina-Bordignon等人,1989)II类表位通过GPGPG氨基酸接头(SEQ 
ID NO:56)连接至最终I类表位。该两个II类表位也通过GPGPG氨基酸接头彼此连接且通过
GPGPG氨基酸接头侧接在C端上。表位的位置和数量似乎都不会实质影响T细胞识别或反应。
靶向序列似乎也不会实质影响盒源性抗原的免疫原性。
[1098] 作为另一实例,基于用模型盒获得的体外及体内数据(图16-19,表2-6),产生交替已知在非人灵长类动物(NHP)、小鼠和人中具有免疫原性的明确表征的T细胞表位的盒设
计。全部嵌入天然25聚体序列中的20个表位之后是存在于所评估的所有模型盒中的两个通
用II类MHC表位(图20)。使用这种盒设计在多个物种中研究免疫原性以及药理学和毒理学
研究。
[1099] XV.ChAd新抗原盒递送载体
[1100] XV.A.ChAd新抗原盒递送载体构建
[1101] 在一个实例中,将黑猩猩腺病毒(ChAd)工程改造成用于新抗原盒的递送载体。在另一实例中,基于缺失E1(nt 457至3014)和E3(nt 27,816-31,332)序列的AC_000011.1(来
自专利US 6083716的序列2)合成全长ChAdV68载体。插入处于CMV启动子/增强子控制下的
报告基因代替缺失的E1序列。将该克隆转染至HEK293细胞中不会产生感染性病毒。为了确
定野生型C68病毒的序列,从ATCC获得分离株VR-594,传代,然后独立测序(SEQ ID NO:10)。
当将AC_000011.1序列与野生型ChAdV68病毒的ATCC VR-594序列(SEQ ID NO:10)相比较
时,鉴定出6个核苷酸差异。在一个实例中,基于相应ATCC VR-594核苷酸在五个位置被取代
的AC_000011.1产生经修饰的ChAdV68载体(ChAdV68.5WTnt SEQ ID NO:1)。
[1102] 在另一实例中,基于缺失E1(nt 577至3403)和E3(nt 27,816-31,332)序列且相应ATCC VR-594核苷酸在四个位置被取代的AC_000011.1产生经修饰的ChAdV68载体。插入处
于CMV启动子/增强子控制下的GFP报告蛋白(ChAdV68.4WTnt.GFP;SEQ ID NO:11)或模型新
抗原盒(ChAdV68.4WTnt.MAG25mer;SEQ ID NO:12)代替缺失的E1序列。
[1103] 在另一实例中,基于缺失E1(nt 577至3403)和E3(nt 27,125-31,825)序列且相应ATCC VR-594核苷酸在五个位置被取代的AC_000011.1产生经修饰的ChAdV68载体。插入处
于CMV启动子/增强子控制下的GFP报告蛋白(ChAdV68.5WTnt.GFP;SEQ ID NO:13)或模型新
抗原盒(ChAdV68.5WTnt.MAG25mer;SEQ ID NO:2)代替缺失的E1序列。
[1104]
[1105]
[1106]
[1107]
[1108]
[1109]
[1110]
[1111]
[1112]
[1113]
[1114]
[1115]
[1116]
[1117]
[1118]
[1119]
[1120]
[1121]
[1122]
[1123]
[1124]
[1125]
[1126]
[1127]
[1128]
[1129]
[1130]
[1131]
[1132]
[1133]
[1134]
[1135]
[1136]
[1137]
[1138]
[1139]
[1140]
[1141]
[1142] XV.B.ChAd新抗原盒递送载体测试
[1143] XV.B.1.ChAd载体评估方法和材料
[1144] 使用脂染胺转染HEK293A细胞
[1145] 使用以下方案,制备ChAdV68构建体(ChAdV68.4WTnt.GFP、ChAdV68.5WTnt.GFP、ChAdV68.4WTnt.MAG25mer和ChAdV68.5WTnt.MAG25mer)的DNA并将其转染至HEK293A细胞
中。
[1146] 用PacI消化10ug质粒DNA以释放病毒基因组。然后,根据制造商的说明书,对于较长DNA片段,使用GeneJet DNA净化微型柱(DNA cleanup Micro columns;Thermo Fisher)
纯化DNA,并且在20ul预热的水中洗脱;在洗脱步骤之前,使柱在37℃下保持0.5-1小时。
[1147] 在转染之前,将HEK293A以106个细胞/孔的细胞密度引入6孔培养板中,保持14-18小时。用每孔1ml新鲜培养基(含青霉素/链霉素和谷氨酸的DMEM-10%hiFBS)覆盖细胞。在
根据制造商的方案,用微升体积(2-4ul)脂染胺2000两次转染中使用每孔1-2ug的纯化DNA。
将0.5ml含有转染混合物的OPTI-MEM培养基添加至各孔中的1ml标准生长培养基中并在细
胞上保持过夜。
[1148] 在37℃下温育经转染的细胞培养物至少5-7天。如果在转染后第7天未见到病毒蚀斑,则将细胞以1:4或1:6分离,并在37℃下温育以监测蚀斑的产生。或者,收集经转染的细
胞且进行3个循环的冷冻和解冻,并使用细胞溶解产物感染HEK293A细胞且温育细胞直至观
察到病毒蚀斑。
[1149] 使用磷酸钙将ChAdV68转染至HEK293A细胞中并产生第三代病毒原液
[1150] 使用以下方案,制备ChAdV68构建体(ChAdV68.4WTnt.GFP、ChAdV 68.5WTnt.GFP、ChAdV68.4WTnt.MAG25mer、ChAdV68.5WTnt.MAG25 mer)的DNA并将其转染至HEK293A细胞
中。
[1151] 在转染前一天,将HEK293A细胞以106个细胞/孔接种于6孔板的5%BS/DMEM/1XP/S、1XGlutamax中。每次转染需要两个孔。在转染前二至四小时,将培养基更换成新鲜培养
基。用PacI使ChAdV68.4WTnt.GFP质粒线性化。然后,用酚氯仿提取经线性化的DNA并使用十
分之一体积的3M乙酸钠pH 5.3和两体积的100%乙醇使其沉淀。通过以12,000xg离心5分钟
使沉淀的DNA集结,然后用70%乙醇洗1次。空气干燥集结粒并使其再悬浮于50μL无菌水中。
使用NanoDropTM(ThermoFisher)测定DNA浓度并将体积调整至5μg DNA/50μL。
[1152] 将169μL无菌水添加至微量离心管中。然后将5μL 2M CaCl2添加至水中并通过移液管移液徐缓地混合。将50μL DNA逐滴添加至CaCl2水溶液中。然后添加26微升2M CaCl2并
通过微量移液管移液两次徐缓地混合。此最终溶液应由5μg DNA于250μL的0.25M CaCl2中
组成。然后制备含有250μL的2XHBS(Hepes缓冲溶液)的第二管。使用连接至Pipet-Aid空气
的2mL无菌移液管缓慢鼓泡通过2XHBS溶液。同时,逐滴添加于0.25M CaCl2溶液中的DNA溶
液。在添加最终DNA液滴之后,继续鼓泡约5秒。接着在室温温育溶液达20分钟,然后添加至
293A细胞中。将250μLDNA/磷酸钙溶液逐滴添加至前一天以106个细胞/孔接种于6孔板中的
293A细胞单层中。将细胞放回温育箱中并温育过夜。24小时后更换培养基。72小时后,将细
胞以1:6分至6孔板中。每天通过光学显微镜检查监测细胞单层的细胞病变效应(CPE)的迹
象。转染后7-10天,观察到病毒蚀斑且通过用移液管吸移孔中的培养基以使细胞升高来收
集细胞单层。将收集的细胞和培养基转移至50mL离心管中,接着进行三轮冷冻解冻(在-80
℃和37℃下)。随后的溶解产物,称为初代病毒原液,通过在桌上型(bench top)离心机
(4300Xg)上全速离心来澄清且使用一部分溶解产物(10-50%)感染T25烧瓶中的293A细胞。
将感染的细胞温育48小时,然后在完全CPE下收集细胞和培养基。再次收集细胞,冷冻解冻
并澄清,然后使用此第二代病毒原液感染每个烧瓶接种1.5×107个细胞的T150烧瓶。一旦
在72小时实现完全CPE,就以先前病毒原液相同的方式收集并处理培养基和细胞以产生第
三代原液。
[1153] 在293F细胞中的制造
[1154] 在8%CO2的温育箱中,在293FreeStyleTM(ThermoFisher)培养基中生长的293F细胞中进行ChAdV68病毒的制造。感染当天,将细胞稀释至106个细胞/毫升,存活率为98%,并
在每个制造操作于1L摇瓶(Corning)中使用400mL。每次感染使用靶MOI>3.3的4mL第三代病
毒原液。将细胞温育48-72小时,直至通过台盼蓝测量到存活率<70%。然后,通过全速桌上
型离心机离心来收集经感染细胞并在1XPBS中洗涤,再离心,然后使其再悬浮于20mL的10mM 
Tris pH7.4中。通过冷冻解冻3次将细胞集结粒溶解并通过以4,300Xg离心5分钟使其澄清。
[1155] 通过CsCl离心纯化
[1156] 通过CsCl离心使病毒DNA纯化。执行两次不连续梯度操作。第一次是从细胞组分中纯化出病毒并且第二次是从细胞组分进一步优化分离并将缺陷性粒子与感染性粒子分离。
[1157] 将10mL的1.2(26.8g CsCl溶解于92mL的10mM Tris pH 8.0中)CsCl添加至异质同晶聚合物管中。然后,使用移液管递送至管底部,小心地添加8mL的1.4CsCl(53g CsCl溶解
于87mL的10mM Tris pH 8.0中)。将澄清的病毒小心地铺在该1.2层的顶部上。必要时,再添
加10mM Tris以使各管平衡。然后将所述管置放于SW-32Ti旋转器中并在10℃下离心2小时
30分钟。然后将所述管移至层流柜中并使用18号针和10mL针筒抽吸病毒带。应避免取出污
染性宿主细胞DNA和蛋白质。然后用10mM Tris pH 8.0将该病毒带稀释至少2倍并如前所述
铺在如上文所描述的不连续梯度上。如前所述进行操作,其中例外为此时进行该操作过夜。
次日,小心抽吸病毒带以避免抽吸出任何缺陷性粒子带。然后使用Slide-A-LyzerTM盒
(Pierce)针对ARM缓冲液(20mM Tris pH 8.0、25mM NaCl、2.5%丙三醇)透析病毒。进行此
操作3次,每次更换缓冲液保持1小时。然后将病毒等分以在-80℃下储存。
[1158] 病毒分析
[1159] 基于1.1×1012个病毒粒子(VP)的消光系数相当于在OD260 nm下的吸光度值1,通过使用OD 260分析测定VP浓度。在病毒溶解缓冲液(0.1%SDS、10mM Tris pH 7.4、1mM 
EDTA)中制备腺病毒的两种稀释液(1:5和1:10)。一式两份测量该两种稀释液的OD并且通过
用OD260值乘以稀释因子乘以1.1×1012VP来测量每毫升VP浓度。
[1160] 利用病毒原液的限制性稀释分析来计算感染单位(IU)滴度。病毒最初在DMEM/5%NS/1X PS中100倍稀释,随后使用10倍稀释法稀释至1X10-7。然后,将100μL这些稀释液添加
至在之前至少一小时以3e5个细胞/孔接种于24孔板中的293A细胞中。此操作一式两份进
行。在37℃下,在CO2(5%)温育箱中温育板48小时。然后用1XPBS洗涤细胞,且接着用100%
冷甲醇(-20℃)固定。然后在-20℃温育所述板最少20分钟。用1XPBS洗涤各孔,然后在室温
下在1×PBS/0.1%BSA中阻断1小时。添加兔抗Ad抗体(Abcam,Cambridge,MA)于阻断缓冲液
中的1:8,000稀释液(每孔0.25ml)并在室温下温育1小时。用每孔0.5mL PBS洗涤各孔4次。
每孔添加1000倍稀释的HRP结合的山羊抗兔抗体(Bethyl Labs,Montgomery Texas)并温育
1小时,然后进行最后一轮洗涤。进行5次PBS洗涤并使用于含0.01%H2O2的Tris缓冲生理食
盐水中的二氨基联苯胺四盐酸盐(Diaminobenzidine tetrahydrochloride,DAB)底物
(0.67mg/mL DAB于50mM Tris pH 7.5、150mM NaCl)使所述板显色。使各孔显色5分钟,然后
计数。使用产生每个视野4-40个经染色细胞的稀释液,在10X下对细胞计数。所用视野是
0.32mm2栅格,相当于在24孔板上每个视野有625个栅格。可以通过每个栅格中经染色细胞
的数量乘以每个视野的栅格数量乘以稀释因子10来测定每毫升中感染性病毒的数量。类似
地,当用GFP表达性细胞操作时,可以使用荧光而非衣壳染色来测定每毫升中GFP表达性病
毒粒子的数量。
[1161] 免疫接种
[1162] 经两侧肌肉内注射向C57BL/6J雌性小鼠和Balb/c雌性小鼠注射1×108个ChAdV68.5WTnt.MAG25mer病毒粒子(VP),体积为100uL(每条腿50uL)。
[1163] 脾细胞解离
[1164] 将每只小鼠的脾和淋巴结汇集于3mL完全RPMI(RPMI、10%FBS、青霉素/链霉素)中。使用gentleMACS解离器(Miltenyi Biotec),遵循制造商的方案进行机械解离。通过40
微米过滤器过滤解离的细胞并用ACK溶解缓冲液(150mM NH4Cl、10mM KHCO3、0.1mM 
Na2EDTA)溶解红细胞。再次经由30微米过滤器过滤细胞且然后使其再悬浮于完全RPMI中。
在Attune NxT流式细胞仪(Thermo Fisher)上使用碘化丙锭染色对细胞计数以排除死亡和
凋亡的细胞。然后将细胞调整至适当活细胞浓度以供后续分析。
[1165] 离体酶联免疫斑点(ELISPOT)分析
[1166] ELISPOT分析是根据ELISPOT统一准则{DOI:10.1038/nprot.2015.068},利用小鼠4
IFNg ELISpotPLUS试剂盒(MABTECH)进行。将5×10 个脾细胞与10uM指定肽一起在涂有
IFNg抗体的96孔板中温育16小时。使用碱性磷酸酶使斑点显色。对反应定时10分钟并通过
用自来水流过板终止反应。使用AID vSpot读取器谱图对斑点计数。对于ELISPOT分析,将饱
和度>50%的孔记录为“太多而无法计数”。将复制孔的偏差>10%的样品从分析中排除。然
后,使用下式,针对孔汇合度校正斑点计数:斑点计数+2×(斑点计数×汇合度%/[100%-
汇合度%])。通过用抗原刺激的孔减去阴性肽刺激孔中的斑点计数来校正阴性背景。最后,
将标记为太多而无法计数的孔设定成最高观察校正值,四舍五入至最接近的百分数。
[1167] XV.B.2.在DNA转染之后ChAdV68病毒递送粒子的制造
[1168] 在一个实例中,将ChAdV68.4WTnt.GFP(图21)和ChAdV68.5WTnt.GFP(图22)DNA转染至HEK293A细胞中并在转染之后7-10天观察病毒复制(病毒蚀斑)。使用光学显微镜检查
(图21A和22A)和荧光显微镜检查(图21B-C和图22B-C)观测ChAdV68病毒蚀斑。GFP表示产毒
ChAdV68病毒递送粒子的产生。
[1169] XV.B.3.ChAdV68病毒递送粒子扩增
[1170] 在一个实例中,使ChAdV68.4WTnt.GFP、ChAdV68.5WTnt.GFP和ChAdV68.5WTnt.MAG25mer病毒在HEK293F细胞中扩增并在转染之后18天,制备纯化的病毒
原液(图23)。定量经纯化ChAdV68病毒原液中的病毒粒子数且与使用相同方案制造的5型腺
病毒(Ad5)和ChAdVY25(密切相关的ChAdV;Dicks,2012,PloSONE 7,e40385)病毒原液相比
较。ChAdV68病毒滴度与Ad5和ChAdVY25相当(表7)。
[1171] 表7.在293F悬浮细胞中产生腺病毒载体
[1172] 构建体 平均VP/细胞+/-SDAd5-载体(多个载体) 2.96e4+/-2.26e4
Ad5-GFP 3.89e4
chAdY25-GFP 1.75e3+/-6.03e1
ChAdV68.4WTnt.GFP 1.2e4+/-6.5e3
ChAdV68.5WTnt.GFP 1.8e3
ChAdV68.5WTnt.MAG25mer 1.39e3+/-1.1e3
[1173] *SD仅在执行多个制造操作情况下报道
[1174] XV.B.4.肿瘤模型中的免疫原性评估
[1175] 在小鼠免疫原性研究中评估表达小鼠肿瘤抗原的C68载体以证实C68载体引起T细胞反应。在C57BL/6J雌性小鼠中测量针对I类MHC表位SIINFEKL的T细胞反应并在Balb/c小
鼠中测量针对I类MHC表位AH1-A5(Slansky等人,2000,Immunity13:529-538)的T细胞反应。
如图29中所示,在对小鼠免疫接种ChAdV68.5WTnt.MAG25mer之后测量到相对于对照较强的
T细胞反应。当对C57BL/6J或Balb/c小鼠免疫接种ChAdV68.5WTnt.MAG25mer时,在免疫接种
之后10天,在ELISpot分析中分别观察到每106个脾细胞8957个或4019个斑点形成细胞
(SFC)的平均细胞免疫应答。
[1176] XVI.甲病毒新抗原盒递送载体
[1177] XVI.A.甲病毒递送载体评估材料和方法
[1178] 体外转录以产生RNA
[1179] 对于体外测试:通过用PmeI限制性消化使质粒DNA线性化,遵循制造商的方案(GeneJet DNA净化试剂盒,Thermo)进行柱纯化并用作模板。根据制造商的方案,使用
RiboMAX大规模RNA生产系统(Promega),利用m7G帽类似物(Promega)进行体外转录。根据制
造商的方案,使用RNeasy试剂盒(Qiagen)纯化mRNA。
[1180] 对于体内研究:产生RNA且由TriLInk Biotechnologies纯化并用Enzymatic Cap1封端。
[1181] RNA转染
[1182] 转染前约16小时,HEK293A细胞对于96孔是以6e4个细胞/孔接种且对于24孔是以2e5个细胞/孔接种。使用MessengerMAX脂染胺(Invitrogen)且遵循制造商的方案,用mRNA
转染细胞。对于96孔,每孔使用0.15uL脂染胺和10ng mRNA,且对于24孔,每孔使用0.75uL脂
染胺和150ng mRNA。GFP表达mRNA(TriLink Biotechnologies)用作转染对照。
[1183] 荧光素酶分析
[1184] 使用ONE-Glo荧光素酶分析(Promega),遵循制造商的方案,在每种条件下于白色壁96孔板中一式三份进行荧光素酶报告蛋白分析。使用SpectraMax测量发光。
[1185] qRT-PCR
[1186] 在转染后2小时,用新鲜培养基冲洗经转染的细胞并更换培养基以移除任何未经转染的mRNA。然后,在多个时间点,将细胞收集于RLT plus溶解缓冲液(Qiagen)中,使用
QiaShredder(Qiagen)均质化并使用RNeasy试剂盒(Qiagen)提取RNA,所有操作都遵循制造
商的方案。使用Nanodrop(Thermo Scientific)定量总RNA。根据制造商的方案,在qTower3
(Analytik Jena)上使用Quantitect探针一步法RT-PCR试剂盒(Probe One-Step RT-PCR 
kit;Qiagen)进行qRT-PCR,每一反应使用20ng总RNA。对于每个探针,各样品是一式三份地
操作。肌动蛋白或GusB用作参考基因。定制引物/探针由IDT产生(表8)。
[1187] 表8.qPCR引物/探针
[1188]
[1189]
[1190] B16-OVA肿瘤模型
[1191] 在C57BL/6J小鼠左下方侧腹部中注射105个B16-OVA细胞/动物。在免疫接种之前,使肿瘤生长3天。
[1192] CT26肿瘤模型
[1193] 在Balb/c小鼠左下方侧腹部中注射106个CT26细胞/动物。在免疫接种之前,使肿瘤生长7天。
[1194] 免疫接种
[1195] 对于srRNA疫苗,经两侧肌肉内注射向小鼠注射10ug RNA,体积100uL(每条腿50uL)。对于Ad5疫苗,经两侧肌肉内注射向小鼠注射5×1010个病毒粒子(VP),体积100uL(每
条腿50uL)。每周2次,经由腹膜内注射向动物注射250ug剂量的抗CTLA-4(克隆9D9,
BioXcell)、抗PD-1(克隆RMP1-14,BioXcell)或抗IgG(克隆MPC-11,BioXcell)。
[1196] 体内生物发光成像
[1197] 在每个时间点,经由腹膜内注射向小鼠注射150mg/kg荧光素底物并在注射之后10-15分钟,使用IVIS体内成像系统(PerkinElmer)测量生物发光。
[1198] 脾细胞解离
[1199] 将每只小鼠的脾和淋巴结汇集于3mL完全RPMI(RPMI、10%FBS、青霉素/链霉素)中。使用gentleMACS解离器(Miltenyi Biotec),遵循制造商的方案进行机械解离。通过40
微米过滤器过滤解离的细胞并用ACK溶解缓冲液(150mM NH4Cl、10mM KHCO3、0.1mM 
Na2EDTA)溶解红细胞。再次经由30微米过滤器过滤细胞,然后使其再悬浮于完全RPMI中。在
Attune NxT流式细胞仪(Thermo Fisher)上使用碘化丙锭染色对细胞计数以排除死亡和凋
亡的细胞。然后将细胞调整至适当活细胞浓度以供后续分析。
[1200] 离体酶联免疫斑点(ELISPOT)分析
[1201] ELISPOT分析是根据ELISPOT统一准则{DOI:10.1038/nprot.2015.068},利用小鼠IFNg ELISpotPLUS试剂盒(MABTECH)进行。将5×104个脾细胞与10uM指定肽一起在涂有
IFNg抗体的96孔板中温育16小时。使用碱性磷酸酶使斑点显色。对反应定时10分钟并通过
用自来水流过板终止反应。使用AID vSpot读取器谱图对斑点计数。对于ELISPOT分析,将饱
和度>50%的孔记录为“太多而无法计数”。将复制孔的偏差>10%的样品从分析中排除。然
后,使用下式,针对孔汇合度校正斑点计数:斑点计数+2×(斑点计数×汇合度%/[100%-
汇合度%])。通过用抗原刺激的孔减去阴性肽刺激孔中的斑点计数来校正阴性背景。最后,
将标记为太多而无法计数的孔设定成最高观察校正值,四舍五入至最接近的百分数。
[1202] XVI.B.甲病毒载体
[1203] XVI.B.1.甲病毒载体体外评估
[1204] 在本发明的一个实施方式中,从基于委内瑞拉马脑炎(VEE)(Kinney,1986,Virology 152:400-413)的自我复制RNA(srRNA)载体产生用于新抗原表达系统的RNA甲病
毒骨架。在一个实例中,编码位于26S亚基因组启动子3'端的VEE结构蛋白的序列缺失(VEE
序列7544至11,175缺失;编号基于Kinney等人1986;SEQ ID NO:6)且被抗原序列(SEQ ID 
NO:14和SEQ ID NO:4)或荧光素酶报告蛋白(例如VEE-荧光素酶,SEQ ID NO:15)替换(图
24)。由srRNA DNA载体体外转录RNA,将其转染至HEK293A细胞中并测量荧光素酶报告蛋白
表达。此外,用编码荧光素酶的(非复制性)mRNA转染以供比较。当比较23小时测量值与2小
时测量值时,对于VEE-荧光素酶srRNA观察到srRNA报告基因信号有约30,000倍增加(表9)。
相比之下,在相同时间段内,mRNA报告基因展现小于10倍的信号增加(表9)。
[1205] 表9.来自VEE自我复制载体的荧光素酶的表达随时间增加。在96孔中用每孔10ngVEE-荧光素酶srRNA或10ng非复制性荧光素酶mRNA(TriLink L-6307)转染HEK293A细
胞。在转染后多个时间测量发光。荧光素酶表达以相对发光单位(RLU)报道。每个数据点是3
个转染孔的平均值+/-SD。
[1206]
[1207] 在另一实例中,通过使用定量逆转录聚合酶链反应(qRT-PCR)测量编码荧光素酶的srRNA(VEE-荧光素酶)或编码多表位盒的srRNA(VEE-MAG25mer)转染之后的RNA含量来直
接确定srRNA的复制。对于VEE-荧光素酶srRNA观察到约150倍的RNA增加(表10),而对于
VEE-MAG25mer srRNA观察到30-50倍的RNA增加(表11)。这些数据证实,当转染至细胞中时,
VEE srRNA载体复制。
[1208] 表10.VEE-荧光素酶srRNA转染的细胞中RNA复制的直接测量。用VEE-荧光素酶srRNA(150ng/孔,24孔)转染HEK293A细胞并在转染之后多个时间,通过qRT-PCR定量RNA水
平。基于肌动蛋白参考基因使各测量值归一化并呈现相对于2小时时间点的倍数变化。
[1209]
[1210] 表11.VEE-MAG25mer srRNA转染的细胞中RNA复制的直接测量。用VEE-MAG25mer srRNA(150ng/孔,24孔)转染HEK293细胞并在转染之后多个时间,通过qRT-PCR定量RNA水
平。基于GusB参考基因使各测量值归一化并呈现相对于2小时时间点的倍数变化。图上的不
同线表示2个不同的qPCR引物/探针集,该两个集合都检测srRNA的表位盒区。
[1211]
[1212] XVI.B.2.甲病毒载体的体内评估
[1213] 在另一实例中,在体内评估VEE-荧光素酶报告蛋白表达。对小鼠注射10ug封装于脂质纳米粒子(MC3)中的VEE-荧光素酶srRNA并在注射后24小时和48小时,以及7天和14天
使其成像以测定生物发光信号。在注射后24小时检测到荧光素酶信号且其随时间增加,并
在srRNA注射之后7天出现峰值(图25)。
[1214] XVI.B.3.甲病毒载体肿瘤模型评估
[1215] 在一个实施方式中,为了确定VEE srRNA载体是否在体内引导抗原特异性免疫应答,产生表达2种不同I类MHC小鼠肿瘤表位SIINFEKL和AH1-A5的VEE srRNA载体(VEE-
UbAAY,SEQ ID NO:14)(Slansky等人,2000,Immunity 13:529-538)。利用B16-OVA黑素瘤细
胞系表达SFL(SIINFEKL)表位,并且AH1-A5(SPSYAYHQF;Slansky等人,2000,Immunity)表位
诱导T细胞靶向由CT26结肠癌细胞系表达的相关表位(AH1/SPSYVYHQF;Huang等人,1996,
Proc Natl Acad Sci USA 93:9730-9735)。在一个实例中,对于体内研究,通过使用T7聚合
酶(TriLink Biotechnologies)体外转录来产生VEE-UbAAY srRNA并将其包封在脂质纳米
粒子(MC3)中。
[1216] 在用MC3配制的VEE-UbAAY srRNA免疫接种带有B16-OVA肿瘤的小鼠之后两周,观察到相对于对照强烈的靶向SFL的抗原特异性T细胞反应。在一个实例中,在用SFL肽刺激之
后,在ELISpot分析中测量每106个脾细胞3835个(中值)斑点形成细胞(SFC)(图26A,表12)
并且如通过五聚体染色所测量,1.8%(中值)的CD8 T细胞具有SFL抗原特异性(图26B,表
12)。在另一实例中,共同施用抗CTLA-4单克隆抗体(mAb)与VEE srRNA疫苗引起总体T细胞
6
反应的适度增加,并且在ELISpot分析中测量到每10 个脾细胞的4794.5个(中值)SFC(图
26A,表12)。
[1217] 表12.在带有B16-OVA肿瘤的C57BL/6J小鼠中VEE srRNA免疫接种后14天ELISPOT和MHCI-五聚体染色分析的结果。
[1218]
[1219] *应注意,从Vax组中小鼠#6得到的结果由于三个重复孔之间变化较大而从分析中排除。
[1220] 在另一实施方式中,为反映临床方法,在B16-OVA和CT26小鼠肿瘤模型中进行异源初免/加强免疫,其中带有肿瘤的小鼠先用表达相同抗原盒的腺病毒载体(Ad5-UbAAY)免疫
接种,接着在Ad5-UbAAY初免之后14天,用VEE-UbAAY srRNA疫苗加强免疫。在一个实例中,
通过Ad5-UbAAY疫苗诱导抗原特异性免疫应答,由此在ELISpot分析中测量到每106个脾细
胞7330个(中值)SFC(图27A,表13)并且通过五聚体染色测量到2.9%(中值)的CD8 T细胞靶
向SFL抗原(图27C,表13)。在另一实例中,在VEE-UbAAY srRNA加强免疫之后2周,B16-OVA模
型中仍维持T细胞反应,并且在ELISpot分析中测量到每106个脾细胞3960个(中值)SFL特异
性SFC(图27B,表13)并且通过五聚体染色测量到3.1%(中值)的CD8 T细胞靶向SFL抗原(图
27D,表13)。
[1221] 表13.用Ad5疫苗初免和srRNA加强免疫进行异源初免/加强免疫之后B16-OVA小鼠的免疫监测。
[1222]
[1223]
[1224] 在另一实施方式中,在Ad5-UbAAY初免和VEE-UbAAYsrRNA加强免疫之后,在CT26小鼠模型中观察到类似结果。在一个实例中,在Ad5-UbAAY初免(第14天)之后观察到AH1抗原
特异性反应并且在ELISpot分析中测量到每106个脾细胞平均5187个SFC(图28A,表14)并且
在VEE-UbAAY srRNA加强免疫(第28天)之后于ELISpot分析中测量到每106个脾细胞平均
3799个SFC(图28B,表14)。
[1225] 表14.在CT26肿瘤小鼠模型中异源初免/加强免疫之后的免疫监测。
[1226]
[1227] XVII.ChAdV/srRNA组合肿瘤模型评估
[1228] 在鼠类CT26肿瘤模型中评估使用ChAdV68和自我复制RNA(srRNA)的各种给药方案。
[1229] XVII.A ChAdV/srRNA组合肿瘤模型评估方法和材料
[1230] 肿瘤注入
[1231] 对Balb/c小鼠注入CT26肿瘤细胞系。肿瘤细胞注入之后7天,将小鼠随机分成不同研究组(28-40只小鼠/组)并开始治疗。在Balb/c小鼠左下方侧腹部中注射106个CT26细胞/
动物。在免疫接种之前,使肿瘤生长7天。研究组详细地描述于表15中。
[1232] 表15-ChAdV/srRNA组合肿瘤模型评估研究组
[1233]
[1234] 免疫接种
[1235] 对于srRNA疫苗,经两侧肌肉内注射对小鼠注射10ugVEE-MAG25mer srRNA,体积100uL(每条腿50μL)。对于C68疫苗,经两侧肌肉内注射对小鼠注射1×1011个
ChAdV68.5WTnt.MAG25mer病毒粒子(VP),体积100μL(每条腿50μL)。每周2次,经由腹膜内注
射对动物注射250ug剂量的抗PD-1(克隆RMP1-14,BioXcell)或抗IgG(克隆MPC-11,
BioXcell)。
[1236] 脾细胞解离
[1237] 将每只小鼠的脾和淋巴结汇集于3mL完全RPMI(RPMI、10%FBS、青霉素/链霉素)中。使用gentleMACS解离器(Miltenyi Biotec),遵循制造商的方案进行机械解离。经由40
微米过滤器过滤解离的细胞并用ACK溶解缓冲液(150mM NH4Cl、10mM KHCO3、0.1mMNa2EDTA)
溶解红细胞。再次经由30微米过滤器过滤细胞,然后使其再悬浮于完全RPMI中。在Attune 
NxT流式细胞仪(ThermoFisher)上使用碘化丙锭染色对细胞计数以排除死亡和凋亡的细
胞。然后将细胞调整至适当活细胞浓度以供后续分析。
[1238] 离体酶联免疫斑点(ELISPOT)分析
[1239] ELISPOT分析是根据ELISPOT统一准则{DOI:10.1038/nprot.2015.068},利用小鼠IFNg ELISpotPLUS试剂盒(MABTECH)进行。将5×104个脾细胞与10uM指定肽一起在涂有
IFNg抗体的96孔板中温育16小时。使用碱性磷酸酶使斑点显色。对反应定时10分钟并通过
用自来水流过板终止反应。使用AID vSpot读取器谱图对斑点计数。对于ELISPOT分析,将饱
和度>50%的孔记录为“太多而无法计数”。将复制孔的偏差>10%的样品从分析中排除。然
后,使用下式,针对孔汇合度校正斑点计数:斑点计数+2×(斑点计数×汇合度%/[100%-
汇合度%])。通过用抗原刺激的孔减去阴性肽刺激孔中的斑点计数来校正阴性背景。最后,
将标记为太多而无法计数的孔设定成最高观察校正值,四舍五入至最接近的百分数。
[1240] XVII.B CT26肿瘤模型中的ChAdV/srRNA组合评估
[1241] 在CT26小鼠肿瘤模型中评估ChAdV68.5WTnt.MAG25mer/VEE-MAG25mer srRNA异源初免/加强免疫或VEE-MAG25mersrRNA同源初免/加强免疫疫苗的免疫原性和功效。对Balb/
c小鼠注射CT26肿瘤细胞系。注射肿瘤细胞之后7天,将小鼠随机分成不同研究组并开始治
疗。研究组详细地描述于表15中且较粗略地描述于表16中。
[1242] 表16-初免/加强免疫研究组
[1243]
[1244] 在初免疫苗接种之后14天收集脾进行免疫监测。一周两次获取肿瘤和体重测量值并监测存活情况。在所有活性疫苗组中观察到相对于对照的强烈免疫应答。
[1245] 在第一次免疫接种之后14天,在ELISpot分析中,在分别免疫接种ChAdV68.5WTnt.MAG25mer(ChAdV/第3组)、ChAdV68.5WTnt.MAG25mer+抗PD-1(ChAdV+PD-1/
第4组)、VEE-MAG25mer srRNA(srRNA/第5组与第7组的组合的中值)或VEE-MAG25mer srRNA
+抗PD-1(srRNA+PD-1/第6组与第8组的组合的中值)的小鼠中观察到每106个脾细胞10,630
个、12,976个、3319个或3745个斑点形成细胞(SFC)的中值细胞免疫应答(图30和表17)。相
比之下,疫苗对照(第1组)或疫苗对照与抗PD-1的组合(第2组)分别展现每106个脾细胞296
个或285个SFC的中值细胞免疫应答。
[1246] 表17-CT26肿瘤模型中的细胞免疫应答
[1247]
[1248] 与ELISpot数据相符,在第一次免疫接种之后14天,免疫接种ChAdV68.5WTnt.MAG25mer(ChAdV/第3组)、ChAdV68.5WTnt.MAG25mer+抗PD-1(ChAdV+PD-1/
第4组)、VEE-MAG25mer srRNA(srRNA/第5组与第7组的组合的中值)或VEE-MAG25mer srRNA
+抗PD-1(srRNA+PD-1/第6组与第8组的组合的中值)的小鼠中分别有5.6%、7.8%、1.8%或
1.9%的CD8 T细胞(中值)在细胞内细胞因子染色(ICS)分析中展现抗原特异性反应(图31
和表18)。免疫接种疫苗对照或疫苗对照与抗PD-1的组合的小鼠分别显示0.2%及0.1%的
抗原特异性CD8反应。
[1249] 表18-CT26肿瘤模型中的CD8 T细胞反应
[1250]
[1251]
[1252] 在CT26结肠肿瘤模型中测量所有组的肿瘤生长情况,且到开始治疗后21天(注射CT-26肿瘤细胞之后28天),出现肿瘤生长。在开始治疗后21天,基于较大肿瘤尺寸(>
2500mm3)处死小鼠;因此,仅呈现前21天以避免分析偏差。ChAdV68.5WTnt.MAG25mer初免/
VEE-MAG25mer srRNA加强免疫(第3组)、ChAdV68.5WTnt.MAG25mer初免/VEE-MAG25mer 
srRNA加强免疫+抗PD-1(第4组)、VEE-MAG25mer srRNA初免/ChAdV68.5WTnt.MAG25mer加强
免疫(第5组)、VEE-MAG25mer srRNA初免/ChAdV68.5WTnt.MAG25mer加强免疫+抗PD-1(第6
组)、VEE-MAG25mer srRNA初免/VEE-MAG25mer srRNA加强免疫(第7组)和VEE-MAG25mer 
srRNA初免/VEE-MAG25mer srRNA加强免疫+抗PD-1(第8组)在21天时的平均肿瘤体积分别
为1129、848、2142、1418、2198和1606mm3(图32和表19)。疫苗对照或疫苗对照与抗PD-1的组
合的平均肿瘤体积分别为2361或2067mm3。基于这些数据,用ChAdV68.5WTnt.MAG25mer/
VEE-MAG25mer srRNA(第3组)、ChAdV68.5WTnt.MAG25mer/VEE-MAG25mer srRNA+抗PD-1(第
4组)、VEE-MAG25mer srRNA/ChAdV68.5WTnt.MAG25mer+抗PD-1(第6组)和VEE-MAG25mer 
srRNA/VEE-MAG25mer srRNA+抗PD-1(第8组)的疫苗治疗在21天时引起肿瘤生长减慢,这显
著不同于对照(第1组)。
[1253] 表19-第21天测量的CT26模型中的肿瘤尺寸
[1254]
[1255]
[1256] 在CT-26肿瘤模型中,在开始治疗后,监测存活情况35天(注射CT-26肿瘤细胞之后42天)。在小鼠疫苗接种4个测试组合之后,观察到存活率提高。在疫苗接种之后,利用
ChAdV68.5WTnt.MAG25mer初免/VEE-MAG25mer srRNA加强免疫与抗PD-1的组合(第4组;相
对于对照组1,P<0.0001)、VEE-MAG25mer srRNA初免/VEE-MAG25mer srRNA加强免疫与抗
PD-1的组合(第8组;相对于对照组1,P=0.0006)、ChAdV68.5WTnt.MAG25mer初免/VEE-
MAG25mer srRNA加强免疫(第3组;相对于对照组1,P=0.0003)以及VEE-MAG25mer srRNA初
免/ChAdV68.5WTnt.MAG25mer加强免疫与抗PD-1的组合(第6组;相对于对照组1,P=
0.0016)的小鼠的存活率分别为64%、46%、41%和36%(图33和表20)。其余治疗组[VEE-
MAG25mer srRNA初免/ChAdV68.5WTnt.MAG25mer加强免疫(第5组)、VEE-MAG25mer srRNA初
免/VEE-MAG25mer srRNA加强免疫(第7组)和单独抗PD-1(第2组)]的存活率与对照组1无显
著不同(≤14%)。
[1257] 表20-CT26模型中的存活率
[1258]
[1259] 总之,相对于对照,ChAdV68.5WTnt.MAG25mer和VEE-MAG25mer srRNA引起针对由疫苗编码的小鼠 肿瘤抗原的强烈T细胞反应。向带有 肿瘤的 小鼠 施用
ChAdV68.5WTnt.MAG25mer初免和VEE-MAG25mer srRNA加强免疫并且共同施用或不共同施
用抗PD-1、施用VEE-MAG25mer srRNA初免和ChAdV68.5WTnt.MAG25mer加强免疫与抗PD-1的
组合或施用VEE-MAG25mer srRNA同源初免加强免疫与抗PD-1的组合使存活率提高。
[1260] XVIII.非人灵长类动物研究
[1261] 在非人灵长类动物(NHP)中评估使用ChAdV68和自我复制RNA(srRNA)的各种给药方案。
[1262] 材料和方法
[1263] 在每个NHP中肌肉注射(IM)初免疫苗以启动研究(疫苗初免)。在每个NHP中也肌肉内注射了一种或多种加强疫苗(疫苗加强)。根据表中概述并在下面总结的组施用每剂量的
双侧注射。
[1264] 免疫接种
[1265] 用在LNP-1或LNP-2中配制的1×1012个病毒粒子(每次注射5×1011个病毒粒子)的ChAdV68.5WTnt.MAG25mer、30ug VEE-MAG25MER srRNA、100ug VEE-MAG25mer srRNA或
300ug VEE-MAG25mer srRNA在双侧免疫接种Mamu-A*01印度恒河猴,在初免疫苗接种之后
的指定时间,经肌肉内施用30ug、100ug或300ug VEE-MAG25mer srRNA疫苗加强免疫。
[1266] 免疫监测
[1267] 在初免疫苗接种之后的指定时间,使用淋巴细胞分离培养基(Lymphocyte Separation Medium,LSM;MP Biomedicals)和LeucoSep分离管(Greiner Bio-One)分离
PBMC并使其再悬浮于含有10%FBS和青霉素/链霉素的RPMI中。在Attune NxT流式细胞仪
(Thermo Fisher)上使用碘化丙锭染色对细胞计数以排除死亡和凋亡的细胞。然后将细胞
调整至适当活细胞浓度以供后续分析。对于研究中的每只猴,使用ELISpot或流式细胞测量
方法测量T细胞反应。通过使用离体酶联免疫斑点(ELISpot)分析测量例如IFN-γ的细胞因
子的诱导来监测PBMC中针对疫苗中编码的6个不同恒河猴Mamu-A*01的I类表位的T细胞反
应。ELISpot分析是根据ELISPOT统一准则{DOI:10.1038/nprot.2015.068},利用猴IFNg 
ELISpotPLUS试剂盒(MABTECH)进行。将200,000个PBMC与10μM指定肽一起在涂有IFNg抗体
的96孔板中温育16小时。使用碱性磷酸酶使斑点显色。对反应定时10分钟并通过用自来水
流过板终止反应。使用AID vSpot读取器谱图对斑点计数。对于ELISPOT分析,将饱和度>
50%的孔记录为“太多而无法计数”。将复制孔的偏差>10%的样品从分析中排除。然后,使
用下式,针对孔汇合度校正斑点计数:斑点计数+2×(斑点计数×汇合度%/[100%-汇合
度%])。通过用抗原刺激的孔减去阴性肽刺激孔中的斑点计数来校正阴性背景。最后,将标
记为太多而无法计数的孔设定成最高观察校正值,四舍五入至最接近的百分数。
[1268] 通过使用流式细胞测量术测量例如IFN-γ的细胞内细胞因子的诱导来监测PBMC中针对疫苗中编码的6个不同恒河猴Mamu-A*01的I类表位的特异性CD4和CD8 T细胞反应。
由两种方法得到的结果指示,以抗原特异性方式诱导针对表位的细胞因子。
[1269] 恒河猴中的免疫原性
[1270] 本研究被设计用于(a)评估30μg和100μg剂量的VEE-MAG25mer srRNA与ChAdV68.5WTnt.MAG25mer组合作为同源初免/加强免疫或异源初免/加强免疫的免疫原性
和初步安全性;(b)使用LNP1与LNP2比较脂质纳米粒子中VEE-MAG25mer srRNA的免疫应答;
(c)评估对VEE-MAG25mer srRNA和ChAdV68.5WTnt.MAG25mer免疫接种的T细胞反应的动力
学。
[1271] 研究组在Mamu-A*01印度恒河猴中进行,以证明免疫原性。本研究中使用的所选抗原仅在恒河猴中识别,特别是具有Mamu-A*01MHC I类单倍型的那些。将Mamu-A*01印度恒河
猴随机分配到不同的研究组(每组6只恒河猴),并双侧IM注射施用编码包括多个Mamu-A*01
限制性表位的模型抗原的ChAdV68.5WTnt.MAG25mer或VEE-MAG25mer srRNA载体。研究组如
下所述。
[1272] 表21:印度恒河猴中的非GLP免疫原性研究
[1273]
[1274] 在免疫接种之前以及初始免疫接种之后第1、2、3、4、5、6、8、9和10周收集PBMC,以进行免疫监测。
[1275] 结果
[1276] 在免疫接种之前以及初始免疫接种之后第1、2、3、4、5、6、8、9和10周,针对六个不同Mamu-A*01限制性表位测量外周血单核细胞(PBMC)中的抗原特异性细胞免疫应答。如表21所述,动物在第4周和第8周接受剂量为30μg或100μg并用LNP1或LNP2配制的VEE-
MAG25mer srRNA的加强免疫。对于每个免疫监测时间点绘制所有六个表位的组合免疫应答
(图34A-D和表22-25)。
[1277] 在初始VEE-MAG25mer srRNA-LNP1(30μg)初始免疫接种后第1、2、3、4、5、6、8、9或10周,分别在每106个PBMC中170、14、15、11、7、8、14、17、12个SFC(六个组合表位)的所有测量结果下观测到组合抗原特异性免疫应答(图34A)。在初始VEE-MAG25mer srRNA-LNP1(100
μg)初始免疫接种后第1、2、3、4、5、6、8、9或10周,分别在每106个PBMC中108、-3、14、1、37、4、
105、17、25个SFC(六个组合表位)的所有测量结果下观测到组合抗原特异性免疫应答(图
34B)。在初始VEE-MAG25mer srRNA-LNP2(100μg)初始免疫接种后第1、2、3、4、5、6、8、9或10周,分别在每106个PBMC中-17、38、14、-2、87、21、104、129、89个SFC(六个组合表位)的所有测量结果下观测到组合抗原特异性免疫应答(图34C)。负值是对每个表位/动物的放血前值
进行归一化的结果。
[1278] 在初始ChAdV68.5WTnt.MAG25mer初始免疫接种后第1、2、3、4、5、6、8、9或10周,分别在每106个PBMC中1218、1784、1866、973、1813、747、797、1249和547个SFC(六个组合表位)的所有测量结果下观测到组合抗原特异性免疫应答(图34D)。免疫应答显示出预期的特征,在初始免疫接种后约2-3周测得免疫应答峰值,接着在4周后免疫应答收缩。在用
ChAdV68.5WTnt.MAG25mer初始免疫接种后第5周(即在用VEE-MAG25mer srRNA第一次加强
免疫后第1周),测得组合抗原特异性细胞免疫应答为每106个PBMC中1813个SFC(六个组合
表位)。用VEE-MAG25mer srRNA第一次加强免疫后第1周(第5周)测得的免疫应答与
ChAdV68.5WTnt.MAG25mer初始免疫接种(第3周)测得的峰值免疫应答相当(图34D)。在用
ChAdV68.5WTnt.MAG25mer初始免疫接种后第9周(即在用VEE-MAG25mer srRNA进行第二次
加强免疫后第1周),测得组合抗原特异性细胞免疫应答为每106个PBMC中1249个SFC(六个
组合表位)。在用VEE-MAG25mer srRNA进行第二次加强免疫后第1周(第9周)测得的免疫应
答是加强免疫接种之前测得的免疫应答的约2倍(图34D)。
[1279] 表22:VEE-MAG25mer srRNA-LNP1(30μg)的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM(第1组)
[1280]
[1281] 表23:VEE-MAG25mer srRNA-LNP1(100μg)的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM(第2组)
[1282]
[1283] 表24:VEE-MAG25mer srRNA-LNP2(100μg)的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM(第3组)
[1284]
[1285] 表25:ChAdV68.5WTnt.MAG25mer初免的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM
[1286]
[1287]
[1288] 印度恒河猴中的非GLP RNA剂量范围研究(较高剂量)
[1289] 本研究被设计用于(a)评估300μg剂量的VEE-MAG25mer  srRNA与ChAdV68.5WTnt.MAG25mer组合作为同源初免/加强免疫或异源初免/加强免疫的免疫原性;
(b)使用LNP1与LNP2比较脂质纳米粒子中300μg剂量的VEE-MAG25mer srRNA的免疫应答;以
及(c)评估针对VEE-MAG25mer srRNA和ChAdV68.5WTnt.MAG25mer免疫接种的T细胞反应的
动力学。
[1290] 研究组在Mamu-A*01印度恒河猴中进行,以证明免疫原性。非人灵长类物种如恒河猴中的疫苗免疫原性是人中疫苗效力的最佳预测指标。此外,本研究中使用的所选抗原仅
在恒河猴中被识别,特别是具有Mamu-A*01 MHC I类单倍型的恒河猴。将Mamu-A*01印度恒
河猴随机分配到不同的研究组(每组6只恒河猴),并双侧IM注射施用编码包括多个Mamu-A*
01限制性抗原的模型抗原的ChAdV68.5WTnt.MAG25mer或VEE-MAG25mer srRNA。研究组如下
所述。
[1291] 在免疫接种之前以及初始免疫接种后第4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24周收集PBMC以对第1组进行免疫监测(异源初免/加强免疫)。在免
疫接种之前以及初始免疫接种后第4、5、7、8、10、11、12、13、14或15周收集PBMC以对第2组和第3组进行免疫监测(异源初免/加强免疫)。
[1292] 表26:印度恒河猴中的非GLP免疫原性研究
[1293]
[1294] 结果
[1295] 用ChAdV68.5-WTnt.MAG25mer免疫接种Mamu-A*01印度恒河猴。在免疫接种之前以及初始免疫接种后第4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24周针对六个不同的Mamu-A*01限制性表位测量外周血单核细胞(PBMC)中的抗原特异性细胞免疫
应答(图35和表27)。在第4、12和20周时,使用LNP2制剂,使动物接受VEE-MAG25mer srRNA加
强免疫。在用ChAdV68.5WTnt.MAG25mer初始免疫接种后第4、5、6、7、8、10、11、12、13、14、15、
16、17、18、19、20、21、22、23或24周测得组合抗原特异性免疫应答为每106个PBMC中1750、
4225、1100、2529、3218、1915、1708、1561、5077、4543、4920、5820、3395、2728、1996、1465、
4730、2984、2828或3043个SFC(六个组合表位)(图35)。用VEE-MAG25mer srRNA第二次加强
免疫后第1周(第13周)测得的免疫应答是加强免疫前(第12周)测得的免疫应答的约3倍。用
VEE-MAG25mer srRNA进行第三次加强免疫后第1周(第21周)测得的免疫应答是加强免疫前
(第20周)测得的免疫应答的约3倍,类似于第二次加强免疫时观测到的应答。
[1296] 还使用两种不同的LNP制剂(LNP1和LNP2),用VEE-MAG25mer srRNA对Mamu-A*01印度恒河猴进行免疫接种。在免疫接种之前以及在初始免疫接种后第4、5、6、7、8、10、11、12、
13、14或15周,针对六个不同Mamu-A*01限制性表位测量外周血单核细胞(PBMC)中的抗原特
异性细胞免疫应答(图36和37,表28和29)。在第4周和第12周,分别使用LNP1或LNP2制剂,使
动物接受使用VEE-MAG25mer srRNA的加强免疫。在用VEE-MAG25mer srRNA-LNP2免疫接种
后第4、5、7、8、10、11、13、14、15周测得组合抗原特异性免疫应答为每106个PBMC中168、204、
103、126、140、145、330、203和162个SFC(六个组合表位)(图36)。在用VEE-MAG25mer srRNA-LNP1免疫接种后第4、5、7、8、10、11、12、13、14、15周测得组合抗原特异性免疫应答为每106个PBMC中189、185、349、437、492、570、233、886、369和381个SFC(六个组合表位)(图37)。
[1297] 表27:用ChAdV68.5WTnt.MAG25mer初免疫苗接种的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM(第1组)
[1298]
[1299] 表28:用VEE-MAG25mer srRNA-LNP2(300μg)初免疫苗接种的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM(第2组)
[1300]
[1301] 表29:用VEE-MAG25mer srRNA-LNP1(300μg)初免疫苗接种的每个表位的每106个PBMC中的平均斑点形成细胞(SFC)±SEM(第3组)
[1302]
[1303] srRNA剂量范围研究
[1304] 在本发明的一种实施方式中,可以在mamu A01印度恒河猴中进行srRNA剂量范围研究,以鉴定哪个srRNA剂量可以进行NHP免疫原性研究。在一个实例中,可以通过IM注射向
Mamu A01印度恒河猴施用包括多个mamu A01限制性表位的编码模型抗原的srRNA载体。在
另一个实例中,抗CTLA-4单克隆抗体可以在IM疫苗注射部位附近SC施用,以靶向一组动物
中的疫苗引流淋巴结。可在初始疫苗接种后每两周收集PBMC,以进行免疫监测。研究组描述
如下(表30)。
[1305] 表30:印度恒河猴中的非GLP RNA剂量范围研究
[1306]
[1307]
[1308] *在高剂量≤300μg下测定的srRNA的剂量范围。
[1309] 印度恒河猴中的免疫原性研究
[1310] 在本发明的一种实施方式中,可以在mamu A01印度恒河猴中进行疫苗研究以证明免疫原性。在一个实例中,可以通过IM注射向Mamu A01印度恒河猴施用包括多个mamu A01
限制性抗原的编码模型抗原的ChAdV和/或srRNA载体。在另一个实例中,抗CTLA-4单克隆抗
体将在IM疫苗注射部位附近SC施用至一些组。可在初始疫苗接种后每两周收集PBMC,以进
行免疫监测。研究组描述如下(表31)。
[1311] 表31:印度恒河猴中的非GLP免疫原性研究
[1312]
[1313] *基于srRNA剂量范围研究测定的srRNA剂量。
[1314] XIX.MHC/肽靶反应性T细胞和TCR的鉴定
[1315] 可以从患者的血液、淋巴结或肿瘤中分离出T细胞。可以例如通过分选抗原-MHC四聚体结合细胞或通过分选在T细胞和抗原冲击的抗原递呈细胞的体外共培养物中刺激的活
化细胞来富集T细胞中的抗原特异性T细胞。用于抗原特异性T细胞鉴定的各种试剂在本领
域中是已知的,包括装载有抗原的四聚体和其它基于MHC的试剂。
[1316] 抗原相关的α-β(或γ-δ)TCR二聚体可以通过抗原特异性T细胞的TCR的单细胞测序来鉴定。或者,可以使用本领域已知的TCR配对方法对抗原特异性T细胞进行批量TCR测
序,并且可以确定具有高匹配概率的α-β对。
[1317] 或者或此外,可以通过来自健康供体的初始T细胞的体外引发获得抗原特异性T细胞。从PBMC、淋巴结或脐带血中获得的T细胞可以被抗原冲击的抗原递呈细胞反复刺激,从
而引发抗原表达T细胞的分化。然后可以类似于上文关于来自患者的抗原特异性T细胞所述
来鉴定TCR。
[1318] 某些序列
[1319] 下面示出载体、盒和抗体的序列。
[1320]
[1321]
[1322]
[1323]
[1324]
[1325]
[1326]
[1327]
[1328]
[1329]
[1330]
[1331]
[1332]
[1333]
[1334]
[1335]
[1336]
[1337]
[1338]
[1339]
[1340]
[1341]
[1342]
[1343]
[1344]
[1345]
[1346]
[1347]
[1348]
[1349]
[1350]
[1351] 泛素(SEQ ID NO:38)
[1352] >UbG76 0-228
[1353] ATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCATCACCCTAGAGGTGGAGCCCAGTGACACCATCGAGAACGTGAAGGCCAAGATCCAGGATAAAGAGGGCATCCCCCCTGACCAGCAGAGGCTGATCTTTGCCGGCAAGCA
GCTGGAAGATGGCCGCACCCTCTCTGATTACAACATCCAGAAGGAGTCAACCCTGCACCTGGTCCTTCGCCTGAGAG
GTGGC
[1354] 泛素A76(SEQ ID NO:39)
[1355] >UbA76 0-228
[1356] ATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCATCACCCTAGAGGTGGAGCCCAGTGACACCATCGAGAACGTGAAGGCCAAGATCCAGGATAAAGAGGGCATCCCCCCTGACCAGCAGAGGCTGATCTTTGCCGGCAAGCA
GCTGGAAGATGGCCGCACCCTCTCTGATTACAACATCCAGAAGGAGTCAACCCTGCACCTGGTCCTTCGCCTGAGAG
GTGCC
[1357] HLA-A2(MHC I类)单肽(SEQ ID NO:40)
[1358] >MHC信号肽0-78
[1359] atggccgtcatggcgccccgaaccctcgtcctgctactctcgggggctctggccctgacccagacctgggcgggctct
[1360] HLA-A2(MHC I类)跨膜结构域(SEQ ID NO:41)
[1361] >HLA A2 TM结构域0-201
[1362] CCGtcttcccagcccaccatccCCATCGTGGGCAtcattgctggcctggttctctttggagctgtgatcactggagctgtggtcgctgctgtgatgtggaggaggaagagctcagatagaaaaggagggagctactctcaggct
gcaagcagtgacagtgcccagggctctgatgtgtctctcacagcttgtaaagtgtga
[1363] IgK前导序列(SEQ ID NO:42)
[1364] >IgK前导序列0-60
[1365] atggagaccgatacactgctgctgtgggtgctgctcctgtgggtgccaggaagcacaggc
[1366] 人DC-Lamp(SEQ ID NO:43)
[1367] >人DCLAMP 0-3178
[1368] ggcaccgattcggggcctgcccggacttcgccgcacgctgcagaacctcgcccagcgcccaccatgccccggcagctcagcgcggcggccgcgctcttcgcgtccctggccgtaattttgcacgatggcagtcaaatgagagca
aaagcatttccagaaaccagagattattctcaacctactgcagcagcaacagtacaggacataaaaaaacctgtcc
agcaaccagctaagcaagcacctcaccaaactttagcagcaagattcatggatggtcatatcacctttcaaacagc
ggccacagtaaaaattccaacaactaccccagcaactacaaaaaacactgcaaccaccagcccaattacctacacc
ctggtcacaacccaggccacacccaacaactcacacacagctcctccagttactgaagttacagtcggccctagct
tagccccttattcactgccacccaccatcaccccaccagctcatacagctggaaccagttcatcaaccgtcagcca
cacaactgggaacaccactcaacccagtaaccagaccacccttccagcaactttatcgatagcactgcacaaaagc
acaaccggtcagaagcctgatcaacccacccatgccccaggaacaacggcagctgcccacaataccacccgcacag
ctgcacctgcctccacggttcctgggcccacccttgcacctcagccatcgtcagtcaagactggaatttatcaggt
tctaaacggaagcagactctgtataaaagcagagatggggatacagctgattgttcaagacaaggagtcggttttt
tcacctcggagatacttcaacatcgaccccaacgcaacgcaagcctctgggaactgtggcacccgaaaatccaacc
ttctgttgaattttcagggcggatttgtgaatctcacatttaccaaggatgaagaatcatattatatcagtgaagt
gggagcctatttgaccgtctcagatccagagacagtttaccaaggaatcaaacatgcggtggtgatgttccagaca
gcagtcgggcattccttcaagtgcgtgagtgaacagagcctccagttgtcagcccacctgcaggtgaaaacaaccg
atgtccaacttcaagcctttgattttgaagatgaccactttggaaatgtggatgagtgctcgtctgactacacaat
tgtgcttcctgtgattggggccatcgtggttggtctctgccttatgggtatgggtgtctataaaatccgcctaagg
tgtcaatcatctggataccagagaatctaattgttgcccggggggaatgaaaataatggaatttagagaactcttt
catcccttccaggatggatgttgggaaattccctcagagtgtgggtccttcaaacaatgtaaaccaccatcttcta
ttcaaatgaagtgagtcatgtgtgatttaagttcaggcagcacatcaatttctaaatactttttgtttattttatg
aaagatatagtgagctgtttattttctagtttcctttagaatattttagccactcaaagtcaacatttgagatatg
ttgaattaacataatatatgtaaagtagaataagccttcaaattataaaccaagggtcaattgtaactaatactac
tgtgtgtgcattgaagattttattttacccttgatcttaacaaagcctttgctttgttatcaaatggactttcagt
gcttttactatctgtgttttatggtttcatgtaacatacatattcctggtgtagcacttaactccttttccacttt
aaatttgtttttgttttttgagacggagtttcactcttgtcacccaggctggagtacagtggcacgatctcggctt
atggcaacctccgcctcccgggttcaagtgattctcctgcttcagcttcccgagtagctgggattacaggcacaca
ctaccacgcctggctaatttttgtatttttattatagacgggtttcaccatgttggccagactggtcttgaactct
tgacctcaggtgatccacccacctcagcctcccaaagtgctgggattacaggcatgagccattgcgcccggcctta
aatgttttttttaatcatcaaaaagaacaacatatctcaggttgtctaagtgtttttatgtaaaaccaacaaaaag
aacaaatcagcttatattttttatcttgatgactcctgctccagaattgctagactaagaattaggtggctacaga
tggtagaactaaacaataagcaagagacaataataatggcccttaattattaacaaagtgccagagtctaggctaa
gcactttatctatatctcatttcattctcacaacttataagtgaatgagtaaactgagacttaagggaactgaatc
acttaaatgtcacctggctaactgatggcagagccagagcttgaattcatgttggtctgacatcaaggtctttggt
cttctccctacaccaagttacctacaagaacaatgacaccacactctgcctgaaggctcacacctcataccagcat
acgctcaccttacagggaaatgggtttatccaggatcatgagacattagggtagatgaaaggagagctttgcagat
aacaaaatagcctatccttaataaatcctccactctctggaaggagactgaggggctttgtaaaacattagtcagt
tgctcatttttatgggattgcttagctgggctgtaaagatgaaggcatcaaataaactcaaagtatttttaaattt
ttttgataatagagaaacttcgctaaccaactgttctttcttgagtgtatagccccatcttgtggtaacttgctgc
ttctgcacttcatatccatatttcctattgttcactttattctgtagagcagcctgccaagaattttatttctgct
gttttttttgctgctaaagaaaggaactaagtcaggatgttaacagaaaagtccacataaccctagaattcttagt
caaggaataattcaagtcagcctagagaccatgttgactttcctcatgtgtttccttatgactcagtaagttggca
aggtcctgactttagtcttaataaaacattgaattgtagtaaaggtttttgcaataaaaacttactttgg
[1369] 小鼠LAMP1(SEQ ID NO:44)
[1370] >小鼠Lamp1 0-1858
[1371] attccggaggtgaaaaacaatggcacaacgtgtataatggccagcttctctgcctcctttctgaccacctacgagactgcgaatggttctcagatcgtgaacatttccctgccagcctctgcagaagtactgaaaaatggcagt
tcttgtggtaaagaaaatgtttctgaccccagcctcacaattacttttggaagaggatatttactgacactcaact
tcacaaaaaatacaacacgttacagtgtccagcatatgtattttacatataacttgtcagatacagaacattttcc
caatgccatcagcaaagagatctacaccatggattccacaactgacatcaaggcagacatcaacaaagcataccgg
tgtgtcagtgatatccgggtctacatgaagaatgtgaccgttgtgctccgggatgccactatccaggcctacctgt
cgagtggcaacttcagcaaggaagagacacactgcacacaggatggaccttccccaaccactgggccacccagccc
ctcaccaccacttgtgcccacaaaccccactgtatccaagtacaatgttactggtaacaacggaacctgcctgctg
gcctctatggcactgcaactgaatatcacctacctgaaaaaggacaacaagacggtgaccagagcgttcaacatca
gcccaaatgacacatctagtgggagttgcggtatcaacttggtgaccctgaaagtggagaacaagaacagagccct
ggaattgcagtttgggatgaatgccagctctagcctgtttttcttgcaaggagtgcgcttgaatatgactcttcct
gatgccctagtgcccacattcagcatctccaaccattcactgaaagctcttcaggccactgtgggaaactcataca
agtgcaacactgaggaacacatctttgtcagcaagatgctctccctcaatgtcttcagtgtgcaggtccaggcttt
caaggtggacagtgacaggtttgggtctgtggaagagtgtgttcaggatggtaacaacatgttgatccccattgct
gtgggcggtgccctggcagggctgatcctcatcgtcctcattgcctacctcattggcaggaagaggagtcacgccg
gctatcagaccatctagcctggtgggcaggtgcaccagagatgcacaggggcctgttctcacatccccaagcttag
ataggtgtggaagggaggcacactttctggcaaactgttttaaaatctgctttatcaaatgtgaagttcatcttgc
aacatttactatgcacaaaggaataactattgaaatgacggtgttaattttgctaactgggttaaatattgatgag
aaggctccactgatttgacttttaagacttggtgtttggttcttcattcttttactcagatttaagcctatcaaag
ggatactctggtccagaccttggcctggcaagggtggctgatggttaggctgcacacacttaagaagcaacgggag
cagggaaggcttgcacacaggcacgcacagggtcaacctctggacacttggcttgggctacctggccttggggggg
ctgaactctggcatctggctgggtacacacccccccaatttctgtgctctgccacccgtgagctgccactttccta
aatagaaaatggcattatttttatttacttttttgtaaagtgatttccagtcttgtgttggcgttcagggtggccc
tgtctctgcactgtgtacaataatagattcacactgctgacgtgtcttgcagcgtaggtgggttgtacactgggca
tcagctcacgtaatgcattgcctgtaacgatgctaataaaaa
[1372] 人Lamp1 cDNA(SEQ ID NO:45)
[1373] >人Lamp1 0-2339
[1374] ggcccaaccgccgcccgcgcccccgctctccgcaccgtacccggccgcctcgcgccatggcggcccccggcagcgcccggcgacccctgctgctgctactgctgttgctgctgctcggcctcatgcattgtgcgtcagcagcaa
tgtttatggtgaaaaatggcaacgggaccgcgtgcataatggccaacttctctgctgccttctcagtgaactacga
caccaagagtggccctaagaacatgacctttgacctgccatcagatgccacagtggtgctcaaccgcagctcctgt
ggaaaagagaacacttctgaccccagtctcgtgattgcttttggaagaggacatacactcactctcaatttcacga
gaaatgcaacacgttacagcgtccagctcatgagttttgtttataacttgtcagacacacaccttttccccaatgc
gagctccaaagaaatcaagactgtggaatctataactgacatcagggcagatatagataaaaaatacagatgtgtt
agtggcacccaggtccacatgaacaacgtgaccgtaacgctccatgatgccaccatccaggcgtacctttccaaca
gcagcttcagcaggggagagacacgctgtgaacaagacaggccttccccaaccacagcgccccctgcgccacccag
cccctcgccctcacccgtgcccaagagcccctctgtggacaagtacaacgtgagcggcaccaacgggacctgcctg
ctggccagcatggggctgcagctgaacctcacctatgagaggaaggacaacacgacggtgacaaggcttctcaaca
tcaaccccaacaagacctcggccagcgggagctgcggcgcccacctggtgactctggagctgcacagcgagggcac
caccgtcctgctcttccagttcgggatgaatgcaagttctagccggtttttcctacaaggaatccagttgaataca
attcttcctgacgccagagaccctgcctttaaagctgccaacggctccctgcgagcgctgcaggccacagtcggca
attcctacaagtgcaacgcggaggagcacgtccgtgtcacgaaggcgttttcagtcaatatattcaaagtgtgggt
ccaggctttcaaggtggaaggtggccagtttggctctgtggaggagtgtctgctggacgagaacagcatgctgatc
cccatcgctgtgggtggtgccctggcggggctggtcctcatcgtcctcatcgcctacctcgtcggcaggaagagga
gtcacgcaggctaccagactatctagcctggtgcacgcaggcacagcagctgcaggggcctctgttcctttctctg
ggcttagggtcctgtcgaaggggaggcacactttctggcaaacgtttctcaaatctgcttcatccaatgtgaagtt
catcttgcagcatttactatgcacaacagagtaactatcgaaatgacggtgttaattttgctaactgggttaaata
ttttgctaactggttaaacattaatatttaccaaagtaggattttgagggtgggggtgctctctctgagggggtgg
gggtgccgctgtctctgaggggtgggggtgccgctgtctctgaggggtgggggtgccgctctctctgagggggtgg
gggtgccgctttctctgagggggtgggggtgccgctctctctgagggggtgggggtgctgctctctccgaggggtg
gaatgccgctgtctctgaggggtgggggtgccgctctaaattggctccatatcatttgagtttagggttctggtgt
ttggtttcttcattctttactgcactcagatttaagccttacaaagggaaagcctctggccgtcacacgtaggacg
catgaaggtcactcgtggtgaggctgacatgctcacacattacaacagtagagagggaaaatcctaagacagagga
actccagagatgagtgtctggagcgcttcagttcagctttaaaggccaggacgggccacacgtggctggcggcctc
gttccagtggcggcacgtccttgggcgtctctaatgtctgcagctcaagggctggcacttttttaaatataaaaat
gggtgttatttttatttttttttgtaaagtgatttttggtcttctgttgacattcggggtgatcctgttctgcgct
gtgtacaatgtgagatcggtgcgttctcctgatgttttgccgtggcttggggattgtacacgggaccagctcacgt
aatgcattgcctgtaacaatgtaataaaaagcctctttcttttaaaaaaaaaaaaaaaaaaaaaaaa
[1375] 破伤风类毒素核酸序列(SEQ ID NO:46)
[1376] CAGTACATCAAGGCCAACAGCAAGTTCATCGGCATCACCGAACTC
[1377] 破伤风类毒素氨基酸序列(SEQ ID NO:47)
[1378] QYIKANSKFIGITEL
[1379] PADRE核苷酸序列(SEQ ID NO:48)
[1380] GCTAAATTTGTGGCTGCCTGGACACTGAAAGCCGCCGCT
[1381] PADRE氨基酸序列(SEQ ID NO:49)
[1382] AKFVAAWTLKAAA
[1383] WPRE(SEQ ID NO:50)
[1384] >WPRE 0-593
[1385] aatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttg
tataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgt
ttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccct
ccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgac
aattccgtggtgttgtcggggaagctgacgtcctttccatggctgctcgcctgtgttgccacctggattctgcgcg
ggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcg
gcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcctgt
[1386] IRES(SEQ ID NO:51)
[1387] >eGFP_IRES_SEAP_Insert 1746-2335
[1388] tctcccccccccccctctccctcccccccccctaacgttactggccgaagccgcttggaataaggccggtgtgcgtttgtctatatgttattttccaccatattgccgtcttttggcaatgtgagggcccggaaacctggccct
gtcttcttgacgagcattcctaggggtctttcccctctcgccaaaggaatgcaaggtctgttgaatgtcgtgaagg
aagcagttcctctggaagcttcttgaagacaaacaacgtctgtagcgaccctttgcaggcagcggaaccccccacc
tggcgacaggtgcctctgcggccaaaagccacgtgtataagatacacctgcaaaggcggcacaaccccagtgccac
gttgtgagttggatagttgtggaaagagtcaaatggctctcctcaagcgtattcaacaaggggctgaaggatgccc
agaaggtaccccattgtatgggatctgatctggggcctcggtgcacatgctttacatgtgtttagtcgaggttaaa
aaaacgtctaggccccccgaaccacggggacgtggttttcctttgaaaaacacgatgataatatg
[1389] GFP(SEQ ID NO:52)
[1390] atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatc
tgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagcc
gctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccat
cttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatc
gagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccaca
acgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacgg
cagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccac
tacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtga
ccgccgccgggatcactctcggcatggacgagctgtacaagtag
[1391] SEAP(SEQ ID NO:53)
[1392] atgctgctgctgctgctgctgctgggcctgaggctacagctctccctgggcatcatcccagttgaggaggagaacccggacttctggaaccgcgaggcagccgaggccctgggtgccgccaagaagctgcagcctgcacagaca
gccgccaagaacctcatcatcttcctgggcgatgggatgggggtgtctacggtgacagctgccaggatcctaaaag
ggcagaagaaggacaaactggggcctgagatacccctggccatggaccgcttcccatatgtggctctgtccaagac
atacaatgtagacaaacatgtgccagacagtggagccacagccacggcctacctgtgcggggtcaagggcaacttc
cagaccattggcttgagtgcagccgcccgctttaaccagtgcaacacgacacgcggcaacgaggtcatctccgtga
tgaatcgggccaagaaagcagggaagtcagtgggagtggtaaccaccacacgagtgcagcacgcctcgccagccgg
cacctacgcccacacggtgaaccgcaactggtactcggacgccgacgtgcctgcctcggcccgccaggaggggtgc
caggacatcgctacgcagctcatctccaacatggacattgacgtgatcctaggtggaggccgaaagtacatgtttc
gcatgggaaccccagaccctgagtacccagatgactacagccaaggtgggaccaggctggacgggaagaatctggt
gcaggaatggctggcgaagcgccagggtgcccggtatgtgtggaaccgcactgagctcatgcaggcttccctggac
ccgtctgtgacccatctcatgggtctctttgagcctggagacatgaaatacgagatccaccgagactccacactgg
acccctccctgatggagatgacagaggctgccctgcgcctgctgagcaggaacccccgcggcttcttcctcttcgt
ggagggtggtcgcatcgaccatggtcatcatgaaagcagggcttaccgggcactgactgagacgatcatgttcgac
gacgccattgagagggcgggccagctcaccagcgaggaggacacgctgagcctcgtcactgccgaccactcccacg
tcttctccttcggaggctaccccctgcgagggagctccatcttcgggctggcccctggcaaggcccgggacaggaa
ggcctacacggtcctcctatacggaaacggtccaggctatgtgctcaaggacggcgcccggccggatgttaccgag
agcgagagcgggagccccgagtatcggcagcagtcagcagtgcccctggacgaagagacccacgcaggcgaggacg
tggcggtgttcgcgcgcggcccgcaggcgcacctggttcacggcgtgcaggagcagaccttcatagcgcacgtcat
ggccttcgccgcctgcctggagccctacaccgcctgcgacctggcgccccccgccggcaccaccgacgccgcgcac
ccgggttactctagagtcggggcggccggccgcttcgagcagacatgataa
[1393] 萤火虫荧光素酶(SEQ ID NO:54)
[1394] atggaagatgccaaaaacattaagaagggcccagcgccattctacccactcgaagacgggaccgccggcgagcagctgcacaaagccatgaagcgctacgccctggtgcccggcaccatcgcctttaccgacgcacatatcgag
gtggacattacctacgccgagtacttcgagatgagcgttcggctggcagaagctatgaagcgctatgggctgaata
caaaccatcggatcgtggtgtgcagcgagaatagcttgcagttcttcatgcccgtgttgggtgccctgttcatcgg
tgtggctgtggccccagctaacgacatctacaacgagcgcgagctgctgaacagcatgggcatcagccagcccacc
gtcgtattcgtgagcaagaaagggctgcaaaagatcctcaacgtgcaaaagaagctaccgatcatacaaaagatca
tcatcatggatagcaagaccgactaccagggcttccaaagcatgtacaccttcgtgacttcccatttgccacccgg
cttcaacgagtacgacttcgtgcccgagagcttcgaccgggacaaaaccatcgccctgatcatgaacagtagtggc
agtaccggattgcccaagggcgtagccctaccgcaccgcaccgcttgtgtccgattcagtcatgcccgcgacccca
tcttcggcaaccagatcatccccgacaccgctatcctcagcgtggtgccatttcaccacggcttcggcatgttcac
cacgctgggctacttgatctgcggctttcgggtcgtgctcatgtaccgcttcgaggaggagctattcttgcgcagc
ttgcaagactataagattcaatctgccctgctggtgcccacactatttagcttcttcgctaagagcactctcatcg
acaagtacgacctaagcaacttgcacgagatcgccagcggcggggcgccgctcagcaaggaggtaggtgaggccgt
ggccaaacgcttccacctaccaggcatccgccagggctacggcctgacagaaacaaccagcgccattctgatcacc
cccgaaggggacgacaagcctggcgcagtaggcaaggtggtgcccttcttcgaggctaaggtggtggacttggaca
ccggtaagacactgggtgtgaaccagcgcggcgagctgtgcgtccgtggccccatgatcatgagcggctacgttaa
caaccccgaggctacaaacgctctcatcgacaaggacggctggctgcacagcggcgacatcgcctactgggacgag
gacgagcacttcttcatcgtggaccggctgaagagcctgatcaaatacaagggctaccaggtagccccagccgaac
tggagagcatcctgctgcaacaccccaacatcttcgacgccggggtcgccggcctgcccgacgacgatgccggcga
gctgcccgccgcagtcgtcgtgctggaacacggtaaaaccatgaccgagaaggagatcgtggactatgtggccagc
caggttacaaccgccaagaagctgcgcggtggtgttgtgttcgtggacgaggtgcctaaaggactgaccggcaagt
tggacgcccgcaagatccgcgagattctcattaaggccaagaagggcggcaagatcgccgtgtaa
[1395] FMDV 2A(SEQ ID NO:55)
[1396] GTAAAGCAAACACTGAACTTTGACCTTCTCAAGTTGGCTGGAGACGTTGAGTCCAATCCTGGGCCC
[1397] 参考文献
[1398] 1.Desrichard,A.,Snyder,A.&Chan,T.A.Cancer  Neoantigens and Applications for Immunotherapy.Clin.Cancer Res.Off.J.Am.Assoc.Cancer Res.
(2015).doi:10.1158/1078-0432.CCR-14-3175
[1399] 2.Schumacher,T.N.&Schreiber,R.D.Neoantigens  in  cancer immunotherapy.Science 348,69-74(2015).
[1400] 3.Gubin,M.M.,Artyomov,M.N.,Mardis,E.R.&Schreiber,R.D.Tumor neoantigens:building  a  framework  for  personalized  cancer 
immunotherapy.J.Clin.Invest.125,3413-3421(2015).
[1401] 4.Rizvi,N.A.et al.Cancer immunology.Mutational landscape determines sensitivity to PD-1 blockade in non-small cell lung cancer.Science 348,124-
128(2015).
[1402] 5.Snyder,A.et al.Genetic basis for clinical response to CTLA-4 blockade in melanoma.N.Engl.J.Med.371,2189-2199(2014).
[1403] 6.Carreno,B.M.et al.Cancer immunotherapy.A dendritic cell vaccine increases the breadth and diversity of melanoma neoantigen-specific T 
cells.Science 348,803-808(2015).
[1404] 7.Tran,E.et al.Cancer immunotherapy based on mutation-specific CD4+ T cells in a patient with epithelial cancer.Science344,641-645(2014).
[1405] 8.Hacohen,N.&Wu,C.J.-Y.United States Patent Application:0110293637-COMPOSITIONS AND METHODS OF IDENTIFYING TUMOR SPECIFIC NEOANTIGENS.(A1).at<
http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&
p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1=20110293637.PGNR.>
[1406] 9.Lundegaard,C.,Hoof,I.,Lund,O.&Nielsen,M.State of the art and challenges in sequence based T-cell epitope prediction,Immunome Res.6 Suppl 
2,S3(2010).
[1407] 10.Yadav,M.et al.Predicting immunogenic tumour mutations by combining mass spectrometry and exome sequencing.Nature 515,572-576(2014).
[1408] 11.Bassani-Sternberg,M.,Pletscher-Frankild,S.,Jensen,L.J.&Mann,M.Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong effects of protein abundance and turnover on antigen presentation.Mol.Cell.P
roteomics MCP 14,658-673(2015).
[1409] 12.Van Allen,E.M.et al.Genomic correlates of response to CTLA-4blockade in metastatic melanoma.Science 350,207-211(2015).
[1410] 13.Yoshida,K.&Ogawa,S.Splicing factor mutations and cancer.Wi/ey Interdiscip.Rev.RNA 5,445-459(2014).
[1411] 14.Cancer Genome Atlas Research Network.Comprehensive molecular profiling of lung adenocarcinoma.Nature 511,543-550(2014).
[1412] 15.Rajasagi,M.et al.Systematic identification of personal tumor-specific neoantigens in chronic lymphocytic leukemia.Blood124,453-462(2014).
[1413] 16.Downing,S.R.et al.United States Patent Application:0120208706-OPTIMIZATION OF MULTIGENE ANALYSIS OF TUMOR SAMPLES.(Al).atappft1.uspto.gov/netacgi/nph-Parser?Sectl=PTO1&Sect2=HITOFF&d=PG01&p=1&u
=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1=20120208706.PGNR.>
[1414] 17.Target Capture for  NextGen  Sequencing-IDT.at
[1415] 18.Shukla,S.A.et al.Comprehensive analysis of cancer-associated somatic mutations in class I HLA genes.Nat.Biotechnol.33,1152-1158(2015).
[1416] 19.Cieslik,M.et al.The use of exome capture RNA-seq for highly degraded RNA with application to clinical cancer sequencing.Genome Res.25,
1372-1381(2015).
[1417] 20.Bodini,M.et al.The hidden genomic landscape of acute myeloid leukemia:subclonal structure revealed by undetected mutations.Blood 125,600-
605(2015).
[1418] 21.Saunders,C.T.et al.Strelka:accurate somatic small-variant calling from sequenced tumor-normal sample pairs.Bioinforma.Oxf.Engl.28,1811-1817
(2012).
[1419] 22.Cibulskis,K.et al.Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples.Nat.Biotechnol.31,213-219(2013).
[1420] 23.Wilkerson,M.D.et al.Integrated RNA and DNA sequencing improves mutation detection in low purity tumors.Nucleic Acids Res.42,e107(2014).
[1421] 24.Mose,L.E.,Wilkerson,M.D.,Hayes,D.N.,Perou,C.M.&Parker,J.S.ABRA:improved coding indel detection via assembly-based realignment.Bioinforma.O
xf.Engl.30,2813-2815(2014).
[1422] 25.Ye,K.,Schulz,M.H.,Long,Q.,Apweiler,R.&Ning,Z.Pindel:a pattern growth approach to detect break points of large deletions and medium sized 
insertions from paired-end short reads.Bioinforma.Oxf.Engl.25,2865-2871
(2009).
[1423] 26.Lam,H.Y.K.et al.Nucleotide-resolution analysis of structural variants using BreakSeq and a breakpoint library.Nat.Biotechnol.28,47-55
(2010).
[1424] 27.Frampton,G.M.et al.Development and validation of a clinical cancer genomic  profiling  test  based  on  massively  parallel  DNA 
sequencing.Nat.Biotechnol.31,1023-1031(2013).
[1425] 28.Boegel,S.et al.HLA typing from RNA-Seq sequence reads.Genome Med.4,102(2012).
[1426] 29.Liu,C.et al.ATHLATES:accurate typing of human leukocyte antigen through exome sequencing.Nucleic Acids Res.41,e142(2013).
[1427] 30.Mayor,N.P.et al.HLA Typing for the Next Generation.PloS One 10,e0127153(2015).
[1428] 31.Roy,C.K.,Olson,S.,Graveley,B.R.,Zamore,P.D.&Moore,M.J.Assessing long-distance RNA sequence connectivity  via RNA-templated  DNA-DNA 
ligation.eLife 4,(2015).
[1429] 32.Song,L.&Florea,L.CLASS:constrained transcript assembly of RNA-seq reads.BMC Bioinformatics 14 Suppl 5,S14(2013).
[1430] 33.Maretty,L.,Sibbesen,J.A.&Krogh,A.Bayesian transcriptome assembly.Genome Biol.15,501(2014).
[1431] 34.Pertea,M.et al.StringTie enables improved reconstruction of a transcriptome from RNA-seq reads.Nat.Biotechnol.33,290-295(2015).
[1432] 35.Roberts,A.,Pimentel,H.,Trapnell,C.&Pachter,L.Identification of novel transcripts in annotated genomes using RNA-Seq.Bioinforma.Oxf.Engl.
(2011).doi:10.1093/bioinformatics/btr355
[1433] 36.Vitting-Seerup,K.,Porse,B.T.,Sandelin,A.&Waage,J.spliceR:an R package for classification of alternative splicing and prediction of coding 
potential from RNA-seq data.BMC Bioinformatics 15,81(2014).
[1434] 37.Rivas,M.A.et al.Human genomics.Effect of predicted protein-truncating genetic variants on the human transcriptome.Science 348,666-669
(2015).
[1435] 38.Skelly,D.A.,Johansson,M.,Madeoy,J.,Wakefield,J.&Akey,J.M.A powerful and flexible statistical framework for testing hypotheses of allele-
specific gene expression from RNA-seq data.Genome Res.21,1728-1737(2011).
[1436] 39.Anders,S.,Pyl,P.T&Huber,W.HTSeq--a Python framework to work with high-throughput sequencing data.Bioinforma.Oxf.Engl.31,166-169(2015).
[1437] 40.Furney,S.J.et al.SF3B1 mutations are associated with alternative splicing in uveal melanoma.Cancer Discov.(2013).doi:10.1158/2159-8290.CD-13-
0330
[1438] 41.Zhou,Q.et al.A chemical genetics approach for the functional assessment of novel cancer genes.Cancer Res.(2015).doi:10.1158/0008-5472.CAN-
14-2930
[1439] 42.Maguire,S.L.et al.SF3B1 mutations constitute a novel therapeutic target in breast cancer.J.Pathol.235,571-580(2015).
[1440] 43.Carithers,L.J.et al.A Novel Approach to High-Quality Postmortem Tissue Procurement:The GTEx Project.Biopreservation Biobanking 13,311-319
(2015).
[1441] 44.Xu,G.et al.RNA CoMPASS:a dual approach for pathogen and host transcriptome analysis of RNA-seq datasets.PloS One 9,e89445(2014).
[1442] 45.Andreatta,M.&Nielsen,M.Gapped sequence alignment using artificial neural networks:application to the MHC class I system.Bioinforma.Oxf.Engl.
(2015).doi:10.1093/bioinformatics/btv639
[1443] 46. K.W.,Rasmussen,M.,Buus,S.&Nielsen,M.NetMHCstab-predicting stability of peptide-MHC-I complexes;impacts for cytotoxic T lymphocyte 
epitope discovery.Immunology 141,18-26(2014).
[1444] 47.Larsen,M.V.et  al.An integrative  approach  to CTL epitope prediction:a combined algorithm integrating MHC class I binding,TAP transport 
efficiency,and proteasomal cleavage predictions.Eur.J.Immunol.35,2295-2303
(2005).
[1445] 48.Nielsen,M.,Lundegaard,C.,Lund,O.& C.The role of the proteasome in generating cytotoxic T-cell epitopes:insights obtained from 
improved predictions of proteasomal cleavage.Immunogenetics 57,33-41(2005).
[1446] 49.Boisvert,F.-M.et al.A Quantitative Spatial Proteomics Analysis of Proteome Turnover in Human Cells.Mol.Cell.Proteomics 11,M111.011429-
M111.011429(2012).
[1447] 50.Duan,F.et al.Genomic and bioinformatic profiling of mutational neoepitopes  reveals  new  rules  to  predict  anticancer 
immunogenicity.J.Exp.Med.211,2231-2248(2014).
[1448] 51.Janeway’s Immunobiology:9780815345312:Medicine&Health Science Books @Amazon.com.atMurphy/dp/0815345313>
[1449] 52.Calis,J.J.A.et al.Properties of MHC Class I Presented Peptides That Enhance Immunogenicity.PLoS Comput.Biol.9,e1003266(2013).
[1450] 53.Zhang,J.et al.Intratumor heterogeneity in localized lung adenocarcinomas delineated by multiregion sequencing.Science 346,256-259
(2014)
[1451] 54.Walter,M.J.et al.Clonal architecture of secondary acute myeloid leukemia.N.Engl.J.Med.366,1090-1098(2012).
[1452] 55.Hunt DF,Henderson RA,Shabanowitz J,Sakaguchi K,Michel H,Sevilir N,Cox AL,Appella E,EngelhardVH.Characterization of peptides bound to the class 
I MHC molecule HLA-A2.1 by mass spectrometry.Science 1992.255:1261-1263.
[1453] 56.Zarling AL,Polefrone JM,Evans AM,Mikesh LM,Shabanowitz J,Lewis ST,Engelhard VH,Hunt DF.Identification of class I MHC-associated phosphopeptides 
as targets for cancer immunotherapy.Proc Natl Acad Sci U S A.2006 Oct 3;103
(40):14889-94.
[1454] 57.Bassani-Sternberg M,Pletscher-Frankild S,Jensen LJ,Mann M.Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong 
effects of protein abundance and turnover on antigen presentation.Mol Cell 
Proteomics.2015 Mar;14(3):658-73.doi:10.1074/mcp.M114.042812.
[1455] 58.Abelin JG,Trantham PD,Penny SA,Patterson AM,Ward ST,Hildebrand WH,Cobbold M,Bai DL,Shabanowitz J,Hunt DF.Complementary IMAC enrichment methods 
for HLA-associated phosphopeptide identification by mass spectrometry.Nat 
Protoc.2015 Sep;10(9):1308-18.doi:10.1038/nprot.2015.086.Epub 2015 Aug 6
[1456] 59.Barnstable CJ,Bodmer WF,Brown G,Galfre G,Milstein C,Williams AF,Ziegler A.Production of monoclonal antibodies to group A erythrocytes,HLA and 
other human cell surface antigens-new tools for genetic analysis.Cell.1978 
May;14(1):9-20.
[1457] 60.Goldman JM,Hibbin J,Kearney L,Orchard K,Th′ng KH.HLA-DR monoclonal antibodies inhibit the proliferation of normal and chronic granulocytic 
leukaemia myeloid progenitor cells.Br J Haematol.1982 Nov;52(3):411-20.
[1458] 61.Eng JK,Jahan TA,Hoopmann MR.Comet:an open-source MS/MS sequence database search tool.Proteomics.2013 Jan;13(1):22-4.doi:10.1002/
pmic.201200439.Epub 2012 Dec 4.
[1459] 62.Eng JK,Hoopmann MR,Jahan TA,Egertson JD,Noble WS,MacCoss MJ.A deeper look into  Comet--implementation and features.J Am Soc Mass 
Spectrom.2015 Nov;26(11):1865-74.doi:10.1007/s13361-015-1179-x.Epub 2015 Jun 
27.
[1460] 63.Lukas Jesse Canterbury,Jason Weston,William Stafford Noble and Michael J.MacCoss.Semi-supervised learning for peptide identification from 
shotgun proteomics datasets.Nature Methods 4:923-925,November 2007
[1461] 64.Lukas John D.Storey,Michael J.MacCoss and William Stafford Noble.Assigning confidence measures to peptides identified by tandem mass 
spectrometry.Journal of Proteome Research,7(1):29-34,January 2008
[1462] 65.Lukas John D.Storey and William Stafford Noble.Nonparametric estimation of posterior error probabilities associated with peptides 
identified by tandem mass spectrometry.Bioinformatics,24(16):i42-i48,August 
2008
[1463] 66.Kinney RM,BJ Johnson,VL Brown,DW Trent.Nucleotide Sequence of the 26 S mRNA of the Virulent Trinidad Donkey Strain of Venezuelan Equine 
Encephalitis Virus and  Deduced Sequence  of the Encoded Structural 
Proteins.Virology 152(2),400-413.1986 Jul 30.
[1464] 67.Jill E Slansky,Frédérique M Rattis,Lisa F Boyd,Tarek Fahmy,Elizabeth  M  Jaffee,Jonathan P Schneck,David  H  Margulies,Drew  M 
Pardoll.Enhanced Antigen-Specific Antitumor Immunity with Altered Peptide 
Ligands that Stabilize the MHC-Peptide-TCR Complex.Immunity,Volume 13,Issue 
4,1 October 2000,Pages 529-538.
[1465] 68.A Y Huang,P H Gulden,A S Woods,M C Thomas,C D Tong,W Wang,V H Engelhard,G Pasternack,R Cotter,D Hunt,D M Pardoll,and E M Jaffee.The 
immunodominant major histocompatibility complex class I-restricted antigen of 
a murine colon tumor derives from an endogenous retroviral gene product.Proc 
Natl Acad Sci USA.;93(18):9730-9735,1996 Sep 3.
[1466] 69.JOHNSON,BARBARA J.B.,RICHARD M.KINNEY,CRYSTLE L.KOST AND DENNIS W.TRENT.Molecular Determinants of Alphavirus Neurovirulence:Nucleotide and 
Deduced Protein Sequence Changes during Attenuation of Venezuelan Equine 
Encephalitis Virus.J Gen Virol 67:1951-1960,1986.
[1467] 70.Aarnoudse,C.A.,Krüse,M.,Konopitzky,R.,Brouwenstijn,N.,and Schrier,P.I.(2002).TCR reconstitution in Jurkat reporter cells facilitates the identification of novel tumor antigens by cDNA expression cloning.Int J 
Cancer 99,7-13.
[1468] 71.Alexander,J.,Sidney,J.,Southwood,S.,Ruppert,J.,Oseroff,C.,Maewal,A.,Snoke,K.,Serra,H.M.,Kubo,R.T.,and Sette,A.(1994).Development of high potency universal DR-restricted helper epitopes by modification of high 
affinity DR-blocking peptides.Immunity 1,751-761.
[1469] 72.Banu,N.,Chia,A.,Ho,Z.Z.,Garcia,A.T.,Paravasivam,K.,Grotenbreg,G.M.,Bertoletti,A.,and Gehring,A.J.(2014).Building and optimizing a virus-specific T cell receptor library for targeted immunotherapy in viral 
infections.Scientific Reports 4,4166.
[1470] 73.Comet,S.,Miconnet,I.,Menez,J.,Lemonnier,F.,and Kosmatopoulos,K.(2006).Optimal organization of a polypeptide-based candidate cancer vaccine 
composed of cryptic tumor peptides with enhanced immunogenicity.Vaccine 24,
2102-2109.
[1471] 74.Depla,E.,van der Aa,A.,Livingston,B.D.,Crimi,C.,Allosery,K.,de Brabandere,V.,Krakover,J.,Murthy,S.,Huang,M.,Power,S.,et al.(2008).Rational design of a multiepitope vaccine encoding T-lymphocyte epitopes for treatment of chronic hepatitis B virus infections.Journal of Virology82,435-450.
[1472] 75.Ishioka,G.Y.,Fikes,J.,Hermanson,G.,Livingston,B.,Crimi,C.,Qin,M.,del Guercio,M.F.,Oseroff,C.,Dahlberg,C.,Alexander,J.,et al.(1999).Utilization of MHC class I transgenic mice for development of minigene DNA vaccines encoding multiple HLA-restricted CTL epitopes.J Immunol 162,3915-3925.
[1473] 76.Janetzki,S.,Price,L.,Schroeder,H.,Britten,C.M.,Welters,M.J.P.,and Hoos,A.(2015).Guidelines for the automated evaluation of Elispot assays.Nat Protoc 10,1098-1115.
[1474] 77.Lyons,G.E.,Moore,T.,Brasic,N.,Li,M.,Roszkowski,J.J.,and Nishimura,M.I.(2006).Influence of human CD8 on antigen recognition by T-cell receptor-transduced cells.Cancer Res 66,11455-11461.
[1475] 78.Nagai,K.,Ochi,T.,Fujiwara,H.,An,J.,Shirakata,T.,Mineno,J.,Kuzushima,K.,Shiku,H.,Melenhorst,J.J.,Gostick,E.,et al.(2012).Aurora kinase A-specific T-cell receptor gene transfer redirects T lymphocytes to display 
effective antileukemia reactivity.Blood 119,368-376.
[1476] 79.Panina-Bordignon,P.,Tan,A.,Termijtelen,A.,Demotz,S.,Corradin,G.,and Lanzavecchia,A.(1989).Universally immunogenic T cell epitopes:promiscuous binding to human MHC class II and promiscuous recognition by T cells.Eur J 
Immunol 19,2237-2242.
[1477] 80.Vitiello,A.,Marchesini,D.,Furze,J.,Sherman,L.A.,and Chesnut,R.W.(1991).Analysis of the HLA-restricted influenza-specific cytotoxic T lymphocyte response in transgenic mice carrying a chimeric human-mouse class 
I major histocompatibility complex.J Exp Med 173,1007-1015.
[1478] 81.Yachi,P.P.,Ampudia,J.,Zal,T.,and Gascoigne,N.R.J.(2006).Altered peptide ligands induce delayed CD8-T cell receptor interaction--a role for 
CD8 in distinguishing antigen quality.Immunity 25,203-211.
[1479] 82.Pushko  P,Parker  M,Ludwig  GV,Davis NL,Johnston RE,Smith JF.Replicon-helper systems from attenuated Venezuelan equine encephalitis 
virus:expression of heterologous genes in vitro and immunization against 
heterologous pathogens in vivo.Virology.1997 Dec 22;239(2):389-401.
[1480] 83.Strauss,JH and E G Strauss.The alphaviruses:gene expression,replication,and evolution.Microbiol Rev.1994 Sep;58(3):491-562.
[1481] 84 C,Ehrengruber MU,Grandgirard D.Alphaviral cytotoxicity and its implication in vector development.Exp Physiol.2005 Jan;90(1):45-52.Epub 2004 
Nov 12.
[1482] 85.Riley,Michael K.II,and Wilfred Vermerris.Recent Advances in Nanomaterials for Gene Delivery-A Review.Nanomaterials 2017,7(5),94.
[1483] 86.Frolov I,Hardy R,Rice CM.Cis-acting RNA elements at the 5′end of Sindbis  virus genome  RNA  regulate  minus-and  plus-strand  RNA 
synthesis.RNA.2001 Nov;7(11):1638-51.
[1484] 87.Jose J,Snyder JE,Kuhn RJ.A structural andfunctional perspective of alphavirus replication and assembly.Future Microbiol.2009 Sep;4(7):837-56.
[1485] 88.Bo Li and C.olin N.Dewey.RSEM:accurate transcript quantification from RNA-Seq data with or without a referenfe genome.BMC Bioinformatics,12:
323,August 2011
[1486] 89.Hillary Pearson,Tariq Daouda,Diana Paola Granados,Chantal Durette,Eric Bonneil,Mathieu Courcelles,Anja Rodenbrock,Jean-Philippe Laverdure,
Caroline Sylvie Mader,Sébastien Lemieux,Pierre Thibault,and Claude 
Perreault.MHC class I-associated peptides derive from selective regions of 
the human genome.The Journal of Clinical Investigation,2016,
[1487] 90.Juliane Liepe,Fabio Marino,John Sidney,Anita Jeko,Daniel E.Bunting,Alessandro Sette,Peter M.Kloetzel,Michael P.H.Stumpf,Albert 
J.R.Heck,Michele Mishto.A large fraction of HLA class I ligands are 
proteasome-generated spliced peptides.Science,21,October 2016.
[1488] 91.Mommen GP.,Marino,F.,Meiring HD.,Poelen,MC.,van Gaans-van den Brink,JA.,Mohammed S.,Heck AJ.,and van Els CA.Sampling From the Proteome to 
the Human Leukocyte Antigen-DR(HLA-DR)Ligandome Proceeds Via High 
Specificity.Mol Cell Proteomics 15(4):1412-1423,April 2016.
[1489] 92.Sebastian Kreiter,Mathias Vormehr,Niels van de Roemer,Mustafa Diken,Martin Jan Diekmann,Sebastian Boegel,Barbara Fulvia 
Vascotto,John C.Castle,Arbel D.Tadmor,Stephen P.Schoenberger,Christoph Huber,
Türeci,and Ugur Sahin.Mutant MHC class II epitopes drive therapeutic 
immune responses to caner.Nature 520,692-696,April 2015.
[1490] 93.Tran E.,Turcotte S.,Gros A.,Robbins P.F.,Lu Y.C.,Dudley M.E.,Wunderlich J.R.,Somerville R.P.,Hogan K.,Hinrichs C.S.,Parkhurst M.R.,Yang 
J.C.,Rosenberg S.A.Cancer immunotherapy based on mutation-specific CD4+ T 
cells in a patient with epithelial cancer.Science 344(6184)641-645,May 2014.
[1491] 94.Andreatta M.,Karosiene E.,Rasmussen M.,Stryhn A.,Buus S.,Nielsen M.Accurate pan-specific prediction of peptide-MHC class II binding affinity 
with improved binding core identification.Immunogenetics 67(11-12)641-650,
November 2015.
[1492] 95.Nielsen,M.,Lund,O.NN-align.An artificial neural network-based alignment algorithm for MHC class II peptide binding prediction.BMC 
Bioinformatics 10:296,September 2009.
[1493] 96.Nielsen,M.,Lundegaard,C.,Lund,O.Prediction of MHC class II binding affinity using SMM-align,a novel stabilization matrix alignment method.BMC 
Bioinformatics 8:238,July 2007.
[1494] 97.Zhang,J.,et al.PEAKS DB:de novo sequencing assisted database search for sensitive and accurate peptide identification.Molecular&Cellular 
Proteomics.11(4):1-8.1/2/2012.
[1495] 98.Jensen,Kamilla Kjaergaard,et al“. Improved Methods for Prediting Peptide Binding Affinity to MHC Class II Molecules.”Immunology,2018,doi:
10.1111/imm.12889.
[1496] 99.Carter,S.L.,Cibulskis,K.,Helman,E.,McKenna,A.,Shen,H.,Zack,T.,Laird,P.W.,Onofrio,R.C.,Winckler,W.,Weir,B.A.,et al.(2012).Absolute quantification of somatic DNA alterations in human cancer.Nat.Biotechnol.30,
413-421
[1497] 100.McGranahan,N.,Rosenthal,R.,Hiley,C.T.,Rowan,A.J.,Watkins,T.B.K.,Wilson,G.A.,Birkbak,N.J.,Veeriah,S.,Van Loo,P.,Herrero,J.,et al.(2017).Allele-Specific HLA Loss and Immune Escape in Lung Cancer Evolution.Cell 
171,1259-1271.e11.
[1498] 101.Shukla,S.A.,Rooney,M.S.,Rajasagi,M.,Tiao,G.,Dixon,P.M.,Lawrence,M.S.,Stevens,J.,Lane,W.J.,Dellagatta,J.L.,Steelman,S.,et al.(2015).Comprehensive analysis of cancer-associated somatic mutations in class I HLA 
genes.Nat.Biotechnol.33,1152-1158.
[1499] 102.Van Loo,P.,Nordgard,S.H., O.C.,Russnes,H.G.,Rye,I.H.,Sun,W.,Weigman,V.J.,Marynen,P.,Zetterberg,A.,Naume,B.,et al.(2010).Allele-
specific copy number analysis of tumors.Proc.Natl.Acad.Sci.U.S.A.107,16910-
16915.
[1500] 103.Van Loo,P.,Nordgard,S.H., O.C.,Russnes,H.G.,Rye,I.H.,Sun,W.,Weigman,V.J.,Marynen,P.,Zetterberg,A.,Naume,B.,et al.(2010).Allele-
specific copy number analysis of tumors.Proc.Natl.Acad.Sci.U.S.A.107,16910-
16915.
[1501] 各种实施方案
[1502] 1.本文公开一种包含一个新抗原或多个新抗原的病毒载体。在某些实施方案中,新抗原是使用本文(例如下文)所公开的方法鉴定的。在某些实施方案中,新抗原具有如本
文(例如下文)所公开的至少一个特征或特性。
[1503] 2.本文公开一种用于鉴定来自受试者的肿瘤细胞并且可能在肿瘤细胞表面上递呈的一个或多个新抗原的方法,其包括以下步骤:
[1504] 从受试者的肿瘤细胞获得外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少一者,其中该肿瘤核苷酸测序数据用于获得代表新抗原集合中的每一者的肽序列的数
据,并且其中每个新抗原的肽序列包含使其不同于相应野生型亲本肽序列的至少一个改
变;
[1505] 将每个新抗原的肽序列输入到一个或多个递呈模型中,以产生新抗原中的每一者在受试者肿瘤细胞的肿瘤细胞表面上由一个或多个MHC等位基因递呈的数值可能性集合,
该数值可能性集合已至少基于所接受的质谱数据进行鉴定;以及
[1506] 基于所述数值可能性集合选择新抗原集合的子集,以产生经选择的新抗原集合。
[1507] 3.在某些实施方案中,所述经选择的新抗原集合的数量为20个。
[1508] 4.在某些实施方案中,所述递呈模型表示以下两者之间的依赖性:
[1509] MHC等位基因中的一对特定等位基因和在肽序列特定位置处特定氨基酸的存在;和
[1510] 在肿瘤细胞表面上由该对MHC等位基因中的特定等位基因递呈在该特定位置处包含特定氨基酸的此类肽序列的可能性。
[1511] 5.在某些实施方案中,输入肽序列包括:
[1512] 将一种或多种递呈模型应用于相应新抗原的肽序列,以产生一个或多个MHC等位基因中的每一者的依赖性评分,指示MHC等位基因是否将至少基于相应新抗原的肽序列的
氨基酸位置递呈相应新抗原。
[1513] 6.在某些实施方案中,所述方法还包括:
[1514] 变换依赖性评分以产生每个MHC等位基因的相应独立等位基因的可能性,指示相应MHC等位基因将递呈相应新抗原的可能性;以及
[1515] 组合独立等位基因可能性以产生数值可能性。
[1516] 7.在某些实施方案中,变换依赖性评分使相应新抗原的肽序列的递呈模型化是相互排斥的。
[1517] 8.在某些实施方案中,所述方法还包括:
[1518] 变换依赖性评分组合以产生数值可能性。
[1519] 9.在某些实施方案中,变换依赖性评分组合使相应新抗原的肽序列的递呈作为MHC等位基因之间的干扰而模型化。
[1520] 10.在某些实施方案中,数值可能性集合通过至少一个等位基因非相互作用特征进一步鉴定,并且还包括:
[1521] 将不与一个或多个递呈模型中的一者相互作用的等位基因应用于等位基因非相互作用特征,以产生等位基因非相互作用特征的依赖性评分,指示相应新抗原的肽序列是
否将基于等位基因非相互作用特征递呈。
[1522] 11.在某些实施方案中,所述方法还包括:
[1523] 将一个或多个MHC等位基因中的每个MHC等位基因的依赖性评分与等位基因非相互作用特征的依赖性评分组合;
[1524] 变换每个MHC等位基因的组合依赖性评分以产生MHC等位基因中的相应独立等位基因可能性,指示相应MHC等位基因将递呈相应新抗原的可能性;以及
[1525] 组合独立等位基因可能性以产生数值可能性。
[1526] 12.在某些实施方案中,所述方法还包括:
[1527] 变换每个MHC等位基因的依赖性评分与等位基因非相互作用特征的依赖性评分的组合以产生数值可能性。
[1528] 13.在某些实施方案中,用于递呈模型的数值参数集合是基于训练数据集来训练,该训练数据集包括鉴定为存在于多个样品中的至少一个训练肽序列集合和与每个训练肽
序列相关的一个或多个MHC等位基因,其中训练肽序列是通过对从源自多个样品的MHC等位
基因洗脱的分离肽进行质谱法来鉴定。
[1529] 14.在某些实施方案中,训练数据集还包括关于肿瘤细胞的mRNA表达水平的数据。
[1530] 15.在某些实施方案中,样品包含经工程改造以表达单个MHC I类或II类等位基因的细胞系。
[1531] 16.在某些实施方案中,样品包含经工程改造以表达多个MHC I类或II类等位基因的细胞系。
[1532] 17.在某些实施方案中,样品包含获自或源自多个患者的人细胞系。
[1533] 18.在某些实施方案中,样品包含获自多个患者的新鲜或冷冻的肿瘤样品。
[1534] 19.在某些实施方案中,样品包含获自多个患者的新鲜或冷冻的组织样品。
[1535] 20.在某些实施方案中,样品包含使用T细胞分析鉴定的肽。
[1536] 21.在某些实施方案中,训练数据集还包括与以下相关的数据:
[1537] 样品中存在的训练肽集合的肽丰度;
[1538] 样品中的训练肽集合的肽长度。
[1539] 22.在某些实施方案中,训练数据集通过将训练肽序列集合与包含已知蛋白质序列集合的数据库经由比对进行比较来产生,其中训练蛋白质序列集合比训练肽序列更长且
包括训练肽序列。
[1540] 23.在某些实施方案中,训练数据集是基于对细胞系执行或已执行质谱法以获得该细胞系的外显子组、转录组或全基因组肽测序数据中的至少一者来产生,该肽测序数据
包括至少一个包括改变的蛋白质序列。
[1541] 24.在某些实施方案中,训练数据集是基于从正常组织样品获得外显子组、转录组和全基因组正常核苷酸测序数据中的至少一者来产生。
[1542] 25.在某些实施方案中,训练数据集还包括与样品相关的蛋白质组序列相关的数据。
[1543] 26.在某些实施方案中,训练数据集还包括与样品相关的MHC肽组序列相关的数据。
[1544] 27.在某些实施方案中,训练数据集还包括与至少一种分离肽的肽-MHC结合亲和力测量相关的数据。
[1545] 28.在某些实施方案中,训练数据集还包括与至少一种分离肽的肽-MHC结合稳定性测量相关的数据。
[1546] 29.在某些实施方案中,训练数据集还包括与样品相关的转录组相关的数据。
[1547] 30.在某些实施方案中,训练数据集还包括与样品相关的基因组相关的数据。
[1548] 31.在某些实施方案中,训练肽序列的长度在k聚体的范围内,其中k在8-15之间(包括端点)。
[1549] 32.在某些实施方案中,所述方法还包括使用独热编码方案编码肽序列。
[1550] 33.在某些实施方案中,所述方法还包括使用左填充独热编码方案编码训练肽序列。
[1551] 34.本文还公开一种治疗具有肿瘤的受试者的方法,其包括执行本文公开的方法的步骤中的任一者,并且还包括获得包含经选择的新抗原集合的肿瘤疫苗,以及向所述受
试者施用所述肿瘤疫苗。
[1552] 35.本文还公开一种制造肿瘤疫苗的方法,其包括执行本文公开的方法的步骤中的任一者,并且还包括产生或已产生包含经选择的新抗原集合的肿瘤疫苗。
[1553] 36.本文还公开一种包含经选择的新抗原集合的肿瘤疫苗,该经选择的新抗原集合通过执行本文公开的方法选择。
[1554] 37.在某些实施方案中,肿瘤疫苗包含核苷酸序列、多肽序列、RNA、DNA、细胞、质粒或载体中的一个或多个。
[1555] 38.在某些实施方案中,肿瘤疫苗包含在肿瘤细胞表面上递呈的一个或多个新抗原。
[1556] 39.在某些实施方案中,肿瘤疫苗包含在受试者中具有免疫原性的一个或多个新抗原。
[1557] 40.在某些实施方案中,肿瘤疫苗不包含在受试者中诱导针对正常组织的自身免疫应答的一个或多个新抗原。
[1558] 41.在某些实施方案中,肿瘤疫苗还包括佐剂。
[1559] 42.在某些实施方案中,肿瘤疫苗还包括赋形剂。
[1560] 43.在某些实施方案中,选择经选择的新抗原集合包括基于递呈模型选择相对于未经选择的新抗原在肿瘤细胞表面上递呈的可能性增加的新抗原。
[1561] 44.在某些实施方案中,选择经选择的新抗原集合包括基于递呈模型选择相对于未经选择的新抗原在受试者中能够诱导肿瘤特异性免疫应答的可能性增加的新抗原。
[1562] 45.在某些实施方案中,选择经选择的新抗原集合包括基于递呈模型选择相对于未经选择的新抗原能够由专职抗原递呈细胞(APC)递呈于初始T细胞的可能性增加的新抗
原,任选地其中所述APC是树突状细胞(DC)。
[1563] 46.在某些实施方案中,选择经选择的新抗原集合包括基于递呈模型选择相对于未经选择的新抗原经由中心或外周耐受性受抑制的可能性降低的新抗原。
[1564] 47.在某些实施方案中,选择经选择的新抗原集合包括基于递呈模型选择相对于未经选择的新抗原能够诱导针对受试者正常组织的自身免疫应答的可能性降低的新抗原。
[1565] 48.在某些实施方案中,外显子组或转录组核苷酸测序数据是通过对肿瘤组织进行测序而获得。
[1566] 49.在某些实施方案中,测序是下一代测序(NGS)或任何大规模平行测序方法。
[1567] 50.在某些实施方案中,数值可能性集合通过至少MHC-等位基因相互作用特征来进一步鉴定,所述特征包括以下中的至少一者:
[1568] a.经预测的MHC等位基因与新抗原编码肽结合的亲和力。
[1569] b.经预测的新抗原编码肽-MHC复合物的稳定性。
[1570] c.新抗原编码肽的序列和长度。
[1571] d.如通过质谱蛋白质组学或其它手段所评定,在来自表达特定MHC等位基因的其它个体的细胞中递呈具有类似序列的新抗原编码肽的概率。
[1572] e.所讨论的受试者中特定MHC等位基因的表达水平(例如,如通过RNA-seq或质谱法所测量)。
[1573] f.在表达特定MHC等位基因的其他不同受试者中由特定MHC等位基因递呈的总体新抗原编码肽序列独立性概率。
[1574] g.在其他不同受试者中由同一家族分子(例如HLA-A、HLA-B、HLA-C、HLA-DQ、HLA-DR、HLA-DP)中的MHC等位基因递呈的总体新抗原编码肽序列独立性概率。
[1575] 51.在某些实施方案中,数值可能性集合通过至少MHC-等位基因非相互作用特征来进一步鉴定,所述特征包括以下中的至少一者:
[1576] a.在其源蛋白序列内侧接新抗原编码肽的C端和N端序列。
[1577] b.新抗原编码肽中蛋白酶裂解基序的存在,任选地根据相应蛋白酶在肿瘤细胞中的表达加权(如通过RNA-seq或质谱法所测量)。
[1578] c.如在适当细胞类型中所测量,源蛋白的周转率。
[1579] d.源蛋白的长度,任选地考虑在肿瘤细胞中最高度表达的特异性剪接变体(“同种型”),如通过RNA-seq或蛋白质组质谱法所测量,或如DNA或RNA序列数据中所检测的生殖系
或体细胞剪接突变的批注所预测。
[1580] e.蛋白酶体、免疫蛋白酶体、胸腺蛋白酶体或其它蛋白酶在肿瘤细胞中的表达水平(其可通过RNA-seq、蛋白质组质谱法或免疫组织化学测量)。
[1581] f.新抗原编码肽的源基因的表达(例如,如通过RNA-seq或质谱法所测量)。
[1582] g.新抗原编码肽的源基因在细胞周期的各种阶段期间的典型组织特异性表达。
[1583] h.源蛋白和/或其结构域的综合特征目录,如例如uniProt或PDB http://www.rcsb.org/pdb/home/home.do中可见。
[1584] i.描述含有所述肽的源蛋白的结构域特性的特征,例如:二级或三级结构(例如α螺旋对β折叠);替代性剪接。
[1585] j.在其他不同受试者中由所讨论的新抗原编码肽的源蛋白递呈肽的概率。
[1586] k.由于技术偏差,肽将不会由质谱法检测到或过量表示的概率。
[1587] l.通过RNASeq(其无需含有肽的源蛋白)所测量的提供关于肿瘤细胞、基质或肿瘤浸润淋巴细胞(TIL)状态的信息的各种基因模块/通路的表达。
[1588] m.新抗原编码肽的源基因在肿瘤细胞中的拷贝数。
[1589] n.肽结合于TAP的概率或经测量或经预测的肽对TAP的结合亲和力。
[1590] o.TAP在肿瘤细胞中的表达水平(其可通过RNA-seq、蛋白质组质谱法、免疫组织化学测量)。
[1591] p.存在或不存在肿瘤突变,其包括(但不限于):
[1592] i.已知癌症驱动基因(例如EGFR、KRAS、ALK、RET、ROS1、TP53、CDKN2A、CDKN2B、NTRK1、NTRK2、NTRK3)中的驱动突变
[1593] ii.在编码抗原递呈机制中所涉及的蛋白质的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或编码蛋白酶体或免疫蛋白酶体组
分的基因中的任一者)中。递呈依赖于肿瘤中经受功能丧失性突变的抗原递呈机制的组分
的肽具有降低的递呈概率。
[1594] q.存在或不存在功能性生殖系多态性,其包括(但不限于):
[1595] i.在编码抗原递呈机制中所涉及的蛋白质的基因(例如B2M、HLA-A、HLA-B、HLA-C、TAP-1、TAP-2、TAPBP、CALR、CNX、ERP57、HLA-DM、HLA-DMA、HLA-DMB、HLA-DO、HLA-DOA、HLA-DOB、HLA-DP、HLA-DPA1、HLA-DPB1、HLA-DQ、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB2、HLA-DR、HLA-DRA、HLA-DRB1、HLA-DRB3、HLA-DRB4、HLA-DRB5或编码蛋白酶体或免疫蛋白酶体组
分的基因中的任一者)中
[1596] r.肿瘤类型(例如NSCLC、黑素瘤)。
[1597] s.临床肿瘤亚型(例如鳞状肺癌对非鳞状肺癌)。
[1598] t.吸烟史。
[1599] u.肽的源基因在相关肿瘤类型或临床亚型中的典型表达,任选地通过驱动突变分层。
[1600] 52.在某些实施方案中,至少一个突变是移码或非移码插入缺失、错义或无义取代、剪接位点改变、基因组重排或基因融合、或产生neoORF的任何基因组或表达改变。
[1601] 53.在某些实施方案中,肿瘤细胞选自:肺癌、黑素瘤、乳腺癌、卵巢癌、前列腺癌、肾癌、胃癌、结肠癌、睾丸癌、头颈癌、胰腺癌、脑癌、B细胞淋巴瘤、急性骨髓性白血病、慢性骨髓性白血病、慢性淋巴细胞性白血病、T细胞淋巴细胞性白血病、非小细胞肺癌和小细胞
肺癌。
[1602] 54.在某些实施方案中,所述方法还包括获得包含经选择的新抗原集合或其子集的肿瘤疫苗,任选地还包括向受试者施用所述肿瘤疫苗。
[1603] 55.在某些实施方案中,当呈多肽形式时,经选择的新抗原集合中的至少一种新抗原包含以下中的至少一者:对于长度为8-15、8、9、10、11、12、13、14或15个氨基酸的MHC 1类多肽,与MHC的结合亲和力的IC50值小于1000nM,在亲本蛋白质序列中在该多肽内部或附近
存在促进蛋白酶体裂解的序列基序,以及存在促进TAP转运的序列基序。
[1604] 56.本文还公开一种产生用于鉴定可能在肿瘤细胞的肿瘤细胞表面上递呈的一个或多个新抗原的模型的方法,其包括执行以下步骤:
[1605] 接收包含与自源于多个样品的主要组织相容性复合体(MHC)洗脱的多个分离肽相关的数据的质谱数据;
[1606] 通过至少鉴定样品中存在的训练肽序列集合以及与各训练肽序列相关的一个或多个MHC获得训练数据集;
[1607] 使用包含训练肽序列的训练数据集来训练递呈模型的数值参数集合,该递呈模型提供来自肿瘤细胞的肽序列在肿瘤细胞表面上由一个或多个MHC等位基因递呈的多个数值
可能性。
[1608] 57.在某些实施方案中,递呈模型表示以下两者之间的依赖性:
[1609] 在肽序列的特定位置处存在特定氨基酸;和
[1610] 由肿瘤细胞上的MHC等位基因中的一者递呈在该特定位置处含有该特定氨基酸的肽序列的可能性。
[1611] 58.在某些实施方案中,样品包含经工程改造以表达单个MHC I类或II类等位基因的细胞系。
[1612] 59.在某些实施方案中,样品包含经工程改造以表达多个MHC I类或II类等位基因的细胞系。
[1613] 60.在某些实施方案中,样品包含获自或源自多个患者的人细胞系。
[1614] 61.在某些实施方案中,样品包含获自多个患者的新鲜或冷冻的肿瘤样品。
[1615] 62.在某些实施方案中,样品包含使用T细胞分析鉴定的肽。
[1616] 63.在某些实施方案中,训练数据集还包括与以下相关的数据:
[1617] 样品中存在的训练肽集合的肽丰度;
[1618] 样品中的训练肽集合的肽长度。
[1619] 64.在某些实施方案中,获得训练数据集包括:
[1620] 通过将训练肽序列集合与包含已知蛋白质序列集合的数据库经由比对进行比较来获得基于训练肽序列的训练蛋白质序列集合,其中训练蛋白质序列集合比训练肽序列更
长且包括训练肽序列。
[1621] 65.在某些实施方案中,获得训练数据集包括:
[1622] 对细胞系执行或已执行质谱法以获得该细胞系的外显子组、转录组或全基因组核苷酸测序数据中的至少一者,该核苷酸测序数据包括至少一个包括突变的蛋白质序列。
[1623] 66.在某些实施方案中,训练递呈模型的参数集合包括:
[1624] 使用独热编码方案编码训练肽序列。
[1625] 67.在某些实施方案中,所述方法还包括:
[1626] 从正常组织样品获得外显子组、转录组和全基因组正常核苷酸测序数据中的至少一者;以及
[1627] 使用正常核苷酸测序数据训练递呈模型的参数集合。
[1628] 68.在某些实施方案中,训练数据集还包括与样品相关的蛋白质组序列相关的数据。
[1629] 69.在某些实施方案中,训练数据集还包括与样品相关的MHC肽组序列相关的数据。
[1630] 70.在某些实施方案中,训练数据集还包括与至少一种分离肽的肽-MHC结合亲和力测量相关的数据。
[1631] 71.在某些实施方案中,训练数据集还包括与至少一种分离肽的肽-MHC结合稳定性测量相关的数据。
[1632] 72.在某些实施方案中,训练数据集还包括与样品相关的转录组相关的数据。
[1633] 73.在某些实施方案中,训练数据集还包括与样品相关的基因组相关的数据。
[1634] 74.在某些实施方案中,训练数值参数集合还包括:
[1635] 使参数集合逻辑回归。
[1636] 75.在某些实施方案中,训练肽序列的长度在k聚体的范围内,其中k在8-15之间(包括端点)。
[1637] 76.在某些实施方案中,训练递呈模型的数值参数集合包括:
[1638] 使用左填充独热编码方案编码训练肽序列。
[1639] 77.在某些实施方案中,训练数值参数集合还包括:
[1640] 使用深度学习算法确定参数集合的值。
[1641] 78.本文还公开一种产生用于鉴定可能在肿瘤细胞的肿瘤细胞表面上递呈的一个或多个新抗原的模型的方法,其包括执行以下步骤:
[1642] 接收包含与从源自多个新鲜或冷冻肿瘤样品的主要组织相容性复合体(MHC)洗脱的多个分离肽相关的数据的质谱数据;
[1643] 通过至少鉴定肿瘤样品中存在且递呈在与各训练肽序列相关的一个或多个MHC等位基因上的训练肽序列集合来获得训练数据集;
[1644] 基于训练肽序列获得训练蛋白质序列集合;以及
[1645] 使用训练蛋白质序列和训练肽序列训练递呈模型的数值参数集合,该递呈模型提供来自肿瘤细胞的肽序列在肿瘤细胞表面上由一个或多个MHC等位基因递呈的多个数值可
能性。
[1646] 79.在某些实施方案中,递呈模型表示以下两者之间的依赖性:
[1647] MHC等位基因中的一对特定等位基因和在肽序列特定位置处特定氨基酸的存在;和
[1648] 在肿瘤细胞表面上由该对MHC等位基因中的特定等位基因递呈在该特定位置处包含特定氨基酸的此类肽序列的可能性。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈