首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 来自动物的单克隆抗体的快速分离

来自动物的单克隆抗体的快速分离

申请号 CN201180035306.5 申请日 2011-05-17 公开(公告)号 CN103003697A 公开(公告)日 2013-03-27
申请人 得克萨斯系统大学董事会; 发明人 赛·雷迪; 葛新; 丹尼·布齐; 安德鲁·D·埃林顿; 爱德华·M·马科特; 贾森·拉维德尔; 乔治·乔治乌;
摘要 提供了用于识别候选 抗原 特异性可变区以及生成可具有所期望的抗原特异性的 抗体 或抗原结合 片段 的方法和组合物。例如,在某些方面,描述了确定血清抗体CDR的 氨 基酸序列和丰度 水 平的方法。在某些方面,提供了确定抗体可变区序列的核酸序列和 频率 的方法。而且,本 发明 提供识别并生成包含高度表现的CDR的抗体或抗原结合片段的方法。
权利要求

1.一种确定循环系统中的抗体序列的方法,包括:
a)获得由所受对象的成熟B细胞编码的VH和VL基因谱的核酸以及相应的基酸序列信息;
b)获得来源于所述所受对象的血清抗体的肽的质谱;和
c)使用所述序列信息和所述质谱确定循环系统中一个或多个抗体的VH和VL区的氨基酸序列。
2.如权利要求1所述的方法,其中所述成熟B细胞来自外周血。
3.如权利要求1所述的方法,其中所述成熟B细胞来自淋巴器官。
4.如权利要求1所述的方法,其中步骤a)包括确定由所述成熟B细胞编码的VH和VL基因的核酸序列以及相应的氨基酸序列。
5.如权利要求4所述的方法,其中所述成熟B细胞中的所述核酸序列是通过高通量DNA测序确定的。
6.如权利要求5所述的方法,其中所述高通量测序包括边合成边测序、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序、纳米孔测序或其组合。
7.如权利要求1所述的方法,其中所述成熟B细胞包括记忆B细胞。
8.如权利要求1所述的方法,其中所述成熟B细胞包括浆细胞。
9.如权利要求1所述的方法,其中步骤b)包括使用高效液相色谱(HPLC)。
10.如权利要求1所述的方法,其中步骤b)进一步包括分离或富集所选择类型的血清抗体。
11.如权利要求1所述的方法,其中步骤b)进一步包括分离或富集与预定抗原结合的血清抗体。
12.如权利要求1所述的方法,其中步骤b)进一步包括分离或富集血清抗体中含CDR3的片段
13.如权利要求1所述的方法,其中步骤b)进一步包括使用基于所述序列信息所确定的蛋白酶从血清抗体制备含CDR3的肽片段。
14.如权利要求1所述的方法,其中所述所受对象患有肿瘤、感染性疾病自身免疫性疾病或者已经被免疫。
15.如权利要求1所述的方法,其中所述所受对象具有或者已经被暴露于为感染剂、肿瘤抗原、肿瘤细胞或自身抗原的抗原。
16.如权利要求1所述的方法,进一步包括报告步骤c)中的确定。
17.如权利要求1所述的方法,其中所述方法进一步包括确定所述血清抗体的氨基酸序列的丰度平。
18.如权利要求1所述的方法,其中所述方法进一步包括识别至少具阈值水平丰度的抗体序列。
19.如权利要求18所述的方法,其进一步包括生成包含一个或多个的所述富有氨基酸序列中的一种或多种抗体或抗原结合片段。
20.如权利要求19所述的方法,其中每个所生成的抗体或抗原结合片段中包含相似丰度的氨基酸序列的VH和VL或者是相似丰度的高同源性氨基酸序列簇的一部分。
21.如权利要求19所述的方法,其中步骤c)中生成的抗体或抗体结合片段以100pM至
5μM的单价亲和性结合所述所受对象具有或者已经被暴露于的抗原。
22.如权利要求19所述的方法,其进一步包含评估所生成的抗体或抗原结合片段对预定抗原的结合亲和性。
23.一种识别循环系统中富有抗体序列的方法,包括:
a)在所受对象的含有血清的样品中确定相应于抗体的VH和VL区的氨基酸序列以提供血清抗体序列;和
b)识别相对于其他血清抗体序列表现出至少阈值水平丰度的抗体序列。
24.如权利要求23所述的方法,其中步骤a)包括获得来源于所述所受对象的血清抗体的肽的质谱。
25.如权利要求23所述的方法,其中所确定的氨基酸序列包括完整的VH和VL区的序列。
26.如权利要求25所述的方法,其中所确定氨基酸序列包括完整抗体V结构域的序列。
27.如权利要求26所述的方法,其中确定完整抗体V结构域的序列包括配对相似丰度的VH和VL区、基于同源性比对配对VH和VL区或基于亲和测定配对VH和VL区。
28.如权利要求23所述的方法,其中确定相应于所述VH和VL区的氨基酸序列包括确定所述VH和VL区的至少互补决定区3(CDR3)的氨基酸序列。
29.如权利要求23所述的方法,其中步骤a)进一步包括使用基于所述所受对象的成熟B细胞中VH和VL基因的至少CDR3的核酸序列和相应的氨基酸序列的序列信息确定的蛋白酶从血清抗体制备含CDR3的肽片段。
30.如权利要求23所述的方法,其中步骤a)进一步包括获得所述所受对象的成熟B细胞中VH和VL基因的至少CDR3的核酸序列的序列信息,其中所述核酸序列信息被用于确定所述血清抗体的氨基酸序列。
31.如权利要求30所述的方法,其中获得所述核酸序列信息包括确定所述B细胞中的核酸序列以及相应的氨基酸序列。
32.如权利要求31所述的方法,其中所确定的核酸序列包括VH和VL基因的序列。
33.如权利要求31所述的方法,其中所述B细胞中的核酸序列通过高通量DNA测序来确定。
34.如权利要求33所述的方法,其中所述高通量测序包括边合成边测序、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序、纳米孔测序或其组合。
35.如权利要求30所述的方法,其中所述成熟B细胞包括记忆B细胞。
36.如权利要求30所述的方法,其中所述成熟B细胞包括浆细胞。
37.如权利要求23所述的方法,其中步骤a)进一步包括分离或富集所选择类型的血清抗体。
38.如权利要求23所述的方法,其中步骤a)进一步包括分离或富集与预定抗原结合的血清抗体。
39.如权利要求23所述的方法,其中步骤a)进一步包括分离或富集血清抗体中含CDR3的片段。
40.如权利要求23所述的方法,其中所述方法包括通过自动化方法确定所述血清抗体的氨基酸序列的丰度水平。
41.如权利要求40所述的方法,其中确定所述氨基酸序列的丰度水平包括质谱定量方法。
42.如权利要求23所述的方法,其中所述阈值丰度水平是约5至约500μg/ml的浓度。
43.如权利要求23所述的方法,其中所述丰度的阈值水平是所述血清抗体中50个最富有的含CDR3的氨基酸序列中的任何一个的水平。
44.如权利要求23所述的方法,其中所述所受对象患有肿瘤、感染性疾病、自身免疫性疾病或者已经被免疫。
45.如权利要求23所述的方法,其中所述所受对象具有或者已经被暴露于为感染剂、肿瘤抗原、肿瘤细胞或自身抗原的抗原。
46.如权利要求23所述的方法,其进一步包括报告步骤a)中的确定或步骤b)中的识别。
47.如权利要求23所述的方法,其进一步包括步骤c),即生成包含一个或多个的所述富有氨基酸序列中的一种或多种抗体或抗原结合片段的。
48.如权利要求47所述的方法,其中每个所生成的抗体或抗原结合片段中包含相似丰度氨基酸序列的VH和VL。
49.如权利要求47所述的方法,其中步骤c)中所生成的抗体或抗原结合片段以约
100pM至5μM的单价亲和性与所述所受对象具有或已经被暴露于的抗原结合。
50.如权利要求47所述的方法,其中所述步骤c)包括在异源系统中的表达或体外蛋白合成的使用。
51.一种生成一种或多种抗体或抗原结合片段的方法,包括:
a)获得相应于所受对象的血清中存在的抗体的VH和VL区的抗体氨基酸序列的序列和丰度信息;
b)识别表现出如富有氨基酸序列的至少阈值水平丰度的那些序列;和
c)生成包含一个或多个所确定的富有氨基酸序列的一种或多种抗体或抗原结合片段。
52.如权利要求51所述的方法,其中步骤a)包括确定所述血清抗体的VH和VL区的至少CDR3的氨基酸序列。
53.如权利要求52所述的方法,其中步骤a)包括获得来源于所述血清抗体的肽的质谱。
54.如权利要求52所述的方法,其中所确定的氨基酸序列包括完整VH和VL区的序列。
55.如权利要求54所述的方法,其中所确定的氨基酸序列包括完整抗体V结构域的序列。
56.如权利要求55所述的方法,其中确定完整抗体V结构域的序列包括:将为相似丰度序列的VH和VL区配对;基于同源性比对配对VH和VL区或基于结合测定配对VH和VL区。
57.如权利要求51所述的方法,其中获得相应于VH和VL区的抗体氨基酸序列的序列和丰度信息包括获得所述VH和VL区的至少互补决定区3(CDR3)的抗体氨基酸序列的序列和丰度信息。
58.如权利要求52所述的方法,其中步骤a)进一步包括使用基于所述所受对象的成熟B细胞中的VH和VL基因的至少CDR3的核酸序列和相应的氨基酸序列的序列信息识别的蛋白酶从血清抗体制备含CDR3的肽。
59.如权利要求52所述的方法,其中步骤a)进一步包括获得所述所受对象的成熟B细胞所编码的VH和VL基因谱的至少CDR3的核酸序列的序列信息,其中所述核酸序列信息被用于确定所述血清抗体的氨基酸序列。
60.如权利要求59所述的方法,其中获得所述氨基酸序列信息包括确定所述B细胞中的核酸序列和相应的氨基酸序列。
61.如权利要求60所述的方法,其中所确定的核酸序列包括VH和VL基因的序列。
62.如权利要求60所述的方法,其中所述B细胞中的核酸序列通过高通量DNA测序来确定。
63.如权利要求62所述的方法,其中所述高通量测序包括边合成边测序、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序、纳米孔测序或其组合。
64.如权利要求59所述的方法,其中所述成熟B细胞包括记忆B细胞。
65.如权利要求59所述的方法,其中所述成熟B细胞包括浆细胞。
66.如权利要求51所述的方法,其中步骤a)进一步包括分离或富集所选择类型的血清抗体。
67.如权利要求51所述的方法,其中步骤a)进一步包括分离或富集与预定抗原结合的血清抗体。
68.如权利要求51所述的方法,其中步骤a)进一步包括分离或富集血清抗体的含CDR3的片段。
69.如权利要求51所述的方法,其中步骤a)进一步包括通过血清抗体的蛋白水解片段化产生的肽序列的丰度水平。
70.如权利要求69所述的方法,其中确定所述氨基酸序列的丰度水平包括质谱的定量方法。
71.如权利要求51所述的方法,其中所述丰度的阈值水平是约5至约500μg/ml的浓度。
72.如权利要求51所述的方法,其中所述丰度的阈值水平是所述血清抗体中50个最富有的含CDR3的氨基酸序列中的任何一个的水平。
73.如权利要求51所述的方法,其中所述所受对象患有肿瘤、感染性疾病、自身免疫性疾病或者已经被免疫。
74.如权利要求51所述的方法,其中所述所受对象具有或者已经被暴露于为感染剂、肿瘤抗原、肿瘤细胞或自身抗原的抗原。
75.如权利要求51所述的方法,其进一步包括报告步骤b)中的识别。
76.如权利要求51所述的方法,其中步骤c)中生成的抗体或抗原结合片段中的每一种包括相似丰度的VH和VL的氨基酸序列。
77.如权利要求51所述的方法,其中步骤c)中所生成的抗体或抗原结合片段以100pM至5μM的单价亲和性与所述所受对象具有或已经被暴露于的抗原结合。
78.如权利要求51所述的方法,其进一步包括评估步骤c)中所生成的抗体或抗原结合片段对预定抗原的结合亲和性的步骤d)。
79.一种生成抗体的方法,包括:
a)获得所受对象的含血清样品中抗体的VH和VL区的氨基酸序列的序列和丰度信息;

b)基于所述序列和丰度信息生成包含所述血清抗体的VH和VL的一种或多种抗体。
80.如权利要求79所述的方法,其中步骤a)包括确定所述血清抗体的氨基酸序列。
81.如权利要求80所述的方法,其中步骤a)包括获得来源于所述所受对象的血清抗体的肽的质谱。
82.如权利要求80所述的方法,其中步骤a)包括使用高效液相色谱(HPLC)。
83.如权利要求79所述的方法,其中步骤b)包括相应于表现出至少阈值水平丰度的抗体序列的VH和VL编码区的化学合成。
84.如权利要求83所述的方法,其中步骤b)包括在细菌细胞中表达所合成的VH和VL编码区。
85.如权利要求79所述的方法,其中a)包括获得高同源性的VH和VL区的丰度信息。
86.一种从所受对象的血清抗体制备含CDR3的肽片段的方法,包括:
a)获得所受对象的成熟B细胞中VH和VL基因的至少CDR3的核酸以及相应的氨基酸序列信息;
b)使用所述序列信息选择蛋白酶;和
c)用所述蛋白酶从所述所受对象的血清抗体制备含CDR3的肽片段。
87.如权利要求86所述的方法,其中所选择的蛋白肽在临近所述CDR3区的位点裂解VH和VL区。
88.如权利要求86所述的方法,其中获得所述核酸序列信息包括确定所述B细胞中所述核酸序列和所述相应的氨基酸序列。
89.如权利要求88所述的方法,其中所确定的所述核酸序列包括VH和VL基因的序列。
90.如权利要求88所述的方法,其中所述B细胞中的所述核酸序列通过高通量DNA测序来确定。
91.如权利要求86所述的方法,其中所述成熟B细胞包括记忆B细胞。
92.如权利要求86所述的方法,其中所述成熟B细胞包括浆细胞
93.如权利要求86所述的方法,进一步包括富集或纯化含CDR3的肽片段的步骤d)。
94.如权利要求93所述的方法,其中步骤d)包括将含CDR3的肽片段与标记的巯基特异性轭合剂轭合。
95.如权利要求94所述的方法,其中步骤d)包括基于所轭合的含CDR3的肽片段上的标记富集或纯化含CDR3的肽片段。
96.如权利要求94所述的方法,其中所述标记是生物素。
97.一种生成一种或多种抗体或抗原结合片段的方法,包括:
a)获得所受对象的成熟B细胞中相应于VH和VL基因的核酸序列的序列和丰度信息;

b)识别表现出阈值水平丰度的那些序列;和
c)生成包含一个或多个的相应于所识别的核酸序列的氨基酸序列的一种或多种抗体或抗原结合片段。
98.如权利要求97所述的方法,其中所述成熟B细胞来自外周血。
99.如权利要求97所述的方法,其中所述成熟B细胞来自淋巴器官。
100.如权利要求97所述的方法,其中所述成熟B细胞包括骨髓浆细胞。
101.如权利要求97所述的方法,其中所述成熟B细胞包括淋巴结浆细胞。
102.如权利要求97所述的方法,其中所述成熟B细胞包括脾浆细胞。
103.如权利要求97所述的方法,其中所述成熟B细胞包括来自外周血的浆母细胞。
104.如权利要求97所述的方法,其中所述成熟B细胞包括来自脾或淋巴结或外周血的记忆B细胞。
105.如权利要求97所述的方法,其中所述成熟B细胞基于细胞表面标记的差异表达来选择或富集。
106.如权利要求97所述的方法,其中所述细胞表面标记是Blimp-1、CD138、CXCR4或CD45。
107.如权利要求97所述的方法,其中步骤a)包括高通量测序。
108.如权利要求107所述的方法,其中所述高通量测序包括边合成边测序、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序、纳米孔测序或其组合。
109.如权利要求97所述的方法,其中步骤c)包括所识别的核酸序列的化学合成。
110.如权利要求97所述的方法,其中步骤c)包括在异源系统中的表达或体外蛋白合成的使用。
111.如权利要求97所述的方法,其中所述阈值水平的丰度是来自所选择的器官的浆细胞群中的至少1%。
112.如权利要求97所述的方法,其中所产生的抗体或抗体片段中的每一个包括相应于相似丰度的VH和VL的氨基酸序列或者相似丰度的VH和VL的高同源性核酸序列的簇的氨基酸序列。
113.如权利要求97所述的方法,其中所述所受对象患有感染、肿瘤或自身免疫性疾病或者已经被免疫。
114.如权利要求97所述的方法,其中所生成的抗体或抗体片段结合一名或多名所受对象具有或者已经被暴露于的抗原。
115.如权利要求114所述的方法,其中所述抗原是感染剂、肿瘤抗原、肿瘤细胞或自身抗原。
116.一种识别循环系统中的富有抗体序列的方法,包括:
a)确定所受对象的成熟B细胞中相应于VH和VL基因的核酸序列的序列和丰度信息;

b)识别相应于表现出至少阈值水平丰度的抗体核酸序列的那些抗体氨基酸序列,由此识别循环系统中的富有抗体序列;
117.如权利要求116所述的方法,其中所述成熟B细胞包括骨髓浆细胞。
118.如权利要求116所述的方法,其中所述成熟B细胞包括淋巴结浆细胞。
119.如权利要求116所述的方法,其中所述成熟B细胞包括脾浆细胞。
120.如权利要求116所述的方法,其中确定相应于所述VH和VL基因的核酸序列的序列和丰度信息包括确定所述VH和VL基因的至少CDR3的序列和丰度信息。
121.如权利要求116所述的方法,其中步骤a)包括高通量测序。
122.如权利要求121所述的方法,其中所述高通量测序包括边合成边测序、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序、纳米孔测序或其组合。
123.如权利要求121所述的方法,其进一步包括生成包含一个或多个的所述富有抗体序列中的一种或多种抗体或抗原结合片段的步骤c)。
124.如权利要求123所述的方法,其中所产生的抗体或抗体片段中的每一个包括相应于下列的氨基酸序列:相似丰度的VH和VL的氨基酸序列或者相似丰度的VH和VL的高同源性核酸序列的簇。
125.如权利要求123所述的方法,其中步骤c)包括所识别的抗体序列的化学合成。
126.如权利要求125所述的方法,其中步骤c)包括将所合成的VH和VL基因并入至少一个表达抗体中。
127.如权利要求123所述的方法,其中所述步骤c)包括在异源系统中的表达或体外蛋白合成的使用。
128.如权利要求116所述的方法,其中所述阈值水平的丰度是来自所选择的器官的浆细胞群中的至少1%。
129.如权利要求116所述的方法,其中所识别的抗体氨基酸序列是IgG抗体的序列。
130.如权利要求116所述的方法,其中所识别的抗体氨基酸序列是IgM抗体的序列。
131.如权利要求116所述的方法,其中所识别的抗体氨基酸序列是IgA抗体的序列。
132.一种识别候选抗原特异性可变区核酸序列的方法,其中所述方法包括下列步骤:
a)从所受对象的淋巴组织的核酸群获得抗体可变区核酸池而无需将B细胞从所述淋巴组织分离,其中所述所受对象已经被暴露于抗原;和
b)确定所述池中抗体可变区核酸的序列和出现频率
c)识别总共以步骤b)中所确定的序列中的至少0.5%的频率存在的富有可变区序列,其中所述富有可变区序列是候选抗原特异性序列。
133.如权利要求132所述的方法,进一步包括选择包含相似丰度水平或作为具有相似丰度的高同源性核酸序列簇的一部分的VH和VL的核酸序列的一对VH和VL序列。
134.如权利要求133所述的方法,其中所述对中的所述VH核酸序列是最富有VH序列并且所述对中的所述VL核酸序列是最富有VL序列。
135.如权利要求133所述的方法,进一步包括生成由VH和VL的成对核酸序列编码的氨基酸序列的抗体或抗体片段,其中所生成的抗原或抗原片段中的至少一种结合所述抗原。
136.如权利要求132所述的方法,进一步包括所述富有可变区序列的化学合成。
137.如权利要求132所述的方法,进一步包括在体外表达系统或异源细胞表达系统中表达所述富有可变区序列。
138.如权利要求132所述的方法,进一步包括免疫所述所受对象。
139.如权利要求132所述的方法,其中所述淋巴组织是初级淋巴组织。
140.如权利要求132所述的方法,其中所述淋巴组织是二级淋巴组织。
141.如权利要求132所述的方法,其中所述淋巴组织是三级淋巴组织。
142.如权利要求132所述的方法,其中所述淋巴组织是骨髓、脾或淋巴结。
143.如权利要求142所述的方法,其中所述淋巴组织是骨髓。
144.如权利要求132所述的方法,其中所述所受对象是哺乳动物、鱼、两栖动物或
145.如权利要求144所述的方法,其中所述哺乳动物是人类、小鼠、灵长类、兔、山羊、绵羊或猪。
146.如权利要求132所述的方法,其中所述核酸池是cDNA池。
147.如权利要求132所述的方法,其中获得所述核酸池包括使用逆转录酶。
148.如权利要求132所述的方法,其中获得所述核酸池包括使用基于已知抗体恒定区cDNA序列的引物或探针。
149.如权利要求132所述的方法,其中获得所述核酸池包括快速cDNA末端扩增(RACE)。
150.如权利要求132所述的方法,其中获得所述核酸池包括PCR扩增。
151.如权利要求132所述的方法,其中获得所述核酸池包括核酸杂交。
152.如权利要求132所述的方法,其中所述核酸池是基因组核酸池。
153.如权利要求132所述的方法,其中确定所述序列包括高通量测序
154.如权利要求153所述的方法,其中所述高通量测序包括边合成边测序、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序、纳米孔测序或其组合。
155.如权利要求132所述的方法,其进一步包括识别所述抗体可变区核酸序列的CDR3序列。
156.如权利要求132所述的方法,其中所选择的可变区序列的存在频率进一步定义为具有与所选择的可变区序列具有相同的CDR3序列的任何可变区序列的出现频率的和。
157.如权利要求132所述的方法,其中所述方法包括识别总共以在步骤b)中所确定序列中至少1%的频率存在的富有可变区序列。
158.如权利要求132所述的方法,其中所述抗体可变区核酸具有所选择的抗体类型。
159.如权利要求158所述的方法,其中所选择的抗体类型是IgG或IgA。

说明书全文

来自动物的单克隆抗体的快速分离

[0001] 相关申请的交叉引用
[0002] 本申请要求分别于2010年5月17日和2010年8月27日提交的美国临时专利申请第61/345,538和61/377,816号的权益,其全部内容通过引用并入本文。
[0003] 发明背景

技术领域

[0004] 本发明一般涉及抗体分析和产生的领域,例如从免疫的动物发现抗体。更具体地,其涉及用于识别和/或生产所期望的抗体或抗原结合片段的方法和组合物。其还涉及来自任何哺乳动物以及更一般地具有导致可溶免疫球蛋白表达的适合的免疫响应并且其免疫球蛋白基因座的基因信息可得的任何动物的单克隆抗体的识别。
[0005] 相关领域描述
[0006] 在过去的12年中,癌症治疗性抗体例如赫塞汀(曲妥单抗,抗Her2)、Rituxa(利妥昔单抗,抗CD20)、Eribitux/Vectibix(西妥昔单抗/帕尼单抗,抗EGFR)、阿瓦斯丁(抗VEGF)和其他的开发已经挽救了全世界数以万计的生命。抗体治疗相对于小分子药物提供了不同优点,即:(i)对作用原理更好的了解;(ii)较高的特异性和较少的目标外效果;(iii)可预计的安全性和毒理学概况。目前,在美国有超过200种抗体治疗处于临床试验,其中大部分用于癌症治疗
[0007] 单克隆抗体的发现是治疗性抗体开发中非常重要的方面。此外,单克隆抗体广泛用于多种诊断和分析目的。自35年前由Kohler和Milstein开发的杂交瘤技术(Kohler和Milstein,1975)以来,已经开发了多种产生MAb的方法。这些方法包括经由EB病毒的基因重组(Traggiai等人,2004)或逆转录病毒介导的基因转移(Kwakkenbos等人,2010)的B细胞永生化,通过单细胞PCR克隆V基因(Wrammert等人,2008;Meijer等人,2008)和经由重组抗体文库的展示和删选的体外发现的方法(Clackson等人,1991;Feldhaus等人,2003;Harvey等人,2004;Schaffitzel等人,1999;Hosse等人,2006;Mazor等人,2007;Zahnd等人,2007;Kretzschmar和von Ruden,2002)。用于抗体发现的体外和体内方法都关键取决于确定抗原特异性的高通量筛选。近来,使用用于抗原特异性B细胞的高通量确定的光刻的微雕技术已经加速了B细胞分析,然而,这是以归因于对抗体V基因扩增和细胞扩增的需要的可观的技术复杂性为代价的(Jin等人,2009;Love等人,2006)。
[0008] 相似地,体外抗体发现技术的成功取决于筛选参数,包括展示平台的性质、抗原浓度、浓缩期间的结合亲和、多轮筛选(例如,淘洗或分选)以及重要地取决于合成抗体文库的设计和多样性(Hoogenboom,2005;Cobaugh等人,2008;Persson等人,2006)。
[0009] 目前与文库筛选系统例如通过淘洗分离抗体的噬菌体展示结合的展示技术的使用具有许多显著问题—尤其是通过文库生产的一些抗体可导致表达它们的生物体死亡并且因此它们不能被简单地检测。存在特别的问题,即当寻找对于来自病原体的抗原的特异的可能与宿主表达系统(例如大肠杆菌(E.coli))生产的抗体同源的抗体时,重要的抗体不能被表达时。使用大肠杆菌表达人类抗体文库同样受困于密码子选择的问题—人类特定基酸所使用的密码子常常不是大肠杆菌或其他宿主系统中相同氨基酸的最佳密码子。这意味着重要的抗体不能(或至少不能以足够的量)被表达,因为其序列中的密码子在大肠杆菌中高度失效导致在大肠杆菌中不能通读并且全长表达。抗体文库的密码子最佳化明显不是可选的,因为文库首先必须被测序,其使得使用文库的主要优点落空。
[0010] 有对于识别控制疾病上表现出有益效果的生物学相关抗体的急迫需要。哺乳动物将抗体(体液)免疫反应针对抗传染原、毒素或癌细胞。患病的个体产生识别疾病原的循环抗体并且在某些实例中(例如在从感染恢复的患者中或者在处于缓解和中的癌症患者中),这些抗体在恢复和治疗中起到关键作用。目前没有可获得的识别血液中的循环抗体并且产生对疾病原特异性的并且具有治疗效果的抗体的方法。
[0011] 另一方面,来自不同动物物种的单克隆抗体的分离对于治疗学和诊断学的发展很有价值。分离单克隆抗体的现有方法的主要局限在于它们的应用限于非常小数目的物种。与小鼠和人类相比,不同物种已经进化出了不同的使它们的抗体谱变化的不同方法并且因此可产生识别抗原上不同表位或者显示对特定抗原非常高的亲和力的抗体。例如,本领域中熟知的是来自兔类的抗体通常展示比从小鼠生产的那些高得多的亲和性
[0012] 目前使用杂交瘤技术从特定物种生产单克隆抗体需要将B细胞通过与来自该物种的骨髓瘤融合而永生化成。发育这些骨髓瘤细胞系是困难并且费时的并且因此仅存在于小鼠、灵长类、兔和绵羊。可选择地,研究者已经试图通过将小鼠骨髓瘤细胞系与来自其自体骨髓瘤细胞系不可获得的动物的B细胞融合产生种间杂交瘤。然而,种间杂种以非常低的效率产生并且不稳定,在几代之后停止产生单克隆抗体。因此,目前从具有适当的免疫球蛋白系统的动物中的绝大多数产生单克隆抗体是主要挑战。而且,即使是对于可产生稳定的B细胞融合的物种(兔、小鼠、绵羊和灵长类),使用杂交瘤技术分离单克隆抗体是动物处死之后需要2-6个月的长期过程。
[0013] 可选择地,单克隆抗体可从来自免疫动物的免疫球蛋白谱的可变(V)链的巨大的文库体外分离并且之后通过不同的展示方法例如噬菌体展示、酵母展示或细菌展示来筛选这些文库。这些方法的使用再一次受限于其免疫球蛋白谱的全面信息可得的几个物种,即小鼠、灵长类和兔。这是因为免疫球蛋白谱的克隆需要能够获得能够将经由无性系重组机制在该动物产生的免疫球蛋白可变区的大部分优选地全部扩增的成套的寡核苷酸引物。其反过来需要在特定物种中表达的免疫球蛋白的序列的全面信息并且其对于具有编码抗体的体液免疫系统的动物中的大部分来说都是不可得的。此外,不知道通过组合文库筛选分离的抗体是否对应于已经通过免疫系统扩增并且在动物中大量生产的那些。
[0014] 明显地,所有这些技术在某种程度上是复杂的、有困难的并且费时的。因此,还有对开发用于识别抗原特异性抗体或直接来自患者或任何动物的单克隆抗体的更有效和精确的方法的需要。
[0015] 发明概述
[0016] 本发明的方面通过提供确定血清抗体序列或识别来自血清、B细胞或直接来自淋巴组织或来自分离的B细胞的富有抗体序列的新方法来克服本领域中的主要缺陷。因此,在第一实施方案,提供了用于识别循环系统中富有抗体序列的方法,包括:a)确定所受对象的含血清样品中的抗体的VH和VL序列的至少互补决定区3(CDR3)的氨基酸序列,以提供血清抗体序列;和b)识别相对其他血清抗体序列表阈值平丰度的抗体序列。“含血清样品”意指包括任何血液相关样品,例如含血清样品、血浆样品或具有添加剂的血液样品。在某些方面,所确定的氨基酸序列包含完整的VH和VL区的序列。
[0017] 在第二实施方案中,提供了用于产生一种或多种抗体或抗原结合片段的方法,包括:a)获得在所受对象的血清中存在的抗体的VH和VL区的至少CDR3的抗体氨基酸序列的序列和丰度信息;b)识别表现出至少阈值水平丰度的那些序列;和c)产生包括所确定的富有氨基酸序列中的一种或多种的一种或多种抗体或抗原结合片段。例如,这些抗体或抗原片段的产生可包括在异源体系中的表达或体外蛋白合成的使用。
[0018] 在另外的实施方案中,提供确定循环系统中的抗体序列的方法,包括:a)获得所受对象的成熟B细胞中一种或多种VH和VL基因的核酸序列和相应的氨基酸、序列信息;b)获得来源于所受对象的血清抗体的肽的质谱;和c)使用序列信息和质谱确定循环系统中一种或多种抗体的VH和VL区的氨基酸序列。
[0019] 在另外的实施方案中,提供产生抗体的方法,包括:a)获得所受对象的含血清样品中抗体的VH和VL区的氨基酸序列的序列和丰度信息;和b)基于序列和丰度信息产生包含血清抗体的VH和VL区的一种或多种抗体。
[0020] 在某些实施方案中,同样提供制备来自所受对象的血清抗体的包含CDR3的肽片段的方法,包括:a)获得所受对象的成熟B细胞中的VH和VL基因的至少CDR3的核酸以及相应的氨基酸、序列信息;b)使用序列信息选择蛋白酶;和c)使用所述蛋白酶从所受对象的血清抗体制备含CDR3的肽片段。这样的蛋白酶可基本上不剪切VH和VL肽的CDR3。例如,蛋白酶可在接近CDR3区的位点剪切,产生基本上完整的CDR3。
[0021] 在其他方面,还提供了与B细胞中核酸信息有关的方法。例如,提供了产生一种或多种抗体或抗原结合片段的方法,包括:a)获得所受对象的浆细胞群中VH和VL基因的至少CDR3的核酸序列的序列和丰度信息;和b)识别表现至少阈值水平丰度的那些序列;和c)产生一种或多种抗体或抗原结合片段,其包含相应于所识别的核酸序列的氨基酸序列中的一个或多个。
[0022] 发明人发现血清中存在的富有抗体序列可与B细胞尤其是来自所选择的器官例如骨髓的B细胞中的富有抗体基因相关联。在另外的实施方案中,提供了识别循环系统中富有抗体序列的方法,包括:a)确定所受对象的浆细胞群中VH和VL基因的至少CDR3的核酸序列的序列和丰度信息;和b)识别相应于表现出至少阈值水平丰度的抗体核酸序列的那些抗体氨基酸序列,由此识别循环系统中的富有抗体序列。例如,所识别的抗体氨基酸序列可以是所选择类型的抗体例如IgG、IgM或IgA的序列。
[0023] 在某些方面,确定或获得VV基因序列(例如VH、VL)的丰度信息包括获得来源于相同VDJ谱系的一簇高相似性序列的丰度信息。例如,可将多个序列进行比对以确定高相似性序列簇(例如无性系高突变的结果不同的序列)并且之后所述簇可被分级以确定簇的普遍性。因此,在将VH和VL结构域配对形成完整抗体V结构域的方面中,可将属于相似分级簇的VH和VL结构域配对。
[0024] 在另外的实施方案中,提供了在任何动物中产生单克隆抗体的方法。所述方法可以通过利用来自所受对象例如免疫的动物的免疫球蛋白DNA的高通量DNA测序以及之后用于对免疫抗原具有特异性的单克隆抗体的识别的抗体核酸序列谱的生物信息学分析来克服之前的局限。由此识别的抗体可以转换类型并且无性系超突变或者可具有所选择的抗体类型,例如人类和小鼠中的IgG或IgA或其他动物中它们的等效物。
[0025] 在某些实施方案中,提供了确定候选抗原特异性抗体可变区核酸序列的方法。所述方法可包括从所受对象的淋巴组织的核酸群获得抗体可变区核酸池,优选地无需从淋巴组织分离B细胞。所受对象可被暴露于抗原例如传染源、免疫原或毒素。可变区可至少包括CDR3或包含CDR1-3的全长区并且可以是可变重链或可变轻链或两者。
[0026] 所述方法可包括将所受对象免疫。所述方法可进一步包括淋巴组织的分离。免疫组织分离可以是在免疫后至少或约1、2、3、4、5、6、7、8、9、10天或任何中间范围。所述方法可进一步包含获得淋巴组织的核酸群,优选地无需从淋巴组织分离B细胞。淋巴组织可以是初级、二级或三级淋巴组织,例如骨髓、脾脏或淋巴结。所受对象可以是任何动物,例如哺乳动物、鱼、两栖动物或。哺乳动物可以是人类、小鼠、灵长类、兔、绵羊或猪。
[0027] 抗体可变区的核酸池可以是cDNA池。获得核酸池可以包括使用逆转录酶。获得核酸池的方法例如可包括快速cDNA末端扩增(RACE)、PCR扩增或者核酸杂交。无需从淋巴组织分离B细胞,淋巴组织的核酸群可包含其他非B细胞核酸以及非抗体核酸。对于抗体序列分离,可以使用抗体特异性引物或探针,例如基于已知抗体恒定区cDNA序列的引物或探针。在可选择的方面,核酸池可以是基因核酸池。
[0028] 所述方法可进一步包括确定池中抗体可变区核酸的序列和出现频率。在另外的实施方案中,所述方法可包括确定富有可变区序列。在特定的实施方案中,所述方法可进一步包括确定抗体可变区核酸序列的CDR3序列,例如通过同系物搜索。由于CDR3是最常见的可变区,可变区序列频率优选地基于相应的CDR3频率。特别地,所选择的可变区序列的出现频率可以进一步定义为与所选择的可变区序列具有相同或相似CDR3序列的任何可变区序列的出现频率的总和。相似的CDR3序列可以是至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或任何中间范围。例如,可变区序列可以基于相同或相似CDR3序列而分组并且每组如相同组中所有序列的频率的和所定义的相同的频率。在其他方面,可变区序列的频率可以是每个不同可变区序列的频率或者基于包含CDR1、CDR2和CDR3的全长可变区的相似性的频率。
[0029] 在某些方案中,可进行富有CDR3序列的识别,之后识别包含所识别的富有CDR3序列的全长可变区。例如,引物或探针可以基于富有CDR3序列产生并且用于富集或扩增编码富有CDR3序列的抗体可变区序列。
[0030] 在示例性的方面中,这些富有序列可以所确定的序列中总共至少0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、
4.5%、5%、6%、7%、8%、9%、10%或任何中间范围的频率存在。所识别的富有可变区序列可以是候选抗原特异性序列。
[0031] 对于抗原特异性抗体或抗体片段的产生,所述方法可进一步包括选择一对包含相似丰度水平的VH和VL的核酸序列或一对包含属于包含相似分度的一簇核酸序列的核酸序列。例如,所述对中VH核酸序列是最富有VH序列并且所述对中的VL核酸序列是最富有VL序列。可选择地,相似丰度水平的VH和VL可以是分别具有在VH或VL亚群中相似分级等级或相似浓度水平的任何VH和VL。例如,第三最富有VH可以与第三最富有VL配对。在还有另外的方面中,VH和/或VL可以与其他所识别的VH或VL序列比对以识别高相似性序列簇(例如例如高突变的结果不同的序列)之后将所述簇分级并且VH可与属于相似级别的簇的VL配对。
[0032] 所述方法可进一步包括产生包含由VH和VL的所配对的核酸序列编码的氨基酸序列的抗体或抗体片段。所产生的抗体或抗体片段中的至少一种可以结合所受对象已经被暴露于其的抗原,例如用于将所受对象免疫的免疫原。例如,富有可变区序列可以直接化学合成,例如自动合成法。所述方法可进一步包括在体外表达系统中或异源细胞表达系统中表达富有可变区序列(例如合成的)。
[0033] 所受对象可以是任何动物,优选地哺乳动物或人类。所受对象可以患有疾病或病况,包括肿瘤、传染性疾病或自身免疫疾病或者已经被免疫。在某些方面,所受对象可以从疾病或或病况例如肿瘤、传染性疾病或自身免疫疾病恢复或存活。在另外的方面,所受对象可以处于对疾病或病况的预防和治疗例如癌症治疗、传染疾病治疗或疫苗之中或之后。例如,所受对象已经或已经被暴露于为传染原、肿瘤抗原、肿瘤细胞、变应原或自身抗原的抗原。这样的传染原可以是任何致病性病毒,致病性细菌,真菌原生动物,多细胞寄生虫和异常的蛋白质,如朊病毒,以及来源于其的核酸或抗原。变应原可以是能够导致个体中I型过敏反应的任何非寄生虫抗原,例如许多常见的环境抗原。
[0034] 肿瘤抗原可以是肿瘤细胞中产生的促发宿主中的免疫响应的任何物质。肿瘤细胞中产生的具有归因于突变的异常结构的蛋白可作为肿瘤抗原。这些异常蛋白由于所关注的基因的突变而产生。原癌基因和导致异常蛋白产生的肿瘤抑制因子的突变是肿瘤的致因并且因此这些异常蛋白称为肿瘤特异性抗原。肿瘤特异性抗原的实例包括ras和p53基因的异常产物。
[0035] 在某些方面中,提供了包括获得所受对象的B细胞中的VH和VL基因的至少CDR3编码序列的核酸序列的序列信息。例如,所确定的核酸序列可包含VH和VL基因。B细胞可优选地是成熟的B细胞。例如成熟的B细胞可包括记忆B细胞、浆细胞或其组合。浆细胞可包括骨髓浆细胞、淋巴结浆细胞或脾浆细胞。在特定的实例中,可使用骨髓浆细胞。可基于细胞标记尤其是细胞表面标记例如Blimp-1、CD138、CXCR4和/或CD45的差别表达选择或富集浆细胞。
[0036] 获得核酸序列信息可包括确定B细胞或淋巴组织中核酸序列和任选地相应的氨基酸序列,或者在其他方面中,从提供服务者或数据存储设备获得这样的信息。在另外的方面,这样的核酸序列信息可用于确定血清抗体的氨基酸序列。
[0037] 为了确定B细胞或淋巴组织中的核酸序列,可使用本领域中已知的任何核酸测序方法,包括高通量DNA测序。高通量测序方法的非限制性实例包括边合成边测序(例如454测序)、边连接边测序、变杂交边测序、单分子DNA测序、多聚合酶群落测序(Multiplex Polony Sequencing)、纳米孔测序或其组合。
[0038] 在某些方面中,提供了获得所受对象的含血清样品中抗体的VH和VL区的至少CDR3的氨基酸序列的序列信息。获得序列信息可包括确定氨基酸或核酸序列或者从提供服务者或数据存储设备获得这些信息。
[0039] 这些氨基酸序列确定方法可包括获得来源于所受对象的血清抗体的肽的质谱。为了分离来源于血清抗体的肽,可使用任何层析方法,例如高效液相层析(HPLC)。
[0040] 为了确定氨基酸序列,提供包括分离或富集所选择类型的血清抗体例如IgG、IgM、IgA、IgE或其他主要Ig类型,分离或富集与预定抗原结合的血清抗体和/或分离或富集血清抗体的含CDR3片段的方法。
[0041] 在另外的方面,所述方法可包括使用在所受对象的成熟B细胞的VH和VL区的至少CDR3的核酸序列和相应的氨基酸序列的序列信息的基础上识别的蛋白酶从血清抗体制备含CDR3的肽片段。例如,蛋白酶在CDR3外或者接近CDR3的位点剪切VH和VL肽,因此留下基本上完整的CDR3区。
[0042] 在某些方面中,还提供可包括富集或纯化含CDR3的肽片段的方法。例如这些方法可包括将含CDR3的肽片段与用于在CDR3序列的末端特异性轭合唯一的半胱氨酸的标记的硫醇特异性轭合剂轭合。富集或纯化所轭合的含CDR3的肽片段的方法可以基于所轭合的含CDR3的肽片段上的标记。标记的实例包括生物素。
[0043] 发明的某些方面基于,部分地,浆细胞或淋巴组织中高度富有的抗体cDNA与对与所受对象中的疾病或病况例如肿瘤相关的抗原的抗体特异性相关的发现。在另外的方面,提供了包含通过例如自动化方法确定B细胞或淋巴组织中血清抗体的氨基酸序列或VH和VL基因的核酸序列的丰度水平的方法。为了确定血清抗体的氨基酸序列的丰度水平,使用用于质谱法的定量方法。
[0044] 在某些方法中,提供了包括确定表现出至少阈值水平丰度的抗体氨基酸序列的方法。例如,阈值水平丰度是大约、至少或者至多5、10、20、30、40、50、100、200、300、400、500μg/ml(或其中任何可获得的范围)的浓度或者血清抗体的约20、30、40、50、60、70、80、
90、100、200个(或其中任何可获得的数目范围)最富有含CDR3的氨基酸序列中的至少一个的水平。
[0045] 在某些方法中,提供了包括识别表现至少阈值水平丰度的抗体核酸序列的方法。这些阈值水平的丰度可以是所受对象的抗体基因池中至少0.5%、1%、2%、3%、4%、5%、
6%、7%、8%、9%、10%、15%的频率,例如在B细胞群或淋巴组织中的抗体基因。这些B细胞群可以是特定的成熟B细胞群,例如来自所选择的淋巴组织例如骨髓、脾或淋巴结的成熟B细胞群。
[0046] 在某些方面,提供了包括报告上文所描述的确定或识别中的任一个的方法。例如,这些报告可以是计算机可读形式。
[0047] 在某些方面,还提供了包括产生包含一个或多个的如上文所描述的富有氨基酸序列中的一种或多种抗体或抗原结合片段的方法。抗体或抗原结合片段的产生可包括相应于表现出至少阈值水平丰度的血清抗体的富有VH和VL氨基酸序列的VH和VL编码区的化学合成或者在其他方面包括B细胞或淋巴组织中VH和VL基因的富有核酸序列的化学合成。
[0048] B细胞可以是成熟B细胞,特别地浆细胞,更特别地骨髓浆B细胞。产生方法可进一步包括将富有序列合并至一个或多个表达载体中。另外的方面可包括在任何宿主细胞例如细菌细胞、酵母细胞、昆虫细胞或哺乳动物细胞中表达富有序列例如所合成的VH和VL序列。
[0049] 例如,如此产生的抗体或抗原结合片段可结合所受对象具有或已经被暴露于其的抗原。抗原可以是传染原、肿瘤抗原、肿瘤细胞或自身抗原。这些结合可以具有至少或大约3 4 5
100、200、10、10、10pM或1、2、3、4、5μM或其中可获得的任何范围的单价亲和性。
[0050] 还进一步提供了包含评价所产生的抗体或抗原结合片段对预定的抗原例如传染原、肿瘤抗原、肿瘤细胞或自身抗原的结合亲和性或特异性的方法。
[0051] 在优选的方面中,每个如此产生的抗体或抗原结合片段中都包含相似丰度氨基酸或核酸序列的VH和VL。例如,VH序列具有分级为含血清样品中第三最富有VH序列的丰度水平,其可与在相同的样品中具有相似丰度等级水平(例如第三、第四或第五)的VL序列配对。发明人确定将具有+/-3等级级别丰度的VH基因和VL基因配对(例如第三最富有VH和第一至第六最富有VL中的任一种)以高于50%的频率产生抗原特异性抗体。
[0052] 就本文描述的其他方法或组合物而言,可使用在本发明的方法和/或组合物的背景下讨论的实施方案。因此,也可将属于一种方法或组合物的实施方案应用于本发明的其他方法和组合物。
[0053] 如本文所用的,就核酸而言使用术语“编码(encode)”或“编码(encoding)”以使本发明容易被本领域技术人员理解,然而,这些术语可分别与“包括(comprise)”或“包括(comprising)”互换使用。
[0054] 如本文说明书中所用的,“一(a)”或“一(an)”可意指一个或多个。如本文权利要求中所用的,当与词语“包括(comprising)”关联使用时,词语“一(a)”或“一(an)”可意指一个或多于一个。
[0055] 除非明确表明仅指选择方案或者所述选择方案是互相排斥的,权利要求中术语“或”的使用被用来意指“和/或”,尽管本公开内容支持是指仅选择方案和“和/或”的定义。如本文所用的,“另一个”可意指至少第二个或更多。
[0056] 本申请全文中,术语“约”用于意指数值包括设备的误差固有偏差、用于确定所述数值的方法或在研究客体中存在的偏差。
[0057] 本发明的其他目的、特征和优点将从下文详细描述中变得显而易见。然而,应当理解的是详细的描述和具体的实例,同时代表本发明的优选的实施方案,仅以说明的方式给出,因为从这一详细描述中本发明的精神和范围内的不同变化和修改对本领域技术人员来说是显而易见的。
[0058] 下列附图构成本说明书的一部分并且被包括以进一步证明本发明的某些方面。本发明通过结合本文中特定实施例的详细描述参照这些附图中的一个或多个而被更好的理解。
[0059] 图1:用于血清Ig的定量分析的实验性方法的示例性实施方案的流程图
[0060] 图2:分离单克隆抗体但无需通过采选骨髓浆细胞的抗体可变(V)基因谱筛选的- +示意图。免疫之后,将小鼠处死并且分离CD45RCD138 浆细胞。mRNA分离和第一链cDNA合成之后,产生可变轻链(VL)和可变重链(VH)基因DNA。进行高通量454DNA测序和生物信息学分析以确定VL和VH谱。最富有VL和VH基因被识别并且通过简单的相对频率法则确定配对。使用自动机器人协助的基因合成合成各个抗体基因。最终,抗原特异性抗体信号链可变片段或全长IgG分别在细菌或哺乳动物细胞中表达。
[0061] 图3:从骨髓分离浆细胞。左图:用抗CD45R-APC抗体和抗CD138-PE抗体标记的+总小鼠骨髓细胞群的流式细胞计数曲线。中间图:CD45R 细胞耗尽之后剩余的骨髓细胞。
+
右图:用轭合磁珠的抗CD138 抗体磁性分选之后分离的细胞群。
[0062] 图4:来自骨髓浆细胞的可变轻链(VL)和可变重链(VH)基因。通过PCR从来源于用不同抗原免疫的小鼠的骨髓浆细胞的cDNA扩增的VH和VL基因的琼脂糖凝胶电泳。从左边起:第一道是DNA梯度;第二、第四、第六、第八道是VL(~370bp);第三、第五、第七、第九道是VH(~400bp)。
[0063] 图5是V基因分析的生物信息学流水线的示例性实施方案的流程图。首先,通过与保守侧翼氨基酸序列基序的同源性识别CDR3。以最高频率(通常具有>1%的频率)存在的CDR3被用于将感兴趣的V基因序列分组。通过多序列比对和配对同一性的计算进行包含高度表现的CDR3的V基因的同源性分析。最后,进行高度表现的全长V基因的种系分析以确定无性系突变和V(D)J和V-J基因使用。
[0064] 图6:V基因谱分析的图形用户界面(GUI)的实例。开发GUI应用以便组织和图解表示V基因的高通量测序结果。程序输入并组织来自不同的样品数据集、使用所描述的CDR侧翼基序确定CDRH3和CDRL3并且提取CDR3频率分布(SEQ ID NO:718-737PRT和SEQ ID NO:738-747DNA)。
[0065] 图7:佐剂和C1s免疫的谱中VH种系家族图表。柱状图代表每个谱中前30个VH序列的VH基因家族的频率(代表总VH谱的24%-47%)。在免疫小鼠中证明了朝向IGHV1的清楚的偏移。
[0066] 图8:包含相同CDR3的全长V基因的同源性分析。(A)当所有其他序列以<0.8%的频率存在时,全长C1s-1.1VH基因(CDRH3=GNYYYAMDY(SEQ ID NO:145))的数据集由单一序列(65%)占主要地位。(B)全长C1s-2.2VH基因(CDRH3=WLLLAY(SEQ ID NO:21))的频率分布显示具有高频率的多个序列。(C)包含C1s-2.2CDR3的前三个全长VH序列和它们各自的频率(%)(SEQ ID NO:758-760)。
[0067] 图9:高频率CDRH3的比较表明每个小鼠中唯一的VH基因。显示注射佐剂(Adv)、卵清蛋白(OVA)、C1s和Bright(BR)的小鼠中高度表现的CDRH3分布的热图。Y轴表示每个小鼠中识别的10个最高频率CDRH3序列。X轴将这些优势CDRH3序列的频率在所有其他小鼠中相比较。白色:以非统计学上显著的频率(0.00-0.03%)存在的序列。黑色:以>10%的频率存在的序列。
[0068] 图10A-10B:来自不同小鼠组的骨髓浆细胞谱的CDRH3序列的主成分分析(PCA)。仅卵清蛋白(OVA)和佐剂的小鼠是一个免疫组(来源于同一笼并且同一窝)而C1s和
Bright小鼠是另一个免疫组。第一次主成分分析识别两个主要簇组,蓝色和红色,其代表不同的实验(即免疫在不同的日期进行)。
[0069] 图11:跨四个小鼠群的亚集分布的CDRH3的百分比。从一组八个中选择的四个小鼠的所有组合之间的普通CDRH3的百分比。在同一天用卵清蛋白(OVA)或佐剂免疫的小鼠之间的百分比相似性显示为红色。在用一天用Bright或C1s免疫的小鼠之间的百分比相似性显示为蓝色;灰色代表每个另外的可能的组合的相似性。
[0070] 图12:合成抗体基因的构建。将来自骨髓浆细胞谱的高度表现VH和VL基因通过将V基因与聚gly-ser连接体连接合成为单链可变片段(scFv)。比对.聚gly-ser连接体起到比对所期望的基因集的锚点的作用。加入适合的限制性位点以促进克隆并且将序列填充至统一长度以使得单一重叠寡核苷酸组装设计图能够建立所有基因。初级组装.使用内外成核PCR(设计图右边)从寡核苷酸的重叠的集产生初级片段。二级组装.组装的第二个步骤是将初级片段结合在一起形成最终产物的方便的重叠延伸PCR(设计图右边)。通过移液机器人将初级PCR产物用水稀释并且每个所稀释的初级反应物的一部分被加至第二反应中(实例左边)。凝胶图像.典型scFv组装产物的琼脂糖凝胶。第一道:DNA梯度;第二和第三道:~400bp的初级产物;第四道:~810bp的最终产物。
[0071] 图13A-13B:经由表面等离子体子共振(Biacore)的纯化的抗C1s IgG的动力结合分析。(图13A)用固定化的C1s以25nM、50nM、100nM或200nM将抗C1s 2.1L-2.1HB抗体注射至芯片上并且(图13b)如上文以2.625nM、5.25nM、10.5nM或21nM注射的抗C1s2.3L-2.2H。
[0072] 图14:使用通过采选骨髓浆细胞谱获得的抗体通过三明治ELISA检测C1s。抗C1s scFv 2.1L-2.1HB抗体包被在板上并用作捕获抗体而抗C1s IgG 2.3L-2.2H抗体用作检测抗体。
[0073] 图15:通过使用通过采选骨髓浆细胞谱获得的抗体将C1s从人类血清免疫沉淀。在与蛋白A琼脂糖小球结合后,抗C1s IgG 2.3L-2.2H抗体被用于捕获人类血清中的C1s。
用抗C1s scFv 2.1L-2.1HB抗体作为初级抗体进行蛋白质印迹分析,之后用抗聚His-HRP抗体检测。道1:100kDa和70kDa M.W.标记。道2:无捕获抗体;道3和4:分别用1.5μg/ml和3μg/ml 2.3L-2.2H抗体捕获。
[0074] 图16:序列比对显示所有已知绵羊种系VH基因(IGHV)的5’区。5’简并引物混合物可基于这些序列来设计并且用于来自绵羊第一链cDNA(SEQ ID NO:779-789)的PCR扩增。
[0075] 图17:小鸡种系IGHV区基因的氨基酸序列(SEQ ID NO:761-778)。说明性实施方案的描述
[0076] I.引言
[0077] 值得注意的是思考生物学研究为何未能解决位于理解生命体系中心的某些主要问题。一个这样的问题是哺乳动物中多克隆免疫反应的组分的分析。血清抗体在保护颌类脊椎动物对抗来自环境因素、病原体以及异常自身细胞的激发中起到不可取少的作用。然而尽管在了解免疫响应的起源和B细胞发育上的巨大进展,仍不可能的是在分子水平解决位于具有保护性多克隆抗体群的血清中的体液免疫的最终结果。由于技术原因,血清抗体响应仅就对特定抗原的效价而表征,很少有或者没有归于关于与抗原结合的免疫球蛋白的相对量以及亲和性和特异性的信息。本发明的某些方面通过表征其抗体组分的相对丰度和氨基酸序列来将血清免疫响应去卷积并且之后分别评价它们的治疗功效的能力可彻底改变蛋白质治疗
[0078] B细胞成熟和归巢是适应性免疫力以及保护性免疫球蛋白响应产生的标志。分子免疫学和基因学的广泛研究已经引致对哺乳动物中B细胞分化的时相阶段和不同B细胞亚群许多功能的重要了解。B细胞发育的终末以及不可逆阶段是位于骨髓、脾和其他淋巴组织并且作为免疫球蛋白(Ig)生产工厂的浆细胞的形成。完全分化的浆细胞与分泌较低数量抗体的未成熟的浆细胞(浆母细胞)一起共同占到淋巴细胞的小于1%并且仍然负责循环系统中所有抗体。从功能观点来看,循环抗体由三个池组成:低亲和性、非特异性池(主要通过B1和边缘区B细胞源的ASC产生,响应于激发产生的多克隆的和逐渐越来越高亲和性/特异性抗体的更富有的池)和具有对来自较早暴露的抗原的不同特异性的高亲和性抗体的第三池。组成第三池的抗体在生物体生命期(人类中长50年)的大部分时间中产生,而对抗体再刺激没有明显需要。这些长期的持续的响应对再感染起到重要的保护性作用并且构成了“体液记忆”。非特异性抗体池构成“天然抗体”或赋予抗病原体的早期保护的体液免疫响应的“先天”成分。第二群抗体包括适应性免疫响应并且在激发后几周内在强度上迅速下降(Rajewsky,1996;Manz等人,2005;Shapiro-Shelef和Calame,2005;Lanzavecchia和Sallusto,2009)。
[0079] 浆细胞代表小于1%的免疫细胞并且它们仍然负责循环系统中所有抗体(Rajewsky,1996;Manz 等 人,2005;Shapiro-Shelef 和 Calame,2005;Lanzavecchia 和Sallusto,2009)。在小鼠和人类中,抗体以10-20mg/ml,之间的浓度存在于血清中,其中
85%是IgG,约7%是IgM而另外的7-10%是单体IgA(Manz等人,2005)。小鼠中抗体分泌细胞(ASC)群的分析表明血清可含有多达500种不同的抗体,其中多个可具有相同的抗原特异性。然而,以<20μg/ml(约1nM)存在的低丰度抗体似乎在癌症监视和杀灭中不能,至少单独地,起到显著作用。
[0080] 值得注意地,考虑到哺乳动物免疫中血清抗体的巨大重要性,仍没有办法对组成血清Ig池的不同抗体进行相对浓度的定量表征以及序列和亲和性/特异性的确定。由于技术原因,血清抗体响应仅就对特定抗原的效价而言进行了表征。血清Ig的蛋白质组分析仍是不可能的,首先因为Ig中全组装的V区的结合上不同的和无性系突变的氨基酸序列对于MS谱的判读来说是必需的但是之前未知。换句话说,血清IgG的MS分析需要蛋白质氨基酸序列的知识但是这些序列是未知的。其次是因为血清是多种蛋白的高度复杂的混合物,鸟枪蛋白质组方法非常难以完成。第三,蛋白质组方法不能告知抗体特异性和生物学功能。
[0081] 免疫学家依赖通过使用技术例如杂交瘤技术的永生化或经由病毒(EBV)感染的B细胞永生化或可选地通过B细胞筛选和克隆来分离具有所期望的特异性的抗体。然而,这些方法不能捕获循环系统中的抗体的谱。产生抗体的浆细胞不能增殖并且不能融合或永生化。不可能知道从永生化/克隆的记忆B细胞分离的抗体是否并且以相对于其他抗体的何种水平存在于血清中。由于这些原因,本领域未包含关于如何分离循环系统中存在的抗体,尤其是以较高丰度或特异结合疾病致病抗原的那些,的任何信息。
[0082] 此外,这些方法通常不能用于除了已经开发了用于B细胞永生化的适合的工具的少数哺乳动物、小鼠、灵长类和某些实例中兔之外的任何动物。而且,这些方法非常耗时并且作为结果它们在处死动物和分离抗原特异性抗体之间花费数月。
[0083] 本发明试图克服现有领域中的缺点并且开发用于人类和动物中抗体响应的定量分子重叠合的方法。例如,高通量测序、蛋白质组和/或生物信息分析可以相结合以识别循环系统或淋巴组织中高度表现的免疫球蛋白(Ig)的序列和相对丰度。在某些另外的实施方案中,之后可以合成这些抗体的可变结构域的基因,表达并纯化各个IgG或抗体片段例如scFvs,之后可分析抗体或抗体片段与所受对象来源中的抗原例如感兴趣的传染原或癌细胞的结合。
[0084] 对于来自血清的抗体响应的定量分子重叠合,可提供具有在图1中示例性说明示例性实施方案的方法。在某些实施方案中,步骤中一个或多个可以是任选的并且可进行步骤的变化以达成相同的目的。第一,高通量测序例如来自外周血中成熟B细胞(记忆和浆母细胞)或来自骨髓和脾(当可获得时)的浆细胞的V基因cDNA的NextGen测序被用于产生患者抗体的氨基酸序列的信息库。在某些方面,DNA测序可被用于建立个体所制得的所有的抗体的序列数据库。第二,为了蛋白质组分析,分离来自患者血清的免疫球蛋白部分并且抗体通过用于Ig类型分离不同的亲和性方法以及同样通过在感兴趣的多种抗原上的亲和性结合分成几部分。第三,使用保持CDR3区完整性的蛋白酶将不同部分中的Ig多肽片段化。CDR3是不同抗体唯一或接近唯一的标示符。同样通过利用肽中的Cys残基的存在的方法从不相关的肽中富集CDR3肽。例如,使用与硫醇反应以引入生物素的试剂。第四,之后通过提供池中不同CDR3序列的绝对定量的鸟枪蛋白质组LC-MS/MS方法分辨并测序CDR3肽。第五,参考在上文第一步骤中产生的氨基酸序列数据库解释MS数据。第六,在血清中识别的最丰富VH和VL基因通过全基因合成来合成。第七,将相同丰度的VH和VL基因配对成为IgG,将其表达并且表征抗原结合亲和性。
[0085] 在另外的实施方案中,用固定的抗原通过亲和层析分离抗原特异性抗体。之后识别唯一或相反的肽,如上文段落中所识别的由V基因家族编码的序列。随后相应于具有相同丰度(频率)或等级级别丰度的肽的VH和VL基因被合成并且配对成为IgG,其被表达并且表征抗原结合亲和性。
[0086] 在另外的实施方案中,免疫后来自淋巴组织的B细胞中的VH和VL cDNA的相对丰度被用于识别抗原特异性抗体。免疫之后,适合的免疫响应导致经由新分化的B细胞产生抗原特异性抗体。发明人已经发现编码抗原特异性抗体的V基因cDNA在淋巴组织中以非常高的水平表达。因此,发明人已经使用了高通量DNA测序以确定在特定淋巴区室中的B细胞表达的V基因并且之后推论出这些V基因的丰度或频率。发明人合成高丰度V基因并且根据在该组织中它们的丰度或它们的分级级别丰度将VH和VL配对。发明人已经发现40%和>80%之间的所配对的V基因产生抗原特异性抗体。由此产生的抗原特异性抗体的百分比与通过在用免疫抗原包被的板上的系列稀释的ELISA测定所确定的抗体的血清效价相关联。
[0087] VH和VL链的配对同样可由将所识别的VH和VL序列分组至相关序列的簇中(例如代表仅无性系超突变不同的序列的簇)来指导。这样的分簇可通过对所识别的VH和VL序列对以及由此的相关序列的簇进行多序列比来完成。分簇信息之后可被用于指导VH和VL链配对。可选择地或另外地,通过瞬时方法识别的VH和VL链可通过对所识别的成对的链的组合亲和性测定(例如ELISA)来确定。这些方法可在当抗体谱不是高度极化的例如常常在来自绵羊、山羊和兔的样品中所存在的情况时具有特殊用途。
[0088] 在另外的实施方案中,提供了直接从淋巴组织识别抗原特异性可变基因序列而无需分离B细胞的方法。示例性的实施方案可在图2中示例性说明。步骤中一个或多个可以是任选的并且可进行步骤的变化以达成相同的目的。首先,过程可以将免疫的动物处死并收集初级、二级或三级淋巴器官或组织样品开始。第二,可进行V基因cDNA的高通量测序例如NextGen测序。第三,可使用生物信息学分析以确定不同V基因出现的频率。第四,识别以高丰度或频率表达的V基因。例如,这些高丰度(即频率)基因包含从相应组织获得或分析的全V基因群的至少0.5%。第五,可制备编码来自上文的丰富基因的DNA。第六,基于它们的分级级别丰度将编码VH和VL链的基因配对。第七,可在宿主细胞中表达各种VH-VL基因组合以产生对用于动物免疫的抗原特异性的抗体。
[0089] II.定义
[0090] 除非另外说明,否则本文所用的所有技术和科学术语具有本发明相关的领域中一名一般技术人员通常所理解的含义。下文定义补充本领域中的那些并且指定于本申请中所描述的实施方案。
[0091] 术语“抗体”在本文中以最广阔的含义使用并且特别包含至少单克隆抗体、多克隆抗体、多特异性抗体(例如双特异性抗体)、天然多特异性抗体、嵌合抗体、人源化抗体、人类抗体和抗体片段。抗体是包含基本上或者部分由免疫球蛋白基因或免疫球蛋白基因片段编码的一种或多种多肽的蛋白。所识别的免疫球蛋白基因包括κ、λ、α、γ、ε、ζ和μ恒定区基因以及极大数量的免疫球蛋白可变区基因。
[0092] “抗体片段”包括完整抗体的一部分,例如其抗原结合区的一个或多个部分。抗体片段的实例包括Fab、Fab’、F(ab’)2和Fv片段,双体、线性抗体、单链抗体以及从完整抗体和抗体片段形成的多特异性抗体。
[0093] “完整抗体”是包含全长重链和轻链以及Fc区的抗体。完整抗体同样称为“全长异二聚”抗体或免疫球蛋白。
[0094] 术语“可变”是指在它们的序列上表现可变性并且参与确定特定抗体的特异性和结合亲和性的免疫球蛋白结构域的部分。
[0095] 如本文所用的,“抗体可变结构域”是指包括互补决定区(CDR;即CDR1、CDR2和CDR3)以及框架区(FR;即FR1、FR2、FR3和FR4)的氨基酸序列的抗体分子的轻链和重链的一部分。FR包括除了如本文中定义的CDR位点之外抗体可变结构域中的那些氨基酸位点。VH是指重链的可变结构域。VL是指轻链的可变结构域。
[0096] 如本文所用的,术语“互补核苷酸序列”是指足以与另一条单链上互补以与其特异性杂交具有作为结果的氢键的DNA或RNA的单链分子中的核苷酸序列。
[0097] “表达载体”意指用于传送基因信息的任何核苷酸分子。
[0098] III.抗体可变结构域
[0099] 本发明的某些方面提供识别在血清或B细胞中过量表达的抗体可变区或可变结构域编码序列的方法。抗体可变结构域的这些偏移表现被用于识别具有高亲和性或特异性的新的抗原结合分子。以高水平丰度产生具有可变结构域的抗体或抗体片段允许分离高亲和性结合剂。本发明是基于(部分地)形成抗原结合口袋的抗体可变结构域的区(例如CDR3区)的丰度水平可与所期望的亲和性或特异性相关联的发现。
[0100] 为了识别所期望的抗体可变区,本发明的某些部分提供确定抗体互补决定区(CDR)的序列和分布的方法。特别地,VH和/或VL的互补决定区(CDR)中的一至六个的序列可通过蛋白测序或核酸测序方法来确定。可变结构域或CDR的丰度水平可确定为绝对水平例如浓度或者相对水平例如分级级别。
[0101] 抗体是也称为免疫球蛋白的球形血浆蛋白(~150kDa)。它们具有加至它们的氨基酸残基中的某些的糖链。换句话说,抗体是糖蛋白。每个抗体的基本功能单位是免疫球蛋白(Ig)单体(仅包含一个Ig单位);分泌的抗体还可以以两个Ig单位二聚化(例如IgA),以四个Ig单位四聚化(例如硬骨鱼IgM)或者以五个Ig单位五聚化(例如哺乳动物IgM)。
[0102] Ig单体是“Y”型分子,由四个多肽链构成;由二硫键连接的两个相同的重链和两个相同的轻链。每条链由称为Ig结构域的结构结构域组成。这些结构域包含约70-110个氨基酸并且根据它们的尺寸和功能被分类为不用的类别(例如可变的或IgV和恒定的或IgC)。它们具有表征性的免疫球蛋白折叠,其中两个β折叠产生“三明治”形状,通过保守的半胱氨酸和其他变化的氨基酸之间的相互作用保持在一起。
[0103] 有通过希腊字母α、δ、ε、γ和μ表示的五个类型的人类Ig重链。所存在的重链类型定义了抗体的种类;这些链分别存在于IgA、IgD、IgE、IgG和IgM中。不同的重链在尺寸和组成上不同;Ig重链α和γ包含约450个氨基酸,而μ和ε具有约550个氨基酸。其他动物编码类似免疫球蛋白重链类型。
[0104] 每个重链具有两个区,恒定区和可变区。恒定区在相同同种型的所有抗体中都相同,但是在不同同种型的抗体中不同。重链γ、α和δ具有由三个随机(成一线)的Ig结构域组成的恒定区和用于增加挠性的铰链区;重链μ和ε具有由四个免疫球蛋白结构域组成的恒定区。重链的可变区在由不同B细胞产生的抗体中不同但是在由单个B细胞或B细胞集群产生的所有抗体中相同。每个重链的可变区大约110氨基酸长并且由单个Ig结构域组成。
[0105] 在人类(和小鼠)中,有两种类型的免疫球蛋白轻链,其称为λ(λ)和κ(κ)。轻链具有两个连续的结构域:一个恒定结构域和一个可变结构域。轻链的大致长度为211至217个氨基酸。每个抗体含有总是相同的两个轻链;在这些物种中,每个抗体仅存在一种类型的轻链,κ或λ。
[0106] 片段抗原结合(Fab片段)是抗体上与抗原结合的区。其由重链和轻链中的每一个的一个恒定区和一个可变区组成。这些结构域形成互补位-抗原结合位点-单体的氨基末端。
[0107] 两个可变结构域结合它们特异性抗原上的表位。可变结构域也称为FV区并且是与抗原结合的最重要的区。更具体地,可变环,轻链(VL)和重链(VH)上各三个负责与抗原结合。这些环称为互补决定区(CDR)。
[0108] 互补决定区(CDR)是存在于与抗原互补并且因此提供具有对该特定抗原的特异性的受体的抗原受体(例如免疫球蛋白和T细胞受体)蛋白的可变结构域中的短的氨基酸序列。CDR在可变结构域中由保守框架区(FR)支持。
[0109] 抗原受体的每个多肽链包含三个CDR(CDR1、CDR2和CDR3)。因为抗原受体通常由两个多肽链组成,因此可与抗原接触的每个抗原受体有六个CDR(每个重链和轻链包含三个CDR),单个抗体分子有十二个CDR而五聚体IgM分子有六十个CDR。因为与免疫球蛋白和T细胞受体相关的大多数序列变化存在于CDR中,这些区有时称为超变结构域。其中,CDR3在其由VJ(在重链的实例中VDJ)区的重组编码时显示最大的变化性。
[0110] IV.抗体可变区分析
[0111] 在本发明的某些方面中,可分析来源于cDNA的抗体可变基因(V基因)序列。例如,来自这些分析的信息可被用于生成产生循环抗体的V基因的数据库(V基因数据库)以致来源于血清抗体的肽的质谱(MS)谱图可被确定并且反过来用于确定数据库中编码这些肽的各个全长V基因。在另一个实施方案中,序列信息可以用于确定富有可变基因核酸例如mRNA转录物并且以富有可变基因为基础产生抗体或抗体片段。所识别的富有可变基因可相应于具有所期望的特异性或亲和性的抗体或抗体片段。
[0112] 从通过原始测序确定的核苷酸序列,推定的VH和VL区的氨基酸序列可使用标准算法软件包确定(例如参见网址mrc-lmb.cam.ac.uk/pubseq/,Staden包和Gap4程序)。这些可以被进一步表征以确定VH和VL序列的CDR(互补决定区)部分,尤其是CDR1、CDR2和CDR3。确定推定氨基酸序列并且识别CDR区的方法是本领域中熟知的。在一个特定的实施方案中,CDR3序列通过在前述的CDR3的N末端区寻找高度保守的序列基序来确定,这一方法可以正确地识别抗体中>90%的CDR3序列。基于B细胞cDNA的核酸序列获得的推定氨基酸序列可以用于某些实施方案中血清抗体的鸟枪蛋白质组分析。
[0113] 已经开发了各种方法用于永生化或从个体B细胞克隆抗体。这些技术包括杂交瘤技术,通过病毒(EBV)感染的记忆B细胞永生化,表达表面和分泌抗体两者的记忆B细胞的工程化和从瞬时ABC群、记忆B细胞或脾浆细胞克隆抗原特异性抗体基因的。近来微流体和纳米图案化(nanopatterning)设备已经被用于增加对于抗原结合和随后的VH和VL基因克隆来说有质疑的B细胞的通量。
[0114] 尽管对于单克隆抗体的分离是宝贵的,但是这些技术具有若干缺陷:首先,大多数集中在并且在某些实例中仅与B细胞周期的某些阶段相容。因此,对末端分化的成熟浆ASC的广泛研究并未停止。这留下了未解决的核心问题,从B细胞分离的特定抗体在该个体的血清中是否以显著的量存在。同样,有证据显示骨髓中的浆细胞是抗体合成的主要区室并且是在它们的亲和性以及或许防护性功能的基础上选择的。其次单个B细胞克隆方法仍不足以提供血清中抗体多样性的全部信息,尤其是特异性抗体克隆的血清浓度和丰度方面。第三,目前对于将重组mAb聚集以便重构显示更高治疗效果的多克隆抗体的尝试不可能捕获血清的真实的保护效果,因为克隆的抗体的混合是完全随机的。本发明可通过本文描述的方法避免这些问题中的一个或多个。
[0115] 在某些实施方案中,来自B细胞或者直接来自一个或多个免疫组织的mRNA可以被分离并且转化为cDNA。在另外的实施方案中,cDNA可以经历VH和VL基因分离。例如,编码可变重链和可变轻链(VH和Vκ,λ)基因的基因可以使用与cDNA的5’和3’端杂交的特异性引物来扩增。取决于用于cDNA构建的引物,可区别不同Ig类型的V基因。例如VH和VL基因分离可以基于Ig类型通过使用可变基因的已知引物组扩增或者优选地通过使用类型特异性3’引物的3’RACE(cDNA末端的迅速扩增)。例如,类型特异性3’引物可以与CH2结构域杂交。
[0116] V.淋巴组织
[0117] 在某些实施方案中,提供了通过直接从淋巴组织获得核酸序列来识别抗原特异性可变区序列的方法。在可选的方面中,B细胞可能不是从B细胞所位于的淋巴组织分离的。所述方法可包括初级、二级或三级免疫组织的分离。可使用用于分离淋巴组织的任何已知方法。
[0118] 与淋巴系统有关的淋巴组织与防御身体抗感染和肿瘤扩散的免疫功能相关。其由在其内部具有不同类型的白血细胞的结缔组织组成,大多数是淋巴细胞。
[0119] 取决于淋巴细胞发育和成熟的阶段,淋巴组织可以是初级、二级或三级。(三级淋巴组织通常包含少得多的淋巴细胞并且假定仅在用导致炎症的抗原激发时起到免疫作用。其通过输入来自血液和淋巴的淋巴细胞来实现。
[0120] 中央和初级淋巴器官产生来自未成熟祖细胞的淋巴细胞。胸腺和骨髓组成参与淋巴细胞的产生和初期选择的初级淋巴组织。
[0121] 二级或外周淋巴器官维持成熟原始淋巴细胞并且起始适合的免疫响应。外周淋巴器官是经由抗原的原位淋巴细胞活化的位点。活化导致克隆扩张和亲和性成熟。成熟的淋巴细胞在血液和外周淋巴器官之间循环直到它们遭遇它们的特异性抗原。
[0122] 二级淋巴组织为外源或变化的原始分子(抗原)提供环境以与淋巴细胞相互反应。其通过淋巴结以及扁桃体、派尔集合淋巴结、脾、腺样增殖体、皮肤等中的淋巴滤泡示例性说明,其与粘膜相关淋巴组织(MALT)有关。
[0123] 淋巴结是淋巴组织有组织的集合,淋巴在其道路上经过其返回血液。淋巴结以一定间隔沿淋巴组织定位。若干的向心淋巴管指向淋巴,其渗入淋巴结的物质中并且通过离心淋巴管排出。
[0124] 淋巴结的物质由包含淋巴样滤泡称为“皮层”的外部部分中的淋巴样滤泡和在除了已知为“”的部分的所有侧面由皮层包围称为“髓质”的内在部分组成。门表现为淋巴结表面的凹窝,其使得其他球形或卵形的淋巴结成为豆形。离心淋巴管直接从淋巴结出现。动脉和静脉经由门随血液进入和离开供给淋巴结。
[0125] 淋巴滤泡是淋巴细胞的密集集合,其数目、尺寸和构型依照淋巴结的功能状态而变化。例如,滤泡在遭遇外源抗原时显著膨胀。B细胞的选择发生于淋巴结的发生中心。
[0126] 淋巴结在胸部、颈部、骨盆、腋窝(腋下)、腹股沟区(腹股沟)区的纵隔中尤其多并且与肠道的血管相关。
[0127] VI.B细胞样品制备
[0128] 在某些实施方案中,B细胞可被提取用于可变区核酸序列的分离。在其他的实施方案中,B细胞无需从淋巴组织分离因此节省了B细胞分离的花费和时间。无需B细胞分离,淋巴组织可以直接用于获得抗体可变基因序列的池,例如通过使用抗体特异性引物或探针,例如基于抗体恒定区序列的引物或探针。
[0129] 在一个实施方案中,可使用外周血(例如大约或至少或最多3、4、5、6、7、8、9、10、15、20ml或可从其推出的任何范围)中成熟的循环的B细胞(记忆细胞和/或抗原分泌细胞(ASC))。循环B细胞可以如实施例中所描述的通过磁分选程序(Jackson等人,2008;Scheid等人,2009;Smith等人,2009;Kwakkenbos等人,2010)分离。可选择地,位于骨髓、脾或二级淋巴器官中的为最终分化的B细胞的浆细胞可被分离并用于个体动物或人类中B细胞库的确定。在特定的方面,浆细胞可以从骨髓动员至循环系统中例如通过施用G-CSF(粒细胞集落刺激因子)并且分离。
[0130] ASC是由表面标志(例如多配体聚糖-1)区分的最终或者接近最终分化的B细胞(包括浆细胞和浆母细胞)。它们缺少表面IgM和IgD,其他典型的B细胞表面标志(例如CD19)并且重要地它们表达抑制剂Blimp-1、转录因子Xbp-1并下调Pax-5。抗体分泌细胞可从下列生成:(i)产生低特异性“先天样”IgM的B1细胞,(ii)来自不位于淋巴器官的滤+ + +泡中(小结间)的B细胞并且包括通常产生较低亲和性抗体的缘带((MZ、IgM、IgD、CD27)细胞(后者几乎在T细胞帮助不存在的情况下),以及最后(iii)已经经过淋巴滤泡循环的B2系的细胞。B2细胞直接从它们经历对更高抗原特异性的删选(在无性系超突变之后)的生发中心或在它们已经初次进入记忆区室之后进行至浆阶段。无论它们的确切来源,这些细胞表达高亲和性的主要IgG同种型的抗体并且构成激发后保护性免疫响应的主要组分。
[0131] 浆细胞通常不能增殖或脱分化为较早的B细胞系。大多数浆细胞是短期存在的并且在几天内死亡。相反,部分浆细胞占据为存活和持续数月至数年的不断的抗体分泌提供适合的细胞因子微环境的“凹陷”(主要在骨髓中),即它们是产生主要参与对再激发的保护的抗体并且构成“体液记忆”免疫响应的细胞。
[0132] ASC分离的特别优选的位点是存在大量表达对抗原特异性的抗体的浆细胞的骨髓。应当注意的是成熟成为浆细胞并且位于骨髓中的B细胞主要表达高亲和性IgG抗体。使++ +用基于本领域中熟知的细胞表面标志选择骨髓细胞中的成熟浆细胞,例如CD138 、CXCR4-/弱
和CD45 。成熟浆细胞还可基于转录因子Blimp-1的高表达水平分离;用于分离Blimp-1高
细胞的方法尤其是从携带与Blimp-1连接的受体蛋白的转基因动物分离的方法是本领域中已知的。
[0133] 在另外的方面,记忆B细胞是从对在初级免疫响应中遭遇的抗原特异性的活化的B细胞形成的。这些细胞能过长时间存活并且可在再次被暴露于相同抗原时能够迅速响应。在涉及特定抗原的首次(初级响应)感染的之后。响应的天然(从未被暴露于抗原的)细胞增殖产生细胞的集落,其大部分分化为浆细胞,也称为效应物B细胞(其产生抗体)并且随着感染的消退而消失,而其余部分作为可存活数年甚至一生的记忆细胞而存留
[0134] VII.核酸测序
[0135] 任何测序方法,尤其是高通量测序方法,可被用于确定B细胞库中的VH和VL核苷酸序列中的一种或多种。例如,VH和VL的核苷酸序列可使用通用引物通过454测序(Fox等人,2009)来确定而无需使得各个mRNA能够精确定量的扩增。可处理长度超过300bp的读段(reads)以便进一步的分析(Weinstein等人,2009)。高通量测序技术的非限制性实例描述于下文。
[0136] 高通量测序技术预期降低用标准的荧光染料终止物方法可能的DNA测序花费。这些测序途径中的大多数使用体外克隆步骤以扩增个体DNA分子,因为它们的分子检测方法未敏感到足以单个的分子测序。乳液PCR连同油相中的水滴中引物包被的小珠一起分离个体DNA分子。之后聚合酶链式反应(PCR)用DNA分子的克隆复制报备并且之后的固定化以便后来的测序。乳液PCR用于Marguilis等人(由454Life Sciences商品化)、Shendure和Porreca等人(也称为“Polony测序)和SOLiD测序(由Agencourt,现在的Applied Biosystems开发)的方法中。体外克隆扩增的另一个方法是Illumina Genome Analyzer中所用的桥式PCR,其中当引物与固体表面连接时扩增片段。由Stephen Quake的实验室开发的单个分子方法(之后由Helicos商业化)是例外:其使用亮的荧光基团和激光激发以检测固定至表面的个体DNA分子的焦磷酸测序事件,消除对分子扩增的需要。
[0137] 在并行化测序中,DNA分子物理结合于表面并且平行测序。与荧光染料终止物电泳测序相似,通过合成的测序使用DNA聚合酶确定基序列。可逆终止物方法(Illumina和Helicos所使用的)使用荧光染料终止物的可逆版本,一定时间加入一个核苷酸,实时监测每个位置的荧光,通过封闭基团的反复去除以允许另一个核苷酸的聚合。焦磷酸测序(454所使用的)同样使用DNA聚合,一定时间加入一个核苷酸种类并且通过由所连接的焦磷酸盐的释放所激发的光检测并定量加至给定位置的核苷酸的数目。
[0138] 通过连接的测序使用DNA连接酶确定靶序列。在polony方法和SOLiD技术中所用的,其使用固定长度的,根据测序位置标记的所有可能的寡核苷酸的池。将寡核苷酸退火并且连接;通过用于匹配序列的DNA连接酶的优先的连接导致在该位置的核苷酸信号信息。
[0139] 在微流体Sanger测序中,在单个玻璃薄片(直径约10cm)上完成DNA片段的完全热循环扩增以及它们经由电泳的分离,因此减少了试剂使用以及花费。
[0140] 通过杂交测序是使用DNA微阵列的非酶方法。其序列有待确定的DNA的单个池被荧光标记并且与包含已知序列的阵列杂交。来自阵列上给定点的强杂交信号在被测序的序列中识别其序列。质谱可被用于确定在链终止反应中产生的DNA片段之间的质量差别。
[0141] 目前开发中的DNA测序方法包括将DNA聚合酶标记(Scheid等人,2009),当DNA链经过纳米孔时读取序列以及显微镜基础的技术,例如用于通过为了可视检测和记录而用较重元素(例如卤素)标记的核苷酸识别长的DNA片段(>5,000bp)中各个核苷酸位置的原子力显微镜(AFM)或电子显微镜。
[0142] 发明人发现VH和VL池中的每个的小于105个读段可能足以提供相应于血清中存在的最富有抗体的可变基因序列的信息。
[0143] VIII.序列丰度确定
[0144] 用于测序的自动分析的生物信息方法产生例如454读段,统计学测序误差分析和最终的CDR尤其是CDR3的识别和分类,抗体中最超变的区已经由本发明人开发。
[0145] 在某些实施方案中,例如,为了解释测序/PCR不确定性,抗体序列尤其是CDR3序列可分组为家族,每个家族由一或两个核苷酸或氨基酸不同的所有CDR3序列组成。
[0146] 例如,抗体可变区序列的丰度水平可基于作为鉴别剂的CDR3序列。确定丰度水平的序列可以是包括相同CDR3序列和与其具有至少80%同源性例如85%、90%、95%、96%、97%、98%或99%同源性的CDR3序列的家族(氨基酸序列或核苷酸序列)。序列同源性使用BLAST2程序(Tatusova等人,1999)以默认参数在美国生物技术信息国家中心(网址ncbi.nlm.nih.gov)确定。例如,总共以由一套序列中至少1百分比的频率所代表的相对丰度水平存在的序列可以是CDR3序列或具有与其1或2个氨基酸变化的序列的组合。例如,第一序列可以0.7百分比的频率存在并且每一个具有从其的单个氨基酸变化的第二、第三和第四序列每个以0.1%的频率存在—因此丰度上的总的出现率是1.1%并且因此优势抗体序列(以0.7%的频率存在)是可以用于抗体生成/表征的候选CDR3序列。
[0147] IX.抗体可变序列信息的使用
[0148] 除了提供解释血清抗体分析的质谱数据的参考数据库之外,通过可变区尤其是CDR序列和丰度分析的核酸信息同样用于提供潜在的抗原特异性抗体或抗体片段。在某些方面,基于富有可变区尤其是CDR信息所获得的VH和Vκ,λ文库可被插入适于生产全长IgG蛋白或蛋白片段的适合的表达载体(仅由VH和Vκ,λ链组成的scFv或Fab或单结构域抗体)。由VH和Vκ,λ组成的文库可产生重链和轻链的组合配对。
[0149] 随机配对的VH和Vκ,λ链中的一些可以是活化的而其他的将不能产生有功能的抗体。然而,本发明人已经发现由于骨髓中抗原特异性浆细胞的非常高度的表现,非常大部分所获得克隆表达功能性并且高亲和性的重组抗体。在一个实例中,从由克隆的>5%的骨髓浆细胞分离的VH和Vκ,λ基因构建的scFv文库包含抗原特异性抗体。
[0150] 例如,发明人分析在两只小鼠中每只使用4种不同的蛋白质抗原促生免疫(完全Freund佐剂)之后5天分离的骨髓浆细胞中VH和VL转录水平。V-D-J使用和无性系超突变的模式被确定并且与骨髓浆细胞群中的表现相关联。与骨髓浆细胞对抗体分泌的关键作用相一致,抗原特异性VH和VL cDNA被发现高度富集至总Ig RNA的1%-20%之间的水平。对于所测试的四种抗原中的每一种,将2-4种VH和VL cDNA以总VH cDNA池的>4%的频率表现。合成每种抗原并且来自每只小鼠的四种最富有VH和VL基因,如下文讨论的将重链和轻链配对并且将所获的抗体片段在细菌中表达。重要地,通过ELISA(酶联免疫吸附测定)和BIACore分析发现在免疫的动物中平均>80%的相应于最高表达的VH和VL基因的抗体片段是抗原特异性的。
[0151] 因此,发明人已经发现从这些文库手动ELISA筛选几百个克隆足以允许具有高亲和性和特异性的抗体的生成。其他克隆的手动ELISA筛选可用于显示产生不同套抗体的VH和Vκ,λ基因的不同组合。这一方法简单并且迅速并且发明人相信可能取代杂交瘤技术用于从动物分离抗体。
[0152] X.定量血清抗体分析
[0153] 为了识别循环抗体的CDR区尤其是CDR3区的富有氨基酸序列的池,MS鸟枪蛋白质组或蛋白测序方法可被用于确定氨基酸序列。
[0154] 可使用确定其构成肽的氨基酸序列的任何蛋白测区方法。蛋白测序的两个主要的直接方法是质谱和Edman降解反应。同样可能的是从编码蛋白质的DNA或mRNA序列(如果这是已知的)生成氨基酸序列。然而,还有可用于获得关于蛋白序列的更多限制信息的多种其他反应并且可被用作前文提及的测序方法的准备工作以克服其中的特异性缺陷。
[0155] 例如,基于将蛋白质降解为肽并且使用随机质谱将它们测序以及自动数据库搜索的鸟枪蛋白质组策略可以是为了识别血清抗体序列而选择的方法。“鸟枪蛋白质组”是指复杂的蛋白质混合物的直接分析以迅速生成混合物中蛋白质补体的完整概况。这一方法已经通过使用结合了多维高压液相层析(LC/LC)随机质谱(MS/MS)和数据库搜索算法的多维蛋白质识别技术(MudPIT)而变得容易。
[0156] A.IgG分级
[0157] 特定种类的Ig蛋白可通过例如使用蛋白质A(或者用于其他主要Ig类型的亲和纯化的抗IgA和抗IgM抗体)的亲和层析来分离。
[0158] 在某些方面,抗体或抗体片段例如来自使用木瓜酶的纯化Ig的降解和FAB纯化的FAB部分可因与所期望的抗原或病原体(例如癌细胞、肿瘤抗原或感染剂)或者宿主组织的结合而亲和性富集以便分离疑似在自动免疫中具有作用的抗体。抗体可在变性条件下洗脱。在另外的实施方案中,可生成血清来源FAB的几个部分或池,包括下列那些:(a)对抗原富集的,(b)对宿主组织富集的和(c)具有不相关或未知特异性的抗体。
[0159] B.蛋白水解片段化
[0160] 为了定量鸟枪蛋白质组质谱分析,抗体或抗体片段例如FAB可使用在CDR3中不足但是存在于邻近的框架区的氨基酸/氨基酸对后剪切的蛋白酶降解。用于蛋白质组处理的适合的蛋白酶可通过V基因序列数据库的生物信息分析来识别。
[0161] 在一个实例中,FAB部分于37℃经受使用测序级胰蛋白酶(Sigma)的蛋白水解4小时。作为可选择的方法,蛋白酶GluC(NEB)和LysC(Sigma)的组合可取代胰蛋白酶使用以生成在计算测试中提供对CDR3的更好的覆盖的不同套的蛋白水解肽(即以使剪切发生在CDR3两侧的位置并由此产生具有完整CDR3的肽)。
[0162] 在某些实施方案中,CDR3肽可以经由CDR3序列末端独有的Cys与允许这些肽纯化的巯基特异性试剂的特异性轭合从不相关的肽富集。
[0163] 发明人已经开发了采用用于肽生成和含巯基的CDR3肽的Cys特异性断开的适当的蛋白酶的组合的程序,其产生由至少30%的CDR3肽序列组成的肽混合物。在一个实例中,CDR3肽经由可逆的巯基特异性生物素化富集。在另一个实施例中,CDR3肽与允许MS分析期间它们的特定激发和检测的特定的生色团反应。因为CDR3肽几乎普遍(>99%)含有半胱氨酸、生物素化的巯基特异性交联剂被用于为质谱分析亲和分离这些肽,由此大大简化谱图的复杂性。
[0164] C.鸟枪MS(质谱)蛋白质组
[0165] 在某些示例性的方面,抗体分子的肽可以通过反相层析和串联纳电喷雾离子化/高分辨率随机质谱,使用已经广泛接受的程序(Ong和Mann,2005;Pandey和Mann,2000;Shevchenko等人,1996;Hunt等人,1986;Link等人,1999;Washburn等人,2001;Lu等人,
2007)和傅立叶转换LTQ-Orbitrap质谱(Hu等人,2005)来解析以从CDR3和其他FAB来源的肽收集几十万随机质谱。
[0166] 例如,将肽在运行5%至38%乙腈,0.1%甲酸的洗脱梯度的反相Zorbax C-18柱(Agilent)上分离。肽通过纳米电喷雾离子化直接洗脱至LTQ-Orbitrap质谱(Thermo Scientific)。使用以100k解析度收集的母离子质谱(MSI)使得可以数据依赖性离子选择。可选择具有已知的>+1电荷的离子用于CID裂解谱分析(MS2)以便降低强度,具有每MS1循环所选择的12个母离子的最大值。用为30秒钟两次MS2所选择的离子激活动态排出。
在LC-MS/MS运行中相应于来自重链和轻链的恒定区的肽而识别的离子可在随后的实验中从数据依赖性选择排除以便增加来自可变区的肽的选择。
[0167] D.MS蛋白质组数据分析
[0168] 来自相同的所受对象的B细胞的可变基因测序数据被用于补充蛋白序列数据库以便解释鸟枪蛋白质水解中的肽质谱(Marcotte,2007)。在样品特异性序列数据库的帮助下,我们从随机质谱识别了CDR3肽(使用标准方法(Keller等人,2002;Nesvizhskii等人,2009)控制错误发现率)。
[0169] 鸟枪蛋白质组中的几个最新进展使得蛋白质能够定量至~2倍的绝对精确度而无需引入另外的对同种型标记或内部定标肽的需要(Lu等人,2007;Malmstrom等人,2009;Silva等人,2006a;Vogel和Marcotte,2008;Ishihama等人,2005;Liu等人,2004)。在这些方法中,有两种非常适于个体IgG定量:APEX法基于与蛋白质有关的随机质谱的加权系数(加权合并了肽可观测性的机器学习估量(Lu等人,2007;Vogel,2008),而平均粒子密度法基于质谱离子层析峰体积(Silva等人,2006a)。例如,两种方法都可以用于测量含血清样品中所识别的抗原特异性IgG中的每一种的丰度。组合(Malmstrom等人,2009)以及单独的肽定量方法同样可作为替换方案使用。可使用减去非CDR3肽的算法。在这些所测量的丰度的基础上,可将样品中至少50或100个最高丰度VH和VL按级别分级。
[0170] 例如,样品特异性蛋白序列数据库是从高通量V区cDNA转录物数据产生的。通过454测序以>8个读段来表示的VH和VL基因可被编译为数据库,其反过来被加至连的正向/反向序列蛋白编码数据库。使用作为Bioworks软件包(Thermo Scientific)的一部分的Sequest搜索算法在这一数据库中搜索LC-MS/MS数据。应用滤器以确保如下高置信度序列识别:ΔCN≥0.250;XCorr=+2、+3和≥+4个电荷的2.0、2.5和3.0;并且精确度≤10.0ppm。
[0171] 在某些实施方案中,与不同B细胞来源(例如表达其产品存在于血清中的VH和VL基因的特定的器官特异性ASC群)的不同V基因池信息偶联的氨基酸序列分析可被用来识别特定血清抗体是否可能在骨髓、在二级淋巴组织或在持续感染的实例中在三级淋巴组织中优先发生。同样可解决特定抗体由已经迁移至不同器官的浆细胞分泌的可能性。在系统水平,发明人可以使用这一信息以定量形式估计不同区室对体液免疫的贡献并且可以生成在免疫响应的不同阶段中所涉及的抗体或抗体片段。
[0172] XI.抗体生成和表征
[0173] 上文描述的某些实施方案引致对B细胞或所选择的淋巴组织中感兴趣的富有血清抗体或最富有可变区序列的识别和定量。这些信息可用于开发具有所期望的结合亲和性或抗原响应的抗体或抗体片段。在某些方面,可估计它们的结合亲和性或治疗应用性。例如,对癌细胞具有细胞毒性的抗体或抗体片段可以从富有血清多克隆抗体池生成。在另外的实施方案中,对用于免疫任何动物的抗原具有特异性的抗体或抗体特异性片段可通过分析B细胞中可变区核酸的序列和丰度信息来提供或者直接从淋巴组织提供。
[0174] A.用于抗体生成的基因合成
[0175] 为了生成具有所期望的结合特异性或特性的抗体或抗体片段,可合成V基因,组装为FAB或IgG并表达。可基于通过上文所描述的方法获得的序列信息通过高通量基因合成生成VH和VL基因。
[0176] 例如,可使用自动基因合成。简单地说,使用严格控制条件下的内外成核PCR反应生成基因片段(长度200至500个核苷酸)以确保构建所期望的最终片段。随后,缝线重叠延伸PCR(stitch-overlap extension PCR)被用于合成感兴趣的基因。使用寡核苷酸合成仪工作列表和用于合成和组装的机器人操作脚本将这些片段和相关重叠的设计自动化。以目前的构型,每次机器人组装运行(4小时)获得48千碱基的通量。为了保持序列的最大保守和随后用以维持相同的长度的在任一端的“填充”,序列的算法允许使用基因重叠寡核苷酸组装策略并且同样确保最大的寡核苷酸再使用。50个VH和50个VL基因(即>38,000bp的DNA)的现有通量平台由一名研究人员在一周内并且以<$2,000的试剂花费合成并且验证正确的ORF。
[0177] B.VH和VL的配对
[0178] 为了表达,特定的VH必须与同源VL配对。配对问题可如下解决:首先发明人已经经验性地发现样品中VH和VL的正确配对与样品中蛋白的分级级别丰度良好相关。例如,第五最富有VH与第五最富有VL配对。到目前为止用这一方法,使用VH和VL的配对生物信息学分级级别信息,发明人已经在将来自四个不同小鼠的VH和VL基因配对以生产高亲和性抗原特异性抗体上取得了75%的成功。另外,发明人已经发现即使对于配对来说最佳VL不是基于蛋白质组分析具有相似丰度的VL但是因为抗原识别是由VH序列支配的,因此仍然可以观察到抗原结合,只是亲和性较低。
[0179] 在某些方面,VH和VL链可通过将相关的VH和VL序列分组在一起而识别。例如,所识别的VH和/或VL序列可基于序列的相关性进行比对并且成簇。例如每组可包含彼此仅无性系超突变的结果不同的抗体序列。在某些情况下,序列的簇可被分级,并且所述簇的级别被用作VH和VL序列之间成对的指导。
[0180] 在还有另外的方面,VH和VL链可基于组合的亲和性测定来配对。在这一情况下,用于测试的VH和VL配对可由丰度分级和/或可由上文概括的相关序列的成簇来指导。
[0181] 配对同样可通过其他方法解决或确认。例如,用VH和候选VL探针(例如从丰度分析识别的)对固定浆细胞进行原位杂交(ISH)。ISH可使用适当的机器人自动化容易地以高通量方式应用。可选择地,FAB池的ESI-MS(电喷雾电离质谱法)与这些谱图与所期望的分子量的匹配相偶联,可在某些情况下确定VH和VL配对。
[0182] C.抗体表达
[0183] 在另外的方面,合成的VH和VL基因可被插入适合的载体以便表达,例如FAB在大肠杆菌细胞中或全长IgG经由HEK293细胞的瞬时转染
[0184] 候补抗体或抗体片段与抗原之间的结合之后可通过结合检测和定量的任何方法特别是ELISA来估计。例如,癌特异性抗体或抗体片段可通过经由抗体的荧光标记之后的荧光激活细胞分选(FACS)的癌或宿主细胞结合来表征。
[0185] 使用常规程序,根据本发明的某些方面的抗体可用可检测的标记来标记或者可与效应分子例如药物比如抗菌剂或毒素或酶轭合并且本发明预期这些标记的抗体或抗体轭合物。
[0186] 本发明中可用或生产的抗体可以是完整抗体或其抗原结合片段并且通常可以属于任何免疫球蛋白类型。因此,例如其可以是IgM或IgG抗体。抗体或片段可以是动物例如哺乳动物来源的并且可以是例如小鼠、大鼠、绵羊或人类来源的。优选地,其可以是重组抗体片段,即使用重组DNA技术生产的抗体或抗体片段。这样的重组抗体片段可以包括上文所识别的优势CDR或可变结构域序列。
[0187] 特定重组抗体或抗体片段包括,(1)具有其至少一部分来源于不同抗体的抗原结合位点的那些,例如其中一个抗体的超变或互补决定区被移植至第二个不同抗体的可变框架区中的那些(如在例如EP 239400中所描述的);(2)重组抗体或片段,其中非Fv序列已经被来自其他的不同抗体的非Fv序列取代(如例如EP 171496、EP 173494和EP 194276中描述的);或(3)大致上具有天然免疫球蛋白结构的重组抗体或片段,但是其中铰链区具有与天然免疫球蛋白中存在的那些不同的半胱氨酸数目但是其中重组抗体或片段的表面口袋上的一个或多个半胱氨酸残基取代天然免疫球蛋白中存在的另一种氨基酸残基(如例如WO 89/01782和WO 89/01974中所描述的)。
[0188] 文本例如Harlow和Lane(1998)的教导进一步详述了抗体、抗体片段、它们的制备和用途。
[0189] 抗体或抗体片段可以是多克隆或单克隆来源的。其可以是对于至少一个表位特异性的。
[0190] 抗原结合抗体片段包括例如通过全抗体的蛋白水解裂解获得的片段,例如F(ab’)2、Fab’或Fab片段,或通过重组DNA技术获得的片段,例如Fv片段(如例如WO89/02465中所描述的)。
[0191] XII.治疗应用
[0192] 本发明可包括具有广泛范围治疗应用的方法,例如癌治疗、增强免疫响应、疫苗或者感染性疾病或自身免疫性疾病的治疗
[0193] 在一些实施方案中,本发明可用于在缓解中的癌患者中抗体响应的定量分子去卷积以确定可有利于在患者中根除肿瘤的循环系统中高度表现的抗体的序列和丰度。这些抗体自身作为治疗剂或用于识别可作为治疗靶的癌细胞上的新抗原都是非常有用的。相似地在一些实施方案中,本发明的方法可用于识别保护患者免受特定感染剂感染的抗体。这些抗体可从已经被感染并且之后从感染中康复的患者或可选择地从已接种的患者识别。可生产这些抗体或抗体片段并且估计它们对癌细胞的特异性和细胞毒性或者对感染剂的中和效能。通过表征其抗体组分的相对丰度和氨基酸序列来去卷积血清多克隆响应以及之后单独估计癌细胞结合和细胞毒性的能力可提供关于对恶性肿瘤的适当的免疫响应的性质的史无前例的有价值的信息。这些所识别的抗体可引致强有力的细胞毒性癌治疗的发现以及癌检测和治疗所用的新型肿瘤抗原的识别。
[0194] 例如,通过同种造血干细胞(HSC)移植之后处于缓解中的患者中的抗体响应的去卷积,可通过上文所描述的方法识别用于白血球过多症的治疗抗体。之后可通过药理学工程和动物评估来获取有希望的抗体。
[0195] 本发明的某些方面可包括通过本发明的某些方面所生成的抗体或抗体片段向非免疫个体(例如经历化疗/放疗、用于器官移植的免疫抑制的,归因于潜在条件例如肥胖、创伤等免疫力低下的以及非常年轻或非常年长的患者)的被动转移。例如,赋予免疫的抗体的序列可通过寻找已经克服感染的患者中过度表现的VH和VL序列来确定。这些保护性抗体可以遗传水平重新合成,在大肠杆菌(或其他表达系统)中过表达并且纯化。所获得的纯化的重组抗体之后可作为被动免疫治疗施用于患者。抗体同样可从商业供应商例如Operon Technologies Inc.,USA(在网址operon.com)通过简单地为它们提供有待被制造的抗体的序列而订购。
[0196] 疫苗接种通过用病原体来源的抗原引发免疫系统来防止感染。疫苗接种受到对病原体来源的抗原的单次或多次暴露的影响并且允许抗体成熟以及B细胞克隆扩张而没有受到充分发展的感染过程的有害影响。T细胞参与同样在影响患者的疫苗接种上具有很大重要性。本发明的某些方面同样可被用于伴随对抗体响应的定性和定量评价来监测使用实验性疫苗的免疫处理。例如,一个或多个所受对象被给予实验性疫苗并且从所受对象扩增VH和VL序列并且如上文所描述的分析抗体谱。随着疫苗接种,给定的抗体可变结构域或CDR序列的增加的丰度可引致保护性抗体池的识别。证实之后,这些保护性抗体可别被用于需要这些保护的患者的治疗,例如受到微生物例如病毒感染的患者。
[0197] XIII.实施例
[0198] 下列实施例被包括以证实本发明的优选的实施方案。本领域的技术人员应当理解的是在实施例中所公开的技术遵循发明人所发现的代表技术以在本发明的实行中良好地起作用并且因此可被认为构成用于其实行的优选方式。然而,根据本公开内容,本领域技术人员应当理解可在所公开的特定实施方案中进行许多变化并且仍获得类似或相似的结果而不背离本发明的精神和范围。
[0199] 实施例1:免疫程序
[0200] 将蛋白抗原(例如纯化的人类互补蛋白C1s(CalBiochem),纯化的鸡卵白蛋白(OVA,Sigma)或重组的细菌表达的IgH转录的人类B细胞调节剂(BRIGHT))悬浮在1.0mg/ml无菌过滤的磷酸盐缓冲盐水(PBS)中。在初级免疫当天,将25μl抗原溶液与25μl弗氏完全佐剂(CFA,Pierce Biotechnology)和50μl无菌PBS彻底混合并且储存在上。将6-8周大的雌性Balb/c小鼠养在常规分栏空间中并且用正常饲料维持。注射之前,将小鼠从尾静脉抽血并且收集约25μl血液并且储存于-20℃以便之后的分析。第1天被指定为进行初级免疫的日期。用26号针头每只小鼠皮下注射100μl的抗原-CFA混合物至后足垫(backpad)。由动物住院医师每日监测小鼠并且每周两次更换笼子。
[0201] 为了次级免疫,将25μl抗原溶液与25μl弗氏完全佐剂(CFA,PierceBiotechnology)和50μl无菌PBS彻底混合并且储存在冰上。在第21天,以每只小鼠
100μl的抗原-IFA混合物腹膜内给予小鼠次级免疫。在第26天,通过CO2窒息处死小鼠并且收集血液、淋巴结、脾、股骨和胫骨。为了三级以及随后所需的免疫,将25μl抗原溶液与25μl弗氏完全佐剂(CFA,Pierce Biotechnology)在50μl无菌PBS中彻底混合,并在次级免疫后两周注射至动物中并且如果需要每两周进行随后的免疫。
[0202] 实施例2:从小鼠骨髓分离浆细胞(CD138+CD45R(B220)-CD49b-)群
[0203] 从自免疫的小鼠采集的胫骨和股骨除去肌肉和脂肪组织。用普通手术剪修剪胫骨和股骨的末端并且用26号胰岛素注射器(Becton Dickinson,BD)清洗出骨髓。将骨髓组织收集在无菌过滤的缓冲液#1(PBS/0.1%血清白蛋白(BSA)/2mM乙二胺四乙酸(EDTA))中。通过使用机械破碎过滤通过70-um细胞过滤器(BD)收集骨髓细胞并用20ml的PBS清洗并且收集在50ml试管中(Falcon,BD)。之后以1200RPM于4℃离心骨髓细胞10分钟。将上清移去并且用3.0ml的RBC溶菌缓冲液(eBioscience)重悬细胞团并且于25℃轻柔振荡5分钟。之后用20ml的PBS稀释细胞悬浮液并且以1200RPM于4℃离心10分钟。移去上清液并且将细胞团在1.0ml的缓冲液#1中重悬。
[0204] 将每个分离的骨髓细胞悬浮液分别用7.5ug和10ug的生物素化的大鼠抗小鼠CD45R(B220)和生物素化的大鼠抗小鼠CD49b(eBioscience)孵育。在实施例9中,每个分离的骨髓细胞悬浮液分别用2.5ug和1.5ug的生物素化的大鼠抗小鼠CD45R(B220)和生物素化的大鼠抗小鼠CD49b(eBioscience)孵育。将细胞悬浮液于4℃旋转20分钟。之后将细胞悬浮液以2,000RPM于4℃离心6分钟,移去上清并且将细胞团在1.5ml的缓冲液#1中重悬。将链霉亲和素轭合的M280磁珠(Invitrogen)根据制造商程序清洗并且重悬。向每个细胞悬浮液加入50μl磁珠并且将混合物于4℃旋转20分钟。之后将细胞悬浮液放置在Dynabead磁体(Invitrogen)中并且收集上清(负极部分,未与小珠轭合的细胞),废弃与小珠轭合的细胞(可选择地,小珠结合的细胞可被保留用于之后的分析)。
[0205] 任选地,之后将负极部分细胞与2.5μg生物素化的大鼠抗小鼠CD45R(B220)和生物素化的大鼠抗小鼠CD49b两者孵育并且于4℃旋转20分钟。之后将细胞以2,000RPM于4℃离心6分钟,移除上清液并且将细胞团在1.0ml的缓冲液#1中重悬。向每个细胞悬浮液加入50μl磁珠并且将混合物于4℃旋转20分钟。之后将细胞悬浮液放置在Dynabead磁体(Invitrogen)中并且收集上清(负极部分,未与小珠轭合的细胞),废弃与小珠轭合的细胞(可选择地,小珠结合的细胞可被保留用于之后的分析)。
[0206] 将预清洗的链霉亲和素M280磁珠与生物素化的大鼠抗小鼠CD138(BDPharmingen)以每25μl磁珠0.75μg抗体于4℃孵育30分钟。之后用磁体根据制造商程序清洗小珠并且在缓冲液#1中重悬。将预先收集的负极细胞部分(加倍贫化的CD45R/+ +
B220 和CD49b 细胞)与50μl的CD138轭合的磁珠孵育并且于4℃旋转30分钟。之后将-
细胞置于磁体上并且用缓冲液#1清洗3次,废弃未与小珠结合的负极(CD138)细胞(或+
保留仅用于分析)。收集正极CD138 小珠结合细胞并于4℃储存直到进一步处理。
[0207] 浆细胞纯化处理的流式细胞分析显示于图3。
[0208] 实施例3:抗体分泌细胞(ASC)和记忆B细胞的分离
[0209] 小鼠记忆B细胞。按照环境优生学从免疫的小鼠采集二级淋巴器官(脾和淋巴结)。将组织收集在无菌过滤的缓冲液#1(PBS/0.1%牛血清蛋白(BSA)/2mM EDTA)中。通过使用机械破碎过滤通过70-um细胞过滤器(BD)收集脾和淋巴结细胞并用20ml的PBS清洗并且收集在50ml试管(Falcon,BD)中。之后以1200RPM于4℃离心脾和淋巴结细胞10分钟。将上清移去并且用3.0ml的RBC溶菌缓冲液(eBioscience)重悬细胞团并且于25℃轻柔振荡5分钟。之后用20ml的PBS稀释细胞悬浮液并且以1200RPM于4℃离心10分钟。移去上清液并且将细胞团在1.0ml的缓冲液#1中重悬。
[0210] 此外,通过心脏穿刺收集全血。将全血以1∶1的体积加至中性粒细胞分离液(histopaque solution)(Sigma),避免内含物混合。将血液-中性粒细胞分离液以1,600RPM于23℃离心30分钟而无需离心制动。梯度离心之后分离外周血单核细胞(PBMC)层并且通过与清洗缓冲液(PBS,2.5%胎牛血清(FBS),1mM乙二胺四乙酸(EDTA))一起离心而清洗两次。之后将细胞在缓冲液#1中重悬。
[0211] 将脾和淋巴结生发中心细胞用凝集原生物素标记并且之后用链霉亲和素磁珠(Invitrogen)分离生发中心记忆B细胞。
[0212] 人类ASC和记忆B细胞。分离来自人类志愿者的PBMC并且之后用荧光抗体染色。使用FACS通过CD19高/CD20低/CD3阴性(CD19high/CD20low/CD3neg)上的门控以及之后CD27高/CD38高上的二次分选分离PBMC以获得纯的ASC和记忆B细胞群(Wrammert等人,2008)。
[0213] 实施例4:制备用于高通量DNA测序的可变轻链(VL)和重链(VH)基因
[0214] RNA分离将如实施例2和3中描述所分离的CD138+CD45R-骨髓浆细胞或外周血ASC和B细胞以2,000RPM于4℃离心5分钟。之后用TRI试剂溶解细胞并且根据Ribopure RNA分离试剂盒(Ambion)中的制造商程序分离全RNA。通过使用oligodT树脂和Poly(A)纯化试剂盒(Ambion)根据制造商程序从全RNA分离mRNA。用ND-1000分光光度计(Nanodrop)测量mRNA浓度。
[0215] PCR扩增将所分离的mRNA用于通过使用Maloney鼠白血病病毒逆转录酶(MMLV-RT,Ambion)的逆转录的第一链cDNA合成。为了cDNA合成,将50ng的mRNA用做模板并且使用oligo(dT)引物。根据Retroscript试剂盒(Ambion)的制造商程序进行RT-PCR。
cDNA构建后,使用2ul的未纯化的cDNA产物和已有的VL和VH简并引物混合物进行PCR扩增以扩增VL和VH基因(Krebber等人,1997;Mazor等人,2007)。引物的完整列表可在表1中找到。
[0216] 表1-用于VL和VH基因的PCR扩增的引物混合物
[0217]
[0218]
[0219]
[0220]
[0221] 50ul PCR反应物由0.2mM的正向和反向引物组合物、5ul的Thermopol缓冲液(NEB)、2ul未纯化的cDNA、1ul的Taq DNA聚合酶(NEB)和39ul的双蒸水H2O组成。PCR热循环程序为:92℃3分钟;4个循环(92℃1分钟、50℃1分钟、72℃1分钟);4个循环(92℃1分钟、55℃1分钟、72℃1分钟);20个循环(92℃1分钟、63℃1分钟、72℃1分钟);72℃7分钟;4℃储存。将PCR基因产物凝胶纯化并且送至SeqWright(Houston,TX)和德克萨斯大学奥斯汀分校的遗传测序和分析中心进行Roche GS-FLX 454DNA测序。
[0222] 将VL和VH基因的PCR产物凝胶纯化并且送至德克萨斯大学奥斯汀分校的遗传测序和分析中心进行454DNA测序。
[0223] 快速cDNA末端(RACE)扩增。可选择地,从所分离的mRNA构建对可变轻链(VL)和可变重链(VH)特异性的cDNA扩增子文库。开始,使用SMARTScribe Maloney鼠白血病病毒逆转录酶(MMLV-RT,Clonetech)从mRNA合成第一链cDNA。cDNA合成使用25ng mRN、模板开关特异性5’引物和3’基因特异性引物。根据制造商程序使用缓冲液和反应条件。在5’和3’末端两处随多种标示剂(MID)一起使用已经混合454测序引物(Roche)的引物以使所合成并扩增的cDNA可直接用于454emPCR步骤。5’正向引物连同454 Titanium(SRp#1)的5’测序引物的一部分一起通过在第一链3’端加入三个半胱氨酸残基来使用MMLV-RT模板开关。对于反向引物,引物可连同包括3个唯一MID(SRp#2、3、4)的454 Titanium的引物A一起被用于扩增VL基因和轻链恒定区CK的3’末端的一小部分。相似地,用重链恒定1(CH1)区的VH基因的3’末端的一小部分连同包括3个唯一MID(SRp#5、6、7)的454 Titatnium的引物A一起扩增VH基因。所有的引物从集成DNA技术(IDT)合成并HPLC纯化并且列于表2中。
[0224] 表2-用于VL和VH cDNA扩增子文库的引物
[0225]
[0226]
[0227] 第一链cDNA合成之后,用基于所加的454测序引物(分别是SRp#8和9,注意5’正向引物SRp#8在5’端是生物素化的)的5’和3’端的引物进行PCR以扩增cDNA。根据Advantage 2PCR试剂盒(Clontech)使用标准PCR条件。之后在1%琼脂糖凝胶上运行cDNA样品并且分别提取相应于VL或VH的~450和~500bp的条带并且进一步纯化(Zymogen)。使用nanodrop分光光度计测量cDNA浓度。之后将每个样品500ng的cDNA用于454测序。
[0228] VL和VH谱的高通量测序。使用高通量454GS-FLX测序(德克萨斯大学,Austin,TX;SeqWright,Houston,TX)将从八只小鼠的BM-PC分离的V基因谱测序。总共生成415,018条序列,并且454数据质量控制根据它们的多重标示剂(MID)使用将>97%的序列过滤并且分组至每只小鼠的数据集。
[0229] 实施例5:抗体可变重链和轻链序列的分析
[0230] 454GS-FLX被用于从骨髓浆细胞或ACS或记忆B细胞或直接从分离的骨髓、淋巴结或脾获得抗体可变区VL和VH的全长读段。全长读段被认为覆盖所有3个CDR的序列。
[0231] 通过对CDR3的N-和C-末端的高度保守的四个氨基酸基序的同源搜索识别CDR3。表3列出了用于在KabatMan数据库中识别CDR-L3和CDR-H3的基序和它们出现频率的基序(网址bioinf.org.uk)。
[0232] 同样为基序搜索生成反向互补序列并且为了下列分析考虑符合读框的CDR3。所识别的CDR3序列被用作VL和VH唯一的标签标示剂并且计算它们的相对丰度并用于代表相应的可变基因丰度(表4-5)。带有高丰度CDR3的全长VL和VH序列之后通过对数据集的比对相似性搜索和标准BLAST来识别(表6)
[0233] 表3-用于识别CDR3的保守基序
[0234]
[0235] 表4.来自Bright-1样品的共有CDR3H序列和它们的出现频率(%)
[0236]
[0237]
[0238] 表5.来自C1s-2样品的共有CDR3H序列和它们的出现频率(%)
[0239]
[0240] 表6.共有VL和VH的全长氨基酸序列
[0241]
[0242]
[0243]
[0244] 实施例6:血清IgG中V基因的蛋白质组量化
[0245] 血清Ig蛋白通过使用具有使用醋酸盐缓冲液,pH3.0的洗脱的蛋白A或G层析的亲和层析(或用于亲和纯化其他主要Ig类型的抗IgA和抗IgM抗体)分离血清Ig蛋白。此外,抗原特异性IgG通过固定化抗原柱上的亲和层析和使用6M尿素或乙酸盐缓冲液pH3.0的洗脱进一步纯化。为了之后的处理将所洗脱的样品在PBS中透析
[0246] 视情况将纯化的IgG蛋白或FAB片段在50%2,2,2-三氟乙醇(TFE)中变性。加入15mM二硫苏糖醇以减少蛋白质并且将样品于55℃孵育45分钟,之后用55mM碘乙酰胺于室温烷基化30分钟。将样品稀释10倍至5%TFE浓度并且经历保持CDR3结构域大致完整的适当的蛋白酶的蛋白酶水解。适当的蛋白酶的选择基于V结构域蛋白序列的生物信息分析以使蛋白酶裂解生成裂解CDR3的N-和C-末端的肽,留下数据库大部分序列中大致完整的CDR3序列。在某些实施方案中,使用测序级胰蛋白酶于37℃4小时完成蛋白水解裂解。在个别实施方案中,GluC(NEB)和LysC(Sigma)蛋白酶的组合被用于生成不同套蛋白水解肽,其在计算机测试中提供较好的CDR3覆盖。在还有第三个实施方案中,使用胰蛋白酶或所另外选择的细菌外膜蛋白酶OmpT的工程化变体完成蛋白水解裂解以使裂解保留CDR3的完整性。用1%甲酸停止消化。通过真空蒸发离心减少样品体积。为了除去杂质,将肽在C-18 Hypersep SpinTips(Thermo Scientific)柱上结合并清洗并且在LC-MS/MS分析之前过滤通过10kDa Microcon YM-10离心过滤器(Amicon)。
[0247] 在某些实施方案中,CDR3肽通过包含Cys的免疫球蛋白肽的亲和纯化来富集。不变的Cys残基位于CDR3结构域的N末端。FAB蛋白中的VL-Cκ,λ和VH-CH1多肽每个包含4个Cys。因此从重链或轻链分离含Cys的肽导致CDR3肽显著富集至池的约25%。含Cys的肽的富集因此显著减少MS质疑的冗余肽的数目并且增加的覆盖的深度。为了纯化含Cys的CDR3肽,根据制造商说明书将上文生成的肽片段与3倍摩尔过量的巯基特异性生物素化试剂例如碘代乙酰基(isodoacetyl)-LC-生物素(ProtecoChem)反应。生物素化之后,含Cys的肽片段通过中性链亲和素上的亲和层析以及用大大过量(5mM)的游离生物素的洗脱来分离。
[0248] 之后在反相Zorbax C-18柱(Agilent)上运行230分钟从5%至38%乙腈0.1%甲酸洗脱分离肽。肽通过纳米电喷雾离子化直接洗脱至LTQ-Orbitrap质谱(Thermo Scientific)中。使用在100K分辨率收集的母离子质谱(MS1)使得可以进行信息依赖性离子选择。选择具有已知>+1电荷的离子用于以降低密度的次序进行的CID片段化光谱分析(MS2),具有每个MS1循环12个所选择的母离子的最大值。用为30秒钟两次MS2所选择的离子活化动力排除。从MS2选择排除30秒。
[0249] 在LC-MS/MS运行中识别为相应于来自重链和轻链的恒定区的肽的离子在随后的实验中从数据依赖性选择中排除以便增加对来自可变区的肽的选择。作为可替代的方法,与重链和轻链的超变区重叠的预测的蛋白酶特异性肽被编译为包含物列表,其相应母离子优选选用于MS2片段分析。
[0250] 样品特异性蛋白序列数据库是从高通量V基因cDNA测序数据产生的。使用作为Bioworks软件包(Thermo Scientific)的一部分的Sequest搜索算法针对这一数据库搜索LC-MS/MS数据。应用过滤器以确保如下的高置信度肽识别:ΔCN≥0.250;XCorr=+2、+3和≥+4个电荷的2.0、2.5和3.0;并且精确度≤10.0ppm。可选择地,用于质谱的其他无标记(Silva等人,2006b;Gygi等人,1999;Ross等人,2004)或同位素标记基础的定量方法可被用于在蛋白水平确定特定CDR3家族的丰度。
[0251] 应当注意的是对于浆细胞来说基于CDR3肽计数的转录物丰度和蛋白水平常常是无关联的。这一偏差有三个原因。第一并且最重要的,V基因丰度概况提供抗体转录和蛋白合成的快照。然而,抗体在循环系统中以对于IgG来说约14天的t1/2持续。浆细胞群是动态的并且持续更新。因此,在血清中不是高丰度的良好转录的Ig可能是仅近期位于血浆区室中的新浆细胞的产物。显示低转录速度但是高度表现的“衰退”的浆细胞的存在支持这一假设(以红色和下划线显示于表7中)。第二,测序数据包括所有V基因而不分同种型,其中蛋白质组数据仅反映IgG池。因此,一些未表现或表现不良的CDR3可能相应于IgA并且将不会通过本文分析来检测。第三,因为胰酶消化被用于片段化,一些CDR3可能已经被部分裂解并且因此作为完整肽是低表现的(包含可能的胰蛋白酶裂解位点的CDR3序列在表7中是灰色高亮的)。
[0252] 在表7中,通过MACS/FACS分离并且通过Roche454测序(约15-35K完整读段)+ - -分析骨髓浆细胞(CD138,CD45R(B220)/CD49b)中VL转录物的频率。同样显示通过来自相同小鼠的血清的纯化的IgG的鸟枪蛋白质组分析确定的CDR3肽计数。显示出CDR3序列包含假定的蛋白水解位点并且因此在片段化过程中低表现。显示相对高计数但是低转录水平的CDR3肽为红色下划线的。
[0253] 表7:浆细胞中CDR3VL基因mRNA序列的实例和如通过将MS所识别的CDR3肽计数所确定的血清中各个抗体的相应的相对丰度
[0254]
[0255]
[0256] 在某些实施方案中,基于CDR3家族的V基因的分组大大改善了肽数据集的定量。其向生物信息分析流水线引入了多个另外的步骤:(1)在进行鸟枪蛋白质组实验并且基于标准质谱分析流水线和样品特异性序列数据库识别肽之后,识别了与CDR3区重叠的肽。
(2)将这些所观察到的肽对V基因cDNA定义的CDR3家族作图,以及(3)定义可归属于每个CDR3家族的光谱计数。将通过MS蛋白质组分析识别的CDR3肽的分级级别丰度与DNA序列分析的比较示于表7中。VL转录物丰度与从CDR3分析确定的蛋白丰度的比较表明最高表现的抗体(以骨髓细胞群中所有VL转录物的17%表达!)在CDR3肽中同样是最高表现的。
[0257] 在几个实例中,浆细胞转录与血清中抗体的浓度无关。这一发现对于疾病检测和治疗性抗体发现有重要意义并且与三个因素有关:首先,转录物分析仅提供转录和蛋白合成的快照。然而,抗体在循环系统中以对于IgG来说约14天的t1/2持续。浆细胞群是动态的并且持续更新。因此,在血清中不是高丰度的良好转录的Ig可能是仅近期位于血浆区室中的新浆细胞的产物。显示低转录速度但是高度表现的“衰退”的浆细胞的存在支持这一假设。第二,测序数据包括所有V基因而不分同种型,其中蛋白质组数据仅反映IgG池。因此,一些未表现或表现不良的CDR3可能相应于IgA并且将不会通过本文分析来检测。第三,用于生成这一数据的蛋白水解片段化导致一些CDR3被部分裂解并且因此作为完整肽是低表现的(包含推定的胰蛋白酶裂解位点的CDR3序列是绿色高亮的)。如上文所讨论的,这一问题通过对片段化条件的慎重选择而成功解决。
[0258] 实施例7:合成的抗体基因的构建
[0259] 蛋白质组分析所识别的最富有的VL和VH蛋白序列和来自基因序列分析的那些之后通过采用已开发的以快速且高效生产高保真性合成基因的软件和液相操作机器人为基础利用序列数据的自动化的基因构建而合成(Cox等人,2007)。简单地说,使用内外成核PCR反应从合成的寡核苷酸生成基因片段,随后使用缝线重叠延伸PCR反应并且由此排除对纯化步骤的需要,使得过程可以自动化。片段设计和相关的重叠通过软件自动化,其进一步生成用于构建和组装的寡核苷酸合成仪列表和机器人操作脚本。
[0260] 对于IgG生产,基于来自蛋白质组和基因序列频率分布的信息将VH和VL基因配对。将以相似的频率存在的VH和VL基因配对。发明人发现这一策略获得表现高抗原亲和性的正确配对抗体的高成功率(>75%)(表8)。在表8中,VL和VH具有基于表2中所显示的丰度分级级别配对的CDR3序列并且通过ELISA测量各个抗体的亲和性。.
[0261] 表8:在血清中经由本文公开的技术识别的合成抗体的实例以及它们的抗原结合亲和性
[0262]
[0263] 实施例8:IgG表达和结合分析
[0264] 将合成的VL和VH基因组装以便全长IgG表达。合成的基因产物通过凝胶提取纯化,之后分别用限制性内切酶BssHII/BsiWI和BssHII/NheI消化VL和VH。将所消化的VL和VH基因分别连接至载体pMAZ-IgL和pMAZ-IgH1中。pMAZ-IgL携带恒定人类κ轻链抗体区而pMAZ-IgH携带IgG1的恒定人类重链抗体区。将载体转化至大肠杆菌Jude 1细胞中并且铺板在补充了100ug/ml氨苄西林的Luria Broth(LB,Miller)琼脂平板上。选择单个群并且确认正确的V基因序列。携带pMAZ-IgL和pMAZ-IgH载体的大肠杆菌细胞之后在补充100ug/ml氨苄西林的10ml TB中生长,分离并且纯化DNA。按照Freestyle MAX表达系统程序(Invitrogen)将每个20μg的纯化的pMAZ-IgL和pMAZ-IgH用于从HEK293-F细胞共转染并瞬时表达。HEK293-F细胞在转染后生长96小时并且采集培养基并且将IgG通过蛋白A琼脂层析柱纯化。
[0265] 为了确定抗原亲和性,用由PBS中2ug/ml纯化的抗原包被并用0.5%BSA封闭的96孔板进行标准ELISA。将纯化的IgG以不同浓度加至板1.5小时并用PBS/0.05%Tween-20清洗。将轭合HRP的山羊抗人Fc区的多克隆抗体用于检测并且用TMB底物显像并用2N H2SO4停止。在450nm用96孔板分光光度计测量吸光率。将纯化的IgG的滴定曲线用于确定结合的大致的IC50(表8)。
[0266] 可选择地,可进行全细胞的ELISA以估计结合亲和性。向96孔板培养簇板以2x105个细胞/m加入肿瘤细胞。之后将细胞暴露于各种浓度的纯化的IgG1.5小时。之后将板以2000RPM离心1分钟以将细胞成团并且用PBS重悬并清洗并且重复3次。为了检测,将山羊抗人Fc区的多克隆抗体与HRP轭合并且用TMB底物显像并且用2N H2SO4停止。在450nm用96孔板分光光度计测量吸光率。
[0267] 实施例9:通过挖掘浆细胞的可变基因谱分离单克隆抗体
[0268] 已经开发了简单并且迅速的方法用于抗体分离而无需任何实验室筛选步骤。利用高通量DNA测序以分析来源于存在于免疫小鼠的骨髓中的完全分化的成熟B细胞-抗体分泌浆细胞-的mRNA转录物的VL和VH抗体基因谱。生物信息学分析之后,可在每只免疫小鼠的谱中识别几个富有抗体基因序列。根据谱中它们的相对频率将VL和VH基因配对。通过寡核苷酸以及通过使用自动化液相操作机器人的PCR组装迅速合成抗体基因。将抗体分别在细菌和哺乳动物系统中重组表达为单链可变片段(scFv)和全长IgG(图2)。最后,确认了所获得的抗体是压倒性抗原特异性的(21/27或78%),因此提供了用于快速并且直接分离MAb无需筛选的方法。
[0269] B细胞成熟在B细胞发育的末端非增殖阶段结束-形成作为免疫球蛋白生产工厂起作用的浆细胞。浆细胞代表所有淋巴细胞的不足1%并且还负责循环系统中抗体的压倒性主体(Manz等人,2005;Shapiro-Shelef和Calame,2005)。骨髓构成浆细胞长期占据并5
且生产抗体的主要区室。在小鼠中,~10 个细胞(全部BM-PC的10-20%)的稳定并且高度富集的抗原特异性BM-PC群在二级免疫之后6天出现并且持续很长时间(Manz等人,
1997)。相反,脾的浆细胞群是非常瞬时的,其在第6天达到峰值并且到第11天迅速下降至
4
<10 个细胞。重要地,BM-PC负责最富有循环抗体的合成,其反过来可能在病原体中和和其他保护性体液免疫响应中起到主要作用(Manz等人,2005)。
[0270] 为了检测BM-PC中抗体V基因谱的尤其是激发后早期(即模拟小鼠表现出弱的免疫响应时的情况)的动力学,用鸡卵清蛋白(OVA)、人类补体丝氨酸蛋白酶(C1s)、IgH转录的人类B细胞调节剂(Bright)或者仅佐剂免疫成对小鼠。将抗原与弗氏完全佐剂共注射,之后是弗式不完全佐剂中的二级促生免疫。二级免疫后6天处死小鼠并且分离- +BM-PC(CD45RCD138)至高纯度(图3)。提取总RNA并且逆转录以便合成第一链cDNA。良好表征的(Mazor等人,2007)退化的V基因引物组合物被用于第二链扩增,产生高纯度的VL和VH PCR产物(图4),其之后被提交至使用454-GS FLX技术(Roche)的长读段的高通量DNA测序。
[0271] 与近来研究斑鱼(Weinstein等人,2009)、人类(Boyd等人,2009;Glanville等人,2009)或合成文库(Ge等人,2010)中V基因谱多样性的高通量测序分析不同,目的在于:(1)识别可能为抗原特异性的高表达的V基因和(2)确定免疫小鼠的BM-PC谱中相对V基因转录物丰度。这些任务无需对V基因谱的彻底覆盖;已经发现获得每个BM-PC样品>5K的基因序列足以提供抗体发现所需的信息,降低了DNA测序费用
[0272] 454读段首先通过多序列和信号过滤器处理并且之后经受简单并快速的取决于与V基因中的保守框架区的同源性的生物信息学分析以便识别最常见的互补决定区3(CDR3)序列(图5)。
[0273] 这一方法正确识别Kabat数据库中~94%的VH和~92%的VL序列(表3)。在总共415,018个读段中,23.2%包含VH的CDR3(CDRH3)而26.6%包含VL的CDR3(CDRL3)序列(表9),分别代表每只小鼠6,681-16,743和7,112-21,241个CDRH3和CDRL3序列读段。
[0274] 表9.使用CDR3两侧共有基序从454GS-FLX DNA测序识别的包含CDR3的序列的数目
[0275]
[0276] 对于每只小鼠,计算CDR3的频率分布。来自经由不同工具的不同cDNA文库制品的相同样品的测序给出对CDR3定量上相似的分级。如表10中所示,对所有高表达的CDR3观察到相似的分级级别频率。这是重要的,因为如下文所讨论的我们用于抗体发现的方法利用V基因的分级级别频率并且尤其是对最高表达的克隆的识别。含有特定CDR3的V基因序列如果覆盖所有3个CDR的话则作为全长被接受。通过多重序列比对以及之后的种系分析(图5和下文描述的生物信息方法)计算配对同一性和频率。开发图画使用界面应用以增强数据分析和结果的可视化(图6)。
[0277] 表10.通过两种不同工具从两个不同cDNA文库制品(SeqWright和UT-Austin Genome Sequencing Center)生成454DNA测序结果的比较
[0278]
[0279] BM-PC谱的分析产生几个有趣的观察。首先,所有免疫小鼠总谱的~10-20%平均由仅四个CDRH3序列组成(表11)。例如,在用C1s免疫的两个小鼠中,最富有CDRH3的频率分别是总谱的7.93%和10.99%。第二,如对早期响应所期望的,用对VL和VH分别仅2和5个氨基酸取代的平均无性系突变速度从种系V基因节段的多样性测定集合最富有的CDR3(表12-13)。并不出乎意料,响应于特定的抗原,在小鼠中某些种系V基因家族被优先表现。例如,在用C1s免疫的小鼠中,整个VH基因谱的15-30%之间使用IGHV1家族,然而仅佐剂免疫的小鼠由IGHV5或IGHV6家族占据(图7)。
[0280] 表11.最高表现CDRL3和CDRH3a序列的频率(%)
[0281]
[0282]
[0283]a
[0284] 在免疫小鼠和仅佐剂小鼠中都以高频率存在的CDRH3序列作为背景并且因此从列表中排除。a
[0285] 表12.最高表现的VL和VH 基因的氨基酸无性系突变(SM)的种系同一性和数目[0286]
[0287]
[0288]
[0289] a在免疫小鼠和仅佐剂小鼠中都以高频率存在的VH序列作为背景并且因此从列表中排除。
[0290] 表13:每个BM-PC谱中前30个VH序列核苷酸(nt)和氨基酸(AA)上的平均无性系突变
[0291]
[0292] 在大多数情况下,编码高丰度CDR3的V基因由一条序列占据而与优势序列相差1-2个氨基酸的第二最高丰度的V基因序列(无性系变体)以低>10倍水平存在的
[0293] 下列测试和表格提供了关于使用本文详述的技术研究的抗体谱的进一步信息。有一些情况中富有CDRH3由以相当的频率表现的几个V基因编码(图8和表14)。明显地,VH谱非常不同,即使在用相同的抗原在同一天免疫的遗传上相同的同胞仔中。对于用C1s或Bright免疫的小鼠,每只小鼠发育出不同并且多变的一套富有CDRH3序列(图9和表15)。这表明每只小鼠产生其自身独有并且高表达的VH基因谱。然而一个例外是在OVA免疫的小鼠的同龄组中我们观察到有几个富有CDRH3在其他小鼠中同样以高频率存在,表明相应的抗体可能是多特异性的。并不令人惊讶地,来自仅接受佐剂的动物的一些中等表现的CDRH3序列同样存在于免疫小鼠中(图9)。这些序列编码的抗体可能对佐剂或常见天然抗原来说是特异性的。CDRL3多样性被以高频率在几个小鼠中表现的未加区分的序列拉低(图16)。
第四,即使BM-PC VH谱主要由对于每只小鼠来说唯一的序列组成,但小鼠间共有CDR3的基本组成分析表明在同一时间用不同抗原免疫的每个同龄组(即同笼并同窝)的数据的不同分簇(图10)。这一特征可能反映了环境因素例如动物组的抗原历史并且表明V基因谱分析可提供有价值的诊断信息。
[0294] 表14:最高代表的CDR3组以及它们的全长可变重链(VH)和可变轻链(VL)基因频率和同源性。
[0295]
[0296]
[0297]
[0298] a特定CDR3组中最高两种VH和VL全长序列的频率。b通过经由共有相同CDR3的所有V基因的多序列比对计算成对同一性确定VH和VL同源性。
[0299] 表15:来自用C1s免疫的小鼠的骨髓浆细胞谱的最高频率CDRH3的存在以及它们在用佐剂或不同抗原免疫的小鼠中的相对频率
[0300]
[0301]
[0302] 表16:来自用C1s免疫的小鼠的骨髓浆细胞谱的最高频率CDRL3的存在以及它们在用佐剂或不同抗原免疫的小鼠中的相对频率
[0303]
[0304]
[0305]
[0306]
[0307] 应当注意的是在接受其他抗原的小鼠的CDRH3谱中以非常低的水平(通常<0.1%)观察到针对给定抗原产生的最富有CDRH3序列的几个拷贝(通常<5个)。因为各自抗体基因中的几个显示编码抗原特异性抗体(参见下文),所以发明人相信用其他抗原免疫的小鼠中这些序列的存在可能从低水平的样品间杂质产生,这是受到相同同龄组中常见CDRD3序列的偏倚分布所支持的结论(图11)。因为454DNA测序的高敏感性,即使最大限度的注意,在文库制备/多重测序期间完全排除低水平杂质(序列噪音)也是不可能的。尽管认真考虑针对无偏倚谱的研究(Weinstein等人,2009;Boyd等人,2009),但序列噪音并不影响本文描述的方法,因为BM-PC谱中最富有V基因以高于序列噪音水平的20至>100倍的水平表现。
[0308] 使用整个BM-PC V基因池(即不具有通过NextGen测序分析确定的最富有C基因中)对大肠杆菌中scFv的小组合文库的手动筛选产生低产量的抗原特异性克隆(每96孔板<4个阳性克隆,数据未显示)。当进一步分析时,这些scFv中的大多数显示ELISA的低外观亲和性和/或不良的表达和聚集。发明人推论这是组合配对的结果:即使假定在scFv组装上没有PCR偏倚时VL和VH基因占cDNA池的5%,那么正确配对的可能性仅为0.25%并且因此阳性克隆的发现将需要极大数量的筛选。
[0309] 总之为了克服这些问题并且避免筛选,预期以大致一样的频率表现的VL和VH基因可能来源于相同的浆细胞并且因此是天然配对的。为了测试这一理论,将来自每只小鼠最少占到谱的0.5%的前4-5个最富有全长VL和VH基因(排除在仅佐剂小鼠中交叉表现的VH基因)成对基因合成,重组表达并且测试抗原结合。
[0310] 合成基因通过上文详细显示的机器人协助的高通量DNA合成来构建。简单地说,基因片段(长度200至500个核苷酸)使用内外成核PCR反应来生成。使用定制软件将这些片段和相关重叠的设计自动化以有利于机器人合成和组装。任一端序列的比对和“填充”产生相同长度的基因并且允许使用确保最大寡核苷酸再使用的一般的重叠组装策略(图12)。以这一方式,由一名研究人员在一周内合成多达48个VL和48个VH基因并且证实了正确的OFR,试剂花费<$2,000。
[0311] 在大多数情况下,VL和VH配对通过谱中CDR3频率的分级级别确定。在两个VL或VH基因以非常相似的频率存在的情况下,构建了多个VL-VH组合。成对的V基因之后在大肠杆菌中表达为scFv片段。
[0312] 制备大肠杆菌全细胞溶解物以表达通过将最富有V基因配对(如上文所示)构建的抗体单链可变片段(scFvs)。通过骨髓浆细胞谱中各个V基因的相对频率(%)确定VL和VH基因配对。进行ELISA分析以确定抗原结合(参见在线方法)。(+):相对于用不相关抗原(牛血清白蛋白和/或明胶)包被的孔,抗原包被孔上>3倍的ELISA信号。
[0313] 细菌溶解物的ELISA分析表明所获的抗体是压倒性抗原特异性的(~78%):从用三种不同的蛋白抗原免疫的六个小鼠获得21/27的抗原特异性抗体(表17)。为了进一步评估这一简单配对策略的实用性,构建了包含来自用C1s免疫的两只小鼠中的每一只的4个最富有VL和VH基因的scFv的组合文库。scFv抗体在大肠杆菌中表达:通过ELISA的结合分析表明所有最高抗原结合克隆具有与通过配对策略预测的相同的VL-VH基因组合(表
18)。
[0314] 表17:来自高频率VL和VH基因的抗体单链可变片段(scFv)的抗原结合
[0315]
[0316]
[0317]
[0318] 表18:通过最高四个VL和VH基因的组合配对识别的抗体单链可变片段(scFv)[0319]
[0320] aELISA信号与表达scFv的大肠杆菌全细胞溶解物相关联,如相对于用无关抗原(牛血清蛋白)包被的孔,与抗原包被的孔结合的scFv的OD450信号所测量的。
[0321] 小鼠C1s-2显示最高血清滴度(表19)并且因此来自这一小鼠的抗体被选用于通过表面等离子体共振(Biacore)生物物理表征表面抗体结合亲和性。将抗体在大肠杆菌中重组表达并纯化为单体scFv片段而在HEK 293F细胞中重组表达并纯化为全长IgG抗体。来自小鼠C1s-2的最富有轻链(2.1L)和重链(2.1H-B)V基因(分别为17.10%和9.93%CDRL3和CDRH3频率)产生为scFv的具有20nM的KD(kon=2.3x 104M-1sec-1;koff=5.0x
10-4sec-1)的抗体以及出乎意料地为IgG的50nM稍低的单价KD(kon=2.4x 104M-1sec-1;koff=1.2x 10-3sec-1)的抗体。来自相同的小鼠,将C1s 2.2L与2.2H(分别为2.62%和3.30%CDRL3和CDRH3频率)配对产生显示低结合亲和性的IgG(~500nM的KD,数据未显示)。然而C1s 2.3L与2.2H(分别为2.20%和3.30%CDRL3和CDRH3频率)的配对产生具有亚纳摩尔结合亲和性的IgG(KD=0.43nM,kon=4.5x105M-1sec-1;koff=1.9x 10-4sec-1,图13和表20),表明天然配对可能是2.3L-2.2H。而且,抗体适于功能测定,例如三明治ELISA和来自人类血清的C1s的免疫沉淀(图14-15)。
[0322] 表19:在用不同抗原免疫的小鼠中的血清IgG滴度
[0323]
[0324] *IgG滴度通过产生背景以上的ELISA信号(与预免疫的小鼠血清结合)的最大小鼠血清稀释来确定。
[0325] 表20:通过挖掘小鼠C1s-2的骨髓浆细胞谱获得的抗体单链可变片段(scFv)和IgG的生物物理表征,其显示最高的血清IgG滴度
[0326]
[0327] 除非以另外的方式说明,免疫、分离骨髓浆细胞、制备可变轻链(VL)和可变重链(VH)基因以及高通量测序VL和VH谱的方法基本上与实施例1-4中所描述的相同。
[0328] 生物信息分析:
[0329] (1)CDR3识别 基于CDR3上游和下游存在的保守的两侧序列基序开发了搜索方法。搜索CDRH3和CDRL3的基序基于在来自Kabat数据库的V基因中在特定位点以99%的平均频率出现的氨基酸确定(表3)。为了分别位于CDRH3的N-和C端的基序DXXXY[F/Y]C VH序列(Kabat#86-92)和WGXG(T/S)的搜索VH序列。类似地,通过搜索基序DXXXY[F/Y]C(Kabat#82-88)和FGXGT(Kabat#98-102)发现VL基因。这一方法在Kabat数据库中正确识别超过94%的VH和92%的VL全长序列。分别将包含这些基序的任何序列或者反向补体提出作为VH或VL基因。仅进一步分析具有符合读框的CDR3而不具有终止子的序列。对于每个样品,发现最高表现CDR3序列(通常以>1%的频率表现)并且计算它们在所有其他7个样品中的相对丰度。为了找到共有的全长VH/VL基因序列,通过BLAST分析包含所感兴趣的高频率CDR3的序列的配对同源性并且选择具有最高得分的序列。图5总结了V基因的序列的生物信息分析。在Unix环境下使用Perl脚本进行分析,使用Matlab 7.1GUI构造程序将其转化为图形用户界面以便增强结果的可视性。
[0330] (2)来自不同小鼠的样品间的CDR3表达分析 提取在多个样品中存在的CDR3序列并且分析它们在所有小鼠中的普及率。首先,使用Matab进行基本成分分析(FCA)以分析不同小鼠中CDR3表达的方差(图10A-10B)。小鼠样品之间的大部分方差被编译为七个基本组分。第二,计算在多个样品中存在的CDR3序列的百分比。因为不可确定复制序列是否属于杂质或者真正的生物学作用,因此进行置换检验以确定四个样品间共享的序列的百分比是否因特定日期分析的样品而偏倚。计算选自四次所选的八个样品的所有70个可能组合的共有序列的百分比,之后通过百分比重叠分级。前三个级别的组合被认为是显著地并且不能归因于随机组合。
[0331] (3)富有CDRH3的频率分布 生成热图以说明来自接受不同抗原的小鼠中的每个样品的高丰度CDRH3的普及率。仅表现在前5%的分布中具有统计学上显著的频率的CDRH3序列(频率阈值~0.03%)(图9)。
[0332] (4)全长V基因的同源性分析 发现包含相同CDR3的序列的全长V基因。首先,将序列通过对接CDR3基序而符合读框地放置。第二,接受全长V基因序列,如果它们不含有终止子并且覆盖所有三个CDR区。使用Geneious软件中的多序列比对工具将不相同的全长的V基因(含有至少一个氨基酸差异)进行比对以确定配对同源性(Biomatters Ltd.,图8和表14)。
[0333] (5)种系分析 通过IMGT/V-Quest工具分析前4个全长共有VL和VH基因(Brochet等人,2008)。另外,使用IMGT/V-QUEST工具进一步分析四个小鼠(佐剂-1、佐剂-2、C1s-1和C1s-2)的前30个所分级的CDRH3序列的V(D)J重组。IMGT/V-QUEST分析之后识别V阶段种系用途和VH基因无性系突变。这些信息报告于图7和表13中。
[0334] 合成抗体基因的构建.
[0335] 可根据上文实施例8中描述的方法构建合成的抗体。
[0336] 表面等离子体共振(Biacore)将C1s以大约200个响应单位的水平通过如制造商程序中所描述的标准氨基偶联化学法共价固定在CM5芯片(GE healthcare,NJ)上。相似地将BSA偶联作为基线校准。在BIAcore 3000(GE healthcare,NJ)上在HBS-EP(10mM HEPES,150mM NaCl,50μM EDTA,0.005% P-20,pH 7.4)中于25℃进行所有的动力学分析。将抗体以50μl/分或100μl/分的流速注射在固定的抗原上并且将芯片用单次10s注射
20mM NaOH再生。一式两份进行每次原位测试(sensogram),动力学和平衡常数通过使用BIA评估软件(GE healthcare,NJ)完全拟合至二价模型来确定。
[0337] 实施例10:直接从淋巴组织迅速生成单克隆抗体而无需B细胞分离免疫程序[0338] 将蛋白抗原(例如纯化的鸡卵溶菌酶或钥孔血蓝蛋白)以1.0mg/ml重悬在灭菌过滤的磷酸盐缓冲的盐水(PBS)中。在初级免疫当天,将200ul的抗原溶液与200ul的弗氏完全佐剂(CFA,Pierce Biotechnology)和600ul的无菌PBS彻底混合并且储存在冰上。对动物物种(兔、绵羊、山羊、猪、小鼠)抽血,收集大约20ml血液并且储存于-20℃用于之后的分析。第1天被设定为进行初级免疫的日期。用21号针头每只动物皮下注射1.0ml的抗原-CFA混合物。
[0339] 为了随后的促生免疫,将200ul的抗原溶液与200ul的弗氏完全佐剂(IFA,Pierce Biotechnology)和600ul的无菌PBS彻底混合并且储存在冰上。每14天给予动物促生免疫,以每只动物1.0ml的抗原-IFA混合物腹膜内地给予感染。在促生免疫之后将动物抽血7天并且测量抗原特异性抗体滴度以监测免疫响应。当免疫响应达到高滴度(>1/100,000血清稀释)时,处死动物并采集血液和组织。
[0340] 分离骨髓、淋巴结和脾
[0341] 骨髓:从采集自免疫动物的股骨去除肌肉和脂肪组织。使用电钻和灭菌的钻头钻出进入胫骨和股骨两者末端的孔以为22号针头进入骨头提供足够的空间。使用这一操作吹洗出骨髓。将骨髓组织收集在无菌过滤的缓冲液#1(PBS/0.1%牛血清白蛋白(BSA)/2mM乙二胺四乙酸(EDTA))中。通过使用机械破碎过滤通过70-um细胞过滤器(BD)收集骨髓细胞,用40ml的PBS清洗并且收集在50ml试管(Falcon,BD)中。之后以1200RPM于4℃离心骨髓细胞10分钟。将上清移去并且用5.0ml的RBC溶菌缓冲液(eBioscience)重悬细胞团并且于25℃轻柔振荡5分钟。之后用40ml的PBS稀释细胞悬浮液并且以1200RPM于4℃离心10分钟。移去上清液并且将细胞团在2.0ml的缓冲液#1中重悬。
[0342] 淋巴结:从动物采集淋巴结,放置于缓冲液#1中并储存于冰上。使用两个22号针头将淋巴结组织拨开为小的1-2mm的碎片。之后将碎片与5ml缓冲液#1一起放于有盖培养皿中。之后,向每个淋巴结组织碎片加入0.5ml的10X胶原酶D(R&D Systems)并且于37℃孵育30分钟。孵育之后,向淋巴结碎片加入100ul的100mM EDTA(以淬灭胶原酶)。
之后将淋巴结碎片转移至使用机械破碎的70-um细胞过滤器并用40ml的PBS清洗。之后将淋巴结细胞以1200RPM于4℃离心10分钟。移去上清并且将细胞团重悬在2.0ml的PBS中并且以1200RPM于4℃离心10分钟。移去上清并且将细胞团重悬在缓冲液#1中。
[0343] 脾:从动物采集脾并且放置于缓冲液#1中并储存于冰上。使用两个22号针头将脾组织拨开为小的1-2mm的碎片。之后将碎片与5ml缓冲液#1一起放于有盖培养皿中。之后,向每个脾组织碎片加入0.5ml的10X胶原酶D(R&D Systems)并且于37℃孵育10分钟。孵育之后,向脾碎片加入100ul的100mM EDTA(以淬灭胶原酶)。之后将脾碎片转移至使用机械破碎的70-um细胞过滤器并用40ml的PBS清洗。之后将脾细胞以1200RPM于
4℃离心10分钟。移去上清并且用5.0ml的RBC溶菌缓冲液(eBioscience)重悬细胞团并且于25℃轻柔振荡5分钟。之后用40ml的PBS稀释细胞悬浮液并且以1200RPM于4℃离心10分钟。移去上清液并且将细胞团在2.0ml的缓冲液#1中重悬。
[0344] mRNA的制备
[0345] 将如本文所描述的分离的细胞以2,000RPM于4℃离心5分钟。移去上清并且之后将细胞团重悬并且用TRI试剂溶解并且根据Ribopure RNA分离试剂盒(Ambion)中的制造商程序分离总RNA。根据制造商程序通过使用oligodT树脂和Poly(A)纯化试剂盒(Ambion)从总RNA分离mRNA。用ND-1000分光光度计(Nanodrop)测量mRNA浓度
[0346] 使用5’RACE制备抗体VL和VH基因
[0347] 从所分离的mRNA构建来自所期望的类型(IgA、IgG、IgM或IgE)的抗体的VL和VH基因的cDNA文库。开始,使用SMARTscribe Maloney鼠白血病病毒从mRNA合成第一链cDNA,使用逆转录酶从mRNA制备cDNA(MMLV-RT,Clonetech)。cDNA合成使用300ng mRNA模板开关5’接头引物和oligo(dT)3’引物。随后,根据制造商说明书通过根据RLM-RACE First Choice试剂盒(Ambion)使用RNA连接进行5’RACE。2μl未纯化的cDNA被用作模板。5’引物、缓冲液、聚合物和反应条件由制造商提供(Clontech和Ambion)。根据Igμ或γ或其他物种的恒定区序列设计3’引物,其是公众可从IMGT数据库获得的。不同物种的3’恒定区特异性引物示于表21中。用1%琼脂糖凝胶纯化PCR产物,分离与VL和VH有关的~400-450bp的条带并且提交进行454高通量DNA测序。
[0348] 通过使用引物混合物的PCR的V基因扩增
[0349] 所分离的mRNA被用于通过使用Maloney鼠白血病病毒逆转录酶的逆转录(MMLV-RT,Ambion)的第一链cDNA合成。为了cDNA合成,将50ng的mRNA用作模板并使用oligo(dT)引物;根据Retroscript试剂盒(Ambion)的制造商程序进行RT-PCR。cDNA合成之后,通过使用2ul未纯化cDNA产物的PCR扩增VH和VL基因。VH和VL的5’引物混合物基于可在IMGT数据库获得的种系谱序列生成。绵羊中VH基因的5’区的实例提供于图
16中。如表21中所描述的,基于恒定区使用3’引物。将VL和VH基因的PCR产物凝胶纯化并且提交进行454DNA测序。
[0350] 表21:恒定区3′引物
[0351]
[0352] 通过杂交分离VH和VL cDNA
[0353] 所分离的mRNA用于通过使用MMLV-RT(Ambion)的逆转录的第一链cDNA合成。为了cDNA合成,将200ng的mRNA用作模板并且将VL和VH恒定区的3’特异性引物(表21)用于RT反应;于55℃进行RT-PCR 90分钟,之后是90℃10分钟。RT-PCR之后,将RNase加至反应以耗尽剩余的mRNA。之后,将10μM生物素化的引物加至cDNA。生物素化的引物是以表21中描述的引物的反向补体为基础的并且包含454序列引物B的3’端上的垂悬。将25ul链霉亲和素包被的Dynabead(Invitrogen)加至cDNA并且于室温旋转5分钟。之后将试管放置在磁体上并且移去上清且废弃,cDNA-小珠合成物之后用200ul的PBS清洗两次。
之后用20ul的10mM Tris-HCl,pH 7.5从小珠洗脱cDNA,将混合物于70℃加热2分钟并且放置于磁体上。将上清液中洗脱的cDNA转移至新试管,之后通过1%琼脂糖凝胶进行凝胶纯化并且将大小对应于IgL和IgHcDNA的~600-700nt的条带切下并且进行454DNA测序。
[0354] 用于CDR3识别的生物信息学分析
[0355] CDR3是抗体最多样化的区并且控制抗原识别、发明人意识到CDR3两侧序列在具有编码免疫球蛋白的适当的免疫响应系统的所有物种(鱼、蛙、鸟、哺乳动物等)中是高度保守的。这些保守的基序据信对于为适当表现超可变CDR3环而保持可变结构域的整体结构不被破坏提供严格的构象背景来说是关键性的。发明人开发了用于基于概率同源性分析识别CDR3的快速算法。三个策略可被用于设计各个物种的搜索基序-使用免疫球蛋白的抗体数据库(重排的基因)、种系基因或基因组序列。这一生物信息学分析方法可因此用于具有适合的免疫系统的几乎所有物种的抗体序列,即便没有大的抗体数据库。
[0356] 兔CDR-H3同源搜索基序的设计。编写Perl脚本以通过KabatMan数据库中506个兔VH基因的比对在抗体可变结构域上每个单独的残基位点的氨基酸出现频率。计算结果表明CDR3-H3区两侧存在高度保守序列(Kabat编号残基#95-102)。例如99%的兔VH基因在位点92和106分别具有半胱氨酸和甘氨酸。识别了CDR3两侧10个高度保守的位点(>90%)。表22-23列出了这些位点上所计算出的氨基酸占用可能性。为了有效识别具有位于基序区的无性系超变的抗体序列,将可能的权重平等地给予任何非优势氨基酸。例如,在位点86,天冬氨酸的可能性是0.97,丙氨酸的可能性是0.03而其他18种氨基酸中任何一种的可能性是0.03/18=0.00167。
[0357] 表22:兔CDR-H3的5’搜索基序和相关的可能性矩阵
[0358]
[0359] 表23:兔CDR-H3的3’搜索基序和相关的可能性矩阵
[0360]
[0361] 来源于使用基因组数据的种系序列分析的鸡CDR-H3搜索基序。当抗体序列数据库不可得时,可从可获得自基因组信息的种系序列识别搜索基序。作为示例性实例,识别鸡中VDR3的5’的搜索基序并且建立各自的可能性表24。从数据库提取所有18个鸡种系IGHV基因,包括功能性的和假基因两者。图17显示所比对的所有鸡重链V节段基因的蛋白序列。之后如上文计算CDR3的5’两侧的保守基序。
[0362] 表24:鸡CDR-H3的5’搜索基序和相关的可能性矩阵
[0363]
[0364] 如实施例5中所描述的必不可少地进行抗体可变重链和可变轻链序列的分析。如上文所示例的保守基序被用于搜索CDR3区。基于所识别的富有可变区序列构建合成抗体基因基本上如实施例7中所描述的的。抗体表达和结合分析基本上如实施例8中所描述的。
[0365] 实施例11:免疫不同动物之后从总淋巴组织迅速V基因谱而无需B细胞分离[0366] 将蛋白抗原(例如纯化的鸡卵溶菌酶或钥孔血蓝蛋白)以10mg/ml重悬在灭菌过滤的磷酸盐缓冲的盐水(PBS)中。在初级免疫当天,将在1mL盐水中稀释的100μg抗原与1ml的弗氏完全佐剂(CFA)混合并且储存在冰上。在第0天将动物物种(兔、绵羊或山羊)的血液(免疫前血液)抽至两个肝素试管中以获得大约15mL的血液用于随后的RNA分离和血清滴定。第1天被设定为进行初级免疫的日期。每只动物注射2.0ml的抗原-CFA混合物。
[0367] 为了随后的促生免疫,将在1mL盐水中稀释的100ug的抗原溶液与1ml的弗氏完全佐剂(IFA)彻底混合并且储存在冰上。每14天给予动物促生免疫,以每只动物2.0ml的抗原-IFA混合物给予注射。在促生免疫之后将动物抽血6天并且测量抗原特异性抗体滴度以监测免疫响应。当免疫响应达到高滴度(>1/25,000血清稀释,参见表25)时,处死动物并采集血液和组织。
[0368] 表25:对所有八只所注射的动物中HEL和CCH的血清滴定Table
[0369]
[0370] a如通过使用抗物种特异性IgG+IgM的二级抗体的ELISA测定的针对所注射的抗原(HEL,除了两只CCH兔之外)的滴度
[0371] 骨髓、脾和PBMC的分离
[0372] 骨髓:从采集自免疫动物的股骨和肱骨去除肌肉和脂肪组织。使用Dremel锯子在靠近关节处将骨头直接横切。在小铲的帮助下用无菌PBS清吹洗出骨髓以打碎红骨髓的细胞物质。通过使用机械破碎过滤通过70-um细胞过滤器(BD)收集骨髓细胞,用40ml的PBS清洗并且收集在50ml试管(Falcon,BD)中。之后以1200RPM于4℃离心骨髓细胞10分钟。将上清移去并且用5.0ml的RBC溶菌缓冲液(eBioscience)重悬细胞团并且于25℃轻柔振荡5分钟。之后用40ml的PBS稀释细胞悬浮液并且以1200RPM于4℃离心10分钟。移去上清液并且将细胞团在1.0-2.0ml的缓冲液#1中重悬。
[0373] 脾:从动物采集脾并且放置于无菌PBS中并储存于冰上。使用两个刀片将脾组织切丁并且之后拨开为小的1-2mm的碎片。之后将碎片与5ml缓冲液#1一起放于有盖培养皿中。之后将脾碎片转移至使用机械破碎的70-um细胞过滤器并用40ml的PBS清洗。之后将脾细胞以1,200RPM于4℃离心10分钟。移去上清并且用5.0ml的RBC溶菌缓冲液(eBioscience)重悬细胞团并且于25℃轻柔振荡5分钟。之后用40ml的PBS稀释细胞悬浮液并且以1200RPM于4℃离心10分钟。移去上清液并且将细胞团在1.0-2.0ml的缓冲液#1中重悬。
[0374] 血液:从动物将血液收集至密封的肝素试管中并且储存于冰上。在第0天,每次促生免疫之后6天和每只动物处死时收集血液。处理不同时间点的血液(所有动物的第0天、第20天、第34天以及每只动物处死时)以分离PBMC用于随后RNA的分离。通过将每份血液(每只动物16-20mL)以1∶1的体积在中性粒细胞分离液(Sigma)的顶部分层完成PBMC纯化,避免内含物的混合。将血液-中性粒细胞分离液溶液以1,600RPM于23℃离心30分钟而无需离心制动。梯度离心之后分离外周血单核细胞(PBMC)层并且通过与清洗缓冲液(PBS)一起离心而清洗。将细胞在1.0-2.0缓冲液#1中重悬。收集含有10-12mL血清的顶层用于针对各个抗原的血清滴度分析。在每只动物处死时的心脏穿刺产生大约两倍体积的血液。来自这些血液的血清体积为30-50mL。
[0375] 将如本文所描述的分离的细胞以2,000RPM于4℃离心5分钟。移去上清液并且之后将细胞团通过有力的吸液和涡旋在1mL TRI试剂中重悬并且根据Ribopure RNA分离试剂盒(Ambion)中的制造商程序分离总RNA。用ND-1000分光光度计(Nanodrop)测量RNA浓度。
[0376] 将2.75ul体积的200-700ng总RNA用于使用SMARTer RACE cDNA扩增试剂盒(Clontech)的第一链cDNA合成。将1.0ul的CDS Primer A加至RNA,之后在热循环仪上于72℃孵育3分钟,之后至42℃2分钟。加入1ul的SMARTer IIA oligo,之后是包含2.0ul
5X First-Strand缓冲液、1.0ul 20mM DTT、1.0ul的10mM dNTP混合物、0.25ul RNase抑制剂(40U/ul)和1.0ul SMARTScribe逆转录酶(100U)的5.25ul的主要混合物。之后将第一链合成反应混合物于42℃孵育90分钟,之后是70℃10分钟。将第一链cDNA产物用100ul的Tricine-EDTA缓冲液稀释。用包括70.5ul无RNase水、10ul 10X Advantage 2PCR缓冲液(Clontech)、2.0ul 10mM dNTP混合物、10ul 10X Universal Primer A Mix(Clontech)和1.5ul Advantage 2 Polymerase Mix(Clontech)的主要混合物建立5’RACE扩增。向包含2.0ul第一链cDNA产物和1.0ul的3’引物(10μM)的PCR管加入94ul的主要混合物。
为了VH扩增,基于公众可从IMGT数据库(兔和绵羊)或Genbank(山羊)获得的兔、绵羊或山羊的Igμ或γCH1基因序列设计3’引物。为了VL扩增,基于公众可从IMGT数据库(兔κ)或Genbank(兔λ、绵羊和山羊)获得的兔、绵羊或山羊的Igκ或λ基因序列设计3’引物。每个物种的3’恒定区特异性引物示于表26中。将PCR产物用1%琼脂糖凝胶纯化,分离与VL和VH相关联的~500-550bp条带并且提交用于454高通量DNA测序。
[0377] 表26:恒定区3’引物
[0378]
[0379]
[0380] 通过上文所描述的未碎片的淋巴组织的5’RACE制备的V基因谱与通过首先分选抗原分泌B细胞(CD138+浆细胞和浆母细胞)之后是如上文描述的V基因mRNA的5’RACE扩增获得的V基因谱相比较。如实施例2中所描述的使用大鼠α-鼠CD138抗体克隆281-2(BD Pharmingen)通过磁分选将CD138+细胞纯化。指定从未碎化的淋巴组织获得的V基因DNA为总淋巴组织V基因(tLT-V)。从分泌所分离的抗体的CD138+B细胞获得的DNA被指定为浆细胞V基因(PC-V)。如实施例4中所描述的使用NExtGEn测序将tLT-V和PC-V DNA测序并且如实施例5中所描述的处理数据。发明人确定当比较兔HEL1tLT-V和PC-V时同样在tLT-V池中检测PC-V池中超过95%的富有CDRH3序列(10个读段的最小值或≥0.04%),其大约为相同数目的比对读段。表27显示从用CCH(CCH1和CCH2)或用HEL(HEL1和HEL2)免疫的四只兔的骨髓浆细胞获得的tLT-V样品和PC-V样品中检测的最富有VH序列的比较。
[0381] 表27:从来自从总淋巴组织(tLT-V)或从纯化的CD138+B细胞(PC-V)制备的V基因cDNA的谱的测序识别的最富有VH基因的比较
[0382]
[0383]
[0384]a
[0385] tLT-V谱的前15个最富有CDRH3的存在(+)或不存在(-)。
[0386] 实施例12:通过挖掘骨髓、脾和PBMC细胞群的IgG可变基因谱分离单克隆抗体-应用于兔、绵羊和山羊
[0387] 如实施例4和9中所描述的将来自不同淋巴器官或来自外周血的V基因cDNA测序,并且通过依赖于与V基因中保守框架区的同源性的快速生物信息学分析处理454读段以便识别最常见的互补决定区3(CDR3)序列。使用IMGT软件进行种系比对。已经显示与已知山羊序列的高同一性的绵羊种系序列被用于IMGT基础的比对以确定山羊中的CDR基序。
[0388] 兔、绵羊和山羊中谱的生物信息学分析显示与鼠类谱相比不同的差异。首先,重链和轻链两者的tBM样品中谱极性低于小鼠中(实施例9)。因此,与仅基于相对cDNA丰度识别抗原特异性V基因时的小鼠不同,应用另外的生物信息学计划以精炼数据并且帮助抗原特异性V基因识别。在一个方法中,本文描述的PBMC谱与骨髓数据相比。其他淋巴区室中骨髓中的抗原分泌细胞在促生免疫后早期发生(4-30天之间,取决于物种)。骨髓中以高频率存在并且在其他区室中同样以中等至高频率存在的序列产生抗原特异性单克隆抗体。IgG特异性5’RACE扩增的使用提供主要通过总外周血单核细胞中循环浆母细胞和浆细胞(并且因为低得多的转录水平以较低程度通过种类转换的记忆细胞)表达的种类转换(IgG、IgA或IgE编码)抗体的高分辨率分析而无需之前纯化特异性B细胞群。应注意的是来自种类转换记忆B细胞的转录水平(以及由此的cDNA水平)是低得多的,因为这些细胞并没有活跃地分泌淋巴免疫球蛋白。表28包含来自骨髓和PBMC群超过1∶25000的滴度阈值的五只动物中的四只的前10个VH序列。如所期望的,两个群之间的关联不是特别明显的并且另外的过滤器对于选择对两者来说常见的序列是必需的。
[0389] 表28:骨髓和PBMC中最高表现的CDRH3的频率(%)
[0390]
[0391]
[0392]
[0393] 通过骨髓和PBMC群中共有丰度的过滤
[0394] 从每种动物选择抗原特异性VH序列是以骨髓中的丰度和总PBNC中对可调节阈值丰度的过滤两者为基础的。更严格的过滤器将代表在骨髓中前10个最丰富和外周血单核细胞中前50个最丰富中的抗原特异性V基因记为阳性。下文表29列出丰度分级和频率(为来自不同动物的V基因的总谱的%)。a
[0395] 表29:就过滤分析中所使用的丰度 而言VH序列频率和分级的实例
[0396]
[0397]
[0398]
[0399]
[0400]a
[0401] 可根据严格度调整丰度阈值以优化抗原特异性VH序列的分离。发明人选择0.05-0.1%的PBMC频率截止值并且已经显示通过这一阈值的最高骨髓序列。
[0402] 通过骨髓中的丰度选择VL序列
[0403] 抗原特异性VL序列的选择依赖于骨髓中的丰度数据。与VH一样,同样使用恒定区引物经由5’RACE扩增VL序列。
[0404] 表30:通过骨髓浆细胞中的丰度的最高VL序列
[0405]
[0406]
[0407]
[0408] 实施例13:通过组合配对ELISA筛选所选择的高丰度VH和VL合成基因
[0409] 兔、绵羊和山羊VH和VL谱的较低的极性(与实施例9中小鼠VH和VL谱相比)使得识别抗原特异性VH和VL的高亲和性配对的修饰的方法成为必需。如为较高极性的鼠类谱所做的,小的组合的组的不同合成VH和VL配对的ELISA筛选的使用避免了仅基于分级手工配对合成VH和VL的难题。
[0410] 抗原特异性抗体的分离。如实施例9中所描述的制得来自绵羊54的高丰度VH和VL序列的合成基因。分别合成VH和VL基因以便克隆为Fab构建体,具有拼接在VL上的Nco I/Not I位点和拼接在VH上的Nhe I/Hind III位点。这有利于将合成基因克隆至pFab-S载体(为了在大肠杆菌的周质中表达为可溶Fab工程化的基于pMAZ360的载体(Mazor等人,2007))中。此外,合成基因随后被扩增为使用重叠延伸PCR构建的VL和VH序列之间具有甘氨酸-苏氨酸连接子(GGGGS)4的scFv(如实施例9中)。为了scFv克隆,在每个VH-连接子-VL基因序列两侧加入Sfi I限制性内切酶酶切位点以有利于将合成的基因构建体克隆至可相容的pMoPac16载体中(Hayhurst等人,2003)。如实施例9中所描述的完成来自大肠杆菌溶解物的表达和ELISA筛选。表31列出用于构建FAb和scFv的绵羊54VH和VL CDR3序列以及它们在骨髓和PBMC中的相对丰度。表32列出来自绵羊54的7个VH和5个VL合成序列的全氨基酸序列。除非另外指出,选择每个CDRH3的最富有无性系变体。对于VL,合成CDRL3组的氨基酸共有序列。
[0411] 表31:绵羊54 VH和VL合成基因
[0412]
[0413]
[0414] 表32:绵羊54VH和VL合成序列—全氨基酸序列和相应的CDR3序列(同样列于上文表1中)
[0415]
[0416]
[0417]a
[0418] 对于这一VH,合成第二富有无性系变体。
[0419] 实施例14:经由将高分辨率V基因序列数据集的分析分簇对淋巴谱进行免疫信息挖掘
[0420] 来自绵羊、山羊以及较少程度上兔中骨髓的V免疫球蛋白cDNA谱比小鼠中的谱极化得少。这一实施例描述识别抗原特异性VH和VL基因并且将它们配对以生产所期望的高亲和性抗体的生物信息学方法。
[0421] 发明人发现系统进化分析(更具体地分簇分析)可被用于帮助识别所期望的抗原特异性V基因。由大的样品尺寸提供的高分辨率可帮助识别亲和性突变过程中从高水平的无性系超变所获得的抗原特异性单克隆抗体。形成用于识别作为在免疫之后发生的最近的克隆扩张的结果生成的抗体的另外的过滤器。高度相关的序列可以是单个CDR3组中的无性系变体或者CDR3组中的无性系变体(例如CDR3自身中的体细胞超变)。通过识别多个淋巴群(骨髓、脾、淋巴结和PBMC)中高度相关的序列的簇,形成最近的克隆扩张和亲和性突变的清楚的图片。这些事件表明最近的抗原特异性响应并且可帮助分离单克隆抗体序列,尤其是在谱极性低的情况下。
[0422] 使用多重序列比对和系统进化分析的谱分簇。有多个计算机程序可用于多重序列比对,但是大部分受限于可比对的数据集的大小。MUSCLE或经由Log Expectation的多重序列比较理想地适于极其大的数据集并且被选用于比对VH和VL谱,取决于可用的读段数目其常常具有几千个以上独有的氨基酸序列。如实施例9中所描述的加工未加工的454测序数据以产生经由同源性驱使的基序搜索所对比的序列。为了确保仅分析接近全长的VH和VL序列,应用一系列过滤器除去高度截短的序列和包含终止子的那些。例如,VH过滤器包括下列标准:1)全长≥100个残基、2)FR4长度≥2个残基、3)不包含终止子的序列以及和4)具有至少2个读段(去除独有序列误差)的独有序列(如CDR1至CDR3所定义的)。将这些过滤器应用于比对兔CCH1 VH的PC-V数据集(>30,000个识别的VH氨基酸序列)将数据限制在~5000个独有氨基酸序列。这5000个氨基酸序列通过FASTA格式中的丰度来注释(例如最富有的独有氨基酸序列名为1)并且用使用对缺口和缺口扩展罚分的默认参数以及默认的得分矩阵的MUSCLE进行比对。通过MUSCLE产生的比对之后通过三种建造软件加工为簇序列。在ClustalX中,使用邻接法生成Phylip树文件。之后使用Dendroscope分析并处理树文件(Huson,2007)。在Dendroscope中,搜索树并且迅速识别同样位于树的高度分叉的分支中的那些所注释的高丰度序列是容易的。软件同样是非常交互的,因此你之后可以选择大簇序列并且输出进行Microsoft Excel中所注释的数据的检测。表33显示如上文所描述的使用分簇分析从兔CCH1 PBMC识别的VH序列的簇。表34提供通过显示在骨髓和血液群两者中识别的簇的无性系变体的颜色编码比较的PC-V(来自骨髓)和tLT-V(来自PBMC)数据中的CDRH3丰度。PBMC和BMPC两者中都存在具有相似CDRH3序列的大的相关簇。显示了非常富有的代表性的CDRH3。分簇分析同样识别中等富有(相对于代表性的CDRH3组)但是同样可能来自于抗原特异性克隆扩张的大簇序列。
[0423] 表33:通过分簇分析识别的独有的高度相关的PBMC无性系变体的簇
[0424]
[0425]
[0426] a#SM是使用IMGT HighV-Quest通过种系比对确定的无性系突变的数目。每个列出的CDRH3代表独有的无性系变体。一些无性系变体具有相同数目的无性系突变但是是不同的独有序列。
[0427] 表34:通过百分比PBMC(顶部)和百分比BMPC(底部)分选的CCH1 PBMC和BMPC中的CDRH3丰度。颜色编码符合表1。
[0428]
[0429]
[0430] 实施例15:兔和其他哺乳动物中抗体的蛋白质组识别和量化
[0431] 通过使用蛋白A小珠以及使用甘氨酸缓冲液pH2.5的洗脱的亲和层析分离如实施例6中所描述的来自于免疫动物的兔血清Ig蛋白。洗脱之后,将Ig蛋白溶液更换缓冲液至磷酸盐缓冲盐水。
[0432] 从使用体积排阻层析(SEC)与抗体共洗脱的痕量的兔血清白蛋白(RSA)分离蛋白A纯化的血清IgG蛋白。用Na-醋酸盐,pH5.0作为流动相而TSKgel G3000SWxl柱作为固定相(Tosoh Bioscience LLC)完成SEC。随后用固定化的木瓜蛋白酶(Pierce)消化样品以产生每个IgG分子两个FAB片段和一个Fc结构域。通过将消化溶液应用于蛋白A亲和柱以及如上文的洗脱从Fc片段分离FAB片段。在流过和清洗步骤中收集FAB片段。
[0433] 将纯化的FAB片段在新鲜配制的100mM酸钠pH10中的8M尿素溶液pH8.0中变性。加入97.5%v/v乙腈、2%v/v碘代乙醇、0.5%v/v三乙膦的混合物以减少并且烷基化Fab片段并且将样品于60℃孵育60分钟。之后使用真空蒸发离心将样品冷冻干燥并且重悬至2M尿素的终浓度。之后将样品经历胰蛋白酶的蛋白酶消化。使用测序级胰蛋白酶(Sigma)于37℃5小时以1∶50的胰蛋白酶∶蛋白比率完成蛋白水解裂解。用1%甲酸淬灭消化。为了除去杂质,将肽结合在C-18 Hypersep SpinTips(Thermo Scientific)上并且清洗并且在LC-MS/MS分析之前过滤通过10kDa Microcon YM-10离心过滤器(Amicon)。
[0434] 之后将肽在反相Zorbax C-18柱(Agilent)上用5%至38%乙腈、0.1%甲酸的梯度分离超过230分钟。将肽通过纳米电喷雾离子化直接洗脱至LTQ-Orbitrap质谱仪(Thermo Scientific)中。使用以100K的分辨率收集的母离子质谱(MS1)使得可以进行数据依赖性离子选择。选择具有已知的>+1电荷的离子用于CID裂解谱分析(MS2)以便降低强度,具有每MS1循环所选择的12个母离子的最大值。用为30秒钟两次MS2所选择的离子激活动态排出。从MS2选择洗脱30秒。
[0435] 在LC-MS/MS运行中识别为相应于来自重链和轻链的恒定区的肽的离子在随后的实验中从数据依赖性选择中排除以便增加对来自CDR3区的肽的选择。而且,除了全范围的m/z肽,还进行气体分馏以降低样品中优势肽的离子分离(sapreation),气体分馏具有i)300-800、ii)800-900和iii)900-1500的rn/z。这一程序改善了肽覆盖。
[0436] 使用作为Bioworks软件包(Thermo Scientific)的一部分的Sequest搜索算法针对包含通过如实施例6中所描述的V基因谱的NextGen测序获得的全V基因的数据库搜索LC-MS/MS数据。应用过滤器以确保如下的高置信度肽识别:ΔCN≥0.250;XCorr=+2、+3和≥+4个电荷的2.0、2.5和3.0;并且精确度≤10.0ppm。可选择地,用于质谱的其他无标记(Silva等人,2006b;Gygi等人,1999;Ross等人,2004)或基于同位素标记的定量方法可被用于在蛋白水平确定特异性CDR3家族的丰度。
[0437] 表35显示来自454测序cDNAV基因丰度数据的V,D和J家族丰度(即转录的丰度)和鸟枪MS蛋白质组数据(表35)。转录概况与蛋白质组数据相关,如肽计数所报道的。
[0438] 表35:来自转录数据和MS数据的D和J家族的丰度
[0439]家族 mRNA seq计数 MS肽计数
F_4(J) 987 264
F_2(J) 199 63
F_3(J) 87 38
F_6(J) 11 12
F_5(J) 8 4
8_1(D) 92 408
6_1(D) 80 120
2_1(D) 49 217
1_1(D) 45 190
4_2(D) 31 77
7_1(D) 10 34
4_1(D) 5 19
5_1(D) 2 5
3_3(D) 1 6
3_1(D) 0 0
1S40(V) 110 348
1S45(V) 102 420
1S47(V) 99 167
1S7(V) 44 244
1S21(V) 10 29
1S29(V) 9 5
[0440]
[0441] 在某些实施方案中,V基因基于CDR3家族的分组大大改善了肽数据集的量化。样品特异性蛋白序列数据库是从高通量V基因cDNA测序数据产生的。序列数据库是通过将V基因基于CDR3家族大大改善肽数据集的定量来分组而产生的。其向生物信息分析流水线引入了多个另外的步骤:(1)在进行鸟枪蛋白质组实验并且基于标准质谱分析流水线和样品特异性序列数据库识别肽之后,识别了与CDR3区重叠的肽。(2)将这些所观察到的肽对V基因cDNA定义的CDR3家族作图,以及(3)定义可归属于每个CDR3家族的光谱计数。
[0442] V基因的CDR3区和MS数据与FR4和CH1区的N-末端连接。在这一实例中使用作为Bioworks软件包(Thermo Scientific)的一部分的Sequest搜索算法针对包含分组的CDR3序列的数据库搜索LC-MS/MS数据。应用过滤器以确保如上文所提及的高置信度的肽识别。
[0443] 将从似鲍岩螺(Concholepas concholepas)血蓝蛋白(CCH)免疫的兔CCH1分离的FAB中识别的肽的总数与反应各个V基因的转录物丰度的VH cDNA数据谱相比较。一旦所识别的肽唯一地拟合于来自测序数据的CDR3(表36下划线的文本),显示来自转录物序列的相应的CDR3。一旦所识别的肽与CDR3区中的胰蛋白酶消化位点一致,则没有来自序列数据的独有的相应的CDR3被显示(因为CDR3片段相应于多个序列)。这是因为CDR3区中Lys或Arg氨基酸的存在导致胰蛋白酶消化之后的短肽(表36,加粗的文本)。如所期望的。这一实施例中所识别的最富有肽与骨髓细胞表达的最富有VH基因转录物不相关,因为后者仅反映转录和蛋白合成的快照。然而,抗体在循环系统中以对于IgG约14天的t1/2持续。来自显示中等转录水平但是在MS肽计数中仍然高度表现的“衰退”浆细胞的推断的抗体在表36中通过下划线标记。
[0444] 表36:通过总骨髓谱的NextGen测序确定的CDR3VH基因序列丰度(频率分级)的实例和从计算通过MS识别的CDR3肽所推断的血清中各个抗体的相应丰度
[0445]
[0446]
[0447]
[0448]
[0449]
[0450]
[0451]
[0452]
[0453] ***
[0454] 可进行并执行本文公开和要求的所有方法无需根据本发明内容的过度实验。当本发明的组合物和方法已经以优选的实施方案的方式描述时,对于本领域技术人员来说明显的是可将变化应用于本文所描述的方法以及方法的步骤或步骤的顺序中而不背离本发明的概念、精神和范围。更详细地,化学和生理上都相关的某些剂可取代本文中所描述的某些剂同时获得相同或者相似的结果是显而易见的。对于本领域的技术人员来说是明显的所有这些相似的取代和修改被认为在由所附的权利要求所定义的本发明的精神、范围和概念中。
[0455] 参考文献
[0456] 下列参考文献以它们为本文所展示的那些提供示例性程序或其他细节补充的程度通过引用特别并入本文。
[0457] 美国专利4,683,202
[0458] 美国专利5,302,523
[0459] 美国专利5,322,783
[0460] 美国专利5,384,253
[0461] 美国专利5,384,253
[0462] 美国专利5,464,765
[0463] 美国专利5,538,877
[0464] 美国专利5,538,880
[0465] 美国专利5,550,318
[0466] 美国专利5,563,055
[0467] 美国专利5,580,859
[0468] 美国专利5,589,466
[0469] 美国专利5,610,042
[0470] 美国专利5,656,610
[0471] 美国专利5,702,932
[0472] 美国专利5,736,524
[0473] 美国专利5,780,448
[0474] 美国专利5,789,215
[0475] 美国专利5,928,906
[0476] 美国专利5,945,100
[0477] 美国专利5,981,274
[0478] 美国专利5,994,624
[0479] Ausubel 等 人, 于:Current Protocols in Molecular Biology,Greene Publishing Associates和Wiley Interscience,N.Y.,1994.
[0480] Bhattacharya和Cheah,J.Immunol.,179:6808-6819,2007.
[0481] Boyd等人,Sci.Transl.Med.,1:12ra23,2009.
[0482] Brochet等人,Nucleic Acids Res.,36:W503-508,2008.
[0483] Carbonelli等人,FEMS Microbiol.Lett.,177(1):75-82,1999.
[0484] Carlson,Nat.Biotechnol.,27:1091-1094,2009.
[0485] Chen和Okayama,Mol.Cell Biol.,7(8):2745-2752,1987.
[0486] Clackson等人,Nature,352:624-628,1991.
[0487] Cocea,Biotechniques,23(5):814-816,1997.
[0488] Cox等人,Protein Sci.,16:379-390,2007.
[0489] EP 171496
[0490] EP 173494
[0491] EP 194276
[0492] EP 239400
[0493] Fechheimer等人,Proc Natl.Acad.Sci.USA,84:8463-8467,1987.
[0494] Feldhaus等人,Nat.Biotechnol.,21:163-170,2003.
[0495] Fox等人,Methods Mol.Biol.,553:79-108,2009.
[0496] Fraley等人,Proc.Natl.Acad.Sci.USA,76:3348-3352,1979.
[0497] Gao等人,Nucleic Acids Res.,31:e143,2003.
[0498] Ge等人,Biotechnol.Bioeng.,106:347-357,2010.
[0499] Glanville等人,Proc.Natl.Acad.Sci.USA,106:20216-20221,2009.
[0500] Gopal,Mol.Cell Biol.,5:1188-1190,1985.
[0501] Graham和Van Der Eb,Virology,52:456-467,1973.
[0502] Gygi等人,Nat.Biotechnol.,17(10):994-999,1999.
[0503] Harland和Weintraub,J.Cell Biol.,101(3):1094-1099,1985.
[0504] Harlow和Lane,于:Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY,346-348,1988.
[0505] Harvey等人,Proc.Natl.Acad.Sci.USA,101:9193-9198,2004.
[0506] Hayhurst等人,J.Immunol.Methods,276:185-196,2003.
[0507] Hoogenboom,Nat.Biotechnol.,23:1105-1116,2005.
[0508] Hosse等人,Protein Sci.,15:14-27,2006.
[0509] Hu等人,J.Mass.Spectrom.,40:430-443,2005.
[0510] Hunt等人,Proc.Natl.Acad.Sci.USA,83:6233-6237,1986.
[0511] Ishihama等人,Mol.Cell Proteomics,4:1265-1272,2005.
[0512] Jackson等人,Adv.Immunol.,98:151-224,2008.
[0513] Jin等人,Nat.Med.,15:1088-1092,2009.
[0514] Kaeppler等人,Plant Cell Rep.,8:415-418,1990.
[0515] Kaneda等人,Science,243:375-378,1989.
[0516] Kato等人,J.Biol.Chem.,266:3361-3364,1991.
[0517] Keller等人,Anal.Chem.,74:5383-5392,2002.
[0518] Kohler和Milstein,Nature,256:495-497,1975.
[0519] Krebber等人,J.Immunol.Methods,201:35-55,1997.
[0520] Krebber等人,J.Immunol.Methods,201:35-55,1997.
[0521] Kretzschmar和von Ruden,Curr.Opin.Biotech.,13:598-602,2002.
[0522] Kwakkenbos等人,Nat.Med.,16:123-128,2010.
[0523] Lanzavecchia和Sallusto,Curr.Opin.Imnunol.,21:298-304,2009.
[0524] Levenson等人,Hum.Gene Ther.,9(8):1233-1236,1998.
[0525] Link等人,Nat.Biotechnol.,17:676-682,1999.
[0526] Liu等人,Anal.Chem.,76:4193-4201,2004.
[0527] Love等人,Nat.Biotechnol.,24:703-707,2006.
[0528] Lu等人,Nat.Biotechnol.,25:117-124,2007.
[0529] Malmstrom等人,Nature,460(7256):762-5,2009.
[0530] Maniatis,等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,1988.
[0531] Manz等人,Annu.Rev.Immunol.,23:367-386,2005.
[0532] Manz等人,Nature,388:133-134,1997.
[0533] Marcotte,Nat.Biotechnol.,25:755-757,2007.
[0534] Mazor等人,J.Immunol.Methods,321,41-59,2007.
[0535] Mazor等人,Nat.Biotechnol.,25:563-565,2007.
[0536] Meijer,P.-J.等人,J.Molec.Biol.,358:764-772,2006.
[0537] Nesvizhskii等人,Anal.Chem.,75:4646-4658,2003.
[0538] Nicolau和Sene,Biochim.Biophys.Acta,721:185-190,1982.
[0539] Nicolau等人,Methods Enzymol.,149:157-176,1987.
[0540] Ong和Mann,Nat.Chem.Biol.,1:252-262,2005.
[0541] Pandey和Mann,Nature,405:837-846,2000.
[0542] PCT Appln.WO 89/01782
[0543] PCT Appln.WO 89/01974
[0544] PCT Appln.WO 89/02465
[0545] PCT Appln.WO 94/09699
[0546] PCT Appln.WO 95/06128
[0547] Phan等人,J.Exp.Med.,203:2419-2424,2006.
[0548] Potrykus等人,Mol.Gen.Genet.,199(2):169-177,1985.
[0549] Potrykus等人,Mol.Gen.Genet.,199:183-188,1985.
[0550] Radbruch等人,Nat.Rev.Immunol.,6:741-750,2006.
[0551] Rajewsky,Nature,381:751-758,1996.
[0552] Rippe,等人,Mol.Cell Biol.,10:689-695,1990.
[0553] Ross等人,Mol.Cell Proteomics,3(12):1154-69,2004.
[0554] Sambrook和Russell,分子克隆:实验室手册,第三版,Cold Spring Harbor Laboratory,N.Y.,1989.
[0555] Schaffitzel等人,J.Immunol.Meth.,231:119-135,1999.
[0556] Scheid等人,Nature,458:636-640,2009.
[0557] Shapiro-Shelef和Calame,Nat.Rev.Immunol.,5:230-242,2005.
[0558] Shendure和Ji,Nat.Biotechnol.,26:1135-1145,2008.
[0559] Shevchenko等人,Proc.Natl.Acad.Sci.USA,93:14440-14445,1996.
[0560] Silva等人,Mol.Cell Proteomics,5(4):589-607,2006b.
[0561] Silva等人,Mol.Cell Proteomics,5:144-156,2006a.
[0562] Smith等人,Nat.Protoc.,4:372-384,2009.
[0563] Tatusova等人,FEMS Microbiol Lett.,174(2):247-50,1999.
[0564] Traggiai,E.等人,Nat.Med.,10:871-875,2004.
[0565] Vogel和Marcotte,Nature Protocols,3:1444-1451,2008.
[0566] Washburn等人,Nat.Biotechnol.,19:242-247,2001.
[0567] Weinstein等人,Science,324:807-810,2009.
[0568] Wong等人,Gene,10:87-94,1980.
[0569] Wrammert等人,Nature,453:667-671,2008.
[0570] Zahnd等人,Nat.Methods,4:269-279,2007.
QQ群二维码
意见反馈