首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 集合及其使用方法

集合及其使用方法

申请号 CN201080022793.7 申请日 2010-05-29 公开(公告)号 CN102449149B 公开(公告)日 2014-04-23
申请人 莫佛塞斯公司; 发明人 马库斯·恩泽尔伯格; 乔瑟夫·普拉斯勒; 斯特法妮·尤林格; 塔贾·赫尔曼; 托马斯·蒂勒;
摘要 本公开内容使得鉴定人免疫组库中的VH和VL类对、确定最普遍的VH和VL类对和具有有利的 生物 物理特性的VH和VL类对的方法成为可能。更具体而言,本公开内容的集合包括具有高度多样化的CDR的最普遍的和/或最优选的VH和VL类 配对 。
权利要求

1.合成抗体或其功能片段的集合,所述合成抗体或其功能片段包含可变重链构架区和可变轻链构架区,
其中所述可变重链构架区和所述可变轻链构架区由种系蛋白对的种系蛋白序列组成,其中所述种系蛋白对包含如下特性:
i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达平;
iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性
iv)以Fab形式在37℃持续大于十天的在血清或小鼠血清中的稳定性;
v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
vi)以IgG形式在37℃持续十四天的在血清中的稳定性;
其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对的种系蛋白序列,并且
其中所述种系蛋白对由种系基因对编码,其中所述种系蛋白对选自由以下组成的组:
IGHV1-18/IGKV1-05;IGHV1-18/IGLV2-23;IGHV1-46/IGKV1-09;IGHV1-46/IGKV1-39;
IGHV1-46/IGKV3-15;IGHV1-69*01/IGKV1-05;IGHV3-07/IGKV1-09;IGHV3-07/IGKV1-12;
IGHV3-07/IGKV1-27;IGHV3-07/IGKV3-15;IGHV3-07/IGLV1-47;IGHV3-07/IGLV2-23;
IGHV3-07/IGLV3-01;IGHV3-11/IGKV1-05;IGHV3-11/IGKV1-06;IGHV3-11/IGKV1-12;
IGHV3-11/IGKV1-16;IGHV3-11/IGKV3-15;IGHV3-11/IGLV1-47;IGHV3-11/IGLV2-23;
IGHV3-15/IGKV1-05;IGHV3-15/IGKV1-06;IGHV3-15/IGKV1-09;IGHV3-15/IGKV1-12;
IGHV3-15/IGKV1-16;IGHV3-15/IGKV1-27;IGHV3-15/IGKV1-39;IGHV3-15/IGKV3-15;
IGHV3-15/IGLV1-40;IGHV3-15/IGLV1-51;IGHV3-15/IGLV2-11;IGHV3-21/IGKV1-06;
IGHV3-21/IGKV1-12;IGHV3-21/IGKV1-27;IGHV3-21/IGKV1-39;IGHV3-21/IGLV2-14;
IGHV3-21/IGLV2-23;IGHV3-30/IGLV2-23;IGHV3-30/IGLV3-1;IGHV3-33/IGKV3-15;
IGHV3-33/IGLV2-23;IGHV3-48/IGKV1-27;IGHV3-53/IGKV1-09;IGHV3-53/IGKV1-12;
IGHV3-53/IGLV1-51;IGHV3-53/IGLV2-23;IGHV3-53/IGLV3-1;IGHV3-74/IGKV1-06;
IGHV3-74/IGKV1-09;IGHV3-74/IGKV1-27;IGHV3-74/IGKV3-15;IGHV3-74/IGLV1-51;
IGHV4-04*03/IGLV2-23;IGHV4-04*03/IGLV3-1;IGHV4-04*03/IGLV3-21;IGHV4-39/IGLV2-14;IGHV4-39/IGLV3-1;IGHV5-51/IGKV1-09;IGHV5-51/IGLV2-23;IGHV5-51/IGLV3-1;IGHV6-1/IGKV1-06和IGHV6-1/IGLV2-23。
2.根据权利要求1所述的集合,其中所述种系基因对以至少0.05%的浓度存在于人免疫组库中。
3.根据权利要求2所述的集合,其中所述种系基因对以至少0.23%的浓度存在于人免疫组库中。
4.根据权利要求3所述的集合,其中所述种系基因对以至少0.51%的浓度存在于人免疫组库中。
5.根据权利要求1所述的集合,其中所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。
6.根据权利要求5所述的集合,其中所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。
7.根据权利要求6所述的集合,其中所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。
8.根据权利要求1所述的集合,其中所述抗体或其功能片段包括人序列。
9.根据权利要求1所述的集合,其中所述抗体或其功能片段的集合包括至少十七个不同的种系蛋白对的种系蛋白序列。
10.根据权利要求1所述的集合,其中所述抗体或其功能片段的集合包括至少10个不同的种系蛋白对的种系蛋白序列。
11.根据权利要求1所述的集合,其中所述抗体或其功能片段的集合包括至少20个不同的种系蛋白对的种系蛋白序列。
12.根据权利要求1所述的集合,其中所述抗体或其功能片段的集合包括至少30个不同的种系蛋白对的种系蛋白序列。
13.根据权利要求1所述的集合,其中所述抗体或其功能片段的集合包括至少40个不同的种系蛋白对的种系蛋白序列。
14.根据权利要求1所述的集合,其中所述抗体或其功能片段的集合包括至少50个不同的种系蛋白对的种系蛋白序列。
15.根据权利要求1所述的集合,其中所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。
16.根据权利要求15所述的集合,其中所述抗体或其功能片段包括含种系蛋白序列的FR1区、CDR1区、FR2区、CDR2区和FR3区。
17.根据权利要求1所述的集合,其中所述抗体或其功能片段包括选自由以下组成的组的FR4区:JH4、Jκ1和Jλ2/3。
18.根据前述权利要求1所述的集合,其中所述抗体或其功能片段包括多样化的HCDR3区。
19.根据权利要求1所述的集合,其中所述抗体或其功能片段包括多样化的LCDR3区。
4
20.根据权利要求1所述的集合,其中所述集合包括1×10 种抗体或其功能片段。
21.根据权利要求1所述的集合,其中所述种系蛋白对包括包含在采样的前60%Fab中的值的以Fab形式的相对展示率。
22.根据权利要求1所述的集合,其中所述种系蛋白对包括与FabVH1-69VLA_Vl1-40AYA相比至少0.6的以Fab形式的表达水平。
23.根据权利要求1所述的集合,其中所述种系蛋白对包括以Fab形式在70℃或更高温度持续至少45分钟的热稳定性
24.根据权利要求1所述的集合,其中所述种系蛋白对包括与MOR03080相比至少0.6的以IgG形式的表达水平。
25.根据权利要求1所述的集合,其中所述抗体的所述功能片段选自由Fab、F(ab')2、Fab’、Fv和scFv组成的组。
26.编码根据前述权利要求中任一项所述的集合的核酸的集合。
27.一种载体,所述载体包含权利要求26所述的核酸。
28.一种重组宿主细胞,所述重组宿主细胞包含权利要求26所述的核酸。
29.如权利要求28所述的重组宿主细胞,所述重组宿主细胞是原核的或真核的。
30.根据权利要求29所述的重组宿主细胞,所述重组宿主细胞是大肠杆菌(E.coli)或哺乳动物细胞。
31.一种生产根据权利要求1所述的合成抗体或其功能片段的集合的方法。
32.根据权利要求31所述的方法,其中所述生产的步骤还包括产生含可变重链构架区和可变轻链构架区的抗体或其功能片段的集合,
其中所述可变重链构架区和所述可变轻链构架区由种系蛋白对的种系蛋白序列组成,其中所述种系蛋白对包含如下特性:
i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性;且
其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对,其中所述种系蛋白对选自由以下组成的组:
IGHV1-18/IGKV1-05;IGHV1-18/IGLV2-23;IGHV1-46/IGKV1-09;IGHV1-46/IGKV1-39;
IGHV1-46/IGKV3-15;IGHV1-69*01/IGKV1-05;IGHV3-07/IGKV1-09;IGHV3-07/IGKV1-12;
IGHV3-07/IGKV1-27;IGHV3-07/IGKV3-15;IGHV3-07/IGLV1-47;IGHV3-07/IGLV2-23;
IGHV3-07/IGLV3-01;IGHV3-11/IGKV1-05;IGHV3-11/IGKV1-06;IGHV3-11/IGKV1-12;
IGHV3-11/IGKV1-16;IGHV3-11/IGKV3-15;IGHV3-11/IGLV1-47;IGHV3-11/IGLV2-23;
IGHV3-15/IGKV1-05;IGHV3-15/IGKV1-06;IGHV3-15/IGKV1-09;IGHV3-15/IGKV1-12;
IGHV3-15/IGKV1-16;IGHV3-15/IGKV1-27;IGHV3-15/IGKV1-39;IGHV3-15/IGKV3-15;
IGHV3-15/IGLV1-40;IGHV3-15/IGLV1-51;IGHV3-15/IGLV2-11;IGHV3-21/IGKV1-06;
IGHV3-21/IGKV1-12;IGHV3-21/IGKV1-27;IGHV3-21/IGKV1-39;IGHV3-21/IGLV2-14;
IGHV3-21/IGLV2-23;IGHV3-30/IGLV2-23;IGHV3-30/IGLV3-1;IGHV3-33/IGKV3-15;
IGHV3-33/IGLV2-23;IGHV3-48/IGKV1-27;IGHV3-53/IGKV1-09;IGHV3-53/IGKV1-12;
IGHV3-53/IGLV1-51;IGHV3-53/IGLV2-23;IGHV3-53/IGLV3-1;IGHV3-74/IGKV1-06;
IGHV3-74/IGKV1-09;IGHV3-74/IGKV1-27;IGHV3-74/IGKV3-15;IGHV3-74/IGLV1-51;
IGHV4-04*03/IGLV2-23;IGHV4-04*03/IGLV3-1;IGHV4-04*03/IGLV3-21;IGHV4-39/IGLV2-14;IGHV4-39/IGLV3-1;IGHV5-51/IGKV1-09;IGHV5-51/IGLV2-23;IGHV5-51/IGLV3-1;IGHV6-1/IGKV1-06和IGHV6-1/IGLV2-23。
33.根据权利要求32所述的方法,其中所述生产的步骤还包括如下步骤:
a)获得包括在人免疫组库中存在的可变重链和可变轻链种系基因对的数据;
b)鉴定包含如下特性的可变重链和可变轻链种系蛋白对:
i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
ii)与Fab pMx11_FH VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性;且
c)产生包含在步骤b)中鉴定的种系蛋白对的可变重链种系蛋白序列和可变轻链种系蛋白序列的抗体或其功能片段的集合。
34.根据权利要求33所述的方法,其中步骤b)还包括如下步骤:
ba)鉴定以至少0.05%的浓度存在于人免疫组库中的可变重链和可变轻链种系基因对;
bb)产生包含在步骤ba)中鉴定的种系蛋白对的抗体或其功能片段;和
bc)评估所述种系蛋白对的如下特性:
i)以Fab形式的相对展示率;
ii)以Fab形式的表达水平;
iii)以Fab形式在60℃或更高温度的热稳定性;
iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
v)以IgG形式的表达水平;和
vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
35.根据权利要求34所述的方法,其中步骤a)还包括如下步骤:
aa)从样品中分离人B细胞;
ab)从所述B细胞产生cDNA;
ac)PCR扩增来自所述B细胞的cDNA;
ad)对PCR产物测序;
ae)鉴定每种PCR产物的种系基因。
36.根据权利要求33所述的方法,其中产生集合的所述步骤还包括如下步骤:
ca)合成编码所述抗体或其功能片段的核酸;
cb)将所述核酸克隆到载体中;
cc)表达所述抗体或其功能片段。
37.根据权利要求32所述的方法,其中所述种系基因对以至少0.05%的浓度存在于人免疫组库中。
38.根据权利要求37所述的方法,其中所述种系基因对以至少0.23%的浓度存在于人免疫组库中。
39.根据权利要求38所述的方法,其中所述种系基因对以至少0.51%的浓度存在于人免疫组库中。
40.根据权利要求32所述的方法,其中所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。
41.根据权利要求40所述的方法,其中所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。
42.根据权利要求41所述的方法,其中所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。
43.根据权利要求32所述的方法,其中所述抗体或其功能片段包括人序列。
44.根据权利要求32所述的方法,其中所述抗体或其功能片段包括至少十七个不同的种系蛋白对的种系蛋白序列。
45.根据权利要求32所述的方法,其中所述抗体或其功能片段包括至少10个不同的种系蛋白对的种系蛋白序列。
46.根据权利要求32所述的方法,其中所述抗体或其功能片段包括至少20个不同的种系蛋白对的种系蛋白序列。
47.根据权利要求32所述的方法,其中所述抗体或其功能片段包括至少30个不同的种系蛋白对的种系蛋白序列。
48.根据权利要求32所述的方法,其中所述抗体或其功能片段包括至少40个不同的种系蛋白对的种系蛋白序列。
49.根据权利要求32所述的方法,其中所述抗体或其功能片段包括至少50个不同的种系蛋白对的种系蛋白序列。
50.根据权利要求32所述的方法,其中所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。
51.根据权利要求50所述的方法,其中所述抗体或其功能片段包括含种系蛋白序列的FR1、CDR1、FR2、CDR2和FR3。
52.根据权利要求32所述的方法,其中所述抗体或其功能片段包括选自由以下组成的组的FR4区:JH4、Jκ1和Jλ2/3。
53.根据权利要求32所述的方法,其中所述抗体或其功能片段包括多样化的HCDR3区。
54.根据权利要求32所述的方法,其中所述抗体或其功能片段包括多样化的LCDR3区。
4
55.根据权利要求32所述的方法,其中所述集合包括1×10 种抗体或其功能片段。
56.根据权利要求32所述的方法,其中所述种系蛋白对包括包含在采样的前60%Fab中的值的以Fab形式的相对展示率。
57.根据权利要求32所述的方法,其中所述种系蛋白对包括与Fab VH1-69VLA_Vl1-40AYA相比至少0.6的以Fab形式的表达水平。
58.根据权利要求32所述的方法,其中所述种系蛋白对包括以Fab形式在70℃或更高温度持续至少45分钟的热稳定性。
59.根据权利要求32所述的方法,其中所述种系蛋白对包括与MOR03080相比至少0.6的以IgG形式的表达水平。
60.根据权利要求32所述的方法,其中所述抗体的所述功能片段选自由Fab、F(ab')2、Fab’、Fv和scFv组成的组。

说明书全文

集合及其使用方法

[0001] 相关申请的交叉引用
[0002] 本申请要求2010年1月29日提交的美国临时申请系列第61/299,401号和2009年5月29日提交的美国临时申请系列第61/182,350号的权益,二者均通过引用整体并入本文。
[0003] 背景
[0004] 在尤其是治疗抗体领域中的药物研发上的进展正快速地使许多疾病的治疗成为可能和/或改进许多疾病的治疗。这些达到新颖的目标空间并提供新颖的作用机制的进展正日益改善患者的生活质量,甚至是患有最严重的和挑战性的疾病的患者。一般对于保健制度特别是患者来说的一个挑战是由这些药物进展赋予的新药的成本也在快速地增加。高成本是由于药物特别是抗体的研发所需的投资目前每种市售产品超过十亿美元。研发的高失败险和极长的研发时间线使得这些投资不可避免。从潜在治疗性抗体的鉴定时起直到它上市并可以使患者受益可能要超过十五年。从鉴定、临床前、临床到进入市场的每个研发阶段充满了挑战和风险。制药公司不断地审估以确定如何通过减少时间线和失败风险来减少研发成本,以使最有效的药品快速达到患者手中,并使他们负担得起。
[0005] 以下公开内容提供了允许更快地鉴定用于治疗可以说任何疾病的最优治疗性抗体的一种有价值的进展。候选的治疗性抗体必须满足许多研发标准以使其上市,所述研发标准诸如长期稳定性和高表达产率。本公开的进展提高了鉴定直接从开始就满足所有的严格研发标准的抗体的概率和速度。由此得到的抗体将更廉价地生产并且在众多疾病的治疗上将是有效的且安全的。
[0006] 鉴定治疗性抗体的公知方法是通过使用噬菌体展示技术。噬菌体展示利用生长在细菌中的病毒样粒子来展示抗体。这种技术的一个益处是使用的文库是巨大的,具10
有高达1×10 种抗体,可以快速地测试这些抗体与任何疾病相关的任何靶的结合。见,例 如,Knappik等 人,(2000), ″ Fully synthetic human combinatorial antibody libraries(HuCAL)based on modular consensus frameworks and CDRs randomized with trinucleotides(基于模共有构架和以三个核苷酸随机化的CDR的全合成的人组合抗体文库(HuCAL)),″J.Mol.Biol.11;296(1):57-86。以这些大数目为研究对象的益处是对靶进行筛选的结果可产生数百种结合该治疗靶的抗体,所有这些抗体可能是治疗上相关的。但一个问题是,通常这些抗体中只有一些是可研发的,意味着它们能够满足所需的所有严格标准以使其上市。
[0007] 为了使新的噬菌体展示文库快速缩短鉴定时间线并减少内在风险,该文库应包括具有如下特性的抗体:所述特性对于选择和临床研发是必要的并且将在患者中产生安全且有效的治疗。这些特性包括:1)高噬菌体展示率,使得能够针对感兴趣的靶对该集合(collection)的每一种和每一个抗体进行测试;2)高表达平,使得抗体或片段可被高效地复制;3)高热稳定性,使得抗体能够以有效形式到达患者;4)在血清中的高稳定性,使得抗体能够在体内存活达治疗相关的时间;5)低免疫原性风险,从而提高安全性,以及5)高度多样性,使得可使用一个文库来鉴定针对任何治疗靶的抗体。
[0008] 以基本方式模拟人免疫系统的文库将是具有高度价值的,或甚至是最佳的解决办法。人免疫系统包括被种系基因编码的抗体。抗体在部分上包括可变重链和可变轻链。存在大约50种可变重链种系基因和大约50种可变轻链种系基因,合起来提供约2,500种不同的可变重链和可变轻链对的组合。在人中,认为所有这2500种组合被产生。但已发现,某些可变重链、可变轻链和/或可变重链和可变轻链组合(对)以比其他可变重链、可变轻链和/或可变重链和可变轻链组合(对)更高的水平表达。假设一定存在某些比另一些表达得更多的原因,且如果这样的话,假设高表达的种系基因可能具有有利的功能特性。因此,提供具有有利的功能特性的抗体文库的一种方式是产生包括来自免疫组库(immune repertoire)的丰富的可变重链、可变轻链和/或可变重链和可变轻链种系对的文库。
[0009] 此外,认为人存在的种系基因序列出于明显的原因具有非常低的免疫原性,因此可以在重组抗体中模拟这些序列以降低免疫原性风险。
[0010] 已从事了评估人免疫组库中普遍的可变重链和轻链种系基因配对的方法。见de Wildt等人,Analysis of heavy and light chain pairings indicates that receptor editing shapes the human antibody repertoire(重链和轻链配对的分析指示受体编辑(receptor editing)塑造人抗体谱),J Mol Biol.22;285(3):895-901(1999年1月),通过引用将其整体并入。Wildt等人从人供体采取血样,分选已经历体细胞超突变(somatic hypermutation)的IgG+B细胞,PCR扩增cDNA,对每个cDNA进行测序,并将每条序列与已知的人可变结构域种系基因进行比对。Wildt等人观察到,仅有一些种系基因占据免疫组库的优势地位,并且频繁表达的重链和轻链基因区段通常是成对的。
[0011] 还已尝试保持个体B细胞的重链和轻链可变结构域配对。例如,已公开可变结构域“同源对(cognate pair)”的文库。见Meijer等人,Isolation of human antibody repertoires with preservation of the natural heavy and light chain pairing(保存天然重链和轻链配对的人抗体谱的分离),J Mol Biol.,358(3):764-72(2006年5月5日);和WO2005042774。根据Meijer等人所述的技术的文库已从免疫过的宿主的个体B细HI胞产生。一般而言,通过FACS分选B细胞,以选择代表体细胞超突变细胞的CD38 B细胞,PCR扩增它们的cDNA,并且将该抗体基因产物插入Fab载体中以用于选择。这种同源对文库不是没有限制。例如,提供B细胞的宿主通常被免疫;并且分选的B细胞群已经被超突变,因此,得到的文库偏向于特定的免疫原。
[0012] 另外,已尝试利用突出的可变重链或可变轻链产生文库。例如,在Shi等人,“De Novo Selection of High-Affinity Antibodies from Synthetic Fab Libraries Displayed on Phage as pIX Fusion Proteins(在噬菌体上展示为pIX融合蛋白的来自合成的Fab文库的高亲和抗体的重新选择);J Mol Biol.,397(2):385-96(2010年3月26日)(不被认为是关于本发明现有技术)以及对应的专利申请WO2009085462;和WO2006014498中,根据可变重链或可变轻链种系蛋白序列在人免疫组库中的使用频率将它们掺入文库中。
[0013] 还进行了另外的尝试,该尝试将特异性种系对掺入文库中。例如,WO1999020749描述了一种文库,其中文库成员包括具有由人种系重链基因区段DP-47(IGHV3-23)编码的高变环和/或由该种系基因编码的构架区的规范结构的重链,和/或具有由人种系轻链基因区段O2/O12(IGKV1-39/1D-39)编码的高变环和/或由该种系基因编码的构架区的规范结构的轻链。
[0014] 另外的方法已产生直接来自B细胞或衍生自B细胞的文库。例如,Glanville等人,Precise Determination of the Diversity of a Combinatorial Antibody Library Gives Insight into the Human Immunoglobulin Repertoire(组合抗体文库的多样性的准确测定给予了对人免疫球蛋白谱的深入了解),Proc Natl Acad Sci 1;106(48):20216-21(2009年12月)(不被认为是关于本发明的现有技术),描述了由654种人供体免疫球蛋白M(IgM)谱的多样性构建的抗体文库。具体而言,对来自654个人类供体的重链和轻链V基因cDNA分别进行PCR扩增(分离可变重链和轻链对),然后将这些重链和轻链结构域随机地重新关联。WO2003052416描述了从显示对感兴趣的病原体明显响应的宿主分离B细胞,这些病原体产生于被生物感染或用疫苗治疗。在WO2003052416中,对编码可变区的CDR3区的cDNA进行测序,并且设计包含优势CDR3的抗体片段。WO2009100896描述了从免疫的宿主分离B细胞,其中对编码可变重链区和可变轻链区的cDNA进行测序,并且确定未配对的可变重链和可变轻链序列的丰度。在WO2009100896(不被认为是关于本发明的现有技术)中,合成包括随机重组的可变重链和可变轻链的文库,其中抗体是对一种免疫原特异的。这些方法和其他方法的概述见于Fuh等人,Synthetic antibodies as therapeutics(作为疗法的合成抗体),Expert Opin Biol Ther.,7(1):73-87(2007年1月)。
[0015] 因此,对于掺入在人免疫组库中表达的具有有利的生物物理特性的可变重链和可变轻链种系基因对的抗体或其片段的集合存在高度需求,所述有利的生物物理特性产生在患者中安全且有效的容易开发的抗体。本发明满足了这些需求和其他需求。
[0016] 概述
[0017] 本公开内容对有效地鉴定针对任何靶的可开发的且在患者中安全和有效的抗体的问题提供了有价值的解决办法。从最一般的意义上讲,发明人开始于如下想法:以基本方式模拟人免疫系统的抗体文库可能是有利的。一方面,发明人决定通过将来自人免疫组库的最佳种系基因序列掺入抗体中来模拟人免疫系统。这样,在一些实施方案中,文库的抗体包括序列上为种系的部分,例如构架区。使用种系序列将显著地降低在患者中治疗性使用的重组抗体的免疫原性风险。
[0018] 此外,发明人根据其如下假设而研究:在人免疫组库中富含的可变重链和可变轻链种系基因对可能具有有利的生物物理特性,将导致更有效率的临床研发,提高得到的抗体在患者中的安全性和效力。作为背景,每个B细胞编码一种抗体,并且每种抗体包含可变重链和可变轻链。可将抗体的可变重链和可变轻链中的每一个与种系序列比对以确定抗体的起源,意味着可变重链和可变轻链由哪些种系基因编码。因此,对于每种抗体来说,可变重链和可变轻链构成种系对,例如,VH3-23与VK1-5配对。
[0019] 为了证实突出的种系基因对可能具有有利的生物物理特性的假设,第一步是鉴定存在于人免疫组库中的可变重链和可变轻链种系基因对。这是通过广泛地查找公开可用的文献并通过从人宿主中对B细胞采样而完成。下一步,汇集、分析原始数据,并根据发生率对存在于人免疫组库中的可变重链和可变轻链种系对进行分级。从这个数据很清楚的是,某些可变重链和可变轻链种系基因对比其他种系对更频繁地存在于人免疫组库中。
[0020] 另外,发明人认为某些可变重链和可变轻链种系基因对在幼稚B细胞(未经历抗原的)与经历抗原的B细胞中可差异地表达,因此,基于采样的B细胞的发育或分化来分析汇集数据。从我们的分析很清楚的是,某些种系基因对在幼稚B细胞群与经历抗原的B细胞群中差异地表达。
[0021] 下一步,必须确定要测试哪些种系蛋白对,因为在人免疫组库中存在约2500对。一种方式是测试最突出地出现在人免疫组库中的可变重链和可变轻链种系蛋白对,例如,见表18。人们可例如选择前四百对用于测试,或者选择表达高于某个阈值浓度的可变重链和可变轻链种系基因对。这种方法将需要合成和测试大量可变重链和可变轻链种系蛋白对序列;因此,这种方法可能不是非常有效率的。
[0022] 作为一种可选的方法,发明人选择了代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对的一小组可变重链和可变轻链种系对。这种方法部分上基于如下观察结果:少量可变重链、可变κ轻链和可变λ轻链种系基因在人免疫组库中占优势。Wildt等人在895-896页描述了这种现象。Wildt等人还说明频繁表达的重链和轻链基因区段通常是成对的,并且观察到采样的一半配对仅对应于五个种系对。因此,可以联合少量的突出表达的重链和轻链种系基因(未成对的)以产生一组代表人免疫组库的对。
[0023] 这种方法以下列方式进行。分析汇集数据和另外的数据(仅鉴定VH或VL的表达而不是关联对的表达)来确定在人免疫组库中可变重链、可变κ轻链和可变λ轻链的种系基因表达。下一步,评估突出表达的可变重链、可变κ轻链和可变λ轻链种系蛋白序列(不是对)以确定其与研发相关的生物物理特性。经由计算机模拟(in silico)评估了可变重链、可变κ轻链和可变λ轻链种系蛋白序列的以下特性:(i)CDR长度,(ii)等电点(pI)(优选的等电点是8或以上,因为这将提供在中性配制缓冲液中的稳定性),(iii)翻译后修饰(PTM)(具体地说,N连接的糖基化位点(NxS或NxT)或化学修饰如Asp切割(通常在DP)),(iv)Asp异构化(DD,DG),(v)脱酰胺作用(NS,NG)(这可在体内(在血清中)或在储存时在配制缓冲液中发生并且导致抗体结合的丧失),(vi)在CDR中甲硫酸的存在(当暴露于溶剂时可被化),(vii)未成对的半胱氨酸的存在(将与任何其他未成对的半胱氨酸形成二硫键,由此导致蛋白的交联和/或较低的表达水平),(viii)偏离种系,(ix)潜在的T细胞表位的存在,以及(x)理论上的聚集倾向。
[0024] 下一步,组合具有有利的生物物理特征的可变重链、可变κ轻链和可变λ轻链种系对以形成可变重链和可变轻链对。如表23所示,这一小组的对代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对。这是通过如下方式完成的:合成可变重链和可变轻链种系基因、将它们组合成对、将这些对表达成蛋白并测试每种蛋白来鉴定这些对的生物物理特性。测试了以下特性:(i)在噬菌体上以Fab形式的相对展示率,(ii)以Fab形式的相对表达水平,例如,在大肠杆菌中;(iii)以Fab形式的热稳定性;(iv)以Fab形式在血清或小鼠血清中的稳定性;(v)以IgG形式的相对表达水平;(vi)以IgG形式在牛血清中的稳定性。
[0025] 鉴定具有有利的生物物理特性的种系蛋白对后,将集合设计成包括这些对。本公开内容的一个方面是如下抗体或功能片段的集合:所述抗体或功能片段包括具有增强可研发性(developability)的有利特性的可变重链和轻链种系基因对,但不包括不具有这些特性的可变重链和轻链种系基因对,即使不具有这些特性的可变重链和轻链种系基因对被突出地表达在人免疫组库中。以这种方式,将集合设计成不包括自然存在的(在2,500对中)不具有有利的功能特性的可变重链和轻链的组合或对。例如,VH4-34是人免疫组库中频繁出现的,如表20所示,但是还已知源自这种重链种系基因的抗体对B细胞有细胞毒性,因此源自这种基因的抗体可从文库设计中排除。见Bhat等人,Rapid cytotoxicity of human B lymphocytes induced by VH4-34(VH4.21)gene-encoded monoclonal antibodies(由VH4-34(VH4.21)基因编码的单克隆抗体诱导的人B淋巴细胞的快速细胞毒性),Clin Exp Immunol.,105(1):183-90(1996年7月)。
[0026] 在一些实施方案中,本发明的集合包括含大量功能上有利的可变重链和可变轻链的组合或对的抗体,以致这些集合的抗体十分多样,从而提供可用于鉴定针对任何治疗靶的抗体的集合。
[0027] 这些集合克服了现有技术的许多问题。例如,源自B细胞的同源文库没有加入这个概念,因为在这种文库中存在的VH和VL类配对与在B细胞样品中存在的类配对相同。如果取得足够大的B细胞样品,近似50个VH和50个VL的类配对组合(2500)中的每一个都将存在。在本公开内容中VH和VL对的广泛测试显示许多VH和VL种系基因对没能具有容许在临床上的可研发性的特性。因此,这种同源文库包括可能不可开发的许多VH和VL对。因此,产生只包括具有有利的功能特性的VH和VL类对的大多样性的文库可能是令人期望的,但是对于同源文库方法,这是不能的。
[0028] 此外,在一些实施方案中,包含在集合中的种系基因对是基于幼稚B细胞或未经历抗原的B细胞的样品,因此,所代表的种系基因对不偏向于特定的免疫原,并且这些集合可能在针对任何免疫原进行筛选上是优秀的。
[0029] 附图描述
[0030] 图1显示在周质提取具有VH3-23重链(上图)和VH1-69重链(下图)的抗体后的抗-Fd表达ELISA的结果,每种抗体带有三种修饰的phoA信号序列之一,所述修饰的phoA信号序列相比于野生型(TKA)信号序列包括C端限制酶切位点AflII(VLS)、NheI(VLA)和AvrII(VLG)。在VH3-23组中,所有修饰的phoA信号序列保持了野生型(TKA)范围内的表达水平。
[0031] 图2显示了在周质提取具有VK1-39轻链(左上图)、VK3-11轻链(右上图)、VL1-40轻链(左下图)和VL3-1轻链(右下图)的抗体后的抗-Fd表达ELISA的结果,每种抗体带有三种修饰的ompA信号序列之一,所述修饰的ompA信号序列相比于野生型(AQA)信号序列包括C端限制酶切位点NdeI(AYG)、NdeI(AYA)和BsiWI(TYA)。使用Vκ和VλFab片段二者测试了包括C端限制酶切位点的修饰的ompA信号序列和野生型信号序列。包括NdeI(AYA)的信号序列始终显示与野生型(AQA)一样好或更好的表达。
[0032] 图3显示了如实施例1-1.3中详述的被选择用于掺入phoA和ompA大肠杆菌信号序列的C端中的限制酶切位点,并且包括CDR 3周围的信号序列及其各自的取向。这幅图在展示大肠杆菌信号序列的同时还表示如实施例1.5中详述的选择用于在IgG表达中使用的人重链和κ链前导序列中掺入的C端限制酶切位点。
[0033] 图4-9显示在Tsuiji M.等人(2006)中分离并描述的B细胞的VH/VL种系基因对。
[0034] 图10-12显示在Tiller T.等人(2007)中分离并描述的B细胞的VH/VL种系基因对。
[0035] 图13-17显示在Mietzner B.等人(2008)中分离并描述的B细胞的VH/VL种系基因对。
[0036] 图18-20显示在Wardemann H.等人(2003)中分离并描述的B细胞的VH/VL种系基因对。
[0037] 图21-23显示在Yurasov S.等人(2005)中分离并描述的B细胞的VH/VL种系基因对。
[0038] 图24-26显示在Yurasov S.等人(2006)中分离并描述的B细胞的VH/VL种系基因对。
[0039] 图27显示用于扩增分离自人宿主的单个分选的成熟的幼稚B细胞(mn)和抗体分泌细胞(asc)的cDNA的PCR策略,如实施例2.2中详述的。
[0040] 图28-36显示如实施例2.2中详述的分离自人样品的B细胞的VH/VL对。
[0041] 图37显示选择用于合成、组合和功能表征的20种VH种系基因,如实施例4-4.1详述的。该图还显示每种种系基因经由计算机模拟分析的结果,其中pI代表等电点,PTM是如本文所述的互补决定区中的翻译后修饰,NxS/T是N连接的糖基化位点,并且在CDR中的Met是甲硫氨酸。
[0042] 图38显示选择用于合成、组合和功能表征的8种Vλ和12种Vκ种系基因,如实施例4-4.1详述的。该图还显示每种种系基因的经由计算机模拟分析的结果,其中pI代表等电点,PTM是如本文所述的互补决定区中的翻译后修饰,NxS/T是N连接的糖基化位点,并且在CDR中的Met是甲硫氨酸。
[0043] 图39显示了来自示于图4-26的实施例2.1和示于图28-36的实施例2.2的汇集数据的VH/Vκ对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/Vκ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGKV3-20)到右(IGKV1D-17)排序的Vκ种系基因。数字1358是采样的B细胞数目。
[0044] 图40显示了来自示于图4-26的实施例2.1和示于图28-36的实施例2.2的汇集数据的VH/Vλ对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/Vλ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGLV2-14)到右(IGLV4-60)排序的Vλ种系基因。数字779是采样的B细胞数目。
[0045] 图41显示了来自示于图4-26的实施例2.1和示于图28-36的实施例2.2的汇集数据的VH/Vκ对,但仅包括未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞的未经历抗原的B细胞群以鉴定在幼稚的人免疫组库中突出的VH/Vκ对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/VL种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGKV3-20)到右(IGKV1D-17)排序的Vκ种系基因。数字888是采样的B细胞数目。
[0046] 图42显示了来自示于图4-26的实施例2.1和示于图28-36的实施例2.2的汇集数据的VH/Vλ对,但仅包括未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞的未经历抗原的B细胞群以鉴定在幼稚的人免疫组库中突出的VH/Vλ对。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/Vλ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGLV2-14)到右(IGLV4-60)排序的Vλ种系基因。数字457是采样的B细胞数目。
[0047] 图43显示了来自示于图4-26的实施例2.1和示于图28-36的实施例2.2的汇集数据的VH/Vκ对,但仅包括IgG抗体分泌细胞以及IgM和IgG记忆性B细胞的经历抗原的B细胞群。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/Vκ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGKV3-20)到右(IGKV1D-17)排序的Vκ种系基因。数字470是采样的B细胞数目。
[0048] 图44显示了来自示于图4-26的实施例2.1和示于图28-36的实施例2.2的汇集数据的VH/Vλ对,但仅包括IgG抗体分泌细胞以及IgM和IgG记忆性B细胞的经历抗原的B细胞群。数字条目代表汇集数据中鉴定的来自个体B细胞的每个VH/Vλ种系基因对的数目。Y轴显示根据汇集数据中的表达频率从顶部(VH3-23)到底部(VH3-20)排序的VH种系基因。X轴显示根据汇集数据中的表达频率从左(IGLV2-14)到右(IGLV4-60)排序的Vλ种系基因。数字322是采样的B细胞数目。
[0049] 图45A-C显示由VH种系基因编码的氨基酸序列,如在以下文献中所述:Tomlinson等 人,(1992),“The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop(人种系Vh序列的组库揭示大约五十组具有不同超变环的Vh区段)”J.Mol.Biol.227,776-798;Matsuda等 人 (1998),“The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus(人免疫球蛋白重链可变区基因座的完整核苷酸序列)”J Exp Med 188(11):2151-62;和LeFranc MP(2001)“Nomenclature of the human immunoglobulin heavy(IGH)genes(人免疫球蛋白重链(IGH)基因的命名).”Exp Clin Immunogenet.18(2):100-16。
[0050] 图46A-C显示了由Vκ种系基因编码的氨基酸序列,如在以下文献中所述:和Zachau(1993),“The variable genes of the human immunoglobulin kappa locus(人免疫球蛋白κ基因座的可变基因),”Biol.Chem Hoppe Seyler.374(11):
1001-22;Brensing-Küppers等人(1997),“The human immunoglobulin kappa locus on yeast artificial chromosomes(YACs)(在酵母人工染色体(YAC)上的人免疫球蛋白κ基因座)”Gene.191(2):173-81;Kawasaki等人(2001),“Evolutionary dynamics of the human immunoglobulin kappa locus and the germline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vκ基因的种系组库的进化动态)”Eur J Immunol
31(4):1017-28;和Lefranc MP(2001)″Nomenclature of the human immunoglobulin kappa(IGK)genes(人免疫球蛋白κ(IGK)基因的命名)″Exp Clin Immunogenet.,18,
161-174。
[0051] 图47A-B显示由Vλ种系基因编码的氨基酸序列,如在以下文献中所述:Kawasaki等人,(1997)“One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆基序列分析)”Genome Research 7(3):250-61;Frippiat等人,(1995)″Organization of the human immunoglobulin lambda light-chain locus on chromosome 22q11.2(在染色体22q11.2上的人免疫球蛋白λ轻链基因座的组织)″Hum.Mol.Genet.,4,983-991;和LeFranc MP(2001)″Nomenclature of the human immunoglobulin lambda(IGL)genes(人免疫球蛋白λ(IGL)基因的命名).Exp Clin Immunogenet.;18:242-254。
[0052] 图48显示pJPd1三顺反子(tricistronic)噬菌体展示载体。
[0053] 图49显示pJPx1 Fab表达载体。
[0054] 图50显示pMx11(pMORPHX11)Fab表达载体。
[0055] 图51显示pMORPH30Fab展示载体。
[0056] 图52显示pJP_h_IgG1f可变重链IgG表达载体。
[0057] 图53显示pJP_h_Ig_κ可变κ轻链IgG表达载体。
[0058] 图54显示pJP_h_Ig_λ2可变λ轻链IgG表达载体。
[0059] 图55显示测试的400个VH/VL种系基因对的相对Fab展示率。较高的数字指示较高的展示水平。
[0060] 图56显示测试的400个VH/VL种系基因对的相对Fab表达水平。较高的数字指示较高的Fab表达水平。
[0061] 图57显示以Fab形式的测试的400个VH/VL种系基因对的温度稳定性数据。数字60和70指示在测试的设置中在60℃或70℃稳定持续45min的VH/VL对。数字4指示温度不稳定的对并且bg指示低表达水平。
[0062] 图58显示以Fab形式的测试的400个VH/VL种系基因对在牛血清中的稳定性数据。S代表在测试的条件下稳定的并且U代表在测试的条件下不稳定的。
[0063] 图59显示以Fab形式的测试的400个VH/VL种系基因对在小鼠血清中的稳定性数据。S代表在测试的条件下稳定的并且U代表在测试的条件下不稳定的。
[0064] 图60显示测试的400个VH/VL种系基因对的相对IgG表达率。较高的数字指示较高的IgG1表达水平。
[0065] 图61显示以IgG形式的测试的400个VH/VL种系基因对的血清稳定性数据。S代表在测试的条件下稳定的并且U代表在测试的条件下不稳定的。
[0066] 详述
[0067] 定义
[0068] 为了使理解本发明容易,提供了以下定义和阐释。
[0069] 一般术语
[0070] 在数值和范围上下文中的术语“大约”或“近似”是指近似于或接近于使得本发明可按预期实行(诸如具有期望的序列同源性的数字或百分比)的所列的值或范围的值或范围,根据本文包含的教导这对于技术人员是清楚的。这至少部分上是由于可变的培养条件和生物系统的可变性。因此,这些术语涵盖超出系统误差产生的值的值。这些术语使隐含的东西明确。通常,“大约”涵盖陈述值的±10%。因此,术语“大约”可用来描述范围。
[0071] 在发明概述和发明描述中本文列出的所有范围包括关于该范围的数字或在该范围的数字之间的所有数字或值。本发明的范围明白地命名并列出在该范围中的所有整数、小数和分数值。
[0072] 术语“受治疗者”包括人和非人动物。非人动物包括所有脊椎动物,例如,哺乳动物和非哺乳动物,如非人灵长类、羊、狗、牛、鸡、两栖动物和爬行动物。除另外说明,术语“患者”或“受治疗者”在本文可互换使用。
[0073] 术语“治疗”包括施用组合物或抗体以阻止或延迟疾病的症状、并发症或生物化学标记(biochemical indicia)的发作,减轻症状或停止或抑制疾病、病症或疾患的进一步发展。因此,治疗涵盖但不限于“治愈”。治疗可以是预防性的(以阻止或延迟疾病的发作,或阻止或减缓临床症状或其亚临床症状的表现)或在疾病表现后治疗性的抑制或减轻症状。
[0074] 如本文所用的“数据库或可读介质”是指用于储存序列数据的任何格式以及由此的任何信息集合,如数据库文档、查找表、Excel电子表格等等。在某些实施方案中,数据库以电子形式存储,如计算机可读的存储装置。这包括介质,如服务器、客户端(client)、硬盘、CD、DVD、个人数字助理如Palm Pilot、磁带、zip盘、计算机内部ROM(只读存储器)或因特网或万维网。其他计算机可获取的用于存储文档的介质将对本领域技术人员是明显的。
[0075] “经由计算机模拟”是指在计算机上进行的操作、分析和设计,但还可以同样在纸上或通过心算进行。
[0076] 抗体及其特性
[0077] 如本文所用的术语“抗体”包括整个抗体。抗体可以是多克隆的、亲和力纯化的多克隆的、单克隆的、全人的、鼠的或啮齿动物的、嵌合的、骆驼的或人源化的抗体。抗体可属于任何的抗体类,如IgG、IgG1、IgG2、IgG3、IgG4、IgA(包括人亚类IgA1和IgA2)、IgD、IgE、IgG或IgM。天然存在的“抗体”是包括由二硫键相互连接的至少两条重(H)链和两条轻(L)链的糖蛋白。
[0078] 如本文所用的术语“其功能片段”包括任何抗原结合片段,如Fab、F(ab′)2、Fab’、Fv、scFv、包括Fc部分的单链、纳米抗体以及具有不同于可变构架区的支架的其他抗体样结构。术语“其功能片段”包括但不限于抗体的任何功能部分,其中功能包括免疫原的结合或效应子功能。
[0079] 如本文所用,术语“亲和力”是指在抗原位点处在抗体与抗原之间的相互作用的强度。在每个抗原位点之内,抗体“臂”的可变区通过非共价力与抗原在许多位点相互作用;相互作用越大,亲和力越强。如本文所用,术语抗体或其功能片段如IgG抗体的“高亲和力”-8 -9 -10 -11
是指抗体具有对靶抗原10 M或更低、10 M或更低、10 M或更低、或10 M或更低的KD。然而,“高亲和力”结合对于其他抗体同种型来说可能不同。例如,对于IgM同种型的“高亲和-7 -8
力”结合是指抗体具有10 M或更低、或10 M或更低的KD。
[0080] 如本文所用的术语“Kassoc”或“Ka”意指特定的抗体-抗原相互作用的缔合速率,而本文所用的术语“Kdis”或“Kd”意指特定的抗体-抗原相互作用的解离速率。如本文所用的术语“KD”意指解离常数,它由Kd与Ka的比(即Kd/Ka)获得并且被表示为摩尔浓度(M)。抗体的KD值可使用本领域充分确立的方法来确定。一种用于确定抗体KD的方法是通过使用表面等离子共振或使用生物传感器系统如Biacore 系统。
[0081] 术语“交叉阻断(cross-block)”、“交叉阻断的”和“交叉阻断了”在本文可互换使用,来表示在标准的竞争结合测定中抗体或其他结合剂干扰其他抗体或结合剂与相同的靶结合的能力。抗体或其他结合剂能够干扰另一种抗体或结合分子与相同的靶结合的能力或程度,以及因此是否可以根据本发明将其说成交叉阻断,可使用标准竞争结合测定法来确定。一种适合的测定包括Biacore技术的使用(例如,通过使用BIAcore 3000仪器(Biacore,Uppsala,Sweden)),该技术可利用表面等离子共振技术测量相互作用的程度。另一种测量交叉阻断的测定法利用基于ELISA的方法。
[0082] 术语“表位”表示能够特异性结合抗体的蛋白决定簇。表位通常由化学活性表面分类的分子如氨基酸或糖侧链组成,并且通常具有特定的三维结构特征以及特定的电荷特征。构象表位和非构象表位的差别在于在存在变性溶剂的情况下与前者的结合丧失,但与后者的结合没有。
[0083] 术语“嵌合抗体”是其中恒定区或其部分被改变、取代或交换以使得抗原结合位点(可变区)与具有不同或改变的类别、效应子功能和/或种类的恒定区连接的抗体分子。
[0084] 术语“同种型”是指由重链恒定区基因提供的抗体类(例如,IgM,IgE,IgG如IgG1或IgG4)。同种型还包括这些类之一的修饰形式,其中已作出修饰来改变Fc功能,例如,增强或减少效应子功能或与Fc受体的结合。
[0085] 术语“种系”表示从亲本到后代传下来的编码抗体或其功能片段的核酸序列。
[0086] 术语“种系蛋白序列”表示:a)由种系基因编码的抗体或其功能片段的可变区的氨基酸序列,b)由编码抗体或其功能片段的可变区的修饰的核酸序列所编码的氨基酸序列,所述抗体或其功能片段的可变区具有与由种系基因编码的抗体或其功能片段的可变区相同的氨基酸序列,其中所述核酸序列通过以下方式修饰:例如,密码子优化、期望的限制酶切位点的添加、优化的GC含量、不期望的剪接位点的去除或mRNA不稳定性基序的去除,或c)由种系基因编码的但在氨基酸序列中具有点突变的氨基酸序列,所述点突变诸如为了去除不期望的半胱氨酸,或引入期望的限制酶切位点例如BbsI,或产生于合成、扩增或克隆中的错误。
[0087] 术语“种系基因序列”表示:a)编码抗体或其功能片段的可变区的种系基因的核酸序列,或b)编码具有与由种系基因所编码的抗体的可变区相同的氨基酸序列的抗体或其功能片段的修饰的氨基酸序列,其中所述氨基酸序列通过以下方式修饰:例如,密码子优化、期望的限制酶切位点的添加、优化的GC含量、不期望的剪接位点的去除或mRNA不稳定性基序的去除。
[0088] 术语“种系基因对”表示编码抗体或其功能片段的可变重链和可变轻链的核酸序列及其对应的种系基因的对。例如,种系基因对可以是VH3-23/Vκ1-5,其中由VH3-23/Vκ1-5编码的抗体包括由种系基因VH3-23编码的可变重链或其部分以及由种系基因Vκ1-5编码的可变轻链或其部分。
[0089] 术语“种系蛋白对”表示如下抗体或其功能片段,其中可变重链或其部分以及可变轻链或其部分:a)各自由特定的种系基因编码,或b)各自由编码具有与由特定的种系基因编码的抗体的可变区相同的氨基酸序列的抗体或其功能片段的可变区的修饰的核酸序列编码,其中所述核酸序列通过以下方式修饰:例如,密码子优化、期望的限制酶切位点的添加、优化的GC含量、不期望的剪接位点的去除或mRNA不稳定性基序的去除,或c)各自包含由种系基因编码的但在氨基酸序列中具有点突变的氨基酸序列,所述点突变诸如为了去除不期望的半胱氨酸,或引入期望的限制酶切位点例如BbsI,或产生于合成、扩增或克隆中的错误。例如,种系蛋白对可以是由VH3-23/Vκ1-5编码的抗体或功能片段,其中该抗体包括由种系基因VH3-23编码的可变重链或其部分以及由种系基因Vκ1-5编码的可变轻链或其部分。“种系蛋白对”包括如在实施例5中所制备的构建体,所述构建体包括[0090] a)对于VH:前导序列(掺入如图3所示的NheI RE位点的修饰的phoA);种系FR1、CDR1、FR2、CDR2和FR3(掺入如图3所示的BssHII RE位点);如在Ewert S.等人,J.Mol.Biol.(2003)325,531-553中所用的4D5抗体的CDR-H3(WGGDGFYAMDY);以及JH4 FR4(掺入如图3所示的XhoI/SalI RE位点);
[0091] b)对于Vκ:前导序列(掺入如图3所示的NdeI RE位点的ompA);种系FR1、CDR1、FR2、CDR2和FR3(掺入如图3所示的BbsI RE位点);根据Ewert S.等人,J.Mol.Biol.(2003)325,531-553的κ样CDR-L3(QQHYTTPPT);以及Jk1 FR4(掺入如图3所示的KpnI RE位点);和
[0092] c)对于Vλ:前导序列(掺入如图3所示的NdeI RE位点的ompA);种系FR1、CDR1、FR2、CDR2和FR3(掺入如图3所示的BbsI RE位点);根据Ewert S.等人,J.Mol.Biol.(2003)325,531-553的λ样CDR-L3(QSYDSSLSGVV);以及Jl2/3 FR4(掺入如图3所示的KpnI RE位点)。
[0093] 这些构建体中的每一种被合成、表达并且如实施例6和7所述作为Fab和IgG测试了以下功能特性:a)在噬菌体产生和噬菌体ELISA之后以Fab形式的相对展示;b)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和产生的Fab的ELISA检测后的相对Fab表达水平;c)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和升高温度下孵育后非变性Fab的ELISA检测后Fab的温度稳定性;d)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的来自大肠杆菌裂解物的Fab的牛/小鼠血清稳定性;e)在哺乳动物细胞中产生IgG1和ELISA检测细胞培养上清液中的分泌IgG1后的相对的人IgG1表达水平;和f)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的人IgG1的牛血清稳定性。
[0094] 术语“基本上的种系蛋白序列(substantially germline protein sequence)”表示由种系基因编码的但在氨基酸序列中具有点突变的氨基酸序列,所述点突变诸如,为了去除不期望的半胱氨酸,或引入期望的限制酶切位点例如BbsI,或产生于合成、扩增或克隆中的错误。
[0095] “种系基因”是编码在以下出版物中所公开的抗体或其功能片段的种系基因的核酸,对于VH:Tomlinson等人,(1992),“The Repertoire of Human Germline Vh Sequences Reveals about Fifty Groups of Vh Segments with Different Hypervariable Loop(人种系Vh序列的组库揭示大约五十组具有不同超变环的Vh区段 )”J.Mol.Biol.227,776-798;Matsuda 等 人 (1998),“The complete nucleotide sequence of the human immunoglobulin heavy chain variable region locus( 人免疫球蛋白重链可变区基因座的完整核苷酸序列)”J Exp Med 188(11):2151-62;和 LeFranc MP(2001)“Nomenclature of the human immunoglobulin heavy (IGH)genes(人免疫球蛋白重链(IGH)基因的命名).”Exp Clin Immunogenet.18(2):100-16;
对 于Vλ:Kawasaki 等 人,(1997)“One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆碱基序列分析)”Genome Research 7(3):250-61;Frippiat等人,(1995)″Organization of the human immunoglobulin lambda light-chain locus on chromosome 22q11.2(在染色体22q11.2上的人免疫球蛋白λ轻链基因座的组织)″Hum.Mol.Genet.,4,983-991;和LeFranc MP(2001)″Nomenclature ofthe human immunoglobulin lambda(IGL)genes(人免疫球蛋白λ(IGL)基因的命名).Exp Clin Immunogenet.;18:242-254;以及对于Vκ:
和Zachau(1993),“Thevariable genes of the human immunoglobulin kappa locus(人免疫球蛋白κ基因座的可变基因),”Biol.Chem Hoppe Seyler.374(11):
1001-22;Brensing-Küppers等人(1997),“The human immunoglobulin kappa locus on yeast artificial chromosomes(YACs)(在酵母人工染色体(YAC)上的人免疫球蛋白κ基因座)”Gene.191(2):173-81;Kawasaki等人(2001),“Evolutionary dynamics of the human immunoglobulin kappa locus and the germline repertoire of the Vkappa genes(人免疫球蛋白κ基因座和Vκ基因的种系组库的进化动态)”Eur J Immunol
31(4):1017-28;和Lefranc MP(2001)″Nomenclature of the human immunoglobulin kappa(IGK)genes(人免疫球蛋白κ(IGK)基因的命名)″Exp Clin Immunogenet.,18,
161-174,由此通过引用将它们全部以整体并入。
[0096] 可变重链的JH4、可变κ轻链的Jκ1、以及可变λ轻链区的Jλ2/3的序列在以下出版物中描述:Scaviner等人,(1999),″Protein displays of the human immunoglobulin heavy,kappa and lambda variable and joining regions(人免疫球蛋白重链、κ和λ链可变区和接合区的蛋白展示)″Exp Clin Immunogenet.16(4):234-40;对于JH:Ravetch等人,(1981),“Structure of the human immunoglobulin mu locus:
characterization of embryonic and rearranged J and D genes.(人免疫球蛋白mu基因座的结构:胚性的和重排的J和D基因的表征)”Cell 27(3pt 2):583-91;对于JK:
Hieter等人(1982),“Evolution of human immunoglobulin kappa J region genes.(人免疫球蛋白κJ区基因的进化)”J Biol Chem 257(3):1516-22;对于JL:Kawasaki等人,(1997)“One-Megabase Sequence Analysis of the Human immunoglobulin lambda Gene Locus(人免疫球蛋白λ基因座的一兆碱基序列分析)”Genome Research 7(3):
250-61,通过引用它们全部以整体并入本文。JH4序列是(YFDYWGQGTLVTVSS);Jκ1序列是(WTFGQGTKVEIK);并且Jλ2/3序列是(VVFGGGTKLTVL)。
[0097] 术语“依赖于位置的氨基酸利用”是指特定氨基酸序列在多肽中的给定位置出现的可能性。在本发明中,对于通过个体种系基因分类的重排氨基酸序列确定了依赖于位置的氨基酸利用。这使得CDR在其天然的种系环境中的个性、精确的设计成为可能。
[0098] 术语“可变结构域/区(VH或VL)”表示包括基本上由分别组成轻链(包括κ和λ)和重链免疫球蛋白基因座的VL(包括Vk和Vλ)、VH、JL(包括Jk和Jλ)以及JH核酸中的任何一个编码的一个或多个Ig结构域的免疫球蛋白的区域。轻链或重链可变区(VL和VH)由散布三个称为“互补决定区”或“CDR”的高变区的“构架”区或“FR”区组成。构架区和CDR的范围已被精确地定义(见Kabat,1991,J.Immunol.,147,915-920.;Chothia&Lesk,1987,J.Mol.Biol.196:901-917;Chothia等人,1989,Nature 342:877-883;Al-Lazikani等人,1997,J.Mol.Biol.273:927-948)。抗体的构架区即组分轻链和重链的联合构架区用来安置和对齐CDR,CDR主要负责与抗原结合。
[0099] 术语“构架区”表示被Kabat等人(1991)定义为充当可变结构域的抗原结合环的支架的这种可变结构域的一部分的抗体可变结构域。构架区的实例包括可变重链或可变轻链的FR1、FR2、FR3和FR4。
[0100] 术语“互补决定区”或“CDR”表示由Kabat等人(1991)定义的抗体的抗原结合环。抗体Fv片段的两个可变结构域的每一个包含三个CDR。互补决定区包括可变重链或可变轻链的CDR1、CDR2和CDR3。
[0101] “优选的VH和VL类对”表示那些在免疫组库中优选的VH和VL类对,所述免疫组库例如根据标准阈值组的人免疫组库。例如,丰富的VH-VL对;或具有有利的生物物理特性如低免疫原性、稳定性的VH-VL对;容易被展示和/或表达的VH-VL对;或者以在约2500个人B细胞的样品中至少0.05%的浓度出现的VH-VL对。在人免疫组库中优选的VH和VL类对可具有胜过其他VH和VL类对的优选的特征。
[0102] 术语“幼稚”表示未经历抗原的。
[0103] 术语“幼稚B细胞”表示如下B细胞:其中编码抗体或其功能片段的核酸没有经历体细胞超突变,因此被认为包括种系基因的核酸,存在V(D)J基因区段重排。被认为幼稚的B细胞群是未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞。
[0104] 术语“幼稚的人免疫组库( human immune repertoire)”表示分离自人免疫系统的未经历抗原的B细胞的核酸的组库,其中编码抗体或其功能片段的核酸没有经历体细胞超突变,因此被认为包括种系基因的核酸,存在V(D)J基因区段重排。组库可以是个体或群体的组库。只要获得足够的B细胞,本发明顺从于从单个个体确定免疫组库。优选地,从多个个体获得免疫组库以避免样品偏倚。
[0105] 术语“人免疫组库(human immune repertoire)”表示分离自人免疫系统的B细胞的核酸的组库。组库可以是个体或群体的组库,并且可以来自于幼稚B细胞和/或经历抗原的B细胞。只要获得足够的B细胞,本发明顺从于从单个个体确定免疫组库。优选地,从多个个体获得免疫组库以避免样品偏倚。
[0106] 将“抗原”和“免疫原”定义为被抗体特异性结合的任何分子。
[0107] 术语“对免疫原特异的”表示在抗体与相应分子之间的特异性关联。
[0108] 如本文所用的“CDR多样化”或“多样的CDR”是通过任何适合的方法对CDR的氨基酸序列的修饰。CDR一般已知是免疫原结合区,因此具有包含代表CDR中的较大多样性的成员的集合提高了集合将包括对于任何免疫原具有特异性和最佳特性的抗体或其片段的概率。通过改变一个或多个CDR的氨基酸组成而获得多样性。这可以通过本领域技术人员已知的任何方法达成,包括本文所述的方法。
[0109] “编码抗体或其片段的合成核酸的集合”表示编码该抗体或其片段的所有核酸是合成的,但不是指可与这些合成的核酸可操作地连接的其他核酸,如载体。
[0110] 在分子生物学上下文中使用的术语
[0111] 术语“合成”或“合成了”表示基因合成,其中核酸序列被合成为物理DNA,包括多核苷酸。标准的DNA合成包括单核苷酸合成,其中产生单链寡核苷酸,然后利用PCR样组件连接重叠的寡核苷酸。公司如Sloning (Puchheim,Germany)、Geneart(Regensburg,Germany)、DNA2.0(Menlo Park,CA USA)和Genscript(Piscataway,NJ USA)提供了基因合成技术。例如,Sloning利用一组事先制备的双链三联体核苷酸,这些核苷酸退火并随后被连接。
[0112] 术语“合成的”描述了通过合成制备或被合成的分子。
[0113] 术语“集合(collection)”或“文库”表示至少两个成员。术语“成员”包括但不限于编码抗体或其片段的核酸或者抗体或其片段本身。
[0114] 术语“宿主”是指任何宿主,包括哺乳动物,如人、鼠类或啮齿动物,小鼠、大鼠、松鼠、花栗鼠、囊地鼠、豪猪、河狸、仓鼠、沙土鼠、豚鼠、兔、狗、猫、牛或
[0115] 术语“核酸”在本文可与术语“多核苷酸”互换使用,并且是指处于单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。该术语涵盖包含已知的核苷酸类似物或修饰的骨架残基或连接的核酸,这些核酸是合成的、天然存在的和非天然存在的,具有与参考核酸相似的结合特性。这些类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸以及肽-核酸(PNA)。
[0116] 除非另外指明,否则特定的核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子取代)和互补序列以及明确指出的序列。具体地说,如以下所述,简并密码子取代可通过如下方式达成:产生其中一个或多个选择的(或全部的)密码子的第三个位置被混合碱基和/或脱氧肌苷残基取代的序列(Batzer等人,Nucleic Acid Res.19:5081,1991;Ohtsuka等人,J.Biol.Chem.260:2605-2608,1985;和Rossolini等人,Mol.Cell.Probes
8:91-98,1994)。
[0117] 术语“可操作地连接”是指在两个或更多个多核苷酸(例如,DNA)区段之间的功能关系。通常,它是指转录调节序列与被转录的序列的功能关系。例如,如果启动子或增强子序列在适当的宿主细胞或其他表达系统中刺激或调控编码序列的转录,那么启动子或增强子序列与该编码序列可操作地连接。一般来说,与被转录的序列可操作地连接的启动子转录调节序列在物理上与该被转录的序列邻接,即它们是顺式作用的。然而,一些转录调节序列如增强子不必与它们增强转录的编码序列物理上邻接或位置上很靠近。
[0118] 如本文所用,术语“密码子优化的”或“密码子优化”表示已利用在生产细胞或生物中优选的密码子改变核苷酸序列来编码氨基酸序列。优化的核苷酸序列被工程化以保留最初由初始核苷酸序列编码的氨基酸序列。此外,可将核苷酸序列设计成完全或尽可能不含抑制性基序、剪接位点、mRNA不稳定性基序和不期望的限制酶切位点。还可以优化核苷酸序列的GC含量、期望的限制酶切位点以及其他参数。可优化序列在不同宿主中的表达,包括细菌细胞或真核细胞。由优化的核苷酸序列编码的氨基酸序列也被称为优化的。
[0119] 术语“氨基酸”是指天然存在的氨基酸和合成的氨基酸,以及以类似于天然存在的氨基酸的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸,以及后来被修饰的那些氨基酸,例如,羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构(即,与氢、羧基、氨基和R基结合的α)的化合物,例如,高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基硫鎓(methionine methyl sulfonium)。这些类似物具有修饰的R基(例如,正亮氨酸)或修饰的肽骨架,但保留了与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构但以类似于天然存在的氨基酸的方式起作用的化学化合物。
[0120] 术语“多肽”和“蛋白”在本文可互换使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或更多个氨基酸残基是对应的天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,并适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。除非另外指明,否则特定的多肽序列还隐含地涵盖其保守修饰的变体。
[0121] 术语“保守修饰的变体”适用于氨基酸序列和核酸序列二者。就特定的核酸序列来说,保守修饰的变体是指那些编码相同或基本上相同的氨基酸序列的核酸,或者在核酸不编码氨基酸序列的情况下是指基本相同的序列。因为遗传密码的简并性,大量功能相同的核酸编码任何给定蛋白。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在丙氨酸被密码子指定的每个位置,该密码子可被改变为所述的任何对应密码子而不改变所编码的多肽。这种核酸变异是“沉默变异”,是一类保守修饰变异。本文编码多肽的每个核酸序列还描述了该核酸的每种可能的沉默变异。技术人员将认识到,核酸中的每个密码子(除了通常是甲硫氨酸唯一密码子的AUG和通常是色氨酸唯一密码子的TGG之外)可被修饰产生功能相同的分子。因此,编码多肽的核酸的每种沉默变异隐含在每个描述的序列中。
[0122] 对于多肽序列来说,“保守修饰的变体”包括导致氨基酸被化学上相似的氨基酸取代的对多肽序列的个体取代、缺失或添加。提供功能相似的氨基酸的保守取代表是本领域公知的。这些保守修饰的变体不包括但不排除本发明的多态变体、种间同源物和等位基因。以下八组包括互相为保守取代的氨基酸:1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(见,例如Creighton,Proteins(1984))。在一些实施方案中,术语“保守序列修饰”用来指如下氨基酸修饰:不显著影响或改变包含该氨基酸序列的抗体的结合特征的氨基酸修饰。
[0123] 术语“相同的”或“同一性”百分比在两个或更多个核酸或多肽序列的上下文中是指相同的两条或更多条序列或子序列。如果两条序列在比较窗口或者在使用以下序列比较算法之一或通过人工比对和肉眼检查所测量的指定区域比较和比对最大对应性时具有指定百分比的相同氨基酸残基或核苷酸(即,在限定的区域或者当不限定时整个序列的60%同一性、任选65%、70%、75%、80%、85%、90%、95%或99%同一性),那么这两条序列是“基本上相同的”。任选地,同一性在长度为至少约50个核苷酸(或10个氨基酸)的区域,或更优选在长度为100到500或1000或更多个核苷酸(或20、50、200或更多个氨基酸)的区域存在。对于序列比较,通常一条序列用作与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机中,指定子序列坐标,如果必要的话,指定序列算法程序参数。可使用缺省的程序参数,或者可指定可选的参数。然后序列比较算法基于程序参数计算测试序列相对于参考序列的序列同一性百分比。
[0124] 如本文所用的“比较窗口”包括参考选自由20到600、通常约50到约200、更通常约100到约150组成的组的任何一个邻接位置数目的区段,在比较窗口中在序列与参考序列被最佳地比对后可将该序列与参考序列的相同数目的邻接位置进行比较。用于比较的序列比对方法是本领域公知的。用于比较的序列的最佳比对可通过如下方式进行:例如,通过Smith和Waterman(1970)Adv.Appl.Math.2:482c的局部同源性算法,通过Needleman和Wunsch,J.Mol.Biol.48:443,1970的同源性比对算法,通过Pearson和Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444,1988的相似性搜寻方法,通过这些算法的计算机实现(在Wisconsin遗传性软件包,Genetics Computer Group,575Science Dr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA),或通过人工比对和肉眼检查(见,例如,Brent等人,Current Protocols in Molecular Biology(现代分子生物学实验技术),John Wiley&Sons,Inc.(2003))。
[0125] 适于确定序列同一性百分比和序列相似性百分比的算法的两个实例是分别被描述于Altschul等人,Nucl.AcidsRes.25:3389-3402,1977和Altschul等人,J.Mol.Biol.215:403-410,1990中的BLAST和BLAST 2.0算法。用于执行BLAST分析的软件是通过美国国立生物技术信息中心公开可用的。这种算法包括首先通过识别问询序列中长度W的短字(word)来识别高得分序列对(HSP),该高得分序列对当与数据库序列中的相同长度的字对齐时匹配或满足某个正值阈值得分T。T被称为相邻字得分阈值(neighborhood word score threshold)(Altschul等人,上述)。这些最初的相邻字命中(hit)充当用于启动搜索的种子以寻找包含它们的更长的HSP。字命中沿每条序列在两个方向上延伸直到累计的比对得分可被增加为止。对于核苷酸序列,使用参数M(对一对匹配残基的奖励得分;总是>0)和N(对错配残基的处罚得分;总是<0)计算累计得分。对于氨基酸序列,使用评分矩阵来计算累计得分。当发生以下情况时字命中在每个方向上的延伸停止:累计比对得分从其所达到的最大值下降了量X;由于一个或更多个负得分残基比对的累计,累计得分趋于零或零以下;或者到达任一条序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列而言)使用字长(W)11,期望(E)10,M=5,N=-4以及两条链的比较作为缺省值。对于氨基酸序列,BLASTP程序使用字长(W)3,和期望(E)10以及BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA89:10915,1989),比对(B)50,期望(E)10,M=5,N=-4和两条链的比较作为缺省值。
[0126] BLAST算法还进行两条序列之间的相似性的统计分析(见,例如,Karlin和Altschul,Proc.Natl.Acad.Sci.USA 90:5873-5787,1993)。由BLAST算法提供的一种相似性量度是最小和概率(P(N)),它提供了在两条核苷酸序列或氨基酸序列之间的匹配将偶然发生的概率的指示。例如,如果在测验核酸与参考核酸的比较中最小和概率小于大约0.2、更优选地小于大约0.01、并且最优选地小于大约0.001,那么认为该核酸与参考序列是相似的。
[0127] 两条氨基酸序列之间的同一性百分比还可以使用已被加入ALIGN程序(2.0版)中的E.Meyers和W.Miller的算法(Comput.Appl.Biosci.,4:11-17,1988)确定,使用PAM120残基权重表、空位长度罚分12和空位罚分4。此外,两条氨基酸序列之间的同一性百分比可使用已被加入GCG软件包的GAP程序(在www.gcg.com可获得)中的Needleman和Wunsch(J.Mol.Biol.48:444-453,1970)算法确定,使用Blossom 62矩阵或PAM250矩阵,以及空位权重(gap weight)16、14、12、10、8、6或4,以及长度权重(length weight)1、2、3、4、5或6。
[0128] 除了以上指出的序列同一性百分比外,两条核酸序列或多肽基本上相同的另一个指征是由第一核酸编码的多肽与针对由第二核酸编码的多肽而产生的抗体有免疫交叉反应,如以下所述。因此,多肽通常与另一多肽基本上相同,例如,在这两条多肽差异仅为保守取代的情况下。两条核酸序列基本上相同的另一指征是这两个分子或它们的互补序列在严格条件下彼此杂交,如以下所述。两条核酸序列基本上相同的又另一个指征是可使用相同的引物来扩增该序列。
[0129] 术语“重组的宿主细胞”(或简称“宿主细胞”)是指重组表达载体已被引入其中的细胞。应理解这些术语不仅意指特定的受试细胞而且意指这种细胞的子代。因为某些修饰由于突变或环境影响可发生在随后的代中,所以这种子代事实上可与母本细胞不同,但是仍被包括在本文所用的术语“宿主细胞”的范围之内。典型的宿主细胞是原核的(如细菌的,包括但不限于大肠杆菌)或真核的(其包括酵母、哺乳动物细胞和更多)。
[0130] 术语“载体”意指如下多核苷酸分子:所述多核苷酸分子能够运输与其连接的另一个多核苷酸。优选的载体是能够自主复制和/或表达与其连接的核酸的那些载体。能够指导与其可操作地连接的核酸的表达的载体在本文被称为“表达载体”。一种类型的载体是“质粒”,是指附加的DNA区段可被连入其中的环状双链DNA环。另一种类型的载体是病毒载体,其中附加的DNA区段可被连入该病毒的基因组中。某些载体能够在它们被引入的宿主细胞中自主复制(例如,具有细菌的复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)可在引入宿主细胞中后被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导与其可操作地连接的基因的表达。这些载体在本文称为“重组表达载体”(或简称“表达载体”)。一般来说,在重组DNA技术中有实用性的表达载体通常处于质粒形式。在本说明书中,“质粒”和“载体”可被互换使用,因为质粒是最常用的载体形式。然而,本发明旨在包括具有同等功能的那些其他形式的表达载体,如病毒载体(例如,复制缺陷型逆转录病毒、腺病毒以及腺伴随病毒)。
[0131] 载体通常包括原核复制子,原核复制子可包括能够在细菌宿主细胞中指导编码VH和/或VL的同源物的表达(转录和翻译)的原核启动子,所述细菌宿主细胞例如用编码VH和/或VL的同源物转化的大肠杆菌(Escherichia coli)。启动子是允许RNA聚合酶的结合和转录发生的由DNA序列形成的表达控制元件。与细菌宿主相容的启动子序列通常被提供在包含用于插入DNA区段的便利限制酶切位点的质粒载体中。这些载体质粒的实例包括可商购的pUC8、pUC9、pBR322和pBR329、pPL以及pKK223。
[0132] “展示载体”包括具有指导重组DNA分子在宿主细胞中在染色体外复制和维持的能力的DNA序列,所述宿主细胞例如用重组DNA分子转化的细菌宿主细胞。这些DNA序列是本领域公知的。展示载体可以是例如起源于fd、M13或fl丝状噬菌体类别的噬菌体载体或噬菌粒载体。这些载体能够促进蛋白(包括,例如,结合蛋白或其片段)在丝状噬菌体表面上的展示。适合于在噬菌体、核糖体、DNA、细菌细胞或真核细胞(例如酵母或哺乳动物细胞)上展示的展示载体也是本领域公知的,例如,是病毒载体或编码嵌合蛋白的载体。
[0133] “唯一的”限制酶切位点是在给定的核酸分子上只存在或出现一次的限制酶切位点。
[0134] 集合及其生产和使用方法
[0135] 本公开内容使得可用于鉴定针对任何靶的治疗性抗体的抗体或其功能片段的集合成为可能,其中所述抗体在临床上可开发并且在患者中是安全且有效的。作为背景,发明人设想在人免疫组库中富含的可变重链和可变轻链种系基因对可能具有有利的生物物理特性,将导致更有效率的研发,提高得到的抗体在患者中的安全性和效力。每个B细胞编码一种抗体,并且每种抗体包含可变重链和可变轻链。可将抗体的可变重链和可变轻链中的每一个与种系基因序列比对以确定抗体的起源,意味着可变重链和可变轻链由哪些种系基因形成。因此,对于每种抗体而言,可以说,可变重链和可变轻链构成种系基因对,例如,VH3-23与VK1-5配对。这种有利的生物物理特性可包括:a)以Fab形式的相对高的展示率;b)相对高的Fab表达水平;c)Fab的温度稳定性;d)Fab的牛/小鼠血清稳定性;e)相对高的人IgG1表达水平;和f)人IgG1的牛血清稳定性。
[0136] 为了证实种系基因对可能具有有利的生物物理特性的假设,第一步是鉴定在人免疫组库中表达的可变重链和可变轻链种系基因对。在一些方面,本发明包括产生合成抗体或其功能片段的集合的方法,所述方法包括获得包括人免疫组库中存在的可变重链和可变轻链种系基因对的数据的步骤。在一些实施方案中,数据是从提供可变重链和可变轻链种系基因对的公开可用的文献中获得。一般来说,在相关的公开可用的文献中,遵循以下方法:从人供体中分离B细胞,分选B细胞以确定其发育或分化的阶段,产生并扩增代表编码来自每个B细胞的抗体的DNA的cDNA,对该cDNA测序,将编码可变重链和可变轻链的cDNA与已知的种系基因序列比对,并确定来自每个B细胞的种系基因对。在一些实施方案中,数据是从人B细胞的采样和分离获得的,其包括与文献中使用的方法类似的方法。在这些方面,生产合成抗体或其功能片段的集合的方法包括获得包含存在于人免疫组库中的可变重链和可变轻链种系基因对的数据的步骤;其中该获得步骤还包括如下步骤:aa)从样品中分离人B细胞;ab)从该B细胞产生cDNA;ac)PCR扩增来自B细胞的cDNA;ad)对PCR产物进行测序;和ae)鉴定PCR产物的种系基因。两个数据集提供了人免疫组库中存在的可变重链和可变轻链种系基因对。
[0137] 下一步,汇集、分析原始数据,并根据表达水平对存在于人免疫组库中的可变重链和可变轻链种系基因对进行分级。在这些方面,本发明包括产生抗体或其功能片段的集合的方法,所述方法包括鉴定在人免疫组库中被突出表达的可变重链和可变轻链种系基因对。
[0138] 在人免疫组库中被突出表达的种系基因对
[0139] 从这个数据很清楚的是,某些可变重链和可变轻链种系基因对比其他种系对更频繁地存在于人免疫组库中。因为这些突出的对预期具有优异的生物物理特性,所以本发明的方面包括源自在人免疫组库中突出的种系基因对的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于在人免疫组库中突出的种系基因对。在其他方面,本发明包括含在人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列。在其他方面,本发明包括含在人免疫组库中被突出表达的种系基因对的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在人免疫组库中被突出表达的种系基因对的种系蛋白序列。在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系基因对的种系蛋白序列,其中所述种系基因在人免疫组库中被突出表达。
[0140] 在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段基本上由在人免疫组库中被突出表达的种系基因对组成,其中在一些实施方案中,一个或更多个CDR基本上由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段由在人免疫组库中被突出表达的种系基因对所编码的种系蛋白对组成,其中在一些实施方案中,一个或更多个CDR基本上由在人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括在人免疫组库中被突出表达的种系基因对的种系蛋白序列。
[0141] 在一些实施方案中,在人免疫组库中丰富的或被突出表达的种系基因对以如下浓度表达:在人免疫组库中至少0.05%,在人免疫组库中至少0.09%;在人免疫组库中至少0.14%;在人免疫组库中至少0.19%;在人免疫组库中至少0.23%;在人免疫组库中至少
0.28%;在人免疫组库中至少0.33%;在人免疫组库中至少0.37%;在人免疫组库中至少
0.42%;在人免疫组库中至少0.47%;在人免疫组库中至少0.51%;在人免疫组库中至少
0.56%;在人免疫组库中至少0.61%;在人免疫组库中至少0.66%;在人免疫组库中至少
0.70%;在人免疫组库中至少0.84%;在人免疫组库中至少0.89%;在人免疫组库中至少
0.94%;在人免疫组库中至少1.03%;在人免疫组库中至少1.12%;在人免疫组库中至少
1.17%;或在人免疫组库中至少1.26%。
[0142] 本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。根据CDR长度和在构象或规范结构上的多样性,认为产生具有在人免疫组库中被突出表达的至少两个可变重链和可变轻链种系蛋白对的集合将提供在该集合中的多样性,尤其是在该集合的抗体的互补决定区中的多样性。这容许本发明的集合可用于鉴定针对任何免疫原的抗体或其功能片段。因此,本发明的一些方面包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的选自人免疫组库的突出表达的种系蛋白对的不同的种系蛋白对:至少两个不同的种系蛋白对;至少三个不同的种系蛋白对;至少四个不同的种系蛋白对;至少五个不同的种系蛋白对;至少六个不同的种系蛋白对;至少七个不同的种系蛋白对;至少八个不同的种系蛋白对;至少九个不同的种系蛋白对;至少十个不同的种系蛋白对;至少十一个不同的种系蛋白对;至少十二个不同的种系蛋白对;至少十三个不同的种系蛋白对;至少十四个不同的种系蛋白对;至少十五个不同的种系蛋白对;至少十六个不同的种系蛋白对;至少十七个不同的种系蛋白对;至少十八个不同的种系蛋白对;至少十九个不同的种系蛋白对;至少二十个不同的种系蛋白对;至少21个不同的种系蛋白对;至少22个不同的种系蛋白对;至少23个不同的种系蛋白对;至少24个不同的种系蛋白对;至少25个不同的种系蛋白对;至少26个不同的种系蛋白对;至少27个不同的种系蛋白对;至少28个不同的可变重链种系蛋白;至少29个不同的种系蛋白对序列;至少30个不同的种系蛋白对;至少31个不同的种系蛋白对;至少32个不同的种系蛋白对;至少
33个不同的种系蛋白对;至少34个不同的种系蛋白对;至少35个不同的种系蛋白对;至少
36个不同的种系蛋白对;至少37个不同的种系蛋白对;至少38个不同的种系蛋白对;至少
39个不同的种系蛋白对;至少40个不同的种系蛋白对;至少41个不同的种系蛋白对;至少
42个不同的种系蛋白对;至少43个不同的种系蛋白对;至少44个不同的可变重链种系蛋白;至少45个不同的种系蛋白对序列;至少46个不同的种系蛋白对;至少47个不同的种系蛋白对;至少48个不同的种系蛋白对;至少49个不同的种系蛋白对;或至少50个不同的种系蛋白对。
[0143] 在一些实施方案中,集合包括含选自表18所示的种系基因对的一个或更多个种系蛋白对的可变重链和可变轻链构架区。
[0144] 在一些实施方案中,本发明包括分离的抗体或其功能片段,所述分离的抗体或其功能片段包含可变重链结构域和可变轻链结构域,所述可变重链结构域和可变轻链结构域包含FR1、CDR1、FR2、CDR2和FR3,所述FR1、CDR1、FR2、CDR2和FR3包含种系基因对的种系蛋白序列,其中所述种系基因对选自表18的种系基因对。
[0145] 在幼稚的人免疫组库中被突出表达的种系基因对
[0146] 还预料某些可变重链和可变轻链种系基因对可在幼稚B细胞(未经历抗原的)与经历抗原的B细胞中差异地表达,因此,基于采样的B细胞的发育或分化来分析数据。包含在幼稚B细胞中被差异表达的种系基因对的种系蛋白对的集合可能在选择针对任何免疫原的抗体或其功能片段上是有利的。因此,本发明的方面包括源自于在幼稚的人免疫组库中被突出表达的种系基因对的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于在幼稚的人免疫组库中被突出表达的种系基因对。在其他方面,本发明包括含在幼稚的人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在幼稚的人免疫组库中被突出表达的种系基因对的基本上的种系蛋白序列。在其他方面,本发明包括含在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列。在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包括可变重链和可变轻链种系蛋白对,其中所述种系蛋白对由在幼稚的人免疫组库中被突出表达的种系基因对编码。
[0147] 在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段基本上由如下种系蛋白对组成:所述种系蛋白对由在幼稚的人免疫组库中被突出表达的种系基因对编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段由如下种系蛋白对组成:所述种系蛋白对由在幼稚的人免疫组库中被突出表达的种系基因对编码。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括在幼稚的人免疫组库中被突出表达的种系基因对的种系蛋白序列。
[0148] 在一些实施方案中,在幼稚的人免疫组库中丰富的或被突出表达的种系基因对以如下浓度表达:在幼稚的人免疫组库中至少0.07%,在幼稚的人免疫组库中至少0.15%;在幼稚的人免疫组库中至少0.22%;在幼稚的人免疫组库中至少0.30%;在幼稚的人免疫组库中至少0.37%;在幼稚的人免疫组库中至少0.45%;在幼稚的人免疫组库中至少
0.52%;在幼稚的人免疫组库中至少0.59%;在幼稚的人免疫组库中至少0.67%;在幼稚的人免疫组库中至少0.74%;在幼稚的人免疫组库中至少0.82%;在幼稚的人免疫组库中至少0.89%;在幼稚的人免疫组库中至少0.97%;在幼稚的人免疫组库中至少1.19%;或在幼稚的人免疫组库中至少1.56%。
[0149] 本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。根据CDR长度和在构象或规范结构上的多样性,认为产生具有在幼稚的人免疫组库中被突出表达的种系基因对所编码的至少两个可变重链和可变轻链种系蛋白对的集合将提供在该集合中的多样性,尤其是在该集合的抗体的互补决定区中的多样性。这容许本发明的集合可用于鉴定针对任何免疫原的抗体或其功能片段。因此,本发明的一些方面包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的种系蛋白对:至少两个不同的种系蛋白对;至少三个不同的种系蛋白对;至少四个不同的种系蛋白对;
至少五个不同的种系蛋白对;至少六个不同的种系蛋白对;至少七个不同的种系蛋白对;
至少八个不同的种系蛋白对;至少九个不同的种系蛋白对;至少十个不同的种系蛋白对;
至少十一个不同的种系蛋白对;至少十二个不同的种系蛋白对;至少十三个不同的种系蛋白对;至少十四个不同的种系蛋白对;至少十五个不同的种系蛋白对;至少十六个不同的种系蛋白对;至少十七个不同的种系蛋白对;至少十八个不同的种系蛋白对;至少十九个不同的种系蛋白对;至少二十个不同的种系蛋白对;至少21个不同的种系蛋白对;至少22个不同的种系蛋白对;至少23个不同的种系蛋白对;至少24个不同的种系蛋白对;至少25个不同的种系蛋白对;至少26个不同的种系蛋白对;至少27个不同的种系蛋白对;至少28个不同的可变重链种系蛋白;至少29个不同的种系蛋白对序列;至少30个不同的种系蛋白对;至少31个不同的种系蛋白对;至少32个不同的种系蛋白对;至少33个不同的种系蛋白对;至少34个不同的种系蛋白对;至少35个不同的种系蛋白对;至少36个不同的种系蛋白对;至少37个不同的种系蛋白对;至少38个不同的种系蛋白对;至少39个不同的种系蛋白对;至少40个不同的种系蛋白对;至少41个不同的种系蛋白对;至少42个不同的种系蛋白对;至少43个不同的种系蛋白对;至少44个不同的可变重链种系蛋白;至少45个不同的种系蛋白对序列;至少46个不同的种系蛋白对;至少47个不同的种系蛋白对;至少48个不同的种系蛋白对;至少49个不同的种系蛋白对;或至少50个不同的种系蛋白对。
[0150] 在一些实施方案中,集合包括含选自表19的种系基因对的一个或更多个种系蛋白对的可变重链和可变轻链构架区。
[0151] 在一些实施方案中,本发明包括分离的抗体或其功能片段,所述分离的抗体或其功能片段包含可变重链结构域和可变轻链结构域,所述可变重链结构域和可变轻链结构域包含FR1、CDR1、FR2、CDR2和FR3,所述FR1、CDR1、FR2、CDR2和FR3包含构成种系蛋白对的种系蛋白序列,其中所述种系蛋白对选自表19的种系基因对。
[0152] 在人免疫组库中被突出表达的可变重链、可变κ轻链、以及可变λ轻链种系基因[0153] 下一步,分析汇集数据和附加的数据以确定在人免疫组库中可变重链、可变κ轻链、和可变λ轻链的种系基因表达。因此,本发明的额外方面包括产生抗体或其功能片段的集合的方法,所述方法包括鉴定在人免疫组库中被突出表达的可变重链、可变κ轻链、和可变λ轻链种系基因的步骤。这样做的一个途径是基于可变重链、可变κ轻链、和可变λ轻链种系基因的表达水平将它们排序。
[0154] 包含由在人免疫组库中被突出表达的种系基因编码的可变重链或可变轻链种系蛋白序列的抗体可能具有增强研发及在患者中的安全性和效力的有利生物物理特性。因此,本发明的方面包括源自于在人免疫组库中被突出表达的可变重链或可变轻链种系基因的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于在人免疫组库中被突出表达的可变重链或可变轻链种系基因。在其他方面,本发明包括含在人免疫组库中被突出表达的可变重链或可变轻链种系基因的基本上的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包含在幼稚的人免疫组库中被突出表达的可变重链或可变轻链种系基因的基本上的种系蛋白序列。在其他方面,本发明包括含在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列的合成抗体或其功能片段的集合,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包含在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列。在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列由在人免疫组库中被突出表达的可变重链或可变轻链种系基因编码。
[0155] 在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段基本上由如下可变重链或可变轻链种系蛋白序列组成:所述种系蛋白序列由在幼稚的人免疫组库中被突出表达的种系基因编码。在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由在人免疫组库中被突出表达的可变重链或可变轻链种系基因的种系蛋白序列组成。在一些实施方案中,抗体或其功能片段由如下可变重链或可变轻链种系蛋白序列组成:所述种系蛋白序列由在人免疫组库中被突出表达的种系基因编码。在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括在幼稚的人免疫组库中被突出表达的种系基因编码的种系蛋白序列。
[0156] 在一些实施方案中,在人免疫组库中丰富的或被突出表达的可变重链种系基因以如下浓度表达:在人免疫组库中至少0.1%;在人免疫组库中至少0.2%;在人免疫组库中至少0.3%;在人免疫组库中至少0.4%;在人免疫组库中至少0.5%;在人免疫组库中至少0.6%;在人免疫组库中至少1.0%;在人免疫组库中至少1.6%;在人免疫组库中至少2.1%;在人免疫组库中至少2.2%;在人免疫组库中至少2.6%;在人免疫组库中至少2.7%;在人免疫组库中至少3.0%;在人免疫组库中至少3.2%;在人免疫组库中至少3.3%;在人免疫组库中至少4.0%;在人免疫组库中至少4.1%;在人免疫组库中至少4.5%;在人免疫组库中至少4.6%;在人免疫组库中至少5.3%;在人免疫组库中至少5.8%;或在人免疫组库中至少6.8%;在人免疫组库中至少7.6%;在人免疫组库中至少
8.0%;或在人免疫组库中至少10.6%。
[0157] 在一些实施方案中,在人免疫组库中丰富的或被突出表达的可变κ轻链种系基因以如下浓度表达:在人免疫组库中至少0.1%,在人免疫组库中至少0.2%;在人免疫组库中至少0.3%;在人免疫组库中至少0.4%;在人免疫组库中至少0.5%;在人免疫组库中至少0.7%;在人免疫组库中至少1.0%;在人免疫组库中至少1.1%;在人免疫组库中至少1.3%;在人免疫组库中至少1.9%;在人免疫组库中至少2.2%;在人免疫组库中至少2.4%;在人免疫组库中至少2.6%;在人免疫组库中至少4.6%;在人免疫组库中至少6.0%;在人免疫组库中至少7.6%;在人免疫组库中至少8.5%;在人免疫组库中至少11.1%;在人免疫组库中至少11.2%;在人免疫组库中至少14.2%;或在人免疫组库中至少16.2%。
[0158] 在一些实施方案中,在人免疫组库中丰富的或被突出表达的可变λ轻链种系基因以如下浓度表达:在人免疫组库中至少0.1%,在人免疫组库中至少0.3%;在人免疫组库中至少0.5%;在人免疫组库中至少0.6%;在人免疫组库中至少1.0%;在人免疫组库中至少1.2%;在人免疫组库中至少1.5%;在人免疫组库中至少1.7%;在人免疫组库中至少4.5%;在人免疫组库中至少5.1%;在人免疫组库中至少5.3%;在人免疫组库中至少6.5%;在人免疫组库中至少8.1%;在人免疫组库中至少10.0%;或在人免疫组库中至少
11.3%;或在人免疫组库中至少18.1%。
[0159] 本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。认为产生具有在人免疫组库中被突出表达的一个或更多个可变重链、可变κ轻链和可变λ轻链种系基因的集合将产生在该集合中的多样性,尤其是在CDR长度和在构象或规范结构上的多样性,由此使得该集合可用于鉴定针对任何免疫原的抗体或其功能片段。本发明的实施方案包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的可变重链种系蛋白序列:至少两种不同的可变重链种系蛋白序列;至少三种不同的可变重链种系蛋白序列;至少四种不同的可变重链种系蛋白序列;至少五种不同的可变重链种系蛋白序列;至少六种不同的可变重链种系蛋白序列;至少七种不同的可变重链种系蛋白序列;至少八种不同的可变重链种系蛋白序列;至少九种不同的可变重链种系蛋白序列;至少十种不同的可变重链种系蛋白序列;至少十一种不同的可变重链种系蛋白序列;至少十二种不同的可变重链种系蛋白序列;至少十三种不同的可变重链种系蛋白序列;至少十四种不同的可变重链种系蛋白序列;至少十五种不同的可变重链种系蛋白序列;至少十六种不同的可变重链种系蛋白序列;至少十七种不同的可变重链种系蛋白序列;至少十八种不同的可变重链种系蛋白序列;至少十九种不同的可变重链种系蛋白序列;至少二十种不同的可变重链种系蛋白序列;至少21种不同的可变重链种系蛋白序列;至少22种不同的可变重链种系蛋白序列;至少23种不同的可变重链种系蛋白序列;至少24种不同的可变重链种系蛋白序列;至少25种不同的可变重链种系蛋白序列;至少26种不同的可变重链种系蛋白序列;至少27种不同的可变重链种系蛋白序列;至少28种不同的可变重链种系蛋白;至少29种不同的可变重链种系蛋白序列;至少30种不同的可变重链种系蛋白序列;至少31种不同的可变重链种系蛋白序列;至少32种不同的可变重链种系蛋白序列;至少33种不同的可变重链种系蛋白序列;至少34种不同的可变重链种系蛋白序列;
至少35种不同的可变重链种系蛋白序列;至少36种不同的可变重链种系蛋白序列;至少
37种不同的可变重链种系蛋白序列;至少38种不同的可变重链种系蛋白序列;至少39种不同的可变重链种系蛋白序列;至少40种不同的可变重链种系蛋白序列;至少41种不同的可变重链种系蛋白序列;至少42种不同的可变重链种系蛋白序列;至少43种不同的可变重链种系蛋白序列;至少44种不同的可变重链种系蛋白;至少45种不同的可变重链种系蛋白序列;至少46种不同的可变重链种系蛋白序列;至少47种不同的可变重链种系蛋白序列;至少48种不同的可变重链种系蛋白序列;至少49种不同的可变重链种系蛋白序列。
[0160] 本发明的实施方案包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的可变κ轻链种系蛋白序列:至少两种可变κ轻链种系蛋白序列;至少三种不同的可变κ轻链种系蛋白序列;至少四种不同的可变κ轻链种系蛋白序列;至少五种不同的可变κ轻链种系蛋白序列;至少六种不同的可变κ轻链种系蛋白序列;至少七种不同的可变κ轻链种系蛋白序列;至少八种不同的可变κ轻链种系蛋白序列;至少九种不同的可变κ轻链种系蛋白序列;至少十种不同的可变κ轻链种系蛋白序列;至少十一种不同的可变κ轻链种系蛋白序列;至少十二种不同的可变κ轻链种系蛋白序列;至少十三种不同的可变κ轻链种系蛋白序列;至少十四种不同的可变κ轻链种系蛋白序列;至少十五种不同的可变κ轻链种系蛋白序列;至少十六种不同的可变κ轻链种系蛋白序列;至少十七种不同的可变κ轻链种系蛋白序列;至少十八种不同的可变κ轻链种系蛋白序列;至少十九种不同的可变κ轻链种系蛋白序列;至少二十种不同的可变κ轻链种系蛋白序列;至少21种不同的可变κ轻链种系蛋白序列;至少22种不同的可变κ轻链种系蛋白序列;至少23种不同的可变κ轻链种系蛋白序列;至少24种不同的可变κ轻链种系蛋白序列;至少25种不同的可变κ轻链种系蛋白序列;至少26种不同的可变κ轻链种系蛋白序列;至少27种不同的可变κ轻链种系蛋白序列;至少28种不同的可变κ轻链种系蛋白;至少29种不同的可变κ轻链种系蛋白序列;至少30种不同的可变κ轻链种系蛋白序列;至少31种不同的可变κ轻链种系蛋白序列;至少32种不同的可变κ轻链种系蛋白序列;至少33种不同的可变κ轻链种系蛋白序列;至少34种不同的可变κ轻链种系蛋白序列;至少35种不同的可变κ轻链种系蛋白序列。
[0161] 本发明的实施方案包括含抗体或其功能片段的集合,所述抗体或其功能片段包含如下数目的不同的可变λ轻链种系蛋白序列:至少两种不同的可变λ轻链种系蛋白序列;至少三种不同的可变λ轻链种系蛋白序列;至少四种不同的可变λ轻链种系蛋白序列;
至少五种不同的可变λ轻链种系蛋白序列;至少六种不同的可变λ轻链种系蛋白序列;
至少七种不同的可变λ轻链种系蛋白序列;至少八种不同的可变λ轻链种系蛋白序列;
至少九种不同的可变λ轻链种系蛋白序列;至少十种不同的可变λ轻链种系蛋白序列;
至少十一种不同的可变λ轻链种系蛋白序列;至少十二种不同的可变λ轻链种系蛋白序列;至少十三种不同的可变λ轻链种系蛋白序列;至少十四种不同的可变λ轻链种系蛋白序列;至少十五种不同的可变λ轻链种系蛋白序列;至少十六种不同的可变λ轻链种系蛋白序列;至少十七种不同的可变λ轻链种系蛋白序列;至少十八种不同的可变λ轻链种系蛋白序列;至少十九种不同的可变λ轻链种系蛋白序列;至少二十种不同的可变λ轻链种系蛋白序列;至少21种不同的可变λ轻链种系蛋白序列;至少22种不同的可变λ轻链种系蛋白序列;至少23种不同的可变λ轻链种系蛋白序列;至少24种不同的可变λ轻链种系蛋白序列;至少25种不同的可变λ轻链种系蛋白序列;至少26种不同的可变λ轻链种系蛋白序列;至少27种不同的可变λ轻链种系蛋白序列;至少28种不同的可变λ轻链种系蛋白;至少29种不同的可变λ轻链种系蛋白序列;至少30种不同的可变λ轻链种系蛋白序列;至少31种不同的可变λ轻链种系蛋白序列;至少32种不同的可变λ轻链种系蛋白序列;至少33种不同的可变λ轻链种系蛋白序列。
[0162] 在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变重链种系蛋白序列:IGHV3-23;IGHV3-30;IGHV4-39;IGHV4-34;IGHV4-59;IGHV1-69;IGHV5-51;IGHV3-7;
IGHV1-18;IGHV3-48;IGHV3-15;IGHV3-21;IGHV1-2;IGHV3-33;IGHV4-31;IGHV3-53;
IGHV3-11;IGHV3-9;IGHV4-4;IGHV1-46;IGHV3-74;IGHV1-24;IGHV4-61;IGHV1-8;
IGHV1-3;IGHV3-49;IGHV3-43;IGHV4-28;IGHV3-64;和IGHV7-81。
[0163] 在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变κ轻链种系蛋白序列:IGKV3-20;IGKV1-39/1D-39;IGKV1-5;IGKV3-15;IGKV4-1;IGKV3-11;IGKV2-28/2D-28;
IGKV1-33/1D-33;IGKV2-30;IGKV1-9;IGKV1-17;IGKV1-27;IGKV1-8;IGKV1-16;IGKV1-6;
IGKV1-12;IGKV2D-29;IGKV1-13;IGKV1D-8;和IGKV2-24。
[0164] 在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变λ轻链种系蛋白序列:IGLV2-14;IGLV1-40;IGLV1-44;IGLV1-51;IGLV2-23;IGLV3-21;IGLV1-47;IGLV3-1;IGLV2-11;IGLV2-8;IGLV6-57;IGLV3-25;IGLV7-46;IGLV1-36;IGLV7-43;IGLV9-49;
IGLV4-69;IGLV2-18;IGLV3-10;和IGLV3-27。
[0165] 在一些实施方案中,本发明包括含FR1、CDR1、FR2、CDR2和FR3的分离的抗体或其功能片段,所述FR1、CDR1、FR2、CDR2和FR3包含选自由以下组成的组的种 系 蛋 白 序 列:IGHV3-23;IGHV3-30;IGHV4-39;IGHV4-34;IGHV4-59;IGHV1-69;IGHV5-51;IGHV3-7;IGHV1-18;IGHV3-48;IGHV3-15;IGHV3-21;IGHV1-2;IGHV3-33;
IGHV4-31;IGHV3-53;IGHV3-11;IGHV3-9;IGHV4-4;IGHV1-46;IGHV3-74;IGHV1-24;
IGHV4-61;IGHV1-8;IGHV1-3;IGHV3-49;IGHV3-43;IGHV4-28;IGHV3-64;IGHV7-81;
IGKV3-20;IGKV1-39/1D-39;IGKV1-5;IGKV3-15;IGKV4-1;IGKV3-11;IGKV2-28/2D-28;
IGKV1-33/1D-33;IGKV2-30;IGKV1-9;IGKV1-17;IGKV1-27;IGKV1-8;IGKV1-16;IGKV1-6;
IGKV1-12;IGKV2D-29;IGKV1-13;IGKV1D-8;IGKV2-24;IGLV2-14;IGLV1-40;IGLV1-44;
IGLV1-51;IGLV2-23;IGLV3-21;IGLV1-47;IGLV3-1;IGLV2-11;IGLV2-8;IGLV6-57;
IGLV3-25;IGLV7-46;IGLV1-36;IGLV7-43;IGLV9-49;IGLV4-69;IGLV2-18;IGLV3-10;和IGLV3-27。
[0166] 具有有利的生物物理特性的可变重链、可变κ轻链和可变λ轻链种系基因[0167] 下一步,评估突出的可变重链、可变κ轻链和可变λ轻链种系蛋白序列以确定其与研发相关的生物物理特性。经由计算机模拟评估了可变重链、可变κ轻链和可变λ轻链种系蛋白序列的以下特性:CDR长度;等电点(pI),优选的等电点是7.5或以上,因为这应该提供在标准的pH 5.5到pH 7配制缓冲液中的稳定性;在互补决定区中的翻译后修饰(PTM)(具体地说,N连接的糖基化位点(NxS或NxT)或化学修饰如Asp切割(通常在DP),Asp异构化(DD,DG),脱酰胺作用(NS,NG)(这可在体内(在血清中)或在储存时在配制缓冲液中发生并且导致抗体结合的丧失);在CDR中甲硫氨酸的存在(当暴露于溶剂时可被氧化);未成对的半胱氨酸的存在(将与任何其他未成对的半胱氨酸形成二硫键,由此导致蛋白的交联和/或较低的表达水平);偏离种系;潜在的T细胞表位的存在;以及理论上的聚集倾向。
[0168] 在一些实施方案中,本发明包括产生合成抗体或其功能片段的集合的方法,所述方法包括如下步骤:a)鉴定包含如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;和vi)至少7.5的等电点;和b)产生含在a)中鉴定的可变重链和/或可变轻链种系基因序列的抗体或其功能片段的集合。
[0169] 本发明的方面包括源自于具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列的合成抗体或其功能片段的集合:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于具有这些特性的可变重链和/或可变轻链种系蛋白序列。
[0170] 本发明的方面包括合成抗体或其功能片段的集合,所述合成抗体或其功能片段包括具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列的基本上的种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括来自具有这些特性的可变重链和/或可变轻链种系蛋白序列的基本上的种系蛋白序列。
[0171] 本发明的方面包括合成抗体或其功能片段的集合,所述合成抗体或其功能片段包括具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列的种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点,其中在一些实施方案中,这些抗体或其功能片段的一个或更多个构架区和/或互补决定区包括具有这些特性的可变重链和/或可变轻链种系蛋白的种系蛋白序列。
[0172] 本发明的方面包括合成抗体或其功能片段的集合,所述合成抗体或其功能片段包括不含未成对半胱氨酸的可变重链和/或可变轻链种系蛋白序列。
[0173] 本发明的方面包括含如下可变重链和/或可变轻链种系蛋白序列的合成抗体或其功能片段的集合:所述可变重链和/或可变轻链种系蛋白序列包含互补决定区中的四个或更少的翻译后修饰;互补决定区中的三个或更少的翻译后修饰;互补决定区中的两个或更少的翻译后修饰;互补决定区中的一个或更少的翻译后修饰;或互补决定区中无翻译后修饰。
[0174] 本发明的方面包括源自于如下可变重链和/或可变轻链种系蛋白序列的合成抗体或其功能片段的集合:所述可变重链和/或可变轻链种系蛋白序列包括至少7.5的等电点;至少8.0的等电点;至少8.5的等电点;至少9的等电点;或至少9.5的等电点。
[0175] 本发明的方面包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括具有一种或更多种如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0176] 在一些实施方案中,合成抗体或其功能片段的集合包括具有至少两种如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0177] 在一些实施方案中,合成抗体或其功能片段的集合包括具有至少四种如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0178] 在一些实施方案中,合成抗体或其功能片段的集合包括具有至少四种如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0179] 在一些实施方案中,合成抗体或其功能片段的集合包括具有至少五种如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0180] 在一些实施方案中,合成抗体或其功能片段的集合包括具有如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;和vi)至少7.5的等电点。
[0181] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区基本上由具有一种或更多种如下特性的可变重链和/或可变轻链种系蛋白序列组成:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0182] 在一些实施方案中,抗体或其功能片段基本上由具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列组成:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0183] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区由具有一种或更多种如下特性的可变重链和/或可变轻链种系蛋白序列组成:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0184] 在一些实施方案中,抗体或其功能片段由具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列组成:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0185] 在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括具有一种或多种如下特性的可变重链和/或可变轻链种系蛋白序列:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0186] 一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;和v)至少7.5的等电点。
[0187] 一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性:i)一个或更少的未成对半胱氨酸。
[0188] 一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性:i)一个或更少的未成对半胱氨酸;ii)一个或更少的潜在T细胞表位。
[0189] 一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性:i)一个或更少的未成对半胱氨酸;ii)一个或更少的潜在T细胞表位;和iii)至少7.5的等电点。
[0190] 一些实施方案包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述构架区包括种系蛋白序列,其中所述种系蛋白序列包含如下特性:i)在互补决定区中两个或更少的甲硫氨酸;ii)一个或更少的未成对半胱氨酸;iii)一个或更少的潜在T细胞表位;和iv)至少7.5的等电点。
[0191] 本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。认为产生具有一个或更多个可变重链、可变κ轻链和可变λ轻链种系蛋白序列的集合将产生在该集合中的多样性,尤其是在CDR长度和在构象或规范结构上的多样性,由此使得该集合可用于鉴定针对任何免疫原的抗体或其功能片段。
[0192] 本发明的实施方案包括含如下抗体或其功能片段的集合:所述抗体或其功能片段包括如下数目的不同的可变重链种系蛋白序列:至少两种不同的可变重链种系蛋白序列;至少三种不同的可变重链种系蛋白序列;至少四种不同的可变重链种系蛋白序列;至少五种不同的可变重链种系蛋白序列;至少六种不同的可变重链种系蛋白序列;至少七种不同的可变重链种系蛋白序列;至少八种不同的可变重链种系蛋白序列;至少九种不同的可变重链种系蛋白序列;至少十种不同的可变重链种系蛋白序列;至少十一种不同的可变重链种系蛋白序列;至少十二种不同的可变重链种系蛋白序列;至少十三种不同的可变重链种系蛋白序列;至少十四种不同的可变重链种系蛋白序列;至少十五种不同的可变重链种系蛋白序列;至少十六种不同的可变重链种系蛋白序列;至少十七种不同的可变重链种系蛋白序列;至少十八种不同的可变重链种系蛋白序列;至少十九种不同的可变重链种系蛋白序列;或至少二十种不同的可变重链种系蛋白序列,所述不同的可变重链种系蛋白序列包含如下特性:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0193] 本发明的实施方案包括含如下抗体或其功能片段的集合:所述抗体或其功能片段包括如下数目的不同的可变κ轻链种系蛋白序列:至少两种不同的可变κ轻链种系蛋白序列;至少三种不同的可变κ轻链种系蛋白序列;至少四种不同的可变κ轻链种系蛋白序列;至少五种不同的可变κ轻链种系蛋白序列;至少六种不同的可变κ轻链种系蛋白序列;至少七种不同的可变κ轻链种系蛋白序列;至少八种不同的可变κ轻链种系蛋白序列;至少九种不同的可变κ轻链种系蛋白序列;至少十种不同的可变κ轻链种系蛋白序列;至少十一种不同的可变κ轻链种系蛋白序列;至少十二种不同的可变κ轻链种系蛋白序列,所述不同的可变κ轻链种系蛋白序列包含如下特性:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0194] 本发明的实施方案包括含如下抗体或其功能片段的集合:所述抗体或其功能片段包括如下数目的不同的可变λ轻链种系蛋白序列:至少两种不同的可变λ轻链种系蛋白序列;至少三种不同的可变λ轻链种系蛋白序列;至少四种不同的可变λ轻链种系蛋白序列;至少五种不同的可变λ轻链种系蛋白序列;至少六种不同的可变λ轻链种系蛋白序列;至少七种不同的可变λ轻链种系蛋白序列;至少八种不同的可变λ轻链种系蛋白序列,所述不同的可变λ轻链种系蛋白序列包含如下特性:i)在互补决定区中四个或更少的翻译后修饰;ii)在互补决定区中两个或更少的甲硫氨酸;iii)一个或更少的未成对半胱氨酸;iv)一个或更少的潜在T细胞表位;v)中等或低的聚集倾向;或vi)至少7.5的等电点。
[0195] 在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变重链种系蛋白序列:IGHV1-2;IGHV1-18;IGHV1-69;IGHV1-46;IGHV3-7;IGHV3-11;IGHV3-15;IGHV3-21;IGHV3-23;IGHV3-30;IGHV3-33;IGHV3-48;IGHV3-53;IGHV3-73;IGH3-74;IGHV4-4;
IGHV4-31;IGHV4-39;IGHV 5-51和IGHV6-1。
[0196] 在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变κ轻链种系蛋白序列:IGKV1-5;IGKV1-6;IGKV1-9;IGKV1-12;IGKV1-16;IGKV1-17;IGKV1-27;IGKV1-39;IGKV2-30;IGKV3-11;IGKV3-15;和IGKV3-20。
[0197] 在一些实施方案中,集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括选自由以下组成的组的一种或更多种可变λ轻链种系蛋白序列:IGLV1-40;IGLV1-47;IGLV1-51;IGLV2-11;IGLV2-23;IGLV2-14;IGLV3-1和IGLV3-21。
[0198] 在一些实施方案中,本发明包括含FR1、CDR1、FR2、CDR2和FR3的分离的抗体或其功能片段,所述FR1、CDR1、FR2、CDR2和FR3包含选自由以下组成的组的种系蛋白序列:IGHV1-2;IGHV1-18;IGHV1-69;IGHV1-46;IGHV3-7;IGHV3-11;IGHV3-15;IGHV3-21;IGHV3-23;IGHV3-30;IGHV3-33;IGHV3-48;IGHV3-53;IGHV3-73;IGH3-74;IGHV4-4;
IGHV4-31;IGHV4-39;IGHV 5-51;IGHV6-1;IGKV1-5;IGKV1-6;IGKV1-9;IGKV1-12;
IGKV1-16;IGKV1-17;IGKV1-27;IGKV1-39;IGKV2-30;IGKV3-11;IGKV3-15;IGKV3-20;
IGLV1-40;IGLV1-47;IGLV1-51;IGLV2-11;IGLV2-23;IGLV2-14;IGLV3-1和IGLV3-21。
[0199] 具有有利的生物物理特性的种系基因对
[0200] 下一步,必须确定要测试哪些种系蛋白质对,因为在人免疫组库中存在约2500对。一种方式是测试最突出地出现在人免疫组库中的可变重链和可变轻链种系蛋白对,例如,见表18。人们可例如选择前四百对用于测试,或者选择表达高于某个阈值浓度的可变重链和可变轻链种系蛋白对。因此,本发明的方面包括生产合成抗体或其功能片段的集合的方法,其中所述生产步骤还包括如下步骤:鉴定以至少0.05%的浓度在人免疫组库中表达的可变重链和可变轻链种系基因对;产生包含所鉴定的种系蛋白对的抗体或其功能片段;并且评估所述种系蛋白对的如下特性:i)以Fab形式的相对展示率;ii)以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在
37℃持续大于十天的在牛血清中的稳定性;v)以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0201] 这种方法将需要合成和测试大量可变重链和可变轻链种系蛋白对序列;因此,这种方法将不是非常有效率的。
[0202] 作为一种替代的方法,发明人选择了代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对的一小组可变重链和可变轻链种系对。这种方法部分上基于如下观察结果:少量可变重链、可变κ轻链和可变λ轻链种系基因在人免疫组库中占优势。Wildt等人在895-896页描述了这种现象。Wildt等人还说明频繁表达的重链和轻链基因区段通常是成对的,并且观察到采样的一半配对仅对应于五个种系对。因此,可以联合少量的突出表达的重链和轻链种系基因(未成对的)以产生一组代表人免疫组库的对。
[0203] 因此,本发明的方面包括如下抗体或其片段的集合:所述抗体或其片段包括代表、准确地再现或覆盖人免疫组库或幼稚的人免疫组库的大多数突出表达的可变重链和可变轻链种系基因对的种系蛋白对。如以下所述,随着首先测试可变重链和可变轻链种系蛋白对的有利的生物物理特性,然后将集合设计成包括具有一种或更多种这些有利的生物物理特性的种系蛋白对,我们的方法产生了包含可充分开发的抗体或其片段的集合。
[0204] 本发明的方面包括生产抗体或其功能片段的集合的方法,所述方法包括鉴定具有一种或多种如下特性的可变重链和可变轻链种系蛋白对的步骤:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab pMx11_FH VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0205] 在一些方面,本发明包括生产抗体或其功能片段的集合的方法,所述方法包括产生含可变重链和可变轻链构架区的抗体或其功能片段的集合,其中所述一种或更多种构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括一种或更多种如下特性:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在
37℃持续十四天的在牛血清中的稳定性。在一些实施方案中,FR1、FR2和FR3区包括种系蛋白序列。
[0206] 在一些实施方案中,FR1、FR2和FR3区包括种系蛋白对的种系蛋白序列。在一些实施方案中,抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,CDR1区和CDR2区包括种系蛋白序列。在一些实施方案中,CDR1区和CDR2区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR1、CDR1、FR2、CDR2和FR3区包括种系蛋白序列。在一些实施方案中,FR1、CDR1、FR2、CDR2和FR3区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR4区包括JH4重链区。在一些实施方案中,FR4区包括Jκ1轻链区。在一些实施方案中,FR4区包括Jλ2/3轻链区。
[0207] 在其他实施方案中,本发明包括生产抗体或其功能片段的集合的方法,所述方法包括产生集合,其中产生还包括如下步骤:合成编码抗体或其功能片段的核酸;将核酸克隆到载体中;并且表达抗体或其功能片段。
[0208] 合成并测试可变重链和可变轻链种系蛋白对的突出表达的或代表的组后,然后可将集合设计成包括具有有利的生物物理特性的种系蛋白对。
[0209] 本发明的方面包括源自于具有一种或更多种如下特性的种系蛋白对的合成抗体或其功能片段的集合:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性,其中在一些实施方案中,抗体或其功能片段的一个或更多个构架区和/或互补决定区源自于具有这些特性的种系蛋白对。
[0210] 本发明的方面包括如下合成抗体或其功能片段的集合:所述合成抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的基本上的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性,其中在一些实施方案中,抗体或其功能片段的一个或更多个构架区和/或互补决定区包括具有这些特性的种系蛋白对的基本上的种系蛋白序列。
[0211] 本发明的方面包括如下合成抗体或其功能片段的集合:所述合成抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性,其中在一些实施方案中,抗体或其功能片段的一个或更多个构架区和/或互补决定区包括具有这些特性的种系蛋白对的种系蛋白序列。
[0212] 在一些方面,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0213] 在一些实施方案中,包含种系蛋白对的种系蛋白序列的构架区包括FR1、FR2和FR3区。在一些实施方案中,抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,CDR1区和CDR2区包括种系蛋白序列。在一些实施方案中,CDR1区和CDR2区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR1、CDR1、FR2、CDR2和FR3区包括种系蛋白序列。在一些实施方案中,FR1、CDR1、FR2、CDR2和FR3区包括种系蛋白对的种系蛋白序列。在一些实施方案中,FR4区包括JH4重链区。在一些实施方案中,FR4区包括Jκ1轻链区。在一些实施方案中,FR4区包括Jλ2/3轻链区。
[0214] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少两种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0215] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少三种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0216] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少四种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0217] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有至少五种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0218] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区包括具有如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0219] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区基本上由具有一种或更多种如下特性的种系蛋白对的种系蛋白序列组成:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0220] 在一些实施方案中,抗体或其功能片段基本上由包括一种或更多种如下特性的种系蛋白对的种系蛋白序列组成:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0221] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述构架区由具有一种或更多种如下特性的种系蛋白对的种系蛋白序列组成:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在
37℃持续十四天的在牛血清中的稳定性。
[0222] 在一些实施方案中,抗体或其功能片段由包括一种或更多种如下特性的种系蛋白对的种系蛋白序列组成:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0223] 在一些实施方案中,这些集合的大多数或基本上全部的抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0224] 在一些方面,集合的抗体或其功能片段包括具有一种或更多种如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0225] 在一些实施方案中,抗体或其功能片段基本上由包括如下特性的种系蛋白对的种系蛋白序列组成:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0226] 在一些实施方案中,抗体或其功能片段由包括如下特性的种系蛋白对的种系蛋白序列组成:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0227] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性:i)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;和ii)以IgG形式在37℃持续十四天的在血清中的稳定性。
[0228] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性:i)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;ii)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;iii)以IgG形式在37℃持续十四天的在血清中的稳定性。
[0229] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iii)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;和iv)以IgG形式在37℃持续十四天的在血清中的稳定性。
[0230] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性:i)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;ii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iii)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;iv)与MOR03080相比至少0.4的以IgG形式的表达水平;和v)以IgG形式在37℃持续十四天的在血清中的稳定性。
[0231] 在其他实施方案中,本发明的集合包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括如下特性:i)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;ii)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;iii)与MOR03080相比至少0.4的以IgG形式的表达水平;和iv)以IgG形式在37℃持续十四天的在血清中的稳定性。
[0232] 在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括含如下以Fab形式的相对展示率的种系蛋白对的种系蛋白序列:相比于对照至少0.1;相比于对照至少0.2;相比于对照至少0.3;相比于对照至少0.4;相比于对照至少0.5;相比于对照至少0.6;相比于对照至少0.7;相比于对照至少0.8;相比于对照至少0.9;相比于对照至少1.0;相比于对照至少1.1;相比于对照至少1.2;相比于对照至少1.3;相比于对照至少1.4;相比于对照至少1.5;相比于对照至少1.6;相比于对照至少1.7;相比于对照至少1.8;相比于对照至少1.9;相比于对照至少2.0;相比于对照至少2.1;相比于对照至少2.2;相比于对照至少2.3;相比于对照至少2.4;相比于对照至少2.5;相比于对照至少2.6;相比于对照至少2.7;相比于对照至少2.8;相比于对照至少2.9;相比于对照至少3.0;相比于对照至少3.2;相比于对照至少3.3;相比于对照至少3.4;相比于对照至少3.5;相比于对照至少3.6;相比于对照至少3.7;相比于对照至少3.8;相比于对照至少4.1;相比于对照至少4.3;相比于对照至少4.4;相比于对照至少4.5;相比于对照至少4.6;相比于对照至少4.7;相比于对照至少5.0;相比于对照至少5.1;相比于对照至少5.2;相比于对照至少5.4;相比于对照至少5.5;相比于对照至少5.7;相比于对照至少5.9;相比于对照至少6.0;相比于对照至少6.1;相比于对照至少6.3;相比于对照至少6.4;相比于对照至少6.7;相比于对照至少6.9;相比于对照至少7.0;相比于对照至少7.1;相比于对照至少7.2;相比于对照至少7.3;相比于对照至少7.4;相比于对照至少8.1;相比于对照至少8.2;相比于对照至少8.3;相比于对照至少8.4;相比于对照至少8.5;相比于对照至少8.6;相比于对照至少8.7;相比于对照至少8.8;相比于对照至少8.9;相比于对照至少9.1;相比于对照至少9.2;相比于对照至少9.3;相比于对照至少9.4;相比于对照至少9.5;相比于对照至少9.7;相比于对照至少9.8;相比于对照至少10.0;相比于对照至少
10.2;相比于对照至少10.3;相比于对照至少10.5;相比于对照至少10.6;相比于对照至少10.7;相比于对照至少10.8;相比于对照至少11.0;相比于对照至少11.2;相比于对照至少11.3;相比于对照至少11.5;相比于对照至少11.7;相比于对照至少11.8;相比于对照至少12.1;相比于对照至少12.3;相比于对照至少12.4;相比于对照至少12.9;相比于对照至少13.0;相比于对照至少13.6;相比于对照至少14.4;相比于对照至少14.5;相比于对照至少16.1;相比于对照至少16.6;相比于对照至少16.7;相比于对照至少17.1;相比于对照至少19.4;相比于对照至少27.3;或相比于对照至少29.0。
[0233] 在一些实施方案中,合成抗体或其功能片段的集合包括可变重链和可变轻链构架区,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,其中所述种系蛋白对包括含如下值的以Fab形式的相对展示率:采样的前10%Fab中的值;采样的前15%Fab中的值;采样的前20%Fab中的值;采样的前25%Fab中的值;采样的前30%Fab中的值;采样的前35%Fab中的值;采样的前40%Fab中的值;采样的前45%Fab中的值;采样的前50%Fab中的值;采样的前55%Fab中的值;采样的前60%Fab中的值;采样的前65%Fab中的值;采样的前70%Fab中的值;采样的前75%Fab中的值;采样的前80%Fab中的值;采样的前85%Fab中的值;或采样的前90%Fab中的值。
[0234] 在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括种系蛋白对的种系蛋白序列,所述种系蛋白对的种系蛋白序列包括如下值的以Fab形式的相对表达水平:相比于Fab VH1-69VLA_Vl1-40AYA至少0.1;相比于Fab VH1-69VLA_Vl1-40AYA至少0.2;相比于Fab VH1-69VLA_Vl1-40AYA至少0.3;相比于Fab VH1-69VLA_Vl1-40AYA至少0.4;相比于Fab VH1-69VLA_Vl1-40AYA至少0.5;相比于Fab VH1-69VLA_Vl1-40AYA至少0.6;相比于Fab VH1-69VLA_Vl1-40AYA至少0.7;相比于Fab VH1-69VLA_Vl1-40AYA至少0.8;相比于Fab VH1-69VLA_Vl1-40AYA至少0.9;相比于Fab VH1-69VLA_Vl1-40AYA至少1.0;相比于Fab VH1-69VLA_Vl1-40AYA至少1.1;相比于Fab VH1-69VLA_Vl1-40AYA至少1.2;或相比于Fab VH1-69VLA_Vl1-40AYA至少1.3。
[0235] 在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括种系蛋白对的种系蛋白序列,所述种系蛋白对的种系蛋白序列包括以Fab形式在70℃或更高温度持续至少45分钟的热稳定性;或包括以Fab形式在80℃或更高温度持续至少45分钟的热稳定性。
[0236] 在其他实施方案中,本发明的集合和/或生产这些集合的方法包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括种系蛋白对的种系蛋白序列,所述种系蛋白对的种系蛋白序列包括如下值的以IgG形式的相对表达水平:相比于MOR03080至少0.1;相比于MOR03080至少0.2;相比于MOR03080至少0.3;相比于MOR03080至少0.4;相比于MOR03080至少0.5;相比于MOR03080至少0.6;相比于MOR03080至少0.7;相比于MOR03080至少0.8;相比于MOR03080至少0.9;相比于MOR03080至少1.0;相比于MOR03080至少1.1;相比于MOR03080至少1.2;相比于MOR03080至少1.3;相比于MOR03080至少1.4;相比于MOR03080至少1.5;相比于MOR03080至少1.6;相比于MOR03080至少1.7;
相比于MOR03080至少1.8;相比于MOR03080至少1.9。
[0237] 在某些方面,本发明包括集合以及生产或使用含抗体或其功能片段的集合的方法,所述抗体或其功能片段包括含种系蛋白序列、基本上的种系蛋白序列或源自于种系蛋白序列的序列的一个或更多个互补决定区。在某些实施方案中,抗体或其功能片段包括含种系蛋白序列的CDR1和CDR2。在某些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的CDR1和CDR2。
[0238] 在一些方面,一个或更多个构架区包括种系蛋白对的种系蛋白序列。如在一些方面,FR4选自由JH4、Jκ1和Jλ2/3组成的组。如图45A-47B所示,种系蛋白序列只包括FR1-FR3。因此在某些方面,当所述可变重链构架区和可变轻链构架区包括种系蛋白序列时,FR1、FR2和/或FR3包括种系蛋白序列。在一些方面,一个或更多个构架区包括种系蛋白序列,容许一个或更多个互补决定区的多样化。在一些实施方案中,本发明包括集合以及生产和制备所述包括多样化HCDR3区的合成抗体或其功能片段的集合的方法。在一些实施方案中,本发明包括集合以及生产和使用所述包括多样化LCDR3区的合成抗体或其功能片段的集合的方法。
[0239] 本发明的另外一方面是集合可用于鉴定针对任何免疫原的抗体或其功能片段的能力。根据CDR长度和在构象或规范结构上的多样性,认为产生具有包括以上功能特性的至少两个可变重链和可变轻链种系蛋白对的集合将提供在该集合中的多样性,尤其是在该集合的抗体的互补决定区中的多样性。这容许本发明的集合可用于鉴定针对任何免疫原的抗体或其功能片段。
[0240] 本发明的一些实施方案包括如下集合:所述集合包括含可变重链和可变轻链构架区的抗体或其功能片段,其中所述构架区包括具有如下特性的种系蛋白对的种系蛋白序列:i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性,其中所述集合包括含如下数目的不同的种系蛋白对的抗体或其功能片段:至少两个不同的种系蛋白对;至少三个不同的种系蛋白对;至少四个不同的种系蛋白对;至少五个不同的种系蛋白对;至少六个不同的种系蛋白对;至少七个不同的种系蛋白对;至少八个不同的种系蛋白对;至少九个不同的种系蛋白对;至少十个不同的种系蛋白对;至少十一个不同的种系蛋白对;至少十二个不同的种系蛋白对;
至少十三个不同的种系蛋白对;至少十四个不同的种系蛋白对;至少十五个不同的种系蛋白对;至少十六个不同的种系蛋白对;至少十七个不同的种系蛋白对;至少十八个不同的种系蛋白对;至少十九个不同的种系蛋白对;至少二十个不同的种系蛋白对;至少21个不同的种系蛋白对;至少22个不同的种系蛋白对;至少23个不同的种系蛋白对;至少24个不同的种系蛋白对;至少25个不同的种系蛋白对;至少26个不同的种系蛋白对;至少27个不同的种系蛋白对;至少28种不同的可变重链种系蛋白;至少29个不同的种系蛋白对序列;至少30个不同的种系蛋白对;至少31个不同的种系蛋白对;至少32个不同的种系蛋白对;至少33个不同的种系蛋白对;至少34个不同的种系蛋白对;至少35个不同的种系蛋白对;至少36个不同的种系蛋白对;至少37个不同的种系蛋白对;至少38个不同的种系蛋白对;至少39个不同的种系蛋白对;至少40个不同的种系蛋白对;至少41个不同的种系蛋白对;至少42个不同的种系蛋白对;至少43个不同的种系蛋白对;至少44种不同的可变重链种系蛋白;至少45个不同的种系蛋白对序列;至少46个不同的种系蛋白对;至少47个不同的种系蛋白对;至少48个不同的种系蛋白对;至少49个不同的种系蛋白对或至少50个不同的种系蛋白对。
[0241] 包含种系基因序列的抗体或其功能片段
[0242] 另外,认为利用种系蛋白序列将降低抗体在施用至患者时的免疫原性风险。因此,本发明的方面包括集合以及生产和使用含可变重链和可变轻链构架区的合成抗体或其功能片段的所述集合的方法,其中所述构架区包括种系蛋白序列。在一些实施方案中,抗体或其功能片段的可变重链和可变轻链构架区包括基本上的种系序列。在一些实施方案中,抗体或其功能片段的可变重链和可变轻链构架区源自于种系序列。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列、基本上的种系序列或源自于种系蛋白序列的FR1、FR2、FR3和FR4区。在某些实施方案中,所述抗体或其功能片段包括含代表性种系蛋白对的种系蛋白序列的FR1、FR2、FR3。在一些实施方案中,使用的FR4区是可变重链的JH4,可变κ轻链的Jκ1和可变λ轻链的Jλ2/3。
[0243] 又因为利用种系蛋白序列将降低抗体在患者中施用时的免疫原性风险,所以本发明的某些方面包括集合以及生产或使用包含一个或更多个互补决定区的抗体或其功能片段的集合的方法,所述一个或更多个互补决定区包括种系蛋白序列、基本上的种系序列或源自于种系蛋白序列。在某些实施方案中,抗体或其功能片段包括含种系蛋白序列的CDR1和CDR2。在某些实施方案中,抗体或其功能片段包括含种系蛋白对的种系蛋白序列的CDR1和CDR2。
[0244] 在一些方面,一个或更多个构架区包括种系蛋白序列,容许一个或更多个互补决定区的多样化。在一些实施方案中,本发明包括集合以及生产和制备所述包括多样化HCDR3区的合成抗体或其功能片段的集合的方法。在一些实施方案中,本发明包括集合以及生产和使用所述包括多样化LCDR3区的合成抗体或其功能片段的集合的方法。CDR可通过本领域公知的方法设计,包括那些公开在Knappik等人2000;WO 97/08320;WO2008053275;WO2009036379;WO2007056441;WO2009114815中的方法,这些文献全部通过引用整体并入。
[0245] 另外,为了产生包含具有低免疫原性风险的抗体或其功能片段的集合,在某些方面,本发明的集合以及生产和使用这些集合的方法包括含人序列的抗体或其功能片段。
[0246] 在一些方面,本发明的集合包括至少1×104;至少1×105;至少1×106;至少7 8 9 10 11
1×10 ;至少1×10 ;至少1×10 ;至少1×10 ;或至少1×10 种编码抗体或其功能片段的核酸序列或者抗体或其功能片段。
[0247] 在一些方面,集合的抗体或其功能片段是合成的。
[0248] 在一些方面,集合包括编码抗体或其功能片段的核酸。
[0249] 本发明另外的实施方案
[0250] 在一些方面,本发明包括含可变重链和可变轻链构架区的合成抗体或其功能片段的集合,其中所述可变重链构架区和可变轻链构架区包括种系蛋白对的种系蛋白序列,[0251] 其中所述种系蛋白对包含如下特性:
[0252] i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
[0253] ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
[0254] iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
[0255] iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
[0256] v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
[0257] vi)以IgG形式在37℃持续十四天的在血清中的稳定性;
[0258] 其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对的种系蛋白序列,且
[0259] 其中所述种系蛋白对由种系基因对编码。
[0260] 在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区基本上由包括如下特性的种系蛋白对的种系蛋白序列组成:
[0261] i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
[0262] ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
[0263] iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
[0264] iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
[0265] v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
[0266] vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0267] 在一些实施方案中,本发明包括合成抗体或其功能片段的集合,其中所述可变重链和可变轻链构架区由包括如下特性的种系蛋白对的种系蛋白序列组成:
[0268] i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
[0269] ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
[0270] iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
[0271] iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
[0272] v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
[0273] vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0274] 在一些实施方案中,所述种系基因对以至少0.05%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0.23%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0.51%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述抗体或其功能片段包括人序列。在一些实施方案中,所述抗体或其功能片段的集合包括至少十七个不同的种系蛋白对的种系蛋白序列。
[0275] 在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的FR1、CDR1、FR2、CDR2和FR3区。在一些实施方案中,所述抗体或其功能片段包括选自由以下组成的组的FR4区:JH4、Jκ1和Jλ2/3。在一些实施方案中,所述抗体或其功能片段包括多样化的HCDR3区。在一些实施方案中,所述抗体或其功能片段包括多样化的LCDR3区。
[0276] 在一些实施方案中,集合包括1×104种抗体或其功能片段。在一些实施方案中,所述种系蛋白对包括含在采样的前60%Fab中的值的以Fab形式的相对展示率。在一些实施方案中,所述种系蛋白对包括与Fab VH1-69VLA_Vl1-40AYA相比至少0.6的以Fab形式的表达水平。在一些实施方案中,所述种系蛋白对包括以Fab形式在70℃或更高温度持续至少45分钟的热稳定性。在一些实施方案中,所述种系蛋白对包括与MOR03080相比至少0.6的以IgG形式的表达水平。
[0277] 在一些实施方案中,可变重链和可变轻链构架区包括选自由以下组成的组的种系蛋白对的种系蛋白序列:IGHV3-23/IGKV1-5;IGHV3-23/IGKV3-20;IGHV4-39/IGKV3-15;IGHV3-23/IGKV3-15;IGHV4-39/IGKV1-39/1D-39;IGHV1-18/IGKV3-20;IGHV3-30/IGKV3-20;IGHV4-39/IGKV1-5;IGHV1-69/IGKV1-39/1D-39;IGHV5-51/IGLV1-40;IGHV4-39/IGKV3-20;IGHV3-23/IGLV2-14;IGHV4-39/IGLV3-21;IGHV3-23/IGKV1-39/1D-39;IGHV3-30/IGKV1-39/1D-39;IGHV1-69/IGKV3-20;IGHV3-48/IGKV3-20;
IGHV1-2/IGKV3-20;IGHV3-30/IGKV4-1;IGHV5-51/IGLV2-14;IGHV5-51/IGKV3-20;
IGHV3-7/IGKV1-39/1D-39;IGHV3-7/IGKV1-5;IGHV3-15/IGKV3-20;IGHV4-39/IGLV2-14;
IGHV3-23/IGKV3-11;IGHV3-30/IGKV1-5;IGHV3-30/IGKV3-15;IGHV3-21/IGKV1-5;
IGHV3-21/IGKV3-15;IGHV3-30/IGLV1-51;IGHV3-21/IGLV1-51;和IGHV1-69/IGKV3-11。
[0278] 在一些实施方案中,所述抗体的所述功能片段选自由Fab、F(ab′)2、Fab’、Fv和scFv组成的组。
[0279] 在一些方面,本发明包括编码公开的抗体集合的核酸的集合。在一些方面,本发明包括含编码公开的抗体集合的核酸的载体。在一些方面,本发明包括含编码公开的抗体集合的核酸的重组宿主细胞。在一些实施方案中,重组宿主细胞是原核的或真核的。在一些实施方案中,重组宿主细胞是大肠杆菌或哺乳动物细胞。
[0280] 在一些方面,本发明包括含可变重链构架区和可变轻链构架区的合成抗体或其功能片段的集合,
[0281] 其中所述构架区包括种系蛋白序列,
[0282] 其中所述种系蛋白序列包含如下特性:
[0283] i)在互补决定区中四个或更少的翻译后修饰;
[0284] ii)在互补决定区中两个或更少的甲硫氨酸;
[0285] iii)一个或更少的未成对半胱氨酸;
[0286] iv)一个或更少的潜在T细胞表位;
[0287] v)中等或低的聚集倾向;和
[0288] vi)至少7.5的等电点;且
[0289] 其中所述抗体或其功能片段的集合包括至少两种不同的可变重链种系蛋白序列,[0290] 其中所述种系蛋白序列由种系基因序列编码。
[0291] 在一些实施方案中,所述可变重链或可变轻链种系基因序列以至少0.5%的浓度存在于人免疫组库中。在一些实施方案中,所述抗体或其功能片段的集合包括至少五种不同的可变重链种系蛋白序列。在一些实施方案中,所述抗体或其功能片段包括人序列。在一些实施方案中,所述可变重链或可变轻链种系基因序列以至少5.0%的浓度存在于人免疫组库中。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的FR1、CDR1、FR2、CDR2和FR3。在一些实施方案中,所述抗体或其功能片段包括选自由以下组成的组的FR4区:JH4、Jκ1和Jλ2/3。在一些实施方案中,所述抗体或其功能片段还包括多样化的HCDR3区。在一些实施方案中,所述抗体或其功能片段还包括多样化的LCDR3区。在一些实4
施方案中,集合包括1×10 种抗体或其功能片段。
[0292] 在一些实施方案中,所述可变重链种系蛋白序列选自由以下组成的组:IGHV3-23;IGHV3-30;IGHV4-39;IGHV4-34;IGHV4-59;IGHV1-69;IGHV5-51;IGHV3-7;IGHV1-18;
IGHV3-48;IGHV3-15;IGHV3-21;IGHV1-2;IGHV3-33;IGHV4-31;IGHV3-53;IGHV3-11;
IGHV3-9;IGHV4-4;IGHV1-46;IGHV3-74;IGHV1-24;IGHV4-61;IGHV1-8;IGHV1-3;
IGHV3-49;IGHV3-43;IGHV4-28;IGHV3-64;和IGHV7-81。
[0293] 在一些实施方案中,所述可变κ轻链种系蛋白序列选自由以下组成的组:IGKV3-20;IGKV1-39/1D-39;IGKV1-5;IGKV3-15;IGKV4-1;IGKV3-11;IGKV2-28/2D-28;
IGKV1-33/1D-33;IGKV2-30;IGKV1-9;IGKV1-17;IGKV1-27;IGKV1-8;IGKV1-16;IGKV1-6;
IGKV1-12;IGKV2D-29;IGKV1-13;IGKV1D-8;和IGKV2-24。
[0294] 在一些实施方案中,所述可变λ轻链种系蛋白序列选自由以下组成的组:IGLV2-14;IGLV1-40;IGLV1-44;IGLV1-51;IGLV2-23;IGLV3-21;IGLV1-47;IGLV3-1;
IGLV2-11;IGLV2-8;IGLV6-57;IGLV3-25;IGLV7-46;IGLV1-36;IGLV7-43;IGLV9-49;
IGLV4-69;IGLV2-18;IGLV3-10;和IGLV3-27。
[0295] 在一些方面,本发明包括生产公开的合成抗体或其功能片段的集合的方法。在一些实施方案中,生产步骤还包括产生含可变重链和可变轻链构架区的抗体或其功能片段的集合,
[0296] 其中所述可变重链构架区和可变轻链构架区包含种系蛋白对的种系蛋白序列,[0297] 其中所述种系蛋白对包含如下特性:
[0298] i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
[0299] ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
[0300] iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
[0301] iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
[0302] v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
[0303] vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性;且
[0304] 其中所述抗体或其功能片段的集合包括至少两个不同的种系蛋白对。
[0305] 在一些实施方案中,生产步骤还包括如下步骤:
[0306] a)获得包括在人免疫组库中存在的可变重链和可变轻链种系基因对的数据;
[0307] b)鉴定包含如下特性的可变重链和可变轻链种系蛋白对:
[0308] i)以Fab形式的相对展示率包括在采样的前75%Fab中的值;
[0309] ii)与Fab pMx11_FH VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;
[0310] iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;
[0311] iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
[0312] v)与MOR03080相比至少0.4的以IgG形式的表达水平;和
[0313] vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性;和
[0314] c)产生包含在步骤b)中鉴定的种系蛋白对的可变重链种系蛋白序列和可变轻链种系蛋白序列的抗体或其功能片段的集合。
[0315] 在一些实施方案中,步骤b)还包括如下步骤:
[0316] ba)鉴定以至少0.05%的浓度存在于人免疫组库中的可变重链和可变轻链种系基因对;
[0317] bb)产生包含在步骤ba)中鉴定的种系蛋白对的抗体或其功能片段;和[0318] bc)评估所述种系蛋白对的如下特性:
[0319] i)以Fab形式的相对展示率;
[0320] ii)以Fab形式的表达水平;
[0321] iii)以Fab形式在60℃或更高温度的热稳定性;
[0322] iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;
[0323] v)以IgG形式的表达水平;和
[0324] vi)以IgG形式在37℃持续十四天的在牛血清中的稳定性。
[0325] 在一些实施方案中,步骤a)还包括如下步骤:
[0326] aa)从样品中分离人B细胞;
[0327] ab)从所述B细胞产生cDNA;
[0328] ac)PCR扩增来自B细胞的cDNA;
[0329] ad)对所述PCR产物测序;
[0330] ae)鉴定每种PCR产物的种系基因。
[0331] 在一些实施方案中,产生集合的步骤还包括如下步骤:
[0332] ca)合成编码所述抗体或其功能片段的核酸;
[0333] cb)将所述核酸克隆到载体中;
[0334] cc)表达所述抗体或其功能片段。
[0335] 在一些实施方案中,所述种系基因对以至少0.05%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0.23%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0.51%的浓度存在于人免疫组库中。在一些实施方案中,所述种系基因对以至少0.07%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.52%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述种系基因对以至少0.88%的浓度存在于幼稚的人免疫组库中。在一些实施方案中,所述抗体或其功能片段包括人序列。在一些实施方案中,所述抗体或其功能片段包括至少十七个不同的种系蛋白对的种系蛋白序列。在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的一个或更多个互补决定区。
[0336] 在一些实施方案中,所述抗体或其功能片段包括含种系蛋白序列的FR1、CDR1、FR2、CDR2和FR3。在一些实施方案中,所述抗体或其功能片段包括选自由以下组成的组的FR4区:JH4、Jκ1和Jλ2/3。在一些实施方案中,所述抗体或其功能片段包括多样化的HCDR3区。在一些实施方案中,所述抗体或其功能片段包括多样化的LCDR3区。在一些实施4
方案中,集合包括1×10 种抗体或其功能片段。
[0337] 在一些实施方案中,所述种系蛋白对包括含在采样的前60%Fab中的值的以Fab形式的相对展示。在一些实施方案中,所述种系蛋白对包括与Fab VH1-69VLA_Vl1-40AYA相比至少0.6的以Fab形式的表达水平。在一些实施方案中,所述种系蛋白对包括以Fab形式在70℃或更高温度持续至少45分钟的热稳定性。在一些实施方案中,所述种系蛋白对包括与MOR03080相比至少0.6的以IgG形式的表达水平。
[0338] 在一些实施方案中,可变重链和可变轻链构架区包括选自由以下组成的组的种系蛋白对的种系蛋白序列:IGHV3-23/IGKV1-5;IGHV3-23/IGKV3-20;IGHV4-39/IGKV3-15;IGHV3-23/IGKV3-15;IGHV4-59/IGKV1-39/1D-39;IGHV4-39/IGKV1-39/1D-39;IGHV4-59/IGKV3-20;IGHV1-18/IGKV3-20;IGHV3-30/IGKV3-20;IGHV4-39/IGKV1-5;IGHV1-69/IGKV1-39/1D-39;IGHV5-51/IGLV1-40;IGHV3-23/IGKV4-1;IGHV4-39/IGKV3-20;
IGHV3-23/IGLV2-14;IGHV4-39/IGLV3-21;IGHV3-23/IGKV1-39/1D-39;IGHV3-30/IGKV1-39/1D-39;IGHV3-30/IGKV3-11;IGHV1-69/IGKV3-20;IGHV3-48/IGKV3-20;
IGHV1-2/IGKV3-20;IGHV3-30/IGKV4-1;IGHV5-51/IGLV2-14;IGHV4-59/IGKV4-1;
IGHV5-51/IGKV3-20;IGHV3-7/IGKV1-39/1D-39;IGHV3-7/IGKV1-5;IGHV3-15/IGKV3-20;
IGHV4-39/IGLV2-14;IGHV4-39/IGLV2-8;IGHV3-23/IGKV3-11;IGHV3-30/IGKV1-5;
IGHV3-30/IGKV3-15;IGHV3-21/IGKV1-5;IGHV3-21/IGKV3-15;IGHV3-30/IGLV1-51;
IGHV3-21/IGLV1-51;IGHV3-53/IGLV1-44;IGHV4-59/IGKV3-15;IGHV5-51/IGKV4-1;
IGHV1-69/IGKV4-1;和IGHV1-69/IGKV3-11。
[0339] 在一些方面,所述抗体的所述功能片段选自由Fab、F(ab′)2、Fab’、Fv和scFv组成的组。
[0340] 在一些方面,本发明包括编码含C端限制酶切位点的信号序列或前导序列的分离的核酸。在一些实施方案中,限制酶切位点是NheI。在一些实施方案中,信号序列或前导序列包括phoA或人重链前导序列。在一些实施方案中,限制酶切位点是NdeI。在一些实施方案中,信号序列包括ompA或人κ前导序列。
[0341] 在一些方面,本发明包括含如下核酸的载体:所述核酸编码含C端限制酶切位点的信号序列或前导序列。在一些方面,本发明包括含所述载体的宿主细胞。在一些实施方案中,宿主细胞是原核的或真核的。在一些实施方案中,宿主细胞是大肠杆菌。在一些实施方案中,宿主细胞是哺乳动物细胞。
[0342] 在一些方面,本发明包括含FR1、CDR1、FR2、CDR2和FR3的分离的抗体或其功能片段,所述FR1、CDR1、FR2、CDR2和FR3包含种系蛋白对的种系蛋白序列,
[0343] 其中所述种系蛋白对选自由以下组成的组:
[0344] IGHV3-23/IGKV1-5;IGHV3-23/IGKV3-20;IGHV4-39/IGKV3-15;IGHV3-23/IGKV3-15;IGHV4-39/IGKV1-39/1D-39;IGHV1-18/IGKV3-20;IGHV3-30/IGKV3-20;IGHV4-39/IGKV1-5;IGHV1-69/IGKV1-39/1D-39;IGHV5-51/IGLV1-40;IGHV4-39/IGKV3-20;IGHV3-23/IGLV2-14;IGHV4-39/IGLV3-21;IGHV3-23/IGKV1-39/1D-39;
IGHV3-30/IGKV1-39/1D-39;IGHV1-69/IGKV3-20;IGHV3-48/IGKV3-20;IGHV1-2/IGKV3-20;IGHV3-30/IGKV4-1;IGHV5-51/IGLV2-14;IGHV5-51/IGKV3-20;IGHV3-7/IGKV1-39/1D-39;IGHV3-7/IGKV1-5;IGHV3-15/IGKV3-20;IGHV4-39/IGLV2-14;IGHV3-23/IGKV3-11;IGHV3-30/IGKV1-5;IGHV3-30/IGKV3-15;IGHV3-21/IGKV1-5;IGHV3-21/IGKV3-15;IGHV3-30/IGLV1-51;IGHV3-21/IGLV1-51;和IGHV1-69/I。
[0345] 一方面,本公开内容描述了包括含可变重链和轻链构架区(具体是FR1)的抗体的集合,所述可变重链和轻链构架区包含种系序列。预期具有种系构架区将降低抗体在施用至患者时的免疫原性风险。然而,必须使用限制酶切位点以使得能将编码抗体集合的核酸标准地克隆到展示载体和/或表达载体中,以便可针对免疫原筛选抗体。过去,用于克隆的限制酶切位点通常位于构架区内,从而修饰核酸序列远离种系。为了确保本公开内容的每种抗体的至少构架1(FR1)区保持种系序列,在FR1内应该没有任何非天然存在的限制酶切位点。因此,本公开内容的一个方面是在原核信号序列和人前导序列的C端内具体是在三个C端残基内掺入限制酶切位点。另外,包含限制酶切位点的信号序列和前导序列必须是有功能的并且容许抗体或其片段在原核和哺乳动物表达系统中均有良好的展示和表达水平。
[0346] 在一些方面,本发明包括编码含C端限制酶切位点的信号序列或前导序列的分离的核酸。在一些实施方案中,限制酶切位点是NheI或NdeI。在一些实施方案中,信号序列或前导序列包括phoA或人重链前导序列。在一些实施方案中,信号序列或前导序列包括ompA或人κ前导序列。在一些方面,本发明包括含如下分离的核酸的载体:所述分离的核酸编码含C端限制酶切位点的信号序列或前导序列。在一些方面,本发明包括含编码具有C端限制酶切位点的信号序列或前导序列的分离的核酸的宿主细胞或含编码具有C端限制酶切位点的信号序列或前导序列的分离的核酸的载体。在一些实施方案中,相应的宿主细胞是原核的,例如大肠杆菌,或是真核的,例如哺乳动物细胞。
[0347] 本公开内容第一次公开如下概念:在幼稚的人免疫组库中最普遍的VH和VL类对可能具有优选的特征,如更大的稳定性和更低的免疫原性。本公开内容还第一次将这种概念引入集合设计中并且利用全基因合成来产生这些集合。本公开内容使得鉴定幼稚的和经历抗原的人免疫组库中的VH和VL类对、确定最普遍的VH和VL类对并然后产生包含这些VH和VL类对的集合的方法成为可能。更具体而言,本公开内容的集合包括具有高度多样化的CDR的最普遍的和/或最优选的VH和VL类配对。这种策略提高了集合包括稳定的、具有低免疫原性和对特定抗原的高亲和力的针对任何免疫原的抗体或其片段的概率。该结果极大地提高了集合包括可用于治疗或诊断目的的针对任何免疫原的高度有效的抗体或其片段的概率。
[0348] 因此,可对从人宿主的幼稚B细胞获得的编码抗体或其片段的核酸序列(或其选定部分)进行测序。从这些序列数据,可鉴定在免疫组库中代表性的种系家族VH/VL链类配对。基于某些指标如普遍性(prevalence)和/或有利的生物物理特性,选择重链和轻链类对掺入集合中。然后可通过基因合成来合成集合。在一些实施方案中,合成的集合包括基本上的种系VH和VL构架区,其中CDR是多样化的,或者VH和/或VL仅一个CDR是多样化的。
[0349] 使用从人宿主的幼稚B细胞获得的DNA序列作为“模板”,本公开内容使得鉴定最普遍的VH和VL对的方法成为可能。一旦阐明VH和VL类对的相对丰度,就可以产生包含最普遍的和/或最优选的VH和VL类对的抗体或其片段的高度多样的集合。利用这种信息,技术人员能够产生高度的多样性而不牺牲可归因于最普遍的和/或最优选的VH和VL类对组合的关键益处。在本公开内容之前,没有人阐释最普遍的和/或最优选的VH和VL类对或尝试将该知识应用到文库产生技术中。因此,这种方法提供了编码代表幼稚的人免疫系统的抗体或其片段的核酸的全面的集合。
[0350] 利用本文公开的集合设计和展示方法,可产生大多样性的集合,因为一些实施方10
案包括至少1×10 种成员的集合。
[0351] 在一些方面,本公开内容使得包含公开的核酸集合的载体和宿主细胞成为可能。
[0352] 在一些方面,本公开内容使得生产这些集合的方法成为可能。
[0353] 在一些实施方案中,在单独步骤中获得代表人免疫组库的幼稚DNA序列,并将其储存在数据库中;因此集合设计可经由计算机模拟被容易地改变、优化和定制,容许通常可在合成文库中实现的定制水平。
[0354] 在一些方面,本公开内容使得利用所公开的集合鉴定抗体或其片段的方法成为可能。
[0355] 在一些方面,本发明涉及编码抗体或其片段的集合或文库,所述抗体或其片段包含由免疫组库中丰富和/或优选的VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,编码抗体或其片段的核酸是种系、基本上的种系或其密码子优化的变体。这些集合或文库可包括具有有利的生物物理特性的VH和VL种系家族和/或基因,所述有利的生物物理特性包括:在噬菌体上的高度展示;以Fab形式在大肠杆菌中的高表达;以IgG形式在哺乳动物细胞中的高表达;高热稳定性;血清稳定性;低聚集倾向(即,高溶解性);和低免疫原性风险。在一些实施方案中,集合或文库可包括存在于幼稚的人免疫组库中的VH和VL种系家族和/或基因。相关的实施方案包括制备和使用这些集合的方法。
[0356] 在一些方面,本发明涉及编码抗体或其片段的集合或文库,所述抗体或其片段包含由免疫组库中丰富和/或优选的VH和VL种系家族和/或基因以及免疫组库中丰富和/或优选的VH/VL类对编码的种系蛋白序列。在一些实施方案中,编码抗体或其片段的核酸是种系、基本上的种系或其密码子优化的变体。这些集合或文库可包括由具有有利的生物物理特性的VH和VL种系家族和/或基因和/或VH/VL类对编码的种系蛋白序列,所述有利的生物物理特性包括:在噬菌体上的高度展示;以Fab形式在大肠杆菌中的高表达;以IgG形式在哺乳动物细胞中的高表达;高热稳定性;血清稳定性;低聚集倾向(即,高溶解性);和低免疫原性风险。在一些实施方案中,集合或文库可包括由存在于幼稚的人免疫组库的VH和VL种系家族和/或基因和/或VH/VL类对编码的种系蛋白序列。相关的实施方案包括制备和使用这些集合的方法。
[0357] 因此,本发明包括编码基本上代表免疫组库的抗体或其片段的核酸的集合,其中每种抗体或其片段包括VH/VL类对,其中基本上代表免疫组库是使得该集合中存在的每个VH/VL类对为在免疫组库中以至少0.05%、至少1%或至少2%的VH/VL类对的浓度存在的VH/VL类对。免疫组库可以是个体或群体,并且可以是幼稚的。这种免疫组库可被测定为如5
下VH/VL类对的免疫组库,例如:在来自个体的至少1×10 个B细胞中的VH/VL类对;在来
5 5
自多个个体的群体的至少1×10 个B细胞中的VH/VL类对;或存在于至少1×10 种抗体中的VH/VL类对。免疫组库可以是幼稚B细胞或经历抗原的B细胞的免疫组库。个体或群体可以是人。免疫组库可通过分析公开可用的数据库和/或文献来确定。
[0358] 在一些实施方案中,编码抗体或其片段的核酸是合成的,如通过全基因合成而产生。在相关的实施方案中,核酸是种系序列;基本上的种系序列;或是种系或基本上的种系序列的密码子优化的变体。在一些实施方案中,CDR中至少一个是高度多样化的。
[0359] 在一些实施方案中,本公开内容的集合包括抗体或其片段,其中VH和VL二者的FR1、FR2和FR3包括具有优选特征的VH和VL类对的种系蛋白序列。最优选地,本公开内容的集合包括抗体或其片段,其中VH和VL二者的FR1、FR2和FR3包括具有优选特征的VH和VL类对的种系蛋白序列,其中VH和VL二者的CDR3是高度多样化的。
[0360] 在相关的实施方案中,所述编码抗体或其片段的核酸的集合被克隆到载体中。适合的载体是本领域已知的,并且包括展示载体如噬菌体展示载体、质粒载体、噬菌粒载体、包括细菌表达载体或哺乳动物表达载体的表达载体。在另外的相关实施方案中,集合或克隆到载体中的集合被转化到宿主细胞中。因此,本发明包括宿主细胞的集合。适合的宿主细胞包括原核宿主细胞(如大肠杆菌)和真核宿主细胞(如哺乳动物宿主细胞)。
[0361] 在另一实施方案中,本发明是包含来自约1345个幼稚的人B细胞或来自可读介质上的公开可用的序列的VH/VL类对的数据库。这种数据库可用于本发明的集合和文库的设计和构建。
[0362] 本发明还包括生产编码基本上代表免疫组库的抗体或其片段的核酸的集合的方法。免疫组库可以是一人或多人的幼稚B细胞或经历抗原的B细胞的免疫组库。这种方法可包括如下步骤:(a)鉴定以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对。
[0363] 该鉴定步骤可以不同方式进行。例如,鉴定VH/VL类对可包括从一个或多个人宿主中分离幼稚B细胞,并且通过分离并测序编码VH/VL类对的DNA、mRNA或cDNA或通过用对每个VH和VL特异的一种或多种核酸探针探测来确定每个B细胞中的VH/VL类对,然后分析VH/VL类对。在可选的或补充的实施方案中,VH/VL类对可以从预先存在的数据库如抗体序列数据库中确定。在可选的或补充的实施方案中,VH/VL类对可以从文献鉴定。因而,在一个实施方案中,本发明包括获得抗体核酸序列(预先存在的或重新产生的抗体核酸序列),通过序列比对确定VH/VL类对,并且核对这些序列以鉴定免疫组库中存在的VH/VL类对。
[0364] 在一些实施方案中,使用所述方法来产生其中大多数成员具有促进抗体或其片段的生产和表达(例如在噬菌体上或从细胞)的有利的生物物理特性的集合,并且生产可溶的、热稳定的抗体。更具体地说,这些特性包括:(i)有效地展示在噬菌体上;(ii)有效地展示在哺乳动物细胞上;(iii)以Fab形式很好地表达在大肠杆菌中;(iv)以IgG形式很好地表达在哺乳动物细胞中;(v)热稳定性;(vi)可溶性;和(vii)低免疫原性。通过确定具有这些特性中的一些或全部特性的VH/VL类对,人们可以例如通过只合成那些具有这类特性的核酸来构建其中大多数成员具有这些生物物理特性的集合。因此,本发明包括这种集合以及制备这种集合的方法。
[0365] 在一些实施方案中,合成的核酸是种系、基本上的种系或其密码子优化的变体。可将变异引入至少一个互补决定区(CDR)中。任何CDR是合适的,尤其是CDR3。优选地,添加至CDR的序列变异限于框内序列并且不含半胱氨酸和终止密码子,由此确保文库的所有成员被正确地表达。
[0366] 合成了核酸后,可将其克隆到载体(如展示载体、噬菌体展示载体;噬菌粒载体;或哺乳动物表达载体)中,并且可将其转化到宿主细胞中。适合的宿主细胞包括原核宿主细胞(例如大肠杆菌)和真核宿主细胞(例如哺乳动物宿主细胞)。
[0367] 在另外的实施方案中,本发明提供了鉴定对免疫原特异的抗体的方法。在一个实施方案中,这种方法可以包括鉴定以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;对编码包含以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对的抗体或其片段的核酸的集合进行合成;展示或表达该集合的抗体或其片段;针对特定免疫原筛选该集合;并且选择对所述免疫原特异的至少一种抗体或其片段。因为本发明的方法和集合可以按照有利的生物物理特性来构建,所以通过制备编码具有这些有利特性的抗体或其片段的核酸的集合并针对特定免疫原进行筛选来鉴定结合这种免疫原的抗体,本发明对于鉴定用于治疗疾病或病症的抗体或其抗体片段是特别有用的。
[0368] 在一些方面,本发明涉及包含VH/VL对的抗体或其片段的集合或文库。在一些实施方案中,抗体或其片段的集合或文库包含由免疫组库中丰富的VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,本发明涉及包含由具有某些有利的生物物理特征的VH和VL种系家族和/或基因编码的种系蛋白序列的抗体或其片段的集合或文库。在一些实施方案中,VH和VL种系家族和/或基因是免疫组库中天然存在的那些,并且在该文库中是更丰富的或更普遍的。在一些实施方案中,抗体或其片段的集合或文库包含由VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,抗体或其片段的集合或文库包括来自种系、基本上的种系或密码子优化的VH和VL种系家族和/或基因的构架区和/或CDR区。在一些实施方案中,抗体或其片段的集合或文库包含由合成的、通过全基因合成而构建的VH和VL种系家族和/或基因编码的种系蛋白序列。在一些实施方案中,抗体或其片段的集合或文库包含由合成的、通过全基因合成而构建的VH和VL种系家族和/或基因的部分。在一些实施方案中,抗体或其片段的集合或文库包括由具有有利的生物物理特性的VH和VL种系家族和/或基因编码的种系蛋白序列,所述有利的生物物理特性帮助筛选和进一步研发尤其是在治疗背景下的抗体。有利的生物物理特性包括但不限于:(i)它们以Fab形式被很好地展示在噬菌体上;(ii)它们以IgG形式被很好地展示在哺乳动物细胞上;(iii)它们以Fab形式被大量表达在例如大肠杆菌中,以及以IgG形式被大量表达在例如哺乳动物细胞中;(iv)是热力学稳定的;(v)具有高血清稳定性;(vi)具有低聚集倾向(即高可溶性);和(vii)具有低免疫原性风险。
[0369] 在其他方面,本公开内容的集合包括含优选的VH和VL类对的种系蛋白序列的抗体或其片段。本公开内容的集合优选地包括抗体或其片段,其中一个或更多个构架区包括由具有优选的特征的VH和VL类对编码的种系蛋白序列,特别是其中VH和VL的FR1、FR2和FR3包括具有优选的特征的VH和VL类对的种系蛋白序列。CDR可以是高度多样化的。优选地,VH和VL二者的CDR3是高度多样化的。在一些实施方案中,VH和/或VL的CDR1和CDR2是种系序列或基本上的种系序列。
[0370] 这种策略提高了本公开内容的集合包括能够被开发用于治疗用途的针对任何免疫原的抗体或其片段的概率,因为集合中存在的大多数抗体或其片段包括具有以上优选特征的VH和VL对的种系序列。选择的抗体还将具有低免疫原性和对特定抗原的高亲和力。该结果极大地提高了从公开的集合选择的抗体或其片段针对任何免疫原是高效的且可被研发用于治疗或诊断目的的概率。
[0371] 这些集合克服了现有技术的许多问题。例如,在源自B细胞的同源文库中,该文库存在的VH和VL类配对取决于样品中存在的类配对。如果取得足够大的B细胞样品,大约50个VH和50个VL的类配对组合(约2500个)中的每一个都将存在。存在如此多的VH和VL类对可比拟背景噪声。产生只包括最普遍的VH和VL类对的大多样性的文库可能是令人期望的,但是对于同源文库方法,这是不可能的。
[0372] 此外,在一些实施方案中,集合所基于的DNA序列是从未经历抗原的幼稚B细胞的样品获得,因此,所表达的成员不偏向于特定抗原并且可以使用集合来针对任何免疫原进行筛选。
[0373] 因此,可对从人宿主的幼稚(未经历抗原的)B细胞获得的编码抗体或其片段的核酸序列(或其选定部分)进行测序。从这些序列数据,可鉴定在免疫组库中主要代表的种系家族VH/VL链类配对。基于某些指标如普遍性,选择重链和轻链类对加入集合中。然后可通过基因合成来合成集合。在一些实施方案中,合成的集合包括基本上的种系VH和VL构架区,其中CDR是多样化的。
[0374] 利用从例如人宿主的幼稚(未经历抗原的)B细胞或从公开可用的数据库或文献获得的DNA序列作为“模板”,本公开内容使得鉴定最普遍的VH和VL种系家族和/或基因和/或类对的方法成为可能。阐释了VH和VL种系家族和/或基因和/或类对的相对丰度后,就可以测试包含由VH和VL种系家族和/或基因和/或类对编码的种系蛋白序列的抗体或其片段的如下优选特征:(i)它们以Fab形式被很好地展示在噬菌体上;(ii)它们以Fab形式和IgG形式被大量表达;(iii)并且它们是热力学稳定的。通过测试由最普遍的VH和VL种系家族和/或基因和/或类对编码的种系蛋白序列,可鉴定具有优选特征的那些。利用这种信息,技术人员能够产生高度的多样性而不牺牲可归因于最普遍的VH和VL种系家族和/或基因和/或类对组合的关键益处。
[0375] 利用本文公开的集合设计和展示方法,可产生大多样性的集合,因为一些实施方10
案包括至少1×10 种成员的集合。
[0376] 本公开内容总体上涉及包含具有最优选的特征的VH和VL类对的合成抗体集合。在一些实施方案中,集合包括由类对代表的VH和VL家族编码的种系蛋白序列。
[0377] 本公开内容总体上涉及包含具有优选的特征的一个或更多个VH和VL类对的合成抗体集合。在一些方面,集合包括由类对代表的VH和VL家族编码的种系蛋白序列。
[0378] 在一些方面,本公开内容使得鉴定在免疫组库中最普遍的VH和VL种系基因、测试具有最普遍的VH和VL种系基因序列的抗体以鉴定具有优选特征的VH和VL种系基因、并然后产生包含优选的VH和VL类对的集合的方法成为可能。本公开内容使得鉴定在人免疫组库(可能是幼稚的)中的VH和VL类对、确定最普遍的VH和VL类对、测试这些VH和VL类对以鉴定具有优选特征的VH和VL类对、并然后产生包含优选的VH和VL类对的集合和/或源自于优选的VH和VL种系基因的抗体的方法成为可能。一旦鉴定了VH和VL和/或VH和VL类对,就鉴定了它们相应的种系序列,这样可将种系序列加入到集合设计中。
[0379] 在一些方面,本公开内容使得包含公开的核酸集合的载体和宿主细胞成为可能。
[0380] 在一些方面,本公开内容使得生产这些集合的方法成为可能。
[0381] 在一些实施方案中,在单独步骤中获得代表人免疫组库的DNA序列,并将其储存在数据库中;因此,集合设计可经由计算机模拟被容易地改变、优化和定制,容许通常可在合成文库中实现的定制水平。
[0382] 在一些方面,本公开内容使得利用所公开的集合鉴定抗体或其片段的方法成为可能。
[0383] 方法、核酸、蛋白、载体、宿主细胞
[0384] 在一方面,本公开内容使得由全基因合成产生的核酸的集合成为可能。基因合成技术近年已取得相当大的进展并且可产生非常大的核酸集合。以下公司提供了这种合成服务:Entelechon(Regensburg、Germany)、Geneart(Regensburg、Germany)和Sloning Biotechnology(Puchheim、Germany)。为了使基因合成公司得以产生集合,可提供该集合的每个成员的序列。
[0385] 在一些实施方案中,本公开内容使得编码包含以至少0.05%的VH和VL类对的浓5
度存在于至少1×10 个B细胞的样品中的VH和VL类对的抗体或其片段的合成核酸的集合成为可能。在其他实施方案中,本公开内容的集合包括以至少1%的VH和VL类对的浓度
5
存在于至少1×10 个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的
5
集合包括以至少1.5%的VH和VL类对的浓度存在于至少1×10 个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的集合包括以至少2%的VH和VL类对的浓度
5
存在于至少1×10 个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的
5
集合包括以至少3%的VH和VL类对的浓度存在于至少1×10 个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的集合包括以至少4%的VH和VL类对的浓度存
5
在于至少1×10 个B细胞的样品中的VH和VL类对。在其他实施方案中,本公开内容的集
5
合包括以至少5%的VH和VL类对的浓度存在于至少1×10 个B细胞的样品中的VH和VL类对。
[0386] 在一些实施方案中,本公开内容使得其中从分离自人宿主的B细胞中鉴定VH和VL类对的集合成为可能。在一些实施方案中,B细胞是幼稚的。在一些实施方案中,核酸的集合编码包含VH和VL构架区的抗体或其片段。在优选的实施方案中,核酸的集合被合成包括具有多样化的CDR的种系VH和VL构架区。种系构架区是令人期望的,因为包含种系构架区的抗体或其片段不可能具有免疫原性。
[0387] 利用本文公开的集合设计和展示方法,可产生大多样性的集合,因为一些实施方4 5 6 7 8 9
案包括至少1×10 种核酸序列的集合,一些实施方案包括至少1×10、10、10、10、10、
10 11 12
10 、10 或10 种核酸序列的集合。这种多样性是通过合成包括如下成员的集合而产生:
所述成员包括具有多样化的CDR的普遍的VH和VL类对。
[0388] 本公开内容的集合是从基本上代表免疫组库的序列数据而设计。在一些实施方案中,序列数据是通过检索公开可用的免疫球蛋白序列表而获得。例如,可利用Ig-Blast检索NCBI或者可检索公开可用的文献。到2005年为止,该数据库包括至少25,000种FASTA格式的人重排抗体序列。在22,500个条目中,13,235个代表VH序列,1,506个代表Vκ并且2,259个代表Vλ。从这些序列中,VH、Vκ和Vλ可归类为其对应的种系家族和/或基因。因为一些Ig-Blast包括完全的抗体序列,每个VH和VL结构域类配对的正确的种系家族和/或基因可从数据库序列确定。如果利用这种方法,本领域技术人员能够容易地确定每个VH和VL种系家族和/或基因的突出性(prominence)和/或每个VH和VL结构域类对的种系家族和/或基因。选择哪些VH和VL和/或VH和VL类对加入文库中能够以许多方式完成。在一些实施方案中,选择具有最高普遍性的VH和VL加入集合或文库中。在一些实施方案中,选择具有有利的生物物理特性的VH和VL加入集合或文库中。在一些实施方案中,选择具有最高普遍性的VH和VL类对加入集合或文库中。在一些实施方案中,选择具有有利的生物物理特性的VH和VL类对加入集合或文库中。在一些实施方案中,选择具有最高普遍性和/或有利的生物物理特性的VH和VL和/或具有最高普遍性的VH和VL类对和/或具有有利的生物物理特性的VH和VL类对加入集合或文库中。
[0389] 这种方法的一个缺点是公开可用的数据库通常填充了针对特定免疫原而产生的抗体的序列,因此这些序列是有偏性的。此外,在大部分数据库中,重链和轻链的序列是不相联系的,因此不能鉴定VH和VL类配对。
[0390] 在一些实施方案中,核酸序列通过如下方式获得:从一个或更多个宿主收获B细胞,从B细胞分离DNA,并且优选地对DNA测序。优选地,B细胞是幼稚的。B细胞的样品是从一个或更多个人供体收获的。以下是可用于分离B细胞的技术。通过使用以抗CD43和抗Mac-1/CD11b单克隆抗体(例如经磁性微珠)针对其他细胞类型的阴性选择从脾脏中分离静息B淋巴细胞(B细胞)。这种策略从脾细胞的混合群中去除非B细胞并且依靠如下事实:除了静息的脾B细胞之外大多数成熟的白细胞表达CD43(事实上,除了粒细胞、单核细胞、巨噬细胞、血小板、自然杀伤(NK)细胞、胸腺细胞和外周CD8+细胞和大多数CD4+T细胞之外,CD43的表达显示在不成熟的B细胞、浆细胞和某些成熟细胞上)。抗Mac-1/CD11b微珠被包括在阴性选择中以改善髓样细胞的除去。通过利用AutoMACS自动磁珠细胞分选仪(Miltenyi Biotec),B细胞分离可以是自动化的。如通过B220+细胞的荧光分析所评7
定的,这种分离常规地产生>95%纯的大约4×10 个B细胞/脾脏。还参见Miltenyi S,Muller W,Weichel W和Radbruch A.(1990)Cytometry 11(2),231-238。
[0391] 所收获的B细胞的数目基本上代表免疫组库。在一些实施方案中,至少1×104个5 6 7
B细胞从宿主分离,更优选至少10 个B细胞、更优选至少10 个B细胞、最优选10 个B细胞从宿主分离。
[0392] 编码来自B细胞的抗体或其片段的DNA被分离并扩增,例如,重链和轻链通过PCR反应连接。DNA被优选地测序。测序的DNA可以是从B细胞mRNA产生的cDNA。从真核细胞如B细胞提取mRNA是公知的技术程序。存在许多技术方案并且商业试剂盒是可用的。如PolyATtract mRNA分离系统(Promega,Madison,WI,USA)或多种RNeasy和Oligotex DirectmRNA试剂盒(均来自于Qiagen,Hilden,Germany)。这些技术中许多利用真核mRNA的聚腺苷酸尾,例如经由对oligo(dT)基质如oligo(dT)纤维素的亲和纯化。
[0393] 可以利用特定引物经反转录接着通过常规PCR从分离的mRNA选择性扩增cDNA。特定引物用于扩增可变重链和可变轻链结构域核酸。参见Cancer Surv.1997;30:21-44,J Clin.Pathol.1994;47:493-6,J.Clin.Pathol.1990;43:888-90或Mol.Pathol.2002年
4月;55(2):98-101。
[0394] 将编码来自一个B细胞的可变重链和可变轻链结构域的DNA保持在一起,以使得可以鉴定可变结构域重链和轻链类配对。用于分离编码个体B细胞的可变结构域配对的核酸的技术是本领域公知的。见,例如,WO01/92291;WO92/15678;WO93/03151,WO2005/042774;Mullinax RL等人,1992Biotechniques 12:6864-868;Chapal,N.等人1997 Biotechniques 23,518-524,,Embleton MJ等人,1992 Nucleic Acids Res.20:15,
3831-3837;Coronella,J.A.等人2000 Nucleic Acids Res.28:20,E85;Thirion S等人,1996 European Journal of Cancer Prevention 5:6507-511;和Wang,X等人2000 J.Immunol.Methods 20,217-225。
[0395] 这些技术可被单独使用或与其他方法组合使用。例如,如果大样品的可变重链和轻链结构域序列没有从其对应的B细胞中被一起成功地鉴定,那么可完成以下方法,以鉴定正确的可变重链和可变轻链结构域类对。完成了每个个体B细胞的单细胞PCR。
[0396] 优选地,来自每个B细胞的DNA被测序。存在多家能够对整个基因组测序的公司,如Helicos BioSciences Corporation(Cambridge,MA,USA)。Helicos能够用其真实单分TM子测序(True Single Molecule Sequencing )技术直接以高速度和高效率对DNA或RNA的单分子测序。能够进行类似测序工作的其他公司包括Illumina(San Diego,CA,USA;Solexa system)和Roche(Basel,CH;454系统)。在测序之前不需要克隆步骤。
[0397] 在另一方面,本公开内容使得鉴定免疫组库中存在的重链和轻链可变结构域对的种系家族的方法成为可能。使用本领域技术人员已知的方法可将所有抗体或其片段追溯到其种系家族。通过分析编码抗体或其片段的核酸的序列,VH和VL二者的种系家族可通过本领域技术人员已知的方法确定。例如,Wildt等人,(1999)从3位患者中采样B细胞并鉴定了365种VH和VL类配对。将来自每个B细胞的RNA用于cDNA合成并且对编码VH和VL区的cDNA进行PCR扩增和测序。如Wildt的图1所示,某些VH和VL类比其他VH和VL类更频繁配对,例如,VH3-8与Vκ3-1、Vκ3-19、Vκ4-1、Vκ2-3或Vκ1-2,以及VH3-9与Vκ3-1、Vκ3-3或Vκ1-5。
[0398] 在另一方面,本公开内容使得在合成集合之前设计多样化的互补决定区的方法成为可能。CDR可通过本领域公知的方法设计,包括在Knappik等人2000;WO 97/08320中公开的方法。
[0399] 在另一方面,本公开内容使得选择期望被包括在编码抗体或其片段的核酸的集合中的可变结构域类配对的方法成为可能。在一些实施方案中,合成了包含由公开的方法鉴定的所有VH和VL结构域类对的核酸的集合。
[0400] 此外,VH和VL类对的普遍性可通过多种统计检验确定。最简单的形式是,简单地计数个体VH和VL类对。更复杂的统计检验可考虑各种其他参数。通过非限制性实例的方式,以下统计检验和参考文献可作为已在这种或类似的分析中进行大量探讨的实例来指导:贝叶斯压缩估计(Bayesian Shrinkage Estimation)(见例如,Biometrics 59(2003):476-486),DADA(cDNA丰度的数字分析,见例如,BMC Genomics 2002,3:7),线性建模(太平洋生物计算讨论会(Pacific Symposium on Biocomputing),1999,4:41-52)和各种聚类方法(BMC Bioinformatics 2006,7:397,第4次IEEE国际数据挖掘会议(Fourth IEEE International Conference on Data Mining(ICDM′04)),第403-406页)。
[0401] 在其他方面,本公开内容使得包含编码抗体或其片段的核酸集合的载体的集合成为可能。在一些实施方案中,载体包含表达载体、展示载体、噬菌体展示载体或噬菌粒载体。
[0402] 真核表达载体是本领域公知的并且还可商购获得。通常,提供这些载体包含用于插入期望的DNA的便利的限制酶切位点。这些载体的实例包括pSVL和pKSV-10、pBPV-1/PML2d和pTDT1(ATCC,编号31255)。
[0403] 在其他方面,本公开内容使得用公开的载体集合转化的宿主细胞的集合成为可能。宿主细胞可以是真核的或原核的。细菌细胞是优选的原核宿主细胞并且通常是大肠杆菌(Escherichia coli,E.coli)的菌株,诸如,例如,可从Bethesda Research Laboratories,Inc.,Bethesda,Md获得的大肠杆菌菌株DH5。优选的真核宿主细胞包括酵母和哺乳动物细胞,包括鼠类细胞和啮齿类细胞,优选脊椎动物细胞,如来自小鼠、大鼠、猴或人细胞系的细胞。
[0404] 引入载体到宿主细胞中可通过本领域技术人员已知的许多转化或转染方法完成,包括磷酸沉淀、电穿孔、显微注射、脂质体融合、RBC血影(ghost)融合、原生质体融合、病毒感染以及类似方法。单克隆全长抗体、Fab片段、Fv片段和scFv片段的生产是公知的。
[0405] 用重组DNA分子转化适当的细胞宿主是通过通常取决于所用的载体类型的方法而完成。关于原核宿主细胞的转化,见,例如,Cohen等人,Proceedings National Academy of Science,USA,第69卷,第2110页(1972);和Maniatis等人,Molecular Cloning,a Laboratory Manual(分子克隆实验室指南),冷泉港实验室,冷泉港,纽约(1982)。关于用包含rDNA的逆转录病毒载体转化脊椎动物细胞,见例如,Sorge等人,Mol.Cell.Biol.,4:1730-1737(1984);Graham等人,Virol.,52:456(1973);和Wigler等人,Proceedings National Academy of Sciences,USA,第76卷,第1373-1376页(1979)。
[0406] 在另一方面,本公开内容使得包含如下序列数据的试剂盒或数据库成为可能,所5
述序列数据阐述编码如下抗体或其片段的核酸:所述抗体或其片段包含在至少1×10 个幼稚的人B细胞的样品中存在的核酸,其中所述序列数据在可读介质上。
[0407] 在另一方面,本公开内容使得生产编码抗体或其片段的合成核酸的集合的方法成为可能,所述方法包括合成编码包含以至少0.05%的VH和VL类对存在于至少约2500个B细胞的样品中的VH和VL类对的抗体或其片段的核酸的集合。在一些实施方案中,本公开内容使得生产编码基本上代表免疫组库的抗体或其片段的核酸的集合的方法成为可能,所述方法包括:(a)鉴定以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对。在一些实施方案中,鉴定VH/VL类对包括:(i)从一个或更多个人宿主中分离B细胞;(ii)通过选自如下的方法确定每个B细胞中的VH/VL类对:(A)对编码VH/VL类对的DNA、mRNA或cDNA进行分离并测序;或(B)用对每个VH和VL特异的一种或更多种核酸探针进行探测;和(iii)分析VH/VL类对。在一些实施方案中,鉴定VH/VL类对包括:(i)获得抗体核酸序列;(ii)通过序列比对确定VH/VL类对;(iii)核对这些来自至少100种抗体的序列以鉴定在免疫组库中存在的VH/VL类对。在一些实施方案中,这些方法包括选择显示选自以下组成的组的至少一种生物物理特性的VH/VL类对:(i)有效地展示在噬菌体上;(ii)有效地展示在哺乳动物细胞上;(iii)以Fab形式很好地表达在大肠杆菌中;(iv)以IgG形式很好地表达在哺乳动物细胞中;(v)热稳定性;(vi)可溶性;和(vii)低免疫原性;以及合成编码显示至少一种所述生物物理特性的抗体或其片段的核酸的集合。在一些实施方案中,编码抗体或其片段的核酸的集合是种系、基本上的种系或密码子优化的种系核酸的变体。在一些实施方案中,在合成编码含VH/VL类对的抗体或其片段的核酸的集合的过程中,将序列变异引入至少一个互补决定区(CDR)中。在一些实施方案中,序列变异限于不含终止密码子的序列。在一些实施方案中,这些方法还包括将核酸的集合克隆到载体中。在一些实施方案中,载体选自以下组成的组:(i)展示载体,(ii)噬菌体展示载体;(iii)噬菌粒载体;和(iv)哺乳动物表达载体。在一些实施方案中,这些方法还包括转化到宿主细胞中。在一些实施方案中,宿主细胞选自由以下组成的组:(i)原核宿主细胞;(ii)真核宿主细胞:(iii)大肠杆菌宿主细胞;和iv)哺乳动物宿主细胞。
[0408] 一些实施方案还包括将所述核酸插入载体的集合中并且转化/转染到宿主细胞中并展示抗体或其片段。在一些实施方案中,载体是表达载体、展示载体,如噬菌粒载体。一些实施方案还包括将所述载体转染到适合的宿主细胞中。在一些实施方案中,宿主细胞是原核的,例如大肠杆菌,或是真核的,例如哺乳动物细胞。
[0409] 在另一方面,本公开内容使得鉴定对免疫原特异的抗体或其抗体片段的方法成为可能,所述方法包括如下步骤:合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以至少0.05%的VH和VL类对的浓度存在于至少约2500个B细胞的样品中的VH和VL类对;针对特定免疫原筛选该集合;并且选择对所述免疫原特异的一种或更多种抗体或其片段。一些实施方案包括鉴定对免疫原特异的抗体或其抗体片段的方法,所述方法包括如下步骤:(a)鉴定以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)对编码包含以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对的抗体或其片段的核酸的集合进行合成;(c)展示或表达该集合的抗体或其片段;(d)针对特定免疫原筛选该集合;和(e)选择对所述免疫原特异的至少一种抗体或其片段。一些实施方案包括鉴定用于治疗疾病或病症的抗体或其抗体片段的方法,所述方法包括如下步骤:(a)鉴定以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在的VH/VL类对;(b)鉴定显示选自以下组成的组的至少一种生物物理特性的VH/VL类对:(i)有效地展示在噬菌体上;(ii)有效地展示在哺乳动物细胞上;(iii)以Fab形式很好地表达在大肠杆菌中;(iv)以IgG形式很好地表达在哺乳动物细胞中;(v)热稳定性;(vi)可溶性;和(vii)低免疫原性;(c)合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以至少0.05%、至少1%或至少2%的VH/VL类对的浓度在免疫组库中存在并展示(i)-(vii)的至少一种生物物理特性的VH/VL类对;(d)展示或表达来自所述集合的抗体或其片段;(e)针对与所述疾病或病症相关的特定免疫原筛选该集合;和(f)选择对所述免疫原特异的至少一种抗体或其片段。
[0410] 在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。在一些实施方案中,在至少1×约2500个B细胞的样品中存在的VH和VL类对是通过如下方法鉴定的:所述方法包括从一个或更多个人宿主收获幼稚B细胞;从收获的B细胞中分离DNA;并且分析所分离的DNA。在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA的步骤还包括鉴定每个VH和VL类对在样品中存在的频率。
[0411] 一些实施方案还包括将所述核酸插入载体的集合中并且转化/转染到宿主细胞中,并展示抗体或其片段。
[0412] 在另一方面,本公开内容使得鉴定对免疫原特异的抗体或其抗体片段的方法成为可能,所述方法包括如下步骤:合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以至少0.05%的VH和VL类对的浓度存在于至少约2500个B细胞的样品中的VH和VL类对;针对特定免疫原筛选该集合;并且选择对所述免疫原特异的一种或更多种抗体或其片段。
[0413] 在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。在一些实施方案中,在至少约2500个B细胞的样品中的VH和VL类对是通过如下方法鉴定的:所述方法包括从一个或更多个人宿主收获B细胞;从收获的B细胞中分离DNA;并且分析所分离的DNA。在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA的步骤还包括鉴定每个VH和VL类对在样品中存在的频率。
[0414] 在一些实施方案中,在测试/筛选之前利用噬菌体、酵母、核糖体、细菌或真核的展示来展示集合。在一些实施方案中,集合被展示在原核或真核细胞上。在一些实施方案中,集合以Fab或IgG形式或其他本领域技术人员已知的形式展示。
[0415] 筛选可以通过使用本领域公知的方法之一进行,例如噬菌体展示、选择性感染的噬菌体、筛选结合的多核糖体技术、以及用于酶活性或蛋白稳定性的测定系统。许多这类方法是本领域技术人员已知的并且作为示例性参考文献在以下提供:Valle RP,Curr.Opin.Drug Discov.Devel.2003 年 3 月;6(2):197-203;Ackermann BL Expert Rev.Proteomics.2007年4月;4(2):175-86;和Anderson KS J Proteome Res.2005年7-8月;4(4):1123-33。
[0416] 在一个实施方案中,进行筛选测定以使得抗体对配体的结合直接或间接产生可检测的信号。这些信号包括,例如,复合物的产生、催化反应产物的形成、能量的释放或摄取,等等。来自用主题的重组DNA进行转化的群体的细胞可被克隆以产生例如单克隆集落。可以将来自这些集落的细胞收获、裂解并且用本领域已知的方法检验其DNA内容物的重组DNA的存在,所述本领域已知的方法例如在Southern,J.Mol.Biol.,98:503(1975)或Berent等人,Biotech.3:208(1985)中所述的。
[0417] 生物物理特性
[0418] 本发明还包括集合以及制备这些集合的方法,在这些集合中VH/VL类对具有令人期望的生物物理特性。有利的和期望的生物物理特性包括较高的稳定性、较高的表达水平和低的聚集倾向。
[0419] 适合的生物物理特性便于在不同的阶段利用集合。例如,如果抗体或其片段是可溶的并且不聚集,且被很好地表达在筛选背景如噬菌体中,那么有利于集合的筛选。以下特性使得诸如用于动物试验和治疗用途的抗体的随后开发变得容易:诸如抗体可溶性、热稳定性、高水平表达(尤其是作为IgG在哺乳动物中的高水平表达)和低免疫原性。
[0420] 为了确保全部或至少大多数的抗体或其片段具有这些有利的生物物理特性,可提前筛选VH/VL类对以鉴定哪些类对显示这些特性中的哪些。然后通过合成只编码那些具有这类有利的生物物理特性的抗体的核酸来构建文库。
[0421] 当然,不是所有的VH/VL类对都将以相同的程度显示所有的生物物理特性,并且技术人员将在确定要合成哪些VH/VL类对之前确定哪些特性是更相关的和/或每种特性的平衡。
[0422] 因而,在某些方面,本发明提供了选择被有效地展示诸如在噬菌体表面上或在其他展示技术中的VH/VL组合的合成抗体文库。优选地全部、基本上全部或实质上全部的VH/VL组合被有效的展示。展示效率可通过如在本发明中所述的噬菌体夹心ELISA测量。
[0423] 在其他方面,本发明提供了选择被以Fab形式很好地表达在大肠杆菌中的VH-VL组合的合成抗体文库。优选地全部、基本上全部或实质上全部的VH/VL组合被以Fab形式很好地表达在大肠杆菌中。在大肠杆菌中以Fab形式的表达可被定量且在细菌培养物中优选为多于2mg/L、多于5mg/L、多于10mg/L或多于15mg/L。在某些方面,所有的VH-VL以多于2mg/L表达,基本上所有的VH-VL组合以多于5mg/L的水平表达,大部分VH-VL组合以多于10mg/L的水平在细菌培养物中表达,和/或至少两个、至少三个、至少四个或至少五个VH-VL组合以多于15mg/L的水平在细菌培养物中表达。
[0424] 在某些方面,本发明提供了选择被以Fab形式很好地表达在哺乳动物系统中的VH-VL组合的合成抗体文库。目前市售的绝大多数基于抗体的治疗性生物制品为IgG形式是因为多种原因:(i)由于IgG与新生儿受体(FcRn)的相互作用,IgG分子在人体内的半衰期非常高(约3周);(ii)IgG分子是高度可溶的、热力学稳定的且对血液中的蛋白酶是相对耐受的;和(iii)IgG具有清除肿瘤细胞所需的ADCC(抗体依赖性细胞介导的细胞毒作用)和/或CDC(补体依赖性细胞毒作用)活性。Fab形式的特定VL/VH组合的表达不一定与IgG形式的相同的VL/VH组合的表达相关,所以IgG形式的VL/VL组合的表达和可溶性也是重要的独立因素。
[0425] 哺乳动物系统可包括,例如,哺乳动物悬浮培养、哺乳动物粘附细胞培养、HKB11细胞、PERC.6细胞或CHO细胞。优选地全部、基本上全部或实质上全部的VH/VL组合被以IgG形式很好地表达在哺乳动物系统中。在某些方面本发明提供了合成的人抗体文库,其中所有的VH-VL组合以多于10mg/L的水平以IgG形式被表达在哺乳动物系统中,其中基本上全部的VH-VL组合以多于15mg/L的水平以IgG形式被表达在哺乳动物系统中;其中大多数VH-VL组合以多于20mg/L的水平以IgG形式被表达在哺乳动物系统中;和/或至少三种、至少四种或至少五种VH-VL组合以多于25mg/L的水平以IgG形式被表达在哺乳动物系统中。
[0426] 在某些方面,本发明提供了选择热稳定的VH/VL组合的合成抗体文库。优选地全部、基本上全部或实质上全部的组合是热稳定的,具有至少68℃、70℃、72℃、74℃或76℃的Tm。可以如本文所述测量热稳定性。在某些方面,本发明提供了合成的人抗体文库,其中基本上全部的VH-VL组合具有多于68℃的Tm;基本上全部的VH-VL组合具有多于70℃的Tm,或多于72℃的Tm;大多数VH-VL组合具有多于74℃的Tm;和/或许多VH-VL组合具有多于76℃的Tm。在某些方面,至少三种、至少四种或至少五种VH-VL组合具有多于70℃的Tm。
[0427] 在某些方面,本发明提供了选择可溶(即不趋向于聚集)的VH-VL组合的合成抗体文库。可以通过如下方式确定可溶性:例如,通过测试的Fab在细菌宿主或IgG1在真核宿主中良好的折叠和表达特征或在纯化后通过分析性尺寸排阻色谱而确定的聚集。
[0428] 低免疫原性可被预测或通过本领域已知的方法直接测试,但也可以通过以下事实推断:给定VH/VL类对在文库中是最丰富的并且使用的蛋白序列是基本上的种系蛋白序列。
[0429] 如本文所述,抗体序列数据可以从B细胞获得,例如,幼稚B细胞、公开可用的数据库和/或文献。可将每个抗体序列与最接近的种系家族和/或基因比对。从这个数据,人们能够确定丰富的VH和VL种系家族和/或基因和/或VH/VL类对。
[0430] 确定丰富的VH和VL种系家族和/或基因和/或VH/VL类对后,人们能够选择测试哪些VH和VL种系家族和/或基因和/或VH/VL类对的有利的生物物理特性。一种方法是根据丰度将VH和VL种系家族和/或基因排序,然后测试最丰富的VH和VL种系家族和/或基因,例如前20最丰富的VH和VL种系家族和/或基因。此外,人们可以组合前20种最丰富的VH和VL种系家族和/或基因,产生例如400个VH和VL的组合,并测试它们的有利的生物物理特性。另外或补充地,人们能够测试最丰富的VH/VL类对的有利的生物物理特性。
[0431] 有利的生物物理特性包括但不限于:(i)它们以Fab形式被很好地展示在噬菌体上;(ii)它们以IgG形式被很好地展示在哺乳动物细胞上;(iii)它们以Fab形式被大量表达在例如大肠杆菌中,以及以IgG形式被大量表达在例如哺乳动物细胞中;(iv)是热力学稳定的;(v)具有高血清稳定性;(vi)具有低聚集倾向(即高可溶性);和(vii)具有低免疫原性风险。
[0432] 在一些方面,本发明包括编码如下抗体或其片段的合成核酸的集合:所述抗体或5
其片段包含以至少0.5%的VH和VL类对的浓度存在于至少1×10 个B细胞的样品中的VH和VL类对。在一些实施方案中,VH和VL类对以至少1%的VH和VL类对的浓度存在于至
5
少1×10 个B细胞的样品中。在一些实施方案中,VH和VL类对以至少2%的VH和VL类
5
对的浓度存在于至少1×10 个B细胞的样品中。在一些实施方案中,B细胞分离自人宿主。
在一些实施方案中,B细胞是幼稚的。在一些方面,集合包括编码包含种系VH和VL构架区
4 6
的抗体或其片段的核酸。在一些实施方案中,集合包括至少1×10 种核酸序列、至少1×10
8 10 11
种核酸序列、至少1×10 种核酸序列、至少1×10 种核酸序列、或至少1×10 种核酸序列。
[0433] 在一些方面,本发明包括包含如下序列数据的试剂盒,所述序列数据阐述编码如5
下抗体或其片段的核酸:所述抗体或其片段包含在至少1×10 个幼稚的人B细胞的样品中存在的核酸,其中所述序列数据在可读介质上。在一些实施方案中,本发明包括编码抗体或其功能片段的核酸的集合。在一些实施方案中,载体是噬菌体展示载体。在一些实施方案中,载体是噬菌粒载体。在一些方面,本发明包括用集合载体转化的宿主细胞,所述集合载体包括编码抗体或其功能片段的核酸的集合。在一些实施方案中,宿主细胞是原核的。在一些实施方案中,宿主细胞是大肠杆菌。在一些实施方案中,宿主细胞是真核的。在一些实施方案中,宿主细胞是哺乳动物细胞。
[0434] 在一些方面,本发明包括生产编码抗体或其片段的合成核酸的集合的方法,所述方法包括:合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以至少5
0.5%的VH和VL类对的浓度存在于至少1×10 个B细胞的样品中的VH和VL类对。在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。在一些实施方
5
案中,通过包括如下步骤的方法鉴定存在于至少1×10 个B细胞的样品中的VH和VL类对:
[0435] aa)从一个或更多个人宿主中收获幼稚B细胞;
[0436] ab)从步骤aa)中收获的B细胞分离DNA;和
[0437] ac)分析在步骤ab)中分离的DNA。
[0438] 在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA的步骤还包括鉴定每个VH和VL类对存在于样品中的频率。在一些实施方案中,这些方法还包括将核酸插入到载体的集合中。在一些实施方案中,载体是表达载体。在一些实施方案中,载体是展示载体。在一些实施方案中,展示载体是噬菌粒载体。在一些实施方案中,所述方法还包括将所述载体转染到适合的宿主细胞中。在一些实施方案中,宿主细胞是原核的。在一些实施方案中,宿主细胞是大肠杆菌。在一些实施方案中,宿主细胞是真核的。在一些实施方案中,宿主细胞是哺乳动物细胞。
[0439] 在一些方面,本发明包括鉴定对免疫原特异的抗体或其抗体片段的方法,所述方法包括如下步骤:a)合成编码如下抗体或其片段的核酸的集合:所述抗体或其片段包含以5
至少0.5%的VH和VL类对的浓度存在于至少1×10 个B细胞的样品中的VH和VL类对;
b)针对特定免疫原筛选该集合;和c)筛选对所述免疫原特异的一种或更多种抗体或其片段。在一些实施方案中,B细胞分离自人宿主。在一些实施方案中,B细胞是幼稚的。在一
5
些实施方案中,通过包括如下步骤的方法鉴定存在于至少1×10 个B细胞的样品中的VH和VL类对:
[0440] aa)从一个或更多个人宿主中收获幼稚B细胞;
[0441] ab)从步骤aa)中收获的B细胞分离DNA;和
[0442] ac)分析在步骤ab)中分离的DNA。
[0443] 在一些实施方案中,分析DNA的步骤包括对DNA测序。在一些实施方案中,分析DNA的步骤还包括鉴定每个VH和VL类对存在于样品中的频率。在一些实施方案中,合成集合的步骤还包括将所述核酸插入到载体的集合中。在一些实施方案中,所述方法还包括将所述载体转染到适合的宿主细胞中。在一些实施方案中,所述方法还包括展示所述集合。实施例
[0444] 实施例1:在原核信号序列和人前导序列的C端中产生限制酶切位点,提供完全种系FR1区
[0445] 一方面,本公开内容描述了包括含种系蛋白序列的构架区特别是FR1的抗体的集合。预期具有种系序列将降低抗体在施用于人时的免疫原性风险。然而,必须使用相容的限制酶切位点以使得能将编码抗体集合的核酸标准地克隆到展示载体和/或表达载体中,以便可针对免疫原筛选抗体。过去,用于克隆的限制酶切位点通常位于构架区内,从而修饰核酸和/或氨基酸序列远离种系。为了确保本公开内容的每种抗体的至少构架1(FR1)区保持种系蛋白序列,在FR1内应该没有任何非天然存在的限制酶切位点。因此,本公开内容的一个方面是在原核信号序列和人前导序列的C端内具体是在三个C端残基内掺入相同的或至少相容的限制酶切位点。另外,包含相同的或相容的限制酶切位点的信号序列和前导序列必须是有功能的并且容许抗体或其片段在原核和哺乳动物表达系统中均有良好的展示和表达水平。
[0446] 实施例1.1:在大肠杆菌信号序列的C端丰富的氨基酸残基的分析
[0447] 以下描述了要掺入信号序列大肠杆菌ompA和phoA的C端中的限制酶切位点的选择和得到的信号序列的功能性的评估。
[0448] 第一步,分析在信号序列的C端三个氨基酸(-3到-1)处的常见氨基酸残基,并且产生如表1所示的共有序列。见Chou等人,Prediction of protein signal sequences(蛋白信号序列的预测),Protein Pept.Sci.3(6):615-22(2002年12月)。
[0449] 表1:信号序列的三个C端氨基酸的共有序列
[0450]
[0451] 在-3位,主要观察到A、S、V和T氨基酸。在-2位,主要观察到L、A、S和Q氨基酸。在-1位,主要观察到A、G和S。
[0452] 实施例1.2:用于重链大肠杆菌信号序列(phoA)的限制酶切位点的选择[0453] 在比较表1中所示的共有序列与已知限制酶切位点后,选择以下三个限制酶切位点AfIII、NheI和AvrII用于掺入到phoA C端中并随后研究其表达水平。重要的是注意到哪些情况下将野生型核苷酸序列改变成修饰的核苷酸序列氨基酸序列也被改变。选择的限制酶切位点的核酸序列和对应的氨基酸序列显示在表2中。
[0454] 表2:
[0455]
[0456] 作为对照,研究野生型phoA信号序列的表达水平。包括3个C端序列的野生型phoA信号序列的核酸和氨基酸序列显示在表3中。
[0457] 表3:
[0458] 野生型大肠杆菌phoA信号序列(从-3位到-1位的C端氨基酸序列是没有限制酶切位点的TKA):
[0459]
[0460] 为了评估表达水平,将表2中所示的限制酶切位点掺入到phoA信号序列中,从而还修饰了野生型氨基酸序列。得到的信号序列用来表达包含a)VH3-23或b)VH1-69种系蛋白序列的Fab片段。选择这些种系序列因为它们已知是稳定的并且被很好地表达。将4D5抗体的CDR-H3(WGGDGFYAMDY)掺入到VH3-23和VH1-69种系基因序列中,并且JH4种系基因序列用于FR4。4D5抗体被公开在(PDB条目1FVC;Carter,P.,Presta,L.,Gorman,C.M.,Ridgway,J.B.,Henner,D.,Wong,W.L.等人(1992);Humanization Biophysical Properties of Human Antibody Domains 551 of an anti-p185HER2 antibody for human cancer therapy(用于人癌症治疗的抗p185HER2抗体的人抗体结构域551的人源化生物物理特性).Proc.Natl Acad.Sci.USA,89,4285-4289中。产生基于pMORPHX11(示于图
50)的质粒,所示质粒包括:a)包含表2的C端限制酶切位点和氨基酸序列的phoA信号序列,b)VH3-23和VH1-69的VH序列,该VH序列如以上所示掺入了CDR-H3和JH4,和c)来自MOR03207的稳定的且很好地表达的轻链。在Geneart(Regensburg,Germany)产生了所有的基因。
[0461] 通过在周质提取后进行抗Fd ELISA来检查表达和周质运输。在周质提取后使用BBS缓冲液的抗Fd表达ELISA的结果显示在图1中。如所示的,在VH3-23组中,包括C端限制酶切位点AfIII(VLS)、NheI(VLA)和AvrII(VLG)的信号序列保持在野生型(TKA)范围内的表达水平,其中NheI(VLA)比野生型(TKA)表现得更好。
[0462] 另外,在摇瓶中过夜培养后进行大肠杆菌中的Fab表达,并且在通过亲和色谱和缓冲液更换的Fab纯化后确定了Fab生产水平。结果显示在表4中。
[0463] 表4:
[0464] 使用包括C端限制酶切位点AfIII(VLS)、NheI(VLA)和AvrII(VLG)的信号序列相比于野生型(TKA)的Fab表达
[0465]
[0466] 如所示的,包括C端限制酶切位点AfIII(VLS)、NheI(VLA)和AvrII(VLG)的信号序列相比于野生型(TKA)表达相似量的Fab。
[0467] 基于以上数据,选择NheI(VLA)限制酶切位点掺入到重链信号序列(phoA)中。修饰的NheI(VLA)phoA信号序列的核酸和氨基酸序列显示在表5中。
[0468] 表5
[0469] 具有C端VLA和NheI限制酶切位点(=GCTAGC)的修饰的大肠杆菌phoA信号序列:
[0470]
[0471] 实施例1.3:用于κ和λ轻链大肠杆菌信号序列(ompA)的限制酶切位点的选择[0472] 与实施例1.2中所述相似的方法用于选择掺入到κ和λ的轻链信号序列(ompA)的C端中的限制酶切位点。
[0473] 在比较表1中所示的共有序列与已知的限制酶切位点后,选择以下限制酶切位点:NdeI(AYG)、NdeI(AYA)和BsiWI(TYA)掺入到ompA C端,从而还修饰该氨基酸序列,随后研究其表达水平。选择的限制酶切位点的序列显示在表6中。
[0474] 表6:
[0475]
[0476] 作为对照,研究野生型ompA信号序列的表达水平。包括3个C端序列的野生型ompA信号序列的核酸和氨基酸序列显示在表7中。
[0477] 表7:
[0478] 野生型大肠杆菌ompA信号序列(从-3位到-1位的C端氨基酸序列是没有限制酶切位点的AQA):
[0479]
[0480] 为了评估表达水平,将表6中所示的限制酶切位点掺入ompA信号序列中。得到的修饰的信号序列用于表达Fab片段,所述Fab片段包括:a)κ1O12(IGKV1-39),b)κ3L6(IGKV3-11),或c)λ1V1-13(IGLV1-40)种系基因序列。选择这些种系序列因为它们已知是稳定的并且被很好地表达。在a)κ1O12(IGKV1-39)和b)κ3L6(IGKV3-11)中,掺 入了 CDR-L3区:QQHYTTPPT(对 于κ),在c)λ1V1-13(IGLV1-40)中,掺入 了CDR-L3区:QSYDSSLSGVV(对于λ),并且在a)-c)中,Jk1种系基因序列用作κ轻链的FR4;并且Jl2/3种系基因序列用作λ轻链的FR4。产生了pMORPHX11(图50中所示)质粒,其包括a)包含表6的C端限制酶切位点的ompA信号序列,b)VL种系序列κ1O12(IGKV1-39)、b)κ3L6(IGKV3-11)或c)λ1V1-13(IGLV1-40),该VL种系序列如上所述掺入了CDR-L3和FR4,以及c)在实施例1.2中所述的为重链的IGHVH3-23TKA构建体。在Geneart(Regensburg,Germany)产生了所有的基因。
[0481] 通过进行在大肠杆菌中的过夜Fab生产、周质提取、和周质提取后的抗Fd ELISA,检查了表达和周质运输。在周质提取后使用BBS缓冲液的抗Fd表达ELISA的结果显示在图2中。如所示的,包括NdeI(AYA)的信号序列显示与野生型(AQA)一样好或更好的表达。
[0482] 另外,在摇瓶中过夜培养后进行大肠杆菌中的Fab表达,并且在通过亲和色谱和缓冲液更换的Fab纯化后确定了Fab生产水平。结果显示在表8中。
[0483] 表8:
[0484] 使用与野生型(AQA)相比包括C端限制酶切位点NdeI(AYA)的信号序列的Fab表达。
[0485]
[0486] 基于以上数据,选择NdeI(AYA)限制酶切位点掺入到κ和λ信号序列(ompA)中。修饰的NdeI(AYA)ompA信号序列的核酸和氨基酸序列显示在表9中。
[0487] 表9
[0488] 具有C端AYA和NdeI限制酶切位点(=CATATG)的修饰的大肠杆菌ompA信号序列:
[0489]
[0490] 实施例1.4:在噬菌体展示中Fab片段被信号序列展示的效率的评估
[0491] 如实施例1.2和1.3中所述,选择以下限制酶切位点掺入到Fab信号序列和IgG前导序列的C端:
[0492] 重链可变区(phoA和重链前导序列):NheI(VLA)
[0493] 轻链可变区(κ和λ)(ompA和κ前导序列):NdeI(AYA)
[0494] 图3显示选择的限制酶切位点和对应的氨基酸序列。
[0495] 为了显示这些修饰的信号序列介导Fab片段的有效运输和生产,产生了掺入选择的信号序列到三顺反子展示载体中的载体构建体,该载体构建体编码VH、VL和pIII(用于噬菌体展示的噬菌体外壳蛋白pIII)。这样做是为了证实包含所选的信号序列的这些载体能够提供有用的噬菌体展示率。产生了pJPd1(图48所示)三顺反子载体构建体,其包含VH3-23或VH1-69种系基因的VH,或VL1-40、VK3-11、或VK1-39种系基因的VL,以及选择的重链(phoA)限制酶切位点NheI(VLA),且野生型phoA(TKA)作为对照,或选择的轻链(ompA)限制酶切位点NdeI(AYA),且野生型ompA(AQA)作为对照。此外,产生了包含相同组分的pMORPH30(图51所示)三顺反子载体构建体作为对照。相对展示率显示在表10中。
[0496] 表10:
[0497]
[0498] 如所示的,掺入选择的信号序列的pJPd1载体产生了与pMORPH30载体相当的相对展示率;并且当超级噬菌体(hyperphage)用作辅助噬菌体用于噬菌体生产时检测到比pMORPH30载体优异的相对展示率。因此,包括修饰的信号序列的pJPd1载体对于针对靶抗原的抗体或其功能片段的噬菌体展示选择来说应该很有效。
[0499] 实施例1.2-1.4描述了产生、表达并展示本公开内容的抗体或功能片段的集合的必要工具,因为它们描述了包含容许具有种系蛋白序列的FR1区的限制酶切位点的信号序列和前导序列,并且描述了可用于将公开的抗体或其功能片段的集合掺入到噬菌体展示选择系统或哺乳动物表达系统中以鉴定针对任何免疫原的抗体的载体骨架。此外,信号序列携带容许与Fab噬菌体展示和表达质粒以及对应的IgG表达质粒的完全相容性的限制酶切位点。
[0500] 实施例1.5:包含选择的C端限制酶切位点的用于IgG表达的人重链和κ前导序列的测试
[0501] 为了允许从大肠杆菌表达的Fab容易转换为哺乳动物表达的IgG形式,产生IgG轻链(人κ前导序列)和IgG重链(人重链前导序列)的人前导序列以包含与ompA(NdeI(AYA))和phoA(NheI(VLA))信号序列的C端相同的限制酶切位点,从而还修饰三个C端氨基酸序列中的一些。
[0502] 使用位于以下位置中的所描述的NheI限制酶切位点可进行VH从基于大肠杆菌的Fab表达质粒向哺乳动物IgG表达载体的转移:(a)在phoA信号序列的C端以及(b)在人重链前导序列的C端中的对应位置。为了提供这种转移,修饰了phoA信号序列的最后三个氨基酸(从TKA到VLA),并且通过将野生型氨基酸序列(-3到-1)从VLS改变为phoA相容的VLA来改造人重链前导序列的C端。
[0503] 使用位于以下位置中的所描述的NdeI限制酶切位点可进行VL从基于大肠杆菌的Fab表达质粒向哺乳动物IgG表达载体的转移:(a)在ompA信号序列的C端以及(b)在人κ前导序列的C端中的对应位置。为了提供这种转移,修饰了ompA信号序列的最后三个氨基酸(从AQA到AYA),并且通过将野生型氨基酸序列(-3到-1)从AYG改变为ompA相容的AYA来改造人κ前导序列的C端。野生型和修饰的人重链前导序列和人κ前导序列显示在表11中。
[0504] 表11
[0505] 重链前导序列
[0506] A)
[0507] 野生型人重链前导序列(从-3位到-1位的C端氨基酸序列是没有限制酶切位点的VLS):
[0508]
[0509] B)
[0510] 具有C端VLA和NheI限制酶切位点(=GCTAGC)的修饰的人重链前导序列:
[0511]
[0512] C)
[0513] 野生型人κ前导序列(从-3位到-1位的C端氨基酸序列是没有限制酶切位点的AYG):
[0514]
[0515] D)
[0516] 具有C端AYA和NdeI限制酶切位点(=CATATG)的修饰的人κ前导序列:
[0517]
[0518] 为了显示这些修饰的信号/前导序列介导人IgG1蛋白的有效运输和生产,将修饰的人重链前导序列和修饰的人κ前导序列二者克隆到用于全长人IgG1的哺乳动物表达的pJP_Ig质粒(显示在图52-54中)中,取代野生型前导序列。将得到的包含修饰的前导序列、如表12所述的可变区基因以及κ或λ轻链和重链的恒定区的表达载体转染到HKB11细胞中,并且在转染后几天通过使用蛋白A色谱将人IgG1从细胞培养上清液中纯化。在纯化和缓冲液更换后确定了IgG1的含量。表达产量显示在表12中。
[0519] 表12
[0520]
[0521] 所有的测试构建体表达大量的人IgG1,指示修饰的前导序列维持表达水平。选择的修饰的前导序列(a)产生根据所用的载体系统的高产量的IgG蛋白,(b)提供在原核系统和哺乳动物系统之间转换抗体形式、载体和表达系统的完全相容性,和(c)位于信号/前导序列中从而保持FR1的完全种系序列。
[0522] 实施例2:在人文库中最丰富的VH/VL对的鉴定
[0523] 本公开内容的一个方面是包含在人免疫组库中最丰富的种系基因对的种系蛋白序列的抗体或其功能片段的集合或文库,其中每种抗体或其功能片段包括对应的种系蛋白对的种系蛋白序列,并且其中被选择加入到集合中的种系蛋白对包括如下生物物理特性:所述生物物理特性提高了从该集合中选择的每种抗体或其功能片段将可临床开发和取得商业成功的可能性。为了产生这种集合,必须评估许多指标。一般来说,采取了以下步骤:
鉴定来自人免疫组库的占优势的种系基因对;合成了来自人免疫组库的占优势的种系基因对的cDNA并将其克隆到多个载体背景中并生产抗体或其功能片段;从功能上测试包含该占优势的种系基因对的种系蛋白序列的抗体或其功能片段以确定其生物物理特性;并且比较包含对应的种系蛋白对的抗体或其功能片段的生物物理特性;然后选择一小组种系蛋白对加入到集合中。在一些实施方案中,所选择的种系蛋白对的种系蛋白序列充当支架。在那些实施方案中,支架包括所选的种系蛋白对的种系蛋白序列,其中VH和VL二者在至少FR1、CDR1、FR2、CDR2和FR3中包含对应的对的种系蛋白序列。在具体的实施方案中,CDR3可以是多样化的。在具体的实施方案中,FR4是固定的,例如,对于VH可使用JH4序列,对于κVL可使用Jk1序列,并且对于λVL可使用JI2/3。
[0524] 实施例2.1:VH/VL对种系基因使用的确定
[0525] 为了鉴定人免疫组库占优势的VH/VL种系基因对,分析公开可用的数据并对人B细胞采样。第一步,检查公开可用的数据以确定描述分离自B细胞的VH/VL种系基因对的文章。如所提到的,许多公开可用的数据库提供抗体序列,然而,许多仅提供了可变结构域VH或VL的序列,却很少提供VH/VL种系基因对的联系。以下文章被鉴定并且被详细分析:Wardemann H.等人(2003)Science 301,1374-1377及任何支持表格;Yurasov S.等人(2005)J.Exp.Med.201,703-712及任何支持表格;Tsuiji M.等人(2006)J.Exp.Med.203,393-401及任何支持表格;Yurasov S.等人(2006)J.Exp.Med.203,2255-2262及任何支持表格,Tiller T.等人(2007)Immunity 26,205-213及任何支持表格,和Mietzner B.等人(2008)PNAS 105,9727-9732及任何支持表格。
[0526] 图4-9显示在Tsuiji M等人(2006)中分离的B细胞的VH/VL对。
[0527] 图10-12显示在Tiller T.等人(2007)中分离的B细胞的VH/VL对。
[0528] 图13-17显示在Mietzner B.等人(2008)中分离的B细胞的VH/VL对。
[0529] 图18-20显示在Wardemann H.等人(2003)中分离的B细胞的VH/VL对。
[0530] 图21-23显示在Yurasov S.等人(2005)中鉴定分离的B细胞的VH/VL对。
[0531] 图24-26显示在Yurasov S.等人(2006)中分离的B细胞的VH/VL对。
[0532] 另外的VH/VL对数据从人B细胞的样品鉴定,如以下所述。
[0533] 实施例2.2:人样品的VH/VL对基因使用的确定
[0534] 为了获得另外的VH/VL种系基因对使用数据,从人宿主分离PBMC。分选PBMC,使用PCR扩增B细胞的cDNA,对来自B细胞的DNA测序,然后用IgBLAST(NCBI)将序列比对以鉴定来自每个B细胞的VH/VL种系基因对。
[0535] 实施例2.2(a):人外周血单核细胞(PBMC)的分离和分选
[0536] 从静脉血分离和分选人PBMC以及从骨髓分离和分选单核细胞的一般方法描述在TMTiller等人JIM 2008中。PBMC被如下分离。将40ml静脉血从人供体(在Pandemrix 接种(H1N1疫苗GlaxoSmithKline)后7天)采集到4×Li-肝素血液采集管(Sarstedt)(每个10ml)中。将每个monovette的内容物合并到一个50ml Falcon(总计40ml)中,然后添加100μlRosetteSep(StemCell technologies)(2.5μl/ml),在旋转器(5rpm)上充分混合,并且在室温下孵育30min。用等体积的1×PBS(Invitrogen)稀释血液/RosettaSep组合。将15ml的FicollPaque(GE Healthcare)添加到新的50ml锥形管中,并且20ml的稀释血液在FicollPaque上分层,总计(4个管:每个具有15ml FicollPaque+20ml血液)。将管在离心机上以400g(在sigma实验室离心机上1400rpm)于室温下不减速地旋转30min。
在离心后,富集的PBMC在血浆与FicollPaque之间的界面形成带。用移液管将PBMC从每个管移出并转移到新的50ml管中。通过用FACS缓冲液(PBS,3%FCS)稀释到40ml并且在离心机上在4℃以1250rpm旋转10min来洗涤PBMC。PBMC用台盼蓝(10μl样品+90μl台盼蓝(用PBS 1∶10稀释))计数。
[0537] 通过在约5ml冷的FACS缓冲液中重悬将PBMC染色。准备等份细胞用于染色。准备荧光团来进行测试。将等份在1250rpm,4℃离心,并且弃掉上清液。根据表13中所述的方案,将用于染色的抗体添加到细胞沉淀(cell pellet)中。
[0538] 表13:
[0539]
[0540] 然后使细胞通过FACS管(Eppendorf)上的细胞过滤网(cell strainer)以避免细胞计数器中的堵塞物。将细胞放在冰上,并且保持在黑暗中。
[0541] 根据感兴趣的表型的细胞表面标志物单个分选细胞。例如,抗体分泌细胞是+ low hi hi + neg neg +CD19CD20 CD27 CD38 ,并且成熟的幼稚B细胞是CD19CD27 CD10 IgM。使用小鼠抗人抗体(AbD:CD19、CD27、CD38、CD-20和CD10)(Becton Dickinson:IgM)鉴定细胞表面标志物的存在。使用FACS Aria将细胞按照前向散射(forward scatter)和侧向角散射(side scatter)(具有双判别(double discrimination)的活细胞)分选到包含4μl的
0.5×PBS、10mM DTT、8U RNAsin(Promega)的单细胞96孔PCR板(Eppendorf)中。
[0542] 如表14所示准备PCR板。
[0543] 表14:
[0544]
[0545] 在分选后,每个板立即用微密封箔(microseal foil)(BioRad)密封并且置于干冰上。一旦完成细胞分选,就将所有板冷冻在-80℃。
[0546] 实施例2.2(b):人B细胞DNA的PCR扩增
[0547] 如实施例2.2(a)中所述分离并分选PBMC。然后PCR扩增单个分选的成熟的幼稚(mn)B细胞和抗体分泌细胞(asc)的Ig基因转录物以确定VH/VL种系基因对。PCR扩增B细胞的cDNA的一般方法和可用于PCR扩增B细胞的cDNA的引物描述在Tiller等人J Immunol Methods,2008中。
[0548] 总的PCR策略显示在图27中。使用的特异性引物显示在表15中。
[0549] 表15:
[0550] 对于μ或γ重链PCR:
[0551]
[0552] 对于κ轻链PCR:
[0553]
[0554] 对于λ轻链PCR:
[0555]
[0556] 如下合成了单个分选的成熟的幼稚(mn)B细胞和抗体分泌细胞(asc)的cDNA。首先在冰上制备RHP-Mix、RT-Mix和RT-Mix。用以下组分制备RHP-Mix:115μl的随机六聚体引物(Random Hexamer Primer,Roche)(300ng/μl)、115μl NP-40(Sigma)(10%)、35μl RNAsin和542μl水。用以下组分制备RT-Mix:660μl的5×RT缓冲液,110μl的dNTP(Invitrogen)(各25mM),450μl的 水,220μl的0.1M DTT,44μl的RNAsin(Promega),55μl Superscript III(反转录酶)(Invitrogen)。
[0557] 接下来,将板放在干冰上,并且添加3.5μl的RHP-Mix。板用箔覆盖并且在68℃在水浴中孵育1min。然后将板置于常规的冰上。然后添加7μl的RT-Mix,并且箔封闭孔。在以下温度并持续以下时间进行RT扩增程序:42℃持续5′,25℃持续10′,50℃持续60′,94℃持续5′,以及4℃并保持。将cDNA储存在-20℃。
[0558] 如下进行巢式PCR。独立地PCR扩增人的IgH、Igk和IgL V基因转录物。使用3.5μl cDNA作为模板。在96孔板的每孔40μl的总体积中进行所有的PCR反应。对于每个板,各自用以下制备3个反应管:1154μl的水,150μl的10×缓冲液,16μl的dNTP,
5μl的5’引物混合物,5μl 3’引物,以及7μl HotStar Taq(Qiagen)。用3.5μl未纯化的第一PCR产物和基因特异性引物或引物混合物进行所有的巢式PCR反应。如表16所示进行每轮PCR。
[0559] 表16:
[0560] 用于扩增人Ig基因转录物的PCR程序
[0561]
[0562] 接下来,将3μl等份的第二PCR产物与等量上样缓冲液在1×TBE缓冲液中在包含溴化乙锭的2%琼脂糖凝胶上以150V电泳45min。使DNA条带在紫外线下显影。预期的PCR产物大小对于Igγ为大约450bp,对于Igκ为大约510bp,且对于Igλ为大约405bp。
[0563] 将4μl的VH、VK和VL PCR产物(含匹配的对应的VH或VL产物)与16μl ddH2O合并到96孔板中并委托Eurofins MWG Operon,Ebersberg,Germany进行板测序。测序引物以10pmol/μl(储液50pmol/μl,1∶5稀释)提供并显示在表17中。
[0564] 表17:
[0565] μHC:5’Age VH-Mix
[0566] γHC:3’IgG内标
[0567] VK:5’Pan-VK
[0568] VL:5’VL-Mix
[0569] 用IgBLAST(NCBI)比对测序结果以鉴定VH、VK和VL种系基因,如图28A-C(28-36)所示。
[0570] 实施例2.3在人免疫组库中鉴定的VH/VL种系基因对
[0571] 将如实施例2.1所述且在图4-26所示的从公开可用的文献鉴定的VH/VL种系基因对数据与如实施例2.2所述且在图28-36中所示从人样品鉴定的数据相汇集。
[0572] 分析汇集数据并将其显示为在表18中的排序,即在人免疫组库中鉴定的VH/VL种系基因对的浓度(%)的排序。
[0573] 表18:在人免疫组库中VH/VL种系基因对使用的频率
[0574] pos代表按每个VH/VL对占总样品的百分比(%)而确定的VH/VL对的相对排序的位置。
[0575] N=2137
[0576]
[0577]
[0578]
[0579]
[0580]
[0581]
[0582]
[0583]
[0584]
[0585]
[0586]
[0587]
[0588]
[0589]
[0590]
[0591]
[0592]
[0593]
[0594]
[0595]
[0596]
[0597]
[0598]
[0599] 实施例2.4在“幼稚的”人免疫组库中的VH/VL种系基因对使用
[0600] 另外,分析包含如实施例2.1所述且在图4-26所示的从公开可用的文献鉴定的VH/VL种系基因对数据与如实施例2.2所述且在图28-36中所示从人样品鉴定的VH/VL种系基因对数据的汇集数据以确定在幼稚的人文库中的种系基因使用。区分幼稚的、未经历抗原的B细胞群和经历抗原的B细胞群是重要的。幼稚的、未经历抗原的B细胞包括但不限于未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞,其中抗体序列仍为种系。经历抗原的B细胞包括但不限于IgG抗体分泌细胞以及IgM和IgG记忆B细胞,其中大多数的抗体包括体细胞超突变。
[0601] 认为与经历抗原的B细胞群相比,不同的种系基因对在两种B细胞群幼稚B细胞、未经历抗原的B细胞中有过多的代表。本公开内容的一个方面是产生可用来鉴定针对任何免疫原的抗体或其功能片段的抗体或其功能片段的集合,因此生产包含被主要表达在幼稚的未经历抗原的免疫组库中的VH/VL种系蛋白对的集合可能是更可取的。
[0602] 为了鉴定在幼稚的未经历抗原的免疫组库中被主要表达的VH/VL种系基因对,分析如实施例2.1所述且在图4-26所示的来自公开可用的文献与如实施例2.2所述且在图28-36中所示从人样品鉴定的VH/VL种系基因对数据的汇集数据,以将未成熟的B细胞、新的迁移B细胞和成熟的幼稚B细胞的未经历抗原的B细胞群与经历抗原的B细胞群分离。
代表幼稚的人免疫组库的VH/VL种系基因对的排序显示在表19中。
[0603] 表19
[0604] N=1345
[0605]pos V重链 V轻链 %
1 IGHV4-34 IGKV3-20 1,56
2 IGHV4-39 IGKV3-15 1,19
3 IGHV4-34 IGKV1-39/1D-39 0,97
4 IGHV3-23 IGKV3-20 0,89
IGHV4-59 IGKV1-39/1D-39 0,89
IGHV1-69 IGKV1-39/1D-39 0,89
5 IGHV4-39 IGKV1-39/1D-39 0,82
IGHV1-18 IGKV3-20 0,82
IGHV5-51 IGLV1-40 0,82
6 IGHV4-39 IGKV3-20 0,74
IGHV4-39 IGKV1-5 0,74
IGHV4-59 IGKV3-20 0,74
7 IGHV3-23 IGKV1-5 0,67
IGHV3-23 IGKV3-15 0,67
IGHV3-30 IGKV1-39/1D-39 0,67
IGHV3-30 IGKV3-11 0,67
IGHV1-69 IGKV3-20 0,67
IGHV4-39 IGLV2-8 0,67
8 IGHV3-23 IGKV1-39/1D-39 0,59
IGHV3-30 IGKV1-5 0,59
IGHV3-7 IGKV1-39/1D-39 0,59
IGHV1-2 IGKV3-20 0,59
IGHV4-59 IGLV1-40 0,59
IGHV4-34 IGLV2-14 0,59
9 IGHV3-23 IGKV4-1 0,52
IGHV5-51 IGKV3-20 0,52
IGHV5-51 IGKV4-1 0,52
IGHV3-53 IGKV1-5 0,52
IGHV3-23 IGLV2-14 0,52
[0606]IGHV4-34 IGLV1-51 0,52
IGHV1-69 IGLV2-14 0,52
IGHV1-69 IGLV1-40 0,52
10 IGHV3-23 IGKV1-33/1D-33 0,45
IGHV3-30 IGKV3-20 0,45
IGHV3-30 IGKV4-1 0,45
IGHV3-30 IGKV1-9 0,45
IGHV4-59 IGKV4-1 0,45
IGHV4-34 IGKV3-15 0,45
IGHV4-34 IGKV4-1 0,45
IGHV1-18 IGKV1-33/1D-33 0,45
IGHV3-48 IGKV3-20 0,45
IGHV3-48 IGKV3-11 0,45
IGHV3-21 IGKV1-39/1D-39 0,45
IGHV3-21 IGKV3-15 0,45
IGHV3-15 IGKV3-20 0,45
IGHV3-15 IGKV1-39/1D-39 0,45
IGHV3-30 IGLV2-14 0,45
IGHV5-51 IGLV2-14 0,45
IGHV3-21 IGLV1-51 0,45
IGHV1-2 IGLV2-14 0,45
11 IGHV3-23 IGKV2-28/2D-28 0,37
IGHV3-30 IGKV3-15 0,37
IGHV4-39 IGKV3-11 0,37
IGHV1-69 IGKV4-1 0,37
IGHV1-18 IGKV1-39/1D-39 0,37
IGHV1-18 IGKV1-5 0,37
IGHV1-18 IGKV2-28/2D-28 0,37
IGHV3-48 IGKV1-39/1D-39 0,37
IGHV3-48 IGKV3-15 0,37
IGHV3-48 IGKV1-33/1D-33 0,37
IGHV3-21 IGKV1-5 0,37
[0607]IGHV3-15 IGKV1-5 0,37
IGHV4-31 IGKV3-11 0,37
IGHV3-33 IGKV3-20 0,37
IGHV3-53 IGKV1-33/1D-33 0,37
IGHV3-23 IGLV1-40 0,37
IGHV3-30 IGLV1-51 0,37
IGHV4-39 IGLV2-14 0,37
IGHV4-59 IGLV3-1 0,37
IGHV1-18 IGLV1-40 0,37
IGHV3-48 IGLV2-14 0,37
IGHV4-31 IGLV2-14 0,37
12 IGHV3-23 IGKV3-11 0,30
IGHV3-23 IGKV1-17 0,30
IGHV3-23 IGKV1-27 0,30
IGHV4-39 IGKV1-33/1D-33 0,30
IGHV4-59 IGKV3-11 0,30
IGHV4-34 IGKV1-5 0,30
IGHV4-34 IGKV3-11 0,30
IGHV4-34 IGKV2-28/2D-28 0,30
IGHV5-51 IGKV3-15 0,30
IGHV5-51 IGKV3-11 0,30
IGHV5-51 IGKV2-28/2D-28 0,30
IGHV1-69 IGKV1-5 0,30
IGHV3-7 IGKV3-15 0,30
IGHV3-48 IGKV4-1 0,30
IGHV3-21 IGKV3-20 0,30
IGHV3-21 IGKV4-1 0,30
IGHV3-15 IGKV3-15 0,30
IGHV3-33 IGKV1-39/1D-39 0,30
IGHV3-53 IGKV1-39/1D-39 0,30
IGHV3-53 IGKV3-15 0,30
IGHV3-53 IGKV4-1 0,30
[0608]IGHV3-11 IGKV1-39/1D-39 0,30
IGHV4-4 IGKV3-20 0,30
IGHV1-46 IGKV3-20 0,30
IGHV1-46 IGKV1-39/1D-39 0,30
IGHV3-23 IGLV3-21 0,30
IGHV3-23 IGLV3-1 0,30
IGHV4-39 IGLV1-40 0,30
IGHV4-39 IGLV1-44 0,30
IGHV4-39 IGLV1-51 0,30
IGHV4-59 IGLV1-51 0,30
IGHV4-34 IGLV1-40 0,30
IGHV4-34 IGLV1-47 0,30
IGHV4-34 IGLV2-8 0,30
IGHV5-51 IGLV1-44 0,30
IGHV1-69 IGLV1-51 0,30
IGHV1-69 IGLV2-8 0,30
IGHV3-9 IGLV2-14 0,30
IGHV3-9 IGLV2-23 0,30
IGHV4-4 IGLV1-44 0,30
IGHV4-61 IGLV1-44 0,30
13 IGHV3-23 IGKV1-8 0,22
IGHV3-30 IGKV2-28/2D-28 0,22
IGHV4-39 IGKV4-1 0,22
IGHV4-39 IGKV1-27 0,22
IGHV5-51 IGKV1-39/1D-39 0,22
IGHV1-69 IGKV1-33/1D-33 0,22
IGHV3-7 IGKV3-20 0,22
IGHV3-7 IGKV3-11 0,22
IGHV3-7 IGKV1-8 0,22
IGHV1-18 IGKV3-11 0,22
IGHV3-48 IGKV1-8 0,22
IGHV3-15 IGKV3-11 0,22
[0609]IGHV3-15 IGKV1-33/1D-33 0,22
IGHV4-31 IGKV1-39/1D-39 0,22
IGHV4-31 IGKV3-15 0,22
IGHV4-31 IGKV1-33/1D-33 0,22
IGHV1-2 IGKV1-39/1D-39 0,22
IGHV1-2 IGKV1-5 0,22
IGHV3-33 IGKV3-15 0,22
IGHV3-33 IGKV4-1 0,22
IGHV3-11 IGKV1-5 0,22
IGHV3-11 IGKV3-15 0,22
IGHV3-9 IGKV1-39/1D-39 0,22
IGHV4-4 IGKV3-15 0,22
IGHV4-4 IGKV3-11 0,22
IGHV1-46 IGKV1-9 0,22
IGHV4-61 IGKV1-39/1D-39 0,22
IGHV4-61 IGKV4-1 0,22
IGHV1-3 IGKV1-39/1D-39 0,22
IGHV3-49 IGKV1-39/1D-39 0,22
IGHV3-49 IGKV1-17 0,22
IGHV3-43 IGKV1-5 0,22
IGHV7-81 IGKV3-20 0,22
IGHV3-23 IGLV2-23 0,22
IGHV3-23 IGLV2-11 0,22
IGHV4-39 IGLV2-23 0,22
IGHV1-69 IGLV2-23 0,22
IGHV1-18 IGLV2-14 0,22
IGHV3-48 IGLV3-1 0,22
IGHV3-15 IGLV1-44 0,22
IGHV4-31 IGLV1-40 0,22
IGHV1-2 IGLV1-40 0,22
IGHV1-2 IGLV3-1 0,22
IGHV3-33 IGLV2-14 0,22
[0610]IGHV3-33 IGLV1-47 0,22
IGHV3-33 IGLV3-21 0,22
IGHV3-9 IGLV1-44 0,22
IGHV3-9 IGLV1-47 0,22
IGHV3-9 IGLV2-11 0,22
IGHV1-46 IGLV1-44 0,22
IGHV1-8 IGLV2-14 0,22
14 IGHV3-23 IGKV1-16 0,15
IGHV3-23 IGKV2D-29 0,15
IGHV3-23 IGKV2-40/2D-40 0,15
IGHV3-30 IGKV1-33/1D-33 0,15
IGHV3-30 IGKV1D-8 0,15
IGHV4-39 IGKV2-28/2D-28 0,15
IGHV4-39 IGKV2-30 0,15
IGHV4-39 IGKV1-6 0,15
IGHV4-59 IGKV1-5 0,15
IGHV4-59 IGKV3-15 0,15
IGHV4-59 IGKV1-33/1D-33 0,15
IGHV4-34 IGKV1-33/1D-33 0,15
IGHV4-34 IGKV1-17 0,15
IGHV4-34 IGKV1-16 0,15
IGHV5-51 IGKV1-5 0,15
IGHV5-51 IGKV1-33/1D-33 0,15
IGHV1-69 IGKV3-15 0,15
IGHV1-69 IGKV3-11 0,15
IGHV1-69 IGKV1-8 0,15
IGHV3-7 IGKV1-5 0,15
IGHV3-7 IGKV4-1 0,15
IGHV3-7 IGKV2-28/2D-28 0,15
IGHV3-7 IGKV1-9 0,15
IGHV3-7 IGKV1-17 0,15
IGHV3-7 IGKV1-13 0,15
[0611]IGHV1-18 IGKV4-1 0,15
IGHV1-18 IGKV2-30 0,15
IGHV3-48 IGKV2-28/2D-28 0,15
IGHV3-48 IGKV1-17 0,15
IGHV3-21 IGKV2-28/2D-28 0,15
IGHV3-21 IGKV1-8 0,15
IGHV3-15 IGKV4-1 0,15
IGHV3-15 IGKV2-28/2D-28 0,15
IGHV3-15 IGKV1-9 0,15
IGHV4-31 IGKV3-20 0,15
IGHV4-31 IGKV2-28/2D-28 0,15
IGHV1-2 IGKV3-15 0,15
IGHV1-2 IGKV4-1 0,15
IGHV1-2 IGKV1-27 0,15
IGHV3-33 IGKV2-28/2D-28 0,15
IGHV3-33 IGKV1-9 0,15
IGHV3-53 IGKV3-20 0,15
IGHV3-53 IGKV3-11 0,15
IGHV3-53 IGKV1-8 0,15
IGHV3-11 IGKV3-20 0,15
IGHV3-11 IGKV4-1 0,15
IGHV3-11 IGKV3-11 0,15
IGHV3-11 IGKV2-28/2D-28 0,15
IGHV3-11 IGKV1-6 0,15
IGHV3-9 IGKV1-5 0,15
IGHV3-9 IGKV1-16 0,15
IGHV3-9 IGKV2D-29 0,15
IGHV3-74 IGKV1-39/1D-39 0,15
IGHV3-74 IGKV1-5 0,15
IGHV3-74 IGKV4-1 0,15
IGHV4-4 IGKV1-39/1D-39 0,15
IGHV4-4 IGKV1-5 0,15
[0612]IGHV4-4 IGKV4-1 0,15
IGHV4-4 IGKV2D-29 0,15
IGHV1-46 IGKV3-15 0,15
IGHV1-46 IGKV1-16 0,15
IGHV4-61 IGKV3-15 0,15
IGHV1-24 IGKV3-15 0,15
IGHV1-24 IGKV3-11 0,15
IGHV1-24 IGKV2-28/2D-28 0,15
IGHV3-49 IGKV3-20 0,15
IGHV3-64 IGKV1-5 0,15
IGHV3-64 IGKV3-11 0,15
IGHV7-81 IGKV1-39/1D-39 0,15
IGHV3-13 IGKV1-39/1D-39 0,15
IGHV3-13 IGKV4-1 0,15
IGHV3-72 IGKV3-15 0,15
IGHV3-30 IGLV1-40 0,15
IGHV3-30 IGLV1-44 0,15
IGHV3-30 IGLV2-23 0,15
IGHV3-30 IGLV3-21 0,15
IGHV3-30 IGLV9-49 0,15
IGHV4-39 IGLV2-18 0,15
IGHV4-59 IGLV2-23 0,15
IGHV4-59 IGLV2-11 0,15
IGHV4-34 IGLV1-44 0,15
IGHV4-34 IGLV2-23 0,15
IGHV4-34 IGLV3-25 0,15
IGHV5-51 IGLV1-47 0,15
IGHV5-51 IGLV2-23 0,15
IGHV5-51 IGLV3-21 0,15
IGHV5-51 IGLV1-36 0,15
IGHV5-51 IGLV3-25 0,15
IGHV1-69 IGLV1-44 0,15
[0613]IGHV1-69 IGLV2-11 0,15
IGHV1-69 IGLV3-1 0,15
IGHV1-18 IGLV1-44 0,15
IGHV1-18 IGLV2-8 0,15
IGHV1-18 IGLV6-57 0,15
IGHV3-48 IGLV1-47 0,15
IGHV3-21 IGLV2-14 0,15
IGHV3-21 IGLV1-47 0,15
IGHV3-21 IGLV2-11 0,15
IGHV3-15 IGLV7-46 0,15
IGHV4-31 IGLV1-51 0,15
IGHV4-31 IGLV1-47 0,15
IGHV4-31 IGLV2-23 0,15
IGHV1-2 IGLV1-44 0,15
IGHV1-2 IGLV1-51 0,15
IGHV1-2 IGLV2-23 0,15
IGHV1-2 IGLV2-8 0,15
IGHV3-11 IGLV3-21 0,15
IGHV3-11 IGLV3-1 0,15
IGHV3-9 IGLV3-21 0,15
IGHV3-74 IGLV3-21 0,15
IGHV4-4 IGLV2-14 0,15
IGHV4-4 IGLV1-51 0,15
IGHV1-46 IGLV1-51 0,15
IGHV4-61 IGLV2-11 0,15
IGHV1-24 IGLV2-23 0,15
IGHV1-3 IGLV2-14 0,15
IGHV1-3 IGLV3-1 0,15
IGHV4-28 IGLV1-44 0,15
IGHV4-28 IGLV1-36 0,15
IGHV3-43 IGLV1-51 0,15
15 IGHV3-23 IGKV1-9 0,07
[0614]IGHV3-23 IGKV2-30 0,07
IGHV3-23 IGKV1-12 0,07
IGHV3-23 IGKV2-29 0,07
IGHV3-23 IGKV3D-20 0,07
IGHV3-23 IGKV1D-12 0,07
IGHV3-30 IGKV2-30 0,07
IGHV3-30 IGKV1-27 0,07
IGHV3-30 IGKV1-16 0,07
IGHV3-30 IGKV1-6 0,07
IGHV3-30 IGKV2D-29 0,07
IGHV3-30 IGKV2-24 0,07
IGHV3-30 IGKV2D-30 0,07
IGHV4-39 IGKV1-17 0,07
IGHV4-59 IGKV2-30 0,07
IGHV4-59 IGKV1-17 0,07
IGHV4-59 IGKV1-27 0,07
IGHV4-59 IGKV1-8 0,07
IGHV4-59 IGKV1-16 0,07
IGHV4-59 IGKV1-12 0,07
IGHV4-59 IGKV1D-17 0,07
IGHV4-34 IGKV1-9 0,07
IGHV4-34 IGKV1-27 0,07
IGHV4-34 IGKV1-8 0,07
IGHV4-34 IGKV1-12 0,07
IGHV5-51 IGKV1-17 0,07
IGHV5-51 IGKV1-27 0,07
IGHV1-69 IGKV2-28/2D-28 0,07
IGHV1-69 IGKV2-30 0,07
IGHV1-69 IGKV1-16 0,07
IGHV1-69 IGKV2D-29 0,07
IGHV1-69 IGKV2D-30 0,07
IGHV1-69 IGKV1D-16 0,07
[0615]IGHV1-69 IGKV3D-15 0,07
IGHV3-7 IGKV2-30 0,07
IGHV3-7 IGKV1-27 0,07
IGHV3-7 IGKV1D-8 0,07
IGHV3-7 IGKV1D-17 0,07
IGHV1-18 IGKV3-15 0,07
IGHV1-18 IGKV1-8 0,07
IGHV1-18 IGKV1-16 0,07
IGHV1-18 IGKV1-12 0,07
IGHV1-18 IGKV1-13 0,07
IGHV1-18 IGKV2-40/2D-40 0,07
IGHV3-48 IGKV1-5 0,07
IGHV3-48 IGKV1-9 0,07
IGHV3-48 IGKV1-27 0,07
IGHV3-48 IGKV1-16 0,07
IGHV3-48 IGKV1-6 0,07
IGHV3-48 IGKV2D-29 0,07
IGHV3-48 IGKV3D-20 0,07
IGHV3-48 IGKV1D-12 0,07
IGHV3-21 IGKV3-11 0,07
IGHV3-21 IGKV1-27 0,07
IGHV3-21 IGKV2D-29 0,07
IGHV3-15 IGKV1-27 0,07
IGHV3-15 IGKV2D-29 0,07
IGHV3-15 IGKV1D-43 0,07
IGHV4-31 IGKV1-5 0,07
IGHV4-31 IGKV4-1 0,07
IGHV4-31 IGKV1-17 0,07
IGHV4-31 IGKV1-27 0,07
IGHV4-31 IGKV1-6 0,07
IGHV4-31 IGKV2-40/2D-40 0,07
IGHV1-2 IGKV2-28/2D-28 0,07
[0616]IGHV1-2 IGKV1-33/1D-33 0,07
IGHV1-2 IGKV2-30 0,07
IGHV1-2 IGKV1-8 0,07
IGHV1-2 IGKV1-6 0,07
IGHV3-33 IGKV1-5 0,07
IGHV3-33 IGKV1-33/1D-33 0,07
IGHV3-33 IGKV1-8 0,07
IGHV3-53 IGKV2-28/2D-28 0,07
IGHV3-53 IGKV1-9 0,07
IGHV3-53 IGKV1-17 0,07
IGHV3-53 IGKV1-27 0,07
IGHV3-53 IGKV1-12 0,07
IGHV3-53 IGKV2-29 0,07
IGHV3-53 IGKV1D-16 0,07
IGHV3-11 IGKV1-33/1D-33 0,07
IGHV3-11 IGKV1-9 0,07
IGHV3-11 IGKV1-17 0,07
IGHV3-11 IGKV1D-8 0,07
IGHV3-9 IGKV3-15 0,07
IGHV3-9 IGKV4-1 0,07
IGHV3-9 IGKV3-11 0,07
IGHV3-9 IGKV2-28/2D-28 0,07
IGHV3-9 IGKV1-27 0,07
IGHV3-9 IGKV1-8 0,07
IGHV3-9 IGKV1D-8 0,07
IGHV3-74 IGKV3-20 0,07
IGHV3-74 IGKV3-15 0,07
IGHV3-74 IGKV3-11 0,07
IGHV3-74 IGKV2-30 0,07
IGHV4-4 IGKV2-28/2D-28 0,07
IGHV4-4 IGKV1-17 0,07
IGHV4-4 IGKV1-27 0,07
[0617]IGHV4-4 IGKV1D-8 0,07
IGHV1-46 IGKV1-5 0,07
IGHV1-46 IGKV4-1 0,07
IGHV1-46 IGKV1-33/1D-33 0,07
IGHV1-46 IGKV1-8 0,07
IGHV4-61 IGKV2-28/2D-28 0,07
IGHV4-61 IGKV1-16 0,07
IGHV4-61 IGKV1-12 0,07
IGHV1-8 IGKV1-39/1D-39 0,07
IGHV1-8 IGKV3-15 0,07
IGHV1-8 IGKV4-1 0,07
IGHV1-8 IGKV3-11 0,07
IGHV1-8 IGKV2-28/2D-28 0,07
IGHV1-8 IGKV1-9 0,07
IGHV1-8 IGKV2-29 0,07
IGHV1-24 IGKV3-20 0,07
IGHV1-24 IGKV1-39/1D-39 0,07
IGHV1-24 IGKV4-1 0,07
IGHV1-24 IGKV1-33/1D-33 0,07
IGHV1-24 IGKV2-30 0,07
IGHV1-24 IGKV2-24 0,07
IGHV1-3 IGKV1-5 0,07
IGHV1-3 IGKV3-15 0,07
IGHV1-3 IGKV1-33/1D-33 0,07
IGHV1-3 IGKV2-30 0,07
IGHV1-3 IGKV2D-29 0,07
IGHV3-49 IGKV1-5 0,07
IGHV3-49 IGKV3-15 0,07
IGHV3-49 IGKV3-11 0,07
IGHV3-49 IGKV2-28/2D-28 0,07
IGHV3-43 IGKV4-1 0,07
IGHV3-43 IGKV3-11 0,07
[0618] 实施例3:确定VH和VL种系基因使用
[0619] 实施例2.3-4的表18-19的评述显示与种系基因的总数相比,少量的VH、Vκ和Vλ种系基因在人免疫组库中以及在幼稚的人免疫组库中占优势。Wildt等人在895-896页也描述了这种现象。Wildt等人也描述被频繁地表达的重链和轻链基因区段通常是配对的,并且观察到采样的一半配对仅对应于五个VH/VL种系基因对。
[0620] 另外,评估汇集数据以鉴定在人免疫组库中被独立地高表达的VH、Vκ、和Vλ种系基因。因此,包括如实施例2.1所述且在图4-26所示的从公开可用的文献鉴定的VH/VL种系基因对、如实施例2.2所示且在图28-36中所示从人样品鉴定的VH/VL种系基因对和包括未成对的VH和/或VL种系基因表达的另外的参考文献(见Brezinschek H.P.等人(1997)J.Clin.Invest.99,2488,Demaison C.等人(1995)Immunogenetics 42,342,和Foster S.J.等人(1997)J.Clin.Invest.99,1614,这些文章均通过引用整体并入本文)的数据被汇集并且被排序,以便确定哪些VH、Vκ和Vλ种系基因在人免疫组库中被最高表达。表20显示VH、Vκ和Vλ种系基因的普遍性的排序。
[0621] 表20:在人免疫组库中未成对的VH、Vκ和Vλ种系基因使用
[0622]
[0623]
[0624] 在将显示无联系的VH、Vλ和Vκ种系基因普遍性的表20与显示在人免疫组库和幼稚的人免疫组库中有联系的VH/VL对种系基因普遍性的表18-19进行比较时,显示在不考虑联系或配对而评估时被高度代表的VH、Vλ和Vκ种系基因中的许多在VH/VL配对中评估时也被高度代表。
[0625] 这一观察结果被显示人免疫组库的VH/VL种系基因对的图39-40和显示幼稚的人免疫组库的VH/VL种系基因对的图41-42所示的图所证实。这些图显示了在矩阵上作图的从汇集数据鉴定的每个VH/VL种系基因对的实际数目,其中Y轴包括VH种系基因的排序,并且X轴包括VL种系基因的排序。
[0626] 实施例4:选择VH/VL种系基因对以进一步评估其生物物理特性
[0627] 下一步,必须确定要测试哪些种系蛋白对,因为在人免疫组库中有大约2500对,并且发明人的目标是鉴定这些种系蛋白对中哪些包括将帮助选择和开发的有利的生物物理特性。一种方式是测试最突出地出现在人免疫组库中的可变重链和可变轻链种系蛋白对,例如,见表18。人们可例如选择前四百对用于测试,或者选择表达高于某个阈值浓度的可变重链和可变轻链种系基因对。这种方法将需要合成和测试大量可变重链和可变轻链种系蛋白对序列;因此,这种方法可能不是非常有效率的。
[0628] 作为一种替代的方法,发明人选择了代表、准确地再现或覆盖大多数来自人免疫组库的突出表达的对的一小组可变重链和可变轻链种系对。这种方法部分上基于以上观察结果,即,少量可变重链、可变κ轻链和可变λ轻链种系基因在人免疫组库中占优势。因此,可以组合少量的被突出表达的重链和轻链种系基因(未成对的)以产生一组代表人免疫组库的对。
[0629] 这种方法以下列方式进行。在实施例3中,确定了可变重链、可变κ轻链和可变λ轻链种系基因的表达。下一步,完成了占优势的VH、Vλ和Vκ种系基因的计算机模拟分析,其中评估了至少以下因素:CDR长度;等电点(pI)(优选的等电点是7.5或以上,因为这将提供在标准的pH 5.5到pH 7配制缓冲液中的稳定性);翻译后修饰(PTM)(具体地说,N连接的糖基化位点(NxS或NxT)或化学修饰如Asp切割(通常在DP),Asp异构化(DD,DG),脱酰胺作用(NS,NG)(这可在体内(在血清中)或在储存时在配制缓冲液中发生并且导致抗体结合的丧失);在CDR中甲硫氨酸的存在(当暴露于溶剂时可被氧化);未成对的半胱氨酸的存在(将与任何其他未成对的半胱氨酸形成二硫键,由此导致蛋白的交联和/或较低的表达水平);偏离种系;潜在的T细胞表位的存在;以及理论上的聚集倾向。来自计算机模拟分析的选择数据显示在图37-38中。
[0630] 基于最突出的VH、Vλ和Vκ种系基因的计算机模拟分析,选择这些种系基因中的一小组进行合成,组合以及随后功能测试,这个小组显示在图37-38中。如所示的,不是所有最突出的VH、Vλ和Vκ种系基因都被选择进行进一步测试。在最突出的VH种系基因中,如在表20中所示,IGHV4-34、IGHV4-59和IGHV3-9没有被选择。相反,如图37-38以及表21所示,IGHV3-74、IGHV3-73和IGHV6-1被选择。总计20种VH种系基因被选择。在最突出的Vκ种系基因中,如在表20中所示,IGKV4-1、IGKV2-28/2D-28、IGKV1-33/1D-33和IGKV1-8没有被选择。总计12种Vκ种系基因被选择。在最突出的VH种系基因中,如表20所示,IGLV1-44没有被选择。总计8种Vλ种系基因被选择。
[0631] 表21也显示人免疫组库的VH、Vκ和Vλ种系基因使用的排序,并且将选择用于进一步的功能测试的种系基因加粗并且加下划线。
[0632] 表21来自公开可用的数据和人B细胞样品的VH、Vλ和Vκ种系基因的普遍性的排序以及选择用于进一步的功能测试的VH、Vλ和Vκ种系基因的鉴定被加粗并且加下划线。
[0633]
[0634]
[0635] 实施例4.1:丰富的VH、Vκ和Vλ种系基因的重组产生在人免疫组库中VH/VL最突出的对的代表
[0636] 如以上所讨论的,且如表21和图39-40、图41-42所示,所选的20种VH、12种Vκ和8种Vλ当组合时准确地再现或覆盖大多数来自人免疫组库和幼稚的人免疫组库的被突出表达的VH/VL种系基因对。
[0637] 下一步,20种VH、12种Vκ和8种Vλ选择的VH、Vκ和Vλ种系基因被合成并组合以产生准确地再现或覆盖人免疫组库中大多数被突出表达的VH/VL种系基因对的400个VH/VL种系基因对。然后测试这400个VH/VL种系基因对的生物物理特性。
[0638] 表22显示所选的VH、Vκ和Vλ种系基因被组合以产生400个VH/VL种系基因对。
[0639] 表22
[0640]
[0641] 为了显示被产生用于功能测试的400个VH/VL种系基因对实际上确实准确地再现或覆盖人免疫组库中大多数被突出表达的VH/VL种系基因对,表18在以下以表23再现,其中被测试的400个VH/VL对被加粗和加下划线。
[0642] 表23:功能测试的400个VH/VL种系基因对代表在人免疫组库中鉴定的VH/VL种系基因对
[0643]
[0644]
[0645]
[0646]
[0647]
[0648]
[0649]
[0650]
[0651]
[0652]
[0653]
[0654]
[0655]
[0656]
[0657]
[0658]
[0659]
[0660]
[0661]
[0662]
[0663]
[0664]
[0665] 实施例4.2
[0666] 如在实施例2.4中所讨论的,感觉区分幼稚的、未经历抗原的B细胞群和经历抗原的B细胞群是重要的。因此,显示在幼稚的人免疫组库中鉴定的VH/VL种系基因对的排序的表19在以下以表24再现,其中被合成并组合用于进一步功能测试的400个VH/VL种系基因对被加粗和加下划线。
[0667] 表24:功能测试的400个VH/VL种系基因对代表在幼稚的人免疫组库中鉴定的VH/VL种系基因对
[0668]
[0669]
[0670]
[0671]
[0672]
[0673]
[0674]
[0675]
[0676]
[0677]
[0678]
[0679]
[0680]
[0681] 实施例5:用于功能分析的种系基因的产生
[0682] 下一步,将如表25所示的被选择用于组合和随后的测试的VH、Vλ和Vκ种系基因送至Geneart(Regensburg,Germany)以用于对于大肠杆菌表达进行密码子优化(对哺乳动物表达无作用)以及合成。
[0683] 表25:送至合成的VH、Vλ和Vκ种系基因
[0684]
[0685] 每一个VH、Vλ和Vκ种系基因的种系基因序列显示在图45-47中。合成每个种系基因序列以包括以下部分:
[0686] a)对于VH:前导序列(掺入如图3所示的NheI限制酶切位点的修饰的phoA信号序列);种系FR1、CDR1、FR2、CDR2和FR3(掺入如图3所示的BssHII限制酶切位点);如在Ewert S.等人,J.Mol.Biol.(2003)325,531-553中所用的4D5抗体的CDR-H3(WGGDGFYAMDY);以及JH4 FR4(掺入如图3所示的XhoI/SalI RE位点);
[0687] b)对于Vκ:前导序列(掺入如图3所示的NdeI限制酶切位点的修饰的ompA信号序列);种系FR1、CDR1、FR2、CDR2和FR3(掺入如图3所示的BbsI限制酶切位点);根据Ewert S.等人,J.Mol.Biol.(2003)325,531-553的κ样CDR-L3(QQHYTTPPT);以及Jκ1FR4(掺入如图3所示的KpnI RE位点);
[0688] c)对于Vλ:前导序列(掺入如图3所示的NdeI限制酶切位点的修饰的ompA信号序列);种系FR1、CDR1、FR2、CDR2和FR3(掺入如图3所示的BbsI限制酶切位点);根据Ewert S.等人,J.Mol.Biol.(2003)325,531-553的λ样CDR-L3(QSYDSSLSGVV);以及Jl2/3FR4(掺入如图3所示的KpnI RE位点)。
[0689] 实施例6:代表人免疫组库的VH/VL种系基因对的功能测试
[0690] 然后测试这400个VH/VL种系基因对的如下特性:a)在噬菌体产生和噬菌体ELISA之后以Fab形式的相对展示;b)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和产生的Fab的ELISA检测后的相对Fab表达水平;c)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和升高温度下孵育后非变性Fab的ELISA检测后Fab的温度稳定性;d)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的来自大肠杆菌裂解物的Fab的牛/小鼠血清稳定性;e)在哺乳动物细胞中产生IgG1和ELISA检测细胞培养上清液中的分泌IgG1后的相对的人IgG1表达水平;和f)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的人IgG1的牛血清稳定性。
[0691] 实施例6.1:产生展示在噬菌体上的Fab池以用于功能表征
[0692] 将实施例5中合成、表25中显示的抗体或抗体片段克隆到三顺反子Fab展示载体pJPd1中(图48)以用于功能测试。产生包含每个主基因的组合的Fab池,主基因是与8种Vλ和12种Vκ组合的20种VH,它产生400个组合,这些组合代表人免疫组库的绝大多数最突出的VH/VL种系基因对,如表18和图39-40所示。
[0693] 使用96孔板小规模生产包含以上基因对的噬菌体。通过以2×YT/CAM/TET/Gluc介质填充每个孔并且接种来自400个VH/VL组合的克隆产生主板(master plate),其中pMORPH30_Vk3-11_AQA/VH3-23_TKA或pMORPH30_Vk3-11_AYA/VH3-23_VLA(pMORPH30显示在图51中)用作对照。将板在37℃孵育过夜同时摇动。将主板储存在15%终浓度的甘油中并且在-80℃冷冻。
[0694] 使用2×YT/CAM/TET/Gluc作介质产生另外的96孔板用于噬菌体生产并将其接种上述主板的克隆。将板在37℃孵育约2-4小时,同时以400rpm摇动直至达到约0.5的OD600nm。
[0695] 用每孔5μl辅助噬菌体(超级噬菌体;PROGEN;1×1012pfu/ml)感染这些板。将板在37℃孵育45min没有摇动,然后在37℃孵育60min同时以400rpm摇动。将细菌在4℃以2200g离心5min。
[0696] 弃去包含辅助噬菌体的上清液并且用没有葡萄糖的2×YT/Cam/TET/Kan/IPTG重悬感染的大肠杆菌沉淀。将重悬的沉淀转移到用2×YT/Cm/TET/Kan/IPTG预先填充的新的96深孔板中。将板在22℃孵育过夜,同时摇动。通过离心收集包含噬菌体的上清液,弃去大肠杆菌细胞和碎片。
[0697] 实施例6.2:利用ELISA评估Fab噬菌体展示排序
[0698] 如实施例6.1所述制备的噬菌体上清液用于在噬菌体ELISA中的Fab噬菌体展示排序。
[0699] 利用两种不同的捕获抗体在噬菌体ELISA中评估Fab片段的展示:
[0700] (1)抗M13抗体(Amersham#27-9420-01)用于经主要外壳蛋白g8p捕获噬菌体粒子;因此可以确定噬菌体滴度。
[0701] (2)使用与展示的Fab结合的抗Fd抗体(The Binding Site#PC075);因此,只有展示包含主基因的Fab的噬菌体被捕获。
[0702] 通过如下方式将对应的捕获抗体固定在黑色96孔MaxisorpTM板上:将对于抗M13抗体为7.5μg/ml的浓度以及对于抗Fd抗体为1.0μg/ml的浓度的100μl抗体溶液分配到不同的孔中,用层压箔片(laminated foil)密封板并将其在4℃孵育过夜。第二天,用TBST将板洗涤两次,并且在室温下用300μl CTBST封闭每个孔1小时。
[0703] 转移噬菌体上清液和参考样品以用于如下检测。用TBST洗涤封闭的ELISA板两次。将100μl在CTBST中的适当稀释的噬菌体上清液从稀释板转移到包被的ELISA板,在室温下孵育1-2小时,并且用TBST洗涤5次。添加在CTBST中1∶5000稀释的100μl/孔的抗M13过氧化物酶轭合物(Amersham),并且将其在室温下孵育1-2小时。通过混合1份(例如,0.5ml)过氧化物溶液与9份(例如,4.5ml)底物溶液并且将其平衡至室温至少30min来制备Quanta Blu(Pierce)工作溶液。用TBST将ELISA板洗涤5次,添加100μl/孔的QuantaBlu工作溶液。在约2min的孵育时间后测量荧光(激发光:320nm,发射光:
430nm),随后间隔5min测量。
[0704] 如下完成ELISA数据的评估:通过使用HuCAL GOLD参考噬菌体制备物(VH3κ+λ)产生校准曲线,并且计算噬菌体上清液和对照的滴度。对于每个样品,关于抗Fd的滴度除以关于抗M13(抗pVIII)的滴度,得到的比值是相对展示率。
[0705] 使用内标(HuCAL GOLD噬菌体制备物VH3κ+λ)计算Fab的相对展示率,该内标不是公开可用的。相对展示率被评估为排序。通过将相对展示值排序,本领域技术人员能够使用任何对照再现以上方法。例如,每个种系蛋白对展示相对于对照的量。因此,与我们的对照相比具有最高相对展示率的种系蛋白对还将具有相比于任何对照的最高相对展示率,尽管有以下事实:特定的相对展示率可能会不同。因此,使用显示在图55中还显示在表32中的相对展示数据产生这些值的排序,其中从最高值到最低值将数据排序。排序显示在表26中。从这个排序可鉴定包括在采样的前10%、20%、30%、45%、50%、55%、60%、70%、
75%、80%和90%的Fab内的相对展示率的种系蛋白对。
[0706] 具体地说,从测试的400对,获得196对的相对展示值,见表26。因此,本领域技术人员可以准确地确定哪些种系蛋白对落在采样的前10%、20%、30%、45%、50%、55%、60%、70%、75%、80%或90%的Fab内。例如,前75%包括在表26中被排序为编号1-147的种系蛋白对。
[0707] 表26:相对Fab展示值的排序
[0708]
[0709]
[0710]
[0711]
[0712]
[0713]
[0714] 图55显示400个VH/VL种系基因对的大多数的相对展示率。
[0715] 实施例6.3:确定大肠杆菌裂解物中的Fab表达水平的400个VH/VL组合的筛选ELISA
[0716] 通过挑取被Fab表达载体pJPx1(显示在图49中)中的VH/VL组合的池转化的克隆到每孔的2YT/Cam/1%Gluc介质中来接种主板(MP)。将这些板在37℃孵育过夜,同时摇动。用2.5μl来自MP的培养物接种到表达板(EP)的每孔2YT/Cam/0.1%葡萄糖中。由甘油储液接种对照(见表27)。将这些板在37℃孵育6小时并且摇动,然后通过添加IPTG诱导Fab表达并且在22℃孵育过夜同时摇动。通过添加酸/EDTA/溶菌酶缓冲液到EP中生产大肠杆菌细胞裂解物(在22℃孵育1小时,摇动),并随后用12.5%MPBST封闭细菌裂解物,在室温下摇动至少30min。将来自表达板的大肠杆菌裂解物在0.5%MPBS中适当地稀释并且在以下测定中使用。
[0717] 表27显示使用的未标记的包被抗体和AP标记的检测抗体。
[0718] 表27:
[0719]
[0720] 表28描述了使用的对照。
[0721] 表28:
[0722]
[0723] 筛选ELISA包括如下步骤:用在PBS中稀释的抗人IgG Fd特异性抗体包被MaxiSorp板的384孔,并且在4℃孵育过夜。第二天,用PBST洗涤板两次,并且通过向每个孔添加(在PBS中的5%奶粉)且在室温孵育1-2小时同时摇动,进行封闭。然后再次用PBST洗涤板,并且添加在0.5%MPBS中稀释的预封闭的大肠杆菌裂解物,并且在室温下孵育1小时同时摇动。还添加对照#3和#5。然后用PBST洗涤板,并且将AP标记的检测抗体在0.5%MPBS中稀释。添加稀释的检测抗体,然后在室温下孵育1小时,同时轻轻摇动。通过以下步骤鉴定信号:用TBST洗涤孔并且添加20μl的AttoPhos(在ddH2O中1∶5稀释),并且使用Tecan(infiniTe F200)程序PrimeScreen在5min和7-8min读数。
[0724] 通过将各自的VH/VL对的ELISA信号除以参考Fab pMx11_FHVH1-69VLA_Vl1-40AYA的ELISA信号计算相对Fab表达水平。从而同等高的ELISA信号产生为1的相对Fab表达水平。参考Fab被表达在pMORPHX11质粒(显示在图50)中,该质粒包括:a)包含C端NheI限制酶切位点的修饰的phoA重链信号序列;b)包含C端NdeI限制酶切位点的修饰的ompA轻链信号序列;c)如图45A所示的VH1-69*01种系基因的可变重链种系蛋白序列;d)如图47A所示的IGLV1-40种系基因的可变轻链种系蛋白序列;e)掺入hu4D5-8抗体的CDR-H3(WGGDGFYAMDY)以及重链FR4的JH4种系蛋白序列;f)掺入CDR-L3区(QSYDSSLSGVV)和轻链FR4的Jl2/3种系蛋白序列。hu4D5-8描述在Carter P.等人(1992)“Humanization of an anti-p185Her2 antibody for human cancer therapy(用于人癌症治疗的抗p185Her2抗体的人源化)”Proc.Natl.Acad.Sci.USA 89,4285-4289)中。在Geneart(Regensburg,Germany)产生了所有的基因。
[0725] 结果显示在图56中。
[0726] 实施例6.4:确定BEL裂解物中的Fab的温度稳定性的400个VH/VL组合的筛选ELISA
[0727] 按照实施例6.3产生表达板。将来自表达板的稀释的大肠杆菌裂解物在不同的温度下孵育45分钟并且在以下测定中使用。
[0728] 表29显示使用的未标记的包被抗体和AP标记的检测抗体。
[0729] 表29:
[0730]
[0731] 筛选ELISA包括如下步骤:用在PBS中稀释的包被抗体(见上表)包被MaxiSorp板的384孔。将板在4℃过夜孵育。第二天,用PBST洗涤板并且通过向每孔添加5%MPBS并且在室温下孵育1-2小时同时摇动来进行封闭。然后将来自表达板的稀释的大肠杆菌裂解物分配到四个96孔PCR板(每个约40μl)中并将其暴露于PCR仪中的不同温度(4℃(在冰上),60℃,70℃,80℃,然后在冰上),每个温度45min。用PBST洗涤封闭的384孔板,然后将预孵育的Fab裂解物添加到板中。然后在室温下将板孵育1小时,同时摇动。用PBST洗涤板,并且将AP标记的检测抗体在0.5%MPBS中稀释。添加20μl/孔的稀释的检测抗体并且在室温下孵育1小时,同时轻轻摇动。通过以下方式鉴定信号:用TBST洗涤孔并且向所有的孔添加AttoPhos(在ddH2O中1∶5稀释)。使用Tecan(infiniTe F200)、程序PimeScreen在不同的时间点(5min到10min)读取信号。
[0732] 结果显示在图57中。
[0733] 实施例6.5:确定大肠杆菌裂解物中的Fab的血清稳定性的400个VH/VL组合的筛选ELISA
[0734] 按照实施例6.3产生表达板。使用以下步骤稀释包含Fab的大肠杆菌裂解物并且将其孵育在牛血清和小鼠血清中:将来自表达板的大肠杆菌裂解物在50%血清中稀释(总体积100μl),添加1∶1000Cam以阻止细菌的生长,并且将裂解物分配到两个96孔板中,且将两个板冷冻。将第一个板解冻并且在37℃孵育12-13天。将第二个板储存在-80℃直至进行ELISA(在37℃孵育0天)。
[0735] 表30显示使用的未标记的包被抗体和AP标记的检测抗体。
[0736] 表30:
[0737]
[0738] 在第11天或第12天,用20μl在PBS中稀释的包被抗体包被MaxiSorp板的384孔。将板在4℃过夜孵育。第二天,用PBST洗涤板并且通过向每孔添加5%MPBS并且在室温下孵育1-2小时同时摇动来进行封闭。然后用PBST洗涤封闭的384孔板。将来自-80℃和37℃样品的在血清中的大肠杆菌裂解物转移到包被的ELISA板并且在室温下孵育1小时同时摇动。用PBST洗涤板,并且将AP标记的检测抗体在0.5%MPBS中稀释。添加AP标记的检测抗体,然后在室温下孵育1小时,同时摇动。通过以下方式鉴定信号:用TBST洗涤孔并且向所有的孔添加AttoPhos(在ddH2O中1∶5稀释)。使用Tecan(infiniTe F200)、程序PrimeScreen在不同的时间点(5min到10min)读取信号。
[0739] 牛血清稳定性测试的结果显示在图58中。
[0740] 小鼠血清稳定性测试的结果显示在图59中。
[0741] 实施例7:用于评估生物物理特性的IgG的产生
[0742] 对于400个VH/VL种系基因对的产生,将20种可变区重链基因亚克隆到图52所示的人IgG1表达载体pJP_hIgG1中。并行地将12种可变区κ基因亚克隆到图53所示的哺乳动物κ轻链表达载体pJP_hIgκ中,以及将8种可变区λ基因亚克隆到图54所示的哺乳动物λ轻链表达载体pJP_hIgλ中。
[0743] 通过每次共转染重链和轻链表达质粒,所有400个VH/VL对可通过只克隆40种表达构建体而被分别产生。因而,将所有20种重链构建体与每种轻链表达构建体在HEK.EBNA细胞中共转染。在转染后几天从细胞培养上清液收集或检测人IgG1。
[0744] 实施例7.1:IgG表达排序
[0745] 用于选择要包括在文库中的VH/VL配对的标准之一是以IgG形式的400个不同的VL/VL配对的表达水平。通过夹心ELISA评定以人IgG1形式的每个VH/VL配对的表达水平。因此,将人IgG1形式的所有400个VH/VL组合转染到HEK.EBNA细胞中并且以小规模表达。在几天后收获细胞培养上清液并且评定IgG水平。
[0746] 进行以下程序。用PBS中的2.5μg/ml的Fcγ-pan R10Z8E9小鼠抗人IgG包被384孔MaxiSorpTM板。将板在4℃孵育过夜。用PBST洗涤板。用PBST中的5%BSA或
1×Chemiblocker封闭板并且将其在室温下孵育1小时,同时摇动,且再次用PBST洗涤。
在2.5%BSA-PBST中稀释IgG表达上清液并且将稀释的样品添加到已封闭和洗涤的ELISA板。使用以下对照:空白上清液和具有低表达的抗体、中等表达的抗体和高表达的抗体的上清液。在室温下将板孵育2小时,同时摇动。然后用TBST洗涤板。添加在1%BSA-TBST中的适当稀释的Fcγ-pan R10Z8E9小鼠抗人IgG生物素轭合物。将板在室温孵育1小时。用TBST洗涤板。添加在0.5%BSA-TBST中1∶2000稀释的链霉亲和素-AP,并且将板在室温下孵育1小时,同时摇动。用TBST洗涤板。添加使用前直接在TBST中稀释的AttoPhosTM荧光底物(根据制造商的说明书制备)。在5min和10min之后,经Tecan酶标仪(microplate reader)测量荧光。
[0747] 通过将各自的VH/VL对的ELISA信号除以参考IgG1MOR03080(显示在表31中)的ELISA信号计算相对IgG1表达水平。从而同等高的ELISA信号产生为1的相对IgG1表达水平。
[0748] 表31
[0749] MOR03080的氨基酸序列如下:
[0750] 03080可变重链,CDR以粗体表示:
[0751]
[0752] 03080可变轻链,CDR以粗体表示
[0753]
[0754] 结果显示在图60中。
[0755] 实施例7.2:IgG1血清稳定性排序
[0756] 用于选择要包括在文库中的可变重链和可变轻链配对的标准之一是以IgG形式的400个不同的可变重链和可变轻链配对的血清稳定性。通过在50%小鼠血清中孵育14天以及随后用小鼠抗人IgG(CH2)克隆R1028E9进行的夹心ELISA评定每种IgG抗体上清液的血清稳定性。再次将人IgG1形式的所有400个VH/VL组合转染到HEK.EBNA细胞中并且以小规模表达。在几天后收获细胞培养上清液并且测试该上清液中IgG的血清稳定性。
[0757] 进行以下程序。用PBS中的2.5μg/ml的Fcγ-pan R1028E9小鼠抗人IgG包被384孔MaxiSorpTM板。将板在4℃孵育过夜。用PBST洗涤板,然后用5%BSA-PBST或1×Chemiblocker在室温下封闭板1小时,同时摇动。用PBST洗涤板。将包含IgG1的细胞培养上清液稀释在a)2.5%BSA-PBST和b)50%小鼠血清中,并且在37℃孵育至少14天,并且将这些样品添加到已封闭和洗涤的ELISA板。使用以下对照:空白上清液和具有低表达的抗体、中等表达的抗体和高表达的抗体的上清液。在室温下将板孵育2小时,同时摇动。
用TBST洗涤板。添加在1%BSA-TBST中稀释为0.8μg/ml的Fcγ-pan R1028E9小鼠抗人IgG生物素轭合物。将板在室温孵育1小时。用TBST洗涤板。添加在0.5%BSA-TBST中1∶2000稀释的链霉亲和素-AP。在室温下将板孵育1小时,同时摇动。用TBST洗涤板。添加使用前直接在TBST中1∶5稀释的AttoPhosTM荧光底物(根据制造商的说明书制备)。在5min和10min之后,经Tecan酶标仪测量荧光。
[0758] 结果显示在图61中。
[0759] 实施例8:选择具有有利的生物物理特性的VH/VL对加入集合中
[0760] 测试这400个VH/VL种系基因对的如下特性后:a)在噬菌体产生和噬菌体ELISA之后以Fab形式的相对展示;b)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和产生的Fab的ELISA检测后的相对Fab表达水平;c)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和升高温度下孵育后非变性Fab的ELISA检测后Fab的温度稳定性;d)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的来自大肠杆菌裂解物的Fab的牛/小鼠血清稳定性;e)在哺乳动物细胞中产生IgG1和ELISA检测细胞培养上清液中的分泌IgG1后的相对的人IgG1表达水平;和f)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的人IgG1的牛血清稳定性;然后下一步就是选择要将哪些VH/VL种系对加入集合中。
[0761] 每个VH/VL种系蛋白对的功能测试的结果显示在表32中。
[0762] 表32:400个VH/VL种系基因对中每一个的功能数据的汇编
[0763]
[0764]
[0765]
[0766]
[0767]
[0768]
[0769]
[0770]
[0771] 如在之前的实施例中所述的,将占优势的VH和VL种系基因和占优势的VH/VL种系基因对从人免疫组库和幼稚的人免疫组库中鉴定出来,然后经由计算机模拟分析占优势的VH和VL种系蛋白序列以选择鉴定具有有利的生物物理特性的可变重链和可变轻链种系蛋白序列。如表21以及图37-38所示,一般来说,选择前20种VH、前8种Vλ和前12种Vκ用于合成、组合及随后的功能分析。合成种系基因序列,然后将其组合以产生代表在免疫组库中发现的丰富的种系基因对的400个种系蛋白对,其中可变区中的每一个都具有经由计算机模拟而鉴定的有利的生物物理特性。测试这400个VH/VL种系蛋白对的如下特性:a)在噬菌体产生和噬菌体ELISA之后以Fab形式的相对展示;b)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和产生的Fab的ELISA检测后的相对Fab表达水平;c)在大肠杆菌中的Fab产生、大肠杆菌细胞裂解和升高温度下孵育后非变性Fab的ELISA检测后Fab的温度稳定性;d)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的来自大肠杆菌裂解物的Fab的牛/小鼠血清稳定性;e)在哺乳动物细胞中产生IgG1和ELISA检测细胞培养上清液中的分泌IgG1后的相对的人IgG1表达水平;和f)在牛/小鼠血清中孵育后借助非变性Fab的ELISA检测的人IgG1的牛血清稳定性。
[0772] 使用表32中提供的数据,本领域技术人员可容易地鉴定具有有利的生物物理特性的种系蛋白对。
[0773] 一般来说,选择具有每种功能特性的阈值的种系蛋白对以加入集合中。例如,在一些实施方案中,选择包括所有以下特性的种系蛋白对加入到集合中:i)以Fab形式的相对展示率包括在采样的前75%Fab内的值;ii)与Fab VH1-69VLA_Vl1-40AYA相比至少0.4的以Fab形式的表达水平;iii)以Fab形式在60℃或更高温度持续至少45分钟的热稳定性;iv)以Fab形式在37℃持续大于十天的在牛血清或小鼠血清中的稳定性;v)与MOR03080相比至少0.4的以IgG形式的表达水平;和vi)以IgG形式在37℃持续十四天的在血清中的稳定性。表32以粗体和下划线显示包含所有这些功能特性的种系蛋白对。
[0774] 然而,如以上所述,可选择具有一种或更多种功能特性的种系蛋白对加入到集合中。这里,创建了所测试的400个种系蛋白对的累积排序(aggregate ranking),以使得可以将每个种系蛋白对相对于彼此进行排序,对测试的每个功能特性给予权重。这允许发明人选择具有所列出的功能特性的一种或更多种或全部功能特性的一种或更多种种系蛋白对。在一些实施方案中,集合包括具有以上特征的全部种系蛋白对。在一些实施方案中,集合包括具有所测试的400对的最高累积得分的种系蛋白对。在一些实施方案中,选择具有所测试的400对的前10%、前20%、或前30%内的累积得分的种系蛋白对加入集合中。
[0775] 应理解说明书、具体实例和数据当指出示例性实施方案时是通过阐释的方式给出,并且不旨在限制本发明。从本文包括的讨论、公开内容和数据,本发明内的各种改变和变更将变得对技术人员是明显的,因而被认为是本发明的一部分。
QQ群二维码
意见反馈