首页 / 专利库 / 物理 / 离子阱 / 基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法

基于质谱技术实现单克隆抗体药物基酸序列的测序方法

阅读:27发布:2021-03-21

专利汇可以提供基于质谱技术实现单克隆抗体药物基酸序列的测序方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于质谱技术实现单克隆 抗体 药物 氨 基酸序列的测序方法,所述基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法利用质谱数据依赖性和全信息 串联 采集;将质谱DDA采集获得的数据用Peaks 软件 进行从头测序后,再用MSE采集获得的数据进行氨基酸序列的验证。单克隆抗体分子量高达150KDa,采用本发明能够高效地实现对其氨基酸序列的测定,为单抗药品的研发、 生物 类似药研究和 质量 控制提供重要手段,实现了单抗药物氨基酸序列的从头测序(de novo)。,下面是基于质谱技术实现单克隆抗体药物基酸序列的测序方法专利的具体信息内容。

1.一种基于质谱技术实现单克隆抗体药物基酸序列的测序方法,其特征在于,所述基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法利用质谱数据依赖性和全信息串联采集;将质谱DDA采集获得的数据用Peaks软件进行从头测序后,再用MSE采集获得的数据进行氨基酸序列的验证。
2.如权利要求1所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法包括以下步骤:
步骤一,通过文献检索获得该单抗IgG类型,CDR区、恒定区、可变区序列信息;
步骤二,采用胰蛋白酶进行酶解,再通过DDA数据采集获得高质量一级谱图和二级谱图,将一级、二级谱图用Peaks软件进行denovo解析,获得初步的氨基酸序列结果;
步骤三,采用多种蛋白酶进行酶解,MSE采集数据后可获得所有肽段峰以及每个肽段的各个价态完整和碎裂的信息;
步骤四,将获得的更加全面的质谱数据与初步的氨基酸序列进行匹配,实现氨基酸序列验证。
3.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,采用DDA模式进行肽段的色谱分离和质谱数据的采集,采用PepFinder分析处理数据,用已有的氨基酸序列进行匹配;利用Peaks软件对DDA质谱数据进行从头测序的软件分析。
4.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,进一步包括:采用多种蛋白酶分别酶解该单抗,包括胰蛋白酶、糜蛋白酶、Glu-C、Lys-C、以及PNGase F酶串联胰蛋白酶切;采用MSE模式采集肽段以及UNIFI处理数据去验证de novo后的结果。
5.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述酶解的具体条件及过程为:
取单抗原液100μL,加稀释至样品浓度为5mg/mL;
计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA pH=7.5的蛋白变性缓冲液稀释;
加入10μL 1M二硫苏糖醇到稀释后样品中,在37℃孵育1小时,使蛋白还原;
加入12μL 2.9M碘乙酰胺到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化,然后加入30μL 1M DTT到烷基化后样品中,终止反应;
用10mL 100mM Tris pH=7.5酶解缓冲液,平衡NAP-5柱子,每次加入0.5mL,重复加入
20次;
加入500μL还原烷基化后的样品到平衡后的NAP-5柱子中,每个样品使用两个NAP-5柱子,弃去流出的馏分;
对于每个NAP-5柱子,用800μL酶解缓冲液洗脱,并收集洗脱液;
根据样品浓度,加入胰蛋白酶,蛋白:酶=1:20,37℃孵育1.5小时,使蛋白酶解成肽段;
将酶解后样品进行冷冻干燥,然后用100μL水重新溶解,加入进样小瓶。
6.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述再通过DDA数据采集获得高质量一级谱图和二级谱图具体数据采集方法为:
色谱条件:色谱柱:ACQUITY UPLC BEH130 C18;流动相:A相为0.1%三氟乙酸水溶液,B相为0.09%三氟乙酸90%乙腈溶液;梯度洗脱;2-47分钟B相从1-40%,流速为0.3mL/min,柱温65℃;
质谱条件:采用正离子模式,喷雾电压为4.0kV;离子传输管温度为325℃;S-lens为
60%,扫描模式为DDA,选择一级谱图中相对强度最高的3个离子去做二级碎裂;一级扫描为Orbitrap;扫描范围为m/z 200-2000;分辨率为60K;碰撞模式为CID;碰撞能量为35%;二级扫描为离子阱;扫描速度为Normal。
7.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述将一级、二级谱图用Peaks软件进行de novo解析,获得初步的氨基酸序列结果具体方法为采用SwissProt人数据库和添加的该单抗蛋白氨基酸序列合并后进行蛋白质鉴定,鉴定采用Peaks Studio 8.0软件,设置参数如下:酶解方式为胰蛋白酶;质量容差一级为7ppm;二级为0.05Da;固定修饰包括:还原烷基化:半胱氨酸+57Da;可变修饰:化甲硫氨酸+16Da,脱酰胺化天冬酰胺、谷氨酰胺+0.98Da;结果质控方式:谱图水平1%假阳性率,差异比较采用PEAKS Q非标记定量算法,基于一级谱峰峰面积强度进行肽段定量并整合为蛋白质的差异信息,归一化对添加单抗蛋白强度计算后以此归一化,结果取倍数变化大于2倍结果进行差异蛋白选取。
8.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述Glu-C和Lys-C酶解包括:
取单抗原液100μL,加水稀释至样品浓度为5mg/mL;
计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA pH=7.5的蛋白变性缓冲液稀释;
加入10μL 1M二硫苏糖醇到稀释后样品中,在37℃孵育1小时,使蛋白还原;
加入12μL2.9M碘乙酰胺到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化;
然后加入30μL 1M DTT到烷基化后样品中,终止反应;
用10mL水,平衡NAP-5柱子,每次加入0.5mL,重复加入20次;
加入还原烷基化后的样品到平衡后的NAP-5柱子中,弃去流出的馏分;
用800μL水洗脱,并收集洗脱液;
取200μL洗脱液,加入磷酸盐缓冲液,终浓度为100mM,根据样品浓度,加入Glu-C,蛋白:
酶=1:20,37℃孵育16-18小时,使蛋白酶解成肽段;
另取200μL洗脱液,加入酸氢铵缓冲液,终浓度为50mM,根据样品浓度,加入Lys-C,蛋白:酶=1:20,37℃孵育16-18小时,使蛋白酶解成肽段;
将酶解后样品分别进行冷冻干燥,然后用50μL水重新溶解,加入进样小瓶,待后续检测。
9.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述PNGase F串联胰蛋白酶酶解包括:
取单抗原液100μL,加水稀释至样品浓度为5mg/mL;
计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA pH=7.5的蛋白变性缓冲液稀释;
加入10μL 1M二硫苏糖醇到稀释后样品中,在37℃孵育1小时,使蛋白还原;
加入12μL 2.9M碘乙酰胺到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化,然后加入30μL 1M DTT到烷基化后样品中,终止反应;
用10mL水,平衡NAP-5柱子,每次加入0.5mL,重复加入20次;
加入还原烷基化后的样品到平衡后的NAP-5柱子中,弃去流出的馏分;
用800μL水洗脱,并收集洗脱液;
在洗脱液中补加磷酸盐缓冲液,根据样品浓度,加入PNGase F,37℃孵育18小时;然后补加胰蛋白酶,蛋白:酶=20:1,37℃孵育8小时;
将酶解后样品进行冷冻干燥,然后用100μl水重新溶解,加入进样小瓶,待后续检测。
10.如权利要求2所述的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,其特征在于,所述MSE采集数据后可获得所有肽段峰以及每个肽段的各个价态完整和碎裂的信息具体数据采集方法为:
色谱条件:色谱柱:ACQUITY UPLC BEH130C18;流动相:A相为0.1%甲酸水溶液,B相为
0.1%甲酸乙腈溶液;梯度洗脱;3-93分钟开始B相从0-35%,流速为0.2mL/min,柱温65℃;
质谱条件:ESI正离子模式,脱溶剂气体温度350℃,源温度105℃,脱溶剂气流速800L/h,毛细管电压3kV,锥孔电压25V,数据采集范围m/z 50~2000;使用MSE采集方法,即在碰撞池内等频率交替进行低碰撞能量和高碰撞能量切换,分别获得各个肽段母离子一级质谱数据及其二级碎片数据;用嵌入式辅助持续注射100fmol/mL的Glu1-血纤维蛋白肽B溶液,乙腈∶水=50∶50,含0.1%甲酸,流速10μL/min,用于获得Lockmass参比质量信号,以便对所测得的质量数进行实时校准。

说明书全文

基于质谱技术实现单克隆抗体药物基酸序列的测序方法

技术领域

[0001] 本发明属于氨基酸测序技术领域,尤其涉及一种基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法。

背景技术

[0002] 目前,抗体药物是近年来生物制药领域增长率最快的一类生物技术药物,以靶向性强、副作用小等优势在癌症、自身免疫性疾病等领域应用广泛。目前,单抗药物占据了全球十大畅销药物的半壁江山。在中国,单抗药物的申报和销售也呈急速上升趋势,随着原研产品专利过期,有越来越多的企业投身于单抗生物类似药的研发和生产。因单抗药物存在巨大的经济利益,不少不法分子制造生产单抗假药,严重危害国民的健康。因此,对单抗药物的质量研究刻不容缓。
[0003] 氨基酸序列是单抗药物的一级结构,是单抗药物研究的基础。但是由于专利保护等原因,在专利期内的单抗药物氨基酸序列较难获得,成为研发瓶颈。基于软电离技术的开发,质谱成为蛋白质药物研究的重要手段。在单抗药物氨基酸序列的鉴定和确证中,首先用胰蛋白酶等进行酶解,获得肽段用质谱进行一级扫描和二级碎裂。得到的数据与已知的单抗药物氨基酸序列进行匹配以获得鉴定结果。再通过完整蛋白和轻重链的理论与测定分子量的一致性比较进一步确证单抗的氨基酸序列。当无法获得氨基酸序列时,可以通过文献检索等方法初步获得。但由于自我保护等原因,文章中公布的氨基酸序列通常与真实序列存在较大差异,需要进一步验证和研究。质谱数据采集的方法包含有数据依赖性(DDA)、全信息串联(MSE)采集等。数据依赖性采集(DDA)利用一级全扫描检测肽段母离子,然后按信号强度排列,将前若干位的母离子依次选择、碎裂,并扫描二级碎片离子。由于DDA通常选择一级扫描中信号最强的1~10个母离子进行碎裂,因此二级碎裂图谱的质量较高。对于准确解析肽段的氨基酸序列非常有。但DDA也存在一定的局限性先强后弱的采集方式易造成低丰度肽段信息丢失。全信息串联(MSE)指从液相色谱流出的所有肽段峰以及每个肽段的各个价态都会进行碎裂,并同时采集一级质谱数据。MSE能够给出更全面的信息,所有的离子信息都被记录,定量、定性更加准确。但由于肽段的丰度差异比较大,而图谱的信号动态范围有限,有些碎裂谱图不是特别理想。不同数据采集方式获得的数据需要不同的软件进行数据分析。DDA可采用PepFinder等,而MSE可采用UNIFI,Biopharmalynx等。质谱de novo测序是一种直接解释串联质谱数据的方法。每个串联质谱峰对应一对肽键的裂解,通过确定质谱中峰的离子类型可以得到这个峰对应肽段的前缀或后缀子序列的质量。理论上,可以根据串联质谱中信号强度高的碎片离子之间的质量差和母离子信号确定离子类型,得到相应的b离子、y离子或其他离子峰。然后通过计算相邻的同类型碎片离子之间的质量差获得肽段的全长序列。为了更准确地分析氨基酸序列,de novo测序对质谱一级、二级谱图的质量偏差、碎片离子的数量、丰度均有较高的要求。

发明内容

[0004] 本发明的目的在于提供一种基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,旨在解决现有的氨基酸序列不公开或公布的氨基酸序列通常与真实序列存在较大差异,测序中数据采集方式易造成低丰度肽段信息丢失,对质谱一级、二级谱图的质量偏差、碎片离子的数量、丰度均有较高要求的问题。
[0005] 本发明是这样实现的,一种基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,所述基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法利用质谱数据依赖性和全信息串联采集相结合;将质谱DDA采集获得的数据用Peaks软件进行从头测序后,再用EMS采集获得的数据进行氨基酸序列的验证。
[0006] 进一步,所述基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法包括以下步骤:
[0007] 步骤一,文献检索,在Pubmed输入需要解析单抗药物的名称、研发企业或结合抗原等特征词进行查找,找到与氨基酸序列研究相关的文献,获得该单抗IgG类型,CDR区、恒定区、可变区序列信息;
[0008] 步骤二,采用胰蛋白酶进行酶解;
[0009] 具体条件及过程为:
[0010] 1.取单抗原液100μL(10mg/mL),加稀释至样品浓度为5mg/mL。
[0011] 2.计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA(pH=7.5)的蛋白变性缓冲液稀释。
[0012] 3.加入10μL 1M二硫苏糖醇(DTT)到稀释后样品中,在37℃孵育1小时,使蛋白还原。
[0013] 4.加入12μL 2.9M碘乙酰胺(IAA)到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化。然后加入30μL 1M DTT到烷基化后样品中,终止反应。
[0014] 5.用10mL 100mM Tris(pH=7.5)酶解缓冲液,平衡NAP-5柱子,每次加入0.5mL,重复加入20次。
[0015] 6.加入500μL还原烷基化后的样品到平衡后的NAP-5柱子中,每个样品使用两个NAP-5柱子,弃去流出的馏分。
[0016] 7.对于每个NAP-5柱子,用800μL酶解缓冲液洗脱,并收集洗脱液。
[0017] 8.根据样品浓度,加入胰蛋白酶,蛋白:酶=1:20,37℃孵育1.5小时,使蛋白酶解成肽段。
[0018] 9.将酶解后样品进行冷冻干燥,然后用100μL水重新溶解,加入进样小瓶。
[0019] 再通过DDA数据采集获得高质量一级谱图和二级谱图。
[0020] 具体数据采集方法为1色谱条件:色谱柱:ACQUITY UPLC BEH130C18(1.7μm,2.1mm×150mm);流动相:A相为0.1%三氟乙酸水溶液,B相为0.09%三氟乙酸90%乙腈溶液;梯度洗脱;2-47分钟B相从1-40%,流速为0.3mL/min,柱温65℃。
[0021] 2质谱条件:采用正离子模式,喷雾电压为4.0kV;离子传输管温度为325℃;S-lens为60%。扫描模式为DDA,选择一级谱图中相对强度最高的3个离子去做二级碎裂;一级扫描为Orbitrap;扫描范围为m/z 200-2000;分辨率为60K;碰撞模式为CID;碰撞能量为35%;二级扫描为离子阱;扫描速度为Normal。
[0022] 将一级、二级谱图用Peaks软件进行de novo解析,获得初步的氨基酸序列结果。
[0023] 具体方法为采用SwissProt人数据库(20197条序列)和添加的该单抗蛋白氨基酸序列合并后进行蛋白质鉴定。鉴定采用Peaks Studio 8.0软件,设置参数如下:酶解方式为胰蛋白酶;质量容差一级为7ppm;二级为0.05Da;固定修饰包括:还原烷基化:半胱氨酸+57Da;可变修饰:化甲硫氨酸+16Da,脱酰胺化天冬酰胺、谷氨酰胺+0.98Da;结果质控方式:谱图水平1%假阳性率。差异比较采用PEAKS Q非标记定量算法,基于一级谱峰峰面积强度进行肽段定量并整合为蛋白质的差异信息,归一化对添加单抗蛋白强度计算后以此归一化,结果取倍数变化大于2倍结果进行差异蛋白选取。
[0024] 步骤三,采用多种蛋白酶进行酶解,包括胰蛋白酶、糜蛋白酶、Glu-C、Lys-C、以及为了鉴定到N-糖基化位点而进行的PNGase F酶串联胰蛋白酶切。糜蛋白酶具体条件与过程与胰蛋白酶基本一致,只是在酶反应时间上略有区别。糜蛋白酶,蛋白:酶=1:20,37℃孵育16-18小时。
[0025] Glu-C和Lys-C酶解,1-4步骤与胰蛋白酶酶解步骤一致。
[0026] 5.用10mL水,平衡NAP-5柱子,每次加入0.5mL,重复加入20次。
[0027] 6.加入还原烷基化后的样品到平衡后的NAP-5柱子中,弃去流出的馏分。
[0028] 7.用800μL水洗脱,并收集洗脱液。
[0029] 8.取200μL洗脱液,加入磷酸盐缓冲液,终浓度为100mM。根据样品浓度,加入Glu-C,蛋白:酶=1:20,37℃孵育16-18小时,使蛋白酶解成肽段。
[0030] 9.另取200μL洗脱液,加入酸氢铵缓冲液,终浓度为50mM。根据样品浓度,加入Lys-C,蛋白:酶=1:20,37℃孵育16-18小时,使蛋白酶解成肽段。
[0031] 10.将酶解后样品分别进行冷冻干燥,然后用50μL水重新溶解,加入进样小瓶,待后续检测。
[0032] PNGase F串联胰蛋白酶酶解,1-7步骤均与Glu-C和Lys-C酶解一致。
[0033] 8.在洗脱液中补加磷酸盐缓冲液。根据样品浓度,加入PNGase F,37℃孵育18小时;然后补加胰蛋白酶,蛋白:酶=20:1,37℃孵育8小时。
[0034] 9.将酶解后样品进行冷冻干燥,然后用100μl水重新溶解,加入进样小瓶,待后续检测。
[0035] MSE采集数据后可获得所有肽段峰以及每个肽段的各个价态完整和碎裂的信息,具体数据采集方法为1色谱条件:色谱柱:ACQUITY UPLC BEH130C18(1.7μm,2.1mm×150mm);流动相:A相为0.1%甲酸水溶液,B相为0.1%甲酸乙腈溶液;梯度洗脱;3-93分钟开始B相从0-35%,流速为0.2mL/min,柱温65℃。
[0036] 2质谱条件:ESI正离子模式,脱溶剂气体温度350℃,源温度105℃,脱溶剂气流速800L/h,毛细管电压3kV,锥孔电压25V,数据采集范围m/z 50~2000。使用MSE采集方法,即在碰撞池内等频率交替进行低碰撞能量(4V)和高碰撞能量(从25~40V的变化区间)切换,分别获得各个肽段母离子一级质谱数据(MS)及其二级碎片数据(MSE)。用嵌入式辅助持续注射100fmol/mL的Glu1-血纤维蛋白肽B(GFP)溶液(乙腈∶水=50∶50,含0.1%甲酸),流速10μL/min,用于获得Lockmass参比质量信号,以便对所测得的质量数进行实时校准。
[0037] 步骤四,在UNIFI数据处理软件中分析获得的各个蛋白酶MSE数据,输入初步的氨基酸序列,将数据处理后的序列覆盖率进行分析。再结合人工对匹配到肽段的碎片离子的强度和数量进行分析,实现氨基酸序列的验证。具体方法为分别选择胰蛋白酶、糜蛋白酶、Glu-C、Lys-C、以及PNGase F酶串联胰蛋白酶切数据来确定单抗一级序列,考虑半酶切及漏切1个位点肽段对序列覆盖率的贡献。根据数据分别选择酶解方式为胰蛋白酶、糜蛋白酶、Glu-C、Lys-C;半胱氨酸还原烷基化(+57.02Da)被选为固定修饰,N-去酰胺化(天冬氨酸和异天冬氨酸产物,+0.98Da;琥珀酰亚胺中间产物,-17.03Da)和甲硫氨酸-氧化(+15.99Da)被选为可变修饰,已知的存在于单抗中的寡糖也被选为可变修饰。母离子和碎片离子的质量偏差分别设为10ppm和20ppm。如果某肽段中至少有3个碎片离子与in-silico理论值相匹配,则认MSE二级质谱数据可确证该肽段的序列。
[0038] 进一步,采用DDA模式进行肽段的色谱分离和质谱数据的采集。采用PepFinder分析处理数据,用已有的氨基酸序列进行匹配,判断已有氨基酸序列是否正确;若错误率高则利用Peaks软件对DDA质谱数据进行从头测序的软件分析。
[0039] 进一步包括:采用多种蛋白酶分别酶解该单抗,包括胰蛋白酶、糜蛋白酶、Glu-C、ELys-C、以及PNGase F酶串联胰蛋白酶切;采用MS 模式采集肽段数据去验证de novo后的结果。
[0040] 本发明提供的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法,具体是充分利用质谱数据依赖性(DDA)和全信息串联(MSE)采集各自优势。将质谱DDA采集方法获E得的数据用Peaks软件进行从头测序(de novo)后,再用MS 采集获得的数据进行氨基酸序列的验证;单克隆抗体药物分子量巨大达到了150KDa,尽管来源于相同IgG类型的单抗有部分序列是相同的,但是决定其与抗原的特异性识别和结合的CDR区,不同单抗药物是截然不同的。由于分子特性不同,单抗的可变区氨基酸序列也可能存在差异。因此,研究单抗药物的氨基酸序列是药物研发最基本也是最重要的部分。目前有部分单抗的研发是基于已上市的单抗进行的优化和改造,无法得到已上市单抗的氨基酸序列无疑会给这类单抗药物的研发造成困难。CFDA明确要求,单抗的生物类似药必须要与原研药有着完全相同的氨基酸序列,因此对原研单抗氨基酸序列的解析是生物类似药研发中最基本的一步。单抗的氨基酸有时会发生修饰,将会影响药物的安全性与有效性。想要分析这些修饰以实现药物的质量分析首先要掌握单抗的氨基酸序列。然而,目前上市的很多单抗药物均存在着氨基酸序列不公开,或公开的序列存在错误的问题。采用本发明能够高效地实现对其氨基酸序列的测定,为单抗药品的研发、生物类似药研究和质量控制提供重要手段,实现了单抗药物氨基酸序列的从头测序(de novo),打破壁垒。
[0041] 通过质谱对完整蛋白进行分子量检测(图3)。如果分子量与预测的不同则可以直观地发现氨基酸序列不正确。并且肽段鉴定中氨基酸序列覆盖率未达到100%,因此该检测是氨基酸序列必不可少的环节。从去卷积的结果图4可以看到,峰1检测分子量为150179.97Da,理论分子量为150179.56Da,峰2检测分子量为150342.52Da,理论分子量为
150341.70Da。可以看出峰1,2检测与理论分子量的质量偏差均小于1Da。峰3和峰4的检测分子量与理论分子量的差异很小,均在4Da以内。可以看出氨基酸序列应该是正确的。单抗由两个轻链和两个重链组成,在亚基水平检测可以进一步验证轻链和重链各自的氨基酸序列是否正确(图5)。重链去卷积的结果图6可以看到,峰1检测分子量为50967.25Da,理论分子量为50968.35Da,质量偏差仅约1Da。峰2和3质量偏差分别为4.56Da和6.19Da。质量偏差小说明重链的氨基酸序列是正确的。轻链去卷积后的结果图7可以看到,检测分子量为
24127.96Da,理论分子量为24127.47Da,质量偏差仅为0.5Da。说明轻链的氨基酸序列是正确的。
附图说明
[0042] 图1是本发明实施例提供的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法流程图
[0043] 图2是本发明实施例提供的肽段VTITADESSTTAYMELSSLR的二级谱图解析示意图。
[0044] 图3是本发明实施例提供的完整蛋白质谱图。
[0045] 图4是本发明实施例提供的去卷积后完整蛋白平均分子量解析图;
[0046] 图中:峰1-4分别为G0F糖基化(2),C末端赖氨酸缺失(2),N末端谷氨酰胺焦谷氨酸化(2);G0F糖基化(1),G1F糖基化(1),C末端赖氨酸缺失(2),N末端谷氨酰胺焦谷氨酸化(2);G1F糖基化(2),C末端赖氨酸缺失(2),N末端谷氨酰胺焦谷氨酸化(2);G1F糖基化(1),G2F糖基化(1),C末端赖氨酸缺失(2),N末端谷氨酰胺焦谷氨酸化(2);“()”代表修饰位点的个数。
[0047] 图5是本发明实施例提供的轻链和重链各自的氨基酸序列示意图。
[0048] 图6是本发明实施例提供的去卷积后重链平均分子量解析图;
[0049] 图中:峰1-3分别为G0F糖基化,C末端赖氨酸缺失,N末端谷氨酰胺焦谷氨酸化;G1F糖基化,C末端赖氨酸缺失,N末端谷氨酰胺焦谷氨酸化;G2F糖基化,C末端赖氨酸缺失,N末端谷氨酰胺焦谷氨酸化。
[0050] 图7是本发明实施例提供的去卷积后轻链平均分子量解析图。

具体实施方式

[0051] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0052] 下面结合附图对本发明的应用原理作详细的描述。
[0053] 如图1所示,本发明实施例的基于质谱技术实现单克隆抗体药物氨基酸序列的测序方法包括以下步骤:
[0054] S101:通过文献检索获得该单抗IgG类型,CDR区、恒定区、可变区序列等信息;
[0055] S102:采用胰蛋白酶进行酶解,再通过DDA数据采集获得高质量一级谱图和二级谱图,将一级、二级谱图用Peaks软件进行de novo解析,获得初步的氨基酸序列结果;
[0056] S103:采用多种蛋白酶进行酶解,MSE采集数据后可获得所有肽段峰以及每个肽段的各个价态完整和碎裂的信息;
[0057] S104:将获得的更加全面的质谱数据与初步的氨基酸序列进行匹配,实现氨基酸序列的验证。
[0058] 酶解具体条件及过程为:
[0059] 1.取单抗原液100μL(10mg/mL),加水稀释至样品浓度为5mg/mL。
[0060] 2.计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA(pH=7.5)的蛋白变性缓冲液稀释。
[0061] 3.加入10μL 1M二硫苏糖醇(DTT)到稀释后样品中,在37℃孵育1小时,使蛋白还原。
[0062] 4.加入12μL 2.9M碘乙酰胺(IAA)到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化。然后加入30μL 1M DTT到烷基化后样品中,终止反应。
[0063] 5.用10mL 100mM Tris(pH=7.5)酶解缓冲液,平衡NAP-5柱子,每次加入0.5mL,重复加入20次。
[0064] 6.加入500μL还原烷基化后的样品到平衡后的NAP-5柱子中,每个样品使用两个NAP-5柱子,弃去流出的馏分。
[0065] 7.对于每个NAP-5柱子,用800μL酶解缓冲液洗脱,并收集洗脱液。
[0066] 8.根据样品浓度,加入胰蛋白酶,蛋白:酶=1:20,37℃孵育1.5小时,使蛋白酶解成肽段。
[0067] 9.将酶解后样品进行冷冻干燥,然后用100μL水重新溶解,加入进样小瓶。
[0068] 再通过DDA数据采集获得高质量一级谱图和二级谱图。
[0069] 具体数据采集方法为:
[0070] 1色谱条件:色谱柱:ACQUITY UPLC BEH130C18(1.7μm,2.1mm×150mm);流动相:A相为0.1%三氟乙酸水溶液,B相为0.09%三氟乙酸90%乙腈溶液;梯度洗脱;2-47分钟B相从1-40%,流速为0.3mL/min,柱温65℃。
[0071] 2质谱条件:采用正离子模式,喷雾电压为4.0kV;离子传输管温度为325℃;S-lens为60%。扫描模式为DDA,选择一级谱图中相对强度最高的3个离子去做二级碎裂;一级扫描为Orbitrap;扫描范围为m/z 200-2000;分辨率为60K;碰撞模式为CID;碰撞能量为35%;二级扫描为离子阱;扫描速度为Normal。
[0072] 将一级、二级谱图用Peaks软件进行de novo解析,获得初步的氨基酸序列结果。
[0073] 具体方法为采用SwissProt人数据库(20197条序列)和添加的该单抗蛋白氨基酸序列合并后进行蛋白质鉴定。鉴定采用Peaks Studio 8.0软件,设置参数如下:酶解方式为胰蛋白酶;质量容差一级为7ppm;二级为0.05Da;固定修饰包括:还原烷基化:半胱氨酸+57;可变修饰:氧化甲硫氨酸+16,脱酰胺化天冬酰胺、谷氨酰胺+0.98;结果质控方式:谱图水平
1%假阳性率。差异比较采用PEAKS Q非标记定量算法,基于一级谱峰峰面积强度进行肽段定量并整合为蛋白质的差异信息,归一化对添加单抗蛋白强度计算后以此归一化,结果取倍数变化大于2倍结果进行差异蛋白选取。
[0074] 步骤三,采用多种蛋白酶进行酶解,包括胰蛋白酶、糜蛋白酶、Glu-C、Lys-C、以及为了鉴定到N-糖基化位点而进行的PNGase F酶串联胰蛋白酶切。糜蛋白酶具体条件与过程与胰蛋白酶基本一致,只是在酶反应时间上略有区别。糜蛋白酶,蛋白:酶=1:20,37℃孵育16-18小时。
[0075] Glu-C和Lys-C酶解包括:
[0076] 1.取单抗原液100μL(10mg/mL),加水稀释至样品浓度为5mg/mL。
[0077] 2.计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA(pH=7.5)的蛋白变性缓冲液稀释。
[0078] 3.加入10μL 1M二硫苏糖醇(DTT)到稀释后样品中,在37℃孵育1小时,使蛋白还原。
[0079] 4.加入12μL 2.9M碘乙酰胺(IAA)到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化。然后加入30μL 1M DTT到烷基化后样品中,终止反应。
[0080] 5.用10mL水,平衡NAP-5柱子,每次加入0.5mL,重复加入20次。
[0081] 6.加入还原烷基化后的样品到平衡后的NAP-5柱子中,弃去流出的馏分。
[0082] 7.用800μL水洗脱,并收集洗脱液。
[0083] 8.取200μL洗脱液,加入磷酸盐缓冲液,终浓度为100mM。根据样品浓度,加入Glu-C,蛋白:酶=1:20,37℃孵育16-18小时,使蛋白酶解成肽段。
[0084] 9.另取200μL洗脱液,加入碳酸氢铵缓冲液,终浓度为50mM。根据样品浓度,加入Lys-C,蛋白:酶=1:20,37℃孵育16-18小时,使蛋白酶解成肽段。
[0085] 10.将酶解后样品分别进行冷冻干燥,然后用50μL水重新溶解,加入进样小瓶,待后续检测。
[0086] PNGase F串联胰蛋白酶酶解包括:
[0087] 1.取单抗原液100μL(10mg/mL),加水稀释至样品浓度为5mg/mL。
[0088] 2.计算稀释体积,使得样品终体积为1ml,终浓度为1mg/mL,用7M盐酸胍、250mM Tris、1mM EDTA(pH=7.5)的蛋白变性缓冲液稀释。
[0089] 3.加入10μL 1M二硫苏糖醇(DTT)到稀释后样品中,在37℃孵育1小时,使蛋白还原。
[0090] 4.加入12μL 2.9M碘乙酰胺(IAA)到还原后的样品中,在室温下暗室反应40分钟,使蛋白烷基化。然后加入30μL 1M DTT到烷基化后样品中,终止反应。
[0091] 5.用10mL水,平衡NAP-5柱子,每次加入0.5mL,重复加入20次。
[0092] 6.加入还原烷基化后的样品到平衡后的NAP-5柱子中,弃去流出的馏分。
[0093] 7.用800μL水洗脱,并收集洗脱液。
[0094] 8.在洗脱液中补加磷酸盐缓冲液。根据样品浓度,加入PNGase F,37℃孵育18小时;然后补加胰蛋白酶,蛋白:酶=20:1,37℃孵育8小时。
[0095] 9.将酶解后样品进行冷冻干燥,然后用100μl水重新溶解,加入进样小瓶,待后续检测。
[0096] MSE采集数据后可获得所有肽段峰以及每个肽段的各个价态完整和碎裂的信息,具体数据采集方法为:
[0097] 1色谱条件:色谱柱:ACQUITY UPLC BEH130C18(1.7μm,2.1mm×150mm);流动相:A相为0.1%甲酸水溶液,B相为0.1%甲酸乙腈溶液;梯度洗脱;3-93分钟开始B相从0-35%,流速为0.2mL/min,柱温65℃。
[0098] 2质谱条件:ESI正离子模式,脱溶剂气体温度350℃,源温度105℃,脱溶剂气流速800L/h,毛细管电压3kV,锥孔电压25V,数据采集范围m/z 50~2000。使用MSE采集方法,即在碰撞池内等频率交替进行低碰撞能量(4V)和高碰撞能量(从25~40V的变化区间)切换,分别获得各个肽段母离子一级质谱数据(MS)及其二级碎片数据(MSE)。用嵌入式辅助泵持续注射100fmol/mL的Glu1-血纤维蛋白肽B(GFP)溶液(乙腈∶水=50∶50,含0.1%甲酸),流速10μL/min,用于获得Lockmass参比质量信号,以便对所测得的质量数进行实时校准。
[0099] 下面结合具体实施例对本发明的应用原理作进一步的描述。
[0100] 1文献检索与整理
[0101] 通过文献检索得到了三篇包含有该单抗氨基酸序列相关信息的文献。分别是:1Characterization of a recombinant monoclonal antibody by mass spectrometry combined with liquid chromatography.Journal of Chromatography B,752(2001)247-
261;2Humanization of a mouse monoclonal antibody that blocks the epidermal growth factor receptor:recovery of antagonistic.Immunotechnology 3(1997)71-
81;3Nimotuzumab,an Antitumor Antibody that Targets the Epidermal Growth Receptor,Blocks Ligand Binding while Permitting  the Active Receptor Conformation.Cancer Research,69(2009)5851-5857。
[0102] 通过文献整理获得了该单抗的大致的氨基酸序列。如下所示:
[0103] 轻链
[0104] DIQMTQSPSSLSASVGDRVTITCRSSQNIVHSNGNTYLDWYQQTPGKAPKLLIYKVSNRFSGVPSRFSGSGSGTDFTFTISSLQPEDIATYYCFQYSHVPWTFGQGTKLQITRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC[0105] 重链
[0106] QVQLQQSGAEVKKPGSSVKVSCKASGYTFTNYYIYWVRQAPGQGLEWIGGINPTSGGSNFNEKFKTRVTITADESTSTAYMELSSLRSEDTAFYFCTRQGLWFDSDGRGFDFWGQGTTVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK[0107] 2DDA模式采集数据和de novo测序
[0108] 将该单抗进行了还原烷基化和胰酶酶解,采用DDA模式(仪器:UPLC-Obitrap Elite)进行肽段的色谱分离和质谱数据的采集。采用PepFinder分析处理数据,用已有的氨基酸序列进行匹配。发现鉴定覆盖率轻链为90.0%,重链为86.1%。而且对于单抗发挥结合活性至关重要的CDR区的19个氨基酸序列未鉴定到。利用Peaks软件对DDA质谱数据进行从头测序(de novo)的软件分析。Peaks软件从人的蛋白数据库、Ig G的类型、文献中获得的氨基酸序列、DDA采集的一级二级谱图等方面进行解析和匹配获得了该单抗药物的氨基酸序列。并提示可能发生的氨基酸替换、增加或缺失。主要是轻链ETVAAPSVFIFPPSDEQLK这条肽链上的第一个氨基酸E是多余的,另外在重链CDR区上也有几个氨基酸可能发生了突变。获得了该单抗可能的氨基酸序列。
[0109] 3MSE模式采集数据和氨基酸序列验证
[0110] 采用多种蛋白酶分别酶解该单抗,包括胰蛋白酶、糜蛋白酶、Glu-C、Lys-C、以及为了鉴定到N-糖基化位点而进行的PNGase F酶串联胰蛋白酶切。采用MSE模式(仪器:UPLC-Synapt G2-s)采集肽段数据去验证de novo后的结果,结果显示鉴定覆盖率大大提高,由原来的轻链90.0%提高到了99.09%,重链86.1%提高到了97.57%。CDR区的序列均被鉴定到。表1显示了多种蛋白酶酶解产生肽段经MSE模式数据采集鉴定的氨基酸覆盖率。
[0111] 表1
[0112]
[0113] 此外,借助了MSE采集数据进一步验证肽段氨基酸序列时,一个氨基酸的交换被发现。通过DDA数据采集de novo分析获得重链上的一条肽段为VTITADESTSTAYMELSSLR(加粗部分代表错误的氨基酸序列)。借助MSE数据采集获得的更为全面的二级碎裂信息。找到了其中至关重要的y11这个碎片离子,证明氨基酸的顺序应该为ST(如图2所示)。
[0114] 通过以上方法最终获得的该单抗的氨基酸序列如下所示
[0115] 轻链
[0116] DIQMTQSPSSLSASVGDRVTITCRSSQNIVHSNGNTYLDWYQQTPGKAPKLLIYKVSNRFSGVPSRFSGSGSGTDFTFTISSLQPEDIATYYCFQYSHVPWTFGQGTKLQITRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC[0117] 重链
[0118] QVQLQQSGAEVKKPGSSVKVSCKASGYTFTNYYIYWVRQAPGQGLEWIGGINPTSGGSNFNEKFKTRVTITADESSTTAYMELSSLRSEDTAFYFCTRQGLWFDSDGRGFDFWGQGTTVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK[0119] 4完整蛋白水平的验证
[0120] 通过质谱对完整蛋白进行分子量检测(图3)。如果分子量与预测的不同则可以直观地发现氨基酸序列不正确。并且肽段鉴定中氨基酸序列覆盖率未达到100%,因此该检测是氨基酸序列必不可少的环节。从去卷积的结果图4可以看到,峰1检测分子量为150179.97Da,理论分子量为150179.56Da,峰2检测分子量为150342.52Da,理论分子量为
150341.70Da。可以看出峰1,2检测与理论分子量的质量偏差均小于1Da。峰3和峰4的检测分子量与理论分子量的差异均在4Da以内。由于峰3和峰4信号强度远远低于峰1和峰2,因此它们检测与理论分子量的偏差较峰1和峰2大,但均在可接收的范围内。可以看出氨基酸序列应该是正确的。
[0121] 5还原轻/重链水平的验证
[0122] 单抗由两个轻链和两个重链组成,在亚基水平检测可以进一步验证轻链和重链各自的氨基酸序列是否正确(图5)。重链去卷积的结果图6可以看到,峰1检测分子量为50967.25Da,理论分子量为50968.35Da,质量偏差仅约1Da。峰2和峰3分别为4.56Da和
6.19Da。质量偏差小说明重链的氨基酸序列是正确的。轻链去卷积后的结果图7可以看到,检测分子量为24127.96Da,理论分子量为24127.47Da,质量偏差仅为0.5Da。说明轻链的氨基酸序列是正确的。
[0123] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
相关专利内容
标题 发布/更新时间 阅读量
离子阱质谱仪 2020-05-14 182
离子阱 2020-05-11 180
虚拟离子阱 2020-05-12 471
在离子阱中分离离子 2020-05-15 345
二维四极离子阱 2020-05-13 693
高产出的四极离子阱 2020-05-16 760
离子阱和在离子阱中解离离子的方法 2020-05-15 678
二维四极离子阱 2020-05-14 621
直流离子阱 2020-05-12 36
线性离子阱结构 2020-05-14 371
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈