包含混合电荷肽的融合产物和生物缀合物

申请号 CN201980079144.1 申请日 2019-10-10 公开(公告)号 CN113195514A 公开(公告)日 2021-07-30
申请人 华盛顿大学; 发明人 C·曹; S·罗中; T·科里根; 江绍毅; E·刘; P·麦克马伦;
摘要 公开了带电荷的多肽、其缀合物和包含这样的多肽的融合蛋白。在融合蛋白中包含这样的多肽增强蛋白的特性,如 稳定性 和循环 半衰期 ,其与单独的活性蛋白相比,产生更好的 治疗 效果。因此,本 发明 的融合蛋白或缀合物可以用于开发蛋白或肽药物,治疗或 预防 疾病 、障碍或病症,或改善受试者的健康或幸福感。
权利要求

1.一种多肽,其包含:
a)多个带负电荷的基酸;
b)多个带正电荷的氨基酸;和
c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;并且
其中所述带正电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约
1:2。
2.权利要求1所述的多肽,其中所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。
3.权利要求1或权利要求2所述的多肽,其中所述多个带正电荷的氨基酸独立地选自赖氨酸、组氨酸、精氨酸及其衍生物。
4.权利要求1‑3中任一项所述的多肽,其中所述带正电荷的氨基酸和带负电荷的氨基酸占带电荷的结构域中存在的氨基酸的总数目的约20%至约95%、约30%至约95%、约
40%至约95%、约50%至约95%、约40%至约90%、约50%至约90%、约40%至约80%或约
50%至约70%。
5.权利要求1‑4中任一项所述的多肽,其中所述多肽包含约6至约1000个氨基酸、约20至约1000个氨基酸、约30至约1000个氨基酸、约50至约1000个氨基酸、约80至约1000个氨基酸或约80至约600个氨基酸。
6.权利要求1‑5中任一项所述的多肽,其中所述带正电荷的氨基酸与带负电荷的氨基酸的比率为约1:0.7至约1:1.4、约1:0.8至约1:1.25或约1:0.9至约1:1.1。
7.权利要求1‑6中任一项所述的多肽,其中所述多肽包含至少两个包含与带负电荷的氨基酸邻近的带正电荷的氨基酸的配对
8.权利要求1‑6中任一项所述的多肽,其中所述多肽包含无规序列。
9.权利要求1‑8中任一项所述的多肽,其中所述多肽是基本上电子中性的。
10.权利要求1‑9中任一项所述的多肽,其中所述多肽基本上由以下组成:
a)多个带负电荷的氨基酸;
b)多个带正电荷的氨基酸;和
c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物。
11.权利要求1‑10中任一项所述的多肽,其中所述多肽包含多个赖氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。
12.权利要求1‑10中任一项所述的多肽,其中所述多肽包含多个组氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。
13.权利要求11或权利要求12所述的多肽,其中所述多个另外的氨基酸选自丝氨酸、天冬酰胺、甘氨酸和脯氨酸。
14.权利要求11或权利要求12所述的多肽,其中所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
15.权利要求11或权利要求12所述的多肽,其中所述多个另外的氨基酸选自丝氨酸和甘氨酸。
16.权利要求11或权利要求12所述的多肽,其中所述多个另外的氨基酸是脯氨酸。
17.权利要求11或权利要求12所述的多肽,其中所述多个另外的氨基酸是甘氨酸。
18.权利要求11或权利要求12所述的多肽,其中所述多个另外的氨基酸是丝氨酸。
19.权利要求1‑10中任一项所述的多肽,其中所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
20.权利要求1‑10中任一项所述的多肽,其中所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自甘氨酸和脯氨酸。
21.前述权利要求中任一项所述的多肽,其中所述多肽在约7.4的pH下是基本上电子中性的。
22.一种生物缀合物,其包含共价偶联到生物分子的至少一种权利要求1‑21所述的多肽。
23.权利要求22所述的生物缀合物,其中所述生物分子是多肽、合成聚合物、核酸、糖蛋白、蛋白聚糖、荧光染料、小分子、脂肪酸或脂质。
24.一种融合蛋白,其包含连接到一个或多个带电荷的结构域的一个或多个功能性结构域,其中所述一个或多个带电荷的结构域包含:
a)多个带负电荷的氨基酸;
b)多个带正电荷的氨基酸;和
c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;并且
其中所述带正电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约
1:2。
25.权利要求24所述的融合蛋白,其中所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。
26.权利要求24或权利要求25所述的融合蛋白,其中所述多个带正电荷的氨基酸独立地选自赖氨酸、组氨酸、精氨酸及其衍生物。
27.权利要求24‑26中任一项所述的融合蛋白,其中所述带正电荷的氨基酸和带负电荷的氨基酸占带电荷的结构域中存在的氨基酸的总数目的约20%至约95%、约30%至约
95%、约40%至约95%、约50%至约95%、约40%至约90%、约50%至约90%、约40%至约
80%或约50%至约70%。
28.权利要求24‑27中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域包含约6至约1000个氨基酸、约20至约1000个氨基酸、约30至约1000个氨基酸、约50至约1000个氨基酸、约80至约1000个氨基酸或约80至约600个氨基酸。
29.权利要求24‑28中任一项所述的融合蛋白,其中一个或多个带电荷的结构域中的带正电荷的氨基酸与带负电荷的氨基酸的比率为约1:0.7至约1:1.4、约1:0.8至约1:1.25或约1:0.9至约1:1.1。
30.权利要求24‑29中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域包含至少两个与带负电荷的氨基酸邻近的带正电荷的氨基酸的配对。
31.权利要求24‑30中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域包含无规序列。
32.权利要求24‑31中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域是基本上电子中性的。
33.权利要求24‑32中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域基本上由以下组成:
a)多个带负电荷的氨基酸或潜在的带负电荷的氨基酸;
b)多个带正电荷的氨基酸或潜在的带正电荷的氨基酸;和
c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物。
34.权利要求24‑33中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域包含多个赖氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。
35.权利要求24‑34中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域包含多个组氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。
36.权利要求34或权利要求35所述的融合蛋白,其中所述多个另外的氨基酸选自丝氨酸、天冬酰胺、甘氨酸和脯氨酸。
37.权利要求34或权利要求35所述的融合蛋白,其中所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
38.权利要求34或权利要求35所述的融合蛋白,其中所述多个另外的氨基酸选自丝氨酸和甘氨酸。
39.权利要求34或权利要求35所述的融合蛋白,其中所述多个另外的氨基酸是脯氨酸。
40.权利要求34或权利要求35所述的融合蛋白,其中所述多个另外的氨基酸是甘氨酸。
41.权利要求34或权利要求35所述的融合蛋白,其中所述多个另外的氨基酸是丝氨酸。
42.权利要求24‑33中任一项所述的融合蛋白,其中所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
43.权利要求24‑33中任一项所述的融合蛋白,其中所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自甘氨酸和脯氨酸。
44.权利要求24‑43中任一项所述的融合蛋白,其中所述一个或多个带电荷的结构域在约7.4的pH下是基本上电子中性的。
45.一种核酸,其包含编码权利要求24‑44中任一项所述的融合蛋白的序列。
46.一种表达载体,其包含权利要求45所述的核酸。
47.一种细胞,其包含权利要求45所述的核酸或权利要求46所述的表达载体。
48.权利要求47所述的细胞,其中所述细胞是原核细胞或真核细胞。
49.一种制备融合蛋白的方法,其包括表达权利要求46所述的表达载体。
50.权利要求47所述的方法,其还包括分离所述多肽。
51.权利要求50所述的方法,其中分离所述多肽包括选自以下的方法:蛋白沉淀、尺寸排阻色谱、亲和色谱、基于静电性质的分离、基于亲或疏水性质的分离、基于无基质电泳技术的分离或其组合。

说明书全文

包含混合电荷肽的融合产物和生物缀合物

[0001] 相关申请的交叉引用
[0002] 本申请要求于2018年10月10日提交的第62/743,663号美国专利申请的权益,其全部内容明确地通过引用并入本文。
[0003] 关于序列表声明
[0004] 与本申请相关联的序列表以文本格式代替纸质副本提供,并且在此以引用方式并入说明书中。包含序列表的文本文件的名称为70421_Sequence_final_2019‑10‑10。文本文
件为60.1KB;创建于2019年10月10日;并在提交说明书时通过EFS‑Web一起提交。
[0005] 政府许可权利的声明
[0006] 本发明是在由美国国防威胁降低局(Defense Threat Reduction Agency,DTRA)授予的资助号为HDTRA1‑13‑1‑0044P00011的政府支持下完成的。政府对本发明享有某些权
利。
[0007] 背景
[0008] 已知肽和蛋白对许多疾病和综合征具有巨大的治疗。药物生物技术领域中的进步使市场上基于蛋白和肽的治疗剂的价值和数量增加。目前,已经批准了超过100种蛋白
作为治疗剂,还有更多的蛋白正在经历临床试验。尽管生物制药市场目前和未来都在增长,
但是仍然存在与实现有前景的治疗性蛋白相关的重大挑战。这些挑战中的许多挑战极大地
降低了治疗剂的功效,并且这些限制通常是通过治疗剂及其制备所固有的特性赋予的。这
些固有特性可以导致构象变化、降解、聚集、沉淀和吸附到表面上。另外,这些治疗性蛋白的
特征通常在于短的半衰期和免疫原性应答,特别是考虑到许多这些重组蛋白来源于非人类
生物体或在非人类宿主中表达。所产生的不良药代动力学已经是生物药物开发面临的关键
问题。
[0009] 当前,最被接受的方法之一是使用聚乙二醇(PEG)修饰治疗性蛋白,聚乙二醇(PEG)是一种无毒且推定为非免疫原性的聚合物。该过程通常称为PEG化,已知其改变生物
分子的物理和化学特性,包括构象、静电结合和疏性,并且可以使药物的药代动力学特性
改善。PEG化的优点包括改善药物溶解度和降低免疫原性,增加给药后的药物稳定性和循环
时间,以及减少蛋白水解和肾脏排泄,所有这些均能降低给药频率,使得患者依从性增加和
治疗效果更好。PEG化技术已应用于多种治疗性蛋白,以提供已获得美国FDA批准的新药。然
而,由于诱导的和预先存在的抗PEG抗体,对使用PEG化的生物药物的担心仍然存在。PEG化
蛋白已显示在抗PEG抗体的存在下从一些健康个体引发免疫应答的能力。注射抗原性物质
可以潜在地引起细胞因子级联反应或其他潜在的严重免疫应答,因此应避免其作为药物制
剂的组分。之前证明了使用两性离子聚合物(例如聚(羧基甜菜)(pCB))作为两亲性PEG的
替代物赋予超亲水、超低生物结垢和蛋白稳定的特性。pCB与蛋白的化学缀合增加蛋白的稳
定性,而不影响其活性。然而,由于pCB的合成来源,因此pCB可能遭遇与PEG相同的缺点。最
后,已证明将由重复的赖酸(K)和谷氨酸(E)残基组成的结构域掺入融合多肽中可以改善
产生的多肽的某些特性;然而,很难控制这种多肽的大小和形状。
[0010] 存在对具有更好的药代动力学和其他有利特性的药物,例如蛋白的需求,所述有利特性包括改善的溶解度、降低的给药频率、延长的循环寿命、提高的稳定性以及增强的对
蛋白水解降解的保护。
附图说明
[0011] 当结合附图时,本发明的前述方面和许多附带的优点将变得更加容易理解,因为通过参考下面的详细描述,本发明的前述方面和许多附带的优点将变得更好理解。
[0012] 图1是使用IMAC柱纯化后的MBP‑EKX‑GCSF变体的免疫印迹的照片。将蛋白转移到聚偏二氟乙烯(PVDF)膜上,并使用单克隆抗GCSF抗体(Invitrogen)进行探测。泳道2到9的
条带表示MBP‑EKX‑GCSF的存在。
[0013] 图2A是在含有1μM所显示的EKX‑GCSF或GCSF的10mM磷酸(pH8)中获得的EKX‑GCSF变体的圆二色谱(CD)曲线。
[0014] 图2B显示了从EKX‑GCSF变体中扣除GCSF CD曲线以获得EKX组分的CD曲线。
[0015] 图3是EKX‑GCSF和单独的GCSF的血清浓度曲线图。通过眼眶后注射将EKX‑GCSF或GCSF(20nmol/kg)注射到C57BL/6小鼠(6周龄)中。抽血并使用ELISA测定法分析EKX‑GCSF或
GCSF。
[0016] 图4A是EKX‑GCSF和单独的GCSF的归一化血清浓度曲线图。通过尾静脉注射将EKX‑GCSF或GCSF(10nmol/kg)注射到Sprague‑Dawley大鼠中。抽血并使用ELISA测定法分析EKX‑
GCSF或GCSF。
[0017] 图4B是在所显示的时间点注射10nmol/kg EKP‑GCSF、EK‑GCSF和GCSF的动物的白细胞计数的图。白细胞计数由Medix LeukoTic Bluplus WBC测试试剂盒确定。
[0018] 图5是从HEK293F细胞表达和分泌的EKP‑hIFNα2a、EK‑hIFNα2a和单独的hIFNα2a的SDS‑PAGE凝胶的照片。使用HA纯化试剂盒(ThermoFisher)进行纯化。
[0019] 图6是EKP‑hIFNα2a(EKP‑hIFNa2a)、EK‑hIFNα2a(EK‑hIFNa2a)和单独的hIFNα2a(hIFNa2a)的血清浓度曲线图。通过眼眶后方法将EKP‑hIFNα2a、EK‑hIFNα2a和单独的hIFNα
2a(50nmol/kg)注射到C57BL/6小鼠(6周龄)中。在所显示的时间点抽血,并使用ELISA法分
析EKP‑hIFNa2a和hIFNa2a。虚线表示浓度低于检测限(~40ng/mL)。
[0020] 图7是纯化的eGFP和EKX‑eGFP变体的SDS‑PAGE凝胶的照片,具有如所显示的梯状条带和泳道。
[0021] 概述
[0022] 提供本概述以简化形式介绍一些构思,这些构思将在下面的详述中进一步描述。该概述不旨在确定所要求保护的主题的关键特征,也不旨在用于帮助确定所要求保护的主
题的范围。
[0023] 一方面,本文提供了一种多肽,其包含:
[0024] a)多个带负电荷的氨基酸;
[0025] b)多个带正电荷的氨基酸;和
[0026] c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;并且
[0027] 其中所述带正电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约1:2。
[0028] 在一些实施方案中,所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。在一些实施方案中,所述多个带正电荷的氨基酸独立地选自赖氨酸、组氨酸、精
氨酸及其衍生物。
[0029] 在一些实施方案中,所述带正电荷的氨基酸和带负电荷的氨基酸占带电荷的结构域中存在的氨基酸的总数目的约20%至约95%、约30%至约95%、约40%至约95%、约50%
至约95%、约40%至约90%、约50%至约90%、约40%至约80%或约50%至约70%。
[0030] 在一些实施方案中,所述多肽包含约6至约1000个氨基酸、约20至约1000个氨基酸、约30至约1000个氨基酸、约50至约1000个氨基酸、约80至约1000个氨基酸或约80至约
600个氨基酸。
[0031] 在一些实施方案中,所述带正电荷的氨基酸与带负电荷的氨基酸的比率为约1:0.7至约1:1.4、约1:0.8至约1:1.25或约1:0.9至约1:1.1。
[0032] 在一些实施方案中,所述多肽包含至少两个包含与带负电荷的氨基酸邻近的带正电荷的氨基酸的配对。在一些实施方案中,所述多肽包含无规序列。在一些实施方案中,所
述多肽是基本上电子中性的。
[0033] 在一些实施方案中,所述多肽包含多个赖氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。在一些实施方案中,所述多肽包含多个组氨
酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。
[0034] 在一些实施方案中,所述多个另外的氨基酸选自丝氨酸、天冬酰胺、甘氨酸和脯氨酸。在一些实施方案中,所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
[0035] 在一些实施方案中,所述多个另外的氨基酸选自丝氨酸和甘氨酸。在一些实施方案中,所述多个另外的氨基酸是脯氨酸。在一些实施方案中,所述多个另外的氨基酸是甘氨
酸。在一些实施方案中,所述多个另外的氨基酸是丝氨酸。
[0036] 在一些实施方案中,所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,并且所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
[0037] 在一些实施方案中,所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,并且所述多个另外的氨基酸选自甘氨酸和脯氨酸。
[0038] 在一些实施方案中,所述多肽在约7.4的pH下是基本上电子中性的。
[0039] 另一方面,本文提供了一种生物缀合物,其包含共价偶联到生物分子的至少一种本文公开的多肽。
[0040] 另一方面,本文提供了一种稳定生物分子的方法,其包括将一种或多种本文公开的多肽缀合到生物分子。
[0041] 在一些实施方案中,所述生物分子是多肽、合成聚合物、核酸、糖蛋白、蛋白聚糖、荧光染料、小分子、脂肪酸或脂质。
[0042] 另一方面,本文提供了一种融合蛋白,其包含连接到一个或多个带电荷的结构域的一个或多个功能性结构域,其中所述一个或多个带电荷的结构域包含本文公开的多肽。
[0043] 另一方面,本文提供了一种核酸,其包含编码本文公开的融合蛋白的序列。
[0044] 另一方面,本文提供了一种表达载体,其包含本文公开的核酸。
[0045] 另一方面,本文提供了一种细胞,其包含本文公开的核酸或表达载体。在一些实施方案中,所述细胞是原核细胞或真核细胞。
[0046] 另一方面,本文提供了一种制备融合蛋白的方法,其包括表达本文公开的表达载体。
[0047] 在一些实施方案中,所述方法还包括分离多肽。在一些实施方案中,分离多肽包括选自以下的方法:蛋白沉淀、尺寸排阻色谱、亲和色谱、基于静电性质的分离、基于亲水或疏
水性质的分离、基于无基质电泳技术的分离或其组合。
[0048] 详述
[0049] 本文公开了多肽、其生物缀合物和包含这样的多肽的融合蛋白,其中所述多肽包含多个独立地选自带负电荷的氨基酸的氨基酸,多个独立地选自带正电荷的氨基酸的氨基
酸,和多个独立地选自中性亲水氨基酸和脯氨酸的氨基酸。与母体未修饰分子相比,生物分
子与多肽的缀合物和包含所述多肽的融合蛋白可以具有降低的免疫原性、增加的半衰期、
提高的产率和/或改善的特异性靶向。
[0050] 多肽
[0051] 一方面,本文提供了一种多肽,其包含:
[0052] a)多个带负电荷的氨基酸;
[0053] b)多个带正电荷的氨基酸;和
[0054] c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;以及
[0055] 其中所述带正电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约1:2。
[0056] 如本文所用,术语“氨基酸”涵盖单个氨基酸和掺入多肽链的氨基酸残基。应当理解,当在多肽的上下文中提到术语“氨基酸”时,该术语是指通过肽键与一个或两个相邻氨
基酸连接的氨基酸。如本文所用,术语“约”是指所述值的±5%。
[0057] 带负电荷的氨基酸包括包含可以带负电荷的基团(例如羧酸基团)以及其衍生物和潜在的带负电荷的基团的氨基酸。如本文所用,“潜在的带负电荷的基团”是官能团,例如
酯,其当暴露于适当的环境刺激时可以转变成带负电荷的基团,例如羧酸。带正电荷的氨基
酸包括包含可以带正电荷的基团(例如氨基基团)以及其衍生物和潜在的带正电荷的基团
的氨基酸。如本文所用,“潜在的带正电荷的基团”是官能团,例如叔丁羰基(t‑Boc)保护
的氨基基团,其当暴露于适当的环境刺激时可以转变成带正电荷的基团,例如氨基基团。
[0058] 在本文公开的多肽的一些实施方案中,所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。在某些实施方案中,所述多个带正电荷的氨基酸独立地选自赖
氨酸、组氨酸、精氨酸及其衍生物。
[0059] 在一些实施方案中,带正电荷的氨基酸和带负电荷的氨基酸占多肽中存在的氨基酸的总数目的约20%至约95%、约30%至约95%、约40%至约95%、约50%至约95%、约
40%至约90%、约50%至约90%、约40%至约80%或约50%至约70%。在一些实施方案中,
所述带正电荷的氨基酸占多肽中存在的氨基酸的总数目的约10%至约48%、约15%至约
48%、20%至约48%、约25%至约48%、约20%至约45%、约25%至约45%、约20%至约40%
或约25%至约35%。在一些实施方案中,所述带负电荷的氨基酸占多肽中存在的氨基酸的
总数目的约10%至约48%、约15%至约48%、20%至约48%、约25%至约48%、约20%至约
45%、约25%至约45%、约20%至约40%或约25%至约35%。
[0060] 本文公开的多肽通常包含约6至约1000个氨基酸、约20至约1000个氨基酸、约30至约1000个氨基酸、约50至约1000个氨基酸、约80至约1000个氨基酸、约80至约600个氨基酸
或约50至约500个氨基酸。
[0061] 本文公开的多肽包含基本上相等数目的带负电荷的氨基酸和带正电荷的氨基酸。在一些实施方案中,带负电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:
0.5至约1:2、约1:0.7至约1:1.4、约1:0.8至约1:1.25或约1:0.9至约1:1.1。因此,本文公开
的多肽是基本上电子中性的。如本文所用,术语“基本上电子中性的”是指具有基本上为零
的净电荷的多肽(即具有大致相同数目的带正电荷的氨基酸和带负电荷的氨基酸的多肽)
的性质。在一些实施方案中,所述多肽在约7.4的pH下是基本上电子中性的。
[0062] 在一些实施方案中,所述多肽包含多个赖氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。在一些实施方案中,所述多肽包含多个组氨
酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。
[0063] 在本文公开的多肽的一些实施方案中,所述多个另外的氨基酸选自丝氨酸、天冬酰胺、甘氨酸和脯氨酸。本发明的多肽可以包含仅一种类型的另外的氨基酸(例如,脯氨
酸),两种不同的另外的氨基酸(例如,脯氨酸和甘氨酸),三种不同的另外的氨基酸(例如,
丝氨酸、甘氨酸和脯氨酸)。在一些实施方案中,所述多肽包含一种另外的氨基酸。在一些实
施方案中,所述多肽包含两种另外的氨基酸。
[0064] 在本文公开的多肽的一些实施方案中,所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。在本文公开的多肽的一些实施方案中,所述多个另外的氨基酸选自丝氨酸和
甘氨酸。
[0065] 在本文公开的多肽的一些实施方案中,所述多个另外的氨基酸是两个或更多个脯氨酸。在本文公开的多肽的一些实施方案中,所述多个另外的氨基酸是两个或更多个甘氨
酸。在本文公开的多肽的一些实施方案中,所述多个另外的氨基酸是两个或更多个丝氨酸。
[0066] 在一些实施方案中,所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
[0067] 在一些实施方案中,所述多肽包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自甘氨酸和脯氨酸。
[0068] 在一些实施方案中,所述多肽基本上由以下组成:多个带负电荷的氨基酸;多个带正电荷的氨基酸;和多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨
酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;和任选的亲和标签,如可用于多肽的
亲和纯化的组氨酸标签。在一些实施方案中,所述多肽基本上由以下组成:多个谷氨酸;多
个赖氨酸;和多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸和甘氨酸;和任
选的亲和标签,如可用于多肽的亲和纯化的组氨酸标签。
[0069] 本发明的多肽中的氨基酸可以以任何方式或顺序排列。在一些实施方案中,所述多肽包含至少两个与带负电荷的氨基酸邻近的带正电荷的氨基酸的配对。在一些实施方案
中,所述多肽包含至少三个与带负电荷的氨基酸邻近的带正电荷的氨基酸的配对。在一些
实施方案中,所述多肽包含至少五个与带负电荷的氨基酸邻近的带正电荷的氨基酸的配
对。在一些实施方案中,所述多肽包含至少十个与带负电荷的氨基酸邻近的带正电荷的氨
基酸的配对。在一些实施方案中,所述多肽包含无规序列。例如,当本发明的多肽包含多个
谷氨酸(E)、多个赖氨酸(K)和多个甘氨酸(G)时,所述多肽可以包含含有EKG三肽作为重复
单元的序列,例如(EKG)n,其中n为2或更大。在一些实施方案中,包含多个谷氨酸(E)、多个
赖氨酸(K)和多个甘氨酸(G)的示例性多肽可以具有无规序列,如EKGGKEGKKEEEGG……。在
一些实施方案中,所述多肽不包含五个或更多个相同氨基酸的嵌段。
[0070] 在一些实施方案中,所述多肽是无规卷曲多肽,即所述多肽例如在水溶液中或在生理条件下采用/形成无规卷曲构象。术语“生理条件”是指其中蛋白通常采用其天然的折
叠构象的那些条件。在一些实施方案中,无规卷曲构象介导多肽或其生物缀合物的体内和/
或体外稳定性,例如生物样品或生理环境中的体内和/或体外稳定性的增加。
[0071] 可以根据本领域已知的方法,例如化学肽合成或克隆来制备本文公开的多肽。
[0072] 生物缀合物
[0073] 在第二方面,本文提供了一种包含至少一种本文公开的多肽的生物缀合物,其中所述多肽共价偶联到生物分子。适合的生物分子包括生物聚合物(例如,蛋白、肽、寡核苷
酸、多糖)、脂质和小分子。
[0074] 在一些实施方案中,所述生物分子是多肽(例如,蛋白、酶、短肽、抗体或其片段、结构蛋白等)、合成聚合物、核酸、糖蛋白、蛋白聚糖、荧光染料、小分子、脂肪酸或脂质。
[0075] 在一些实施方案中,所述生物分子是蛋白或肽。术语“蛋白”、“多肽”和“肽”可以互换使用。在某些实施方案中,肽的尺寸范围为约5至约5000、5至约1000、约5至约750、约5至约500、约5至约250、约5至约100、约5至约75、约5至约50、约5至约40、约5至约30、约5至约
25、约5至约20、约5至约15、或约5至约10个氨基酸,可以包含L‑氨基酸、D‑氨基酸或二者,并且可以包含本领域已知的多种氨基酸修饰或类似物中的任何一种。这样的修饰包括例如末
端乙酰化、酰胺化。
[0076] 在一些实施方案中,所述生物分子可以是激素、促红细胞生成素、胰岛素、细胞因子、用于接种的抗原或生长因子。在一些实施方案中,所述生物分子可以是抗体和/或其特
征部分。在一些实施方案中,抗体可以包括但不限于多克隆、单克隆、嵌合(即“人源化的”)
或单链(重组)抗体。在一些实施方案中,抗体可以具有降低的效应子功能和/或双特异性分
子。在一些实施方案中,抗体可以包括Fab片段和/或由Fab表达文库产生的片段(例如,Fab、
Fab'、F(ab')2、scFv、Fv、dsFv双抗体和Fd片段)。
[0077] 在其中生物分子是蛋白的一些实施方案中,本发明的多肽可以通过肽键与蛋白的C或N末端连接。
[0078] 在某些实施方案中,所述生物分子是核酸(例如,DNA、RNA、其衍生物)。在一些实施方案中,核酸试剂是功能性RNA。通常,“功能性RNA”是这样的RNA,其不编码蛋白,反而属于一类其成员特征性地在细胞内具有一种或多种不同的功能或活性的RNA分子。应当理解,具
有不同序列的功能性RNA分子的相对活性可以不同,并且可以至少部分取决于其中存在RNA
的特定细胞类型。因此,术语“功能性RNA”在本文中用于指一类RNA分子,并且不意在暗示该
类别的所有成员实际上将在任何特定的一组条件下显示该类别的活性特征。在一些实施方
案中,功能性RNA包括诱导RNAi的实体(例如,短干扰RNA(siRNA)、短发夹RNA(shRNA)和微小
RNA)、核酶、tRNA、rRNA、可用于三螺旋形成的RNA。
[0079] 在一些实施方案中,核酸是载体。如本文所用,术语“载体”是指可以转运已与其连接的另一核酸的核酸分子(通常但不必须是DNA分子)。载体可以在宿主细胞中实现与其连
接的核酸的染色体外复制和/或表达。在一些实施方案中,载体可以实现整合到宿主细胞的
基因组中。在一些实施方案中,载体用于引导蛋白和/或RNA表达。在一些实施方案中,待表
达的蛋白和/或RNA通常不被细胞表达。在一些实施方案中,待表达的蛋白和/或RNA通常由
细胞表达,但是其水平低于当载体尚未递送到细胞时所表达的水平。在一些实施方案中,载
体引导本文所述的任何功能性RNA,例如诱导RNAi的实体、核酶的表达。
[0080] 在一些实施方案中,所述生物分子是水化合物。在某些实施方案中,碳水化合物是与蛋白结合的碳水化合物(例如糖蛋白、蛋白聚糖)。碳水化合物包括天然或合成的碳水
化合物。碳水化合物也可以是衍生的天然碳水化合物。在某些实施方案中,碳水化合物可以
是简单糖或复合糖。在某些实施方案中,碳水化合物是单糖,包括但不限于葡萄糖、果糖、半
乳糖和核糖。在某些实施方案中,碳水化合物是二糖,包括但不限于乳糖、蔗糖、麦芽糖、海
藻糖和纤维二糖。在某些实施方案中,碳水化合物是多糖,包括但不限于纤维素、微晶纤维
素、羟丙基甲基纤维素(HPMC)、甲基纤维素(MC)、右旋糖、右旋糖酐、糖原、黄原胶、结冷胶、淀粉和支链淀粉。在某些实施方案中,碳水化合物是糖醇,包括但不限于甘露糖醇、山梨糖
醇、木糖醇、赤藓糖醇、麦芽糖醇和乳糖醇。
[0081] 在一些实施方案中,所述生物分子是脂质。在某些实施方案中,脂质是与蛋白质结合的脂质(例如,脂蛋白)。示例性的脂质包括但不限于甘油酯、甘油单酯、甘油二酯、甘油三
酯、甾体化合物(例如胆固醇、胆汁酸)、维生素(例如维生素E)、磷脂、鞘脂和脂蛋白。
[0082] 在一些实施方案中,所述生物分子是脂肪酸,例如具有长的取代或未取代的链(例如,C5‑C50),包括饱和以及不饱和链的酸。在一些实施方案中,脂肪酸可以是己酸、辛
酸、癸酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸、花生酸、山萮酸或木蜡酸中的一种或多种。在一些实施方案中,脂肪酸可以是棕榈油酸、油酸、异油酸、亚油酸、α‑亚麻酸、γ‑亚油酸、花生四烯酸、鳕油酸、花生四烯酸、二十碳五烯酸、二十二碳六烯酸或芥酸中的一种或多种。
[0083] 在一些实施方案中,所述生物分子是具有药物活性的小分子和/或有机化合物。在一些实施方案中,生物分子是临床上使用的药物。在一些实施方案中,药物是抗癌剂,抗生
素,抗病毒剂,抗HIV剂,抗寄生虫剂,抗原生动物剂,麻醉剂,抗凝剂,酶抑制剂,甾体药,甾体或非甾体抗炎药,抗组胺剂,免疫抑制剂,肿瘤剂,抗原,疫苗,抗体,解充血药,镇静剂,阿片类药物,镇痛剂,退热剂,节育剂,激素,前列腺素,促孕剂,抗青光眼剂,眼用药,抗胆碱能剂,镇痛剂,抗抑郁剂,抗精神病药,神经毒素,催眠剂,镇定剂,抗惊厥剂,肌肉松弛剂,抗帕金森病药,解痉剂,肌肉收缩剂,通道阻滞剂,缩瞳剂,抗分泌剂,抗血栓剂,抗凝剂,抗胆碱能药,β‑肾上腺素能阻断剂,利尿剂,心血管活性剂,血管活性剂,血管舒张剂,抗高血压剂,血管生成剂,细胞‑细胞外基质相互作用的调节剂(例如细胞生长抑制剂和抗粘附分
子),DNA、RNA或蛋白合成的抑制剂。在某些实施方案中,小分子药剂可以是任何药物。在一
些实施方案中,所述药物是适当的政府机构或监管机构已经认为安全且有效地用于人或动
物的药物,例如Axel Kleemann和Jurgen Engel的“Pharmaceutical Drugs:Syntheses,
Patents,Applications”,Thieme Medical Publishing,1999和“The Merck Index:An 
Encyclopedia of Chemicals,Drugs,and Biologicals”,Budavari等人(编),CRC Press,
1996中公开的具体药物,两者均通过引用并入本文。
[0084] 可以根据本领域已知的方法通过共价偶联将本发明的多肽缀合到生物分子。在一些实施方案中,生物缀合物包含与生物分子共价连接的两种或更多种本发明的多肽。本发
明的多肽的侧链基团和末端基团均可以用于将多肽缀合到生物分子。同样,多肽可以以任
何合适的方式连接到生物分子,例如,连接到蛋白的侧链或掺入到核酸碱基中的反应性
团。
[0085] 另一方面,本文提供了一种稳定生物分子的方法,其包括将一种或多种本文公开的多肽缀合到生物分子。如本文所用,与母体未修饰生物分子相比,“稳定生物分子”包括降
低免疫原性,增加其生物学半衰期和/或改善特异性组织或器官靶向。
[0086] 融合蛋白
[0087] 另一方面,本文提供了一种融合蛋白,其包含连接到一个或多个带电荷的结构域的一个或多个功能性结构域,其中所述一个或多个带电荷的结构域包含:
[0088] a)多个带负电荷的氨基酸;
[0089] b)多个带正电荷的氨基酸;和
[0090] c)多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;以及
[0091] 其中所述带正电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约1:2。
[0092] 如本文所用,“融合蛋白”是由至少两个结构域组成的蛋白,所述结构域由已经连接的分开的基因编码,使得它们作为单个单元被转录和翻译,产生单个多肽。在一些实施方
案中,本文公开的融合蛋白的结构域包含在该蛋白的单个一级序列中,例如作为单个多肽。
[0093] 如本文所用,术语“功能性结构域”涉及能够自主采用特定结构和/或功能的氨基酸序列的任何区域或部分。在一些实施方案中,如本文所述的融合蛋白可以包含至少一个
可以介导生物学活性的功能性结构域,其本身可以是融合蛋白。本发明的融合蛋白包含至
少一个具有和/或介导生物学活性的结构域/部分和至少一个带电荷的结构域。本发明的融
合蛋白也可以由多于两个的结构域组成,并且可以包含在两个结构域之间的间隔结构或另
外的结构域,例如蛋白酶敏感的切割位点、亲和标签(例如His‑标签或Strep‑标签)、信号
肽、保留肽、靶向肽(例如膜易位肽)或另外的效应子结构域(例如用于与抗肿瘤毒素相关的
肿瘤靶向的抗体片段)或用于前药激活的酶等。
[0094] 如本文所用,术语“带电荷的多肽结构域”或“带电荷的结构域”是指多肽例如融合蛋白的区域,其包含多个独立地选自带负电荷的氨基酸的氨基酸和多个独立地选自带正电
荷的氨基酸的氨基酸,使得该片段是基本上电子中性的。除了带正电荷和带负电荷的氨基
酸以外,带电荷的结构域还可以包含一种或多种类型的另外的氨基酸,例如不带电荷的氨
基酸,使得该片段是基本上电子中性的。
[0095] 在本文公开的融合蛋白的一些实施方案中,所述带电荷的结构域中的所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。在某些实施方案中,所述多个带
正电荷的氨基酸独立地选自赖氨酸、组氨酸、精氨酸及其衍生物。
[0096] 在一些实施方案中,带正电荷的氨基酸和带负电荷的氨基酸占带电荷的结构域中存在的氨基酸的总数目的约20%至约95%、约30%至约95%、约40%至约95%、约50%至约
95%、约40%至约90%、约50%至约90%、约40%至约80%或约50%至约70%。在一些实施
方案中,所述带正电荷的氨基酸占带电荷的结构域中存在的氨基酸的总数目的约10%至约
48%、约15%至约48%、20%至约48%、约25%至约48%、约20%至约45%、约25%至约
45%、约20%至约40%或约25%至约35%。在一些实施方案中,所述带负电荷的氨基酸占带
电荷的结构域中存在的氨基酸的总数目的约10%至约48%、约15%至约48%、20%至约
48%、约25%至约48%、约20%至约45%、约25%至约45%、约20%至约40%或约25%至约
35%。
[0097] 所述带电荷的结构域通常包含约6个或更多个氨基酸。在一些实施方案中,所述带电荷的结构域包含约6至约1000个氨基酸、约20至约1000个氨基酸、约30至约1000个氨基
酸、约50至约1000个氨基酸、约80至约1000个氨基酸、约80至约600个氨基酸或约50至约500
个氨基酸。
[0098] 本文公开的融合蛋白的带电荷的结构域包含数目基本上相等的带负电荷的氨基酸和带正电荷的氨基酸。在一些实施方案中,带负电荷的氨基酸的数目与带正电荷的氨基
酸的数目的比率为约1:0.5至约1:2、约1:0.7至约1:1.4、约1:0.8至约1:1.25或约1:0.9至
约1:1.1。因此,所述带电荷的结构域是基本上电子中性的。在一些实施方案中,所述多肽在
约7.4的pH下是基本上电子中性的。
[0099] 在一些实施方案中,所述带电荷的结构域包含多个赖氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸和天冬氨酸。在一些实施方案中,所述带电荷的
结构域包含多个组氨酸和多个带负电荷的氨基酸,所述多个带负电荷的氨基酸选自谷氨酸
和天冬氨酸。
[0100] 在本文公开的融合蛋白的一些实施方案中,所述带电荷的结构域中的所述多个另外的氨基酸选自丝氨酸、天冬酰胺、甘氨酸和脯氨酸。在一些实施方案中,所述多个另外的
氨基酸选自丝氨酸、甘氨酸和脯氨酸。在一些实施方案中,所述多个另外的氨基酸选自丝氨
酸和甘氨酸。本发明的带电荷的结构域可以包含仅一种类型的另外的氨基酸(例如,脯氨
酸),两种不同的另外的氨基酸(例如,脯氨酸和甘氨酸),三种不同的另外的氨基酸(例如,
丝氨酸、甘氨酸和脯氨酸)。在一些实施方案中,所述带电荷的结构域包含一种另外的氨基
酸。在一些实施方案中,所述多肽包含两种另外的氨基酸。
[0101] 在一些实施方案中,所述多个另外的氨基酸是两个或更多个脯氨酸。在一些实施方案中,所述多个另外的氨基酸是两个或更多个甘氨酸。在一些实施方案中,所述多个另外
的氨基酸是两个或更多个丝氨酸。
[0102] 在一些实施方案中,所述带电荷的结构域包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。
[0103] 在一些实施方案中,所述带电荷的结构域包含多个赖氨酸、多个谷氨酸和多个另外的氨基酸,所述多个另外的氨基酸选自甘氨酸和脯氨酸。
[0104] 在一些实施方案中,所述带电荷的结构域基本上由以下组成:多个带负电荷的氨基酸;多个带正电荷的氨基酸;和多个另外的氨基酸,所述多个另外的氨基酸独立地选自脯
氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物;和任选的亲和标签,如可用于多肽的亲和纯化的组氨酸标签。在一些实施方案中,所述带电荷的结构域基本上由以下
组成:多个谷氨酸;多个赖氨酸;和多个另外的氨基酸,所述多个另外的氨基酸独立地选自
脯氨酸和甘氨酸;和任选的亲和标签,如可用于多肽的亲和纯化的组氨酸标签。
[0105] 所述带电荷的结构域中的氨基酸可以以任何方式或顺序,例如以上述方式排列。在一些实施方案中,所述带电荷的结构域是无规卷曲多肽。
[0106] 本文公开的融合蛋白包含一个或多个功能性结构域。在一些实施方案中,所述功能性结构域是功能性多肽。术语“功能性蛋白”和“功能性肽”可以互换使用。在某些实施方
案中,肽的尺寸范围为约5至约40000、约5至约20000、约5至约10000、约5至约5000、约5至约
1000、约5至约750、约5至约500、约5至约250、约5至约100、约5至约75、约5至约50、约5至约
40、约5至约30、约5至约25、约5至约20、约5至约15或约5至约10个氨基酸。
[0107] 在一些实施方案中,功能性多肽是蛋白或肽,包括酶、细胞因子、激素、生长因子、抗原、抗体、抗体的特征部分、凝血因子、调节蛋白、信号传导蛋白、转录蛋白和受体。这些包括(IL‑1α)、IL‑1β、IL‑2、IL‑3、IL‑4、IL‑5、IL‑6、IL‑11、IL‑7、IL‑8、IL‑9、IL‑10、IL‑11、IL‑
12、IL‑13、IL‑14、IL‑15、IL‑16、IL‑17、IL‑18、IL‑19、IL‑20、IL‑21、IL‑22、IL‑23、IL‑24、IL‑31、IL‑32、IL‑33、集落刺激因子‑1(CSF‑1)、巨噬细胞集落刺激因子、葡糖脑苷脂酶、促甲状腺素、干细胞因子、粒细胞巨噬细胞集落刺激因子、粒细胞集落刺激因子(G‑CSF)、GM‑
CSF、(EOS)‑CSF、CSF‑1、EPO、有机磷水解酶(OPH)、干扰素‑α(IFN‑α)、复合干扰素‑β(IFN‑β)、干扰素‑γ(IFN‑γ)、促血小板生成素(TPO)、Cas9、Cas12a、Cas12b、Cas12c、Cas13a1、Cas13a2、Cas13b、血管生成素‑1(Ang‑1)、Ang‑2、Ang‑4、Ang‑Y、血管生成素样多肽1
(ANGPTL1)、血管生成素样多肽2(ANGPTL2)、血管生成素样多肽3(ANGPTL3)、血管生成素样
多肽4(ANGPTL4)、血管生成素样多肽5(ANGPTL5)、血管生成素样多肽6(ANGPTL6)、血管生成
素样多肽7(ANGPTL7)、玻连蛋白、血管内皮生长因子(VEGF)、血管生成素、激活素A、激活素
B、激活素C、骨形态发生蛋白‑1、骨形态发生蛋白‑2、骨形态发生蛋白‑3、骨形态发生蛋白‑
4、骨形态发生蛋白‑5、骨形态发生蛋白‑6、骨形态发生蛋白‑7、骨形态发生蛋白‑8、骨形态发生蛋白‑9、骨形态发生蛋白‑10、骨形态发生蛋白‑11、骨形态发生蛋白‑12、骨形态发生蛋白‑13、骨形态发生蛋白‑14、骨形态发生蛋白‑15、骨形态发生蛋白受体IA、骨形态发生蛋白受体IB、骨形态发生蛋白受体II、脑源性神经营养因子、心肌营养素‑1、睫状神经营养因子、睫状神经营养因子受体、cripto、cryptic、细胞因子诱导的嗜中性粒细胞趋化因子1、细胞
因子诱导的嗜中性粒细胞趋化因子2α、乙型肝炎疫苗、丙型肝炎疫苗、drotrecoginα、细胞
因子诱导的嗜中性粒细胞趋化因子2β、SLF、SCF、肥大细胞生长因子、内皮细胞生长因子、内皮素1、表皮生长因子(EGF)、epigen、上皮调节蛋白、上皮源性嗜中性粒细胞引诱剂、成纤维
细胞生长因子4、成纤维细胞生长因子5、成纤维细胞生长因子6、成纤维细胞生长因子7、成
纤维细胞生长因子8、成纤维细胞生长因子8b、成纤维细胞生长因子8c、成纤维细胞生长因
子9、成纤维细胞生长因子10、成纤维细胞生长因子11、成纤维细胞生长因子12、成纤维细胞
生长因子13、成纤维细胞生长因子16、成纤维细胞生长因子17、成纤维细胞生长因子19、成
纤维细胞生长因子20、成纤维细胞生长因子21、酸性成纤维细胞生长因子、碱性成纤维细胞
生长因子、EPA、乳蛋白、H‑亚基铁蛋白、前列腺素(PG)E1和E2、神经胶质细胞系源性神经
营养因子受体α1、神经胶质细胞系源性神经营养因子受体、生长相关蛋白、生长相关蛋白a、
IgG、IgE、IgM、IgA和IgD、α‑半乳糖苷酶、β‑半乳糖苷酶、DNA酶、胎球蛋白、黄体生成素、阿替普酶、雌激素、胰岛素、白蛋白、脂蛋白、胎蛋白、转铁蛋白、促血小板生成素、尿激酶、整联蛋白、凝血酶、因子IX(FIX)、因子VIII(FVIII)、因子Vila(FVIIa)、血管假性血友病因子
(VWF)、因子FV(FV)、因子X(FX)、因子XI(FXI)、因子XII(FXII)、因子XIII(FXIII)、凝血酶
(FII)、蛋白C、蛋白S、tPA、PAI‑1、组织因子(TF)、ADAMTS 13蛋白酶、生长相关蛋白β、生长相关蛋白、肝素结合表皮生长因子、肝细胞生长因子、肝细胞生长因子受体、肝细胞瘤源性生
长因子、胰岛素样生长因子I、胰岛素样生长因子受体、胰岛素样生长因子II、胰岛素样生长
因子结合蛋白、化细胞生长因子、白血病抑制因子、生长激素、抗血友病因子、培冬酶、
orthoclone OKT 3、腺苷脱氨酶、阿糖脑苷酶、伊米苷酶、白血病抑制因子受体α、神经生长
因子、神经生长因子受体、神经生成素、神经营养蛋白‑3、神经营养蛋白‑4、制瘤素M(OSM)、胎盘生长因子、胎盘生长因子2、血小板源性内皮细胞生长因子、血小板源性生长因子、血小
板源性生长因子A链、血小板源性生长因子AA、血小板源性生长因子AB、血小板源性生长因
子B链、血小板源性生长因子BB、血小板源性生长因子受体α、血小板源性生长因子受体β、前B细胞生长刺激因子、干细胞因子(SCF)、干细胞因子受体、TNF、TNF0、TNF1、TNF2、转化生长因子α、胸腺基质淋巴细胞生成素(TSLP)、I型肿瘤坏死因子受体、II型肿瘤坏死因子受体、
尿激酶型纤溶酶原激活剂受体、磷脂酶激活蛋白(PUP)、胰岛素、凝集素、蓖麻毒素、催乳素、绒毛膜促性腺激素、促卵泡激素、促甲状腺激素、组织纤溶酶原激活物(tPA)、瘦素、Enbrel
(依那西普)、激活素、抑制素、白血病抑制因子、制瘤素M、MIP‑1‑C、MIP‑1B;MIP‑2‑C、GRO‑C.;MIP‑2‑B和血小板因子‑4。
[0108] 在一些实施方案中,功能性结构域可以包含设计的功能性多肽序列。在一些实施方案中,功能性多肽序列是功能性多肽的结构域或片段。在一些实施方案中,功能性多肽序
列是识别序列,其任选导致多肽的化学计量结合或修饰。在一些实施方案中,功能性多肽序
列是用于促进融合多肽的表达或纯化的序列。在一些实施方案中,功能性多肽序列是具有
二级或更高级性质的结构基序,包括螺旋、片层、转角、折叠和超结构域。在一些实施方案
中,功能性多肽序列是存在于两个其他结构域之间的接头序列。
[0109] 在一些实施方案中,可以通过合理设计、定向进化或产生在性能的至少一方面得到改善的功能性蛋白的另一种技术来修饰功能性多肽结构域。
[0110] 本文公开的融合蛋白的结构域可以包含L‑氨基酸、D‑氨基酸或其组合,并且可以包含本领域已知的多种氨基酸修饰或类似物中的任一种。在一个实施方案中,有用的修饰
包括末端乙酰化、酰胺化、半胱氨酸向甲酰基甘氨酸的位点特异性转化。在一些实施方案
中,如本文所述,功能性结构域和保护性结构域可包含天然氨基酸、非天然氨基酸、合成氨
基酸及其组合。
[0111] 在一些实施方案中,所述带电荷的结构域充当保护性结构域,即为与其连接的分子提供有利性质的结构域,所述有利性质例如增强的稳定性、改善的溶解性和/或改善的药
代动力学性质。术语“保护性结构域”、“保护性多肽结构域”以及“混合电荷保护性多肽结构域”可以互换使用。
[0112] 与不包含如本文所公开的一个或多个带电荷的结构域的类似的蛋白相比,本文所公开的融合蛋白具有有利的性质。如以下实施例和图4A中所示,包含粒细胞集落刺激因子
蛋白功能性结构域(GCSF,SEQ ID NO:10)和含有氨基酸谷氨酸(E)、赖氨酸(K)和脯氨酸(P)
(EKP)的示例性带电荷的多肽结构域的示例性融合蛋白EKP‑GCSF当与单独的GCSF蛋白相比
时显示出增强的循环特性。令人惊讶地,与融合蛋白EK‑GCSF(SEQ ID NO:8)相比,EKP‑GCSF
(SEQ ID NO:2)表现出增强的循环特性,所述融合蛋白EK‑GCSF(SEQ ID NO:8)包含仅含有
谷氨酸(E)和赖氨酸(K)的带电荷的结构域。通过白细胞计数测定法确定并如图4B所示,当
与EK‑GCSF或单独的GCSF相比时,示例性融合蛋白EKP‑GCSF还表现出增加的活性/功效。
[0113] 另外,如图6所示,与IFNα2a蛋白本身(IFNα2a,SEQ ID NO:16)或包含仅含有谷氨酸(E)和赖氨酸(K)的带电荷的结构域的IFNα2a融合蛋白(EK‑IFNα2a,SEQ ID NO:12)相比,
包含与干扰素α2a(IFNα2a)末端融合的示例性EKP多肽结构域的示例性融合蛋白(EKP‑IFNα
2a,SEQ ID NO:14)显示出更有利的药代动力学特性。
[0114] 多肽和融合蛋白的制备
[0115] 本文公开的融合蛋白和多肽可以以任何合适的方式制备,例如,使用分子克隆技术。
[0116] 因此,一方面,本发明提供了一种包含编码本文公开的融合蛋白或多肽的序列的核酸。在一个实施方案中,本发明提供了编码本发明的任何方面的多肽,例如融合蛋白的分
离的核酸。分离的核酸序列可以包含RNA或DNA。如本文所用,“分离的核酸”是已从基因组或
cDNA序列中的其正常周围核酸序列中移出的核酸。这样的分离的核酸序列还可以包含用于
促进编码的多肽的表达和/或纯化的另外的序列,如前所述。
[0117] 可以将编码本发明的融合蛋白或本发明的多肽的核酸掺入合适的表达载体中。表达载体或表达构建体是将特定基因携带到宿主细胞中并使用该细胞的蛋白合成机制产生
该基因编码的蛋白的DNA分子。表达载体还包含基因表达所必需的元件,例如可操作地连接
到基因的启动子区域,其实现基因的有效转录。可以控制蛋白的表达,并且仅在必要时通过
使用诱导剂才大量产生蛋白。大肠杆菌通常用作蛋白生产的宿主,但是也可以使用其他细
胞类型,例如酵母、昆虫细胞和哺乳动物细胞。
[0118] 因此,一方面,本文提供了一种细胞,其包含编码本发明的融合蛋白或多肽的核酸。该细胞可以是原核细胞或真核细胞。
[0119] 在一些实施方案中,可以使用任何合适的表达系统,例如大肠杆菌表达系统、枯草芽孢杆菌表达系统或任何其他原核表达系统来合成本文公开的多肽或融合蛋白。
[0120] 在一个实施方案中,可以使用巴斯德毕赤酵母表达系统合成本文公开的多肽或融合蛋白。在另一个实施方案中,可以使用人胚肾293表达系统合成本文公开的多肽或融合蛋
白。在另一个实施方案中,可以使用中国仓鼠卵巢表达系统合成本文公开的多肽或融合蛋
白。在一个实施方案中,可以使用无原核或真核细胞的表达系统合成本文公开的多肽或融
合蛋白。
[0121] 本文公开的多肽和融合蛋白的回收和纯化可以通过任何方法或这些方法的组合来实现。在一些实施方案中,可以使用蛋白沉淀技术。在一些实施方案中,可以使用尺寸排
阻色谱纯化本文公开的多肽或融合蛋白。在一些实施方案中,可以使用离子交换色谱纯化
本文公开的多肽或融合蛋白。在一些实施方案中,可以使用脱盐柱纯化本文公开的多肽或
融合蛋白。在一些实施方案中,可以使用亲和色谱纯化本文公开的多肽或融合蛋白。在一些
实施方案中,可以使用疏水或亲水特性来纯化本文公开的多肽或融合蛋白。在一些实施方
案中,可以使用无基质电泳技术纯化本文公开的多肽或融合蛋白。
[0122] 尽管已经示出和描述了示例性实施方案,但是应当理解,可以在不脱离本发明的精神和范围的情况下在其中进行各种改变。尽管本文将本发明的每个要素描述为包含多个
实施方案,但是应当理解,除非另外指出,否则本发明的给定要素的每个实施方案能够与本
发明的其他要素的每个实施方案一起使用,并且每种这样的使用均旨在形成本发明的不同
实施方案。
[0123] 从上面的公开内容可以理解,本发明具有各种各样的应用。通过以下实施例进一步说明本发明,提供这些实施例是为了说明而不是限制本发明。
实施例
[0124] 实施例1:与粒细胞集落刺激因子(GCSF)的末端融合的一系列多肽的制备和表征
[0125] 在该实施例中,将DNA序列(SEQ ID NO:1、3和5)克隆到pMAL‑c5E表达载体中,所述DNA序列(SEQ ID NO:1、3和5)编码包含含有氨基酸E和K以及X的结构域(表示为EKX的结构
域)的蛋白,其中该实施例中的X为G(表示为EKG的结构域,SEQ ID NO:4的氨基酸2‑292)、P
(表示为EKP的结构域,SEQ ID NO:2的氨基酸2‑272),或G和P的混合物(表示为EKPG的结构
域,SEQ ID NO:6的氨基酸2‑278),所述蛋白与粒细胞集落刺激因子(GCSF)的N末端融合,具
有另外的与GCSF的C末端融合的6x His标签(例如,EKX‑GCSF‑His)。pMAL‑c5E载体含有编码
具有肠激酶切割位点的麦芽糖结合蛋白(MBP)的DNA序列。克隆EKX‑GCSF,使得具有肠激酶
位点的MBP在EKX‑GCSF的N末端上。已显示MBP增强了GCSF融合蛋白的表达和溶解性,可以使
用肠激酶在其目标裂解位点将其裂解,仅留下期望的EKX‑GCSF融合蛋白。将构建的pMAL‑
c5E‑EKX‑GCSF‑His转化到BL21(DE3)大肠杆菌感受态细胞中。使转化的大肠杆菌在含有100
μg/mL氨苄青霉素的Terrific肉汤(TB)中于37℃下生长至光密度(OD600)为0.5,此时用1mM
异丙基β‑D‑1‑硫代吡喃半乳糖苷(IPTG)诱导表达。此时,温度改变成30℃,并生长6小时。通过细胞成团收获培养物。将团粒重悬于pH 8的20mM磷酸钠、6M GnHcl、500mM NaCl、10mM咪
唑中,并用冻融和超声处理来裂解。然后使细胞碎片与残留在上清液中的期望蛋白一起成
团。通过乙醇沉淀除去脂质,并将蛋白重悬于原始缓冲液中。将所得样品上样至Nuvia IMAC
柱(BioRad)。使用pH 4的相同缓冲液洗脱蛋白。
[0126] 所得蛋白在乙醇中沉淀以除去盐酸胍,并重悬在SDS‑PAGE上样缓冲液中以进行免疫印迹。将目标蛋白转移到用单克隆抗hGCSF抗体(Invitrogen)探测的聚偏二氟乙烯
(PVDF)膜上进行检测(图1)。出现条带,表明成功产生了目标蛋白。使用肠激酶在20℃下裂
解连接到由表达产生的融合蛋白的MBP 16小时。利用圆二色性分析MBP切割后的最终产物,
以确定融合蛋白的结构。使用Jasco 720圆二色谱仪在10mM pH 8的磷酸钾缓冲液中分析等
摩尔量的50μg/mL所得蛋白EKP‑GCSF(SEQ ID NO:2,50μg/mL)、EKPG‑GCSF(SEQ ID NO:6,50μg/mL)、EKG‑GCSF(SEQ ID NO:4,50μg/mL)、EK‑GCSF(V SEQ ID NO:8,50μg/mL)和单独的GCSF(SEQ ID NO:10,20μg/mL)(图2A)。为了确定多肽本身、EKP、EKPG、EKG和EK的结构,从融合蛋白变体的GCSF曲线中扣除了GCSF曲线(图2B)。曲线表明存在随机卷曲,并且与EK相比,
EKP、EKPG和EKG中的随机卷曲增加。
[0127] 实施例2:与GCSF的末端融合的一系列多肽的药代动力学和药效学性质
[0128] 使用C57BL/6小鼠(6周龄),通过在t=0小时眼眶后注射EKP‑GCSF(SEQ ID NO:2)、EKPG‑GCSF(SEQ ID NO:6)、EKG‑GCSF(SEQ ID NO:4)、EK‑GCSF(SEQ ID NO:8)和单独的GCSF
(SEQ ID NO:10)(20nmol/kg),在体内确定如上所述获得的融合蛋白变体的药代动力学曲
线。在所显示的时间点从小鼠的下巴抽血。使用抗‑hGCSF单克隆抗体(3316‑Invitrogen)和
抗‑hGCSF多克隆抗体(R&D systems),采用捕获ELISA分析法测定血清浓度(图3)。针对每种
变体(EKP‑GCSF、EKPG‑GCSF、EKG‑GCSF、EK‑GCSF和GCSF)生成标准曲线,以说明抗体与GCSF表位的差异结合。
[0129] 为了进一步阐明这些变体的药代动力学和药效学特性,通过尾静脉注射将EK‑GCSF、EKP‑GCSF和GCSF(10nmol/kg)注射到Sprague‑Dawley大鼠中。在注射后所显示的时间
点通过尾静脉抽血采血。使用抗‑hGCSF单克隆抗体(3316‑Invitrogen)和抗‑hGCSF多克隆
抗体(R&D systems),采用捕获ELISA分析法测定血清浓度。针对每种变体(EKP‑GCSF、EK‑
GCSF和GCSF)生成标准曲线,以说明抗体与GCSF表位的差异结合。在t=0小时将血清浓度归
一化至初始血清浓度(图4A)。当与EK‑GCSF或单独的GCSF相比时,EKP‑GCSF显示出增强的循
环特性。通过白细胞计数(WBC)确定融合蛋白变体的功效。根据制造商的说明,通过Medix 
LeukoTic Bluplus WBC测试试剂盒在所显示的时间点确定WBC(图4B)。当与EK‑GCSF或单独
的GCSF相比时,EKP‑GCSF还表现出增强的活性/功效,因为注射EKP‑GCSF的动物的白细胞计
数具有更高且更持久的升高。
[0130] 实施例3:与干扰素α2a(IFNα2a)的末端融合的一系列多肽的制备、表征和药代动力学特征
[0131] 在该实施例中,将编码包含氨基酸E和K而具有或不具有P的结构域的DNA序列与hIFNα2a的N末端融合,产生EK‑hIFNα2a和EKP‑hIFNα2a融合蛋白。将HA标签(YPYDVPDYA)添加到融合蛋白的N末端,以检测全长产物。为了在哺乳动物细胞中有效地进行细胞外分泌,
先天性分泌信号序列hIFNα2a被删除并被人组织纤溶酶原激活物(tPA)前导序列替代。分别
由这些得到的DNA SEQ ID NO:11、SEQ ID NO:13和SEQ ID NO:15编码的蛋白EK‑hIFNα2a
(SEQ ID NO:12)、EKP‑hIFNα2a(SEQ ID NO:14)和hIFNα2a(SEQ ID NO:16)如下制备。将表
达盒克隆到含有CMV启动子的pcDNA3.1+哺乳动物细胞表达载体中。源自HEK293细胞系的
TM 6
FreeStyle 293‑F细胞(HEK293‑F,ThermoFisher,USA)用于蛋白表达。首先将细胞以10 个
细胞/mL的密度接种在30mL F17培养基中,并在37℃下在5%CO2的湿润气氛中在以120rpm
旋转的轨道振荡器平台上孵育。然后,将构建的质粒与聚乙烯亚胺(PEI)以3:1的N/P比例复
TM
合,并与HEK293‑F孵育。72小时后,收集培养物上清液,并使用Pierce Anti‑HA琼脂糖凝胶
(ThermoFisher,US)通过HA标签特异性抗体纯化蛋白。SDS‑PAGE分析证实了转染质粒后,
hIFNα2a、EK‑hIFNα2a和EKP‑hIFNα2a各自在HEK293‑F中成功地细胞外表达(图5)。检测到约
20kDa的条带,其与hIFNα2a的大小(19.2kDa)一致。还检测到EK‑hIFNα2a和EKP‑hIFNα2a的条带(均为49.2kDa)。EKP‑hIFNα2a在SDS‑PAGE上显示出明显的延迟迁移,这可能是由于EKP
多肽的无规卷曲结构的性质所致。
[0132] 通过在C57BL/6小鼠(6周龄)中进行体内测试,确定了hIFNα2a融合蛋白变体的药代动力学曲线。每个实验组中的三只小鼠通过眼眶后注射在t=0小时给予50nmol/kg EKP‑
hIFNα2、EK‑hIFNα2a和hIFNα2a。给药后,在注射后0、1、4、8、12、24、48小时从每只动物的下巴出血采集血液样品。使用抗HA标签抗体(NB600‑363,Novus)和抗人干扰素α2多克隆抗体
(MBS2527079,MyBioSource),通过捕获ELISA对每种样品中蛋白的血清浓度进行定量(图
6)。针对每种变体(HA‑EKP‑hIFNα2a、HA‑EK‑hIFNα2a和HA‑hIFNα2a)生成标准曲线,以说明抗体与HA和hIFNα2a表位的差异结合。
[0133] 实施例4:与增强的绿色荧光蛋白(eGFP)融合的一系列多肽的产生
[0134] 在该实施例中,合成DNA(SEQ ID NO:17、19、21和23)并将其克隆到pET20b+质粒中,以表达到细胞质中,所述DNA编码包含与eGFP的C末端融合的EK(SEQ ID NO:18的氨基酸
249‑330)、EKGSN(SEQ ID NO:20的氨基酸246‑346)、EKG(SEQ ID NO:22的氨基酸247‑342)
和EKGS(SEQ ID NO:24的氨基酸247‑346)的10kDa片段的蛋白(所有蛋白表示为EKX‑eGFP)。
用EKX‑eGFP质粒转化BL21(DE3)大肠杆菌。使转化的大肠杆菌在含有100μg/mL氨苄青霉素
的Terrific肉汤(TB)中在37℃下生长至光密度(OD600)为0.5,此时用1mM异丙基β‑D‑1‑硫
代吡喃半乳糖苷(IPTG)诱导表达。此时,温度改变成30℃,并生长6小时。通过将培养物在
10000rpm下离心10分钟以使细胞成团来收获培养物。将细胞团粒重悬于磷酸盐缓冲盐水
(PBS)中,并用探针超声仪超声处理以裂解细胞。将硫酸铵添加至2M,并通过离心除去任何
沉淀的蛋白质。将上清液施加到苯基疏水相互作用色谱柱(HIC)上,并用降低的硫酸铵浓度
梯度洗脱。合并含有eGFP(和多肽变体)的级分,并施加到用PBS平衡的尺寸排阻色谱柱
(SEC)上。再次合并含有eGFP的级分,并施加到阴离子交换(AEX)柱。使用增加的氯化钠梯度
(至多1M)洗脱蛋白。合并含有eGFP的级分,并在SDS‑PAGE上进行分析(图7)。使用二辛可宁
酸(bicinchronic acid,BCA)分析计算产率,并针对每1升批次报告(表1)。
[0135] 表1
[0136] eGFP和EKX‑eGFP蛋白的1升摇瓶表达的纯化产率。
[0137]
QQ群二维码
意见反馈