一种采用大肠杆菌表达串联序列制备GLP-1或其类似物多肽
的方法
技术领域
[0001] 本
发明属于
生物技术领域,具体涉及一种采用大肠杆菌高效表达的串联序列制备GLP-1或其类似物多肽的方法。
背景技术
[0002] 2型糖尿病是一种高度异质性的代谢紊乱综合征,其基本病理损害是在胰岛素抵抗的
基础上又合并有胰岛功能的明显减退。据统计,2007年全球大约有2.46亿糖尿病患者,2025年将达到3.8亿,其中2型糖尿病患者占总数的90%~95%。目前,临床上
治疗糖尿病的药物主要集中在各类胰岛素和四大类口服降糖药。为了让糖尿病患者在治疗时有更多的选择,一些新型的治疗糖尿病药物在21世纪初应运而生,如胰高糖素样肽-1类似物,这类药物是在内源胰高糖素样肽-1(GLP-1)的基础上经过结构改变而成的。内源性的GLP-1能根据体内
葡萄糖水平按需促进胰岛素分泌,但却又很快被体内的二肽基肽酶IV降解,
半衰期大约
2min。结构改造后的GLP-1制剂既保留了GLP-1的药理作用,又大大提高了药物的作用时间,目前已被FDA批准用于2型糖尿病治疗的GLP-1类似物有
艾塞那肽注射液、利拉鲁肽注射液和索
马鲁肽注射液和索马鲁肽片等。
[0003] GLP-1或其类似物通常分子量不超过4000Da,
氨基酸数不超过40,可通过大肠杆菌表达系统和
酵母表达系统产生。酵母表达可分泌到细胞外,有利于表达产物的收集和纯化,但酵母培养成本相对较高,
发酵培养周期时间长,且缺乏强有
力的受严格调控的启动子,分泌效率较低,相对产量不高,综合成本较高。大肠杆菌原核表达系统具有产率高,成本低廉,遗传背景清楚,特征明确,操作简单等特点,可以弥补酵母表达系统的缺点。但是大肠杆菌原核表达系统不适于表达分子量较小的多肽或蛋白,因为小肽和蛋白类产品在大肠杆菌表达的菌体内容易降解,为了增强这类小蛋白多肽的
稳定性,往往在设计时需要连接一段融合蛋白,以减少其降解。连接的融合蛋白需要在后期纯化前进行蛋白酶酶切去除,这就使得表达产物融合蛋白在酶切之后目的蛋白占总蛋白的量并不高,大部分表达产物都被酶切后去除了,结果即便融合蛋白表达量很高,其目的蛋白的理论收率也只有20-30%。GLP-1或其类似物的分子量较小,为了提高其在大肠杆菌中的表达量,传统的表达策略也是在GLP-1或其类似物前端或后端加入融合蛋白,增加其蛋白大小。融合蛋白-GLP-1或其类似物或GLP-1或其类似物-融合蛋白经蛋白酶或肠激酶等酶切后释放GLP-1或其类似物。这样的表达设计获得GLP-1或其类似物收率不高,理论收率只有25%左右,且产物纯度较低,一般只有40-50%的纯度,后续分离纯化难度很大,收率也低。因此探索新的GLP-1或其类似物高表达技术对于开发新药、降低生产成本具有非常显著的意义。
[0004] 目前还没有关于多肽或蛋白串联表达技术的
专利或文献,一个原因可能是因为串联表达目的蛋白之间的酶切位点很难完全被识别,造成酶切不彻底,或者酶切后有残留氨基酸,目的蛋白收率较低。
[0005] 因此,本领域需要提供一种GLP-1或其类似物重组串联蛋白表达的设计及原核表达菌株的构建方法,来提高GLP-1或其类似物在整个表达肽链的比例和酶切后的收率。
发明内容
[0006] 本发明的目的之一是提供GLP-1或其类似物重组串联蛋白序列。
[0007] 本发明的目另一个目的是提供GLP-1或其类似物重组串联蛋白的原核表达菌株的构建方法。
[0008] 本文使用的术语“GLP-1或其类似物”意指天然GLP-1氨基酸序列的全部或部分突变序列,包括但不限于以下(1)~(8)任一序列:
[0009] (1)HAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG、
[0010] (2)HAEGTFTSDVSSYLEGQAAKEFIAWLVRGRG、
[0011] (3)EGTFTSDVSSYLEGQAAKEFIAWLVRGRG、
[0012] (4)HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPPS、
[0013] (5)HAEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPPS、
[0014] (6)HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPSKKKKKK、
[0015] (7)HGEGTFTSDVSSYLEGQAAKEFIAWLVKGR、
[0016] (8)HGEGTFTSDVSSYLEEQAAKEFIAWLVKGGG。
[0017] 在本发明的第一方面,提供一种GLP-1或其类似物重组串联蛋白序列,通式为:X-(Y-Z)n,其中:
[0018] X为5-10个氨基酸形成的前导肽,氨基酸组成包括但不限于:A丙氨酸、L亮氨酸、N天冬酰胺、R精氨酸、S丝氨酸、F苯丙氨酸、H组氨酸、M甲硫氨酸、V缬氨酸。优选的序列组成为MRLN、MRLNSA或MRLNSAFV,序列号分别为Seq ID No.1-3;
[0019] Y为胰蛋白酶和CPB酶双酶切位点或Kex2酶和CPB酶双酶切位点及辅助序列,是串联表达序列设计技术的核心序列,通式为Y=y-m-y;其中,y为酶切位点,氨基酸组成包括但不限于:R精氨酸、K赖氨酸,可以为R或K或RR或KK或RK或KR,m为4-12个氨基酸形成的专属连接序列,氨基酸包括但不限于S丝氨酸、G甘氨酸、E谷氨酸、D天冬氨酸、T苏氨酸、R精氨酸、A丙氨酸的组合;优选的序列组成GSGSEEGSGS或GSGSDDGSGS或GSGSEDGSGS或GSGSDEGSGS或EEAE或DDAD或TEEAEKL或TDDADKL或TEDAEKL或TDEADKL或EGTEEAEKLG或EGTDDADKLG或EGTEEADKLG或EGTDDAEKLG或EGTEDADKLG或EGTDEAEKLG,序列号分别为Seq ID No.4-19;
[0020] Z为GLP-1或其类似物,氨基酸序列选自Seq ID No.20~Seq ID No.27中的任意一种:
[0021] HAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG(Seq ID No.20)、
[0022] HAEGTFTSDVSSYLEGQAAKEFIAWLVRGRG(Seq ID No.21)、
[0023] EGTFTSDVSSYLEGQAAKEFIAWLVRGRG(Seq ID No.22)、
[0024] HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPPS(Seq ID No.23)、
[0025] HAEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPPS(Seq ID No.24)、
[0026] HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPSKKKKKK(Seq ID No.25)、[0027] HGEGTFTSDVSSYLEGQAAKEFIAWLVKGR(Seq ID No.26)、
[0028] HGEGTFTSDVSSYLEEQAAKEFIAWLVKGGG(Seq ID No.27);
[0029] n为重复数,包括但不限于2至7的整数,优选为3、4或5。
[0030] 在一些具体
实施例中,本发明提供了一些具体的GLP-1或其类似物重组串联蛋白序列,氨基酸序列如SEQ ID NO.28-SEQ ID NO.111所示。
[0031] 本发明还提供了编码所述GLP-1或其类似物重组串联蛋白序列的基因。
[0032] 本发明还提供包含编码所述GLP-1或其类似物重组串联蛋白序列的基因的重组质粒。
[0033] 在另一优选例中,本发明所述的重组质粒包括本发明所述编码所述GLP-1或其类似物重组串联蛋白序列的基因,构成重组质粒的载体,优选的是pET系列载体。
[0034] 本发明还提供包含所述编码所述GLP-1或其类似物重组串联蛋白序列的基因或所述重组质粒的宿主细胞。在一些实施例中,所述宿主细胞为大肠杆菌,优选的是BL21(DE3)、HMS174(DE3)、pLysS或pLysE宿主菌。
[0035] 在发明的第二方面,提供了一种应用大肠杆菌表达制备GLP-1或其类似物的方法,是将是采用大肠杆菌表达本发明所述的GLP-1及或其类似物重组串联蛋白序列。
[0036] 在一种具体的实施例中,本发明所述的应用大肠杆菌表达制备GLP-1或其类似物的方法。
[0037] 在另一优选例中,所述表达载体转化大肠杆菌的方法,是本领域是公知的,优选电穿孔法、CaCL2转化法;所述筛选阳性克隆的方法,是本领域是公知的,优选抗性基因法;所述诱导宿主表达蛋白的方法,是本领域技术人员所公知的技术。优选浓度为0.lmM至10mM的IPTG,在25-37℃
温度下进行诱导,使得目的蛋白可以获得更高效的表达。
[0038] 在另一优选例中,所述的
破碎菌体的方法,优选高压匀浆、渗透压冲击、冻融、
超声波破碎。
[0039] 在另一优选例中,所述的获得包涵体的方法,优选离心法。
[0040] 本发明所述的GLP-1及或其类似物重组串联蛋白序列所形成的包涵体溶解性好,无需变性剂就可以完全溶解表达的包涵体,非常有利于后续的酶切和分离纯化。本发明提供一种优选的溶解包涵体的方法,优选25-250mM的Tris溶液,pH 8.5-11.5,12-15℃进行溶解2~6h。
[0041] 在另一优选例中,所述的获取粗品GLP-1或其类似物重组串联蛋白溶解液的方法,优选离心法、
超滤法。
[0042] 在另一优选例中,所述的获取粗品GLP-1或其类似物
单体的方法,优选胰蛋白酶和CPB酶双酶切法、Kex2酶和CPB酶双酶切法。
[0043] 在另一优选例中,所述胰蛋白酶(或Kex2酶)和CPB酶双酶切法,所用条件可以为这些酶切常用的条件,例如缓冲液可以为Tris溶液(25-250mM)或
磷酸盐缓冲液;pH 7.0-10.0,优选pH 8.0-9.0;温度15-30℃,优选25℃,两种酶均按照串联总蛋白
质量1/400-1/
800加入,优选1/500;酶切时间4-12h。酶切后目的蛋白的HPLC纯度不低于80%,非常有利于后续的蛋白纯化工艺。酶切收率不低于45%,是传统融合蛋白酶切收率的200%-300%。
[0044] 利用基因工程手段,设计新颖的GLP-1或其类似物的重组多肽串联序列设计的表达技术。该重组串联蛋白可以通过原核表达系统产生,通过酶切,获得高产量的GLP-1或其类似物,该产物可进行
侧链修饰,用于糖尿病和内分泌代谢相关
疾病的治疗。
[0045] 本发明通过是在串联表达的目的基因之间的酶切位点附近设计有效的连接序列,将融合蛋白替换成GLP-1或其类似物蛋白,形成串联表达,该连接序列能使酶切位点充分暴露、并且完全
切除连接序列和识别位点,从而显著提高目的产物酶切收率和纯度,使得酶切后的主要蛋白都是GLP-1或其类似物的目标蛋白,这样大大降低的无用的融合蛋白含量,可显著提高GLP-1或其类似物蛋白在整个表达肽链的比例,酶切后的理论收率接近70%,是一个有效提高GLP-1或其类似物蛋白表达收率的好方法。该路线产生的蛋白另一个优点是包涵体溶解性好。传统大肠杆菌表达的蛋白产物多以致密的包涵体形式,包涵体的溶解性往往较差,需要使用高浓度的尿素或
盐酸胍等变性剂来溶解,本串联表达设计的蛋白可以得到良好溶解性的包涵体,无需变性剂就可以完全溶解表达的包涵体,非常有利于后续的酶切和分离纯化。
附图说明
[0046] 图1.索马鲁肽前体重组3串联蛋白1工程菌(SEQ ID No.30)诱导表达
电泳图。其中:1为marker,2为诱导后工程菌,2为诱导前工程菌。
[0047] 图2.索马鲁肽前体重组3串联蛋白2工程菌(SEQ ID No.38)诱导表达电泳图。其中:1为诱导前工程菌,2为marker,3为诱导后工程菌。
[0048] 图3.索马鲁肽前体重组4串联蛋白1工程菌(SEQ ID No.92)诱导表达电泳图。其中:1为诱导前工程菌,2为marker,3为诱导后工程菌。
[0049] 图4.索马鲁肽前体重组4串联蛋白2工程菌(SEQ ID No.109)诱导表达电泳图。其中:1为marker,2为诱导前工程菌,3为诱导后工程菌。
[0050] 图5.索马鲁肽前体重组3串联蛋白1(SEQ ID No.30)经Kex2和CPB双酶切后HPLC检测图。索马鲁肽肽前体在RT6.349min出峰,纯度为85.06%。
[0051] 图6.索马鲁肽前体重组3串联蛋白2(SEQ ID No.38)经Kex2和CPB双酶切后HPLC检测图。索马鲁肽前体在RT6.323min出峰,纯度为86.27%。
[0052] 图7.索马鲁肽前体重组4串联蛋白1(SEQ ID No.92)经Kex2和CPB双酶切后HPLC检测图。索马鲁肽前体在RT6.334min出峰,纯度为85.33%。
[0053] 图8.索马鲁肽前体重组4串联蛋白2(SEQ ID No.109)经Kex2和CPB双酶切后HPLC检测图。索马鲁肽前体在RT6.261min出峰,纯度为83.89%。
[0054] 图9.索马鲁肽前体重组3串联蛋白1(SEQ ID No.30)经Kex2和CPB双酶切后质谱分析图。索马鲁肽分子量为3175,与理论一致。
[0055] 图10.索马鲁肽前体重组3串联蛋白2(SEQ ID No.38)经Kex2和CPB双酶切后质谱分析图。索马鲁肽分子量为3175,与理论一致。
[0056] 图11.索马鲁肽前体重组4串联蛋白1(SEQ ID No.92)经Kex2和CPB双酶切后质谱分析图。索马鲁肽分子量为3175,与理论一致。
[0057] 图12.索马鲁肽前体重组4串联蛋白2(SEQ ID No.109)经Kex2和CPB双酶切后质谱分析图。索马鲁肽分子量为3175,与理论一致。
具体实施方式
[0058] 下面结合实施例对本发明做进一步说明,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,凡在本发明的构思前提下对本发明制备方法的简单改进都属于本发明的保护范围之内。下面实施例未注明具体条件的实验方法,通常按照本领域的公知手段。
[0059] 材料:
[0060] 菌株和质粒:表达菌株BL21(DE3)、pLysS等购自MERCK,pET系列载体购自淼灵生物科技有限公司。
[0062] 实施例中涉及分子生物学操作所用的酶均购于购自TakaRa,相应的操作步骤完全按照相关的产品
说明书进行。
[0063] 实施例中所涉及的编码索马鲁肽重组串联蛋白的核苷酸序列的基因合成和测序工作由南京金斯瑞有限公司完成。
[0064] 其他未标明来源的原、辅料均为市售产品。
[0065] 实施例1:
[0066] 一、GLP-1类似物三串联蛋白的序列设计1
[0067] 为了增加GLP-1类似物前体肽在原核表达中的表达量,提高前体肽链在整个表达肽链的比例,按照上述的专利思路,将GLP-1类似物前体肽链进行了三串联设计(n=3),并且GLP-1类似物前体之间通过胰蛋白酶酶切位点或kex2酶酶切位点相连,为了使胰蛋白酶或kex2酶更好识别胰蛋白酶酶切位点或kex2酶酶切位点,提高酶切效率,我们在胰蛋白酶酶切位点或kex2酶酶切位点设计了关键辅助序列(m)。根据NCBI公布的GLP-1类似物(索马鲁肽前体序列(9-37)和利拉鲁肽前体序列(7-37)),在其N端前导肽MRLNSA,在GLP-1天然序列与前导肽之间及GLP-1天然序列彼此之间连入kex2酶酶切位点及辅助序列:GSGSEEGSGS或GSGSDDGSGS或GSGSEDGSGS或GSGSDEGSGS或EEAE或DDAD或TEEAEKL或TDDADKL或TEDAEKL或TDEADKL或EGTEEAEKLG或EGTDDADKLG或EGTEEADKLG或EGTDDAEKLG或EGTEDADKLG或EGTDEAEKLG,选择n=3。
[0068] 故所设计的GLP-1天然类似物(索马鲁肽前体序列(79-37)和利拉鲁肽前体序列(7-37))重组3串联蛋白的序列如表1所示:
[0069] 【表1】
[0070]
[0071]
[0072]
[0073]
[0074] 二、GLP-1类似物四串联蛋白的序列设计2
[0075] 按照上述专利设计思路,还对GLP-1类似物前体肽链进行了四串联设计(n=4),采用与三串联设计一致的连接序列。根据NCBI公布的GLP-1类似物(索马鲁肽前体序列(9-37)和利拉鲁肽前体序列(7-37)),在其N端前导肽MRLNSA,在GLP-1天然序列与前导肽之间及GLP-1天然序列彼此之间连入kex2酶酶切位点及辅助序列:GSGSEEGSGS或GSGSDDGSGS或GSGSEDGSGS或GSGSDEGSGS或EEAE或DDAD或TEEAEKL或TDDADKL或TEDAEKL或TDEADKL或EGTEEAEKLG或EGTDDADKLG或EGTEEADKLG或EGTDDAEKLG或EGTEDADKLG或EGTDEAEKLG,选择n=4。
[0076] 故所设计的GLP-1天然类似物(索马鲁肽前体序列(79-37)和利拉鲁肽前体序列(7-37))重组4串联蛋白的序列如表2所示:
[0077] 【表2】
[0078]
[0079]
[0080]
[0081]
[0082]
[0083] 实施例2:GLP-1类似物串联蛋白重组质粒的构建及工程菌的构建
[0084] 将上述设计的氨基酸序对应的核苷酸序列,分别按照大肠杆菌密码子进行优化,通过化学合成法进行密码子优化后的基因合成,分别通过BamHI和XhoI连入pET32a中,构建4种重组质粒。将上述重组质粒通过CaC12转化的方法导入到BL21(DE3)中,经过抗性筛选单克隆,构建多株索马鲁肽前体重组3和4串联蛋白工程菌。经测序,工程菌中的序列与设计一致。
[0085] 实施例3:GLP-1类似物串联蛋白的诱导表达
[0086] 3.1 LB培养基配方
[0087] 表3.LB培养基配方
[0088]
[0089] 按照表3配制11L LB培养基,溶解混匀后,吸取10ml、1.7L培养基分别装入50ml、3L的锥形瓶中,各配制6瓶,封口,灭菌(121℃,25min),待用。
[0090] 3.2工程菌复苏
[0091] 取出索马鲁肽前体重组3和4串联蛋白甘油菌一只,分别按照1%接种量接入6支10ml灭菌后培养基,在摇床37℃,250rpm的条件下过夜培养。
[0092] 3.3工程菌的诱导培养
[0093] 取出复苏菌液,分别按照1%接种量接入6只1.7L灭菌后培养基,在摇床37℃,250rpm的条件下培养,约7-8h,加入0.lmM的IPTG,在37℃温度下进行过夜诱导表达。
[0094] 3.4菌体离心
[0095] 菌液在4000rpm,8℃离心40min,弃去上清
收获菌体。通过SDS-PAGE观察菌体中目的蛋白的表达(部分串联蛋白的工程菌诱导表达电泳如图1-4)。
[0096] 实施例4:GLP-1类似物串联蛋白包涵体的收获与溶解
[0097] 4.1菌体重悬,破碎与离心
[0098] 按照1kg菌体加入10L体积的破菌缓冲液(5mmol/L EDTA,50mmol/LTris-HCl)悬浮菌体,充分搅匀至无
块状菌体,悬浮液即可进行高压匀浆破菌,破菌时采用的操作压力为850±50bar,连续破两次。破菌液在4000rpm,8℃离心40min,离心收集沉淀。
[0099] 4.2包涵体洗涤离心
[0100] 按照洗前包涵体重量,依据如下公式计算包涵体洗涤液终体积:包涵体洗涤液终体积(L)=包涵体重量(kg)×包涵体稀释倍数(10),然后按照每10L包涵体洗涤液加入0.5L1mol/LTris-HCl溶液配置缓冲液。在6000rpm,8℃离心30min,离心收集沉淀。
[0101] 4.3包涵体溶解
[0102] 按照每1g洗涤离心后的包涵体加入12~15ml Tris溶液(50mM),低温条件下(12-15℃)进行溶解,0.5h后使用NaOH溶液调节pH至11.5,再经过0.5h后第二次使用NaOH溶液调节pH至11.5,此后继续溶解2~6h。
[0103] 实施例5:GLP-1类似物串联蛋白前体的获得
[0104] 5.1包涵体溶解液超滤
[0105] 包涵体溶解结束后,使用离心机在10000g条件下离心1h去除去颗粒物。离心后的溶液用750K中空
纤维柱超滤,使用50mM Tris溶液进行洗滤,收集滤出液。
[0106] 5.2酶切
[0107] 用6M HCl将超滤后溶液pH调至8.5~9.0,按每500g滤后蛋白加入1g的Kex2酶和1g的CPB酶,加入Kex2酶和CPB酶进行酶切反应。缓慢搅拌酶切液控制酶切反应温度在20~25℃,酶切反应6~10h。取样进行HPLC和质谱检测(部分串联蛋白的结果如图6-8和图9-12),并计算酶切收率。
[0108] 结果如表4所示,显示Kex2和CPB双酶切后HPLC检测,主峰纯度范围为80-93%,收率范围为45%-60%。其中图示显示索马鲁肽前体HPLC检测出GLP-1或其类似物在RT6.3min出峰,纯度约为85%。质谱分析:索马鲁肽前体分子量约为3175,与理论一致。
[0109] 【表4】
[0110]
[0111]
[0112] 小结:通过此种串联设计,可以显著提高GLP-1或其类似物在整条表达条带中的占比,提高酶切效率至40%-60%之间,是融合蛋白设计方案酶切收率的200%-300%。在相同的发酵条件下,可以显著提高GLP-1或其类似物的目的蛋白产量。且酶切后主峰(GLP-1或其类似物)的纯度达到80-93%,非常利于后续纯化。