首页 / 专利库 / 生物学 / 真菌 / 多拷贝基因蛋白表达系统

多拷贝基因蛋白表达系统

阅读:889发布:2020-05-11

专利汇可以提供多拷贝基因蛋白表达系统专利检索,专利查询,专利分析的服务。并且本 发明 属于 生物 技术领域,尤其是属于重组蛋白表达领域。本发明聚焦于重组蛋白表达过程中普遍遇到的两个问题,低量的蛋白表达、和用于重组蛋白表达的细胞系的遗传不 稳定性 。本发明的基本原理是,将几个表达盒引入细胞中,所述表达盒全部编码相同的成熟目的重组蛋白,但所述表达盒具有不同的核苷酸序列。表达盒是指,至少包含启动子序列、起始密码子、编码旨在重组表达的蛋白(POI)的多核苷酸序列,终止密码子和终止子的多核苷酸序列。,下面是多拷贝基因蛋白表达系统专利的具体信息内容。

1.包含三个或更多个不同类型的表达盒的宿主细胞,每个表达盒编码具有相同成熟基酸序列的相同目的蛋白(POI),并且每个类型的表达盒至少包含启动子序列、POI编码序列的多核苷酸序列和终止子序列,
其中所述表达盒的不同之处在于它们包含
(A)
(Aa)不同的启动子序列,
(Ab)由于使用简并遗传密码,编码相同的成熟POI氨基酸序列的不同核苷酸序列,和任选地
(Ac)不同的终止子序列,和/或
(Ad)如果存在,不同的信号序列,
或其中所述表达盒的不同之处在于它们包含
(B)
(Ba)相同的启动子序列,
(Bb)由于使用简并遗传密码,编码相同的成熟POI氨基酸序列的不同核苷酸序列,和任选地
(Bc)不同的终止子序列,和/或
(Bd)如果存在,不同的信号序列。
2.根据权利要求1的宿主细胞,其中至少一个表达盒编码两个或更多个具有相同成熟氨基酸序列的POI,其中IRES序列分别位于所述两个或更多个POI的编码序列之间。
3.根据权利要求1或2任一项的宿主细胞,其中在权利要求1的可选项(A)的点(Ab)中,所述POI的编码序列的不同核苷酸序列由简并遗传密码编码,所述简并遗传密码导致的核苷酸序列差异是,为了获得所述特定POI的相同成熟氨基酸序列,就该特定的POI编码核苷酸序列而言可能的最大理论核苷酸序列差异的至少50%,
或其中在可选项(B)的点(Bb)中,所述POI的编码序列的不同核苷酸序列由简并遗传密码编码,所述简并遗传密码导致的核苷酸序列差异是,为了获得所述特定POI的相同成熟氨基酸序列,就该特定的POI编码核苷酸序列而言可能的最大理论核苷酸序列差异的至少
50%。
4.根据权利要求1至3任一项的宿主细胞,其中在可选项(A)中,所述启动子、所述终止子和/或如果存在的话所述信号序列,以及在可选项(B)中,所述终止子序列和/或如果存在的话所述信号序列,就其核苷酸序列而言,在所用的不同表达盒之间分别具有至少20%,优选至少30%,更优选至少40%,最优选至少50%的差异。
5.根据权利要求1至4任一项的宿主细胞,其中所述POI与所述宿主细胞是异源的。
6.根据权利要求1至5任一项的宿主细胞,其中所述POI编码序列的不同核苷酸序列具有至少30个,优选至少60个,更优选至少90个核苷酸的长度。
7.根据权利要求1至6任一项的宿主细胞,其中所述宿主细胞是
(i)真核细胞,优选选自
(a)丝状真菌细胞,优选曲霉、木霉或青霉;
(b)酵母细胞,优选巴斯德毕赤酵母、酿酒酵母、或解脂耶氏酵母,更优选巴斯德毕赤酵母;
(c)哺乳动物细胞,优选CHO(中国仓鼠卵巢)细胞;
(d)人细胞,优选HEK293细胞(HEK=人胚肾);
(e)昆虫细胞,优选sf5、sf21或High-Five细胞;

(ii)原核细胞,优选细菌细胞,更优选大肠杆菌。
8.产生权利要求1至7任一项中限定的宿主细胞的方法,包括用至少三个不同的核酸序列转染所述宿主细胞的步骤,其中每个核酸序列包含至少一个不同的编码所述POI的相同成熟氨基酸序列的表达盒。
9.产生权利要求1至7任一项中限定的宿主细胞的方法,包括用至少一个核酸序列转染所述宿主细胞的步骤,其中所述核酸序列包含至少三个不同类型的表达盒,并且每个所述表达盒编码所述POI的相同成熟氨基酸序列。
10.包含至少三个如权利要求1至6任一项中限定的表达盒的核酸。
11.包含至少三个如权利要求1至6任一项中限定的表达盒的载体。
12.包含至少三个核酸的试剂盒,其中所述核酸优选是载体,并且其中每个核酸包含至少一个权利要求1至6任一项中限定的表达盒。
13.包含权利要求10中限定的核酸或权利要求11中限定的载体的试剂盒。
14.用于制造POI的方法,包括使用权利要求1至7任一项中限定的宿主细胞、权利要求
10中限定的核酸、权利要求11中限定的载体或权利要求12或13中限定的试剂盒的步骤。
15.根据权利要求14的方法,其中所述POI是单链蛋白、或所述POI源自单链多肽的前体,例如,胰岛素。

说明书全文

多拷贝基因蛋白表达系统

发明概要

[0001] 本发明属于生物技术领域,尤其是属于重组蛋白表达领域。本发明聚焦于重组蛋白表达过程中普遍遇到的两个问题,低量的蛋白表达、和用于重组蛋白表达的细胞系的遗传不稳定性。本发明的基本原理是,将几个表达盒引入细胞中,所述表达盒全部编码相同的成熟目的重组蛋白,但所述表达盒具有不同的核苷酸序列。表达盒是指,至少包含启动子序列、起始密码子、编码旨在重组表达的蛋白(POI)的多核苷酸序列,终止密码子和终止子的多核苷酸序列。发明领域
[0002] 本发明属于生物技术领域,尤其是属于重组蛋白表达领域。此外,本发明涉及经修饰以表达更高产量的重组蛋白(目的蛋白,POI)的细胞、以及具有较小的遗传不稳定性倾向的修饰细胞,其中所述遗传不稳定性是由在所述修饰细胞中引入的遗传物质的重排而导致的。在另一方面,本发明涉及用于产生所述修饰细胞的载体、表达盒、以及产生所述修饰细胞的方法、和使用所述修饰细胞、所述载体和所述表达盒来制造重组蛋白的方法。

背景技术

[0003] 重组蛋白表达通常具有两个主要目的:第一,获得高品质的重组蛋白质,这意味着例如纯度、低含量的降解产物、在基酸序列和翻译后修饰上的均一性、可溶性、正确的三维折叠、以及与天然的野生型蛋白相比具有相同的生物活性。第二目的是,在短时间内获得大量的重组蛋白,以例如在生产过程中节约成本、时间和资源。
[0004] 本发明聚焦于重组蛋白表达过程中普遍遇到的两个问题,低蛋白表达量和用于重组蛋白表达的细胞系的遗传不稳定性。
[0005] 为了获得大量重组蛋白,通常不仅尝试将一个拷贝的所谓表达盒引入选择用于重组蛋白生产的细胞中,而且还尝试将几个拷贝的表达盒引入细胞中并随后选择那些具有最高数量表达盒的修饰宿主细胞,以表达最大量的目的蛋白(POI)。这个策略具有至少两个缺陷
[0006] 首先,越多拷贝的表达盒引入细胞中,越有可能的是,随着时间,这些表达盒的序列彼此重组(这是由于它们的序列相似性所致,这种相似性会促进重组)。结果是,修饰宿主细胞内的核苷酸序列重排将导致用于蛋白表达的修饰宿主细胞的基因组不稳定。这导致修饰细胞随着时间而较低的重组蛋白表达。在最坏的情况中,这些不合需要的重组过程会导致改变的POI序列,由此不仅降低重组蛋白表达率,而且还降低质量,因为重组蛋白产生了不同POI变体的混合物,例如,POI的截短或突变的形式,或具有重复结构域和区域的POI等。
[0007] 其次,通常认为高拷贝数量的表达盒不能保证POI的高表达率。表达盒的数量过高可能会导致修饰宿主细胞中蛋白表达所需的分子机制的一定过载或过度负荷,并且因此一旦修饰宿主细胞内的表达盒拷贝数超过某个阈值,POI的表达率就会下降。
[0008] 发明概述
[0009] 本发明的基本原理是,将几个表达盒引入细胞中,所述表达盒全部编码相同的成熟目的蛋白,但所述表达盒具有不同的核苷酸序列。本发明的主要优势之一是其普遍适用性,其不限于某些类型的细胞,而且可用于原核以及真核细胞中。
[0010] 例如,表达盒可以具有不同的启动子、不同的终止子、不同的信号序列等,而表达盒中的POI的编码序列可以是相同的,或者在不同表达盒中可以是不同的,然而,POI的氨基酸序列总是相同的。表达盒可以具有不同的核苷酸序列,通过利用简并遗传密码,编码具有相同氨基酸序列的相同POI。相同的氨基酸可以由多达6种不同的密码子编码,并且由此可以具有由非常不同的核苷酸序列编码的相同氨基酸序列。此外,当相同载体元件,如表达盒、选择标记、复制起点等,在一个载体内使用两次或在一个以上载体内使用时,则所述载体元件可以在载体序列内以不同方向使用。这进一步提高了载体序列的差异并且由此降低了包含这两个或更多个相同载体元件的转染宿主细胞内所述载体元件的重组可能性。这进一步提高了所述宿主细胞的遗传稳定性。
[0011] 此策略具有至少两个主要优点。一方面,表达盒现在具有非常不同的核苷酸序列并且因此它们不太可能彼此重组。这可以导致修饰细胞更稳定的基因组,这转而允许在修饰细胞内具有更高拷贝数量的表达盒。另一方面,修饰细胞的蛋白质合成机制不太可能由于高POI表达率而过负荷或过载,因为修饰细胞平行地使用:
[0012] -不同的启动子,其转而使用不同组的转录因子,这可以避免由于缺乏足量的某些转录因子而引起的潜在瓶颈
[0013] -不同的信号序列,导致平行地使用不同的POI-分泌机制,这可以避免分泌途径中的潜在瓶颈,
[0014] -不同的POI编码序列,其转而使用不同比例的tRNA用于POI-合成,这可以避免某些tRNA供应中的潜在瓶颈,
[0015] -不同的终止子序列,导致平行地使用不同的终止机制/终止因子,这可以避免终止途径中的潜在瓶颈。
[0016] 除了这两个方面,本发明还具有第三个优势。本领域技术人员不需要进行一系列实验来寻找在待修饰的宿主细胞中启动子和POI的哪种组合可以工作最佳,这是因为总是有一组不同类型的启动子在平行地被使用,即使在某些POI/宿主细胞组合中个别启动子性能不佳,这也不一定会对POI的整体表达率具有大的影响,因为同时使用的其他不同启动子可以补偿该非最佳启动子。这可以导致例如修饰宿主细胞较快的发展时间,适用于成本效益的、有效的POI重组表达。
[0017] 平行使用几个载体的概念,其中每个载体包含用于相同POI的单个不同表达盒,具有另外的优势:与使用在相同载体内包含几个不同表达盒的载体的概念相比,这更灵活。使用一组不同的单表达盒载体,本领域技术人员可以容易且快速地测试不同表达盒的各种组合,并且甚至可以容易地改变各表达盒的相对丰度,简单地以不同量(每个单表达盒载体的转染DNA的量)同时将不同载体转染至一个宿主细胞中。这允许调节各表达盒的拷贝数,以获得关于宿主细胞的遗传稳定性和/或关于POI表达率的最佳结果。当表达盒具有相同的启动子序列时,可以获得相似的优势。例如,表达盒具有相同的启动子序列、编码相同的成熟POI氨基酸序列的不同核苷酸序列、和任选的不同终止子序列和/或不同的信号序列(如果存在)。
[0018] 此外,由于不同的POI编码序列而导致的不同mRNA具有不同的核苷酸序列,因此可以具有不同的稳定性、半衰期和不同的二级结构(所述二级结构可能会或可能不会干扰mRNA有效翻译成POI)。因为同时存在其他更合适的mRNA版本并对不稳定或具有不利三维结构的mRNA进行补偿,这种机制避免了仅因为偶然某个特定版本的mRNA不稳定或具有不利的三维结构而导致的总体表达率较低。
[0019] 通常,转染到宿主细胞中的编码POI的核酸的拷贝越多,表达率越高。然而,重组蛋白表达领域的技术人员已知存在一定的阈值,这意味着达到一定的拷贝数,表达率不再增加,而是可能确实降低。通常可以根据经验为每个细胞或POI确定最佳拷贝数。使用本文公开的本发明蛋白表达策略,也可能观察到相同的效果。可以预期,以一定的阈值拷贝数增加本发明的各个表达盒的拷贝数后,蛋白表达率不再增加。还可以预期,增加编码相同POI氨基酸序列的不同表达盒的数量也具有一定的阈值数,进一步增加所述不同表达盒的数量不会进一步增加表达的POI的量。重组蛋白表达领域的技术人员知道如何凭经验确定特定类型的宿主细胞中用于特定POI的表达盒的最佳数量,例如简单地通过测量表达的POI的量并将其与同一宿主细胞中检测到的表达盒拷贝数进行比较。
[0020] 本发明的主要优点之一是其普遍适用性,与所用细胞的类型无关。本发明可用于所有类型的细胞,真核以及原核细胞。可以与例如哺乳动物细胞、酵母细胞、真菌细胞、细菌等一起使用。
[0021] 在现有技术中,这个概念是未知的。唯一的蛋白表达策略(远离本文所述的本发明方向)是,在同一宿主细胞中同时表达几种不同POI的概念,例如T细胞受体的α-和β-链(WO2016/073794)、抗体的轻链和重链(WO  03/018771),L-和H-蛋白(J.Microbiol.Biotechnol,2008,18:926-932)等。然而,现有技术中的这些概念在一些方面明显不同于本发明:
[0022] -主要目的不是获得遗传上更稳定的、具有更少不需要的重组的宿主细胞,并且该概念也并非是通过向宿主细胞中引入更多拷贝的编码相同POI的核酸来获得更高的表达率[0023] -如现有技术中所述,在一个宿主细胞中同时表达两个或更多个不同POI的唯一原因是获得从不同POI构建的蛋白复合物,其中这些POI在理想情况下甚至可以由宿主细胞组装成最终的蛋白复合物,如T细胞受体或抗体。
[0024] -现有技术的主要目的不是获得最大的POI表达,而是以正确的化学计量比表达不同的POI,以促进蛋白复合物的正确组装。由于这个原因,在现有技术中使用在同一载体内含有两个表达盒的载体,其中每个表达盒分别导致该多聚蛋白复合物的两条多肽链之一的表达,通常是由两个多肽链组成的抗体片段。通过将两个表达盒结合到同一载体中,以等摩尔量表达两个多肽链的问题更容易解决。
[0025] WO 2016/005931描述了一种使用双重、独立的顺反子表达系统来增加大肠杆菌中蛋白表达的方法,其中两个顺反子都位于一个载体内。该申请的主要目的是增加蛋白的表达,尤其是由两个多肽序列组成的抗体片段如Fab片段的表达。还公开了该双顺反子表达系统用于仅表达一种目的蛋白的用途。但是,这个概念在几个方面也与本发明不同:
[0026] -未公开使用多于两个的顺反子,且仅公开了使用含有这两个顺反子的一个载体。既没有公开使用两个以上的顺反子,也没有公开平行地替换使用多个载体,每个载体含有一个顺反子。
[0027] -使用两个顺反子的原因是为了同时表达一种蛋白复合物(如抗体)所需的两条分开的多肽链和增加重组蛋白的量。
[0028] -仅公开了细菌细胞中作为包涵体的蛋白表达。
[0029] 发明实施方案
[0030] 本发明提供以下方面、主题和优选实施方案,它们分别单独或组合地有助于解决本发明的目的:
[0031] 项(1):宿主细胞,其包含三个或更多个不同类型的表达盒,每个表达盒编码具有相同成熟氨基酸序列的相同目的蛋白(POI),并且每个类型的表达盒分别至少包含启动子序列、POI编码序列的多核苷酸序列和终止子序列,其中所述表达盒的不同之处在于它们包含
[0032] (a)不同的启动子序列,
[0033] 和任选地
[0034] (b)由于使用简并遗传密码,编码相同的成熟POI氨基酸序列的不同核苷酸序列,和/或
[0035] (c)不同的终止子序列,和/或
[0036] (d)不同的信号序列(如果存在),
[0037] 优选地,
[0038] 包含三个或更多个不同类型的表达盒的宿主细胞,每个表达盒编码具有相同成熟氨基酸序列的相同目的蛋白(POI),并且每个类型的表达盒至少包含启动子序列、POI编码序列的多核苷酸序列和终止子序列,其中所述表达盒的不同之处在于它们包含
[0039] (A)
[0040] (Aa)不同的启动子序列,
[0041] (Ab)由于使用简并遗传密码,编码相同的成熟POI氨基酸序列的不同核苷酸序列,[0042] 和任选地
[0043] (Ac)不同的终止子序列,和/或
[0044] (Ad)不同的信号序列(如果存在),
[0045] 或其中所述表达盒的不同之处在于它们包含
[0046] (B)
[0047] (Ba)相同的启动子序列,
[0048] (Bb)由于使用简并遗传密码,编码相同的成熟POI氨基酸序列的不同核苷酸序列,和任选地
[0049] (Bc)不同的终止子序列,和/或
[0050] (Bd)不同的信号序列(如果存在),
[0051] 项(2):根据项(1)的宿主细胞,其中与包含相同数量的具有相同启动子序列的表达盒的宿主细胞相比,所述宿主细胞表达更高量的所述POI,其中所述更高量的所述POI通过例如使用以下方法测量所述POI来确定:ELISA测量、通过光密度法测量Western印迹、光密度法测量考斯蓝或染色的SDS-PAGE凝胶、定量质谱法、或在从样品中色谱分离所述POI后定量所述POI峰下的面积。与包含相同数量的但具有相同启动子序列的表达盒的宿主细胞相比,所述POI的量增加至少5%,10%,20%,30%,40%,50%,60%,70%,80%,90%,100%,150%,200%,300%,400%或至少500%。所述POI的量增加至少50%,优选增加至少
30%,更优选增加至少20%,最优选增加至少10%。适用于测定POI表达量的方法描述于本文其他地方。
[0052] 项(3):根据项(1)或(2)的宿主细胞,其中与包含相同数量的但具有相同启动子序列的宿主细胞相比,所述宿主细胞的基因组更稳定,其中该遗传稳定性通过例如以下方法来确定:在至少100个宿主细胞世代后,确定宿主细胞内GOP的拷贝数(例如通过定量PCR),或确定使用GOP特异性PCR引物获得的PCR产物的正确长度,或进行宿主细胞的基因组测序。本文其他地方描述了适于确定宿主细胞基因组稳定性的方法。
[0053] 项(4):根据项(1)至(3)任一项的宿主细胞,其中在至少20、30、40、50、60、70、80、90、100、150、200、300、400或至少500个原核细胞的细胞世代后,或在至少20、30、40、50、60、
70、80、90、100、150、200、300、400或至少500个真核细胞的细胞世代后,通过确定所述宿主细胞中存在多少关于所述表达盒的遗传变异来测量遗传稳定性。在至少200个细胞世代后,优选在至少150个细胞世代后,更优选在至少100个细胞世代后,最优选在至少50个细胞世代后,测量原核细胞,特别是大肠杆菌细胞的遗传变异。在至少160个细胞世代后,优选在至少120个细胞世代后,更优选在至少80个细胞世代后,更优选在至少40个细胞世代后,测量酵母细胞,优选酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia 
pastoris)细胞,更优选巴斯德毕赤酵母细胞的遗传变异。在至少150个细胞世代后,优选在至少120个细胞世代后,更优选在至少90个细胞世代后,最优选在至少60个细胞世代后,测量哺乳动物细胞(如CHO细胞)的遗传变异。
[0054] 项(5):根据项(1)至(4)任一项的宿主细胞,其中所述遗传稳定性由影响至少5至20个,优选至少5至100个,更优选至少5至500个,最优选至少5至1500个核苷酸长度的核苷酸序列的宿主细胞基因组改变来表示。
[0055] 项(6):根据项(1)至(5)任一项的宿主细胞,其中所述启动子选自单向启动子、双向启动子、和/或(例如通过使用IRES序列)控制两个或更多个POI表达的启动子。
[0056] 项(7):根据项(1)至(6)任一项的宿主细胞,其中所述启动子序列具有至少10、15、20、30、40、50、100、150、200、250、300、400、500、600、700、800、900、1000、1200、1400、1600、
1800、2000、2500或至少3000个核苷酸的长度。对于原核细胞,所述启动子序列具有至少50个,优选至少20个,更优选至少15个,最优选至少10个核苷酸的长度。在酵母细胞的情况中,优选在巴斯德毕赤酵母或酿酒酵母的情况中,更优选在巴斯德毕赤酵母的情况中,所述启动子序列具有至少500个,优选至少300个,更优选至少200个,最优选至少100个核苷酸的长度。对于哺乳动物细胞,如CHO,所述启动子序列具有至少500个,优选至少300个,更优选至少200个,最优选至少100个核苷酸的长度。
[0057] 项(8):根据项(1)至(7)任一项的宿主细胞,其中所述启动子是组成型活性启动子,或其中所述启动子是诱导型启动子。
[0058] 项(9):根据项(1)至(7)任一项的宿主细胞,其中至少一个表达盒包含诱导型启动子,并且至少一个表达盒包含组成型活性启动子。
[0059] 项(10):根据项(1)至(9)任一项的宿主细胞,其中所述终止子序列以至少三个,优选至少两个,更优选至少一个拷贝存在,并且其中如果存在超过一个终止子序列,所述终止子序列是相同或不同的终止子序列。
[0060] 项(11):根据项(1)至(10)任一项的宿主细胞,其中所述信号序列包含分泌信号序列和/或胞内靶向序列,将POI靶向特定所需的区隔、细胞器或细胞位置,例如,在细菌细胞的情况中进入周质。
[0061] 项(12):根据项(1)至(11)任一项的宿主细胞,其中所述信号序列就其氨基酸序列而言是不同的信号序列,和/或其中所述信号序列具有相同的氨基酸序列但由不同的核苷酸序列编码。
[0062] 项(13):根据项(1)至(12)任一项的宿主细胞,其包含至少3、4、5、6、7、8、9、10、11、12、13、14或15个表达盒。
[0063] 项(14):根据项(1)至(13)任一项的宿主细胞,其中至少一个表达盒编码两个或更多个具有相同成熟氨基酸序列的POI,其中IRES序列或功能类似IRES序列的序列位于所述两个或更多个POI的编码序列之间。功能类似IRES序列的IRES序列替代物例如是2A、P2A、T2A和F2A序列(S.C.L.Ho等,PLOS,2013,Vol.8,Issue 5,e63247)。
[0064] 项(15):根据项(1)至(14)任一项的宿主细胞,其中应用项(1)的点(b),并且所述POI的编码序列的不同核苷酸序列由简并遗传密码编码,所述简并遗传密码导致的核苷酸序列差异是,为了获得所述特定POI的相同成熟氨基酸序列,就该特定的POI编码核苷酸序列而言可能的最大理论核苷酸序列差异的至少50%。
[0065] 项(16):根据项(1)至(14)任一项的宿主细胞,其中应用项(1)的点(b),并且所述POI的编码序列的不同核苷酸序列由简并遗传密码编码,所述简并遗传密码导致的核苷酸序列差异是,为了获得所述特定POI的相同成熟氨基酸序列,就该特定的POI编码核苷酸序列而言可能的最大理论核苷酸序列差异的至少5%,10%,20%,30%,40%,50%,60%,70%,80%,至少90%或100%。
[0066] 项(17):根据项(1)至(16)任一项的宿主细胞,其中所述启动子、所述终止子和/或所述信号序列(如果存在),关于其核苷酸序列,相差至少20%,优选至少30%,更优选至少40%,最优选至少50%。
[0067] 项(18):根据项(1)至(17)任一项的宿主细胞,其中所述启动子序列关于其核苷酸序列相差至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75,至少80%,和/或其中所述终止子序列关于其核苷酸序列相差至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75,至少80%,和/或其中所述信号序列,如果存在,关于其核苷酸序列相差至少5、10、15、
20、25、30、35、40、45、50、55、60、65、70、75,至少80%。
[0068] 项(19):根据项(1)至(18)任一项的宿主细胞,其中所述POI与所述宿主细胞是异源的。
[0069] 项(20):根据项(1)至(19)任一项的宿主细胞,其中应用项(1)的点(b),并且所述POI的编码序列的不同核苷酸序列具有至少30个,优选至少60个,更优选至少90个核苷酸的长度。
[0070] 项(21):根据项(1)至(19)任一项的宿主细胞,其中应用项(1)的点(b),并且所述POI的编码序列的不同核苷酸序列具有至少30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、750、1000、1500个,至少2000个核苷酸的长度。该核苷酸序列优选具有至少180个,优选至少120个,更优选至少60个,最优选至少30个核苷酸的序列长度。
[0071] 项(22):根据项(1)至(21)任一项的宿主细胞,其中所述宿主细胞是
[0072] (i)真核细胞,优选选自
[0073] (a)丝状真菌细胞,优选曲霉属(Aspergillus)、木霉属(Trichoderma)或青霉属(Penicillium),
[0074] (b)酵母细胞,优选巴斯德毕赤酵母、酿酒酵母、或解脂耶氏酵母(Y.lipolytica),更优选巴斯德毕赤酵母,
[0075] (c)哺乳动物细胞,优选CHO(中国仓鼠卵巢)细胞;
[0076] (d)人细胞,优选HEK293细胞(HEK=人胚肾),
[0077] (e)昆虫细胞,优选sf5、sf21或High Five细胞(sf=草地贪夜蛾,Spondoptera frugiperda),或
[0078] (ii)原核细胞,优选细菌细胞,更优选大肠杆菌细胞。
[0079] 项(23):根据项(22)的宿主细胞,其中所述宿主细胞是CHO细胞、巴斯德毕赤酵母或大肠杆菌,优选所述宿主细胞是CHO细胞或巴斯德毕赤酵母。
[0080] 项(24):根据项(22)或(23)的宿主细胞,其中所述宿主细胞是CHO细胞。
[0081] 项(25):根据项(22)或(23)的宿主细胞,其中所述宿主细胞是巴斯德毕赤酵母细胞。
[0082] 项(26):根据项(22)至(23)的宿主细胞,其中所述宿主细胞是大肠杆菌细胞。
[0083] 项(27):产生项(1)至(26)任一项中限定的宿主细胞的方法,包括用至少三个不同的核酸序列转染所述宿主细胞的步骤,其中每个核酸序列包含至少一个不同的编码相同的所述POI的成熟氨基酸序列的表达盒。
[0084] 项(28):根据项(27)的方法,其中用至少2、3、4、5、6、7、8、9或至少10个不同的核酸序列,例如,不同的载体,转染所述宿主细胞。用至少6个,优选用至少4个,更优选用至少3个,最优选用至少2个不同的核酸来进行所述转染。
[0085] 项(29):产生项(1)至(26)任一项中限定的宿主细胞的方法,包括用至少一个核酸序列转染所述宿主细胞的步骤,其中所述核酸序列包含至少三个不同的表达盒,且每个所述表达盒编码相同的所述POI的成熟氨基酸序列。
[0086] 项(30):根据项(29)的方法,其中用核酸序列转染所述宿主细胞,其中所述核酸序列包含至少2、3、4、5、6、7、8、9或至少10个不同的表达盒。所述核酸包含至少6个,优选至少5个,更优选至少4个,最优选至少3个表达盒。
[0087] 项(31):包含至少三个如项(1)至(21)任一项中限定的表达盒的核酸。
[0088] 项(32):包含至少2、3、4、5、6、7、8、9或至少10个如项(1)至(21)任一项中限定的表达盒的核酸。所述核酸包含至少6个,优选至少5个,更优选至少4个,最优选至少3个表达盒。
[0089] 项(33):包含至少三个如项(1)至(21)任一项中限定的表达盒的载体。
[0090] 项(34):根据项(33)的载体,进一步包含抗生素选择标记或代谢或营养缺陷选择标记。
[0091] 项(35):根据项(34)的载体,其中在细菌细胞的情况下,所述抗生素选择标记优选是对氨苄青霉素、卡那霉素、吉欧霉素(zeocin)、遗传霉素(G418)、新霉素、草甘膦、嘌呤霉素、潮霉素B、腐草霉素、杀稻瘟菌素、霉酚酸等的抗性。
[0092] 项(36):根据项(34)的载体,其中在CHO细胞的情况下,所述代谢选择标记优选是二氢叶酸还原酶(DHFR)、谷氨酰胺合成酶(GS)、叶酸受体(folR)等。
[0093] 项(37):根据项(34)的载体,其中在酵母细胞的情况下,所述代谢选择标记优选是LEU2、HIS3、URA3、ADE、5-FOA(5-氟乳清酸)等(Brachmann等,1998,Yeast,14:115-132),和/或优选,所述抗生素选择标记是吉欧霉素(zeocin)、G418(遗传霉素)、腐草霉素、潮霉素B、嘌呤霉素、杀稻瘟菌素、霉酚酸等。
[0094] 项(38):包含至少3、4、5、6、7、8、9或至少10个具有不同启动子的表达盒的载体,其中所述表达盒缺少目的基因,并且任选在该缺少的目的基因的位置插入一个克隆位点或多克隆位点。所述载体包含至少6个,优选至少5个,更优选至少4个,最优选至少3个表达盒。
[0095] 项(39):包含至少三个核酸的试剂盒,其中所述核酸优选是载体,并且其中每个核酸包含至少一个如项(27)至(32)任一项中限定的表达盒。
[0096] 项(40):根据项(39)的试剂盒,其中所述试剂盒包含至少3、4、5、6、7、8、9,或至少10个核酸。
[0097] 项(41):根据项(39)或(40)的试剂盒,其中所述核酸是载体。
[0098] 项(42):包含项(31)或(32)中限定的核酸、或项(33)至(38)任一项中限定的载体的试剂盒。
[0099] 项(43):根据项(42)的试剂盒,其中所述核酸包含至少3、、4、5、6、7、8、9,或至少10个表达盒。
[0100] 项(44):根据项(41)或(42)的试剂盒,其中所述核酸是载体。
[0101] 项(45):根据项(39)至(44)任一项的试剂盒,其中所述一个载体或所述多个载体是根据项(33)至(38)任一项的载体。
[0102] 项(46):根据项(39)至(45)任一项的试剂盒,进一步包含纸件、电子手册或其他形式的说明书,该说明书解释如何使用所述试剂盒。
[0103] 项(47):通过使用项(1)至(26)任一项中限定的宿主细胞、项(31)或(32)中限定的核酸、项(33)至(38)任一项中限定的载体,或项(39)至(46)任一项中限定的试剂盒来制造POI的方法。
[0104] 项(48):根据项(47)的方法,其中所述POI是单链蛋白、或源自单链多肽的前体,例如,胰岛素。
[0105] 项(49):根据项(48)的方法,其中所述单链蛋白是如下蛋白
[0106] a)在自然界中作为单链蛋白存在的蛋白;
[0107] b)在自然界中作为包含至少两条多肽链的蛋白存在的蛋白,但是该蛋白在自然界中源于单链前体蛋白质,例如胰岛素(胰岛素的前体是单链,最终加工的胰岛素包括由二硫桥连接的两条链);
[0108] c)由不同蛋白组成的融合蛋白;
[0109] d)由相同蛋白的部分组成的融合蛋白;
[0110] e)由不同蛋白的部分组成的融合蛋白;或
[0111] f)在自然界作为包含至少两条多肽链的蛋白存在的蛋白,但是该蛋白通过使用分子生物学技术以产生单链蛋白的方式制造(例如单链抗体)。
[0112] 用于本发明中的定义和术语:
[0113] 在本申请的段落前给出的标题旨在导读申请文本,但并不意味着并且不应被理解为以任何方式限制本发明的范围。
[0114] 在此使用的术语“和/或”包括“和”、“或”和“由所述术语连接的要素的所有或任何其他组合”的含义。例如,A、B和/或C是指A、B、C、A+B、A+C、B+C和A+B+C。
[0115] “宿主细胞”是指用于表达重组蛋白的细胞。宿主细胞可以是任何类型的细胞,如细菌细胞、酵母细胞、真菌细胞、哺乳动物细胞、人细胞、细胞系(如癌细胞)或经过实验修饰而导致永生化细胞(=无限次数分裂的细胞,与癌细胞相同)的细胞,等等。
[0116] “表达盒”是指至少包含启动子序列、起始密码子、编码待重组表达的蛋白(POI)的多核苷酸序列、终止密码子和终止子的多核苷酸序列。表达盒可包含另外的调控序列和其他序列,如增强子、信号序列、增强子、内含子、IRES序列等。包含三个或更多个不同表达盒的宿主细胞可以是已被三个或更多个载体转染的宿主细胞,每个载体包含不同的表达盒。所得的宿主细胞可以包含以质粒形式存在于其胞质溶胶中的所述载体,或者可具有已经整合到其基因组中的所述表达盒和任选的所述载体的其他部分。也可以是,一些转染的载体被整合(部分或完全)到所述宿主细胞的基因组中,而其他所述转染的载体作为质粒存在于所述宿主细胞的胞质溶胶中。可替换地,所述宿主也可以已经转染了在所述一个载体内包含至少三个不同表达盒的至少一个载体、或转染了包含单个表达盒的载体的混合物并且同时转染了包含两个或更多个不同表达盒的载体。
[0117] GOI(意指GOI的表达盒)或载体(意指包含GOI的至少一个表达盒的载体)的“转染”可导致转染的宿主细胞(或转化的宿主细胞,其是相同的),其中所述宿主细胞已将所述GOI或所述载体整合到其染色体中(如果所述细胞仅具有一条染色体),或所述宿主细胞已将所述GOI或所述载体整合到其若干或所有染色体中(如果所述宿主细胞具有一条以上的染色体)。所述GOI或载体可以一次或几次地整合到所述染色体中,优选地它几次整合到染色体中。优选,它整合在同一宿主细胞的超过一条的染色体中。如果载体整合到染色体中,则整合到所述染色体中的可以是所述载体的完整序列或仅部分序列,但是至少存在于所述载体中的所述GOI的表达盒被整合到所述染色体中。可替换地,所述载体可以不整合到所述宿主细胞的染色体中,而是可以存在于染色体外所述宿主细胞的胞质溶胶内,例如以环状双链脱多核苷酸的形式。如果所述宿主细胞是真核细胞,更优选如果所述宿主细胞是哺乳动物或酵母或真菌细胞,最优选所述宿主细胞是CHO细胞或巴斯德毕赤酵母细胞,则优选所述GOI或所述载体整合到所述宿主细胞的染色体中。如果所述宿主细胞是原核细胞,优选细菌细胞,更优选大肠杆菌细胞,则所述载体优选不整合到所述宿主细胞的染色体中,而是位于所述宿主细胞的胞质溶胶中。
[0118] 如果表达盒包含两个或更多个编码待重组表达的蛋白(POI)的多核苷酸序列,并且所述两个或更多个多核苷酸序列由于所述表达盒内的单个启动子多核苷酸的功能而表达,则所述表达盒仍被视为一个表达盒。例如,这种表达盒可以例如从使用IRES序列或从使用双向启动子来产生。双向启动子是导致两个编码序列表达的启动子,其中一个编码序列位于启动子的5′,而一个位于启动子的3′。
[0119] 根据本发明使用的载体的其他部分,所述部分不是POI表达所直接需要的,例如复制起点(ori)、抗生素抗性基因或代谢选择标记等,不被视为表达盒的一部分。然而,载体的这些部分中的某些或全部在不同的载体中也可以是不同的。例如,如果根据本发明使用几个单独的载体,则这些载体中的每一个可以含有不同的抗生素抗性基因或不同的代谢选择标记或不同的复制起点(ori)等。可替换地,抗生素抗性基因和/或代谢选择标记等可以是相同的蛋白,但是由于简并遗传密码,载体内编码所述蛋白的核酸序列可不同,但仍编码相同的抗生素抗性蛋白质或代谢选择标记蛋白。
[0120] “编码”:如果结合适当的调控序列,如启动子、起始密码子、终止密码子和终止子等,一个多核苷酸或序列可以导致包含至少10个,至少20个,至少30个,至少50个或至少100个通过肽键连接的氨基酸的蛋白或多肽或肽的表达,则该多核苷酸或序列“编码”。
[0121] “编码序列”或“编码区”是指多核苷酸中编码成熟氨基酸序列的氨基酸序列的那些部分。“成熟氨基酸序列”在下面几段解释。
[0122] “开放阅读框”是指多核苷酸中编码氨基酸序列的那些部分,无论这些氨基酸序列是否存在于最终成熟氨基酸序列中,或者这些氨基酸序列是否在POI加工过程中被去除,例如信号肽的氨基酸序列——为了获得“成熟氨基酸序列”,该序列从POI中去除。
[0123] “目的蛋白”,也缩写为POI,是包含至少10个,至少20个,至少30个,至少50个,至少100个,至少150个,至少200个,至少250个通过肽键连接的氨基酸的蛋白、多肽或肽,该POI旨在通过使用宿主细胞进行重组表达。POI由“目的基因”(GOI)编码。POI的氨基酸序列被认为是“成熟氨基酸序列”。
[0124] POI可以是自然界中存在的蛋白、多肽或肽,也可以是自然界中不存在的蛋白、多肽或肽,例如自然界中存在的两种肽、多肽、蛋白、蛋白结构域等的融合蛋白,而该融合蛋白在自然界中不存在。例如,POI可以是与His标签融合的、或者是与用于标记或纯化融合蛋白的其他肽融合的自然界中存在的蛋白;或者可以是包含自然界中存在的两个或多个蛋白的结构域的融合蛋白,所述结构域通常在自然界中不存在于一个蛋白、多肽或肽中;或者可以是已被“人源化”的非人序列,例如人源化抗体等。人源化抗体是例如鼠抗体,其恒定氨基酸序列部分已被人抗体相应的氨基酸序列部分取代。因此,成熟氨基酸序列通常是指旨在由设计或进行实验以获得POI的人制造的最终氨基酸序列。
[0125] 因此,POI的成熟氨基酸序列可以是:
[0126] -自然界中存在的蛋白的序列;
[0127] -蛋白序列的片段或结构域,该片段或结构域在自然界中不存在;
[0128] -蛋白序列的突变体,该突变体在自然界中不存在;
[0129] -融合蛋白,例如通过添加用于检测或纯化该融合蛋白的肽而获得的融合蛋白;
[0130] -融合蛋白,例如由两种或更多种不同蛋白的蛋白结构域构建的融合蛋白;
[0131] -融合蛋白,例如由相对于其天然排列而言已发生重排的蛋白结构域构建的融合蛋白;
[0132] -由人完全从头设计的蛋白质;
[0133] -等等。
[0134] “成熟氨基酸序列”是指,例如,一个蛋白质在经历了就其氨基酸序列而言相应的非重组蛋白、多肽或肽的完整加工步骤后的氨基酸序列。例如,分泌信号序列已被除去,例如蛋白的前-形式或前-原-形式已被转化为最终蛋白、多肽或肽序列,或氨基酸序列内的内部序列在加工过程中已除去。例如,在胰岛素的情况下,这意味着:前-原-胰岛素:信号序列的去除=原-胰岛素;原-胰岛素:内部C肽的去除=胰岛素=在这种情况下的成熟氨基酸序列。
[0135] “成熟重组蛋白”是指包含如上定义的成熟氨基酸序列的重组蛋白。内含子通常不编码成熟蛋白、多肽或肽的一部分。
[0136] “加工序列”是指为了获得成熟的氨基酸序列而从蛋白、多肽或肽中去除的氨基酸序列,如分泌信号序列、用于胞内蛋白靶向的信号序列、前-原-序列、原-序列等。
[0137] POI的序列可以包含加工序列或可以部分或完全缺乏加工序列。所述加工序列常常存在于自然界中存在的蛋白(原始蛋白、天然蛋白)中,并且常常是正确加工原始蛋白所需要的,或者是在胞内或胞外正确位置正确物理定位原始蛋白所需要的,或者是原始蛋白转运需要的,等等。跨膜序列通常在蛋白、多肽或肽的加工过程中不会除去,因此通常不将其视为加工序列。如果POI仅通过使用所述跨膜序列来瞬时定位在细胞膜上,并且所述跨膜序列在POI加工过程中将从POI的其余部分中除去以获得POI,则仅在此时将跨膜序列视为加工序列。
[0138] 启动子或启动子序列是指多核苷酸的区域,其启动基因的转录,或在本发明的情况下,其启动编码POI的核苷酸序列的转录。启动子可以是“诱导型启动子”或“组成型启动子”。IRES序列和功能类似IRES序列的序列不被视为启动子或启动子序列。“诱导型启动子”是指可以通过存在或不存在某些诱导因子来诱导的启动子,而“组成型启动子”是指不受调控的启动子,其在任何时候都具有活性,且与特定诱导因子的存在无关,其允许与其相关的一个或多个基因的连续转录。任选地,当例如两个或更多个基因被IRES序列隔开,则启动子可以启动这两个或更多个基因的转录。任选地,当所述启动子是例如双向启动子,则启动子可以启动两个基因的转录。
[0139] “简并遗传密码”是指某种氨基酸有一个以上的核苷酸密码子。例如,氨基酸半胱氨酸可以由以下两个不同的密码子编码:TGC或TGT,氨基酸精氨酸可以由以下6个密码子编码:CGG、CGA、CGC、CGT、AGG、AGA等。因此,相同的氨基酸序列可以由不同的核苷酸序列编码。仅改变各单个密码子,但不改变这些密码子编码的氨基酸。除少数例外,几乎所有生物体的简并遗传密码都是相同的。例如,人线粒体具有不同的遗传密码。在本专利申请中,“简并遗传密码”总是意指旨在用于表达POI的特定细胞或特定细胞器(如线粒体)的遗传密码。
[0140] “终止子”的含义与“转录终止子”相同。根据本发明,终止子是一段核酸序列,其标志着编码POI所需的核酸序列的结束。通常,所述终止子就位于GOI的终止密码子的下游。在原核生物中,终止包括Rho非依赖性以及Rho依赖性转录终止。根据本发明使用的原核终止序列优选是Rho非依赖性终止序列,如T7和rrnB终止序列。Rho非依赖性终止也称为固有终止。优选在一个表达盒中使用一个或两个终止序列。两个组合的终止顺序可提高终止效率。如果使用IRES序列,则优选在POI的两个编码序列之间放置超过一个的终止序列。哺乳动物终止序列例如是SB40-、hGH-、BGH-或rbGlob-终止序列。
[0141] “信号序列”是指通常指引蛋白、多肽或肽分泌至胞外区域所需要的氨基酸序列,并且所述信号序列通常通过蛋白解从成熟氨基酸序列上去除。还有将蛋白、多肽或肽指引至细胞的某些细胞器的信号序列。细菌细胞也使用信号序列,例如将POI指引至周质中的信号序列。信号序列通常位于氨基酸序列的N-末端,但是也可以存在于C-末端或可以存在于多肽序列内部。
[0142] “IRES”序列,也称为“内部核糖体进入位点”序列,是mRNA内的核苷酸序列,其允许在mRNA序列内进行翻译启动,而不依赖于用于启动翻译的mRNA的5′端。因此,IRES序列允许从一个mRNA表达两个或更多个POI。具有与IRES序列相同的主要功能的IRES序列替代物是例如2A、P2A、T2A和F2A序列。
[0143] “异源”蛋白、多肽、肽序列是指,由核苷酸序列编码的氨基酸序列并非天然存在于宿主细胞中。如果宿主细胞中天然存在的氨基酸序列被突变(例如点突变、插入、缺失、融合等),则所得的突变序列也被视为是异源序列。
[0144] “异源”多核苷酸或核苷酸序列是指,所述多核苷酸或核苷酸序列不天然存在于宿主细胞中。如果宿主细胞中天然存在的多核苷酸或核苷酸序列通过交换单核苷酸而被修饰,使得所述多核苷酸或核苷酸序列仍编码相同的氨基酸序列,则这种修饰的多核苷酸或核苷酸序列被认为是异源的。
[0145] 术语“序列差异”以及诸如“区别”、“不同”、“差异”之类的术语,在与氨基酸序列或核酸序列组合被提及时,旨在例如按如下方式确定:
[0146] 在本发明中,述及例如“不同的启动子序列”或编码(相同的)成熟POI氨基酸序列的不同核苷酸序列。因此,为了确定所述序列是否是“不同的”,各个相应的序列(氨基酸序列或核苷酸序列)就其序列同一性进行比较。例如,比较启动子序列或编码成熟POI氨基酸序列的核苷酸序列。
[0147] 当就序列同一性比较两个或更多个序列,所述比较仅在某个位置存在确切相同的核苷酸或氨基酸时认为核苷酸或氨基酸是相同的。尤其是对于氨基酸序列比较,必须清楚地区分序列同一性和序列同源性。在本专利申请中,在序列比较的内容中,除非明确指出相反的含义,否则总是指序列同一性,而不是序列同源性。同源性是指,例如,序列内某个位置的氨基酸不相同,而仅在其化学和/或生物学和/或物理特性方面相似。通常被视为同源物的此类氨基酸的实例为:
[0148] -带正电荷的氨基酸:精氨酸、组氨酸、赖氨酸,或
[0149] -带负电荷的氨基酸:天冬氨酸、谷氨酸,或
[0150] -极性、不带电荷氨基酸:丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺,或
[0151] -芳香族氨基酸:苯丙氨酸、酪氨酸、色氨酸,或
[0152] -脂肪族氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸,或
[0153] -含硫氨基酸:半胱氨酸、甲硫氨酸,或
[0154] -杂环仲α-氨基酸:脯氨酸
[0155] 例如,可以使用各种方法、软件算法来确定序列比对或序列差异。例如,可以使用美国国立卫生研究院(NIH)的网络服务https://blast.ncbi.nlm.nih.gov/Blast.cgi或使用欧洲生物信息学研究所(EMBL-EBI)的网络服务http://www.ebi.ac.uk/Tools/psa/来进行此类确定。“序列同一性”或“同一性%”是指,使用标准化算法比对的两个蛋白、多肽、肽、氨基酸或核苷酸序列之间残基匹配的百分比。这样的算法可以以标准化且可再现的方式在所比较的序列中插入空位,以优化两个序列之间的比对,从而实现两个序列的更有意义的比较。由于算法和软件设置不同,使用不同的软件/算法对两个相同序列进行的比对或序列比较可能不会得出完全相同的结果。因此,必须给出软件和软件设置,以清楚地定义结果是如何获得的。
[0156] 出于本发明的目的,使用NCBI BLAST程序版本2.6.0(2017年1月10日),BLAST=基本局部比对搜索工具,(Altschul等,Nucleic,Nucleic Acids Res.(1997)25:3389-3402),确定两个序列之间的序列同一性。作为参考序列,始终使用两个待比较的启动子序列中较短的一个。例如,如果序列长度100个核苷酸的某个启动子X短与相同的启动子X长(X长是与X短相同的启动子,但为所述启动子X短的200个核苷酸的更长版本)比对/比较,则两个序列X短和X长的比较给出结果如下:如果较短的序列X短作为参考序列,并且与该序列的较长版本即X长相比,则X短与X长100%相同。然而,如果较长的序列X长作为参照序列,并且与X短进行比较,则X长与X短仅为50%相同。因此,在本专利申请中,序列X短和序列X长的比较将始终被认为是100%相同而不是50%相同,因为在本申请中总是使用待比较启动子序列中较短的一个作为参考序列。
[0157] 例如,可以使用blastp确定两个氨基酸序列的序列同一性,并设置为以下缺省算法参数:“最大目的序列”=100,“短查询”=“自动调整为针对短输入序列的参数”,“期望阈值”=10,“词大小”=6,“查询范围内的最大匹配”=0,“矩阵”=BLOSUM62,“空位成本”=“存在:11延伸:1”,“组成调整”=“条件组成分数矩阵调整”,滤器和掩蔽:“低复杂度区域”,“仅用于查找表的掩蔽”,“掩蔽小写字母”,全部三个滤器均已停用。
[0158] 例如,可以使用blastn确定两个核苷酸序列的序列同一性,并设置为以下缺省算法参数:“最大目的序列”=100,“短查询”“自动调整为针对短输入序列的参数”,“期望阈值”=10,“词大小”=28,“查询范围内的最大匹配”=0,“匹配/不匹配分数”=1,-2,“空位成本”=“线性”,滤器和掩蔽:“低复杂度区域”,“仅用于查找表的掩蔽”,两个滤器均已激活。
[0159] 如果提及核苷酸序列的核苷酸,则缩写A、T、G、C和U代表不同的核苷酸。每当提及T或U作为核苷酸时,T和U可以相互交换,除非从实验或科学的度讲这没有意义。术语核苷酸序列、多核苷酸等在本申请中使用时,总是指DNA和/或RNA、或脱氧核酸和/或脱氧核糖核酸,只要这在实验或科学角度上是有意义的。
[0160] 简并遗传密码的使用允许具有几个不同的核苷酸序列,所有这些均编码相同的氨基酸序列。编码相同成熟蛋白的两个核苷酸序列之间的差异量取决于所述成熟蛋白的氨基酸序列。非常简化的,所有氨基酸均由三个核苷酸编码,并且大多数氨基酸的密码子的最后一个核苷酸可在嘌呤(G)、胞嘧啶(C)、腺嘌呤(A)和胸苷(T)之间变化。因此,大多数氨基酸具有四个不同的密码子,每个密码子都编码相同的氨基酸。因此,例如100个氨基酸长度的成熟多肽可以由300个核苷酸编码,并且每第三个核苷酸可以被突变而不改变氨基酸序列。因此,在此简化模型中,由于简并密码,可以改变总共300个核苷酸中的100个核苷酸,而没有改变相应的氨基酸序列。该简化模型导致最大理论核苷酸序列差异为33.3%。如果期望获得最大理论核苷酸序列差异的50%,则这100个核苷酸中的50%,即50个核苷酸可以交换为其他核苷酸,导致核苷酸序列差异为16.65%。
[0161] 实际上,这种计算有点更为困难。例如,可以如下计算以下肽序列的最大核苷酸序列:
[0162] 表1:
[0163]
[0164] 丝氨酸(Ser)由TCT、TCA、TCC、TCG、AGT、AGC编码
[0165] 因此Ser的密码子可以在位置1、2和3上变化=xxx
[0166] 亮氨酸(Leu)由CTT、CTA、CTC、CTG、TTA、TTG编码
[0167] 因此Leu的密码子可以在位置1和3上变化=xTx
[0168] 精氨酸(Arg)由CGT、CGA、CGC、CGG、AGA、AGG编码
[0169] 因此,Arg的密码子可以在位置1和3上变化=xTx
[0170] 因此,对于样品肽Pep1的核苷酸序列,在30个核苷酸位置中有24个可以被至少一个不同的核苷酸交换而不改变氨基酸序列。最大核苷酸序列差异为24/30=0.8,这意味着最大核苷酸序列差异为80%。
[0171] 如果对肽Pep2采用相同计算,则结果如下:蛋氨酸和色氨酸各自只有一个密码子,这意味着在不改变编码的氨基酸的情况下,没有核苷酸可以交换。所有其他氨基酸具有两个、三个或四个不同的密码子,但是所有密码子的第一个和第二个核苷酸固定,而只有第三个核苷酸可以变化。结果,对于Pep2的核苷酸序列,30个核苷酸中只有7个可以在不改变编码的氨基酸序列的情况下进行交换。因此,最大的不同核苷酸序列为7/30=0.23,这意味着最大核苷酸序列差异为23%。
[0172] 因此,不改变氨基酸序列的核苷酸序列的最大变化很大程度上取决于POI的氨基酸序列。例如,如果期望核苷酸差异应是为了仍然获得相同的成熟氨基酸序列而可能的最大核苷酸序列差异的50%,则Pep 1的这个50%值将为80%的50%=40%,而Pep2的该50%值为23%的50%=11.5%。
[0173] 例如当期望50%的可能最大核苷酸序列差异时,使用该策略,技术人员可以针对任何POI容易地计算出可能的自成熟核酸序列的变化%,以获得相同的成熟POI氨基酸序列。
[0174] 根据本发明的“遗传稳定性”或可替换地也称为“基因组稳定性”是指,属于宿主细胞基因组的核酸序列不会随时间,例如在所述宿主细胞的一定数量的细胞世代或细胞分裂中,“显著改变”。这样的改变可以例如由非常相似或相同的核苷酸序列的同源重组事件引起。例如,如果表达盒的几个相同拷贝已经整合到宿主细胞的基因组中,则随后这些相同核苷酸序列彼此重组的可能性会增加。这种重组事件例如可以导致所述表达盒的部分或完全缺失、重复或倍增。还可能发生所述表达盒的重排,它们在染色体内的位置的改变、或它们在染色体中的取向的改变。
[0175] 就遗传稳定性而言,“显著改变”是指宿主细胞基因组的较大重排,如宿主细胞基因组内的核苷酸序列的缺失、重复、扩增、重排、重新定位、部分缺失、部分重复、部分扩增、部分重排、部分重新定位等。这样的遗传不稳定性可优选影响引入宿主细胞基因组中以便通过所述宿主细胞表达POI的表达盒的核苷酸序列。宿主细胞基因组的显著改变可以影响至少5至20个,优选至少5至100个,更优选至少5至500个,最优选至少5至1500个核苷酸长度的核苷酸序列。
[0176] 例如表达盒的有限数量的点突变仅被认为是宿主细胞基因组的微小变化。这种有限数量的点突变在自然界中是常见的,并且通常可以随时间,尤其是在细胞分裂和细胞衰老期间,在任何细胞中发生。这样有限数量的点突变不被认为是受损的遗传稳定性,也不被认为是显著改变的核酸序列。
[0177] 根据本发明的宿主细胞的基因组被认为是,在引入编码POI的表达盒之前,宿主细胞中存在的染色体、线粒体染色体和染色体外质粒。根据本发明,诸如mRNA、tRNA、rRNA等的核酸不被认为属于所述宿主细胞的基因组。
[0178] 并非所有类型的属于基因组的此类核酸都存在于所有类型的宿主细胞中。例如,细菌宿主细胞通常不含线粒体染色体。
[0179] 根据本发明的“细胞世代”是指,一个细胞世代是特定宿主细胞的数目的倍增。根据宿主细胞的类型,一个细胞世代可以仅花费几分钟,例如在细菌宿主细胞的情况下,或者可以花费数小时甚至几天,例如在哺乳动物细胞的情况下。
[0180] 根据本发明的“单链蛋白”包括,仅包含一条单氨基酸链的蛋白。在翻译后加工过程中从单链前体修饰产生的、由几条氨基酸链组成并最终通过二硫桥连接的蛋白质,例如人胰岛素,仍被视为根据本发明的单链蛋白。在翻译后加工后包含两条或更多条氨基酸链的此类单链蛋白,可以通过分析所述单链蛋白的编码核苷酸序列的开放阅读框,容易地鉴定。开放阅读框是核苷酸序列内不含终止密码子(在脱氧核糖核酸的情况下通常为TAA、TAG或TGA,在核糖核酸的情况下通常为UAA、UAG或UGA)的连续一段密码子。开放阅读框可以编码单条多肽链,其随后在所述多肽链的加工过程中可以被加工成包含两条或更多条多肽链的蛋白。根据本发明,这种蛋白仍被认为是单链蛋白。
[0181] 根据本发明的“载体”优选是环状、双链脱氧多核苷酸,其可以被线性化,例如通过用限制性核酸内切酶消化来进行线性化,所述限制性内切酶仅识别所述载体的核苷酸序列内的一个位点。载体可以使用本领域已知的技术通过分子生物学技术制造,或者可以化学或酶促合成。
[0182] 根据本发明的“抗性基因”或“抗性标记”是指编码如下蛋白的基因,所述蛋白可以赋予宿主细胞对毒性物质(优选抗生素)的活性具有抗性。
[0183] 根据本发明的“代谢标记”通常是指编码如下蛋白的基因,所述蛋白为宿主细胞提供合成某种代谢产物(例如,某种氨基酸)的能,所述代谢产物是宿主细胞生长或存活所需的。
[0184] 根据本发明的“选择标记”通常是抗性基因、代谢标记或营养缺陷标记,但也可以例如是允许识别携带所述基因的宿主细胞的基因,例如编码有色蛋白的基因,或编码可以产生或代谢有色底物的酶的基因,或编码可以在代谢底物时发射光的酶(诸如萤光素酶)的基因等。
[0185] 根据本发明的试剂盒是一组适于例如表达重组蛋白或POI的材料。试剂盒通常可以包含以下材料,如宿主细胞、蛋白表达载体、适于检测所述蛋白表达载体的部分的PCR引物、适于使所述宿主细胞生长的培养基、适于将载体转染至宿主细胞中的化学物质和缓冲液、进行PCR反应的酶、将环状载体切割成线性载体的酶、解释如何使用该试剂盒或该试剂盒适用于什么目的的说明手册等。
[0186] “细胞的衍生物”或细胞系的衍生物,或“宿主细胞的衍生物”或“宿主细胞系的衍生物”是源自细胞或宿主细胞的细胞,其中所述细胞或宿主细胞已经以一定方式进行了操纵,例如,以含有或缺少某些抗性基因、含有或缺少某些代谢基因、含有或缺少某些可以将所述细胞或宿主细胞与其相应的未修饰细胞或宿主细胞区分开的基因。通常,细胞或宿主细胞的衍生物在遗传上与其起源的相应细胞或宿主细胞(其母细胞)几乎相同,但是仅在一个或很少的基因(如上述的基因类型)上有所不同。
[0187] 发明详述
[0188] 根据本发明的宿主细胞原则上可以是任何类型的细胞,如细胞系或原代细胞,或者甚至是不同类型细胞的混合物,或组织样品、器官或整个多细胞生物体。优选,细胞是原核或真核细胞系。
[0189] 如果根据本发明使用原核细胞,则所述细胞优选是细菌,如大肠杆菌,如BL21、BL21(DE3)、W3110、MG1655、RB791、RV308,或巨大芽孢杆菌(Bacillus megaterium),如QM B1551、PV361、DSM319,或假单胞菌(Pseudomonas),如绿假单胞菌(P.aeruginosa)、恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens)、产假单胞菌(P.alcaligenes)、铜绿假单胞菌PAO1-LAC、恶臭假单胞菌KT2440,或链霉菌(Streptomyces),如天蓝色链霉菌(S.coelicolor)A3、除虫链霉菌(S.avermitilis)、灰色链霉菌(S.griseus)、疮痂链霉菌(S.scabies)、浅青紫链霉菌(S.lividans)TK24、浅青紫链霉菌1326。大肠杆菌的实例包括衍生自大肠杆菌K12株的那些,具体而言,HMS 174、HMS174(DE3)、NM533、XL1-Blue、C600、DH1、HB101、JM109,以及衍生自B株的那些,尤其是BL-21、BL21(DE3)等。通常,衍生物(如修饰的原核细胞,如细菌)也适用于本发明。这样的修饰例如可以是蛋白酶的缺失或失活,或其他基因的缺失或失活。
[0190] 如果根据本发明使用真核细胞,则所述细胞优选是酵母细胞、丝状真菌细胞、昆虫细胞、哺乳动物细胞或人细胞。
[0191] 酵母细胞优选是甲基营养型酵母(=可以利用甲醇作为能量源的酵母细胞),例如Komagataella pastoris=巴斯德毕赤酵母、甲醇毕赤酵母(P.methanolica)、H.polymorpa、O.minuta、C.biodinii,或非甲基营养型酵母,如酿酒酵母、乳酸克鲁维酵母(Kluyveromyces lactis)、树干毕赤酵母(P.Stipitis)、解脂耶氏酵母(Yarrowia 
lipolytica)、Z.rouxii、Z.bailii、A.adeninivorans、马克斯克鲁维酵母(Kluyveromyces marxianus)、粟酒裂殖酵母(Schizosaccharomyces pombe)和Arxula adeninivorans。本发明中有用的巴斯德毕赤酵母菌株的实例是X33及其亚型GS115、KM71、KM71H;、CBS7435(mut+)及其亚型CBS7435muts、CBS7435mutsdeltaArg、CBS7435mutsdeltaHis、
s s
CBS7435mutdeltaArg,deltaHis、CBS7435mut PDI+、CBS 704(=NRRL Y-1603=DSMZ 
70382),CBS 2612(=NRRL Y-7556)、CBS 9172-9189和DSMZ 70877、PPS-9010(可从ATUM,先前为DNA2.0,Newark,CA,USA获得)和PPS-9016(可从ATUM,先前为DNA2.0,Newark,CA,USA获得)及其突变体。通常,此类酵母细胞的衍生物,例如,修饰的酵母细胞,也适用于本发明。这样的修饰例如可以是酵母蛋白酶的缺失或失活,或者是其他基因(例如ssn6-样基因)的缺失或失活(详情参见WO2016139279A1)或从酵母基因组中缺失所谓的杀伤者质粒(killer plasmid),尤其是从巴斯德毕赤酵母或酿酒酵母基因组中缺失(Sturmberger等,J 
Biotechnol.,2016,235:121-131)。
[0192] 丝状真菌细胞优选是曲霉(Aspergillus),如黑曲霉(A.niger)、米曲霉(A.oryzae)、土曲霉(A.terreus)、泡盛曲霉(A.awamori)、构巢曲霉(A.nidulans),或木霉(Trichoderma),如里氏木霉(T.reesei)、里氏木霉QM9414、里氏木霉RUT-C30、里氏木霉QM6a、深绿木霉(T.atroviride)、哈茨木霉(T.harzianum)、粘绿木霉(T.virens)、棘孢木霉(T.asperellum)、长枝木霉(T.longibrachiatum),或青霉(Penicillium),如产紫青霉(P.purpurogenum)、绳状青霉(P.funiculosum)、埃默森青霉(篮状菌)(Penicillium
(Talaromyces)emersonii)、沙柏干酪青霉(P.camemberti)和娄地青霉(P.roqueforti),及其衍生物。
[0193] 昆虫细胞优选是Sf9或Sf21细胞(均来自草地贪夜蛾)、High-Five细胞(与Hi5相同,与High-Five BTI-TN-5B1-4相同)或Tn-368细胞(均来自粉纹夜蛾(Trichoplusia ni)),或Se301细胞(来自甜菜夜蛾(Spondoptera exigua)),及其衍生物。
[0194] 哺乳动物细胞优选是CHO(中国仓鼠卵巢=CHO)细胞,如CHO-K1、CHO-DXB11、CHO-S、CHO-DG44,及其衍生物。
[0195] 人细胞优选是HEK293(人胚肾=HEK)细胞,如HT-1080、PER.C6、HKB-11、CAP和HuH-7,及其衍生物。
[0196] 细胞和细胞系可从多种来源获得,如组织培养物保藏中心,如美国典型培养物保藏中心(ATCC),10801University Boulevard,Manassas,VA 20110,USA,德国微生物菌种保藏中心(DSMZ),Inhoffenstraβe 7B,38124Braunschweig,德国,荷兰微生物保藏中心(CBS),Uppsalalaan 8,3584CT Utrecht(Utrecht),尼德兰,大肠杆菌遗传资源中心(CGSC),730 Kline Biology Tower,Dept.of Molecular,Cellular,and Developmental Biology,266Whitney Ave.,PO box 208103,耶鲁大学,纽黑文,CT 06520-8103,USA,或来自商业供应商,如Merck KGaA,Frankfurter Straβe 250,64293达姆施塔特,德国,GE Healthcare,Chalfont St Giles,Buckinghamshire,英国,Thermo Fischer Scientiffic,
168Third Avenue,Waltham,MA USA 02451,等。
[0197] 表2:宿主细胞和适用于所述细胞的启动子
[0198]
[0199]
[0200]
[0201]
[0202]
[0203] *取决于所用的启动子,某些细胞类型需要特定的蛋白或因子存在于所述细胞中,以使所述启动子能够起作用,例如在T7启动子的情况下,T7-RNA聚合酶,该酶不存在于所有类型的细胞中,但是如果需要可以将其转染到所述细胞中。
[0204] **为了使LLP启动子起作用,需要将ssn6-基因失活或删除(有关详细信息,请参阅WO2016139279A1)
[0205] 表3:
[0206] 宿主细胞和适用于所述细胞的信号序列
[0207]
[0208]
[0209]
[0210] *并非在所有情况下,POI的原始信号肽都将在某种类型的细胞中起作用,但是,如果细胞足够相似,则通常天然信号序列将起作用。
[0211] 表4:宿主细胞和适用于所述细胞的终止序列
[0212]
[0213]
[0214] 分子生物学技术,如克隆、转染、确定转染的表达盒的拷贝数、载体的设计和化学合成、载体元件(如复制起点、抗生素抗性、选择标记、启动子、信号序列、终止子等)的使用和选择、细胞培养技术、蛋白表达技术包括例如用于杆状病毒系统的病毒技术等、蛋白表达的定量和半定量测定等,都是标准实验室方法,并且是技术人员已知的。可以从标准教科书和实验室手册中获得方案,例如从M.R.Green,J.Sambrook,2013,Molecular cloning:a laboratory manual(分子克隆:实验室手册),Cold Spring Harbor,N.Y.;Current Protocols in Protein Science(蛋白科学中的通用实验方案),John Wiley&Sons 
Inc.ISSN 1934-3655;Current Protocols in Molecular Biology(分子生物学中的通用实验方案),John Wiley&Sons Inc.ISSN1934-3639;Advanced Technologies for Protein Complex Production and Characterization(蛋白复合物生产和表征的高级技术),编辑M.Cristina Vega,Springer,2016,ISSN 0065-2598;Bacculovirus and Insect Cell Expression protocols(杆状病毒和昆虫细胞表达实验方案),第三版,编辑David 
W.Murhammer,Humana Press,2016,ISSN 1064-3745;Recombinant Gene Expression,Reviews and Protocol(重组基因表达,综述和实验方案),第三版,编辑A.Lorence,Humana Press,ISSN 1064-3745等。
[0215] 测量POI的宿主细胞表达
[0216] 已知许多标准测试系统可以用于确定与包含相同数目表达盒但具有相同表达盒序列的宿主细胞相比,用根据本发明的不同表达盒转染的宿主细胞是否表达更高量的所述POI,如ELISA(酶联免疫吸附测定)、ELIspot测定(酶联免疫斑点测定)、表面等离振子共振测定(Biacore Life Science,现为GE Healthcare)、蛋白芯片测定、定量反转录酶PCR(qRT-PCR)、Western印迹的密度(desitometric)测量、考马斯蓝或银染色SDS-PAGE凝胶、定量质谱分析、POI样品色谱的相应POI峰下的峰面积计算,等。实施所述方法的合适方案是技术人员已知的,并且可以例如在M.R.Green,J.Sambrook,2013,Molecular cloning:a laboratory manual(分子克隆:实验室手册),Cold Spring Harbor,N.Y.,或在Current Protocols in Protein Science(蛋白科学中的通用实验方案),John Wiley&Sons Inc.ISSN 1934-3655中找到。
[0217] 遗传稳定性的测量
[0218] 例如,可以通过确定本发明的宿主细胞中根据本发明的不同表达盒的拷贝数,并与本领域已知的宿主细胞中相同表达盒的拷贝数相比,来测量遗传稳定性。例如,表达盒的拷贝数可以通过定量PCR(qPCR)确定。可以设计qPCR引物,使其扩增表达盒的全部或一部分。如果表达盒的拷贝数在一些细胞世代后发生变化,则证明基因组不稳定。此外,可以通过例如琼脂糖凝胶电泳确定qPCR产物的序列长度。如果表达产物发生部分的缺失或重复,则qPCR产物的序列长度会相应改变,这也表明基因组不稳定。确定表达盒拷贝数的其他方法是例如Southern印迹或荧光原位杂交(FISH)。实施所述方法的合适方案是技术人员已知的,并且可以例如在M.R.Green,J.Sambrook,2013,Molecular cloning:a laboratory manual(分子克隆:实验室手册),Cold Spring Harbor,N.Y.,或在Current Protocols in Protein Science(蛋白科学中的通用实验方案),John Wiley&Sons Inc.ISSN 1934-3655中找到。
[0219] 附图简述
[0220] 图1:用于转染酵母细胞(巴斯德毕赤酵母)的载体的载体图谱,其中载体包含用于POI的1、2、3或4个表达盒,并且在一个载体内对于每个POI表达盒,启动子序列、信号序列、GOI序列(不同的编码序列,但是由于简并遗传密码,其总是导致与POI相同的氨基酸序列;GOI称为变体1至变体4,缩写为var1至var4)和终止子序列,总是使用不同的序列。每个酵母载体都包含吉欧霉素抗生素抗性表达盒作为载体骨架,所述表达盒包含在酵母以及在大肠杆菌中工作的杂合启动子(pILV5与pEM72结合),然后是吉欧霉素抗生素抗性的编码序列(ZeoR),然后是醇氧化酶终止子(AODTT),然后是pUC复制起点(pUC ori)。仅在Y392_1xGOI的情况下,pUC ori之后是凝集素样蛋白终止子序列(LLPTT)。
[0221] 图1A:
[0222] 除载体骨架外,酵母载体Y391_1xGOI还含有以下用于GOI的表达盒,该表达盒在这种情况下是单链抗体(scFV):
[0223] -凝集素样蛋白启动子(pLLP)、作为目的基因(GOI)的单链抗体(scFv_var4)、醇脱氢酶终止子序列(ADHTT)
[0224] 图1B:
[0225] 除载体骨架外,酵母载体Y393_2xGOI还含有以下用于GOI的表达盒,在两种情况下,它们均编码相同单链抗体(scFV)氨基酸序列:
[0226] -甘油-3-磷酸脱氢酶启动子(pGAP)、交配因子α2信号序列(MFa2SS),作为目的基因的相同单链抗体的变异1(scFv_var 1)、凝集素样蛋白终止子序列(LLPTT)
[0227] -凝集素样蛋白启动子(pLLP)、作为目的基因的相同单链抗体的变异2(scFv_var 4)、醇脱氢酶终止子序列(ADHTT)
[0228] 图1C:
[0229] 除载体骨架外,酵母载体Y394_3xGOI还含有以下用于GOI的表达盒,在所有三种情况下,它们均编码相同单链抗体(scFV)氨基酸序列:
[0230] -醇脱氢酶启动子(pADH)、人血清白蛋白信号序列(HSASS)、单链抗体变体2(scFv_var2)、细胞色素c1终止子序列(cyc1TT)
[0231] -甘油醛-3-磷酸脱氢酶启动子(pGAP)、交配因子α2信号序列(MFa2SS),单链抗体变体1(scFv_var 1)、凝集素样蛋白终止子序列(LLPTT)
[0232] -凝集素样蛋白启动子(pLLP)、凝集素样蛋白信号序列(LLPSS)、单链抗体变体4(scFv_var 4)、醇脱氢酶终止子序列(ADHTT)
[0233] 图1D:
[0234] 除载体骨架外,酵母载体Y395_4xGOI还含有以下用于GOI的表达盒,在所有四种情况下,它们均编码相同单链抗体(scFV)氨基酸序列:
[0235] -醇脱氢酶启动子(pADH)、人血清白蛋白信号序列(HSASS)、单链抗体变体2(scFv_var2)、细胞色素c1终止子序列(cyc1TT)
[0236] -甘油醛-3-磷酸脱氢酶启动子(pGAP)、交配因子α2信号序列(MFa2SS),单链抗体变体1(scFv_var1)、凝集素样蛋白终止子序列(LLPTT)
[0237] -凝集素样蛋白启动子(pLLP)、凝集素样蛋白信号序列(LLPSS)、单链抗体变体4(scFv_var4)、醇脱氢酶终止子序列(ADHTT)
[0238] -反式延伸因子-启动子(pTEF)、交配因子α4信号序列(MFa4SS)、单链抗体变体3(scFv_var3)、醇氧化酶终止子序列(AOXTT)
[0239] 图2:
[0240] 来自图1的表达载体的序列。
[0241] A)酵母载体Y391_1xGOI(SEQ-ID NO.:1)
[0242] B)酵母载体Y393_2xGOI(SEQ-ID NO.:2)
[0243] C)酵母载体Y394_3xGOI(SEQ-ID NO.:3)
[0244] D)酵母载体Y395_4xGOI(SEQ-ID NO.:4)
[0245] 图3:
[0246] 用于转染哺乳动物细胞(CHO细胞)的载体的载体图谱,每个载体包含单个表达盒,其中所述表达盒包含作为GOI的融合蛋白的序列,所述融合蛋白由与TNF受体2的配体结合结构域融合的抗体恒定区组成。每个载体还包含代谢选择标记二氢叶酸还原酶(DHFR),该酶例如使CHO(中国仓鼠卵巢)细胞在缺乏胸苷的细胞培养基中生长,从而允许从未转染的细胞中选择已转染了含DHFR载体的CHO(或其他细胞)。此外,每个载体包含新霉素抗性基因(NeoR)的序列,其允许通过使用抗生素新霉素来选择转化的细胞。此外,每个载体包含选自氨苄青霉素抗性(AmpR)、spectromycin抗性(SpectR)和氯霉素抗性(CmR)的另一抗生素抗性基因。每个载体在用于GOI的表达盒内包含不同的启动子、不同的信号序列和不同的终止子序列。
[0247] 图3A描绘了载体pNT-MG001。载体元件的详细内容显示于表7中。
[0248] 图3B描绘了载体pNT-MG002。载体元件的详细内容显示于表7中。
[0249] 图3C描绘了载体pNT-MG003。载体元件的详细内容显示于表7中。
[0250] 图3D描绘了载体pNT-MG004。载体元件的详细内容显示于表7中。
[0251] 图4:
[0252] 来自图3的表达载体的序列。
[0253] A)哺乳动物载体pNT-MG001(SEQ-ID NO.:5)
[0254] B)哺乳动物载体pNT-MG002(SEQ-ID NO.:6)
[0255] C)哺乳动物载体pNT-MG003(SEQ-ID NO.:7)
[0256] D)哺乳动物载体pNT-MG004(SEQ-ID NO.:8)
[0257] 实施例和方法:
[0258] 用于毕赤酵母细胞的方法
[0259] 酵母载体的产生:
[0260] 该组载体包含一个具有一个表达盒的载体、一个具有两个不同表达盒的载体,一个具有三个不同表达盒的载体,和一个具有四个不同表达盒的载体。在该载体组中,四个不同表达盒的每个具有不同的GOI核苷酸序列,但所得POI具有相同的成熟氨基酸序列,并且四个不同表达盒的每个各包含不同的启动子核苷酸序列、不同的信号序列和不同的终止子核苷酸序列。图1A至1D显示了这些载体的载体图谱,而图2A至2D和SEQ-ID-NO.1、2、3和4显示了这些载体的完整核苷酸序列。
[0261] 通过使用简并遗传密码设计了POI的四个不同核苷酸序列。POI是单链抗体(scFV,ESBA1845=scFv=单链可变片段=包含单多肽链的人工抗体片段,所述单肽链包括其抗原结合结构域)。使用了所述scFv的4种不同变体,称为scFv_var1、scFv_var2、scFv_var3和scFv_var4,它们均编码相同的氨基酸序列,但是由于使用了简并遗传密码而具有不同的核苷酸序列。使用的启动子序列是来自巴斯德毕赤酵母(pLLP)的凝集素样蛋白启动子、GAP启动子(pGAP)、ADH启动子(pADH)和TEF启动子(pTEF)。用于POI的分泌信号序列是来自巴斯德毕赤氏酵母的凝集素样蛋白的信号序列(LLPSS)、来自酿酒酵母的交配因子α-4的信号序列(MFa4SS)、人血清白蛋白的信号序列(HSASS)和酿酒酵母的交配因子α-2的信号序列(MFa2SS)。终止序列是醇脱氢酶(ADHTT)、来自巴斯德毕赤酵母的凝集素样蛋白的终止序列(LLPTT)、细胞色素c1终止子的终止序列(cyc1TT)、和醇氧化酶的终止序列(AOXTT)。所有载体中使用的酵母细胞选择标记是吉欧霉素-r,通过使用ILV5-启动子、EM72信号序列和AOD终止子来表达。将pUC ori用于所有酵母表达载体中。
[0262] 载体的产生
[0263] 设计了如图1A至1D的载体图谱中所绘的四种不同的表达载体,其具有如图2A至2D以及SEQ ID NO:1、2、3和4所示的载体序列。所有载体均使用来自(ATUM,纽瓦克,加利福尼亚,USA)的DNA2.0(现为ATUM)合成服务,通过化学合成。
[0264] 毕赤酵母的转染
[0265] 将四种不同的载体单独转染到巴斯德毕赤酵母酵母细胞SSS1中。该酵母细胞描述于专利申请WO2016139279A1中,并且在遗传上与巴斯德毕赤酵母CBS 7435相同,并且与NRRL Y-11430相同,除了ssn6-样基因在巴斯德毕赤酵母CBS 7435基因组染色体1的807,480位由于插入表达盒而被破坏,如WO 2016/139270A1中所述的。CBS 7435的完整序列公开于Journal of Biotechnology,2011年,Vol.154,第312-320页。核苷酸序列在GenBank中以下列登录号公开:染色体1:FR839628.1;染色体2:FR839629.1;染色体3:FR839630.1;染色体4:FR839631.1;线粒体:FR839632.1。
[0266] 48深孔平板中的POI表达,POI的半定量测量
[0267] 将转染物划线,并在合成培养基中培养转化的单克隆。70小时后,从培养物中移出细胞培养上清液,通过离心自上清液中去除酵母细胞和细胞碎片,将10μl上清液上样并在SDS-PAGE(Novex NuPage 4-12%,Invitrogen)凝胶上进行电泳分离。SDS-PAGE凝胶用考马斯蓝染色后或在银染后,通过凝胶中蛋白带的扫描和光密度测量,半定量确定scFv(ESBA1845)的蛋白带(具有分子量约26kDa)。信号强度给出了scFv蛋白表达率的估计值。
[0268] 根据制造商的建议,通过应用自动化毛细管电泳仪(LabChip GXII-Touch,Perkin Elmer,沃尔瑟姆,MA,USA)确定上清液中POI的浓度。
[0269] 表5:通过Lab-on-a-chip,Perkin Elmer测量的POI表达
[0270]
[0271] 摇瓶中巴斯德毕赤酵母中的POI表达,遗传稳定性的测定
[0272] 将巴斯德毕赤酵母单克隆在摇瓶中培养4周。需要时,用培养基稀释细胞培养物以确保细胞生长。在此4周培养之前和之后,例如通过定量PCR(qPCR),确定表达盒的拷贝数。任选地或另外地,根据本领域已知的方法,通过测序确定表达盒的序列,并通过琼脂糖凝胶电泳确定PCR扩增的核酸的正确大小。进行这些实验是为了确定克隆的遗传稳定性。
[0273] 用于CHO细胞的方法
[0274] 载体的产生
[0275] 设计了四个不同的CHO表达载体,每个编码相同的POI。使用了两个不同核苷酸序列编码相同POI氨基酸序列(Etanercept var1和Etanercept var2)。四个不同的载体各自包含仅一个编码相同POI的表达盒、一个用于新霉素的表达盒(抗生素选择标记)、用于另一抗生素抗性的表达盒、和一个用于DHFR的表达盒(CHO细胞系生长所需的代谢选择标记)。在四个不同载体的每一个中,GOI、新霉素选择标记和DHFR使用不同的启动子和终止子,这意味着在载体内使用了多个不同的启动子和终止子。新霉素选择标记和DHFR的核苷酸序列在所有四个载体中都相同。所有载体都是使用来自(Geneart AG,雷根斯堡,德国,现在属于Life Technologies)GeneArt的合成服务通过化学合成的。关于不同载体的载体元件的详细内容可以在表6中找到,载体图谱在图3A至3D中示出,并且序列在图4A至4D以及SEQ ID NO:5、6、7和8中示出。
[0276] 这些CHO载体每次包含仅一个这样的表达盒,该表达盒在四个载体的每一个中都不同。详细地,每个表达盒使用不同的启动子、不同的信号序列和不同的终止子。POI始终相同。此外,每个载体包含用于代谢选择标记DHFR的表达盒(每次由相同的核苷酸序列编码)、用于抗生素选择标记新霉素R(NeoR)的表达盒(每次由相同的核苷酸序列编码)、和编码另一抗生素选择标记的表达盒,该另一抗生素选择标记可以是不同的选择标记,即氨苄青霉素抗性(AmpR)、spectromycin抗性(SpectR)或氯霉素抗性(CmR),或者该选择标记是相同的选择标记但以不同的方向插入载体中,例如在这种情况下,氨苄青霉素抗性标记在载体pNT-MG001和pNT-MG004中采取两个不同的方向。此外,所有4个载体均包含噬菌体f1序列作为载体骨架、复制起点pBR322或p16A,其中pBR322在这些载体中也以两种不同的方向使用。下表6给出了哺乳动物载体的不同载体元件的概述。
[0277]
[0278] 载体pNT-MG001至pNT-MG004的核苷酸序列在图4A至D中以及在序列表SEQ ID NO.5、6、7和8中给出。从表6和图3A至D可以看出,pNT-MG001至pNT-MG003都含有Etanercept var2(=版本2)的序列作为POI,而pNT-MG004含有Etanercept,var1(=版本1)。var1和var2均是密码子优化的核苷酸序列,均编码相同的氨基酸序列,但密码子使用略有不同。var1和var2的核苷酸序列具有90%以上的同一性(通过本文其他地方所述的方法确定),并且差异仅由var1和var2使用两种不同的密码子优化算法引起。图4和序列表中仅给出了var2的核苷酸序列(用于载体pNT-MG001至pNT-MG003中)。对于本发明的原理和进行所描述的实验,不需要知道var1核苷酸序列,只要清楚var1和var2两者都编码完全相同的氨基酸序列即可。
[0279] 表7显示了所使用的表达载体Y391_1xGOI、Y393_2xGOI、Y394_3xGOI、Y394_4xGOI、pNT-MG001、pNT-MG002、pNT-MG003和pNT-MG004的所有特征。
[0280] 表7:
[0281] 所用的表达载体的特征
[0282]
[0283]
[0284]
[0285]
[0286] SS=信号序列,TT=终止子,var1=变体1,ori=复制起点,enh=增强子
[0287] 获得稳定的细胞系
[0288] CHO(DHFR)细胞用四个载体中的单个载体或全部四个载体的混合物转染。按照制造商的说明书,使用Amaxa Nucleofection试剂盒(Lonza AG,瑞士)进行稳定的转染。简而言之,每次转染均用3μg线性化的载体DNA转染5×106个CHO细胞。所有载体单独分别转染,或将所有四个载体混合用于转染。转染后,添加生长培养基,并使细胞在10%CO2气氛中,37℃,110rpm摇动下生长24-48h。细胞恢复后,进行两轮选择。首先,使用含有G418的培养基选择细胞,然后在达到90%的细胞活力后使用甲氨蝶呤(MTX)选择细胞。将细胞维持在MTX选择下,直到细胞活力达到90%以上(通常是转染后3-4周)。在整个选择期间,每周两次使用新鲜培养基培养细胞。使用标准的限制性稀释克隆方法进行单细胞克隆。根据载体拷贝数选择各单克隆(即每个克隆至少两个拷贝)。
[0289] 从每个转染中选择单克隆,并测试POI的表达率(滴度)、克隆随时间的滴度稳定性、每个克隆的前导肽断裂、以及克隆随时间的遗传稳定性。滴度是指组织培养基中重组POI(在这种情况下为Etanercept)的浓度(mg/L)。
[0290] 细胞系中载体拷贝数的分析
[0291] 使用定量PCR(qPCR)评估整合的载体拷贝数。使用相对定量来估计每个克隆的整合表达构建体的数量。3个月后重复拷贝数评估,也用于确定各个细胞系中POI的拷贝数是否随时间是稳定的。通过琼脂糖凝胶电泳分离PCR产物,进一步允许确定PCR扩增的多核苷酸的大小是否随时间是稳定的,这是细胞系单克隆的遗传稳定性的另一个指标。PCR产物的高分辨率熔融分析可用于确认PCR产物的身份。
[0292] 分析细胞系的POI生产
[0293] 采用14天的通用分批补料工艺进行生产率评估。所有分批补料工艺均在100mL无血清培养基中进行。用4×105个活细胞/mL接种培养基,并将细胞培养物在37℃和10%CO2气氛中以110rpm振荡(50mm摇动直径)培养,并在第7天将温度转变至33℃。使用Vi-Cell XR分析仪测量细胞浓度和活力。使用Cedex系统(Roche Diagnostics Deutschland GmbH,曼海姆,德国)在培养的第7、10和14天测量滴度。该测量基于比浊法,使用针对人Fc区的抗体进行。在分批补料工艺结束时收集收获物,并使用蛋白A色谱法纯化。
[0294] 细胞系遗传稳定性的分析
[0295] 在无选择压力的情况下,将细胞单克隆以3×105个细胞/ml的密度接种在75cm3烧瓶中悬浮培养。为期3个月,每6周进行一次生产率检测。使用本领域技术人员已知的标准方法(如ELISA分析、ELISPOT、定量western印迹、定量质谱、表面等离振子共振(例如Biacore,瑞典)等)测量POI的表达。
[0296] 分析细胞系中信号肽的切割
[0297] 通过使用质谱或Edman降解,通过肽测序,分析正确的前导肽切割。信号肽的错切割可使用完整质量测量来进行评估。首先用N-糖苷酶(PNGase)F将蛋白去糖基化,然后在高分辨率质谱仪上使用LC-MS分析完整蛋白的质量。根据计算出的蛋白和信号肽加合物的理论质量,确定质量,并根据峰强度计算错切割的信号肽的比例。
[0298] 本文描述或提及的用于巴斯德毕赤酵母酵母细胞、CHO哺乳动物细胞以及用于根据本发明的其他类型细胞的所有方法,是技术人员已知的标准方法。这样的方法例如描述于标准实验室方法手册中,例如,M.R.Green,J.Sambrook,2013,“Molecular cloning:a laboratory manual(分子克隆:实验室手册)”,ColdSpring Harbor,N.Y.,或“Current Protocols in Molecular Biology(分子生物学中的通用实验方案)”,John Wiley&Sons Inc.ISSN 1934-3639和“Current protocols in Protein Science(蛋白科学中的通用实验方案)”,John Wiley&Sons Inc.ISSN 1934-3655,或John Wiley&Sons Inc的其他名称的“通用实验方案”系列。
[0299] 本发明不包括在细胞文库的单个细胞内偶然可能存在的两个或更多个表达盒,所述表达盒包含相同的GOI但具有不同的编码序列用于该相同的表达盒,其中所述细胞文库旨在筛选出在用于构建细胞文库的细胞系中具有最大表达率的GOI编码序列。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈