新的β‑肌动蛋白和RPS21启动子及其应用

申请号 CN201611041276.X 申请日 2004-06-24 公开(公告)号 CN107058313A 公开(公告)日 2017-08-18
申请人 建新公司; 发明人 S·D·埃斯蒂斯; W·张;
摘要 本 发明 涉及新的β‑肌动蛋白和核糖体蛋白S21(rpS21)启动子的分离及应用。特别地,本发明的特征为包括仓鼠、大鼠和小鼠的啮齿动物β‑肌动蛋白启动子和仓鼠rpS21启动子的序列。
权利要求

1.一种分离的啮齿动物启动子,其包含在SEQ ID NO:2或3的全长上与SEQ ID NO:2或3中列出的序列至少99%相同的序列,其中所述序列具有启动子活性。
2.权利要求1的分离的啮齿动物启动子,其包含SEQ ID NO:2中列出的序列。
3.权利要求1的分离的啮齿动物启动子,其包含SEQ ID NO:3中列出的序列。
4.一个载体,其包含权利要求1-3任一项的启动子。
5.根据权利要求4所述的载体,其中启动子被可操作地连接到异源核酸上。
6.根据实施方案5所述的载体,其中异源核酸编码治疗性蛋白。
7.根据实施方案6所述的载体,其中治疗性蛋白选自鞘磷脂酶、α-葡萄糖苷酶或组织血浆酶原激活剂。
8.一种宿主细胞,其包含权利要求4-7任一项的载体。
9.根据权利要求8的宿主细胞,其中宿主细胞是中国仓鼠卵巢细胞。
10.一种生产蛋白质的方法,其包括:
(a)培养包含权利要求4-7任一项的载体的宿主细胞,并
(b)回收蛋白质。
11.根据权利要求10所述的方法,其中蛋白质是抗体
12.根据权利要求10所述的方法,其中蛋白质是治疗性蛋白。
13.根据权利要求12所述的方法,其中治疗性蛋白选自鞘磷脂酶、α-葡萄糖苷酶或组织血浆酶原激活剂。
14.一种分离的啮齿动物启动子,其包含在SEQ ID NO:1的全长上与SEQ ID NO:1中列出的序列至少99%相同的序列,其中所述序列具有启动子活性。
15.一种分离的rpS21启动子,其包含在SEQ ID NO:39的全长上与SEQ ID NO:39中列出的序列至少99%相同的序列,其中所述序列具有启动子活性。

说明书全文

新的β-肌动蛋白和RPS21启动子及其应用

[0001] 本申请是申请日为2004年06月24日、申请号为201210408569.2、发明名称为“新的β-肌动蛋白和RPS21启动子及其应用”的发明分案申请的再分案申请(原申请号200480017948.2)。
[0002] 本发明要求2003年6月24日提交的美国临时申请No.60/480,768的优先权,该申请引作参考而并入此文。
[0003] 生物材料的保藏
[0004] 以下生物材料已经保藏于美国典型培养物保藏中心(American Type Culture Collection,ATCC):
[0005]

技术领域

[0006] 本发明涉及调节基因元件,如启动子及其应用,例如,在表达蛋白中的应用。更特别地,本发明涉及β-肌动蛋白和核糖体蛋白S21基因的启动子。技术背景
[0007] 每种真核基因含有驱动该基因转录的调节元件。该调节元件包括典型地直接位于该基因编码区上游的启动子。作为转录机制的一部分,启动子通过提供转录因子的结合位点来调节转录。启动子通常被用于在细胞培养中和体内表达蛋白质。很多启动子是已知的并被用于各种表达系统中表达蛋白质。启动子的例子包括巨细胞病毒(CMV)立即早期启动子、劳氏肉瘤病毒基因组大基因组长末端重复(RSV)、猿病毒40(SV40)启动子、干扰素基因启动子、金属硫因启动子、和胸腺嘧啶激酶启动子及其它,如Fernandez等人(1999)在Gene Expression System,Academic Press中所描述的。然而,在本领仍需要提供一种可以产生高表达平和/或在长时间内维持表达的启动子。
[0008] β-肌动蛋白是一种结构蛋白,其通常在从原核到真核,包括人的所有物种中表达。先前描述了人和鸡的β-肌动蛋白启动子。一般而言,β-肌动蛋白启动子表现出比广泛被应用的CMV启动子更普遍的活性(Xu等(2001)Gene 272:149-156)。仅仅当其被连接到CMV增强子序列时,鸡的β-肌动蛋白启动子比病毒CMV和SV40启动子具有更高的活性(Xu等,supra)。
[0009] 核糖体蛋白S21(rpS21)与核糖体40S亚单位有关。人的rpS21基因的启动子已被鉴别( 接收号No.AJ250907)。与大多数核糖体启动子基因相似,其缺少传统的转录元件,如TATA盒和CAAT序列(Smirnova等(2000)Bioorg.Khim.26(5):392-396)。

发明内容

[0010] 本发明提供了一种新的β-肌动蛋白启动子,其与前述公知的β-肌动蛋白启动子相比具有低水平的序列同源性(如,人或鸡)。本发明还提供了新的rpS21启动子,其与前述公知的rpS21启动子相比具有低水平的序列同源性(如,人或小鼠)。
[0011] 本发明部分基于对中国仓鼠卵巢细胞(CHO)系来源的β-肌动蛋白和rpS21启动子的发现和分离。本发明进一步部分基于仓鼠β-肌动蛋白启动子比CMV启动子具有显著的高活性的观察。本发明进一步部分基于当被用于表达一定基因时,rpS21启动子至少具有与仓鼠β-肌动蛋白启动子相同的活性的观察。本发明提供了这些启动子的核酸序列,并包括具有启动子活性的各种核酸序列的变种。在一些实施例中,本发明的β-肌动蛋白启动子来源于啮齿类,如仓鼠、大鼠和小鼠。典型地rpS21启动子来源于仓鼠。
[0012] 本发明进一步提供了含有可操作地连接到异源核酸上的本发明的β-肌动蛋白或rpS21启动子的载体。在某些实施例中,本发明的载体包括可操作地连接到异源核酸上的启动子,该异源核酸编码异源表达产物,如治疗蛋白质或其片段。在示例性实施例中,表达产物是酸性鞘磷脂酶(ASM)、α-葡萄糖苷酶(GAA)、或组织血浆酶原激活剂(tPA)。
[0013] 本发明还提供了用本发明的载体转染的宿主细胞。在描述性实施例中,宿主细胞是哺乳动物细胞,如CHO、HEK和BHK。
[0014] 本发明还提供了用于产生蛋白质的方法。产生蛋白质的方法包括,例如,培养转染细胞,该细胞用含有可操作地连接到编码蛋白质的异源核酸上的本发明的β-肌动蛋白启动子和/或rpS21启动子的载体转染的细胞,以及回收蛋白质。在一些实施例中,异源表达产物是分泌蛋白,其从培养基中被回收。在描述性实施例中,蛋白质是ASM、GAA、或tPA。
[0015] 本发明还涉及下述实施方案:
[0016] 1.一种选自SEQ ID NOs:1、2、3的核苷酸序列的分离的啮齿动物β-肌动蛋白启动子或其具有启动子活性的变种。
[0017] 2.一种SEQ ID NO:1中列出的分离的仓鼠β-肌动蛋白启动子核苷酸序列,或其具有启动子活性的变种。
[0018] 3.一种SEQ ID NO:2中列出的分离的大鼠β-肌动蛋白启动子核苷酸序列,或其具有启动子活性的变种。
[0019] 4.一种SEQ ID NO:3中列出的分离的小鼠β-肌动蛋白启动子核苷酸序列,或其具有启动子活性的变种。
[0020] 5.一个包括SEQ ID NO:1中列出的核苷酸序列的分离的核酸,或其具有启动子活性的变种。
[0021] 6.一个包括SEQ ID NO:2中列出的核苷酸序列的分离的核酸,或其具有启动子活性的变种。
[0022] 7.一个载体,其包括SEQ ID NO:1中的启动子,或其具有启动子活性的变种。
[0023] 8.一个载体,其包括SEQ ID NO:2中的启动子,或其具有启动子活性的变种。
[0024] 9.一个载体,其包括SEQ ID NO:3中的启动子,或其具有启动子活性的变种。
[0025] 10.根据实施方案7-9的任何一项所述的载体,其中启动子被可操作地连接到异源核酸上。
[0026] 11.根据实施方案10所述的载体,其中异源核酸编码治疗性蛋白。
[0027] 12.根据实施方案11所述的载体,其中治疗性蛋白选自酸性鞘磷脂酶、α-葡萄糖苷酶或组织血浆酶原激活剂。
[0028] 13.用实施方案7-12的任何一项的所述的载体转染的宿主细胞。
[0029] 14.根据实施方案13的宿主细胞,其中细胞是CHO细胞。
[0030] 15.一种生产蛋白质的方法,其包括:
[0031] (a)培养用含有仓鼠β-肌动蛋白启动子或其变种的载体转染的细胞,该启动子或其变种被可操作地连接到编码该蛋白质的核酸上,和;
[0032] (b)回收蛋白质。
[0033] 16.根据实施方案15所述的方法,其中蛋白质是抗体
[0034] 17.根据实施方案16所述的方法,其中抗体结合TGF-β族成员。
[0035] 18.根据实施方案15所述的方法,其中蛋白质是治疗性蛋白。
[0036] 19.根据实施方案18所述的方法,其中治疗性蛋白选自酸性鞘磷脂酶、α-葡萄糖苷酶或组织血浆酶原激活剂。
[0037] 20.含有实施方案1-6的任何一项所述的启动子的转基因动物。
[0038] 21.根据实施方案20所述的转基因动物,其中动物是哺乳动物。
[0039] 22.具有SEQ ID NO:39的核苷酸序列的分离的rpS21启动子,或其具有启动子活性的变种。
[0040] 23.含有SEQ ID NO:39的核苷酸序列或其具有启动子活性的变种的载体。
[0041] 24.根据实施方案23所述的载体,其中核苷酸序列被可操作地连接到异源核酸上。
[0042] 25.根据实施方案24所述的载体,其中异源核酸编码治疗性蛋白。
[0043] 26.根据实施方案25所述的载体,其中治疗性蛋白是α-葡萄糖苷酶或酸性鞘磷脂酶。
[0044] 27.用实施方案23-26的任何一项所述的载体转染的宿主细胞。
[0045] 28.根据实施方案27所述的宿主细胞,其中细胞是CHO细胞。
[0046] 29.一种生产蛋白的方法,其包括:
[0047] (a)培养用含有仓鼠rpS21启动子或其变种的载体转染的细胞,该启动子或其变种被可操作地连接到该编码蛋白质的核酸上,和;
[0048] (b)回收蛋白质。
[0049] 30.根据实施方案29所述的方法,其中蛋白是抗体。
[0050] 31.根据实施方案29所述的方法,其中蛋白是治疗性蛋白。
[0051] 32.根据实施方案31所述的方法,其中治疗性蛋白是α-葡萄糖苷酶或酸性鞘磷脂酶。
[0052] 33.一种含有实施方案22所述的启动子的转基因动物。
[0053] 34.根据实施方案33所述的转基因动物,其中动物是哺乳动物。
[0054] 35.一种分离的β-肌动蛋白启动子,其核苷酸序列作为ATCC参考号PTA-5309被保藏,其分类命名为:含有克隆到噬菌粒载体pBluescript II KS+的β-肌动蛋白启动子的仓鼠基因组克隆:pBlueβ-肌动蛋白/Avr(Hamster genomic clone containingβ-actin promoter cloned in phagemid vector pBlueScript II KS+:pBlueβ-actin/Avr),保藏单位为美国典型培养物保藏中心(American Type Culture Collection,ATCC),保藏日为2003年7月3日。
[0055] 36.一种分离的rpS21启动子,其核苷酸序列作为ATCC参考号____被保藏。附图说明
[0056] 图1A显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID NO:1)与大鼠β-肌动蛋白启动子(SEQ ID NO:2)的比对,显示出SEQ ID NO:1中的核苷酸487-893与SEQ ID NO:2中的核苷酸1-417具有79%的同一性。大鼠β-肌动蛋白启动子(SEQ ID NO:2)与仓鼠β-肌动蛋白启动子(SEQ ID NO:1)的全长相比具有67%的同一性。
[0057] 图1B显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID NO:1)与大鼠β-肌动蛋白启动子(SEQ ID NO:2)的比对,显示出SEQ ID NO:1中的核苷酸1047-3006与SEQ ID NO:2中的核苷酸546-2493具有83%的同一性。
[0058] 图2A显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID NO:1)与小鼠β-肌动蛋白启动子(SEQ ID NO:3)的比对,显示出SEQ ID NO:1中的核苷酸33-487与SEQ ID NO:3中的核苷酸1-449具有84%的同一性。小鼠β-肌动蛋白启动子(SEQ ID NO:3)与仓鼠β-肌动蛋白启动子(SEQ ID NO:1)的全长相比具有80%的同一性。
[0059] 图2B显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID NO:1)与小鼠β-肌动蛋白启动子(SEQ ID NO:3)的比对,显示出SEQ ID NO:1中的核苷酸996-3006与SEQ ID NO:1中的核苷酸921-2953具有83%的同一性。
[0060] 图3显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID NO:1)与仓鼠β-肌动蛋白基因( 接收号No.U20114;SEQ ID NO:4)的比对,显示出SEQ ID NO:1中的核苷酸1775-3006与SEQ ID NO:4中的核苷酸1-1232具有98%的同一性。仓鼠β-肌动蛋白基因序列与仓鼠β-肌动蛋白启动子序列(SEQ ID NO:1)的全长相比具有40%的同一性。
[0061] 图4显示了仓鼠β-肌动蛋白启动子部分核苷酸序列(SEQ ID NO:1)与在先已知的人β-肌动蛋白启动子( 接收号No.gi28337;SEQ ID NO:5)的比对,显示出SEQ ID NO:1中的核苷酸113-148与SEQ ID NO:5中的核苷酸38-73具有94%的同一性,SEQ ID NO:1中的核苷酸362-433与SEQ ID NO:5中的核苷酸303-374具有83%的同一性,SEQ ID NO:1中的核苷酸1728-1764与SEQ ID NO:5中的核苷酸1791-1830具有90%的同一性,SEQ ID NO:1中的核苷酸1797-1966与SEQ ID NO:5中的核苷酸1840-2007具有91%的同一性。仓鼠β-肌动蛋白启动子序列(SEQ ID NO:5)与人β-肌动蛋白启动子(SEQ ID NO:1)的全长相比具有10%的同一性。
[0062] 图5显示了仓鼠β-肌动蛋白启动子核苷酸序列(SEQ ID NO:1)与先前已知的鸡β-肌动蛋白启动子( 接收号No.gi217043;SEQ ID NO:6)的比对,显示出SEQ ID NO:1中的核苷酸1878-1919与SEQ ID NO:6中的核苷酸186-227具有83%的同一性。鸡的β-肌动蛋白启动子序列(SEQ ID NO:6)与仓鼠β-肌动蛋白启动子(SEQ ID NO:1)的全长相比具有
1%的同一性。
[0063] 图6A描述了CHO-K1细胞中的半乳糖结合蛋白、蛋白和β-肌动蛋白的RNA斑点印迹。mRNAs分别分离自放射菌素D处理后0、4、8、10和15小时后的细胞。
[0064] 图6B描述了半乳糖结合蛋白、铁蛋白和β-肌动蛋白的相对mRNA表达水平。mRNAs分别分离自放射菌素D处理后的CHO-K1细胞10、4、8、10和15小时后的细胞。
[0065] 图7A描述了在CHO-K1细胞中的瞬时转染分析检测下列启动子的相对启动子强度:CMV、人EF-1、仓鼠GAPDH、仓鼠rpS21_和仓鼠β-肌动蛋白。在pDsRED-1质粒中启动子分别被克隆到红色荧光蛋白(RFP)基因的上游。用FACS检测荧光。
[0066] 图7B描述了在CHO-K1细胞中的稳定转染分析检测中下列启动子的相对启动子强度:CMV、人EF-1、仓鼠GAPDH、仓鼠rpS21_和仓鼠β-肌动蛋白。在pDsRED-1质粒中分别将启动子被克隆到红色荧光蛋白(RFP)基因的上游。用FACS检测平均荧光。
[0067] 图8A描述了在来源于三个被含有可操作地连接到CMV启动子或仓鼠β-肌动蛋白启动子上的ASM cDNA的载体转染的CHO-DXB11细胞池的培养基中酸性鞘磷脂酶(ASM)蛋白的表达。用分析ASM酶活性的分析方法分析ASM的表达。
[0068] 图8B描述了在来源于三个被含有可操作地连接到CMV启动子或仓鼠β-肌动蛋白启动子上的GAA cDNA的载体转染的CHO-DXB11细胞池的培养基中α-葡萄糖苷酶(GAA)蛋白的表达。用分析α-葡萄糖苷酶(GAA)蛋白酶活性的分析方法分析GAA的表达。
[0069] 图9描述了在来源于被含有可操作地连接到仓鼠β-肌动蛋白启动子上的tPA cDNA的载体转染的CHO-DXB11细胞池的培养基中tPA蛋白的表达。用ELISA方法分析tPA的表达。

具体实施方式

[0070] 为了更容易地理解本发明,首先对术语进行定义。另外的定义在贯穿说明书的详细说明中列出。
[0071] 术语“启动子”指调节元件,其指导与其可操作地连接的核酸的转录。启动子可以调节可操作地连接到其上的核酸的转录速率和效率。启动子还可以被可操作地连接到其它的调节元件上,其可增强(“增强子”)或抑制(“抑制子”)启动子依赖的的核酸转录。术语“可操作地连接”指处于与其它核酸有功能关系的位置的核酸。启动子通常位于核酸转录起始点的5’端(即,上游)。然而,启动子可以包括转录起始点的3’端(即,下游)。启动子还可以包括可操作地连接的核酸的转录起始点的5’和3’端。
[0072] 术语“启动子活性”指启动子启动与其可操作连接的核酸转录的能。可以应用本领域公知的或实施例中描述的方法检测启动子活性。例如,可以通过测量被转录的mRNA的量测量启动子的活性,例如,RNA印迹或聚合酶链反应(PCR)。可供选择地,可以通过测量被翻译的蛋白产物的量测量启动子的活性,例如,蛋白印迹、ELISA、如Bradford分析(Bradford(1976)Anal.Biochem.,72:248)的色比色分析和各种活性分析,包括报告基因分析和其他本领域公知的或实施例中描述的方法。
[0073] 术语“载体”指可以携带其他核酸的病毒或非病毒、原核或真核、脱核糖核酸、核糖核酸或核酸类似物。载体可携带核酸进入被称为“宿主细胞”的细胞,从而使核酸的全部或部分被转录或表达。可供选择地,载体可被用于体外转录分析中。载体通常来源于不同病毒、细菌或哺乳动物基因元件的组合物装配而成。载体含有各种包括编码选择性标记(如,抗生素抗性基因)、有助于其在细菌中增殖的序列、或仅在某些细胞类型中表达的一个或多个转录单位的编码和非编码序列。例如,哺乳动物表达载体通常即含有有助于载体在细菌中增殖的原核序列,又含有仅在真核细胞中表达的一个或多个真核转录单位。本领域技术人员应该理解载体的设计取决于如所选择的被转染的宿主细胞、所需的蛋白质表达水平等因素。
[0074] 载体包括例如,质粒、噬菌粒和病毒载体。对于已具有启动子的载体,可以使用本领域熟知的标准重组DNA技术对载体进行修饰,从而用任何SEQ ID NOs:1、2、3或39或其变种列出的启动子序列取代已存在的启动子序列,。一般而言,合适的载体或者可以选自商售的那些,也可以应用本领域熟知的标准重组DNA技术构建。(见,如Molecular Cloning:A Laboratory Manual:2nd edition,Sambrook et al.,1989,Cold Spring Harbor Laboratory Press.)
[0075] 术语“转化”和“转染”指向细胞内导入核酸。可以使用本领域熟知的方法或此处描述的方法将核酸导入植物或动物细胞,或原核或真核细胞。
[0076] 术语“分离的”指使用不是自然发生的方式,从其他核酸序列中分离的脱氧核糖核酸、核糖核酸、或多聚核苷酸的核酸类似物。分离的核酸包括使用本领域的标准技术部分或全部化学地或重组地合成和/或纯化的核酸。
[0077] 涉及启动子的术语“变种”指如果变种具有启动子活性,则与启动子序列全长或其互补链全长基本上具有同一性的核苷酸序列。
[0078] 只要其长度至少有1250个核苷酸β-肌动蛋白启动子的变种可以与SEQ ID NOs:1、2或3的核苷酸序列同样长、或短。只要其具启动子活性rpS21启动子的变种可以与SEQ ID NOs:39的核苷酸序列同样长、或短。β-肌动蛋白启动子的变种可以是自然发生的,如从除人和鸡以外的物种分离的自然发生的β-肌动蛋白,或人工生成的β-肌动蛋白启动子。当被最优比对时,在SEQ ID NO:1序列的核苷酸1-3007的全长上,SEQ ID NO:1列出的仓鼠β-肌动蛋白启动子与其变种之间的同一性至少为45%、50%、55%、60%、65%、70%、75%、80%、
85%、90%、92%、93%、94%、95%、96%、97%、98%、或99%。相似地,在SEQ ID NO:2列出的序列的核苷酸1-2493的全长上,SEQ ID NO:2的大鼠β-肌动蛋白启动子与其变种之间的同一性至少为60%、65%、70%、75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、
98%、或99%。SEQ ID NO:3序列的核苷酸1-2953的全长上,SEQ ID NO:3的小鼠β-肌动蛋白启动子与其变种之间的同一性至少为55%、60%、65%、70%、75%、80%、85%、90%、92%、
93%、94%、95%、96%、97%、98%、或99%。相似地,在SEQ ID NO:39列出的序列的核苷酸
1-1958的全长上,SEQ ID NO:39的仓鼠rpS21启动子与其变种之间在最优比对时的同一性,至少为40%、50%、55%、60%、65%、70%、80%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、或99%。
[0079] β-肌动蛋白启动子的变种可以,例如,包括其他物种中的β-肌动蛋白启动子的同源物(orthologs),其他物种包括啮齿动物和其他哺乳动物,但除外人和鸡β-肌动蛋白启动子及其已知的变种。本发明的启动子的变种还可以在其他啮齿动物中被发现,如豚鼠、花白旱獭、麝鼠、沙鼠、松鼠、花栗鼠、土拨鼠、海狸、豪猪和野鼠。
[0080] 术语“变种”进一步包括具有启动子活性的任何一个或多个本发明启动子的片段。β-肌动蛋白启动子的变种具有至少1250核苷酸的长度。例如,可通过5’端切断SEQ ID NO:1中列出的的仓鼠β-肌动蛋白启动子的而衍生出本发明的β-肌动蛋白启动子。在一些实施方案中,β-肌动蛋白启动子的变种包括SEQ ID NO:1的核苷酸50-3000、100-3000、150-3000、
200-3000、250-3000、500-3000、1000-3000、或1500-3000的序列。在另一些实施例中,可通过5’端切断SEQ ID NO:2中序列而衍生出β-肌动蛋白启动子,例如包括SEQ ID NO:2的核苷酸50-2490、100-2490、150-2490、200-2490、250-2490、500-2490、或1000-2490的序列。还可通过5’端切断SEQ ID NO:3中序列而衍生出β-肌动蛋白启动子,其包括例如,SEQ ID NO:3的核苷酸50-2950、100-2950、150-2950、200-2950、250-2950、500-2950、1000-2950或1500-
2950的序列。例如,可以通过切断SEQ ID NO:7中较长的仓鼠启动子核苷酸序列的5’端而衍生出仓鼠β-肌动蛋白启动子的长片段。此种变种包括,如,核苷酸50-3668、100-3668、150-
3668、200-3668、250-3668、500-3668或600-3668的序列。
[0081] 可以通过5’和/或3’端的切断SEQ ID NO:39的序列来衍生rpS21启动子的变种。此变种包括,例如,核苷酸50-1958、100-1958、150-1958、200-1958、250-1958、500-1958、1000-1958、1-1900、1-1850、1-1800、1-1750、1-1700、1-1600或1-1500的序列。
[0082] 在某些实施方案中,本发明的β-肌动蛋白启动子包括来自于SEQ ID NOs:1、2或3的至少1250、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2500或3000个核苷酸的相邻的分支。此SEQ ID NOs:1、2和3的相邻分支还可以包括一个突变(插入或缺失),前提是突变序列保留了至少原始序列的一些功能以及在低、中等或高度严格的条件下可以分别与SEQ ID NOs:1、2或3杂交的能力。可以通过5’切断SEQ ID NOs:1、2、3或7或上述其变种的任何序列的而衍生出β-肌动蛋白启动子的相邻分支。
[0083] 在其他实施方案中,本发明的rpS21启动子包括来自SEQ ID NO:39的至少500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1850或1900个核苷酸的相邻分支。
[0084] 本发明的β-肌动蛋白启动子的变种进一步包括可以和SEQ ID NOs:1、2或3中所示的β-肌动蛋白启动子或其互补序列全长杂交的核苷酸序列,两者具有最多0、1、2、3、4、5、10、15、20、25、30、35、40、45%的基对错配。本发明的rpS21启动子序列包括可与SEQ ID NOs:39中所示的全长rpS21启动子序列或其互补序列杂交的核苷酸序列,两者具有最多0、
1、2、3、4、5、10、15、20、30、40、45、50、55、60%的碱基对错配。可使用本领域公知的或此处描述的技术测定碱基对的错配率。在此处用于修饰核酸的术语“异源的”是指除可操作地连接到自然发生的基因组的启动子核酸以外的核酸。例如,术语“异源的”指当此核酸被可操作地连接到仓鼠β-肌动蛋白启动子时,除仓鼠β-肌动蛋白基因以外的任何核酸。同样地,当此核酸被可操作地连接到大鼠β-肌动蛋白启动子时,术语“异源的”指除大鼠β-肌动蛋白基因以外的任何核酸。相似地,当此核酸被可操作地连接到小鼠β-肌动蛋白启动子时,术语“异源的”指任何核酸。类似地,当此核酸被可操作地连接到仓鼠rpS21启动子时,此术语可以指除仓鼠rpS21基因以外的任何核酸。
[0085] 术语“转基因”指含有基因操作细胞的任何动物,其中本发明的启动子不再被可操作地连接如天然发生的基因组中的相同的核酸上。术语“转基因”包括,例如,含有具有整合到动物染色体中的本发明的启动子或其变种的细胞的动物。术语“转基因”还包括含有在染色体外具有由本发明的启动子或其变种组成的复制的DNA序列的细胞的动物。转基因动物可以是如啮齿动物或人的哺乳动物。
[0086] 本发明部分基于新的β-肌动蛋白和rpS21基因的启动子的发现和分离。特别地,本发明的特征为包括但不局限于仓鼠、大鼠和小鼠的啮齿动物β-肌动蛋白启动子,以及仓鼠rpS21启动子。如实施例中所描述的,本发明是基于发现和证实本发明的β-肌动蛋白启动子具有高于CMV的启动子活性的基础上。本发明进一步基于当用于表达某些基因时,仓鼠rpS21启动子的活性至少与仓鼠β-肌动蛋白启动子的活性相同的发现的基础上。
[0087] 本发明提供了包括仓鼠、大鼠和小鼠的啮齿动物β-肌动蛋白启动子的核苷酸序列,以及其应用方法。本发明进一步提供了鉴别和分离本发明的启动子变种的方法,包括具有启动子活性的启动子的同源物或片段。另外,本发明提供了用于仓鼠rpS21启动子的核苷酸序列及其使用方法。
[0088] 在导致本发明的实验中,仓鼠β-肌动蛋白启动子的基因克隆被称为基因表达的系列分析技术或“SAGE”(Valculesco et al.(1995)Science,270:484-487和Valculesco et al.(1987)Cell,88:243-251)鉴定为活性启动子在识别后从CHO细胞中分离出来。SAGE技术可被用于整个基因组的转录图谱中。使用SAGE技术,β-肌动蛋白启动子被鉴定为是CHO细胞中最具活性的启动子之一。因此从CHO细胞中克隆β-肌动蛋白启动子。可应用相似的方法从CHO细胞中克隆仓鼠rpS21启动子。该方法可被用于其他基因组的转录图谱以确认在其他基因组中相应的β-肌动蛋白启动子或rpS21启动子的活性。可使用本领域公知的标准技术或此处描述的技术克隆这些启动子。可以通过将其与一个或多个SEQ ID NOs:1、2、3或39列出的启动子序列杂交的方法鉴别本发明的启动子的变种。同源性每降低1%,双链核酸的熔点(Tm)就降低1-1.5℃是公知的(见,如Bonner et al.(1973)J.Mol.Biol.,81:123)。因此,例如可以将公认的核苷酸序列与SEQ ID NOs:1、2、3或39或其变种序列杂交,并将此杂化物的熔点和SEQ ID NOs:1、2、3或39或其变种序列与其互补序列的杂化物的熔点相比较,从而鉴定物种间的同源性。然后可以计算待测杂化物的碱基对错配数。因此,待测杂化物的熔点与含有任何SEQ ID NOs:1、2、3或39的公认同源物的杂化物的熔点的差别越小,表明公认的核苷酸序列与本发明的启动子序列之间的同源性越大。例如,在其他啮齿动物如,豚鼠、花白旱獭、麝鼠、沙鼠、松鼠、花栗鼠、土拨鼠、海狸、豪猪和野鼠中的变种可以表现为与本发明的启动子及其变种具有更高的同源性。
[0089] 已知多种因子影响核酸双链的杂交效率。其包括,例如,核酸序列的长度,盐浓度和序列的G/C含量。例如,为了杂交DNA的长片段,Howley et al.(1997)J.Biol.Chem.,254:4876,确定了使50%DNA与互补链杂交的熔点为:
[0090] Tm=81.5+16.6logM+41(%G+%C)-500/L-0.62F,
[0091] 其中,M是单价阳离子的摩尔浓度;
[0092] (%G+%C)是序列中G和C核苷酸各自的份额,
[0093] L是杂合DNA的长度;
[0094] F是甲酰胺的摩尔浓度。
[0095] 本领域技术人员可以如Ausubel et  al.(1995)Current  Protocols in Molecular Biology,John Wiley&Sons,的第2、4和6部分列举的通过最少的实验来选择恰当的杂交条件。另外,严格的杂交条件在Sambrook et al.(1989)Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor Press,第7、9和11章中描述。
[0096] 低严格的杂交条件的非限制性的例子如下。含有DNA的滤纸在40℃下,在含有35%甲酰胺、5XSSC、50mMTris-HCl(pH7.5)、5mM EDTA、0.1%PVP、0.1%FicoliTM、1%BSA、和500ug/ml变性的鲑鱼精子DNA的溶液中预处理6小时。杂交在具有以下变动的相同的溶液中进行:0.02%PVP、0.02%FicoliTM、0.2%BSA、100ug/ml变性的鲑鱼精子DNA、10%(wt/vol)硫酸葡聚糖以及使用5-20X 106 32P-标记的探针。滤纸在40℃下,在杂交混合液中孵育18-
20小时,然后在55℃的含2X SSC、25mM Tris-HCl(pH7.4)、5mM EDTA和0.1%SDS的溶液中洗脱1.5小时。用新鲜溶液替换洗脱液并在60℃下继续赋育1.5小时。吸干滤纸,使其暴露于射线自显仪。也可以使用本领域公知的其他的低严格条件(如,种间杂交所用的)。
[0097] 一个高度严格的杂交条件的非限制性的示例如下所述。含有DNA的滤纸的预杂交在含有6X SSC、50mM Tris-HCl(pH7.5)、1mM EDTA、0.02%PVP、0.02%FicollTM、0.02%BSA和500ug/ml变性的鲑鱼精子DNA的缓冲液中,在65℃处理8小时至过夜。滤纸在65℃下,含有100ug/ml变性的鲑鱼精子DNA和5-20X 106cpm的32P-标记的探针的杂交液中杂交48小时。在TM
37℃下,含有2X SSC、0.01%PVP、0.01%Ficoll 和0.01%BSA的溶液中洗脱滤纸1小时,之后在50℃,0.1×SSC溶液中洗脱45分钟。
[0098] 一个中度严格的杂交条件的非限制性的例子包括在5X SSC、0.5%SDS、1.0mM EDTA,pH8.0的溶液中预洗脱;在50%甲酰胺、6X SSC的溶液中42℃进行杂交;在0.5X SSC、0.1%SDS的条件下,60℃进行洗脱。
[0099] 还可以通过公认变种的核苷酸序列和SEQ ID NOs:1、2、3或39中的序列或其互补链间同一性的百分比鉴定本发明启动子的变种。同一性百分比可以通过,例如,可见观测或本领域公知的或实施例中描述的各种计算机程序来确定。例如,可以通过使用Devereux等(1984)Nucl.Acids.Res.,12:387中描述的并从威斯康星州大学的基因计算机组(UWGCG)中可获得的GAP计算机程序比较序列信息来确定两核苷酸序列的同一性百分比。还可以通过使用如Tatusove et al.(1999)FEMS Microbiol.Lett.,174:247中描述的 程序(www.ncbi.nlm.nih.gov/BLAST)比对两核苷酸序列以确定同一性百分比。例如,使用程序进行核苷酸序列比对时,默认参数设定如下:匹配回报为2,不匹配惩罚为-2,开口间隙和延伸间隙惩罚分别为5和2,间隙Xdropoff为50,预期值为10,字大小为11,过滤器关闭。
[0100] 通过序列同一性鉴别的本发明的启动子包括,例如,SEQ ID NOs:2和3序列分别列出的大鼠和小鼠β-肌动蛋白启动子的序列,显示出与SEQ ID NO1列出的仓鼠β-肌动蛋白启动子序列的1-3007核苷酸相比具有67%和80%的同一性。应用此处描述的和本领域熟知的多种技术可以很容易地鉴别其他变种。
[0101] 可以通过所描述的方法确定仓鼠β-肌动蛋白启动子(SEQ ID NO1)与已知的β-肌动蛋白启动子间的同一性百分比。例如,当用默认参数的 序列比对对SEQ ID NO1与人β-肌动蛋白启动子(SEQ ID NO5)进行对比时,显示出在SEQ ID NO1的全长上仅有大约10%的同一性。相似地,当SEQ ID NO1与鸡β-肌动蛋白启动子(SEQ ID NO6)对比时,显示出在SEQ ID NO1的全长上仅有大约1%的同一性。由于同源性的水平如此低,因此不认为人和鸡的β-肌动蛋白启动子是SEQ ID NO1列出的仓鼠β-肌动蛋白启动子的变种。而且,SEQ ID NO1的3’部分显示出与仓鼠β-肌动蛋白基因序列的5’部分( 接收号No。U20114;
SEQ ID NO 4)具有显著的同源性。特别地,如图3所示,SEQ ID NO 4的前1232个核苷酸显示出与SEQ ID NO1的3’部分具有98%的同一性。此同一性位于仓鼠β-肌动蛋白基因的第一内含子区内。整体上看,在SEQ ID NO1的全长上,SEQ ID NO 4仅显示出40%的同源性。而且,SEQ ID NO 4或其片段并不具有启动子活性。
[0102] 应用具有默认参数的 序列比对发现在先前知道的人rpS21启动子(接收号No AJ250907的核苷酸1-2344)与SEQ ID NO 39的仓鼠rpS21启动子的核
苷酸1-1958之间没有同一性。在SEQ ID NO 39的仓鼠rpS21启动子和跨越小鼠rpS21基因的小鼠基因组DNA( 接收号No NT_039212)之间有很低的同一性。在小鼠的序列中
有两个具同源性的区域。第一个是SEQ ID NO 39的核苷酸1775-1945(172个核苷酸中有137个相匹配)。第二个是SEQ ID NO 39的核苷酸580-851(274个核苷酸中有208个相匹配)。这两个具同一性的区域在仓鼠序列(SEQ ID NO 39)中被923个核苷酸分开,在小鼠基因组序列(NT_039212)中被1745个核苷酸分开。
[0103] 在一些实施方案中,具有启动子活性的分离的启动子或其变种包括SEQ ID NO 39中的核苷酸1775-1945和/或SEQ ID NO 39中的核苷酸580-851的核苷酸序列。可选择的,此启动子或变种进一步包括从SEQ ID NO 39的全部或如核苷酸852-1774所示的部分序列。
[0104] SEQ ID NOs:1、2、3或39所示的核苷酸序列或其变种可用作探针以用于筛选基因组库的,以便分离与一个或多个SEQ ID NOs:1、2、3或39所示序列或其变种的基因组序列。
[0105] 根据本发明的启动子或其变种被可操作地连接到被其所表达的异源核酸上。启动子既可单独使用,也可以与其他调节元件,如增强子和抑制子联合使用。可供选择地,此启动子可被整合到宿主细胞或动物的基因组上,从而在宿主细胞中表达内源性基因。根据本发明的启动子可被用在表达异源核酸的载体中。在某些实施方案中,异源核酸编码治疗性蛋白。治疗性蛋白的例子包括,但不局限于α-葡萄糖苷酶、酸性鞘磷脂酶、胰岛素、组织血浆酶原激活剂、促甲状腺素α注射液刺激的激素(thyrogen stimulating hormon)、红细胞生成素、葡糖脑苷脂酶、α-半乳糖苷酶和各种抗体。抗体的例子包括但不局限于结合如TGF-β-1、2和3TGF-β族成员的抗体。
[0106] 本发明进一步提供了含有具有启动子活性的本发明的启动子或其变种的载体。在一些实施方案中,本发明的载体包括位于启动子下游的合适的限制性酶切位点,其可用于插入异源的核酸。该限制性酶切位点可以包括用于一种限制性酶的一个限制性位点或其可包括用于多种限制性酶的多个限制性位点,从而有助于插入多个不同异源的核酸。本发明的载体还可以包括异源核酸插入点下游的一个多腺苷序列。含有本发明启动子的载体还可以含有用于细菌复制的原核DNA元件和用于载体在细菌细胞中生长和选择的抗生素选择标记,以及一个控制转录过程的另外的DNA元件,如终止信号。载体可以进一步包含指导蛋白质向细胞外分泌的DNA序列。
[0107] 在某些实施方案中,含有本发明的启动子序列的载体是双顺反子载体。设计成双顺反子载体可以使两个核酸被转录而生成一个转录产物。此转录产物通常含有翻译成一个蛋白的第一部分和翻译成另一个蛋白的第二部分。一个蛋白可以是兴趣蛋白,如治疗蛋白,另一个蛋白可以被用作可供选择的标记。双顺反子载体通常含有一个启动子和一个内部的核糖体进入位点或位于两个核酸间的IRES。这使得两个核酸转录为一个双顺反mRNA。在这种方式下,可将载体构建成含有本发明的β-肌动蛋白启动子或其变种和在两个异源核酸间的IRES。含有本发明的β-肌动蛋白启动子或其变种的双顺反子载体可被用于表达连接报告基因的治疗蛋白,例如,酸性鞘磷脂酶或α-葡萄糖苷酶。
[0108] 本发明进一步提供了鉴定具有启动子活性的本发明的β-肌动蛋白和rpS21启动子的变种的方法。例如,将本发明的启动子或其变种插入合适载体的报告基因的上游,并且报告基因的表达,择确定启动子活性的鉴定。例如,为鉴定本发明的具有启动子活性的启动子变种,则将此变种克隆到报告基因的上游。报告基因可以编码能催化产生视觉可辨别信号的反应的酶。此种信号基因的例子包括β-半乳糖苷酶和荧光素酶。其他信号基因的例子包括碱性磷酸酶、胭脂碱合成酶、章鱼碱合成酶、β-葡萄糖酸苷酶、氯霉素乙酰基转移酶(chloremphenicol acetyltransferase)。在下列实施例中,编码海葵(Discosoma striata)红色荧光蛋白(RFP)的报告基因被用于检测启动子活性。然而,本领域技术人员可以使用任何适当的报告基因和分析技术检测启动子活性。可以在体外表达系统或细胞内(如体内)分析启动子启动的报告基因的表达。
[0109] 本发明进一步提供了被含有可操作地连接到异源基因的启动子的本发明的载体转染的宿主细胞。此宿主细胞可以是原核细胞或真核细胞。宿主细胞可以是培养的,也可以是动物中的细胞。培养的宿主细胞的例子包括,但不局限于Hela细胞、CHO细胞、NSO、HEK细胞、BHK细胞、NIH-3T3、MDCK细胞和COS细胞。如实施例中所述的,培养中的宿主细胞可以悬浮或在微载体中生长。
[0110] 可以使用许多恰当的方法将本发明的核酸导入宿主细胞。含有本发明启动子序列的载体可以被导入原核或真核细胞。可以将核酸导入真核细胞的技术的例子包括,例如,磷酸沉淀、DEAE-右旋糖苷转染、电穿孔、脂质体介导的转染、应用病毒载体的转导等。
[0111] 可以用许多恰当的表达系统来生成使用本发明的启动子的蛋白质。一个此种表达系统应用了二氢叶酸还原酶(DHFR)基因,该基因被导入含有可操作地连接到异源核酸的本发明启动子或其变种的载体。可供选择地,如果使用DFHR缺陷细胞作表达,可将表达DHFR的表达载体共同转染到宿主细胞。当增加甲蝶呤(MTX),一种主要的酶DHFR的竞争性抑制剂的浓度被施加到转染细胞时,仅仅具DHFR较高表达水平的细胞存活。进一步增加MTX水平时,仅仅那些DHFR基因的拷贝数增幅的细胞存活。在这种方式下,通过增加含启动子的载体的拷贝数,可以增加异源核酸的表达,从而提高蛋白质产量。第二个表达系统使用了谷氨酸合成酶(GS)基因,该基因被导入含有被可操作地连接到异源核酸的本发明的启动子或其变种的载体中。使用另外GS的竞争性抑制剂,如,硫代甲硫氨酸(methionine sulphoximine)(MSX),以增加载体的拷贝数,实现增加的蛋白质产量。
[0112] 任何恰当的原核或真核表达系统可被用来表达应用本发明的启动子蛋白质。表达系统的例子包括,但不局限于,植物、杆状病毒、酵母、细菌、果蝇、哺乳动物或无细胞(cell free)表达系统。例如,在Ausubel(1995),supra中提供了将表达载体导入哺乳动物、细菌、酵母、昆虫和植物细胞的标准方法。
[0113] 在某些实施方案中,本发明的启动子及其变种被用于基因治疗的方法中。例如,本发明的启动子及其变种被克隆到病毒或非病毒基因治疗载体中,使其被可操纵的连接到兴趣基因上。当载体被运送到目的物,如人类病人时,启动子启动编码治疗蛋白的基因表达。
[0114] 以下实施例提供了本发明的说明性实施方案。本领域的普通技术人员将意识到在不改变本发明的主旨和范围时,可进行多种修饰和改动。这些修饰和改动仍包括在本发明的范围内。这些实施例不以任何方式限制本发明。
[0115] 实施例
[0116] 以下描述了实施例中所用的物质和方法
[0117] A.CHO-K1细胞的培养
[0118] CHO-K1细胞从American Type Culture Collection(Manassas,VA)(ATCC No.CRL-9618)获得。在250ml含有15g/L DE-52微载体(Whatman,Kent,UK)、和10%供体小血清(DCS)(Invitrogen)的925细胞培养基中旋转培养细胞。细胞在37℃下,使用20-40%O2和5%CO2、并在大约60rpm下晃动6天。细胞在血清存在下生长后,每天用不含血清的925培养基更换80%(v/v)培养基。细胞在不含血清的培养基中生长11天后从细胞中提取RNA。为了确定mRNA的半衰期,将7mg/L的放射菌素D加入不含血清相中。
[0119] B.RNA的提取和分析
[0120] 使用Promega(Madison,WI)的RNAgents试剂盒从CHO-K1细胞中分离RNA。用RNA印记法分析基因表达。为进行RNA印记分析,应用 试剂盒(Ambion,Ausein,TX)在变性的glycoxal/二甲基亚砜凝胶上电泳分离5ug RNA。而后将RNA转到尼龙膜上(Schleiche&Schuell,Dassel,德国)。用通过PCR扩增的下述基因探针杂交斑点:半乳糖结合蛋白( 接收号No.M96676,核苷酸14-383);β-肌动蛋白( 接收
号No.U20114,核苷酸238-381);EF-1( 接收号No.D00522,核苷酸7-192);rpS21(接收号No.X79059,核苷酸68-340);铁蛋白( 接收号No.M99692,核
苷酸182-303)或商业上可购得的甘油醛-3-磷酸脱氢酶(GAPDH)片段(Ambion,Austin,TX)。
使用随机引物将每种PCR产物放射标记。用于扩增每种基因的PCR引物在表一中列出。
[0121] 表1
[0122]
[0123] C.CHO-K1细胞的转染
[0124] 为了瞬时转染,CHO-K1细胞被铺在含10%胎牛血清(FBS)(Invitrogen)的925培养基的6孔培养平板中。在用LipofectamineTM(Invitrogen)进行转染之前,细胞生长至50-75%融合度。pDsRED-1质粒(Clontech,Palo Alto,CA)与编码用于鉴别转染细胞的细胞表面CD20标记的pSV40-CD20质粒共同转染。pDsRED-1质粒编码海葵红色荧光蛋白(RFP),可通过FASC检测其表达。根据厂家的说明书进行转染。简言之,细胞与脂质体-DNA复合物在不含血清的Opti-MEMTM培养基(Invitrogen)中孵育16小时。用含10%FBS的925培养基替换该培养基,转染48小时后收集细胞。
[0125] D.荧光活化细胞挑选分析
[0126] 为进行FACS分析,用胰蛋白酶处理1X106个细胞,并用含2%FBS的冷PBS冲洗。随后用FITC标记的抗CD20抗体(Pharmingen,San Diego,CA)在上孵育细胞30分钟。然后用含2%FBS的冷PBS冲洗,并用1ml冷的PBS/2%FBS将细胞悬浮。使用FACSCaliburTM(BD Biosciences,San Diego,CA)进行FACS分析。评估所有的CD20阳性物的红色荧光蛋白的平均荧光强度,以分析启动子强度。
[0127] E.ASM分析
[0128] 将由编码酸性鞘磷脂酶(ASM)的载体转染的细胞的培养物在37℃下,与在250mM的醋酸钠中,浓度为12.5mM的合成底物2-(N-六癸酰基氨基)-4-硝基苯基磷酰基氯(Calbiochem,San Diego,CA)、pH5.5、0,含有1M醋酸锌、0.25mg/ml的牛血清白蛋白(BSA)和
0.15%的吐温20中孵育。通过加入含50%乙醇的0.2M的甘氨酸-氢氧化钠终止反应。通过使用比色仪测量415nm下的光密度,测量所产生的2-(N-六癸酰基氨基)-4-硝基酚盐的量来测定ASM的活性。
[0129] F.GAA分析
[0130] 将被编码α-葡萄糖苷酶(GAA)的载体转染的细胞培养基在37℃下,与在50mM的醋酸钠中浓度为40mM的合成底物p-硝基苯基-D-a-吡喃葡萄糖酯(Sigma,St Louis,MO)、pH4.3,并含有0.1%的胎牛血清(BSA)中孵育。通过加入0.3M的甘氨酸,pH10.6终止反应。通过使用比色仪测量400nm的光密度,测量所产生的p-硝基苯基的量来测定GAA的活性或量。
[0131] 实验例1:CHO-K1细胞中β-肌动蛋白启动子的鉴别
[0132] 应用基因表达的系列分析(SAGE)分析在不含血清的完全覆盖旋转培养(perfused spinner culture)上生长的CHO-K1细胞的完整的转录图谱。
[0133] SAGE的第一步包括使用标准技术从分离的CHO-K1细胞mRNA中合成双链DNA。随后用限制性内切酶Nlalll,又称锚定酶切断该cDNA,预期至少一次可切出最多的转录产物。通过结合到链霉亲和素的磁珠而将每一个被切断的cDNA的3’部分分离。然后将cDNA分成两部分,通过将其限制性位点锚定连接到含有II型限制性内切酶位点(例如,FokI)的连接物上。II型限制性内切酶在离其不对称的识别位点最多20个碱基对的指定位置切断。II型酶典型地被称为标记酶。用标记酶切段连接物产物可以使连接物与短的cDNA片段被释放出来。锚定和标记酶的联合使用可产生对于一个基因是唯一的10个碱基对的标记。
[0134] 应用这种方法,每个基因的标记序列可以用3’最多的Nlalll位点及其后的独特的10bp的序列代表。在标记不能别指定到已知基因的例子中,可以使用SAGE标记和常用是M13正向引物(GTTTTCCCAGTCACGAC,SEQ ID NO:18)对SAGE库的cDNA进行PCR扩增。随后将PCR产物克隆到pCR2.1载体(Invitrogen),并用标准的技术测序。基因的鉴定是以PCR产物的序列与 (www.ncbi.nlm.nih.gov/genbank)中已知序列的同源性为基础的。
[0135] 使 核 酸 序 列 与 小 鼠 和 / 或 大 鼠 的 相 对 物 进 行 比 对(www.ncbi.nlm.nih.gov/blast)以确定标记来源的序列。在分析鉴定出来的16个最丰富标记中,(表2),除一个标记外,其余的标记基因都被鉴定出来。在这15个被鉴定出来的基因中,5个是线粒体来源,3个是核重复元件。在每个细胞中,这些基因有多重拷贝发生,可能是其在SAGE的输出中丰富的原因。这些序列不能进行下一步的评估。
[0136] 表2
[0137]
[0138] 应用此种方法,作为CHO-K1细胞中最活跃的四个基因的启动子被鉴别出来。这些启动子是:β-肌动蛋白、核糖体蛋白S21(rpS21)、延伸因子1(EF-1)和甘油醛-3-磷酸脱氢酶(GAPDH)。在CHO-K1细胞中这些mRNA高水平的表达即归功于其各自启动子的活性,又归功于mRNAs的内在稳定性。尽管SAGE分析提供了基因mRNA的总体稳定状态的定量,其并不能区分基因的启动子活性和mRNA的稳定性哪一个是高表达水平基础的。因此,为了区分这两种可能性,测定了mRNAs的半衰期。简言之,通过对放射菌素D处理后的不同点的旋转培养中的CHO-K1细胞的RNA印记分析评估了候补基因的表达。
[0139] 最初,分析了rpS21、GAPDH和EF-1基因,发现这所有的基因都具有相对稳定的mRNAs,其半衰期大于8个小时。这表明这些mRNAs的丰富来自于mRNAs稳定,而不是各自启动子较高的活性。
[0140] 同样如上所述的在放射菌素D处理后的0、4、8、10和15小时后使用RNA印记方法测量半乳糖结合蛋白、铁蛋白、和β-肌动蛋白mRNA的半衰期。各自的RNA印记的结果在图6A中表示。相对mRNA水平在图6B中以曲线说明。这些数据表明虽然半乳糖结合蛋白和铁蛋白的半衰期大于8小时,β-肌动蛋白mRNA变化的更快,其半衰期为大约6小时。因此,对于β-肌动蛋白,启动子强度在总的稳定状态的mRNA水平中的贡献大于CHO-K1细胞中的其他候选。因此,在这些条件下,β-肌动蛋白启动子具有强启动子特点。
[0141] 实施例2:仓鼠β-肌动蛋白和rpS21启动子的分离和其特征
[0142] 根据实施例1中描述的结果,选择具有最高丰富度的候选(rpS21)和具有最快mRNA变化(β-肌动蛋白)进行进一步的研究。筛选λFIX II CHO-K1基因组文库(Stratagene,LaJolla,CA)以分离仓鼠的β-肌动蛋白和rpS21启动子的基因组DNA。
[0143] 为了分离β-肌动蛋白和rpS21基因克隆,将大肠杆菌株,XL1-Blue MRA(P2)培养在含10mM硫酸镁和0.2%麦芽糖的LB培养基中。使600nm处的吸光度为0.5时收集细菌,而后再重新悬浮在10mM硫酸镁中,。从库中取大约100万噬菌体,将其与细菌细胞在37℃中孵育15分钟。将熔化的琼脂糖凝胶加入噬菌体/细菌混合物,将细菌平铺在含琼脂的BioAssay平板(Nunc,Rochester,NY)。琼脂糖表面变硬后,将平板倒置,在30℃中过夜生长。而后将平板冷却,用GenescreenPlusTM(Perk Elmer Life Science,Wellesley,MA)尼龙滤纸覆盖两次。在具有1.5M的氯化钠的0.1M的氢氧化钠中将滤纸变性2分钟,随后中和。用UV交联滤纸,并标记。
[0144] 用于分离仓鼠β-肌动蛋白启动子的探针通过β-肌动蛋白5’末端( 接收号NoU20114的核苷酸238-381)的随机PCR产生。用于分离仓鼠rpS21启动子的探针通过使用SEQ ID NOs:12和13中的引物的PCR产生。使用标准的技术纯化杂交β-肌动蛋白和rpS21启动子的噬菌体。通过氯仿,酚,酚/氯仿(1:1)以及最后氯仿一系列抽提从噬菌体裂解液中分离噬菌体DNA。
[0145] 为了分离仓鼠β-肌动蛋白基因启动子,在乙醇沉淀后,用在仓鼠β-肌动蛋白基因的5’部分有切点的内切酶消化DNA,并用与筛选基因组库相同的探针进行DNA印记杂交。
[0146] 应用此方法,产生了大约7kb的Avrll片段和大约5.5kb的Sall片段,两者均可与探针杂交。随后将其克隆到pBluescriptII KS质粒(Stratagene)。7kb的Avrll片段的ATCC参考号No----,保藏----,200----,美国组织培养中心,邮政信箱1549,Manassas,VA20108,美国。
[0147] 含有Avrll和Sall片段的质粒被Sfol消化,除去片断包含β-肌动蛋白开放阅读框的片段的3’端。然后将这些片断克隆到pDsRED-1质粒(Clontech)以产生称为pDsRED-Avr(6.5kb)和pDsRED-Avr(5.1kb)的构建体。为了生成含有β-肌动蛋白基因内含子1全部的构建,使用以下引物作PCR:
[0148] 正向:AGGCCCAGCTTGGGACCAAGACAGAA(SEQ ID NO:35)
[0149] 反向:CGCGGATCCGGCGAACTATATCAGGGC(SEQ ID NO:36)
[0150] PCR片段产生两种产物:一个预期的大约7kb的产物和一个小点的3kb的非预期产物。两种PCR产物均被克隆到pDsRED-1质粒(Clontech)以产生pDsRED-Avr(1)-7和pDsRED-Avr(1)-3构建体。
[0151] 将克隆到pDsRED-1质粒(Clontech)的仓鼠β-肌动蛋白启动子每一个片段都被转染到CHO-K1细胞。使用上述的FACS测定每一个仓鼠β-肌动蛋白启动子片段的相对启动子强度。活性分析的结果将在下面总结。
[0152] 跨越核苷酸-1970至+1037的β-肌动蛋白启动子的Avr(1)-3片段表现出最高的启动子活性。跨越核苷酸-6000至+1037的Avr(1)-7片段表现出Avr(1)-3活性的47%的活性。Avr(6.5kb)、Sal(5.1kb)、肌动蛋白(3kb)和肌动蛋白-P(2.8kb)片段分别仅表现出Avr(1)-
3活性的2%、2%、2%和0%的启动子活性。
[0153] 随即对Avr(1)-3片段测序,序列为SEQ ID NO:1中的序列。另外,也对Avr(1)-3的5’上游区域的660核苷酸进行测序。这个从-2622到+1037的相对长的序列在SEQ ID NO:7中列出。
[0154] 从杂交的噬菌体中分离出DNA后,为了分离rpS21启动子,使用下列引物通过PCR对DNA扩增:
[0155] 正向:AGCTCTAATACGACTCACTATAGGGC(SEQ ID NO:40)
[0156] 反向:CTCTAGGCCAGCGGAGCGCAG(SEQ ID NO:41)。
[0157] 将PCR产物克隆到PCR2.1载体(Invitrogen)中,随后测序。仓鼠rpS21启动子的核苷酸序列为SEQ ID NO:39中的序列。使用在克隆点侧面的EcoRI位点切下启动子,将其克隆到pDsRED1-1载体(Clontech)。2kb的仓鼠rpS21启动子序列的ATCC参考号No PTA-6194,保藏于2005年8月5日,美国组织培养中心,邮政信箱1549,Manassas,VA20108,美国。
[0158] 实施例3:仓鼠β-肌动蛋白启动子与CMV启动子的功能对比
[0159] 将Avr(1)-3的启动子活性与CMV立即早期启动子(Invitrogen)和人EF-1启动子(Invitrogen)的活性进行比较。
[0160] 用含有Avr(1)-3、CMV立即早期启动子上游、或人EF-1启动子的pDsRED-1质粒转染CHO-K1细胞,每一个启动子都可操作地连接有RFP基因。转染48小时后用FACS检测RFP的表达。
[0161] 如图7A所示,在Avr(1)-3转染的细胞中,β-肌动蛋白启动子序列(SEQ ID NO:1)与CMV或EF-1启动子相比,表现出较高水平的RFP表达。特别地,Avr(1)-3转染的表达大约比CMV启动子的高2倍。
[0162] 为了确定观察到的表达情况在稳定的转染中是否保留,用G418TM筛选转染的CHO-K1细胞,共两周。然后分析存活的细胞中的RFP的表达。如图7B中所示,与瞬时转染的细胞相似,β-肌动蛋白启动子序列在SEQ ID NO:1中列出的Avr(1)-3转染的细胞中观察到最高的RFP表达,。实施例4:BHK-21和HEK293细胞中仓鼠β-肌动蛋白启动子的活性
[0163] 在应用实施例3所述的稳定转染的BHK-21(ATCC No.CCL 10)和HEK293(ATCC No.CRL-1573)细胞中比较仓鼠β-肌动蛋白启动子和CMV启动子的活性。如在CHO-K1细胞中所见到的,当用β-肌动蛋白启动子而不是CMV启动子时,在BHK-21细胞中的RFP的表达显著较高(表3)。在HEK293细胞中,β-肌动蛋白启动子启动的RFP的表达大体上与CMV启动子所引起的表达相同。
[0164] 表3
[0165]细胞系 CMV启动子 β-肌动蛋白启动子
BHK-21 8.3±0.4 121±99.8
HEK293 139±9.9 102±8.3
[0166] 实施例5:大鼠和小鼠的β-肌动蛋白启动子
[0167] 使用默认参数检索了公开的核苷酸序列数据库,以查找SEQ ID NO:1的仓鼠β-肌动蛋白启动子序列的同源序列。
[0168] 仓鼠β-肌动蛋白基因的5’部分( 接收号No.U21104;SEQ ID NO:4)显示出与仓鼠β-肌动蛋白启动子3’部分的98%的同一性。可是,在SEQ ID NO:1的仓鼠β-肌动蛋白启动子序列的全长上,此同一性仅为40%。这部分没有启动子活性。
[0169] 应用默认的参数和 程序对先前已知的人( 接收号No gi28337A)和鸡( 接收号No gi2170437)β-肌动蛋白启动子:与仓鼠β-肌动蛋白
启动子进行比对,以确定同源性。与仓鼠β-肌动蛋白启动子(SEQ ID NO:1)相比,人和鸡β-肌动蛋白启动子仅分别具有10%和1%的同一性。
[0170] 大鼠(Rattus norvegcus)基因组超重叠群( 接收号No.NW_042778)被鉴定为在大鼠12号染色体上,其含有与SEQ ID NO:1序列全长有67%同一性的核苷酸序列。
[0171] 相似地,在小鼠(Mus musculus)基因组第5号染色体上鉴别出一个重叠群(接收号No.NT_039324),其与SEQ ID NO:1序列全长有80%同一性。
[0172] 仓鼠β-肌动蛋白启动子(SEQ ID NO:1)与仓鼠基因序列、人、鸡、大鼠、和小鼠β-肌动蛋白启动子的比对分别在图3、4、5、1A-1B和2A-2B中说明。
[0173] 实施例6:大鼠和小鼠β-肌动蛋白启动子的活性
[0174] 分别在SEQ ID NOs:1和2中列出的大鼠和小鼠β-肌动蛋白启动子序列,并被克隆到pDsRED-1质粒(Clontech)。CMV启动子也被克隆到pDsRED-1质粒中RFP基因的上游。将这些质粒转染到CHO-K1细胞,或其他细胞系。转染48小时后,用FACS分析RFP的表达。
[0175] 用大鼠或小鼠β-肌动蛋白启动子转染的细胞预期比相似的条件下CMV启动子转染的RFP的表达高。
[0176] 实施例7:使用仓鼠β-肌动蛋白启动子的表达蛋白质
[0177] 为了进一步评估仓鼠β-肌动蛋白启动子的活性,使用二氢叶酸还原酶(DHFR)选择和甲氨蝶呤(MTX)扩增的表达系统。载体pGZ6衍生自pCLHAXSV2DHFR质粒,因而除含有SV40早期启动子控制的DHFR基因外,还含有3kb的仓鼠β-肌动蛋白启动子(SEQ ID NO:1)。pCLHAXSV2DHFR质粒先前曾被Cole et al.(1993)Biotechnology,11:1014-1024描述。简言之,pCLHAXSV2DHFR载体中的金属硫因启动子(MT)被β-肌动蛋白启动子替换而生成pGZ6载体。治疗目的的两种蛋白的cDNA,酸性鞘磷脂酶(ASM)和α-葡萄糖苷酶(GAA)被可操作地连TM
接到仓鼠β-肌动蛋白启动子。ASM cDNA从IMAGE 协会( 接收号No.A1587087)获
得。GAA的cDNA从纽约医科大学的Dr Martinuik处获得。ASM和GAA cDNA的核苷酸序列分别在SEQ ID NOs:37和38中列出。相似地,两个cDNA也被克隆到含有DHFR表达卡盒的载体中的CMV启动子的下游。DHFR缺陷CHO-K1细胞系DXB11被两套表达载体一式三份的转染。在两周后,含有20nM MTX的核酸缺陷培养基中,用PBS冲洗异源未被克隆的细胞池,并将其转入不含血清的介质。24小时后,测量介质中的ASM或GAA的量。
[0178] 此试验的结果在图8A和8B中表示。在稳定的细胞池中,仓鼠β-肌动蛋白启动子产生的ASM的水平比CMV启动子多2到15倍,而在GAA的细胞中,多2到5倍。
[0179] 进一步应用稳定的细胞池来评估β-肌动蛋白启动子维持长期蛋白表达的能力。典型地,为了产业上生产蛋白,通过增加选择步骤的次数和/或MTX浓度的方法选择具有较高基因拷贝的细胞,从而实现高表达。为了确定能否通过β-肌动蛋白启动子(SEQ ID NO:1)实现较高表达,将早期在20nM MTX下选择的ASM细胞池放大,使用高于10倍的MTX(200nM)选择两周。如表4中所总结的,3个被测β-肌动蛋白池中的两个在放大后显示出相对起始20nM细胞池的ASM水平高2-3倍。相反地,仅有一个被检测的CMV池显示比其来源的20nM池高的水平。在两个启动子产生的六个细胞池中,β-肌动蛋白产生的最高表达是CMV启动子产生的最高表达的6倍。这表明,至少在检测条件下,仓鼠β-肌动蛋白启动子优于CMV启动子。
[0180] 表4
[0181]
[0182] 在另一个试验中,仓鼠β-肌动蛋白启动子被用来表达组织血浆酶原激活剂(tPA)蛋白,该蛋白是一种溶解血栓剂,可解决病人的凝血问题。用在该载体中仓鼠β-肌动蛋白启动子被可操作地连接到tPA基因的pGZ6-tPA表达载体转染CHO-DXB11细胞,。通过在含有200nM MTX的核酸缺陷培养基中生长来选择稳定转染的细胞。然后将得到的未克隆细胞池中加入500nM MTX以放大转染基因的拷贝数。从细胞中除去MTX,在1L的旋转培养中放大细胞池并种植到CytoporeTM 2微载体上。细胞在含血清的培养基中生长7天,以后的4天,每天用不含血清的培养基替换80%的血清。然后用15天收集培养基并用可买到的ELISA试剂盒(tPA试剂盒,Biopool International,Inc.,Ventura,CA)分析tPA表达。如本
的图9所示,使用仓鼠β-肌动蛋白启动子导致tPA的表达浓度为每天30mg/L。此结果可以与最近发表的报道相比,用其他启动子4-8天后可产生30-40mg/L tPA(Senger et al.(2003)Biotechnology Progress 19:1199-1209;Dowd等人(2000)Biotechnology Progress 16:
786-794)。
[0183] 实施例8:应用仓鼠β-肌动蛋白启动子制备抗体产量
[0184] 为了生成抗TGF-β族抗体,在两个分别的pGZ6表达载体中,编码抗TGF-β抗体轻链或抗TGF-β抗体重链的核酸被克隆到β-肌动蛋白启动子的下游。
[0185] 用两种表达载体转染DHFR缺陷CHO-K1细胞系DXB11。在含有MTX的核酸缺陷培养基中选择两个星期后,测定培养基中轻链和重链的抗TGF-β抗体水平。
[0186] 实施例9:使用仓鼠rpS21启动子的蛋白表达
[0187] 在CHO-DXB11细胞中比较了仓鼠rpS21启动子与仓鼠β-肌动蛋白启动子的表达活性。用含有可操作地连接到仓鼠rpS21启动子SEQ ID NO:39(pGZ31C-GAA)或仓鼠β-肌动蛋白启动子SEQ ID NO:1(pGZ61C-GAA)的人α-葡萄糖苷酶(rhGAA)的表达载体转染到CHO-DXB11细胞。在两种情况下,rhGAA通过内部核糖体进入点(IRES)序列被连接到编码细胞表面标记(CD20)的基因。在核酸缺陷培养基中,用0.2uM的MTX选择细胞后,用FITC连接的抗CD20抗体标记细胞,并用过FACS分离高表达的克隆。将被选出的细胞铺到96孔平板上,放大以分析rhGAA的表达。分析了仓鼠rpS21启动子的38个克隆和仓鼠β-肌动蛋白启动子的29个克隆。表5显示了所得两种启动子克隆的表达范围分布。
[0188] 表5
[0189]
[0190]
[0191] 在另一个试验中,仓鼠rpS21启动子被用于在CHO-DXB11细胞中表达ASM。对rpS21启动子与β-肌动蛋白和CMV启动子的活性进行了比较。CHO-DXB11细胞分三分转染,直接在200nM MTX中选择,或先在20nM MTX而后在200nM MTX中放大两周,如实施例7中所述的。如所述测量培养基中的ASM水平。在未转染的细胞中测不到ASM表达。
[0192] 如表6所总结的,三份rpS21细胞池在放大后均显示出相对其来源的初始20nM细胞池大2-3倍的ASM表达水平。另外,所产生的ASM水平比CMV启动子所产生的ASM水平高(实施例7)。
[0193] 表6
[0194]
[0195] 在直接用200nM MTX选择的细胞所产生的ASM表达水平在表7中总结。
[0196] 表7
[0197]
[0198]
[0199] 仓鼠rpS21启动子在200nM MTX中产生的ASM水平比CMV所产生的平均高大约1-2倍。在另一方面,β-肌动蛋白启动子产生的ASM水平比CMV所产生的平均高大约3-4倍。因此,当用于表达GAA时,rpS21启动子至少具有与β-肌动蛋白启动子一样的活性,然而,当用于ASM表达时,其表现出低于β-肌动蛋白启动子的活性。然而,两种启动子的活性均大于CMV启动子。
[0200] 根据在此引作参考的说明书中的对比文献,可以充分理解书明书。说明书中的实施分案为本发明的实施方案提供了解释,但并不限制本发明的范围。本领域技术人员应该意识到许多其他的实施方案也包括在本发明的范围内。在此引用的所有的出版物和专利和在此公开通过接收号和数据库参考而鉴别的序列被作为整体通过参考而并入此文。在一定程度上被引入作参考的内容与本说明书相矛盾或不一致的程度,本说明将取代这些内容。在此引用的任何参考文献并非是本发明的现有技术
[0201] 除非特别指出,应该认为所有在本说明书,包括权利要求中的用于表示成分、细胞培养、处理条件等的数字都用术语“大约”限定。从而,除非特别指出是相反的,数字参数是大概的,可以依据本发明所要获得的特性的不同而不同。除非特别指出,在一系列成分前的术语“至少”应当被理解成指系列中的每一个成分。本领域技术人员可以使用不超出常规的实验认识到或者可以确定此处描述的发明的特定实施方案的许多等同方案。这些等同方案包括在权利要求中。
QQ群二维码
意见反馈