具有α-葡糖苷酶活性的多肽及编码其的多核苷酸

申请号 CN201410144299.8 申请日 2005-06-29 公开(公告)号 CN104195123A 公开(公告)日 2014-12-10
申请人 诺维信股份有限公司; 发明人 苏珊娜.奥塔尼; 戈海燕; 保罗.哈里斯; 戴比.亚弗; 亚历山大.布林科夫斯基;
摘要 本 发明 涉及具有α-葡糖苷酶活性的多肽及编码其的多核苷酸,具体的涉及具有α-葡糖苷酶活性的分离多肽和编码该多肽的分离多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞,以及生产和使用该多肽的方法。
权利要求

1.具有α-葡糖苷酶活性的分离多肽,选自:
(a)具有与SEQ ID NO:2的第15至881位基酸或SEQ ID NO:4的第30至967位氨基酸有至少75%同一性,或与SEQ ID NO:6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽;
(b)由在中等严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交,或在高严谨条件下与(i)SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:5的第
58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码的多肽;以及
(c)包括SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸的一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
2.权利要求1的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ ID NO:4的第30至967位氨基酸有至少75%、80%、85%、90%、95%或97%同一性的氨基酸序列。
3.权利要求1或2的多肽,具有与SEQ ID NO:6的第20至988位氨基酸有至少85%、
90%、95%或97%同一性的氨基酸序列。
4.权利要求1-3中任何一项的多肽,其包含SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6的氨基酸序列,或由SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6;或其具有α-葡糖苷酶活性的片段组成。
5.权利要求1-3中任何一项的多肽,其由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸组成。
6.权利要求1的多肽,其由在中等或中等-高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码。
7.权利要求1的多肽,其由在高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸,或SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸、或SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码。
8.权利要求1的多肽,其中该多肽是包括SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸的一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
9.权利要求1的多肽,其由包含在包含于大肠杆菌NRRL B-30751中的质粒pSMO216、包含于大肠杆菌NRRL B-30750中的质粒pHyGe011、或包含于大肠杆菌NRRL B-30856中的质粒pJSF9b中的多核苷酸编码。
10.分离的多核苷酸,其包含编码权利要求1-9中任何一项多肽的核苷酸序列。
11.权利要求10的分离的多核苷酸,其在SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的成熟多肽编码序列中具有至少一个突变,其中该突变的核苷酸序列编码分别由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第
20至988位氨基酸组成的多肽。
12.包括与指导多肽在表达宿主中生产的一个或多个调控序列可操作连接的权利要求
10或11的多核苷酸的核酸构建体。
13.包括权利要求12的核酸构建体的重组表达载体。
14.包括权利要求12的核酸构建体的重组宿主细胞。
15.生产权利要求1-9中任何一项多肽的方法,包括(a)在有助于生产该多肽的条件下培养在其野生型形态时能够生产多肽的细胞;以及(b)回收该多肽。
16.生产权利要求1-9中任何一项多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括含有编码该多肽的核苷酸序列的核酸构建体的宿主细胞;以及(b)回收该多肽。
17.生产亲本细胞突变体的方法,其包括使编码权利要求1-9中任何一项多肽的核苷酸序列破坏或缺失,这导致该突变体比所述亲本细胞产生较少的该多肽。
18.通过权利要求17的方法生产的突变体细胞
19.权利要求18的突变体细胞,其进一步包括编码天然或异源蛋白质的基因。
20.生产蛋白质的方法,包括(a)在有助于生产该蛋白质的条件下培养权利要求19的突变体细胞;以及(b)回收该蛋白质。
21.通过(a)使DNA群在中等、中等-高或高严谨条件下与(i)SEQ ID NO:1的第43至
2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第
43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的该杂交多核苷酸来获得的分离的多核苷酸。
22.通过(a)使DNA群在高严谨条件下与(i)SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的该杂交多核苷酸来获得的分离多核苷酸。
23.生产具有突变核苷酸序列的多核苷酸的方法,包括:(a)将至少一个突变导入SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的成熟多肽编码序列,其中该突变的核苷酸序列编码由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸组成的多肽;以及(b)回收包括该突变核苷酸序列的多核苷酸。
24.通过权利要求23的方法产生的突变多核苷酸。
25.生产多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括编码该多肽的权利要求24的突变多核苷酸的细胞;以及(b)回收该多肽。
26.包括编码蛋白质的基因的核酸构建体,所述基因与编码由SEQ IDNO:1的第1至42位核苷酸、SEQ ID NO:3的第1至145位核苷酸、或SEQID NO:5的第1至57位核苷酸组成的信号肽的核苷酸序列可操作连接,其中该基因对于该核苷酸序列是外源的。
27.包括权利要求26的核酸构建体的重组表达载体。
28.包括权利要求26的核酸构建体的重组宿主细胞。
29.生产蛋白质的方法,包括(a)在有助于生产该蛋白的条件下培养权利要求41的重组宿主细胞;以及(b)回收该蛋白。
30.生产权利要求1-9中任何一项多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明的具有α-葡糖苷酶活性的多肽;以及(b)回收该多肽。
31.转基因的植物、植物部分或植物细胞,其已经用编码权利要求1-9中任何一项多肽的多核苷酸转化。
32.生产发酵的麦芽饮料的方法,其中在麦芽汁生产过程中的麦芽汁热处理之前,添加权利要求1-9中任一项具有α-葡糖苷酶活性的多肽来用于制造发酵的麦芽饮料。
33.用于生产啤酒的方法,其中权利要求1-9中任一项具有α-葡糖苷酶活性的多肽在啤酒酿造中被添加入发酵过程。

说明书全文

具有α-葡糖苷酶活性的多肽及编码其的多核苷酸

[0001] 本申请是申请日为2005年6月29日,申请号为200580029141.5(国际申请号为PCT/US2005/023678),名称为“具有α-葡糖苷酶活性的多肽及编码其的多核苷酸”的发明专利申请的分案申请。

发明背景

发明领域
[0002] 本发明涉及具有α-葡糖苷酶活性的分离多肽和编码该多肽的分离多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞,以及生产和使用该多肽的方法。
[0003] 相关技术的说明
[0004] 若干酶涉及淀粉的降解。该酶包括α-淀粉酶、β-淀粉酶、淀粉葡萄糖苷酶、支链淀粉酶、淀粉异构酶、α-葡糖苷酶、和环糊精糖基转移酶。
[0005] α-葡糖苷酶(EC3.2.1.20)解多种底物中的末端、非还原的α-1,4-键葡萄糖残基,释放葡萄糖。它们快速降解二糖和寡聚糖,而如果有多糖的话,多糖被慢慢地受到侵袭。麦芽糖、麦芽糖衍生物蔗糖、芳基-α-葡糖苷、和烷基-α-糖苷能够充当底物。
[0006] 来 自 烟 曲 霉 的α- 葡 糖 苷 酶 的 纯 化 和 特 性 已 经 由 Rudick and Elbein,1974,Archives of Biochemistry and Biophysics161:281-290进行描述。
[0007] 已经报道其他的丝状真菌生产α-葡糖苷酶,例如黄曲霉(Aspergillusflavus)(Olutiola,1981,Mycologia73:1130)、 构 巢 曲 霉 (Kato 等 ,2002,Appl.Environ.Microbiol.68:1250-1256)、黑 曲 霉(Rudick等 ,1979,Archives ofBiochemistry and Biophysics193:509)、 米 曲 霉 (Leibowitz and Mechlinski,1926,Hoppe-Seyler’s Zeitschrift für Physiologische Chemie154:64),Mucor javanicus(Yamasaki等 ,1978,Berichte des Ohara Instituts für LandwirtschaftlicheBiologie17:123),Mucor racemosus(Yamasaki 等 ,1977,Agricultural andBiological Chemistry41:1553),Mucor rouxii(Flores-Carreon and Ruiz-Herrera,1972,Biochemica et Biophysica Acta258:496)、 产 紫 青 霉 (Yamasaki 等 ,1976,Agricultural and Biological Chemistry40:669), 和 Penicillium oxalicum(Yamasaki等,1977,Agricultural and Biological Chemistry41:1451)。
[0008] α-葡糖苷酶可与其他的淀粉降解酶,例如α-淀粉酶组合使用,以在其中需要转化为可发酵糖的工业应用中获得完全的淀粉水解。因此,本领域中需要具有改善特性,例如最适pH、最适温度和耐热的备选α-葡糖苷酶。
[0009] 本发明的目的是提供具有α-葡糖苷酶活性的多肽和编码该多肽的多核苷酸。
[0010] 发明概述
[0011] 本发明涉及具有α-葡糖苷酶活性的分离多肽,其选自:
[0012] (a)具有与SEQ ID NO:2的第15至881位基酸或SEQ ID NO:4的第30至967位氨基酸有至少75%同一性,或与SEQ ID NO:6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽;
[0013] (b)由在中等严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交,或在高严谨条件下与(i)SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的核苷酸序列编码的多肽;以及
[0014] (c)包括SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸的一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
[0015] 本发明也涉及编码具有α-葡糖苷酶活性的多肽的分离多核苷酸,其选自:
[0016] (a)编码具有与SEQ ID NO:2的第15至881位氨基酸或SEQ ID NO:4的第30至967位氨基酸有至少75%同一性,或与SEQ ID NO:6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽的多核苷酸;
[0017] (b)与SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸有至少75%同一性或与SEQ ID NO:5的第58至3164位核苷酸有至少85%同一性的多核苷酸;和
[0018] (c)在中等严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交,或在高严谨条件下与(i)SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸。
[0019] 本发明也涉及包括该多核苷酸的核酸构建体、重组表达载体,和重组的宿主细胞。
[0020] 本发明也涉及生产这种具有α-葡糖苷酶活性的多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括包含编码该多肽的多核苷酸的核酸构建体的宿主细胞;以及(b)回收该多肽。
[0021] 本发明也涉及使用α-葡糖苷酶的方法。
[0022] 本发明进一步涉及包括编码蛋白质的基因的核酸构建体,其中所述基因与编码信号肽的核苷酸序列可操作连接,其中该核苷酸序列由SEQ ID NO:1的第1至42位核苷酸、SEQ ID NO:3的第1至145位核苷酸、或SEQ ID NO:5的第1至57位核苷酸组成,其中该基因对于该核苷酸序列是外源的。
[0023] 本发明还涉及如下方面:
[0024] 1.具有α-葡糖苷酶活性的分离多肽,选自:
[0025] (a)具有与SEQ ID NO:2的第15至881位氨基酸或SEQ ID NO:4的第30至967位氨基酸有至少75%同一性,或与SEQ ID NO:6的第20至988位氨基酸有至少85%同一性的氨基酸序列的多肽;
[0026] (b)由在中等严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交,或在高严谨条件下与(i)SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码的多肽;以及
[0027] (c)包括SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸的一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
[0028] 2.项1的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ IDNO:4的第30至967位氨基酸有至少75%同一性的氨基酸序列。
[0029] 3.项2的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ IDNO:4的第30至967位氨基酸有至少80%同一性的氨基酸序列。
[0030] 4.项3的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ IDNO:4的第30至967位氨基酸有至少85%同一性的氨基酸序列。
[0031] 5.项4的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ IDNO:4的第30至967位氨基酸有至少90%同一性的氨基酸序列。
[0032] 6.项5的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ IDNO:4的第30至967位氨基酸有至少95%同一性的氨基酸序列。
[0033] 7.项6的多肽,具有与SEQ ID NO:2的第15至881位氨基酸或SEQ IDNO:4的第30至967位氨基酸有至少97%同一性的氨基酸序列。
[0034] 8.项3的多肽,具有与SEQ ID NO:6的第20至988位氨基酸有至少85%同一性的氨基酸序列。
[0035] 9.项4的多肽,具有与SEQ ID NO:6的第20至988位氨基酸有至少90%同一性的氨基酸序列。
[0036] 10.项5的多肽,具有与SEQ ID NO:6的第20至988位氨基酸有至少95%同一性的氨基酸序列。
[0037] 11.项6的多肽,具有与SEQ ID NO:6的第20至988位氨基酸有至少97%同一性的氨基酸序列。
[0038] 12.项1-11中任何一项的多肽,包括SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6的氨基酸序列。
[0039] 13.项1-12中任何一项的多肽,其由SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6;或其具有α-葡糖苷酶活性的片段组成。
[0040] 14.项13的多肽,其由SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6组成。
[0041] 15.项14的多肽,其由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸组成。
[0042] 16.项1的多肽,其由在中等严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ IDNO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码。
[0043] 17.项1的多肽,其由在中等-高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码。
[0044] 18.项1的多肽,其由在高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸,或SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸、或SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸编码。
[0045] 19.项1的多肽,其中该多肽是包括SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸的一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
[0046] 20.项1的多肽,其由包含在包含于大肠杆菌NRRL B-30751中的质粒pSMO216、包含于大肠杆菌NRRL B-30750中的质粒pHyGe011、或包含于大肠杆菌NRRL B-30856中的质粒pJSF9b中的多核苷酸编码。
[0047] 21.包括编码项1-20中任何一项多肽的核苷酸序列的分离多核苷酸。
[0048] 22.项21或22的分离多核苷酸,其在SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的成熟多肽编码序列中具有至少一个突变,其中该突变的核苷酸序列编码分别由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸组成的多肽。
[0049] 23.包括与指导多肽在表达宿主中生产的一个或多个调控序列可操作连接的项21或22的多核苷酸的核酸构建体。
[0050] 24.包括项23的核酸构建体的重组表达载体。
[0051] 25.包括项23的核酸构建体的重组宿主细胞。
[0052] 26.生产项1-20中任何一项多肽的方法,包括(a)在有助于生产该多肽的条件下培养在其野生型形态时能够生产多肽的细胞;以及(b)回收该多肽。
[0053] 27.生产项1-20中任何一项多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括含有编码该多肽的核苷酸序列的核酸构建体的宿主细胞;以及(b)回收该多肽。
[0054] 28.生产亲本细胞突变体的方法,其包括使编码项1-20中任何一项多肽的核苷酸序列破坏或缺失,这导致该突变体比所述亲本细胞产生较少的该多肽。
[0055] 29.通过项28的方法生产的突变体细胞
[0056] 30.项29的突变体细胞,其进一步包括编码天然或异源蛋白质的基因。
[0057] 31.生产蛋白质的方法,包括(a)在有助于生产该蛋白质的条件下培养项30的突变体细胞;以及(b)回收该蛋白质。
[0058] 32.通过(a)使DNA群在中等严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ IDNO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的该杂交多核苷酸来获得的分离多核苷酸。
[0059] 33.项32的分离多核苷酸,其通过(a)使DNA群在中等-高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的该杂交多核苷酸来获得。
[0060] 34.项33的分离多核苷酸,其通过(a)使DNA群在高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸或SEQ ID NO:3的第146至3013核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的该杂交多核苷酸来获得。
[0061] 35.通过(a)使DNA群在高严谨条件下与(i)SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的该杂交多核苷酸来获得的分离多核苷酸。
[0062] 36.生产具有突变核苷酸序列的多核苷酸的方法,包括(a)将至少一个突变导入SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的成熟多肽编码序列,其中该突变的核苷酸序列编码由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸组成的多肽;以及(b)回收包括该突变核苷酸序列的多核苷酸。
[0063] 37.通过项36的方法产生的突变多核苷酸。
[0064] 38.生产多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括编码该多肽的项37的突变多核苷酸的细胞;以及(b)回收该多肽。
[0065] 39.包括编码蛋白质的基因的核酸构建体,所述基因与编码由SEQ IDNO:1的第1至42位核苷酸、SEQ ID NO:3的第1至145位核苷酸、或SEQID NO:5的第1至57位核苷酸组成的信号肽的核苷酸序列可操作连接,其中该基因对于该核苷酸序列是外源的。
[0066] 40.包括项39的核酸构建体的重组表达载体。
[0067] 41.包括项39的核酸构建体的重组宿主细胞。
[0068] 42.生产蛋白质的方法,包括(a)在有助于生产该蛋白的条件下培养项41的重组宿主细胞;以及(b)回收该蛋白。
[0069] 43.生产项1-20中任何一项多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明的具有α-葡糖苷酶活性的多肽;以及(b)回收该多肽。
[0070] 44.转基因的植物、植物部分或植物细胞,其已经用编码项1-20中任何一项多肽的多核苷酸转化。
[0071] 45.生产发酵的麦芽饮料的方法,其中在麦芽汁生产过程中的麦芽汁热处理之前,添加项1-20中任一项具有α-葡糖苷酶活性的多肽来用于制造发酵的麦芽饮料。
[0072] 46.用于生产啤酒的方法,其中项1-20中任一项具有α-葡糖苷酶活性的多肽在啤酒酿造中被添加入发酵过程。
[0073] 附图简述
[0074] 图1A-E显示烟曲霉α-葡糖苷酶(Agl1)的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:1和2)。
[0075] 图2A-C显示烟曲霉α-葡糖苷酶(Agl2)的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:3和4)。
[0076] 图3A-E显示烟曲霉α-葡糖苷酶(Agl3)的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:5和6)。
[0077] 图4显示pAlLo1的限制图谱。
[0078] 图5显示pBM121b的限制图谱。
[0079] 图6显示pBM120a的限制图谱。
[0080] 图7显示pSMO216的限制图谱。
[0081] 图8显示pHyGe011的限制图谱。
[0082] 图9显示pJSF9b的限制图谱。
[0083] 图10显示纯化的烟曲霉Agl1α-葡糖苷酶于37°C在50mM乙酸盐缓冲液/50mM磷酸盐缓冲液中活性的pH依赖性。
[0084] 图11显示在0.05M乙酸钠,pH5.0中于不同温度培养5分钟后纯化的烟曲霉Agl1α-葡糖苷酶的热稳定性
[0085] 图12显示纯化的烟曲霉Agl1α-葡糖苷酶在50mM乙酸钠,pH5.0中活性的温度依赖性。
[0086] 图13显示纯化的烟曲霉Agl3α-葡糖苷酶于37°C在50mM乙酸盐缓冲液/50mM磷酸盐缓冲液中活性的pH-依赖性。
[0087] 图14显示纯化的烟曲霉Agl3α-葡糖苷酶在50mM乙酸钠,pH5.0中在不同温度培养5分钟后的热稳定性
[0088] 图15显示纯化的烟曲霉Agl3α-葡糖苷酶在50mM乙酸钠,pH5.0中活性的温度依赖性。
[0089] 定义
[0090] α-葡糖苷酶活性:术语“α-葡糖苷酶活性”在此定义为α-D-葡糖苷葡萄糖水解酶活性(E.C.3.2.1.20),其催化末端、非还原的1,4-连接的α-D-葡萄糖残基的外切水解,伴随α-D-葡萄糖的释放。酶活性的天然底物包括例如,
[0091] 麦芽糖、麦芽三糖、麦芽四糖、麦芽五糖、淀粉(可溶的)、直链淀粉、支链淀粉、异麦芽糖、曲二糖、蔗糖、黑曲霉糖、松二糖、松三糖、和糖原。为了本发明的目的,α-葡糖苷酶活性以麦芽糖作为底物在0.1M乙酸钠缓冲液,pH4.3,于25℃测定。一个单位的α-葡糖苷酶活性定义为在乙酸钠缓冲液中在25℃,pH4.3每分钟从作为底物的麦芽糖产生1.0μmole的葡萄糖。
[0092] 本发明的多肽具有由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸所示的氨基酸序列组成的多肽的至少20%,优选40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%,最优选至少95%,以及最优选至少100%的α-葡糖苷酶活性。
[0093] 分离的多肽:术语“分离的多肽”如在此使用的,是指通过SDS-PAGE所测定的为至少20%纯、优选至少40%纯、更优选至少60%纯、更优选至少80%纯、最优选至少90%纯、以及最优选至少95%纯。
[0094] 基本上纯的多肽:术语“基本上纯的多肽”在此表示按重量计包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、更优选至多2%、最优选至多1%、以及最优选至多0.5%的与其天然或重组缔合的其他多肽物质的多肽制品。因此优选基本上纯的多肽是按重量计以至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、更优选至少99%、最优选至少99.5%纯、以及最优选100%纯的总多肽物质存在于制品中。
[0095] 本发明的多肽优选是基本上纯的形式。特别地,优选该多肽是“本质上纯的形式”,即,该多肽制品基本上不含与其天然或重组缔合的其他多肽物质。这可通过例如借助于众所周知的重组方法或经典的纯化方法制备多肽来实现。
[0096] 在此术语“基本上纯的多肽”和术语“分离的多肽”以及“分离形式的多肽”同义。
[0097] 同一性:两个氨基酸序列之间或两个核苷酸序列之间的关系是通过参数“同一性”来描述的。
[0098] 为了本发明的目的,两个氨基酸序列之间同一性的程度通过ClustalTM TM方 法 (Higgins,1989,CABIOS5:151-153), 利 用 LASERGENE MEGALIGN 软 件(DNASTAR,Inc.,Madison,WI)来确定,其中使用同一性表格和下列多个排列参数:缺口罚分为10,缺口长度罚分为10。成对排列参数是K元组=1,缺口罚分=3,窗口=5和对线=5。
[0099] 为了本发明的目的,两个核苷酸序列之间同一性的程度通过Wilbur-Lipman方 法 (Wilbur 和 Lipman,1983,Proceedings of the NationalAcademy of Science TM TMUSA80:726-730),利用LASERGENE MEGALIGN 软件(DNASTAR,Inc.,Madison,WI)来确定,其中使用同一性表格和下列多个排列参数:缺口罚分为10和缺口长度罚分为10。成对排列参数是K元组=3,缺口罚分=3和窗口=20。
[0100] 多肽片段:术语“多肽片段”在此定义为从氨基酸序列或其同系物的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,其中该片段具有α-葡糖苷酶活性。在优选的方面,片段包含SEQ ID NO:2或其同系物的至少770个氨基酸残基,更优选至少800个氨基酸残基,以及最优选至少830个氨基酸残基。在另外优选的方面,片段包含SEQ ID NO:4或其同系物的至少820个氨基酸残基,更优选至少860个氨基酸残基,以及最优选至少900个氨基酸残基。在另外优选的方面,片段包含SEQ ID NO:6或其同系物的至少820个氨基酸残基,更优选至少860个氨基酸残基,以及最优选至少900个氨基酸残基。
[0101] 等位变体:术语“等位变体”在此表示占据相同染色体位点的基因的任何两个或多个备选形式。等位变化通过突变天然产生,并且可能导致种群内的多态性。基因突变可能是沉默的(在编码的多肽中无变化)或可能编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
[0102] 分离的多核苷酸:术语“分离的多核苷酸”如在此使用的,是指通过琼脂糖电泳所测定的为至少20%纯、优选至少40%纯、更优选至少60%纯、更优选至少80%纯、最优选至少90%纯、以及最优选至少95%纯。
[0103] 基本上纯的多核苷酸:术语“基本上纯的多核苷酸”如在此使用的,是指不含其他外来的或不需要的核苷酸,并且为适用于遗传工程化蛋白质生产系统的形式的多核苷酸制品。因此,基本上纯的多核苷酸按重量计包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、更优选至多2%、最优选至多1%、以及最优选至多0.5%的与其天然或重组缔合的其他多核苷酸物质。然而基本上纯的多核苷酸可包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸按重量计算是至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,最优选至少99%,以及更优选至少99.5%纯。本发明的多核苷酸优选是基本上纯的形式。特别地,优选在此公开的多核苷酸是“本质上纯的形式”(essentially),即,该多核苷酸制品基本上不含与其天然或重组缔合的其他多核苷酸物质。在此术语“基本上纯的多核苷酸”和术语“分离的多核苷酸”以及“分离形式的多核苷酸”同义。多核苷酸可以是基因组、cDNA、RNA、半合成的、合成的起源,或其任何组合。
[0104] 亚序列:术语“亚序列”在此定义为从多核苷酸或其同系物的5'和/或3'端缺失一个或多个核苷酸的核苷酸序列,其中该亚序列编码具有α-葡糖苷酶活性的多肽片段。在优选的方面,亚序列包含SEQ ID NO:1或其同系物的至少2310个核苷酸,更优选至少2400个核苷酸,以及最优选至少2490个核苷酸。在另外优选的方面,亚序列包含SEQ ID NO:3或其同系物的至少2460个核苷酸,更优选至少2580个核苷酸,以及最优选至少2700个核苷酸。在另外优选的方面,亚序列包含SEQ ID NO:5或其同系物的至少2460个核苷酸,更优选至少2580个核苷酸,以及最优选至少2700个核苷酸。
[0105] cDNA:术语"cDNA"在此定义为可通过从真核细胞获得的成熟、拼接、mRNA分子逆转录制备的DNA分子。cDNA缺乏通常存在于相应的基因组DNA中的内含子序列。起始的、初级RNA转录本是在作为成熟拼接的mRNA出现前通过一系列步骤加工的mRNA前体。这些步骤包括通过称为拼接的过程除去内含子序列。来源于mRNA的cDNA因此缺乏任何内含子序列。
[0106] 核酸构建体:术语"核酸构建体"如在此使用的,是指分离自天然存在的基因或已经被改变而以不会另外天然存在的方式包含核酸节段的单链-或双链的核酸分子。当核酸构建体包含为表达本发明的编码序列所需要的调控序列时,术语核酸构建体和术语“表达盒”同义。
[0107] 调控序列:术语“调控序列”在此定义为包括为表达编码本发明多肽的多核苷酸所必需或有益的所有组分。每个调控序列对于编码该多肽的核苷酸序列可能是天然的或彼此是天然或外来的。这种调控序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。至少该调控序列包括启动子、和转录和翻译终止信号。调控序列可能为了导入促进调控序列与编码多肽的核苷酸序列编码区连接的特异限制性位点的目的而拥有连接子。
[0108] 可操作连接的:术语“可操作连接的”在此表示其中调控序列被置于相对于多核苷酸序列的编码序列适当的位置而使得该调控序列指导多肽编码序列的表达的构型。
[0109] 编码序列:当在此使用时,术语“编码序列”是指直接确定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开放阅读框来确定,其通常从ATG起始密码子或备选的起始密码子,例如GTG和TTG开始,并且以例如TAA、TAG和TGA的终止密码子结束。编码序列可以是DNA、cDNA或重组的核苷酸序列。
[0110] 表达:术语“表达”包括涉及多肽生产的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。
[0111] 表达载体:术语“表达载体”在此定义为包括编码本发明多肽的多核苷酸,并且其与保证其表达的附加核苷酸可操作连接的线性或环状DNA分子。
[0112] 宿主细胞:术语"宿主细胞"如在此使用的,包括对用包括本发明多核苷酸的核酸构建体或表达载体转化、转染、转导等易感的任何细胞类型。
[0113] 修饰:术语“修饰”在此是指由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸、或其同源序列组成的多肽的任何化学修饰,以及编码那个多肽的DNA的遗传操作。修饰可以是取代、缺失和/或插入一个或多个氨基酸以及置换一个或多个氨基酸侧链
[0114] 人工变体:当在此使用时,术语“人工变体”是指由表达SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的修饰核苷酸序列的生物体产生的具有α-葡糖苷酶活性的多肽。修饰的核苷酸序列是通过改变在SEQ ID NO:1、SEQID NO:3、或SEQ ID NO:5中公开的核苷酸序列的人为介入获得的。
[0115] 发明详述
[0116] 具有α-葡糖苷酶活性的多肽
[0117] 在第一个方面,本发明涉及具有与SEQ ID NO:2的第15至881位氨基酸或SEQ ID NO:4的第30至967位氨基酸(即,成熟多肽)有至少75%,优选至少80%,更优选至少85%,更优选至少90%,最优选至少95%,以及最优选至少97%的同一性程度的氨基酸序列,且具有α-葡糖苷酶活性的分离多肽,或与SEQ ID NO:6的第20至988位氨基酸(即,成熟多肽)有至少85%,优选至少90%,更优选至少95%,以及最优选至少97%的氨基酸序列,且具有α-葡糖苷酶活性的分离多肽(在下文中为"同源多肽")。在优选的方面,同源多肽具有与SEQ ID NO:2的第15至881位氨基酸,SEQ ID NO:4的第30至967位氨基酸,或SEQ ID NO:6的第20至988位氨基酸相差10个氨基酸,优选相差5个氨基酸,更优选相差4个氨基酸,更优选相差3个氨基酸,最优选相差2个氨基酸,以及最优选相差1个氨基酸的氨基酸序列。
[0118] 本发明的多肽优选包括SEQ ID NO:2的氨基酸序列,或其等位变体;或具有α-葡糖苷酶活性的其片段。在优选的方面,多肽包括SEQ ID NO:2的氨基酸序列。在另外优选的方面,多肽包括SEQ ID NO:2的第15至881位氨基酸,或其等位变体;或具有α-葡糖苷酶活性的其片段。在另外优选的方面,多肽包括SEQ ID NO:2的第15至881位氨基酸。在另外优选的方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或具有α-葡糖苷酶活性的其片段组成。在另外优选的方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另外优选的方面,多肽由SEQ ID NO:2的第15至881位氨基酸或其等位变体;或具有α-葡糖苷酶活性的其片段组成。在另外优选的方面,多肽由SEQ ID NO:2的第15至881位氨基酸组成。
[0119] 本发明的多肽优选包括SEQ ID NO:4的氨基酸序列,或其等位变体;或具有α-葡糖苷酶活性的其片段。在优选的方面,多肽包括SEQ ID NO:4的氨基酸序列。在另外优选的方面,多肽包括SEQ ID NO:4的第30至967位氨基酸,或其等位变体;或具有α-葡糖苷酶活性的其片段。在另外优选的方面,多肽包括SEQ ID NO:4的第30至967位氨基酸。在另外优选的方面,多肽由SEQ ID NO:4的氨基酸序列或其等位变体;或具有α-葡糖苷酶活性的其片段组成。在另外优选的方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另外优选的方面,多肽由SEQ ID NO:4的第30至967位氨基酸或其等位变体;或具有α-葡糖苷酶活性的其片段组成。在另外优选的方面,多肽由SEQ ID NO:4的第30至967位氨基酸组成。
[0120] 本发明的多肽优选包括SEQ ID NO:6的氨基酸序列,或其等位变体;具有α-葡糖苷酶活性的其片段。在优选的方面,多肽包括SEQ ID NO:6的氨基酸序列。在另外优选的方面,多肽包括SEQ ID NO:6的第20至988位氨基酸,或其等位变体;或具有α-葡糖苷酶活性的其片段。在另外优选的方面,多肽包括SEQ ID NO:6的第20至988位氨基酸。在另外优选的方面,多肽由SEQ ID NO:6的氨基酸序列或其等位变体;或具有α-葡糖苷酶活性的其片段组成。在另外优选的方面,多肽由SEQ ID NO:6的氨基酸序列组成。在另外优选的方面,多肽由SEQ ID NO:6的第20至988位氨基酸或其等位变体;或具有α-葡糖苷酶活性的其片段组成。在另外优选的方面,多肽由SEQ ID NO:6的第20至988位氨基酸组成。
[0121] 在第二个方面,本发明涉及由在极低严谨条件,优选低严谨条件,更优选中等严谨条件,更优选中-高严谨条件,更优选高严谨条件,以及最优选极高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸,或SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸、或SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的互补链(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold SpringHarbor,New York)杂交的多核苷酸编码的具有α-葡糖苷酶活性的分离多肽。SEQ ID NO:1的亚序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,该亚序列可编码具有α-葡糖苷酶活性的多肽片段。
[0122] SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的核苷酸序列;或其亚序列,以及SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6的氨基酸序列;或其片段,可用于设计核酸探针来根据本领域已知的方法从不同种属的菌株鉴定和克隆编码具有α-葡糖苷酶活性的多肽的DNA。特别地,这种探针可用于按照标准的Southern印迹方法与感兴趣种属的基因组或cDNA杂交,以鉴定和分离其中相应的基因。这种探针可能比起完整的序列来是相当短的,但应该是至少14,优选至少25,更优选至少35,以及最优选至少70个核苷酸长度。然而优选该核酸探针是至少100个核苷酸长度。例如,核酸探针可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸长度。即使可能使用较长的探针,例如是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸长度的核酸探针。DNA和RNA探针都能被使用。该探针一
32 3 35
般被标记来用于检测相应的基因(例如,使用 P,H, S,生物素,或抗生物素蛋白)。这种探针包括在本发明中。
[0123] 从这种其他生物体制备的基因组DNA或cDNA文库因此可能用于筛选与上述探针杂交和编码具有α-葡糖苷酶活性的多肽的DNA。来自这种其他生物体的基因组或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他的分离技术来区分。来自文库的DNA或分离的DNA可被转移和固定至硝化纤维或其他合适的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5,或其亚序列同源的克隆或DNA,该载体材料被用于Southern印迹。
[0124] 为了本发明的目的,杂交表明该核苷酸序列与相应于SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5所示的核苷酸序列,其互补链,或其亚序列的标记核酸探针在极低至极高严谨条件下杂交。在这些条件下与该核酸探针杂交的分子可利用X光胶片检测。
[0125] 在优选的方面,该核酸探针是SEQ ID NO:1的第43至2643位核苷酸。在另外优选的方面,该核酸探针是编码SEQ ID NO:2的多肽,或其亚序列的多核苷酸序列。在另外优选的方面,该核酸探针是SEQ ID NO:1。在另外优选的方面,该核酸探针是SEQ ID NO:1的成熟多肽编码区。在另外优选的方面,该核酸探针是包含在质粒pSMO216中的多核苷酸序列,而该质粒包含在大肠杆菌NRRL B-30751中,其中多核苷酸序列编码具有α-葡糖苷酶活性的多肽。在另外优选的方面,该核酸探针是包含在质粒pSMO216中的成熟多肽编码区,其中该质粒包含在大肠杆菌NRRL B-30751中。
[0126] 在另外优选的方面,该核酸探针是SEQ ID NO:3的第146至3013位核苷酸。在另外优选的方面,该核酸探针是编码SEQ ID NO:4的多肽,或其亚序列的多核苷酸序列。在另外优选的方面,该核酸探针是SEQ ID NO:3。在另外优选的方面,该核酸探针是SEQ ID NO:3的成熟多肽编码区。在另外优选的方面,该核酸探针是包含在质粒pHyGe011中的多核苷酸序列,而该质粒包含在大肠杆菌NRRL B-30750中,其中其多核苷酸序列编码具有α-葡糖苷酶活性的多肽。在另外优选的方面,该核酸探针是包含在质粒pHyGe011中的成熟多肽编码区,其中该质粒包含在大肠杆菌NRRL B-30750中。
[0127] 在另外优选的方面,该核酸探针是SEQ ID NO:5的第58至3164位核苷酸。在另外优选的方面,该核酸探针是编码SEQ ID NO:6的多肽,或其亚序列的多核苷酸序列。在另外优选的方面,该核酸探针是SEQ ID NO:5。在另外优选的方面,该核酸探针是SEQ ID NO:5的成熟多肽编码区。在另外优选的方面,该核酸探针是包含在质粒pJSF9b中的多核苷酸序列,而该质粒包含在大肠杆菌NRRL B-30856中,其中其多核苷酸序列编码具有α-葡糖苷酶活性的多肽。在另外优选的方面,该核酸探针是包含在质粒pJSF9b中的成熟多肽编码区,其中该质粒包含在大肠杆菌NRRL B-30856中。
[0128] 对于至少100个核苷酸长度的长探针,极低至极高严谨条件定义为在42℃在5X SSPE,0.3%SDS,200μg/ml剪切和变性的鲑鱼精DNA中预杂交和杂交,并且对于极低和低严谨为25%甲酰胺,对于中等和中-高严谨为25%甲酰胺,对于高和极高严谨为50%甲酰胺,按照标准的Southern印迹方法,12至24小时最佳。
[0129] 对于至少100个核苷酸长度的长探针,载体材料最后利用2X SSC,0.2%SDS优选至少在45℃(极低严谨),更优选至少在50℃(低严谨),更优选至少在55℃(中等严谨),更优选至少在60℃(中-高严谨),更优选至少在65℃(高严谨),以及最优选至少在70℃(极高严谨)洗涤3次,每次15分钟。
[0130] 对于约15个核苷酸至约70个核苷酸长度的短探针,严谨条件定义为在低于利 用 Bolton 和 McCarthy(1962,Proceedings of the National Academy ofSciences USA48:1390)所述的算法计算的Tm大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt's溶液,1mM焦磷酸钠,1mM一元(monobasic)磷酸钠,0.1mM ATP,和每ml0.2mg酵母RNA,按照标准的Southern印迹方法进行预杂交、杂交、和杂交后洗涤。
[0131] 对于大约15个核苷酸至大约70个核苷酸长度的短探针,载体材料在低于计算的Tm5℃至10℃,在6X SCC加0.1%SDS中洗涤15分钟一次,并利用6X SSC洗涤2次,每次15分钟。
[0132] 在包含盐的杂交条件下,有效的Tm是控制探针和成功杂交的滤过结合DNA之间所需要的同一性程度的温度。有效的Tm可利用确定2个DNAs在各种严谨条件下杂交所需要的同一性程度的下列公式来确定。
[0133] 在第三个方面,本发明涉及具有下列物理化学特性的具有α-葡糖苷酶活性的分离多肽:在50mM乙酸盐缓冲液/50mM磷酸盐缓冲液中,在37°C,最适pH在大约3.5至大约4.5的范围内,优选大约3.8至大约4.5,更优选大约4.0至大约4.5,最优选大约4.0至大约4.3,以及最优选大约pH4.1;在50mM乙酸钠pH5.0中最适温度在大约60°C至大约63°C的范围内;以及在50mM乙酸钠pH5.0中5分钟,热稳定性达到大约67°C至大约70°C(大约80%剩余活性)。在优选的方面,具有α-葡糖苷酶活性的分离多肽在50mM乙酸钠pH5.0中5分钟具有达到大约67°C(大约80%剩余活性)的热稳定性。在另外优选的方面,具有α-葡糖苷酶活性的分离多肽在50mM乙酸钠pH5.0中5分钟具有达到大约70°C(大约80%剩余活性)的热稳定性。
[0134] 在第四个方面,本发明涉及包括SEQ ID NO:2、SEQ ID NO:4、或SEQID NO:6;或其成熟多肽的一个或多个氨基酸的保守取代、缺失、和/或插入的人工变体。优选地,氨基酸变化具有次要的特性,也就是说不显著影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;一般为1个至大约30个氨基酸的小的缺失;小的氨基或羧基末端延伸,例如氨基端甲硫氨酸残基;最多大约20-25个残基的小接头肽;或通过变化净电荷或另外的功能,例如聚组氨酸区、抗原表位或结合结构域的促进纯化的小的延伸。
[0135] 保守取代的实例在性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯基丙氨酸、色氨酸和酪氨酸)、和小的氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)组的范围之内。通常不改变特异活性的氨基酸取代是本领域已知的,并且通过例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York有描述。最通常发生的互换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
[0136] 除20个标准氨基酸之外,非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸、和α-甲基丝氨酸)可能被野生型多肽的氨基酸残基替代。有限数目的非保守氨基酸,不由遗传密码编码的氨基酸和非天然的氨基酸可被氨基酸残基替代。“非天然的氨基酸"已经在蛋白质合成后被修饰,和/或在其侧链具有不同于标准氨基酸的化学结构。非天然的氨基酸可被化学合成,优选是可商业购买的,以及包括六氢吡啶羧酸、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、和3,3-二甲基脯氨酸。
[0137] 备选地,氨基酸变化具有该多肽的理化性质被改变的这种特性。例如,氨基酸变化可能改善多肽的热稳定性,改变底物特异性,变化最适pH等等。
[0138] 亲本多肽中的必需氨基酸可根据本领域已知的方法来鉴定,例如定点诱变或丙氨酸扫描诱变(Cunningham and Wells,1989,Science244:1081-1085)。在后者的技术中,单个的丙氨酸突变被导入分子的每个残基,测试所得到的突变分子的生物活性(即,α-葡糖苷酶活性)以鉴定对该分子的活性至关重要的氨基酸残基。也参见,Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其他的生物学相互作用还可通过结构的物理分析来确定,如通过例如核磁共振、结晶学、电子衍射、或光亲和标记的技术结合假定的接触位点氨基酸的突变来测定。参见例如,de Vos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的同一性还可从与本发明所述多肽相关的多肽的同一性分析来推断。
[0139] 可利用已知的诱变、重组、和/或改组方法,继之以适当的筛选程序产生和测试单个或多个氨基酸取代,例如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie and Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;or WO95/22625所描述的。能被使用的其他方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO92/06204),和定区域诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127).
[0140] 诱变/改组方法可与高通量、自动筛选方法结合以检测由宿主细胞表达的克隆、诱变多肽的活性。编码活性多肽的诱变DNA分子可从宿主细胞回收并且利用本领域的标准方法快速测序。这些方法容许快速测定感兴趣多肽中个别氨基酸残基的重要性,并且可被应用于未知结构的多肽。
[0141] SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选至多5,更优选4,更优选3,最优选2,以及最优选1。
[0142] 具有α-葡糖苷酶活性的多肽的来源
[0143] 本发明的多肽可获得自任何属的微生物。为了本发明的目的,如在此使用的术语“获得自”结合给定的来源应指由核苷酸序列编码的多肽是通过该来源或通过其中已经被插入来自该来源的核苷酸序列的细胞生产的。在优选的方面,获得自给定来源的多肽是细胞外分泌的。
[0144] 本发明的多肽可以是细菌多肽。例如,多肽可以是革兰氏阳性细菌的多肽,例如芽孢杆菌属多肽,例如,嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢 杆菌(Bacillus brevis)、环状 芽孢杆菌 (Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏金芽孢杆菌(Bacillus thuringiensis)多肽;或链霉菌属(Streptomyces)多肽,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)多肽;或革兰氏阴性细菌多肽,例如,大肠杆菌或假单胞菌属(Pseudomonas)多肽。
[0145] 本发明的多肽也可为真菌多肽,并且更优选酵母多肽,例如假丝酵母(Candida)、克鲁维氏酵母(Kluyveromyces)、毕赤氏酵母(Pichia)、糖酵母(Saccharomyces)、裂殖酵母(Schizosaccharomyces)、或耶氏酵母(Yarrowia)多肽;或更优选丝状真菌多肽,例如枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球酵母属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐殖菌属(Humicol)、稻瘟霉属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Piromyces、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、或木霉属(Trichoderma)多肽。
[0146] 在优选的方面,多肽是具有α-葡糖苷酶活性的卡尔斯伯酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁维酵母(Saccharomyces kluyveri)、诺地糖酵母(Saccharomyces norbensis)、或卵形糖酵母(Saccharomyces oviformis)多肽。
[0147] 在另外优选的方面,多肽是具有α-葡糖苷酶活性的棘孢曲霉(Aspergillus aculeatus,)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、杆孢状镰孢 (Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense, 大 刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum、Humicola insolens、Humicola lanuginosa、米 赫 毛 霉(Mucor miehei)、嗜 热 毁 丝 霉(Myceliophthora thermophila)、粗 糙 链 孢 霉(Neurospora crassa)、或 产 紫 青 霉 (Penicillium purpurogenum)、哈 茨 木 霉 (Trichoderma harzianum)、康 宁 氏 木 霉(Trichoderma koningii)、Trichoderma longibrachiatum、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)多肽。
[0148] 在更优选的方面,多肽是烟曲霉多肽,例如,SEQ ID NO:2、SEQ ID NO:4、或SEQ ID NO:6的多肽、或其成熟多肽。
[0149] 可以理解对于上述种属,本发明包括完全的和不完全的状态,及其他分类学上的等价物,例如无性型,无论它们已知的种属名称。本领域的技术人员将容易地识别合适等价物的同一性。
[0150] 这些种属的菌株可在许多菌种保藏处由公众容易地获得,例如美国典型培养物保藏中心(ATCC)、德国微生物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真 菌 菌 种 保 藏 中 心 (Centraalbureau Voor Schimmelcultures)(CBS)、和农业研究机构保藏中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
[0151] 此外,这种多肽可利用上述探针从其他来源,包括分离自自然界(例如土壤、堆肥、水等)的微生物鉴定和获得。用于从天然生境分离微生物的技术是本领域已知的。然后多核苷酸可通过类似地筛选别的微生物的基因组或cDNA文库来获得。一旦已经用探针检测到编码多肽的多核苷酸序列,该多核苷酸可通过利用本领域普通技术人员已知的技术分离或克隆(参见例如,Sambrook等,1989,同上文)。
[0152] 本发明的多肽也包括融合多肽或可切割的融合多肽,其中另外的多肽融合在该多肽或其片段的N-末端或C-末端。融合的多肽通过将编码另外多肽的核苷酸序列(或其部分)融合至本发明的核苷酸序列(或其部分)来产生。用于生产融合多肽的技术是本领域已知的,包括连接编码多肽的编码序列以使得它们处于框内并且该融合多肽的表达在相同启动子和终止子的控制之下。
[0153] 多核苷酸
[0154] 本发明也涉及具有编码本发明多肽的核苷酸序列的分离多核苷酸。
[0155] 在优选的方面,该核苷酸序列如SEQ ID NO:1所示。在另外更优选的方面,该核苷酸序列是包含在质粒pSMO216中的序列,其中该质粒包含在大肠杆菌NRRL B-30751中。在另外优选的方面,该核苷酸序列是SEQ ID NO:1的成熟多肽编码区。在另外更优选的方面,该核苷酸序列是包含在质粒pSMO216中的成熟多肽编码区,其中该质粒包含在大肠杆菌NRRL B-30751中。本发明也包括编码具有SEQ ID NO:2或其成熟多肽的氨基酸序列的多肽的核苷酸序列,其由于遗传密码的简并性而不同于SEQ ID NO:1。本发明也涉及编码具有α-葡糖苷酶活性的SEQ ID NO:2片段的SEQ ID NO:1的亚序列。
[0156] 在另外优选的方面,该核苷酸序列如SEQ ID NO:3所示。在另外更优选的方面,该核苷酸序列是包含在质粒pHyGe011中的序列,其中该质粒包含在大肠杆菌NRRL B-30750中。在另外优选的方面,该核苷酸序列是SEQ ID NO:3的成熟多肽编码区。在另外更优选的方面,该核苷酸序列是包含在质粒pHyGe011中的成熟多肽编码区,其中该质粒包含在大肠杆菌NRRL B-30750中。本发明也包括编码具有SEQ ID NO:4或其成熟多肽的氨基酸序列的多肽的核苷酸序列,其由于遗传密码的简并性而不同于SEQ ID NO:3。本发明也涉及编码具有α-葡糖苷酶活性的SEQ ID NO:4片段的SEQ ID NO:3的亚序列。
[0157] 在另外优选的方面,该核苷酸序列如SEQ ID NO:5所示。在另外更优选的方面,该核苷酸序列是包含在质粒pJSF9b中的序列,其中该质粒包含在大肠杆菌NRRL B-30856中。在另外优选的方面,该核苷酸序列是SEQ ID NO:5的成熟多肽编码区。在另外更优选的方面,该核苷酸序列是包含在质粒pJSF9b中的成熟多肽编码区,其中该质粒包含在大肠杆菌NRRL B-30856中。本发明也包括编码具有SEQ ID NO:6或其成熟多肽的氨基酸序列的多肽的核苷酸序列,其由于遗传密码的简并性而不同于SEQ ID NO:5。本发明也涉及编码具有α-葡糖苷酶活性的SEQ ID NO:6片段的SEQ ID NO:5的亚序列。
[0158] 本发明也涉及在SEQ ID NO:1的成熟多肽编码序列中包括至少一个突变的突变多核苷酸,其中该突变的核苷酸序列编码由SEQ ID NO:2的第15至881位氨基酸组成的多肽。
[0159] 本发明也涉及在SEQ ID NO:3的成熟多肽编码序列中包括至少一个突变的突变多核苷酸,其中该突变的核苷酸序列编码由SEQ ID NO:4的第30至967位氨基酸组成的多肽。
[0160] 本发明也涉及在SEQ ID NO:5的成熟多肽编码序列中包括至少一个突变的突变多核苷酸,其中该突变的核苷酸序列编码由SEQ ID NO:6的第20至988位氨基酸组成的多肽。
[0161] 用于分离或克隆编码多肽的多核苷酸的技术是本领域已知的,并且包括从基因组DNA分离,从cDNA制备,或其组合。来自这种基因组DNA的本发明多核苷酸的克隆可例如通过利用已知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共用结构特点的克隆DNA片段来实现。参见例如,Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可使用其他的核酸扩增方法,例如连接酶链式反应(LCR)、连接活化的转录(LAT)和基于核苷酸序列的扩增(NASBA)。该多核苷酸可能克隆自曲霉属的细胞,或另外的或相关的生物体,因此例如可能是编码核苷酸序列区域的多肽的等位或种属变体。
[0162] 本发明也涉及具有与SEQ ID NO:1的成熟多肽编码序列(即,第142至2943位核苷酸)有至少75%,优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,以及最优选至少97%同一性程度,编码活性多肽的核苷酸序列的多核苷酸。
[0163] 本发明也涉及具有与SEQ ID NO:3的成熟多肽编码序列(即,第142至2943位核苷酸)有至少75%,优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,以及最优选至少97%同一性程度,编码活性多肽的核苷酸序列的多核苷酸。
[0164] 本发明也涉及具有与SEQ ID NO:5的成熟多肽编码序列(即,第142至2943位核苷酸)有至少75%,优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,以及最优选至少97%同一性程度,编码活性多肽的核苷酸序列的多核苷酸。
[0165] 编码本发明多肽的核苷酸序列的改变可能是为合成基本上类似于该多肽的多肽所必需的。术语与多肽“基本上相似的”是指非天然存在形式的多肽。这些多肽可能以一些工程化的方式不同于分离自其天然来源的多肽,例如特异活性、热稳定性、最适pH等有不同的人工变体。变体序列可根据如SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的多肽编码区,例如其亚序列存在的核苷酸序列,和/或通过导入不产生由该核苷酸序列编码的多肽另外氨基酸序列,但其相应于为生产酶而设计的的宿主生物体的密码子利用率的核苷酸取代,或通过导入可能产生不同氨基酸序列的核苷酸取代来构建。参见例如,Ford等,1991,Protein Expression and Purification2:95-107对于核苷酸取代的概述。
[0166] 对本领域的技术人员显而易见的是这种取代可在对该分子功能至关重要的区域外产生并且仍然生成活性多肽。对由本发明的分离多核苷酸编码的多肽,并且因此优选没有经受取代的多肽的活性所必需的氨基酸残基可根据本领域已知的方法来鉴定,例如定点诱变或丙氨酸扫描诱变(参见例如,Cunningham and Wells,1989,Science244:1081-1085)。在后者的技术中,在分子中的每个带阳电荷的残基导入突变,并且测试所得到的突变分子的α-葡糖苷酶活性以鉴定对该分子活性至关重要的氨基酸残基。底物酶相互作用的位点还可通过分析立体结构来确定,如通过例如核磁共振分析、结晶学或光亲合标记的技术来测定(参见例如,de Vos等,1992,Science255:306-312;Smith等,1992,Journal of Molecular Biology224:899-904;Wlodaver等,1992,FEBS Letters309:59-64)。
[0167] 本发明也涉及编码本发明多肽的分离多核苷酸,其如在此定义的,在极低严谨条件,优选低严谨条件,更优选中等严谨条件,更优选中-高严谨条件,更优选高严谨条件,以及最优选极高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸,或SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸、或SEQ ID NO:5的第
58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链,或其等位变体和亚序列(Sambrook等,1989,同上文)杂交。
[0168] 本发明也涉及通过(a)将DNA群在极低、低、中、中-高、高、或极高严谨条件下与(i)SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸,或SEQ ID NO:5的第58至3164位核苷酸,(ii)包含在SEQ ID NO:1的第43至2643位核苷酸、SEQ ID NO:3的第146至3013位核苷酸、或SEQ ID NO:5的第58至3164位核苷酸中的cDNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离编码具有α-葡糖苷酶活性的多肽的杂交多核苷酸来获得的分离多核苷酸。
[0169] 核酸构建体
[0170] 本发明也涉及包括与指导编码序列在合适的宿主细胞中在与该调控序列相适合的条件下表达的一个或多个调控序列可操作连接的本发明分离多核苷酸的核酸构建体。
[0171] 编码本发明多肽的分离多核苷酸可以多种方式被操作以保证该多肽的表达。在其插入载体之前该多核苷酸序列的操作可能根据该表达载体而是合乎需要或必需的。利用重组DNA方法来改变多核苷酸序列的技术是本领域已知的。
[0172] 调控序列可以是合适的启动子序列,由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列包含介导多肽表达的转录调控序列。启动子可以是在所选择的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的、和杂合启动子,并且可从编码与该宿主细胞同源或异源的胞外或胞内多肽的基因获得。
[0173] 用于指导本发明的核酸构建体,特别是在细菌宿主细胞中转录的合适启动子的实例是从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽胞杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽胞杆菌xylA和xylB基因、和原核β-内酰胺酶基因获得的启动子(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of the National Academy of Sciences USA80:21-25)。进一步的启动子在Scientific American,1980,242:74-94 中 的 "Useful proteins from recombinant bacteria" 和Sambrook 等,1989,同上文中有描述。
[0174] 用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡萄糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、尖孢镰孢胰蛋白酶-样蛋白酶(WO96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉葡聚糖内切酶I、里氏木霉葡聚糖内切酶II、里氏木霉葡聚糖内切酶III、里氏木霉葡聚糖内切酶IV、里氏木霉葡聚糖内切酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子杂合体);及其突变的、截短的、和杂合的启动子。
[0175] 在酵母宿主中,有用的启动子获得自酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属金属硫蛋白(metallothionine)(CUP1)、和酿酒酵母3-磷酸甘油酸(phosphorglycerate)激酶的基因。用于酵母宿主细胞的其他有用启动子由Romanos等,1992,Yeast8:423-488描述。
[0176] 调控序列也可以是合适的转录终止子序列,由宿主细胞识别以终止转录的序列。终止子序列与编码该多肽的核苷酸序列的3’末端可操作连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。
[0177] 用于丝状真菌宿主细胞的优选终止子获得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖镰孢胰蛋白酶-样蛋白酶的基因。
[0178] 用于酵母宿主细胞的优选终止子获得自酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。用于酵母宿主细胞的其他有用终止子由Romanos等,1992,同上文描述。
[0179] 调控序列也可以是合适的前导序列,对宿主细胞翻译重要的mRNA的非翻译区。前导序列与编码该多肽的核苷酸序列的5’末端可操作连接。在选择的宿主细胞中有功能的任何终止子都可用于本发明。
[0180] 用于丝状真菌宿主细胞的优选前导序列获得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因.
[0181] 用于酵母宿主细胞的合适的前导序列获得自酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子,和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。
[0182] 调控序列也可以是多腺苷酸化序列,与核苷酸序列的3’末端可操作连接,并且当转录时,由宿主细胞识别为向转录的mRNA添加多腺苷残基的信号的序列。在选择的宿主细胞中有功能的任何多腺苷序列都可用于本发明。
[0183] 用于丝状真菌宿主细胞的优选多腺苷酸化序列获得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶-样蛋白酶,和黑曲霉α-葡糖苷酶的基因。
[0184] 用于酵母宿主细胞的有用多腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology15:5983-5990描述。
[0185] 调控序列也可以是编码与多肽的氨基末端连接的氨基酸序列并且指导该编码的多肽进入细胞分泌途径的信号肽编码区。核苷酸序列编码序列的5’端可固有地包含天然连接具有编码分泌多肽的编码区节段的翻译阅读框的信号肽编码区。备选地,编码序列的5’端可包含与该编码区外源的信号肽编码区。当编码序列非天然地包含信号肽编码区时,可能需要外来的信号肽编码区。备选地,外来的信号肽编码区可简单地替换天然的信号肽编码区以增强多肽的分泌。然而指导表达的多肽进入选择的宿主细胞的分泌途径的任何信号肽编码区都可用于本发明。
[0186] 用于细菌宿主细胞的有效信号肽编码区是从芽孢杆菌NCIB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)、和枯草芽胞杆菌prsA的基因获得的信号肽编码区。进一步的信号肽由Simonen和Palva,1993,Microbiological Reviews57:109-137描述。
[0187] 用于丝状真菌宿主细胞的有效信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、Humicola insolens纤维素酶、和Humicola lanuginosa脂肪酶的基因获得的信号肽编码区。
[0188] 在优选的方面,该信号肽编码区是编码SEQ ID NO:2的第1至14位氨基酸的SEQ ID NO:1的第1至42位核苷酸。
[0189] 在另外优选的方面,该信号肽编码区是编码SEQ ID NO:4的第1至29位氨基酸的SEQ ID NO:3的第1至145位核苷酸。
[0190] 在另外优选的方面,该信号肽编码区是编码SEQ ID NO:6的第1至19位氨基酸的SEQ ID NO:5的第1至57位核苷酸。
[0191] 用于酵母宿主细胞的有用信号肽获得自酿酒酵母α-因子和酿酒酵母转化酶的基因。其他有用的信号肽编码区由Romanos等,1992,同上文描述。
[0192] 调控序列也可以是编码位于多肽氨基端的氨基酸序列的前肽编码区。所得到的多肽被称为前酶或前多肽(或有时候为酶原)。前多肽通常是无活性的并且可通过前肽从前多肽的催化或自催化裂解而被转化为成熟的活性多肽。前肽编码区可获得自枯草芽胞杆菌碱性蛋白酶(aprE)、枯草芽胞杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜热毁丝霉漆酶(WO95/33836)的基因。
[0193] 当信号肽和前肽区都存在于多肽的氨基端时,前肽区紧邻多肽的氨基端而信号肽区紧邻前肽区的氨基端。
[0194] 可能也需要添加容许调节多肽相对于宿主细胞生长而表达的调节序列。调节系统的实例是导致基因表达根据化学或物理的刺激,包括存在调节化合物而打开或关闭的调节系统。原核系统中的调节系统包括lac、tac、和trp操纵子系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子可用作调控序列。调节序列的其他实例是容许基因扩增的调节序列。在真核系统中,这些包括在存在氨甲蝶呤时扩增的二氢叶酸还原酶基因,和伴随重金属扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列与调节序列可操作连接。
[0195] 表达载体
[0196] 本发明也涉及包括本发明多核苷酸、启动子、和转录及翻译终止信号的重组表达载体。上述的各种核酸和调控序列可被连接在一起以产生可能包括一个或多个容许在这种位点插入或置换编码多肽的核苷酸序列的方便限制性位点的重组表达载体。备选地,本发明的核苷酸序列可通过插入核苷酸序列或包括进入适当表达载体的序列的核酸构建体而被表达。在制造表达载体时,编码序列位于载体中以使得该编码序列可操作地连接用于表达的适当调控序列。
[0197] 重组表达载体可以是能够方便地经受重组DNA方法并且可导致感兴趣的核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择一般取决于载体与其中被导入该载体的宿主细胞的相容性。该载体可以是线性或闭合的环形质粒。
[0198] 载体可以是自主复制的载体,即,作为染色体外实体存在,其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体、或人工染色体。载体可包含用于保证自我复制的任何方式。备选地,载体可以是当被导入宿主细胞时,整合到基因组中并且与其已经被整合进入的染色体一起复制的载体。此外,可使用一起包含将被导入宿主细胞基因组的总DNA的单个载体或质粒或两个或多个载体或质粒,或转座子。
[0199] 本发明的载体优选包含一个或多个容许容易选择转化细胞的可选择标记。可选择的标记是基因,其产物提供对杀生物剂或病毒的抗性、对重金属的抗性、原养型至营养缺陷型(prototrophy to auxotrophs)等。
[0200] 细菌的可选择标记的实例是来自枯草芽胞杆菌或地衣芽孢杆菌的dal基因,或赋予例如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性的抗生素抗性的标记。用于酵母宿主细胞的合适标记是ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。用于丝状真菌宿主细胞的可选择标记包括但不限于,amdS(乙酰胺酶)、argB(氨酸氨甲酰基转移酶)、bar(phosphinothricin转乙酰酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸酯脱羧酶)、sC(硫酸腺苷转移酶)、和trpC(邻氨基苯甲酸合酶),及其等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因,和吸水链霉菌的bar基因。
[0201] 本发明的载体优选包含容许该载体整合进入宿主细胞基因组或该载体在细胞中独立于基因组自主复制的元件。
[0202] 对于整合进入宿主细胞基因组,载体可依赖于编码多肽的多核苷酸序列或用于通过同源或非同源重组使该载体整合进入基因组的载体的任何其他元件。备选地,该载体可包含通过同源重组在染色体的准确位置直接整合进入宿主细胞基因组的附加核苷酸序列。为了增加在准确位置整合的可能性,该整合元件应优选包含足够数目的核酸,例如100至
10,000个碱基对、优选400至10,000个碱基对,以及最优选800至10,000个碱基对,其与相应的靶序列具有高度同一性以增强同源重组的概率。该整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。此外,该整合元件可以是非编码或编码的核苷酸序列。另一方面,载体可通过非同源重组被整合进入宿主细胞的基因组。
[0203] 对于自主复制,该载体可进一步包括能够使载体在所述的宿主细胞中自主复制的复制原点。复制原点可以是在细胞中起作用的调节自主复制的任何质粒复制子。术语“复制原点”或“质粒复制子”在此定义为使质粒或载体能够体内复制的核苷酸序列。
[0204] 细 菌 的 复 制 原 点 的 实 例 是 容 许 在 大 肠 杆 菌 中 复 制 的 质 粒pBR322,pUC19,pACYC177,和 pACYC184,和 容 许 在 芽 孢 杆 菌 中 复 制 的 质 粒pUB110,pE194,pTA1060,和pAMβ1的复制原点。
[0205] 用于酵母宿主细胞的复制原点的实例是2微粒(micro)复制原点、ARS1,ARS4、ARS1和CEN3的组合、和ARS4和CEN6的组合。
[0206] 用 于 丝 状 真 菌 细 胞 的 复 制 原 点 的 实 例 是AMA1 和 ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,Nucleic Acids Research15:9163-9175;WO00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可根据WO00/24883中公开的方法来实现。
[0207] 一个以上拷贝的本发明的多核苷酸可被插入宿主细胞以增加该基因产物的产量。多核苷酸拷贝数的增加可通过将至少一个附加拷贝的多核苷酸整合进入宿主细胞基因组或通过包括可扩增的选择标记基因和该多核苷酸来获得,其中包含扩增拷贝的选择标记多核苷酸并且由此包含附加拷贝多核苷酸的细胞可通过在存在适当的选择剂时培养该细胞来筛选。
[0208] 用于连接上述元件以构建本发明的重组表达载体的方法对于本领域的技术人员来说是已知的(参见例如,Sambrook等,1989,同上文)。
[0209] 宿主细胞
[0210] 本发明也涉及包括被有利地用于重组生产多肽的本发明多核苷酸的重组宿主细胞。包括本发明多核苷酸的载体被导入宿主细胞以使得该载体如早先说明的作为染色体的组成部分或作为染色体外的自我复制载体来维持。术语"宿主细胞"包括由于在复制期间发生突变而与亲本细胞不相同的亲本细胞任何后代。宿主细胞的选择在很大程度上取决于编码多肽的基因及其来源。
[0211] 宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
[0212] 有用的单细胞微生物是细菌细胞,例如革兰氏阳性细菌,包括但不限于,芽孢杆菌细胞,例如,嗜碱芽胞杆菌、解淀粉芽胞杆菌、短芽孢杆菌、环状芽孢杆菌、Bacillus clausii、凝结芽孢杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽胞杆菌、和苏云金杆菌;或链霉菌细胞,例如,浅青紫链霉菌和鼠灰链霉菌,或革兰氏阴性细菌,例如大肠杆菌和假单胞菌属。在优选的方面,细菌宿主细胞是迟缓芽胞杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌、或枯草芽胞杆菌细胞。在另外优选的方面,芽胞杆菌细胞是嗜碱的芽胞杆菌。
[0213] 将载体导入细菌宿主细胞可例如通过原生质体转化(参见例如,Chang和Cohen,1979,Molecular General Genetics168:111-115),利用感受态细胞(参见例如,Young 和 Spizizen,1961,Journal of Bacteriology81:823-829, 或 Dubnau 和Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques6:742-751)、或接合(参见例如,Koehler和Thorne,1987,Journal of Bacteriology169:5771-5278)来实现。
[0214] 宿主细胞也可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。
[0215] 在优选的方面,宿主细胞是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等,In,Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK所描述的),以及卵菌门(如在Hawksworth等,1995,supra,page171中所引用的)和所有的mitosporic真菌(Hawksworth等,1995,supra)。
[0216] 在更优选的方面,宿主细胞是酵母细胞。如在此使用的“酵母”包括产子囊酵母(内孢霉目)(Endomycetales)、产生担子孢子酵母(basidiosporogenous yeast)、和属于半知菌类(芽生菌)(the Fungi Imperfecti(Blastomycetes))的酵母。因为酵母的分类可能在将来有变化,为了本发明的目的,酵母应定义为在Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M. 和 Davenport,R.R. 编 Soc.App.Bacteriol.Symposium Series No.9,1980)中所说明的。
[0217] 在更优选的方面,酵母宿主细胞是假丝酵母、汉逊氏酵母(Hansenula)、克鲁维氏酵母、毕赤氏酵母、糖酵母、裂殖酵母(Schizosaccharomyces)、或耶氏酵母(Yarrowia)细胞。
[0218] 在最优 选的方 面,酵 母宿主 细胞是 卡尔斯 伯酵母 (Saccharomyces carlsbergensis)、酿酒酵母、Saccharomyces diastaticus、Saccharomyces douglasii、克鲁弗糖酵母(Saccharomyces kluyveri)、诺地糖酵母(Saccharomyces norbensis)、或卵形糖酵母(Saccharomyces oviformis)细胞。在另外的最优选方面,酵母宿主细胞是乳酸克鲁维氏酵母(Kluyveromyces lactis)细胞。在另外的最优选方面,酵母宿主细胞是Yarrowia lipolytica细胞。
[0219] 在另外的更优选方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌(Eumycota)亚门和卵菌门(Oomycota)的全部丝状体(如Hawksworth等,1995,同上文所描述的)。丝状真菌通常的特征在于菌丝的壁由几丁质、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖、及其他复合多糖组成。营养生长是通过菌丝的伸长,而分解代谢是专性需的。相比之下,例如酿酒酵母的酵母营养生长是通过单细胞叶状体的出芽,而碳分解代谢可能是发酵性的。
[0220] 在更优选的方面,丝状的真菌宿主细胞是支顶孢属(Acremonium)、曲霉属、短梗霉属 (Aureobasidium)、Bjerkandera,Ceriporiopsis,鬼 伞属(Coprinus)、Coriolus,隐球酵母属(Cryptococcus)、Filibasidium,镰孢属、腐殖菌属、Magnaporthe、毛霉属、毁丝霉属、Neocallimastix,脉孢菌属、拟青霉属(Paecilomyces)、青霉属、Phanerochaete,Phlebia,Piromyces,侧属(Pleurotus)、裂褶菌属(Schizophyllum)、Talaromyces,Thermoascus, 梭 孢 壳 属、Tolypocladium,Trametes, 或 木 霉 属(Trichoderma)细胞。
[0221] 在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉细胞细胞。在另外的最优选方面,丝状的真菌宿主细胞是杆孢状镰孢、Fusarium cerealis,Fusarium crookwellense,大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum,Fusarium trichothecioides,或Fusarium venenatum细胞。在另外的最优选方面,丝状的真菌宿主细胞是Bjerkandera adusta,Ceriporiopsis aneirina,Ceriporiopsis aneirina,Ceriporiopsis caregiea,Ceriporiopsis gilvescens,Ceriporiopsis pannocinta,Ceriporiopsis rivulosa,Ceriporiopsis subrufa,Ceriporiopsis subvermispora,灰 盖 鬼 伞 (Coriolus cinereus)、Coriolus hirsutus,Humicola insolens,Humicola lanuginosa, 米 赫 毛 霉 (Mucor miehei)、嗜热毁 丝霉(Myceliophthora thermophila)、粗 糙链孢 霉(Neurospora crassa)、产 紫 青 霉 (Penicillium purpurogenum)、Phanerochaete chrysosporium,Phlebia radiata,Pleurotus eryngii,Thielavia terrestris,Trametes villosa,Trametes versicolor, 哈 茨 木 霉 (Trichoderma harzianum)、康 宁 氏 木 霉、Trichoderma longibrachiatum,里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)细胞。
[0222] 真菌细胞可通过涉及原生质体形成、原生质体转化、和细胞壁再生的本质上已知的方法而被转化。用于转化曲霉和木霉宿主细胞的合适方法在EP238023和Yelton等 ,1984,Proceedings of the National Academy of SciencesUSA81:1470-1474 中有描述。用于转化镰孢种属的合适方法由Malardier等,1989,Gene78:147-156,and WO96/00787描述。酵母可利用由Becker和Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume194,pp182-187,Academic Press,Inc.,New York;Ito 等 ,1983,Journal of Bacteriology153:163;and Hinnen等,1978,Proceedings of the National Academy of Sciences USA75:1920描述的方法转化。
[0223] 生产方法
[0224] 本发明也涉及生产本发明多肽的方法,包括(a)培养在其野生型形式时在有助于生产多肽的条件下能够生产多肽的细胞;以及(b)回收多肽。优选地,该细胞属于曲霉属,以及更优选为烟曲霉。
[0225] 本发明也涉及生产本发明多肽的方法,包括(a)在有助于生产多肽的条件下培养宿主细胞;以及(b)回收多肽。
[0226] 本发明也涉及生产本发明多肽的方法,包括(a)在有助于生产多肽的条件下培养宿主细胞,其中该宿主细胞包括在SEQ ID NO:1、SEQ ID NO:3、或SEQ ID NO:5的成熟多肽编码区中具有至少一个突变的突变多核苷酸,其中该突变的核苷酸序列分别编码由SEQ ID NO:2的第15至881位氨基酸、SEQ ID NO:4的第30至967位氨基酸、或SEQ ID NO:6的第20至988位氨基酸组成的多肽,以及(b)回收多肽。
[0227] 在本发明的生产方法中,细胞利用本领域已知的方法在适于生产多肽的培养基中培养。例如,细胞可通过在实验室或工业发酵罐中进行的摇瓶载培、和小规模的或大规模的发酵(包括连续的、分批的、分批补料、或固态发酵),在合适的培养基和容许该多肽表达和/或分离的条件下进行培养。培养发生在利用本领域已知的方法包括碳和氮源和无机盐的合适培养基中。合适的培养基可获得自商业供应者或可根据公开的组合物(例如,在美国典型物培养中心的目录中)来制备。如果该多肽分泌进入培养基,该多肽可从培养基直接回收。如果该多肽不是分泌的,它可从细胞裂解物回收。
[0228] 多肽可利用本领域已知的特异于该多肽的方法来检测。这些检测方法可包括特异抗体的使用,酶产物的形成,或酶底物的消失。例如,酶活性测定可如在此说明的用来测定多肽的活性。
[0229] 所得到的多肽可利用本领域已知的方法来回收。例如,多肽可通过常规方法,包括但不限于离心、过滤、萃取、喷雾干燥蒸发、或沉淀而从培养基回收。
[0230] 本发明的多肽可通过本领域已知的多种方法来纯化,包括但不限于,色谱法(例如,离子交换、亲合性、疏水性的、色谱聚焦、和大小排阻),电泳方法(例如,制备型等电位焦距)、差异溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(extraction)(参见例如,Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)。
[0231] 植物
[0232] 本发明也涉及已经用编码本发明具有α-葡糖苷酶活性的多肽的核苷酸序列转化,以使得表达和生产可回收数量的多肽的转基因植物、植物部分、或植物细胞。多肽可从植物或植物部分回收。备选地,包含重组多肽地植物或植物部分可用于改善食品或饲料质量,例如改善营养价值、适口性(palatability)、和流变(rheological)性质,或用于破坏抗营养因子
[0233] 转基因的植物可以是双子叶(双子叶植物)或单子叶植物(单子叶植物)。单子叶植物的实例是草类(grasses),例如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa)),饲用牧草(forage grass),例如羊茅属(Festuca)、黑麦草属(Lolium)、寒地型牧草(temperate grass),例如Agrostis,和谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱和玉米(玉蜀黍)。
[0234] 双子叶植物的实例是烟草、豆荚,例如羽扇豆(lupin)、铃薯、甜菜(sugarbeet)、豌豆、菜豆和大豆,和十字花科植物(十字花科(Brassicaceae)科),例如花椰菜、油菜籽(rape seed)、和紧密相关的模型生物拟南芥(Arabidopsis thaliana)。
[0235] 植物部分的实例是茎、愈伤组织、叶、根、果实、种子、和茎,以及包括这些部分的个别组织,例如表皮、叶肉、薄壁组织parenchyme、维管组织、分生组织。特异的植物细胞隔室,例如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质也被认为是植物部分。此外,任何植物细胞,无论什么组织起源,被认为是植物部分。同样地,例如促进本发明应用的特异组织和分离细胞的植物部分也被认为是植物部分,例如胚胎、胚乳、糊粉粒和种皮。
[0236] 也包括在本发明范畴内的是这种植物、植物部分、和植物细胞的后代。
[0237] 表达本发明多肽的转基因植物或植物细胞可根据本领域已知的方法来构建。简言之,植物或植物细胞通过将编码本发明多肽的一个或多个表达构建体整合进入植物宿主基因组或叶绿体基因组并且繁殖所得到的改变植物或植物细胞成为转基因的植物或植物细胞来构建。
[0238] 表达构建体便利地是包括可操作地连接有为在选择的植物或植物部分中表达该核苷酸序列所需要的合适调节序列的编码本发明多肽的多核苷酸的核酸构建体。此外,该表达构建体可包括用于鉴定其中已经整合有该表达构建体的宿主细胞和为将该构建体导入所述植物所必需的DNA序列的选择标记(后者依赖于所使用的DNA导入方法)。
[0239] 调节序列,例如启动子和终止子序列以及任选地信号或转运序列的选择根据例如需要何时、何处以及如何表达该多肽来确定。例如,编码本发明多肽的基因的表达可以是组成性的或可诱导的,或可以是发育、阶段或组织特异的,以及该基因产物可以被靶向特异的组织或植物部分,例如种子或叶片。调节序列由例如Tague等,1988,Plant Physiology86:506来描述。
[0240] 对于组成 性的表达,可使用35S-CaMV、玉 米泛素1、和 水稻肌动 蛋白 1 启 动 子 (Franck 等 ,1980,Cell21:285-294,Christensen 等 ,1992,Plant Mo.Biol.18:675-689;Zhang等 ,1991,Plant Cell3:1155-1165)。 器 官 特 异 性 启动子可以是例如来自储存库(sink)组织,例如种子、马铃薯块茎和果实的启动子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织,例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异的启动子,例如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白、或白蛋白启动子(Wu等,1998,Plant and Cell Physiology39:885-889)、来自豆球蛋白B4和来自蚕豆(Vicia faba)的未知种子蛋白质基因的的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology152:708-711)、来自植物油体蛋白质的启动子(Chen等,1998,Plant and Cell Physiology39:935-941)、来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本领域已知的任何其他种子特异性启动子,例如如如WO91/14772所描述的。此外,启动子可以是叶特异的启动子,例如来自水稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology102:991-1000、小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,Plant Molecular Biology26:85-93)、来自水稻的aldP基因启动子(Kagaya等,1995,Molecular and General Genetics248:668-674)、或创伤可诱导的启动子,例如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology22:573-588)。同样地,启动子可通过非生物的处理来诱导,例如温度、干旱、或盐度变化,或通过活化启动子的外部施加的物质来诱导,例如乙醇、雌激素、植物激素,例如乙烯、脱落酸、和赤霉酸、和重金属。
[0241] 启动子增强子元件也可用于在植物中获得本发明多肽的更高表达。例如,启动子增强子元件可以是置于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如,Xu等,1993,同上文,公开了使用水稻肌动蛋白1基因的第一个内含子增强表达。
[0242] 表达构建体的选择标记基因和任何其他部分可从本领域可得到的那些来选择。
[0243] 核酸构建体根据本领域已知的传统方法被整合进入植物基因组,包括土壤杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物导弹转化、和电穿孔(Gasser等 ,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。
[0244] 目前,根癌土壤杆菌介导的基因转移是用于产生转基因双子叶植物的选择方法(至于综述,参见Hooykas and Schilperoort,1992,Plant MolecularBiology19:15-38)并且还可用于转化单子叶植物,尽管其他的转化方法经常被用于这些植物。目前,用于产生转基因单子叶植物的选择方法是胚胎愈伤组织或发育胚胎的粒子轰击(涂有转化DNA的显微黄金或钨颗粒)(Christou,1992,Plant Journal2:275-281;Shimamoto,1994,Current Opinion Biotechnology5:158-162;Vasil 等 ,1992,Bio/Technology10:667-674)。用于转化单子叶植物的备选方法是基于如由Omirulleh等,1993,Plant Molecular Biology21:415-428描述的原生质体转化。
[0245] 转化后,选择已经整合有表达构建体的转化体,并且根据本领域已知的方法使之再生成为完整植株。转化过程经常被设计用于在再生期间或在随后的生成中利用例如用两个单独的T-DNA构建体共同转化或通过特异重组酶的选择基因的位点特异切除来选择性消除选择基因。
[0246] 本发明也涉及生产本发明多肽的方法,包括:(a)在有助于生产多肽的条件下培养包括编码本发明具有α-葡糖苷酶活性的多肽的多核苷酸的转基因植物或植物细胞;以及(b)回收多肽。
[0247] α-葡糖苷酶活性的去除或减少
[0248] 本发明也涉及生产亲本细胞突变体的方法,其包括使编码本发明多肽的多核苷酸序列,或其部分断裂或缺失,这导致当在相同条件下培养时该突变细胞比所述亲本细胞产生较少的该多肽。
[0249] 突变细胞可利用本领域已知方法通过减少或消除编码本发明多肽的核苷酸序列表达来构建,例如插入、断裂、置换、或缺失。待改变或失活的核苷酸序列可以是例如对活性必要的编码区或其部分,或为表达编码区所需要的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即足以影响核苷酸序列表达的部分。用于可能的改变的其他调控序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录活化子。
[0250] 核苷酸序列的改变或失活可通过使亲本细胞经受诱变并且筛选其中核苷酸序列的表达已经被减少或消除的突变细胞来进行。可能是特异或随机的诱变可例如通过利用合适的物理或化学诱变处理剂,通过利用合适的寡聚核苷酸,或通过使DNA序列经受PCR产生的诱变来进行。此外,诱变可通过利用这些诱变处理剂的任何组合来进行。
[0251] 适于本目的的物理或化学诱变处理剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基磺酸甲烷(EMS)、亚硫酸氢钠(sodium bisulphite)、蚁酸、和核苷酸类似物。
[0252] 当使用这种试剂时,诱变一般通过在存在选择的诱变处理剂时在适宜条件下培养待诱变处理的亲本细胞,以及筛选和/或选择显示减少或不表达基因的突变细胞来进行。
[0253] 核苷酸序列的改变或失活可通过导入、取代、或除去基因或为其转录或翻译需要的调节元件中的一个或多个核苷酸来实现。例如,核苷酸可被插入或除去以使得导致形成终止密码子的导入、起始密码子的除去、或开放读框的变化。这种改变或失活可通过定点诱变或导致诱变的PCR根据本领域已知的方法来实现。尽管原则上,改变可在体内进行,即直接在表达待改变核苷酸序列的细胞上进行,优选如下列例证的在体外进行改变。
[0254] 消除或减少细胞表达核苷酸序列的便利方式的实例是基于基因置换、基因缺失或基因断裂的技术。例如,在基因断裂方法中,体外诱变处理相应于内源核苷酸序列的核酸序列以产生然后被转化进入亲本细胞以产生有缺陷基因的缺陷性核酸序列。通过同源重组,有缺陷的核酸序列替换内源的核苷酸序列。可能需要有缺陷的核苷酸序列也编码可用来选择其中该核苷酸序列已经被改变或破坏转化体的标记。在特别优选的实施方案中,核苷酸序列用可选择的标记,例如在此描述的那些来断裂。
[0255] 备选地,核苷酸序列的改变或失活可通过利用与该核苷酸序列互补的序列建立的反义技术来进行。更具体地说,通过细胞表达核苷酸序列可通过导入与在细胞中转录并且能够与在细胞中产生的mRNA杂交的基因的核苷酸序列互补的序列来减少或消除。在容许互补的反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的数量因此被减少或消除。
[0256] 本发明进一步涉及包括断裂或缺失编码多肽的核苷酸序列或其调控序列的亲本细胞的突变细胞,这导致该突变细胞比亲本细胞产生较少的多肽。
[0257] 如此产生的有缺陷多肽的突变细胞作为用于表达同源和/或异源多肽的宿主细胞是特别有用的。因此,本发明进一步涉及生产同源或异源多肽的方法,包括(a)在有助于生产多肽的条件下培养突变细胞;以及(b)回收多肽。术语"异源的多肽"在此定义为对于宿主细胞不是天然的多肽,其中已经产生改变以变化天然序列的天然蛋白质,或其表达由于通过重组DNA技术操作该宿主细胞而定量改变的天然蛋白质。
[0258] 在进一步的方面,本发明涉及通过发酵生产本发明多肽以及感兴趣的蛋白质产物的细胞生产基本上不含α-葡糖苷酶活性的蛋白质产物的方法,其中在发酵已经完成之前、期间、或之后向发酵肉汤加入能够抑制α-葡糖苷酶活性的有效量试剂,从发酵肉汤回收感兴趣的产物,以及任选地使回收产物经受进一步纯化。
[0259] 在进一步的方面,本发明涉及通过在容许产物表达的条件下培养细胞,使所得到的培养肉汤经受组合的pH和温度处理以使得基本上减少α-葡糖苷酶活性,以及从培养肉汤回收产物来生产基本上不含α-葡糖苷酶活性的蛋白质产物的方法。备选地,组合的pH和温度处理可对培养肉汤回收的酶制剂进行。组合的pH和温度处理可任选地用于与α-葡糖苷酶抑制剂的处理组合。
[0260] 根据本发明的这个方面,有可能除去至少60%,优选至少75%,更优选至少85%,更优选至少95%,和最优选至少99%的α-葡糖苷酶活性。α-葡糖苷酶活性的完全去除可通过利用这个方法来获得。
[0261] 组合的pH和温度处理优选在4-5的pH范围内和70-80℃的温度范围内进行足够的时段以达到预期效果,其中一般30至60分钟是足够的。
[0262] 用于培养和纯化感兴趣产物的方法可通过本领域已知的方法来进行。
[0263] 用于生产基本上不含α-葡糖苷酶的产物的本发明方法在真核多肽的生产,特别是真菌蛋白质,例如酶的生产中具有特殊的意义。酶可选自例如,淀粉分解酶、脂肪分解酶、蛋白水解酶、细胞裂解酶、氧化还原酶、或植物细胞壁降解酶。这种酶的实例包括氨肽酶、淀粉酶、淀粉葡萄糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡糖苷酶、卤素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶,果胶裂解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶、或木聚糖酶。α-葡糖苷酶有缺陷的细胞也可用于表达有药物学重要性的异源蛋白质,例如激素、生长因素、受体等等。
[0264] 可以理解术语"真核的多肽"不仅包括天然的多肽,而且包括已经通过氨基酸取代、缺失或添加改变,或增强活性、热稳定性、pH耐受性等等的其他这种改变的多肽,例如酶。
[0265] 在进一步的方面,本发明涉及通过本发明方法生产的基本上没有α-葡糖苷酶活性的蛋白质产物。
[0266] 组合物
[0267] 本发明也涉及生产包括本发明多肽的组合物的方法。优选地,该组合物在这种多肽中富集。术语"富集的"表明组合物的α-葡糖苷酶活性已经被增加,例如浓缩因子为1.1。
[0268] 组合物可包括作为主要酶促成分的本发明多肽,例如单组分组合物。备选地,组合物可包括多种酶促活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶裂解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。附加的酶可由属于曲霉属,优选棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉;镰孢属,优选杆孢状镰孢、Fusarium cerealis,库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、Fusarium toruloseum,Fusarium trichothecioides,或Fusarium venenatum;腐殖菌属,优选Humicola insolens或Humicola lanuginosa;或木霉属,优选哈茨木霉、康宁氏木霉、长枝木霉、里氏木霉或绿色木霉的微生物来生产。
[0269] 多肽组合物可根据本领域已知的方法来制备并且可以是液体或干燥组合物的形式。例如,多肽组合物可以是颗粒状或微颗粒的形式。被包括入组合物的多肽可根据本领域已知的方法被稳定。
[0270] 如下给出本发明多肽组合物的优选使用的实施例。本发明多肽组合物的剂量以及使用该组合物的其他条件可根据本领域已知的方法来确定。
[0271] 用途
[0272] 本发明也指向利用具有α-葡糖苷酶活性的多肽的方法。
[0273] 本发明的多肽可根据DE2944483用于从谷粒生产醇类。
[0274] 本发明的多肽也可根据WO2002/55652(公开的美国专利申请20040101591)用于生产发酵的麦芽饮料,例如(低-热值)啤酒。具有增强充气味道和富有口感的发酵麦芽饮料可通过在制造发酵麦芽饮料的过程中的麦芽汁生产过程的热处理之前加入具有α-葡糖苷酶活性的多肽来生产。可制造低热值的啤酒,其中在酿造啤酒的发酵过程中加入具有α-葡糖苷酶活性的多肽。乙酸的产生可通过在高比重酿造啤酒的发酵过程中加入具有α-葡糖苷酶活性的多肽而减少。
[0275] 在啤酒制造中,来源于包括麦芽的成分的淀粉由水解酶(例如,α-淀粉酶、β-淀粉酶)水解,并且生产出可发酵糖,例如葡萄糖、麦芽糖、啤酒酵母可代谢的麦芽三糖,大于麦芽四糖的寡聚糖、以及糊精。然后可发酵糖由啤酒酵母(或其他酵母)代谢并且被转化为啤酒的各种组分,例如醇类。大于麦芽四糖的寡聚糖和糊精可保持在啤酒中而不被代谢并且可参与充填饮料的味道和使其富有口感。
[0276] 在优选的方面,该方法涉及生产发酵的麦芽饮料,其中本发明的具有α-葡糖苷酶活性的多肽在制造发酵麦芽饮料的麦芽汁生产过程中热处理麦芽汁之前被加入。在另外更优选的方面,使用的具有α-葡糖苷酶活性的多肽的数量是每当量的麦芽50-400ppm。在另外优选的方面,具有α-葡糖苷酶活性的多肽与碾碎的麦芽同时加入。在另外优选的方面,具有α-葡糖苷酶活性的多肽在麦芽汁生产过程中的热处理之前被加入麦芽浆。在另外优选的方面,具有α-葡糖苷酶活性的多肽包括在发麦芽过程中。在另外优选的方面,只有麦芽被用作组分。在另外优选的方面,麦芽和添加剂被用作糖组分。
[0277] 在另外优选的方面,该方法涉及生产一啤酒,其中本发明的具有α-葡糖苷酶活性的多肽在啤酒酿造中被加入发酵过程。在更优选的方面,啤酒是低热值的啤酒或轻淡啤酒(light beer)。在另外优选的方面,加入具有α-葡糖苷酶活性的多肽减少了乙酸的产生。在另外更优选的方面,原麦汁抽出物的浓度超过10并且不超过30重量%。在另外更优选的方面,使用的具有α-葡糖苷酶活性的多肽的数量是每当量的麦芽50-400ppm。
[0278] 信号肽
[0279] 本发明也涉及包括与核苷酸序列可操作连接的编码蛋白质的基因的核酸构建体,其中该核苷酸序列由SEQ ID NO:1的第1至42位核苷酸、SEQ ID NO:3的第1至145位核苷酸、或SEQ ID NO:5的第1至57位核苷酸组成,其分别编码由SEQ ID NO:2的第1至14位氨基酸、SEQ ID NO:4的第1至29位氨基酸、或SEQ ID NO:6的第1至19位氨基酸组成的信号肽,其中该基因相对于该核苷酸序列是外来的。
[0280] 本发明也涉及包括这种核酸构建体的重组表达载体,和重组的宿主细胞。
[0281] 本发明也涉及生产蛋白质的方法,包括(a)在适于生产蛋白质的条件下培养这种重组宿主细胞;以及(b)回收该蛋白质。
[0282] 蛋白质对于宿主细胞可能是天然的或异源的。术语“蛋白质”在此不意味着是指特定长度的编码产物,并且因此包括肽、寡肽、和蛋白质。术语“蛋白质”也包括组合形成编码产物的两个或多个多肽。该蛋白质也包括其中包括获得自至少两个不同蛋白质的部分或完全多肽序列的组合的混合多肽,其中一个或多个对于宿主细胞可以是异源的或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白的天然存在的等位和工程化变体。
[0283] 优选地,该蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分、或报告子。在更优选的方面,该蛋白质氧化还原酶、转移酶、水解酶、裂解酶、异构酶、或连接酶。在更优选的方面,蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶裂解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
[0284] 基因可从任何原核、真核或其他的来源获得。
[0285] 本发明通过不应被理解为限制本发明范围的下列实施例进一步加以描述。
[0286] 实施例
[0287] 材料
[0288] 用作缓冲液和底物的化学品是至少试剂级的商业产品。
[0289] 菌株
[0290] 米曲霉BECh2菌株(Δalp,Δamy,CPA-,KA-,Δnp1)被用于表达烟曲霉α-葡糖苷酶。烟曲霉PaHa34被用作α-葡糖苷酶的来源。
[0291] 培养基
[0292] 马铃薯葡萄糖培养基的组成为每升24克马铃薯葡萄糖肉汤(broth)。
[0293] Cove平板的组成为每升342.3g蔗糖,20ml Cove盐溶液,10ml1M乙 酰胺,10ml1.5M CsCl2,和25g Noble琼脂。
[0294] Cove盐溶液的组成为每升26g KCl,26g MgSO4·7H2O,76g KH2PO4,和50ml COVE痕量金属溶液。
[0295] Cove痕量金属溶液的组成为每升0.04g Na2B4O7·10H2O,0.4gCuSO4·5H2O,1.2g FeSO4·7H2O,0.7g MnSO4·H2O,0.8g Na2MoO2·2H2O,和10g ZnSO4·7H2O。
[0296] MY25培养基的组成为每升25g麦芽糖糊精,2g MgSO4·7H2O,10gKH2PO4,2g柠檬酸,2g K2SO4,2g尿素,10g酵母提取物,和1.5ml AMG痕量金属溶液,调节至pH6。
[0297] AMG痕量金属溶液的组成为每升14.3g ZnSO4·7H2O,2.5g CuSO4·5H2O,0.5g NiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·H2O,和3g柠檬酸。
[0298] LB培养基的组成为每升10g胰蛋白胨,5g酵母提取物,和5g NaCl。
[0299] 2X YT培养基的组成为每升16g胰蛋白胨,10g酵母提取物,和5gNaCl。2X YT平板的组成为每升16g胰蛋白胨,10g酵母提取物,5g NaCl和15g Noble琼脂。
[0300] SOC培养基的组成为每升20g胰蛋白胨,5g酵母提取物,2ml5M NaCl,和2.5ml1M KCl。
[0301] TAE缓冲液的组成为40mM Tris碱,20mM乙酸钠,和1mM EDTA二钠pH7.2。
[0302] 实施例1:烟曲霉基因组序列中α-葡糖苷酶基因的鉴定
[0303] 利用查询来自构巢曲霉的α-葡糖苷酶蛋白质序列来进行(登录号Q9UV08)烟曲霉部分基因组序列的(The Institute for Genomic Research,Rockville,MD)tfasty检索(Pearson,W.R.,1999,in Bioinformatics Methods and Protocols,S.Misener and S.A.Krawetz,ed.,pp.185-219)。基于与询问序列在氨基酸水平的相似性,几个基因被鉴定为假定的同系物。与询问序列在氨基酸水平具有34.9、51.4和77.5%同一性的大约3000bp的3个基因组区域被鉴定出来。
[0304] 实施例2:烟曲霉基因组DNA提取
[0305] 烟曲霉于37℃和240rpm生长在带挡板摇瓶中的250ml马铃薯葡萄糖培养基中。通过过滤收获菌丝体,在TE(10mM Tris-1mM EDTA)中洗涤两次,并且在液氮下冷冻。通过研钵和杵棒研磨冷冻的菌丝体为细粉末,将其重悬在含有10mM Tris,100mM EDTA,1%Triton X-100,0.5M胍-HCl,和200mM NaCl的pH8.0缓冲液中。加入无Dnase的RNase A至浓度为20mg/升,并且裂解物在37℃温育30分钟。通过离心除去细胞碎屑,并利用Qiagen Maxi500柱(QIAGEN Inc.,Valencia,CA)分离DNA。该柱在用30ml QC洗涤的10ml QBT中平衡,并用15ml QF(所有缓冲液来自QIAGEN Inc.,Valencia,CA)洗脱。DNA在异丙醇中沉淀,70%乙醇中洗涤,并通过离心回收。该DNA重悬在TE缓冲液中。
[0306] 实施例3:pAlLo1表达载体的构建
[0307] 表达载体pAlLo1通过改变包括来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因启动子的杂合体(NA2-tpi启动子)、黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)、和构巢曲霉乙酰胺酶基因(amdS)的pBANe6(美国专利号6,461,837)来构建。全部的TM诱变步骤如所描述的通过使用Big-Dye 终止剂化学的测序来验证。pBANe6的改变首先通过定点诱变从amdS选择标记消除在第2051、2722和3397bp位置的3个Nco I限制位点来进行。全部的变化被设计成是“沉默的”,使得amdS基因产物的实际蛋白质序列没有改变。
TM
这3个位点的去除用GeneEditor 体外定点诱变试剂盒(Promega,Madison,WI)根据制造商的指导,利用下列引物同时进行(加下划线的核苷酸表示变化的碱基):AMDS3NcoMut(20
50):5’-GTGCCCCATGATACGCCTCCGG-3’(SEQ ID NO:7)AMDS2NcoMut(2721):5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO:8)AMDS1NcoMut(3396):5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO:9)
[0308] 包括全部3个预期的序列变化的质粒随后利用QuickChangeTM定点诱变试剂盒(Stratagene,La Jolla,CA)经受定点诱变,以消除在第1643位置的AMG终止子末端的Nco I限制位点。下列引物(加下划线的核苷酸表示变化的碱基)被用于诱变:
[0309] 诱变AMG终止子序列的上游引物:
[0310] 5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ ID NO:10)[0311] 诱变AMG终止子序列的下游引物:
[0312] 5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQ ID NO:11)[0313] pBANe6改变的最后步骤是利用QuickChangeTM定点诱变试剂盒和下列引物(加下划线的核苷酸表示变化的碱基)在多接头的起始添加新的Nco I限制位点以产生pAlLo1(图4)。
[0314] 诱变NA2-tpi启动子的上游引物:
[0315] 5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO:12)[0316] 诱变NA2-tpi启动子的下游引物:
[0317] 5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO:13)[0318] 实施例4:pBM120a表达载体的构建
[0319] 构建质粒pBM120a以获得含有用于在曲霉种属中驱动基因表达的双NA2(NA2-NA2-tpi)启动子,并含有用于在大肠杆菌中进行选择的氨苄青霉素抗性基因的质粒。
[0320] 设计引物来从pJaL721(WO03/008575)PCR扩增双NA2启动子。加入限制性酶切位点Sal I和Nco I(加下划线)用于将双启动子克隆进入曲霉表达质粒pAlLo1。
[0321] 5’-GTCGACATGGTGTTTTGATCATTTTA-3’(SEQ ID NO:14)
[0322] 5’-CCATGGCCAGTTGTGTATATAGAGGA-3’(SEQ ID NO:15)
[0323] 利用Expand High Fidelity PCR系统(Roche Diagnostics,Mannheim,Germany)通过PCR扩增感兴趣的片段。PCR扩增反应混合物包含1μl的每μl0.09μg pJaL721,1μl的各个引物(50pmol/μl),5μl具有15mM MgCl2的10X PCR缓冲液,1μl的dNTP混合物(每种为10mM),37.25μl水,和0.75μl(3.5U/μl)DNA聚合酶混合物。Eppendorf Mastercycler热循环仪(Hamburg,Germany)被用于扩增片段,其设置如下:1个循环的94℃,2分钟;10个循环的94℃,15秒,55℃,30秒,72℃,1.25分钟;15个循环的94℃,15秒,55℃,30秒,72℃,1.25分钟,在每个顺序的循环加5秒延伸;1个循环的72℃,7分钟;
和10℃保存。将10微升的这个PCR反应物与1μl10X DNA加样染料(25%丙三醇,10mM Tris pH7.0,10mM EDTA,0.025%溴酚蓝,0.025%二甲苯蓝)混合,并在1.0%(w/v)琼脂糖凝胶上利用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液进行电泳。在Nucleotech凝胶观察系统(Nucleotech,San Mateo,CA)上用紫外线观察到1128bp的PCR产物。根据制造商的指导该PCR产物被直接连接进入pPC2.1-TOPO(Invitrogen,Carlsbad,CA)。将1μl体积的新鲜PCR产物,3μl双蒸水和1μl TOPO克隆载体用吸液器混合并在工作台顶部温育5分钟。
[0324] 温育 后,2μl的混 合物 被用 于转 化OneShot感受 态大 肠杆 菌细 胞(Invitrogen,Carlsbad,CA)。将2μl体积的连接混合物加入大肠杆菌细胞并在上培养5分钟。随后,该细胞在42℃热休克30秒,并置于冰上2分钟。将250μl体积的SOC培养基加入这些细胞,并且该混合物在37℃和250rpm培养1小时。培养后,该集落被涂布到补充有每ml100μg氨苄青霉素的2XYT平板上,并在37℃培养过夜来选择质粒。生长在该平板上的8个集落用无菌牙签挑取,并于37℃,250rpm,在含有补充有每ml100μg氨苄青霉素的3ml LB培养基的15ml Falcon管中生长过夜。利用BioRobot9600(QIAGEN Inc.,Valencia,CA)分离质粒。
[0325] 4μl体积所得到的质粒小提物用Eco RI消化。消化反应物通过如先前对于PCR反应物所描述的琼脂糖凝胶色谱法和UV分析加以分析。含有插入的分离质粒利用1μl质粒模板,1.6ng M13引物(正向或反向)(MWG Biotech;High Point;NC),和6μl水来测序。DNA测序用Applied Biosystems Model377测序仪XL,利用染料终止剂进行。所得到的质粒被命名为pBM121b(图5)。
[0326] 5μl体积的pBM121b用Sal I和Nco I消化。消化反应物通过如上所述的琼脂糖凝胶电泳分析,连接至载体先前已经用Sal I和Nco I切割的pAlLo1。所得到的表达质粒被命名为pBM120a(图6)。
[0327] 实施例5:烟曲霉α-葡糖苷酶基因agl1的克隆
[0328] 设计如下所示的2个合成的寡聚核苷酸引物以从实施例2中制备的基因组DNA PCR扩增编码α-葡糖苷酶基因的命名为agl1的烟曲霉基因。
[0329] 正向引物:5'-TACACAACTGGCCATGTTGAGATCGCTGC-3'(SEQ ID NO:16)
[0330] 反向引物:5'-GTCACCTCTAGTTAATTAACTAGCTGAGGTCAATCTCGG-3'(SEQ ID NO:17)[0331] 黑体字表示编码序列。添加其余的序列用于克隆位点。
[0332] 通过PCR,利用Expand High Fidelity PCR系统扩增感兴趣的片段。50皮摩尔的上述每一引物被用于包含200ng烟曲霉基因组DNA的PCR反应。PCR扩增反应混合物也包含具有1.5mM MgCl2的1X PCR缓冲液,1μl dNTP混合物(分别为10mM),和0.75μl(3.5U/μl)DNA聚合酶混合物(Roche Diagnostics,Mannheim,Germany),终体积为50μl。Eppendorf Mastercycler热循环仪被用于扩增片段,设置如下:1个循环的94℃,2分钟;10个循环的94℃,15秒,58.1℃,30秒,72℃,2分5秒;15个循环的94℃,15秒,58.1℃,30秒,和
72℃,2分5秒,在每个顺序的循环加5秒延伸;1个循环的72℃,7分钟;以及10℃保持。
[0333] 反应产物在1.0%琼脂糖凝胶上利用TAE缓冲液分离,从凝胶切下大约3.0kb的产物条带并利用QIAquick凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA),根据制造商的指导进行纯化。
[0334] 然后该片段利用InFusion克隆试剂盒(BD Biosciences,Palo Alto,CA)克隆进入pBM120a。载体用Nco I和Pac I消化。消化载体和PCR片段如先前描述的通过凝胶电泳和QIAquick凝胶提取纯化。基因片段和消化的载体在产生其中α-葡糖苷酶基因的转录处于串联的NA2-tpi启动子调控之下的表达质粒pSMO216mu的反应中被连接在一起。连接反应(20μl)的组成为1XInFusion缓冲液(BD Biosciences,Palo Alto,CA),1X BSA(BD Biosciences,Palo Alto,CA),1μl Infusion 酶 (1:10 稀 释 )(BD Biosciences,Palo Alto,CA),40ng用Nco I和Pac I消化的pBM120a,和25ng烟曲霉α-葡糖苷酶纯化PCR产物。反应物在室温下温育30分钟。2μl反应物被用于转化E.coli One shot感受态细胞(Invitrogen Life Technologies,Carlsbad,CA)。含有pSMO216mu的大肠杆菌转化体通过限制性消化来检测,并且质粒DNA利用BioRobot9600来制备。
[0335] 实施例6:编码α-葡糖苷酶agl1基因的烟曲霉基因组序列的表征
[0336] 来自pSMO216mu烟曲霉α-葡糖苷酶agl1基因的DNA测序用Perkin-Elmer Applied Biosystems Model377XL Automated DNA 测 序 仪 (Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA),利用染料终止剂化学(Giesecke等,1992,Journal of Virology Methods38:47-60)和引物步行策略来进行。核对核苷酸序列数据的质量,并且将所有的序列借助PHRED/PHRAP软件(University of Washington,Seattle,WA)彼此进行比较。
[0337] pSMO216mu的序列分析显示与预测的序列有1个碱基对的变化。DNA序列至蛋白质的翻译导致在第367位置1个氨基酸的变化。定点诱变被用于变化该氨基酸回复到预测的序列。
[0338] 实施例7:烟曲霉α-葡糖苷酶agl1基因的定点诱变
[0339] 为了改变第367位置的氨基酸突变,设计下列所示的合成寡聚核苷酸引物利用QuikChange定点诱变试剂盒(Stratagene,La Jolla,CA)来PCR扩增烟曲霉α-葡糖苷酶agl1基因
[0340] 5'-GCATGGAGCAGGGCATCTTCCTGCAGACTC-3'(SEQ ID NO:18)
[0341] 5'-GAGTCTGCAGGAAGATGCCCTGCTCCATGC-3'(SEQ ID NO:19)
[0342] 100纳克的上述每一引物被用于含有10ng pSMO216mu,1X QuikChange反应缓冲液(Stratagene,La Jolla,CA),3μl QuikSolution(Stratagene,La Jolla,CA),1μl10mM dATP,dTTP,dGTP 和 dCTP 混 合 物 , 和 1μl2.5U/μl Pfu Ultra 酶 (Stratagene,La Jolla,CA)的PCR反应物,终体积为50μl。使用Eppendorf Mastercycler热循环仪,设置如下:1个循环的95℃,1分钟;30个循环的95℃,1分钟,55℃,1分钟,和65℃,14分钟。然后热休克进行至10℃保温循环。将1微升Dpn I直接加入扩增反应物,并在37℃温育1小时。2μl体积的Dpn I消化反应物被用于转化大肠杆菌XL10-Gold超感受态细胞(Stratagene,La Jolla,CA)。含有质粒pSMO216的大肠杆菌转化体通过限制性消化来检测并且质粒DNA利用BioRobot9600来制备。序列分析验证了质粒pSMO216中所产生的bp变化(图7)。
[0343] 含有pSMO216的大肠杆菌XL10-Gold超感受态细胞以NRRL B-30751保藏在农业研究机构保藏中心,1815University Street,Peoria,Illinois,61604,,保藏日期为2004年6月17日。
[0344] 根据tfasty输出构建序列的基因模型并且与来自米曲霉的同源基因排列对比。核苷酸序列(SEQ ID NO:1)和推导的氨基酸序列(SEQ ID NO:2)显示在图1中。该基因组片段编码881个氨基酸的多肽,其被49bp(第211至260位核苷酸)、52bp(第820至872位核苷酸)、54bp(第1063至1117位核苷酸)、51bp(第1135至1186位核苷酸)、49bp(第1592至
1643位核苷酸)、和51bp(第1702至1753位核苷酸)的6个内含子打断。agl1基因的%G+C含量是57.4%。利用SignalP软件程序(Nielsen等,1997,Protein Engineering10:1-6),预测出14个残基的信号肽。预测的成熟蛋白质包含分子量为98.8kDa的867个氨基酸。
[0345] α- 葡 糖 苷 酶 序 列 的 比 较 排 列 利 用 Clustal W 方 法TM TM
(Higgins,1989,CABIOS5:151-153), 利 用 LASERGENE MEGALIGN 软 件
(DNASTAR,Inc.,Madison,WI)来测定,其中使用 同一性表 格和下 列多个排 列参数:缺口罚分为(gap penalty)10,缺口长度罚分为10。成对排列参数是
Ktuple=1,gappenalty=3,windows=5,和diagonals=5。排列显示烟曲霉α-葡糖苷酶(Agl1)的推导的氨基酸序列与构巢曲霉α-葡糖苷酶(EMBL AB057788)的推导的氨基酸序列共享67%的同一性。
[0346] 实施例8:烟曲霉α-葡糖苷酶agl1基因在米曲霉BECh2中的表达
[0347] 米曲霉BECh2原生质体根据Christensen等,1988,Bio/Technology6:1419-1422的方法来制备。总的5μg pSMO216被用于转化米曲霉BECh2。
[0348] 使用pSMO216的米曲霉BECh2的转化产生了20个转化体。该20个转化体被转移到单独的Cove平板。20个转化体的孢子收集在4ml0.01%Tween20中,200μl孢子悬浮液分别被接种到在125ml塑料摇瓶中的25ml MY25培养基中,并在34℃,250rpm培养。接种后3和5天,如下所述测定培养物上清液的α-葡糖苷酶活性。
[0349] 100μl培养物上清液在0.1M乙酸钠缓冲液pH4.3中稀释。获得自Novozymes A/S,Bagsvaerd,Denmark的AMG标准物利用2-倍步骤稀释,在0.1M乙酸钠缓冲液pH4.3中起始为0.033AGU/ml浓度,并且终止为0.0042AGU/ml浓度。100微升20mg/ml麦芽糖溶液被加入各个孔,然后在25℃温育180分钟。温育步骤一结束,将200μl0.06N NaOH溶液加入各个孔以淬灭该反应。从各个孔转移出总的30μl淬灭反应物,并置于新的96-孔平板中,然后向各个孔加入200μl液状葡萄糖(氧化酶)试剂(PointeScientific,Inc,Lincoln Park,Michigan,USA),在室温下温育18分钟。温育一结束,利用Spectra Max349(Molecular Devices,Sunnyvale,CA)测量该96-孔平板在505nm处的吸光率。样品浓度通过从形成的标准曲线的外推法来确定。存在于培养基中的葡萄糖含量通过没有加入麦芽糖的液状葡萄糖试剂来独立测量样品肉汤中的葡萄糖而标准化。从来自其中加入麦芽糖底物的试剂的值减去吸光率。
[0350] 测定结果证明大约一半的转化体表达α-葡糖苷酶活性。命名为米曲霉SMO17的1个转化体如上所述在MY25培养基中培养以提供用于纯化和表征的酶。
[0351] 实施例9:烟曲霉α-葡糖苷酶agl2基因的克隆
[0352] 设计如下所示的2个合成的寡聚核苷酸引物以从实施例2中制备的基因组DNA PCR扩增编码α-葡糖苷酶的命名为agl2的烟曲霉基因。正向引物:5’-ACACAACTGGCCATGGCCCGGAGCAGCTCGTC-3’(SEQ ID NO:20)反向引物:5’-AGTCACCTCTAGTTAATTAATTAGAATTCAATCTTCCATG-3’(SEQ IDNO:21)
[0353] 黑体字表示编码序列。添加其余的序列用于克隆位点。
[0354] 感兴趣的片段通过PCR利用Expand High Fidelity PCR系统来扩增。50皮摩尔的上述每一引物被用于包含200ng烟曲霉基因组DNA的PCR反应。PCR扩增反应混合物也包含具有1.5mM MgCl2的1X PCR缓冲液,1μl dNTP混合物(各自为10mM),和0.75μl(3.5U/μl)DNA聚合酶混合物,终体积为50μl。Eppendorf Mastercycler热循环仪被用于扩增片段,设置如下:1个循环的94℃,2分钟;10个循环的94℃,15秒,58.1℃,30秒,72℃,2分5秒;15个循环的94℃,15秒,58.1℃,30秒,72℃,2分5秒,在各个顺序循环加5秒延伸;1个循环的72℃,7分钟;以及10℃保持。
[0355] 反应产物在1.0%琼脂糖凝胶上利用TAE缓冲液分离,从凝胶切下大约3.0kb的产物条带并利用QIAquick凝胶提取试剂盒,根据制造商的指导纯化。
[0356] 然 后 该 片 段 被 克 隆 进 入 pCR2.1-TOPO 载 体 (Invitrogen Life Technologies,Carlsbad,CA)。 该 基 因 片 段 通 过 PCR Clean Up Kit(QIAGEN Inc.,Valencia,CA)纯化。该片段和pCR2.1-TOPO载体通过产生质粒pHyGe011mu,利用由制造商制定的条件连接。2μl反应物被用于转化E.coli One Shot感受态细胞。含有质粒pHyGe011mu的大肠杆菌转化体通过限制性消化来检测并且质粒DNA利用BioRobot9600来制备。
[0357] 实施例10:编码α-葡糖苷酶agl2基因的烟曲霉基因组序列的表征
[0358] 来自pHyGe011mu的烟曲霉α-葡糖苷酶agl2基因的DNA测序用Perkin-Elmer Applied Biosystems Model377XL Automated DNA 测 序 仪 (Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA),利用染料终止剂化学(Giesecke等,1992,Journal of Virology Methods38:47-60)和引物步行策略进行。核对核苷酸序列数据的质量,并且将所有的序列借助PHRED/PHRAPsoftware(University of Washington,Seattle,WA)彼此进行比较。
[0359] pHyGe011mu的序列分析显示与预测的序列有7个碱基对的变化。DNA序列至蛋白质的翻译在第140、530和941位产生3个氨基酸变化。定点诱变被用于变化该氨基酸回复到预测的序列。
[0360] 实施例11:烟曲霉α-葡糖苷酶agl2基因的定点诱变
[0361] 为了改变在第140、530和941位的3个氨基酸突变,设计下列所示的3个合成的寡聚核苷酸引物利用QuikChange定点诱变试剂盒来PCR扩增包含5个碱基对变化的烟曲霉α-葡糖苷酶agl2基因。
[0362] 5’-CGCGCAGCTCCAGACTCCAGGAAAGAAATCAC-3’(SEQ ID NO:22)
[0363] 5’-GTACTTGAACAAGCCGGTCCACCATTTGATTG-3’(SEQ ID NO:23)
[0364] 5’-GCCTGCCTGCTGGGCGTGATACTCCAAGGGTG-3’(SEQ ID NO:24)
[0365] 100纳克的上述各个引物被用于含有100ng pHyGe011mu,1XQuikChange反应缓冲液,0.75μl QuikSolution,1μl dATP,dTTP,dGTP和dCTP的10mM混合物,1μl QuikChange Multi酶混合物的PCR反应,终体积为50μl。伴随下列设置使用Eppendorf Mastercycler热循环仪:1个循环的95℃,1分钟;30个循环的95℃,1分钟,55℃,1分钟,和65℃,14分钟。热休克进行至10℃保温循环。1微升Dpn I被直接加入扩增反应物,并在37℃温育1小时。2μl体积的Dpn I消化反应物被用于转化E.coli XL10-Gold超感受态细胞。含有质粒pHyGe011的大肠杆菌转化体通过限制性消化来检测并且质粒DNA利用BioRobot9600来制备。序列分析检验在质粒pHyGe011中产生的bp变化(图8)。
[0366] 含有质粒pHyGe011的E.coli XL10-Gold以NRRL B-30750保藏在农业研究机构保藏中心,1815University Street,Peoria,Illinois,61604,保藏日期为2004年6月10日。
[0367] 根据tfasty输出构建序列的基因模型并且与来自米曲霉的同源基因排列对比。核苷酸序列(SEQ ID NO:3)和推导的氨基酸序列(SEQ ID NO:4)显示在图2中。该基因组片段编码被58(第85至142位核苷酸)和54bp(第899至952位核苷酸)的2个内含子打断的967个氨基酸的多肽。该基因的%G+C含量是51.2%。利用SignalP软件程序(Nielsen等,1997,Protein Engineering10:1-6),预测出29个残基的信号肽。预测的成熟蛋白质包含分子量为106.5kDa的938个氨基酸。
[0368] α- 葡 糖 苷 酶 序 列 的 比 较 性 排 列 利 用 Clustal W 方 法TM TM(Higgins,1989,CABIOS5:151-153), 利 用 LASERGENE MEGALIGN 软 件
(DNASTAR,Inc.,Madison,WI)来确定,其中使用同一性表格和下列多个排列参数:缺口罚分为10并且缺口长度罚分为10。成对排列参数是Ktuple=1,gap penalty=3,windows=5,和diagonals=5。排列显示烟曲霉α-葡糖苷酶(Agl2)的推导的氨基酸序列与来自粗糙链孢霉的推定α-葡糖苷酶的推导氨基酸序列(登录号SWALL Q8NIY3)共享71%同一性。
[0369] 实施例12:用于烟曲霉α-葡糖苷酶agl2基因的米曲霉表达载体的构建[0370] 烟曲霉α-葡糖苷酶agl2基因被克隆进入表达载体pBM120a。基因片段通过用Nco I和Pac I消化从pHyGe011释放出来,然后如先前描述的通过凝胶电泳和QIAquick凝胶纯化来进行纯化。pBM120a载体用Nco I和Pac I消化。基因片段和消化的载体利用快速DNA连接试剂盒(BoehringerMannheim,Germany)连接在一起,产生其中烟曲霉α-葡糖苷酶基因的转录处于串连的NA2-tpi启动子调控之下的表达质粒pHyGe002。5微升的反应物被用于转化E.coli XL1-Blue亚克隆级感受态细胞(Stratagene,La Jolla,CA)。含有pHyGe002质粒的大肠杆菌转化体通过限制性消化来检测并且质粒DNA利用BioRobot9600来制备。
[0371] 实施例13:烟曲霉α-葡糖苷酶agl2基因在米曲霉BECh2中的表达
[0372] 米曲霉BECh2原生质体根据Christensen等,1988,同上文的方法来制备。总的7.3μg pHyGe002被用于转化米曲霉BECh2。
[0373] 用pHyGe002转化米曲霉BECh2产生24个转化体。该24个转化体被转移到单独的Cove平板。24个转化体的孢子收集在4ml0.01%Tween20中,200μl孢子悬浮液分别被接种到在125ml塑料摇瓶中的25ml MY25培养基中,且在34℃,250rpm培养。接种后3和5天,如实施例8所描述的测定培养物上清液的α-葡糖苷酶活性。
[0374] 测定结果证明大约一半的转化体表达α-葡糖苷酶活性。
[0375] 实施例14:烟曲霉α-葡糖苷酶agl3基因的克隆
[0376] 设计如下所示的2个合成的寡聚核苷酸引物来从实施例2中制备的基因组DNA PCR扩增编码α-葡糖苷酶的命名为agl3的烟曲霉基因。
[0377] 正向引物:
[0378] 5'-TACACAACTGGCCATGGCCAGCGTCCTGGGCCTCGTCGC-3'(SEQ ID NO:25)[0379] 反向引物:
[0380] 5'-GTCACCTCTAGTTAATTAACTACCATTTCAGAATCCAGTGTCC-3'(SEQ ID NO:26)[0381] 黑体字表示编码序列。添加其余的序列用于克隆位点。
[0382] 感兴趣的片段通过PCR利用Expand High Fidelity PCR系统来扩增。50皮摩尔的上述每一引物被用于包含200ng烟曲霉基因组DNA的PCR反应。PCR扩增反应混合物也包含具有1.5mM MgCl2的1X PCR缓冲液,1μl dNTP混合物(各自为10mM),和0.75μl(3.5U/μl)DNA聚合酶混合物(Roche Diagnostics,Mannheim,Germany),终体积为
50μl。Eppendorf Mastercycler热循环仪被用于扩增片段,设置如下:1个循环的94℃,2分钟;10个循环的94℃,15秒,60℃,30秒,72℃,2分30秒;20个循环的94℃,15秒,60℃,
30秒,和72℃,2分30秒,在每个顺序循环加5秒延伸;1个循环的72℃,7分钟;和10℃保持。
[0383] 反应产物在1.0%琼脂糖凝胶上利用TAE缓冲液分离,从凝胶切下大约3.15kb的产物条带并利用QIAquick凝胶提取试剂盒,根据制造商的指导纯化。
[0384] 然后该片段利用InFusion克隆试剂盒克隆进入pBM120a。该载体用NcoI和Pac I消化。消化的载体和PCR片段都通过凝胶电泳和QIAquick凝胶提取如先前描述的进行纯化。基因片段和消化的载体在产生其中α-葡糖苷酶基因转录被置于串联的NA2-tpi启动子调控下的表达质粒pJSF9b(图9)的反应中连接在一起。连接反应(20μl)的组成为1X InFusion缓冲液,1X BSA(BD Biosciences,Palo Alto,CA),1μl Infusion酶(diluted1:10),90ng用Nco I和Pac I消化的pBM120a,和84ng烟曲霉α-葡糖苷酶的纯化PCR产物。反应在室温下温育30分钟。1.5μl的反应物根据制造商的指导用于转化E.coli Solopac Gold超感受态细胞(Stratagene,La Jolla,CA)。含有pJSF9b的大肠杆菌转化体通过限制性消化来检测并且质粒DNA利用BioRobot9600来制备。
[0385] 实施例15:编码α-葡糖苷酶agl3基因的烟曲霉基因组序列的表征
[0386] 来自pJSF9b的烟曲霉α-葡糖苷酶agl3基因的DNA测序用Perkin-Elmer Applied Biosystems Model377XL Automated DNA 测 序 仪 (Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA),利用染料终止剂化学(Giesecke等,1992,Journal of Virology Methods38:47-60)和引物步行策略来进行。核对核苷酸序列数据的质量,并且将所有的序列借助PHRED/PHRAP软件(University of Washington,Seattle,WA)彼此进行比较。pJSF9b的序列分析证实该克隆包含α-葡糖苷酶。
[0387] 含有质粒pJSF9b的E.coli XL10-Gold以NRRL B-30856保藏在农业研究机构保藏中心,1815University Street,Peoria,Illinois,61604,保藏日期为2005年6月23日。
[0388] 核苷酸序列(SEQ ID NO:5)和推导的氨基酸序列(SEQ ID NO:6)显示在图3中。该基因组片段编码被766bp(第700至765位核苷酸)、61bp(第1174至1235位核苷酸)、和70bp(第1407至1477位核苷酸)的3个内含子打断的988个氨基酸的多肽。该基因的%G+C含量是56.4%。利用SignalP软件程序(Nielsen等,1997,supra),预测出19个残基的信号肽。预测的成熟蛋白质包含分子量为108.6kDa的969个氨基酸。
[0389] α- 葡 糖 苷 酶 序 列 的 比 较 性 排 列 利 用 Clustal W 方 法TM TM(Higgins,1989,CABIOS5:151-153), 利 用 LASERGENE MEGALIGN 软 件
(DNASTAR,Inc.,Madison,WI)来确定,其中使用同一性表格和下列多个排列参数:缺口罚分为10和缺口长度罚分为10。成对排列参数是Ktuple=1,gap penalty=3,windows=5,和diagonals=5。排列显示烟曲霉α-葡糖苷酶(Agl3)的推导的氨基酸序列与来自米曲霉的α-葡糖苷酶的推导的氨基酸序列(登录号SwissprotQ12558)共享81%同一性。
[0390] 实施例16:烟曲霉α-葡糖苷酶agl3基因在米曲霉BECh2中的表达
[0391] 米曲霉BECh2原生质体根据Christensen等,1988,同上文的方法来制备。总的7.3μg pJSF9b被用于转化米曲霉BECh2。
[0392] 用pJSF9b转化米曲霉BECh2产生20个转化体。该20个转化体被转移到单独的Cove平板。转化体的孢子收集在4ml0.01%Tween20中,200μl孢子悬浮液分别被接种到在125ml塑料摇瓶中的25ml MY25培养基中,并且在34℃,250rpm培养。接种后3和5天后,如实施例8所描述的测定培养物上清液的α-葡糖苷酶活性。
[0393] 测定结果证明大约一半的转化体表达α-葡糖苷酶活性。命名为米曲霉SMO24的1个转化体如上所述在MY25培养基中培养以提供用于纯化和表征的酶。
[0394] 实施例17:烟曲霉Agl1α-葡糖苷酶的纯化
[0395] 如实施例8中所描述,在米曲霉BECH2中表达的烟曲霉Agl1α-葡糖苷酶利用如下所述的方案进行纯化。
[0396] α-葡糖苷酶活性利用麦芽糖作为底物来测量。麦芽糖(1.1%;375μl)在37oC水浴中温育5分钟。将稀释在含有0.01%Triton-X100的50mM乙酸钠pH5.0中的等分酶样品(25μl)与底物混合。温育10分钟后通过加入100μl1M Tris溶液并且立即煮沸3分钟来终止反应。
[0397] 蛋白质浓度利用BCA蛋白质测定试剂盒(Pierce,Rockford,IL),根据其“微平板方法”来测定。
[0398] 来自馏分和汇集部份的样品的SDS-PAGE分析通过以1:1比率混合样品和Laemmli样品缓冲液(Bio-Rad,Hercules,CA)来进行。煮沸2分钟后,样品伴随10-15μl分子质量标记(Precision Plus Protein Standards,Bio-Rad,Hercules,CA)被加载到8-16%SDS-PAGE凝胶(Bio-Rad,Hercules,CA)上。凝胶在1X Tris-Glycine-SDS电泳缓冲液(Bio-Rad,Hercules,CA)中于200V泳动1小时。然后凝胶用水漂洗3次,每次5分钟,并用Bio-Safe考马斯染色剂染色(Bio-Rad,Hercules,CA)1小时,然后用水脱色超过1小时。
[0399] 摇瓶培养物(MY25培养基)在1000x g离心并移出上清液。上清液利用Stericup0.22μm真空滤器(Millipore,Billerica,MA)过滤。
[0400] 该上清液包含相当大量的淡褐色色素。为了除去色素,将105ml上清液(用100mM Tris pH8.5稀释2.5-倍)加载到用0.1M Tris pH8.5预平衡的含有Q-Sepharose Big Beads树脂(Amersham Biosciences,Uppsala,Sweden)的30X2.5cm柱上。α-葡糖苷酶用0.1M乙酸钠pH4.0缓冲液洗涤来洗脱而不分馏。收集“洗净”(wash out)溶液(300ml)并测定α-葡糖苷酶活性。回收百分之五十九的α-葡糖苷酶活性。剩余的大部分淡褐色色素结合Q-Sepharose。Q-Sepharose柱的乙酸钠洗涤步骤后,将0.5mM的丝氨酸蛋白酶抑制剂,PMSF加入溶液以免潜在的蛋白水解。浓缩这个溶液并且利用搅拌的250ml超滤细胞(Amicon,Beverly,MA)再缓冲(100mM Tris pH8.5)。
[0401] 然后来自Q-Sepharose柱步骤的α-葡糖苷酶被加载到用50mM Tris pH8.5预平衡的Mono Q16/10柱上(Pharmacia Biotech AB,Uppsala,Sweden)。该酶利用在50mM Tris pH8.5中的0至0.55M NaCl20柱容积梯度来洗脱。收集10ml馏分,测定α-葡糖苷酶活性,并根据特异活性和纯度(SDS-PAGE)汇集。
[0402] 来自Mono Q柱步骤的α-葡糖苷酶最后被加载到用50mM乙酸盐,pH4.5预平衡的Mono S16/10柱上(Pharmacia Biotech AB,Uppsala,Sweden)。该α-葡糖苷酶利用在50mM乙酸盐,pH4.5中的0至0.5M NaCl20柱容积梯度来洗脱。收集10ml馏分,测定α-葡糖苷酶活性,并且根据纯度(SDS-PAGE)汇集。
[0403] 纯化概括在下列表1中。
[0404] 表1.烟曲霉Agl1α-葡糖苷酶的纯化
[0405]体积(ml) 纯化倍数 回收(%)
起始上清液 105 1 100
在Q-Sepharose上的乙酸盐洗涤(色素去除) 35 3.17 59
单Q柱色谱 34 20.9 40
单S柱色谱 6 27.6 29
[0406] 实施例18:烟曲霉Agl3α-葡糖苷酶的纯化
[0407] 如实施例16中所描述的,在米曲霉BECH2中表达的烟曲霉Agl3α-葡糖苷酶利用如下所述的方案纯化。
[0408] α-葡糖苷酶活性如实施例17中所描述的测量。蛋白质浓度如实施例17所描述的测定。SDS-PAGE分析如实施例17所描述的进行。
[0409] 摇瓶培养物(MY25培养基)在1000x g离心,并移出上清液。上清液利用Millipore0.22μm Stericup 真空滤器过滤。
[0410] 该上清液包含相当大量的淡褐色色素。为了除去色素,将250毫升的上清液(用100mM Tris pH8.5稀释2.5-倍)加载到用0.1M Tris pH8.5预平衡的含有Q-Sepharose Big Beads树脂的30X2.5cm柱上。α-葡糖苷酶用0.1M乙酸钠pH4.0缓冲液洗涤来洗脱而不分馏。收集“洗净”溶液(300ml)并用于测定α-葡糖苷酶活性。回收百分之六十八的α-葡糖苷酶活性。剩余的大部分淡褐色色素结合Q-Sepharose。Q-Sepharose柱的乙酸钠洗涤步骤后,将0.5mM的丝氨酸蛋白酶抑制剂,PMSF加入溶液以免潜在的蛋白水解。浓缩这个溶液并且利用搅拌的250ml Amicon超滤细胞再缓冲(100mM Tris pH8.5)。
[0411] 然后来自Q-Sepharose柱步骤的α-葡糖苷酶被加载到用50mM Tris pH8.5预平衡的Mono Q16/10柱上。该酶利用在50mM Tris pH8.5中的0至0.5M NaCl20柱容积梯度洗脱。收集10ml馏分,测定α-葡糖苷酶活性,并根据特异活性和纯度(SDS-PAGE)汇集。
[0412] 最后来自MonoQ柱步骤的α-葡糖苷酶被加载到用1.7M(NH4)2SO4-50mM Tris pH8.5 预 平 衡 的 Phenyl Sepharose HR16/10 柱 上 (PharmaciaBiotechAB,Uppsala,Sweden)。α-葡糖苷酶用1.7M(NH4)2SO4-50mM Tris pH8.5至50mM Tris pH8.5的20柱容积梯度洗脱。收集10ml馏分,测定α-葡糖苷酶活性,并根据纯度(SDS-PAGE)汇集。
[0413] 纯化概括在下列表2中。
[0414] 表2.烟曲霉Agl3α-葡糖苷酶的纯化
[0415]体积(ml) 纯化倍数 回收(%)
起始上清液 250 1.0 100
在Q-Sepharose上的乙酸盐洗涤(色素去除) 75 4.1 68
单Q柱色谱 61 8.2 34
Phenyl Superose柱色谱 9 11.8 12
[0416] 实施例19:烟曲霉α-葡糖苷酶的表征
[0417] SDS-PAGE分析.纯化的烟曲霉Agl1和Agl3α-葡糖苷酶如上所述通过SDS-PAGE加以分析。尽管成熟Agl1α-葡糖苷酶的预测分子量是98.8kDa,SDS-PAGE结果显示大约40和60kDa的2个条带。同时成熟Agl3α-葡糖苷酶的预测分子量是108.6kDa,SDS-PAGE结果显示大约110kDa的1个条带。
[0418] MALDI-TOF MS分析.如下所述40和60kDa条带的MALDI-TOF MS分析显示它们来自Agl1α-葡糖苷酶,并且110kDa条带来自Agl3α-葡糖苷酶。
[0419] MultiPROBE II Liquid Handeling Robot(PerkinElmer Life andAnalyticalSciences,Boston,MA)被用于进行凝胶内消化。从SDS-PAGE凝胶切下在纯化的烟曲霉Agl1中观察到的40和60kDa条带和来自Agl3α-葡糖苷酶的110kDa条带。该凝胶条带用50μl在碳酸氢铵pH8.0中的10mM DTT100mM还原30分钟。还原后,凝胶块用50μl在100mM碳酸氢铵pH8.0缓冲液中的55mM碘乙酰胺烷基化20分钟。容许干凝胶块在组成为每μl6ng测序级胰蛋白酶(Princeton Separations,Adelphia,NJ)的50mM碳酸氢铵pH8缓冲液的胰蛋白酶消化溶液中于室温下膨胀30分钟,然后在40℃消化8小时。描述的每一反应步骤按照制造商的标准方案继之以用合适的溶液进行多次洗涤和预洗涤。50μl乙腈被用于在反应之间使凝胶脱水,并且在步骤之间凝胶块被空气干燥。肽用在HPLC级水中的
1%甲酸/2%乙腈提取2次,每次30分钟。肽提取溶液被转移至已经冷却至10–15℃的96孔带边的PCR型平板(ABGene,Rochester,NY)中,并用96孔平板盖(PerkinElmer Lifeand Analytical Sciences,Boston,MA)覆盖以防止蒸发。平板进一步储存在4℃直到能够进行质谱分析。
[0420] 40和60kDa蛋白质条带和110kDa条带如上所述用胰蛋白酶进行凝胶内消化。回收的肽通过用于蛋白质验证的肽质量指纹分析来进行研究。使用MaldiTM-LR飞行时间质谱仪(Waters Micromass MS Technologies,Milford,MA)。再结晶的α-氰基-4-羟基肉桂酸通过用100%乙腈(E.M.Science,Gibbstown,NJ)洗涤毫克数量的α-氰基-4-羟基肉桂酸(Sigma Chemical Co.,St.Louis,MO)并且充分混合以及离心至形成基质颗粒来制备。除去并丢弃乙腈溶液。加入HPLC级水(Fisher Chemicals,Fairlawn,NJ,),然后缓慢加入氢氧化铵(J.T.Baker,Phillipsburg,NJ)直到几乎所有的颗粒溶解。丢弃未溶解的颗粒。将浓缩的HCl水(Fisher Chemicals,Fairlawn,NJ,)缓慢加入基质溶液直到大量基质已经再结晶。结晶基质通过过滤被移出,并用0.1M HCl洗涤若干次且容许其完全干燥。最后的基质溶液由在50%乙腈/50%含水0.1%TFA中的10mg/ml再结晶α-氰基-4-羟基肉桂酸溶液组成。将1μl获得自蛋白质凝胶内消化的肽提取溶液与1μl再结晶的基质溶液混合并且在不锈的MALDI-TOF靶平板(Waters Micromass MS Technologies,Milford,MA)上打点干燥。质谱仪利用+15kV的加速电压,2535伏特的脉冲电压,和2000伏特的reflectron电压以reflectron和阳离子模式运作。数据采集质量范围设置为640至3000m/z。使用由1μl200fmols/μl ACTH(AdenocorticotrophicHormone Clip18-39MW=2,465.1989)(Sigma Chemical Co,St.Louis,MO)和1μl再结晶的基质溶液组成的定质量校准标准用于内标准并且打点至邻近的锁定质量目标孔。数据采集利用Windows NT控制的微处理器工作站,利用Masslynx4.0质谱分析法软件(Waters Micromass MS Technologies,Milford,MA)进行。使获得的光谱组合、平滑和中心化,并TN
且产生肽离子质量的峰值列表。这个峰值列表利用ProteinLynx Global Server2.05软件(Waters Micromass MS Technologies,Milford,MA)针对数据库进行检索。
[0421] 来自肽质量指纹分析的结果表明验证40和60kDa蛋白质条带为烟曲霉Agl1α-葡糖苷酶,而验证110kDa蛋白质条带为烟曲霉Agl3α-葡糖苷酶。
[0422] 最适pH.利用上述的活性测定,在50mM乙酸盐缓冲液/50mM磷酸盐缓冲液,于37oC在不同的pH值测量纯化的烟曲霉Agl1和Agl3α-葡糖苷酶的特异活性。
[0423] 如图10所示Agl1α-葡糖苷酶在pH4.1具有酸性最适pH活性。如图13所示Agl3α-葡糖苷酶在pH4.0-4.5范围内具有酸性最适pH活性。
[0424] 热稳定性.纯化的烟曲霉Agl1和Agl3α-葡糖苷酶的热稳定性通过将每一α-葡糖苷酶在50mM乙酸钠pH5.0水浴中,于选择的温度温育5分钟来确定。作为底物的麦芽糖(1.1%;375μl)在水浴中于37oC温育5分钟。将等分的酶样品与底物混合,并在37oC测量特异活性。
[0425] 如图11所示,烟曲霉Agl1α-葡糖苷酶达到大约70oC仍具有优良的热稳定性(大约80%残余)。该酶于这个温度在50mM乙酸盐缓冲液pH5.0中5分钟后只丧失22%活性,而在100oC丧失全部活性。
[0426] 如图14所示,烟曲霉Agl3α-葡糖苷酶达到大约67oC仍具有优良的热稳定性(大约80%残余)。该酶于70oC在50mM乙酸盐缓冲液pH5.0中5分钟后只丧失33%活性,而在100oC丧失全部活性。
[0427] 最适温度.纯化的烟曲霉Agl1和Agl3α-葡糖苷酶的特异活性在50mM乙酸钠pH5.0中于不同的温度值加以测量。将作为底物的麦芽糖(1.1%;375μl)于选择的温度在水浴中温育5分钟。将在含有0.01%Triton-X100的50mM乙酸钠pH5.0稀释的等分酶样品(25μl)与底物混合。该反应在相同温度温育10分钟后通过加入1M Tris溶液(100μl)并且立即煮沸3分钟来终止。
[0428] 如图12所示,Agl1酶的最适温度是大约63oC。如图15所示,Agl3酶的最适温度是大约60oC。
[0429] 动学参数.测定麦芽糖被纯化的烟曲霉Agl1和Agl3α葡糖苷酶特异水解的动力学参数。
[0430] 装备有CarboPac PA104x250mm柱和ED50电化学检测器(Sunnyvale,CA)的Dionex BioLC HPLC装置被用于定量检测来自麦芽糖水解的葡萄糖。氢氧化钠溶液(200mM)被用作液相。这个方法提供在大约0.01mM葡萄糖水平的精确测定。校准曲线在0mM和1.2mM葡萄糖之间是线性的。
[0431] 温育混合物在37oC包含在0.19-4.61mM范围内的10ml麦芽糖溶液。酶促反应通过加入10μlα-葡糖苷酶溶液来起始。酶促反应通过将1ml等分样品置于沸水中2.5分钟然后置于冰至少30分钟来终止。
[0432] kcat的值利用烟曲霉α-葡糖苷酶Agl1和Agl3的分别为98.8kDa和108.6kDa的分子质量来计算。
[0433] 通常被用来确定动力学参数的倒数曲线图对于每个酶都不是线性的。在升高的麦芽糖浓度,水解反应的速度(葡萄糖的累积)显著降低。这个效应对于烟曲霉Agl1α-葡糖苷酶是特别显著的,其中从0.58mM麦芽糖开始观察到降低的反应速度。
[0434] 麦芽糖的α-葡糖苷酶-催化水解中观察到的速度降低可能是由底物抑制所引起的(Segel,I.H.Enzyme Kinetics.Behavior and Analysis of RapidEquilibrium and Steady-State Enzyme Systems.1975,John Wiley&Sons),或备选地可能是转糖基反应中葡萄糖的竞争性利用的结果。随着麦芽糖浓度增加,它成为葡萄糖分子的接受体。葡萄糖和麦芽糖之间的转糖基反应导致产生潘糖(6-O-α-D-葡糖基麦芽糖)。产生麦芽糖和异麦芽糖的2个葡萄糖分子之间相互作用的概率由于在“初速度”状态下麦芽糖的低浓度而是很低的。CarboPac PA10柱容许从寡聚糖分离葡萄糖,但不区分麦芽糖和潘糖。
[0435] 从曲线图评估α-葡糖苷酶的动力学参数。在pH5.0和37oC,烟曲霉Agl1α-葡-1糖苷酶的Km是0.04mM,kcat是48s (底物范围为0.12mM-0.41mM)。在pH5.0和37°C,烟-1
曲霉Agl3的Km是0.34mM,kcat是237s (底物范围为0.14mM-0.55mM)。
[0436] 如上所指出,该底物范围并不总是最佳的。同时检测极限不容许应用更低的底物浓度。两个α-葡糖苷酶证明了可能归因于转糖基作用活性的强烈的“底物抑制”。
[0437] 实施例20:烟曲霉Agl2α-葡糖苷酶的纯化
[0438] 如实施例13中描述的在米曲霉BECH2中表达的烟曲霉Agl2α-葡糖苷酶利用如下所述的方案纯化。
[0439] α-葡糖苷酶活性如实施例17中所描述的进行测量。蛋白质浓度如实施例17所描述的测定。SDS-PAGE分析如实施例17所描述的进行。
[0440] 摇瓶培养物(MY25培养基)在1000x g离心并移出上清液。上清液利用Millipore0.22μm Stericup 真空滤器过滤。
[0441] 上清液用100mM Tris稀释,pH调节至8.5。该稀释的上清液包含淡褐色色素。为了除去色素,250毫升的上清液(用100mM Tris pH8.5稀释2.5-倍)被 加 载 到 用 0.1M Tris pH8.5预 平 衡 的 含 有Q-Sepharose Big Beads 树 脂(Amersham Biosciences,Uppsala,Sweden) 的 30x2.5cm 柱 上 (PharmaciaBiotech AB,Uppsala,Sweden)。α-葡糖苷酶用0.1M乙酸钠pH4.0缓冲液洗涤来洗脱而不分馏。收集“洗净”溶液(300ml)并测定α-葡糖苷酶活性。回收百分之九十的α-葡糖苷酶活性。剩余的大部分淡褐色色素结合Q-Sepharose。Q-Sepharose柱的乙酸钠洗涤步骤后,将
0.5mM的丝氨酸蛋白酶抑制剂,PMSF加入溶液以免潜在的蛋白水解。浓缩这个溶液并且利用搅拌的250ml超滤细胞(Amicon,Beverly,MA)再缓冲(100mM Tris pH8.5)。
[0442] 然后来自Q-Sepharose柱步骤的α-葡糖苷酶被加载到用50mM Tris pH8.5预平衡的Mono Q16/10柱上。该酶利用在50mM Tris pH8.5中的0至0.5M NaCl20柱容积梯度洗脱。收集10ml馏分,测定α-葡糖苷酶活性,并根据特异活性和纯度汇集(SDS-PAGE)。
[0443] 纯化概括在下列表3中。
[0444] 表3.烟曲霉Agl2α-葡糖苷酶的纯化
[0445]体积(ml) 纯化倍数 回收(%)
起始上清液 1700 1 100
在Q-Sepharose上的乙酸盐洗涤(色素去除) 520 2.5 90
单Q柱色谱 90 6.2 63
沉淀 40 72 28
[0446] 纯化的制品在SDS-PAGE上产生分子量为33、36、75、和105kDa的4个条带。根据烟曲霉Agl3α-葡糖苷酶的预测质量,105kDa的条带相应于α-葡糖苷酶。
[0447] 生物材料的保藏
[0448] 下列生物材料已经根据布达佩斯条约保藏在农业研究机构保藏中心,1815University Street,Peoria,Illinois,61604,并且给出下列保藏号:
[0449] 保藏物 保藏号 保藏日期
[0450] 大肠杆菌XL10-Gold(pSMO216) NRRL B-30751 2004年6月17日
[0451] 大肠杆菌XL10-Gold(pHyGe011) NRRL B-30750 2004年6月10日
[0452] 大肠杆菌XL10-Gold(pJSF9b) NRRL B-30856 2005年6月23日
[0453] 该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
[0454] 本文所描述和要求保护的发明并不限于由本文公开的具体实施方案的范围,因为这些实施方案旨在例证说明本发明的若干方面。任何等同的实施方案都将在本发明的范围之内。事实上,除了本文所显示和描述的那些之外,由在前描述对于本领域技术人员来说本发明的各种改进将是显而易见的。这些改进也将落入随附的权利要求的范围之内。在出现抵触的情况下,以包括定义的本说明书的公开来调控。
[0455] 本文引用了多种参考文献,将其全部内容并入作为参考。
[0456]
[0457]
[0458]
QQ群二维码
意见反馈