制备多肽变异体的方法专利检索-植物促生菌有效微生物生物学专利检索查询-专利查询网

制备多肽变异体的方法

阅读：370发布：2021-01-05

专利汇可以提供制备多肽变异体的方法专利检索，专利查询，专利分析的服务。并且本发明涉及通过体内重组将同源DNA序列的不同的核苷酸序列改组制备阳性多肽变异体的方法,包括下列步骤:(a)形成至少一种含有编码多肽的DNA序列的环状质粒,(b)在编码多肽的DNA序列内打开所述的环状质粒,(c)制备至少一种包括与至少一种环状质粒的多肽编码区的至少一部分同源的DNA序列的DNA 片段 ,(d)将至少一种所述的开环质粒与至少一种所述同源DNA片段一起导入到重组宿主细胞,所述同源DNA片段覆盖了编码所述多肽的全长DNA序列或其一部分,(e)培养所述的重组宿主细胞,和(f)筛选阳性多肽变异体。，下面是制备多肽变异体的方法专利的具体信息内容。

权利要求

1.用于制备多肽变异体的方法，包括通过体内重组将同源DNA序列的不同的核苷酸序列进行改组，包括下列步骤：
(a)形成至少一个含有编码多肽的DNA序列的环状质粒，
(b)在编码多肽的DNA序列内打开所述的环状质粒，
(c)制备至少一个包括与至少一种环状质粒的多肽编码区的至少一部分同源的DNA序列的DNA片段，
(d)将至少一种所述的开环质粒与至少一种所述同源DNA片段一起导入到重组宿主细胞，所述同源DNA片段覆盖了编码所述多肽的全长DNA序列或其一部分，
(e)培养所述的重组宿主细胞，和
(f)筛选阳性多肽变异体。
2.根据权利要求1所述的方法，其中将步骤(a)-(f)进行一个以上的循环。
3.根据权利要求1和2所述的方法，其中在相同的改组循环中两个或多个打开的质粒与一个或多个同源DNA片段进行改组。
4.根据权利要求1-3任一项所述的方法，其中开环质粒有缺口。
5.根据权利要求1-4任一项所述的方法，其中开环质粒和同源的DNA 片段之间的比例是在20∶1-1∶50的范围内，优选的是在2∶1-1∶ 10(摩尔载体：摩尔片段)的范围内，其中DNA的比浓度为1pM-10M的范围内。
6.根据权利要求1-5任-项所述的方法，其中2或多个，优选的是 2-6，尤其是2-4个DNA片段具有部分重叠区域。
7.根据权利要求6所述的方法，其中DNA片段的重叠区域位于5-5000 碱基对，优选的是10-500碱基对，尤其是10-100碱基对的范围内。
8.根据权利要求1-8任一项所述的方法，其中至少步骤(a)-(f)的一个循环是与起始使用的DNA片段回交。
9.根据权利要求1-8任一项所述的方法，其中在编码多肽的DNA序列的中间左右的区域打开质粒。
10.根据权利要求1-9任一项所述的方法，其中在靠近编码多肽的DNA 序列的突变处打开质粒。
11.根据权利要求1-10任一项所述的方法，其中在适合于高，中等或低诱变的条件下制备在步骤(c)中制备的DNA片段。
12.根据权利要求1-11任一项所述的方法，其中可从输入的DNA序列生产的多肽是具有生物学活性的酶或蛋白质。
13.根据权利要求12所述的方法，其中多肽是选自于下列组的酶：蛋白酶，脂酶，角质酶，纤维素酶，淀粉酶，过氧化物酶，氧化酶和植酸酶。
14.根据权利要求12所述的方法，其中多肽是选自于下列组的具有生物学活性的蛋白质：胰岛素，ACTH，胰高血糖素，生长激素抑制素，促生长素，胸腺素，甲状旁腺激素，色素激素，生长调节素，红血球生成素，促黄体激素，绒毛膜促性腺激素，下丘脑释放因子，抗利尿激素，甲状腺刺激激素，松弛素，干扰素，血小板生成素(TPO)和促乳素。
15.根据权利要求1-13任一项所述的方法，其中至少一种起始使用的输入DNA序列是野生型DNA序列，例如编码野生型酶特别是脂酶的DNA 序列，所述脂酶来自于例如Humicola种的丝状真菌特别是Humicola lanuginosa，尤其是Humicola lanuginosa DSM 4109。
16.根据权利要求15所述的方法，其中至少一个输入的DNA序列选自于(a)-(f)的组的载体和/或编码Humicola lanuginosa脂酶变异体的(g) -(aa)的DNA片段。
17.根据权利要求1-13任一项所述的方法，其中至少一种起始使用的输入DNA序列是野生型DNA序列，例如编码野生型酶特别是脂酶的DNA 序列，所述脂酶来自于犁头霉，根霉，翅孢壳，曲霉，青霉，Eupenicilium，拟青霉属，保节菌属，热子囊菌和Sclerocleista的属的丝状真菌。
18.根据权利要求1-13任一项所述的方法，其中至少一种起始使用的输入DNA序列是野生型DNA序列，例如编码野生型酶特别是脂酶的DNA 序列，所述脂酶来自于细菌，例如假单胞菌种，特别是莓实假单胞菌，司徒茨氏假单胞菌，葱头假单胞菌，荧光假单胞菌，Pseudomonas plantarii，唐菖蒲假单胞菌，产碱假单胞菌，粪产碱假单胞菌，门多茜娜假单孢菌，Pseudomonas auroginosa，夹壳假单孢菌，丁香假单孢菌， Pseudomonas wisconsinensis或芽孢杆菌种的菌株特别是枯草芽孢杆菌，嗜热脂肪芽孢杆菌或短小芽孢杆菌或链霉菌种的菌株特别是沧痂病链霉菌或色杆菌种的菌株特别是粘稠色杆菌。
19.根据权利要求1-13任一项所述的方法，其中至少一种起始使用的输入DNA序列是变异体DNA序列，例如编码变异体酶特别是脂酶变异体的DNA序列，所述酶来自于酵母例如假丝酵母，特别是皱褶假丝酵母或地霉，特别是白地霉。
20.根据权利要求1-19任一项所述的方法，其中同源输入DNA序列至少60％同源性，优选的是至少70％，更好的是高于80％同源性，尤其是高于至少90％同源性，甚至高达100％的同源性。
21.根据权利要求1-20任一项所述的方法，其中重组宿主细胞是真核细胞，例如真菌细胞或植物细胞。
22.根据权利要求21所述的方法，其中所述的真菌细胞是选自于下列组的细胞：酵母种的细胞，特别是啤酒酵母或克鲁维氏酵母或裂殖糖酵母的细胞，特别是粟酒裂殖糖酵母或克鲁维氏酵母例如乳克鲁维氏酵母，或汉逊酵母特别是多型汉逊酵母或毕赤氏酵母特别是巴斯德毕赤氏酵母或选自于下列组的丝状真菌细胞曲霉，特别是黑曲霉，构巢曲霉或米曲霉，或链孢霉属或镰刀菌属，特别是尖孢镰孢或地霉的细胞。
23.根据权利要求1-22任一项所述的方法，其中编码多肽的质粒DNA 序列可操作连接到复制序列。
24.根据权利要求23所述的方法，其中编码多肽的质粒DNA序列可操作连接到功能启动子序列。
25.根据权利要求24所述的方法，其中质粒是表达质粒。
26.根据权利要求25所述的方法，其中表达质粒是pJSO26或 pJSO37。

说明书全文

发明领域

本发明涉及通过体内重组制备多肽变异体的方法。

发明背景

近几年已经了解了通过利用重组DNA技术将微生物例如真菌生物体和细菌的天然存在的DNA序列进行克隆而产生生物学活性多肽的优点。
制备新的多肽变异体和突变体例如具有改变的特性例如比活性，底物特异性，最适pH，pI，Km，Vmax等等的新的修饰的酶已经被努力地和成功地用于获得具有改善的特性的多肽，特别是近几年。
例如，在酶技术领域内，显著地改善了例如蛋白酶，脂酶，淀粉酶和纤维素酶的洗衣和/或洗涤餐具的性能。
在大多数情况下，通过位点特异性诱变，导致特定的氨基酸残基的替代，缺失或插入而获得这些改善的特性，所述氨基酸残基是基于在成熟酶的二级或三级结构中它们的类型或它们的定位而选定的(参见例如美国专利4,518,584)。
用于修饰蛋白质和酶的另一种通用的途径是基于随机诱变，例如在美国专利4,894,331和WO 93/01285中公开的。
由于获得具有改善的功能特性的多肽变异体或突变体是麻烦的和耗时的过程，已有人建议了用于快速制备修饰的多肽的其它可替代的方法。
Weber等人(1983)，核酸研究，第11期，5661-5661描述了通过同源基因之间的体内重组修饰基因的方法。构建包括5’末端一侧为编码α- 1人干扰素的DNA序列和3’末端一侧为编码α-2人干扰素的DNA序列的质粒载体的线性DNA序列，并且转染到大肠杆菌的recA阳性菌株。利用抗性标记鉴别重组体并且分离。
Pompon等人(1989)，基因83，第15-24页描述了通过啤酒酵母的部分同源序列的体内重组改组哺乳动物细胞色素P-450的基因编码区的方法，所述啤酒酵母是通过用具有填平末端的线性化质粒和与所述质粒的末端部分同源的DNA片段转化啤酒酵母获得的。
Stemmer，(1994)，Proc.Natl.Acad.Sci.USA，第11期，10747 -10751；Stemmer，(1994)，自然学，第370期，389-391，涉及通过体外PCR方法改组同源DNA序列的方法。一个改组周期包括用DNA酶I 消化同源基因库。将获得的小片段重新装配为全长基因。基于它们的改善功能从DNA文库选择含有改组的DNA序列的阳性重组基因。可将阳性重组体用作为其它改组循环的起始材料。
美国专利5,093,257(承让人：Genencor Int.Inc.)公开了通过体内重组制备杂合多肽的方法。通过形成环状载体产生杂合DNA序列，所述载体包括复制序列，编码杂合多肽的氨基末端部分的第一DNA序列，编码所述杂合多肽的羧基末端部分的第二DNA序列。将环状载体转化到rec阳性微生物，在其中扩增环状载体。这导致通过rec阳性微生物的天然存在的重组机理介导所述环状载体的重组，所述微生物包括原核生物例如芽孢杆菌和大肠杆菌，真核生物例如啤酒酵母。
尽管存在上述方法，仍然需要更好的制备新的阳性多肽变异体的体内反复重组方法。
发明概述
本发明的目的是提供了通过体内重组方法制备阳性多肽变异体的改善的方法。
本发明的发明人已经惊奇地发现通过体内重组将同源DNA序列的不同核苷酸序列改组有利于制备所述阳性多肽变异体，所述体内重组包括下列步骤：
(a)形成至少一个包括编码多肽的DNA序列的环状质粒，
(b)在编码多肽的DNA序列内打开所述环状质粒，
(c)制备至少一个包括与至少一种环状质粒的多肽编码区的至少一部分同源的DNA序列的DNA片段，
(d)将至少一种所述的开环质粒与至少一种所述同源DNA片段一起导入到重组宿主细胞，所述同源DNA片段覆盖了编码所述多肽的全长DNA序列或其一部分，
(e)培养所述的重组宿主细胞，和
(f)筛选阳性多肽变异体。
附图简述
附图1显示包括编码Humicola lanuginosa脂酶基因的DNA序列的酵母表达质粒pJSO26。
附图2显示包括含有12个额外的限制性位点的编码Humicola lanuginosa脂酶基因的DNA序列的酵母表达质粒pJSO37。
附图3显示质粒pJSO26。
附图4显示质粒pJSO37。
附图5显示利用啤酒酵母作为重组宿主细胞，将0.9kb合成野生型 Humicola lanuginosa脂酶(基因)与pJSO37体内重组(如实施例1所述)。
附图6显示利用啤酒酵母作为重组宿主细胞，将从Humicola lanuginosa脂酶变异体(y)制备的DNA片段与包含于质粒的Humicola lanuginosa脂酶变异体(d)体内重组(如实施例2所述)。
附图7显示对Humicola lanuginosa脂酶基因的失活位点的定位和克隆编号(指括号中的“Blue号码”)的观察。限制性酶切位点的定位和克隆编号相对于脂酶基因的起始密码子。在所有的情况下，终止密码子定位于新阅读框中离移码10-50碱基对。
附图8显示通过“镶嵌机理”从表2A和B重组制备活性Humicola lanuginosa脂酶基因。线条表示将片段序列导入到载体，有a×的线条表示不导入到活性脂酶菌落的序列。用于PCR片段的引物与移码突变的位置一起显示(由用于构建的限制性酶切位点标示)。
附图9显示用于将2个部分重叠的片段重组到缺口载体的片段。用于 PCR片段的引物与移码突变的位置一起显示(如果不是野生型)。
附图10显示用于将3个部分重叠的片段重组到缺口载体的片段。显示了用于PCR片段的引物。PCR353和355之间的重叠只有10个碱基对。
发明详述
本发明的目的是提供了通过反复体内重组方法制备阳性多肽变异体的改善的方法。
本发明的发明人已经惊奇地发现利用真核细胞作为重组宿主细胞在体内重组系统将同源DNA序列改组的有效的方法。
在本发明的说明书中“重组宿主细胞”是指能够介导许多同源DNA序列改组的细胞。
术语“改组”是指两个或多个同源DNA序列之间的核苷酸序列的重组，导致与输入DNA序列(即起始点同源DNA序列)相比，输出DNA序列(即已经经过改组循环的DNA序列)具有被交换的许多核苷酸。
本发明的重要优点是制备了具有多个替代点或不与打开点相关的替代的镶嵌DNA序列，而在Pompon的方法中没有发现。
本发明的其它重要的优点是当利用片段和打开的载体的混合物(在筛选中出现)，可能许多不同的克隆配对重组或三对重组(如结合下面的实施例看到的)。
本发明的体内重组方法易于执行并且导致同源基因或变异体高水平混合。大量的变异体或同源基因可混合于一个转化体。改善的变异体或野生型基因的混合，随后筛选，与仅进行随机诱变的方法相比使进一步改善的变异体数目提高了许多倍。
利用体内重组方法，使多个重叠片段高效地重组能够增加变异体或同源基因的混合。小至10碱基对的重叠足于进行重组，所述重组可非常容易地用于甚至远缘相关的基因的区域改组。
本发明涉及通过体内重组使同源DNA的不同的核苷酸序列改组的制备多肽变异体的方法，该方法包括下列步骤：
(a)形成至少一个包括编码多肽的DNA序列的环状质粒，
(b)在编码多肽的DNA序列内打开所述环状质粒，
(c)制备至少一个包括与至少一种环状质粒的多肽编码区的至少一部分同源的DNA序列的DNA片段，
(d)将至少一种所述的开环质粒与至少一种所述同源DNA片段一起导入到重组宿主细胞，所述同源DNA片段覆盖了编码所述多肽的全长DNA序列或其一部分，
(e)培养所述的重组宿主细胞，和
(f)筛选阳性多肽变异体。
根据本发明进行步骤a)到f)的一个以上的循环。
步骤(b)中打开的质粒相当于质粒的多肽编码区内的任何位点。通过本领域内任何已知的合适的方法打开质粒。如Pompon等人(1989)，(见上文) 的描述，用核苷酸填平质粒的开环末端。优选的是如果可制备移码，则不填平开环的末端。
优选的是大约在编码多肽的DNA序列的中部打开质粒，据认为导致产生DNA片段和开环的质粒之间的更有效的重组。
在本发明的一个实施例中，在导致低，中等或高随机诱变频率的条件下制备DNA片段。
为了获得低诱变频率，通过标准的PCR扩增方法制备DNA序列(包括DNA 片段)(美国专利4,683,202或Saiki等人，(1988)，科学239,487- 491)。
通过在增加核苷酸错掺入的条件下，例如Deshler，(1992)，GATA 9(4)，103-106；Leung等人，(1989)，技术，第11期，No.1，11 -15进行PCR扩增可获得中等或高诱变频率。
根据本发明还涉及利用合适的物理或化学诱变剂例如，诱导换同，换异，倒位，混杂，缺失和/或插入的诱变剂，将PCR扩增(即根据该实施例，也包括DNA片段的突变)与诱变步骤结合使用。
在本发明的说明书中术语“阳性多肽变异体”是指获得的具有功能特性的多肽变异体，与从相应的输入DNA序列生产的多肽相比已经改善的功能特性。所述改善的特性的例子是不同于例如生物学活性，酶洗涤性能，抗生素抗性等等的特性。
因此，用于鉴别阳性变异体的筛选方法取决于多肽变异体的所需的改善的特性。
例如，如果所需的多肽是酶，所需的功能特性是洗涤性能，在步骤f) 的筛选可通过使用基于下列原理的滤膜检测法方便地进行
在用于分泌酶的合适的培养基和合适的条件下，培养重组宿主细胞，所提供的培养基有两层滤膜，包括第一层蛋白质结合膜和其上部的显示低蛋白质结合能力的第二层膜。将重组宿主细胞定位于第二层膜。培养之后，将含有从重组宿主细胞分泌的酶的第一层膜与含有所述细胞的第二层膜分离。将第一层膜用于对所需的酶促活性进行筛选，鉴别在第二层膜上存在的微生物菌落。
用于结合酶促活性的膜可以是任何蛋白质结合膜例如尼龙或硝基纤维素。携带表达生物体的菌落的顶层膜可以是没有或低结合蛋白质亲和性的膜例如乙酸纤维素或Durapore0。可以用用于筛选的任何条件预处理膜或在检测酶促活性期间进行处理。
通过染料，荧光素，沉淀，pH指示剂，IR吸光率或其它任何已知的用于检测酶促活性的技术可检测酶促活性。
采用任何固定化试剂例如琼脂糖，琼脂，明胶，聚丙烯酰胺，淀粉，滤纸，滤布；或任何固定化试剂结合使用可将检测化合物固定。
如果在一次改组循环之后，多肽的改善的功能特性不足够好，则可将多肽进行再一次的循环。
在本发明的实施方案中，至少一个改组循环是与起始使用的DNA片段回复杂交循环，起始使用的DNA是野生型DNA片段。该循环去除了非必要突变。也可以通过利用野生型DNA片段作为起始使用的输入DNA材料去除非必要的突变。
本领域内技术人员明白本发明的方法适合于所有类型的多肽包括酶例如蛋白酶，淀粉酶，脂酶，角质酶，淀粉酶，纤维素酶，过氧化物酶和氧化酶。
本发明还涉及具有生物学活性的多肽，例如胰岛素，ACTH，胰高血糖素，生长激素抑制素，促生长素，胸腺素，甲状旁腺激素，色素激素，生长调节素，红血球生成素，促黄体激素，绒毛膜促性腺激素，下丘脑释放因子，抗利尿激素，甲状腺刺激激素，松弛素，干扰素，血小板生成素(TPO) 和促乳素。
本发明特别涉及起始时使用野生型的，或变异的或修饰的DNA序列作为输入DNA序列，例如分别编码野生型，变异的或修饰的酶特别是显示脂解活性的酶的DNA序列。
在本发明的一个实施方案中，脂解活性是来自于Humicola种的丝状真菌特别是Humicola lanuginosa，尤其是Humicola lanuginosa的脂酶活性。
在本发明的特定的实施方案中，起始使用的将与同源多肽改组的输入 DNA片段是编码来自于Humicola lanuginosa DSM 4109(由EP305216(Novo Nordisk A/S))描述的Humicola lanuginosa脂酶的野生型DNA序列。
本发明的范围还特异性地包括选自于下列组：载体(a)-(f)和/或列于下文的材料和方法部分的编码Humicola lanuginosa脂酶变异体的DNA片段(g)-(aa)的输入DNA序列。
尽管本申请使用的名称Humicola lanuginosa已经用于识别优选的亲本酶即上文刚提到的酶。但是，在近几年也将Humicola lanuginosa称作为Thermomyces lanuginosa(第一次由Tsiklinsky在1989年引入的种)，因为该真菌显示其形态学和生理学特性类似于Thermomyces lanuginosa。因此，本领域内技术人员将会理解就作为Humicola lanuginosa的参照而言，可由Thermomyces lanuginosa替代该术语。已经对来自Thermomyces lanuginosa(或Humicola lanuginosa)的18S核糖体基因的部分DNA进行测序。得到的18S序列相当于基因数据库的其它18S序列，也已经利用过度节俭进行的系统发育分析(PAUP，3.1.1版本，Smithsonian研究院，1993) 进行验证。这清除地将Thermomyces lanuginosa划分到不整子囊菌类，可能属于Eurotiales目。根据NCBI(国家生物技术信息中心)Entrez Browser，这将Thermomyces lanugirnosa归纳为类似于单囊霉科， Monoascaceae，假散囊菌科和Trichocomaceae，后者包括类似于翅孢壳，曲霉，青霉，Eupenicillium，拟青霉属，保节菌属，热子囊菌和 Sclerocleista的属。
因此，本发明也特别涉及翅孢壳，曲霉，青霉，Eupenicillium，拟青霉属，保节菌属，热子囊菌和Sclerocleista的属的丝状真菌的脂解酶的所述基因。
相关的编码脂解酶的丝状真菌基因的其它实施例包括犁头霉的菌株例如列于WO 96/13578(来自于Novo Nordisk A/S)的菌株，引入本文作为参考。列于WO 96/13578的犁头霉菌株包括Absidia blakesleeana，伞枝犁头霉和反射犁头霉。
本发明也涉及根霉种的菌株特别是雪白根霉和米根霉。
脂解基因也可以来自于细菌，例如假单孢菌种的菌株，特别是莓实假单孢菌，司徒茨氏假单孢菌，葱头假单孢菌和荧光假单孢菌(WO 89/04361)，或Pseudomonas plantarii或唐菖蒲假单孢菌(美国专利4950417)，或产碱假单胞菌和粪产碱假单胞菌(EP218272，EP331376，或WO 94/25578)(公开了粪产碱假单胞菌脂解酶的变异体)，在EP407225公开的假单胞菌变异体或假单胞菌脂解酶例如描述于WO 88/09367和美国专利5389536的门多茜娜假单胞菌(也称作为Pseudomonas putida)脂解酶或描述于美国专利 5352594的它们的变异体或Pseudomonas aeruginosa或夹壳假单胞菌，或丁香假单胞菌或Pseudomonas wisconsinensis(Solvay的WO 96/12012)或芽孢杆菌种的菌株例如由Dartois等人(1993)Biochemica et Biophysica acta 1131，253-260描述的枯草芽孢杆菌或嗜热脂肪芽孢杆菌 (JP64/7744992)或短小芽孢杆菌(WO 91/16422)或链霉菌种的菌株例如沧痂病链霉菌或色杆菌种的菌株例如粘稠色杆菌。
就假单孢菌种脂酶而言，已经发现来自于下列生物体的脂酶具有高度同源性，例如至少60％同源性，至少80％同源性或至少90％同源性，因此涉及属于相同科的脂酶：假单胞菌ATCC 21808，从Liposam购买的假单胞菌脂酶，Pseudomonas aeruginosa EF2，Pseudomonas aeruginosa PAClR，Pseudomonas aeruginosa PAO1，Pseudomonas aeruginosa TE3285，假单胞菌109，粪产碱假单胞菌M1，夹壳假单胞菌，葱头假单胞菌DSM 3959，葱头假单胞菌M-12-33，假单胞菌KWI-56， Pseudomonas putida IFO 3458，Pseudomonas putida IFO 12049(Gilbert， E.J.，(1993)假单胞菌脂酶：生物化学特性和分子克隆。微生物酶技术， 15，634-645)。最近已经将葱头假单孢菌重新分类为葱头伯克氏菌，但是在本发明中被称作为葱头假单胞菌。
编码来自于酵母的脂解酶的基因也是相关，包括来自于假丝酵母，特别是皱褶假丝酵母或地霉，特别是白地霉的脂解酶基因。
包括编码商品脂解酶的基因的和可用作为本发明的改组的基因的供体的基因的微生物的特定的实施例包括用于Lipolase)，Lipolase) Ultra的Humicola lanuginosa，用于Lumafast的门多茜娜假单胞菌，用于Lipomax的产碱假单胞菌，茄病镰孢，芽孢杆菌(US5427936，EP 528828)，用于Liposam的门多茜娜假单胞菌。
本发明也特别涉及显示于SEQ ID NO 14的假单胞菌脂酶基因。
需要强调的是，本发明改组的编码脂酶的基因可以是任何上文提到的脂解酶基因和其变异，修饰，截短形式。特别涉及的所述基因的例子包括编码描述于WO92/05249，WO 94/01541，WO 94/14591，WO 94/25577， WO95/22615的酶的和描述于EP407225的蛋白质工程得到的脂酶变异体的基因；编码如US5352594描述的蛋白质工程获得的门多茜娜假单胞菌脂酶的基因；编码描述于WO94/14964的角质酶变异体的基因；编码描述于欧洲专利167309的曲霉脂解酶的变异体的基因；和编码描述于WO95/06720的假单胞菌脂酶的基因。
对编码多肽的待改组的DNA序列的一个要求是它们是至少60％，优选的是至少70％，更好的是80％，特别是90％，甚至几乎高达100％的同源性。几乎不同源的DNA序列难于相互作用和重组。
本发明也涉及将不同属的亲本(同源)野生型生物体改组。
此外，待改组的DNA片段优选的是具有长度为约20碱基对到8千碱基对，优选的是约40碱基对-6千碱基对，更优选的是约80碱基对到4千碱基对，特别优选的是约100碱基对到2千碱基对时能够与开环的质粒最好地相互作用。
与包括转化线性DNA片段/序列的现有技术的方法相比本发明的方法用于制备多肽变异体是非常有效的。
发明人发现开环的质粒和DNA片段的混合物的转化频率显著高于当转化时仅在相同位点打开质粒时的频率。开环质粒和DNA片段的转化频率与未开环质粒的频率相同。
不受任何理论的限制，据信当不与至少一个DNA片段作用时质粒的开环限制了(开环)质粒的复制。据此发现在仅一个改组循环之后据此增加了重组DNA序列的数量。
如在实施例1描述，获得的50％转化体含有两个输入DNA序列的重组的DNA序列。高至20％的总数的重组DNA序列是“随机”混合物(即有一个以上的核苷酸区域被交换)。
输入DNA序列可以是包括野生型DNA序列，编码其变异或突变，或修饰形式的DNA序列例如延伸的或延长的DNA序列，也可以是已经进行一个或多个本发明方法改组循环(即输出DNA序列)或经过其它方法(例如，现有技术部分描述的任何方法)获得的DNA序列。
当利用本发明方法时，输出的DNA序列(即改组的DNA序列)已经有许多的核苷酸被交换了。这导致与亲本多肽相比，在多肽变异体内至少一个氨基酸被替代。将会明白，也涉及沉默突变(即不会导致氨基酸序列改变的核苷酸交换)。
但是，在大多数情况下本发明的方法将导致相当大数量的氨基酸的替代，并且在某些情况下甚至改变一个或多个多肽区域(即多肽结构的折叠单位)的结构。
根据本发明可在同时改组两个以上的DNA序列。实际上可包含于合适的质粒中的许多不同的DNA片段和同源多肽可在同时被改组。这是有利的，因为可以不需要大量的重复操作快速地制备大量的不同的变异体。
发明人已经利用显著大于两个的同源DNA序列检测了本发明的核苷酸改组方法。如在实施例2描述，令人惊奇地发现使用本发明的方法将两个以上的DNA序列重组是有利的。
本发明方法的一个改组循环导致在编码多肽的开环的质粒DNA中1- 1000个核苷酸的交换。被交换的核苷酸序列可以是连续的或可以以全长序列内的许多亚序列形式存在。
为了支持本发明，发明人基于本发明的方法的不同方面进行了许多额外的实验。下文描述了这些实验并且描述于下文的实施例3-6。
通过在脂酶基因的不同位置导入移码/终止密码子突变构建包括失活的合成的Humicola lanuginosa脂酶基因的许多载体和片段。这些可用于监测开环的载体和DNA片段的不同结合的体内重组。如实施例3的描述对活性脂酶菌落的数量进行评分。菌落的数量决定开环质粒和片段的重组效率。
在开环载体中的所述Humicola lanuginosa脂酶基因中的一个移码突变和在开环位点所相对位点的片段中的另一个突变得到了取决于定位和结合的3-32％的活性脂酶菌落。这可以得出突变离载体末端越近，混合率越高。
在开环载体中的一个移码突变和在开环位点的各一侧的片段的两个突变得到了取决于定位和结合的4-42％的活性菌落。这些活性菌落中的一些被认为是嵌合体，不仅与开环位点相关。
在开环位点的各一侧的开环载体中的两个移码突变和在片段中的一个突变得到了取决于定位和结合的0.5-3.1％的活性菌落。这些活性菌落的大多数是“亲本”DNA的嵌合体。
在开环位点的各一侧的开环载体中的和在野生型片段中的两个移码突变得到了取决于定位的7.7-10.7％的活性菌落。
也发现载体相对于片段的量和片段的大小也影响结果。
利用啤酒酵母rad52突变体作为重组宿主细胞显示rad52突变体非常适合于用野生型质粒转化并且表达Humicola lanuginosa脂酶基因，但是用开环载体和片段完全没有获得转化体。
RAD52功能是“经典的重组”所需要的(但是不是不相等的姐妹链有丝分裂重组所需要的)，这证明开环质粒和片段的重组涉及经典的重组机理。
经典的重组是涉及定位于同源染色体的非姐妹染色单体的基因之间的重组的重组机理，例如在酵母的分子和细胞生物学，第1期(eds.Broach JR， Pringle JR和Jones EW)，冷泉港实验室出版，纽约，由Petes TD，Malone RE和Symington LS(1991)发表的“酵母的重组”，P407-522定义的。
多个部分重叠片段
发明人也试验了利用本发明方法的多个部分重叠片段的重组。
对重组到缺口(即开环导致基因的小部分打开)载体的2个和3个部分重叠片段进行测试，得到高回收率的重组Humicola lanuginosa脂酶基因。对从失活的Humicola lanuginosa基因的不同的组合回收的活性脂酶基因进行检测，测定2个部分重叠片段的重组。在缺口区域2个片段之间的重叠区域比载体和片段的重叠有更高的混合趋势。
当来自于相同区域的许多片段重组时，多个重叠片段技术将会增加自身的混合，但是重叠区域具有相对高的随机混合也是重要的，以便使相近定位的变异/不同混合。
发现两个片段之间小至10碱基对的重叠足以获得非常有效的重组。因此，根据本发明的方法5-5000碱基对范围内的重叠，优选的是10-500 碱基对范围内的重叠，尤其是10-100碱基对范围内的重叠是合适的。
根据本发明的该实施方案，优选的是将2或以上的重叠片段，优选的是2-6个重叠片段，尤其是2-4个重叠片段用作为改组循环的输入片段。
除了增加基因的混合，这是用于通过制备来自于不同区域的DNA片段之间小重叠和筛选最好的结合而使区域改组的有效的方法。
例如，对于三个DNA片段的情况，重叠区域如下： -第一片段的第一末端重叠了开环质粒的第一末端， -第二片段的第一末端重叠了第一片段的第二末端，第二片段的第二末端重叠了第三片段的第一末端， -第三片段的第一末端重叠(如上文所述)第二片段的第二末端，第三片段的第二末端重叠了开环质粒的第二末端。
将会明白当将两个或多个DNA片段用作为起始材料时，优选的是质粒和DNA片段末端之间有连续的重叠。
尽管优选的是改组DNA片段和开环质粒形式的同源DNA片段，本发明也涉及改组含有编码多肽的同源DNA序列的两个或多个开环质粒。但是，在这种情况下在不同的位点打开质粒是强制的。
在本发明的又一个实施方案中，将两个或多个开环质粒和一个或多个同源DNA片段用作为待改组的起始材料。开环质粒和同源DNA片段之间的比例优选的是位于20∶1-1∶50范围内，优选的是2∶1-1∶10(载体：片段的摩尔比)范围内，其中DNA的特定的浓度为1pM-10M。
优选的是以下列方式给开环质粒制造缺口，所述方式是在载体中缺失片段之间的重叠以便选择重组。
制备DNA片段
通过任何合适的方法制备包含于开环质粒中的用同源多肽的改组的 DNA片段。例如通过利用特定的引物，例如美国专利4683202或Saiki等人， (1988)，科学，239，487-491描述的引物，将含有多肽基因的质粒或载体的PCR扩增(聚合酶链反应)，如上文描述，制备DNA片段。通过用限制性内切酶消化，随后通过例如电泳分离也可以从含有所需DNA序列的载体或质粒切出DNA片段。
另一种可选的方法，通过已经建立的标准方法例如由Beaucage和 Caruthers，(1981)，Tetrahedron Letters 22，1859-1869，描述的磷酸亚酰胺方法或由Matthes等人，(1984)，EMBO杂志3，801-805描述的方法，合成制备编码所需同源多肽的DNA片段。根据磷酸亚酰胺方法，例如用自动DNA合成仪合成寡聚核苷酸，纯化，退火，连接和克隆到合适的载体。
此外，DNA片段是通过将合成的，基因组的或cDNA来源的片段对应于标准技术制备的整个DNA序列的各部分的片段连接而制备的合成的和基因组的混合的，合成的和cDNA的混合的或基因组的和cDNA来源的混合的片段(如果合适的话)。
质粒
通过将所述DNA序列连接到合适的载体或质粒，或通过任何其它合适的方法制备的含有编码所需多肽的DNA序列的质粒。
所述载体可以是便于实施重组DNA操作的任何载体。载体的选择常常取决于该载体所要导入的重组宿主细胞。
因此，载体可以是自主复制载体，即以染色体外主体的形式存在的载体，其复制独立于染色体的复制例如一种质粒。另一种可选的方法，当导入到重组宿主细胞时，该载体可以是被整合到宿主细胞基因组并且与它整合的染色体一起复制的载体。
为了便于筛选方法，优选的是载体是表达载体，其中编码所述多肽的 DNA序列可操作地连接到转录DNA所需的其它片段。通常，表达载体来源于质粒，粘粒或噬菌体，或含有任何或所有这些的元件。
术语，“可操作连接”指使各个片段以发挥各自预定的功能例如，由启动子起始转录，借助于编码所述多肽的DNA序列引导转录的方式排列。
启动子可以是在所选择的重组宿主细胞显示转录活性，并且来源于编码与宿主细胞同源或异源的蛋白质例如酶的基因的DNA序列。
用于酵母宿主细胞的合适的启动子的例子包括来源于酵母糖酵解基因的启动子(Hitzeman等人，(1980)，生物化学杂志，255，12073-12080； Alber和Kawasaki，(1982)，J.Mol.Appl.Gen.1，419-434)或来源于乙醇脱氢酶基因(Young等人，微生物遗传工程的化学应用(Hollaender 等人，eds.)Plenum出版，纽约，1982)，或TPI1(美国专利4599311)或 ADH2-4c(Russel等人，(1983)，自然学304，652-654)启动子。
用于丝状真菌宿主细胞的合适的启动子是例如ADH3启动子(McKnight 等人，(1985)，EMBO杂志，4，2093-2099)或tipA启动子。其它有用的启动子是那些来源于编码米曲霉TAKA淀粉酶，Rhizomucor miehei天冬氨酸蛋白酶，黑曲霉中性α-淀粉酶，黑曲霉酸稳定的α-淀粉酶，黑曲霉或泡盛曲霉糖淀粉酶(gluA)，Rhizomucor miehei脂酶，米曲霉碱性蛋白酶，米曲霉丙糖磷酸异构酶或构钞曲霉乙酰胺酶的基因的启动子。优选的是TAKA淀粉酶和gluA启动子。
如果必要，本发明的编码所述多肽的DNA序列也可操作连接到合适的终止子，例如人生长激素终止子(Palmiter等人，op.cit.)或(对于真菌宿主)TPI1(Alber和Kawasai，op.cit.)或ADH3(McKnight等人，op. cit.)终止子。该载体可进一步包括例如聚腺苷化信号的元件(例如来源于 SV40或腺病毒5E1b区域)，转录增强子序列(例如，SV40增强子)和转译增强子序列(例如编码腺病毒VA RNAs的序列)。
载体可进一步包括能够使载体在所述重组宿主细胞中复制的DNA序列。当宿主细胞是酵母细胞时，能够使载体复制的合适的序列是酵母质粒 2m复制基因REP1-3和复制源点。
利用丝状真菌例如曲霉和酵母作为重组宿主细胞(JP06245777-A)质粒pY1可用于生产有用的蛋白质和肽。
载体还可包括合适的标记物，例如其产物补充重组宿主细胞的缺陷的基因例如，编码二氢叶酸还原酶(DHFR)的基因或粟酒裂殖糖酵母TPI基因 (由P.R.Russel(1985)，基因40，125-130描述)。
所述合适的选择性标记物的另一个例子是ura3和leu2基因，它补充例如酵母菌株啤酒酵母YNG318的相应的缺陷基因。
该载体也包括授予抗药性例如青霉素，卡那霉素，四环素，氯霉素，新霉素，潮霉素或氨甲喋呤的选择性标记物。对于丝状真菌，选择性标记物包括amdS，pyrG，argB，niaD，sC，trpC，pyr4和DHFR。
为了指导所述多肽进入重组宿主细胞的分泌途径，也可以在重组载体中提供分泌信号序列(也称作为引导序列，前原序列或前序列)。将分泌信号序列连接到正确的读码框的编码脂酶的DNA序列上。分泌信号序列通常定位于编码多肽的DNA序列的5’末端。分泌信号序列可以是通常与所述多肽连接的信号或可以来源于编码另一个分泌的蛋白质的基因。
信号肽可以是天然存在的信号肽或其功能部分，或可以是合成肽。对于从酵母细胞分泌，已经发现合适的信号肽是α-因子信号肽(参见，美国专利4870008)，鼠唾液淀粉酶的信号肽(参见O.Hagenbuchle等人， (1981)，自然学289，643-646)，一种修饰的羧基肽酶信号肽(参见L. A.Vall等人(1987)，细胞学48，887-897)，Humicola lanuginosa 脂酶信号肽，酵母BAR1信号肽(参见WO87/02670)，或酵母天冬氨酸蛋白酶 3(YAP3)信号肽(参见M.Egel-Mitani等人，(1990)，酵母6，127-137)。
为了在酵母中有效地分泌，也可将编码引导肽的序列插入到信号序列的下游和编码所述多肽的DNA序列的上游。引导肽的功能是允许被指导的表达肽从内质网进入到高尔基设备，进一步进入到分泌泡囊以便分泌到培养基(即多肽穿过细胞壁输出，或至少穿过细胞膜进入到酵母细胞的浆膜外周间隙)。引导肽可以是酵母α-因子引导序列(其应用描述于例如美国专利 4546082，欧洲专利16201，欧洲专利123294，123544和欧洲专利163 529)。另一种可选的方法，引导肽可以是合成的引导肽，它是自然界不存在的引导肽。合成的引导肽可以是例如如WO 89/02463或WO92/11378所描述的方法构建的。
对于丝状真菌的应用，便利的是信号肽来源于编码曲霉淀粉酶或糖淀粉酶的基因，编码Rhizomucor miehei脂酶或蛋白酶的基因，编码Humicola lanuginosa脂酶的基因。优选的是信号肽来源于编码米曲霉TAKA淀粉酶，黑曲霉中性α-淀粉酶，黑曲霉酸稳定的α-淀粉酶，或黑曲霉糖淀粉酶的基因的信号肽。
重组宿主细胞
待导入质粒/片段DNA序列的混合物的重组宿主细胞可以是真核细胞，包括能够重组同源DNA序列的真菌细胞和植物细胞。
根据现有技术，已经有人建议原核微生物例如，细菌包括芽孢杆菌和大肠杆菌；真核生物例如丝状真菌包括曲霉和酵母例如啤酒酵母；来自于鸟类或哺乳动物源的组织培养细胞可用于体内重组。所有所述的生物可用作为重组宿主细胞，但是通常原核细胞适用于工业使用的重组方法不是非常有效的(即不会产生足够量的变异体)。
因此，根据本发明优选的重组宿主细胞是真菌细胞例如酵母细胞或丝状真菌。
合适的酵母细胞的例子包括酵母属的细胞，特别是啤酒酵母菌株或克鲁维氏酵母或裂殖糖酵母属的菌株的细胞，用于将异源DNA转化酵母细胞和生产异源多肽的方法参见例如美国专利4599311，美国专利4931373，美国专利4870008，5037743和美国专利4845075，所有文献引入本文作为参考。通过例如由选择性标记物通常利用抗药性或在没有特定营养例如亮氨酸存在时生长的能力决定的表现型可选择转化细胞。用于酵母的优选的载体是描述于美国专利4931373的POT1载体。由信号序列和非强制性的引导序列例如如上所述，引导编码多肽的DNA序列。合适的酵母细胞的进一步的例子是克鲁维氏菌株例如乳克鲁维氏酵母，汉逊酵母例如多型汉逊酵母或毕赤氏酵母例如巴斯德毕赤氏酵母(参见Gleeson等人，(1986)，J. Gen.Microbiol.132，3459-3465；美国专利4882279)。
其它真菌细胞的例子是丝状真菌细胞例如曲霉，链孢霉属，镰刀菌属或地霉属特别是米曲霉，构巢曲霉或黑曲霉的菌株。用于表达蛋白质的曲霉描述于例如欧洲专利272277，欧洲专利230023。例如按照Malardier 等人(1989)，基因78，147-156描述的方法实施尖孢镰孢的转化。
在本发明的优选的实施方案中，重组宿主细胞是酵母属的细胞特别是啤酒酵母的细胞。
方法和材料
DNA序列：
编码Humicola lanuginosa DSM4109衍生的脂酶的DNA序列。
Humicola lanuginosa脂酶变异体：
实施例2中用于制备待用NruI打开的载体的变异体：
(a)E56R，D57L，I90F，D96L，E99K
(b)E56R，D57L，V60M，D62N，S83T，D96P，D102E
(c)D57G，N94K，D96L，L97M
(d)E87K，G91A，D96R，I100V，E129K，K237M，I252L，P256T，G263A，L264Q
(e)E56R，D57G，S58F，D62C，T64R，E87G，G91A，F95L，D96P，K98I，(K237M)
(f)E210K
在实施例2由标准PCR扩增方法制备的DNA片段的变异体：
(g)S83T，N94K，D96N
(h)E87K，D96V
(i)N94K，D96A
(j)E87K，G91A，D96A
(k)D167G，E210V
(l)S83T，G91A，Q249R
(m)E87K，G91A
(n)S83T，E87K，G91A，N94K，D96N，D111N.
(o)N73D，E87K，G91A，N94I，D96G.
(p)L67P，I76V，S83T，E87N，I90N，G91A，D96A，K98R.
(q)S83T，E87K，G91A，N92H，N94K，D96M
(s)S85P，E87K，G91A，D96L，L97V.
(t)E87K，I90N，G91A，N94S，D96N，I100T.
(u)I34V，S54P，F80L，S85T，D96G，R108W，G109V，D111G，S116P，L124S，
   V132M，V140Q，V141A，F142S，H145R，N162T，I166V，F181P，F183S，
   R205G，A243T，D254G，F262L.
(v)E56R，D57L，I90F，D96L，E99K
(x)E56R，D57L，V60M，D62N，S83T，D96P，D102E
(y)D57G，N94K，D96L，L97M
(z)E87K，G91A，D96R，I100V，E129K，K237M，I252L，P256T，G263A，L264Q
(aa)E56R，D57G，S58F，D62C，T64R，E87G，G91A，F95L，D96P，K98I
菌株：
表达系统宿主：
啤酒酵母YNG318：MATa Dpep4(cir+)ura3-52，leu 2-D2，his 4-539
啤酒酵母Rad52：菌株M1533＝MATa rad52 ura3，从哥本哈哥大学，遗传研究院，Torsten Nilsson Tillgren获得。
质粒
pJSO26(参见附图3)
pJSO37(参见附图4)
pYES 2.0(Invitrogen)
转化选择性标记物
ura 3
leu 2
培养基
SC-ura-：90毫升10×基础盐，22.5毫升20％酪蛋白氨基酸，9 毫升1％色氨酸，加入806毫升水，高压灭菌，加入3.6毫升5％苏氨酸和90毫升20％葡萄糖或20％半乳糖。
LB培养基：10克Bacto-胰酶解胨，5克Bacto-酵母提取物，10克氯化钠，溶于1升水中。
亮绿(BG)(Merck，art.No.1.01310)
BG试剂：溶于水中的4毫克/毫升亮绿(BG)
底物1：
10毫升棕榈油(Sigma CAT NO.0-1500)
20毫升2％聚乙烯醇(PVA)
将底物匀浆化15-20分钟。
方法：
酵母表达载体的构建
表达质粒pJSO26和pJSO37来源于pYES 2.0。用啤酒酵母的组成型表达的TPI(丙糖磷酸异构酶)-启动子(Alber和Kawasaki，(1982)，J.Mol. Appl.Gen.1，419-434)替代pYES 2.0的诱导型GAL1启动子，缺失ura 3 启动子。pJSO26和pJSO37的限制性物理图谱分别描述于附图3和附图 4。
野生型DNA片段的制备
通过PCR扩增pJSO26质粒(导致低，中等或高诱变)或通过用合适的限制性内切酶切割取出DNA片段制备脂酶野生型DNA片段。
在酵母中Humicola lanuginosa脂酶变异体的发酵
将啤酒酵母菌落接种到10毫升的SC-ura-培养基，并且在30℃生长 2天。将10毫升用于接种到300毫升的SC-ura-培养基，在30℃生长3 天。将300毫升用于接种到5升的下列G-底物：
400克    Amicase
6.7克    酵母提取物(Difco)
12.5克   L-Leucin(Fluka)
6.7克    硫酸铵
10克     7水硫酸镁
17克     磷酸钾
10毫升   微量化合物
5毫升    维生素溶液
6.7毫升  磷酸
25毫升   20％Pluronic(消沫剂)
在5000毫升的总体积中：
酵母细胞在30℃发酵5天。供给酵母的起始营养为100毫升的70％葡萄糖并且每天加入400毫升的70％葡萄糖。通过加入10％氨溶液使pH 保持于5.0。起始22小时搅拌速率为300rpm，随后在其余的发酵时间为 900rpm。起始的22小时通气量为11空气/升/分钟，随后在其余的发酵时间为1.5空气/升/分钟。
微量化合物：
6.8克      氯化锌
54.0克     6水氯化亚铁
19.1克     4水氯化锰
2.2克      5水硫酸铜
2.58克     氯化钴
0.62克     硼酸
0.024克    (NH4)6Mo7O24.4H2O
0.2克      碘化钾
100毫升    盐酸(浓)
总体积为1升
维生素溶液：
250毫克  生物素
3克      硫胺
10克     D-泛酸钙
100克    肌醇
50克     Cholinchlorid
1.6克    吡哆醇
1.2克    烟酰胺
0.4克    叶酸
0.4克    核黄素
总体积为1升。
酵母的转化
采用标准的方法转化啤酒酵母(参见，Sambrooks等人，(1989)，分子克隆：实验室手册，第二版，冷泉港)
酵母转化频率的测定
通过在SC-ura-培养平板上培养转化体3天并且计算出现的菌落数量测定转化频率。每克开环质粒的转化体数量是转化频率。
筛选具有改良的洗涤性能的阳性变异体
利用下面的滤膜检测法筛选具有改良的洗涤性能的阳性变异体。
低钙滤膜检测法
(1)提供了具有第一蛋白质结合膜(尼龙膜)和其顶上的第二低蛋白质结合膜(乙酸纤维素)的SC-ura-影印培养平板(用于筛选携带表达载体的菌株)。
(2)将含有亲本脂酶基因或突变的脂酶基因的酵母细胞涂布于两层膜上并且在30℃培养2或3天。
(3)通过将顶层膜转移到新的平板上而使菌落保持于顶层膜。
(4)取出蛋白质结合膜到空培养皿。
(5)将包括棕榈油乳液(2％PVA∶棕榈油＝3∶1)，亮绿(指示剂，0.004 ％)，100毫摩尔tris缓冲液pH9和EGTA(最终浓度5毫摩尔)的琼脂糖溶液倾倒至低膜上以便识别兰绿点形式的表达脂酶活性的菌落。
(6)鉴定步骤5中发现的菌落与亲本脂酶相比对钙的依赖性降低。
采用Applied Biosystems ABI DNA测序模型373A，根据ABI Dye Terminator循环测序试剂盒的方案，进行DNA测序。
重组效力的评估
菌落的数量决定了开环质粒和片段重组的效力。具有脂酶活性的菌落的百分数可以估测活性和非活性基因的混合-从理论上说，对于一个移码可以计算如果野生型和移码的相似，越接近50％，混合越好，对于2个移码，是25％，对于3个移码是12.5％。
移码突变
通过利用T4 DNA聚合酶，有或没有dNTP(脱氧核苷酸＝等量的dATP， dTTP，dCTP和dGTP)填平限制性位点(对于5’突出的情况)或通过缺失“粘性末端”(对于3’突出)制备移码突变。用于填平限制性位点(在附图7称作为“F”)和缺失粘性末端(附图7称作为“(D)”)的方法是本领域内技术人员已知的。
对具有脂酶活性的菌落进行评估的方法
以每3个平板的平均数计算菌落和阳性(即具有脂酶活性)的数量。
所使用的培养条件和筛选条件如下：
(1)提供了在平板上具有蛋白质结合膜(尼龙膜)的SC-ura-培养平板。
(2)将含有亲本脂酶基因或突变的脂酶基因的酵母细胞涂布于膜上并且在30℃培养3或4天。
(3)取出含有菌落的蛋白质结合膜到空培养皿，所述空培养皿包括含有棕榈油乳液(2％PVA∶棕榈油＝2∶1)，亮绿(指示剂，0.004％)，100 毫摩尔tris缓冲液pH9的琼脂糖溶液。
(5)识别兰绿点形式的表达脂酶活性的菌落。
                          实施例1
                 检测两个同源基因的体内重组
按照如上“材料和方法部分”所述的方法，构建啤酒酵母表达质粒 pJSO26。
分别用NruI，PstI，和NruI和PstI切割含有额外的12个限制性位点 (参见附图4)的合成的Humicola lanuginosa脂酶基因(在pJSO27中)以约在编码脂酶的DNA序列的中间打开该基因。
将打开的质粒(pJSO37)和采用PCR扩增从pJSO26制备的约0.9千碱基对的野生型Humicola lanuginosa脂酶基因片段(参见附图1)一起转化到啤酒酵母YNG318。
此外，也仅将开环的质粒转化到酵母重组宿主细胞(即没有0.9kb的合成脂酶DNA片段)。
如上述“材料和方法部分”所述的方法生长转化的酵母细胞，如上所述测定转化频率。
结果发现与所述的质粒/片段的转化频率(每毫克打开的质粒为50,000 个转化体)相比，仅有打开质粒的转化频率是非常低(每毫克打开的质粒为 10个转化体)。
将质粒/片段进行PCR扩增导致产生20个含有覆盖重组的质粒/片段的脂酶基因区的片段的转化体。利用标准方法，通过限制性位点消化分析20 个转化体的重组混合物。结果显示于表1。表1
                   NruI(未检测)
PCR    SphI HindIII PstI  BstXI NhI BstEII KpnI  XhoI
片段
P1      wt    wt    wt    wt    wt    wt    wt    wt
P2      sg    sg    sg    wt    wt    wt    wt    wt
P3      sg    sg    sg    sg    nd    sg    sg    nd
P4      nd    sg    sg    wt    nd    wt    nd    nd
P5      wt    wt    nd    wt    wt    wt    wt    wt
P6      sg    sg    sg    sg    sg    sg    sg    nd
N1      wt    wt    wt    wt    sg    wt    wt    wt
N2      wt    wt    wt    wt    wt    wt    wt    wt
N3      wt    wt    wt    wt    wt    wt    wt    wt
N4      sg    sg    sg    wt    wt    wt    wt    wt
N5      sg    sg    sg    wt    wt    wt    wt    wt
N6      wt    wt    wt    sg    sg    sg    sg    sg
P/N1    sg    sg    sg    wt    wt    wt    wt    wt
P/N2    sg    sg    sg    sg    sg    sg    sg    nd
P/N3    sg    sg    sg    wt    nd    sg    sg    sg
P/N4    sg    sg    sg    sg    sg    sg    sg    nd
P/N5    sg    sg    sg    sg    sg    sg    sg    nd
P/N6    sg    sg    sg    wt    nd    sg    sg    sg
P/N7    nd    wt    wt    wt    nd    wt    nd    wt
P/N8    sg    sg    sg    wt    wt    wt    sg    nd
P：用Pst I打开的质粒
N：用NruI打开的质粒
P/N：用PstI和NruI打开的质粒(导致去除75bp的片段)
wt：野生型基因的限制性酶切图谱
sg：非常的基因的限制性酶切图谱
nd：未测定
从表1可以看出，10个转化体(相当于50％)含有重组的DNA序列。这些10个DNA序列中的4个(相当于20％)含有重组到合成基因的野生型基因区域或含有重组到野生型片段的合成基因区域。
                          实施例2
          Humicola lanuginosa脂酶变异体的体内重组
在相同的混合物中20个Humicola lanuginosa脂酶变异体的DNA序列进行体内重组。
通过连接到酵母表达载体pJSO37从脂酶变异体(a)-(f)(参见上述名单) 制备六个载体。所有载体用NruI打开。
利用标准方法通过PCR扩增制备所有20个同源DNA序列(g)-(aa)(参见上述名单)的DNA片段。
采用标准的方法将20个DNA片段和6个开环的载体混合并且转化到啤酒酵母YNG318。如上所述培养重组宿主细胞并且如上所述筛选。分离约20 个转化体并且利用如上“材料和方法部分”所述的膜检测方法，检测其改善的洗涤性能。
利用膜检测法识别两个阳性的转化体(称为A和B)。
与野生型氨基酸序列相比，两个重组的阳性转化体具有下列突变。
A：D57G，N94K，D96L，P256T
   ----  ----  ----  ＝＝＝＝
A是两个变异体的重组。
----来源于载体(d)
＝＝＝＝来源于从变异体(y)制备的DNA片段
B：D57G，G59V，N94K，D96L，L97M，S116P，S170P，N249R
   ---- ？？？？---- ---- ---- ＜＜＜＜？？？？？＝＝＝＝
B是载体(c)，DNA片段(n)和(u)的重组。
----来源于载体(c)
＜＜＜＜来源于从变异体(u)制备的DNA片段
＝＝＝＝来源于从变异体(n)制备的DNA片段
？？？？不是重组产生的氨基酸突变。
可以看出，通过两个或多个变异体的重组已经形成了阳性变异体。标记为“？？？？？”的氨基酸突变不是体内重组的结果，由于改组的脂酶变异体(参见上述名单)没有含有任何所述的突变。因此，这些突变是在采用标准PCR 扩增制备DNA片段期间获得的随机诱变的结果。
                          实施例3
                    具有移码突变的重组
通过缺失(位置184/385)或填平(位置290/317/518/746)限制性酶位点或通过终止密码子的定位导入而在各个位置使合成的Humicola lanuginosa 脂酶基因(在载体pJSO37)失活。从附图7可以推导出900碱基对的所有失活的脂酶基因。
利用引物4699和引物5164，利用标准PCR技术从上述载体制备许多不同的900碱基对DNA片段。利用引物8487和引物4548(260碱基对)，引物 2843和引物4548(488碱基对)制备较小的PCR片段。
如表1A所示，将用PstI(即位置385)打开的0.5毫升(约0.1毫克)的载体Blue425，Blue426，Blue428，和Blue429，用NruI(即位置464)打开的Blue424和Blue425与3毫升(约0.5毫克)的片段424，425，426， 428，429以不同的组合一起转化到100毫升的啤酒酵母YNG318感受态细胞。
如在上述“材料和方法部分”所述，以3个平板的平均数计算茵落和阳性(即具有脂酶活性)的数量。
检测结果显示于表1A
                          表1A 在载体上的一个移码突变和打开的位点的相对的一侧片段上的另一个移码突变发生配对重组。由9个平板测定；#由6个平板测定。
表1A中起始的2排显示具有在PstI位点的各一侧一个移码的载体和片段。以第2排与第一排进行“镜子成象”试验得到可重复的较低量的活性菌落。对于第三和第四排，尽管不显著但是仍获得相同的结果。去除载体中靠近移码的开环位点增加了活性菌落的数量，如在第5排看到的。这可以解释“镜子成象”试验的差异的原因。在两种情况下，较高数量的阳性菌落在载体中具有靠近移码的开环位点。
因此，可以得出突变越靠近载体的末端，混合机会越高。这可能从熟知的事实得出，游离的DNA末端具有高重组优势。因此具有尽可能多的游离 DNA末端对加强基因的混合是令人满意的。这可以从后面的多个重叠片段的重组的实施例中获得。
由于移码精确地定位于载体的PstI开环位点的片段上所以第6排具有相当低数量的活性。
第7排具有靠近开环位点的载体的移码，并且它具有高数量的活性。
具有一个终止密码子突变的重组
为了检测与移码突变相比终止密码子的突变的重组效力是否不同，进行下面的试验。
如上所述的方法，将用PstI打开的在特定位置(位置分别是184，317 和746)(由定位诱变制备)具有终止密码子的0.5毫升(约0.1毫克)的载体 Blue624，Blue625，Blue626(参见表1B)与3毫升(约0.5毫克)的片段 624，625，626以不同的组合一起转化到100毫升的啤酒酵母YNG318感受态细胞。结果显示于表1B。
                      表1B   载体+片段   菌落的数量   具有脂酶活性的菌落％   1.Blue626+624     ND     40％   2.Blue624+626     ND     12％   3.Blue625+624     ND     75％   4.Blue624+625     ND     10％在载体上的一个终止密码子突变和打开的位点的相对的一侧片段上的另一个终止密码子突变发生配对重组。ND＝为未测定，但是高数量。
第1排和第2排(表1B)具有位置相同于表1A的第1排和第2排的位置的突变。正如所看到的，与移码突变相比，对于终止密码子突变，具有脂酶活性的菌落的数量明显高，但是在“镜子成象”试验中存在相同的差异。
这表明较接近于方法的“应用”的终止密码子突变与移码突变相比混合更好。第3排和第4排证实突变越接近载体的末端，混合的机会越高。
在载体中有一个或两个移码突变和片段中有一个或两个移码突变时的重组
利用相同于上述方法，利用载体Blue425，426和428(一个突变)和载体Blue442，Blue443(两个突变)和片段442和443(两个移码突变)和片段 424，425，426，427，428(一个突变)和野生型(没有突变)，检测在载体中有一个或两个移码突变和片段中有一个或两个移码突变时的影响。
载体Blue442和443是双重移码突变：Blue442＝428+429和Blue443 ＝427+429(参见附图7)。
通过将用PstI打开的0.5毫升(约0.1毫克)的载体和3毫升PCR片段(约 0.5毫克)转化到100毫升的啤酒酵母YNG318感受态细胞进行重组。
检测结果显示于表2A和表2B。
                          表2A   载体+片段   菌落的数量具有活性Lipolase的菌落％   1.Blue425+442     142     15％   2.Blue425+443     144     14％   3.Blue426+442     42     42％   4.Blue 426+443 #     77     20％   5.Blue428+443     115     3.8％在载体上的一个移码突变和打开的位点的各一侧片段上的两个移码突变。 #由6个平板测定。
                              表2B   载体+片段   菌落的数量具有活性Lipolase的菌落％   Blue442+424     137     0.5％   Blue442+426     118     1.1％   Blue442+427 #     125     1.3％   Blue443+425     540     2.5％   Blue443+426     196     1.5％   Blue443+428     469     3.1％   Blue442+wt片段     135     7.7％   Blue443+wt片段     488     10.7％在载体上打开的位点各一侧的两个移码突变和片段上的一个移码突变。# 由6个平板测定。
表2A显示除了载体的移码定位远离开环位点的最后2排情况，甚至在高达3个移码突变(但是载体仅一个移码)时有相当高数量的具有脂酶活性的菌落。泳道4具有的活性低于泳道3，这可能是由于载体上的移码的定位比片段上的移码更远离开环位点，导致获得与开环位点不相关的活性嵌合基团(参见附图2A)。在表2B，当在载体上有两个移码突变时，观察到非常低数量的活性菌落。这些活性菌落大多数是“亲本”DNA的嵌合体，表明混合与开环位点并不相关(参见附图2B)。
两个不同的载体或片段的重组
两个不同的载体或片段的重组结果显示于表3。
                               表3   载体+片段菌落的数量具有活性Lipolase的菌落的％   Blue428/PstI+   Blue429/pst #     13     15％   Blue428/pst +   Blue429/PstI+442     273     4.2％ Blue442/PstI+428+429     228     0.8％ Blue443/PstI+427+428     229     1.6％两个不同的载体或片段的重组。#由1个平板测定。
正如所预料的，在表3的第1排显示的对照试验中看到较低数量的菌落。在中间排中加入的片段具有各对应于各载体的移码的两个移码。借助于三个配对重组，制备了4.2％活性。对于具有各一个移码的两个片段和具有相同的两个移码的载体，发现非常低的活性。
在不同的位点开环的载体的重组
在一侧而不是在中间打开质粒仍获得较好的重组，如表4显示。在不同位点打开的两个载体也可以在一定的程度上重组(与表13的载体对照相比)。
                           表4   载体+片段菌落的数量具有活性Lipolase 的菌落％ Blue428/xho+429     160     11％ Blue428/xho+Blue429/pst #     35     6.3％在一侧打开质粒而不是在中间打开。#由6个平板测定。
不同浓度的载体和片段的重组
载体和片段的相对浓度影响阳性菌落的百分数，正如表5看到的。
                            表5   载体+片段菌落的数量具有脂酶活性的菌落％ 0.5微升Blue426+3微升442     42     42％ 1.5微升Blue426+3微升442     21     51％ 1.5微升Blue426+9微升442     34     26％ 1.5微升Blue426+3微升427     230     2.8％ 1微升Blue442+1微升Blue425     224     1.16％ 1微升Blue442+2微升Blue425     429     0.9％ 1微升Blue442+4微升Blue425     434     1.6％ 1微升Blue442+8微升Blue425     481     1.6％ 1微升Blue442+16微升Blue425     497     2.0％改变载体或片段的浓度。
具有不同大小的片段的重组
片段的大小也影响重组结果，如表6所示。
                        表6 载体+片段菌落的数量具有活性Lipolase 的菌落％ Blue424+425(260碱基对)     73     34％ Blue424+425(489碱基对)     130     45％ Blue424+424(480碱基对)     133     0.3％ Blue424+428(480碱基对)     130     36％ Blue428+425(480碱基对)     150     28％ Blue425+424(480碱基对)     69     0％ Blue425+428(480碱基对)     63     55％小于900碱基对的片段的重组
未打开的载体的重组
未打开的载体的转化显示非常低程度的重组(表7)。
                                 表7     质粒菌落的数量具有活性Lipolase的菌落％   Blue428+Blue429     887     0.3％   Blue426+Blue425     697     0.7％未打开的质粒的重组
                          实施例4
             在重组中改变的啤酒酵母突变体的检测
利用实施例3描述的相同方法，利用啤酒酵母rad52突变体作为重组宿主细胞检测打开的和未打开的载体和片段的重组。结果显示于表8。
                      表8   载体+片段   菌落的数量具有活性Lipolase的菌落％   Blue428+429     0     0   Blue442+427     0     0   Blue424+425     0     0   Blue426+443     0     0   质粒pJSO37     544     100％重组产生rad52的突变体。
rad52的结果证明完全没有发生重组。rad52的功能是经典的重组所需要的(但是不是不相等的姐妹链染色体重组所需要的)，这表明打开质粒和片段的重组涉及经典的重组机理。
                          实施例6
                   多个部分重叠片段的重组
为了提高采用本发明重组方法制备的突变的混合，计划将两个片段和一个有缺口的载体进行重组。
                           表15     载体+片段     菌落的数量     具有脂酸活     性的菌落％ 1.pJSO37/HindIII-XhoI     + PCR319+PCR327     ＞2000     100％ 2.pJSO37/HindIII-XhoI     + PCR321+PCR331     ≈2000     ≈0.2％ 3.pJSO37/HindIII-XhoI     + PCR319+PCR331     ≈1500     ≈1％ 4.pJSO37/HindIII-XhoI     + PCR319+PCR386     ＞5000     ＞90％ 5.pJSO37/HindIII-XhoI     + PCR321+PCR386     ＞5000     ≈25％ 6.Blue428/HindIII-   XhoI + PCR321+PCR331     400     0.2％ 7.Blue428/HindIII-   XhoI + PCR319+PCR327     ≈1500     ＞90％ 8.Blue428/HindIII-   XhoI + PCR321+PCR327     ≈150     ≈10％ 9.Blue428/HindIII-   XhoI + PCR327+PCR385     ≈1500     ≈10％   10.Blue429/HindIII-      XhoI + PCR319+PCR386     ≈400     ≈15％   11.Blue429/HindIII-      XhoI + PCR321+PCR386     ≈350     ≈15％   12.Blue442/HindIII-      XhoI + PCR319+PCR327     ≈1500     ≈10％   13.Blue428/HindIII-      XhoI +     2     0   14.Blue429/HindIII-      XhoI +     0     0   15.Blue442/HindIII-      XhoI +     6     0   16.Blue428/HindIII-      XhoI + PCR331     4     0   17.Blue428/HindIII-      XhoI + PCR321     2     0 两个片段和有缺口的载体的重组结果。最后5排是对照。
如在表15中看到的，Humicola lanuginosa脂酶基因的回收率是非常高的。表15的最后5排显示单独的开环质粒或仅加上不覆盖整个缺口的一个片段(参见附图3)仅获得非常少的菌落。
有野生型片段的第一排得到100％的活性菌落。
第二排是各含有一个移码突变的两个片段。片段PCR331具有定位于 BglII位点的移码，在该重组过程中该片段没有被野生型片段所覆盖(参见附图3)，因此得到约0％的活性脂酶。结果与第3排和第6排的情况相同。
在第4排，片段PCR386在SphI位点含有一个移码，它被有缺口的载体的野生型序列所重叠。将移码重组到低于10％的基因，结果低于上述表1A 的最后排的一个片段重组的结果。
在第5排，各含有一个移码的2个片段和有缺口的野生型载体之间观察到相当高的混合效果，得到25％活性的和75％非活性的脂酶菌落。这可能是由于片段PCR321在2个片段之间的重叠和在载体的有缺口区域具有移码。如果片段PCR386导致10％的非活性菌落，如第4排，则片段PCR321 得到其余的65％非活性-因此在重叠中PCR386获得35％wt。
第7排是第4排的“镜子成象”，它在载体的SphI位点有一个移码(参见附图7)和2个野生型片段，使野生型片段整合到高于90％的载体中。
第8排和第5排一样显示在重叠和缺口区域的PCR321移码得到非常高数量的非活性菌落。
在第9排，在载体重叠区域具有移码的片段PCR385产生非常高数量的非活性。
与第7排和第4排相比，第10排得到相当高数量的非活性菌落。在第 11排数量没有增加。
第12排显示与第7排相比在载体上的两个移码得到较低数量的活性菌落。
3个部分重叠片段重组到有缺口的载体是非常高效的，如在表16看到的。仅具有载体的最后排得到非常低的菌落。如在附图4看到的，所使用的所有片段是wt。在表16的第一排，载体和片段之间有相当长的重叠，但是在中间排PCR353和355之间的重叠仅10个碱基对长，仍然是非常高效的重组。这令人惊奇的结果非常容易地用于甚至远缘相关基因的区域的改组。例如可以将来自10个不同基因的3个不同区域制作为PCR片段形式，用引物设计为具有10-20碱基对的重叠，并且重组在一起，随后筛选最好的组合(1000可能的组合)。
                          表16     载体+片段     菌落的数量   具有活性Lipolase     的菌落％     pJSO37/PvuII-SpeI +     PCR353+PCR354+PCR367     ＞5000     100％     pJSO37/PvuII-SpeI +     PCR353+PCR355+PCR367     ＞5000     100％     pJSO37/PvuII-SpeI     20     100％ 3个片段和一个有缺口的载体的重组结果。最后排是对照。
                                      序列表 (1)一般的资料：    (i)申请人：
  (A)名称：Novo Nordisk A/S
  (B)街道：Novo Alle
  (C)城市：Bagsvaerd
  (E)国家：丹麦
  (F)邮政编码(ZIP)：DK-2880
  (G)电话：+4544448888
  (H)传真：+4544493256    (ii)发明名称：制备多肽变异体的方法    (iii)序列数目：15    (iv)计算机可读形式：
  (A)媒质类型：Floppy 软盘
  (B)计算机：IBM PC兼容机
  (C)操作系统：PC-DOS/MS-DOC
  (D)软件：PatentIn Release #1.0，版本# 1.30B(EPO) (2)SEQ ID NO：1的资料：    (i)序列特征：
  (A)长度：20个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物2843”    (xi)序列描述：SEQ ID NO：1 ACAAACATTA CGTGCACGGG (2)SEQ ID NO：2的资料：    (i)序列特征：
  (A)长度：18个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物4699”    (xi)序列描述：SEQ ID NO：2 CGGTACCCGG  GGATCCAC (2)SEQ ID NO：3的资料：    (i)序列特征：
  (A)长度：18个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物5164”    (xi)序列描述：SEQ ID NO：3 AATTACTCA TGCGGCCC (2)SEQ ID NO：4的资料：    (i)序列特征：
  (A)长度：21个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物8487”    (xi)序列描述：SEQ ID NO：4 CATTTGCTCC GGCTGCAGGG A (2)SEQ ID NO：5的资料：    (i)序列特征：
  (A)长度：60个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物4548”    (xi)序列描述：SEQ ID NO：5 GTGTTCCGCC GGTCTGTACG GTCAGGAATT CTGCAAAAGC CCTGTTTCCG ACTCGGGGGG (2)SEQ ID NO：6的资料：    (i)序列特征：
  (A)长度：21个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物5576”    (xi)序列描述：SEQ ID NO：6 GGTCTGTACG GTCAGGAATT C (2)SEQ ID NO：7的资料：    (i)序列特征：
  (A)长度：19个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物5578”    (xi)序列描述：SEQ ID NO：7 CGTTTCGGGT GACGGGGAC (2)SEQ ID NO：8的资料：    (i)序列特征：
  (A)长度：18个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物1596”    (xi)序列描述：SEQ ID NO：8 GGAGCAAATG TCATTTAT (2)SEQ ID NO：9的资料：    (i)序列特征：
  (A)长度：64个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：其它核酸
  (A)描述：/desc＝“引物4545”    (xi)序列描述：SEQ ID NO：9 GCATTGGCAA CTGTTGCCGG AGCAGACCTG CGTGGAAATG GGTATGATAT CGACGTGTTT TCAT (2)SEQ ID NO：10的资料：    (i)序列特征：
  (A)长度：876个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：环状 (ii)分子类型：其它核酸    (A)描述：/desc＝“载体pJSO26” (vi)原始来源：    (B)菌株：Humicola lanuginosa (ix)特征：    (A)名称/关键：CDS    (B)位置1..876 (xi)序列描述：SEQ ID NO：10 ATG AGG AGC TCC CTT GTG CTG TTC TTT GTC TCT GCG TGG ACG GCC TTG            48 Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu   1               5                  10                  15 GCC AGT CCT ATT CGT CGA GAG GTC TCG CAG GAT CTG TTT AAC CAG TTC            96 Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe
         20                  25                  30 AAT CTC TTT GCA CAG TAT TCT GCA GCC GCA TAC TGC GGA AAA AAC AAT           144 Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn
     35                  40                  45 GAT GCC CCA GCT GGT ACA AAC ATT ACG TGC ACG GGA AAT GCC TGC CCC           192 Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro
50                  55                  60 GAG GTA GAG AAG GCG GAT GCA ACG TTT CTC TAC TCG TTT GAA GAC TCT           240 Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser 65                  70                  75                  80 GGA GTG GGC GAT GTC ACC GGC TTC CTT GCT CTC GAC AAC ACG AAC AAA           288 Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys
             85                  90                  95 TTG ATC GTC CTC TCT TTC CGT GGC TCT CGT TCC ATA GAG AAC TGG ATC           336 Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile
        100                 105                 110 GGG AAT CTT AAC TTC GAC TTG AAA GAA ATA AAT GAC ATT TGC TCC GGC           384 Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly
    115                 120                 125 TGC AGG GGA CAT GAC GGC TTC ACT TCG TCC TGG AGG TCT GTA GCC GAT         432 Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp
130                 135                 140 ACG TTA AGG CAG AAG GTG GAG GAT GCT GTG AGG GAG CAT CCC GAC TAT         480 Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr 145                 150                 155                 160 CGC GTG GTG TTT ACC GGA CAT AGC TTG GGT GGT GCA TTG GCA ACT GTT         528 Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val
            165                 170                 175 GCC GGA GCA GAC CTG CGT GGA AAT GGG TAT GAT ATC GAC GTG TTT TCA         576 Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser
        180                 185                 190 TAT GGC GCC CCC CGA GTC GGA AAC AGG GCT TTT GCA GAA TTC CTG ACC         624 Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr
    195                 200                 205 GTA CAG ACC GGC GGA ACA CTC TAC CGC ATT ACC CAC ACC AAT GAT ATT         672 Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile
210                 215                 220 GTC CCT AGA CTC CCG CCG CGC GAA TTC GGT TAC AGC CAT TCT AGC CCA         720 Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro 225                 230                 235                 240 GAG TAC TGG ATC AAA TCT GGA ACC CTT GTC CCC GTC ACC CGA AAC GAT         768 Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp
            245                 250                 255 ATC GTG AAG ATA GAA GGC ATC GAT GCC ACC GGC GGC AAT AAC CAG CCT         816 Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro
        260                 265                 270 AAC ATT CCG GAT ATC CCT GCG CAC CTA TGG TAC TTC GGG TTA ATT GGG         864 Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly
    275                 280                 285 ACA TGT CTT TAG                                                         876 Thr Cys Leu  *
290 (2)SEQ ID NO：11的资料：    (i)序列特征：
  (A)长度：292个氨基酸
  (B)类型：氨基酸
  (D)几何结构：线性    (ii)分子类型：蛋白质    (xi)序列描述：SEQ ID NO：11
Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu
  1               5                  10                  15
Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe
             20                  25                  30
Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn
         35                  40                  45
Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro
     50                  55                  60 Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser 65                  70                  75                  80 Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys
             85                  90                  95 Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile
        100                 105                 110 Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly
    115                 120                 125 Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp
130                 135                 140 Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Prg Asp Tyr 145                 150                 155                 160 Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val
            165                 170                 175 Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser
        180                 185                 190 Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr
    195                 200                 205 Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile
210                 215                 220 Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro 225                 230                 235                 240 Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp
            245                 250                 255 Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro
        260                 265                 270 Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly
    275                 280                 285 Thr Cys Leu  *
290 (2)SEQ ID NO：12的资料：    (i)序列特征：
  (A)长度：876个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：环状    (ii)分子类型：其它核酸
  (A)描述：/desc＝“载体pJSO37”    (vi)原始来源：
  (B)菌株：Humicola lanuginosa    (ix)特征：    (A)名称/关键：CDS    (B)位置1..876 (xi)序列描述：SEQ ID NO：12 ATG AGG AGC TCC CTT GTG CTG TTC TTT GTC TCT GCG TGG ACG GCC TTG          48 Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu   1               5                  10                  15 GCC AGT CCT ATA CGT AGA GAG GTC TCG CAG GAT CTG TTT AAC CAG TTC          96 Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe
         20                  25                  30 AAT CTC TTT GCA CAG TAT TCA GCT GCC GCA TAC TGC GGA AAA AAC AAT          144 Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn
     35                  40                  45 GAT GCC CCA GCA GGT ACA AAC ATT ACG TGC ACG GGA AAT GCA TGC CCC          192 Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro
50                  55                  60 GAG GTA GAG AAG GCG GAT GCA ACG TTT CTC TAC TCG TTT GAA GAC TCT          240 Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser 65                  70                  75                  80 GGA GTG GGC GAT GTC ACC GGC TTC CTT GCT CTC GAC AAC ACG AAC AAG          288 Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys
             85                  90                  95 CTT ATC GTC CTC TCT TTC CGT GGC TCA AGA TCT ATA GAG AAC TGG ATC          336 Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile
        100                 105                 110 GGG AAT CTT AAC TTC GAC TTG AAA GAA ATA AAT GAC ATT TGC TCC GGC          384 Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly
    115                 120                 125 TGC AGG GGA CAT GAC GGC TTC ACT TCG TCC TGG AGG TCT GTA GCC GAT          432 Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp
130                 135                 140 ACG TTA AGG CAG AAG GTG GAG GAT GCT GTT CGC GAG CAT CCC GAC TAT          480 Thr Leu Arg Gln Lys VaL Glu Asp Ala Val Arg Glu His Pro Asp Tyr 145                 150                 155                 160 CGC GTG GTG TTT ACC GGC CAT AGC CTT GGT GGT GCG CTA GCA ACT GTT          528 Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val
            165                 170                 175 GCC GGA GCA GAC CTG CGT GGA AAT GGG TAT GAT ATC GAC GTG TTT TCA          576 Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser
        180                 185                 190 TAT GGC GCC CCC CGA GTC GGT AAC CGT GCT TTT GCA GAA TTC CTG ACC         624 Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr
    195                 200                 205 GTA CAG ACC GGC GGT ACC CTC TAC CGC ATT ACC CAC ACC AAT GAT ATT         672 Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile
210                 215                 220 GTC CCT AGA CTC CCG CCT CGA GAA TTC GGT TAC AGC CAT TCT AGC CCA         720 Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro 225                 230                 235                 240 GAG TAC TGG ATC AAA TCT GGA ACA CTA GTC CCC GTC ACC CGA AAC GAT         768 Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp
            245                 250                 255 ATC GTG AAG ATA GAA GGC ATC GAT GCC ACC GGC GGC AAT AAC CAG CCT         816 Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro
        260                 265                 270 AAC ATT CCG GAT ATC CCT GCG CAC CTA TGG TAC TTC GGG TTA ATT GGG         864 Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly
    275                 280                 285 ACA TGT CTT TAG                                                         876 Thr Cys Leu  *
290 (2)SEQ ID NO：13的资料： (i)序列特征：    (A)长度：292个氨基酸    (B)类型：氨基酸    (D)几何结构：线性 (ii)分子类型：蛋白质 (xi)序列描述：SEQ ID NO：13 Met Arg Ser Ser Leu Val Leu Phe Phe Val Ser Ala Trp Thr Ala Leu   1               5                  10                  15 Ala Ser Pro Ile Arg Arg Glu Val Ser Gln Asp Leu Phe Asn Gln Phe
         20                  25                  30 Asn Leu Phe Ala Gln Tyr Ser Ala Ala Ala Tyr Cys Gly Lys Asn Asn
     35                  40                  45 Asp Ala Pro Ala Gly Thr Asn Ile Thr Cys Thr Gly Asn Ala Cys Pro
50                  55                  60 Glu Val Glu Lys Ala Asp Ala Thr Phe Leu Tyr Ser Phe Glu Asp Ser 65                  70                  75                  80 Gly Val Gly Asp Val Thr Gly Phe Leu Ala Leu Asp Asn Thr Asn Lys
             85                  90                  95 Leu Ile Val Leu Ser Phe Arg Gly Ser Arg Ser Ile Glu Asn Trp Ile
         100                105                 110 Gly Asn Leu Asn Phe Asp Leu Lys Glu Ile Asn Asp Ile Cys Ser Gly
    115                 120                 125 Cys Arg Gly His Asp Gly Phe Thr Ser Ser Trp Arg Ser Val Ala Asp
130                 135                 140 Thr Leu Arg Gln Lys Val Glu Asp Ala Val Arg Glu His Pro Asp Tyr 145                 150                 155                 160 Arg Val Val Phe Thr Gly His Ser Leu Gly Gly Ala Leu Ala Thr Val
            165                 170                 175 Ala Gly Ala Asp Leu Arg Gly Asn Gly Tyr Asp Ile Asp Val Phe Ser
        180                 185                 190 Tyr Gly Ala Pro Arg Val Gly Asn Arg Ala Phe Ala Glu Phe Leu Thr
    195                 200                 205 Val Gln Thr Gly Gly Thr Leu Tyr Arg Ile Thr His Thr Asn Asp Ile
210                 215                 220 Val Pro Arg Leu Pro Pro Arg Glu Phe Gly Tyr Ser His Ser Ser Pro 225                 230                 235                 240 Glu Tyr Trp Ile Lys Ser Gly Thr Leu Val Pro Val Thr Arg Asn Asp
            245                 250                 255 Ile Val Lys Ile Glu Gly Ile Asp Ala Thr Gly Gly Asn Asn Gln Pro
        260                 265                 270 Asn Ile Pro Asp Ile Pro Ala His Leu Trp Tyr Phe Gly Leu Ile Gly
    275                 280                 285 Thr Cys Leu  *
290 (2)SEQ ID NO：14的资料：    (i)序列特征：
  (A)长度：864个碱基对
  (B)类型：核酸
  (C)链数：单链
  (D)几何结构：线性    (ii)分子类型：DNA(基因组)    (vi)原始来源：
  (B)菌株：假单孢菌    (xi)特征：
  (A)名称/关键：mat肽
  (B)位置：1..864    (ix)特征：
  (A)名称/关键词：CDS
  (B)位置：1..864    (xi)序列描述：SEQ ID NO：14 TTC GGC TCC TCG AAC TAC ACC AAG ACC CAG TAC CCG ATC GTC CTG ACC          48 Phe Gly Ser Ser Asn Tyr Thr Lys Thr Gln Tyr Pro Ile Val Leu Thr   1               5                  10                  15 CAC GGC ATG CTC GGT TTC GAC AGC CTG CTT GGA GTC GAC TAC TGG TAC          96 His Gly Met Leu Gly Phe Asp Ser Leu Leu Gly Val Asp Tyr Trp Tyr
         20                  25                  30 GGC ATT CCC TCA GCC CTG CGT AAA GAC GGC GCC ACC GTC TAC GTC ACC         144 Gly Ile Pro Ser Ala Leu Arg Lys Asp Gly Ala Thr Val Tyr Val Thr
     35                  40                  45 GAA GTC AGC CAG CTC GAC ACC TCC GAA GCC CGA GGT GAG CAA CTG CTG         192 Glu Val Ser Gln Leu Asp Thr Ser Glu Ala Arg Gly Glu Gln Leu Leu
50                  55                  60 ACC CAA GTC GAG GAA ATC GTG GCC ATC AGC GGC AAG CCC AAG GTC AAC         240 Thr Gln Val Glu Glu Ile Val Ala Ile Ser Gly Lys Pro Lys Val Asn 65                  70                  75                  80 CTG TTC GGC CAC AGC CAT GGC GGG CCT ACC ATC CGC TAC GTT GCC GCC         288 Leu Phe Gly His Ser His Gly Gly Pro Thr Ile Arg Tyr Val Ala Ala
             85                  90                  95 GTG CGC CCG GAT CTG GTC GCC TCG GTC ACC AGC ATT GGC GCG CCG CAC         336 Val Arg Pro Asp Leu Val Ala Ser Val Thr Ser Ile Gly Ala Pro His
        100                 105                 110 AAG GGT TCG GCC ACC GCC GAC TTC ATC CGC CAG GTG CCG GAA GGA TCG         384 Lys Gly Ser Ala Thr Ala Asp Phe Ile Arg Gln Val Pro Glu Gly Ser
    115                 120                 125 GCC AGC GAA GCG ATT CTG GCC GGG ATC GTC AAT GGT CTG GGT GCG CTG         432 Ala Ser Glu Ala Ile Leu Ala Gly Ile Val Asn Gly Leu Gly Ala Leu
130                 135                 140 ATC AAC TTC CTT TCC GGC AGC AGT TCG GAC ACC CCA CAG AAC TCG CTG         480 Ile Asn Phe Leu Ser Gly Ser Ser Ser Asp Thr Pro Gln Asn Ser Leu 145                 150                 155                 160 GGC ACG CTG GAG TCA CTG AAC TCC GAA GGC GCC GCA CGG TTT AAC GCC         528 Gly Thr Leu Glu Ser Leu Asn Ser Glu Gly Ala Ala Arg Phe Asn Ala
            165                 170                 175 CGC TTC CCC CAG GGG GTA CCA ACC AGC GCC TGC GGC GAG GGC GAT TAC         576 Arg Phe Pro Gln Gly Val Pro Thr Ser Ala Cys Gly Glu Gly Asp Tyr
        180                 185                 190 GTG GTC AAT GGC GTG CGC TAT TAC TCC TGG AGG GGC ACC AGC CCG CTG         624 Val Val Asn Gly Val Arg Tyr Tyr Ser Trp Arg Gly Thr Ser Pro Leu
    195                 200                 205 ACC AAC GTA CTC GAC CCC TCC GAC CTG CTG CTC GGC GCC ACC TCC CTG         672 Thr Asn Val Leu Asp Pro Ser Asp Leu Leu Leu Gly Ala Thr Ser Leu
210                 215                 220 ACC TTC GGT TTC GAG GCC AAC GAT GGT CTG GTC GGA CGC TGC AGC TCC        720 Thr Phe Gly Phe Glu Ala Asn Asp Gly Leu Val Gly Arg Cys Ser Ser 225                 230                 235                 240 CGG CTG GGT ATG GTG ATC CGC GAC AAC TAC CGG ATG AAC CAC CTG GAC        768 Arg Leu Gly Met Val Ile Arg Asp Asn Tyr Arg Met Asn His Leu Asp
            245                 250                 255 GAG GTG AAC CAG ACC TTC GGG CTG ACC AGC ATC TTC GAG ACC AGC CCG        816 Glu Val Asn Gln Thr Phe Gly Leu Thr Ser Ile Phe Glu Thr Ser Pro
        260                 265                 270 GTA TCG GTC TAT CGC CAG CAA GCC AAT CGC CTG AAG AAC GCC GGG CTC        864 Val Ser Val Tyr Arg Gln Gln Ala Asn Arg Leu Lys Asn Ala Gly Leu
    275                 280                 285 (2)SEQ ID NO：15的资料：    (i)序列特征：
  (A)长度：288个氨基酸
  (B)类型：氨基酸
  (D)几何结构：线性    (ii)分子类型：蛋白质 (xi)序列描述：SEQ ID NO：15 Phe Gly Ser Ser Asn Tyr Thr Lys Thr Gln Tyr Pro Ile Val Leu Thr   1               5                  10                  15 His Gly Met Leu Gly Phe Asp Ser Leu Leu Gly Val Asp Tyr Trp Tyr
         20                  25                  30 Gly Ile Pro Ser Ala Leu Arg Lys Asp Gly Ala Thr Val Tyr Val Thr
     35                  40                  45 Glu Val Ser Gln Leu Asp Thr Ser Glu Ala Arg Gly Glu Gln Leu Leu
50                  55                  60 Thr Gln Val Glu Glu Ile Val Ala Ile Ser Gly Lys Pro Lys Val Asn 65                  70                  75                  80 Leu Phe Gly His Ser His Gly Gly Pro Thr Ile Arg Tyr Val Ala Ala
             85                  90                  95 Val Arg Pro Asp Leu Val Ala Ser Val Thr Ser Ile Gly Ala Pro His
        100                 105                 110 Lys Gly Ser Ala Thr Ala Asp Phe Ile Arg Gln Val Pro Glu Gly Ser
    115                 120                 125 Ala Ser Glu Ala Ile Leu Ala Gly Ile Val Asn Gly Leu Gly Ala Leu
130                 135                 140 Ile Asn Phe Leu Ser Gly Ser Ser Ser Asp Thr Pro Gln Asn Ser Leu 145                 150                 155                 160 Gly Thr Leu Glu Ser Leu Asn Ser Glu Gly Ala Ala Arg Phe Asn Ala
            165                 170                 175 Arg Phe Pro Gln Gly Val Pro Thr Ser Ala Cys Gly Glu Gly Asp Tyr
        180                 185                 190 Val Val Asn Gly Val Arg Tyr Tyr Ser Trp Arg Gly Thr Ser Pro Leu
    195                 200                 205 Thr Asn Val Leu Asp Pro Ser Asp Leu Leu Leu Gly Ala Thr Ser Leu
210                 215                 220 Thr Phe Gly Phe Glu Ala Asn Asp Gly Leu Val Gly Arg Cys Ser Ser 225                 230                 235                 240 Arg Leu Gly Met Val Ile Arg Asp Asn Tyr Arg Met Asn His Leu Asp
            245                 250                 255 Glu Val Asn Gln Thr Phe Gly Leu Thr Ser Ile Phe Glu Thr Ser Pro
        260                 265                 270 Val Ser Val Tyr Arg Gln Gln Ala Asn Arg Leu Lys Asn Ala Gly Leu
    275                 280                 285

标题	发布/更新时间	阅读量
一株缓解植物盐害的耐盐促生细菌JP-JH及其应用	2020-05-08	387
一种培育高活性植物促生菌的培养基及其制备方法	2020-05-12	111
促进玉米根系发育的阿氏芽孢杆菌及其应用	2020-05-11	21
一种复合芽孢杆菌菌剂及制备方法和应用	2020-05-14	765
一种复合菌根生物肥及其制备方法和应用	2020-05-14	264
球形赖氨酸芽孢杆菌SY50及其应用	2020-05-08	88
青枯病防病促生菌剂及其应用	2020-05-12	586
一种适用于寒区贫瘠环境下提升土体基质肥力的微生物菌肥	2020-05-12	447
一种利用富镉基质栽培快速鉴别叶菜镉低吸收品种的方法	2020-05-15	691
一种具有促生作用的同温层芽孢杆菌及其应用	2020-05-15	754

制备多肽变异体的方法

发明领域

发明背景

该功能需要专业版企业版VIP权限，您可以：