首页 / 专利库 / 诊断设备和程序 / 鉴别诊断 / 编码具有δ-5,7甾醇,δ-7还原酶活性的蛋白质的DNA序列和该蛋白质及生产方法,转化酵母菌株,用途

编码具有δ-5,7甾醇,δ-7还原酶活性的蛋白质的DNA序列和该蛋白质及生产方法,转化酵母菌株,用途

阅读:504发布:2021-09-19

专利汇可以提供编码具有δ-5,7甾醇,δ-7还原酶活性的蛋白质的DNA序列和该蛋白质及生产方法,转化酵母菌株,用途专利检索,专利查询,专利分析的服务。并且编码A.thaliana 蛋白质 的cDNA序列,该蛋白质具有δ-5,7甾醇,δ-7还原酶活性(SEQ ID NO.1)。克隆方法。在C-7位不饱和甾醇的还原方法。孕甾烯醇 酮 的生产方法。,下面是编码具有δ-5,7甾醇,δ-7还原酶活性的蛋白质的DNA序列和该蛋白质及生产方法,转化酵母菌株,用途专利的具体信息内容。

1.核酸序列,含有编码具有δ-5,7甾醇,δ-还原酶活性的蛋白 质的序列,所述核酸是一种DNA或一种RNA。
2.根据权利要求1所述核酸序列,其中核酸是一种cDNA。
3.根据权利要求2所述cDNA序列,其中编码序列编码具有δ-5 ,7甾醇,δ-7还原酶活性的A.thaliana蛋白质,并且具有SEQ ID NO .1的核酸序列: GTGTGAGTAA TTTAGGTCAA CACAGATCAG AATCTGAGGC TTTGGCCGAG ACGAAGAGAA        60 AAGCAGAAGA AGAAA ATG GCG GAG ACT GTA CAT TCT CCG ATC GTT ACT TAC        111
             Met Ala Glu Thr Val His Ser Pro Ile Val Thr Tyr
               1               5                  10 GCA TCG ATG TTA TCG CTT CTC GCC TTC TGT CCA CCT TTC GTC ATT CTC         159 Ala Ser Met Leu Ser Leu Leu Ala Phe Cys Pro Pro Phe Val Ile Leu
     15                  20                  25 CTA TGG TAC ACA ATG GTT CAT CAG GAT GGT TCT GTT ACT CAG ACC TTT         207 Leu Trp Tyr Thr Met Val His Gln Asp Gly Ser Val Thr Gln Thr Phe
 30                  35                  40 GGC TTC TTT TGG GAG AAT GGA GTT CAA GGA CTT ATC AAC ATA TGG CCA         255 Gly Phe Phe Trp Glu Asn Gly Val Gln Gly Leu Ile Asn Ile Trp Pro  45                  50                  55                  60 AGA CCC ACT TTG ATT GCT TGG AAA ATT ATA TTT TGC TAT GGA GCA TTT         303 Arg Pro Thr Leu Ile Ala Trp Lys Ile Ile Phe Cys Tyr Gly Ala Phe
             65                  70                  75 GAA GCT ATT CTT CAG CTG CTT CTG CCT GGT AAA AGA GTT GAG GGT CCA         351 Glu Ala Ile Leu Gln Leu Leu Leu Pro Gly Lys Arg Val Glu Gly Pro
         80                  85                  90 ATA TCT CCA GCC GGA AAC CGA CCA GTT TAC AAG GCC AAT GGT CTG GCT          399 Ile Ser Pro Ala Gly Asn Arg Pro Val Tyr Lys Ala Asn Gly Leu Ala
     95                 100                 105 GCT TAC TTT GTG ACA CTA GCA ACC CAT CTT GGT CTT TGG TGG TTT GGA          447 Ala Tyr Phe Val Thr Leu Ala Thr His Leu Gly Leu Trp Trp Phe Gly
110                 115                 120 ATC TTC AAC CCT GCA ATT GTC TAT GAT CAC TTG GGT GAA ATA TTT TCG          495 Ile Phe Asn Pro Ala Ile Val Tyr Asp His Leu Gly Glu Ile Phe Ser 125                 130                 135                 140 GCA CTA ATA TTC GGA AGC TTC ATA TTT TGT GTT TTG TTG TAC ATA AAA          543 Ala Leu Ile Phe Gly Ser Phe Ile Phe Cys Val Leu Leu Tyr Ile Lys
            145                 150                 155 GGC CAT GTT GCA CCT TCA TCA AGT GAC TCT GGT TCA TGT GGT AAC CTA          591 Gly Mis Val Ala Pro Ser Ser Ser Asp Ser Gly Ser Cys Gly Asn Leu
        160                 165                 170 ATA ATT GAC TTC TAT TGG GGC ATG GAG TTG TAC CCT CGA ATT GGT AAG          639 Ile Ile Asp Phe Tyr Trp Gly Met Glu Leu Tyr Pro Arg Ile Gly Lys
    175                 180                 185 AGC TTT GAC ATC AAG GTG TTT ACT AAT TGC AGA TTC GGA ATG ATG TCT          687 Ser Phe Asp Ile Lys Val Phe Thr Asn Cys Arg Phe Gly Met Met Ser
190                 195                 200 TGG GCA GTT CTT GCA GTC ACG TAC TGC ATA AAA CAG TAT GAA ATA AAT          735 Trp Ala Val Leu Ala Val Thr Tyr Cys Ile Lys Gln Tyr Glu Ile Asn 205                 210                 215                 220 GGC AAA GTA TCT GAT TCA ATG CTG GTG AAC ACC ATC CTG ATG CTG GTG          783 Gly Lys Val Ser Asp Ser Met Leu Val Asn Thr Ile Leu Met Leu Val
            225                 230                 235 TAT GTC ACA AAA TTC TTC TGG TGG GAA GCT GGT TAT TGG AAC ACC ATG          831 Tyr Val Thr Lys Phe Phe Trp Trp Glu Ala Gly Tyr Trp Asn Thr Met
        240                 245                 250 GAC ATT GCA CAT GAC CGA GCT GGA TTC TAT ATA TGC TGG GGT TGT CTA          879 Asp Ile Ala His Asp Arg Ala Gly Phe Tyr Ile Cys Trp Gly Cys Leu
    255                 260                 265 GTG TGG GTG CCT TCT GTC TAC ACT TCT CCA GGC ATG TAC CTT GTG AAC          927 Val Trp Val Pro Ser Val Tyr Thr Ser Pro Gly Met Tyr Leu Val Asn
270                 275                 280 CAC CCC GTC GAA CTC GGA ACT CAG TTG GCA ATA TAC ATT CTC GTT GCA        975 His Pro Val Glu Leu Gly Thr Gln Leu Ala Ile Tyr Ile Leu Val Ala 285                 290                 295                 300 GGA ATT CTG TGC ATT TAC ATA AAG TAT GAC TGT GAT AGA CAA AGG CAA       1023 Gly Ile Leu Cys Ile Tyr Ile Lys Tyr Asp Cys Asp Arg Gln Arg Gln
            305                 310                 315 GAG TTC AGG AGG ACA AAC GGG AAA TGT TTG GTT TGG GGA AGA GCC CCG       1071 Glu Phe Arg Arg Thr Asn Gly Lys Cys Leu Val Trp Gly Arg Ala Pro
        320                 325                 330 TCA AAG ATT GTG GCG TCG TAT ACT ACA ACA TCT GGT GAA ACT AAA ACT       1119 Ser Lys Ile Val Ala Ser Tyr Thr Thr Thr Ser Gly Glu Thr Lys Thr
    335                 340                 345 AGT CTT CTC TTA ACG TCT GGA TGG TGG GGA TTG GCT CGT CAT TTC CAT       1167 Ser Leu Leu Leu Thr Ser Gly Trp Trp Gly Leu Ala Arg His Phe His
350                 355                 360 TAT GTT CCT GAG ATC TTA AGT GCT TTC TTC TGG ACC GTA CCG GCT CTC       1215 Tyr Val Pro Glu Ile Leu Ser Ala Phe Phe Trp Thr Val Pro Ala Leu 365                 370                 375                 380 TTC GAT AAC TTC TTG GCA TAC TTC TAC GTC GTC ACC CTT CTT CTC TTT       1263 Phe Asp Asn Phe Leu Ala Tyr Phe Tyr Val Leu Thr Leu Leu Leu Phe
            385                 390                 395 GAT CGA GCC AAG AGA GAC GAT GAC CGA TGC CGA TCA AAG TAT GGG AAA       1311 Asp Arg Ala Lys Arg Asp Asp Asp Arg Cys Arg Ser Lys Tyr Gly Lys
        400                 405                 410 TAT TGG AAG CTG TAT TGT GAG AAA GTC AAA TAC AGG ATC ATT CCG GGA       1359 Tyr Trp Lys Leu Tyr Cys Glu Lys Val Lys Tyr Arg Ile Ile Pro Gly
    415                 420                 425 ATT TAT TGATTGTAAC GAAGTCTGTT GTTCTCATTT TCTACTTATT ACGTTAATTC        1415 Ile Tyr
430 GAACGTT GGA ATCATCAAAA GACCGAGCCA AAACAAAAAT GCAAATTGAT GCGATAGACA    1475 TTCTTTT GCT GAAAAAAAAA A                                              1496 及其该序列的等位变体。
4.DNA序列,它编码具有δ-5,7甾醇,δ-还原酶活性的蛋白质, 并且在中等或高严紧条件下与权利要求3中定义的序列杂交或者与 该序列具有约60%和更高的序列等同性。
5.DNA序列,它编码具有δ-5,7甾醇,δ-7还原酶活性的蛋白质, 并且可以利用引物寡核苷酸和PCR技术进行扩增,所述引物寡核苷 酸编码具有SEQID NO.3基酸序列的共有序列: Leu Leu Xaa Xaa Gly Trp Xaa Gly Xaa Xaa Arg Xaa Xaa Xaa Tyr 1               5                   10                  15 其中第7位的Xaa是Trp或Tyr并且第12位Xaa是His或Lys。
6.具有δ-5,7甾醇,δ-7还原酶活性的A.thaliana蛋白质并且 具有氨基酸序列SEQ ID NO.2。 Met Ala Glu Thr Val His Ser Pro Ile Val Thr Tyr Ala Ser Met Leu   1               5                  10                  15 Ser Leu Leu Ala Phe Cys Pro Pro Phe Val Ile Leu Leu Trp Tyr Thr
         20                  25                  30 Met Val His Gln Asp Gly Ser Val Thr Gln Thr Phe Gly Phe Phe Trp
     35                  40                  45 Glu Asn Gly Val Gln Gly Leu Ile Asn Ile Trp Pro Arg Pro Thr Leu
 50                  55                  60 Ile Ala Trp Lys Ile Ile Phe Cys Tyr Gly Ala Phe Glu Ala Ile Leu  65                  70                  75                  80 Gln Leu Leu Leu Pro Gly Lys Arg Val Glu Gly Pro Ile Ser Pro Ala
             85                  90                  95 Gly Asn Arg Pro Val Tyr Lys Ala Asn Gly Leu Ala Ala Tyr Phe Val
        100                 105                 110 Thr Leu Ala Thr His Leu Gly Leu Trp Trp Phe Gly Ile Phe Asn Pro
    115                 120                 125 Ala Ile Val Tyr Asp His Leu Gly Glu Ile Phe Ser Ala Leu Ile Phe
130                 135                 140 Gly Ser Phe Ile Phe Cys Val Leu Leu Tyr Ile Lys Gly His Val Ala 145                 150                 155                 160 Pro Ser Ser Ser Asp Ser Gly Ser Cys Gly Asn Leu Ile Ile Asp Phe
            165                 170                 175 Tyr Trp Gly Met Glu Leu Tyr Pro Arg Ile Gly Lys Ser Phe Asp Ile
        180                 185                 190 Lys Val Phe Thr Asn Cys Arg Phe Gly Met Met Ser Trp Ala Val Leu
    195                 200                 205 Ala Val Thr Tyr Cys Ile Lys Gln Tyr Glu Ile Asn Gly Lys Val Ser
210                 215                 220 Asp Ser Met Leu Val Asn Thr Ile Leu Met Leu Val Tyr Val Thr Lys 225                 230                 235                 240 Phe Phe Trp Trp Glu Ala Gly Tyr Trp Asn Thr Met Asp Ile Ala His
            245                 250                 255 Asp Arg Ala Gly Phe Tyr Ile Cys Trp Gly Cys Leu Val Trp Val Pro
        260                 265                 270 Ser Val Tyr Thr Ser Pro Gly Met Tyr Leu Val Asn His Pro Val Glu
    275                 280                 285 Leu Gly Thr Gln Leu Ala Ile Tyr Ile Leu Val Ala Gly Ile Leu Cys
290                 295                 300 Ile Tyr Ile Lys Tyr Asp Cys Asp Arg Gln Arg Gln Glu Phe Arg Arg 305                 310                 315                 320 Thr Asn Gly Lys Cys Leu Val Trp Gly Arg Ala Pro Ser Lys Ile Val
            325                 330                 335 Ala Ser Tyr Thr Thr Thr Ser Gly Glu Thr Lys Thr Ser Leu Leu Leu
        340                 345                 350 Thr Ser Gly Trp Trp Gly Leu Ala Arg His Phe His Tyr Val Pro Glu
    355                 360                 365 Ile Leu Ser Ala Phe Phe Trp Thr Val Pro Ala Leu Phe Asp Asn Phe
370                 375                 380 Leu Ala Tyr Phe Tyr Val Leu Thr Leu Leu Leu Phe Asp Arg Ala Lys 385                 390                 395                 400 Arg Asp Asp Asp Arg Cys Arg Ser Lye Tyr Gly Lys Tyr Trp Lys Leu
            405                 410                 415 Tyr Cys Glu Lye Val Lys Tyr Arg Ile Ile Pro Gly Ile Tyr
        420                 425                 430 以及该序列的等位变体和类似物。
7.具有δ-5,7甾醇,δ-7还原酶活性的A.thaliana蛋白质并且 具有SEQ ID NO.2氨基酸序列并命名为δ-7Red。
8.具有δ-5,7甾醇,δ-7还原酶活性的蛋白质,其氨基酸序列 与权利要求7定义的SEQ ID NO.2序列具有约60%和更高的序列等同 性。
9.具有δ-5,7甾醇,δ-7还原酶活性的蛋白质,它与权利要求7 中定义的A.thaliana δ-7Red蛋白质具有交叉免疫反应性
10.具有δ-5,7甾醇,δ-7还原酶活性的蛋白质,它是通过含有 权利要求l-5任一项的DNA序列的宿主细胞进行表达获得的。
11.一种具有δ-5,7甾醇,δ-7还原酶活性的A.thaliana蛋白 质,它是通过在含有编码氨基酸序列SEQ ID NO.2的DNA序列的宿主 细胞中表达而获得的。
12.根据权利要求10或11所述蛋白质,其中宿主细胞是酵母
13.一种抗体,它特异于权利要求6-12所述具有δ-5,7甾醇,δ -7还原酶活性的蛋白质。
14.表达载体,含有权利要求1-5任一项所述DNA序列。
15.宿主细胞,由权利要求14所述载体转化。
16.克隆方法,用于将编码具有δ-5,7甾醇δ-7还原酶活性的 蛋白质的核酸克隆于一种生物中,所述克隆方法包括筛查方法, 筛选
-对制霉菌素或一种类似化合物共抗性的微生物,所述类似化 合物的毒性由在C-7位携带不饱和键的甾醇存在而定,
-将其核酸与SEQ ID NO.1的核苷酸序列进行杂交,
-利用数据加工技术从随机分离的DNA序列鉴别核酸,
-在该蛋白质直接表达之后利用特异于具有SEQ ID NO.2氨基 酸序列的蛋白质的抗体进行免疫检测。
17.DNA或RNA核酸序列,根据权利要求16定义的方法获得。
18.由含有权利要求17的DNA序列的载体转化的宿主细胞。
19.根据权利要求15或权利要求18所述转化宿主细胞,其中宿 主是一种酵母或丝状真菌
20.制备具有δ-5,7甾醇,δ-7还原酶活性的蛋白质的方法,其 中将根据权利要求15,18或19任一项所述转化宿主细胞进行培养, 并分离表达的蛋白质。
21.根据权利要求20所述方法,其中宿主细胞是一种转化酵母, 其中DNA编码序列置于酵母启动子控制之下。
22.将C-7位不饱和的甾醇体外还原方法,其中被还原的甾醇与 权利要求20或权利要求21获得的蛋白质一起保温并且对获得的还 原甾醇进行分离或不分离。
23.在C-7位不饱和的外源甾醇体内还原方法,其中将甾醇与权 利要求15,18或19的任一项所述转化宿主细胞一起培养,并将得到 的还原甾醇进行分离或不分离。
24.将在C-7位不饱和的内源甾醇进行体内还原方法,其中将权 利要求19所述转化的宿主菌株进行培养并将积累的还原甾醇进行 分离或不分离。
25.根据权利要求22-24任一项所述体外或体内还原方法,其中 获得的还原甾醇是胆固醇侧链限制性酶(P450SCC)的底物。
26.根据权利要求25所述体内还原方法,其中被还原的内源甾 醇是麦甾5,7二烯3-醇,麦角甾5,7,24(28)三烯3-醇或麦角甾5,7 ,22三烯3-醇或它们的混合物。
27.制备孕甾烯醇的方法,其中将权利要求19所述转化宿主 细胞进行培养,将在C-7位还原的积累的内源甾醇或甾醇类进行分 离或不分离,在P450SCC存在以及有或没有肾上腺皮质激素还原酶 (ADR)和肾上腺皮质激素(ADX)存在下,培养还原的甾醇,并对获得 的孕甾烯醇酮进行分离或不分离。
28.根据权利要求27所述方法,其中宿主细胞是酵母。
29.制备孕甾烯醇酮的方法,其中将由一个或多个载体转化的 酵母进行培养,所述载体能使具有δ-5,7甾醇,δ-7还原酶活性以 及P450SCC活性和具有或不具有ADR和ADX活性的蛋白质共表达,然 后分离或不分离游离的或酯化的孕甾烯醇酮。
30.根据权利要求29所述孕甾烯醇酮的生产方法,其中将能共 表达具δ-5,7甾醇,δ-7还原酶,P450SCC,ADR和ADX活性的蛋白质 的转化酵母进行培养。
31.根据权利要求30所述方法,其中具有δ-5,7甾醇,δ-7还原 酶活性的蛋白质是A.thaliana δ-7Red蛋白质。
32.根据权利要求31所述方法,其中酵母菌株是ECol/pCD63菌 株。
33.转化的酵母菌株,共表达具有δ-5,7甾醇,δ-7还原酶 ,P450SCC,ADR和ADX活性的一种蛋白质并且积累游离或酯化的孕甾 烯醇酮。
34.根据权利要求33所述酵母菌株,其中具有δ-5,7甾醇,δ-7 还原酶活性的蛋白质是A.thaliana δ-7Red蛋白质。
35.根据权利要求34所述酵母菌株,其命称为ECol/pCD63。
36.根据权利要求17所述人DNA序列,可用作为探针,用于诊断 δ-5,7甾醇,δ-7还原酶的先天性缺失。
37.用于检测δ-5,7甾醇,δ-7还原酶缺失的方法,该方法包括 将含有人基因组DNA的样品与权利要求36的探针一起在标准杂交条 件一起保温并且显示该探针有或没有固定到基因组DNA上,没有与 后者固定或还原,表明δ-5,7甾醇,δ-7还原酶先天性缺陷

说明书全文

发明涉及编码具有δ-5,7甾醇,δ-7还原酶活性的A. thaliana蛋白质的DNA序列,δ7-Red蛋白质,它们的生产方法,转 化酵母菌株及其用途。

δ-5,7甾醇,δ-7还原酶(E.C.1.3.1.21)是一种微粒体酶,根 据其在大鼠的肝匀浆中具有活性(M.E.Dempsey等人,Methods Enzymol.,15,501-514,1969)以及在玉米植物制剂中具有活性(M .Taton等人,Biochem.Biophys.Res,Commun.,181,465-473,1991 )已经证明了该酶的存在。该还原酶依赖于NADPH并在体外将7-脱 氢胆甾醇还原为胆甾醇。

胆甾是真核生物膜的主要组成成分,但根据种的不同显示出结 构上的差异。在真核生物例如酵母的细胞中,主要甾醇是麦甾醇, 该甾醇在C-5和C-7位均是不饱和的,在C-24位具有一个分支侧链, 并且在C-22位也是不饱和的,而哺乳动物甾醇特征在于在C-5位进 行了脱饱和作用并且含有一个饱和的侧链。埴物中最有代表性的 一般甾醇的谷甾醇,豆甾醇和菜油甾醇具有一个分支但饱和的侧链 并且如同脊椎动物的甾醇,在C-7位上也是不饱和的。对甾醇核结 构之间的这种差异起作用的酶是δ-5,7甾醇,δ-7还原酶。

还从没有将δ-5,7甾醇,δ-7还原酶纯化至均一并且仅描述了 部分纯化方法(M.E.Dempsey等人;M.Taton等人,已经引述过)。该 蛋白质的物理-化学特性还没有得到表征。对该蛋白质的序列信息 以及针对该蛋白质的抗体都没有描述。此外,对患有RSH/Smith -Lemli-Opitz(SLO)综合症的人体的7-脱氢胆甾醇还原酶的近似效 率已有描述(J.M.Opitz等人,Am.J.Med.Genet.,50,326-338,1994)。

采用已知方法还没有获得编码δ-5,7甾醇,δ-7还原酶的CDNA 的克隆,利用该克隆可以鉴定相应蛋白质的序列,也可以对人基因 进行定性或者将该基因的先天性缺陷显露出来,所述已知方法是使 用例如杂交和/或免疫检测技术。因此特别寻求可以实施克隆的有 创造性的筛选方法,尤其是在没有有关蛋白质信息的情况下。

真菌膜的主要甾醇,豆甾醇在C-5,7位含有一对共轭的双链,该 双键为多烯族化合物例如制霉菌素提供了抗霉菌素的活性(R .Bittman等人,J.Biol.Chem.260,2884-2889,1985)。根据制霉菌 素作用的发挥对C-5,7位不饱和的甾醇在膜中的浓度有强烈依赖性 这一情况,可以在酿酒酵母中选择有关积累甾醇的突变菌株(S.W .Molzahn等人,J.Gen.Microbiol.,72,339-348,1972)。因此,突变 体er92和erg3积累甾醇,它们在C-5,7位没有共轭双键,因为它们分 别在甾醇δ-8,7异构酶(W.Ashman等人,Lipids,26,628,1991)以及 甾醇δ-5脱氢酶(B.Arthinton等人,Gene,102,39,1991)方面有缺 陷。这样的突变体是能生存的,因为在适当条件下可用不同替代甾 醇包括胆甾醇代替豆甾醇,酵母的主要天然甾醇。

发明人利用一种干扰酿酒酵母代谢的筛选方法将编码具有δ -5,7甾醇,δ-7还原酶活性的异源蛋白质的CDNA进行克隆,发现了 富含在C-5,7位没有双重不饱和的甾醇的酵母菌株其对制霉素素抗 性的增加是具有益处。而且这种方法的成功之处在于克服了许多 技术难点也是没有预见到的,该方法具有不依赖于已知DNA序列或 蛋白质并且可仅根据酶活性进行检测的双重优点。

第一方面的限制处来自于下列事实:制霉菌素起作用的方式 还没有被完全阐明(L.W.Parks等人,CRC Critical Reviews in Microbiology,301-304,1978)。例如,由于促使酵母中对自发基因 组突变例如erg突变体(S.W.Molzahn等人,已经引述过)或者涉及独 立于甾醇途径的抗性的基因组突变发生进行选择的制霉菌素的间 接特性,这种低特异性的制霉菌素的选择作用是可预见到的。同样, 由基因文库转化的细胞可以表达能提供与甾醇途径不相关的制霉 菌素抗性的异源基因。

另一个预料中的受限制方面的实例是涉及下列事实:该异源蛋 白质在细胞中活性弱,由于例如下列原因之一而导致对制霉菌素没 有或较低抗性:1)微弱地表达编码δ-5,7甾醇,δ-7还原酶的基因 ;2)由于缺乏折叠或者由于不正确的亚细胞定位,该蛋白质是弱活 性或没有活性;3)植物蛋白质不能将酵母自身甾醇辨认为底物或者 4)可以作为底物的甾醇是酯化形式或者贮存于泡囊中并且不与酶 接触。因此,预期以这种方式积累的甾醇逃脱了δ-5,7甾醇,δ-7 还原酶的作用,在真核生物中认为该还原酶定位于微粒体中。

本发明涉及根据一种克隆方法将编码具有δ-5,7甾醇,δ-7还 原酶活性的蛋白质(命名为δ-7Red)的A.thaliana cDNA的进行克 隆,所述克隆方法是根据对制霉菌素的抗性在酵母中进行代谢干扰 来完成的。该δ-7 Red蛋白质通过一个生物还原方法使在C-7位不 饱和的甾醇被还原,另外,该蛋白质为使甾醇或类固醇(在C-5,7位 有双重不饱和位)的C-7位进行选择性还原提供了有益的解决办法, 这种选择性还原作用是采用化学途径的还原方法达不到的。

本发明还涉及表达δ-7Red的转化酵母细胞,所述酵母细胞以 令人惊奇的方式积累C-7位饱和并且C-22位饱和或不饱和的产品, 与豆甾醇相反,该产品是胆因醇侧链的限制性酶的底物即细胞色素 P450 SCC。

这些未曾预料到特性可将本发明的转化酵母用于制备具有工 业的和/或药物用途的甾醇或类固醇的方法中,尤其是通过在肾上 腺皮质还蛋白还原酶(ADR)和肾上腺皮质铁氧还蛋白(ADX)存 在下,由细胞色素P450 SCC(P450SCC)在第C-7位上使之还原而使内 源酵母甾醇发生生物氧化从而制备孕甾烯醇。还可以将本发明 的转化酵母用于制备在哺乳动物和其他脊椎动物中胆固醇转化为 氢化可的松的代谢途径的中间产物类固醇的方法中。这种应用具 有在生物氧化方法制备氢化可的松或其中间体的优点,这种方法不 需要将外源甾醇例如胆甾醇用作为起始底物,从而回避了甾醇渗透 到酵母中的问题,前面已经描述过在有氧条件下外源甾醇不具有渗 透性(R.T.Lorentz等人,J.Bacteriology,981-985,1986)。

本发明还涉及利用本发明的克隆方法获得的核酸序列的使用。 编码δ-5,7甾醇,δ-7还原酶的RNA或DNA可用于诊断或治疗涉及δ -5,7甾醇,δ-7还原酶的基因产物的疾病。例如,据推测能将7-脱 氢胆固醇转化为胆固醇的δ-5,7甾醇,δ-7还原酶的缺陷与 RSH/SLO综合症有关。因此,可将人DNA序列用作为探计,用于诊断 δ-5,7甾醇,δ-7还原酶的缺陷,并且也可用于纠正这种缺陷而进 行的基因治疗

因此,本发明的一个主题是一种核酸序列,包含有编码具δ-5 ,7甾醇,δ-7还原酶活性的蛋白质的序列,所述核酸是一种DNA或一 种RNA并且尤其是一种CDNA。

利用在实施例部分进一步描述的体外酶促检测方法例如,可以 显示δ-5,7甾醇,δ-7还原酶活性。

本发明更具体的一个方面是涉及一种cDNA序列,其中的编码序 列为具有δ-5,7甾醇,δ-7还原酶活性的A.thaliana的蛋白质编码, 并且它具有序列SEQ ID No.1的核苷酸序列: GTGTGAGTAA TTTAGGTCAA CACAGATCAG AATCTGAGGC TTTGGCCGAG ACGAAGAGAA       60 AAGCAGAAGA AGAAA ATG GCG GAG ACT GTA CAT TCT CCG ATC GTT ACT TAC       111

             Met Ala Glu Thr Val His Ser Pro Ile Val Thr Tyr

               1               5                  10 GCA TCG ATG TTA TCG CTT CTC GCC TTC TGT CCA CCT TTC GTC ATT CTC         159 Ala Ser Met Leu Ser Leu Leu Ala Phe Cys Pro Pro Phe Val Ile Leu

     15                  20                  25 CTA TGG TAC ACA ATG GTT CAT CAG GAT GGT TCT GTT ACT CAG ACC TTT         207 Leu Trp Tyr Thr Met Val His Gln Asp Gly Ser Val Thr Gln Thr Phe

 30                  35                  40 GGC TTC TTT TGG GAG AAT GGA GTT CAA GGA CTT ATC AAC ATA TGG CCA         255 Gly Phe Phe Trp Glu Asn Gly Val Gln Gly Leu Ile Asn Ile Trp Pro  45                  50                  55                  60 AGA CCC ACT TTG ATT GCT TGG AAA ATT ATA TTT TGC TAT GGA GCA TTT          303 Arg Pro Thr Leu Ile Ala Trp Lys Ile Ile Phe Cys Tyr Gly Ala Phe

             65                  70                  75 GAA GCT ATT CTT CAG CTG CTT CTG CCT GGT AAA AGA GTT GAG GGT CCA          351 Glu Ala Ile Leu Gln Leu Leu Leu Pro Gly Lye Arg Val Glu Gly Pro

         80                  85                  90 ATA TCT CCA GCC GGA AAC CGA CCA GTT TAC AAG GCC AAT GGT CTG GCT          399 Ile Ser Pro Ala Gly Asn Arg Pro Val Tyr Lys Ala Asn Gly Leu ALa

     95                 100                 105 GCT TAC TTT GTG ACA CTA GCA ACC CAT CTT GGT CTT TGG TGG TTT GGA          447 Ala Tyr Phe Val Thr Leu Ala Thr His Leu Gly Leu Trp Trp Phe Gly

110                 115                 120 ATC TTC AAC CCT GCA ATT GTC TAT GAT CAC TTG GGT GAA ATA TTT TCG          495 Ile Phe Asn Pro Ala Ile Val Tyr Asp His Leu Gly Glu Ile Phe Ser 125                 130                 135                 140 GCA CTA ATA TTC GGA AGC TTC ATA TTT TGT GTT TTG TTG TAC ATA AAA          543 Ala Leu Ile Phe Gly Ser Phe Ile Phe Cys Val Leu Leu Tyr Ile Lys

            145                 150                 155 GGC CAT GTT GCA CCT TCA TCA AGT GAC TCT GGT TCA TGT GGT AAC CTA          591 Gly His Val Ala Pro Ser Ser Ser Asp Ser Gly Ser Cys Gly Asn Leu

        160                 165                 170 ATA ATT GAC TTC TAT TGG GGC ATG GAG TTG TAC CCT CGA ATT GGT AAG          639 Ile Ile Asp Phe Tyr Trp Gly Met Glu Leu Tyr Pro Arg Ile Gly Lys

    175                 180                 185 AGC TTT GAC ATC AAG GTG TTT ACT AAT TGC AGA TTC GGA ATG ATG TCT          687 Ser Phe Asp Ile Lys Val Phe Thr Asn Cys Arg Phe Gly Met Met Ser

190                 195                 200 TGG GCA GTT CTT GCA GTC ACG TAC TGC ATA AAA CAG TAT GAA ATA AAT          735 Trp Ala Val Leu Ala Val Thr Tyr Cys Ile Lys Gln Tyr Glu Ile Asn 205                 210                 215                 220 GGC AAA GTA TCT GAT TCA ATG CTG GTG AAC ACC ATC CTG ATG CTG GTG         783 Gly Lys Val Ser Asp Ser Met Leu Val Asn Thr Ile Leu Met Leu Val

            225                 230                 235 TAT GTC ACA AAA TTC TTC TGG TGG GAA GCT GGT TAT TGG AAC ACC ATG         831 Tyr Val Thr Lys Phe Phe Trp Trp Glu Ala Gly Tyr Trp Asn Thr Met

        240                 245                 250 GAC ATT GCA CAT GAC CGA GCT GGA TTC TAT ATA TGC TGG GGT TGT CTA         879 Asp Ile Ala His Asp Arg Ala Gly Phe Tyr Ile Cys Trp Gly Cys Leu

    255                 260                 265 GTG TGG GTG CCT TCT GTC TAC ACT TCT CCA GGC ATG TAC CTT GTG AAC         927 Val Trp Val Pro Ser Val Tyr Thr Ser Pro Gly Met Tyr Leu Val Asn

270                 275                 280 CAC CCC GTC GAA CTC GGA ACT CAG TTG GCA ATA TAC ATT CTC GTT GCA         975 His Pro Val Glu Leu Gly Thr Gln Leu Ala Ile Tyr Ile Leu Val Ala 285                 290                 295                 300 GGA ATT CTG TGC ATT TAC ATA AAG TAT GAC TGT GAT AGA CAA AGG CAA        1023 Gly Ile Leu Cys Ile Tyr Ile Lys Tyr Asp Cys Asp Arg Gln Arg Gln

            305                 310                 315 GAG TTC AGG AGG ACA AAC GGG AAA TGT TTG GTT TGG GGA AGA GCC CCG        1071 Glu Phe Arg Arg Thr Asn Gly Lys Cys Leu Val Trp Gly Arg Ala Pro

        320                 325                 330 TCA AAG ATT GTG GCG TCG TAT ACT ACA ACA TCT GGT GAA ACT AAA ACT        1119 Ser Lys Ile Val Ala Ser Tyr Thr Thr Thr Ser Gly Glu Thr Lys Thr

    335                 340                 345 AGT CTT CTC TTA ACG TCT GGA TGG TGG GGA TTG GCT CGT CAT TTC CAT        1167 Ser Leu Leu Leu Thr Ser Gly Trp Trp Gly Leu Ala Arg His Phe His

350                 355                 360 TAT GTT CCT GAG ATC TTA AGT GCT TTC TTC TGG ACC GTA CCG GCT CTC        1215 Tyr Val Pro Glu Ile Leu Ser Ala Phe Phe Trp Thr Val Pro Ala Leu 365                 370                 375                 380 TTC GAT AAC TTC TTG GCA TAC TTC TAC GTC CTC ACC CTT CTT CTC TTT        1263 Phe Asp Ash Phe Leu Ala Tyr Phe Tyr Val Leu Thr Leu Leu Leu Phe

            385                 390                 395 GAT CGA GCC AAG AGA GAC GAT GAC CGA TGC CGA TCA AAG TAT GGG AAA       1311 Asp Arg Ala Lys Arg Asp Asp Asp Arg Cys Arg Ser Lys Tyr Gly Lys

        400                 405                 410 TAT TGG AAG CTG TAT TGT GAG AAA GTC AAA TAC AGG ATC ATT CCG GGA       1359 Tyr Trp Lys Leu Tyr Cys Glu Lys Val Lys Tyr Arg Ile Ile Pro Gly

    415                 420                 425 ATT TAT TGATTGTAAC GAAGTCTGTT GTTCTCATTT TCTACTTATT ACGTTAATTC        1415 Ile Tyr

430 GAACGTTGGA ATCATCAAAA GACCGAGCCA AAACAAAAAT GCAAATTGAT GCGATAGACA     1475 TTCTTTTGCT GAAAAAAAAA A                                               1496 以及该序列的等位变异体。

编码具有相应于图3中所示序列(SEQ ID NO:2)的430个基酸 的蛋白质的上述cDNA序列是一种cDNA序列,按照在下文中进一步详 细描述的操作条件,利用基于酵母对制霉菌素的抗性出现进行的筛 选方法,从A.thaliana表达文库开始在酵母中进行克隆可以获得该 cDNA序列。

知道了上述的核苷酸序列SEQ ID NO:1,采用本领域内技术人 员已知的方法,例如采用化学合成法或者利用合成的寡核苷酸探针 以及杂交技术筛选基因文库或cDNA文库或者采用PCR扩增。可以重 复本发明。

本发明还有一个主题是涉及编码具有δ-5,7甾醇,δ-7还原酶 活性的蛋白质的DNA序列,该DNA序列在中等或者高度严紧条件下与 SEQ ID NO:1的核苷酸序列杂交或者这两个序列有约60%或者更多 的序列相同性。

在中等严紧的标准条件下,例如在50%甲酰胺SSC×6溶液中 ,42℃杂交12小时,随后进行洗涤或者在低严谨性条件下,例如在 20%甲酰胺,SSC×6溶液中,于42℃杂交24小时,随后在已知标准条 件下进行洗涤(T.Maniatis等人,Molecular Cloning,Cold Spring Harbor Laboratory Press,1989)能够以一种可检测方式 将上述所述序列与SEQ ID NO.1序列进行杂交。

利用例如BLAST程序"basic local alignment search tool" (S.F.Altschul等人,J.Mol.Biol.,215,403-410,1990)在NCBI辅助 器上测出核苷酸序列等同性的百分数。

本发明还涉及编码具有δ-5,7甾醇,δ-7还原酶活性的蛋白质 的DNA序列,并且采用PCR技术,利用编码具有SEQ ID NO:3氨基酸序 列的共有序列的寡核苷酸作为引物可扩增该DNA序列:  Leu Leu Xaa Xaa Gly Trp Xaa Gly Xaa Xaa Arg Xaa Xaa  1               5                   10 Xaa Tyr

15 其中7位的Xaa是Trp或者Tyr并且第12位的Xaa是His或者Lys。

上述SEQ ID NO.3序列对应于一种新的共有序列,通过对从 SEQ ID NO.1核苷酸序列推测出的新序列SEQ ID NO.2与编码在除 C-7位以外的一个位置上具有持异性作用的其他甾醇还原酶或者编 码lamin B受体的已知序列之间的氨基酸序列等同性进行排列,已 经对该新的共有序列进行了限定,在实施例部分对该步骤将作详细 描述。根据氨基酸序列SEQ ID NO.3给出的信息,可以定义并合成 至多由45个核苷酸组成的引物,利用该引物,并与作为返回序列的 第二种引物寡聚dT(17个核苷酸)结合一起,可以用商业途径购买的 PCR检测药盒(例如Stratagene),对编码具δ-5,7甾醇,δ-7还原酶 活性的蛋白质的DNA进行扩增。

本发明还涉及具有δ-5,7甾醇,δ-7还原酶活性并且具有SEQ ID NO:2的氨基酸序列的A.thaliana蛋白质: Met Ala Glu Thr Val His Ser Pro Ile Val Thr Tyr Ala Ser Met Leu   1               5                  10                  15 Ser Leu Leu Ala Phe Cys Pro Pro Phe Val Ile Leu Leu Trp Tyr Thr

         20                  25                  30 Met Val His Gln Asp Gly Ser Val Thr Gln Thr Phe Gly Phe Phe Trp

     35                  40                  45 Glu Asn Gly Val Gln Gly Leu Ile Asn Ile Trp Pro Arg Pro Thr Leu

 50                  55                  60 Ile Ala Trp Lys Ile Ile Phe Cys Tyr Gly Ala Phe Glu Ala Ile Leu  65                  70                  75                  80 Gln Leu Leu Leu Pro Gly Lys Arg Val Glu Gly Pro Ile Ser Pro Ala

             85                  90                  95 Gly Asn Arg Pro Val Tyr Lys Ala Asn Gly Leu Ala Ala Tyr Phe Val

        100                 105                 110 Thr Leu Ala Thr His Leu Gly Leu Trp Trp Phe Gly Ile Phe Asn Pro

    115                 120                 125 Ala Ile Val Tyr Asp His Leu Gly Glu Ile Phe Ser Ala Leu Ile Phe

130                 135                 140 Gly Ser Phe Ile Phe Cys Val Leu Leu Tyr Ile Lys Gly His Val Ala 145                 150                 155                 160 Pro Ser Ser Ser Asp Ser Gly Ser Cys Gly Ash Leu Ile Ile Asp Phe

            165                 170                 175 Tyr Trp Gly Met Glu Leu Tyr Pro Arg Ile Gly Lys Ser Phe Asp Ile

        180                 185                 190 Lys Val Phe Thr Asn Cys Arg Phe Gly Met Met Ser Trp Ala Val Leu

    195                 200                 205 Ala Val Thr Tyr Cys Ile Lys Gln Tyr Glu Ile Asn Gly Lys Val Ser

210                 215                 220 Asp Ser Met Leu Val Asn Thr Ile Leu Met Leu Val Tyr Val Thr Lys 225                 230                 235                 240 Phe Phe Trp Trp Glu Ala Gly Tyr Trp Asn Thr Met Asp Ile Ala His

            245                 250                 255 Asp Arg Ala Gly Phe Tyr Ile Cys Trp Gly Cys Leu Val Trp Val Pro

        260                 265                 270 Ser Val Tyr Thr Ser Pro Gly Met Tyr Leu Val Asn His Pro Val Glu

    275                 280                 285 Leu Gly Thr Gln Leu Ala Ile Tyr Ile Leu Val Ala Gly Ile Leu Cys

290                 295                 300 Ile Tyr Ile Lys Tyr Asp Cys Asp Arg Gln Arg Gln Glu Phe Arg Arg 305                 310                 315                 320   Thr Asn Gly Lys Cys Leu Val Trp Gly Arg Ala Pro Ser Lys Ile Val

            325                 330                 335 Ala Ser Tyr Thr Thr Thr Ser Gly Glu Thr Lys Thr Ser Leu Leu Leu

        340                 345                 350 Thr Ser Gly Trp Trp Gly Leu Ala Arg His Phe His Tyr Val Pro Glu

    355                 360                 365 Ile Leu Ser Ala Phe Phe Trp Thr Val Pro Ala Leu Phe Asp Asn Phe

370                 375                 380 Leu Ala Tyr Phe Tyr Val Leu Thr Leu Leu Leu Phe Asp Arg Ala Lys 385                 390                 395                 400 Arg Asp Asp Asp Arg Cys Arg Ser Lys Tyr Gly Lys Tyr Trp Lys Leu

            405                 410                 415 Tyr Cys Glu Lys Val Lys Tyr Arg Ile Ile Pro Gly Ile Tyr

        420                 425                 430 以及该序列的等位变异体和类似物。

对于等位体和类似物,包括通过取代,缺失或增加一或多个氨 基酸而修饰得到的序列,只要这些产物保留了相同的功能。利用本 领域内已知的位点特异性诱变技术例如可以制备这些修饰序列。

本发明的一个特定方面是具有δ-5,7甾醇δ-7还原酶活性并 且具有上述的SEQ ID NO.2氨基酸序列的A.thaliana蛋白质并且命 名为δ-7Red。

本发明还涉及具有δ-5,7甾醇,δ-7还原酶活性的蛋白质,该 蛋白质的氨基酸序列与SEQ ID NO.2序列具有约60%和更多的序列 等同性。

利用上面指出的BLAST程序例如可以测出等同性百分数。

本发明还涉及具有δ-5,7甾醇,δ-7还原酶活性以及与上文中 定义的A.thaliana δ-7 Red蛋白质具有交叉免疫反应性的蛋白质。

例如利用根据已知方法制备的针对δ-7Red蛋白质的抗血清, 以及免疫沉淀方法可以检测到该蛋白质。

本发明的一个方面涉及具有δ-5,7甾醇,δ-7还原酶活性的蛋 白质例如通过在含有前面定义的DNA序列的宿主细胞中表达而获得 的蛋白质,本发明具体涉及A.thaliana蛋白质,例如通过在含有编 码上述SEQ ID NO.2的氨基酸序列的DNA序列的宿主细胞中表达而 获得的蛋白质。

当在宿主细胞表达而获得本发明蛋白质时,可根据本领域内技 术人员熟知的遗传工程方法和细胞培养方法来完成。

表达可以在原核宿主细胞,例如大肠杆菌或在真核宿主细胞例 如哺乳动物细胞,昆虫细胞或酵母中完成,所述宿主含有前面有合 适启动子的编码本发明的δ-7Red的序列。

所获得的重组蛋白可以是糖基化的或非糖基化的。

具体地讲本发明涉及根据本发明得到的蛋白质,例如通过在酵 母细胞中表达获得的。

本发明还涉及针对前面定义的具有δ-5,7甾醇,δ-7还原酶活 性的蛋白质的抗体。该抗体可以是根据本领域内技术人员熟知的 方法制备的一种多克隆或单克隆抗体。

本发明还涉及含有前面定义的DNA序列的表达载体以及涉及由 该载体转化的宿主细胞。

表达载体是允许蛋白质在合适载体控制下进行表达的已知载 体。对于原核细胞,启动子可以是例如lac启动子,trp启动子,tac 启动子,β-内酰胺酶启动子或pl启动子。对于哺乳动物细胞,启动 子可以是SV40启动子或腺病毒的启动子。杆状病毒型载体也可用 于在昆虫细胞中进行表达。对于酵母细胞细胞该启动子可以是例 如PGK启动子,ADH启动子,CYC1启动子或GAL10/CYC1启动子。

宿主细胞可以是原核细胞或真核细胞。原核细胞例如有大肠 杆菌,芽孢杆菌或链霉菌,原核宿主细胞包括酵母和丝状真菌以及 更高等生物细胞,例如哺乳动物细胞或昆虫细胞。哺乳动物细胞可 以是仓鼠CHO细胞或猴COS细胞。昆虫细胞可以是例如SF9细胞。酵 母细胞可以是例如酿酒酵母细胞,Schizosaccharomyces pombe或 Kluyveromyces lactis

本发明的又一主题是在微生物中克隆编码具有δ-5,7甾醇,δ -7还原酶活性的蛋白质的核酸的克隆方法,该方法包括一种筛选方 法,该筛选方法用于选择

-对制霉菌素或一种类似化合物具抗性的微生物,所述化合物 的毒性依赖于在C-7位携带不饱和键的甾醇的存在而定,

克隆方法还包括

-将该核酸与上述SEQ ID NO.1的核苷酸序列进行杂交,

-利用数据处理技术从随机分离到的DNA序列鉴别出该核酸,

-直接表达该蛋白质,随后用针对具有上述SEQ ID NO.2氨基酸 序列的蛋白质的抗体进行免疫检测。

所述微生物是指一种酵母例如酿酒酵母S.pombe或K.laetis.

类似于制霉菌素的化合物包括例如两性霉素B或菲律宾菌素。

所述杂交是指在中等或高度严紧条件下根据已知标准方法(T .Maniatis等人,已经引述)进行的杂交。

根据上面说明的BLAST程序例如可以完成利用数据处理技术进 行鉴别。

在实施例部分进一步描述了上面所述克隆方法的一个实例,其 中的筛选方法使用了对制霉菌素具抗性的酵母。

本发明的一个主题还包括采用上面克隆方法获得的DNA或RNA 核酸序列。核酸序列可根据完成克隆所取材料而分为原核或真核 来源例如来源于人类。

本发明的一个方面还涉及用含有经上述克隆方法得到之DNA序 列的载体而转化的宿主细胞,宿主细胞可以是原核细胞或真核细胞。 前文已列举了宿主细胞和载体的实例。

本发明的一个方面还特别涉及由载体转化的选自酵母或丝状 真菌的宿主细胞,所述载体含有本发明上文所定义的DNA序列或用 上述克隆方法得到的DNA序列。

本发明一个方面也涉及具有δ-5,7甾醇,δ-7还原酶活性的蛋 白质的制备方法,其中包括培养本发明的转化宿主细胞,并且分离 表达的蛋白质,本发明特别涉及其中所用宿主细胞为一种转化酵母 的方法,在该宿主细胞中DNA序列处于酵母启动子控制之下。

本发明的另一方面涉及在C-7位上不饱和的甾醇的体外还原方 法,其中包括将待还原的甾醇与上述方法获得的蛋白质进行保温, 并且选择性包括分离获得被还原甾醇的步骤。

本发明一个方面还涉及在C-7位不饱和的外源甾醇的体内还原 方法,该方法包括将甾醇与本发明所述转化酵母细胞一起保温,并 且可选择性地采用分离被还原甾醇的步骤,宿主细胞可以是原核细 胞或真核细胞,尤其是酵母或丝状真菌。

本发明的一个方面还涉及在C-7位不饱和的内源甾醇的体内还 原方法,其中培养选自于酵母或丝状真菌的本发明所述转化宿主菌 株,并且选择性地采用分离所积累的还原所得甾醇的步骤。

具体地说,本发明涉及上述定义的体外或体内还原方法,其中 所获得的被还原的甾醇是胆固醇侧链限制性酶的底物(P450 SCC) 并且本发明尤其是涉及体内还原方法,其中待还原的内源甾醇是麦 角甾5,7二烯3-醇,麦角甾5,7,24(28)三烯3-醇或者麦角甾5,7,22 三烯3 -醇或者它们的混和物。

本发明的一个方面还涉及孕甾烯醇酮的生产方法,其中包括将 选自于酵母或丝状真菌的本发明所述转化宿主细胞进行培养,将在 C-7位被还原的被积累的内源甾醇或类固醇进行分离或不分离,在 P450SCC存在,并且有或没有肾上腺皮质激素还原酶(ADR)以及肾 上腺皮质激素(ADX)存在下保温被还原的甾醇,并且分离或不分离 获得的孕甾烯醇酮。

本发明的一个特定方面是生产上文中定义的孕甾烯醇酮的方 法,其中宿主细胞是酵母。

本发明还涉及孕甾烯醇酮的生产方法,其中将由一个或多个载 体转化的酵母进行培养,所述载体允许具有δ-5,7甾醇,δ-7还原 酶活性的蛋白质以及P450SCC以及有或没有ADR和ADX一起共表达, 对游离或酯化的孕甾烯醇酮进行分离或不分离。

本发明特别涉及上述方法,在该方法中将具有δ-5,7甾醇,δ -7还原酶活性的蛋白质,P450SCC,ADR和ADX进行共表达的转化酵母 进行培养,更具体地涉及这样的方法,其中具有δ-5,7甾醇δ-7还 原酶活性的蛋白质是A.thaliana δ-7 Red的蛋白质,并更进一步 涉及其中酵母菌株是ECO1/PCD63的菌株的上述方法。

在实施例部分进一步给出了本发明所述孕甾烯醇酮的生产的 实施例。

用于实施孕甾烯醇酮生产方法的转化酵母可以是例如由本发 明表达载体以及细胞色素P450SCC和包括或不包括ADX和ADR的表 达载体共转化的酵母,所述表达载体含有编码具有δ-5,7甾醇,δ -7还原酶活性之蛋白质的DNA序列。细胞色素P450SCC和/或ADX的 表达载体是已知的并且其制备描述于例如欧洲专利申请EP0340878 以及进一步可参见实施例部分描述。

所使用的转化酵母还可以是一种酵母,其中编码具有δ-5,7甾 醇,δ-7还原酶活性的蛋白质的DNA序列整合到基因组特定位点,例 如在ADE2位点,并且麦角甾醇不再是在δ-7还原酶表达条件下的主 要甾醇。然后用整合性表达盒或由表达载体转化获得的"整合"酵 母,所述表达载体含有编码细胞色素P450SCC并且包括或不包括ADX 和ADR的DNA序列。

在实施例部分进一步给出了构建体内生产孕甾烯醇酮或其乙 酸酯的酵母菌株的实施例。

因此本发明主题还包括转化酵母菌株,它能共表达具有δ-5,7 甾醇δ-7还原酶活性的蛋白质,P450SCC,ADR和ADX并且积累游离或 酯化孕甾烯醇酮,本发明特别包括这样的上述酵母菌株,其中具有 δ-5,7甾醇δ-7还原酶活性的蛋白质是A.thaliana δ-7 Red蛋白 质以及具体涉及称为ECO1/PCD63酵母菌株,其精确结构进一步描述 于实施例部分。

本发明还延伸到根据上文中定义的克隆方法获得的人DNA序列, 利用该序列作为探针可用于诊断δ-5,7甾醇,δ-7还原酶的先天性 缺陷。δ-5,7甾醇,δ-7还原酶的缺陷包括例如7-脱氢胆固醇还原 酶的缺陷,该酶的缺陷是导致血浆中胆固醇含量异常低的原因。

本发明还涉及检测δ-5,7甾醇,δ-7还原酶缺陷的方法,该方 法包括在标准杂交条件下将含有人基因组DNA的样品与上文中定义 的探针一起保温,并且展现出该探针是否与基因组DNA固定,如果后 者没有被固定或还原,表明δ-5,7甾醇,δ-7还原酶先天性缺陷。

本发明方法还可用于例如检测胎儿期或新生儿以及患有各种 疾病的病人尤其是具有RSH/SLO综合症临床表现的患者的δ-5,7甾 醇,δ-7还原酶的先天缺陷。

附图描述了发明的特定方面:

图1表示从对制霉菌素具抗性的F22克隆提取到的总甾醇的概 况,所述克隆是通过从FY1679酵母中筛选A.thaliana文库获得的。 在205nm或在285nm处进行RP-HPLC(图1A)或者与未转化酵母FY1679 比较GC(图1B)可完成上述分析。

图2描述了pF22质粒的NotI片段的限制性图谱以及测序方案。

图3描述了cDNAδ-7Red的核苷酸序列(SEQ ID NO.1)以及相 应的氨基酸序列(SEQ ID NO.2)。

图4描述了用诱导型表达载体"δ-7/V8"转化的FY1679的微粒 体部分的δ-5,7甾醇δ-7还原酶活性的体外检测。分析是采用GC 进行的,并且证明在内源甾醇5,22二烯3-醇(RT=16.682);麦角甾醇 (RT=17.249);麦角甾5-烯3-醇(RT=17.664)存在下底物7-脱氢胆固 醇(RT=16.528)转化为胆固醇(RT=15.887)。

图5描述了孕甾烷酮醇的体外制备,即通过将从表达δ-7Red的 转化酵母纯化到的麦角甾5-烯3-醇(图5A);麦角甾5,24(28)二烯3- 醇(5B)或麦角甾5,22二烯3-醇(5C)进行限制,然后与P450SCC,ADX 和ADR一起保温而制备。通过与作为对照限制的胆固醇比较GC而进 行分析。

图6描述了整合性质粒PADδ-7的构建,该质粒允许编码δ -7Red(甾醇δ-7还原酶)的cDNA整合到ADE2位点。

图7描述通过将在半乳糖存在下培养的FY1679菌株和ELR01整 合菌株进行皂化而提取到的总甾醇的GC进行分析结果。

图8是穿梭载体大肠杆菌-酿酒酵母V13的构建示意图,该载体 在多克隆位点中含有单一的SalI(Sa)位点。

图9表示整合质粒pCD62-1和pCD62-2的构建过程,这两质粒允 许ADR表达盒插入到leu 2基因和Spl1δ基因的基因间隔区。 MCS1和MCS2:多克隆位点

图10表示CDRO1菌株的构建方案。

图11表示含有两个表达盒ADX和P450SCC的PCD63表达质粒的构 建过程。

图12表示对甾醇的GC进行的分析,所述甾醇是从用半乳糖诱导 9小时(图12a)或24小时(图12b)之后的EC01/PCD63菌株分离到的细 胞(细胞裂解液)或培养基(介质)提取的。

图13表示pTG7457质粒的结构。

图14表示pTG7453质粒的结构。

图15表示pTG10014质粒的结构。

图16表示pTG10004质粒的结构。

图17表示pTG10031质粒的结构。

图18表示pTG10033质粒的结构。

下列实施例是用于描述发明而不是用于限制。

实施例1

编码A.thaliana的δ-5,7甾醇,δ-7还原酶(δ-7Red)的CDNA 的克隆

A.-在酵母中筛选A.thaliana表达文库

起始cDNA表达文库是由M.Minet等人(Plant J.,2,417-422 ,1992)描述的文库,该文库是从二片子叶发芽期的A.thaliana的 mRNA制备的,并且其两为NotI位点的CDNA已被插入到穿梭载体大 肠杆菌/酿酒酵母PFL61的表达盒的Bst XI位点。该表达盒含有磷 酸甘油酸激酶基因(PGK)的启动子和终止序列。酵母的复制原点来 源于2u序列,并且有一个选择指示信号URA3保证载体在酵母中繁殖 。该载体在大肠杆菌中繁殖是源自于pUC19质粒。

利用由D.Gietz等人描述的乙酸锂方法(Nucleic Acids Res. ,20,1425,1992)由CDNA文库转化FY1679酵母菌株(Mata),该菌株是 由A,Thierry等人描述的S288C菌株的等基因菌株(Yeast,6,521 -534,1990)。

在含有7克/升的"酵母氮源"(Difco),1克/升的细菌酪蛋白氨 基酸(Difco),20克/升葡萄糖,20mg/升的色氨酸并且不含尿嘧啶的 SGI合成培养基平板上培养细胞。然后将获得的105个尿嘧啶原养 型转化体分组并在相同的无尿嘧啶并含有2或5μg/ml制霉菌素的 合成培养基平板上以每平皿5×104个细胞的比例进行培养。以这 种方式对每个制霉菌素浓度筛查106个转化体。在28℃培养3天之 后,以5个克隆为一组收集大约100个在2μg/ml制霉菌素浓度生长 的克隆,采用反相高效液相色谱(在下文中称为RP-HPLC)分析这些 克隆的甾醇组分,而在浓度为5μg/ml的制霉菌素时获得了称为 F22的单个抗性克隆。

B.-分析在F22克隆中积累的甾醇

根据L.Parks等人描述的碱性皂化方法(Methods in Enzymol ,111,333-346,1985)制备酵母的总甾醇,然后采用RP-HPLC和/或采 用气相色谱(称为GC)进行分析。

将获得的甾醇残基溶于乙醇-四氢呋喃-混合物(65∶10 ∶25V/V)中,然后采用RP-HPLC方法在Applied Biosystems C18键合 的二氧化柱(100×2.1mm)上以1ml/分钟的流速以及在55℃和利用 溶于水中的甲醇的线性梯度(50%-100%,经18分钟)对此混合物进行 分析,在205nm和285nm处检测光密度值,并与麦角甾醇,油菜甾醇和 胆固醇标准物进行比较。

在Alltech SE-30毛细管柱(30m×0.32mm)上用氦作为载体气 体,对于注射器和检测器温度分别为280℃和310℃,在起始时温度 从110℃增加到245℃时增加速度为45℃/分钟,然后增加速度为3℃ /分钟以至达到280℃,再对甾醇组合物的GC进行分析。

根据RP-HPLC分析(图1A)以及根据GC分析(图1B)显示了上面获 得的F22克隆中积累甾醇的概况,其特征为在非转化菌株FY1679中 的主要甾醇麦角甾醇实质上完全消失,并由两种主要甾醇以相同的 量取代,它们在285nm处没有吸收峰,因而根据RP-HPLC分析,获得的 甾醇不再具有共轭的双不饱和键。

在图1A中,油菜甾醇(Sigma)(24-R-麦角甾-5-烯-3-醇)含有 大约35%的二氢芸苔属甾醇(24-S-麦角甾5-烯-3-醇)。

C-δ-7Red CDNA的克隆

根据J.N.Strathern等人描述的方法(Methods in Enzymol. ,194,319-329,1991),在大肠杆菌中扩增源自于F22克隆的质粒,然 后用NotI进行消化。获得约600碱基对(bp)的片段以及1.6kbp的 片段。分别用上面各个片段转化FY1679菌株。按照上面指示的方 法对转化酵母的各个克隆的甾醇的组分进行分析,并且辨别出携带 有对甾醇的修饰情况起作用的基因的质粒。以这种方式鉴别出的 质粒称为PF22。

D-δ-7Red的CDNA序列的测定

将pF22的CDNA插入物再克隆到来源于PUC9(pharmacia)的 PUC9N载体的NotI位点,该载体中多克隆位点中的EcoRI位点被插 入的NotI限制性位点所替代,但保留了Lacz基因的阅读框架。然 后测出限制性图谱(图2)。

将分别含有NotI外来位点以及EcoRI,Pvu II或HindIII内源位 点的限制性片段亚克隆到pBluescript质粒(Stratagene)上。利用 PBluescript PUC9,T3和T7的直接和反向引物或者推导出的CDNA核 苷酸序列的特异引物,根据Sanger方法以及DNA聚合酶测序酶 (Stratagene药盒),在两条链上测定核苷酸序列。

所获得所有序列汇编代表A.thaliana的δ-7Red CDNA核苷酸 序列(SEQ ID NO.1),其序列列于图3中。该序列含有1496个核苷酸 ,其末端含有一个多聚腺苷酸序列。该序列有一个开放式阅读框架 ,该框架起始于第76核苷酸的甲硫氨酸起始密码子,结束于第1366 位核苷酸的终止密码子。这样该开放式阅读框架具有1290个核苷 酸,编码含有430个氨基酸的蛋白质。编码δ-7Red蛋白质的δ -7Red CDNA的编码区,及其推测出的氨基酸序列(SEQ ID NO.2)显 示于图3中。该蛋白质序列包括430个氨基酸胺,它具有计算出的分 子质量为49.286 KDa。

含有位于载体PUC9N中的δ-7 Red CDNA(命名为δ7 Red/ PUC9N CDNA)的大肠杆菌DH5-1菌株的样本于1995年2月10日寄存于 CNCM,寄存号为I-1535。

E-共有序列SEQ ID NO.3的测定

利用序列数据库(Genbank和EMBL)进行计算机检索,已经证 明A.thaliana的δ-7 Red蛋白质的序列与其他甾醇还原酶具有某 些序列相似性,尤其是与由R.T.Lorentz等人(DNA Ceu Biol.,11 ,685-692,1992)以及W.Chen等人(Yeast,7,305-308,1991)分别描 述的酿酒酵母的甾醇C-14还原酶以及甾醇C-24(28)还原酶,以及由 M.Shimanuki等人(Mol.Biol,Cell,3,263-273,1992)描述的S .Pombe的sts 1+基因的产物以及Neurospora crassa的甾醇C-14还 原酶(在EMBL数据库中为NO.X77955)。另外,δ-7Red蛋白质与由H .J.Worman等人(J.Cell Biol.,111,1535-1542,1990)以及E .Schuler等人(J.Biol.Chem.,269,11312-11317,1994)描述的鸡野 芝麻花碱B受体的C末端的400个氨基酸以及人受体的相应区域都具 有相似性。

在由上面获得的δ-7Red cDNA推导出的SEQ ID NO.2氨基酸序 列和三个酵母甾醇还原酶以及两个野芝麻花碱B受体的氨基酸序列 进行序列等同性排列,然后为了制备寡核苷酸,定义了一个具有下 列氨基酸序列的新的共有序列(SEQ ID NO.3): Leu Leu Xaa Xaa Gly Trp Xaa Gly Xaa Xaa Arg Xaa Xaa Xaa 1               5                   10 Tyr 15 其中第7位上的Xaa是Trp或Tyr以及第12位上的Xaa是His或者Lys, 所制备的寡核苷酸可在PCR中用作为引物用于扩增编码具δ-5,7甾 醇,δ-7还原酶活性的蛋白质的新的基因组DNA或cDNA序列。

F-δ-7Red蛋白质在酵母中的表达 a)在酵母中构建诱导型表达载体δ-7/V8

利用下面特定寡核苷酸通过PCR扩增将PF22的CDNA的非编码区缺 失:  5′CGCGGATCCA TGGCGGAGAC TGTACATTC 3′(SEQ ID No.4)和  5′CAGGGTACCT CAATAAATTC CCGGAATG 3′(SEQ ID No.5) 定义这些寡核苷酸是为了在紧接起始密码子的上游导入一个Bam HI限制性位点,并且在紧挨终止密码子的下游导入一个KpnI位点。

在2个单位的Pfu DNA聚合酶以及0.2μM的每个上述各种引物 存在下,利用下面扩增条件:94℃,10秒;52℃,50秒;74℃,90秒;从1ng 的"δ-7Red/pUC9N cDNA"质粒开始将该cDNA用Stratagene PCR药盒 扩增33个循环。

结果获得了约1300bp的片段,然后用限制性酶BamHI和KpnI进 行消化并插入到C.Cullin等人(Gene,65,203-217,1988)描述的大 肠杆菌/酿酒酵母pYeDP1/8-2穿梭载体(称为V8)的BamHI和KpnI位 点。V8携带了选择性指示剂URA3并且含有适用于酵母的表达盒,该 表达盒含有启动子GAL10/CYC1以及PGK基因的终止序列。由此获得 的载体称为δ-7/V8,该载体可在半乳糖诱导时表达δ-7Red蛋白质。 b)δ-7Red蛋白质的生产

采用D.Gietz等人描述的乙酸锂方法(已经引述过)用上述得到 的δ-7/V8质粒转化酵母菌株FY1679(Mata)。

在上面描述的SGI选择性培养基(但是其中葡萄糖浓度为5克/ 升)上,于27℃将转化酵母进行培养,直到获得细胞密度达饱和 (oD600nm=12)。然后通过加入1倍体积的完全培养基YP(酵母提取物 10克/升(Difco)并且细菌用蛋白胨(Difco)10克/升),然后加入作 为源的乙醇(1.5%V/V)而将该培养物稀释,当生长至细胞浓度至 少为7×107个细胞/ml时,加入浓度为20克/升的半乳糖而诱导δ -7Red的表达。

在SLI选择性基本培养基上,培养至细胞浓度为2×107个细胞 /ml时也可以实施诱导,该SLI培养基相当于SGI培养基,但其中由半 乳糖(20克/升)取代葡萄糖。 c)δ-5,7甾醇,δ-7还原酶活性的体外酶促检测

利用M.Taton等人描述的酶促检测法(Biochem.Bioph.Res .Commun,181,465-473,1991)但没有利用NADPH再生系统,而是用上 面描述的被诱导酵母的微粒体或胞液细胞制剂可以证明δ-7 Red 蛋白质的表达。

将被诱导的细胞进行机械破碎可以获得细胞的各个组分,并且 采用由P.Urban等人描述的方法(Eur.J.Biochem.222,843-850 ,1994)进行超离心将各个部分分离。收集细胞,然后用TE-Kcl缓冲 液(50mM Tris-Hcl,pH7.4;1mM EDTA,0.1MKcl)洗涤两次,并且重悬 于0.6MTE-山梨醇裂解缓冲液中。加入直径为0.45-0.5mm(Braun) 的玻璃珠,直到显示玻璃珠穿过细胞悬液表面,然后在4℃搅拌5分 钟。将表面的细胞裂解液集合在一起,用裂解缓冲液将玻璃珠洗三 次。将裂解液和洗液混合,然后在4℃以20,000g离心13分钟,以便 去除线粒体部分。将收集到的上清液于4℃以100,000g离心1小时。 单独收集含有微粒体部分的团丸以及代表胞质部分的上清液。

将由此获得的微粒体部分或胞质部分分别在100mM Tris/Hcl缓冲液,pH7.3,37℃,以及在2mM NADPH存在下保温90分钟,所述缓 冲液含有用吐温-80(1.5g/l)乳化的150μm的7-脱氢胆固醇作为底 物。通过加入3倍体积的甲醇-二氯甲烷混合物(50∶50,V/V)提取甾 醇,然后与标准产物进行GC比较分析。    

由上述FY1679酵母获得的微粒体部分(3.5mg/ml蛋白质)将7- 脱氢胆固醇(RT-16.528分钟)转化成的胆固醇(RT=15.887分钟)显 示于图4中,所述FY1679酵母已用δ-7/V8载体转化并且被诱导了3 小时,其内源甾醇具有较高的滞留时间(对于麦角甾5-22二烯3-醇 其RT=16.682;对于麦角甾醇其RT=17.249分钟并且对于麦角甾5-烯 3-醇其RT=17.664分钟)。

这些结果证明该转化酵母一方面表达δ-7Red蛋白质,另一方 面具有δ-5,7甾醇,δ-7还原酶活性。

实施例2:在C-7位不饱和的酵母的内源性甾醇的体内还原

用实施例1中获得的δ-7/V8载体转化酵母菌株,该菌株的主要 甾醇在C-5,7位上具有一个双键,然后按实施例1所述将该菌株培养 并诱导。提取内源甾醇,分析其GC概况,并按实施例1所述,利用制 备性C18柱(100×4.6mm)采用RP-HPLC进行纯化,然后根据IR,UV,MS 和NMR进行鉴别。分别使用下面三个菌株:

-实施例1中描述的FY1679菌株;

-突变菌株erg5,称为PLC1051,其特征在于缺失了甾醇C-22去饱 和酶,通过FY1679菌株和S.W.Molzahn等人描述的原始菌株pol5(J .Gen.Microbiol.,72,339-348,1972)之间进行杂交可以构建该菌 株,该菌株积累麦角甾5,7-二烯3-醇。

-双重突变菌株erg4,5,称为PLC1451,其特征在于缺失甾醇C -22去饱和酶(erg5)以及甾醇C-24(28)还原酶(erg4),通过将 FY1679菌株与由S.W.Molzahn等人(已经引证)描述pol5菌株进行杂 交可获得该突变菌株,其中pol5菌株在系统筛查用于研究甾醇突变 体的酵母的过程中获得了自发的对制霉菌素的抗性,所述双突变菌 株积累麦角甾5,7,24(28)三烯3-醇。得到的单倍体菌株携带双突 变erg4,erg5,它能在半乳糖和一种不能发酵的底物存在下生长,并 且是尿嘧啶,色氨酸和组氨酸营养缺陷型。菌株PLC1051和PLC1451 已于1995年2月10日寄存于CNCM,分别得到保存号为I-1536和I -1537。

下表中列出了分别从上述三个转化菌株鉴别出的主要被还原 甾醇: 起始菌株    起始主要              在C-7位被还原

        内源甾醇              的主要内源甾醇 FY1679      麦角甾5,7,22三烯    麦角甾5-烯3-醇

        3-醇(麦角甾醇)        (二氢油菜甾醇)

                              麦角甾5,22二烯3-醇

                              (油菜甾醇) erg5       麦角甾5,7二烯3-醇     麦角甾5-烯3-醇 PLC1051 erg4,5    麦角甾5,7,24(28)     麦角甾5,24(28)二烯3-醇 PLC1451    三烯-3-醇              (牡蛎甾醇)

实施例3将在第C-7位上被还原的酵母内源甾醇进行限制而 体外制备孕甾烯酮醇

利用Wada等人描述(Arch.Biochem.Biophys.,290,376-380 ,1991)的胆固醇侧链的体外酶促限制检测而制备孕甾烯酮醇,在该 过程中,根据D.W.Seybert等人,J.Biol.Chem.,254,12088-12098 ,1979的描述在140nM肾上腺皮质激素还原酶,1.16μM肾上腺皮质 激素和0.68μM来源于肾上腺的细胞色素P450SCC存在下,在150 μl的10mM磷酸盐缓冲液,pH7.4,100mM NaCl,0.3%吐温20中将实施 例2中获得的在C-7位上被还原的甾醇260μM保温。

通过加入150μM的NADPH而激发反应。在37℃保温80分钟之后, 加入1倍体积的甲醇-二氯甲烷混合物(50∶50V/V)而终止反应。按 实施例1所述提取甾醇并分析GC。

图5分别证明麦角甾5-烯3-醇(图5A),麦角甾5,24(28)二烯3- 醇(图5B)或者麦角甾5,22二烯3-醇(图5C)是细胞色素P450 SCC的 底物并且产生一种产物,该产物,与同样条件下限制胆固醇获得的 孕甾烯醇酮具有同样的RT。

所得结果显示能表达δ-7Red的转化酵母积累可直接用于通过 体外生物氧化而制备孕甾烯酮醇的甾醇。

实施例4体内生产孕甾烯酮醇或其乙酸酯的酵母菌株的构建 A-含有A.thaliana的δ-7Red的表达盒的ELR01菌株的构建,所述表 达盒整合于单倍体菌株FY1679交配型a(FY1679 Mata)的ADE2位点 a)整合性质粒PAD δ-7(PADΔ7)的构建:

质粒pADΔ7的构建是按照图6描述完成的。从pASZ11质粒(A .Stotz等人,Gene,95,91,1990)中分离含有酿酒酵母的ADE2基因的 BglII片段(2244bp)并将该片段插入到pBluescript II KS+载体 (Stratagene)的多克隆位点的BamHI位点。

得到的质粒称为pBS-ADE2,然后在其单一的StuI位点将该质 粒线性化并且脱磷酸化。根据PCR技术,利用下列寡核苷酸作为引 物:  5′GATTACGCCA AGCTTTTCGA AAC 3′      (SEQ ID NO.6)  5′AGATCTTGAG AAGATGCGGC CAGCAAAAC 3′(SEQ ID NO.7) 从实施例1F获得的质粒δ-7/V8制备大约2.44Kb的片段,该片段含 有GAL10/CYC1启动子,δ-7Red的编码区(甾醇7还原酶)以及终止 子PGK(tPGK),所述寡核苷酸引物被限定为分别与tPGK的3′末端以 及与URA3基因的3′末端相匹配。使用下列物质:作为模板的δ -7/V8质粒(80ng),上述寡核苷酸(各为0.5μM),天然的Pfu DNA聚 合酶(溶于由Stratagene推荐的缓冲液中的1个单位)以及使用了下 列扩增条件:35个周期缩环:在95℃1分钟;在95℃5秒;在56℃30秒 钟;在70℃4分钟30秒)。然后将获得的扩增片段克隆到上面线性化 的pBS-ADE2质粒的平齐末端以便得到pADΔ7质粒,该质粒中大约有 4720bp的NotI-PstI片段携带有被δ-7Red表达盒间断的ADE2基因。 b)酵母菌株FY1679 Mata中的染色体整合:

从pADΔ7质粒分离到的NotI-PstI片段(4720bp)用限制性酶 NotI和PstI消化,然后利用D.Gietz等人描述(已经引述过)乙酸 锂方法通过转化将消化后的片段导入到FY1679 Mata酵母中。

根据其对制霉菌素的抗性,及其表型,选择出由于同源重组而 已经整合了该片段的转化体,由于δ-7 Red的表达而将酵母的δ-5 ,7甾醇转化为δ-5甾醇产生其表型。

在实施例1F描述的含有葡萄糖(20克/升)并补充了腺嘌呤 (20mg/l)的YP完全培养基上28℃将转化细胞培养4小时。然后将细 胞浓缩并涂布于SLI-琼脂基本培养基(细菌用酪蛋白氨基酸1克/升 ;"酵母氮源"7克/升;半乳糖20克/升;腺嘌呤20mg/升,琼脂20克/升) 平板上,在28℃培养过夜以便诱导δ-7Red基因的表达。没有尿嘧 啶互补作用使细胞生长受限制,收集克隆,分组然后涂布于含有YP 完全培养基的平板上,该YP完全培养基含有半乳糖(20克/升)并补 充了腺嘌呤(20mg/升)以及浓度逐渐增高的制霉菌素(分别0μg/ml ,1μg/ml,2μg/ml,5μg/ml,20μg/ml)。在第4天,获得了在5μ g/ml浓度时能生长的约二十个克隆。在装有WO基本培养基(7克/升 "酵母氮源",没有氨基酸,20克/升葡萄糖)的平皿中再培养这十二 个克隆,该WO培养基富含尿嘧啶,亮氨酸,色氨酸,组氨酸和腺嘌呤( 各为20mg/升)。

然后通过在上面描述的富含尿嘧啶,壳氨酸,色氨酸,组氨酸, 没有腺嘌呤的WO基本培养基上没有观察到有任何生长而证实由于 破坏了ADE2基因而成为腺嘌呤营养缺陷型。

通过从获得的克隆的基因组DNA进行PCR扩增并且利用具有上 述的SEQ ID NO.6和SEQ ID NO.7的序列作为引物可以控制酵母基 因组中表达盒的存在。

通过对酵母中积累并且采用一个5米SE30毛细管柱(Alltech) 根据实验例1B描述的操作方法进行碱性皂化作用提取到的甾醇的 GC组分分析而证实整合人的δ-7Red基因的功能。分析结果显示当 在半乳糖存在下培养该克隆时显示有含有第C-7位上不饱和的甾醇 的改良过的分布概况。所获得的称为ELR01的菌株积累了麦角甾5 烯3-醇和麦角甾5,22二烯3-醇而不是麦角甾5,7,22三烯3-醇(麦角 甾醇),如图7所示,被替代的麦角甾醇是起始菌株FY1679的主要甾 醇。

由此方式构建的ELR01菌株在半乳糖存在下培养时,由于转录 受启动子GAL 10/CYC1控制这一事实,因而能表达δ-7Red基因。虽 然δ-7Red的表达单位具有相同于ADE2基因的转录方向,但是当在 半乳糖存在下培养时通过对甾醇的GC组分进行分析没有检测到δ -7Red的表达,这是由于启动子GAL10/CYC1的阻遏作用造成的。 B-含有牛肾上腺皮质激素还原酶(ADRm)的成熟形式的表达盒的 CDR01菌株的构建,所述表达盒整合到单倍体菌株FY1679交配型α (mat.α)的LEU2和SPL1位点之间

a)穿梭载体大肠杆菌-酿酒酵母V13的构建

V13载体相当于V8载体(C.Cullin等人,已经引述过),该载体携 带选择性标记URA3和适用于酵母的含有GAL10/CYC1启动子的表达 盒(PG/C)并且在该载体中根据图8显示的构建示意图,在其多克隆 位点已经导入了另一个SalI位点(Sa)。

用限制性酶HindIII和BamHI消化V8载体,并将获得的含有URA3 基因和GAL10/CYC1启动子(称为进一步根据Ura-gal)的BamHI-Hind III片段亚克隆到用限制性酶HindIII和BamHI消化的PUC18载体 (pharmacia)的相应位点。

然后采用PCR方法,利用下列条件:30次循环;在86℃,5秒钟;在 95℃,10秒;在38℃,40秒;在55℃,5秒以及在74℃,2分钟,溶于制造 商的缓冲液中的2个单位的Taq DNA聚合酶以及具有下列核苷酸序 列的各种引物各1μM:  5′GGGGATCCGT GGTCGACGTA ATTTAGTGTG TGTATTTGTG TTTGCG 3′

                                     (SEQ ID NO.8)和  5′GTAAACGAC GGCCAGT 3′                (SEQ ID NO.9) 从上述获得的在95℃退化30秒的30ng PUC 18/"ura-gal"质粒扩增 "Ura-gal"片段。引物SEQID No.8含有相同于"Ura-gal"片段的 Bam HIGGATCC位点,在Bam HI位点有3个连续的核苷酸不与模板杂 交,还含有一个SalI GTCGAC位点以及一个与GAL10/CYC1启动子同 源的序列。引物XEQ ID NO.9与位于多克隆位点PUC18的HindIII位 点前面的序列相匹配。在扩增之后获得的1722bp的HindIII-BamHI 片段用XhoI和BamHI进行消化,释放出含有GAL10/CYC1启动子(pG/c) 的一个254bp片段,然后将该片段亚克隆到用限制性酶BamHI和XhoI 消化的V8载体中。

最后得到的V13载体含有限制性位点,允许编码成熟牛肾上腺 皮质激素还原酶(ADRm),成熟牛肾上腺皮质激素(ADXm)以及牛细胞 色素P450SCC的CDNA容易地进行亚克隆。

在下列方式中从V13载体开始,分别制备V13-ADR载体和V13 -ADX载体和V13-SCC10载体:

a)V13-ADR载体的构建

从EP.340878的实施例25中描述的DGBADR-2质粒分离携带有编 码ADRm的cDNA的1478bp的SalI-KpnI片段并且再克隆到V13载体的 相应位点得到V13-ADR载体。

b)V13-ADX载体的构建

从欧洲专利申请EP340878的实施例23中描述的PGBADX-1质粒 分离携带有编码ADXm的CDNA的390bp的SalI-BamHI片段并且再克隆 到V13载体的相应位点得到V13-ADX载体。

c)V13-SCC10载体的构建

从欧洲专利申请EP 340878的实施例6描述的pGBSCC-10质粒分 离携带了编码P450SCC的CDNA的1554bp的SalI-EcoRI片段并且再 克隆到V13载体的相应位点得到V13-SCC10载体。 b)整合性质粒pCD62-1和pCD62-2的构建:

质粒pCD62-1和pCD62-2的构建按图9描述来完成。

a)质粒pFL26CD的构建

根据下列操作方法,在从splI基因(称为spl1)的5′末端隔离开 的leu2基因的基因间隔区(C.Kolman等人,J.Bacteriol.,175,1433 ,1993)将NotI位点导入到pFL26质粒(N.Bonneaud等人,Yeast,7 ,609-615,1991):

利用具有下列核苷酸序列:

5′TTGAAGGTTC AACATCAATT GATTG 3′    (SEQ ID NO.10)

5′GTGTGGCGGC CGCCTCCTTG TCAATATTAA TGTTAAAG 3′(SEQ ID NO.11) (用于扩增704bp片段)以及核苷酸序列:

5′CAAGGAGGCG GCCGCCACAC AAAAAGTTAG GTGT 3′(SEQ ID NO.12)

5′TCTGCTTCCC TAGAACCTTC TTATG 3′    (SEQ ID NO.13) (用于扩增347bp片段)的引物进行PCR合成分别携带leu2的5′末端 和Spl1的3′末端的704bp和347bp的两个DNA片段。

引物SEQ ID NO.11和SEQ ID NO.12具有一个GGCGGCCG序列,该 序列对应于NotI位点并且该序列中3个碱基与模板不相配。引物 SEQ ID NO.10与定位于Leu2终止密码子上游536bp处的一个序列相 匹配,并且引物SEQID NO.13与定位于Spl 1Δ终止密码子上游 194bp处的一个序列相匹配。

利用PFL26质粒作为模板,pfu DNA聚合酶作为酶,在由供应商 (Stratagene)描述的标准条件下进行pCR首先扩增704bp和347bp片 段。

所获得的两个扩增片段与由SEQ ID NO.11引物(704bp片段)和 SEQ ID NO.12引物(347bp片段)从5′末端起始产生末端水平的20bp 相匹配;这些20bp分别对应于每种引物的开始20个核苷酸。

利用SEQ ID NO.10引物和SEQ ID NO.13引物以及下列条件:30 次循环,包括95℃10秒,60℃5秒,45℃,1分钟,65℃5秒,以及72℃2 分钟,随后一个循环在72℃,7分钟;各种引物各50pmol,以及1个单 位的pfu DNA聚合酶,都溶于50μl反应缓冲液(Stratagene)中,对 由704bp DNA片段(1ng)和347bp DNA片段(2ng)进行配对得到的产 物进行扩增。获得了含有一个Not限制性位点的1031bp的扩增片段。 然后用BstXI和NsiI酶消化该片段,将获得的含有NotI位点的 920bp片段插入到pFL26的起始BstXI-NsiI片段的位置,得到质粒 pFL26CD,其图谱描述于图9a中。

b)pCD60质粒的构建

-pDP10036质粒的制备:

从质粒V13-ADX中分离出携带有编码成熟牛肾上腺皮质激素 (ADXm)的CDNA的390bp SalI-BamHI片段,然后亚克隆于pTG10033质 粒的多克隆位点的SalI-BglII位点,该pTG10033质粒的两侧是诱导 型启动子GAL10/CYC1以及终止子ter PGK。根据下文中进一步描述 的操作方法可以制备pTG10033质粒,其图谱描述于图18中,它相当 于表达载体pTG10031(图17),含有启动子CYC1和terPGK,其中启动 子CYC1已被启动子GAL10/CYC1替代。

由此获得的质粒称为pDP10034,它携带ADX表达盒,即处于 GAL10/CYC1和terPGK转录控制下的编码ADXm的基因。随后,将术语 "表达盒"用于其转录依赖于GAL10/CYC1和ter PGK的任何基因。

采用限制性酶HindIII消化而从质粒V13-ADR中分离出携带选择 性标记URA3和ADR表达盒的3593bp的HindIII片段,然后将该片段插 入到用限制性酶HindIII消化的pDP10034质粒的相应位点。获得的 质粒称为pDp10036,该质粒含有由标记URA3使之相互隔离开的ADX 和ADR表达盒(图9b)。

-pCD60质粒的制备:

通过用限制性酶AflIII和AccI将pDpl0036质粒进行部分消化而 分离出携带ADR表达盒的2770bp的AflIII-AccI片段,用DNA聚合酶I 的Klenow-片段处理而制备平齐末端,连接后亚克隆到质粒pBlue -Script KS+(Stratagene)的SmaI位点的平齐末端。在获得的称为 PCD60的质粒中,该ADR表达盒在NotI位点的任一侧构建形成,一个 定位于AflIII/SmaI连接位点上游的209bp处并且来源于亚克隆片段, 而另一个来源于pBlue-Script KS+的多克隆位点(MCS1)(图9b)。

C)质粒pCD62-1和pCD62-2的构建:

采用限制性酶NotI消化质粒pCD60,消化后分离出的2558bp的 NotI片段亚克隆到pFL26CD质粒的单一NotI位点。根据该片段插入 的方向,获得两个质粒称为pCD62-1和pCD62-2(图9C)。

在pCD62-1质粒中,ADR表达盒定位于leu2基因的转录方向,而 在pCD62-2质粒中其方向正好相反。

保留pCD62-1质粒,用于后来的构建过程。

c)-酵母菌株FY1679(Matalpha)的染色体整合:

pCD62-1质粒含有与FY1679菌株的染色体上位点同源的区域。 这些区域分别对应于图10中描述的1060bp的Bgl II-ClaI片段(A) ,707bp的EcoRI-NotI片段(B)以及602bp的NatI-BglII片段。

在FY1679菌株中缺失对应于pCD62-1质粒的486bp的ClaI- EcoRI片段的区域,暗示着该菌株实际上是亮氨酸营养缺陷型( LEU2-菌株)(R.S.Sikorski等人,Genetics,122,19,1989)。

通过用限制性酶XbaI消化而将pCD62-1质粒线性化,该质粒的 限制性位点定位于同源区的外面,然后利用乙酸锂方法(D.Gietz等 人,已经引证)通过转化将线性化质粒导入到FY1679菌株(Matα)。

由于酵母具有的对DNA的细胞修复能("缺口修复")以及对具 有LEU2+表现型的重组体的选择能力,因而在第一种情况下选择出 了两种类型的重组子:第一种类型是在片段A和B水平上发生同源重 组之后获得的,第二种类型是在片段A和C水平上发生同源重组之后 获得的。仅仅后一种重组类型除了使表现型LEU2+修复以外还允许 ADR表达盒整合。

为了选择第二种类型的克隆,利用上面的SEQ ID NO.10引物以 及具有下列核苷酸序列的引物:  5′TACATTAGGT CCTTTGTAGC 3′            (SEQ ID NO.14) 进行PCR筛选以便证实在FY1679菌株(Matα)基因组中既存在ADR表 达盒又使ADR表达盒有正确定位。

在该筛选方法中,SEQ ID NO.14引物全部与编码ADRm的序列相 匹配,而SEQ ID NO.10引物与染色体上一个序列相匹配(图10)。

利用从FY1679菌株(Matα)分离的基因组DNA(20ng)(C .Hoffman等人,Gene,57,267,1987)作为模板,以及Taq DNA聚合酶 (1U,Bochringer),各个引物各50pmol以及在供应商描述的标准条 件下30次PCR循环(在95℃,10秒,在55℃1分钟,在72℃3分钟)而完 成扩增反应。

在表达盒被整合的情况下扩增之后分离出相应的2.9kb片段。 在相反情况下,没有检测到扩增产物。

以这种公式选择的FY1679菌株(Mataα)含有整合的ADR表达盒 ,将该菌株称为CDR01。    

采用对抗ADR抗体识别的蛋白质进行免疫检测,可以实施例1F 描述的方案制备的胞质细胞组分证明由该菌株表达了ADR。

在实施例3描述的胆固醇侧链的体外酶限制检测中证实了由 CDR01菌株表达的ADR的功能,其中由含有100μg总蛋白的CDR01菌 株的细胞的胞质部分代替纯化ADR(0.28pmol)来完成的。观察到胆 固醇转化为孕甾烯酮醇的生物转化速率约为25%,这相当于用纯化 ADR获得的速率。 C.-共表达A.Thaliana的δ-7Red和ADRm的二倍体EC01菌株的构建

根据G.Sprague等人描述的方案(Methods in Enzymology,194 ,77,1991)将单倍体菌株CDR01和上文中获得的ELR01菌株杂交获得 了二倍体菌株EC01。

首先在前面描述的富含尿嘧啶,色氨酸和组氨酸(各20mg/l)但 没有亮氨酸的WO基本培养基上进行第一次选择以便分离出二倍体 LEU2+克隆(原养型特性,证明存在有ADR表达盒)。然后在前面描述 的固体合成SLI琼脂培养基上检测这些克隆对5μg/ml的制霉菌素 的抗性(抗性特征,证明存在有δ-7Red表达盒)。

以这种方式从对制霉菌素具抗性的克隆中任意地分离出一个 菌株称为EC01。 D-产生孕甾烯醇酮和孕甾烯醇酮-3-乙酸的EC01/pCD63菌株构建

a)表达质粒pCD63的构建

按照图11描述完成pCD63质粒的构建。

利用限制性酶NotI从前面制备的质粒pDP10036中分离含有 ADX表达盒,选择性标记URA3和ADR表达盒的4961bp的NotI片段并用 限制性酶NotI消化,然后将该片段克隆到pFL45L质粒(N.Bonneaud 等人,Yeast,7,609,1991)的多克隆位点的NotI位点。由此获得 的载体称为pDP10037,描述于图11中。

一方面,用酶Tth111I消化而将质粒pDP10037线性化,该质粒的 限制性位点定位于编码ADRm的基因内。

另一方面,将前面获得的Vl3-SCC10质粒用限制性酶PvuII和 EcoRV消化,纯化出含有P450SCC的表达盒以及URA3标记物的5′末端 的3476bp的PvuII-EcoRV片段。

分别得到的两个线性化DNA具有同源区域,一方面该区域与 URA3基因的5′末端以及GAL10/CYC1相对应,另一方面对应于ter PGK,如图11a描述。

然后利用乙酸锂方法(D.Gietz等人,已经引述过)通过共转化 将这两个片段导入酵母菌株FY1679(Mata)中。

下面介绍的选择尿嘧啶和色氨酸(URA3+,RTP1+)的原养型重组 子的方法可以分离这样的克隆,其中由于通过同源重组整合了表达 盒P450SCC而将由限制性酶Tth111I消化产生的双链破裂处修复。

在富含亮氨酸,组氨酸以及亮氨酸(各为20mg/l)没有尿嘧啶和 色氨酸的Wo基本培养基上选择重组体(URA3+,RTP1+)。从收集到的 50个克隆开始,采用C.Hoffman等人描述的方法(Gene,57,267,1987) 提取总DNA,然后采用电穿孔方法导入到大肠杆菌XL1-蓝色 (Stratagene)菌株中。在含有50mg/l氨苄青霉素的丰富培养基LB( 胰蛋白胨1%,酵母抽提物0.5%,NaCl1%)选择由"缺口修复"产生的质 粒转化的克隆。根据J.Sambrook等人,Molecular Cloning,Cold Spring Harbor Laboratory Press,1989描述的方法从选出的克隆 之一提取称为pCD63的质粒。所获得的质粒pCD63含有由选择标记 URA3分隔开的表达盒ADX和P450SCC,如图11b所描述的

b)pCD63质粒转化EC01菌株

根据乙酸锂方法(D.Gietz等人,已经引证过)通过转化将质粒 pCD63导入到上述获得的EC01菌株中。然后将转化酵母培养于前面 描述的WO基本培养基上,该培养基没有尿嘧啶,色氨酸腺嘌呤和亮 氨酸,但增补了组氨酸(20mg/l)。

以这种方式分离称为EC01/pCD63菌株。参考名称为 EC01/pCD63的菌株样品已于1995年2月10日寄存于CNCM,保芷号为 I-1538。

c)体内生产孕甾烯醇酮和孕甾烯醇酮-3乙酸

在28℃有氧条件下(130r/min)将EC01/pCD63菌株培养于3升 Erlenmeyer中的实施例1A中描述的SGI选择性培养基中直到达到稳 定生长期(OD600=12-13),所述培养基中葡萄糖浓度为5克/升。然 后加入1倍体积的上面描述的Yp完全培养基稀释该培养物,然后 加入乙醇(0.5%V/V)作为碳源。当达到新的稳定生长期(OD600=12 -13)时,以浓缩溶液形式(500克/升)向该培养物中加入半乳糖(20克 /升),以便同时诱导编码ADXm,ADRm,P450SCC和δ-7Red的基因进行 表达,这些基因分别处于启动子GAL10/CYC1控制之下。

根据下列操作方法分别对细胞中积累的甾醇以及培养上清液 中的甾醇进行分析可以证明四个基因的共表达:

在诱导9个小时和24个小时之后收集50ml培养物样品。将每个 样品离心(4000g,10分钟,4℃)以便将细胞与培养基分离。

一方面,根据实施例1F说明的方法在玻璃珠存在下通过机械破 碎将细胞裂解。然后从由此获得的裂解液中,通过加入1倍体积的 已烷而提取细胞内甾醇。

另一方面,通过加入1倍体积己烷直接提取培养基中存在的甾 醇。

按照实施例1中说明的方法分析提取的甾醇GC组分,并与标准 产品进行比较。

在诱导了9小时或24小时之后获得的结果分别显示于图12a和 图12b中。

在诱导9小时之后,图12a显示

-在细胞裂解液中,存在与标准孕甾烯醇酮乙酸盐(RT=11.8分 钟)具有同样滞留时间的主要化合物,而在孕甾烯醇酮的滞留时间 (RT=9.9分钟)时仅存在十分弱的峰。在RT=18分钟和RT=17分钟时分 别鉴别出低量的第C-7位还原的酵母的内源甾醇(麦角甾5-烯3-醇和 麦角甾5,22二烯3-醇)。在分析之前将细胞裂解液碱性皂化导致存在 与孕甾烯醇酮共迁移的主要化合物。这可以证实具有RT=11.8分钟的 积累化合物相当于乙酸孕甾烯醇酮。

-在培养基中,孕甾烯醇酮或其乙酸盐明显缺乏。

 在诱导24小时之后,图12b显示:

-在细胞裂解液中,存在低量的孕甾烯醇酮(RT=10.2分钟)和乙 酸孕甾烯醇酮(RT=12分钟)以及存在被还原的酵母内源甾醇(RT=17 分钟和RT=18分钟)。胆固醇(RT=16.2分钟)是一种在提取之前加入 的内部标准物。

-在培养基中,主要存在乙酸孕甾烯醇酮以及小量的孕甾烯醇 酮。    

试验也平行地用对照质粒如pFL45L(已经引述)转化的EC01菌 株进行,该平行试验已经证明没有对应于游离孕甾烯醇酮或乙酸盐 形式的孕甾烯醇酮的峰。

以这种方式对甾醇进行鉴别显示在没有任何内源甾醇存在下, 在半乳糖存在下进行诱导之后酵母菌株EC01/pCD63积累了孕甾烯 醇酮和乙酸孕甾烯醇酮,并且在诱导9小时之后具有最大生产量

这些结果证明一方面EC01菌株中在C-7位还原的内源甾醇的有 效变化,另一方面,内源甾醇的侧链的限制性反应偶合十分有效。

整合菌株的概述表 菌株 整合位点 整合基因 转化质 粒 质粒 标记 质粒上 基因 选择 标记 CDR01 (Mata) 基因间 LEU2-SPL1 ADRm - - - HIS3,URA3, TRP1  ELR01 (Mata) ADE2 δ-7Red - - - ADE2,URA3, LEU2,HIS3, TRP1 EC01 (双倍体) 基因间 LEU2-SPL1     + ADE2 ADRm δ-7Red  - - - HIS3,URA3, TRP1 EC01/ PCD63 基因间 LEU2-SPL1     + ADE2 ADRm δ-7Red pCD63 URA3 TRP1 ADXm p450SCC HIS3 实施例4:pTG10033质粒的构建 1.具有新的多克隆位点的pUC19衍生物:

利用下列寡核苷酸:  5′GCGCTCAGCG GCCGCTITCC AGTCG 3′    SEQ ID NO.15 将克隆载体M13mp19(C.Yanish-Peron等人,Gene,33,103,1985)诱 变以便将NotI位点导入到被截断的lacI基因的序列中得到质粒 M13TG724。

然后利用下列寡核苷酸: 5′AATTGCGGCC GCGTACGTAT G 3′    SEQ ID NO,16 5′AATTCATACG TACGCGGCCG C 3′    SEQ ID NO.17 将含有EcoRI,SnaBI和NotI位点的"多接头"导入到质粒M13TG724 的EcoRI位点,得到质粒M13TG7244,其中在扩增阶段观察到插入物 修饰。质粒M13TG7244的插入物具有下列核苷酸序列: CAATTCATACGTACGCGGCCGCAATTGCGGCCGGTACGTATAATTCACTGGCCGT 其中底下划线部分为EcoRI,SnaBI和SstI位点,斜体字描写为 pUC19的lacZ基因。在用限制性酶EcoRI和SstI消化质粒 M13TG7244之后,利用下列寡核苷酸:

5′CAACGCGTCC TAGG3′              SEQ ID NO.18

5′AATTCCTAGG ACGCGTTGAG CT 3′    SEQ ID NO.19 导入含有MluI和AvrII位点的"多接头"。

在用酶PvuII消化之后,将获得的PvuII片段亚克隆到pUC19(C .Yanish-Porch等人,已经引述)得到质粒pTG7457(图13)。 2.PGK终止子的亚克隆:

用限制性酶BamHI和EcoRI消化PUC19,利用下列寡核苷酸: 5′GATCCGCAGA TATCATCTAG ATCCCGGGTA GAT 3′ SEQ ID NO.20, 5′AGAGCTCAAG ATCTACCCGG GATCTAGATG ATATCTGCG 3′

                                         SEQ ID NO.21, 5′CTTGAGCTCT ACGCAGCTGG TCGACACCTA GGAG 3′ SEQ ID NO.22 和 5′AATTCTCCTA GGTGTCGACC AGCTGCGT 3′        SEQ ID NO.23. 导入一个新"多接头"BamHI SstI。

以这种方式获得了质粒pTG7453(图14),然后用限制性酶 BamHI和SstI消化。将位于BamHI和SstI之间的"多接头"位点导入 到上面获得的并用限制性酶BamHI和SstI消化的质粒pTG7457衍生 物中,由此获得的新质粒含有PvuII,HindIII,BamHI,EcoRI,XbaI ,SmaI,BglII,SstII(=SacI),MluI,AvrII,EcoRI,SnaBI,NotI ,SnaBI,PvuI位点。

用限制性酶BglII和HindIII消化该新质粒并将含有PGK启动子 的BglII-HindIII片段(R.A.Hitzeman等人,Nucleic Acids Res.10 ,7791,1982;G.Loison等人,Yeast,5,497,1989)插入到上述消化后 的质粒中得到pTG10014质粒中(图15) 3.启动子的亚克隆:

a)CYC1启动子

将pTG7453质粒的BamHI和SstI之间的"多接头"位点导入到前 面所述质粒pTG7457衍生物中。由限制性酶SnaBI将获得的新质粒 消化,然后导入一个含有f1噬菌体的复制源点的质粒pEMBL8的 456bp的RsaI-DraI片段(L.Dente等人,Nucleic Acid Res.,11 ,1645,1983),得到质粒pTG7503。

将欧洲专利申请EP0340378的实施例6中制备的并且含有酿酒 酵母的CYC1启动子,一个"多接头"以及乳克鲁维氏酵母的乳糖酶终 止子的pGBSCC-9质粒的0.78Kb BamHI-HindIII片段亚克隆到用限制 性酶HindIII和BamHI消化的质粒pTG7503中得到质粒pTG10004(图 16)。

然后利用下列寡核苷酸: 5′GCGGATCTGC TCGAAGATTG CCTGCGCGTT GGGCTTGATC 3′

                                         SEQ ID NO.24. 对质粒pTG10004的双链DNA进行定位诱变而消除了CYC1启动子的 XhoI和MluI位点。 然后用限制性酶SalI和XhoI将由此得到的质粒pTG10005进行消化 ,然后利用下列寡核苷酸 5′TCGACGGACG CGTGG 3′                      SEQ ID NO.25 5′TCGACCACGC GTCC 3′                       SEQ ID NO.26 导入一个MluI位点得到质粒pTG10006。

b)GAL10/CYC1启动子

用限制性酶XhoI将质粒pYeDPl/8-2(C.Cullin等人,Gene,203 ,1988)打开。所制备的粘性末端用DNA聚合酶Klenow片段填充,然 后再将质粒连接。由此获得的质粒pTG10010用作为pCR扩增的模板, 该质粒中GAL10/CYC1启动子不再含有XhoI位点。 4.表达载体pTG10031的构建

利用下列寡核苷酸: 5′TGGCCGTCGT TTTACTCCTG CGCCTGATGC GGTAT 3′SEQ ID NO.27 进行位点特异性诱变从质粒pTG7503中消除编码lac Z的序列的剩 余部分得到质粒pTG7549。

然后用下列寡核苷酸: 5′GGCCGCAAAA CCAAA 3′         SEQ ID NO.28 5′AGCTTTTGGT TTTGC 3′         SEQ ID NO.29 消除质粒pTG7549中存在的lacZ启动子,这两个寡核苷酸插入到事 先用限制性酶NotI和HindIII消化的该质粒中并且恢复了两个位点 得到质粒pTG7553。

通过用限制性酶BamHI和MluI消化质粒pTG10006而获得含有 CYC1启动子的BamHI-MluI片段,从用限制性酶MluI和HindIII消化的 质粒pTG10015中分离含有PGK启动子的MluI-HindIII片段。将这两 个片段连接并将由此获得的连接产物插入到事先用限制性酶MluI 和HindIII消化的质粒pTG7553中。

下列寡核苷酸: 5′GATCTATCGA TGCGGCCGCG 3′     SEQ ID NO.30 与下列寡核苷酸: 5′CGCGCGCGGC CGCATCGATA 3′     SEQ ID NO.31 相杂交,这一寡核苷酸组成了含有ClaI和NotI位点的BamHI-MluI" 接头",加入该寡核苷酸并连接得到表达载体pTG10031(图17)。

用限制性酶ClaI和SalI将上述从质粒pYE DP1/8-2经pCR扩增 得到的片段进行消化,然后导入到事先用相同限制性酶消化的质粒 pTG10031中以便得到质粒pTG10033(图18)。

      序列表

(1)总体资料:

(i)申请人

(A)姓名:ROUSSEL UCLAF

(B)街道:102,Route de Naisy

(C)城市:ROMAINVILLE

(E)国家:法国

(F)邮编(ZIP):93230

(G)电话:49.91.49.91

(H)传真:49.91.46.10

(ii)发明名称:编码具有δ-5,7甾醇,δ-7还原酶活性的A .thaliana蛋白质的DNA序列,δ-7Red蛋白质,生产方法,转化的酵 母菌株,应用。

(iii)序列数:31

(iv)计算机可读形式:

(A)媒介类型:软盘

(B)计算机:IBM PC兼容

(C)操作系统:PC-DOS/MS-DOS

(D)软件:PatentIn Release#1.0,Version#1.30(EPO)

(vi)以前的申请资料:

  (A)申请号:FR9501723

  (B)申请日:1995年2月15日

(vi)以前的申请资料:

  (A)申请号:FR9506517   (B)申请日:1995年6月1日 (2)SEQ ID NO.1的资料:   (i)序列特征:   (A)长度:1496个碱基对   (B)类型:核酸   (C)链数:单链   (C)几何结构:线性 (ii)分子类型:CDNA (vI)原始来源:   (A)生物体:Arabidopsis thaliana (ix)特征:   (A)名称/关键词:CDS   (B)位置:76..1365 (xi)序列描述:SEQ ID NO.1 GTGTGAGTAA TTTAGGTCAA CACAGATCAG AATCTGAGGC TTTGGCCGAG ACGAAGAGAA        60 AAGCAGAAGA AGAAA ATG GCG GAG ACT GTA CAT TCT CCG ATC GTT ACT TAC        111

             Met Ala Glu Thr Val His Ser Pro Ile Val Thr Tyr

               1               5                  10 GCA TCG ATG TTA TCG CTT CTC GCC TTC TGT CCA CCT TTC GTC ATT CTC         159 Ala Ser Met Leu Ser Leu Leu Ala Phe Cys Pro Pro Phe Val Ile Leu

     15                  20                  25 CTA TGG TAC ACA ATG GTT CAT CAG GAT GGT TCT GTT ACT CAG ACC TTT         207 Leu Trp Tyr Thr Met Val His Gln Asp Gly Ser Val Thr Gln Thr Phe

 30                  35                  40 GGC TTC TTT TGG GAG AAT GGA GTT CAA GGA CTT ATC AAC ATA TGG CCA         255 Gly Phe Phe Trp Glu Asn Gly Val Gln Gly Leu Ile Asn Ile Trp Pro  45                  50                  55                  60 AGA CCC ACT TTG ATT GCT TGG AAA ATT ATA TTT TGC TAT GGA GCA TTT         303 Arg Pro Thr Leu Ile Ala Trp Lys Ile Ile Phe Cys Tyr Gly Ala Phe

             65                  70                  75 GAA GCT ATT CTT CAG CTG CTT CTG CCT GGT AAA AGA GTT GAG GGT CCA         351 Glu Ala Ile Leu Gln Leu Leu Leu Pro Gly Lys Arg Val Glu Gly Pro

         80                  85                  90 ATA TCT CCA GCC GGA AAC CGA CCA GTT TAC AAG GCC AAT GGT CTG GCT         399 Ile Ser Pro Ala Gly Asn Arg Pro Val Tyr Lys Ala Asn Gly Leu Ala

     95                 100                 105 GCT TAC TTT GTG ACA CTA GCA ACC CAT CTT GGT CTT TGG TGG TTT GGA         447 Ala Tyr Phe Val Thr Leu Ala Thr His Leu Gly Leu Trp Trp Phe Gly

110                 115                 120 ATC TTC AAC CCT GCA ATT GTC TAT GAT CAC TTG GGT GAA ATA TTT TCG         495 Ile Phe Asn Pro Ala Ile Val Tyr Asp His Leu Gly Glu Ile Phe Ser 125                 130                 135                 140 GCA CTA ATA TTC GGA AGC TTC ATA TTT TGT GTT TTG TTG TAC ATA AAA         543 Ala Leu Ile Phe Gly Ser Phe Ile Phe Cys Val Leu Leu Tyr Ile Lys

            145                 150                 155 GGC CAT GTT GCA CCT TCA TCA AGT GAC TCT GGT TCA TGT GGT AAC CTA         591 Gly His Val Ala Pro Ser Ser Ser Asp Ser Gly Ser Cys Gly Asn Leu

        160                 165                 170 ATA ATT GAC TTC TAT TGG GGC ATG GAG TTG TAC CCT CGA ATT GGT AAG         639 Ile Ile Asp Phe Tyr Trp Gly Met Glu Leu Tyr Pro Arg Ile Gly Lys

    175                 180                 185 AGC TTT GAC ATC AAG GTG TTT ACT AAT TGC AGA TTC GGA ATG ATG TCT         687 Ser Phe Asp Ile Lys Val Phe Thr Asn Cys Arg Phe Gly Met Met Ser

190                 195                 200 TGG GCA GTT CTT GCA GTC ACG TAC TGC ATA AAA CAG TAT GAA ATA AAT         735 Trp Ala Val Leu Ala Val Thr Tyr Cys Ile Lys Gln Tyr Glu Ile Asn 205                 210                 215                 220 GGC AAA GTA TCT GAT TCA ATG CTG GTG AAC ACC ATC CTG ATG CTG GTG         783 Gly Lys Val Ser Asp Ser Met Leu Val Asn Thr Ile Leu Met Leu Val

            225                 230                 235 TAT GTC ACA AAA TTC TTC TGG TGG GAA GCT GGT TAT TGG AAC ACC ATG         831 Tyr Val Thr Lys Phe Phe Trp Trp Glu Ala Gly Tyr Trp Asn Thr Met

        240                 245                 250 GAC ATT GCA CAT GAC CGA GCT GGA TTC TAT ATA TGC TGG GGT TGT CTA         879 Asp Ile Ala His Asp Arg Ala Gly Phe Tyr Ile Cys Trp Gly Cys Leu

    255                 260                 265 GTG TGG GTG CCT TCT GTC TAC ACT TCT CCA GGC ATG TAC CTT GTG AAC         927 Val Trp Val Pro Ser Val Tyr Thr Ser Pro Gly Met Tyr Leu Val Asn

270                 275                 280 CAC CCC GTC GAA CTC GGA ACT CAG TTG GCA ATA TAC ATT CTC GTT GCA         975 His Pro Val Glu Leu Gly Thr Gln Leu Ala Ile Tyr Ile Leu Val Ala 285                 290                 295                 300 GGA ATT CTG TGC ATT TAC ATA AAG TAT GAC TGT GAT AGA CAA AGG CAA       1023 Gly Ile Leu Cys Ile Tyr Ile Lys Tyr Asp Cys Asp Arg Gln Arg Gln

            305                 310                 315 GAG TTC AGG AGG ACA AAC GGG AAA TGT TTG GTT TGG GGA AGA GCC CCG       1071 Glu Phe Arg Arg Thr Asn Gly Lys Cys Leu Val Trp Gly Arg Ala Pro

        320                 325                 330 TCA AAG ATT GTG GCG TCG TAT ACT ACA ACA TCT GGT GAA ACT AAA ACT       1119 Ser Lys Ile Val Ala Ser Tyr Thr Thr Thr Ser Gly Glu Thr Lys Thr

    335                 340                 345 AGT CTT CTC TTA ACG TCT GGA TGG TGG GGA TTG GCT CGT CAT TTC CAT       1167 Ser Leu Leu Leu Thr Ser Gly Trp Trp Gly Leu Ala Arg His Phe His

350                 355                 360 TAT GTT CCT GAG ATC TTA AGT GCT TTC TTC TGG ACC GTA CCG GCT CTC       1215 Tyr Val Pro Glu Ile Leu Ser Ala Phe Phe Trp Thr Val Pro Ala Leu 365                 370                 375                 380 TTC GAT AAC TTC TTG GCA TAC TTC TAC GTC CTC ACC CTT CTT CTC TTT       1263 Phe Asp Asn Phe Leu Ala Tyr Phe Tyr Val Leu Thr Leu Leu Leu Phe

            385                 390                 395 GAT CGA GCC AAG AGA GAC GAT GAC CGA TGC CGA TCA AAG TAT GGG AAA       1311 Asp Arg Ala Lys Arg Asp Asp Asp Arg Cys Arg Ser Lys Tyr G1y Lys

        400                 405                 410 TAT TGG AAG CTG TAT TGT GAG AAA GTC AAA TAC AGG ATC ATT CCG GGA       1359 Tyr Trp Lys Leu Tyr Cys Glu Lys Val Lys Tyr Arg Ile Ile Pro Gly

    415                 420                 425 ATT TAT TGATTGTAAC GAAGTCTGTT GTTCTCATTT TCTACTTATT ACGTTAATTC        1415 Ile Tyr

430 GAACGTTGGA ATCATCAAAA GACCGAGCCA AAACAAAAAT GCAAATTGAT GCGATAGACA     1475 TTCTTTTGCT GAAAAAAAAA A                                               1496 (2)SEQ ID NO.2的资料。   (i)序列特征:   (A)长度:430个氨基酸   (B)类型:氨基酸   (D)几何结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO.2 Met Ala Glu Thr Val His Ser Pro Ile Val Thr Tyr Ala Ser Met Leu   1               5                  10                  15 Ser Leu Leu Ala Phe Cys Pro Pro Phe Val Ile Leu Leu Trp Tyr Thr

         20                  25                  30 Met Val His Gln Asp Gly Ser Val Thr Gln Thr Phe Gly Phe Phe Trp

     35                  40                  45 Glu Asn Gly Val Gln Gly Leu Ile Asn Ile Trp Pro Arg Pro Thr Leu

 50                  55                  60 Ile Ala Trp Lys Ile Ile Phe Cys Tyr Gly Ala Phe Glu Ala Ile Leu  65                  70                  75                  80 Gln Leu Leu Leu Pro Gly Lys Arg Val Glu Gly Pro Ile Ser Pro Ala

             85                  90                  95 Gly Asn Arg Pro Val Tyr Lys Ala Asn Gly Leu Ala Ala Tyr Phe Val

        100                 105                 110 Thr Leu Ala Thr His Leu Gly Leu Trp Trp Phe Gly Ile Phe Asn Pro

    115                 120                 125 Ala Ile Val Tyr Asp His Leu Gly Glu Ile Phe Ser Ala Leu Ile Phe

130                 135                 140 Gly Ser Phe Ile Phe Cys Val Leu Leu Tyr Ile Lys Gly His Val Ala 145                 150                 155                 160 Pro Ser Ser Ser Asp Ser Gly Ser Cys Gly Asn Leu Ile Ile Asp Phe

            165                 170                 175 Tyr Trp Gly Met Glu Leu Tyr Pro Arg Ile Gly Lys Ser Phe Asp Ile

        180                 185                 190 Lys Val Phe Thr Asn Cys Arg Phe Gly Met Met Ser Trp Ala Val Leu

    195                 200                 205 Ala Val Thr Tyr Cys Ile Lys Gln Tyr Glu Ile Asn Gly Lys Val Ser

210                 215                 220 Asp Ser Met Leu Val Asn Thr Ile Leu Met Leu Val Tyr Val Thr Lys 225                 230                 235                 240 Phe Phe Trp Trp Glu Ala Gly Tyr Trp Asn Thr Met Asp Ile Ala His

            245                 250                 255 Asp Arg Ala Gly Phe Tyr Ile Cys Trp Gly Cys Leu Val Trp Val Pro

        260                 265                 270 Ser Val Tyr Thr Ser Pro Gly Met Tyr Leu Val Asn His Pro Val Glu

    275                 280                 285 Leu Gly Thr Gln Leu Ala Ile Tyr Ile Leu Val Ala Gly Ile Leu Cys

290                 295                 300 Ile Tyr Ile Lys Tyr Asp Cys Asp Arg Gln Arg Gln Glu Phe Arg Arg 305                 310                 315                 320 Thr Asn Gly Lys Cys Leu Val Trp Gly Arg Ala Pro Ser Lys Ile Val

            325                 330                 335 Ala Ser Tyr Thr Thr Thr Ser Gly Glu Thr Lys Thr Ser Leu Leu Leu

        340                 345                 350 Thr Ser Gly Trp Trp Gly Leu Ala Arg His Phe His Tyr Val Pro Glu

    355                 360                 365 Ile Leu Ser Ala Phe Phe Trp Thr Val Pro Ala Leu Phe Asp Asn Phe

370                 375                 380 Leu Ala Tyr Phe Tyr Val Leu Thr Leu Leu Leu Phe Asp Arg Ala Lys 385                 390                 395                 400 Arg Asp Asp Asp Arg Cys Arg Ser Lys Tyr Gly Lys Tyr Trp Lys Leu

            405                 410                 415 Tyr Cys Glu Lys Val Lys Tyr Arg Ile Ile Pro Gly Ile Tyr

        420                 425                 430

(2)SEQ ID NO.3的资料。

  (i)序列特征:

  (A)长度:15个氨基酸

  (B)类型:氨基酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:肽

(ix)特征:

  (A)名称/关键词:肽

  (B)位置:7

  (D)其他资料:/注解="残基7=Trp或Tyr"

(ix)特征:

  (A)名称/关键词:肽

  (B)位置:12

  (D)其他资料:/注解="残基12=His或lys"

(xi)序列描述:SEQ ID NO.3

Leu Leu Xaa Xaa Gly Trp Xaa Gly Xaa Xaa Arg Xaa Xaa

1               5                   10 Xaa Tyr

15

(2)SEQ ID NO:4的资料:

 (i)序列特征:    

  (A)长度:29个碱基对

  (B)类型:核酸   (C)链数:单链   (D)几何结构:线性 (ii)分子类型:其他核酸   (A)描述/desc="寡核苷酸" (ix)特征:   (A)名称/关键词:misc-特征   (B)位点:10.29   (D)其他资料:/注释="SEQ ID NO.1从76-95" (xi)序列描述:SEQ ID NO.4: CGCGGATCCA TGGCGGAGAC TGTACATTC                      29 (2)SEQ ID NO:5的资料:  (i)序列特征:   (A)长度:28个碱基对   (B)类型:核酸   (C)链数:单链   (D)几何结构:线性 (ii)分子类型:其他核酸   (A)描述:/desc="寡核苷酸" (ix)特征:   (A)名称/关键词:misc-特征   (B)位置:补体(10.28)   (D)其他资料:/注释="互补序列ID NO.1从1350-1368" (xi)序列描述:SEQ ID NO.5: CAGGGTACCT CAATAAATTC CCGGAATG                   28

(2)SEQ ID NO:6的资料:

 (i)序列特征:

  (A)长度:23个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-特征

  (B)位置:补体(1.23)

(xi)序列描述:SEQ ID NO.6: GATTACGCCA AGCTTTTCGA AAC                           23

(2)SEQ ID NO:7的资料:

 (i)序列特征:

  (A)长度:29个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO.7: AGATCTTGAG AAGATGCGGC CAGCAAAAC                   29

(2)SEQ ID NO:8的资料:

(i)序列特征:

 (A)长度:46个碱基对

 (B)类型:核酸

 (C)链数:单链

(D)几何结构:线性    (ii)分子类型:其他核酸

 (A)描述:/desc="寡核苷酸"    (xi)序列描述:SEQ ID NO.8: GGGGATCCGT GGTCGACGTA ATTTAGTGTG TGTATTTGTG TTTGCG  46

(2)SEQ ID NO:9的资料:

 (i)序列特征:

  (A)长度:17个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-特征

  (B)位置:补体(1.17)

(xi)序列描述:SEQ ID NO.9: GTAAAACGAC GGCCAGT                                  17

(2)SEQ ID NO:10的资料:

 (i)序列特征:

(A)长度:25个碱基对

(B)类型:核酸

(C)链数:单链

(D)几何结构:线性   (ii)分子类型:其他核酸

(A)描述:/desc="寡核苷酸"   (xi)序列描述:SEQ ID NO.10: TTGAAGGTTC AACATCAATT GATTG                        25

(2)SEQ ID NO:11的资料:

 (i)序列特征:

  (A)长度:38个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-特征

  (B)位置:衬体(1.38)

(xi)序列描述:SEQ ID NO.11: GTGTGGCGGC CGCCTCCTTG TCAATATTAA TGTTAAAG          38

(2)SEQ ID NO:12的资料:

 (i)序列特征:

  (A)长度:34个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(iii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO.12: CAAGGAGGCG GCCGCCACAC AAAAAGTTAG GTGT           34

(2)SEQ ID NO:13的资料:

 (i)序列特征:

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..25)

(xi)序列描述:SEQ ID NO:13 TCTGCTTCCC TAGAACCTTC TTATG                     25

(2)SEQ ID NO:14的资料:

 (i)序列特征:

  (A)长度:20碱基对

  (B)类型:核酸

(C)链数:单链

(D)几何结构:线性   (ii)分子类型:其他核酸

(A)描述:/desc="寡核苷酸"   (ix)特征:

(A)名称/关键词:misc-feature

(B)位置:补体(1..20)   (xi)序列描述:SEQ ID NO:14: TACATTAGGT CCTTTGTAGC                       20

(2)SEQ ID NO:15的资料:

 (i)序列特征:

  (A)长度:25个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:15: GCGCTCAGCG GCCGCTTTCC AGTCG                 25

(2)SEQ ID NO:16的资料:

 (i)序列特征:

  (A)长度:21个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:16: AATTTGCGGCC GCGTACGTAT G                        21

(2)SEQ ID NO:17的资料:

 (i)序列特征:

  (A)长度:21个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..21)

(xi)序列描述:SEQ ID NO:17: AATTCATACG TACGCGGCCG C                         21

(2)SEQ ID NO:18的资料:

 (i)序列特征:

  (A)长度:14个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:18 CAACGCGTCC TAGG                               14

(2)SEQ ID NO:19的资料:

 (i)序列特征:

  (A)长度:22个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..22)

(xi)序列描述:SEQ ID NO:19: AATTCCTAGG ACGCGTTGAG CT                      22

(2)SEQ ID NO:20的资料:

 (i)序列特征:

  (A)长度:33个碱基对

  (B)类型:核酸

  (C)链数:单链    

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:20: GATCCGCAGA TATCATCTAG ATCCCGGGTA GAT             33

(2)SEQ ID NO:21的资料:

 (i)序列特征:

  (A)长度:39个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..39)

(xi)序列描述:SEQ ID NO:21: AGAGCTCAAG ATCTACCCGG GATCTAGATG ATATCTGCG       39

(2)SEQ ID NO:22的资料:

 (i)序列特征:

  (A)长度:34碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性    

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:22 CTTGAGCTCT ACGCAGCTGG TCGACACCTA GGAG              34

(2)SEQ ID NO:23的资料:

 (i)序列特征:

  (A)长度:28个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..28)

(xi)序列描述:SEQ ID NO:23 AATTCTCCTA GGTGTCGACC AGCTGCGT                     28

(2)SEQ ID NO:24的资料:

 (i)序列特征:

  (A)长度:40个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:24 GCGGATCTGC TCGAAGATTG CCTGCGCGTT GGGCTTGATC       40

(2)SEQ ID NO:25的资料:

 (i)序列特征:

  (A)长度:15个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:25 TCGACGGACG CGTGG                                  15

(2)SEQ ID NO:26的资料:

 (i)序列特征:

  (A)长度:14个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..14)

(xi)序列描述:SEQ ID NO:26 TCGACCACGC GTCC                                   14

(2)SEQ ID NO:27的资料:

 (i)序列特征:

  (A)长度:35个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:27 TGGCCGTCGT TTTACTCCTG CGCCTGATGC GGTAT          35

(2)SEQ ID NO:28的资料:

 (i)序列特征:

  (A)长度:15个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:28 GGCCGCAAAA CCAAA                                15

(2)SEQ ID NO:29的资料:

 (i)序列特征:    

  (A)长度:15个碱基对

  (B)类型:核酸 

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸    

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..25)

(xi)序列描述:SEQ ID NO:29 AGCTTTTGGT TTTGC                                 15

(2)SEQ ID NO:30的资料:

 (i)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链数:单链

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(xi)序列描述:SEQ ID NO:30: GATCTATCGA TGCGGCCGCG                            20

(2)SEQ ID NO:31的资料:

 (i)序列特征:

  (A)长度:20个碱基对

  (B)类型:核酸

  (C)链数:单链 

  (D)几何结构:线性

(ii)分子类型:其他核酸

  (A)描述:/desc="寡核苷酸"

(ix)特征:

  (A)名称/关键词:misc-feature

  (B)位置:补体(1..20)

(xi)序列描述:SEQ ID NO:31: CGCGCGCGGC CGCATCGATA                           20

编码具有δ-5,7甾醇,δ-7还原酶活性的A.thaliana蛋白质的 DNA序列,δ7-Red蛋白质,生产方法,转化酵母菌株,用途。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈