首页 / 专利库 / 植物油脂 / 植物油 / 玉米胚芽油 / 葡聚糖酶,编码它们的核酸以及制备和使用它们的方法

葡聚糖酶,编码它们的核酸以及制备和使用它们的方法

阅读:319发布:2021-11-18

专利汇可以提供葡聚糖酶,编码它们的核酸以及制备和使用它们的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及具有葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶、木聚糖酶活性或这些活性的组合的多肽,和编码它们的多核苷酸。在一个方面,葡聚糖酶活性是内切葡聚糖酶活性(例如内-1,4-β-D-葡聚糖4-葡聚糖 水 解 酶活性),和包括水解 纤维 素、 纤维素 衍 生物 (例如 羧甲基纤维素 和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键,以及水解混合的β-1,3-葡聚糖,诸如谷物β-D-葡聚糖或木葡聚糖和含有纤维素部分的其他 植物 材料中的β-1,4键。此外,本发明也提供了设计新酶的方法,和使用它们的方法。在可选择的方面,新型葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶在增高的pH和 温度 中具有增加的活性和 稳定性 。,下面是葡聚糖酶,编码它们的核酸以及制备和使用它们的方法专利的具体信息内容。

1.分离或重组的核酸,所述核酸包括与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、 SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、 SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、 SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、 SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、 SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、 SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、 SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、 SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、 SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、 SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、 SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、 SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、 SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO: 179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、 SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、 SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、 SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、 SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、 SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、 SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、 SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、 SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、 SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、 SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、 SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、 SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、 SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、 SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、 SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、 SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或 SEQ ID NO:517具有至少50%的序列同一性的核酸序列,所述序列同一性在至少 约20、30、40、50、60、75或100个残基的区域上,其中所述核酸编码至少一种 具有葡聚糖酶活性的多肽,所述序列同一性通过采用序列比较算法的分析或通过 目视检查法来测定。
2.如权利要求1所述的分离或重组的核酸,其中所述序列同一性至少约51%、 52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%或64%。
3.如权利要求2所述的分离或重组的核酸,其中所述序列同一性至少约65%、 66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、 79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性。
4.如权利要求1所述的分离或重组的核酸,其中所述的序列同一性是在至少 大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、 700、750、800、850、900、950、1000、1050、1100、1150或更多个残基,或者 基因或转录物的全长区域上。
5.如权利要求3所述的分离或重组的核酸,其中所述核酸序列包括SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、 SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、 SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、 SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、 SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、 SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、 SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、 SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、 SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、 SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、 SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、 SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、 SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、 SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、 SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、 SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、 SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、 SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、 SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、 SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、 SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、 SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、 SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、 SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、 SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、 SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、 SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、 SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、 SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、 SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517中示出的序列。
6.如权利要求1所述的分离或重组的核酸,其中所述核酸序列编码具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO: 12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、 SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、 SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、 SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、 SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、 SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、 SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、 SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、 SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、 SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140; SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、 SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、 SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、 SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、 SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、 SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、 SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、 SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、 SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、 SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、 SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、 SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、 SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、 SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、 SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、 SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、 SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、 SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、 SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、 SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、 SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516或SEQ ID NO:518中示出的序列的多 肽。
7.如权利要求1所述的分离或重组的核酸,其中所述序列比较算法是BLAST 版本2.2.2算法,其中过滤设置设为blastall-p blastp-d“nr pataa”-F F,所有其他选 项都设为默认值。
8.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性包括内切 葡聚糖酶活性。
9.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性包括催化 解1,4-β-D-糖苷键或内部β-1,3-糖苷键,或水解葡聚糖,产生较小分子量的多糖 或寡聚体。
10.如权利要求8所述的分离或重组的核酸,其中所述内切葡聚糖酶活性包括 内-1,4-β-内切葡聚糖酶活性。
11.如权利要求10所述的分离或重组的核酸,其中所述1,4-β-D-糖苷键活性 包括水解纤维素或纤维素生物、地衣多糖或谷物中的1,4-β-D-糖苷键。
12.如权利要求11所述的分离或重组的核酸,其中所述纤维素衍生物包括羧 甲基纤维素或羟乙基纤维素。
13.如权利要求11所述的分离或重组的核酸,其中所述谷物包括β-D-葡聚糖 或木葡聚糖。
14.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性包括水解 包括1,4-β-糖苷-连接的D-吡喃型葡萄糖的多糖。
15.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性包括水解 纤维素、纤维素衍生物或半纤维素。
16.如权利要求15所述的分离或重组的核酸,其中所述葡聚糖酶活性包括水 解木浆或纸浆或木产品或纸产品中的纤维素或半纤维素。
17.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性包括催化 水解饲料、食物产品或饮料中的葡聚糖。
18.如权利要求17所述的分离或重组的核酸,其中所述饲料、食物产品或饮 料包括以谷物为基础的动物饲料、麦芽汁啤酒、面团、水果或蔬菜。
19.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性包括催化 水解微生物细胞、真菌细胞、哺乳动物细胞、或植物细胞中的葡聚糖。
20.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性具有热稳 定性。
21.如权利要求20所述的分离或重组的核酸,其中所述多肽在一定的温度条 件下仍保留葡聚糖酶活性,所述条件包括在约37℃至约95℃之间的温度、或约55℃ 至约85℃之间的温度、约70℃至约75℃之间的温度、或约70℃至约95℃之间的 温度、或约90℃至约95℃之间的温度。
22.如权利要求1所述的分离或重组的核酸,其中所述葡聚糖酶活性具有耐热 性。
23.如权利要求22所述的分离或重组的核酸,其中所述多肽在暴露于超过 37℃至大约95℃、超过55℃至大约85℃、或大约70℃至大约75℃之间、或超过 90℃至大约95℃范围内的温度后,仍保留葡聚糖酶活性。
24.分离或重组的核酸,其中所述核酸包括序列,所述序列在严紧性条件下杂 交到包括SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、 SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、 SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、 SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、 SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、 SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、 SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、 SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、 SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、 SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、 SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、 SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、 SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、 SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、 SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、 SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、 SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、 SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、 SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、 SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、 SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、 SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、 SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、 SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、 SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、 SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、 SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、 SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、 SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、 SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、 SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517 的核酸,其中所述核酸编码具有葡聚糖酶活性的多肽。
25.如权利要求24所述的分离或重组的核酸,其中所述核酸长度为至少约20、 30、40、50、60、75、100、150、200、300、400、500、600、700、800、900、 1000个或更多残基,或基因或转录物的全长。
26.如权利要求24所述的分离或重组的核酸,其中所述严紧性条件包括洗涤 步骤,所述洗涤步骤包括在0.2×SSC中,在约65℃的温度洗涤约15分钟。
27.核酸探针,用于鉴定编码具有葡聚糖酶活性的多肽的核酸,其中所述探针 包括序列的至少10个连续的基,所述序列包括SEQ ID NO:1、SEQ ID NO:3、 SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、 SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、 SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、 SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、 SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、 SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、 SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、 SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、 SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、 SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、 SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、 SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、 SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、 SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、 SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、 SEQ ID-NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、 SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、 SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、 SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、 SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、 SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、 SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或EQ ID NO:517,其中所述探针通过结合或杂交鉴定 核酸。
28.如权利要求27所述的核酸探针、其中所述探针包括寡核苷酸,所述寡核 苷酸包括至少约10个至50个、约20个至60个、约30个至70个、约40个至80 个、或约60个至100个或约50个至150个连续碱基。
29.核酸探针,用于鉴定编码具有葡聚糖酶活性的多肽的核酸,其中所述探针 包括核酸,所述核酸包括与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、 SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、 SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、 SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、 SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、 SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、 SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、 SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、 SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、 SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、 SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、 SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、 SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、 SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、 SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、 SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、 SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、 SEQ ID NO:425;SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、 SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、 SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、 SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、 SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517具有至少50%序列同一性的核酸序列的至少约10个 连续残基。所述序列同一性通过用序列比较算法分析或通过目视检查法来测定。
30.如权利要求29所述的核酸探针,其中所述探针包括寡核苷酸,所述寡核 苷酸包括至少约10个至50个、约20个至60个、约30个至70个、约40个至80 个、约60个至100个或约50个至150个连续碱基。
31.扩增引物对,用于扩增编码具有葡聚糖酶活性的多肽的核酸,其中所述引 物对能够扩增包括权利要求1或权利要求24中所述的序列或它们的亚序列的核 酸。
32.如权利要求31所述的扩增引物对,其中所述扩增引物序列对的引物可以 包括寡核苷酸,所述寡核苷酸包括所述序列的至少约10个至50个连续碱基,或 所述序列的约12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30个或更多个连续的碱基。
33.扩增引物对,其中所述引物对包括第一条引物和第二条引物,所述第一条 引物具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、 SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、 SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、 SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、 SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、 SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、 SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、 SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、 SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、 SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、 SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、 SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、 SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、 SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、 SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、 SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、 SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、 SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、 SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、 SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、 SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、 SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、 SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、 SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、 SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、 SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、 SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、 SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、 SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、 SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、 SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517的 约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30个或更多残基示出的序列;所述第二引物具有所述第一条引物的互补 链的约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30个或更多残基示出的序列。
34.编码葡聚糖酶的核酸,所述核酸使用权利要求33中所述的扩增引物对通 过扩增多核苷酸而产生。
35.如权利要求34中所述的编码葡聚糖酶的核酸,其中所述扩增是通过聚合 酶链式反应(PCR)进行的扩增。
36.如权利要求34中所述的编码葡聚糖酶的核酸,其中所述核酸通过扩增基 因文库而产生。
37.如权利要求34中所述的编码葡聚糖酶的核酸,其中所述基因文库是环境 文库。
38.分离或重组的葡聚糖酶,所述酶由权利要求34所述的编码葡聚糖酶的核 酸编码。
39.一种扩增编码具有葡聚糖酶活性的多肽的核酸的方法,包括用能够扩增权 利要求1或权利要求24中所示核酸序列或其亚序列的扩增引物序列对扩增模板核 酸。
40.表达盒,包括核酸,所述核酸包括权利要求1或权利要求24所述的序列。
41.载体,包括核酸,所述核酸包括权利要求1或权利要求24所述的序列。
42.克隆载体,包括核酸,所述核酸包括权利要求1或权利要求24所述的序 列,其中所述克隆载体包括病毒载体、质粒、噬菌体、噬菌粒、粘端质粒、F粘粒、 细菌噬菌体或人工染色体。
43.如权利要求42所述的克隆载体,其中所述病毒载体包括腺病毒载体、逆 转录病毒载体、或腺-相关病毒载体。
44.如权利要求42所述的克隆载体,包括细菌人工染色体(BAC)、质粒、细 菌噬菌体P1-衍生的载体(PAC)、酵母人工染色体(YAC)、或哺乳动物人工染色体 (MAC)。
45.转化细胞,其包含含有在权利要求1或权利要求24中所示的序列的核酸。
46.转化细胞,其包括权利要求40所述的表达盒。
47.如权利要求40所述的转化细胞,其中所述细胞是细菌细胞、哺乳动物细 胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。
48.转基因非-人动物,其包括权利要求1或权利要求24所述的序列。
49.如权利要求48所述的转基因非-人动物,其中所述动物是小鼠。
50.转基因植物,其包括权利要求1或权利要求24所述的序列。
51.如权利要求50所述的转基因植物,其中所述植物是玉米植物、高梁植物、 铃薯植物、西红柿植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、 大米植物、大麦植物、草、或烟草植物。
52.转基因种子,其包括权利要求1或权利要求24所述的序列。
53.如权利要求52所述的转基因种子,其中所述种子是玉米种子、小麦仁、 含油种子、油菜籽、大豆种子、棕榈仁、向日葵种子、芝麻种子、大米、大麦、 花生或烟草植物种子。
54.反义寡核苷酸,其包括与在权利要求1或权利要求24中所示的序列或其 亚序列互补的核酸序列,或者能够在严紧性条件下与在权利要求1或权利要求24 中所示的序列或其亚序列杂交的核酸序列。
55.如权利要求49所述的反义寡核苷酸,其中所述的反义寡核苷酸的长度为 大约10个至50个、大约20个至60个、大约30个至70个、大约40个至80个、 或大约60个至100个碱基。
56.在细胞中抑制葡聚糖酶信息的翻译的方法,包括给予所述细胞反义寡核苷 酸,或在细胞中表达反义寡核苷酸,所述反义寡核苷酸含有与在权利要求1或权 利要求24中所示的序列互补的核酸序列,或者能够在严紧性条件下与在权利要求 1或权利要求24中所示的序列或其亚序列杂交的核酸序列。
57.双链抑制性RNA(RNAi)分子,包括权利要求1或权利要求24所述的序列 的亚序列。
58.如权利要求52所述的双链抑制性RNA(RNAi)分子,其中所述RNAi长度 为约15、16、17、18、19、20、21、22、23、24、25或更多个双螺旋核苷酸。
59.一种抑制葡聚糖酶在细胞中表达的方法,包括给予所述细胞双链抑制性 RNA(iRNA),或在细胞中表达双链抑制性RNA(iRNA),其中所述RNA包括权利 要求1或权利要求24所述的序列的亚序列。
60.分离的、或重组的多肽,其(i)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、 SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142; SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、 SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、 SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、 SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、 SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、 SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、 SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、 SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、 SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、 SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、 SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、 SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、 SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、 SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、 SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、 SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、 SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、 SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、 SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、 SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、 SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、 SEQ ID NO:514、SEQ ID NO:516或SEQ ID NO:518具有至少50%的序列同一性, 所述序列同一性在至少约20、25、30、35、40、45、50、55、60、75或100个残 基的区域内,所述序列同一性通过用序列比较算法分析或通过目视检查法来测定; 或(ii)由与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、 SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、 SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、 SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、 SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、 SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、 SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、 SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、 SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、 SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、 SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、 SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、 SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、 SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、 SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、 SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、 SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、 SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、 SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、 SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、 SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、 SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、 SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515 或SEQ ID NO:517中示出的序列具有至少50%的序列同一性的核酸所编码,所述 同一性在至少约20、25、30、35、40、45、50、55、60、75或100个残基的区域 内,所述序列同一性通过用序列比较算法分析或通过目视检查法来测定;或由能 够在严紧性条件下杂交到SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、 SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、 SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、 SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、 SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、 SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、 SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、 SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、 SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、 SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、 SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、 SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、 SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、 SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、 SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、 SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、 SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、 SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、 SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、 SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、 SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、 SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、 SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、 SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517中示出的序列的核酸所编码。
61.如权利要求60所述的分离或重组的多肽,其中所述序列同一性在至少大 约的一个区域上具有至少大约51%、52%、53%、54%、55%、56%、57%、58%、 59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、或更大,或100%的序列同一性。
62.如权利要求60所述的分离或重组的多肽,其中所述的序列同一性是在至 少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、 350、400、450、500、550、600、650、700、750、800、850、900、950、1000、 1050个或更多个残基或酶的全长的区域上。
63.如权利要求60所述的分离或重组的多肽,其中所述多肽具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、 SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、 SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、 SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、 SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、 SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、 SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、 SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、 SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、 SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140; SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、 SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、 SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、 SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、 SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、 SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、 SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、 SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、 SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、 SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、 SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、 SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、 SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、 SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、 SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、 SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、 SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、 SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、 SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、 SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、 SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516或SEQ ID NO:518中示出的序列。
64.如权利要求60所述的分离或重组的多肽,其中所述多肽具有葡聚糖酶活 性。
65.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性包括内 切葡聚糖酶活性。
66.如权利要求65所述的分离或重组的多肽,其中所述内切葡聚糖酶活性包 括内-1,4-β-内切葡聚糖酶活性,或包括催化水解1,4-β-D-糖苷键或内部β-1,3-糖苷 键。
67.如权利要求66所述的分离或重组的多肽,其中所述1,4-β-D-糖苷键活性 包括水解纤维素或纤维素衍生物、地衣多糖或谷物中的1,4-β-D-糖苷键。
68.如权利要求67所述的分离或重组的多肽,其中所述纤维素衍生物包括羧 甲基纤维素或羟乙基纤维素。
69.如权利要求67所述的分离或重组的多肽,其中所述谷物包括β-D-葡聚糖 或木葡聚糖(xyloglucan)。
70.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性包括水 解包括1,4-β-糖苷-连接的D-吡喃型葡萄糖的多糖。
71.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性包括水 解纤维素、纤维素衍生物或半纤维素。
72.如权利要求71所述的分离或重组的多肽,其中所述葡聚糖酶活性包括水 解木浆或纸浆或纸产品中的纤维素或半纤维素。
73.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性包括催 化水解饲料、食物产品或饮料中的葡聚糖。
74.如权利要求73所述的分离或重组的多肽,其中所述饲料、食物产品或饮 料包括以谷物为基础的动物饲料、面团、麦芽汁或啤酒、水果或蔬菜。
75.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性包括催 化水解微生物细胞或植物细胞中的木聚糖。
76.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性催化水 解可发酵糖,产生燃料产品。
77.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性具有热 稳定性
78.如权利要求77所述的分离或重组的多肽,其中所述的多肽在一定条件下 仍保留有葡聚糖酶活性,所述条件包括约1℃至约5℃之间、约5℃至约15℃之间、 约15℃至约25℃之间、约25℃至约37℃之间、约37℃至约95℃之间、约55℃至 约85℃之间、约70℃至约95℃之间、约70℃至约75℃之间、或约90℃至约95℃ 之间的温度。
79.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性具有耐 热性。
80.如权利要求79所述的分离或重组的多肽,其中,在暴露于约1℃至约5℃ 之间、约5℃至约15℃之间、约15℃至约25℃之间、约25℃至约37℃之间、约 37℃至约95℃之间、约55℃至约85℃之间、约70℃至约75℃之间、或约90℃至 约95℃之间的温度或更高的温度之后,所述多肽能够保留葡聚糖酶活性。
81.分离或重组的多肽,包括权利要求60所述的多肽,并缺少信号序列或前 体序列。
82.分离或重组的多肽,包括权利要求60所述的多肽,并具有异源信号序列 或异源前体序列。
83.如权利要求64所述的分离或重组的多肽,其中所述葡聚糖酶活性在大约 37℃时其比活为每毫克蛋白大约100至大约1000单位、每毫克蛋白大约500至大 约750单位、每毫克蛋白大约500至1200单位、或每毫克蛋白大约750至大约1000 单位。
84.如权利要求79所述的分离或重组的多肽,其中所述的耐热性包括在被加 热至升高的温度后保留其在37℃时的葡聚糖酶比活的至少一半。
85.如权利要求79所述的分离或重组的多肽,其中所述的耐热性包括在被加 热至升高的温度后,保留有在37℃时的比活,其范围是从每毫克蛋白大约500至 大约1200单位。
86.如权利要求60所述的分离或重组的多肽,所述多肽包括至少一个糖基化 位点。
87.如权利要求86所述的分离或重组的多肽,其中所述糖基化是N-连接糖基 化。
88.如权利要求87所述的分离或重组的多肽,其中所述多肽在巴斯德毕赤酵 母(P.pastoris)或粟酒裂殖酵母(S.pombe)中表达之后被糖基化。
89.如权利要求64所述的分离或重组的多肽,所述多肽在包括约pH 6.5、pH 6.0、pH 5.5、pH 5.0、pH 4.5或pH 4.0的条件下,保留葡聚糖酶活性。
90.如权利要求64所述的分离或重组的多肽,其中所述多肽在包括约pH 7.5、 pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10或pH 10.5的条件下,保留葡聚糖酶活性。
91.蛋白质制品,其包括权利要求60所述的多肽,其中所述蛋白质制品包括 液体、固体或凝胶。
92.异源二聚体,其包括权利要求60所述的多肽和第二结构域。
93.如权利要求92所述的异源二聚体,其中所述第二结构域是多肽,所述异 源二聚体是融合蛋白。
94.如权利要求92所述的异源二聚体,其中所述第二结构域是表位或标记。
95.同源二聚体,其包括权利要求60所述的多肽。
96.固定化的多肽,其中所述多肽包括权利要求60所述的序列,或其亚序列。
97.如权利要求96所述的固定化多肽,其中所述多肽固定化在细胞、金属、 树脂聚合物、陶瓷、玻璃、微电极石墨颗粒、珠、凝胶、板、阵列或毛细管 上。
98.阵列,包括权利要求60所述的多肽的固定化多肽。
99.阵列,包括权利要求1或权利要求24中所述的核酸的固定化核酸。
100.分离或重组的抗体,其特异性地结合权利要求60所述的多肽。
如权利要求100所述的分离或重组的抗体,其中所述抗体是单克隆抗体 或多克隆抗体。
杂交瘤,其包括特异性地结合权利要求60所述的多肽的抗体。
一种分离或鉴定具有葡聚糖酶活性的多肽的方法,包括步骤:
(a)提供权利要求100所述的抗体;
(b)提供包括多肽的样品;和
(c)在抗体能够特异性结合到所述多肽的条件下,将步骤(b)的所述样品与步骤 (a)的所述抗体接触,从而分离或鉴定具有葡聚糖酶活性的多肽。
一种制备抗-葡聚糖酶抗体的方法,包括给予非人动物在权利要求1或权 利要求24中所示的核酸或其亚序列,其量足以产生体液免疫反应,由此制备抗- 葡聚糖酶抗体。
一种制备抗-葡聚糖酶抗体的方法,包括给予非人动物在权利要求60中 所示的多肽或其亚序列,其量足以产生体液免疫反应,由此制备抗-葡聚糖酶抗体。
一种产生重组多肽的方法,包括步骤:(a)提供可操作性地连接到启动子 的核酸,其中所述核酸包括权利要求1或权利要求24中所述的序列;和(b)在允 许表达所述多肽的条件下,表达步骤(a)的核酸,从而产生重组多肽。
如权利要求106所述的方法,还包括用步骤(a)的核酸转化宿主细胞,然 后表达步骤(a)的核酸,从而在转化的宿主细胞中产生重组多肽。
一种鉴定具有葡聚糖酶活性的多肽的方法,包括步骤:
(a)提供在权利要求64中所示的多肽;
(b)提供葡聚糖酶底物;和
(c)将所述多肽与步骤(b)的底物接触,检测底物量的减少或反应产物量的增 加,其中所述的的底物量的减少或反应产物量的增加可检测出具有葡聚糖酶活性 的多肽。
一种鉴定葡聚糖酶底物的方法,包括步骤:
(a)提供在权利要求64中所示的多肽;
(b)提供被测底物;和
(c)将步骤(a)的多肽与步骤(b)的被测底物接触,检测底物量的减少或反应产物 量的增加,其中所述的底物量的减少或反应产物量的增加可鉴定被测底物为葡聚 糖酶的底物。
110.一种确定被测化合物是否与多肽特异结合的方法,包括步骤:
(a)在允许核酸翻译为多肽的条件下表达核酸或含有核酸的载体,其中所述的 核酸具有在权利要求1或权利要求24中所示的序列;
(b)提供被测化合物;
(c)将所述多肽与所述被测化合物接触;和
(d)确定步骤(b)的被测化合物是否与所述多肽特异结合。
111.一种确定被测化合物是否与多肽特异结合的方法,包括步骤:
(a)提供在权利要求60中所示的多肽;
(b)提供被测化合物;
(c)将所述多肽与所述被测化合物接触;和
(d)确定步骤(b)的被测化合物是否与所述多肽特异结合。
112.一种鉴定葡聚糖酶活性的调节物的方法,包括步骤:
(a)提供在权利要求64中所示的多肽;
(b)提供被测化合物;
(c)将步骤(a)的多肽与步骤(b)的被测化合物接触,测定葡聚糖酶的活性,将在 所述的被测化合物存在的情况下测定的葡聚糖酶活性与缺少所述的被测化合物时 的活性作比较,通过其中的变化可确定所述的被测化合物调节葡聚糖酶的活性。
113.如权利要求112所述的方法,其中所述的葡聚糖酶活性的测定是通过提 供葡聚糖酶底物,检测底物量的减少或反应产物量的增加,或者底物量的增加或 反应产物量的减少。
114.如权利要求113所述的方法,其中与没有所述被测化合物时的底物量或 反应产物量相比,有所述被测化合物时底物量的减少或反应产物量的增加可鉴定 所述被测化合物为葡聚糖酶活性的激活物。
115.如权利要求113所述的方法,其中与没有所述被测化合物时的底物量或 反应产物量相比,有所述被测化合物时底物量的增加或反应产物量的减少可鉴定 所述被测化合物为葡聚糖酶活性的抑制剂
116.一种计算机系统,包括处理器和数据存储装置,其中所述的数据存储装 置上储存了多肽序列或核酸序列,其中所述的多肽序列包括权利要求60中所示的 序列,由权利要求1或权利要求24中所示核酸序列编码的多肽。
117.如权利要求115所述的计算机系统,进一步包括序列比较算法和储存了 至少一条参考序列的数据存储装置。
118.如权利要求117所述的计算机系统,其中所述的序列比较算法包括可指 示多态性的计算机程序
119.如权利要求117所述的计算机系统,进一步包括可鉴别所述序列中的一 个或多个特征的识别器。
120.计算机可读介质,其上已经储存了多肽序列或核酸序列,其中所述的多 肽序列包括权利要求60中所示的多肽;由权利要求1或权利要求24中所示的核 酸序列编码的多肽。
121.一种识别序列中的特征的方法,包括步骤:(a)使用可鉴别序列中一个或 多个特征的计算机程序读取序列,其中所述的序列包括多肽序列或核酸序列,其 中所述的的多肽序列包括权利要求60中所示的多肽;由权利要求1或权利要求24 中所示的核酸编码的多肽;和(b)用计算机程序鉴定序列中的一个或多个特征。
122.将第一序列与第二序列进行比较的方法,包括步骤:(a)通过使用可比较 序列的计算机程序读取第一序列和第二序列,其中所述的第一序列包括多肽序列 或核酸序列,其中所述的多肽序列包括权利要求60中所示的多肽或由权利要求1 或权利要求24中所示的核酸编码的多肽;和(b)用计算机程序确定第一序列和第 二序列之间的差异。
123.如权利要求122所述的方法,其中所述的确定第一序列和第二序列之间 差异的步骤进一步包括鉴定多态性的步骤。
124.如权利要求123所述的方法,进一步包括可鉴别序列中一个或多个特征 的识别器。
125.如权利要求124所述的方法,包括使用计算机程序读取所述第一序列, 并鉴定序列中的一个或多个特征。
126.从环境样品中分离或回收编码具有葡聚糖酶活性的多肽的核酸的方法, 包括步骤:
(a)提供在权利要求31或权利要求33中所示的扩增引物序列对;
(b)从所述环境样品中分离出核酸或处理所述环境样品,以便样品中的核酸可 与所述的扩增引物对杂交;和
(c)将步骤(b)的核酸与步骤(a)的扩增引物对混合,扩增所述环境样品中的核 酸,由此从环境样品中分离或回收编码具有葡聚糖酶活性的多肽的核酸。
127.如权利要求126所述的方法,其中所述扩增引物序列对的每一条引物包 括寡核苷酸,所述寡核苷酸包括SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、 SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、 SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、 SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、 SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、 SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、 SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、 SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、 SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、 SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、 SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、 SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、 SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、 SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、 SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、 SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、 SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、 SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、 SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、 SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、 SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、 SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517中示出的序列或它们的亚序列的至少约10至50个 连续碱基。
128.从环境样品中分离或回收编码具有葡聚糖酶活性的多肽的核酸的方法, 包括步骤:
(a)提供多核苷酸探针,其含有在权利要求1或权利要求24中所示的序列或 其亚序列;
(b)从环境样品中分离核酸或处理环境样品,以便样品中的核酸可与步骤(a) 的多核苷酸探针杂交;
(c)将步骤(b)的分离出的核酸或已处理过的环境样品与步骤(a)的多核苷酸探 针混合;和
(d)分离出可与步骤(a)的多核苷酸探针特异杂交的核酸,由此可从环境样品中 分离或回收编码具有葡聚糖酶活性的多肽的核酸。
129.如权利要求127或权利要求128所述的方法,其中所述的环境样品包括 水样品、液体样品、土壤样品、空气样品或生物学样品。
130.如权利要求129所述的方法,其中所述的生物学样品来自细菌细胞、原 生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。
131.产生编码具有葡聚糖酶活性的多肽的核酸变异体的方法,包括步骤:
(a)提供含有在权利要求1或权利要求24中所示的序列的模板核酸;和
(b)在模板序列中修饰、删除或添加一个或多个核苷酸,或进行这些操作的组 合,从而产生模板核酸的变异体。
132.如权利要求131所述的方法,进一步包括表达所述的核酸变异体,产生 变异的葡聚糖酶多肽。
133.如权利要求131所述的方法,其中所述的修饰、添加或删除通过以下的 方法被导入,所述方法包括易错PCR、重排、寡核苷酸定点突变、装配PCR、有 性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性 诱变、基因重装配、基因位点饱和诱变(GSSMTM)、合成连接重装配(SLR)和 它们的组合。
134.如权利要求131所述的方法,其中所述的修饰、添加或删除通过以下的 方法被导入,所述方法包括重组、递归序列重组、硫代磷酸酯-修饰的DNA诱变、 含有尿嘧啶模板的诱变、缺口双链体诱变、点错配修复诱变、修复-缺陷型宿主株 诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基 因合成、整体诱变、嵌合核酸多聚体生成以及它们的组合。
135.如权利要求131所述的方法,其中所述的方法可以迭代反复,直至产生 与所述模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳 定性的葡聚糖酶。
136.如权利要求135所述的方法,其中所述变体葡聚糖酶多肽是耐热性的, 并在暴露于高温之后保留一些活性。
137.如权利要求135所述的方法,其中,相比起由模板核酸编码的葡聚糖酶, 变体葡聚糖酶多肽具有增加的糖基化作用。
138.如权利要求135所述的方法,其中,所述变体葡聚糖酶多肽在高温下具 有葡聚糖酶活性,其中由模板核酸编码的葡聚糖酶在高温下无活性。
139.如权利要求131所述的方法,其中所述方法可以迭代反复,直到产生与 所述模板核酸的密码子使用相比,具有改变了的密码子使用的葡聚糖酶编码序列。
140.如权利要求131所述的方法,其中,所述方法可以迭代反复,直到产生 与由所述模板核酸的信息表达水平或稳定性相比,具有较高或较低的信息表达水 平或稳定性的葡聚糖酶基因。
141.在编码具有葡聚糖酶活性的多肽的核酸中修改密码子以增加其在宿主细 胞中的表达的方法,该方法包括步骤:
(a)提供编码具有葡聚糖酶活性的多肽的核酸,包括在权利要求1或权利要求 24中所示的序列;和
(b)鉴定步骤(a)的核酸中的非典型或不太典型的密码子,用典型的或中度使用 的与被替换密码子编码相同基酸的密码子替换,其中所述的典型密码子是在宿 主细胞基因的编码序列中出现频率较高的密码子,非典型的或不太典型的密码子 是在宿主细胞基因的编码序列中出现频率较低的密码子,由此修饰核酸以增加其 在宿主细胞中的表达。
142.在编码葡聚糖酶多肽的核酸中修改密码子的方法,该方法包括步骤:
(a)提供编码具有葡聚糖酶活性的多肽的核酸,包括在权利要求1或权利要求 24中所示的序列;和
(b)鉴定步骤(a)的核酸中的密码子,替换以与被替换密码子编码相同氨基酸的 不同密码子,由此在编码葡聚糖酶的核酸中修改密码子。
143.在编码葡聚糖酶多肽的核酸中修改密码子以增加其在宿主细胞中的表达 的方法,该方法包括步骤:
(a)提供编码葡聚糖酶多肽的核酸,包括在权利要求1或权利要求24中所示 的序列;和
(b)鉴定步骤(a)的核酸中的非典型或不太典型的密码子,并替换以与被替换密 码子编码相同氨基酸的典型或中度使用的密码子,其中典型的密码子是在宿主细 胞基因的编码序列中出现频率很高的密码子,非典型或不太典型的密码子是在宿 主细胞基因的编码序列中出现频率很低的密码子,由此修饰核酸以增加其在宿主 细胞中的表达。
144.在编码具有葡聚糖酶活性的多肽的核酸中修改密码子以减少其在宿主细 胞中表达的方法,该方法包括步骤:
(a)提供编码葡聚糖酶多肽的核酸,包括在权利要求1或权利要求24中所示 的序列;和
(b)鉴定步骤(a)的核酸中的至少一个典型密码子,替换以与被替换密码子编码 相同氨基酸的非典型或不太典型的密码子,其中典型的密码子是宿主细胞基因的 编码序列中出现频率很高的密码子,非典型或不太典型的密码子是宿主细胞基因 的编码序列中出现频率很低的密码子,由此修饰核酸以减少其在宿主细胞中的表 达。
145.如权利要求144所述的方法,其中所述宿主细胞是细菌细胞、真菌细胞、 昆虫细胞、酵母细胞、植物细胞、或哺乳动物细胞。
146.一种产生编码多个被修饰的葡聚糖酶活性位点或底物结合位点的核酸文 库的方法,其中所述的被修饰的活性位点或底物结合位点源自含有编码第一活性 位点或第一底物结合位点的序列的第一核酸,该方法包括步骤:
(a)提供编码第一活性位点或第一底物结合位点的第一核酸,其中所述的第一 核酸序列包括可在严紧性条件下与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、 SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、 SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、 SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、 SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、 SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、 SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、 SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、 SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、 SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、 SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、 SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、 SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、 SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、 SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、 SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、 SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、 SEQ ID NO:397SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、 SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、 SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、 SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、 SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、 SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、 SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517中所示的序列或其亚序列杂交的序列,和编码葡聚 糖酶活性位点或葡聚糖酶底物结合位点的核酸;
(b)提供一组诱变性的寡核苷酸,它们在所述第一核酸的多个目标密码子处编 码天然发生的氨基酸变异;和
(c)使用该组诱变性的寡核苷酸产生一组编码活性位点或编码底物结合位点 的变异核酸,它们在被诱变的各个氨基酸密码子处编码一定范围的氨基酸变异, 由此产生编码多个被修饰的葡聚糖酶活性位点或底物结合位点的核酸文库。
147.如权利要求145所述的方法,包括通过以下的方法诱变步骤(a)的第一核 酸,所述方法包括优化的定向进化系统、基因位点饱和诱变(Gene Site-Saturation MutagenesisTM(GSSMTM))或合成连接重装配(SLR)。
148.如权利要求145所述的方法,包括通过下述方法对步骤(a)的第一条核酸 或变体进行诱变:易错PCR、重排、寡核苷酸定点诱变、装配PCR、有性PCR诱 变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基 因重装配、基因位点饱和诱变(Gene Site-Saturation MutagenesisTM(GSSMTM))、 合成连接重装配(SLR)和它们的组合。
149.如权利要求所述的方法145,包括通过下述方法对步骤(a)的第一条核酸 或变体进行诱变:重组、递归序列重组、硫代磷酸酯-修饰的DNA诱变、含有尿 嘧啶模板的诱变、缺口双链体诱变、点错配修复诱变、修复-缺陷型宿主株诱变、 化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、 整体诱变、嵌合核酸多聚体生成以及它们的组合。
150.制备小分子的方法,包括步骤:
(a)提供能够合成或修饰小分子的多个生物合成酶,其中所述的酶中的一个包 括由含有权利要求1或权利要求24中所示序列的核酸编码的葡聚糖酶;
(b)为步骤(a)中的至少一个酶提供底物;和
(c)将步骤(b)的底物与所述酶在可促进多个生物催化反应的条件下反应,通过 一系列生物催化反应产生小分子。
151.修饰小分子的方法,包括步骤:
(a)提供葡聚糖酶,其中所述的酶包括在权利要求64中所示的多肽,或由含 有权利要求1或权利要求24中所示核酸序列的核酸编码的多肽;
(b)提供小分子;和
(c)将步骤(a)的酶与步骤(b)的小分子在可促进葡聚糖酶催化的酶促反应的条 件下反应,由此通过葡聚糖酶酶促反应修饰小分子。
152.如权利要求151所述的方法,包括为步骤(a)的酶提供多个小分子底物, 由此通过葡聚糖酶催化的至少一个酶促反应产生修饰的小分子文库。
153.如权利要求151所述的方法,进一步包括在可促进酶的多个生物催化反 应的条件下提供多个额外的酶,通过多个酶促反应产生修饰的小分子文库。
154.如权利要求153所述的方法,进一步包括以下的步骤,即检测文库以确 定显示有所需的活性的特定的被修饰小分子是否存在于该文库内。
155.如权利要求154所述的方法,其中所述的检测文库的步骤进一步包括系 统性的除去用来在文库中产生多个被修饰小分子的一部分的其中一个生物催化反 应以外的所有反应,通过检测该部分被修饰的小分子是否存在具有所需活性的特 定的被修饰小分子,鉴定产生具有所需活性的特定的被修饰小分子的至少一个特 异性生物催化反应。
156.确定葡聚糖酶的功能片段的方法,包括步骤:
(a)提供葡聚糖酶,其中所述的酶包括权利要求64中所示的多肽,或由权利 要求1或权利要求24中所示的核酸编码的多肽;和
(b)从步骤(a)的序列中删除多个氨基酸残基,检测剩余的亚序列的葡聚糖酶活 性,由此确定葡聚糖酶的功能片段。
157.权利要求156中的方法,其中所述的葡聚糖酶活性的测定是通过提供葡 聚糖酶底物,检测底物量的减少或反应产物量的增加。
158.通过使用实时代谢流分析进行新的或修饰的表现型的全细胞工程改造的 方法,包括步骤:
(a)通过修饰细胞的遗传组成,产生修饰的细胞,其中所述遗传组成通过往所 述细胞中加入含有权利要求1或权利要求24中所示的序列的核酸而被修饰;
(b)培养所述被修饰的细胞,产生多个修饰的细胞;
(c)通过以实时方式监控步骤(b)的细胞培养物,测量所述细胞的至少一种代谢 参数;
(d)分析步骤(c)的数据,确定测量到的参数是否与在相似条件下的未修饰细胞 的可比较的测量结果有所不同,从而应用实时代谢流分析确定所述细胞中工程化 的表型。
159.如权利要求158所述的方法,其中所述的细胞遗传组成通过以下的方法 被修饰,所述方法包括在细胞中删除序列或修饰序列,或敲除基因的表达。
160.如权利要求158所述的方法,进一步包括选择含有刚被改造的表现型的 细胞。
161.如权利要求160所述的方法,进一步包括培养被选择的细胞,由此产生 了含有刚被改造的表现型的新细胞株。
162.分离或重组的信号序列,由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、 SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、 SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、 SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、 SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、 SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、 SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、 SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ IDNO:106、 SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134; SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO: 144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、 SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、 SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、 SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、 SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、 SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、 SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、 SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、 SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、 SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、 SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、 SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ IDNO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、 SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、 SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、 SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、 SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、 SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、 SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、 SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、 SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、 SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、 SEQ ID NO:516或SEQ ID NO:518残基1至14、1至15、1至16、1至17、1至 18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至 27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至 36、1至37、1至38、1至40、1至41、1至42、1至43或1至44所示的序列的 组成;或由在表3中所示的序列组成。
163.嵌合多肽,其含有至少第一结构域和至少第二结构域,所述的至少第一 结构域含有具有权利要求162所示序列的信号肽(SP),所述的至少第二结构域含 有异源的多肽或肽,其中所述的异源多肽或肽与信号肽(SP)不是天然相关的。
164.如权利要求163所述的嵌合多肽,其中所述的异源多肽或肽不是葡聚糖 酶或内切葡聚糖酶。
165.如权利要求163所述的嵌合多肽,其中所述的异源多肽或肽是在信号肽 (SP)或葡聚糖酶或内切葡聚糖酶催化结构域(CD)的氨基末端、羧基末端或两 个末端上。
166.分离出的或重组的核酸,其编码嵌合多肽,其中所述的嵌合多肽含有至 少第一结构域和至少第二结构域,所述的至少第一结构域含有具有权利要求162 所示序列的信号肽(SP),所述的至少第二结构域含有异源的多肽或肽,其中所 述的异源多肽或肽与信号肽(SP)不是天然相关的。
167.增加葡聚糖酶多肽的耐热性或热稳定性的方法,所述方法包括对葡聚糖 酶进行糖基化,其中所述的多肽包括在权利要求60中所示的多肽或由权利要求1 或权利要求24中所示核酸编码的多肽的至少30个连续氨基酸,由此增加所述葡 聚糖酶的耐热性或热稳定性。
168.在细胞中过量表达重组葡聚糖酶的方法,包括表达含有权利要求1或权 利要求24中所示的核酸序列的载体,其中所述的过量表达通过使用高活性的启动 子、双顺反子载体或通过载体的基因扩增来完成。
169.制备转基因植物的方法,包括步骤:
(a)将异源核酸序列导入进细胞中,其中所述的异源核酸序列包括在权利要求 1或权利要求24中所示的序列,由此产生转化的植物细胞;
(b)从转化的细胞产生转基因植物。
170.如权利要求169所述的方法,其中步骤(a)进一步包括通过电穿孔或植物 细胞原生质体的微注射来导入异源的核酸序列。
171.如权利要求169所述的方法,其中步骤(a)包括通过DNA微粒轰击或通 过使用根癌农杆菌(Agrobacterium tumefaciens)宿主将异源核酸序列直接导入进 植物组织中。
172.在植物细胞中表达异源核酸序列的方法,包括步骤:
(a)用可操作性地连接于启动子的异源核酸序列转化植物细胞,其中所述的异 源核酸序列包括权利要求1或权利要求24中所示的序列;
(b)使植物在一定条件下生长,其中所述的异源核酸序列在植物细胞中被表 达。
173.水解、分解或破坏含葡聚糖的组合物的方法,包括步骤:
(a)提供权利要求64中所示的具有葡聚糖酶活性的多肽,或由权利要求1或 权利要求24中所示的核酸编码的多肽;
(b)提供含有葡聚糖的组合物;和
(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,其中所述的葡聚糖 酶可水解、分解或破坏含葡聚糖的组合物。
174.如权利要求173所述的方法,其中所述的组合物包括植物细胞、细菌细 胞、酵母细胞、昆虫细胞或动物细胞。
175.面团或面包产品,包括权利要求64中所述的多肽。
176.改良面团的方法,包括将面团或面包产品与权利要求64中所示的至少一 种多肽在足以改进面团的条件下接触。
177.饮料,含有权利要求64中所示的多肽。
178.生产饮料的方法,包括在足以降低饮料粘度的条件下向饮料或饮料前体 中加入权利要求64中所示的至少一种多肽。
179.如权利要求178所述的方法,其中所述的饮料或饮料前体是麦芽汁或啤 酒。
180.食物、饲料或营养添加物,包括权利要求64中所示的多肽。
181.在动物饮食中使用葡聚糖酶作为营养添加物的方法,该方法包括:
制备含有葡聚糖酶的营养添加物,所述的葡聚糖酶含有权利要求64中所示多 肽的至少30个连续氨基酸;和
将所述营养添加物给予动物以增加包含在被动物消化的饲料或食物中的木聚 糖的利用。
182.如权利要求181所述的方法,其中所述的动物是人。
183.如权利要求181所述的方法,其中所述的动物是人。
184.如权利要求181所述的方法,其中所述的动物是反刍动物单胃动物
185.权利要求181中的方法,其中所述的葡聚糖酶通过在选自细菌、酵母、 植物、昆虫、真菌和动物的生物体中表达编码葡聚糖酶的多核苷酸而制备出来。
186.如权利要求185所述的方法,其中所述的生物体选自裂变酵母(S.pombe)、 啤酒酵母(S.cerevisiae)、巴斯德毕赤酵母(Pichia pastoris)、大肠杆菌(E.coli)、链霉 菌属的种(Streptomyces sp.)、杆菌属的种(Bacillus sp.)和乳酸杆菌属的种 (Lactobacillus sp.)。
187.可食用的酶输送基质,其含有热稳定的重组葡聚糖酶。
188.权利要求187中的可食用酶输送基质,其含有权利要求64中所示的多肽。
189.将葡聚糖酶补充物输送至动物的方法,所述方法包括:
以丸的形式制备可食用的酶输送基质,所述丸包括颗粒状的可食用载剂和热 稳定的重组葡聚糖酶,其中所述的丸很容易将包含在其中的葡聚糖酶分散至水介 质中,以及
将该可食用的酶输送基质给予所述动物。
190.如权利要求189所述的方法,其中所述的重组葡聚糖酶包括权利要求64 中所示的多肽。
191.如权利要求189所述的方法,其中所述的颗粒状可食用载剂包括选自谷 物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉和小麦粗 粉的载体。
192.如权利要求189所述的方法,其中所述的可食用载剂包括去油的谷物胚 芽。
193.如权利要求189所述的方法,其中所述的葡聚糖酶被糖基化以便在制丸 条件下提供热稳定性。
194.如权利要求189所述的方法,其中所述的输送基质通过将含有谷物胚芽 和葡聚糖酶的混合物制丸而形成。
195.如权利要求189所述的方法,其中所述的制丸条件包括应用蒸汽
196.如权利要求189所述的方法,其中所述的制丸条件包括应用超过大约 80℃的温度大约5分钟,所述酶保留有每毫克酶至少350至大约900单位的比活 性。
197.分离出的或重组的核酸,其包含编码具有葡聚糖酶活性的多肽的序列和 信号序列,其中所述的核酸包括在权利要求1中所示的序列。
198.如权利要求197所述的分离出的或重组的核酸,其中所述的信号序列来 自另一个葡聚糖酶或非葡聚糖酶。
199.分离出的或重组的核酸,其包含编码具有葡聚糖酶活性的多肽的序列, 其中所述的序列不含有信号序列,所述核酸包括在权利要求1中所示的序列。
200.纤维素-或纤维素衍生物-组合物,包含权利要求64所述的多肽。
木材、木浆或木制品,包含权利要求64所述的多肽。
纸、纸浆或纸产品,包含权利要求64所述的多肽。
还原在纸、木材或木制品中的木质素的方法,包括将纸、木材或木制品 与权利要求64中所示的多肽接触。
洗涤剂组合物,其含有权利要求64中所示的多肽。
药学组合物,其含有权利要求64中所示的多肽。
消灭含葡聚糖的微生物或保护动物免遭含葡聚糖的微生物的伤害的方 法,包括给予权利要求64中所示的多肽。
如权利要求206所述的方法,其中所述微生物是细菌。
如权利要求207所述的方法,其中所述的细菌是沙氏菌。
燃料,含有权利要求64中所示的多肽。
210.制备燃料的方法,包括将可发酵糖与权利要求64中所示的多肽接触。
211.乳制品,含有权利要求64中所示的多肽。
212.如权利要求211所述的乳制品,包含乳、激凌、干酪或乳酪。
213.改善乳制品质地和味的方法,包括下述步骤:(a)提供权利要求64中 所示的本发明多肽;(b)提供乳制品;和(c)在葡聚糖酶可以改善所述乳制品质地 或风味的条件下,将步骤(a)的多肽与步骤(b)的乳制品接触。
214.分离出的或重组的多肽,具有权利要求60中示出的序列,并包括至少一 个氨基酸残基保守取代。
215.如权利要求214所述的分离或重组的多肽,其中所述保守取代包括用另 一脂肪族氨基酸取代脂肪族氨基酸;用苏氨酸取代丝氨酸或反过来;用另一酸性 残基取代酸性残基;用另一携带酰胺基团的残基取代携带酰胺基团的残基;用另 一碱性残基替换碱性残基;或用另一芳香族残基取代芳香族残基,或它们的组合。
216.如权利要求215所述的分离或重组的多肽,所述脂肪族残基包括丙氨酸、 缬氨酸、亮氨酸、异亮氨酸或它们的合成等同物。
217.如权利要求215所述的分离或重组的多肽,其中所述酸性残基包括 天冬氨酸、谷氨酸或它们的合成等同物。
218.如权利要求215所述的分离或重组的多肽,其中所述携带酰胺基团的残 基包括天冬氨酸、谷氨酸或它们的合成等同物。
219.如权利要求215所述的分离或重组的多肽,其中所述碱性基团包括赖氨 酸、精氨酸或它们的合成等同物。
220.如权利要求215所述的分离或重组的多肽,其中所述芳香族残基包括苯 丙氨酸、酪氨酸或它们的合成等同物。

说明书全文

发明领域

[0002]总体上说,本发明涉及酶,编码该酶的多核苷酸,该多核苷酸和多肽 的用途;更具体地,本发明涉及具有葡聚糖酶,例如内切葡聚糖酶活性的多肽(例 如酶、抗体),内切葡聚糖酶活性例如催化内部的内-β-1,4-和/或β-1,3-葡聚糖酶键 (glucanase linkages)的解。在一个方面,内切葡聚糖酶活性(例如内-1,4-β-D- 葡聚糖4-葡聚糖水解酶活性)包括水解在纤维素、纤维素生物(例如羧甲基纤维素 和羟乙基纤维素)、地衣多糖中的1,4-和/或β-1,3-β-D-糖苷键,水解混合的β-1,3- 葡聚糖,诸如谷物β-D-葡聚糖或木葡聚糖和含有纤维素部分的其他植物或有机物 质中的β-1,4键。在一个方面,本发明多肽具有木聚糖酶或甘露聚糖酶活性。

发明背景

[0003]内切葡聚糖酶(例如内-β-1,4-葡聚糖酶,EC 3.2.1.4;内-β-1,3(1)-葡聚糖 酶,EC 3.2.1.6;内-β-1,3-葡聚糖酶,EC 3.2.1.39)水解纤维素和葡聚糖的内部β-1,4- 和/或β-1,3-糖苷键,产生分子量较小的葡萄糖和葡萄糖寡聚体。葡聚糖是多糖, 由1,4-β-和/或1,3-糖苷-连接的D-吡喃型葡萄糖形成。内切葡聚糖酶具有相当大的 商业价值,被用于食品工业、用于焙烤和果蔬加工、农业废物降解、用于生产动 物饲料(例如鸡饲料)、用于浆和纸的生产、纺织品制造和家用和工业洗涤剂。内切 葡聚糖酶由真菌和细菌产生。
[0004]β-葡聚糖是谷物中主要的非-淀粉多糖。取决于种类和生长条件,葡聚 糖含量可以变化很大。这种多糖的物化特性导致能在化条件下产生粘性溶液或 者甚至产生凝胶。此外,葡聚糖的水结合能(water-binding capacity)高。所有 这些特性为若干工业包括酿造、焙烤、动物营养带来了问题。在酿造应用中,葡 聚糖的存在产生麦芽汁过滤性和浑浊形成问题(haze formation issues)。在焙烤应 用(特别是糕点和脆饼)中,葡聚糖会产生发粘面团,这使得难以加工(machine), 并会减小饼干的大小。此外,该水化合物与焙烤的产品的快速再水化密切相关, 导致脆性丧失,货架期减短。对于用谷物食物制成的单胃动物(monogastric animal) 。 饲料的应用,β-葡聚糖是肠内物质粘性的成因,因此不利地影响饲料的可消化性和 动物的生长速度。对于反刍动物,这些β-葡聚糖是摄入的纤维的基本组分,葡聚 糖较完全的消化将有助于获得较高的食物转化效率。内切葡聚糖酶在动物胃中具 有活性对动物饲料是有利的。
[0005]内切葡聚糖酶对于消化所有植物物质中发现的纤维素、β-1,4-连接的葡 聚糖也是重要的。纤维素是自然界中最丰富的多糖。消化纤维素的酶在浆和纸工 业、在纺织品制造以及家用和工业用洗涤剂中具有利用价值。
[0006]在此讨论的出版物被提供,仅仅是显示了它们先于本发明申请日而公 开。并不能凭借在此的任何内容认为,本发明没有资格先于在前发明的那些公开 内容。发明概述
[0007]本发明提供了分离的、合成的、或重组的核酸,该核酸包括与本发明 的示范性核酸具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、 59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、或更大的序列同一性或完全的(100%)序列同一性的核酸序列,所述本 发明的示范性核酸例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、 SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、 SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、 SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、 SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、 SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、 SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、 SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、 SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、 SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、 SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、 SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO: 117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、 SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO: 145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、 SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、 SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、 SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、 SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、 SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、 SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、 SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、 SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、 SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、 SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、 SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、 SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、 SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、 SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、 SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、 SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、 SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、 SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、 SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、 SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515 或SEQ ID NO:517,所述序列同一性在至少约10、15、20、25、30、35、40、45、 50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、 750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、 1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、 2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多残基的 区域内,所述核酸编码至少一种具有葡聚糖酶,例如内切葡聚糖酶活性,木聚糖 酶或甘露聚糖酶活性的多肽,所述序列同一性通过用序列比较算法(sequence comparison algorithm)分析或通过目测检查法(visualinspection)来测定。
[0008]本发明示范性的核酸也包括分离的、合成的、或重组的核酸,该核酸 编码本发明的多肽,例如具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、 SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144; NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、 SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、 SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、 SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、 SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、 SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、 SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、 SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、 SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ IDNO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、 SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、 SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、 SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、 SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、 SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、 SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、 SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、 SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、 SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、 SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、 SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、 SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、 SEQ ID NO:516或SEQ ID NO:518中示出的序列和它们的亚序列的多肽,和这些 多肽的变体。在一个方面,多肽具有葡聚糖酶,例如内切葡聚糖酶活性,例如催 化内部内-β-1,4-和/或1,3-葡聚糖酶键的水解;以及具有木聚糖酶或甘露聚糖酶活 性。
[0009]在一个方面,本发明也提供了编码葡聚糖酶的核酸,它们具有同样的 新颖性,这是因为都它们来自混合的培养物。本发明提供了分离自混合培养物的 编码葡聚糖酶的核酸,该核酸包括与本发明的示范性核酸具有至少约50%、51%、 52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、 78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性,或 完全的(100%)序列同一性的核酸序列,本发明的示范性核酸例如SEQ ID NO:1、 SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、 SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、 SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、 SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、 SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、 SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、 SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、 SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、 SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、 SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、 SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、 SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、 SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、 SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、 SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、 SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、 SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、 SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、 SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、 SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、 SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、 SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、 SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、 SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515或SEQ ID NO:517,序列同一性在至少约10、15、20、25、30、35、40、45、50、60、75、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050、1100、1150或更多残基(基)的区域内。 [0010]在一个方面,本发明提供了编码葡聚糖酶的核酸,和由它们编码的多 肽,具有同样的新颖性,这是因为它们来自共同的来源,例如环境来源或古细菌 来源,参见表1。
[0011]在一个方面,本发明也提供了编码葡聚糖酶的核酸,和由它们编码的 多肽,具有同样的新颖性,这是因为它们处于共同的家族3、家族5、家族6、家 族8、家族9、家族12或家族16中,如下面所描述,参见表2A和2B。
[0012]在一个方面,本发明也提供了编码葡聚糖酶的核酸,具有同样的新颖 性,这是因为它们都来自环境来源,例如混合的环境来源。在一个方面,本发明 提供了编码葡聚糖酶的核酸,该核酸分离自环境来源,例如混合的环境来源,包 括与本发明的示范性核酸具有至少约10、15、20、25、30、35、40、45、50%、 51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、 64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、 77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更大的序列同 一性,或完全的(100%)序列同一性的核酸序列,所述序列同一性在至少约50、75、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050、1100、1150、1200或更多残基的范围内,其 中所述核酸编码至少一种具有葡聚糖酶活性的多肽,所述序列同一性通过用序列 比较算法分析或通过目测检查法来测定。
[0013]在一个方面,序列比较算法是BLAST版本2.2.2算法,其中将过滤设 置(filtering setting)设为blastall-p blastp-d“nr pataa”-F F,所有其他的选项设置 为默认值。
[0014]本发明的另一方面是分离的、合成的、或重组的核酸,包括本发明的 核酸序列的至少10个连续的碱基、与之基本上相同的序列、和与之互补的序列。
[0015]在一个方面,本发明的葡聚糖酶活性包括内切葡聚糖酶活性,例如内 -1,4-和/或1,3-β-D-葡聚糖4-葡聚糖水解酶活性。在一个方面,内切葡聚糖酶活性 包括催化1,4-β-D-糖苷键的水解。在一个方面,葡聚糖酶,例如内切葡聚糖酶活性 包括内-1,4-和/或1,3-β-内切葡聚糖酶活性或内-β-1,4-葡聚糖酶活性。在一个方面, 葡聚糖酶活性(例如内-1,4-β-D-葡聚糖4-葡聚糖水解酶活性)包括水解在纤维素、纤 维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键; 水解在混合的β-1,3-葡聚糖,诸如谷物β-D-葡聚糖和含有纤维素部分的其他植物物 质中的β-1,4键。
[0016]在一个方面,葡聚糖酶、木聚糖酶或甘露聚糖酶活性包括水解葡聚糖 或其他多糖,产生分子量较小的多糖或寡聚体。在一个方面,葡聚糖包括β-葡聚 糖,诸如水溶性β-葡聚糖。水溶性β-葡聚糖可以构成面团或面包产品。
[0017]在一个方面,葡聚糖酶活性包括水解包含1,4-β-糖苷键连接的D-吡喃 型葡萄糖的多糖。在一个方面,葡聚糖酶活性包括水解纤维素。在一个方面,葡 聚糖酶活性包括水解木浆或纸浆或纸产品中纤维素。
[0018]在一个方面,葡聚糖酶,例如内切葡聚糖酶活性包括催化水解饮料或 饲料(例如动物饲料,诸如鸡饲料)或食物产品中的葡聚糖。饮料、饲料或食物产 品可以包括以谷物为基础的动物饲料、麦芽汁或啤酒、水果或蔬菜。在一个方面, 本发明提供了食物、饲料(例如动物饲料,诸如鸡饲料)、液体,例如饮料(诸如果 汁饮料或啤酒)或饮料前体(例如麦芽汁),其包括本发明多肽。食物可以是面团或 面包产品。饮料或饮料前体可以是果汁饮料、啤酒或麦芽汁。在一个方面,本发 明提供了澄清液体,例如汁液诸如果汁饮料或啤酒的方法,该方法通过用本发明 的酶处理液体来进行。
[0019]在一个方面,本发明提供了面团改良(dough conditioning)的方法, 该方法包括在足以使面团改良的条件下,将面团或面包产品与至少一种本发明的 多肽接触。在一个方面,本发明提供了饮料生产方法,该方法包括在足以降低饮 料粘性的条件下,将至少一种本发明的多肽加入到饮料或饮料前体中。
[0020]在一个方面,葡聚糖酶,例如内切葡聚糖酶活性包括催化水解细胞例 如植物细胞或微生物细胞中的葡聚糖。
[0021]在一个方面,所述分离的、合成的、或重组的核酸编码具有葡聚糖酶, 例如内切葡聚糖酶、木聚糖酶或甘露聚糖酶活性的多肽,这些酶活性是热稳定性 的。在一定的条件下,该多肽能够保留葡聚糖酶、木聚糖酶或甘露聚糖酶或其他 活性,这些条件包括约37℃至约95℃之间、约55℃至约85℃之间、约70℃至约 95℃之间、或约90℃至约95℃之间的温度
[0022]在另一方面,所述分离的、合成的、或重组的核酸编码具有葡聚糖酶, 例如内切葡聚糖酶、木聚糖酶或甘露聚糖酶活性的多肽,这些酶活性是耐热性的。 在暴露于大于37℃至约95℃范围内的温度、或大于55℃至约85℃范围内的任何 温度后,多肽能够保留有葡聚糖酶或其他活性。在暴露于约1℃至约5℃之间、约 5℃至约15℃之间、约15℃至约25℃之间、约25℃至约37℃之间、约37℃至约 95℃之间、约55℃至约85℃之间、约70℃至约75℃之间、或约90℃至约95℃之 间的温度;或更高的温度后,多肽能够保留有葡聚糖酶活性或其他活性。在一个 方面,在pH 4.5时,暴露于大于90℃至约95℃范围内的温度后,多肽能够保留葡 聚糖酶活性或其他活性。
[0023]本发明提供了分离的、合成的、或重组的核酸,该核酸包括这样的序 列,该序列在严紧性条件(stringent conditions)下与包括本发明序列的核酸杂交, 本发明序列例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、 SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、 SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、 SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、 SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、 SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、 SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、 SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、 SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、 SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、 SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、 SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、 SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、 SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、 SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、 SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、 SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、 SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、 SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、 SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、 SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、 SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、 SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、 SEQ ID NO:515或SEQ ID NO:517中示出的序列,或它们的片段或亚序列。在一 个方面,该核酸编码具有葡聚糖酶,例如内切葡聚糖酶、木聚糖酶或甘露聚糖酶 活性的多肽。核酸长度可以至少约10、15、20、25、30、35、40、45、50、75、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050、1100、1150、1200或更多个残基,或基因或 转录物的全长。在一个方面,严紧性条件包括洗涤步骤,包括在0.2×SSC中,在 约65℃的温度中洗涤约15分钟。
[0024]本发明提供了核酸探针,用于鉴定编码具有葡聚糖酶例如内切葡聚糖 酶、木聚糖酶或甘露聚糖酶活性的多肽的核酸,其中,该探针包括序列的至少约 10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000或更多连续的碱基,所述序列包括本发明的序列,或 它们的片段或亚序列,其中所述探针通过结合或杂交鉴定核酸。探针可以包括寡 核苷酸,该寡核苷酸包括序列的至少约10至50、约20至60、约30至70、约40 至80、或约60至100个连续碱基,所述序列包括本发明的序列,或它们的片段或 亚序列。
[0025]本发明提供了核酸探针,用于鉴定编码具有葡聚糖酶例如内切葡聚糖 酶、木聚糖酶或甘露聚糖酶活性的多肽的核酸,其中,所述探针包括这样的核酸, 该核酸包括至少约10、15、20、30、40、50、60、70、80、90、100、150、200、 250、300、350、400、450、500、550、600、650、700、750、800、850、900、 950、1000或更多个残基的序列,与本发明核酸具有至少约50%、51%、52%、53%、 54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、 67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,或完全的(100%) 序列同一性;其中所述序列同一性通过用序列比较算法分析或通过目测检查法来 测定。
[0026]探针可以包括寡核苷酸,该寡核苷酸包括本发明核酸序列,或它们的 亚序列的至少约10至50、约20至60、约30至70、约40至80、或约60至100 个连续碱基。
[0027]本发明提供了扩增引物对(amplification primer pair),用于扩增编码 具有葡聚糖酶活性的多肽的核酸,其中,所述引物对能够扩增包括本发明序列, 或其片段或亚序列的核酸。扩增引物序列对的一条或每条引物可以包括寡核苷酸, 该寡核苷酸包括所述序列的至少约10至50个连续碱基,或所述序列的至少约12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30 或更多个连续的碱基。
[0028]本发明提供了扩增引物对,其中该引物对包括第一条引物和第二条引 物,第一条引物具有本发明核酸的约前(5′端)12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30个或更多残基示出的序列;第二 引物具有第一条引物的互补链的约前(5′端)12、13、14、15、16、17、18、19、20、 21、22、23、24、25、26、27、28、29、30个或更多残基示出的序列。
[0029]本发明提供了编码葡聚糖酶,例如内切葡聚糖酶、编码木聚糖酶或编 码甘露聚糖酶的核酸,该核酸通过使用本发明的扩增引物对,由扩增例如聚合酶 链式反应(PCR)产生。本发明提供了葡聚糖酶、甘露聚糖酶或木聚糖酶,这些酶通 过使用本发明的扩增引物对,由扩增例如聚合酶链式反应(PCR)产生。本发明提供 了制备葡聚糖酶、甘露聚糖酶或木聚糖酶的方法,该方法通过使用本发明的扩增 引物对,由扩增例如聚合酶链式反应(PCR)产生酶。在一个方面,扩增引物对由文 库扩增核酸,文库例如基因文库,诸如环境文库。
[0030]本发明提供了扩增核酸的方法,该核酸编码具有葡聚糖酶,例如内切 葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽,所述方法包括用扩增引物序列对 扩增模板核酸,其中,扩增引物序列对能够扩增本发明的核酸序列,或其片段或 亚序列。
[0031]本发明提供了表达盒(expression cassette),该表达盒包括本发明的 核酸,或其亚序列。在一个方面,表达盒可以包括可操作性地连接到启动子的核 酸。启动子可以是病毒、细菌、哺乳动物或植物启动子。在一个方面,植物启动 子可以是铃薯、大米、玉米、小麦、烟草大麦启动子。启动子可以是组成型 启动子。组成型启动子可以包括CaMV35S。在另一方面,启动子可以是诱导型启 动子。在一个方面,启动子可以是组织特异性启动子或环境调节型启动子或发育 调节型启动子。因此,启动子可以是例如种子-特异性启动子、叶子-特异性启动子、 根-特异性启动子、茎-特异性启动子、或脱落-诱导型启动子(abscission-induced promoter)。在一个方面,表达盒还可以包括植物或植物病毒表达载体。
[0032]本发明提供了克隆载体,该克隆载体包括本发明的表达盒(例如载体), 或本发明的核酸。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒、粘端质粒、 F粘粒(fosmid)、细菌噬菌体或人工染色体。病毒载体可以包括腺病毒载体、逆 转录病毒载体或腺-伴随病毒载体(adeno-associated viral vector)。克隆载体可以 包括细菌人工染色体(BAC)、质粒、噬菌体P1-衍生的载体(bacteriophage P1-Derived vector)(PAC)、酵母人工染色体(YAC)、或哺乳动物人工染色体(MAC)。
[0033]本发明提供了转化的细胞,该转化的细胞包括本发明的核酸,本发明 的表达盒(例如载体),或本发明的克隆载体。在一个方面,转化细胞包括细菌细胞、 哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。在一个方面,植物 细胞可以是谷物、马铃薯、小麦、大米、玉米、烟草或大麦。
[0034]本发明提供了转基因的非-人动物(transgenic non-human animals),该 转基因非-人动物包括本发明的核酸或本发明的表达盒(例如载体)。在一个方面, 动物是小鼠。
[0035]本发明提供了转基因植物,该转基因植物包括本发明的核酸或本发明 的表达盒(例如载体)。转基因植物可以是谷物植物、玉米植物、马铃薯植物、西红 柿植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、大米植物、大麦植 物或烟草植物。
[0036]本发明提供了转基因种子,该转基因种子包括本发明的核酸或本发明 的表达盒(例如载体)。转基因种子可以是谷物植物、玉米种子、小麦仁、含油种子、 油菜籽、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生或烟草植物种子。
[0037]本发明提供了反义寡核苷酸,该反义寡核苷酸包括与本发明核酸互补 的核酸序列,或能够在严紧性条件下与本发明核酸杂交的核酸序列。本发明提供 了抑制葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶的信使在细胞中翻 译的方法,包括给予细胞反义寡核苷酸,或在细胞中表达反义寡核苷酸,该反义 寡核苷酸包括与本发明核酸互补的核酸序列,或能够在严紧性条件下与本发明核 酸杂交的核酸序列。在一个方面,反义寡核苷酸长度为约10至50、约20至60、 约30至70、约40至80、或约60至100个碱基。
[0038]本发明提供了抑制葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚 糖酶信息(message)在细胞中翻译的方法,该方法包括给予细胞反义寡核苷酸, 或在细胞中表达反义寡核苷酸,该反义寡核苷酸包括与本发明核酸互补的核酸序 列,或能够在严紧性条件下与本发明核酸杂交的核酸序列。本发明提供了双链抑 制性RNA(double-stranded inhibitory RNA)(RNAi)分子,其包括本发明序列的亚序 列。在一个方面,RNAi长度为约15、16、17、18、19、20、21、22、23、24、25 或更多个双螺旋核苷酸。本发明提供了抑制葡聚糖酶,例如内切葡聚糖酶、甘露 聚糖酶或木聚糖酶在细胞中表达的方法,该方法包括给予细胞双链抑制性 RNA(iRNA),或在细胞中表达双链抑制性RNA(iRNA),其中该NRA包括本发明 序列的亚序列。
[0039]本发明提供了分离的、合成的、或重组的多肽,该多肽包括与本发明 示范性多肽或肽具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、 59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、或更大的序列同一性,或完全的(100%)序列同一性的基酸序列,所 述同一性在多肽的至少约25、50、75、100、125、150、175、200、225、250、275、 300、325、350个或更多残基的区域内,或多肽的全长区域内,所述序列同一性通 过用序列比较算法分析或通过目测检查法来测定。本发明示范性多肽或肽序列包 括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、 SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、 SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、 SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、 SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、 SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、 SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、 SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、 SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、 SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、 SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、 SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、 SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、 SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、 SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、 SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、 SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、 SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、 SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、 SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、 SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、 SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、 SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、 SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、 SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、 SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、 SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、 SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、 SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、 SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、 SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516或 SEQ ID NO:518和它们的亚序列以及它们的变体。示范性多肽也包括长度为至少约 10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、 400、450、500、550、600个或更多个残基的片段,或为酶的全长。本发明示范性 多肽或肽序列包括本发明核酸编码的序列。本发明的示范性多肽或肽序列包括被 本发明的抗体特异性结合的多肽或肽。
[0040]在一个方面,本发明多肽具有葡聚糖酶,例如内切葡聚糖酶、甘露聚 糖酶或木聚糖酶活性中的至少一种。
[0041]在一个方面,内切葡聚糖酶活性包括内-1,4-β-D-葡聚糖4-葡聚糖水解 酶活性。在一个方面,内切葡聚糖酶活性包括催化水解1,4-β-D-糖苷键或1,3-β-D- 糖苷键。在一个方面,内切葡聚糖酶活性包括内-1,4-β-内切葡聚糖酶活性,或内 -β-1,4-葡聚糖酶活性、内切-1,3-β-内切葡聚糖酶活性或内-β-1,3-葡聚糖酶活性。在 一个方面,葡聚糖酶活性(例如内-1,4和/或1,3-β-D-葡聚糖4-葡聚糖水解酶活性)包 括水解在纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中 的1,4-β-D-糖苷键,以及混合的β-1,3-葡聚糖,诸如谷物β-D-葡聚糖或木葡聚糖和 含有纤维素部分的其他植物物质中的β-1,4和/或1,3键。
[0042]本发明的另一方面提供了分离的、合成的、或重组的多肽或肽,该多 肽或肽包括本发明的多肽或肽序列、与它们基本上相同的序列、和与它们互补的 序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、 85、90、95或100或更多个连续的碱基。多肽可以是例如免疫原性片段、基序 (motif)(例如结合位点)、信号序列、前体序列(prepro sequence)、催化区域(CDs) 或活性位点。
[0043]本发明提供了分离的、合成的、或重组的核酸,该核酸包括编码具有 葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽的序列以及信 号序列,其中,所述核酸包括本发明的序列。信号序列可以来自另一葡聚糖酶、 甘露聚糖酶或木聚糖酶或非葡聚糖酶等,即异源酶。本发明提供了分离的、合成 的、或重组的核酸,该核酸包括编码具有葡聚糖酶,例如内切葡聚糖酶、甘露聚 糖酶或木聚糖酶活性的多肽的序列,其中该序列不含有信号序列,所述核酸包括 本发明的序列。
[0044]在一个方面,葡聚糖酶,例如内切葡聚糖酶活性包括催化水解1,4-β-D- 糖苷键或1,3-β-D-糖苷键。在一个方面,内切葡聚糖酶活性包括内-1,4-β-内切葡聚 糖酶活性。
[0045]在一个方面,内切葡聚糖酶活性包括催化水解葡聚糖,产生分子量较 小的多糖或寡聚体。在一个方面,葡聚糖包括β-葡聚糖诸如水溶性β-葡聚糖。水 溶性β-葡聚糖可以构成面团或面包产品。
[0046]在一个方面,葡聚糖酶活性包括水解多糖,该多糖包括1,4-β-糖苷-连 接的D-吡喃型葡萄糖。在一个方面,葡聚糖酶活性包括水解纤维素。在一个方面, 葡聚糖酶活性包括水解木浆或纸浆或纸产品中的纤维素。
[0047]在一个方面,葡聚糖酶、木聚糖酶或甘露聚糖酶活性包括催化水解饲 料(例如动物饲料,诸如鸡饲料)或食物产品中的葡聚糖或其他碳水化合物。饲料或 食物产品可以包括谷物为基础的动物饲料、麦芽汁或啤酒、水果或蔬菜。
[0048]在一个方面,葡聚糖酶、木聚糖酶或甘露聚糖酶活性包括催化水解细 胞中的葡聚糖或其他碳水化合物,所述细胞诸如植物细胞、真菌细胞、或微生物(例 如细菌)细胞。
[0049]在一个方面,葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶 具有热稳定性。在一定的条件下,多肽能够保持葡聚糖酶、甘露聚糖酶或木聚糖 酶活性,所述条件包括约1℃至约5℃之间、约5℃至约15℃之间、约15℃至约 25℃之间、约25℃至约37℃之间、约37℃至约95℃之间、约55℃至约85℃之间、 约70℃至约75℃之间、或约90℃至约95℃之间的温度,或更高的温度。在另一 方面,葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶可以是耐热性的。 在暴露于大于37℃至约95℃范围内的温度、或大于55℃至约85℃范围内的温度 之后,多肽能够保留葡聚糖酶、甘露聚糖酶或木聚糖酶活性。在一个方面,在pH 4.5,暴露于大于90℃至约95℃范围内的温度后,多肽能够保留葡聚糖酶、甘露聚 糖酶或木聚糖酶活性。
[0050]在一个方面,所述分离的、合成的、或重组的多肽可以包括缺少信号 序列的本发明多肽。在一个方面,所述分离的、合成的、或重组的多肽可以包括 本发明多肽,该多肽包括异源信号序列,诸如异源葡聚糖酶、甘露聚糖酶或木聚 糖酶信号序列,或非-葡聚糖酶、甘露聚糖酶或木聚糖酶的信号序列。
[0051]在一个方面,本发明提供了嵌合蛋白质,该嵌合蛋白质包括第一结构 域(domian)和至少一个第二结构域,所述第一结构域包括本发明的信号序列。 蛋白质可以是融合蛋白。第二结构域可以包括酶。所述酶可以是葡聚糖酶,例如 内切葡聚糖酶、甘露聚糖酶或木聚糖酶。
[0052]本发明提供了嵌合蛋白质,该嵌合蛋白质包括第一结构域和至少一个 第二结构域,所述第一结构域包括本发明的信号肽(signa1peptide(SP))、前体序列 和/或催化区域(catalytic domain(CD));所述第二结构域包括异源多肽或肽,其中异 源多肽或肽与信号肽(signal peptide(SP))、前体序列和/或催化区域(catalytic domain (CD))非自然连接。在一个方面,异源多肽或肽不是葡聚糖酶、甘露聚糖酶或木聚 糖酶。异源多肽或肽可以位于信号肽(signal peptide(SP))、前体序列和/或催化区域 (catalytic domain(CD))的氨基末端、羧基末端或两个末端。
[0053]本发明提供了编码嵌合多肽的分离的、合成的、或重组的核酸,其中, 所述嵌合多肽包括第一结构域和至少一个第二结构域,所述第一结构域包括本发 明的信号肽(signal peptide(SP))、前体序列和/或催化区域(catalytic domain(CD));所 述第二结构域包括异源多肽或肽,其中异源多肽或肽与信号肽(signal peptide(SP))、 前体序列和/或催化区域(catalytic domain(CD))非自然连接。
[0054]本发明提供了分离的、合成的、或重组的信号序列(例如信号肽),该 信号序列由本发明多肽的残基1至14、1至15、1至16、1至17、1至18、1至 19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至 28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至 37、1至38、1至40、1至41、1至42、1至43或1至44示出的序列组成,所述 本发明多肽例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、 SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、 SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144; NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、 SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、 SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、 SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、 SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、 SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、 SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、 SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、 SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、 SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、 SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、 SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、 SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、 SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、 SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、 SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、 SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、 SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、 SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、 SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、 SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、 SEQ ID NO:516、SEQ ID NO:518。本发明提供了分离的、合成的、或重组的信号 序列(例如信号肽),其由下面表3中描述的序列组成,或包括下面表3中描述的序 列。
[0055]在一个方面,葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶 活性,包括在37℃每毫克蛋白质约1至约1200单位范围内的比活性(specific activity),或每毫克蛋白质约100至约1000单位范围内的比活性。在另一方面, 葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶活性包括每毫克蛋白质约 100至约1000单位的比活性,或每毫克蛋白质约500至约750单位的比活性。可 选择地,葡聚糖酶、甘露聚糖酶或木聚糖酶活性包括在37℃,每毫克蛋白质约1 至约750单位范围内的比活性,或每毫克蛋白质约500至约1200单位范围内的比 活性。在一个方面,葡聚糖酶,甘露聚糖酶或木聚糖酶活性包括在37℃,每毫克 蛋白质约1至约500单位范围内的比活性,或每毫克蛋白质约750至约1000单位 范围内的比活性。在另一方面,聚糖酶、甘露聚糖酶或木聚糖酶活性包括在37℃, 每毫克蛋白质约1至约250单位范围内的比活性。可选择地,葡聚糖酶,例如内 切葡聚糖酶、甘露聚糖酶或木聚糖酶活性包括在37℃,每毫克蛋白质约1至约100 单位范围内的比活性。在另一个方面,耐热性包括在被加热至高温后,仍能保留 葡聚糖酶、甘露聚糖酶或木聚糖酶在37℃的比活性的至少一半。可选择地,耐热 性可以包括在加热至高温后,可以保留在37℃的、范围为每毫克蛋白约1至约1200 个单位或每毫克蛋白约500至约1000个单位的比活性。在另一个方面,耐热性可 以包括在加热至高温后保留在37℃的、范围为每毫克蛋白约1至约500个单位的 比活性。
[0056]本发明提供了分离的、合成的、或重组的本发明多肽,其中多肽包括 至少一个糖基化位点。在一个方面,糖基化可以是N-连接糖基化。在一个方面, 多肽可以在巴斯德毕赤酵母(P.pastoris)或粟酒裂殖酵母(S.pombe)中表达之 后被糖基化。
[0057]在一个方面,多肽可以在包括约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5 或pH 4的条件下,保留葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶活 性。在另一方面,多肽可以在包括约pH 7、pH 7.5 pH 8.0、pH 8.5、pH 9、pH 9.5、 pH 10、pH 10.5或pH 11的条件下,保留葡聚糖酶、甘露聚糖酶或木聚糖酶活性。 在一个方面,多肽可以在暴露于包括约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4的条件后,保留葡聚糖酶、甘露聚糖酶或木聚糖酶活性。在另一方面,多肽可以 在暴露于包括约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5 或pH 11的条件后,保留葡聚糖酶、甘露聚糖酶或木聚糖酶活性。
[0058]本发明提供了包括本发明的多肽的蛋白质制品(preparation),其中该 蛋白质制品包括液体、固体或凝胶。
[0059]本发明提供了异源二聚体(heterodimer),该异源二聚体包括本发明 多肽和第二蛋白质或结构域。异源二聚体的第二成分(member)可以是不同的聚 糖酶,不同的酶或不同的蛋白质。在一个方面,第二结构域可以是多肽,异源二 聚体可以是融合蛋白质。在一个方面,第二结构域可以是表位或标记。在一个方 面,本发明提供了包括本发明多肽的同源二聚体(homodimer)。
[0060]本发明提供了具有葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚 糖酶活性的固定化多肽(immobilized polypeptide),其中,所述多肽包括本发明 多肽、本发明核酸编码的多肽、或包括本发明多肽和第二结构域的多肽。在一个 方面,多肽可以固定在细胞、金属、树脂聚合物、陶瓷、玻璃、微电极石墨 颗粒、珠、凝胶、板、阵列或毛细管上。
[0061]本发明提供了包括本发明的固定化核酸的阵列(array)。本发明提供 了包括本发明的抗体的阵列。
[0062]本发明提供了分离的、合成的、或重组的抗体,该抗体特异性地结合 到本发明多肽,或结合到本发明核酸编码的多肽。抗体可以是单克隆抗体或多克 隆抗体。本发明提供了杂交瘤,该杂交瘤包括本发明抗体,例如特异性地结合到 本发明多肽,或结合到本发明核酸编码的多肽的抗体。
[0063]本发明提供了分离或鉴定具有葡聚糖酶,例如内切葡聚糖酶、甘露聚 糖酶或木聚糖酶活性的多肽的方法,包括步骤:(a)提供本发明抗体;(b)提供包 括多肽的样品;和(c)在抗体能够特异性结合到多肽的条件下,将步骤(b)的样品与 步骤(a)的抗体接触,从而分离或鉴定具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性 的多肽。
[0064]本发明提供了制备抗-葡聚糖酶、甘露聚糖酶或木聚糖酶抗体的方法, 该方法包括:给予非-人动物本发明的核酸或本发明的多肽或其亚序列 (subsequence),给予量为足以产生体液免疫应答的数量,从而制备抗-葡聚糖酶、 甘露聚糖酶或木聚糖酶抗体。本发明提供了产生抗-葡聚糖酶、甘露聚糖酶或木聚 糖酶体液或细胞免疫应答的方法,该方法包括给予非-人动物本发明的核酸或本发 明的多肽或其亚序列,给予量足以产生免疫应答。
[0065]本发明提供了制备重组多肽的方法,包括步骤:(a)提供可操作性地连 接到启动子的本发明核酸;和(b)在允许表达多肽的条件下,表达步骤(a)的核酸, 从而产生重组多肽。在一个方面,该方法还可以包括用步骤(a)的核酸转化宿主细 胞,然后表达步骤(a)的核酸,从而在转化的宿主细胞中产生重组多肽。
[0066]本发明提供了鉴定具有葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或 木聚糖酶活性的多肽的方法,包括下述步骤:(a)提供本发明的多肽;或本发明的 核酸编码的多肽;(b)提供葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚糖酶 的底物;和(c)将步骤(a)的多肽或其片段或其变体与步骤(b)的底物接触,并检测底 物数量的减少或反应产物数量的增加,其中,底物数量的减少或反应产物数量的 增加表明检测到具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽。
[0067]本发明提供了鉴定葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚 糖酶底物的方法,包括下述步骤:(a)提供本发明多肽;或本发明的核酸编码的多 肽;(b)提供测试底物;和(c)将步骤(a)的多肽与步骤(b)的测试底物接触,并检测底 物数量的减少或反应产物数量的增加,其中,底物数量的减少或反应产物数量的 增加表明测试底物是葡聚糖酶、甘露聚糖酶或木聚糖酶的底物。
[0068]本发明提供了测定测试化合物是否特异性结合到多肽的方法,该方法 包括下述步骤:(a)在允许核酸翻译成多肽的条件下,表达核酸或包括该酸的载体, 其中所述核酸包括本发明的核酸;或提供本发明的多肽;(b)提供测试化合物;(c) 将多肽与测试化合物接触;和(d)测定步骤(b)的测试化合物是否特异性结合到多 肽。
[0069]本发明提供了鉴定葡聚糖酶,例如内切葡聚糖酶、甘露聚糖酶或木聚 糖酶活性的调节物(modulator)的方法,包括下述步骤:(a)提供本发明的多肽; 或本发明的核酸编码的多肽;(b)提供测试化合物;(c)将步骤(a)的多肽与步骤(b) 的测试化合物接触,并测量葡聚糖酶、甘露聚糖酶或木聚糖酶的活性,其中,与 不存在测试化合物时的活性相比,存在测试化合物时测量得到的葡聚糖酶、甘露 聚糖酶或木聚糖酶活性发生变化,则证明该测试化合物调节葡聚糖酶、甘露聚糖 酶或木聚糖酶活性。在一个方面,葡聚糖酶、甘露聚糖酶或木聚糖酶活性可以通 过下述方法测量:提供葡聚糖酶、甘露聚糖酶或木聚糖酶底物;和检测底物数量 的减少或反应产物数量的增加,或检测底物数量的增加或反应产物数量的减少。 相比起没有测试化合物时的底物或反应产物数量,有测试化合物时底物数量的减 少或反应产物数量的增加表明该测试化合物是葡聚糖酶、甘露聚糖酶或木聚糖酶 活性的激活剂。相比起没有测试化合物时的底物或反应产物数量,有测试化合物 时底物数量的增加或反应产物数量的减少表明该测试化合物是葡聚糖酶、甘露聚 糖酶或木聚糖酶活性的抑制剂
[0070]本发明提供了计算机系统,该计算机系统包括处理器和数据存储装置 (data storage device),其中所述数据存储装置上保存有本发明的多肽序列或核酸 序列(例如本发明的核酸编码的多肽)。在一个方面,该计算机系统还可以包括序列 比较算法和数据存储装置,该数据存储装置上保存有至少一条参考序列。在另一 方面,序列比较算法包括指示(indicate)多态性的计算机软件。在一个方面,该计算 机系统还可以包括识别器(identifier),该识别器鉴定所述序列中的一个或多个特 征。本发明提供了计算机可读介质,该介质上保存有本发明的多肽序列或核酸序 列。本发明提供了鉴定序列中的特征的方法,包括步骤:(a)使用可鉴定序列中的 一个或多个特征的计算机程序读取序列,其中该序列包括本发明的多肽序列或核 酸序列;和(b)用计算机程序鉴定序列中的一个或多个特征。本发明提供了将第 一条序列与第二条序列比较的方法,包括步骤:(a)通过使用比较序列的计算机程 序,读取第一条序列与第二条序列,其中第一条序列包括本发明的多肽序列或核 酸序列;和(b)用计算机程序,测定第一条序列与第二条序列之间的差异。测定第 一条序列与第二条序列之间的差异的步骤还可以包括鉴定多态性的步骤。在一个 方面,该方法还包括识别序列中的一个或多个特征的识别器。在另一方面,该方 法还可以包括用计算机程序读第一条序列,并识别序列中的一个或多个特征。
[0071]本发明提供了从环境样品中分离或回收核酸的方法,该核酸编码具有 葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽,该方法包括步骤:(a)提供扩增引 物序列对,用来扩增编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽的核 酸,其中该引物能够扩增本发明的核酸;(b)从环境样品中分离核酸,或处理环境 样品,这样,样品中的核酸易于杂交到扩增引物对;和(c)混合步骤(b)的核酸和步 骤(a)的扩增引物对,并由环境样品扩增核酸,从而从环境样品中分离或回收编码 具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽的核酸。扩增引物序列对的一 条或每一条引物可以包括寡核苷酸,该寡核苷酸包括本发明序列的至少约10至50 个连续的碱基。在一个方面,扩增引物序列对是本发明的扩增引物对。
[0072]本发明提供了从环境样品中分离或回收核酸的方法,该核酸编码具有 葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽,该方法包括步骤:(a)提供多核苷 酸探针,该多核苷酸探针包括本发明的核酸,或其亚序列;(b)从环境样品中分离 核酸,或处理环境样品,这样,样品中的核酸易于杂交到步骤(a)的多核苷酸探针; (c)混合步骤(b)分离的、合成的核酸,或处理的环境样品与步骤(a)的多核苷酸探针; 和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,从而从环境样品中分离或 回收编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽的核酸。环境样品可 以包括水样品、液体样品、土壤样品、空气样品、或生物样品。在一个方面,生 物样品可以来自细菌细胞、原生动物细胞、昆虫细胞、酵母菌细胞、植物细胞、 真菌细胞、或哺乳动物细胞。
[0073]本发明提供了产生编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的 多肽的核酸变体(variant)的方法,该方法包括步骤:(a)提供包括本发明核酸的 模板核酸;和(b),修饰或删除模板序列中一个或多个核苷酸,或将一个或多个核 苷酸插入到模板序列中,或它们的组合,以产生模板核酸的变体。在一个方面, 该方法还可以包括表达变异的核酸,产生变异的葡聚糖酶、甘露聚糖酶或木聚糖 酶多肽。修饰、插入或删除可以通过下述方法被引入,包括:易错PCR、重排 (shuffling)、寡核苷酸定点诱变、装配PCR(assembly PCR)、有性PCR诱变(sexual PCR mutagenesis)、体内诱变(in vivo mutagenesis)、盒式诱变、递归整体诱变 (recursive ensemble mutagenesis)、指数整体诱变(exponential ensemble mutagenesis)、 位点专一性诱变、基因重装配(gene reassembly)、基因位点饱和诱变(Gene Site Saturation MutagenesisTM(GSSMTM))、合成连接重装配(synthetic ligation reassembly)(SLR)和它们的组合。在另一个方面,可通过如下的方法进行修改、插 入或删除,包括重组、递归序列重组(recursive sequence recombination)、硫代磷酸 酯-修饰的DNA诱变(phosphothioate-modified DNA mutagenesis)、含有尿嘧啶的模 板诱变(uracil-containing template mutagenesis)、带缺口双链体诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复-缺陷型宿 主株诱变(repair-deficient host strain mutagenesis)、化学诱变、放射诱变、缺失诱变、 限制-选择诱变(restriction-selection mutagenesis)、限制-纯化诱变 (restriction-purification mutagenesis)、人工基因合成、整体诱变(ensemble mutagenesis)、嵌合核酸多聚体生成(chimeric nucleic acid multimer creation)和它们的 组合。
[0074]在一个方面,该方法可以迭代反复,直到产生与由模板核酸编码的多 肽相比具有改变了的或不同的活性,或改变了的或不同的稳定性的葡聚糖酶、甘 露聚糖酶或木聚糖酶。在一个方面,变体葡聚糖酶、甘露聚糖酶或木聚糖酶多肽 是耐热性的,并在暴露于高温之后保留一些活性。在另一方面,相比起由模板核 酸编码的葡聚糖酶、甘露聚糖酶或木聚糖酶,变体葡聚糖酶、甘露聚糖酶或木聚 糖酶多肽具有增加的糖基化作用。可选择地,变体葡聚糖酶、甘露聚糖酶或木聚 糖酶多肽在高温下具有葡聚糖酶活性,其中由模板核酸编码的葡聚糖酶、甘露聚 糖酶或木聚糖酶在高温下无活性。在一个方面,该方法可以迭代反复,直到产生 与由模板核酸的密码子使用(codon usage)相比,具有改变了的密码子选择的葡 聚糖酶、甘露聚糖酶或木聚糖酶编码序列。在另一方面,该方法可以迭代反复, 直到产生与由模板核酸的信息表达或稳定性相比,具有较高或较低水平的信息表 达或稳定性的葡聚糖酶、甘露聚糖酶或木聚糖酶基因。
[0075]本发明提供了修饰编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的 多肽的核酸中的密码子,以增加它在宿主细胞中的表达的方法,该方法包括下述 步骤:(a)提供本发明的核酸,该核酸编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶 活性的多肽;和(b)鉴别步骤(a)的核酸中非-偏爱(preferrd codon)或不太偏 爱的密码子,并将其替换以偏爱的或中度使用(neutrally used)的与被替换的密码 子编码相同氨基酸的密码子,其中所述的偏爱密码子是在宿主细胞的基因的编码 序列中出现频率较多的密码子,非-偏爱或不太偏爱的密码子是在宿主细胞基因的 编码序列中出现频率较低的密码子,由此可修饰核酸以增加其在宿主细胞中的表 达。
[0076]本发明提供了修饰编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的 多肽的核酸中的密码子的方法,该方法包括下述步骤:(a)提供本发明核酸;和(b) 鉴定步骤(a)的核酸中的密码子,用不同的密码子置换它,该不同的密码子编码与 被置换的密码子相同的氨基酸,从而修饰了编码葡聚糖酶、甘露聚糖酶或木聚糖 酶的核酸中的密码子。
[0077]本发明提供了修饰核酸中的密码子,以增加该核酸在宿主细胞中的表 达的方法,所述核酸编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽;该 方法包括下述步骤:(a)提供本发明核酸,该核酸编码葡聚糖酶、甘露聚糖酶或木 聚糖酶多肽;和(b)鉴别步骤(a)的核酸中非-偏爱或不太偏爱的密码子,并将 其替换以偏爱的或中度使用的与被替换密码子编码相同氨基酸的密码子,其中所 述的偏爱密码子是在宿主细胞基因的编码序列中出现频率较多的密码子,非-偏爱 或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较少的密码子,由 此可修饰核酸以增加其在宿主细胞中的表达。
[0078]本发明提供了修饰核酸中的密码子,以减少该核酸在宿主细胞中表达 的方法,所述核酸编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽;该方 法包括下述步骤:(a)提供本发明核酸;和(b)鉴别步骤(a)的核酸中的至少一 个偏爱的密码子,并将其替换以与被替换密码子编码相同氨基酸的非-偏爱的或不 太偏爱的密码子,其中所述的偏爱密码子是在宿主细胞基因的编码序列中出现频 率较多的密码子,非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出 现频率较低的密码子,由此可修饰核酸以减少其在宿主细胞中的表达。在一个方 面,宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺 乳动物细胞。
[0079]本发明提供了产生核酸文库的方法,其编码许多修饰的葡聚糖酶、甘 露聚糖酶或木聚糖酶活性位点(催化区域(CDs))或底物结合位点,其中修饰的活性 位点或底物结合位点来自第一核酸,该第一核酸包括编码第一活性位点或第一底 物结合位点的序列,所述方法包括下述步骤:(a)提供编码第一活性位点或第一底 物结合位点的第一核酸,其中,第一核酸序列包括在严紧性条件下杂交到本发明 核酸的序列,以及编码葡聚糖酶、甘露聚糖酶或木聚糖酶活性位点或葡聚糖酶、 甘露聚糖酶或木聚糖酶底物结合位点的核酸;(b)提供一组诱变寡核苷酸,其在第 一核酸的许多目标密码子上编码自然-发生的氨基酸变体;和(c)使用该组诱变寡 聚核苷酸以产生一组编码活性位点或编码底物结合位点的核酸变异体,它们在被 诱变的各个氨基酸密码子处编码一定范围的氨基酸变异,由此可产生编码多个被 修饰的葡聚糖酶、甘露聚糖酶或木聚糖酶活性位点或底物结合位点的核酸文库。 在一个方面,本方法包括通过下列的方法诱变步骤(a)的第一核酸,所述方法包 括优化的定向进化系统(optimized directed evolution system)、基因位点饱和诱变TM (Gene Site-Saturation MutagenesisTM)(GSSMTM)、合成连接重装配(SLR)、易错 PCR、重排、寡聚核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、 盒式诱变、递归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、合成 连接重装配(SLR)及其组合。在另一个方面,本方法包括通过以下的方法诱变步 骤(a)的第一核酸或变异体,所述方法包括重组、递归序列重组、硫代磷酸酯- 修饰的DNA诱变、含有尿嘧啶的模板诱变、带缺口的双链体诱变、点错配修复诱 变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、 限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成和它们的组合。
[0080]本发明提供了制备小分子的方法,包括以下步骤:(a)提供多个能够 合成或修饰小分子的生物合成酶,其中所述的酶之一包括由本发明核酸编码的葡 聚糖酶、甘露聚糖酶或木聚糖酶;(b)为步骤(a)中的至少一种酶提供底物;和 (c)将步骤(b)中的底物与所述酶在可促进多个生物催化反应的条件下进行反 应,通过一系列生物催化反应产生小分子。本发明提供了修饰小分子的方法,包 括以下步骤:(a)提供葡聚糖酶、甘露聚糖酶或木聚糖酶,其中所述的酶包括本 发明的多肽,或由本发明的核酸或其子序列编码的多肽;(b)提供小分子,和(c) 将步骤(a)的酶与步骤(b)的小分子在可促进由葡聚糖酶、甘露聚糖酶或木聚 糖酶催化的酶促反应的条件下反应,由此通过葡聚糖酶、甘露聚糖酶或木聚糖酶 酶促反应修饰小分子。在一个方面,本方法可以包含步骤(a)的酶的多个小分子 底物,由此通过葡聚糖酶、甘露聚糖酶或木聚糖酶催化的至少一个酶促反应产生 被修饰小分子的文库。在一个方面,本方法可以包括多种其它的酶,在一定条件 下可通过这些酶促进多个生物催化反应,形成由多个酶促反应产生的被修饰小分 子的文库。在另一个方面,本方法可以进一步包括检测文库的步骤,以确定一种 显示所需活性的特定的修饰小分子是否存在于文库中。检测文库的步骤可以进一 步包括在文库内系统性去除用来产生一部分多个修饰小分子的生物催化反应中的 一个反应之外的所有反应,通过检测一部分修饰小分子中是否存在具有所需活性 的特定的修饰小分子,鉴定产生具有所需活性的特定修饰小分子的至少一个特定 的生物催化反应。
[0081]本发明提供了测定葡聚糖酶、甘露聚糖酶或木聚糖酶的功能片段的方 法,该方法包括步骤:(a)提供葡聚糖酶、甘露聚糖酶或木聚糖酶,其中所述酶包 括本发明多肽,或本发明核酸或其亚序列编码的多肽;(b)从步骤(a)的序列中删 除多个氨基酸残基,并测试剩余亚序列的葡聚糖酶、甘露聚糖酶或木聚糖酶活性, 从而确定葡聚糖酶、甘露聚糖酶或木聚糖酶的功能片段。在一个方面,通过下述 方法测量葡聚糖酶、甘露聚糖酶或木聚糖酶活性:提供葡聚糖酶、甘露聚糖酶或 木聚糖酶底物,并检测底物数量的减少或反应产物数量的增加。
[0082]本发明提供了通过应用实时代谢流分析(real-time metabolic flux analysis)对新的或修饰的表现型进行全细胞工程化(whole cell engineering)的方 法,该方法包括以下步骤:(a)通过修饰细胞的遗传组成,产生修饰的细胞,其 中所述遗传组成通过往所述细胞中添加本发明的核酸而被修饰;(b)培养所述修 饰的细胞,产生多个修饰的细胞;(c)通过以实时方式监控步骤(b)的细胞培养 物,测量所述细胞的至少一种代谢参数;(d)分析步骤(c)的数据,确定测量到 的参数是否与在相似条件下的未修饰细胞有所不同,从而应用实时代谢流分析确 定所述细胞中工程化的表型。一方面,所述细胞的遗传组成可以通过包括删除细 胞中的序列或修饰细胞中的序列,或者敲除基因的表达的方法而被修饰。一方面, 所述方法可以进一步包括选择含有新的工程化表型的细胞。另一方面,所述方法 可以进一步包括培养被选择的细胞,由此产生含有新的工程化表型的细胞株。
[0083]本发明提供了增加葡聚糖酶、甘露聚糖酶或木聚糖酶多肽的耐热性或 热稳定性的方法,该方法包括对葡聚糖酶、甘露聚糖酶或木聚糖酶多肽进行糖基 化,其中该多肽包括本发明多肽的至少30个连续的氨基酸;或包括由本发明的核 酸编码的多肽的至少30个连续的氨基酸;从而增加葡聚糖酶、甘露聚糖酶或木聚 糖酶多肽的耐热性或热稳定性。在一个方面,葡聚糖酶、甘露聚糖酶或木聚糖酶 的比活性可以在大于约37℃至约95℃范围内的温度中具有热稳定性或耐热性。
[0084]本发明提供了在细胞中超量表达(overexpress)重组的葡聚糖酶、甘 露聚糖酶或木聚糖酶多肽的方法,包括表达含有核酸的载体,所述核酸包括本发 明的核酸,或者表达本发明的核酸序列,其中序列同一性是通过采用序列比较算 法的分析或通过目测检查法来确定的,其中所述的超量表达受高活性启动子的应 用、双顺反子载体的应用或载体的基因扩增的影响。
[0085]本发明提供了制备转基因植物的方法,包括以下步骤:(a)将异源核 酸序列导入进细胞中,其中所述的异源核酸序列包括本发明的核酸序列,由此可 产生转化的植物细胞;和(b)从转化的细胞中产生转基因植物。在一个方面,步 骤(a)可以进一步包括通过电穿孔或微注射植物细胞原生质体来导入异源核酸序 列。在另一个方面,步骤(a)可以进一步包括通过DNA微粒轰击(DNA particle bombardment)直接将异源核酸序列导入进植物组织中。可选择地是,步骤(a) 可以进一步包括采用根癌农杆菌(Agrobacterium tumefaciens)宿主将异源核酸序 列导入进植物细胞DNA中。在一个方面,植物细胞可以是马铃薯、玉米、水稻、 小麦、烟草或大麦细胞。
[0086]本发明提供了在植物细胞中表达异源核酸序列的方法,包括以下步骤: (a)用与启动子有效连接的异源核酸序列转化植物细胞,其中所述的异源核酸序 列包括本发明的核酸;(b)在一定条件下使植物生长,其中所述的异源核酸序列 在植物细胞中表达。本发明提供了在植物细胞中表达异源核酸序列的方法,包括 以下步骤:(a)用与启动子有效连接的异源核酸序列转化植物细胞,其中所述的 异源核酸序列包括本发明的序列;(b)在一定条件下使植物生长,其中所述的异 源核酸序列在植物细胞中表达。
[0087]本发明提供了水解、分解或破裂包括葡聚糖的组合物,该方法包括下 述步骤:(a)提供具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明的多肽,或 由本发明核酸编码的多肽;(b)提供包括葡聚糖的组合物;和(c)在葡聚糖酶、甘露 聚糖酶或木聚糖酶能水解、分解、或破裂包括葡聚糖的组合物的条件下,将(a)的 多肽与步骤(b)的组合物接触。在一个方面,组合物包括植物细胞、细菌细胞、酵 母细胞、昆虫细胞、或动物细胞。因此,组合物可以包括任何植物或植物的一部 分,任何包括葡聚糖的食物或饲料(例如动物饲料,诸如鸡饲料)、废弃产品和类似 物。本发明提供了液化或除去包括葡聚糖的组合物的方法,该方法包括下述步骤: (a)提供具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽,或由本发明核 酸编码的多肽;(b)提供包括葡聚糖的组合物;和(c)在葡聚糖酶、甘露聚糖酶或 木聚糖酶能去除、软化或液化包括葡聚糖的组合物的条件下,将(a)的多肽与步骤 (b)的组合物接触。
[0088]本发明提供了洗涤剂组合物,该组合物包括本发明多肽,或本发明核 酸编码的多肽,其中所述多肽具有葡聚糖酶例如内切葡聚糖酶、甘露聚糖酶或木 聚糖酶活性。葡聚糖酶可以是非表面-活性葡聚糖酶,甘露聚糖酶或木聚糖酶或表 面-活性葡聚糖酶,甘露聚糖酶或木聚糖酶。所述葡聚糖酶、甘露聚糖酶或木聚糖 酶可以配制成非-水的液体组合物、铸型固体(cast solid)、颗粒形式、微粒形式、压 缩片剂、凝胶形式、糊剂或膏剂形式。本发明提供了洗涤物体的方法,该方法包 括下述步骤:(a)提供组合物,该组合物包括具有葡聚糖酶、甘露聚糖酶或木聚糖 酶活性的本发明多肽,或由本发明核酸编码的多肽;(b)提供物体;和(c)在组合 物可以洗涤物体的条件下,将步骤(a)的多肽和步骤(b)的物体接触。
[0089]本发明提供了织物或织品,包括例如线,其包括本发明多肽,或本发 明核酸编码的多肽。在一个方面,织物或织品包括含有葡聚糖的纤维。本发明提 供了处理织物或织品的方法(例如去除组合物中污物(stain)),该方法包括下述步 骤:(a)提供组合物,该组合物包括具有葡聚糖酶,例如内切葡聚糖酶、甘露聚糖 酶或木聚糖酶活性的本发明多肽,或由本发明核酸编码的多肽;(b)提供含有葡聚 糖的织物或织品;和(c)在葡聚糖酶、甘露聚糖酶或木聚糖酶能够处理织物或织品 (例如去除污物)的条件下,将步骤(a)的多肽和步骤(b)的组合物接触。本发明提供 了提高织品的表面光洁度(finish)的方法,该方法包括下述步骤:(a)提供组合物, 该组合物包括具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽,或由本 发明核酸编码的多肽;(b)提供织品;和(c)在多肽能够处理织品的条件下,将步 骤(a)的多肽和步骤(b)的织品接触,从而提高织品的表面光洁度。在一个方面,织 品是毛料或丝绸。
[0090]本发明提供了饲料(例如动物饲料,诸如鸡饲料)或食物,包含本发明 多肽,或本发明核酸编码的多肽。本发明提供了在被动物消耗之前,水解饲料或 食物中的葡聚糖或其他多糖的方法,该方法包括下述步骤:(a)获得饲料物质,该 饲料物质包含本发明的葡聚糖酶,例如内切葡聚糖酶、木聚糖酶或甘露聚糖酶, 或本发明核酸编码的葡聚糖酶、甘露聚糖酶或木聚糖酶;和(b)将步骤(a)的多肽加 入到饲料或食物物质中,加入的数量足以在足够时间足内引起葡聚糖或其他多糖 水解,并形成被处理的食物或饲料,从而在被动物食用之前,水解食物或饲料中 的葡聚糖或其他多糖。在一个方面,本发明提供了在被动物食用之后,水解饲料 或食物中的葡聚糖或其他多糖的方法,包括下述步骤:(a)获得饲料物质,该饲料 物质包括本发明的葡聚糖酶、木聚糖酶或甘露聚糖酶,或本发明核酸编码的葡聚 糖酶、甘露聚糖酶或木聚糖酶;和(b)将步骤(a)的多肽加入到饲料或食物物质中; 和(c)将饲料或食物喂给动物,其中在喂食之后,葡聚糖酶、甘露聚糖酶或木聚糖 酶在动物消化道中水解饲料或食物中的葡聚糖或其他多糖。食物或饲料(例如动物 饲料,诸如鸡饲料)可以是例如谷物、谷类、玉米和类似物。
[0091]在另一方面,本发明提供了减少组合物,例如食物或饲料(例如动物饲 料,诸如鸡饲料)中的葡聚糖的的粘性的方法,这通过用本发明的葡聚糖酶,或包 括组合物中的本发明的葡聚糖酶处理组合物来进行。食物或饲料可以包括大麦或 小麦,例如用作高-大麦或高-小麦饮食(diet),诸如家禽饮食的食物或饲料。在一个 方面,本发明提供了使稀便(wet droppings)最小化的方法,该方法通过喂给动物 (例如类,诸如家禽)用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶处理过的食物 或饲料,或含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的食物或饲料来进行。 在一个方面,本发明提供了增加生长速度和/或饲料转化的方法,该方法通过喂给 动物(例如鸟类诸如家禽)用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶处理过的食 物或饲料,或含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的食物或饲料来进 行。在一个方面,本发明提供了减少排泄物(excrement)的方法,该方法通过喂 给动物(例如鸟类诸如家禽)用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶处理过的 食物或饲料,或含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的食物或饲料来 进行。
[0092]本发明提供了动物(例如家禽,诸如鸡)的食物或营养添加剂(nutritional supplements),包括本发明多肽,例如本发明核酸编码的多肽。在一个方面,食 物或营养添加剂中的多肽可以被糖基化。本发明提供了可食用的酶输送基质 (edible enzyme delivery matrices),其包括本发明多肽,例如本发明核酸编码的 多肽。在一个方面,输送基质包括小丸(pellet),该小丸包括本发明的酶,例如 包括本发明的耐热性或热稳定性酶的小丸。在一个方面,多肽可以进行糖基化(这 在一个方面可以使酶更具耐热性或热稳定性)。在一个方面,葡聚糖酶,例如内 切葡聚糖酶、甘露聚糖酶或木聚糖酶活性具有耐热性。在另一方面,葡聚糖酶、 甘露聚糖酶或木聚糖酶活性具有热稳定性。
[0093]本发明提供了包括本发明多肽的食物、饲料(例如动物饲料,诸如鸡饲 料)或营养添加剂。本发明提供了将葡聚糖酶、甘露聚糖酶或木聚糖酶用作动物饮 食中的营养添加剂的方法,该方法包括:制备含有葡聚糖酶、甘露聚糖酶或木聚 糖酶的营养添加剂,所述酶包括本发明多肽的至少30个连续的氨基酸;将该营养 添加剂喂给动物,以增加包含在动物摄取的饲料或食物中的葡聚糖或其他多糖的 利用率。动物可以是人、反刍动物或单胃动物。例如,动物可以是鸟类,例如鸡。 葡聚糖酶、甘露聚糖酶或木聚糖酶可以通过在生物体中表达编码葡聚糖酶的多肽 来产生,所述生物体诸如细菌、酵母、植物、昆虫、真菌或动物。表达本发明多 肽的示范性生物体可以是粟酒裂殖酵母、酿酒酵母(S.Cerevisiae)、毕赤酵母属的 种(Picfilia sp.),例如巴斯德毕赤酵母(Pichia pastoris)、大肠杆菌(E.coli)、链 霉菌属的种(Streptomyces sp.)、杆菌属的种(Bacillus sp.)和乳酸杆菌属的种 (Lactobacillus sp.)。
[0094]本发明提供了可食用的酶输送基质,其包含具有热稳定性的重组葡聚 糖酶、甘露聚糖酶或木聚糖酶,例如本发明多肽。本发明提供了将葡聚糖酶、甘 露聚糖酶或木聚糖酶添加剂输送给动物(人、反刍动物、单胃动物、鸟类如鸡)的方 法,该方法包括:制备小丸形式的可食用的酶输送基质,其包括颗粒状的可食用 载体和具有热稳定性的分离的、合成的、或重组的葡聚糖酶、甘露聚糖酶或木聚 糖酶,其中,该小丸容易将包含在小丸中的葡聚糖酶、甘露聚糖酶或木聚糖酶分 散入水介质中;并将可食用的酶输送基质喂给动物。重组的葡聚糖酶、甘露聚糖 酶或木聚糖酶可以包括本发明多肽。颗粒状可食用载体可以包括选自下述物质的 载体:谷物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉 和小麦粗粉。可食用载体可以包括去油的谷物胚芽。葡聚糖酶、甘露聚糖酶或木 聚糖酶可以进行糖基化,以在制丸条件(pelletizing conditions)下,提供热稳定性。 通过将包括谷物胚芽和葡聚糖酶、甘露聚糖酶或木聚糖酶的混合物制成丸,可以 形成输送基质。制丸的条件可以包括应用蒸气。制丸条件可以包括应用超过约80℃ 的温度约5分钟,酶保留每毫克酶至少约350至约900单位的比活性。
[0095]本发明提供了提供了改善乳制品质地和味的方法,包括下述步骤: (a)提供具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽,或本发明核酸 编码的葡聚糖酶;(b)提供乳制品;和(c)在葡聚糖酶、甘露聚糖酶或木聚糖酶可 以改善乳制品质地或风味的条件下,将步骤(a)的多肽与步骤(b)的乳制品接触。在 一个方面,乳制品包括干酪或乳酪。本发明提供了乳制品,该乳制品包括本发明 的葡聚糖酶、甘露聚糖酶或木聚糖酶,或本发明核酸编码的葡聚糖酶、甘露聚糖 酶或木聚糖酶。
[0096]本发明提供了改进含油量丰富的植物物质的榨油率的方法,该方法包 括下述步骤:(a)提供具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽, 或本发明核酸编码的葡聚糖酶;(b)提供含油量丰富的植物物质;和(c)将步骤(a) 的多肽和含油量丰富的植物物质接触。在一个方面,含油量丰富的植物物质包括 含油丰富的种子。油可以是豆油、橄榄油、菜籽(油菜)油或向日葵油和类似油。
[0097]在一个方面,本发明提供了使用本发明的葡聚糖酶、甘露聚糖酶或木 聚糖酶产生可发酵糖的方法,该可发酵糖可以被转化为燃料乙醇。在一个方面, 本发明提供了燃料,包括具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多 肽,或本发明核酸编码的葡聚糖酶。在一个方面,本发明的酶被用于催化纤维素、 半纤维素和木质素的水解。纤维素的降解可以用于将植物生物量转化为燃料和化 学品。参见例如Kohlmann(1996)Adv.Space Res.18:251-265;Perez(2002)Int Microbiol.5:53-63。
[0098]本发明提供了制备水果或蔬菜汁、糖浆、酱或提取物的方法,包括下 述步骤:(a)提供具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽,或 由本发明核酸编码的葡聚糖酶、甘露聚糖酶或木聚糖酶;(b)提供包括疏果或蔬菜 物质的组合物或液体;和(c)将步骤(a)的多肽和步骤(b)的组合物接触,从而制备 水果或蔬菜汁、糖浆、酱或提取物。
[0099]本发明提供了纸、或纸产品或纸浆,其包括本发明的葡聚糖酶、甘露 聚糖酶或木聚糖酶,或本发明核酸编码的多肽。本发明提供了处理纸、或纸浆或 木浆的方法,包括下述步骤:(a)提供具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性 的本发明多肽,或本发明核酸编码的葡聚糖酶、甘露聚糖酶或木聚糖酶;(b)提供 包括纸或纸浆或木浆的组合物;和(c)在葡聚糖酶、甘露聚糖酶或木聚糖酶能够处 理纸或纸浆或木浆的条件下,将步骤(a)的多肽和步骤(b)的组合物接触。在一个方 面,药物组合物充当消化助剂(digestive aid)或抗微生物剂(例如例如,抗沙氏 菌(Salmonella))。在一个方面,治疗预防性的。在一个方面,本发明提供了口 腔护理产品,其包括具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽, 或本发明核酸编码的葡聚糖酶、甘露聚糖酶或木聚糖酶。口腔护理产品可以包括 牙膏、牙用乳剂、凝胶或牙粉、牙齿用品、漱口剂、刷牙前或后的清洗剂、口香 糖、止咳糖或糖。本发明提供了隐形眼镜清洗组合物,其含有具有葡聚糖酶、 甘露聚糖酶或木聚糖酶活性的本发明多肽,或本发明核酸编码的葡聚糖酶、甘露 聚糖酶或木聚糖酶。[00100]在一个方面,本发明提供了消灭微生物或保护动物免遭微生物伤 害的方法,该微生物含有葡聚糖或其他多糖,所述方法包括施用本发明多肽。微 生物可以是包括葡聚糖的细菌,例如沙门氏菌(Salmonella)。
[00101]本发明的另一方面是制备本发明多肽的方法。该方法包括将编码 多肽的核酸引入宿主细胞,其中,所述核酸可操作性地连接到启动子;并在允许 核酸表达的条件下培养宿主细胞。本发明的另一方面是制备多肽的方法,该多肽 具有序列,如本发明氨基酸序列中示出的序列的至少10个氨基酸序列。该方法包 括将编码多肽的核酸引入宿主细胞,其中核酸可操作性地连接到启动子;并在允 许核酸表达的条件下培养宿主细胞,从而产生多肽。
[00102]本发明的另一方面是产生变体的方法,所述方法包括:获得获得 具有下述序列的核酸:本发明序列、与本发明序列基本上相同的序列、与本发明 序列互补的序列、包括前述序列的至少30个连续核苷酸的片段;并将序列中的一 个或多个核苷酸改变为另一核苷酸;删除序列中的一个或多个核苷酸;或将一个 或多个核苷酸插入到序列中。
[00103]本发明的另一方面是计算机可读介质,其上保存有本发明的核酸 或多肽序列。本发明的另一方面是计算机系统,包括处理器和数据存储装置,其 中,所述数据存储装置上保存有本发明的核酸或多肽序列。本发明的另一方面是 将第一序列与参考序列比较的方法,其中,第一序列是本发明的核酸或多肽序列。 该方法包括通过使用比较序列的计算机程序,来读取第一序列和参考序列;和用 计算机程序测定第一序列和参考序列之间的差异。本发明的另一方面是鉴定本发 明的核酸序列和多肽序列中的特征的方法,该方法包括通过使用鉴定序列中的特 征的计算机程序来读取序列;以及用计算机程序鉴定序列中的特征。
[00104]本发明的还有另一方面是催化分解聚糖或其衍生物的方法,该方 法包括步骤:在有助于聚糖分解的条件下,将含有聚糖或其他多糖或它们的衍生 物的样品与本发明多肽接触。
[00105]本发明的另一方面是鉴定本发明多肽的片段或变体的分析方法 (assay),所述片段或变体保留有本发明多肽的酶功能。该分析方法包括:在允许 多肽片段或变体发挥功能的条件下,将本发明多肽与底物分子接触;并检测或者 底物水平的减少,或者多肽和底物之间的反应所产生的特异性反应产物水平的增 加;从而鉴定此类序列的片段或变体。
[00106]本发明的另一方面是寡核苷酸的核酸探针,其长度为约10至50 个核苷酸,其具有的至少10个连续核苷酸的片段与本发明的核酸序列的核酸目标 区域至少50%互补;并且其在中等至高严紧性条件下与核酸目标区域杂交,形成 可检测目标:探针双链体(probe duplex)。
[00107]本发明的另一方面是多核苷酸探针,用于分离或鉴定葡聚糖酶、 甘露聚糖酶或木聚糖酶基因,其具有与本发明的核酸序列至少之一相同,或充分 互补的序列。
[00108]在还有另一个方面,本发明提供了蛋白质制品,包括具有本发明 的氨基酸序列的多肽,其中蛋白质制品是液体。本发明的还有另一方面提供了蛋 白质制品,包括具有本发明的氨基酸序列的多肽,其中蛋白质制品是固体。
[00109]本发明的还有另一方面提供了修饰小分子的方法,包括步骤:将 至少一种本发明的多肽与至少一种小分子混合,通过至少一种生物催化反应,产 生至少一种修饰的小分子,其中至少一种多肽具有葡聚糖酶、甘露聚糖酶或木聚 糖酶活性。
[00110]本发明的另一方面是编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶 活性的本发明多肽的序列的克隆载体。本发明的另一方面是宿主细胞,该宿主细 胞包括编码本发明多肽的序列。在还有一个方面,本发明提供了能够在细胞中进 行复制的表达载体,该表达载体包括本发明核酸或编码本发明多肽的核酸。
[00111]在另一方面,本发明提供了面团改良的方法,该方法包括在足以 改良面团的条件下,将面团与至少一种本发明的多肽接触。本发明的另一方面是 饮料生产的方法,该方法包括:在足以降低麦芽汁或啤酒粘性,或增加饮料的澄 清度(例如澄清作用)的条件下,给予至少一种本发明多肽。
[00112]本发明的葡聚糖酶,例如内切葡聚糖酶、木聚糖酶或甘露聚糖酶 可以用于降解动物饲料(例如人、反刍动物、单胃动物、鸟类例如鸡的食物)中的高 分子量的葡聚糖或其他多糖。加入本发明的酶,提高可消化性,从而刺激生长速 度,其也提高动物幼仔的质量。葡聚糖酶在整个胃-肠道内发挥功能,以减少肠内 粘性,并增加胰腺酶的扩散。此外,本发明的酶可以用于处理谷类食物的胚乳细 胞壁和植物蛋白。在本发明的一个方面,将本发明的新型酶喂食给动物,以便增 加在食物中的葡聚糖或其他多糖的利用率。本发明的酶的这个活性可以用于降解 不溶性细胞壁物质,从而释放出细胞壁中的营养物,其然后可以被动物利用。它 也将半纤维素变为营养糖,这样原先被俘获在细胞壁中的营养物被释放出来。本 发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以产生可能成为瘤胃微生物区系营养 源的化合物。
[00113]本发明的另一方面提供了将葡聚糖酶、甘露聚糖酶或木聚糖酶用 作动物饮食中的营养添加剂的方法,该方法包括:制备含有重组葡聚糖酶的营养 添加剂,该葡聚糖酶包括本发明的氨基酸序列的至少30个连续氨基酸;和将营养 添加剂喂给动物,以增加包含被动物摄取的食物中的葡聚糖或其他多糖的利用率。
[00114]在本发明的另一方面,提供了输送葡聚糖酶、甘露聚糖酶或木聚 糖酶添加物给动物的方法,其中该方法包括制备小丸形式的可食用酶输送基质, 该小丸中包括粒状可食用载体和热稳定性重组或合成的葡聚糖酶、甘露聚糖酶或 木聚糖酶,其中,颗粒容易将包含在其中的葡聚糖酶、甘露聚糖酶或木聚糖酶扩 散入水介质中;和将该可食用酶输送基质喂给动物。粒状可食用载体可以包括选 自下述物质的载体:去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽 粉和小麦粗粉。葡聚糖酶、甘露聚糖酶或木聚糖酶可以具有本发明的氨基酸序列。
[00115]在另一方面,本发明提供了分离的、合成的、或重组的核酸,该 核酸包括编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽的本发明序列, 其中所述序列含有信号序列。本发明也提供了分离的、合成的、或重组的核酸, 该核酸包括编码具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的本发明多肽的序列, 该序列含有来自另一葡聚糖酶、甘露聚糖酶或木聚糖酶的信号序列。此外,本发 明提供了分离的、合成的、或重组的核酸,包括编码具有葡聚糖酶、甘露聚糖酶 或木聚糖酶活性的多肽的本发明的序列,所述序列不含有信号序列。
[00116]本发明的一个或多个实施方案的详细内容阐述于下面的附图以及 说明书中。阅读完说明书和附图以及权利要求书之后,本发明的其他特征、目的 和优点将是显而易见的。
[00117]在此引用的所有出版物、专利、专利申请、GenBank序列和ATCC 保藏物以及含有序列表的光盘(一式四份提交)均在此明确引入,可用作所有目 的的参考。
附图简述
[00118]下面的图是为了说明本发明的一些方面,不能被认为是限制权利 要求书所包含的发明范围。
[00119]图1是计算机系统的方框图
[00120]图2是流程图,说明了将新的核酸或蛋白序列与序列数据库进行 比较,以确定新序列与数据库中的序列之间的同源性水平的方法的一个方面。
[00121]图3是流程图,说明了计算机中确定两条序列是否同源的方法的 一个方面。
[00122]图4是流程图,说明了用于检测序列中特征的存在的识别器方法 300的一个方面。
[00123]图5是概述本发明的若干示范性酶在各种条件下的相对活性的表。
[00124]图6以图标的形式示出了示范性的一组数据(“抽样数据”),该组 数据作为“标准曲线”示出,如实施例3中所论述。
[00125]图7和图8示出了葡聚糖酶活性测定的结果,证明在巴斯德毕赤 酵母中本发明的示范性葡聚糖酶表达提高,该示范性葡聚糖酶具有SEQ ID NO:464 中示出的序列,由密码子-优化版本的SEQ ID NO:5的编码(即优化的版本是SEQ ID NO:463),如下面实施例4中所论述。
[00126]图9示出了葡聚糖酶活性测定的结果,显示了本发明的示范性葡 聚糖酶的温度曲线,该示范性葡聚糖酶由SEQ ID NO:6编码,如下面实施例5中 所论述。
[00127]图10示出了葡聚糖酶活性测定的结果,显示了本发明的示范性葡 聚糖酶的半衰期测定结果,该示范性葡聚糖酶由SEQ ID NO:6编码,如下面实施 例5中所论述。
[00128]在不同的图表中,同样的参考标记表示同样的元素。
发明祥述
[00129]本发明提供了多肽和编码它们的多核苷酸,和制备和使用它们的 方法。本发明多肽的酶活性包括具有水解酶活性,例如葡聚糖酶活性的多肽,例 如能够水解葡聚糖中存在的糖苷键的多肽,例如催化水解内部β-1,4-糖苷键的多 肽。本发明多肽(包括抗体)的酶活性包括具有葡聚糖酶、木聚糖酶和/或甘露聚 糖酶活性的多肽。本发明的酶可以被用于制备和/或加工食物、饲料(例如人、反刍 动物、单胃动物、鸟类例如鸡的食物、饲料)、饮料、营养添加剂、织物、洗涤剂 和类似物。本发明的酶可以用于药物组合物和膳食助剂。本发明的葡聚糖酶、甘 露聚糖酶、木聚糖酶可以用于食品加工、焙烤、动物饲料或食品、饮料、洗涤剂、 浆加工和纸工艺中。
定义
[00130]术语“抗体”包括来源于(derived from)、出自于(modeled after) 或大体上编码于(substantially encoded by)一个免疫球蛋白基因或多个免疫球蛋白 基因的肽或多肽或者其片段,它们能特异地结合于抗原或抗原决定部位,见例如, Fundamental Immunology,第三版,W.E.Paul,ed.,Raven Press,N.Y.(1993);Wilson (1994)J.Immunol.Methods 175:267-273;Yarmush(1992)J.Biochem.Biophys. Methods 25:85-97。术语抗体包括结合抗原的部分,即,具有与抗原结合的能力的“抗 原结合位点”(例如,片段、序列、互补性决定区(CDRs)),包括(i)Fab片段, 由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包括在铰链 区由二硫键连接的两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的 Fd片段;(iv)由抗体单臂(a single arm)的VL和VH结构域组成的Fv片段;(v) 由VH结构域组成的dAb片段(Ward等,(1989)Nature 341:544-546),和(vi) 分离出的互补性决定区(CDR)。单链抗体也被包括在术语“抗体”中。
[00131]在此使用的术语“阵列(array)”或“微阵列(microarray)”或“生物 芯片(biochip)”或“芯片(chip)”是多个靶元素(element),每个靶元素包括固定 在基底表面的确定区域上的确定量的一种或多种多肽(包括抗体)或核酸,以下 进一步详细描述。
[00132]正如在此使用的,术语“计算机(computer)”、“计算机程序 (computer program)”和“处理器(processor)”使用的是它们最广泛的一般内容, 并可与所有设备结合,细节在以下详细描述。特定的多肽或蛋白的“编码序列”或“序 列编码”是指当置于合适的调控序列的控制之下时,可转录和翻译成为多肽或蛋白 的核酸序列。
[00133]在此使用的术语“核酸(nucleic acid)”或“核酸序列(nucleic acid sequence)”是指寡核苷酸、核苷酸、多聚核苷酸,或它们的片段,基因组DNA或 RNA,或合成的起点,它们可以是单链或双链,可以代表正义链或反义链,它们 可以是肽核酸(PNA)或任何DNA样或RNA样材料,可以是天然或合成的。短 语“核酸”或“核酸序列”包括寡核苷酸、核苷酸、多聚核苷酸,或它们的片段,基因 组DNA或RNA(例如,mRNA、rRNA、tRNA、iRNA),或合成的起点,它们 可以是单链或双链,可以代表正义链或反义链,可以是肽核酸(PNA),或任何 DNA样或RNA样材料,可以具有天然或合成的起始点,包括例如iRNA、核糖核 蛋白(例如,双链iRNA,例如,iRNPs)。该术语包含了含有天然核苷酸的已知类 似物的核酸,寡核苷酸。该术语也包含了具有合成的骨架的核酸样结构,见例如, Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997) Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。“寡核苷酸”包括可以用化学合成的或者单链的多脱氧核苷酸或者双链 的互补多脱氧核苷酸。这样合成的寡核苷酸没有5’磷酸,所以在没有激酶利用ATP 增加磷酸基团的情况下,它不会与另外的寡核苷酸连接。合成的寡核苷酸可以与 没有脱磷酸化的片段连接。
[00134]特定多肽或蛋白的“编码序列(coding sequence)”或编码特定多肽 或蛋白的“核苷酸序列”,是当被置于合适调控序列的控制之下时被转录和翻译成多 肽或蛋白的核酸序列。
[00135]术语“基因(gene)”是指涉及产生多肽链的DNA片段;它包括在 编码区域前面和后面的区域(引导序列(leader)和尾部序列(trailer)),并且有时, 个别的编码片段(外显子)之间有插入序列(内含子)。在此使用的“有效连接 (operably linked)”是指两个或多个核酸(例如,DNA)片段之间的功能关系。典 型的,它是指转录调控序列与被转录序列的功能关系。例如,启动子有效连接到 编码序列,例如本发明的核酸,假如它刺激或调控该编码序列在合适的宿主细胞 或别的表达系统中的转录的话。一般地,与被转录序列可操作性连接的启动子转 录调控序列与该被转录序列是物理上邻接的,即,它们是顺式作用。然而,一些 转录调控序列,例如增强子,并不需要物理邻接于或位置上靠近于转录被其增强 的编码序列。
[00136]在此所用的术语“表达盒(expression cassette)”指的是可以影响结 构基因(即,蛋白编码序列,例如本发明的木聚糖酶编码序列)在与这些序列相 容的宿主中表达的核苷酸序列。表达序列盒至少包括与多肽编码序列可操作性连 接的启动子;可选择地,也可以与例如转录终止信号的其它序列有效连接。必须 的或有助于影响表达的其它要素也可以被使用,例如,增强子。所以,表达序列 盒也包括质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体,以及类似 物。“载体”包括能够感染细胞、转染细胞、短期或永久地转导细胞的核酸。可以认 识到的是,载体可以是裸露的核酸或与蛋白或脂构成复合物的核酸。载体可选择 地包括病毒的或细菌的核酸和/或蛋白质,和/或膜(例如,细胞膜、病毒脂质被膜 等等)。载体包括,但不局限于复制子(例如,RNA复制子、噬菌体),DNA片段 可以与复制子相连,而变得可以复制。载体包括,但不局限于RNA、自动地自我 复制的环状或线状DNA或RNA(例如,质粒、病毒,以及类似物,见,例如美 国专利5,217,879),并且包括表达质粒和非表达质粒。当重组微生物或细胞培养物 被描述作为“表达载体”的宿主时,这包括染色体外的环状和线状DNA,以及已经 整入到宿主染色体的DNA。当载体被宿主细胞保持时,载体或者可以在细胞有丝 分裂期间作为自主结构稳定复制,或者整入到宿主基因组中。
[00137]如在此使用的,术语“启动子(promoter)”包括所有可以驱动在细 胞例如植物细胞中编码序列的转录的序列。所以,本发明的构建物中使用的启动 子包括顺式作用转录控制元件和调控序列,它们涉及调控或调节基因转录的时间 和/或速率。例如,启动子可以是顺式作用转录控制元件,包括增强子、启动子、 转录终止子、复制起点、染色体整合序列、5’和3’不翻译区,或涉及转录调控的内 含子序列。这些顺式作用序列一般与蛋白质或别的生物分子相互作用(启动/关闭、 调节、调控,等等)来进行转录。“组成型”的启动子是在多数环境条件和发育或细 胞分化状态下持续驱动表达的启动子。“诱导型”或“调控型”启动子在环境条件或发 育条件的影响下指导本发明的核酸的表达。可以影响诱导型启动子进行转录的环 境条件的例子包括厌氧条件、提高的温度、干旱或有光。
[00138]“组织特异性(Tissue-specific)”启动子是只在特定细胞或组织或 器官,例如植物或动物中,有活性的转录控制元件。组织特异性调控可以通过某 些内在因子实现,内在因子可以确保编码某种组织特异性蛋白的基因的表达。已 知这样的因子存在于哺乳动物和植物中,以允许特异性的组织发育。
[00139]术语“植物(plant)”包括整个植物、植物的部分(例如,叶、茎、 花、根等等)、植物原生质体、种子和植物细胞和其后代。一般地,可以在本发明 的方法中使用的植物种类宽泛至可适于转化技术的高等植物,包括被子植物(单 子叶植物和双子叶植物),还有裸子植物。它包括多种倍体型的植物,包括多倍体、 二倍体、单倍体和半合子。如在此使用的,术语“转基因植物”包括这样的植物或植 物细胞,其中插入有异源核酸序列,例如本发明的核酸和各种重组构建物(例如, 表达序列盒)。
[00140]“质粒(Plasmids)”可以从商业上获得、在不受限制地从公众获得、 或者根据公开的程序由可获得的质粒构建。与在此描述的质粒等效的质粒在本领 域是已知的,并且对本领域技术人员来说是很显然的。
[00141]在此所使用的“氨基酸(Amino acid)”或“氨基酸序列(amino acid sequence)”是指寡肽、肽、多肽或蛋白序列,或这些的片段、部分或亚基,天然 发生的或合成的分子。
[00142]“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列,或这些 的片段、部分或亚基,天然发生的或合成的分子。在此所使用的术语“多肽”是指通 过肽键或修饰的肽键彼此连接的氨基酸,后者即肽等配物,并且可以包含不同于 编码基因的20个氨基酸的修饰的氨基酸。可以通过天然过程,如翻译后加工,或 通过本领域中为人所熟知的化学修饰技术来修饰多肽。修饰作用可发生在多肽中 的任何位置,包括肽骨架、氨基酸侧链和氨基或羧基末端。要理解的是,相同类 型的修饰作用可以相同或不同的程度发生在指定多肽的几个位置上。指定的多肽 也可发生多种类型的修饰作用。修饰作用包括乙酰化、酰化、ADP-核糖基化、酰 胺化、核黄素的共价附着、血红素基团的共价附着、核苷酸或核苷酸衍生物的共 价附着、脂质或脂质衍生物的共价附着、磷脂酰肌醇的共价附着、交联的环化作 用、二硫键形成、脱甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲 酰化、γ-羧化、糖基化、形成GPI锚着(anchor)、羟基化、碘化、甲基化、肉豆 蔻酰化、氧化、聚乙二醇化、葡聚糖水解酶加工、磷酸化、异戊二烯化、消旋化、 硒化(selenoylation)、硫酸盐化和转运RNA介导的向蛋白中添加氨基酸如精氨酰 化。(见Creighton,T.E.,Proteins-Structures and Molecular Properties,第二版, W.H.Freeman和Company,New York(1993);Posttranslational Covalent Modification of Proteins,B.C.Johnson主编,Academic Press,New York,1-12页(1983))。本发 明的肽和多肽也包括所有“模拟(mimetic)”和“肽模拟物(peptidomimetic)”形式, 如在下面进一步所详述的。
[00143]如在此所使用的,术语“分离的(isolated)”是指从其原始环境(例 如,如果它是天然发生的,那么就指自然环境)中取出的材料。例如,存在于活 的动物中的天然发生的多核苷酸或多肽就不是分离的,但是从天然系统中的一些 或全部共存材料分离到的同样的多核苷酸或多肽就是分离的。这些多核苷酸可以 成为载体的一部分,和/或这些多核苷酸或多肽可以成为组合物的一部分,而它们 仍然是分离的,因为这些载体或组合物不是天然环境的一部分。如在此所使用的, 术语“纯化的”不要求绝对的纯净;相反,它是一个相对的定义。从文库中获得的单 种核酸可以照惯例提纯到电泳同质。从这些克隆中获得的序列不能直接从文库中 获得,或从人总DNA中获得。本发明的纯化核酸已经相对于生物体中基因组DNA 的剩余部分纯化了至少104-106倍。但是,术语“纯化的”也包括已经从基因组DNA 或文库中或别的环境中的别的序列中提纯的核酸,其纯度提高至少一个数量级, 通常是二或三个数量级,更多的情况是四或五个数量级。
[00144]如在此所使用的,术语“重组(recombinant)”的含义是核酸与在 其自然环境中并不邻接的“骨架(backbone)”核酸相邻。另外,为了成为“被富集 的(enriched)”,核酸要在核酸骨架分子的群体中占到核酸插入物数量的5%或更 多。根据本发明的骨架分子所包括的核酸如表达载体、自我复制的核酸、病毒、 整合核酸和其它载体或用来保留或操作感兴趣的核酸插入物的核酸。一般,被富 集的核酸在重组的骨架分子的群体中占到核酸插入物数量的15%或更多。更典型 的,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的50%或更多。 在一个方面,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的 90%或更多。
[00145]“重组”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白;即 从用编码所需多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。“合 成的”多肽或蛋白是通过化学合成制备的多肽或蛋白。固相化学肽合成方法也可用 来合成本发明的多肽或片段。自从二十世纪60年代早期在本领域中这种方法就是 为人所熟知的(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也见 Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,111.,11-12页))并已经在最近被用于商业上可获得的实验室肽设计 和合成试剂盒(Cambridge Research Biochemicals)。这样的商业可获得的实验室试 剂盒通常应用了H.M.Geysen等在Proc.Natl.Acad.Sci.,USA,81:3998(1984)中 的教导,它们可在联系于单个板的多个“杆”或“钉”的尖端上合成多肽。当使用这样 的系统时,一整板的杆或钉被倒转,并插入进第二个板的对应孔或容器中,其中 含有可将一种合适的氨基酸附着或锚着到钉或杆的尖端上的溶液。通过重复这样 的过程,即倒转和将杆和钉的尖端插入到合适的溶液中,氨基酸可被构建成为所 需的肽。另外,许多现有的FMOC肽合成系统可以使用。例如,多肽或片段的组 装可在固体支持物上使用Applied Biosystems公司的431A型自动肽合成仪来进行。 这样的装置为本发明肽的合成提供了简便途径,它们通过直接合成或通过合成一 系列可使用其它已知技术连接在一起的片段。
[00146]启动子序列可“可操作性地连接于(operably linked to)”编码序列, 此时可在启动子处启动转录的RNA聚合酶将编码序列转录为mRNA。
[00147]“质粒(Plasmid)”标注为前面为小写的"p",后面为大写字母和/ 或数字。起始的质粒可以是市售的,可以不受限制地从公共获得,或可根据已发 表的方法从现有的质粒构建出来。另外,与在此所述的质粒相当的质粒在本领域 中是已知的,对普通技术人员是很明显的。
[00148]DNA的“消化(Digestion)”是指使用仅可在DNA中某些序列上 作用的限制性酶对DNA进行的催化切割。在此使用的各种限制型酶是商业渠道中 可购得的,其使用的反应条件、辅助因子和其他必要条件是普通技术人员已知的。 为了进行分析,一般1μg质粒或DNA片段在大约20μl缓冲溶液中使用大约2单 位酶。为了分离DNA片段进行质粒构建,一般5至50μg的DNA用20至250单 位酶在更大的体积中进行消化。特定的限制性酶的合适缓冲液和底物量由制造商 说明。通常使用的孵育时间为在37℃大约1小时,但根据供应商的使用说明可以 变化。在消化后,可以进行凝胶电泳以分离所需的片段。
[00149]短语“实质上相同的(substantially identical)”就两个核酸或多肽而 言,是指两条或多条序列被比较和比对(aligned)以确定最大一致性(maxium correspondence)时,具有例如至少大约50%、51%、52%、53%、54%、55%、56%、 57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更多的核苷酸或氨基酸残基(序列)同一性,所述的最 大一致性可以通过使用任何一种已知的序列比较算法进行测量,或者通过观察检 验得出。一般,实质上的同一性存在于至少大约100个残基的区域中,最普遍的 是,在至少大约150-200个残基的区域中序列是实质上相同的。在一些方面,序列 在编码区的整个长度上是实质上相同的。
[00150]另外,“实质上相同的”氨基酸序列是通过一个或多个保守或非保 守氨基酸的取代、删除或插入而与参考序列有差异的序列,特别是当这样的取代 发生在分子的非活性位点(催化区域(CD))上时,只要该多肽基本上保留其功能 特性。保守的氨基酸取代例如将一个氨基酸取代为相同类型的另一个氨基酸(例 如,用一种疏水氨基酸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸取代另一种疏水 氨基酸,或用一种极性氨基酸替代另一种极性氨基酸,如用精氨酸取代赖氨酸, 用谷氨酸取代天冬氨酸,或用谷氨酰胺取代天冬酰胺)。可以从例如葡聚糖酶多肽 中删除一个或多个氨基酸,产生多肽结构的修饰,而又不明显地改变其生物学活 性。例如,对葡聚糖酶生物学活性并不是必需的氨基或羧基末端氨基酸可被去掉。 本发明的修饰的多肽序列可以通过任何方法来分析葡聚糖酶生物学活性,包括将 修饰的多肽序列与葡聚糖酶底物接触,确定在该分析中修饰的多肽是否可降低特 异底物的量或增加功能性葡聚糖酶多肽与底物的酶反应的生物产物的量。
[00151]如在此所使用的,“片段(Fragments)”是自然发生的蛋白的一部 分,它可以以至少两种不同的构象存在。片段可以具有与自然发生的蛋白相同的 或基本上相同的氨基酸序列。“基本上相同”的含义是很大程度上但不是完全的相 同,但又保留了与其相关的序列的至少一种功能活性。通常,如果至少大约85% 是相同的,两个氨基酸序列就是“基本上相同的”或“实质上同源的”。也包括具有与 自然发生的蛋白不同的三维结构的片段。这样的一个实例是“前体形式(pro-form)” 分子,如低活性的原蛋白(proprotein),它可通过切割而被修饰,从而产生具有明 显更高活性的成熟酶。
[00152]“杂交(Hybridization)”是指核酸链与互补链通过碱基配对联结的 过程。杂交反应可以是灵敏的和选择性的,感兴趣的特定序列甚至可以在以非常 低的浓度存在于样品中时仍可被识别出来。合适的严紧条件可以通过例如预杂交 和杂交溶液中盐或甲酰胺的浓度,或者通过杂交温度被限定,这是在本领域广为 人知的。例如,严紧性(stringency)可以通过降低盐浓度、增加甲酰胺的浓度、 或者提高杂交温度而增加。在可替代的方面,本发明的核酸可以根据它们在不同 严紧条件(例如,高、中、低)下杂交的能力而进行定义,如在此阐明的。
[00153]例如,在高严紧性条件下的杂交可发生在大约50%甲酰胺、大约 37℃至42℃。在降低的严紧性条件下的杂交可发生在大约35%至25%甲酰胺、大 约30℃至35℃。特别地,在高严紧性条件下的杂交可发生在42℃、在50%甲酰 胺、5XSSPE、0.3%SDS和200n/ml的剪切和变性的鲑鱼精DNA中。杂交可如上 所述发生在降低的严紧性条件下,但在35%甲酰胺中、在降低的温度35℃。与特 定水平的严紧性对应的温度范围可通过计算感兴趣的核酸中嘌呤和嘧啶的比例而 进一步缩小,并相应地调整温度。对上述范围和条件的改变在本领域中是为人所 熟知的。
[00154]术语“变体(variant)”是指在一个或多个碱基对、密码子、内含子、 外显子或氨基酸残基处(分别)被修饰,但仍保留本发明的葡聚糖酶生物学活性 的本发明的多聚核苷酸或多肽。可通过任何方法来产生变体,包括的方法如易错 PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、 盒式诱变、递归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、基因 位点饱和诱变(GSSMTM)及其任何组合。
[00155]术语“饱和诱变(Saturation Mutagenesis)”、“基因位点饱和诱变TM (Gene Site Saturation MutagenesisTM)”或“GSSMTM”包括使用简并寡核苷酸引物 在多核苷酸中导入点突变的方法,以下详细描述。
[00156]术语“优化的定向进化系统(optimized directed evolution system)” 或“优化的定向进化(optimized directed evolution)”包括用于重新装配相关核酸序 列例如相关基因的片段的方法,以下详细描述。
[00157]术语“合成的连接重装配(synthetic ligation reassembly)”或者“SLR” 包括以非随机方式连接寡核苷酸片段的方法,以下详细描述。
产生和操作核酸
[00158]本发明提供了分离、重组和合成的核酸(例如本发明的示范性核 酸,包括SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、 SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、 SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、 SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、 SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、 SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、 SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、 SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、 SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、 SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、 SEQ ID NO:101;SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、 SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、 SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、 SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、 SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、 SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、 SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、 SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、 SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、 SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、 SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、 SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、 SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、 SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、 SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、 SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、 SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、 SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、 SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、 SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、 SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ ID NO:517,和 与示范性核酸具有序列同一性的序列;编码本发明多肽的核酸,本发明多肽例如 SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO;92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、 SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、 SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134;SEQ ID NO:136;SEQ ID NO: 138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO: 148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、 SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、 SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、 SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、 SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、 SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、 SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、 SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、 SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、 SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、 SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、 SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、 SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、 SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、 SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、 SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、 SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、 SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、 SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、SEQ ID NO:480、8EQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、 SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、 SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、SEQ ID NO:516、SEQ ID NO:518 中的示范性氨基酸序列)。本发明也提供了表达盒,诸如表达载体,包括本发明的 核酸,其包括编码本发明多肽的多核苷酸。本发明也包括使用本发明的核酸发现 新的葡聚糖酶序列的方法。本发明也包括使用本发明的核酸抑制葡聚糖酶基因、 转录物和多肽的表达的方法。也提供了修饰本发明的核酸的方法,例如,通过合 成连接重装配、优化的定向进化系统和/或饱和诱变进行。
[00159]本发明的核酸可通过例如克隆和表达cDNA文库、通过PCR扩增 信使或基因组DNA以及类似的方法来制备、分离和/或操作。
[00160]例如,本发明的下述示例性序列最初来自于下述的来源,如下表1 所示:
表1
SEO ID NO:来源
291,292  Aquifex aeolicus
161,162  古细菌
175,176  古细菌
367,368  古细菌
479,480  古细菌
495,496  古细菌
59,60    古细菌
75,76    古细菌
109,110  细菌
229,230  细菌
261,262  细菌
263,264  细菌
273,274  细菌
277,278  细菌
287,288  细菌
293,294  细菌
295,296  细菌
331,332  细菌
333,334  细菌
363,364    细菌
365,366    细菌
369,370    细菌
395,396    细菌
397,398    细菌
401,402    细菌
427,428    细菌
433,434    细菌
435,436    细菌
439,440    细菌
447,448    细菌
449,450    细菌
455,456    细菌
483,484    细菌
485,486    细菌
499,500    细菌
5,6        细菌
231,232    细菌
67,68      细菌
517,518    细菌
399,400    热袍菌属的种(Thermotoga sp.)
1,2        未知来源
101,102    未知来源
103,104    未知来源
105,106    未知来源
107,108    未知来源
11,12      未知来源
111,112    未知来源
113,114    未知来源
115,116    未知来源
117,118    未知来源
119,120    未知来源
121,122    未知来源
123,124    未知来源
125,126    未知来源
127,128    未知来源
129,130   未知来源
13,14     未知来源
131,132   未知来源
133,134   未知来源
135,136   未知来源
137,138   未知来源
139,140   未知来源
141,142   未知来源
143,144   未知来源
145,146   未知来源
147,148   未知来源
149,150   未知来源
15,16     未知来源
151,152   未知来源
153,154   未知来源
155,156   未知来源
157,158   未知来源
159,160   未知来源
163,164   未知来源
165,166   未知来源
167,168   未知来源
169,170   未知来源
17,18     未知来源
171,172   未知来源
173,174   未知来源
177,178   未知来源
179,180   未知来源
181,182   未知来源
183,184   未知来源
185,186   未知来源
187,188   未知来源
189,190   未知来源
19,20     未知来源
191,192   未知来源
193,194   未知来源
195,196   未知来源
197,198   未知来源
199,200   未知来源
201,202   未知来源
203,204   未知来源
205,206   未知来源
207,208   未知来源
209,210   未知来源
21,22     未知来源
211,212   未知来源
213,214   未知来源
215,216   未知来源
217,218   未知来源
219,220   未知来源
221,222   未知来源
223,224   未知来源
225,226   未知来源
227,228   未知来源
23,24     未知来源
233,234   未知来源
235,236   未知来源
237,238   未知来源
239,240   未知来源
241,242   未知来源
243,244   未知来源
245,246   未知来源
247,248   未知来源
249,250   未知来源
25,26     未知来源
251,252   未知来源
253,254   未知来源
255,256   未知来源
257,258   未知来源
259,260   未知来源
265,266   未知来源
267,268   未知来源
269,270   未知来源
27,28     未知来源
271,272   未知来源
275,276   未知来源
279,280   未知来源
281,282   未知来源
283,284   未知来源
285,286   未知来源
289,290   未知来源
29,30     未知来源
297,298   未知来源
299,300   未知来源
3,4       未知来源
301,302   未知来源
303,304   未知来源
305,306   未知来源
307,308   未知来源
309,310   未知来源
31,32     未知来源
311,312   未知来源
313,314   未知来源
315,316   未知来源
319,320   未知来源
321,322   未知来源
323,324   未知来源
325,326   未知来源
327,328   未知来源
329,330   未知来源
33,34     未知来源
335,336   未知来源
337,338   未知来源
339,340   未知来源
341,342   未知来源
343,344   未知来源
345,346   未知来源
347,348   未知来源
349,350      未知来源
35,36        未知来源
351,352      未知来源
353,354      未知来源
355,356      未知来源
357,358      未知来源
359,360      未知来源
361,362      未知来源
37,38        未知来源
371,372      未知来源
373,374      未知来源
375,376      未知来源
377,378      未知来源
379,380      未知来源
381,382      未知来源
383,384      未知来源
385,386      未知来源
387,388      未知来源
389,390      未知来源
39,40        未知来源
391,392      未知来源
393,394      未知来源
403,404      未知来源
405,406      未知来源
407,408      未知来源
409,410      未知来源
41,42        未知来源
411,412      未知来源
413,414      未知来源
415,416      未知来源
417,418      未知来源
419,420      未知来源
421,422      未知来源
423,424      未知来源
425,426      未知来源
429,430      未知来源
43,44    未知来源
431,432  未知来源
437,438  未知来源
441,442  未知来源
443,444  未知来源
445,446  未知来源
45,46    未知来源
451,452  未知来源
453,454  未知来源
457,458  未知来源
459,460  未知来源
461,462  未知来源
463,464  人工
465,466  未知来源
467,468  未知来源
469,470  未知来源
47,48    未知来源
471,472  未知来源
473,474  未知来源
475,476  未知来源
477,478  未知来源
481,482  未知来源
487,488  未知来源
489,490  未知来源
49,50    未知来源
491,492  未知来源
493,494  未知来源
497,498  未知来源
501,502  未知来源
503,504  未知来源
505,506  未知来源
507,508  未知来源
509,510  未知来源
51,52    未知来源
511,512  未知来源
513,514  未知来源
515,516    未知来源
53,54      未知来源
55,56      未知来源
57,58      未知来源
61,62      未知来源
63,64      未知来源
65,66      未知来源
69,70      未知来源
7,8        未知来源
71,72      未知来源
73,74      未知来源
77,78      未知来源
79,80      未知来源
81,82      未知来源
83,84      未知来源
85,86      未知来源
87,88      未知来源
89,90      未知来源
9,10       未知来源
91,92      未知来源
93,94      未知来源
95,96      未知来源
97,98      未知来源
99,100     未知来源
[00161]在一个方面,本发明提供了编码葡聚糖酶的核酸,和由它们编码 的多肽,具有共同的新颖性,这是因为它们来自共同的来源,例如环境来源或古 细菌来源。
[00162]在实施本发明的方法时,同源基因可以通过对模板核酸的操作而 被修饰,如在此所述。本发明也可与本领域中已知的任何方法或方案或装置联合 实施,它们在科学文献和专利文献中已被详细描述。
[00163]本发明的一个方面是分离出的核酸,其含有本发明序列之一、或 包含本发明核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、 300、400或500个连续碱基的片段。分离出的核酸可以包括DNA,包括cDNA、 基因组DNA和合成的DNA。DNA可以是双链或单链的,如果是单链,则可以是 编码链或非编码(反义)链。可选择的是,分离出的核酸可以包括RNA。
[00164]本发明分离的核酸可以被用于制备其中一种本发明多肽,或片段, 其包括本发明多肽的至少5、10、15、20、25、30、35、40、50、75、100或150 个连续连续氨基酸。
[00165]因此,本发明的另一个方面是分离出的核酸,该核酸编码其中一 种本发明多肽,或片段,其包括本发明多肽的至少5、10、15、20、25、30、35、 40、50、75、100或150个连续连续氨基酸。这些核酸的编码序列可以与本发明的 其中一种核酸的其中一种编码序列相同,或者,可以是不同的编码序列,其编码 具有其中一种本发明多肽的至少5、10、15、20、25、30、35、40、50、75、100 或150个连续的氨基酸的其中一种多肽,这是由于遗传代码的丰余或简并性的缘 故。遗传代码对本领域的技术人员是已知的,可在例如B.Lewin,Genes VI,Oxford University Press,1997的214页上获得。
[00166]编码其中一种本发明多肽的分离出的核酸,包括但不限于:仅本 发明核酸的编码序列,和其它的编码序列,如引导序列(leader sequences)或原蛋 白序列(proprotein sequences)和非编码序列,如内含子或编码序列的5′和/或3′ 端的非编码序列。因此,如在此所使用的,术语“编码多肽的多聚核苷酸”包括仅包 含多肽的编码序列的多聚核苷酸以及包括其它额外的编码和/或非编码序列的多聚 核苷酸。
[00167]可选择地,可采用常规的技术如位点定向诱变或本领域专业技术 人员熟悉的其它的技术,诱变本发明核酸序列,以将一些沉默改变导入进本发明 的多聚核苷酸中。如在此所使用的,“沉默改变(silent changes)”包括,例如不改 变由多聚核苷酸编码的氨基酸序列的改变。这样的改变可能是有利的,以便通过 导入在宿主生物体中频繁出现的密码子或密码子对,来增加含有编码多肽的载体 的宿主细胞所产生的多肽的水平。
[00168]本发明也涉及具有核苷酸改变的多聚核苷酸,所述核苷酸改变可 引起本发明的多肽发生氨基酸替代、添加、删除、融合和截短。这样的核苷酸改 变可使用一些技术被导入,如位点定向诱变、随机化学诱变、核酸外切酶III删除 和其它重组DNA技术。可选择地是,这样的核苷酸改变可以是天然的等位基因变 异,它们可以通过在此处所提供的高、中或低严谨性条件下,鉴定可与探针特异 杂交的核酸而被分离出来,所述探针包括本发明序列中的一种序列(或与其互补 的序列)的至少10、15、20、25、30、35、40、50、75、100、150、200、300、 400或500个连续碱基。
一般技术
[00169]用来实施本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、 基因组DNA、载体、病毒或其杂交体,都可从多种来源分离、利用遗传工程进行 改造、扩增和/或利用重组技术表达/产生。从这些核酸产生的重组多肽(例如葡聚 糖酶、甘露聚糖酶或木聚糖酶)可以被单独分离或克隆,并检测所需的活性。可 使用任何的重组表达系统,包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系 统。
[00170]可选择地,这些核酸可以通过公知的化学合成技术体外合成,这 些合成技术描述下述文献中:例如Adams(1983)J.Am.Chem.Soc.105:661; Belousov(1997)Nucleic Acids Res.25:3440-3444;Frenkel(1995)Free Radic.Biol. Med.19:373-380;Blommers(1994)Biochemistry 33:7886-7896;Narang(1979)Meth. Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett. 22:1859;美国专利4,458,066。
[00171]核酸操作技术,例如亚克隆、标记探针(例如,使用Klenow聚合 酶、切口平移、扩增来进行随机引物标记)、测序、杂交等等已经在科学和专利文 献中详细描述过,见,例如Sambrook等,MOLECULAR CLONING:A LABORATORY MANUAL(第二版),1-3卷,Cold Spring Harbor Laboratory,(1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel等.John Wiley & Sons Inc.,New York(1997);LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,第I部分.Theory and Nucleic Acid Preparation,Tijssen等.Elsevier,N.Y. (1993)。
[00172]另一种用于实践本发明的方法的有用的获得核酸和操作核酸的方 法是从基因组样品中进行克隆,并且假如需要的话,筛选和再克隆从例如基因组 克隆或cDNA克隆中分离或扩增出的插入物。在本发明的方法中使用的核酸来源 包括基因组文库或cDNA文库,其被包含在例如哺乳动物的人工染色体(MACs) 中,见,例如,美国专利5,721,118;6,025,155;人类人工染色体中,见,例如Rosenfeld (1997)Nat.Genet.15:333-335;酵母人工染色体(YAC)中;细菌人工染色体(BAC) 中;P1人工染色体中,见,例如Woon(1998)Genomics 50:306-316;P1-衍生的 载体(PACs)中,见,例如,Kern(1997)Biotechniques 23:120-124;粘粒、重组 病毒、噬菌体或质粒中。
[00173]一方面,编码本发明的多肽的核酸在合适的阶段与引导序列组合, 该引导序列能够引导翻译出的多肽或其片段进行分泌。
[00174]本发明提供融合蛋白和编码所述融合蛋白的核酸。本发明的多肽 可以与异源的肽或多肽融合,例如与N端识别肽(N-terminal identification peptides) 融合,该N端识别肽赋予所期望的特性,例如增加稳定性或使提纯简单化。为了 例如产生更高免疫原性的肽、更容易地分离重组合成的肽、确定和分离抗体和表 达抗体的B细胞,等等,本发明的肽和多肽也可以合成和表达为融合蛋白,其具 有一个或多个与之连接的额外的结构域。有利于检测和提纯的结构域包括,例如, 金属螯合肽,例如使得在固定化的金属上进行提纯成为可能的多组氨酸单元和组 氨酸-色氨酸模式单元,使得在固定的免疫球蛋白上进行提纯成为可能的蛋白A结 构域,和在FLAGS延展/亲和纯化系统中使用的结构域(Immunex Corp,Seattle WA)。为了有利于纯化,可以在纯化结构域和包含上述模体的肽或多肽之间引入 可切割的连接序列,例如因子Xa或肠激酶(Inivitrogen,San Diego CA)。例如, 表达载体可以包括与六个组氨酸残基连接的编码抗原决定部位的核酸序列,并连 接有硫氧还蛋白和肠激酶切割位点(见,例如,Williams(1995)Biochemistry 34: 1787-1797;Dobeli(1998)Protein Expr.Purif 12:404-414)。组氨酸残基有利于检测 和纯化,而肠激酶切割位点提供了将抗原决定部位从融合蛋白的剩余部分中纯化 出来的方法。关于编码融合蛋白的载体的技术和融合蛋白的应用在科学和专利文 献中有很好的描述,见,例如,Kroll(1993)DNA Cell.Biol.,12:441-53。
转录和翻译控制序列
[00175]本发明提供了与表达(例如,转录或翻译)控制序列可操作性连 接的本发明的核酸(例如,DNA)序列,以指导或调控RNA合成/表达,这里的 表达控制序列例如启动子或增强子。表达控制序列可以在表达载体中。典型的细 菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。典型的真核启动子包括 CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录 病毒的LTRs、鼠金属硫蛋白I启动子。
[00176]合适于在细菌中表达多肽的启动子包括E.coli lac或trp启动子、 lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、λPL 启动子、编码糖酵解酶例如3-磷酸甘油酸激酶(PGK)的操纵子的启动子和酸性 磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、 热休克启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白-I 启动子。已知的用来控制基因在原核和真核细胞或它们的病毒中的表达的别的启 动子也可以使用。合适于在细菌中表达多肽或其片段的启动子包括E.coli lac或trp 启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动 子、λPL启动子、编码糖酵解酶例如3-磷酸甘油酸激酶(PGK)的操纵子的启动子 和酸性磷酸酶启动子。真菌启动子包括α因子启动子。真核启动子包括CMV即时 早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚期SV40启动子、 反转录病毒的LTRs、鼠金属硫蛋白-I启动子。已知的用来控制基因在原核和真核 细胞或它们的病毒中的表达的别的启动子也可以使用。
组织特异性植物启动子
[00177]本发明提供了可以以组织特异性方式表达的表达序列盒,例如, 可以以组织特异性方式表达本发明的葡聚糖酶的表达序列盒。本发明也提供了以 组织特异性方式表达本发明的葡聚糖酶的植物或种子。所述的组织特异性可以是 种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的特异性。
[00178]一方面,组成型启动子例如CaMV 35S启动子可以用于在植物或 种子的特异部分或整个植物内的表达。例如,为了过量表达,植物启动子片段可 以用于指导核酸在植物例如再生植物的一些或所有组织中表达。这样的启动子在 此称为“组成型”启动子,它可以在大多数环境条件和发育状态或细胞分化情况下具 有活性。组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录起始区域、 衍生于根癌农杆菌的T-DNA的1’-或2’-启动子,以及本领域技术人员已知的来自 不同植物基因的别的转录起始区域。这些基因包括,例如,拟南芥(Arabidopsis) 的ACT11(Huang(1996)Plant Mol.Biol.33:125-139);拟南芥的Cat3(GenBank 号:U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);甘蓝型油菜(Brassica napus)的编码硬脂酰-酰基载体蛋白去饱和酶的基因(Genbank号:X74782, Solocombe(1994)Plant Physiol.104:1167-1176);玉米的GPc1(GenBank号:X15596; Martinez(1989)J.Mol.Biol 208:551-565);玉米的Gpc2(GenBank号:U45855, Manjunath(1997)Plant Mol.Biol.3397-112);美国专利4,962,028;5,633,440中 描述的植物启动子。
[00179]本发明使用的组织特异性或组成型启动子可以衍生自病毒,包括, 例如,烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA 92:1679-1683);只能在受感染的水稻植物的韧皮部细胞中复制的水稻东格鲁杆状 病毒(RTBV),其启动子驱动韧皮部特异的报告基因的表达;在导管、叶中轴细 胞、根尖中具有最高活性的木薯脉带花叶病毒(cassava vein mosaic virus,CVMV) 启动子(Verdaguer(1996)Plant Mol.Biol.31:1129-1139)。
[00180]可选择地,植物启动子可以指导表达葡聚糖酶的核酸表达于特定 组织、器官或细胞类型中(即,组织特异启动子),或者可以在更加精确的环境或 发育控制下或在可诱导启动子的控制下指导表达葡聚糖酶的核酸的表达。可以影 响转录的环境条件的例子包括厌氧条件、提高温度、有光、或喷撒化学试剂/激素。 例如,本发明包括玉米的干旱诱导型启动子(Busk(1997)如上),马铃薯的寒冷、 干旱、高盐诱导型启动子(Kirch(1997)Plant Mol.Biol.33:897 909)。
[00181]组织特异性启动子只在该组织的发育阶段的某个时间段内促进转 录。参见,例如描述拟南芥LEAFY基因启动子的Blazquez(1998)Plant Cell 10:791-800。也见,描述转录因子SPL3的Cardon(1997)Plant J 12:367-77,SPL3 识别拟南芥(A.thaliana)的调节植物分生组织形成的基因(meristem identity gene) AP1的启动子区域的保守序列模体;和描述分生组织启动子eIF4的Mandel(1995) Plant Molecular Biology,29卷,995-1004页。可以使用在特定组织的整个生命周期 都具有活性的组织特异性启动子。一方面,本发明的核酸与主要在花纤维细胞 中有活性的启动子有效连接。一方面,本发明的核酸与主要在棉花纤维细胞伸长 的阶段具有活性的启动子有效连接,例如,Rinehart(1996)如上所描述的。核酸 可以与Fb12A基因启动子有效连接,这样它将偏好在棉花纤维细胞(Ibid)中表达。 也见John(1997)Proc.Natl.Acad.Sci.USA 89:5769-5773;John等,美国专利 5,608,148和5,602,321,描述了用于构建转基因棉花植物的棉花纤维特异性启动子 和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例 子包括乙醇脱氢酶基因中的启动子(DeLisle(1990)Int.Rey.Cytol.123:39-60)。 也可以使用别的启动子来表达本发明的核酸,包括,例如,胚珠特异的、胚芽特 异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的组合;叶特异的启 动子(见,例如,Busk(1997)Plant J.11:12851295,描述玉米的叶特异的启动子); Agrobacterium rhizogenes的ORF13启动子(ORF13启动子在根部表现出高活性, 见,例如Hansen(1997)如上);玉米花粉特异性启动子(见,例如Guerrero(1990) Mol.Gen.Genet.224:161168);番茄启动子,其在果实成熟、变老、从叶上脱落 的过程中有活性,在花中具有低一些的活性(见,例如,Blume(1997)Plant J.12:731 746);马铃薯SK2基因的雌蕊特异性启动子(见,例如Ficker(1997)PlantMol.Biol. 35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮组织和转基因苜蓿的花 梗顶中具有活性,这使它成为使外源基因靶向表达于活跃地生长的芽或纤维的表 皮层的有用工具;胚珠特异的BEL1基因(见,例如,Reiser(1995)Cell 83:735-742, GenBank号:U39944);和/或Klee,美国专利5,589,583中的启动子,描述了一种 植物启动子区域,其可导致在分生组织和/或快速分裂细胞中的高水平转录。
[00182]可选择的是,经由对植物激素例如植物生长素的暴露便能被诱导 的植物启动子用于表达本发明的核酸。例如,本发明可以使用大豆(Glycine max L.) 中的植物生长素响应元件E1启动子片段(AuxREs)(Liu(1997)Plant Physiol. 115:397-407);植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产 生响应)(Chen(1996)Plant J.10:955-966);烟草的植物生长素诱导的parC启动 子(Sakai(1996)37:906-913);植物生物素响应元件(Streit(1997)Mol.Plant Microbe Interact.10:933-937);和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science 274:1900-1902)。
[00183]本发明的核酸也可以与植物启动子有效连接,所述植物启动子暴 露于施用于植物的化学试剂例如除草剂或抗生素,便能够被诱导。例如,可以使 用由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol.38:568-577);不同的除草剂安全剂的应用诱导不同的基因表达模式,包括 在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导 的启动子的控制下,例如,被描述的含有Avena sativa L.(oat)精氨酸脱羧酶基因 的转基因烟草植物(Masgrau(1997)Plant J.11:465-473);或者处于水杨酸响应元 件的控制之下(Stange(1997)Plant J.11:1315-1324)。使用化学(例如,激素或 杀虫剂)诱导的启动子,即,对施用于田间的转基因植物的化学剂发生响应的启 动子,本发明的多肽的表达可以在植物发育的特定阶段被诱导。所以,本发明也 提供含有可诱导基因的转基因植物,所述可诱导基因编码本发明的多肽,其宿主 范围局限于靶向植物种类,例如玉米、水稻、大麦、小麦、马铃薯或别的作物, 并且所述可诱导基因在作物发育的任何阶段都可被诱导。
[00184]本领域技术人员会认识到,组织特异性的植物启动子可以驱动可 操作性连接的序列在不是靶向组织的组织中表达。所以,组织特异性启动子是驱 动在靶向组织或细胞类型中产生优势表达的启动子,但是也可以导致在别的组织 中的一些表达。
[00185]本发明的核酸也可以与化学试剂诱导的植物启动子有效连接。这 些试剂包括例如,除草剂、合成的植物生长激素或抗生素,它们可以通过例如喷 雾而施用于转基因植物。本发明的产生葡聚糖酶的核酸的可诱导表达将允许对具 有最佳的葡聚糖酶表达和/或活性的植物进行选择。植物局部的发育也可以因此被 控制。这样,本发明提供了促进植物和植物的部分的收获的方法。例如,在许多 实施方式中,玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder(1997)Plant Cell Physiol.38:568-577)。应用不同的除草剂安全剂诱导出 不同的基因表达模式,包括在根中、排水器中、芽尖分生组织中的表达。本发明 的编码序列也可以处于四环素诱导的启动子的控制之下,例如,对含有燕麦(Avena sativaL.)(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)Plant J.11:465-473);或者,可以由水杨酸响应元件控制(Stange(1997)Plant J. 11:1315-1324)。
[00186]在一些方面,适当的多肽表达可能要求该编码区域的3’端有多聚 腺苷酸化区域。多聚腺苷酸化区域可以出自天然基因、各种别的植物(或动物或 其它)基因、或者根癌农杆菌T-DNA中的基因。
表达载体和克隆载体
[00187]本发明提供包括本发明的核酸例如编码本发明的葡聚糖酶、甘露 聚糖酶或木聚糖酶的序列的表达载体和克隆媒介物。本发明的表达载体和克隆媒 介物可以包括病毒颗粒、杆状病毒、噬菌体、噬菌粒(phagemids)、粘粒、fos-质 粒(fosmids)、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪 狂犬病病毒和SV40的衍生物)、基于P1的人工染色体、酵母质粒、酵母人工染色 体和任何别的对感兴趣的特定宿主(例如,杆状菌、曲霉和酵母)有特异性的载 体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大多数合适的 载体对于本领域技术人员都是已知的,并且可以商业获得。典型的载体包括:细 菌:pQE载体(Qiagen)、pBluescript质粒、PNH载体、λ-ZAP载体(Stratagene); ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia);真核细胞的:PXT1、pSG5 (Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以 使用任何别的质粒或别的载体,只要它们可以在宿主中复制和维持下去。可以在 本发明中使用低拷贝数或高拷贝数的载体。
[00188]表达载体可以包括启动子、翻译起始和转录终止的核糖体结合位 点。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制 起始点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、 转录终止序列、5’边的非转录序列。一方面,衍生于SV40剪接位点和聚腺苷酸化 位点的DNA序列可以用于提供所需要的不被转录的基因元件。
[00189]在一个方面,表达载体含有一个或多个选择性标记基因,使得可 以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原 酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli) 具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。启动子区 域可以使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体,从任何期望的 基因中选择出来。
[00190]用于在真核细胞中表达多肽或其片段的载体也可以含有增强子, 以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约 300bp,其作用于启动子,增强其转录。例子包括在SV40复制起点下游侧100bp 到270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增 强子,和腺病毒增强子。
[00191]核酸序列可以通过各种程序插入载体中。一般的,把插入物和载 体用合适的限制性内切酶消化后,序列可以连接到载体中的所希望的位置。可选 择地,插入物和载体的平末端可以被连接。在本领域已知多种克隆技术,例如在 Ausubel和Sambrook中描述的。这样的程序和别的程序被认为在本领域技术人员 已知的范围内。
[00192]载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色 体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体DNA、 杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如 痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种 克隆和表达载体被例如Sambrook描述。
[00193]可以使用的特定的细菌载体包括商业上可获得的质粒,包括以下 已知的克隆载体的遗传元件:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden)、GEM1(Promega Biotec,Madison,WI,USA)、pQE70、 pQE60、pQE-9(Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、 pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5 (Pharmacia)、pKK232-8和pCM7。特定的真核载体包括pSV2CAT、pOG44、pXT1、 pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用 任何别的载体,只要它可以在宿主细胞中复制和维持。
[00194]本发明的核酸可以在表达序列盒、载体或病毒中表达,在植物细 胞和种子中短暂的或稳定的表达。一个典型的短暂表达系统应用了附加体 (episomal)表达系统,例如,在核中通过含有超螺旋DNA的附加小染色体的转 录而产生的花椰菜花叶病毒(CaMV)RNA,见,例如,Covey(1990)Proc.Natl. Acad.Sci.USA 87:1633-1637。作为选择,编码序列,即本发明的序列的全部或亚 片段,可以插入到植物宿主细胞基因组中,而成为该宿主染色体DNA的整合的一 部分。正义和反义转录产物可以以这种方式被表达。包含本发明的核酸的序列(例 如,启动子或编码区域)的载体可以包括用于在植物细胞或种子中选择表型的标 记基因。例如,所述标记可以编码生物杀灭剂抗性,特别是抗生素抗性,例如对 卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性,例如对氯磺隆或Basta的 抗性。
[00195]可以在植物中表达核酸和蛋白的表达载体在本领域中是已知的, 可以包括,例如,根癌农杆菌的载体、马铃薯病毒X(见,例如,Angell(1997) EMBO J.16:3675-3684)、烟草花叶病病毒(见,例如,Casper(1996)Gene 173:69-73)、 番茄丛矮病毒(见,例如,Hillman(1989)Virology 169:42-50)、烟草蚀纹病毒(见, 例如,Dolja(1997)Virology 234:243-252)、菜豆金色花叶病毒(见,例如,Morinaga (1993)Microbiol inimunol.37:471-476)、花椰菜花叶病毒(见,例如,Cecchini (1997)Mol.Plant Microbe Interact.10:1094-1101)、玉米Ac/Ds转座元件(见, 例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol. Inimunol.204:161-194),和玉米抑制基因-突变基因(Spm)转座元件(见,例如 Schlappi(1996)Plant Mol.Biol.32:717-725);和它们的衍生物。
[00196]在一个方面,蛋白载体可以有两套复制系统,使其可以在两种生 物中保持,例如在哺乳动物或昆虫细胞中表达,在原核宿主中克隆和扩增。进一 步,对于整合表达载体,该表达载体可以包括至少一个与宿主细胞基因组同源的 序列。它可以在表达构建物的两侧包含两个同源序列。通过选择包含入载体的合 适的同源序列,可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建 在本领域已知。
[00197]本发明的表达载体也可以包括选择性的标记基因,以便对已经转 化的细菌株进行选择,例如,使细胞对药物,例如氨苄青霉素、氯霉素、红霉素、 卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成 基因,例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。
[00198]表达载体中的DNA序列可有效连接于合适的表达控制序列(启动 子)以引导RNA的合成。具有特定命名的细菌启动子包括lacI、lacZ、T3、T7、 gpt、λPR、PL和trp。真核细胞启动子包括CMV即时早期启动子、HSV胸苷激酶 启动子、早期和晚期SV40启动子、反转录病毒的LTRs和鼠金属硫蛋白-I启动子。 选择合适的载体和启动子是在本领域普通技术人员的水平之内。表达载体也含有 翻译起始和转录终止的核糖体结合位点。载体也包括扩增表达的合适序列。可使 用氯霉素转移酶(CAT)载体或其它具有选择性标记的载体从任何期望的基因中选 择启动子区域。另外,为选择被转化的宿主细胞,表达载体在一个方面含有一个 或多个选择性标记基因以提供一种表型特征,如使真核细胞培养物具有二氢叶酸 还原酶或新霉素抗性,或使大肠杆菌具有四环素或氨苄青霉素抗性。
[00199]哺乳动物表达载体也可以包括复制起始点、任何必须的核糖体结 合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧的非转录序 列。在一些方面,衍生于SV40剪接位点和聚腺苷酸化位点的DNA序列可以用于 提供所需要的不被转录的基因元件。
[00200]用于在真核细胞中表达多肽或其片段的载体也可以含有增强子, 以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约 300bp,作用于启动子,增强其转录。例子包括在SV40复制起点下游侧100bp到 270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子 和腺病毒增强子。
[00201]另外,表达载体通常含有一个或多个选择性标记基因,使得可以 对含有该载体的宿主细胞进行选择。这些选择性标记包括编码二氢叶酸还原酶的 基因和使得真核细胞培养物具有新霉素抗性的基因、使得E.coli具有四环素或氨 苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。
[00202]在一些方面,编码本发明其中一个多肽或含有其至少大约5、10、 15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的核酸在合适 的阶段与能够引导翻译出的多肽或其片段分泌的引导序列组装。可选择的是,核 酸可编码一种融合多肽,其中本发明其中一个多肽或含有其至少5、10、15、20、 25、30、35、40、50、75、100或150个连续氨基酸的片段与异源肽或多肽融合, 这些异源肽例如可提供所需特征如增加的稳定性或简化的纯化步骤的N-末端识别 肽。
[00203]核酸序列可以通过各种程序插入载体中。一般的,把插入物和载 体用合适的限制性内切酶消化后,序列可以在载体中的期望位置连接。可选择的 是,插入物和载体的平末端可以被连接。多种克隆技术在Ausubel等,Current Protocols in Molecular Biology,John Wiley 503 Sons,Inc.1997和Sambrook等, Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold Spring Harbor Laboratory Press(1989)中被公开。这些程序和其它的程序被认为在本领域技术人员所知道 的范围之内。
[00204]载体可以是例如质粒、病毒颗粒或噬菌体的形式。别的载体包括 染色体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体 DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA 例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的 各种克隆和表达载体由Sambrook等,Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold Spring Harbor,N.Y.(1989)描述。
宿主细胞和转化细胞
[00205]本发明也提供了包含本发明的核酸序列例如编码本发明的葡聚糖 酶的序列或者本发明的载体的转化细胞。宿主细胞可以是本领域技术人员熟悉的 任何宿主细胞,包括原核细胞,真核细胞,例如,细菌细胞、真菌细胞、酵母细 胞、哺乳动物细胞、昆虫细胞或植物细胞。典型的细菌细胞包括大肠杆菌(E.coli)、 乳酸乳球菌(Lactococcus lactis)、链霉菌(Streptomyces)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、鼠伤寒沙门氏菌(Salmonella typhimurium) 和芽孢杆菌属(Bacillus)、链霉菌属(Streptomyces)和葡萄球菌属(Staphyloccus) 中的任何种类。典型的昆虫细胞包括果蝇S2(Drosophila S2)和草地夜蛾Sf9 (Spodoptera Sf9)。典型的酵母细胞包括巴斯德毕赤酵母(Pichia pastoris)、酿酒 酵母(Saccharomyces cerevisiae)或粟酒裂殖酵母(Schizosaccharomyces pombe)。 典型的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的 宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是已 知的,在技术和科学文献中有描述,见,例如,Weising(1988)Ann.Rey.Genet. 22:421-477;美国专利5,750,870。
[00206]载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、 病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸转染、 DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M., Battey,I.,Basic Methods in Molecular Biology,(1986))。
[00207]一方面,本发明的核酸或载体导入细胞是为了筛选,所以,所述 核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞 类型决定。典型的方法包括CaPO4沉淀法、脂质体融合、脂转染法(例如, LIPOFECTINTM)、电穿孔法、病毒感染法,等等。候选的核酸可以稳定地整合到 宿主细胞基因组中(例如,用反转录病毒导入)或者可以短暂的或稳定的存在于 细胞质中(即,通过使用传统的质粒,利用标准的调控序列、选择标记,等等)。 因为许多药学上重要的筛选要求人或模型哺乳动物靶细胞,所以可以使用能够转 染这些靶细胞的反转录病毒载体。
[00208]适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述 营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适 的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温 度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生 所需的多肽或其片段。
[00209]细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的 粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方 法破碎,包括冷冻-融解循环、声波裂解法、机械破碎法或使用细胞溶解试剂。 这些方法为本领域技术人员所熟悉。表达的多肽或其片段可以从重组细胞培养物 中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素 色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收 和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的 话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。
[00210]可以以常规方式应用宿主细胞中的构建物以产生由重组序列编码 的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体的该宿主细 胞产生的多肽可以是糖基化的或者可以是非糖基化的。本发明的多肽可以包括或 者不包括起始的甲硫氨酸残基。
[00211]也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译 系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所 述多肽或其片段的核酸可操作性连接的启动子。一些方面,该DNA构建物在进行 体外转录反应之前可以是线性的。转录得到的mRNA然后与合适的无细胞翻译提 取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。
[00212]表达载体可以含有一个或多个选择性标记基因,为选择转化宿主 细胞提供表型性状,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者 大肠杆菌的例如四环素或氨苄青霉素的抗性。
[00213]含有感兴趣的多聚核苷酸例如本发明的核酸的宿主细胞可在常规 营养培养基中培养,该培养基经改良以适于活化启动子、选择转化子或扩增基因。 培养条件如温度、pH和类似的条件是以前那些被选择表达的宿主细胞所使用的条 件,这对于普通技术人员是很明显的。被鉴定具有特异酶活性的克隆然后被测序, 以鉴定编码具有增强活性的酶的多聚核苷酸序列。
[00214]本发明提供了在细胞中过量表达重组葡聚糖酶的方法,包括表达 含有本发明的核酸的载体,本发明的核酸例如含有与本发明的示范性序列在至少 大约100个残基的区域内具有至少大约50%、51%、52%、53%、54%、55%、56%、 57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更多的序列同一性的核酸序列的核酸,其中所述的序列 同一性是通过采用序列比较算法的分析或通过观察检验来确定的,或者,本发明 的核酸例如在严紧条件下与本发明的核酸序列杂交的核酸。可通过任何手段实现 过量的表达,例如使用高活性启动子、双顺反子载体或通过载体的基因扩增。
[00215]本发明的核酸可以用任何的体外或体内表达系统表达或过量表 达。任何细胞培养系统都可用来表达或过量表达重组蛋白,包括细菌、昆虫、酵 母、真菌或哺乳动物培养物。通过适当地选择启动子、增强子、载体(例如,使 用复制子载体、双顺反子载体(见,例如Gurtu(1996)Biochem.Biophys.Res. Commun.229:295-8)、培养基、培养系统等可以实现过量表达。在一个方面,在细 胞系统中,使用了选择标记如谷氨酰胺合成酶(见,例如Sanders(1987)Dev.Biol. Stand.66:55-63)的基因扩增可以被用来过量表达本发明的多肽。
[00216]关于这种方法的其它细节可在公共文献中找到,并且/或者它们对 于专业技术人员是已知的。在一个特定的非限制性的示例中,这种可获得的公共 文献包括EP 0659215(WO 9403612A1)(Nevalainen等);Lapidot,A.,Mechaly,A., Shoham,Y.,"Overexpression and single-step purification of a thermostable glucanase from Bacillus stearothermophilus T-6,"J.Biotechnol.Nov 51:259-64(1996);Lüthi,E., Jasmat,N.B.,Bergquist,P.L.,"Endoglucanases from the extremely thermophilic bacterium Caldocellum saccharolyticum:overexpression of the gene in Escherichia coli and characterization of the gene product,"Appl.Environ.Microbiol.Sep 56:2677-83 (1990);以及Sung,W.L.,Luk,C.K.,Zahab,D.M.,Wakarch.uk,W., "Overexpression of the Bacillus subtilis and circulans Endoglucanases in Escherichia coli,"Protein Expr.Purif.Jun 4:200-6(1993),尽管这些参考文献并不能教导本申 请中的发明酶。
[00217]宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核 细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。作为合适的宿主的代表 性例子,细菌细胞例如大肠杆菌、链霉菌、枯草芽孢杆菌、鼠伤寒沙门氏菌和链 霉菌属和葡萄球菌属中的许多种类,真菌细胞例如酵母,昆虫细胞例如果蝇S2和 草地夜蛾Sf9,动物细胞例如CHO、COS或黑色素瘤细胞,以及腺病毒。合适的 宿主的选择在本领域技术人员的能力范围内。
[00218]载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、 病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、 DEAE-Dextran介导的转染、脂转染法或电穿孔(Davis,L.,Dibner,M.,Battey,I., Basic Methods in Molecular Biology,(1986))。
[00219]适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述 营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适 的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温 度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生 所需的多肽或其片段。
[00220]细胞通常可以通过离心收获,通过物理或化学方法破碎,保留得 到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常 规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞溶解试 剂。这些方法为本领域技术人员所熟悉。表达的多肽或其片段可以从重组细胞培 养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤 维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法 回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需 要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。
[00221]也可以应用各种哺乳动物细胞培养系统来表达重组蛋白。哺乳动 物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系(如Gluzman,Cell,23:175, 1981所述)和别的能够由相容性载体表达蛋白质的细胞系,例如C127、3T3、CHO、 HeLa和BHK细胞系。
[00222]可以以常规方式应用宿主细胞中的构建物来产生由重组序列编码 的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体的该宿主细 胞产生的多肽可以是糖基化的或者可以是非糖基化的。本发明的多肽可以包括或 者不包括起始的甲硫氨酸残基。
[00223]可选择地是,本发明的多肽,或含有其至少5、10、15、20、25、 30、35、40、50、75、100或150个连续氨基酸的片段可利用常规的肽合成仪来合 成产生。在另一个方面,可以通过肽合成方法来应用多肽的片段或部分以产生相 应的全长多肽;因此,片段可用作产生全长多肽的中间体。
[00224]也可以采用无细胞(cell-free)的翻译系统利用由DNA构建物转录 得到的mRNA来产生本发明的其中一种多肽,或含有其至少5、10、15、20、25、 30、35、40、50、75、100或150个连续氨基酸的片段,所述DNA构建物包括与 编码所述多肽或其片段的核酸可操作性连接的启动子。一些方面,该DNA构建物 在进行体外转录反应之前可以是线性的。转录得到的mRNA然后与合适的无细胞 翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。
扩增核酸
[00225]在实践本发明时,可以通过扩增来复制本发明的核酸和编码本发 明的葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸,或本发明的经修饰的核酸。扩增 也可以用于克隆或修饰本发明的核酸。所以,本发明提供了用于扩增本发明的核 酸的扩增引物序列对。本领域技术人员能够针对这些序列的任何部分或全长设计 出扩增引物序列对。
[00226]在一个方面,本发明提供了利用本发明的引物对扩增出的核酸, 所述的引物对例如由本发明核酸的大约前(5′)12、13、14、15、16、17、18、19、 20、21、22、23、24、或25个残基和互补链的大约前(5′)15、16、17、18、19、 20、21、22、23、24或25个残基所示的引物对。
[00227]本发明提供了用于扩增编码具有葡聚糖酶活性的多肽的核酸的扩 增引物序列对,其中所述的引物对能够扩增含有本发明的序列或片段或其子序列 的核酸。扩增引物序列对的一个或每个成员可以包括含有序列的至少大约10至50 个连续碱基,或序列的大约12、13、14、15、16、17、18、19、20、21、22、23、 24或25个连续碱基的寡核苷酸。本发明提供了扩增引物对,其中所述的引物对包 含的第一个成员具有本发明核酸的大约前(5′)12、13、14、15、16、17、18、 19、20、21、22、23、24或25个残基所示的序列,第二个成员具有第一个成员的 互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24 或25个残基所示的序列。本发明提供了利用本发明的扩增引物对通过扩增例如聚 合酶链式反应(PCR)产生的葡聚糖酶、甘露聚糖酶或木聚糖酶。本发明提供了利 用本发明的扩增引物对通过扩增例如聚合酶链式反应(PCR)制备葡聚糖酶、甘露 聚糖酶或木聚糖酶的方法。在一个方面,扩增引物对可从文库,例如基因文库, 如环境文库中扩增出核酸。
[00228]扩增反应也可以用于定量样品中的核酸的量(例如,细胞样品中 的信息(message)的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸或 定量样品中的特定核酸的量。在本发明的一方面,从细胞或cDNA文库中分离出 的信息被扩增。
[00229]熟练的技术人员能够选择和设计适合的寡核苷酸扩增引物。扩增 方法在本领域是已知的,包括,例如聚合酶链式反应,PCR(见,例如PCR PROTOCOLS,A GUIDE TO METHODS AND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGLES(1995),ed.Innis,Academic Press,Inc.,N.Y., 连接酶链反应(LCR)(见,例如Wu(1989)Genomics 4:560;Landegren(1988) Science 241:1077;Barringer(1990)Gene 89:117);转录扩增(见,例如Kwoh(1989) Proc.Natl.Acad.Sci.USA 86:1173);和自主序列复制(见,例如Guatelli(1990) Proc.Natl.Acad.Sci.USA 87:1874);Q Beta复制酶扩增(见,例如Smith(1997) J.Clin.Microbiol.35:1477-1491),自动Q-beta复制酶扩增分析(见,例如Burg(1996) Mol.Cell.Probes 10:257-271)和别的RNA聚合酶介导的技术(例如,NASBA, Cangene,Mississauga,Ontario);也见Berger(1987)Metbods Enzymol.152:307-316; Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995) Biotechnology 13:563-564。
确定序列同一性(sequence identity)的程度
[00230]本发明提供了核酸,其包括与本发明的示例性核酸(例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、 SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、 SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、 SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、 SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、 SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、 SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、 SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、 SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、 SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、 SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、 SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、 SEQ ID NO:157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、 SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、 SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、 SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、 SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、 SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、 SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、 SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、 SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、 SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、 SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、 SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、 SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、 SEQ ID NO:391、SEQ ID NO:393、SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、 SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、SEQ ID NO:423、SEQ ID NO:425、 SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、SEQ ID NO:441、SEQ ID NO:443、 SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、SEQ ID NO:459、SEQ ID NO:461、 SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、SEQ ID NO:477、SEQ ID NO:479、 SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、SEQ ID NO:495、SEQ ID NO:497、 SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、 SEQ ID NO:517)在至少大约10、20、30、40、50、60、70、75、100、150、200、 250、300、350、400、450、500、550、600、650、700、750、800、850、900、 950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、 1550或更多残基的区域内具有至少大约50%、51%、52%、53%、54%、55%、56%、 57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或更多或完全(100%)的序列同一性的序列。本发明提供 了多肽,其包括与本发明的示范性多肽具有至少大约50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、 68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多或完全的(100%)序列同一性的序列。 序列同一性(同源性)的程度可以使用任何计算机程序和相关的参数来测定,包 括在此所述的那些程序和参数,如BLAST 2.2.2.或FASTA版本3.0t78,其中使用 默认参数(default parameters)。
[00231]本发明的核酸序列可以包括本发明的示例性序列和与其实质上相 同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、 400或500个连续核苷酸。本发明的核酸序列的同源序列和片段和片段,是指与这 些序列具有至少99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、 65%、60%、55%或50%的同源性的序列。同源性可使用在此所述的任何计算机程 序和参数来确定,包括FASTA版本3.0t78,并使用默认参数。同源序列也包括RNA 序列,其中尿嘧啶替代了本发明核酸序列中的胸腺嘧啶。同源序列可以使用任何 在此描述的程序或者可以由校正测序错误而获得。要理解的是,本发明的核酸序 列可以用传统的单字符格式(single character forrmat)来表示(见Stryer,Lubert. Biochemistry,3rd Ed.,W.H Freeman & Co.,New York的背面内页)或者用可记录序 列内核苷酸同一性的任何其它格式来表示。
[00232]在本专利说明书的其它地方说明的各种序列比较程序都可被特别 地考虑用于本发明的这个方面。蛋白和/或核酸序列的同源性可以应用本领域已知 的各种序列比较算法和程序来评估。这样的算法和程序包括,但不限于, TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman,Proc. Natl.Acad.Sci.USA 85(8):2444-2448,1988;Altschul等,J.Mol.Biol.215(3): 403-410,1990;Thompson等,Nucleic Acids Res.22(2):4673-4680,1994;Higgins 等,Methods Enzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410, 1990;Altschul等,Nature Genetics 3:266-272,1993)。
[00233]同源性或者同一性常常是应用序列分析软件来测定(如地址为 1710University Avenue,Madison,WI 53705的威斯康星大学生物技术中心遗传学 计算机组(Genetics Computer Group)的序列分析软件包)。这样的软件通过对各 种缺失、替代和其它的修饰赋予表示同源性的数值来匹配相似的序列。联系两个 或者多个核酸或者多肽序列的术语“同源性”和“同一性”,是指当两个或更多个序列 或子序列在某一比较窗口(comparison window)或者指定区域内被比较和比对以 确定最大一致性时,这些序列是相同的,或者具有特定比例的相同氨基酸残基或 核苷酸,最大一致性可以应用各种序列比较算法或者通过人工比对和目测检查法 来测定。
[00234]对于序列比较,通常是一段序列作为参考序列,受测序列与之进 行比较。当使用序列比较算法时,将受测序列和参考序列输入到计算机中,指定 子序列坐标,如果必要,指定序列算法程序参数。可以使用默认的程序参数,或 者可以指定别的参数。以程序参数为基础,然后通过序列比较算法计算出受测序 列相对于参照序列的百分序列一致性。
[00235]正如在此所使用的,“比较窗口(comparison window)”包括指代 具有选自大约20到600、通常是大约50到大约200、更通常是大约100到大约150 的任一数目的连续位置的片段,其中序列与具有同样数目的连续位置的参考序列 在优化比对之后,两个序列可以进行比较。用于进行比较的序列比较方法在本领 域已知。用于比较的序列的优化比对可以通过例如以下的手段实现:Smith和 Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch, J.Mol.Biol.48:443,1970的同源性联配算法,person和Lipman,Proc.Nat′l.Acad.Sci. USA 85:2444,1988的查找相似的方法,这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Dr.,Madison,WI),手工比对和目测检查法。除了 BLAST程序(生物信息国家中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外,用于确定同源性或者一致性的其它的算法包括,例如,ALIGN、 AMAS(多重联配序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋 白多重序列联配(Protein Multiple Sequence Alignment))、ASSET(联配片段统计 评估工具(Aligned Segment Statistical Evaluation Tool))、BANDS、BESTSCOR、 BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocks IMProved Searcher)、FASTA、Intervals & Points、BMB、 CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、WCONSENSUS、 Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸联配工具 (Forced Nucleotide Alignment Tool))、Framealign、Framesearch、DYNAMIC、 FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(GlobalAlignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏的序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列联配(Local Sequence Alignment))、LCP(局 部内容程序(Local Content Program))、MACAW(多重联配构建和分析工作台 (Multiple Alignment Construction & Analysis Workbench))、MAP(多重联配程序 (Multiple Alignment Program))、MBLKP、MBLKN、PIMA(模式诱导的多重序 列联配(Pattern-Induced Multi-sequence Alignment))、SAGA(通过遗传算法的序 列联配(Sequence Alignment by Genetic Algorithm))和WHAT-IF。这样的联配程 序也可以用于筛查基因组数据库,确定具有大体上相同的序列的多聚核苷酸序列。 大量的基因组数据库是可利用的,例如,作为人类基因组测序工程的构成部分的 人类基因组的实质部分可以被利用(J.Roach, http://weber.u.Washington.edu/~roach/human_genome_progress 2.html)(Gibbs, 1995)。几个基因组序列已经测定,如,生殖器支原体(M.genitalium)(Fraser等, 1995)、甲烷球菌(M.jannaschii)(Bult等,1996)、流行性感冒杆菌(H.influenzae) (Fleischmann等,1995)、大肠杆菌(E.coli)(Blattner等,1997)、和酵母(S. cerevisiae)(Mewes等,1997),和黑腹果蝇(D.melanogaster)(Adams等,2000)。 在模式生物的基因组序列的测序上已经取得了很大的进展,如鼠,线虫(C.elegans) 和拟南芥(Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的数据 库由不同组织维护,可以通过互联网登录。
[00236]可用的算法的一个实例是BLAST和BLAST 2.0算法,分别在 Altschul等人,Nuc.Acids Res.25:3389-3402,1977和Altschul等人,J.Mol.Biol. 215:403-410,1990中描述。用于实施BLAST分析的软件可以通过美国国家生物技 术信息中心公开获得。这一算法包括首先通过鉴别待询序列(query sequence)中 长度为W的短的字串来确定高分序列对(high scoring sequence pairs,HSPs),所 述高分序列对在与数据库序列中同样长度的字串联配时,匹配或者满足某个正值 的阈值T。T是指作为邻近字串(neighborhood word)的分数阈值(Altschul等, 如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。 所述字串沿着每一个序列向两个方向延伸,只要累积的联配分数在增加。对于核 苷酸序列,使用参数M(一对匹配的残基的奖励分数;总是大于0)来计算累积分 数;对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在 各个方向上的延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于 一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延 伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速 率。BLASTN程序(对于核苷酸序列)默认的是:字串长度(W)为11,期望值 (E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序默 认:字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和 Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)联配(B)为50,期望值(E) 为10,M=5,N=-4,对两条链进行比较。
[00237]BLAST算法也进行两个序列之间的相似性的统计学分析(参见, 例如,Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873)。由BLAST 算法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其 表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在受测核酸 和参考核酸的比较中,如果最小合计概率小于大约0.2,更在一个方面小于0.01, 最优选地在一个方面小于大约0.001,就认为该核酸与参考序列相似。
[00238]一方面,应用基本局域联配搜索工具(“BLAST”)来评价蛋白和 核酸序列同源性。例如,五个特定的BLAST程序可以用来进行以下的任务:
(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进 行比较;
(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较;
(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念 上的翻译产物与蛋白序列数据库进行比较;
(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅 读框架(两条链)的翻译结果进行比较;
(5)TBLASTN把核苷酸待询序列的六个框架的翻译结果与核苷酸 序列数据库的六个框架的翻译结果进行比较。
[00239]BLAST程序通过确定相似片段来确定同源性序列,所述相似片段 在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对 (high-scoring segment pairs)”,该受测序列在一个方面从蛋白或者核酸序列数据 库得到。高分片段对在一个方面利用记分矩阵来鉴定(即,联配),很多的记分矩 阵在本领域是已知的。在一个方面,应用的记分矩阵为BLOSUM62矩阵(Gonnet 等,Science 256:1443-1445,1992;Henikoff和Henikoff,Proteins 17:49-61,1993)。 较少地在一个方面,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和 Dayhoff,eds.,1978,Matrices for Detecting Distance Relationships:Atlas of protein Sequence and Structure,Washingion:National Biomedical Research Foundation)。 BLAST程序可通过美国国立医学图书馆取得。
[00240]上述算法所使用的参数可根据被研究的序列长度和同源性程度来 修改。在一些方面,在没有用户指令时所使用的参数可以是该算法所使用的默认 参数。
计算机系统和计算机程序产品
[00241]为了确定和鉴定序列一致性、结构同源性、基元和上类似物(the like in silico),本发明的核酸或多肽序列可以在能够由计算机阅读和访问的任何介 质上存储、记录和操作。
[00242]因此,本发明提供记录或存储有本发明的核酸和多肽序列的计算 机、计算机系统、计算机可读介质、计算机程序产品以及类似物。正如在此所用, 词语“记录”和“存储”是指将信息存储到计算机介质中的过程。技术人员很容易地采 用任何已知的方法将信息记录到计算机可读介质上,从而产生包括发明的一个或 者多个核酸和/或多肽序列的产品。
[00243]本发明的多肽包括本发明的多肽序列,例如本发明的示范性序列 和与其实质上相同的序列,和任何前述序列的片段。实质上相同的或同源的多肽 序列是指与本发明的示范性序列,具有至少50%、51%、52%、53%、54%、55%、 56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、 69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更多或完全的(100%)序列同一性的多肽序列。
[00244]同源性可使用在此所述的任何计算机程序和参数来测定,包括 FASTA 3.0t78版,使用默认参数或任何修改的参数。同源序列可以使用任何在此 描述的程序或者可以由测序错误的校正获得。多肽片段含有本发明多肽的至少大 约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、 400、450、500或更多的连续氨基酸。要理解的是,如在本发明的氨基酸序列中所 示的多肽编码可以以传统的单字符格式或三字母格式表示(见Stryer,Lubert. Biochemistry.3rd Ed.,W.H Freeman & Co.,New York的背面内页)或以可以将多肽 序列同一性关联起来的任何其它格式表示。
[00245]本发明的核酸或多肽序列可在能被计算机阅读和存取的任何介质 上存储、记录和操作。如在此所使用的,词语“记录”和“存储”是指在计算机介质上 储存信息的过程。技术人员可很容易地采用任何以前已知的方法来在计算机可读 介质上记录信息以产生一些产品,其含有本发明的一个或更多个核酸序列,本发 明的一个或更多个多肽序列。本发明的另一个方面是计算机可读介质,上面已经 记录了本发明的核酸序列的至少2、5、10、15或20或更多个核酸序列。
[00246]本发明的另一个方面是计算机可读介质,其上已经记录了本发明 的一个或更多个核酸序列。本发明的另一个方面是计算机可读介质,其上已经记 录了本发明的一个或更多个多肽序列。本发明的另一个方面是计算机可读介质, 其上已经记录了如上所示的至少2、5、10、15或20或更多个序列。
[00247]计算机可读介质包括磁性可读介质、光学可读介质、电子可读介 质和磁性/光学介质。例如,计算机可读介质可以是硬盘软盘、磁带、CD-ROM、 数字化视频光盘(DVD)、随机存储器(RAM),或者只读存储器(ROM),同时 还有本领域技术人员所知的其它类型的其它介质。
[00248]本发明的方面包括存储和操作在此描述的序列信息的系统(如, 基于因特网的系统),特别是计算机系统。计算机系统100的一个例子在图1的框 图中说明。正如在此所使用的,“计算机系统”是指其硬件部分、软件部分以及用于 分析本发明核酸序列的核苷酸序列或本发明的多肽序列的数据存储部分。计算机 系统100通常包括用于处理、访问和操作序列数据的处理器。该处理器105可以 是任何已知类型的中央处理单元,例如Intel公司的奔腾III,或者来自Sun、 Motorola、Compaq、AMD或者IBM的类似处理器。
[00249]通常地,计算机系统100是一种通用系统,包括处理器105和一 个或者多个用于存储数据的内部数据存储部分110,以及一个或者多个用于检索存 储在数据存储部分中的数据的数据检索装置。技术人员可以很容易地意识到目前 可用的计算机系统的任何一个都是合适的。
[00250]在一个特定的方面,计算机系统100包括处理器105,处理器105 连接于数据传送总线,该总线连接于一个主存储器115(在一个方面,按RAM来 实施),计算机系统100还包括一个或者多个内部数据存储装置110,如硬盘驱动 器和/或具有数据记录作用的其它的计算机可读介质。在一些方面,计算机系统100 可以进一步包括一个或者多个用于读取内部数据存储装置110上储存的数据的数 据检索装置118。
[00251]数据检索装置118可以是例如,软盘驱动器、光盘驱动器、磁带 驱动器或者可以(如,通过因特网)连接至远端的数据存储系统的调制解调器等。 在一些方面,内部数据存储装置110是可移动的计算机可读介质,例如含有控制 逻辑和/或在其中记录有数据的软盘、光盘、磁带等。有利的是,计算机系统100 可以包括或运行适当的软件程序,从插入到数据检索装置中的数据存储部分读取 控制逻辑和/或数据。
[00252]计算机系统100包括用于给计算机使用者显示输出结果的显示器 120。也应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机 系统125a-c相联,提供集中化的计算机系统100访问。
[00253]用于访问和处理本发明核酸序列的核苷酸序列,或本发明的多肽 序列的软件(如搜索工具、比较工具和建模工具(modeling tools)等)可在执行 过程中驻留在主存储器115中。
[00254]在一些方面,计算机系统100可以进一步包含用于比较存储在计 算机可读介质上的本发明核酸序列,或本发明多肽序列与存储在计算机可读介质 上的参考核苷酸或多肽序列的序列比较算法。“序列比较算法”是指一个或多个程 序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存 装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计 算机可读介质上的本发明核酸序列的核苷酸序列,或本发明多肽序列与储存在计 算机可读介质上的参考序列比较,以鉴定同源性或结构模体。
[00255]图2是说明了处理过程200的一个方面的流程图,这个处理过程 是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序 列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100 的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。
[00256]过程200开始于起始状态201,然后移至状态202,其中待比较的 新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的 存储器,包括RAM或者内部存储设备。
[00257]过程200然后移至状态204,其中序列数据库被打开以用于分析和 比较。然后,过程200移至状态206,其中存储在数据库的第一个序列读取到计算 机的存储器中。然后在状态210中进行比较,确定第一序列是否与第二序列相同。 重要的是,注意到这一步骤并不限于在所述新序列和数据库中的第一序列间进行 准确的比较。本领域技术人员熟知比较两个核苷酸或者蛋白序列的方法,尽管它 们并不完全相同。例如,为了提高两个待测序列间的同源性水平,可以在一个序 列中引入空位。在比较过程中控制是否往序列中引入空位或者其它特征的参数一 般由计算机系统的使用者输入。
[00258]一旦在状态210下进行两个序列的比较,在决定状态210下作出 两个序列是否相同的决定。当然,术语“相同”并不限于绝对相同的序列。在过程 200中,在使用者输入的同源性参数范围内的序列将标记为“相同”。
[00259]如果决定了两个序列相同,过程200移至状态214,其中给使用者 显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名 称的序列满足输入的同源性限制。一旦被存储的序列的名称显示给使用者,过程 200移至决定状态218,其中确定在数据库中是否存在更多的序列。如果在数据库 中没有更多的序列存在,那么过程200终止于结束状态220。然而,如果在数据库 中存在更多的序列,那么过程200移至状态224,其中指示器移至数据库的下一个 序列以便可以与所述的新序列比较。以这种方式,所述的新序列与数据库中的每 一个序列进行联配和比较。
[00260]应当注意到,如果已经在决定状态212确定了序列并不具有同源 性,那么为了确定在数据库中是否有其它的可用于比较的序列,过程200将立即 移至决定状态218。
[00261]因此,本发明的一个方面是计算机系统,其含有处理器、其上储 存了本发明核酸序列或本发明多肽序列的数据存储设备、其上可检索地储存了参 考核苷酸序列或多肽序列的数据存储设备,所述的参考核苷酸序列或多肽序列将 与本发明的核酸序列或本发明的多肽序列进行比较,以及执行比较的序列比较器。 序列比较器可指示被比较序列之间的同源性水平,或在上述的本发明核酸序列或 本发明多肽序列中所示的多肽序列中鉴定结构模体,或可以在与这些核酸代码和 多肽代码比较的序列中鉴定结构模体。在一些方面,数据存储设备上面可以存储 有本发明核酸序列中的至少2、5、10、15、20、25、30或40或更多个序列,或 本发明的多肽序列。
[00262]本发明的另一个方面是用于确定本发明核酸序列和本发明多肽序 列与参考核苷酸序列之间的同源性水平的方法。该方法包括通过使用可测定同源 性水平的计算机程序读取核酸代码或多肽代码以及参考核苷酸或多肽序列,并用 计算机程序确定核酸代码或多肽代码与参考核苷酸或多肽序列之间的同源性。计 算机程序可以是任意的能够测定同源性水平的计算机程序,包括在此特别列举的 那些(例如,BLAST2N,使用默认参数,或任何修改的参数)。该方法可使用上述 的计算机系统执行。本方法也可这样来执行:通过使用计算机程序读取上述本发 明核酸序列或本发明多肽序列中的至少2、5、10、15、20、25、30或40或更多 个序列,并测定核酸代码或多肽代码和参考核苷酸序列或多肽序列之间的同源性。
[00263]图3是说明在计算机中确定两个序列是否具有同源性的过程250 的一个方面的流程图。过程250开始于起始状态252,然后移至状态254,其中待 比较的第一序列被存储于存储器中。待比较的第二序列然后在状态256被存储于 存储器中。过程250然后移至状态260,其中读取第一序列的第一个字符,然后到 状态262,其中读取第二序列的第一个字符。应当理解,如果序列是核苷酸序列, 那么所述字符一般将是A、T、C、G或者U。如果序列是蛋白质序列,那么在一 个方面可以是单字母的氨基酸代码,以便第一序列和第二序列可以很容易地进行 比较。
[00264]然后在决定状态264作出是否两个字符是否相同的决定。如果它 们是相同的,那么过程250移至状态268,其中读取第一序列和第二序列的下一个 字符。然后确定所述的下一字符是否相同。如果相同,那么过程250继续这一循 环直到两个字符是不同的。如果确定了接下来的两个字符并不相同,过程250移 至决定状态274,确定在两个序列中是否有任何更多的字符要读取。
[00265]如果没有任何更多的字符被读取,那么过程250移至状态276,其 中第一序列和第二序列的同源性水平显示给使用者。通过计算序列间相同字符占 第一序列中字符总数的比例来确定同源性水平。这样,如果第一个100核苷酸序 列的每一个字符都与第二序列的每一个字符联配,那么同源性水平将是100%。
[00266]可选择的是,计算机程序可以是将本发明中所示核酸序列的核苷 酸序列与一个或更多个参考核苷酸序列进行比较的计算机程序,以便确定本发明 的核酸代码是否在一个或更多个位置上不同于参考核酸序列。可任意选择的是, 关于参考多核苷酸序列或本发明核酸序列,这样的程序可记录插入、删除或替代 的核苷酸的长度和同一性。在一个方面,计算机程序可以确定本发明核酸序列是 否含有参考核苷酸序列的单核苷酸多态性(SNP)。
[00267]因此,本发明的另一个方面是确定本发明核酸序列是否与参考核 苷酸序列有一个或更多个核苷酸的差异,包括步骤如下:通过使用可鉴定核酸序 列间差异的计算机程序读取核酸代码和参考核苷酸序列,并使用计算机程序鉴定 核酸代码和参考核苷酸序列之间的差异。在一些方面,计算机程序可鉴定单核苷 酸多态性。该方法可通过上述的计算机系统来实施,方法在图3中图示。该方法 的执行也可通过使用计算机程序读取本发明核酸序列的至少2、5、10、15、20、 25、30或40或更多个核酸序列以及参考核苷酸序列,并使用计算机程序鉴定核酸 代码和参考核苷酸序列之间的差异来进行。
[00268]在另一个方面,采用了计算机的系统可进一步包含识别器,可鉴 别本发明的核酸序列或本发明的多肽序列内的特征。
[00269]“识别器(identifier)”是指一个或多个程序,其可识别本发明的核 酸序列或本发明的多肽序列内的某些特征。在一个方面,识别器可以含有可鉴别 本发明核酸序列中的开放阅读框架的程序。
[00270]图4是说明用于检测在序列中某个特征的存在的识别器处理过程 300的一方面的流程图。过程300开始于起始状态302,随后移至状态304,其中 待检测特征的第一序列被存储于计算机系统100的存储器115中。过程300然后 移至状态306,其中序列特征的数据库被打开。这样的数据库将包括各个特征的属 性及其名称的列表。例如,特征的名称可以是“起始密码子”,该特征属性将会是 “ATG”。另一个例子是特征名称“TAATAA盒”,该特征的属性将是“TAATAA”。这 样的数据库的例子由威斯康星大学遗传学计算机组制作。可选择地,所述特征可 以是结构性多肽模体,如α螺旋、β折叠,或者功能性多肽模体,如酶的活性区域 (CDs)或活性位点、螺旋-转-螺旋模体,或者本领域技术人员所知的其它模体。
[00271]一旦特征的数据库在状态306下打开,过程300移至状态308,其 中从数据库读取第一特征。然后在状态310进行第一特征的属性和第一序列的比 较。然后在决定状态316中作出决定是否在第一序列中发现所述特征的属性。如 果发现有该属性,那么过程300移至状态318,其中所发现的特征的名称被显示给 使用者。
[00272]过程300然后移至决定状态320,其中决定是否在数据库中存在更 多的特征。如果不存在更多的特征,那么过程300终止于结束状态324。然而,如 果在数据库中存在更多的特征,那么过程300在状态326中读取下一个序列特征, 并且回至状态310,在其中进行所述下一个特征的属性与第一序列比较。如果在决 定状态316中所述特征的属性没有在所述第一序列中发现,那么为了决定在数据 库中是否存在更多特征,过程300直接移至决定状态320。
[00273]因此,本发明的另一个方面是鉴别本发明核酸序列,或本发明多 肽序列内的特征的方法,包括通过使用可识别其中特征的计算机程序读取核酸代 码或多肽代码,并使用计算机程序鉴别核酸代码内的特征。在一个方面,计算机 程序包括可鉴别开放阅读框的计算机程序。本方法的实施可以通过使用计算机程 序读取本发明核酸序列,或本发明多肽序列中的单个序列或至少2、5、10、15、 20、25、30或40个序列,并使用计算机程序鉴别在核酸代码或多肽代码内的特征。
[00274]本发明的核酸序列,或本发明的多肽序列可在各种数据处理程序 中以多种格式被储存和进行操作。例如,本发明的核酸序列,或本发明的多肽序 列,可以以文本形式储存在字处理文件如Microsoft WORDTM或WORDPERFECTTM 中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2TM、 SYBASETM或ORACLETM中。另外,许多计算机程序和数据库都可用作序列比较 算法、识别器、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多 肽序列要与本发明的核酸序列,或本发明的多肽序列进行比较。下列的列表的目 的不是要限制本发明,而是提供可用于本发明的核酸序列,或本发明的多肽序列 的程序和数据库的指南。
[00275]可以被应用于的程序和数据库包括,但不限于:MacPattern (EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(Molecular Applications Group)、Look(Molecular Applications Group)、MacLook(Molecular Applications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul 等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci. USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、 Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、 Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、 CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi (Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.),Homology (Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab (Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular Simulations Inc.)、MDL可用化学制品目录数据库(Available Chemicals Directory database)、 MDL药品数据报告数据库(Drug Data Report data base)、综合医药化学数据库 (Comprehensive Medicinal Chemistry database)、德文特的世界药物索引数据库 (World Drug Index database)、BioByteMasterFile数据库、Genbank数据库和 Genseqn数据库。在本公开内容的技术领域内的技术人员是熟悉很多其它的程序和 数据库的。
[00276]应用以上的程序可能检测到的模体包括编码亮氨酸拉链的序列、 螺旋-转角-螺旋模体、糖基化作用位点、泛素化位点、α螺旋、β折叠、编码引导 被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序列如同源框、酸性伸 展(acidic stretches)、酶的活性位点(催化区域(CDs))、底物结合位点以及酶切 割位点。
核酸的杂交
[00277]本发明提供了可在严紧条件下与本发明的示例性序列(例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、 SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、 SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、 SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、 SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、 SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、 SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、 SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、 SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、 SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、 SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、 SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO: 157、SEQ ID NO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、 SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、 SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、 SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、 SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、 SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、 SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、 SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、 SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、 SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、 SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO-369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、 SEQ ID NO:377、SEQ ID NO:379、SEQ ID NO:381、SEQ ID NO:383、SEQ ID NO:385、SEQ ID NO:387、SEQ ID NO:389、SEQ ID NO:391、SEQ ID NO:393、 SEQ ID NO:395、SEQ ID NO:397、SEQ ID NO:399、SEQ ID NO:401、SEQ ID NO:403、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:409、SEQ ID NO:411、SEQ ID NO:413、SEQ ID NO:415、SEQ ID NO:417、SEQ ID NO:419、SEQ ID NO:421、 SEQ ID NO:423、SEQ ID NO:425、SEQ ID NO:427、SEQ ID NO:429、SEQ ID NO:431、SEQ ID NO:433、SEQ ID NO:435、SEQ ID NO:437、SEQ ID NO:439、 SEQ ID NO:441、SEQ ID NO:443、SEQ ID NO:445、SEQ ID NO:447、SEQ ID NO:449、SEQ ID NO:451、SEQ ID NO:453、SEQ ID NO:455、SEQ ID NO:457、 SEQ ID NO:459、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:465、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:471、SEQ ID NO:473、SEQ ID NO:475、 SEQ ID NO:477、SEQ ID NO:479、SEQ ID NO:481、SEQ ID NO:483、SEQ ID NO:485、SEQ ID NO:487、SEQ ID NO:489、SEQ ID NO:491、SEQ ID NO:493、 SEQ ID NO:495、SEQ ID NO:497、SEQ ID NO:499、SEQ ID NO:501、SEQ ID NO:503、SEQ ID NO:505、SEQ ID NO:507、SEQ ID NO:509、SEQ ID NO:511、SEQ ID NO:513、SEQ ID NO:515、SEQ ID NO:517)杂交的分离的、合成的、或重组的 核酸。所述严紧条件可以是高的严紧条件、中等严紧条件和/或低的严紧条件,包 括在此描述的高的和降低的严紧条件。在一方面,正是洗脱条件的严紧性提出了 确定一段核酸是否在本发明范围内的条件,如下所述。
[00278]在可选择的方面,本发明的核酸根据它们在严紧条件下杂交的能 力来定义,它们可以在大约5个残基到本发明的核酸全长之间;例如它们的长度 可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000或者更多的残基。也包括比全长核酸短的核酸。这些 核酸可以作为如,杂交探针、标记探针、PCR寡聚核苷酸探针、iRNA(单链或者 双链)、编码抗体结合肽(抗原决定部位)的序列或反义序列、模体、活性位点(催 化区域(CDs))以及类似物。
[00279]一方面,本发明的核酸由它们在高的严紧条件下杂交的能力来定 义,高严紧条件包括在大约37℃到42℃大约50%的甲酰胺。一方面,本发明的核 酸由它们在降低的严紧条件下杂交的能力来定义,低严紧条件包括在大约30℃到 35℃大约35%到25%的甲酰胺。
[00280]作为选择,本发明的核酸由它们在高的严紧条件下杂交的能力定 义,高严紧条件包括42℃,50%的甲酰胺、5×SSPE、0.3%SDS和重复序列封闭核 酸,如cot-1或者鲑鱼精DNA(如,200n/毫升剪切的和变性的鲑鱼精DNA)。一 方面,本发明的核酸由它们在降低的严紧条件下杂交的能力定义,该低严紧条件 包括在降低的温度35℃,35%的甲酰胺。
[00281]在核酸杂交反应中,用来达到特定的严紧水平的条件可根据被杂 交的核酸的特性来变化。例如,核酸的杂交区域的长度、互补性程度、核酸序列 组成(例如,GC与AT含量)和核酸类型(例如,RNA或DNA)可在选择杂交 条件时被加以考虑。其它的考虑是其中一种核酸是否被固定在例如滤纸上。
[00282]杂交可以在低严紧、中等严紧、高严紧条件下进行。作为核酸杂 交的一个例子,含有固定的变性核酸的聚合物膜首先在45℃下在含有0.9M NaCl、 50mMNaH2PO4,pH 7.0、5.0mM Na2EDTA、0.5%SDS、10×Denhardt′s试剂和0.5 毫克/毫升的聚核糖腺苷酸的溶液中预杂交30分钟。然后向该溶液中加入到大约 2×107cpm(放射性比度为4-9×108cpm/ug)的32P末端标记的寡聚核苷酸探针。在 温育12-16个小时以后,该膜在室温下在含有0.5%SDS的1×SET(150mMNaCl、 20mM Tris盐酸,pH 7.8、1mM Na2EDTA)的溶液中洗涤30分钟,随后,用新鲜 的1×SET在寡聚核苷酸探针的Tm-10℃洗涤30分钟。该膜随后暴露于放射自显影 的胶片以检测杂交信号。
[00283]所有前面的杂交均可被考虑在高严紧条件下进行。
[00284]杂交后,可以洗涤滤膜以去除任何非特异结合的可检测探针。用 于洗涤滤膜的严紧度也可以依据杂交的核酸的性质、杂交核酸的长度、互补的程 度、核苷酸序列的组成(如GC和AT含量)以及核酸类型(如,RNA,DNA)而 变化。越来越高的严紧条件洗涤的例子如下:2×SSC,0.1%SDS在室温下进行15 分钟(低严紧度);0.1×SSC,0.5%SDS在室温下进行30分钟到1个小时(中等严 紧度);0.1×SSC,0.5%SDS在杂交温度与68℃之间进行15到30分钟(高严紧度); 以及0.15M的NaCl在72℃进行15分钟(很高的严紧度)。最后的低严紧度洗涤 可以在0.1×SSC在室温进行。以上的例子仅仅是列出一系列可以用于洗膜的条件。 本领域技术人员知道,对于不同严紧度的洗涤有各种配方。一些其它的实例如下 所示。
[00285]已经与所述探针杂交的核酸可以通过放射自显影或者其它传统的 技术鉴定。
[00286]以上的程序可以被修改,以鉴定与所述探针序列的同源性水平降 低的核酸。例如,为了得到与可检测探针的同源性降低的核酸,可以应用较低严 紧度的条件。例如,在含有大约1M的Na+浓度的杂交缓冲液中杂交温度可以以5℃ 的幅度从68℃降到42℃。杂交以后,滤膜可以用2×SSC、0.5%SDS在杂交温度下 洗涤。认为这些条件中超过50℃是“中等”条件,而低于50℃的条件是“低的”条件。 “中等”杂交条件的一个具体例子是当以上的杂交在55℃进行。“低严紧”杂交条件 的一个具体例子是当以上的杂交在45℃进行。
[00287]作为选择,杂交可以在缓冲液中进行,如在含有甲酰胺的6×SSC 中在42℃的温度进行。在这种情况下,在杂交缓冲液中的甲酰胺的浓度可以以5 %的幅度从50%到0%,以鉴定与探针的同源性水平降低的克隆。杂交后,滤膜 可以用6×SSC、0.5%SDS在50℃洗涤。认为这些条件中超过25%的甲酰胺是“中 等”条件,而低于25%的甲酰胺的条件是“低的”条件。“中等”杂交条件的一个具体 例子是当以上的杂交在甲酰胺为30%时进行。“低严紧”杂交条件的一个具体例子 是当以上的杂交在甲酰胺为10%时进行。
[00288]然而,杂交形式的选择并不是关键的,而是洗脱条件的严紧度提 出了确定一段核酸是否属于本发明范围的条件。用于鉴定核酸是否属于本发明范 围的洗脱条件包括,例如在pH 7的大约0.02摩尔的盐浓度,温度至少是大约50℃ 或者大约55℃到大约60℃;或者在72℃,大约0.15M NaCI的盐浓度,大约15分 钟;或者大约0.2×SSC的盐浓度,温度至少为大约50℃或者大约55℃到大约60℃, 进行大约15到20分钟;或者,杂交复合物在含有0.1%SDS的大约2×SSC的盐溶 液中室温15分钟洗脱两次,然后用含有0.1%SDS的0.1×SSC在68℃、15分钟洗 脱两次;或者等效条件,参见Sambrook、Tijssen和Ausubel所说明的SSC缓冲液 和等效条件。
[00289]这些方法可用来分离本发明的核酸。例如,前述的方法可用来分 离核酸,其具有与选自本发明序列中的一个序列,或含有其至少大约10、15、20、 25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段和 与其互补的序列中的核酸序列具有至少大约97%、至少95%、至少90%、至少85%、 至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%同 源性的序列。可使用比对算法(alignment algorithm)来测定同源性。例如,同源 的多核苷酸所具有的编码序列可以是在此所述的一种编码序列的天然发生的等位 基因变异体。当与本发明核酸比较时,这样的等位基因变异体可以具有一个或多 个核苷酸的取代、删除或添加。
[00290]另外,上述的程序可以被用来分离核酸,所述核酸编码的多肽与 本发明多肽,或含有其5、10、15、20、25、30、35、40、50、75、100或150个 连续氨基酸的片段,具有至少大约99%、95%、至少90%、至少85%、至少80%、 至少75%、至少70%、至少65%、至少60%、至少55%或至少50%的同源性,所 述同源性可以使用序列比较算法(例如,如FASTA版本3.0t78算法,使用默认参 数)来测定。
寡核苷酸探针和使用它们的方法
[00291]本发明也提供了核酸探针,其可以被用来例如鉴定编码具有葡聚 糖酶活性的多肽或其片段的核酸或者用于鉴定葡聚糖酶基因。一方面,所述探针 包括本发明的核酸的至少10个连续的碱基。作为选择,本发明的探针可以是本发 明的核酸阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、 100、110、120、130、150或者大约10到50、大约20到60、大约30到70个连 续的碱基。所述探针通过结合和/或杂交来鉴定核酸。所述探针可以用于本发明的 阵列,参见以下的讨论,包括,例如毛细管阵列。本发明的探针也可以用于分离 其它的核酸或者多肽。
[00292]分离得到的本发明核酸、与其互补的序列、或含有本发明序列中 的一个序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、 400或500个连续碱基的片段、或与其互补的序列,也可用作探针以确定一种生物 学样品如土样中是否含有具有本发明核酸序列的生物体,或确定获得核酸的生物 体。在这样的程序中,很有可能包藏有可以分离出所述核酸的生物体的生物样品 被获得,并从所述样品中得到核酸。在允许探针特异地与所述样品中存在的任何 互补序列杂交的条件下,让所述核酸与所述探针接触。
[00293]在必要的情况下,为了确定允许探针特异地与互补序列杂交的条 件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不 含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓 冲液中甲酰胺的浓度或者杂交温度,可以进行被变化以确定允许所述探针特异地 与互补的核酸杂交的条件。
[00294]如果样品含有可以从其中分离出所述核酸的生物体,那么探针的 特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探针来检测, 所述的可检测试剂例如放射性同位素、荧光染料或者能够催化形成可检测产物的 酶。
[00295]使用标记探针来检测在样品中存在的互补核酸的很多方法对于本 领域技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、菌落杂交 方法以及点杂交。每种方法的实验方案都已经由Ausubel等人,Current Protocols in Molecular Biology,John Wiley 503 Sons,Inc.(1997)和Sambrook等人,Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold Spring Harbor Laboratory Press(1989) 提供。
[00296]作为选择,可以在一个扩增反应中使用多于一种探针(其中的至 少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含 有包括本发明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。一方面, 所述探针包括寡聚核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实 验方案见前面Ausubel和Sambrook的如上的所述。可选择地是,扩增包括连接酶 链式反应、3SR或链置换反应(strand displacement reaction)。(参见,Barany,F.,"The Ligase Chain Reaction in a PCR World",PCR Methods and Applications 1:5-16,1991; E.Fahy等人,"Self-sustained Sequence Replication(3SR):An Isothermal Transcription-based Amplification System Alternative to PCR",PCR Methods and Applications 1:25-33,1991和Walker G.T.等人,"Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique",Nucleic Acid Research 20: 1691-1696,1992)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所 述扩增反应,检测得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳, 并用嵌入剂如溴化乙啶染胶来进行检测。可选择地,一种或者多种探针可以用放 射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物 的存在。
[00297]源自位于本发明序列的末端附近的序列的探针也可以在染色体移 步(chromosome walking)程序中被应用,以鉴定含有位于本发明序列附近的基因 组序列的克隆。这样的方法允许从宿主生物体中分离出编码其他蛋白的基因。
[00298]分离得到的本发明核酸、与其互补的序列、或含有本发明序列中 的一个序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、 400或500个连续碱基的片段、或与其互补的序列,可用作探针以鉴定和分离相关 的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基 因组DNA,但是这些生物体可以不是本发明的核酸起初被分离出来的那些生物体。 例如,其它的生物体可以是相关的生物体。在这样的程序中,核酸样品与所述探 针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体 的核酸的杂交采用以上描述的任何方法来检测。
[00299]通过变化被用来鉴定核酸例如与可检测探针杂交的cDNA或者基 因组DNA的杂交条件的严紧度,可以鉴定和分离与探针具有不同水平的同源性的 核酸。可以通过在低于探针的解链温度下改变温度进行杂交而使严紧度变化。解 链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探 针杂交的温度。非常严紧的条件被选择为与特定的探针的Tm值相等或比其低大约 5℃。探针的解链温度可以通过应用以下的经验公式计算:
[00300]对于在14到70个核苷酸长度的探针,应用此公式计算解链温度: Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。
[00301]如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以 下的公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰 胺)-(600/N),其中的N是探针的长度。
[00302]预杂交可以在6×SSC、5×Denhardt′s试剂、0.5% SDS、100μg变性 的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5% SDS、100μg变性的鲑 鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s溶液的配方列于Sambrook 等,见上文。
[00303]通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂 交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂 交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA 或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交的过程可以是在 低于Tm温度15-25℃进行。对于较短的探针,如寡聚核苷酸探针,杂交的过程可 以是在低于Tm温度5-10℃下进行。一般,在6×SSC溶液中的杂交过程在大约68℃ 进行。通常,在含有50%甲酰胺的溶液中的杂交的过程,杂交在大约42℃进行。
抑制酶(葡聚糖酶)的表达
[00304]本发明提供了与本发明的核酸——例如编码内切葡聚糖酶、甘露 聚糖酶、或木聚糖酶的核酸——互补的核酸(例如,本发明的核酸的反义序列)。 反义序列能够抑制葡聚糖酶,内切葡聚糖酶、甘露聚糖酶、或木聚糖酶编码基因 的转运、剪接或转录。通过以基因组DNA或信使RNA作为靶标可实现抑制作用。 靶核酸的转录或功能可通过例如杂交和/或剪切而被抑制。本发明提供的一组特别 有用的抑制剂包括能够结合葡聚糖酶、甘露聚糖酶、或木聚糖酶基因或信息的寡 核苷酸,在两种情况下都可阻止或抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶的产 生或功能。这种联合可以通过序列特异性杂交实现。另一类有用的抑制剂包括可 引起葡聚糖酶、甘露聚糖酶、或木聚糖酶信息失活或剪切的寡核苷酸。该寡核苷 酸可以具有导致这样的剪切的酶活性,如核酶(ribozyme)。寡核苷酸可被化学修 饰或与能够切割互补核酸的酶或组合物偶联。可以对由很多不同的寡聚核苷酸组 成的库进行筛选,以寻找到那些具有所需活性的寡聚核苷酸。因此,本发明提供 了各种在核酸和/或蛋白水平抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶表达的组合 物,例如,反义、iRNA和含有本发明的葡聚糖酶、甘露聚糖酶、或木聚糖酶序列 的核酶和本发明的抗木聚糖酶抗体。
[00305]抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶的表达有大量的工业应 用。例如,抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶表达可延缓或防止酸败。当 多糖例如结构性多糖被酶降解时可发生酸败。这可引起水果和蔬菜的变质或腐败。 在一个方面,应用可抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶的表达和/或活性的 本发明的组合物,例如抗体、反义寡核苷酸、核酶和RNAi,可以延缓或防止酸败。 因此,在一个方面,本发明提供了一些方法和组合物,包括在植物或植物产品(如 谷物、谷粒、水果、种子、根、叶等)上使用本发明的抗体、反义寡核苷酸、核 酶和RNAi来延缓或防止酸败。这些组合物也可被植物(例如,转基因植物)或其 他生物体(如,用本发明的葡聚糖酶、甘露聚糖酶、或木聚糖酶基因转化的细菌 或其他微生物)表达。
[00306]本发明的抑制葡聚糖酶、甘露聚糖酶或木聚糖酶表达的组合物(例 如,反义、iRNA、核酶、抗体)可被用作药学组合物,例如抗病原体药剂或用于 其它治疗中,例如抗微生物试剂,例如抗沙门氏菌试剂。
反义寡核苷酸
[00307]本发明提供了能够结合葡聚糖酶、甘露聚糖酶、或木聚糖酶信息 或基因的反义寡核苷酸,其能够通过靶向mRNA来抑制目标基因或信息,例如抑 制葡聚糖水解酶活性(例如,催化内β-1,4-木糖苷键的水解)。设计反义寡核苷酸 的策略在科学和专利文献中已被详述,专业技术人员能够使用本发明的新型的试 剂来设计这样的葡聚糖酶、甘露聚糖酶、或木聚糖酶寡核苷酸。例如,用于筛选 有效的反义寡聚核苷酸的基因移步(gene walking)/RNA作图(RNA mapping)实 验方案在本领域是已知的,参见,如,Ho(2000)Methods Enzymol.314:168-183, 其说明了RNA作图分析,它是基于标准的分子技术,可以为有效的反义序列的选 择提供容易的和可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
[00308]天然发生的核酸可以作为反义寡聚核苷酸。所述反义寡聚核苷酸 可以是任何长度;例如,在可供选择的方面,所述反义寡聚核苷酸是在大约5到 100之间、大约10到80之间、大约15到60之间、大约18到40之间。通过常规 的筛选来确定最佳的长度。所述反义寡聚核苷酸可以以任何浓度存在。通过常规 的筛选来确定最佳的浓度。已知有许多合成的、非天然发生的核苷酸和核酸类似 物可以针对这样的潜在的问题。例如,可以应用含有非离子骨架如N-(2-氨乙基) 甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸酯连接的反义寡聚核苷酸, 如在WO 97/03211;WO 96/39154;Mata(1997)Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)中所说明的。 本发明提供的具有合成的DNA骨架类似物的反义寡聚核苷酸也可以包括二硫代磷 酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩、亚 甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸,正如以上所说明的。
[00309]也可以应用组合化学方法来产生大量数目的寡聚核苷酸,可以对 它们进行快速筛选,找出对某些靶标例如本发明的正义和反义葡聚糖酶、甘露聚 糖酶或木聚糖酶序列具有合适的结合亲和性和特异性的特异的寡聚核苷酸(参见, 如,Gold(1995)J.of Biol.Chem.270:13581-13584)。
抑制性核酶
[00310]本发明提供可以结合葡聚糖酶、甘露聚糖酶、或木聚糖酶信息的 核酶。这些核酶可以通过,例如靶向mRNA来抑制葡聚糖酶、甘露聚糖酶、或木 聚糖酶活性。设计核酶和选择用于靶向的葡聚糖酶-、甘露聚糖酶-、或木聚糖酶- 特异的反义序列的策略在科学和专利文献中有很好的说明,而且技术人员可以应 用本发明的新型的试剂设计出这样的核酶。核酶通过核酶的靶RNA结合部分结合 于靶RNA而起作用,核酶的RNA结合部分非常靠近切割靶RNA的RNA酶活部 分。这样,通过互补的碱基配对,核酶识别和结合靶RNA,而且一旦结合于正确 的位置,便以酶的活性作用来切割靶RNA和使其失活。如果切割发生在编码序列 中,以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合 和切割其RNA靶之后,它可以从结合的RNA上释放出来并且重复切割新的靶子。
[00311]在一些情况下,核酶的酶性质会优于其它的技术,如反义技术(其 中核酸分子结合于核酸靶来阻止其转录、翻译或者与其它分子的联系),因为实现 治疗效果所必要的核酶有效浓度可能低于反义寡聚核苷酸的浓度。这一潜在的优 点反映出核酶可以以酶的方式进行作用的能力。因此,单个核酶分子可以切割靶 RNA的多个分子。此外,核酶是一种典型的高度特异性的抑制物,其抑制作用的 特异性不仅依赖于碱基配对的结合机制,也依赖于该分子抑制与其结合的RNA的 表达的机制。即,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA 的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素,这种切割 机制还依赖于另外的因素。这样,核酶作用的特异性比结合于同样的RNA位点的 反义寡聚核苷酸强。
[00312]本发明的核酶,例如,具有酶活的核酶RNA分子可以形成锤头状 模体、发夹模体,如肝炎δ病毒模体、I类内含子模体和/或与RNA引导序列相联 系的RNaseP类似的RNA。锤头状模体的例子在如Rossi(1992)Aids Research and Human Retroviruses 8:183中有说明;发夹模体在Hampel(1989)Biochemistry 28: 4929和Hampel(1990)Nuc.Acids Res.18:299中有说明;肝炎δ病毒模体在Perrotta (1992)Biochemistry 31:16中有说明;RnaseP模体在Guetrier-Takada(1983)Cell 35:849中有说明;I类内含子在Cech美国专利4,987,071中有说明。这些特定模体 的引述并不是限制性的。本领域技术人员将认识到本发明的核酶,如,本发明的 有酶活的RNA分子,可以有与一个或者多个靶基因的RNA区域互补的特异的底 物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子 RNA切割活性的核苷酸序列。
RNA干扰(RNAi)
[00313]在一个方面,本发明提供了被称为“RNAi”分子的RNA抑制性分 子,其含有本发明的葡聚糖酶、甘露聚糖酶、或木聚糖酶序列。RNAi分子构成双 链RNA(dsRNA)分子。RNAi可抑制葡聚糖酶、甘露聚糖酶、或木聚糖酶基因 的表达。在一个方面,RNAi的长度大约为15、16、17、18、19、20、21、22、23、 24、25或更多个双链核苷酸。本发明不限于任何特殊的作用机制,RNAi可进入细 胞中,引起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。 当细胞与双链RNA(dsRNA)接触时,来自同源基因的mRNA被称为RNA干扰 (RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因 序列匹配的双链RNA(dsRNA)打断成为称为小分子干扰RNA的短的碎片,它 可触发与其序列匹配的mRNA的降解。在一个方面,本发明的RNAi可用于基因 沉默(gene-silencing)疗法中,见,例如Shuey(2002)Drug Discov.Today 7:1040-1046。在一个方面,本发明提供了使用本发明的RNAi选择性降解RNA的 方法。该过程可在体外、离体或体内实施。在一个方面,本发明的RNAi分子可用 来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的 RNAi分子的方法在本领域中是为人所熟知的,见,例如美国专利6,506,559; 6,511,824;6,515,109;6,489,127。
核酸的修饰
[00314]本发明提供了产生本发明的核酸的变异体的方法,所述的本发明 核酸例如那些编码葡聚糖酶、甘露聚糖酶、或木聚糖酶的核酸。这些方法可以被 重复或者以各种组合方式来应用,以产生与模板核酸编码的葡聚糖酶、甘露聚糖 酶、或木聚糖酶相比具有改变的或不同的活性,或者改变的或不同的稳定性的葡 聚糖酶、甘露聚糖酶、或木聚糖酶。这些方法也可以被重复或者以各种组合方式 来应用,以例如使基因/信息表达、信息翻译或者信息稳定性产生变化。另一方面, 细胞的遗传学组成可以被改变,通过例如离体进行同源基因的修饰,然后将其重 新插入到细胞。
[00315]本发明的核酸可以用任何方法进行变化。例如,无定向或随机方 法、或者非随机、或者“定向进化”的方法,参见如,美国专利6,361,974。基因的 随机突变方法在本领域是已知的,参见如,美国专利5,830,696。例如,可以应用 突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者γ辐射,或者化学 诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者组合 使用来诱导DNA的断裂,其可以通过重组被修复。另外的化学诱变剂包括,如, 亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物, 如,亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反 应中替换核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶 黄、奎纳克林和类似物。
[00316]可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如, Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或者组合式多重盒式诱变, 参见如,Crameri(1995)Biotechinques 18:194-196。可选择地,核酸,如基因,可 以在随机片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861; 5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可选择的方面,修饰、 增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、 有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一 性诱变、基因重装配、基因位点饱和诱变TM(GSSMTM)、合成连接重装配(SLR)、 重组、递归序列重组、硫代磷酸酯-修饰的DNA诱变、含有尿嘧啶模板的诱变、 缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、 缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸 多聚体生成、和/或者这些方法和其它方法的组合产生。
[00317]以下的出版物描述了各种递归重组程序和/或可以整入到本发明的 方法中的方法:Stemmer(1999)“Molecularbreeding of viruses for targeting and other clinical properties”Tumor Targeting 4:1-4;Ness(1999)Nature Biotechnology 17:893-896;Chang(1999)“Evolution of a cytokine using DNA family shuffling”Nature Biotechnology 17:793-797;Minshull(1999)“Protein evolution by molecular breeding”Current Opinion in Chemical Biology 3:284-290;Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17:259-264;Crameri(1998)“DNA shuffling of a family of genes from diverse species accelerates directed evolution”Nature 391:288-291;Crameri(1997)“Molecular evolution of an arsenate detoxification pathway by DNA shuffling”Nature Biotechnology 15:436-438;Zhang(1997) “Directed-evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94:4504-4509;Patten等(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion in Biotechnology 8:724-733;Crameri等(1996)“Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103;Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through display on a lac repressor′headpiece dimer′”Journal of Molecular Biology 255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The Encyclopedia of Molecular Biology.VCH Publishers,New York.447-457页;Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all thepermutations of mutant and wildtype cassettes”BioTechniques 18:194-195;Stemmer等(1995)“Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides”Gene, 164:49-53;Stemmer(1995)“The Evolution of Molecular Computation”Science 270:1510;Stemmer(1995)“Searching Sequence Space”Bio/Technology 13:549-553; Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370: 389-391;和Stemmer(1994)“DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution”Proc.Natl.Acad.Sci.USA 91: 10747-10751。
[00318]产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997) “Approaches to DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale 等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.Rev. Genet.19:423-462;Botstein & Shortle(1985)“Strategies and applications of in vitro mutagenesis”Science 229:1193-1201;Carter(1986)“Site-directed mutagenesis”Biochem.J.237:1-7;Kunkel(1987)“The efficiency of oligonucleotide directed mutagenesis”在Nucleic Acids & Molecular Biology(Eckstein,F.和Lilley,D. M.J.eds.,Springer Verlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985) “Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl. Acad.Sci.USA 82:488-492;Kunkel等(1987)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Methods in Enzymol.154,367-382;和Bass 等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242: 240-245);寡核苷酸诱导的定点诱变(Methods in Enzymol.100:468-500(1983); Methods in Enzymol.154:329-350(1987);Zoller & Smith (1982) “Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment”Nucleic Acids Res.10:6487-6500;Zoller & Smith(1983)“Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol. 100:468-500和Zoller & Smith(1987)Oligonucleotide-directed mutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template” Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985) “The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA”Nucl.Acids Res.13:8749-8764;Taylor等(1985)“The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye (1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14: 9679-9698;Sayers等(1988)“Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis”Nucl.Asids Res.16:791-802;和Sayers等(1988) “Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16: 803-814);使用缺口双倍DNA的诱变(Kramer等(1984)“The gapped duplex DNA approach to oligonucleotide-directed mutation construction”Nucl.Acids Res.12: 9441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction of mutations via gapped duplex DNA”154:350-367;Kramer等(1988) “Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;和Fritz 等(1988)“Oligonucleotide-directed construction of mutations:a gaPPed duplex DNA procedure without enzymatic reactions in vitro”Nucl.Acids Res.16:6987-6999)。
[00319]可以用于实践本发明的另外的实验方案包括点错配修复(Kramer (1984)“Point Mismatch Repair”Cell 38:879-887),应用修复缺陷型宿主株的诱变 (Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13 vectors”Nuucl.Acids Res.13:4431-4443和Carter(1987)“Improved oligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154: 382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate large deletions”Nuucl.Acids Res.14:5115),限制-选择和限制-纯化(Wells等(1986) “Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.R.Soc.Lond.A 317:415-423),通过全基因合成的诱变 (Nambiar等(1984)“Total synthesis and cloning of a gene coding for the ribonuclease S protein”Science 223:1299-1301;Sakamar和Khorana(1988)“Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)”Nuucl.Acids Res.14:6361-6372;Wells等 (1985)“Cassette mutagenesis:an efficient method for generation of multiple mutations at defined sites”Gene 34:315-323和Grundstrom等(1985) “Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl. Acids Res.13:3305-3316),双链断裂修复(Mandecki(1986),Arnold(1993) “Protein engineering for unusual environments”Current Opinion in Biotechnology 4:450-455.“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:a method for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA,83: 7177-7181)。很多以上的方法的另外的细节在Methods in Enzymology的154卷中 有说明,其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。
[00320]在例如下列的文件中描述了可以用于实践本发明的实验方案,如 Stemmer的美国专利5,605,793(1997.2.25),“Methods for In Vitro Recombination”; Stemmer等的美国专利5,811,238(1998.9.22)“Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination”;Stemmer等的美国专利5,830,721(1998.11.3),“DNA Mutagenesis by Random Fragmentation and Reassembly”;Stemmer等的美国专利5,834,252(1998. 11.10),“End-Complementary Polymerase Reaction”;Minshull等的美国专利 5,837,458(1998.11.17)“Methods and Compositions for Cellular and Metabolic Engineering”;WO 95/22625,Stemmer和Crameri,“Mutagenesis by Random Fragmentation and Reassembly”;WO 96/33207,Stemmer和Lipschutz,“End Complementary Polymerase Chain Reaction”;WO 97/20078,Stemmer和Crameri的 “Methods for Generating Polynuucleotides having Desired Characteristics by Iterative Selection and Recombination”;WO 97/35966,Minshull和Stemmer,“Methods and Compositions for Cellular and Metabolic Engineerin”;WO 99/41402,Punnonen等, “Targeting of Genetic Vaccine Vectors”;WO 99/41383,Punnonen等,“Antigen Library Immunization”;WO 99/41369,Punnonen等,“Genetic Vaccine Vector Engineering”; WO 99/41368,Punnonen等,“Optimization of Immunomodulatory Properties of Genetic Vaccines”;EP 752008,Stemmer和Crameri,“DNA Mutagenesis by Random Fragmentation and Reassembly”;EP 0932670,Stemmer,“Evolving Cellular DNA Uptake by Recursive Sequence Recombination”;WO 99/23107,Stemmer等, “Modification of Virus Tropism and Host Range by Viral Genome Shuffling”;WO 99/21979,Apt等,“Human Papillomavirus Vectors”;WO 98/31837,del Cardayre 等,“Evolution of Whole Cells and Organisms by Recursive Sequence Recombination”; WO 98/27230,Patten和Stemmer,“Methods and Compositions for PolyPeptide Engineering”;WO 98/27230,Stemmer等,“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection”;WO 00/00632,“Methods for Generating Highly Diverse Libraries”;WO 00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences”;WO 98/42832,Arnold等,“Polynucleotide Sequences Using Random or Defined Primers”; WO 99/29902,Amold等,“Method for Creating Polynucleotide and Polypeptide Sequences”;WO 98/41653,Vind,“An in Vitro Method for Construction of a DNA Library”;WO 98/41622,Borchert等,“Method for Constructing a Library Using DNA Shuffling”;以及WO 98/42727,Pati和Zarling,“Sequence Alterations using Homologouus Recombination”。
[00321]在例如下列的文件中描述了可以用于实践本发明的方案(提供了 关于产生不同多样性的方法的细节),如美国专利申请系列号(USSN)09/407,800, Patten等的“SHUFFLING OF CODON ALTERED GENES”,于1999年9月28日归 档;del Cardayre等的“EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,美国专利6,379,964;Crameri等的 “OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,美国专 利6,319,714;6,368,861;6,376,246;6,423,542;6,426,224和PCT/US00/01203; Welch等的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING”,美国专利6,436,675;Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,2000年1月18日归档, (PCT/US00/01202)和,如Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,2000年7月18日归档,(美国系列号 09/618,579);Selifonov和Stemmer的“METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,2000年1月18 日归档(PCT/US00/01138),和Affholter的“SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION”,2000年9月6日归档(美国系列号09/656,549),和美国专利 6,177,263;6,153,410。
[00322]非随机的或者“定向进化”的方法包括例如,基因位点饱和诱变 (Gene Site Saturation MutagenesisTM(GSSMTM))、合成的连接重装配(SLR),或 者它们的组合,它们被用来修饰本发明的核酸,以产生具有新的或者改变的性质 的葡聚糖酶、甘露聚糖酶或木聚糖酶(如,在强酸性或者强碱性条件、高温等条 件下的活性)。由改变了的核酸编码的多肽可以在测定木聚糖水解或者其它活性之 前对活性进行筛选。可以应用任何测试形式或者方案,如,用毛细管阵列平台。 参见,如,美国专利6,361,974;6,280,926;5,939,250。
饱和诱变,或者GSSMTM
[00323]一方面,应用含有简并的N,N,G/T序列的密码子引物将点突变引 入到多聚核苷酸,如,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或者抗体,以 便产生一套子代多肽,其中,在每个氨基酸位置都可以出现完整范围的单个氨基 酸替换,例如,替换的位置可以在将要被改变的酶活性位点(催化区域(CDs)) 或者配基结合位点内的氨基酸残基。这些寡聚核苷酸可以包括邻近的第一同源序 列、简并的N,N,G/T序列和可选择的第二同源序列。由这样的寡聚核苷酸的应用 获得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点的所有可能的氨基 酸变化,这是由于N,N,G/T序列的简并包括了所有20个氨基酸的密码子。一方面, 一个这样的简并寡聚核苷酸(例如,由一个简并的N,N,G/T盒构成)被应用,以 使亲代多聚核苷酸模板中各个原先的密码子发生完整范围的密码子替换。另一方 面,应用至少两个简并序列盒——或者是在同一个寡聚核苷酸中或者不是,以使 亲代多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密码子替代。例 如,在一个寡聚核苷酸中可以含有多于一个的N,N,G/T序列,这样,在多于一个 的位点导入氨基酸突变。这样的多个N,N,G/T序列可以是直接邻近的,或者被一 个或者多个另外的核苷酸序列隔开。另一方面,可用于引入增加和缺失的寡聚核 苷酸可以单独应用或者与含有N,N,G/T序列的密码子组合应用,以引入氨基酸增 加、缺失和/或取代的任何组合或者排列。
[00324]一方面,应用含有邻接的N,N,G/T三联体,即简并的(N,N,G/T)n 序列的寡聚核苷酸,可以在两个或者多个邻近的氨基酸位置同时进行诱变。另一 方面,可以应用简并度比N,N,G/T序列小的简并盒。例如,在一些例子中,(如, 在一个寡聚核苷酸中)应用包括仅仅一个N的简并三联体序列是理想的,其中所 述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使 用包括任何组合和排列的任何其它的碱基。作为选择,在一些例子中,(如,在一 个寡聚核苷酸中)使用简并的N,N,N三联体序列是理想的。
[00325]一方面,应用简并的三联体(如N,N,G/T三联体),可以系统地和 容易地在多肽的所有氨基酸位置中的每一个位置获得完整范围的可能的天然氨基 酸(对应于所有20个氨基酸)(在可供选择的方面,所述方法也包括在每一个氨 基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如,对于100个 氨基酸的多肽,可以产生2000个不同的种类(即,每个位置可能的20种氨基酸× 100个氨基酸位置)。通过应用含有简并N,N,G/T三联体的一段寡聚核苷酸或者一 套寡聚核苷酸,32个不同的序列可以编码所有20种可能的天然氨基酸。因此,在 使用至少一种这样的寡聚核苷酸进行亲本多聚核苷酸序列饱和诱变的反应容器 中,产生了32种不同的子代寡聚核苷酸,它们编码20种不同的多肽。相反地, 在定点突变中,应用非简并的寡聚核苷酸导致在每个反应容器中仅仅有一种子代 多肽产物。非简并的寡聚核苷酸可以选择性地与公开的简并引物组合使用;例如, 在工作多肽中,可以应用非简并的寡聚核苷酸来产生特异的点突变。这就提供了 一种手段来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引起 终止密码子产生和多肽片段相应的表达终止的点突变。
[00326]一方面,每一个饱和诱变反应容器中含有编码至少20种子代多肽 (如,葡聚糖酶、甘露聚糖酶或木聚糖酶)分子的多聚核苷酸,因此所有的20种 天然氨基酸都会出现在对应于亲本多聚核苷酸中的被诱变的密码子位置上的特定 的氨基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱和诱变 反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克 隆至合适的宿主,如E.coli宿主),然后进行表达的筛选。当通过筛选确定显示出 有利的性质变化(例如与亲本多肽比较,在碱性、酸性条件下葡聚糖水解活性增 强)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸 取代。
[00327]一方面,如在此所公开的,应用饱和诱变对亲本多肽的各个和所 有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一个的氨基酸 位置。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种 新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特 定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与 原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有 3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在 三个位置的每一个处有2个)和在任何位置中都没有变化的1种。
[00328]另一方面,位点饱和诱变可以与重排、嵌合、重组和其它的诱变 程序以及筛选一起应用。本发明提供了以反复的方式来应用任何的诱变程序,包 括饱和诱变。在一个实例中,任何诱变程序的反复应用与筛选组合使用。
[00329]本发明也提供了所专有的密码子引物(含有简并N,N,N序列)的 应用,其可将点突变导入进多核苷酸中,以产生一套子代多肽,其中,在每个氨 基酸位置都可以出现完整范围的单个氨基酸替换(Gene Site Saturation MutagenesisTM(GSSMTM))。使用的寡聚物包括邻接的第一同源序列、简并N,N,N 序列和在一个方面的但不是必需的第二同源序列。由这样的寡聚核苷酸的应用获 得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点的所有可能的氨基酸 变化,这是由于N,N,G/T序列的简并包括了所有20个氨基酸的密码子。
[00330]一方面,一个这样的简并寡聚物(由一个简并的N,N,N盒构成) 被应用,以使亲代多聚核苷酸模板中各个原先的密码子发生完整范围的密码子替 换。另一方面,应用至少两个简并N,N,N序列盒——或者是在同一个寡聚物中或 者不是,以使亲代多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密 码子替代。例如,在一个寡聚物中可以含有多于一个的N,N,N序列,这样,在多 于一个的位点导入氨基酸突变。这样的多个N,N,N序列可以是直接邻近的,或者 被一个或者多个另外的核苷酸序列隔开。另一方面,可用于引入增加和缺失的寡 聚物可以单独应用或者与含有N,N,N序列的密码子组合应用,以引入氨基酸增加、 缺失和/或取代的任何组合或者排列。
[00331]在一个特殊的实例中,可以应用含有邻接的N,N,N三联体,即简 并的(N,N,N)n序列的寡聚物,在两个或者多个邻近的氨基酸位置同时进行诱变。
[00332]另一方面,本发明提供了简并度比N,N,N序列小的简并序列盒的 应用。例如,在一些例子中,(如,在一个寡聚物中)应用包括仅仅一个N的简并 三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位 置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。可选择 的是,在一些实例中(例如,在一个寡聚物中)需要使用简并的N,N,N三联体序 列、N,N,G/T,或N,N,G/C三联体序列。
[00333]但要理解的是,在本发明中所公开的简并三联体(如N,N,G/T或 N,N,G/C三联体序列)的应用在数个方面都是有优势的。在一个方面,本发明提供 了可以系统地和相当容易地在多肽的各个和所有氨基酸位置中产生完整范围的可 能的氨基酸(总共20个氨基酸)替代的手段。因此,对于100个氨基酸的多肽, 本发明提供了可系统地和相当容易地产生2000个不同的种类(即,每个位点20 个可能的氨基酸乘100个氨基酸位点)的方法。要理解的是,通过使用含有简并 N,N,G/T或N,N,G/C三联体序列的寡聚物,可以提供编码20个可能氨基酸的32 条序列。因此,在使用一种这样的寡聚物进行亲本多聚核苷酸序列饱和诱变的反 应容器中,产生了32种不同的子代寡聚核苷酸,它们编码20种不同的多肽。相 反地,在定点突变中,应用非简并的寡聚物导致在每个反应容器中仅仅有一种子 代多肽产物。
[00334]本发明也提供了非简并寡聚物的应用,其可选择性地与公开的简 并引物联合使用。要理解的是,在一些情况下,使用非简并寡聚物在工作多核苷 酸中产生特异点突变是有利的。这就提供了一种手段来产生特异的沉默点突变、 导致相应的氨基酸改变的点突变和引起终止密码子产生和表达相应多肽片段的点 突变。
[00335]因此,在本发明的一个方面,每个饱和诱变反应容器中含有编码 至少20种子代多肽分子的多聚核苷酸,这样所有的20种氨基酸都会出现在对应 于亲本多聚核苷酸中被诱变的密码子位置的特定的氨基酸位置。产生于每个饱和 诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载 体克隆至合适的E.coli宿主),然后进行表达的筛选。当通过筛选确定显示出有利 的性质变化(与亲本多肽比较)的单个子代多肽时,就可以用测序来确定其中所 含有的相应的有利的氨基酸取代。
[00336]要理解的是,如在此所公开的,应用饱和诱变对亲本多肽的各个 和所有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一个的氨 基酸位置。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者 多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2 个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性 (与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样, 就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即, 在三个位置的每一个有2个)和在任何位置中都没有变化的1种。
[00337]因此,在一个非限制性的实例中,本发明提供了饱和诱变与其它 诱变处理过程的组合应用,例如将两个或更多个相关的多核苷酸导入进合适的宿 主细胞中,这样通过重组和还原性重配(reductive reassortment)产生杂交多核苷 酸。
[00338]除了沿基因的整个序列进行诱变以外,本发明提出,可以使用诱 变在多核苷酸序列中替换任意数目的碱基,其中所述的要被诱变的碱基数目在一 个方面从15至100,000的每个整数。因此,不是对分子的每个位置进行诱变,可 以将每一数目或不连续数目的碱基(在一个方面,子集总数选自从15至100,000) 进行诱变。在一个方面,使用分离的核苷酸沿多核苷酸序列诱变每个位点或一组 位点。要被诱变的一组3个位点可以是密码子。突变可以使用诱变引物导入,该 引物含有异源序列盒,也称为诱变序列盒。示例性的序列盒具有1至500个碱基。 这样的异源基因盒中的每个核苷酸位点可以是N、A、C、G、T、A/C、A/G、A/T、 C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E,其中E可以是非A、C、G、 或T的任何碱基(E可以被称为设计者寡聚物)。
[00339]通常意义上,饱和诱变包括在已确定要诱变的多核苷酸序列(其 中所述的要被诱变的序列的长度在一个方面从大约15至100,000个碱基)中诱变 一整套诱变序列盒(其中所述的每个序列盒(cassete)的长度在一个方面为大约 1-500个碱基)。因此,一组突变(范围从1至100个突变)被导入进要被诱变的 每个序列盒中。在进行一轮饱和诱变时,被导入进一个序列盒的一组突变可以与 要被导入进第二个序列盒的第二组突变不同或相同。这样的分组的例子是缺失、 添加、特定密码子的分组和特定核苷酸序列盒的分组。
[00340]将要被诱变的确定序列包括整个基因、通路、cDNA、整个开放阅 读框(open reading frame(ORF))和整个启动子、增强子、阻遏物/反式激活因子、 复制起始点、内含子、操纵子或任何多核苷酸功能基团。通常,用于此目的的“确 定序列”可以是15个碱基的多核苷酸序列,和长度在15个碱基和15,000个碱基之 间的任何多核苷酸序列(本发明特别指定其间的每一个整数)。在选择密码子组别 时的考虑包括:由简并诱变序列盒编码的氨基酸类型。
[00341]在一个实例中,可导入进诱变序列盒中一组突变集合,本发明特 别地提供了在每个位点上编码2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19和20个氨基酸的简并密码子取代(使用简并的寡聚物)和由 此编码的多肽文库。
合成连接重装配(SLR)
[00342]本发明提供了一种非随机的基因改变系统,命名为“合成连接重装 配(synthetic ligation reassembly)”或者简称为“SLR”,这是一种“定向进化方法 (directed evolution process)”,可以产生具有新的或者改变的性质的多肽,例如, 本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或抗体。
[00343]SLR是一种非随机地连接寡聚核苷酸片段的方法。这一方法与随 机的寡聚核苷酸重排不同,因为核酸构建模(building blocks)并不进行随机重 排、连接或者嵌合,而是进行非随机的装配。参见,如,美国专利申请系列号(USSN) 09/332,835,名称为“Synthetic Ligation Ressembly in Directed Evolution”,在1999 年6月14日归档(“USSN 09/332,835”)。一方面,SLR包括以下的步骤:(a)提 供模板多聚核苷酸,其中该模板多聚核苷酸包括编码同源基因的序列;(b)提供 多个构建模块多聚核苷酸,其中所述的构建模块多聚核苷酸被设计为可与模板多 聚核苷酸以预定顺序交换装配(cross-over reassemble),而且构建模块多聚核苷酸 包括所述同源基因的变异体序列以及在变异序列两侧与模板多聚核苷酸同源的序 列;(c)将模板多聚核苷酸与构建模块多聚核苷酸结合,以便构建模块多聚核苷 酸与模板多聚核苷酸交换装配,产生包含同源基因序列变异的多聚核苷酸。
[00344]SLR并不依赖于在待重新组装的多聚核苷酸之间存在高水平的同 源性。这样,这一方法可以用于非随机地产生包括超过10100个不同嵌合体的子代 分子的文库(或者集合)。SLR可以用于产生包括超过101000个不同子代嵌合体的 文库。这样,本发明包括用于产生一套最终的具有按设计选择的整个装配顺序的 嵌合核酸分子的非随机方法。这一方法包括按设计产生大量特定的核酸构建模块 的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后 装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。
[00345]将被装配的核酸构建模块的相互相容的可连接的末端对于这种类 型的顺序装配被认为是“适用的”,如果它们使得构建模块以预先制定的顺序联接的 话。因此,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异 化的。如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配 顺序也通过装配步骤或多个装配步骤的先后次序来特异化。一方面,退火的构建 模块用酶处理,如用连接酶(如,T4 DNA连接酶)处理,以完成构建模块的共价 键连接。
[00346]一方面,寡聚核苷酸构建模块的设计通过分析一套祖先核酸序列 模板来得到,该模板作为产生子代一套最终的嵌合多聚核苷酸的基础。这些亲本 寡聚核苷酸模板作为序列信息源,辅助待诱变例如待嵌合化或者重排的核酸构建 模块的设计。在这一方法的一个方面,为了选择一个或者多个分界点(demarcation points),对多个亲本核酸模板的序列进行联配。所述分界点可以位于同源的区域, 并且可以包括一个或者多个核苷酸。这些分界点在一个方面由至少两个祖先模板 中共有。所述分界点可以因此用于描绘将要产生的寡聚核苷酸构建模块的边界, 以便重新排列亲本寡聚核苷酸。在祖先分子中确定和选择的分界点用作装配最终 的嵌合子代分子的潜在的嵌合位点。分界点可以是至少两个亲本多聚核苷酸序列 共同的同源区域(包括至少一个同源核苷酸碱基)。可选择地,分界点可以是由至 少半数的亲本多聚核苷酸序列共同拥有的同源区域,或者,是由至少三分之二的 亲本多聚核苷酸序列共同拥有的同源区域。甚至在一个方面,可应用的分界点是 至少四分之三的亲本多聚核苷酸序列共同拥有的同源区域,或者,是几乎所有的 亲本多聚核苷酸序列共同拥有的同源区域。一方面,分界点是由所有的亲本多聚 核苷酸序列共同拥有的同源区域。
[00347]一方面,为了产生一个彻底的子代嵌合多聚核苷酸文库,连接重 装配过程被尽可能充分地实施。换句话说,核酸构建模块的所有可能顺序的组合 存在于一套最终的嵌合核酸分子中。同时,另一方面,每个组合中的装配顺序(即, 各个构建模块的装配顺序,按各个最终的嵌合核酸序列的5’到3’序列方向)是按 照以上所述设计的(或者是非随机的)。由于本发明的非随机性质,不需要的副产 物的可能性大大降低。
[00348]另一方面,系统地实施连接重装配的方法。例如,实施本方法来 产生系统区分化的子代分子文库,划分开的文库可以系统地进行筛选,例如逐个 的筛选。换句话说,通过选择性的和审慎的应用特定的核酸构建模块,再加上选 择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实 现,即可以在几个反应容器中制备出各自特定的一系列子代产物。这就允许进行 系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以 较小的组进行系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌 合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,所以这些方法 可以产生包括很大数目的子代分子的文库(或者一套分子)。由于该连接重装配发 明的非随机性,产生的子代分子在一个方面包括具有依设计而选择的全部装配序 列的最终嵌合核酸分子的文库。饱和诱变和优化的定向进化方法也可以用于产生 不同的子代分子种类。可以理解,本发明在分界点的选择、核酸构建模块的大小 和数目以及偶联的大小和设计方面提供了选择和控制的自由度。更进一步理解的 是,本发明的操作对分子间同源性的要求被大大降低了。实际上,甚至可以在有 较少分子间同源性或者没有分子间同源性的区域选择区别点。例如,由于密码子 的摆动性,即,密码子的简并,核苷酸的替代可以被引入到核酸构建模块中而并 不改变在相应的祖先模板中起初编码的氨基酸。可选择地,一个密码子可以被改 变以至于原先的氨基酸的编码被改变。本发明提供了这样的替换,它们能够被引 入到核酸构建模块中,由此增加分子间同源的分界点的发生率,这样就允许在构 建模块之间实现更多数目的偶联,这又使得更多数目的子代嵌合分子产生。
[00349]在一个方面,本发明提供了称为合成基因重装配(synthetic gene reassembly)的非随机方法,其显示稍微与随机重排相关,只是核酸构建模块并不 进行随机重排、连接或者嵌合,而是进行非随机的装配。
[00350]合成基因重装配方法并不依赖于在待重排的多聚核苷酸之间存在 高水平的同源性。本发明可以用于非随机地产生包括超过10100个不同嵌合体的子 代分子文库(或一套子代分子)。令人信服的是,合成基因重装配甚至可以用于产 生包括超过101000个不同子代嵌合体的文库。
[00351]因此,在一个方面,本发明提供了用于产生一套最终的具有按设 计选择的整个装配顺序的嵌合核酸分子的非随机方法,这一方法包括按设计产生 大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容 的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装 配顺序。
[00352]将被装配的核酸构建模块的相互相容的可连接的末端对于这种类 型的顺序装配被认为是“适用的”,如果它们使得构建模块能够以预先制定的顺序联 接的话。因此,在一个方面,核酸构建模块被偶联的总体装配顺序是通过可连接 末端的设计来特异化的,如果不止一个装配步骤将要被应用,那么核酸构建模块 被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。在本发明的一方面, 退火的构建零件用酶处理,如用连接酶(如,T4 DNA连接酶)处理,以完成构建 零件的共价连接。
[00353]在另一方面,核酸构建模块的设计是基于对一套祖先核酸模板的序 列分析而得到的,该模板作为产生一套子代的最终的嵌合核酸分子的基础。因此, 这些祖先核酸模板作为序列信息源,辅助待诱变的即待嵌合化的或者重排的核酸构 建模块的设计。
[00354]在一个实例中,本发明提供了一个家族的相关基因的嵌合和它们编 码的相关产物的家族。在一个特定的实例中,被编码的产物是酶。本发明的葡聚糖 酶、甘露聚糖酶或木聚糖酶可根据在此所述的方法被诱变。
[00355]因此,根据本发明的一个方面,为了选择一个或者多个分界点, 对多个祖先核酸模板(例如,本发明的多核苷酸)的序列进行联配,所述分界点 可以位于同源的区域。所述分界点可以用于描绘将要产生的核酸构建模块的边界。 因此,在祖先分子中确定和选择的分界点用作装配子代分子的潜在的嵌合位点。
[00356]通常,可应用的分界点是至少两个祖先模板共有的同源区域(包 括至少一个同源核苷酸碱基)。分界点可以是由至少半数的祖先模板共同拥有的同 源区域、是由至少三分之二的祖先模板共同拥有的同源区域、是至少四分之三的 祖先模板共同拥有的同源区域,在一个方面是几乎所有的祖先模板共同拥有的同 源区域。更有在一个方面,分界点是由所有的祖先模板共同拥有的同源区域。
[00357]在一个方面,基因重装配过程被极限地实施,以便产生一个极限 文库。换句话说,核酸构建模块的所有可能的组合顺序都存在于一套最终的嵌合 核酸分子中。同时,每个组合中的装配顺序(即,各个构建模块在各个最终嵌合 核酸的5’至3’序列中的装配顺序)是遵循设计的(或者说是非随机的)。由于本方 法的非随机性质,不需要的副产物的可能性大大降低。
[00358]在另一个方面,本方法提出,基因重装配过程可系统地被实施, 例如,实施本方法来产生系统地区分化的文库,划分开的文库可以系统地进行筛 选,例如逐个地筛选。换句话说,本发明提出,通过选择性的和审慎的应用特定 的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发 明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系 列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可 能是很大数目的子代分子以较小的组进行系统性检测。
[00359]由于其具有以高度变通而又彻底和系统的方式进行嵌合作用的能 力,尤其是当祖先分子之间具有低水平的同源性时,所以本发明提供了可以产生 包括很大数目的子代分子的文库(或者一套分子)的方法。由于该基因重装配发 明的非随机性,产生的子代分子在一个方面包括具有依设计而选择的全部装配序 列的最终嵌合核酸分子的文库。在一个特定的方面,产生的这种文库含有超过103 至超过101000个不同的子代分子种类。
[00360]在一个方面,一组如所述产生的最终嵌合的核酸分子构成编码多肽 的多核苷酸。根据一个方面,这种多核苷酸是基因,可以是人造基因。根据另一个 方面,这种多核苷酸是基因通路,可以是人造基因通路。本发明提出,可以将本发 明产生的一个或多个人造基因整合到人造基因通路中,如可在真核生物(包括植物) 中起作用的通路中。
[00361]在另一个实例中,产生构建模块的步骤的合成特性允许设计和导 入的核苷酸(例如,可以是密码子或内含子或调控序列的一个或多个核苷酸)在 以后在体外程序(例如,通过诱变)或在体内程序(例如,通过运用宿主生物的 基因剪接能力)被选择性地去掉。可理解的是,在许多实例中,除了形成可应用 的分界点的潜在益处之外,还有许多其它的原因导致需要导入这些核苷酸。
[00362]因此,根据另一个方面,本发明提出,可应用核酸构建模块来导 入内含子。因此,本发明提出,功能性内含子可被导入进本发明的人造基因中。 本发明也提出,功能性内含子可以导入进本发明的人造基因通路中。因此,本发 明产生了一种嵌合的多核苷酸,它是含有一个(或多个)人工导入的内含子的人 造基因。
[00363]因此,本发明也产生了嵌合的多核苷酸,它是含有一个(或多个) 人工导入的内含子的人造基因通路。在一个方面,人工导入的内含子能够以天然 发生的内含子在基因剪接中发挥功能的方式在一种或多种宿主细胞的基因剪接中 发挥作用。本发明提供了产生含有人造内含子的多核苷酸的程序,所述多核苷酸 可以被导入进宿主生物体中进行重组和/或剪接。
[00364]应用本发明产生的人造基因也可作为与别的核酸进行重组的底 物。同样,应用本发明产生的人造基因通路也可作为与别的核酸进行重组的底物。 在一个方面,重组可借助于或发生于人造的含内含子的基因和作为重组的另一方 的核酸之间的同源区域。在一个方面,重组作用的另一方也可以是本发明产生的 核酸,包括人造基因或人造基因通路。重组可借助于或发生于人造基因中一个(或 多个)人工导入的内含子处的同源区域。
[00365]本发明的合成基因重装配方法利用了多个核酸构建模块,其中的每 一个在一个方面具有两个可连接的末端。在每个核酸构建模块上的两个可连接末端 可以是两个钝性末端(即,每个末端都无核苷酸悬出),或在一个方面一个钝性末端 和一个粘性末端(overhang(悬出端)),或更在一个方面是为两个粘性末端。
[00366]对于此目的,有用的粘性末端可以是3′突出的粘性末端或5′突出 的粘性末端。因此,核酸构建模块可以具有一个3′粘末端、一个5′粘末端,或者两 个3′粘末端或两个5′粘末端。核酸构建模块被装配成最终的嵌合核酸分子的整个顺 序是通过有目的的实验设计来确定的,而非随机的。
[00367]在一个方面,核酸构建模块可以这样来产生,即化学合成两个单 链核酸(也称为单链寡聚物),让它们接触以致让它们退火形成双链的核酸构建模 块。
[00368]双链核酸构建模块的大小是可变的。这些构建模块的大小可以很 小或很大。构建模块的示范性大小的范围是从1个碱基对(不包括任何突出端) 至100,000个碱基对(不包括任何突出端)。也可以是其它的大小范围,下限是从 1bp至10,000bp(包括其间的任一整数值),上限是从2bp至100,000bp(包括其 间的任一整数值)。
[00369]对于本发明,可应用许多种产生双链核酸构建模块的方法;这些方 法在本领域中是已知的,很容易被专业技术人员实施。
[00370]根据一个方面,双链构建模块可通过首先产生两个单链核酸,再 使它们退火形成双链核酸构建模块来产生。双链核酸构建模块的两条链的除了突 出端之外的任何核苷酸可以是互补的;因此除任何突出端之外不含有任何错配。 根据另一个方面,双链核酸构建模块的两条链在除了突出端之外的核苷酸处不是 完全互补的。因此,根据这个方面,双链核酸构建模块可用来导入密码子简并。 在一个方面,密码子简并通过应用在此所述的位点饱和诱变而被导入,其中使用 了一个或多个N,N,G/T序列盒,或者,可以使用一个或多个N,N,N序列盒。
[00371]本发明的体内重组方法可在特定多核苷酸或序列的未知杂合体或 等位基因构成的库上实施。但不一定需要知道所述特定多核苷酸的具体DNA或 RNA序列。
[00372]在一组混合的基因内应用重组的方法可用来产生任何有用的蛋 白,例如,白介素1、抗体、tPA和生长激素。这种方法可用来产生具有改变的特 异性或活性的蛋白。该方法也可用来产生杂合的核酸序列,例如启动子区、内含 子、外显子、增强子序列、基因的3’未翻译区或5’未翻译区。因此,这种方法可 用来产生具有更高的表达率的基因。这种方法也可用于重复DNA序列(repetitive DNA sequences)的研究中。最后,这种方法可用来突变核酶或适体(aptamers)。
[00373]在一个方面,在此所述的本发明涉及使用重复循环的还原性重配、 重组和选择,其使得高度复杂的线性序列,如DNA、RNA或蛋白质可以通过重组 进行定向分子进化。
最适定向进化系统
[00374]本发明提供了一种非随机的基因修改系统,命名为“最适定向进化 系统(optimized directed evolution system)”,其可以用来生产具有新的或者改变 的性质的多肽,如本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或者抗体。最适定 向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用,其 使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进 化出的嵌合序列,其中产生的群体显著地富集了具有预定数目交换事件(crossover events)的序列。
[00375]交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体 到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷 酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确 浓度,这样,序列的最终嵌合群体富集了所选择数目的交换事件。这也提供了对 选择具有预定数目的交换事件的嵌合突变体的更多控制。
[00376]此外,这一方法与其他系统相比,提供了一种用于探究大数量的 可能蛋白变异体的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子, 测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当 部分将具有很高数目的交换事件,其中得到的蛋白不大可能具有增高水平的特定 活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的交换事 件的变异体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用 于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为 得到的子代群体可以(在统计学上)偏向于具有预定数目的交换事件,所以嵌合 分子之间的功能多样性的界线减少。当计算出来自最初的亲本多聚核苷酸中的哪 一个可能影响到特定的性质时,这时便提供了更加可控制的变量。
[00377]产生嵌合子代多聚核苷酸序列的一个方法是产生对应于每一个亲 本序列的片段或者部分的寡聚核苷酸。每一个寡聚核苷酸在一个方面包括重叠的 独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡聚核苷酸 片段的新的变异体。也可以发现另外的一些信息,如,在USSN 09/332,835;美国 专利6,361,974中。
[00378]对应于每一个亲本变异体产生的寡聚核苷酸数目与在最终产生的 嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有 如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进 行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套 50个寡聚核苷酸序列。相应的,在连接重装配过程中,在每一个嵌合序列中有可 能有超过50个交换事件。产生的每一个嵌合多聚核苷酸都以交替的顺序含有来自 各个亲本变异体的寡聚核苷酸的可能性很低。如果每一个寡聚核苷酸片段以同样 的摩尔量存在于连接反应中,有可能在一些位置中来自同一亲本多聚核苷酸的寡 聚核苷酸将相互一个个连接,而不导致交换事件。如果在这一例子的任何连接步 骤中,来自每一个亲本的每一个寡聚核苷酸的浓度保持不变,那么将会有1/3的机 会(假定3个亲本)来自同一个亲本变异体的寡聚核苷酸连接于嵌合序列内而不 产生遗传交换。
[00379]相应的,可以确定概率密度函数(probality density function(PDF)), 预测在一个连接反应的每一步中可能发生的交换事件的总数,其中给定了一套确 定数目的亲本变异体、对应于每种变体的寡聚核苷酸数目、以及在连接反应中的 每个步骤中的每种变异体的浓度。在确定PDF中所应用到的统计学和数学在下面 被描述。通过应用这些方法,可以计算这样的概率密度函数,而且这样就富集了 来源于特定连接反应的具有预定数目的交换事件的嵌合子代群体。此外,可以预 先确定交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的 每一个步骤中,每种亲本寡聚核苷酸的起始量,从而得到以交换事件的预先确定 的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循 环应用,通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的 进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目交换事件的序列。 交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体到另一个亲本变 异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形 成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序 列的最终嵌合群体富集了所选择数目的交换事件。这也提供了对选择具有预定数 目的交换事件的嵌合突变体的更多控制。
[00380]此外,这些方法与其他系统相比,提供了一种用于探究大数量的 可能的蛋白变异体的方便手段。通过应用在这里描述的方法,嵌合分子的群体可 以富集那些含有特定数目的交换事件的变异体。因此,尽管在反应中可以仍然产 生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例 如,仅仅三个交换事件。因为得到的子代群体可以(在统计学上)倾向于具有预 定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出 来自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,这时便提供了 更加可控制的变量。
[00381]一方面,该方法通过产生对应于每一个亲本序列的片段或者部分 的寡聚核苷酸,产生嵌合子代多聚核苷酸序列。每一个寡聚核苷酸在一个方面包 括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡 聚核苷酸片段的新的变异体。也可参见USSN 09/332,835。
确定交换事件
[00382]本发明包括系统和软件,它们接受以所需的交换概率密度函数 (PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为输入量。该 程序输出“片段PDF”,它可以用于确定用于获得重新装配的基因和那些基因的估 计的遗传交换PDF的具体方法。在一个方面中,于此说明的过程在MATLABTM 中进行(The Mathworks,Natick,Massachusetts),MATLABTM是一种用于技术计算 的程序语言和开发环境。
迭代过程(iterative process)
[00383]在实践本发明时,这些过程可以迭代反复。例如,鉴定出改变的 或者新的葡聚糖酶、甘露聚糖酶或木聚糖酶表型的核酸,再分离,再修饰,再测 试活性。这一过程可以重复直到得到所需的表型。例如,完整的生物化学合成代 谢的或者分解代谢的途径可以在细胞中设计,包括,例如葡聚糖酶、甘露聚糖酶 或木聚糖酶活性。
[00384]类似地,如果确定了特定的寡聚核苷酸对于所有所需的性质(如, 新的葡聚糖酶或甘露聚糖酶或木聚糖酶表型)没有影响,那么就可以合成包括这 段序列在内的更大的亲本寡聚核苷酸,从而将作为变量的这段序列去除。由于将 这段序列合并到更大的序列中,可以避免任何交换事件,所以在子代多聚核苷酸 中,这一序列不再有任何变异。确定哪些寡聚核苷酸与所需的性质最有关系,以 及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的具有特定性质 或者活性的蛋白变异体。
体内重排
[00385]分子的体内重排(in vivo shuffling)在本发明的方法中使用,提供 本发明的多肽如抗体、葡聚糖酶、甘露聚糖酶或木聚糖酶等的变异体。体内重排 利用细胞的天然特性进行多聚体重组。体内的重组提供了实现分子多样性的主要 的天然途径,而遗传重组仍然是一种相对复杂的过程,其涉及1)同源性识别;2) 链切割,链侵入,和导致产生重组交叉(recombination chiasma)的代谢步骤;和 最后3)交叉消除至分离的重组分子。交叉的形成需要同源序列的识别。
[00386]在另一个方面,本发明包括由至少第一多聚核苷酸和第二聚多核 苷酸产生杂合的多聚核苷酸的方法。本发明通过将至少第一多聚核苷酸和第二聚 多核苷酸导入进合适的宿主细胞中,可用来产生杂合的多聚核苷酸,所述的至少 第一多聚核苷酸和第二聚多核苷酸共享具有部分序列同源性的至少一个区域(例 如,SEQ ID NOS:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、 31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、 67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、 103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、 133、135、137、139、141、143、145、147、149、151、153、155、157、159、 161、163、165、167、169、171、173、175、177、179、181、183、185、187、 189、191、193、195、197、199、201、203、205、207、209、211、213、215、 217、219、221、223、225、227、229、231、233、235、237、239、241、243、 245、247、249、251,253、255、257及其组合)。具有部分序列同源性的区域可促 进一些过程,这些过程可引起产生杂合多核苷酸的序列改组。正如在此所用,术 语“杂合多聚核苷酸(hybrid polynucleotide)”是由本发明的方法产生的任何核苷酸 序列,其含有来自至少两个原初的多聚核苷酸序列的序列。这样的杂合多聚核苷 酸可以源于分子间重组事件,分子间重组事件促进了DNA分子间的序列整合。此 外,这样的杂合多聚核苷酸可以源自分子内还原性重配过程,分子内还原性重配 过程利用重复序列来改变DNA分子中的核苷酸序列。
[00387]体内重配主要集中在“分子间”的过程,它们可以统称为“重组”,在 细菌中一般视作“依赖于RecA”的现象。本发明可以利用宿主细胞的重组过程来重 新组合和重配序列,或者利用细胞介导还原性过程的能力,通过缺失来降低准重 复序列的复杂性。“还原性重配(reductive reassortment)”的过程可以通过“分子内” 的RecA依赖性的过程发生。
[00388]因此,在本发明的另一个方面,新型的多聚核苷酸可以通过还原 性重配过程产生。本方法包括产生含有连续序列(最初的编码序列)的构建物, 将它们插入到合适的载体中,随后将它们引入到合适的宿主细胞中。各个分子本 体的重配通过具有同源性区域的构建物中的连续序列之间,或准重复单元之间的 组合过程发生。重配过程重组和/或降低了重复序列的复杂性和范围,并且导致产 生新的蛋白种类。可以应用不同的处理来提高重配率。这些可以包括用紫外线或 者DNA损伤化学剂处理,和/或使用表现出高水平“遗传不稳定性(genetic instability)”的宿主细胞系。因此,重配过程可以包括同源重组或者准重复序列的 天然性质来引导它们自身的进化。
[00389]重复或者“准重复(quasi-repeated)”序列在遗传不稳定性(genetic instability)中起作用。在本发明中,“准重复”是并不限于它们起初的单元结构的重 复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。 一旦连接,在连续序列之间的连接处变得基本上是看不出来的,并且得到的构建 物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过 程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板 库(repertoire),在模板上可以发生滑动事件(slippage event)。因此,含有准重复 的构建物有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以 在准重复单元内的任何地方发生。
[00390]当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然, 细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,当 例如,所述单元以头对头存在,而不是头对尾,相邻单元的头尾倒置,这样缺失 的形成将有利于不连续单元的失去。因此,本发明的方法优选的是序列是处于相 同的方向。准重复序列的随机定向将会导致重配效率的损失,而序列的一致定向 将会提供最高的效率。然而,虽然具有较少的相同定向的连续序列会降低效率, 但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效 率的准重复序列制备构建物。
[00391]应用各种方法中的任何一种,可以将序列装配成头对尾的定向, 包括以下:
a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括 poly-A头和poly-T尾的引物将提供定向。这通过由RNA制备引物的头 几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。
b)可以应用包括独特的限制酶切割位点的引物。这需要多重位点、一组 独特的序列、和重复的合成和连接步骤。
c)引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具有 尾巴的分子。
[00392]重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的 确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降 低的RI的克隆载体的回收可以这样被完成,即:
1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。
2)通过物理程序对缩短的载体进行物理回收。在这一情况下,克隆载体将应 用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或 者柱子上利用标准程序进行大小分离。
3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。
4)应用表达载体以及适当的选择,使用定向选择技术。
[00393]相关的生物体的编码序列(例如,基因)可以表现出高度的同源 性,并且编码相当多样化的蛋白产物。这些类型的序列可以在本发明中用作准重 复序列。以下的实施例说明了几乎相同的原始编码序列(准重复)的重配,然而, 这一过程并不限于这种几乎相同的重复。
[00394]以下的例子表明了本发明的典型方法。描述了来源于三种(3)独 特物种的编码核酸序列(准重复)。每一个序列编码的每一种蛋白都具有不同的一 套性质。这些序列中的每一个在序列的独特位置处的单个或者几个碱基对上有差 别。准重复序列分别或者一起被扩增,并且被连接到随机装配物中,这样所有可 能的排列和组合都可以在连接分子的群体中获得。准重复单元的数目可以通过装 配条件控制。准重复单元在构建物中的平均数目被定义为重复指数(repetitive index (RI))。
[00395]一旦构建物形成,可以按照已出版的实验方案通过琼脂糖凝胶根 据大小进行分离,也可以不分离,将构建物插入到克隆载体中,并转染至适当的 宿主细胞。然后细胞繁殖并且实现“还原性重配”。还原性重配过程的速率可以通过 引入DNA损伤来进行刺激,如果需要的话。RI的降低是通过一种“分子内”的机制 在重复序列间形成缺失来介导,还是通过“分子间”的机制由重组类似的事件来介导 是不重要的。最终的结果是分子被重配,得到所有可能的组合。
[00396]可选择地,本方法包括一个额外的步骤,即对重排的文库成员进 行筛选,以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病毒颗粒或者 其它的预定的化合物或者结构结合或者不同方式地相互作用,或者催化一个特定 的反应(如,酶的催化结构域)的能力的个别的重排文库成员。
[00397]从这样的文库确定出的多肽可以用于治疗、诊断、研究和相关目 的(如,催化剂,用于增加水溶液的渗透摩尔浓度的溶质,等等),和/或可以用于 进行一轮或者多轮附加的重排和/或选择循环。
[00398]另一方面,可以预见,在重组或重配之前,或者在重组或重配的 过程中,通过本发明的方法产生的多聚核苷酸可以用试剂处理或进行加工,这些 处理或加工促进突变引入到原始的多聚核苷酸中。引入这样的突变将会增加得到 的杂合多聚核苷酸及其编码的多肽的多样性。促进诱变的试剂和过程可以包括, 但不限于:(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun 和Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基 联苯加合物(见,例如,van de Poll等(1992)),或者能够抑制DNA合成的N- 乙酰化或者脱乙酰基的4-氨基联苯加合物(见,van de Poll等(1992),751-758 页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香(PAH)DNA加合 物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二 溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化 物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”)、 和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者 停止PCR扩增的示范性的方法包括紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌 呤)。特别包含的方法是DNA加合物或者来自多聚核苷酸或者多聚核苷酸库的含 有DNA加合物的多聚核苷酸,在进一步的处理前,其可以通过包括加热含有所述 多聚核苷酸的溶液的过程进行释放或者去除。
[00399]本发明的另一个方面涉及产生具有生物学活性的重组蛋白的方 法,其通过根据本发明,在可产生杂合或重配的多核苷酸条件的条件下处理含有 编码野生型蛋白的双链模板多核苷酸的样品。
产生序列变异体
[00400]本发明也提供了制备本发明的核酸(如,葡聚糖酶、甘露聚糖酶 或木聚糖酶)序列的序列变异体的另外的方法。本发明也提供了应用本发明的核 酸和多肽分离葡聚糖酶、甘露聚糖酶或木聚糖酶的另外的方法。一方面,本发明 提供了本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶编码序列(如,基因、cDNA或 者信息)的变异体,其可以通过任何方法被改变,包括,例如,随机的方法,或 者非随机的方法,或者“定向进化”的方法,如上所述。
[00401]被分离的突变体可以是天然发生的(naturally occurring)。变异体 也可以在体外产生。变异体也可以应用基因工程技术来产生,如定点诱变、随机 的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地,可以应用化 学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生物。本领域技 术人员也熟悉制备变异体的其它方法。这些方法包括这样的程序,其中,从天然 分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸,所述 的特征使这些多肽在工业或者实验室应用中具有更高的价值。在这样的程序中, 大量的变异体序列被获得和表征,这些变异体序列与从天然分离物中得到的序列 相比,有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分 离得到的核酸序列编码的多肽的氨基酸变化。
[00402]例如,变异体可以通过易错PCR产生(error prone PCR)。在易错 PCR中,PCR在DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的 PCR产物中得到较高的点突变率。易错PCR在例如,Leung,D.W.,等,Technique,l: 11~15,1989和Caldwell,R.C.和Joyce G.F.,PCR Methods Applic.,2:28-33,1992中 描述。简要地说,在这一程序中,待突变的核酸与PCR引物、反应缓冲液、MgCl2、 MnCl2、Taq聚合酶以及适合浓度的dNTPs混合,在全长的PCR产物中得到高的 点突变率。例如,反应可以使用20fmol(毫微微摩尔)待诱变的核酸进行,每种 PCR引物30pmol(皮摩尔),反应缓冲液包括50mM KCl、10mM Tris HCl(pH8.3) 和0.01%明胶、7mM的MgCl2、0.5mM MnCl2、5单位的Taq聚合酶、0.2mM dGTP、 0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环,每个循环为 94℃ 1分钟;45℃ 1分钟;和72℃ 1分钟。然而,这些参数可以适当地变化。诱 变的核酸克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。
[00403]变异体也可以用寡聚核苷酸诱导的定向突变(oligonucleotide directedmutagenesis)产生,在任何感兴趣的克隆DNA中产生位点特异性的突变。 寡聚核苷酸诱变在,例如,Reidhaar-Olson(1988)Science 241:53-57中描述。简 要地说,在这样的程序中,合成多个具有一个或者多个突变的双链寡聚核苷酸, 这些寡聚核苷酸所含有的突变将要被导入被克隆的DNA中,将这些寡聚核苷酸插 入到待诱变的克隆DNA中。回收含有诱变DNA的克隆,并评估它们编码的多肽 的活性。
[00404]另一个产生变异体的方法是装配PCR(assembly PCR)。装配PCR 涉及由小的DNA片段的混合物装配出PCR产物。在同一个容器中平行进行很多 不同的PCR反应,其中,一个反应的产物用作另外一个反应的引物。装配PCR在 例如美国专利5,965,408中有说明。
[00405]另一个产生变异体的方法是有性PCR诱变(sexual PCR mutagenesis)。在有性PCR诱变中,由于基于序列同源性的DNA分子的随机片段 化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源 重组,然后通过PCR反应的引物延伸,交换得到固定。有性PCR诱变在,例如, Stemmer(1994)Proc.Natl.Asad.Sci.USA 91:10747-10751中描述。简要地说, 在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸 的平均大小的片段。纯化具有所需的平均大小的片段,重悬于PCR混合物中。在 有利于核酸片段重组的条件下进行PCR反应。例如,PCR可以这样进行:将纯化 的片段重悬于含有0.2mM的各种dNTP、2.2mM MgCl2、50mM KCl、10mM的 Tris-HCl,pH 9.0以及0.1%的Triton X-100的溶液中,其浓度为10-30ng/μl,以100: 1的比例在反应混合物中加入2.5单位的Taq聚合酶,用以下的条件进行PCR:94℃ 60秒,94℃ 30秒,50-55℃ 30秒,72℃ 30秒(30-45次),然后72℃进行5分钟。 然而,这些参数可以进行适当的变化。在一些方面,寡聚核苷酸可以包括在该PCR 反应中。在其它的一些方面,DNA聚合酶I的Klenow片段可以用于第一轮PCR 反应,而Taq聚合酶可以用于后续的PCR反应。重组序列经过分离并评估它们编 码的多肽的活性。
[00406]变异体也可以通过体内诱变(in vivo mutagenesis)产生。在一些 方面,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生, 所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这 样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行 DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株 在,例如,PCT公开号WO 91/16427中有描述,公开日为1991年10月31日,标 题为“Methods for Phenotype Creation from Multiple Gene Populations”。
[00407]变异体也可以通过应用盒式诱变(cassette mutagenesis)产生。在 盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡聚核苷 酸“盒子”替代。所述寡聚核苷酸一般含有完全和/或部分随机的天然序列。
[00408]递归整体诱变(recursive ensemble mutagenesis)也可以用于产生 变异体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法,它的开发是 为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。 该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin (1992)Proc.Natl.Acad.Sci.USA 89:7811-7815中有描述。
[00409]在一些方面,用指数整体诱变(exponential ensemble mutagenesis) 产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的 突变体的组合文库的过程,其中部分的残基被随机化,同时在每一个被改变的位 置确认导致功能性蛋白的氨基酸。指数整体诱变在如,Delegrave Biotechnology Res. 11:1548-1552,1993中有描述。随机和定点诱变在如,Amold Current Opinion in Biotechnology 4:450-455,1993中有描述。
[00410]在一些方面,变异体利用重排方法(shuffling procedures)产生, 其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合 核酸序列,其描述见美国专利5,965,408,1996年7月9日归档,标题为“Method of DNA Reassembly by Interrupting Synthesis”和美国专利5,939,250,1996年5月22 日归档,题目为“Production of Enzymes Having Desired Activities by Mutagenesis”。
[00411]本发明多肽的变异体可以是本发明肽的一个或多个氨基酸残基被 保守的或非保守的氨基酸残基(在一个方面是保守的氨基酸残基)取代所得到的 变异体,这样的取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。
[00412]本发明提供了本发明多肽(和编码它们的核酸序列)的替代实施 方案,包括至少一个保守的氨基酸取代,如本文中所述,(例如保守氨基酸取代是 用具有类似特征的另一氨基酸取代多肽中给定的氨基酸)。本发明提供了多肽(和 编码它们的核酸序列),其中任何、一些或所有氨基酸残基被具有类似特征的另一 氨基酸取代例如保守的氨基酸所取代。
[00413]保守的取代(conservative substitutions)是指在多肽中用另一个具 有相似性质的氨基酸取代已知的氨基酸。以下的替代通常都被视作保守的取代: 用其它的脂肪族氨基酸替换脂肪族的氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨 酸;用苏氨酸替换丝氨酸,或者用丝氨基替换苏氨酸;用其它的酸性残基替换酸 性残基如天冬氨酸和谷氨酸;用其它具有酰胺基的氨基酸替换具有酰胺基团的残 基如天冬酰胺和谷氨酰胺;用其它的碱性氨基酸替换碱性氨基酸残基如赖氨酸和 精氨酸;用其它的芳香氨基酸取代芳香氨基酸如苯丙氨酸,酪氨酸。在一个可选 择的方面,这些保守取代氨基酸也可以是这些氨基酸的合成等同物。
[00414]在其它的变异体中,本发明的多肽的一个或多个氨基酸残基包含 有取代基团。
[00415]仍然在其它的变异体中,多肽与别的化合物,如用于增加多肽半 衰期的化合物,如,聚乙二醇联接。
[00416]在另外的变异体中,另外的氨基酸融合到多肽上,如前导序列、 分泌序列、蛋白原序列或者有利于纯化、富集或者所述多肽稳定的序列。
[00417]在一些方面,片段、衍生物和类似物仍保留有与本发明的多肽相 同的生物学功能或者活性。在其它方面,片段、衍生物或者类似物包括蛋白原, 这样,所述片段、衍生物或者类似物可以通过蛋白原部分的切割而活化,产生有 活性的多肽。
优化密码子,实现宿主细胞中高水平的蛋白表达
[00418]本发明提供了修饰编码葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸 来改变密码子使用(codon usage)的方法。一方面,本发明提供了修饰编码葡聚 糖酶的核酸中的密码子来增强或者降低其在宿主细胞中的表达的方法。本发明也 提供了编码经修饰而其表达在宿主细胞中增强的葡聚糖酶、甘露聚糖酶或木聚糖 酶的核酸、经过这样的修饰的葡聚糖酶、甘露聚糖酶或木聚糖酶,和制备经修饰 的葡聚糖酶、甘露聚糖酶或木聚糖酶的方法。该方法包括确定编码葡聚糖酶、甘 露聚糖酶或木聚糖酶的核酸中“非-偏爱的”或者“较不偏爱的”密码子,并且用编码 同样氨基酸的“偏爱的密码子”作为替换密码子替换一个或者多个这样的非-偏爱或 者较不偏爱的密码子,并且在所述核酸中至少一个非-偏爱或者较不偏爱的密码子 被编码相同氨基酸的偏爱密码子替换。偏爱密码子是在宿主细胞基因的编码序列 中被优先使用的密码子,而不偏爱的或者较不偏爱的密码子是指在宿主细胞基因 的编码序列中较少使用的密码子。
[00419]用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细 菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在 所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密 码子被改变的核酸编码的多肽。典型的宿主细胞包括革兰氏阴性细菌,如大肠杆 菌;革兰氏阳性细菌,如链霉菌、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳 球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、芽胞杆菌属的种 (Bacillus sp.)、枯草芽胞杆菌、蜡状芽孢杆菌。示范性的宿主细胞也包括真核生 物体,如,各种酵母,如酵母属的种(Saccharomyces sp.),包括酿酒酵母、粟酒 裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森 酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞 系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和生物物种中的表 达被优化的核酸和多肽,例如本发明的核酸序列在例如毕赤酵母属的种例如 (Pichia sp.)、酵母属的种、或芽胞杆菌属的种、链霉菌属的种(Streptomyces sp.) 和类似菌中的宿主细胞中的表达密码子被优化。
[00420]例如,从细菌细胞中分离出的、编码本发明多肽,例如葡聚糖酶、 甘露聚糖酶或木聚糖酶或类似酶的核酸的密码子被修饰,以便该核酸(编码酶) 在不同于获得酶(例如葡聚糖酶、甘露聚糖酶或木聚糖酶)的细菌细胞,酵母、 真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在 本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol. 30:113-l18;Hale(1998)Protein Expr.Purif.12:185-188;Narum(2001)Inect.Immun. 69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253,描述了在鼠 系统中优化密码子;Outchkourov(2002)Protein Expr.Purif.24:18-24,描述了在酵 母中优化密码子;Feng(2000)Biochemistry 39:15399-15409,描述了在大肠杆菌 中优化密码子;Humphreys(2000)Protein Expr.Purif 20:252-264,描述了大肠杆 菌中影响分泌的优化的密码子使用。Gao(2004)Biotechnol Prog.20:443-448,描述 了“UpGene”使用以网络为基础的DNA密码子优化算法(web-based DNA codon optimization algorithm)。
[00421]例如,如下面实施例4所述,将编码具有SEQ ID NO:6中示出的 序列的多肽的核酸(例如SEQ ID NO:5)进行密码子优化,以在巴斯德毕赤酵母中获 得最佳表达;巴斯德毕赤酵母密码子-优化的编码酶的核酸是SEQ ID NO:463。具 有SEQ ID NO:464中示出的序列的示范性多肽在位置91是丙氨酸(SEQ ID NO:464),在可选择的方面,是缬氨酸(在SEQ ID NO:6中)。类似地,在可选择的 实施方案中,编码SEQ ID NO:464(即SEQ ID NO:463)的示范性核酸在位置91可 编码丙氨酸或缬氨酸(或另一保守的取代)。事实上,本发明提供了本发明多肽(和 编码它们的核酸)的可选择实施方案,其包括至少一个保守氨基酸取代,如本文 中论述(例如保守氨基酸取代是用具有类似的特性的另一氨基酸取代多肽中给定的 氨基酸),如本文中论述。
转基因非-人类的动物
[00422]本发明提供了包含本发明的核酸、多肽(例如葡聚糖酶、甘露聚 糖酶或木聚糖酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转 基因非人类的动物。本发明也提供了制造和应用这些转基因非人类动物的方法。
[00423]转基因非人类动物可以是,例如包括本发明的核酸的山羊、兔、 绵羊、猪、牛、小鼠和大鼠。这些动物可以用作例如体内模型来研究葡聚糖酶、 甘露聚糖酶或木聚糖酶活性,或者作为模型来在体内筛选改变葡聚糖酶、甘露聚 糖酶或木聚糖酶活性的试剂。要在转基因非人类动物中表达的多肽的编码序列可 以设计为组成型的,或者在组织特异性、发育特异性或者可诱导的转录调控因子 的控制之下。转基因非人类动物可以应用本领域任何已知的方法设计和产生;参 见,如,美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541; 5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933; 5,387,742;5,087,571,它们描述了制造和应用转化的细胞和卵以及转基因大鼠、 小鼠、兔、羊、猪和牛。也参见,如,Pollock(1999)J.Immunol.Methods 231:147-157, 描述了在转基因奶牛动物的牛奶中生产重组蛋白;Baguisi(1999)Nat.Biotechnol. 17:456-461,描述了转基因山羊的生产。美国专利6,211,428,描述了制备和应用在 其脑中表达含有DNA序列的核酸构建物的转基因非人类哺乳动物。美国专利 5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中,移植 注射的卵至假孕的雌鼠中,并且生长成为转基因鼠,它的细胞表达与阿尔茨海默 氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因鼠,它的 基因组具有编码淀粉样蛋白原(APP)的基因的断裂。
[00424]“基因敲除动物(Knockout animals)”也可以用于实践本发明的方 法。例如,在一方面,本发明的转基因动物或者改进的动物包括“基因敲除动物”, 如“基因敲除鼠”,它被工程改造,不会表达某种内源基因,取而代之的是,表达可 以表达本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶或者包含本发明的聚糖酶、甘 露聚糖酶或木聚糖酶的融合蛋白的基因。
转基因植物和种子
[00425]本发明提供了包含本发明的核酸、多肽(例如葡聚糖酶、甘露聚 糖酶或木聚糖酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转 基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如葡聚糖酶、 甘露聚糖酶或木聚糖酶)的植物产物,如油、种子、叶、提取物以及类似物。转 基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也 提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植 物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利 6,309,872。
[00426]本发明的核酸和表达构建物可以通过任何方式导入到植物细胞 中。例如,核酸或者表达构建物可以导入到所需的植物宿主的基因组中,或者, 核酸或者表达构建物可以是附加体。可以导入到所需植物的基因组中,这样宿主 的葡聚糖酶、甘露聚糖酶或木聚糖酶的产生被内源性的转录或者翻译控制元件调 控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的基因序列的插入破 坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的,参见,如, Strepp(1998)Proc Natl.Acad.Sci.USA 95:4368-4373;Miao(1995)Plant J 7: 359-365。参见下面的转基因植物的讨论。
[00427]本发明的核酸可以将所需的性质赋予基本上任何植物,例如产淀 粉的植物,如马铃薯、小麦、水稻、大麦等。本发明的核酸可以用于操作植物的 代谢途径,以优化或者改变宿主的葡聚糖酶、甘露聚糖酶或木聚糖酶的表达。这 可以改变葡聚糖酶、甘露聚糖酶或木聚糖酶活性。可选择地,本发明的葡聚糖酶、 甘露聚糖酶或木聚糖酶可以在转基因植物的生产中被应用,以产生该植物不能天 然产生的化合物。这可以降低生产成本或者产生一种新的产物。
[00428]一方面,生产转基因植物的第一步包括制备在植物细胞中表达的 表达构建物。这些技术在本领域是被熟知的。它们可以包括选择和克隆启动子、 便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。典型的组 成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表 达。其它的启动子是更特异的,并且对植物的内部或者外部环境中的暗示有反应。 典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。
[00429]一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发 明的序列很可能具有比在植物中更高的A-T核苷酸对百分率,而一些植物优选G-C 核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改 变氨基酸序列,可以增强在植物细胞中基因产物的产生。
[00430]为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将 选择性标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成 基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。 选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生 素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经 整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰 当的功能,标记基因也需要启动子和终止序列。
[00431]一方面,制备转基因植物或者种子包括将本发明的序列以及可选 择的标记基因整合到目标表达构建物(如,质粒)中,同时设置启动子和终止序 列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如,构建物可以 应用如电击转化和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组 DNA中,或者构建物可以应用弹道方法(ballistic methods),如,DNA微粒轰击 (DNA particle bombardment)的方法直接引入到植物组织中。例如,参见如, Christou(1997)Plant Mol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol. 6:17-30;Klein(1987)Nature 327:70-73;Talcumi(1997)Genes Genet.Syst.72: 63-69,讨论了应用微粒轰击引入转基因到小麦中;Adam(1997)如上,应用微粒 轰击引入YACs至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生 转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明;而且,可 以买到BioRad(Biolistics)PDS-2000微粒加速设备;也参见,John,美国专利 5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。
[00432]一方面,原生质体可以被固定,并用核酸例如表达构建物注射。 尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原 生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基 因枪技术用裸DNA转化,其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上,射出物的大小为细胞大小的1/100,它携带DNA深入到细胞 和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一 技术已经在包括玉米和水稻的几个谷类物种中成功应用。
[00433]核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。 植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997) Plant Mol.Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genes in plants”,Mol.Biotechnol.5:209-221。
[00434]可选择地,核酸,如表达构建物,可以与合适的T-DNA旁侧区域 组合,并导入到传统的根癌农杆菌宿主载体中。根癌农杆菌宿主的毒力功能将在 植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根 癌农杆菌介导的转化技术,包括解毒(disarming)和二元载体的应用,在科学文 献中有详细的说明。参见,如,Horsch(1984)Science 233:496-498;Fraley(1983) Proc.Natl.Acad.Sci.USA 80:4803(1983);Gene Transfer to Plants,Potrykus,ed. (Springer-Verlag,Berlin 1995)。根癌农杆菌细胞的DNA被包含在细菌染色体中, 也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为 T-DNA的DNA(~20kb长)和一系列vir(毒力(virulence))基因,T-DNA在感 染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根癌农杆菌可以 通过伤口感染植物:当一种植物的根或者茎受伤,它释放某种化学信号,作为对 这种信号的响应,根癌农杆菌的毒力基因被激活,并引发一系列从Ti质粒转移 T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个 推测是T-DNA一直等到植物DNA复制或者转录,然后将自身插入到暴露的植物 DNA中。为了应用根癌农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部 分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区 域之间,从这里转移到植物细胞并且整合到植物的染色体中。
[00435]本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的 单子叶植物的转化,参见Hiei(1997)PlantMol.Biol.35:205-218。也参见如,Horsch, Science(1984)233:496;Fraley(1983)Proc.Natl Acad.Sci USA 80:4803;Thykjaer (1997)如上;Park(1996)Plant Mol.Biol.32:1135-1148,讨论了将T-DNA整合 到基因组DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或 者其它单子叶植物的细胞中的具有功能性的基因的DNA的稳定整合过程。
[00436]一方面,第三步可以包括能够将整合的靶基因传递至下一代的完 整植物的选择和再生。这样的再生技术依赖于对组织培养生长培养基中的某些植 物激素的操作,典型地,依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草 剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等, Protoplasts lsolation and Culture,Handbook of Plant Cell Culture,124-176页, MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of Plants, Plant Protoplasts,21-73页,CRC Press,Boca Raton,1985。再生也可以从植物愈伤组 织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev. of plant Phys.38:467-486中有总体的说明。为了从转基因组织如未成熟的胚胎获得 整个植物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件 下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评价 子代。
[00437]在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂 交(sexual crossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依 赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的 重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子 可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的 杂交。当两个亲本植物都表达本发明的多肽(如,葡聚糖酶、甘露聚糖酶、或木 聚糖酶)时,所需的效应(例如,表达本发明的多肽来产生一种开花行为被改变 的植物)可以增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。
[00438]本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。 本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因 植物的例子是草,如牧草(蓝草,早熟禾属Poa),饲料草如羊茅属,黑麦草属, 温带草,如翦股颖属(Agrostis),和谷类,如,小麦、燕麦、黑麦、大麦、水稻、 蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草,豆类,如羽扇豆, 马铃薯,甜菜,豌豆,蚕豆和大豆,以及十字花科植物(Brassicaceae),如花椰菜, 油菜籽,和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样,本发明的转 基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的物种:腰果属 (Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕 麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、 Carthamus、椰子(Cocos)、咖啡(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、 Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属 (Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣 属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄 属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属 (Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属 (Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、 萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、 Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属 (Triticum)、野豌豆属(Vicia)、Vitis、Vigna、和玉蜀黍属(Zea)。
[00439]在可供选择的实施方式中,本发明的核酸在含有纤维细胞的植物 中表达,包括,如,棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、 balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可供选择的实 施方式中,本发明的转基因植物可以是棉属(Gossypium)的成员,包括任何棉种 (Gossypium)的成员,如,亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛 棉(G.barbadense)和陆地棉(G.hirsutum)。
[00440]本发明也提供用于大量生产本发明的多肽(例如葡聚糖酶、甘露 聚糖酶或木聚糖酶或抗体)的转基因植物。例如,参见Palingren(1997)Trends Genet. 13:348;Chong(1997)Transgenic Res.6:289-296(利用植物生长素诱导的双向甘 露氨酸合成酶(mas1′,2′)启动子,应用根癌农杆菌介导的叶盘(leafdisc)转化方 法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。
[00441]应用已知的程序,技术人员可以通过检测在转基因植物中转基因 mRNA或者蛋白的增加或者减少来筛选本发明的植物。检测和定量mRNA或者蛋 白的方法在本领域是被熟知的。
多肽和肽
[00442]一方面,本发明提供了与本发明的示范性序列有着序列同一性(例 如,至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、 61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、 74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更多或完全的(100%)的序列同一性)的分离的、合成的或重组的多肽,所述 的本发明的示范性序列例如具有在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、 SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、 SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、 SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、 SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、 SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、 SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、 SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、 SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、 SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、 SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、 SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132;SEQ ID NO:134; SEQ ID NO:136;SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144; NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、 SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、 SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、 SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、 SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、 SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、 SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、 SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、 SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、 SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO-306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、 SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、 SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、 SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、 SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:384、SEQ ID NO:386、SEQ ID NO:388、 SEQ ID NO:390、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:398、SEQ ID NO:400、SEQ ID NO:402、SEQ ID NO:404、SEQ ID NO:406、 SEQ ID NO:408、SEQ ID NO:410、SEQ ID NO:412、SEQ ID NO:414、SEQ ID NO:416、SEQ ID NO:418、SEQ ID NO:420、SEQ ID NO:422、SEQ ID NO:424、 SEQ ID NO:426、SEQ ID NO:428、SEQ ID NO:430、SEQ ID NO:432、SEQ ID NO:434、SEQ ID NO:436、SEQ ID NO:438、SEQ ID NO:440、SEQ ID NO:442、 SEQ ID NO:444、SEQ ID NO:446、SEQ ID NO:448、SEQ ID NO:450、SEQ ID NO:452、SEQ ID NO:454、SEQ ID NO:456、SEQ ID NO:458、SEQ ID NO:460、 SEQ ID NO:462、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:468、SEQ ID NO:470、SEQ ID NO:472、SEQ ID NO:474、SEQ ID NO:476、SEQ ID NO:478、 SEQ ID NO:480、SEQ ID NO:482、SEQ ID NO:484、SEQ ID NO:486、SEQ ID NO:488、SEQ ID NO:490、SEQ ID NO:492、SEQ ID NO:494、SEQ ID NO:496、 SEQ ID NO:498、SEQ ID NO:500、SEQ ID NO:502、SEQ ID NO:504、SEQ ID NO:506、SEQ ID NO:508、SEQ ID NO:510、SEQ ID NO:512、SEQ ID NO:514、 SEQ ID NO:516或SEQ ID NO:518中所示的序列的蛋白。在一个方面,所述多肽 具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性,例如可水解多糖内的糖苷键,例如 葡聚糖内的糖苷键。在一个方面,多肽具有葡聚糖酶、甘露聚糖酶或木聚糖酶活 性,包括可催化1,4-β-D-糖苷键或β-1,3-糖苷键。在一个方面,内切葡聚糖酶活性 包括内-1,4-β-内切葡聚糖酶活性。在一个方面,内切葡聚糖酶活性包括水解葡聚糖 产生更小分子量的葡聚糖或葡聚糖-寡聚体。在一个方面,葡聚糖包括包括β-葡聚 糖,诸如水溶性β-葡聚糖。
[00443]由本发明多核苷酸编码的酶包括但不限于水解酶,诸如葡聚糖酶, 例如内切葡聚糖酶,甘露聚糖酶或木聚糖酶。图5是概述本发明的若干示范性酶 在各种条件下,例如变化的pH和温度条件下的相对活性的表格。在图5中:ND= 未测定;*pH或温度的最适值未被测定,但是在指示pH和/或温度下对酶活性进 行了测定;1热稳定性,酶保留显著活性(约>50%)的时间,或酶在指定的温度中失 去它50%的活性(t1/2)的时间;2RA=各自相对于最适pH和温度中的活性,在pH 2.6、4.0、5.5、7.0、8.0、9.0或25℃、37℃、50℃、65℃、75℃、85℃下的相对 活性;3RA,就最适pH而言,在pH 3.75、5、5.3、6.25、7下;和就最适温度而 言,在40、55、70、90℃时的相对活性;4BBG=大麦-β-葡聚糖,CMC=羧甲基纤 维素。葡聚糖酶的家族分类描述于下。
[00444]在一个方面,本发明的酶也可以具有甘露聚糖酶活性,例如它能 够降解(或水解)甘露聚糖。含有甘露聚糖的多糖是在硬木和软木以及许多豆科 种子的胚乳和一些非-豆科植物的成熟种子中的半纤维素部分的主要成分。在一个 方面,本发明的甘露聚糖酶水解甘露聚糖、葡甘露聚糖、半乳甘露聚糖和半乳葡 甘露聚糖中的β-1,4键(甘露聚糖是具有由β-1,4键连接的甘露糖组成的主架的多 糖,葡甘露聚糖是具有由或多或少规则交替的β-1,4键连接的甘露糖和葡萄糖组成 的主架的多糖)。例如,在一个方面,多肽具有SEQ ID NO:454中示出的序列,由 例如SEQ ID NO:453编码,具有木聚糖酶、葡聚糖酶和甘露聚糖酶活性。测定甘 露聚糖酶活性的方法是本领域公知的,参见例如美国专利申请20030215812; 20030119093;美国专利5,661,021;5,795,764;6,376,445;6,420,331。测定木聚糖 酶活性的方法是本领域公知的,参见例如美国专利申请5,693,518;5,885,819; 6,200,797;6,586,209;6,682,923。
[00445]本发明也提供了嵌合多肽(和编码它们的核酸),该嵌合多肽包 括至少两个本发明的酶或它们的亚序列,例如活性位点,或催化位点(CDs)。本发 明的嵌合蛋白质(例如融合蛋白质,或其他杂合二聚体,例如利用其他方式例如 连接键或静电的方式结合在一起的两结构域)可以包括本发明的一个多肽(例如 活性位点或催化位点)和本发明的另一种多肽(例如活性位点或催化区域肽 (catalytic domainpe ptide))或其他多肽。例如,本发明的嵌合蛋白质可以具有甘 露聚糖酶和木聚糖酶活性,甘露聚糖酶和葡聚糖酶活性等。在一个方面,本发明 的嵌合蛋白质包括结构域的融合,例如单个结构域可以显示出葡聚糖酶/木聚糖酶/ 甘露聚糖酶活性或任何活性的组合。
[00446]本发明提供了具有同样的新颖性的葡聚糖酶,这是因为它们最初 来自类似的“糖苷酶水解酶”家族。糖苷酶水解酶最初在1991年分类为一个家族, 参见例如Henrissat(1991)Biochem,.J.280:309-316。从那以来,该分类不断升级, 参见例如Henrissat(1993)Biochem.J.293:781-788;Henrissat(1996)Biochem.J.316: 695-696;Henrissat(2000)Plant Physiology 124:1515-1519。现有约87个鉴定的糖 苷酶水解酶家族。在一个方面,本发明的葡聚糖酶被分入家族例如家族3、5、6、 8、9、12和16,如下表2所示。
表2
SEO ID NO:      家族
    1,2          5
101,102          16
103,104          5
105,106          5
107,108          5
109,110          5
  11,12          8
111,112          5
113,114          16
115,116          5
117,118          5
119,120          16
121,122          12
123,124          8
125,126          16
127,128          5
129,130          5
  13,14          8
131,132          9
133,134          8
135,136          5+CBD
137,138          5
139,140          8
141,142          9
143,144          5
145,146          5+CBD+SLH
147,148          5+CBD+SLH
149,150          5
  15,16          3
151,152          16
153,154          5
155,156          9+CBD
157,158          16
159,160          16
161,162          16
163,164          9
165,166          5
167,168          5
169,170          5
  17,18          9和1
171,172          16
173,174          16
175,176            5
177,178            16
179,180            5+CBD
181,182            16
183,184            8
185,186            NA
187,188            8和1
189,190            5
  19,20            5
191,192            16
193,194            5
195,196            16
197,198            16
199,200            16
201,202            5
203,204            3
205,206            5
207,208            5
209,210            16
  21,22            12
211,212            8
213,214            16
215,216            6
217,218            16
219,220            5
221,222            5
223,224            5
225,226            8
227,228            5+CBD
229,230            5
  23,24            12
231,232            5
233,234            5
235,236            5
237,238            6
239,240            NA+CBD
241,242            5
245,246            9
247,248            8
249,250            5
  25,26            8
251,252            9+CBD
253,254            5
255,256            5
257,258            9
259,260            5
261,262            5
263,264            1+CBD
265,266            NA
267,268            5
269,270            9
  27,28            8
271,272             9
273,274             48+CBD
275,276             8
277,278             3
279,280             5
281,282             9
283,284             5
285,286             5
287,288             6
289,290             8
  29,30             9
291,292             8
293,294             6
295,296             9+DOCR
297,298             9
299,300             5
    3,4             8
301,302             5
303,304             9+CBD
305,306             5
307,308             5
309,310             10
  31,32             5
311,312             5
313,314             5
315,316             5
317,318             5
319,320             5
321,322             5
323,324             5
325,326             5
327,328             5
329,330             9+CBD
  33,34             8
333,334             5
335,336             6
337,338             5
339,340             6
341,342             5
343,344             5
345,346             6
347,348             5
349,350             5
  35,36             12
351,352             5+CBD
353,354             12
355,356             5+CBD
357,358             5
359,360             5
361,362             5
363,364             CBD
365,366             5
367,368             5
369,370             5
  37,38             5和/或6
371,372             5
373,374             5
375,376             9
377,378             5
379,380             3
381,382             9
383,384             5
385,386             8
387,388             5
389,390             9
  39,40             5
391,392             9
395,396             8
397,398             3
399,400             5
401,402             5或6+CDB
403,404             5
405,406             5
407,408             5
409,410             5
  41,42             12
411,412             5
413,414             6
415,416             9+CBD
417,418             5
419,420             5
421,422             5
423,424             9
425,426             44
427,428             5
429,430             3
  43,44             16
431,432             9
433,434             6
435,436             5
437,438             5
439,440             5
441,442             9
443,444              NA
445,446             NA
447,448             26
449,450             5+DOCR
  45,46             9
451,452             5
453,454             5和26
455,456             1
457,458             5
459,460             9
461,462             5
463,464             5
465,466             5
467,468             10
469,470             5
  47,48             8
471,472             16
473,474             5
475,476             5
477,478             11
481,482             5
483,484             16
485,486             16
487,488             12
489,490             5
  49,50             5
491,492             11
493,494             16
495,496             5
497,498             16
499,500             16
    5,6             5
501,502             1
503,504             5
505,506             5
507,508             1
509,510             5
  51,52             5
511,512             26
513,514             26
515,516             5
517,518             3
  53,54             5
  55,56             5
  57,58             9
  59,60             16
  61,62             12
  63,64             16
  65,66             16
  67,68             9
  69,70             5
    7,8             9
  71,72             16
  73,74             5
  75,76             12
  77,78             5
  79,80             CBD
  81,82             16
  83,84             5
  87,88             16
  89,90             16
   9,10             5
  91,92             3
93,94      6
95,96      16
97,98      5
99,100     16
[00447]本发明的多肽包括活性或非活性形式的葡聚糖酶、甘露聚糖酶或 木聚糖酶。例如,本发明的多肽包括在“成熟”或前体序列(prepro sequences)加工 之前的原蛋白(proproteins),所述的加工例如通过原蛋白加工酶,如可以产生“活 性”成熟蛋白的原蛋白转变酶进行的加工。本发明的多肽包括为其它原因而失活的 葡聚糖酶、甘露聚糖酶或木聚糖酶,例如未通过翻译后加工事件进行“活化”的木聚 糖酶,所述的翻译后加工事件例如内肽酶或外肽酶或蛋白酶作用、磷酸化事件、 酰胺化、糖基化或硫酸化、二聚化事件和类似作用。本发明的多肽包括所有的活 性形式,包括活性子序列,例如葡聚糖酶、甘露聚糖酶或木聚糖酶的催化结构域 或活性位点。
[00448]鉴定“前体(prepro)”结构域序列和信号序列的方法在本领域中是 为人所熟知的,见,例如Van de Yen(1993)Crit.Rev.Oncog.4(2):115-136。例如, 为了鉴定前体序列,蛋白从细胞外空间纯化出来,测定N-末端蛋白序列,并与未 加工的形式进行比较。
[00449]本发明包括具有或没有信号序列和/或前体序列的多肽。本发明提 供了具有异源的信号序列和/或前体序列的多肽。所述前体序列(包括用作异源前 体结构域的本发明序列)可位于蛋白的氨基末端或羧基末端。本发明也包括构成 本发明的序列的分离出的或重组的信号序列、前体序列和催化结构域(例如,“活 性位点”)。
[00450]一定百分数的同一性可以是在所述多肽的全长范围,或者,所述 同一性可以是在至少大约50、60、70、80、90、100、150、200、250、300、350、 400、450、500、550、600、650、700或者更多残基的范围。本发明的多肽也可以 比示范性多肽的全长短。在可供选择的方面,本发明提供大小范围在大约5至多 肽例如一种酶,如葡聚糖酶、甘露聚糖酶或木聚糖酶的全长之间的多肽(肽,片 段),典型的大小为大约5、10、15、20、25、30、35、40、45、50、55、60、65、 70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、 500、550、600、650、700或者更多的残基,如本发明的示范性的葡聚糖酶、甘露 聚糖酶或木聚糖酶的连续残基。
[00451]本发明的肽(例如,本发明的示范性多肽的子序列)可以用作, 例如标记探针,抗原、耐受原、模体、葡聚糖酶、甘露聚糖酶或木聚糖酶活性位 点(例如,“催化结构域”)、信号序列和/或前体结构域。
[00452]本发明的多肽和肽可以是从天然的来源中分离出的,可以是合成 的,或者是由重组产生的多肽。肽和蛋白可以在体外或者在体内重组表达。本发 明的肽和多肽可以应用本领域任何已知的方法来制备和分离,本发明的多肽和肽 也可以部分或者全部由本领域已知的化学方法合成。参见如,Caruthers(1980) Nucleic Acids Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser. 225-232;Banga,A.K.,Therapeutic Peptides and Proteins,Formulation,Processing and Delivery Systems(1995)Technomic Publishing Co.,Lancaster,PA。例如,肽的合成 可以应用各种固相技术来进行(参见,如,Roberge(1995)Science 269:202;Metrifield (1997)Methods Enzymol.289:3-13),还可以实现自动合成,如,按照制造商提 供的说明书,应用ABI 431 A肽合成仪(Perkin Elmer)进行合成。
[00453]本发明的肽和多肽也可以是糖基化的,所述糖基化可以在翻译后 通过化学方法或者通过细胞的生物合成机制而加上,其中后者包括应用已知的糖 基化模体,所述糖基化模体可以是天然序列,或者是作为肽段而被加入的,或者 是在核酸编码序列中加入的。糖基化作用可以是O-连接的或者是N-连接的。
[00454]本发明的肽和多肽,如以上所定义的,包括所有的“模拟物 (mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物” 是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。 该模拟物或者完全由合成的非天然的氨基酸类似物组成,或者是由部分天然的肽 氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任 意数量的天然氨基酸保守取代,只要这样的取代本质上不改变该模拟物的结构和/ 或活性。对于作为保守性变异体的本发明的多肽,常规实验将确定一种模拟物是 否在本发明的范围内,即,其结构和/或功能并没有实质上的改变。因此,一方面, 如果一种模拟化合物具有木聚糖酶活性,那么它在本发明的范围内。
[00455]本发明的多肽模拟化合物可以含有非天然结构组分的任何组合。 在可供选择的方面,本发明的模拟化合物包括以下三种结构基团中的一种或所有: a)不是天然酰胺键(“肽键”)连接的残基连接基团;b)取代天然发生的氨基酸残 基的非天然残基;或者c)诱导二级结构拟态(mimicry)的残基,即是,诱导或 者稳定二级结构,如β转角、γ转角、β折叠、α螺旋构象,等等。例如,当一个 多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时,本发明的该多 肽可以作为模拟物来表征。各个肽模拟物残基可以通过肽键、其它的化学键或者 偶联方式连接,如,通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N′- 二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以替代 传统的酰胺键(“肽键”)连接的连接基团包括,如,基亚甲基(如,-C(=O)-CH2- 代替-C(=O)-NH-)、氨基亚甲基(CH2-NH)、次乙基、烯烃(CH=CH)、醚(CH2-O)、 硫醚(CH2-S)、四唑(CN4-)、噻唑、retroamide、硫代酰胺或者酯(参见如,Spatola (1983)在Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,第7 卷,267-357页,“Peptide Backbone Modifications”Marcell Dekker,NY)。
[00456]本发明的多肽作为模拟物时,其特征也可以是含有全部或者部分 替代了天然发生的氨基酸残基的非天然氨基酸残基。在科学和专利文献中描述了 非天然的残基;作为天然氨基酸残基的模拟物的一些典型的非天然化合物及指导 在下面有描述。芳香族氨基酸的模拟物可以通过用以下的取代来产生,如,D-或 者L-基丙氨酸;D-或者L-苯基甘氨基,D-或L-2thieneyl丙氨酸;D-或者L-1,-2, 3-或者4-芘基丙氨酸;D-或者L-3thieneyl丙氨酸;D-或者L-(2-吡啶基)-丙氨酸; D-或者L-(3-吡啶基)-丙氨酸;D-或者L-(2-吡嗪基)-丙氨酸,D-或者L-(4-异丙基)- 苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基 丙氨酸;D-或者L-p-二苯基苯基丙氨酸;D-或者L-p-甲氧基-二苯基苯基丙氨酸; D-或者L-2-吲哚(烷基)丙氨酸;和,D-或者L-烷基丙氨酸,其中的烷基可以是取 代的或者非取代的甲基、乙基、丙基、己基、丁基,戊基、异丙基、异丁基、sec-isotyl、 异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括,如噻唑基、苯硫基、吡 唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。
[00457]酸性氨基酸的模拟物可以通过用以下的取代来产生,如,保持有 负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链(如,天冬 氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的 修饰,所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮 鎓-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应 转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了 赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的 取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分) 可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为 相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一 种或者多种常规试剂在优选为碱性的条件下反应而产生,所述的常规试剂包括如 苯乙二醛、2,3-丁二酮、1,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪 氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四 硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基 模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相 应的胺反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也 可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸;氯乙酰磷 酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p- 氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-1,3-二唑反应而产 生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟 物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过 与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯氢化物、三硝 基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应 而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的 模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3- 或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基 与例如二乙基原碳酸酯或者对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包 括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰 的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的α氨基基团的 甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰 胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的 酰胺化而产生的模拟物。
[00458]本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或 者肽模拟物残基)替代。因此,任何天然发生的L-构型(也可以被称为R或者S, 取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的 氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者 S-型。
[00459]本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化, 酰化以及类似作用)或者化学修饰技术修饰本发明的多肽的方法,以及得到的被 修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和 氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或 者不同的水平在几个位点处发生。一个多肽也可以具有很多类型的修饰。修饰包 括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价 连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍 生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成 共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作 用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧 化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、 硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。 参见,如,Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H. Freeman和Company,New York(1993);Posttranslational Covalent Modification of Proteins,B.C.Johnson,Ed.,Academic Press,New York,11-12页(1983)。
[00460]固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这 样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J. Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页),并且 这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利 用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它们让肽 合成在多个“杆(rods)”或者“钉(pins)”的顶端进行,而所有的“杆”或者“钉”都 被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到另 一个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸 附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插 入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的 FMOC肽合成系统是可利用的。例如,应用Applied Biosystems,Inc.的Model 431ATM 自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽 容易获得,或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起 来的合成。
[00461]本发明包括具有或不具有信号的本发明的葡聚糖酶、甘露聚糖酶 或木聚糖酶。含有本发明的信号序列的多肽可以是本发明的葡聚糖酶或另一种葡 聚糖酶或另一种酶或其它的多肽。
[00462]本发明包括固定化的葡聚糖酶、甘露聚糖酶或木聚糖酶、抗葡聚 糖酶、甘露聚糖酶或木聚糖酶抗体及其片段。本发明提供了抑制葡聚糖酶、甘露 聚糖酶或木聚糖酶活性的方法,例如使用显性负突变体或本发明的抗葡聚糖酶、 甘露聚糖酶或木聚糖酶抗体。本发明包括杂合物,例如融合蛋白、异源二聚体等, 其中含有本发明的葡聚糖酶。
[00463]本发明的多肽可以在各种条件下具有葡聚糖酶、甘露聚糖酶或木聚 糖酶活性,例如在极端pH和/或温度、氧化剂和类似的条件下。本发明提供了产生 可选择的各种葡聚糖酶、甘露聚糖酶或木聚糖酶制备物的方法,它们例如对于温度、 氧化剂和变化的清洗条件具有不同的催化效率和稳定性。在一个方面,葡聚糖酶、 甘露聚糖酶或木聚糖酶变异体可使用定点诱变和/或随机诱变的技术来产生。在一个 方面,定向进化可用来产生极大量的葡聚糖酶、甘露聚糖酶或木聚糖酶变异体,它 们具有各种特异性和稳定性。
[00464]本发明的蛋白也可用作鉴定葡聚糖酶、甘露聚糖酶或木聚糖酶调节 物——例如葡聚糖酶、甘露聚糖酶或木聚糖酶活性的激活物或抑制物——的研究试 剂。简言之,将受测样品(化合物、肉汤、提取物等)加入至葡聚糖酶、甘露聚糖 酶或木聚糖酶分析中以确定其抑制底物裂解的能力。以这种方式鉴定的抑制物可用 于工业和研究中以降低或防止不需要的蛋白水解。对于葡聚糖酶、甘露聚糖酶或木 聚糖酶,抑制物可被组合在一起以增加活性谱(spectrum of activity)。
[00465]本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例 如,为了使用例如自动测序仪进行测序,可以使用葡聚糖酶、甘露聚糖酶或木聚糖 酶将多肽破碎成更小的片段。
[00466]本发明也提供了应用本发明的核酸、多肽和抗体来发现新的葡聚 糖酶、甘露聚糖酶或木聚糖酶的方法。一方面,筛选噬粒文库,基于表达来发现 葡聚糖酶、甘露聚糖酶或木聚糖酶。另一方面,筛选λ噬菌体文库,基于表达来 发现葡聚糖酶、甘露聚糖酶或木聚糖酶。通过筛选噬菌体或噬粒文库,可以检测 到毒性克隆;更方便地利用底物;减少工程改造宿主的需要,绕过由文库中大的 切除带来任何偏差的可能性;以及获得在低克隆密度下更快的生长速率。噬菌体 或噬粒文库的筛选可以是在液相中或者固相中。一方面,本发明提供了在液相中 的筛选。与固相筛选相比,这给予了分析条件上的更大灵活性;额外底物的可行 性;对于弱的克隆的更高灵敏性;和固相筛选更容易进行的自动化。
[00467]本发明提供了使用本发明的蛋白和核酸以及机器人自动化来进行 筛选的方法,机器人自动化使得在例如一天的短时间内能进行数千个生物催化反应 和筛选分析,并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。 结果,衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的 进一步教导,参见PCT/US94/09174。
[00468]本发明的另一个方面是分离出的或纯化的多肽,其含有本发明的序 列,或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连 续氨基酸的片段。如上所述,这样的多肽的获得可通过将编码多肽的核酸插入进载 体中,这样,所述编码序列可操作性地连接于能够在合适的宿主细胞中驱动被编码 的多肽表达的序列。例如,表达载体可含有启动子、启动翻译的核糖体结合位点和 转录终止子。载体也包括用于扩增表达的合适序列。
[00469]本发明的另一个方面是多肽或其片段,其与本发明多肽或含有其至 少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有 至少大约50%、至少大约55%、至少大约60%、至少大约65%、至少大约70%、至 少大约75%、至少大约80%、至少大约85%、至少大约90%、至少大约95%或超过 大约95%的序列同一性(同源性)。序列同一性(同源性)可以使用上述的任何程序 来确定,它们可比对被比较的多肽或片段,并确定它们之间的氨基酸同一性或相似 性程度。要理解的是,氨基酸等同、或同一性或“同源性”包括保守的氨基酸取代, 如上述的那些取代。
[00470]与本发明多肽的一种多肽或含有其至少大约5、10、15、20、25、 30、35、40、50、75、100或150个连续氨基酸的片段具有同源性的多肽或片段,可 使用上述的技术通过分离编码它们的核酸而获得。
[00471]可选择的,通过生物化学富集或纯化步骤可获得同源的多肽或片 段。通过木聚糖水解酶消化、凝胶电泳和/或微测序可以确定潜在同源的多肽或片段 的序列。预期的同源多肽或片段的序列可使用上述的任何程序,与本发明多肽的一 个多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个 连续氨基酸的片段相比较。
[00472]本发明的另一个方面是用于鉴定本发明的片段或变异体的分析方 法,所述片段或变异体保留了本发明多肽的酶功能。例如所述多肽的片段或变异体 可用来催化生物化学反应,这样的反应表明所述片段或变异体保留了本发明多肽的 酶活性。
[00473]用于确定变异体的片段是否保留了本发明多肽的酶活性的分析方 法包括步骤:将多肽片段或变异体与底物分子在允许该多肽片段或变异体发挥作用 的条件下接触,并检测底物水平的降低或该多肽和底物之间反应的特异反应产物水 平的增加。
[00474]本发明多肽或含有其至少5、10、15、20、25、30、35、40、50、 75、100或150个连续氨基酸的片段可用于许多的应用领域中。例如,所述多肽或其 片段可用来催化生物化学反应。根据本发明的一个方面,提供了一个过程,其中应 用本发明多肽或编码这样的多肽的多核苷酸来水解糖苷键。在这样的过程中,含有 糖苷键的底物(例如,淀粉)与本发明多肽,与其实质上相同的序列在可促进糖苷 键水解的条件下接触。
[00475]本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的 或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特 定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反 应条件是对于存在于很多起始化合物中的功能基团具有特异性的。每种生物催化剂 对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有这一功能基 团的许多起始化合物反应。
[00476]生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。 这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过 生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。
[00477]酶可以在起始化合物的特定位点发生反应而不影响分子的其它部 分,该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于 在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列生物 催化反应来表征,这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物 合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序,并确认 合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法,并不需要 固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。 一方面,酶反应在功能基团上的高度特异性允许“追踪”特定的酶促反应,由所述酶 促反应制备出了生物催化产生的文库。
[00478]许多程序化的步骤可使用自动化机器人来实施,这使得每天可执行 数千个生物催化反应和筛选分析,并保证高水平的准确性和可重复性。结果,在大 概几周内便产生了衍生化合物的文库,而采用现今的化学方法则需要几年的时间。
[00479]在一个特定的方面,本发明提供了修饰小分子的方法,包括将在此 所述的由多核苷酸编码的多肽或其酶活性片段与小分子接触,产生修饰的小分子。 检测被修饰的小分子的文库以确定显示出所需活性的修饰小分子是否存在于文库 内。产生具有所需活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地 去除用来产生一部分文库的每个生物催化反应,然后检测在这一部分文库中产生的 小分子是否存在具有所需活性的修饰小分子。产生具有所需活性的修饰小分子的特 异生物催化反应可选择性地被重复。生物催化反应可用一组生物催化剂来进行,它 们可与在小分子的结构中发现的各种不同结构部分反应,每个生物催化剂对一个结 构部分或一组相关的结构部分是特异的;每个生物催化剂可与含有各种不同的结构 部分的许多不同的小分子反应。
信号序列、前体和催化结构域
[00480]本发明提供了葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列(例如, 信号肽(SP))、前体结构域(prepro domains)和催化结构域(CD)(例如活性位点)。 本发明的SP、前体结构域和/或CD可以是分离出的或重组的肽,或是融合蛋白的一 部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CD)、 前体结构域和信号序列(SP,例如,具有由本发明多肽的氨基末端残基组成的序列/ 含有本发明多肽的氨基末端残基的序列的肽)的核酸。在一个方面,本发明提供了 信号序列(signal sequence),其包括的肽含有本发明多肽的残基1至15、1至16、1 至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1 至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1 至35、1至36、1至37、1至38、1至39、1至40、1至41、1至42、1至43、1 至44中所示的序列或由其组成。
[00481]在一个方面,本发明也提供了嵌合多肽(和编码它们的核酸),该 嵌合多肽包括至少两个本发明的酶或它们的亚序列,例如活性位点,或催化位点 (CDs)。例如,本发明的嵌合蛋白质可以具有甘露聚糖酶和木聚糖酶活性,甘露聚糖 酶和葡聚糖酶活性等。在一个方面,本发明的嵌合蛋白质包括结构域的融合,例如 单个结构域可以显示出葡聚糖酶/木聚糖酶/甘露聚糖酶活性或任何活性的组合(例如 重组嵌合蛋白质)。
[00482]本发明也提供了分离的、合成的或重组的信号序列,该信号序列 或者包括本发明的信号序列,例如下表3中示出的示范性信号序列,或者由本发 明的信号序列,例如下表3中示出的示范性信号序列组成,本发明也提供了包括 这些信号序列的多肽。多肽可以是本发明另一葡聚糖酶、甘露聚糖酶或木聚糖酶, 其他葡聚糖酶、甘露聚糖酶或木聚糖酶,另一糖苷酶或水解酶,或另一类型的酶 或多肽。例如,阅读表3,本发明提供了SEQ ID NO:102的残基1至21示出的分 离的、合成的或重组的信号序列,其在一个方面由例如SEQ ID NO:101的亚序列 编码;或在本发明提供了SEQ ID NO:104的残基1至30示出的分离的、合成的或 重组的信号序列,其在一个方面由例如SEQ ID NO:103的亚序列编码,等。
表3
SEQ ID NO:信号(AA) 预测的信号序列
101,102    1-21
103,104    1-30
105,106    1-33
107,108    1-18
109,110    1-25
  11,12    1-25
111,112    1-39
113,114    1-24
115,116    1-21
117,118    1-29
121,122    1-24
123,124    1-30
125,126    1-19
127,128    1-22
129,130    1-40
  13,14    1-22
133,134    1-34
135,136    1-53
137,138    1-37
139,140    1-22
141,142    1-32
143,144    1-29
145,146    1-29
147,148    1-29
149,150    1-30
  15,16    1-44
151,152    1-22
153,154    1-24
155,156    1-21
157,158    1-38
159,160    1-34
161,162    1-19
163,164    1-19
165,166    1-51
169,170    1-22
171,172    1-22
173,174    1-19
175,176    1-19
177,178    1-26
179,180    1-71
181,182          1-35
183,184          1-22
185,186          1-17
187,188          1-22
  19,20          1-68
191,192          1-20
193,194          1-29
199,200          1-22                    MKTKLISTLVAGLIVISPATYA
201,202          1-32
203,204          1-27
205,206          1-34
207,208          1-28
209,210          1-22
  21,22          1-34
211,212          1-22
213,214          1-22
215,216          1-42
217,218          1-23
219,220          1-27
221,222          1-29
223,224          1-31
225,226          1-29
227,228          1-22                    MTSKHFFKITLMSILLFTTTLA
229,230          1-25                    MKRRNWNYLLIILLVISAFTLISAQ
  23,24          1-22
235,236          1-19                    MKSVLALALIVSINLVLLA
237,238          1-29                    MTRRSIVRSSSNKWLVLAGAALLACTALG
241,242          1-39                    MSSFKASAINPRMAGALTRSLYAAGFSLAVSTLSTQAYA
243,244          1-26                    MKKLLKLSMLSTSVALGIMASSGAIA
247,248          1-21                    MNVLRSGIVTMLLLAAFSVQA
  25,26          1-21
251,252          1-23                    MLKKLALAAGIAAATLAASGSHG
255,256          1-28                    MKRTGWTLKLLLAALLLLPATLGLHNGA
257,258          1-30                    MYRLFFRSLKRSGILLPVLLYFFILPSATA
269,270          1-22                    MKFTLTPLLCGFALLLGCAVQA
  27,28          1-19
271,272          1-18                    MVSMLLLTVGAVSVSAVS
273,274          1-37                    MPRLRARTRPRRQLTALAAALSLPLGLTAVGATTAQA
275,276          1-27                    MQNLFKRVFFHLLLLALLAGCAGPSPV
277,278          1-28                    MSGRSAGRGPWARLVVALAAVGALVAGA
279,280          1-38                    MQNKIINTKIKLRKFMSQLIKITYIFIIIIFCMQRTYA
281,282          1-18                    MKKLILTLFSLWAISAYA
285,286          1-27                    MRKSIRSFSILLAITFIIALLSFPAMG
287,288          1-30                    MNPRSLRRRTTAALAALAACAALLATQAQA
289,290          1-29                    MFPRLSPSRFRQVTLTLLTLGLVSLTGCA
29,30            1-19
291,292          1-16                    MKFFTVLLFFLSFVFS
293,294          1-27                    MRRRIRALVAALSALPLALVVAPSAHA
    3,4          1-25
301,302  1-17        MAIGISATMLLAMPQQA
303,304  1-30        MSCRTLMSRRVGWGLLLWGGLFLRTGSVTG
305,306  1-26        MNPKYIYRITFLLISILSMTALQSFS
                      MVWTPARSTLAGSSEIPLMTMNIFPNRKDSRMSLWIKLGILCMM
307,308  1-52        AGTVMVHG
  31,32  1-39
311,312  1-24        MKRREFMLGGAGVAALASTLGVSA
313,314  1-20        MLIIGGLLVLLGFSSCGRQA
315,316  1-32        MDKTITAKDSGKITALILIILLVLPYAGYVVA
319,320  1-29        MREIILKSGALLMVVILIVSILQILTVFA
323,324  1-32        MFQSLKMRTLSFLLLMALLASFLALPTDVAHA
325,326  1-29        MKKIILKSGILLLVVILIVSILQILPVFA
327,328  1-46        MLVYRVSIQKHLASLTVLVSLLLILAGCSSSSDSIAPVSSSSVSSA
  33,34  1-35
331,332  1-28        MNNPTNGARRGRHRRRWSATALLLGVPA
333,334  1-28        MNRTRVLSAATLLALVATLASVPVTAQA
337,338  1-29        MRNHLNVPFYFIFFFLIASIFTVCSSSTA
339,340  1-23        MNNPRILTYLLIGIVVAVLIVFA
343,344  1-31        MRKIVKQINYLTPSVLGLLVLSLFFQVPTQA
345,346  1-33        MKRTRYGVRSPRSAPRFGVLFGAAAAGVLMTGA
349,350  1-38        MNSSPVSVKKPCPVDRPNPLWAAGFSLALATLSTQTQA
351,352  1-28        MKKVSNARVLSFLLILVLIFGNLASVFA
357,358  1-32        MEKQICSNVFSTMLIIGGLLVLLGFSSCGRQA
359,360  1-22        MRRLITIILATAVAILSTTSCS
361,362  1-20        MSRGILILVMLSVLSGAALA
363,364  1-30        MRRTRSLLAGLALTAGLLTGAGAGAPPATA
                      MLGAPSPHFPMRRGMTKSQRRTWLTAVGSAIAGIAGLLLPVFAT
365,366  1-50        AGAAQA
367,368  1-42        MPHPKLLTNGGSYVSSKQKTVAIFVLFVVLAGVAGSIPASYA
  37,38  1-33
373,374  1-23        MNKILKLFSSLLLFAGICPALQA
377,378  1-30        MKMLTTLKKPLLKKTALALLTSAMVAPAFA
381,382  1-26        MRAIRLSLSIAAGAVLLLAGCTTKPA
383,384  1-28        MTMHRKLHRSIAAGALSAIFFVGLQAGA
387,388  1-25        MSIIKKVPLIFLCLLMFATSLFIFK
  39,40  1-24
393,394  1-29        MSKFLSLSNFFSLLVVCVLLGACSGGSSS
401,402  1-30        MGTSLMIKSTLTGMITAVAAAVFTTSAAFA
403,404  1-32        MGKISKYFAMFLAFLMVFSSLFVNFQPRNVQA
407,408  1-28        MRKNILMLAVAMIAAMCVTTSCGNKAQK
409,410  1-24        MTRNWLGKILAALLLAGCAIPAPA
411,412  1-24        MPYVVRLALVCAWTVLACTGAPIA
413,414  1-28        MSRHLISLGLLVVVALGAMLWISSRDVA
419,420  1-21        MLRKLILFCAVLLSMSWVALA
421,422  1-26        MKTKSIYSIAILSIALFFFTTAQTFS
423,424  1-25        MWSQDVRKVWLVGFLLLVAGMPALA
425,426  1-20        MRIRLATLALCAALSPVTFA
427,428     1-43             METPMTSARSARPRPRLRRYGIAGTALGALLLGLATLPPTATA
  43,44     1-48
431,432     1-22             MKFTLMPLLCGFALLLGCAVQA
441,442     1-26             MRAIRLSLSIAAGAVLLLAGCTTKPA
445,446     1-29             MRRFRVVFLGLFVFFGIVIASQYGQTAAA
449,450     1-25             MKKIVSLVCVLVMLVSILGSFSVVA
  45,46     1-16
457,458     1-39             MKSKTSTAAPSAGPLRNYKKLTACIAVASTALLAGSASA
459,460     1-18             MKKLILTLFSLWAISAYA
461,462     1-28             MFKHLLHVLKIGFLPLLATLLLAGHAHG
465,466     1-21             MLRKLIVSVFGFVMLTSAAAA
469,470     1-25             MKYKAIFIYLIVLILFYSINIYANA
  47,48     1-23
471,472     1-22             MKTKLISTLVAGLIVISPATYA
473,474     1-28             MKRKRVFIHSLIVFFLMIGSFTSCGSVA
475,476     1-25             MNLLAQYFSGLFLIFLISIFFVSSA
477,478     1-27             MKSIRSRSLATAVLAGALGVAAAGAQA
481,482     1-21             MKLLKLLIFLLITVIFSDVSA
483,484     1-26             MYKRLLSSVLIIMLLLSAWSPISVQA
489,490     1-23             MKYIFSYIIMMILIGFIPVYGFG
  49,50     1-42
491,492     1-26             MSMFLSLKRVAALVCVAGFGISAANA
493,494     1-28             MPYLKRVLLLLVTGLFMSLFAVTSTASA
495,496     1-29             MSSKQKTVAIFVLFVALAGVAGSIPASYA
499,500     1-17             MKKLVLVLLLFPVFILA
505,506     1-24             MKSKVKMFFAAAIVWSACSSTGYA
509,510     1-20             MPKKLLASFIALFFAANAAA
  51,52     1-38
511,512     1-21             MKKLHILLLALTAMTAFASCS
[00483]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列(SP)和/或前 体序列可以是分离出的肽,或与另一种葡聚糖酶、甘露聚糖酶或木聚糖酶或非葡聚 糖酶、甘露聚糖酶或木聚糖酶多肽连接的序列,例如形成一个融合(嵌合)蛋白。 在一个方面,本发明提供了含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶信号序 列的多肽。在一个方面,含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶信号序列 SP和/或前体序列的多肽包含与本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶异源的序 列(例如,含有本发明的SP和/或前体序列和来自另一种葡聚糖酶或非葡聚糖酶蛋 白的序列的融合蛋白)。在一个方面,本发明提供了具有异源的SP和/或前体序列的 本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶,例如具有酵母信号序列的序列。本发 明的木聚糖酶可以含有存在于载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中 的异源SP和/或前体序列。
[00484]在一个方面,本发明的SP和/或前体序列在鉴定出新的葡聚糖酶、 甘露聚糖酶或木聚糖酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位 置的通路通常被称为蛋白靶向通路(protein targeting pathways)。在所有这些靶向系 统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,称为信号 序列。这种信号序列可指引蛋白至其在细胞中的适合位置,并在转运过程中或在蛋 白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨 基末端信号序列,这些信号序列标示着它们将转位至内质网腔内。在本组中有超过 100个蛋白信号序列被确定。信号序列的长度可以从13至36个氨基酸残基。识别信 号序列的各种方法对于本领域技术人员是已知的。例如,在一个方面,新的葡聚糖 酶、甘露聚糖酶或木聚糖酶信号肽可通过称为SignalP的方法来鉴定。SignalP应用 了既可识别信号肽,又可识别其裂解位点的组合神经网络。(Nielsen等人, “Indentification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites”Protein Engineering,卷10,1,1-6页(1997))。
[00485]应该理解的是,在一些方面,本发明的葡聚糖酶、甘露聚糖酶或木 聚糖酶可以没有SP和/或前体序列,或“结构域”。在一个方面,本发明提供了缺少所 有或部分的SP和/或前体结构域的本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶。在 一个方面,本发明提供了编码来自一种葡聚糖酶、甘露聚糖酶或木聚糖酶的信号序 列(SP)和/或前体序列的核酸序列,其有效连接于一种不同的葡聚糖酶的核酸序列, 或者,可选择地,来自非葡聚糖酶、甘露聚糖酶或木聚糖酶蛋白的信号序列(SP) 和/或前体结构域是被需要的。
[00486]本发明也提供了分离出的或重组的多肽,其含有本发明的信号序列 (SP)、前体结构域和/或催化结构域(CD)和异源序列。所述异源序列是与SP、前 体结构域和/或CD(例如,与葡聚糖酶、甘露聚糖酶或木聚糖酶)天然不相关的序 列。与SP、前体结构域和/或CD天然不相关的序列可以在SP、前体结构域和/或CD 的氨基末端、羧基末端,和/或SP和/或CD的两个末端上。在一个方面,本发明提 供了分离出的或重组的多肽,其包括(或构成于)含有本发明的信号序列(SP)、前 体结构域和/或催化结构域(CD)的多肽,另外的条件是它同与其天然相关的任何序 列(例如,葡聚糖酶、甘露聚糖酶或木聚糖酶序列)是不相关的。同样,在一个方 面,本发明提供了编码这些多肽的分离出的或重组的核酸。因此,在一个方面,本 发明的分离出的或重组的核酸包括本发明的信号序列(SP)、前体结构域和/或催化 结构域(CD)的编码序列和异源序列(即,与信号序列(SP)、前体结构域和/或催 化结构域(CD)天然不相关的序列)。异源序列可在SP、前体结构域和/或CD编码 序列的3’末端、5’末端和/或两个末端上。
杂合(嵌合)葡聚糖酶、甘露聚糖酶或木聚糖酶和肽文库
[00487]一方面,本发明提供了包含本发明的序列的杂合葡聚糖酶、甘露聚 糖酶或木聚糖酶和融合蛋白,包括肽库。本发明的肽库可以用于分离目标的肽调节 物(如,激活物或者抑制物),如葡聚糖酶、甘露聚糖酶或木聚糖酶底物、受体、酶。 本发明的肽库可以用于确定目标的形式上的结合配偶,如,配体,例如,细胞因子, 激素以及类似物。一方面,本发明提供了嵌合蛋白,其含有本发明的信号序列(SP)、 前体结构域和/或催化结构域(CD)或其组合以及异源序列(如上)。
[00488]一方面,本发明的融合蛋白(如,肽部分)是构象稳定的(相对于 线形肽),对靶标具有更高的结合亲和性。本发明提供了本发明的葡聚糖酶、甘露聚 糖酶或木聚糖酶与其它肽的融合,所述其它肽包括已知的肽和随机的肽。它们可以 以这样一种方式融合,使得所述葡聚糖酶、甘露聚糖酶或木聚糖酶的结构没有明显 地被扰乱,并且该肽在代谢上或者结构构象上是稳定的。这样便允许获得肽库,该 肽库在细胞内的存在及其数量都是容易监测的。
[00489]本发明的氨基酸序列变异体可以通过该变异的注定的性质来表征, 也就是将它们与天然发生的形式区分开的特征,如,葡聚糖酶、甘露聚糖酶或木聚 糖酶序列的等位基因的或者种间的变异。一方面,本发明的变异体表现出与天然发 生的类似物相同性质的生物活性。可选择地,可以选择具有改变的特征的变异体。 一方面,尽管引入氨基酸序列变化的区域或者位点是预先决定的,但突变本身并不 需要预先决定。例如,为了优化在一个给定位点出现的突变,可以在目标密码子或 者区域进行随机诱变,并筛选被表达的葡聚糖酶、甘露聚糖酶或木聚糖酶变异体, 以寻找所需活性的优化组合。已知在具有已知序列的DNA的预先决定的位点产生取 代突变的技术,正如在此说明的,例如,M13引物诱变和PCR诱变。突变体的筛选 可以通过应用例如葡聚糖水解分析来进行。在可供选择的方面,氨基酸取代物可以 是单个残基;插入可以是大约1到20个氨基酸的水平,尽管可以插入相当大的片段。 缺失的范围可以是大约1到大约20、30、40、50、60、70个残基或者更多。为了得 到具有优化性质的最终衍生物,替代、缺失、插入或者任何它们的组合可以被应用。 一般地,这些变化是在几个氨基酸上进行,以最小化分子的改变。然而,在某些情 况下,可以容忍更大的改变。
[00490]本发明提供了葡聚糖酶、甘露聚糖酶或木聚糖酶,其中多肽骨架的 结构、二级结构或三级结构,例如,α螺旋或β折叠结构,已被修饰。一方面,电荷 或疏水性已被修饰。一方面,侧链已被修饰。通过选择较不保守的取代来产生功能 或免疫性的本质变化。例如,可以进行这样的取代,它们将更加显著地影响:发生 变化的区域的多肽骨架的结构,例如α螺旋或β折叠结构;分子的电荷或疏水位点, 其可以是活性位点;或者侧链。本发明提供在本发明的多肽中的取代,其中(a)亲 水残基,例如丝氨酰或苏氨酰,被疏水残基例如亮氨酰、异亮氨酰、苯基丙氨酰、 缬氨酰或丙氨酰取代;或者相反;(b)半胱氨酸或脯氨酸被任何别的残基取代;或 者相反;(c)具有正电性侧链的残基,例如赖氨酰、精氨酰或组氨酰被带负电的残 基例如谷氨酰或天冬氨酰取代;或者相反;或者(d)具有大体积侧链的基团,例如 苯丙氨酸,被不具侧链的氨基酸例如甘氨酸取代;或者相反。所述变异体可以表现 出相同性质的生物学活性(即是内切葡聚糖酶、甘露聚糖酶或木聚糖酶活性),尽管 变异体可经选择来按需改变葡聚糖酶、甘露聚糖酶或木聚糖酶的特征。
[00491]一方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶包括表位 (epitopes)或者纯化标记、信号序列或者其它的融合序列,等。在一方面,本发明 的葡聚糖酶、甘露聚糖酶或木聚糖酶可以与随机的多肽融合,形成融合多肽。“融合” 或者“可操作性连接(operably linked)”在此是指随机肽和葡聚糖酶、甘露聚糖酶或 木聚糖酶酶连接在一起,以这样的方式来最小化对葡聚糖酶结构稳定性的破坏,例 如,其仍保持葡聚糖酶、甘露聚糖酶或木聚糖酶的活性。所述的融合多肽(或者编 码该融合多肽的融合多聚核苷酸)还可以包含进一步的组分,包括在多环(multiple loops)处的多个肽段。
[00492]一方面,肽和编码它们的核酸或者是完全随机化的,或者是在随机 化中有偏向,例如,在核苷酸/残基的普遍频率或者每个位置处的频率方面。“随机化” 是指每一个核酸或者肽分别由本质上随机的核苷酸和氨基酸组成。一方面,产生所 述肽的所述核酸可以通过化学合成,并且可以在任何位置整合进任何核苷酸。因此, 当所述核酸被表达形成肽时,任何氨基酸残基可以整合进任何位置。可以设计合成 过程来产生随机化的核酸,从而允许在所述核酸的长度范围内形成所有的或者大多 数的可能组合,由此形成随机核酸文库。该文库可以提供足量的结构多样的随机化 表达产物群体,可以获得概率上充分的细胞响应范围,从而可以提供一种或者多种 表现出所需响应的细胞。因此,本发明提供了一个足够大的相互作用文库,以便其 成员中的至少一个会具有使其对于一些分子、蛋白或者其他因子具有亲和性的结构。
[00493]内切葡聚糖酶木聚糖酶是多结构域的酶,可选择地,其由信号肽、 糖类结合模块(module)、葡聚糖酶催化结构域、连接子(linker)和/或另一个催化 结构域组成。
[00494]本发明提供了产生可以编码生物学活性杂合多肽(例如,杂合葡聚 糖酶、甘露聚糖酶或木聚糖酶)的嵌合多聚核苷酸的方法。在一个方面,原始的多 核苷酸编码生物学活性的多肽。本发明的方法通过利用细胞内过程产生了新的杂合 多肽,所述的细胞内过程可整合原始的多核苷酸序列,这样得到的杂合多核苷酸编 码证明具有源自原始生物学活性多肽的活性的多肽。例如,原始的多核苷酸可以编 码来自不同微生物的特定酶。由来自一个生物体或变异体的第一多核苷酸编码的酶 可以,例如,在特殊的环境条件下,例如,高盐,有效地发挥功能。来自不同生物 体或变异体的第二多核苷酸编码的酶可在不同的环境条件下,如超高温,有效地发 挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸编码的酶显示了 原始多核苷酸编码的两种酶的特性。因此,杂合多核苷酸编码的酶可在第一和第二 多核苷酸编码的酶所共有的环境条件下,例如高盐和极端温度下,有效地发挥功能。
[00495]由本发明的方法得到的杂合多肽可显示出在原始酶中不具有的特 殊酶活性。例如,在编码水解酶活性的多核苷酸重组和/或进行还原性重配后,从得 到的由杂合多核苷酸编码的杂合多肽中可筛选出由各个原始酶获得的特殊水解酶活 性,即在水解酶作用的键类型和水解酶发挥作用的温度方面被特殊化。因此,例如, 水解酶被筛选以确定那些可区分杂合水解酶和原始水解酶的化学功能性,如(a)酰 胺(肽键),即内切葡聚糖酶;(b)酯键,即酯酶和脂酶;(c)乙缩醛;即糖苷酶, 和例如杂合多肽发挥作用的温度、pH或盐浓度。
[00496]原始多聚核苷酸的来源可以是分离自个体生物体(“分离物”)、已经 生长在成分确定的培养基中的生物体收集物(“富集培养物”),或者未经培养的生物 体(“来自环境的样品”)。应用不依赖于培养物的方法从来自环境的样品获得编码新 的生物活性的多聚核苷酸是最优选的,因为这样便可接触到具有生物多样性的原始 来源。
[00497]“环境文库(Environmental libraries)”可以从环境样品中获得,其可 以代表天然发生的生物体的基因组集合,这些“环境文库”可以用克隆载体完成,所 述克隆载体可以在适合的原核宿主中扩增繁殖。因为被克隆的DNA起初是直接从环 境样品中提取的,所以所述文库并不限于可以在纯培养物中生长的小部分原核生物。 另外,存在于这些样品中的来自环境的DNA的标准化使其可以更加公正地代表存在 于原始样品的物种的DNA。这可以大大增加从所述样品的次要组成中发现令人感兴 趣的基因的效率,所述次要组成与优势种相比,其所占的量可能小几个数量级。
[00498]例如,从一个或者多个未经培养的微生物中获得的基因文库被筛选 以发现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以 基因表达文库的形式捕获。编码令人感兴趣的活性的多聚核苷酸从这样的文库中分 离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长, 产生潜在的具有新的或者增强的活性的生物分子。
[00499]另外,可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中,DNA 的一部分被扩增、消化——通常是通过限制性酶——以剪切所需的序列,所需的序 列被连接进接受载体中,并被扩增。在亚克隆的每个步骤中,该部分被检测感兴趣 的活性,以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被 纯化,例如在连接入载体之前通过凝胶电泳,或在含有接受载体的细胞和不含有接 受载体的细胞被置于选择性培养基中时,所述培养基含有例如一种抗生素,其可杀 死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中 是为人所熟知的(Sambrook等人,Molecular Cloning:A Laboratory Mannual,第二版, Cold Spring Harbor Laboratory Press(1989))。在另一个方面,本发明的酶是亚克隆。 这种亚克隆与亲代克隆的差别在于,例如,长度、突变、标志物(tag)或标记(label)。
[00500]在一个方面,本发明的信号序列在鉴定出新的葡聚糖酶、甘露聚糖 酶或木聚糖酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路 通常被称为蛋白靶向通路。在所有这些靶向系统中最重要的元件之一是新合成的多 肽的氨基末端上的短的氨基酸序列,称为信号序列。这种信号序列可指引蛋白至其 在细胞中的适合位置,并在转运过程中或在蛋白到达其最终目的地时被去除。大多 数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列,这些信号序列标示 着它们将转位至内质网腔内。在本组中有超过100个蛋白信号序列被确定。信号序 列的长度可以从13至36个氨基酸残基。识别信号序列的各种方法对于本领域技术 人员是已知的。在一个方面,肽可通过称为SignalP的方法来鉴定。SignalP应用了 既可识别信号肽,又可识别其裂解位点的组合神经网络。参见例如Nielsen等人, “Indentification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites”Protein Engineering,第10卷,第1号,第1-6页(1997)。应该理解的是, 本发明的一些葡聚糖酶、甘露聚糖酶或木聚糖酶可以含有或不含有信号序列。可以 期望的是,提供了编码来自一种葡聚糖酶、甘露聚糖酶或木聚糖酶的信号序列的核 酸序列,其有效连接于一种不同的葡聚糖酶、甘露聚糖酶或木聚糖酶的核酸序列, 或者,可选择地,来自非葡聚糖酶、甘露聚糖酶或木聚糖酶的蛋白的信号序列是被 需要的。
[00501]可以制备所述多聚核苷酸的微生物包括原核微生物如真细菌和古 细菌,低等真核微生物如真菌、一些藻和原生动物。多聚核苷酸可以是分离自环境 样品,在这种情况下,核酸被回收而不需培养某一种生物体,或者是从一种或者多 种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高 温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来 的酶的多聚核苷酸可以被应用。这样的酶可以在地表温泉和深海的热火山口超过 100℃的温度有作用,在北极水域低于0℃的温度有作用,在死海的饱和的盐环境下 有作用,在pH值在0附近的沉积物和地热富硫矿泉中起作用,或者在pH值超 过11的污水污泥中有作用。例如,来自极端条件下的生物体的几种被克隆和被表达 的酯酶和脂酶在很宽的温度和pH范围内表现出高活性。
[00502]如上所述的选择和分离的多核苷酸被导入进合适的宿主细胞中。合 适的宿主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸在一 个方面已经在包括有合适的控制序列的载体中。宿主细胞可以高等的真核细胞,如 哺乳动物细胞,或低等真核细胞,如酵母细胞,或在一个方面,宿主细胞是原核细 胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的 转染,或电穿孔(Davis等人,1986)来实现。
[00503]对于典型的适当的宿主,可能被提及的是:细菌细胞,如大肠杆菌、 链霉菌、鼠伤寒沙门氏菌;真菌细胞,如酵母;昆虫细胞如果蝇S2和草地夜蛾Sf9; 动物细胞如CHO、COS或者黑色素瘤细胞;腺病毒,和植物细胞。选择适合的宿 主被认为是在本领域技术人员已知的范围内。
[00504]特别提及可以用于表达重组蛋白的各种哺乳动物细胞培养系统,哺 乳动物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系,其在 “SV40-transformed simian cells support the replication of early SV40 mutants”(Gluzman, 1981)中有说明,和其它的可以表达相容性载体的细胞系,例如,C127、3T3、CHO、 HeLa和BHK细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子, 以及任何必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转 录终止序列,以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸 化的位点可以用于提供所需的非转录的遗传学元件。
[00505]另一方面,本发明的方法可以用于产生编码来自一个或者多个操纵 子或者基因簇或者其中的部分的生物化学途径的新的多聚核苷酸。例如,细菌和很 多真核生物具有用于调控基因的协作机制,所述基因的产物涉及相关的过程。基因 成簇排列在单一染色体上,在结构上称“基因簇”,它们在单个调控序列的控制下一 起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一 组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因。通过基因簇 编码的生物化学途径的一个例子是聚酮化合物(polyketides)。
[00506]基因簇DNA可以从不同的生物体中分离出来并且连接到载体中, 尤其是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白 或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于外源DNA具有非 常大的容量的载体特别适合用于这样的基因簇的情况,在这里通过括大肠杆菌的 f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合 过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如 来自混合的微生物样品的基因簇是理想的。一个方面是使用被称作“fos-质粒”的克 隆载体,或者细菌人工染色体(BAC)载体。它们是源于大肠杆菌f因子,可以 稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的 DNA时,这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。 用于本发明的另一类型的载体是粘粒载体。粘粒载体最初是设计用来克隆和扩增 基因组DNA的大片段。应用粘粒载体的克隆在Sambrook等,Molecular Cloning:A Laboratory Mannual,第二版,Cold Spring Harbor Laboratory Press(1989)中有详 细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或 者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同 源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合 基因簇进行筛选,以寻找在起初的基因簇没有发现的活性。
[00507]因此,一方面,本发明涉及用于产生具有生物活性的杂合多肽以 及筛选具有更高活性的多肽的方法,通过:
1)以有效连接的方式导入至少第一多聚核苷酸和以有效连接的方式导入 至少第二多聚核苷酸到合适的宿主细胞,所述的至少第一多聚核苷酸和 第二多聚核苷酸共有具有部分的序列同源性的至少一个区域。
2)在促进序列重新组织的条件下培养宿主细胞,得到有效连接的杂合多 聚核苷酸。
3)表达由所述杂合多聚核苷酸编码的杂合多肽。
4)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽;和
5)分离编码该杂合多肽的多聚核苷酸。
[00508]用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它 的讨论贯穿于本说明书。当要分离本发明的多聚核苷酸和多肽时,可以应用这些方 法。
筛选的方法学和“在线”监测设备
[00509]在实施本发明的方法时,可以应用与本发明的多肽和核酸结合的各 种仪器和方法学,从而例如筛选具有葡聚糖酶、甘露聚糖酶或木聚糖酶活性的多肽 (例如,分析例如酶谱中酪蛋白的水解、从明胶中释放荧光,或从各种小分子肽底 物中释放p-nitroanalide)、筛选可作为葡聚糖酶、甘露聚糖酶或木聚糖酶活性的潜在 调节物的化合物,例如激活物或抑制物、筛选可与本发明的多肽结合的抗体、可与 本发明的核酸杂交的核酸、筛选表达本发明多肽的细胞等。除了下面详细描述的用 于筛选样品的阵列形式以外,也可使用别的形式来实施本发明的方法。这样的形式 包括,例如质谱仪、色谱仪,例如,高通量HPLC和其它形式的液相色谱,和更小 的形式,如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明 的方法,见,例如美国专利申请20020001809。
毛细管阵列
[00510]本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或 监测组合物(例如,小分子、抗体、核酸等)的文库,以发现它们结合本发明的核 酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列,如 GIGAMATRIXTM,戴弗萨公司,San Diego,CA;和描述在例如美国专利申请 20020080350 A1;WO 0231203 A;WO 0244336 A中的阵列,提供了容纳和筛选样品 的可供选择的装置。在一个方面,毛细管阵列包括多个毛细管,它们形成具有相互 邻接的毛细管的阵列,其中所述的每个毛细管含有至少一个壁,其限定了一个用以 保留样品的内腔。这个内腔可以是圆柱形的、正方形的、六边形的或其它任何几何 形状,只要其壁能够形成内腔以保留液体或样品。毛细管阵列的毛细管可相互靠近 联合在一起形成一个面状的构造。毛细管可通过融合(例如,当毛细管由玻璃制成 时)、粘合、键合或面对面的夹合而结合在一起。可选择地,毛细管阵列可以包括在 阵列中相邻毛细管之间放置的间质材料(interstitial material),从而形成含有多个穿 通孔(through-holes)的固体平曲装置。
[00511]毛细管阵列可由任何数量的毛细管形成,例如,100至4,000,000个 毛细管。进一步,具有大约100,000或更多个毛细管的毛细管阵列可形成标准大小和 形状的板,其适合于标准的实验室设备。通过毛细作用或使用细针的微 注射,人工或自动地将腔充满。随后可以从毛细管中移出感兴趣的样品以进行进一 步的分析或定性。例如,安置细针样的探头被安置,使其与选择的毛细管能够液体 连通,从而可以向腔内加入材料或移走材料。
[00512]在单区筛选分析(single-pot screening assay)中,分析组分在插入到 毛细管阵列中之前被混合在一起,产生目的溶液。当至少一部分阵列被浸入目标溶 液中时,通过毛细作用充满内腔。在每个毛细管中的化学或生物学反应和/或活性被 监测,以发现可检测事件。所述的可检测事件常常被称为“命中事件(hit)”,其常 常可以通过光学检测与产生“非命中事件(non-hit)”的毛细管区分开来。因此,毛细 管阵列可整体地并行检测“命中事件”。
[00513]在多区筛选分析(multi-pot screening assay)中,多肽或核酸,例如, 配体可被导入进第一组分中,该组分被导入进毛细管阵列的至少一部分毛细管中。 然后将气泡导入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内,其 中所述的第二组分与第一组分通过气泡相隔。通过在毛细管阵列的两侧施加静水压 挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的反应 或非反应而发生的可检测事件。
[00514]在结合筛选分析(binding screening assay)中,目标样品可作为用 可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中,其中为了使可检测颗粒 与内腔结合,毛细管的内腔包被了一种结合材料。然后第一种液体可从毛细管中移 去,其中结合的可检测颗粒仍保留在毛细管内,可以将第二液体导入进毛细管内。 然后监测毛细管中由颗粒与第二液体的反应或非反应而发生的可检测事件。
阵列,或“生物芯片”
[00515]本发明的核酸或者多肽可以固定于或者应用于阵列(array)。可以 应用阵列来筛选或者监测化合物(例如,小分子、抗体、核酸等等)的文库,所述 筛选或者监测是针对它们结合或者调控本发明的核酸或者多肽的活性的能力。例如, 在本发明的一方面,一个被监测的参数是葡聚糖酶、甘露聚糖酶或木聚糖酶基因的 转录表达。细胞的一种或者多种或者所有的转录物可以通过阵列或者“生物芯片”上 的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互 补的核酸的杂交来测定。通过应用在微型芯片上的核酸“阵列”,细胞的一些或者所 有转录物可以同时被定量。可选择地,包含基因组核酸的阵列也可以用于确定通过 本发明的方法制造的新型的工程菌株的基因型。“多肽阵列”也可以用于同时定量多 种蛋白。本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被指作“微阵列” 或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”,或者它们的变体。 阵列一般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或者多种生物 分子,例如,固定于基底表面的确定区域、用于特异结合一种样品分子如mRNA转 录物的寡核苷酸。
[00516]在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方 法都可以被全部或者部分地整入,或者也引入它们的变化,例如在下列文献中说明 的:美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695; 6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456; 5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752; 5,434,049;还例如,WO 99/51773;WO 99/09217;WO 97/46313;WO 96/17958;还 例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques 23:1087-1092;Kern(1997)Biotechniques 23:120-124;Solinas-Toldo(1997)Genes, Chromosomes & Cancer 20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。 也参见出版的美国专利申请20010018642;20010019827;20010016322;20010014449; 20010014448;20010012537;20010008765。
抗体和基于抗体的筛选方法
[00517]本发明提供了可与本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶特异 结合的分离出的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的葡聚糖 酶、甘露聚糖酶或木聚糖酶或相关的多肽。这些抗体可用来分离在本发明范围内的 其它多肽或其它相关的葡聚糖酶、甘露聚糖酶或木聚糖酶。抗体经设计可以结合葡 聚糖酶、甘露聚糖酶或木聚糖酶的活性位点。因此,本发明提供了使用本发明的抗 体来抑制葡聚糖酶、甘露聚糖酶或木聚糖酶的方法(见上面关于本发明的抗葡聚糖 酶、甘露聚糖酶或木聚糖酶组合物的应用的讨论)。
[00518]本发明提供了本发明的酶的片段,包括本发明的多肽的免疫原性片 段。本发明提供了含有本发明的多肽或肽和佐剂或载体以及类似物的组合物。
[00519]所述抗体可以在免疫沉淀、染色、免疫亲合柱以及类似的程序中被 应用。如果需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离 出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。可供选择的, 本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性 可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法设计 细胞表型。
[00520]免疫、产生或者分离抗体(多克隆的或者单克隆的)的方法是本领 域技术人员所了解的,并且在科学和专利文献中有描述,参见,如,Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.) BASIC AND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA(“Stites”);Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE(第2版)Academic Press,NewYork,NY(1986);Kohler(1975)Nature 256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring HarborPublications,New York。除了使用动物的传统的体内方法外,抗体也可以在体 外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom (1997)Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct. 26:27-45。
[00521]本发明的多肽,或含有其至少5、10、15、20、25、30、35、40、 50、75、100或150个连续氨基酸的片段,也可用来产生与所述多肽或片段特异结合 的抗体。得到的抗体可应用于免疫亲和层析程序,以分离或纯化多肽,或确定多肽 是否存在于生物样品中。在这样的程序中,蛋白制备物,如提取物,或生物样品与 能够同本发明的其中一种多肽或含有其至少5、10、15、20、25、30、35、40、50、 75、100或150个连续氨基酸的片段特异结合的抗体接触。
[00522]在免疫亲和程序中,所述抗体附着于一种固体支持物上,如珠子或 者其它的填充柱基质。在所述抗体可以特异地与本发明的其中一种多肽或其片段结 合的条件下,将所述蛋白制备物与所述抗体接触。当通过清洗去除非特异结合的蛋 白后,特异性结合的多肽被洗脱下来。
[00523]在生物样品中蛋白结合所述抗体的能力可以通过使用本领域技术 人员所熟悉的各种方法来确定。例如,结合可以通过用例如荧光试剂、酶标记或者 放射性同位素的可检测标记物来标记所述抗体来确定。可选择地,所述抗体与所述 样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括 ELISA分析、夹心分析、放射免疫分析以及Western印迹。
[00524]产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、 35、40、50、75、100或150个连续氨基酸的片段的多克隆抗体可通过直接将多肽注 射进动物中或通过将多肽给予动物,例如非人动物而获得。这样获得的抗体然后可 与多肽本身结合。以这种方式,甚至仅编码多肽的一个片段的序列也可用来产生可 与整个天然多肽结合的抗体。这种抗体然后可用来从表达所述多肽的细胞中分离多 肽。
[00525]为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的 任何技术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975)、trioma 技术、人B-细胞杂交瘤技术(Kozbor等人,Immunology Today 4:72,1983)和EBV- 杂交瘤技术(Cole等人,1985,in Monoclonal Antibodies and Cancer Therapy,Alan R. Liss,Inc.,pp.77-96)。
[00526]用于产生单链抗体的技术(美国专利4,946,778)可被改动,以使之 适于产生本发明的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、 100或150个连续氨基酸的片段的单链抗体。可选择地是,转基因小鼠可用来表达这 些多肽或其片段的人源化抗体。
[00527]产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、 35、40、50、75、100或150个连续氨基酸的片段的抗体可用于筛选来自其它生物体 和样品的类似多肽。在这些技术中,来自生物体的多肽与抗体接触,检测可与抗体 特异结合的多肽。上述的任何程序可用来检测抗体的结合。一种这样的筛选分析描 述在“Methods for Measuring Cellulase Activities”,Methods in Enzymology,Vol 160, 87-116页中。
试剂盒
[00528]本发明提供了试剂盒,其包括组合物,例如本发明的核酸、表达序 列盒、载体、细胞、转基因种子或者植物或者植物的一部分、多肽(如内切葡聚糖 酶、甘露聚糖酶或木聚糖酶)和/或者抗体。所述试剂盒也可以包括如在此所述的用 于教导本发明的方法学以及工业应用的指导性材料。
全细胞工程和测定代谢参数
[00529]本发明的方法提供了细胞的全细胞进化或全细胞工程,其通过修饰 细胞的遗传组成开发出具有新的表现型,例如,新的或修饰的葡聚糖酶、甘露聚糖 酶或木聚糖酶活性的新细胞株。通过向细胞中加入本发明的核酸,例如本发明的酶 的编码序列而修饰遗传组成。见,例如,WO0229032;WO0196551。
[00530]为了探测新的表型,在“实时”或者“在线”的时间期间监测被修饰的 细胞的至少一种代谢参数。一方面,多个细胞,如培养细胞物被“实时”或者“在线” 监测。一方面,“实时”或者“在线”监测多个代谢参数。代谢参数可以应用本发明的木 聚糖酶进行监测。
[00531]代谢流分析(Metabolic flux analysis(MFA))是以已知的生物化学框 架为基础。以质量守恒定律和细胞内代谢物的假稳态假说(pseudo-steady state hypothesis(PSSH))为基础,构建线性独立代谢矩阵。在实践本发明的方法时,建立 代谢网络,包括:
·所有途径底物、产物和中间代谢物的特性,
·使途径代谢物互变的所有化学反应的特性,途径反应的化学计量学,
·催化反应的所有酶的特性,酶反应动力学,
·途径组分之间的调控性相互作用;如变构效应相互作用,酶-酶相互作用 等,
·酶或者酶的任何其它超大分子组织在细胞内的区室化,以及,
·代谢物、酶或者效应分子的任何浓度梯度的存在,或者它们运动的扩散 障碍。
[00532]一旦针对给定的细胞株建立了代谢网络,如果在线代谢数据可用, 那么可以通过矩阵概念引入数学表达来评估细胞内的代谢流。代谢表型依赖于细 胞内整个代谢网络的变化。代谢表型依赖于途径利用对环境条件、遗传调控、发 育状态和基因型等等作出的变化。在本发明方法的一个方面,当计算了在线MFA 之后,通过研究所述的途径利用来分析细胞的动力学行为、它们的表型和其它性 质。例如,在酵母发酵中,如果葡萄糖供应增加,氧气减少,呼吸途径的利用将 会降低和/或者停止,而发酵途径的利用将占优势。在所述的途径分析之后,细胞 培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导 物的使用等来控制细胞的生理状态朝着所需的方向进行,本发明的方法可以有助 于确定如何操纵发酵。在实践本发明的方法时,MFA的结果也可以与转录物组 (transcriptome)和蛋白质组(proteome)的数据比较,设计实验和方案用于代谢 工程或者基因重排等等。
[00533]在实践本发明的方法时,可以产生和检测到任何经修饰改变的或者 新的表型,包括在细胞中新的或者改进的特征。可以监测代谢或者生长的任何方面。
监测mRNA转录物的表达
[00534]在本发明的一方面,工程化的表型包括增加或者降低mRNA转录物 (如,葡聚糖酶、甘露聚糖酶或木聚糖酶信息)的表达或者在细胞中产生新的(如, 葡聚糖酶、甘露聚糖酶或木聚糖酶)转录物。这一增加或者减少的表达可以通过测 定本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的存在或者通过葡聚糖酶、甘露聚糖 酶或木聚糖酶活性分析来跟踪。mRNA转录物或者信息也可以通过本领域已知的任 何方法来检测或者定量,包括,例如,Northern印迹、定量扩增反应、阵列杂交以 及类似的方法。定量扩增反应包括,如,定量PCR,包括,如,定量反转录聚合酶 链式反应,或者RT-PCR;定量实时RT-PCR,或者“实时动力学RT-PCR”(参见,如, Kreuzer(2001)Br.J.Haematol.114:313-318;Xia(2001)Transplantation 72:907-914)。
[00535]在本发明的一方面,工程化的表型是通过敲除同源基因的表达产 生。可以敲除所述基因的编码序列或者一个或多个转录控制元件,如启动子或者增 强子。这样,转录物的表达可以完全去除或者降低。
[00536]在本发明的一方面,所述工程化的表型包括增加同源基因的表达。 这可以通过敲除负调控元件或者诱变正调控元件而实现,负调控元件包括以顺式或 者反式起作用的转录调控元件。细胞的一种或者多种或者所有的转录物可以通过阵 列上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录 物互补的核酸的杂交来测定。
监测多肽、肽和氨基酸的表达
[00537]在本发明的一方面,工程化的表型包括增加或者降低多肽(如葡聚 糖酶、甘露聚糖酶或木聚糖酶)的表达或者在细胞内产生新的多肽。这一增加或者 减少的表达可以通过确定存在的葡聚糖酶、甘露聚糖酶或木聚糖酶的量或者通过葡 聚糖酶、甘露聚糖酶或木聚糖酶活性分析来跟踪。也可以通过本领域任何已知的方 法来检测并定量多肽、肽和氨基酸,所述方法包括,如,核磁共振(NMR)、分光光 度测定法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、 薄层色谱(TLC)、超扩散色谱,各种免疫学方法,如,免疫沉淀、免疫扩散、免疫 电泳、放射性免疫分析(RIAs)、酶联免疫吸附分析(ELISAs)、免疫荧光分析,凝 胶电泳(如,SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热分解 质谱、傅立叶转换红外光谱测定、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联- 电喷质谱,已经类似的方法。应用这些方法或者它们的变体也可以筛选新的生物活 性,在美国专利6,057,103中有说明。而且,正如以下详细讨论的,可以应用蛋白阵 列测定细胞的一个或者多个或者所有的多肽。
工业应用
[00538]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶是高度选择性的催化 剂。它们可催化具有强烈的立体选择性、区域选择性和化学选择性的反应,是常规 合成化学无法比拟的。而且,酶是非常通用的。本发明的酶可适于在有机溶剂中发 挥功能,可在极端pH(例如,高pH和低pH)和极端温度(例如,高温和低温)、 极端的盐度水平(例如,高盐度和低盐度)下工作,并可催化同与其天然的生理底 物结构不相关的化合物的反应。
去垢剂组合物
[00539]本发明提供了含有本发明的一种或多种多肽(例如,葡聚糖酶、甘 露聚糖酶或木聚糖酶)的去垢剂组合物,以及制备和使用这些组合物的方法。本发 明并入了制备和使用去垢剂组合物的所有方法,见,例如美国专利6,413,928; 6,399,561;6,365,561;6,380,147。去垢剂组合物可以是一个部分和两个部分的含水组 合物、不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压缩片剂、凝胶和/ 或糊剂和浆液的形式。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶也可用作固体或 液体形式的去垢剂添加剂产品。这样的添加剂产品可以考虑用来补充或促进常规的 去垢剂组合物的性能,它们可在洗涤过程的任何阶段被加入。
[00540]实际的活性酶含量依赖于制造去垢剂组合物的方法,这不是很严格 的,只要去垢剂溶液具有所需的酶活性。在一个方面,存在于最终溶液中的葡聚糖 酶、甘露聚糖酶或木聚糖酶的量的范围为每克去垢剂组合物大约0.001mg至0.5mg。 选择用于本发明的过程和产品中的特定酶依赖于最终应用的条件,包括产品的物理 形式、应用时的pH、应用时的温度和要被降解和改变的土壤类型。对于指定的任何 一组应用条件,可以选择酶以提供最佳的活性和稳定性。在一个方面,本发明的葡 聚糖酶、甘露聚糖酶或木聚糖酶在大约4至大约12的pH范围内,大约20℃至大约 95℃的温度范围内是有活性的。本发明的去垢剂可以包括阳离子表面活性剂、半极 性的非离子表面活性剂或两性离子表面活性剂或其混合物。
[00541]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可被制成粉末状和液体 的去垢剂,具有的pH在4.0和12.0之间,重量为大约0.01%至大约5%(在一个方 面为0.1%至0.5%)的水平。这些去垢剂组合物也包括其它的酶如其他葡聚糖酶、甘 露聚糖酶或木聚糖酶、或纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、β-葡聚糖酶、 内-β-1,3(4)-葡聚糖酶、过氧化氢酶、角质酶、过氧化物酶、漆酶、脂酶、淀粉酶、葡 糖淀粉酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯 聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛 聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、蛋白酶、果 胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。这些去垢剂组合物 也包括洗涤增洁剂和稳定剂。这些去垢剂组合物也包括洗涤增洁剂和稳定剂。
[00542]向传统的洗涤组合物中添加本发明的葡聚糖酶、甘露聚糖酶或木聚 糖酶不会造成任何特殊的应用限制。换句话说,适合去垢剂的任何温度和pH也适用 于本发明的组合物,只要酶在打算使用的pH和/温度下有活性,或是可耐受的。另 外,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于不需要去垢剂的洗涤剂中, 单独应用或与增洁剂和稳定剂联合应用。
[00543]本发明提供了洗涤组合物,包括清洁硬表面的去垢剂组合物、清洁 织物的去垢剂组合物、用于洗碗的组合物、口腔清洁组合物、假牙清洁组合物和隐 形眼镜清洁溶液。
[00544]在一个方面,本发明提供了清洗物体的方法,包括将物体与本发明 的多肽在可充分洗涤的条件下接触。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶 可以作为去垢剂添加剂而被加入。本发明的去垢剂组合物,例如可被配制为含有本 发明多肽的手工或机器洗衣的去垢剂组合物。用于预处理染织物的洗衣添加剂可含 有本发明的多肽。织物柔软剂组合物可含有本发明的葡聚糖酶、甘露聚糖酶或木聚 糖酶酶。可选择的是,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶可被制成去垢 剂组合物,用于通常的家庭硬表面清洗工作中。在可选择的方面,本发明的去垢剂 添加剂和去垢剂组合物包含一种或多种其它的酶,例如其他葡聚糖酶、甘露聚糖酶 或木聚糖酶、或木聚糖酶、脂酶、角质酶、糖酶、纤维素酶、果胶酶、阿拉伯糖酶、 半乳聚糖酶、氧化酶,例如,乳糖酶和/或过氧化物酶(也见上)。所选择的本发明的 酶的特性可与所选择的去垢剂相容(即,最佳pH,与其它的酶或非酶成分相容,等), 酶是以有效量存在。在一个方面,本发明的酶用来从织物中去掉有恶臭的材料。在 实施本发明过程中可使用的各种去垢剂组合物和制备它们的方法描述在,例如美国 专利6,387,690;6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232; 6,197,070;5,856,164。
[00545]当制成适合用于洗衣机器洗涤方法的组合物时,本发明的木聚糖酶 可包括表面活性剂和增白剂化合物。另外,它们可以包括一种或多种去垢剂组分, 例如有机聚合的化合物、漂白剂、其它的酶、抑泡剂、分散剂、石灰肥皂分散剂、 土壤悬液和防再污染剂和腐蚀抑制剂。本发明的洗衣组合物也可以含有柔软剂作为 额外的去垢剂组分。这样的含有糖酶的组合物当制成洗衣去垢剂组合物时,可提供 织物的洗涤、染剂的去除、洁白度的保持、软化、着色、染料转移的抑制和卫生处 理。
[00546]本发明的洗衣去垢剂组合物的密度范围可以为大约200至1500克/ 升,或大约400至1200克/升,或大约500至950克/升,或600至800克/升组合物; 这是在大约20℃时测定的。
[00547]本发明的洗衣去垢剂组合物的“紧密(compact)”形式最好由密度来 反映,就组合物而言,可以通过无机填料盐类的量来反映。无机填料盐是粉末形式 的去垢剂组合物的常规成分。在常规的去垢剂组合物中,填料盐类存在的基本量一 般为总组合物重量的17%至35%。在所述紧密组合物的一个方面,填料盐类存在的 量不超过总组合物重量的15%,或不超过10%,或不超过5%。无机填料盐类选自硫 酸盐和氯化物的碱和碱土金属盐类,例如,硫酸钠。
[00548]本发明的液体去垢剂组合物也可以是“浓缩的形式”。在一个方面, 与常规的液体去垢剂相比,所述的液体去垢剂组合物含有较低量的水分。在可选择 的方面,浓缩液体去垢剂的水含量小于去垢剂组合物重量的40%,或小于30%,或 小于20%。本发明的去垢剂化合物可以构成在WO 97/01629中所述的剂型。
[00549]本发明的酶可用于配制多种洗涤组合物。多种已知的化合物是合适 的表面活性剂包括非离子的,阴离子,阳离子,或可使用两性离子去垢剂,如在美 国专利4,404,128;4,261,868;5,204,015中所公开的。另外,葡聚糖酶、甘露聚糖或木 聚糖酶酶可用于,例如条皂或液体肥皂的应用、碗碟清洗剂型、隐形眼镜清洗溶液 或产品、肽水解、废物处理、纺织品应用、在蛋白生产中作为融合-裂解酶,以及类 似的应用。与别的去垢剂葡聚糖酶相比,葡聚糖酶、甘露聚糖酶或木聚糖酶在去垢 剂组合物提供了增强的性能,即,酶基团可以提高对某些酶敏感的污物的清洗,如 对草或血的清洗,这可以在进行标准的洗涤循环后用通常的评价方法来测定。本发 明的葡聚糖酶、甘露聚糖酶或木聚糖酶酶可被配制到已知的粉末状和液体去垢剂中, pH在6.5和12.0之间,重量水平在大约0.01至大约5%(例如,大约0.1%至0.5%)。 这些去垢剂洗涤组合物也可以包括其它的酶,如已知的葡聚糖酶、甘露聚糖酶、木 聚糖酶、淀粉酶、纤维素酶、脂酶或糖苷内切酶,以及增洁剂和稳定剂。
[00550]在一个方面,本发明提供了具有葡聚糖酶、甘露聚糖酶或木聚糖酶 活性(本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶)的去垢剂组合物,其可用于水 果、蔬菜和/或泥浆和粘土化合物(见,例如,美国专利5,786,316)。
处理纤维和纺织品
[00551]本发明提供了使用本发明的一种或多种葡聚糖酶、甘露聚糖酶或木 聚糖酶处理纤维和织物的方法。本发明的酶可用于本领域中熟知的任何纤维或织物 处理方法中,见,例如,美国专利6,387,690;6,261,828;6,077,316;6,024,766;6,021,536; 6,017,751;5,980,581;美国专利申请20020142438 A1。例如,本发明的酶可用于纤维 和/或织物的退浆工艺中。在一个方面,织物的质地和外观通过将织物与本发明的酶 在溶液中接触的方法而被改善。在一个方面,织物用溶液在一定压力下处理。例如, 本发明的酶可用于去除染料。
[00552]在一个方面,本发明的酶在编织织物期间或编织织物之后使用,或 在退浆阶段使用,或在一个或多个额外的织品加工步骤期间应用。在编织织物期间, 使线经受相当大的机械应力。在机械织布机上进行编织之前,弯曲的线常常涂敷浆 料淀粉(sizing starch)或淀粉衍生物,以便增加它们的拉伸强度和防止断裂。纺织 完织物之后,织品可以继续进行退浆阶段。这之后,可以进行一个或多个额外的织 品加工步骤。退浆是的作用是将“浆料(size)”从织物去除。编织完之后,在进一步 加工织物之前必须除去浆料涂层,以确保获得均一和耐洗(wash-proof)的结果。
[00553]本发明的酶可用来处理任何纤维素材料,包括纤维(例如,棉、大 麻、亚麻或亚麻布纤维),缝制的和未缝制的织物,例如,由棉、混棉或天然纤维素 或人造纤维素(例如,来自含葡聚糖的纤维素纤维,如来自木浆)或其混合物制成 的编织物、针织物、粗斜纹布、纱线和毛巾料。混合物的实例是棉或人造丝/粘胶与 一种或多种伴随材料如羊毛、合成纤维(例如,聚酰胺纤维、丙烯酸纤维、聚酯纤 维、聚乙烯醇纤维、聚氯乙烯纤维、聚偏二氯乙烯纤维、聚氨酯纤维、聚脲纤维、 芳香族聚酰胺纤维)和含纤维素的纤维(例如,人造丝/粘胶、苎麻、大麻、亚麻/ 亚麻布、黄麻、乙酸纤维素纤维、莱赛尔(lyocell))的混合物。
[00554]本发明的酶可用来处理织品或任何含有葡聚糖、甘露聚糖、木聚糖 或纤维素的物质,包括含有棉的织品,如洗涤剂添加剂,例如在含水组合物中。对 于制造衣服,织品可进行切割和缝制成衣服或服装。这些可以在处理之前或处理之 后进行。特别地,对于制造牛仔裤,已经开发出不同的酶修整方法(enzymatic finishing method)。斜纹粗棉布服装的修整工作以酶退浆步骤为开始,在这个步骤期间服装受 到淀粉分解酶的作用,以赋予织品柔性,并使得棉更容易接受随后的酶修整步骤。 本发明提供了处理织物的方法,例如通过使用酶诸如本发明的甘露聚糖酶、木聚糖 酶或葡聚糖酶(例如内切葡聚糖酶)的任何组合对斜纹粗棉布进行修整,酶法退浆,和 赋予织品柔性。在一个方面,本发明的酶可以用于处理以防止织物颜色变灰。
[00555]在一个方面,本发明的碱性和/或热稳定性甘露聚糖酶、木聚糖酶和 葡聚糖酶(例如内切葡聚糖酶)在单浴退浆(single bath desizing)和生物煮练 (bioscouring)中混合。将退浆和煮练合并在一个步骤中的优点之中是节省成本,并 降低对环境的影响,这是因为节省了能量和水的使用和降低废物产生量的缘故。退 浆和煮练的应用条件可以在约pH8.5至pH 10.0之间,温度在约40℃和40℃以上。 低酶剂量(例如每吨棉5g)和短的反应时间(例如约15分钟)可以用于获得高效的退浆 和煮练效率,无需加入钙。
[00556]本发明的酶可以用于处理含纤维素的织品以减少粗糙性,使色泽鲜 明,或使此种织物的色泽局部发生变化。参见,例如美国专利6,423,524。例如,本 发明的酶可以用于减少含棉织物的粗糙性,诸如用作粗糙性减少洗涤剂添加剂。本 发明的酶可以用于处理织物,以给予彩色织物“石洗的(stonewashed)”外观,同时 减少着色剂重新沉淀到织物上的数量。
[00557]本发明的纺织品处理过程(使用本发明的酶)可与其它纺织品处理 相结合,例如,刷洗和漂白。刷洗是从棉纤维中去掉非纤维素的材料,例如角质层 (主要由蜡组成)和原初的细胞壁(主要由胶质、蛋白质和木糖葡萄糖组成)。适当 的蜡去除对获得高的可湿性是必须的。这是染色所必需的。通过本发明的过程去除 主要的细胞壁可改善蜡的去除,保证更均匀的染色。用本发明的过程处理纺织品可 改善漂白过程中的洁白度。用于刷洗中的主要化学物质是高浓度和高温下的钠、氢 氧化物。漂白包括氧化纺织品。漂白一般涉及使用过氧化氢作为氧化剂,以便获得 完全漂白(白的)织物或保证染料的洁净色调
[00558]本发明也提供了碱性葡聚糖酶(在碱性条件下有活性的内切葡聚糖 酶)、甘露聚糖酶、或木聚糖酶。这些酶在织物加工、植物纤维(例如植物韧皮纤维) 的脱胶、废物处理,胶质废水的处理、造纸、咖啡和茶发酵中具有很广泛的应用。 参见,例如Hoondal(2002)Applied Microbiology and Biotechnology 59:409-418。
[00559]本发明的纺织品处理工艺也可包括使用其他酶的任何组合,这些其 他酶(包括碳水化合物降解酶)诸如过氧化氢酶、其他葡聚糖酶、纤维素酶、脂酶、内 切糖苷酶、内-β-1,4-葡聚糖酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化 物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质素 酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、其他甘露聚糖酶、木糖葡聚糖酶、 其他木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、聚半乳糖醛 酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、果胶甲基酯酶、纤维二糖 水解酶和/或转谷氨酰胺酶。本发明的酶可以与其他碳水化合物降解酶例如纤维素酶、 阿拉伯聚糖酶、木糖葡聚糖酶、果胶酶、木聚糖酶和类似酶一起联合使用,来制备 纤维或用于清洗纤维。蛋白酶也可以与本发明的酶联合使用。这可以与洗涤剂联合 使用。
处理食物和食物加工
[00560]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶在食品加工工业中具有 大量的应用。例如,在一个方面,本发明的酶可用来改善从富油植物原料中油的提 取,例如,富含油的种子,例如来自大豆的大豆油、来自橄榄的橄榄油、来自油菜 籽的油菜籽油和/或来自向日葵籽的向日葵油。
[00561]本发明的酶可用来分离植物细胞材料中的成分。例如,本发明的酶 可用于将富含葡聚糖的物质(例如,植物细胞)分离成各种成分。在一个方面,本 发明的酶可用来将富含葡聚糖或富含油的作物分离成有价值的蛋白和油和外壳组 分。可通过使用本领域中已知的方法执行分离过程。
[00562]本发明的酶可用于水果或蔬菜汁、果汁、提取物以及类似物的制备 过程以增加产量。本发明的酶可用于各种植物细胞壁衍生物质或废料的酶处理(例 如,水解含有葡聚糖的植物物质),所述的被处理物质例如来自谷类、谷粒、葡萄酒 或果汁的生产,或农业残余物如蔬菜外壳、豆荚、制糖甜菜浆、橄榄浆、马铃薯浆 以及类似物。本发明的酶可用来改变被加工的水果或蔬菜的粘稠度和外观。本发明 的酶可用来处理植物物质以促进包括食物在内的植物物质的加工,促进植物成分的 纯化或提取。本发明的酶可用来改善饲料的价值、降低结合水含量、提高污水的降 解性和/或改善植物物质向窖藏品的转变以及类似的应用。本发明的酶也可以用于水 果和酿造工业进行设备清洗和维护。
[00563]在一个方面,本发明的酶,例如葡聚糖酶、甘露聚糖酶或木聚糖酶 可用于烘烤应用中,例如,曲奇和饼干,以水解葡聚糖和减少粘性。本发明的葡聚 糖酶、甘露聚糖酶或木聚糖酶也可以用于产生机器不难加工的不粘的面团,并减小 饼干的大小。使用本发明的酶水解葡聚糖可用于防止烘烤制品的迅速再水化引起的 松脆性丢失和储藏寿命的减小。在一个方面,本发明的酶可用作面团加工过程中的 添加剂。在一个方面,本发明的酶可用于面团改良,其中在一个方面,本发明酶在 大约25-35℃的温度范围内和接近中性pH(7.0-7.5)下具有很高的活性。在一个方 面,面团改良酶可在极端温度的烘烤下(>500℉)被灭活。
[00564]本发明的食品处理工艺也可包括使用其他酶的任何组合,这些其他 酶诸如过氧化氢酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖 苷酶(amyloglucosidases)、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧 化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡 糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、 阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯 酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、肽酶、蛋白酶、聚半乳糖醛酸酶、鼠李 半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维 二糖水解酶和/或转谷氨酰胺酶
纸或纸浆处理
[00565]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于纸或纸浆处理或 纸脱墨中。例如,在一个方面,本发明提供了使用本发明的葡聚糖酶、甘露聚糖酶 或木聚糖酶的纸处理过程。在一个方面,本发明的酶可应用在高碱和高温环境中, 减少对化学漂白剂如二氧化氯的需求。在一个方面,本发明的酶是耐热的碱性葡聚 糖酶,可减少牛皮纸纸浆的二氧化氯需求量超过25%,使纸浆产量的损失小于0.5%。 在一个方面,临界的参数为pH 10,65-85℃,处理时间少于60分钟,酶的加样量小 于0.001wt%。可以检测一个内切葡聚糖酶库中水解染料标记的葡聚糖的能力,例如 在pH 10和60℃。在这些条件下检测为阳性的酶然后可以在例如pH 10和70℃被 评价。可选择地是,酶可在pH 8和pH 10在70℃被测试。在发现纸浆和造纸工业 中所需的内切葡聚糖酶的过程中,以来自高温或高碱环境的文库作为目标。特别地, 这些文库被筛选,以发现可在碱性pH和大约45℃的温度发挥作用的酶。在另一个 方面,本发明的葡聚糖酶可用于纸浆和造纸工业中降解木质素半纤维素连接,以释 放木质素。
[00566]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于纸或纸浆工业, 如例如美国专利5,661,021;6,387,690;6,083,733;6,140,095和6,346,407中所述。 例如如美国专利6,140,095所述,本发明的酶可以是耐碱性的葡聚糖酶。本发明的酶 可用于纸或纸浆工业,其中酶在65℃至75℃的温度范围和约10的pH中具有活性。 此外,可用于纸或纸浆工业的本发明的酶将减少对漂白剂诸如二氧化氯的需要量。 本发明的酶可以在微酸pH(5.5-6.0)、在40℃至70℃温度范围内具有活性,95℃失活。 在一个方面,本发明的酶在40-75℃之间,和pH 5.5-6.0时具有最佳活性;在70℃保 持稳定至少50分钟,在96-100℃失活。
[00567]此外,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于生物漂 白和处理化学浆,如美国专利5,202,249所述;用于生物漂白和处理木浆或纸浆,如 美国专利5,179,021、5,116,746、5,407,827、5,405,769、5,395,765、5,369,024、5,457,045、 5,434,071、5,498,534、5,591,304、5,645,686、5,725,732、5,759,840、5,834,301、5,871,730 和6,057,438所述;用于减少木材中的木质素和修饰木材,如美国专利5,486,468和 5,770,012中所述。
[00568]在一个方面,本发明的甘露聚糖酶或其他酶可以用于纸或浆工业, 单独使用或与木聚糖酶(例如本发明的木聚糖酶)一起使用。在一个方面,本发明的酶 可以用于漂白工艺,以增加漂白的浆(例如全部或部分来自软木材)的亮度。如果 使用本发明的酶,可以减少在漂白阶段使用的氯的数量。在一个方面,本发明的甘 露聚糖酶可以用于增加回收纸工艺中的浆的自由度。在一个方面,本发明的甘露聚 糖酶单独使用或与木聚糖酶(例如本发明的木聚糖酶)一起用于处理木质素纤维浆 (例如全部或部分来自软木材),以改善其漂白率。参见例如美国专5,795,764。
[00569]本发明的浆或纸处理也可包括使用与其他酶的任何组合,这些其他 酶诸如过过氧化氢酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀粉 糖苷酶、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化酶、β-葡聚糖酶、 内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、 还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半 纤维素酶、甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛 聚糖乙酰酯酶、蛋白酶、肽酶、蛋白酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、 半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转 谷氨酰胺酶。
动物饲料和食物或饲料添加剂
[00570]本发明提供了使用本发明的葡聚糖酶处理动物饲料和食物和食物 或饲料添加剂的方法,动物包括哺乳动物(例如,人)、鸟类(例如鸡)、爬行动物、 鱼和类似物。本发明提供了含有本发明葡聚糖酶、甘露聚糖酶或木聚糖酶的动物饲 料、食物和添加剂。在一个方面,使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶 处理动物饲料、食物和添加剂可有助于动物饲料或添加剂中的营养素例如淀粉、蛋 白等的利用度。通过破坏很难消化的蛋白或间接或直接暴露淀粉(或其它营养物质), 本发明的酶使营养物质更容易接近其它的内源或外源酶。本发明的酶也可引起很易 消化和很易吸收的营养物质和糖类的释放。在另一方面,本发明的酶可以用于饲料 中以减少食品或饲料,例如高-大麦或高-小麦饮食,诸如家禽饮食中的葡聚糖的粘性。 在一个方面,这可以使稀粪便(wet droppings)最小化。
[00571]当被加入进动物饲料中时,本发明的葡聚糖酶可改善植物细胞壁物 质的体内分解,这部分是由于减小了肠内的粘度(见,例如Bedford等人,Proceedings of the 1st Symposium on Enzymes in Animal Nutrition,1993,pp.73-77),因此可实现动 物对植物营养物质的更好利用。因此,通过在饲料中使用本发明的葡聚糖酶、甘露 聚糖酶或木聚糖酶,动物的生长速率和/或饲料转化率(即,被消化饲料相对于增加 的体重重量)被改善。
[00572]本发明的动物饲料添加剂可以是颗粒状的酶产品,其很容易与饲料 成分混合。可选择地是,本发明的饲料添加剂可形成一种预混合组分。本发明的颗 粒状酶产品可被包被或不包被。酶颗粒的微粒大小可与饲料和预混合组分的大小相 容。这为将酶整合进饲料中提供了一种安全和方便的手段。可选择地是,本发明的 动物饲料添加剂可以是一种稳定的液体组合物。它可以是一种水基或油基的浆液。 见,例如美国专利6,245,546。
[00573]在动物饲料或食物的改变中,本发明的葡聚糖酶、甘露聚糖酶或木 聚糖酶可在体外(通过改变饲料或食物的成分)或体内加工食物或饲料。本发明的 葡聚糖酶、甘露聚糖酶或木聚糖酶可加入至含有很高含量的葡聚糖的动物饲料或食 物组合物中,例如含有来自谷类、谷粒以及类似物的植物物质的饲料或食物。当被 加入至饲料或食物中时,葡聚糖酶可显著地改善含葡聚糖物质例如植物细胞壁的体 内分解,因此可实现动物(例如,人)对植物营养物质的更好利用。在一个方面, 动物的生长速率和/或饲料转化率(即,被消化饲料的重量相对于增加的体重)被改 善。例如,部分消化或不消化的含葡聚糖的蛋白被本发明的葡聚糖酶、甘露聚糖酶 或木聚糖酶完全或部分降解成为肽和半乳糖和/或半乳糖寡聚物,其中这些酶可以与 其它酶联合,例如β-半乳糖苷酶。这些酶消化产物更容易被动物消化。因此,本发 明的葡聚糖酶有助于饲料或食物的能量的有效利用。通过促使含葡聚糖蛋白的降解, 本发明的葡聚糖酶也可改善糖类和非糖类饲料或食物成分如蛋白、脂肪和矿物质的 消化性和摄取。
[00574]在另一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶通过直 接在转基因饲料作物(如,例如转基因植物、转基因种子以及类似物)中表达酶而 被供给,所述转基因作物如谷粒、谷类、玉米、大豆、油菜籽、羽扇豆以及类似物。 如在上面所讨论的,本发明提供了转基因的植物、植物部分和植物细胞,其含有编 码本发明多肽的核酸序列。在一个方面,核酸被表达,这样本发明的葡聚糖酶以可 回收的量被产生。本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可从任何植物或植物 部分中被回收。可选择的是,含有重组多肽的植物或植物部分可用来改善食物或饲 料的性质,例如,改善营养价值、可口性和流变性,或破坏抗营养因子
[00575]在一个方面,本发明提供了在饲料被动物个体消耗之前使用本发明 的葡聚糖酶、甘露聚糖酶或木聚糖酶从饲料中去除寡糖的方法。在这个过程中,形 成了可代谢能值(metabolizable energy value)增加的饲料。除了本发明的葡聚糖酶、 甘露聚糖酶或木聚糖酶以外,可使用半乳糖苷酶、纤维素酶和其组合。在一个方面, 酶以相当于饲料物质重量的大约0.1%至1%的量被加入。在一个方面,饲料是谷类、 小麦、谷粒、大豆(例如,磨碎的大豆)物质。见,例如美国专利6,399,123。
[00576]在另一个方面,本发明提供了在动物饮食中应用本发明的葡聚糖 酶、甘露聚糖酶或木聚糖酶作为营养添加物的方法,这通过制备含有本发明的重组 酶的营养添加物,将该营养添加物给予动物以增加对包含在被动物消化的食物中的 葡聚糖的利用来进行。
[00577]仍在另一个方面,本发明提供了一种可食用的丸状的酶输送基质和 将葡聚糖酶、甘露聚糖酶或木聚糖酶——例如作为一种营养添加物——输送给动物 的应用方法。酶输送基质很容易释放葡聚糖酶,例如一种具有本发明的氨基酸序列 或其至少30个连续氨基酸的酶,其处于含水介质中,例如,动物的消化性液体中。 本发明的酶输送基质可用粒状的可食用载剂制备,载剂选自这样一些成分,如无油 的谷粒胚芽、干草、苜蓿、梯牧草、大豆荚、向日葵籽粉、小麦粗粉以及类似物, 它们很容易将包含在其中的重组酶分散进含水介质中。在应用中,可食用的丸状酶 输送基质被给予动物,将葡聚糖酶输送给动物。合适的基于谷物的基质可包含或来 自任何适合的可食用谷物,如小麦、玉米、大豆、高粱、苜蓿、大麦和类似物。基 于谷物的基质的实例是基于玉米的基质。底物可来自谷物的任何合适的部分,但在 一个方面被批准用于动物饲料的谷物胚芽,如可在潮湿的或干燥的磨粉过程中获得 的玉米胚芽。谷物胚芽在一个方面含有废胚芽,它是油已经被榨出的谷物胚芽,如 通过压榨或己烷或其它溶剂萃取。可选择地是,谷物胚芽被压榨机提取,即油已经 通过压榨被去除。
[00578]本发明的酶输送基质是以分散的多个微粒、小丸或颗粒形式存在。 “颗粒”的含义是被压扁或压紧的微粒,如通过制丸、挤压或类似的压制过程从基质 中去除水分。微粒的这种压缩或压紧也可促进微粒的粒子内粘聚性。例如,通过在 制丸机中将基于谷物的基质制丸来制备颗粒。由此制备的丸被研磨粉碎成适合用 作动物饲料辅料的颗粒大小。由于基质本身被批准用于动物饲料,所以在动物饲料 中它可用作输送酶的稀释剂。
[00579]在一个方面,酶输送基质为颗粒的形式,颗粒大小范围为大约4至 大约400目(USS);在还有一个方面大约8至大约80目;更有大约14至大约20 目。如果谷物胚芽是经溶剂提取被消耗,在制粒机中可能需要使用润滑剂如玉米油, 但如果胚芽是被压榨机提取则通常不需要这样的润滑剂。在本发明的另一个方面, 通过其它的压制或压缩过程来制备基质,例如通过一个模具挤压基于谷物的基质, 并将压出物研磨成合适的颗粒大小。
[00580]酶输送基质可进一步包括多糖成分作为粘合剂以增强基质颗粒的 粘聚性。认为粘合剂可提供另外的羟基,可增强基质颗粒内谷类蛋白之间的键合作 用。进一步认为,额外的羟基基团可通过增强蛋白与淀粉和其它蛋白的氢键结合而 发挥作用。粘合剂可以任何适合的量存在以增强酶输送基质的颗粒的粘聚性。合适 的粘合剂包括一种或多种糊精、麦芽糊精、淀粉,如玉米淀粉、面粉、纤维素、半 纤维素和类似物。例如,基质中谷胚芽和粘合剂的比例(不包括酶)为78%的玉米 胚芽粉和20%重量的玉米淀粉。
[00581]因为本发明的酶释放基质由生物可降解材料制成,基质可能发生酸 败,如通过发霉。为了防止或抑制这种发霉,基质可包括发霉抑制剂,如丙酸盐, 可以任何足以抑制酶释放基质发霉的量存在,因此提供了以稳定剂型存在的输送基 质,其不需要冷冻。
[00582]包含在本发明的酶输送基质和方法中的葡聚糖酶在一个方面是热 稳定的葡聚糖酶,如在此所述,这是为了在制造过程中抵抗葡聚糖酶的灭活,在制 造过程中高温和/或蒸汽可被应用来制备成垛的酶输送基质。在消化含有本发明的酶 输送基质的饲料过程中,水相消化液将引起活性酶的释放。其它类型的热稳定酶和 热稳定的营养添加剂也可被掺入输送基质中,其可在任何类型的含水条件下释放。
[00583]出于许多不同的目的,可以对本发明的酶基质微粒应用包衣,如为 了向动物饲料中添加调味剂或营养添加剂,为了在胃内条件下延缓动物饲料添加剂 和酶的释放,以及类似的目的。或者,可应用包衣来实现功能性的目的,例如在需 要延缓酶从基质微粒中的释放或控制酶将被释放的条件时。包衣材料的组合物可以 是可选择性地被其敏感的试剂(如热、酸、酶或其它化学物质)分解的材料。可选 择地是,对不同的这样的分解剂敏感的两种或更多种包衣可被连续地应用于基质微 粒。
[00584]本发明也专注于制备酶释放基质的过程。根据本发明,该过程包括 提供基于谷粒的基材的多个分散颗粒,其颗粒大小适合用作酶释放基质,其中所述 的颗粒包括由本发明的氨基酸序列编码的葡聚糖酶。在一个方面,该过程包括将酶 释放基质的颗粒压制或压缩成微粒,最优选在一个方面是通过制丸来完成。防霉剂 和粘聚剂,当被应用时,可在任何适合的时间被加入,在一个方面与基于谷粒的基 材以所需的比例在将基于谷粒的基材制丸之前混合。制丸机进料中的含水量在一个 方面上面所示的与最终产物含水量对应的范围,在一个方面大约14-15%。在一个方 面,水分以酶的水制剂形式加入至供给原料中,使该原料达到此含水量。在制丸机 中的温度在一个方面用蒸汽达到大约82℃。制丸机可在任何条件下进行操作,对供 给原料进行足够的操作以提供小丸。对于从含酶组合物中去除水分来说,制丸过程 本身是一个很划算的过程。
[00585]在一个方面,制丸机用1/8英寸乘2英寸的模在100Ib./min.的压力 下在82℃操作,形成小丸,然后在制丸机粉碎室内被粉碎形成分散的多个颗粒,颗 粒大小能够通过8目的筛网但可被保留在20目的筛网上。
[00586]本发明的热稳定葡聚糖酶、甘露聚糖酶或木聚糖酶可用于本发明的 小丸中。它们可以具有很高的最适温度和很高的耐热性,这样可以在至今无法进行 反应的温度下执行酶反应。根据本发明,编码葡聚糖酶的基因(例如,在本发明序 列的任何一条序列中所示的)可用于制备葡聚糖酶、甘露聚糖酶或木聚糖酶(例如, 使用在此所述的GSSMTM),所述酶具有与本发明的葡聚糖酶、甘露聚糖酶或木聚糖 酶不同的特性(在最适pH、最适温度、耐热性、对溶剂的稳定性、比活性、对底物 的亲和力、分泌能力、翻译速率、转录调控以及类似的方面)。而且,本发明的多核 苷酸可被用来筛选通过在此所述的方法制备的葡聚糖酶、甘露聚糖酶或木聚糖酶变 异体,以确定那些具有所需活性的变异体,如具有改善或改变的热稳定性或耐热性 的变异体。例如,美国专利5,830,732描述了测定葡聚糖酶的耐热性的筛选试验。
[00587]在一个方面,在动物饲料中的本发明的葡聚糖酶、甘露聚糖酶或木 聚糖酶在动物胃中具有活性。因此,在一个方面,例如在饲料中的本发明的酶在约 37℃、在单胃动物的低pH(pH2-4)和反刍动物的中性pH(pH 6.5-7)中具有活性。本 发明的酶经得住动物内脏中的酶,例如蛋白酶的作用,在与饲料微粒化有关的较高 温度中保持稳定。在一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶用于饲 料添加剂,例如单胃动物饲料,并且具有较高的比活性,例如在35-40℃,和pH 2-4 具有活性,在SGF中半衰期大于30分钟;在配制状态的85℃温度中半衰期>5分钟。 对于反刍动物饲料,在饲料添加剂中的本发明葡聚糖酶、甘露聚糖酶或木聚糖酶具 有较高的比活性,例如在5-40℃,和pH 6.5-7.0具有活性,在SRF中半衰期大于30 分钟,在浓缩的干粉中具有稳定性。
[00588]本发明的动物饲料和动物饲料生产工艺也可包括与其他酶的任何 组合,这些其他酶诸如过氧化氢酶、其他葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4- 葡聚糖酶、淀粉糖苷酶、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化 酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖 淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、 植酸酶、阿拉伯聚糖酶、半纤维素酶、其他甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、 果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖 酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/ 或转谷氨酰胺酶。
废物处理
[00589]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于其它的各种工业 应用中,例如用在废物处理(除了例如将生物量转化为燃料)中。例如,在一个方 面,本发明提供了使用本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的固体废物消化 过程。该法可包括减少基本上未处理的固体废物的质量和体积。固体废物可在酶溶 液(包括本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶)存在的情况下用一种酶消化 过程在可控的温度下进行处理。这种反应不需要添加微生物形成明显的细菌发酵。 固体废物被转变为液化的废物和残余的固体化废物。得到的液化废物可与所述的任 何残余的固化废物分离。见,例如美国专利5,709,796。
[00590]本发明的废物处理工艺也可包括使用与其他酶的任何组合,这些其 他酶诸如过氧化氢酶、其他葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、 淀粉糖苷酶、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、磷脂酶、脂氧化酶、β-葡聚 糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、 果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、植酸酶、 阿拉伯聚糖酶、半纤维素酶、其他甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙 酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白酶、肽酶、蛋白酶、聚半乳糖醛酸酶、 鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、 纤维二糖水解酶和/或转谷氨酰胺酶。
口腔护理产品
[00591]本发明提供了含有本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的口 腔护理产品。示范性的口腔护理产品包括牙膏、牙乳剂、凝胶或牙粉、洗牙剂、漱 口剂、刷牙前或后的漱口剂、口香糖、止咳糖或冰糖。见,例如美国专利6,264,925。
[00592]本发明的口腔护理产品可包括与其他酶的任何组合,这些其他酶诸 蛋白酶、肽酶、蛋白酶、葡萄糖氧化酶、过氧化物酶、葡聚糖酶、纤维素酶、内切 糖苷酶、内-β-1,4-葡聚糖酶、淀粉糖苷酶、内-β-1,3(4)-葡聚糖酶、淀粉糖苷酶和糖 苷酶。
酿造和发酵
[00593]本发明提供了酿造(例如,发酵)含有本发明的葡聚糖酶、甘露聚 糖酶或木聚糖酶的啤酒的方法。在一个示范性的过程中,含有淀粉的原材料被分解 和加工形成麦芽。本发明的酶被用在发酵过程中的任何时候。例如,本发明的葡聚 糖酶、甘露聚糖酶或木聚糖酶被用于酿造工业中,用来降解β-葡聚糖。在一个方面, 本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶被用于酿造工业中,用来澄清饮料。
[00594]在一个方面,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以被用 于处理大麦麦芽。啤酒酿造的主要原材料是大麦麦芽。这是一个三阶段的过程。首 先,大麦谷粒被浸泡以增加含水量,例如,大约40%左右。第二,当在赤霉素控制 下刺激酶合成时,在15至25℃孵育3至6天可使谷粒发芽。在一个方面,本发明 的酶在所述过程的这个阶段(或任何其它阶段)被加入。
[00595]在一个方面,本发明的酶用于糖化和转化过程。在酿造和发酵工业 中,糖化和转化过程在一定的温度中进行,该一定的温度太低以至于不能促进水溶 性葡聚糖和木聚糖进行足够的降解。这些聚合物形成胶粘性的底物,这会使得糖化 的麦芽汁的粘性增加,从而在最终啤酒产品中产生较长的糖化醪过滤(run-off)时间、 残留的浑浊和沉淀物,这是由于过滤效率不足和萃取量低的缘故。对于这些理由, 在酿造过程中加入酶来降解β-1,4-和β-1,3-键连接的葡聚糖。
[00596]在一个方面,本发明的酶用于麦牙坊操作中,例如将葡聚糖酶加入 到生产用水中,来缩短发芽时间和/或促进将质量差的大麦转化成可接受的麦芽。在 一个方面,本发明的酶用于糖化,例如添加本发明的酶以增加可滤性和/或改善过滤。 在一个方面,本发明的酶用于发酵罐和/或沉淀罐(settling tank),以例如帮助清除浑 浊和/或提高过滤水平。在一个方面,本发明的酶用于添加料酿造中,例如加入本发 明的葡聚糖酶以降解大麦、小麦和/或其他谷物中的葡聚糖,包括麦芽中的葡聚糖。 在一个方面,本发明的酶用于麦芽酿造,例如加入本发明的葡聚糖酶以改变葡聚糖 含量高的劣等麦芽。
[00597]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用于任何啤酒或酒精 饮料的生产过程中,其描述例如,见美国专利5,762,991;5,536,650;5,405,624; 5,021,246;4,788,066。
[00598]本发明的酿造工艺也可包括使用与其他酶的任何组合,这些其他酶 诸如其他木聚糖酶、酯酶、纤维素酶、果胶酶、果胶裂解酶、淀粉酶、脱羧酶、漆 酶、葡聚糖酶、蛋白酶、肽酶、蛋白酶、淀粉糖苷酶、葡萄糖异构酶、葡糖淀粉酶、 β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、半纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、 葡萄糖苷转移酶、磷脂酶、脂氧化酶、还原酶、氧化酶、酚氧化酶、木质素酶、支 链淀粉酶、阿拉伯聚糖酶、其他甘露聚糖酶、木糖葡聚糖酶、果胶乙酰酯酶、鼠李 半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、转 谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
医学和研究应用
[00599]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶由于其溶菌的特性和抗 真菌特性,可用作抗微生物试剂。本发明的葡聚糖酶可用来消灭沙门氏菌,或保护 动物免受沙门氏菌感染,其描述见,例如PCT申请WO0049890和WO9903497。本 发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于糖酶和/或葡聚糖酶的组合物和使 用方法,其用于制备用于治疗和/或预防球虫病的试剂。制备得到的试剂可以是以谷 物为基础的动物饲料形式的(参见例如美国专利5,624,678)。
钻探应用
[00600]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于改变植物衍 生的物质的粘性。在一个方面,本发明的酶可以用于石油工业,在石油工业中瓜 尔豆胶和修饰的瓜尔豆被用于例如破碎液体和钻探泥浆。本发明的酶可以用于清 洗油井,例如分解破碎之后破碎液体中的高粘度结构或凝胶结构。在一个方面, 用于这些应用领域中的本发明的酶具有高热稳定性。在一个方面,用于这些应用 领域中的本发明的酶能经受住地面中或钻探过程中产生的高温。本发明的葡聚糖 酶、甘露聚糖酶或木聚糖酶可以用于处理钻探泥浆(例如使用的泥浆)。
其它工业应用
[00601]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可用在各种食物、动物 饲料和饮料应用中。通过筛选已存在的文库和从多种嗜温和中度嗜热场所以及从目 标来源——包括消化性植物、动物废物中的微生物、土壤细菌和高度碱性栖息地—— 构建出的DNA文库来发现新的葡聚糖酶、甘露聚糖酶或木聚糖酶。使用含葡聚糖的 底物和/或动物饲料物质中的不溶性多糖组分来进行生物俘获(biotrap)和初步的富 集策略也是有用的。
[00602]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于将生物量转化 为燃料,和用于生产乙醇,例如如PCT申请WO043496和WO100857中所述。本发 明的葡聚糖酶可以用于生产可发酵的糖类和含葡聚糖的生物量,它们可以转化为燃 料乙醇。
[00603]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以与参与纤维素消化 的其他酶,例如纤维二糖水解酶和β-糖苷酶联合使用。
[00604]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用于许多其他应用 中。例如,本发明的葡聚糖酶可以用于改善泌乳母牛乳蛋白生产的质量和数量(参 见例如Kung,L.,et al,J.Dairy Science,2000 Jan 83:115-122),增加猪的胃和小肠中的 可溶性糖的数量(参见例如van der Meulen,J.et al,Arch.Tierernahr,2001 54:101-115), 提高母鸡后期产蛋效率和鸡蛋产量(参见例如Jaroni,D.,et al,Poult.Sci.,1999 June 78: 841-847)。此外,本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶可以用作面粉、面团和 面包改良剂(参见例如美国专利5,108,765和5,306,633),作为饲料添加剂和/或补充物, 如上所述(参见例如美国专利5,432,074、5,429,828、5,612,055、5,720,971、5,981,233、 5,948,667、6,099,844、6,132,727和6,132,716),用于制造纤维素溶液(参见例如美国 专利5,760,211)。包含本发明葡聚糖酶、甘露聚糖酶或木聚糖酶的洗涤剂组合物可以 用于水果、蔬菜和/或泥和粘土化合物(参见例如美国专利5,786,316)。
[00605]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的其他用途包括用于产 生水溶性的膳食纤维(参见例如美国专利5,622,738),用于改善可滤性,分离和产生 淀粉(参见例如美国专利4,960,705和5,023,176),用于饮料工业,改善麦芽汁或啤 酒的可滤性(参见例如美国专利4,746,517),用于促进家畜分泌奶和提高奶质量的酶 组合物(参见例如美国专利4,144,354),用于减小植物物质的粘性(参见例如美国专利 5,874,274),用于增加食物产品诸如果酱、橘子酱、果冻、糊剂、汤、沙拉等的粘性 或凝胶强度(参见例如美国专利6,036,981)。葡聚糖酶、甘露聚糖酶或木聚糖酶也可 以用于选择性地水解半纤维素,特别是在纤维素存在下。此外,纤维素酶丰富的截 留物质适于水解纤维素(参见例如美国专利4,725,544)。
[00606]本发明的葡聚糖酶、甘露聚糖酶或木聚糖酶的各种用途包括产生乙 醇的微生物转化(参见例如PCT申请WO99/46362),用于生产酿酒产生的丹宁酸和酶 组合物(参见例如PCT申请WO0164830),用于激发植物的自然抵御能力(参见例如 PCT申请WO0130161),用于从半纤维素物质生产糖(参见例如PCT申请 WO9203541),用于清洗含土的水果、蔬菜、泥或粘土(参见例如PCT申请 WO9613568),用于清洗啤酒过滤膜(参见例如PCT申请WO9623579),用于杀死或 抑制微生物细胞(参见例如PCT申请WO9732480)的方法中,用于通过使用两个UV 吸收测量值的比例和比较光谱来测定来自木浆漂白的工业用水的特性(参见例如PCT 申请WO9840721)。
[00607]本发明的任何产品和方法可以包括其他酶的任何组合,这些其他 酶诸如:过氧化氢酶、葡聚糖酶、纤维素酶、内切糖苷酶、内-β-1,4-葡聚糖酶、淀 粉糖苷酶(amyloglucosidases)、葡萄糖异构酶、葡萄糖苷转移酶、脂酶、酯酶、 磷脂酶、脂氧化酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆 酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质 素酶、支链淀粉酶、植酸酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡 聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸 酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基 酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。
[00608]两种筛选形式(基于活性和基于序列)可用于发现新的葡聚糖酶、 甘露聚糖酶或木聚糖酶。基于活性的方法是直接在琼脂平板上采用底物如AZO-大麦 β葡聚糖(Megazyme)来筛选葡聚糖酶活性。可选择的是,可使用基于序列的方法, 这是根据生物信息学和分子生物学来为杂交和生物淘选(biopanning)设计探针。见, 例如美国专利6,054,267、6,030,779、6,368,798、6,344,328。为了进行基本的生物化 学定性,筛选得到的命中物可被纯化、测序、定性(例如,测定特异性、温度和最 适pH)、使用生物信息学进行分析、亚克隆和表达。这些方法可用来筛选可用于大 量应用中的葡聚糖酶、甘露聚糖酶或木聚糖酶,包括用于面团改进和作为动物饲料 添加酶的木聚糖酶。
[00609]在对由筛选获得的酶进行定性的过程中,可以评价在面团加工和烘 烤应用中的实效。定性可以包括,例如,测定底物的特异性(葡聚糖、CMC、BBG)、 温度和pH稳定性和比活。市售的酶可用作基准。在一个方面,本发明的酶在pH=7 和25-35℃具有显著活性,对不溶的葡聚糖是无活性的,在50-67%蔗糖中是稳定和 有活性的。
[00610]在另一个方面,可通过候选酶的表征来评价作为饲料添加剂的实 效。表征可以包括,例如测量底物的特异性(葡聚糖、CMC、BβG)、温度和pH稳 定性、比活和胃内的稳定性。在一个方面,为单胃动物设计饲料,在另一方面,为 反刍动物设计饲料。在一个方面,本发明的酶在pH2-4和35-40℃具有显著的活性, 在胃液中的半衰期超过30分钟,在85℃时剂型(在缓冲液或细胞中)的半衰期超 过5分钟,它们可用作单胃动物的饲料添加剂。在另一个方面,本发明的酶具有一 种或多种以下的特性:在pH 6.5-7.0和35-40℃具有显著的活性、在瘤胃流体中的半 衰期超过30分钟、与干粉同样稳定的剂型稳定性、可用作反刍动物的饲料添加剂。
[00611]酶对于很大范围的天然底物和非天然底物酶都是具有反应性的,因 此这使得实际上任何有机先导化合物(lead compound)的修饰都成为可能。而且, 不同于传统的化学催化剂,酶是高度对映选择性和区域选择性的。酶所显示的高度 的功能基团特异性使人们能够追踪可导致产生新的活性化合物的合成顺序中的每一 个反应。酶也能够催化许多与其生理功能在自然状态下不相关的各种反应。例如, 过氧化物酶可通过过氧化氢催化苯酚的氧化。过氧化物酶也可催化与该酶的天然功 能不相关的羟基化反应。其它的实例是可催化多肽分解的葡聚糖酶。在有机溶液中, 一些葡聚糖酶也可酰化糖类,该功能与这些酶的天然功能不相关。
[00612]本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的 或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特 定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反 应条件是对于存在于很多起始化合物中的功能基团具有特异性的。每种生物催化剂 对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有这一功能基 团的许多起始化合物反应。生物催化反应可以从单一的起始化合物生产出一个群体 的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化 合物。通过生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。
[00613]酶可以在起始化合物的特定位点发生反应而不影响分子的其它部 分,该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用 于在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列 生物催化反应来表征,这也称为“生物合成历史”。对该文库的生物活性的筛选和对 生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序, 并确认合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法, 并不需要固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由 合成和测试。重要的是,要注意到,酶反应在功能基团上的高度特异性允许“追踪” 制备出了生物催化产生的文库的特定酶促反应。
[00614]许多程序化的步骤可使用机器人自动化来实施,这使得每天可进行 几千个生物催化反应和筛选测定,并保证高水平的准确性和可重复性。结果是,可 在几周内产生衍生化合物的文库,使用现今的化学方法需要几年才能产生。(对于包 括小分子在内的分子修饰的进一步教导,见PCT/US94/09174)。
[00615]本发明进一步通过下面的实施例进行说明;但要理解的是本发明不 受这些实施例的限制。
实施例
实施例1:基于平板的糖苷内切酶(endoglycosidase)的酶发现:表达筛选
[00616]下述实施例显示了本发明示范性酶的酶活性和核酸的分离和确定。 这些测定方法也可以用于测定多肽是否具有本发明范围内的必需的酶(例如葡聚糖 酶、甘露聚糖酶或木聚糖酶)活性。
[00617]λ文库的滴定测定;向600μL大肠杆菌MRF细胞(OD600=1.0)中 加入1.0μL的λ Zap Express扩增文库母液。用10mM MgSO4稀释MRF母液。在37℃ 孵育混合物15分钟,然后将悬液转移至50℃的5-6mL的NZY上层琼脂中,并轻 轻混合。迅速将琼脂溶液倾倒至大的(150mm)NZY培养基平板上,使上层琼脂完 全固化(大约30分钟)。倒转平板。将平板在39℃孵育8-12小时。(噬菌斑的数目 被估计。测定的噬菌体滴度(titer,效价)达到50,000pfu/板。如果需要,用SM缓 冲液稀释一小等份的文库噬菌体。)
[00618]底物筛选:向600μL大肠杆菌MRF′细胞(OD600=1.0)中加入来自 扩增文库的λ Zap Express(50,000pfu),在37℃孵育15分钟。在噬菌体/细胞悬液 被孵育的同时,向50℃的5.0mL NZY上层琼脂中加入1.0mL所需的多糖染料标记 的底物(通常1-2%w/v),并充分混合。(溶液保持在50℃备用。)将细胞悬液转移 至底物/上层琼脂溶液中,并轻轻混合。迅速将溶液倾倒至大的(150mm)NZY培养 基平板上,使上层琼脂完全凝固(大约30分钟),然后倒转平板。在39℃孵育平板 8-12小时。观察平板中噬菌斑周围的透明圈(晕)。带有晕的中心噬菌斑被移出琼脂 并转移至无菌的微量管中。(大内径的200μL吸管的尖部可很好地移出含有所需噬 菌斑的(中心的)琼脂块。)将噬菌体重悬在500μLSM缓冲液中。加入20μL氯仿 以抑制细胞的进一步生长。
[00619]分离纯克隆:向500μL大肠杆菌MRF′细胞(OD600=1.0)中加入5μL 重悬的噬菌体悬液。在37℃孵育15分钟。在噬菌体/细胞悬液被孵育的同时,向50℃ 的3.0mL NZY上层琼脂中加入600μL所需的多糖染料标记的底物(通常1-2%w/v), 并充分混合。(溶液保持在50℃备用。)将细胞悬液转移至底物/上层琼脂溶液中, 并轻轻混合。迅速将溶液倾倒至小的(90mm)NZY培养基平板上,使上层琼脂完 全凝固(大约30分钟),然后倒转平板。在39℃孵育平板8-12小时。观察平板中 单个噬菌斑(纯克隆)周围的透明圈(晕)。(如果不能分离出单个噬菌斑,调整滴 度,重新在板上涂布噬菌体悬液。)将噬菌体重悬在500μL SM缓冲液中,加入20μL 氯仿以抑制细胞的进一步生长。
[00620]切除纯克隆:使纯的噬菌体悬液在室温孵育2至3小时或4℃过夜。 向200μL大肠杆菌MRF′细胞(OD600=1.0)中加入100μL纯的噬菌体悬液。加入1.0μL 的ExAssist辅助噬菌体(hepler phage)(>1×106pfu/mL;Stratagene)。在37℃孵育 悬液15分钟。向细胞悬液中加入3.0mL 2×YT培养基。37℃孵育2-2.5小时同时振 摇。转移管至70℃20分钟。转移50-100μL的噬粒悬液至含有200μL的大肠杆菌 Exp 505细胞(OD600=1.0)的微量管中。在37℃孵育悬液45分钟。将100μL细胞 悬液涂布至LBkan50培养基(LB培养基,含有卡那霉素50μg/mL)中。在37℃孵育 平板8-12小时。观察平板的集落。生长的任何集落都含有纯的噬粒。挑出集落,在 小的(3-10mL)液体培养中生长8-12小时。培养基是液体LBkan50。
[00621]活性检验:将1.0mL的液体培养物转移至无菌的微量管中。在13200 rpm(16000g′s)离心1分钟。弃去上清液,加入200μL磷酸盐缓冲液,pH 6.2。在 冰上使用微型探头超声破碎5至10秒。加入200μL合适的底物,轻轻混合,在37℃ 孵育1.5-2小时。还要有仅含有缓冲液和底物的阴性对照。向悬液中加入1.0mL无水 乙醇(200proof)并混合。在13200rpm离心10分钟。观察上清液的颜色。显色的 量可有变化,但显色超过对照的任何管都被认为是阳性,也就是有活性。如果需要, 在此步骤中可使用分光光度计。(对于Azo-大麦β葡聚糖,Megazyme,在590nm读 数。)
[00622]来自相同文库的纯克隆的RFLP(限制性片段长度多形性分析):将 1.0mL的液体培养物转移至无菌的微量管中。13200rpm(16000g′s)离心1分钟。 根据QIAprep spin mini kit(Qiagen)的实验手册进行质粒分离,使用40μL的纯净 水(holy water)作为洗脱缓冲液。将10μL的质粒DNA转移至无菌的微量管中。加 入1.5μL缓冲液3(New England Biolabs)、1.5μL 100X BSA溶液(New England Biolabs)和2.0μL holy water。向其中加入1.0μL Not1和1.0μL Pst 1限制性核酸内切 酶(New England Biolabs)。37℃孵育1.5小时。加入3.0μL 6X上样缓冲液(Invitrogen)。 将15μL的被消化的样品在1.0%琼脂糖凝胶上于120伏电泳1-1.5小时。用凝胶成像 仪观察凝胶。在所有克隆上使用不同消化模式进行序列分析。
[00623]图5是含有本发明酶的表征的表格,包括概述了若干本发明的示范 性酶在各种条件下的相对活性,例如变化的pH和温度,如上所述。
实施例2:活性测定
[00624]下面的实施例示出了本发明的示范性酶的酶活性。这些测定也可 以用于测定多肽是否具有在本发明范围内的必需的(例如葡聚糖酶、甘露聚糖酶或 木聚糖酶)酶活性。
[00625]具有下面列出的SEQ ID NO:s中示出的序列的本发明的多肽显示 具有葡聚糖酶活性,如下所述。使用BCA还原糖测定方法测定了大麦β-葡聚糖 (BBG)或羧甲基纤维素(CMC)上的比活性。1单位(U)的葡聚糖酶活性=在37℃,pH 5.3时释放的1μmol/分钟-1葡萄糖还原等同物。



ND=未测定
[00626]具有下面SEQ ID NO:s中示出的序列的本发明的示范性多肽,显 示具有碱性内切葡聚糖酶/纤维素酶活性,最适pH和温度阐述如下。该活性使用 纤维素酶活性测定方法(BCA还原端测定方法)进行测定,如下面实施例3中详细 描述。
  SEQ ID NO: 类型 最适pH 最适温度 409,410 碱性内切葡聚糖酶/纤维素酶 5 NA 343,344 碱性内切葡聚糖酶/纤维素酶 6 60 319,320 碱性内切葡聚糖酶/纤维素酶 6 70 383,384 碱性内切葡聚糖酶/纤维素酶 7 60 301,302 碱性内切葡聚糖酶/纤维素酶 7 60 257,258 碱性内切葡聚糖酶/纤维素酶 8 42 419,420 碱性内切葡聚糖酶/纤维素酶 8 70 421,422 碱性内切葡聚糖酶/纤维素酶 9 60 405,406 碱性内切葡聚糖酶/纤维素酶 9 50 329,330 碱性内切葡聚糖酶/纤维素酶 9 50 325,326 碱性内切葡聚糖酶/纤维素酶 (5-7)* 70 415,416 碱性内切葡聚糖酶/纤维素酶 (6-10)* 70 303,304 碱性内切葡聚糖酶/纤维素酶 (6-10)* 60 271,272 碱性内切葡聚糖酶/纤维素酶 (6-7)* 60 175,176 碱性内切葡聚糖酶/纤维素酶 (6-7)* 70
  9,10 碱性内切葡聚糖酶/纤维素酶 (6-7)* 70 297,298 碱性内切葡聚糖酶/纤维素酶 (6-8)* 50 109,110 碱性内切葡聚糖酶/纤维素酶 (6-8)* 60 267,268 碱性内切葡聚糖酶/纤维素酶 (6-8)* 70 107,108 碱性内切葡聚糖酶/纤维素酶 (6-8)* 70 305,306 碱性内切葡聚糖酶/纤维素酶 (7-10)* 60 417,418 碱性内切葡聚糖酶/纤维素酶 (7-8.5)* NA 227,228 碱性内切葡聚糖酶/纤维素酶 (7-9)* 60 375,376 碱性内切葡聚糖酶/纤维素酶 (7-9)* 70 335,336 碱性内切葡聚糖酶/纤维素酶 (7-9)* 50 155,156 碱性内切葡聚糖酶/纤维素酶 (7-9)* 60 445,446 碱性内切葡聚糖酶/纤维素酶 (7-9)* 60 259,260 碱性内切葡聚糖酶/纤维素酶 (8-10)* 50 423,424 碱性内切葡聚糖酶/纤维素酶 (8-10)* 50 345,346 碱性内切葡聚糖酶/纤维素酶 (8-9)* 25 285,286 碱性内切葡聚糖酶/纤维素酶 (8-9)* 50 351,352 碱性内切葡聚糖酶/纤维素酶 (9-10)* 80
实施例3:纤维素酶活性测定:BCA还原端测定
[00627]下面的实施例描述了测定方法,纤维素酶活性测定方法(BCA还 原端测定),用于测定测定多肽是否具有本发明范围内的必需的酶(例如葡聚糖酶、 甘露聚糖酶或木聚糖酶)活性,例如碱性内切葡聚糖酶/纤维素酶活性(参见上面 的实施例2)。
[00628]该测定方法设计用于测量在高通量多样品96-孔形式中,酶法降解 羧甲基纤维素(carboxymethylcellulose(CMC))期间产生的还原端的数量。
材料:
底物溶液:
1% CMC
将1gm的CMC溶解在pH~4的100ml 50mM Britton-Robinson缓冲液中,在沸 水浴中加热CMC溶液,同时混合,进行20-40分钟,直到它溶解(溶液将依然出现 微微的乳白色,但是半透明)。用1M NaOH或HCl调节到理想的pH。
溶液A:
64mg/ml一水碳酸钠
24mg/ml碳酸氢钠
1.95mg/ml BCA(4,4′-二羧基-2,2′-联二喹啉二钠盐(Sigma Chemical cat # D-8284)
将上述物质加入到dH2O中,
可能需要通过加热溶解BCA,但不要加热超过~80℃。
溶液B:
1.24mg/ml五水硫酸
1.26mg/ml L-丝氨酸
将上述物质加入到dH2O。
工作试剂:
以1:1的溶液A和B,每天制备新鲜的工作试剂混合物(通常只制备足以进行每 次测定的量),每周制备新鲜的溶液A和B。
葡萄糖贮存溶液:
将10mM葡萄糖溶于dH2O中。0.2μm过滤,保存在4℃。
葡萄糖标准物:
在理想的pH,将10mM的葡萄糖贮存物稀释在1%的CMC中,浓度为0、100、 200、300、400、500μM。因为曲线通过将10μl的标准物加入到工作试剂中而进 行测定,它作出至0-0.005μmole葡萄糖/孔。需要对每板的样品时间-点作出标准 曲线,因为加热循环可能会影响观察到的信号的数量。
方法:
准备:
将1ml的底物溶液(1% CMC)等份加入到深孔平板中(如果使用环境温度),或加入 到加热-装置(hot-block)中的Acme-管中,在加热装置或热水浴中平衡至理想的 温度(~5分钟)。
当平衡溶液时,制备10ml的工作试剂,并将100μl等份分入96孔PCR-板中。将 板置于冰上。
反应/取样:
温度平衡完毕之后,将酶溶液加入到底物溶液中。通过移液管上下吸取,立即混 合。立即将10-μl等份分入PCR-板(也就是t=0,零时间点)。在每一时间点(例如0、 2、5、10、15、20、30分钟),将10-μl等份分入PCR-板。
每次加入10μl的葡萄糖标准物,省下板上的最后一排(即在它们中,孔将只有100-μl 的工作试剂)。
测定显色(Assay Color Development):
当收集所有时间点,和加入标准物后,覆盖板,并用PCR仪加热至100℃10分钟。 在冰上冷却板5-10分钟(或将PCR仪设置至1℃10分钟)。
将100μl的H2O加入到孔。将100μl的混合物等份分入干净的平底96-孔板中, 并读取560nm时的吸光度。
生成标准曲线:
由含有葡萄糖标准物的孔,作A560对μmole葡萄糖的图。使用线性回归法,计算 斜率(Sstd)。
生成反应斜率的图:
作A560对时间点的图。将每一样品时间点针对它自己的T=0调整为零(即从同一 样品的所有其他时间点减去样品的T=0吸光度)。产生每一组样品时间点的斜率 (Srnx)(A560/时间)。
活性测定:
用Sstd除Srxn,乘以100(因为检测到的μmole产物是用于测定的10-ul中的还原端 的数量,不是1ml酶反应中产生的总数量)。
比活性测定:
用加入到1-ml反应中的总mg的蛋白质除活性(以μmole/分钟为单位)。用 Bradford或类似测定方法测定蛋白质浓度。
用任何使用的稀释物除蛋白质浓度。
乘以用于反应的体积(ml)。
所有的点应该进行两次,三次更好。
下面的表表示出了示范组的数据(“样品数据”),其以图的形式作为“标准曲线” 在图6中示出。

实施例4:密码子优化
[00629]下面的实施例示出了对本发明示范性的编码酶的序列进行示范性 的密码子优化作用。本领域已知的任何密码子优化方案都可以用于对任何本发明 核酸进行密码子优化。
[00630]对编码具有SEQ ID NO:6中示出的序列的多肽的示范性核酸,即 SEQ ID NO:5进行密码子优化作用,以在巴斯德毕赤酵母中获得最佳表达;巴斯德 毕赤酵母密码子优化的、编码酶的核酸是SEQ ID NO:463。除了优化编码酶的核酸 的密码子外,也对一个氨基酸(A91V)进行修饰,该新的多肽序列如SEQ ID NO:464 所示。
[00631]葡聚糖酶活性测定(它的数据在图7和8中示出)显示SEQ ID NO:464(由例如由SEQ ID NO:463编码)在巴斯德毕赤酵母中的表达提高,SEQ ID NO:464是密码子优化形式的多肽,具有SEQ ID NO:6(例如由SEQ ID NO:5编码) 中示出的序列。通过改变pH表达水平被提高。
[00632]在图7中,发酵期间的葡聚糖酶活性用U/mL的培养物表示。1单 位(U)的葡聚糖酶活性=在37℃,pH 5.3时释放的1μmol/分钟-1葡萄糖还原等同物。 使用在巴斯德毕赤酵母中表达的密码子-优化了的葡聚糖酶SEQ ID NO:464(由 SEQ ID NO:463编码)。发酵在pH5.0中实施。
[00633]在图8中,发酵期间的葡聚糖酶活性用U/mL的培养物表示。1单 位(U)的葡聚糖酶活性=在37℃,pH 5.3时释放的1μmol/分钟-1葡萄糖还原等同物。 使用在巴斯德毕赤酵母中表达的密码子-优化了的葡聚糖酶SEQ ID NO:464(由 SEQ ID NO:463编码)。发酵在pH 6.2中实施。
实施例5:酶活性
[00634]下述实施例示出了本发明示范性酶的酶活性的测定。这些测定方法 也可以用于测定多肽是否具有本发明范围内的必需的酶(例如葡聚糖酶、甘露聚糖 酶或木聚糖酶)活性。
由SEQ ID NO:6编码的葡聚糖酶的比活性
[00635]具有SEQ ID NO:6中示出的序列的本发明示范性酶(由例如SEQ ID NO:5编码)的比活性使用下述方案显示:
[00636]使用离子交换层析将由SEQ ID NO:6编码的葡聚糖酶纯化成均匀 一致。使用BCA还原糖测定方法,于37℃,在pH 5.3的50mM醋酸钠缓冲液中, 在1%底物上测定比活性。1单位(U)的葡聚糖酶活性=在37℃,pH 5.3时释放的 1μmol/分钟-1葡萄糖还原等同物。
o大麦β葡聚糖(BBG):30U/mg
o燕麦β葡聚糖(OBG):38U/mg
o羧甲基纤维素(CMC):40U/mg
o稻子豆(Carob)半乳甘露聚糖:0.3U/mg
由SEQ ID NO:6编码的葡聚糖酶的温度曲线
[00637]以三种独立的底物(BBG、OBG和CMC)测定温度曲线。在较高的 温度中,由SEQ ID NO:6编码的葡聚糖酶具有最高的活性。在BBG和CMC上, 由SEQ ID NO:6编码的葡聚糖酶在80℃时的比活性比37℃看到的活性高10×倍。 存在甘露聚糖时,在100℃,由SEQ ID NO:6编码的葡聚糖酶显示出最高的酶活性, 如图9所示。
[00638]在底物(CMC、BBG或甘露聚糖酶)存在下,通过温育BD10,测定 温度曲线。使用BCA还原糖测定方法和醋酸钠缓冲液(pH 5.3),测定起始速率。 将起始速率标准化,以%活性作图,如图9所示。
由SEQ ID NO:6编码的葡聚糖酶的半衰期测定
[00639]在85℃和90℃,测定由SEQ ID NO:6编码的葡聚糖酶的半衰期。 在85℃和90℃,热处理由SEQ ID NO:6编码的葡聚糖酶不同的时间,在37℃测量 残余活性。在85℃温育10分钟之后,由SEQ ID NO:6编码的葡聚糖酶保留它60% 以上的活性。在90℃,2分钟之后,没有留下残余活性,如图10所示。
[00640]如图10所示,通过在指示温度(85℃和90℃)热处理酶30秒、1分 钟、2分钟、3分钟、4分钟、5分钟、和10分钟,并使用BCA还原糖在标准条 件下检测活性,来测定BD10的半衰期。
[00641]本发明已经就某些示范性的方面进行了详述,但要理解的是,修饰 和变化都包含在被描述和要求保护的精神和范围之内。
参阅提交在光盘上的序列表
[0001]本申请包括光盘(一式四份提交),该光盘中含有序列表。序列表的全 部内容通过参考并入本文。序列表在光盘上标识如下:  文件名 创建日期 大小(字节) 序列表.txt 2004年7月2日 1,562,624
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈