用于处理木质纤维素的酶、编码它们的核酸及其制备和应用方法专利检索-巴斯德消毒法食品加工与设备专利检索查询-专利查询网

用于处理木质 纤维素的酶、编码它们的核酸及其制备和应用方法

阅读：912发布：2020-06-11

专利汇可以提供用于处理木质纤维素的酶、编码它们的核酸及其制备和应用方法专利检索，专利查询，专利分析的服务。并且本发明提供了具有木质纤维素水解活性，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、木糖苷酶(例如，β-木糖苷酶)、阿拉伯呋喃糖苷酶和/或葡萄糖氧化酶活性的多肽，编码这些多肽的多核苷酸以及制备和使用这些多核苷酸和多肽的方法。在一方面，本发明提供了能够酶促处理(水解) 甘蔗渣的多肽，即用于甘蔗渣降解或用于生物质处理的多肽，和编码这些酶的多核苷酸以及制备和使用这些多核苷酸和多肽。在一种实施方式中，本发明提供了本发明的热稳定和耐热形式的多肽。本发明的多肽可以用于各种药物、农业和工业环境；例如，本发明提供了多酶系统，其能够水解糖工厂中处理的甘蔗的甘蔗渣成分中的多糖。本发明提供了用于将木质纤维素残余物生物转化成可发酵糖的酶；并且这些糖可以作为化学原料使用，用于生产乙醇和燃料，包括生物燃料如生物乙醇、生物丙醇、生物丁醇和生物柴油。，下面是用于处理木质纤维素的酶、编码它们的核酸及其制备和应用方法专利的具体信息内容。

权利要求

1.分离的、合成的或重组的核酸，其包括：
(a)核酸序列(多核苷酸)，其与如下序列在至少大约20、30、40、50、75、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050、1100、1150或更多个残基，或cDNA、转录体(mRNA)或基因全长的区域内，具有至少50％、51％、52％、53％、54％、55％、 56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、 69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、 82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、 95％、96％、97％、98％、99％或更高或完全(100％)的序列同一性：SEQ ID NO：1、 SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、 SEQ ID NO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、 SEQ ID NO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、 SEQ ID NO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、 SEQ ID NO：167、SEQ ID NO：169、SEQ ID NO：171、SEQ ID NO：173、SEQ ID NO：175、SEQ ID NO：177、SEQ ID NO：179、SEQ ID NO：181、SEQ ID NO：183、 SEQ ID NO：185、SEQ ID NO：187、SEQ ID NO：189、SEQ ID NO：191、SEQ ID NO：193、SEQ ID NO：195、SEQ ID NO：197、SEQ ID NO：199、SEQ ID NO：201、 SEQ ID NO：203、SEQ ID NO：205、SEQ ID NO：207、SEQ ID NO：209、SEQ ID NO：211、SEQ ID NO：213、SEQ ID NO：215、SEQ ID NO：217、SEQ ID NO：219、SEQ ID NO：221、SEQ ID NO：223、SEQ ID NO：225、SEQ ID NO：227、SEQ ID NO：229、 SEQ ID NO：231、SEQ ID NO：233、SEQ ID NO：235、SEQ ID NO：237、SEQ ID NO：239、SEQ ID NO：241、SEQ ID NO：243、SEQ ID NO：245、SEQ ID NO：247、 SEQ ID NO：249、SEQ ID NO：251、SEQ ID NO：253、SEQ ID NO：255、SEQ ID NO：257、SEQ ID NO：259、SEQ ID NO：261、SEQ ID NO：263、SEQ ID NO：265、 SEQ ID NO：267、SEQ ID NO：269、SEQ ID NO：271、SEQ ID NO：273、SEQ ID NO：275、SEQ ID NO：277、SEQ ID NO：279、SEQ ID NO：281、SEQ ID NO：283、 SEQ ID NO：285、SEQ ID NO：287、SEQ ID NO：289、SEQ ID NO：291、SEQ ID NO：293、SEQ ID NO：295、SEQ ID NO：297、SEQ ID NO：299、SEQ ID NO：301、 SEQ ID NO：303、SEQ ID NO：305、SEQ ID NO：307、SEQ ID NO：309、SEQ ID NO：311、SEQ ID NO：313、SEQ ID NO：315、SEQ ID NO：317、SEQ ID NO：319、SEQ ID NO：321、SEQ ID NO：323、SEQ ID NO：325、SEQ ID NO：327、SEQ ID NO：329、 SEQ ID NO：331、SEQ ID NO：333、SEQ ID NO：335、SEQ ID NO：337、SEQ ID NO：339、SEQ ID NO：341、SEQ ID NO：343、SEQ ID NO：345、SEQ ID NO：347、 SEQ ID NO：349、SEQ ID NO：351、SEQ ID NO：353、SEQ ID NO：355、SEQ ID NO：357、SEQ ID NO：359、SEQ ID NO：361、SEQ ID NO：363、SEQ ID NO：365、 SEQ ID NO：367、SEQ ID NO：369、SEQ ID NO：370、SEQ ID NO：372、SEQ ID NO：373、SEQ ID NO：375、SEQ ID NO：376、SEQ ID NO：378、SEQ ID NO：379、 SEQ ID NO：381、SEQ ID NO：382、SEQ ID NO：384、SEQ ID NO：385、SEQ ID NO：387、SEQ ID NO：388、SEQ ID NO：390、SEQ ID NO：391、SEQ ID NO：393、 SEQ ID NO：394、SEQ ID NO：396、SEQ ID NO：397、SEQ ID NO：399、SEQ ID NO：400、SEQ ID NO：402、SEQ ID NO：403、SEQ ID NO：405、SEQ ID NO：406、 SEQ ID NO：408、SEQ ID NO：409、SEQ ID NO：411、SEQ ID NO：412、SEQ ID NO：414、SEQ ID NO：415、SEQ ID NO：417、SEQ ID NO：418、SEQ ID NO：420、 SEQ ID NO：421、SEQ ID NO：423、SEQ ID NO：425、SEQ ID NO：427、SEQ ID NO：429、SEQ ID NO：431、SEQ ID NO：433、SEQ ID NO：435、SEQ ID NO：437、 SEQ ID NO：439、SEQ ID NO：441、SEQ ID NO：443、SEQ ID NO：445、SEQ ID NO：447、SEQ ID NO：449、SEQ ID NO：451、SEQ ID NO：453、SEQ ID NO：455、 SEQ ID NO：457、SEQ ID NO：459、SEQ ID NO：461、SEQ ID NO：463、SEQ ID NO：465、SEQ ID NO：467、SEQ ID NO：469和/或SEQ ID NO：471、SEQ ID NO：480、 SEQ ID NO：481、SEQ ID NO：482、SEQ ID NO：483、SEQ ID NO：484、SEQ ID NO：485、SEQ ID NO：486、SEQ ID NO：487、SEQ ID NO：488、SEQ ID NO：489至 SEQ ID NO：700之间所有奇数编号的SEQ ID NO：、SEQ ID NO：707、SEQ ID NO：708、SEQ ID NO：709、SEQ ID NO：710、SEQ ID NO：711、SEQ ID NO：712、SEQ ID NO：713、SEQ ID NO：714、SEQ ID NO：715、SEQ ID NO：716、SEQ ID NO：717、 SEQ ID NO：718和/或SEQ ID NO：720，
其中所述核酸(多核苷酸)编码具有木质纤维素酶活性的多肽，或编码能够产生与如下序列特异性结合的抗体的多肽或肽：SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、 SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、 SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、 SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、 SEQ ID NO：170、SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、 SEQ ID NO：188、SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、 SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、 SEQ ID NO：224、SEQ ID NO：226、SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、 SEQ ID NO：242、SEQ ID NO：244、SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、SEQ ID NO：256、SEQ ID NO：258、 SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、SEQ ID NO：274、SEQ ID NO：276、 SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、 SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、SEQ ID NO：312、 SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、SEQ ID NO：330、 SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、 SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、 SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419、 SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、 SEQ ID NO：440、SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、 SEQ ID NO：458、SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、 SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、在SEQ ID NO：490至SEQ ID NO：700之间所有偶数编号SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721，和/或它们的酶促活性子序列(片段)，其中任选地，所述木质纤维素活性包括糖基转移酶、纤维素酶、纤维素分解活性、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶或阿拉伯呋喃糖苷酶活性，
并且任选地，所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定；
并且任选地，所述序列比较算法包括BLAST版本2.2.2的算法，其中过滤设置被设置为blastall-p blastp-d″nr pataa″-F F，并且所有其它的选项被设为默认值；
(b)在严格条件下与(a)的核酸杂交的核酸序列(多核苷酸)，其中所述核酸编码具有木质纤维素活性的多肽，并且任选地，所述木质纤维素活性包括糖基转移酶、纤维素酶、纤维素分解活性、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶或阿拉伯呋喃糖苷酶活性，
并且所述严格条件包括洗涤步骤，所述洗涤步骤包括在0.2×SSC中在大约 65℃的温度洗涤大约15分钟，
并且任选地，所述核酸的长度是至少大约20、30、40、50、60、75、100、150、 200、300、400、500、600、700、800、900、1000或更多个残基，或基因、cDNA 或转录体(mRNA)的全长；
(c)编码具有如下所示序列的多肽的核酸序列：SEQ ID NO：2、SEQ ID NO：4、 SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、 SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、 SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、 SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、 SEQ ID NO：170、SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、 SEQ ID NO：188、SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、 SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、 SEQ ID NO：224、SEQ ID NO：226、SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、 SEQ ID NO：242、SEQ ID NO：244、SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、SEQ ID NO：256、SEQ ID NO：258、 SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、SEQ ID NO：274、SEQ ID NO：276、 SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、 SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、SEQ ID NO：312、 SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、SEQ ID NO：330、 SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、 SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、 SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419、 SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、 SEQ ID NO：440、SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、 SEQ ID NO：458、SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、 SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、SEQ ID NO：490至SEQ ID NO：700之间所有偶数编号的SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721，或它们的酶促活性子序列 (片段)；
(d)，(a)、(b)或(c)所述的核酸(多核苷酸)，其编码具有至少一个保守氨基酸置换并保持其木质纤维素活性的多肽，
其中任选地，所述保守氨基酸置换包括用相似性质的另一氨基酸置换氨基酸；并且任选地，保守置换包括：脂肪族氨基酸用另一个脂肪族氨基酸替代；丝氨酸用苏氨酸替代或相反；酸性残基用另一个酸性残基替代；带有酰胺基的残基用另一个带有酰胺基的残基替代；碱性残基与另一个碱性残基交换；或芳香族残基用另一个芳香族残基替代；
(e)，(a)、(b)、(c)或(d)所述的核酸(多核苷酸)，其编码具有木质纤维素活性但缺少信号序列、前原结构域、锚定结构域和/或糖结合模块(CBM)的多肽，
其中任选地，所述糖结合模块(CBM)包括纤维素结合模块、木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异的模块和/或阿拉伯呋喃糖苷酶结合模块，或由之组成；
(f)，(a)、(b)、(c)、(d)或(e)所述的核酸(多核苷酸)，其编码具有木质纤维素活性的多肽并进一步包含异源序列；
(g)，(f)所述的核酸(多核苷酸)，其中所述异源序列包括这样的序列或由这样的序列组成，该序列编码：(i)异源信号序列、异源糖结合模块、异源锚定结构域、异源催化结构域(CD)或它们的组合；(ii)，(i)所述的序列，其中所述异源信号序列、糖结合模块或异源催化结构域(CD)从异源木质纤维素酶得到；或(iii)标签、表位、靶向肽、可剪切序列、可检测部分或酶；
(h)，(g)所述的核酸(多核苷酸)，其中所述异源糖结合模块(CBM)包括如下模块或由如下模块组成：纤维素结合模块、木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异模块和/或阿拉伯呋喃糖苷酶结合模块；
(i)，(g)所述的核酸(多核苷酸)，其中所述异源信号序列将所编码的蛋白质靶向液泡、内质网、叶绿体或淀粉颗粒；或
(j)，与(a)、(b)、(c)、(d)、(e)、(g)、(g)、(h)或(i)完全(全部)互补的核酸序列(多核苷酸)。
2.权利要求1所述的分离的、合成的或重组的核酸，其中所述木质纤维素活性包括
(a)糖基水解酶活性、纤维素酶活性、内切纤维素酶活性、内切葡聚糖酶活性、纤维二糖水解酶活性、β-葡糖苷酶和/或甘露聚糖酶活性，或它们的任何组合；
(b)活性，其包括将可溶的寡聚体水解(降解)为可发酵的单体糖；
(c)活性，其包括将可溶的纤维寡糖和阿拉伯木聚糖寡聚体水解(降解)为单体，并且任选地，所述单体包括木糖、阿拉伯糖和葡萄糖；
(d)催化植物生物质多糖的水解(降解)；
(e)催化葡聚糖或木质素的水解(降解)以产生较小分子量的多糖或寡聚体或单体；
(f)催化1，4-β-D-糖苷键的水解；
(g)内切纤维素酶活性，其包括内切-1，4-β-内切纤维素酶活性；
(f)1，4-β-D-糖苷键水解活性，包括水解纤维素、纤维素衍生物、地衣多糖或谷物中的1，4-β-D-糖苷键，其中任选地，所述纤维素衍生物包括羧甲基纤维素或羟乙基纤维素，或所述谷物包含β-D-葡聚糖或木葡聚糖；
(g)催化葡聚糖酶键的水解；
(h)催化β-1，4-和/或β-1，3-葡聚糖酶键的水解；
(i)催化内切葡聚糖键的水解；
(j)催化内切1，4-β-D-葡聚糖4-葡聚糖水解的水解酶活性；
(k)催化内部的内切-β-1，4-葡聚糖酶键和/或β-1，3-葡聚糖酶键的水解；
(l)催化内部β-1，3-糖苷键的水解；
(m)催化包括吡喃葡萄糖的多糖的水解；
(n)催化包括1，4-β-糖苷-连接的D-吡喃葡萄糖的多糖的水解；
(o)催化纤维素、纤维素衍生物或半纤维素的水解；
(p)，(o)所述的活性，其中所述纤维素酶活性(纤维素、纤维素衍生物或半纤维素的水解)包括水解(降解)甘蔗渣、玉米纤维、玉米种子纤维、木材、木材废料、木浆、纸浆、木制品或纸制品、植物生物质、植物生物质中的纤维素或半纤维素，所述植物生物质包含种子、谷物、块茎、植物废弃物、或者食品或饲料加工或工业加工的副产品、茎、玉米、穗、秸秆、草、印度草或柳枝稷；
(q)催化饲料、食品或饮料中的葡聚糖水解；
(r)，(q)所述的活性，其中所述饲料、食品或饮料包括基于谷类的动物饲料、麦芽汁或啤酒、面团、水果或蔬菜；
(s)催化微生物细胞、真菌细胞、哺乳动物细胞、植物细胞或包含纤维素部分的任何植物原料中的葡聚糖的水解；
(t)，(a)至(s)任一项所述的活性，其中所述活性是热稳定的或耐热的；
(u)，(a)至(t)任一项所述的活性，其中所述活性在包括大约37℃至大约 95℃之间、或大约55℃至大约85℃之间、或大约70℃至大约75℃之间、或大约 70℃至大约95℃之间、或大约90℃至大约95℃之间的温度范围的条件下是稳定的或具有耐受性，或在大约1℃至大约5℃之间、在大约5℃至大约15℃之间、在大约15℃至大约25℃之间、在大约25℃至大约37℃之间、或在大约37℃至大约 95℃、96℃、97℃、98℃或99℃之间的范围内的温度下保持木质纤维素活性；
(v)，(a)至(t)任一项所述的活性，其中所述活性在暴露于大于37℃至大约95℃、大于55℃至大约85℃，或在大约70℃至大约75℃，或大于90℃至大约 95℃的范围内的温度之后是稳定的或具有耐受性，或在暴露于大约1℃至大约5℃ 之间、大约5℃至大约15℃之间、大约15℃至大约25℃之间、大约25℃至大约 37℃之间、大约37℃至大约95℃、96℃、97℃、98℃或99℃之间的范围内的温度之后是稳定的或具有耐受性；
(w)，(a)至(s)任一项所述的活性，其中所述酶在包括大约pH 6.5、pH 6、 pH 5.5、pH 5、pH 4.5或pH 4或更酸性的条件下具有活性；或在包括大约pH 7、 pH 7.5、pH 8、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11或更碱性pH的条件下具有活性。
3.核酸探针，用于鉴定编码具有木质纤维素活性的多肽的核酸，其中所述探针包含
(a)权利要求1中所述的核酸序列(多核苷酸)的至少20、30、40、50、60、 75、100、125、150或200或更多个连续碱基，其中所述探针通过结合或杂交鉴定所述核酸；
(b)，(a)所述的探针，其中所述探针包括含有至少大约10至50、大约20 至60、大约30至70、大约40至80、大约60至100、或大约50至150个连续碱基的寡核苷酸：
(c)，(a)或(b)所述的探针，其中所述探针包含SEQ ID NO：1，SEQ ID NO：3、 SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、 SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、 SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、 SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、 SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、 SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、 SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、 SEQ ID NO：75、SEQ ID NO：77，SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、 SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、 SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、 SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ ID NO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ ID NO：131、 SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ ID NO：149、 SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ ID NO：167、 SEQ ID NO：169、SEQ ID NO：171、SEQ ID NO：173、SEQ ID NO：175、SEQ ID NO：177、SEQ ID NO：179、SEQ ID NO：181、SEQ ID NO：183、SEQ ID NO：185、 SEQ ID NO：187、SEQ ID NO：189、SEQ ID NO：191、SEQ ID NO：193、SEQ ID NO：195、SEQ ID NO：197、SEQ ID NO：199、SEQ ID NO：201、SEQ ID NO：203、 SEQ ID NO：205、SEQ ID NO：207、SEQ ID NO：209、SEQ ID NO：211、SEQ ID NO：213、SEQ ID NO：215、SEQ ID NO：217、SEQ ID NO：219、SEQ ID NO：221、 SEQ ID NO：223、SEQ ID NO：225、SEQ ID NO：227、SEQ ID NO：229、SEQ ID NO：231、SEQ ID NO：233、SEQ ID NO：235、SEQ ID NO：237、SEQ ID NO：239、 SEQ ID NO：241、SEQ ID NO：243、SEQ ID NO：245、SEQ ID NO：247、SEQ ID NO：249、SEQ ID NO：251、SEQ ID NO：253、SEQ ID NO：255、SEQ ID NO：257、 SEQ ID NO：259、SEQ ID NO：261、SEQ ID NO：263、SEQ ID NO：265、SEQ ID NO：267、SEQ ID NO：269、SEQ ID NO：271、SEQ ID NO：273、SEQ ID NO：275、 SEQ ID NO：277、SEQ ID NO：279、SEQ ID NO：281、SEQ ID NO：283、SEQ ID NO：285、SEQ ID NO：287、SEQ ID NO：289、SEQ ID NO：291、SEQ ID NO：293、 SEQ ID NO：295、SEQ ID NO：297、SEQ ID NO：299、SEQ ID NO：301、SEQ ID NO：303、SEQ ID NO：305、SEQ ID NO：307、SEQ ID NO：309、SEQ ID NO：311、SEQ ID NO：313、SEQ ID NO：315、SEQ ID NO：317、SEQ ID NO：319、SEQ ID NO：321、 SEQ ID NO：323、SEQ ID NO：325、SEQ ID NO：327、SEQ ID NO：329、SEQ ID NO：331、SEQ ID NO：333、SEQ ID NO：335、SEQ ID NO：337、SEQ ID NO：339、 SEQ ID NO：341、SEQ ID NO：343、SEQ ID NO：345、SEQ ID NO：347、SEQ ID NO：349、SEQ ID NO：351、SEQ ID NO：353、SEQ ID NO：355、SEQ ID NO：357、 SEQ ID NO：359、SEQ ID NO：361、SEQ ID NO：363、SEQ ID NO：365、SEQ ID NO：367、SEQ ID NO：369、SEQ ID NO：370、SEQ ID NO：372、SEQ ID NO：373、 SEQ ID NO：375、SEQ ID NO：376、SEQ ID NO：378、SEQ ID NO：379、SEQ ID NO：381、SEQ ID NO：382、SEQ ID NO：384、SEQ ID NO：385、SEQ ID NO：387、 SEQ ID NO：388、SEQ ID NO：390、SEQ ID NO：391、SEQ ID NO：393、SEQ ID NO：394、SEQ ID NO：396、SEQ ID NO：397、SEQ ID NO：399、SEQ ID NO：400、 SEQ ID NO：402、SEQ ID NO：403、SEQ ID NO：405、SEQ ID NO：406、SEQ ID NO：408、SEQ ID NO：409、SEQ ID NO：411、SEQ ID NO：412、SEQ ID NO：414、SEQ ID NO：415、SEQ ID NO：417、SEQ ID NO：418、SEQ ID NO：420、SEQ ID NO：421、 SEQ ID NO：423、SEQ ID NO：425、SEQ ID NO：427、SEQ ID NO：429、SEQ ID NO：431、SEQ ID NO：433、SEQ ID NO：435、SEQ ID NO：437、SEQ ID NO：439、 SEQ ID NO：441、SEQ ID NO：443、SEQ ID NO：445、SEQ ID NO：447、SEQ ID NO：449、SEQ ID NO：451、SEQ ID NO：453、SEQ ID NO：455、SEQ ID NO：457、 SEQ ID NO：459、SEQ ID NO：461、SEQ ID NO：463、SEQ ID NO：465、SEQ ID NO：467、SEQ ID NO：469和/或SEQ ID NO：471、SEQ ID NO：480、SEQ ID NO：481、 SEQ ID NO：482、SEQ ID NO：483、SEQ ID NO：484、SEQ ID NO：485、SEQ ID NO：486、SEQ ID NO：487、SEQ ID NO：488，在SEQ ID NO：489至SEQ ID NO：700 之间的所有奇数编号的SEQ ID NO：、SEQ ID NO：707、SEQ ID NO：708、SEQ ID NO：709、SEQ ID NO：710、SEQ ID NO：711、SEQ ID NO：712、SEQ ID NO：713、SEQ ID NO：714、SEQ ID NO：715、SEQ ID NO：716、SEQ ID NO：717、SEQ ID NO：718 和/或SEQ ID NO：720的序列的连续碱基；
(d)，(a)、(b)或(c)所述的探针，进一步包括可检测试剂；或
(e)，(d)所述的探针，其中所述可检测试剂包括放射性同位素、荧光染料或能够催化可检测产物形成的酶。
4.扩增引物对，用于扩增编码具有木质纤维素活性的多肽的核酸，其中所述扩增引物对
(a)，能够扩增包含权利要求1所述的核酸序列或其子序列的核酸；
(b)，包含第一成员和第二成员，所述第一成员具有如SEQ ID NO：1等的约前 (5′)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30或更多个残基所述的序列，所述第二成员具有如所述第一成员的互补链的约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30或更多个残基所述的序列；或
(c)，包含(a)或(b)所述的扩增引物对，其中所述扩增引物对的成员包括含有所述序列至少约10到50个连续碱基，或所述序列约12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27、28、29、30或更多个连续碱基的寡核苷酸。
5.分离的或重组的编码木质纤维素酶的核酸，其包括：
(a)，核酸，其使用权利要求4所述的扩增引物对通过扩增多核苷酸产生；
(b)，(a)所述的核酸，其中所述扩增是通过聚合酶链式反应(PCR)进行的；
(c)，(a)所述的核酸，其中所述核酸通过基因文库的扩增产生；
(d)，(c)所述的核酸，其中所述基因文库是环境文库；
(e)，(a)、(b)、(c)或(d)所述的核酸，其编码具有木质纤维素活性但是缺乏信号序列、前原结构域、锚定结构域和/或糖结合模块(CBM)的多肽，
其中任选地，所述糖结合模块(CBM)包括纤维素结合模块、木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异模块和/或阿拉伯呋喃糖苷酶结合模块，或由这些模块组成；或
(f)，(a)、(b)、(c)、(d)或(e)所述的核酸，其编码具有木质纤维素活性的多肽，进一步包括异源序列。
6.分离的、合成的或重组的木质纤维素酶，其由权利要求5所述的核酸编码。
7.扩增编码具有木质纤维素酶活性的多肽的核酸的方法，其包括用权利要求 4所述的扩增引物对扩增模板核酸。
8.表达盒，其包括含有权利要求1或权利要求5所述的核酸序列的核酸。
9.载体，其包括含有权利要求1或权利要求5所述核酸序列的核酸，或权利要求8所述的表达盒，其中任选地，所述载体包括表达载体或克隆载体。
10.克隆载体，其包括含有权利要求1或权利要求5所述的核酸序列的核酸，或权利要求8所述的表达盒，其中任选地，所述克隆载体包括病毒载体、质粒、噬菌体、噬菌粒、黏粒、F黏粒、细菌噬菌体或人工染色体，并且任选地，所述病毒载体包括腺病毒载体、反转录病毒载体或腺相关病毒载体，并且任选地，所述克隆载体包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1-衍生的载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。
11.转化的、感染的、转染的宿主细胞，其包括：
(a)包含权利要求1或权利要求5所述的核酸序列的核酸，或权利要求8所述的表达盒、权利要求9所述的载体，或权利要求10所述的克隆载体；
(b)，(a)所述的细胞，其中所述细胞为细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞；
(c)，(b)所述的植物细胞，其中所述植物细胞衍生自下列属的植物：腰果属(Anacardium)、花生属(Arachis)、天门冬属(Asparagus)、颠茄属(Atropa)、燕麦属(Avena)、芸苔属(Brassica)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、红花属(Carthamus)、椰子属(Cocos)、咖啡属(Coffea)、十字花科(Cruciferae)、黄瓜属(Cucumis)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、油棕属(Elaeis)、草莓属(Fragaria)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、萱草属(Heterocallis)、大麦属(Hordeum)、天仙子属 (Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、薄荷属(Majorana)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、稻属(Oryza)、黍属(Panieum)、狼尾草属(Pannisetum)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连属(Pistachia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、白芥属(Sinapis)、茄属(Solanum)、高粱属(Sorghum)、可可属(Theobromus)、胡卢巴属(Trigonella)、小麦属(Triticum)、蚕豆属(Vicia)、葡萄属(Vitis)、豇豆属(Vigna)或黍属(Zea)；或
(d)，(b)所述的植物细胞，其中所述植物细胞源自玉米植物、高粱植物、马铃薯植物、番茄植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物、草或烟草植物。
12.转基因非人动物，其包含如权利要求1或权利要求5所述的核酸序列，或权利要求8所述的表达盒、权利要求9所述的载体，或权利要求10所述的克隆载体，其中任选地，所述转基因非人动物为小鼠、大鼠、猪、牛或羊。
13.转基因植物，其包含：
(a)权利要求1或权利要求5所述的核酸序列，或权利要求8所述的表达盒、权利要求9所述的载体，或权利要求10所述的克隆载体；
(b)，(a)所述的转基因植物，其中所述植物为玉米植物、高粱植物、马铃薯植物、番茄植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物、草或烟草植物；或
(c)，(a)所述的转基因植物，其中所述植物为下列属的植物：腰果属、花生属、天门冬属、颠茄属、燕麦属、芸苔属、柑橘属、西瓜属、辣椒属、红花属、椰子属、咖啡属、十字花科、黄瓜属、南瓜属、胡萝卜属、油棕属、草莓属、大豆属、棉属、向日葵属、萱草属、大麦属、天仙子属、莴苣属、亚麻属、黑麦草属、羽扇豆属、番茄属、苹果属、木薯属、薄荷属、苜蓿属、烟草属、木犀榄属、稻属、黍属、狼尾草属、鳄梨属、菜豆属、黄连属、豌豆属、梨属、李属、萝卜属、蓖麻属、黑麦属、千里光属、白芥属、茄属、高粱属、可可属、胡卢巴属、小麦属、蚕豆属、葡萄属、豇豆属或黍属。
14.转基因种子，其包括：
(a)权利要求1或权利要求5所述的核酸序列，或权利要求8所述的表达盒、权利要求9所述的载体，或权利要求10所述的克隆载体；
(b)，(a)所述的转基因种子，其中所述种子为玉米种子、小麦仁、含油种子、油菜籽种子、大豆种子、棕榈仁、向日葵种子、芝麻种子、水稻、大麦、花生或烟草种子；或
(c)，(a)所述的转基因种子，其中所述种子源自下列属的植物：腰果属、花生属、天门冬属、颠茄属、燕麦属、芸苔属、柑橘属、西瓜属、辣椒属、红花属、椰子属、咖啡属、十字花科、黄瓜属、南瓜属、胡萝卜属、油棕属、草莓属、大豆属、棉属、向日葵属、萱草属、大麦属、天仙子属、莴苣属、亚麻属、黑麦草属、羽扇豆属、番茄属、苹果属、木薯属、薄荷属、苜蓿属、烟草属、木犀榄属、稻属、黍属、狼尾草属、鳄梨属、菜豆属、黄连属、豌豆属、梨属、李属、萝卜属、蓖麻属、黑麦属、千里光属、白芥属、茄属、高粱属、可可属、胡卢巴属、小麦属、蚕豆属、葡萄属、豇豆属或黍属。
15.反义寡核苷酸，其包括与权利要求1或权利要求5所述的核酸序列互补或能够在严格条件下与其杂交的核酸序列，其中任选地，所述反义寡核苷酸具有约 10至50、约20至60、约30至70、约40至80或约60至100个碱基之间的长度，其中任选地，所述反义寡核苷酸包括RNAi或核酶。
16.抑制酶信息在细胞中翻译的方法，包括向所述细胞给予或在所述细胞中表达反义寡核苷酸，所述反义寡核苷酸包含与权利要求1或权利要求5所述的核酸序列互补或能够在严格条件下与其杂交的核酸序列。
17.双链干扰RNA(RNAi)分子，其包含权利要求1所述核酸序列的子序列，其中任选地，所述RNAi包含siRNA或miRNA，并且任选地，所述RNAi分子的长度为约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26 或更多个双链核苷酸。
18.抑制木质纤维素酶或信息(mRNA)在细胞中表达的方法，包括向所述细胞给予或在所述细胞中表达权利要求17所述的双链干扰性RNA(RNAi)分子。
19.分离的、合成的或重组的多肽，其包含
(a)氨基酸序列，其与如下序列在至少约20、25、30、35、40、45、50、55、 60、75、100、150、200、250、300或更多个残基的区域内或在所述多肽或酶的全长区域内具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、 60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、 73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、 86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、 99％或更高或完全(100％)的序列同一性：SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、 SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、 SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、 SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、 SEQ ID NO：170、SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、 SEQ ID NO：188、SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、 SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、 SEQ ID NO：224、SEQ ID NO：226、SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、 SEQ ID NO：242、SEQ ID NO：244、SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、SEQ ID NO：256、SEQ ID NO：258、 SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、SEQ ID NO：274、SEQ ID NO：276、 SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、 SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、SEQ ID NO：312、 SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、SEQ ID NO：330、 SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、 SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、 SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ 1D NO：419、 SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、 SEQ ID NO：440、SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、 SEQ ID NO：458、SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、 SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479，SEQ ID NO：490至SEQ ID NO：700之间所有偶数编码的SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721，或其酶促活性子序列(片段)，
其中所述核酸编码具有木质纤维素活性的多肽，并且任选地，所述木质素活性包括糖基转移酶、纤维素酶、纤维素分解活性、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶或阿拉伯呋喃糖苷酶活性，
其中任选地，所述序列同一性通过使用序列比较算法的分析或通过视觉观察确定，并且任选地，所述序列比较算法是BLAST版本2.2.2算法，其中过滤设置被设定为blastall-p blastp-d″nr pataa″-F F，并且所有其它选项被设为默认值；
(b)由权利要求1的核酸编码的氨基酸序列，其中所述多肽具有(i)木质纤维素活性，并且任选地，所述木质纤维素活性包括糖基转移酶、纤维素酶、纤维素分解活性、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶或阿拉伯呋喃糖苷酶活性，或(ii)具有免疫原活性，原因是其能够产生与具有如下序列的多肽特异性结合的抗体：SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、 SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、 SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、 SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、 SEQ ID NO：170、SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、 SEQ ID NO：188、SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、 SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、 SEQ ID NO：224、SEQ ID NO：226、SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、 SEQ ID NO：242、SEQ ID NO：244、SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、SEQ ID NO：256、SEQ ID NO：258、 SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、SEQ ID NO：274、SEQ ID NO：276、 SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、 SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、SEQ ID NO：312、 SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、SEQ ID NO：330、 SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、 SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、 SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419、 SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、 SEQ ID NO：440、SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、 SEQ ID NO：458、SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、 SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479，SEQ ID NO：490至SEQ ID NO：700之间所有偶数编码的SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721，和/或其酶促活性子序列(片段)；
(c)，(a)或(b)所述的氨基酸序列，包括至少一个氨基酸残基保守置换，
(d)，(c)所述的氨基酸序列，其中所述保守置换包括脂肪族氨基酸用另一个脂肪族氨基酸替代；丝氨酸用苏氨酸替代或相反；酸性氨基酸用另一个酸性氨基酸替代；带有酰胺基的残基用另一个带有酰胺基的残基替代；碱性残基与另一个碱性残基交换；或，芳香族残基用另一个芳香族残基替代；或其组合，
并且任选地，所述脂肪族残基包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸或其合成的等效物；所述酸性残基包括天冬氨酸、谷氨酸或其合成的等效物；所述包含酰胺基的残基包括天冬氨酸、谷氨酸或其合成的等效物；所述碱性残基包括赖氨酸、精氨酸或其合成的等效物；或所述芳香族残基包括苯丙氨酸、酪氨酸或其合成的等效物；
(e)，(a)、(b)、(c)或(d)所述的多肽，其具有木质纤维素活性，但是缺少信号序列、前原结构域、锚定结构域和/或糖结合模块(CBM)，
其中任选地，所述糖结合模块(CBM)包括如下模块或由之组成：纤维素结合模块、木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异模块和/或阿拉伯呋喃糖苷酶结合模块；
(f)，(a)、(b)、(c)、(d)或(e)所述的多肽，其具有木质纤维素活性，进一步包括异源序列；
(g)，(f)所述的多肽，其中所述异源序列包括如下部分，或由如下部分组成： (i)异源信号序列、异源糖结合模块、异源锚定结构域、异源催化结构域(CD) 或其组合；(ii)，(i)所述的序列，其中所述异源信号序列、糖结合模块或催化结构域(CD)源自异源木质纤维素酶；和/或(iii)标签、表位、靶向肽、可剪切序列、可检测部分或酶；
(h)，(g)所述的多肽，其中所述异源糖结合模块(CBM)包括如下模块或由如下模块组成：纤维素结合模块、木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异模块和/或阿拉伯呋喃糖苷酶结合模块；或
(i)，(g)所述的多肽，其中所述异源信号序列将所编码的蛋白质靶向至液泡、内质网、叶绿体或淀粉颗粒。
20.权利要求19所述的分离的、合成的或重组的多肽，或权利要求6所述的木质纤维素酶，其中所述木质纤维素活性包括
(a)糖基水解酶活性、维素酶活性、内切纤维素酶活性、内切葡聚糖酶活性、纤维二糖水解酶活性、β-葡糖苷酶、甘露聚糖酶活性，或它们的任何组合；
(b)活性，其包括将可溶的寡聚体水解(降解)为可发酵的单体糖；
(c)活性，其包括将可溶的纤维寡糖和阿拉伯木聚糖寡聚体水解(降解)为单体，并且任选地，所述单体包括木糖、阿拉伯糖和葡萄糖；
(d)催化植物生物质多糖的水解(降解)；
(e)催化葡聚糖或木质素的水解(降解)以产生较小分子量的多糖或寡聚体或单体；
(f)催化1，4-β-D-糖苷键的水解；
(g)内切纤维素酶活性，其包括内切-1，4-β-内切纤维素酶活性；
(f)1，4-β-D-糖苷键水解活性，包括纤维素、纤维素衍生物、地衣多糖或谷物中1，4-β-D-糖苷键的水解，其中任选地，所述纤维素衍生物包括羧甲基纤维素或羟乙基纤维素，或所述谷物包含β-D-葡聚糖或木葡聚糖；
(g)催化葡聚糖酶键的水解；
(h)催化β-1，4-和/或β-1，3-葡聚糖酶键的水解；
(i)催化内切葡聚糖键的水解；
(j)催化内切1，4-β-D-葡聚糖4-葡聚糖水解的水解酶活性；
(k)催化内部的内切-β-1，4-葡聚糖酶键和/或β-1，3-葡聚糖酶键的水解；
(l)催化内部β-1，3-糖苷键的水解；
(m)催化包括吡喃葡萄糖的多糖的水解；
(n)催化包括1，4-β-糖苷-连接的D-吡喃葡萄糖的多糖的水解；
(o)催化纤维素、纤维素衍生物或半纤维素的水解；
(p)，(o)所述的活性，其中所述酶活性包括水解(降解)甘蔗渣、玉米纤维、玉米种子纤维、木材、木浆、纸浆、木制品或纸制品、植物生物质、植物生物质中的纤维素或半纤维素，所述植物生物质包含种子、谷粒、块茎、植物废弃物、或者食品或饲料加工或工业加工的副产品、茎、玉米、穗、秸秆、草、印度草或柳枝稷；
(q)催化饲料、食品或饮料中葡聚糖的水解；
(r)，(q)所述的活性，其中所述饲料、食品或饮料包括基于谷类的动物饲料、麦芽汁或啤酒、面团、水果或蔬菜；
(s)催化微生物细胞、真菌细胞、哺乳动物细胞、植物细胞或包含纤维素部分的任何植物原料中的葡聚糖的水解；
(t)，(a)至(s)任一项所述的活性，其中所述活性是热稳定的或耐热的；
(u)，(a)至(t)任一项所述的活性，其中所述活性在包括大约37℃至大约 95℃之间、或大约55℃至大约85℃之间、或大约70℃至大约75℃之间、或大约 70℃至大约95℃之间、或大约90℃至大约95℃之间的温度范围的条件下是稳定的或具有耐受性，或在大约1℃至大约5℃之间、在大约5℃至大约15℃之间、在大约15℃至大约25℃之间、在大约25℃至大约37℃之间、或在大约37℃至大约95 ℃、96℃、97℃、98℃或99℃之间的范围内的温度下保持木质纤维素活性；
(v)，(a)至(t)任一项所述的活性，其中所述活性在暴露于大于37℃至大约95℃、大于55℃至大约85℃，或在大约70℃至大约75℃，或大于90℃至大约 95℃的范围内的温度之后是稳定的或具有耐受性，或在暴露于大约1℃至大约5 ℃之间、大约5℃至大约15℃之间、大约15℃至大约25℃之间、大约25℃至大约 37℃之间、大约37℃至大约95℃、96℃、97℃、98℃或99℃之间的范围内的温度之后是稳定的或具有耐受性；
(w)，(a)至(s)任一项所述的活性，其中所述酶在包括大约pH 6.5、pH 6、 pH 5.5、pH 5、pH 4.5或pH 4或更酸性的条件下具有活性；或在包括大约pH 7、 pH 7.5、pH 8、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11或更碱性pH的条件下具有活性。
21.权利要求19所述的分离的、合成的或重组的多肽，或权利要求6所述的木质纤维素酶，其中所述多肽或酶包括至少一个糖基化位点，并且任选地，所述糖基化是N-连接的糖基化，并且任选地，所述多肽在巴斯德毕赤酵母(P.pastoris) 或粟酒裂殖酵母(S.pombe)中表达之后被糖基化。
22.蛋白质制剂，其包含权利要求19所述的多肽，或权利要求6所述的木质纤维素酶，其中所述蛋白质制剂包括液体、固体或凝胶。
23.异二聚体，其包括权利要求19所述的多肽或权利要求6所述的木质纤维素酶和第二结构域，其中任选地，所述第二结构域包括多肽，并且所述异二聚体为融合蛋白，并且任选地，所述第二结构域包括表位、异源酶、可检测的蛋白质或肽、免疫原蛋白或肽或标签。
24.同型二聚体，其包括权利要求19所述的多肽或权利要求6所述的木质纤维素酶。
25.固定化多肽或酶或固定化核酸，其中所述多肽包含权利要求19所述的序列，或权利要求6所述的木质纤维素酶，或所述核酸包含权利要求1或权利要求5 所述的核酸序列，或权利要求3所述的探针，其中任选地，所述多肽或核酸被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、阵列或毛细管上。
26.阵列，其包含权利要求25所述的固定化多肽或固定化核酸。
27.分离的、合成的或重组的抗体，其与权利要求19所述的多肽特异性结合，其中任选地，所述抗体是单克隆抗体或多克隆抗体。
28.杂交瘤，其包含与权利要求19所述的多肽特异性结合的抗体。
29.分离或鉴定具有木质纤维素活性的多肽的方法，包括下列步骤：
(a)提供权利要求27所述的抗体；
(b)提供包含多肽的样品，和
(c)使步骤(b)的样品与步骤(a)的抗体在所述抗体能特异性结合到所述多肽的条件下接触，从而分离或鉴定具有木质纤维素活性的多肽。
30.制备抗纤维素酶或抗木质纤维素酶的抗体的方法，包括：
(a)以足以产生体液免疫应答的量给予非人类动物权利要求1或权利要求5所述的核酸，由此制备抗木质纤维素酶或抗纤维素酶抗体，或
(b)以足以产生体液免疫应答的量给予非人类动物权利要求19所述的多肽，由此制备抗木质纤维素酶或抗纤维素酶抗体。
31.产生重组多肽的方法，其包括：
(A)，(a)提供可操作地连接到启动子的核酸，其中所述核酸包含权利要求1 或权利要求5中所述的核酸序列；和
(b)在允许所述多肽表达的条件下表达步骤(a)所述的核酸，由此产生重组多肽；或
(B)，(A)所述的方法，其中所述方法进一步包括用步骤(a)所述的核酸转化宿主细胞，接着表达步骤(a)所述的核酸，由此在转化细胞中产生重组多肽；或
(C)，(A)或(B)所述的方法，其中所述启动子是如下启动子或包括如下启动子：病毒、细菌、哺乳动物或植物启动子；或，植物启动子；或，马铃薯、水稻、玉米、小麦、烟草或大麦启动子；或，组成型启动子或CaMV35S启动子；或，诱导型启动子；或，组织特异的启动子或环境调节的或发育调节的启动子；或，种子特异的、叶特异的、根特异的、茎特异的或脱落诱导的启动子；或，种子优选的启动子、玉米γ玉米醇溶蛋白启动子或玉米ADP-gpp启动子。
32.鉴定具有木质纤维素活性的多肽的方法，其包括以下步骤：
(a)提供权利要求19所述的多肽或权利要求6所述的木质纤维素酶；
(b)提供木质纤维素酶的底物；和
(c)使所述多肽与步骤(b)所述的底物接触，并检测底物量的减少或反应产物量的增加，其中所述底物量的减少或所述反应产物量的增加检测到具有木质纤维素活性的多肽。
33.鉴定木质纤维素酶底物的方法，其包括以下步骤：
(a)提供权利要求19所述的多肽；
(b)提供测试底物；和
(c)将步骤(a)所述的多肽与步骤(b)所述的测试底物接触，并检测底物量的减少或反应产物量的增加，其中所述底物量的减少或所述反应产物量的增加将所述测试底物鉴定为木质纤维素酶底物。
34.确定测试化合物是否特异性地结合多肽的方法，其包括以下步骤：
(a)在允许核酸翻译为多肽的条件下，表达所述核酸或含有所述核酸的载体，其中所述核酸具有权利要求1或权利要求5所述的核酸序列；
(b)提供测试化合物；
(c)将所述多肽与所述测试化合物接触；和
(d)确定步骤(b)所述的测试化合物是否特异性地结合所述多肽。
35.确定测试化合物是否特异地结合多肽的方法，其包括以下步骤：
(a)提供权利要求19所述的多肽；
(b)提供测试化合物；
(c)将所述多肽与所述测试化合物接触；和
(d)确定步骤(b)所述的测试化合物是否特异性地结合所述多肽。
36.鉴定木质纤维素活性的调节剂的方法，其包括以下步骤：
(a)提供权利要求19所述的多肽；
(b)提供测试化合物；
(c)将步骤(a)所述的多肽与步骤(b)所述的测试化合物接触，并测量所述木质纤维素酶的活性，其中在存在所述测试化合物的情况下测量的木质纤维素酶活性与不存在所述测试化合物的情况下的活性相比的变化，确定了所述测试化合物调节所述木质纤维素酶活性。
37.权利要求36所述的方法，其中所述木质纤维素酶活性通过提供木质纤维素酶底物并检测所述底物量的减少或反应产物量的增加，或所述底物量的增加或所述反应产物量的减少而测量，
其中任选地，与没有所述测试化合物的情况下底物或反应产物的量相比，有所述测试化合物情况下所述底物量的减少或所述反应产物量的增加将所述测试化合物鉴定为木质纤维素酶活性的激活剂，
并且任选地，与没有所述测试化合物的情况下底物或反应产物的量相比，有所述测试化合物情况下所述底物量的增加或所述反应产物量的减少将所述测试化合物鉴定为木质纤维素酶活性的抑制剂。
38.计算机系统，包含处理器和数据存储设备，其中所述数据存储设备已经在其上存储有多肽序列或核酸序列，其中所述多肽序列包含如权利要求19所述的序列，由权利要求1或权利要求5所述的核酸编码的多肽，
其中任选地，所述计算机系统进一步包括序列比较算法和数据存储设备，其中所述数据存储设备上已经存储了至少一个参考序列，或者进一步包括在所述序列中鉴定一个或多个特征的鉴定器，
并且任选地，所述序列比较算法包括指出多态性的计算机程序。
39.计算机可读介质，其上已经存储了多肽序列或核酸序列，其中所述多肽序列包括权利要求19所述的多肽，或权利要求1或权利要求5所述的核酸编码的多肽。
40.用于鉴定序列中的特征的方法，包括以下步骤：(a)使用鉴定序列中的一个或多个特征的计算机程序读取所述序列，其中所述序列包括多肽序列或核酸序列，其中所述多肽序列包括权利要求19所述的多肽；权利要求1或权利要求5所述的核酸编码的多肽；和(b)使用所述计算机程序鉴定所述序列中的一个或多个特征。
41.用于将第一序列与第二序列进行比较的方法，所述方法包括如下步骤： (a)通过使用比较序列的计算机程序读取所述第一序列和所述第二序列，其中所述第一序列包括多肽序列或核酸序列，其中所述多肽序列包括权利要求19所述的多肽或由权利要求1或权利要求5所述的核酸编码的多肽；和(b)用所述计算机程序确定所述第一序列和所述第二序列之间的差异，
其中任选地，所述方法进一步包括确定所述第一序列和所述第二序列之间的差异的步骤，或者任选地，所述方法进一步包括鉴定多态性的步骤，或者任选地，所述方法进一步包括使用鉴定序列中的一个或多个特征的鉴定器，
和任选地，所述方法包括使用计算机程序读取所述第一序列，并鉴定所述序列中的一个或多个特征。
42.从样品中分离或回收编码具有木质纤维素酶活性的多肽的核酸的方法，包括以下步骤：
(a)提供权利要求4所述的扩增引物对；
(b)从所述样品中分离核酸，或处理所述样品以使所述样品中的核酸易于与所述扩增引物对杂交；和，
(c)混合步骤(b)的所述核酸与步骤(a)的所述扩增引物对，并从所述样品扩增核酸，由此从样品中分离或回收编码具有木质纤维素酶活性的多肽的核酸，
其中任选地，所述样品是环境样品，或任选地，所述样品包括水样品、液体样品、土壤样品、空气样品或生物样品，并且任选地，所述生物样品从细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞获得。
43.从样品中分离或回收编码具有木质纤维素酶活性的多肽的核酸的方法，包括以下步骤：
(a)提供包含权利要求1所述核酸序列或由权利要求1所述核酸序列组成的多核苷酸探针，或权利要求3所述的探针；
(b)从所述样品中分离核酸，或处理所述样品以使所述样品中的核酸易于与步骤(a)的多核苷酸探针杂交；
(c)将步骤(b)的分离的核酸或处理的样品与步骤(a)的多核苷酸探针结合；和
(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸，从而从所述样品中分离或回收编码具有木质纤维素酶活性的多肽的核酸，
其中任选地，所述样品是环境样品，或任选地，所述样品包括水样品、液体样品、土壤样品、空气样品或生物样品，并且任选地，所述生物样品从细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞获得。
44.产生编码具有木质纤维素活性的多肽的核酸变体的方法，其包括以下步骤：
(a)提供包含权利要求1或权利要求5所述的核酸序列的模板核酸；和
(b)在该模板序列中修饰、缺失或添加一个或多个核苷酸，或进行修饰、缺失和添加的组合，以产生所述模板核酸的变体，
其中任选地，所述方法进一步包括表达所述变体核酸，以产生具有木质纤维素活性的变体多肽，
并且任选地，所述的修饰、添加或缺失通过包括如下方法中的方法来引入：易错PCR、改组、寡核苷酸诱导的定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合，
并且任选地，所述方法被迭代重复，直到产生与所述模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳定性的木质纤维素酶。
45.权利要求44所述的方法，其中
(A)所述变体木质纤维素酶：(a)是耐热的，且在暴露于增高的温度之后仍保持一些活性；(b)与模板核酸编码的木质纤维素酶相比，具有增加的糖基化；或，(c)在高温下具有木质纤维素酶活性，其中由所述模板核酸编码的木质纤维素酶在所述高温下不具有活性；或
(B)所述方法被迭代重复，直到(a)产生具有与所述模板核酸的密码子使用有所不同的密码子使用的木质纤维素酶编码序列，或(b)产生具有比所述模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的木质纤维素酶。
46.在编码具有木质纤维素活性的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法，所述方法包括以下步骤：
(a)提供编码具有木质纤维素活性的多肽的核酸，所述核酸包含权利要求1或权利要求5所述的核酸序列；和
(b)鉴定步骤(a)所述核酸中的非优选或较不优选的密码子，并用与被替代密码子编码相同氨基酸的优选使用的或中度使用的密码子替换它，其中，优选密码子是在宿主细胞基因的编码序列中过多表现的密码子，而非优选的或较不优选的密码子是宿主细胞基因的编码序列中的表现不足的密码子，由此修饰核酸以增加其在所述宿主细胞中的表达。
47.在编码木质纤维素酶的核酸中修饰密码子的方法，所述方法包括以下步骤：
(a)提供编码具有木质纤维素酶活性的多肽的核酸，所述核酸包含权利要求1 或权利要求5所述的核酸序列；和
(b)鉴定步骤(a)所述核酸中的密码子，并用与被替代密码子编码相同氨基酸的不同密码子替换它，由此修饰编码木质纤维素酶的核酸中的密码子。
48.在编码木质纤维素酶的核酸中修饰密码子以增加其在宿主细胞中表达的方法，所述方法包括以下步骤：
(a)提供编码木质纤维素酶的核酸，所述核酸包含权利要求1或权利要求5所述的核酸序列；和
(b)鉴定步骤(a)所述的核酸中的非优选或较不优选密码子，并用优选的或中度使用优选的密码子来代替它，所述优选或中度使用的密码子与被取代的密码子编码相同的氨基酸，其中优选密码子是在宿主细胞基因的编码序列中过度表现的密码子，而非优选或较不优选的密码子是在宿主细胞基因的编码序列中表现不足的密码子，从而修饰所述核酸以增加其在所述宿主细胞中的表达。
49.在编码具有木质纤维素活性的多肽的核酸中修饰密码子以降低其在宿主细胞中表达的方法，所述方法包括以下步骤：
(a)提供编码木质纤维素酶多肽的核酸，所述核酸包含权利要求1或权利要求 5所述的核酸序列；和
(b)鉴定步骤(a)所述核酸中的至少一个优选密码子，并用非优选的或较不优选的密码子来代替它，所述非优选或较不优选的密码子与被取代的密码子编码相同的氨基酸，其中优选密码子是在宿主细胞基因的编码序列中过度表现的密码子，而非优选或较不优选的密码子是在宿主细胞基因的编码序列中表现不足的密码子，从而修饰所述核酸以降低其在所述宿主细胞中的表达，
其中任选地，所述宿主细胞为细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。
50.用于产生核酸文库的方法，所述核酸文库编码多个被修饰的木质纤维素酶活性位点或底物结合位点，其中所述被修饰的活性位点或底物结合位点来源于第一核酸，所述第一核酸包含编码第一活性位点或第一底物结合位点的序列，所述方法包括如下步骤：
(a)提供编码第一活性位点或第一底物结合位点的第一核酸，其中所述第一核酸序列包含在严格条件下与权利要求1所述的核酸序列(多核苷酸)杂交的序列，并且所述核酸编码木质纤维素酶活性位点或木质纤维素酶底物结合位点；
(b)提供一组诱变的寡核苷酸，其在所述第一核酸的多个目标密码子处编码天然发生的氨基酸变体；和
(c)使用该组诱变寡核苷酸，产生一组编码活性位点或编码底物结合位点的变体核酸，其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变化，从而产生编码多个被修饰的木质纤维素酶活性位点或底物结合位点的核酸文库，
其中任选地，诱变寡核苷酸或变体核酸通过如下方法中的方法产生，所述方法包括：优化的定向进化系统、基因位点饱和诱变(GSSM)或合成连接重装配 (SLR)、易错PCR、改组、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。
51.制备小分子的方法，包括以下步骤：
(a)提供多个能够合成或修饰小分子的生物合成酶，其中所述酶的一种包括木质纤维素酶，其由包含权利要求1或权利要求5所述的核酸序列的核酸编码；
(b)提供步骤(a)所述的至少一种酶的底物；和
(c)将步骤(a)所述的底物与所述酶在能促进多个生物催化反应的条件下进行反应，以通过一系列生物催化反应产生小分子。
52.修饰小分子的方法，包括以下步骤：
(a)提供木质纤维素酶，其中所述酶包含权利要求19所述的多肽，或由包含权利要求1或权利要求5所述序列的核酸序列编码的多肽；
(b)提供小分子；和
(c)使步骤(a)所述的酶与步骤(b)所述的小分子在促进由所述木质纤维素酶催化的酶促反应的条件下反应，由此通过木质纤维素酶的酶促反应修饰小分子。
其中任选地，步骤(b)包括提供多个用于步骤(a)所述酶的小分子底物，从而产生由所述木质纤维素酶催化的至少一种酶促反应产生的被修饰小分子的文库；
并且任选地，所述方法进一步包括在促进由所述酶催化的多个生物催化反应的条件下，提供多个其它酶，以形成由所述多个酶促反应产生的被修饰小分子的文库；
并且任选地，所述方法进一步包括测试所述文库的步骤，以确定所述文库中是否存在表现出期望活性的特定被修饰小分子，其中任选地，测试所述文库的步骤进一步包括系统性地去除所有但保留其中一个用于产生在所述文库中的所述多个被修饰小分子中的一部分的生物催化反应的步骤，方法是通过测试所述被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子，和鉴定产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。
53.确定木质纤维素酶功能片段的方法，包括以下步骤：
(a)提供木质纤维素酶，其中所述酶包括权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽；和
(b)从步骤(a)所述的序列中缺失多个氨基酸残基，并测试剩余子序列的木质纤维素活性，由此确定木质纤维素酶的功能片段，
其中任选地，所述木质纤维素活性通过提供木质纤维素酶底物并检测所述底物量的减少或反应产物量的增加而测量。
54.通过使用实时代谢流分析来获得新的或修饰的表型的全细胞工程改造的方法，该方法包括如下步骤：
(a)通过修饰细胞的遗传组成来制备修饰的细胞，其中所述遗传组成通过向所述细胞加入包含权利要求1或权利要求5所述核酸序列的核酸而被修饰；
(b)培养所述修饰的细胞以产生多个修饰的细胞；
(c)通过实时监控步骤(b)的细胞培养物来测量所述细胞的至少一个代谢参数；和
(d)分析步骤(c)的数据，以确定测量的参数是否与在类似条件下未修饰细胞中的参照测量值不同，从而使用实时代谢流分析鉴定细胞中的工程改造的表型，
其中任选地，所述细胞的遗传组成通过包括在所述细胞中缺失序列或修饰序列，或敲除基因的表达的方法来修饰，
并且任选地，所述方法进一步包括选择含有新工程改造的表型的细胞，
并且任选地，所述方法进一步包括培养所选择的细胞，从而产生包含新工程改造的表型的新细胞株。
55.分离的、合成的或重组的信号(或前导)序列(信号肽(SP))，其由(a) 权利要求19中所述的氨基酸序列的氨基末端残基1到12、1到13、1到14、1到 15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到 24、1到25、1到26、1到27、1到28、1到28、1到30、1到31、1到32、1到 33、1到34、1到35、1到36、1到37、1到38、1到40、1到41、1到42、1到 43或1到44所述的氨基酸序列组成；或由(b)SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、 SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、 SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、 SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、 SEQ ID NO：170、SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、 SEQ ID NO：188、SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、 SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、 SEQ ID NO：224、SEQ ID NO：226、SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、 SEQ ID NO：242、SEQ ID NO：244、SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、SEQ ID NO：256、SEQ ID NO：258、 SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、SEQ ID NO：274、SEQ ID NO：276、 SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、 SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、SEQ ID NO：312、 SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、SEQ ID NO：330、 SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、 SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、 SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419、 SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、 SEQ ID NO：440、SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、 SEQ ID NO：458、SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、 SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、SEQ ID NO：490至SEQ ID NO：700之间所有偶数编码的SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721和/或其酶活性子序列(片段)所述的氨基酸序列的氨基末端残基1到12、1到13、1到14、1到15、1到 16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到 25、1到26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、1到 34、1到35、1到36、1到37、1到38、1到40、1到41、1到42、1到43或1 到44所述的氨基酸序列组成。
56.嵌合多肽，其含有至少第一结构域和至少第二结构域，所述至少第一结构域含有具有权利要求55所述氨基酸序列的信号序列(信号肽(SP))或前导序列，所述至少第二结构域含有异源的多肽或肽，其中所述异源多肽或肽与所述信号肽 (SP)或前导序列不是天然相连的，
并且任选地，所述异源多肽或肽不是木质纤维素酶，并且任选地，所述异源多肽或肽在所述信号肽(SP)或前导序列的氨基端、羧基端或两端。
57.编码嵌合多肽的分离的、合成的或重组的核酸，其中所述嵌合多肽含有至少第一结构域和至少第二结构域，所述至少第一结构域含有具有权利要求55所述氨基酸序列的信号肽(SP)或前导序列，所述至少第二结构域含有异源的多肽或肽，其中所述异源多肽或肽与所述信号肽(SP)或前导序列不是天然相连的。
58.分离的、合成的或重组的核酸，其包括(a)编码具有木质纤维素活性的多肽和异源信号(或前导)序列(信号肽(SP))的序列，其中所述核酸包含权利要求1或权利要求5所述的核酸序列；(b)，(a)所述的序列，其中所述信号(或前导)序列(信号肽(SP))来源于另一木质纤维素酶或非木质纤维素酶；或(c)， (a)所述的序列，其中所述异源信号序列将编码的蛋白质靶向至液泡、内质网、叶绿体或淀粉颗粒。
59.分离的、合成的或重组的核酸，其包括编码具有木质纤维素活性的多肽的序列，其中所述序列不含有信号序列，并且所述编码多肽的核酸包含权利要求1 或权利要求5所述的核酸序列。
60.提高木质纤维素酶多肽耐热性或热稳定性的方法，所述方法包括对木质纤维素酶进行糖基化，其中所述多肽包括权利要求19所述多肽或由权利要求1或权利要求5所述核酸编码的多肽的至少30个连续氨基酸，由此提高所述木质纤维素酶的耐热性或热稳定性。
61.在细胞中过量表达重组木质纤维素酶的方法，其包括
(A)，表达包含权利要求1所述核酸序列的载体，其中所述过量表达通过使用高活性启动子、双顺反子载体或通过所述载体的基因扩增来完成；或
(B)，(A)所述的方法，其中所述高活性启动子是如下启动子或包括如下启动子：病毒、细菌、哺乳动物或植物启动子；或，植物启动子；或，马铃薯、水稻、玉米、小麦、烟草或大麦启动子；或，组成型启动子或CaMV35S启动子；或，诱导型启动子；或，组织特异的启动子或环境调节的或发育调节的启动子；或，种子特异的、叶特异的、根特异的、茎特异的或脱落诱导的启动子；或，种子优选的启动子、玉米γ玉米醇溶蛋白启动子或玉米ADP-gpp启动子。
62.制备转基因植物的方法，包括以下步骤：
(A)，(a)向所述细胞中引入异源核酸序列，其中所述异源核酸序列包括权利要求1所述的核酸序列，由此产生转化的植物细胞；
(b)从所述转化的细胞产生转基因植物；
(B)，(A)所述的方法，其中所述步骤(A)(a)进一步包括通过电穿孔或显微注射植物原生质体导入所述异源核酸序列；
(C)，(A)或(B)所述的方法，包括通过DNA微粒轰击或通过使用根瘤农杆菌宿主将所述异源核酸序列直接导入植物组织中；或
(D)，(A)、(B)或(C)所述的方法，其中所述植物是单子叶植物或双子叶植物，或所述植物是单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒属植物；或所述植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树木、白杨或羽扇豆。
63.在植物细胞中表达异源核酸序列的方法，包括以下步骤：
(A)，(a)用可操作地连接到启动子的异源核酸序列转化所述植物细胞，其中所述异源核酸序列包括权利要求1或权利要求5所述的核酸序列；和
(b)在所述异源核酸序列在所述植物细胞中被表达的条件下培养所述植物；
(B)，(A)所述的方法，其中所述植物是单子叶植物或双子叶植物，或所述植物是单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒属植物；或所述植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树木、白杨或羽扇豆；或
(C)，(A)或(B)所述的方法，其中所述启动子是如下启动子或包括如下启动子：病毒、细菌、哺乳动物或植物启动子；或，植物启动子；或，马铃薯、水稻、玉米、小麦、烟草或大麦启动子；或，组成型启动子或CaMV35S启动子；或，诱导型启动子；或，组织特异的启动子或环境调节的或发育调节的启动子；或，种子特异的、叶特异的、根特异的、茎特异的或脱落诱导的启动子；或，种子优选的启动子、玉米γ玉米醇溶蛋白启动子或玉米ADP-gpp启动子。
64.用于水解、分解或破坏纤维寡糖、阿拉伯木聚糖寡聚体，或含木质纤维素、木质素、木聚糖、葡聚糖或纤维素组合物的方法，所述方法包括以下步骤：
(A)，(a)提供如权利要求19所述的具有木质纤维素活性的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91至93或权利要求96所述的组合物或制造产物；
(b)提供包含木质纤维素、木质素、木聚糖、纤维素和/或葡聚糖的组合物；和
(c)使步骤(a)的多肽与步骤(b)的组合物在其中木质纤维素酶水解、分解或破坏所述含木质素、木聚糖、纤维寡糖、阿拉伯木聚糖寡聚体或葡聚糖或纤维素的组合物的条件下接触；
(B)，(A)所述的方法，其中所述组合物包括植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物细胞，
(C)，(A)或(B)所述的方法，其中所述多肽具有糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性；
(D)，(A)、(B)或(C)所述的方法，其中(A)(a)的所述多肽是重组多肽；
(E)，(D)所述的方法，其中所述重组多肽作为待水解的含木质纤维素、木聚糖、木质素、葡聚糖或纤维素组合物内的异源重组多肽被产生；
(F)，(D)所述的方法，其中所述重组多肽通过在细菌、酵母、植物、昆虫、真菌和动物中表达编码所述重组多肽的异源多核苷酸来产生，并且任选地，所述生物体选自粟酒裂殖酵母、酿酒酵母、巴斯德毕赤酵母、大肠杆菌、链霉菌属某种、杆菌属某种和乳酸杆菌属某种；或
(G)，(A)至(F)所述的方法，其中所述含木质纤维素、木质素、木聚糖、葡聚糖或纤维素组合物包括：单子叶植物或双子叶植物或植物产物；或，单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒属植物；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树木、白杨或羽扇豆。
65.面团或面包产物，其包含权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
66.面团调理的方法，包括在足以调理所述面团的条件下，使面团或面包产物与权利要求19所述的多肽、或由权利要求1或权利要求5所述的核酸编码的多肽、或权利要求91到93或权利要求96所述的组合物或制造产物中的至少一种接触。
67.饮料，其含有权利要求19所述的多肽，或由权利要求1或权利要求5所述的核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
68.饮料生产的方法，包括在足以降低所述饮料粘度的条件下，给予饮料或饮料前体权利要求19所述的多肽，或由权利要求1或权利要求5所述的核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物中的至少一种，
其中任选地，所述饮料或饮料前体是麦芽或啤酒。
69.食品、饲料、食品或饲料补充剂或营养补充剂，含有权利要求19所述的多肽，或由权利要求1或权利要求5所述的核酸编码的多肽，或权利要求91到93 或权利要求96所述的组合物或制造产物，
其中任选地，所述多肽具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
70.在动物膳食中利用木质纤维素酶作为营养补充剂的方法，所述方法包括：
(A)，(a)制备包含木质纤维素酶的营养补充剂，所述木质纤维素酶包含权利要求19所述的多肽，或由权利要求1或权利要求5所述的核酸编码的多肽；或权利要求91到93或权利要求96所述的组合物或制造产物中的至少一种；或
(b)给予动物所述营养补充剂以增加包含在被所述动物摄取的饲料或食品中的木聚糖的利用；
(B)，(A)所述的方法，其中所述动物是人类，或所述动物是反刍动物或单胃动物，
(C)，(A)或(B)所述的方法，其中所述木质纤维素酶通过在选自细菌、酵母、植物、昆虫、真菌、动物、粟酒裂殖酵母、酿酒酵母、巴斯德毕赤酵母、大肠杆菌、链霉菌属某种、杆菌属某种和乳酸杆菌属某种的生物体中表达编码所述木质纤维素酶的多核苷酸而制备。
71.可食用酶输送基质或小丸，其包含热稳定的重组木质纤维素酶，所述木质纤维素酶包括权利要求19所述的多肽，或由权利要求1或权利要求5所述的核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
72.向动物或人输送木质纤维素酶补充剂的方法，所述方法包括：制备含有颗粒状可食用载体和热稳定重组木质纤维素酶的可食用酶输送基质或小丸，其中所述小丸容易将包含在其中的木质纤维素酶分散至含水介质中，并且所述重组木质纤维素酶包括权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或所述重组木质纤维素酶是权利要求91到93或权利要求96所述的组合物或制造产物；和，给予所述动物或人所述可食用的酶输送基质或小丸，
其中任选地，所述颗粒状可食用载体包括选自谷物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉和小麦粗粉的载体，
并且任选地，所述可食用载体包含去油的谷物胚芽，
并且任选地，所述木质纤维素酶被糖基化以在制丸的条件下提供热稳定性，
并且任选地，所述输送基质通过将含有谷物胚芽和木质纤维素酶的混合物制丸而形成，
并且任选地，所述制丸条件包括应用蒸汽，以及可选地，所述制丸条件包括应用超过大约80℃的温度大约5分钟，而所述酶保留每毫克酶至少350至大约900 单位的比活性。
73.含木质纤维素组合物，其包括权利要求19所述的多肽，或由权利要求1 或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
74.木材、木浆、木材废料或木制品，其包含如权利要求19中所述的木质纤维素酶和/或纤维素酶，或由权利要求1或权利要求5所述核酸编码的纤维素酶或木质纤维素酶，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述纤维素酶活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
75.纸、纸浆或纸制品，其包含权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
76.减少纸、木材、木材废料或木制品中纤维素酶的量的方法，包括使所述纸、木材或木制品与如权利19中所述的木质纤维素酶和/或纤维素酶，或由权利要求1 或权利要求5所述核酸编码的木质纤维素酶和/或纤维素酶，或权利要求91到93 或权利要求96所述的组合物或制造产物接触，其中任选地，所述纤维素酶活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
77.洗涤剂组合物，其包含如权利要求19中所述的木质纤维素酶和/或纤维素酶，或由权利要求1或权利要求5所述核酸编码的木质纤维素酶或纤维素酶，或权利要求91到93或权利要求96所述的组合物或制造产物，
其中任选地，所述多肽被配制成非水液体组合物、铸态固体、粒状形式、微粒形式、压缩片剂、凝胶形式、糊剂或浆状物形式，
并且任选地，所述木质纤维素酶和/或纤维素酶活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
78.药物组合物或膳食补充剂，其包含如权利要求19中所述的木质纤维素酶和/或纤维素酶，或由权利要求1或权利要求5所述核酸编码的木质纤维素酶或纤维素酶，或权利要求91到93或权利要求96所述的组合物或制造产物，
其中任选地，所述木质纤维素酶和/或纤维素酶被配制成片剂、凝胶、丸粒、植入物、液体、喷剂、粉末、食品、饲料小丸或配制成胶囊化的制剂，
并且任选地，所述木质纤维素酶和/或纤维素酶活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，其中任选地，所述组合物进一步包括葡萄糖氧化酶、葡萄糖氧化酶-1 (β-葡糖苷酶)或葡萄糖氧化酶-2(β-木糖苷酶)。
79.燃料，其包含权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶活性、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶活性，其中任选地，所述组合物进一步包括葡萄糖氧化酶、葡萄糖氧化酶-1(β-葡糖苷酶)或葡萄糖氧化酶-2(β-木糖苷酶)，
其中任选地，所述燃料来源于植物材料，所述植物材料任选地包括马铃薯、大豆(油菜籽)、大麦、裸麦、玉米、燕麦、小麦、甜菜或甘蔗，
并且任选地，所述燃料包括液体或气体，
并且任选地，所述燃料为生物燃料或合成燃料，或所述燃料包括生物乙醇、生物甲醇、生物丙醇或生物丁醇，或所述燃料包括汽油-乙醇、甲醇、丙醇和/或丁醇混合物。
80.制备燃料的方法，包括
(A)，将包含纤维寡糖、阿拉伯木聚糖寡聚体、木质素、木质纤维素、木聚糖、葡聚糖、纤维素或可发酵糖的组合物与权利要求19所述的多肽、或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物接触；
(B)，(A)所述的方法，其中所述包含纤维寡糖、阿拉伯木聚糖寡聚体、木质素、木质纤维素、木聚糖、葡聚糖、纤维素或可发酵糖的组合物包括植物、植物产物或植物衍生物；
(C)，(A)或(B)所述的方法，其中所述植物或植物产物包括甘蔗植物或植物产物、甜菜或甜菜、小麦、玉米、大豆、马铃薯、水稻或大麦；
(D)，(C)所述的方法，其中所述植物是单子叶植物或双子叶植物，或所述植物是单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒属植物；或所述植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树木、白杨或羽扇豆；
(E)，(A)、(B)、(C)或(D)所述的方法，其中所述多肽具有活性，包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，其中任选地，所述组合物进一步包括葡萄糖氧化酶、葡萄糖氧化酶-1(β-葡糖苷酶)或葡萄糖氧化酶-2(β-木糖苷酶)，
(F)，(A)、(B)、(C)、(D)或(E)所述的方法，其中所述燃料包括液体和 /或气体，或所述燃料包括生物燃料和/或合成燃料，或所述燃料包括生物乙醇、生物甲醇、生物丙醇或生物丁醇；和/或汽油-乙醇、甲醇、丁醇和/或丙醇混合物。
81.制备生物乙醇、生物甲醇、生物丙醇和/或生物丁醇的方法，包括
(A)将包含纤维寡糖、阿拉伯木聚糖寡聚体、木质素、木质纤维素、木聚糖、葡聚糖、纤维素或可发酵糖的组合物与权利要求19所述的多肽、或由权利要求1 或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物接触；
(B)，(A)所述的方法，其中所述组合物包括植物、植物产物或植物衍生物，并且任选地，所述植物或植物产物包括甘蔗植物或植物产物、甜菜或甜菜、小麦、玉米、大豆、马铃薯、水稻或大麦，
(C)，(A)或(B)所述的方法，其中所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，其中任选地，所述组合物进一步包括葡萄糖氧化酶、葡萄糖氧化酶-1(β-葡糖苷酶)或葡萄糖氧化酶-2(β-木糖苷酶)；或
(D)，(A)、(B)或(C)所述的方法，其中所述植物是单子叶植物或双子叶植物，或所述植物是单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒属植物；或所述植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树木、白杨或羽扇豆；
(E)，(A)、(B)、(C)、或(D)所述的方法，进一步包括将生物乙醇、生物甲醇、生物丙醇和/或生物丁醇加工和/或配制成液体燃料和/或气体燃料，其中任选地，所述燃料包括生物燃料和/或合成燃料，或所述燃料包括生物乙醇、生物甲醇、生物丙醇和/或生物丁醇；和/或汽油-乙醇、甲醇、丁醇和/或丙醇混合物。
82.酶整体或“混合物”，用于将纤维素和半纤维素聚合物解聚成可代谢的碳部分，其包括权利要求19所述的多肽、或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，
其中任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶活性，其中任选地，所述组合物进一步包括葡萄糖氧化酶、葡萄糖氧化酶-1(β-葡糖苷酶)或葡萄糖氧化酶-2(β-木糖苷酶)。
83.处理包含木质纤维素的生物质材料的方法，包括将包含纤维素或可发酵糖的组合物与权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物接触，
其中任选地，所述包含木质纤维素的生物质材料来源于农作物，是食品或饲料生产的副产品，是木质纤维素废品，或是植物残渣或废纸或废纸产品，并且任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，其中任选地，所述组合物进一步包括葡萄糖氧化酶、葡萄糖氧化酶-1(β-葡糖苷酶)或葡萄糖氧化酶-2(β-木糖苷酶)，
并且任选地，所述植物残渣包括茎、叶、皮、壳、玉米或玉米穗、玉米秸秆、干草、秸秆、木材、木片、木浆、木材废料和锯屑，
并且任选地，所述废纸包括丢弃的或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和基于纸的包装材料，
并且任选地，所述生物质材料的处理产生生物醇、生物乙醇、生物甲醇、生物丁醇或生物丙醇。
84.乳制品，其包含权利要求19所述的多肽，或由权利要求1或权利要求5 所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述乳制品包含奶、冰激凌、奶酪或酸奶，并且任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
85.改善乳制品的质地和味道的方法，所述方法包括下列步骤：(a)提供权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物；(b)提供乳制品；和(c) 在所述木质纤维素酶和/或纤维素酶能够改善所述乳制品的质地或味道的条件下，使步骤(a)所述的多肽与步骤(b)所述的乳制品接触。
86.纺织品或织物，其包含权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述纺织品或织物包括含纤维素的纤维，并且任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
87.处理固体或液体动物废物产物的方法，包括以下步骤：
(a)提供权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性；
(b)提供固体或液体动物废物；和
(c)在所述蛋白酶能够处理所述废物的条件下，将步骤(a)所述的多肽与步骤(b)所述的固体或液体废物接触。
88.被处理的废物产物，其包括权利要求19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有活性，包括木质纤维素酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
89.消毒剂，其包含具有木质纤维素活性的多肽，其中所述多肽包括权利要求 19所述的多肽，或由权利要求1或权利要求5所述核酸编码的多肽，或权利要求 91到93或权利要求96所述的组合物或制造产物，其中任选地，所述多肽具有活性，包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
90.生物解毒剂或生物防护剂，其包含具有木质纤维素酶、纤维素酶和/或纤维素分解活性的多肽，其中所述多肽包括权利要求19所述的多肽，或由权利要求 1或权利要求5所述核酸编码的多肽，或权利要求91到93或权利要求96所述的组合物或制造产物，所述多肽具有活性，所述活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
91.组合物或制造产物，包括
(a)木质纤维素酶的混合物(或“鸡尾酒”)，其包含(i)每种内切葡聚糖酶、纤维二糖水解酶I(CBH I)、纤维二糖水解酶II(CBH II)和β-葡糖苷酶的至少一种； (ii)每种木聚糖酶、β-木糖苷酶和阿拉伯呋喃糖苷酶的至少一种；或，(iii)，(i) 或(ii)的至少一种的组合；其中(a)的所述混合物包括至少一种权利要求19所述的酶；
(b)半纤维素-水解酶和纤维素-水解酶的混合物(或“鸡尾酒”)，包括(i)每种内切葡聚糖酶、木质纤维素酶、纤维二糖水解酶I(CBH I)、纤维二糖水解酶II (CBH II)、阿拉伯呋喃糖苷酶和木聚糖酶中的至少一种；(ii)，(i)所述的混合物，其中所述葡萄糖氧化酶是葡萄糖氧化酶-1或β-葡糖苷酶；或(iii)，(i)或(ii)的混合物，其中所述葡萄糖氧化酶是葡萄糖氧化酶-2或β-木糖苷酶；其中(b)所述的混合物包括至少一种权利要求19所述的酶；
(c)半纤维素-水解酶和纤维素-水解酶的混合物(或“鸡尾酒”)，包括：每种内切葡聚糖酶；纤维二糖水解酶I(CBH I)；纤维二糖水解酶II(CBH II)；阿拉伯呋喃糖苷酶；木聚糖酶；葡萄糖氧化酶-1(β-葡糖苷酶)；和葡萄糖氧化酶-2或β- 木糖苷酶的至少一种；其中(c)所述的混合物包括至少一种权利要求19所述的酶；
(d)酶混合物(或“鸡尾酒”)，包括：(1)内切葡聚糖酶，其切割内部的β-1，4 键，产生更短的葡糖寡糖，(2)纤维二糖水解酶，其以“外切”方式作用，向前释放纤维二糖单位(β-1，4葡萄糖-葡萄糖二糖)，和(3)β-葡糖苷酶，用于从短的纤维寡糖(例如，纤维二糖)释放葡萄糖单体；其中(d)所述的混合物包括至少一种权利要求19所述的酶；
(e)酶混合物(或“鸡尾酒”)，包括：SEQ ID NO：34、SEQ ID NO：360、SEQ ID NO：358和SEQ ID NO：371；或，SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：168；或，SEQ ID NO：34、SEQ ID NO：360、SEQ ID NO：214；或，SEQ ID NO：360、 SEQ ID NO：90、SEQ ID NO：358；或
(f)酶混合物(或“鸡尾酒”)，包括如表4中所述的酶的组合。
92.权利要求91所述的组合物或制造产物，其中
(a)，内切葡聚糖酶包括SEQ ID NO：4，纤维二糖水解酶I包括SEQ ID NO：16、 SEQ ID NO：30或SEQ ID NO：356，纤维二糖水解酶II包括SEQ ID NO：282，β-葡糖苷酶包括SEQ ID NO：124，木聚糖酶包括SEQ ID NO：262，或其任何组合，
(b)，(a)所述的酶组合，其中至少一种酶包括额外的糖结合结构域(CBM)。
93.组合物或制造产物，包括(a)如权利要求91中所述的酶混合物(或“鸡尾酒”)，或至少一种权利要求19所述的木质纤维素酶，和生物质材料；(b)，(a) 所述的混合物，其中所述生物质材料包括来源于农作物的木质纤维素材料，或所述生物质材料是食品或饲料生产的副产品，或所述生物质材料是木质纤维素废品，或所述生物质材料是植物残渣或废纸或废纸制品；或所述生物质材料包括植物残渣；(c)，(a)或(b)的混合物，其中所述植物残渣或所述生物质材料包括甘蔗渣、茎、叶、皮、壳、玉米或玉米穗、玉米秸秆、干草、秸秆、木材、木片、木浆、木材废料和/或锯屑，或者，所述废纸包括丢弃的或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和基于纸的包装材料。
94.处理生物质材料的方法，包括
(a)提供：(i)(A)酶混合物(或“鸡尾酒”)，或(B)权利要求91至93或权利要求96所述的组合物或制造产物；和(ii)生物质材料；
其中所述酶混合物(或“鸡尾酒”)包括：(I)至少一种权利要求19所述的木质纤维素酶；或(II)，(I)所述的混合物，包括含有半纤维素-水解酶和纤维素水解酶的酶混合物(或“鸡尾酒”)，其中所述纤维素-水解酶包括至少一种葡萄糖氧化酶、内切葡聚糖酶、纤维二糖水解酶I、纤维二糖水解酶II和β-葡糖苷酶；而半纤维素-水解酶包括至少一种木聚糖酶、β-木糖苷酶和阿拉伯呋喃糖苷酶，
并且任选地，所述酶具有活性，包括葡萄糖氧化酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性；和
(b)使所述酶混合物与所述生物质材料接触。
95.权利要求94所述的方法，其中包含木质纤维素的所述生物质材料来源于农作物，是食品或饲料生产的副产品，是木质纤维素废产物，或是植物残渣或植物材料，或废纸或废纸产品，并且任选地，所述植物残渣或植物材料包括甘蔗渣、茎、叶、皮、壳、玉米或玉米穗、玉米秸秆、干草或秸秆、木材、木片、木浆、木材废料和锯屑，并且任选地，所述废纸包括丢弃的或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和基于纸的包装材料，并且任选地，所述生物质材料的处理产生生物乙醇。
96.酶混合物或鸡尾酒，其包括
(a)至少一种权利要求19所述的木质纤维素酶；
(b)如表4中所述的酶组合；
(c)(i)每种内切葡聚糖酶、纤维二糖水解酶I(CBH I)、纤维二糖水解酶II (CBH II)和β-葡糖苷酶的至少一种；(ii)每种木聚糖酶、β-木糖苷酶和阿拉伯呋喃糖苷酶的至少一种；或(iii)，(i)或(ii)的至少一种的组合；其中所述混合物包括至少一种权利要求19所述酶；
(d)至少一种半纤维素水解酶和/或纤维素水解酶，包括(i)每种内切葡聚糖酶、葡萄糖氧化酶、纤维二糖水解酶I(CBH I)、纤维二糖水解酶II(CBH II)、阿拉伯呋喃糖苷酶和木聚糖酶的至少一种；(ii)，(i)所述的混合物，其中所述葡萄糖氧化酶是葡萄糖氧化酶-1或β-葡糖苷酶；和/或(iii)，(i)或(ii)所述的混合物，其中所述葡萄糖氧化酶是葡萄糖氧化酶-2或β-木糖苷酶；其中所述混合物包括至少一种权利要求19所述的酶；
(e)至少一种半纤维素水解酶和/或纤维素水解酶，包括：每种内切葡聚糖酶；纤维二糖水解酶I(CBH I)；纤维二糖水解酶II(CBH II)；阿拉伯呋喃糖苷酶；木聚糖酶；葡萄糖氧化酶-1(β-葡糖苷酶)；和/或葡萄糖氧化酶-2或β-木糖苷中的至少一种；其中(c)所述的混合物包括至少一种权利要求19所述的酶；
(f)至少一种(1)内切葡聚糖酶，其切割内部的β-1，4键，产生更短的葡糖寡糖，(2)纤维二糖水解酶，其以“外切”方式作用，向前释放纤维二糖单位(β-1，4 葡萄糖-葡萄糖二糖)，和/或(3)β-葡糖苷酶，用于从短的纤维寡糖(例如，纤维二糖)释放葡萄糖单体；其中(d)所述的混合物包括至少一种权利要求19所述的酶；
(g)酶组合，包括：SEQ ID NO：34、SEQ ID NO：360、SEQ ID NO：358和SEQ ID NO：371；或，SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：168；或，SEQ ID NO：34、SEQ ID NO：360、SEQ ID NO：214；或，SEQ ID NO：360、SEQ ID NO：90、 SEQ ID NO：358。
97.处理生物质材料的方法，包括
(a)，(i)提供如权利要求96中所述的酶混合物，和
(ii)将所述酶混合物与所述生物质材料接触；
(b)，(a)所述的处理，其中包含木质纤维素的所述生物质材料来源于农作物，是食品或饲料生产的副产品，是木质纤维素废物产品，或是植物材料、所述处理的植物副产品，或植物残渣，或废纸或废纸产品；
(c)，(a)或(b)所述的处理，其中所述多肽具有活性，包括葡萄糖氧化酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性；
(d)，(a)、(b)或(c)所述的处理，其中所述生物质材料包括植物残渣，所述植物残渣包括甘蔗渣、茎、叶、皮、壳、玉米或玉米穗、玉米秸秆、干草或秸秆、木材、木片、木浆、废纸、木材废料和/或锯屑；
(e)，(d)所述的处理，其中所述废纸包括丢弃的或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和基于纸的包装材料；
(f)，(a)、(b)、(c)、(d)或(e)所述的处理，进一步包括处理所述生物质材料以产生糖类、生物乙醇和/或醇。
98.嵌合多肽，其包含
(a)，第一结构域和至少第二结构域，所述至少第一结构域包含权利要求19 所述的酶，所述第二结构域包含异源的或修饰的糖结合结构域(CBM)、异源的或修饰的锚定结构域、异源的或修饰的前原结构域、或异源的或修饰的活性位点；
(b)，(a)所述的嵌合多肽，其中所述糖结合结构域(CBM)是纤维素-结合模块或木质素-结合结构域；
(c)，(a)或(b)所述的嵌合多肽，其中所述CBM靠近所述酶的催化结构域；
(d)，(a)、(b)或(c)所述的嵌合多肽，其中所述至少一个CBM在位置上靠近所述多肽的催化结构域；
(e)，(d)所述的嵌合多肽，其中所述至少一个CBM被定位：靠近所述多肽的催化结构域的C-末端，或，靠近所述多肽的催化结构域的N-末端，或者靠近所述多肽的催化结构域的两端；
(f)，(a)、(b)、(c)或(e)所述的嵌合多肽，其中所述嵌合多肽是重组嵌合蛋白质。
99.嵌合多肽，其包含
(a)具有木质纤维素酶活性的权利要求19所述的多肽和结构域，所述结构域包括至少一个异源或修饰的糖结合结构域(CBM)、或至少一个内部重排的CBM 或它们的任何组合；
(b)，(a)所述的嵌合多肽，其中所述异源的或修饰的或内部重排的CBM包括如下部分或由如下部分组成：CBM_1、CBM_2、CBM_2a、CBM_2b、CBM_3、 CBM_3a、CBM_3b、CBM_3c、CBM_4、CBM_5、CBM_5_12、CBM_6、CBM_7、 CBM_8、CBM_9、CBM_10、CBM_11、CBM_12、CBM_13、CBM_14、CBM_15、 CBM_16或来自CBM_1至CBM_48的CMB家族的任何CBM；糖基水解酶结合结构域；如在表5或表6中所述的CBM；或它们的任何组合；
(c)，(a)或(b)所述的嵌合多肽，其中所述CBM包括纤维素-结合模块或木质素-结合结构域；
(d)，(a)、(b)或(c)所述的嵌合多肽，其中所述至少一个CBM在位置上靠近所述多肽的催化结构域；
(e)，(d)所述的嵌合多肽，其中所述至少一个CBM被定位：靠近所述多肽的催化结构域的C-末端，或，靠近所述多肽的催化结构域的N-末端，或者靠近所述多肽的催化结构域的两端；或
(f)，(a)、(b)、(c)或(e)所述的嵌合多肽，其中所述嵌合多肽是重组嵌合蛋白质。
100.分离的、合成的和/或重组的糖结合结构域-模块(CBM)，其包括糖结合结构域模块(CBM)基序或由之组成，所述糖结合结构域模块(CBM)基序包括权利要求19所述多肽的子序列或由权利要求1或权利要求5所述核酸编码的多肽，或由权利要求19所述多肽的子序列或由权利要求1或权利要求5所述核酸编码的多肽组成，其中所述糖结合结构域-模块(CBM)包括CBM_1、CBM_2、CBM_2a、 CBM_2b、CBM_3、CBM_3a、CBM_3b、CBM_3c、CBM_4、CBM_5、CBM_5_12、 CBM_6、CBM_7、CBM_8、CBM_9、CBM_10、CBM_11、CBM_12、CBM_13、 CBM_14、CBM_15、CBM_16或来自CBM_1至CBM_48的CMB家族的任何CBM，或由之组成。
101.分离的、合成的和/或重组的糖结合结构域-模块(CBM)，其包括下列部分或由下列部分组成：
(a)至少一个如表5和序列表中所述的糖结合结构域-模块(CBM)；
(b)至少一个如表6和序列表中所述的糖结合结构域-模块(CBM)；
(c)至少一个权利要求100所述的糖结合结构域-模块(CBM)；或
(d)它们的组合。

说明书全文

参考通过EFS-WEB提交的 序列表

【0001】本申请通过USPTO EFS-WEB服务器电子提交，如在MPEP§1730 II.B.2.(a)(A)所批准并阐明的，并且该电子提交包括电子提交的序列(SEQ ID)表；该序列表的全部内容通过引用明确并入本文用于所有目的。序列表根据如下电子提交的.txt文件确定：

文件名创建日期大小(字节) 564462015440Seqlist.txt 2008年1月28日 2,530,632字节

发明领域

【0002】本发明涉及分子和细胞生物学和生物化学。一方面，本发明提供具有木质纤维素分解(木质纤维素)活性例如木质素分解和纤维素分解活性——其包括例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性——的多肽，编码这些多肽的多核苷酸，以及制备和使用这些多核苷酸和多肽的方法。在一个实施方式中，本发明提供本发明多肽的热稳定和耐热形式。本发明的多肽和核酸用于各种制药、农业和工业环境中；例如，作为用于将生物质例如木质纤维素残余物生物转化为可发酵糖的酶，其中一方面，这些糖用作化学原料用于乙醇和燃料——例如生物燃料，例如合成的液体或气体燃料，其包括乙醇、甲醇等等——的生产。

背景技术

【0003】将生物质例如包括木质纤维素残余物的材料生物转化为可发酵的糖具有巨大利益。这些糖可转而用作化学原料用于生物燃料的生产，生物燃料是清洁燃烧的可再生能源。因此，在工业中存在处理生物质来生产清洁燃烧可再生燃料的非化学方法的需要。
发明概述
【0004】本发明提供具有木质纤维素分解(木质纤维素)活性例如木质素分解和纤维素分解活性——其包括例如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/ 或阿拉伯呋喃糖苷酶活性——的多肽，编码这些多肽的核酸，以及制备和使用它们的方法。本发明提供用于将任何生物质例如木质纤维素残余物生物转化为可发酵的糖或多糖的酶；并且这些糖或多糖可用作化学原料用于醇类例如乙醇、丙醇、丁醇和/或甲醇的生产以及燃料例如生物燃料——例如合成的液体或气体，例如合成气——的生产。
【0005】一方面，本发明的酶具有增加的催化速率以改善底物(例如木质纤维素残余物、纤维素、蔗渣)水解过程。在催化速率上这种增加的效率导致在生产糖或多糖上增加的效率，所述糖或多糖可用于工业、农业或医学应用中，例如制造生物燃料或醇类，例如乙醇、丙醇、丁醇和/或甲醇。一方面，使用本发明的酶水解产生的糖可被微生物用于醇类(例如乙醇、丙醇、丁醇和/或甲醇)的生产和/或燃料(例如生物燃料)的生产。
【0006】一方面，本发明提供具有木质纤维素活性的高活性多肽，例如具有增加的催化速率的多肽，包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶。
【0007】本发明提供工业、农业或医学应用：例如生物质转化为生物燃料例如乙醇、丙醇、丁醇和/或甲醇，其使用本发明的具有降低的酶成本的酶，例如在生物质转化为生物燃料的过程中降低的成本。因此，本发明提供了由任何生物质生产生物醇、生物燃料和/或包含生物燃料(例如生物乙醇、丙醇、丁醇和/或甲醇 -)的组合物的有效过程(方法)，包括包含生物醇的合成的、液体或气体燃料。
【0008】一方面，本发明的酶，包括本发明的酶“鸡尾酒”(“鸡尾酒”意思是包括本发明的至少一种酶的酶混合物)，用于水解木质纤维素生物质的主要组分，或任何包括纤维素和/或半纤维素(木质纤维素生物质也包括木质素)的组合物，例如种子、谷物、块茎、植物废料(例如干草或稻草例如水稻杆或小麦杆或任何谷类植物的任何干秸秆)或食品加工或工业加工的副产品(例如秸秆)、玉米(包括穗、秸、等等)、草(例如印度草如蓝刚草(Sorghastrum nutans)；或柳枝稷(switch grass) 例如黍(Panicum)的种，如柳枝稷(Panicum virgatum))、木材(其包括木片、加工废料例如木材废料)、纸、纸浆、再生纸(例如新闻纸)；还包括单子叶植物或双子叶植物或单子叶玉米、甘蔗或其部分(例如蔗梢)、水稻、小麦、大麦、柳枝稷或芒(Miscanthus)；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0009】一方面，本发明的酶用于水解纤维素，包括β-1，4-连接的葡萄糖部分的线性链，和/或半纤维素，其作为复杂的结构在各植物之间有所变化。一方面，本发明的酶用于水解半纤维素，其含有具有阿拉伯糖、半乳糖、葡糖醛酸和/或甘露糖的不连续分支的β-1，4连接的木糖分子的骨架。一方面，本发明的酶用于水解半纤维素，其含有非碳水化合物成分例如木糖上的乙酰基以及阿拉伯糖上的阿魏酸酯。一方面，本发明的酶用于水解半纤维素，其被共价地连接至木质素和/或通过二阿魏酸酯(diferulate)交联被偶联至其它半纤维素链。
【0010】一方面，本发明的组合物和方法用于生物质的酶促消化并可包括使用多种不同的酶，其包括纤维素酶和半纤维素酶。用于实践本发明的木质纤维素酶能够消化纤维素为包括葡萄糖在内的单糖。一方面，用于实践本发明的组合物可包括酶的混合物，例如糖基水解酶、葡萄糖氧化酶、木聚糖酶、木糖苷酶(例如β-木糖苷酶)、纤维二糖水解酶和/或阿拉伯呋喃糖苷酶或其它可消化半纤维素为单体糖的酶。本发明的混合物可包括本发明的酶或仅由本发明的酶组成，或可包括至少一种本发明的酶和其它酶，所述其它酶也可以是木质纤维素酶和/或任何其它酶，例如葡萄糖氧化酶。
【0011】一方面，用于实践本发明的组合物包括“纤维素酶”，其是至少三种不同类型酶的混合物，(1)内切葡聚糖酶，其切割内部β-1，4键，产生较短的葡糖寡糖(glucooligosaccharides)，(2)纤维二糖水解酶，其以“外切”方式作用逐个释放纤维二糖单元(β-1，4葡萄糖-葡萄糖二糖)，以及(3)β-葡糖苷酶，其从短的纤维寡糖 (例如纤维二糖)释放葡萄糖单体。
【0012】一方面，本发明的酶具有葡聚糖酶例如内切葡聚糖酶活性，例如催化内部内切-β-1，4-和/或β-1，3-葡聚糖酶键的水解。一方面，内切葡聚糖酶活性(例如内切-1，4-β-D-葡聚糖4-葡聚糖水解酶活性)包括水解纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣聚糖(lichenin)的1，4-和/或β-1，3-β-D-糖苷键，混合的β-1，3葡聚糖的β-1，4键，例如谷类β-D-葡聚糖或木糖葡聚糖和其它含有纤维素部分的植物材料。
【0013】一方面，本发明的酶具有内切葡聚糖酶(例如内切-β-1，4-葡聚糖酶， EC 3.2.1.4；内切-β-1，3(1)-葡聚糖酶，EC 3.2.1.6；内切-β-1，3-葡聚糖酶，EC 3.2.1.39) 活性并可水解纤维素和葡聚糖的内部β-1，4-和/或β-1，3-糖苷键以产生分子量更小的葡萄糖和葡萄糖寡聚体。本发明提供使用本发明的这些酶来产生分子量更小的葡萄糖和葡萄糖寡聚体的方法。
【0014】一方面，本发明的酶用于产生葡聚糖，例如，由1，4-β-和/或1，3-糖苷 -连接的D-吡喃葡萄糖形成的多糖。一方面，本发明的内切葡聚糖酶被用在食品工业中，如用于烘焙及水果和蔬菜加工、农业废物的分解、动物饲料的生产、纸浆和纸的生产、纺织物生产以及家用和工业清洁剂。一方面，通过微生物如真菌和/ 或细菌，生产本发明的酶，例如内切葡聚糖酶。
【0015】一方面，本发明的酶如内切葡聚糖酶被用于水解β-葡聚糖(β-葡聚糖)， β-葡聚糖是谷物主要的非淀粉多糖。根据品种和生长条件，多糖的葡聚糖含量可显著变化。该多糖的物理化学性质是在氧化条件下产生粘性溶液或者甚至是凝胶。此外，葡聚糖具有高的水结合能力。所有这些特征给几个行业带来了问题，包括酿造、烘焙、动物营养。在酿造应用中，葡聚糖的存在导致麦芽汁过滤性和形成浑浊的问题。在烘焙应用中(尤其对于曲奇和脆饼)，葡聚糖可产生发粘面团，其难以进行机械处理和减小饼干大小。因此，本发明的酶如内切葡聚糖酶被用于降低含β-葡聚糖的组合物中β-葡聚糖的量，例如，本发明的酶被用在降低溶液或凝胶的粘度的工艺中；用于降低组合物例如含β-葡聚糖的组合物的水结合能力；在酿造工艺中(例如，用于增加麦芽汁过滤性和降低混浊形成)，用于降低面团的粘性，例如，用于制作曲奇、面包、饼干等等的面团。
【0016】此外，碳水化合物(例如β-葡聚糖)参与烘焙的产品的快速再水化，导致松脆性丧失和缩短的货架期。因此，本发明的酶，例如内切葡聚糖酶，被用于保持松脆性、增加松脆性或降低松脆性的损失速率，以及增加任何含碳水化合物食品、饲料或饮料的货架期，例如含β-葡聚糖的食品、饲料或饮料。
【0017】本发明的酶，例如内切葡聚糖酶，被用于降低消化道内容物(例如在动物中，如反刍动物或人中)的粘性，例如，含有谷物膳食的那些。因此，在可选的方面，本发明的酶，例如内切葡聚糖酶，被用于积极影响食品或饲料的可消化性以及动物(例如人或家畜)生长速率，以及在一方面，被用于产生更高的饲料转化效率。对于谷物食物的单胃动物饲料应用，β-葡聚糖是消化道内容物的粘性的促成因素，并且从而负面影响饲料的可消化性和动物生长速率。对于反刍动物，这些β-葡聚糖代表纤维摄入的主要成分，而葡聚糖的更完全的消化将促进更高的饲料转化效率。因此，本发明提供了含有本发明的内切葡聚糖酶的动物饲料和食品，并且在一方面，这些酶在动物消化道中是有活性的，例如在胃和/或肠中是有活性的。
【0018】本发明的酶，例如内切葡聚糖酶，被用于消化纤维素或任何含β-1，4- 连接葡聚糖的合成或天然的材料，包括在任何植物材料中发现的那些。本发明的酶，例如内切葡聚糖酶，被用作消化任何来源的纤维素的商业酶，其包括所有生物来源，例如植物生物质，例如玉米、谷物、草(例如印度草例如蓝刚草(Sorghastrum nutans)；或柳枝稷(switch grass)，例如黍属(Panicum)的种，例如柳枝稷(Panicum virgatum))；还包括单子叶植物或双子叶植物或单子叶玉米、甘蔗或其部分(例如蔗梢)、水稻、小麦、大麦、柳枝稷或芒；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆；或木材或木材处理副产品，例如在木材处理、纸浆和/或纸工业中、在纺织品制造中以及在家用和工业清洁剂中和/或在生物物质废物处理中。
【0019】一方面，本发明提供了含有本发明的酶、多肽或多核苷酸的组合物 (例如，药物组合物、食物、饲料、药物、饮食补充物)。这些组合物可以以各种形式加以配制，例如丸剂、胶囊、片剂、凝胶、凝胶片(geltab)、洗剂、丸剂、注射剂、植入物、液体、喷剂、粉末、食物、添加剂、补充剂、饲料或饲料小丸或任何类型的胶囊化形式或任何类型的制剂。
【0020】本发明提供了分离的、合成的或重组的核酸序列，包括在至少约10、 15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、 450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、 1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、 1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、 2400、2450、2500或更多残基的区域内，或者在由蛋白编码区域(例如cDNA) 或基因组序列组成的区域内，与本发明的示例性核酸具有至少约50％、51％、52％、 53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、 66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、 79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、 92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的核酸序列，本发明的示例性核酸包括：SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ ID NO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、 SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ ID NO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ ID NO：149、SEQ ID NO：151、 SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ ID NO：167、SEQ ID NO：169、SEQ ID NO：171、SEQ ID NO：173、SEQ ID NO：175、SEQ ID NO：177、SEQ ID NO：179、 SEQ ID NO：181、SEQ ID NO：183、SEQ ID NO：185、SEQ ID NO：187、SEQ ID NO：189、SEQ ID NO：191、SEQ ID NO：193、SEQ ID NO：195、SEQ ID NO：197、SEQ ID NO：199、SEQ ID NO：201、SEQ ID NO：203、SEQ ID NO：205、SEQ ID NO：207、 SEQ ID NO：209、SEQ ID NO：211、SEQ ID NO：213、SEQ ID NO：215、SEQ ID NO：217、SEQ ID NO：219、SEQ ID NO：221、SEQ ID NO：223、SEQ ID NO：225、SEQ ID NO：227、SEQ ID NO：229、SEQ ID NO：231、SEQ ID NO：233、SEQ ID NO：235、 SEQ ID NO：237、SEQ ID NO：239、SEQ ID NO：241、SEQ ID NO：243、SEQ ID NO：245、SEQ ID NO：247、SEQ ID NO：249、SEQ ID NO：251、SEQ ID NO：253、SEQ ID NO：255、SEQ ID NO：257、SEQ ID NO：259、SEQ ID NO：261、SEQ ID NO：263、 SEQ ID NO：265、SEQ ID NO：267、SEQ ID NO：269、SEQ ID NO：271、SEQ ID NO：273、SEQ ID NO：275、SEQ ID NO：277、SEQ ID NO：279、SEQ ID NO：281、SEQ ID NO：283、SEQ ID NO：285、SEQ ID NO：287、SEQ ID NO：289、SEQ ID NO：291、 SEQ ID NO：293、SEQ ID NO：295、SEQ ID NO：297、SEQ ID NO：299、SEQ ID NO：301、SEQ ID NO：303、SEQ ID NO：305、SEQ ID NO：307、SEQ ID NO：309、SEQ ID NO：311、SEQ ID NO：313、SEQ ID NO：315、SEQ ID NO：317、SEQ ID NO：319、 SEQ ID NO：321、SEQ ID NO：323、SEQ ID NO：325、SEQ ID NO：327、SEQ ID NO：329、SEQ ID NO：331、SEQ ID NO：333、SEQ ID NO：335、SEQ ID NO：337、SEQ ID NO：339、SEQ ID NO：341、SEQ ID NO：343、SEQ ID NO：345、SEQ ID NO：347、 SEQ ID NO：349、SEQ ID NO：351、SEQ ID NO：353、SEQ ID NO：355、SEQ ID NO：357、SEQ ID NO：359、SEQ ID NO：361、SEQ ID NO：363、SEQ ID NO：365、SEQ ID NO：367、SEQ ID NO：369、SEQ ID NO：370、SEQ ID NO：372、SEQ ID NO：373、 SEQ ID NO：375、SEQ ID NO：376、SEQ ID NO：378、SEQ ID NO：379、SEQ ID NO：381、SEQ ID NO：382、SEQ ID NO：384、SEQ ID NO：385、SEQ ID NO：387、SEQ ID NO：388、SEQ ID NO：390、SEQ ID NO：391、SEQ ID NO：393、SEQ ID NO：394、 SEQ ID NO：396、SEQ ID NO：397、SEQ ID NO：399、SEQ ID NO：400、SEQ ID NO：402、SEQ ID NO：403、SEQ ID NO：405、SEQ ID NO：406、SEQ ID NO：408、SEQ ID NO：409、SEQ ID NO：411、SEQ ID NO：412、SEQ ID NO：414、SEQ ID NO：415、 SEQ ID NO：417、SEQ ID NO：418、SEQ ID NO：420、SEQ ID NO：421、SEQ ID NO：423、SEQ ID NO：425、SEQ ID NO：427、SEQ ID NO：429、SEQ ID NO：431、SEQ ID NO：433、SEQ ID NO：435、SEQ ID NO：437、SEQ ID NO：439、SEQ ID NO：441、 SEQ ID NO：443、SEQ ID NO：445、SEQ ID NO：447、SEQ ID NO：449、SEQ ID NO：451、SEQ ID NO：453、SEQ ID NO：455、SEQ ID NO：457、SEQ ID NO：459、SEQ ID NO：461、SEQ ID NO：463、SEQ ID NO：465、SEQ ID NO：467、SEQ ID NO：469和 /或SEQ ID NO：471、SEQ ID NO：480、SEQ ID NO：481、SEQ ID NO：482、SEQ ID NO：483、SEQ ID NO：484、SEQ ID NO：485、SEQ ID NO：486、SEQ ID NO：487、SEQ ID NO：488、SEQ ID NO：489和SEQ ID NO：700之间所有的奇数SEQ ID NO：、SEQ ID NO：707、SEQ ID NO：708、SEQ ID NO：709、SEQ ID NO：710、SEQ ID NO：711、 SEQ ID NO：712、SEQ ID NO：713、SEQ ID NO：714、SEQ ID NO：715、SEQ ID NO：716、SEQ ID NO：717、SEQ ID NO：718和/或SEQ ID NO：720；其包括cDNA 编码序列和基因组(例如“gDNA”)序列，并且也包括表1至4的序列(所有这些序列是“本发明示例性核酸”)以及如下实施例(并且这些序列也在序列表中描述)；所有这些核酸序列和它们编码的多肽包括“本发明的序列”。
【0021】在可选的方面，本发明的这些核酸编码至少一个具有木质纤维素分解活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽。在可选的实施方式中，本发明的核酸可编码能够产生可特异性结合本发明示例性多肽(如下所列)的抗体(或其任何结合片段)的多肽，或者，这些核酸可用作鉴别或分离编码木质纤维素水解酶的核酸的探针，或用于抑制表达木质纤维素水解酶的核酸的表达(所有这些方面都称为“本发明的核酸”)。一方面，所述序列同一性通过运用了序列比较算法的分析或通过视觉观察来确定。
【0022】本发明的核酸也包括，编码本发明的示例性多肽(或肽)的分离的、合成的或重组的核酸，本发明的示例性多肽(或肽)包括具有如下所示序列(或其子序列或酶促活性片段)的本发明的多肽(例如酶)：SEQ ID NO：2、SEQ ID NO：4、 SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、 SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、 SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、 SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、SEQ ID NO：170、SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、SEQ ID NO：188、 SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、 SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、SEQ ID NO：224、SEQ ID NO：226、SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、SEQ ID NO：242、SEQ ID NO：244、 SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、SEQ ID NO：256、SEQ ID NO：258、SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、 SEQ ID NO：274、SEQ ID NO：276、SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、 SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、SEQ ID NO：312、SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、 SEQ ID NO：330、SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、 SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419、SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、 SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、SEQ ID NO：440、SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、SEQ ID NO：458、 SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、SEQ ID NO：474、 SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、所有SEQ ID NO：490和SEQ ID NO：700之间的偶数SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721，其包括表1至4所述序列以及序列表所述序列(所有这些序列都是“本发明的示例性酶/多肽(或核酸)”)及其酶促活性子序列(片段)和/或其免疫活性子序列(例如表位或免疫原)(所有“本发明的肽”)及其变体 (所有这些序列包括本发明的多肽和肽序列)。
【0023】在一个实施方式中，本发明的多肽具有木质纤维素活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性。
【0024】一方面，本发明提供了编码木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)、阿拉伯呋喃糖苷酶的核酸，其具有共同的新颖性，原因在于它们来源于混合培养物。本发明提供了从混合培养物分离的编码纤维素或寡糖水解(降解)酶的核酸，其包括本发明的多核苷酸，例如在至少约50、75、 100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850、900、950、1000、1050、1100、1150或更多残基的区域内，或在编码序列(例如cDNA)或基因组序列(例如包括外显子和内含子)的全长内，与本发明的示例性核酸具有至少约10％、15％、20％、25％、30％、35％、40％、45％、50％、 51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、 64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、 77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、 90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％) 序列同一性的序列，本发明的示例性核酸例如：SEQ ID NO：1、SEQ ID NO：3、等等、直至SEQ ID NO：471、SEQ ID NO：480、SEQ ID NO：481、SEQ ID NO：482、 SEQ ID NO：483、SEQ ID NO：484、SEQ ID NO：485、SEQ ID NO：486、SEQ ID NO：487、SEQ ID NO：488、所有SEQ ID NO：489和SEQ ID NO：700之间的奇数SEQ ID NO、SEQ ID NO：707、SEQ ID NO：708、SEQ ID NO：709、SEQ ID NO：710、SEQ ID NO：711、SEQ ID NO：712、SEQ ID NO：713、SEQ ID NO：714、SEQ ID NO：715、 SEQ ID NO：716、SEQ ID NO：717、SEQ ID NO：718和/或SEQ ID NO：720(参见表 1至3和序列表)。
【0025】一方面，本发明提供了编码木质纤维素酶的核酸，例如编码纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶的核酸，和/或编码葡萄糖氧化酶的核酸，包括本发明的示例性多核苷酸序列，也参见下面的表1至4，和序列表，以及由它们编码的多肽，包括本发明的酶，例如本发明的示例性多肽，如SEQ ID NO：2、SEQ ID NO：4、等等、直至SEQID NO：472、SEQ ID NO：473、SEQ ID NO：474、 SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、所有SEQ ID NO：490和SEQ ID NO：700之间的偶数SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721(参见序列表并且还参见表1至4)，其具有共同的新颖性，原因在于它们来源于共同的来源，例如环境来源。如下表2和3说明了某些本发明的示例性酶的最初来源。
【0026】一方面，本发明也提供了编码木质纤维素酶的核酸，例如编码糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶的核酸；和/或编码葡萄糖氧化酶的核酸，其具有共同的新颖性，原因在于它们来源于环境来源，例如混合的环境来源。
【0027】一方面，序列比较算法是βLAST 2.2.2版本算法，其中过滤设置 (filtering setting)被设置为blastall-p blastp-d“nr pataa”-F F，所有其它选项被设置为缺省。
【0028】本发明的另一方面是分离的、合成的或重组的核酸，包括本发明的核酸序列的至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、 300、350、400、450、500、550、600、650、700、750、800、850、900、950、 1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、 1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、 2250、2300、2350、2400、2450、2500或更多个连续碱基、与其基本相同的序列、以及与其互补的序列。
【0029】一方面，本发明分离的、合成的或重组的核酸编码具有木质纤维素酶活性的多肽，例如具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性；和/或葡萄糖氧化酶活性的多肽，其是热稳定的。该多肽在包括如下温度范围的条件下可以保持木质纤维素酶活性：约37℃到约95℃之间；约55℃ 到约85℃之间；约70℃到约95℃之间；或约90℃到约95℃之间。该多肽在如下范围内的温度中可以保持木质纤维素酶活性：在约1℃到约5℃之间，约5℃到约 15℃之间，约15℃到约25℃之间，约25℃到约37℃之间，约37℃到约95℃、96℃、 97℃、98℃或99℃之间，约55℃到约85℃之间，约70℃到约75℃之间，或约90℃ 到约99℃，或95℃、96℃、97℃、98℃或99℃，或更高温度。
【0030】另一方面，所述分离的、合成的或重组的核酸编码具有木质纤维素酶活性的多肽，例如具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽；和/或具有葡萄糖氧化酶活性的多肽，其可水解(降解) 可溶性纤维寡糖和阿糖基木聚糖寡聚体成单体木糖、阿拉伯糖和葡萄糖，所述多肽是耐热的。该多肽在暴露于如下范围内的温度后可以保持木质纤维素活性或葡萄糖氧化酶活性活性：37℃以上到约95℃，或55℃以上到约85℃的范围之内的任何温度。该多肽在暴露于如下范围内的温度后可以保持木质纤维素酶活性：在约 1℃到约5℃之间，约5℃到约15℃之间，约15℃到约25℃之间，约25℃到约37℃ 之间，约37℃到约95℃、96℃、97℃、98℃或99℃之间，约55℃到约85℃之间，约70℃到约75℃之间，或约90℃到约95℃之间，或更高温度。一方面，该多肽在暴露于如下范围内的温度后保持木质纤维素酶活性：90℃以上到约99℃，或 95℃、96℃、97℃、98℃或99℃，在约pH 4.5或更高。
【0031】本发明提供了分离的、合成的或重组的核酸，包括在严格条件下与本发明的核酸杂交的序列，所述本发明的核酸包括本发明的示例性核酸序列，例如如下所示的序列：SEQ ID NO：1、SEQ ID NO：3等等直至SEQ ID NO：471、SEQ ID NO：480、SEQ ID NO：481、SEQ ID NO：482、SEQ ID NO：483、SEQ ID NO：484、SEQ ID NO：485、SEQ ID NO：486、SEQ ID NO：487、SEQ ID NO：488、所有SEQ ID NO：489 和SEQ ID NO：700之间的奇数SEQ ID NO：、SEQ ID NO：707、SEQ ID NO：708、 SEQ ID NO：709、SEQ ID NO：710、SEQ ID NO：711、SEQ ID NO：712、SEQ ID NO：713、SEQ ID NO：714、SEQ ID NO：715、SEQ ID NO：716、SEQ ID NO：717、SEQ ID NO：718和/或SEQ ID NO：720(参见表1至3以及序列表)或其片段或其子序列。一方面，该核酸编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽，或可水解(降解)可溶性纤维寡糖和阿糖基木聚糖寡聚体为单体木糖、阿拉伯糖和葡萄糖。该核酸的长度可以是至少约 10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、 400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、 1100、1150、1200或更多残基，或者基因或转录物(例如cDNA)的全长。一方面，严格条件包括洗涤步骤，包括在0.2×SSC中在约65℃的温度洗涤约15分钟。
【0032】本发明提供了核酸探针，其用于鉴定或分离编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽，或可水解(降解)可溶性纤维寡糖和阿糖基木聚糖寡聚体为单体木糖、阿拉伯糖和葡萄糖的多肽的核酸，其中所述探针包含这样的序列的至少约10、15、20、25、30、 35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、 300、350、400、450、500、550、600、650、700、750、800、850、900、950、 1000或更多个连续碱基，所述序列包括本发明的序列或其片段或其子序列，其中所述探针通过结合或杂交来鉴定核酸。该探针可以包括寡核苷酸，该寡核苷酸含有序列的至少约10到50、约20到60、约30到70、约40到80或约60到100个连续碱基，所述序列包括本发明的序列或其片段或子序列。
【0033】本发明提供了核酸探针，其用于鉴定或分离编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽，或可水解(降解)可溶性纤维寡糖和阿糖基木聚糖寡聚体为单体木糖、阿拉伯糖和葡萄糖的多肽的核酸，其中所述探针包括含有本发明核酸的至少约10、15、20、30、 40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、 600、650、700、750、800、850、900、950、1000或更多残基的序列的核酸，所述本发明核酸例如与本发明的示例性核酸具有至少约50％、51％、52％、53％、54％、 55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、 68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、 81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、 94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的多核苷酸。一方面，序列同一性通过运用序列比较算法的分析或通过视觉观察来确定。在可选的方面中，该探针可以包括寡核苷酸，该寡核苷酸含有本发明的核酸序列或其子序列的至少约10到50、约20到60、约30到70、约40到80或约60到 100个连续碱基。
【0034】本发明提供了扩增引物序列对，其用于扩增(例如，通过PCR)编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性或可水解(降解)可溶性纤维寡糖和阿糖基木聚糖寡聚体为单体木糖、阿拉伯糖和葡萄糖的多肽的核酸，其中该引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个或每一个成员可以包括寡核苷酸，该寡核苷酸包括该序列的至少约10到50个或更多个连续碱基，或者包括该序列的约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36或更多个连续碱基。本发明提供了扩增引物对，其中所述引物对包括第一成员和第二成员，第一成员具有本发明核酸的约前(5’)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36或更多个残基所示的序列，第二成员具有第一成员的互补链的约前(5’)12、13、14、15、16、17、18、19、20、21、 22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个残基所示的序列。
【0035】本发明提供了通过扩增产生的编码纤维素酶，例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)、阿拉伯呋喃糖苷酶的核酸，所述扩增例如聚合酶链反应(PCR)，其中使用本发明的扩增引物对。本发明提供了通过扩增产生的编码纤维素酶，例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β- 木糖苷酶)、阿拉伯呋喃糖苷酶的核酸，所述扩增例如聚合酶链反应(PCR)，其中使用本发明的扩增引物对。本发明提供了使用本发明的扩增引物对，通过扩增制备编码具有木质纤维素活性的酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)、阿拉伯呋喃糖苷酶的核酸的方法，所述扩增例如聚合酶链反应(PCR)。一方面，所述扩增引物对从文库例如基因文库诸如环境文库扩增核酸。
【0036】本发明提供了扩增核酸的方法，所述核酸编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β- 葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)、阿拉伯呋喃糖苷酶活性的多肽或可水解(降解)可溶性纤维寡糖和阿糖基木聚糖寡聚体为单体木糖、阿拉伯糖和葡萄糖的多肽，所述方法包括用能扩增本发明的核酸序列或其片段或子序列的扩增引物序列对扩增模板核酸。
【0037】本发明提供了包含本发明的核酸或其子序列的表达盒。一方面，表达盒可以包含可操作地连接到启动子上的核酸。启动子可以是病毒、细菌、哺乳动物或植物启动子。一方面，植物启动子可以是马铃薯、稻、玉米、小麦、烟草或大麦启动于。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面，启动子可以是诱导型启动子。一方面，启动子可以是组织特异性启动子或环境调节型或发育调节型启动子。因此，启动子可以是，例如种子特异性、叶特异性、根特异性、茎特异性或脱落诱导启动子。一方面，使用诱导型启动子、环境调节型或发育调节型启动子、组织特异性启动子和类似启动子表达本发明的编码内源或异源信号序列(参见下文讨论)的核酸。在可选的方面，所述启动子包括种子优选的启动子，例如玉米γ醇溶蛋白启动子或玉米ADP-gpp启动子。一方面，所述信号序列将本发明的编码蛋白靶向至液泡、内质网、叶绿体或淀粉颗粒。
【0038】一方面，表达盒可以进一步包括植物或植物病毒表达载体。本发明提供了克隆载体，包括本发明的表达盒(例如载体)或本发明的核酸。克隆载体可以是病毒载体、质粒、噬菌体(phage)、噬粒、黏粒(cosmid)、-F黏粒(fosmid)、细菌噬菌体(bacteriophage)或人工染色体。病毒载体可以包括腺病毒载体、逆转录病毒载体或腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体 (MAC)。
【0039】本发明提供了包含本发明的核酸或本发明的表达盒(例如载体、质粒等等)或本发明的克隆载体(例如人工染色体)的转化细胞。一方面，转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。一方面，植物细胞可以是大豆、油菜籽、含油种子、番茄、甘蔗(cane sugar)、谷类、马铃薯、小麦、稻、玉米、烟草或大麦细胞；植物细胞也可以是单子叶植物或双子叶植物或单子叶玉米、甘蔗、稻、小麦、大麦、印度草、柳枝稷或芒；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0040】本发明提供了包含本发明核酸或本发明表达盒(例如载体)的转基因非人动物。一方面，该动物是小鼠、牛、大鼠、猪、山羊或绵羊。
【0041】本发明提供了包含本发明核酸或本发明表达盒(例如载体)的转基因植物。转基因植物可以是谷类植物、玉米植物、马铃薯植物、番茄植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。转基因植物可以是单子叶植物或双子叶植物或单子叶玉米、甘蔗、水稻、小麦、大麦、印度草、柳枝稷或芒；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0042】本发明提供了包含本发明核酸或本发明表达盒(例如载体)的转基因种子。转基因种子可以是谷类植物、玉米种子、小麦仁、含油种子、油菜籽、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生或烟草植物种子。转基因种子可以源自单子叶植物或双子叶植物或单子叶玉米、甘蔗、水稻、小麦、大麦、印度草、柳枝稷或芒；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0043】本发明提供了包含与本发明的核酸互补的核酸序列或能与本发明的核酸在严格条件下杂交的核酸序列的反义寡核苷酸。本发明提供了抑制木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶、β- 葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶信息在细胞中翻译的方法，该方法包括给细胞施用反义寡核苷酸或在细胞中表达反义寡核苷酸，所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严格条件下杂交的核酸序列。一方面，所述反义寡核苷酸的长度在约10到50、约20到60、约30到70、约40到80或约60到100个碱基之间，例如长度为10、15、20、25、30、35、40、45、50、55、60、65、70、75、 80、85、90、95、100或更多个碱基。本发明提供了抑制木质纤维素酶信息在细胞中翻译的方法，该方法包括给细胞施用反义寡核苷酸或在细胞中表达反义寡核苷酸，所述反义寡核苷酸包括与本发明的核酸互补的核酸序列或能与本发明的核酸在严格条件下杂交的核酸序列。
【0044】本发明提供了含有本发明的序列的子序列的双链抑制RNA(RNAi 或RNA干扰)分子(包括小干扰性RNA，或siRNA，用于抑制转录，以及微RNA 或miRNA，用于抑制翻译)。一方面，siRNA的长度为约21至24个残基之间，或约至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、90、95、100 或更多个双链核苷酸。本发明提供了抑制木质纤维素酶——例如具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性，例如，可水解(降解)可溶性纤维寡糖和阿糖基木聚糖寡聚体成单体木糖、阿拉伯糖和葡萄糖—— 在细胞中表达的方法，所述方法包括向所述细胞施用双链抑制RNA(siRNA或 miRNA)或在所述细胞中表达双链抑制RNA(siRNA或miRNA)，其中所述RNA 含有本发明的序列的子序列。
【0045】本发明提供了分离的、合成的或重组的多肽，包括在至少约10、15、 20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、 150、175、200、225、250、275、300、325、350或更多个残基的区域内或者在多肽的全长区域内，与本发明的示例性多肽或肽具有至少约50％、51％、52％、53％、 54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、 67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、 80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、 93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性的氨基酸序列。一方面，序列同一性通过运用序列比较算法的分析或通过视觉观察来确定。本发明的示例性多肽或肽序列包括SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、 SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、 SEQ ID NO：143、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、SEQ ID NO：170、 SEQ ID NO：172、SEQ ID NO：174、SEQ ID NO：176、SEQ ID NO：178、SEQ ID NO：180、SEQ ID NO：182、SEQ ID NO：184、SEQ ID NO：186、SEQ ID NO：188、SEQ ID NO：190、SEQ ID NO：192、SEQ ID NO：194、SEQ ID NO：196、SEQ ID NO：198、 SEQ ID NO：200、SEQ ID NO：202、SEQ ID NO：204、SEQ ID NO：206、SEQ ID NO：209、SEQ ID NO：210、SEQ ID NO：212、SEQ ID NO：214、SEQ ID NO：216、SEQ ID NO：218、SEQ ID NO：220、SEQ ID NO：222、SEQ ID NO：224、SEQ ID NO：226、 SEQ ID NO：228、SEQ ID NO：230、SEQ ID NO：232、SEQ ID NO：234、SEQ ID NO：236、SEQ ID NO：238、SEQ ID NO：240、SEQ ID NO：242、SEQ ID NO：244、SEQ ID NO：246、SEQ ID NO：248、SEQ ID NO：250、SEQ ID NO：252、SEQ ID NO：254、 SEQ ID NO：256、SEQ ID NO：258、SEQ ID NO：260、SEQ ID NO：262、SEQ ID NO：264、SEQ ID NO：266、SEQ ID NO：268、SEQ ID NO：270、SEQ ID NO：272、SEQ ID NO：274、SEQ ID NO：276、SEQ ID NO：278、SEQ ID NO：280、SEQ ID NO：282、 SEQ ID NO：284、SEQ ID NO：286、SEQ ID NO：288、SEQ ID NO：290、SEQ ID NO：292、SEQ ID NO：294、SEQ ID NO：296、SEQ ID NO：298、SEQ ID NO：300、SEQ ID NO：302、SEQ ID NO：304、SEQ ID NO：306、SEQ ID NO：308、SEQ ID NO：310、 SEQ ID NO：312、SEQ ID NO：314、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320、SEQ ID NO：322、SEQ ID NO：324、SEQ ID NO：326、SEQ ID NO：328、SEQ ID NO：330、SEQ ID NO：332、SEQ ID NO：334、SEQ ID NO：336、SEQ ID NO：338、 SEQ ID NO：340、SEQ ID NO：342、SEQ ID NO：344、SEQ ID NO：346、SEQ ID NO：348、SEQ ID NO：350、SEQ ID NO：352、SEQ ID NO：354、SEQ ID NO：356、SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：362、SEQ ID NO：364、SEQ ID NO：366、 SEQ ID NO：368、SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、 SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419、SEQ ID NO：422、SEQ ID NO：424、SEQ ID NO：426、SEQ ID NO：428、SEQ ID NO：430、SEQ ID NO：432、SEQ ID NO：434、SEQ ID NO：436、SEQ ID NO：438、SEQ ID NO：440、 SEQ ID NO：442、SEQ ID NO：444、SEQ ID NO：446、SEQ ID NO：448、SEQ ID NO：450、SEQ ID NO：452、SEQ ID NO：454、SEQ ID NO：456、SEQ ID NO：458、SEQ ID NO：460、SEQ ID NO：462、SEQ ID NO：464、SEQ ID NO：466、SEQ ID NO：468、 SEQ ID NO：470和/或SEQ ID NO：472、SEQ ID NO：473、SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、SEQ ID NO：490至SEQ ID NO：700之间的所有偶数SEQ ID NO：、SEQ ID NO：719和/ 或SEQ ID NO：721，包括表1至4以及序列表所述的所有序列(所有这些序列是“本发明的示例性酶/多肽”)及其(例如“本发明的肽”)子序列(包括“酶促活性片段”) 及其变体(所有这些序列包括本发明的多肽和肽序列)。
【0046】示例性多肽还包括长度为至少约10、15、20、25、30、35、40、45、 50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、 600或更多个残基的片段，或者长度为酶的全长的片段。本发明的多肽或肽序列包括由本发明的核酸编码的序列。本发明的多肽或肽序列包括被本发明的抗体特异性结合的多肽或肽(例如，表位)，或可产生本发明的抗体的多肽或肽(例如，免疫原)。
【0047】一方面，本发明的多肽具有至少一种木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性。在可选的方面，本发明的多核苷酸编码具有至少一种木质纤维素酶活性的多肽。
【0048】一方面，木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性，是热稳定的。多肽在包括如下温度范围的条件下可以保持木质纤维素酶：约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约 55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃ 至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃ 至约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、 104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、 115℃或更高温度。在一些实施方式中，根据本发明的热稳定多肽在上述范围的温度中，在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约 pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、约pH 11.0、约pH 11.5、约pH 12.0或更高pH下保持木质纤维素酶活性。
【0049】在另一方面，木质纤维素酶活性可以是耐热的。该多肽在暴露于如下范围内的温度后可以保持木质纤维素酶活性：约-100℃至约-80℃、约-80℃至约 -40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约 55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃ 至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃ 至约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、 104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、 115℃或更高温度。在一些实施方式中，根据本发明的耐热多肽在暴露至上述范围的温度后，在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 9.0、约 pH 9.5、约pH 10.0、约pH 10.5、约pH 11.0、约pH 11.5、约pH 12.0或更高pH 下保持木质纤维素酶活性。
【0050】本发明的另一方面提供了分离的、合成的或重组的多肽或肽，包括本发明的多肽或肽序列、与其基本上相同的序列、与其互补的序列的至少10、15、 20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、 150或更多个连续碱基。该肽可以是例如免疫原性片段、基序(例如结合位点)、信号序列、前原序列(prepro sequence)或活性位点。
【0051】本发明提供了分离的、合成的或重组的核酸，包括编码具有木质纤维素活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、甘露聚糖酶、木聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽的序列和信号序列，其中所述核酸包括本发明的序列。信号序列可以来源于另一种木质纤维素酶，和/或葡萄糖氧化酶或非纤维素酶，例如非内切葡聚糖酶、非纤维二糖水解酶、非β-葡糖苷酶(非β-葡糖苷酶)、非木聚糖酶、非甘露聚糖酶、非β-木糖苷酶、非阿拉伯呋喃糖苷酶和/或非葡萄糖氧化酶(即异源酶)。本发明提供了分离的、合成的或重组的核酸，包括编码具有木质纤维素活性和/或葡萄糖氧化酶酶活性的多肽的序列，其中所述序列不含有信号序列，所述核酸包括本发明的序列。一方面，本发明提供了分离的、合成的或重组的多肽，包括本发明的多肽，其缺少信号序列的全部或部分。一方面，所述分离的、合成的或重组的多肽可以包括本发明的多肽，其含有异源信号序列，例如异源木质纤维素酶信号序列，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶信号序列；和/或葡萄糖氧化酶信号序列或非纤维素酶信号序列，例如非内切葡聚糖酶、非纤维二糖水解酶、非β-葡糖苷酶(非β-葡糖苷酶)、非木聚糖酶、非甘露聚糖酶、非β-木糖苷酶、非阿拉伯呋喃糖苷酶信号序列。
【0052】一方面，本发明提供了嵌合(例如多结构域重组)蛋白，其包括第一结构域和至少第二结构域，第一结构域含有本发明的信号序列和/或糖(碳水化合物) 结合结构域(carbohydrate binding domain，CBM)。该蛋白可以是融合蛋白。第二结构域可以包括酶。蛋白可以是非酶(nonenzyme)，例如嵌合蛋白可以包括本发明的信号序列和/或CBM以及结构蛋白。
【0053】本发明提供嵌合多肽，包括(i)包括(或由其组成)本发明的糖结合结构域(CBM)、信号肽(SP)、前原序列和/或催化结构域(CD)的至少第一结构域；以及(ii)含有异源多肽或肽的至少第二结构域，其中所述异源多肽或肽不与所述CBM、信号肽(SP)、前原序列和/或催化结构域(CD)天然相关。一方面，所述异源多肽或肽不是木质纤维素酶，例如不是糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、木糖苷酶(例如β-木糖苷酶)和/或阿拉伯呋喃糖苷酶。所述异源多肽或肽可以在所述CBM、信号肽(SP)、前原序列和/或催化结构域(CD)的氨基端、羧基端或两端。
【0054】本发明提供了编码嵌合多肽的分离的、合成的或重组的核酸，其中所述嵌合多肽包括含有本发明的CBM、信号肽(SP)、前原结构域和/或催化结构域 (CD)的或由它们组成的至少第一结构域；以及含有异源多肽或肽的至少第二结构域，其中所述异源多肽或肽不与所述CBM、信号肽(SP)、前原结构域和/或催化结构域(CD)天然相关。
【0055】本发明提供了分离的、合成的或重组的信号序列(例如，信号肽)，其由本发明的多肽的残基1至14、1至15、1至16、1至17、1至18、1至19、1 至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1 至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1 至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47 的序列(如在其中所述的序列)组成或包括本发明的多肽的残基1至14、1至15、 1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、 1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、 1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、 1至44、1至45、1至46或1至47的序列(如在其中所述的序列)，本发明的多肽例如本发明的示例性多肽，例如SEQ ID NO：2、SEQ ID NO：4等等至SEQ ID NO：472、SEQ ID NO：473、SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：4/6、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、SEQ ID NO：490和SEQ ID NO：700 之间所有偶数SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721(参见表1至4 以及序列表)。一方面，本发明提供了信号序列，其包括本发明的多肽的前14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、 52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、 70或更多个氨基端残基。
【0056】一方面，木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，包括在约37℃每毫克蛋白约1到约1200单位，或每毫克蛋白约100到约1000单位的范围内的比活性。另一方面，木质纤维素酶活性包括每毫克蛋白从约100到约1000单位，或从约500到约750单位的比活性。可选地，木质纤维素酶活性包括在37℃每毫克蛋白从约1到约750单位，或每毫克蛋白约500到约1200单位的范围内的比活性。一方面，木质纤维素酶活性包括在37℃每毫克蛋白从约1到约500单位，或每毫克蛋白约750到约1000单位的范围内的比活性。另一方面，木质纤维素酶活性包括在37℃每毫克蛋白从约1到约 250单位的范围内的比活性。可选地，木质纤维素酶活性包括在37℃每毫克蛋白从约1到约100单位的范围内的比活性。
【0057】另一方面，耐热性包括在被加热到高温后，保持在37℃时木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β- 葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的比活性的至少一半。可选地，耐热性可以包括在被加热到高温后，保持在37℃每毫克蛋白从约1到约1200单位，或每毫克蛋白约500到约1000单位的范围内的比活性。另一方面，耐热性可以包括在被加热到高温后，保持在37℃每毫克蛋白从约1到约500单位的范围内的比活性。
【0058】本发明提供了本发明的分离的、合成的或重组的多肽，其中所述多肽包括至少一个糖基化位点。一方面，糖基化可以是N-连接糖基化。一方面，多肽可以在巴斯德毕赤酵母(P.pastoris)或粟酒裂殖酵母(S.pombe)中被表达后被糖基化。
【0059】一方面，多肽可以在包括约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或 pH 4的更酸性pH的条件下保持木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性。另一方面，多肽可以在包括约pH 7、pH 7.5、 pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11或更碱性pH的条件下保持木质纤维素酶活性。一方面，多肽可以在暴露于包括约pH 6.5、pH 6、pH 5.5、 pH 5、pH 4.5或pH 4或更酸性pH的条件下保持木质纤维素酶活性。另一方面，多肽可以在暴露于包括约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、 pH 10.5或pH 11或更碱性pH的条件下保持木质纤维素酶活性。
【0060】一方面，本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶，在碱性条件下，例如在肠道如小肠的碱性条件下，具有活性。一方面，多肽在暴露于胃的酸性pH后保持活性。
【0061】本发明提供了含有本发明的多肽(包括肽)的蛋白制剂，其中该蛋白制剂包括液体、固体或凝胶。本发明提供了包含本发明的多肽和第二蛋白或结构域的异二聚体。该异二聚体的第二成员可以是不同的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，不同的酶或另一种蛋白。一方面，第二结构域可以是多肽，异源二聚体可以是融合蛋白。一方面，第二结构域可以是表位(epitope)或标记物(tag)。一方面，本发明提供了包含本发明的多肽的同型二聚体。
【0062】本发明提供了具有木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性的固定化多肽(包括肽)，其中所述固定化多肽包括本发明的多肽、由本发明的核酸编码的多肽、或含有本发明的多肽和第二结构域的多肽。一方面，多肽可以被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、平板、阵列或毛细管上。
【0063】本发明还提供了包含本发明的固定化核酸的阵列，包括例如本发明的探针。本发明还提供了包含本发明的抗体的阵列。
【0064】本发明提供了分离的、合成的或重组的抗体，其与本发明的多肽或与由本发明的核酸编码的多肽特异性结合。本发明的这些抗体可以是单克隆或多克隆抗体。本发明提供了包含本发明的抗体的杂交瘤，所述抗体例如，与本发明的多肽或与由本发明的核酸编码的多肽特异性结合的抗体。本发明提供了编码这些抗体的核酸。
【0065】本发明提供了分离或鉴定具有木质纤维素酶如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽的方法，该方法包括如下步骤：(a)提供本发明的抗体；(b)提供包含多肽的样品；和(c)将步骤(b)的样品与步骤(a)的抗体在所述抗体能与所述多肽特异性结合的条件下接触，从而分离或鉴定具有木质纤维素酶活性的多肽。
【0066】本发明提供了制备抗葡萄糖氧化酶，抗纤维素酶，例如抗内切葡聚糖酶、抗纤维二糖水解酶、抗β-葡糖苷酶(β-葡糖苷酶)、抗木聚糖酶、抗甘露聚糖酶、抗β-木糖苷酶和/或抗阿拉伯呋喃糖苷酶抗体的方法，该方法包括以足以产生体液免疫应答的量向非人动物施用本发明的核酸或本发明的多肽或其子序列，由此制备抗葡萄糖氧化酶，或抗纤维素酶，例如抗内切葡聚糖酶、抗纤维二糖水解酶、抗β-葡糖苷酶(β-葡糖苷酶)、抗木聚糖酶、抗甘露聚糖酶、抗β-木糖苷酶和 /或抗阿拉伯呋喃糖苷酶抗体。本发明提供了产生抗葡萄糖氧化酶或抗纤维素酶，例如抗内切葡聚糖酶、抗纤维二糖水解酶、抗β-葡糖苷酶(β-葡糖苷酶)、抗木聚糖酶、抗甘露聚糖酶、抗β-木糖苷酶和/或抗阿拉伯呋喃糖苷酶免疫应答(细胞应答或体液应答)的方法，该方法包括以足以产生免疫应答(细胞应答或体液应答) 的量向非人动物施用本发明的核酸或本发明的多肽或其子序列。
【0067】本发明提供了产生重组多肽的方法，包括如下步骤：(a)提供与启动子可操作地连接的本发明的核酸；和(b)在允许多肽表达的条件下表达步骤(a) 的核酸，从而产生重组多肽。一方面，该方法可进一步包括用步骤(a)的核酸转化宿主细胞，随后表达步骤(a)的核酸，从而在转化细胞中产生重组多肽。
【0068】本发明提供了用于鉴定具有木质纤维素酶如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽的方法，该方法包括如下步骤：(a)提供本发明的多肽；或由本发明的核酸编码的多肽；(b)提供木质纤维素酶底物；和(c)将步骤(a)的多肽或其片段或变体与步骤(b)的底物接触，并且检测底物量的降低或反应产物量的增加，其中底物量的降低或反应产物量的增加鉴定出具有木质纤维素酶活性的多肽。一方面，底物可以是含纤维素或含多糖 (例如含可溶性纤维寡糖和/或阿糖基木聚糖寡聚体)的化合物。
【0069】本发明提供了用于鉴定木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶底物的方法，包括如下步骤：(a)提供本发明的多肽；或由本发明的核酸编码的多肽；(b)提供测试底物；和(c)将步骤 (a)的多肽与步骤(b)的测试底物接触，并且检测底物量的降低或反应产物量的增加，其中底物量的降低或反应产物量的增加将测试底物鉴定为木质纤维素酶底物。
【0070】本发明提供了确定测试化合物是否与多肽特异性结合的方法，包括如下步骤：(a)在允许核酸翻译为多肽的条件下表达核酸或包含核酸的载体，其中所述核酸包括本发明的核酸，或提供本发明的多肽；(b)提供测试化合物；(c)将多肽与测试化合物接触；和(d)确定步骤(b)的测试化合物是否与多肽特异性结合。
【0071】本发明提供了用于鉴定木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的调节剂的方法，包括如下步骤：(a) 提供本发明的多肽，或由本发明的核酸编码的多肽；(b)提供测试化合物；和(c) 将步骤(a)的多肽与步骤(b)的测试化合物接触，并测定木质纤维素酶活性，其中在存在测试化合物的情况下测定的木质纤维素酶活性与不存在测试化合物的情况下测定的活性相比的变化，确定了该测试化合物调节木质纤维素酶活性。一方面，木质纤维素酶活性，可以通过提供木质纤维素酶底物，并检测底物量的降低或反应产物量的增加，或底物量的增加或反应产物量的降低来测量。与没有测试化合物时底物或反应产物的量相比，有测试化合物时底物量的降低或反应产物量的增加鉴定出作为木质纤维素酶活性的激活剂的测试化合物。与没有测试化合物时底物或反应产物量相比，有测试化合物时底物量的增加或反应产物量的降低鉴定出作为木质纤维素酶活性的抑制剂的测试化合物。
【0072】本发明提供了计算机系统，该系统包括处理器和数据存储设备，其中所述数据存储设备上已经存储了本发明的多肽序列或核酸序列(例如由本发明的核酸编码的多肽或肽)。一方面，计算机系统可以进一步包括序列比较算法和数据存储设备，其中数据存储设备上已经存储了至少一个参考序列。另一方面，序列比较算法包括可指出多态现象(多态性)的计算机程序。一方面，计算机系统可以进一步包括在所述序列中鉴定一个或多个特征的鉴定器(标识符，identifier)。本发明提供了计算机可读介质，其上已经存储了本发明的多肽序列或核酸序列。本发明提供了用于鉴定序列中的特征的方法，包括如下步骤：(a)使用可鉴定序列中的一个或多个特征的计算机程序读取序列，其中所述序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序鉴定序列中的一个或多个特征。本发明提供了将第一序列与第二序列进行比较的方法，包括如下步骤：(a)通过使用可比较序列的计算机程序读取第一序列和第二序列，其中第一序列包括本发明的多肽序列或核酸序列；和(b)用所述计算机程序确定第一序列和第二序列之间的差异。确定第一序列和第二序列之间差异的步骤可以进一步包括鉴定多态性的步骤。一方面，该方法可以进一步包括可鉴定序列中的一个或多个特征的鉴定器。另一方面，该方法可以包括使用计算机程序读取第一序列，并鉴定该序列中的一个或多个特征。
【0073】本发明提供了从样品例如从环境样品中分离或回收核酸的方法，所述核酸编码具有木质纤维素酶活性例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽，该方法包括如下步骤：(a)提供用于扩增编码具有木质纤维素酶活性的多肽的核酸的扩增引物序列对，其中所述引物对能扩增本发明的核酸；(b)从样品例如环境样品中分离核酸，或处理样品例如环境样品，以便样品中的核酸得以与扩增引物对杂交；和(c)将步骤(b)的核酸与步骤 (a)的扩增引物对结合，并从样品例如环境样品中扩增核酸，从而从样品例如环境样品中分离或回收编码具有木质纤维素酶活性的多肽的核酸。扩增引物序列对的一个或每一成员可以包括寡核苷酸，该寡核苷酸包括本发明的扩增引物序列对，例如，具有本发明的序列的至少约10到50个连续碱基。
【0074】本发明提供了从样品例如环境样品中分离或回收核酸的方法，所述核酸编码具有木质纤维素活性例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽，该方法包括如下步骤：(a)提供包含本发明的核酸或其子序列的多核苷酸探针；(b)从样品例如环境样品分离核酸，或处理样品例如环境样品，以便样品中的核酸可得以与步骤(a)的多核苷酸探针杂交；(c)步骤(b)的分离的核酸或处理的样品例如环境样品与将步骤(a)的多核苷酸探针结合；和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸，从而从样品例如环境样品中分离或回收编码具有木质纤维素酶活性的多肽的核酸。样品，例如环境样品可以包括水样品、液体样品、土壤样品、空气样品或生物样品。一方面，生物样品可以来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。
【0075】本发明提供了产生编码具有木质纤维素酶活性例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(beta-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽的核酸变体的方法，该方法包括如下步骤：(a)提供包括本发明的核酸的模板核酸；和(b)在模板序列中修饰、删除或添加一个或多个核苷酸，或进行修饰、删除和添加一个或多个核苷酸的组合，以产生模板核酸的变体。一方面，该方法可以进一步包括表达变体核酸，以产生变体木质纤维素酶多肽。修饰、添加或删除通过包括如下方法中的方法来引入，包括：易错PCR、改组(重排，shuffling)、寡核苷酸诱导的定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变(recursive ensemble mutagenesis)、指数整体诱变、位点特异性诱变、基因再装配、基因位点饱和诱变 (或GSSM)、合成连接重装配(SLR)、染色体饱和诱变(CSM)或其组合。另一方面，修饰、添加或删除通过包括如下方法中的方法引入：包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变(gapped duplex mutagenesis)、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。
【0076】一方面，该方法可以被迭代重复，直到产生与模板核酸编码的多肽相比具有改变的或不同的活性或者改变的或不同的稳定性的木质纤维素酶，如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。一方面，变体木质纤维素酶多肽是耐热的，在暴露于升高的温度之后保持一些活性。另一方面，与模板核酸编码的木质纤维素酶相比，变体木质纤维素酶多肽，具有增加的糖基化。可选地，变体多肽在高温下具有木质纤维素酶活性，其中由模板核酸编码的木质纤维素酶在高温下没有活性。一方面，该方法可以被迭代重复，直到产生具有与模板核酸的密码子使用有所不同的密码子使用的木质纤维素酶编码序列，如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶编码序列。另一方面，该方法可以被迭代重复，直到产生具有比模板核酸的信息表达或稳定性更高或更低水平的信息表达或稳定性的木质纤维素酶基因。
【0077】本发明提供了在编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供编码具有木质纤维素酶活性的多肽的本发明的核酸；和(b)鉴定步骤(a)的核酸中非优选或较不优选的密码子，用优选的或中度使用(neutrally used)的密码子来代替之，所述优选或中度使用的密码子编码与被代替的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现(over-represented)的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足(under-represented)的密码子，从而修饰核酸以增加其在宿主细胞中的表达。
【0078】本发明提供了在编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽的核酸中修饰密码子的方法，该方法包括如下步骤： (a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的密码子，并用不同的密码子来代替之，所述不同的密码子编码与被代替的密码子相同的氨基酸，从而修饰在编码木质纤维素酶的核酸中的密码子。
【0079】本发明提供了在编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性——的多肽的核酸中修饰密码子以增加其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供编码木质纤维素酶多肽的本发明核酸；和(b)鉴定步骤(a)的核酸中的非优选或较不优选密码子，并用优选的或中度使用的密码子来代替之，所述优选或中度使用的密码子编码与被代替的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以增加其在宿主细胞中的表达。
【0080】本发明提供了在编码具有木质纤维素酶活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽的核酸中修饰密码子以降低其在宿主细胞中的表达的方法，该方法包括如下步骤：(a)提供本发明的核酸；和(b)鉴定步骤(a)的核酸中的至少一个优选密码子，并用非优选的或较不优选的密码子来代替之，所述非优选或较不优选的密码子编码与被代替的密码子相同的氨基酸，其中优选密码子是在宿主细胞的基因的编码序列中过度表现的密码子，非优选或较不优选的密码子是在宿主细胞的基因的编码序列中表现不足的密码子，从而修饰核酸以降低其在宿主细胞中的表达。一方面，宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或喃乳动物细胞。
【0081】本发明提供了用于产生核酸文库的方法，所述核酸文库编码一系列的被修饰的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的活性位点或底物结合位点，其中被修饰的活性位点或底物结合位点来源于第一核酸，所述第一核酸包含编码第一活性位点或第一底物结合位点的序列，该方法包括如下步骤：(a)提供第一核酸，其编码第一活性位点或第一底物结合位点，其中所述第一核酸序列包括在严格条件下与本发明的核酸杂交的序列，所述核酸编码木质纤维素酶活性位点或木质纤维素酶底物结合位点；(b)提供一组诱变寡核苷酸，其在第一核酸的多个目标密码子处编码天然发生的氨基酸变体；和(c) 使用该组诱变寡核苷酸，产生一组编码活性位点或编码底物结合位点的变体核酸，其在被诱变的每一氨基酸密码子处编码一定范围的氨基酸变化，从而产生编码多个被修饰的木质纤维素酶活性位点或底物结合位点的核酸文库。一方面，该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸：优化的定向进化系统、基因位点饱和诱变TM(或GSSM)、合成连接重装配(SLR)、易错PCR、改组、寡核苷酸诱导的定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配及其组合。另一方面，该方法包括通过包括如下方法中的方法诱变步骤(a)的第一核酸或变体：重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。
【0082】本发明提供了产生小分子的方法，包括如下步骤：(a)提供多个能合成或修饰小分子的生物合成酶，其中这些酶中的一种酶包括由本发明的核酸编码的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶；(b) 为步骤(a)的至少一种酶提供底物；和(c)将步骤(b)的底物与这些酶在能促进多个生物催化反应的条件下通过一系列生物催化反应进行反应，以产生小分子。本发明提供了修饰小分子的方法，包括如下步骤：(a)提供木质纤维素酶，其中该酶包括本发明的多肽，或由本发明的核酸编码的多肽，或其子序列；(b)提供小分子；和(c)将步骤(a)的酶与步骤(b)的小分子在能促进由木质纤维素酶催化的酶促反应的条件下进行反应，从而通过木质纤维素酶的酶促反应修饰小分子。一方面，该方法可以包括为步骤(a)的酶提供多个小分子底物，从而产生通过由木质纤维素酶催化的至少一种酶促反应产生的被修饰小分子的文库。一方面，该方法可以包括多个其它的酶，在有助于这些酶介导的多个生物催化反应的条件下使用这些酶，以形成由多个酶促反应产生的被修饰小分子的文库。另一方面，该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应，方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子，并鉴定出产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。
【0083】本发明提供了确定本发明的酶的功能片段的方法，包括如下步骤：(a) 提供本发明的多肽或由本发明的核酸编码的多肽、或其子序列；和(b)从步骤(a) 的序列删除多个氨基酸残基，并测试剩余的子序列的木质纤维素酶活性，从而确定酶的功能片段。一方面，木质纤维素酶活性通过提供底物并检测底物量的减少或反应产物量的增加来测量。
【0084】本发明提供了通过使用实时代谢流(real-time metabolic flux)分析进行新的或修饰的表型的全细胞工程改造的方法，该方法包括如下步骤：(a)通过修饰细胞的遗传组成产生修饰的细胞，其中所述遗传组成通过将本发明的核酸加入到细胞来修饰；(b)培养修饰的细胞以产生多个修饰的细胞；(c)通过实时监控步骤(b)的细胞培养物来测量该细胞的至少一个代谢参数；和(d)分析步骤(c) 的数据，以确定被测量的参数是否与在类似条件下未修饰细胞中的参照测量值不同，从而使用实时代谢流量分析鉴定细胞中的工程化表型。一方面，细胞的遗传组成可以通过包括在细胞中序列的删除或序列的修饰，或敲除基因的表达的方法来修饰。一方面，该方法可以进一步包括选择含有新工程化表型的细胞。另一方面，该方法可以包括培养被选择的细胞，从而产生包含新工程化表型的新细胞株。
【0085】本发明提供了增加木质纤维素酶的耐热性或热稳定性的方法，该方法包括糖基化木质纤维素酶多肽，其中该多肽包括本发明的多肽或由本发明的核酸序列编码的多肽的至少三十个连续氨基酸，从而增加木质纤维素酶的多肽的耐热性或热稳定性。一方面，木质纤维素酶的比活性可以在大于约37℃到约95℃的温度范围内是热稳定的或耐热的。
【0086】本发明提供了在细胞中过量表达重组葡萄糖氧化酶和/或木质纤维素酶多肽的方法，该方法包括表达含有核酸的载体，该核酸包括本发明的核酸或本发明的核酸序列，其中序列同一性通过使用序列比较算法的分析或通过视觉观察来确定，其中过量表达通过使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。
【0087】本发明提供了产生转基因植物的方法，该方法包括如下步骤：(a)将异源核酸序列引入细胞中，其中异源核酸序列包括本发明的核酸序列，从而产生转化的植物细胞；和(b)从转化的细胞产生转基因植物。一方面，步骤(a)可以进一步包括通过植物细胞原生质体的电穿孔或显微注射引入异源核酸序列。另一方面，步骤(a)可以进一步包括通过DNA微粒轰击(DNA particle bombardment) 将异源核酸序列直接引入植物组织中。可选地，步骤(a)可以进一步包括使用根瘤农杆菌(Agrobacterium tumefaciens)宿主将异源核酸序列引入植物细胞DNA中。一方面，植物细胞可以是甘蔗、甜菜、大豆、番茄、马铃薯、玉米、稻、小麦、烟草或大麦细胞。细胞可以源自单子叶植物或双子叶植物或单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0088】本发明提供了在植物细胞中表达异源核酸序列的方法，该方法包括如下步骤：(a)用与启动子可操作地连接的的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的核酸；(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。本发明提供了在植物细胞中表达异源核酸序列的方法，该方法包括如下步骤：(a)用与启动子可操作地连接的异源核酸序列转化植物细胞，其中异源核酸序列包括本发明的序列；(b)在异源核酸序列可在植物细胞中表达的条件下培养所述植物。一方面，所述启动子是或包括：病毒、细菌、哺乳动物或植物启动子；或植物启动子；或马铃薯、水稻、玉米、小麦、烟草或大麦启动子；或组成型启动子或CaMV35S；或诱导型启动子；或组织特异性启动子或环境调节型或发育调节型启动子；或种子特异性、叶特异性、根特异性、茎特异性或脱落诱导启动子；或种子优选的启动子，玉米γ醇溶蛋白启动子或玉米ADP-gpp启动子。一方面，植物细胞源自单子叶植物或双子叶植物或单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒；或植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0089】本发明提供了用于水解、分解(breaking up)或破坏纤维寡糖、阿糖基木聚糖寡聚体或含有葡聚糖-或纤维素的组合物(组分)的方法，该方法包括如下步骤：(a)提供本发明的多肽；(b)提供包括纤维素或葡聚糖的组合物(组分)；以及(c)在其中纤维素酶水解、分解或破坏纤维寡糖、阿糖基木聚糖寡聚体或含有葡聚糖-或纤维素的组合物的条件下，将步骤(a)的多肽与步骤(b)的组合物接触；其中任选地所述组合物包括植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物细胞。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0090】本发明提供了饲料或食物，其含有本发明的多肽或本发明的核酸编码的多肽。一方面，本发明提供了食品、饲料、液体如饮料(如果汁或啤酒)、面包或面团或面包产品、或饮料前体(例如，麦芽汁)，其含有本发明的多肽。本发明提供了动物的食物或营养补充剂，其含有本发明的多肽，例如，由本发明的核酸编码的多肽。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。
【0091】一方面，食物或营养补充剂中的多肽可以被糖基化。本发明提供了可食用的酶输送基质，其含有本发明的多肽，例如，由本发明的核酸编码的多肽。一方面，该输送基质包括丸剂。一方面，多肽可被糖基化。一方面，木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的活性，是耐热的。另一方面，木质纤维素酶活性是热稳定的。
【0092】本发明提供了含有本发明的多肽的食物、饲料或营养补充剂。本发明提供了将本发明的木质纤维素酶如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶用作动物获人饮食中的营养补充剂的方法，所述方法包括：制备含有本发明木质纤维素酶的营养补充剂，所述木质纤维素酶包含本发明的多肽的至少三十个连续氨基酸；以及向动物施用所述营养补充剂。动物可以是人、反刍动物或单胃动物。通过在宿主生物，例如细菌、酵母、植物、昆虫、真菌和/或动物中表达编码木质纤维素酶的多核苷酸，可以制备木质纤维素酶。所述生物还可选自粟酒裂殖酵母(S.pombe)、酿酒酵母(S.cerevisiae)、巴斯德毕赤酵母(Pichia.pastoris)、大肠杆菌(E.coli.)、链霉菌属某种(Streptomyces sp.)、杆菌属某种(Bacillus sp.) 和/或乳酸杆菌属某种(Lactobacillus sp.)。一方面，植物是单子叶植物或双子叶植物，或植物是单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒；或植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。
【0093】本发明提供了可食用的酶输送基质，其包括热稳定重组的本发明的木质纤维素酶，例如本发明的糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。本发明提供了向动物或人类输送木质纤维素酶补充剂的方法，所述方法包括：制备丸剂(丸粒，pellet)形式的可食用的酶输送基质，其包括粒状可食用载体以及热稳定的重组木质纤维素酶，其中所述丸剂容易将包含在其中的木质纤维素酶分散入含水介质中，以及向所述动物施用该可食用酶输送基质。本发明的重组的木质纤维素酶可以包括本发明至少一种多肽的全部或子序列。木质纤维素酶可被糖基化，以在压丸条件下提供热稳定性。该输送基质可以通过对含有谷物胚芽和木质纤维素酶的混合物进行压丸而形成。压丸条件可包括蒸汽的应用。压丸条件可包括应用超过约80℃的温度约5分钟，而该酶保持每毫克酶至少约350到约900 单位的比活性。
【0094】一方面，本发明提供了药物组合物，其含有本发明的木质纤维素酶，例如本发明的糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，或者本发明的核酸编码的多肽。一方面，药物组合物作为助消化剂。
【0095】在某些方面，含纤维素化合物与本发明具有木质纤维素酶的多肽在约 pH 3.0至9.0、10.0、11.0或更高的范围的pH下接触。在其它方面，含纤维素化合物与木质纤维素酶在约55℃、60℃、65℃、70℃、75℃、80℃、85℃、90℃或更高的温度下接触。
【0096】本发明提供用于输送酶补充剂，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶补充剂；和/或葡萄糖氧化酶补充剂给动物或人类的方法，所述方法包括：制备可食用的酶输送基质或丸剂，包括粒状可食用载体以及本发明热稳定的重组酶，其中所述丸剂容易将包含在其中的纤维素酶以及本发明的重组酶或由本发明的核酸编码的多肽分散入含水介质中；以及向所述动物施用该可食用酶输送基质或丸剂；以及任选地，所述粒状可食用酶输送基质包括载体，其选自谷物胚芽、无油谷物胚芽、干草、紫花苜蓿、梯牧草、大豆壳、向日葵花籽粕和次粉(wheat midd)；以及任选地，所述可食用载体包括无油谷物胚芽；以及任选地，本发明的酶被糖基化，以在压丸条件下提供热稳定性；以及任选地，该输送基质可以通过对含有谷物胚芽和纤维素酶的混合物进行压丸而形成；以及任选地，压丸条件包括蒸汽的应用；以及任选地，压丸条件包括应用超过约80℃的温度约5分钟，而该酶保持每毫克酶至少大约350到大约900单位的比活性。
【0097】本发明提供纤维素或纤维素衍生物组合物，其包括本发明的多肽或由本发明核酸编码的多肽，其中在可选的实施方式中，所述多肽具有糖基水解酶、葡萄糖氧化酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的活性。
【0098】本发明提供木材、木浆或木材产品或木材废料，其包括本发明的酶或由本发明的核酸编码的酶，其中任选地，本发明的酶的活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0099】本发明提供纸、纸浆或纸产品或纸废料副产品或再生材料，其包括本发明的多肽或由本发明核酸编码的多肽，其中任选地，所述多肽具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0100】本发明提供降低纸、木材或木材产品中纤维素含量的方法，包括用本发明的酶或由本发明的核酸编码的酶接触纸、木材或木材产品或木材废料，其中任选地，所述酶活性包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0101】本发明提供包括本发明的酶或由本发明的核酸编码的酶的洗涤剂组合物，其中任选地，多肽以非水液体组合物、注塑固体、颗粒形式、微粒形式、压缩片剂、凝胶形式、糊剂和浆液形式配制。一方面，所述活性包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0102】本发明提供包括本发明的酶或由本发明的核酸编码的纤维素酶的药物组合物或饮食补充剂，其中任选地，所述酶以片剂、凝胶、丸剂、植入物、液体、喷剂、粉末、食物、饲料小丸或胶囊化制剂配制。一方面，所述活性包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0103】本发明提供包括本发明的多肽或由本发明核酸编码的多肽的燃料，其中任选地，所述燃料源自植物材料，其任选地包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗。所述植物材料可源自单子叶植物或双子叶植物或单子叶玉米、甘蔗、水稻、小麦、大麦、柳枝稷或芒；或双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。所述燃料可包括、生物醇，例如生物乙醇或汽油-乙醇混合物、生物甲醇或汽油-甲醇混合物、生物丁醇或汽油-丁醇混合物、或生物丙醇或汽油-丙醇混合物。一方面，所述活性包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0104】本发明提供用于制造燃料或醇的方法，其包括将本发明的酶或包括本发明的酶的组合物或由本发明核酸编码的多肽或本发明制备的混合物或“鸡尾酒” 或产物的任何一种与生物质例如包括纤维素、可发酵的糖或多糖的组合物，例如木质素纤维材料接触。在可选的实施方式中，所述组合物包括纤维素或可发酵的糖，其包括植物、植物产物、植物废料或植物衍生物，以及所述植物、植物废料或植物产物可包括产蔗糖植物(cane sugar plant)或植物产物、甜菜或糖用甜菜 (sugarbeet)、小麦、玉米、大豆、马铃薯、水稻或大麦。在可选的实施方式中，所述燃料包括生物乙醇或汽油-乙醇混合物、生物甲醇或汽油-甲醇混合物、生物丁醇或汽油-丁醇混合物、或生物丙醇或汽油-丙醇混合物。本发明中本发明的酶可以是植物或种子例如转基因植物或种子的部分——以及，一方面，本发明的酶作为异源重组酶表达在每一生物质中(例如植物、种子、植物废料)，通过本发明的这种方法生物质被靶向用于水解和转化为燃料或醇。一方面，所述活性包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
【0105】本发明提供用于制造生物燃料的方法，所述生物燃料例如包括生物醇，例如生物乙醇、生物甲醇、生物丁醇或生物丙醇或其混合物或由以上组成，该方法包括将包括本发明酶的组合物、或可发酵的糖、或包括本发明多肽的木质素纤维材料、或由本发明核酸编码的多肽或本发明制备的混合物或“鸡尾酒”或产物的任何一种与生物质，例如包括纤维素、可发酵的糖或多糖的组合物例如木质素纤维材料接触。在可选的实施方式中，所述组合物包括本发明的酶和/或将被水解的材料，包括植物、植物废料、植物产物或植物衍生物。在可选的实施方式中，所述植物、植物废料或植物产物包括产蔗糖植物或植物产物(例如蔗梢)、甜菜或糖用甜菜、小麦、玉米、大豆、马铃薯、水稻或大麦。一方面，所述植物是单子叶植物或双子叶植物，或所述植物是单子叶玉米、甘蔗(包括茎部分，例如蔗梢)、水稻、小麦、大麦、柳枝稷或芒；或所述植物是双子叶含油种子作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、糖用甜菜、花生、树木、杨树或羽扇豆。一方面，本发明的酶具有包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。
【0106】本发明提供酶整体(酶总体，酶集合，enzyme ensemble)或“鸡尾酒 (混合物)”，用于解聚纤维素和半纤维素聚合物为可代谢的碳部分，其包括本发明的多肽或由本发明核酸编码的多肽。一方面，本发明的酶具有包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。本发明的酶整体或“鸡尾酒”可以是组合物(例如制剂、液体或固体)的形式，例如作为制备的产物。
【0107】本发明提供组合物(包括制备的产物、酶整体或“鸡尾酒”)，其包括 (a)木质纤维素酶例如半纤维素-和纤维素-水解酶的混合物(“鸡尾酒”、“酶整体”、制备的产物)，其包括至少一种本发明的酶，例如下文表4所述并在实施例4中讨论的本发明的酶的组合；例如本发明的示例性混合物、“鸡尾酒”或“酶整体”是：示例性酶SEQ ID NO：34、SEQ ID NO：360、SEQ ID NO：358和SEQ ID NO：371；或，示例性酶SEQ ID NO：358、SEQ ID NO：360、SEQ ID NO：168；或，示例性酶SEQ ID NO：34、SEQ ID NO：360、SEQ ID NO：214；或，示例性酶SEQ ID NO：360、SEQ ID NO：90、SEQ ID NO：358；等等，如表4清楚阐述。
【0108】本发明提供处理包括木质纤维素的生物质材料方法，其包括将包括纤维素、木质素或可发酵糖的组合物与本发明的至少一种多肽或由本发明核酸编码的多肽、或本发明酶整体、制备的产物或“鸡尾酒”接触。一方面，所述包括木质纤维素的生物质材料源自农作物，是食品或饲料生产的副产物，是木质纤维素废品，或是植物残渣或废纸或废纸产品。一方面，本发明的酶具有包括糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。一方面，所述植物残渣包括谷物、种子、茎、叶、壳、皮、玉米或玉米穗、玉米秸秆、干草、稻草(例如水稻杆或小麦杆或任何谷类植物的干杆)和/或草(例如印度草或柳枝稷)。一方面，所述草是印度草或柳枝稷、木材、木片、木浆和锯屑、或木材废料；并且任选地，所述纸废品包括废弃或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸、报纸、杂志、纸板和基于纸的包装材料。一方面，生物质材料的处理产生生物燃料，例如生物醇，例如生物乙醇、生物甲醇、生物丁醇或生物丙醇。
【0109】本发明提供乳制品，其包括本发明的多肽、或由本发明核酸编码的多肽或本发明的酶整体、制备的产品或“鸡尾酒”。一方面，所述乳制品包括乳、冰激凌、奶酪或酸奶。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。
【0110】本发明提供改善乳制品质地和风味的方法，其包括下列步骤：(a)提供本发明的多肽、或由本发明核酸编码的多肽或本发明的酶整体、制备的产物或“鸡尾酒”；(b)提供乳制品；和(c)将步骤(a)的多肽和步骤(b)的乳制品在其中本发明的多肽能够改善所述乳制品的质地和风味的条件下接触。
【0111】本发明提供纺织品或织物，其包括本发明的多肽、或由本发明核酸编码的多肽或本发明的酶整体、制备的产物或“鸡尾酒”，其中任选地，所述纺织品或织物包括含有纤维素的纤维。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶和/或纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。
【0112】本发明提供处理固体或液体动物废料产物的方法，其包括下列步骤： (a)提供本发明的多肽、或由本发明核酸编码的多肽或本发明的酶整体、制备的产物或“鸡尾酒”；(b)提供固体或液体动物废料；和(c)将步骤(a)的多肽和步骤(b)的固体或液体动物废料在其中蛋白酶可处理废料的条件下接触。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性在内的活性。
【0113】本发明提供处理的废料产物，其包括本发明的多肽、或由本发明核酸编码的多肽或本发明的酶整体、制备的产物或“鸡尾酒”。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0114】本发明提供消毒剂，其包括具有葡萄糖氧化酶和/或纤维素酶活性的多肽，其中所述多肽包括本发明的序列、或由本发明核酸编码的多肽或本发明的酶整体、制备的产物或“鸡尾酒”。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0115】本发明提供生物防御或生物解毒剂，包括具有木质纤维素活性例如纤维素酶活性的多肽，其中所述多肽包括本发明的序列、或由本发明核酸编码的多肽或本发明的酶整体、制备的产物或“鸡尾酒”。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0116】本发明提供组合物(包括本发明的酶整体和制备的产物)，其包括本发明的酶例如本发明的半纤维素和纤维素水解酶，和生物质材料的混合物，其中任选地，所述生物质材料包括源自农作物的木质素纤维材料，或所述生物质材料是食品或饲料生产的副产物，或所述生物质材料是木质纤维素废品、或所述生物质材料是植物残渣或废纸或废纸产品，或所述生物质材料包括植物残渣；并且任选地，所述植物残渣包括谷物、种子、茎、叶、壳、皮、玉米或玉米穗、玉米秸秆、草，其中任选地，所述草是印度草或柳枝稷、干草或秸杆(例如水稻杆或小麦杆或任何谷类植物的干杆)、木材、木片、木浆、木材废料和/或锯屑；并且任选地，所述纸废品包括废弃或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸、报纸、杂志、纸板和基于纸的包装材料。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0117】本发明提供处理生物质材料的方法，包括提供本发明的酶整体(“鸡尾酒”)或制备的产物，或本发明的半纤维素和纤维素水解酶的混合物，其中所述纤维素水解酶包括至少一种内切葡聚糖酶、纤维二糖水解酶I、纤维二糖水解酶II 和β-葡糖苷酶；以及所述半纤维素水解酶包括至少一种木聚糖酶、β-木糖苷酶和阿拉伯呋喃糖苷酶，以及将酶的混合物与生物质材料接触，其中任选地，所述包括木质纤维素的生物质材料源自农作物，是食品或饲料生产的副产物，是木质纤维素废品、或是植物残渣或废纸或废纸产品；以及任选地，所述植物残渣包括谷物、种子、茎、叶、壳、皮、玉米或玉米穗、玉米秸秆、草，其中任选地，所述草是印度草或柳枝稷、干草或秸秆(例如水稻杆或小麦杆或任何谷类植物干杆)、木材、木材废料、木片、木浆和/或锯屑；并且任选地，所述纸废品包括废弃或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸、报纸、杂志、纸板和基于纸的包装材料，以及任选地，该方法进一步包括处理所述生物质材料以产生生物燃料，例如生物醇，例如生物乙醇、生物甲醇、生物丁醇或生物丙醇，醇和/ 或糖(sugar)(糖类，saccharide)。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0118】本发明提供处理生物质材料的方法，包括提供本发明的酶的混合物(包括本发明的酶整体(“鸡尾酒”)或制备的产物)，以及将酶的混合物与生物质材料接触，其中任选地，所述包括木质纤维素的生物质材料源自农作物，是食品或饲料生产的副产物，是木质纤维素废品、或是植物残渣或废纸或废纸产品；以及任选地，所述植物残渣包括包括种子、茎、叶、壳、皮、玉米或玉米穗、玉米秸秆、玉米纤维、草(例如印度草或柳枝稷)、干草、谷物、秸秆(例如水稻杆或小麦杆或任何谷类植物的干杆)、甘蔗蔗渣、糖用甜菜浆、柑橘浆以及柑橘皮、木材、木材伐才(wood thinnings)、木片、木浆、浆废料、木材废料、木材刨花和锯屑、建筑和/或爆破废物和残片(例如木材、木材刨花和锯屑)；以及任选地，所述纸废品包括废弃或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸、报纸、杂志、纸板和基于纸的包装材料以及再生纸材料。此外，城市废物，例如城市固体废物的纸质部分、城市木材废物和城市绿色废物以及包含糖、淀粉和/或纤维素的其它材料可以被应用。任选地，生物质材料的处理产生生物燃料，例如生物醇，例如生物乙醇、生物甲醇、生物丁醇或生物丙醇。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0119】本发明提供包括第一结构域和至少第二结构域的嵌合多肽，其中所述第一结构域包括本发明的酶或由本发明的酶组成，并且所述第二结构域包括异源序列，例如异源结构域，例如异源或修饰的糖结合结构域或异源或修饰的锚定 (dockerin)结构域。在可选的实施方式中，所述糖结合结构域或模块(module) (CBM)是纤维素-结合模块或木质素-结合结构域，以及任选地，所述第二结构域被附加于接近酶的催化结构域。一方面，CBM包括本发明的CBM或由本发明的 CBM组成。在可选的实施方式中，所述第二结构域包括肝素和/或纤连蛋白结合结构域，例如纤连蛋白III型结构域例如FN3等等，或由肝素和/或纤连蛋白结合结构域例如纤连蛋白III型结构域例如FN3等等组成。
【0120】在可选的实施方式中，所述第二结构域被附加于接近酶的催化结构域的C-末端。一方面，本发明的多肽具有木质纤维素活性，例如包括糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的活性。
【0121】本发明提供包括(a)第一结构域和至少第二结构域的嵌合多肽，其中所述第一结构域包括本发明的酶和/或糖结合结构域/模块(CBM)或由本发明的酶和/或糖结合结构域/模块(CBM)组成，并且所述第二结构域包括异源或修饰的糖结合结构域(CBM)、异源或修饰的锚定结构域、异源或修饰的前原结构域或异源或修饰的活性位点，或由异源或修饰的糖结合结构域(CBM)、异源或修饰的锚定结构域、异源或修饰的前原结构域或异源或修饰的活性位点组成；(b)(a)的嵌合多肽，其中所述糖结合结构域(CBM)包括纤维素-结合模块或木质素-结合结构域，或由纤维素-结合模块或木质素-结合结构域组成；(c)(a)或(b)的嵌合多肽，其中所述CBM接近酶的催化结构域；(d)(a)、(b)或(c)的嵌合多肽，其中所述至少一种CBM的位置接近多肽的催化结构域；(e)(d)的嵌合多肽，其中所述至少一种CBM的位置接近多肽的催化结构域的C-末端，或接近多肽的催化结构域的N-末端或均接近二者；(f)(a)、(b)、(c)或(e)的任一项的嵌合多肽，其中所述嵌合多肽包括重组嵌合蛋白或由重组嵌合蛋白组成。
【0122】本发明提供嵌合多肽，包括(a)本发明的多肽和结构域，所述本发明的多肽具有木质纤维素酶活性，所述结构域包括至少一种异源或修饰的糖结合结构域-模块(CBM)(例如糖基水解酶结构域)、或至少一种内部重排的CBM或其任何组合，或由至少一种异源或修饰的糖结合结构域-模块(CBM)(例如糖基水解酶结构域)、或至少一种内部重排的CBM或其任何组合组成；(b)(a)的嵌合多肽，其中所述异源或修饰的或内部重排的CBM包括：CBM_1、CBM_2、 CBM_2a、CBM_2b、CBM_3、CBM_3a、CBM_3b、CBM_3c、CBM_4、CBM_5、 CBM_5_12、CBM_6、CBM_7、CBM_8、CBM_9、CBM_10、CBM_11、CBM_12、 CBM_13、CBM_14、CBM_15、CBM_16或CBM_1至CBM_48的CMB家族中的任何CBM；糖基水解酶结合结构域；本发明的CBM(例如本文所述，本发明的 CBM也在序列表中描述)；或其任何组合；(c)(a)或(b)的嵌合多肽，其中所述CBM包括纤维素-结合模块或木质素-结合结构域；(d)(a)、(b)或(c)的嵌合多肽，其中所述至少一种CBM的位置接近多肽的催化结构域；(e)(d)的嵌合多肽，其中所述至少一种CBM的位置接近多肽的催化结构域的C-末端，或接近多肽的催化结构域的N-末端或均接近二者；或(f)(a)、(b)、(c)或(e)的任一项的嵌合多肽，其中所述嵌合多肽是重组嵌合蛋白。
【0123】本发明提供分离的、合成的和/或重组的糖结合结构域-模块(CBM)，其包括下列或由下列组成：(a)至少一种如表5和序列表所述的CBM；(b)至少一种如表6和序列表所述的CBM；或(c)它们的组合。在可选的实施方式中，本发明的糖结合结构域-模块(CBM)包括本发明任何酶的任何子序列或由本发明任何酶的任何子序列组成，其包括本发明示例性酶的任何子序列，例如SEQ ID NO：2、 SEQ ID NO：4等等，其中所述子序列包括CBM基序或由CBM基序组成，例如 CBM_1、CBM_2、CBM_2a、CBM_2b、CBM_3、CBM_3a、CBM_3b、CBM_3c、 CBM_4、CBM_5、CBM_5_12、CBM_6、CBM_7、CBM_8、CBM_9、CBM_10、 CBM_11、CBM_12、CBM_13、CBM_14、CBM_15、CBM_16或CBM_1至CBM_48 的CMB家族中的任何CBM。
【0124】本发明的一个或多个方面的细节如附图和下面的描述所示。本发明的其它特征、目标和优点将通过说明书和附图以及权利要求而更加清楚。
【0125】此处引述的所有出版物、专利、专利申请、GenBank序列和ATCC 保藏物均通过引用被明确引入，用于所有目的。

附图说明

【0126】下面的附图是本发明各方面的例证性说明，而不意图限制权利要求书所包括的本发明的范围。
【0127】图1是一个计算机系统的框图。
【0128】图2是一个流程图，该图示意性说明了用于将新核苷酸或蛋白序列与序列数据库进行比较以确定该新序列与数据库中序列之间的同源性水平的过程的一个方面。
【0129】图3是一个流程图，该图示意性说明了在计算机中确定两个序列是否同源的过程的一个方面。
【0130】图4是一个流程图，该图示意性说明了检测序列中特征的存在的鉴定过程300的一个方面。
【0131】图5示例性说明了并入使用本发明至少一种酶或酶混合物的本发明的示例性甘蔗加工过程，如下详述；图5A说明了并入使用本发明至少一种酶或酶混合物的示例性糖至乙醇的过程；图5B说明了并入使用本发明至少一种酶或酶混合物的本发明的示例性过程；图5C示例性说明了本发明的示例性过程——干磨过程概述 ——其可并入使用本发明的至少一种酶或酶混合物。
【0132】图6示例性说明了鉴定本发明酶的示例性方案：用于定量葡萄糖的葡萄糖氧化酶分析，如下文实施例5详述。
【0133】图7示例性说明了概括包括在0.1％底物上在37℃消化的条件下多种示例性混合物酶促活性结果的数据，如下文实施例4详述。
【0134】图8示例性说明了概括包括在0.23％蔗渣上在37℃消化的条件下多种示例性混合物酶促活性结果的数据，如下文实施例4详述。
【0135】图9A示例性说明了示例性β-葡糖苷酶活性分析的标准曲线，如下文实施例14详述。图9B显示了对示例性β-葡糖苷酶活性分析的酶活性计算是如何在EXCELTM中建立的，如下文实施例14详述。
【0136】图10示例性说明了示例性β-葡糖苷酶活性分析的标准曲线，如下文实施例14详述。图10B显示了对示例性β-葡糖苷酶活性分析的酶活性计算是如何在EXCELTM中建立的，如下文实施例14详述。
【0137】图11示例性说明了表1，其显示了来自本发明的β-葡糖苷酶生产和纯化概括的数据，如下文实施例14详述。
【0138】图12A示例性说明了用FPLC方法从上清和沉淀细胞部分纯化的本发明的示例性SEQ ID NO：548、SEQ ID NO：564和SEQ ID NO：560的PAGE电泳，如下文实施例14详述。
【0139】图12B示例性说明了用FPLC方法从上清和沉淀细胞部分纯化的SEQ ID NO：530和SEQ ID NO：566的PAGE电泳，如下文实施例14详述。
【0140】图13示例性说明了表7，并显示用三种不同方法测定的本发明的纯化的β-葡糖苷酶的蛋白浓度，如下文实施例14详述。
【0141】图14示例性说明了表8，并显示本发明的纯化的β-葡糖苷酶的比活性，如下文实施例14详述。
【0142】图15示例性说明了表1，并显示本发明的示例性β-葡糖苷酶的比活性，如下文实施例14详述。
【0143】图16示例性说明了对于每种测试的本发明的β-葡糖苷酶，经验性选择的酶稀释液的起始速率动力学数据，如下文实施例15详述。
【0144】图17示例性说明了本发明的示例性SEQ ID NO：556、SEQ ID NO：560，以及黑曲霉(A.niger)β-葡糖苷酶的PAGE电泳，如下文实施例15详述。
【0145】图18示例性说明了显示使用本发明的示例性酶在pH 5、不同温度下 2mM纤维二糖水解的数据，如下文实施例15详述。
【0146】图19示例性说明了显示使用本发明的示例性酶在pH 7、不同温度下 2mM纤维二糖水解的数据，如下文实施例15详述。
【0147】图20示例性说明了三个样品制备物的示例排列，如下文实施例17详述。
【0148】图21是一个表格，其概括了本发明的示例性纤维素酶活性分析的 SPECTRAMAXTM数据，其从MU-吡喃葡糖苷(MU-glucopyranoside)释放4-甲基 7-羟基香豆素(4-methylumbelliferone)，如下文实施例17详述。
【0149】图22是一个表格，其概括了本发明的示例性纤维素酶活性分析的动力学活性数据，如下文实施例17详述。
【0150】图23示例性说明了显示三种可用于本发明的酶“鸡尾酒”或混合物的酶的小麦阿糖基木聚糖消化产物(消化特征，digest profile)的数据，如下文实施例 20详述。
【0151】图24是数据的示例性图示，所述数据显示了本发明的阿拉伯呋喃糖苷酶如何与本发明的木聚糖酶协同作用以消化小麦阿糖基木聚糖，如下文实施例 20详述。
【0152】图25是数据的示例性图示，所述数据显示了在小麦阿糖基木聚糖消化中，beta(β)-木糖苷酶(如图中所述)对示例性SEQ ID NO：719木聚糖酶的促进作用，如下文实施例20详述。
【0153】图26是数据的示例性图示，所述数据显示了使用本发明示例性酶，以玉米种子纤维为底物的阿魏酸酯酶活性，如下文实施例20详述。
【0154】图27是数据的示例性图示，所述数据显示了使用本发明示例性的乙酰基木聚糖酯酶SEQ ID NO：640、SEQ ID NO：650和SEQ ID NO：688，以乙酰基化的木聚糖为底物的活性分析，如下文实施例20详述。
【0155】图28是数据的示例性图示，所述数据显示了使用本发明示例性的乙酰基木聚糖酯酶SEQ ID NO：648、SEQ ID NO：654和SEQ ID NO：680，以醛糖酸 (aldo-uronic acid)混合物为底物的alpha(α)-葡糖苷酸酶活性分析，如下文实施例20 详述。
【0156】在不同的附图中同样的标记符号表示同样的要素。
发明详述
【0157】一方面，本发明提供了具有任何木质纤维素分解(木质素纤维)活性，包括木质素分解和纤维素分解活性，包括例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性的多肽；编码这些多肽的多核苷酸；以及制备和使用这些多核苷酸和多肽的方法。一方面，本发明提供具有木质纤维素活性例如葡萄糖氧化酶活性的多肽，其包括在生物质糖化中将可溶寡聚物转化为可发酵的单糖的酶。一方面，本发明的多肽的活性包括酶促水解 (或降解)可溶性纤维寡糖(cellooligsaccharides)和阿糖基木聚糖为单体木糖、阿拉伯糖和葡萄糖。一方面，本发明提供本发明多肽的热稳定和耐热形式。本发明多肽可用于各种制药、农业和工业环境中。
【0158】一方面，本发明提供了木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，其具有增强的催化速率，因此改善了底物水解过程。一方面，本发明提供木质纤维素酶，其在相对极端条件下具有活性，例如在高温或低温或高盐或低盐条件和/或酸性或碱性条件，包括高于或低于生理条件的pH 和温度。在催化速率上的这种增加的效率导致在生产糖类中增加的效率，在一个实施方式中，所述糖类随后可被微生物用于乙醇生产。一方面，产生本发明的酶的微生物与糖水解微生物例如产乙醇微生物一起使用。因此，本发明提供了生产生物燃料例如生物醇例如生物乙醇、生物甲醇、生物丁醇或生物丙醇以及制备基于醇类的“清洁燃料”的方法，例如，用于利用生物燃料进行的运输。
【0159】一方面，本发明提供了组合物(例如，酶制剂、饲料、药物、饮食补充剂)，其包括本发明的酶、多肽或多核苷酸。这些组合物可以以各种形式加以配制，例如液体、凝胶、丸剂、片剂、喷剂、粉末、食物、饲料小丸或包括纳米胶囊化剂型在内的胶囊化剂型。
【0160】测量纤维素酶活性如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的分析试验，例如用于确定多肽是否具有纤维素酶活性，如内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的分析试验，在本领域中是熟知的，并且在本发明的范围内；参见，例如Baker WL， Panow A，Estimation of cellulase activity using a glucose-oxidase-Cu(II)reducing assay for glucose，J Biochem Biophys Methods.1991 Dec，23(4)：265-73；Sharrock KR， Cellulase assay methods：a review，J Biochem Biophys Methods.1988 Oct， 17(2)：81-105；Carder JH，Detection and quantitation of cellulase by Congo red staining of substrates in a cup-platediffusion assay，Anal Biochem.1986 Feb 15，153(1)：75-9； Canevascini G.，A cellulase assay coupled to cellobiose dehydrogenase，Anal Biochem. 1985 Jun，147(2)：419-27；Huang JS，Tang J，Sensitive assay for cellulase and dextranase. Anal Biochem.1976Jun，73(2)：369-77。
【0161】本发明使用的反应条件的pH是本发明提供的另一个可变参数。在某些方面，反应的pH被指导在约3.0或更小至约9.0或更高的范围内，并且在一个实施方式中，本发明的酶在这些酸性或碱性条件下具有活性。在其它方面，本发明的方法在pH为约4.0、4.5、5.0、5.5、6.0、6.5、7.5、8.0、8.5、9.0或9.5或更高pH中实践，并且在一个实施方式中，本发明的酶在这些酸性或碱性条件下具有活性。在碱性条件下进行的反应条件也可能是有利的，例如，在本发明的酶的一些工业应用或制药应用中。
【0162】本发明提供包括药物、添加剂和补充剂的组合物，其包括以各种形式和配方的本发明的木质纤维素酶，包括具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽。在本发明的方法中，本发明的木质纤维素酶还以各种形式和配方使用。例如，纯化的木质纤维素酶可以用在酶制剂中，该酶制剂在生物燃料例如生物醇例如生物乙醇、生物甲醇、生物丁醇或生物丙醇的生产中或制药、食物、饲料或饮食助剂应用中使用。可选地，本发明的酶可直接或间接用在生产生物燃料例如生物醇例如生物乙醇、生物甲醇、生物丁醇或生物丙醇、制备清洁燃料、处理生物废物、加工食物、化学制品、药品、补充剂(物)、液体、食物或饲料等等的工艺中。
【0163】可选地，本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和 /或阿拉伯呋喃糖苷酶多肽，可使用本领域已知的方法在微生物(包括细菌、酵母、病毒、真菌和类似物)中表达。表达本发明酶的微生物可在植物、植物部分(例如种子)或生物体上或其内生存。在其它方面，本发明的木质纤维素酶可在用于本发明的方法之前固定在固体支持物上。将酶固定在固体支持物上的方法在本领域中广为人知，例如J.Mol.Cat.B：Enzymatic 6(1999)29-39；Chivata et al. Biocatalysis：Immobilized cells and enzymes，J Mol.Cat.37(1986)1-24；Sharma et al.， Immobilized Biomaterials Techniques and Applications，Angew.Chem.Int.Ed.Engl. 21(1982)837-54：Laskin(Ed.)，Enzymes and Immobilized Cells in Biotechnology。
核酸、探针和抑制分子(Inhibitory Molecules)
【0164】本发明提供了分离的、合成的和重组的核酸，例如参见下面的表1、 2和3和实施例；以及本发明的示例性核酸和多肽的序列在序列表中阐述；也描述了编码本发明示例性多肽的示例性核酸，参见例如表1、2和3以及序列表；包括表达盒例如表达载体、病毒、人工染色体或任何克隆载体，全部包括本发明的核酸。
【0165】在序列表中，对于SEQ ID NO：1-472，奇数代表编码蛋白的核酸序列，并且偶数代表氨基酸序列。在阅读SEQ ID表中，概括如下：
·SEQ ID NO：1-472：奇数代表编码蛋白的核酸序列，偶数代表氨基酸序列；
·SEQ ID NO：473-479代表氨基酸序列，SEQ ID NO：480-488代表核苷酸序列；
·SEQ ID NO：489-700：奇数代表编码蛋白的核酸序列，偶数代表氨基酸序列；
·SEQ ID NO：701-706是连接体，都是氨基酸序列；
·SEQ ID NO：707-717是最初源自真菌来源的某些酶的基因组、或gDNA、序列(都是核苷酸)；
·SEQ ID NO：718-721：偶数代表核苷酸序列，奇数代表氨基酸序列。
【0166】对于表1A所列的序列，其表明SEQ ID NO：370、SEQ ID NO：373、 SEQ ID NO：376、SEQ ID NO：379、SEQ ID NO：382、SEQ ID NO：385、SEQ ID NO：388、SEQ ID NO：391、SEQ ID NO：394、SEQ ID NO：397、SEQ ID NO：400、SEQ ID NO：403、SEQ ID NO：406、SEQ ID NO：409、SEQ ID NO：412、SEQ ID NO：415、 SEQ ID NO：418和SEQ ID NO：421是示例性酶编码序列或cDNA序列；以及SEQ ID NO：369、SEQ ID NO：372、SEQ ID NO：375、SEQ ID NO：378、SEQ ID NO：381、 SEQ ID NO：384、SEQ ID NO：387、SEQ ID NO：390、SEQ ID NO：393、SEQ ID NO：396、SEQ ID NO：399、SEQ ID NO：402、SEQ ID NO：405、SEQ ID NO：408、SEQ ID NO：411、SEQ ID NO：414、SEQ ID NO：417和SEQ ID NO：420是示例性基因组 (或“gDNA”)序列；以及SEQ ID NO：371、SEQ ID NO：374、SEQ ID NO：377、SEQ ID NO：380、SEQ ID NO：383、SEQ ID NO：386、SEQ ID NO：389、SEQ ID NO：392、 SEQ ID NO：395、SEQ ID NO：398、SEQ ID NO：401、SEQ ID NO：404、SEQ ID NO：407、SEQ ID NO：410、SEQ ID NO：413、SEQ ID NO：416、SEQ ID NO：419和 SEQ ID NO：422是示例性蛋白(氨基酸)序列。
总结：
表1A

表1B
  SEQ ID NO：   gDNA   SEQ ID   NO：   预测的cDNA   SEQ ID NO：预测的蛋白SEQ ID NO：   493，494   707   493 494   495，496   710   495 496   497，498   711   497 498   499，500   712   499 500   501，502   713   501 502   503，504   714   503 504   505，506   715   505 506   507，508   716   507 508   509，510   717   509 510   511，512   708   511 512   513，514   709   513 514
【0167】如上表1A和1B所列的序列是最初源自真菌来源，即本发明的这些示例性序列是源于真菌的核酸和酶。
【0168】如下的表2和3是描述了包括本发明的示例性核酸和多肽的酶促活性的选择特征的表格，包括利用同源性(序列同一性)分析将示例性序列与公共数据库的序列进行序列同一性比较以鉴定本发明酶的活性。表2和3中描述的所有序列(本发明的所有示例性序列)针对两组数据库进行了BLAST搜索(如在下面详细描述地)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库搜索所获得的所有结果参见名称为“NR描述(NR Description)”、“NR登录号(NR Accession Code)”、“NR评价(NR Evalue)”或“NR生物(NR Organism)”的各栏。“NR”指由NCBI维护的非-冗余(Non-Redundant)核苷酸数据库。该数据库是 GenBank、GenBank更新和EMBL更新的综合。栏“NR描述(NR Description)” 中的条目指任何给定的NCBI记录中的定义行(definition line)，其包括了对序列的描述，诸如来源生物、基因名称/蛋白质名称，或对序列的一些功能描述——因此通过同源性(序列同一性)分析鉴定本发明的列出的示例性酶的活性。“NR登录号(NR Accession Code)”一栏中的条目指给予序列记录的独特的标识符 (identifier)。“NR评价(NR Evalue)”一栏中的条目指期望值(评价)，其代表了这样的可能性：同待询序列(query sequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值，被发现在随机序列之间具有相同的数量的比较，如在当前的BLAST搜索中所进行的。“NR生物(NR Organism)”一栏中的条目指被鉴定为关系最密切的BLAST(序列同源性)命中(hit)的序列的来源生物。第二组数据库统称为GeneseqTM数据库，其可从Thomson Derwent(Philadelphia， PA)获得。对该数据库所作搜索的所有结果参见名称为“GeneseqTM蛋白质描述 (GeneseqTM Protein Description)”、“GeneseqTM蛋白质登录号(GeneseqTM Protein Accession Code)”、“GeneseqTM蛋白质评价(GeneseqTM Protein Evalue)”、“GeneseqTM DNA描述(GeneseqTM DNA Description)”、“GeneseqTM DNA登录号(GeneseqTM DNA Accession Code)”、“GeneseqTM DNA评价(GeneseqTM DNA Evalue)”的各栏中。这些栏中发现的信息与上述NR各栏中发现的信息具有可比性，除了它来自对 GENESEQTM数据库而不是对NCBI数据库进行的BLAST搜索。此外，该表包括栏“预测的EC编号(Predicted EC No.)”一栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号，该命名法是由国际生物化学和分子生物学联合会 (IUBMB)的命名委员会的酶分组(Enzyme Commission of the Nomenclature Committee of International Union of Biochemistry and Molecular Biology)开发的。在 “预测的EC编号”栏中的结果由对Kegg(Kyoto Encyclopedia of Genes and Genomes)数据库的BLAST搜索结果确定。如果最高BLAST匹配(top BLAST match) 的评价值等于或小于e-6，那么赋予最高匹配的EC编号进入表中。最高命中(top hit) 的EC编号用作向导，用于指出本发明序列的EC编号可能是什么。“待询DNA长度(Query DNA Length)”和“待询蛋白质长度(Query Protein Length)”这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目，本发明的序列被用于对NCBI或 GENESEQTM数据库进行搜索或查询。“GENESEQTM或NR DNA长度(GENESEQTM or NR DNA Length)”和“GENESEQTM或NR蛋白质长度(GENESEQTM or NR Protein Length)”这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果来自搜索，其将较低的评价——或者来自 NCBI数据库或者来自Geneseq数据库的较低的评价返回(return)。“GENESEQTM 或NR％ID蛋白质(GENESEQTM or NR％ID Protein)”和“GENESEQTM或NR％ID DNA(GENESEQTM or NR％ID DNA)”指本发明序列与最高BLAST匹配的序列之间的序列同一性百分比。这些栏中给出的结果来自搜索，其将较低的评价—— 或者来自NCBI数据库或者来自GENESEQTM数据库的较低的评价返回。
【0169】本发明示例性序列的活性及其它列于如下的表2和3(还参见表4 和5，其分别列出本发明示例性酶混合物和CBM)。为了进一步辅助阅读这些表格，例如在表2第一栏中，标有“SEQ ID NO：”，数字369-371代表本发明的示例性多肽，其具有如SEQ ID NO：371所述的序列，由例如SEQ ID NO：369(这是基因组序列，如上所释)编码；“由同源性得到的酶活性”是基于最高(最接近)BLAST 命中的酶活性赋值(评分，assignment)；“由实验得到的酶活性”是如实验方法所测定的在宽范围解释中的酶活性；“GH家族”是指所列示例性酶的糖基水解酶家族； “在PASC上的活性”是如下所述所列酶对于底物磷酸溶胀纤维素(substrate phosphoric acid swollen cellulose，PASC)的活性的实验测定水平；“Signalp切割位点”是所列示例性酶的信号序列(或“信号肽”或SP)，由范例Signalp所测定的，如下所讨论(参见Nielsen(1997))见下文)；“预测的信号序列”从氨基末端到羧基末端列出，例如对于表2第二栏中的多肽SEQ ID NO：38，信号肽是 “MVKSRKISILLAVAMLVSIMIPTTAFA”；“来源”是最初获得本发明的示例性核酸和多肽的微生物来源。

本发明选择的示例性多肽和核酸的初始来源：

【0170】本发明还包括利用本发明的核酸发现、鉴定或分离新的木质纤维素酶，包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶多肽序列的方法。本发明还包括利用本发明的核酸抑制木质纤维素酶编码基因和转录体表达的方法。
【0171】还提供了修饰本发明的核酸的方法，包括通过例如合成连接重装配、优化的定向进化系统和/或饱和诱变例如基因位点饱和诱变(或GSSM)产生本发明的核酸变体的方法。术语“饱和诱变”、基因位点饱和诱变或GSSM包括使用简并寡核苷酸引物将点突变引入多核苷酸的方法，如在下面所详细描述的。术语“优化的定向进化系统”或“优化的定向进化”包括用于重新装配相关的核酸序列的片段的方法，所述的相关核酸序列例如相关的基因，下面对其进行了详细解释。术语“合成连接重装配”或“SLR”包括以非随机方式连接寡核苷酸片段的方法，下面进行了详细解释。术语“变体”是指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处被(分别地)修饰的本发明的多核苷酸或多肽，然而它们仍然保持本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的生物学活性。变体可以通过许多种方法产生，包括的方法诸如，例如易错PCR、改组、寡核苷酸诱导的定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点特异性诱变、基因再装配、GSSM及其任意组合。
【0172】本发明的核酸可以通过，例如cDNA文库的克隆和表达、通过PCR 进行的信息或基因组DNA扩增以及类似的技术来制备、分离和/或操作。例如，本发明的示例性核酸最初来源于环境来源。因此，一方面，本发明提供了编码木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸，以及由它们编码的多肽，其共同的新颖性在于它们来源于共同的来源，例如环境来源、混合的培养物或细菌来源。
【0173】在本发明方法的实践中，同源基因可以通过操作模板核酸加以修饰，如同在文中所描述的。本发明可以与本技术领域已知的任何方法或程序或设备一起实践，这些方法、程序或设备在科学和专利文献中有很好的描述。特定多肽或蛋白的“编码序列”或编码特定多肽或蛋白的“核苷酸序列”是这样的核酸序列，其当置于合适的调节序列的调控下时被转录和翻译成多肽或蛋白质。术语“基因”意指在产生多肽链中所涉及的DNA片段；其包括编码区之前的区域和之后的区域(前导区 (leader)和尾区(trailer))，以及在适用的情况下，可以包括各个编码片段(外显子)之间的间插序列(内含子)。启动子序列“可操作地连接到”编码序列上，此时RNA聚合酶可以在启动子处起始转录，将编码序列转录成mRNA。正如此处所用，“可操作地连接(operably linked)”是指两个或更多个核酸(例如DNA)片段之间的功能关系。它可以指转录调控序列与被转录序列的功能关系。例如，如果启动子刺激或调节编码序列例如本发明的核酸在适当的宿主细胞或其它表达系统中的转录，那么该启动子便是可操作地连接到编码序列。一方面，启动子转录调控序列被可操作地连接到被转录序列(例如本发明的序列)并且与被转录序列是物理上相邻的，即它们是顺式作用。然而，一些转录调控序列，如增强子，不需要与它们增强其转录的编码序列物理相邻或者位于与它们增强其转录的编码序列接近的位置。用于 “驱动”本发明核酸转录的启动子包括例如病毒、细菌、哺乳动物或植物启动子；或，植物启动子；或者马铃薯、水稻、玉米、小麦、烟草或大麦启动子；或组成型启动子或CaMV35S启动子；或，诱导型启动子；或，组织特异性启动子或环境调节型或发育调节型启动子；或，种子特异性、叶特异性、根特异性、茎特异性或脱落诱导启动子；或种子优选启动子、玉米γ醇溶蛋白启动子或玉米ADP-gpp启动子。
【0174】本发明的一方面是分离的、合成的或重组的核酸，包括本发明的序列之一，或者含有本发明的核酸的至少10、15、20、25、30、35、40、50、75、100、 150、200、300、400或500或更多个连续碱基的片段。该分离的、合成的或重组的核酸可以包含DNA，包括cDNA、基因组DNA和合成DNA。DNA可以是双链或单链的，并且如果是单链的，可以是编码链或非编码(反义)链。可选地，该分离的、合成的或重组的核酸包含RNA。
【0175】本发明的分离的、合成的或重组的核酸可用于制备本发明的多肽之一，或者含有本发明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100 或150或更多个连续氨基酸的片段。因此，本发明的另一方面是分离的、合成的或重组的核酸，其编码本发明的多肽的一种，或者含有本发明的多肽之一的至少5、 10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段。这些核酸的编码序列可以与本发明的核酸之一的编码序列之一相同，或者可以是不同的编码本发明的多肽之一的编码序列，所述的多肽具有本发明的多肽之一的至少 5、10、15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸，这是遗传密码子的冗余性或简并性的结果。遗传密码子对于本领域技术人员是熟知的，并可以例如在B.Lewin，Genes VI，Oxford University Press，1997的第214页上得到。
【0176】编码本发明的多肽的核酸包括但不限于：本发明的核酸的编码序列和另外的编码序列，例如前导序列或蛋白原序列(proprotein sequences)，以及非编码序列，例如内含子，或编码序列的5′和/或3′非编码序列。因此，如在本文所使用，术语“编码多肽的多核苷酸”包括这样的多核苷酸，其包括多肽的编码序列以及包含另外的编码和/或非编码序列的多核苷酸。
【0177】一方面，使用常规技术，例如定点诱变或本领域技术人员熟悉的其它技术，本发明的核酸序列被诱变，以将沉默改变引入本发明的多核苷酸。如本文所使用，“沉默改变(silent changes)”包括，例如不改变由所述多核苷酸编码的氨基酸序列的改变。这样的改变可能是期望的，以通过引入在宿主生物中频繁出现的密码子或密码子对而增加由宿主产生多肽的水平，该宿主含有编码所述多肽的载体。
【0178】本发明还涉及具有核苷酸改变的多核苷酸，所述核苷酸改变在本发明的多肽中导致氨基酸置换、添加、缺失、融合和截短。使用技术例如定点诱变、随机化学诱变、外切核酸酶III删除和其它重组DNA技术，可以导入这样的核苷酸改变。可选地，这样的核苷酸改变可以是天然存在的等位基因变体，其通过鉴定在本文所提供的高严格条件、中度严格条件或低严格条件下特异性杂交到探针的核酸而分离出，所述探针含有本发明的序列(或其互补序列)之一的至少10、15、20、 25、30、35、40、50、75、100、150、200、300、400或500或更多个连续碱基。
一般技术
【0179】用于实践本发明的核酸，不管是RNA、siRNA、miRNA、反义核酸、 cDNA、基因组DNA、载体、病毒或其杂合体，都可以从多种来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽(例如木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)可以被单独地分离或克隆，并且可测试其期望活性。可以使用任何重组表达系统，包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。
【0180】可选地，这些核酸可以通过熟知的化学合成技术体外合成，正如例如 Adams(1983)J.Am.Chem.Soc.105：661；Belousov(1997)Nucleic Acids Res.25： 3440-3444；Frenkel(1995)Free Radic.Biol.Med.19：373-380；Blommers(1994) Biochemistry 33：7886-7896；Narang(1979)Meth.Enzymol.68：90；Brown(1979) Meth.Enzymol.68：109；Beaucage(1981)Tetra.Lett.22：1859；美国专利4,458,066 中所描述的。
【0181】本发明包括“核酸”或“核酸序列”，其为寡核苷酸、核苷酸、多核苷酸，或者寡核苷酸、核苷酸、多核苷酸中任意一种的片段，或者基因组或合成来源或者衍生的DNA、cDNA、gDNA、RNA(信使)、RNAi等等，其中任何一种可以是单链或双链，并且可以代表正义链或反义(互补)链，或者是指肽核酸(PNA)或者指天然或合成来源的任何DNA样或RNA样的物质。本发明包括“核酸”或“核酸序列”，其包括任何正义或反义序列、肽核酸(PNA)、天然或合成来源的任何DNA 样或RNA样的物质，其包括例如iRNA、核糖核蛋白(例如双链iRNA，例如iRNP)。本发明包括核酸，即寡核苷酸，其含有天然核苷酸的已知类似物。本发明包括具有合成骨架的核酸样结构，其是本发明的合成的核酸的一个可能的实施方式；例如参见Mata(1997)Toxicol.Appl.Pharmacol.144：189-197；Strauss-Soukup(1997) Biochemistry 36：8692-8698；Samstag(1996)Antisense Nucleic Acid Drug Dev 6： 153-156。“寡核苷酸”或者包括单链的多脱氧核苷酸，或者包括两个互补的多脱氧核苷酸链，它们可以是化学合成的。本发明包括合成的核酸和/或寡核苷酸，其没有5’磷酸；因此如果不在存在激酶的情况下采用ATP添加磷酸，该合成寡核苷酸便不会连接到另一个寡核苷酸上；合成的寡核苷酸可以连接到没有被去磷酸化的片段上。合成的核酸和/或寡核苷酸的可选结构以及制造它们的方法是本领域熟知的，并且将所有并入以用于制造和使用本发明。
【0182】本发明提供“重组的”多核苷酸(和蛋白)，并且一方面，重组的核酸是与“骨架”核酸相邻的核酸，这些核酸在其天然环境中与该“骨架”核酸是不相邻的。一方面，为了被“富集”，核酸表现为在核酸骨架分子群体中有大约1％、5％、 10％、15％、20％、25％或更多数量的核酸插入物。一方面，骨架分子包括核酸，如表达载体、自主复制核酸、病毒、整合核酸，以及用于维持或操纵感兴趣的核酸插入物的其它载体或核酸。一方面，富集的核酸表现为在重组的骨架分子群体中有大约1％、5％、10％、15％、20％、25％或更多数量的核酸插入物。一方面，富集的核酸表现为在重组的骨架分子群体中有大约50％、50％、51％、52％、53％、54％、 55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、 68％、69％、70％、71％、72％、73％、74％、75％或更多数量的核酸插入物。一方面，富集的核酸表现为在重组的骨架分子群体中有大约90％、91％、92％、93％、 94％、95％、96％、97％、98％、99％或更多数量的核酸插入物。
【0183】用于操纵核酸的技术，例如亚克隆、标记探针(例如使用Klenow聚合酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文献中有很好的描述，例如参见Sambrook编辑，MOLECULAR CLONING：A LABORATORY MANUAL(第二版)，Vols.1-3，Cold Spring Harbor Laboratory， (1989)；CURRENT PROTOCOLS IN MOLECULAR BIOLOGY，Ausubel，ed.John Wiley&Sons，Inc.，New York(1997)；LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY：HYBRIDIZATION WITH NUCLEIC ACID PROBES，Part I.Theory and Nucleic Acid Preparation，Tijssen，ed. Elsevier，N.Y.(1993)。
【0184】获得和操纵用于实践本发明方法的核酸的另一个有用方法是从基因组样品中克隆，并且如果是期望的，筛选和再克隆插入物，插入物可以分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或 cDNA文库，所述文库可以包含在例如哺乳动物人工染色体(MACs)，例如参见美国专利5,721,118；6,025,155；人类人工染色体，例如参见Rosenfeld(1997)Nat.Genet. 15：333-335；酵母人工染色体(YAC)；细菌人工染色体(BAC)；P1人工染色体，例如参见Woon(1998)Genomics 50：306-316；P1来源的载体(PAC)，例如参见 Kern(1997)Biotechniques 23：120-124；黏粒、重组病毒、噬菌体或质粒中。
【0185】一方面，编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。
【0186】本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上，如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达，其中所述融合蛋白中连接有一个或多个额外的结构域，例如用于产生免疫原性更强的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞，等等。有利于检测和纯化的结构域包括，例如金属螯合肽，如多组氨酸标记和组氨酸-色氨酸模块，其允许在固定的金属上纯化，还包括蛋白A结构域，其允许在固定的免疫球蛋白上纯化，还包括在FLAGS延展/亲和纯化系统(Immunex Corp， Seattle WA)中所使用的结构域。在纯化结构域和含有基序的肽或多肽之间包含可切割的连接体序列有助于纯化，这样的连接体序列例如Xa因子或肠激酶 (Invitrogen，San Diego CA)。例如，表达载体可以包括编码表位的核酸序列，其连接到六组氨酸残基上，还连接有硫氧还蛋白和肠激酶切割位点(例如参见 Williams(1995)Biochemistry 34：1787-1797；Dobeli(1998)Protein Expr.Purif.12： 404-414)。组氨酸残基有助于检测和纯化，而肠激酶切割位点提供了将表位与融合蛋白的剩余部分纯化分离开的手段。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了很好的描述，例如参见Kroll(1993)DNA Cell. Biol.，12：441-53。
转录和翻译控制序列
【0187】本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制序列上的本发明的核酸(例如DNA)序列，所述控制序列例如启动子或增强子，它们指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括 CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及小鼠金属硫蛋白I启动子。
【0188】如本文所使用，术语“启动子”包括能够驱动编码序列在细胞中例如植物或动物细胞中转录的所有序列。因此，在本发明的构建物中所用的启动子包括顺式作用转录控制元件和调节序列，它们涉及调节或调控基因转录的时间选择(定时， timing)和/或速率。例如，启动子可以是顺式作用转录控制元件，包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5’和3’非翻译区或内含子序列，它们均涉及转录的调节。这些顺式作用序列可与蛋白质或其它生物分子互相作用来执行(打开/关闭、调节、调控等等)转录。“组成型”启动子是那些在大部分环境条件和发育状态或细胞分化状态下持续地驱动表达的启动子。“诱导型”或“可调控型”启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以通过诱导型启动子影响转录的环境条件的实例包括无氧条件、升高的温度、干旱或光的存在。
【0189】“组织特异性”启动子是仅仅在特定细胞或组织或器官中有活性的转录控制元件，例如在植物或动物的特定细胞或组织或器官中有活性。组织特异性调节可以通过某些内在因子来实现，这些内在因子确保编码对给定组织特异的蛋白的基因被表达。这样的因子已知存在于哺乳动物和植物中，以便允许特异性组织的发育。
【0190】适合于在细菌中表达多肽的启动子包括大肠杆菌(E.coli)lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子和λPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR、以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。适合于在细菌中表达多肽或其片段的启动子包括大肠杆菌 lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、 λPR启动子和λPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子、以及酸性磷酸酶启动子。真菌启动子包括α-因子启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40 启动子、来自逆转录病毒的LTR以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。
组织特异性植物启动子
【0191】本发明提供了可以以植物部分(例如种子、叶、根或种子)或组织特异性方式表达的表达盒，例如可以以部分特异性或组织特异性方式表达本发明的木质纤维素酶例如本发明的糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的表达盒。本发明也提供了以阶段特异性和/或组织特异性方式表达本发明的木质纤维素酶的植物或种子。组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的方式。本发明的核酸可被可操作地连接至任何启动子，例如在表达盒中(例如载体、质粒等等)，以提供在植物、植物部分(例如根、茎、种子或果实)或植物种子中非常高的表达，其包括在植物的任何部分具有活性的启动子 (而且即使不在植物的全部部分高水平表达，也在至少一个部分中高水平表达)，或可选地，启动子可以以高水平在不是全部植物中，例如以组织特异性方式，表达本发明的核酸。一方面，启动子是组成型的并产生组成型高水平表达；可选地，启动子可以是诱导型的，即其可被诱导以产生本发明核酸的高水平表达，例如通过应用化学物质，通过可产生诱导性化学物质或蛋白质的试剂的感染，通过正常或诱导的成熟或生长过程，其中植物内源地开启或关闭某些基因和启动子。
【0192】一方面，组成型启动子如CaMV 35S启动子可以被用于在植物或种子的特定部分或在整个植物中的表达。例如，为了过量表达，可以使用植物启动子片段，其将指导核酸在植物例如再生植物的一些或所有组织中表达。此处，这样的启动子被称作“组成型”启动子，它们在大部分环境条件和发育或细胞分化状态下是有活性的。组成型启动子的实例包括花椰菜花叶病毒(CaMV)35S转录起始区(花椰菜花叶病毒启动子；参见例如USPN 5,100,732)；来自根瘤农杆菌的T-DNA的1’ 或2’启动子；以及来自本技术领域已知的多种植物基因的其它转录起始区。
【0193】可用于实践本发明的启动子、增强子和/或其它转录或翻译调节基序包括本领域已知的来自任何植物、动物或微生物基因的那些，例如其包括来自拟南芥 (Arabidopsis)的ACT11(Huang(1996)Plant Mol.Biol.33：125-139)；来自拟南芥的Cat3(GenbankNo.U43147，Zhong(1996)Mol.Gen.Genet.251：196-203)；来自甘蓝型油菜(Brassica napus)的编码硬酯酰基-酰基载体蛋白去饱和酶的基因 (Genbank No.X74782，Solocombe(1994)Plant Physiol.104：1167-1176)；来自玉米的GPc1(Genbank No.X15596；Martinez(1989)J.Mol.Biol.208：551-565)；来自玉米的Gpc2(Genbank No.U45855，Manjunath(1997)Plant.Mol.Biol.33：97-112)；在美国专利4,962,028；5,633,440中描述的植物启动子。
【0194】本发明使用来自病毒的组织特异性、诱导型或组成型启动子和/或增强子，它们可以包括，例如烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl. Acad.Sci.USA 92：1679-1683；稻米东格鲁杆状病毒(RTBV)，该病毒仅在受感染稻米植物中的韧皮细胞中复制，它的启动子驱动强的韧皮特异性报道基因的表达；木薯脉带花叶病毒(CVMV)启动子，其在导管组分、叶中轴细胞和根尖中具有最高活性(Verdaguer(1996)Plant Mol.Biol.31：1129-1139)。一方面，本发明使用丁香黄叶卷曲病毒(cestrum yellow leaf curling virus)启动子，例如USPN 7,166,770；10th IAPTC&B Congress“Plant Biotechnology 2002 and beyond.” Kononova等.p.237-238.Jun.24，2002中所述。一方面，本发明使用玉米(corn) (玉米(maize))胚乳特异性启动子，例如USPN 7,157,623中所述。一方面，本发明使用调节锌指蛋白表达的启动子，例如USPN 7,151,201中所述。一方面，本发明使用玉米(corn)(玉米(maize))启动子，例如USPN 7,138,278所述。一方面，本发明使用“arcelin”启动子(包括例如Arcelin-3、Arcelin-4和Arcelin-5启动子)，其能够在植物中以高水平转录异源核酸序列，例如USPN 6,927,321所述。一方面，本发明使用植物胚芽特异性启动子，例如美国专利(USPN)6,781,035； 6,235,975所述。一方面，本发明使用马铃薯块茎特异性表达的启动子，例如USPN 5,436,393所述。一方面，本发明使用叶-特异性表达启动子，例如USPN 6,229,067 所述。一方面，本发明使用叶肉-特异性表达启动子，例如USPN 6,610,840所述。
【0195】种子-优选的调节序列(例如种子-特异启动子)在例如美国专利 7,081,566；7,081,565；7,078,588；6,566,585；6,642,437；6,410,828；6,066,781； 5,889,189；5,850,016中描述。
【0196】一方面，植物启动子指导表达木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸在特定组织、器官或细胞类型中表达(即，组织特异性启动子)，或者可以在更加精确的环境或发育控制下或在诱导型启动子的控制下指导表达木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸的表达。可能影响转录的环境条件的实例包括厌氧条件、升高的温度、有光或喷撒化学品/激素。例如，本发明包括玉米的干旱诱导型启动子(Busk(1997) 出处同上)，马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)Plant Mol.Biol. 33：897 909)。
【0197】来自任何植物的任何组织特异性调节的编码序列、基因和/或转录调节序列(包括启动子和增强子)可用于实践本发明；其包括例如组织特异性启动子和增强子和编码序列；或启动子和增强子或基因，包括编码种子贮藏蛋白，例如油菜籽蛋白、十字花科蛋白(cruciferin)、β-伴大豆球蛋白、以及菜豆蛋白、玉米醇溶蛋白或油体蛋白(例如油质蛋白)的编码序列或基因，或涉及脂肪酸生物合成(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fatty acid desatureses， fad 2-1))的基因，以及其它在胚芽发育过程中表达的基因(例如Bce4，参见例如 EP 255378和Kridl等(1991)Seed Science Research，1：209)，以及与这些基因和蛋白编码序列相关的启动子和增强子。可用于实践本发明的示例性组织特异性启动子和增强子包括来自下列植物基因的组织特异性启动子和增强子：植物凝集素(参见例如Vodkin(1983)Prog.Clin.Biol.Res.138：87；Lindstrom(1990)Der.Genet. 11：160)、玉米醇脱氢酶1(参见例如Kyozuka(1994)Plant Cell 6(6)：799-810；Dennis (1985)Nucleic Acid Res.13(22)：7945-57)、玉米集光复合体(参见例如Simpson，(1986) Science，233：34；Bansal(1992)Proc.Natl.Acad.Sci.USA 89：3654)、玉米热休克蛋白 (参见例如Odell等(1985)Nature，313：810)、豌豆小亚基RuBP羧化酶(参见例如Poulsen等(1986)Mol.Gen.Genet.，205：193-200；Cashmore等，(1983)Gen.Eng. of Plant，Plenum Press，New York，29-38)、Ti质粒甘露氨酸合成酶(参见例如 Langridge等，(1989)Proc.Natl.Acad.Sci.USA，86：3219-3223)、Ti质粒胭脂氨酸合成酶(Langridge等，(1989)Proc.Natl.Acad.Sci.USA，86：3219-3223)、矮牵牛花查耳酮异构酶(参见例如vanTunen(1988(EMBO J.7：1257)、豆甘氨酸富含蛋白 1(参见例如Keller(1989)Genes Dev.3：1639)、截短的CaMV 35s(参见例如Odell (1985)Nature 313：810)、马铃薯patatin(参见例如Wenzler(1989)Plant Mol.Biol. 13：347)、根细胞(参见例如Yamamoto(1990)Nucleic Acid Res.18：7449)、玉米醇溶蛋白(参见例如Reina(1990)Nucleic Acid Res.18：6425；Kriz(1987)Mol.Gen. Genet.207：90；Wandelt(1989)Nucleic Acid Res.，17：2354；Langridge(1983)Cell， 34：1015；Reina(1990)Nucleic Acid Res.，18：7449)、ADP-gpp启动子(参见例如美国专利号7,102,057)、球蛋白-1(参见例如Belanger(1991)Genetics 129：863)、α- 微管蛋白、cab(参见例如Sullivan(1989)Mol.Gen.Genet.，215：431)、PEPCase(参见例如Hudspeth和Grula，(1989)Plant Molec.Biol.，12：579-589)、R基因复合体相关启动子(R gene complex-associated promoter)(参见例如Chandler，(1989)Plant Cell， 1：1175)、查耳酮合酶启动子(参见例如Franken，(1991)EMBO J.，10：2605)；和/ 或大豆热休克基因启动子，参见例如Lyznik(1995)Plant J.8(2)：177-86。
【0198】一方面，本发明使用用于种子特异性表达的种子特异性转录调节元件，例如其包括使用豌豆球蛋白启动子(参见例如Czako(1992)Mol.Gen.Genet.， 235：33；还参见美国专利5,625,136)。其它用于在成熟叶子中表达的启动子是那些在衰老开始时启动的启动子，例如来自拟兰芥的SAG启动子(参见例如Gan(1995) Science 270：1986)。
【0199】一方面，本发明使用果实-特异性启动子，其在或在贯穿果实发育的开花期至少直到成熟的开始的期间表达，例如美国专利4,943,674所述。一方面，本发明使用优先在棉纤维中表达的cDNA克隆，例如John(1992)Proc.Natl.Acad. Sci.USA 89：5769所述。一方面，本发明使用在果实发育过程中显示差异表达的、来自番茄的cDNA克隆，例如Mansson等，Gen.Genet.，200：356(1985)；Slater等， Plant Mol.Biol.，5：137(1985)中所述。一方面，本发明使用多聚半乳糖醛酸酶基因的启动子，其在果实成熟中具有活性；多聚半乳糖醛酸酶基因在例如美国专利 4,535,060；4,769,061；4,801,590；5,107,065中所述。
【0200】用于实践本发明的组织特异性启动子的其它例子包括那些在叶子遭到损害之后(例如，遭到咀嚼式昆虫损害)的叶细胞中、在块茎(例如patatin基因启动子)和在纤维细胞(发育调节纤维细胞蛋白的例子是E6，参见例如John(1992) PNAS 89：5769-5773)中指导表达的启动子。尽管在叶、胚珠和花中发现低水平的转录体，E6基因在纤维中是最具活性的。
【0201】一方面，组织特异性启动子只在该组织的发育阶段的某个时间段内促进转录；参见例如表征拟南芥LEAFY基因启动子的Blazquez(1998)Plant Cell 10：791-800；还参见描述转录因子SPL3的Cardon(1997)Plant J 12：367-77，SPL3 识别拟南芥(A.thaliana)花分生组织特征基因(floral meristem identity gene)AP1 的启动子区域的保守序列基序；和描述分生组织启动子eIF4的Mandel(1995)Plant Molecular Biology，29卷，第995-1004页。
【0202】可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。一方面，本发明的核酸与主要在棉纤维细胞中有活性的启动子可操作地连接。一方面，本发明的核酸与主要在棉纤维细胞伸长的阶段具有活性的启动子可操作地连接，例如，如Rinehart(1996)(出处同上)所述。核酸可以与Fb12A基因启动子可操作地连接，这样它将偏好在棉纤维细胞(同前)中表达。也参见John(1997) Proc.Natl.Acad.Sci.USA 89：5769-5773；John等，美国专利5,608,148和5,602,321，描述了用于构建转基因棉花植物的棉纤维特异性启动子和方法。
【0203】也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括醇脱氢酶基因中的启动子(DeLisle(1990)Int.Rey.Cytol.123：39-60)。可以用来表达本发明核酸的其它启动子包括，例如胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的一些组合；叶特异的启动子(参见例如Busk(1997)Plant J.11：12851295，描述了玉米的叶特异的启动子)；发根农杆菌(Agrobacterium rhizogenes)的ORF13启动子(ORF13启动子在根部表现出高活性，见，例如Hansen(1997)如上)；玉米花粉特异性启动子(见，例如 Guerrero(1990)Mol.Gen.Genet.224：161 168)；番茄启动子，其在果实成熟、变老、叶子脱落的期间有活性，在花中具有低一些的活性(参见例如Blume(1997) Plant J.12：731 746)；马铃薯SK2基因的雌蕊特异性启动子(见，例如Ficker(1997) Plant Mol.Biol.35：425 431)；豌豆的Blec4基因，Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性，这使它成为使外源基因靶向表达于活跃生长的芽或纤维的表皮层的有用工具；胚珠特异的BEL1基因(参见例如Reiser(1995)Cell 83：735-742，GenBank号：U39944)；和/或Klee，美国专利5,589,583中的启动子，该美国专利描述了一种植物启动子区域，其可导致在分生组织和/或快速分裂细胞中的高水平转录。
【0204】一方面，使用暴露于植物激素例如植物生长素后可诱导的植物启动子来表达本发明的核酸。例如，本发明可以使用大豆(Glycine max L.)的植物生长素响应元件E1启动子片段(AuxREs)(Liu(1997)Plant Physiol.115：397-407)；植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen (1996)Plant J.10：955-966)；烟草的植物生长素诱导的parC启动子(Sakai(1996) 37：906-913)；植物生物素响应元件(Streit(1997)Mol.Plant Microbe Interact. 10：933-937)；和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science 274： 1900-1902)。
【0205】本发明的核酸也可以与植物启动子可操作地连接，所述植物启动子暴露于施用于植物的化学试剂例如除草剂或抗生素后可被诱导。例如，可以使用被苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol. 38：568-577)；不同的除草剂安全剂的应用诱导不同的基因表达模式，包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下，例如，针对含有燕麦(Avena sativa L.)(oat)精氨酸脱羧酶基因的转基因烟草植物所描述的(Masgrau(1997)Plant J.11：465-473)；或者处于水杨酸响应元件的控制之下(Stange(1997)Plant J.11：1315-1324)。使用化学(例如，激素或杀虫剂)诱导的启动子，即，对可施用于田间的转基因植物的化学剂产生响应的启动子，本发明的多肽的表达可以在植物或植物部分(例如果实或种子)发育或成熟的特定阶段被诱导。因此，本发明也提供转基因植物，其包括编码本发明多肽的诱导型蛋白编码序列(例如基因)；其可选物可包括广泛或限制范围的宿主范围，例如限于目标植物种类，例如玉米、水稻、大麦、大豆、番茄、小麦、马铃薯或其它作物。一方面，诱导型蛋白编码序列(例如基因)在作物——包括植物部分(例如果实或种子)——发育或成熟的任何阶段是可诱导的。
【0206】本领域技术人员应认识到，组织特异性的植物启动子可能驱动可操作地连接的序列在不是靶组织的组织中表达。因此，一方面，组织特异性启动子是优选在靶组织或细胞类型中驱动表达的启动子，但是也可以在其它组织中导致一些表达。
【0207】本发明的核酸也可以与在暴露于化学试剂后可诱导的植物启动子可操作地连接。这些试剂包括例如，除草剂、合成的植物生长激素或抗生素，它们可以通过例如喷雾施用于转基因植物。一方面，木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶的诱导型表达，例如本发明编码酶的核酸的诱导型表达，将允许对木质纤维素酶表达和/或活性具有最佳表达量或时间的植物进行选择。植物部分的发育也可以因此被控制。以这种方式，本发明提供了促进植物和植物部分的收获的方法。例如，在各种实施方式中，玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder(1997)Plant Cell Physiol.38： 568-577)；应用不同的除草剂安全剂诱导出不同的基因表达模式，包括在根中、排水器中、芽尖分生组织中的表达。本发明的编码序列也可以处于四环素诱导的启动子的控制之下，例如，对含有燕麦(oat)精氨酸脱羧酶基因的转基因烟草植物的描述 (Masgrau(1997)Plant J.11：465-473)；或者在水杨酸响应元件控制下(Stange(1997) Plant J.11：1315-1324)。
【0208】在一些方面，适当的多肽表达可能要求在该编码区域的3’端具有多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、各类其它植物(或者动物或其它)基因或者农杆菌T-DNA中的基因。
表达载体和克隆载体
【0209】本发明提供表达盒、表达载体和克隆载体，其包括本发明的核酸，例如编码本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶或本发明抗体的序列。
【0210】本文所用的术语“表达盒(expression cassette)”指能实现结构基因(即蛋白编码序列，例如本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)在与这样的序列相容的宿主中表达的核苷酸序列。
【0211】本发明的表达盒可包括至少一个与多肽编码序列(例如本发明的酶或抗体)可操作地连接的启动子；并且任选地，可以与其它序列例如转录终止信号、信号序列或CBH编码序列等等可操作地连接。
【0212】也可以使用在实现表达中必需的或有用的其它因子，例如增强子、α- 因子。因此，本发明的表达盒也可包括(包含，或含在其中)质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体、人工染色体等等。
【0213】一方面，本发明的载体包括可以感染、转染、瞬时或永久地转导细胞的多肽编码序列(例如本发明酶或抗体的编码序列)和核酸。本发明的载体可以是裸核酸、或与蛋白或脂质复合的核酸。本发明的载体可包括病毒或细菌核酸和/或蛋白，和/或膜(例如细胞膜、病毒脂质包被等等)。本发明的载体可包括复制子(例如RNA复制子、细菌噬菌体)，DNA片段可以连接到这些复制子上并从而可被复制。因此，本发明的载体包括但不限于RNA、自主复制环状或线状DNA或RNA (例如质粒、病毒以及类似物，例如参见美国专利5,217,879)，并且包括表达质粒和非表达质粒。
【0214】本发明的重组微生物或细胞培养物可包含——可容纳——“表达载体”，所述“表达载体”可包括染色体外环状和/或线状DNA的一种或两种，它们已经被整合到宿主染色体(一条或多条)中。一方面，载体由宿主细胞(例如植物细胞)来维持，并且可选地，载体可以作为自主结构在有丝分裂过程中被细胞稳定地复制，或者被整合进宿主的基因组中。
【0215】本发明的表达载体和克隆载体可以包括病毒颗粒、重组病毒、杆状病毒、噬菌体、质粒、噬菌粒(phagemids)、黏粒、-F黏粒(fosmids)、人工染色体 (例如酵母或细菌人工染色体)、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、基于P1的人工染色体、酵母质粒、酵母人工染色体和任何其它对感兴趣的特定宿主(例如杆菌、曲霉和酵母)有特异性的载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大量的合适的载体对于本领域技术人员都是已知的，并且可以商业获得。
【0216】示例性的载体包括：细菌：pQETM载体(Qiagen)、pBLUESCRIPTTM质粒、pNH载体、λ-ZAP载体(Stratagene)；ptrc99a、pKK223-3、pDR540、pRIT2T (Pharmacia)；真核细胞：pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40 (Pharmacia)。然而，也可以使用任何其它质粒或其它载体，只要它们可以在宿主中复制和存活。可以在本发明中使用低拷贝数或高拷贝数的载体。用于实践本发明的质粒可以商购得到，在不受限制的基础上可以公开获得，或可以根据已公开的程序用可获得的质粒来构建。与本文描述的那些质粒等价的质粒在本技术领域是已知的，并且对于普通技术人员是显而易见的。
【0217】表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧翼非转录序列。在一些方面，衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录遗传元件。
【0218】一方面，表达载体含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因或使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四坏素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。启动子区域可以从任何期望的基因中选择出来，使用氯霉素转移酶(CAT)载体或具有选择标记的其它载体进行。
【0219】一方面，用于在真核细胞中表达多肽或其片段的载体含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp。它们可以作用于启动子以增强其转录。示例性增强子包括在复制起点下游侧100bp 到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子和腺病毒增强子。
【0220】核酸序列可以通过各种方法插入载体中。一般而言，将插入物和载体用合适的限制性内切酶消化后，序列可以连接到载体中的所希望的位置。可选择地，插入物和载体的平末端可以被连接。多种克隆技术在本领域已知，例如在Ausubel 和Sambrook中描述的。这样的方法和其它方法被认为在本领域技术人员的范围内。
【0221】载体可以是质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。
【0222】可以使用的特定细菌载体包括商业上可获得的质粒，其包括以下熟知的克隆载体的遗传元件：pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals，Uppsala，Sweden)、GEM1(Promega Biotec，Madison，WI，USA)、pQE70、 pQE60、pQE-9(Qiagen)、pD10、psiX174 pBLUESCRIPT II KS、pNH8A、pNH16a、 pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5 (Pharmacia)、pKK232-8和pCM7。特定的真核载体包括pSV2CAT、pOG44、pXT1、 pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而，可以使用任何其它载体，只要它可以在宿主细胞中复制和存活。
【0223】本发明的核酸可以在表达盒、载体或病毒中表达，在植物细胞和种子中瞬时地或稳定地表达。一个示例性的瞬时表达系统应用了附加型(episomal)表达系统，例如，通过含有超螺旋DNA的附加小染色体的转录而在核中产生的花椰菜花叶病毒(CaMV)病毒RNA，参见例如，Covey(1990)Proc.Natl.Acad.Sci.USA 87：1633-1637。可选地，编码序列，即本发明的序列的全部或子片段，可以插入到植物宿主细胞基因组中，而成为该宿主染色体DNA的整体部分。正义和反义转录体可以以这种方式被表达。包含本发明的核酸的序列(例如，启动子或编码区域) 的载体可以包含赋予植物细胞或种子选择性表型的标记基因。例如，所述标记可以编码生物杀灭剂抗性，例如抗生素抗性，例如对卡那霉素、G418、博来霉素、潮霉素或除草剂的抗性，例如对氯磺隆或Basta的抗性。
【0224】可以在植物中表达核酸和蛋白的表达载体在本领域中是熟知的，可以包括，例如，根瘤农杆菌的载体、马铃薯病毒X(参见例如Angell(1997)EMBO J.16：3675-3684)、烟草花叶病病毒(参见例如Casper(1996)Gene 173：69-73)、番茄丛矮病毒(参见例如Hillman(1989)Virology 169：42-50)、烟草蚀纹病毒(参见例如Dolja(1997)Virology 234：243-252)、菜豆金色花叶病毒(参见例如Morinaga (1993)Microbiol Immunol.37：471-476)、花椰菜花叶病毒(参见例如Cecchini (1997)Mol.Plant Microbe Interact.10：1094-1101)、玉米Ac/Ds转座元件(参见例如Rubin(1997)Mol.Cell.Biol.17：6294-6302；Kunze(1996)Curr.Top.Microbiol. Inimunol.204：161-194)，和玉米阻抑基因-突变基因(Spm)转座元件(参见例如 Schlappi(1996)Plant Mol.Biol.32：717-725)；和它们的衍生物。
【0225】一方面，表达载体可以有两套复制系统，使其可以在两种生物中保持，例如在哺乳动物或昆虫细胞中表达，在原核宿主中克隆和扩增。进一步，对于整合表达载体，该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在该表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列，可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建体在本领域是已知的。
【0226】本发明的表达载体也可以包括选择性的标记基因，以便对已经被转化的细菌株进行选择，例如，使细菌对药物，例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成基因，例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。
【0227】表达载体中的DNA序列被可操纵连接到合适的表达控制序列(一种或多种)(启动子)，以指导RNA合成。具体命名的细菌启动子包括lacI、lacZ、 T3、T7、gpt、λPR、λPL和trp。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR以及小鼠金属硫蛋白-I启动子。选择合适的载体和启动子在本领域技术人员的水平之内。表达载体还可以包括用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。使用氯霉素转移酶(CAT)载体或具有选择标记的其它载体，启动子区域可以从任何期望的基因中选择出来。此外，一方面，表达载体含有一个或多个选择性标记基因，以提供用于选择被转化的宿主细胞的表型特征，例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性，或例如大肠杆菌中的四环素或氨苄青霉素抗性。
【0228】哺乳动物表达载体还可以包括复制起点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’侧翼非转录序列。在一些方面，衍生于SV40剪接子的DNA序列和聚腺苷酸化位点可以用于提供所需要的非转录遗传元件。
【0229】用于在真核细胞中表达多肽或其片段的载体也可以含有增强子，以增加表达水平。增强子是DNA的顺式作用元件，一般长度为大约10到大约300bp，其作用于启动子，增强其转录。示例性增强子包括在复制起点下游侧100bp到270bp 的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子，和腺病毒增强子。
【0230】此外，表达载体通常含有一个或多个选择性标记基因，使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。
【0231】在一些方面，编码本发明的多肽之一或含有其至少大约5、10、15、 20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。一方面，该核酸可以编码融合多肽，其中本发明的多肽之一或含有其至少大约5、10、 15、20、25、30、35、40、50、75、100或150或更多个连续氨基酸的片段被融合到异源肽或多肽，例如N-末端鉴定肽，其给予了期望的特性，如增加的稳定性或简化的纯化特性。
【0232】合适的DNA序列可以通过各种方法插入载体中。一般而言，将插入物和载体用合适的限制性内切酶消化后，DNA序列可以连接到载体中的所希望的位置。可选地，插入物和载体的平末端可以被连接。多种克隆技术被公开于Ausubel 等，Current Protocols in Molecular Biology，John Wiley 503 Sons，Inc.1997和 Sambrook等，Molecular Cloning：A Laboratory Manual 2nd Ed.，Cold Spring Harbor Laboratory Press(1989)。这样的方法和其它方法被认为在本领域技术人员的范围内。
【0233】载体可以是例如质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体在Sambrook等，Molecular Cloning：A Laboratory Manual，2nd Ed.， Cold Spring Harbor，N.Y.，(1989)中描述。
宿主细胞和转化细胞
【0234】本发明也提供了包含本发明的核酸序列的转化细胞，所述核酸序列例如编码本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的序列，或本发明的载体。
【0235】本发明提供“转基因植物”，其包括植物或植物细胞以及植物细胞培养物(参见例如美国专利7,045,354；6,127,145；5,693,506；5,407,816)，其源自那些包括原生质体的细胞，在其中异源核酸序列例如本发明的核酸和各种重组构建体 (例如表达盒)已被插入。
【0236】宿主细胞可以是本领域技术人员熟悉的任何宿主细胞，包括原核细胞，真核细胞，例如，细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示例性的细菌细胞包括大肠杆菌属、沙门氏菌属(Salmonella)、链霉菌属、假单胞菌属、葡萄球菌属和杆菌属的任何种，包括例如埃希氏大肠杆菌、乳酸乳球菌(Lactococcus lactis)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、鼠伤寒沙门氏菌(Salmonella typhimurium)、荧光假单胞菌(Pseudomonas fluorescens)。示例性酵母细胞包括毕赤酵母属、酵母属、裂殖酵母属 (Schizosaccharomyces)、克鲁维酵母属(Kluyveromyces)、汉森酵母属(Hansenula)、曲霉菌属(Aspergillus)或许旺酵母属(Schwanniomyces)的任何种，包括巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母 (Schizosaccharomyces pombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)或丝状真菌，例如木霉属(Trichoderma)、曲霉菌属某种(Aspergillus sp.)，包括黑曲霉(Aspergillus niger)、海枣曲霉(Aspergillus phoenicis)、炭黑曲霉(Aspergillus carbonariu)。示例性的昆虫细胞包括草地夜蛾属 (Spodoptera)或果蝇属(Drosophila)的任何种，包括果蝇S2和草地夜蛾 (Spodoptera)Sf9。示例性的动物细胞包括CHO、COS或Bowes黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是熟知的，并在技术和科学文献中有描述。参见，例如， Weising(1988)Ann.Rey.Genet.22：421-477；美国专利5,750,870。
【0237】在可选的实施方式中，本发明的多肽(例如酶)以多种形式用于工业过程中，包括基于细胞的系统和/或部分地或充分地纯化的形式、或以混合物或其它制剂用于例如生物燃料加工和生产。一方面，使用商用(例如“高级”(“upscaled”)) 酶生产系统，并且本发明可使用任何本领域已知的多肽生产系统，包括任何基于细胞的表达系统，其包括多种菌株，包括任何真核或原核系统，包括任何昆虫、微生物、酵母、细菌和/或真菌表达系统；这些可选的表达系统是熟知的并在文献中讨论，并且所有被预期用于商业使用，用于生产和使用本发明的酶。例如，杆菌属的一些种可用于工业生产(参见例如Canadian Journal of Microbiology，2004 Jan.， 50(1)：1-17)。可选地，链霉菌属的一些种，例如变青链霉菌(S.lividans)、天蓝链霉菌(S.coelicolor)、S.limosus、S.rimosus、S.roseosporus和变青链霉菌(S.lividans) 可用于工业和可持续生产宿主(参见例如Appl Environ Microbiol.2006 August；72(8)： 5283-5288)。曲霉菌属(Aspergillus)菌株例如海枣曲霉(Aspergillus phoenicis)、黑曲霉(Aspergillus niger)和炭黑曲霉(Aspergillus carbonariu)可用于实践本发明，例如产生本发明的酶例如β-葡糖苷酶(参见例如World Journal of Microbiology and Biotechnology，2001，17(5)：455-461)。任何镰孢菌属的种可用于实践本发明的表达系统，包括例如禾谷镰孢菌(Fusarium graminearum)；参见例如Royer等 Bio/Technology 13：1479-1483(1995)。任何曲霉菌属的种可用于实践本发明的表达系统，其包括例如A.nidulans、烟曲霉(A.fumigatus)、黑曲霉或米曲霉(A.oryzae)；黑曲霉CBS513.88的基因组，商用酶生产菌株的亲本，最近被测序(参见例如Nat Biotechnol.2007 Feb；25(2)：221-31)。相似地，米曲霉的基因组测序最近完成(Nature. 2005 Dec 22；438(7071)：1157-61)。对于可用于实践本发明的可选的真菌表达系统，例如表达酶用于工业应用例如生物燃料生产，参见例如Advances in Fungal Biotechnology for Industry，Agriculture，and Medicine.Jan S.Tkacz&Lene Lange编辑. 2004.Kluwer Academic&Plenum Publishers，New York；和例如Handbook of Industrial Mycology.Zhiqiang An.编辑24 Sept.2004.Mycology Series No.22.Marcel Dekker，New York；和例如Talbot(2007)“Fungal genomics goes industrial”，Nature Biotechnology 25(5)：542；和USPNs 4,885,249；5,866,406；和国际申请公开 WO/2003/012071。
【0238】载体可以使用各种技术中的任何一种导入宿主细胞中，包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis，L，Dibner， M.，Battey，I.，Basic Methods in Molecular Biology，(1986))。
【0239】一方面，本发明的核酸或载体导入细胞是为了筛选，所以，所述核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。示例性的方法包括CaPO4沉淀法、脂质体融合、脂转染法(例如， LIPOFECTINTM)、电穿孔法、病毒感染法，等等。候选的核酸可以稳定地整合到宿主细胞基因组中(例如，用反转录病毒导入)或者可以短暂的或稳定的存在于细胞质中(即，通过使用传统的质粒，利用标准的调控序列、选择标记，等等)。因为许多药学上重要的筛选要求人或模式哺乳动物靶细胞，所以可以使用能够转染这些靶的反转录病毒载体。
【0240】在适当的情况下，工程化宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，细胞再培养一段时期，使得它们产生所需的多肽或其片段。
【0241】细胞可以通过离心收获，通过物理或化学方法破碎，保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎，包括冷冻-融解循环、声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话，可以应用蛋白质重折叠步骤来完成多肽的构象。假如需要的话，对于最终的纯化步骤可以采用高效液相色谱(HPLC)。
【0242】宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。取决于重组生产方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。
【0243】也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面，该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育，产生所需的多肽或其片段。
【0244】表达载体可以含有一个或多个选择性标记基因，为选择转化的宿主细胞提供表型特征，例如对真核细胞培养物而言的二氢叶酸还原酶或新霉素抗性，或者例如大肠杆菌中的四环素或氨苄青霉素抗性。
【0245】含有感兴趣多核苷酸如本发明的核酸的宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增基因。培养条件例如温度、pH和类似条件是先前选择用于表达的宿主细胞所使用的培养条件，并且对于普通技术人员是明显的。然后，被鉴定为具有指定的酶活性的克隆被测序，以鉴定编码具有增强活性的酶的多核苷酸序列。
【0246】本发明提供了在细胞中过量表达重组木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶的方法，该方法包括表达含有本发明的核酸的载体，本发明的核酸例如包括与本发明示例性序列在至少约100个残基的区域具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、 62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、 75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、 88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的核酸序列的核酸，其中所述序列同一性可以通过使用序列比较算法的分析或者通过视觉观察来确定，或者是与本发明的核酸序列在严格条件下杂交的核酸。过量表达通过任何方式例如使用高活性启动子、双顺反子(dicistronic)载体或通过该载体的基因扩增来实现。
【0247】本发明的核酸可以在任何体外或体内表达系统中被表达或过量表达。任何细胞培养系统可被用于表达或过量表达重组蛋白，包括植物、细菌、昆虫、酵母、真菌或哺乳动物培养物。示例性植物细胞培养系统包括来自水稻、玉米、烟草 (例如烟草BY-2细胞)或任何原生质的细胞培养系统，参见例如美国专利 7,045,354；6,127,145；5,693,506；5,407,816。
【0248】通过启动子、增强子、载体(例如，复制子载体、双顺反子载体的使用(见，例如Gurtu(1996)Biochem.Biophys.Res.Commun.229：295-8))、培养基、培养系统等等的合适选择，可以实现过量表达。一方面，使用选择标记如谷氨酰胺合酶(参见例如Sanders(1987)Dev.Biol.Stand.66：55-63)在细胞系统中进行的基因扩增被用于过量表达本发明的多肽。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞，包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。合适的宿主的选择在本领域技术人员的能力范围内。
【0249】载体可以使用各种技术中任何技术导入宿主细胞中，包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、 DEAE-Dextran介导的转染、脂转染法或电穿孔(例如参见Davis，L.，Dibner，M.， Battey，I.，Basic Methods in Molecular Biology，(1986))。
【0250】在适当的情况下，工程化宿主细胞可以在传统的营养培养基中培养，所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后，用合适的方法(例如，温度变化或化学诱导)诱导被选择的启动子，细胞再培养一段时期，使得它们产生所需的多肽或其片段。
【0251】细胞可以通过离心收获，通过物理或化学方法破碎，保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎，包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话，可以应用蛋白质重折叠步骤来完成多肽的构象。假如需要的话，对于最终的纯化步骤可以采用高效液相色谱(HPLC)。
【0252】各种哺乳动物细胞培养系统也可以被用于表达重组蛋白。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系(由Gluzman(1981)Cell，23：175 描述)，以及能从相容载体表达蛋白的其它细胞系，如C127、3T3、CHO、HeLa 和BHK细胞系。
【0253】宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。根据重组产生方法中所用的宿主，由含有载体的宿主细胞产生的多肽可以糖基化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸氨基酸残基。
【0254】可选地，本发明的多肽和包括其至少5、10、15、20、25、30、35、 40、50、75、100或150或更多连续氨基酸的片段可以通过常规肽合成仪合成产生，例如如下所述。在其它方面，通过肽合成，所述多肽的片段或部分可以被用于产生相应的全长多肽；因此，所述片段可用作产生全长多肽的中间体。
【0255】也可以采用无细胞的翻译系统来产生本发明的多肽之一或包括其至少 5、10、15、20、25、30、35、40、50、75、100或150或更多连续氨基酸的片段，其应用由DNA构建物转录得到的mRNA，所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面，该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA可与合适的无细胞翻译提取物例如兔网状细胞提取物温育，产生所需的多肽或肽。
核酸的扩增
【0256】在本发明的实践中，本发明的核酸和编码本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸，或本发明的修饰的核酸，可以通过扩增例如PCR来复制。扩增也可以被用于克隆或修饰本发明的核酸。因此，本发明提供了用于扩增本发明核酸的扩增引物序列对。本技术领域技术人员能设计用于这些序列的任何部分或全长的扩增引物序列对。
【0257】一方面，本发明提供了通过本发明的扩增引物对扩增的核酸，所述扩增引物对例如本发明的核酸的大约前(5′)12、13、14、15、16、17、18、19、20、 21、22、23、24或25或更多个残基以及互补链的大约前(5′)15、16、17、18、19、 20、21、22、23、24或25或更多个残基所示的引物对。本发明提供了用于扩增核酸的扩增引物序列对，所述核酸编码具有木质纤维素酶活性例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽，其中所述引物对能够扩增含有本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个成员或每一成员可以包含寡核苷酸，该寡核苷酸包含所述序列的至少约10至50个或更多个连续碱基，或所述序列的约12、 13、14、15、16、17、18、19、20、21、22、23、24或25或更多个连续残基。本发明提供了扩增引物对，其中所述引物对包括第一成员和第二成员，第一成员具有本发明核酸的大约前(5’)12、13、14、15、16、17、18、19、20、21、22、23、 24或25或更多个碱基所示的序列，第二成员具有第一成员的互补链的大约前(5’) 12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多个碱基所示的序列。
【0258】本发明提供了通过扩增产生的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，所述扩增例如聚合酶链反应(PCR)，其使用本发明的扩增引物对进行。本发明提供了通过扩增制备木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶的方法，所述扩增例如PCR，其使用本发明的扩增引物对。一方面，所述扩增引物对从文库例如基因文库诸如环境文库扩增核酸。
【0259】扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸，或量化样品中特异性核酸的量。在本发明的一个方面，扩增从细胞或cDNA文库分离出的信息。
【0260】技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本技术领域也是已知的，包括，例如聚合酶链式反应PCR(例如参见PCR PROTOCOLS， A GUIDE TO METHODS AND APPLICATIONS，ed.Innis，Academic Press，N.Y. (1990)和PCR STRATEGIES(1995)，ed.Innis，Academic Press，Inc.N.Y.；连接酶链式反应(LCR)(例如参见Wu(1989)Genomics 4：560；Landegren(1988)Science 241： 1077；Barringer(1990)Gene 89：117)；转录扩增(例如参见Kwoh(1989)Proc.Natl. Acad.Sci.USA 86：1173)；和自主维持序列复制(例如参见Guatelli(1990)Proc.Natl. Acad.Sci.USA 87：1874)；Qβ复制酶扩增(例如参见Smith(1997)J.Clin.Microbiol. 35：1477-1491)；自动Q-β复制酶扩增测定法(例如参见Burg(1996)Mol.Cell.Probes 10：257-271)和其它的RNA聚合酶介导的技术(例如NASBA，Cangene，Mississauga， Ontario)；也参见Berger(1987)Methods Enzymol.152：307-316；Sambrook；Ausubel；美国专利4,683,195和4,683,202；Sooknanan(1995)Biotechnology 13：563-564。
确定核酸和多肽的序列同一性
【0261】本发明提供了核酸，所述核酸包括与本发明的示例性核酸(也参见表 1至3以及序列表)在至少大约50、75、100、150、200、250、300、350、400、 450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、 1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基的区域内具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、 61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、 74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、 87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性(同源性)的序列。本发明提供了多肽，该多肽包括与本发明的示例性多肽(参见表1至3以及序列表)具有至少大约50％、 51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、 64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、 77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、 90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％) 序列同一性的序列。序列同一性(同源性)的程度可以使用任何计算机程序和相关参数来确定，包括本文描述的那些，如BLASTP或BLASTN、BLAST 2.2.2或FASTA 3.0t78版本，参数为默认值。
【0262】本发明的核酸序列可以包括本发明的示例性序列和与其基本上相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或 500或更多个连续核苷酸。本发明的核酸序列的同源序列和片段可以指与这些序列具有至少约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、 61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、 74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、 87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性(同源性)的序列。同源性(序列同一性)可以使用本文所描述的任何计算机程序和本文所述的参数来确定，包括BLASTP或BLASTN、BLAST 2.2.2、FASTA 3.0t78版本，其在可选的方面，可使用默认参数。同源序列还包括 RNA序列，其中尿嘧啶取代本发明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一种方法获得，或者从对测序错误的纠正中产生。应该意识到，本发明的核酸序列可以以传统的单字母格式表示(例如参见Stryer，Lubert.Biochemistry， 3rd Ed.，W.H Freeman&Co.，New York的内封底)，或以在序列中记录核苷酸的身份的任何其它格式表示。
【0263】在各个方面，本文指出的序列比较(序列同一性确定)程序被用于本发明的该方面，即，确定核酸或多肽序列是否在本发明的范围之内。然而，蛋白和 /或核酸序列同一性(同源性)可以使用本技术领域已知的任何序列比较算法或程序来评价。这样的算法和程序包括，但不限于，TBLASTN、BLASTP、FASTA、 TFASTA和CLUSTALW(参见，例如Pearson and Lipman，Proc.Natl.Acad.Sci.USA 85(8)：2444-2448，1988；Altschul等，J.Mol.Biol.215(3)：403-410，1990；Thompson 等人，Nucleic Acids Res.22(2)：4673-4680，1994；Higgins等，Methods Enzymol.266： 383-402，1996；Altschul等，J.Mol.Biol.215(3)：403-410，1990；Altschul等人，Nature Genetics 3：266-272，1993)。
【0264】一方面，同源性或同一性可以使用序列分析软件来测量(例如，地址为1710 University Avenue，Madison，WI 53705的威斯康星大学生物技术中心遗传学计算机组(Genetics Computer Group)的序列分析软件包)。这样的软件通过对各种缺失、取代和其它的修饰赋予同源性度数来匹配相似的序列。一方面，用于表示两个或者更多个核酸或者多肽序列之间的关系的术语“同源性”和“同一性”，是指当两个或更多个序列或子序列在某一比较窗口(comparison window)或者指定区域内被比较和联配以确定最大同一性时，这些序列是相同的，或者具有特定百分比例的相同氨基酸残基或核苷酸，其可以应用各种序列比较算法或者通过人工联配和视觉观察来确定。一方面，对于序列比较，将一个序列作为参考序列，而将测试序列与之进行比较。当使用序列比较算法时，将测试序列和参考序列输入到计算机中，指定子序列坐标，如果必要，也指定序列算法程序参数。可以使用默认的程序参数，或者可以指定别的参数。然后基于程序参数，序列比较算法计算出测试序列相对于参考序列的序列同一性百分比。
【0265】正如本文所用，“比较窗口”包括参考具有任意数目的连续位置的片段，所述数目选自从20到600、通常大约50到大约200，更经常大约100到大约150，其中在序列和参考序列进行优化联配后，序列可与具有相同数目的连续位置的参考序列作比较。用于比较的联配方法在本技术领域是熟知的。可以通过如下方法进行用于比较的序列的优化联配：例如Smith和Waterman，Adv.Appl.Math.2：482，1981 的局部同源性算法，Needleman和Wunsch，J.Mol.Biol.48：443，1970的同源性或序列同一性联配算法，person和Lipman，Proc.Nat′l.Acad.Sci.USA 85：2444，1988的查找相似性的方法，这些算法的计算机化实施(Wisconsin Genetics Software Package 中的GAP、BESTFIT、FASTA和TFASTA，Genetics Computer Group，575 Science Dr.，Madison，Wl)，手工联配和观察检验。除了BLAST程序(美国国家生物信息中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外，用于确定同源性或者同一性的其它的算法包括，例如，ALIGN、AMAS(多重联配序列分析 (Analysis of Multiply Aligned Sequences))、AMPS(蛋白多重序列联配(Protein Multiple Sequence Alignment))、ASSET(联配片段统计评估工具(Aligned Segment Statistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocks IMProved Searcher)、FASTA、Intervals&Points、BMB、CLUSTAL V、CLUSTAL W、 CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、 Las Vegas算法、FNAT(受迫核苷酸联配工具(Forced Nucleotide Alignment Tool))、 Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、 ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列联配(Local Sequence Alignment))、LCP(局部内容程序(Local Content Program))、 MACAW(多重联配构建和分析工作台(Multiple Alignment Construction&Analysis Workbench))、MAP(多重联配程序(Multiple Alignment Program))、MBLKP、 MBLKN、PIMA(模式诱导的多重序列联配(Pattern-Induced Multi-sequence Alignment))、SAGA(通过遗传算法的序列联配(Sequence Alignment by Genetic Algorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库，以鉴定具有大体上相同的序列的多核苷酸序列。大量的基因组数据库是可利用的，例如，作为人类基因组测序工程的构成部分的人类基因组的实质部分可以被利用(Gibbs， 1995)。至少二十一个其它基因组已经测定，如，生殖器支原体(M.genitalium) (Fraser等，1995)、甲烷球菌(M.jannaschii)(Bult等，1996)、流行性感冒杆菌(H. influenzae)(Fleischmann等，1995)、大肠杆菌(E.coli)(Blattner等，1997)和酵母 (酿酒酵母(S.cerevisiae))(Mewes等，1997)和黑腹果蝇(D.melanogaster) (Adams等，2000)。在模式生物的基因组序列的测序上已经取得了很大的进展，模式生物如小鼠，线虫(C.elegans)和拟南芥(Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的几个数据库由不同组织维护，可以通过互联网登录。
【0266】一方面，BLAST和BLAST 2.0算法被使用，其分别被描述于Altschul 等(1997)Nuc.Acids Res.25：3389-3402，1997和Altschul等(1990)J.Mol.Biol. 215：403-410，1990。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(query sequence)中长度为 W的短的字串来确定高分序列对(high scoring sequence pairs，HSPs)，所述高分序列对在与数据库序列中同样长度的字串联配时，匹配或者满足某个正值的阈值T。 T是指邻近字串(neighborhood word)的分数阈值(Altschul等，如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸，只要累积的联配分数可在增加。对于核苷酸序列，使用参数M(一对匹配的残基的奖励分数；总是大于0)来计算累积分数。对于氨基酸序列，使用记分矩阵来计算累计分数。出现下面情况时，字串命中(hit)在各个方向上的延伸便停止：累积的联配分数由达到的最大值下降了数量X；由于一个或者多个记分为负的残基联配的累积，累积分数达到0或者0以下；或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN 程序(对于核苷酸序列)默认的是：字串长度(W)为11，期望值(E)为10， M＝5，N＝-4，对两条链进行比较。对于氨基酸序列，BLASTP程序使用默认参数：字串长度为3，期望值(E)为10，BLOSUM62记分矩阵(参见Henikoff和Henikoff， Proc.Natl.Acad.Sci.USA 89：10915，1989)联配(B)为50，期望值(E)为10， M＝5，N＝-4，对两条链进行比较。
【0267】BLAST算法也进行两个序列之间的相似性的统计学分析(参见例如， Karlin和Altschul，Proc.Natl.Acad.Sci.USA 90：5873，1993)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability，P(N))，其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如，在测试核酸和参考核酸的比较中，如果最小合计概率小于大约0.2，更优选的是在一方面中小于0.01，最优选的是在一方面中小于大约0.001，就认为该核酸与参考序列相似。
【0268】一方面，应用基本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性(或序列同一性)。具体而言，五个特定的BLAST程序可以用来进行以下的任务：
(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较；
(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较；
(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较；
(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较；和
(5)TBLASTX把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。
【0269】BLAST程序通过确定相似片段来确定同源序列，所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoring segment pairs)”，该受测序列一方面从蛋白或者核酸序列数据库得到。高分片段对一方面利用记分矩阵来鉴定(即，联配)，很多的记分矩阵在本领域是已知的。一方面，应用的记分矩阵为BLOSUM62矩阵(Gonnet(1992)，Science 256：1443-1445； Henikoff和Henikoff(1993)，Proteins 17：49-61)。较不优选地，在一方面，也可以应用PAM或者PAM250矩阵(参见如，Schwartz和Dayhoff，eds.，1978，Matrices for Detecting Distance Relationships：Atlas of protein Sequence and Structure，Washingion： National Biomedical Research Foundation)。BLAST程序通过美国国家医学图书馆 (U.S.National Library of Medicine)可以获得。
【0270】根据所研究的序列长度和同源性程度，上述算法使用的参数可以被调整。在一些方面，在无用户的指示的情况下，所述参数使用算法所采用的默认参数。
计算机系统和计算机程序产品
【0271】本发明提供了计算机、计算机系统、计算机可读介质、计算机程序产品以及其上记录或存储了本发明的核酸和多肽序列的类似设备。此外，在实践本发明的方法中，例如，为了确定和鉴定序列同一性(为了确定核酸是否在本发明的范围之内)、结构同源性、基序等等，本发明的核酸或多肽序列可以在可通过计算机读取和访问的任何介质上存储、记录和操作。
【0272】正如此处所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练技术人员能容易地采用任何已知方法，在计算机可读介质上存储信息，以产生包括本发明的一个或多个核酸和/或多肽序列的产品。正如本文所用，术语“计算机”、“计算机程序”和“处理器”以它们在最广的普通语境中的含义被使用，包括了所有这样的设备，例如下面所详细描述的。特定多肽或蛋白的“编码序列”或“编码特定多肽或蛋白的序列”是指当被置于适当的调控序列的控制下时可被转录和翻译成多肽或蛋白的核酸序列。
【0273】本发明的多肽包括本发明的示例性序列和与其基本上相同的序列以及前述序列的任一个的子序列(片段)。一方面，基本上相同的、或同源的多肽序列是指与本发明的示例性序列(也参见表1至3)具有至少50％、51％、52％、53％、 54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、 67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、 80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、 93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性 (同源性)的多肽序列。
【0274】同源性(序列同一性)可以使用本文所描述的计算机程序和参数的任一种进行确定。本发明的核酸或多肽序列可以在可被计算机读取和访问的任何介质上存储、记录和操作。正如此处所用，词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练的技术人员能容易地采用任何目前已知的方法，在计算机可读介质上存储信息，以产生包括本发明的一个或多个核酸序列、本发明的一个或多个多肽序列的产品。本发明的另一方面是其上记录有至少2、5、10、15或20或更多个本发明核酸或多肽序列的计算机可读介质。
【0275】本发明的另一方面是其上记录有本发明的一个或多个核酸序列的计算机可读介质。本发明的另一方面是其上记录有本发明的一个或多个多肽序列的计算机可读介质。本发明的另一方面是其上记录有至少2、5、10、15或20或更多个如上面所述的核酸或多肽序列的计算机可读介质。
【0276】计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁/光学介质。例如，计算机可读介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存取存储器(RAM)或只读存储器(ROM)以及本领域的技术人员已知的其它类型的其它介质。
【0277】本发明的方面包括系统(例如基于因特网的系统)，特别是计算机系统，它们存储和操纵本文描述的序列信息。计算机系统100的一个实例以框图形式示意性地描述在图1中。正如此处所用，“计算机系统”指硬件部分、软件部分以及数据存储部分，它们用于分析本发明的核酸序列的核苷酸序列或本发明的多肽序列。一方面，计算机系统100可包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知类型的中央处理单元，如来自英特尔公司的奔腾III，或来自Sun、Motorola、Compag、AMD或International Business Machines公司的类似处理器。
【0278】一方面，计算机系统100是一个通用目的的系统，该系统包括处理器 105和用于存储数据的一个或多个内部数据存储部件110，以及用于检索数据存储部件上存储的数据的一个或多个数据检索设备。普通技术人员能容易地意识到任何一种当前可获得的计算机系统都是合适的。
【0279】在一个特定的方面，计算机系统100包括连接到总线上的处理器105，总线连接到主存储器115(在一方面，以RAM来实现)，和一个或多个内部数据存储设备110，例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。在一些方面，计算机系统100进一步包括一个或多个数据检索设备118，用于读取在内部数据存储设备110上存储的数据。
【0280】数据检索设备118可以是，例如软盘驱动器、压缩磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些方面中，内部数据存储设备110是可移动的计算机可读介质，例如含有控制逻辑和/或其上记录的数据的软盘、压缩磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程，用于当数据存储部件被插入到数据检索设备中时从数据存储部件读取控制逻辑和/或数据。
【0281】计算机系统100包括显示器120，用于给计算机用户显示输出。也应用注意到，计算机系统100可以被连接到网络或广域网中的其它计算机系统125a-c，以便提供对计算机100的集中访问。
【0282】用于访问和处理本发明的核酸序列的核苷酸或本发明的多肽序列的软件(例如，检索工具、比较工具和建模工具等等)在执行过程中可驻留于主存储器 115中。
【0283】在一些方面，计算机系统100可以进一步包括序列比较算法，其用于比较存储于计算机可读介质上的本发明核酸序列或本发明多肽序列与存储于计算机可读介质上的参考核苷酸或多肽序列。“序列比较算法”指在计算机系统100上执行(本地或远程)的一种或多种程序，以比较核苷酸序列和数据存储设备中存储的其它核苷酸序列和/或化合物。例如，序列比较算法可以将计算机可读介质上存储的本发明的核酸序列的核苷酸序列或本发明的多肽序列与计算机可读介质上存储的参考序列进行比较，以鉴定同源性或结构基序。
【0284】图2是示意性说明过程200的一个方面的流程图，该过程用于将新的核苷酸或蛋白序列与序列数据库进行比较，以便确定新序列和数据库中的序列之间的同源性水平。序列数据库可以是存储于计算机系统100上的个人数据库，或可以通过因特网获得的公共数据库如GENBANK。
【0285】过程200在起始状态201开始，然后转到状态202，其中要被比较的新序列被存储于计算机系统100的存储器上。正如上面所讨论的，该存储器可以是任何类型的存储器，包括RAM或内部存储设备。
【0286】然后过程200转到状态204，其中打开序列数据库以进行分析和比较。然后过程200转到状态206，其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较，以确定第一个序列是否与第二个序列相同。重要的是应该注意到，该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本技术领域的普通技术人员是已知的，即使所述两个核苷酸或蛋白序列不相同。例如，可以在一个序列中引入空位，以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。
【0287】一旦已经在状态210进行两个序列的比较，在决策状态210就要作出两个序列是否相同的判断。当然，术语“相同的”不限于绝对相同的序列。在过程200 中，在由用户输入的同源性参数范围内的序列都将被标记为“相同的”。
【0288】如果作出两个序列相同的判断，过程200转到状态214，其中来自数据库的序列的名称被显示给用户。该状态通知用户，具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户，过程200转到决策状态 218，其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序列，那么过程200在结束状态220终止。然而，如果数据库中确实存在更多的序列，那么过程200转到状态224，其中指针被指向数据库中的下一个序列，以便与新序列进行比较。以这种方式，将新序列与数据库中的每一序列联配并进行比较。
【0289】应该注意到，如果已经在决策状态212已经作出了序列不同源的判断，那么过程200将立即转到决策状态218，以便确定用于比较的数据库中的任何其它序列是否可利用。
【0290】因此，本发明的一个方面是计算机系统，该系统包括处理器、其上已经存储了本发明核酸序列或本发明的多肽序列的数据存储设备、其上以可检索方式存储了待与本发明的核酸序列或本发明的多肽序列比较的参考核苷酸序列或多肽序列的数据存储设备、以及用于进行比较的序列比较器。该序列比较器可以指出被比较的序列之间的同源性水平，或鉴定上述的本发明的核酸序列的核酸密码或者本发明的多肽序列中的结构基序，或者该比较器可以鉴定与这些核酸密码和多肽密码进行比较的序列中的结构基序。在一些方面中，数据存储设备可以在其上已经存储了至少2、5、10、15、20、25、30或40个或更多个本发明的核酸序列或本发明的多肽序列的序列。
【0291】本发明的另一方面是确定本发明的核酸序列或本发明的多肽序列和参考核苷酸序列之间的同源性水平的方法。所述方法包括通过使用确定同源性水平的计算机程序读取核酸代码或多肽代码以及参考核苷酸或多肽序列，以及用该计算机程序确定核酸代码或多肽代码与参考核苷酸或多肽序列之间的同源性。所述计算机程序可以是确定同源性水平的许多计算机程序的任何一种，包括本文中具体罗列的那些程序(例如，BLAST2N，具有默认参数或任何调整的参数)。所述方法可以使用上述的计算机系统执行。所述方法还可以如下进行：通过使用所述计算机程序读取至少2、5、10、15、20、25、30或40个或更多个上述的本发明的核酸序列或本发明的多肽序列，以及确定核酸代码或多肽代码与参考核苷酸序列或多肽序列之间的同源性。
【0292】图3是示意性说明计算机中的过程250的一个方面的流程图，该过程用于确定两个序列是否同源。过程250在起始状态252开始，然后转到状态254，其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态 256被存储到存储器上。然后过程250转到状态260，其中读取第一个序列中的第一个字符，然后转到状态262，其中读取第二个序列的第一个字符。应该理解到，如果序列是核苷酸序列，那么字符将通常是A、T、C、G或U。如果序列是蛋白序列，那么字符一方面可以是单字母氨基酸代码，以便第一个序列和第二个序列可以被容易地比较。
【0293】然后在决策状态264作出两个字符是否相同的判断。如果它们相同，那么过程250转到状态268，其中第一个和第二个序列中的下一个字符被读取。然后作出该下一个字符是否相同的判断。如果它们相同，那么过程250继续循环，直到两个字符不相同。如果作出的判断是这两个字母不相符，那么过程250转到决策状态274，以确定是否有更多的字符或者序列待读取。
【0294】如果没有任何更多的字符待读取，那么过程250转到状态276，其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此，如果前100个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配，那么同源性水平将是 100％。
【0295】可选地，计算机程序可以是这样的计算机程序，其将本发明所示的核酸序列的核苷酸序列与一个或多个参考核苷酸序列进行比较，以确定本发明的核酸代码是否在一个或多个位置上与参考核酸序列不同。任选地，这样的程序记录，相对于参考多核苷酸序列或者本发明的核酸序列，被插入、删除或置换的核苷酸的长度和身份。一方面，计算机程序可以是确定本发明的核酸序列是否相对于参考核苷酸序列含有单核苷酸多态性(SNP)的程序。
【0296】因此，本发明的另一方面是确定本发明的核酸序列是否在一个或多个核苷酸处与参考核苷酸序列不同的方法，所述方法包括通过使用鉴定核酸序列之间的差异的计算机程序读取核酸代码和参考核苷酸序列，并用该计算机程序鉴定核酸代码和参考核苷酸序列之间的差异的步骤。在一些方面，计算机程序是鉴定单核苷酸多态性的程序。该方法可以通过上面描述的计算机系统和图3所示意性说明的方法执行。所述方法还可以如下进行：通过使用所述计算机程序读取至少2、5、10、 15、20、25、30或40个或更多个本发明核酸序列和参考核苷酸序列，以及用该计算机程序鉴定核酸代码与参考核苷酸序列之间的差异。
【0297】在其它方面，基于计算机的系统可以进一步包括鉴定器，其用于鉴定本发明的核酸序列或本发明的多肽序列中的特征。“鉴定器”指在本发明的核酸序列或本发明的多肽序列中鉴定某些特征的一个或多个程序。一方面，鉴定器可以包括在本发明的核酸序列中鉴定开放阅读框的程序。
【0298】图4是示意性说明鉴定器过程300的一个方面的流程图，用于检测序列中特征的存在。过程300在起始状态302开始，然后转到状态304，其中将被检查特征的第一个序列存储在计算机系统100的存储器115上。然后过程300转到状态306，其中打开序列特征数据库。这样的数据库包括每一特征的属性以及该特征的名称的列表。例如，特征名称可以是“起始密码子”，属性将是“ATG”。另一个实例是特征名称“TAATAA序列盒”，特征属性是“TAATAA”。这样的数据库的实例由威斯康星大学遗传学计算机组(University of Wisconsin Genetics Computer Group) 开发。可选地，这些特征可以是结构多肽基序如α螺旋、β折叠，或功能多肽基序如酶活性结构域(CD)、或活性位点、螺旋-转角-螺旋基序或本技术领域技术人员已知的其它基序。
【0299】一旦在状态306打开特征数据库，过程300就转到状态308，其中从数据库读取第一个特征。然后在状态310将第一个特征的属性与第一个序列进行比较。接着在决策状态316作出在第一个序列中是否发现该特征的属性的判断。如果发现了属性，那么过程300转到状态318，其中所发现的特征的名称被显示给用户。
【0300】然后，过程300转到决策状态320，其中作出数据库中是否存在更多特征的判断。如果不存在更多特征，那么过程300在结束状态324终止。然而，如果数据库中确实存在更多的特征，那么过程300在状态326读取下一个序列特征，循环回到状态310，其中将下一个特征的属性与第一个序列进行比较。应当注意，如果在决策状态316在第一个序列中没有发现特征属性，那么过程300直接转到决策状态320，以便确定数据库中是否存在更多特征。
【0301】因此，本发明的另一方面是鉴定本发明的核酸序列或本发明的多肽序列中的特征的方法，所述方法包括通过使用鉴定其中特征的计算机程序读取核酸代码或多肽代码，并用该计算机程序鉴定核酸代码中的特征。一方面，计算机程序包括鉴定开放阅读框的计算机程序。所述方法可以如下进行：通过使用所述计算机程序读取本发明的核酸序列或本发明的多肽序列中的单个序列或至少2、5、10、15、 20、25、30或40个或更多个序列，以及用该计算机程序鉴定核酸代码或多肽代码中的特征。
【0302】本发明的核酸序列或本发明的多肽序列可以以多种形式在各种数据处理器程序中存储和操作。例如，本发明的核酸序列或本发明的多肽序列可以以文本文件存储在字处理文件中，如Microsoft WORDTM或WORDPERFECTTM，或以ASCII 文件存储在本领域技术人员熟悉的各种数据库程序中，例如DB2TM、SYBASETM 或ORACLETM。此外，许多计算机程序和数据库可以被用作序列比较算法、鉴定器或与本发明的核酸序列或本发明的多肽序列进行比较的参考核苷酸序列或多肽序列的来源。下面的罗列不意图限制本发明，而是提供对本发明的核酸序列或本发明的多肽序列有用的程序和数据库的指导。
【0303】可以使用的程序和数据库，包括但不限于：MACPATTERNTM(EMBL)、 DISCOVERYBASETM(Molecular Applications Group)、GENEMINETM(Molecular Applications Group)、LOOKTM(Molecular Applications Group)、MACLOOKTM (Molecular Applications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX (Altschul等，J.Mol.Biol.215：403，1990)、FASTA(Pearson和Lipman，Proc.Natl.Acad. Sci.USA，85：2444，1988)、FASTDB(Brutlag等.Comp.App.Biosci.6：237-245，1990)、 CATALYSTTM(Molecular Simulations Inc.)/Catalyst/SHAPETM(Molecular Simulations Inc.)、Cerius2.DBAccessTM(Molecular Simulations Inc.)、HYPOGENTM(Molecular Simulations Inc.)、INSIGHT IITM(Molecular Simulations Inc.)、DISCOVERTM (Molecular Simulations Inc.)、CHARMmTM(Molecular Simulations Inc.)、FELIXTM (Molecular Simulations Inc.)、DELPHITM(Molecular Simulations Inc.)、QuanteMMTM (Molecular Simulations Inc.)、Homology(Molecular Simulations Inc.)、MODELERTM (Molecular Simulations Inc.)、ISISTM(Molecular Simulations Inc.)、Quanta/protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular Simulations Inc.)、MDL Available Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、 Derwents’s World Drug Index数据库、BioByteMasterFile数据库、Genbank数据库和 Genseqn数据库。基于本发明的公开内容，许多其它程序和数据库对于本技术领域的技术人员是显而易见的。
【0304】可以用上述程序检测的基序包括：编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠、编码指导被编码的蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性序列(acidic stretches)、酶活性位点、底物结合位点和酶切割位点。
核酸的杂交
【0305】本发明提供了分离的、合成的或重组的核酸，所述核酸与本发明的示例性序列(例如SEQ ID NO：1、SEQ ID NO：3等等至SEQ ID NO：471、SEQ ID NO：480、SEQ ID NO：481、SEQ ID NO：482、SEQ ID NO：483、SEQ ID NO：484、SEQ ID NO：485、SEQ ID NO：486、SEQ ID NO：487、SEQ ID NO：488、SEQ ID NO：489 和SEQ ID NO：700之间的所有奇数SEQ ID NO、SEQ ID NO：707、SEQ ID NO：708、 SEQ ID NO：709、SEQ ID NO：710、SEQ ID NO：711、SEQ ID NO：712、SEQ ID NO：713、SEQ ID NO：714、SEQ ID NO：715、SEQ ID NO：716、SEQ ID NO：717、SEQ ID NO：718和/或SEQ ID NO：720，还参见表1至3和序列表)在严格条件下杂交。严格条件可以是高严格条件、中等严格条件和/或低严格条件，包括本文描述的高的和降低的严格性的条件。一方面，正如下面所讨论的，洗涤条件的严格性提供了决定核酸是否在本发明范围内的条件。
【0306】“杂交”指这样一个过程，即，通过该过程，核酸链与互补链通过碱基配对而结合。杂交反应可以是灵敏的并且是选择性的，以便感兴趣的特定序列可以被鉴定，甚至在其以低浓度存在的样品中也可以被鉴定。适度的严格条件(stringent condition)可以通过，例如预杂交和杂交溶液中盐或甲酰胺的浓度来定义，或者通过杂交温度来定义，这些严格条件在本技术领域是已知的。在可选的方面，严格性可以通过降低盐的浓度、增加甲酰胺的浓度或升高杂交温度来增加。在可选的方面，本发明的核酸通过它们在各种严格条件(例如高、中等和低严格条件)下杂交的能力来定义，正如本文所示。
【0307】一方面，高严格条件下的杂交包括大约37℃到42℃下大约50％的甲酰胺。一方面，杂交条件包括在大约30℃到35℃、大约35％至25％的甲酰胺的条件中降低的严格条件。一方面，杂交条件包括高度严格条件，例如在42℃、50％甲酰胺、5×SSPE、0.3％SDS和200μg/ml的剪切和变性鲑精DNA。一方面，杂交条件包括这些降低的严格条件，但在降低的温度35℃在35％甲酰胺中。相应于特定的严格性水平的温度范围可以通过计算感兴趣核酸中的嘌呤与嘧啶比并相应调节温度而进一步缩小。上述范围和条件的变化在本领域中是熟知的。
【0308】在可选的方面，本发明的核酸，正如通过它们在严格条件下杂交的能力所定义的，可以在本发明的核酸的约五个残基到全长之间；例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、 150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、 900、950、1000或更多残基。也包括小于全长的核酸。这些核酸可以用作，例如杂交探针、标记探针、PCR寡核苷酸探针、siRNA或miRNA(单链或双链)、反义或编码抗体结合肽(表位)、基序、活性位点等的序列。
【0309】一方面，本发明的核酸通过它们在高度严格性下杂交的能力定义，高度严格性包括在大约37℃到42℃的温度下大约50％的甲酰胺的条件。一方面，本发明的核酸通过它们在降低的严格性下杂交的能力定义，降低的严格性包括在大约 30℃到35℃在大约35％至25％的甲酰胺中的条件。
【0310】可选地，本发明的核酸通过它们在高度严格性下杂交的能力定义，高度严格性包括的条件为：在42℃、在50％甲酰胺、5×SSPE、0.3％SDS中，和封闭核酸的重复序列，如cot-1或鲑精DNA(例如200μg/ml的剪切和变性鲑精DNA)。一方面，本发明的核酸通过它们在降低的严格性条件下杂交的能力定义，降低的严格性条件包括在35℃或42℃的降低温度下的35％或40％甲酰胺中。
【0311】在核酸杂交反应中，用于得到特定严格性水平的条件将根据杂交中的核酸的性质变化。例如，所述核酸的杂交区域的长度、互补程度、核苷酸序列组成 (例如GC和AT含量)和核酸类型(例如RNA和DNA)可以在选择杂交条件时加以考虑。另外的考虑因素是核酸之一是否被固定，例如固定在滤膜上。
【0312】杂交可以在低度严格性、中度严格性或高度严格性的条件下进行。作为核酸杂交的一个实例，含有固定化的变性核酸的聚合物膜首先在45℃在由如下成分组成的溶液中预杂交30分钟：0.9M NaCl、50mM NaH2PO4，pH 7.0、5.0mM Na2EDTA、0.5％SDS、10×Denhardt’s和0.5mg/ml多核糖腺苷酸。然后在该溶液中加入大约2×107cpm(比活性为4-9×108cpm/ug)的32p末端标记的寡核苷酸探针。在温育12-16小时后，在室温下在含有0.5％SDS的1×SET(150mM NaCl、20mM Tris盐酸，pH 7.8、1mM Na2EDTA)中将膜洗涤30分钟，随后，在该寡核苷酸探针的Tm-10℃的温度，在新鲜的1×SET中洗涤30分钟。然后将膜暴露于放射自显影胶片，以检测杂交信号。所有的前述杂交将被认为在高严格条件下。
【0313】杂交后，可洗涤滤膜以除去任何非特异性结合的可检测探针。用于洗涤滤膜的严格性也可以根据如下方面进行变化：被杂交的核酸的性质、被杂交的核酸的长度、互补程度、核苷酸序列组成(例如GC和AT含量)和核酸类型(例如 RNA和DNA)。逐步增高的严格性洗涤条件的实例如下：2×SSC，0.1％SDS，室温下洗涤15分钟(低度严格性)；0.1×SSC，0.5％SDS，室温下洗涤30分钟到1 小时(中度严格性)；0.1×SSC，0.5％SDS，在杂交温度至68℃之间洗涤15到30 分钟(高度严格性)；和0.15M NaCl，72℃洗涤15分钟(极高严格性)。最终的低严格性洗涤可以在0.1×SSC在室温下进行。上述的实例仅仅是可用于洗涤滤膜的一组条件的示例性说明。本领域技术人员将知道，对于不同严格性的洗涤，可以有多种方案。下面给出了一些其它实例。
【0314】一方面，杂交条件包括洗涤步骤，其包括在溶液中在室温洗涤30分钟，所述溶液包括1×150mM NaCl、20mM Tris盐酸，pH 7.8、1mM Na2EDTA、 0.5％SDS，然后在新鲜溶液中洗涤30分钟。
【0315】通过放射自显影或其它常规技术，可以鉴定已杂交至探针的核酸。
【0316】可以对上述方法进行修改，以鉴定与探针序列具有降低水平的序列同一性(同源性)的核酸。例如，为了获得与可检测的探针具有降低的序列同一性(同源性)的核酸，可以使用较低严格性的条件。例如，杂交温度可以以5℃的梯度变化从68℃降低到42℃，杂交缓冲液的Na+浓度为大约1M。在杂交后，用2×SSC、 0.5％SDS在杂交温度下洗涤滤膜。这些条件在高于50℃被认为是“中度”条件，在低于50℃被认为是“低度”条件。“中度”杂交条件的具体实例是上述杂交在55℃进行。“低度严格性”杂交条件的具体实例是上述杂交在45℃进行。
【0317】可选地，杂交可以在含有甲酰胺的缓冲液如6×SSC中在42℃的温度下进行。在这种情况下，杂交缓冲液中甲酰胺的浓度可以以5％的梯度变化从50％降低到0％，以鉴定与探针具有降低水平的同源性的克隆。在杂交后，用6×SSC、 0.5％SDS在50℃洗涤滤膜。这些条件在高于25％的甲酰胺被认为是“中度”条件，在低于25％甲酰胺被认为是“低度”条件。“中度”杂交条件的具体实例是上述杂交在 30％甲酰胺中进行。“低度严格性”杂交条件的具体实例是上述杂交在10％甲酰胺中进行。
【0318】然而，杂交形式的选择不是关键性的——洗涤条件的严格性是决定核酸是否在本发明范围内的条件。用于鉴定本发明范围内的核酸的洗涤条件包括，例如：在pH 7大约0.02摩尔的盐浓度，并且至少大约50℃或大约55℃到大约60℃ 的温度；或者在72℃大约0.15M NaCl的盐浓度下大约15分钟；或者在至少大约 50℃或大约55℃到大约60℃的温度下大约0.2×SSC的盐浓度下大约15到大约20 分钟；或者用溶液将杂交复合物洗涤两次，所述溶液的盐浓度为含有0.1％SDS的大约2×SSC，在室温下洗涤15分钟，然后用含有0.1％SDS的0.1×SSC在68℃洗涤15分钟，洗涤两次；或者等同的条件。参见Sambrook，Tijssen和Ausubel对于 SSC缓冲液和等同条件的描述。
【0319】这些方法可以被用于分离或鉴定本发明的核酸。例如，前述方法可用于分离或鉴定核酸，所述核酸具有与选自本发明的序列或其含有至少大约10、15、 20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段以及其互补序列的核酸序列具有至少大约50％、51％、52％、53％、54％、55％、 56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、 69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、 82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、 95％、96％、97％、98％、99％或更高序列同一性(同源性)的序列。序列同一性 (同源性)可以使用联配算法来测量。例如，同源多核苷酸可以具有编码序列，该编码序列是本文描述的编码序列之一的天然发生的等位基因变体。当与本发明的核酸比较时，这样的等位基因变体可以具有一个或多个核苷酸的置换、删除或添加。另外，上述的方法可用于分离编码多肽的核酸，所述多肽与本发明的多肽或者其包含至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少大约99％、95％、至少90％、至少85％、至少80％、至少75％、至少 70％、至少65％、至少60％、至少55％或至少50％的序列同一性(同源性)，正如使用序列联配算法(例如FASTA3.0t78版本算法，参数为默认值)所确定的。
寡核苷酸探针及使用这些寡核苷酸探针的方法
【0320】本发明也提供了核酸探针，例如可以用于鉴定、扩增或分离编码具有木质纤维素(酶)活性例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的活性的多肽的核酸或其片段，或用于鉴定木质纤维素酶的基因。一方面，该探针包括本发明核酸中的至少大约10个或更多个连续碱基。可选地，本发明的探针可以是如本发明核酸序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、 100、110、120、130、150或大约10到50、大约20到60或大约30到70个连续碱基。这些探针通过结合和/或杂交来鉴定核酸。这些探针可以在本发明的阵列中使用，参见下面的讨论，包括例如毛细管阵列。本发明的探针也可以用于分离其它核酸或多肽。
【0321】本发明的分离的、合成的或重组的核酸、与其互补的序列、或含有本发明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、 300、400或500个连续碱基的片段、或与其互补的序列，也可用作探针，以确定生物样品如土壤样品是否含有具有本发明的核酸序列的生物体或从中可得到所述核酸的生物体。在这样的方法中，获得潜在地具有从中可分离出所述核酸的生物体的生物样品，并从样品中获得核酸。将这些核酸在允许探针与样品中存在的任何互补序列特异性杂交的条件下与探针接触。
【0322】在必要的时候，允许探针与互补序列特异性杂交的条件，可以通过将探针与来自样品的互补序列以及对照序列进行接触来确定，所述样品已知含有互补序列，所述对照序列不含有互补序列。杂交条件，如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度或杂交温度，可以被改变以确定允许探针与互补核酸特异性杂交的条件。
【0323】如果该样品含有从中可分离出核酸的生物体，那么探针的特异性杂交被检测到。杂交可以通过用可检测的试剂标记探针来检测，所述可检测的试剂如放射性同位素、荧光染料或能催化可检测产物形成的酶。
【0324】使用标记探针来检测样品中互补核酸的存在的许多方法对于本领域技术人员是熟知的。这些方法包括Southern印迹法、Northern印迹法、集落杂交方法和斑点印迹法。这些方法中的每一种方法的方案在Ausubel等，Current Protocols in Molecular Biology，John Wiley 503 Sons，Inc.(1997)和Sambrook等，Molecular Cloning：A Laboratory Manual 2nd Ed.，Cold Spring Harbor Laboratory Press(1989)中提供。
【0325】可选地，一种以上的探针(其中至少一种探针能与核酸样品中存在的任何互补序列特异性杂交)可以在扩增反应中使用，以确定样品是否包含含有本发明的核酸序列的生物体(例如从中可分离出所述核酸的生物体)。一方面，这些探针可以包括寡核苷酸。一方面，扩增反应可以包括PCR反应。PCR实验方案在 Ausubel和Sambrook(出处同上)中有所描述。可选地，扩增可以包括连接酶链式反应、3SR或链置换反应(见Barany，F.，“The Ligase Chain Reaction in a PCR World”， PCR Methods and Applications 1：5-16，1991；E.Fahy et ah，“Self-sustained Sequence Replication(3SR)：An Isothermal Transcription-based Amplification System Alternative to PCR”，PCR Methods and Applications 1：25-33，1991；以及Walker G.T.等，“Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique”， Nucleic Acid Research 20：1691-1696，1992)。在这样的方法中，将样品中的核酸与探针接触，进行扩增反应，检测任何所得的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳并用嵌入剂如溴化乙锭对凝胶进行染色来检测。可选地，可以用放射性同位素标记一种或多种探针，放射性扩增产物的存在在凝胶电泳后通过放射自显影术来检测。
【0326】衍生自本发明序列末端附近的序列的探针也可以在染色体步移 (chromosome walking)方法中使用，以鉴定含有位于临近本发明的序列的基因组序列的克隆。这样的方法允许从宿主生物中分离编码额外蛋白的基因。
【0327】一方面，本发明的分离的、合成的或重组的核酸，与其互补的序列或含有本发明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、 200、250、300、400或500个或更多个连续碱基的片段、或与其互补的序列，可被用作探针，以鉴定和分离相关的核酸。在一些方面，该相关的核酸可以是来自生物体的cDNA或基因组DNA，这些生物体并不是从中分离出所述核酸的生物体。例如，其它生物体可以是相关生物体。在这样的方法中，核酸样品在允许探针与相关序列特异性杂交的条件下与探针接触。然后用上述的任意一种方法检测探针与来自相关生物体的核酸的杂交。
【0328】通过改变用于鉴定与可检测探针杂交的核酸例如cDNA或基因组DNA 的杂交条件的严格性，可以鉴定并分离与探针具有不同同源性水平的核酸。严格性通过在低于探针的解链温度的变化温度下进行杂交来改变。解链温度Tm是50％的靶序列与完全互补的探针杂交时的温度(在确定的离子强度和pH下)。选择非常严格的条件，使其与特定探针的Tm相等，或比Tm低大约5℃。可以使用下述公式计算探针的解链温度：
【0329】对于长度在14到70个核苷酸的探针，使用如下公式计算解链温度 (Tm)：Tm＝81.5+16.6(log[Na+])+0.41(G+C的比例分数)一(600/N)，其中N是探针的长度。
【0330】如果杂交在含有甲酰胺的溶液中进行，解链温度使用如下等式计算： Tm＝81.5+16.6(log[Na+])+0.41(G+C的比例分数)-(0.63％甲酰胺)-(600/N)，其中 N是探针的长度。
【0331】预杂交可以在6×SSC、5×Denhardt试剂、0.5％SDS、100μg变性的片段化鲑精DNA或6×SSC、5×Denhardt试剂、0.5％SDS、100μg/ml变性的片段化鲑精DNA、50％甲酰胺中进行。SSC和Denhardt溶液的配方已在Sambrook等，如上列出。
【0332】一方面，杂交通过将可检测探针加入到上面所列出的预杂交溶液中来进行。在探针包含双链DNA的情况下，在加入到杂交溶液之前对探针变性。一方面，将滤膜与杂交溶液接触充足的时间，以允许探针与含有与其互补的序列或与其同源的序列的cDNA或基因组DNA杂交。对于长度超过200个核苷酸的探针，杂交可以在比Tm低约15-25℃的温度进行。对于更短的探针，如寡核苷酸探针，杂交在比Tm低5-10℃的温度进行。一方面，对于6×SSC中的杂交，杂交在大约68℃进行。通常，对于在包含50％甲酰胺的溶液中的杂交，杂交是在大约42℃进行的。
抑制纤维素酶的表达
【0333】本发明提供了与本发明的核酸例如编码纤维素酶的核酸互补的核酸 (例如本发明的核酸的反义序列)，例如包括反义序列、siRNA、miRNA、核酶。包括反义序列的本发明的核酸能抑制编码纤维素酶的基因的转运、剪接或转录。抑制可通过将基因组DNA或信使RNA作为靶标来实现。靶标核酸的转录或功能可以被抑制，例如通过杂交和/或切割。本发明提供的一组示例性抑制剂包括寡核苷酸，这些寡核苷酸或者能结合木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的基因或信息，在任一种情况下阻止或抑制木质纤维素酶的产生或功能。结合可通过序列特异性杂交来完成。另一类有用的抑制剂包括引起木质纤维素酶的信息失活或切割的寡核苷酸。该寡核苷酸可具有引起此类切割的酶活性，如核酶。可以对寡核苷酸进行化学修饰，或与能切割互补核酸的酶或组分偶联。可以对许多不同的这样的寡核苷酸的库进行筛选来寻找那些具有期望活性的寡核苷酸。因此，本发明提供了在核酸和/或蛋白水平抑制木质纤维素酶表达的各种组合物，例如，含有本发明的木质纤维素酶的反义序列、siRNA、miRNA和核酶，以及本发明的抗纤维素酶例如抗内切葡聚糖酶、抗纤维二糖水解酶和/或抗β-葡糖苷酶的抗体。
【0334】木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶表达的抑制可以具有各种工业应用。例如，抑制木质纤维素酶表达可以减慢或防止腐败(spoilage)。一方面，本发明的抑制木质纤维素酶表达和/或活性的组合物的使用，例如抗体、反义寡核苷酸、核酶、siRNA和miRNA的使用，被用于减慢或防止腐败。因此，一方面，本发明提供了方法和组合物，包括将本发明的抗体、反义寡核苷酸、核酶、siRNA和miRNA应用于植物或者植物产品(如，谷物、谷粒、果实、种籽、根、叶等)，以阻止或者延缓腐败。这些组分也可以由植物(例如转基因植物)或者其它生物(例如用本发明的木质纤维素酶的编码基因转化的细菌或者其它微生物)表达。
【0335】用于抑制木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶表达的本发明的组合物(例如反义序列、iRNA、核酶、抗体)可用作药物组合物，例如用作抗病原体剂，或用在其它治疗中，例如用作抗微生物剂，如用于抗沙门氏菌属。
反义寡核苷酸
【0336】本发明提供了能结合木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和 /或阿拉伯呋喃糖苷酶的信息的反义寡核苷酸，一方面，其能通过以mRNA作为靶标来抑制木质纤维素酶活性。设计反义寡核苷酸的策略在科学和专利文献中有很好的描述，技术人员能使用本发明的新试剂设计这样的木质纤维素酶寡核苷酸。例如，筛选有效的反义寡核苷酸的基因步移/RNA作图方案在本技术领域是熟知的，例如参见Ho(2000)Methods Enzymol.314：168-183，该文献描述了RNA作图分析法，该分析法是基于标准的分子技术，以提供用于有效的反义序列选择的一种简单且可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11：191-198。
【0337】自然发生的核酸被用作反义寡核苷酸。该反义寡核苷酸可以是任意长度；例如，在可选的方面，该反义寡核苷酸在大约5到100之间，大约10到80之间，大约15到60之间，大约18到40之间。最佳长度可以通过常规筛选来决定。这些反义寡核苷酸可以以任意浓度存在。最佳浓度可通过常规筛选来决定。广泛种类的合成的、非天然发生的核苷酸和核酸类似物是已知的，它们可以解决这一潜在的问题。例如，可以使用含有非离子骨架的肽核酸(PNA)，如含有N-(2-氨基乙基) 甘氨酸单元。也可以使用具有硫代磷酸酯键的反义寡核苷酸，正如在如下文献中所描述的：WO 97/03211；WO 96/39154；Mata(1997)Toxicol Appl Pharmacol 144： 189-197；Antisense Therapeutics，ed.Agrawal(Humana Press，Totowa，N.J.，1996)。如上文所述，本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩醛、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸。
【0338】组合化学方法学可用于产生大量寡核苷酸，其能被用于快速筛选特异性寡核苷酸，所述特异性寡核苷酸对任何靶标具有适当的结合亲和性和特异性，例如本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的正义和反义序列(例如参见Gold(1995)J.，Biol.Chem.270：13581-13584)。
抑制性核酶
【0339】本发明提供了能结合木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和 /或阿拉伯呋喃糖苷酶的信息的核酶。这些核酶能通过例如以mRNA作为靶标来抑制木质纤维素酶活性。设计核酶和选择用于靶向的木质纤维素酶特异性反义序列的策略在科学和专利文献中有很好的描述，并且熟练的技术人员能使用本发明的新试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分来与靶RNA结合，从而发挥作用，核酶的靶RNA结合部分与该RNA上切割靶RNA的酶促部分非常接近。因此，通过互补的碱基配对，核酶识别和结合靶RNA，而且一旦结合于正确的位置，便以酶促活性作用来切割靶RNA和使其失活。如果切割发生在编码序列中，以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后，它可以从结合的RNA上释放出来并且重复切割新的靶标。
【0340】在一些情况下，核酶的酶促性质会优于其它的技术，如反义技术(其中核酸分子仅结合于核酸靶来阻止其转录、翻译或者与其它分子的结合)，因为实现治疗效果所必要的核酶有效浓度可能低于反义寡核苷酸的浓度。这一潜在的优点反映出核酶可以以酶促方式进行作用的能力。因此，单个核酶分子可以切割靶RNA 的多个分子。一方面，核酶是高度特异性的抑制物，其抑制作用的特异性不仅依赖于碱基配对的结合机制，也依赖于该分子抑制与其结合的RNA的表达的机制。即，所述抑制是由切割靶RNA引起的，因此特异性定义为靶RNA的切割率与非靶RNA 的切割率的比值。除了涉及碱基配对的那些因素，这种切割机制还依赖于另外的因素。这样，核酶作用的特异性比结合于同样的RNA位点的反义寡核苷酸高。
【0341】本发明的核酶，例如具有酶活的核酶RNA分子，可以形成锤头状基序、发夹基序，如肝炎δ病毒基序、I类内含子基序和/或与RNA前导序列(guide sequence)相联系的RNaseP样RNA。锤头状基序的例子在如Rossi(1992)Aids Research and Human Retroviruses 8：183中有描述；发夹基序在Hampel(1989) Biochemistry 28：4929和Hampel(1990)Nuc.Acids Res.18：299中有描述；肝炎δ 病毒基序在Perrotta(1992)Biochemistry 31：16中有描述；RNaseP基序在 Guetrier-Takada(1983)Cell 35：849中有描述；I类内含子在Cech美国专利4,987,071 中有描述。这些特定基序的引述并不是限制性的。本领域技术人员将认识到本发明的核酶，如，本发明的有酶活的RNA分子，可以有与一个或者多个靶基因的RNA 区域互补的特异性底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。
RNA干扰(RNAi)
【0342】一方面，本发明提供了被称为“RNAi”分子的RNA抑制性分子，其包括本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶序列。RNAi分子可以包括双链RNA(dsRNA)分子，例如siRNA和/或miRNA。 RNAi分子例如siRNA和/或miRN可抑制木质纤维素酶基因的表达。一方面，RNAi 分子例如siRNA和/或miRNA长度大约为15、16、17、18、19、20、21、22、23、 24、25或更多个双链体核苷酸。虽然本发明不限于任何特殊的作用机制，但RNAi 可进入细胞中，并引起具有相似或相同序列的单链RNA(ssRNA)的降解，包括内源性mRNA。当细胞暴露于双链RNA(dsRNA)时，来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为短的干扰RNA的短碎片，它可触发与其序列匹配的mRNA的降解。一方面，本发明的RNAi可用于基因沉默(gene-silencing)疗法中，参见例如Shuey(2002)Drug Discov.Today 7：1040-1046。一方面，本发明提供了使用本发明的RNAi分子例如siRNA和/或 miRNA选择性降解RNA的方法。该过程可在体外、离体或体内实施。一方面，本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子例如siRNA和/或miRNA的方法在本领域中是熟知的，参见例如美国专利6,506,559；6,511,82；6,515,109；6,489,127。
核酸的修饰——制备本发明的变体酶
【0343】本发明提供了产生本发明的核酸的变体的方法，所述本发明的核酸例如那些编码木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸。这些方法可以被重复或者以多种组合使用，以产生具有与模板核酸编码的木质纤维素酶有所改变的或不同的活性或有所改变的或不同的稳定性的木质纤维素酶。这些方法也可以被重复或以多种组合使用，从而例如在基因/信息表达、信息翻译或信息稳定性方面产生变化。另一方面，细胞的遗传组成可以被改变，例如通过同源基因的离体修饰，随后再将其插入到细胞中。
【0344】本发明的核酸可以通过任何方法来改变。例如，随机(random或 stochastic)方法、或者非随机、或者“定向进化”的方法，参见如，美国专利6,361,974。基因的随机突变方法在本领域是已知的，参见如，美国专利5,830,696。例如，可以应用突变剂来对基因进行随机突变。突变剂包括，如，紫外线或者γ 辐射，或者化学诱变剂，如，丝裂霉素、亚硝酸、光活化的补骨脂内酯，它们单独使用或者组合使用来诱导DNA的断裂，其可以通过重组被修复。其它的化学诱变剂包括，如，亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物，如，亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体，从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。
【0345】可以应用分子生物学上的任何技术，如随机PCR诱变，参见例如Rice (1992)Proc.Natl.Acad.Sci.USA 89：5467-5471；或者组合式多重盒式诱变，参见例如Crameri(1995)Biotechinques 18：194-196。可选择地，核酸，如基因，可以在随意(random)或“随机”(“stochastic”)片段化后重新装配，参见例如美国专利 6,291,242；6,287,862；6,287,861；5,955,358；5,830,721；5,824,514，5,811,238； 5,605,793。在可选的方面，修饰、增加或者删除可以通过易错PCR、改组、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配、基因位点饱和诱变(或GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursive sequence recombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口双重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变(restriction-selection mutagenesis)、限制纯化诱变(restriction-purification mutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成、染色体饱和诱变(CSM)和/或者这些方法和其它方法的组合产生。
【0346】以下的出版物描述了可以并入到本发明的方法中的各种递归重组程序和/或方法：Stemmer(1999)“Molecular breeding of viruses for targeting and other clinical properties”Tumor Targeting 4：1-4；Ness(1999)Nature Biotechnology 17：893-896；Chang(1999)“Evolution of a cytokine using DNA family shuffling”Nature Biotechnology 17：793-797；Minshull(1999)“Protein evolution by molecular breeding” Current Opinion in Chemical Biology 3：284-290；Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17：259-264；Crameri(1998)“DNA shuffling of a family of genes from diverse species accelerates directed evolution”Nature 391：288-291；Crameri(1997) “Molecular evolution of an arsenate detoxification pathway by DNA shuffling”Nature Biotechnology 15：436-438；Zhang(1997)“Directed-evolution of an efiective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94：4504-4509；Patten等(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion in Biotechnology 8：724-733；Crameri等(1996) “Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2：100-103；Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through display on a lac repressor ′headpiece dimer′”Journal of Molecular Biology 255：373-386；Stemmer(1996)“Sexual PCR and Assembly PCR”，于The Encyclopedia of Molecular Biology中，VCH Publishers，New York.447-457页； Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes”BioTechniques 18：194-195；Stemmer 等(1995)“Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides”Gene，164：49-53；Stemmer(1995)“The Evolution of Molecular Computation”Science 270：1510；Stemmer(1995)“Searching Sequence Space”Bio/Technology 13：549-553；Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370：389-391；和Stemmer(1994)“DNA shuffling by random fragmentation and reassembly：In vitro recombination for molecular evolution” Proc.Natl.Acad.Sci.USA 91：10747-10751。
【0347】产生多样性的突变方法包括，例如，定点诱变(Ling等.(1997) “Approaches to DNA mutagenesis：an overview”Anal Biochem.254(2)：157-178；Dale 等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57：369-374；Smith(1985)“In vitro mutagenesis”Ann.Rev. Genet.19：423-462；Botstein&Shortle(1985)“Strategies and applications of in vitro mutagenesis”Science 229：1193-1201；Carter(1986)“Site-directed mutagenesis” Biochem.J.237：1-7；和Kunkel(1987)“The efficiency of oligonucleotide directed mutagenesis”在Nucleic Acids&Molecular Biology(Eckstein，F.和Lilley，D.M.J. eds.，Springer Verlag，Berlin))；使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad. Sci.USA 82：488-492；Kunkel等(1987)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Methods in Enzymol.154，367-382；和Bass等(1988) “Mutant Trp repressors with new DNA-binding specificities”Science 242：240-245)；寡核苷酸诱导的定点诱变(Methods in Enzymol.100：468-500(1983)；Methods in Enzymol.154：329-350(1987)；Zoller(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors：an efficient and general procedure for the production of point mutations in any DNA fragment”Nucleic Acids Res.10：6487-6500；Zoller& Smith(1983)“Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100：468-500；和Zoller(1987)Oligonucleotide-directed mutagenesis：a simple method using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154：329-350)；硫代磷酸酯修饰的DNA诱变 (Taylor(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA”Nucl.Acids Res.13：8749-8764；Taylor(1985)“The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA”Nucl.Acids Res.13：8765-8787(1985)；Nakamaye (1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14： 9679-9698；Sayers (1988)“Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis”Nucl.Asids Res.16：791-802；和Sayers等(1988) “Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16： 803-814)；使用缺口双链体DNA的诱变(Kramer等(1984)“The gapped duplex DNA approach to oligonucleotide-directed mutation construction”Nucl.Acids Res.12： 9441-9456；Kramer和Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction of mutations via gapped duplex DNA”154：350-367；Kramer(1988) “Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.16：7207；和Fritz (1988)“Oligonucleotide-directed construction of mutations：a gapped duplex DNA procedure without enzymatic reactions in vitro”Nucl.Acids Res.16：6987-6999)。
【0348】可以用于实践本发明的另外的实验方案包括点错配修复(参见例如 Kramer(1984)″Point Mismatch Repair″38：879-887)，应用修复缺陷型宿主株的诱变(参见例如Carter等(1985)″Improved oligonucleotide site-directed mutagenesis using M13 vectors″Nucl.Acids Res.13：4431-4443；和Carter(1987)″Improved oligonucleotide-directed mutagenesis using M13 vectors″Methods in Enzymol.154： 382-403)，缺失诱变(Eghtedarzadeh(1986)″Use of oligonucleotides to generate large deletions″Nucl.Acids Res.14：5115)，限制-选择和限制-选择和限制-纯化(Wells等 (1986)″Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin″Phil.Trans.R.Soc.Lond.A 317：415-423)，通过全基因合成的诱变 (Nambiar(1984)″Total synthesis and cloning of a gene coding for the ribonuclease S protein″Science 223：1299-1301；Sakamar和Khorana(1988)″Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)″Nucl.Acids Res.14：6361-6372；Wells等 (1985)″Cassette mutagenesis：an efficient method for generation of multiple mutations at defined sites″Gene 34：315-323；和Grundstrom(1985)″Oligonucleotide-directed mutagenesis by microscale `shot-gun`gene synthesis″Nucl.Acids Res.13： 3305-3316)，双链断裂修复(Mandecki(1986)；Arnold(1993)″Protein engineering for unusual environments″Current Opinion in Biotechnology 4：450-455. ″Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli：a method for site-specific mutagenesis″Proc.Natl.Acad.Sci.USA，83：7177-7181)。很多以上的方法的另外的细节可在Methods in Enzymology第154卷中发现，其中也描述了用于解决各种诱变方法中所遇到的问题的有用参照方法。
【0349】在例如下列的文件中描述了可以用于实践本发明的实验方案，如 Stemmer的美国专利5,605,793(1997年2月25日)，“Methods for In Vitro Recombination”；Stemmer等的美国专利5,811,238(1998年9月22日)“Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination”；Stemmer等的美国专利5,830,721(1998年11月3日)，“DNA Mutagenesis by Random Fragmentation and Reassembly”；Stemmer等的美国专利 5,834,252(1998年11月10日)，“End-Complementary Polymerase Reaction”；Minshull 等的美国专利5,837,458(1998年11月17日)“Methods and Compositions for Cellular and Metabolic Engineering”；WO 95/22625，Stemmer和Crameri，“Mutagenesis by Random Fragmentation and Reassembly”；WO 96/33207，Stemmer和Lipschutz，“End Complementary Polymerase Chain Reaction”；WO 97/20078，Stemmer和Crameri， “Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination”；WO 97/35966，Minshull和Stemmer，“Methods and Compositions for Cellular and Metabolic Engineerin”；WO 99/41402，Punnonen等， “Targeting of Genetic Vaccine Vectors”；WO 99/41383，Punnonen等，“Antigen Library Immunization”；WO 99/41369，Punnonen等，“Genetic Vaccine Vector Engineering”； WO 99/41368，Punnonen等，“Optimization of Immunomodulatory Properties of Genetic Vaccines”；EP 752008，Stemmer和Crameri，“DNA Mutagenesis by Random Fragmentation and Reassembly”；EP 0932670，Stemmer，“Evolving Cellular DNA Uptake by Recursive Sequence Recombination”；WO 99/23107，Stemmer等， “Modification of Virus Tropism and Host Range by Viral Genome Shuffling”；WO 99/21979，Apt等，“Human Papillomavirus Vectors”；WO 98/31837，del Cardayre 等，“Evolution of Whole Cells and Organisms by Recursive Sequence Recombination”； WO 98/27230，Patten和Stemmer，“Methods and Compositions for Polypeptide Engineering”；WO 98/27230，Stemmer等，“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection”；WO 00/00632，“Methods for Generating Highly Diverse Libraries”；WO 00/09679，“Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences；WO 98/42832， Amold等，“Recombination of Polynucleotide Sequences Using Random or Defined Primers”；WO 99/29902，Arnold等，“Method for Creating Polynucleotide and Polypeptide Sequences”；WO 98/41653，Vind，“An in Vitro Method for Construction of a DNA Library”；WO 98/41622，Borchert等，“Method for Constructing a Library Using DNA Shuffling”；以及WO 98/42727，Pati和Zarling，“Sequence Alterations using Homologous Recombination”。
【0350】在例如下列的文件中描述了可以用于实践本发明的方案(提供了关于产生不同多样性的方法的细节)，如美国专利申请系列号(USSN)09/407,800，Patten 等的“SHUFFLING OF CODON ALTERED GENES”，于1999年9月28日提交；del Cardayre等的“EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”，美国专利6,379,964；Crameri等的 “OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”，美国专利6,319,714；6,368,861；6,376,246；6,423,542；6,426,224和PCT/US00/01203； Welch等的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING”，美国专利6,436,675；Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS，POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”，2000年1月18日提交， (PCT/US00/01202)和，如Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS，POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”，2000年7月18日提交，(美国系列号09/618,579)；Selifonov 和Stemmer的“METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”，2000年1月18日提交(PCT/US00/01138)；和Affholter的“SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION”，2000年9月 6日提交(美国系列号09/656,549)；和美国专利6,177,263；6,153,410。
【0351】非随机或“定向进化”方法包括，例如饱和诱变，诸如基因位点饱和诱变(或GSSM)、合成连接重装配(SLR)或其组合，它们被用于修饰本发明的核酸，以产生具有新的或改变的特性(例如在高度酸性或碱性条件下的活性，在高温或低温的活性，等等)的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。由修饰的核酸编码的多肽可以在测试葡聚糖水解或其它活性之前被筛选活性。可以使用任何测试形式或实验方案，例如使用毛细管阵列平台。例如参见美国专利6,361,974；6,280,926；5,939,250。
基因位点饱和诱变或GSSM
【0352】本发明也提供了使用基因位点饱和诱变或GSSM制备新酶的方法，如在本文中以及美国专利6,171,820和6,579,258所述的。基因位点饱和诱变(或 GSSM)方法用于获得沿多肽每个氨基酸位点的所有可能的氨基酸改变。使用的寡聚体由同源序列、含有简并的N，N，G/T的三联体序列以及另一个同源序列组成。因此，每个寡聚体的简并性源于本文含有的N，N，G/T序列盒的简并性。从这些寡聚体的使用产生的聚合产物包括沿多肽每个氨基酸位点的所有可能的氨基酸改变，因为 N，N，G/T序列能够编码所有的20种氨基酸。如所示，独立的简并性寡聚体用于在编码多肽的多核苷酸中诱变每个密码子。
【0353】一方面，含有简并N，N，G/T序列的密码子引物被用于将点突变引入多核苷酸中，例如本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶或抗体，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出全范围的单氨基酸置换，置换发生的位置例如酶活性位点中的氨基酸残基，或将要被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列，简并N，N，G/T序列，和任选地第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N，N，G/T序列的简并性包括了所有20个氨基酸的密码子。一方面，一个这样的简并寡核苷酸(例如包括一个简并N，N，G/T序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置换。另一方面，使用至少两个简并序列盒，或在相同的寡核苷酸中或不同的寡核苷酸中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。例如，一个寡核苷酸中可以包含一个以上N，N，G/T序列，以便在多于一个的位点上引入氨基酸突变。这些多个N，N，G/T序列可以直接相邻，或被一个或多个额外的核苷酸序列分隔开。另一方面，用于引入添加和删除的寡核苷酸可以单独使用，或者与含有N，N，G/T序列的密码子组合使用，以便引入氨基酸添加、删除和/或置换的任何组合或排列组合。
【0354】一方面，两个或更多个连续氨基酸位置的同时诱变是使用含有相邻 N，N，G/T三联体的寡核苷酸进行的，即简并(N，N，G/T)n序列。另一方面，使用与 N，N，G/T序列相比具有较低简并性的简并序列盒。例如，在一些情况下，可能期望使用(例如，在寡核苷酸中)仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在该三联体的剩余两个位置上，可以使用包括任意组合和排列的任何其它碱基。可选地，在一些情况下可能期望使用(例如在寡聚体中)简并N，N，N三联体序列。
【0355】一方面，使用简并三联体(例如N，N，G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20 种氨基酸)(在可选的方面，这些方法也包括在每一氨基酸残基或密码子、位置产生少于全部的可能置换)。例如，对于100个氨基酸的多肽，可以产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)。通过使用含有简并 N，N，G/T三联体的寡核苷酸或一组寡核苷酸，32种不同序列可编码所有20种可能的天然氨基酸。因此，在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的32种不同的子代多核苷酸。相反，在定点诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷酸可以任选地与所公开的简并引物组合使用；例如，非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致终止密码子产生和多肽片段的相应表达的手段。
【0356】一方面，每一饱和诱变反应容器含有编码至少20种子代多肽(例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)分子的多核苷酸，以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置(其它方面使用了少于全部20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的宿主中，例如大肠杆菌宿主中)，并进行表达筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时，如在碱性或酸性条件下增高的葡聚糖水解活性)，可以对其测序以鉴定其中所含的相应的有利氨基酸置换。
【0357】一方面，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后，可以在超过一个的氨基酸位置确定出有利的氨基酸变化。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸置换的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化，那么出现的排列就包括每一位置上的3种可能性(从原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。
在还另一方面，位点饱和诱变可以与改组、嵌合、重组和其它诱变方法以及筛选一起使用。本发明提供了以反复的方式使用任何诱变方法(多种方法)，包括饱和诱变。在一个实例中，任何诱变方法(多种方法)的反复使用与筛选结合使用。
【0358】本发明还提供了使用专有密码子引物(含有简并N，N，N序列)将点突变引入多核苷酸中，以便产生一组子代多肽，其中在每一氨基酸位置上可表现出全范围的单氨基酸置换(基因位点饱和诱变M(或GSSM))。使用的这些寡聚体包括相邻的第一同源序列，简并N，N，N序列，以及一方面不必须包括第二同源序列。由使用这些寡聚体而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化，这是由于N，N，N序列的简并性包括了所有20个氨基酸的密码子。
【0359】一方面，一个这样的简并寡聚体(包括一个简并N，N，N序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置换。另一方面，使用至少两个简并N，N，N序列盒，或在相同的寡聚体中或不同的寡聚体中，用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。因此，一个寡聚体中可以包含一个以上N，N，N序列，以便在多于一个的位点上引入氨基酸突变。这些多个N，N，N序列可以直接相邻，或由一个或多个额外的核苷酸序列分隔开。另一方面，用于引入插入和删除的寡聚体可以单独使用，或者与含有 N，N，N序列的密码子组合使用，以便引入氨基酸插入、删除和/或置换的任何组合或排列组合。
【0360】一方面，使用含有相邻N，N，N三联体的寡聚体，即简并(N，N，N)n 序列，进行两个或更多个连续氨基酸位置的同时诱变是可能的。另一方面，本发明提供了使用与N，N，N序列相比具有较低简并性的简并序列盒。例如，在一些情况下可能期望使用(例如在寡聚体中)仅包括一个N的简并三联体序列，其中所述的N可以在三联体的第一、第二或第三位置上。在三联体的剩余两个位置上，可以使用包括任意组合和排列的任何其它碱基。可选地，在一些情况下可能期望使用 (例如在寡聚体中)简并N，N，N三联体序列、N，N，G/T或N，N，G/C三联体序列。
【0361】一方面，由于几个原因，使用如本发明公开的简并三联体(例如N，N，G/T 或N，N，G/C三联体序列)是有利的。一方面，本发明提供了在多肽中的每一和每个氨基酸位置上系统且相对容易地产生完全范围的可能的氨基酸(总共20种氨基酸) 的置换的方法。因此，对于100个氨基酸的多肽，本发明提供了系统且相对容易地产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)的方法。可以理解，通过使用含有简并N，N，G/T或N，N，G/C三联体序列的寡聚体，提供编码20种可能的氨基酸的32种不同序列。因此，在其中使用一种这样的寡聚体对亲本多核苷酸序列进行饱和诱变的反应容器中，产生了编码20种不同多肽的 32种不同的子代多核苷酸。相反，在定点诱变中使用非简并寡聚体在每个反应容器中仅仅导致一种子代多肽产物。
【0362】本发明还提供了非简并寡聚体的使用，其可以任选地与所公开的简并引物组合使用。可以理解，在一些情况中，使用非简并寡聚体在工作多核苷酸中产生特异性点突变是有利的。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的点突变的手段。
【0363】因此，在本发明的一方面，每一饱和诱变反应容器含有编码至少20 种子代多肽分子的多核苷酸，以便所有的20种氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的一个特定氨基酸位置。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的大肠杆菌宿主中)，并进行表达筛选。当单个子代多肽通过筛选鉴定，显示出有利的特性变化时(当与亲本多肽相比时)，可以对其测序以鉴定其中所含的相应的有利氨基酸置换。
【0364】一方面，如本文所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后，可以在一个以上的氨基酸位置确定出有利的氨基酸变化。可以产生一个或多个新的子代分子，其含有所有或部分这些有利的氨基酸置换的组合。例如，如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化，那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性，以及两个有利变化中的每一个的可能性)和3个位置。因此，总共有3×3×3或27种可能性，其中包括了先前被检验的7种可能性，即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。
【0365】本发明提供了结合另外的诱变方法使用饱和诱变，例如其中两个或更多个相关多核苷酸被引入合适的宿主细胞的方法，以便通过重组和还原性重配产生杂合多核苷酸。
【0366】除了沿着基因的全序列进行诱变之外，本发明提供了：诱变可用于替代多核苷酸序列中任意数量的碱基的每一个，其中待被诱变的碱基的数量在一个方面为从15至100,000中的每一个整数。因此，并不是沿着分子诱变每一个位置，可以对每一个或独立数目的碱基(在一个方面总共为15至100,000的亚组)进行诱变。一方面，单独的核苷酸被用于沿着多核苷酸序列诱变每一个位置或一组位置。待被诱变的一组3个位置可以是密码子。使用诱变引物可以引入突变，该诱变引物含有异源序列盒，也称为诱变序列盒。示例性的序列盒可以具有1至500个碱基。在这样的异源序列盒中每一个核苷酸位置可以是N、A、C、G、T、A/C、A/G、 A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E，其中E是非A、C、 G或T的任何碱基(E可以被称为设计者寡聚体(designer oligo))。
【0367】一方面，饱和诱变包括诱变有待诱变的限定多核苷酸序列(其中待诱变的序列长度一方面为约15至100,000个碱基)中的一整组诱变序列盒(其中每一个序列盒的长度一方面为约1-500个碱基)。因此，一组突变(范围从1至100 个突变)被引入每一个待诱变的序列盒。在应用一轮饱和诱变的过程中，一组待被引入到一个序列盒的突变可以与第二组待被引入到第二个序列盒的突变不同或相同。这样的分组通过缺失、插入、特定密码子的分组以及特定核苷酸序列盒的分组加以例示。
【0367a】一方面，待被诱变的限定序列包括全基因、通路、cDNA、整个开放阅读框(ORF)以及整个启动子、增强子、阻抑物/反式激活蛋白、复制起点、内含子、操纵子或任何多核苷酸功能组。通常，为了此目的，“限定序列(defined sequence)”可以是15个碱基多核苷酸序列的任何多核苷酸以及长度在15个碱基至 15,000个碱基之间的多核苷酸序列(本发明特别指出中间的每一个整数)。选择密码子分组时的考虑因素包括由简并诱变序列盒编码的氨基酸的类型。
【0368】一方面，可被引入到诱变序列盒中的突变分组，本发明特别提供了在每一个位置编码2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19和20种氨基酸的简并密码子置换(使用简并寡聚体)以及由此编码的多肽文库。
合成连接重装配(SLR)
【0369】本发明提供了非随机的基因修饰系统，命名为“合成连接重装配”或简单地称作“SLR”，这是一种“定向进化方法”，产生具有新的或改变的特性的多肽，例如本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶或本发明的抗体。
【0370】SLR是将寡核苷酸片段非随机地连接在一起的一种方法。该方法与随机寡核苷酸改组不同的地方在于，核酸构件(building blocks)没有被随意地改组、连接或嵌合，而是被非随机地装配。参见例如美国专利6,773,900；6,740,506； 6,713,282；6,635,449；6,605,449；6,537,776。一方面，SLR包括下述步骤：(a)提供模板多核苷酸，其中模板多核苷酸包含编码同源基因的序列；(b)提供多个构件多核苷酸，其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-over reassemble)，所述构件多核苷酸包含作为同源基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列；(c)将构件多核苷酸与模板多核苷酸组合在一起，以便构件多核苷酸与模板多核苷酸交换重装配，以产生包含同源基因序列变异的多核苷酸。
【0371】SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此，该方法可以被用于非随机地产生包括超过10100个不同嵌合体的子代分子的文库 (或集合)。SLR可以被用于产生包括超过101000个不同子代嵌合体的文库。因此，本发明的一些方面包括产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。
【0372】将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序结合的话。因此，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定的。如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面，用酶例如连接酶(例如T4 DNA连接酶)处理退火的构件片段，以实现构件片段的共价结合。
【0373】一方面，寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得，所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源，它们在将被诱变例如被嵌合或改组的核酸构件的设计中有帮助。在该方法的一个方面，多个亲本核酸模板的序列被联配，以便选择一个或多个分界点。这些分界点可以位于同源区域，由一个或多个核苷酸构成。这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界，以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可选地，分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域，或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地，一方面，有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域，或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。一方面，分界点是由所有亲本多核苷酸序列分享的同源区域。
【0374】一方面，连接再装配过程被彻底地进行，以便产生含有尽可能多的子代嵌合多核苷酸的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，另一方面，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)遵循如上所述的设计(或非随机地)。由于本发明的非随机特性，大大地降低了不需要的副产品的可能性。
【0375】另一方面，连接再装配方法被系统地进行。例如，实施该方法，以便产生子代分子的系统区分化的文库，该文库分成能被系统地筛选的数个部分，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种设计可以实现，即可以在各个反应容器中制备出各自特定的一组子代产物。这样的设计允许进行系统的检查和筛选步骤。因此，这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性，所产生的子代分子一方面包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到，本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步，应该意识到，就本发明的可操作性而言，对分子间同源性的要求大大地放宽了。事实上，甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如，由于密码子的摆动，即密码子的简并性，可以将核苷酸取代引入核酸构件，同时又不会改变在相应的祖先模板中最初编码的氨基酸。可选地，可以改变密码子，从而改变对原始氨基酸的编码。在本发明中，这样的取代可以被引入到核酸构件中，以便增加分子间同源分界点的发生率，从而使得在构件之间可获得的偶联的数量增加，而这又允许产生更多数量的子代嵌合分子。
合成基因重装配
【0376】一方面，本发明提供了非随机的方法，命名为合成基因重装配，其在一定程度上与随机改组相关，只是核酸构件不随机改组、连接或嵌合，而是被非随机地装配。参见例如美国专利6,537,776。
【0377】合成基因重装配法不依赖于将被改组的多核苷酸之间存在高度同源性。本发明可以被用于非随机地产生包括超过10100个不同嵌合体的子代分子的文库(或集合)。可以想象地，合成基因重装配可以被用于产生包括超过101000个不同子代嵌合体的文库。
【0378】因此，一方面，本发明提供了产生一组最终嵌合的核酸分子的非随机方法，所述最终嵌合的核酸分子具有按设计所选择的整个装配次序，该方法包括按设计产生多个特异性核酸构件的步骤，以及装配这些核酸构件的步骤，这样可获得依设计而定的整个装配次序，所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。
【0379】将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”，如果它们能使这些构件以预定次序结合的话。因此，一方面，核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定，并且如果使用多于一个的装配步骤，那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。在本发明的一方面，用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段，以实现结构片段的共价结合。
【0380】另一方面，核酸构件的设计通过分析一组祖先核酸模板的序列来获得，所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些祖先核酸模板因此作为序列信息的来源，它们有助于设计将被诱变即被嵌合或改组的核酸构件。
【0381】在一个示例中，本发明提供了相关基因的家族和它们编码的相关产物的家族之间的嵌合。在具体的示例中，编码的产物是酶。根据本文描述的方法，本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶可以被诱变。
【0382】因此，根据本发明的一个方面，多个祖先核酸模板序列(例如本发明的多核苷酸)被联配，以便选择一个或多个分界点，这些分界点可以位于同源区域。这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界。因此，在祖先分子中鉴定和选择的分界点作为子代分子的装配中的潜在嵌合点。
【0383】一方面，有用的分界点是由至少两个祖先模板分享的同源区域(包括至少一个同源核苷酸碱基)，但分界点可以是由至少一半的祖先模板、至少三分之二的祖先模板、至少四分之三的祖先模板以及一方面可以是由几乎所有的祖先模板分享的同源区域。甚至仍在一方面，有用的分界点是由所有祖先模板分享的同源区域。
【0384】一方面，基因再装配过程被彻底地进行，以便产生含有尽量可能多的文库。换句话说，核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时，在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)是设计的(或非随机地)。由于本发明的非随机特性，大大地降低了不需要的副产品的可能性。
【0385】另一方面，基因再装配过程在所述方法中被系统地进行，以便例如产生子系统区分化的文库，该文库分成能被系统地筛选的数个部分，例如可以逐个地筛选。换句话说，通过选择性的和审慎的应用特定的核酸构件，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种实验设计可以实现，即在其中可以在各个反应容器中制备出特定的一组子代产物。这样的设计允许进行系统的检查和筛选步骤。因此，这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。
【0386】由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，本发明可以产生包含大量子代分子的文库(或集合)。由于本发明的基因再装配的非随机特性，所产生的子代分子一方面包含有最终嵌合核酸分子的文库，这些核酸分子具有按设计而选择的总装配次序。在具体方面，这样的所产生的文库包括大于103至大于101000种不同的子代分子种类。
【0387】一方面，如所述产生的一组最终嵌合的核酸分子包括编码多肽的多核苷酸。根据一方面，该多核苷酸是基因，其可以是人造基因。根据另一方面，该多核苷酸可以是基因通路，其可以是人造基因通路。本发明产生的一种或更多种人造基因在本发明中可以整合入人造基因通路，例如在真核生物体(包括植物)中可操纵的通路。
【0388】在另一个示例中，产生构件的步骤的合成属性允许设计和引入核苷酸 (例如一个或多个核苷酸，例如可以是密码子或内含子或调控序列)，这些核苷酸随后可以在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪接能力)被任选地去除。应该意识到，在许多情况下，除了产生有用的分界点的潜在好处之外，还有许多其它原因也使得可能期望引入这些核苷酸。
【0389】因此，根据另一方面，本发明提供了核酸构件可用于引入内含子。因此，本发明提供了功能性内含子可被引入到本发明的人造基因中。本发明还提供了功能性内含子可被引入本发明的人造基因通路中。因此，本发明提供了嵌合多核苷酸的产生，该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因。
【0390】本发明还提供了嵌合多核苷酸的产生，该嵌合多核苷酸是含有一个(或多个)人工引入的内含子的人造基因通路。一方面，人工引入的内含子在一种或多种宿主细胞的基因剪接中发挥作用，其发挥作用的方式与天然发生的内含子在基因剪接中发挥作用的方式在很大程度上是相同的。本发明提供了产生含人造内含子的多核苷酸的方法，该多核苷酸将被引入宿主生物体中，用于重组和/或剪接。
【0391】使用本发明产生的人造基因也可作为底物发挥作用，用于与另一核酸重组。同样，使用本发明产生的人造基因途径也可作为底物发挥作用，用于与另一核酸重组。一方面，重组由人造的含内含子基因和作为重组伙伴的核酸之间的同源区域促进，或发生在人造的含内含子基因和作为重组伙伴的核酸之间的同源区域。一方面，重组伙伴也可以是本发明产生的核酸，包括人造基因或人造基因途径。重组可以由人造基因中一个(或多个)人工引入的内含子上存在的同源区域促进，或发生在由人造基因中一个(或多个)人工引入的内含子上存在的同源区域中。
【0392】一方面，本发明的合成基因再装配方法使用多种核酸构件，其每一种一方面具有两个可连接末端。在每一个核酸构件上的两个可连接末端可以是两个平端(即，每一个末端具有零个核苷酸的突出)，或者一方面可以是一个平端和一个突出端，或者更多的在一方面可以依然是两个突出端。一方面，用于该目的的一个有用的突出端可以是3′突出端或5′突出端。因此，核酸构件可以具有一个3′突出端或可选地具有一个5′突出端或可选地具有两个3′突出端或可选地具有两个5′突出端。核酸构件被装配来形成最终嵌合的核酸分子的整个装配次序通过有目的试验设计确定并且是非随机的。
【0393】一方面，通过化学合成两个单链核酸(也称为单链寡聚体)并使它们接触以便允许它们退火形成双链核酸构件来生成核酸构件。双链核酸构件可以具有不同的大小。这些构建的大小可以是小的或大的。构件的示例性大小在1个碱基对(不包括任何突出端)至100,000个碱基对(不包括任何突出端)之间。还提供了其它示例性大小范围，其具有1bp至10,000bp(包括中间的每一个整数)的下限和2bp至 100,000bp(包括中间的每一个整数)的上限。
【0394】存在许多方法，通过这些方法，可以产生可用于本发明的双链核酸构件；并且这些方法在本领域中是已知的，且普通技术人员容易进行。根据一个方面，通过首先产生两个单链核酸并使它们退火形成双链核酸构件，从而产生双链核酸构件。双链核酸构件的两条链可以在每个核苷酸处互补，除了形成突出端的任何一个核苷酸；从而除了任何突出端外不含有错配。根据另一方面，双链核酸构件的两条链可以在比除了形成突出端的任何核苷酸外的每个核苷酸更少的核苷酸处互补。因此，根据一方面，双链核酸构件可用于引入密码子简并性。一方面，使用本文描述的位点饱和诱变，使用一个或多个N，N，G/T序列盒，或者可选地，使用一个或多个N，N，N序列盒，引入密码子简并性。
【0395】本发明的体内重组方法可以在未知杂合体或具体多核苷酸或序列的等位基因的库上进行盲试。然而，不必知道所述具体多核苷酸的实际DNA或RNA序列。采用混合基因群内的重组的方法可用于产生任何有用的蛋白质，例如本发明的纤维素酶或其变体。该方法可用于产生具有改变的特异性或活性的蛋白质。该方法还可以用于产生杂合核酸序列，例如，基因的启动子区、内含子、外显子、增强子序列、 3’非翻译区或5’非翻译区。因此，该方法可用于产生具有增加的表达速率的基因。该方法在研究重复DNA序列中也是有用的。最后，该方法可用于制备本发明的核酶或适体。
【0396】一方面，本文中描述的发明涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用，其使得可以通过重组实现高度复杂的线性序列例如 DNA、RNA或蛋白质的定向分子进化。
优化的定向进化系统
【0397】本发明提供了一种非随机的基因修饰系统，命名为“优化的定向进化系统”，其可以用来产生具有新的或者改变的性质的多肽，如本发明的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶或者抗体。一方面，优化的定向进化涉及还原性重配、重组和选择的重复循环应用，其使得可以通过重组实现核酸的定向分子进化。
【0398】优化的定向进化允许产生大量的进化得到的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
【0399】此外，这一方法与其它系统相比，提供了一种用于探究巨大数量的可能蛋白变体空间的方便手段。以前，例如，如果在反应中产生了1013个嵌合分子，测试这样大数目的嵌合突变体的特定活性将会非常困难。此外，子代群体的相当部分将具有很高数目的遗传交换事件，其中得到的蛋白较不大可能具有增高水平的特定活性。通过应用这些方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此，尽管在反应中可以仍然产生1013嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可能偏向于具有预定数目的遗传交换事件，所以嵌合分子之间的功能多样性的界限缩小了。当要计算在最初的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时，这便提供了更加可控数目的变量。
【0400】产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸一方面包括独特的重叠区域，这样把所述寡核苷酸混合在一起，得到具有以正确顺序装配的每个寡核苷酸片段的新的变体。可选地，实践本发明的方法的方案可以在美国专利6,773,900；6,740,506；6,713,282； 6,635,449；6,605,449；6,537,776；6,361,974中找到。
【0401】对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如，为了发现如在高温下具有更高活性的嵌合变体，可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子，对应于每一个亲本变体的每一部分可以产生总共50个寡核苷酸序列。相应地，在连接再装配过程中，在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中，有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接，而不导致遗传交换事件。如果在这一例子的任何连接步骤中，来自每一个亲本的每一种寡核苷酸的浓度都保持不变，那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将在嵌合序列内连接而不产生交换。
【0402】因此，可以确定概率密度函数(PDF)，来预测在一个连接反应的每一步中可能发生的遗传交换事件的总数，其中给出了一套许多的亲本变体、对应于每种变体的许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法，可以计算这样的概率密度函数，而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外，可以预先确定遗传交换事件的目标数目，然后对该系统进行程序化，以计算在该连接反应的每一个步骤中，每种亲本寡核苷酸的起始量，从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用，使得能够通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点，在这里，从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般是在两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
【0403】此外，这些方法与其它系统相比，提供了一种用于探究巨大数量的可能蛋白变体空间的方便手段。通过应用在这里描述的方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此，尽管在反应中可以仍然产生 1013个嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件，所以造成嵌合分子之间的功能多样性的界限减少。当计算出在最初的亲本多核苷酸中的哪一个多核苷酸可能影响到特定的性质时，便提供了更加可控数目的变量。
【0404】一方面，该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸，产生嵌合子代多核苷酸序列。一方面，每一个寡核苷酸包括独特的重叠区域，这样把所述寡核苷酸混合在一起，得到每一寡核苷酸片段以正确顺序装配的新的变体。还参见美国专利6,773,900；6,740,506；6,713,282；6,635,449；6,605,449； 6,537,776；6,361,974。
确定交换事件
【0405】本发明的多个方面包括系统和软件，它们接收所需的交换概率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入值。该程序输出是“片段PDF”，它可以用于确定用于产生重新装配的基因和那些基因的估计的交换PDF的方案。在此描述的过程一方面在MATLABTM(The Mathworks， Natick，Massachusetts)中进行，MATLABTM是一种用于技术计算的程序语言和开发环境。
迭代处理
【0406】本发明的任何过程(方法)可以被迭代重复，例如，编码本发明的改变的或者新的纤维素酶表型例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶表型的核酸，可以被鉴定、再分离、再修饰、再测试其活性。这一过程可以迭代重复，直到所期望的表型被工程化改造。例如，完整的生物化学合成代谢或分解代谢途径可以被工程化到细胞中，例如包括木质纤维素酶活性的细胞。
【0407】类似地，如果确定了某特定寡核苷酸对于所期望的特性(例如新的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶表型)根本不会造成影响，则可以通过合成包括待除去的序列的更大的亲本寡核苷酸，从而将这段序列作为变量除去。由于将这一序列合并到更大的序列中避免了任何遗传交换事件，所以在子代多核苷酸中，这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系，以及哪些与所需的性质无关的重复实践，可以更有效地探寻所有可能的可能提供特定性质或者活性的蛋白变体。
体内改组
【0408】在多个方面，分子的体内改组在本发明的方法中使用，以提供本发明的多肽的变体，例如本发明的抗体、本发明的纤维素酶例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶以及类似物。体内改组可以利用重组多聚体的细胞的天然特性进行。尽管体内重组已经提供了分子多样性的主要天然途径，但遗传重组仍然是一种相对复杂的过程，该过程涉及1)同源性识别；2)链切割，链侵入，和导致产生重组交叉 (recombination chiasma)的代谢步骤；和最后3)交叉消除，得到分离的重组分子。交叉的形成需要同源序列的识别。
【0409】另一方面，本发明包括一种方法，用于由至少第一多核苷酸和第二多核苷酸产生杂合多核苷酸。本发明可被用于产生杂合多核苷酸，这通过将至少第一多核苷酸和第二多核苷酸(例如一种或两种，其为示例性的本发明编码木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的序列)引入到合适的宿主细胞中实现，所述至少第一多核苷酸和第二多核苷酸共享具有部分序列同源性的至少一个区域。部分序列同源的区域促进了导致产生杂合多核苷酸的序列再组织的过程。如本文所用，术语“杂合多核苷酸”是从本发明的方法产生的任何核苷酸序列，并且含有来自至少两个原始多核苷酸序列的序列。这样的杂合多核苷酸可以来自可促进DNA分子间序列整合的分子间重组事件。此外，这样的杂合多核苷酸可以来自分子内还原重配过程，该过程利用重复序列来改变DNA分子内的核苷酸序列。
【0410】一方面，体内重装配集中在“分子间”的过程上，统称为“重组”，在细菌中，它一般被视为是“RecA-依赖性”现象。本发明可以依赖于宿主细胞的重组过程来重组和重装配序列，或者依赖于细胞介导还原过程的能力，通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过“分子内的”、RecA-依赖过程而发生。
【0411】在本发明的另一方面，通过还原性重装配过程，产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物，它们插入到合适的载体中，并且然后将它们引入到合适的宿主细胞。单个分子同一性的重装配通过在构建物中具有同源性区域的连续序列间的组合过程，或者准-重复单位间的组合过程而发生。重装配过程重组和/或降低重复序列的复杂性和程度，并且导致产生新型的分子种类。可以应用各种处理来提高重装配效率。这些处理可以包括用紫外光，或者损坏DNA的化学试剂处理，和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此，这样的重装配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。
【0412】重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。在本发明中，“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的阵列出现；以相似序列的连续单元出现。一旦连接，在连续序列之间的连接处变得基本上不可见，并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板库，在模板上可以发生滑移事件。一方面，含有准重复的构建物因此有效地提供了足够的分子弹性，缺失(和潜在的插入)事件几乎可以在准重复单元内的任何地方发生。
【0413】当准重复序列全部以相同方向连接，例如，头对尾或者反之亦然，细胞就不能区别各个单元。因此，还原过程可以在整个序列中发生。相反地，例如，当所述单元以头对头存在，而不是头对尾，倒置勾画了相邻单元的末端，这样缺失的形成将有利于不连续单元的失去。因此，本方法优选的是序列处于相同的方向。准重复序列的随机定向将会导致重装配效率的损失，而序列的一致定向将提供最高的效率。然而，虽然具有较少的相同方向的连续序列降低了效率，但是仍然可以为新型分子的有效回收提供足够的弹性。可以用相同定向以允许更高效率的准重复序列制备构建物。
【0414】应用各种方法中的任何一种，序列可以以头对尾的定向进行装配，包括以下方法：
a)可以使用包括poly-A头和poly-T尾的引物，当制成单链时，包括poly-A 头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成，而且因此用RNaseH容易去除。
b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。
c)引物的内部少数碱基可以被硫醇化，并且用外切酶来产生合适的具有尾巴的分子。
【0415】一方面，重装配序列的回收依赖于具有减低的重复指数(RI)的克隆载体的确定。被重装配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有减低的RI的克隆载体的回收可以通过如下实现：
1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。
2)通过物理方法对缩短的载体进行物理回收。在这一情况下，克隆载体将应用标准的质粒分离程序进行回收，或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。
3)插入物的大小下降时，对含有可以选择的断裂基因的载体进行回收。
4)应用表达载体以及适当的选择，使用定向选择技术。
【0416】相关的生物体的编码序列(例如，基因)可以表现出高度的同源性，并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而，尽管下面所描述的例子证明了几乎相同的起始编码序列(准-重复) 的再装配，这一过程并不限于这种几乎相同的重复。
【0417】下面的例子说明了本发明的示例性方法。描述了来自三个(3)独特种的编码性核酸序列(准-重复)。每一序列编码具有一组不同特征的蛋白质。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的装配体中，以便所有可能的排列和组合可以在连接的分子群体中可获得。准-重复单位的数目可以通过装配条件来控制。在构建物中，准-重复单位的平均数目被定义为重复指数(RI)。
【0418】一旦形成，构建物可以按照，或可以不按照已公开的方法在琼脂糖凝胶上按大小分离，插入到克隆载体，并且转染到合适的宿主细胞中。然后细胞进行繁殖，并且进行“还原性重装配”。如果需要，还原性重装配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导，还是通过“分子间”的机制由类似重组的事件来介导是不重要的。最终的结果是分子被重装配，得到所有可能的组合。
【0419】任选地，本方法包括额外的步骤，即对改组库的文库成员进行筛选，以鉴定个别的改组文库成员——其具有与一种预定的大分子如蛋白质受体、寡糖、病毒颗粒或者其它的预定的化合物或者结构结合或者另外地相互作用，或者催化特定的反应(如，酶的催化结构域)的能力。
【0420】从这样的文库所鉴定得到的多肽可以用于治疗、诊断、研究和相关目的(例如，催化剂，用于增加水溶液的渗透性的溶质等等)和/或可以进行改组和/ 或选择的一个或者多个另外的循环。
【0421】在另一方面，可以预见，在重组或重装配之前，或者在重组或重装配的过程中，通过本发明的方法产生的多核苷酸可以用试剂或方法处理，这些试剂或方法促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的所述试剂或方法可以包括，但不限于： (+)-CC-1065，或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley， (1992)；能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物 (参见例如，van de Poll等(1992))；或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也参见，van de Poll等(1992)，751-758页)；三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物，如7- 溴甲基-苯[a]蒽(“BMA”)、三(2，3-二溴丙基)磷酸盐(“Tris-BP”)、1，2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7，8-二氢二醇-9-10-环氧化物 (“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑并[4，5-f]-喹啉(“N-羟基-IQ”) 和N-羟基-2-氨基-1-甲基-6-苯基咪唑并[4，5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的示例性方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别考虑的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA 加合物的多核苷酸，在进一步的处理前，其可以通过包括加热含有所述多核苷酸的溶液的过程被释放或者去除。
【0422】另一方面，本发明涉及产生具有生物活性的重组蛋白的方法，其通过在根据本发明产生杂合或再装配多核苷酸的条件下处理含有编码野生型蛋白的双链模板多核苷酸的样品进行。
产生序列变体
【0423】本发明也提供了用于制备本发明核酸(例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)序列的序列变体的其它方法。本发明也提供了使用本发明的核酸和多肽分离木质纤维素酶的其它方法。一方面，本发明提供本发明木质纤维素酶编码序列(例如基因、cDNA或信息)的变体，其可以通过任何方法来改变，包括例如如上所述的随意或随机方法、或非随机或“定向进化” 方法。
【0424】被分离的变体可以是天然发生的。变体也可以在体外产生。变体也可以应用基因工程技术来产生，如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选地，可以应用化学合成或者修饰方法来产生这样的变体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变体的其它方法。这些方法包括这样的程序，其中，从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸，所述的特征增加这些多肽在工业实验室应用中的价值。在这样的程序中，大量的变体序列被获得和表征，这些变体序列与从天然分离物中得到的序列相比，具有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离物的核酸编码的多肽的氨基酸变化。
【0425】例如，变体可以通过使用易错PCR产生。一方面，在易错PCR中， PCR在DNA聚合酶的复制保真性低的情况下进行，这样便在全长的PCR产物中得到高的点突变率。易错PCR在例如，Leung(1989)Technique 1：11-15和Caldwell (1992)PCR Methods Applic.2：28-33中描述。简要地说，在这样的程序中，待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适当浓度的dNTP 混合，从而在全长的PCR产物中得到高的点突变率。例如，反应可以使用20fmol 待诱变的核酸进行，每种PCR引物30pmol，反应缓冲液包含50mM KCl、10mM Tris HCl(pH8.3)和0.01％明胶、7mM MgCl2、0.5mM MnCl2、5单位的Taq聚合酶、 0.2mM dGTP、0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环，每个循环为94℃ 1min；45℃ 1min；和72℃ 1min。然而，应该意识到，这些参数可以适当地变化。诱变的核酸被克隆到一个适当的载体，并评价由诱变核酸编码的多肽的活性。
【0426】一方面，变体也可以用寡核苷酸诱导的定向诱变产生，以在任何感兴趣的克隆DNA中产生位点特异性的诱变。寡核苷酸诱变在，例如，Reidhaar-Olson (1988)Science 241：53-57中描述。简要地说，在这样的程序中，合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡核苷酸，并将这些寡核苷酸插入到待诱变的克隆的DNA中。一方面，含有诱变DNA的克隆被回收、表达并评估它们编码的多肽的活性。
【0427】另一种产生变体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生，一个反应的产物引发另一个反应的产物。装配PCR已经被描述，例如在美国专利 5,965,408中。
【0428】一方面，有性PCR诱变是产生本发明变体的示例性方法。在有性PCR 诱变的一个方面，由于基于序列同源性的DNA分子随机片段化，在不同的但是高度相关的DNA序列的DNA分子之间，在体外强行发生同源重组，然后通过PCR 反应的引物延伸，交换得到固定。有性PCR诱变在，例如，Stemmer(1994)Proc. Natl.Asad.Sci.USA 91：10747-10751中描述。简要地说，在这样的程序中，多个待重组的核酸用DNase消化，产生具有50-200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段，并重悬于PCR混合物中。在有利于核酸片段之间发生重组的条件下进行PCR反应。例如，PCR可以这样进行：将纯化的片段以 10-30ng/μl的浓度重悬于含有0.2mM的每种dNTP、2.2mM MgCl2、50mM KCl、 10mM的Tris-HCl，pH 9.0以及0.1％的Triton X-100的溶液中。以100∶1的比例在反应混合物中加入2.5单位的Taq聚合酶，用以下的方案进行PCR：94℃60秒， 94℃30秒，50-55℃30秒，72℃30秒(30-45次)，然后72℃进行5分钟。然而，可以意识到，这些参数可以进行适当的变化。在一些方面，寡核苷酸可以被包括在该PCR反应中。在其它方面，DNA聚合酶I的Klenow片段可以用于第一组PCR 反应，而Taq聚合酶可以用于后续组的PCR反应。重组序列被分离，并评估它们编码的多肽的活性。
【0429】一方面，变体也可以通过体内诱变产生。在一些方面，感兴趣的序列中的随机突变通过在细菌菌株中增殖该感兴趣的序列而产生，所述细菌菌株例如在一个或者多个DNA修复途径中携带突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的增殖，最终可在DNA中产生随机突变。适于在体内诱变中应用的突变菌株在，例如，PCT公开号WO 91/16427中有描述，其在1991年10月31日公开，名称为“Methods for Phenotype Creation from Multiple Gene Populations”。
【0430】变体也可以通过应用盒式诱变产生。在盒式诱变中，双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“序列盒”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。
【0431】递归整体诱变也可以用于产生变体。递归整体诱变是一种用于蛋白质工程(蛋白诱变)的算法，它的开发是为了产生表型相关的突变体组成的多样性群体，其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式序列盒式诱变。递归整体诱变在如Arkin(1992)Proc.Natl.Acad.Sci.USA 89：7811-7815中描述。
【0432】在一些方面，用指数整体诱变产生变体。指数整体诱变是一个用于产生具有高百分比的独特且具功能性的突变体的组合文库的过程，其中少部分的残基被平行随机化，以在每一个被改变的位置确认产生功能性蛋白的氨基酸。指数整体诱变在如Delegrave(1993)Biotechnology Res.11：1548-1552中描述。随机和定点诱变在如Arnold(1993)Current Opinion in Biotechnology 4：450-455中描述。
【0433】在一些方面，变体利用改组方法产生，其中编码不同多肽的多个核酸的部分被融合在一起，产生编码嵌合多肽的嵌合核酸序列，如在美国专利 5,965,408，其提交于1996年7月9日，名称为“Method of DNA Reassembly by Interrupting Synthesis”；以及美国专利5,939,250，其提交于1996年5月22日，名称为“Production of Enzymes Having Desired Activities by Mutagenesis”中描述。
【0434】本发明的多肽的变体可以是这样的变体，其中本发明序列的多肽的一个或多个氨基酸残基被保守或非保守氨基酸残基(一方面，保守氨基酸残基)置换；这样置换的氨基酸残基可以是由遗传密码编码或不由其编码的氨基酸(例如置换可以使用合成的残基)。
【0435】一方面，保守置换是那些在多肽中一个给定的氨基酸被另一个具有类似特性的氨基酸取代的置换。一方面，本发明的保守置换可包括任何一种下列的替代：脂肪族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸用另一个脂肪族氨基酸替代；丝氨酸用苏氨酸替代，或苏氨酸用丝氨酸替代；酸性残基如天冬氨酸和谷氨酸用另一个酸性残基替代；具有酰胺基团的残基，如天冬酰胺和谷氨酰胺用另一个具有酰胺基团的残基替代；碱性残基如赖氨酸和精氨酸用另一个碱性残基来交换；芳香族残基如苯丙氨酸、酪氨酸用另一个芳香族残基替代。
【0436】其它变体是那些在本发明的多肽的一个或多个氨基酸残基中包括有取代基的变体。一方面，其它变体是那些与别的化合物联接的多肽，所述化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)。额外的变体是那些其中额外的氨基酸被融合到多肽上的那些变体，例如前导序列、分泌序列、蛋白原序列或有助于多肽的纯化、富集或稳定的序列。
【0437】在一些方面，片段、衍生物和类似物保持了与本发明的多肽的相同的生物功能或活性。在其它方面，片段、衍生物或类似物包括蛋白原，这样，片段、衍生物或类似物可以通过蛋白原部分的切割来激活，以产生活性多肽。
优化密码子以便在宿主细胞中获得高水平的蛋白表达
【0438】本发明提供了修饰编码木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸来修改(例如优化)密码子使用的方法。一方面，本发明提供了修饰编码木质纤维素酶的核酸中的密码子来增加或者降低其在宿主细胞中的表达的方法。本发明也提供了编码木质纤维素酶的核酸，该核酸经过修饰从而增加其在宿主细胞中的表达，经过这样的修饰的木质纤维素酶，以及制备修饰的木质纤维素酶的方法。该方法包括鉴定编码木质纤维素酶的核酸中的“非优选的”或“较不优选的”密码子，并且用编码相同氨基酸的“优选密码子”作为替换密码子替换一个或者多个这些非优选或者较不优选的密码子，并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基因的编码序列中过度表现(较多使用)的密码子，而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中表现不足(较少使用)的密码子。
【0439】用于表达本发明的核酸、表达盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞(参见上文讨论)。因此，本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸，以及由所述的密码子被改变的核酸编码的多肽。示例性的宿主细胞包括细菌，如埃希氏菌属、乳球菌属、沙门氏菌属、链霉菌属、假单胞菌属、葡萄球菌属或杆菌属的任何种，包括例如大肠埃希氏菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、加氏乳酸杆菌 (Lactobacillus gasseri)、乳脂乳球菌(Lactococcus cremoris)、枯草芽胞杆菌(Bacillus subtilis)、仙人掌杆菌(Bacillus cereus)、鼠伤寒沙门氏菌(Salmonella typhimurium)、荧光假单胞菌(Pseudomonas fluorescens)。示例性的宿主细胞也包括真核生物体，例如各种真菌例如酵母，如毕赤酵母属、酵母属、裂殖酵母属(Schizosaccharomyces)、克鲁维酵母属(Kluyveromyces)、汉森酵母属(Hansenula)、曲霉菌属(Aspergillus) 或许旺酵母属(Schwanniomyces)的任何种，包括巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha) 或丝状真菌，例如木霉属(Trichoderma)、曲霉菌属的某种(Aspergillus sp.)，包括黑曲霉(Aspergillus niger)，和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此，本发明也包括在这些生物体和物种中表达被优化的核酸和多肽。
【0440】例如，从细菌细胞中分离出的编码木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶的核酸的密码子被修饰，以便该核酸在不同于获得该木质纤维素酶的细菌的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中被优化地表达。优化密码子的方法在本领域是已知的，参见如，美国专利5,795,737；Baca(2000)Int.J.Parasitol.30：113-118；Hale(1998)Protein Expr.Purif. 12：185-188；Narum(2001)Inect.Immun.69：7250-7253。也参见Narum(2001)Infect. Immun.69：7250-7253，描述了在小鼠系统中优化密码子；Outchkourov(2002)Protein Expr.Purif.24：18-24，描述了在酵母中优化密码子；Feng(2000)Biochemistry 39： 15399-15409，描述了在大肠杆菌中优化密码子；Humphreys(2000)Protein Expr.Purif 20：252-264，描述了大肠杆菌中优化影响分泌的密码子使用。
转基因非人动物
【0441】本发明提供了转基因非人动物，其包含本发明的核酸、多肽(例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)、表达盒或载体或转染细胞或转化细胞。本发明也提供了产生和应用这些转基因非人动物的方法。
【0442】转基因非人类动物可以是，例如包含本发明的核酸的狗、山羊、兔、绵羊、猪(包括所有的猪(swine)、公猪和相关动物)、牛、大鼠和小鼠。这些动物可以用作例如体内模型来研究木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶的活性，或者作为模型来在体内筛选改变木质纤维素酶的活性的试剂。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的，或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。
【0443】转基因非人动物可以应用本领域任何已知的方法设计和产生；参见，如，美国专利6,211,428；6,187,992；6,156,952；6,118,044；6,111,166；6,107,541； 5,959,171；5,922,854；5,892,070；5,880,327；5,891,698；5,639,940；5,573,933； 5,387,742；5,087,571，它们描述了制造和应用转化的细胞和卵以及转基因小鼠、大鼠、兔、羊、猪和牛。也参见例如，Pollock(1999)J.Immunol.Methods 231：147-157，描述了在转基因奶牛动物的乳汁中生产重组蛋白；Baguisi(1999)Nat.Biotechnol. 17：456-461，描述了转基因山羊的产生。美国专利6,211,428，描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利 5,387,742，描述了将克隆的重组子或者合成的DNA序列注射至小鼠受精卵中，移植注射的卵至假孕的雌鼠中，并生长成为转基因小鼠。美国专利6,187,992，描述了制备和应用转基因小鼠。
【0444】“基因敲除动物”也可以被用于实践本发明的方法。例如，一方面，本发明的转基因或修饰动物包括“基因敲除动物”，例如“基因敲除小鼠”，其被进行了工程改造以至于不表达内源基因，该基因被表达本发明木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的基因或表达包含本发明的木质纤维素酶的融合蛋白的基因代替。
转基因植物和种子
【0445】本发明提供了转基因植物和种子(以及源自它们的植物部分，包括例如果实、根等等)，其包含本发明的核酸、多肽(例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)、表达盒、载体和/或转染或转化的细胞。
【0446】本发明提供了包括本发明核酸的转化、转导、感染和转基因植物，以及使用这些植物实践本发明，例如从植物或植物部分包括整株植物、植物废料、植物副产品、植物部分(例如叶、茎、花、根等等)、植物原生质体、种子和植物细胞和后代及其细胞培养物来产生生物燃料和/或醇或糖。一方面，用于实践本发明的植物种类——其包括本发明的细胞和植物以及方法——的范围与可用于转化技术的高等植物种类的范围一样宽，其包括被子植物(单子叶的(单子叶植物)和双子叶的(双子叶植物)植物)，以及裸子植物；包括多种倍性水平的植物，其包括多倍体、双倍体、单倍体和半合子状态。
【0447】本发明也提供了包含本发明的核酸和/或多肽的植物产品，例如油、种子、根、叶、提取物、果实、果肉、花粉和类似物，和/或秸秆或干草和类似物。转基因植物可以是双子叶(双子叶植物)或单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如，美国专利6,309,872； 5,508,468；7,151,204和7,157,623(玉米(corn)或玉米(Zea mays))；7,141,723 (十字花科(Cruciferae)和芸苔属(Brassica)植物)；6,576,820和6,365,807(转基因大米)。
【0448】本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如，核酸或者表达构建物可以导入到所希望的植物宿主的基因组中，或者，核酸或表达构建物可以是附加体。可以导入到所希望的植物的基因组中，这样，宿主的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”，其中例如同源重组导致的基因序列插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是熟知的，参见例如，Strepp(1998)Proc Natl.Acad.Sci.USA 95：4368-4373； Miao(1995)Plant J 7：359-365。参见下面的转基因植物的讨论。
【0449】本发明的核酸可以用来通过在植物中瞬时或稳定表达例如作为稳定的转基因植物，将所需的性质赋予基本上任何植物，例如产淀粉的植物，如马铃薯、番茄、小麦、大豆、甜菜、玉米、稻、大麦以及类似的植物。本发明的核酸可以用于操纵植物的代谢途径，以优化或者改变宿主的木质纤维素酶表达。这可以改变植物中的木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的活性。可选地，本发明的木质纤维素酶可以在转基因植物的生产中被应用，以产生该植物不能天然产生的化合物。这可以降低生产成本或者产生新的产物。
【0450】一方面，生产转基因植物的第一步涉及制备用于在植物细胞中表达的表达构建物。这些技术在本领域是熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列，以及选择适当的基因终止子序列。一个示例性的组成型启动子是来自花椰菜花叶病毒的CaMV35S，它一般在植物中导致高水平的表达。其它的启动子是更特异的，并且对植物内部或者外部环境中的暗示有反应。一个示例性的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。
【0451】一方面，修饰核酸来实现在植物细胞中更大的表达。例如，本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率，而一些植物优选G-C核苷酸对。因此，编码序列中的A-T核苷酸可以用G-C核苷酸取代，而不显著改变氨基酸序列，从而可以增加基因产物在植物细胞中的产生。
【0452】为了鉴定已经成功整合了转基因的植物细胞或者组织，可以将选择性标记基因加入到基因构建物中。这可能是必要的，因为在植物细胞中完成基因的整合和表达是一个小概率事件，仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白，所述试剂一般对植物有毒性，如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时，只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样，为了有恰当的功能，标记基因也需要启动子和终止序列。
【0453】一方面，制备转基因植物或种子包括将本发明的序列以及任选的标记基因整合到目标表达构建物(如，质粒)中，同时安置启动子和终止子序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如，构建物可以应用如电穿孔和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中，或者构建物可以应用弹道方法(ballistic methods)，如，DNA微粒轰击(DNA particle bombardment)的方法直接引入到植物组织中。例如，参见如，Christou(1997)Plant Mol.Biol.35：197-203；Pawlowski(1996)Mol.Biotechnol.6：17-30；Klein(1987) Nature 327：70-73；Talcumi(1997)Genes Genet.Syst.72：63-69，讨论了应用微粒轰击将转基因引入到小麦中；以及Adam(1997)如上，应用微粒轰击将YAC引入至植物细胞中。例如，Rinehart(1997)如上，用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明；而且，可以商购得到 BioRad(Biolistics)PDS-2000微粒加速设备；也参见，John，美国专利5,608,148；和Ellis，美国专利5,681,730，描述了微粒介导的裸子植物的转化。
【0454】一方面，原生质体可以被固定，并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易，但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化，其中，DNA被包裹于钨微射弹(tungsten microprojectiles)上，射出物的大小为细胞大小的1/100，它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生，一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。
【0455】核酸，例如表达构建物，也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化，如，烟草花叶病毒衍生的载体(Rouwendal(1997) Plant Mol.Biol.33：989-999)，参见Porta(1996)“Use of viral replicons for the expression of genes in plants”，Mol.Biotechnol.5：209-221。
【0456】可选地，核酸，如表达构建物，可以与合适的T-DNA侧翼区组合，并导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受该细菌感染时，引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导的转化技术，包括disarming和应用二元载体，在科学文献中有详细的说明。参见，如，Horsch(1984)Science 233：496-498；Fraley(1983)Proc.Natl.Acad.Sci. USA 80：4803(1983)；Gene Transfer to Plants，Potrykus，ed.(Springer-Verlag，Berlin 1995)。根瘤农杆菌细胞的DNA被包含在细菌染色体中，也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(大约20kb 长)和一系列毒力(毒性)基因，T-DNA在感染过程中被转移到植物细胞中，毒力基因则引导所述感染过程。根瘤农杆菌仅可以通过伤口感染植物：当一种植物的根或者茎受伤时，它释放某种化学信号，作为对这种信号的响应，根瘤农杆菌的毒力基因被激活，并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。 T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录，然后将自身插入到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体，必须去除T-DNA的肿瘤诱导部分，而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间，从这里转移到植物细胞并且整合到植物的染色体中。
【0457】本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化，参见Hiei(1997)Plant Mol.Biol.35：205-218。也参见如，Horsch， Science(1984)233：496；Fraley(1983)Proc.Natl Acad.Sci USA 80：4803；Thykjaer (1997)如上；Park(1996)Plant Mol.Biol.32：1135-1148，讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin，美国专利5,712,135，描述了包含在谷类或者其它单子叶植物的细胞中的具有功能的基因的DNA的稳定整合过程。
【0458】一方面，第三步可能涉及完整植物的选择和再生，所述植物能够将整合的靶基因传递至下一代。这样的再生技术可使用在组织培养生长培养基中对某些植物激素的操作。一方面，该方法使用杀虫剂和/或除草剂标记，其已同所期望的核苷酸序列一起引入。源自培养的原生质体的植物再生在以下文献中有说明，Evans 等，Protoplasts Isolation and Culture，Handbook of Plant Cell Culture，124-176页， MacMillilan Publishing Company，New York，1983；和Binding，Regeneration of Plants， PlantProtoplasts，21-73页，CRC Press，Boca Raton，1985；也参见美国专利7,045,354。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.of plant Phys.38：467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植物，它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养，即称为组织培养的过程。一旦整个植物再生并且产生种子，便开始评测其子代。
【0459】一方面，在表达盒稳定地整入到转基因植物之后，其可以通过有性交换(sexual crossing)引入到其它的植物中。可以应用任何的标准繁殖技术，这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化，包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此，本发明的种子可以来自本发明的两个转基因植物的杂交，或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(例如木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)时，所需的效应(例如，表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。
【0460】一方面，本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草，如牧草(蓝草，早熟禾属(Poa))，饲料草如羊茅属，黑麦草属，温带草，如翦股颖属(Agrostis)，和谷类，如小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(maize)(玉米(corn))。一方面，转基因单子叶植物和种子，包括单子叶植物种子-特异启动子用于产生本发明的酶；从转基因植物产生转基因单子叶植物种子的方法在例如美国专利7,157,629中描述；在植物种子中产生蛋白以及种子-优选调控序列(例如种子-特异启动子)也在例如美国专利7,081,566； 7,081,565；7,078,588；6,566,585；6,642,437；6,410,828；6,066,781；5,889,189；5,850,016 中描述。
【0461】本发明的双子叶转基因植物的例子是烟草、豆类，如羽扇豆、马铃薯、甜菜、豌豆、蚕豆和大豆，以及十字花科植物(Brassicaceae属)，如花椰菜，油菜籽，和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样，本发明的转基因植物和种子包括宽范围的植物，包括，但不限于，以下属的种：腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜属(Brassica)、柑桔属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、红花属(Carthamus)、椰子属(Cocos)、咖啡属(Coffea)、荠属(Cruciferae)、香瓜属(Cucumis)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、油棕属(Elaeis)、草莓属(Fragaria)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、萱草属(Heterocallis)、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属 (Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属 (Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、马郁兰属(薄荷属，Majorana)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、稻属(Oryza)、黍属(Panieum)、狼尾草属(Pannisetum)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistachia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卡属 (Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、白芥属(Sinapis)、茄属(Solanum)、高粱属(Sorghum)、可可属(Theobromus)、胡卢巴属(Trigonella)、小麦属(Triticum)、野豌豆属(Vicia)、葡萄属(Vitis)、豇豆属(Vigna)和/或黍属(Zea)；另外，本发明提供源自这些属和这些细胞中任何的转化的、感染的或转导的细胞和细胞培养物(包括原生质体)——其包括本发明的核酸、表达盒(例如载体)和/或多肽，可被稳定或瞬时转化、感染或转导。
【0462】在可选择的实施方式中，本发明的核酸在含有纤维细胞的(例如作为转基因的)植物中表达，包括，如，棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、轻木(balsa)、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可选择的实施方式中，本发明的转基因植物可以是棉属(Gossypium) 的成员，包括任何棉(Gossypium)种的成员，如，亚洲棉(G.arboreum)、草棉(G. herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。
【0463】本发明的转基因植物(和源自它们的细胞和细胞培养物)可包括十字花科和芸苔属植物、菊科(Compositae)植物例如向日葵和豆科植物例如豌豆。本发明的本发明的转基因植物还包括转基因树木及其部分，例如包括任何木材、叶、树皮、根、纸浆或纸产品；参见例如美国专利7,141,422，其描述了转基因杨树属 (Populus)的种。
【0464】本发明也提供了用于产生大量本发明多肽(例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)的转基因植物(和源自它们的细胞和细胞培养物)。例如，参见Palingren(1997)Trends Genet.13：348；Chong(1997) Transgenic Res.6：289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′，2′) 启动子，应用根瘤农杆菌介导的叶片圆盘(leaf disc)转化方法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。
【0465】应用已知的程序，技术人员可以通过检测在转基因植物中转基因 mRNA或蛋白的增加或减少来筛选本发明的植物。检测和定量mRNA或蛋白的方法在本领域是熟知的。
多肽和肽
【0466】一方面，本发明提供了分离的、合成的或重组的多肽，其与本发明的示例性序列(如上定义)具有序列同一性或同源性，例如至少大约50％、51％、52％、 53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、 66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、 79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、 92％、93％、94％、95％、96％、97％、98％、99％或更高或完全的(100％)序列同一性，本发明的示例性序列例如蛋白质，其具有序列SEQ ID NO：2、SEQ ID NO：4、等等至SEQ ID NO：472、SEQ ID NO：473、SEQ ID NO：474、SEQ ID NO：475、SEQ ID NO：476、SEQ ID NO：477、SEQ ID NO：478、SEQ ID NO：479、SEQ ID NO：490 至SEQ ID NO：700之间的所有偶数SEQ ID NO：、SEQ ID NO：719和/或SEQ ID NO：721的序列，还参见表1至3和序列表，和其酶促活性片段(子序列)(具有木质纤维素酶活性)和/或其免疫活性子序列(例如抗原决定部位(表位)或免疫原，例如能引发——或产生——能与本发明的示例性多肽特异性结合的抗体)。
【0467】序列同一性百分比可以在多肽的全长的区域内，或同一性可以在至少大约15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、 300、350、400、450、500、550、600、650、700或更多残基的区域内。本发明的多肽也可以短于所述的示例性多肽的全长。在可选的方面，本发明提供了大小范围在大约5到多肽全长的多肽(肽、片段)，例如酶，例如具有木质纤维素分解(木质素纤维)活性的多肽，例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶；示例性的大小为大约5、10、15、20、25、30、35、40、45、50、 55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、 400、450、500、550、600、650、700或更多残基，这些残基例如是本发明的示例性木质纤维素酶的相邻残基。本发明的肽(例如，本发明的示例性多肽的子序列) 可以用作例如标记探针、抗原(免疫原)、耐受原、基序、木质纤维素酶活性位点 (例如“催化结构域”)、信号序列和/或前原结构域。
【0468】在可选的方面，本发明提供了具有木质纤维素分解(木质素纤维)活性例如木质素分解和纤维素分解活性的多肽；在一个实施方式中，本发明的酶，其包括具有糖基水解酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的多肽，是一类多肽的成员，该类多肽共享与木质纤维素分解(木质素纤维)活性相关的特定结构元件，例如氨基酸残基。这些共享的结构元件可用于常规产生木质纤维素酶，例如常规产生糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶变体。本发明的木质纤维素酶的这些共享结构元件可用于指导本发明的多肽种类范围内的木质纤维素酶变体的常规产生。
【0469】本发明的木质纤维素分解或木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，包括但不限于，任何能够催化纤维素的完全或部分分解和/或水解的任何多肽或酶(例如，本发明的示例性多肽，也参见表2和3以及如下的实施例)，或者能够进行纤维素、半纤维素或木质纤维素材料例如含有纤维素、半纤维素和木质素的生物质材料的修饰和水解。
【0470】具有葡萄糖氧化酶活性的多肽也用于实践本发明，例如在本发明的酶的混合物中(“集合”或“鸡尾酒”，“ensemble”或“cocktail”)，例如在实践本发明的方法中或本发明的组合物中，例如在本发明的添加剂、营养辅剂、丸剂、饲料、食品中；一方面，该葡萄糖氧化酶可具有被分类为EC 1.1.3.4的活性，其可结合至β-D- 葡萄糖(六碳糖，葡萄糖的异构体)和/或可辅助将糖分解为它的代谢物；并且一个实施方式可以是以多聚体的形式，例如二聚体蛋白，其可催化β-D-葡萄糖氧化为D-葡糖酸-1，5-内酯，然后可水解为葡糖酸。本发明所有和任选多肽的可选的实施方式包括多聚体的形式，例如二聚体形式，如同源二聚体和/或异源二聚体。表2 和3概括了本发明的示例性多肽的示例性酶促活性，例如，由这些图表所示，在可选的方面，这些示例性多肽具有但不限于所列的各种活性。
【0471】在可选的实施方式中，本发明具有糖苷水解酶活性(也可称为糖苷酶活性)的多肽催化糖苷键水解以产生两个较小的糖，并且因此用于水解——或降解 ——生物质，例如纤维素和半纤维素。本发明具有糖苷水解酶活性的多肽也可用于抗-细菌防御策略，其包括在抗微生物病原机理中靶向溶菌酶，例如，以靶向或阻碍病毒神经氨酸酶(其是糖苷水解酶)。本发明具有糖苷水解酶活性的多肽也可用于正常细胞功能的等同功能中，例如用于修整参与N-连接糖蛋白生物合成的甘露糖苷酶。本发明的糖苷水解酶可被分类为EC 3.2.1，其是催化O-或S-糖苷水解的酶。本发明的糖苷水解酶也可被分类为保持或转化酶；或者内切或外切作用酶；因此，在某种实施方式中，本发明的糖苷水解酶可在它的底物例如寡/多糖链的非还原端或在中部作用。
【0472】在可选的实施方式中，本发明具有纤维素酶活性的多肽可被分类为具有内切葡聚糖酶、内切-1，4-β-葡聚糖酶、羧甲基纤维素酶、内切-1，4-β-D-葡聚糖酶、 β-1，4-葡聚糖酶和/或β-1，4-内切葡聚糖水解酶活性。在可选的实施方式中，本发明多肽的纤维素酶活性包括内切-纤维素酶活性，其打断内部键以破坏纤维素的晶体结构并且暴露单个纤维素多糖链；或者，外切-纤维素酶活性，其从由内切纤维素酶产生的暴露的链的末端切割2至4个单位，产生四糖或二糖，例如纤维二糖。在可选的实施方式中，本发明多肽的纤维素酶活性包括外切-纤维素酶或纤维二糖水解酶活性，其包括具有从纤维素的还原端向前工作和/或从纤维素的非还原端向前工作的活性。在可选的实施方式中，本发明多肽的纤维素酶活性包括纤维二糖酶或 β-葡糖苷酶活性，其水解内切-纤维素酶产物为单个的单糖。在可选的实施方式中，本发明多肽的纤维素酶活性包括氧化的纤维素酶活性，其通过自由基反应解聚纤维素，例如作为纤维二糖脱氢酶。在可选的实施方式中，本发明多肽的纤维素酶活性包括纤维素磷酸化酶活性，其利用磷酸盐而不是水来解聚纤维素。一方面，本发明的酶可水解纤维素为β-葡萄糖。
【0473】在可选的实施方式中，本发明多肽可具有木聚糖酶活性，其包括这样的活性，包含水解(降解)线性多糖β-1，4-木聚糖为木糖；并且一方面，因此分解半纤维素，其是植物细胞壁的主要组分。
用于测定或表征酶活性的分析
【0474】用于测定或表征酶活性的分析方法，例如测定纤维素酶、木聚糖酶、纤维二糖水解酶、β-葡糖苷酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶或相关活性的分析方法，例如测定多肽是否在本发明的范围内，是本领域熟知的，例如参见Thomas M.Wood，K.Mahalingeshwara Bhat，“Methods for Measuring Cellulase Activities”， Methods in Enzymology，160，87-111(1988)；美国专利5,747,320；5,795,766； 5,973,228；6,022,725；6,087,131；6,127,160；6,184,018；6,423,524；6,566,113； 6,921,655。
【0475】在某些方面，本发明的多肽可具有可选的酶促活性。例如，多肽可具有内切葡聚糖酶/纤维素酶活性；木聚糖酶活性；蛋白酶活性；等等；换言之，本发明的酶可以是多功能的，因为它们具有不严格的底物特异性。事实上，显示于本文的研究已说明本发明酶的两种示例性葡萄糖氧化酶是多功能的，因为它们具有不严格的底物特异性，参见上文讨论。
【0476】如本文所使用，“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白序列，或寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，以及天然发生的或合成的分子。“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列，或寡肽、肽、多肽或蛋白序列中任意一种的片段、部分或亚基，以及天然发生的或合成的分子。如本文所使用，术语“多肽”是指通过肽键或修饰的肽键即肽等排体 (peptide isosteres)彼此结合在一起的氨基酸，可以含有除20个由基因编码的氨基酸之外的修饰的氨基酸。所述多肽可以通过天然过程，如，翻译后加工或者通过本领域所熟知的化学修饰技术修饰所述多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在给定的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、 γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、葡聚体水解酶处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。(参见Creighton，T.E.，Proteins-Structure and Molecular Properties 2nd Ed.，W.H.Freeman和Company，New York(1993)；Posttranslational Covalent Modification of Proteins，B.C.Johnson，Ed.，Academic Press，New York， 11-12页(1983))。本发明的肽和多肽也包括所有“模拟物”和“肽模拟物”形式，正如下面进一步详细描述的。
【0477】如本文所使用，术语“分离的”意指从其原始环境(例如天然环境，如果该环境是天然存在的话)中分离出物质(本发明的蛋白或核酸)。例如，在活的动物中存在的天然发生的多核苷酸或多肽不是分离的，但与该天然系统中的一些或所有的共存物质分离开的同一多核苷酸或多肽是分离的。这样的多核苷酸可以成为载体的一部分，和/或这样的多核苷酸或多肽可以是组合物的一部分，但它们仍然是分离的，因为这样的载体或组合物不是其天然环境的组成部分。正如本文所用，术语“纯化的”并不要求绝对的纯度；它更确切的说，这意味着是一个相对定义。从文库获得的各核酸可以按惯例纯化为电泳同质。从这些克隆获得的序列不能够从所述文库或从总人DNA直接获得。本发明的纯化的核酸已经以至少104-106倍从该生物体的基因组DNA的剩余物中纯化出来。一方面，术语“纯化的”包括核酸，这些核酸已经以至少一个数量级，例如一方面，以两个或三个，或者，四个或五个数量级的程度从基因组DNA的剩余物或从文库或其它环境的序列中被纯化出来。
【0478】“重组的”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白；即，由用编码期望多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。“合成的”多肽或蛋白是那些通过化学合成制备的多肽或蛋白。固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield，R.B.，J.Am.Chem.Soc.，85：2149-2154，1963)(也参见 Stewart，J.M.和Young，J.D.，Solid Phase Peptide Synthesis，第二版，Pierce Chemical Co.，Rockford，III，11-12页)，并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等，Proc.Natl.Acad.Sci.，USA，81： 3998(1984)的方法，它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行，而所有的“杆”或者“钉”都被连接到一块板上。
【0479】短语“基本上相同(substantially identical)”在用于两个核酸或多肽时，是指当两个或更多个序列被比较和联配(aligned)以寻找最大一致性(maximun correspondence)时，它们具有例如至少大约50％、51％、52％、53％、54％、55％、 56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、 69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、 82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、 95％、96％、97％、98％、99％或更高的核苷酸或氨基酸残基(序列)同一性，所述同一性可以使用任意一种已知的序列比较算法测量，或者通过视觉观察。在可选的方面，基本上相同存在于至少大约100或更多个残基的区域内，最经常地，在至少大约150至200或更多残基的区域内所述序列是基本上相同的。在一些方面，核酸序列可以在编码区的整个长度范围内是基本上相同的。
【0480】此外，“基本上相同的”氨基酸序列可以是通过一个或多个保守或非保守氨基酸的置换、缺失或插入而与参考序列有所不同的序列。一方面，置换发生在不是分子的活性位点的位置，或者可选地，置换发生在分子的活性位点的位置，前提是该多肽基本上保持其功能(酶促)特性。保守的氨基酸置换，例如一个氨基酸置换为另一个相同类别的氨基酸(例如一个疏水氨基酸，如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸，置换为另一个疏水氨基酸，或一个极性氨基酸置换为另一个极性氨基酸，例如精氨酸置换为赖氨酸、谷氨酸置换为天冬氨酸，或谷氨酰胺置换为天冬酰胺)。可以从例如木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶多肽中删除一个或多个氨基酸，从而形成对多肽结构的修饰，而又不会显著地改变其生物活性。例如，对木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶的生物活性来说不需要的氨基或羧基末端氨基酸可以被去除。可以通过任何方法测定本发明的修饰的多肽序列的木质纤维素酶生物活性，所述方法包括将所述修饰的多肽序列和底物接触，确定所述修饰的多肽是否在该测定中减少特定底物的量或者增加功能性木质纤维素酶多肽与底物的酶促反应的生物产物。
【0481】如本文所使用，“片段”是天然存在的蛋白质的一部分，其可以以至少两种不同的构象存在。片段可以具有与天然发生的蛋白质相同或基本上相同的氨基酸序列。具有与天然存在的蛋白质有所不同的三维结构的片段也被包括在内。这样的一个例子是“原-形式(pro-form)”分子，例如，低活性的蛋白原，其可以通过切割而被修饰，产生具有显著更高的活性的成熟酶。
【0482】一方面，本发明提供了本发明的蛋白和肽例如纤维素酶的晶体(三维) 结构；其可以使用本领域中熟知的常规方案进行制备并加以分析，例如，在下列文献中有所描述：MacKenzie(1998)Crystal structure of the family 7 endoglucanase I (Cel7B)from Humicola insolens at 2.2 A resolution and identification of the catalytic nucleophile by trapping of the covalent glycosyl-enzyme intermediate，Biochem.J. 335：409-416；Sakon(1997)Structure and mechanism of endo/exocellulase E4 from Thermomonosporafusca，Nat.Struct.Biol 4：810-818；Varrot(1999)Crystal structure of the catalytic core domain of the family 6 cellobiohydrolase II，Cel6A，from Humicola insolens，at 1.92 A resolution，Biochem.J.337：297-304；其举例说明并鉴定了特定的结构元件，可用于指导本发明的纤维素酶变体的常规产生，并用于指导鉴别本发明的范围内的酶种类。
【0483】本发明的多肽和肽可以分离自天然来源，可以是合成的，或者可以是重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用本技术领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本技术领域熟知的化学方法全部或部分合成。例如参见Caruthers(1980)Nucleic Acids Res. Symp.Ser.215-223；Horn(1980)Nucleic Acids Res.Symp.Ser.225-232；Banga， A.K.，Therapeutic Peptides and Proteins，Formulation，Processing and Delivery Systems (1995)Technomic Publishing Co.，Lancaster，PA。例如，肽合成可以使用各种固相技术进行(例如参见Roberge(1995)Science 269：202；Merrifield(1997)Methods Enzymol.289：3-13)，自动合成可以根据制造商提供的说明书来实施，例如使用ABI 431A肽合成仪(Perkin Elmer)。
【0484】本发明的肽和多肽也可被糖基化。所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上，其中后者包括应用已知的糖基化作用基序，所述糖基化作用基序可以对于所述序列是天然的，或者是作为肽段而被加入的，或者是在核酸编码序列中加入的。糖基化作用可以是O-联接的或者是N-联接的。
【0485】本发明的肽和多肽，如以上所定义的，包括所有的“模拟物(mimetic)” 和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成，或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守置换，只要这样的置换本质上不改变该模拟物的结构和/或活性。对于作为本发明多肽的保守性变体或种类成员的本发明多肽(例如与本发明的示例性序列具有约50％或更高序列特异性)，常规实验将可以确定一种模拟物是否在本发明的范围内，即，其结构和/或功能并没有实质上的改变。因此，一方面，如果一种模拟组合物具有木质纤维素酶例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，那么它在本发明的范围内。
【0486】本发明的多肽模拟组合物可以包含非天然结构成分的任何组合。在可供选择的方面，本发明的模拟组合物包括以下三种结构基团中的一种或全部：a) 不是天然酰胺键(“肽键”)连接的残基连接基团；b)置换天然发生的氨基酸残基的非天然残基；或者c)诱导二级结构拟态(mimicry)的残基，即，诱导或者稳定二级结构，如β转角、γ转角、β折叠、α螺旋构象，以及类似的结构。例如，当本发明的多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时，该多肽可以表征为模拟物。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接，如，通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N，N′-二环己基碳二亚胺(DCC)或者N，N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括，如，酮基亚甲基(如，-C(＝O)-CH2-代替 -C(＝O)-NH-)、氨基亚甲基(CH2-NH)、次乙基、烯烃(CH＝CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(参见如，Spatola(1983)在Chemistry and Biochemistry of Amino Acids，Peptides and Proteins，第7卷，267-357页，“Peptide Backbone Modifications”Marcell Dekker， NY)。
【0487】本发明的多肽也可以由于含有全部或者部分替代了天然发生的氨基酸残基的非天然氨基酸残基而被表征为模拟物。在科学和专利文献中充分描述了非天然的残基；用作为天然氨基酸残基的模拟物的一些示例性的非天然组合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下替换来产生，如，D-或L-萘基丙氨酸；D-或L-苯基甘氨基，D-或L-2噻吩基丙氨酸；D-或L-1、-2、3-或4- 芘基丙氨酸；D-或L-3噻吩基丙氨酸；D-或L-(2-吡啶基)-丙氨酸；D-或L-(3-吡啶基)-丙氨酸；D-或L-(2-吡嗪基)-丙氨酸；D-或L-(4-异丙基)-苯基甘氨酸；D-(三氟甲基)-苯基甘氨酸；D-(三氟甲基)-苯基丙氨酸；D-p-氟-苯基丙氨酸；D-或L-p-二苯基苯基丙氨酸；D-或L-p-甲氧基-二苯基苯基丙氨酸；D-或L-2-吲哚(烷基)丙氨酸；和，D-或L-烷基丙氨酸，其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括，如噻唑基、噻吩基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。
【0488】酸性氨基酸的模拟物可以通过用以下的置换来产生，如，保持负电荷的非羧酸氨基酸；(膦酰基)丙氨酸；硫酸化的苏氨酸。羧基侧链基团(如，天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰，所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮鎓-4，4- 二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基残基。碱性氨基酸的模拟物可以通过用如，(除了赖氨酸和精氨酸外)氨基酸鸟氨酸、瓜氨酸、或者(胍基)-乙酸，或者(胍基)烷基-乙酸置换而产生，其中烷基如以上定义。腈衍生物(如，含有替代COOH的CN-部分) 可以置换天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基残基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基残基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂一方面在碱性的条件下反应而产生，所述的常规试剂包括如苯乙二醛、2，3-丁二酮、1，2-环-己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-乙酰基咪唑基和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生；得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-咪唑基)丙酸；氯乙酰磷酸、 N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物；甲基2-吡啶基二硫化物；p-氯汞苯甲酸盐；2-氯汞-4硝基苯酚，或者，氯-7-硝基苯并-氧杂-1，3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和可改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2，4，戊二酮的反应，和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括，例如，2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸，或者3，3，-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括，例如，由脯氨酸和赖氨酸的羟基化作用产生的模拟物；由丝氨酰或者苏氨酰残基的羟基的磷酸化作用产生的模拟物；由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物；由N-末端胺的乙酰化作用而产生的模拟物；由主链酰胺残基的甲基化或用N-甲基氨基酸置换而产生的模拟物；或者，由C-末端羧基的酰胺化而产生的模拟物。
【0489】在一方面，本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。在一方面，天然发生的L-构型(其也可以被称为R 或者S，取决于化学实体的结构)的任何氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代，相反手性的氨基酸称为D-氨基酸，但也可以称R-或者S-型。
【0490】本发明也提供了通过天然过程，如，翻译后加工(如，磷酸化，酰化等)或者通过化学修饰技术来修饰本发明的多肽的方法，以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在给定的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有多种类型的修饰。在一方面，修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰肌醇、交联环化作用、二硫键形成、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI 锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。参见，如，Creighton， T.E.，Proteins-Structure and Molecular Properties 2nd Ed.，W.H.Freeman and Company，New York(1993)；Posttranslational Covalent Modification of Proteins，B.C. Johnson，Ed.，Academic Press，New York，11-12页(1983)。
【0491】固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield，R.B.，J.Am. Chem.Soc.，85：2149-2154，1963)(也参见Stewart，J.M.和Young，J.D.，Solid Phase Peptide Synthesis，第二版，Pierce Chemical Co.，Rockford，III，11-12页)，并且这些方法近来已经被用于商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)。这样的商业上可获得的实验室试剂盒一般是利用H.M. Geysen等，Proc.Natl.Acad.Sci.，USA，81：3998(1984)的教导，它们将肽合成在多个“杆(rods)”或者“钉(pins)”的顶端，而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时，一个板的杆或者钉被倒转并插入到第二个板的相应孔或者贮存器中，所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤，即是，反转和插入所述杆和钉的顶端至适当的溶液中，将氨基酸构建成所要的肽。此外，大量的可利用的FMOC肽合成系统是可利用的。例如，应用Applied Biosystems，Inc.的Model 431ATM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得，或者通过直接的合成或者通过合成用其它已知的技术可以偶联起来的一系列片段。
【0492】本发明的多肽包括活性形式或非活性形式的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。例如，本发明的多肽包括在“成熟” 之前或例如通过蛋白原加工酶如蛋白原转化酶来产生“活性”的成熟蛋白来加工前原序列之前的蛋白原。本发明的多肽包括由于其它原因而不具有活性的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，所述其它原因例如在通过翻译后加工事件诸如内切或外切肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化或二聚化事件等等进行“活化”之前。本发明的多肽包括所有的活性形式，包括酶的活性子序列，例如，催化结构域或活性位点。
【0493】本发明包括固定化的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，抗纤维素酶，例如，抗内切葡聚糖酶、抗纤维二糖水解酶和/或抗β-葡糖苷酶抗体及其片段。本发明提供了抑制木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的方法，例如使用本发明的显性负突变体或抗纤维素酶抗体，如抗内切葡聚糖酶、抗纤维二糖水解酶和/或抗β-葡糖苷酶抗体。本发明包括含有本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的异源复合物，例如融合蛋白、异二聚体等等。
【0494】本发明的多肽可以在多种条件下，例如在极端pH和/或极端温度、氧化试剂和类似的情况下，具有木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶酶活性。发明提供了产生，例如对温度、氧化试剂和改变的洗涤条件具有不同催化效率和稳定性的可选的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶制备物的方法。在一方面，木质纤维素酶变体可以使用位点定向诱变和/或随机诱变的技术产生。在一方面，定向进化可以被用于产生各种具有可选的特异性及稳定性的木质纤维素酶变体。
【0495】本发明的蛋白质也被用作研究试剂以鉴定木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的调节剂，如木质纤维素酶活性的激活剂或抑制剂。简单地说，测试样品(化合物、培养基、提取物等)被加入到木质纤维素酶测定中，以确定它们抑制底物切割的能力。这种方法鉴定的抑制剂可以被用在工业和研究中，以降低或防止不希望的蛋白水解。至于木质纤维素酶，抑制剂可以被组合以增加活性谱。
【0496】本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例如，为了使用例如自动测序仪进行测序，可以使用木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶将多肽破碎成较小的片段。
【0497】本发明也提供了应用本发明的核酸、多肽和抗体来发现新的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的方法。在一方面，筛选噬粒文库，基于表达来发现木质纤维素酶。在其它方面，筛选λ噬菌体文库，基于表达来发现木质纤维素酶。通过筛选噬菌体或噬粒文库，可以检测到毒性克隆；更方便地利用底物；减少工程改造宿主的需要，绕过由文库中大的切除带来任何偏差的可能性；以及获得在低克隆密度下更快的生长速率。噬菌体或噬粒文库的筛选可以是在液相中或者固相中。在一方面，本发明提供了在液相中的筛选。与固相筛选相比，这给予了分析条件上的更大灵活性；额外底物的灵活性；对于弱的克隆的更高灵敏性；和更容易实现的自动化。
【0498】本发明提供了使用本发明的蛋白质和核酸以及机器人自动化来进行筛选的方法，以使得在例如一天的短时间内能进行数千个生物催化反应和筛选分析，并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。结果，衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的进一步教导，参见PCT/US94/09174；美国专利6,245,547。
【0499】在一方面，通过生物化学富集或纯化步骤获得本发明的多肽或片段。通过木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶测定(参见例如下面的实施例1、2和3)、凝胶电泳和/或微测序，可以确定潜在同源的多肽或片段的序列。可使用上述的任何程序，将本发明的预期多肽或片段的序列与本发明的示例多肽或片段例如含有其至少大约5、10、15、20、25、30、35、40、50、 75、100或150或更多个连续氨基酸的片段相比较。
【0500】本发明的另一方面是用于鉴定本发明的片段或变体的分析方法，所述本发明的片段或变体保留了本发明的多肽的酶功能。例如，所述多肽的片段或变体可用于催化生物化学反应，这样的反应表明所述片段或变体保留了本发明的多肽的酶活性。确定变体或片段是否保留本发明的多肽的酶活性的示例性测定方法包括下面的步骤：将多肽片段或变体与底物分子在允许该多肽片段或变体发挥作用的条件下接触，并检测底物水平的降低或该多肽和底物之间反应的特异反应产物水平的增加。
【0501】本发明开发了酶的独特的催化性质。鉴于生物催化剂(即，纯化的或者粗制的酶，非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂，本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物如小分子中的功能基团具有特异性。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的，并且可以和含有这一功能基团的许多起始化合物反应。
【0502】在一方面，生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代，可以产生起始小分子或化合物的数千种变化。
【0503】酶在起始化合物的特定位点发生反应而不影响分子的其它部分，该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了在文库中鉴定单个活性化合物的方法。该文库通过用于产生该文库的一系列生物催化反应来表征，这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序，并确认合成出的化合物的结构。这种鉴定方式，不同于其它的合成和筛选方法，并不需要固定化技术，并且化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。重要的是，注意到酶反应对功能团的高度特异性允许“追踪”特定的酶促反应，由所述酶促反应制备出了生物催化产生的文库。
【0504】在一个方面，许多程序步骤可使用机器人自动化来实施，这使得每天可执行数千个生物催化反应和筛选分析，并保证高水平的准确性和可重复性。机器人自动化也可以用于筛选纤维素酶活性，以确定多肽是否在本发明的范围内。结果，一方面，在几周内便产生了衍生化合物的文库，而采用“传统的”化学或酶筛选方法方法则需要几年的时间。
【0505】在具体的方面，本发明提供了修饰小分子的方法，包括使在此所述的由多核苷酸编码的多肽和/或其酶活性子序列(片段)与小分子接触，产生修饰的小分子。检测被修饰的小分子的文库以确定显示出期望活性的修饰小分子是否存在于文库内。产生具有期望活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地去除用来产生一部分文库的每个生物催化反应，然后检测在这一部分文库中产生的小分子是否存在或不存在具有期望活性的修饰小分子来进行。产生具有期望活性的修饰小分子的特异生物催化反应可任选地被重复。生物催化反应可用一组生物催化剂来进行，它们可与在小分子的结构中发现的各种不同结构部分反应，每个生物催化剂对一个结构部分或一组相关的结构部分是特异的；每个生物催化剂可与含有各种不同的结构部分的许多不同的小分子反应。
木质纤维素酶的信号序列、糖结合结构域以及前原结构域和催化结构域
【0506】本发明提供了具有或没有同源或异源信号序列(一个或多个)(例如，信号肽(SP)、前原(prepro)结构域、糖结合结构域和/或催化结构域(CD)的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。本发明的 SP、前原结构域和/或CD可以是分离的、合成的或重组的肽或可以是融合蛋白的一部分，例如作为嵌合蛋白中的异源结构域(一个或多个)。这些酶可以是多结构域的构造，例如，本发明的酶可以具有一个或一个以上或多个结构域(例如，SP、前原结构域、糖结合结构域和/或催化结构域)，所述结构域被加其序列或被剪接成其序列(例如，作为融合(嵌合)蛋白)以置换其内源的等价结构域(如，内源的SP、前原结构域、糖结合结构域和/或催化结构域)。本发明提供了分离的、合成的或重组的核酸，所述分离的、合成的或重组的核酸编码这些多结构域、或置换的结构域酶、和来源于本发明的多肽的单个催化结构域(CD)、糖结合结构域、前原结构域和信号序列(SP，例如具有包括本发明多肽的氨基末端残基或由本发明多肽的氨基末端残基组成的序列的肽)。
【0507】本发明提供了分离的、合成的或重组的信号序列(如信号肽)，该信号序列由下列残基的序列组成或包括下列残基的序列(下列残基中描述的序列)，即本发明的多肽的残基1到14、1到15、1到16、1到17、1到18、1到19、1到 20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到 28、1到30、1到31、1到32、1到33、1到34、1到35、1到36、1到37、1到 38、1到39、1到40、1到41、1到42、1到43、1到44、1到45、1到46或1 到47或更多残基，所述多肽例如本发明的示例性多肽，也参见表3和4以及序列表。
【0508】在一方面，本发明提供了包含本发明的多肽的前14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、 36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多个氨基端残基的信号序列。
【0509】例如，如，上文的表3和表4列出了本发明的示例性的信号(前导) 序列，如在具有由例如SEQ ID NO：1编码的SEQ ID NO：2中所列的序列的多肽中，有这样的信号序列，该信号序列包含SEQ ID NO：2的氨基端33个残基，或 MSRNIRKSSFIFSLLTIIVLIASMFLQTQTAQA(或由之组成)。
【0510】另外的示例性信号序列同样在上文的表3和表4中列出；这些是示例性信号序列，而本发明不限于这些示例性序列，例如SEQ ID NO：2的另一信号序列可以是
MSRNIRKSSFIFSLLTIIVLIASMFLQTQTAQ，或 MSRNIRKSSFIFSLLTIIVLIASMFLQTQTA等。
【0511】表1至4和序列表还列出了关于本发明的示例性序列的其它信息，如上文中所详细讨论的。
【0512】本发明包括具有和没有信号序列(即，信号肽(SP)，例如，如上描述的和/或表1至4中列出的)、前原结构域、糖结合结构域和/或催化结构域(CD) 的多肽，包括本发明的多肽。本发明包括具有异源信号序列、前原结构域、糖结合结构域和/或催化结构域的多肽。例如，本发明的多肽包括酶，其中所述酶的内源信号(前导)序列、前原结构域、糖结合结构域和/或催化结构域由另一相似的酶或来自完全不同的酶源的异源功能性等价结构域序列代替。SP结构域、前原结构域、糖结合结构域和/或催化结构域(例如，包括用作异源结构域的本发明的序列) 可以位于蛋白质的内部，或氨基末端或羧基末端。
【0513】在一方面，用于实践本发明的异源信号序列将编码的蛋白质(例如，本发明的酶)靶向液泡、内质网、叶绿体或淀粉颗粒。在一方面，本发明的信号序列将所编码的蛋白质(例如，本发明的酶)靶向液泡、内质网、叶绿体或淀粉颗粒。
【0514】本发明还包括分离、合成的或重组的含有本发明酶的子序列的信号序列、糖结合结构域、前原序列和/或催化结构域(例如，“活性位点”)。所述含有本发明的信号序列的多肽可以是本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶，或另一种木质纤维素酶(不是本发明的木质纤维素酶)，或另一种酶或其它多肽。
【0515】在一方面，本发明提供了编码来自本发明的木质纤维素酶的信号序列、糖结合结构域、前原序列和/或催化结构域的核酸，所述核酸可操作地连接到不同木质纤维素酶，或任选地，另一酶的核酸序列；同样地，可以使用来自非木质纤维素酶的信号序列(SP)、糖结合结构域、前原序列和/或催化结构域。
【0516】本发明也提供了分离的、合成的或重组的多肽，所述多肽包含本发明的信号序列、糖结合结构域(或模块，“CBM”)、前原序列和/或催化结构域(活性位点)和一个或多个异源序列。在一方面，所述异源序列是与酶、或与它们所结合的结构域(例如，作为多结构域融合蛋白)天然不相关的序列，或是内源的但序列被修饰和/或分子内重排(再定位)的结构域。与信号序列、糖结合结构域(CBM) 前原结构域和/或催化结构域天然不相关的序列可以在异源序列(例如，酶)内部，或在异源序列(例如，酶)的氨基末端、羧基末端，和/或异源序列的两个末端上。例如，在一方面，异源的或修饰的或再定位的CBM、信号序列和/或活性位点(例如，“至少一个CBM”)被定位，靠近本发明的催化结构域、CBM和/或信号序列的嵌合多肽，例如其中所述至少一个催化结构域、CBM和/或信号序列被定位：例如，靠近所述多肽催化结构域的C-端，或，靠近所述多肽催化结构域的N-端；在可选的实施方式中，术语“靠近”表示位置距离催化结构域、CBM、活性位点或C-端或 N-端1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或 20或更多个残基。
【0517】在一方面，本发明提供了分离的、合成的或重组的多肽，其包括(或由之构成)含有本发明的信号序列(SP)、CBM、前原结构域和/或催化结构域(CD) 的多肽，条件是它同与其天然相关的任何序列(例如，木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)是不连接的。
植物信号序列
【0518】用于实践本发明的内源或异源信号序列(一个或多个)可以包括任何植物信号序列(信号肽，SP)(注意：任何SP可以被用于实践本发明，而术语SP 包括能够指导或靶向多肽的部分，并且包括病毒、细菌、哺乳动物或合成来源的 SN)。任何信号序列，包括植物信号序列的编码序列能够可操作地连接到编码嵌合蛋白，例如酶的多核苷酸上。例如，本发明的多肽可以包含玉米γ-玉米醇溶蛋白 N-端信号序列，用于靶向至内质网并且分泌到质外体(质膜外的游离扩散空间)中；参见，例如，Torrent(1997)Plant Mol Biol.34(1)：139-149。对于本发明的所有多肽，包括这些嵌合蛋白，本发明提供了编码它们的核酸。
【0519】可以用于实践本发明的另一示例性信号序列是氨基酸序列基序 SEKDEL，其用于将多肽保持在内质网中；参见，例如，Munro(1987)Cell 48(5)：899-907。例如，在一方面，本发明提供了本发明的酶以及编码该嵌合序列的核酸，所述本发明的酶包含可操作地连接到模体SEKDEL的、来自玉米γ-玉米醇溶蛋白的N-端序列。
【0520】本发明还提供了可操作地连接到蜡质造粉质体靶向肽的本发明的多肽；因而，由于与蜡质造粉质体靶向肽的这种融合，所述多肽将被靶向到造粉质体或靶向到淀粉颗粒；参见，例如，Klosgen(1986)，Klosgen(2001)Biochim Biophys Acta.1541(1-2)：22-33；Qbadou(2003)J.Cell Sci.116(Pt 5)：837-846。
【0521】在另一方面，编码超嗜热加工酶(hyperthermophilic processing enzyme) 的多核苷酸可操作地连接到淀粉结合结构域形式的叶绿体(造粉体)转运肽(CTP) 和CBH，例如，其来自蜡质基因；参见，例如，Klosgen(1991)Mol.Gen.Genet. 225(2)：297-304；Gutensohn(2006)Plant Biol.(Stuttg).8(1)：18-30；Ji(2004)Plant Biotechnol.J.2(3)：251-260。淀粉结合结构域在本领域内是熟知的，并且任何淀粉结合结构域可以被用于实践本发明，例如，作为连接到本发明的酶的异源结构域或作为本发明的酶的一部分(例如作为嵌合重组蛋白)；参见，例如，Firouzabadi Planta (2006)Oct.13th Epub；Ji(2004)Plant Biotechnol.J.2(3)：251-260。在另一方面，本发明的酶被设计成，以通过可操作地将其连接到淀粉结合结构域，例如蜡质淀粉结合结构域而靶向淀粉颗粒；这种连接——当与结合到本发明的酶的其它异源结构域一起时——可以作为嵌合重组的蛋白或例如，与连接体化学结合，或静电结合。在一方面，本发明提供了融合多肽(嵌合重组蛋白)，所述融合多肽包含例如来自waxy 的N-端质外体靶向序列，其可操作地连接到含有淀粉结合结构域，例如蜡质淀粉结合结构域的α-淀粉酶融合多肽。
糖(碳水化合物)结合模块(一个或多个)(CBM)
【0522】如上面讨论的，在一方面，本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、 β-木糖苷酶和/或阿拉伯呋喃糖苷酶是重组的或嵌合的，例如多结构域，包含至少一个(例如，可以包括多个)糖结合模块(一个或多个)(CBM)的酶，其可以是异源的或内源的糖结合模块(包括修饰的或重排的CBM)，其中所述糖结合模块 (一个或多个)可以是任何已知的模块(或“结构域”)，例如，包括糖基水解酶结合结构域，和/或，纤维素结合模块，木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异的模块(见，例如，Gunnarsson(2006)Glycobiology 16：1171-1180)、阿拉伯呋喃糖苷酶结合模块等；所述模块在可选的实施方式中可以来自本发明的另一木质纤维素酶，或来自不是本发明的另一木质纤维素酶，例如，所述结构域对于所述酶是“异源的”；包括在例如美国专利申请公开号20060257984； 20060147581；USPN 7,129,069中描述的模块。因而，本发明的嵌合酶，例如多结构域，可以具有在它自己的序列中重排或增加的内源性糖结合模块，或可以具有对其自己的内源性模块“转换的”或替换糖结合模块，或可以具有一个或多个被剪接成其序列(内部的或羧基-和/或氨基端)的其它羧基结合模块。
【0523】因而，本发明的多肽可以包括已经被确定为三种主要类型：A、B和 C的任何糖结合模块；或本发明的嵌合多肽可以包括异源的或修饰的或内部重排的 CBM，所述CBM包括CBM_1、CBM_2、CBM_2a、CBM_2b、CBM_3、CBM_3a、 CBM_3b、CBM_3c、CBM_4、CBM_5、CBM_5_12、CBM_6、CBM_7、CBM_8、 CBM_9、CBM_10、CBM_11、CBM_12、CBM_13、CBM_14、CBM_15、CBM_16 或来自CBM_1至CBM_48的CBM家族的任何CBM，或它们的任何组合。
【0524】本发明的嵌合酶或杂交(例如，重组的)酶可以包含一个或几个任何其它这些类型如异源的或重排的内源性模块：包括CBM_1至CBM_48家族的一个或任何模块成员，和/或类型A模块，具有扁平的结合表面，结合到不溶的晶体葡聚糖；类型B模块——显示了结合裂口(cleft)——对游离的单个糖链具有亲和力；类型C模块——其具有溶剂暴露的结合槽(slot)——具有结合单糖和二糖的能力 (见，例如，Protein Engineering Design and Selection(2004)17(3)：213-221；Coutinho (1999)Carbohydrate-active enzymes：an integrated database approach.In″Recent Advances in Carbohydrate Bioengineering″，H.J.Gilbert，G.Davies，B.Henrissat and B. Svensson eds.，The Royal Society of Chemistry，Cambridge，pp.3-12；Tomme(1989) FEBS Lett.243，239-243；Gilkes(1988)J.Biol.Chem.263，10401-10407；Tomme (1995)in Enzymatic Degradation of Insoluble Polysaccharides(Saddler，J.N.&Penner， M.，eds.)，Cellulose-binding domains：classification and properties.pp.142-163， American Chemical Society，Washington；Henrissat(1997)Structural and sequence-based classification of glycoside hydrolases.Curr.Op.Struct.Biol. 7：637-644；Coutinho(2003)An evolving hierarchical family classification for glycosyltransferases.J.Mol.Biol.328：307-317；Boraston(2004)Carbohydrate-binding modules：fine-tuning polysaccharide recognition.Biochem.J.382：769-781；因而，CBM 在本领域内被很好地表征。
【0525】在一方面，应用本发明的木质纤维素酶或其它多肽的常规筛选程序、或序列同源性分析，鉴定本发明的SP、糖结合结构域、催化结构域和/或前原序列。例如，本发明多肽的子序列的添加或缺失或修饰对其在蛋白质靶向通路中的行为、结合底物如糖，例如纤维素酶或木质素以水解的能力等的影响，将会确定本发明的新的结构域(蛋白质被分类并转运到其正确细胞位置的通路通常被称为蛋白质靶向通路(protein targeting pathways))。本发明的信号序列的长度可以在大约10到 65，或更多个氨基酸残基之间变化。识别信号序列(SP)、糖结合结构域、催化结构域和/或前原结构域的各种方法是本领域普通技术人员已知的。例如，在一方面，新的木质纤维素酶信号肽通过称为SignalP的方法来鉴定。SignalP应用既可识别信号肽，又可识别其切割位点的组合神经网络，例如，如在Nielsen(1997) ″Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites.″Protein Engineering 10：1-6中所述。鉴定“前原”结构域序列和信号序列的方法在本领域内是熟知的，见，例如，Van de Ven(1993)Crit.Rev.Oncog. 4(2)：115-136。例如，为了鉴定前原序列，从细胞外空间纯化蛋白质，确定N-末端蛋白质序列并且与未加工的形式进行比较。在另一实施方式中，异源的SP包括酵母信号序列。本发明的木质纤维素酶在载体，例如pPIC系列载体(Invitrogen， Carlsbad，CA)中可以包括异源的SP和/或前原序列。下面的实施例7描述了用于鉴定糖结合模块序列的示例性常规程序。
杂合(嵌合)木质纤维素酶以及肽库
【0526】在一方面，本发明提供杂合木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶作为融合蛋白，其在一方面也包括肽库，并且在一种实施方式中，这些肽库包括本发明的序列(本发明酶的子序列)，或由之组成。本发明的肽库可以被用于分离靶的肽调节剂(例如，激活剂或抑制剂)，所述靶例如木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶底物，受体，辅因子、调节剂和类似物。本发明的肽库可以被用于鉴别靶的形式结合伴侣，如配体，例如细胞因子、激素、辅因子、调节剂及类似物。在一方面，本发明提供嵌合蛋白，所述嵌合蛋白包含本发明的信号序列(SP)、前原结构域(prepro domain) 和/或催化结构域(CD)或其组合以及异源序列(见上述)。
【0527】在一方面，本发明的融合蛋白(如肽部分)被构象稳定化(相对于线性肽)，从而允许其对靶的较高的结合亲和力。本发明提供了本发明的木质纤维素酶和其它肽的融合物，所述其它肽包括已知的和随机的肽。它们可以以这样的方式融合：木质纤维素酶的结构没有被显著地干扰，并且所述肽在代谢上或结构构象上是稳定的。这使得能够产生这样的肽文库，该肽文库在细胞内的存在和其数量可容易被监测。
【0528】本发明的氨基酸序列变体可以通过预先确定的所期望的变异性质来表征，例如，所述预先确定的期望的变异性质是使它们与天然存在的形式区分开的特征，例如本发明的木质纤维素序列的等位基因的或种间的变异。在一方面，本发明的变体显示出与天然存在的类似物相同性质的生物活性。可选地，可以选择具有改良特性的变体。在一方面，尽管用于引入氨基酸序列变异的位点或区域是预先确定的，但该突变本身不需要被预先确定。例如，为了优化在给定位点的突变性能，可以在靶密码子或区域进行随机诱变并且筛选表达的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶变体，以寻求期望活性的最佳组合。在具有已知序列的DNA中的预定位点进行置换突变的技术是熟知的，如本文描述的，例如M13引物诱变和PCR诱变。可以使用例如葡聚糖水解分析方法来进行突变体的筛选。在可选的方面，氨基酸置换可以是单个残基；插入可以是大约1到20个氨基酸的水平，尽管可以进行大得多的插入。缺失的范围可以在大约1到大约20、 30、40、50、60、70个残基或更多残基。为了获得具有最佳特性的最终衍生物，置换、缺失、插入或其任何组合可以被使用。一般地，这些改变在少数氨基酸上进行，以使分子的改变最小化。然而，在某些情况下可以容忍较大的改变。
【0529】本发明提供了木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，其中多肽骨架结构、二级或三级结构，如α-螺旋或β-折叠结构，已经被修饰。在一方面，电荷或疏水性已经被修饰。在一方面，侧链大小已经被修饰。通过选择较不保守的置换来产生功能或免疫特性的实质变化。例如，可以进行这样的置换，它们将更加显著地影响：发生变化的区域的多肽骨架的结构，例如α 螺旋或β折叠结构；分子的电荷或疏水位点，其可以是活性位点；或侧链。本发明提供了在本发明的多肽中的置换，其中(a)亲水残基，例如丝氨酰或苏氨酰，被疏水残基例如亮氨酰、异亮氨酰、苯丙氨酰、缬氨酰或丙氨酰置换(或者相反)； (b)半胱氨酸或脯氨酸被任何别的残基置换(或者相反)；(c)具有正电性侧链的残基，例如赖氨酰、精氨酰或组氨酰被带负电的残基，例如谷氨酰或天冬氨酰置换(或者相反)；或者(d)具有大体积侧链的残基，例如苯丙氨酸，被不具侧链的氨基酸例如甘氨酸置换(或者相反)。所述变体可以表现出相同性质的生物学活性(即，木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性)，尽管变体可被选择以根据需要改变木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的特征。
【0530】在一方面，本发明的木质纤维素酶包括表位或纯化标记、信号序列或其它的融合序列等。在一方面，本发明的木质纤维素酶可以与随机的肽融合，形成融合多肽。“融合”或者“可操作地连接”在此是指随机肽和木质纤维素酶连接在一起，其连接方式对木质纤维素酶酶结构稳定性的破坏最小，例如，其仍保持木质纤维素酶活性。所述的融合多肽(或者编码该融合多肽的融合多核苷酸)也可以包含进一步的成分，包括在多个环处的多个肽。
【0531】在一方面，肽和编码它们的核酸被随机化，或者是被完全随机化，或者在它们的随机化中有偏向，例如，在核苷酸/残基的总的频率或者每个位置的频率方面有偏向。“随机化”是指每一核酸和肽分别由基本上随机的核苷酸和氨基酸组成。在一方面，产生肽的核酸可以化学合成，并且因此可以在任何位置整合任何核苷酸。因此，当核酸被表达而形成肽时，任何氨基酸残基可以被整合在任何位置。可以设计合成过程来产生随机化的核酸，从而允许在核酸的长度范围内形成所有的或大多数的可能组合，由此形成随机核酸文库。该文库可以提供结构上充分多样的随机化表达产物群体，从而影响概率上充分的细胞响应范围，以提供一种或多种表现出期望响应的细胞。因此，本发明提供了一个足够大的相互作用文库，以使其成员中的至少一个将具有使其对于一些分子、蛋白或者其它因子具有亲和性的结构。
【0532】本发明提供了产生可以编码生物学活性杂合多肽(例如，杂合木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)的嵌合多肽的方法和序列。在一方面，原始的多核苷酸(例如，本发明的示例性核酸)编码生物学活性多肽。在一方面，本发明的方法通过利用细胞加工产生新的杂合多肽，所述细胞加工整合原始多核苷酸序列，使得得到的杂合多核苷酸编码显示源自原始生物学活性多肽但不同于原始生物学活性多肽(例如，本发明的酶或多肽)的活性的多肽。例如，原始的多核苷酸可以编码来自不同微生物或在不同微生物中发现的特定酶 (例如，木质纤维素酶)。由来自一个生物体的第一多核苷酸编码的酶、或变体可以例如在特定的环境条件下，例如高盐条件下，有效地发挥功能。由来自不同生物体的第二多核苷酸编码的酶、或变体可在不同的环境条件下，如超高温条件下有效地发挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸可以编码这样的酶，所述酶显示出由原始多核苷酸编码的两种酶的特性。因此，由本发明的杂合多核苷酸编码的酶可在第一和第二多核苷酸编码的每一种酶所共有的环境条件下，例如高盐和极端温度下有效地发挥功能。
【0533】在一方面，由本发明的方法产生的杂合多肽可显示出在原始酶中不具有的特异酶活性。例如，在编码木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和 /或阿拉伯呋喃糖苷酶的多核苷酸重组和/或还原性重配后，从由杂合多核苷酸编码的所得杂合多肽中可筛选由每个原始酶获得的特定的非木质纤维素酶活性，例如筛选肽酶、磷酸化酶、酰胺酶、磷酸化酶等活性。在一方面，所述杂合多肽被筛选以确定那些可区分杂合多肽和原始亲本多肽的化学官能度，如在杂合多肽发挥功能的温度、pH或盐浓度。
【0534】在一方面，本发明涉及用于产生具有生物活性的杂合多肽以及筛选具有增强活性的这样的多肽的方法，所述方法通过如下进行：
1)以可操纵的连接导入至少第一多核苷酸和以可操纵的连接导入第二多核苷酸到合适的宿主细胞中，所述的至少第一多核苷酸和第二多核苷酸共有具有部分序列同源性的至少一个区域；
2)在促进序列再组织的条件下培养宿主细胞，得到可操纵连接的杂合多核苷酸；
3)表达由所述杂合多核苷酸编码的杂合多肽；
4)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽；和
5)分离编码该杂合多肽的多核苷酸。
分离并发现木质纤维素酶
【0535】本发明提供了分离和发现木质纤维素酶以及编码它们的核酸的方法。多核苷酸或酶可以分离自个体生物体(“分离群”)、已经在成分确定的培养基中生长的生物体收集物(“富集培养物”)，或者未经培养的生物体(“环境样品”)。生物体可以通过例如体内生物淘选进行分离(参见下面的讨论)。应用不依赖于培养物的方法从环境样品获得编码新的生物活性的多核苷酸是最优选的，因为这样便可接触到具有生物多样性的未被利用的来源。多核苷酸或酶也可以分离自许多生物体的任何一种，例如细菌。除了全细胞之外，多核苷酸或酶也可以分离自来源于这些生物体例如细菌的培养物的粗酶制备物。
【0536】在一方面，“环境文库”可以从环境样品产生，其代表天然存在的生物体的基因组集合，其存储于可以在适合的原核宿主中繁殖的克隆载体中。在该方面，因为被克隆的DNA起初是直接从环境样品提取的，所以所述文库并不限于可以在纯培养物中生长的小部分原核生物。在一方面，存在于这些样品中的环境DNA的标准化使其可以更加公正地代表来自存在于原始样品的所有物种的DNA；这可以大大增加从所述样品的次要组成中发现令人感兴趣的基因的效率，所述次要组成与优势种相比，其所代表的可能小几个数量级。
【0537】在一方面，从一个或者多个未经培养的微生物中获得的基因文库被筛选以发现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以基因表达文库的形式捕获。在一方面，编码令人感兴趣的活性的多核苷酸从这样的文库中分离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长，产生潜在的具有新的或者增强活性的活性生物分子。
【0538】可以利用基于FACS和基于非光学(例如，磁的)的机器进行体内生物筛选。在一方面，用含有被可稳定转录的RNA的元件的载体构建复合基因文库。例如，包含可导致二级结构的序列——如被设计在RNA的转录区的侧翼发夹，将用于增强它们的稳定性，因而增加它们在细胞内的半衰期。用于生物筛选过程的探针分子由标记有报告分子的寡核苷酸组成，所述报告分子只在所述探针结合到靶分子时发出荧光。应用几种转化方法之一从所述文库中将这些探针引入到重组细胞中。探针分子结合到转录的靶mRNA，导致DNA/RNA异源双链分子。在筛选过程中，探针与靶的结合将产生可通过FACS机器检测和分类的荧光信号。
【0539】在一方面，可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中， DNA的一部分被扩增、消化——通常是通过限制性酶——以切割所需的序列，期望的序列被连接进接受载体中，并被扩增。在亚克隆的每个步骤中，该部分被检测感兴趣的活性，以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被纯化，例如，在连接入载体之前通过凝胶电泳纯化，或在含有接受载体的细胞和不含有接受载体的细胞被置于选择性培养基中时，所述培养基含有例如抗生素，其可杀死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中是熟知的(Sambrook等人，Molecular Cloning：A Laboratory Mannual，第二版，Cold Spring Harbor Laboratory Press(1989))。在另一方面，本发明的酶是亚克隆。这种亚克隆与亲代克隆的差别在于，例如，长度、突变、标志物(tag) 或标记(label)。
【0540】可以从其发现、分离或制备多核苷酸的微生物包括原核微生物，如真细菌(Eubacteria)和古细菌(Archaebacteria)以及低等真核微生物如真菌、一些藻类和原生动物。多核苷酸可以是发现于、分离自或制备自样品如环境样品，在这种情况下，核酸可以被回收而不需培养某一种生物体，或者是从一种或者多种培养的生物中回收。在一方面，这样的微生物可以是适于极端环境的，如，嗜高温的、嗜冷的、兼性嗜冷菌(psychrotroph)、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的酶的多核苷酸可以被应用。本发明的酶可以例如在地表温泉和深海的热火山口中发现的超过100℃的温度发挥作用，或在例如北极的水域中发现的低于0℃的温度起作用，在例如死海中发现的饱和的盐环境下起作用，在例如煤层沉积物和地热富硫矿泉中发现的pH值在0附近起作用，或者在如污水污泥中发现的pH值超过11下起作用。在一方面，本发明的酶在很宽的温度和pH范围内具有高活性。
【0541】如上所述选择和分离的多核苷酸被导入进合适的宿主细胞中。合适的宿主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸在一方面已经在包括有合适的控制序列的载体中。宿主细胞可以是高等的真核细胞，如哺乳动物细胞，或低等真核细胞，如酵母细胞，或在一方面，宿主细胞可以是原核细胞，如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染，或电穿孔来实现。
【0542】示例性宿主包括细菌细胞，如大肠杆菌、链霉菌(Streptomyces)、鼠伤寒沙门氏菌(Salmonella typhimurium)；真菌细胞，如酵母；昆虫细胞如果蝇 S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)；动物细胞如CHO、COS或者黑色素瘤细胞；腺病毒和植物细胞，参见上文讨论。通过本文的教导，适合宿主的选择被认为是在本领域技术人员的范围内。
【0543】各种哺乳动物细胞培养系统可以用于表达重组蛋白；哺乳动物表达系统的例子包括猴肾成纤维细胞的COS-7系，其在“SV40-transformed simian cells support the replication of early SV40 mutants”(Gluzman，1981)中有说明，和其它的能够表达相容性载体的细胞系，例如，C127、3T3、CHO、HeLa和BHK细胞系的细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子，以及任何必要的核糖体结合位点、多聚腺苷酸化位点、剪接供体和受体位点、转录终止序列，以及5’侧翼的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以被用于提供所需的非转录的遗传学元件。
【0544】在另一方面，本发明的核酸、多肽和方法被用于生化途径，或用于产生编码来自一个或者多个操纵子或者基因簇或者其部分的生化途径的新的多核苷酸。例如，细菌和许多真核生物具有用于调控基因的协作机制，所述基因的产物参与相关的过程。基因成簇排列在单一染色体上，在结构上称为“基因簇”，并且它们在单个调控序列的控制下一起转录，所述调控序列包括起始整个簇的转录的单个启动子。因此，基因簇是一组或者相同或者相关的相邻基因，一般是指功能上相同或相关(通过基因簇编码的生物化学途径的一个例子是聚酮化合物(polyketides))。
【0545】在一方面，基因簇DNA可以从不同的生物体中分离出来并且连接到载体中，例如，含有表达调控序列的载体，所述表达控制序列可以控制和调控可检测蛋白或者来自所连接的基因簇的蛋白相关系列活性的产生。对于外源DNA引入具有非常大的容量的载体的应用可能适合用于这样的基因簇，在这里通过包括大肠杆菌的f-因子(或者致育因子)的例子加以描述。该大肠杆菌的f-因子是一种质粒，在接合过程中它能实现自身的高频率转移，f-因子对于获得和稳定扩增大的DNA 片段，如来自混合的微生物样品的基因簇是理想的。一个方面是使用被称作“F-黏粒(Fosmid)”的克隆载体，或者细菌人工染色体(BAC)载体。它们源于大肠杆菌f因子，能够稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时，这就有可能得到稳定的“环境DNA文库”形式的大的基因组片段。用于本发明的另一类型的载体是黏粒载体。黏粒载体最初是设计用来克隆和扩增基因组DNA的大片段。进入黏粒载体的克隆在Sambrook等，Molecular Cloning：A Laboratory Mannual，第二版，Cold Spring Harbor Laboratory Press(1989) 中有详细说明。一旦连接到适当的载体，含有不同的聚酮化合物合成酶基因簇的两个或者更多个载体可以被引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选，以寻找在起初的基因簇中没有发现的增强的活性。
【0546】筛选各种酶活性的方法对于本领域技术人员是已知的并且在整个本说明书中被讨论，见，例如下面实施例1、2和3。当分离本发明的多肽和多核苷酸时，可以采用这些方法。
【0547】在一方面，本发明提供了应用全细胞方法(如下面讨论的)来发现和分离纤维素酶，例如，内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶的方法，或修饰这些酶的活性的化合物。可以从基因组DNA文库，筛选编码木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶的克隆。
筛选方法和“在线”监控设备
【0548】在实践本发明的方法中，多种仪器和方法可以与本发明的多肽和核酸一起使用，例如，用来筛选多肽的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性，用来筛选作为木质纤维素酶活性的潜在调节剂的化合物，诸如激活剂或抑制剂，筛选与本发明的多肽结合的抗体、与本发明的核酸杂交的核酸，用来筛选表达本发明的多肽的细胞，等等。除了下面详细描述的用于筛选样品的阵列形式以外，也可使用可选形式来实施本发明的方法。这样的形式包括，例如质谱仪、色谱仪，例如，高通量HPLC和其它形式的液相色谱，和更小的形式，如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明的方法，见，例如，美国专利申请20020001809；20050272044。
毛细管阵列
【0549】本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或监测组合物(例如，小分子、抗体、核酸等)的文库，以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列，如 GIGAMATRIXTM，维莱尼姆公司(Verenium Corporation)，San Diego，CA；和描述在例如美国专利申请20020080350A1；WO 0231203A；WO 0244336A中的阵列，提供了容纳和筛选样品的可供选择的装置。在一方面，毛细管阵列包括多个毛细管，它们形成相互邻接的毛细管的阵列，其中每个毛细管含有至少一个壁，其限定了一个用以保留样品的腔。这个腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状，只要其壁能够形成腔以保留液体或样品。毛细管阵列的毛细管可相互靠近联合在一起形成平面结构。毛细管可通过融合(例如，当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。此外，毛细管阵列可以包括在阵列中相邻毛细管之间放置的间质材料(interstitial material)，从而形成含有多个穿通孔 (through-holes)的固体平面装置。
【0550】毛细管阵列可由任何数量的单个毛细管形成，例如，100至4,000,000 个毛细管。进一步，具有大约100,000或更多个单个毛细管的毛细管阵列可形成标准大小和形状的板，其适合于标准的实验室设备。通过毛细作用或使用细针的微注射，人工或自动地将腔充满。随后可以从单个毛细管中移出感兴趣的样品用于进行进一步的分析或表征。例如，安置细的针状探头，使其与选择的毛细管流体连通，从而可以向腔内加入材料或从腔中移走材料。
【0551】在单区筛选分析(single-pot screening assay)中，分析组分在插入到毛细管阵列中之前被混合在一起，产生目的溶液。当至少一部分阵列被浸入感兴趣的溶液中时，通过毛细作用充满腔。在每个毛细管中的化学或生物学反应和/或活性被监测，以发现可检测事件。可检测事件常常被称为“命中事件(hit)”，其常常可以通过光学检测与产生“非命中事件(non-hit)”的毛细管区分开来。因此，毛细管阵列可大量地并行检测“命中事件”。
【0552】在多区筛选分析(multi-pot screening assay)中，多肽或核酸，例如，配体可被导入进第一组分中，该组分被导入进毛细管阵列的至少一部分毛细管中。然后可将气泡引入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内，其中所述的第二组分与第一组分通过气泡相隔。然后可通过在毛细管阵列的两侧施加静水压挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的反应或非反应而导致的可检测事件。
【0553】在结合筛选分析(binding screening assay)中，目标样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中，其中为了使可检测颗粒与腔结合，毛细管的腔涂覆了结合材料。然后第一液体可从毛细管中移去，其中结合的可检测颗粒仍保留在毛细管内，可以将第二液体导入进毛细管内。然后监测毛细管中由颗粒与第二液体的反应或非反应而导致的可检测事件。
阵列或“生物芯片”
【0554】本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测组合物(例如，小分子、抗体、核酸等等)的文库，所述筛选或者监测是针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例如，在本发明的一个方面，一个被监测的参数是木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶基因的转录体表达。细胞的一种或多种或所有的转录体可以通过包含细胞转录体、或代表细胞转录体的核酸、或与细胞转录体互补的核酸的样品的杂交，通过与阵列或“生物芯片”上的固定化核酸的杂交来测定。通过在微型芯片上应用核酸“阵列”，细胞的一些或所有的转录体可以同时被定量。可选择地，包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。本发明可以用任何已知的“阵列”进行实践，所述“阵列”也被称为“微阵列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”，或者它们的变型。阵列一般是多个“点”或者“靶元素”，每一个靶元素包括确定数量的一种或多种生物分子，例如，固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录体的寡核苷酸。
【0555】在此使用的术语“阵列”或“微阵列”或“生物芯片”或“芯片”是多个靶元素，每个靶元素包括固定在基材表面的确定区域上的确定量的一种或多种多肽(包括抗体)或核酸，如下面进一步详细讨论的。
【0556】在实践本发明的方法时，任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地并入，或者它们的变型，例如在下列文献中描述的：美国专利6,277,628；6,277,489；6,261,776；6,258,606；6,054,27；6,048,695；6,045,996； 6,022,963；6,013,440；5,965,452；5,959,098；5,856,174；5,830,645；5,770,456； 5,632,957；5,556,752；5,143,854；5,807,522；5,800,992；5,744,305；5,700,637； 5,556,752；5,434,049；也参见，例如WO 99/51773；WO 99/09217；WO 97/46313； WO 96/17958；也参见，例如Johnston(1998)Curr.Biol.8：R171-R174；Schummer (1997)Biotechniques 23：1087-1092；Kern(1997)Biotechniques 23：120-124； Solinas-Toldo(1997)Genes，Chromosomes&Cancer 20：399-407；Bowtell(1999) Nature Genetics Supp.21：25-32。也参见公开的美国专利申请号20010018642； 20010019827；20010016322；20010014449；20010014448；20010012537； 20010008765。
抗体和基于抗体的筛选方法
【0557】本发明提供了分离的、合成的或重组的抗体，其特异地结合本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。这些抗体可以用于分离、识别或量化本发明的木质纤维素酶或相关多肽。这些抗体可以被用于分离在本发明范围内的其它多肽，或其它相关的木质纤维素酶。抗体可以被设计成结合木质纤维素酶的活性位点。因此，本发明提供了使用本发明的抗体抑制木质纤维素酶的方法(参见上文关于本发明的抗纤维素酶，例如抗内切葡聚糖酶、抗- 纤维二糖水解酶和/或抗β-葡糖苷酶组合物的应用的论述)。
【0558】术语“抗体”包括由一个免疫球蛋白基因或多个免疫球蛋白基因衍生 (derived)、仿造(modeled after)或基本上由之编码的肽或多肽或者其片段，它们能特异地结合抗原或表位，见例如，Fundamental Immunology，第三版，W.E.Paul， ed.，Raven Press，N.Y.(1993)；Wilson(1994)J.Immunol.Methods 175：267-273； Yarmush(1992)J.Biochem.Biophys.Methods 25：85-97。术语抗体包括结合抗原的部分，即，保留与抗原结合的能力的“抗原结合位点”(例如，片段、子序列、互补决定区(CDR))，包括(i)Fab片段，由VL、VH、CL和CH1结构域组成的单价片段；(ii)F(ab’)2片段，包括在铰链区由二硫键连接的两个Fab片段的二价片段；(iii)由VH和CH1结构域组成的Fd片段；(iv)由抗体单臂的VL和VH 结构域组成的Fv片段；(v)由VH结构域组成的dAb片段(Ward等，(1989) Nature 341：544-546)；和(vi)分离的互补决定区(CDR)。单链抗体也通过引用被包括在术语“抗体”中。
【0559】本发明提供了本发明的酶的片段(例如，多肽)，包括本发明多肽的免疫原性片段(例如，子序列)。本发明提供了含有本发明的多肽或肽和佐剂或载体以及类似物的组合物。
【0560】所述抗体可以在免疫沉淀、染色、免疫亲合柱等等中被应用。如果需要的话，编码特异抗原的核酸序列可以通过免疫产生，随后分离多肽或核酸，进行扩增或克隆，并且将多肽固定在本发明的阵列上。可选择地，本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构，如，抗体的亲和性可以被增加或降低。而且，制备或修饰抗体的能力可以是通过本发明方法改造到细胞中的表型。
【0561】免疫、产生和分离抗体(多克隆抗体和单克隆抗体)的方法是本领域技术人员已知的，并且在科学和专利文献中有描述，参见，如Coligan，CURRENT PROTOCOLS IN IMMUNOLOGY，Wiley/Greene，NY(1991)；Stites(eds.)BASIC AND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications，Los Altos， CA(“Stites”)；Goding，MONOCLONAL ANTIBODIES：PRINCIPLES AND PRACTICE(第2版)Academic Press，New York，NY(1986)；Kohler(1975)Nature 256：495；Harlow(1988)ANTIBODIES，A LABORATORY MANUAL，Cold Spring Harbor Publications，NewYork。除了使用动物的传统的体内方法外，抗体也可以在体外产生，例如，应用表达重组抗体结合位点的噬菌体展示文库。参见如， Hoogenboom(1997)Trends Biotechnol.15：62-70；Katz(1997)Annu.Rev.Biophys. Biomol.Struct.26：27-45。
【0562】本发明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、 75、100或150个连续氨基酸的片段，也可以被用于产生与所述多肽或片段特异结合的抗体。得到的抗体可应用于免疫亲和层析方法，以分离或纯化多肽，或确定多肽是否存在于生物样品中。在这样的方法中，蛋白质制备物，如提取物，或生物样品与能够同本发明的多肽之一或含有其至少5、10、15、20、25、30、35、40、50、 75、100或150个连续氨基酸的片段特异结合的抗体接触。
【0563】在免疫亲和步骤中，抗体被连接到固态支持物，如珠子或其它柱基质。在抗体特异性结合本发明的一种多肽或其片段的条件下，蛋白质制备物被置于与抗体接触。经清洗去除非特异性结合的蛋白质之后，特异性结合的多肽被洗脱。
【0564】在生物样品中蛋白质结合抗体的能力可以通过使用本领域技术人员所熟悉的各种方法中的任何一种来确定。例如，结合可以通过用可检测标记物，例如荧光试剂、酶标记或放射性同位素标记抗体来确定。可选择地，抗体与样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及蛋白质印迹法。
【0565】针对本发明的多肽或含有其至少5、10、15、20、25、30、35、40、 50、75、100或150个连续氨基酸的片段产生的多克隆抗体可通过直接将多肽注射进动物中或通过将多肽给予动物，例如非人动物而获得。这样获得的抗体然后可结合多肽本身。以这种方式，甚至仅编码多肽的片段的序列也可用来产生可与整个天然多肽结合的抗体。这种抗体然后可用来从表达多肽的细胞中分离多肽。
【0566】为了制备单克隆抗体，可使用提供通过连续细胞系培养产生的抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein，Nature，256：495-497，1975)、三体瘤技术、人B-细胞杂交瘤技术(Kozbor等人，Immunology Today 4：72，1983) 和EBV-杂交瘤技术(Cole等人，1985，Monoclonal Antibodies and Cancer Therapy， Alan R.Liss，Inc.，pp.77-96)。
【0567】描述用于产生单链抗体的技术(美国专利4,946,778)可被改良，以使之适于产生本发明的多肽或含有其至少5、10、15、20、25、30、35、40、50、 75、100或150个连续氨基酸的片段的单链抗体。可选择地，转基因小鼠可用来表达这些多肽或其片段的人源化抗体。
【0568】产生的针对本发明的多肽或含有其至少5、10、15、20、25、30、35、 40、50、75、100或150个连续氨基酸的片段的抗体可被用于筛选来自其它生物体和样品的类似多肽。在这样的技术中，来自生物体的多肽与抗体接触，并且检测可与抗体特异性结合的那些多肽。上述的任何方法可用来检测抗体的结合。一种这样的筛选试验在“Methods for Measuring Cellulase Activities”，Methods in Enzymology， Vol 160，pp.87-116中描述。
试剂盒
【0569】本发明提供了包含组合物，如本发明的核酸、表达盒、载体、细胞、转基因种子或植物或植物部分、多肽(如纤维素酶)和/或抗体的试剂盒。试剂盒还可以含有教导本发明的方法学以及工业、医疗和膳食用途的指导性材料，如在此所述的。
全细胞工程改造和测定代谢参数
【0570】本发明的方法提供了细胞的全细胞进化或全细胞工程改造，以通过修饰细胞的遗传组成开发出具有新表型，如新的或修饰的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的新细胞株。参见，美国专利申请号20040033975。
【0571】可以通过将本发明的核酸，如编码本发明的酶的序列加入到细胞而修饰遗传组成。如参见WO0229032；WO0196551。
【0572】为了检测新的表型，在“实时”或者“在线”的时间范围内在细胞中监测被修饰的细胞的至少一种代谢参数。在一方面，多个细胞，如细胞培养物被“实时” 或者“在线”监测。在一方面，“实时”或者“在线”监测多个代谢参数。代谢参数可以应用本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶进行监测。
【0573】代谢流分析(MFA)是以已知的生物化学框架为基础。基于质量守恒定律和关于细胞内代谢的假稳态假说(PSSH)，构建线性独立代谢矩阵。在实践本发明的方法时，建立代谢网络，包括：
·所有途径底物、产物和中间代谢物的特性(identity)；
·使途径代谢物互变的所有化学反应的特性，途径反应的化学计量学；
·催化反应的所有酶的特性，酶反应动力学；
·途径组分之间的调控性相互作用，如变构效应相互作用，酶-酶相互作用等；
·酶或者酶的任何其它超大分子组织在细胞内的区室化，以及
·任何浓度梯度的代谢物、酶或者效应分子的存在，或者它们运动的扩散障碍。
【0574】一旦针对给定的细胞株建立了代谢网络，如果在线代谢数据可用，通过矩阵概念的数学显示可以被引入以评估细胞内的代谢流。代谢表型取决于细胞内整个代谢网络的变化。代谢表型取决于途径利用相对于环境条件、遗传调控、发育状态和基因型等等的变化。在本发明方法的一些方面，在在线MFA计算之后，通过研究途径利用来分析细胞的动力学行为、它们的表型和其它性质。例如，在酵母发酵中，如果葡萄糖供应增加，氧气减少，呼吸途径的利用将会被降低和/或者停止，而发酵途径的利用将占优势。在途径分析之后，细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态朝着所需的方向进行，本发明的方法可以帮助确定如何操纵发酵。在实践本发明的方法时，MFA结果也可以与转录体组(transcriptome)和蛋白质组(proteome) 的数据比较，以用于代谢工程改造或基因重排的设计实验和方案等等。
【0575】在实践本发明的方法时，可以产生和检测任何经修饰的或者新的表型，包括在细胞中新的或者改进的特征。可以监测代谢或生长的任何方面。
监测mRNA转录体的表达
【0576】在本发明的一个方面，工程化的表型包括增加或者降低mRNA转录体(如，木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶信使)的表达或者在细胞中产生新的(如，木质纤维素酶)转录体。这种增加或减少的表达可以通过测定本发明的木质纤维素酶的存在，或者通过木质纤维素酶活性分析来追踪。mRNA转录体或信息也可以通过本领域已知的任何方法来检测或者定量，包括，例如Northern印迹、定量扩增反应、杂交至阵列以及类似的方法。定量扩增反应包括如定量PCR，包括如定量反转录聚合酶链式反应或RT-PCR；定量实时RT-PCR，或“实时动力学RT-PCR”(参见Kreuzer(2001)Br.J.Haematol.114： 313-318；Xia(2001)Transplantation 72：907-914)。
【0577】在本发明的一个方面，工程化的表型通过敲除同源基因的表达来产生。可以敲除所述基因的编码序列或者一个或多个转录控制元件，如启动子或增强子。这样，转录体的表达可以完全去除或者仅被降低。
【0578】在本发明的一个方面，工程化的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现，负调控元件包括以顺式或者反式起作用的转录调控元件。细胞的一种或多种或所有的转录体可以通过包含细胞转录体、或代表细胞转录体的核酸、或与细胞转录体互补的核酸的样品的杂交，通过与阵列上的固定化核酸的杂交来测定。
监测多肽、肽和氨基酸的表达
【0579】在本发明的一个方面，工程化的表型包括增加或者降低多肽(如木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)的表达或者在细胞内产生新的多肽。这种增加或者减少的表达可以通过确定存在的木质纤维素酶的量，或者通过木质纤维素酶活性分析来追踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸，所述方法包括如核磁共振(NMR)、分光光度法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色谱，各种免疫学方法，如免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIA)、酶联免疫吸附分析(ELISA)、免疫荧光分析，凝胶电泳(如，SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热解质谱、傅立叶变换红外光谱、拉曼光谱、GC-MS和LC-电喷射以及cap-LC- 串联-电喷射质谱，以及类似的方法。应用这些方法或者它们的变化也可以筛选新的生物活性，在美国专利6,057,103中有描述。而且，如下面详细描述的，可以应用蛋白阵列测定细胞的一种或者多种或者所有的多肽。
工业、能源、制药和其它应用
【0580】本发明的多肽(例如，具有木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶)能够催化纤维素的分解。本发明的酶可以是高度选择性的催化剂。本发明提供了应用本发明的酶的工业过程，例如在药物或营养(饮食)补充剂工业、能源工业(例如，制造“清洁”生物燃料)中，在食品和饲料工业中，例如在制造食品和饲料产品和食品和饲料添加剂的方法中。在一方面，本发明提供了在医疗工业中应用本发明的酶，例如制造药物或饮食辅助剂或补充剂，或食物补充剂和添加剂的过程。此外，本发明提供了应用本发明的酶生产生物燃料的方法，所述生物燃料包括例如生物醇，如生物乙醇、生物甲醇、生物丁醇或生物丙醇，因而包含“清洁的”燃料生产。
【0581】本发明的酶能够以灵敏的立体选择性、区域选择性和化学选择性催化反应。本发明的木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶可以被工程改造以在各种溶剂中行使功能，在极端pH(例如，高pH和低pH)、极端温度(例如，高温和低温)、极端盐度水平(例如，高盐度和低盐度)起作用，并且催化在结构上与其天然、生理学底物无关的化合物的反应。
生物质转换和清洁生物燃料的生产
【0582】本发明提供了酶(包括混合物，或酶“鸡尾酒”)和将生物质或任何木质纤维素材料(例如，包括纤维素、半纤维素和木质素的任何组合)转换为可发酵的糖，和/或单体糖——并最终转换为燃料(例如，生物乙醇、生物甲醇、生物丙醇、生物丁醇和类似物)、饲料、食品和化学品或任何其它有用的产品的方法。因此，本发明的组合物和方法提供了使用基于石油产品的有效且可持续的替代品或添加剂，例如，作为生物燃料(例如，醇类如生物乙醇、生物丙醇、生物丁醇、生物甲醇和类似物)和汽油的混合物。
【0583】本发明提供了表达本发明的酶和抗体的生物，例如，作为细胞、细胞培养物或转基因植物或植物部分(例如，种子或果实)，“生产工厂”用于合成本发明的多肽(例如，作为用于高水平、高产量制造本发明的多肽的工具)，或用于本发明的酶或抗体参与涉及天然生物质转化、处理或其它操作的化学循环。
【0584】在一方面，用于转化的酶和方法被用在酶整体(enzyme ensembles) (“混合物”或“鸡尾酒”)中，用于有效地将木质纤维素、纤维素和/或半纤维素聚合物水解(解聚)成可代谢的碳部分，包括糖和醇。本文描述了示例性的酶鸡尾酒；然而，本发明包括组合物，所述组合物包括含有至少一种本发明的酶(一种或多种) (的任何组合)的酶混合物；并且在可选的实施方式中，本发明的混合物(“整体” 或“鸡尾酒”)也可以包含其它的酶，例如，葡萄糖氧化酶、磷酸化酶、酰胺酶等和类似物。如上面讨论的，本发明提供了发现和实施最有效的酶的方法，以使这些重要的新的“生物质转化”、“生物质处理”和替代性的能源或生物燃料生产、工业过程可行。
【0585】在一方面，具有木质纤维素活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶和/或β-葡糖苷酶(β-葡糖苷酶)活性的本发明的多肽，被用于将木质纤维素生物质转换为单体糖——其最终被转换为生物醇，例如乙醇、甲醇等——的过程。因此本发明提供了从包含木质纤维素生物质的组合物制造生物燃料的过程，所述生物燃料包括例如，生物醇如生物乙醇、生物甲醇、生物丁醇或生物丙醇。木质纤维素生物质材料可以得自农作物，作为食品和饲料加工的副产品，或作为木质纤维素废物产品，如植物残渣(例如，甘蔗渣或玉米纤维，如木质种子纤维)和废纸。适合用本发明的多肽处理的植物残渣的实例包括甘蔗(例如，甘蔗渣、蔗梢)、谷物、种子、茎、叶、壳、皮、玉米或玉米穗、玉米秸秆、玉米纤维、干草、稻草(例如，水稻杆或小麦杆，或任何谷类植物的任何干的杆)、草(例如，印度草，如蓝刚草(Sorghastrum nutans)；或柳枝稷(switch grass)，例如，黍(Panicum) 种如柳枝稷(Panicum virgatum))、甜菜浆、柑橘浆、柑橘皮和类似物，以及木材、木屑(wood thinning)、木材废物、木片、木浆、废浆、木材废物、木材刨花和锯屑、建筑和/或爆破废物和残片(例如木材、木材刨花和锯屑)。适合用本发明的多肽处理的纸或木材废物的实例包括废弃或用过的复印纸、计算机打印纸、笔记本纸、记事本纸、打字机用纸和类似物以及报纸、杂志、纸板和基于纸的包装材料以及再生纸材料。此外，城市废物，例如城市固体废物的纸质部分、城市木材废物和城市绿色废物以及包含糖、淀粉和/或纤维素的其它材料可以被应用。
【0586】除了被直接加入到材料中之外，用于处理或加工木质纤维素生物质材料(例如，来自农作物、食品或饲料加工的副产品、木质纤维素废物产品、植物残渣、甘蔗渣、玉米或玉米纤维、木材废物或废纸等)的本发明的酶可选地可以通过生活在生物质材料上或生物质材料之内的微生物(例如，病毒、植物、酵母等)制造或通过生物质材料本身例如，作为转基因植物或种子和类似物制造。在一方面，产生酶(例如，通过喷雾、感染等)的微生物被加入到待处理的生物质材料中—— 这可能是所述酶的唯一来源，或可以补充以另一种形式(例如，为纯化的酶，或为培养物的粗制溶菌产物，所述培养物如细菌、酵母或昆虫细胞培养物，或为任何其它制剂)加入的酶，或补充在转基因植物中作为异源重组蛋白的酶存在。可选地，植物可以被工程改造以通过用裸DNA、质粒、病毒和类似物的瞬时感染、转化或转导来重组表达所述酶。可选地，所述酶在植物或植物种子如玉米中产生，然后从所述植物中分离所述酶或所述植物被直接用于过程中。在可选的实施方式中，本发明的酶可以通过批量补料过程(fed-batch processe)以批量加入到处理过程，在所述过程中不断加入和/或再循环。
【0587】本发明的酶和方法可以与任何糖生产过程——例如在典型的蔗糖生产工厂中——一起使用，其中蔗糖加工的重点在从甘蔗生产甘蔗糖(蔗糖)；例如，如在图5A和5B(本发明的两种转化至糖至生物醇，例如乙醇、甲醇等加工过程的示例性原料)和5C(本发明示例性干磨过程)中描述的。本发明的一种或多种多肽(例如，酶)可以按图5A、5B和/或5C中描述在一个步骤、任何步骤、一些步骤或所有步骤中加入。本发明的这些示例性方法的其它产物可以包括：乙醇、甘蔗渣和糖蜜。在一方面，甘蔗渣，甘蔗的残余纤维成分被用作生产用水蒸气发生中的加热器燃料源。在可选的方面，糖蜜以两种形式产生：不适于食用的形式(可为动物食用；赤糖糊)或为(人类)可食用的糖浆。赤糖糊糖蜜最初作为动物饲料添加剂，但是其也被用于生产乙醇。可食用的糖蜜糖浆可以与槭树糖浆、转化糖浆或玉米糖浆一起混合。
【0588】在一个示例性过程中，可在磨粉机处接收甘蔗并且准备用于汁的提取。研磨过程可以以两步发生：破坏甘蔗的坚硬结构并碾碎所述甘蔗。吸涨是水被施加于碾碎的甘蔗从而增加汁的提取的过程。碾碎步骤后的剩余材料被称为甘蔗渣，其在加热器中燃烧以产生蒸汽和电。提取的汁被过滤以除去大的颗粒，然后使其澄清。在粗糖生产中，几乎专门用热和石灰来进行澄清，并且也添加少量的可溶的磷酸盐。石灰被加入以中和有机酸，而温度被升高至大约95℃。重的沉淀物形成，其在澄清器中与汁分离。澄清的汁被转移到蒸发器而不进行进一步的处理。蒸发以两个阶段进行：最初在蒸发器中浓缩所述汁，然后在真空盘中使所述糖结晶。蒸发器台典型地产生具有大约65％固体和35％水的糖浆。蒸发之后，通过加入石灰、磷酸使糖浆澄清，聚合物成絮状，充气并且在澄清器中过滤。糖浆从澄清器到真空盘，用于结晶。在盘中，蒸发所述糖浆并开始结晶过程。当液体和晶体的混合物——称为糖膏——的体积达到容量时，所述内容物被排到结晶器中。从结晶器，糖膏A被转移到高速离心机器，其中液体(A糖蜜)与晶体分开。糖蜜返回到真空盘并且重新煮沸以产生B糖膏，其在离心后产生第二批晶体和B糖蜜。B糖蜜的纯度比A 糖蜜低得多，并且其通过再煮沸形成较低等级的糖膏C，所述糖膏C到结晶器中，然后进行离心。来自第三阶段(赤糖糊糖蜜)的最终糖蜜是重的、粘性的材料，所述粘性材料首先用于产生乙醇和用作家畜饲料的添加剂。来自组合的A和B糖膏的蔗糖被冷却并且运送到糖精炼厂。
【0589】在一方面，本发明的酶和方法可以与从生物质制备生物醇，例如乙醇、甲醇等的更“传统”的方法一起使用，如，这样的方法，包括通过使干燥的木质纤维素材料在反应器中与由强酸和金属盐的稀溶液组成的催化剂接触而水解木质纤维素材料；这可以降低纤维素水解的活化能或温度，以获得更高的糖产率；参见，例如，美国专利6,660,506和6,423,145。
【0590】合并使用本发明的酶的另一示例性方法包括水解含有半纤维素、纤维素和木质素的木质纤维素材料，其是通过在一定的温度和压力下，使所述材料在含水介质中经受第一阶段水解步骤进行，所述温度和压力被选择来实现半纤维素的初步解聚而不将纤维素大部分解聚成葡萄糖。该步骤产生一种浆，其中液体含水相包含由半纤维素解聚获得的溶解单糖，而固相包含纤维素和木质素。第二阶段水解步骤可以包括使得至少大部分纤维素解聚的条件，该步骤产生含有溶解的/可溶的纤维素解聚产物的含水液相。参见例如美国专利5,536,325。本发明的酶可以在该示例性方法的任何阶段加入。
【0591】合并使用本发明的酶的另一示例性方法包括：通过一个或多个用大约 0.4％至2％的强酸进行酸水解的阶段来处理含有木质纤维素的生物质材料；以及以及通过碱性去木质作用来处理酸水解的生物质材料的未反应的固体木质纤维素成分，以产生可生物降解的热塑性塑料和衍生物的前体。参见例如美国专利 6,409,841。本发明的酶可以在该示例性方法的任何阶段加入。
【0592】合并使用本发明的酶的另一种示例性方法包括：在预水解反应器中预水解木质纤维素材料；加入酸性液体到固态木质纤维素材料，制备混合物；加热所述混合物至反应温度；将反应温度维持足够的时间，所述时间足以将木质纤维素材料分馏成为包含至少大约20％来自木质纤维素材料的木质素的可溶解馏分和含有纤维素的固体馏分；当处于或接近其中固体部分中的纤维素变得更易于进行酶促降解的反应温度时，从固体部分除去可溶解部分；以及回收溶解部分。参见，例如，美国专利号5,705,369。本发明的酶可以在该示例性方法的任何阶段加入。
【0593】本发明提供了制备基于液体烃的发动机燃料组合物(例如，用于火花点火发动机)的方法，所述液体烃掺混有利用本发明的酶或方法制备的燃料级醇。在一方面，利用本发明的酶生产的燃料包括，例如液体煤气-或液体天然气-乙醇混合物。在一方面，共溶剂是生物质衍生的2-甲基四氢呋喃(MTHF)。参见，例如，美国专利6,712,866。
【0594】用于木质纤维素的酶促降解的本发明方法，例如，用于从木质纤维素材料生产糖和/或乙醇的方法，还可以包括生物质材料的超声处理的使用；参见，例如，美国专利6,333,181。
【0595】使用本发明的酶生产包括生物醇如乙醇、甲醇等的生物燃料的另一个示例性的方法包括：预处理包含木质纤维原料的起始材料，所述木质纤维原料至少包含半纤维素和纤维素。在一方面，起始材料包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗或成分或废物或食品或饲料生产副产物。起始材料(“原料”)在破坏植物纤维结构的条件下发生反应，以实现半纤维素和纤维素的至少部分水解。破坏性条件可以包括，例如使起始材料在pH 0.5至2.5下经受 180℃至270℃的平均温度大约5秒至60分钟的时间；或，在pH 0.5至2.5下经受 220℃至270℃的温度大约5秒至120秒的时间，或同等条件。这产生了可利用性增加的原料，该原料有待本发明的酶例如纤维素酶消化。美国专利6,090,595。
【0596】木质纤维材料的纤维素酶水解的示例性条件包括在约30℃到48℃之间的温度和/或在约4.0到6.0的之间的pH的条件下反应。其它示例性条件包括在约30℃到60℃的温度和在约4.0到8.0之间的pH。
生物燃料和生物方法生产的醇
【0597】本发明提供了包括液体和气体(例如，合成气)和生物方法生产的醇的生物燃料和合成燃料，以及应用本发明的组合物(例如，酶和核酸，和转基因植物、动物、种子以及微生物)和方法制造它们的方法。本发明提供了包含本发明的酶、核酸、转基因植物、动物(例如，微生物，如细菌或酵母)和/或种子的生物燃料和生物生产的醇。在一方面，这些生物燃料和生物生产的醇从生物质产生。
【0598】本发明提供了生物生产的醇，如通过本发明的方法生产的乙醇、甲醇、丙醇和丁醇，其包括本发明的微生物和酶通过发酵(水解)作用产生醇类燃料。
作为液体和气体汽油的生物燃料
【0599】本发明提供了气体、或汽油，如合成气形式的生物燃料和合成燃料。在一方面，本发明的方法包括使用本发明的酶用于天然生物质转化的化学循环—— 例如，用于生物质的水解——以制造生物燃料，如生物乙醇、生物丙醇、生物丁醇或生物甲醇，或合成燃料，其形式为液体或作为气体，如合成气。
【0600】例如，本发明提供了制造生物燃料气体和合成气体燃料(“合成气”) 的方法，所述生物燃料气体和合成气体燃料包括采用本发明的多肽或应用本发明的方法制造的生物乙醇、生物丙醇、生物丁醇和/或生物甲醇；在一方面，本发明的这种生物燃料气体与天然气体(也可以从生物质生产)一起混合，例如基于氢或烃的气体燃料。
【0601】在一方面，本发明提供了将生物质加工成合成燃料，如合成气的方法，如通过气化从生物质生产合成气。在一方面，本发明提供了从甘蔗，例如甘蔗渣制造乙醇、丙醇、丁醇和/或甲醇气体的方法。在一方面，这种燃料或气体被用作发动机燃料，例如汽车发动机、卡车发动机、飞机发动机、渔船发动机、小发动机等的燃料。在一方面，本发明提供了从植物，例如玉米，或植物产物如干草或秸秆(例如，水稻秸秆或小麦秸秆，或任何谷类植物的任何干秆)或农业废物制造乙醇、丙醇、丁醇和/或甲醇的方法。可以从植物，例如玉米，或植物产物，例如干草或秸秆，或农业废物制造纤维素乙醇、丙醇、丁醇和/或甲醇(例如，如通过Iogen Corporation，Ontario，Canada加工)。
【0602】在一方面，应用本发明的方法和组合物制造的乙醇、丙醇、丁醇和/ 或甲醇可以用作燃料(例如，汽油)添加剂(例如充氧剂)或直接用作燃料。例如，通过本发明的方法制造的乙醇、丙醇、丁醇和/或甲醇——包括燃料——可以与乙基·叔丁基醚(ETBE)，或ETBE混合物如含有47％作为生物燃料的乙醇的ETBE，或与MTBE(甲基·叔丁基醚)一起混合。在另一方面，通过本发明的方法制造的乙醇、丙醇、丁醇和/或甲醇——包括燃料——可以与下列物质混合：
  IUPAC名   通用名   丁-1-烯   α-丁烯
  顺-丁-2-烯   顺-β-丁烯   反-丁-2-烯   反-β-丁烯   2-甲基丙烯   异丙烯
【0603】可以应用”A.B.E”(丙酮、丁醇、乙醇)发酵，进一步加工通过本发明的方法(例如，使用本发明的酶)制造的丁醇和/或乙醇；在一方面，丁醇是唯一的液体产物。在一方面，这种丁醇和/或乙醇在现有的汽油发动机(没有对发动机或汽车进行改进)中“直接”燃烧，产生比乙醇更多的能量和较少腐蚀性及较小的水可溶性，而且能够通过现有的结构分配。
【0604】本发明也提供了其中一种、几种或所有的醇通过包含至少一种本发明方法(例如，使用本发明的酶)的过程来制备的混合醇，例如包含乙醇、丙醇、丁醇、戊醇、己醇和庚醇的混合物，如ECALENETM(Power Energy Fuels，Inc.，Lakewood， CO)，例如：

【0605】在一方面，一种、几种或所有的醇通过使用本发明的酶的本发明的过程来制备，并且所述过程可以进一步包括生物质-到-液体的技术，例如，汽化过程来生产合成气，随后进行催化合成，或进行生物质到混合醇燃料的生物转化。
【0606】本发明也提供了这样的过程，所述过程包括使用本发明的酶结合(或被结合到)“天然气到液体”或GTL、或“煤到液体”或CTL、或“生物质到液体”或 BTL、或“油砂到液体”或OTL的过程；并且在一方面，本发明的这些过程被用于制造合成燃料。在一方面，本发明的这些过程之一包括：应用例如所谓的“Fischer Tropsch”过程(一种催化的化学反应，其中一氧化碳和氢被转化为各种形式的液体烃；使用的典型催化剂基于铁和钴；本过程的主要目的是生产作为合成润滑油或作为合成燃料使用的合成石油替代品)，从生物质中生产生物燃料(例如，合成燃料)。在一方面，本发明的这种合成生物燃料可以包含氧，并且可以作为高质量柴油和汽油的添加剂使用。
甘蔗渣的酶促过程
【0607】本发明提供了能够酶促处理(水解)甘蔗(甘蔗属(Saccharum))、甘蔗部分(例如，甘蔗稍)和/或甘蔗渣的多肽，即，用于甘蔗降解，或用于生物质处理的多肽，和编码这些酶的多核苷酸以及制造和使用这些多核苷酸和多肽。本发明提供了将包括甘蔗渣的木质纤维素残余物，或者糖制造厂或相关工业的任何废产物加工成木质纤维素水解产物的多肽和方法，所述木质纤维素水解产物本身可以是生物燃料或可以被进一步加工成为包括液体或其它燃料的生物燃料。由于本发明提供了甘蔗加工的酶和方法，除了制造醇(用于任何目的)和/或生物燃料例如生物乙醇的方法之外，其也提供了制造(生产)可食用糖、garapa、rapadura(papelón)、法勒娜姆酒(falernum)、糖蜜、浪姆酒(rum)、卡沙萨酒(Cachaca)是的方法。因此，本发明也提供了可食用的糖、garapa、rapadura(papelón)、法勒娜姆酒、糖蜜、浪姆酒(rum)、卡沙萨酒、醇、生物燃料，例如生物乙醇和类似物，以及它们的中间产物，包括本发明的多肽。
【0608】在一些方面，使用甘蔗，例如甘蔗渣作为底物用于生物转化具有几个优点：
1.其具有高的碳水化合物含量(纤维素，40-50％，和半纤维素，20-30％)；
2.其在加工的地点收集；
3.其是廉价的底物，并且供应量是恒定的，虽然在甘蔗工业内产生季节性供应。
【0609】本发明提供了水解甘蔗例如甘蔗渣内的纤维素和半纤维素多糖的多肽和方法，所述甘蔗渣与木质素有关，作为保护多糖不受微生物和它们的相关酶系统攻击的屏障起作用。由于木质纤维素的结构特征，如其木质素屏障和纤维素结晶，所以在一方面预处理过程被用于增强本发明的酶(一种或多种)接近生物质(甘蔗渣)中的多糖成分，从而增加转化为构件单糖如己糖和戊糖的转化产量。在一个使用本发明的酶(一种或多种)的本发明的示例性系统中，所产生的糖被有效地发酵成乙醇，而燃烧未水解的碳水化合物和木质素提供了足以为糖厂供应燃料的蒸汽。
【0610】在可选的方面，本发明的过程使用各种预处理，其可以被分为三类：物理的、化学的和复合的(物理的+化学的)。任何化学制品都可以被用作预处理剂，例如酸、碱、气体、纤维素溶剂、醇、氧化剂和还原剂。在这些化学品中，碱是最普遍的预处理剂，因为它相对便宜并且产生较少的纤维素降解。普通的碱氢氧化钠和石灰也可以用作预处理剂。虽然氢氧化钠显著增加了生物质的可消化性，但是其难以再循环，相对昂贵，并且处理起来有危险。相反地，石灰具有许多优点：其是安全的并且非常便宜，能够通过用二氧化碳对洗涤水进行碳酸盐化处理而回收。
【0612】在一方面，本发明提供了多酶系统(包括本发明的至少一种酶)，所述多酶系统能够水解甘蔗如甘蔗渣中的多糖，糖厂加工的甘蔗成分。在一方面，通过本发明的酶处理甘蔗，如甘蔗渣，所述本发明的酶由生物(例如，转基因动物、植物、转化的微生物)和/或表达本发明的酶的副产品(例如，收获的植物、果实、种子)制备。在一方面，所述酶是由待加工成燃料的植物或生物质制备的重组酶，例如本发明提供了包含本发明的酶的转基因甘蔗渣。在一方面，这些组合物和产物在本发明的方法中使用，所述方法包括用于天然生物质转化，例如，用于生物质水解来制备生物燃料，如生物乙醇、生物丙醇、生物丁醇、生物甲醇、以液体或气体形式的合成燃料如“合成气”的化学循环。
【0613】在一方面，本发明提供了由厌氧微生物厌氧消化有机材料过程产生的生物燃料，例如生物气，其中所述过程包括使用本发明的酶或本发明的方法。这种生物燃料，例如生物气，可以从生物可降解废物材料产生，或者通过应用被供应给厌氧蒸煮器以补充气体产量的能源作物来产生。固体产品——消化物——也可以被用作生物燃料。
【0614】在一方面，本发明提供了生物燃料，例如，包含甲烷的生物气，其中所述过程包括使用本发明的酶或本发明的方法。这种生物燃料，例如生物气，可以在工业厌氧蒸煮器和机械生物处理系统中回收。可以应用本发明的酶或本发明的方法，进一步处理(垃圾)掩埋气；在处理之前，掩埋气可以是在填埋场中通过天然发生的厌氧消化产生的较不清洁的生物气。反之，如果垃圾掩埋气被允许排放到大气中，那么其将是潜在的温室气体。
【0615】本发明提供了从各种废物制造生物产生的油和气体的方法，其中所述过程包括使用本发明的酶或本发明的方法。在一方面，这些方法包括热解聚废物，从而提取甲烷和其它类似于石油的油；或者包括，例如，生物反应器系统，所述生物反应器系统利用无毒的光合藻类吸纳烟囱废气和生产生物燃料，如生物柴油、生物气和相当于煤的干燃料，例如，如由GreenFuel Technologies Corporation， Cambridge，MA所设计的。
【0616】本发明提供了制造生物产生的油——包括原油——和可以用于柴油发动机的天然气的方法，其中所述方法包括使用本发明的酶和本发明的方法。在一方面，这些方法可以将石油，例如原油精炼成煤油、石油、柴油和其它馏分。
【0617】本发明提供了从下列物质制造生物产生的油的方法(使用本发明的酶或本发明的方法)：
·直接植物油(Straight vegetable oil)(SVO)
·废弃植物油(WVO)——在数量上主要由商业厨房产生的废弃烹饪油和油脂。
·生物柴油，从动物脂肪和植物油的酯交换获得，在石油柴油发动机中直接可用。
·生物衍生的原油，和通过包含非油基材料的复合有机材料例如，废物如旧轮胎、废料、木材和塑料的热解聚作用制备的生物气和碳固体。
·高温分解油，其可以只在闪速热解过程(flash pyrolysis process)中采用加热 (所述油在用于传统的燃料系统或内部燃烧发动机中之前必须被处理)从生物质、木材废物等生产。
·木材、木炭和干粪。
动物饲料和食品或饲料添加剂
【0618】除了提供人使用的膳食辅助物或补充剂，或食品补充剂和添加剂，本发明也提供了使用应用本发明的多肽，例如具有本发明的木质纤维素活性，例如，糖基转移酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的蛋白质，和/或应用本发明的抗体处理动物饲料和食品及食品或饲料添加剂的组合物和方法。本发明提供了包含本发明的木质纤维素酶和/或本发明的抗体的动物饲料、食品和添加剂。动物可以是任何家畜或任何动物。
【0619】本发明的动物饲料添加剂可以是颗粒化的酶产物，其可以容易地与饲料组分混合。可选地，本发明的饲料添加剂可以形成预混合的组分。本发明的颗粒化的酶产物可以被包被或不包被。酶颗粒的颗粒大小可以与饲料和预混组分的大小相容。这提供了将酶合并进饲料的安全且方便的方式。可选地，本发明的动物饲料添加剂可以是稳定的液态组合物。其可能是水基或油基的浆体。参见美国专利号 6,245,546。
【0620】在动物饲料或食品的改善中，本发明的木质纤维素酶，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶可以在体外(通过改变饲料或食品的成分)或在体内加工食品或饲料。本发明的多肽可被加到动物饲料或食品组合物中。
【0621】在一方面，本发明的酶与另一种酶一起加入，例如，β-半乳糖苷酶、过氧化氢酶、漆酶、其它的纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β- 漆酶、内切-β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或葡萄糖氧化酶。这些酶消化产物更容易被动物消化。因此，本发明的木质纤维素酶，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶有助于饲料或食物的能量的有效利用，或者通过降解纤维素，有助于食物或饲料的可消化性。
【0622】在另一方面，本发明的木质纤维素酶，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶可以通过直接在转基因饲料作物(作为，例如转基因植物、种子等)，如谷类、谷物、玉米、大豆、油菜籽、羽扇豆等中表达所述酶而供应。如上文讨论，本发明提供了包含编码本发明多肽的核酸序列的转基因植物、植物部分和植物细胞。在一方面，核酸被表达，以使本发明的木质纤维素酶以可回收的量被生产。木质纤维素酶可以从任何植物或植物部分中被回收。可选择的是，含有重组多肽的植物或植物部分可用来改善食物或饲料的性质，例如，改善营养价值、可口性等等。
【0623】在另一方面，本发明的酶输送基质是以分散的多个微粒、小丸或颗粒形式存在。“颗粒”的含义是被压扁或压紧的微粒，如通过制丸、挤压或类似的压制过程从基质中去除水分。微粒的这种压缩或压紧也可促进微粒的微粒内粘聚性。例如，通过在制丸机(pellet mill)中将基于谷物的基质制丸来制备颗粒。由此制备的小丸被研磨或粉碎成适合用作动物饲料辅料的颗粒大小。由于基质本身被批准用于动物饲料，所以在动物饲料中它可用作输送酶的稀释剂。
【0624】在一方面，本发明的酶输送基质和方法中包含的木质纤维素酶，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶是如本文所述的热稳定木质纤维素，以便抵御生产过程中木质纤维素酶的失活，在生产过程中升高的温度和/或蒸汽可以被用来制备丸化的酶输送基质。在消化含有本发明的酶输送基质的饲料的过程中，水相消化液将引起活性酶的释放。其它类型的热稳定酶和热稳定的营养补充剂也可被掺入输送基质中，用于在任何类型的含水条件下释放。
【0625】在一方面，出于许多不同的目的，可以对酶基质微粒应用包衣，如为了向动物饲料中添加调味剂或营养补充剂，为了在胃内条件下延缓动物饲料补充剂和酶的释放，以及类似的目的。在一方面，可应用包衣来实现功能性目的，例如在需要延缓酶从基质微粒中释放或控制酶将被释放的条件时。包衣材料的组分可以是这样的，其可选择性地被其敏感的试剂(如热、酸或碱、酶或其它化学物质)分解。可选择地是，对不同的这样的分解剂敏感的两种或更多种包衣可被连续地应用于基质微粒。
【0626】本发明也涉及制备酶释放基质的方法。根据本发明，该过程包括提供基于谷粒的底物的多个分散颗粒，其颗粒大小适合用作酶释放基质，其中所述的颗粒包括由本发明的氨基酸序列编码的木质纤维素酶，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶。在一方面，该方法包括将酶释放基质的颗粒压制或压缩成微粒，在一方面主要是通过制丸来完成。防霉剂和粘聚剂，当被应用时，可在任何适合的时间被加入，并且在一方面，与基于谷粒的基质以期望的比例在将基于谷粒的基质制丸之前混合。制丸机进料中的含水量在一方面是上面所示的与最终产物含水量对应的范围，在一方面是大约14-15％。在一方面，水分以酶的含水制备物形式加入至原料中，使该原料达到此含水量。在制丸机中的温度在一方面用蒸汽达到大约82℃。制丸机可在任何条件下进行操作，对原料进行足够的操作以提供小丸。对于从含酶组合物中去除水分来说，制丸方法本身是一个很经济的方法。
【0627】本发明的组合物和方法可以结合施用益生素(prebiotics)进行实践，益生素是高分子量糖类，如低聚果糖(FOS)；低聚半乳糖(GOS)、GRAS(通常认为安全的(Generally Recognized As Safe))材料。这些益生素可以通过一些益生乳酸菌(LAB)进行代谢。它们对于大多数小肠微生物是不可消化的。
处理食品和食品加工
【0628】本发明提供了包含本发明的酶的食品和饲料，以及在加工食品和饲料的过程中使用本发明的酶的方法。本发明的纤维素酶，例如，内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶在食品加工工业中有多种应用。本发明提供了水解含纤维素组合物的方法，所述组合物包括例如植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物细胞，或任何植物或植物部分，或任何食品或饲料，废物产品等。
例如，本发明提供了包含本发明的木质纤维素酶的饲料或食品，例如在饲料、液体，如饮料(如果汁或啤酒)，面包或面团或面包产品，或饮品(如啤酒)或饮料前体(如麦芽汁)中。
【0629】本发明的食品处理工艺还可以包括使用其它酶的任何组合，其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、纤维二糖水解酶和/或葡萄糖氧化酶。
【0630】在一方面，本发明提供了用于水解液体(液化的)和粒状淀粉的酶和方法。这种淀粉可以源自任何来源，例如甜菜、甘蔗、马铃薯、玉米、小麦、蜀黍、高粱、裸麦或bulgher。本发明适用于任何植物淀粉来源，例如，可用于液化(例如，用来制造包括例如，生物醇如生物乙醇、生物甲醇、生物丁醇或生物丙醇的生物燃料)的谷物淀粉来源，其包括已知可生产适合液化的淀粉的任何其它谷物或蔬菜来源。本发明的方法包括液化来自任何天然材料，如大米，发芽的大米、玉米、大麦、蜀黍、小麦、豆类、马铃薯、甜菜、甘蔗和甘薯(例如，制造包含例如生物醇，如生物乙醇、生物甲醇、生物丁醇或生物丙醇的生物燃料)的淀粉。所述液化过程能够基本上水解淀粉而产生糖浆。液化的温度范围可以是已知在液化淀粉中有效的任何液化温度。例如，淀粉的温度可以在约80℃至约115℃之间，约100℃至约110℃之间，和约105℃至约108℃之间。应用本发明的酶和方法制造的生物醇除了用于(或用于制造)食品和饲料——包括含酒精的饮料——之外，可以用作燃料或用于燃料(例如，汽车燃料)例如，如下文中讨论的。
废物处理
【0631】本发明提供了用于废物处理的酶。本发明的纤维素酶，例如，内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/ 或阿拉伯呋喃糖苷酶可以被用于许多废物处理和相关的工业应用，例如，用于与生物质转化产生燃料有关的废物处理。例如，在一方面，本发明提供了使用本发明的木质纤维素酶的固体和/或液体废物消化方法。该方法可以包括减少基本上未处理的固体废物的量和体积。固体废物可在酶溶液(包括本发明的木质纤维素酶)存在的情况下用酶促消化方法在控制的温度下进行处理。这导致不需要添加微生物形成明显的细菌发酵的反应。固体废物被转变为液化的废物和任何残余的固体废物。得到的液化废物可与所述的任何残余的固化废物分离。见，例如美国专利5,709,796。
【0632】在一方面，本发明的组合物和方法用于例如在动物废物池如养猪农场的动物废物池中，在其它农业、食品和饲料加工，在衣服和/或纺织品加工、清洁或再生，或其它工业过程应用中去除气味、预防气味或减少气味。
【0633】用于生物质(例如，木质纤维素材料)转化成燃料(例如生物燃料，包括例如生物醇，如生物乙醇、生物甲醇、生物丁醇或生物丙醇)的酶和方法可以结合城市固体废物材料的处理/再循环，所述城市固体废物材料包括从城市直接获得的废物或者先前填埋随后回收的城市固体废物，或者下水道淤泥，例如含有明显量的纤维素材料的下水道淤泥块形式的下水道淤泥。由于下水道淤泥块通常不含有明显量的可再循环材料(铝、玻璃、塑料等等)，它们可以用浓硫酸直接处理(以降低废物的纤维素成分的重金属含量)，并在乙醇生产系统中进行处理。参见，美国专利6,267,309；5,975,439。
【0634】使用本发明的酶从废物材料回收有机物质和无机物质的另一种示例性方法包括通过使之经受热和压力来对固体有机物质进行灭菌并使之软化。该示例性方法可以通过首先搅拌废物材料，然后使之经受热和压力而进行，热和压对其进行灭菌并使其中包含的有机物质软化。一方面，在压力下加热之后，压力可以从多孔室突然释放，以向外推动经软化的有机物质通过容器的孔，从而从固体无机物质分离出有机物质。然后，经软化的无菌有机物质在发酵室中进行发酵，例如使用本发明的酶，例如，以形成醪液。该醪液可通过离心、蒸馏柱和/或厌氧蒸煮器进行进一步加工，以回收燃料如乙醇和甲烷、以及动物饲料补充物。参见，例如美国专利 6,251,643。
【0635】本发明的酶还可以用于降低工业废物或从畜牧业设施产生的废物以及类似废物的气味的工艺，例如预处理。例如，本发明的酶可用于处理废物存储设施中的动物废物，以增强大量的有机物质的有效降解，同时气味减少。该方法还可以包括接种利用硫化物的细菌和消化有机物的细菌以及裂解酶(除了本发明的酶之外)。参见，例如美国专利5,958,758。
【0636】本发明的酶还可用在移动系统(mobile system)，例如间歇式反应器 (batch type reactors)中，用于含水有害废物的生物再补救，例如，如在美国专利 5,833,857中所描述的。间歇式反应器可以是具有循环能力的大的容器，其中通过将营养物输入反应器中将细菌(例如，表达本发明的酶的细菌)维持在有效的状态。当流出物可以被输送到反应器中或者反应器被建成为废水处理系统时，可以采用这样的系统。本发明的酶还可以用在这样的处理系统中，该处理系统在小的或临时的遥远场所使用，例如，移动式的、大容量、高效的多功能废水处理系统。
【0637】本发明的废物处理方法可以包括使用其它酶的任何组合，其它酶例如其它木质纤维素酶，如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切 -β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、肌醇六磷酸酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或葡萄糖氧化酶。
洗涤剂组合物
【0638】本发明提供了含有本发明的一种或多种多肽(例如，具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶)的洗涤剂组合物，以及制备和使用这些组合物的方法。本发明包括了制备和使用洗涤剂组合物的所有方法，见，例如美国专利 6,413,928；6,399,561；6,365,561；6,380,147。洗涤剂组合物可以是一个部分和两个部分的含水组合物、不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压缩片剂、凝胶和/或糊剂和浆液的形式。本发明还提供了能够使用这些洗涤剂组合物快速除去总食物类污垢、或食物残留的膜以及其它少量食物组分的方法。本发明的酶通过淀粉多糖的催化水解可以促进淀粉污物的去除。本发明的酶可用于洗碟用洗涤剂、纺织品洗涤洗涤剂中。
【0639】实际的活性酶含量取决于制造洗涤剂组合物的方法，这不是至关重要的，只要洗涤剂溶液具有期望的酶活性。在一方面，存在于最终溶液中的葡糖苷酶的量的范围为每克洗涤剂组合物大约0.001mg至0.5mg。选择用于本发明的方法和产品的特定酶依赖于最终应用的条件，包括产品的物理形式、应用pH、应用温度和要被降解或改变的污垢类型。对于任何指定的一组应用条件，可以选择酶以提供最佳的活性和稳定性。在一方面，本发明的多肽在大约4至大约12的pH范围内，大约20℃至大约95℃的温度范围内是有活性的。本发明的洗涤剂可以包括阳离子表面活性剂、半极性的非离子表面活性剂或两性离子表面活性剂；或其混合物。
【0640】本发明的酶(例如，具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶) 可被配制成粉末状和液体的洗涤剂，其具有在4.0至12.0之间的pH，按重量计为大约0.01％至大约5％(优选0.1％至0.5％)的水平。这些洗涤剂组合物也可以包括其它的酶如已知的蛋白水解酶、纤维素酶、脂酶或内切糖苷酶和/或葡萄糖氧化酶以及助洗剂和稳定剂。向传统的清洁组合物中添加本发明的酶不会产生任何特殊的应用限制。换句话说，适合洗涤剂的任何温度和pH也适用于本发明的组合物，只要pH在上述范围内，而温度在所描述的酶的变性温度之下。另外，本发明的多肽可用于不需要洗涤剂的清洁组合物中，而且单独应用或与助洗剂和稳定剂联合应用。
【0641】本发明提供了清洁组合物，包括清洁硬表面的洗涤剂组合物、清洁织物的洗涤剂组合物、洗碟用组合物、口腔清洁组合物、假牙清洁组合物和隐形眼镜清洗液。
【0642】在一方面，本发明提供了清洗物体的方法，包括将物体与本发明的多肽在可充分清洗的条件下接触。本发明的多肽可以作为洗涤剂添加剂而被包括。本发明的洗涤剂组合物，可以例如被配制为含有本发明多肽的手工或机器洗衣的洗涤剂组合物。适合用于预处理污染织物的洗衣添加剂可含有本发明的多肽。织物柔软剂组合物可含有本发明的多肽。可选的，本发明的多肽可被配制成洗涤剂组合物，用于通常的家庭硬表面清洗工作中。在可选择的方面，本发明的洗涤剂添加剂和洗涤剂组合物可以包含一种或多种其它的酶，例如蛋白水解酶、脂酶、角质酶、另一种葡糖苷酶、糖酶、另一种纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶，例如，乳糖酶和/或过氧化物酶，和/或葡萄糖氧化酶。所选择的本发明的酶(一种或多种)的特性可与所选择的洗涤剂相容(即，最佳 pH，与其它的酶或非酶成分相容，等)，并且，所述酶(一种或多种)是以有效量存在。在一方面，本发明的酶用来从织物中去掉有恶臭的物质。在实施本发明中可使用的各种洗涤剂组合物和制备它们的方法描述在，例如美国专利6,333,301； 6,329,333；6,326,341；6,297,038；6,309,871；6,204,232；6,197,070；5,856,164。
【0643】本发明的洗涤剂和相关的方法还可以包括使用其它酶的任何组合，其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或葡萄糖氧化酶。
处理织物和纺织品
【0644】本发明提供了使用本发明的一种或多种多肽处理织物和纺织品的方法，所述多肽例如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶。本发明的多肽可以在任何织物处理方法中使用，这些方法在本技术领域是已知的，例如参见美国专利6,077,316。例如，一方面，织物的手感和外观通过包括将织物与本发明的酶在溶液中接触的方法得到改进。一方面，用溶液在压力下处理织物。
【0645】在一方面，本发明的酶在织物的编织过程中或之后应用，或在脱浆阶段应用，或在一个或多个其它的织物处理步骤中应用。在织物的编织过程中，线被施加相当大的机械张力。在机械织布机上进行编织之前，经纱通常用上浆淀粉或淀粉衍生物涂覆，以便提高它们的拉伸强度并防止断裂。本发明的酶可用于去除这些上浆淀粉或淀粉衍生物。在纺织品已经编织好之后，织物可以继续进行到脱浆阶段。随后可以是一个或多个额外的织物加工步骤。脱浆是从纺织品中去除浆料的作用过程。在编织之后和进一步加工织物之前，必须去除浆料涂层，以便确保均匀且耐洗的效果。本发明提供了一种脱浆方法，包括通过本发明酶的作用对浆料进行酶促水解。
【0646】本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β- 葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶) 可作为去污剂添加剂对织物进行脱浆，所述织物包括含棉织物，所述酶可以例如在含水组合物中。本发明提供了在靛类染色的斜纹粗棉布织物和衣服上产生砂洗外观的方法。对于服装制造，织物可以被剪裁并缝纫为衣料或服装，它们在后来被整理 (修整，finishing)。尤其是，对于粗斜纹布牛仔裤的制造，已经开发了不同的酶促整理(修整)方法。斜纹粗棉布服装的整理通常从酶脱浆步骤开始，在该步骤中服装经受淀粉分解酶的作用，以便给织物提供柔软性，使得棉更易于进行后面的酶促整理步骤。本发明提供了使用本发明的酶整理(修整)斜纹粗棉布服装(例如“生物-石磨方法(bio-stoning process)”)、酶促脱浆并给织物提供柔软性的方法。本发明提供了在脱浆和/或整理过程中快速软化斜纹粗棉布服装的方法。
【0647】本发明还提供了含有本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶)的消毒剂。
【0648】本发明的织物或纺织品处理方法还可以包括使用其它酶的任何组合，其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或葡萄糖氧化酶。
纸或纸浆处理
【0649】本发明的酶(例如，具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、 β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶) 可以在纸或浆处理或纸脱墨中使用。例如，在一方面，本发明提供了使用本发明的酶的纸处理方法。在一方面，本发明的酶可以被用来改性纸中的淀粉，从而将其转化为液化形式。在另一方面，在化学和酶促脱墨过程中处理回收的影印纸的纸成分。在一方面，本发明的酶可以与其它酶一起使用，所述其它酶包括其它纤维素酶(包括其它内切葡聚糖酶、纤维二糖水解酶和/或β-葡糖苷酶)。木材、木材废物、纸、纸产品或浆可以通过如下三种方法来处理：1)在本发明的酶存在的情况下进行分解；2)用脱墨化学品和本发明的酶进行分解，和/或3)在用本发明的酶浸透后进行分解。与仅仅用纤维素酶处理的纸相比，用本发明的酶处理的回收纸可以具有更高的亮度，原因在于去除了墨粉颗粒。尽管本发明不受任何特定机理的限制，但本发明的酶的效果可能是由于其在纸浆悬浮物中作为表面活性剂的结果。
【0650】本发明提供了使用本发明的一种或多种多肽处理纸和纸浆的方法。本发明的多肽可以在任何纸处理或纸浆处理方法中使用，这些方法在本技术领域是熟知的，例如参见美国专利6,241,849；6,066,233；5,582,681。例如，在一方面，本发明提供了对含有染料的印刷过的纸进行脱墨和脱色的方法，包括使印刷过的纸变成浆状物，以得到纸浆，并在本发明的酶(也可以加入其它酶)存在的情况下从纸浆中移去油墨。在另一方面，本发明提供了增加浆的打浆度的方法，所述浆例如由二次纤维(secondary fiber)制成的浆，这可以通过将含有本发明的酶的酶促混合物(也可以含有其它酶，例如果胶酶)加入到浆中，并在可引起反应的条件下进行处理，以产生酶促处理的浆。酶促处理的浆的打浆度相对于二次纤维浆的初始打浆度有所增加，而光度没有损失。
【0652】本发明的纸、木材、木材废物或浆处理或再循环工艺还可以包括使用其它酶的任何组合，其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或葡萄糖氧化酶。
再制浆(再浆化)：木质纤维素材料的处理
【0653】本发明也提供了用于处理木质纤维素纤维的方法，其中所述纤维用本发明的多肽(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶)处理，所述多肽以足以改进纤维特性的量被使用。本发明的酶也可以用于由淀粉强化废纸和纸板生产或再循环木质纤维素材料如纸浆、纸和纸板，尤其是在再制浆或再循环发生在高于7的pH的场合，以及本发明的酶可以通过降解强化淀粉来促进废物分解的场合。本发明的酶可以在由淀粉涂覆的印刷过的纸制备造纸纸浆的过程中有用。该过程可以按照例如WO 95/14807中的描述进行。一个示例性的方法包括分解纸以产生纸浆，在所述分解之前、分解过程中或分解之后用淀粉降解酶进行处理，并在分解和酶处理之后从纸浆中分离出油墨颗粒。也参见美国专利6,309,871和本文引述的其它美国专利。因此，本发明包括用于再循环纸浆的酶促脱墨的方法，其中多肽以足以有效地使纤维表面进行脱墨的量使用。
酿造和发酵
【0654】本发明提供了包含本发明的酶的啤酒酿造(例如发酵)方法，所述酶例如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶。在一个示例性的方法中，含淀粉的原料被分解，并被加工以形成麦芽。本发明的酶可以在发酵过程中的任何点使用。例如，本发明的酶可以在大麦麦芽的加工中使用。啤酒酿造的主要原料是大麦麦芽。这可以是一个三阶段过程。首先，大麦谷物被浸渍以增加水含量，例如增加到大约40％左右。第二，所述谷物可以在15-25℃温育3到6天以便发芽，此时酶合成在赤霉素的控制下被刺激。酶水平在此期间显著上升。在一方面，本发明的酶在该过程的这个(或任何其它)阶段加入。酶的作用导致可发酵的还原糖有所增加。这可以被表示为糖化力(diastatic power)，DP，在12℃糖化力可以在5天内从大约80上升到190。
【0655】本发明的酶可以在任何啤酒生产方法中使用，例如美国专利5,762,991； 5,536,650；5,405,624；5,021,246；4,788,066中所描述的。
增加来自地下地层的生产流体的流动
【0656】本发明也包括使用本发明的酶(如具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶)的方法，其中所述方法通过除去在生产作业过程中形成的粘性的、含淀粉的、破坏性流体来增加来自地下地层(地下形成物，subterranean formation) 的生产流体(production fluids)的流动；这些流体可以在地下地层中找到，所述地下地层包围着整个井孔。因此，本发明的方法导致生产液体能够从井孔流出。本发明的方法还着眼于破坏性流体的问题，该破坏性流体将来自地层的生产流体的流动降低到预期流速之下。在一方面，本发明通过将含水流体和本发明的多肽混合在一起配制酶处理物(使用本发明的酶)；将酶处理物泵入到井孔内的期望位置；允许酶处理物降解粘性、含淀粉的破坏性流体，从而流体能够从地下地层中移出至井表面；以及其中酶处理物可以有效地攻击含淀粉流体中的α葡糖苷键。
【0657】本发明的地下地层酶处理方法还可以包括使用其它酶的任何组合，其它酶例如色氨酸酶或酪氨酸脱羧酶、漆酶、过氧化氢酶、漆酶、其它纤维素酶、内切糖苷酶、内切-β-1，4-漆酶、淀粉葡糖苷酶、其它葡糖苷酶、葡萄糖异构酶、糖基转移酶、脂酶、磷脂酶、脂氧化酶、β-漆酶、内切-β-1，3(4)-漆酶、角质酶、过氧化物酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、脱羧酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、转谷氨酰胺酶、果胶甲基酯酶、其它纤维二糖水解酶和/或葡萄糖氧化酶。
药物组合物和膳食补充物
【0658】本发明还提供了含有本发明的纤维素酶(例如，具有内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的酶)的药物组合物和膳食补充物(例如，膳食助剂)。纤维素酶活性包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β- 木糖苷酶和/或阿拉伯呋喃糖苷酶活性。在一方面，药物组合物和膳食补充物(例如，膳食助剂)被配制用于经口摄取，例如，以提高具有高纤维素或木质纤维素成分的食物和饲料的可消化性。
【0659】牙周治疗化合物可以包括本发明的酶，例如，如在美国专利6,776,979 所述。用于治疗或预防酸性肠道综合症的组合物和方法可以包括本发明的酶，例如，如美国专利6,468,964所述。
【0660】在另一方面，创伤敷料、植入物和类似物包括抗微生物(如，抗生素 -作用)酶，包括本发明的酶(包括，例如，本发明的示例性序列)。本发明的酶也可用于藻酸盐敷料、抗菌防护敷料、烧伤敷料、压迫绷带、诊断工具、凝胶敷料、选择性透水敷料(hydro-selective dressing)、吸水(泡沫)敷料(hydrocellular(foam) dressing)、水胶敷料、I.V敷料、开刀防护巾(incise drape)、低附着敷料(low adherent dressing)、气味吸收敷料、石膏绷带(paste bandage)、术后敷料、伤疤控制、皮肤护理、透明膜敷料和/或伤口闭合。本发明的酶可用于伤口清细、创面床准备，以治疗压迫性溃疡、腿部溃疡、烧伤、糖尿病足溃疡、伤疤、IV固定、手术创伤和微创。本发明的酶可用于无菌酶促清创组合物如软膏中。在各个方面，纤维素酶被配制为片剂、凝胶、药丸、植入物、液体、喷剂、粉末、食物、饲料球或配制为胶囊化的制剂。
生物防御应用
【0661】在其它方面，本发明的酶和抗体——包括具有木质纤维素活性的酶，包含具有纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性的多肽——可以用于生物防御；例如，用于破坏含有木质纤维素物质或对本发明多肽的水解敏感的任何生物聚合物的孢子或微生物，例如细菌、真菌、酵母等。在生物防御应用中使用本发明的酶和抗体——包括具有木质纤维素活性的酶，包括具有纤维素酶、内切葡聚糖酶等活性的多肽——提供了显著的益处，因为它们可以被非常迅速地制造和/或开发，对抗任何目前未知的或未来的生物战剂。此外，具有木质纤维素活性的酶，包括具有纤维素酶等活性的多肽可用于受侵袭环境或材料——包括衣服或个体的去污染作用。因此，在一方面，本发明提供了含有具有木质纤维素活性的多肽，包括具有纤维素酶等活性的多肽的生物防御剂或生物解毒剂(一种或多种)或消毒剂，以及制造和使用它们的方法，其中所述多肽包括本发明的序列(包括，例如，本发明的示例性序列)，或者由本发明的核酸(包括，例如，本发明的示例性序列)编码的多肽。在一方面，所述多肽具有活性，包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶活性。
参考文献列表
1.Sambrook，J.and Russell，D.W.2001.Molecular Cloning：A Laboratory Manual.Third Edition.Cold Spring Harbor Laboratory Press，New York.
2.Benhar，I.Biotechnological applications of phage and cell display. Biotechnology Advances 19，1-13.2001.
3.Carbohydrate-Active Enzymes CAZy server on the internet；citation is Coutinho，P.M.&Henrissat，B.(1999)Carbohydrate-active enzymes：an integrated database approach.In″Recent Advances in Carbohydrate Bioengineering″，H.J.Gilbert， G.Davies，B.Henrissat and B.Svensson eds.，The Royal Society of Chemistry， Cambridge，pp.3-12.
4.Felix，C.R.and L.G.Ljungdahl.1993.The cellulosome：the exocellular organelle of Clostridium.Annu.Rev.Microbiol 47：791-819.：791-819.
5.Gray(2001)Rapid evolution of reversible denaturation and elevated melting temperature in a microbial haloalkane dehalogenase.Advanced Synthesis and Catalysis 343：607-617.
6.Guttman(1996)High-resolution capillary gel electrophoresis of reducing oligosaccharides labeled with 1-aminopyrene-3，6，8-trisulfonate.Anal.Biochem 233：234-242.
7.Harjunpaa(1996)Cello-oligosaccharide hydrolysis by cellobiohydrolase II from Trichoderma reesei.Association and rate constants derived from an analysis of progress curves.Eur.J Biochem 240：584-591.
8.Himmel(1999)cellulase for commodity products from cellulosic biomass. Curr.Opin.Biotechnol 10：358-364.
9.Kerr，R.A.1998.GEOLOGY：The Next Oil Crisis Looms Large--and Perhaps Close.Science 281：1128.
10.Kerr，R.A.2000.OIL OUTLOOK：USGS Optimistic on World Oil Prospects.Science 289：237.
11.King(1997)Expression cloning in the test tube.Science 277：973-974.
12.Kuritz，T.1999.An easy colorimetric assay for screening and qualitative assessment of deiodination and dehalogenation by bacterial cultures.Lett.Appl Microbiol 28：445-447.
13.Lundberg(1993)The use of selection in recovery of transgenic targets for mutation analysis.Mutat.Res.301：99-105.
14.MacKenzie(1998)Crystal structure of the family 7 endoglucanase I (Cel7B)from Humicola insolens at 2.2 A resolution and identification of the catalytic nucleophile by trapping of the covalent glycosyl-enzyme intermediate.Biochem J 335：409-416.
15.Richardson(2002)A novel，high performance enzyme for starch liquefaction.Discovery and optimization of a low pH，thermostable alpha-amylase.J Biol Chem 277：26501-26507.
16.Sakon(1997) Structure and mechanism of endo/exocellulase E4 from Thermomonospora fusca.Nat.Struct.Biol 4：810-818.
17.Short(1988)Lambda ZAP：a bacteriophage lambda expression vector with in vivo excision properties.Nucleic Acids Res.16：7583-7600.
18.Snustad(1988)Maize glutamine synthetase cDNAs：isolation by direct genetic selection in Escherichia coli.Genetics 120：1111-1123.
19.Varrot(1999)Crystal structure of the catalytic core domain of the family 6 cellobiohydrolase II，Cel6A，from Humicola insolens，at 1.92 A resolution.Biochem J 337：297-304.
20.Yano(1998)Directed evolution of an aspartate aminotransferase with new substrate specificities.Proc.Natl.Acad.Sci U.S.A 95：5511-5515.
21.Zverlov(2002)A newly described cellulosomal cellobiohydrolase，CelO， from Clostridium thermocellum：investigation of the exo-mode of hydrolysis，and binding capacity to crystalline cellulose.Microbiology 148：247-255.
[662]提供下列实施例来说明但不是限制所要求保护的发明。
实施例
实施例1：使用GIGAMATRIXTM筛选的示例性筛选方案
【0663】本发明提供了筛选具有木质纤维素活性的酶的方法。这些描述的方法也可以用于确定酶是否具有必需的活性以及是否在要求保护的发明的范围之内。在一方面，本发明的方法使用Verenium公司专有的GIGAMATRIXTM平台；参见PCT 专利公布号WO 01/38583；美国专利申请20050046833；20020080350；美国专利 6,918,738；设计专利D480,814。例如，在一方面，GIGAMATRIXTM被用于确定多肽是否具有木质纤维素活性以及是否在本发明范围内的方法中、或者鉴定和分离具有木质纤维素活性的多肽，例如具有糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶和/或β-葡糖苷酶(β-葡糖苷酶)活性的多肽的方法中。
【0664】GIGAMATRIXTM平台可以包括基于100,000孔微板的超高通量筛选，该微板具有常规96孔板的尺寸。虽然在本实施例中，使用了两种(2种)底物—— 甲基伞形酮酰纤维二糖苷(methyl-umbelliferylcellobioside)(MUC)和甲基伞形酮酰乳糖苷(methylumbelliferyl lactoside)(MUL)进行GIGAMATRIXTM筛选，但是对于任何木质纤维素活性特异的或具有决定性的任何底物，包括纤维素酶、内切葡聚糖酶、纤维二糖水解酶和/或β-葡糖苷酶都可以被使用。
【0665】可以筛选噬粒形式的不同克隆，因为底物扩散入细胞，并且荧光被认为更容易检测到。使用缺乏β-半乳糖苷酶的宿主株，以降低对乳糖苷底物的活性。乳糖苷底物可以导致更少的命中(hit)，并且可被认为比纤维二糖底物更具有专一性。此外，乳糖苷底物产生更少的β-葡糖苷酶命中。二次筛选由在琼脂板上铺上克隆以及然后将菌落挑选入含有培养基和MUL的384孔板中组成。针对MUL有活性的克隆与非活性克隆的背景中区分开来。然后，单独的克隆可以过夜生长并测量荧光。然后拣选最具活性的命中物用于测序。
表征酶和底物活性
【0666】在GIGAMATRIXTM筛选中发现的命中物首先针对纤维六糖进行筛选，以确定对纤维素寡聚体的作用模式。克隆在含有抗生素的TB培养基中过夜生长，然后裂解细胞并通过离心澄清裂解液。用合适的诱导剂诱导，使亚克隆生长至 OD600＝0.5，然后在裂解细胞并澄清裂解液之前生长额外的3小时。基因组克隆通常比亚克隆具有更低的活性，但却是在大范围的克隆中评价活性的更方便的途径。使用薄层色谱(TLC)进行终点反应的初步研究，通常进行24h。也可以在磷酸溶胀纤维素(PASC)上测试酶，磷酸溶胀纤维素是结晶纤维素，其通过酸处理溶胀而更加不定形。
【0667】对PASC具有活性的纤维素酶也可以释放纤维二糖以及纤维三糖和/ 或葡萄糖。来自GIGAMATRIXTM发现尝试的克隆也针对PASC以及在纤维素底物例如纤维六糖(例如，Seikagaku，Japan)上进行了测试。薄层色谱(TLC)试验可以用于表明，一些克隆能够水解纤维六糖。在这些克隆中，一些克隆能够产生葡萄糖作为最终产物。几种酶可以产生纤维二糖和/或较大的片段，但是当到产物模式的确切性质不能通过TLC试验认识清楚时，也可以使用毛细管电泳(CE)方法。
实施例2：基于序列的发现
【0668】本发明提供了使用本发明的核酸序列，例如作为杂交探针和/或作为扩增(例如，PCR)引物，鉴定和分离生物质-(例如，甘蔗渣、玉米纤维)-降解酶，包括具有木质纤维素活性例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶(例如，β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽的方法。
【0669】本发明提供了用于扩增(例如，通过PCR)编码具有木质纤维素活性，例如糖基水解酶、纤维素酶、内切葡聚糖酶、β-葡糖苷酶(β-葡糖苷酶)、木聚糖酶、甘露聚糖酶、β-木糖苷酶(例如，β-木糖苷酶)和/或阿拉伯呋喃糖苷酶活性的多肽的核酸(包括转录物或基因)的扩增引物对，或用于扩增编码能够将可溶的纤维寡糖和阿拉伯木聚糖水解(降解)成单体木糖、阿拉伯糖和葡萄糖的多肽的核酸，其中所述引物对能够扩增包含本发明的序列或其片段或子序列的核酸。扩增引物序列对的一个或每一成员可以包括含有所述序列的至少大约10至50或更多个连续碱基，或所述序列的大约10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个连续碱基的寡核苷酸。本发明提供了扩增引物对，其中所述引物对包括第一成员和第二成员，所述第一成员具有本发明核酸的大约前(5’端)12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多个残基所示出的序列，所述第二成员具有所述第一成员的互补链的大约前(5’) 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、35、36或更多个残基所示出的序列。
实施例3：木质纤维素酶的遗传工程化及其筛选
【0670】本实施例描述了本发明酶的遗传工程化的示例性方案。本发明的工程化、或“优化”的酶可用于生物质(例如，甘蔗渣、玉米纤维)向单糖、燃料和/或化学品或其它有用的产品的转化中；例如，用于制造基于石油的产品的有效和可持续的替代品。本发明的工程化、或“优化”的酶可以在生物体(例如，微生物，如细菌)中表达，以参与涉及天然生物质转化的化学循环。在一方面，本发明的这种工程化、或“优化”的酶以“酶整体”使用，用于将纤维素和半纤维素聚合物有效解聚成可代谢的碳部分。如上所讨论，本发明提供了发现和实施最有效的酶的方法，以使这些重要的新的“生物质转化”和可选择的能源工业方法可行。
【0671】使用宏基因组发现法(metagenomic discovery)和定向进化的非随机法(称为如在例如美国专利6,939,689所述，其包括基因位点饱和诱变(或GSSM)(如上所讨论，也参见美国专利6,171,820和6,579,258) 以及可调基因再装配(Tunable GeneReassembly(TGR)(参见，例如美国专利 6,537,776)技术。这些技术可以用于发现和优化用于将木质纤维素生物质材料(例如，纤维素)还原(例如，水解)成单糖(例如葡萄糖)的酶成分、纤维二糖水解酶和其它糖类。
【0672】在一种实施方式中，使用Verenium公司的GIGAMATRIXTM高通量表达筛选平台(如上讨论)，进行酶发现筛选以鉴定酶；例如使用甲基伞形酮酰纤维二糖苷作为底物来鉴定纤维二糖水解酶。可以表征命中对Microcrystalline Cellulose(MCC)(FMC Corporation，Philadelphia，PA)的活性。
【0673】在一方面，酶被选择作为候选，用于利用基因位点饱和诱变(或GSSM) 技术进行优化。在一种实施方式中，在进行GSSM进化之前，信号序列——如果存在的话——可以被除去并且加入起始甲硫氨酸。如上所述，GSSM技术可以快速将蛋白质中的所有氨基酸以顺序方式突变成19种其它氨基酸。使用基于纤维的测定来筛选突变体，并鉴定表现出单个氨基酸变化的潜在的上游突变体(upmutants)。这些上游突变体可以被组合成新的文库，该新文库代表着上游突变体的组合。可以筛选该文库，结果鉴定出几种候选酶，可以用于商业化。
上游突变体的掺混
【0674】使用基因再装配(可调基因再装配(TGR))技术，GSSM上游突变体(酶编码序列变体)可以被“掺混”(混合在一起以达到最佳的效果)以构建具有期望活性或特性的酶；然后可以应用筛选(例如，GSSM)以鉴定出具有最期望活性或特性(例如，耐热性)的候选(一个或多个)。活性测定与GSSM筛选中的相同，只是反应物被进一步稀释，以考虑到上游突变体相对于野生型酶具有增加的活性。
实施例4：用于加工/转化生物质的酶混合物或“鸡尾酒”
【0675】本发明提供了酶的新的组合物或混合物或“鸡尾酒”，用于将含木质纤维素的生物质例如，甘蔗渣或玉米纤维加工成可用的产品，例如加工成木质素或单糖如葡萄糖，所述可用的产品可以随后被加工成为乙醇。本实施例描述了将生物质，例如甘蔗渣消化成可发酵的糖的本发明的酶混合物或“鸡尾酒”以及它们的开发。在一方面，所述酶混合物或“鸡尾酒”包括至少一种本发明的示例性酶。本发明的混合物(“整体”或“鸡尾酒”)也可以包括任何其它的酶，例如葡萄糖氧化酶、磷酸化酶和酰胺酶等和类似物。
【0676】在一种实施方式中，本发明的酶混合物或“鸡尾酒”被用于水解木质纤维素材料，例如，纤维素或任何β1，4-连接的葡萄糖部分和/或半纤维素或任何支化聚合物，所述支化聚合物包括β1，4-连接的木糖主链和阿拉伯糖、半乳糖、甘露糖、葡糖醛酸的分支和/或连接到木质素的键，例如通过阿魏酸酯基团连接。因而，在各个方面，由于糖和键的可变性，本发明的方法和组合物着重于从半纤维素到单体糖的消化中的复杂性和各种问题。
示例性组合酶筛选方案
1.制备酶组板(Enzyme Panel Plate)
1.1在50％甘油中重悬冻干的蛋白质粉末至25mg蛋白质/mL的浓度
1.2将200μl的每种酶排列在96孔板上
1.3在-20℃储存
2.制备酶鸡尾酒板
2.1在diH20中制备恒定酶的11.11X溶液(0.1mg/mL的总酶浓度)
2.2将27μL分加到两个96孔板的孔中(高剂量和低剂量)
2.3将3μL从酶组板转移到高剂量板，充分混合
2.4将3μL从高剂量板转移到低剂量板，充分混合
3.制备底物缓冲溶液
3.1需要pH控制的缓冲液、叠氮钠和木聚糖酶，在1.11X浓度(分别为55.56 mM、5.56mM和0.32mg/mL)
3.2需要0.1％纤维素(大约2％的预处理的研磨的甘蔗渣，取决于底物批次的纤维素浓度)的1×浓度的底物
4.制备终止板
4.1制备150mM的碳酸钠缓冲溶液，pH10
4.2以每孔60μL分配到384孔板
5.制备消化板
5.1以每孔180μL缓冲底物分配到两个96孔板(高剂量板和低剂量板)
5.2将20μL从高剂量鸡尾酒板转移到高剂量消化板，用吸管混合
5.2.1使底物短暂沉淀并在T＝0时间点将20μL从消化板转移到终止板
5.3.对于低剂量鸡尾酒板，重复步骤5.2
5.4密封消化板并在37℃温育4小时
5.5以3000rpm旋转消化板1分钟，以使上清旋转到板的底部
5.6在T＝4小时时间点，将20μL从消化板转移到终止板
5.7向终止板加入葡萄糖和纤维二糖标准物
6.β-葡糖苷酶消化
6.1在125mM磷酸钠缓冲液，pH 7.0中制备β-葡糖苷酶溶液(大约35 mg/mL)并且以每孔35μL分配到384孔板中
6.2使用APRICOTTM系统(Process Analysis and Automation Ltd，Hampshire， UK)，将4μL从终止板转移到β-葡糖苷酶板；在室温下温育3小时
7.葡萄糖氧化酶(GO)分析
7.1制备2×GO分析溶液
7.1.1100mM pH7.4磷酸钠缓冲液，2U/mL葡萄糖氧化酶，0.2U/mL 辣根过氧化物酶，0.1mM Amplex Red。充分混合
7.2立即向β-葡糖苷酶板加入40μL/孔；在室温温育25-30分钟
7.3在分光光度计上读取530nm/595nm激发/发射波长。
在下面实施例5中描述了单个的酶活性筛选的试验，包括示例性大规模酶消化性试验。
下列表4总结了本发明的几种示例性酶“鸡尾酒”或混合物及其表征：

1对于平均DVSA#1转化值标准化的百分比转化

【0677】本发明的额外的酶“混合物”或“鸡尾酒”包括示例性酶SEQ ID NO：34； SEQ ID NO：360；SEQ ID NO：358和SEQ ID NO：371的下列几种组合。下表总结了在包括在0.1％底物上的37℃消化条件下各种示例性混合物的酶促活性结果，其中所述总酶剂量在20mg/g纤维素保持不变：

【0678】总结了在包括在0.1％底物上的37℃消化条件下各种示例性混合物的酶促活性结果的数据示于图7中。
【0679】本发明的额外的酶“混合物”或“鸡尾酒”包括示例性酶SEQ ID NO：358； SEQ ID NO：360；SEQ ID NO：168的下列几种组合；下表总结了在包括在0.1％底物上的37℃消化条件下各种示例性混合物的酶促活性结果，其中所述总酶剂量在20mg/g纤维素保持不变：

                           具有22419
             转化   stdev  转化    stdev
AB           0.4％  0.1％   2.7％  0.5％
C+载体对照                  0.8％  0.1％
AA     0.3％  0.0％    1.4％  0.0％
BB     0.2％  0.1％    2.4％  0.1％
A      0.3％  0.0％
B      0.2％  0.1％
C      0.8％  0.1％
A+B    0.4％  0.1％
B+C    2.4％  0.1％
A+C    1.4％  0.0％
A+B+C  2.7％  0.5％
【0680】总结了在包括在0.23％甘蔗渣上的37℃消化条件下各种示例性混合物的酶促活性结果的数据示于图8中。
【0681】酶B和酶C一起具有协同效应：单独地，酶B产生0.2％的转化而酶 C产生0.8％的转化，因此，会预期将它们一起使用将产生1％的转化，但是，酶B 和酶C组合产生了2.4％的转化——明显地是协同效应。包含本发明的混合物或“鸡尾酒”的本发明的其它组合物也可以对于生物质的水解，例如，甘蔗渣转化产生协同效应，如在本实施例中所描述的。
实施例5：本发明酶的活性表征
【0682】本实施例描述了用于表征和鉴定本发明的酶的可选示例性筛选方案。例如，本实施例描述了本发明示例性酶如何被鉴定和如何作为用于水解生物质—— 例如，植物生物质如甘蔗渣或玉米纤维(例如，玉米种子纤维)——的木质纤维素水解酶使用。在一方面，本发明的示例性酶可单独使用或与糖基水解酶、内切葡聚糖酶、纤维二糖水解酶和/或β-葡糖苷酶联合使用，用于例如处理，例如糖化纤维素或含纤维素组合物，如植物生物质，例如甘蔗渣、玉米纤维或其它植物废弃材料 (如干草或秸秆，例如水稻秸秆或小麦杆，或任何谷类植物的任何干杆)或者加工或农业副产品。
定量葡萄糖的葡萄糖氧化酶分析
【0683】本示例性方案描述了对葡萄糖进行定量的葡萄糖氧化酶分析：荧光酶 -偶联分析用于间接测量复合混合物(例如，原料、纤维样品、甘蔗渣、玉米纤维或其它植物废弃材料或加工或农业副产品等)中的葡萄糖浓度。用葡萄糖氧化酶氧化糖类的酶促水解过程中产生的葡萄糖：该氧化作用与过氧化物酶和荧光染料偶联，并且通过与葡萄糖标准曲线比较量化所产生的荧光。所述分析的示意图，如图 6中所示，示出了FAD与葡萄糖氧化酶结合并且FAD不是添加的成分。
【0684】下列物质是本示例性分析(试验)所需要的：
·粉末状葡萄糖氧化酶(例如，黑曲霉(A.niger)Sigma Cat#G 7141)；
·辣根过氧化物酶(液体：例如，Sigma Cat#P 6140)；
·AMPLEX REDTM(10-乙酰基3，7二羟基吩噁嗪(Dihydroxyphenoxazine)；例如，Molecular Probes Cat#A 12222)；
·葡萄糖；
·磷酸钠缓冲液，pH 7.5，50mM；
·二甲基亚砜(DMSO)；
·黑色微孔板；
·荧光板读取器(例如，Tecan、SpectraMax等)。
【0685】除非另外指明，需要下述pH 7.5磷酸钠缓冲液中的储液。当在所推荐的温度下储存时，所有这些储液可稳定几个星期。
·葡萄糖氧化酶：配制100U/ml溶液，保存在4℃；
·辣根(HR)过氧化物酶：配制40U/ml的溶液，保存在4℃；
·AMPLEX REDTM(10-乙酰基3，7二羟基吩噁嗪)：将5mgAMPLEX REDTM 溶解到3.880ml的DMSO中，以制备5mM的溶液(AMPLEX REDTM的分子量(MW) 为257.25)。将此溶液存在黑暗小瓶中，保存在-20℃；
·葡萄糖：为了防止微生物生长和葡萄糖储液的消耗，在10mM叠氮钠中制备并冷冻保存。
【0686】试剂的工作储存液应该只在分析之前制备。假定每一反应使用45μl 试剂，根据具有的样品的数量来计算将配制的试剂的体积，例如，100个样品为4.5 ml工作储存试剂。配制比将需要的试剂稍微多一些的试剂，以避免在样品的最后一列上吸入空气。AAO工作储存试剂是含有1％(v/v)的每一种酶储存液(1％的 100U/ml葡萄糖氧化酶和1％的20U/ml HR过氧化物酶)和1％荧光试剂(5mM 10- 乙酰基3，7二羟基吩噁嗪或AMPLEX REDTM)的磷酸钠缓冲液。
【0687】从酶促反应板中将5ul吸取到黑色微孔板中(例如，或者96孔或384 孔板)，并加入45ul工作储存试剂。一定要在板中包括葡萄糖的标准曲线，从而能够比较温育时间稍微不同的板。在黑暗中温育大约15-20分钟并在荧光板读数器上进行终点读数。对于试卤灵(Amplex Red的产品)推荐的激发和发射光谱是545nm ex/590nm em。小心不使分析的pH降到6.5以下，因为荧光将在试卤灵的pKa(大约6.0)周围减少。
示例性表征分析：CBH活性筛选的PASC分析
【0688】本示例性分析可以用于确定酶是否具有纤维二糖水解酶活性以及其是否在所要求保护的发明的范围之内。在一种实施方式中，所述分析的目的是使用 PASC(磷酸溶胀纤维素)作为底物来确定纤维二糖水解酶亚克隆是否具有活性。
【0689】示例性分析条件：
·100ul反应体积；
·50mM pH5缓冲液(醋酸钠)或50mM pH7缓冲液(磷酸钠)；
·0.75％PASC(中性pH)；
·20ul酶制备型可溶性组分(在反应中1∶5稀释)；
·(+)对照和(-)对照包括在内；
·在用箔密封的96孔PCR板中反应；
·使用热循环仪(或加热单元)在37℃反应过夜。
示例性分析：
·葡萄糖氧化酶分析(应用SPECTRAMAXTM读取器在545/590测量荧光)
材料：
·96孔PCR板(用于反应)；
·具有黑色底端的黑色384孔板(用于葡萄糖氧化酶检测)；
·箔密封；
·1.5％PASC储存液；
·CBH亚克隆样品(被裂解并离心下来)；
·MEGAZYMETM(Wicklow，Ireland)CBHI样品(阳性对照)；
·没有插入样品的载体(阴性对照)；
·500mM pH5醋酸钠储存液；
·500mM pH7磷酸钠储存液；
·热循环仪或加热单元(在37℃用于反应)；
·SPECTRAMAXTM荧光读数器(Molecular Devices Corporation，Sunnyvale， CA)，用于葡萄糖氧化酶检测。
·葡萄糖氧化酶试剂盒：
1)800mM pH7.4磷酸盐缓冲液储存液
2)纯化的β-葡糖苷酶(例如，本发明的示例性SEQ ID NO：424酶，其由例如，SEQ ID NO：423编码)
3)2500/250U/ml葡萄糖氧化酶/辣根(HR)过氧化物酶鸡尾酒
4)50mM Amplex red储存液(光敏感的)
【0690】PASC反应的示例性方案：
1)向96孔PCR板的孔A1和C1中加入20ul(-)对照(没有插入物的载体)。 A1将是在pH5反应的阴性对照。C1将是在pH7反应的阴性对照。
2)以1∶20稀释CBHI储存液(Megazyme)(20ul储存液+380ul水)
3)向孔A2和C2加入20ul稀释的CBHI。A2将是在pH5反应的(+)对照。C2 将是在pH7反应的(+)阳性对照。
4)向A排和C排加入20ul CBH亚克隆样品(如果多于10个样品，继续向B 排和D排加入)。A排将在pH 5进行反应。C排将在pH7进行反应。
5)向含有样品的A排和C排的孔中加入20ul高压灭菌水。
6)向A排加入10ul 500mM pH5的缓冲液储存液(在反应中，50mM)
7)向C排加入10ul 500mM pH7缓冲液储存液(在反应中，50mM)
8)使用剪刀，夹住200ul Rainin吸头的尖端。吸头必须被改造为吸取PASC 储存液。
9)向所有包含样品的孔加入50ul1.5％PASC储存液。使用吸管充分混合。
10)用箔封条密封PCR板并将板放置在热循环仪(或加热单元)中。
11)使PCR板在37℃温育过夜。
葡萄糖氧化酶分析的示例性方案：
1)从37℃温育箱移走PCR板并以4,000RPM离心该板5分钟(使用Eppendorf 离心机)。
2)使用多通道吸管，将25ul反应上清转移到黑色384孔检测板中。务必别将任何沉淀转移到检测板(只是上清液)。
3)制备2×葡萄糖氧化酶鸡尾酒(体积取决于样品数目)：
  成分   [储存液]   2×鸡尾酒   无菌dI水   n/a   适量   磷酸钠pH7.4   800mM   100mM   B-Glc(SEQ ID NO：424)   variable   0.01U/ml   GO/HRP混合物   2500/250U/ml   10/1U/ml   Amplex red   50mM   0.1mM
·葡萄糖氧化酶(GO)来自Sigma(#G7141-50KU)。将全部50,000单位溶解在5ml 50mM磷酸盐缓冲液pH7.4中。
·辣根过氧化物酶(HRP)来自Sigma(#P2088-5KU)。将全部5,000单位溶解在5ml 50mM磷酸盐缓冲液pH7.4中。
·然后GO和HRP以相等的体积合并(2,500/250GO/HRP)。
·Amplex Red来自Molecular Probe(#A22177)。将小瓶中的10mg溶解在 0.777ml DMSO中以获得50mM储存液。避光保存在-20℃。
4)向含有反应上清的384孔检测板的孔中加入25ul 2×葡萄糖氧化酶鸡尾酒。充分混合并避免气泡形成。
5)使检测板在室温温育30分钟。在温育过程中避光。
6)在SPECTRAMAXTM荧光板读取器上以545/590nm读板。
7)将数据存为文本文件并储存数据。在EXCELTM工作表中打开数据并分析结果。
8)数据分析：
ο与阴性对照相比，认为“活性的”CBH亚克隆必须具有高得多的545/590 值。例如，如果阴性对照的值为1000，那么值为1200的样品将不被视为是有活性的。相反地，如果阴性对照的值是1000，则值为2500的样品将被视为具有活性。
ο表现有与阳性对照相似或高于阳性对照的值的样品被认为是“高活性的”。
ο所有活性CBH亚克隆将在更相关的底物(微晶纤维素(MCC) (FMC Corporation，Philadelphia，PA)，或生物质靶标，例如，甘蔗渣、玉米纤维等)上进行进一步表征。
ο葡萄糖氧化酶数据的诠释是相对主观的，因此在每次进行实验时具有可靠的阳性对照和阴性对照是非常重要的。
示例性CBH表征分析
【0691】本示例性分析可以用于确定酶是否具有纤维素酶或纤维二糖水解酶 (CBH)活性以及是否在要求保护的发明的范围之内。本示例性的基于活性的筛选被用于鉴定和筛选纤维二糖水解酶和其它的纤维素酶。在384孔板中筛选λ文库对微晶纤维素()的活性，并且在包括β-葡糖苷酶的酶-偶联反应和Invitrogen 的葡萄糖氧化酶葡萄糖检测分析中检测纤维素酶活性。
【0692】初步筛选
准备
1.制备并在MgSO4中对OD1的足够量的大肠杆菌宿主进行滴定分析。
2.对扩增的λ文库进行滴定分析。
3.以用于自动仪器的条形码对板进行标记。
4.设定自动仪器运行的时间。
5.确定具有足够量的平板、顶层琼脂、试剂、高压灭菌的试剂瓶等。
计算
1.需要多少筛选培养物？
举例：如果将以每孔25μL筛选145块板，用10块额外的板的值的安全缓冲，将需要大约1.5升的筛选培养物。
2.需要多少大肠杆菌宿主制备物？所述培养物应该以大约0.03的OD600为起始。
举例：对于1.5升的培养物，将需要45mL的OD1宿主制备物。
3.需要多少文库：
举例：对于每孔2个克隆的起始接种浓度，将需要每μL 0.08个噬菌体的起始浓度(即，在25μL中有2个噬菌体)。对于1.5升的培养物，需要1.2×105个噬菌体克隆。例如，如果文库的滴度是每μL 1.5×106，那么将需要加入8μL的 1/100稀释液用于本筛选。使用SM缓冲液制备λ文库的稀释液。
4.需要多少NZY和在筛选培养物中的浓度在1×NZY培养基中应该是大约5％。
举例：对于1.5升的培养物，需要577mL13％分散的储存液。也需要 750mL 2×NZY以产生1×NZY的终浓度。还将需要用无菌水(在本实施例的情况下为128mL)使培养物达到1.5升。
第一天
1.在合适的无菌容器中将计算量的大肠杆菌宿主和λ文库合并。轻轻混合并允许噬菌体吸附在室温发生15分钟。
2.同时，在合适的无菌容器中将计算量的2×NZY培养基、13％分散的储存液和无菌水合并。在NZY的存在下将会絮凝，使其产生“凝乳”外观。用搅拌棒尽可能彻底地混合悬浮物，以避免大块形成。
3.将细胞/噬菌体悬浮液与筛选培养基合并，并轻轻混合。这是筛选培养物。
4.并行滴定度：在无菌的2059管中，将250μL OD1的大肠杆菌制备物与 500μL筛选培养物合并，加入7mL溶化的顶层琼脂，在150mm NZY 板上平铺，并且在37℃温育过夜。对于每孔为2的接种密度，这应该产生大约40个噬斑。
a.第二天：计算板上的噬斑，并且采用：(2×(#噬斑))*(9.6ml×(#筛选的平板))来更新筛选克隆的报告。
5.应用无菌的TITERTEKTM(Huntsville，Alabama)头状物(head)，将筛选培养物的其余部分以25μL每孔加载到条形码标记的384孔板中。如果可能，在层流操作台中进行此操作。
6.对照板：每个筛选的文库制备至少两个具有分析对照的384-孔板。
a.制备具有下列终浓度的培养基：5％分散的1×NZY；OD600 为0.03的大肠杆菌宿主。
b.对于一个批次，以每μL大约0.2-0.4个噬菌体的浓度，将阳性对照噬菌体“D7”加入到培养基中；对另一个批次，以相同的浓度加入阴性对照噬菌体“N38”(0GL7)。
c.以每孔25μL分配到黑色的384孔板，阳性对照在1-12列，阴性对照在13-24列。
7.在湿润的温育箱中在37℃温育384-孔板过夜。采取任何必要的防范措施以最小化孔-到-孔和板-到-板的蒸发/浓缩问题。
第二天
1.准备自动仪器稿纸，用于被筛选板的编号；
a.在鸡尾酒添加和读板之间进行30分钟的室温温育。
b.应用560/610滤光器组，用于每一板的第一次读数。
c.应用UV/蓝色滤光器组，用于每一板的第二次(参考)读数。
2.制备2×分析鸡尾酒(紧紧地盖上盖并且避光)；一般将需要大约与第一天筛选培养物所需要的量相同的量。等待直到放置在自动仪器上，将 DMSO加入到Amplex Red，并将Amplex Red加入到鸡尾酒混合物。这将减少Amplex Red的氧化。按顺序加入下列成分：
  成分   2×鸡尾酒   [储存液]   实例(1.5L)   无菌的dI水   n/a   n/a   适量   磷酸钠缓冲液，pH 7.4   100mM   800mM   188mL   SEQ ID NO：424   0.01U/mL   可变   计算   GO/HRP混合物   10/1U/mL   2500/250U/mL   6mL   Amplex Red   0.1mM   50mM   3mL
3.将温育的板、分析用鸡尾酒和无菌TITERTEKTM头状物带到工程操作 (Engineering)中的自动仪器。
4.堆放板，使条形码向外面对温育箱1中的传送带，所述传送带从列1开始并向下沾满(fill down)所述列。注意：将对照板放置在第一位置和在每一文库的最后一块板之后。
5.将TITERTEKTM头状物连接到TITERTEKTM 1
6.使用夹紧装置，将分析瓶放置在倾斜位置，以箔覆盖，将氩气或氮气喷嘴放置入瓶中。
7.准备启动装管(tubing)。
8.登录计算机并开始操作。
a.检查560/610nm的发射/激发滤光器和UV/蓝色滤光器。
第三天
1.对于每一块板，通过将红色读数除以蓝色读数而使红色读数标准化，以减少基于流体的假象。
2.产生筛选器((cherrypicker))的命中表。
【0693】示例性次级筛选-自动化方法
第一天
1.将指定的命中筛选(cherry pick)到CP Master 96孔costar板中的200ul/ 孔SM缓冲液中。
2.将1°筛选板保存在4℃，直到突破(breakout)完成。
第二天
1.将0.5μL每一1°命中从具有大肠杆菌宿主的CP Master板平铺到90mm NZY板上。
2.将“D7”阳性对照和“N38”阴性对照(以每板50-100个噬斑为目标)平铺在单独的90mm NZY板上。
3.在干燥的37℃温育器中将板温育过夜。
第三天
1.将1×NZY+OD 0.03大肠杆菌宿主中5％分散的以25μL/孔充满 384孔Sec_Master板。
2.将板放到集落拣选器，并且从每个初级命中板“集落拣选”16个噬斑到384 孔板的列(列1-20)。
3.拣选“D7”阳性对照到列21中，并且拣选“N38”阴性对照到列22中。
4.在设置到37℃的湿润温育器中温育过夜。
第四天
1.如对初级筛选所述制备2×分析鸡尾酒。
2.如上所述在自动仪器上进行分析。
3.筛选2°命中到96孔Sec PCR板中。
4.将噬菌体储存液保存在4℃。
【0694】示例性次级筛选——人工方法
第一天
1.如果初级筛选板没有被筛选，从初级筛选板取1μL的每个命中并将其稀释在500μL SM缓冲液中。如所描述的，将1μL这种稀释液与大肠杆菌一起平铺在NZY琼脂板上。
2.如果应用筛选的命中，如上所述平铺来自CP Master板的0.5μL每个命中。
3.将“D7”阳性对照和“N38”阴性对照(以每个板50-100个噬斑为目标)平铺在单独的90mmNZY板上。
4.在干燥的37℃温育器中将平板温育过夜。
第二天
1.准备用于拣选的384-孔接受板。以25μL/孔分配下列悬浮液：在具有 OD600为0.03的大肠杆菌宿主的1×NZY中5％分散的
2.应用无菌牙签或无菌吸管尖轻轻地接触每一分离噬斑的表面并将其转移到384孔接收板的一个孔中。每一1°命中拣选16个分离物(一个列值 (one column-worth))。
3.在设置到37℃的湿润温育器中温育所述板(一块或多块)(“突破板) (breakout plate))过夜。
第三天
1.如对初级筛选所述，制备2×分析鸡尾酒。
2.以25μL/孔将2×分析鸡尾酒加入到“突破板”，在室温温育(避光)30 分钟，然后在535/595nm和360/465nm读取荧光。
3.红色读数除以蓝色读数，并且鉴定任何2°命中。
4.如果2°命中被鉴定，取出与阳性分离物对应的孔的内容物并加到1mL SM缓冲液+100μL CHCl3中。旋转并在4℃储存噬菌体储存液。
试剂和供应品：
2×NZY浓缩物，13％分散的
【0695】测量130克微晶纤维素(FMC Biopolymer(Philadelphia，PA)：类型PH 105，NF/EP级)到干净的、高速搅拌机中，并且加入18MΩdI水到1L 测量线(大约916mL)。盖上盖子并以最高速混合20分钟。将悬浮液转移到高压安全的容器中并应用30分钟“液体”循环进行高压灭菌。在室温下储存。
磷酸钠缓冲液pH 7.4(800mM储存液)
【0696】磷酸盐缓冲储存液被配制为800mM，以防止有时在1M储存液时发生的沉淀。对于1升800mM缓冲液，将90.7克Na2HPO4(MW 141.96)与22.2 克NaH2PO4·H2O(MW 137.99)合并，并溶解在大约950mL dI水中。如有必要，用NaOH或磷酸调节pH至7.4，然后无菌过滤或进行高压灭菌。
SEQ ID NO：424酶-对照；GO/HRP混合物
【0697】葡萄糖氧化酶：Sigma#G7141-50KU。将全部50,000单位溶解在5mL 50mM磷酸盐缓冲液，pH 7.4中。
【0698】辣根过氧化物酶：Sigma#P2088-5KU。将全部5,000单位溶解在5mL 50mM磷酸盐缓冲液，pH 7.4中。
【0699】合并葡萄糖氧化酶和HRP溶液。采用无菌注射器加入等体积(10mL) 的无菌甘油。充分混合。这产生了20mL具有终浓度为2,500U/mL GO，250U/mL HRP的溶液。
Amplex Red
【0700】Molecular Probes#A22177(10×10-mg小瓶，MW＝257.25)。将每一小瓶中的10mg溶解在0.777mL DMSO中，产生50mM储存液。需要时集中(Pool as needed)。将不使用的储存液避光保存在-20℃。
黑色384-孔板
Costar 384-孔板3709    Fisher 07-200-652
【0701】大肠杆菌宿主培养物的制备
需要的成分
·大肠杆菌的过夜培养物或条纹板。使用LB培养基+20μg/mL四环素抗生素，用于液体培养基和条纹板。
·无菌的250mL摇瓶
·补充有20μg/mL四环素的LB
·无菌离心管
·无菌的10mM MgSO4溶液
实验方案
1.在无菌的250-mL瓶中，用1mL的过夜大肠杆菌宿主培养物接种100mL LB培养基+20μg/mL四环素。
2.在37℃/240rpm的振荡器中，使所述培养物生长至OD6000.8-1.0(典型地，2-4小时)。
3.以1,100×g离心培养物10分钟(例如，在Eppendorf 5810R中，2351rpm)。
4.轻轻地将沉淀重悬于10mM MgSO4至OD600＝1.0。
5.将制备的宿主细胞储存在冰上或4℃。宿主制备物应该保持良好大约1 个星期。
【0702】平铺λ噬菌体的一般方案
需要的成分
·OD1宿主制备物
·无菌的Falcon 2054管(或2059管，如果使用150mm板的话)
·融化的NZY顶层琼脂，其在50℃平衡。
·NZY板，升温至室温。
所需要的OD1宿主制备物和融化的顶层琼脂的量取决于所使用的NZY板的大小。一般的准则遵循：
NZY板的大小 OD1宿主制备物的体积   融化的顶层琼脂的体积 90mm 100μL   2.5mL 150mm 250μL   7mL
【0703】一般步骤
1.将推荐量的OD1宿主制备物(参见上面的表)等分到无菌2054或2059 管中。
2.仔细地将所需量的λ噬菌体储存液吸到等分的宿主细胞中并且通过温和旋转混合。
3.通过在室温温育15分钟(不需要摇动)，使噬菌体吸附到宿主细胞。
4.通过将适量的50℃融化的顶层琼脂(见上表)加入到管中并且迅速倾泻到NZY板上，将噬菌体铺板。仔细地将所述板左右倾斜以确保在顶层琼脂变硬之前噬菌体的平滑均匀分布。
5.颠倒板并且在干燥的37℃温育器中温育过夜。注意一些NZY板非常潮湿。为了预防温育过程中的湿气问题，在将它们放置在温育器中之前这些板需要排出湿气。
【0704】对λ文库进行滴定
1.在SM缓冲液中进行10-5、10-6和10-7稀释。注意：对于具有低于105/μL (＜108/mL)的滴度的较老文库，更保守的稀释是必要的。
2.将100μL的OD1宿主制备物吸入到三个Falcon 2054管的每一个管中。
3.小心地将100μL的每一种稀释液加入到含有宿主细胞的单独2054管中。
4.如上面平铺λ噬菌体的一般方案中的步骤3-5所述，进行吸附、平铺和温育。
5.对噬斑计数并计算文库储存液的滴度(以pfu/μL计)。如果可能，采用可产生50-200个噬斑的稀释。例如，如果含有100μL10-6稀释的板产生157个噬斑，则文库滴度为大约1.6×106pfu/μL。
【0705】下表总结了来自这些示例性实验方案的数据；为了帮助阅读表，例如，对于标记(本发明)“示例性酶”的栏，第一行读作“7，8”，其被诠释为具有SEQ ID NO：8的氨基酸序列的酶，所述酶由，例如SEQ ID NO：7的核酸序列编码，等等。 “Avicel”是如上所述的GH家族表示“糖基水解酶”家族。“真的”和“假的” 分别代表在示出的条件下“有酶促活性的”或“无活性的”。反应时间为分钟。

【0706】纤维素酶的初步筛选的示例性分析
单酶消化物的示例性方案(37℃和55℃)
1.准备。对于每10个测试样品，通常需要：两块96-孔板(用于在37℃和55 ℃进行消化)，两个透明的384-孔板(用于对应的时间点)和在96深孔板进行酶稀释的可用空间。
2.总体布置。一般地，10个酶样品每板加上阳性对照和阴性对照。每一样品为1列。典型的筛选布置被示出(在本布置中给出本方案的某些详细情况)。
B排：0.1mg/mL酶，在pH 5
C排：1.0mg/mL酶，在pH 5
D排：0.1mg/mL酶，在pH 7
E排：1.0mg/mL酶，在pH 7
F排：0.1mg/mL酶，在pH 9
G排：1.0mg/mL酶，在pH 9
3.配制1.2×缓冲底物溶液。下列是用于消化的溶液，终浓度为0.4％ 50mM缓冲液和5mM叠氮钠。对于每12个待测的样品(10个测试样品加上2个对照)，需要大约10mL的每种下列缓冲溶液。加入叠氮钠来抑制消化反应期间任何微生物污染物的生长。
a.0.48％分散的60mM醋酸钠，pH 5.0；6mM叠氮钠
b.0.48％分散的60mM磷酸钠，pH 7.0；6mM叠氮钠
c.0.48％分散的60mM磷酸钠，pH 9.0；6mM叠氮钠
4.将175μL/孔的1.2×缓冲的底物溶液沉淀到2个96孔板中。这两个板将是消化板。使用多通道吸移管。迅速下沉，因此每次都吸出槽外，上下吸以在将液体转移到96孔板之前形成均匀的悬浮液。如在上面的总体布置中示出的阵列：在B排和C排pH 5，在D排和E排pH 7，在F排和G排pH 9。
5.准备两个具有35μL/孔终止液的384-孔时间点板。使用TITERTEKTM。用 35μL终止液注满每一板的所有孔。
6.配制6×酶溶液。在96-孔板中，制备每一酶储存液的0.6mg/mL和6mg/mL 的稀释液。每一样品制备大约250μL的两种稀释液的每一种。用水稀释酶储存液并将它们以期望在消化板上的顺序排在板的两排(上排为0.6mg/mL，下排为6 mg/mL)中。还在12个样品中包括阳性对照和阴性对照。
7.向底物加入酶并立即取0时间点。使用多通道吸移管，从稀释板的上排移出 35μL 6×酶样品并且转移到两块消化板的B、D和F排(参见上面的总体布置)。小心地上下吸至完全混合，然后立即将35μL的每种消化溶液转移到384孔时间点板的左上四组中的终止液中。上下吸以与终止液混合。注意：如果关心最小化吸取误差，对于消化板上的每一排，可以使用相同的12个吸管尖，用于酶转移和时间点转移。用机器盖(robo-lid)将384-孔时间点板保存在4℃，直到下一个时间点。
8.温育。使用用湿纸巾湿润的机器盖和拉锁袋，将一个消化板放置在37℃，而另外一个消化板放置在55℃。
9.3-5小时后，取另一时间点。首先离心消化板以下降凝集在盖上的湿气(3200 ×g，＜1分钟)。使用设置到35μL的多通道吸移管，上下吸以均匀悬浮然后将35μL转移到时间点板的右上四组中，并且与终止液混合。注意使吸取误差最小化。注意该时间点消化时间的长短。
10.在大约24小时取第三个时间点。在第二天，如上所述取第三个时间点。放置在左下四组中并且与终止液混合。注意该时间点消化时间的长短。
11.在大约48小时取最后的时间点。在第三天，从温育器中取出板。如上所述取最后的时间点并且与所述时间点板的右下四组中的终止液混合。注意消化时间的长短并且将其写在96孔消化板的盖上。使用时间点板用于BCA和葡萄糖氧化酶分析。应用箔密封在消化板上并且储存在-20℃，用于稍后在CE/HPLC分析中使用。
葡萄糖氧化酶(+β葡糖苷酶)分析的示例性方案
【0707】本示例性方案稀释消化反应物39倍(包括每个时间点到终止液中的2 倍稀释)，并且因此当预期消化产物中的葡萄糖当量浓度在大约25至400μM的范围时是适当的。较高的葡萄糖浓度也将被检测到，但是其将落入标准品的线性范围之外。
【0708】对于每一384孔终止反应板(例如，时间点板)，应该进行下列操作：
1.确定APRICOTTM被设置并且具有连接和安装有新尖头的384歧管。
2.在2,000×g离心终止反应板一分钟。
3.计算标准曲线：当进行GO分析时，纤维二糖(CB)标准品被用于控制β- 葡糖苷酶活性。当正确地进行β-gluc步骤时，CB标准品——如以葡萄糖当量表示的——应该产生与葡萄糖标准品相同的斜率。
a.在96深孔板中制备稀释液是方便，因而这些稀释液将如期望转移到分析板一样被排列。
b.可以在水中稀释标准品。
c.制备200μM CB溶液和400μM葡萄糖溶液。每种溶液进行4次连续2 倍稀释。对于包含0μM的溶液，将具有对于葡萄糖和CB的6-点标准曲线。
d.示例性方案：
i.在96深孔板的一个孔中，制备1mL的200μM CB溶液。在另一孔中，制备1mL的400μM葡萄糖溶液。
ii.为了进行连续稀释，向邻近每一标准品的5个孔每一个孔加入0.5 mL水。
iii.每一标准进行4次连续的2-1稀释(0.5mL+0.5mL水)。牢记将没有所述标准品的最后的孔作为“0μM”点。
e.将每一稀释液以35μL/孔转移到35μL终止液，至时间点板的未使用区域如A、B、O和P排。加载每一种标准品，每一标准品四孔。
4.使用TITERTEKTM MULTIDROPTM，以35μL/孔将新制备的β-葡糖苷酶溶液加载到黑色384-孔板中。
5.使用APRICOTTM，从时间点板将4μL/孔转移到β-葡糖苷酶板并且混合；(这些转移步骤的示例性Apricot程序称为DYCAICO7TM)。一旦混合，最终的 pH应该是大约7.5。用箔封条将所述时间点板保存在-20℃，以防任一分析重复。
6.以2000×g离心板几秒钟，以除去气泡。
7.在室温温育β-葡糖苷酶板2-3小时。
8.使用TITERTEK MULTIDROPTM，以40μL/孔向黑色β-葡糖苷酶处理板加入新制备的2×GO分析溶液(在计划用此溶液之前一刻制备)。
9.在室温温育所述分析板30分钟，避光。(如果需要，以2000×g离心板几秒钟，除去气泡)。
10.对于试卤灵检测，在530/595nm读取荧光。
11.将数据保存为文本文件，用于应用Excel模板的分析。
【0709】BCA分析的示例性方案
1.预热BEAVERTM(Tansun Limited，UK)加热器：底部＝70℃，顶部＝75℃。
2.确保APRICOTTM被设定并且具有连接的384-歧管。运行几次程序以使洗涤器完全预备好。
3.标准品：如对于GO分析所述向时间点板加入标准品。注意：在过去，为了模拟存在于BCA分析测试样品中的蛋白质背景，采用0.1mg/mL蛋白质溶液(如BSA)，用于稀释标准品。这只在当消化物中使用高水平相对不纯的蛋白质时是相关的。
4.在4℃以3200×g离心时间点板5分钟，以使存在于样品中的沉淀。
5.对于每一时间点板，使用两块新的透明384-孔板用于BCA分析(两块板)。因此总计需要4块板以包括37°和55°时间点。
6.使用TITERTEK MULTIDROPTM，以15μL/孔向每一分析板加入新合并的 A+B溶液。
7.使用APRICOTTM，将15μL酶消化上清液从时间点板转移到分析板两次。
避免转移(悬浮的将产生背景)。确定在APRICOTTM 上具有混合步骤。由于在BEAVERTM加热器上只有两块板的空间，所以应该以大约40分钟计交错安排37°和55°时间点分析。
8.立即将泡沫盖应用到分析板，并放置在BEAVERTM加热器中。
9.正好温育35分钟。
10.一旦温育完成，立即将板置于冰上，用原盖替换泡沫盖，并且快速前往离心机。
11.在4℃，以3200×g离心5分钟。在4℃的这种离心将迅速冷却所述板。
12.在562nm读取吸光度。
13.将数据保存为文本文件，用于使用EXCELTM模板的分析。
溶液：
13％分散的
【0710】称取130克微晶纤维素(FMC Biopolymer：类型PH 105， NF/EP级)，放入到干净、高速搅拌机中并且加入18MΩdI水至1L测量线(大约 916mL)。盖上盖子并以最高速混合20分钟。将悬浮液转移到高压安全的容器并且采用30分钟“液体”循环进行高压灭菌。在室温下储存。
终止液
(400mM碳酸盐缓冲液，pH 10)
【0711】根据下列说明配制BCA溶液A，但是不添加BCA成分。然后稀释两倍产生1升400mM的碳酸盐溶液。
BCA溶液A
(5mM BCA，在800mM碳酸盐pH 10中)
  FW   amt   终浓度   碳酸钠，一水合物*   124.00   64mg/mL   516mM   碳酸氢钠   84.01   24mg/mL   286mM   二辛可宁酸二钠水合物(bicinchoninic   acid disodium salt hydrate)   (Sigma D8284)   388.28   1.95mg/mL   5mM
1.在具有搅拌棒的500mL烧杯中，将32克碳酸钠一水合物*与12克碳酸氢钠合并。
2.加入18MΩ水至大约450mL，并放置在磁力搅拌器上直到完全溶解(大约15-30分钟)。
3.加入975mg BCA试剂，继续搅拌直到完全溶解。
4.用18MΩ水调节体积至500mL。
5.无菌过滤。
6.保存在4℃。每2-3周制备新鲜溶液。
·可选地，在上面步骤1中使用27.35克无水碳酸钠(FW 106)。
BCA溶液B
  FW   amt   终浓度硫酸铜五水合物(Sigma C2857)   249.69   1.24mg/mL   5mM L-丝氨酸   105.09   1.26mg/mL   12mM
1.在具有搅拌棒的500mL烧杯中，将620mg硫酸铜五水合物与630mg L- 丝氨酸合并。
2.加入18MΩ水至大约450mL并放置在磁力搅拌器上直到完全溶解(大约 15-30分钟)。
3.用18MΩ水调节体积至500mL。
4.无菌过滤。
5.保存在4℃。每2-3周制备新鲜溶液。
【0712】β-葡糖苷酶溶液
  成分   [储存的]   [最终的]   无菌dI水   n/a   适量   磷酸钠缓冲液，pH 7.0*   500mM   125mM   SEQ ID NO：424**β-葡糖苷酶   可变的   0.04U/mL
*一旦来自时间点板的高-pH溶液被稀释10-倍到β-葡糖苷酶溶液中，最终的pH 应该是大约7.5，这对SEQ ID NO：424是适合的。
**也可以使用这种酶的His-标签形式。
【0713】2×GO分析溶液
  成分   [储存的]   2×鸡尾酒   无菌dI水   n/a   适量   磷酸钠缓冲液，pH 7.4   500mM   100mM   GO/HRP混合物   2500/250U/mL   2/0.2U/mL   Amplex Red   50mM   0.1mM
以列出的顺序加入成分，然后立即用于分析。
【0714】GO/HRP混合物
·葡萄糖氧化酶：Sigma#G7141-50KU。将全部50,000单位溶解在5mL 50mM 磷酸盐缓冲液pH 7.4中。
·辣根过氧化物酶：Sigma#P2088-5KU。将全部5,000单位溶解在5mL 50mM 磷酸盐缓冲液pH 7.4中。
将葡萄糖氧化酶和HRP溶液合并。使用无菌注射器加入等体积(10mL)的无菌甘油。充分混合。这产生了20mL终浓度为2,500U/mL GO；250U/mL HRP的溶液。等分到1-mL管中并储存在-20℃。
【0715】50mM Amplex Red
Molecular Probes#A22177(10×10-mg小瓶；MW＝257.25)。将每个小瓶中的 10mg溶解在0.777mL DMSO中，产生50mM储存液。避光储存在-20℃。
任意的10mM储存液：Invitrogen#A12222；MW＝257.25。将全部5mg溶解在 1.94mLDMSO中。以每0.5-mL管250μL分装，并避光冷冻在-20℃。
【0716】叠氮钠
Sigma#S2002(FW 65.01)；小心：有毒性且是致癌物。用水配制浓储存液(例如，1M)。对于用作抗菌添加剂，典型的浓度是0.02-0.05％(w/v)，这在3mM至 8mM之间。
示例性酶消化性分析——大规模
【0717】大规模酶消化性分析也可以被用于鉴定本发明的酶，和用于表征本发明的酶。示例性大规模酶消化性分析如下：
【0718】在10mL玻璃钳口瓶(crimp-top vial)中进行示例性大规模酶消化性分析。在分析之前测定水分含量和糖组成。在玻璃小瓶中称量250dw mg±10mg 的碎甘蔗渣，并根据最终的酶浓度加入一定量的100mM NaOAc缓冲液。NaOAc 缓冲液的pH为5，并且含有10mMNaN3作为生长抑制剂。甘蔗渣混合物被盖上，没有密封，并在加入合适量的酶溶液之前在37℃温育箱中预热大约20分钟。大规模反应中的酶加载量是25mg总蛋白/g纤维素。反应总体积是5mL。一旦加入酶溶液，就密封小瓶并夹到旋转装置上。在2、4、6和24小时取出大约200uL样品。以13,200rpm离心样品5分钟。在384孔板中将上清夜稀释4倍。用RI-HPLC根据已知的标准品分析反应产物中的糖组成，并基于甘蔗渣中的理论纤维素值计算纤维素转化。
实施例6：本发明的酶的鉴定和表征
【0719】本实施例描述了鉴定和表征本发明的酶的示例性策略，所述本发明的酶包括将用于本发明的酶混合物(“鸡尾酒”)的酶，其被设计为有效处理(“水解”) 各种生物质的复杂结构，例如，甘蔗植物纤维(也称为“甘蔗渣”)，这需要多种酶活性以完全降解(“水解”)甘蔗渣。
【0720】在可选的方面，测试了不同的酶组合，以确定将甘蔗渣底物(或任何其它靶生物质底物)水解到期望水平所必需的最佳组合。可以基于以前确定的酶对模式底物的活性，而不必基于它们序列同一性(与已知酶的序列相似性/同源性) 来进行酶的分类。例如，从纤维素释放纤维二糖的酶将被视为纤维二糖水解酶，即使其与内切葡聚糖酶在序列上最相似。
酶发现：
原核生物酶：
【0721】通过对未标记或标记的底物，例如未标记的或标记的AVICELTM，进行功能性筛选，已经从原核文库中发现了许多已知的酶。功能性筛选也可以包括使用任何分析或实验方案，例如，木聚糖陷阱(xylan traps)和类似物。基因文库一一来自环境来源样品，包括土壤、空气或水样品，例如来自农业耕地，如甘蔗地，并且包括在任何环境来源样品中直接或间接发现的任何微生物：例如植物(例如，甘蔗、玉米)微生物；昆虫相关(例如，白蚁肠道)微生物；动物相关(例如，反刍动物肠道)微生物；和类似物——被用于表达多肽，其反过来用于筛选木质纤维素活性，例如，糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶和/或β- 葡糖苷酶(β-葡糖苷酶)活性，其包括例如甘蔗渣降解或玉米纤维-(例如，玉米种子纤维)降解活性。
真菌酶：
【0722】除了细菌文库之外，功能性筛选将包括真菌文库；具有木质纤维素活性——包括生物质降解，例如甘蔗渣降解或玉米种子纤维降解活性——的酶将从真菌来源(已经从真菌中鉴定出许多表现最好的生物质降解酶，因此，这可能代表了对甘蔗渣特异的纤维水解酶的良好来源)鉴定得到。
【0723】推测有效降解甘蔗渣的真菌具有已进化为在一起起作用的酶全部组成。可能的是，与分离自不同生物体的酶相比时，来自同一生物体的多种甘蔗渣降解酶在甘蔗渣降解应用中协同作用。由于这些原因，本发明的本示例性酶发现策略将集中于真菌基因。
【0724】在一种实施方式中，真菌甘蔗渣降解酶的发现使用维莱尼姆公司 (Verenium Corporation)的高通量培养技术(High Throughput Culturing technology) 从环境样品中分离并排列独特的微生物。当它们在生物质底物，例如甘蔗渣或玉米纤维(例如，玉米种子纤维)底物上活跃降解和生长时，可以评价鉴定由真菌分泌的酶的方法组合。在一种实施方式中，当在植物或微生物中异源表达时，从高活性的真菌分离大多数或所有纤维水解酶提供了一起很好地发挥协同作用的酶的有效组合。
底物预处理：
【0725】开始，进行并评价简单的实验规模的生物质底物，例如甘蔗渣或玉米纤维底物的预处理。
在应用分析中的示例性酶评价
【0726】在一种实施方式中，应用分析将被用于测定酶和酶组合对未处理和预处理的生物质底物，例如甘蔗渣或玉米纤维(例如，玉米种子纤维)底物的活性。这可以包括利用分析技术来定量和鉴定从生物质底物释放出的糖。被建立以测定纤维底物的精确的糖组成的方法也可以被应用在生物质(例如甘蔗渣或玉米纤维)样品上。这种信息可以被用于测定酶处理后底物的降解程度。
【0727】将系统地确定最好的酶组合。该策略可以包括固定一种或多种酶的特性或预处理底物。基准酶(商业制剂和/或已有的纤维水解酶的亚克隆)可以用于发展和验证本分析。
【0728】对于酶，如分别被纤维二糖和葡萄糖严重抑制的CBH和β-葡糖苷酶，可以测量产物抑制。
A.酶发现
a.对原核生物酶的示例性功能筛选策略
·应用功能分析，对来自相关样品位点(一个或多个)(例如，玉米或甘蔗地)的原核生物基因文库进行了靶酶活性(例如糖基水解酶等) 筛选。
·用不同荧光团(例如，4-甲基伞形酮酰基和试卤灵连接的底物)进行的酶筛选可以组合起来在同一时间多次筛选多种酶活性。
b.真菌菌株的示例性筛选策略
·从高通量培养中筛选新的真菌，并且在获得体内有效降解目标生物质(例如，玉米纤维或甘蔗渣)的菌株的玉米种子纤维项目进行期间鉴定最高的真菌菌株。
·可以通过进行18S分析，测定所鉴定菌株的特性和多样性。
·从活跃产生生物质降解(例如，甘蔗渣降解)酶的培养物中产生全长cDNA表达文库。
·筛选尝试可以用于克隆大多数或所有存在于来自这些菌株——尤其是如果它们活跃降解目标生物质(例如，玉米纤维或甘蔗渣)的话—— 的培养基中的基因。可用于克隆所有这些基因的示例性方法可以包括下列方法的组合：
1.通过(a)基于序列的方法筛选cDNA文库，和/或，(b)通过底物结合结构域(SBD)筛选gDNA文库，将基因组克隆直接放进黑曲霉，在产生cDNA形式的过程中由宿主完成内含子剪接，以证实剪接的克隆；
2.当这些菌株在目标生物质(例如，玉米纤维或甘蔗渣)基质上生长时，进行蛋白质组分析以鉴定分泌到培养基中的蛋白质。
B.示例性酶表征
a.新发现的基因的生物信息学表征
·结构域结构、酶分类和家族
·信号序列、稀有密码子等
b.亚克隆新发现的基因并优化蛋白质表达，用于表征和应用测试。
c.用标准程序对所有亚克隆进行酶表征
·选择的或所有酶制剂的比活性可以在模式底物上测定；这种信息可以用于计算加载在应用分析中的酶。
C.应用分析中的示例性酶评价
a.可选的分析发展策略：
·目标生物质(例如，玉米纤维或甘蔗渣)底物的分布；
·反应形式(format)条件；
·用于确定所释放的全部糖的培养基通量分析(例如，还原糖分析)；
·可以对具有高水平糖释放的样品进行详细分析(HPLC/ELSD， LC/MS等)；可以采用对释放的糖和未消化残余物进行量化和鉴定的方法。在一种实施方式中：为了评价酶性能，将纤维底物的糖组成量化为释放的糖％；
·酶的组合评价的示例性策略：可以包括酶促或化学预处理，用于对具体的酶种类进行早期研究。
b.用基准酶证实所述分析：这将产生一些靶性能标准和酶单位的信息，从而增添到应用分析中。
c.在应用分析中评价所有酶：鉴定导致从目标生物质(例如，玉米纤维或甘蔗渣)底物释放最多糖的酶和酶组合。
D.在植物细胞——转基因植物中评价酶
在一种实施方式中，每一水解类别中有潜力的候选者进行植物表达，包括在宿主植物细胞、植物组织和/或转基因植物中进行表达。这些植物表达的酶(例如，水解酶)将在目标生物质(例如，玉米纤维或甘蔗渣)应用分析中进行测试。
E.进化——酶活性的优化
在一种实施方式中，取决于酶的性能，一些或所有的酶被“优化”，即进行了序列修饰，以改进各种参数，如对特定底物的酶生产力、最适温度、最适pH、稳定性、比活性、产物抑制等。优化可以包括应用维莱尼姆公司(Verenium Corporation) 专有的基因位点饱和诱变(GSSM)和/或GENEREASSEMBLYTM技术的进化。
实施例7：本发明的多结构域酶
【0729】本实施例还描述了本发明的多-结构域多肽(例如，酶)(和编码它们的核酸)的设计和制备。
【0730】本发明提供了木质纤维素酶，例如糖基水解酶、纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶和/或阿拉伯呋喃糖苷酶，它们是包含至少-个(例如，可以包括多个)糖结合模块(一个或多个)的多结构域酶，所述糖结合模块可以是异源的或同源的糖结合模块 (CBM)，并且可以是来自另外的木质纤维素酶的任何已知的CBM模块，例如，纤维素结合模块、木质素结合模块、木糖结合模块、甘露聚糖酶结合模块、木葡聚糖特异的模块、阿拉伯呋喃糖苷酶结合模块等。本实施例描述了用于常规鉴定糖结合模块例如，纤维素结合模块的示例性实验方案。
CBM结合分析材料：
【0731】用于示例性CBM结合分析(例如用于纤维素和木聚糖)的底物是微晶纤维素(MCC)和Oat-Spelt Xylan(Sigma，X-0627)。纤维素结合模块或是纯化的CBM-GST融合蛋白或是含有CBM的裂解物。选择BSA作为分析期间的对照。
CBM结合分析程序：
【0732】在1.5ml Eppendorf管中以总共200μl的反应体积进行CBM结合分析，在所述200μl反应体积中含有1mg底物(Avicel MCC或Oat_Spet-Xylan)和0.1mg CBM，于50mM TisHCl缓冲液(pH 8.0)中。在反应在室温下进行1小时后，通过在10,000rpm离心5分钟，将留在上清中的未结合的CBM与留在沉淀中的结合的CBM分开。接着，用相同的缓冲液洗涤沉淀3次，加入SDS加样缓冲液并且煮沸10分钟以从所述沉淀中释放结合的CBM。最后，通过SDS-PAGE检测结合的和未结合的CBM。
CBM定义：
【0733】如上所述，任何糖结合模块(CBM)，例如纤维素结合模块，都可以并入到本发明的酶中，并且许多这样的模块在本领域内是熟知的，例如，在糖活性酶网站，糖结合模块被定义为在糖-活性酶中具有不连续折叠(discreet fold)和具有糖结合活性的的连续氨基酸序列。少数例外是多纤维素酶体支架蛋自中的CBM 和罕见的独立推定的CBM的实例。对作为较大酶内的模块存在的糖结合模块，例如纤维素结合模块的需要，使该类糖结合蛋白与其它的非催化的糖结合蛋白如凝集素和糖转运蛋白相区别。
【0734】基于结合纤维素的几种模块的最初发现，CBM以前被列为纤维素结合结构域。然而，不断发现糖活性酶中的另外的模块虽然结合除纤维素外的糖类但是其它方面符合CBM标准，因此需要采用更具包容性的术语来重新将这些多肽分类。以前的纤维素结合结构域的分类是基于氨基酸相似性进行的。CBD的分组被称为“类型”并用罗马数字进行编号(例如I类或II类CBD)。
【0735】与糖苷水解酶分类一致，这些分组现在被称为家族并用阿拉伯数字进行编号，如下所述。在可选的实施方式中，本发明的酶包括任何或所有这些糖结合模块例如纤维素结合模块的一个或多个成员，如连接到本发明的任何酶或多肽的结构域，例如，剪接到或添加到本发明的酶或多肽上的序列：
CBM 1：
【0736】发现几乎是真菌中专有的大约40个残基的模块。纤维素-结合功能已经在许多情况中显示，并且似乎是分开大约10.4埃并且形成平面的三个芳香残基所介导。唯一的非真菌CBM1的出现是海藻非水解多糖-结合蛋白，其由四个重复的CBM1模块组成。在一个实例中示出其结合壳多糖。
CBM 2(CBM_2a、CBM_2b)
【0737】大约100个残基的模块，并且可在大量的细菌酶中发现。已经在许多情况中显示出纤维素结合功能。这些模块中的几种已经示出也结合壳多糖或木聚糖。
CBM_3(CBM_3a、CBM_3b、CBM_3c)
【0738】在细菌酶中发现具有150个残基。已经在许多情况中显示出纤维素结合功能。已经报道了在一种情况中结合壳多糖。
CBM_5_12：
【0739】大约40-60个残基。这些模块中的大多数在几丁质酶中被发现，在所述几丁质酶中，其功能是结合壳多糖。与CBM5家族关系远。
CBM10：
【0740】大约50个残基的模块。在一种情况中已经示出了纤维素结合功能。
【0741】这些糖结合模块(CBM)分析测定的结果示于下面的表5和表6中。这些结果，如表5和表6中所总结的，说明了在一些本发明的示例性多肽中功能性 CBM的存在。该表也显示了与本发明的这些CBM有关的活性。
【0742】本发明提供了嵌合多肽，其包括包含本发明的多肽序列(例如，本发明的酶，包括本发明的多肽的酶促活性子序列(片段))的酶，包括CBM的任何组合，包括下面所述的示例性CBM。例如，具有木质纤维素活性例如糖基转移酶、纤维素酶、纤维水解活性、内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、甘露聚糖酶、β-木糖苷酶或阿拉伯呋喃糖苷酶活性的本发明的嵌合多肽可以包括一个、两个或几个异源性或内源性重排的CBM；并且这些异源性或内源性重排的CBM可以定位于序列内，和/或氨基酸序列的氨基端或羧基端；如果本发明的嵌合多肽是重组蛋白，那么所述嵌合多肽可以通过构建重组嵌合编码序列来制备，所述重组嵌合编码序列编码侧翼和/或内部的异源性或内源性重排的CBM编码序列；并且这些嵌合核酸编码序列也是本发明的序列。

实施例8：本发明的单子叶植物和双子叶植物的优化基因
【0743】本实施例也描述了本发明所设计或“优化”的用于在双子叶和/或单子叶植物细胞和/或植物中最佳表达的核酸序列的设计和制备。
【0744】应用Vector NTI 9.0TM中的回译程序，设计双子叶和单子叶植物合成基因。使用单子叶植物或双子叶植物的优选密码子，四个蛋白质序列被回译成单子叶植物优化的或双子叶植物优化的编码序列。额外的序列被加到每一纤维素基因编码序列的5’和3’端，用于克隆和差异性靶向亚细胞区室。这些序列包括BamHI克隆位点、Kozak序列和在5’端的N-端信号序列。液泡或ER靶向序列和SacI克隆位点被加在3’端。沉默突变被引入，以除去干扰克隆策略的任何限制性位点。合成的基因由GENEARTTM(Germany)合成。
【0745】编码示例性SEQ ID NO：360(CBH1蛋白)的双子叶植物的优化基因是SEQ ID NO：480；编码示例性SEQ ID NO：358(CBH2蛋白)的双子叶植物的优化基因是SEQ ID NO：481；编码示例性SEQ ID NO：168(内切葡聚糖酶)的双子叶植物的优化基因是SEQ ID NO：482；以及，编码示例性SEQ ID NO：34(CBH1蛋白)的双子叶植物的优化基因是SEQ ID NO：487。编码示例性SEQ ID NO：360的单子叶植物的优化基因是SEQ ID NO：483；编码示例性SEQ ID NO：358的单子叶植物的优化基因是SEQ ID NO：484；编码示例性SEQ ID NO：168的单子叶植物的优化基因是SEQ ID NO：485；和编码示例性SEQ ID NO：34的单子叶植物的优化基因是 SEQ ID NO：486。
实施例9：植物表达载体的构建
【0746】本发明提供了各种植物表达系统，包括载体、重组病毒、人工染色体和类似物等，其含有本发明的核酸，包括编码本发明的酶的核酸，以及包括与所述酶编码序列互补的序列；并且本实施例描述了制造这些实施方式中的一些实施方式。
【0747】能够指导纤维素酶在转基因植物中表达的表达载体被设计用于单子叶植物和双子叶植物的优化纤维素酶。烟草表达载体采用组成型启动子夜来香黄叶卷曲病毒(CYLCV)启动子和前导区(SEQ ID NO：488)来驱动双子叶植物的优化纤维素基因的表达。烟草表达的纤维素酶通过与大豆(Glycine max)的大豆球蛋白 GY1信号序列(SEQ ID NO：473)和ER保留序列(SEQ ID NO：474)融合而被靶向至内质网(ER)。烟草表达的纤维素酶通过使纤维素酶基因与C-端的sporamin 液泡靶向序列(SEQ ID NO：475)(Plant Phys 1997：114，863-870)和N-端的GY1 信号序列融合而被靶向至液泡。纤维素酶的质体靶向通过来自与N-端融合的蓝载藻(Cyanophoraparadoxa)的铁氧还蛋白-NADP+还原酶(FNR)的转运肽(SEQ ID NO：476)进行(FEBS Letters 1996：381，153-155)。
【0748】大豆(Glycine max)的大豆球蛋白GY1启动子和信号序列(GenBank 登录号X15121)被用于驱动大豆种子特异性的纤维素酶的表达。纤维素酶在大豆中的靶向作用涉及来自β-伴大豆球蛋白的ER保留序列(EQ ID NO：474)的C-端添加或蛋白质存储液泡(PSV)序列(SEQ ID NO：477)(Plant Phys 2004：134， 625-639)。
【0749】玉米PepC启动子(The Plant Journal 1994：6(3)，311-319)被用于驱动每一单子叶植物的优化纤维素酶的玉米叶子特异表达。所述纤维素酶基因与N-端的γ玉米醇溶蛋白27KD信号序列(SEQ ID NO：478)融合以靶向通过ER，并与来自大麦多胺氧化酶(SEQ ID NO：479)的液泡序列结构域(VSD)融合从而指导纤维素酶进入到叶片液泡中(Plant Phys 2004：134，625-639)。可选地，使用ER保留序列(SEQ ID NO：474)代替VSD，以将纤维素酶保留在ER中。质体靶构建物包含上述FNR转运肽。每一玉米优化纤维素酶被克隆在水稻谷蛋白启动子之后，用于在玉米种子的胚乳中进行表达。如上所述，额外的序列被加入，用于将蛋白质靶向ER或胚乳。载体成分的信息被示于表7中。采用本领域内已知的重组DNA技术，所有表达盒都被亚克隆到二元载体中，用于转化入烟草、大豆和玉米。
表7.用于转基因烟草、玉米和大豆生产的植物表达载体
【0750】本发明提供了各种植物表达系统，包括含有本发明的核酸——包括编码本发明的酶的核酸，以及包括与酶-编码序列互补的序列——的载体、重组病毒、人工染色体和类似物，所述植物表达系统用于各种具体的植物，包括烟草、玉米 (maize(corn))和/或大豆；并且本实施例描述了制备这些实施方式中的一些。
  作物   酶(酶分类)   启动子   亚细胞靶向   构建物编号   烟草   SEQ ID NO：360(由SEQ ID NO：480编码)   (CBH1)   组成型(CYLCV)   液泡   15935   烟草   SEQ ID NO：360(由SEQ ID NO：480编码)   (CBH1)   组成型(CYLCV)   ER   15936   烟草   SEQ ID NO：360(由SEQ ID NO：480编码)   (CBH1)   组成型(CYLCV)   质体   17024   烟草   SEQ ID NO：358(由SEQ ID NO：481编码)   (CBH2)   组成型(CYLCV)   ER   17022   烟草   SEQ ID NO：358(由SEQ ID NO：481编码)   (CBH2)   组成型(CYLCV)   液泡   17023   烟草   SEQ ID NO：358(由SEQ ID NO：481编码)   (CBH2)   组成型(CYLCV)   质体   17034   烟草   SEQ ID NO：168(由SEQ ID NO：482编码)   (内切葡聚糖酶)   组成型(CYLCV)   液泡   17025   烟草   SEQ ID NO：168(由SEQ ID NO：482编码)   (内切葡聚糖酶)   组成型(CYLCV)   ER   17029   烟草   SEQ ID NO：168(由SEQ ID NO：482编码)   (内切葡聚糖酶)   组成型(CYLCV)   质体   17043   玉米   SEQ ID NO：360(由SEQ ID NO：483编码)   (CBH1)   叶(PepC)   液泡   15942   玉米   SEQ ID NO：360(由SEQ ID NO：483编码)   (CBH1)   叶(PepC)   ER   15944   玉米   SEQ ID NO：360(由SEQ ID NO：483编码)   (CBH1)   叶(PepC)   质体   17026   玉米   SEQ ID NO：358(由SEQ ID NO：484编码)   叶(PepC)   ER   17013
  (CBH2)   玉米   SEQ ID NO：358(由SEQ ID NO：484编码)   (CBH2)   叶(PepC)   液泡   17014   玉米   SEQ ID NO：358(由SEQ ID NO：484编码)   (CBH2)   叶(PepC)   质体   17042   玉米   SEQ ID NO：168(由SEQ ID NO：485编码)   (内切葡聚糖酶)   叶(PepC)   ER   17084   玉米   SEQ ID NO：168(由SEQ ID NO：485编码)   (内切葡聚糖酶)   叶(PepC)   质体   17085   玉米   SEQ ID NO：168(由SEQ ID NO：485编码)   (内切葡聚糖酶)   叶(PepC)   液泡   17086   玉米   SEQ ID NO：360(由SEQ ID NO：483编码)   (CBH1)   种子(水稻谷蛋白)   ER   15943   玉米   SEQ ID NO：34(由SEQ ID NO：486编码)   (CBH1)   种子(水稻谷蛋白)   ER   17021   玉米   SEQ ID NO：358(由SEQ ID NO：484编码)   (CBH2)   种子(水稻谷蛋白)   ER   17012   玉米   SEQ ID NO：168(由SEQ ID NO：485编码)   (内切葡聚糖酶)   种子(水稻谷蛋白)   ER   17027   大豆   SEQ ID NO：360(由SEQ ID NO：480编码)   (CBH1)   种子(水稻谷蛋白)   PSV   15928   大豆   SEQ ID NO：360(由SEQ ID NO：480编码)   (CBH1)   种子(水稻谷蛋白)   ER   15929   大豆   SEQ ID NO：34(由SEQ ID NO：487编码)   (CBH1)   种子(水稻谷蛋白)   PSV   15973   大豆   SEQ ID NO：34(由SEQ ID NO：487编码)   (CBH1)   种子(水稻谷蛋白)   ER   15983   大豆   SEQ ID NO：358(由SEQ ID NO：481编码)   (CBH2)   种子(水稻谷蛋白)   PSV   15975   大豆   SEQ ID NO：358(由SEQ ID NO：481编码)   (CBH2)   种子(水稻谷蛋白)   ER   15982   大豆   SEQ ID NO：168(由SEQ ID NO：482编码)   (内切葡聚糖酶)   种子(水稻谷蛋白)   PSV   17050   大豆   SEQ ID NO：168(由SEQ ID NO：482编码)   (内切葡聚糖酶)   种子(水稻谷蛋白)   ER   15984
实施例10：表征本发明的酶
【0751】在一种实施方式中，本发明提供了多肽，例如具有β-糖苷酶活性的酶，其可以单独使用或组合使用，例如，作为“鸡尾酒”或混合物，用于任何不同的工业应用，例如，用于生物质转化，如用于生物燃料生产。本实施例表征了本发明的一些示例性多肽(例如，酶)的所选择的特性。

实施例11：转基因植物的蛋白质分析
【0752】本发明提供了转基因植物(和源自那些转基因植物的细胞和种子以及植物部分)，所述转基因植物包含本发明的表达系统，其包含本发明的载体、重组病毒、人工染色体等和/或包含本发明的核酸，包括编码本发明酶的核酸以及包括与酶编码序列互补的序列；并且本实施例描述了制备这些实施方式中的一些。
【0753】从大约100mg的叶组织或产生自非转基因和转基因植物的玉米和大豆种子的面粉获得蛋白质提取物。叶材料被置于含有小钢球的96深孔模块中并在干冰上预冷。使用GENO/GRINDERTM(SPEC/CERTIPREPTM，Metuchen，New Jersey) 将样品磨成细粉。通过集中大约10-20个种子并且使用KLECOTM研磨机(Gracia Machine Company，Visalia，CA)磨成细粉来制备面粉样品。样品在250-500μl的 Western Extraction Buffer(WEB＝12.5mM硼酸钠，pH10；2％BME；和1％SDS) 或分析缓冲液中在室温下提取大约30分钟之后，在13,000rpm离心5分钟。
【0754】通过将100μl的WEB样品转移到Eppendorf管中并加入25μl的 4×BioRad LDS或改良的BIORADTM(Hercules，CA)加样缓冲液(4×BioRad LDS： BME的比例为2∶1)，进行SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)。在70℃，将样品加热10分钟，然后立即置于冰上5分钟。简单离心样品，并将样品转移回冰上。采用MOPS缓冲液，使样品提取物(5-10μl)在BioRad 4-12％Bis/Tris蛋白质凝胶(18孔)上移动。
【0755】应用冷藏的NUPAGETM转移缓冲液(Invitrogen)，将SDS-PAGE凝胶转移到硝酸纤维素膜上，在100伏特下进行免疫印迹分析30分钟。应用丽春红 (Ponceau)染色(Sigma)显示转移到印迹上的总蛋白。丽春红染色之后，膜在具有 3％干乳的TBST洗涤缓冲液(30mM Tris-HCL，pH 7.5，100mM NaCl和0.05％ Tween 20)中，于封闭缓冲液中温育30分钟，然后在TBST中洗涤三次，5分钟。以1ug/ml加入多克隆山羊或兔初级抗体到含有3％干乳的TBST洗涤缓冲液中，并将所述印迹温育2小时至过夜。在过夜温育之后，将印迹在TBST洗涤缓冲液中洗涤3次，每次5分钟。二抗(兔-AP或山羊-AP)以1∶8000稀释(在TBST中) 并加入到印迹中30分钟。在二抗中温育之后，再次将所述印迹洗涤三次，每次5 分钟。通过加入Moss BCIP/NBT-碱性磷酸酶底物来使免疫应答性条带可见。在 BCIP/NBT底物中温育之后，用水充分冲洗印迹并允许空气干燥。
【0756】用于活性分析的样品提取物的蛋白质印迹分析显示了免疫应答性蛋白的累积和酶活性(在实施例12中描述)之间的相关性。具有ER保留序列的CBH1 (构建物15936)被检测为迁移与全长酶的预测大小(56.6kD)接近的条带。也在蛋白质印迹中检测到大约51kD的第二条、较小的带。靶向叶液泡的CBH1(构建物15935)主要作为51kD的蛋白质累积。用构建物15935和15936产生的转基因植物的蛋白质印迹数据被总结在下面的表8中。
【0757】蛋白质印迹分析被用于筛选用构建物15942和构建物15944产生的转基因玉米植物。具有ER靶向序列的玉米叶表达的SEQ ID NO：360CBH1(构建物 15944)被检测为迁移与全长酶的预测大小(57kD)接近的条带。也检测到居中大约51kD的第二条宽带。液泡靶向的SEQ ID NO：360CBH1(构建物15942)示出了大约51kD的宽条带，其在57kD处具有小的条带。构建物15942的蛋白质印迹数据被总结在下面的表9中，而构建物15944的蛋白质印迹数据被总结在下面的表 10中。
实施例12：转基因事件的酶提取和活性分析
【0758】在一种实施方式中，从本发明的转基因植物、细胞、种子和/或植物部分收获本发明的分离的或重组的酶或其它多肽；并且本实施例描述了示例性实施方式。
【0759】大约100mg转基因植物的新鲜叶组织或种子面粉在5到10ml的下列缓冲液之一中进行提取：(A)100mM醋酸钠，0.02％Tween，0.02％叠氮钠pH 4.75， 1％PVP和COMPLETETM蛋白酶抑制剂鸡尾酒片剂(Roche)；(B)100mM醋酸钠， 1mg/ml BSA，0.02％Tween和0.02％叠氮钠pH 4.75；或(C)100mM醋酸钠pH 5.3， 100mM NaCl，1mg/ml明胶，1mM EDTA、0.02％TWEEN-20TM，0.02％NaN3。用于从叶或从种子中提取蛋白质的可选的缓冲液在本领域内是熟知的。样品被放置在台式转子上30-36分钟，然后以3000rpm离心10分钟。对于新鲜的叶样品，根据如产品资料中所概述的PierceBCA程序，测定提取的总蛋白的量。根据以前公开的程序(参见，例如Methods in Enzymology，Vol 160)，应用下列底物之一进行纤维素酶活性分析：pNP-乳糖苷、甲基伞形酮酰乳糖苷(MUL)、羧甲基纤维素、燕麦 -β葡聚糖、磷酸处理的纤维素(PASC)、Avicel或用于测量纤维素酶活性的其它商业可用的底物。产生的转基因植物的酶活性数据被列于下面的表8到10中。
【0760】表8.表达靶向烟草叶的液泡(构建物15935)和ER(构建物15936) 的双子叶植物优化SEQ ID NO：360的转基因烟草事件中的纤维二糖水解酶I (CBHI)活性的总结。在缓冲液A中提取样品，并且在作为底物的甲基伞形酮酰乳糖苷上分析CBH1活性。
  构建物编号   植物ID编号   nmol/min/mg   蛋白质   蛋白质印迹   AVICELTM   结合分析   15935   Nt22-1A   0.466   +   ND(未测)   15935   Nt22-6B   0.519   +   ND   15935   Nt22-7A   0.685   +   ND   15935   Nt22-10A   0.587   +   ND   15935   Nt22-11A   0.500   +   ND   15935   Nt22-15A   0.363   +   ND   15935   Nt22-16A   1.337   +   +   15935   Nt22-17A   0.650   +   ND
  15935   Nt22-18A   1.079   +   ND   15935   Nt22-19A   0.009   -   -   15935   Nt22-23B   1.811   +   +   15935   Nt22-24B   1.151   +   ND   15935   Nt22-30B   1.338   +   ND   15936   Nt23-2B   0.170   +   ND   15936   Nt23-5A   0.118   +   ND   15936   Nt23-9A   0.670   +   ND   15936   Nt23-11A   0.666   +   +   15936   Nt23-12A   0.410   +   ND   15936   Nt23-16A   0.354   +   ND   15936   Nt23-17B   0.597   +   ND   15936   Nt23-22A   0.484   +   ND   15936   Nt23-23B   0.907   +   +   15936   Nt23-24B   0.162   +   ND   15936   Nt23-26B   0.203   +   ND   15936   Nt23-29B   0.626   +   ND   15936   Nt23-30B   0.082   -   -   15936   Nt23-32B   0.190   +   ND   非转基因对照   非转基因对照   0.007   -   ND   非转基因对照   非转基因对照   -0.010   -   ND
ND＝未测
【0761】表9.表达靶向玉米叶的液泡的单子叶植物优化SEQ ID NO：360的转基因玉米事件(构建物15942)中的纤维二糖水解酶I(CBHI)活性总结。在缓冲液A中提取样品，并且在作为底物的甲基伞形酮酰乳糖苷上分析CBH1活性。

【0762】表10.表达靶向玉米叶ER的本发明的单子叶植物优化的示例性SEQ ID NO：360的转基因玉米事件(构建物15944)中的纤维二糖水解酶I(CBHI)活性的总结。在缓冲液A中提取样品，并且在作为底物的甲基伞形酮酰乳糖苷上分析CBH1活性。
  植物ID编号平均nmol/min/mg 蛋白质   标准偏差   蛋白质印迹   001A 1.71   0.09   +   002A 0.01   0.00   -   003A 1.10   0.13   +   004A 0.03   0.00   -   005A 0.63   0.04   +   006A ND   ND   -   007A ND   ND   -   008A ND   ND   -   009A 1.20   0.04   +
  010A   ND   ND   -   011A   ND   ND   +   012A   1.34   0.09   +   013A   5.85   0.43   +   014A   1.20   0.07   +   015A   1.95   0.19   +   016A   ND   ND   -   017A   2.50   0.07   +   018A   ND   ND   +   019A   ND   ND   -   020A   0.91   0.07   +   021A   2.34   0.05   +   022A   ND   ND   -   023A   ND   ND   +   024A   ND   ND   -   025A   ND   ND   +   026A   ND   ND   +   027A   1.51   0.09   +   028A   ND   ND   +   029A   ND   ND   +   030A   ND   ND   +   031A   2.36   0.07   +   032A   ND   ND   -   033A   1.59   0.11   +   034A   ND   ND   +   035A   1.14   0.11   +   036A   1.06   0.09   +   037A   1.27   0.21   +   038A   0.55   0.01   +   039A   1.51   0.02   +   040A   1.36   0.15   +   041A   0.53   0.01   +   042A   0.02   0.00   -   043A   1.15   0.05   +   044A   0.81   0.03   +   045A   ND   ND   -   046A   0.52   0.03   +
ND＝未测
实施例13：结晶纤维素结合和水解分析
【0763】在一种实施方式中，本发明的分离的、合成的或重组的酶或其它多肽结合纤维素例如结晶纤维素和/或催化纤维素例如结晶纤维素的水解，本实施例描述了示例性实施方式和分析——其可以用于测定多肽是否具有酶促活性，例如水解酶，如纤维素酶活性。
【0764】AVICELTM微晶纤维素(MCC)结合分析：如上所述，在5mL分析缓冲液(A)中提取大约100mg叶组织。提取之后，将大约250ul的样品与25mg AVICELTM MCC温育0分钟和60分钟。零时间点样品被加入到在加入提取物之前放置在冰上的Eppendorf管中并立即处理。样品在室温下在台式顶端漩涡(benchtop vortex)上温育60分钟。温育之后，将样品在Eppendorf管中以13000rpm离心5 分钟。小心地除去上清并且用冰冷的水洗涤AVICELTM MCC 3次。最后一次洗涤之后，将80μL的蛋白质印迹提取缓冲液(WEB)和25μL的BioRad 4×加样缓冲液加入到样品中。漩涡样品，然后放置在70度10分钟。以13000rpm沉淀AVICELTM MCC，除去上清并通过如上所述的的蛋白质印迹进行分析。
【0765】通过在上段中描述的Avicel MCC结合分析对源自构建物15935 (Nt22-16A，Nt22-19A)和构建物15936(Nt23-11A，Nt23-23B，Nt23-30B)的转基因植物进行分析。植物Nt22-16A、Nt23-11A和Nt23-23B通过蛋白质印迹分析是阳性的，而植物Nt22-19A和Nt23-30B在AVICELTM MCC结合分析中是阴性的。该数据被总结在上面表8中。
【0766】AVICELTM MCC水解分析。将转基因叶样品冻干，然后用Kleco研磨机碾磨成细粉。称出大约150mg碾磨的叶材料并在室温下在4ml的缓冲液A中提取30分钟。离心样品并除去上清。1毫升各自的叶提取物、真菌表达的SEQ ID NO：360或里氏木霉(Trichoderma reesei)CBH1(Megazyme International)酶，或真菌酶——其被加入到非表达转基因提取物——被加入到50mg Avicel MCC中，并且样品被放置在37度的漩涡上。采用BCA试剂(Pierce)测量蛋白质浓度。在 0、24、48和72小时取出两份100μL样品。通过HPLC分析进行糖分析。产生的用构建物15944(靶向ER的示例性SEQ ID NO：360CBH1)转化的玉米转基因植物的数据示于下面的表11中。
【0767】来自转基因植物的蛋白质提取物相当于总蛋白含量；但是，该数据不代表示例性SEQ ID NO：360在转基因植物中的相对表达水平。表11中的数据显示植物表达的纤维素酶在AVICELTM MCC分析中具有活性，这显示了纤维素酶与底物的结合以及结合后的纤维素酶活性。
表11：纤维二糖从AVICELTM MCC的释放
  转基因编号   mg/mL纤维二糖，   在72小时产生   标准偏差   013A   2.644   0.264
  017A   1.549   0.366   036A   1.631   0.710   042A(阴性对照)   -0.086   0.001   042A+SEQ ID NO：360真菌酶(0.09mg/ml)   0.317   0.087   042A+MegaTr.(0.25mg/ml)   3.226   0.083   SEQ ID NO：360真菌酶(0.09mg/ml)   1.565   0.734   Megazyme TrCBH1真菌酶(0.05mg/ml)   3.719   0.831   仅缓冲液   0   0
Mega Tr.＝商业上可用的CBH1，Megazyme TrCBH1
实施例14：β-葡糖苷酶活性分析
【0768】在一种实施方式中，本发明的分离的、合成的或重组的酶或其它多肽具有β-葡糖苷酶活性。本实施例描述了被设计用于测量β-葡糖苷酶对pNP-β-D-吡喃葡糖苷底物的活性的示例性分析。本示例性分析可以用于确定多肽是否具有β- 葡糖苷酶活性，以及是否在本发明的范围之内。
【0769】以U/mL来描述酶活性。如果蛋白质浓度(mg/mL)是可用的，那么该值将被用于计算酶比活性(U/mg)。
单位定义
【0770】一个活性单位被定义为在定义的分析条件下(例如，pH和温度)每分钟释放1微摩尔的硝基酚所需要的酶的量。
【0771】方案(示例性多肽SEQ ID NO：560作为实例使用)
1.使用透明的96-孔板。定位所有的样品，用于快速、同时添加反应成分以提供最短的动力学读数间隔。所有样品以一式两份运行。在每一板上包括标准曲线(一式两份)。
2.标准曲线制备。在50mM磷酸钠缓冲液pH 7.0中稀释10mM p-NP溶液。制备至少500μL的每一种稀释：0、0.0625、0.125、0.25、0.5和1.0mM。
3.样品制备。对于每一待测的酶样品，首先分析未稀释的样品。如果需要稀释样品，在50mM磷酸钠缓冲液pH 7.0中稀释中进行系列稀释。制备至少100μL 每一种稀释液。
4.底物制备。为了避免在酶促反应中的底物限制，对于每一待分析的酶，应该根据经验确定pNP-β-D-吡喃葡糖苷的量。例如，对于SEQ ID NO：560，底物应该以20mM的终浓度使用。最终反应体积将是200μL(见步骤9)。对于待检测的每一酶样品和每一稀释液，制备190μL由150μL 50mM磷酸钠缓冲液pH 7.0和40μl 100mM pNP-β-D-吡喃葡糖苷储存底物(20mM的终浓度)组成的溶液。例如，如果2个酶样品的4个不同的稀释液将以一式两份进行检测，那么制备3.8mL由3.0 mL 50mM磷酸钠缓冲液pH 7.0和0.8mL 100mM pNP-β-D-吡喃葡糖苷溶液组成的溶液。在37℃在水浴中预先温育溶液5分钟，并且在将其分配到96孔板之前一刻放置到吸液盆中(见步骤6)。
5.加载(Load)标准曲线。在37℃在水浴中预先温育标准曲线稀释液样品5 分钟。以200μL/孔，重复两次加载到透明的96孔板上。将板放置在 SPECTRAMAXTM盘上，去盖(lid off)。
6.加载底物。快速将步骤4中制备的溶液转移到吸液盆中，并且以190μL/孔，重复两次将步骤4中制备的底物加载到透明的96孔板上。将板放置在 SPECTRAMAXTM盘上，去盖。
7.在动力学读数之前在37℃平衡：在添加酶样品之前在37℃温育含有标准曲线和底物的96孔板1分钟。
8.设置SPECTRAMAXTM。设置在37℃进行动力读数。选择下列 SPECTRAMAXTM设置：(1)吸光度405nm(A405)；(2)定时：设置读数为总共10 分钟，允许在读数之间的最小间隔(这将取决于每一板上将被读数的条带的数目)； (3)自动混合和空白化：“在第一读数之前自动混合”应该处于“开”，“在读数之间自动混合”和“在预先读数之前空白化”应该处于“关”；(4)“自动校准一次”：该功能应该处于“开”；(5)条带：选择只对加载样品的条带进行读数；(6)“自动读数”：本功能应该处于“关”。确保标准曲线样品被包括在动力学读数中，以使它们在相同的条件下进行读数。
9.加入酶，并开始动力学读数。快速将10μL的每一种酶稀释液(一式两份) 加入到含有190μl步骤6中分配的溶液的孔中。使用多通道吸管，用于快速、同时添加和混合样品。立即开始动力学读数；保存数据。确保通过程序以mU每分钟来计算Vmax。
计算：
【0772】标准曲线
1.使用第一动力学读数以收集标准曲线的数据(该标准曲线正好是端点测量)。首先将mM值转换为μmol；例如，200μL的1.0mM p-NP＝0.2μmol。对于标准上的每一个点，计算两份样品的均数和标准偏差，并且减去来自平均RFU值的背景值。需要最少4个数据点来产生可靠的标准曲线。
2.采用减去背景值的平均数值产生散射图，μmol p-NP在x-轴上而A405在y- 轴上。
3.应用线性回归产生关于A405对μmol p-NP的线性函数。由于减去了背景值，使y截距为0。如果R-值为0.998以下，那么忽略在标准曲线上代表最高浓度的数据点。然而，最少4个数据点必须被包括在标准曲线中。在MS EXCELTM中，用2 个小数点来使线性函数为科学记数法的格式。标准曲线的实例被示于图9A中。
【0773】酶活性
1.对于β-葡糖苷酶活性的每一测量，应用最适合标准曲线的灵敏度范围的稀释。在该稀释之内，只采用落入动力学的线性区域内的数据点以产生Vmax(Vmax 是在SPECTRAMAXTM软件内自动计算的(以mU/min))。计算每一对双份的平均数和标准偏差。标准偏差应该不大于5％。然后将平均mU/min除以1000得到U/min。
2.使用线性函数，将Vmax U/min值转化为以μmol/min表示的β-gluc活性单位(U/min除以标准曲线的斜率)，然后该值除以加入到每个孔反应中的酶的体积 (0.01mL)，最后乘以酶的稀释倍数以将μmol/min值转化为U/mL值。
3.为了获得蛋白质以U/mg表示的比活性，将U/ml值除以蛋白质浓度 (mg/mL)。
4.图9B示出了如何能够在EXCELTM中设置计算，产生25.90的标准曲线斜率 (SEQ ID NO：560和20mM pNP-β-D-吡喃葡糖苷被用于本分析)。
试剂
p-NP标准品
【0774】p-硝基酚(4-硝基酚)(Sigma N7660，10mM溶液)。避光储存在4℃。在将用于本分析中的缓冲液(例如，50mM磷酸钠pH 7.0)中配制用于标准曲线的稀释液。
pNP-β-D-吡喃葡糖苷底物(pNP-G)
pNP-β-D-吡喃葡糖苷(FW 301.3g/mol，Sigma N-7006)。为了配制10ml的 100mM储存液，称取0.3013g粉末到15mL圆锥形离心管并且将所述粉末溶解在 5.0mL DMSO中。用DIH2O调节终体积至10mL。将所述管漩涡几分钟以保证溶液完全混合。溶液应该是透明的。如果溶液是混浊的，则在热水浴中加热溶液并轻轻漩涡直到所有的物质被溶解。分装并避光保存在-20℃。
程序(示例性多肽SEQ ID NO：564被用作实例)：
【0776】本示例性分析是应用pNP-β-D-吡喃葡糖苷底物在pH 5.0和37℃的分析条件下测定β-葡糖苷酶活性。酶活性被描述为U/mL。如果蛋白质浓度(mg/mL) 是可用的，该值可以被用于计算酶比活性(U/mg)。
1.使用透明的96-孔板并设计定位所有的样品，用于快速、同时添加反应成分以提供最短的动力学读数间隔。所有样品以一式两份运行运行。在每一板上也包括一式两份的标准曲线。
2.标准曲线制备。在50mM磷酸钠缓冲液pH 5.0中稀释10mM p-NP溶液。制备至少500μL的每一种下列稀释液：5、2.5、1.25、0.625、0.3125、0.15625和 0.078125mM。注意：1.0mM＝1.0μmol/mL。
3.样品制备。对于每一待测的酶样品，首先分析未稀释的样品。如果需要稀释样品，在50mM磷酸钠缓冲液pH 5.0中制备系列稀释物。例如，纯化的SEQ ID NO：564应该被稀释100倍。制备至少100μL每一种酶稀释液；将在每个反应中使用50μl的样品。
4.底物制备。可以使用100mM的储存浓度。为了避免在酶促反应中的底物限制，对于每一待分析的酶，应该根据经验确定pNP-β-D-吡喃葡糖苷的量。例如，酶SEQ ID NO：564应该用20mM底物分析。对于待分析的每一样品，最终反应体积将是1mL。
例如，对于一个样品下列是必需的：
(i)200μl的100mM底物。
(ii)750μl的50mM磷酸钠缓冲液pH 5.0
(iii)50μl稀释的酶
5.淬灭剂板制备。由于分析在pH 5.0进行，需要淬灭步骤以适当地读取吸光度。设置透明的96-孔板，其在每一孔中具有200μL的400mM Na2CO3pH 10.0。在每一分析板的开始两列中加入50μL的每一种标准稀释液，一式两份。
6.预先温育。在1.5mL Eppendorf管中，加入750μl缓冲液和50μl酶并在37 ℃温育5分钟。单独地，同样在37℃温育底物。
7.开始反应。使用计时器并在下列时间点取等分的样品：0、2、4、8、18、 28、38和48分钟。为了开始反应，在含有缓冲液和酶的反应管中加入200μl的底物。充分混合，立即取出50μl的等分试样并加入到淬灭剂板中(一式两份)，用于第一个时间点，t＝0min。在每一时间点进行同样的操作。当取一个时间点时，立即在37℃置换反应管。观察所有时间点淬灭剂板中的颜色变化。
8.设置SpectraMax。设置在37℃进行端点读数。选择下列SpectraMax设置： (1)吸光度405nm(A405)；(2)条带：选择只对加载样品的条带进行读数。将板加载到机器上并进行读数。当读数完成时保存数据。
计算
【0777】标准曲线
1.使用端点读数以收集用于计算标准曲线的数据。首先通过与0.05相乘(加入到淬灭剂板中的体积)将p-NP稀释液(mM)转换为μmol表示的p-NP；例如， 0.05mL的1.0mM p-NP＝0.05μmol。对于每一个标准稀释，计算两份样品的均数和标准偏差，并且减去来自平均光吸收度值的背景值。需要最少4个数据点来产生可靠的标准曲线。
2.采用减去背景值的平均数值产生散射图，μmol p-NP在x-轴上而A405在y- 轴上。
3.应用线性回归趋势线产生关于A405对μmol p-NP的直线函数。由于减去了背景值，使y截距为0。如果R-值为0.998以下，那么忽略在标准曲线上代表最高浓度的数据点。然而，最少4个数据点必须被包括在标准曲线中。在MS EXCEL中，用2个小数点来使线性函数成为科学记数法的格式。标准曲线的实例被示于图10A 中。
【0778】计算酶比活性
为了测量β-葡糖苷酶活性，应用最适合标准曲线的灵敏度范围的稀释。采用端点读数以收集数据用于计算每一种酶的比活性。
1.对于每一种酶的稀释，在每一时间点，计算双份样品的平均数和标准偏差，并且从平均光吸收度值减去背景值(在时间点0分钟的吸光度)。标准偏差应该不大于5％。大于1.00的吸光度不应该用于计算，因为其不位于吸光度数据的可靠范围之内。再一次，需要最少4个数据点来产生可靠的反应速率曲线。
2.采用减去背景值的平均数值产生散射图，以分钟形式的时间在x-轴上而A405 在y-轴上。
3.应用线性回归趋势线产生关于A405在48分钟的时间进程中的直线函数。由于减去了背景值，使y截距为0。如果R-值为0.998以下，那么试着忽略可能离群 (outlier)的数据点。
4.然后产生表格，如下所示：
a.斜率[ΔAbs/min]-反应速率
b.最终的酶稀释-最初的酶稀释*(100)
c.加入到反应中的酶体积-0.05mL
d.斜率比[μmol/min]-(反应速率的斜率/标准曲线的斜率)
e.酶活性[U/mL]-(斜率比/反应中的酶体积)*稀释倍数
f.蛋白质浓度[mg/mL]-来自A280扫描的值
g.比活性[U/mg]-(酶活性/蛋白质浓度)
5.图10B示出了如何能够在EXCELTM中设置计算，产生256.91的标准曲线斜率(SEQ ID NO：564-100×和20mM pNP-β-D-吡喃葡糖苷被用于所述分析)。
·标准曲线和端点吸光度应该在SpectraMax上在同一读数中一起测量，以使标准和样品之间的灵敏度相配。
·确定p-NP的目标范围，以得到线性吸光度。始终配制新鲜的p-NP标准稀释液。
·使用相同的缓冲液pH 5.0用于标准曲线和样品测量。p-NP对于温度和 pH的变化高度敏感。
试剂
p-NP标准
【0779】p-硝基酚(4-硝基酚)(Sigma N7660，10mM溶液)。避光储存在4 ℃。在将用于本分析的缓冲液(例如，50mM磷酸钠pH 5.0)中配制用于标准曲线的稀释液。
pNP-β-D-吡喃葡糖苷底物(pNP-G)
【0780】pNP-β-D-吡喃葡糖苷(FW 301.3g/mol，Sigma N-7006)。为了配制 10ml 100mM的储存液，称取0.3013g的粉末到15mL圆锥形离心管中并将所述粉末溶解在5.0mL DMSO中。用蒸馏水(DIH2O)将终体积调节到10mL。将所述管旋涡几分钟以确保溶液完全混合。溶液应该是透明的。如果溶液是混浊的，在热水浴中加热该溶液并轻轻旋涡直到所有物质溶解。分装并避光保存。
【0781】β-葡糖苷酶评价
·67种β-葡糖苷酶被部分表征；基于下列标准进一步评价了本发明的这些酶中的36种：(1)在pH5和7和T＝37-90℃对纤维二糖和荧光底物甲基伞形酮酰β-D 吡喃葡糖苷(4-MU-GP)的活性；(2)在异源宿主中的表达；(3)在T＝60-80℃， pH5时的残余活性；和(4)产物抑制的水平。基于多种选择标准鉴定了本发明的八(8) 种β-葡糖苷酶：包括本发明的示例性多肽SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：586和 SEQ ID NO：558。
·产生His-标签形式的本发明的这些β-葡糖苷酶并通过分批发酵在大肠杆菌中生产。完成了本发明的五(5)个示例性酶的蛋白质纯化。开发了使用pNP-β-D- 吡喃葡糖苷底物(pNP-G)的基于吸光度的活性分析，并用于测定本发明的示例性酶的比活性。Megazyme I黑曲霉β-葡糖苷酶在所有实验中被用作基准。几种酶在选择的分析条件下具有显著高于商业基准的比活性。
·为了完成最适合用于多酶鸡尾酒的β-葡糖苷酶的选择，可以用具有高比活性的本发明的β-葡糖苷酶来测定在T＝60-80℃时的产物抑制和残余活性。
β-葡糖苷酶的表征
【0782】引言：本工作具有下列主要目标：(1)鉴定用于四种酶鸡尾酒的本发明的β-葡糖苷酶，所述鸡尾酒被设计为满足MS1标准；(2)鉴定能够用于组合分析的几种酶。
【0783】67种β-葡糖苷酶被部分表征。基于下列标准进一步评价了这些酶中的36种：(1)在pH5和7以及T＝37-90℃对纤维二糖和荧光底物甲基伞形酮酰β-D 吡喃葡糖苷(4-MU-GP)的活性；(2)在异源宿主中的表达；(3)在T＝60-80℃， pH5时的残余活性；和(4)产物抑制的水平。基于多种选择标准鉴定了本发明的下列8种β-葡糖苷酶：本发明的示例性多肽SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：586和 SEQ ID NO：558。
【0784】为了增加蛋白质的纯化，产生了His-标签形式的本发明的所有示例性 β-葡糖苷酶(SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、 SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：586和SEQ ID NO：558)。在摇瓶中评价了表达，并且最佳诱导条件被转到发酵程序中。通过分批发酵(10L的规模) 生产示例性酶，回收原料并通过FPLC方法纯化蛋白质。通过几种方法，包括 Bradford分析、凝胶光密度分析法和在A280的吸光度，来测定蛋白质浓度。开发了使用pNP-β-D-吡喃葡糖苷底物(pNP-G)基于吸光度的活性分析。该分析被用于测定本发明的β-葡糖苷酶的比活性。商业的黑曲霉β-葡糖苷酶在所有实验中被用作基准。为了完成对最适合于上面概述的目标的β-葡糖苷酶的选择，可以应用纯化的具有高比活性的本发明酶的蛋白质制备物来测定在T＝60-80℃时的产物抑制和残余活性。
方法/结果：
(1)蛋白质表达、产生和纯化
【0785】通过定点诱变产生His-标签形式的本发明的全部的酶，所述定点诱变在原始亚克隆的pSE420载体中的ORF和C-端6X-His标签之间除去终止密码子。
【0786】除了SEQ ID NO：558之外的所有的酶在大肠杆菌宿主(菌株GAL631 和Rosetta Gami)中表达，并且通过10L分批发酵产生。这些蛋白质中的几种以可溶的或不溶的部分进行表达，并且在完全完成(extensive troubleshooting)之后从上清(S)和细胞沉淀(P)中回收。名称“S”和“P”将接着用于相关的下一部分，在下一部分中，蛋白质纯化和活性分析将被呈现。也在毕赤酵母x33宿主(载体pPICZ 和pGAP)中评价了本发明的所有酶的表达。所有的亚克隆产生可溶的蛋白质，但是表达和活性太低而不能允许在酶表征中使用毕赤酵母产生的材料。SEQ ID NO：558最初在毕赤酵母x33中产生并且显示了良好的表达(35％的纯度)，但是也具有高水平的产物抑制。His-标签形式的SEQ ID NO：558在毕赤酵母中很少表达，没有进一步被表征。
【0787】完成了在大肠杆菌中产生的本发明的7种酶中的5种(SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：530和SEQ ID NO：566) 的FPLC蛋白质纯化。使用了His-标签酶构建物，各自的1克冻干粉末被重悬在10.0 mL的缓冲液A.(20mM Tris-HCl，500mM NaCl，pH8.0)中，并且在同样的缓冲液中透析过夜。透析之后，10mL的每一种样品被加载到HISTRAPTM 5mL柱上并用HISTRAPTM 5mL程序进行洗脱。HISTRAPTM方法需要用5倍柱体积的缓冲液 A来洗涤未结合的蛋白质，并且使用线性梯度的缓冲液B(20mM Tris，500mM NaCl，1M咪唑，pH8.0)以超过20倍柱体积来洗脱结合的蛋白质。在所述程序期间维持2mL/min的流速并且在96深孔板中收集1mL的洗脱级分。基于FPLC数据，最佳的级分——那些位于色谱峰之下的级分，被选择来测试酶活性和表达/纯度。应用4-MU-GP荧光分析测试活性。选择的级分也在PAGE凝胶上跑胶来测试纯度。
【0788】发酵回收和蛋白质纯化的成果总结被示于表1中。所有本发明的这些示例性酶都被足量(“总冻干粉末”和“在1g粉末和总份额(lot)中期望mg的纯化蛋白”)产生，以对相关的酶进行深入的生物化学表征。
【0789】表1——如图11所述，示出了来自本发明的β-葡糖苷酶产生和纯化总结的数据。
(2)蛋白质浓度的测定
【0790】三种方法被用于测定纯化蛋白质的浓度：Bradford分析、凝胶光密度分析法和在A280的吸光度。在活性表征之前，所有FPLC纯化的蛋白质在50mM NaPi pH 7.0中进行透析。结果被总结在图11的表中。
【0791】Bradford比色分析测量在595nm的蛋白质吸光度。纯化的蛋白质样品被加入到分析染料试剂中，观察颜色变化并在595nm读取吸光度。在0.05、0.1、 0.2、0.3、0.4和0.5mg/mL使用BSA蛋白质标准品以确定未知的浓度。从用BSA 标准品产生的“最佳匹拟合线(line-of-best fit)”的线性曲线来推断酶的蛋白质浓度。
【0792】为了评价蛋白质纯度并且通过凝胶光密度分析法测定浓度，5μL的酶被加载到4-12％Tris-甘氨酸PAGE凝胶(Invitrogen)上的每一泳道，并在在2×MES 缓冲液中以200V电泳50分钟。每一样品所加载的蛋白质的量被记录在下面。BSA 蛋白质标准(Pierce)以每一泳道0.25、0.50、1.00、1.50和2.00μg总量被加载到所有的凝胶上。应用软件扫描凝胶，基于BSA标准曲线确定蛋白质浓度。
【0793】图12A：通过FPLC方法从上清和细胞沉淀部分纯化的SEQ ID NO：548、SEQ ID NO：564和SEQ ID NO：560的PAGE电泳：
泳道1-标记加两梯度(Invitrogen)
泳道2-SEQ ID NO：548(P)-0.07μg
泳道3-SEQ ID NO：548(S)-0.12μg
泳道4-SEQ ID NO：564(P)-0.23μg
泳道5-SEQ ID NO：564(S)-0.41μg
泳道6-SEQ ID NO：560(P)-0.54μg
泳道7-SEQ ID NO：560(S)-0.37μg
泳道8-BSA标准品-2.0μg
泳道9-BSA标准品-1.5μg
泳道10-BSA标准品-1.0μg
泳道11-BSA标准品-0.50μg
泳道12-BSA标准品-0.25μg
【0794】图12B：通过FPLC方法从上清和细胞沉淀部分纯化的SEQ ID NO：530 和SEQ ID NO：566的PAGE电泳：
泳道1-SeeBlue标记加两梯度(Invitrogen)
泳道2-SEQ ID NO：530(P)-0.18μg
泳道3-SEQ ID NO：530(S)-0.12μg
泳道4-N/A
泳道5-SEQ ID NO：566(S)-0.07μg
泳道6-N/A
泳道7-空白
泳道8-BSA标准品-2.00μg
泳道9-BSA标准品-1.50μg
泳道10-BSA标准品-1.00μg
泳道11-BSA标准品-0.50μg
泳道12-BSA标准品-0.25μg
【0795】当在A280nm的吸光度被用于测定蛋白质浓度时，如图11所述，示于表1中的1mL物质被放置在石英杯中并且在A200-A320nm在5nm范围进行扫描。使用VectorNTi软件，基于单个氨基酸序列测定的A280值和摩尔消光系数(εm)被用于计算蛋白质浓度(C＝mg/mL；C＝(A280xMW/(εm))；(MW＝蛋白质分子量)。计算A260/A280比并用于估计蛋白质纯度(期望大约为0.5至0.7的比为高纯度的蛋白质)。*示于表1(图11)的样品是浓缩的。
【0796】表2，如图13中所述，示出了通过三种不同方法测定的纯化的β-葡糖苷酶的蛋白质浓度：
【0797】用上述三种独立的方法获得的值(mg/mL)对于大多数样品是一致的，特别是当比较通过凝胶光密度分析法和在A280的吸光度测定的量时。由于这三种方法应用不同的参数来估计蛋白质浓度，假定Bradford分析倾向于高估蛋白质浓度，所以通过在A280的吸光度测定的mg/mL值将被用于计算蛋白质的比活性。
(3)β-葡糖苷酶比活性的测定
【0798】使用pNP-β-D-吡喃葡糖苷底物(pNP-G)的基于吸光度的活性分析被开发，并且被用于测定本发明的酶的比活性。一个活性单位被定义为在定义的分析条件下每分钟释放1微摩尔的硝基酚所需要的酶的量。以U/mL来描述酶活性。当蛋白质浓度(mg/mL)是已知的时，可以应用这些值来测定酶的比活性(U/mg)。
【0799】对于全面的活性测试，以连续的方式稀释纯化的蛋白制备物并且在 pH 7与20mM pNP-G在T＝37℃温育10min。商业的黑曲霉β-葡糖苷酶被用作基准。利用在50mM磷酸钠缓冲液pH 7中稀释成0.0625、0.125、0.25、0.5和1μmol/mL，产生标准曲线。酶加样量被调节至获得这样的吸光度，其将在测试分析中的p-NP 标准曲线的线性范围之内。测定酶活性并以U/mL表示。通过在A280的吸光度测定的蛋白质浓度被用于计算比活性。结果总结示于表3中，如图14中所述。
【0800】在选择的分析条件下，目前表征的5种酶中的4种显示了高于商业基准的比活性(表3/图14)。SEQ ID NO：548和SEQ ID NO：560显示了比基准高大约 4-5倍的比活性。SEQ ID NO：564和SEQ ID NO：530胜过基准大约15倍。当酶从可溶的或不溶的细胞部分纯化时，没有观察到显著差异。由于实践原因，pNP-G分析在pH 7进行，假定本发明的β-葡糖苷酶在宽的pH范围内显示出活性。但是，由于黑曲霉β-葡糖苷酶在较低的pH显示出最佳的活性，比活性比较将在pH 5重复进行。*表1中示出的样品是浓缩的。
【0801】表3或图14示出了本发明的纯化的β-葡糖苷酶的比活性。
总结
【0802】本发明的5种β-葡糖苷酶通过分批发酵生产并且通过FPLC方法纯化蛋白质。通过几种方法，包括Bradford比色分析、凝胶光密度分析法和在A280的吸光度测定蛋白质浓度。测定了本发明的5种β-葡糖苷酶的比活性，并且与黑曲霉 β-葡糖苷酶的商业制备物——其购自Megazyme，被用作基准——进行比较。
【0803】在选择的分析条件(表3)下，目前表征的5种酶中的四种优于商业基准。这些酶中的两种(SEQ ID NO：564和SEQ ID NO：530)显示了比基准高大约 15倍的比活性。当与基准进行比较时，SEQ ID NO：548和SEQ ID NO：560显示了高大约4-5倍的比活性。当在纤维二糖底物上评价半纯化的蛋白质时，在500、400 和200mM葡萄糖分别存在的情况下，非-His标签形式的SEQ ID NO：564、SEQ ID NO：548和SEQ ID NO：530(SEQ ID NO：564、SEQ ID NO：548和SEQ ID NO：530) 显示出产物抑制。
【0804】蛋白质浓度的精确测定被证明是具有相当的挑战性。然而，用本研究中使用的三种独立方法获得的值(mg/mL)对于大多数的样品是一致的，特别是当比较通过凝胶光密度分析法和在A280的吸光度测定的量时(表2)。由于三种方法使用了不同的参数来估计蛋白质浓度，并且假定Bradford分析倾向于高估蛋白质浓度，所有通过在A280的吸光度测定的mg/mL值被用于蛋白质比活性的计算。
本发明的β-葡糖苷酶的进一步表征
【0805】在本实施例中描述的研究的主要目标是：(1)鉴定用于多酶鸡尾酒的本发明的示例性β-葡糖苷酶，所述多酶鸡尾酒被设计用于有效降解预处理的甘蔗渣中的纤维素成分；(2)鉴定本发明的几种酶，以用于高通量组合分析。
【0806】六十七(67)种β-葡糖苷酶被部分表征，并且基于下列标准进一步评价了这些酶中的36种：(1)在pH5和7以及T＝37-90℃对纤维二糖和对荧光底物4- 甲基伞形酮酰β-D吡喃葡糖苷(4-MU-GP)的活性；(2)在异源宿主中的表达；(3) 在T＝60-80℃，pH5时的残余活性；和(4)葡萄糖的产物抑制的水平。基于多种选择标准鉴定了本发明的下列8种酶：本发明的示例性酶SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：586和SEQ ID NO：558。
【0807】为了增加蛋白质的纯化，产生了His-标签形式的本发明的8种示例性酶，并且通过分批发酵(10L的规模)在大肠杆菌中产生。成功完成了本发明的8 种示例性酶中的5种(SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：566和SEQ ID NO：530)的蛋白质纯化，并且利用基于吸光度的活性分析和 pNP-β-D-吡喃葡糖苷底物(pNP-G)测定了在pH7的比活性。商业的黑曲霉β-葡糖苷酶在所有实验中被用作基准。鉴定了四种酶(本发明的示例性酶SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560和SEQ ID NO：530)，所述酶在pH 7显示了显著高于商业基准的比活性。
【0808】对本发明的5种示例性酶——β-葡糖苷酶——进行了额外的生物化学表征，以选择适合用于多酶鸡尾酒和适合用于高通量组合分析的最终的候选酶。如本文所述测定了在pH 5的比活性、在葡萄糖(0至2M)存在下的产物抑制、在60 ℃的残余活性以及pH特性(profile)(在pH 4至8的比活性)。
方法/结果：
(1)β-葡糖苷酶在pH 5的比活性的测定
【0809】开发了应用pNP-β-D-吡喃葡糖苷底物(pNP-G)的基于吸光度的活性分析，并被用于测定本发明的示例性酶的比活性。一个活性单位被定义为在定义的分析条件下每分钟释放1微摩尔的硝基酚所需要的酶量。以U/mL来描述酶活性。当蛋白质浓度(mg/mL)是已知的时，可以应用这些值来测定酶的比活性(U/mg)。
【0810】对于全面的活性测试，以连续的方式在50mM磷酸钠缓冲液pH 5中稀释纯化的蛋白制备物并且在T＝37℃与20mM pNP-G(1mL总反应体积)温育 48min。在时间点0、2、4、8、18、28、38和48min取出50μl等分试样并加入到每一孔含有200μl的400mM Na2CO3 pH 10的淬灭剂96孔板中。商业的黑曲霉β 葡糖苷酶被用作基准。利用在50mM磷酸钠缓冲液pH 5中稀释成0.0625、0.125、 0.25、0.5和1μmol/mL的10mM p-硝基酚(p-NP)产生标准曲线。在405nm(端点读数)测量吸光度。酶负载被调节至获得这样的吸光度，其将保持在检测分析中的p-NP标准曲线的线性范围之内。测定酶活性并以U/mL表示。通过在A280的吸光度测定的蛋白质浓度被用于计算比活性。结果总结于表1中，如图15中所述。
【0811】与黑曲霉β葡糖苷酶相比，本发明的5种选择的酶中的两种(SEQ ID NO：564和SEQ ID NO：530)在pH 5显示出了较高的比活性。与基准相比，本发明的另外三种示例性酶在pH 5具有较低的比活性(表1/图15)。
【0812】表1——如图15中所述，示出了本发明的β-葡糖苷酶的比活性。
(2)在葡萄糖存在下的产物抑制
【0813】本工作的目标是评价本发明的β-葡糖苷酶在各种浓度的葡萄糖存在下的产物抑制和酶活性水平。以0至300mM(“低剂量”)和0至2M(“高剂量”) 施用葡萄糖，并且如在前面部分中所述(在37℃和pH 5反应48分钟)测定对p-NPG 底物的比活性。基于过程假设(process assumptions)(在20％固体水解)和以前用半纯化的酶进行产物抑制实验获得的结果选择葡萄糖浓度。对于每种酶，在葡萄糖不存在的情况下的比活性被指定为100％。
【0814】本发明的所有5种示例性酶在pH 5，在本实验中评价的所有葡萄糖浓度的存在下保持活性，并且显著优于黑曲霉基准。在假定在20％固体水解甘蔗渣 (大约50％的纤维素含量)和50％酶促转化的商业过程中，将从1kg的起始材料 (在本实验中评价的“低剂量”的当量)产生大约280mM葡萄糖(50g/L)。与商业基准保持＜25％的活性相比，在本研究中测试的本发明的所有5种示例性酶在300 mM葡萄糖存在下保持≥50％的活性。在更高的葡萄糖浓度存在下，观察到了类似的趋势。例如，将会在≥50％固体进行的过程中期望≥1M葡萄糖的积累，这在实践中将会非常难以达到的。然而，即使在这样苛刻的条件下，本发明的所有5种示例性酶保持≥20％的活性，而商业的基准保持＜5％的活性。
【0815】在多个实验中反复观察到在葡萄糖存在的情况下SEQ ID NO：560和 SEQ ID NO：566的比活性增加。这种现象没有被理解，并且在这时将不会进一步研究。
(3)在60℃时的残余β-葡糖苷酶活性
【0816】在60℃，在pH 5，将本发明的四种(4)示例性β-葡糖苷酶(SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560和SEQ ID NO：530)和商业的黑曲霉β- 葡糖苷酶温育0-4小时(1mL反应体积，300rpm混合)。在每一小时取出等分样品并如在本报告的部分(1)中所述分析对p-NPG底物的残余活性。对于每一种酶，在Time＝0h时的比活性被指定为100％。
【0817】4种测试酶中的3种(SEQ ID NO：548、SEQ ID NO：564和SEQ ID NO：530)在暴露于60℃较长的时间(≥2h)之后显示了显著的活性丧失。这些酶在 60℃4h后损失≥50％的活性，而商业的基准则保持了大约70％的活性。这个发现与以前用粗制蛋白质制备物(冻干的细菌裂解物)在纤维二糖和在荧光底物上分析产生的结果相矛盾。当分析为粗酶(存在的感兴趣蛋白质≤10％总蛋白质)时，所有4 种酶在60℃4h后保持＞90％的活性。有可能残留的宿主蛋白质能够在升高的温度提供一些稳定作用。但是，这个发现进一步强调为了进行有意义的酶表征有必要产生纯化的蛋白质制备物。
(4)示例性β-葡糖苷酶的pH特性(profile)的测定
【0818】在pH 4、5、6、7和8，在p-NPG底物上测定了本发明的五(5)种示例性酶，β-葡糖苷酶SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：566和SEQ ID NO：530以及商业黑曲霉β-葡糖苷酶的比活性。在pH 4和5进行的分析如上面所描述的操作，除了50mM磷酸钠缓冲液被调节至pH 4和5。在 pH 6、7和8进行的分析如上面所描述的操作。简而言之，以连续方式稀释纯化的蛋白质制备物，并且在T＝37℃，与20mM pNP-G在pH 6、7和8温育10min。商业黑曲霉β-葡糖苷酶被用作基准。利用在50mM磷酸钠缓冲液pH 6、7和8中稀释成0.0625、0.125、0.25、0.5和1μmol/mL的10mM p-硝基酚(p-NP)产生标准曲线。酶加载被调节，以获得这样的吸光度，所述吸光度将保持在检测分析中的 p-NP标准曲线的线性范围之内。测定酶活性并以U/mL表示。通过在A280的吸光度测定的蛋白质浓度被用于计算比活性(U/mg)。在pH 4-8范围内确定的比活性被总结在下面表2中。
【0819】基于在pH4-8范围内保持的比活性，所有本发明的测试示例性β-葡糖苷酶都优于基准。SEQ ID NO：564和SEQ ID NO：530显示了强的pH 5最佳比活性(下面表2)和窄的pH特性(在pH 6保持14-18％的比活性，在pH 7保持11％的比活性)。基准酶显示了强的pH 4-5最佳比活性并且在pH 6只保持5％的比活性，在pH 7保持1％的比活性。与SEQ ID NO：564和SEQ ID NO：530相比，SEQ ID NO：548、SEQ ID NO：560和SEQ ID NO：566显示了与基准更相似的pH 4-5的范围。
表2.β-葡糖苷酶和基准在pH4-8的比活性：
  E nzyme/pH   4   5   6   7   8   SEQ ID NO：548   45.60   40.64   8.88   6.70   4.87   SEQ ID NO：564   162.14   416.03   57.97   44.52   35.41   SEQ ID NO：560   88.74   101.79   13.83   10.98   7.93   SEQ ID NO：530   159.47   274.59   50.29   30.11   12.69   SEQ ID NO：566   8.04   11.43   1.93   0.99   0.45   A.niger β-gluc.   177.69   163.72   9.45   1.78   0.66
Enzyme：酶；A.niger：黑曲霉
总结：
【0820】完成了本发明的β-葡糖苷酶的选择，该酶在一些实施方式和应用中可能最适合用于多酶鸡尾酒。选择本发明的五种示例性酶进一步表征以确定它们在 pH5的比活性，在葡萄糖(0-2M)存在下的产物抑制、在60℃的残余活性以及pH 特性(在pH4-8的比活性)。
【0821】根据考虑的所有参数，除了在较长时间暴露于高温(在60℃，4h) 之后的残余活性之外，所选择的本发明的酶大大地优于商业的基准(Megazyme黑曲霉β-葡糖苷酶)。这些酶在pH 5显示了高的比活性和很少的葡萄糖产物抑制。所选择的本发明的示例性酶在广的pH范围内保持活性并且能够在各种应用中使用。几种β-葡糖苷酶的表征总结被示于下面表3中：
表3.表征总结
  酶   SA，   在pH5   (U/mg)   SA，   在pH7   (U/mg)   ％活性   (0.3M葡萄   糖)   pH最适   /范围   ％残留活性   (4h，在60℃)   SEQ ID NO：564   416   45   76   5/4-8   17   SEQ ID NO：530   275   30   50   5/4-8   25   SEQ ID NO：560   102   11   ＞100   4-5/4-8   90   黑曲霉   164   2   18   4-5/4-6   70
SA，比活性；示于表1和2中的数被四舍五入到0小数。
选择的β-葡糖苷酶研究的总结

实施例15：本发明的β-葡糖苷酶表征
【0822】本工作的主要目标是表征本发明的示例性β-葡糖苷酶，以鉴定可以被包括在4-酶鸡尾酒中的最合适的酶(一种或多种)。在较高温度的酶活性和残余稳定性，良好的比活性以及低的或没有产物抑制，被选择作为用于对候选酶分级的主要选择标准。采用替代荧光底物(pNP-B-吡喃葡糖苷)，在不同的pH和温度评价 67种酶β-葡糖苷酶集合。本发明的14种酶被鉴定为表现最好的酶，并且被选择用于在纤维二糖底物上进行更详细的评价。目前这些酶中的10种已经被评价。来自亚克隆发酵的半纯的蛋白质制备物被用于分析，所述分析包括(1)在不同pH和温度条件下的酶活性测定，(2)比活性的半-定量分析，和(3)在可达80℃的温度下的残余活性的测定。用几种酶剂量和底物浓度以及在下面部分中描述的pH和温度条件下进行分析。在0.5h-4h的反应时间内选择时间点，并且用AMPLEX葡萄糖氧化酶分析来测量释放的葡萄糖的量。进行PAGE(聚丙烯酰胺凝胶电泳)来估计在反应中使用的蛋白质的量。
方法/结果：
(1)β-葡糖苷酶在pH 5和pH 7以及在37℃和90℃之间的温度范围的活性
【0823】来自亚克隆发酵的半纯冻干蛋白质制备物在50％甘油中重构，以获得 25mg/ml的总蛋白质浓度。随后蛋白质制备物被稀释40倍(根据经验确定以避免酶被甘油抑制)并被用于反应，所述反应在pH5和pH7，并且在37、40、50、60、 70、80和90℃进行1小时。使用2mM纤维二糖底物。反应体积为50μl(底物和酶以1∶1的比例存在)。在本实验中，评价了下列10种酶：SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：542、SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：532、SEQ ID NO：560、SEQ ID NO：592、SEQ ID NO：586和SEQ ID NO：576。结果示于图18 中。
【0824】图18图解说明了显示应用本发明的示例性酶在pH 5在不同温度下2 mM纤维二糖水解的数据。
【0825】图19图解说明了显示应用本发明的示例性酶在pH 7在不同的温度下 2mM纤维二糖水解的数据。
【0826】基于本实验中获得的结果得出下列结论：
(1)大多数测试的本发明的示例性酶在pH 5比在pH 7表现得更好；
(2)本发明的几种示例性酶在pH 5在温度范围内显示出强活性(SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：542、SEQ ID NO：548和SEQ ID NO：560) 并且被选择用于更详细的分析；
(3)SEQ ID NO：556在所有温度保持非常大的活性，而SEQ ID NO：560在高达 90℃时具有活性。
(4)温度60℃和pH5被选择作为将来实验的反应条件，用于模拟这些酶在4- 酶鸡尾酒中将会遇到的反应条件。
(2)选择的本发明的β-葡糖苷酶的比活性的半定量测定
【0827】准确的测定比活性是不实际的，因为半纯的蛋白质制备物被用于这里描述的实验(纯化的蛋白质对于这种最初的筛选不可用)。为了以半定量的方式测定比活性，制备了用于每一选择的酶的多种稀释液，并应用10mM底物(根据经验确定的量以避免底物限制)，在pH 5和60℃，进行16分钟的纤维二糖消化。反应体积是50μl(底物和酶以1∶1的比例存在)。目标是在选择的反应条件下实现所有酶的相当的速率动力学。平行进行PAGE以估计每一蛋白质制备物中的β-葡糖苷酶的量。在制备物中带有最少量的蛋白质(最稀的)并且具有与其它蛋白质相当的速率的酶被认为在测试条件下具有最好的比活性。
【0828】在这些实验中也评价了Megazyme β-葡糖苷酶(纯的蛋白制剂)，虽然如果用于本研究的本发明的酶没有被纯化时，不能与本发明的示例性β-葡糖苷酶进行直接比较。本实验的结果被示于图16(纤维二糖消化)和图17(PAGE电泳) 中。
【0829】图16：图解说明了酶稀释的最初速率动力学的数据，所述酶稀释对每一测试的本发明β-葡糖苷酶根据经验选择。
【0830】图17：图解说明了本发明的示例性SEQ ID NO：556、SEQ ID NO：560 和黑曲霉β-葡糖苷酶的PAGE电泳。相等的1μl每种样品被加载到每一泳道中。箭头表示与每一样品中的β-葡糖苷酶对应的蛋白质带。
【0831】基于在本实验中获得的结果，可以得出下列结论：
(1)在所有测试的本发明的β-葡糖苷酶中，SEQ ID NO：556和SEQ ID NO：560 表现最好(在最高的酶稀释度，具有与以较低稀释度使用的其它酶获得的速率相当的最初速率)；
(2)基于此处示出的半定量分析，SEQ ID NO：556和SEQ ID NO：560具有非常相当的比活性。根据这两种酶的示出的PAGE电泳数据，相似量的每一种酶存在于本反应中使用的蛋白质制备物中。当对示于图17中的凝胶进行密度扫描时，经确定大约1mg/ml SEQ ID NO：556酶和0.7mg/ml SEQ ID NO：560酶存在于被稀释10 倍用于凝胶加载的相应蛋白质制备物(存在于SEQ ID NO：556制备物中的β-葡糖苷酶蛋白质比存在于SEQ ID NO：560制备物中的β-葡糖苷酶蛋白质多1.5倍)中；由于在纤维二糖消化反应中SEQ ID NO：556比SEQ ID NO：560多稀释1.5倍以获得相当的反应速率(1200倍对800倍，对于在50μl反应体积中的每一种酶，使用25μl 体积)，这两种酶的比活性显得非常相似。在图16中列出的浓度的BSA标准被用于密度扫描中进行校准。
(3)存在于Megazyme纯蛋白制备物中的β-葡糖苷酶的量估计为大约1mg/ml；虽然这种酶被明显稀释更高的倍数以获得相当的纤维二糖消化速率(对于SEQ ID NO：556和SEQ ID NO：560，分别是2,500倍对1,200倍或800倍)，其相对比活性不可能与SEQ ID NO：556和SEQ ID NO：560相当，因为纯度非常不同的蛋白质制备物被用于纤维二糖消化中；
(4)对于SEQ ID NO：566、SEQ ID NO：542和SEQ ID NO：548，不能进行相似的比活性半定量测定，因为在PAGE凝胶上不能鉴定相关的蛋白质条带，原因在于可用于这些酶的蛋白质制备物的纯度低。这与这些酶获得与SEQ ID NO：556和SEQ ID NO：560相当的速率所需要的物质(较低的蛋白质制备物稀释)的量明显较高有关。
(3)在高温下，在4小时纤维二糖水解中所选择的本发明β-葡糖苷酶的残余活性。
来自亚克隆发酵的半纯的蛋白质制备物被稀释以获得如在前面部分中讨论的相当的反应速率：SEQ ID NO：556-1,200倍，SEQ ID NO：566-40倍，SEQ ID NO：542-250倍，SEQ ID NO：548-300倍，SEQ ID NO：560-800倍。Megazyme黑曲霉β-葡糖苷酶被稀释2,500倍。10mM纤维二糖被用作底物，消化反应在60℃、 70℃和80℃进行4h，在每一小时取时间点。反应体积是50μl(底物和酶以1∶1 的比例存在)。
【0832】基于在本实验中获得的结果得出下列结论：
(1)SEQ ID NO：556和SEQ ID NO：560在4h反应时间内在所有温度下保持活性；
(2)在4h反应结束时，这两种酶在60℃、70℃或80℃(在所有温度可比量的葡萄糖被释放)的活性没有显著差异；
(3)基于随时间释放的葡萄糖的量，看来在4小时＞60％的每种酶都仍具有活性。这个发现间接暗示所述两种酶在较高的温度是稳定的，并且同样地，可以是包括在4-酶鸡尾酒内的合适候选酶；
(4)SEQ ID NO：566和SEQ ID NO：542在70℃和80℃显示了显著的活性损失； SEQ ID NO：548在70℃保持大约50％的活性并且在80℃不具有活性；
(5)观察到Megazymeβ-葡糖苷酶在70℃活性损失＞75％，并且所述酶在80℃不具有活性。
总结：
【0833】在此处讨论的几个实验中评价了本发明的10个示例性β-葡糖苷酶，并且当实践时，与从Megazyme购买的来自黑曲霉的β-葡糖苷酶的商业制剂进行比较。本发明的示例性酶SEQ ID NO：556和SEQ ID NO：560在高达90℃的温度中显示了高反应性并且在80℃，在pH 5在4小时的反应中保持大于60％的活性。本发明的这两种酶在测试条件下，在70℃和80℃优于Megazyme的商业β-葡糖苷酶，并且在这时被视为4-酶鸡尾酒的热门候选酶。由于在这些实验中使用的蛋白质制备物的纯度低，所以本发明的β-葡糖苷酶的比活性不能被准确测定。目前正用在此处讨论的实验中评价的所有酶来研究产物抑制。
【0834】可以对本发明的其它酶进行相似的表征，例如，基于在替代底物 (pNP-B-吡喃葡糖苷)上获得的数据，剩余的四种β-葡糖苷酶鉴定为表现最好的酶。在不同的pH和温度下，本发明的其它酶可以在纤维二糖上进行表征，以鉴别可用于4-酶鸡尾酒的最好的酶。表现最好的酶可以进行蛋白质纯化以更准确地测定比活性。表现最好的酶——其将基于这里讨论的所有标准而被选择——可以并入到 4-酶鸡尾酒中并且在组合筛选中的预处理甘蔗渣上进行评价。
实施例16：本发明的β-葡糖苷酶的表征
【0835】这些研究的主要目标是：(1)鉴定用于4酶鸡尾酒的本发明的β-葡糖苷酶；和(2)鉴定几种可以用于组合分析的本发明的酶。
【0836】67种β-葡糖苷酶被部分表征。基于比活性、pH和温度特性，这些酶中的36种被选择，用于在4-步骤选择过程进行进一步的评价，所述4-步骤选择过程包括下列步骤：
(1)在pH 5和7，并且在T＝37-90℃，测定对纤维二糖和对荧光底物4-甲基伞形酮酰β-D-吡喃葡糖苷(4-MU-GP)的活性；
(2)表达评价；
(3)测定在T＝60-80℃，pH5的残余活性；
(4)测定产物抑制。在所有实验中，商业黑曲霉β-葡糖苷酶被用作基准，虽然直接的比较是困难的，原因在于可用的蛋白质制备物的质量具有显著差异(冻干的细菌裂解物对商业制剂中＞90％的纯蛋白质)。当纤维二糖被用作底物时，可以通过葡萄糖氧化酶分析测定酶活性。
方法/结果：
(1)在pH 5和pH 7和在温度37-90℃的β-葡糖苷酶活性
【0837】来自亚克隆发酵的半纯的冻干蛋白质制备物在50％甘油中重构，以获得25mg/ml的总蛋白质浓度。随后蛋白质制备物被稀释为0.5mg/mL并且用于反应，所述反应在10mM纤维二糖底物的存在下，在37、40、50、60、70、80和 90℃和在pH 5和pH 7，进行1小时(反应体积为50μl；底物和酶以1∶1的比例存在)。
【0837a】所测试的本发明的36种酶的大多数显示了pH 5最适。17种酶在≥50℃ 时具有活性，包括本发明的示例性酶SEQ ID NO：556、SEQ ID NO：540、SEQ ID NO：546、SEQ ID NO：566、SEQ ID NO：550、SEQ ID NO：530、SEQ ID NO：542、SEQ ID NO：554、SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：526、SEQ ID NO：560、 SEQ ID NO：592、SEQ ID NO：586、SEQ ID NO：588、SEQ ID NO：578和SEQ ID NO：558(表1)。这些酶中的14种在≥60℃时具有活性：SEQ ID NO：556、SEQ ID NO：540、SEQ ID NO：546、SEQ ID NO：566、SEQ ID NO：542、SEQ ID NO：554、SEQ ID NO：548、SEQ ID NO：564、SEQ ID NO：526、SEQ ID NO：560、SEQ ID NO：592、 SEQ ID NO：588、SEQ ID NO：578和SEQ ID NO：558。36种酶中的13种具有低活性或没有明显的活性。
(2)β-葡糖苷酶的表达和全面活性表征
【0838】等量的0.5mg/mL总蛋白质浓度的半纯冻干蛋白质制备物被加样到 SDS-PAGE上，以测定蛋白质表达和纯度。使用Invitrogen的4-12％NU-PAGETM 凝胶，并且电泳在2×MES缓冲液中以200V进行50min。处理凝胶并通过光密度分析法估算蛋白质浓度。对于全面活性测试，在pH5，将0.5mg/mL半纯冻干蛋白质制备物(细菌细胞裂解物)与10mM纤维二糖(T＝37℃和50℃)以及1mM 4-MU-GP(T＝37℃)温育30分钟。商业的黑曲霉β-葡糖苷酶(以0.4cg/mL加载) 被用作基准。由于这种制备物包含＞90％纯的蛋白质，酶加样被调节，以获得这样的荧光，所述荧光将保持在检测分析中的葡萄糖标准曲线的线性范围之内。测定酶活性并表示为μM释放的葡萄糖(纤维二糖底物)或表示为U/mL(4-MU-GP底物)。
【0839】在≥50℃具有活性的本发明的17种酶中的10种也以＞3％的纯度表达。这些酶显示了对纤维二糖和对4-MU-GP的活性范围。表达和活性结果被总结在表 1中：

表1：17种选择的β-葡糖苷酶的表达和活性
【0840】基于表1中总结的结果，下列8种酶被选择，用于表达优化和大规模蛋白质生产：SEQ ID NO：556、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、 SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：586和SEQ ID NO：558。
(3)在pH 5和T＝60-80℃于0-4h之后的残余活性
【0841】表1中列出的17种酶的半纯冻干制备物(细菌细胞裂解液)(0.25 mg/mL总蛋白)和商业的黑曲霉β-葡糖苷酶(1.0ug/mL的纯蛋白，基准)在60、 70和80℃，在pH 5温育0-4h(1mL反应体积，200rpm混合)。在每一小时取等分的样品，并且分析其对纤维二糖(10mM，1h反应时间，pH5，60℃)和对4-MU-GP (1mM，20min反应时间，pH5，RT)的残余酶活性。
【0842】结果被总结在表2和图1中。17种测试酶中的7种在≥60℃时保留残余活性(SEQ ID NO：556、SEQ ID NO：560、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、SEQ ID NO：564和SEQ ID NO：554)。这些酶中的6种在60℃4h后保持了90％的活性，而SEQ ID NO：554在60℃2h后保持了25％的活性。SEQ ID NO：556在80℃温育4h后保持90％的活性，并且优于商业基准(黑曲霉β-葡糖苷酶)。所述基准在60℃保留活性，但是在70℃1小时后，其保留20％以下的活性，并且在80℃1小时后，其没有活性。
  温度   在4h后大约90％的残余活性   60℃   SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：548、   SEQ ID NO：564、SEQ ID NO：560、SEQ ID NO：556   70℃   SEQ ID NO：560、SEQ ID NO：556   80℃   SEQ ID NO：556
表2：在60-80℃4h之后残余的β-葡糖苷酶活性
(4)在0-500mM葡萄糖存在下的产物抑制
【0843】将0、25、50、100、200、300、400和500mM葡萄糖加入包含5mM 纤维二糖和0.5mg/mL的总蛋白的半纯冻干酶制备物以及黑曲霉β-葡糖苷酶(0.025 mg/mL，基准)的消化反应(50μL总反应体积)并且在60℃，在pH 5温育1小时。通过加入等体积的50mM Na2CO3缓冲液pH10来终止反应。通过HPLC分析消化1h后留下的纤维二糖底物的量和存在于每一样品中的葡萄糖的量。
【0844】结果被总结在下面的表3中。被测试的本发明的13种酶中的3种： SEQ ID NO：566、SEQ ID NO：548和SEQ ID NO：564优于商业基准并且在≥300mM 葡萄糖存在下保持活性。SEQ ID NO：566和SEQ ID NO：564显示了最小的产物抑制并且在≥400mM葡萄糖存在下保持活性。在商业过程——在此过程中将假定巴西甘蔗渣(大约50％的纤维素含量)在10％固体和50％酶促转化时水解——中，大约 139mM葡萄糖(25g/L)将从1kg的起始原料中产生。列于表3中的本发明的8种酶(SEQ ID NO：556、SEQ ID NO：540、SEQ ID NO：566、SEQ ID NO：530、SEQ ID NO：542、SEQ ID NO：548、SEQ ID NO：564和SEQ ID NO：592)和Megazyme黑曲霉β-葡糖苷酶被期望在这些条件下保持活性。然而，在需要≥20％固体的过程中，商业的基准将被抑制，但是SEQ ID NO：566、SEQ ID NO：548和SEQ ID NO：564应该保持活性。
表3：
  酶   产物抑制(mM葡萄糖)   SEQ ID NO：556   200(在25开始)   SEQ ID NO：540   300(在50开始)   SEQ ID NO：546   25   SEQ ID NO：566   ＞400(在25开始)
  SEQ ID NO：550   NT   SEQ ID NO：530   200(在50开始)   SEQ ID NO：542   200(在25开始)   SEQ ID NO：554   100(在50开始)   SEQ ID NO：548   400(在100开始)   SEQ ID NO：564   500(在25开始)   SEQ ID NO：526   25   SEQ ID NO：560   SEQ ID NO：592   200(在25开始)   SEQ ID NO：586   SEQ ID NO：588   100(在25开始)   SEQ ID NO：578   NT   SEQ ID NO：558   50(在25开始)   Megazyme β-葡糖苷酶   300(在50开始)
表3.在葡萄糖存在下的产物抑制。NT，未检测
【0845】总结：应用本研究中描述的示例性4-步选择方法鉴定了本发明的几种 β-葡糖苷酶。本发明的这些酶可以用于组合筛选和用于酶鸡尾酒(混合物)，例如， 4-酶鸡尾酒。在这些研究中基于单个选择标准鉴定的本发明候选酶的示例性酶被列于下面表4中：
  选择标准   最好表现的酶   在37-90℃/pH5的活性   和表达   SEQ ID NO：556、SEQ ID NO：566、SEQ ID   NO：530、SEQ ID NO：554、SEQ ID NO：526、   SEQ ID NO：560、SEQ ID NO：586、SEQ ID   NO：588、SEQ ID NO：558   在60-80℃/pH5的残余   活性   SEQ ID NO：556、SEQ ID NO：566、SEQ ID   NO：530、SEQ ID NO：554、SEQ ID NO：548、   SEQ ID NO：564、SEQ ID NO：560   产物抑制的水平   SEQ ID NO：566、SEQ ID NO：548、SEQ ID   NO：564
表4：基于单个选择标准的表现最好的酶
实施例17：本发明的酶-偶联纤维素酶发现筛选
【0846】本实施例描述了本发明的示例性酶偶联纤维素酶发现筛选，在本具体的实施例中，其应用了本发明的示例性酶SEQ ID NO：580，β-葡糖苷酶。取决于纯化的成功程度，每毫克蛋白质的活性随制备物不同而不同。为了更好的标准化发现筛选，现在以U/mL描述具体批次的该酶的活性。本程序描述了如何进行。
单位定义
【0847】对于本实施例，所述单位定义指定：在室温(大约22℃)下，在pH 7.5，1单位的SEQ ID NO：580酶每分钟从MU-吡喃葡糖苷释放1.0μmol 4-甲基伞形酮。
方案
1.使用黑色96-孔板。设计定位所有样品，用于快速、同时加入样品，并且提供最短的动力学读数间隔。图20示出了三个样品制备物的安排实例，其中读数范围是B1-E12。
2.制备用于标准曲线的稀释液。在50mM磷酸钠缓冲液pH 7.5中稀释4-MU。制备300μL的下列每种稀释液：0、1、2、4、8和16μM。
3.制备酶样品的稀释液。对于每一种待测酶样品，制备连续的2-倍稀释液，典型地，以1/500(即，1/500、1/1000、1/2000、1/4000、1/8000和1/16000)开始。应用50mM磷酸钠缓冲液pH 7.5作为稀释剂，制备150μL的每种稀释液。
4.制备2×底物。通过在50mM磷酸钠缓冲液pH 7.5中稀释储存底物来制备2 mM MU-β-吡喃葡糖苷底物溶液。制备大约1mL的每种待测酶样品的这种溶液。将溶液放置到吸移盆中。
5.加载标准曲线。以100μL/孔，加载到黑色96孔板上，一式两份。
6.加载酶。以每孔50μL每种酶稀释液，加载酶，一式两份。
7.设置SPECTRAMAXTM。设置在室温下用Ex/Em在360/465nm进行动力学读数。选择以30秒钟间隔进行读数，总计达5分钟。设置对培养基的PMT敏感性。确保标准曲线样品被包括在动力学读数中，以使它们在相同的条件下读数。
8.加入底物并开始动力学读数。将板放置在SPECTRAMAXTM盘上，去盖。快速将50μL 2×底物溶液加入到含有酶样品的孔中。使用多通道吸移管，用于快速同时加入和混和样品。立即开始动力学读数；保存数据。确保通过软件以每分钟 mRFU计算Vmax。
【0848】参见图21，这是一个表，总结了本纤维素酶活性研究(从MU-吡喃葡糖苷释放4-甲基伞形酮)如“板2”的SPECTRAMAXTM数据。
计算
标准曲线
1.采用第一动力学读数以收集标准曲线数据(由于标准曲线正好是端点测量)。首先将μM值转换为μmol；例如，100μL的25μM＝0.0025μmol。对于在标准上的每个点，计算一式两份样品的平均值和标准差，然后从平均RFU值中减去背景值。
2.用减去背景值的平均值产生散射图，μmol 4-MU在x轴上而RFU在y轴上。
3.应用线性回归产生关于RFU对μmol 4-MU的线性函数(由于减去了背景值，使y截距为0)。注意：如果R-值为0.998以下，那么忽略在标准曲线上代表最高浓度的数据点。在MS EXCELTM中，用2个小数点来使线性函数为科学记数法的格式。
【0849】参见图22，这是一个表，总结了本纤维素酶活性研究(从MU-吡喃葡糖苷释放4-甲基伞形酮)的动力学活性数据。
酶活性
1.对于β-葡糖苷酶活性的每一测量，应用最适合标准曲线的灵敏度范围的稀释。在该稀释之内，只采用落入动力学的线性区域内的数据点以产生Vmax(Vmax 在SPECTRAMAXTM软件内自动计算(以mU/min))。计算每一对双份的平均数和标准差。然后将平均mU/min除以1000得到U/min。
2.使用线性函数，将该值转化为β-gluc活性的单位，为μmol/min(U/min除以斜率)，然后乘以稀释系数以转化成Vmax，为μmol/min。
3.取计算的单位并且乘以使用的稀释系数，然后除以加入到孔中的体积(0.05 mL)，得到以U/mL表示的活性。
4.下面示出了所有的计算结果如何被设置在EXCELTM中，应用SEQ ID NO：580作为实例，产生2,717,377的标准曲线斜率：

(#pts based on：依据的#pts；avg mRFU/min：平均mRFU/min；std dev：标准偏差； dilution：稀释；activity：活性；vol added：加入的体积)
·标准曲线和动力学应该在相同的读数中在SpectraMax上一起测量，以使标准品和样品之间的灵敏度相匹配。
·如果4-MU标准品根本不可信，从好的储存液中制备新鲜的稀释液。
·使用相同的缓冲液用于标准曲线和样品测量。4-MU的荧光高度依赖于 pH。
试剂
4-MU
【0850】4-甲基伞形酮(Sigma M1381，FW 176.2)：以DMSO制备50mM储存液并避光储存在-20℃。
MU-β-吡喃葡糖苷
【0851】4-甲基伞形酮酰β-D-吡喃葡糖苷(Sigma M3633，FW 338.3)：以DMSO 制备50mM的储存液。在-20℃避光储存分装溶液。
实施例18：CBM嵌合酶的构建
【0852】在一种实施方式中，本发明提供了包括第一结构域和至少第二结构域的嵌合(例如，多结构域重组的)蛋白质，所述第一结构域包含本发明的信号序列和/或糖结合结构域(CBM)。所述蛋白质可以是融合蛋白。第二结构域可以包括酶。所述蛋白质可以是非酶，例如，所述嵌合蛋白质可以包含本发明的信号序列和/或 CBM和结构蛋白质。本实施例描述了制备本发明的含CBM的多肽的示例性方案。
CBM交换文库(Swapping Library)的构建
【0853】应用GENEREASSEMBLYTM技术(Verenium Corporation，San Diego， CA)，使用6个CBHI催化结构域(见，下面表1)，30个源自真菌和细菌GHs的CBM (见下面表2)和从GH基因提取的6个天然连接体(见下面表3)，构建 GENEREASSEMBLYTM变体文库(1080个变体)。
【0854】代表CBH变体的DNA片段文库被克隆到黑曲霉表达载体中，所述载体包含：
a)标志基因，其给转化的黑曲霉宿主提供抗生素抗性，
b)与黑曲霉基因组具有同源性的DNA的两个区域，通过同源重组引导表达盒稳定整合到基因组中，其中之一也起转录终止子的作用，
c)驱动CBH表达的启动子，和
d)大肠杆菌复制子，其包含赋予大肠杆菌宿主抗生素抗性的标记基因。
【0855】用于筛选CBH变体(pDC-A1)的载体是载体pGBFin-5的重构体(描述在例如美国专利号7,220,542中)，其被重制以减少载体的总大小。pGBFin-5的 2.1kb 3’Gla区被减少到0.54kb，gpd启动子保持相同，但是2.24kb amdS序列被编码潮霉素磷酸转移酶的1.02kb hygB基因替换。2.0kb葡糖淀粉酶启动子gla被减少到代表原始序列3’端的1.15kb片段。pGBFin-5的2.3kb 3’Gla区也被减少到代表原始序列5’端的1.1kb片段。pDC-A1的大肠杆菌复制子取自pUC18。总的来说，原始12.5kb pGBFin-5表达载体(没有插入意图被表达的基因)被减小为7.2kb载体(没有插入物)。
【0856】在CBH变体ORF DNA库连接到载体上之后，所述连接混合物被用于化学转化感受态大肠杆菌Stb12。单个大肠杆菌转化体被挑选到96孔板中，并在 30℃，在每孔200μl LB和氨苄青霉素(100μg/ml)的液体培养基中生长过夜。然后，细胞被用于通过菌落PCR产生用于测序反应的模板。来自克隆文库的序列数据被分析，以鉴定独特的CBH变体。然后，含有选择的变体的大肠杆菌转化体被重新排列在96孔格式中，并且利用与3’和3”Gla区的末端杂交的引物，通过PCR 制备完整表达盒(除了大肠杆菌复制子之外的pDC-A1的内含物)的线性DNA。来自每一克隆的大约1μg PCR产物然后被用于以PEG-介导的转化方法转化96孔板的一个孔(即，每孔一个克隆)中的黑曲霉CBS153.88原生质体。在相同的96- 孔格式中的再生琼脂(每孔200μl的PDA加上340g/l的蔗糖和200μg/ml的潮霉素)上选择转化体。在30℃温育7天后，使用针(pintool)将转化体复制到含有 PDA和潮霉素(200μg/ml)的96孔板中。在30℃温育另外的7天后，来自每一孔的孢子被用于接种96孔板上每孔200μl的液体培养基。所述板在30℃温育7天，来自每孔的上清——含有分泌的CBH变体——被回收。
【0857】用于生长用包含变体的表达构建物转化的曲霉菌的培养基具有下列组成：NaNO3，3.0g/l；KCl，0.26g/l；KH2PO4，0.76g/l；4M KOH，0.56ml/l；D-葡萄糖， 5.0g/l；酪蛋白氨基酸，0.5g/l；微量元素溶液0.5ml/l；维生素溶液5ml/l；青霉素- 链霉素溶液(分别10,000U/ml和10,000μg/ml)5.0ml/l；麦芽糖，66.0g/l；大豆酮 (Soytone)，26.4g/l；(NH4)2SO4，6.6g/l；NaH2PO4.H2O，0.44g/l；MgSO4.7H2O，0.44g/l；精氨酸，0.44g/l；Tween-80，0.035ml/l；Pleuronic Acid消泡剂，0.0088ml/l；MES， 18.0g/l。100ml微量元素溶液具有下列组成：ZnSO4.7H2O，2.2g；H3BO3，1.1g； FeSO4.7H2O，0.5g；CoCl2.6H2O，0.17g；CuSO4.5H2O，0.16；MnCl2.4H2O，0.5g/l； NaMoO4.2H2O，0.15g/l；EDTA，5g/l。500ml维生素溶液具有下列组成：核黄素， 100mg；盐酸硫胺素，100mg；烟酰胺，100mg；盐酸吡哆醇，50mg；泛酸(Panthotenic Acid)，10mg；生物素，0.2mg。
初级分析筛选方案
【0858】碾磨的(60-目)甘蔗渣底物——称为pBG10C——在50mM醋酸盐缓冲液pH 5中被稀释为0.2％纤维素的终浓度。200μL/孔的这种溶液被加入到96孔 “底物”板中。在96孔“鸡尾酒”板中，制备10×酶鸡尾酒，包含本发明的示例性酶 SEQ ID NO：90(EG)、SEQ ID NO：358(CBHII)以及生长在黑曲霉中的CBH1CBM 上清。最终剂量是4mg EG/g纤维素、2mg CBHII/g纤维素和变量CBHI。为了启动反应，22μL的酶鸡尾酒被加入到200μL缓冲的底物中。在37℃进行该消化。从0至48小时选取时间点。通过将反应转移到384孔“停止”板(200mM碳酸钠缓冲液，pH10)中来选取时间点。接着在“停止”板上进行过夜β-葡糖苷酶消化，以将纤维二糖分解成葡萄糖。
【0859】然后进行葡萄糖氧化酶(GO)分析，以测量产生的总葡萄糖的量。如果CBM突变体显示出2倍于阴性对照(只有载体)的平均值的GO信号，那么认为CBM突变体具有活性。这产生了159个活性克隆。

实施例19：生物质的糖化作用
【0860】在一种实施方式中，本发明提供了具有木质纤维素活性的多肽，包括将可溶的寡聚体转化为可发酵的单体糖的酶，用于生物质的糖化作用。在一方面，本发明的多肽活性包括将可溶的纤维寡多糖和阿拉伯木聚糖寡聚体酶促水解(降解)成单体木糖、阿拉伯糖和葡萄糖。在一方面，本发明的示例性酶被用于纤维素或含纤维素组合物的糖化作用过程，所述纤维素或含纤维素组合物如植物生物质，例如甘蔗渣，玉米纤维或其它植物废料(如干草或秸秆，例如，例如水稻杆或小麦杆，或任何谷类植物的任何干杆)或加工或农业副产品。本实施例描述了本发明的示例性糖化作用过程。
糖化反应运行：
方法
【0861】250dw mg蒸汽破碎的(steam exploded)甘蔗渣被称重，放入10mL 玻璃压盖式瓶(crimp-top vial)(5％固体)中。一定体积的MES缓冲的基础培养基 (pH5.6)被加入到每一瓶中——这取决于酶加载量——获得5％固体的最终底物量。以每克固体10mg酶将酶鸡尾酒加入到甘蔗渣混合物中，每一种酶成分具有相同的量(1∶1∶1)。总反应体积是5mL(因此2.5mg总酶/rxn)。从反应中取出200 uL 0时间的样品并冷冻在-20℃。瓶被密封并夹紧，放置在摇动的37℃温育器中。在24、48和90小时取出200uL样品。样品被解冻，以13,200rpm离心5分钟，而上清被稀释10倍。通过HPLC依据已知的标准品，分析这些反应产物的糖组成。基于甘蔗渣底物中的理论纤维素值，计算转化。

96-孔板分析-甘蔗渣转化百分比
方法
【0862】以0.4％纤维素将蒸汽破碎的甘蔗渣重悬在MES缓冲的基础培养基(pH 5.6)中。200ul缓冲底物被加入到96孔板的每一孔中。在水中制备0.432mg酶/mL 的酶鸡尾酒，每一种酶成分的量相等。22.22ul的鸡尾酒被加入到底物中并通过吸管混合，用于12mg酶/g纤维素的最终加样。以4000rpm离心消化板1分钟并且将15ul上清转移到384孔板(“停止板”)中的45ul 200mM碳酸钠pH10中。密封消化板并且在37℃温育。在22和70小时取额外的时间点。
【0863】β-葡糖苷酶和GO分析步骤在实施例5中被充分描述。基于甘蔗渣底物中的理论纤维素值计算转化。

比率优化(D.O.E.)：
方法
【0864】以1％固体将蒸汽破碎的甘蔗渣重悬在MES缓冲的基础培养基(pH 5.6)中。160ul缓冲的底物连同2金属BB一起被加入到96孔板上的每一孔中。取决于期望的酶比率。用一定量的每一成分制备酶鸡尾酒。40ul的鸡尾酒被加入到底物中并且通过吸移管混合，获得25mg酶/g纤维素的最终加样。以4000rpm离心消化板1分钟，将20ul上清转移到384孔板(“停止板”)中的60ul 150mM碳酸钠pH10中。密封消化板并且在35℃温育，同时以250rpm摇动。在7、26和50 小时取额外的时间点。β-葡糖苷酶和GO分析步骤基本上如实施例5中描述进行。基于甘蔗渣底物中的理论纤维素值计算转化。

实施例20：用于生物质转化的酶“鸡尾酒”
【0865】在一种实施方式中，本发明提供了处理或“转化”生物质的酶“鸡尾酒” 或混合物(“鸡尾酒”意即包含至少一种本发明的酶的酶混合物)，例如，用于制造生物燃料如生物乙醇、生物丁醇、生物丙醇、生物柴油和类似物。本发明的酶“鸡尾酒”或混合物可以用于水解木质纤维素生物质的主要成分，或者包含纤维素和/或半纤维素(木质纤维素生物质也包含木质素)的任何成分，例如种子、谷物、块茎、植物废物(如干草或秸秆，例如水稻杆和小麦杆，或或任何谷类植物的任何干杆)、或者食品加工或工业加工的副产品(例如，茎)、玉米(包括玉米穗轴、秸秆和类似物)、草(例如，印度草，如蓝刚草(Sorghastrum nutans)；或柳枝稷(switch grass)，例如，稷(Panicum)种如柳枝稷(Panicum virgatum))、木材(包括木片、加工废料如木材废物)、纸、纸浆、再生纸(例如报纸)；也包括单子叶植物或双子叶植物、或单子叶玉米、甘蔗或其部分(例如甘蔗稍)、水稻、小麦、大麦、柳枝稷或芒属植物；或双子叶油籽作物、大豆、油菜、油菜籽、亚麻、棉花、棕榈油、甜菜、花生、树、白杨或羽扇豆。
【0866】本发明的酶“鸡尾酒”或混合物可以包括酶的任何组合，所述酶例如阿魏酸酯酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、木糖苷酶、木聚糖酶、内切葡聚糖酶和β-葡聚糖酶等，其中在可选的实施方式中，“鸡尾酒”或混合物的至少一种，或几种或所有酶是本发明的一种酶或多种酶。
【0867】例如，图23示出了可以用于本发明的酶“鸡尾酒”或混合物的本发明的三种酶(示例性SEQ ID NO：664、SEQ ID NO：630、SEQ ID NO：628)的小麦阿拉伯木聚糖消化产物(消化图谱(profile))的数据；这三种酶是最初源自不同的 Cochliobolus的木聚糖酶。每一种酶被用于消化小麦阿拉伯木聚糖，得到的产物通过毛细管电泳进行分析。
【0868】图24是数据的图解图，示出了本发明的阿拉伯呋喃糖苷酶(示例性 SEQ ID NO：686、SEQ ID NO：682、SEQ ID NO：660、SEQ ID NO：662)如何与本发明的木聚糖酶协同作用而消化小麦阿拉伯木聚糖；并且该图也说明了本发明的示例性“鸡尾酒”或混合物。本发明的示例性阿拉伯呋喃糖苷酶被用于与或不与木聚糖酶，例如多肽SEQ ID NO：719一起消化小麦阿拉伯木聚糖。用还原糖BCA分析来测量底物消化的量。
【0869】图25是数据的图解图，示出了本发明的β-木糖苷酶SEQ ID NO：550、 SEQ ID NO：700、SEQ ID NO：698、SEQ ID NO：622、SEQ ID NO：672、SEQ ID NO：626、SEQ ID NO：632、SEQ ID NO：636、SEQ ID NO：656和SEQ ID NO：696(如图中所示)在小麦阿拉伯木聚糖消化中对示例性SEQ ID NO：719木聚糖酶的促进作用。用单独的β-木糖苷酶与木聚糖酶SEQ ID NO：719联合消化小麦阿拉伯木聚糖； BCA分析被用于量化产生的还原糖。显示了相对于单独SEQ ID NO：719木聚糖酶的％增加。
【0870】图26是数据的图解图，示出了利用本发明的示例性酶、以玉米种子纤维作为底物的阿魏酸酯酶(FAE)的活性。用阿魏酸酯酶(FAE))SEQ ID NO：640 与或不与木聚糖酶SEQ ID NO：719一起消化玉米种子纤维，通过HPLC测量得到的阿魏酸产物。FAE SEQ ID NO：640和木聚糖酶SEQ ID NO：719的混合物是本发明的示例性混合物。
【0871】图27是数据的图解图，示出了利用本发明的示例性乙酰木聚糖酯酶 SEQ ID NO：640、SEQ ID NO：650和SEQ ID NO：688、以乙酰化的木聚糖作为底物的活性分析。释放自乙酰化木聚糖的醋酸盐被用于证明乙酰木聚糖酯酶活性。图示出了在pH 5，24小时温育对500μg乙酰化木聚糖反应的酯酶活性。
【0872】图28是数据的图解图，示出了利用本发明的示例性乙酰木聚糖酯酶 SEQ ID NO：648、SEQ ID NO：654和SEQ ID NO：680、以糖醛酸(aldo-uronic acid) 混合物作为底物的α-葡糖醛酸糖苷酶活性分析。LC-MS被用于检测葡糖醛酸释放以显示α-葡糖醛酸糖苷酶对糖醛酸(aldo-uronic acid)混合物的活性。
【0873】已经描述了本发明的一些方面。然而将会理解可以进行各种修改而不背离本发明的精神和范围。因此，其它方面在所附的权利要求的范围之内。

标题	发布/更新时间	阅读量
一种具有降血压功能的复合酵素及其制备方法	2020-05-14	623
一种人胎盘组织液注射剂及其制备方法	2020-05-11	86
一种预防呼吸道感染的复合酵素及其制备方法	2020-05-13	623
包含单糖烷基单缩醛或单糖烷基单醚的异构体混合物的抗菌组合物	2020-05-16	420
有机稻生产技术	2020-06-07	163
包含己糖醇酐长链烷基缩醛或己糖醇酐长链烷基醚的抗菌组合物	2020-05-17	259
可被生物机体吸收的止血生物制品/生物材料的病毒去除/灭活方法	2020-05-20	117
一种新型CpGISS疫苗佐剂的制备方法与应用	2020-05-17	618
新穎的雷曼氏乳桿菌菌株（ＬＡＣＴＯＢＡＣＩＬＬＵＳ　ＲＨＡＭＮＯＳＵＳ）與其用於抑制黃嘌呤氧化酶及治療痛風之代謝產物	2020-05-18	394
減少生物膜的方法	2020-05-19	105

用于处理木质纤维素的酶、编码它们的核酸及其制备和应用方法

参考通过EFS-WEB提交的序列表

背景技术

附图说明

该功能需要专业版企业版VIP权限，您可以：