不溶性目标蛋白质的分离 |
|||||||
申请号 | CN201180017588.6 | 申请日 | 2011-03-30 | 公开(公告)号 | CN102844326B | 公开(公告)日 | 2017-09-29 |
申请人 | 安西尔克公司; | 发明人 | 马丁·施密特; 阿克塞尔·莱默尔; 林·勒默尔; | ||||
摘要 | 本 发明 涉及从完整或 破碎 的宿主细胞的悬液中分离不溶性目标 蛋白质 的方法。本发明还涉及可通过所述方法获得的不溶性目标蛋白质,尤其是丝蛋白。 | ||||||
权利要求 | 1.从完整或破碎宿主细胞悬液中纯化不溶性目标丝蛋白的方法,其包括以下步骤: |
||||||
说明书全文 | 不溶性目标蛋白质的分离背景技术[0003] 例如,参考利用色谱技术(如离子交换色谱或尺寸排阻色谱)纯化和分离可溶性目标蛋白质的标准蛋白质纯化方法(Guide to Protein Purification,Academic Press Vol.182,1990)。目前使用的其他技术为液-液相分离和超滤等(Guide to Protein Purification,Academic Press Vol.182,1990)。通过进行一些变化,可以改变这些基本的纯化方法以纯化科学或工业目的所需的大多数蛋白质,但是,它们一般成本非常高、复杂且 耗时。 [0004] 特别地,在Huemmerich等,Biochemistry 2004,43,13604-13612中描述了专门处理丝蛋白的方法。该文献中的技术在目标蛋白质沉淀步骤之后进行利用宿主细胞蛋白质的 热变性的技术,但是缺少色谱纯化方法,该技术被成功用于纯化技术应用的重组蛛丝蛋白。 因为丝蛋白质倾向于自聚集,所以该方法会造成相当大部分目标蛋白质的损失,目标蛋白 质沉淀并因此难以用可溶性蛋白质的纯化方法获得。 [0005] 尽管所述方法很好地用于大多数可溶性蛋白质,但是显然的是当处理有聚集倾向的蛋白质时有严重不足。这些有聚集倾向的蛋白质在溶液中经过一段时间后倾向于沉淀, 产生稳定的、通常不溶的蛋白质聚集物。这些蛋白质聚集物不可以再利用所述可溶性蛋白 质级分纯化方法进行分离。因此,发酵时间和/或纯化时间一般为避免不期望沉淀的关键参 数。已知可以利用数种去污剂来溶解所述蛋白质聚集物,但是,还已知这样的溶解对蛋白质 产量和蛋白质质量有不利影响。此外,经过延长的时间来完全溶解蛋白质聚集物几乎不可 能。 [0006] 因此,需要开发有聚集倾向的目标蛋白质和/或已聚集的目标蛋白质的纯化/分离方法,其主要从包含不溶性宿主细胞蛋白质和其他残留物的级分中分离有聚集倾向的目标 蛋白质级分和/或聚集的目标蛋白质级分,而不完全溶解所述目标蛋白质。这种纯化方法应 该允许从宿主细胞(如微生物细胞)和/或其他细胞残留物的悬液中以高产量和高质量分离 不溶性目标蛋白质。这种纯化方法还应当经济、快速、简单和可重现。 [0007] 本发明人出乎意料地发现目标蛋白质是不溶的,并且在溶解全部或几乎全部其他不溶性宿主蛋白质、宿主细胞残留物和/或其他潜在发酵相关杂质所必需的特定条件下依 然不溶,并且发现这使得能够通过很少的纯化步骤来分离和纯化这些目标蛋白质,而不会 因为所述目标蛋白质的不期望溶解或其他交叉反应而使所述目标蛋白质的量显著损失。 [0008] 出乎意料地,通过根据本发明的方法将不溶性目标蛋白质与溶解的不溶性宿主细胞部分分离,可以实现纯度优选为至少80%的不溶性目标蛋白质的纯化。甚至当一些不溶 性宿主细胞部分不完全溶解而残留在悬液中时,依然可以实现有效分离,这是因为这些悬 浮的宿主细胞部分的比重低于不溶性目标蛋白质的比重,使得允许通过离心、沉降和/或过 滤来有效分离。 [0009] 相比于已知的纯化技术,本发明的方法提供了若干显著优点。例如,本发明方法减少了复杂的纯化步骤数,因此是快速、可靠并且易于进行的纯化方法。此外,所述方法允许 以高产量和质量纯化/分离不溶性目标蛋白质。相比于常规方法,所述方法能够显著降低成 本。此外,所述方法很环保。 [0010] 尽管本发明方法仅包括几个方法步骤,但是迄今为止没有完全预见到的是,一些目标蛋白质不溶并且在所用条件下保持不溶。尤其是考虑到在洗涤和清洁与蛋白质和细胞 接触之生物反应器和反应罐时通常采用的碱浓度(~0.1M NaOH)的背景下。因此很难不证 自明这些条件也可以用于大规模纯化不溶性目标蛋白质。 [0011] 发明概述 [0012] 在第一方面中,本发明提供了从完整或破碎的宿主细胞的悬液中分离不溶性目标蛋白质的方法,其包括以下步骤: [0013] a)提供包含不溶性目标蛋白质和不溶性宿主细胞部分的完整或破碎的宿主细胞的悬液, [0014] b)向所述悬液中加入至少一种碱的水溶液,其量足以破碎所述宿主细胞和/或溶解所述不溶性宿主细胞部分,以及 [0015] c)使不溶性目标蛋白质与溶解的不溶性宿主细胞部分分离, [0016] 其中在步骤b)中,目标蛋白质保持不溶,并且其中至少80%的不溶性宿主细胞部分溶解。 [0017] 在第二方面中,本发明涉及可通过第一方面的方法获得的不溶性目标蛋白质。 [0018] 本发明的该概述不一定描述本发明的全部特征。 [0019] 发明详述 [0020] 在详细描述本发明之前,应当理解本发明并不局限于本文所述的具体方法、方案和试剂,因为这些可以不同。还应当理解本文所用术语的目的仅为描述具体实施方案,而不 是意在限制本发明的范围,该范围仅由所附权利要求限制。除非本文另外定义,否则本文所 使用的所有技术和科学术语的意思与本领域普通技术人员通常理解的意思相同。 [0021] 优选地,本文所用术语的定义如“A multilingual glossary of biotechnological terms:(IUPAC Recommendations)”,Leuenberger,H.G.W,Nagel,B.和H.编辑(1995),Helvetica Chimica Acta,CH-4010Basel,Switzerland)所足义。 [0022] 在本说明书全文中引用了几篇文献。无论是上文还是下文,本文所引用的每一篇文献(包括全部的专利、专利申请、科学出版物、制造商说明书、使用说明书、GenBank登录号序列提交等)均通过引用整体并入本文。不应将本文中的任何内容解释为承认本发明不享 有借助在先发明早于这些公开内容的权利。 [0023] 接下来将描述本发明的要素。这些要素用具体实施方案列举,但是应当理解这些要素可以以任何方式和任何数量组合,从而产生另外的实施方案。多种描述的实施例和优 选实施方案不应当被理解为将本发明仅限制为具体描述的实施方案。应当将本说明书理解 为支持和涵盖组合了明确描述的实施方案以及任意数量之公开和/或优选要素的实施方 案。此外,除非上下文另外指出,否则应认为本申请描述的所有要素的任意排列和组合是本 申请说明书所公开的。 [0024] 在本说明书及权利要求全文中,除非上下文另外指出,否则应当将词“包括”及其变化形式“包含”和“含有”理解为包括所述整数或步骤或者整数或步骤的组,但不排除任何其他整数或步骤或者整数或步骤的组。 [0025] 除非本文另外明确表明,在本说明书及所附权利要求中不使用数量词时包括复数的指示对象。 [0026] 如果残基占据了两个或更多个多肽结构中的类似位点,那么就说多肽中的这些残基彼此“对应”。本领域公知两个或更多个多肽中的类似位点可以通过基于氨基酸序列或结 构相似性的多肽序列比对来确定。这些比对工具对本领域技术人员来说是熟知的,并且可 以例如,获自万维网,如ClustalW(www.ebi.ac.uk/clustalw)或利用标准设定(优选Align EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5)的Align(http:// www.ebi.ac.uk/emboss/align/index.html)。 [0027] 在第一方面中,本发明提供了从完整或破碎的宿主细胞的悬液中分离不溶性目标蛋白质的方法,其包括以下步骤: [0028] a)提供包含不溶性目标蛋白质和不溶性宿主细胞部分的完整或破碎的宿主细胞的悬液, [0029] b)向所述悬液中加入至少一种碱的水溶液,其量足以破碎所述宿主细胞和/或溶解所述不溶性宿主细胞部分,以及 [0030] c)使不溶性目标蛋白质与溶解的不溶性宿主细胞部分分离, [0031] 其中在步骤b)中,目标蛋白质保持不溶,并且其中至少80%、优选至少85%、更优选至少90%、最优选至少95%或甚至100%的不溶性宿主细胞部分被溶解。 [0032] 例如,本发明提供了从破碎的宿主细胞的悬液中分离不溶性目标蛋白质的方法,其包括以下步骤: [0033] a)提供包含不溶性目标蛋白质和不溶性宿主细胞部分的破碎的宿主细胞的悬液, [0034] b)向所述悬液中加入至少一种碱的水溶液,其量足以溶解所述不溶性宿主细胞部分,以及 [0035] c)使不溶性目标蛋白质与溶解的不溶性宿主细胞部分分离, [0036] 其中在步骤b)中,目标蛋白质保持不溶,并且其中至少80%、优选至少85%、更优选至少90%、最优选至少95%或甚至100%的不溶性宿主细胞部分被溶解。 [0037] 此外,例如,本发明提供了从完整宿主细胞的悬液中分离不溶性目标蛋白质的方法,其包括以下步骤: [0038] a)提供包含不溶性目标蛋白质和不溶性宿主细胞部分的完整宿主细胞的悬液, [0039] b)向所述悬液中加入至少一种碱的水溶液,其量足以使所述宿主细胞破碎并且溶解所述不溶性宿主细胞部分,以及 [0040] c)使不溶性目标蛋白质与溶解的不溶性宿主细胞部分分离, [0041] 其中在步骤b)中,目标蛋白质保持不溶,并且其中至少80%、优选至少85%、更优选至少90%、最优选至少95%或甚至100%的不溶性宿主细胞部分被溶解。 [0042] 本发明人出乎意料地发现:存在于完整或破碎之宿主细胞的悬液中的不溶性目标蛋白质(例如蛛丝蛋白)在使完整的宿主细胞破碎和/或使全部或几乎全部的其他不溶性宿 主细胞部分(例如不溶性宿主细胞蛋白质、宿主细胞壁、宿主细胞残留物或其他可能的发酵 相关杂质(例如,发酵残留物)溶解所需的条件下保持不溶,因此可以仅通过几个纯化步骤 就简单地从所述悬液中分离和纯化所述不溶性目标蛋白质(如蛛丝蛋白),而无显著量的蛋 白质损失。 [0043] 详细地,本发明人出乎意料地发现:可以通过向完整或破碎的宿主细胞的悬液中加入含有至少一种低浓度(例如,0.05M NaOH)碱(例如,NaOH)的水溶液来实现不溶性目标 蛋白质与不溶性宿主细胞部分的分离。本发明人发现含有至少一种碱的水溶液使宿主细胞 破碎和/或使不溶性宿主细胞蛋白质和剩余的细胞碎片溶解,而不影响不溶性目标蛋白质。 [0044] 本发明人进一步确定在该步骤之后,为了纯化感兴趣的不溶性目标蛋白质,仅需要使包含不溶性目标蛋白质的固相与包含溶解的不溶性宿主细胞部分的液相分离(例如通 过离心和/或过滤),和任选地洗涤目标蛋白质沉淀。所得的经纯化的不溶性目标蛋白质可 以直接用于科学或工业应用,而不需要进一步处理。 [0045] 本发明人出乎意料的确定:利用本发明的方法,可以分离纯度至少为80%,优选至少85%或90%,更优选至少95%、98%或99%,最优选至少99.9%或甚至100%(例如至少 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%、99.9%或100%)的不溶性目标蛋白质。大部分利用本发明方法分离的不溶性目标蛋白质不需要进一步纯化步骤。因此,本发明的方法是非常节省成本 且有效的纯化方法。 [0046] 本文所用术语“宿主细胞”是指含有感兴趣的目标蛋白质(例如,丝蛋白如蛛丝蛋白或其变体)的细胞。所述目标蛋白质(例如,丝蛋白如蛛丝蛋白或其变体)可以由多核苷酸 编码,优选由分离的多核苷酸编码。所述多核苷酸可以以下形式存在于宿主细胞中:(i)本 身游离地分散,(ii)整合入重组载体中,或(iii)整合在宿主细胞基因组或线粒体DNA中。宿 主细胞可以用于扩增和表达编码感兴趣的目标蛋白质(如丝蛋白如蛛丝蛋白或其变体)的 多核苷酸。 [0047] 本文所用术语“分离的多核苷酸”是指(i)分离自其自然环境,(ii)通过聚合酶链式反应扩增,和/或(iii)全部或部分合成的多核苷酸,并且是指脱氧核糖核苷酸或核糖核 苷酸碱基的单链或双链聚合体,并且包括DNA和RNA分子,有义链和反义链二者。该术语包括 cDNA、基因组DNA、mRNA和重组DNA。多核苷酸可以由整个基因或其一部分组成。 [0048] 在本发明的一个优选实施方案中,上述多核苷酸为编码感兴趣的目标蛋白质的重组多核苷酸。术语“重组多核苷酸”是指在体外合成或以其他方式操作的多核苷酸。由所述 重组多核苷酸编码的目标蛋白质可以称为重组目标蛋白质。含有所述重组多核苷酸和/或 所述重组目标蛋白质的宿主细胞可以称为重组宿主细胞。 [0049] 本文所用术语“重组载体”包括本领域技术人员已知的任何载体,包括质粒载体、黏粒载体、噬菌体载体如λ噬菌体、病毒载体如腺病毒载体或杆状病毒载体,或人工染色体 载体如细菌人工染色体(BAC)、酵母人工染色体(YAC)或P1人工染色体(PAC)。所述载体包括 表达载体和克隆载体。表达载体包括质粒载体和病毒载体,并且一般含有期望的编码序列 和在特定宿主生物(例如,细菌、酵母或植物)或在体外表达系统中表达有效连接的编码序 列所需的合适的DNA序列。克隆载体一般用于某些期望的DNA片段的改造和扩增,并且可缺 少表达期望的DNA片段所需要的功能性序列。 [0050] 在本发明的一个优选实施方案中,编码感兴趣的目标蛋白质的多核苷酸包含在表达载体中且与表达控制序列有效连接以调节其在宿主细胞中的表达,或者包含在克隆载体 中以使其在宿主细胞中扩增。包含编码感兴趣之目标蛋白质的多核苷酸的克隆载体或表达 载体通常通过转化或转染引入宿主细胞。 [0051] 在本发明的一个优选实施方案中,宿主细胞为微生物宿主细胞如细菌或酵母宿主细胞,植物宿主细胞或昆虫宿主细胞。 [0052] 在本发明的上下文中,本文所用术语“微生物宿主细胞”是指微生物来源的细胞,例如细菌细胞如革兰氏阴性或革兰氏阳性细菌细胞如埃希氏菌(Escherichia)(例如,大肠 埃希氏菌(Escherichia coli))、鱼腥藻(Anabaena)、柄细菌(Caulobacter)、葡糖杆菌 (Gluconobacter)、红细菌(Rhodobacter)、假单胞菌(Pseudomonas)、副球菌(Para coccus)、芽孢杆菌(Bacillus)(例如,枯草芽孢杆菌(Bacillus subtilis))、短杆菌 (Brevibacterium)、棒状杆菌(Corynebacterium)、根瘤菌(Rhizobium)(中华根瘤菌 (Sinorhizobium))、黄杆菌(Flavobacterium)、克雷伯氏菌(Klebsiella)、肠杆菌 (Ehterobacter)、乳杆菌(Lactobacillus)、乳球菌(Lactococcus)、甲基营养菌 (Methylobacterium)、丙酸杆菌(Propionibacterium)、葡萄球菌(Staphylococcus)或链霉 菌(Streptomyces)细胞,或酵母细胞如产子囊孢子酵母(ascosporogenous)(内孢霉目 (Endomycetales))细胞、basidiosporogenous细胞,或属于不完全菌纲(Fungi Imperfecti)(芽孢纲(Blastomycetes))的细胞,例如假丝酵母(Candida)、汉逊酵母 (Hansenula)、克鲁维酵母菌(Kluyveromyces)、酵母属(Saccharomyces)(例如,酿酒酵母 (Saccharomyces cerevisiae)、裂殖酵母(Schizosaccharomyces)、毕赤酵母(Pichia)(例 如,甲醇毕赤酵母(Pichia pastoris)或亚罗酵母(Yarrowia)细胞。 [0053] 在本发明的上下文中,术语“昆虫宿主细胞”是指昆虫来源的细胞,例如草地贪夜蛾(Spodoptera frugiperda)或粉纹夜蛾(Trichoplusia ni)细胞。优选地,昆虫细胞为SF9 细胞、SF-21细胞或High-Five细胞。SF-9和SF-21为来自草地贪夜蛾的卵巢细胞。High-Five 细胞为来自粉纹夜蛾的卵细胞。 [0055] 本文所用术语“完整或破碎的宿主细胞的悬液“是指含有完整或破碎的宿主细胞的异质流体。所述流体(其中悬浮有完整或破碎的细胞)可以是发酵培养基、培养基、水溶液 如缓冲的水溶液、工艺用水或去离子H2O。缓冲的水溶液可以是例如Tris/HCl。缓冲的水溶 液的pH可以为pH 5.0至pH 9.0,优选pH 6.0至pH 8.0,更优选pH 6.7至pH 7.2,例如Tris/ HCl,pH 7.0、pH 7.5或pH 8.0。优选地,缓冲水溶液为10至100mM的Tris/HCl溶液,更优选10至50mM的Tris/HCl溶液,最优选10至20mM的Tris/HCl溶液,例如10、15、20、25、30、35、40、 45、50、55、60、65、70、75、80、85、90、95或100mM的Tris/HCl溶液,其中所述缓冲的水溶液优选pH为5.0至9.0,更优选pH为6.0至8.0,最优选pH为6.7至7.2,例如Tris/HCl,pH 7.0、pH 7.5或pH 8.0。培养基可以是基本培养基或盐培养基(例如见Korz等Journal of Biotechnology 39,1995,59-65)。悬液中流体与完整或破碎之宿主细胞的比例可以不同, 例如5%至95%。因此,术语“完整或破碎的宿主细胞的悬液”涵盖这样的悬液,其中流体与完整或破碎之宿主细胞的比例可以为5%比95%、10%比90%、15%比85%、20%比80%、 25%比75%、30%比70%、35%比65%、40%比60%、45%比55%、50%比50%、55%比45%、 60%比40%、65%比35%、70%比30%、75%比25%、80%比20%、85%比15%、90%比10%、或95%比5%。 [0056] 在本发明的上下文中,术语“完整宿主细胞的悬液”涵盖悬浮在流体如水溶液(例如,缓冲水溶液)、工艺用水、去离子水、培养基或发酵培养基中的完整、一般未溶解的宿主细胞如微生物宿主细胞、植物宿主细胞或昆虫宿主细胞。本文所使用的术语“破碎宿主细胞 的悬液”涵盖具有破碎的细胞壁或大部分裂解的宿主细胞如微生物宿主细胞、植物宿主细 胞或昆虫宿主细胞,并且其悬浮在流体如水溶液(例如,缓冲水溶液)、工艺用水、去离子水、培养基或发酵培养基中。“破碎宿主细胞的悬液”可以通过以下方法及其组合来制备:(i)非机械细胞破碎(例如,利用酶裂解细胞,利用化学试剂处理细胞以借助渗透压溶解/部分溶 解或打开/部分打开细胞壁和/或细胞膜或者破碎细胞),(ii)机械细胞破碎(例如,机械研 磨或球磨机提取),(iii)高压均匀化,或(iv)超声处理。 [0057] 在本发明的一个优选实施方案中,由步骤a)所提供的完整宿主细胞(例如,微生物宿主细胞如细菌宿主细胞)存在水分含量为5%至20%,优选为5%、10%、15%或20%(例如 为5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或 20%)的悬液中,即在优选通过如离心或过滤将所述细胞与培养基分离后的细胞沉积物中。 在本发明的另一优选实施方案中,破碎的宿主细胞(例如,微生物细胞如细菌细胞)存在于 水分含量为5%至20%,优选为5%、10%、15%或20%(例如为5%、6%、7%、8%、9%、10%、 11%、12%、13%、14%、15%、16%、17%、18%、19%或20%)的悬液中,即在优选通过如离心或过滤将所述破碎的(例如裂解的或超声破碎的)细胞与培养基分离后的细胞沉积物中。 [0058] 应当注意在由步骤a)所提供的完整或破碎宿主细胞的悬液中,可溶性宿主细胞部分(例如,细胞器、可溶性宿主细胞蛋白质或可溶性宿主细胞残余)和/或其他可溶性成分 (如可溶性的发酵相关杂质、发酵培养基的可溶性部分或培养基的可溶性部分)的量可能不 同。例如,与(i)在培养基或发酵培养基中的完整宿主细胞悬液或(ii)在培养基或发酵培养 基中的破碎宿主细胞的悬液中的可溶性宿主细胞部分和/或其他可溶性成分的量相比,以 下两种情况下可溶性宿主细胞部分和/或其他可溶性成分的量较低:(i)在通过离心或过滤 来将完整的或破碎的宿主细胞与培养基或发酵培养基分离所产生,水分含量为5%至10% 的完整或破碎的宿主细胞的细胞沉淀中,或者(ii)在水溶液中,其中所述细胞沉淀被重悬。 悬液中也可能不存在可溶性宿主细胞部分和/或其他可溶性成分,例如水溶液,尤其是在破 碎的宿主细胞的细胞沉淀被清洗并且重悬在水溶液中的情况下,所述水溶液随后在步骤a) 提供。 [0059] “宿主细胞(如微生物、植物、或昆虫宿主细胞)的悬液”可以通过在培养基或发酵培养基中培养宿主细胞(如微生物、植物、或昆虫宿主细胞)来提供或/产生。可以在有效培 养宿主细胞(如微生物、植物、或昆虫宿主细胞)的生物反应器中进行目标蛋白质的生产。可 以使用三种相交的发酵策略:(i)连续发酵,(ii)分批发酵,(iii)分批补料发酵。也可以将 这些发酵策略进行组合。为了获得所期望的目标蛋白质的最大产量,即,提供高生物量,可 需要向宿主细胞(如微生物、植物、或昆虫宿主细胞)供应足够的营养并且将该处理过程与 连续监测相结合,并且使用相关的处理参数(例如,溶解氧、pH和温度)。可以使用目标蛋白 质表达诱导系统(例如,异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导,利用糖或其类似物来 诱导,利用温度依赖的启动子的温度诱导,利用受渗透压控制的启动子的诱导,或由细胞内 的代谢变化开始的诱导)。很多参数可能影响目标蛋白质的产生以及蛋白质品质。特别为了 增加不溶性目标蛋白质产量,可以使用较长的诱导期、改变诱导温度、优化营养供应和/或 不同类型的细胞压力。也可通过小心地控制环境(例如培养基成分、发酵过程中的温度、发 酵过程的持续时间)来影响在细胞培养和纯化处理的过程中产生的目标蛋白质聚集物的 量,以及通过使用合适策略来使聚集物的程度最大化。 [0060] “宿主细胞(如微生物、植物、或昆虫宿主细胞)的悬液”也可以通过将所培养的宿主细胞(如微生物、植物、或昆虫宿主细胞)重悬在水溶液如缓冲水溶液、工艺用水或去离子 水中来提供或/产生,所述培养的宿主细胞(如微生物、植物、或昆虫宿主细胞)已经通过如 离心或过滤与培养基分离。植物细胞的悬液也可以通过使植物细胞悬浮在水溶液如缓冲水 溶液、工艺用水或去离子水中来提供,所述植物细胞获自全植物,例如通过从所述植物中提 取所述植物细胞或通过全植物破碎。 [0061] 在可以通过本发明方法的步骤a)来提供完整宿主细胞悬液的情况下,可以直接使用上述宿主细胞悬液之一。在可以通过本发明方法的步骤a)来提供破碎宿主细胞悬液的情 况下,可以首先破碎包含在上述悬液之一中的(完整)宿主细胞,例如使用非机械细胞破碎 方法或机械细胞破碎方法(见以上)。 [0062] 在本发明的上下文中,术语“含有不溶性目标蛋白质和不溶性宿主细胞部分的破碎宿主细胞的悬液”是指一种悬液,例如培养基、缓冲水溶液、工艺用水或去离子水,其直接包含来自破碎的宿主细胞的不溶性目标蛋白质和不溶性宿主细胞部分(例如,不溶性细胞 壁部分,或不溶性细胞碎片)。与之相比,本文所使用的术语“含有不溶性目标蛋白质和不溶性宿主细胞部分的完整宿主细胞的悬液”是指含有完整宿主细胞的悬液,例如培养基、水溶 液(例如,缓冲水溶液)、工艺用水或去离子水,其中包含不溶性目标蛋白质和不溶性宿主细 胞部分(例如,不溶性细胞壁部分,或不溶性细胞碎片)。 [0063] 本文所使用的术语“不溶性宿主细胞部分”是指不溶性宿主细胞蛋白质、细胞壁、细胞膜、细胞壁部分、细胞膜部分、细胞骨架部分、宿主细胞碎片和/或不溶性细胞质内含物(例如,草酸钙或二氧化硅晶体)、能量储存物质如淀粉、糖原或聚羟基丁酸酯),它们是宿主细胞(如微生物、植物、或昆虫宿主细胞)或者用于表达目标蛋白质的表达系统的部分。该术 语不涵盖本发明的不溶性目标蛋白质。术语“不溶性宿主细胞部分”还指在步骤a)的条件下 不溶而在步骤b)的条件下溶解的宿主细胞的部分。 [0064] 本文所使用的术语“可溶性宿主细胞部分”是指可溶性宿主细胞蛋白质、细胞器、细胞器部分和/或其他可溶性成分,它们是宿主细胞(如微生物、植物、或昆虫宿主细胞)或 者用于表达目标蛋白质的表达系统的部分。术语“可溶性宿主细胞部分”还指在步骤a)的条 件下已经溶解并且在步骤b)的条件下保持溶解的宿主细胞部分。 [0065] 在本发明上下文中使用的术语“目标蛋白质”是指目的蛋白,例如,丝蛋白如蛛丝蛋白或昆虫丝蛋白、胶原蛋白、节肢弹性蛋白或角蛋白,其可以分离自宿主细胞(如微生物、植物、或昆虫宿主细胞)的悬液。在一个优选实施方案中,所述目标蛋白质为重组目标蛋白 质,更优选为由重组多核苷酸所编码的重组目标蛋白质。在另一实施方案中,重组目标蛋白 质为蛛丝蛋白和昆虫丝蛋白质、蛛丝蛋白和胶原蛋白、蛛丝蛋白和节肢弹性蛋白、或蛛丝蛋 白和角蛋白的杂种蛋白质。特别优选地,所述目标蛋白质在所述宿主细胞中重组产生。 [0066] 在一个优选实施方案中,目标蛋白质为包含重复单元/结构域的蛋白质,其具有在宿主细胞中或在悬液如在培养基中、在水溶液(例如,缓冲水溶液)中、在工艺用水中或在去 离子水中形成目标蛋白质聚集物的性质。 [0067] 在另一优选实施方案中,在宿主细胞中,或在悬液中如在细胞培养基中、在水溶液中(例如,缓冲水溶液)、在工艺用水中或在去离子水中,目标蛋白质的存在形式为目标蛋白 质聚集物。这些目标蛋白质聚集物可以通过宿主细胞中的目标蛋白质的自聚集形成,而不 影响细胞支架或其他细胞内机制。 [0068] 优选地,目标蛋白质聚集物可以通过使目标蛋白质的多拷贝/单元自聚集成体或固体块而形成,而不影响细胞支架或其他细胞内机制。目标蛋白质聚集物还可以通过目标 蛋白质在悬液如在细胞培养基中、在水溶液中(例如,缓冲水溶液)、在工艺用水中或在去离 子水中自聚集而形成。目标蛋白质可以通过若干机制形成,所述机制可以包括目标蛋白质 分子之间的共价或非共价相互作用。 [0069] 优选地,目标蛋白质聚集物包含至少85%,更优选至少90%,最优选至少95%或者甚至100%,例如85、86、87、88、89、90、91、92、93、94、95、96、97、98、99%或100%的相同目标蛋白质,其通过所述目标蛋白质的多拷贝聚集形成。出乎意料的是所述目标蛋白质聚集物 不仅是目标蛋白质在非特异性聚集物中的共同定位,还包括至少85%,或者甚至100%的相 同目标蛋白质,表明目标蛋白质易于自聚集。 [0070] 本文所使用的术语“不溶性目标蛋白质”或术语“不溶性目标蛋白质聚集物”是指这样的目标蛋白质或目标蛋白质聚集物,其在悬液如细胞培养基、发酵培养基、水溶液(例 如,缓冲水溶液如pH 7.5的Tris/HCl)、工艺用水或去离子水中不溶,因此其可以与存在于 所述溶液中的可溶性宿主细胞部分通过如离心或过滤来分离。此外,本文所使用的术语“不 溶性目标蛋白质”或术语“不溶性目标蛋白质聚集物”是指这样的目标蛋白质或目标蛋白质 聚集物,当向悬液如细胞培养基、发酵培养基、水溶液(例如,缓冲水溶液如pH 7.5的Tris/ HCl)、工艺用水或去离子水中加入含有碱的水溶液(例如,0.05M的NaOH)后,所述蛋白质或 蛋白质聚集物在所述溶液中依然不溶,而其他在悬液如细胞培养基、发酵培养基、水溶液 (例如,缓冲水溶液如pH 7.5的Tris/HCl)、工艺用水或去离子水中不溶的宿主细胞成分,在 向所述悬液加入含有碱的水溶液后变得可溶,因此,可以通过例如离心和/或过滤将存在于 所述悬液中的不溶性目标蛋白质或不溶性蛋白质聚集物与溶解的不溶性宿主细胞部分分 离。 [0071] 优选地,不溶性目标蛋白质或不溶性目标蛋白质聚集物在缓冲水溶液中不溶,所述缓冲水溶液为10至100mM Tris/HCl,更优选为10至50mMTris/HCl,最优选为10至20mM Tris/HCl,例如10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100mM Tris/HCl,其中所述缓冲水溶液的优选pH为5.0至9.0,更优选的pH为6.0至8.0,最优选的pH 为6.7至7.2,例如pH 7.0、pH 7.5或pH 8.0的Tris/HCl。 [0072] 例如,如果在本发明方法的步骤a)中提供完整宿主细胞如微生物、植物或昆虫宿主细胞的悬液,那么在步骤b)中加入含有至少一种碱的水溶液,加入量为使所述宿主细胞 破碎成不溶性宿主细胞部分,并且进一步使所述不溶性宿主细胞部分溶解至以下程度的足 够/需要量,所述程度为使至少80%,优选至少90%,更优选至少95%或甚至100%,例如至 少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%、99.9%或100%的所述不溶性宿主细胞部分溶解。此外,例如,如果在本发明方法的步骤a)中提供破碎宿主细胞如微生物、植物或昆虫宿主细胞的悬液, 即含有来自破碎细胞的不溶性宿主细胞部分的悬液,那么在步骤b)中加入含有至少一种碱 的水溶液,加入量为使所述不溶性宿主细胞部分溶解至以下程度的足够/需要量,所述程度 为使至少80%,优选至少90%,更优选至少95%或甚至100%,例如至少80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99.9%或100%的所述不溶性宿主细胞部分溶解。 [0073] 本领域技术人员可以轻易获得含有碱的水溶液破碎宿主细胞如微生物、植物或昆虫宿主细胞的足够/需要量,和/或使至少80%,优选至少90%,更优选至少95%或甚至 100%的所述不溶性宿主细胞部分溶解的足够/需要量,例如,通过(i)所选择碱如NaOH的系 列稀释;(ii)向完整或破碎宿主细胞的悬液中加入若干浓度的所选择碱(例如,NaOH)(例 如,NaOH的终浓度为0.01M NaOH、0.02M NaOH、0.03M NaOH、0.04M NaOH、0.05M NaOH、0.06M NaOH、0.07M NaOH、0.08M NaOH、0.09M NaOH、0.1M NaOH、0.2M NaOH、0.3M NaOH、0.4M NaOH、0.5M NaOH、0.6M NaOH、0.7M NaOH、0.8M NaOH、0.9M NaOH或1M NaOH)。(iii)通过例如离心或过滤使不溶性目标蛋白质与完全或部分溶解的不溶性宿主细胞部分分离,(iv)估 算已分离的不溶性目标蛋白质部分中(例如离心产物或滞留物中)的不溶性宿主细胞部分, 以及(v)确定碱的足够/或所需量,以便使至少80%,优选至少90%,更优选至少95%或甚至 100%的不溶性宿主细胞部分溶解。 [0074] 本文所使用的术语“保持不溶的目标蛋白质”是指这样的目标蛋白质,它们在悬液中如在水溶液(例如,缓冲水溶液)中、在培养基中、在发酵培养基中、在工艺用水中或在去 离子水中不溶;并且经过例如特定的一段时间和/或在特定的温度下,它们在含有碱的所述 悬液中如所述水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,保持例如至少80%、优选至少90%、更优选至少95%或甚至100%不溶,例如至少80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、99.9%或100%不溶,因此,允许通过例如过滤或离心分开和分离所述目标蛋白质。 [0075] 在本发明的一个优选实施方案中,目标蛋白质在悬液中如在水溶液(例如,缓冲水溶液)中、在培养基中、在发酵培养基中、在工艺用水中或在去离子水中不溶;并且经过至少 5分钟,优选至少10分钟,更优选至少90分钟,最优选至少180分钟的一段时间,例如经过至 少5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、110、120、 130、140、150、160、170或180的一段时间后,它们在含有碱的所述悬液中如所述水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水中或去离子水中,保持例如至少80%、优选至少90%、更优选至少95%或甚至100%不溶,例如至少80、81、82、83、84、85、86、87、88、89、 90、91、92、93、94、95、96、97、98、99、99.9%或100%不溶。 [0076] 在本发明的另一优选实施方案中,目标蛋白质在悬液中如在水溶液(例如,缓冲水溶液)中、在培养基中、在发酵培养基中、在工艺用水中或在去离子水中不溶;并且经过至少 5至180分钟,优选至少10至90分钟的一段时间,例如经过5、6、7、8、9、10、15、20、25、30、35、 40、45、50、55、60、65、70、75、80、85、90、100、110、120、130、140、150、160、170或180分钟,和/或在4至60℃下,例如在4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55或60℃下,它们在含有碱的所述悬液中如所述水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子 水中,保持例如至少80%、优选至少90%、更优选至少95%或甚至100%不溶,例如至少80、 81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、99.9或100%不溶。 [0077] 在本发明的一个更优选实施方案中,目标蛋白质在悬液中如在水溶液(例如,缓冲水溶液)中、在培养基中、在发酵培养基中、在工艺用水中或在去离子水中不溶,并且在含有碱的所述溶液如所述水溶液、培养基、发酵培养基、工艺用水或去离子水中,在15℃、20℃、 25℃、30℃、35℃或40℃经过10分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃经过 20分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃经过30分钟的一段时间,在15℃、 20℃、25℃、30℃、35℃或40℃经过40分钟的一段时间在水溶液中,在15℃、20℃、25℃、30℃、35℃或40℃经过一段50分钟的时间,在15℃、20℃、25℃、30℃、35℃或40℃经过60分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃经过90分钟的一段时间,其至少90%,优选至少95%保持不溶。 [0078] 在本发明的一个最优选实施方案中,目标蛋白质在悬液中如在水溶液(例如,缓冲水溶液)中、在培养基中、在发酵培养基中、在工艺用水中或在去离子水中不溶;并且经过至少5至180分钟,优选至少10至90分钟的一段时间,例如经过5、6、7、8、9、10、15、20、25、30、 35、40、45、50、55、60、65、70、75、80、85、90、100、110、120、130、140、150、160、170或180分钟,和/或在4至60℃的温度下,例如在4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55或60℃下,其在含有碱的所述悬液如所述水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或 去离子水中,至少80%、优选至少90%、更优选至少95%或甚至100%保持不溶,例如至少 80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、99.9或100%保持不溶,所述碱为金属的氢氧化物和/或氨,例如氢氧化钠(NaOH)、氢氧化钾(KOH)和/或氢氧化 钙(CaOH),其终浓度为0.005M至1M,优选为0.01M至0.6M,更优选为0.02M至0.2M、0.05M至 0.15M或0.04M至0.1M,最优选为0.04M至0.06M。 [0079] 特别优选地,在步骤b)中加入含有至少一种碱的水溶液后,在15℃至25℃经过10至40分钟的一段时间,至少90%,优选至少95%或甚至100%,例如至少90、91、92、93、94、 95、96、97、98、99、99.99%或100%的目标蛋白质保持不溶。更加特别优选地,在步骤b)中加入含有至少一种碱的水溶液后,在20℃至25℃经过20至30分钟的一段时间,至少90%,优选 至少95%或甚至100%,例如至少90、91、92、93、94、95、96、97、98、99、99.99%或100%的目标蛋白质保持不溶。 [0080] 在本发明的另一优选实施方案中,可以利用滤器如孔径为0.1uM或0.22μM的滤器和/或通过离心如在3000至8000×g进行20至30分钟,来将保持不溶的目标蛋白质(如蛛丝 蛋白)与溶解的不溶性宿主细胞部分分开/分离。 [0081] 在另一优选实施方案中,目标蛋白质以目标蛋白质聚集物(例如,丝蛋白聚集物如蛛丝蛋白聚集物)的形式保持不溶。因此,术语“保持不溶的目标蛋白质聚集物”是指在含有碱的悬液中例如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经过如某一段时间和/或在特定的温度下,不可逆或者有0.1、1、2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19或20%以上不可逆的目标蛋白质聚集物形成,因此允许通过如过滤和/或离心分开并分离所述目标蛋白质聚集物。 [0082] 术语“保持不溶的目标蛋白质聚集物”还指这样的目标蛋白质聚集物:在含有碱的悬液中例如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经过例如某一段时间和/或在特定的温度下,其例如至少80%,优选至少90%,更优选至少95% 或甚至100%,例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、 99、99.9%或100%保持不溶的目标蛋白质聚集物,因此,允许通过如过滤和/或离心分开并 分离所述目标蛋白质聚集物。 [0083] 在本发明的一个更优选实施方案中,在含有碱如金属氢氧化物和/或氨的悬液如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经过5至180分 钟,优选10至90分钟,例如经过5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、 75、80、85、90、100、110、120、130、140、150、160、170或180分钟的一段时间;和/或在4至60℃,例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、39、40、45、50、55或60℃的温度下,目标蛋白质聚集物形成不可逆或者有0.1、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%以上不可逆。 [0084] 在本发明的另一实施方案中,在含有碱如金属氢氧化物和/或氨的悬液如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经过5至180分钟,优选 10至90分钟,例如经过5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、 90、100、110、120、130、140、150、160、170或180分钟的一段时间;和/或在4至60℃,例如4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、45、50、55或60℃的温度下,至少80%,优选至少90%,更优选至少95%或甚至100%,例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、 97、98、99、99.9%或100%的目标蛋白质聚集物保持不溶。 [0085] 在本发明一个特别优选实施方案中,在含有碱如金属氢氧化物和/或氨的悬液如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过10分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过20分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过30分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过40分钟的一段时间在水溶液 中,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过50分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过60分钟的一段时间,在15℃、20℃、25℃、30℃、35℃或40℃的温度经过90分钟的一段时间,10%以上的目标蛋白质聚集物形成不可逆。 [0086] 在本发明的另一优选实施方案中,在含有碱的悬液如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经过5至180分钟,优选10至90分钟,例如经过 5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、110、120、130、 140、150、160、170或180分钟的一段时间,和/或在4至60℃,例如4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、45、50、55或60℃的温度下,至少80%,优选至少90%,更优选至少95%或甚至 100%,例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、 99.9%或100%的目标蛋白质聚集物保持不溶。所述碱为金属氢氧化物和/或氨,例如氢氧 化钠(NaOH)、氢氧化钾(KOH)和/或氢氧化钙(CaOH),其终浓度为0.005M至1M,优选为0.01M 至0.6M,更优选为0.02M至0.2M、0.05M至0.15M或0.04M至0.1M,最优选为0.04M至0.06M。 [0087] 在一个更优选实施方案中,目标蛋白质为具有重复结构域/重复单元(例如,丝蛋白如蛛丝蛋白)并且具有形成蛋白质聚集物的性质的目标蛋白质。一旦蛋白质聚集物形成, 所述蛋白质聚集物优选在悬液如水溶液(例如,缓冲水溶液)、培养基、发酵培养基、工艺用 水或去离子水中不溶,并且在含有碱(如金属氢氧化物和/或氨)的所述悬液如所述水溶液 (例如,缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经过5至180分钟,优选 10至90分钟,例如经过5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、 90、100、110、120、130、140、150、160、170或180分钟的一段时间,和/或在4至60℃,例如4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、45、50、55或60℃的温度下,至少80%,优选至少90%,更优选至少95%或甚至100%,例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、 97、98、99、99.9%或100%保持不溶。 [0088] 保持不溶的目标蛋白质聚集物,例如,蛛丝蛋白聚集物,其作为利用如肉眼、光学显微镜或电子显微镜观察的离散颗粒是可见的,和/或可以利用滤器(如孔径为0.1μM或 0.22μM的滤器)从溶解的不溶性宿主细胞部分中去除/分离。 [0089] 优选地,不溶性目标蛋白质形成蛋白质聚集物包括至少85%,更优选至少90%,最优选至少98%或甚至100%,例如至少85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、 99.9%或100%的所述目标蛋白质。在本发明上下文中使用的术语“包含至少85%,更优选 至少90%,最优选至少98%或甚至100%的相同目标蛋白质的目标蛋白质聚集物”,是指由 多拷贝/单元的相同目标蛋白质聚集形成的目标蛋白质聚集物,并且该聚集物包含至少 85%,更有优选至少90%,最有优选至少98%或甚至100%的所述目标蛋白质。 [0090] 优选地,本发明方法的步骤b)的进行时间为使目标蛋白质保持不溶的一段时间。 [0091] 更优选地,本发明方法的步骤b)进行5至180分钟,优选10至90分钟,最优选10至40分钟的一段时间,例如进行5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、 80、85、90、100、110、120、130、140、150、160、170或180分钟。例如,为了在例如20℃至25℃的温度下溶解来自完整细菌宿主细胞的培养基的不溶性宿主细胞部分,本发明方法的步骤b) 进行30至180分钟的一段时间。 [0092] 优选地,利用本发明方法分离/分开的不溶性目标蛋白质或不溶性目标蛋白质聚集物的纯度为至少50%或60%,更优选为至少70%或80%,最优选为至少90%、95%或甚至 100%,例如为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、 70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99、99.9%或100%。 [0093] 优选地,纯度为至少50%或60%,更优选至少为70%或80%,最优选为至少90%、95%或甚至100%,例如为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、99.9%或100%的分离的不溶性目标蛋白质或目标蛋白质聚集物,是指其至少有50%或60%,更优选至少有70%或80%,最优选至少有90%、95%或甚至 100%,例如至少有50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、 70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99、99.9%或100%不含(i)不溶性宿主细胞部分(例如,不溶性宿主细胞蛋白质、细胞壁部分、细胞膜部分、细胞骨架部分、宿主细胞碎片和/或细胞质内含物)和/或可溶性宿主细胞部分(例如,可溶性宿主细胞蛋白质、细胞器部分和/或细胞成分);更优选的不 含(i)不溶性宿主细胞部分(例如,不溶性宿主细胞蛋白质、细胞壁部分、细胞膜部分、细胞 骨架部分、宿主细胞碎片和/或细胞质内含物)和/或可溶性宿主细胞部分(例如,可溶性宿 主细胞蛋白质、细胞器部分和/或细胞成分)以及(ii)可溶性和/或不溶性悬液残余(例如, 发酵/培养相关的杂质如矿物质和/或微量元素)。 [0094] 此外,纯度为至少50%或60%,更优选至少为70%或80%,最优选为至少90%、95%或甚至100%,例如为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、99.9%或100%的分离的不溶性目标蛋白质或目标蛋白质聚集物,是指其至少有50%或60%,更优选至少有70%或80%,最优选至少有90%、95%或甚至 100%,例如至少有50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、 70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99、99.9%或100%不含(i)不溶性和/或可溶性宿主细胞蛋白质;最优选不含(i)不溶性和/或可溶性宿主细胞蛋白质和(ii)不溶性细胞壁部分、细胞膜部分、细胞骨架 部分、宿主细胞碎片、细胞质内含物、细胞器的可溶性部分和/或可溶性细胞成分;甚至最优选不含(i)不溶性和/或可溶性宿主细胞蛋白质,(ii)不溶性细胞壁部分、细胞膜部分、细胞 骨架部分、宿主细胞碎片、细胞质内含物、细胞器的可溶性部分和/或可溶性细胞成分,和 (iii)不溶性和/或可溶性悬液残余(例如,发酵/培养相关的杂质如矿物质和/或微量元 素)。 [0095] 或者,纯度为至少50%或60%,更优选至少为70%或80%,最优选为至少90%、95%或甚至100%,例如为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、99.9%或100%的分离的不溶性目标蛋白质或目标蛋白质聚集物,是指其包含不多于50%或40%、更优选不多于30%或20%,最优选不多于10%、5%或 0%,例如50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、 27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1%或 0%的(i)不溶性宿主细胞部分(例如,不溶性宿主细胞蛋白质、细胞壁部分、细胞膜部分、细胞骨架部分、宿主细胞碎片和/或细胞质内含物)和/或可溶性宿主细胞部分(例如,可溶性 宿主细胞蛋白质、细胞器部分和/或细胞成分);更优选(i)不溶性宿主细胞部分(例如,不溶 性宿主细胞蛋白质、细胞壁部分、细胞膜部分、细胞骨架部分、宿主细胞碎片和/或细胞质内含物)和/或可溶性宿主细胞部分(例如,可溶性宿主细胞蛋白质、细胞器部分和/或细胞成 分)以及(ii)可溶性和/或不溶性悬液残余(例如,发酵/培养相关的杂质如矿物质和/或微 量元素)。 [0096] 此外,纯度为至少50%或60%,更优选至少为70%或80%,最优选为至少90%、95%或甚至100%,例如为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、99.9%或100%的分离的不溶性目标蛋白质或目标蛋白质聚集物,更优选是指其包含不多于50%或40%、更优选不多于30%或20%,最优选不多于10%、 5%或0%,例如50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、 29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、 1%或0%的(i)不溶性和/或可溶性宿主细胞蛋白质;最优选(i)不溶性和/或可溶性宿主细 胞蛋白质和(ii)不溶性细胞壁部分、细胞部分、细胞骨架部分、宿主细胞碎片、细胞质内含 物、细胞器的可溶性部分和/或可溶性细胞成分;甚至最优选(i)不溶性和/或可溶性宿主细 胞蛋白质,(ii)不溶性细胞壁部分、细胞膜部分、细胞骨架部分、宿主细胞碎片、细胞质内含物、细胞器的可溶性部分和/或可溶性细胞成分,和(iii)不溶性和/或可溶性悬液残余(例 如,发酵/培养相关的杂质如矿物质和/或微量元素)。 [0097] 技术人员知道如何确定利用本发明方法分离的不溶性目标蛋白质或目标蛋白质聚集物的纯度的技术。 [0098] 分离的不溶性目标蛋白质或目标蛋白质聚集物的纯度优选利用以下方法进行测量:(i)光谱测定法,优选质谱分析法(MS),(ii)色谱分析法,优选液相色谱法(LC),更优选高效液相色谱法(HPLC),(iii)凝胶电泳,优选SDS凝胶电泳,(iv)Western印迹/免疫印迹, 或(v)其组合。 [0099] 优选地,色谱分析法,优选液相色谱法(LC),更优选高效液相色谱法(HPLC)与光谱测定法,优选质谱分析法(MS)结合。因此,所分离的不溶性目标蛋白质或目标蛋白质聚集物 的纯度优选利用液相色谱-质谱(LC-MS)方法进行测定,更优选利用高效液相色谱-质谱 (HPLC-MS)方法进行测定。 [0100] 优选地,利用本发明方法分离的不溶性目标蛋白质或目标蛋白质聚集物的纯度以干重为基础进行计算,例如,表示为干重基础的%(wt/wt)。 [0101] 特别优选地,相对于(i)不溶性和/或可溶性宿主细胞部分,更优选相对于(i)不溶性和/或可溶性宿主细胞部分和(ii)不溶性和/或可溶性悬液残余,对分离的不溶性目标蛋 白质或目标蛋白质聚集物的干重进行计算(见上文)。 [0102] 进一步特别优选地,相对于(i)不溶性和/或可溶性宿主细胞蛋白质,更优选地相对于(i)不溶性和/或可溶性宿主细胞蛋白质和(ii)不溶性细胞壁部分、细胞膜部分、细胞 骨架部分、宿主细胞碎片、细胞质内含物、细胞器的可溶性部分和/或可溶性细胞成分,最优选地相对于(i)不溶性和/或可溶性宿主细胞蛋白质,(ii)不溶性细胞壁部分、细胞膜部分、 细胞骨架部分、宿主细胞碎片、细胞质内含物、细胞器的可溶性部分和/或可溶性细胞成分,以及(iii)可溶性和/或不溶性悬液残余(例如,发酵/培养相关的杂质如矿物质和/或微量 元素),对分离的不溶性目标蛋白质或目标蛋白质聚集物的干重进行计算。 [0103] 优选地,步骤b)中含有碱的水溶液的pH为7至14,更优选为9至13,最优选为10至12。例如,步骤b)中含有碱的水溶液的pH为7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、 12.5、13、13.5或14。 [0104] 在本发明的一个优选实施方案中,碱为金属氢氧化物或氨。在本发明的另一个优选实施方案中,使用金属氢氧化物和氨。优选地,金属氢氧化物选自氢氧化钠(NaOH)、氢氧 化钾(KOH)、氢氧化钙(CaOH)或其组合。最优选地,碱是氢氧化钠(NaOH)。 [0105] 优选地,步骤b)中碱的终浓度为0.005M至1M,优选为0.01M至0.6M,更优选为0.02M至0.2M、0.05M至0.15M或0.04M至0.1M,最优选为0.04M至0.06M。例如,本发明方法的步骤b)中碱的终浓度为0.005M、0.01M、0.015M、0.02M、0.025M、0.03M、0.035M、0.04M、0.045M、 0.05M、0.055M、0.06M、0.065M、0.07M、0.075M、0.08M、0.085M、0.09M、0.095M、0.1M、0.15M、 0.2M、0.25M、0.3M、0.35M、0.4M、0.45M、0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、 0.9M、0.95M或1M。 [0106] 在本发明方法的优选实施方案中,步骤b)中氢氧化钠(NaOH)、氢氧化钾(KOH)和/或氢氧化钙(CaOH)的终浓度为0.005M至1M,优选为0.01M至0.6M,更优选为0.02M至0.2M、 0.05M至0.15M或0.04M至0.1M,最优选为0.04M至0.06M。例如,本发明方法的优选实施方案 的步骤b)中氢氧化钠(NaOH)、氢氧化钾(KOH)和/或氢氧化钙(CaOH)的终浓度为0.005M、 0.01M、0.015M、0.02M、0.025M、0.03M、0.035M、0.04M、0.045M、0.05M、0.055M、0.06M、 0.065M、0.07M、0.075M、0.08M、0.085M、0.09M、0.095M、0.1M、0.15M、0.2M、0.25M、0.3M、 0.35M、0.4M、0.45M、0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、0.9M、0.95M或1M。 [0107] 在一些本发明方法的更优选实施方案中,在步骤b)中的碱是氢氧化钠(NaOH)并且在步骤b)中氢氧化钠(NaOH)的终浓度为0.005M至1M,优选地为0.01M至0.6M,更优选地为 0.02M至0.2M、0.05M至0.15M或0.04M至0.1M,和最优选地为0.04M至0.06M。例如,在本发明 方法的优选实施方案的步骤b)中氢氧化钠(NaOH)的终浓度为0.005M、0.01M、0.015M、 0.02M、0.025M、0.03M、0.035M、0.04M、0.045M、0.05M、0.055M、0.06M、0.065M、0.07M、 0.075M、0.08M、0.085M、0.09M、0.095M、0.1M、0.15M、0.2M、0.25M、0.3M、0.35M、0.4M、0.45M、 0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、0.9M、0.95M或1M。 [0108] 优选地,完整或破碎宿主细胞的悬液(例如细胞培养基、发酵培养基、水溶液(例如缓冲水溶液)或水分含量为5至20%的悬液,例如5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19或20%的悬液,即细胞沉淀物)与含有碱的水溶液的比例为3∶1至1∶20,更优选地为1∶ 1至1∶10以及最优选地为1∶2至1∶4,例如3∶1、2∶1、1∶1、1∶2、1∶3、1∶4、1∶5、1∶6、1∶7、1∶8、1∶ 9、1∶10、1∶11、1∶12、1∶13、1∶14、1∶15、1∶16、1∶17、1∶18、1∶19、1∶20。 [0109] 尤其优选的是,本发明的步骤b)使用包含作为碱的氢氧化钠(NaOH)的水溶液随一定时间在一定温度下进行,所述氢氧化钠(NaOH)的终浓度为0.05M至0.15M,优选为0.05M; 所述时间为10至30分钟,优选为20至30分钟;所述温度为20至25℃,优选为20℃。 [0110] 优选地,为了改善分离的不溶性目标蛋白质的产量、纯度和/或进一步的加工性,所述方法还包括添加至少一种试剂(i)在步骤b)之前,(ii)在步骤b)中和/或(iii)在步骤 b)之后,例如,步骤b)之前、步骤b)中、步骤b)之后、步骤b)之前和步骤b)中、步骤b)之前和步骤b)之后、步骤b)中和步骤b)之后或者步骤b)之前、步骤b)中和步骤b)之后。 [0111] 优选地,所述试剂选自变性剂、kosmotropic剂和去污剂或其组合。 [0112] 因此,在本发明的一个优选实施方案中,(i)在步骤b)之前,(ii)在步骤b)中和/或(iii)在步骤b)之后添加变性剂、kosmotropic剂和/或去污剂。 [0113] 所述变性剂加强不溶性宿主细胞部分的溶解,然而所述去污剂帮助溶解宿主细胞(如微生物宿主细胞、植物宿主细胞或昆虫宿主细胞)的细胞壁和/或细胞膜。另外,所述 kosmotropic剂帮助稳定目标蛋白质聚集物。 [0114] 因而,优选地,在步骤b)之前,在步骤b)中和/或在步骤b)之后将去污剂添加至完整宿主细胞(例如细菌或植物宿主细胞)的悬液,该去污剂帮助溶解细胞壁和/或细胞膜,优 选地与进一步加强剩余的不溶性宿主细胞部分的溶解的变性剂组合。因此,还优选地,在步 骤b)之前,在步骤b)中和/或在步骤b)之后将变性剂添加至已经破碎宿主细胞(例如细菌或 植物宿主细胞)的悬液,该变性剂加强剩余的不溶性宿主细胞部分的溶解,优选地与稳定不 溶性目标蛋白质聚集物的kosmotropic剂组合。 [0115] 本发明人出人意料地发现,在步骤b)之前,在步骤b)中和/或在步骤b)之后添加变性剂、kosmotropic剂和/或去污剂可将分离的不溶性目标蛋白质的纯度提高到约多至5至 20%,例如多至5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%;将分离的不溶性目标蛋白质的产率提高到多至5至20%,例如多至5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%。例如,分离步骤c)之后,没有在步骤b)之前,在步骤b)中和/或在步骤b)之后添加变性剂、kosmotropic剂和/或去污剂,分离的不溶性目标蛋白质的纯度为80、81、82、83、84、 85、86、87、88、89、90、91、92、93、94或95%;在步骤b)之前,在步骤b)中和/或在步骤b)之后添加了变性剂、kosmotropic剂和/或去污剂,其纯度可为85、86、87、88、89、90、91、92、93、 94、95、96、97、98、99或100%。 [0116] 优选地,(i)变性剂是尿素(CH4N2O)或盐酸胍(CH5N3HCl),(ii)kosmotropic剂是磷酸盐或硫酸盐,或者(iii)去污剂是Tween20、Tween 60、1ween 80、TritonX-15、Triton X- 45、Triton X-100、Triton X-102、,TritonX-114、Triton X-151、TritonX-165、Triton X- 200、Triton X-207、TritonX-301、Triton X-305、Triton X-405、Triton X-705、SDS或 Brij。本领域技术人员能够选择更合适的变性剂、kosmotropic剂或去污剂。 [0117] 优选地,磷酸盐是磷酸铵、磷酸钾或磷酸钠。磷酸盐可降低目标蛋白质或目标蛋白质聚集物在完整或破碎宿主细胞的悬液中(例如在水溶液、发酵培养基、培养基、工艺用水 或去离子水中)的溶解度。优选地,硫酸盐是硫酸铵。 [0118] 优选地,尿素的终浓度为0.1M至10M,优选为1M至5M和更优选为4M至5M。例如,尿素的终浓度为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、 6、6.5、7、7.5、8、8.5、9、9.5或10M。还优选地,盐酸胍的终浓度为0.01M至3M,优选为0.1M至 2M。例如,盐酸胍的终浓度为0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、 0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.1、2.2、 2.3、2.4、2.5、2.6、2.7、2.8、2.9或3M。 [0119] 在本发明的一个优选实施方案中,目标蛋白质或目标蛋白质聚集物在包含氢氧化钠(NaOH)(例如终浓度为0.005M至0.5M)和盐酸胍(CH5N3HCl)(例如终浓度为0.01M至3M)或 尿素(例如终浓度为0.1M至10M)的水溶液中在20℃至25℃的温度下经过20分钟至40分钟, 至少85%、优选至少90%和更有选95%或甚至100%保持不溶。 [0120] 在本发明的另一个优选实施方案中,目标蛋白质(例如蛛丝蛋白如蛛丝蛋白C16)或目标蛋白质在包含氢氧化钠(NaOH)(例如终浓度为0.005M至0.2M)和盐酸胍(CH5N3HCl) (例如终浓度为0.1M至2M)或尿素(例如终浓度为1M至5M)的水溶液中在20℃至25℃的温度 下经过20分钟至40分钟,至少85%、优选为至少90%和更有选为95%或甚至100%保持不 溶。 [0121] 在本发明的又一个优选实施方案中,目标蛋白质(例如蛛丝蛋白如蛛丝蛋白C16)或目标蛋白质聚集物在包含浓度为0.5M氢氧化钠(NaOH)的含水培养基在20℃至25℃的温 度下经过30分钟,至少85%、优选为至少90%和更有选为95%或甚至100%保持不溶。 [0122] 优选地,在步骤c)中不溶性目标蛋白质或不溶性目标蛋白质聚集物与溶解的不溶性宿主细胞部分的分离通过离心实现。离心步骤使得包含不溶性目标蛋白质或不溶性目标 蛋白质聚集物的固相与包含溶解的不溶性宿主细胞部分(例如宿主细胞蛋白质、宿主细胞 碎片)和任选地溶解的不溶性残留物(例如发酵残留物)、可溶性宿主细胞部分和/或其他可 溶性杂质的液相(例如水溶液(例如水缓冲溶液)、培养基、发酵培养基、工艺用水或去离子 水)分离。离心步骤之后,可溶性目标蛋白质或可溶性目标蛋白质聚集物作为沉淀出现,而 上清液包含溶解的不溶性宿主细胞部分和任选地溶解的不溶性残留物(例如发酵残留物)、 可溶性宿主细胞部分和/或其他可溶性杂质并且可丢弃。因而,对技术人员而言应清楚的 是,在这个分离步骤期间,将不溶性目标蛋白质与溶解的不溶性细胞部分和任选地与存在 于或仍然存在于液相(例如水溶液或培养基)的可溶性宿主细胞部分分离。 [0123] 还优选地,在步骤c)中不溶性目标蛋白质或不溶性目标蛋白质聚集物与溶解的不溶性宿主细胞部分的分离通过过滤实现。在这个分离的方法中,通过使液相通过过滤膜来 浓缩不溶性目标蛋白质,所述液相(例如水溶液(例如水缓冲溶液)、培养基、发酵培养基、工艺用水或去离子水)包含不溶性目标蛋白质、溶解的不溶性宿主细胞部分和任选地溶解的 不溶性残留物(例如发酵残留物)、可溶性宿主细胞部分和/或其他可溶性杂质,所述过滤膜 截留不溶性目标蛋白质并且让溶解的不溶性宿主细胞部分和任选地溶解的不溶性残留物 (例如发酵残留物)、可溶性宿主细胞部分和/或其他可溶性杂质通过。因而,对技术人员而 言应清楚的是,在这个分离步骤期间,通过过滤膜将不溶性目标蛋白质与溶解的不溶性细 胞部分和任选地与存在于或仍然存在于液相(例如水溶液或培养基)的可溶性宿主细胞部 分分离。在本发明方法的一些优选实施方案中,包含不溶性目标蛋白质和溶解的不溶性宿 主细胞部分的液相(例如水溶液(例如水缓冲溶液)、培养基、发酵培养基、工艺用水或去离 子水)的移动通过重力压力、真空和/或离心进行加速。 [0124] 还优选地,在步骤c)中不溶性目标蛋白质与溶解的不溶性宿主细胞部分的分离通过沉降实现。在这个分离的方法中,不溶性目标蛋白质或不溶性目标蛋白质聚集物从包含 它的流体相(例如水溶液(例如水缓冲溶液)、培养基、发酵培养基、工艺用水或去离子水)中 沉淀出来并且贴壁。这是由于不溶性目标蛋白质或不溶性目标蛋白质聚集物应答作用于其 的力(例如重力)而移动通过流体。溶解的不溶性宿主细胞部分和任选地溶解的不溶性残留 物(例如发酵残留物)、可溶性宿主细胞部分和/或其他可溶性杂质保留在溶液中形成上清 液,因此可以简单丢弃。 [0125] 尤其优选地,在步骤c)中不溶性目标蛋白质与溶解的不溶性宿主细胞部分的分离通过离心、沉降和/或过滤的组合实现,例如,离心和过滤、沉降和过滤、沉降和离心、或者离心、沉降和过滤。 [0126] 根据不同的不溶性目标蛋白质,离心、沉降或过滤的参数也可不同。本领域技术人员能够容易地采用适当的分离参数,例如,使用离心分离的加速力/重力和/或时间,使用过 滤分离的滤器大小,和/或使用沉降分离的沉降时间,从而使溶解的不溶性宿主细胞部分和 不溶性目标蛋白质分离/分开。 [0127] 优选地,离心以这样的加速力/重力和/或这样的离心时间进行,使得足以沉降至少80%,更优选至少90%和最优选至少95%,或甚至100%,例如80、81、82、83、84、85、86、 87、88、89、90、91、92、93、94、95、96、97、98、99、99.9%或100%的不溶性目标蛋白质和不溶性目标蛋白质聚集物,而溶解的不溶性宿主细胞部分或大部分溶解的不溶性宿主细胞部分 留在溶液中。在本发明方法的一个优选实施方案中,在3000×g至12000×g(例如3000、 3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、10500、 11000、11500或12000×g)离心10分钟至40分钟(例如10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40分钟)。这些离心参数使得沉降至少80%,优选至少90%和更优选至少95%或甚至100%,例如80、81、82、83、 84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、99.9%或100%的不溶性目标蛋白质和不溶性目标蛋白质聚集物,而溶解的不溶性宿主细胞部分或大部分溶解的不溶性宿主 细胞部分留在溶液中。 [0128] 相同的应用用于沉降或过滤。优选地,沉降在这样的沉降时间下进行:足以沉降至少80%,更优选至少90%和最优选至少95%或甚至100%,例如至少80、81、82、83、84、85、 86、87、88、89、90、91、92、93、94、95、96、97、98、99、99.9%或100%的不溶性目标蛋白质和不溶性目标蛋白质聚集物,而溶解的不溶性宿主细胞部分或大部分溶解的不溶性宿主细胞部 分留在溶液中,并且可被容易地丢弃。在本发明方法的一个优选实施方案中,沉降进行1至 24小时,优选3至15小时,更优选5至10小时,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23或24小时。上述沉降时间使得沉降至少80%,优选至少90%和更优选至少95%或甚至100,例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99、99.9%或100%的不溶性目标蛋白质和不溶性目标蛋白质聚集物,而溶解的不溶性宿主细胞部分或大部分溶解的不溶性宿主细胞部分留在溶液中。 [0129] 优选地,使用这样的过滤器孔径进行过滤,其足以截留至少80%,优选至少90%和最优选至少95%或甚至100%,例如至少80、81、82、83、84、85、86、87、88、89、90、91、92、93、 94、95、96、97、98、99、99.9%或100%的不溶性目标蛋白质和不溶性目标蛋白质聚集物,而溶解的不溶性宿主细胞部分或大部分溶解的不溶性宿主细胞部分可通过过滤器孔。因而, 如果过滤被用作分离方法,过滤器的孔径可稍小于不溶性目标蛋白质或不溶性目标蛋白质 聚集物。在本发明方法的一个优选实施方案中,进行过滤的过滤器孔径为10nm至200nm,优 选为20nm至180nm和更优选为50至100nm,例如10、15、20、25、30、35、40、45、50、60、70、80、 90、100、110、120、130、140、150、160、170、180、190或200nm。这些过滤器孔径参数使得截留至少80%,优选至少90%和最优选至少95%或甚至100%,例如80、81、82、83、84、85、86、87、 88、89、90、91、92、93、94、95、96、97、98、99、99.9%或100%的不溶性目标蛋白质和不溶性目标蛋白质聚集物,而溶解的不溶性宿主细胞部分或大部分溶解的不溶性宿主细胞部分可通 过过滤器孔。 [0130] 优选地,为了提高已溶解的和/或未完全溶解的不溶性宿主细胞部分在悬液中的混合和/或提高来自已溶解的和/或未完全溶解的不溶性宿主细胞部分的较小片段的形成, 以便在步骤c)中促进不溶性目标蛋白质或不溶性目标蛋白质聚集物和溶解的和/或不完全 溶解的不溶性宿主细胞部分的分离,该方法在步骤b)之后和步骤c)之前还包括均化所述悬 液(优选地使用均化器),例如根据如实施例1所述的方法)或细胞裂解液(优选地使用合适 的酶)的步骤b’)。或者通过球磨或超声对所述悬液进行均化。 [0131] 优选地,为了进一步移除杂质,如细胞碎片、发酵残留物、碱、变性剂和/或盐,本发明方法在步骤c)之后还包括洗涤分离的不溶性目标蛋白质或不溶性目标蛋白质聚集物的步骤d),优选地洗涤离心物、沉降物或截留物。更优选地,本发明的方法在步骤c)之后还包 括用水溶液、有机溶液和/或尿素洗涤分离的不溶性目标蛋白质或不溶性目标蛋白质聚集 物的步骤d),优选地洗涤离心物、沉降物或截留物。 [0132] 当在本发明方法的步骤a)中提供包含完整宿主细胞(含有不溶性目标蛋白质)培养基的情况下,可需要这个进一步的纯化步骤。当在本发明方法的步骤a)中提供重悬于水 或水溶液的宿主细胞沉降物或宿主细胞沉淀的情况下,可不需要这个步骤。在后者的情况 下,宿主细胞已经与培养基或发酵培养基分离或大体分离,从而已经与所有或几乎所有的 发酵残留物和/或杂质分离或大体分离。 [0133] 优选地,水溶液是缓冲水溶液。还优选地,有机溶液包括乙醇(EtOH)、甲醇(CH3OH)、己烷(C6H14)、乙醚(C4H10O)和/或异丙醇(C3H8O)。 [0134] 如上述,在本发明方法的一个更优选实施方案中,分离的不溶性目标蛋白质或不溶性目标蛋白质聚集物,优选离心物、沉降物或截留物,在步骤c)之后步骤d)中用尿素洗 涤。使用尿素使得进一步移除在步骤c)中没有被分离的潜在残余的宿主细胞蛋白质。 [0135] 本发明人出乎意料地发现,随后的洗涤步骤d)可将分离的不溶性目标蛋白质的纯度提高至约多至5至20%,例如多至5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%。 例如,步骤c)之后不进行随后的洗涤步骤d),分离的不溶性目标蛋白质的纯度为80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94或95%,而在随后的洗涤步骤d)之后,该纯度为 85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%。 [0136] 优选地,分发明方法进行的温度为4℃至60℃,更优选为15℃至40℃,和最优选为15℃至25℃或20℃至25℃,例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、 47、48、49、50、51、52、53、54、55、56、57、58、59或60℃。 [0137] 优选地,本发明方法进行的压强为10kPa至1000kPa,优选为50kPa至150kPa,例如10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、 700、750、800、850、900、950或1000kPa。 [0138] 优选地,将不溶性目标蛋白质(例如蛛丝蛋白)与完整细菌宿主细胞培养基、细胞沉降物或缓冲溶液分离的方法包括以下步骤: [0139] a)提供(i)包含不溶性目标蛋白质(例如蛛丝蛋白)和不溶性细菌宿主细胞部分的完整细菌宿主细胞的培养基,(ii)包含不溶性目标蛋白质(例如蛛丝蛋白)和不溶性细菌宿 主细胞部分的完整细菌宿主细胞的细胞沉降物,优选残余水分含量为20%,或(iii)其中重 悬着所述细胞沉降物的缓冲溶液, [0140] b)将NaOH以0.05M至0.15M的终浓度添加至(i)培养基、(ii)细胞沉降物或(iii)缓冲溶液中,以便破坏所述细菌宿主细胞并溶解所述不溶性细菌宿主细胞部分,和 [0141] c)通过3000×g至12000×g离心,使不溶性目标蛋白质(例如蛛丝蛋白)与溶解的不溶性宿主细胞部分分离,即不溶性目标蛋白质作为沉淀存在,溶解的不溶性细菌宿主细 胞部分在上清液中并可被丢弃, [0142] 其中,步骤b)中目标蛋白质保持不溶,并且其中至少80%或85%、优选95%的不溶性细菌宿主细胞部分溶解。 [0143] 还优选地,将不溶性目标蛋白质(例如蛛丝蛋白)与破碎细菌宿主细胞培养基、细胞沉降物或缓冲溶液分离的方法包括以下步骤: [0144] a)提供(i)包含不溶性目标蛋白质(例如蛛丝蛋白)和不溶性细菌宿主细胞部分的破碎细菌宿主细胞的培养基,(ii)包含不溶性目标蛋白质(例如蛛丝蛋白)和不溶性细菌宿 主细胞部分的破碎细菌宿主细胞的细胞沉降物,优选残余水分含量为15%,或(iii)其中重 悬着所述细胞沉降物的缓冲溶液, [0145] b)将NaOH以终浓度0.05M至0.15M、优选为0.15M的终浓度添加至(i)培养基、(ii)细胞沉降物或(iii)缓冲溶液中,以便溶解所述不溶性细菌宿主细胞部分,和 [0146] c)通过3000×g至12000×g离心,使不溶性目标蛋白质(例如蛛丝蛋白)与溶解的不溶性宿主细胞部分分离,即不溶性目标蛋白质作为沉淀存在,溶解的不溶性细菌宿主细 胞部分在上清液中并可被丢弃, [0147] 其中,步骤b)中目标蛋白质保持不溶,并且其中至少80%或85%、优选95%的不溶性细菌宿主细胞部分溶解。 [0148] 本文所使用的术语“多肽”和“蛋白质”可互换并且意指任何氨基酸的肽键链,忽略长度或翻译后修饰。 [0149] 可以利用本发明的方法进行分离以上定义的任何不溶性目标蛋白质,优选不溶性目标蛋白质聚集物。但是,优选地,不溶性目标蛋白质、优选不溶性目标蛋白质聚集物选自 丝蛋白(尤其是包含至少两个相同重复单元的丝蛋白(例如节肢动物丝蛋白如蛛丝蛋白或 昆虫丝蛋白))、胶原蛋白、节肢弹性蛋白、和角蛋白。优选地,胶原蛋白是贝类足丝蛋白或人胶原蛋白。优选地,角蛋白是人角蛋白。 [0150] 在本发明上下文中,术语“丝蛋白”、“胶原蛋白”、“节肢弹性蛋白”或“角蛋白”可以指在宿主细胞(例如微生物、昆虫或植物宿主细胞)如重组宿主细胞或表达系统(例如微生物、昆虫或植物表达系统)如重组表达系统中(即与其自然环境分离)表达的蛋白质如重组 蛋白。另外,在本发明上下文中,术语“分离的丝蛋白”、“分离的胶原蛋白”、“分离的节肢弹性蛋白”或“分离的角蛋白”可以指在宿主细胞(例如微生物、昆虫或植物宿主细胞)如重组 宿主细胞或表达系统(例如微生物、昆虫或植物表达系统)如重组表达系统中(即与其自然 环境分离)表达并且与所述宿主细胞或所述表达系统分开的蛋白质如重组蛋白。前述术语 “表达系统”和“宿主细胞”在本文中可互换。 [0151] 在本发明上下文中,所使用的“丝蛋白”还指具有这样的氨基酸序列的蛋白质,所述氨基酸序列包含一个相同重复单元(例如A2、Q6或C16,其中数字2、6或16代表重复单元的 数目)的多个拷贝的或者两个或更多个不同重复单元(例如(AQ)24或(AQ)12C16)的多个拷贝 的至少50%、60%、65%、70%、75%、80%、85%、90%,优选至少95%和最优选100%;或由其组成。 [0152] 术语“重复的单元”和“重复单元”在本发明上下文中可互换使用。 [0153] 在本发明上下文中,术语“丝蛋白”还指包含至少两个相同的重复单元或由其组成的丝蛋白,所述相同的重复单元包含自然存在的丝多肽氨基酸序列或自然存在的丝多肽氨 基酸序列的变体或其两者组合,或者由其组成。 [0154] 在本发明上下文中,“重复单元”指这样的区域,其在氨基酸序列中对应包含至少一种在天然存在的丝多肽(例如MaSpI、ADF-3、ADF-4或Flag)内重复存在的肽基序(例如 AAAAA(SEQ ID NO:13)或GPGQQ(SEQ ID NO:4))的区域(相同的氨基酸序列)或由其组成,或 者对应基本上类似于其的氨基酸序列(变异的氨基酸序列)。就这一点而言,“基本上类似” 意指,优选地在各自参考天然存在的氨基酸序列的全长上,氨基酸同一性的程度为至少 50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或甚至99.9%。在天然存在的丝多肽内具有与对应氨基酸序列“基本上类似”的氨基酸序列的“重复单元”(野生型重复单元)还关于其特性类似,例如包含“基本上类似的重复单元”丝蛋白仍然不溶并且保持其不溶性,因此仍然可在本发明方法的 步骤c)中与溶解的不溶性宿主细胞部分分离。优选地,包含“基本上类似的重复单元”丝蛋 白在水溶液如缓冲水溶液、培养基、发酵培养基、工艺用水或去离子水中是不溶的,并且在 包含碱(例如NaOH,0.005M至1M)水溶液如缓冲水溶液、培养基、发酵培养基、工艺用水或去 离子水中10分钟至90分钟例如10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85或90分钟和/或4℃至60℃的温度例如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55或60℃多于 80、85、90、91、92、93、94、95、96、97、98、99、99.9%或甚至至100%保持不溶。在本发明的一些优选实施方案中,保持不溶的包含“基本上类似的重复单元”丝蛋白通过过滤、优选使用 10nm至200nm孔径的过滤膜和/或通过离心、优选在3000×g至12000×g和更优选在4000×g 至8000×g下离心10分钟至40分钟、优选离心20分钟至40分钟与溶解的不溶性宿主细胞部 分分离/分开。 [0155] 具有与天然存在丝多肽的氨基酸序列“相同”的氨基酸序列的“重复单元”,例如可以是对应MaSp I(SEQ ID NO:43)、MaSp II(SEQ ID NO:44)、ADF-3(SEQ ID NO:1)和/或ADF-4(SEQ ID NO:2)的一种或更多种肽基序的一部分。具有与天然存在丝多肽的氨基酸序 列“基本上类似”的氨基酸序列的“重复单元”,例如可以是对应MaSp I(SEQ ID NO:43)、MaSp II(SEQ ID NO:44)、ADF-3(SEQ ID NO:1)和/或ADF-4(SEQ ID NO:2)的一种或更多种肽基序的一部分,但是在特定的氨基酸位置上具有一种或更多种氨基酸替换。 [0156] “重复单元”不包括通常被认为存在于天然存在丝多肽的N端和/或C端的非重复亲水氨基酸结构域。 [0157] 根据本发明的“重复单元”还指具有3至200个氨基酸或5至150个氨基酸、优选具有10至100个氨基酸或15至80个氨基酸以及更优选具有10至60个或20至40个氨基酸长度的氨 基酸序列。例如,根据本发明的重复单元的长度可为3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、 41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、 66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、 91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145、150、155、 160、165、170、175、180、185、190、195或200个氨基酸。最优选地,根据本发明的重复单元由 3、4、5、6、7、8、9、10、12、15、18、20、24、27、28、30、34、35或39个氨基酸组成。 [0158] 使用本发明方法分离的丝蛋白优选地由6至1500个氨基酸或200至1300个氨基酸和最优选250至1200个氨基酸或500至1000个氨基酸组成。 [0159] 优选地,使用本发明方法分离的丝蛋白包含2至80个重复单元、3至80个重复单元或4至60个重复单元、更优选8至48个重复单元或10至40个重复单元和最优选16至32个重复 单元或由其组成。例如,使用本发明方法分离的丝蛋白包含2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、 63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80个重复单元或由其组成。最优选地,丝多肽包含4、8、12、16、24、32或48个重复单元。如上述,使用本发明方法分离的丝多肽种所包含的重复单元中至少有两个是相同的重复单元。因此,使用本发明方法分离的 丝多肽可包含一种相同重复单元(例如A2或C16,其中项目2或16代表重复单元的数目)的多 个拷贝或两种或更多种不同重复单元(例如(AQ)24或(QAQ)8)的多个拷贝。例如使用本发明 方法分离的丝多肽所包含的80个重复单元中有2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、 42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79或80个是相同的重复单元。 [0160] 使用本发明方法分离的丝多肽可包含本领域技术人员已知的任何丝多肽的氨基酸序列或由其组成。优选地,使用本发明方法分离的丝多肽包含节肢动物丝多肽(优选蛛丝 蛋白多肽)或昆虫丝多肽的氨基酸序列或者由其组成。使用本发明方法分离的丝多肽还可 包含贝类丝多肽的氨基酸序列或由其组成。 [0161] 优选地,蛛丝多肽包含大壶状腺多肽(如蜘蛛牵引丝蛋白)、小壶状腺多肽、鞭状多肽、聚状蛛丝多肽、葡萄状蛛丝多肽或管状蛛丝多肽的氨基酸序列或由其组成。最优选地, 蛛丝多肽包含蜘蛛牵引丝蛋白或鞭状蛛丝多肽的氨基酸序列或由其组成。通常优选选择圆 珠(Araneidae)或Araneoids的圆网蜘蛛(orb-web spider)之牵引丝蛋白或鞭状腺多肽的 氨基酸序列或由其组成。 [0162] 优选地,昆虫丝多肽包含鳞翅目(Lepidoptera)丝多肽的氨基酸序列或由其组成。更优选地,昆虫丝多肽包含蚕蛾科(Bombycidae)、最优选家蚕(Bombyx mori)丝多肽的氨基 酸序列或由其组成。 [0163] 优选地,上述丝多肽是重组产生的,即使重组丝多肽。例如,使用本发明方法分离的丝多肽是重组蛛丝多肽如蜘蛛牵引丝多肽或聚状蛛丝多肽、重组昆虫丝多肽或者重组贝 类丝多肽。 [0164] 使用本发明方法分离的丝多肽的重复单元可包含任何区域的氨基酸序列或由其组成,所述区域包含本领域技术人员已知的天然存在丝多肽内重复存在的至少一种肽基序 或由其组成。优选地,使用本发明方法分离的丝多肽的重复单元包含一种区域的氨基酸序 列或由其组成,所述区域包含节肢动物丝多肽(更优选蛛丝多肽)或昆虫丝多肽内重复存在 的至少一种肽基序或由其组成。使用本发明方法分离的丝多肽的重复单元还可包含一种区 域的氨基酸序列或由其组成,所述区域包含贝类丝多肽内重复存在的至少一种肽基序或由 其组成。 [0165] 优选地,蛛丝重复单元包含一种区域的氨基酸序列或由其组成,所述序列包含天然存在大壶状腺多肽如蜘蛛牵引丝蛋白、小壶状腺多肽、鞭状多肽、聚状蛛丝多肽、葡萄状 蛛丝多肽或梨状蛛丝多肽内重复存在的至少一种肽基序或由其组成。最优选地,重复单元 包含一种区域的氨基酸序列或由其组成,所述区域包含天然存在的蜘蛛牵引丝多肽或鞭状 多肽内重复存在的至少一种肽基序或由其组成。 [0166] 优选地,昆虫丝重复单元包含一种区域的氨基酸序列或由其组成,所述区域包含天然存在的鳞翅目丝多肽内重复存在的至少一种肽基序或由其组成。更优选地,昆虫丝重 复单元包含一种区域的氨基酸序列或由其组成,所述区域包含天然存在的蚕蛾科、最优选 家蚕昆虫丝多肽内重复存在的至少一种肽基序或由其组成。 [0167] 在本发明上下文中所使用的术语“共有序列”指这样的氨基酸序列,其包含在某个位置频繁出现的氨基酸(例如“G”)并且其中还没有被确定的另一些氨基酸被替换为占位符 “X”。 [0168] 优选地,使用本发明方法分离的丝蛋白包含至少两个相同的重复单元、基本上由其组成或由其组成,每个重复单元包含选自以下的至少一个、优选一个共有序列: [0169] i)GPGXX(SEQ ID NO:3),其中X是任何氨基酸,优选地,在不同的情况下独立地选自A、S、G、Y、P和Q; [0170] ii)GGX,其中X是任何氨基酸,优选地,在不同的情况下独立地选自Y、P、R、S、A、T、N和Q,更优选地在不同的情况下独立地选自Y、P和Q; [0171] iii)Ax,其中x是5至10的整数。 [0172] 还优选地,使用本发明方法分离的丝蛋白包含至少两个相同的重复单元或由其组成,每个重复单元包含选自GGRPSDTYG(SEQ ID NO:18)和GGRPSSSYG(SEQ ID NO:19)的至少 一个、优选一个氨基酸序列。 [0173] 迭代(肽)基序GPGXX(SEQ ID NO:3)和GGX(即富含甘氨酸基序)对丝多肽以及因而由包含所述基序的丝蛋白形成的线状物提供柔性。详细地,迭代GPGXX(SEQ ID NO:3)基序 形成β-转角螺旋结构,其对丝多肽赋予弹性。大壶状丝和鞭状丝二者具有GPGXX(SEQ ID NO:3)基序。迭代GGX基序与每个转角具有3个氨基酸的螺旋结构结合并在大多数蛛丝中形 成。GGX基序可对丝提供另外的弹性特性。迭代聚丙氨酸Ax(肽)基序形成了对丝多肽提供强 度的晶态β-折叠结构。(WO03/057727)。GGRPSDTYG(SEQ ID NO:18)和GGRPSSSYG(SEQ IDNO: 19)(肽)基序选自节肢弹性蛋白(WO 2008/155304)。节肢弹性蛋白是在大多数节肢动物(节 肢动物门(arthropoda))中所发现的弹性蛋白。它位于角质层的特化区域,提供低硬度和高 强度(Elvin等,Nature(473):999-1002,2005)。 [0174] 因此,在本发明的-个优选实施方案中,丝蛋白包含重复单元或由其组成,每个重复单元包含选自GPGAS(SEQ ID NO:5)、GPGSG(SEQID NO:6)、GPGGY(SEQ ID NO:7)、GPGGP(SEQ ID NO:8)、GPGGA(SEQ ID NO:9)、GPGQQ(SEQ ID NO:4)、GPGGG(SEQ ID NO:10)、GPGQG(SEQ ID NO:40)和GPGGS(SEQ ID NO:11)的至少一个、优选一个氨基酸序列。在本发明的另一个优选实施方案中,丝蛋白包含重复单元或由其组成,每个重复单元包含选自GGY、GGP、 GGA、GGR、GGS、GGT、GGN和GGQ的至少一个(例如1、2、3、4、5、8、7或8个)、优选一个氨基酸序列。在本发明的又一个优选实施方案中,丝蛋白包含重复单元或由其组成,每个重复单元包 含选自AAAAA(SEQ IDNO:12)、AAAAAA(SEQ ID NO:13)、AAAAAAA(SEQ ID NO:14)、AAAAAAAA(SEQ ID NO:15)、AAAAAAAAA(SEQ ID NO:16)和AAAAAAAA(SEQ ID NO:17)的至少一个(例如 1、2、3、4、5或6个)、优选一个氨基酸序列。 [0175] 在本发明的另一优选实施方案中,丝蛋白包含重复单元或由其组成,每个重复单元包含选自GPGAS(SEQ ID NO:5)、GPGSG(SEQ ID NO:6)、GPGGY(SEQ ID NO:7)、GPGGP(SEQ ID NO:8)、GPGGA(SEQID NO:9)、GPGQQ(SEQ ID NO:4)、GPGGG(SEQ ID NO:10)、GPGQG(SEQ ID NO:40)、GPGGS(SEQ ID NO:11)、GGY、GGP、GGA、GGR、GGS、GGT、GGN、GGQ、AAAAA(SEQ ID NO:12)、AAAAAA(SEQ ID NO:13)、AAAAAAA(SEQ ID NO:14)、AAAAAAAA(SEQ ID NO:15)、AAAAAAAAA(SEQ ID NO:16)、AAAAAAAAAA(SEQ ID NO:17)、GGRPSDTYG(SEQ ID NO:18)和 GGRPSSSYG(SEQ ID NO:19)的至少一个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24或25个)、优选一个氨基酸序列。 [0176] 最优选地,使用本发明方法分离的丝蛋白包含重复单元、基本上由其组成或由其组成,该重复单元包含以下或由以下组成: [0177] i)如氨基酸序列GPGAS(SEQ ID NO:5)、AAAAAA(SEQ ID NO:13)、GGY和GPGSG(SEQ ID NO:6),优选以这个顺序, [0178] ii)如氨基酸序列AAAAAAAA(SEQ ID NO:15)、GPGGY(SEQ IDNO:7)、GPGGY(SEQ ID NO:7)和GPGGP(SEQ ID NO:8),优选以这个顺序, [0179] iii)如氨基酸序列GPGQQ(SEQ ID NO:4)、GPGQQ(SEQ ID NO:4)、GPGQQ(SEQ ID NO:4)和GPGQQ(SEQ ID NO:4),优选以这个顺序, [0180] iv)如氨基酸序列GPGGA(SEQ ID NO:9)、GGP、GPGGA(SEQ IDNO:9)、GGP、GPGGA(SEQ ID NO:9)和GGP,优选以这个顺序, [0181] v)如氨基酸序列AAAAAAAA(SEQ ID NO:15)、GPGQG(SEQ IDNO:40)和GGR,优选以这个顺序, [0182] vi)如氨基酸序列AAAAAAAA(SEQ ID NO:15)、GPGGG(SEQ IDNO:10)、GGR、GGN和GGR,优选以这个顺序, [0183] vii)如氨基酸序列GGA、GGA、GGA、GGS、GGA和GGS,优选以这个顺序, [0184] viii)如氨基酸序列GPGGA(SEQ ID NO:9)、GPGGY(SEQ ID NO:7)、GPGGS(SEQ ID NO:11)、GPGGY(SEQ ID NO:7)、GPGGS(SEQID NO:11)和GPGGY(SEQ ID NO:7),优选以这个顺序。 [0185] 应注意,在上述丝多肽中所包含的重复单元中至少有两个是相同的重复单元。 [0186] 优选地,使用本发明方法分离的丝蛋白包含2至80个重复单元、3至80个重复单元或4至60个重复单元、更优选8至48个重复单元或10至40个重复单元以及最优选16至32个重 复单元,即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、 52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、 77、78、79或80个重复单元,或基本上由其组成或由其组成,每个重复单元包含选自以下的 至少一个、优选一个共有序列: [0187] i)GPGXX(SEQ ID NO:3),其中X是任意氨基酸,优选地,在不同的情况下独立地选自A、S、G、Y、P和Q; [0188] ii)GGX,其中X是任意氨基酸,优选地,在不同的情况下独立地选自Y、P、R、S、A、T、N和Q,更优选地在不同的情况下独立地选自Y、P和Q;和 [0189] iii)Ax,其中x是5至10的整数。 [0190] 如上述,在使用本发明方法分离的丝多肽中所包含的重复单元中至少有两个是相同的重复单元。 [0191] 还优选地,使用本发明方法分离的丝蛋白包含2至80个重复单元、3至80个重复单元或4至60个重复单元、更优选8至48个重复单元或10至40个重复单元和最优选16至32个重 复单元,基本上由其组成或由其组成,每个重复单元包含选自GGRPSDTYG(SEQ ID NO:18)和 GGRPSSSYG(SEQ ID NO:19)的至少一个、优选一个氨基酸序列。 [0192] 因此,使用本发明方法分离的丝蛋白优选地包含2至80个重复单元、3至80个重复单元或4至60个重复单元、更优选8至48个重复单元或10至40个重复单元和最优选16至32个 重复单元,基本上由其组成或由其组成,每个重复单元包含选自GPGAS(SEQ ID NO:5)、 GPGSG(SEQID NO:6)、GPGGY(SEQ ID NO:7)、GPGGP(SEQ ID NO:8)、GPGGA(SEQ ID NO:9)、GPGQQ(SEQ ID NO:4)、GPGQG(SEQ ID NO:40)、GPGGG(SEQ ID NO:10)、GPGGS(SEQ ID NO: 11)、GGY、GGP、GGA、GGR、GGS、GGT、GGN、GGQ、AAAAA(SEQ ID NO:12)、AAAAAA(SEQ ID NO:13)、AAAAAAA(SEQ ID NO:14)、AAAAAAAA(SEQ ID NO:15)、AAAAAAAAA(SEQ ID NO:16)、 AAAAAAAAAA(SEQ ID NO:17)、GGRPSDTYG(SEQ ID NO:18)和GGRPSSSYG(SEQ ID NO:19)的至少一个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或 25)、优选一个氨基酸序列。 [0193] 最优选地,使用本发明方法分离的丝蛋白包含以下、基本上由以下组成或由以下组成: [0194] i)重复单元,其包含如氨基酸序列GPGAS(SEQ ID NO:5)、AAAAAA(SEQ ID NO:13)、GGY和GPGSG(SEQ ID NO:6)或由其组成,优选以这个顺序, [0195] ii)重复单元,其包含如氨基酸序列AAAAAAAA(SEQ ID NO:15)、GPGGY(SEQ ID NO:7)、GPGGY(SEQ ID NO:7)和GPGGP(SEQID NO:8)或由其组成,优选以这个顺序, [0196] iii)重复单元,其包含如氨基酸序列GPGQQ(SEQ ID NO:4)、GPGQQ(SEQ ID NO:4)、GPGQQ(SEQ ID NO:4)和GPGQQ(SEQID NO:4)或由其组成,优选以这个顺序, [0197] iv)重复单元,其包含如氨基酸序列GPGGA(SEQ ID NO:9)、GGP、GPGGA(SEQ ID NO:9)、GGP、GPGGA(SEQ ID NO:9)和GGP或由其组成,优选以这个顺序, [0198] v)重复单元,其包含如氨基酸序列AAAAAAA(SEQ ID NO:15)、GPGQG(SEQ ID NO:40)和GGR或由其组成,优选以这个顺序, [0199] vi)重复单元,其包含如氨基酸序列AAAAAAAA(SEQ ID NO:15)、GPGGG(SEQ ID NO:10)、GGR、GGN和GGR或由其组成,优选以这个顺序, [0200] vii)重复单元,其包含重复单元,其包含如氨基酸序列GGA、GGA、GGA、GGS、GGA和GGS或由其组成,优选以这个顺序,和/或 [0201] viii)重复单元,其包含如氨基酸序列GPGGA(SEQ ID NO:9)、GPGGY(SEQ ID NO:7)、GPGGS(SEQ ID NO:11)、GPGGY(SEQ IDNO:7)、GPGGS(SEQ ID NO:11)和GPGGY(SEQ ID NO:7)或由其组成,优选以这个顺序。 [0202] 应注意,在上述丝多肽所包含的重复单元中至少有两个是相同的重复单元。 [0203] 优选地,使用本发明方法分离的丝蛋白包含以下、基本上由以下组成或由以下组成: [0204] (i)(GPGXX)n(SEQ ID NO:3)作为重复单元,其中X是任意氨基酸,优选地在各情况下独立选自A、S、G、Y、P和Q,以及n是2、3、4、5、6、7、8或9; [0205] (ii)(GGX)n作为重复单元,其中X是任意氨基酸,优选地在各情况下独立选自Y、P、R、S、A、T、N和Q,更优选地在各情况下独立地选自Y、P和Q,以及n是2、3、4、5、6、7或8;和/或[0206] (iii)(Ax)n作为重复单元,其中x是5至10的整数以及n是2、3、4、5、6、7、8、9或10。 [0207] 如上述,在使用本发明方法分离的丝多肽中所包含的重复单元中至少有两个是相同的重复单元。 [0208] 优选地,重复单元独立地选自构件A(SEQ ID NO:20)、构件C(SEQID NO:21)、构件Q(SEQ ID NO:22)、构件K(SEQ ID NO:23)、构件sp(SEQ ID NO:24)、构件S(SEQ ID NO:25)、构件R(SEQ ID NO:26)、构件X(SEQ ID NO:27)或构件Y(SEQ ID NO:28)或其变体(即构件A变体、构件C变体、构件Q变体、构件K变体、构件sp变体、构件S变体、构件R变体、构件X变体或构件Y变体)。构件A(SEQ IDNO:20)和构件Q(SEQ ID NO:22)以十字园蛛(Araneus diadematus)的ADF-3氨基酸序列为基础。构件C(SEQ ID NO:21)以十字园蛛的ADF-4氨基酸 序列为基础。构件K(SEQ ID NO:23)、sp(SEQ ID NO:24)、X(SEQ ID NO:27)和Y(SEQ ID NO: 28)以金丝蜘蛛(Nephila clavipes)的鞭状蛋白FLAG氨基酸序列为基础(WO 2006/ 008163)。构件S(SEQ ID NO:25)和构件R(SEQ ID NO:26)以节肢弹性蛋白(节肢动物门)为 基础(WO 2008/155304)。 [0209] 因此,在本发明的一个优选实施方案中,丝多肽的重复单元由构件A:GP Y GP G AS A AA AA A GG Y GP G SG QQ (SE Q I D N O :2 0) 、构件 C : GSSAAAAAAAASGPGGYGPENQGPSGPGGYGPGGP(SEQ ID NO:21)、构件Q:GPGQQGPGQQGPGQQGPGQQ (SEQ ID NO:22)、构件K:GPGGAGGPYGPGGAGGPYGPGGAGGPY(SEQ ID NO:23)、构件sp: GGTTIIEDLDITIDGADGPITISEEITI(SEQ ID NO :24) 、构件S: PGSSAAAAAAAASGPGQGQGQGQGQGGRPSDTYG(SEQ IDNO:25)、构件R: SAAAAAAAAGPGGGNGGRPSDTYGAPGGGNGGRPSSSYG(SEQ IDNO:26)、构件X:GGAGGAGGAGGSGGAGGS (SEQ ID NO:27)或构件Y:GPGGAGPGGYGPGGSGPGGYGPGGSGPGGY(SEQ ID NO:28)或其变体组 成。 [0210] 使用本发明方法分离的丝蛋白包含以下单元,基本上由其组成或由其组成:2至80个重复单元、3至80个重复单元或4至60个重复单元、更优选8至48个重复单元或10至40个重 复单元以及最优选16至32个重复单元,即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79或80个重复单元,其独立地选自构件A(SEQ ID NO:20)、构件C(SEQ ID NO:21)、构件Q(SEQ ID NO:22)、构件K(SEQ ID NO:23)、构件sp(SEQID NO:24)、构件S(SEQ ID NO:25)、构件R(SEQ ID NO:26)、构件X(SEQ ID NO:27)或构件Y(SEQ ID NO:28)或其变体(即构件A变体、构件C变体、构件Q变体、构件K变体、构件sp变体、构件S变体、构件R变体、构件X变体或构件Y变体)。应注意,在使用本发明方法分离的丝多肽中所包含的重复单元中至少有两个是相同的重复单元(构件)。 [0211] 因此,优选地,使用本发明方法分离的丝多肽包含以下内容,基本由其组成或由其组成:(i)由构件A组成的重复单元和/或由构件A变体组成的重复单元;(ii)由构件C组成的 重复单元和/或由构件C变体组成的重复单元;(iii)由构件Q组成的重复单元和/或由构件Q 变体组成的重复单元;(iv)(a)由构件A组成的重复单元和由构件Q组成的重复单元,(b)由 构件A组成的重复单元和由构件Q变体组成的重复单元,(c)由构件A变体组成的重复单元和 由构件Q组成的重复单元,(d)由构件A变体组成的重复单元和由构件Q变体组成的重复单 元;(v)(a)由构件A组成的重复单元和由构件C组成的重复单元,(b)由构件A组成的重复单 元和由构件C变体组成的重复单元,(c)由构件A变体组成的重复单元和由构件C组成的重复 单元,(d)由构件A变体组成的重复单元和由构件C变体组成的重复单元;(vi)(a)由构件C组 成的重复单元和由构件Q组成的重复单元,(b)由构件C组成的重复单元和由构件Q变体组成 的重复单元,(c)由构件C变体组成的重复单元和由构件Q组成的重复单元,(d)由构件C变体 组成的重复单元和由构件Q变体组成的重复单元;或者(vii)(a)由构件A组成的重复单元、 由构件Q组成的重复单元和由构件C组成的重复单元,(b)由构件A组成的重复单元、由构件Q 变体组成的重复单元和由构件C变体组成的重复单元,(c)由构件A组成的重复单元、由构件 Q变体组成的重复单元和由构件C组成的重复单元,(d)由构件A变体组成的重复单元、由构 件Q组成的重复单元和由构件C组成的重复单元,(e)由构件A组成的重复单元、由构件Q变体 组成的重复单元和由构件C变体组成的重复单元,(f)由构件A变体组成的重复单元、由构件 Q变体组成的重复单元和由构件C组成的重复单元,(g)由构件A变体组成的重复单元、由构 件Q组成的重复单元和由构件C变体组成的重复单元,(h)由构件A变体组成的重复单元、由 构件Q变体组成的重复单元和由构件C变体组成的重复单元。 [0212] 构件A、C、Q、K、sp、S、R、X或Y或其变体(即构件A变体、构件C变体、构件Q变体、构件K变体、构件sp变体、构件S变体、构件R变体、构件X变体或构件Y变体)各自还可以以任何组合和任何数目进行组合,即构件(重复单元)A可与构件(重复单元)Q组合(即组合AQ),构件(重复单元)C可与构件(重复单元)Q组合(即组合CQ),构件(重复单元)Q可与构件(重复单元)A 和构件(重复单元)Q组合(即组合QAQ),构件(重复单元)A可与构件(重复单元)A和构件(重 复单元)Q组合(即组合AAQ)等,前提是使用本发明方法分离的丝多肽包含至少两个相同的 重复单元或由其组成。例如,使用本发明方法分离的丝多肽可以包含An、(AA)n、(AQ)n、 (QA)n、Qn、(QQ)n、(QAQ)n、(AQA)n、Cn、(CC)n、(CCC)n、(CQ)n、(QC)n、(QCQ)n、(CQC)n、(AA)nQn、(QQ)nAn、(AAA)nQn、(QQQ)nAn、(AQQ)n、(QQA)n、Kn、spn、Sn、Rn、Xn、Yn、(Ksp)n、(spK)n、(XY)n、(YX)n、(XX)n、(YY)n、(XXX)n、(YYY)n、(AX)n、(XA)n、(CX)n、(XC)n、(QX)n、(XQ)n、(YQ)n、(QY)n、(SS)n、(SR)n、(RS)n或(RR)n或由其组成,其中n至少为2,优选4、8、9、10、12、16、20、24或32。 如果丝多肽由(AQ)12组成,应注意,在丝多肽中构件(重复单元)A出现12次和构件(重复单 元)Q也出现12次,因而丝多肽由24个构件(重复单元)组成。由(AQ)12组成的丝多肽构件(重 复单元)的排列如下:AQAQAQAQAQAQAQAQAQAQAQAQ。另外,如果丝多肽由(QAQ)8组成,应注 意,在丝多肽中构件(重复单元)A出现8次和构件(重复单元)Q出现16次,因而丝多肽由24个 构件(重复单元)组成。由(QAQ)8组成的丝多肽构件(重复单元)的排列如下: QAQQAQQAQQAQQAQQAQQAQQAQ。 [0213] 使用本发明方法分离的丝多肽还可包含(A*Q)n、(AQ*)n、(A*Q*)n、(Q*A)n、(QA*)n、(Q*A*)n、(QAQ*)n、(QA*Q)n、(Q*AQ)n、(QA*Q*)n、(Q*A*Q)n、(Q*AQ*)n、(Q*A*Q*)n、(AQA*)n、(AQ*A)n、(A*QA)n、(AQ*A*)n、(A*Q*A)n、(A*QA*)n、(A*Q*A*)n或由其组成,其中n至少为2,优选4、8、9、10、12、16、20、24或32和其中*指构件变体,即构件A或Q变体。 [0214] 术语“彼此组合”或“彼此串联”可意指在本发明的背景中构件(重复单元)彼此直接组合或串联或者可意指在本发明的背景中构件(重复单元)通过一个或更多个间隔区氨 基酸彼此组合或串联。在一些优选的实施方案中,在丝多肽种所包含的构件(重复单元)彼 此直接组合或串联。在另一些优选的实施方案中,在丝多肽种所包含的构件(重复单元)通 过1至25个或1至20个间隔区氨基酸,更优选通过1至15个或1至10个间隔区氨基酸,最优选 通过1至5个间隔区氨基酸,即通过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24或25个间隔区氨基酸彼此组合或串联。所述间隔区氨基酸可以是在蛋白质中天然存在的任何氨基酸。优选地,所述间隔区氨基酸不是脯氨酸。尤其优选不带电荷的氨 基酸,如丙氨酸或甘氨酸。优选地,所述间隔区氨基酸是这样的一些氨基酸,它们不会改变 丝蛋白的不溶性并维持其不溶性,以便使所述丝蛋白在本发明方法的步骤c)中仍然能够与 溶解的不溶性宿主细胞部分分离。还优选地,所述间隔区氨基酸是不会引起位阻的氨基酸, 例如小尺寸的氨基酸如丙氨酸或甘氨酸。在更优选的实施方案中,丝多肽包含彼此直接组 合的构件以及通过1至25个或1至20个间隔区氨基酸、更优选地通过1至15个或1至10个间隔 区氨基酸和最优选地通过1至5个间隔区氨基酸(即通过1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24或25个间隔区氨基酸)彼此组合的构件。 [0215] 构件A、C、Q、K、sp、S、R、X或Y变体与衍生它们的参照(野生型)构件A、C、Q、K、sp、S、R、X或Y在氨基酸序列中相差多至1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个氨基酸的改变(即替换、添加、插入、缺失、N-端截短和/或C-端截短)。此类构件变体可能可替换地或另外地被表征为与其来源的参照(野生型)构件的某种程度的序列同一性。因此,构件A、C、Q、K、sp、S、R、X或Y变体与各自参照(野生型)构件A、C、Q、K、sp、S、R、X或Y的序列同一性为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或甚至99.9%。优选地,序列同一性为至少10、15、18、20、24、 27、28、30、34、35或更多个氨基酸的连续延伸,优选各自参照(野生型)构件A、C、Q、K、sp、S、R、X或Y的全长。 [0216] 尤其优选地,序列同一性为各自参照(野生型)构件A、C、Q、K、sp、S、R、X或Y的全长的至少80%、全长的至少85%、全长的至少90%、全长的至少95%、全长的至少98%或全长的至少99%。还尤其优选地,序列同一性为各自参照(野生型)构件A、C、Q、K、sp、S、R、X或Y的至少10、15、18、20、24、28或30个氨基酸连续延伸的至少80%、至少10、15、18、20、24、28或30个氨基酸连续延伸的至少85%、至少10、15、18、20、24、28或30个氨基酸连续延伸的至少 90%、至少10、15、18、20、24、28或30个氨基酸连续延伸的至少95%、至少10、15、18、20、24、 28或30个氨基酸连续延伸的至少98%或至少10、15、18、20、24、28或30个氨基酸连续延伸的至少99%。 [0217] 构件A、C、Q、K、sp、S、R、X或Y的片段(或缺失变体)优选在N-端和/或在C-端缺失多至1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个氨基酸。还可以是内部缺失。 [0218] 另外,如果关于氨基酸序列(构件A、C、Q、K、sp、S、R、X或Y变体或片段以其为基础)的修饰不会改变丝蛋白的不溶性并维持其不溶性,以便使所述丝蛋白在本发明方法的步骤c)中仍然能够与溶解的不溶性宿主细胞部分分离,那么构件A、C、Q、K、sp、S、R、X或Y变体或片段仅被认为是本发明背景内的构件A、C、Q、K、sp、S、R、X或Y变体或片段。优选地,包含构件A、C、Q、K、sp、S、R、X或Y变体或片段的丝蛋白在水溶液如缓冲水溶液、培养基、发酵培养基、工艺用水或去离子水中是不溶的,并且在包含碱(例如NaOH,0.005M至1M)水溶液如缓冲水 溶液、培养基、发酵培养基、工艺用水或去离子水中在10分钟至90分钟例如10、15、20、25、 30、35、40、45、50、55、60、65、70、75、80、85或90分钟和/或4℃至60℃的温度例如4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、 35、36、37、38、39、40、45、50、55或60℃下多于80、85、90、91、92、93、94、95、96、97、98、99、 99.9%或甚至至100%保持不溶。在本发明优选的实施方案中,包含构件A、C、Q、K、sp、S、R、X或Y变体或片段的丝蛋白(维持/保持不溶性)通过过滤、优选使用10nm至200nm孔径的过滤 膜和/或通过离心、优选在3000×g至12000×g和更优选在4000×g至8000×g下离心10分钟 至40分钟、优选离心20分钟至40分钟与溶解的不溶性宿主细胞部分分离/分开。 [0219] 因此,在本发明的一个优选实施方案中,所述重复单元独立地选自模式AC(SEQ ID NO:29)、模式AK(SEQ ID NO:30)、模式CC(SEQ IDNO:31)、模式CK1(SEQ ID NO:32)、模式CK2(SEQ ID NO:33)或模式CKC(SEQ ID NO:34)。模式AC(SEQ ID NO:29)、AK(SEQ ID NO:30)、CCK1 K2 KC (SEQ ID NO:31)、C (SEQ ID NO:32)、C (SEQ ID NO:33)和C (SEQ ID NO:34)是基于蜘蛛十字园蛛(Araneus diadematus)的ADF-3氨基酸序列的模式A的变体以及基于蜘蛛十字园 蛛的ADF-4氨基酸序列的模式C的变体(WO 2007/025719)。在模式AC(SEQ ID NO:29)中21位 的氨基酸S(丝氨酸)被替换为氨基酸C(半胱氨酸),在模式AK(SEQ ID NO:30)中21位的氨基 C 酸S(丝氨酸)被替换为氨基酸K(赖氨酸),在模式C (SEQ ID NO:31)中25位的氨基酸S被替 换为25位氨基酸C,在模式CK1(SEQ ID NO:32)中25位的氨基酸S被替换为氨基酸K,在模式 CK2(SEQ ID NO:33)中20位的氨基酸E(谷氨酸)被替换为氨基酸K,以及在CKC(SEQ ID NO: 34)中20位的氨基酸E被替换为K并且25位的氨基酸S被替换为氨基酸C(WO 2007/025719)。 [0220] 优选地,用本发明方法分离的丝多肽中的重复单元由以下模式组成,模式AC:GPYGPGASAAAAAAGGYGPGCGQQ(SEQ ID NO:29)、模式AK:GPYGPGASAAAAAAGGYGPGKGQQ(SEQ ID NO:30)、模式CC:GSSAAAAAAAASGPGGYGPENQGPCGPGGYGPGGP(SEQ IDNO:31)、模式CK1: GSSAAAAAAAASGPGGYGPENQGPKGPGGYGPGGP(SEQ ID NO:32)、模式CK2: GSSAAAAAAAASGPGGYGPKNQGPSGPGGYGPGGP(SEQ ID NO:33)或模式CKC: GSSAAAAAAAASGPGGYGPKNQGPCGPGGYGPGGP(SEQ ID NO:34)。 [0221] 还优选地,用本发明方法分离的丝多肽包含2至80个重复单元、3至80个重复单元、或4至60个重复单元、优选8至48个重复单元、或10至40个重复单元以及最优选16至32个重 复单元,基本上由其组成或者由其组成,即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79或80个重复单元,所述重复单元独立地选自模式AC(SEQ ID NO:29)、模式AK(SEQ ID NO:30)、模式CC(SEQ ID NO:31)、模式CK1(SEQID NO: K2 KC 32)、模式C (SEQ ID NO:33)或模式C (SEQ ID NO:34)。例如,用本发明方法分离的丝多肽可包含模式CC4、CC8、CC16、CC32、AC5、AC8或AC10,或者由其组成。应注意,用本发明方法分离的丝多肽中包含的重复单元中有至少两个是相同重复单元(模式)。 [0222] 例如,丝多肽可包含模式CC4、CC8、CC16、CC32、AC5、AC8或AC10,或者由其组成。 [0223] 模式AK、CC、CK1、CK2和CKC还可彼此组合,即模式(重复单元)AK可与模式(重复单元)CC组合(即AK CC组合),模式(重复单元)CK1可与模式(重复单元)CK2和模式(重复单元)CKC组合(即CK1CK2CKC组合),等等,前提是用本发明方法分离的丝多肽包含至少两个相同重复单元或者由其组成。因此,用本发明方法分离的丝多肽还可以包含(AK)n、(CC)n、(CK1)n、(CK2)n、(CKC)n、(AKAC)n、(CCCC)n、(CK1CK2)n、(CK2CK1)n、(CK1CK2CK1)n、(CK2CK1CK2)n、(CK1CK2CKC)n、(CKCCK2CKC)n或(CKCCK2CK1)n,或者由其组成,其中n至少为2,优选4、5、6、7、8、10、12、16或20。术语“彼此组合”在上面定义。 [0224] 另外优选地,用本发明方法分离的丝多肽包含2至80个重复单元、3至80个重复单元或4至60个重复单元、优选8至48个重复单元,或10至40个重复单元以及最优选16至32个 重复单元,基本上由其组成或者由其组成,即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、 42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79或80个重复单元,所述重复单元独立地选自模式A(SEQ ID NO:20)或其变体、模式C(SEQ ID NO:21)或其变体、模式Q(SEQ ID NO:22)或其变体、模式K(SEQ ID NO:23)或其变体、模式sp(SEQ ID NO:24)或其变体、模式S(SEQ ID NO:25)或其变体、模式R(SEQ ID NO:26)或其变体、模式X(SEQ ID NO:27)或其变体、模式Y(SEQ ID NO:28)或其变体、模式AC(SEQ ID NO:29)、模式AK(SEQ ID NO:30)、模式CC(SEQ ID NO:31)、模式CK1(SEQ ID NO:32)、模式CK2(SEQ IDNO:33)或模式CKC(SEQ ID NO:34)。再者,应注意,用本发明方法分离的丝多肽中包含的重复单元中有至少两个是相同重复单元(模 式)。 [0225] 模式AK、CC、CK1、CK2和CKC还可以与模式A、C、Q、K、sp、S、R、X或Y组合,即模式(重复单元)AK可与模式(重复单元)C组合(即AKC组合),或者模式(重复单元)CC可与模式(重复单元)C组合(即CCC组合),等等,前提是用本发明方法分离的丝多肽包含至少两个相同重复单元 或者由其组成。因此,用本发明方法分离的丝多肽还可以包含(AQAK)n、(QAK)n、(QAKQ)n、 (AKQA)n、(AKQAK)n、(CCC)n、(CCCC)n、(CCCCC)n、(CCCCC)n、(CCQ)n、(QCC)n、(QCCQ)n、(CCQC)n、(CQCC)n、(CCQCC)n、(CCK1)n、(CK1C)n、(CK1CC)n、(CCK1C)n、(CKCCKCC)n、(CCKCCKC)n、(CKCQ)n、(QCKC)n、(QCKCQ)n、(AKCK1Q)n、(QCK2AK)n或(CK1CK2C)n,或者由其组成,其中n至少为2,优选4、5、 6、7、8、10、12、16或20。术语“彼此组合”在上面定义。 [0226] 例如,用本发明方法分离的丝多肽包含模式C16CC、CCC16、C8CCC8、C8CC8、CC8C8、C4CC8C4、CC4C8CC4、CC(AQ)24或(AQ)24CC,或者由其组成。 [0227] 用本发明方法分离的丝多肽还可包含至少一个非重复(NR)单元,即1、2、3、4、5、6或更多个NR单元,优选一个NR单元。在本发明的上下文中,术语“非重复(NR)单元”指存在于天然存在的丝多肽中的不表现出明显重复形式(非重复单元或NR单元)的氨基酸区域。优选地,非重复单元的氨基酸序列对应天然存在的拖丝多肽、优选ADF-3(SEQ IDNO:1)或ADF-4 (SEQ ID NO:2)的非重复氨基酸序列,或者对应与其基本类似的氨基酸序列。 [0228] 尤其优选地,非重复单元的氨基酸序列对应天然存在的拖丝多肽、优选ADF-3(SEQ ID NO:1)或ADF-4(SEQ ID NO:2)的非重复C端氨基酸序列,或者对应与其基本类似的氨基 酸序列。更优选地,非重复单元的氨基酸序列对应包含513位至636位氨基酸的ADF-3(SEQ ID NO:1)、或包含302位至410位氨基酸的ADF-4(SEQ ID NO:2)的非重复C端氨基酸序列,或者对应与其基本类似的氨基酸序列。 [0229] 在这点上,“基本类似”意指优选在20、30、40、50、60、70、80或更多个氨基酸上,更优选在分别参照的天然拖丝多肽、优选ADF-3(SEQID NO:1)或ADF-4(SEQ ID NO:2)的非重复(C端)氨基酸序列的全长上,氨基酸同一性的程度为至少50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%乃至99.9%。 [0230] 与对应的天然存在的拖丝多肽(即野生型非重复(C端)单元)内、优选ADF-3(SEQ ID NO:1)或ADF-4(SEQ ID NO:2)内的非重复(C端)氨基酸序列“基本类似”的“非重复单元”的氨基酸序列还与其性能类似,例如,包含“基本类似的非重复单元”的丝蛋白仍然不溶并 保持其不溶性,从而在本发明方法的步骤c)中仍然能够从溶解的不溶性宿主细胞部分中分 离。优选地,包含“基本类似的非重复单元”的丝蛋白在水溶液(如缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中不溶,并且在包含碱(如NaOH,0.005to 1M)的水溶液(如 缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经10至9分钟(如10、15、20、25、 30、35、40、45、50、55、60、65、70、75、80、85或90分钟)和/或在4℃至60℃的温度(如4、5、6、7、 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、39、40、45、50、55或60℃)下,仍保持大于80、85、90、91、92、93、94、95、96、 97、98、99、99.9%乃至100%不溶。在本发明的优选实施方案中,通过过滤(优选使用孔径为 10nm至200nm的过滤膜)、和/或通过离心(优选3000至12000×g,更优选4000至8000×g,离 心10至40分钟,优选20至40分钟)将维持/保持不溶的含“基本类似的非重复单元”的丝蛋白 与溶解的不溶性宿主细胞部分进行分离。 [0231] 最优选地,非重复(NR)单元为NR3(SEQ ID NO:41)或其变体、或NR4(SEQ ID NO:42)或其变体。NR3(SEQ ID NO:41)以蜘蛛十字园蛛的ADF-3氨基酸序列为基础,而NR4(SEQ ID NO:42)以蜘蛛十字园蛛的ADF-4氨基酸序列为基础(WO 2006/008163)。 [0232] NR3或NR4单元变体与其来源的参照NR3(SEQ ID NO:41)或NR4(SEQ ID NO:42)单元的不同在于,氨基酸序列中有多至1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、25或30个氨基酸改变(即替换、插入、缺失、N端截短和/或C端截短)。此类NR3或NR4单元变体可通过与其来源的参照NR3或NR4单元序列同一性的某一程度进行替换地或另外地 表征。因此,NR3或NR4单元变体与分别参照的NR3或NR4单元的序列同一性为至少50%、 55%、60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%乃至 99.9%。优选地,序列同一性在至少10、20、30、40、50、60、70、80、90或更多个氨基酸的连续段上,优选在各自参照的NR3或NR4单元的全长上。 [0233] 尤其优选地,序列同一性在各自参照的NR3或NR4单元全长上为至少80%、在所述全长上为至少85%、在所述全长上为至少90%、在所述全长上为至少95%、在所述全长上为 至少98%、或者在所述全长上至少99%。另外尤其优选地,序列同一性在各自参照的NR3或 NR4单元的至少20、30、40、50、60、70或80个氨基酸的连续段上为至少80%,或者在至少20、 30、40、50、60、70或80个氨基酸的连续段上为至少85%,或者在至少20、30、40、50、60、70或 80个氨基酸的连续段上为至少90%,或者在至少20、30、40、50、60、70或80个氨基酸的连续段上为至少95%,或者在至少20、30、40、50、60、70或80个氨基酸的连续段上为至少98%,或者在至少20、30、40、50、60、70或80个氨基酸的连续段上为至少99%。 [0234] NR3或NR4单元的片段(或缺失变体)优选地在其N端和/或其C端缺失多至1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55或 60个氨基酸。缺失也可以在内部。 [0235] 此外,在本发明的上下文中,NR3或NR4单位变体或片段仅被认作NR3或NR4单位变体或片段,如果关于所述变体或片段所基于的氨基酸序列修饰不改变丝蛋白不溶的性能并 且保持其不溶性,那么使得在本发明方法的步骤c)中所述丝蛋白仍然可以从溶解的不溶性 宿主细胞部分中分离。优选地,包含NR3或NR4单位变体或片段的丝蛋白在水溶液(如缓冲水 溶液)、培养基、发酵培养基、工艺用水或去离子水中不溶,并且在包含碱(如NaOH,0.005M至 1M)的水溶液(如缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水中,经10至90分钟(10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85或90分钟)和/或在4℃至60℃的温度(如4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、31、32、33、34、35、36、37、38、39、40、45、50、55或60℃)下,仍保持大于80、85、90、91、92、 93、94、95、96、97、98、99、99.9%乃至100%不溶。在本发明的优选实施方案中,通过过滤(优选使用孔径为10nm至200nm的过滤膜)、和/或通过离心(优选3000至12000×g,更优选4000 至8000×g,离心10至40分钟,优选20至40分钟)将维持/保持不溶的含NR3或NR4单位变体或 片段的丝蛋白与溶解的不溶性宿主细胞部分进行分离。 [0236] 优选地,用本发明方法分离的丝蛋白选自:ADF-3(SEQ ID NO:1)或其变体、ADF-4(SEQ ID NO:2)或其变体、MaSp I(SEQ ID NO:43)或其变体、MaSp II(SEQ ID NO:44)或其变体、(C)m、(C)mNRz、NRz(C)m、NRz(C)mNRz、(AQ)n、(AQ)nNRz、NRz(AQ)n、NRz(AQ)nNRz、(QAQ)o、NRz(QAQ)o、(QAQ)oNRz、Yp、Xp和Kp,其中m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、 40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、 65、66、67或68),n为6至24的整数(即6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22、23或24),o为8至16的整数(即8、9、10、11、12、13、14、15或16),p为8至16的整数(即8、9、 10、11、12、13、14、15或16)以及z为1至3的整数(即1、2或3),并且NR代表非重复单元。上述式由以下式之一定义:在所述式中 [0237] (i)(C)m,根据SEQ ID NO:21的氨基酸序列所代表的“m”个C模式(即2至64个C模式)彼此组合, [0238] (ii)(C)mNRz,根据SEQ ID NO:21的氨基酸序列所代表的“m”个C模式(即2至64个C模式)彼此组合,其中所述C模式进一步与“z”个非重复(NR)单元(即1至3个非重复(NR)单 元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO: 42的氨基酸序列所代表的非重复(NR)单元NR4)组合, [0239] (iii)NRz(C)m,“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序列所代表的非重复(NR)单元NR4)存在(z=1)或彼此组合(z=2或3),其中所述非重复(NR)单元 进一步与根据SEQ ID NO:21的氨基酸序列所代表的“m”个C模式(即2至64个C模式)组合, [0240] (iv)NRz(C)mNRz,“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序列所代表的非重复(NR)单元NR4)存在(z=1)或彼此组合(z=2或3),其中所述非重复(NR)单元 进一步与根据SEQ ID NO:21的氨基酸序列所代表的“m”个C模式(即2至64个C模式)组合,并且其中所述C模式进一步与“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据 SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序 列所代表的非重复(NR)单元NR4)组合, [0241] (v)(AQ)n,“n”个A与Q模式组合(即6至24个A与Q模式组合)彼此组合,其中根据SEQ ID NO:20的氨基酸序列代表模式A并且根据SEQID NO:22的氨基酸序列代表模式Q, [0242] (vi)(AQ)nNRz,“n”个A与Q模式组合(即6至24个A与Q模式组合)彼此组合,其中根据SEQ ID NO:20的氨基酸序列代表模式A并且根据SEQ ID NO:22的氨基酸序列代表模式Q,并且其中所述A与Q模式组合进一步与“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例 如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的 氨基酸序列所代表的非重复(NR)单元NR4)组合, [0243] (vii)NRz(AQ)n,“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序列所代表的非重复(NR)单元NR4)存在(z=1)或彼此组合(z=2或3),其中所述非重复(NR)单元 进一步与“n”个A与Q模式组合(即6至24个A与Q模式组合,其中根据SEQ ID NO:20的氨基酸 序列代表模式A并且根据SEQ ID NO:22的氨基酸序列代表模式Q)组合, [0244] (viii)NRz(AQ)nNRz,“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序列所代表的非重复(NR)单元NR4)存在(z=1)或彼此组合(z=2或3),其中所述非重复(NR) 单元进一步与“n”个A与Q模式组合(6至24个A与Q模式组合,其中根据SEQ ID NO:20的氨基 酸序列代表模式A并且根据SEQ ID NO:22的氨基酸序列代表模式Q)组合,并且其中所述A与 Q模式组合进一步与“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序列所代 表的非重复(NR)单元NR4)组合, [0245] (ix)(QAQ)o,“o”个Q、A与Q模式组合(即8至16个Q、A与Q模式组合)彼此组合,其中根据SEQ ID NO:22的氨基酸序列代表模式Q并且根据SEQ ID NO:20的氨基酸序列代表模式A, [0246] (x)(QAQ)oNR“z o”个Q、A与Q模式组合(即8至16个Q、A与Q模式组合)彼此组合,其中根据SEQ ID NO:22的氨基酸序列代表模式Q并且根据SEQ ID NO:20的氨基酸序列代表模式A,并且其中所述Q、A与Q模式组合进一步与“z”个非重复(NR)单元(即1至3个非重复(NR)单 元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO: 42的氨基酸序列所代表的非重复(NR)单元NR4)组合, [0247] (xi)NRz(QAQ)o,“z”个非重复(NR)单元(即1至3个非重复(NR)单元,例如,根据SEQ ID NO:41的氨基酸序列所代表的非重复(NR)单元NR3或根据SEQ ID NO:42的氨基酸序列所代表的非重复(NR)单元NR4)存在(z=1)或彼此组合(z=2或3),其中所述非重复(NR)单元 进一步与“o”个Q、A与Q模式组合(即8至16个Q、A与Q模式组合,其中根据SEQ ID NO:22的氨基酸序列代表模式Q并且根据SEQ ID NO:20的氨基酸序列代表模式A)组合, [0248] (xii)Yp,根据SEQ ID NO:28的氨基酸序列所代表的“p”个Y模式(即8至16个Y模式)彼此组合, [0249] (xiii)Xp,根据SEQ ID NO:27的氨基酸序列所代表的“p”个X模式(即8至16个X模式)彼此组合, [0250] (xiv)Kp,根据SEQ ID NO:23的氨基酸序列所代表的“p”个K模式(即8至16个K模式)彼此组合, [0251] 更优选地, [0252] (i)(C)mNRz或NRz(C)m中z为1并且m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、 62、63或64),(C)mNRz或NRz(C)m中z为2并且m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、 62、63或64),(C)mNRz或NRz(C)m中z为3并且m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、 62、63或64), [0253] (ii)(AQ)nNRz或NRz(AQ)n中z为1并且n为6至24的整数(即6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24),(AQ)nNRz或NRz(AQ)n中z为2并且n为6至24的整数(即6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24),(AQ)nNRz或NRz(AQ)n中z为3并且n为6至24的整数(即6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或 24), [0254] (iii)NRz(QAQ)o或(QAQ)oNRz中z为1并且o为8至16的整数(即8、9、10、11、12、13、14、15或16),NRz(QAQ)o或(QAQ)oNRz中z为2并且o为8至16的整数(即8、9、10、11、12、13、14、 15或16),NRz(QAQ)o或(QAQ)oNRz中z为3并且o为8至16的整数(即8、9、10、11、12、13、14、15或 16), [0255] (iv)NRz(C)mNRz中z为1并且m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63或 64),NRz(C)mNRz中z为2并且m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、 42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63或64),NRz(C)mNRz中z为3并且m为2至64的整数(即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、 45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63或64),或者[0256] (v)NRz(AQ)nNRz中z为1并且n为6至24的整数(即6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23或24),NRz(AQ)nNRz中z为2并且n为6至24的整数(即6、7、8、9、10、11、 12、13、14、15、16、17、18、19、20、21、22、23或24),NRz(AQ)nNRz中z为3并且n为6至24的整数(即6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24), [0257] 其中NR代表非重复单元,优选NR3或NR4。 [0258] 最优选地,用本发明方法分离的丝蛋白为C16NR4、C32NR4、(AQ)12NR3、(AQ)24NR3、(AQ)12、(AQ)24、C16、C32、NR4C16NR4、NR4C32NR4、NR3C16NR3、NR3C32NR3、NR4(AQ)12NR4、NR4(AQ)24NR4、NR3(AQ)12NR3、NR3(AQ)24NR3、(QAQ)8或(QAQ)16。 [0259] ADF-3、ADF-4、MaSp I或MaSp II变体与其来源的参照(野生型)ADF-3(SEQ ID NO:1)、ADF-4(SEQ ID NO:2)、MaSp I(SEQ ID NO:43)或MaSp II(SEQ ID NO:44)多肽的不同之处在于氨基酸序列中有多至150个(多至1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140或 150个)氨基酸改变(即替换、插入、缺失、N端截短和/或C端截短)。此类变体可通过与其来源的参照(野生型)多肽的某一程度的序列同一性进行可替换地或另外地表征。因此,ADF-3、 ADF-4、MaSp I或MaSp II变体与分别参照的(野生型)ADF-3、ADF-4、MaSp I或MaSp II多肽 的序列同一性为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、 61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、 76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%乃至99.9%。优选地,序列同一性在至少20、25、30、35、40、50、60、70、80、90、100、120、150、180、200、250、300、350、400或更多个氨基酸的连续段上,优选在各自参照的(野生型)ADF-3、ADF-4、MaSp I或MaSp II多肽的全长 上。 [0260] 尤其优选地,序列同一性在各自参照的(野生型)ADF-3、ADF-4、MaSp I或MaSp II多肽全长上为至少80%、在所述全长上为至少85%、在所述全长上为至少90%、在所述全长 上为至少95%、在所述全长上为至少98%、或者在所述全长上至少99%。还尤其优选地,序 列同一性在各自参照的(野生型)ADF-3、ADF-4、MaSp I或MaSp II多肽的至少20、30、50、 100、150、200、250或300个氨基酸的连续段上为至少80%,或者在至少20、30、50、100、150、 200、250或300个氨基酸的连续段上为至少85%,或者在至少20、30、50、100、150、200、250或 300个氨基酸的连续段上为至少90%,或者在至少20、30、50、100、150、200、250或300个氨基酸的连续段上为至少95%,或者在至少20、30、50、100、150、200、250或300个氨基酸的连续段上为至少98%,或者在至少20、30、50、100、150、200、250或300个氨基酸的连续段上为至少99%。 [0261] ADF-3(SEQ ID NO:1)多肽的片段(或缺失变体)优选地在其N端和/或其C端缺失多至1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、 100、120、150、170、200、220、250、270、300、320、350、370、400、420、450、470、500、520、550、 570、600或610个氨基酸。缺失也可以在内部。 [0262] ADF-4(SEQ ID NO:2)多肽的片段(或缺失变体)优选地在其N端和/或其C端缺失多至1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、 100、120、150、170、200、220、250、270、300、320、330、340、350、360、370、380或390个氨基酸。 缺失也可以在内部。 [0263] MaSp I(SEQ ID NO:43)多肽的片段(或缺失变体)优选地在其N端和/或其C端缺失多至1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、 100、150、200、250、300、350、400、450、500、550、600、620、640、660、670、680或690个氨基酸。 缺失也可以在内部。 [0264] MaSp II(SEQ ID NO:44)多肽的片段(或缺失变体)优选地在其N端和/或其C端缺失多至1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、 95、100、150、200、250、300、350、400、450、500、520、540、560或570个氨基酸。缺失也可以在内部。 [0265] 此外,在本发明的上下文中,ADF-3、ADF-4、MaSp I或MaSp II变体或片段仅被认作ADF-3、ADF-4、MaSp I或MaSp II变体或片段,如果关于所述变体或片段所基于的氨基酸序 列修饰不改变丝蛋白不溶的性能并且保持其不溶性,那么使得在本发明方法的步骤c)中所 述丝蛋白仍然可以从溶解的不溶性宿主细胞部分中分离。优选地,ADF-3、ADF-4、MaSp I或 MaSp II变体或片段在水溶液(如缓冲水溶液)、培养基、发酵培养基、工艺用水或去离子水 中仍然不溶,并且在包含碱(如NaOH,0.005M至1M)的水溶液(如缓冲水溶液)、培养基、发酵 培养基、工艺用水或去离子水中,经10至90分钟(10、15、20、25、30、35、40、45、50、55、60、65、 70、75、80、85或90分钟)和/或在4℃至60℃的温度(如4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、 45、50、55或60℃)下,仍保持大于80、85、90、91、92、93、94、95、96、97、98、99、99.9%乃至 100%不溶。在本发明的优选实施方案中,通过过滤(优选使用孔径为10nm至200nm的过滤 膜)、和/或通过离心(优选3000至12000×g,更优选400至8000×g,离心10至40分钟,优选20 至40分钟)来分离维持/保持不溶的ADF-3、ADF-4、MaSp I或MaSp II变体或片段与溶解的不 溶性宿主细胞部分。 [0266] 在另一个实施方案中,丝蛋白还包含选自以下的N端和/或C端TAG: [0267] (i)由氨基酸序列GCGGGGGGSGGGG(SEQ ID NO:35)组成的TAGCYS1, [0268] (ii)由氨基酸序列GCGGGGGG(SEQ ID NO:36)组成的TAGCYS2, [0269] (iii)由氨基酸序列GCGGSGGGGSGGGG(SEQ ID NO:37)组成的TAGCYS3, [0270] (iv)由氨基酸序列GKGGGGGGSGGGG(SEQ ID NO:38)组成的TAGLYS1, [0271] (v)由氨基酸序列GKGGGGGG(SEQ ID NO:39)组成的TAGLYS2。 [0273] 最优选地,用本发明方法分离的丝多肽包含TAGCYS1C16、C16TAGCYS1、TAGCYS1C16TAGCY31、TAGCYS2C16、C16TAGCYS2、TAGCYS2C16TAGCYS2、TAGCYS3C16、C16TAGCYS3、TAGCYS3C16TAGCYS3、TAGLYS1C16、C16TAGLYS1、TAGLYS1C16TAGLYS1、TAGLYS2C16、C16TAGLYS2或TAGLYS2C16TAGLYS2,或由其组成。 [0274] 在第二个方面中,本发明涉及可通过第一个方面的方法获得的不溶性目标蛋白质。 [0275] 在又一个方面中,本发明提供了一种从蛋白质溶液中分离不溶性目标蛋白质的方法,所述方法包括以下步骤: [0276] a)提供包含不溶性目标蛋白质的蛋白质溶液, [0277] b)将一定量的至少一种碱的水溶液添加至所述溶液中,所述量足以破碎所述宿主细胞和/或溶解所述不溶性宿主细胞部分,以及 [0278] c)将不溶性目标蛋白质与溶解的不溶性宿主细胞部分分离, [0279] 其中步骤b)中目标蛋白质保持不溶并且至少80%的不溶性宿主细胞部分被溶解。 [0280] 优选地,蛋白质溶液来自表达不溶性目标蛋白质的转基因动物(如山羊、绵羊或牛)的乳。关于步骤b)中添加的碱、所用试剂、工艺条件和参数的选择,定义以及可分离目标蛋白质,参照本发明上面关于第一个方面所做的解释。 [0281] 在不背离本发明范围的情况下,本发明的多种修正和变化对于本领域技术人员将是显而易见的。虽然关于特定的优选实施方案本发明已进行了描述,应理解所声明的本发 明应不过度地受限于此类具体实施方案。实际上,对于相关领域技术人员显而易见的,用于 实施本发明的所述方式的多种修正涵盖在本发明内。 附图说明[0283] 图1:相分离的直观化。细胞残留物完全被溶解,然而C16目标蛋白质在沉淀部分中仍然保持不溶。添加不同试剂影响C16目标蛋白质沉淀的相分离结果。图1示出如实施例2所 述的一步纯化。在A:0.05M NaOH、B:0.05M NaOH和4.8M尿素、C:0.05M NaOH和0.1%吐温20、D:4.8M尿素、E:2M盐酸胍、F:0.1%吐温20中将细胞碎片孵育45分钟。孵育并进行后续离心步骤之后,A、B和C的沉淀物表现为白色沉淀,其几乎完全由高纯度C16目标蛋白质组成。在样品D、E和F中,观察到无明显的相分离。 [0284] 图2:根据实施例2纯化的重组蛛丝蛋白C16的免疫印迹分析(Western印迹)。载有C16的泳道2示出单一的蛋白质信号(泳道1中为C16阳性对照)。可观察到无蛋白质降解。目标 蛋白质的特异性缺失根据SERVAGelTM TG10(43210)所附方案经由缀合T7标签(T7-tag)肽 来介导。具体为:泳道1:0.5μg的阳性对照C16(根据Huemmerich等,Biochemistrv 2004,43, 13604-13612纯化);泳道2:0.5μg的C16(根据实施例2纯化)。抗体: 抗体HRP缀合 物,Cat.Nr:69048-3,Novagen;PVDF膜: Fluoro-PVDF,PVM020C-099,Roth;免疫印迹 (Western印迹)根据SERVAGelTM TG10(43210)所附方案来进行。封闭液:1×PBS缓冲剂中的 5%奶粉,孵育30分钟;根据所附方案,用Lumi-lightPlus溶液,12015196001,Roche来实现检测。 [0285] 图3:根据实施例2所述过程纯化的重组蛛丝蛋白C16的SDS聚丙烯酰胺凝胶电泳(SDS-Page)分析(银染色)(泳道2),载有10μg的C16蛋白,示出单一的蛋白质信号(泳道1中为C16阳性对照)。根据图1可观察到无污染物。泳道1:阳性对照10μg的C16(根据Huemmerich等,Biochemistrv 2004,43,13604-13612纯化);泳道2:10μg的C16(实施例2所述纯化)。SDS-Page分析根据所附方案经SERVAGelTM TG10(43210)来进行。染色根据所附方案用SERVA银 染色试剂盒(35076)来实现。 [0286] 图4:根据实施例2纯化的重组蛛丝蛋白C16的HPLC分析。色谱图在15.057分钟示出单一的尖锐峰(波长280nm处检测,鉴定为目标蛋白质C16)。可观察到无污染物。柱参数: HPLC色谱柱G3000SWXL,Tosoh Bioscience,Nr.08541;内径:7.8mm;柱长: 30.0cm。流速恒定为0.5ml/min。 [0287] 图5:关于纯化的C16蛋白(目标蛋白质)的量,对Huemmerich等,Biochemistry 2004,43,13604-13612的纯化方法与根据实施例2的纯化方法进行了比较。这可表明,与 Biochemistry 2004,43,13604-13612的纯化方法的目标蛋白质C16产率(10.4%)相比,当使用根据本发明方法(参见实施例2)进行纯化时,目标蛋白质C16产率(89%)显著提高(约9 倍)。图5示出根据实施例2纯化的目标蛋白质C16的产率。关于纯化的C16蛋白的量,对纯化方法(Huemmerich等,Biochemistry 2004,43,13604-13612)和实施例2所述纯化方法二者进 行比较。 [0288] 图6:如实施例2所述用0.05M氢氧化钠处理的纯化重组蛛丝蛋白C16的稳定性测定。在用0.05M孵育5分钟至24小时之后可观察到无显著的蛋白质降解。目标蛋白质鉴定经由 HPLC运行中的荧光检测器(激发波长:275nm 波长:305nm;梯度:等度,洗脱剂:100mMTris/HCl pH 7.5)来介导。在孵育5分钟、10分钟、20分钟、30分钟、1小时、3小时、7小时和24小时的不同时间点下采集样品。为了更好检测微小差别,将每个色谱图数据标准化至100%。 实施例 [0289] 为了分离目标蛋白质,本发明人示例性地设计了来源于拖丝丝蛋白ADF-4(来自欧洲花园十字园蛛(Araneus diadematus))的合成丝多肽C16。基于ADF-3和/或ADF-4及其变体 表现出有效装配行为的以上观察结果,选择蛋白质。 [0290] 实施例I:制备微生物细胞悬液 [0291] 使用匀浆器(APV Gaulin GmbH,LAB60-15RBFI)在室温和900巴的压强下对微生物细胞进行两次细胞溶解/破碎。所得细胞碎片溶液在20℃下以9000×g离心30分钟。弃去上 清液并将细胞碎片沉淀物用于一步纯化中。 [0292] 实施例II:分离C16 [0293] 测定来自制备微生物溶液(实施例1)的细胞碎片沉淀物的湿重以调节所需稀释体积。细胞碎片沉淀物(湿重)与0.05M NaOH的比率为1:3(w/w)。在本实施例中,测量细胞碎片沉淀物为5克。因此计算样品添加剂的重量为15克。本实验中的添加剂为A:0.05M NaOH、B: 0.05MNaOH和4.8M尿素、C:0.05M NaOH和0.1%吐温20、D:4.8M尿素、E:2M盐酸胍或F:0.1%吐温20。所有样品在20℃及很好混合的条件下孵育45分钟。孵育之后,将样品在20℃下以 8000×g离心30分钟(参见图1)。A、B和C的沉淀物表现为白色沉淀,其几乎完全由高纯度C16 目标蛋白质组成。在样品D、E和F中,观察到无明显的相分离。 [0294] 该步骤之后,聚集的C16蛋白(目标蛋白质)存在于沉淀部分中,而弃去上清液。用H2O进行两次额外的洗涤步骤(20℃下以8000×g离心30分钟)以增加C16目标蛋白质的纯度。 然后对所得C16目标蛋白质进行以下分析:SDS-Page分析(银染色)(根据所附方案用SERVA银 染色试剂盒(35076)进行染色)(参见图3);免疫印迹(Western印迹)(根据SERVAGelTM TG10 (43210)所附方案进行免疫印迹(Western印迹)。封闭液:1×PBS缓冲剂中的5%奶粉,孵育 30分钟;根据所附方案,用Lumi-lightPlus溶液,12015196001,Roche来实现检测。)(参见图 2);以及HPLC分析(柱参数: HPLC柱G3000SWXL,TosohBioscience,Nr.08541;内 径:7.8mm;柱长:30.0cm。流速恒定为0.5ml/min)(参见图4)。 [0295] 实施例III:与标准方法相比分离C16 [0296] 测定来自制备微生物溶液的细胞碎片沉淀物的湿重以调节所需稀释体积。细胞碎片沉淀物(湿重)与0.05M NaOH的比率为1∶3(w/w)。在本实施例中,测量细胞碎片沉淀物为1 千克。因此计算样品添加剂的重量为3kg(总重量:4kg)。样品在20℃下搅拌孵育45分钟。孵 育之后,将样品在20℃下以8000×g离心30分钟。该步骤之后,C16目标蛋白质存在于沉淀部 分中,而弃去上清液。用H2O进行两次额外的洗涤步骤(20℃下以8000×g离心30分钟)以增 加C16目标蛋白质的纯度。将在本实施例中纯化的C16目标蛋白质量与如Huemmerich等, Biochemistry 2004,43,13604-13612所述纯化方法进行比较。与本发明方法相比,根据 Huemmerich等的纯化用来自制备微生物细胞的细胞破碎之后的上清液来进行。 [0297] 表1: [0298] [0299] 关于纯化的C16目标蛋白质的量,可示出如实施例2所述纯化的目标蛋白质C16的产率显著增加(大约9倍)(参见表1、图5)。 [0300] 实施例IV:C16的蛋白质稳定性 [0301] 将含有目标蛋白质C16的微生物细胞溶液用0.05M NaOH处理。如实施例1和2所述,使用匀浆器[APV Gaulin GmbH,LAB60-15RBFI]在室温和900巴的压强下对微生物细胞进行 两次细胞溶解。将所得细胞碎片溶液在20℃、9000×g离心30分钟。弃去上清液并将细胞碎 片沉淀物用于一步纯化。测定来自制备微生物细胞溶液(实施例1)的细胞碎片沉淀物的湿 重以调节所需稀释体积。细胞碎片沉淀物(湿重)与0.05M NaOH的比率为1∶3(w/w)。 [0302] 在孵育5分钟、10分钟、20分钟、30分钟、1小时、3小时、7小时和24小时的不同时间点下采集样品。为了更好检测微小差别,将每个色谱图数据标准化至100%。如图6所示,用0.05M NaOH孵育5分钟至24小时之后,没有发生显著的蛋白质降解。仪器参数: HPLC柱G3000SWXL,内径:7.8mm,柱长:30.0cm,流速:0.5ml/min。荧光检测:激发波长: 275nm-发射波长:305nm;梯度:等度,洗脱剂:100mM Tris/HCl pH 7.5。 |