支架蛋白

阅读:261发布:2020-07-31

专利汇可以提供支架蛋白专利检索,专利查询,专利分析的服务。并且本 发明 的膜 支架 蛋白(MSP)与疏 水 或部分疏水性 蛋白质 装配所形成的可溶性 纳米级 颗粒保留了其天然结构和功能;就 稳定性 及 生物 活性和天然构象保存而言,它们优于脂质体和 去污 剂微团。当存在磷脂时,MSP可形成纳米级磷脂双层圆盘,通式MSP稳定了该颗粒的双层结构域周缘。这种颗粒性双层结构可经操作在液体或固体支持物中掺入蛋白质,包括与这种表面敏感技术一起用作扫描探针显微术或表面胞质基因组共振术。就掺入蛋白质的完整性和保持其生物化学活性而言,这种纳米级粒子是坚固的,可促进药物和生物研究、结构/功能相关性、结构确定、生物分离和药物开发。,下面是支架蛋白专利的具体信息内容。

1.一种在溶液中装配成颗粒的人造膜支架蛋白,所述人造膜支架蛋白包含至少 一个两性螺旋。
2.如权利要求1所述的人造膜支架蛋白,其特征在于,所述两性螺旋是α螺旋。
3.如权利要求1所述的人造膜支架蛋白,其特征在于,所述两性螺旋包含50-200 个螺旋转
4.如权利要求1所述的人造膜支架蛋白,其特征在于,所述两性螺旋的每个螺旋 转角含有3-16个基酸。
5.如权利要求1所述的人造膜支架蛋白,其特征在于,所述螺旋的每个转角含有 3-10个氨基酸。
6.如权利要求1所述的人造膜支架蛋白,其特征在于,所述α螺旋含有12-600个 氨基酸。
7.如权利要求1所述的人造膜支架蛋白,其特征在于,所述蛋白包含至少两个螺 旋,所述螺旋通过转折序列连接,其中所述转折序列含有1-5个氨基酸。
8.如权利要求7所述的人造膜支架蛋白,其特征在于,所述转折序列含有至少一 个选自甘氨酸、丙氨酸和脯氨酸的氨基酸。
9.如权利要求1所述的人造膜支架蛋白,其特征在于,所述膜支架蛋白包含选自 以下的氨基酸序列:SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、 SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、 SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94 的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、 SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、 SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99 的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、SEQ ID NO: 113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115的氨基酸 24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基酸25-214、 SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、SEQ ID NO:133 的氨基酸25-212、SEQID NO:135和SEQ ID NO:135的氨基酸13-212。
10.如权利要求1所述的人造膜支架蛋白,所述蛋白包含选自以下的氨基酸序列: SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:17、SEQ ID NO:17的氨基酸13-414、 SEQID NO:19、SEQ ID NO:19的氨基酸13-422、SEQ ID NO:23、SEQ ID NO:23 的氨基酸13-168、SEQ ID NO:29、SEQ ID NO:29的氨基酸13-1 68、SEQ ID NO:43、 SEQID NO:43的氨基酸13-201、SEQ ID NO:44、SEQ ID NO:44的氨基酸13-201、 SEQ ID NO:45、SEQ ID NO:45的氨基酸13-392、SEQ ID NO:73、SEQ ID NO:73 的氨基酸13-234、SEQ ID NO:74、SEQ ID NO:74的氨基酸13-256、SEQ ID NO:75、 SEQ ID NO:75的氨基酸13-278、SEQ ID NO:76、SEQ ID NO:76的氨基酸24-223、 SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:78的氨基酸24-212、SEQ ID NO:79、 SEQ ID NO:80、SEQ ID NO:80的氨基酸24-201、SEQ ID NO:81、SEQ ID NO:81 的氨基酸13-168、SEQ ID NO:82、SEQ ID NO:82的氨基酸13-168、SEQ ID NO:83、 SEQ ID NO:83的氨基酸13-190、SEQ ID NO:84、SEQ ID NO:84的氨基酸13-201、 SEQ ID NO:85、SEQ ID NO:85的氨基酸13-190、SEQ ID NO:86、SEQ ID NO:86 的氨基酸24-381、SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、 SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、 SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94 的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、 SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、 SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99 的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、SEQ ID NO: 113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115的氨基酸 24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基酸25-214、 SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、SEQ ID NO:133 的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸13-212,其中,所述 序列通过1-5个保守性氨基酸、插入1-5个氨基酸或删除1-5个氨基酸进行了修饰。
11.如权利要求9所述的人造膜支架蛋白,还包含额外的两性螺旋,其中所述额外 的两性螺旋不衍生自载脂蛋白A-1的氨基酸序列。
12.如权利要求11所述的人造膜支架蛋白,其特征在于,所述额外的两性螺旋衍 生自载脂蛋白A-II、载脂蛋白C-1、载脂蛋白C-11、载脂蛋白C-111、载脂蛋白E、 apolipophorin III、肌红蛋白和血红蛋白的氨基酸序列。
13.如权利要求12所述的人造膜支架蛋白,其特征在于,所述额外的两性螺旋通 过含有1-5个氨基酸的转折序列连接于所述蛋白质的一个螺旋。
14.如权利要求13所述的人造膜支架蛋白,其特征在于,所述转折序列包含至少 一个选自脯氨酸、丙氨酸和甘氨酸的氨基酸。
15.一种将至少一种疏水或部分疏水性分子掺入在水溶液中稳定并可溶的纳米级 圆盘状颗粒中的方法,所述方法包括以下步骤:
(a)提供一种溶解的组合物,其含有溶于水溶液的至少一种疏水或部分疏水性分 子和增溶剂
(b)使膜支架蛋白接触至少一种磷脂和步骤(a)中溶解的组合物;和
(c)除去所述增溶剂,
籍此,至少一种疏水或部分疏水性分子与所述膜支架蛋白在水溶液中自装配成纳米 级颗粒,只要该膜支架蛋白不是载脂蛋白A-1,或者膜支架蛋白特征为具有选自以下 的氨基酸序列:SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:17、SEQ ID NO:17的 氨基酸13-414、SEQ ID NO:19、SEQ ID NO:19的氨基酸13-422、SEQ ID NO:23、 SEQ ID NO:23的氨基酸13-168、SEQ ID NO:29、SEQ ID NO:29的氨基酸13-168、 SEQ ID NO:43、SEQ ID NO:43的氨基酸13-201、SEQ ID NO:44、SEQ ID NO:44 的氨基酸13-201、SEQ ID NO:45、SEQ ID NO:45的氨基酸13-392、SEQ ID NO:73、 SEQ ID NO:73的氨基酸13-234、SEQ ID NO:74、SEQ ID NO:74的氨基酸13-256、 SEQ ID NO:75、SEQ ID NO:75的氨基酸13-278、SEQ ID NO:76、SEQ ID NO:76 的氨基酸24-223、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:78的氨基酸24-212、 SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:80的氨基酸24-201、SEQ ID NO:81、 SEQ ID NO:81的氨基酸13-168、SEQ ID NO:82、SEQ ID NO:82的氨基酸13-168、 SEQ ID NO:83、SEQ ID NO:83的氨基酸13-190、SEQ ID NO:84、SEQ ID NO:84 的氨基酸13-201、SEQ ID NO:85、SEQ ID NO:85的氨基酸13-190、SEQ ID NO:86 和SEQ ID NO:86的氨基酸24-381。
16.如权利要求15所述的方法,其特征在于,至少一种磷脂是磷脂酰胆、磷脂 酰乙醇胺、磷脂酰肌醇、二棕榈酰磷脂酰胆碱、二肉豆蔻酰磷脂酰胆碱、1-棕榈酰-2- 油酰-磷脂酰胆碱、1-棕榈酰-2-油酰-磷脂酰丝氨酸、1-棕榈酰-2-油酰-磷脂酰乙醇胺、 二己酰磷脂酰胆碱、二棕榈酰磷脂酰乙醇胺、二棕榈酰磷脂酰肌醇、二肉豆蔻酰磷 脂酰乙醇胺、二肉豆蔻酰磷脂酰肌醇、二己酰磷脂酰乙醇胺、二己酰磷脂酰肌醇、 1-棕榈酰-2-油酰-磷脂酰乙醇胺和1-棕榈酰-2-油酰-磷脂酰肌醇。
17.如权利要求15所述的方法,其特征在于,所述疏水疏水或部分疏水性分子是 蛋白质。
18.如权利要求17所述的方法,其特征在于,所述磷脂来自溶解的膜制品或溶解 的膜片段制品。
19.如权利要求18所述方法,其特征在于,所述纳米级颗粒还包含胆固醇或胆固 醇酯。
20.如权利要求17所述的方法,其特征在于,所述蛋白质是细胞色素P450。
21.如权利要求20所述的方法,其特征在于,所述促溶蛋白质组合物还包含电子 转运系统、细胞色素P450还原酶或细胞色素b5。
22.如权利要求17所述的方法,其特征在于,所述所述疏水或部分疏水性蛋白质 是受体蛋白。
23.如权利要求22所述的方法,其特征在于,所述所述受体蛋白是G蛋白偶联 受体。
24.如权利要求23所述的方法,其特征在于,所述受体蛋白是五羟色胺受体,β- 肾上腺素能受体、多巴胺D4受体,溶血磷脂酸受体或趋化因子受体。
25.如权利要求24所述的方法,其特征在于,所述趋化因子受体是CXCR4受体 或CCR5受体。
26.如权利要求17所述的方法,其特征在于,所述疏水或部分疏水性蛋白质是转 氢酶或天冬氨酸受体蛋白。
27.如权利要求15所述的方法,其特征在于,所述膜支架蛋白包括SEQ ID NO:91、 SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、SEQ ID NO:92的氨基酸24-190、 SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、SEQ ID NO:94、SEQ ID NO:94 的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、 SEQID NO:95的氨基酸24-278、SEQ ID NO:96、SEQ ID NO:96的氨基酸24-423、 SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、SEQ ID NO:98、SEQ ID NO:98 的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99的氨基酸24-392、SEQ ID NO:111、 SEQ ID NO:111的氨基酸24-397、SEQ ID NO:113、SEQ ID NO:113的氨基酸24-383、 SEQ ID NO:115、SEQ ID NO:115的氨基酸24-379、SEQ ID NO:117、SEQ ID NO:117 的氨基酸24-381、SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO: 129、SEQ ID NO:129的氨基酸25-214、SEQ ID NO:131、SEQ ID NO:131的氨基酸 25-212、SEQ ID NO:133、SEQ ID NO:133的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸13-212。
28.如权利要求15所述的方法,其特征在于,所述膜支架蛋白包含选自以下的氨 基酸序列:SEQ ID NO:6、SEQID NO:9、SEQ ID NO:17、SEQ ID NO:17的氨基 酸13-414、SEQ ID NO:19、SEQ IDNO:19的氨基酸13-422、SEQ ID NO:23、SEQ ID NO:23的氨基酸13-168、SEQ ID NO:29、SEQ ID NO:29的氨基酸13-168、SEQ ID NO:43、SEQID NO:43的氨基酸13-201、SEQIDNO:44、SEQ ID NO:44的氨 基酸13-201、SEQ ID NO:45、SEQ ID NO:45的氨基酸13-392、SEQ ID NO:73、SEQ ID NO:73的氨基酸13-234、SEQ ID NO:74、SEQ ID NO:74的氨基酸13-256、SEQ ID NO:75、SEQ ID NO:75的氨基酸13-278、SEQ ID NO:76、SEQ ID NO:76的氨 基酸24-223、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:78的氨基酸24-212、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:80的氨基酸24-201、SEQ ID NO:81、SEQ ID NO:81的氨基酸13-168、SEQ ID NO:82、SEQ ID NO:82的氨基酸13-168、SEQ ID NO:83、SEQ ID NO:83的氨基酸13-190、SEQ ID NO:84、SEQ ID NO:84的氨 基酸13-201、SEQ ID NO:85、SEQ ID NO:85的氨基酸13-190、SEQ ID NO:86、SEQ ID NO:86的氨基酸24-381、SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨 基酸24-179、SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨 基酸24-199、SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、SEQ ID NO:113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115 的氨基酸24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO: 119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基 酸25-214、SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、 SEQ ID NO:133的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸 13-212,其中,所述氨基酸序列有1-5个保守性氨基酸取代、删除1-5个氨基酸或插 入1-5个氨基酸。
29.如权利要求27或28所述的方法,其特征在于,所述疏水或部分疏水性蛋白质 是受体蛋白。
30.如权利要求29所述的方法,其特征在于,所述受体蛋白是G蛋白偶联受体。
31.如权利要求30所述的方法,其特征在于,所述受体蛋白是五羟色胺受体、β- 肾上腺素能受体、多巴胺D4受体、溶血磷脂酸受体或趋化因子受体。
32.如权利要求31所述的方法,其特征在于,所述趋化因子受体是CXCR4受体 或CCR5受体。
33.如权利要求27所述的方法,其特征在于,所述疏水或部分疏水性蛋白质是转 氢酶或天冬氨酸受体蛋白。
34.如权利要求15所述的方法,其特征在于,所述增溶剂是去污剂或peptidetergent 或流体为200-200,000的大气。
35.如权利要求27所述的方法,其特征在于,所述增溶剂是胆酸盐、脱胆酸盐、 1-棕榈酰-2-油酰-sn-甘油磷酸胆酸盐、1-棕榈酰-2-油酰-sn-甘油磷酸丝氨酸、1-棕榈 酰-2-油酰-sn-甘油磷酸乙醇胺、正-十二烷基-β-D-麦芽苷、辛基-吡喃葡糖苷、Triton X-100、肉豆蔻酰硫代甜菜碱、二己酰-磷脂酰胆碱、毛地黄皂苷、emulgen 913或 JB3-14。
36.如权利要求27所述的方法,其特征在于,所述增溶剂可通过透析吸附除去。
37.如权利要求16所述的方法,其特征在于,MSP∶增溶剂∶膜脂的摩尔比为1∶25∶50 至1∶2000∶1000。
38.如权利要求37所述的方法,其特征在于,MSP∶增溶剂∶膜脂质的摩尔比为 1∶75∶150。
39.一种含有至少一种磷脂、非载脂蛋白A-1的膜支架蛋白和另一种疏水或部分 疏水性分子的纳米级颗粒。
40.如权利要求39所述的纳米级颗粒,其特征在于,所述另一种疏水或部分疏水 性分子是治疗分子,且其中的膜支架蛋白是权利要求9所述的人造膜支架蛋白。
41.如权利要求40所述的纳米级颗粒,其特征在于,所述至少一种磷脂是磷脂酰 胆碱、磷脂酰乙醇胺、磷脂酰肌醇、二棕榈酰磷脂酰胆碱、二肉豆蔻酰磷脂酰胆碱、 1-棕榈酰-2-油酰-磷脂酰胆碱、1-棕榈酰-2-油酰-磷脂酰丝氨酸、1-棕榈酰-2-油酰-磷 脂酰乙醇胺、二己酰磷脂酰胆碱、二棕榈酰磷脂酰乙醇胺、二棕榈酰磷脂酰肌醇、 二肉豆蔻酰磷脂酰乙醇胺、二肉豆蔻酰磷脂酰肌醇、二己酰磷脂酰乙醇胺、二己酰 磷脂酰肌醇、1-棕榈酰-2-油酰-磷脂酰乙醇胺和1-棕榈酰-2-油酰-磷脂酰肌醇。
42.如权利要求40所述的纳米级颗粒,其特征在于,所述治疗分子是抗生物剂、 肿瘤剂、血管生成因子、血栓溶解剂、通道阻滞剂、抗动脉粥样硬化剂、抗高 血压剂、正性肌力药、抗炎剂、抗心律失常剂(antiarrythmia agent)、抗病毒剂、抗真 菌剂、抗凝血剂、抗再狭窄剂、治疗性蛋白质、光动力剂、治疗性肽、治疗性核酸 分子、治疗性糖类或至少一种维生素。
43.如权利要求42所述的纳米级颗粒,其特征在于,所述抗微生物剂是两性霉素 B或康唑。
44.如权利要求40所述的纳米级颗粒,还包含与要被输送治疗剂的细胞的表面特 异性结合的寻靶剂。
45.如权利要求44所述的纳米级颗粒,其特征在于,所述寻靶剂是凝集素、单链 抗体或抗体的抗原结合片段。
46.如权利要求47所述的纳米级颗粒,其特征在于,所述寻靶剂与所述膜支架蛋 白共价结合。
47.如权利要求44所述的纳米级颗粒,其特征在于,所述寻靶剂与所述颗粒非共 价结合。
48.如权利要求39所述的纳米级颗粒,其特征在于,所述另一种疏水或部分疏水 性分子是蛋白质。
49.如权利要求48所述的纳米级颗粒,其特征在于,所述蛋白质是膜受体蛋白。
50.如权利要求49所述的纳米级颗粒,其特征在于,所述膜受体蛋白是G蛋白 偶联受体。
51.如权利要求50所述的纳米级颗粒,其特征在于,所述G蛋白偶联受体是五 羟色胺受体、β肾上腺素能受体、趋化因子受体、溶血磷脂酸受体或多巴胺受体。
52.如权利要求51所述的纳米级颗粒,其特征在于,所述趋化因子受体是CXCR4 受体或CCR5受体。
53.如权利要求48所述的纳米级颗粒,其特征在于,所述蛋白质是转氢酶或天冬 氨酸受体蛋白。
54.如权利要求48所述的纳米级颗粒,其特征在于,所述蛋白质是细胞色素P450 蛋白。
55.如权利要求54所述的纳米级颗粒,还包含电子转运系统、细胞色素P450还 原酶或细胞色素b5。
56.如权利要求48所述的纳米级颗粒,还包含胆固醇或胆固醇酯。
57.如权利要求48所述的纳米级颗粒,其特征在于,所述膜支架蛋白包含选自以 下的氨基酸序列:SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、 SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、 SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94 的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、 SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、 SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99 的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、SEQ ID NO: 113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115的氨基酸 24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基酸25-214、 SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、SEQ ID NO:133 的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸13-212。
58.如权利要求48所述的纳米级颗粒,所述膜支架蛋白包含选自以下的氨基酸序 列:SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:17、SEQ ID NO:17的氨基酸13-414、 SEQ ID NO:19、SEQ ID NO:19的氨基酸13-422、SEQ ID NO:23、SEQ ID NO:23 的氨基酸13-168、SEQ ID NO:29、SEQ ID NO:29的氨基酸13-168、SEQ ID NO:43、 SEQ ID NO:43的氨基酸13-201、SEQ ID NO:44、SEQ ID NO:44的氨基酸13-201、 SEQ ID NO:45、SEQ ID NO:45的氨基酸13-392、SEQ ID NO:73、SEQ ID NO:73 的氨基酸13-234、SEQ ID NO:74、SEQ ID NO:74的氨基酸13-256、SEQ ID NO:75、 SEQ ID NO:75的氨基酸13-278、SEQ ID NO:76、SEQ ID NO:76的氨基酸24-223、 SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:78的氨基酸24-212、SEQ ID NO:79、 SEQ ID NO:80、SEQ ID NO:80的氨基酸24-201、SEQ ID NO:81、SEQ ID NO:81 的氨基酸13-168、SEQ ID NO:82、SEQ ID NO:82的氨基酸13-168、SEQ ID NO:83、 SEQ ID NO:83的氨基酸13-190、SEQ ID NO:84、SEQ ID NO:84的氨基酸13-201、 SEQ ID NO:85、SEQ ID NO:85的氨基酸13-190、SEQ ID NO:86、SEQ ID NO:86 的氨基酸24-381、SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、 SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、 SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94 的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、 SEQ ID NO:96的氨基酸24-423、SEQ IDNO:97、SEQ ID NO:97的氨基酸24-199、 SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99 的氨基酸24-392、SEQ ID NO:111、SEQID NO:111的氨基酸24-397、SEQ ID NO: 113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115的氨基酸 24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基酸25-214、 SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、SEQ ID NO:133 的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸13-212,其中,所述 序列通过1-5个保守性氨基酸、插入1-5个氨基酸或删除1-5个氨基酸来修饰。
59.如权利要求38所述的纳米级颗粒,其特征在于,所述疏水或部分疏水性分子 是亲脂性染料、荧光染料或显影剂。
60.如权利要求59所述的纳米级颗粒,其特征在于,所述显影剂包括钆、锝、碲、 铱或碘。
61.一种鉴定调节受体-配体相互作用的分子的方法,该方法包括:
使包含至少一种磷脂、配体受体蛋白的纳米级颗粒接触配体和膜支架蛋白,其中, 所述膜支架蛋白包含以下氨基酸序列:SEQ ID NO:91、SEQ ID NO:91的氨基酸 24-201、SEQ ID NO:92、SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸 24-278、SEQ ID NO:96、SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基 酸24-397、SEQ ID NO:113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、 SEQ ID NO:115的氨基酸24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、 SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO: 129的氨基酸25-214、SEQ ID NO:131、SEQ ID NO:13 1的氨基酸25-212、SEQ ID NO: 133、SEQ ID NO:133的氨基酸25-212、SEQ ID NO:135、SEQ ID NO:135的氨基酸 13-212,或经修饰的上述序列,其中,所述氨基酸序列通过1-5个氨基酸的保守性氨 基酸取代、插入1-5个氨基酸或删除1-5个氨基酸进行了修饰;
测定所述配体与所述纳米级颗粒的结合;
在存在候选调节剂时使所述配体受体蛋白接触所述配体;
测定存在所述候选调节剂时所述配体与所述受体的结合;
比较存在和缺乏所述候选调节剂时所述配体与所述受体的结合;
从而可通过能否提高或降低所述配体与所述受体结合来鉴定该调节剂。
62.如权利要求61所述的方法,其特征在于,所述配体受体蛋白是G蛋白偶联受 体。
63.如权利要求62所述的方法,其特征在于,所述G蛋白偶联受体是五羟色胺 受体、β肾上腺素能受体、趋化因子受体、溶血磷脂酸受体或多巴胺受体。
64.如权利要求63所述的方法,其特征在于,所述趋化因子受体是CXCR4受体 或CCR5受体。
65.如权利要求61所述的方法,其特征在于,所述纳米级颗粒附着于固体支持物 上。
66.如权利要求65所述的方法,其特征在于,所述固体支持物是金颗粒或金表面。
67.如权利要求66所述的方法,其特征在于,所述固体支持物是石英、聚苯乙烯、 塑料、二氧化硅、氧化硅、氮化硅或树脂
68.如权利要求61所述的方法,其特征在于,所述至少一种磷脂是磷脂酰胆碱、 磷脂酰乙醇胺、磷脂酰肌醇、二棕榈酰磷脂酰胆碱、二肉豆蔻酰磷脂酰胆碱、1-棕榈 酰-2-油酰-磷脂酰胆碱、1-棕榈酰-2-油酰-磷脂酰丝氨酸、1-棕榈酰-2-油酰-磷脂酰乙 醇胺、二己酰磷脂酰胆碱、二棕榈酰磷脂酰乙醇胺、二棕榈酰磷脂酰肌醇、二肉豆 蔻酰磷脂酰乙醇胺、二肉豆蔻酰磷脂酰肌醇、二己酰磷脂酰乙醇胺、二己酰磷脂酰 肌醇、1-棕榈酰-2-油酰-磷脂酰乙醇胺和1-棕榈酰-2-油酰-磷脂酰肌醇。
69.一种从含有疏水物质的样品中去除所述疏水或部分疏水性物质的方法,所述方 法包括使疏水样品接触一种或多种权利要求62所述的纳米颗粒,从而使所述疏水性 物质离开所述样品分配到纳米颗粒的磷脂双层中。
70.如权利要求69所述的方法,其特征在于,所述样品是液体。
71.如权利要求69所述的方法,其特征在于,所述样品是颗粒状固体。
72.如权利要求69所述的方法,其特征在于,所述纳米颗粒结合在溶液中的阵列 上。
73.如权利要求69所述的方法,在结合步骤之后还包括使所述纳米颗粒与样品分 离。
74.一种制备可溶性纳米级圆盘状颗粒的方法,所述方法包括以下步骤:
用促溶剂溶解人造膜支架蛋白产生溶解的膜支架蛋白,其中所述人造膜支架蛋白 包含以下氨基酸序列:SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO: 92、SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸 24-179、SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸 24-199、SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、SEQ ID NO:113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115的氨 基酸24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO:119、 SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基酸 25-214、SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、SEQ ID NO:133的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸13-212, 或者其中所述氨基酸序列通过1-5个氨基酸的保守性氨基酸取代、插入1-5个氨基酸 或删除1-5个氨基酸进行了修饰;
在溶解的膜支架蛋白中加入至少一种磷脂;和
除去增溶剂,
从而使膜支架蛋白与磷脂自装配形成纳米级圆盘状颗粒。
75.一种含有稳定的可溶性纳米级圆盘状颗粒的免疫原性组合物,所述颗粒包含膜 支架蛋白、至少一种疏水或部分疏水性抗原分子和至少一种磷脂,其中,所述免疫 原性组合物还任选含有免疫佐剂。
76.如权利要求75所述的免疫原性组合物,其特征在于,所述疏水或部分疏水性 抗原分子来自溶解的膜制品或溶解的膜片段制品。
77.如权利要求75所述的免疫原性组合物,其特征在于,所述疏水或部分疏水性 抗原分子是蛋白质、脂蛋白、脂多糖、脂低聚糖,糖类,糖蛋白,糖脂或脂质。
78.如权利要求75所述的免疫原性组合物,其特征在于,所述膜支架蛋白包含以 下氨基酸序列:SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:17、SEQ ID NO:17的 氨基酸13-414、SEQ ID NO:19、SEQ ID NO:19的氨基酸13-422、SEQ ID NO:23、 SEQ ID NO:23的氨基酸13-168、SEQ ID NO:29、SEQ ID NO:29的氨基酸13-168、 SEQ ID NO:43、SEQ ID NO:43的氨基酸13-201、SEQ ID NO:44、SEQ ID NO:44 的氨基酸13-201、SEQ ID NO:45、SEQ ID NO:45的氨基酸13-392、SEQ ID NO:73、 SEQ ID NO:73的氨基酸13-234、SEQ ID NO:74、SEQ ID NO:74的氨基酸13-256、 SEQ ID NO:75、SEQ ID NO:75的氨基酸1 3-278、SEQ ID NO:76、SEQ ID NO:76 的氨基酸24-223、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:78的氨基酸24-212、 SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:80的氨基酸24-201、SEQ ID NO:81、 SEQ ID NO:81的氨基酸13-168、SEQ ID NO:82、SEQ ID NO:82的氨基酸13-168、 SEQ ID NO:83、SEQ ID NO:83的氨基酸13-190、SEQ ID NO:84、SEQ ID NO:84 的氨基酸13-201、SEQ ID NO:85、SEQ ID NO:85的氨基酸13-190、SEQ ID NO:86、 SEQID NO:86的氨基酸24-381、SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、 SEQ ID NO:92、SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93 的氨基酸24-179、SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、 SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、 SEQ ID NO:96、SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ IDNO:97 的氨基酸24-199、SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、 SEQ ID NO:99的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、 SEQ ID NO:113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115 的氨基酸24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO: 119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基 酸25-214、SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、 SEQ ID NO:133的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸 13-212,或者所述氨基酸序列中有1-5个保守性氨基酸取代、删除1-5个氨基酸或插 入1-5个氨基酸。
79.如权利要求75所述的免疫原性组合物,其特征在于,所述抗原分子衍生自微 生物、寄生虫、病毒或者人肿瘤细胞或动物肿瘤细胞。
80.如权利要求75所述的免疫原性组合物,其特征在于,所述微生物是细菌、立 克次氏体、支原体、真菌原生动物
81.如权利要求80所述的免疫原性组合物,其特征在于,所述抗原分子选自:人 免疫缺陷病毒的gp120,单纯疱疹病毒的包膜糖蛋白,麻疹病毒的包膜糖蛋白,SARS 病毒的“刺突”蛋白,流感病毒的血凝素,副流感病毒的血凝素,酿脓链球菌 (Streptococcus pyogenes)的M6蛋白,牙龈卟啉单胞菌(Porphoryomonas gingivalis)的菌 毛蛋白,单核细胞增生李斯特菌(Listeria monocytogenes)的InIB蛋白,单核细胞增生 李斯特菌(Listeria monocytogenes)的ActA蛋白,小肠结肠炎耶尔森菌(Yersinia enterocolitica)的YadA蛋白,弗氏志贺菌(Shigella flexneri)的IcsA蛋白,假结核耶尔 森菌(Yersinia pseudotuberculosis)的侵染素,霍乱弧菌(Vibrio cholerae)的至少一种acf 基因产物,含有炭疽杆菌(Bacillus anthracis)聚-D-谷氨酸多肽的荚膜物质,金黄色葡 萄球菌(Staphylococcus aureus)的血纤蛋白原/纤维蛋白结合蛋白,鼠疫耶尔森菌 (Yersinia pestis)、小肠结肠炎耶尔森菌(Yersinia enterocolitica)或假结核耶尔森菌 (Yersinia pseudotuberculosis)的V和/或W抗原,空肠弯曲杆菌空肠亚种(Campylobacter jejuni)的孔蛋白,以及伤寒沙菌(Salmonella typhi)、猪霍乱沙门菌(Salmonella choleraesuis)或肠炎沙门菌(Salmonella enteritidis)的O抗原。
82.如权利要求75所述的免疫原性组合物,其特征在于,所述人肿瘤细胞或动物 肿瘤细胞是恶性黑色素瘤细胞、胃肠癌细胞、成神经细胞瘤细胞、骨肉瘤细胞、直 肠癌细胞、乳腺癌细胞、癌细胞、白血病细胞、淋巴瘤细胞或骨髓瘤细胞。
83.如权利要求75所述的免疫原性组合物,其特征在于,所述纳米级颗粒还包含 能使所述纳米级颗粒靶向细胞表面的分子。
84.如权利要求83所述的免疫原性组合物,其特征在于,所述细胞表面是粘膜细 胞表面。
85.如权利要求84所述的免疫原性组合物,其特征在于,所述粘膜细胞表面是肠 粘膜细胞表面。
86.如权利要求83所述的免疫原性组合物,其特征在于,所述细胞表面是上皮细 胞表面。
87.一种含有两个或多个权利要求39所述纳米级颗粒的阵列。
88.如权利要求87所述的阵列,其特征在于,所述纳米级颗粒包含膜支架蛋白, 其中所述膜蛋白含有一个或多个半胱氨酸残基,所述纳米级颗粒可通过二硫键结合 在一起。
89.如权利要求87所述的阵列,其特征在于,所述纳米级颗粒附着于固体表面。
90.如权利要求89所述的阵列,其特征在于,所述固体表面是金属、石英、聚苯 乙烯、塑料、硅、二氧化硅、氧化硅、氮化硅或树脂。
91.如权利要求90所述的阵列,其特征在于,所述金属表面是金。
92.如权利要求87所述的阵列,其特征在于,所述纳米级颗粒还包含能结合至少 一种配体的结合分子。
93.如权利要求92所述的阵列,其特征在于,所述结合分子是受体蛋白。
94.如权利要求93所述的阵列,其特征在于,所述受体蛋白是G蛋白偶联受体。
95.如权利要求94所述的阵列,其特征在于,所述G蛋白偶联受体是五羟色胺 受体、β肾上腺素能受体、溶血磷脂酸受体、趋化因子受体或多巴胺受体。
96.如权利要求92所述的阵列,其特征在于,所述至少一种被结合的配体是G 蛋白。
97.如权利要求83所述的阵列,其特征在于,膜支架蛋白具有以下给出的氨基酸 序列:SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:17、SEQ ID NO:17的氨基酸13-414、 SEQ ID NO:19、SEQ ID NO:1 9的氨基酸13-422、SEQ ID NO:23、SEQ ID NO:23 的氨基酸13-168、SEQ ID NO:29、SEQ ID NO:29的氨基酸13-168、SEQ ID NO:43、 SEQ ID NO:43的氨基酸13-201、SEQ ID NO:44、SEQ ID NO:44的氨基酸1 3-201、 SEQ ID NO:45、SEQ ID NO:45的氨基酸13-392、SEQ ID NO: 73、SEQ ID NO:73 的氨基酸13-234、SEQ ID NO:74、SEQ ID NO:74的氨基酸13-256、SEQ ID NO:75、 SEQ ID NO:75的氨基酸13-278、SEQ ID NO:76、SEQ ID NO:76的氨基酸24-223、 SEQ ID NO:77、SEQ ID NO:78、SEQID NO:78的氨基酸24-212、SEQ ID NO:79、 SEQ ID NO:80、SEQ ID NO:80的氨基酸24-201、SEQ ID NO:81、SEQ ID NO:81 的氨基酸13-168、SEQ ID NO:82、SEQ ID NO:82的氨基酸13-168、SEQ ID NO:83、 SEQ ID NO:83的氨基酸13-190、SEQ ID NO:84、SEQ ID NO:84的氨基酸13-201、 SEQ ID NO:85、SEQ ID NO:85的氨基酸13-190、SEQ ID NO:86、SEQ ID NO:86 的氨基酸24-381、SEQ ID NO:91、SEQ ID NO:91的氨基酸24-201、SEQ ID NO:92、 SEQ ID NO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、 SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94 的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸24-278、SEQ ID NO:96、 SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、 SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ ID NO:99 的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基酸24-397、SEQ ID NO: 113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、SEQ ID NO:115的氨基酸 24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO:129的氨基酸25-214、 SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO:133、SEQ ID NO:133 的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基酸13-212,或者其中所 述氨基酸序列中有1-5个保守性氨基酸取代、删除了1-5个氨基酸或插入了1-5个氨 基酸。
98.一种含有人造膜支架蛋白和至少一种磷脂的纳米级颗粒,其中,所述人造膜支 架蛋白包含选自以下的氨基酸序列:SEQ ID NO:91、SEQ ID NO:91的氨基酸 24-201、SEQ ID NO:92、SEQ IDNO:92的氨基酸24-190、SEQ ID NO:93、SEQ ID NO:93的氨基酸24-179、SEQ ID NO:94、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:94的氨基酸24-289、SEQ ID NO:95、SEQ ID NO:95的氨基酸 24-278、SEQ ID NO:96、SEQ ID NO:96的氨基酸24-423、SEQ ID NO:97、SEQ ID NO:97的氨基酸24-199、SEQ ID NO:98、SEQ ID NO:98的氨基酸24-401、SEQ ID NO:99、SEQ IDNO:99的氨基酸24-392、SEQ ID NO:111、SEQ ID NO:111的氨基 酸24-397、SEQ ID NO:113、SEQ ID NO:113的氨基酸24-383、SEQ ID NO:115、 SEQ ID NO:115的氨基酸24-379、SEQ ID NO:117、SEQ ID NO:117的氨基酸24-381、 SEQ ID NO:119、SEQ ID NO:119的氨基酸13-1094、SEQ ID NO:129、SEQ ID NO: 129的氨基酸25-214、SEQ ID NO:131、SEQ ID NO:131的氨基酸25-212、SEQ ID NO: 133、SEQ ID NO:133的氨基酸25-212、SEQ ID NO:135和SEQ ID NO:135的氨基 酸13-212,或者其中所述序列用1-5个氨基酸的保守性取代、插入1-5个氨基酸或删 除1-5个氨基酸进行了修饰。
99.如权利要求97所述的纳米级颗粒,其特征在于,所述至少一种磷脂是磷脂酰 胆碱、磷脂酰乙醇胺、磷脂酰肌醇、二棕榈酰磷脂酰胆碱、二肉豆蔻酰磷脂酰胆碱、 1-棕榈酰-2-油酰-磷脂酰胆碱、1-棕榈酰-2-油酰-磷脂酰丝氨酸、1-棕榈酰-2-油酰-磷 脂酰乙醇胺、二己酰磷脂酰胆碱、二棕榈酰磷脂酰乙醇胺、二棕榈酰磷脂酰肌醇、 二肉豆蔻酰磷脂酰乙醇胺、二肉豆蔻酰磷脂酰肌醇、二己酰磷脂酰乙醇胺、二己酰 磷脂酰肌醇、1-棕榈酰-2-油酰-磷脂酰乙醇胺和1-棕榈酰-2-油酰-磷脂酰肌醇。

说明书全文

发明的领域包括分子生物学和膜技术。具体地讲,本发明涉及支架蛋白质 (MSP),尤其是人造MSP,并涉及利用这些膜支架蛋白稳定、分散和溶解完全或部 分疏蛋白质(包括但不限于外周、包埋或整合膜蛋白)同时保留这些蛋白质的生物 学活性,或稳定、分散和溶解纯化的和用化学方法溶解或直接溶解膜片段或膜以使 其模拟天然膜环境的方法。所述疏水性蛋白质与膜支架蛋白相结合形成本文称为纳 米圆盘(nanodisc)的纳米级圆盘状结构。

若干年前,我们通过扫描探针显微术,例如将合成的高密度脂蛋白圆盘 (rHDL,apo A-I)定向吸附母上,研究了与能载脂蛋白(从人血浆制备)复合的脂质 的结构和功能并分析了这些分子装配体的特性(Carlson等,1997;Bayburt等,1998; Bayburt等,2000;Carlson等,2000)。所观察到的圆盘结构直径约10nm,高约5.5nm。 拓扑学观察到5.5nm的高度与外延朝向平坦的云母原子表面上的单一双层膜非常相 容(Carlson等,1997)。

我们随后发现,可将纯化的膜蛋白重建到某些这种圆盘结构的磷脂双层结构域之 中,并利用定向蛋白质-双层装配体的表面结构或分光光谱技术监测研究了圆盘在溶 液中或随后吸附于合适的表面上的情况。在后一种情况下,含有膜蛋白的圆盘结构 易于识别并能提供判断样品和图象质量的参考点。

高密度脂蛋白(HDL)是一种称为apo A-I的蛋白质成分与各种磷脂的球形装配体。 HDL颗粒作为胆固醇逆向转运的主要通路在哺乳动物胆固醇稳态中起着重要作用 (Fielding和Fielding,1991)。HDL作为胆固醇转运体的功能依赖于与HDL结合的酶 卵磷脂-胆固醇酰基转移酶或LCAT(Glomset,1968;Jonas,1991)的活性,LCAT能介导 胆固醇酯插入HDL脂蛋白颗粒中。apo A-I蛋白的某些部分是这种酶活性所必需的 (Holvoet等,1995)。此外,据认为apo A-I蛋白的N-末端球状结构域中的一部分负 责与细胞表面受体相互反应。根据对染色标本的电镜观察,HDL颗粒的新生形式呈 圆盘状(Forte等,1971)。我们的实验室在水环境条件下对rHDL的合成形式进行了原 子显微术(AFM)研究,证实了这一结果。然而,这种形式不是其在体内循环中的主 要形式。而且,从apo A-I的序列看来涉及稳定更常见的球状结构形式。

已提出HDL圆盘新生结构的两种通用模型。一种模型是apo A-I蛋白围绕环状双 层部分形成由弯曲的分节α螺旋棒构成的水平环带或“带状”(Wlodawer等,1979)。 另一种模型,该蛋白质以一系列α螺旋区段垂直跨于该双层两边缘间(Boguski等, 1986)。这两种模型主要以间接的实验证据为基础,尚没有得到可区分它们的整体颗 粒的三维结构。

目前已接受的模型是环带模型,该模型与一些电镜观察和中子散射数据相符 (Wlodawer等,1979),其中的螺旋像“带子”一样纵向排列围绕在双层圆盘的周边 (Segrest等,1999)。与早期的研究相反,最近用新的样品定向法作圆二色性测量的红 外光谱研究与该环带模型更加相符(Wald等,1990;Koppaka等,1999)。迄今为止, 还没有完整的直接证据可以证明这一模型是正确的,虽然已得到了不含脂质的apo A-I晶体的低分辨率X-射线晶体结构(Borhani等,1997)。N-末端载短的apo A-I的低 分辨率晶体结构显示一个单元含有由四个螺旋棒构成的四聚物,四个螺旋棒弯曲成 状并联合产生一大约125×80×40的圆形聚集体。提示这种弯曲构象的二聚物 能够形成圆盘状颗粒。

迄今收集到的与胆固醇逆向转运循环和HDL颗粒成熟有关的信息,提示apo A-I 蛋白有独特的性质,使它能自发地与膜相互反应导致脂蛋白颗粒的形成。已有人提 出了最初的apo A-I脂质结合反应(Rogers等,1998),但双层结构形式如何转变成圆 盘状颗粒的机理仍不清楚。现有证据表明,稳定不含脂apo A-I的能量非常低,不能 维持两种构象之间的平衡(Atkinson和Small,1986;Rogers等,1998)。一种构象可 能是长螺旋棒,另一种可能是约一半长的螺旋性“发夹”结构。已知当apo A-I遇到 脂质膜时,稳定能量低和构象可变使其可被结构性识别,这促进了膜和蛋白质中发 生结构变化,从而产生不连续的脂蛋白颗粒(Rogers等,1998)。一旦这些颗粒形成, apo A-I仍可能经历特定的构象变化,从而影响到脂蛋白颗粒的动力学功能和与酶及 受体的相互反应。所有这些相互反应和变化都发生在蛋白-脂质介面上并有特定的拓 扑学构象,使关键残基暴露于表面。因此,几乎没有理由相信apo A-I自身可理想的 产生稳定的、纳米级大小的可控尺寸的磷脂双层结构。

已采用不同类型的脂质聚集体来重建和研究纯化的膜蛋白;这些脂质聚集体包 括膜分散体、去污剂微团和脂质体(图1)。供生化和物理研究的纯化系统需要稳定性, 但这不是这些系统所固有的,也不限于这些系统。脂质体是内部含水的封闭的球形 双层外壳。通过去污剂透析或其它方法重建脂质体时通常会导致蛋白质朝外和朝腔 内空间的随机取向。由于靶配体或蛋白质通常亲水或带电荷,如图1所示,因而它 们不能通过脂质体双层,尽管在一些情况下这是有利的。由于脂质双层的两侧不与 大部分溶剂接触,难于研究双层相对侧区域之间的耦合效果。脂质体亦倾向于聚集 和融合,且在长时间内或在某些物理操作下(如停止流动或剧烈混合时)通常不稳定。 通过孔径限定的圆柱形孔挤出而得到的脂质体的大小显示不均一的直径,在粒径分 布上具有多重分散性。

由于光散射、双层中膜蛋白的聚集以及热力学不稳定,脂质体可能难以维持 (Angrand等,1997;Savelli等,2000)。脂质体的表面积较大(105-1082)。为得到掺 入单一膜蛋白的脂质体,需要较大的脂质:蛋白质摩尔比。

去污剂微团通过与蛋白质的膜-包埋部分相互反应使膜蛋白溶解并易于使用。去 污剂微团是动态变化并经历结构波动,这促进了亚单位的解离并经常在处理蛋白质 稀释液时发生困难。然而,过量的去污剂微团对于维持蛋白质处于非聚集和溶解状 态是必需的。去污剂还可能引起变性并常常不能保持磷脂双层系统的性能。支持和 调节蛋白质结构和功能常常需要特定种类的磷脂(Tocanne等,1994)。因此,去污剂 溶解的膜蛋白质的结构、功能和稳定性可能产生问题。由于需要过量的去污剂微团, 蛋白质复合物可能解离,这取决于蛋白质浓度和去污剂和蛋白质的比例。相反,本 发明的MSP纳米结构在结构上更加坚固,与单室脂质体相比,它含有大小和组分不 连续的磷脂双层模拟结构域以及较高的稳定性和较小的表面积。圆盘状结构象去污 剂那样使得能够接触双层的两侧,并提供了像脂质体那样的双层结构。

此领域对能分散膜蛋白和其它疏水或部分疏水性蛋白质,从而保存那些蛋白质的 天然活性和性质的稳定而明确的组合物有长期的需要。蛋白质以外的化合物也可分 散在本发明的纳米级颗粒中。

                         发明概述

本文所用的膜支架蛋白(MSP)是一种人造两性蛋白质,它能与磷脂以及磷脂混合 物自身组装成纳米级膜双层。这些纳米级装配体的一个亚类是圆盘状的,称为纳米 圆盘结构。这些纳米级颗粒的直径可以是约5-500nm,约5-100nm或约5-20nm。这 些包含磷脂和MSP的结构保存了正常膜的整个双层结构,而且提供了磷脂和MSP 溶于溶液中并可被装配到或粘附到各种表面的一种系统。

具体的示范性MSP的基酸序列给出在SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:23、SEQ ID NO:29、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45和SEQ ID NOs:73-86、SEQ ID NO:91-99、SEQ ID NO:111、 SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO: 129、SEQ ID NO:131、SEQ ID NO:133和SEQ ID NO:135,以及(它们的)缺失N- 末端12氨基酸His标签或23氨基酸HisTEV标签部分的相应的序列。具有至多5个 氨基酸的保守性氨基酸取代、插入或删除的人造MSP的变体,或与示范性MSP序 列有70-100%氨基酸序列相同性的人造变体也包含在本发明范围之内。

本发明包括那些含有His标签和/或His标签TEV序列的MSP,以及那些经蛋白 水解切割或其它方式切割除去蛋白质该“标签”部分的MSP,这种MSP在N-末端 含有一个或多个衍生自蛋白酶识别序列的氨基酸,所述识别序列可以像本文表格中 列出的那样或带有功能性修饰(例如在P1’位置为Ser或Gly的TEV识别序列,如文 中所述)。还应理解,His TEV-MSP或其蛋白水解切割产物的P2’位置上允许某些氨 基酸取代;例如,P2′氨基酸可以是Ser、Gly、Thr、Ala、Asn、Lys或Met。具有这 种取代的MSP也包括在本发明范围之内。在某些实施方案中,可用天然产生的膜支 架蛋白,如载脂蛋白A-1、A-II、C-I、C-II、C-III或E、apolipophorin III,来代替本 发明的人造MSP(即,这种组合在本领域还未报道)。

重组制造人造MSP的方法也包括在本发明的范围之内。除了示范性的人造MSP 外,人造MSP的一级结构中也可包括其它螺旋结构域,例如衍生自Apo A-II、apo C-I、 apo C-II、apo C-III、apo E、apolipophorin III、肌红蛋白或血红蛋白的结构域。螺旋 构件(具体例子见表19)的数量和顺序可以改变,只要其保留形成纳米圆盘的自装配 功能即可。

本发明还提供了用MSP形成的纳米级磷脂双层结构或纳米圆盘来插入额外的疏 水或部分疏水性分子,包括疏水或部分疏水性蛋白质的用途。例如可用去污剂溶解 那些额外的蛋白质,并将溶解的蛋白质加入含或不含磷脂的MSP溶液,随着纳米级 颗粒的自装配,MSP和额外的“靶”蛋白被掺入形成稳定可溶的颗粒。随后,可通 过渗析或用离子交换树脂或大孔性聚合吸附珠如由苯乙烯二乙烯苯制成的Biobead 处理来除去去污剂。

可用来分散MSP、膜片段、纯化或部分纯化的疏水或部分疏水性蛋白质的膜或制 品的去污剂(或其它增溶剂)包括但不限于:胆酸、中和的胆酸、脱胆酸、脱氧胆酸 钠、正-十二烷基-β-D-麦芽苷、叔-辛基苯氧基聚乙氧基乙醇(Triton X-100,Union Carbide Chemicals and Plastics Co.,Inc.)、正-辛基-β-D-吡喃葡糖苷(辛基葡糖苷)、八 乙烯二醇单十二烷基醚(C12E8)、九乙烯二醇单十二烷基醚(C12E9)、Emulgen 913、 肉豆蔻酰硫代甜菜(myristoyl sulfobetaine)、二己酰磷脂酰胆碱、毛地黄皂苷和 JB3-14。也可使用Peptidetergent。也可利用高流体压力(从约200到约200,000大气 压)来溶解(溶剂化)疏水或部分疏水性蛋白质或其它分子。

可用于本发明的纳米圆盘装配法的磷脂包括但不限于:PC,磷脂酰胆碱;PE, 磷脂酰乙醇胺,PI,磷脂酰肌醇;DPPC,二棕榈酰磷脂酰胆碱;DMPC,二肉豆蔻 酰磷脂酰胆碱;POPC,1-棕榈酰-2-油酰-磷脂酰胆碱;DHPC,二己酰磷脂酰胆碱, 二棕榈酰磷脂酰乙醇胺,二棕榈酰磷脂酰肌醇;二肉豆蔻酰磷脂酰乙醇胺;二肉豆 蔻酰磷脂酰肌醇;二己酰磷脂酰乙醇胺;二己酰磷脂酰肌醇;1-棕榈酰-2-油酰-磷脂 酰乙醇胺;1-棕榈酰-2-油酰-磷脂酰肌醇。所述磷脂可含有丙三醇主链或者可包括鞘 脂。所述磷脂通常含有两个6-20个原子的饱和脂肪酸和一个常用的头基团(head group),例如但不限于:磷脂酰胆碱、磷脂酰乙醇胺和磷脂酰丝氨酸。头基团可以不 带电、带正电或负电或者是两性的。磷脂可以是天然的(自然界产生)或合成的(自然 界中不产生),或是天然和合成磷脂的混合物。MSP和总膜蛋白的理想摩尔比应能在 每个直径约10nm的圆盘状结构中产生约100-200个磷脂分子。那些在自然界中发现 的或与活的生物的各种膜结构结合的蛋白质可通过自装配过程溶解入MSP支持的纳 米双层或纳米圆盘中,从而在这些MSP支持的结构中保存了靶蛋白的天然结构和活 性。

除了纯化的或溶解的疏水或部分疏水性蛋白质外,结合到膜或膜片段或破裂的膜 上或内部的疏水或部分疏水性蛋白质也可与本发明的MSP一起装配,无需预先纯化 该靶蛋白。精通本领域的技术人员应该理解,具体磷脂的特性决定了它是否适合用 于具体的纳米圆盘;例如,DPPC的稠度如同凝胶,因此不适合某些用途。当将膜蛋 白掺入直接来自完整的或溶解的膜或膜片段的纳米圆盘时,相比MSP2优选使用 MSP1。

MSP支持的双层或纳米圆盘可以溶液形式使用或用于许多表面,这样可维持掺入 MSP支持的结构中的蛋白质的天然结构和配体结合、抗原决定簇和/或酶活性。例如, 可将MSP支持的结构附于金表面(例如用于表面胞质基因组共振术中)、附于多孔平 板或附于固体表面,所述固体表面包括但不限于珠、磁性颗粒、层析基质材料等。 可附着MSP的固体物质包括但不限于:金、、聚苯乙烯、石英二氧化硅、氧化 硅、氮化硅以及其它简单材料或复杂材料。当MSP保留有多组氨酸序列(His标签) 时,例如可将纳米圆盘结合到涂有镍-NTA的表面。也可通过一些技术将介导结合到 表面或促进纯化的其它寡肽标签融合到感兴趣的蛋白质,通常是N-或C-末端,这些 技术包括但不限于:strep-tag(Sigma-Genosys,The Woodlands,TX),它可介导结合 到链霉亲和物素或其衍生的streptactin(Sigma-Genosys);谷胱甘肽-S-转移酶基因融合 系统,它可介导结合到偶合在固体支持物上的谷胱甘肽(Amersham Pharmacia Biotech,Uppsala,Sweden);调蛋白-结合肽融合系统,它使得能用钙调蛋白树脂 来纯化(Stratagene,La Jolla,CA);以及麦芽糖结合蛋白融合系统,该系统能结合到 直链淀粉树脂(New England Biolabs,Beverly,MA)。

注意,His或其它标签不会干扰纳米圆盘颗粒螺旋结构域的形成并且能够介导其 装配,或不是螺旋形成或颗粒装配所必需的。通过对MSP的一级序列进行适当修饰 便可通过特异性的蛋白水解切割除去此聚组氨酸标记或其它标记,例如使用烟草蚀 纹病毒蛋白酶,其中在标签和MSP的第一螺旋结构域之间有同源识别序列。

本发明还涉及将与膜相关的或其它疏水或部分疏水性蛋白质(或其它疏水或部分 疏水性分子)掺入含有至少一种本发明的MSP的纳米级脂双层或纳米圆盘中的方法。 膜蛋白(外周、包埋或整合膜蛋白)可用于本发明的方法。这些可被掺入含有MSP的 纳米级颗粒的蛋白质可得自溶解的完整膜制品、完整细胞(天然或重组细胞)或来自破 裂的膜或膜片段,无需对膜蛋白进行预纯化或预分级,或者可在掺入之前对蛋白质 进行纯化(如果需要可经增溶处理)。

外周膜蛋白通过该蛋白质较小的部分与膜双层结合,其例子有各种来源的细胞色 素P450还原酶和细胞色素b5蛋白。

包埋的膜蛋白与脂双层的结合更加广泛,但其大部分通常与胞外环境或胞质接 触。包埋膜蛋白的例子包括但不限于膜结合的细胞色素P450常规类型,例如兔肝脏 微粒体的细胞色素P450 2B4、人肝脏微粒体的细胞色素P450 3A4以及昆虫微粒体的 细胞色素P450 6B1。

常规类型的整合膜蛋白例子包括膜双层中的螺旋区段,如7-螺旋跨膜蛋白,包 括但不限于盐生盐杆菌(Halobacterium halobium)的细菌视紫红质(bR)、人β-肾上腺素 能受体、人类的5-羟基色胺1A G蛋白偶联受体和人、植物、动物或其它来源的其它 G蛋白偶联蛋白受体。总之,整合膜蛋白至少有一部分延伸穿过脂双层。其它的例 子包括但不限于通道形成蛋白、转运蛋白、信号转导蛋白、细胞因子受体(例如肿瘤 坏死因子受体)、白细胞介素受体、Fas受体、CD27、CD40、CD30、胰岛素和胰岛 素家族受体、多巴胺受体、溶血磷脂酸受体、趋化因子受体如CXCR4和CCR5、多 巴胺受体以及生长因子受体(例如表皮生长因子和/或HGF受体)。这种蛋白质可有1 个至20个以上的穿过膜双层的结构域。可成功掺入本发明的纳米级颗粒的一次跨膜 蛋白质的例子是大肠杆菌(Escherichia coli)的天冬氨酸受体(Tar);可掺入纳米圆盘的 跨膜26次的蛋白质例子是大肠杆菌的转氢酶。使用本发明的MSP和方法已经成功 将各种类型膜蛋白的成员掺入该纳米级结构。特别地,可将细胞表面受体尤其是G 蛋白偶联受体,其中包括但不限于β-肾上腺素能、趋化因子和其它受体蛋白,掺入 用本发明的膜支架蛋白(MSP)形成的纳米双层双层结构中。当要将7-螺旋跨膜蛋白的 二聚体或更高寡聚体掺入纳米圆盘时,优选直径大于9nm的纳米圆盘,这种圆盘可 利用较长的MSP序列如MSP1E1、MSP1E2或MSP1E3形成。

本发明还提供了使用可提高自装配纳米颗粒的稳定性和单分散性的人造或天然 产生的MSP的材料和方法。G蛋白偶联受体(GPCR)是哺乳动物细胞膜上重要的多类 型的药物靶点,它们的功能是信号转导元件、结合各种类型的生物活性配体并将信 息传递到胞内。本发明的人造MSP可稳定并溶解GPCR的膜结合形式,从而使得能 在溶液中或在固体支持物上进行纯化或操作以用于流式细胞术、高通量筛选,在表 面进行纯化或操作以用于表面胞质基因组生物传感器和扫描探针技术以及其它分析 用途。本发明的纳米圆盘制造方法也可用来帮助纯化具有稳定的生物活性和可溶形 式的天然产生的或重组的膜蛋白。

本发明还包括将感兴趣的分子或离子吸附或结合到纳米圆盘内的蛋白质(或其它 分子)的方法,其中所述蛋白质(或其它分子)能以足够高的亲和力结合该感兴趣的化 合物或离子从而促进将该感兴趣的化合物或离子从含有它们的溶液中除去。纳米圆 盘技术的这种应用可用来除去污染物或用于分离或纯化过程。类似地,含有MSP和 磷脂的纳米圆盘可以相对非特异性的方式将疏水物质分配到纳米圆盘的磷脂部分 中,从而可用来分离溶液中的疏水物质。一个非限制性的例子是,亲脂性染料已显 示可在纳米圆盘的自装配过程中或通过将其从溶液分配到纳米圆盘的双层中而掺入 纳米圆盘内。

本发明还提供了一种纳米圆盘颗粒,其中感兴趣的蛋白质或糖类结合(共价或非 共价)到纳米圆盘外部的MSP上。或者可将糖类或蛋白质共价结合到烷或磷脂上, 然后将烷烃或磷脂掺入纳米圆盘中,从而使糖可接触外部含水环境。糖类也可以是 掺入纳米圆盘中的糖蛋白形式。这种带有糖的纳米圆盘可用来在体内或体外正调节 或负调节细胞应答。也可用来介导纳米圆盘定向到显示有凝集素或凝集素配体或者 受体或受体的配体的细胞或表面,这取决于纳米圆盘携带的糖类或其它分子的选择。 可共价或非共价结合到纳米圆盘的蛋白质包括但不限于:抗体或其抗原结合片段、 粘附素或其它能够结合到感兴趣的靶分子或细胞的蛋白质或糖蛋白。

本发明的另一方面是将疏水性治疗或美容分子掺入纳米圆盘的疏水核心。这种方 法可延长化合物的循环寿命并且可以延缓相对不溶和/或有毒的分子的释放。这种疏 水治疗剂包括但不限于光动力学治疗剂如补骨脂素、卟啉和酞花青苷(phthalacyanin)- 相关分子、他莫昔芬、紫杉醇,抗癌药如阿霉素、柔红霉素或多柔比星,降胆固醇 药,抗菌药如万古霉素,脂溶性维生素如D或E,以及抗真菌药如吡咯类(例如康 唑)或多烯类(例如两性霉素B)。掺入了这些化合物的纳米圆盘也包含在本发明的范 围之内。

可掺入纳米圆盘或结合于纳米圆盘(例如通过共价结合到MSP上)的其它分子包 括抗体、单克隆抗体、能够结合同源抗原的抗体片段、凝集素、激素、趋化因子、 淋巴因子、肽类、脂质、白蛋白、氨基糖和凝集素、核酸。本发明的纳米圆盘也可 用来稳定和输送能改进皮肤的外观或质地的亲脂性制剂,所述制剂包括但不限于维 生素A和/或E或视黄醇。通过施用或涂敷有效量的含有其中已经掺入了治疗或美容 活性成分的纳米圆盘颗粒的治疗或美容活性组合物来改善皮肤或治疗疾病的方法也 包括在本发明的范围之内。这种疏水性制剂可直接或通过与疏水性(亲脂性)小分子自 装配包装入纳米圆盘中。

本文所述药物(治疗剂)是例子,而不是以任何方式进行限制。疏水性抗炎剂包括 但不限于:已知的疏水性非甾类抗炎药以及已知的疏水性甾类抗炎药,已知的疏水 性非甾类抗炎药如水杨酸衍生物(阿司匹林)、对氨基苯酚衍生物(例如,对乙酰氨基 酚)、吲哚和茚醋酸(吲哚美辛)、杂芳基醋酸(酮咯酸)、芳基丙酸(布洛芬)、邻氨基苯 甲酸(甲芬那酸)、烯醇酸(昔康类)和烷基酮(alkanone)(丁美酮),已知的疏水性甾类 抗炎药可包括皮质类固醇(corticosteriod)以及与它们的相对糖皮质激素(代谢)和盐皮 质激素(调节电介质)活性有关的生物活性合成类似物。此外,可被掺入纳米圆盘的用 于治疗炎症的其它药物或抗炎剂包括但不限于自分泌拮抗剂如所有的组胺和缓激肽 受体拮抗剂、白三烯和前列腺素受体拮抗剂以及血小板活化因子受体拮抗剂。

微生物剂包括但不限于抗菌剂、抗病毒剂、抗真菌剂和抗原生动物剂。抗微生 物剂(抗生素)的非限制性例子是磺胺类药、三甲氧苄二氧嘧啶-磺胺甲唑、喹诺酮 类、青霉素类和头孢菌素类。抗真菌剂包括但不限于吡咯类,尤其是两性霉素B和 制霉菌素。也可将能有效抵抗原生动物的治疗性化合物类似地掺入纳米圆盘。这样 有利于其溶解、降低潜在毒性和控制释放。

抗肿瘤剂包括但不限于那些适合治疗可能存在于器官上或器官内的肿瘤如癌、肉 瘤、血癌,例如粘液瘤、脂肪瘤、乳头状弹力纤维瘤、横纹肌瘤、纤维瘤、血管瘤、 畸胎瘤、AV结节的间皮瘤、淋巴瘤以及转移到靶器官的肿瘤)的药物,包括癌症化疗 剂,本领域熟知的许多这种药剂,如阿霉素、柔红霉素、多柔比星、他莫昔芬和紫 杉醇。抗肿瘤剂也可包括肿瘤细胞的特异性抗体以及针对已结合的治疗性放射性核 素或其它治疗剂的抗体。

血管生成因子(例如可促进器官修复或建立生物旁路(biobypass)从而避免血栓形 成)包括但不限于碱性成纤维细胞生长因子、酸性成纤维细胞生长因子、血管内皮生 长因子、血管生成素、转化生长因子、肿瘤坏死因子、促血管生成素、血小板衍生 生长因子、胎盘生长因子、肝细胞生长因子和增殖蛋白。

溶解血栓(溶解)的药剂包括但不限于:尿激酶、纤溶酶原激活剂、尿激酶、 链激酶、α2-纤溶酶抑制剂的抑制剂以及纤溶酶原激活剂抑制剂-1的抑制剂、血管 紧张素转化酶(ACE)抑制剂、螺内酯、组织纤溶酶原激活剂(tPA)、白细胞介素1β- 转化酶的抑制剂、抗-凝血酶III等。

当靶器官是心脏时,可输送的药物例子包括但不限于:难溶于水的药物、生长因 子、血管生成剂、钙通道阻滞剂、抗高血压剂、正性肌力药、抗动脉粥样硬化剂、 抗凝血药、β-阻滞剂、抗-心律失常药、强心苷、抗炎药、抗生素、抗病毒剂等。 钙通道阻滞剂包括但不限于:二氢地平类,如硝苯地平,尼卡地平,尼莫地平等; 苯并噻氮卓类如dilitazem;苯烷基胺类,如维拉帕米;二芳基氨基丙胺醚类,如苄 普地尔;以及苯并咪唑(benzimidole)取代的四氢化萘类,如米贝拉地尔。抗高血压剂 包括但不限于利尿剂,包括噻嗪类如氢氯噻嗪(hydroclorothiazide)、呋塞米、螺内酯、 氨苯蝶啶和阿米洛利;抗肾上腺素能药,包括可乐定、胍那苄、胍法辛、甲基多巴、 曲美芬、利舍平、胍乙啶、胍那决尔、酚妥拉明、酚苄明、哌唑嗪、特拉唑嗪、多 沙唑嗪、心得安、methoprolol、纳多洛尔、阿替洛尔、噻吗洛尔、倍他洛尔、卡替洛 尔、吲哚洛尔、醋丁洛尔、拉贝洛尔;血管扩张药,包括hydralizine、米诺地尔、二 氮嗪、硝普盐;以及血管紧张素转化酶抑制剂,包括卡托普利、贝那普利、依那普 利、依那普利拉、福辛普利、赖诺普利、喹那普利、雷米普利;血管紧张素受体拮 抗剂,如氯沙坦;以及钙通道拮抗剂,包括nifedine、氨氯地平、非洛地平XL、isadipine、 尼卡地平、苯并噻氮卓类(例如地尔硫卓)和苯烷基胺类(例如维拉帕米)。抗凝血剂包 括但不限于肝素、华法林、水蛭素、壁虱抗凝肽、低分子量肝素(如依诺肝素、达特 肝素和阿地肝素)、噻氯匹定、达那肝素、阿加曲班、阿昔单抗和替罗非班。

抗心律失常药包括但不限于钠通道阻滞剂(例如利多卡因、普鲁卡因胺、恩卡尼、 flecanide等)、β肾上腺素能阻滞剂(例如普萘洛尔)、延长动作电位时程的药剂(例如 胺碘酮)和钙通道阻滞剂(例如钙通道阻滞剂(verpamil)、地尔硫卓、氯化镍等)。可以 用本发明的纳米圆盘输送心脏抑制药(例如利多卡因)、心脏兴奋剂(例如异丙肾上腺 素、多巴胺、去甲肾上腺素等)和多种心脏药剂的组合(例如用来治疗纤维化的地高辛 /奎尼丁)。

治疗充血性心力衰竭的药剂包括但不限于强心苷、正性肌力药、袢利尿剂、噻嗪 类利尿剂、离子节省利尿剂(potassium ion sparing diuretic)、血管紧张素转化酶抑制 剂、血管紧张素受体拮抗剂、硝基血管扩张剂、磷酸二酯酶抑制剂、直接血管扩张 剂(direct vasodilator)、肾上腺素能受体拮抗剂、钙通道阻滞剂和拟交感神经药。适合 治疗心肌病的药物包括但不限于多巴胺、肾上腺素、去甲肾上腺素和去氧肾上腺素。

同样合适的是能够防止或降低再狭窄发生的药剂,包括但不限于紫杉酚 (paclataxane)和相关化合物;以及抗有丝分裂剂。可被掺入的其它化合物包括维生素 A、D和E以及控制胆固醇的药物如斯特汀类。

可将小分子治疗剂掺入本发明的纳米级盘状颗粒中。所提供的重要优点包括:纳 米圆盘良好的血浆寿命、通过富含两性膜支架蛋白的纳米圆盘使部分疏水的化合物 具有可溶性以及通过对纳米圆盘的MSP或磷脂组分进行修饰可提供潜在的寻靶能 力。实施例15-18提供了使用两性霉素B、酮康唑和光动力剂的具体例子,但用相同 或类似的比例和方法也可掺入其它治疗分子。类似地,MSP的具体例子是MSP1T2, 但具有本文所述性能的其它MSP也适用。

治疗性纳米圆盘组合物宜以稳定的可溶性溶液维持;也可冻干纳米圆盘溶液,以 干粉形式储存。优选通过肠胃外途径给予需要的患者这种含在纳米圆盘内的特定的 治疗性化合物,肠胃外途径可包括静脉内、动脉内、肌内、真皮内、皮下或可与粘 膜表面接触的途径,例如通过气雾化(尤其是药物-纳米圆盘干粉制剂)以及鼻内或通 过下呼吸道系统吸入,其剂量应足以引起患者所需的反应。

本发明的纳米圆盘也用来稳定和输送改善皮肤外观和/或品质的亲脂性试剂,其中 包括但不限于维生素E或视黄醇。改善皮肤外观或治疗疾病的方法也包含在本发明 的范围之内。这种疏水试剂被直接或通过脂质和磷脂组分的自装配而包装入纳米圆 盘。宜局部给药,施加到需要改善的皮肤区域上的含有已经掺入美容活性成分的纳 米圆盘的组合物的量(以及频率)可有效改善需要这种改善的皮肤的外观。

本发明的范围包括纳米圆盘的应用,所述纳米圆盘带有疏水或部分疏水性抗原, 所述抗原可以是蛋白质、脂多糖、脂低聚糖或脂蛋白。这种纳米圆盘可用于免疫原 性组合物,例如作为疫苗组分。感兴趣的病毒蛋白质包括但不限于人免疫缺陷病毒 的gp120、单纯疱疹病毒或麻疹病毒的包膜糖蛋白、SARS病毒的“刺突(spike)”蛋 白、流感病毒或副流感病毒的血凝素配体。示例性的细菌性抗原包括但不限于细胞 表面蛋白如酿脓链球菌(Streptococcus pyogenes)的M6蛋白或M蛋白、牙龈卟啉单胞 菌(Porphryomonas gingivalis)的菌毛蛋白、单核细胞增生李斯特菌(Listeria monocytogenes)的InIB或ActA、小肠结肠炎耶尔森菌(Yersinia enterocolitica)的YadA、 弗氏志贺菌(Shigella flexneri)的IcsA、假结核耶尔森菌(Yersinia pseudotuberculosis)的 侵袭素、霍乱弧菌(Vibrio cholerae)的acf基因产物、含有炭疽杆菌(Bacillus anthracis) 聚-D-谷氨酸多肽的荚膜物质、金黄色葡萄球菌(Staphylococcus aureus)的血纤蛋白原/ 纤维蛋白结合蛋白、鼠疫耶尔森菌(Yersinia pestis)(尤其是EV76等疫苗株)或小肠结 肠炎耶尔森菌(Yersinia enterocolytica)或假结核耶尔森菌(Yersinia pseudotuberculosis) 的V和/或W抗原、以及空肠弯曲杆菌空肠亚种(Campylobacter jejeuni)的鞭毛蛋白或 孔蛋白。类似地,使用本文所述的蛋白质和方法也可将伤寒沙菌(Salmonella typhi)、 猪霍乱沙门菌(Salmonella choleraesuis)、肠炎沙门菌(Salmonella enteritidis)的O抗原 掺入纳米圆盘中。

本发明还提供了免疫原性组合物,所述组合物含有已经被掺入至少一种疏水或部 分疏水性抗原的纳米圆盘以及药学上可接受的运载体。可任选在该组合物中掺入佐 剂和/或免疫刺激剂,如趋化因子。所述纳米圆盘能够稳定和溶解疏水性抗原,同时 维持抗原的天然构象,并随着暴露于水环境的抗原亲水区域的呈现提高已经给予免 疫原性组合物的人或动物的免疫应答。

本发明纳米圆盘技术的另一个用途是用于医学或兽医装置的诊断和/或成像过程。 在这种用途中,寻靶剂被包埋如或结合到纳米圆盘,其结合位点可接触含水环境以 及被掺入纳米圆盘的成像化合物,所述成像化合物如染料、放射性核素或者荧光或 发光分子。如本领域所知晓的,对于带有合适显影剂的纳米圆盘有用的成像技术可 用于磁共振成像电子顺磁共振成像、光学成像和声波成像。寻靶剂的结合位点 是细菌表面抗原、肿瘤抗原特异性的或其它细胞表面或组织的特异性标记。该圆盘 能够从含有显影剂、MSP和靶特异性蛋白的含水混合物装配。为导入治疗药物,MSP 的抗原性宜呈中性,即在它所用于的人类或动物中应该不能引发的免疫应答。

含有抗原的纳米圆盘的其它用途包括检测试剂盒和用于检测生物样品中特定抗 原的特异性抗体的方法。可用该领域已知的方法检测结合到纳米圆盘结合抗原的抗 体。在生物样品中检测到抗体说明人或动物已经接触过感兴趣的抗原,这种方法通 常用来识别是否接触过病原体。生物样品可以是血液、血清、血浆或组织,尤其是 淋巴系统组织。

我们已经通过构建更加稳定、大小均匀的具有有用的功能基团的支架蛋白(MSP) 开发了用于结构、生化和药物方面的纳米圆盘。这些颗粒可包含标签以供纯化、与 表面结合以及例如在水凝胶中或在金生物传感器表面对圆盘进行物理操作,这种颗 粒可作为快速可重复性试验、基于溶液的NMR筛选和固态NMR结构研究的坚固物 体。在NMR应用中,纳米圆盘为感兴趣的蛋白质和其它疏水分子,尤其是用来研究 配体结合的受体蛋白,提供了稳定的单分散环境。例如,结合到纳米圆盘支持的受 体的化合物可显示出变宽的信号,因此+/-靶配体之间的差异性光谱可揭示所结合配 体的身份。此纳米颗粒和膜蛋白支架在生物技术、药物工业以及基础研究中都有用。 此外,通过我们的发现及相关技术披露的结构和功能原理将有助于在分子水平理解 蛋白质和脂双层之间的相互作用。

纳米圆盘可含有一种类型的功能蛋白,或者,当MSP和所得纳米圆盘较大时它 们可含有大分子装配体,例如细胞运动器(鞭毛或纤毛)、多组分生物反应器如多酶复 合体、能量转导复合体或光合复合体。当掺入大分子装配体时,包括细胞色素和还 原酶的组合,要用相对较大的MSP来制备纳米圆盘,例如可用MSP1E1、MSP1E2 或MSP1E3。当使用大于MSP1的MSP时,掺入较高摩尔比的脂质和MSP可改进结 果(从70∶1到140∶1,或从90∶1到115∶1)。

本发明还包括一个以上纳米圆盘相互结合形成的复合物。相比单个纳米圆盘颗 粒,这种复合物在人或动物中有较长的循环时间。颗粒的这种结合可通过静电相互 作用(螺旋的不同亲水性部分带有不同电荷)或者可通过二硫键共价结合,例如当亲水 性部分面对至少一些含有半胱氨酸残基的MSP螺旋时,或者可通过基因工程法构建 MSP融合构建物来构建它们。复合物中的颗粒可包含治疗性化合物、抗体或成像化 合物。例如,可将钆掺入纳米圆盘中,用于人局部缺血区的成像。

本发明还包括用于某些化学物质的脱毒和/或补救的组合物和方法,其中,将合适 的结合性蛋白或酶以其生物活性构象掺入纳米圆盘中。一个例子是细胞色素P450编 码序列,该序列编码能够氧化(和/或脱卤)至少一种卤代烃或轻质烃的蛋白质。其例 子包括但不限于三氯乙烷、二溴乙烷、氯仿、四氯化碳、苯乙烯、苯、1,2-二氯丙烷、 氯化乙烯、二氯甲烷、氯代甲烷、三氯乙烷、1,2-二氯乙烷、1,2-二氯丙烷、全氯已 烯、二氯乙烯、溴化乙烯、丙烯腈、碳酸乙烯(vinyl carbonate)、氨基甲酸乙酯、对乙 酰氨基酚和甲基叔丁基醚。将人细胞色素P450单独或与膜结合氧化还原传递伴侣一 起掺入纳米圆盘,圆盘中总的化学物质量以及同-和异-低聚反应状态是可控的,是对 制药工业目前用来对先导化合物和候选药物进行药物代谢的定量、药代动力学和代 谢物毒性研究的粗制膜制品的一个显著改进。在该实施例中,所述纳米圆盘可以溶 液形式使用或者可使它们共价或非共价结合到固体支持物上。

附图简述

图1显示了掺入膜蛋白的不同类型的脂质聚集物。小圈和三分别代表受体蛋白 质胞内域和胞外域的配体。

图2显示了α螺旋的轮状结构,安置的疏水和亲水的氨基酸侧链使此螺旋具有两 性性质。

图3显示了MSP支持的双层“环带”模型。矩形代表直径约1.5nm、螺旋长度 约3.9nm的单个螺旋。

图4A-4G显示了各种基因工程构建的MSP结构,显示以序列分析为基础的尖桩 围栏拓扑学形态和螺旋性排布。图4A:MSP1显示半重复序列所在位置。半重复序 列1根据分子动态模拟技术是无序的(Phillips,1997)。图4B:绞链区的移动。图4C: 除去半重复序列。图4D:绞链区替代螺旋3和4。图4E:MSP1序列串联加倍的MSP2。 图4F:除去半重复序列1制得MSP1D1。图4G:MSP1D1的串联重复形成MSP2D1。

图5A-5B图示了用于扩增人造MSP的PCR方法。

图6A-6B显示了有长接头(图6A)和短接头序列(图6B)的串联重复MSP2的图。

图7A-7B显示了掺入圆盘中和结合固体支持物的膜蛋白。图7A:在金铂上的圆 盘结合受体以及配体诱导的受体-靶复合物的装配。图7B:凝胶基质中的圆盘结合受 体。

图8显示了掺入由100%DPPC作为磷脂构成的10nm双层圆盘中的细胞色素 P4503A4的色谱图。

图9显示了样品1(用共表达细胞色素P4506B1和NADPH P450还原酶的细胞的 微粒体膜制备的纳米圆盘)的PAGE结果。样品2是从缺乏CYP6B1表达的微粒体制 备的。

图10提供了掺入纳米圆盘中的活性细胞色素P4506B1的特征光谱;特征峰出现 在450nm。这样的光谱说明了正确的硫醇盐血红素连接而没有证据说明可溶性膜双 层系统中存在无活性的细胞色素“P420”形式。

图11显示了通过Superdex分子大小分离柱分离样品的色谱图。保留时间说明 rHDL颗粒的大小为10nm。

图12显示了细胞色素P450还原酶和细胞色素P4506B1共掺入MSP纳米圆盘。 将456nm的吸光度(主要是还原酶)与420nm的吸光度(主要是P450)的比值作为保留 时间的函数绘图。约26分钟时的峰表明纳米圆盘群中同时含有还原酶和细胞色素。

图13显示了通过表面胞质基因组共振监测的含有羧基封端硫醇的DPPC纳米圆 盘与金表面的结合。

图14显示了通过自装配形成支持的纳米级脂双层(纳米圆盘)。含有靶膜蛋白的细 胞膜制品在存在膜支架蛋白(MSP)时用去污剂促溶(见下文)。通过透析或BiobeadsTM 除去去污剂后,形成了可溶性MSP支持的纳米圆盘,而靶蛋白掺入所得磷脂双层中。

图15显示了纳米圆盘混合物的单向SDS-PAGE结果。泳道1,低分子量标记。 泳道2(左),经遗传修饰能过度表达CYP6B1的昆虫细胞的Sf9昆虫细胞膜。55kDa 处的条带代表过度表达的靶膜结合蛋白。泳道2(右)显示了从过度表达CYP6B1的Sf9 昆虫细胞膜装配的纳米圆盘混合物。MSP1和CYP6B1电泳条带分别在分子量25kDa 和55kDa外。

图16A-16B显示了用MSP1制备并含有异源性表达的细胞色素P450、CYP6B1 的纳米圆盘的分子大小排阻层析结果。靶蛋白通过文中所述的简单的自装配过程掺 入纳米圆盘中。图16A:显示重建的颗粒大小分离的色谱图(SuperdexTM 200)。虚线 表示MSP不存在时膜样品的大小分离,表明存在高分子量的非特异性和非功能性聚 集体。图16B:含有CYP6B1片段的再次色谱图,证明了自装配的CYP6B1-双层结 构的均一性。

图17显示了所得可溶性纳米圆盘双层保存了起始膜制品的磷脂含量。直方条表 示测定的起始的膜或自装配的纳米圆盘的三种复制样品的磷脂类型。PC:磷脂酰胆 碱,PE:磷脂酰乙醇胺,PI:磷脂酰肌醇。

图18显示结合到与MSP1一起掺入纳米圆盘膜双层的CYP6B1的配体。采用高 通量平板阅读器,在递增加入环境呋喃香豆素花椒毒素(environmental furanocoumarin xanthotoxin)后在微滴定板中获得了特征性的“I型”结合光谱(吸光度约为417nm的 底物低自旋细胞色素降低,而吸光度约为390nm的高自旋组分相应升高)。计算出解 离常数约为30μM。

图19显示了各种MSP的磷脂:MSP的化学计量。H1螺旋结构域对于形成围绕纳 米圆盘的“环带”没有重要作用。我们发现,由MSP1构成的纳米圆盘以及那些由 缺少一半或全部H1的MSP构成的纳米圆盘大小相同且每个纳米圆盘中掺入的磷脂 分子的数目相同。

图20显示了用A-MSP1-DPPC;B-MSP1E1-DPPC;C-MSP1E2-DPPC;D-MSP1 E3-DPPC自装配的纳米圆盘的分子大小排阻层析的洗脱图。曲线E显示了一组校准 蛋白的洗脱图:1-血清白蛋白,2-牛肝过氧化氢酶,斯托克斯直径10.4nm;3-蛋 白,直径12.2nm 4-甲状腺球蛋白。

图21A显示了用含有酮康唑的纳米圆盘和含DMS 1%的酮康唑溶液抑制白色念 珠菌(Candida albicans)。“空”纳米圆盘没有抑制作用。图21B显示纳米圆盘缓冲液、 1%DMSO或少量酮康唑无生长抑制作用。

发明详述

说明书中使用的缩写包括A,Ala,丙氨酸;M,Met,甲硫氨酸;C,Cys,半胱氨酸; N,Asn,天冬酰胺;D,Asp,天冬氨酸;P,Pro,脯氨酸;E,Glu,谷氨酸;Q,Gln,谷氨酰胺; F,Phe,苯丙氨酸;R,Arg,精氨酸;G,Gly,甘氨酸;S,Ser,丝氨酸;H,His,组氨酸;T,Thr, 苏氨酸;I,Ile,异亮氨酸;V,Val,缬氨酸;K,Lys,赖氨酸;W,Try,色氨酸;L,Leu,亮氨酸; T,Tyr,酪氨酸;MSP,膜支架蛋白;DPPC,二棕榈酰磷脂酰胆碱;PC,磷脂酰胆碱;PS, 磷脂酰丝氨酸;BR,细菌视紫红质;apo A-I,载脂蛋白A-1;GABA,γ氨基丁酸; PACAP,垂体腺苷酸环化酶激活肽。

最简单的单细胞生物是由充满含水物质的中心区域和各种可溶性小分子和大分 子构成的。包围这一区域的是以双层结构排列的磷脂构成的膜。在更复杂的活细胞 中,内部区室和结构也被膜包裹。有许多蛋白质分子包埋在这些膜结构中或与其结 合,这些称为膜蛋白的蛋白质通常对决定细胞功能最为重要,这些功能包括信息和 能量的通讯和加工。研究膜蛋白遇到的最大问题是,磷脂双层的内侧是疏水性,膜 蛋白的包埋或锚定部分本身也是疏水性。在将这些膜蛋白从它们的天然膜环境分离 时,很难防止它们形成在生化研究通常用水环境中失活或不溶的聚集体。本发明提 供了产生可溶性纳米颗粒的方法,这种纳米颗粒自身是天然样的磷脂双层,双层中 可掺入感兴趣的疏水性蛋白(靶蛋白)以维持靶蛋白或较小的疏水分子成为可溶性和 均匀分散的实体状态。这可以利用本文所述的MSP通过在纳米级结构中掺入疏水性 蛋白(如膜蛋白)而实现。

增溶剂

在本发明文中,增溶剂可破坏导致疏水性和/或两性分子装配或聚集成三维结构的 疏水性相互作用。例如,可利用增溶剂如去污剂将疏水性蛋白质至于膜或膜片段中。 本文使用的去污剂包括但不限于胆酸盐、脱氧胆酸盐、1-棕榈酰-2-油酰-sn-甘油磷酸 胆酸盐、1-棕榈酰-2-油酰-sn-甘油磷酸丝氨酸、1-棕榈酰-2-油酰-sn-甘油磷酸乙醇胺、 CHAPS、正-十二烷基-β-D-麦芽糖苷、辛基-吡喃葡糖苷、Triton X-100、肉豆蔻酰硫 代甜菜碱、二己酰-磷脂酰胆碱、毛地黄皂苷、emulgen 913或JB3-14。也可使用 Peptidetergent;参见,例如,Schafmeister等,(1993)。

膜支架蛋白

本文所用的膜支架蛋白(MSP)可以是人造的(非天然产生的,自然界中不出现的, 即其氨基酸序列不同于任何天然产生的蛋白质)两性蛋白质,它可将磷脂和磷脂混合 物自身组装进纳米大小的膜双层中。这些纳米大小装配体的一个亚类是圆盘状的, 称为纳米圆盘或纳米圆盘状结构。理想的MSP包含若干螺旋结构域,每对螺旋结构 域由转折区分隔,转折区由1-5个不利于螺旋形成或趋向于终止相邻氨基酸形成螺旋 的氨基酸构成。示例性的螺旋区提供在表19中。这些构件也可按照与那些具体的例 子不同的顺序和数目组合,只要其能保持了自装配形成稳定的可溶性纳米级圆盘颗 粒的功能即可。类似地,这些示例性的构件可与其它蛋白质(如其它载脂蛋白、 apolipophorin等)的其它螺旋构件组合。MSP和磷脂的这些装配结构保留了天然膜的 全部双层结构,但提供了一种可溶性和可装配或附着于各种表面的系统。天然产生 的MSP的例子是人apo-A1。此外,可利用人脱辅基蛋白A-1之外的蛋白质的螺旋区 段来设计MSP,例如其它动物的apoA-1或者各种动物的apo C、apo E、肌红蛋白或 血红蛋白。可用合适的转折序列(punctuation sequence)将一种以上蛋白质的螺旋区段 相组合以形成具有本文所述有用性能的MSP。此外,可通过从头蛋白质设计产生功 能化MSP,其中可产生两性螺旋蛋白质结构的所需性状。还知道可在示例性序列中 进行保守性氨基酸取代,前提是必需保留自身结合功能。这种取代变体可称为示例 性序列的同源物。各种感兴趣蛋白质的描述见Bolanos-Garcia等,(2003)Progress in Biophys.Molec.Biol.83:47-68。

疏水或部分疏水性蛋白质,例如膜蛋白或膜片段可与这些颗粒相结合,从而使疏 水性的蛋白质或膜片段有效溶解成稳定的结构,保留了蛋白质的酶活性或配体结合 功能。类似地,也可将感兴趣的其它疏水或部分疏水性分子掺入本发明的纳米级盘 状颗粒中。

纳米圆盘颗粒在溶液中稳定或者可将它们固定于表面,有利地是它们可统一取向 固定在表面上。本文中,含有MSP的纳米颗粒(有或没有其它疏水或部分疏水性蛋白 质)的直径约为5-500nm,较好约为5-100nm,或者约5-20nm。直径约5-15nm的 纳米颗粒(圆盘)特别有用。

本领域技术人员也不难掌握如何设计MSP以包装疏水性过客化合物、蛋白质或 复合物,根据β片层推测其中MSP的两性构象,蛋白质的氨基酸序列被间隔开,从 而β片层形成部分的区域被可弯曲的氨基酸(绞链)区分隔开。β片层形成序列区域宜 含有约10-30个氨基酸,转折区含有3-10个氨基酸(此时MSP中存在反平行β片层) 或约10-30个氨基酸(此时β片层是平行的)的区域。

功能性MSP二级结构的结构域中可含有或不含转折区(punctuation)。转折区断了 蛋白质内的二级结构区。脯氨酸和/或甘氨酸残基是具有螺旋结构域的蛋白质的优选 转折区。除了可断具有特定特征二级结构的结构域外,转折区可为蛋白质结构提供 可屈曲性而形成绞链区,尤其是在2-3种氨基酸的情况下,转折区理想地包括脯氨酸、 甘氨酸和丙氨酸残基。转折区(或转折序列、绞链区或绞链序列)可包含1-30个氨基 酸,当二级结构结构域是α螺旋时宜包含1-2个氨基酸,并且当MSP中有反平行β 片层时宜包含5-30个,尤其是3-10个氨基酸。

融合的MSP之间的接头(转折、绞链)序列的必需性能是可屈曲性和溶解性,从而 使融合的蛋白可以类似于两个独立的MSP分子方式装配到颗粒中。接头序列由具有 这些性能的Gly-Gly-Gly-Ser/Thr-(SEQ ID NO:46)重复序列构成。在至少一些MSP中 还需要使接头的长度最小。我们用最小的接头序列-GT-构建了一种融合物,该序列与 如下所述Kpn I的共有DNA限制位点相对应。通过用Kpn I限制性酶切和插入编码 任何所需接头的双链合成性DNA,该Kpn I位点提供了一种插入任何所需接头序列 的简单途径(Robinson等,1998)。我们还用较长的接头序列-GTGGGSGGGT-(SEQ ID NO:15)制造了一种融合构建物。然而,带有最小接头的MSP2装配成了与含有两种 MSP1蛋白的颗粒非常类似的颗粒,但比由两种MSP1蛋白构成的颗粒更加稳定。我 们理解,对特定MSP的最佳选择取决于待装配的具体蛋白质。通常,含有较大蛋白 质或蛋白质复合物的装配体需要使用较大的MSP。

利用膜支架蛋白(MSP)为膜蛋白、尤其是G蛋白偶联受体(GPCR)为均一的生化 试验或结晶提供适合的环境的一个重要目标是得到均匀的颗粒制品。我们描述的构 建的膜支架蛋白包括但不限于:氨基末端可溶结构域已被除去的截短的人 apoA-1(MSP1)、一个或多个蛋白质区段被除去或插入的缺失或插入变体、MSP1或 缺失变体各自的随机重复(序列)以及在其中掺入了组氨酸标签的任何上述物质,当这 些膜支架蛋白在溶液中与磷脂自装配时主要形成直径8-10nm的颗粒。理想的是MSP 不含螺旋H1。然而,在与非最佳化学计量的MSP和磷脂装配时,也可能存在其它 大小的颗粒。虽然可用标准的分子大小分离层析法来纯化一种大小的颗粒,但宜使 靶蛋白、MSP和磷脂的最初重建混合物的粒度分布范围最小。通过适当选择膜支架 蛋白的长度可形成各种大小的构建的纳米圆盘。直径为8-10nm的颗粒通常包含两个 MSP蛋白。

载脂蛋白的序列

可通过因特网从国家生物技术信息中心(NCIB,The National Center for Biotechnology Information)、国立卫生研究院(National Institutes of Health)的站点上获 得一些载脂蛋白、血红蛋白和肌红蛋白的序列。这种编码序列可在因特网上找到用 于构建人造MSP编码序列,或者可将这些序列进行剪裁以优化在选择的重组宿主细 胞内的表达。本领域有很多关于密码子选择和非翻译序列的信息。载脂蛋白C序列 包括但不限于:牛的,XP 77416;小鼠的,AAH 28816;人的,NP 000032;和猴的, Q28995。肌红蛋白序列包括,例如,小鼠的,NP 038621;牛的,NP 776306;大鼠 的,NP 067599;以及人的,NP 005359。血红蛋白α链序列包括人的,AAH 32122 或NP 000549;β链序列包括人的,NP 000509或P02023;大鼠的,NP 150237;小 鼠的,NP032246;牛的,NP 776342,所有这些皆纳入本文作为参考。在NCBI站点 以及科学文献中还可找到其它序列。

本文中,两性和兼性以同义词使用指膜支架蛋白。两性蛋白质或蛋白质的两性螺 旋区同时具有疏水和亲水区。

MSP设计

本发明的MSP必需是两性的,其结构的一部分或多或少是亲水性朝向水溶剂, 另一部分或多或少是疏水性朝向将被稳定的疏水双层的中心。蛋白质的二级结构元 件可在三维空间中产生亲水和疏水区。查阅一些基础性生化文献发现两种候选蛋白 质结构:螺旋和片层具有这种所需两性特征。我们设计了本发明的MSP,它具有作 为基础的两性构件的α螺旋。每种MSP都具有可形成两性α-螺旋的氨基酸序列,螺 旋的一个面上有多个占优势的疏水残基(如A、C、F、G、I、L、M、V、W或Y), 螺旋的另一个面上有多个极性或带电荷的残基(如D、E、N、Q、S、T、H、K或R, 有时也会有C)。参见图2的示意图。此外,每个螺旋构件可以,但不一定,被脯氨 酸(P)或甘氨酸(G)周期性地中断,这样可通过中断螺旋的整个拓扑结构而在整个结构 中导入屈曲。一实施方案中,这些转折大约每20-25个氨基酸就出现一次从而形成“纽 结”或引起转角以利于MSP“缠绕”在圆盘状磷脂双层边缘的周围。转折区(或序列) 可含有1-10个氨基酸,当MSP中有反平行β片层时尤其可含有3-10个氨基酸。参 见图2,它描述了通用的线性氨基酸序列和螺旋形轮状图,显示了此螺旋一个面上占 优势的疏水性氨基酸的位置。

我们通过设计用短接头序列连接的串联重复性MSP1制得了一种额外的人造 MSP变体(MSP2),产生了一种新的分子。这种人造MSP称为串联重复性MSP。参 见图4G和SEQ ID NO:17。在细菌表达系统中生产了较大量(每升细胞培养物有几十 毫克)的本发明人造MSP。我们的构建物减少了可能形成的大小等级的数目(与三种 MSP1分子相对应)。串联重复性膜支架蛋白本文用于指膜支架的至少4个螺旋在新 的膜支架蛋白中以线性顺序重复(例如,H1-H2-H3-H4-H5-H6-H7-H8-间隔区 -H1-H2-H3-H4-H5-H6-H7-H8)。串联重复性MSP的例子见图4E和4G。也可见SEQ ID NO:17和SEQ ID NO:19。

至少在一些情况下,与采用某些其它MSP结构制成的纳米圆盘相比,用串联的 (2个)MSP1重复序列制成的纳米圆盘较大,但不太稳定。设计缺少至少一个H1拷贝 的MSP能够制造稳定且尺寸较大的纳米圆盘。具体地说,缺少二聚结构第二半中的 第一个螺旋对于改进结果有重要作用。

MSP2串联重复支架蛋白的整个的氨基酸和核酸序列显示在表7和8中;也可以 参见SEQ ID NO:16和SEQ ID NO:17。使MSP2融合蛋白在大肠杆菌中表达并用与 单个MSP所述基本同样的方法纯化至均一。MSP2蛋白作为有效的支架蛋白,在去 除增溶去污剂时可与磷脂自身组装。与通常10nm颗粒相对应的脂质/二聚体比率为 200时,MSP2蛋白提供了好得多的均匀分散性。重要的是,如通过化学诱导解折叠 并使色氨酸残基暴露于溶剂监测那样,这些圆盘的整体稳定性并未由于单体膜支架 蛋白的融合而改变。

我们还制备了下述两种新的膜支架蛋白二聚体并使它们与磷脂自装配。通过小角 度x射线散射测定的所得纳米圆盘的整体斯托克斯直径约为15.5nm,这与计算出的 约17nm的整体物理直径相符。这是迄今为止构建出的最大纳米圆盘。这些新的串 联重复性MSP的模块序列(也可见表19)如下:

MSP2N2:HisTev-H1/2-H2-H3-H4-H5-H6-H7-H8-H9-H10-GT-H2-H3-H4-H5-H6-H7-H8 -H9-H10

MSP2N3:HisTev-H1/2-H2-H3-H4-H5-H6-H7-H8-H9-H10-GTREQLG-H2-H3-H4-H5-H 6-H7-H8-H9-H 10

也已制备并鉴定了其它MSP。我们优化了自装配条件用MSP1E1、MSP1E2和 MSP1E3获得了均匀分散的纳米颗粒,显示蛋白质的长度是颗粒直径的决定因素,测 量了这些颗粒中脂质/蛋白质比例的化学计量并证实了用高于或低于融点的脂质 (POPC为270K,DPPC为314K)的形成颗粒之间的结构差异。我们还制备了一系列 缺失突变的膜支架蛋白,其中,1/4、1/2或整个第一个螺旋(残基44-65)被删除。用 该截短的蛋白质形成的纳米圆盘进行实验表明,第一个螺旋不是这些纳米圆盘自装 配所必需的。据信,这一观察结果可用来解释早期关于用apo A-1形成的盘状颗粒的 大小及其不均一性的争论。由不同大小支架蛋白形成的这些纳米圆盘的SAXS数据 与图19所示的结构模型相一致。图19还显示H1对于在纳米圆盘外侧周围形成“环 带”没有重要作用。

为在双层结构周围形成较小的环带,可减少螺旋构件的总长度,并可更加频繁地 加入转折。可改变设计的线形序列中疏水氨基酸的位置和数目从而改变该精确的氨 基酸序列。可产生其中的螺旋轴与纳米圆盘双层的正常螺旋轴平行或反平行的简单 模型。MSP含有约12-20个或更多具有这种普遍两性序列的重复单元。为产生直径 约为10nm的圆盘,MSP含有约12-20个或更多个具有这种通用两性序列的重复单元。 优选此蛋白质由长度14-25个氨基酸之间的两性α螺旋构成,线性序列中插有不利于 形成螺旋的残基,如脯氨酸或甘氨酸或者不利于螺旋形成的约1-5个氨基酸的序列, 从而形成能稳定磷脂双层疏水核心的小螺旋构件。约20-25个氨基酸(本申请书中的 螺旋构件)的螺旋的高度相当于膜双层的厚度。这些小的螺旋区段通过约0-5个氨基 酸残基(尤其是G或P)连接在一起(转折处)。为覆盖的“环带”模型中的10nm圆盘 状颗粒的边缘,需要10-20个这种螺旋,根据图3简单的图解分析16个是有用的数 目。理想的是,螺旋中每个转角含有约3-18个氨基酸,螺旋的类型可以是α、π或 3,10螺旋。螺旋的每个转角有3-16、3-8、理想为3-4个氨基酸。本发明的MSP可 含有50-400个转角。用本领域已有的程序可完成二级结构预测;参见,例如,Swiss Institute of Bioinformatics在因特网上提供的ExPASy蛋白质组学服务器。预测二级结 构的指南也可在出版物上找到,如Chou等,(1974)Biochemistry 13:211,222;Chou 等,(1978)Ann.Rev Biochem.47:251-278;Fasman(1987)Biopolymers 26(增刊): S59-S79。当存在某蛋白质的二聚体或更高聚合体如7-TM膜蛋白或当一个以上的蛋 白质例如还原酶和细胞色素被掺入单个纳米圆盘时,所用的MSP必需能够形成直径 大于9-10nm的纳米圆盘颗粒。较大的纳米圆盘是用较长的MSP序列如MSP1E1、 MSP1E2或MSP1E3制备的。

另一实施方案中,构建的两性MSP在三维空间中含有二级结构区域,例如平行 或反平行的β片层,并具有适当长度的间隔区以使疏水区与受到保护避免接触含水 环境的靶疏水性靶分子结合从而使其稳定并溶解。

某些控制细胞功能的关键系统位于膜区室内。这些膜蛋白装配体中的许多都代表 了由于通常需要特定的磷脂环境以维持最佳酶翻转或配体结合活性而通常难以以可 溶性和活性形式分离的重要的药物靶分子。一些药理学上重要的例子指出各种酶和 受体需要特定的磷脂,通常用来溶解膜蛋白的去污剂会破坏这种受体。例子包括人 3-肾上腺素能受体,它需要中性脂质才能有效诱导激素的受体应答(Kirolovsky等, 1985),以及人细胞色素P450单加氧酶(P450)超家族,它需要几种类型磷脂才能进行 有效的药物代谢(Imaoka等,1992)。无法真实重现纯化系统中去污剂促溶蛋白质的脂 质要求可能会影响这些酶活性的测定,且经常是这样。

一种最为广泛采用的用于特征分析这些天然蛋白质性质的替代品包括天然细胞 膜的亚组分可将其掺入微米大小的脂质体中。然而,脂质体的缺点是热力学不稳定 性、大小不均匀且靶膜蛋白会被留在双层接触不到溶剂的一侧(Angrand等,1997; Savelli等,2000)。获得大量装配在磷脂双层内的可溶的功能性膜蛋白的其它简便方 法也已经存在,我们认为其结果是许多在细胞膜内发挥功能的蛋白质复合物受到抑 制。在本申请中,我们报告了一种将异源表达的或天然的膜蛋白区室划分成稳定、 可溶性纳米级双层结构的快速方法,这种双层结构特征是具有足够的靶分子稳定性、 生物活性和足够牢固可经受高通量分析。

本发明的MSP可用来溶解纳米级结构中的外周、包埋或整合膜蛋白。外周膜蛋 白主要由一种相对可溶的位于双层外部的球形结构域和一种将这种简单的球形结构 域锚到膜双层的相对简单的结构(例如,单跨膜或膜插入结构域)构成。球形结构域在 自然状态下可位于胞外或朝向胞质。

外周膜蛋白的例子有NADPH-细胞色素P450还原酶(例如,来自大鼠肝脏内质网 或来自昆虫)和细胞色素b5。NADPH-细胞色素P450还原酶是内质网中发现的膜蛋 白。它催化嘧啶核苷酸脱水和电子向膜结合细胞色素P450转移。在人类、植物、其 它哺乳动物、昆虫等中发现了类似结构的同工酶。

细胞色素b5是一种膜锚定(外周)的血红素蛋白,它有一个穿入膜双层的膜锚定结 构域。在没有去污剂时,溶解自其天然膜的细胞色素b5以大型聚集物存在,在天然 聚丙烯酰胺凝胶电泳(PAGE)上看起来像污点而不是分离的条带。纳米圆盘可通过采 用我们发明所说的MSP通过自身组装过程形成,其中细胞色素b5被加到MSP和磷 脂的制品中,导致细胞色素b5被掺入到圆盘状结构中。含有细胞色素b5的圆盘复 合体可通过层析分离并纯化除去不需要的聚集物质。纯化物质的血红素生色团的光 吸收特性显示,血红素活性位点在天然构象中。外周膜蛋白也可在圆盘形成过程中 被掺入纳米圆盘,或者它们可与预先形成的纳米圆盘相关联。

这里定义的包埋膜蛋白包括多肽的膜锚定区段,但在蛋白质表面也可按疏水氨基 酸分组,其疏水结构域被包埋在脂双层中。包埋膜蛋白的例子包括但不限于干扰素 受体超家族、神经生长因子/肿瘤和坏死因子受体超家族以及细胞色素P450蛋白。

组织因子(TF)或促凝血酶原激酶是一种30,000Da的I-型外周膜蛋白,是引发血 液凝固级联反应的关键性因子。这种膜结合蛋白作为因子VII的活化辅因子起作用, 可溶性丝氨酸蛋白酶执行血液凝固的第一个催化步骤。组织因子的表达局限于不与 血浆直接接触形成“止血性包膜”的细胞。TF:VII复合物必需在膜表面装配才显示 高活性,只有当膜含有带有负电荷头部基团的磷脂时其才有最佳活性。

另一种已掺入纳米圆盘的整合膜蛋白是细菌的天冬氨酸受体。在大肠杆菌和沙门 氏菌属(Salmonella)中,趋化受体Tsr和Tar可通过立体特异性结合这些氨基酸分别介 导对丝氨酸和天冬氨酸的趋向性。在大肠杆菌中,Tar受体蛋白通过识别具有配体的 可溶性麦芽糖-结合蛋白介导了对麦芽糖的趋向性。含有过度表达Tar蛋白的大肠杆 菌(由Gerald Hazelbauer提供,University of Missouri,Columbia,MO)膜可用CHAPS 去污剂溶解而与支架蛋白MSP1T2混合。通过吸附除去去污剂(如以下所述用Biobead 处理)。将Tar受体掺入纳米圆盘中,然后用Ni亲和柱层析纯化并用HPLC尺寸排阻 色谱分析。通过SDS PAGE证实了靶分子的掺入。

包埋的细胞色素P450膜蛋白的例子包括但不限于来自兔肝脏微粒体的细胞色素 P4502B4、来自人肝脏微粒体的细胞色素P4503A4、来自昆虫脂肪体的细胞色素P450 6B1以及来自植物的细胞色素P45086A1、73A5和86A8。细胞色素P450是见于所 有形式生命体中的一种酶超家族。许多P450的一个作用是脱毒生物异源物质;例如, 人肝脏P450可解毒大多数内源和外源化合物,这些酶决定了所有摄取药物的平均血 浆寿命。另一种研究得最广泛的人肝脏细胞色素P450是细胞色素P4503A4(CYP 3A4)。这种膜结合P450是人肝脏中表达最高的P450,它负责分解代谢所有药物的 几乎50%(Guengerich,F.P.,Cytochrome P450.Cytochrome P450,P.R.Ortiz de Montellano 编,1995,New York:Plenum Press.473-535)。为证明纳米圆盘技术在研究细胞色素 P450中的应用,我们将CYP 3A4掺入MSP支持的纳米级双层圆盘中。来自尺寸分 离色谱和PAGE分析的进一步的证据支持CYP 3A4掺入纳米圆盘的结论。

细胞色素P4506B1(CYP 6B1)是大细胞色素P450单加氧蛋白质超家族的一个成 员,它是包埋膜蛋白的另一个例子。已经从Papilio polyxenes[专门用能产生对大多数 生物都有光毒性的植物代谢物呋喃香豆素的植株喂养的黑色燕尾(black swallowtail)] 中分离了CYP 6B1。据认为CYP 6B1是通过环氧化反应催化呋喃香豆素的脱毒作用 (Ma等,(1994))。

整合膜蛋白具有在膜双层内占有时的和关键性的结构区域。或者,在双层两侧可 以有较大可溶性结构域,这些结构域可通过一级序列一次或多次穿过疏水双层核心 而相连,尤其是细胞因子型的分子和受体,它们具有简单的一次通过连接但在双层 两侧都有可溶性结构域。文中,整合膜蛋白是例子有在膜双层中有一个或多个螺旋 区段的常规类型的蛋白质,包括但不限于熟知的7螺旋跨膜蛋白(例如GPCR)。

我们已经证明MSP1、MSP2、MSP1E1、MSP1E2、MSP1E3和MSP2可与细菌 视紫红质装配。从最初的重建混合物开始,在不加入磷脂与MSP1或MSP2形成颗 粒时观察到两种含有细菌视紫红质的物质。MSP是细菌视紫红质溶解形成这些物质 所绝对需要的,因为形成的混合物中没有MSP会导致大的非特异性细菌视紫红质聚 集体,它在凝胶过滤柱的空体积处洗脱下来。当MSP存在时绝大多数细菌视紫红质 呈溶解状态。

作为溶解疏水或部分疏水性“靶”蛋白的一种方法,本发明的含有MSP的纳 米颗粒的一个特别有价值的优点是掺入纳米颗粒中的蛋白质保留了天然形式。保留 了天然靶蛋白的构象,保留了天然靶蛋白-膜之间的相互作用和拓扑结构,靶蛋白保 持在类似天然的环境中,从而提高了靶蛋白抵抗失活和变性的稳定性,保留了靶蛋 白与膜有关的拓扑结构。保留靶蛋白与膜有关的拓扑结构对于筛选细胞-细胞或细胞- 病毒相互作用的靶点、引发配体或抗体与靶蛋白的膜外区域结合或通过特定通行途 径输送靶蛋白尤其重要。

膜和膜片段的掺入

我们已证明可将含有膜蛋白和脂质的天然组合的膜或膜片段掺入含有MSP的纳 米圆盘中。无需预先纯化或溶解膜蛋白群便可直接掺入。一个特别重要的实施方案 是将这种技术用于各种常用的膜蛋白异源表达系统。这些系统包括但不限于昆虫细 胞,酵母细胞,哺乳动物细胞如HEK细胞、Vero细胞和CHO细胞,以及细菌细胞。 也可使用含有抗原性蛋白质或其它分子的多拷贝的病毒包膜蛋白或病原体(例如细菌) 的细胞膜。一个具体的示例性实施方案是使用常见的昆虫细胞-杆状病毒表达系统。 我们采用了市售的共转染的Sf9昆虫细胞系来制备含有过度表达的昆虫CYP 6B1和 过度表达的昆虫NADPH细胞色素P450还原酶的微粒体制品。因此,我们不仅证明 了MSP纳米圆盘可用来将另一种细胞色素P450系统掺入可溶性均匀分散的颗粒中, 还证明这种P450的来源可以是用携带有克隆的CYP6B1基因的杆状病毒感染的Sf9 细胞系的整个膜。

用本文所述方法产生的纳米圆盘含有最初的天然膜原料的脂肪酸和磷脂,从而提 供了可用来检测感兴趣的膜结合酶或受体的可靠的体外环境。因此,MSP支持的纳 米圆盘可用于高通量筛选,比如采用例如肽、蛋白质或化学物质的组合文库来鉴定 膜结合蛋白的配体,以及用来鉴定新的药物。此外,掺入纳米圆盘的简单过程可用 来产生用x-射线晶体学或NMR光谱测定结构的样品。作为溶解膜蛋白的另一种方 法,这种纳米圆盘系统的一个特别优点是由于显著降低了颗粒的光散射从而提高了 光学测定的敏感性。本发明的方法可扩大用于含有感兴趣靶蛋白的其它来源的膜片 段,如扩大到酵母、昆虫、细菌或哺乳动物细胞培养系统或表达系统。

高通量筛选

本发明纳米圆盘技术的一个重要应用是高通量筛选酶或配体的结合活性。在许多 此类系统中,将一种以上的靶膜蛋白掺入到纳米圆盘中是有利的,例如,将P450单 加氧酶催化所需的电子转移伴侣或掺入G蛋白偶联受体的相应的G蛋白掺入纳米圆 盘。

为证明MSP纳米圆盘技术在这些情况下的用途,我们在纳米圆盘中成功的掺入 了NADPH细胞色素P450还原酶和细胞色素P4506B1。如本文所证明的那样,每种 靶膜蛋白都可以用MSP个别掺入纳米圆盘中,或者可将它们组合掺入。细胞色素 P450与还原酶的内源性相对量是每分子还原酶约10-20个P450分子(Feyereisen,R. (1999)Annual Review of Entomology 44,501-533)。为在重建入圆盘后得到CYP 6B1 的活性,可在重建混合物中加入过量的还原酶

已将BR(一种整合膜蛋白)如本文以下所述掺入到MSP纳米圆盘中,我们还采用 了市售的昆虫细胞表达系统,它提供了带有5-HT-1A(血清素)人受体的G-蛋白偶联膜 片段。5-HT-1A掺入纳米圆盘中所显示的配体结合活性证明这种蛋白质在本发明的纳 米圆盘中处于活性构象。随后的实验显示,β-2肾上腺素能受体、多巴胺D2和D1 受体以及细胞因子受体CXCR4和CCR5都属于7-跨膜蛋白家族,用本发明的方法可 容易地将G蛋白偶联的受体类型掺入到纳米圆盘中。

已成功掺入纳米圆盘的膜蛋白和膜蛋白复合物的其它例子包括大鼠、昆虫和植物 的细胞色素P450还原酶、细菌视紫红质三聚体、光合反应中心复合体(center complex)、有26个跨膜结构域的大肠杆菌转氢酶和整联蛋白。

蛋白质和脂质的化学计量是与所有MSP形成单分散性圆盘的一个重要因素。许 多MSP显示脂质/蛋白质有个最佳比例,该比例是定量装配成单分散性盘状颗粒的决 定因素。此外,由于已知圆柱形脂双层被支架蛋白环绕的圆盘状结构的拓扑结构(图 19),所以该化学计量比值是由MSP长度决定的,其长度确定了脂质/蛋白质比例。 如图19所示计算了不同大小圆盘的脂质/蛋白质化学计量比值并通过实验进行了验 证。脂质的浓度是采用具有相同化学结构的氘标记脂质并对柱组分进行闪烁技术来 测量的,如Bayburt等所述,2002,同上。支架蛋白的浓度是通过分光光度法确定的 (Jones等,(1990)J.Biol.Chem.274:22123-22129),使用根据Pace等(1995,Protein Science 4:2411-2423)所述的Gill-von Hippel改进方法计算出的已知氨基酸序列的摩 尔消光系数。用校准的Superdex 200(大小排阻色谱)柱通过HPLC(Millenium System, Waters,Milord,MA)分离已经装配的脂质-蛋白质颗粒后对狭窄的组分进行所有测定。

在295K的室温下在样品距离2D检测器1500mm的真空室中以15keV(波长 0.826A)的光子能量测量小角度X射线散射(SAXS)。将纳米圆盘溶液密封在直径为 1.5mm的玻璃毛细管中,并与标准物(calibrant)(山嵛酸,间隔58.38)和参考缓冲 溶剂一起放在样品室的支架上。原始数据用FIT2D程序(Hammersley,A.P.(1998)ESRF Internal Report,ESRF98HA01T,FITD2D V9.129 Reference Manual V3.1;Hammersley 等,(1996)High Pressure Research 14:235-248)处理以得到1g(I/I0)vs.Q=4πsin(q)/2 形式的散射曲线。用CRYSOL程序(Svergun等,(1995)J.Appl.Cryst.28:768-773)以 及用MATLAB(MathWorks,Natick,MA)编写的本机建模和拟合例程分析SAXS数 据。拟合程序根据Debye公式和模拟了不同对比度的球形珠紧密填装成的纳米颗粒, 如CRYSOL、DUMMIN、SAXS3D和DALAI GA等其它常用程序那样进行,见 Takahasi等,(2003)J.Appl.Cryst.36:549-552;Koch等,(2003)Quart.Rev.Biophys.36: 147-227的综述。利用该论文所描述的其它方法获得的纳米圆盘的大小和组成信息构 建拟合模型。为代表相应相的每个珠指定了最初估计的散射差,即水的电子密度 (0.334e/-3)与双层中心部分、脂质酰基链、脂质极性头部基团(Wiener等,(1989) Biophys.J.55:315-325)和围绕颗粒的支架蛋白(Svergun等,(1998)Proc.Natl.Acad. Sci.USA 95:2267-2272)中亚甲基的平均电子密度之间的差值。用5个参数、4种电子 密度以及圆盘半径拟合每种类型纳米圆盘的实验曲线。在拟合中未试图引入大小或 形状的不均一性。模拟5%之内的这种不均一性(如其它实验数据提出的那样)不会使 计算出的散射曲线产生大的变异,大小和形状更加显著的差异导致散射曲线上观察 到的特征丧失并得到相当差的拟合。

已经构建了MSP以使盘状磷脂双层实体的结构变应性最小,提供较大的结构稳 定性和提高圆盘结构的大小均一性,以及掺入有用的官能度,例如用来对圆盘进行 纯化和物理操作的肽标签。这种可被融合到感兴趣的蛋白质上的寡肽标签(通过分子 生物学或化学方法)包括但不限于strep-tag(Sigma-Genosys,The Woodlands,TX),该 标签指导结合链霉抗生物素蛋白或其衍生物streptactin(Sigma-Genosys);谷胱甘肽-S- 转移酶基因融合系统,它指导结合偶合到固体支持物的谷胱甘肽(Amersham Pharmacia Biotech,Uppsala,Sweden);钙调蛋白结合肽融合系统,该系统允许用钙 调蛋白树脂(Stratagene,La Jolla,CA)进行纯化;麦芽糖结合蛋白融合系统,该系统 允许结合直链淀粉树脂(New England Biolabs,Beverly,MA);以及寡聚组氨酸融合 肽系统,该系统允许用Ni2+-NTA柱(Qiagen,Valencia,CA)进行纯化。

圆盘均一性是将单一的膜蛋白或单一的膜蛋白复合物掺入一种尺寸的圆盘中所 必需的。亲代分子,apoA-I,具有稳定圆盘结构的功能(Forte等,1971;Holvoet等, 1995;Fidge,1999)。这些功能域不是必需的且在本发明的人造双层系统中通常是有害 的。

二级结构的预测提供了估计支架蛋白结构特征的方法。apoA-1结构主要由螺旋构 成,有时可被重复序列中的脯氨酸或甘氨酸残基断开。据认为8-9个α螺旋与圆盘状 形式中的脂质结合。预计apoA-I的N-末端“GLOB”区域(SEQ ID NO:89)更具球状 特征。除去该分子的这一部分以产生设计的MSP1。可产生具有高度单分散性的圆盘 状装配体的MSP是需要的。为确定半重复的作用以及为进一步表征和优化MSP的 结构和功能,采用诱变来产生下文所述的变体。见下面的表2-21。

掺入MSP圆盘的疏水或部分疏水性受体可用于结构、生化和药物研究。膜蛋白 研究目前局限在不可溶膜的分散、去污剂微团和脂质体。生化和物理研究的纯化系 统需要稳定性,这可用或不用去污剂来实现。去污剂微团是动态的并经历结构波动, 这促进了亚单位的解离并给处理稀释液中的蛋白质带来了困难。MSP纳米双层(纳米 圆盘)在结构上更加坚固,与单室脂质体相比,它具有大小和成分不连续的磷脂双层 模拟区域以及较高的稳定性和较小的表面积。4℃时,本发明颗粒的大小、构象和生 物学活性至少可稳定一个月。

表面技术

当将本发明的MSP配制成圆盘时,可用于在表面技术(如供高通量筛选的生物传 感器芯片)或固相测定技术中分析,包括但不限于用例如聚苯乙烯制造的多孔平板。 当MSP包含His标签时,可使纳米圆盘结合于固定的金属,如二价镍阳离子。我们 关于圆盘支架的工作还涉及表面结合的装配体。

例如,表面胞质基因组共振(SPR)生物传感器在光学元件上采用了大约50nm厚的 金箔以使表面胞质基因组与金箔表面的电介质组分(样品)偶联。通过基因工程将半胱 氨酸构建入MSP中,可以使MSP稳定的双层结合于该表面,用作含蛋白质或其它 感兴趣靶分子的仿生层(图7A)。采用硫醇使分子结合于金表面是熟知的。以环带模 型为基础,半胱氨酸可以沿着两性螺旋轴线的极性侧安置,只要半胱氨酸残基不放 在螺旋-螺旋界面上。当如此工程改造MSP时,多个半胱氨酸残基可形成二硫键连接 的二聚体(Segrest等,1999)。或者在可弯曲的N-或C-封端接头中引入半胱氨酸。理 论上,这种结构能够使圆盘的环带形式(或尖桩围栏形式)与金表面结合。或者,可以 在双层区域中掺入硫醇酯。同样,利用层状结构间光学折射率差异的方法,如总的 内反射谱、共振镜、在光学表面设计的衍射光栅等也同样可直接外推使用。除了SPR, 金表面结合的圆盘可用于STM和电化学研究,例如,与膜结合的氧还蛋白(如细胞色 素P450及其黄素蛋白)以及离子通道的研究。

用电介质(如通常用作SPR基质的金属膜的二氧化硅)薄膜进行测定也可以获得 SPR数据。此技术的这一变化称为偶联的胞质基因组波导管谐振(CPWR)(Salamon等, 1997a)。因为二氧化硅在这些胞质基因组谐振实验中可用作活性表面,可采取用于在 云母或其它氧化硅表面产生活性表面的方法来制备自身组装的双层。这有着额外的 优点,能使SPR实验所用的条件直接与AFM实验所用的条件相比。简单地在用于 SPR光谱学的金属膜载片上加入二氧化硅涂层就可以在我们的SPR装置上容易的进 行CPWR技术。

也可利用化学反应基团或亲和标签特异性标记带有可利用半胱氨酸基团的MSP, 将其固定在凝胶矩阵中。带有反应性偶联基团的水凝胶可用于固定蛋白质以供SPR 测定。在水凝胶构型中,该圆盘可作为以均匀分散形式包埋在双层膜中蛋白质的运 载体,其胞内域和胞外域都可供配体结合。我们已经证明,含有His标签的圆盘可结 合于金属螯合物矩阵,该矩阵可用于固定含有His标签的MSP的纳米圆盘。His标 签载体可通过商业获得(例如购自Qiagen,Valencia,CA)其描述将美国专利5284933 和5130663。本领域已知的其它标签肽序列包括但不限于Flag标志(鞭毛抗原)或Step 标志(链霉抗生物素蛋白结合),可通过分子生物学方法将它们加入MSP中。除了介 导与所选择的支持物结合外,此种标签序列还有助于纯化MSP或含有它们的纳米圆 盘。纳米圆盘也可用于制备亲和矩阵以供生物分离加工和测定配体的亲和性。用本 发明方法制备的颗粒可用于药物发现、膜蛋白结构/功能相关性以及结构测定。

膜蛋白的结构和功能分析

目前限制膜蛋白结构测定的是能否制造大量的膜蛋白和结晶这些蛋白质。纳米圆 盘和MSP可用作膜蛋白稳定和表达的运载体。MSP可以替代去污剂溶解膜蛋白产生 结晶。实际上,当MSP的脂质结合形式结构上稳定和刚性时,通过MSP引入结晶 点可促进结晶。我们已证明在有和没有外源脂质时都可用MSP1、MSP1的延伸形式 和MSP2或其它串联重复性MSP来溶解紫膜的BR。

可以用此领域已知的众多载体任何一个在大肠杆菌中表达膜蛋白(或其它蛋白)与 MSP区域的融合构建物,大量制得含有膜锚定区的稳定可溶形式的膜蛋白。在不加 磷脂时MSP可溶解BR这一令人振奋的发现使得我们可以在没有去污剂或脂质添加 剂时利用人造MSP来稳定膜蛋白。本发明的(人造)MSP可用于溶解其它的膜蛋白, 包括但不限于细胞色素P450、细胞色素P450还原酶和5-HT-1A受体,以及其它膜 结合受体蛋白和酶。

当载体使膜的一侧与亲水试剂和效应蛋白不可接触时信号转导元件跨膜发生。本 发明的一个具体实施方案采用圆盘来溶解和稳定自然存在的药物靶子(如GPCR)、离 子通道、受体激酶和磷脂酶。就GPCR而言,我们已经将具有多个跨膜结构域的蛋 白掺入到本发明的圆盘中。我们已经成功地将模型血清素膜蛋白、细菌视紫红质掺 入了纳米圆盘。细菌视紫红质是GPCR的一种模型,是现今药物开发的靶标。近年 来已克隆了1000多种不同生物的可能的G-蛋白受体,有许多称为“孤儿”受体等待 鉴定其天然配体。配体类型包括肽激素、神经递质、类二十烷酸、脂质、钙、核苷 和生物胺。据认为GPCR是目前市售药物一半以上的目标。当与作为预溶解蛋白或 作为膜结合蛋白的MSP接触时可容易地将这种结构类型的膜蛋白掺入纳米圆盘。插 入纳米圆盘的G蛋白偶联受体完全保留了这种跨膜信号处理功能。可采用化学分析、 光谱法和原子力显微法进行这些重建受体的结构特征分析。

细胞色素蛋白和还原酶可衍生自植物、昆虫、哺乳动物、类或其它来源。具体 例子包括昆虫细胞色素P450还原酶和细胞色素P450 CYP6B1以及植物细胞色素 P450 CYP7B12、CYP7B13、CYP73A5、CYP86A1、CYP86A2、CYP86A4、CYP86A7 或CYP86A8。“衍生自”是指当与MSP接触以制造纳米圆盘时,靶蛋白可存在于天 然膜中,或者靶蛋白可被分离、纯化或预先溶解,或者靶蛋白可与通过重组方法制 造该靶蛋白的细胞的膜相关联。

可溶于纳米级磷脂双层的GPCR可以包括A类(视紫质样)GPCR,它结合胺、肽、 激素蛋白、视紫质、嗅前列腺素类、核苷样化合物、大麻的化学成分、血小板活化 因子、促性腺激素释放激素、促甲状腺激素释放激素和促分泌素、褪黑素和溶血鞘 脂(lysosphingolipid)和溶血磷脂酸(LPA)。带有胺配体的GPCR包括但不限于乙酰胆碱 或毒蕈碱性受体、肾上腺素受体、多巴胺、组胺、血清素或对羟苯β羟乙胺受体; 肽配体包括但不限于血管紧张素、铃蟾肽、缓激肽、过敏毒素、Fmet-leu-phe、白细 胞介素-8、趋化因子、胆囊收缩素、内皮缩血管肽、黑皮质激素、神经肽Y、神经加 压素、阿片样物质、促生长素抑制素、速激肽、后时加压素样凝血酶、galanin、活 化的蛋白酶、食欲肽和神经肽FF、肾上腺髓质肽(G10D)、GPR37/B-样内皮缩血管肽、 趋化因子受体样和神经调节肽U。

其它示例性的蛋白质包括哺乳动物尤其是人类的CCR5和CXCR4趋化因子受体。 通过接触含有天然或重组蛋白质的膜将它们掺入纳米圆盘。天然蛋白质的构象被保 持,通过含有CCR5和CXCR4的纳米圆盘与CCR5和CXCR4特异性抗体的反应可 证明这一点。也已经制得了含有人bet-2肾上腺素能受体的纳米圆盘。

其它特异性GPCR的配体包括激素蛋白、视紫质、嗅前列腺素类、核苷样物质(腺 苷、嘌呤受体)、大麻的化学成分、血小板活化因子、促性腺激素释放激素、促甲状 腺激素释放激素和促分泌素、褪黑素和溶血鞘脂和LPA。B类血清素样GPCR其中 包括但不限于那些结合降钙素、促肾上腺皮质激素释放因子、胃抑制肽、胰高血糖 素、生长激素释放激素、甲状旁腺激素、垂体环腺苷酸酶激活肽(PACAP)、血清素、 肠血管活性多肽、利尿激素、EMR1和黑寡妇蜘蛛毒素亲和蛋白的物质。C类代谢型 谷氨酸受体其中包括那些结合代谢型谷氨酸、胞外钙传感受体或GABA-B受体的物 质。配体仍然未知的“孤儿”受体也是本发明试验的潜在靶标。

在本发明的试验(证明特定配体的结合或用于鉴定配体与MSP支持的GPCR结合 的抑制剂或竞争剂)中,可以在配体分子中掺入各种可检测分子(标记)(比如放射性同 位素,如3H、14C、35S、32P、125I、131I、荧光化合物、发光化合物等),只要与同源 受体的结合不会因此种标记而明显下降。

扫描探针显微术

在特性分析圆盘结构和结合的蛋白质中所用的一项重要技术是扫描探针显微术 (SPM)。SPM是首先在扫描隧道显微镜(STM)中采用扫描原理的显微镜总括性术语, 但这些显微镜术可能有非常大的不同,故而最好就它们的指导性中心原理进行讨论。 该技术已用于分析生物膜和膜结合蛋白、双层结构和掺入了膜蛋白的表面。SPM将 所有三个空间方向上的独立活动(扫描)与能够检测该表面某些特征的检测系统(探测) 相联合。可以探测各种表面特性(电导率、表面张力、压缩性、电容、磁性、荧光发 射)证明了可以获得丰富的信息。原子力显微镜出色的z-轴灵敏度使得容易检测到结 合于rHDL单层或纳米圆盘中的蛋白质存在(Bayburt等,1998)。用AFM和通过调节 AFM探针施加在各种纳米圆盘聚集体上的力而获得的膜蛋白高度测量可能得到精确 的高度测量(Bayburt等,2000)。MSP形成的圆盘表面结合使得可以直接检测通过SPM 掺入表面上的磷脂双层的单个膜蛋白质的生物物理学特性。将圆盘通过原子作用附 着于导电平面(如金或二氧化硅)的能力是扫描隧道显微术(STM)所必需的。不希望受 理论的束缚,认为可通过氧化还原—括性系统的隧道探测酶的功能状态(Friis等, 1999;Mukhopadhyay等,2000)。这两种技术提供了互相补充的数据可一齐用于研究 双层/溶液界面上发生的活动。将圆盘放置到金表面的能力还使表面胞质基因组共振 (SPR)术得到应用。通过SPR可以检测并定量分析膜蛋插入这种人造脂双层中的情 况,或它们与表面结合蛋白的相互反应。

纳米圆盘可结合的其它有用的固体表面包括但不限于石英、二氧化硅、硅、氧化 硅、氮化硅、聚苯乙烯、塑料和树脂。

圆盘稳定性和大小分散

圆盘稳定性的测量和各类圆盘大小分布的测定是评价其结构所必需的。凝胶过滤 和天然凝胶电泳可用来分离和定量分析颗粒的大小。光谱法可用来定量分析基因工 程构建的MSP的二级结构(CD)和脂结合(荧光)特性,包括对热和化学变性的稳定性。 可通过传统方法用放射性或荧光标记、质谱等定量分析圆盘中蛋白质和脂质组分等 各组分的组成和化学计量。

已取得了将荧光团掺入纳米圆盘脂双层的进展。这些实验为将小分子掺入纳米圆 盘以供治疗应用及产生标记的结构以用于组织定位和ADME/毒理学研究提供了重要 信息。荧光是最广泛使用的追踪蛋白质和分析蛋白质结合的技术之一。可制备含有 亲脂性荧光染料和标记蛋白的纳米圆盘。一些不同的荧光团在自装配期间或自装配 之后被掺入纳米圆盘的脂双层。由于纳米圆盘的脂双层非常小(直径约8nm),掺入 双层的蛋白质的染料大小只有几纳米。此外,蛋白质和染料的化学计量可被严格控 制。这种方法能够用所需数量的染料来标记蛋白质,无须通过突变或其它侵入性或 可能具有破坏性的技术与染料直接结合。

在有关实验中,利用许多荧光素标记的脂质来形成纳米圆盘。结果说明,可将多 达30-40种的有机小分子掺入一个纳米圆盘而不会破坏圆盘的双层结构,如流体动力 学监测的那样。这些富含荧光的纳米圆盘可用于光学传感和分选,包括用于微流体 阵列和诊断性芯片分析系统。

作为这种技术的一个例子,用掺杂有DHPE-荧光素脂质和MSP1的DPPC装配纳 米圆盘。通过大小排阻层析可知,脂质混合物含有10-20%DHPE-荧光素产生的纳米 圆盘。这些比例与每个纳米圆盘16-32个荧光标记的脂质相对应,已知用MSP1装配 时每个纳米圆盘含有160个DPPC。以将各种亲脂性荧光团掺入纳米圆盘。其中包括 荧光素的亲脂性衍生物、脂相状态标记物laurdan和伞花内酯的衍生物、pH敏感性 探针。这些荧光团可在装配过程中或在装配之后被掺入纳米圆盘。Laurdan已被掺入 含有DPPC和DMPC的纳米圆盘。所有这些荧光团都已被掺入含有DMPC以及经预 装配而含有整合膜蛋白靶的纳米圆盘。

疏水性或两性化合物的掺入

可用两种方法之一容易地将疏水性或两性有机化合物例如荧光性和/或亲脂性染 料(如用来探测膜结构的那些染料)掺入纳米圆盘。最普通的可将这种化合物加入去污 剂增溶混合物。感兴趣的化合物然后在通过除去去污剂而引发的纳米圆盘的装配过 程中自发装配成最终的结构。或者,可将这些化合物经简单的培育掺入预先形成的 纳米圆盘中。此时由培育温度与相关的磷脂混合物相变温度而定,预计更容易掺入 流体状态的磷脂中。然而,由于这种化合物在疏水双层结构中的强烈分隔作用即使 在室温(约25℃)下也可成功掺入DPPC(相变温度约42℃)。能在纳米圆盘中分隔的亲 脂性染料包括但不限于二苯基己三烯、辛基癸基靛炭花青(octyldecylindocarbocyanine) (Dil)、C1-BODIPY 500/510、二己癸酰基甘油磷酸乙醇胺 (dihexadecanoylglycerophosphoethanolamine)荧光素。

也可用相同或类似的方法掺入疏水或部分疏水性显影剂、治疗和/或美容活性分子 等。

原子力显微术

AFM可用于提供本发明纳米圆盘脂质和蛋白质成分结构组织的分子分辨率数 据。这一技术可以在空气、真空和水性及非水性液体下使用。后一能力使其成为生 物科学中最重要的扫描探针技术。AFM是用途很广的装置,它能够获得接触力、敲 击力、相力和侧力的图象和其它形式力的数据(Sarid,1994)。所有这些扫描模式在 Digital Instruments Multimode Scanning Probe Microscope(Digital Instruments, Plainview,N.Y.)上都可得到,它们已成功用于拍摄含或不含掺入蛋白质的rHDL和 与纳米圆盘结合的蛋白质的图象。这种装置还可用于STM和电化学模式研究金结合 的纳米圆盘和掺入的氧还蛋白特性分析。

对MSP的一级结构进行修饰可产生另一种更加有效而稳定的膜支架蛋白。例如, 我们已删除和/或复制了MSP1的螺旋区而产生了新的人造膜支架蛋白。见下面的表 21这种膜支架蛋白结构的实例。

必需仔细注意该重建混合物中MSP的浓度以确保所产生的纳米圆盘大小均匀。 磷脂与MSP的最佳比例取决于所产生的纳米圆盘的总体大小,而这种大小又由围绕 膜支架蛋白的总长度决定。例如,MSP1支架蛋白可自装配形成标称直径为9.7nm 的圆盘,每个纳米圆盘掺入了163个DPPC磷脂(PL)分子(81.6/MSP1)。为了构建较 大纳米圆盘可在MSP中加入额外的螺旋区段,因此包括更多磷脂(PL)。MSPE1具有 一额外的22聚体螺旋,产生的颗粒直径为10.4nm,每个MSP1E1有105.7个PL。 在MSP中插入两个22聚体螺旋,产生的纳米圆盘直径为11.1nm,每个MSP1E2有 138.2个PL分子。加入三个22聚体螺旋时,产生的颗粒直径为12nm,每个产生的 纳米圆盘有176.6个DPPC分子。

我们研究了用天然细胞膜形成的纳米圆盘的脂质组分。应用MSP技术从天然生 物膜成功装配了纳米双层为直接分离细胞的膜蛋白将它们溶解并分散到严格模拟天 然细胞环境的系统中提供了唯一的机会。为进一步阐述模拟原始Sf9微粒体膜的分离 的纳米圆盘的磷脂含量,用薄层层析分析了用Sf9微粒体膜装配的经过镍亲和纯化的 纳米结构。比较这些纳米圆盘的磷脂群体,在昆虫细胞膜中发现的主要磷脂质型有 磷脂酰胆碱、磷脂酰肌醇和磷脂酰乙醇胺(Marheineke等,1998)(图17),清楚表明在 装配好的纳米圆盘中保留了内源性Sf9微粒体膜的磷脂组分。

基础蛋白质组学

为使MSP技术与异源表达的膜蛋白的基础蛋白质组学分析在格式上相容,在存 在构建的膜支架蛋白MSP1时用去污剂完全溶解过度表达CYP6B1的Sf9细胞的膜。 除去去污剂(用BiobeadsTM)起动自装配,将膜蛋白群体掺入MSP支持的磷脂纳米双 层中,如图14所示。随后用镍螯合树脂使His6标签结合到支架蛋白的N-末端分离 得到含有MSP1的颗粒。用变性聚丙烯酰胺凝胶电泳分析亲和纯化的可溶性纳米双 层,证实存在CYP6B1靶蛋白以及原始Sf9细胞膜中的内源性蛋白质阵列(图15)。 经镍亲和纯化的样品通过尺寸排阻色谱分级(图16A)并通过417nm吸光度进行分析, 鉴定到10nm的级分包含90%以上含有血红素的可溶性靶蛋白。

在不存在膜支架蛋白时对经处理并分级的表达CYP6B1的Sf9细胞膜进行尺寸排 阻层析,显示靶蛋白洗脱物为大的非特异性聚集体(图16A,虚线)。产生的MSP1支 持的纳米圆盘的均一性取决于脂质的身份以及脂质与用于重建过程中所用MSP量的 比例(Bayburt等,2002,同上)。我们对用Sf9昆虫细胞膜的天然脂质群体装配的MSP 圆盘进行分析,表明最初经镍亲和纯化的纳米圆盘中有其它大小圆盘群体(图16A)。 造成这些变异是因为难以预先确定与膜制品中表达不同量异源P450蛋白的脂质组分 理想匹配的MSP蛋白的准确浓度,以及由于在该过程中也装配成纳米结构的内源性 膜蛋白有着显著的大小差异。这些其它大类型的颗粒代表了容易与直径约10nm的 纳米双层装配体分离的非特异性聚集体。可按大小区分的含有P450靶蛋白的纳米圆 盘群体在大小分级柱如SuperdexTM 200上均一稳定地再分级。最终含有CYP6B1的 圆盘群体的化学计量约为10个纳米圆盘含有1个CYP6B1蛋白(图16B)。

我们已经测试了装配入纳米圆盘的膜蛋白的完整性。通过铁的还原和一氧化碳 (CO)的结合检测了含有CYP6B1的纳米结构,该检测通过450nm的吸光度监测对于 P450介导的催化反应结构完整且正确的蛋白质的量(Omura和Sato(1964)(见图18)。 这种光学检测显示420nm的吸光度清楚消失,并证明通常情况下不稳定的蛋白质如 P450被以其天然形式掺入随后适合分级和生化分析的纳米圆盘。为进一步证实可溶 性膜蛋白易于结合底物并适合用于高通量光学分析,在96孔微量滴定板中分析了花 椒毒素(被这种P450代谢的几种呋喃香豆素底物之一)与含有MSP1及含有CYP6B1 的纳米圆盘的结合,采用的样品体积仅为200μl纳米圆盘(10皮摩尔酶)且底物浓度 的变化的。用变化浓度的花椒毒素获得的I型结合光谱(Estabrook和Werringloer,1978) 显示了从420nm到390nm的吸光度变化,这种变化是底物有效置换水成为P450催 化位点中血红素铁第六个配体并使铁从低自旋变为高自旋特有的。图18中的数据清 楚说明,在纳米圆盘装配和随后的分级过程中CYP6B1结合底物的能力被保留。

总之,本发明提供了一种研究膜蛋白靶以及细胞双层中存在的复杂的多组分装配 体的重要工具。当将我们的方法与在通常使用的杆状病毒、酵母和哺乳动物表达系 统中表达单独克隆的P450或其它膜蛋白相结合时,随着以前限制于可溶性蛋白质的 生化工艺的发展,这些技术将有机会展现支撑天然膜双层的单个膜蛋白。MSP所产 生的颗粒及模拟起始膜或其片段的膜或膜片段,尤其是经促溶的膜或膜片段制品中 的脂质组分,可用作磷脂和疏水性蛋白质或感兴趣的其它疏水分子的来源。此方法 能够保持与MSP一起掺入到该颗粒中的膜蛋白(或其它疏水性蛋白质)的天然构象和 活性。

这种在微滴定板中利用敏感的光学差异光谱检测底物、抑制剂和其它相互反应性 分子与这些促溶的膜蛋白结合的能力,得以开发用于许多不同类型膜蛋白的高通量 筛选方法。例如,通过掺入纳米圆盘中而功能状态稳定的细胞色素P450及其还原酶 当用于制药工业时,常常是一种有吸引力的衡量药物代谢和药物动力学的方法。纳 米圆盘增溶的事实可非特异性地应用于所有膜蛋白方法,从而这种技术可用于溶解 和分级直接位于细胞膜表面的许多药理学靶蛋白。在MSP分子上偶联组氨酸(或其它) 标签的技术能够将靶蛋白固定在适合高通量筛选的表面。本文描述的所有MSP可用 来与纯化并经促溶的疏水或部分疏水性蛋白质,或与膜或膜片段制品中经促溶的疏 水或部分疏水性膜蛋白一起制备纳米圆盘。

免疫原性组合物

疏水或部分疏水性抗原可被配制成免疫原性组合物以给予需要细胞或体液免疫 应答的人或动物。用本发明的MSP将抗原掺入纳米圆盘能够制备出不易凝集的稳定 的含水制品。抗原的至少一个抗原决定簇出现在水相中,而抗原的大部分疏水部分 被埋入纳米圆盘的疏水核心区域。被掺入纳米圆盘的抗原可以是蛋白质,如细胞膜 蛋白或病毒包膜蛋白,或者它可以是脂多糖或脂低聚糖。

抗原可来自病毒(尤其是有包膜的病毒)、细菌(包括但不限于细菌、真菌、原生动 物、寄生虫),或者它可衍生自特定类型的肿瘤或癌症。含有抗原的纳米圆盘制品可 在预防性或治疗性治疗方案中施用以产生免疫应答,并且可与其它疫苗制品一起施 用这些纳米圆盘以进行初次免疫和/或加强免疫。

在本发明的方法中,可将其细胞用作抗原来源的癌症(肿瘤性疾病)包括癌、肉瘤、 白血病以及神经系统细胞产生的癌症。其中包括但不限于骨癌(骨肉瘤)、脑癌、前列 腺癌、癌如小细胞和大细胞腺癌、横纹肌肉瘤、间皮瘤(mesiothelioma)、鳞状细胞 癌、基底细胞癌、恶性黑色素瘤、其它皮肤癌、支气管癌、结肠癌、其它胃肠癌、 肾癌、肝癌、乳腺癌、子宫、卵巢或宫颈的癌、前列腺癌、淋巴瘤、骨髓瘤、膀胱 癌、网状内皮系统(RES)的癌症如B或T细胞淋巴瘤、黑色素瘤以及软组织癌症。

以单数或复数形式使用的术语″赘生细胞″、″肿瘤细胞″或″癌细胞″指经历恶性转 化使变得对宿主生物有害的细胞。用已有技术尤其是组织学检验容易区分原发性癌 细胞(即从恶性转化位置附近获得的细胞)和非癌细胞。文中对癌细胞的定义不仅包括 原发性癌细胞,而且包括衍生自祖先癌细胞的细胞。其中包括转移的癌细胞以及衍 生自癌细胞的体外培养物和细胞系。当提及癌症类型时通常是指实体瘤,“临床可检 测”的肿瘤是一种根据肿瘤瘤块可检测的肿瘤;例如通过CAT扫描、磁共振成象 (MRI)、X射线、超声波或触诊等过程。仅生化或免疫发现不足以满足该定义。

能诱导多种抗原免疫应答的病原体宜包括病毒、细菌、真菌和原生动物病原体。 能诱导所需免疫力的病毒包括但不限于出血热病毒(如埃博拉病毒)、免疫缺陷病毒 (如猪或人免疫缺陷病毒)、疱疹病毒、冠状病毒、腺病毒、痘病毒、小核糖核酸病毒、 正粘病毒(orthomyxoviruses)、副粘病毒、疹病毒、披膜病毒、披膜病毒、布亚病毒、 肿瘤病毒如逆转录病毒、致病性α病毒(如塞姆利基森林病毒或辛德比斯病毒)、鼻病 毒、肝炎病毒(乙型、丙型等)、流感病毒。能诱导有帮助的免疫应答的细菌病原体包 括但不限于葡萄球菌、链球菌、肺炎球菌、沙门氏菌、埃希氏菌、耶尔森氏菌、肠 球菌、梭菌、棒状杆菌、嗜血杆菌、奈瑟氏菌、拟杆菌、弗朗西丝氏菌、军团杆菌、 巴斯德菌、布氏菌、分枝杆菌、博德特氏菌、螺旋菌、放线菌、衣原体、支原体、 立克次氏体等。感兴趣的致病真菌包括但不限于念珠菌属、隐球菌属、芽生菌、组 织胞浆菌属、球孢子菌属、藻状菌纲、木霉属、曲霉、肺囊虫等。免疫有效的原生 动物包括但不限于弓形虫、疟原虫、血吸虫、变形虫、贾第虫属、巴贝虫属、利什 曼原虫等。其它寄生虫包括线虫、十二指肠虫和绦虫、filiaria等。

本发明进一步的目的是将含有抗原的本发明的免疫原性纳米圆盘组合物施用于 人或动物(例如马、猪、牛、山羊、兔、小鼠、仓鼠)来产生免疫应答,如产生针对抗 原的抗体或细胞应答,从而带有该抗原的细胞或组织被作为细胞或细胞毒免疫应答 的靶。从这种人或动物收集的血清或细胞被用于提供多克隆血清或细胞以制造产生 单克隆血清的杂交瘤,这种抗体制品可用于研究、诊断和治疗用途

虽然产生的免疫应答包括至少一定水平的针对肿瘤细胞(或肿瘤症状)、病原体或 寄生虫的保护性免疫力,但是,如本领域已知的那样,用合适化疗剂一起治疗患有 这种肿瘤症状或受寄生虫或病原体感染的患者可以提高临床结果。当病原体是病毒 时,可与含有抗原的纳米圆盘疫苗一起给予抗病毒化合物,如给予受疱疹病毒感染 的患者阿昔洛韦,或给予受HIV感染的个体HAART(高活性抗逆转录病毒疗法)。当 病原体是细菌病原体时,可给予细菌对其敏感的抗生素,而但病原体是真菌时可给 予合适的抗真菌的抗生素。

类似地,宜采用本领域熟知的剂量和给药方案给予人或动物患者可控制和/或根除 寄生虫感染的化学药剂。当患者患有肿瘤疾病例如癌症时,最好在施用含有纳米圆 盘的免疫原性组合物的同时给予抗肿瘤药,所述纳米圆盘携带有一种或多种与患者 癌症相关的抗原,所述抗肿瘤药包括但不限于化疗剂如柔红霉素、紫杉醇、硫脲类 以及连接有治疗性放射性核素的癌症特异性抗体,只要这些药物不会使患者无法产 生针对所用纳米圆盘和抗原的免疫应答。调节基因表达或指导功能蛋白表达的核酸 也可被掺入纳米圆盘,尤其是当核酸分子与阳离子脂质(其中许多都可通过商业获得) 复合时。

本发明的药物制剂,如疫苗或其它免疫原性组合物,含有免疫原性量的带有抗原 的纳米圆盘以及药学上可接受的载体。″免疫原性量″是足以在施用该药物制剂的对象 中引起免疫应答的带有抗原的纳米圆盘的量。每剂约103-1011,优选105-109个颗粒 的量被认为是合适的,这取决于被治疗对象的年龄和种类。根据给药目的(即要治疗 或预防的疾病),可选择治疗有效或预防有效的剂量(以及给药循环)。

示例性的药学上可接受的载体包括但不限于无菌无热原的水以及无菌无热原的 生理盐水。可给予免疫原性量带有抗原的本发明的纳米圆盘的对象包括但不限于人 和动物(例如,狗、猫、马、猪、牛、山羊、兔、大鼠、驴、小鼠、仓鼠、猴)。也可 加入免疫活性化合物如细胞因子和/或BCG以提高对所施用的免疫原性制品的免疫 应答。

用本发明的方法制造的包含掺有感兴趣抗原的纳米圆盘的免疫原性组合物可用 本领域已知的任何方法制造。这种组合物,尤其是疫苗,通常被制成液体溶液或悬 浮液形式的可注射制剂。也可制造适合在注射之前溶于或悬浮于液体的固体形式。

所述活性免疫原性成分(纳米圆盘)宜与药学上可接受的并与所述活性成分相容的 赋形剂或载体混合。合适的赋形剂包括但不限于无菌水、盐水、葡萄糖、甘油、乙 醇等或它们的组合。

此外,如果需要,所述免疫原性组合物(包括疫苗)可含有少量辅助性物质如润湿 剂或乳化剂、pH缓冲剂和/或增强疫苗功效的佐剂。可能有效的佐剂的例子包括但不 限于氢氧化;N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺(thr-MDP);N-乙酰-去甲-胞 壁酰-L-丙氨酰-D-异谷氨酰胺(CGP 11637,称为nor-MDP);N-乙酰胞壁酰-L-丙氨酰 -D-异谷氨酰胺酰-L-丙氨酸-2-(1′-2′-二棕榈酰-sn-丙三基-3-羟基磷酰氧基)-乙胺(CGP 19835A,称为MTP-PE);和RIBI,它在2%鲨烯/Tween 80乳液中含有三种提取自细 菌的成分:单磷酰脂质A、海藻糖二霉菌酸酯和细胞壁骨架(MPL+TDM+CWS)。佐 剂的效力可通过测定给药之后抗纳米级颗粒免疫原性组分的抗体的量来确定。也可 采用本领域已知的其它制剂及给药方式。

含有免疫原性(或生物活性)抗原的纳米圆盘组合物以与剂型相容的方式给予,其 用量将是预防和/或治疗有效量。给予的剂量范围通常为每剂约103-1010,优选105-108 个颗粒,取决于要治疗的对象、个体的免疫系统合成抗体的能力以及需要的保护程 度。要给予,的活性成分的准确量取决于医生、兽医或其它卫生从业人员的判断,每 个个体都有不同,但这种决定是该专业技术人员如医师份内之事。

疫苗或其它免疫原性组合物可以单剂量或多次剂量方案给予。在多次剂量方案 中,初次疫苗接种过程可包括1-10次或更多次单独的剂量,之后可根据维持或加强 免疫应答所需在后来的时间间隔给予其它剂量,例如可每周、每月或1-4个月给予第 二次剂量,如果需要随后的剂量可在数月或数年后给予。可将疏水或部分疏水性抗 原像其它分子(如膜蛋白或小分子)一样掺入纳米圆盘。当抗原天然就与膜结合或在膜 内时,可采取纯化或部分纯化的可溶性制品或促溶的膜或膜片段制品作为要输入纳 米圆盘装配混合物中抗原的来源。

核磁共振

目前诊断心肌缺血的方法采用包含钆(Gd)的NMR松弛剂。目前市场的引领产品 是Magnevist(商品名Berlex)。Gd金属以钆喷酸二甲葡胺(gadopentetate dimeglumine) 形式螯合。不幸的是,这种化合物的半衰期在人体内只有几分钟,这是因为其尺寸 小,且清除快速。据信,纳米圆盘在人血浆中具有几个小时的半衰期。

可以将各种有机和无机络合物通过与脂肪酸样链偶联(共价连接)掺入到纳米圆盘 双层中,然后脂肪酸样链分配进入纳米圆盘双层中。我们用此技术使荧光分子以不 同载量结合于纳米圆盘。对于含约160DPPC磷脂分子的普通10nm直径纳米圆盘而 言,可以掺入多至约40-50个烷基链锚定磷脂,代替天然磷脂,无需包含纳米圆盘结 构。可以用相同的步骤使其它有机或无机物结合于纳米圆盘,其中,所述纳米圆盘 变成该化合物的载体,提供了有益的受控制的循环寿命,同时提供了小和坚固的圆 盘尺寸。这类化合物包括糖类、显象剂、亲脂性染料、光活性剂(光动力)等。光动力 剂包括但不限于用于治疗肿瘤或动脉粥样硬化斑的那些制剂,例如,卟啉和酞花青 苷-相关分子。

可以构建各种螯合剂,在10nm直径包装中提供具有约50Gd松弛剂的纳米圆盘。 这大大有利于为心血管造影提供寿命更长的显象剂。我们已用市售的螯合剂沿这些 血管线完成了第一次实验,但提供的是不完全协调的Gd分子。这种化合物容易沉淀。 使长烷基链结合于Magnevist结构(例如,在亚甲基的碳位置上)是简单的化学过程 (J.Med.Chem 42,2852(1999)),具有与Magnevist相同的螯合性能,但是为血浆寿命 增加的更加浓缩的形式。

功能等价物

应理解,示例MSP的变体可用基本上类似于本发明MSP氨基酸序列(至少约 80-99%(其中所有的整数)相同)的氨基酸序列来制备,而形成功能等价物,两性物、 三维结构和保留了形成含有磷脂和/或乘客分子(如疏水或部分疏水性蛋白质等)的纳 米圆盘。生物领域熟知,可取代蛋白质序列中的某些氨基酸而不会影响蛋白质的功 能。

通常,可耐受保守性氨基酸取代类似氨基酸的取代而不含影响蛋白质的功能。类 似的氨基酸可以是那些大小和/或带电性能类似的蛋白质,例如,天冬氨酸和谷氨酸 以及异亮氨酸和缬氨酸是两对类似的氨基酸。非极性氨基酸包括丙氨酸、缬氨酸、 亮氨酸、苯基丙氨酸、色氨酸、甲硫氨酸、异亮氨酸、半胱氨酸和甘氨酸。不带电 荷的极性氨基酸包括丝氨酸、苏氨酸、天冬酰胺、谷氨酸和酪氨酸。带电荷的极性 碱性氨基酸包括赖氨酸、精氨酸和组氨酸。当不破坏螺旋形成(除了需要时)时,允许 用一个取代另一个。每对氨基酸之间的类似性可用本领域的许多方法来评价。例如, Dayhoff等在Atlas of Protein Sequence and Structure(1978,卷5,增补本3,第22章, 第345-352页,其内容参考引用于此)中提供了氨基酸取代的频度表,可以用作氨基 酸类似性的一种衡量。Dayhoff等的频度表是根据各种不同来源的具有相同功能的蛋 白质的氨基酸序列比较而制订的。

文献所公开的核苷(和氨基酸)序列的取代突变、插入和缺失变体不难通过本领域 熟知的方法来制备。这些变体可以和示例MSP列同样的方式使用,只要所述变体 具有基本的序列相同性(和本发明示例的MSP相比)。在本文中,基本的序列相同性 指同源性(或相同性),足以使该多核苷或蛋白质变体以和产生所述变体的多核苷或蛋 白质相同的能力发挥作用。这种序列相同性宜大于70%或80%,更好是这种相同性 大于85%,或者,这种相同性大于90%,或者大于95%,以及在70-100%之间的所 有整数。本领域技术人员熟知制备取代突变、插入和删除突变的方法,它们在功能 上是等价的,或者设计这些突变来改进所述序列的功能,或者提供方法上的优势。 在任何天然存在的蛋白质上或者在现有技术产生的变体上可读的任何变体属于本发 明的范围内。

在本领域熟知可以截短和/或突变本发明的多核苷序列,使原先全长的序列所产生 片段和/或变体保留了所需的全长序列的特性。熟知适合于从较大核酸分子产生片段 的各种限制酶。此外,熟知Ba/31核酸外切酶可方便地用于时间-控制的限制消化 DNA。参见,例如,Maniatis(1982)Molecular Cloning:A Laboratory Manual,冷泉港 实验室,New York,第135-139页,参考引用于此。也参见Wei等,(1983,J.Biol.Chem. 258:13006-13512。通过使用Ba/31核酸外切酶(常称作“擦除一碱基(erase-a-base)” 过程),一般技术人员可以除去目标核酸的任意一端或两端的核苷,产生功能上等价 于目标核苷序列的广谱片段。本领域的普通技术人员可用这种方式产生沿原始MSP 编码序列所有位置的数百个受控的长度不一的片段。本领域普通技术人员可以按惯 例试验或筛选所产生的片段的性能,并如本文所述确定所述片段的用途。也熟知全 长序列的变体序列或其片段不难通过定点诱变来产生。参见,例如,Larionov,O.A. 和Nikiforov,V.G.(1982)Genetika 18(3):349-59;Shortle,D,DiMaio,D.和Nathans, D.(1981)Annu.Rev.Genet.15:265-94;均参考引用于此。本领域技术人员能够常规 产生删除-、插入-、或取代-型突变体,并鉴定所产生的具有全长野生型序列所需特 性的那些突变体,或其片段,即保留了GIcNAc T-Vb活性的那些片段。

与表1、3、4或5(SEQ ID Nos:1、3、7或9)中所述DNA编码序列相比至少具 有70、80、85、90或95%或以上相同性其功能是编码GIcNAc T-Vb蛋白质的DNA 序列均属于本发明的范围内。按照本文所述的内容利用本领域熟知的知识和技术, 本领域技术人员能得到大量具有与本文所述那些序列等价的DNA序列的操作性实 施方案,而无需过度的实验。

文中,两种核酸序列的相同性百分比是用Altschul等(1997)Nucl.Acids Res.25: 3389-3402的算法确定的;也可参见Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264-2268,按照Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877 的改进。这种算法被用于Altschul等(1990)J.Mol.Biol.215:402-410的NBLAST和 XBLAST程序。BLAST核苷酸检索用NBLAST程序进行,评分=100,字长=12,以 获得具有所需序列相同性百分比的核苷酸序列。为获得用于比较目的的缺口比对, 采用Gapped BLAST,如Altschul等(1997)Nucl.Acids.Res.25:3389-3402所述。当使 用BLAST和Gapped BLAST程序时,使用各个程序(NBLAST和XBLAST)的默认参 数。可参见国家生物技术信息中心的网站

抗体技术

可用本领域已知的技术制造与本发明的MSP(或其它感兴趣的蛋白质)特异性反 应的单克隆或多克隆抗体,优选单克隆抗体。参见,例如,Harlow和Lane(1988) Antibody:A Laboratory Manual,冷泉港实验室;Goding(1986)Monoclonal Antibody: Principles and Practice,第二版,Academic Press,New York;以及Ausubel等,(1993) Current Protocols in Molecular Biology,Wiley Interscience,New York,NY。

克隆,DNA分离、扩增和纯化,涉及DNA连接酶、DNA聚合酶、限制性内切 酶等的酶促反应等的标准技术,以及各种分离技术是技术人员已知的,通常为此领 域的技术人员使用。许多标准技术描述见Sambrook等(1989)Molecular Cloning,第 二版,冷泉港实验室,Plainview,纽约;Maniatis等(1982)Molecular Cloning,Plainview, 纽约;Wu(编)(1993)Meth.Enzymol.218,第I部分;Wu(编)(1979)Meth.Enzymol.68; Wu等(编)(1993)Meth.Enzymol.100和101;Grossman和Moldave(编) Meth.Enzymol.65;Miller(编)(1972)Experiments in Molecular Genetics,冷泉港实验室, 冷泉港,纽约;Old和Primrose(1981)Principles of Gene Manipulation,加州大学出版 社,Berkeley;Schleif和Wensink(1982)Practical Methods in Molecular Biology; Glover(编)(1985)DNA Cloning第I和II卷,IRL出版社,Oxford,UK;Hames和 Higgins(编)(1985)Nucleic Acid Hybridization,IRL出版社,Oxford,UK;Setlow和 Hollaender(1979)Genetic Engineering:Principles and Methods,第1-4卷,Plenum出版 社,纽约;以及Ausubel等(1992)Current Protocols in Molecular Biology,Greene/Wiley, 纽约,纽约州。这里所用的缩写和术语在此领域是标准的且通常用于如上所述的专 业期刊中。

在此并入本申请中提到的所有参考资料以供参考,其引用程度与本发明的公开一 致。

本文提供的描述并不是要限制本申请权利要求的本发明的范围。本领域熟练技术 人员可想到的本发明所例举的物品和方法的变化应被认为在本发明的范围之内。

                              实施例

               实施例1.构建表达MSP的重组DNA分子

将下面给出的人proapoAI编码序列插入到pET-28中的Nco I和Hind III位点之 间(Novagen,Madison,WI)。起始和终止密码子以黑体表示。克隆中所用的限制性 内切酶位点用下划线表示。

                         表1.

ProApo A-I编码序列(SEQ ID NO:1)。克隆中所用的限制性位点用下划线表示,

              翻译起始和终止信号用黑体表示。

CCATGGCCCATTTCTGGCAGCAAGATGAACCCCCCCAGAGCCCCTGGGATCGA

GTGAAGGACCTGGCCACTGTGTACGTGGATGTGCTCAAAGACAGCGGCAGAG

ACTATGTGTCCCAGTTTGAAGGCTCCGCCTTGGGAAAACAGCTAAACCTAAAGC

TCCTTGACAACTGGGACAGCGTGACCTCCACCTTCAGCAAGCTGCGCGAACAG

CTCGGCCCTGTGACCCAGGAGTTCTGGGATAACCTGGAAAAGGAGACAGAGG

GCCTGAGGCAAGAGATGAGCAAGGATCTGGAGGAGGTGAAGGCCAAGGTGCA

GCCCTACCTGGACGACTTCCAGAAGAAGTGGCAGGAGGAGATGGAGCTCTAC

CGCCAGAAGGTGGAGCCGCTGCGCGCAGAGCTCCAAGAGGGCGCGCGCCAG

AAGCTGCACGAGCTGCAAGAGAAGCTGAGCCCACTGGGCGAGGAGATGCGCG

ACCGCGCGCGCGCCCATGTGGACGCGCTGCGCACGCATCTGGCCCCCTACAG

CGACGAGCTGCGCCAGCGCTTGGCCGCGCGCCTTGAGGCTCTCAAGGAGAAC

GGCGGCGCCAGACTGGCCGAGTACCACGCCAAGGCCACCGAGCATCTGAGCA

CGCTCAGCGAGAAGGCCAAGCCCGCGCTCGAGGACCTCCGCCAAGGCC下GCT

GCCCGTGCTGGAGAGCTTCAAGGTCAGCTTCCTGAGCGCTCTCGAGGAGTACA

CTAAGAAGCTCAACACCCAGTAAT AAGCTT-3′

                     表2.

        ProApo A-I氨基酸序列(SEQ ID NO:2)

MAHFWQQDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLL

DNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYL

DDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAH

VDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPAL

EDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

构建MSP1编码序列如下进行。设计引物通过聚合酶链式反应(PCR)诱变产生编 码MSP1的DNA,该截短的蛋白质缺少proApoA-I的N-末端区域(Higuchi等,1988)。 引物1(SEQ ID NO:3)(5′-TATACCATGGGCCATCATCATCATCATCATATAGAAGGAA GACTAAAGCTCCTTGACAACT-3′)为MSP1的纯化和处理引入了N-末端6个组氨酸 的标签,并为除去该His标签引入了Xa因子切割位点。Xa因子在该蛋白质序列IEGR 的R后处切割。引物2(SEQ ID NO:4)(5′-GCAAGCTTATTACTGGGTGTT GAGCTTCTT-3′)用作反向引物。

                        表3.

            带有His标签的MSP1编码序列(SEQ ID NO:5)。

克隆中所用的限制性位点用下划线表示,翻译起始和终止信号用黑体表示。

TA CCATGGCAAAGCTCCTTGACAACTGGGACAGCGTGACCTCCACCTTCAGCA

AGCTGCGCGAACAGCTCGGCCCTGTGACCCAGGAGTTCTGGGATAACCTGGA

AAAGGAGACAGAGGGCCTGAGGCAGGAGATGAGCAAGGATCTGGAGGAGGTG

AAGGCCAAGGTGCAGCCCTACCTGGACGACTTCCAGAAGAAGTGGCAGGAGG

AGATGGAGCTCTACCGCCAGAAGGTGGAGCCGCTGCGCGCAGAGCTCCAAGA

GGGCGCGCGCCAGAAGCTGCACGAGCTGCAAGAGAAGTTGAGCCCACTGGGC

GAGGAGATGCGCGACCGCGCGCGCGCCCATGTGGACGCGCTGCGCACGCAT

CTGGCCCCCTACAGCGACGAGCTGCGCCAGCGCTTGGCCGCGCGCCTTGAGG

CTCTCAAGGAGAACGGCGGCGCCAGACTGGCCGAGTACCACGCCAAGGCCAC

CGAGCATCTGAGCACGCTCAGCGAGAAGGCCAAACCCGCGCTCGAGGACCTC

CGCCAAGGCCTGCTGCCCGTGCTGGAGAGCTTCAAGGTCAGCTTCCTGAGCG

CTCTCGAGGAGTACACTAAGAAGCTCAACACCCAGTAAT AAGCTTGC

                       表4.

        带His标签的MSP1氨基酸序列(SEQ ID NO:6)

MAKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAK

VQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRD

RARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEK

AKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

为产生没有N-末端His标签的MSP1,用引物1a:5′-TACCATGGCAAAGCT CCTTGACAACTG-3′(SEQ ID NO:7)替代引物1产生SEQ ID NO:8中提供的序列。

                          表5.

          无His标签的MSP1 DNA序列(SEQ ID NO:8)。

克隆中所用的限制性位点用下划线表示,翻译起始和终止信号用黑体表示。

TA CCATGGCAAAGCTCCTTGACAACTGGGACAGCGTGACCTCCACCTTCAGCA

AGCTGCGCGAACAGCTCGGCCCTGTGACCCAGGAGTTCTGGGATAACCTGGA

AAAGGAGACAGAGGGCCTGAGGCAGGAGATGAGCAAGGATCTGGAGGAGGTG

AAGGCCAAGGTGCAGCCCTACCTGGACGACTTCCAGAAGAAGTGGCAGGAGG

AGATGGAGCTCTACCGCCAGAAGGTGGAGCCGCTGCGCGCAGAGCTCCAAGA

GGGCGCGCGCCAGAAGCTGCACGAGCTGCAAGAGAAGTTGAGCCCACTGGGC

GAGGAGATGCGCGACCGCGCGCGCGCCCATGTGGACGCGCTGCGCACGCAT

CTGGCCCCCTACAGCGACGAGCTGCGCCAGCGCTTGGCCGCGCGCCTTGAGG

CTCTCAAGGAGAACGGCGGCGCCAGACTGGCCGAGTACCACGCCAAGGCCAC

CGAGCATCTGAGCACGCTCAGCGAGAAGGCCAAACCCGCGCTCGAGGACCTC

CGCCAAGGCCTGCTGCCCGTGCTGGAGAGCTTCAAGGTCAGCTTCCTGAGCG

CTCTCGAGGAGTACACTAAGAAGCTCAACACCCAGTAAT AAGCTTGC

                            表6.

       无His标签的MSP1氨基酸序列(SEQ ID NO:9)

MAKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAK

VQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRD

RARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEK

AKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

产生带有串联重复性MSP(MSP2)的方法如下所述进行。用以下引物来产生 MSP2(参见图6A-6B):

引物3(SEQ ID NO:10):5′-TACCATGGCAAAGCTCCTTGACAACTG-3′

引物3a(SEQ ID NO:11):

5′-TATACCATGGGCCATCATCATCATCATCATATAGAAGGA

AGACTAAAGCTCCTTGACAACT-3′

引物4(SEQ ID NO:12):

5′-TAAGAAGCTCAACACCCAGGGTACCGGTGGAGGTAGTGGAGGTGGTACCCT

A-3′

引物5(SEQ ID NO:13):

5′-CAGGGTACCGGTGGAGGTAGTGGAGGTGGTACCCTAAAGCTCCTTGACAA-3

引物6(SEQ ID NO:14):5′-GCAAGCTTATTACTGGGTGTTGAGCTTCTT-3′

在第一次PCR中,用引物2(或对N-末端His标签用引物2a)和引物4在MSP 基因的3′末端加入接头(编码氨基酸序列GTGGGSGGGT;SEQ ID NO:15)产生 MSP-A。在第二次PCR中,在MSP基因的5′末端加入该接头产生了MSP-B。用KpnI 处理MSP-A和MSP-B随后连接产生了以下构建物,一个有接头而一个没有接头。 KpnI位点提供了通过KpnI限制性切开和用编码所需接头的双链合成性DNA再连接 而插入任何所需接头序列的简便方法。参见图7A-7B。

                       表7.

  MSP2(有His标签,没有长接头)的DNA序列(SEQ ID NO:16)。

翻译起始和终止信号用黑体表示,克隆中所用的限制性内切酶识别位点用下划线表示。

TATA CCATGGGCCATCATCATCATCATCATATAGAAGGAAGACTAAAGCTCCTTGA

CAACTGGGACAGCGTGACCTCCACCTTCAGCAAGCTGCGCGAACAGCTCGGCCCT

GTGACCCAGGAGTTCTGGGATAACCTGGAAAAGGAGACAGAGGGCCTGAGGCAG

GAGATGAGCAAGGATCTGGAGGAGGTGAAGGCCAAGGTGCAGCCCTACCTGGAC

GACTTCCAGAAGAAGTGGCAGGAGGAGATGGAGCTCTACCGCCAGAAGGTGGAG

CCGCTGCGCGCAGAGCTCCAAGAGGGCGCGCGCCAGAAGCTGCACGAGCTGCAA

GAGAAGCTGAGCCCACTGGGCGAGGAGATGCGCGACCGCGCGCGCGCCCATGT

GGACGCGCTGCGCACGCATCTGGCCCCCTACAGCGACGAGCTGCGCCAGCGCTT

GGCCGCGCGCCTTGAGGCTCTCAAGGAGAACGGCGGCGCCAGACTGGCCGAGTA

CCACGCCAAGGCCACCGAGCATCTGAGCACGCTCAGCGAGAAGGCCAAGCCCGC

GCTCGAGGACCTCCGCCAAGGCCTGCTGCCCGTGCTGGAGAGCTTCAAGGTCAG

CTTCCTGAGCGCTCTCGAGGAGTACACTAAGAAGCTCAACACCCAGGGTACCCTA

AAGCTCCTTGACAACTGGGACAGCGTGACCTCCACCTTCAGCAAGCTGCGCGAAC

AGCTCGGCCCTGTGACCCAGGAGTTCTGGGATAACCTGGAAAAGGAGACAGAGG

GCCTGAGGCAGGAGATGAGCAAGGATCTGGAGGAGGTGAAGGCCAAGGTGCAGC

CCTACCTGGACGACTTCCAGAAGAAGTGGCAGGAGGAGATGGAGCTCTACCGCCA

GAAGGTGGAGCCGCTGCGCGCAGAGCTCCAAGAGGGCGCGCGCCAGAAGCTGC

ACGAGCTGCAAGAGAAGCTGAGCCCACTGGGCGAGGAGATGCGCGACCGCGCGC

GCGCCCATGTGGACGCGCTGCGCACGCATCTGGC CCCCTACAGCGACGAGCTGC

GCCAGCGCTTGGCCGCGCGCCTTGAGGCTCTCAAGGAGAACGGCGGCGCCAGAC

TGGCCGAGTACCACGCCAAGGCCACCGAGCATCTGAGCACGCTCAGCGAGAAGG

CCAAGCCCGCGCTCGAGGACCTCCGCCAAGGCCTGCTGCCCGTGCTGGAGAGCT

TCAAGGTCAGCTTCCTGAGCGCTCTCGAGGAGTACACTAAGAAGCTCAACACCCA

                        表8.

MSP2(有His标签,没有长接头)的氨基酸序列(SEQ ID NO:17)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTLKLLDNWDSVTSTFS

KLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMEL

YRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELR

QRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFL

SALEEYTKKLNTQ

                        表9.

       MSP2(有His标签,有长接头)的DNA序列(SEQ ID NO:18)。

翻译起始和终止信号用黑体表示,克隆中所用的限制性内切酶位点用下划线表示。

TA CCATGGGCCATCATCATCATCATCATATAGAAGGAAGACTAAAGCTCCTTGACA

ACTGGGACAGCGTGACCTCCACCTTCAGCAAGCTGCGCGAACAGCTCGGCCCTGT

GACCCAGGAGTTCTGGGATAACCTGGAAAAGGAGACAGAGGGCCTGAGGCAGGA

GATGAGCAAGGATCTGGAGGAGGTGAAGGCCAAGGTGCAGCCCTACCTGGACGA

CTTCCAGAAGAAGTGGCAGGAGGAGATGGAGCTCTACCGCCAGAAGGTGGAGCC

GCTGCGCGCAGAGCTCCAAGAGGGCGCGCGCCAGAAGCTGCACGAGCTGCAAGA

GAAGCTGAGCCCACTGGGCGAGGAGATGCGCGACCGCGCGCGCGCCCATGTGG

ACGCGCTGCGCACGCATCTGGCCCCCTACAGCGACGAGCTGCGCCAGCGCTTGG

CCGCGCGCCTTGAGGCTCTCAAGGAGAACGGCGGCGCCAGACTGGCCGAGTACC

ACGCCAAGGCCACCGAGGATCTGAGCACGCTCAGCGAGAAGGCCAAGCCCGCGC

TCGAGGACCTCCGCCAAGGCCTGCTGCCCGTGCTGGAGAGCTTCAAGGTCAGCTT

CCTGAGCGCTCTCGAGGAGTACACTAAGAAGCTCAACACCCAGGGTACCGGTGGA

GGTAGTGGAGGTGGTACCCTAAAGCTCCTTGACAACTGGGACAGCGTGACCTCCA

CCTTCAGCAAGCTGCGCGAACAGCTCGGCCCTGTGACCCAGGAGTTCTGGGATAA

CCTGGAAAAGGAGACAGAGGGCCTGAGGCAGGAGATGAGCAAGGATCTGGAGGA

GGTGAAGGCCAAGGTGCAGCCCTACCTGGACGACTTCCAGAAGAAGTGGCAGGA

GGAGATGGAGCTCTACCGCCAGAAGGTGGAGCCGCTGCGCGCAGAGCTCCAAGA

GGGCGCGCGCCAGAAGCTGCACGAGCTGCAAGAGAAGCTGAGCCCACTGGGCGA

GGAGATGCGCGACCGCGCGCGCGCCCATGTGGACGCGCTGCGCACGCATCTGG

CCCCCTACAGCGACGAGCTGCGCCAGCGCTTGGCCGCGCGCCTTGAGGCTCTCA

AGGAGAACGGCGGCGCCAGACTGGCCGAGTACCACGCCAAGGCCACCGAGCATC

TGAGCACGCTCAGCGAGAAGGCCAAGCCCGCGCTCGAGGACCTCCGCCAAGGCC

TGCTGCCCGTGCTGGAGAGCTTCAAGGTCAGCTTCCTGAGCGCTCTCGAGGAGTA

CACTAAGAAGCTCAACACCCAGTAAT AAGCTTGC

                        表10.

MSP2(有His标签,有长接头黑体)的氨基酸序列(SEQ ID NO:19)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTGGGSGGGTLKLLDN

WDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQ

KKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRT

HLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLL

PVLESFKVSFLSALEEYTKKLNTQ

为删除绞链区,采用以下PCR引物和MSP1编码序列的Sac I和Hind III片段作 为模板,通过构建MSP1的C-末端部分以使螺旋4和5缺失。

引物A(SEQ ID NO:20):

5′-TGGAGCTCTACCGCCAGAAGGTGGAGCCCTACAGCGACGAGCT-3′/

引物B(SEQ ID NO:21):5′-GCAAGCTTATTACTGGGTGTTGAGCTTCTT-3′.

用SacI和HindIII消化扩增产物并连接入pLitmus 28进行测序。然后将pET28 载体中SacI+HindIII处理的带His标签的MSP1构建物与上述片段连接产生了 MSP1Da。

                    表11.

       MSP1D4D5的DNA序列(SEQ ID NO:22)。

翻译起始和终止信号用黑体表示;克隆中所用的限制性内切酶识别位点用下划线表示。

TATA CCATGGGCCATCATCATCATCATCATATAGAAGGAAGACTAAAGCTCCTTGA

CAACTGGGACAGCGTGACCTCCACCTTCAGCAAGCTGCGCGAACAGCTCGGCCCT

GTGACCCAGGAGTTCTGGGATAACCTGGAAAAGGAGACAGAGGGCCTGAGGCAG

GAGATGAGCAAGGATCTGGAGGAGGTGAAGGCCAAGGTGCAGCCCTACCTGGAC

GACTTCCAGAAGAAGTGGCAGGAGGAGATGGAGCTctaccgccagaaggtggagcCCTAC

AGCGACGAGCTGCGCCAGCGCTTGGCCGCGCGCCTTGAGGCTCTCAAGGAGAAC

GGCGGCGCCAGACTGGCCGAGTACCACGCCAAGGCCACCGAGCATCTGAGCACG

CTCAGCGAGAAGGCCAAACCCGCGCTCGAGGACCTCCGCCAAGGCCTGCTGCCC

GTGCTGGAGAGCTTCAAGGTCAGCTTCCTGAGCGCTCTCGAGGAGTACACTAAGA

AGCTCAACACCCAGTAAT AAGCTTGC

                      表12.

       MSP1D5D6的氨基酸序列(SEQ ID NO:23)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPYSDELRQRLAARLEALKENGGAR

LAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

以类似的方法进行螺旋5和6的删除,但两个独立的PCR步骤在第一个反应中 采用了以下引物(反应1,引物C:5′-CAGAATTCGCTAGCCGAGTACCACGCCAA-3′, SEQ ID NO:24;和引物D:5′-GCAAGCTTATTACTGGGTGTTGAGCTTCTT-3′,SEQ ID NO:25),在第二个反应中采用以下引物(反应2,引物E: 5′-ATACCATGGGCCATCATCATCATCATCATA-3′,SEQ ID NO:26;以及引物F: 5′-CAGAATTCGCTAGCCTGGCGCTCAACTTCTCTT-3′,SEQ ID NO:27)。

PCR产物编码都缺少螺旋5和6的MSP的N-和C-末端部分,且各含有一个NheI 限制性位点。用NheI、NcoI和HindIII消化PCR产物后,将片段连接入NcoI+HindIII 处理的pET28产生了缺失螺旋5和6的MSP1D6D7的DNA序列。参见图9A-9B。

                      表13.

            MSP1D6D7的DNA序列(SEQ ID NO:28)。

翻译起始和终止信号用黑体表示;克隆中所用的限制性内切酶识别位点用下划线表示。

TATA CCATGGGCCATCATCATCATCATCATATAGAAGGAAGACTAAAGCTCCTTGA

CAACTGGGACAGCGTGACCTCCACCTTCAGCAAGCTGCGCGAACAGCTCGGCCCT

GTGACCCAGGAGTTCTGGGATAACCTGGAAAAGGAGACAGAGGGCCTGAGGCAG

GAGATGAGCAAGGATCTGGAGGAGGTGAAGGCCAAGGTGCAGCCCTACCTGGAC

GACTTCCAGAAGAAGTGGCAGGAGGAGATGGAGCTCTACCGCCAGAAGGTGGAG

CCGCTGCGCGCAGAGCTCCAAGAGGGCGCGCGCCAGAAGCTGCACGAGCTGCAA

GAGAAGTTGAGCGCCAGGCTAGCCGAGTACCACGCCAAGGCCACCGAGCATCTG

AGCACGCTCAGCGAGAAGGCCAAACCCGCGCTCGAGGACCTCCGCCAAGGCCTG

CTGCCCGTGCTGGAGAGCTTCAAGGTCAGCTTCCTGAGCGCTCTCGAGGAGTACA

CTAAGAAGCTCAACACCCAGTAAT AAGCTTGC

                    表14.

      MSP1D6D7的氨基酸序列(SEQ ID NO:29)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSAR

LAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

实施例2.构建合成的MSP基团

用下列重叠性合成寡核苷酸(用PCR填满)制备了MSP1的合成基因。密码子使 用已经过优化而在大肠杆菌中表达,并已经引入限制性位点以进一步基因操作该基 因。

合成的核苷taps 1a(SEQ ID NO:30)

TACCATGGGTCATCATCATCATCATCACATTGAGGGACGTCTGAAGCTGTTGGACA

ATTGGGACTCTGTTACGTCTA

合成的核苷taps 2a(SEQ ID NO:31)

AGGAATTCTGGGACAACCTGGAAAAAGAAACCGAGGGACTGCGTCAGGAAATGTC

CAAAGAT

合成的核苷taps 3a(SEQ ID NO:32)

TATCTAGATGACTTTCAGAAAAAATGGCAGGAAGAGATGGAATTATATCGTCAA

合成的核苷taps 4a(SEQ ID NO:33)

ATGAGCTCCAAGAGAAGCTCAGCCCATTAGGCGAAGAAATGCGCGATCGCGCCCG

TGCACATGTTGATGCACT

合成的核苷taps 5a(SEQ ID NO:34)

GTCTCGAGGCGCTGAAAGAAAACGGGGGTGCCCGCTTGGCTGAGTACCACGCGA

AAGCGACAGAA

合成的核苷taps 6a(SEQ ID NO:35)

GAAGATCTACGCCAGGGCTTATTGCCTGTTCTTGAGAGCTTTAAAGTCAGTTTTCT

合成的核苷taps 1b(SEQ ID NO:36)

CAGAATTCCTGCGTCACGGGGCCCAGTTGTTCGCGAAGTTTACTGAAGGTAGACG

TAACAG

合成的核苷taps 2b(SEQ ID NO:37)

TCATCTAGATATGGCTGAACCTTGGCCTTCACCTCTTCTAAATCTTTGGACATTT

合成的核苷taps 3b(SEQ ID NO:38)

TGGAGCTCATGGAGTTTTTGGCGTGCCCCCTCTTGCAGTTCCGCACGCAGCGGTT

CCACCTTTTGACGATATAATTCCAT

合成的核苷taps 4b(SEQ ID NO:39)

GCCTCGAGACGTGCGGCCAAACGCTGGCGAAGTTCATCCGAATACGGCGCCAAAT

GAGTCCGGAGTGCATCAACAT

合成的核苷taps 5b(SEQ ID NO:40)

GTAGATCTTCCAGCGCCGGTTTCGCTTTTTCGCTCAAGGTGCTCAGGTGTTCTGTC

GCTTT

合成的核苷taps 6b(SEQ ID NO:41)

CCAAGCTTATTACTGGGTATTCAGCTTTTTAGTATATTCTTCCAGAGCTGACAGAAA

ACTGACTTT

                       表15.

   MSP1的完整的合成基因序列(SEQ ID NO:42)。

克隆中所用的限制性位点用下划线表示,翻译起始和终止信号用黑体表示。

A CCATGGGTCATCATCATCATCATCACATTGAGGGACGTCTGAAGCTGTTGGACAA

TTGGGACTCTGTTACGTCTACCTTCAGTAAAC下TCGCGAACAACTGGGCCCCGTGA

CGCAGGAATTCTGGGACAACCTGGAAAAAGAAACCGAGGGACTGCGTCAGGAAAT

GTCCAAAGATTTAGAAGAGGTGAAGGCCAAGGTTCAGCCATATCTAGATGACTTTC

AGAAAAAATGGCAGGAAGAGATGGAATTATATCGTCAAAAGGTGGAACCGCTGCG

TGCGGAACTGCAAGAGGGGGCACGCCAAAAACTCCATGAGCTCCAAGAGAAGCTC

AGCCCATTAGGCGAAGAAATGCGCGATCGCGCCCGTGCACATGTTGATGCACTCC

GGACTCATTTGGCGCCGTATTCGGATGAACTTCGCCAGCGTTTGGCCGCACGTCT

CGAGGCGCTGAAAGAAAACGGGGGTGCCCGCTTGGCTGAGTACCACGCGAAAGC

GACAGAACACCTGAGCACCTTGAGCGAAAAAGCGAAACCGGCGCTGGAAGATCTA

CGCCAGGGCTTATTGCCTGTTCTTGAGAGCTTTAAAGTCAGTTTTCTGTCAGCTCT

GGAAGAATATACTAAAAAGCTGAATACCCAGTAAT AAGCTTGG

下面是MSPp多肽的氨基酸序列,其中半重复已删除:

                     表16.

           MSP1D3(SEQ ID NO:43)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

PYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARA

HVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALE

DLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

                     表17.

             MSP 1D9(SEQ ID NO:44)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPVLESFKVSFLSALEEYTKKLNTQ

                          表18.

第一个半重复已删除的MSP的串联重复(MSP1Δ1)(SEQ ID NO:45)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

PYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARA

HVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALE

DLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTLKLLDNWDSVTSTFSKLREQLGPVT

QEFWDNLEKETEGLRQEMSPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLH

ELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEY

HAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

用“Seamless”克隆试剂盒(Stratagene)按照制造商的建议从Bayburt等,(2002) Nanoletters 2:853-856描述的MSP1的质粒构建了能表达延长的MSP的质粒。通过 PCR加入到MSP1 TEV的另一N-末端;设计了含有Nco I和Hind III限制位点的引 物。将PCR产物克隆入pET28a质粒(Novagen)在。以MSP1TEV质粒作为模板用 Quick-change试剂盒(Stratagene)制造MSP的截短突变体。通过DNA测序证实了PCR 导入的所需插入或删除及缺失突变体的存在。

用这里描述的方法表达和纯化MSP蛋白。蛋白纯度用SDS-PAGE和电雾化质谱 表征;发现纯度大于95%。购买TEV蛋白酶表达系统(Science Reagents,Inc.,Atlanta, GA)并经某些微小改进后使用。如Segrest等,(1999)J.Biol.Chem.274:31755-31758 所述,根据反平行二聚体环带模型的盐键评分优化了新支架蛋白的序列。首先,产 生了延伸突变体的氨基酸序列,从而使各个中心螺旋(从H3到H7)(见图19)依次插入 到其它中心螺旋之间的每个位置上,即在H3、H4、H5和H6之后,并计算出所产生 的支架蛋白中反平行二聚体所有可能构型的相同电荷的有利盐键数减去不利接触数 (Segrest(1999)同上)。其结果是,选择图20所示的插入突变体作为优化的最大盐键 评分。将这些N末端都含有不同标签序列的延伸支架蛋白以及截短的支架蛋白在大 肠杆菌经基因工程改造后以高产率表达并用标准方法纯化。

参照以下蛋白质和DNA序列,可总结出我们采用的MSP具有以下连接结构。注 意,H1、H2指螺旋1等的序列。His是(His)6标签,TEV是烟草病毒蛋白酶,X是 X因子(10)蛋白酶位点。

                          表19

                     MSP构件的氨基酸序列

GLOB                DEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLN

                    (SEQ ID NO:89)

HisX                MGHHHHHHIEGR                  (SEQ ID NO:47)

HisTEV              MGHHHHHHHDYDIPTTENLYFQG       (SEQ ID NO:48)

螺旋1(H1):         LKLLDNWDSVTSTFSKLREQLG        (SEQ ID NO:49)

螺旋2(H2):         PVTQEFWDNLEKETEGLRQEMS        (SEQ ID NO:50)

螺旋3(H3):         KDLEEVKAKVQ                   (SEQ ID NO:51)

螺旋4(H4):         PYLDDFQKKWQEEMELYRQKVE        (SEQ ID NO:52)

螺旋5(H5):         PLRAELQEGARQKLHELQEKLS        (SEQ ID NO:53)

螺旋6(H6):         PLGEEMRDRARAHVDALRTHLA        (SEQ ID NO:54)

螺旋7(H7):         PYSDELRQRLAARLEALKENGG        (SEQ ID NO:55)

螺旋8(H8):         ARLAEYHAKATEHLSTLSEKAK        (SEQ ID NO:56)

螺旋9(H9):         PALEDLRQGLL                   (SEQ ID NO:57)

螺旋10(H10):       PVLESFKVSFLSALEEYTKKLNTQ      (SEQ ID NO:58)

螺旋0.5(H0.5):     STFSKLREQLG                   (SEQ ID NO:59)

螺旋10.5(H10.5):   SALEEYTKKLNTQ                 (SEQ ID NO:87)

螺旋2S(H2):        PVTQEFWDNLEKETEGLRQEMS        (SEQ ID NO:136)

                       表20

              表19的MSP构建的编码序列

HisX             ATGGGTCATCATCATCATCATCACATTGAGGGACGT

                                           (SEQ ID NO:60)

HisTEV           ATGGGTCATCATCATCATCATCATCACGATTATGATATTCCTA

                 CTACTGAGAATTTGTATTTTCAGGGT    (SEQ ID NO:61)

螺旋1(H1):      CTGAAGCTGTTGGACAATTGGGACTCTGTTACGTCTACCTTC

                 AGTAAACTTCGCGAACAACTGGGC    (SEQ ID

                 NO:62)

螺旋2(H2):      CCCGTGACGCAGGAATTCTGGGACAACCTGGAAAAAGAAAC

                 CGAGGGACTGCGTCAGGAAATGTCC    (SEQ ID NO:63)

螺旋3(H3):      AAAGATTTAGAAGAGGTGAAGGCCAAGGTTCAG

                                      (SEQ ID NO:64)

螺旋4(H4):      CCATATCTCGATGACTTTCAGAAAAAATGGCAGGAAGAGATG

                 GAATTATATCGTCAAAAGGTGGAA    (SEQ ID NO:65)

螺旋5(H5):      CCGCTGCGTGCGGAACTGCAAGAGGGGGCACGCCAAAAAC

                 TCCATGAGCTCCAAGAGAAGCTCAGC   (SEQ ID NO:66)

螺旋6(H6):      CCATTAGGCGAAGAAATGCGCGATCGCGCCCGTGCACATGT

                 TGATGCACTCCGGACTCATTTGGCG    (SEQ ID NO:67)

螺旋7(H7):      CCGTATTCGGATGAACTTCGCCAGCGTTTGGCCGCACGTCT

                 CGAGGCGCTGAAAGAAAACGGGGGT    (SEQ ID NO:68)

螺旋8(H8):      GCCCGCTTGGCTGAGTACCACGCGAAAGCGACAGAACACCT

                 GAGCACCTTGAGCGAAAAAGCGAAA    (SEQ ID NO:69)

螺旋9(H9):      CCGGCGCTGGAAGATCTACGCCAGGGCTTATTG

                                              (SEQ ID NO:70)

螺旋10(H10):    CCTGTTCTTGAGAGCTTTAAAGTCAGTTTTCTGTCAGCTCTG

                 GAAGAATATACTAAAAAGCTGAATACCCAG  (SEQ ID NO:71)

螺旋0.5(H0.5):  TCTACCTTCAGTAAACTTCGCGAACAACTGGGC

                                                (SEQ ID NO:72)

螺旋10.5(H10.5):CAGTTTTCTGTCAGCTCTGGAAGAATATACTAAAAAGCTGAATACCCAG

                                   (SEQ ID NO:88)

螺旋2S(H2S):    TCCGTGACGCAGGAATTCTGGGACAACCTGGAAAAAGAAACCGAGGGACTGCGTCAGG

                 AAATGTCC          (SEQ ID NO:90)

用于本发明的几种具体的MSP序列是上述序列的以下组合,如表21或其它的表 所示。

                       表21

      用于制备纳米圆盘的经基因工程改造的MSP

MSP1        HisX-H1-H2-H3-H4-H5-H6-H7-H8-H9-H10          (SEQ ID NO:6)

MSP1E1      HisX-H1-H2-H3-H4-H4-H5-H6-H7-H8-H9-H10       (SEQ ID NO:73)

MSP1E2      HisX-H1-H2-H3-H4-H5-H4-H5-H6-H7-H8-H9-H10    (SEQ ID NO:74)

MSP1E3      HisX-H1-H2-H3-H4-H5-H6-H4-H5-H6-H7-H8-H9-H10 (SEQ ID NO:75)

MSP1TEV     HisTev-H1-H2-H3-H4-H5-H6-H7-H8-H9-H10        (SEQ ID NO:76)

MSP1NH      H1-H2-H3-H4-H5-H6-H7-H8-H9-H10               (SEQ ID NO:77)

MSP1T2      HisTev-H0.5-H2-H3-H4-H5-H6-H7-H8-H9-H10      (SEQ ID NO:78)

MSP1T2NH    H0.5-H2-H3-H4-H5-H6-H7-H8-H9-H10             (SEQ ID NO:79)

MSP1T3      HisTev-H2-H3-H4-H5-H6-H7-H8-H9-H10           (SEQ ID NO:80)

MSP1D3      HisX-H1-H2-H4-H5-H6-H7-H8-H9-H10             (SEQ ID NO:43)

MSP1D9      HisX-H1-H2-H3-H4-H5-H6-H7-H8-H10             (SEQ ID NO:44)

MSP1D5D6    HisX-H1-H2-H3-H4-H7-H8-H9-H10                (SEQ ID NO:23)

MSP1D6D7    HisX-H1-H2-H3-H4-H5-H8-H9-H10                (SEQ ID NO:82)

MSP1D3D9    HisX-H1-H2-H4-H5-H6-H7-H8-H10                (SEQ ID NO:83)

MSP1D10.5   HisX-H1-H2-H3-H4-H5-H6-H7-H8-H9-H10.5        (SEQ ID NO:84)

MSP1D3D10.5 HisX-H1-H2-H4-H5-H6-H7-H8-H9-H10.5           (SEQ ID NO:85)

MSP1T4      HisTEV-H2S-H3-H4-H5-H6-H7-H8-H9-H10          (SEQ ID NO:91)

ApoA-1      GLOB-H1-H2-H3-H4-H4-H5-H6-H5-H6-H7-H8-H9-H10

MSP1T5      HisTev-H2.5-H3-H4-H5-H6-H7-H8-H9-H10         (SEQ ID NO:92)

MSP1T6      HisTev-H3-H4-H5-H6-H7-H8-H9-H10              (SEQ ID NO:93)

MSP1E3TEV: HisTev-H1-H2-H3-H4-H5-H6-H4-H5-H6-H7-H8-H9-H10

                                                         (SEQ ID NO:94)

MSP1E3D1:  HisTev-H0.5-H2-H3-H4-H5-H6-H4-H5-H6-H7-H8-H9-H10

                                                         (SEQ ID NO:95)

MSP2TEV:   HisTev-H1-H2-H3-H4-H5-H6-H7-H8-H9-H10-GT-H1-H2-H3-H4-H5-

            H6-H7-H8-H9-H10                              (SEQ ID NO:96)

MSP1N1:    His-TEV-H2S-H3-H4-H4-H5-H6-H7-H8-H9          (SEQ ID NO:97)

MSP2N1:    HisTev-H0.5-H2-H3-H4-H5-H6-H7-H8-H9-H10-GT-H0.5-H2-H3-H4-

            H5-H6-H7-H8-H9-H10                           (SEQ ID NO:98)

MSP2N2:    HisTev-H0.5-H2-H3-H4-H5-H6-H7-H8-H9-H10-GT-H2-H3-H4-

            H5-H6-H7-H8-H9-H10                           (SEQ ID NO:99)

除了这些序列,有两个供参考的融合蛋白(串联重复性MSP)构建物。它们由通过 Gly-Thr接头连接的两个MSP1构建物组成:

MSP2(MSP1-Gly-Thr-MSP1,SEQ ID NO:17)和MSP2D1D1(MSP1T3-Gly-Thr-H2- H3-H4-H5-H6-H7-H8-H9-H10,SEQ ID NO:86)。

容易产生的其它构建物包括上述序列的置换物,即MSP1或带有短或长接头序列 的串联重复性MSP与以下元件的任意组合:绞链删除、绞链置换、半重复删除、组 氨酸标签、MSP2类似物的不同接头。

表22和23分别给出了MSP1T4的编码序列和氨基酸序列。

                            表22

       编码MSP1T4的DNA序列(SEQ ID NO:100)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttccgtgacgcaggaattc

tgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggt

tcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtg

cggaactgcaagagggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcg

cgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcac

gtctcgaggcgctgaaagaaaacgggggtgcccgcttcggctgagtaccacgcgaaagcgacagaacacctgagcacc

ttgagcgaaaaagcgaaaccggcgctggaagatctacgccagggcttattgcctgttcttgagagctttaaagtcagttttct

gtcagctctggaagaatatactaaaaagctgaatacccag

                              表23

           MSP1T4的氨基酸序列(SEQ ID NO:91)

MGHHHHHHHDYDIPTTENLYFQGSVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQ

PYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARA

HVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALE

DLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

在MSP1T5的示意图中,H2.5表示第二半H2螺旋序列,即MSP序列中不包括 最后33个核苷酸或11个氨基酸。该蛋白质的编码序列和氨基酸序列分别示于表24 和25。

                            表24

            编码MSP1T5的DNA序列(SEQ ID NO:101)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggtaaagaaaccgaggga

ctgcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatg

gcaggaagagatggaattatatcgtcaaaaggtggaaccgctgccgtgcggaactgcaagagggggcacgccaaaaa

ctccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcg atcgcgcccgtgcacatgttgatgcactcc

ggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggt

gcccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctgg

aagatctacgccagggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagct

gaatacccag

                          表25

         MSP1T5的氨基酸序列(SEQ ID NO:92)

MGHHHHHHHDYDIPTTENLYFQGKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQ

EEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPY

SDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESF

KVSFLSALEEYTKKLNTQ

                           表26

          编码MSP1T6的DNA序列(SEQ ID NO:102)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggtaaagatttagaagaggt

gaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtgg

aaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggc

gaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccag

cgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagtaccacgcgaaagcgacagaa

cacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagggcttattgcctgttcttgagagcttt

aaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccag

                              表27

             MSP1T6的氨基酸序列(SEQ ID NO:93)

MGHHHHHHHDYDIPTTENLYFQGKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVE

PLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAAR

LEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEY

TKKLNTQ

MSP1T5和MSP1T6圆盘制品在所有装配条件下都是不均匀的。其结果高度取决 于具体的装配条件。

在以下MSP构建物(MSP1N1)中不包括H10并插入了两个H4基序。表28和29 分别给出了其编码序列和氨基酸序列。设计的这种MSP增加了螺旋间界面可能的盐 桥数。

                       表28

           编码MSP1N1的DNA序列(SEQ ID NO:103)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttccgtgacgcaggaattc

tgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggt

tcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccatatctcga

tgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagag

ggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgc

acatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctga

aagaaaacgggggtgcccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagc

gaaaccggcgctggaagatctacgccagggcttattg

                        表29

              MSP1N1的氨基酸序列(SEQ ID NO:97)

MGHHHHHHHDYDIPTTENLYFQGSVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQ

PYLDDFQKKWQEEMELYRQKVEPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQ

KLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLA

EYHAKATEHLSTLSEKAKPALEDLRQGLL

以下“延伸的”MSP掺入了可切除的His标签并采用了TEV蛋白酶识别位点。

                            表30

编码MSP1E3TEV(HisTev-H1-H2-H3-H4-H5-H6-H4-H5-H6-

H7-H8-H9-H10)的DNA序列(SEQ ID NO:105)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggtctgaagctgttggacaat

tgggactctgttacgtctaccttcagtaaacttcgcgaacaactgggccccgtgacggcaggaattctgggacaacctggaa

aaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgat

gactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagag

ggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgc

acatgttcgatgcactccggactcatttggcgccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatat

cgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaagagaagc

tcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcgg

atgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagtaccacgc

gaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagggcttattgc

ctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccag

                                 表31

           MSP1E3TEV的氨基酸序列(SEQ ID NO:94)

MGHHHHHHHDYDIPTTENLYFQGLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEK

ETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQK

LHELQEKLSPLGEEMRDRARAHVDALRTHLAPYLDDFQKKWQEEMELYRQKVEPLRA

ELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEAL

KENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKL

NTQ

                            表32

           编码MSP1E3D1的DNA序列(SEQ ID NO:106)

(HisTev-H0.5-H2-H3-H4-H5-H6-H4-H5-H6-H7-H8-H9-H10)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttctaccttcagtaaacttc

gcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgccgtcaggaaat

gtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatg

gaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaa

gagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgcc

atatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcgggaac

tgcaagagggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcg

cgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcg

aggcgctgaaagaaaacgggggtgcccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagc

gaaaaagcgaaaccggcgctggaagatctacgccagggcttattgcctgttcttgagagctttaaagtcagttttctgtcagc

tctggaagaatatactaaaaagctgaatacccag

                             表33

           MSP1E3D1的氨基酸序列(SEQ ID NO:95)

MGHHHHHHHDYDIPTTENLYFQGSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSK

DLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLG

EEMRDRARAHVDALRTHLAPYLDDFQKKWQEEM ELYRQKVEPLRAELQEGARQKLH

ELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEY

HAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

设计了含有N-末端TEV可切除His标签的与MSP2相对应的蛋白质。表34和 35分别给出了其编码序列和氨基酸序列。

                         表34

编码MSP2TEV(HisTev-H1-H2-H3-H4-H5-H6-H7-H8-H9-H10-

GT-H1-H2-H3-H4-H5-H6-H7-H8-H9-H10)的DNA序列(SEQ ID NO:107)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggtctaaagctccttgacaac

tgggacagcgtgacctccaccttcagcaagctgcgcgaacagctcggccctgtgacccaggagttctgggataacctgg

aaaaggagacagagggcctgaggcaggagatgagcaaggatctggaggaggtgaaggccaaggtgcagccctacc

tggacgacttccagaagaagtggcaggaggagatggagctctaccgccagaaggtggagccgctgcgcgcagagctc

caagagggcgcgcgccagaagctgcacgagctgcaagagaagctgagcccactgggcgaggagatgcgcgaccgc

gcgcgcgcccatgtggacgcgctgcgcacgcatctggccccctacagcgacgagctgcgccagcgcttggccgcgcgc

cttgaggctctcaaggagaacggcggcgccagactggccgagtaccacgccaaggccaccgagcatctgagcacgct

cagcgagaaggccaagcccgcgctcgaggacctccgccaaggcctgctgcccgtgctggagagcttcaaggtcagctt

cctgagcgctctcgaggagtacactaagaagctcaacacccagggtaccctaaagctccttgacaactgggacagcgtg

acctccaccttcagcaagctgcgcgaacagctcggccctgtgacccaggagttctgggataacctggaaaaggagaca

gagggcctgaggcaggagatgagcaaggatctggaggaggtgaaggccaaggtgcagccctacctggacgacttcca

gaagaagtggcaggaggagatggagctctaccgccagaaggtggagccgctgcgcgcagagctccaagagggcgc

gcgccagaagctgcacgagctgcaagagaagctgagcccactgggcgaggagatgcgcgaccgcgcgcgcgcccat

gtggacgcgctgcgcacgcatctggccccctacagcgacgagctgcgccagcgcttggccgcgcgccttgaggctctca

aggagaacggcggcgccagactggccgagtaccacgccaaggccaccgagcatctgagcacgctcagcgagaagg

ccaagcccgcgctcgaggacctccgccaaggcctgctgcccgtgctggagagcttcaaggtcagcttcctgagcgctctc

gaggagtacactaagaagctcaacacccag

                     表35

         HisTEV-MSP2的氨基酸序列(SEQ ID NO:96)

MGHHHHHHHDYDIPTTENLYFQGLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGL

RQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKA

KPALEDLRQGLLPVLESFKVSFLSALEYTKKLNTQGTLKLLDNWDSVTSTFSKLREQLGPVTQE

FWDNLEKETEGLRQEMKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQ

KLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAK

ATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

设计了新的构建物以制备用来产生只含有一个多肽序列的纳米圆盘的“线性二聚 体”。这些二聚体是利用了我们所知的MSP1序列重要部分的融合体,称为“MSP2 衍生物”。所有都具有TEV蛋白酶可切除的His标签。

                                表36

编码MSP2N1(HisTev-H0.5-H2-H3-H4-H5-H6-H7-H8-H9-H10-GT-H1/2-

H2-H3-H4-H5-H6-H7-H8-H9-H10)的DNA序列(SEQ ID NO:108)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttctaccttcagtaaacttc

gcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaat

gtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatg

gaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaa

gagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgcc

gtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagt

accacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagg

gcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagggtac

cttcagtaaacttcgcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggact

gcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggc

aggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactc

catgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccgga

ctcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgccc

gcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaaga

tctacgccagggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaat

acccag

                     表37

           MSP2N1的氨基酸序列(SEQ ID NO:98)

MGHHHHHHHDYDIPTTENLYFQGSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSK

DLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLG

EEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTL

SEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTFSKLREQLGPVTQEFW

DNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQE

GARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENG

GARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

                     表38

编码MSP2N2的DNA序列(SEQ ID NO:109)(HisTev-H0.5-H2-H3-H4-H5-

H6-H7-H8-H9-H10-GT-H2-H3-H4-H5-H6-H7-H8-H9-H10)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttctaccttcagtaaacttc

gcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaat

gtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatg

gaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaa

gagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgcc

gtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagt

accacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagg

gcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagggtac

cccagtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttaga

agaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaa

aaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaagagaagctcagcc

cattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatgaact

tcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagtaccacgcgaaagc

gacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagggcttattgcctgttctt

gagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccag

                           表39

            MSP2N2的氨基酸序列(SEQ ID NO:99)

MGHHHHHHHDYDIPTTENLYFQGSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSK

DLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLG

EEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTL

SEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTPVTQEFWDNLEKETEG

LRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHEL

QEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHA

KATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

设计了MSP2的另一衍生物(MSP2N3),它在H1螺旋序列的接头部分之后含有螺 旋2-10。表40和41分别给出了其DNA编码序列和氨基酸序列。

                        表40

编码MSP2N3(HisTev-H0.5-H2-H3-H4-H5-H6-H7-H8-H9-H10-GTREQLG-

H2-H3-H4-H5-H6-H7-H8-H9-H10)的DNA序列(SEQ ID NO:110)

Atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttctaccttcagtaaacttc

gcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaat

gtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatg

gaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaa

gagaagctcagcccattaggcgaagaaatgcgcgatcgcgccccgtgcacatgttgatgcactccggactcatttggcgcc

gtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagt

accacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagg

gcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagggtac

ccgcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaa

atgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagaga

tggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctcc

aagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcg

ccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctga

gtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccag

ggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagtaag

ctt

                              表41

            MSP2N3的氨基酸序列(SEQ ID NO:111)

MGHHHHHHHDYDIPTTENLYFQGSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSK

DLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLG

EEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTL

SEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTREQLGPVTQEFWDNLE

KETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQ

KLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLA

EYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

与MSP2和MSP2TEV不同,这些蛋白质以300∶1至400∶1的摩尔比与脂质自装 配,优先形成明显较大的颗粒(斯托克斯直径约15.5nm,对应于计算出的推测的圆盘 形状的直径约17nm)。

设计了新的二聚体序列(即串联重复性MSP),其融合区由两个高度倾向于形成β- 转角的不同的接头组成(Creighton,Proteins,p.226)。特别设计了这些支架蛋白以促 进纳米圆盘中的反平行螺旋-转角-螺旋结构(的形成)。构建的支架蛋白包含MSP1T3 以及本文所述的专门设计的新支架蛋白MSP1N1和环形置换的MSP2N5,它具有改 进的两性螺旋序列优化了反平行螺旋-转角-螺旋结构中两个支架蛋白之间形成的盐 桥。

串联重复性MSP的通用方案是MSP-接头-MSP,其中的接头可以是下面定义的 接头1和接头2序列,MSP可以是前面定义的任何单体膜支架蛋白。接头1(Lb1)由 4个氨基酸组成,优选具有序列Asn-Pro-Gly-Thr(SEQ ID NO:104)。接头2(Lb2)由6 个氨基酸组成,其在两个末端都有一个额外的残基可提供更大的屈曲,优选具有序 列Ser-Asn-Pro-Gly-Thr-Gln(SEQ ID NO:136)。

                        表42

编码MSP2N4(His-TEV-H2S-H3-H4-H5-H6-H7-H8-H9-H10-NPGT-

H2-H3-H4-H5-H6-H7-H8-H9-H10)的DNA序列(SEQ ID NO:112)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttccgtgac

gcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagagg

tgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaag

gtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaagagaagctcagcc

cattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatg

aacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagtaccacgc

gaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagggcttat

tgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagaatccag

gtacccccgtgacgcag gaattctgggacaacctggaa aaagaaaccgagggactgcgtcaggaaatgtccaaa

gatttagaagag gtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaatt

atatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaag

agaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcg

ccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggct

gagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctac

gccagggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatac

ccag

                         表43

               MSP2N4的氨基酸序列(SEQ ID NO:113)

MGHHHHHHHDYDIPTTENLYFQGSVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQ

PYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARA

HVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALE

DLRQGLLPVLESFKVSFLSALEEYTKKLNTQNFGTPVTQEFWDNLEKETEGLRQEMSK

DLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLG

EEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTL

SEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

                     表44。

编码MSP2N5(His-TEV-H2S-H3-H4-H4-H5-H6-H7-H8-H9-NPGT-

H3-H4-H4-H5-H6-H7-H8-H9-H2)的DNA序列(SEQ ID NO:114)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttccgtgacgcaggaattc

tgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggt

tcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccatatctcga

tgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagag

ggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgc

acatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctga

aagaaaacgggggtgcccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagc

gaaaccggcgctggaagatctacgccagggcttattgaatccaggtaccaaagatttagaagaggtgaaggccaaggtt

cagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccatatctcgat

gactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagag

ggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgc

acatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctga

aagaaaacgggggtgcccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagc

gaaaccggcgctggaagatctacgccagggcttattgcccgtgacgcaggaattctgggacaacctggaaaaagaaac

cgagggactgcgtcaggaaatgtcc

                        表45

             MSP2N5的氨基酸序列(SEQ ID NO:115)

MGHHHHHHHDYDIPTTENLYFQGSVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQ

PYLDDFQKKWQEEMELYRQKVEFYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQ

KLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLA

EYHAKATEHLSTLSEKAKPALEDLRQGLLNPGTKDLEEVKAKVQPYLDDFQKKWQEE

MELYRQKVEPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGE

EMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLS

EKAKPALEDLRQGLLPVTQEFWDNLEKETEGLRQEMS

                       表46

编码MSP2N6(His-TEV-H2S-H3-H4-H4-H5-H6-H7-H8-H9-SNPGTQ-

H3-H4-H4-H5-H6-H7-H8-H9-H2)的DNA序列(SEQ ID NO:116)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttccgtgacgcaggaattc

tgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagaggtgaaggccaaggt

tcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatccgtcaaaaggtggaaccatatctcga

tgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagag

ggggcaccgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgc

acatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctga

aagaaaaccgggggtgcccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagc

gaaaccggcgctggaagatctacgccagggcttattgtccaatccaggtacccaaaaagatttagaagaggtgaaggcc

aaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccata

tctcgatgactttcagaaaaaatggcaggaagagatggaattatatccgtcaaaaggtggaaccgctgcgtgcggaactgc

aagagggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaaatgcgcgatcgcgc

ccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatgaacttccgccagcgtttggccgcacgtctcgagg

cgctgaaagaaaacgggggtgccccgcttggctgagtaccacgcgaaagcgacagaacacctgagcaccttgagcgaa

aaagcgaaaccggcgctggaagatctacgccagggcttattgcccgtgacgcaggaattctgggacaacctggaaaaa

gaaaccgagggactgcgtcaggaaatgtcc

                         表47

          MSP2N6的氨基酸序列(SEQ ID NO:117)

MGHHHHHHHDYDIPTTENLYFQGSVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQ

PYLDDFQKKWQEEMELYRQKVEPYLDDFQKKWQEEMELYRQKYEPLRAELQEGARQ

KLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLA

EYHAKATEHLSTLSEKAKPALEDLRQGLLSNPGTQKDLEEVKAKVQPYLDDFQKKWQ

EEMELYRQKVEPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPALEDLRQGLLPVTQEFWDNLEKETEGLRQEMS

构建了膜支架蛋白与其它蛋白质和肽的融合构建物。含有细胞色素P450还原酶 (CPR)的融合物包括以下:

                           表48

编码MSP2CPR(MSP2-接头-CPR,接头氨基酸序列是VD,CPR是大鼠细胞色素

P450还原酶完整序列)的DNA序列(SEQ ID NO:118)

atgggtcatcatcatcatcatcacattgagggacgtctgaagctgttggacaattgggactctgttacgtctaccttcagtaaa

cttcgcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcagga

aatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagag

atggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctc

caagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggc

gccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctg

agtaccacgcgaaagccgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgcca

gggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagggt

accctgaagctgttggacaattgggactctgttacgtctaccttcagtaaacttcgcgaacaactgggccccgtgacgcagg

aattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaatgtccaaagatttagaagaggtgaaggcc

aaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatggaattatatcgtcaaaaggtggaaccgct

gcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaagagaagctcagcccattaggcgaagaa

atgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgccgtattcggatgaacttcgccagcgtttggc

cgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagtaccacgcgaaagcgacagaacacctga

gcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccagggcttattgcctgttcttgagagctttaaagtca

gttttctgtcagctctggaagaatatactaaaaagctgaatacccagtcgaccatgggagactctcacgaagacaccagtg

ccaccatgcctgaggccgtggctgaagaagtgtctctattcagcacgacggacatggttctgttttctctcatcgtgggggtcc

tgacctactggttcatctttagaaagaagaaagaagagataccggagttcagcaagatccaaacaacggccccacccgt

caaagagagcagcttcgtggaaaagatgaagaaaacgggaaggaacattatcgtattctatggctcccagacgggaac

cgctgaggagtttgccaaccggctgtccaaggatgcccaccgctacgggatgcggggcatgtccgcagaccctgaaga

gtatgacttggccgacctgagcagcctgcctgagatcgacaagtccctggtagtcttctgcatggccacatacggagaggg

cgaccccacggacaatgcgcaggacttctatgactggctgcaggagactgacgtggacctcactggggtcaagtttgctgt

atttggtcttgggaacaagacctatgagcacttcaatgccatgggcaagtatgtggaccagcggctggagcagcttggcgc

ccagcgcatctttgagttgggccttggtgatgatgacgggaacttggaagaggatttcatcacgtggagggagcagttctgg

ccagctgtgtgcgagttctttggggtagaagccactggggaggagtcgagcattcgccagtatgagctcgtggtccacgaa

gacatggacgtagccaaggtgtacacgggtgagatgggccgtctgaagagctacgagaaccagaaaccccccttcgat

gctaagaatccattcctggctgctgtcaccgccaaccggaagctgaaccaaggcactgagcggcatctaatgcacctgg

agttggacatctcagactccaagatcaggtatgaatctggagatcacgtggctgtgtacccagccaatgactcagccctgg

tcaaccagattggggagatcctgggagctgacctggatgtcatcatgtctctaaacaatctcgatgaggagtcaaacaaga

agcatccgttcccctgccccaccacctaccgcacggccctcacctactacctggacatcactaacccgccacgcaccaat

gtgctctacgaactggcacagtacgcctcagagccctcggagcaggagcacctgcacaagatggcgtcatcctcaggcg

agggcaaggagctgtacctgagctgggtggtggaagcccggaggcacatcctagccatcctccaagactacccatcact

gccggccacccatcgaccacctgtgtgagctgctgccacgcctgcaggcccgatactactccattgcctcatcctccaaggt

ccaccccaactccgtgcacatctgtgccgtggccgtggagtacgaagcgaagtctggccgagtgaacaagggggtggc

cactagctggcttcgggccaaggaaccagcaggcgagaatggcggccgcgccctggtacccatgttcgtgcgcaaatct

cagttccgcttgcctttcaagtccaccacacctgtcatcatggtgggccccggcactgggattgcccctttcatgggcttcatc

caggaacgagcttggcttcgagagcaaggcaaggaggtgggagagacgctgctatactatggctgccggcgctcggat

gaggactatctgtaccgtgaagagctagcccgcttccacaaggacggtgccctcacgcagcttaatgtggccttttcccgg

gagcaggcccacaaggtctatgtccagcaccttctgaagagagacagggaacacctgtggaagctgatccacgagggc

ggtgcccacatctatgtgtgcggggatgctcgaaatatggccaaagatgtgcaaaacacattctatgacattgtggctgagt

tcgggcccatggagcacacccaggctgtggactatgttaagaagctgatgaccaagggccgctactcactagatgtgtgg

agc

                       表49

         MSP2CPR的氨基酸序列(SEQ ID NO:119)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWD NLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGTLKLLDNWDSVTSTFS

KLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMEL

YRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELR

QRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFL

SALEEYTKKLNTQSTMGDSHEDTSATMPEAVAEEVSLFSTTDMVLFSLIVGVLTYWFIF

RKKKEEIPEFSKIQTTAPPVKESSFVEKMKKTGRNIIVFYGSQTGTAEEFANRLSKDAH

RYGMRGMSADPEEYDLADLSSLPEIDKSLVVFCMATYGEGDPTDNAQDFYDWLQETD

VDLTGVKFAVFGLGNKTYEHFNAMGKYVDQRLEQLGAQRIFELGLGDDDGNLEEDFIT

WREQFWPAVCEFFGVEATGEESSIRQYELVVHEDMDVAKVYTGEMGRLKSYENQKP

PFDAKNPFLAAVTANRKLNQGTERHLMHLELDISDSKIRYESGDHVAVYPANDSALVN

QIGEILGADLDVIMSLNNLDEESNKKHPFPCPTTYRTALTYYLDITNPPRTNVLYELAQY

ASEPSEQEHLHKMASSSGEGKELYLSWVVEARRHILAILQDYPSLRPPIDHLCELLPRL

QARYYSIASSSKVHPNSVHICAVAVEYEAKSGRVNKGVATSWLRAKEPAGENGGRAL

VPMFVRKSQFRLPFKSTTPVIMVGPGTGIAPFMGFIQERAWLREQGKEVGETLLYYGC

RRSDEDYLYREELARFHKDGALTQLNVAFSREQAHKVYVQHLLKRDREHLWKLIHEG

GAHIYVCGDARNMAKDVQNTFYDIVAEFGPMEHTQAVDYVKKLMTKGRYSLDVWS

制备了含有荧光蛋白(FP)和MSP序列的融合物。所有构建物的形式为 His-TEV2-(FP)-MSP1T2或His-TEV-MSP1T2-GT-(FP),其中,(FP)是增强型绿色荧光 蛋白(EGFP)、增强型黄色荧光蛋白(EYFP)或青色荧光蛋白(CFP)。

所有的N-末端序列的形式为:His-TEV2(已经过修饰在该序列中插入了BamH1限 制性位点)。修饰的His-TEV2的DNA序列为 atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggatcc(SEQ ID NO:120), 修饰的His-TEV2的蛋白质序列为

MGHHHHHHHDYDIPTTENLYFQGS(SEQ ID NO:121)。

这些荧光蛋白具有以下的DNA和蛋白质序列:

                                表50

        编码EGFP的DNA序列(SEQ ID NO:122)

gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaag

ttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagc

tgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaag

cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaacta

caagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaagg

aggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcag

aagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactacca

gcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagca

aagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacg

agctgtacaag

                         表51

             EGFP的氨基酸序列(SEQ ID NO:123)

VSKGEELFTGWPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWP

TLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFE

GDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGS

VQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGM

DELYK

                            表52

           编码EYFP的DNA序列(SEQ ID NO:124)

gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaag

ttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagc

tgcccgtgccctggcccaccctcgtgaccaccttcggctacggcctgcagtgcttcgcccgctaccccgaccacatgaagc

agcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactac

aagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaagga

ggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcaga

agaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccag

cagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagctaccagtccgccctgagcaaa

gaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagc

tgtacaag

                          表53

          EYFP的氨基酸序列(SEQ ID NO:125)

VSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWP

TLVTTFGYGLQCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFE

GDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGS

VQLADHYQQNTPIGDGPVLLPDNHYLSYQSALSKDPNEKRDHMVLLEFVTAAGITLGM

DELYK

                              表54

       编码ECFP的DNA序列(SEQ ID NO:126)

gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaag

ttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagc

tgcccgtgccctggcccaccctcgtgaccaccctgacctggggcgtgcagtgcttcagccgctaccccgaccacatgaag

cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaacta

caagacccgcgccgaggtgaagttcgagggcggacaccctggtgaaccgcatcgagctgaagggcatcgacttcaagg

aggacggcaacatcctggggcacaagctggagtacaactacatcagccacaacgtctatatcaccgccgacaagcag

aagaacggcatcaaggccaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactacca

gcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagca

aagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacg

agctgtacaagtaa

                            表55

           ECFP的氨基酸序列(SEQ ID NO:127)

VSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWP

TLVTTLTWGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFE

GDTLVNRIELKGIDFKEDGNILGHKLEYNYISHNVYITADKQKNGIKANFKIRHNIEDGSV

QLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMD

ELYK

                          表56

  编码His-TEV-MSP1T2-GT的DNA序列(SEQ ID NO:128)

atgggtcatcatcatcatcatcatcacgattatgatattcctactactgagaatttgtattttcagggttctaccttcagtaaacttc

gcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcaggaaat

gtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagagatg

gaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctccaa

gagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcgcc

gtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctgagt

accacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaacccggcgctggaagatctacgccagg

gcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccagggtac

c

                      表57

   His-TEV-MSP1T2-GT的氨基酸序列(SEQ ID NO:129)

MGHHHHHHHDYDIPTTENLYFQGSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSK

DLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLG

EEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTL

SEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQGT

通过点突变在支架蛋白中掺入半胱氨酸残基制备了MSP衍生物。表58和59分 别给出了其DNA编码序列和氨基酸序列。在MSP1RC12′中,X因子识别位点中的至 少一个残基处掺入了一个半胱氨酸残基。这种突变体可用于制备荧光标记的圆盘及 附着于表面或基质上。在MSP1K90C中,赖氨酸90被半胱氨酸替代。见表60和61 分别显示了其编码序列和氨基酸序列。在MSP1K152C中,赖氨酸152被半胱氨酸替 代,见表62和63。

                       表58

        编码MSP1RC12′的DNA序列(SEQ ID NO:130)

Atgggtcatcatcatcatcatcacattgagggatgtctgaagctgttggacaattgggactctgttacgtctaccttcagtaaa

cttcgcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcagga

aatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagag

atggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctc

caagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggc

gccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctg

agtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgcca

gggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccag

                         表59

       MSP1RC12′的蛋白质序列(SEQ ID NO:131)

MGHHHHHHIEGCLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

                      表60

     编码MSP1K90C的DNA序列(SEQ ID NO:132)

atgggtcatcatcatcatcatcacattgagggacgtctgaagctgttggacaattgggactctgttacgtctaccttcagtaaa

cttcgcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcagga

aatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagag

atggaattatatcgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaatgtctccatgagctcc

aagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggcg

ccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctga

gtaccacgcgaaagcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgccag

ggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccag

                        表61

         MSP1K90C的蛋白质序列(SEQ ID NO:133)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQCLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLS

TLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

                            表62

     编码MSP1K152C的DNA序列(SEQ ID NO:134)

atgggtcatcatcatcatcatcacattgagggacgtctgaagctgttggacaattgggactctgttacgtctaccttcagtaaa

cttcgcgaacaactgggccccgtgacgcaggaattctgggacaacctggaaaaagaaaccgagggactgcgtcagga

aatgtccaaagatttagaagaggtgaaggccaaggttcagccatatctcgatgactttcagaaaaaatggcaggaagag

atggaattatatccgtcaaaaggtggaaccgctgcgtgcggaactgcaagagggggcacgccaaaaactccatgagctc

caagagaagctcagcccattaggcgaagaaatgcgcgatcgcgcccgtgcacatgttgatgcactccggactcatttggc

gccgtattcggatgaacttcgccagcgtttggccgcacgtctcgaggcgctgaaagaaaacgggggtgcccgcttggctg

agtaccacgcatgcgcgacagaacacctgagcaccttgagcgaaaaagcgaaaccggcgctggaagatctacgcca

gggcttattgcctgttcttgagagctttaaagtcagttttctgtcagctctggaagaatatactaaaaagctgaatacccag

                        表63

         MSP1K152C的蛋白质序列(SEQ ID NO:135)

MGHHHHHHIEGRLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMS

KDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPL

GEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHACATEHLS

TLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ

MSP1K90C和MSP1K152C中的突变位于螺旋间界面。在存在DTT时形成圆盘。 这种圆盘对于温度引起的不可逆降解更加稳定。这些是我们的“Milano”突变的变体。

除了这些序列,有两种作为参比的融合蛋白构建物。它们由Gly-Ser接头连接的 两MSP1构建物:MSP2(MSP1-Gly-Thr-MSP1,SEQ ID NO:17)和MSP2D1D1 (MSP1T3-Gly-Thr-H2-H3-H4-H5-H6-H7-H8-H9-H10,SEQ ID NO:86)组成。

不难产生其它构建物,包括上述的置换,即MSP1或MSP2或MSP2a与以下元 件的任何组合:绞链删除、绞链置换、半重复删除、组氨酸标签、MSP2类似物的不 同接头。

实施例3.重组MSP的表达

为表达MSP蛋白,在pET28表达载体的NcoI和HindIII位点之间插入其核酸构 建物并转化入大肠杆菌BL21(DE3)。在卡那霉素选择性LB平板上培养转化体。菌落 用于接种5ml起始培养物,培养在含有30μg/ml卡那霉素的LB肉汤中。为了过度表 达,在100倍体积含有30μg/ml卡那霉素的LB肉汤中加入1体积过夜培养物以接种 培养物,37℃摇瓶培养。当600nm的光密度达到0.6-0.8时,加入异丙基-β-D-硫代吡 喃半乳糖苷(IPTG)至浓度1mM以诱导表达,再培养细胞3-4小时然后离心收集。将 细胞沉淀速冻并保藏于-80℃。

实施例4.重组MSP的纯化

如下进行带His标签的MSP的纯化。将获自1升表达培养物获得的冷冻细胞沉淀 重悬浮在25ml含1mM苯基甲基磺酰氟化物、pH 7.5、20mM的Tris HCl中。加入 Triton X-100(叔-辛基苯氧基聚乙氧基乙醇),加入的Triton X-100是10%(w/v)的原液 用蒸馏水稀释至最终浓度1%。在上用Branson探头超声波仪以50%能率循环超声 破碎重悬浮的细胞,功率设定为5,每分钟4个循环,超声5分钟。将所得裂解物在 超速离心机中用Bechman Ti45转头30,000rpm离心30分钟。通过0.22mm尼龙注射 器滤器过滤所得的上清液。用水将4M NaCl原液的盐浓度调至0.5M,加到5ml Hi-Trap 镍负载柱上(Pharmacia,Piscataway,NJ)。

对于6H-MSP1,用20ml含有1%Triton X-100的缓冲液(10mM Tris pH8,0.5M NaCl),然后用20ml缓冲液+50mM胆酸钠,接着用20ml缓冲液和20ml含100mM 咪唑的缓冲液洗涤此柱。用15ml含0.5M咪唑的缓冲液洗脱带有His标签的多肽。

对于6H-MSP2,用20ml含有1%Triton X-100的缓冲液(10mM Tris pH8,0.5M NaCl);20ml缓冲液+50mM胆酸钠;20ml缓冲液;20ml含35mM的咪唑的缓冲液 洗涤。然后用15ml含0.5M咪唑的缓冲液洗脱带His标签的多肽,并用10,000MW 的截留值的纤维素透析膜以10mM Tris pH8,0.15M NaCl透析纯化的蛋白质。

实施例5.含有MSP的纳米级颗粒的制造

为用脂质重建本发明的MSP蛋白,在加压超滤装置(Amicon)中用10,000MW截 留值膜将纯化的MSP浓缩至2-6mg蛋白质/ml。用二金鸡纳酸(bicinchoninic acid)试 验(Pierce Chemical,Rockford,IL)或采用理论吸收系数作A280测定确定蛋白质浓度。 在氮气气流下干燥溶于氯仿储备液的磷脂(本例中是二棕榈酰磷脂酰胆碱,然而也可 用不同的磷脂酰胆碱和磷脂酰胆碱与其它脂质的混合物)然后抽真空过夜。进行磷酸 分析以确定氯仿储备溶液的浓度。将干燥的脂质薄膜重悬浮于含0.15M NaCl和 50mM胆酸钠的10mM Tris HCl pH8.0或pH7.5缓冲液中使脂质最终浓度为25mM。 涡旋搅拌该悬浮液并加热至50℃得到澄清溶液。在MSP溶液(2-6mg/ml蛋白质)中加 入磷脂溶液以使MSP1∶脂质的摩尔比为2∶200,MSP2∶脂质的摩尔比为1∶200。37℃培 育该混合物过夜,然后用1000体积没有胆酸盐的缓冲液透析2-3天,需要更换4次 缓冲液。

实施例6.组织因子的掺入

组织因子(TF)是外周膜蛋白的代表。为证明MSP技术对外周膜蛋白的价值,将 重组人TF掺入MSP支持的纳米圆盘中。此重组蛋白质具有胞外域、跨膜锚定结构 域和截短的胞质域。这种截断通过除去了此蛋白质易受细菌酶蛋白水解的C-末端部 分提高了此蛋白质的均一性。这种修饰不会影响TF活性。对此蛋白质的其它修饰包 括N-末端运输肽和HPC4表位标记。运输肽可将表达的蛋白质导向重组大肠杆菌宿 主细胞的膜间腔隙,肽序列在此腔隙中被剪切。HPC4表位使得可用Ca2+依赖性抗体 作亲和纯化(Rezaie等,1992)且不会影响TF活性。

用10mM Tris Cl、150mM NaCl pH 8.0配的50mM胆酸盐溶解含有80%磷脂酰胆 碱和20%磷脂酰丝氨酸的25mM脂质混合物。将TF、MSP1和脂质(比例为1∶10∶1000) 混合37℃培育过夜。然后用含10mM Tris Cl、150mM NaCl pH 8.0的缓冲液(没有胆 酸盐)37℃透析此样品2小时(10,000道尔顿分子量的截留膜)。4℃再继续透折6小时 每隔2小时更换透析液,然后用YM-10离心浓缩机将大约1ml样品浓缩至<250μl, 并将其注入Pharmacia 10/30 Superdex 200HR凝胶过滤柱中。用上述同样的缓冲液(没 有胆酸盐)以每分钟0.5ml流速洗脱样品。将层析所得诸组分在8-25%梯度SDS聚丙 烯酰胺凝胶上跑电泳以确定表观分子量大小,然后核查其凝血活性。显示掺入到 MSP1纳米圆盘过量群中的TF的洗脱结果的层析图见图16A-16B。

通过与人血清的凝固试验测定了几个圆盘组分中TF的活性。活性见于组分25-28 中以凝固时间的倒数表示。组分25的活性最高,为40hr-1,然后降至组分28的30hr-1。 这可以从分子大小层析图预测,因为由于MSP支持的双层中掺入了TF,纳米圆盘 峰的前沿有较大的有效质量。因此该试验证明了TF是以活性构象掺入到纳米圆盘 中,该纳米圆盘的膜环境几乎相等地模拟了天然膜系统的环境。

细胞色素b5是一种膜锚定的血红素蛋白,它具有一个穿过膜双层的膜锚定结构 域。从其天然膜中溶解的细胞色素b5在没有去污剂时以大聚集体的形式存在,在天 然聚丙烯酰胺凝胶电泳上看起来更像是污斑而不是分离的条带。通过自身组装过程 形成纳米圆盘,组装中将细胞色素b5加到MSP和磷脂的制剂中,导致细胞色素b5 掺入到纳米圆盘结构中。纳米圆盘相对应条带显示的血红素强染色验证了这一点。 这些数据证明,采用MSP技术成功地溶解了细胞色素b5,表面可通过层析将不需要 的聚集物质去除而分离并纯化得到含有细胞色素b5的圆盘复合物。纯化物质的血红 素生色团的光吸收特性显示天然构象中的血红素活性位点。

将20μl MSP1(10mg/ml)、6.6μl细胞色素b5(0.5mM)和50μl鸡蛋磷脂酰胆碱/胆酸 钠(11.2mg/ml蛋PC、6.2mg/ml胆酸钠)混合,4℃培育过夜,然后透析除去胆酸盐, 也可以形成纳米圆盘。纯化是用经25mM Tris Cl,pH 8.0平衡的Pharmacia MonoQ FPLC阴离子交换柱完成的。以0.5ml/min流速从0-1M NaCl进行20分钟线性梯度。

另一种从溶解并纯化的蛋白质将外周膜蛋白掺入纳米圆盘中的方法是,用含有那 些感兴趣的外周膜蛋白的膜或膜片段制品通过MSP将外周膜蛋白掺入纳米圆盘中。

实施例7.包埋膜蛋白的掺入

兔肝脏微粒体的细胞色素P4502B4、人肝脏微粒体的细胞色素P4503A4以及昆 虫微粒体的细胞色素P4506B1是包埋膜蛋白的代表。

细胞色素P4502B4系用苯巴比妥诱导后从兔肝脏微粒体分离获得。2B4纳米圆 盘的形成如下。用去污剂透析法将细胞色素P4502B4重建入圆盘中。缓冲剂由10mM Tris-HCl pH8.0、0.1M NaCl、10%(v/v)甘油组成。将apoA-I、胆酸盐和磷脂(摩尔比 为1∶220∶110)的混合物37℃培育8小时,然后加入P450(apoA-I:P450的摩尔比为 1∶0.5)室温培育过夜。在室温下用10,000MW截留值slide-a-lyzer(Pierce Chemical公 司,Rockford,IL)透析该混合物两小时,然后更换缓冲液4℃继续透析。发现在这些 条件下可回收82%的P450成分。透析后,室温将混合物注射入经重建缓冲液平衡的 Superdex 200 HR10/30凝胶过滤柱中(Pharmacia,Uppsala,Sweden),流速为 0.25ml/min,收集0.5ml各组分。在8-25%梯度的天然凝胶上用天然聚丙烯酰胺凝胶 电泳测定诸组分,用Phastgel系统(Pharmacia,Uppsala,Sweden)进行考马斯染色。

也克隆了人细胞色素P4503A4(通常得自肝脏微粒体)、在大肠杆菌中表达并纯 化、将其掺入MSP支持的双层纳米圆盘中。将10纳摩MSP2、1毫摩脂质、5纳摩 细胞色素P4503A4蛋白和2毫摩胆汁酸一起37℃培育2小时。然后在10K Slide-a-lyzer透析盒(Pierce Chemical公司,Rockford,IL)中透析该培育的混合物。透 析用10mM磷酸钾(pH7.4)、150mM NaCl缓冲液进行。将样品37℃透析6小时,然 后更换缓冲液继续在4℃透析,期间更换两次缓冲液,每12小时一次。然后在经透 析缓冲液平衡的Superdex 200 HR10/30柱(Pharmacia,Uppsala,SE)上室温以0.5ml/min 流速分离样品。

细胞色素P450 6B1是另一种模型的包埋膜蛋白。已分离得到Papilio polyxenes 这种黑色燕尾的这种细胞色素。专门用能产生对大多数生物都有光毒性的植物代谢 物呋喃香豆素的植物喂养这些蝴蝶。细胞色素6B1可催化呋喃香豆素脱毒。

为显示本发明的MSP法的用途,我们证明了含有膜蛋白和天然脂质所有组成成 分的分离的膜可用作原料将膜蛋白掺入纳米圆盘。一个重要的说明性实施方案采用 已广泛用作异源表达系统的普通昆虫细胞(Sf9)-杆状病毒表达系统。因此,我们使用 了以含有过度表达的昆虫CYP6B1的微粒体制品和过度表达的昆虫NADPH细胞色 素P450还原酶共转染的昆虫细胞系。在这些实验中,我们不仅证明了MSP纳米圆 盘可用来将另一种细胞色素P450细胞掺入可溶性均匀分散的颗粒中,还证明这种 P450的来源可以简化为含该蛋白质的整个膜。

采用标准杆状病毒表达系统获得了含有过度表达的昆虫细胞色素6B1和昆虫 NADPH P450还原酶的微粒体制品。按前面的描述构建重组CYP6B1杆状病毒表达 载体并感染草地夜蛾(Spodoptera frugiperda)(Sf9)(Chen等,2002)。通常在感染后72 小时收集32个平板,每个平板含有6×107个杆状病毒感染的细胞(MOI=2)。微粒体 膜用2ml研磨缓冲液(pH 7.8)匀化,研磨缓冲液中含有0.1M硫酸钠缓冲液(pH 7.8)、 1.1mM EDTA、20%甘油、0.5mM PMSF、0.1mM DTT和5μg/ml(w/v)亮肽素。将 膜冷冻在液氮中并保藏于-80℃。

为从微粒体膜制品装配含有CYP6b1的纳米圆盘,用Pierce(Rockford,IL)的 BCATM蛋白质测定试剂盒确定膜的蛋白质浓度。我们估计膜中蛋白质和磷脂的质量 比为1∶1,磷脂的平均分子量为750克/摩尔。膜用含有0.5M胆酸(中和的)的去污剂 溶解,并以MSP∶脂质∶去污剂约1∶25∶50至1∶2000∶1000,在至少一些情况下优选 1∶75∶150的比例与MSP混合。重建样品含有约100nmol支架蛋白、10μmol脂质和 20μmol中和的胆酸,在4℃预培养1.5小时。所选温度高于脂质的相变温度。4℃与 购自BioRad Laboratories(Hercules,CA)的BiobeadsSM-2Adsorbent(每毫升重建混合 物0.4克Biobeads)一起培育1.5小时,11,750xg离心5分钟除去去污剂。带有His6 标签的MSP的颗粒通过与购自Qiagen,Inc.(Valencia,CA)的Ni-NTA琼脂糖4℃培 育而纯化,每7.5mg带有His6标签的MSP用1ml Ni-NTA琼脂糖,然后11,750xg 离心5分钟。结合到Ni-NTA琼脂糖的MSP颗粒用3倍连续树脂体积的分别含0.3M NaCl、0.15M NaCl和不含NaCl的0.1M磷酸钠缓冲液(pH 7.4)洗涤。为保持CYP6B1 蛋白的完整性,MSP颗粒用含有0.25M EDTA(螯合痕量金属离子螯合)的0.1M磷酸 钠缓冲液(pH 7.4)洗脱而不使用以前纯化MSP所用的50mM咪唑。

根据该微粒体制品中所含的脂质浓度,用MSP技术以110∶1∶220的脂质∶MSP1∶ 胆酸盐比例将微粒体蛋白质装配入纳米颗粒圆盘中。用含中和的胆酸盐去污剂溶解 微粒体样品并与MSP1混合。4℃培育样品2小时。通过透析或吸附疏水珠除去去污 剂。在该实验中,加入过量(每1ml圆盘混合物加0.25g)的Biobeads(疏水珠,商标为 BioRad,Hercules,CA)4℃培育2小时以除去去污剂。从珠子上取下样品并采用Ni2+树脂分批纯化法分离获得带His6标签的MSP。然后用Superdex尺寸柱层析分离MSP 圆盘(图9)。在带His6标签的圆盘中掺入P450,然后用CO示差光谱分析用镍亲和 柱纯化并用分级柱纯化各组分(图10)。采用8-25%梯度凝胶用考马斯蓝染色进行 SDS-PAGE以验证细胞色素P4506B1掺入了圆盘中(图10)。

细胞色素P450和还原酶的内源(天然)比例约为10-20。为在重建入圆盘后保留细 胞色素P450 6B1的活性,宜在重建的混合物中加入过量的还原酶,这样P450分子 和还原酶分子都分配进入一个圆盘中。已经成功证明此微粒体制剂添加了外源加入 的还原酶。

采用了用微粒体制品制备圆盘的方法,其中有一处修改。用胆酸盐溶解微粒体制 品后加入外源大鼠还原酶,再加入MSP1。然后进行同样的圆盘装配和纯化过程。用 Superdex分级柱分离样品,280nm处的吸收表明了MSP1的存在,420nm和456nm 处的吸收表明存在三价铁物质,456nm处的吸收还表明存在还原酶。制作了456对 420nm的比例图;显示层析谱上的位置,其中456nm处的吸收超过与CYP6B1有关 的吸收,因此可归因于还原酶的吸收。保留时间反映存在含细胞色素P4506B1和还 原酶的10nm颗粒(图13)。

含有纯化的蛋白质、膜片段或破裂膜的MSP支持的纳米圆盘可用于高通量筛选 来例如,鉴定新的药物和其它生物活性分子。

实施例8.整合膜蛋白的掺入

细菌视紫红质(BR)是一种整合膜蛋白的模型并且是一种7跨膜结构域蛋白的模 型。BR采用以下方法掺入纳米级结构中,这是一种对其它蛋白质同样有用的方法。 BR以冻干的紫色膜获自Sigma(St.Louis,MO)。将1mg BR悬浮在1ml 25mM pH6.9 的磷酸钾中。加入溶于同一缓冲液的1ml 90mM的正-辛基-β-D-吡喃葡糖苷并将样品 在黑暗中24℃放置过夜。这种处理产生了去污剂促溶的均聚形式(Dencher等,1982)。 估计BR在550nm的摩尔消光系数为63,000来定量测定BR。将BR(7.8μM)与 MSP1(97μM)或MSP2(110μM)以及胆酸盐(50mM)混合使最终MSP1∶BR的摩尔比为 10∶1或MSP2∶BR的摩尔比为5∶1和胆酸盐浓度约为8mM。为了与磷脂重建,将磷脂 溶于含50mM胆酸盐的上述溶液中,并按1∶110∶0.1的MSP1∶脂质∶BR的摩尔比与 MSP1混合。混合物室温培育约3小时,然后用10,000MW截留透析装置(Slide-a-lyzer, Pierce Chemical)以1000倍体积的缓冲液透析过夜。4℃继续透析2天,更换缓冲液数 次。可用10mM HEPES,pH7.5,0.15M NaCl缓冲液。也可成功使用pH7.5或pH8 的Tris缓冲液。

已将人的5-羟色胺1AG蛋白偶联受体掺入含有MSP的纳米颗粒中。采用可提供 含有人5-羟色胺1A(5-HT-1A)GPCR的膜片段的市售的昆虫细胞表达系统作为GPCR 来源来制备纳米圆盘。简而言之,将含有5-HT受体的膜制品按磷脂∶MSP1∶胆酸盐 比例45∶45∶10与磷脂(磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸)、MSP1和胆酸盐 (中和的胆酸)混合。

用以下方法溶解市售的Sf9昆虫细胞膜制品(Sigma Chemical公司,St.Louis,MO) 中过度表达的5-HT 1A受体。以45∶10∶45的摩尔比例在氯仿中混合POPC、POPS和 POPE(Avanti Phospholipids),氮气气流中干燥,然后在真空下放置数小时以除去残留 的溶剂。以25mM的磷脂浓度将磷脂分散在50mM Tris pH7.4、0.2M NaCl、50mM 胆酸钠缓冲液中。将5微升sf9膜制品(0.2mg/ml蛋白)、1.62微升溶于缓冲液的磷脂、 2.4微升MSP1(4.2mg/ml)和0.28微升4M NaCl混合,冰中放置1小时。用50mM Tris pH7.4将混合物的总体积稀释至100微升,并于4℃在迷你slide-a-lyzer(Pierce Chemical)中用50mM Tris pH7.4透析(更换两次缓冲液,每次一升)。

为测定与纳米圆盘结合的5HT1A受体的量,使放射性标记的配体结合于该受体, 并按照以下方法利用MSP1中存在的6-His标签分离圆盘-受体-配体复合物。透析后, 用50mM Tris pH7.4将混合物的总体积稀释至200微升。在两个试管中分别加入95 微升稀释的混合物。加入105微升试剂母液以使最终体积为200微升最终浓度为 50mM Tris pH7.4、10mM MgSO4、0.5mM EDTA、0.1%抗坏血酸。在各个试管中加 入氚标记的8-羟基-DAT(比活135000Ci/摩尔)直至浓度达到1.5nM。作为对照,在其 中一个试管中加入未标记的麦角苄酯(最终浓度为100微摩尔)作为竞争性配体。在冰 上放置1小时后,将混合物加到200微升Ni-螯合的树脂上以特异性结合带有6His 标签的MSP1圆盘的受体。用0.5ml冷的50mM Tris pH7.4将树脂洗涤三次以除去未 特异性结合的配体。用0.5ml溶于10mM Tris pH7.4和0.5M NaCl的0.5摩尔的咪唑 洗脱与受体/圆盘复合物结合的特异性结合放射性标记的8-羟基-DAT。将闪烁混合液 与洗脱液混合并用闪烁计数仪测定特异性结合的放射性配体。发现与MSP1纳米圆 盘结合的受体中有5-15%为最初存在于sf9膜中的受体。

透析掺入了5-HT-1A GPCR的颗粒。用含有氚化的8-OH-DAT(此受体的激动剂) 的缓冲液培育以检测其功能(就配体结合而言)。然后将这些颗粒通过Ni-NTA柱利用 MSP1上的His标签结合该柱使颗粒与未结合颗粒的8-OH-DAT相分离,洗脱与柱结 合的物质。证明了氚标记激动剂的结合,显示掺入的GPCR保留了其与激动剂结合 的能力。

如上文对外周膜蛋白的描述,可利用MSP和促溶的膜制品而不是纯化的可溶性 蛋白质将整合和包埋膜蛋白掺入纳米圆盘中。纳米圆盘中天然存在的蛋白质被保留, 无论这些蛋白质是纯化的或是直接来自膜制品的。

实施例9.分析MSP支持的纳米圆盘磷脂装配体

如下分析了由膜支架蛋白和磷脂(无论有或没有加入的靶蛋白)自身组装所得的颗 粒。

透析含有细菌视紫红质的颗粒,将所得混合物注射入Superdex 200HR 10/30凝胶 过滤柱(Pharmacia)室温以0.5ml/min流速用缓冲液洗脱。在280nm处监测蛋白质的吸 收,在550nm监测BR的吸收。收集0.5ml各组分。用甲状球蛋白(669kDa,斯托克 斯直径为170A)、转铁蛋白(440kDa,斯托克斯直径为122A)、过氧化氢酶(232kDa,斯 托克斯直径为92A)、乳酸脱氢酶(140kDa,斯托克斯直径为82A)、牛血清白蛋白 (66kDa,斯托克斯直径为71A)和马心脏细胞色素c(12.4kDa,斯托克斯直径为35.6A) 的混合物校准此柱。

和数字式毫微秒示波器IIIa,在缓冲液中用削尖的氮化硅探针以接触模式进行原 子力显微术(AFM)。在10mM Tris pH8.8、0.15M NaCl、2mM CaCl2中,用质量比为 1∶50的Xa因子:MSP蛋白处理MSP1和MSP2二棕榈酰磷脂酰胆碱颗粒8小时。 将2-10ml样品和20ml显像缓冲液(10mM Tris pH8、0.15mM NaCl、10mM MgCl2)一 起放置在新鲜切割的云母表面培育30分钟或更长时间,然后将样品固定在流动小室 中。用几毫升缓冲液冲洗该流动小室除去未吸附的物质。

如下进行纳米级颗粒的磷酸盐分析。采纳Chen等(1956)Anal.Chem.28:1756-1758 以及Fiske和Subbarow(1925)的磷酸盐试验程序。将约含40纳摩磷酸脂的样品在玻 璃试管中干燥。在各试管中加入75μl 8.9N H2SO4加热至210℃,保持30分钟。在各 试管中加入一滴30%的H2O2并加热30分钟。冷却试管,加入0.65ml水,然后加入 83.3μl 2.5%w/v的四水合钼酸铵,然后涡旋搅拌,加入83.3μl 10%w/v的抗坏血酸。 混合后,将试管放置在沸水浴中7分钟。读取820nm处吸光值。用磷酸钾标准品(0-100 nmol磷酸)校准吸光值。MSP蛋白测定时包括了柱层析的缓冲液空白。

实施例10.表面上MSP支持的结构

含有MSP和感兴趣蛋白质的纳米圆盘可装配到金表面或其它固体表面(固体支持 物)。其用处涉及所得的掺入纳米圆盘装配体中的靶蛋白质朝向溶液的外延部分。这 为定量测定用电介质对比试剂标记的其它大分子或小分子与该靶蛋白质的结合,提 供了理想的系统。实现这种测定的常用方法采用了表面胞质基因组共振(SPR)技术。 SPR是用于监测表面生物分子相互反应的常用技术。SPR能够迅速检测并定量金表 面未标记蛋白质的相互反应,可用于产生用于圆盘上多种膜蛋白(包埋的和可溶的) 的高通量芯片试验。

如下所述制备了由含或不含其它含巯基脂质的磷脂DPPC与MSP1蛋白组成的 圆盘。将含有溶于10mM Tris Cl、150mM NaCl pH 8.0的50mM胆酸盐溶解的磷脂酰 胆碱的25mM脂质混合物混合37℃培育过夜。对于含巯基的圆盘,将90%的磷脂酰 胆碱和10%含巯基脂质(ATA-TEG-DSPA,Northern Lipids)溶于pH 9.0、3.3mM Tris Cl、 66.7mM酸盐和150mM NaCl中以除去含巯基脂质中的屏蔽巯基。将MSP1和脂质 (1∶100)混合37℃培育过夜。然后在37℃(10,000MW截留膜)以pH 8.0的含10mM Tris Cl和150mM NaCl而没有胆酸盐的缓冲液透析样品2小时。4℃继续透析6小时,每 2小时更换一次缓冲液。用YM-10离心浓缩机将约1ml样品浓缩至<250μl,并将其 注射到Pharmacia 10/30 Superdex 200HR凝胶过滤柱中。用没有胆酸盐的所述缓冲液 以0.5ml/min流速从柱中洗脱得到样品。用8-25%的梯度SDS聚丙烯酰胺凝胶作聚丙 烯酰胺凝胶电泳分析层析所得的诸组分以测定表观分子量大小。

将如上制备的纳米圆盘样品(3-20μM)注射到SPR装置中以测定圆盘是否会结合 到金表面。DPPC和10%含巯基脂质的圆盘均吸附到金表面,修饰的金表面上覆盖了 一单层甲基未端巯基(壬烷巯基)或羧基未端巯基(11-巯基十一醇酸)。用含3.3mM Tris、66.7mM硼酸盐、150mM NaCl的pH 9.0的缓冲液注射含巯基的圆盘。用含10mM Tris、150mM NaCl的pH 7.5或8.0缓冲液注射DPPC圆盘。两种情况下,即使在严 谨条件(0.5M HCl)下也不能除去圆盘。表面覆盖度显示随着所注射圆盘浓度的增加而 增加(3μM比19μM)。圆盘没有形成包装极好的单层;因此,表面覆盖度受限于0.547 的干扰界限(根据以相同的非重叠硬球体在表面建模圆盘上随机连续吸收的理论最大 覆盖度)限制。根据推测的5.5nm圆盘高度和1.45-1.5之间的折射指数计算了全部单 层圆盘的覆盖度。将全部单层数值乘以干扰界限以确定最大覆盖度,然后将其用于 测定以实验值为基础的覆盖度百分率。当圆盘浓度至少为10μM时,估计覆盖度约 在62-103%之间。得到的SPR痕量证明了纳米圆盘已与金表面结合,见图14。

含有MSP和感兴趣蛋白质的纳米圆盘可通过MSP上的His标签结合于固体支持 物,此支持物上涂有Ni-NTA或His标签特异性抗体,这种抗体可购自例如BD Biosciences Clontech,Palo Alto,CA,或者结合于Ni-NTA琼脂糖珠,这种珠可购自 例如Qiagen,Valencia,CA,或者结合于其它固体支持物,包括珠、芯片、平板或 微量滴定平皿。

实施例11.通用技术

对于SDS-PAGE,可将微升级别的样品在8-25%梯度的聚丙烯酰胺凝胶(Pharmacia) 上分离并用考马斯蓝染色。

尺寸柱层析纯化如下进行。将镍亲和纯化的样品混合物注射到用0.1M磷酸钠缓 冲液(pH 7.4)以0.5ml/min的流速平衡的Superdex(Pharmacia的商标,Piscataway, NJ)200HR10/30凝胶过滤柱(Pharmacia)上。含有CYP6B1的组分用Centricon YM-30 离心过滤装置(Millipore Corporation,Billerica,MA)浓缩后再注射到相同缓冲条件下 的Superdex 200 HR10/30凝胶过滤柱上。

脂质用Folch法(Folch-Pi等,(1957))提取,样品用2∶1的氯仿-甲醇(v/v)匀化并用 1/4体积的0.88%KCl水溶液洗涤。剧烈搅拌该溶液并离心(3,000xg)5分钟完全分离 各相。

纳米圆盘装配通常如下进行。用购自Pierce(Rockford,IL)的BCATM(二金鸡纳酸) 蛋白质测定试剂盒测定膜中蛋白质的浓度。我们估计膜中蛋白质和磷脂的质量比为 1∶1,磷脂的平均分子量为750克/摩尔。用含有0.5M胆酸(中和的)的去污剂溶解膜, 并以MSP∶脂质∶去污剂约1∶25∶50至1∶2000∶1000,在至少一些情况下优选1∶75∶150的 比例与MSP混合。膜用含有0.5M胆酸(中和的)的去污剂溶解,并以MSP∶脂质∶去污 剂约1∶100∶200的比例与MSP混合。重建样品中通常含有约100nmol支架蛋白、 10μmol脂质和20μmol中和的胆酸,4℃预培育1.5小时。在4℃与购自BioRad Laboratories(Hercules,CA)的BiobeadsSM-2 Adsorbent(每毫升重建混合物0.4克 Biobeads)一起培育1.5小时,11,750xg离心5分钟除去去污剂。将带有His6标签的 MSP的颗粒与购自Qiagen,Inc.(Valencia,CA)的Ni-NTA琼脂糖一起4℃培育而纯 化,每7.5mg带有His6标签的MSP用1ml Ni-NTA琼脂糖,然后11,750xg离心5 分钟。结合于Ni-NTA琼脂糖的MSP颗粒用3倍连续树脂体积的分别含0.3M NaCl、 0.15M NaCl和不含NaCl的0.1M磷酸钠缓冲液(pH 7.4)洗涤。为保留CYP6B1蛋白 的完整性,MSP颗粒用含有0.25M EDTA的0.1M磷酸钠缓冲液(pH 7.4)洗脱而不用 以前纯化MSP所用的50mM咪唑。

薄层层析(TLC)如下进行。将样品点样到购自EM Science(Hawthorne,NY)的制 备型硅胶固定相TLC平板上,平板靠在购自Avant(Alabaster,AL)的磷脂标准品上, 并用氯仿/甲醇/氢氧化铵(65∶25∶4)作为流动相。使TLC平板暴露于碘蒸气以显色,用 Hewlett Packard ScanJet扫描并用由美国国立卫生研究院开发的无版权限制的NIH Image程序(可通过因特网从地址为rsb.info.nih.gov/nih-image的站点获得)在 Macintosh计算机上定量测定。

实施例12.底物结合

将Superdex大小分级后收集的含有CYP6B1的纳米圆盘群体浓缩至酶浓度为50 nM。对微滴定板进行编号,孔A1-A5和孔B1-B5每孔含有200μl纳米圆盘样品, 孔C1-C5每孔含有200μl缓冲液(0.1M磷酸钠,pH 7.4)。在A和C行加入用甲醇配 制的原液浓度为20mM的花椒毒素(Sigma Chemical Co.)使最终浓度为0μM(第1栏)、 10μM(第2栏)、20μM(第3栏)、50μM(第4栏)和150μM(第5栏)。使有机溶剂 的总量在加入纳米圆盘样品时不超过1%。在B行加入0μl、0.1μl、0.2μl、0.5μl和 1.5μl甲醇。

用SpectraMAXPlus微板分光光度计(Molecular Devices,Sunnyvale,CA)以1nm 的增量扫描微滴定板各孔的内容物,并对背景缓冲液的吸光度(C行中所确定)和纳米 圆盘的吸光度(孔A1)进行校正。

实施例13.具有较大MSP的纳米圆盘

较大的纳米圆盘(“延伸的”膜支架蛋白序列)可用于控制7-Tm受体或其它特别 大或者趋向于以低聚形式掺入纳米圆盘的疏水或部分疏水性蛋白质的低聚状态。一 个具体的例子是,细菌视紫红质三聚体可自装配入采用较长MSP的较大纳米圆盘中。

按Oesterhelt和Stoeckenius 1974所述,分离了盐沼盐杆菌(Halobacterium salinarum)JW-3培养物的紫膜。用Beckman Ti-45转头35,000rpm离心15分钟除去 蔗糖,然后重悬于水中。重复该过程3次,等分样品-20℃冷冻储存。从280nm的吸 光度可确定MSP的浓度,根据计算出的消光系数,MSP1的消光系数为24740 M-1cm-1,其它MSP的消光系数为31720M-1cm-1(Gill和von Hippel 1989)。发现 MSP1E1、MSP1E2和MSP1E3的纳米圆盘缓冲液的消光系数等于在20mM磷酸盐 缓冲液、6M盐酸胍pH 6.5中计算出的值。DMPC获自Avanti Polar Lipids,Inc., 将其溶于氯仿并通过磷酸盐分析定量(Chen,Toribara等,1956)。除非另有说明,缓 冲液由10mM Tris HCl pH 7.4、0.1M NaCl、0.01%NaN3组成。用Milli-Q系统 (Millipore)纯化水。所有其它物质都是高品质试剂。

为自装配含细菌视紫红质和延伸的MSP的纳米圆盘,先按照Dencher和Heyn 1978的描述用4%w/v Triton X-100溶解细菌视紫红质。在离心管或Falcon管内的 bR(通常约190μM)中加入MSP原液(200-400μM)和DMPC/胆酸盐混合物(200/400 mM,用缓冲液配制),使MSP与bR的摩尔比为2∶3,和不同的磷脂比例。室温1小 时后每毫升溶液用400mg湿的Biobeads SM-2(BioRad)处理3-4小时并轻微搅动以保 持珠子悬浮,除去去污剂(Levy,Bluzat等,1990)。离心悬液,通过管子底部的小孔 除去珠子。

自装配的纳米圆盘混合物通过0.22微米滤膜过滤并注射到尺寸排阻层析柱 (Superdex 200HR 10/30柱),在室温下以0.5ml/min运行,收集1分钟的流分。在280 和560nm监测峰洗脱。

通过SDS-PAGE分析纳米圆盘,量化蛋白质并测定脂质的化学量。将含有MSP1E3 和不同量bR的样品作为校准标准,与凝胶过滤纯化的MSP1E3-bR纳米圆盘样品一 起用Phastgel系统(Pharmacia)在20%SDS-PAGE上分离。用Brilliant蓝R-250染色之 后扫描凝胶并用NIH计算机图象程序定量条带以确定纳米圆盘中bR与MSP1E3的 比例。对于通过视黄滴定测得的MSP1E3纳米圆盘中的bR,用消光系数ε560= 56,600±1200M-1cm-1来确定MSP1E3圆盘中每个bR对应的脂质的量,并通过磷酸 盐分析确定磷脂含量(Chen,Toribara等,1956;Rehorek和Heyn 1979)。在室温下用 Jasco J-720光谱旋光计(spectrapolarimeter)测量圆二色性光谱,样品OD约为2。

用磷脂滴定比例为3-2的bR-MSP混合物以确定通过凝胶过滤色谱估算的bR增 溶的最佳比例。选出最佳比例作为溶解的bR的主峰,此主峰是含有最小量较大圆盘 的主要成分。低于最佳比例时会出现尺寸较小的圆盘。用这种方法确定了MSP1、E1、 E2和E3的最佳比例分别为10∶1、10∶1、55∶1和80∶1,此时主峰约占bR总注射量的 80%。再注射合并的主峰的结果见图19。根据用一组标准蛋白校准该柱后MSP1E1、 MSP1E2和MSP1E3的直径大小分别为11、11.4、12.2、12.8nm。

紫膜中的bR在三聚体的bR视黄醛生色团之间显示出激发相互作用,导致在CD 光谱中出现正峰和负峰。bR的单体形式显示一个由于视黄醛与蛋白质环境相互作用 而形成的正峰。最佳脂质比例的MSP促bR溶解的CD光谱示于图20。只有MSP1E2 和MSP1E3在600nm出现负峰,表明明纳米级盘状颗粒中有bR三聚体形式的装配 体。

实施例14.含有两性霉素B的纳米圆盘

制备了两种纳米圆盘制品,一种含有两性霉素B(AmB),另一种不含(作为对照)。 AmB颗粒中MSP1T2/POPC/AmB的比例为2∶130∶1,对照颗粒制品中MSP1T2/POPC 的比例为1∶65。

合成的1-棕榈酰-2-油酰-sn-丙三基-3-磷酸胆碱(POPC)购自Avanti Polar Lipids (Alabaster,AL),用氯仿将其制成75mM(可接受的浓度范围为70-80mM)的原液, 储藏于-20℃。用Chen等(1956)的方法定量总磷含量确定脂质浓度。两性霉素B(AmB) 粉末购自Sigma(St.Louis,MO)用DMSO制成2mM原液,避光保存储藏于-20℃。 MSP1T2按Denisov等(2004)所述方法表达和纯化。

将AmB加入POPC脂质溶液使脂质∶AmB摩尔比为65∶1。溶液在氮气流下干燥 并在真空下放置过夜以除去残余的溶剂。含有AmB的样品的操作都避光进行。加入 100mM胆酸盐将混合物重悬于标准缓冲液(10mM Tris-HCl(pH 7.4)、0.1M NaCl、1 mM EDTA),使脂质浓度为50mM。将试管涡漩振荡、超声并用37℃的水浴简单加 热,直至混合物完全溶解。

在脂质/AmB/胆酸盐溶液中加入MSP1T2蛋白使蛋白质/脂质/AmB比例为 2∶130∶1。最终的脂质浓度约为15mM。混合物在4℃(接近POPC的相变温度)培育2 小时。加入BioBeads除去胆酸盐,并将样品在4℃再培育2小时。用Superdex 200HR 10/30柱(Amersham Biosciences,Piscataway,NJ)通过尺寸排阻层析分离样品并保留 10nm组分。比较A405与1-20μg/ml两性霉素B构建的标准曲线确定两性霉素B的 浓度。纳米圆盘的浓度通过测量A280(MSP1T2ε280=21,000M-1cm-1)确定。

实施例15.含有酮康唑的纳米圆盘

通过培育摩尔比分别为1∶10∶80∶160的MSP1T2、酮康唑、DMPC和胆酸盐制备了 含有小分子抗真菌药酮康唑的纳米圆盘。将混合物在25℃培育45分钟,加入BioBeads (50%w/v),继续培育45分钟。与BioBeads一起培育除去胆酸盐,导致纳米圆盘自 装配并使亲脂性酮康唑分配到新形成的纳米圆盘的双层环境中。含酮康唑的纳米圆 盘通过镍亲和层析纯化,柱洗脱液用标准缓冲液(20mMTris-HCl(pH 7.4)、0.1M NaCl、0.5mM EDTA)渗滤浓缩。

用生长在酵母马铃薯葡萄糖(YPD)琼脂上的白色念珠菌(Candida albicans)菌苔定 性测试含酮康唑纳米圆盘制品的抗真菌活性。将新鲜生长的白色念珠菌(C.albicans) 菌落与无菌水混合,取1ml细胞悬液均匀施加在YPD-琼脂平板表面。倾析除去过量 的细胞液,将20μl等份含酮康唑纳米圆盘、不含酮康唑纳米圆盘(空纳米圆盘)和13 μg/ml用1%DMSO配制的酮康唑溶液分别相互隔开点到平板表面(图21A)。平板在 35℃培育18小时。含有酮康唑的纳米圆盘以与酮康唑对照相同的方式抑制白色念珠 菌生长,而空纳米圆盘对真菌生长无效。该结果证实,纳米圆盘共纯化(co-purified) 了酮康唑的抗真菌活性,并说明自装配后酮康唑与纳米圆盘相连。加入20μl标准缓 冲液或1%DMSO显示无抗真菌活性(图21B)。加入20μl 0.13μg/ml的酮康唑溶液未 观察到抑制真菌生长,表明加入浓度低100倍的药物太稀,对平板上该细胞密度的 真菌无作用。

实施例16.含有钆的纳米圆盘

含两性钆螯合物的纳米圆盘可通过掺入磷脂或其它类型具有螯合基团的脂质制 备,所述螯合基团可作为两性脂质的极性头基团。这种磷脂中的一种可以通过使磷 脂酰乙醇胺与二亚乙基三胺五乙酸(DTPA)的二酸酐反应产生四配位基螯合的磷脂来 合成,它在装配成纳米圆盘之前或之后可以负载Gd3+。可将含有或没有结合的Gd3+的螯合脂质在有机溶液中与其它类型磷脂混合,也可以不和其它类型磷脂混合,然 后除去溶剂,通过普通方法形成纳米圆盘。

另一种适合钆阳离子的螯合剂是1,2-二棕榈酰-sn-丙三基-3-磷乙醇胺-N-二亚乙 基三胺五乙酸(DPPE-DTPA)。可采用乙二胺四乙酸(EDTA)衍生物来代替DTPA基团。 二肉豆蔻酰和二硬脂基可以替换二棕榈酰基团。较长链脂肪酸与该螯合分子剩余部 分的结合有利于使钆或其它感兴趣的离子(通常包括但不限于铱、锝和镧系元素的三 价阳离子)掺入到纳米圆盘颗粒中。可用DTPA磷脂。参见Urizzi等,(1996)Tetrahedron Lett.37:4685-4688对亲脂性螯合剂的讨论。

实施例17.含有光动力学化合物的纳米圆盘

含光动力化合物的纳米圆盘,尤其是治疗用光动力化合物基本上按照上述两性霉 素B和酮康唑的方法制备,但是其中采用光动力化合物,如补骨脂素、酞花青苷或 卟啉,所作的改动是原液、组装反应以及纳米圆盘的制备均避光。

实施例18.荧光标记的纳米圆盘

制备含有小有机分子,尤其是荧光标记的纳米圆盘的方法如下。

制备中使用的所有玻璃器皿用1M KOH洗涤,可能的话再超声15分钟。

描述了两种纳米圆盘制品,一种有标记一种没有标记。标记的制品中 MSP1/DPPC/Dil的比例为1/100/.05,使用0.5mg MSP1,未标记的制品中MSP1/DPPC 的比例为1/100,使用2mg MSP1。从溶于氯仿的原液获得DPPC。在两个玻璃试管 中加入适量DPPC。在标记的圆盘制品的试管中加入溶于乙醇的Dil。用氮气干燥除 去溶剂,将样品至于真空下过夜除去残余溶剂。

在干燥的脂质样品中加入50mM用标准缓冲液(10mM Tris-HCl pH7.4、0.1M NaCl、1mM EDTA、0.01%NaN3)配制的胆酸盐,使最终脂质浓度为25mM。将试管 涡漩振荡、加热并超声直至脂质完全溶于溶液。37℃下,在要标记的样品中加入0.5 mg溶于缓冲液的MSP1,并在37℃下在不要标记的样品中加入2mg溶于缓冲液的 MSP1。37℃培育样品4小时。然后透析除去胆酸钠。37℃用标准缓冲液透析24小 时,期间更换3次缓冲液。

将两种样品都浓缩至约0.3ml、过滤并加到Superdex柱进行尺寸排阻层析。将各 流分收集、合并并保存含有直径约10nm颗粒的流分。通过测量280nm的吸收确定 纳米圆盘的浓度(1mg/ml MSP1的A280为1.0)。假设可以忽略标记的圆盘样品中Dil 在280nm的吸收。

发明背景

参考文献
Angrand,M.等,(1997)Eur.J.Biochem.250:168-76。
Atkinson,D.和Small,D.M.(1986)Ann.Rev.Biophys.Chem.15:403-456。
Bayburt,T.H.等,(1998)J.Struct.Biol.123:37-44。
Bayburt,T.H.等,(2000)Langmuir 16:5993-5997。
Bayburt,T.H.等,(2002)Nano Letters 2:853-856。
Boguski,M.S.等,(1986)J.of Lipid Research 27:1011-1034。
Borhani,D.W.等,(1997)Proc.Natl.Acad.Sci.USA 94:12291-12296。
Brouillette,C.G.等,(1984)Biochemistry 23:359-367。
Brouillette,C.等,(2001)Biochim.Biophys.Acta 1531:4-46。
Carlson,J.W.等,(2000)Languir 16:3927-3931。
Carlson,J.W.等,(1997)Biophys.J.73:1184-1189。
Chen等,(1956)Anal.Chem.28:1756-1758。
Chen,J.S.等,(2002)Insect Molecular Biology 11:175-186。
Dalton,M.B.和Swaney,J.B.(1993)J.Biol.Chem.268:19274-19283。
Dencher,N.A.和Heyn,M.P.(1982)Methods Enz.88:,5-10。
Denisov,I.G.,Grinkova,Y.V.,Lazarides,A.A.和Sligar,S.G.(2004)J.Am.Chem Soc.126:3477-3487。
Drake等,(1989)Am.J.Pathol.134:1087-1097。
Durbin,D.M.和Jonas,A.(1999)J.Lipid Research 40:2293-2302。
Estabrook,R.W.和J.Werringloer.(1978)Meth.Enzymol.52:212-20.。
Fidge,N.H.(1999)J.Lipid Research 40:187-201。
Fielding,P.E.和Fielding,C.J.(1991)Biochemistry of Lipids,Lipoproteins,and Membranes.D.E.Vance和J.Vance.Amsterdam,Elsevier Press:427-459。
Fiske和Subbarow(1925)J.Biol.Chem.66:374-389。
Folch-Pi,J.等,(1957)J.Biol.Chem.226:497-509。
Forte,T.M.等,(1971)Biochim.Biophys.Acta 248:381-386。
Frank,P.G.等,(1997)Biochemistry 36:1798-1806。
Friis,E.P.等,(1999)Proc.Natl Acad.Sci.USA 96:1379-84。
Glomset,J.A.(1968)J.Lipid Research 9:155-167。
Higuchi,R.等.(1988)Nucl.Acids Res.16:7351。
Holvoet,P.等,(1995)Biochemistry 34:13334-13342。
Imaoka,S.等,(1992)Biochemistry 31:6063-9。
Jonas,A.(1986)Methods Enzymol.128:553-582。
Jonas,A.(1991)Biochim.Biophys.Acta 1084:205-220。
Jonas,A.等,(1989)J.Biol.Chem.264:4818-4824。
Kirilovsky,J.等,(1985)FEBS Letters 183:75-80。
Koppaka,V.等,(1999)J.Biol.Chem.274:14541-14544。
Ma,R.等,(1994)Arch.Biochem.Biophys.310:332-40。
Marheineke,K.等,(1998)FEBS Letters 441:49-52。
Miller,J.P.等,(1996)Biochemistry 35:1466-1474。
Mukhopadhyay,R.等,(2000)J.Inorg.Biochem.78:251-254。
Nemerson,Y.和Repke,D.(1985)Thromb.Res.40:350-358。
Omura,T.,and R.Sato.(1964)J.Biol.Chem.239:2370-8。
Philips,J.C.等,(1997)Biophysics Journal 73:2337-2346。
Rezaie等,(1992)Protein Expression and Purification 3:453-460。
Robinson,C.R.和Sauer,R.T.(1998)Proc.NatlAcad.Sci.USA 95(11):5929-34。
Rogers,D.P.等,(1998)Biochemistry 37:945-955。
Rogers,D.P.等,(1998)Biochemistry 37:11714-11725。
Savelli,G.等,(2000)Curr.Opin.Colloid & Interface Science 5:111-117。
Schafmeister等,(1993)Science 262:734-738。
Segrest,J.P.等,(1999)J.Biol.Chem.274:31755-31758。
Shaw,A.W.,McLean,M.A.和Sligar,S.G.(2004)FEBS Lett.556:260-264
Tocanne,J.-F.等,(1994)Chemistry and Physics of Lipids 73:139-158。
Wald,J.H.等,(1990)J.Biol.Chem.265:20044-20050。
Wald,J.H.等,(1990)J.Biol.Chem.265:20037-20043。
Wang,M.等,(1997)Proc.Natl.Acad.Sci.USA 94:8411-8416。
Wlodawer,A.等,(1979)FEBS Lett.104:231-2 Segr35.
                      序列表
<110>伊利诺斯州立大学托管会(The Board of Trustees of the University of Illinois)
     S.G.斯莱加尔(Sligar,Stephen G)
     T.H.贝伯特(Bayburt,Timothy H)
     M.A.舒勒(Schuler,Mary A)
     N.R.西维简(Civjan,Natanya R)
     Y.V.格里尼科瓦(Grinkova,Yelena V.)
     I.G.杰尼索夫(Denisov,Ilia G.)
     S.J.格里梅(Grimme,Stephen G.)
<120>膜支架蛋白
<130>87-00B WO
<140>未知
<141>2005-01-13
<140>未知
>141>2005-01-11
<150>60/536,281
<151>2004-01-13
<160>136
<170>PatentIn version 3.3
<210>1
<211>762
<212>DNA
<213>智人(Homo sapiens)
<400>1
ccatggccca tttctggcag caagatgaac ccccccagag cccctgggat cgagtgaagg  60
acctggccac tgtgtacgtg gatgtgctca aagacagcgg cagagactat gtgtcccagt  120
ttgaaggctc cgccttggga aaacagctaa acctaaagct ccttgacaac tgggacagcg  180
tgacctccac cttcagcaag ctgcgcgaac agctcggccc tgtgacccag gagttctggg  240
ataacctgga aaaggagaca gagggcctga ggcaagagat gagcaaggat ctggaggagg  300
tgaaggccaa ggtgcagccc tacctggacg acttccagaa gaagtggcag gaggagatgg  360
agctctaccg ccagaaggtg gagccgctgc gcgcagagct ccaagagggc gcgcgccaga  420
agctgcacga gctgcaagag aagctgagcc cactgggcga ggagatgcgc gaccgcgcgc  480
gcgcccatgt ggacgcgctg cgcacgcatc tggcccccta cagcgacgag ctgcgccagc  540
gcttggccgc gcgccttgag gctctcaagg agaacggcgg cgccagactg gccgagtacc  600
acgccaaggc caccgagcat ctgagcacgc tcagcgagaa ggccaagccc gcgctcgagg  660
acctccgcca aggcctgctg cccgtgctgg agagcttcaa ggtcagcttc ctgagcgctc  720
tcgaggagta cactaagaag ctcaacaccc agtaataagc tt                     762
<210>2
<211>250
<212>PRT
<213>智人(Homo sapiens)
<400>2
Met Ala His Phe Trp Gln Gln Asp Glu Pro Pro Gln Ser Pro Trp Asp
1               5                   10                  15
Arg Val Lys Asp Leu Ala Thr Val Tyr Val Asp Val Leu Lys Asp Ser
            20                  25                  30
Gly Arg Asp Tyr Val Ser Gln Phe Glu Gly Ser Ala Leu Gly Lys Gln
        35                  40                  45
Leu Asn Leu Lys Leu Leu Asp Asn Trp Asp Ser Val Thr Ser Thr Phe
    50                  55                  60
Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr Gln Glu Phe Trp Asp
65                  70                  75                  80
Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp
                85                  90                  95
Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln
            100                 105                 110
Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro
        115                 120                 125
Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu
    130                 135                 140
Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg
145                 150                 155                 160
Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu
                165                 170                 175
Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly
            180                 185                 190
Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser
        195                 200                 205
Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly
    210                 215                 220
Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu
225                 230                 235                 240
Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
                245                 250
<210>3
<211>61
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>3
tataccatgg gccatcatca tcatcatcat atagaaggaa gactaaagct ccttgacaac    60
t                                                                    61
<210>4
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>4
gcaagcttat tactgggtgt tgagcttctt                                     30
<210>5
<211>654
<212>DNA
<213>人工序列
<220>
<223>编码带有HIS标签的MSP1的核苷酸序列
<400>5
tataccatgg gccatcatca tcatcatcat atagaaggaa gactaaagct ccttgacaac  60
tgggacagcg tgacctccac cttcagcaag ctgcgcgaac agctcggccc tgtgacccag  120
gagttctggg ataacctgga aaaggagaca gagggcctga ggcaggagat gagcaaggat  180
ctggaggagg tgaaggccaa ggtgcagccc tacctggacg acttccagaa gaagtggcag  240
gaggagatgg agctctaccg ccagaaggtg gagccgctgc gcgcagagct ccaagagggc  300
gcgcgccaga agctgcacga gctgcaagag aagttgagcc cactgggcga ggagatgcgc  360
gaccgcgcgc gcgcccatgt ggacgcgctg cgcacgcatc tggcccccta cagcgacgag  420
ctgcgccagc gcttggccgc gcgccttgag gctctcaagg agaacggcgg cgccagactg  480
gccgagtacc acgccaaggc caccgagcat ctgagcacgc tcagcgagaa ggccaaaccc  540
gcgctcgagg acctccgcca aggcctgctg cccgtgctgg agagcttcaa ggtcagcttc  600
ctgagcgctc tcgaggagta cactaagaag ctcaacaccc agtaataagc ttgc        654
<210>6
<211>212
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1
<400>6
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln
    210
<210>7
<211>27
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>7
taccatggca aagctccttg acaactg                                       27
<210>8
<211>619
<212>DNA
<213>人工序列
<220>
<223>编码没有His标签的MSP1的核苷酸序列
<400>8
taccatggca aagctccttg acaactggga cagcgtgacc tccaccttca gcaagctgcg  60
cgaacagctc ggccctgtga cccaggagtt ctgggataac ctggaaaagg agacagaggg  120
cctgaggcag gagatgagca aggatctgga ggaggtgaag gccaaggtgc agccctacct  180
ggacgacttc cagaagaagt ggcaggagga gatggagctc taccgccaga aggtggagcc  240
gctgcgcgca gagctccaag agggcgcgcg ccagaagctg cacgagctgc aagagaagtt  300
gagcccactg ggcgaggaga tgcgcgaccg cgcgcgcgcc catgtggacg cgctgcgcac  360
gcatctggcc ccctacagcg acgagctgcg ccagcgcttg gccgcgcgcc ttgaggctct  420
caaggagaac ggcggcgcca gactggccga gtaccacgcc aaggccaccg agcatctgag  480
cacgctcagc gagaaggcca aacccgcgct cgaggacctc cgccaaggcc tgctgcccgt  540
gctggagagc ttcaaggtca gcttcctgag cgctctcgag gagtacacta agaagctcaa  600
cacccagtaa taagcttgc                                               619
<210>9
<211>201
<212>PRT
<213>人工序列
<220>
<223>没有His标签的MSP1
<400>9
Met Ala Lys Leu Leu Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser
1               5                   10                  15
Lys Leu Arg Glu Gln Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>10
<211>27
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>10
taccatggca aagctccttg acaactg                                       27
<210>11
<211>61
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>11
tataccatgg gccatcatca tcatcatcat atagaaggaa gactaaagct ccttgacaac    60
t                                                                    61
<210>12
<211>52
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>12
taagaagctc aacacccagg gtaccggtgg aggtagtgga ggtggtaccc ta           52
<210>13
<211>50
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>13
cagggtaccg gtggaggtag tggaggtggt accctaaagc tccttgacaa              50
<210>14
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>14
gcaagcttat tactgggtgt tgagcttctt                                     30
<210>15
<211>9
<212>PRT
<213>人工序列
<220>
<223>合成的肽接头
<400>15
Gly Thr Gly Gly Gly Ser Gly Gly Thr
1               5
<210>16
<211>1260
<212>DNA
<213>人工序列
<220>
<223>编码带有HIS标签的MSP2的核苷酸序列
<400>16
tataccatgg gccatcatca tcatcatcat atagaaggaa gactaaagct ccttgacaac  60
tgggacagcg tgacctccac cttcagcaag ctgcgcgaac agctcggccc tgtgacccag  120
gagttctggg ataacctgga aaaggagaca gagggcctga ggcaggagat gagcaaggat  180
ctggaggagg tgaaggccaa ggtgcagccc tacctggacg acttccagaa gaagtggcag  240
gaggagatgg agctctaccg ccagaaggtg gagccgctgc gcgcagagct ccaagagggc  300
gcgcgccaga agctgcacga gctgcaagag aagctgagcc cactgggcga ggagatgcgc  360
gaccgcgcgc gcgcccatgt ggacgcgctg cgcacgcatc tggcccccta cagcgacgag  420
ctgcgccagc gcttggccgc gcgccttgag gctctcaagg agaacggcgg cgccagactg  480
gccgagtacc acgccaaggc caccgagcat ctgagcacgc tcagcgagaa ggccaagccc  540
gcgctcgagg acctccgcca aggcctgctg cccgtgctgg agagcttcaa ggtcagcttc  600
ctgagcgctc tcgaggagta cactaagaag ctcaacaccc agggtaccct aaagctcctt  660
gacaactggg acagcgtgac ctccaccttc agcaagctgc gcgaacagct cggccctgtg  720
acccaggagt tctgggataa cctggaaaag gagacagagg gcctgaggca ggagatgagc  780
aaggatctgg aggaggtgaa ggccaaggtg cagccctacc tggacgactt ccagaagaag  840
tggcaggagg agatggagct ctaccgccag aaggtggagc cgctgcgcgc agagctccaa  900
gagggcgcgc gccagaagct gcacgagctg caagagaagc tgagcccact gggcgaggag  960
atgcgcgacc gcgcgcgcgc ccatgtggac gcgctgcgca cgcatctggc cccctacagc  1020
gacgagctgc gccagcgctt ggccgcgcgc cttgaggctc tcaaggagaa cggcggcgcc  1080
agactggccg agtaccacgc caaggccacc gagcatctga gcacgctcag cgagaaggcc  1140
aagcccgcgc tcgaggacct ccgccaaggc ctgctgcccg tgctggagag cttcaaggtc  1200
agcttcctga gcgctctcga ggagtacact aagaagctca acacccagta ataagcttgc  1260
<210>17
<211>414
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP2
<400>17
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr Leu Lys Leu Leu Asp Asn Trp Asp Ser Val
    210                 215                 220
Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr Gln
225                 230                 235                 240
Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu
                245                 250                 255
Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu
            260                 265                 270
Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln
        275                 280                 285
Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys
    290                 295                 300
Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg
305                 310                 315                 320
Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro
                325                 330                 335
Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu
            340                 345                 350
Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr
        355                 360                 365
Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp
    370                 375                 380
Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe
385                 390                 395                 400
Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
                405                 410
<210>18
<211>1282
<212>DNA
<213>人工序列
<220>
<223>编码带有HIS标签的MSP2L的核苷酸序列
<400>18
taccatgggc catcatcatc atcatcatat agaaggaaga ctaaagctcc ttgacaactg  60
ggacagcgtg acctccacct tcagcaagct gcgcgaacag ctcggccctg tgacccagga  120
gttctgggat aacctggaaa aggagacaga gggcctgagg caggagatga gcaaggatct  180
ggaggaggtg aaggccaagg tgcagcccta cctggacgac ttccagaaga agtggcagga  240
ggagatggag ctctaccgcc agaaggtgga gccgctgcgc gcagagctcc aagagggcgc  300
gcgccagaag ctgcacgagc tgcaagagaa gctgagccca ctgggcgagg agatgcgcga  360
ccgcgcgcgc gcccatgtgg acgcgctgcg cacgcatctg gccccctaca gcgacgagct  420
gcgccagcgc ttggccgcgc gccttgaggc tctcaaggag aacggcggcg ccagactggc  480
cgagtaccac gccaaggcca ccgagcatct gagcacgctc agcgagaagg ccaagcccgc  540
gctcgaggac ctccgccaag gcctgctgcc cgtgctggag agcttcaagg tcagcttcct  600
gagcgctctc gaggagtaca ctaagaagct caacacccag ggtaccggtg gaggtagtgg  660
aggtggtacc ctaaagctcc ttgacaactg ggacagcgtg acctccacct tcagcaagct  720
gcgcgaacag ctcggccctg tgacccagga gttctgggat aacctggaaa aggagacaga  780
gggcctgagg caggagatga gcaaggatct ggaggaggtg aaggccaagg tgcagcccta  840
cctggacgac ttccagaaga agtggcagga ggagatggag ctctaccgcc agaaggtgga  900
gccgctgcgc gcagagctcc aagagggcgc gcgccagaag ctgcacgagc tgcaagagaa  960
gctgagccca ctgggcgagg agatgcgcga ccgcgcgcgc gcccatgtgg acgcgctgcg  1020
cacgcatctg gccccctaca gcgacgagct gcgccagcgc ttggccgcgc gccttgaggc  1080
tctcaaggag aacggcggcg ccagactggc cgagtaccac gccaaggcca ccgagcatct  1140
gagcacgctc agcgagaagg ccaagcccgc gctcgaggac ctccgccaag gcctgctgcc  1200
cgtgctggag agcttcaagg tcagcttcct gagcgctctc gaggagtaca ctaagaagct  1260
caacacccag taataagctt gc                                           1282
<210>19
<211>422
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP2L
<400>19
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu G1u Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr Gly Gly Gly Ser Gly Gly Gly Thr Leu Lys
    210                 215                 220
Leu Leu Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg
225                 230                 235                 240
Glu Gln Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys
                245                 250                 255
Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val
            260                 265                 270
Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln
        275                 280                 285
Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu
    290                 295                 300
Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu
305                 310                 315                 320
Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp
                325                 330                 335
Ala Leu Arg Thr His Leu Ala Pr0Tyr Ser Asp Glu Leu Arg Gln Arg
            340                 345                 350
Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu
        355                 360                 365
Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu
    370                 375                 380
Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val
385                 390                 395                 400
Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr
                405                 410                 415
Lys Lys Leu Asn Thr Gln
            420
<210>20
<211>43
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>20
tggagctcta ccgccagaag gtggagccct acagcgacga gct                       43
<210>21
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>21
gcaagcttat tactgggtgt tgagcttctt                                       30
<210>22
<211>522
<212>DNA
<213>人工序列
<220>
<223>编码MSP1D5D6的核苷酸序列
<400>22
tataccatgg gccatcatca tcatcatcat atagaaggaa gactaaagct ccttgacaac  60
tgggacagcg tgacctccac cttcagcaag ctgcgcgaac agctcggccc tgtgacccag  120
gagttctggg ataacctgga aaaggagaca gagggcctga ggcaggagat gagcaaggat  180
ctggaggagg tgaaggccaa ggtgcagccc tacctggacg acttccagaa gaagtggcag  240
gaggagatgg agctctaccg ccagaaggtg gagccctaca gcgacgagct gcgccagcgc  300
ttggccgcgc gccttgaggc tctcaaggag aacggcggcg ccagactggc cgagtaccac  360
gccaaggcca ccgagcatct gagcacgctc agcgagaagg ccaaacccgc gctcgaggac  420
ctccgccaag gcctgctgcc cgtgctggag agcttcaagg tcagcttcct gagcgctctc  480
gaggagtaca ctaagaagct caacacccag taataagctt gc                     522
<210>23
<211>168
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D5D6
<400>23
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr Ser Asp Glu Leu Arg
                85                  90                  95
Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala
            100                 105                 110
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
        115                 120                 125
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
    130                 135                 140
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
145                 150                 155                 160
Tyr Thr Lys Lys Leu Asn Thr Gln
                165
<210>24
<211>29
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>24
cagaattcgc tagccgagta ccacgccaa                                  29
<210>25
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>25
gcaagcttat tactgggtgt tgagcttctt                                 30
<210>26
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>26
ataccatggg ccatcatcat catcatcata                                 30
<210>27
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>27
cagaattcgc tagcctggcg ctcaacttct ctt                              33
<210>28
<211>522
<212>DNA
<213>人工序列
<220>
<223>编码带有HIS标签的MSP1D6的核苷酸序列
<400>28
tataccatgg gccatcatca tcatcatcat atagaaggaa gactaaagct ccttgacaac  60
tgggacagcg tgacctccac cttcagcaag ctgcgcgaac agctcggccc tgtgacccag  120
gagttctggg ataacctgga aaaggagaca gagggcctga ggcaggagat gagcaaggat  180
ctggaggagg tgaaggccaa ggtgcagccc tacctggacg acttccagaa gaagtggcag  240
gaggagatgg agctctaccg ccagaaggtg gagccgctgc gcgcagagct ccaagagggc  300
gcgcgccaga agctgcacga gctgcaagag aagttgagcg ccaggctagc cgagtaccac  360
gccaaggcca ccgagcatct gagcacgctc agcgagaagg ccaaacccgc gctcgaggac  420
ctccgccaag gcctgctgcc cgtgctggag agcttcaagg tcagcttcct gagcgctctc  480
gaggagtaca ctaagaagct caacacccag taataagctt gc                     522
<210>29
<211>168
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D6
<400>29
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Ala
            100                 105                 110
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
        115                 120                 125
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
    130                 135                 140
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
145                 150                 155                 160
Tyr Thr Lys Lys Leu Asn Thr Gln
                165
<210>30
<211>77
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>30
taccatgggt catcatcatc atcatcacat tgagggacgt ctgaagctgt tggacaattg  60
ggactctgtt acgtcta                                                 77
<210>31
<211>62
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>31
aggaattctg ggacaacctg gaaaaagaaa ccgagggact gcgtcaggaa atgtccaaag  60
at                                                                 62
<210>32
<211>54
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>32
tatctagatg actttcagaa aaaatggcag gaagagatgg aattatatcg tcaa          54
<210>33
<211>73
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>33
atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc gcccgtgcac  60
atgttgatgc act                                                     73
<210>34
<211>65
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>34
gtctcgaggc gctgaaagaa aacgggggtg cccgcttggc tgagtaccac gcgaaagcga  60
cagaa                                                              65
<210>35
<211>56
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>35
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttct        56
<210>36
<211>61
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>36
cagaattcct gcgtcacggg gcccagttgt tcgcgaagtt tactgaaggt agacgtaaca  60
g                                                                  61
<210>37
<211>55
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>37
tcatctagat atggctgaac cttggccttc acctcttcta aatctttgga cattt        55
<210>38
<211>80
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>38
tggagctcat ggagtttttg gcgtgccccc tcttgcagtt ccgcacgcag cggttccacc  60
ttttgacgat ataattccat                                              80
<210>39
<211>76
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>39
gcctcgagac gtgcggccaa acgctggcga agttcatccg aatacggcgc caaatgagtc  60
cggagtgcat caacat                                                  76
<210>40
<211>61
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>40
gtagatcttc cagcgccggt ttcgcttttt cgctcaaggt gctcaggtgt tctgtcgctt  60
t                                                                  61
<210>41
<211>66
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>41
ccaagcttat tactgggtat tcagcttttt agtatattct tccagagctg acagaaaact  60
gacttt                                                             66
<210>42
<211>651
<212>DNA
<213>人工序列
<220>
<223>编码MSP1的全长合成序列
<400>42
accatgggtc atcatcatca tcatcacatt gagggacgtc tgaagctgtt ggacaattgg  60
gactctgtta cgtctacctt cagtaaactt cgcgaacaac tgggccccgt gacgcaggaa  120
ttctgggaca acctggaaaa agaaaccgag ggactgcgtc aggaaatgtc caaagattta  180
gaagaggtga aggccaaggt tcagccatat ctagatgact ttcagaaaaa atggcaggaa  240
gagatggaat tatatcgtca aaaggtggaa ccgctgcgtg cggaactgca agagggggca  300
cgccaaaaac tccatgagct ccaagagaag ctcagcccat taggcgaaga aatgcgcgat  360
cgcgcccgtg cacatgttga tgcactccgg actcatttgg cgccgtattc ggatgaactt  420
cgccagcgtt tggccgcacg tctcgaggcg ctgaaagaaa acgggggtgc ccgcttggct  480
gagtaccacg cgaaagcgac agaacacctg agcaccttga gcgaaaaagc gaaaccggcg  540
ctggaagatc tacgccaggg cttattgcct gttcttgaga gctttaaagt cagttttctg  600
tcagctctgg aagaatatac taaaaagctg aatacccagt aataagcttg g           651
<210>43
<211>201
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D3
<400>43
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>44
<211>201
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D9
<400>44
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>45
<211>392
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP2Δ1
<400>45
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln Gly Thr Leu Lys Leu Leu Asp
        195                 200                 205
Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu
    210                 215                 220
Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu
225                 230                 235                 240
Gly Leu Arg Gln Glu Met Ser Pro Tyr Leu Asp Asp Phe Gln Lys Lys
                245                 250                 255
Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg
            260                 265                 270
Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu
        275                 280                 285
Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His
    290                 295                 300
Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg
305                 310                 315                 320
Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala
                325                 330                 335
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
            340                 345                 350
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
        355                 360                 365
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
    370                 375                 380
Tyr Thr Lys Lys Leu Asn Thr Gln
385                 390
<210>46
<211>4
<212>PRT
<213>人工序列
<220>
<223>合成的肽接头
<220>
<221>MISC_FEATURE
<222>(1)..(4)
<223>X是Ser或Thr
<400>46
Gly Gly Gly Xaa
1
<210>47
<211>12
<212>PRT
<213>人工序列
<220>
<223>His标签的人工序列
<400>47
Met Gly His His His His His His Ile Glu Gly Arg
1               5                   10
<210>48
<211>23
<212>PRT
<213>人工序列
<220>
<223>HisTEV的人工序列
<400>48
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly
            20
<210>49
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋1的人工序列
<400>49
Leu Lys Leu Leu Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys
1               5                   10                  15
Leu Arg Glu Gln Leu Gly
            20
<210>50
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋2的人工序列
<400>50
Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly
1               5                   10                  15
Leu Arg Gln Glu Met Ser
            20
<210>51
<211>11
<212>PRT
<213>人工序列
<220>
<223>螺旋3的人工序列
<400>51
Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln
1               5                   10
<210>52
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋4的人工序列
<400>52
Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu
1               5                   10                  15
Tyr Arg Gln Lys Val Glu
            20
<210>53
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋5的人工序列
<400>53
Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu
1               5                   10                  15
Leu Gln Glu Lys Leu Ser
            20
<210>54
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋6的人工序列
<400>54
Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala
1               5                   10                  15
Leu Arg Thr His Leu Ala
            20
<210>55
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋7的人工序列
<400>55
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
1               5                   10                  15
Leu Lys Glu Asn Gly Gly
            20
<210>56
<211>22
<212>PRT
<213>人工序列
<220>
<223>螺旋8的人工序列
<400>56
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala ThT Glu His Leu Ser Thr
1               5                   10                  15
Leu Ser Glu Lys Ala Lys
            20
<210>57
<211>11
<212>PRT
<213>人工序列
<220>
<223>螺旋9的人工序列
<400>57
Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
1               5                   10
<210>58
<211>24
<212>PRT
<213>人工序列
<220>
<223>螺旋10的人工序列
<400>58
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
1               5                   10                  15
Tyr Thr Lys Lys Leu Asn Thr Gln
            20
<210>59
<211>11
<212>PRT
<213>人工序列
<220>
<223>螺旋0.5的人工序列
<400>59
Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly
1               5                   10
<210>60
<211>36
<212>DNA
<213>人工序列
<220>
<223>编码His标签的序列
<400>60
atgggtcatc atcatcatca tcacattgag ggacgt                      36
<210>61
<211>69
<212>DNA
<213>人工序列
<220>
<223>编码His-TEV的序列
<400>61
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggt                                                          69
<210>62
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋1的序列
<400>62
ctgaagctgt tggacaattg ggactctgtt acgtctacct tcagtaaact tcgcgaacaa  60
ctgggc                                                             66
<210>63
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋2的序列
<400>63
cccgtgacgc aggaattctg ggacaacctg gaaaaagaaa ccgagggact gcgtcaggaa  60
atgtcc                                                             66
<210>64
<211>33
<212>DNA
<213>人工序列
<220>
<223>编码螺旋3的序列
<400>64
aaagatttag aagaggtgaa ggccaaggtt cag                              33
<210>65
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋4的序列
<400>65
ccatatctcg atgactttca gaaaaaatgg caggaagaga tggaattata tcgtcaaaag  60
gtggaa                                                             66
<210>66
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋5的序列
<400>66
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  60
ctcagc                                                             66
<210>67
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋6的序列
<400>67
ccattaggcg aagaaatgcg cgatcgcgcc cgtgcacatg ttgatgcact ccggactcat  60
ttggcg                                                             66
<210>68
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋7的序列
<400>68
ccgtattcgg atgaacttcg ccagcgtttg gccgcacgtc tcgaggcgct gaaagaaaac  60
gggggt                                                             66
<210>69
<211>66
<212>DNA
<213>人工序列
<220>
<223>编码螺旋8的序列
<400>69
gcccgcttgg ctgagtacca cgcgaaagcg acagaacacc tgagcacctt gagcgaaaaa  60
gcgaaa                                                             66
<210>70
<211>33
<212>DNA
<213>人工序列
<220>
<223>编码螺旋9的序列
<400>70
ccggcgctgg aagatctacg ccagggctta ttg                                33
<210>71
<211>72
<212>DNA
<213>人工序列
<220>
<223>编码螺旋10的序列
<400>71
cctgttcttg agagctttaa agtcagtttt ctgtcagctc tggaagaata tactaaaaag  60
ctgaataccc ag                                                      72
<210>72
<211>33
<212>DNA
<213>人工序列
<220>
<223>编码螺旋0.5的序列
<400>72
tctaccttca gtaaacttcg cgaacaactg ggc                             33
<210>73
<211>234
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1E1的人工序列
<400>73
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr Leu Asp Asp Phe Gln
                85                  90                  95
Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro
            100                 105                 110
Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu
        115                 120                 125
Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg
    130                 135                 140
Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu
145                 150                 155                 160
Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly
                165                 170                 175
Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser
            180                 185                 190
Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly
        195                 200                 205
Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu
    210                 215                 220
Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
225                 230
<210>74
<211>256
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1E2的人工序列
<400>74
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr Leu Asp Asp Phe Gln
                85                  90                  95
Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro
            100                 105                 110
Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu
        115                 120                 125
Gln Glu Lys Leu Ser Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg
    130                 135                 140
Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu
145                 150                 155                 160
Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu
                165                 170                 175
Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu
            180                 185                 190
Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys
        195                 200                 205
Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu
    210                 215                 220
Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val
225                 230                 235                 240
Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
                245                 250                 255
<210>75
<211>278
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1E3的人工序列
<400>75
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr Leu Asp Asp Phe Gln
                85                  90                  95
Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro
            100                 105                 110
Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu
        115                 120                 125
Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg
    130                 135                 140
Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Leu Arg Ala Glu
145                 150                 155                 160
Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu
                165                 170                 175
Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp
            180                 185                 190
Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg
        195                 200                 205
Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu
    210                 215                 220
Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu
225                 230                 235                 240
Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val
                245                 250                 255
Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr
            260                 265                 270
Lys Lys Leu Asn Thr Gln
        275
<210>76
<211>223
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1TEV的人工序列
<400>76
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Leu Lys Leu Leu Asp Asn Trp Asp Ser
            20                  25                  30
Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr
        35                  40                  45
Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln
    50                  55                  60
Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr
65                  70                  75                  80
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                85                  90                  95
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            100                 105                 110
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        115                 120                 125
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    130                 135                 140
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
145                 150                 155                 160
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                165                 170                 175
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            180                 185                 190
Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser
        195                 200                 205
Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
    210                 215                 220
<210>77
<211>200
<212>PRT
<213>人工序列
<220>
<223>MSP1NH的人工序列
<400>77
Leu Lys Leu Leu Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys
1               5                   10                  15
Leu Arg Glu Gln Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu
            20                  25                  30
Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu
        35                  40                  45
Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys
    50                  55                  60
Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg
65                  70                  75                  80
Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu
                85                  90                  95
Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His
            100                 105                 110
Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg
        115                 120                 125
Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala
    130                 135                 140
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
145                 150                 155                 160
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
                165                 170                 175
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
            180                 185                 190
Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>78
<211>212
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1T2的人工序列
<400>78
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln
    210
<210>79
<211>189
<212>PRT
<213>人工序列
<220>
<223>MSP1T2NH的人工序列
<400>79
Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr Gln Glu
1               5                   10                  15
Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met
            20                  25                  30
Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp
        35                  40                  45
Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys
    50                  55                  60
Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu
65                  70                  75                  80
His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp
                85                  90                  95
Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr
            100                 105                 110
Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys
        115                 120                 125
Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu
    130                 135                 140
His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu
145                 150                 155                 160
Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu
                165                 170                 175
Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
            180                 185
<210>80
<211>201
<212>PRT
<213>人工序列
<220>
<223>MSP1T3的人工序列
<400>80
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Pro Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>81
<211>168
<212>PRT
<213>人工序列
<220>
<223>MSP1D4D5的人工序列
<400>81
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His
65                  70                  75                  80
Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg
                85                  90                  95
Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala
            100                 105                 110
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
        115                 120                 125
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
    130                 135                 140
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
145                 150                 155                 160
Tyr Thr Lys Lys Leu Asn Thr Gln
                165
<210>82
<211>168
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D6D7
<400>82
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Ala
            100                 105                 110
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
        115                 120                 125
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
    130                 135                 140
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
145                 150                 155                 160
Tyr Thr Lys Lys Leu Asn Thr Gln
                165
<210>83
<211>190
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D3D9
<400>83
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Val Leu Glu Ser Phe Lys Val Ser Phe
                165                 170                 175
Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
            180                 185                 190
<210>84
<211>201
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D10.5
<400>84
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>85
<211>190
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP1D3D10.5
<400>85
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
            180                 185                 190
<210>86
<211>381
<212>PRT
<213>人工序列
<220>
<223>带有HIS标签的MSP2D1D1
<400>86
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Pro Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu G1u Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala GLu Leu Gln Glu Gly Ala Arg Gln Lys Leu His GLu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln Gly Thr Pro Val Thr Gln Glu
        195                 200                 205
Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met
    210                 215                 220
Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp
225                 230                 235                 240
Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys
                245                 250                 255
Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu
            260                 265                 270
His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp
        275                 280                 285
Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr
    290                 295                 300
Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys
305                 310                 315                 320
Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu
                325                 330                 335
His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu
            340                 345                 350
Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu
        355                 360                 365
Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
    370                 375                 380
<210>87
<211>13
<212>PRT
<213>人工序列
<220>
<223>螺旋10.5的序列
<400>87
Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
1               5                   10
<210>88
<211>49
<212>DNA
<213>人工序列
<220>
<223>螺旋10.5的核苷酸序列
<400>88
cagttttctg tcagctctgg aagaatatac taaaaagctg aatacccag            49
<210>89
<211>43
<212>PRT
<213>人工序列
<220>
<223>GLOB的序列
<400>89
Asp Glu Pro Pro Gln Ser Pro Trp Asp Arg Val Lys Asp Leu Ala Thr
1               5                   10                  15
Val Tyr Val Asp Val Leu Lys Asp Ser Gly Arg Asp Tyr Val Ser Gln
            20                  25                  30
Phe Glu Gly Ser Ala Leu Gly Lys Gln Leu Asn
        35                  40
<210>90
<211>66
<212>DNA
<213>人工的
<220>
<223>编码H2S的寡核苷酸
<400>90
tccgtgacgc aggaattctg ggacaacctg gaaaaagaaa ccgagggact gcgtcaggaa  60
atgtcc
<210>91
<211>201
<212>PRT
<213>人工的
<220>
<223>MSP1T4
<400>91
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln
        195                 200
<210>92
<211>190
<212>PRT
<213>人工的
<220>
<223>MSP1T5
<400>92
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Lys Glu Thr Glu Gly Leu Arg Gln Glu
            20                  25                  30
Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu
        35                  40                  45
Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln
    50                  55                  60
Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys
65                  70                  75                  80
Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg
                85                  90                  95
Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro
            100                 105                 110
Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu
        115                 120                 125
Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr
    130                 135                 140
Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp
145                 150                 155                 160
Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe
                165                 170                 175
Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
            180                 185                 190
<210>93
<211>179
<212>PRT
<213>人工的
<220>
<223>MSP1T6
<400>93
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Lys Asp Leu Glu Glu Val Lys Ala Lys
            20                  25                  30
Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met
        35                  40                  45
Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu
    50                  55                  60
Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu
65                  70                  75                  80
Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg
                85                  90                  95
Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala
            100                 105                 110
Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr
        115                 120                 125
His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys
    130                 135                 140
Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser
145                 150                 155                 160
Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu
                165                 170                 175
Asn Thr Gln
<210>94
<211>289
<212>PRT
<213>人工的
<220>
<223>MSP1E3TEV
<400>94
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Leu Lys Leu Leu Asp Asn Trp Asp Ser
            20                  25                  30
Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr
        35                  40                  45
Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln
    50                  55                  60
Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr
65                  70                  75                  80
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                85                  90                  95
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            100                 105                 110
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        115                 120                 125
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    130                 135                 140
Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu
145                 150                 155                 160
Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala
                165                 170                 175
Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu
            180                 185                 190
Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His
        195                 200                 205
Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu
    2l0                 215                 220
Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala
225                 230                 235                 240
Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala
                245                 250                 255
Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys
            260                 265                 270
Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr
        275                 280                 285
Gln
<210>95
<211>278
<212>PRT
<213>人工的
<220>
<223>MSP1E3D1
<400>95
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln
    130                 135                 140
Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu
145                 150                 155                 160
Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu
                165                 170                 175
Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp
            180                 185                 190
Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg
        195                 200                 205
Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu
    210                 215                 220
Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu
225                 230                 235                 240
Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val
                245                 250                 255
Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr
            260                 265                 270
Lys Lys Leu Asn Thr Gln
        275
<210>96
<211>423
<212>PRT
<213>人工的
<220>
<223>MSP2TEV
<400>96
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Leu Lys Leu Leu Asp Asn Trp Asp Ser
            20                  25                  30
Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr
        35                  40                  45
Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln
    50                  55                  60
Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr
65                  70                  75                  80
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                85                  90                  95
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            100                 105                 110
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        115                 120                 125
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    130                 135                 140
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
145                 150                 155                 160
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                165                 170                 175
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            180                 185                 190
Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser
        195                 200                 205
Phe Leu Ser Ala Leu Glu Tyr Thr Lys Lys Leu Asn Thr Gln Gly Thr
    210                 215                 220
Leu Lys Leu Leu Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys
225                 230                 235                 240
Leu Arg Glu Gln Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu
                245                 250                 255
Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Lys Asp Leu Glu Glu
            260                 265                 270
Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp
        275                 280                 285
Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala
    290                 295                 300
Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys
305                 310                 315                 320
Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val
                325                 330                 335
Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln
            340                 345                 350
Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg
        355                 360                 365
Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser
    370                 375                 380
Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro
385                 390                 395                 400
Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr
                405                 410                 415
Thr Lys Lys Leu Asn Thr Gln
            420
<210>97
<211>199
<212>PRT
<213>人工的
<220>
<223>MSP1N1
<400>97
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr
65                  70                  75                  80
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                85                  90                  95
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            100                 105                 110
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        115                 120                 125
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    130                 135                 140
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
145                 150                 155                 160
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                165                 170                 175
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            180                 185                 190
Asp Leu Arg Gln Gly Leu Leu
        195
<210>98
<211>401
<212>PRT
<213>人工的
<220>
<223>MSP2N1
<400>98
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro
    210                 215                 220
Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu
225                 230                 235                 240
Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln
                245                 250                 255
Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu
            260                 265                 270
Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala
        275                 280                 285
Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu
    290                 295                 300
Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His
305                 310                 315                 320
Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu
                325                 330                 335
Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala
            340                 345                 350
Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala
        355                 360                 365
Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys
    370                 375                 380
Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr
385                 390                 395                 400
Gln
<210>99
<211>392
<212>PRT
<213>人工的
<220>
<223>MSP2N2
<400>99
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr Pro Val Thr Gln Glu Phe Trp Asp Asn Leu
    210                 215                 220
Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu
225                 230                 235                 240
Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys
                245                 250                 255
Trp Gin Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg
            260                 265                 270
Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu
        275                 280                 285
Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His
    290                 295                 300
Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg
305                 310                 315                 320
Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala
                325                 330                 335
Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu
            340                 345                 350
Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu
        355                 360                 365
Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu
    370                 375                 380
Tyr Thr Lys Lys Leu Asn Thr Gln
385                 390
<210>100
<211>603
<212>DNA
<213>人工的
<220>
<223>编码MSP1T4的DNA
<400>100
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ccgtgacgca ggaattctgg gacaacctgg aaaaagaaac cgagggactg  120
cgtcaggaaa tgtccaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  180
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccgctg  240
cgtgcggaac tgcaagaggg ggcacgccaa aaactccatg agctccaaga gaagctcagc  300
ccattaggcg aagaaatgcg cgatcgcgcc cgtgcacatg ttgatgcact ccggactcat  360
ttggcgccgt attcggatga acttcgccag cgtttggccg cacgtctcga ggcgctgaaa  420
gaaaacgggg gtgcccgctt ggctgagtac cacgcgaaag cgacagaaca cctgagcacc  480
ttgagcgaaa aagcgaaacc ggcgctggaa gatctacgcc agggcttatt gcctgttctt  540
gagagcttta aagtcagttt tctgtcagct ctggaagaat atactaaaaa gctgaatacc  600
cag                                                                603
<210>101
<211>570
<212>DNA
<213>人工的
<220>
<223>编码MSP1T5的DNA
<400>101
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggta aagaaaccga gggactgcgt caggaaatgt ccaaagattt agaagaggtg  120
aaggccaagg ttcagccata tctcgatgac tttcagaaaa aatggcagga agagatggaa  180
ttatatcgtc aaaaggtgga accgctgcgt gcggaactgc aagagggggc acgccaaaaa  240
ctccatgagc tccaagagaa gctcagccca ttaggcgaag aaatgcgcga tcgcgcccgt  300
gcacatgttg atgcactccg gactcatttg gcgccgtatt cggatgaact tcgccagcgt  360
ttggccgcac gtctcgaggc gctgaaagaa aacgggggtg cccgcttggc tgagtaccac  420
gcgaaagcga cagaacacct gagcaccttg agcgaaaaag cgaaaccggc gctggaagat  480
ctacgccagg gcttattgcc tgttcttgag agctttaaag tcagttttct gtcagctctg  540
gaagaatata ctaaaaagct gaatacccag                                   570
<210>102
<211>537
<212>DNA
<213>人工的
<220>
<223>编码MSP1T6的DNA
<400>102
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggta aagatttaga agaggtgaag gccaaggttc agccatatct cgatgacttt  120
cagaaaaaat ggcaggaaga gatggaatta tatcgtcaaa aggtggaacc gctgcgtgcg  180
gaactgcaag agggggcacg ccaaaaactc catgagctcc aagagaagct cagcccatta  240
ggcgaagaaa tgcgcgatcg cgcccgtgca catgttgatg cactccggac tcatttggcg  300
ccgtattcgg atgaacttcg ccagcgtttg gccgcacgtc tcgaggcgct gaaagaaaac  360
gggggtgccc gcttggctga gtaccacgcg aaagcgacag aacacctgag caccttgagc  420
gaaaaagcga aaccggcgct ggaagatcta cgccagggct tattgcctgt tcttgagagc  480
tttaaagtca gttttctgtc agctctggaa gaatatacta aaaagctgaa tacccag     537
<210>103
<211>597
<212>DNA
<213>人工的
<220>
<223>编码MSP1N1的DNA
<400>103
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ccgtgacgca ggaattctgg gacaacctgg aaaaagaaac cgagggactg  120
cgtcaggaaa tgtccaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  180
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccatat  240
ctcgatgact ttcagaaaaa atggcaggaa gagatggaat tatatcgtca aaaggtggaa  300
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  360
ctcagcccat taggcgaaga aatgcgcgat cgcgcccgtg cacatgttga tgcactccgg  420
actcatttgg cgccgtattc ggatgaactt cgccagcgtt tggccgcacg tctcgaggcg  480
ctgaaagaaa acgggggtgc ccgcttggct gagtaccacg cgaaagcgac agaacacctg  540
agcaccttga gcgaaaaagc gaaaccggcg ctggaagatc tacgccaggg cttattg     597
<210>104
<211>4
<212>PRT
<213>人工的
<220>
<223>人工的肽序列
<400>104
Asn Pro Gly Thr
1
<210>105
<211>867
<212>DNA
<213>人工的
<220>
<223>编码MSP1E3TEV的DNA
<400>105
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtc tgaagctgtt ggacaattgg gactctgtta cgtctacctt cagtaaactt  120
cgcgaacaac tgggccccgt gacgcaggaa ttctgggaca acctggaaaa agaaaccgag  180
ggactgcgtc aggaaatgtc caaagattta gaagaggtga aggccaaggt tcagccatat  240
ctcgatgact ttcagaaaaa atggcaggaa gagatggaat tatatcgtca aaaggtggaa  300
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  360
ctcagcccat taggcgaaga aatgcgcgat cgcgcccgtg cacatgttga tgcactccgg  420
actcatttgg cgccatatct cgatgacttt cagaaaaaat ggcaggaaga gatggaatta  480
tatcgtcaaa aggtggaacc gctgcgtgcg gaactgcaag agggggcacg ccaaaaactc  540
catgagctcc aagagaagct cagcccatta ggcgaagaaa tgcgcgatcg cgcccgtgca  600
catgttgatg cactccggac tcatttggcg ccgtattcgg atgaacttcg ccagcgtttg  660
gccgcacgtc tcgaggcgct gaaagaaaac gggggtgccc gcttggctga gtaccacgcg  720
aaagcgacag aacacctgag caccttgagc gaaaaagcga aaccggcgct ggaagatcta  780
cgccagggct tattgcctgt tcttgagagc tttaaagtca gttttctgtc agctctggaa  840
gaatatacta aaaagctgaa tacccag                                      867
<210>106
<211>834
<212>DNA
<213>人工的
<220>
<223>编码MSP1E3D1的DNA
<400>106
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc    360
gcccgtgcac atgttgatgc actccggact catttggcgc catatctcga tgactttcag    420
aaaaaatggc aggaagagat ggaattatat cgtcaaaagg tggaaccgct gcgtgcggaa    480
ctgcaagagg gggcacgcca aaaactccat gagctccaag agaagctcag cccattaggc    540
gaagaaatgc gcgatcgcgc ccgtgcacat gttgatgcac tccggactca tttggcgccg    600
tattcggatg aacttcgcca gcgtttggcc gcacgtctcg aggcgctgaa agaaaacggg    660
ggtgcccgct tggctgagta ccacgcgaaa gcgacagaac acctgagcac cttgagcgaa    720
aaagcgaaac cggcgctgga agatctacgc cagggcttat tgcctgttct tgagagcttt    780
aaagtcagtt ttctgtcagc tctggaagaa tatactaaaa agctgaatac ccag          834
<210>107
<211>1275
<212>DNA
<213>人工的
<220>
<223>编码MSP2TEV的DNA
<400>107
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtc taaagctcct tgacaactgg gacagcgtga cctccacctt cagcaagctg  120
cgcgaacagc tcggccctgt gacccaggag ttctgggata acctggaaaa ggagacagag  180
ggcctgaggc aggagatgag caaggatctg gaggaggtga aggccaaggt gcagccctac  240
ctggacgact tccagaagaa gtggcaggag gagatggagc tctaccgcca gaaggtggag  300
ccgctgcgcg cagagctcca agagggcgcg cgccagaagc tgcacgagct gcaagagaag  360
ctgagcccac tgggcgagga gatgcgcgac cgcgcgcgcg cccatgtgga cgcgctgcgc  420
acgcatctgg ccccctacag cgacgagctg cgccagcgct tggccgcgcg ccttgaggct  480
ctcaaggaga acggcggcgc cagactggcc gagtaccacg ccaaggccac cgagcatctg  540
agcacgctca gcgagaaggc caagcccgcg ctcgaggacc tccgccaagg cctgctgccc  600
gtgctggaga gcttcaaggt cagcttcctg agcgctctcg aggagtacac taagaagctc  660
aacacccagg gtaccotaaa gctccttgac aactgggaca gcgtgacctc caccttcagc  720
aagctgcgcg aacagctcgg ccctgtgacc caggagttct gggataacct ggaaaaggag  780
acagagggcc tgaggcagga gatgagcaag gatctggagg aggtgaaggc caaggtgcag  840
ccctacctgg acgacttcca gaagaagtgg caggaggaga tggagctcta ccgccagaag  900
gtggagccgc tgcgcgcaga gctccaagag ggcgcgcgcc agaagctgca cgagctgcaa  960
gagaagctga gcccactggg cgaggagatg cgcgaccgcg cgcgcgccca tgtggacgcg  1020
ctgcgcacgc atctggcccc ctacagcgac gagctgcgcc agcgcttggc cgcgcgcctt  1080
gaggctctca aggagaacgg cggcgccaga ctggccgagt accacgccaa ggccaccgag  1140
catctgagca cgctcagcga gaaggccaag cccgcgctcg aggacctccg ccaaggcctg  1200
ctgcccgtgc tggagagctt caaggtcagc ttcctgagcg ctctcgagga gtacactaag  1260
aagctcaaca cccag                                                   1275
<210>108
<211>1203
<212>DNA
<213>人工的
<220>
<223>MSP2N1
<400>108
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccagggta ccttcagtaa acttcgcgaa  660
caactgggcc ccgtgacgca ggaattctgg gacaacctgg aaaaagaaac cgagggactg  720
cgtcaggaaa tgtccaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  780
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccgctg  840
cgtgcggaac tgcaagaggg ggcacgccaa aaactccatg agctccaaga gaagctcagc  900
ccattaggcg aagaaatgcg cgatcgcgcc cgtgcacatg ttgatgcact ccggactcat  960
ttggcgccgt attcggatga acttcgccag cgtttggccg cacgtctcga ggcgctgaaa  1020
gaaaacgggg gtgcccgctt ggctgagtac cacgcgaaag cgacagaaca cctgagcacc  1080
ttgagcgaaa aagcgaaacc ggcgctggaa gatctacgcc agggcttatt gcctgttctt  1140
gagagcttta aagtcagttt tctgtcagct ctggaagaat atactaaaaa gctgaatacc  1200
cag                                                                1203
<210>109
<211>1176
<212>DNA
<213>人工的
<220>
<223>编码MSP2N2的DNA
<400>109
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccagggta cccccgtgac gcaggaattc  660
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  720
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  780
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  840
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  900
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  960
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  1020
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  1080
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  1140
gctctggaag aatatactaa aaagctgaat acccag                            1176
<210>110
<211>1198
<212>DNA
<213>人工的
<220>
<223>编码MSP2N3的DNA
<400>110
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccagggta cccgcgaaca actgggcccc  660
gtgacgcagg aattctggga caacctggaa aaagaaaccg agggactgcg tcaggaaatg  720
tccaaagatt tagaagaggt gaaggccaag gttcagccat atctcgatga ctttcagaaa  780
aaatggcagg aagagatgga attatatcgt caaaaggtgg aaccgctgcg tgcggaactg  840
caagaggggg cacgccaaaa actccatgag ctccaagaga agctcagccc attaggcgaa  900
gaaatgcgcg atcgcgcccg tgcacatgtt gatgcactcc ggactcattt ggcgccgtat  960
tcggatgaac ttcgccagcg tttggccgca cgtctcgagg cgctgaaaga aaacgggggt  1020
gcccgcttgg ctgagtacca cgcgaaagcg acagaacacc tgagcacctt gagcgaaaaa  1080
gcgaaaccgg cgctggaaga tctacgccag ggcttattgc ctgttcttga gagctttaaa  1140
gtcagttttc tgtcagctct ggaagaatat actaaaaagc tgaataccca gtaagctt    1198
<210>111
<211>397
<212>PRT
<213>人工的
<220>
<223>MSP2N3
<400>111
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr Arg Glu Gln Leu Gly Pro Val Thr Gln Glu
    210                 215                 220
Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met
225                 230                 235                 240
Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp
                245                 250                 255
Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys
            260                 265                 270
Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu
        275                 280                 285
His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp
    290                 295                 300
Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr
305                 310                 315                 320
Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys
                325                 330                 335
Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu
            340                 345                 350
His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu
        355                 360                 365
Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu
    370                 375                 380
Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
385                 390                 395
<210>112
<211>1149
<212>DNA
<213>人工的
<220>
<223>编码MSP2N4的DNA
<400>112
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ccgtgacgca ggaattctgg gacaacctgg aaaaagaaac cgagggactg  120
cgtcaggaaa tgtccaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  180
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccgctg  240
cgtgcggaac tgcaagaggg ggcacgccaa aaactccatg agctccaaga gaagctcagc  300
ccattaggcg aagaaatgcg cgatcgcgcc cgtgcacatg ttgatgcact ccggactcat  360
ttggcgccgt attcggatga acttcgccag cgtttggccg cacgtctcga ggcgctgaaa  420
gaaaacgggg gtgcccgctt ggctgagtac cacgcgaaag cgacagaaca cctgagcacc  480
ttgagcgaaa aagcgaaacc ggcgctggaa gatctacgcc agggcttatt gcctgttctt  540
gagagcttta aagtcagttt tctgtcagct ctggaagaat atactaaaaa gctgaatacc  600
cagaatccag gtacccccgt gacgcaggaa ttctgggaca acctggaaaa agaaaccgag  660
ggactgcgtc aggaaatgtc caaagattta gaagaggtga aggccaaggt tcagccatat  720
ctcgatgact ttcagaaaaa atggcaggaa gagatggaat tatatcgtca aaaggtggaa  780
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  840
ctcagcccat taggcgaaga aatgcgcgat cgcgcccgtg cacatgttga tgcactccgg  900
actcatttgg cgccgtattc ggatgaactt cgccagcgtt tggccgcacg tctcgaggcg  960
ctgaaagaaa acgggggtgc ccgcttggct gagtaccacg cgaaagcgac agaacacctg  1020
agcaccttga gcgaaaaagc gaaaccggcg ctggaagatc tacgccaggg cttattgcct  1080
gttcttgaga gctttaaagt cagttttctg tcagctctgg aagaatatac taaaaagctg  1140
aatacccag                                                          1149
<210>113
<211>383
<212>PRT
<213>人工的
<220>
<223>MSP2N4
<400>113
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu
65                  70                  75                  80
Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln
                85                  90                  95
Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala
            100                 105                 110
His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu
        115                 120                 125
Arg Gln Arg Leu Ala Ala Arg Leu Glu AlaLeu Lys Glu Asn Gly Gly
    130                 135                 140
Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr
145                 150                 155                 160
Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu
                165                 170                 175
Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu
            180                 185                 190
Glu Tyr Thr Lys Lys Leu Asn Thr Gln Asn Pro Gly Thr Pro Val Thr
        195                 200                 205
Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln
    210                 215                 220
Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr
225                 230                 235                 240
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                245                 250                 255
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            260                 265                 270
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        275                 280                 285
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    290                 295                 300
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
305                 310                 315                 320
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                325                 330                 335
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            340                 345                 350
Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser
        355                 360                 365
Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln
    370                 375                 380
<210>114
<211>1137
<212>DNA
<213>人工的
<220>
<223>编码MSP2N5的DNA
<400>114
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ccgtgacgca ggaattctgg gacaacctgg aaaaagaaac cgagggactg  120
cgtcaggaaa tgtccaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  180
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccatat  240
ctcgatgact ttcagaaaaa atggcaggaa gagatggaat tatatcgtca aaaggtggaa  300
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  360
ctcagcccat taggcgaaga aatgcgcgat cgcgcccgtg cacatgttga tgcactccgg  420
actcatttgg cgccgtattc ggatgaactt cgccagcgtt tggccgcacg tctcgaggcg  480
ctgaaagaaa acgggggtgc ccgcttggct gagtaccacg cgaaagcgac agaacacctg  540
agcaccttga gcgaaaaagc gaaaccggcg ctggaagatc tacgccaggg cttattgaat  600
ccaggtacca aagatttaga agaggtgaag gccaaggttc agccatatct cgatgacttt  660
cagaaaaaat ggcaggaaga gatggaatta tatcgtcaaa aggtggaacc atatctcgat  720
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccgctg  780
cgtgcggaac tgcaagaggg ggcacgccaa aaactccatg agctccaaga gaagctcagc  840
ccattaggcg aagaaatgcg cgatcgcgcc cgtgcacatg ttgatgcact ccggactcat  900
ttggcgccgt attcggatga acttcgccag cgtttggccg cacgtctcga ggcgctgaaa  960
gaaaacgggg gtgcccgctt ggctgagtac cacgcgaaag cgacagaaca cctgagcacc  1020
ttgagcgaaa aagcgaaacc ggcgctggaa gatctacgcc agggcttatt gcccgtgacg  1080
caggaattct gggacaacct ggaaaaagaa accgagggac tgcgtcagga aatgtcc     1137
<210>115
<211>379
<212>PRT
<213>人工的
<220>
<223>MSP2n5
<400>115
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr
65                  70                  75                  80
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                85                  90                  95
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            100                 105                 110
LVs Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        115                 120                 125
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    130                 135                 140
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
145                 150                 155                 160
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                165                 170                 175
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            180                 185                 190
Asp Leu Arg Gln Gly Leu Leu Asn Pro Gly Thr Lys Asp Leu Glu Glu
        195                 200                 205
Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp
    210                 215                 220
Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr Leu Asp
225                 230                 235                 240
Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys
                245                 250                 255
Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys Leu
            260                 265                 270
His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg Asp
        275                 280                 285
Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro Tyr
    290                 295                 300
Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu Lys
305                 310                 315                 320
Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr Glu
                325                 330                 335
His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp Leu
            340                 345                 350
Arg Gln Gly Leu Leu Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu
        355                 360                 365
Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser
    370                 375
<210>116
<211>1143
<212>DNA
<213>人工的
<220>
<223>编码MSP2N6的DNA
<400>116
atgggtcate atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ccgtgacgca ggaattctgg gacaacctgg aaaaagaaac cgagggactg  120
cgtcaggaaa tgtccaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  180
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccatat  240
ctcgatgact ttcagaaaaa atggcaggaa gagatggaat tatatcgtca aaaggtggaa  300
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  360
ctcagcccat taggcgaaga aatgcgcgat cgcgcccgtg cacatgttga tgcactccgg  420
actcatttgg cgccgtattc ggatgaactt cgccagcgtt tggccgcacg tctcgaggcg  480
ctgaaagaaa acgggggtgc ccgcttggct gagtaccacg cgaaagcgac agaacacctg  540
agcaccttga gcgaaaaagc gaaaccggcg ctggaagatc tacgccaggg cttattgtcc  600
aatccaggta cccaaaaaga tttagaagag gtgaaggcca aggttcagcc atatctcgat  660
gactttcaga aaaaatggca ggaagagatg gaattatatc gtcaaaaggt ggaaccatat  720
ctcgatgact ttcagaaaaa atggcaggaa gagatggaat tatatcgtca aaaggtggaa  780
ccgctgcgtg cggaactgca agagggggca cgccaaaaac tccatgagct ccaagagaag  840
ctcagcccat taggcgaaga aatgcgcgat cgcgcccgtg cacatgttga tgcactccgg  900
actcatttgg cgccgtattc ggatgaactt cgccagcgtt tggccgcacg tctcgaggcg  960
ctgaaagaaa acgggggtgc ccgcttggct gagtaccacg cgaaagcgac agaacacctg  1020
agcaccttga gcgaaaaagc gaaaccggcg ctggaagatc tacgccaggg cttattgccc  1080
gtgacgcagg aattctggga caacctggaa aaagaaaccg agggactgcg tcaggaaatg  1140
tcc                                                                1143
<210>117
<211>381
<212>PRT
<213>人工的
<220>
<223>MSP2N6
<400>117
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Val Thr Gln Glu Phe Trp Asp Asn
            20                  25                  30
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu
        35                  40                  45
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    50                  55                  60
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr
65                  70                  75                  80
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                85                  90                  95
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            100                 105                 110
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        115                 120                 125
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    130                 135                 140
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
145                 150                 155                 160
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                165                 170                 175
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            180                 185                 190
Asp Leu Arg Gln Gly Leu Leu Ser Asn Pro Gly Thr Gln Lys Asp Leu
        195                 200                 205
Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys
    210                 215                 220
Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Tyr
225                 230                 235                 240
Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg
                245                 250                 255
Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln
            260                 265                 270
Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met
        275                 280                 285
Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala
    290                 295                 300
Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala
305                 310                 315                 320
Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala
                325                 330                 335
Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu
            340                 345                 350
Asp Leu Arg Gln Gly Leu Leu Pro Val Thr Gln Glu Phe Trp Asp Asn
        355                 360                 365
Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu Met Ser
    370                 375                 380
<210>118
<211>3282
<212>DNA
<213>人工的
<220>
<223>编码MSP2CPR的DNA
<400>118
atgggtcatc atcatcatca tcacattgag ggacgtctga agctgttgga caattgggac  60
tctgttacgt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccagggta ccctgaagct gttggacaat  660
tgggactctg ttacgtctac cttcagtaaa cttcgcgaac aactgggccc cgtgacgcag  720
gaattctggg acaacctgga aaaagaaacc gagggactgc gtcaggaaat gtccaaagat  780
ttagaagagg tgaaggccaa ggttcagcca tatctcgatg actttcagaa aaaatggcag  840
gaagagatgg aattatatcg tcaaaaggtg gaaccgctgc gtgcggaact gcaagagggg  900
gcacgccaaa aactccatga gctccaagag aagctcagcc cattaggcga agaaatgcgc  960
gatcgcgccc gtgcacatgt tgatgcactc cggactcatt tggcgccgta ttcggatgaa  1020
cttcgccagc gtttggccgc acgtctcgag gcgctgaaag aaaacggggg tgcccgcttg  1080
gctgagtacc acgcgaaagc gacagaacac ctgagcacct tgagcgaaaa agcgaaaccg  1140
gcgctggaag atctacgcca gggcttattg cctgttcttg agagctttaa agtcagtttt  1200
ctgtcagctc tggaagaata tactaaaaag ctgaataccc agtcgaccat gggagactct  1260
cacgaagaca ccagtgccac catgcctgag gccgtggctg aagaagtgtc tctattcagc  1320
acgacggaca tggttctgtt ttctctcatc gtgggggtcc tgacctactg gttcatcttt  1380
agaaagaaga aagaagagat accggagttc agcaagatcc aaacaacggc cccacccgtc  1440
aaagagagca gcttcgtgga aaagatgaag aaaacgggaa ggaacattat cgtattctat  1500
ggctcccaga cgggaaccgc tgaggagttt gccaaccggc tgtccaagga tgcccaccgc  1560
tacgggatgc ggggcatgtc cgcagaccct gaagagtatg acttggccga cctgagcagc  1620
ctgcctgaga tcgacaagtc cctggtagtc ttctgcatgg ccacatacgg agagggcgac  1680
cccacggaca atgcgcagga cttctatgac tggctgcagg agactgacgt ggacctcact  1740
ggggtcaagt ttgctgtatt tggtcttggg aacaagacct atgagcactt caatgccatg  1800
ggcaagtatg tggaccagcg gctggagcag cttggcgccc agcgcatctt tgagttgggc  1860
cttggtgatg atgacgggaa cttggaagag gatttcatca cgtggaggga gcagttctgg  1920
ccagctgtgt gcgagttctt tggggtagaa gccactgggg aggagtcgag cattcgccag  1980
tatgagctcg tggtccacga agacatggac gtagccaagg tgtacacggg tgagatgggc  2040
cgtctgaaga gctacgagaa ccagaaaccc cccttcgatg ctaagaatcc attcctggct  2100
gctgtcaccg ccaaccggaa gctgaaccaa ggcactgagc ggcatctaat gcacctggag  2160
ttggacatct cagactccaa gatcaggtat gaatctggag atcacgtggc tgtgtaccca  2220
gccaatgact cagccctggt caaccagatt ggggagatcc tgggagctga cctggatgtc  2280
atcatgtctc taaacaatct cgatgaggag tcaaacaaga agcatccgtt cccctgcccc  2340
gccacctacc gcacggccct cacctactac ctggacatca ctaacccgcc acgcaccaat  2400
gtgctctacg aactggcaca gtacgcctca gagccctcgg agcaggagca cctgcacaag  2460
atggcgtcat cctcaggcga gggcaaggag ctgtacctga gctgggtggt ggaagcccgg  2520
aggcacatcc tagccatcct ccaagactac ccatcactgc ggccacccat cgaccacctg  2580
tgtgagctgc tgccacgcct gcaggcccga tactactcca ttgcctcatc ctccaaggtc  2640
caccccaact ccgtgcacat ctgtgccgtg gccgtggagt acgaagcgaa gtctggccga  2700
gtgaacaagg gggtggccac tagctggctt cgggccaagg aaccagcagg cgagaatggc  2760
ggccgcgccc tggtacccat gttcgtgcgc aaatctcagt tccgcttgcc tttcaagtcc  2820
accacacctg tcatcatggt gggccccggc actgggattg cccctttcat gggcttcatc  2880
caggaacgag cttggcttcg agagcaaggc aaggaggtgg gagagacgct gctatactat  2940
ggctgccggc gctcggatga ggactatctg taccgtgaag agctagcccg cttccacaag  3000
gacggtgccc tcacgcagct taatgtggcc ttttcccggg agcaggccca caaggtctat  3060
gtccagcacc ttctgaagag agacagggaa cacctgtgga agctgatcca cgagggcggt  3120
gcccacatct atgtgtgcgg ggatgctcga aatatggcca aagatgtgca aaacacattc  3180
tatgacattg tggctgagtt cgggcccatg gagcacaccc aggctgtgga ctatgttaag  3240
aagctgatga ccaagggccg ctactcacta gatgtgtgga gc                     3282
<210>119
<211>1094
<212>PRT
<213>人工的
<220>
<223>MSP2CPR
<400>119
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr Leu Lys Leu Leu Asp Asn Trp Asp Ser Val
    210                 215                 220
Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln Leu Gly Pro Val Thr Gln
225                 230                 235                 240
Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr Glu Gly Leu Arg Gln Glu
                245                 250                 255
Met Ser Lys Asp Leu Glu Glu Val Lys Ala Lys Val Gln Pro Tyr Leu
            260                 265                 270
Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu Met Glu Leu Tyr Arg Gln
        275                 280                 285
Lys Val Glu Pro Leu Arg Ala Glu Leu Gln Glu Gly Ala Arg Gln Lys
    290                 295                 300
Leu His Glu Leu Gln Glu Lys Leu Ser Pro Leu Gly Glu Glu Met Arg
305                 310                 315                 320
Asp Arg Ala Arg Ala His Val Asp Ala Leu Arg Thr His Leu Ala Pro
                325                 330                 335
Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala Ala Arg Leu Glu Ala Leu
            340                 345                 350
Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu Tyr His Ala Lys Ala Thr
        355                 360                 365
Glu His Leu Ser Thr Leu Ser Glu Lys Ala Lys Pro Ala Leu Glu Asp
    370                 375                 380
Leu Arg Gln Gly Leu Leu Pro Val Leu Glu Ser Phe Lys Val Ser Phe
385                 390                 395                 400
Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys Leu Asn Thr Gln Ser Thr
                405                 410                 415
Met Gly Asp Ser His Glu Asp Thr Ser Ala Thr Met Pro Glu Ala Val
            420                 425                 430
Ala Glu Glu Val Ser Leu Phe Ser Thr Thr Asp Met Val Leu Phe Ser
        435                 440                 445
Leu Ile Val Gly Val Leu Thr Tyr Trp Phe Ile Phe Arg Lys Lys Lys
    450                 455                 460
Glu Glu Ile Pro Glu Phe Ser Lys Ile Gln Thr Thr Ala Pro Pro Val
465                 470                 475                 480
Lys Glu Ser Ser Phe Val Glu Lys Met Lys Lys Thr Gly Arg Asn Ile
                485                 490                 495
Ile Val Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu Glu Phe Ala Asn
            500                 505                 510
Arg Leu Ser Lys Asp Ala His Arg Tyr Gly Met Arg Gly Met Ser Ala
        515                 520                 525
Asp Pro Glu Glu Tyr Asp Leu Ala Asp Leu Ser Ser Leu Pro Glu Ile
    530                 535                 540
Asp Lys Ser Leu Val Val Phe Cys Met Ala Thr Tyr Gly Glu Gly Asp
545                 550                 555                 560
Pro Thr Asp Asn Ala Gln Asp Phe Tyr Asp Trp Leu Gln Glu Thr Asp
                565                 570                 575
Val Asp Leu Thr Gly Val Lys Phe Ala Val Phe Gly Leu Gly Asn Lys
            580                 585                 590
Thr Tyr Glu His Phe Asn Ala Met Gly Lys Tyr Val Asp Gln Arg Leu
        595                 600                 605
Glu Gln Leu Gly Ala Gln Arg Ile Phe Glu Leu Gly Leu Gly Asp Asp
    610                 615                 620
Asp Gly Asn Leu Glu Glu Asp Phe Ile Thr Trp Arg Glu Gln Phe Trp
625                 630                 635                 640
Pro Ala Val Cys Glu Phe Phe Gly Val Glu Ala Thr Gly Glu Glu Ser
                645                 650                 655
Ser Ile Arg Gln Tyr Glu Leu Val Val His Glu Asp Met Asp Val Ala
            660                 665                 670
Lys Val Tyr Thr Gly Glu Met Gly Arg Leu Lys Ser Tyr Glu Asn Gln
        675                 680                 685
Lys Pro Pro Phe Asp Ala Lys Asn Pro Phe Leu Ala Ala Val Thr Ala
    690                 695                 700
Asn Arg Lys Leu Asn Gln Gly Thr Glu Arg His Leu Met His Leu Glu
705                 710                 715                 720
Leu Asp Ile Ser Asp Ser Lys Ile Arg Tyr Glu Ser Gly Asp His Val
                725                 730                 735
Ala Val Tyr Pro Ala Asn Asp Ser Ala Leu Val Asn Gln Ile Gly Glu
            740                 745                 750
Ile Leu Gly Ala Asp Leu Asp Val Ile Met Ser Leu Asn Asn Leu Asp
        755                 760                 765
Glu Glu Ser Asn Lys Lys His Pro Phe Pro Cys Pro Thr Thr Tyr Arg
    770                 775                 780
Thr Ala Leu Thr Tyr Tyr Leu Asp Ile Thr Asn Pro Pro Arg Thr Asn
785                 790                 795                 800
Val Leu Tyr Glu Leu Ala Gln Tyr Ala Ser Glu Pro Ser Glu Gln Glu
                805                 810                 815
His Leu His Lys Met Ala Ser Ser Ser Gly Glu Gly Lys Glu Leu Tyr
            820                 825                 830
Leu Ser Trp Val Val Glu Ala Arg Arg His Ile Leu Ala Ile Leu Gln
        835                 840                 845
Asp Tyr Pro Ser Leu Arg Pro Pro Ile Asp His Leu Cys Glu Leu Leu
    850                 855                 860
Pro Arg Leu Gln Ala Arg Tyr Tyr Ser Ile Ala Ser Ser Ser Lys Val
865                 870                 875                 880
His Pro Asn Ser Val His Ile Cys Ala Val Ala Val Glu Tyr Glu Ala
                885                 890                 895
Lys Ser Gly Arg Val Asn Lys Gly Val Ala Thr Ser Trp Leu Arg Ala
            900                 905                 910
Lys Glu Pro Ala Gly Glu Asn Gly Gly Arg Ala Leu Val Pro Met Phe
        915                 920                 925
Val Arg Lys Ser Gln Phe Arg Leu Pro Phe Lys Ser Thr Thr Pro Val
    930                 935                 940
Ile Met Val Gly Pro Gly Thr Gly Ile Ala Pro Phe Met Gly Phe Ile
945                 950                 955                 960
Gln Glu Arg Ala Trp Leu Arg Glu Gln Gly Lys Glu Val Gly Glu Thr
                965                 970                 975
Leu Leu Tyr Tyr Gly Cys Arg Arg Ser Asp Glu Asp Tyr Leu Tyr Arg
            980                 985                 990
Glu Glu Leu Ala Arg Phe His Lys  Asp Gly Ala Leu Thr  Gln Leu Asn
        995                 1000                 1005
Val Ala  Phe Ser Arg Glu Gln  Ala His Lys Val Tyr  Val Gln His
    1010                 1015                 1020
Leu Leu  Lys Arg Asp Arg Glu  His Leu Trp Lys Leu  Ile His Glu
    1025                 1030                 1035
Gly Gly  Ala His Ile Tyr Val  Cys Gly Asp Ala Arg  Asn Met Ala
    1040                 1045                 1050
Lys Asp  Val Gln Asn Thr Phe  Tyr Asp Ile Val Ala  Glu Phe Gly
    1055                 1060                 1065
Pro Met  Glu His Thr Gln Ala  Val Asp Tyr Val Lys  Lys Leu Met
    1070                 1075                 1080
Thr Lys  Gly Arg Tyr Ser Leu  Asp Val Trp Ser
    1085                 1090
<210>120
<211>72
<212>DNA
<213>人工的
<220>
<223>编码His-TEV2肽的DNA
<400>120
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggat cc                                                      72
<210>121
<211>24
<212>PRT
<213>人工的
<220>
<223>His-TEV2肽序列
<400>121
Met Gly His His His His His His His Asp Tyr Asp Ile Pro Thr Thr
1               5                   10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser
            20
<210>122
<211>714
<212>DNA
<213>人工的
<220>
<223>编码EGFP的DNA
<400>122
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc  60
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc  120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc  180
gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag  240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc  300
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg  360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag  420
ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc  480
atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac  540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac  600
ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg  660
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caag        714
<210>123
<211>238
<212>PRT
<213>人工的
<220>
<223>EGFP序列
<400>123
Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1               5                   10                  15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
            20                  25                  30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
        35                  40                  45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
    50                  55                  60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln
65                  70                  75                  80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
                85                  90                  95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
            100                 105                 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
        115                 120                 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
    130                 135                 140
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
145                 150                 155                 160
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
                165                 170                 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
            180                 185                 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
        195                 200                 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
    210                 215                 220
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225                 230                 235
<210>124
<211>714
<212>DNA
<213>人工的
<220>
<223>编码EYFP的DNA
<400>124
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc  60
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc  120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc  180
gtgaccacct tcggctacgg cctgcagtgc ttcgcccgct accccgacca catgaagcag  240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc  300
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg  360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag  420
ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc  480
atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac  540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac  600
ctgagctacc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg  660
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caag        714
<210>125
<211>238
<212>PRT
<213>人工的
<220>
<223>EYFP序列
<400>125
Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1               5                   10                  15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
            20                  25                  30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
        35                  40                  45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe
    50                  55                  60
Gly Tyr Gly Leu Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln
65                  70                  75                  80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
                85                  90                  95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
            100                 105                 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
        115                 120                 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
    130                 135                 140
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
145                 150                 155                 160
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
                165                 170                 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
            180                 185                 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Tyr Gln Ser Ala Leu Ser
        195                 200                 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
    210                 215                 220
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225                 230                 235
<210>126
<211>717
<212>DNA
<213>人工的
<220>
<223>编码ECFP的DNA
<400>126
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc  60
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc  120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc  180
gtgaccaccc tgacctgggg cgtgcagtgc ttcagccgct accccgacca catgaagcag  240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc  300
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg  360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag  420
ctggagtaca actacatcag ccacaacgtc tatatcaccg ccgacaagca gaagaacggc  480
atcaaggcca acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac  540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac  600
ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg  660
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaa     717
<210>127
<211>238
<212>PRT
<213>人工的
<220>
<223>ECFP序列
<400>127
Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1               5                   10                  15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
            20                  25                  30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
        35                  40                  45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
    50                  55                  60
Thr Trp Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln
65                  70                  75                  80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
                85                  90                  95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
            100                 105                 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
        115                 120                 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
    130                 135                 140
Tyr Ile Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly
145                 150                 155                 160
Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
                165                 170                 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
            180                 185                 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
        195                 200                 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
    210                 215                 220
Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225                 230                 235
<210>128
<211>642
<212>DNA
<213>人工的
<220>
<223>编码MSP1T2-GT的DNA
<400>128
atgggtcatc atcatcatca tcatcacgat tatgatattc ctactactga gaatttgtat  60
tttcagggtt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccagggta cc                     642
<210>129
<211>214
<212>PRT
<213>人工的
<220>
<223>MSP1T2-GT
<400>129
Met Gly His His His His Hi s His His Asp Tyr Asp Ile Pro Thr Thr
1               5                    10                  15
Glu Asn Leu Tyr Phe Gln Gly Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
           100                  105                  110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln Gly Thr
    210
<210>130
<211>636
<212>DNA
<213>人工的
<220>
<223>编码MSP1RC12’的DNA
<400>130
atgggtcatc atcatcatca tcacattgag ggatgtctga agctgttgga caattgggac  60
tctgttacgt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccag                            636
<210>131
<211>212
<212>PRT
<213>人工的
<220>
<223>MSP1RC12’
<400>131
Met G1y His His His His His His Ile Glu Gly Cys Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln
    210
<210>132
<211>636
<212>DNA
<213>人工的
<220>
<223>编码MSP1K9EC的DNA
<400>132
atgggtcatc atcatcatca tcacattgag ggacgtctga agctgttgga caattgggac  60
tctgttacgt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caatgtctcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcga aagcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccag                            636
<210>133
<211>212
<212>PRT
<213>人工的
<220>
<223>MSP1K9EC
<400>133
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Cys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Lys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln
    210
<210>134
<211>636
<212>DNA
<213>人工的
<220>
<223>编码MSP1D152C的DNA
<400>134
atgggtcatc atcatcatca tcacattgag ggacgtctga agctgttgga caattgggac  60
tctgttacgt ctaccttcag taaacttcgc gaacaactgg gccccgtgac gcaggaattc  120
tgggacaacc tggaaaaaga aaccgaggga ctgcgtcagg aaatgtccaa agatttagaa  180
gaggtgaagg ccaaggttca gccatatctc gatgactttc agaaaaaatg gcaggaagag  240
atggaattat atcgtcaaaa ggtggaaccg ctgcgtgcgg aactgcaaga gggggcacgc  300
caaaaactcc atgagctcca agagaagctc agcccattag gcgaagaaat gcgcgatcgc  360
gcccgtgcac atgttgatgc actccggact catttggcgc cgtattcgga tgaacttcgc  420
cagcgtttgg ccgcacgtct cgaggcgctg aaagaaaacg ggggtgcccg cttggctgag  480
taccacgcat gcgcgacaga acacctgagc accttgagcg aaaaagcgaa accggcgctg  540
gaagatctac gccagggctt attgcctgtt cttgagagct ttaaagtcag ttttctgtca  600
gctctggaag aatatactaa aaagctgaat acccag                            636
<210>135
<211>212
<212>PRT
<213>人工的
<220>
<223>MSP1K152C
<400>135
Met Gly His His His His His His Ile Glu Gly Arg Leu Lys Leu Leu
1               5                   10                  15
Asp Asn Trp Asp Ser Val Thr Ser Thr Phe Ser Lys Leu Arg Glu Gln
            20                  25                  30
Leu Gly Pro Val Thr Gln Glu Phe Trp Asp Asn Leu Glu Lys Glu Thr
        35                  40                  45
Glu Gly Leu Arg Gln Glu Met Ser Lys Asp Leu Glu Glu Val Lys Ala
    50                  55                  60
Lys Val Gln Pro Tyr Leu Asp Asp Phe Gln Lys Lys Trp Gln Glu Glu
65                  70                  75                  80
Met Glu Leu Tyr Arg Gln Lys Val Glu Pro Leu Arg Ala Glu Leu Gln
                85                  90                  95
Glu Gly Ala Arg Gln Lys Leu His Glu Leu Gln Glu Lys Leu Ser Pro
            100                 105                 110
Leu Gly Glu Glu Met Arg Asp Arg Ala Arg Ala His Val Asp Ala Leu
        115                 120                 125
Arg Thr His Leu Ala Pro Tyr Ser Asp Glu Leu Arg Gln Arg Leu Ala
    130                 135                 140
Ala Arg Leu Glu Ala Leu Lys Glu Asn Gly Gly Ala Arg Leu Ala Glu
145                 150                 155                 160
Tyr His Ala Cys Ala Thr Glu His Leu Ser Thr Leu Ser Glu Lys Ala
                165                 170                 175
Lys Pro Ala Leu Glu Asp Leu Arg Gln Gly Leu Leu Pro Val Leu Glu
            180                 185                 190
Ser Phe Lys Val Ser Phe Leu Ser Ala Leu Glu Glu Tyr Thr Lys Lys
        195                 200                 205
Leu Asn Thr Gln
    210
<210>136
<211>22
<212>PRT
<213>人工的
<220>
<223>螺旋2S的肽序列
<400>136
Pro Val Thr Gln Glu Phe Trp Asp Ash Leu Glu Lys Glu Thr Glu Gly
1               5                   10                  15
Leu Arg Gln Glu Met Ser
            20
                                                               66
101
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈