多肽在叶绿体中的表达以及用于表达多肽的组合物和方法专利检索-光遗传学生物工程生物工程专利检索查询-专利查询网

多肽在叶绿体中的表达以及用于表达多肽的组合物和方法

阅读：64发布：2020-10-12

专利汇可以提供多肽在叶绿体中的表达以及用于表达多肽的组合物和方法专利检索，专利查询，专利分析的服务。并且提供了在植物叶绿体中表达一种或者多种多肽的方法，包括表达能够在植物叶绿体中特异地联合以形成功能性的蛋白复合物的多肽的方法。还提供了含有(或者编码)第一核糖体结合序列(RBS)和与之有效连接的第二RBS的分离的多聚核苷酸，这样所述的第一RBS指导多肽在原核生物中的翻译，第二RBS指导所述多肽在叶绿体中的翻译，还提供了含有这样的多聚核苷酸的载体，尤其是这样的叶绿体载体和叶绿体/原核生物穿梭载体。还提供了合成的多聚核苷酸，其具有叶绿体密码子偏好性。提供了经遗传修饰而含有上述的多聚核苷酸或者载体的植物细胞，以及含有或者源于这样的遗传修饰的细胞的转基因植物。还提供了由上述合成的多聚核苷酸编码的多肽。，下面是多肽在叶绿体中的表达以及用于表达多肽的组合物和方法专利的具体信息内容。

权利要求

1.一种在质体中生产多肽的方法，所述方法包括向质体导入第一重组核酸分子，
其中第一重组核酸分子包含
第一多聚核苷酸，其编码至少一种多肽，
与之有效连接的第二多聚核苷酸，其包括编码第一核糖体结合序列(RBS)的第一核苷酸序列，以及与之有效连接的编码第二RBS 的第二核苷酸序列，
其中第一RBS可以指导多肽在原核生物中的翻译，第二RBS 可以指导多肽在质体中的翻译，
在允许所述的至少一种多肽表达的条件下，从而在质体中生产所述多肽。
2.权利要求1的方法，其中第一多聚核苷酸编码一种第一多肽和至少一种第二多肽。
3.权利要求2的方法，其中所述的第一多肽和至少第二多肽构成融合蛋白。
4.权利要求3的方法，其中融合蛋白包括单链抗体。
5.权利要求4的方法，其中第一多聚核苷酸包括SEQ ID NO：13或者编码SEQ ID NO：14的核苷酸序列。
6.权利要求1的方法，其中质体是叶绿体。
7.权利要求6的方法，其中第一多聚核苷酸的密码子被倾向于表现出叶绿体的密码子使用。
8.权利要求7的方法，其中第一多聚核苷酸编码报告蛋白或者其突变体或变异体。
9.权利要求8的方法，其中报告蛋白是一种绿色荧光蛋白。
10.权利要求9的方法，其中第一多聚核苷酸包括SEQ ID NO：15，编码 SEQ ID NO：1的核苷酸序列或者编码SEQ ID NO：2的核苷酸序列。
11.权利要求7的方法，其中第一多聚核苷酸序列编码一种第一多肽和至少一种第二多肽。
12.权利要求11的方法，其中所述第一多肽和至少第二多肽构成融合蛋白。
13.权利要求11的方法，其起所述第一多肽和第二多肽包括蛋白复合物的亚基。
14.权利要求13的方法，其中蛋白复合物是异源二聚体。
15.权利要求13的方法，其中蛋白复合物包括报告蛋白。
16.权利要求15的方法，其中报告蛋白包括荧光素酶或者其突变体或变异体。
17.权利要求16的方法，其中荧光素酶包括细菌luxAB基因的产物。
18.权利要求17的方法，其中第一多聚核苷酸包括SEQ ID NO：45或者编码SEQ ID NO：46的核苷酸序列。
19.权利要求11的方法，其中第一多肽包括免疫球蛋白的重链或者其可变区，第二多肽包括免疫球蛋白的轻链或者其可变区。
20.权利要求19的方法，其中第一多肽和第二多肽构成融合蛋白，由此可以生产出单链抗体。
21.权利要求20的方法，其中第一多聚核苷酸包括SEQ ID NO：15；编码SEQ ID NO：16的核苷酸序列；SEQ ID NO：42；编码SEQ ID NO：43 的核苷酸序列；SEQ ID NO：47；或者编码SEQ ID NO：48的核苷酸序列。
22.权利要求1的方法，进一步包括向质体中导入至少一种第二重组核酸分子。
23.权利要求22的方法，其中质体是叶绿体。
24.权利要求23的方法，其中第二重组核酸分子包括第一多聚核苷酸和与之有效连接的第二多聚核苷酸，第一多聚核苷酸编码至少一种多肽，第二多聚核苷酸包括有效连接的编码第一核糖体结合序列(RBS)的第一核苷酸序列和编码第二RBS的第二核苷酸序列，其中第一RBS 可以指导所述多肽在原核生物中的翻译，第二RBS可以指导所述多肽在叶绿体中的翻译。
25.权利要求24的方法，其中第一重组核酸分子和第二重组核酸分子在叶绿体中共表达。
26.权利要求1的方法，其中第一重组核酸分子被包含在载体中。
27.权利要求26的方法，其中质体是叶绿体。
28.权利要求27的方法，其中载体是一种叶绿体载体，这种载体含有叶绿体基因组脱氧核糖核酸(DNA)的一段核苷酸序列，它可以与叶绿体基因组DNA发生同源重组。
29.权利要求28的方法，其中载体进一步包括原核生物的复制原点。
30.权利要求1的方法，进一步包括从质体中分离出多肽。
31.根据权利要求30的方法获得的分离的多肽。
32.权利要求31的分离的多肽，包括SEQ ID NO：2，SEQ ID NO：16， SEQ ID NO：43，SEQ ID NO：46，或者SEQ ID NO：48。
33.一种分离出的核糖核苷酸序列，包括第一核糖体结合序列(RBS) 和与之有效连接的第二RBS，其中第一RBS和第二RBS被大约5到 25个核苷酸分隔开来。
34.权利要求33的这种核糖核苷酸序列，其中第一RBS和第二RBS被大约10到20个核苷酸分隔开来。
35.权利要求33的这种核糖核苷酸序列，其中第一RBS和第二RBS被大约15个核苷酸分隔开来。
36.权利要求33的这种核糖核苷酸序列，其中第一RBS和第二RBS中的每一个都是独立地由3到9个核苷酸组成。
37.权利要求33的这种核糖核苷酸序列，其中第一RBS和第二RBS中的每一个都是独立地由4到7个核苷酸组成。
38.权利要求33的核糖核苷酸序列，其中第一RBS或者第二RBS或者二者都含有GGAG。
39.权利要求33的核糖核苷酸序列，其中第二RBS进一步包括一种叶绿体基因的5’端非翻译区(5’UTR)。
40.权利要求39的核糖核苷酸序列，其中5’UTR由SEQ ID NO：4到8 中的任意一个所列的核苷酸序列编码。
41.权利要求39的核糖核苷酸序列，其中叶绿体基因编码可溶性蛋白。
42.权利要求33的核糖核苷酸序列，其与起始AUG密码子有效连接。
43.权利要求42的核糖核苷酸序列，其中起始AUG密码子进一步包含 Kozak序列。
44.权利要求43的核糖核苷酸序列，其中进一步包含Kozak序列的起始AUG密码子是ACCAUGG。
45.权利要求33的核糖核苷酸序列，它与编码多肽的多聚核苷酸有效连接。
46.权利要求45的核糖核苷酸序列，其中多聚核苷酸包括起始AUG密码子。
47.权利要求33的核糖核苷酸序列，其由大约11到50个核糖核苷酸组成。
48.权利要求33的核糖核苷酸序列，其由大约15到40个核糖核苷酸组成。
49.权利要求33的核糖核苷酸序列，其由大约20到30个核糖核苷酸组成。
50.权利要求33的核糖核苷酸，进一步包括有效连接的编码一种多肽的多聚核苷酸，由此第一RBS可以指导所述多肽在原核生物中的翻译，第二RBS可以指导所述多肽在叶绿体中的翻译。
51.编码权利要求33中的核糖核苷酸序列的多聚核苷酸。
52.权利要求51的多聚核苷酸，其包括有效连接到编码第一RBS和第二RBS的核苷酸序列上的起始ATG密码子。
53.权利要求51的多聚核苷酸，其包括克隆位点，所述位点的定位使得可表达的多聚核苷酸与第一RBS和第二RBS可以有效连接。
54.权利要求53的多聚核苷酸，其中克隆位点包括至少一个限制性内切酶识别位点，或者至少一个重组酶识别位点，或者二者的组合。
55.权利要求51的多聚核苷酸，其两侧分别有第一克隆位点和第二克隆位点。
56.权利要求55的多聚核苷酸，其中第一克隆位点和第二克隆位点是不同的。
57.权利要求51的多聚核苷酸，其与可表达的多聚核苷酸有效连接。
58.权利要求57的多聚核苷酸，其中可表达的多聚核苷酸编码至少第一多肽。
59.权利要求58的多聚核苷酸，其中可表达的多聚核苷酸编码第一多肽和至少一种第二多肽。
60.权利要求59的多聚核苷酸，其中可表达的多聚核苷酸编码第一多肽和一种第二多肽。
61.权利要求60的多聚核苷酸，其中第一多肽和第二多肽是不同的。
62.权利要求60的多聚核苷酸，其中第一多肽和第二多肽构成融合蛋白。
63.权利要求62的多聚核苷酸，其中可表达的多聚核苷酸包括在SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：42，SEQ ID NO：45，或者SEQ ID NO：47中所列的核苷酸序列。
64.权利要求60的多聚核苷酸，进一步包括编码内在核糖体进入位点的核苷酸序列，它有效连接于第一多肽的编码序列和第二多肽的编码序列之间。
65.权利要求51的多聚核苷酸，其是双链分子。
66.权利要求65的多聚核苷酸，它包括编码第二RBS的核苷酸序列，编码第一RBS的核苷酸序列，和起始ATG密码子，这些序列以5’到3’ 的方向有效连接；或者是与所述多聚核苷酸互补的核苷酸序列。
67.权利要求66的多聚核苷酸，进一步包括定位在起始ATG密码子的 3’端的至少一个克隆位点。
68.权利要求65的多聚核苷酸，它包括编码第二RBS的核苷酸序列，编码第一RBS的核苷酸序列，和定位在编码第一RBS的核苷酸序列3’ 端大约3到10个核苷酸位置的至少一个克隆位点，这些序列以5’到3’ 的方向连接；或者与所述多聚核苷酸互补的核苷酸序列。
69.权利要求65的多聚核苷酸，其在每一侧有至少一个克隆位点。
70.载体，包含权利要求51的多聚核苷酸和叶绿体基因组脱氧核糖核酸 (DNA)的一段核苷酸序列，其中所述核苷酸序列可以与叶绿体基因组DNA之间发生同源重组。
71.权利要求70的载体，进一步包括克隆位点，所述位点的定位允许至少一种异源多聚核苷酸与第一RBS和第二RBS有效连接。
72.权利要求70的载体，进一步包括原核生物的复制原点。
73.权利要求72的载体，其中复制原点是大肠杆菌的复制原点。
74.权利要求70的载体，其中叶绿体基因组DNA的核苷酸序列包含第一末端和第二末端。
75.权利要求74的载体，其中第一末端或第二末端或者二者都包括至少一个克隆位点，或者其剪切产物。
76.权利要求70的载体，其是环化的分子。
77.权利要求70的载体，进一步包括与第一RBS和第二RBS有效连接的起始ATG密码子。
78.权利要求77的载体，进一步包括克隆位点，其定位允许至少一种异源多聚核苷酸与ATG密码子有效连接。
79.权利要求72的载体，进一步包括与第一RBS和第二RBS有效连接的可表达的多聚核苷酸。
80.权利要求79的载体，其中可表达的多聚核苷酸包括SEQ ID NO：1，编码SEQ ID NO：2的核苷酸序列，SEQ ID NO：45，编码SEQ ID NO：46 的核苷酸序列，或者其组合。
81.细胞，含有权利要求51中的多聚核苷酸。
82.权利要求81的细胞，其是一种植物细胞。
83.权利要求82的植物细胞，其中所述多聚核苷酸是在叶绿体中。
84.权利要求83的植物细胞，其中所述多聚核苷酸与可表达的多聚核苷酸有效连接。
85.权利要求83的植物细胞，其中可表达的多聚核苷酸编码至少第一多肽。
86.权利要求85的植物细胞，其中可表达的多聚核苷酸编码第一多肽和至少一种第二多肽。
87.权利要求85的植物细胞，其中可表达的多聚核苷酸编码第一多肽和一种第二多肽。
88.权利要求87的植物细胞，其中第一多肽和第二多肽是不同的。
89.权利要求87的植物细胞，其中第一多肽和第二多肽构成融合蛋白。
90.权利要求84的植物细胞，其中可表达的多聚核苷酸包括SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：43，SEQ ID NO：45，SEQ ID NO：47 或者其组合所表示的核苷酸序列。
91.转基因植物，包含权利要求83中的植物细胞。
92.由权利要求81的转基因植物获得的植物细胞或者组织。
93.权利要求92的转基因植物的一个插接部分。
94.权利要求92的转基因植物产生的种子。
95.由权利要求91的转基因植物，或者由来自于所述转基因植物的植物细胞或者植物组织制备出的cDNA或者叶绿体基因组DNA文库。
96.权利要求91的转基因植物，其中所述植物是属于藻类。
97.权利要求91的转基因植物，其中所述植物是被子植物。
98.权利要求97的转基因植物，其中所述被子植物是谷类植物，豆类植物，含油种子植物，或者硬木树。
99.权利要求91的转基因植物，其中所述植物是观赏类植物。
100.组合物，包括从权利要求91的转基因植物中获得的植物材料。
101.权利要求100的组合物，其中叶绿体中的多聚核苷酸与可表达的多聚核苷酸有效连接。
102.权利要求101的组合物，其中可表达的多聚核苷酸被倾向于叶绿体的密码子使用。
103.权利要求101的组合物，其中可表达的多聚核苷酸编码抗体，或者其抗原结合片断。
104.权利要求103的组合物，其是以一种适于施用给个体的形式存在。
105.权利要求104的组合物，其中所述个体是哺乳动物。
106.权利要求104的组合物，其中所述个体是人。
107.叶绿体/原核生物穿梭载体，
叶绿体基因组DNA的一段核苷酸序列，它可以与叶绿体基因组 DNA发生同源重组；
原核生物原点；和
与第二RBS有效连接的第一核糖体结合序列(RBS)，其中第一 RBS可以指导有效连接的可表达的多聚核苷酸在叶绿体中的翻译，第二RBS可以指导有效连接的可表达的多聚核苷酸在原核生物中的翻译。
108.权利要求107的穿梭载体，进一步包含克隆位点，其中所述克隆位点的定位使得异源多聚核苷酸可以插入到载体中，并与第一RBS 和第二RBS有效连接。
109.权利要求107的穿梭载体，进一步包含有效连接的可表达的多聚核苷酸。
110.权利要求109的穿梭载体，其中可表达的多聚核苷酸包含具有叶绿体密码子偏向的多聚核苷酸。
111.编码一种蛋白或者其突变体或变异体的分离出的多聚核苷酸，其中所述多聚核苷酸的密码子被倾向于表现出叶绿体的密码子使用。
112.权利要求111的多聚核苷酸，它包括脱氧核糖核苷酸序列。
113.权利要求111的多聚核苷酸，其中所述密码子被倾向于在第三个核苷酸位置含有腺嘌呤或者胸腺嘧啶。
114.权利要求111的多聚核苷酸，其两侧分别有第一克隆位点和第二克隆位点。
115.权利要求111的多聚核苷酸，其中所述蛋白包括融合蛋白。
116.权利要求111的多聚核苷酸，其中所述蛋白是报告蛋白。
117.权利要求116的多聚核苷酸，其中报告蛋白是绿色荧光蛋白或者荧光素酶。
118.权利要求117的多聚核苷酸，包括SEQ ID NO：1，编码SEQ ID NO：2的核苷酸序列，SEQ ID NO：45，或者编码SEQ ID NO：46的核苷酸序列。
119.权利要求111的多聚核苷酸，其中所述蛋白包括抗体或者抗体的抗原结合片断。
120.权利要求119的多聚核苷酸，包括SEQ ID NO：15，编码SEQ ID NO：16的核苷酸序列，SEQ ID NO：42，编码SEQ ID NO：43的核苷酸序列，SEQ ID NO：47，编码SEQ ID NO：48的核苷酸序列。
121.权利要求111的多聚核苷酸，其与编码第一核糖体结合序列 (RBS)和第二RBS的多聚核苷酸有效连接，其中第一RBS和第二 RBS被大约5到25个核苷酸分隔开，其中第一RBS指导荧光蛋白在原核生物中的翻译，第二RBS指导荧光蛋白在叶绿体中的翻译。
122.由权利要求111的多聚核苷酸编码的多肽。
123.重组核酸分子，包括
编码至少一种多肽的第一多聚核苷酸，其中第一多聚核苷酸的密码子被倾向于表现出叶绿体的密码子使用；和
第二多聚核苷酸，其包含编码第一核糖体结合序列(RBS)的核苷酸序列和有效连接的编码第二RBS的核苷酸序列，其中第一RBS 可以指导所述多肽在原核生物中的翻译，第二RBS可以指导所述多肽在叶绿体中的翻译。
124.权利要求123的重组核酸分子，其中第一多聚核苷酸包含编码第一多肽的第一核苷酸序列，该序列接着有与之有效连接的编码第二多肽的第二核苷酸序列。
125.权利要求124的重组核酸分子，其中编码内在核糖体进入位点的核苷酸序列有效连接到编码第二多肽的第二核苷酸序列上。
126.权利要求123的重组核酸分子，进一步包括与第一多聚核苷酸和第二多聚核苷酸有效连接的第三多聚核苷酸。
127.权利要求126的重组核酸分子，其中第三多聚核苷酸编码至少一种多肽。
128.一种制备叶绿体/原核生物穿梭表达载体的方法，所述方法包括向足以与叶绿体基因组DNA发生同源重组的一段叶绿体基因组脱氧核糖核酸(DNA)的核苷酸序列导入
包含有原核生物复制原点的核苷酸序列，
编码第一核糖体结合序列(RBS)的核苷酸序列，和编码第二RBS 的核苷酸序列，
其中第一RBS和第二RBS被大约5到25个核苷酸分隔开，以及
克隆位点，其中所述克隆位点的定位允许编码多肽的多聚核苷酸有效连接到第一RBS和第二RBS上，由此第一RBS可以指导多肽在原核生物中的翻译，第二RBS可以指导多肽在叶绿体中的翻译。
129.通过权利要求128的方法制备出来的叶绿体/原核生物穿梭表达载体。
130.一种制备叶绿体/原核生物穿梭表达载体的方法，所述方法包括对足以与叶绿体基因组DNA发生同源重组的一段叶绿体基因组脱氧核糖核酸(DNA)的核苷酸序列进行遗传学修饰，以使之含有
原核生物复制原点，
编码第一核糖体结合序列(RBS)的核苷酸序列，和编码第二RBS 的核苷酸序列，第一RBS和第二RBS被大约5到25个核苷酸分隔开，以及
克隆位点，其中所述克隆位点的定位允许编码多肽的多聚核苷酸有效连接到第一RBS和第二RBS上，由此第一RBS可以指导多肽在原核生物中的翻译，第二RBS可以指导多肽在叶绿体中的翻译。
131.通过权利要求130的方法制备出来的叶绿体/原核生物穿梭表达载体。
132.重组多聚核苷酸，包括编码叶绿体核糖体结合序列(RBS)的第一核苷酸序列，以及与之有效连接的编码多肽的第二核苷酸序列，其中第一核苷酸序列与第二核苷酸序列是相对异源的。
133.权利要求132的重组多聚核苷酸，其中叶绿体RBS定位在起始 ATG密码子5’端20到40个核苷酸的位置，起始密码子与编码多肽的核苷酸序列有效连接。
134.权利要求132的重组多聚核苷酸，其中第一核苷酸序列包括定位在RBS的3’端大约20到40个核苷酸位置的ATG密码子。
135.载体，其包含编码定位在克隆位点5’端大约20到40个核苷酸位置的核糖体结合序列(RBS)的核苷酸序列。
136.权利要求135的载体，其中克隆位点包括至少一个限制性内切酶识别位点或者至少一个重组酶识别位点，或者其组合。
137.权利要求135的载体，其中克隆位点包括多克隆位点，所述多克隆位点由多个限制性内切酶识别位点或者多个重组酶识别位点组成，或者由至少一个限制性内切酶识别位点和至少一个重组酶识别位点的组合组成。
138.权利要求134的载体，进一步包括起始ATG密码子或者其一部分，其位于克隆位点的5’端并与克隆位点相邻。
139.权利要求135的载体，进一步包括定位在克隆位点3’端的叶绿体基因3’端非翻译区。
140.一种在质体中生产多肽的方法，包括向质体中导入至少第一重组核酸分子，
所述第一重组核酸分子包括编码至少一个核糖体结合序列 (RBS)的第一核苷酸序列，以及与之有效连接的编码至少一种多肽的至少一种异源多聚核苷酸，
其中所述RBS指导所述多肽在质体中的翻译，在允许所述的至少一种多肽表达的条件下，由此在质体中生产多肽。
141.权利要求140的方法，其中质体是叶绿体。
142.权利要求141的方法，其中第一多聚核苷酸的密码子被倾向于表现出叶绿体的密码子使用。
143.权利要求140的方法，其中第一多聚核苷酸编码抗体，或者抗体的亚基。
144.权利要求143的方法，其中抗体特异性地结合破伤风毒素或者单纯疱疹病毒。
145.权利要求140的方法，其中第一多聚核苷酸编码第一多肽，以及可以选择的第二多肽。
146.权利要求145的方法，其中第一多聚核苷酸被倾向于叶绿体的密码子使用。
147.权利要求146的方法，其中第一多肽包括免疫球蛋白重链或者其可变区，第二多肽包括免疫球蛋白轻链或者其可变区。
148.权利要求147的方法，其中抗体包括在SEQ ID NO：16，SEQ ID NO：43，或者SEQ ID NO：48中所列的氨基酸序列。
149.权利要求147的方法，其中第一多聚核苷酸包括在SEQ ID NO：15，SEQ ID NO：42，或者SEQ ID NO：47中所列的核苷酸序列。
150.权利要求146的方法，其中异源多聚核苷酸编码报告蛋白。
151.权利要求150的方法，其中报告蛋白包括绿色荧光蛋白或者荧光素酶。
152.权利要求151的方法，其中异源多聚核苷酸包括SEQ ID NO：1，编码SEQ ID NO：2的核苷酸序列，SEQ ID NO：45，或者编码SEQ ID NO：46的核苷酸序列。
153.权利要求150的方法，其中第一多聚核苷酸编码第一多肽和至少一种第二多肽。
154.权利要求153的方法，其中第一多肽和第二多肽包括蛋白复合物的亚基。
155.权利要求154的方法，其中蛋白复合物是异源二聚体。
156.权利要求150的方法，进一步包括向质体中导入至少一种第二重组核酸分子。
157.权利要求156的方法，其中第二重组核酸分子包括有效连接的编码至少第一RBS的第一核苷酸序列和编码至少一种第二多肽的第二异源多聚核苷酸，其中第一RBS可以指导所述多肽在叶绿体中的翻译。
158.权利要求157的方法，其中第一重组核酸分子和第二重组核酸分子在叶绿体中共表达。
159.权利要求140的方法，其中第一重组核酸分子被包含在载体中。
160.权利要求159的方法，其中载体是叶绿体载体，其包括一段叶绿体基因组脱氧核糖核酸(DNA)的核苷酸序列，这段序列可以与叶绿体基因组DNA发生同源重组。
161.权利要求160的方法，其中载体进一步包括原核生物复制原点。
162.权利要求140的方法，进一步包括从质体中分离所述多肽。
163.通过权利要求162的方法获得的分离出的多肽。
164.权利要求163的分离出的多肽，其是一种抗体或者报告蛋白。
165.合成的多聚核苷酸，包括编码至少第一多肽的至少第一核苷酸序列，其中第一核苷酸序列中至少有一个密码子被倾向于表现出叶绿体的密码子使用。
166.权利要求165的多聚核苷酸，其中第一核苷酸序列的每一个密码子都被倾向于表现出叶绿体的密码子使用。
167.权利要求165的多聚核苷酸，其中多聚核苷酸进一步包括编码第二多肽的至少第二核苷酸序列。
168.权利要求167的多聚核苷酸，其中第二核苷酸序列的至少一个密码子被倾向于表现出叶绿体的密码子使用。
169.权利要求167的多聚核苷酸，其中第一核苷酸序列与第二核苷酸序列有效连接。
170.权利要求169的多聚核苷酸，其编码包括第一多肽和第二多肽的融合蛋白。
171.权利要求169的多聚核苷酸，其中第一核苷酸序列通过第三核苷酸序列与第二核苷酸序列有效连接。
172.权利要求171的多聚核苷酸，其中第三核苷酸序列编码一种连接肽。
173.权利要求172的多聚核苷酸，其编码包括通过连接肽与第二多肽连接的第一多肽的融合蛋白。
174.权利要求165的多聚核苷酸，其中第一多肽包括免疫球蛋白可变区，免疫球蛋白恒定区，或者二者的组合。
175.权利要求167的多聚核苷酸，其编码单链抗体，所述抗体包含有效连接的重链可变区和轻链可变区。
176.权利要求175的多聚核苷酸，其中单链抗体具有在SEQ ID NO：16，SEQ ID NO：43，或者SEQ ID NO：48中所列的氨基酸序列。 177.权利要求175的多聚核苷酸，其具有在SEQ ID NO：15，SEQ ID NO：42，或者SEQ ID NO：47中所列的核苷酸序列。
178.权利要求165的多聚核苷酸，其编码报告多肽。
179.权利要求178的多聚核苷酸，其中报告多肽是荧光素酶。
180.权利要求179的多聚核苷酸，其中荧光素酶具有在SEQ ID NO：46所列的氨基酸序列。
181.权利要求180的多聚核苷酸，其具有在SEQ ID NO：45中所列的核苷酸序列。
182.多肽，其包含在SEQ ID NO：16，SEQ ID NO：43，SEQ ID NO：46，或者SEQ ID NO：48中所列的氨基酸序列。
183.一种在质体中生产异源多肽的方法，所述方法包括在允许至少第一多肽在质体中表达的条件下向质体导入权利要求165的合成的多聚核苷酸。
184.权利要求183的方法，其中合成的多聚核苷酸与编码至少一种核糖体结合序列(RBS)的核酸序列有效连接。
185.权利要求184的方法，其中RBS可以指导所述多肽在质体中的翻译。
186.权利要求184的方法，其中所述多聚核苷酸进一步包含编码第二多肽的至少第二核苷酸序列。
187.权利要求186的方法，其中第一核苷酸序列与第二核苷酸序列有效连接。
188.权利要求187的方法，其中异源多肽包括融合蛋白，所述融合多肽包括第一多肽和第二多肽。
189.权利要求187的方法，其中第一核苷酸序列通过第三核苷酸序列与第二核苷酸序列有效连接。
190.权利要求189的方法，其中第三核苷酸序列编码一种连接肽。
191.权利要求190的方法，其中异源多肽包括含有通过连接肽连接的第一多肽和第二多肽的融合蛋白。
192.权利要求183的方法，其中异源多肽包括免疫球蛋白可变区，免疫球蛋白恒定区，或者二者的组合。
193.权利要求183的方法，其中异源多肽包括含有有效连接在一起的重链可变区和轻链可变区的单链抗体。
194.权利要求193的方法，其中单链抗体具有在SEQ ID NO：16，SEQ ID NO：43，或者SEQ ID NO：48中所列的氨基酸序列。
195.权利要求193的方法，其中单链抗体是由SEQ ID NO：15，SEQ ID NO：42，或者SEQ ID NO：47所列的核苷酸序列编码。
196.权利要求183的方法，其中异源多肽包括报告多肽。
197.权利要求196的方法，其中报告多肽是荧光素酶。
198.权利要求197的方法，其中荧光素酶具有在SEQ ID NO：46中所列的氨基酸序列。
199.权利要求198的方法，其中报告多肽是由在SEQ ID NO：45中所列的核苷酸序列编码。
200.权利要求183的方法，其中质体是叶绿体。
201.权利要求200的方法，其中叶绿体是在一种藻中。
202.权利要求201的方法，其中藻是一种微藻。
203.通过权利要求183的方法生产的异源多肽。
204.一种检测植物细胞的方法，包括在允许报告多肽在叶绿体中表达的条件下向植物细胞叶绿体中导入权利要求178的多聚核苷酸，以及检测所述报告多肽的表达。
205.权利要求204的方法，其中报告多肽是荧光素酶。
206.权利要求205的方法，其中荧光素酶具有在SEQ ID NO：46中所列的氨基酸序列。
207.权利要求204的方法，其中所述多聚核苷酸具有在SEQ ID NO：45中所列的核苷酸序列。

说明书全文

技术领域

[0002]本发明一般地涉及用于在植物细胞叶绿体中表达多肽的组合物和方法，更具体地，是涉及编码异源多肽的具有叶绿体密码子偏好性(chloroplast codon biased)的多聚核苷酸，以及可以使异源多肽在细菌和叶绿体中强表达的载体，所述的异源蛋白包括，例如，蛋白复合物，如通过多肽亚基的特定联接而形成的抗体和抗体嵌合体。

背景技术

[0003]分子生物学和遗传工程可以产生大量的生物活性物质，这些物质可以用作健康个体的营养补充或者用作治疗具有病理紊乱的个体的治疗试剂。比如，生长激素已经通过遗传工程的方法被生产出来了，而且重组生长激素已经被用于治疗患有生长功能障碍的个体。与此类似，具有所需要的特异性特征的单克隆抗体也被发现可以用作治疗各种紊乱的试剂，所述紊乱包括癌症，如淋巴癌和乳癌。

[0004]应用遗传工程技术来生产生物类治疗试剂的一个主要优点是这种方法可以保证生产出大量所需要的蛋白质。在许多情况下，能够获得足够量的例如用作治疗试剂的生物物质的别的方法，就只有通过从产生这些物质的生物细胞中纯化自然生成的活性物质来实现。因此，在遗传工程发明之前，生长激素只能从动物比如牛的脑下垂体中提取。胰岛素是这样的生物类试剂的另一个例子，在遗传工程发明之前，它只能从动物如猪的胰腺中分离才能够获得足够量和生物活性形式的胰岛素。

[0005]虽然遗传工程提供了一种生产大量生物物质的方法，特别是蛋白质和核酸，但目前可利用的方法仍然存在一些局限性。比如，人类的蛋白可以在细菌细胞中大量表达。但是细菌并不能够提供合适的环境以便于更加复杂的蛋白质的组装，比如抗体，它是一种通过四条多肽链的联接而形成的具有生物活性的蛋白质。因此，即使细菌可以用来生产生物物质，但仍可能需要一些额外的步骤如在特定条件下对蛋白质进行变性和折叠，从而获得生物活性物质。

[0006]重组蛋白也可以在真核细胞中表达，比如昆虫细胞和哺乳动物细胞，这些细胞可以提供将表达出来的蛋白质加工成生物活性试剂所必需的环境和必要的因子。比如抗体含有一条重链和一条轻链，它们构成二聚体，然后再进一步与另外一个由重链和轻链构成的二聚体联接成具有活性的抗体。这样的加工可以在真核细胞如哺乳动物细胞中进行。然而，真核细胞也可能会修饰蛋白质，比如对蛋白质进行糖基化修饰，这样，所述蛋白便在其特定的位置含有糖基。这种翻译后修饰可能会提供带来益处的特性，同时也可能带来一些缺点而限制了重组蛋白的用途。例如，糖基团可能具有非常强的抗原性，当它被注入到体内之后，会引起强烈的免疫应答而使得重组蛋白失活，甚至在某些情况下，可能会产生非常坏的影响，对个体造成比这种药物最初被注入个体时更大的伤害。

[0007]一般地，编码将要通过重组DNA方法来获得的多肽的多聚核苷酸是包含在载体中，所述载体是一种有助于对多聚核苷酸的操作的核酸分子。载体可以用来将感兴趣的多聚核苷酸导入到原核细胞如细菌细胞或者真核细胞如哺乳动物细胞中。根据载体所在宿主细胞的不同，载体还含有调控元件，比如使载体能在宿主细胞中扩增的元件。另外，载体也可以被设计成可以在原核细胞和真核细胞之间穿梭。这样的穿梭载体可能非常有用，比如，它们可以允许先在细菌中产生大量的载体(多聚核苷酸也包含在内)，然后载体再被转移到哺乳动物细胞中，使得由它编码的多肽可以在适合于正确组装出生物活性蛋白质的条件下被生产出来。

[0008]虽然这样的穿梭载体比那些特异地针对一种或者几种特定细胞类型的载体具有一些优势，但是它们还是不能够避免由翻译后修饰如糖基化带来的潜在的问题，这种情况在真核细胞中常常发生。因此需要一种可以方便地产生生物活性蛋白的方法，而且所产生的蛋白不会具有不需要的特征，例如在施用于个体如人类个体时产生强烈的抗原性。本发明就满足了这样的需要，而且还提供了额外的优点。发明概述

[0009]本发明是部分地基于一个确定的事实，即通过对编码多肽的核苷酸序列进行修饰使之反映出叶绿体的密码子使用(codon usage)，可以使所述异源多肽在植物中强烈表达。因此，本发明涉及合成的多聚核苷酸，其包括编码至少第一多肽的至少第一核苷酸序列，其中第一核苷酸序列中的至少一个密码子反映出叶绿体密码子使用偏好性。在一种具体实施方案中，第一核苷酸序列中的每一个密码子都反映出叶绿体密码子使用偏好性。

[0010]合成的多聚核苷酸可以包含编码单个多肽的单个核苷酸序列，或者可以进一步包括编码第二多肽的至少第二核苷酸序列，其中所述第二核苷酸序列中的一个或者多个密码子也可以反映出叶绿体密码子使用偏好性。如果合成的多聚核苷酸编码两个或者更多个多肽，这些编码核苷酸序列可以被有效连接(operatively linked)，这样单条多聚核苷酸可以被转录出来，而编码的多肽可以被分别表达，或者可以进一步有效连接，这样同时含有第一多肽和第二多肽的融合蛋白就可以被表达出来。在一种具体实施方案中，第一核苷酸序列和第二核苷酸序列通过一个第三核苷酸序列有效连接，所述第三核苷酸序列例如可以编码一段连接肽。这样，就可以由所述的合成的多聚核苷酸表达出融合蛋白，其含有通过连接肽连接在一起的第一多肽和第二多肽。

[0011]本发明中由合成的多聚核苷酸编码的多肽可以是任何感兴趣的多肽，而且通常是正常情况下不在质体中表达的多肽，特别是不在叶绿体中表达的多肽。比如，编码的多肽可以是免疫球蛋白(Ig)家族成员的一条或者多条链，例如，Ig可变区，Ig恒定区，Ig重链，Ig轻链，或者其组合；或者是T细胞受体(TCR)α链，TCRβ链，或者其组合；或者是任何可溶性的受体比如T细胞受体的可溶形式或者这样的受体与例如IG重链构成的融合蛋白。在一种具体实施方案中，合成的多聚核苷酸编码Ig家族成员融合蛋白，比如一个单链抗体，其包含与一个轻链可变区有效连接的完整重链。这样的融合蛋白的一个示例是单链抗单纯疱疹病毒(HSV)抗体，其氨基酸序列如SEQ ID NO：16 所示，它可以由具有SEQ ID NO：15所示的核苷酸序列的合成的多聚核苷酸编码，所述的核苷酸序列具有叶绿体密码子使用偏好性。在另外一个示例中，由具有叶绿体密码子使用偏好性的合成的多聚核苷酸编码的融合蛋白是单链抗HSV抗体Fv片断，其氨基酸序列如SEQ ID NO：43所示，而编码这段氨基酸序列的核苷酸序列如SEQ ID NO：42所示。在又另外一个示例中，由具有叶绿体密码子使用偏好性的合成的多聚核苷酸编码的融合蛋白是HSV8-lsc(大单链)抗体，其氨基酸序列如SEQ ID NO：48所示，而编码这段氨基酸序列的核苷酸序列如SEQ ID NO：48所示。

[0012]本发明中由合成的多聚核苷酸编码的多肽也可以是报告多肽 (reporter polypeptide)，比如一种荧光素酶多肽。这样的荧光素酶报告多肽的一个示例是含有通过连接肽有效连接的细菌荧光素酶A亚基和细菌荧光素酶B亚基的荧光素酶融合蛋白，该融合蛋白的氨基酸序列如SEQ ID NO：46所示，而编码这段氨基酸序列的具有叶绿体密码子使用偏好性的核苷酸序列如SEQ ID NO：45所示。因此，本发明提供一种具有SEQ ID NO：46所示的氨基酸序列的荧光素酶融合多肽。编码报告多肽的具有叶绿体密码子偏好性的合成的多聚核苷酸，比如示出的编码细菌luxAB融合多肽(SEQ ID NO：46)的多聚核苷酸(SEQ ID NO：45)是非常有用的，比如，可以作为鉴定叶绿体启动子、5’非翻译区(5’UTRs)、3’UTR、蛋白酶缺陷性株系以及类似物的工具，这样就提供了一种在叶绿体中进一步改善异源多肽表达的方法。

[0013]本发明还涉及一种通过导入合成的多聚核苷酸到质体中来产生异源多肽的方法，所述的合成的多聚核苷酸包括编码至少第一多肽的至少第一核苷酸序列，其中在所述第一核苷酸序列中至少一个密码子具有叶绿体密码子使用偏好性，而所述的导入是在允许所述的至少第一多肽在所述质体中表达的条件下进行的。这种合成的多聚核苷酸可以与一段编码至少一个核糖体结合序列(RBS)——特别是引导所述多肽在质体中翻译的RBS序列——的核酸序列有效连接。

[0014]根据本发明的方法所使用的合成的多聚核苷酸可以是任何合成的多聚核苷酸，其包括至少一个密码子具有叶绿体密码子使用偏好性的至少第一核苷酸序列。如此，所述的合成的多聚核苷酸可以进一步包括编码第二多肽的至少第二核苷酸序列，其中所述的第一核苷酸序列可以但不是必须与所述的第二核苷酸序列有效连接，而且其中所述第二多肽可以但并非必须是与叶绿体异源的。如果所述的合成的多聚核苷酸编码两个(或者更多个)多肽，那么所述被编码的多肽可以被表达成独立的不同的多肽，或者是被表达成含有第一和第二(或者更多)多肽的融合蛋白。

[0015]在一种具体实施方案中，依据本发明的方法由合成的多聚核苷酸表达的融合蛋白包括通过连接肽连接的第一多肽和第二多肽。这样的方法的一个示例是表达包含相互连接的IgA重链和轻链可变区的单链抗体，该融合蛋白具有SEQ ID NO：16所示的氨基酸序列，而编码这段氨基酸序列的具有叶绿体密码子使用偏好性的核苷酸序列如SEQ ID NO：15所示，其中被表达出来的单链抗体仍然具备抗原结合特异性(也参见，具有SEQ ID NO：43所示的氨基酸序列的单链抗HSV抗体Fv片断(由SEQ ID NO：42编码)和具有SEQ ID NO：48所示的氨基酸序列的HSV8-lsc抗体(由SEQ ID NO：48编码)。

[0016]本发明的方法在此的进一步示例是表达一个报告多肽，特别是包含与荧光素酶B亚基有效连接的荧光素酶A亚基的荧光素酶融合蛋白，所述融合蛋白具有SEQ ID NO：46所示的氨基酸序列，而编码这段氨基酸序列的核苷酸序列如SEQ ID NO：45所示，其中所述的异源荧光素酶在叶绿体中的表达可以在体内或者在体外检测。

[0017]本发明的方法可以在任何质体中实践，包括植物的叶绿体。含有叶绿体的植物可以是任何自然含有叶绿体的植物，包括藻类(微藻类或者巨藻类)和高等植物。所述方法还可以进一步包括将表达的异源多肽从含有所述多肽的植物细胞(或者分离的叶绿体)中分离出来的方法。因此，本发明提供利用本发明的方法所产生的异源多肽。

[0018]本发明进一步涉及一种检测含有质体的植物细胞的方法。这样的方法可以这样来实施，例如，将本发明的合成的多聚核苷酸导入到植物细胞的质体中，如导入到叶绿体中，其中所述的多聚核苷酸编码报告多肽，这样的导入允许所述的报告多肽在叶绿体中表达，然后检测所述的报告多肽的表达。所述的报告多肽可以是任何期望的多肽，它的示例是表达具有SEQ ID NO：46所示的氨基酸序列的荧光素酶融合蛋白。

[0019]本发明也涉及一种在质体中产生蛋白的方法。这样的方法可以这样来实施，例如，将至少第一重组核酸分子导入到质体中，其中所述的第一重组核酸分子包括第一核苷酸序列，该第一核苷酸序列编码至少一个核糖体结合序列(RBS)和与之有效连接的编码至少一种多肽的至少一个异源多聚核苷酸，其中所述RBS能够在允许所述的至少一种多肽表达的条件下指导所述多肽在质体中的翻译，由此可以在所述质体中产生所述多肽。所述质体可以是任何质体，包括例如一种叶绿体。

[0020]根据本方法，第一多聚核苷酸中的一个或者多个密码子可以具有叶绿体密码子使用偏好性。在一种具体实施方案中，被编码的多肽是抗体，或者抗体的亚基。在另一个具体实施方案中，第一多聚核苷酸编码第一多肽和第二多肽，例如，第一多肽包括Ig重链或者其可变区，第二多肽包括Ig轻链或者其可变区。通过本发明的方法所表达出来的这样的抗体的一个示例是具有SEQ ID NO：14所示的氨基酸序列的抗破伤风毒素抗体，其由SEQ ID NO：13所示的核苷酸序列编码。在另外一种具体实施方案中，第一多聚核苷酸具有叶绿体密码子使用偏好性。通过本发明的方法被表达出来的这样的抗体的示例是具有SEQ ID NO：16，SEQ ID NO：43和SEQ ID NO：48中的一个所示的氨基酸序列的抗HSV抗体，这些抗体可以由序列分别为SEQ ID NO：15，SEQ ID NO：42和SEQ ID NO：47的核苷酸序列编码。

[0021]在另外一个具体实施方案中，第一多聚核苷酸编码第一多肽和至少一个第二多肽，其中所述第一多肽和第二(或更多个)多肽可以但并不一定是一种蛋白复合物的亚基，所述蛋白复合物例如是一个异源二聚体、异源三聚体等。在另外一个具体实施方案中，所述方法可以进一步包括向质体中导入至少第二重组核酸分子。这样的第二重组核酸分子可以包括第一核苷酸序列，所述第一核苷酸序列编码至少第一RBS和与之有效连接的编码至少第二多肽的至少第二异源多聚核苷酸，其中所述第一RBS能够指导所述多肽在质体中的翻译，特别是叶绿体。优选地，所述的第一重组核酸分子和第二重组核酸分子在质体中共表达。

[0022]根据本发明的方法，第一重组核酸分子可以包含在载体之内。在一种具体实施方案中，所述载体是叶绿体载体，其含有可以与叶绿体基因组DNA进行同源重组的叶绿体基因组DNA核苷酸序列，含有所述第一重组核酸分子的载体被导入到叶绿体中。这样的载体可以进一步包含原核生物的复制起点。

[0023]本发明的方法可以进一步包括从质体中分离多肽。因此，本发明也提供通过这样的方法获得的分离的多肽，例如，一种在叶绿体中异源表达的分离的抗体。

[0024]本发明进一步涉及在植物叶绿体中产生一种或者多种多肽的方法，包括产生能够特异性地联接形成蛋白复合体的多肽的方法。同样地，本发明的方法提供了一种产生功能性蛋白复合物的手段，比如，包括第一重链和轻链和与之联合的第二重链和轻链的二价抗体。本发明的方法可以这样来实施，例如，向叶绿体中导入第一重组核酸分子，其包括编码至少一种多肽的第一多聚核苷酸；与第二多聚核苷酸有效连接，所述第二多聚核苷酸包括编码第一核糖体结合序列(RBS)的核苷酸序列和与之有效连接的编码第二RBS的核苷酸序列，其中第一 RBS可以指导多肽在原核生物中的翻译，第二RBS可以指导多肽在叶绿体中的翻译，这样的方法是在允许所述的至少一种多肽表达的条件下进行的，这样就可以在叶绿体中表达所述多肽。本发明中的这些方法可以在任何含有叶绿体的植物(植物细胞)中进行，包括单细胞植物和藻类，以及多细胞植物和藻类。

[0025]在一种具体实施方案中，在本发明的方法中所用到的第一多聚核苷酸编码第一多肽和至少一个第二多肽，比如，一个第一多肽和一个第二多肽；或者一个第一多肽，一个第二多肽和一个第三多肽；等等，任何一种或者全部的多肽都可以是相同的或者不同的。在另外一个具体实施方案中，所述第一多聚核苷酸的一个或者多个密码子具有叶绿体密码子使用偏好性。

[0026]正如在这里所公开，在植物叶绿体比如微藻莱茵衣藻 (Chlamydomonas reinhardtii)的叶绿体中表达的多肽正确地组装，而且可以与一种或者多种在叶绿体中表达的其它多肽联合形成功能性蛋白复合物。因此，在另外一个具体实施方案中，在本发明的方法中有用的第一多聚核苷酸可以编码一种或者多种多肽亚基，这些亚基可以联合形成功能性蛋白复合物。所述的蛋白复合物可以是二聚体、三聚体、四聚体或者类似的多聚体，而这些亚基可以相同，也可以不同，或者是二者的组合。比如，当所述的蛋白复合物是一个二聚体时，它可以是同源二聚体或者异源二聚体。当所述的蛋白复合物是一个三聚体时，它可以是同源三聚体、异源三聚体或者是由两个相同的多肽和一个不同的多肽组成的三聚体。

[0027]本发明的方法对于生产功能性蛋白复合物特别有用，所述蛋白复合物例如通常在自然发生时含有两条重链和两条轻链的抗体，或者细胞表面受体如T细胞受体、生长素受体、荷尔蒙受体、G蛋白偶联受体，其中G蛋白偶联受体可以与G蛋白联合，以及类似的复合物。应用本发明的方法在叶绿体中产生蛋白如抗体的一个优点是多肽在叶绿体中表达之后不会被糖基化，因此，其抗原性与在动物中获得的或者在真核生物细胞的细胞质中表达的抗体抗原性相比大大降低。正如在这里所公开的，在叶绿体中产生功能性蛋白复合物的方法可以这样来实施：应用第一重组核酸分子，按照定义，其中所述第一多聚核苷酸编码复合物的两个或者多个亚基；或者应用第一重组核酸分子和第二重组核酸分子，前者按照定义，编码复合物的一个多肽亚基，而后者具有和第一重组核酸分子同样的特性，编码所述蛋白质复合物的另外一个多肽亚基。

[0028]因此，本发明的方法可以应用第一重组核酸分子来实施，其中所述第一多聚核苷酸编码第一多肽和第二多肽，前者是免疫球蛋白重链(H)或其可变区，后者是免疫球蛋白轻链(L)或其可变区。如果需要的话，一段编码内在核糖体进入位点的核苷酸序列可以放在编码H 和L的核苷酸序列之间，这样可以促进第二(下游)编码多肽的表达。在编码的H和L链在叶绿体中被翻译之后，一个H链可以与一个L链联合形成一个单价抗体(即，一个H:L复合物)，而两个H:L复合物可以进一步联合形成一个二价抗体。

[0029]本发明的方法也可以这样来实施，向植物叶绿体中导入第一重组核酸分子，其中第一多聚核苷酸编码，比如，H链或者其可变区，进一步向叶绿体中导入第二重组核酸分子，其包含编码L链或者其可变区的第一多聚核苷酸，并且所述第一多聚核苷酸与第二多聚核苷酸有效连接，所述第二多聚核苷酸包含编码第一RBS的核苷酸序列以及与之有效连接的编码第二RBS的核苷酸序列，其中所述第一RBS可以指导多肽在原核生物中的翻译，而第二RBS可以指导多肽在叶绿体中的翻译，被编码的多肽在叶绿体中基本上共表达。其中重链(H)和轻链(L)可以联合形成一个H:L复合体，而其中H:L复合体又可以进一步联合生成一个二价抗体。

[0030]在实践本发明的方法时，第一重组核酸分子可以包含在载体当中。而且，如果本方法还用到第二(或者更多)其它重组核酸分子，那么第二重组核酸分子也可以包含在载体当中，这个载体可以但并不一定与含有第一重组核酸分子的载体相同。作为选择，植物细胞可以被遗传修饰，以使植物的叶绿体含有一个稳定整合的编码蛋白复合物的一个亚基的重组核酸分子，这样，本发明的方法可以包括，比如将含有第二重组核酸分子的载体导入到所述植物的叶绿体中，所述第二重组核酸分子编码蛋白复合物的一个或者多个亚基，这样，在多肽被表达出来之后，一个功能性的蛋白复合物便产生了。

[0031]本发明中所用的载体可以是任何一种用来向叶绿体中导入多聚核苷酸的载体。特别地，所述载体可以包括叶绿体基因组DNA的核苷酸序列，通过它可以介导与叶绿体基因组DNA的同源重组。这样的叶绿体载体可以包含任何有利于载体的应用或者操作的附加核苷酸序列，比如，一个或者多个转录调控元件，或者选择性标记，或者克隆位点，或者类似的元件，包括它们的组合。在一种具体实施方案中，载体可以是一个叶绿体载体，它包括植物叶绿体基因的转录启动子和 5’非翻译区(5’UTR)，它还可以包括，或者通过修饰之后可以包括如前所述的第一RBS以及与之有效连接的第二RBS。在另外一个具体实施方案中，载体可以是一个叶绿体载体，它包括原核生物的复制起始位点(ori)，比如大肠杆菌(E.coli)的ori，因此提供了可以在原核宿主细胞和叶绿体中穿梭和操作的穿梭载体。本发明的穿梭载体可以含有任何感兴趣的多聚核苷酸，包括具有叶绿体密码子偏好性的合成的多聚核苷酸，比如具有SEQ ID NO：45所示的序列的合成的多聚核苷酸，它编码一种细菌luxAB融合蛋白(SEQ ID NO：46)。这样的表达 SEQ ID NO：46的穿梭载体提供的优势是，对于在细菌中的表达，可以检查调控元件或者其他感兴趣的序列，然后含有那些具有所需要的表达特性的元件的载体可以被穿梭，连同与之有效连接的同样的或者其它的合成多聚核苷酸或者其他多聚核苷酸被穿梭到叶绿体中，在其中可以获得被编码的异源多肽的被改善的表达。

[0032]本发明的方法可以进一步包括从叶绿体中分离所表达的多肽或者蛋白复合物的步骤。因此，本发明还提供根据这里所公开的方法得到的分离的多肽或者蛋白复合物。比如，本发明提供在植物叶绿体中表达并从中获得的分离的抗体。本发明的分离的抗体的一个优点是所述抗体的多肽成分没有糖基化，因此当抗体被施予个体时其抗原性会降低。而且，本发明的这种抗体与自然发生的抗体相比，可以有降低的效应活性(effector activities)，例如补体结合活性(complement fixation activity)，因此提供了可以用于对个体进行诊断的抗体。

[0033]本发明还涉及包括第一核糖体结合序列(RBS)和与之有效连接的第二RBS的分离的核糖核苷酸序列，其中所述第一RBS和第二 RBS被5到25个核苷酸间隔开来，其中，当所述的核糖核苷酸序列与一个编码多肽的多聚核苷酸有效连接时，所述第一RBS可以指导所述多肽在原核生物中的翻译，而第二RBS可以指导所述多肽在叶绿体中的翻译。本发明的分离的核糖核苷酸序列一般是大约11到50个核糖核苷酸长度，可以是大约15到40个核糖核苷酸长度，或者是大约20 到30个核糖核苷酸，可以作为一个独立的单位，或者可以与一个异源的RNA分子有效连接。

[0034]在本发明的核糖核苷酸序列中，有效连接的第一RBS和第二 RBS一般被大约5到25核苷酸间隔开来，常常是大约10到20个核苷酸，比如是大约15个核苷酸。第一RBS和第二RBS可以各自独立地由大约3到9个核苷酸组成，常常是大约4到7个核苷酸，而且可以含有任何具有Shine-Delgamo(SD)序列特征的序列，比如包含 5’-GGAG-3’的序列，该序列与16S rRNA的反SD序列的一部分互补。指导多肽在叶绿体中翻译的第二RBS可以包含在一个叶绿体基因的 5’UTR中，所述的叶绿体基因可以是编码一种可溶性叶绿体蛋白或者叶绿体膜结合蛋白的叶绿体基因，其中所述5’UTR可以进一步包括转录调控元件，包括启动子。

[0035]本发明的核糖核苷酸序列可以进一步包括与所述第一和第二 RBS有效连接的起始AUG密码子。这样的起始AUG密码子可以进一步包括Kozak序列的相邻核苷酸，比如ACCAUGG，该序列可以促进多肽在细胞中的翻译。本发明的核糖核苷酸序列还可以与编码多肽的多聚核糖核苷酸有效连接，所述多聚核糖核苷酸序列可以含有一个内源性起始AUG密码子或者可以通过修饰之后含有一个起始AUG密码子，或者也可以缺少起始AUG密码子，而这个密码子可以是本发明的核糖核苷酸序列的一个组分。

[0036]本发明的分离的核糖核苷酸序列可以通过化学方法合成，或者可以采用酶学方法生成，比如从一个脱氧核糖核苷酸(DNA)或者核糖核苷酸(RNA)模板分别利用DNA依赖型RNA聚合酶或者RNA 依赖型RNA聚合酶生成。这样的DNA模板可以化学合成或者可以从自然发生的DNA分子中分离，或者基于自然发生的DNA序列，经过一定修饰之后具备所需的特性，比如一段原核基因的DNA序列，其具有编码定位在起始ATG密码子上游大约5到15个核苷酸的RBS的核苷酸序列，而且还可以通过进一步修饰含有第二RBS，第二RBS定位在第一RBS上游且与第一RBS分开，这样第二RBS可以指导多肽在叶绿体中的翻译。

[0037]因此，本发明还涉及编码如此定义的第一RBS以及与之有效连接的第二RBS的多聚核苷酸。所述多聚核苷酸可以是DNA或者 RNA，可以是单链或者双链。本发明的多聚核苷酸可以包括起始ATG 密码子，它与编码第一RBS和第二RBS的核苷酸序列有效连接。另外，本发明的多聚核苷酸可以包含克隆位点，所述克隆位点的位置允许能够编码多肽的可表达的多聚核苷酸有效连接到第一RBS和第二RBS 上，这样所述多肽可以在叶绿体或者原核宿主细胞中表达。所述克隆位点可以是任何便于可表达的多聚核苷酸插入或者连接到第一和第二 RBS的核苷酸序列，这样编码多肽的翻译就可以在适当的条件下从第一RBS和第二RBS启动，所述克隆位点例如一个或者多个限制性内切酶识别位点或者重组酶识别位点或者它们的组合。

[0038]如在此定义的编码第一和第二RBS的多聚核苷酸可以与一个可表达的多聚核苷酸有效连接，所述的可表达的多聚核苷酸可以编码至少一种多肽，包括肽或者多肽的肽部分。同样，所述的可表达的多聚核苷酸可以编码一种第一多肽和一种或者更多种额外的多肽，这些多肽可以是相同的或者不同的。比如，所述的可表达的多聚核苷酸可以编码一个第一多肽和一个第二多肽，这些多肽可以互不相同。进一步，这样的第一多肽和第二多肽可以作为融合蛋白表达，或者可以作为独立的多肽表达，如果是后一种情况，编码一个内在核糖体进入位点的核苷酸序列可以但并不一定有效连接在所述第一多肽的编码序列和所述第二多肽的编码序列之间，这样可以所述便于所述第二多肽的翻译。

[0039]本发明的多聚核苷酸的两侧还可以具有第一克隆位点和第二克隆位点，这样就提供了一个可以方便地插入或者连接到第二多聚核苷酸的序列盒。这种侧边的第一和第二克隆位点可以相同或者不同，而且其中之一或者两者都可以独立地作为一系列克隆位点中的一个，即多克隆位点。

[0040]在一种具体实施方案中，本发明的多聚核苷酸包含一个编码第二RBS的核苷酸序列，一个编码第一RBS的核苷酸序列，和一个起始 ATG密码子，这些序列都是有效连接并且方向是5’到3’的；以及/或者与这样的多聚核苷酸互补的核苷酸序列。在另外一个具体实施方案中，本发明的多聚核苷酸包含一个编码第二RBS的核苷酸序列，一个编码第一RBS的核苷酸序列，和一个起始ATG密码子，和至少一个克隆位点，这些序列都是有效连接并且方向是5’到3’的；以及/或者与这样的多聚核苷酸互补的核苷酸序列。在又另外一个具体实施方案中，本发明的多聚核苷酸包含一个编码第二RBS的核苷酸序列，一个编码第一RBS的核苷酸序列，和至少一个定位在编码第一RBS的核苷酸序列的3’侧大约3到10个核苷酸位置的克隆位点，这些序列都是有效连接并且方向是5’到3’的；以及/或者与这样的多聚核苷酸互补的核苷酸序列。

[0041]本发明还涉及一种载体，其包括编码如在此定义的有效连接的第一RBS和第二RBS的多聚核苷酸，和一段叶绿体基因组脱氧核糖核酸(DNA)的核苷酸序列，它可以与叶绿体基因组DNA发生同源重组。这样的叶绿体基因组DNA核苷酸序列一般是虽然并不必然是一段沉默的核苷酸序列，它不编码某个叶绿体基因，而且要足够长以使载体能够与叶绿体基因组上对应的核苷酸序列发生同源重组。

[0042]本发明的载体还可以包含一个或者多个额外的可以赋予载体所需特性的核苷酸序列，包括，比如，有利于载体操作的序列。如此，载体可以包含，比如，一个或者多个克隆位点，例如多克隆位点，其定位使得异源多聚核苷酸可以插入到载体当中并与第一RBS和第二 RBS有效连接。所述载体还可以包含原核生物复制起始位点(ori)，比如大肠杆菌的ori或者粘粒的ori，由此提供可以在原核宿主细胞或者植物叶绿体中按照需要穿梭的穿梭载体。因此，在一种具体实施方案中，本发明提供了叶绿体/原核生物穿梭载体，其中所述穿梭载体包括1)叶绿体基因组DNA的核苷酸序列，它可以与叶绿体基因组 DNA发生同源重组；2)原核生物的原点；3)与第二RBS有效连接的第一RBS，其中所述第一(或者第二)RBS可以指导有效连接的可表达的多聚核苷酸在叶绿体中的翻译，而第二(或者第一)RBS可以指导有效连接的可表达的多聚核苷酸在原核生物中的翻译；和4)有效连接的可表达的多聚核苷酸，或者其定位可以使异源多聚核苷酸插入并有效连接到第一和第二RBS上的克隆位点。

[0043]本发明的载体可以是一种环化载体，或者也可以是具有第一末端和第二末端的线性载体。本发明中的线性载体可以在一端或者两端具有一个或者多个克隆位点，这样就提供了环化所述载体的手段或者将所述载体连接到第二多聚核苷酸上的方法，所述第二多聚核苷酸可以是一个与本发明的所述载体相同或者不同的第二载体。所述克隆位点可以包括限制性内切酶识别位点(或者其切割产物)，重组酶位点，或者这样的位点的组合。

[0044]所述载体可以进一步包括一个或者多个表达控制元件，比如转录调控元件、额外的翻译元件和类似的元件。在一种具体实施方案中，所述载体含有与编码第一RBS和第二RBS的序列有效连接的起始 ATG密码子，这样编码多肽的多聚核苷酸可以相邻地与ATG密码子有效连接，在转录之后，可以产生可以在原核生物中和在叶绿体中翻译的RNA。因此，所述载体还可以含有克隆位点，其定位允许至少一段异源多聚核苷酸与这样的ATG密码子有效连接。本发明的载体也可以含有与第一RBS和第二RBS有效连接的编码第一多肽的核苷酸序列，其中所述的编码核苷酸序列经过修饰之后含有一个或者多个克隆位点，包括，比如在ATG密码子的上游附近，ATG密码子的下游附近，以及/或者在被编码的多肽的C末端或其附近。这样的载体提供了一种方便地插入一段编码第二多肽的核苷酸序列于其中的手段，或者是通过替代编码所述第一多肽的核苷酸序列来实现，或者是在所述的被编码的多肽的N末端或者C末端进行有效连接，这样包含第一多肽和第二多肽的融合蛋白可以被表达出来。

[0045]本发明还涉及一种含有本发明的多聚核苷酸或者载体的细胞。所述细胞可以是针对本发明的载体的宿主细胞，可以是原核生物细胞或者真核生物细胞，包括，比如细菌细胞如大肠杆菌细胞；植物细胞如藻类或单子叶或者双子叶植物；昆虫细胞；或者脊椎动物细胞如哺乳动物细胞。如果所述细胞是植物细胞，那么所述多聚核苷酸或者载体可以包含在植物细胞的质体内，特别是叶绿体内，而且可以但并不一定整合到所述质体的基因组中。

[0046]一般地，本发明的多聚核苷酸可以包含在载体内，并与可表达的多聚核苷酸有效连接，因此含有所述的多聚核苷酸的细胞就提供了一个表达系统，其允许由所述的可表达的多聚核苷酸编码的一种或者多种多肽的翻译。如此，所述的可表达的多聚核苷酸可以具有所述质体的密码子使用偏好性，特别是叶绿体密码子使用偏好性，所述的可表达的多聚核苷酸编码至少第一多肽，比如编码第一多肽和第二多肽。在一种具体实施方案中，所述的可表达的多聚核苷酸编码抗体。在另外一种具体实施方案中，所述的可表达的多聚核苷酸具有叶绿体密码子使用偏好性，例如，所述的可表达的多聚核苷酸具有SEQ ID NO：1， SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：42，SEQ ID NO：45或者 SEQ ID NO：47所示的核苷酸序列。

[0047]本发明进一步涉及一种转基因植物，其包含含有本发明的多聚核苷酸，并且已经整合到叶绿体基因组DNA中的植物细胞。因此，本发明提供从这样的转基因植物获得的植物细胞器或者细胞或者组织，比如从所述转基因植物中分离出的叶绿体，或者是从所述转基因植物中分离出的叶或者花，从所述转基因植物中分离出的果实或者根茎，或者所述转基因植物的插枝，或者由所述转基因植物产生的种子。另外，本发明提供从本发明的转基因植物，或者由所述的转基因植物获得的植物细胞或者组织中制备的cDNA或者叶绿体基因组DNA库。本发明的转基因植物可以是任何类型的植物，包括，比如藻类，可以是微藻或者巨藻；单子叶植物；或者双子叶植物比如被子植物(例如谷物类植物，豆科植物，含油种子植物，或者硬木树)，包括观赏类植物。

[0048]本发明进一步涉及一种组合物，其中包括从本发明的转基因植物或者通过遗传修饰含有整合到植物叶绿体基因组DNA中的本发明的多聚核苷酸的植物细胞中获得的植物材料。优选地，在所述的转基因植物或者遗传修饰过的植物细胞中，编码所述的有效连接的第一 RBS和第二RBS的多聚核苷酸与可表达的多聚核苷酸有效连接，所述的可表达的多聚核苷酸可以但并不一定具备叶绿体密码子使用偏好性。这样，所述的植物材料，可以是细胞器，细胞，或者一种或多种由转基因植物获得的组织，例如，叶绿体，或者叶或花，果实或根茎，或者由转基因植物产生的种子，它们提供了由所述的可表达的多聚核苷酸编码的一种或多种多肽的来源。例如，如果所述的可表达的多聚核苷酸编码抗体，或者其抗原结合片断，那么所述植物材料，以及所述的组合物便提供了所述抗体的来源。

[0049]本发明的组合物可以被配制成适合于施予活体的形式，所述活体例如脊椎动物或者其他哺乳动物，可以是家养动物或者宠物，或者可以是人。相应地，根据由所述的可表达的多聚核苷酸编码的一种多肽或者多种多肽的不同，如在此公开的包含植物材料的组合物可以用作营养添加剂、治疗试剂以及类似的产品。比如，如果所述的可表达的多聚核苷酸编码抗体，或者其抗原结合片断，那么所述组合物可以用于例如暴露于疱疹病毒或破伤风毒素的个体的被动免疫。同样，本发明提供用于改善一种病理状态比如疱疹病毒感染的药物。

[0050]本发明还涉及编码荧光蛋白或者其突变体或者其变异体的分离的多聚核苷酸，其中所述多聚核苷酸的密码子具有叶绿体密码子使用偏好性。所述多聚核苷酸可以是DNA序列或者RNA序列，可以是单链或者双链，可以是在一端或者两端含有克隆位点的线性多聚核苷酸。所述多聚核苷酸也可以与编码第一RBS和第二RBS的多聚核苷酸有效连接，其中这两个RBS序列被大约5到25个核苷酸分开，这样，所述荧光蛋白可以方便地在原核生物和叶绿体中翻译。

[0051]编码本发明的荧光蛋白的一种或者多种密码子可以具有偏好性，例如，在第三个位置含有腺嘌呤或者胸腺嘧啶，这样可促进所述荧光蛋白在叶绿体中的翻译。例如，所述荧光蛋白可以是绿色荧光蛋白(GFP)，如由Aequorea jellyfish产生的荧光蛋白。本发明的这样的多聚核苷酸的示例是编码序列为SEQ ID NO：2的多肽的多聚核苷酸，比如，SEQ ID NO：1所示的多聚核苷酸。因此，本发明也提供由这样的多聚核苷酸编码和表达的荧光蛋白，例如，具有SEQ ID NO：2所示的氨基酸序列的荧光蛋白。

[0052]本发明进一步涉及重组核酸分子，其包括第一多聚核苷酸和第二多聚核苷酸，所述第一多聚核苷酸编码至少一种多肽而且含有一个或者多个具有叶绿体密码子使用偏好性的密码子，所述第二多聚核苷酸包括编码第一RBS的核苷酸序列和与之有效连接的编码第二RBS 的核苷酸序列，其中所述第一RBS可以指导所述多肽在原核生物中的翻译，所述第二RBS可以指导所述多肽在叶绿体中的翻译。所述第一多聚核苷酸可以编码单个多肽，或者可以编码两个或者更多多肽，如果是后一种情况，所述多肽可以分别表达或者作为融合蛋白表达。如果所述第一多聚核苷酸编码两个或者更多多肽，各编码序列之间的核苷酸序列可以但并不一定编码内在核糖体进入位点，该位点的定位便于第二(或者其它)多肽的翻译。本发明的重组核酸分子可以进一步包括第三多聚核苷酸，它可以与所述的第一和第二多聚核苷酸有效连接，它可以但并不一定编码一个或者多个多肽。

[0053]本发明还涉及制备叶绿体/原核生物穿梭表达载体的方法。这种方法可以这样来实施，比如，向足以与叶绿体基因组DNA发生同源重组的一段叶绿体基因组DNA的核苷酸序列中导入下列序列：包含原核生物复制原点的核苷酸序列；编码第一RBS的核苷酸序列；编码第二RBS的核苷酸序列，其中所述第一RBS和第二RBS被大约5到25 个核苷酸分开；和克隆位点，其中所述克隆位点被定位以允许编码多肽的多聚核苷酸有效连接到所述第一RBS和第二RBS，这样，所述第一RBS可以指导所述多肽在原核生物中的翻译，而所述第二RBS可以指导所述多肽在叶绿体中的翻译。制备叶绿体/原核生物穿梭表达载体还可以通过遗传修饰一段叶绿体基因组脱氧核糖核酸(DNA)的核苷酸序列来实现，所述这段核苷酸序列可以与叶绿体基因组DNA发生同源重组，经过修饰之后它含有原核生物复制起始位点，编码被大约5 到25个核苷酸分开的第一RBS和第二RBS的核苷酸序列，和克隆位点，其中所述克隆位点被定位以允许编码多肽的多聚核苷酸有效连接到所述第一RBS和第二RBS，这样，所述第一RBS可以指导所述多肽在原核生物中的翻译，而所述第二RBS可以指导所述多肽在叶绿体中的翻译。因此，本发明还提供如上所述的根据本发明的方法制备的叶绿体/原核生物穿梭载体。

[0054]本发明进一步涉及重组多聚核苷酸，其包括编码叶绿体RBS 的第一核苷酸序列和与之有效连接的编码多肽的第二核苷酸序列，其中所述第一核苷酸序列与所述第二核苷酸序列是相对异源的。这样的重组多聚核苷酸可以进一步包括有效连接的编码第二(或者其它)多肽的第三(或者更多)核苷酸序列，由此提供编码双顺反子(或者多顺反子)多聚核糖核苷酸序列的重组多聚核苷酸。编码有效相连的RBS 的核苷酸序列一般距离起始ATG密码子大约20到40个核苷酸位置(上游)，而起始密码子则与编码所述多肽的所述核苷酸序列有效连接。在一种具体实施方案中，所述的第一核苷酸序列包括距离编码RBS的序列的3’大约20到40个核苷酸位置的起始ATG密码子。在另外一个具体实施方案中，一个内部核糖体结合序列被有效连接于编码多肽的两段或者更多核苷酸序列之间，所述的这些核苷酸序列可以相同也可以不同。

[0055]本发明还涉及一种载体，其包括位于克隆位点5’端大约20到 40个核苷酸位置的编码RBS的核苷酸序列。所述克隆位点可以是任何便于核苷酸序列插入或者连接到载体中的核苷酸序列，比如，一个或者多个限制性内切酶识别位点，一个或者多个重组酶识别位点，或者是这些位点的组合。优选地，所述的克隆位点是多克隆位点，其中包括一系列限制性内切酶识别位点或者重组酶识别位点，或者是至少一个限制性内切酶识别位点和至少一个重组酶识别位点的组合。所述载体可以进一步包含位于所述克隆位点的5’端并与之相邻的起始ATG密码子或者其中的一部分，这样就为缺乏起始ATG密码子的编码序列提供了翻译起始位点。另外，所述载体可以包含叶绿体基因的3’非翻译区，其位于所述克隆位点的3’端。附图说明

[0056]图1提供了GFPct(SEQ ID NO：1)和GFPncb(SEQ ID NO：3) 编码区的对比。GFPct的氨基酸序列(SEQ ID NO：2)在核苷酸序列下面标出。改变的密码子用方框标记出来，在密码子使用上被显著改变的密码子用阴影标记。优化的密码子定义为莱茵衣藻(C.reinhardtii) 叶绿体基因组中每1000个密码子使用超过10次的密码子(Nakamura 等，Nucl.Acids Res.27：292，1999)。星号(*)标示GFPct和GFPncb 之间的两个氨基酸改变，分别在第2和第65位氨基酸上。

[0057]图2提供了pET表达的GFPct和GFPncb的表征。在大肠杆菌中由质粒pET19b表达的GFPct和GFPncb蛋白通过Ni琼脂糖亲和色谱纯化(实施例1)。含有GFPct或者GFPncb蛋白的E.colli细胞粗裂解物(20μl)不经过沸水浴直接上样到12％的SDS-PAGE上，电泳结束过后，拆开电泳设备，让胶留在玻璃板之间。荧光凝胶通过指定的激发(ex)和发射(em)滤镜观察。5微克通过亲和纯化得到的GFPct 和GFPncb蛋白在12％的SDS-PAGE上分离，并用考马斯亮蓝染色。 100ng的通过亲和纯化得到的GFPct和GFPncb蛋白经过12％的 SDS-PAGE之后，再进行蛋白质印迹，用抗GFP一抗检测。激发谱是从经过亲和纯化的GFPct(4μg)和GFPncb(20μg)蛋白得到的。记录了在激发波长从350到550nm时的相对荧光强度，其中发射波长固定在510nm。GFPncb(点划线)和GFPct(黑线)的发射谱如图所示；虚线表示的是在两个样品在510nm处的发射峰。

[0058]图3提供了用于在莱茵衣藻叶绿体中的表达的GFPct和 GFPncb报告基因的图谱。

[0059]图3A显示的是将rbcL 5’UTR(Banm HI/Nde I；也可参见SEQ ID NO：5)与GFPct(SEQ ID NO：1)或GFPncb(SEQ ID NO：3)编码区(Nde I/Xba I)以及rbcL 3’UTR(Xba I/Bam HI；也请参见SEQ ID NO：10)进行划界的相关限制性位点。每个片断的大小都以碱基对数 (bp)标明。

[0060]图3B显示的是将rbcL 5’和3’UTR控制下的GFPct和GFPncb 基因整合到莱茵衣藻叶绿体基因组中的整合位点。莱茵衣藻的叶绿体 DNA如5.7kb的Eco RI至Xho I片断所标示。双箭头指示的是DNA 杂交(Southern blot)分析中所用的探针的对应区域。

[0061]图4显示的是突变的psbA 5’UTR(SEQ ID NOS：35到40)的线性序列，其对应的位置是相对于野生型5’UTR(SEQ ID NOS：34)的起始密码子+3到-36位置。5’UTR被置于D1cDNA的上游，该cDNA 是野生型psbA基因的无内含子拷贝。一级序列的改变用下划线标示，起始密码子用方框标示。星号表示mRNA的5’端，它们是在体内由剪切5’UTR的加工事件产生的(参见Mayfield，Trends Plant Sci.4：190-195， 1998，这篇文献在此整入作为参考)。

[0062]图5A至5C提供了用于在莱茵衣藻叶绿体中表达的HSV8-lsc 基因的限制性酶切图谱。HSV8-lsc核苷酸序列(SEQ ID NO：47)及其氨基酸序列(SEQ ID NO：48)在序列表中提供。

[0063]图5A和5B显示的是描绘下列片断的相关限制性位点：rbcL 5’UTR(Bam HI/Nde I)，HSV8编码区和flag标记(NdeI/Xba I)，和rbcL 3’UTR(Xba I/Bam HI；图5A)，以及atpA 5’UTR(Bam HI/Nde I)，HSV8编码区和flag标记(NdeI/Xba I)，和rbcL 3’UTR(Xba I/Bam HI；图5B)的相关限制性位点。

[0064]图5C提供了一个限制性图谱，其显示了将HSV8-lsc基因整合到质粒p322中以便于将其整合到莱茵衣藻叶绿体基因组中的整合位点。p322质粒的DNA含有一段5.7kb的从Eco RI到Xho I的片断，这个片断对应于莱茵衣藻的叶绿体基因组中44,877到50,577的位置(参见万维网URL地址“biology.duke.edu/chlamy_genome/chloro.html”)。双箭头指示的区域对应于Southem杂交分析中所用的探针。黑框指示 (从左到右)的分别是psbA的外显子5，5S核糖体基因和小部分的 23S核糖体基因。

[0065]图6提供了结合于HSV8病毒蛋白的HSV8-lsc的表征，这是通过ELISA获得的。从转基因的莱茵衣藻株系(10-6-3和16-3)中通过亲和纯化得到的HSV8-lsc在ELISA分析中用HSV蛋白来进行筛选， HSV蛋白从被病毒侵染的细胞中制备得到的。100，80，70，60，30， 20，10或者5微升通过Flag纯化的HSV8-lsc蛋白在微滴定板中用恒定量的病毒蛋白包被温育。在这些亲和纯化的提取液中蛋白的浓度为 13ng/μl，其中大约10％是HSV8-lsc，这是通过考马斯亮兰染色鉴定的。等体积的野生型莱茵衣藻的蛋白作为阴性对照(浓度为1μg/μl)。

[0066]图7提供了luxAB(SEQ ID NO：44)和luxCt(序列SEQ ID NO：46 的氨基酸残基2到695)编码区的序列比对。带有修改过的密码子的氨基酸序列用方框和阴影标记的氨基酸来表示。优化的密码子被定义为莱茵衣藻叶绿体基因组中每1000个密码子中使用超过10次的密码子 (Nakamura等，1999)。这两个蛋白质的氨基酸序列差异通过用方框和阴影标记的氨基酸来标示，而导致得到活性荧光素酶而被改变的两个氨基酸用**在改变的氨基酸上方标示出来。

[0067]图8A和8B提供了在莱茵衣藻叶绿体中表达的luxCt基因的图谱。

[0068]图8A说明了描绘atpA 5’UTR(Bam HI/Nde I)，luxCt编码区 (NdeI/Xba I)，和rbcL 3’UTR(Xba I/Bam HI)的相关限制性位点。

[0069]图8B提供了一个显示有质粒p322和莱茵衣藻叶绿体基因组之间的同源区域的图谱，嵌合的luxCt基因就是被插入到这个同源区域中。莱茵衣藻叶绿体DNA是以5.7kb的Eco RI到Xho I的片断表示的，这个片断是定位在叶绿体基因组的反向重复区域中。双箭头表示的区域对应于Southern和Northern杂交分析中所用的探针。黑框从左到右分别指示的是，psbA的外显子5，5S核糖体RNA和23S核糖体RNA 基因。发明详述

[0070]本发明提供了在质体中，特别是在植物叶绿体中表达功能性多肽，包括功能性蛋白复合物的组合物和方法，以及促进多聚核苷酸在植物叶绿体和原核生物之间穿梭和允许被编码的多肽在叶绿体和原核生物中表达的组合物。在一种具体实施方案中，本发明的方法通过表达功能性抗体来例示，所述抗体包括正确地组装并且可以特异性地结合抗原的单链抗体，以及作为单链表达并且可以特异性地联合形成特异性地结合抗原的同源二聚体的抗体及其抗原结合片断。

[0071]根据本发明的一种方法，编码所述抗体的多聚核苷酸与一个5’ 端非翻译区(5’UTR)有效连接，所述的非翻译区包括指导所述抗体在叶绿体中翻译的核糖体结合序列(RBS)。在另外一个具体实施方案中，编码所述抗体的多聚核苷酸与一个指导在原核细胞中的翻译的第一RBS，以及一个指导在叶绿体中的翻译的第二RBS有效连接。在又另外一个具体实施方案中，编码所述抗体的多聚核苷酸具有叶绿体密码子使用偏好性。

[0072]根据本发明的另外一种方法，将合成的多聚核苷酸导入细胞，所述的合成的多聚核苷酸包括编码至少第一多肽的至少第一核苷酸序列，其中所述的第一核苷酸序列中至少一个密码子具有叶绿体密码子使用偏好性，被编码的多肽可以在细胞中被表达。在一种具体实施方案中，所述的第一核苷酸序列中每个密码子都具有叶绿体密码子使用偏好性，在另外一个具体实施方案中，所述的合成的多聚核苷酸含有至少一个第二核苷酸序列，所述第二核苷酸序列可以但并不一定与第一核苷酸序列有效连接，而且所述第二核苷酸序列编码至少一种第二多肽，其中所述多聚核苷酸的表达可以但并不一定生成包括所述第一和第二(或者更多)多肽的融合蛋白。因此，本发明提供合成的多聚核苷酸，它包括编码至少第一多肽的至少第一核苷酸序列，其中所述的第一核苷酸序列中至少一个密码子具有叶绿体密码子使用偏好性。这里使用的名词“合成的多聚核苷酸”意指经过修饰的核酸分子，其中多肽中不具有叶绿体密码子使用偏好性的密码子被改变为具有叶绿体密码子使用偏好性的密码子(参见表1，如下)。如在此所公开的，由这样的合成的多聚核苷酸编码的多肽在叶绿体中的表达强烈。

[0073]在其它具体实施方案中，提供了实践本发明的方法的组合物。由本发明提供的优点包括可以使功能性多肽在植物叶绿体中强烈表达的能力，其中多肽还不会被糖基化，因此当施用于个体时抗原性会降低，另外还能在不需要发酵设备以及相关花费的情况下生产出大量的功能性多肽。

[0074]本发明的方法提供了在植物叶绿体中表达一种或者多种多肽的手段，这样所述多肽可以组装产生功能性蛋白复合物。如在此公开的，叶绿体中表达的多肽不仅可以正确组装，而且当这些多肽包括一个蛋白复合物的亚基时，这些多肽可以特异性地联合生成功能性蛋白复合物。这里用到的术语“蛋白复合物”意指通过至少两个多肽的特异性联合而形成的组合物，所述多肽可以相同也可以不同。能够特异性地联合起到蛋白复合物的功能的多肽是已知的，包括酶、生长因子和激素受体，以及类似物。

[0075]这里用到的术语“特异性联合”或者“特异性相互作用”或者 “特异性结合”意指两个或者更多多肽形成在生理条件下相对稳定的复合体。这里用到的术语可以是指各种相互作用，包括，例如第一多肽亚基和第二多肽亚基的相互作用，通过这种相互作用可以形成功能性蛋白复合物，以及抗体和它的抗原之间的相互作用。特异性的相互作用可以通过至少为大约1×10-6M的解离常数来表征，一般是至少大约1×10-7M，常常是至少大约1×10-8M，特别情况下是至少大约1×10-9 M或者1×10-10M或更大。特异性的相互作用一般在生理条件下是稳定的，所述生理条件包括活体细胞中的条件或者亚细胞区室中的条件，所述活体包括植物或者动物，其中动物可以是脊椎动物或者无脊椎动物，以及在细胞培养中用到的条件，比如用于维持某种生物的细胞或者组织的条件。检测两个分子是否特异性地相互作用的方法是已知的，包括例如平衡透析，表面质体共振，凝胶阻滞分析，以及类似的方法。

[0076]本发明的方法可以用于产生功能性的多肽，包括功能性蛋白复合物，这种用途通过功能性抗体的产生在此例示。这里广泛使用的术语“抗体”意指可以特异性地结合抗原的抗原决定部位的多肽或者蛋白复合物。一般地，抗体含有至少一个抗原结合结构域，这个结构域是由重链可变区结构域和轻链可变区结构域，特别是高度可变区联合形成的。根据本发明中的方法生成的抗体可以是基于自然发生的抗体，比如二价抗体，它含有可以通过第一重链和轻链可变区和第二重链和轻链可变区形成的两个抗原结合结构域(例如，IgG或者IgA同型)，或者通过第一重链可变区和第二重链可变区形成的两个抗原结合结构域(VHH抗体；参见，比如美国专利号6,005,079)，或者是基于非自然发生的抗体，包括比如，单链抗体，嵌合抗体，双功能抗体，人类化的(humanized)抗体，以及抗体的抗原结合片断，比如Fab片断， Fd片断，Fv片断，以及类似物。

[0077]在一种具体实施方案中，本发明的方法用编码包括重链和与之有效连接的轻链的单链抗体的多聚核苷酸来例示，其中所述抗体特异性地结合破伤风毒素(参见SEQ ID NO：13和14)。在另外一种具体实施方案中，本方法是用编码包括重链和与之有效连接的轻链的单链抗体的多聚核苷酸来例示，其中所述抗体特异性地结合单纯疱疹病毒1 型和2型，而且其中编码所述抗体的多聚核苷酸具有叶绿体密码子使用偏好性(参见SEQ ID NO：15和16；SEQ ID NO：42和43；SEQ ID NO：47和48；也请参见实施例3)。

[0078]用于实践本发明的方法的多聚核苷酸可以从产生感兴趣的抗体的细胞中分离，比如，来自免疫个体的B细胞或者来自接触过特定抗原的个体，也可以应用已知的多聚核苷酸合成方法从头合成，还可以通过重组方法产生，或者可以例如通过筛选编码可变重链和可变轻链的多聚核苷酸的组合文库来获得(参见Huse等，Science 246：1275-1281(1989)，这篇文献在此整入以供参考)，而且所述多聚核苷酸可以具有叶绿体密码子使用偏好性，如果需要的话(参见实施例1和表1)。制备编码例如嵌合、人化、CDR移植、单链和双功能抗体的多聚核苷酸的这些方法和其它方法对于本领域技术人员来说是广为人知的(Winter和Harris，Immunol.Today 14：243-246，1993；Ward 等，Nature 341：544-546，1989；Harlow和Lane，Antibodies：A laboratory manual(Cold Spring Harbor Laboratory Press，1988)；Hilyard等，Protein Engineermg：A practical approach(IRL Press 1992)；Borrabeck，Antibody Engineering，第二版(Oxford University Press 1995)；每篇都在此整入以供参考)。

[0079]举个例子，编码人化的单克隆抗体的多聚核苷酸可以这样来获得，将编码鼠免疫球蛋白重链和轻链可变区的互补决定区域的核苷酸序列转移到人类的可变结构域基因中，然后在鼠的相应的框架区域中替换人类的残基。用于克隆鼠免疫球蛋白可变结构域的一般技术是已知的(参见，比如，Orlandi等，Proc.Natl.Acad.Sci.，USA 86：3833，1989，这篇文献在此整入以供参考)，制备人化单克隆抗体的方法也是已知的(参见，比如，Jones等，Nature 321：522，1986；Riechmann等，Nature 332：323，1988；Verhoeyen等，Science 239：1534，1988；Carter等，Proc. Natl.Acad.Sci.，USA 89：4285，1992；Sandhu，Crit.Rev.Biotechnol.12：437， 1992；和Singer等，J.Immunol.150：2844，1993；每篇文献都在此整入作为参考)。

[0080]本发明的方法还可以应用编码从组合免疫球蛋白文库中分离出的人类抗体片断的多聚核苷酸来实践(参见，比如，Barbas等，Methods： A Companion to Methods in Immunology 2：119，1991；Winter等，Ann.Rev. Immunol.12：433，1994；每篇文献都在此整入以供参考)。用于产生人类免疫球蛋白噬菌体文库的克隆载体和表达载体可以通过例如从 Stratagene Cloning Systems(加尼福利亚州，拉霍亚)获得。

[0081]编码人类单克隆抗体的多聚核苷酸还可以例如从转基因鼠中获得，所述的转基因鼠已经过遗传工程改造，可以产生响应抗原反应的特异性人类抗体。在这种技术中，人类的重链和轻链基因座的元件被导入到鼠的株系中，所述株系是来自于内源重链和轻链基因座被靶向破坏的胚胎干细胞系。这种转基因鼠可以合成针对人体抗原的特异性人体抗体，而且这种鼠可以用来产生分泌人体抗体的杂交瘤，从中可以获得用于实践本发明的方法的多聚核苷酸。从转基因鼠中获得人类抗体的方法在如下文献中描述过，比如Green等，Nature Genet.7：13， 1994；Lonberg等，Nature 368：856，1994；和Taylor等，Intl.Immunol. 6：579，1994；每篇文献都在此整入以供参考，而且这样的转基因鼠是可以通过商业渠道获得的(Abgenix公司；加尼福利亚州，佛利蒙)。

[0082]所述的多聚核苷酸也可以是编码抗体的抗原结合片断的多聚核苷酸。抗原结合片断，包括，比如Fv，Fab，Fab’，Fd，和F(ab’)2 片断，这些都是本领域所熟知的，而且最初都是通过抗体的蛋白酶水解而鉴定出的。例如，抗体片断可以通过传统的胃蛋白酶和木瓜蛋白酶水解整个抗体得到。用胃蛋白酶酶解得到的抗体片断产生一个5S的片断，被称为F(ab’)2片断。这种片断可以进一步用一种巯基还原试剂剪切，对于由二硫键连接的切割而产生的巯基还可以选择地使用封闭基团，这样便产生一个3.5S的Fab’单价片断。作为选择，可以用胃蛋白酶进行酶切割，直接产生两个Fab’单价片断和一个Fc片断(参见，比如，Goldenberg，美国专利号4,036,945和美国专利号4,331,647，每一个都在此整入以供参考；Nisonhoff等，Arch.Biochem.Biophys.89：230. 1960；Porter，Biochem.J.73：119，1959；Edelman等，Meth.Enzymol.1：422 (Academic Press 1967)；Coligan等，在Curr.Protocols Immunol.1992，参见2.8.1-2.8.10和2.10.1-2.10.4；每篇文献都在此整入以供参考)。

[0083]抗体片断的另外一种形式是编码单个互补决定区(CDR)的肽。 CDR肽可以通过构建编码感兴趣的抗体的CDR的多聚核苷酸来获得，比如通过聚合酶链式反应由产生抗体的细胞的RNA来合成所述的可变区(参见，比如，Larrick等，Methods：A Companion to Methods in Enzymology 2：106，1991，这篇文献在此整入以供参考)。编码这样的抗体片断——包括这些片断的亚基和连接例如重链可变区和轻链可变区的连接肽——的多聚核苷酸可以通过化学合成方法或者常规的重组 DNA方法来制备，这样的制备可以从按如前所述的方法获得的编码全长重链和轻链的多聚核苷酸起始。

[0084]本方法部分地基于这样的事实，即核糖体结合序列(RBS)相对于编码序列的正确定位能导致这段编码序列在植物叶绿体中强烈地翻译(参见下面的内容；也参见实施例2)，那些当在生物体内自然生成时已知会特异性地联合形成蛋白复合物的多肽(例如抗体)也可以在叶绿体中正确联合(参见实施例3)。在叶绿体中表达这样的多肽的一个优点是这样表达出来的多肽不会像由核基因表达出来的多肽一样经过一些细胞区室，这样也就不会发生某些翻译后修饰比如糖基化。同样，通过本发明的方法产生的多肽或者蛋白复合物可以具有较从导入到真核生物细胞核的多聚核苷酸中表达出来的同样的多肽更低的抗原性。

[0085]本发明的方法提供了产生功能性多肽和蛋白复合物的手段，前者例如单链抗体，后者例如二价抗体，包括比如第一重链和轻链以及与其联合的第二重链和轻链。如在此所公开的，本发明的方法可以这样来实施，比如，向叶绿体中导入重组核酸分子，其中所述重组核酸分子包括编码至少一个多肽(即，1，2，3，4或更多)的第一多聚核苷酸和与之有效连接的第二多聚核苷酸，所述第二多聚核苷酸包括编码第一RBS的核苷酸序列和与之有效连接的编码第二RBS的核苷酸序列，所述导入的条件允许所述的至少一种多肽的表达。这样的条件包括允许或者有利于所述重组核酸分子进入叶绿体的条件，优选地，是将所述重组核酸分子整合到叶绿体基因组中的条件。这样的方法包括在此列举的方法，以及在本领域已知的常规的其它方法。

[0086]在这里使用的术语“有效连接”意指两个或者更多个分子被相对彼此定位，这样它们可以作为一个单一的单位看待，而且表现出来的功能是具备其中一个或者两个分子或者它们的组合的特性。例如，编码多肽的多聚核苷酸可以与转录调控元件或者翻译调控元件有效连接，这种情况下，所述元件对于所述多聚核苷酸的调控作用就如同它们在细胞中调控与它们正常相连的多聚核苷酸序列一样。一个第一多聚核苷酸编码序列可以与一个第二(或者更多)编码序列有效连接，这样一个嵌合多肽就可以从该有效连接的编码序列中表达出来(参见，比如，SEQ ID NO：30，其显示了编码GFP并且具有叶绿体密码子使用偏好性的多聚核苷酸(即，SEQ ID NO：1)插入到PsbD基因中的位点，这样一种包含了融合有GFP的PsbD基因产物的荧光融合蛋白便产生了)。所述嵌合多肽可以是融合多肽，其中被编码的两个(或者更多) 肽被翻译成单个多肽，即通过肽键共价相连，例如，包括(通过连接肽，如果需要的话)有效连接的重链可变区和轻链可变区的单链抗体；或者可以翻译成两个独立的多肽，然后在翻译之后可以特异性地互相联合形成稳定的蛋白复合物，例如，抗体的重链和轻链，它形成四级结构，得到功能性的单价抗体，这种单价抗体可以进一步联合形成功能性的二价抗体。编码这样的融合蛋白的合成的多聚核苷酸的例子包括SEQ ID NO：45，它编码细菌荧光素酶融合蛋白，以及SEQ ID NO：15， 42和47，它们编码单链抗HSV抗体。

[0087]在这里被广泛使用的术语“多聚核苷酸”或者“核苷酸序列” 或者“核酸分子”意指由两个或者多个脱氧核糖核苷酸或者核糖核苷酸通过磷酯键连接起来的序列。这样，这些术语包括RNA和DNA，可以是一个基因或者是基因的一部分，还包括cDNA，合成的多聚脱氧核糖核苷酸序列，或者类似的分子，而且可以是单链或者双链，也可以是DNA/RNA杂交分子。进一步，这里用到的这些术语包括自然发生的核酸分子，它们可以从细胞中分离，也包括合成的多聚核苷酸，它们可以比如通过化学合成的方法或者酶学方法如聚合酶链式反应 (PCR)来制备。需要注意的是，这里所用的不同术语只不过是为了讨论的方便，比如为了区分一个组合物的不同组分，作为例外的是在此用到的术语“合成的多聚核苷酸”，它是专指经过修饰之后具有叶绿体密码子使用偏好性的多聚核苷酸。

[0088]一般地，组成多聚核苷酸的核苷酸包括自然发生的脱氧核糖核苷酸，比如连接到2’脱氧核糖上的腺嘌呤，胞嘧啶，鸟嘌呤或者胸腺嘧啶，或者核糖核苷酸，比如连接到核糖上的腺嘌呤，胞嘧啶，鸟嘌呤或者尿嘧啶。然而，根据用途的不同，多聚核苷酸还可以含有核苷酸类似物，这些类似物包括非自然发生的合成的核苷酸或者经过修饰的自然发生的核苷酸。核苷酸类似物在本领域是已熟知的，而且可以从商业途径获得(比如Ambion公司；Austin TX)，含有这样的核苷酸类似物的多聚核苷酸也是如此(Lin等，Nucl.Acids Res.22：5220-5234， 1994；Jellinek等，Biochemistry 34：11363-11372，1995；Pagratis等，Nature Biotechnol.15：68-73，1997，每篇文献都在此整入以供参考)。多聚核苷酸中连接核苷酸的共价键一般都是磷酯键。然而，根据多聚核苷酸被应用的目的，所述共价键也可以是其它很多种键中的一种，包括硫酯键，硫代磷酯键，肽类似键或者任何其它本领域已知的可以连接核苷酸生成合成的多聚核苷酸的键(参见，比如，Tam等，Nucl.Acids Res. 22：977-986，1994；Ecker和Crooker，Biotechnology 13：351360，1995，每篇文献都在此整入以供参考)。

[0089]含有自然发生的核苷酸和磷酯键的多聚核苷酸可以化学合成，或者可以利用合适的多聚核苷酸作为模板通过重组DNA方法制备。与此相比，含有核苷酸类似物或者非磷酯键的共价键的多聚核苷酸一般需要通过化学合成制备，尽管诸如T7聚合酶的酶也可以将某些类型的核苷酸类似物整合到多聚核苷酸中，并因此可以用来由合适的模板通过重组方法制备这样的多聚核苷酸。

[0090]这里使用的术语“重组核酸分子”意指通过人为介入来操作的多聚核苷酸。重组核酸分子可以包含两个或者多个核苷酸序列，它们被连接起来形成在自然界的细胞中没有被发现的产物。特别地，所述两个或者多个核苷酸序列可以有效连接，而且可以例如编码一个融合多肽，或者可以包含编码核苷酸序列和调控元件，特别地，所述调控元件指有效连接的第一RBS和第二RBS。重组核酸分子也可以基于自然发生的多聚核苷酸，但是经过操作之后，它们与自然发生的多聚核苷酸有所不同，例如其中有一个或者多个核苷酸发生变化，这样在这个多聚核苷酸中正常出现的第一密码子具有了叶绿体密码子使用偏好性，或者感兴趣的序列被导入到所述多聚核苷酸中，例如限制性内切酶识别位点或者剪接位点，启动子，DNA复制原点，或者类似的序列。

[0091]如在此所公开的，RBS定位在起始密码子比如AUG密码子的上游(5’)大约20到40个核苷酸使得起始于该AUG密码子的编码序列可以强烈地翻译(参见实施例2)。这样，定位于AUG密码子上游大约20到40个核苷酸位置的RBS可以被认为是与所述AUG密码子 “有效连接”。进一步，已经知道的是，定位在起始密码子上游大约5 到15个核苷酸位置的RBS可以指导编码序列在原核生物中的翻译，而且如在此公开的，这样的RBS可以与定位在起始密码子上游大约20 到40个核苷酸位置的第二RBS有效连接，这样得到的翻译调控元件可以指导编码序列在原核生物和叶绿体中的翻译。这样，第一和第二 RBS被大约5到25个核苷酸分开，它们也被认为是有效连接的。需要注意的是，这里使用的术语“第一”，“第二”，“第三”等等是指一个RBS或者多聚核苷酸或者多肽，或类似物，这些术语的使用只是为了讨论的方便，除非特别指明，否则不暗指任何顺序或者重要性或者类似的意思。同样地，例如谈到可以指导在原核生物中的翻译的第一RBS和可以指导在叶绿体中的翻译的第二RBS时，这里使用的“第一”、“第二”(或者类似的名称)只是为了便于区分这两个(或者更多个)元件而已。

[0092]对于RBS具有“指导翻译”的能力，这是指当它与通常以起始密码子起始的编码序列有效连接时，所述RBS可以与核糖体结合，这样翻译就可以从所述起始密码子处开始。这里使用的术语“起始密码子”是指作为编码序列的第一个密码子的核糖核苷酸序列或者编码脱氧核糖核苷酸序列。一般地，起始密码子是一个“起始AUG密码子” (在RNA中)或者一个“起始ATG密码子”(在DNA中)，它编码一个甲硫氨酸，尽管其它的密码子也可以作为起始密码子，包括例如 CUG。

[0093]可以使编码多聚核苷酸的一个或者多个密码子表现出叶绿体的密码子使用偏好(实施例1)。大多数氨基酸由两个或者更多个不同的(简并)密码子编码，而且已经知道的是，不同的生物利用某些密码子相对于其它密码子来说具有优先性。这种优选的密码子使用也被叶绿体采用，这也就是这里提到的“叶绿体密码子使用”。表1(下面) 显示的是莱茵衣藻的叶绿体密码子使用。

[0094]当术语“被倾向于(biased)”被用来形容一个密码子的时候，它是指多聚核苷酸中一个密码子的序列已经被改变，使得该密码子成为在叶绿体中优选使用的密码子(参见表1)。被倾向于叶绿体的密码子使用的多聚核苷酸可以从头合成，或者可以应用常规的重组DNA技术进行遗传修饰得到，比如通过位点专一性突变方法来改变一个或者多个密码子使得它们具有叶绿体密码子使用偏好性(参见实施例1)。如在此公开的，叶绿体的密码子偏好在不同植物之间可能有些差别，比如藻类的叶绿体与烟草的叶绿体相比。一般地，根据本发明的目的 ——包括例如在制备在此公开的合成的多聚核苷酸时——所选择的叶绿体密码子偏好要反映出某种植物叶绿体的密码子使用，包括这样一种密码子偏好，即一个密码子的第三个位置偏向于A/T，例如，第三个位置具有超过大约66％的AT偏好，特别地，具有超过大约70％的AT 偏好。这样，根据本发明的目的而偏好的叶绿体密码子排除了例如在 Nicotiana tabacus(烟草)观察到的第三位偏好，其在密码子的第三位上具有34.56％的GC偏好(参见，例如，万维网URL “kazusa.or.jp/codon/”，和其中的“叶绿体”链接)。在一种具体实施方案中，所述叶绿体密码子使用偏好性是藻类叶绿体密码子使用的偏好性，比如莱茵衣藻，其叶绿体的密码子第三位上具有74.6％的AT偏好。                       表1
           莱茵衣藻中的叶绿体密码子使用
UUU 34.1*(348**) UCU 19.4(198)    UAU 23.7(242)    UGU 8.5(87)
UUC 14.2(145)      UCC 4.9(50)      UAC 10.4(106)    UGC 2.6(27)
UUA 72.8(742)      UCA 20.4(208)    UAA 2.7(28)      UGA 0.1(1)
UUG 5.6(57)        UCG 5.2(53)      UAG 0.7(7)       UGG 13.7(140)
CUU 14.8(151)      CCU 14.9(152)    CAU 11.1(113)    CGU 25.5(260)
CUC 1.0(10)        CCC 5.4(55)      CAC 8.4(86)      CGC 5.1(52)
CUA 6.8(69)        CCA 19.3(197)    CAA 34.8(355)    CGA 3.8(39)
CUG 7.2(73)        CCG 3.0(31)      CAG 5.4(55)      CGG 0.5(5)
AUU 44.6(455)      ACU 23.3(237)    AAU 44.0(449)    AGU 16.9(172)
AUC 9.7(99)        ACC 7.8(80)      AAC 19.7(201)    AGC 6.7(68)
AUA 8.2(84)        ACA 29.3(299)    AAA 61.5(627)    AGA 5.0(51)
AUG 23.3(238)      ACG 4.2(43)      AAG 11.0(112)    AGG 1.5(15)
GUU 27.5(280)      GCU 30.6(312)    GAU 23.8(243)    GGU 40.0(408)
GUC 4.6(47)        GCC 11.1(113)    GAC 11.6(118)    GGC 8.7(89)
GUA 26.4(269)      GCA 19.9(203)    GAA 40.3(411)    GGA 9.6(98)
GUG 7.1(72)        GCG 4.3(44)      GAG 6.9(70)      GGG 4.3(44)
*每1000个密码子中某个密码子的使用频率。
**在36个叶绿体编码序列(10193个密码子)中观察到的次数。

[0095]本发明的方法可以应用编码一个第一多肽和至少一个第二多肽的多聚核苷酸来实施。这样，所述多聚核苷酸可以编码比如一个第一多肽和一个第二多肽；一个第一多肽，一个第二多肽和一个第三多肽；等等。进一步，任何一个或者所有被编码的多肽可以相同也可以不同。如在此公开的，在微藻莱茵衣藻的叶绿体中表达的多肽装配形成功能性多肽和蛋白复合物(参见实施例1和3)。这样，本发明的方法提供了一种生产功能性蛋白复合物的手段，所述蛋白复合物包括例如二聚体，三聚体和四聚体，其中所述复合物的亚基可以相同或者不同(例如分别是同源二聚体或者异源二聚体)。在叶绿体中表达功能性多肽和蛋白复合物的方法通过抗体的生产以及报告蛋白的生产来例示，所述报告蛋白包括绿色荧光蛋白和荧光素酶(luxAB融合蛋白；参见实施例1和4；也可分别参见SEQ ID NOS：1和45)，抗体可以从具有叶绿体密码子使用偏好性的多聚核苷酸表达出来(参见实施例3，也可参见SEQ ID NOS：15，42和47)。如在此例示的，叶绿体用重组核酸分子进行转染，所述重组核酸分子包括编码一个单链抗体的多聚核苷酸，所述的单链抗体具有一个连接到轻链可变区上的完整重链，而由此生成了包括两个单链抗体的同源二聚体，所述两个单链抗体通过其重链结构域之间的特异性相互作用联合在一起。这些结果提供了证明异源多肽可以在叶绿体中特异性地联合形成四级结构的证据，并证明了异源多聚体可以通过本发明的方法来产生，通过向叶绿体中导入编码所述异源多聚体的各个不同的多肽的单个重组核酸分子，或者导入两个或者多个多聚核苷酸，其中的每一个编码所述异源多聚体的一个(或者多个)亚基。

[0096]本发明的方法可以应用一个第一重组核酸分子来实施，所述重组核酸分子包括编码指导在叶绿体中的翻译的RBS的核苷酸序列，优选地，这段核苷酸序列还进一步编码有效连接的指导在原核生物中的翻译的RBS，所述核苷酸序列与编码至少第一多肽的至少一个多聚核苷酸有效连接。例如，所述重组核酸分子可以包括编码免疫球蛋白重链(H)或者其可变区(VH)的多聚核苷酸，还可以进一步编码第二多肽，所述第二多肽是免疫球蛋白轻链(L)或者其可变区(VL)。如果需要的话，编码内在核糖体进入位点的核苷酸序列可以定位于编码H 链和L链的核苷酸序列之间，这样有助于被编码的第二(下游)多肽的表达。被编码的H链和L链在叶绿体中被翻译出来之后，一个H链可以与一个L链联合形成一个单价抗体(比如一个H:L复合体)，而两个H:L复合体可以进一步联合形成一个二价抗体。

[0097]本发明的方法也可以这样来实践，向植物叶绿体中导入第一重组核酸分子，所述第一重组核酸分子包括编码例如一个H链或者VH 链的多聚核苷酸，再进一步向所述叶绿体导入第二重组核酸分子，所述第二重组核酸分子包括编码一个L链或者VL链的多聚核苷酸，其中每个重组核酸分子都包括编码第一RBS的核苷酸序列和与之有效连接的编码第二RBS的核苷酸序列，其中所述第一RBS可以指导多肽在原核生物中的翻译，而所述第二RBS可以指导多肽在叶绿体中的翻译，其中编码这两个RBS的核苷酸序列与所述的编码多聚核苷酸序列有效连接。当含有所述叶绿体的植物细胞暴露于允许被编码的多肽共表达的条件时，H链和L链可以联合形成H:L复合体，然后H:L复合体可以进一步联合产生二价抗体。

[0098]包含有编码多肽的多聚核苷酸的重组核酸分子可以进一步包含肽标记物比如His-6标记或者类似的标记，所述标记与所述编码序列有效连接，有助于鉴定所述多肽在细胞中的表达。例如His-6的多组氨酸标记肽可以用二价阳离子比如镍离子，钴离子或者类似的离子检测。其它的肽标记包括，例如，FLAG表位，它可以通过抗FLAG抗体来检测(参见，比如，Hopp等，BioTechnology 6：1204(1988)；美国专利号 5,011,912，每篇文献都在此整入以供参考)；c-myc表位，它可以用特异性地针对该表位的抗体来检测；生物素，它可以用链亲和素或者亲和素来检测；以及谷胱甘肽S转移酶，它可以用谷胱甘肽来检测。这样的标记可以提供一些额外的优点，例如，它们有助于与之有效连接的多肽的分离，如果希望获得基本上纯化的多肽的话。

[0099]本发明的方法中用到的重组核酸分子可以包含在载体中。进一步，如果这种方法用到第二(或者更多)重组核酸分子，那么所述的第二重组核酸分子也可以包含在载体中，该载体可以但并不一定与含有第一重组核酸分子的载体相同。所述载体可以是任何一种用于向叶绿体中导入多聚核苷酸的载体，优选地，所述载体含有一段叶绿体基因组DNA的核苷酸序列以便于与叶绿体基因组发生同源重组，比如一段包含有叶绿体基因组DNA中400到1500或者更多个连续核苷酸的核苷酸序列。叶绿体载体和选择叶绿体基因组上的某些区域作为载体的方法是已熟知的(参见，比如，Bock，J.Mol.Biol.312：425-438，2001；也可参见Staub和Maliga，Plant cell 4：39-45，1992；Kavanagh等， Genetics 152：1111-1122，1999，每篇文献都在此整入以供参考)。

[0100]莱茵衣藻的整个叶绿体基因组是可以通过万维网上的公共数据库获取，其URL地址为 “biology.duke.edu/chlamy_genome/chloro.html”(参见“以文本文件格式查看完整基因组”链接和“叶绿体基因组图谱”链接)，这里的每一篇文献都在此整入以供参考(J.Maul，J.W.Lilly，和D.B.Stern，未发表结果；在2002年1月28日修改；将要以GenBank注册号AF396929 发表)。一般地，被选择的叶绿体基因组DNA的核苷酸序列都不是基因的一部分，包括不是调控序列或者编码序列，特别地，如果由于同源重组导致基因被破坏，从而会对叶绿体造成破坏性的影响，比如影响叶绿体基因组的复制，或者会对含有叶绿体的植物细胞造成破坏性影响，那么，被选择的叶绿体基因组DNA的核苷酸序列不能是这样的基因的一部分。基于这种考虑，公布了莱茵衣藻叶绿体基因组序列的网站也提供了显示叶绿体基因组的编码区和非编码区的图谱，因此有助于挑选出可用于构建本发明的载体的序列。例如，在此所公开的实验中用到的叶绿体载体p322是一个从位置大约是143.1kb的Eco(Eco RI)位点延伸到位置大约是148.5kb的Xho(Xho I)位点的克隆(参见万维网，URL地址为“biology.duke.edu/chlamy genome/chloro.html”，点击“叶绿体基因组图谱”链接，然后再点击“140-150kb”链接；也可以直接通过万维网URL “biology.duke.edu/chlamy/chloro/chloro140.html”进入；也参见实施例 1)。

[0101]所述载体还可以包含一些额外的有助于载体的应用或者操作的核苷酸序列，比如，一个或者多个转录调控元件，编码选择性标记的序列，一个或者多个克隆位点，以及类似的序列。在一个具体实施方案中，所述叶绿体载体含有原核生物的复制原点(ori)，比如，大肠杆菌的ori，从而提供了可以在原核宿主细胞和叶绿体之间转移和操作的穿梭载体。

[0102]本发明的方法通过使用微藻莱茵衣藻来说明。根据本发明的方法，使用微藻来表达多肽或者蛋白复合物的优点是可以这种微藻可以大量培养，包括商业上的渠道(Cyanotech公司；Kailua-Kona HI)，从而可以生产和分离出大量所需要的产品，如果需要的话。然而，任何植物都可以在叶绿体中表达例如功能性哺乳动物多肽包括蛋白复合物的能力也允许这样的植物可以大量种植，因此也可以方便地产生大量的多肽。因此，本发明的方法可以用任何一种含有叶绿体的植物来实践，包括，比如，巨藻如海洋藻类和海草，以及生长在土壤中的植物，比如谷物(玉米(Zea mays))，白菜(比如B.napus，B.rapa，B. juncea)，特别是那些用于生产植物油的品种，苜蓿(Medicago sativa)，水稻(Oryza sativa)，黑麦(Secale cereale)，高粱(Sorghum bicolor， Sorghum vulgare)，玉蜀黍(比如，珍珠黍(Pennisetum glaucum)，稷黍(Panicum miliaceum)，狐尾草(Setaria italica)，手指黍(Eleusine coracana))，向日葵(Helianthus annuus)，红花(Carthamus tinctorius)，小麦(Triticum aestivum)，大豆(Glycine max)，烟草(Nicotiana tabacum)，马铃薯(Solanum tuberosum)，花生(Arachis hypogaea)，棉花(Gossypium barbadense，Gossypium hirsutum)，甜马铃薯(Ipomoea batatus)，木薯(Manihot esculenta)，咖啡(Cofea spp.)，椰子(Cocos nucifera)，菠萝(Ananas comosus)，柑橘树(Citrus spp.)，可可树 (Theobroma cacao)，茶(Camellia sinensis)，香蕉(Musa spp.)，鳄梨树(Persea ultilane)，无花果(Ficus casica)，番石榴(Psidium guajava)，芒果(Mangifera indica)，橄榄木(Olea europaea)，番木瓜(Carica papaya)，腰果(Anacardium occidentale)，夏威夷核果 (Macadamia integrifolia)，杏仁果(Prunus amygdalus)，糖用甜菜 (Beta vulgaris)，甘蔗(Saccharum spp.)，燕麦，浮萍(Lemna)，大麦，番茄(Lycopersicon esculentum)，莴苣(比如Lactuca sativa)，绿豆(Phaseolus vulgaris)，利马豆(Phaseolus limensis)，豌豆(Lathvrus spp.)，以及瓜类比如黄瓜(C.sativus)，香瓜(C.cantalupensis)，麝香瓜(C.melo)。观赏类植物也可以包括在内，比如杜鹃花 (Rhododendron spp.)，八仙花(Macrophylla hydrangea)，芙蓉(Hibiscus rosasanensis)，玫瑰(Rosa spp.)，郁金香(Tulipa spp.)，水仙花(Narcissus spp.)，矮牵牛花(Petunia hybrida)，康乃馨(Dianthus caryophyllus)，猩猩木(Euphorbia pulcherrima)，和菊花。另外一些可以用于实践本发明的方法的观赏类植物包括凤仙花，秋海棠，天竺葵，堇菜，樱草，马鞭草，长春花，万寿菊，樱草属的植物，圣保罗花，藿香，苋， Antihirrhinum，毛莨，菊，苜蓿，科兹莫花，豇豆，大丽花，曼陀罗花，翠雀花，大丁草，剑兰，大岩桐，孤挺花，松叶菊，蛾蝶花，以及鱼尾菊。针叶类树木也可以用于实践本发明中的方法，比如包括，松树如火炬松(Pinus taeda)，爱氏松(Pinus elliotii)，美国黄松(Pinus ponderosa)，梁木松(Pinus contorta)，以及辐射松(Pinus radiata)，花旗松(Pseudotsuga menziesii)；西洋松科常青树(Tsuga ultilane)；云杉(Picea glauca)；美国杉树(Sequoia sempervirens)；冷杉如银杉(Abies amabilis)和橡胶杉(Abies balsamea)；以及杉树如西洋红杉(Thuja plicata)和阿拉斯加黄杉(Chamaecyparis nootkatensis)。

[0103]可以用于实践本发明的方法的豆科植物包括豆类植物和豌豆。豆类植物包括瓜尔豆，刺槐豆，葫芦巴，大豆，花园豆，豇豆，绿豆，蚕豆，扁豆，鹰嘴豆，等等。豆科植物包括但并不限于，落花生比如花生，巢菜属比如小冠花，毛叶苕子，小豆，绿豆，以及鹰嘴豆，羽扇豆属比如羽扇豆，三叶草，菜豆属比如菜豆和利马豆，豌豆属比如野豌豆，草本樨属比如丁香，苜蓿属比如苜蓿，莲属，比如车轴草，小扁豆属，比如小扁豆，假靛蓝。在本发明的方法中使用的优选的草料草和草地草包括苜蓿，田园草，高羊茅，多年生黑麦草，匍匐性本特草，以及小糠草。可以用于本发明的其它植物包括洋槐，香草，洋蓟，黄花南芥菜，黑草莓，油菜，芫荽叶，地中海早橘，菊苣，桉树，茴香，葡萄柚，哈密瓜，豆薯，猕猴桃，柠檬，酸橙，蘑菇，坚果，秋葵，橘子，欧芹，柿子，大蕉，石榴，白杨，辐射松，紫叶菊苣，南方松，枫香，橘，小黑麦，葡萄树，山药，苹果，梨树，温柏树，樱桃，杏树，甜瓜，大麻，荞麦，葡萄，树莓，藜，蓝草莓，油桃，桃，李子，草莓，西瓜，茄子，胡椒，花椰菜，白菜属，比如椰菜，大白菜，鳄梨苗，洋葱，胡萝卜，韭菜，甜菜，蚕豆，旱芹，萝卜，南瓜，菊苣，葫芦，大蒜，四季豆，菠菜，葫芦瓜，芜箐甘蓝，鳄梨，生菜，落花生和青瓜。

[0104]本发明的方法可以获得含有经过遗传修饰之后含有被稳定整合的多聚核苷酸的叶绿体的植物(即，转质体(transplastomes)；参见，比如，Hager和Bock，Appl.Microbiol.Biotechnol.54：302-310，2000，这篇文献在此整入以供参考；也可参见，Bock，如上，2001)。所述的被整合的多聚核苷酸可以包括例如与在此定义的第一和第二RBS有效连接的编码多聚核苷酸。因此，本发明进一步提供了转基因(转质体)植物，它含有一个或者多个含有编码一种或者多种异源多肽的多聚核苷酸的叶绿体，所述多肽包括那些可以特异性地联合形成功能性蛋白复合物的多肽。含有转质体的转基因植物与那些将多聚核苷酸整合到核基因组中的转基因植物相比具有一些优势。比如，在大多数作物植物中，叶绿体严格地通过卵细胞母性遗传；而花粉(精子)中则缺乏叶绿体(参见，比如，Hager和Bock，如上，2000)。这样，含有转质体的转基因植物就不能与其他植物发生交叉授粉，包括可能在转基因植物的附近的本地植物，这样就减少了转基因植物的生长可能给环境带来的生态威胁。

[0105]在这里广泛使用的术语“植物”是指一种含有质体特别是叶绿体的真核生物，而且包括处于各个发育时期的这样的生物，或者是指植物的一部分，包括植物插枝，植物细胞，植物细胞系，植物器官，植物种子，植物苗。植物细胞是植物的结构和生理单位，包括原生质体和细胞壁。植物细胞可以是分离的单个细胞的形式或者培养的细胞的形式，或者可以是一个更高级的组织单位的一部分，比如植物组织，植物器官，或者植物。因此，植物细胞可以是原生质体，能生成接合体的细胞，或者是可以再生为一整株植物的细胞或者细胞群。这样，含有多个细胞并可再生成整个植株的种子可以看成是用于本发明的植物细胞。植物组织或者植物器官可以是种子，原生质体，愈伤组织，或者组织成一个结构或者功能单位的任何其它植物细胞群。植物中特别有用的部分包括可收割部分和对子代植物的繁殖有用的部分，比如花，花粉，子叶，块茎，叶，茎，果实，种子，根，以及类似的部分。植物用于繁殖的部分包括比如，种子，果实，插枝，子叶，块茎，根茎，以及类似的部分。

[0106]转基因植物可以由含有经过遗传修饰的叶绿体的转化植物细胞再生。在这里使用的术语“再生”是指从植物细胞、一群植物细胞、原生质体、种子或者植物的一小部分比如愈伤或者组织生长出一整个植株。源自原生质体的再生在不同植物物种之间有所不同。比如，可以制备出原生质体的悬浮物，在某些物种中，可以由所述的原生质体悬浮物诱导胚胎的形成，然后再到成熟、传代。培养基一般含有生长和再生所必需的各种组分，包括比如激素比如植物生长激素和细胞分裂素；以及氨基酸比如谷氨酸和脯氨酸，这些组分取决于特定的植物种类。有效的再生部分地依赖于培养基，基因型，以及培养的历史。然而，如果这些变量被控制，那么再生是可重复的。

[0107]再生可以发生自植物的愈伤组织，外植体，器官或者植物的某部分。可以在器官或者植物部分再生中实施转化。(参见，Meth. Enzymol.第118卷；Klee等，Ann.Rev.Plant Physiol.38：467，1987，这些文献在此整入以供参考)。例如，利用叶盘-转化-再生这种方法，叶盘在选择性培养基上培养，接着在大约两到四周内幼芽形成。生长中的幼芽从愈伤中摘下，并移植到适合于诱导根的选择性培养基中。出根的小苗在根出现之后尽早移植到土壤中。这样的小苗可以根据需要再次移植，直到达到成熟期。

[0108]在营养繁殖作物中，成熟的转基因植物是通过插枝或者组织培养技术产生多个相同植株来实现繁殖的。所需的转基因子 (transgenotes)被选择出来，新的变种可以被获得并且可以用于商业目的的营养繁殖。在种质繁殖作物中，成熟的转基因植物可以自交产生纯合的近交植株。这样得到的近交植株可以产生含有被导入的异源多聚核苷酸的种子，它们可以被培养而得到能够表达由所述多聚核苷酸编码的多肽的植株。这样，本发明进一步提供了由通过本发明的方法获得的转基因植物产生的种子。

[0109]如果需要，本发明的含有经过遗传修饰而可以表达不同的异源多肽的叶绿体的转基因植物可以相互杂交，由此提供了一种获得含有两个或者更多个不同的转基因的转基因植物的手段。植物交配以及选择具有所需特性或者其他感兴趣的特性的杂交植物的方法是在本领域所熟知的。

[0110]在叶绿体或者本发明的转基因植物中生产异源多肽或者蛋白复合物的方法可以进一步包括从植物细胞叶绿体中分离被表达的多肽或者蛋白复合物的步骤。这里使用的术语“分离的”或者“基本上纯化的”是指多肽或者多聚核苷酸以相对去除了在自然状态下与之联系的蛋白质，核酸，脂类，碳水化合物或者其它材料的形式存在。一般地，分离的多肽(或者多聚核苷酸)组成了样本的至少大约20％，通常组成了样本的至少50％，特别情况下是样本的至少大约80％，更特别的情况下是样本的至少大约90％或者95％或者更多。

[0111]这里使用的术语“异源”在一种比较意义上来说是指一段核苷酸序列(或者多肽)来自非参照来源的来源，或者连接到一个在正常情况下不相联系的第二核苷酸序列(或者多肽)上，或者经过修饰之后使得修饰之后的形式是与参照材料非正常相关的。例如，编码抗体的多聚核苷酸序列相对于植物叶绿体的核苷酸序列是异源的，含有例如与第二核苷酸序列有效连接的第一核苷酸序列的重组核酸分子的组分也是异源的，被导入到叶绿体中的突变多聚核苷酸在所述突变多聚核苷酸在正常情况下没有在叶绿体中发现时也是异源的。

[0112]多肽或者蛋白复合物可以利用任何一种适合于特定多肽或者蛋白复合物的方法从叶绿体中分离出来，这些方法包括例如，盐分级分离方法和色谱方法，如利用可以特异性地结合多肽或者蛋白复合物的配体或者受体来进行的亲和色谱方法。用来确定根据本发明的方法产生的多肽或者蛋白复合物已是分离的形式的方法是已熟知的方法，比如进行电泳，鉴定特定的分子为相对独立的条带，或者鉴定特定的复合物为一系列条带。因此，本发明还提供了根据本发明的方法产生的分离的多肽或者蛋白复合物。

[0113]本发明还提供可以单独使用或者组合使用以获得异源多肽在叶绿体中的强烈表达的组合物。在一种具体实施方案中，本发明提供包括(或者编码)第一RBS和第二RBS的核苷酸序列，其中所述第一 RBS和第二RBS在空间上是被分开的，这样一个RBS指导在原核细胞中的翻译，而另外一个RBS可以指导在植物叶绿体中的翻译。在一个方面，所述核苷酸序列还可以包括(或者编码)与所述第一RBS和第二RBS有效连接的起始密码子，比如起始密码子AUG(或者ATG)，或者可以包括克隆位点，其定位允许一段编码序列与所述的第一RBS 和第二RBS有效连接。在另外一个方面，所述核苷酸序列被包含在载体中，所述载体优选含有一段叶绿体基因组DNA的核苷酸序列，使得可以与叶绿体基因组发生位点特异性同源重组。在又另外一个方面，所述载体是穿梭载体，它可以进一步包括原核生物复制原点。

[0114]在另外一个具体实施方案中，利用密码子选择使编码多聚核苷酸偏向于叶绿体密码子使用，从而提供了一种在叶绿体中强烈表达一种或者多种被编码的多肽的手段。利用密码子选择可以优化多肽在叶绿体中的表达，这通过表达水母(Aequeoria victoria)绿色荧光蛋白来例示(GFP；实例1)。这样，本发明还提供编码GFP的多聚核苷酸，其中所述多聚核苷酸已经具有可以在叶绿体中优化表达的密码子。如在此所公开的，变异多聚核苷酸编码可以以一定量表达出来的GFP，这使得它可以用作检测植物叶绿体的试剂，包括检测叶绿体中的基因表达。叶绿体密码子优化对于表达多肽的普遍有用性通过制备编码荧光素酶的合成的多聚核苷酸来进一步证明(实施例4)，这种蛋白的表达可以在体内或者体外被检测，还可以通过编码抗体的多聚核苷酸来证明(实施例3)。进一步，作为例子被说明的组合物和方法证明了功能性融合蛋白可以在叶绿体中强烈表达，包括单链抗体和报告多肽(参见实施例3和4)。

[0115]高等植物和藻类的叶绿体很有可能起源于光合原核生物到真核生物宿主的内共生整合。在整合的过程中许多基因从叶绿体转移到宿主细胞核中(Gray，Curr.Opin.Gen.Devel.9：678-687，1999)。这样，叶绿体中正常的光合成功能需要核编码蛋白和质体编码蛋白的共同参与，以及这两个基因组之间基因表达的协作。植物中核编码和叶绿体编码基因的表达在对发育和环境因子的响应中会非常敏感地协作。

[0116]在叶绿体中，基因表达的调控一般是发生在转录之后，而且常常发生在翻译起始阶段。这种调控依赖于叶绿体的翻译装置，以及核编码的调控因子(参见Barkan和Goldschmidt-Clermont，Biochemie 82：559-572，2000；Zerges，Biochemie 82：583-601，2000；Bruick和 Mayfield，如上，1999)。叶绿体翻译装置与细菌中的翻译装置比较相似；叶绿体含有70S的核糖体；其mRNA缺乏5’帽而且一般不含有3’ 端多聚腺苷酸化尾(Harris等，Microbiol.Rev.58：700-754，1994)；而且叶绿体和细菌的翻译都可以被选择性试剂如氯霉素抑制。

[0117]在细菌中，介导正确的翻译起始的RNA元素包括起始密码子， RBS，RBS和起始密码子的特定间隔，翻译增强序列，第二密码子的偏向，以及影响RNA可接触性的二级结构(Gold，Ann.Rev.Biochem. 57：199-233，1988)。在叶绿体中，核糖体的结合和翻译起始位点的正确选择是通过，至少是部分通过，顺式作用RNA元件完成的(参见 Bruick和Mayfield，如上，1999)。与细菌相似，叶绿体起始密码子也会影响翻译起始的效率，但是并不决定起始位点的位置(Chen等，Plant Cell 7：1295-1305，1995)，这表明叶绿体中翻译起始位点的选择需要额外的决定因素。

[0118]介导翻译调控的数个RNA元件已经在叶绿体mRNA的5’端非翻译区内被鉴定到(Alexander等，Nucl.Acids Res.26：2265-2272，1998； Hirose和Sugiura，EMBO J.15：1687-1695，1996；Mayfield等，J.Cell Biol. 127：1537-1545，1994；Sakamoto等，Plant J.6：503-512，1994；Zerges等，如上，1997，每篇文献都在此整入以供参考)。这些元件可能与核编码因子相互作用，而且一般与已知的原核生物调控序列没有相似性 (McCarthy和Brimacombe，Trends Genet.10：402-407，1994)。

[0119]保守的原核生物RBS元件的特征是Shine-Dalgamo(SD)序列，这段序列含有3到9个核苷酸，其中一般有大约4、5或者6个核苷酸与16S rRNA的3’端互补。在翻译起始的早期，30S的核糖体亚基借助于16S rRNA内互补的反SD序列在SD序列处与mRNA结合。因为原核生物mRNA的SD序列位于起始密码子上游5到15个核苷酸的位置，这样30S核糖体亚基被定位，正确的起始密码子就进入核糖体P 位点。

[0120]许多叶绿体mRNA含有类似于原核生物RBS元件的元件 (Bonham-Smith和Bourque，Nucl.Acids Res.17：2057-2080，1989；Ruf 和Kossel，FEBS Lett.240：41-44，1988，每篇文献都在此整入以供参考)。然而，这些RBS序列在叶绿体翻译中的功能效用仍然不清楚，这是因为这些元件的定位比通常在原核生物中观察到的位置要更加位于起始密码子的上游。在一些研究中，报道叶绿体mRNA中5’端非翻译区内推定的RBS的改变会影响翻译(Betts和Spremulli，J.Biol.Chem. 269：26456-26465，1994；Hirose等，FEBS Lett.430：257-260，1998；Hirose 和Sugiura，如上，1996；Mayfield等，如上，1994)，而在其它叶绿体 mRNA中可能的RBS元件的改变对翻译的影响很小(Fargo等，Mol. Gen.Genet.257：271-282，1998；Koo和Spremulli，J.Biol.Chem. 269：7494-7500，1994；Rochaix，Plant Mol.Biol.32：327-341，1996； Sakamoto等，如上，1994)。对于这些结果的解释由于叶绿体RBS元件缺乏保守性而变得复杂，而且还因为为了研究这些推定的RBS序列而产生的突变可能改变了5’端非翻译区内其它的重要序列。

[0121]RBS元件在叶绿体翻译中的一个功能性作用已经在这里被揭示(实施例2)。叶绿体16S rRNA反SD序列位于16S rRNA的3’端，其序列为3’-CUUCCUCCAC-5’(SEQ ID NO：29)，对其进行突变，去除其与叶绿体mRNA上SD序列的可能的碱基配对，这严重地削弱了莱茵衣藻叶绿体编码的数种整合膜蛋白的翻译(实施例2)。带有16S rRNA反SD突变的核糖体仍然可以进行翻译，因为可溶性叶绿体蛋白的合成很大程度上都不受这些突变的影响。

[0122]对编码光系统II反应中心D1蛋白的叶绿体psbA mRNA的5’ 端非翻译区内可能的SD元件进行分析，发现类似于原核生物的单个 RBS元件的存在，所述元件定位在起始密码子AUG的5’端(上游) 27个核苷酸处。这个RBS位于起始密码子上游太远的位置以致于核糖体30S亚基不能够像在细菌中一样同时与RBS元件和起始密码子接触。当重新定位该RBS元件使之距离起始密码子更近时，它却不再支持叶绿体中翻译的起始，但却可以使该转录子在大肠杆菌中翻译(实施例2)。由于起始前复合体可以在这个RBS元件处形成，因此它具有核糖体30S亚基的真实识别位点的特征。然而，这个RBS元件在没有额外的因子参与下不能够正确地限定翻译起始位点，所述因子包括核编码的翻译激活蛋白(Danon和Mayfield，1991；Yohn等，1998a；Yohn 等，1998b)。这个结果表明，psbA的mRNA中RBS与起始密码子之间额外的距离用于容纳额外的翻译因子，它的一个例证是叶绿体中 RBS元件与光调控反式作用因子联合起到促进翻译起始的功能。

[0123]因此，本发明提供一种分离的核糖核苷酸序列，它包括与第二 RBS有效连接的第一RBS。如在此公开的，这样的有效连接的第一和第二RBS一般被大约5到25个核苷酸分隔开来，这样，当这段核糖核苷酸序列与编码多肽的多聚核苷酸有效连接时，所述第一RBS可以指导所述多肽在原核生物中的翻译，而所述第二RBS可以指导所述多肽在叶绿体中的翻译。当将一个RBS序列定位在起始密码子AUG上游(5’端)至少大约19个核苷酸的时候，这个RBS在叶绿体的翻译过程中是有活性的，这里所述的有活性包括允许多聚核糖体的形成，如果RBS的位置离AUG更近一些，就会导致其在叶绿体中的翻译活性降低(参见图4)。正如图4所示，psbA mRNA的RBS(SD序列) 从-27的位置开始(即，在AUG密码子上游的-27位置之后)。致使 RBS与AUG密码子的距离少于大约19个核苷酸的缺失导致叶绿体中翻译活性和多聚体的形成明显降低，但是却发现在细菌中的翻译活性有增加(参见实施例2，还显示了细菌中RBS距离AUG密码子的位置超过大约15个核苷酸时翻译活性会降低)。

[0124]本发明的分离的核糖核苷酸序列一般长度为大约11到50个核苷酸，可以是大约15到40个核苷酸，或者大约20到30个核苷酸。这样一个长度允许一般是大约3到9个核苷酸，常常是大约4到7个核苷酸的两个SD序列被大约5到25个核苷酸分隔开来(一般是被大约10到20个核苷酸，特别地是被大约15个核苷酸分隔开)。例如，本发明的核糖核苷酸序列可以包括4个核苷酸长的第一RBS，比如 GGAG，它通过5个核苷酸与大约4个核苷酸长的第二RBS比如GGAG 分开，这样就提供了一段长度为13个核苷酸的核糖核苷酸序列。第一 RBS和第二RBS可以分别独立地具有任何具有SD序列特征的序列。如在此公开的，用于指导植物叶绿体中的翻译的RBS需要与16S rRNA 的3’端反SD序列(3’-CUUCCUCCAC-5’；SEQ ID NO：29)中的至少三个，特定地，是四个，五个，或者六个，或者更多的核苷酸互补，特别地，与反SD序列的中间8个核苷酸互补。例如，包括GGAG，GGAGG，或者ACGAGA(与SEQ ID NO：29互补的核苷酸用斜体标示)的RBS 序列在与一段编码多肽有效连接时，可以指导其在植物叶绿体中的翻译。

[0125]用于制备本发明的组合物或者实践本发明的方法的RBS可以化学合成，或者可以从自然发生的核酸分子中分离出来。例如，指导叶绿体中的翻译的RBS一般存在于叶绿体基因的5’端非翻译区，因此它可以从一个叶绿体基因中被分离出来。另外，包含进一些与所述基因的SD序列正常相关的额外的核苷酸序列也会有一些益处。例如，5’ 端非翻译区可能包括转录调控元件比如启动子，因而有助于构建能够在植物叶绿体中转录和翻译的重组核酸分子。另外，如在此公开的，来自于编码膜相关D1(psbA)叶绿体蛋白的叶绿体基因的额外的 5’UTR序列的整入导致膜异源多肽在叶绿体中的表达(实施例3)。这样，本发明的含有指导叶绿体中的翻译的RBS的核糖核苷酸可以进一步包含一个叶绿体基因的5’端非翻译区，例如，编码一个可溶性蛋白的叶绿体基因的5’端非翻译区，或者编码一个膜结合叶绿体蛋白的基因的5’端非翻译区。这样的5’端非翻译区在本领域是已熟知的，包括那些由编码可溶性蛋白的基因编码的5’端非翻译区，比如，AtpA的5’ 端非翻译区(SEQ ID NO：4)或者RbcL的5’端非翻译区(SEQ ID NO：5)，以及那些由编码膜结合蛋白的叶绿体基因编码的5’端非翻译区，比如 PsbD的5’端非翻译区(SEQ ID NO：6)，或者PsbA的5’端非翻译区 (SEQ ID NO：7)。另外，16S rRNA的5’端非翻译区(SEQ ID NO：8) 可以被用来例如指导与之有效连接的异源多聚核苷酸的转录，而且可以在与反SD序列的互补的序列处进行修饰，使得如此生成的RBS可以特别有效地指导由多聚核苷酸编码的多肽在植物叶绿体中的翻译。

[0126]本发明的核糖核苷酸序列可以进一步包括起始密码子，比如起始密码子AUG，并与第一和第二RBS有效连接。这样的起始密码子 AUG可以进一步包括Kozak序列的相邻核苷酸，比如，ACCAUGG或者GCCAUGG或者CC(A/G)CCAUGG或者类似的序列(参见Kozak，J. Mol.Biol.196：947-950，1987，这篇文献在此整入以供参考)，这样的序列有利于编码多肽在细胞中的翻译。另外，本发明的核糖核苷酸序列可以与编码多肽的多聚核苷酸有效连接，其中所述多聚核苷酸包括起始密码子，所述密码子可以是但并不一定是内源性的起始密码子，或者可以通过修饰之后含有一个起始密码子。

[0127]本发明的分离的核糖核苷酸序列可以化学合成，或者可以利用酶学方法生成，比如，由DNA或者RNA模板分别利用DNA依赖型 RNA聚合酶或者RNA依赖型RNA聚合酶生成。编码本发明的核糖核苷酸的DNA模板可以化学合成，可以从自然发生的DNA分子中分离，或者可以由经过修饰而具有所需特性的自然发生的DNA序列中衍生得来。例如，原核基因的DNA序列正常情况下含有编码RBS的核苷酸序列，这段序列在起始密码子上游大约5到15个核苷酸处。这样的核苷酸序列可以被分离，并通过常规的DNA重组方法进行修饰使之含有位于内源性原核RBS上游(5’)适当位置的第二RBS。因此，本发明提供编码在此定义的有效连接的第一和第二RBS的多聚核苷酸。

[0128]编码与第二RBS有效连接的第一RBS的多聚核苷酸可以是 DNA或者RNA，可以是单链或者双链，其中所述第一RBS可以指导原核生物中的翻译，而所述第二RBS可以指导在叶绿体中的翻译。所述多聚核苷酸还可以包括与编码所述第一RBS和第二RBS的核苷酸序列有效连接的起始密码子，例如ATG，起始密码子定位在所述第一RBS 下游(3’端)大约3到15个核苷酸的位置，包括在所述下游大约4，5， 6，7，8，9，10，11，12，13或者14个核苷酸的位置。本发明的多聚核苷酸还可以包括克隆位点，所述克隆位点的定位允许编码多肽的可表达的多聚核苷酸与所述第一和第二RBS有效连接，以及与ATG密码子有效连接，如果存在这样的密码子的话，这样，所述多肽就可以在叶绿体或者原核宿主细胞中表达。

[0129]在这里广泛用到的术语“克隆位点”是指任何有助于第一多聚核苷酸与第二多聚核苷酸连接的核苷酸或者核苷酸序列。一般地，克隆位点包括一个或者多个限制性内切酶识别位点，例如多克隆位点，或者一个或多个重组酶识别位点，例如loxP位点或者att位点，或者这样的位点的组合。被提供的克隆位点是为了便于插入或者连接操作，所述连接可以是第一和第二多聚核苷酸的有效连接，比如编码有效连接的第一和第二RBS的第一多聚核苷酸与编码感兴趣的多肽的第二多聚核苷酸有效连接，所述多肽将要在原核生物中或者叶绿体中或者在二者中翻译。

[0130]在此定义的编码第一和第二RBS的多聚核苷酸可以与可表达的多聚核苷酸有效连接，所述的可表达的多聚核苷酸编码至少一种多肽，包括肽或者多肽的肽部分。这样，所述的可表达的多聚核苷酸可以只编码一个第一多肽，或者可以编码两个或者更多个多肽，这些多肽可以与第一多肽相同或者不同。例如，所述的可表达的多聚核苷酸可以编码一个第一多肽和一个第二多肽，这两个多肽是不同的，特别地，第一多肽和第二多肽可以特异性地联合形成功能性的异源二聚体比如抗体；酶；细胞表面受体比如T细胞受体，生长因子受体，大麻类受体；或者类似物。这样的第一和第二(或者其他)多肽可以表达成一个融合蛋白，比如包括连接在一起的H链和L链的单链抗体，或者可以表达成独立分开的多肽，这些多肽可以但并不一定具有特异性地联合形成功能性蛋白复合物的能力。如果要将这些多肽表达为分离的单位，那么可以在编码所述第一多肽的序列和编码所述第二多肽的序列之间有效连接上编码内在核糖体进入位点(IRES)的核苷酸序列，这样有助于第二(或者下游)多肽的翻译。

[0131]在此定义的编码有效连接的第一和第二RBS的多聚核苷酸可以是线性的核苷酸序列，而且可以在一个末端具有第一克隆位点，在另外一个末端具有第二克隆位点，这样就提供了可以方便地插入或者连接第二多聚核苷酸的序列盒。末端的第一和第二克隆位点可以相同也可以不同，而且其中之一或者两者都可以独立地包括多克隆位点。所述多聚核苷酸可以进一步包括任何其他感兴趣的核苷酸序列，比如与之有效连接的起始密码子ATG。

[0132]如在此定义的，本发明进一步提供含有编码有效连接的第一和第二RBS的多聚核苷酸的载体。所述载体可以是任何可以用于将一段多聚核苷酸导入到原核或者真核细胞中的载体，包括克隆载体或者表达载体。在一种具体实施方案中，所述载体包括一段叶绿体基因组DNA 的核苷酸序列，特别是不编码任何叶绿体基因的沉默核苷酸序列，有了它可以保证与叶绿体基因组DNA之间的同源重组。这样的叶绿体载体在本领域是已熟知的，包括例如p322(参见实施例1；也可参见， Kindle等，Proc.Natl.Acad.Sci.，USA 88：1721-1725，1991，这篇文献在此整入以供参考；Hager和Bock，如上，2000；Bock，如上，2001)。

[0133]本发明的载体还可以包含一个或者多个额外的可以为载体带来所需特性的核苷酸序列，包括比如，有利于载体的操作的克隆位点，指导载体复制或者其中所包含的核苷酸序列的转录的调控元件，编码选择性标记的序列，以及类似的序列。这样，所述载体可以包含例如一个或者多个克隆位点如多克隆位点，所述克隆位点的定位可以但并不是必须使得异源多聚核苷酸可以插入到所述载体中，并且与所述第一和第二RBS有效连接。所述载体还可以包含原核生物的复制原点 (ori)，比如大肠杆菌的ori或者粘粒的ori，这样就可以使得所述载体在原核宿主细胞中以及植物叶绿体中按照需要进行转移。

[0134]这里广泛使用的术语“调控元件”意指调控多聚核苷酸的转录或者翻译或者多肽的定位并与之有效连接的核苷酸序列。除了RBS，表达控制序列还可以是启动子，增强子，转录终止子，起始密码子，用于切除内含子和维持正确阅读框架的剪接信号，终止密码子，琥珀密码子或者赫石密码子，IRES，或者将多肽导向到特定位置的序列，例如细胞区室化作用信号，它可以用于将多肽导向到细胞质，细胞核，质膜，内质网，线粒体膜或者基质，叶绿体膜或者内腔，中间反区高尔基体池，或者溶酶体或者内涵体。细胞区室化作用结构域在本领域是已熟知的，包括例如含有人类II型膜锚定蛋白半乳糖基转移酶的第 1到81个氨基酸残基的肽，或者含有细胞色素c氧化酶IV亚基的前体序列的第1到12个氨基酸残基的肽(也可参见，Hancock等，EMBO J. 10：4033-4039，1991；Buss等，Mol.Cell.Biol.8：3960-3963，1988；美国专利号5,776,689，每篇文献都在此整入以供参考)。在应用本发明的方法生产的多肽中加入细胞区室化作用结构域，可以使包括蛋白复合物在内的多肽按照需要定向到个体内特定的细胞区室中，并在那里使用。

[0135]本发明的载体或者其它重组核酸分子可以包括编码报告多肽或者其他可选择标记的核苷酸序列。术语“报告子”或者“选择性标记”是指可以赋予可被检测的表型的多聚核苷酸(或者被编码的多肽)。一般，报告子编码可以被检测的多肽，比如，一种绿色荧光蛋白或者一种酶如荧光素酶，当它们与合适的试剂(分别是特定波长的光或者荧光素)接触之后就会产生可以被肉眼检测或者通过合适的仪器检测到的信号(Giacomin，Plant Sci.116：59-72，1996；Scikantha，J.Bacteriol. 178：121，1996；Gerdes，FEBS Lett.389：44-47，1996；也可参见，Jefferson， EMBO J.6：3901-3907，1997，f1-葡糖苷酸酶)。选择性标记一般是一种分子，当它在细胞中存在或者表达的时候，会给含有这种标记的细胞提供一定的选择优势(或者劣势)，比如含有这种标记的细胞在一种试剂存在的条件下具备生长的能力，而不含有这种标记的细胞则会被这种试剂杀死。

[0136]选择性标记可以提供获得表达这种标记的原核细胞或者植物细胞或者二者的手段，这样，这种选择性标记就可以作为本发明的载体的一部分(参见，例如，Bock，如上，2001)。选择性标记的例子包括那些赋予抗代谢物抗性的标记，比如，二氢叶酸还原酶，它可以赋予对氨甲蝶呤的抗性(Reiss，Plant Physiol.(Life Sci.Adv.)13：143-149， 1994)；新霉素磷酸转移酶，它可以赋予对氨基糖苷新霉素的抗性，卡那霉素抗性和巴龙霉素的抗性(Herrera-Estrella，EMBO J.2：987-995， 1983)，hygro，它可以赋予对潮霉素的抗性(Marsh，Gene 32：481-485， 1984)，trpB，它允许细胞利用吲哚替代色氨酸；hisD，它允许细胞利用组氨醇替代组氨酸(Hartman，Proc.Natl.Acad.Sci.USA 85：8047， 1988)；甘露糖6磷酸异构酶，它允许细胞利用甘露糖(WO 94/20627)；鸟氨酸脱羧酶，它可以赋予对鸟氨酸脱羧酶抑制剂，2-(二氟甲基)-DL- 鸟氨酸的抗性(DMFO；McConlogue，1987，在Current Communication in Molecular Biology，Cold Spring Habor Laboratory ed.)；以及来自于土曲霉(Aspergillus terreus)的脱氨酶，它可以赋予对杀稻瘟菌素S的抗性 (Tamura，Biosci.Biotechnol.Biochem.59：2336-2338，1995)。另外一些选择性标记包括那些可以赋予除草剂抗性的标记，比如膦丝菌素酰基转移酶基因，它可以赋予对膦丝菌素的抗性(White等，Nucl.Acids Res. 18：1062，1990；Spencer等，Theor.Appl.Genet.79：625-631，1990)， EPSPV合酶的突变型，它可以赋予草甘膦抗性(Hinchee等， BioTechnology 91：915-922，1998)，乙酰乳酸合成酶的突变型，它可以赋予咪唑啉酮或者磺脲抗性(Lee等，EMBO J.7：1241-1248，1988)，突变型psbA，它可以赋予对莠去津的抗性(Smeda等，Plant Physiol. 103：911-917，1993)，或者原卟啉原氧化酶的突变型(参见美国专利号 5,767,373)，或者其它可以赋予对除草剂比如草丁膦的抗性的标记。选择性标记包括那些使真核细胞具有二氢叶酸还原酶或者新霉素抗性，使原核生物比如大肠杆菌具有四环素，青霉素抗性；以及使植物具有博来霉素，庆大霉素，草甘膦，潮霉素，卡那霉素，氨甲喋呤，腐草霉素，膦丝菌素，大观霉素，链霉素，磺胺药物和磺脲抗性的多聚核苷酸(参见，比如Maliga等，Methods in Plant Molecular Biology， Cold Spring Habor Laboratory Press，1995，39页)。由于本发明的组合物或者方法可以使多肽在叶绿体中表达，这样如果将可赋予植物细胞一定的选择优势的多肽与一段编码细胞内定位基序的核苷酸序列有效连接，便可以将所述多肽转运到细胞质，细胞核，或者其他亚细胞器，而这些地方正好是例如选择性标记导致的毒性效果起作用的地方(参见，比如，Von Heijne等，Plant Mol.Biol.Rep.9：104，1991；Clark等，J. Biol.Chem.264：17544，1989；della Cioppa等，Plant Physiol.84：965，1987； Romer等，Biochem.Biophys.Res.Comm.196：1414，1993；Shah等， Science 233：478，1986；Archer等，J.Bioenerg Biomemb.22：789，1990； Scandalios，Prog.Clin.Biol.Res.344：515，1990；Weisbeek等，J.Cell Sci. Suppl.11：199，1989；Bruce，Trends Cell Biol.10：440，2000)。

[0137]本发明的穿梭载体在原核生物中穿梭的能力使得对于载体的操作更加方便。例如，含有所述载体和假定已经插入的感兴趣的多聚核苷酸的反应混合物可以转化到原核宿主细胞比如大肠杆菌中，然后采用常规的方法扩增并收集，对其进行检验以鉴定含有插入片断或者感兴趣的构建物的载体。如果需要的话，所述载体还可以被进一步操作，比如对被插入的多聚核苷酸进行位点专一性突变，然后再扩增并挑选出含有感兴趣的突变多聚核苷酸的载体。所述穿梭载体然后可以被导入到植物细胞叶绿体中，在那里感兴趣的多肽可以被表达出来，如果需要的话，还可以通过本发明的方法分离出这些多肽。

[0138]本发明的多聚核苷酸或者重组核酸分子可以包含在载体当中，所述载体包括本发明的载体，所述的多聚核苷酸或者重组核酸分子可以通过本领域已知的任何方法被导入到植物叶绿体中。这里用到的术语“导入”是指将多聚核苷酸转移到细胞中，所述细胞包括原核细胞或者植物细胞，特别是导入到植物细胞的质体中。多聚核苷酸可以通过各种方法被导入到细胞中，这些方法在本领域是已熟知的，这些方法的选择部分地依赖于特定的宿主细胞。例如，多聚核苷酸可以通过直接的基因转移方法被导入到植物细胞中，比如电穿孔，或者利用颗粒枪进行的微弹射介导(生物弹射)的转化，或者“玻璃珠方法”(参见，比如，Kindle等，如上，1991)，或者花粉介导的转化，脂质体介导的转化，利用损伤或者酶降解的未成熟胚胎进行的转化，或者利用损伤或者酶降解的胚胎发生愈伤进行的转化(参见，Potrykus，Ann.Rev. Plant.Physiol.Plant Mol.Biol.42：205-225，1991，这篇文献在此整入以供参考)。

[0139]质体转化是一种常规并且已熟知的将多聚核苷酸导入植物细胞叶绿体的方法(参见，美国专利号5,451,513，5,545,817和5,545,818； WO 95/16783；McBride等，Proc.Natl.Acad.Sci.USA 91：7301-7305， 1994，每篇文献在此整入以供参考)。叶绿体转化涉及利用例如生物弹射(biolistic)或者原生质体转化方法(例如氯化钙或者PEG介导的转化)，将两侧有叶绿体DNA某些区域的所需核苷酸序列导入到合适的目标组织。1到1.5kb的两侧的叶绿体基因组DNA核苷酸序列可以使载体和所述叶绿体基因组之间发生同源重组，而且可以替代或者修饰质体基因组(plastome)的特定区域。采用这种方法，能够赋予对大观霉素和链霉素的抗性的叶绿体16S rRNA和rpsl2基因点突变可以用作转化的选择性标记(Svab等，Proc.Natl.Acad.Sci.USA 87：8526-8530， 1990；Staub和Maliga，如上，1992)，结果可以获得稳定的同质转化体 (homoplasmic transformants)，成功的频率大约是100个被轰击的目标叶片中有一个。存在于这些标记之间的克隆位点为构建载体——包括本发明的载体——提供了方便的核苷酸序列(Staub和Maliga，EMBO J.12：601-606，1993)。用显性的选择性标记，编码大观霉素脱毒酶氨基糖苷-3’-腺嘌呤转移酶替代隐性的rRNA或者核糖体蛋白抗生素抗性基因，可以获得明显增加的转化效率(Svab和Maliga，Proc.Natl.Acad. Sci.USA 90：913-917，1993)。转化后常常需要大约15到20个细胞分裂周期才能够达到同质状态。在质体表达中，基因通过同源重组插入到每一个植物细胞的所有的数千个的环状质体基因组拷贝中，由于与核表达的基因相比，它可以利用巨大的拷贝数目，因此使得表达水平可以容易地超过植物可溶性蛋白总量的10％。[140]直接的基因转移方法比如电穿孔也可以用于将本发明的多聚核苷酸导入到植物叶绿体中(Fromm等，Proc.Natl.Acad.Sci.USA 82：5824，1985，这篇文献在此整入以供参考)。高场强的电脉冲可以可逆地使细胞膜穿透，从而允许多聚核苷酸的导入。被电穿孔的植物原生质体重新形成细胞壁，分裂并形成植物愈伤。微注射可以按照 Potrykus和Spangenberg所著的Gene Transfer To Plants(Springer Verlag， Berlin，NY 1995)中描述的方法来进行。含有导入的多聚核苷酸的转化植物细胞可以通过检测由导入的多聚核苷酸带来的表型来鉴定，所述表型例如是报告基因或者选择性标记的表达。

[0141]也可以应用微射弹(microprojectile)介导的转化来将多聚核苷酸导入到植物细胞叶绿体中(Klein等，Nature 327：70-73，1987，这篇文献在此整入以供参考)。这种方法利用微射弹比如金或者钨，其上通过氯化钙，亚精胺或者聚乙二醇沉淀方法而包被有所需的多聚核苷酸。所述微射弹颗粒被高速打入植物组织中，用到的设备可以是例如 BIOLISTIC PD-1000颗粒枪(BioRad；加利福尼亚州，赫库勒斯)。利用生物弹射方法进行转化的方法是已熟知的(Wan，Plant Physiol. 104：37-48，1984；Vasil，BioTechnology 11：1553-1558，1993；Christou， Trends in Plant Science 1：423-431，1996)。微射弹介导的转化可以用于例如，获得各种转基因植物物种，包括棉花，烟草，玉米，杂交白杨或者番木瓜。重要的谷类作物比如小麦，燕麦，大麦，高粱和水稻也可以采用微射弹介导的传送进行转化(Duan等，Nature Biotech. 14：494-498，1996；Shimamoto，Curr.Opin.Biotech.5：158-162，1994)。大多数双子叶植物都可以采用上述方法转化。单子叶植物也可以转化，比如采用上述的生物弹射方法，原生质体转化，部分通透的细胞的电穿孔，用玻璃纤维导入DNA，玻璃珠搅拌方法(Klindle等，如上，1991)，以及类似的方法。

[0142]本发明还提供包含位于克隆位点5’端大约20到40个核苷酸位置的编码RBS的核苷酸序列的载体。所述克隆位点可以是任何有助于异源核苷酸序列插入或者连接到载体中的核苷酸序列，例如一个或者多个限制性内切酶识别位点，一个或者多个重组酶识别位点，或者这些位点的组合。优选地，所述克隆位点是多克隆位点，其包括一系列限制性内切酶识别位点或者重组酶识别位点，或者至少一个限制性内切酶识别位点和至少一个重组酶识别位点的组合。所述载体可以进一步含有位于所述克隆位点5’端附近的起始密码子或者其一部分，从而为缺乏起始密码子ATG或者由于例如限制性内切酶的切割而导致只含有部分起始密码子的编码序列提供一个翻译起始位点(或者隐蔽起始位点)。所述载体还可以含有定位在所述克隆位点3’端的叶绿体基因 3’UTR，比如PsbA的3’UTR(SEQ ID NO：9)，RbcL的3’UTR(SEQ ID NO：10)，AtpA的3’UTR(SEQ ID NO：11)，tRNAARG的3’UTR (SEQ ID NO：12)，或者PsbD的3’UTR(参见SEQ ID NO：30，从位置1553开始；还显示了编码PsbD-GFP融合蛋白的GFP构建物的插入位点)。

[0143]还提供了一种制备叶绿体/原核生物穿梭表达载体的方法。本发明的穿梭载体可以通过这样来制备，例如，向足以与叶绿体基因组 DNA发生同源重组的一段叶绿体基因组DNA的核苷酸序列中导入下列序列：包含原核生物复制原点的核苷酸序列；编码第一RBS的核苷酸序列；编码第二RBS的核苷酸序列，其中所述第一RBS和第二RBS 被大约5到25个核苷酸分开；和克隆位点，其中所述克隆位点被定位以允许编码多肽的多聚核苷酸有效连接到所述第一RBS和第二RBS，这样，所述第一RBS可以指导所述多肽在原核生物中的翻译，而所述第二RBS可以指导所述多肽在叶绿体中的翻译。制备叶绿体/原核生物穿梭表达载体还可以通过遗传修饰一段叶绿体基因组DNA的核苷酸序列来实现，所述这段核苷酸序列可以与叶绿体基因组DNA发生同源重组，经过修饰之后它含有原核生物复制起始位点，编码被大约5 到25个核苷酸分开的第一RBS和第二RBS的核苷酸序列，和克隆位点，其中所述克隆位点被定位以允许编码多肽的多聚核苷酸有效连接到所述第一RBS和第二RBS，这样，所述第一RBS可以指导所述多肽在原核生物中的翻译，而所述第二RBS可以指导所述多肽在叶绿体中的翻译。因此，本发明还提供如上所述的根据本发明的方法制备的叶绿体/原核生物穿梭载体。

[0144]本发明还提供一种重组核酸分子，它包括与编码多肽的第二核苷酸序列有效连接的编码叶绿体RBS的第一核苷酸序列，其中，所述第一核苷酸序列与所述第二核苷酸序列是相对异源的。有效连接的 RBS一般定位在起始密码子5’端(上游)大约20到40个核苷酸的位置，而所述起始密码子又与编码多肽的多聚核苷酸有效连接。在一种具体实施方案中，所述第一核苷酸序列包括定位在编码RBS的核苷酸序列的3’端大约20到40个核苷酸位置的ATG密码子。本发明的重组核酸分子可以进一步包括其它调控元件或者感兴趣的编码多聚核苷酸，正如在此例示的或者本领域已知的。

[0145]报告基因已经在高等植物的叶绿体中被成功应用，而且高水平的重组蛋白表达也有报道。另外，报告基因也已经在莱茵衣藻的叶绿体中被应用，但是在绝大多数情况下都是只有少量的蛋白质被表达出来。在许多生物物种中，报告基因都可以大大增强监测基因表达的能力。在高等植物的叶绿体中，β-葡糖苷酸酶(uidA，Staub和Maliga， EMBO J.12：601-606，1993)，新霉素磷酸转移酶(nptII，Carrer等，Mol. Gen.Genet.241：49-56，1993)，腺苷-3-腺嘌呤转移酶(aadA，Svab和 Maliga，Proc.Natl.Acad.Sci.USA 90：913-917，1993)，以及Aequorea victoria中的GFP(Sidorov等，Plant J.19：209-216，1999)都已经用作报告基因了(Heifetz，Biochemie 82：655-666，2000)。这些基因中的每一个都具有可以使之用作叶绿体基因表达的报告子的特性，比如它们具有分析上的方便性，灵敏性，或者具有原位检测基因表达的能力。基于这些研究，其它异源蛋白也已经可以在高等植物的叶绿体中表达，比如苏云金杆菌(Bacillus thuringiensis)的Cry毒素，它可以使植物具有对食草昆虫的抗性(Kota等，Proc.Natl.Acad.Sci.，USA 96：1840-1845， 1999)，或者人体生长激素(Staub等，Nat.Biotechnol.18：333-338，2000)，这是一种生物类药物。

[0146]已经有数种报告基因在真核绿藻莱茵衣藻的叶绿体中表达，尽管成功表达的程度有所不同。这些基因包括aadA (Goldschmidt-Clermont，Nucl.Acids Res.19：4083-4089 1991；Zerges和 Rochaix，Mol.Cell Biol.14：5268-5277，1994)，uidA(Sakamoto等，Proc. Natl.Acad.Sci.，USA 90：477-501，1993；Ishikura等，J.Biosci.Bioeng. 87：307-314 1999)，海肾(Renilla)荧光素酶(Minko等，Mol.Gen.Genet. 262：421-425，1999)和来自于鲍氏不动杆菌(Acinetobacter baumanii) 的氨基糖苷磷酸转移酶，aphA6(Bateman和Purton，Mol.Gen.Genet. 263：404-410，2000)。产生的重组蛋白的量仅仅对于uidA基因有报道 (Ishikura等，如上，1999)，基于蛋白质印记分析和活性测定，其表达量非常低。为了提高异源多肽在叶绿体中的表达，本发明研究了针对莱茵衣藻叶绿体基因组的密码子偏好(Nakamura等，如上，1999)对表达的影响。

[0147]由于遗传密码先天的简并性，有时多达6种核苷酸三联体编码同一种氨基酸，而同工tRNA又常常由多基因家族编码。例如，在所有核tRNA基因都已知的线虫(Caenorhabditis elegans)中，有31个 tRNAUCCGly编码基因(Duret，Trends Genet.16：287-289，2000)。这种简并性的一个结果就是许多物种表现出明显的密码子偏好，其中某些密码子的使用频率大大超过其他密码子。密码子偏好对于异源蛋白表达的影响已经在原核生物和真核生物中有详细的描述，甚至病毒基因都表现出一定的密码子偏好，从而影响它们暂时的和组织特异性的表达。一般情况下，密码子的使用与同工tRNA的水平相关。这样，编码高效表达的蛋白的基因往往是利用其同功tRNA水平特别高的密码子 (Duret，如上，2000；Kanaya等，Gene 238：143-155，1999)。

[0148]莱茵衣藻的叶绿体基因组表现出强烈的密码子使用偏好，在第三个位置优选使用腺嘌呤或者尿嘧啶(或者胸腺嘧啶)(Nakamura等，如上，1999)。通过从头合成编码GFP并且具有莱茵衣藻叶绿体编码的大部分蛋白所具有的叶绿体密码子使用偏好的多聚核苷酸来研究叶绿体密码子使用在重组多肽在莱茵衣藻叶绿体中表达时的作用(实施例 1)。用处于莱茵衣藻RbcL 5’UTR和3’UTR(分别是SEQ ID NOS：5 和10)控制之下的带有优化的密码子的GFP序列盒(GFPct；SEQ ID NO：1)转化莱茵衣藻叶绿体，监测其中GFP的积累，并与用没有优化的GFP序列盒(GFPncb；SEQ ID NO：3)转化的莱茵衣藻中GFP的积累比较。如在此公开的，用GFPct序列盒转化的莱茵衣藻叶绿体中GFP 的积累量大约是用GFPncb转化的株系中的80多倍，而且这种表达足够强烈，以致于可以报告基于环境条件的微小变化而造成的蛋白合成上的差异(实施例1)。相似的结果也在荧光素酶上得到，其中一种编码包括细菌荧光素酶A亚基和通过连接肽与之融合的细菌荧光素酶B 亚基的融合荧光素酶蛋白(SEQ ID NO：46)的具有叶绿体密码子偏好性的合成的多聚核苷酸(SEQ ID NO：45)的表达导致了荧光素酶的强烈的表达，而且还提供了其它的优点，如荧光素酶的表达可以在体内被检测(参见实施例4)。

[0149]因此，本发明提供编码荧光蛋白或者其突变体或者变异体的分离的合成的多聚核苷酸，其中所述多聚核苷酸的密码子具有叶绿体密码子使用偏好性。所述的合成的多聚核苷酸可以是DNA或者RNA，可以是单链或者双链，可以是在一端或者两端含有克隆位点的线性多聚核苷酸。所述多聚核苷酸可以包含在载体内，还可以与编码被大约5 到25个核苷酸分隔开来的第一RBS和第二RBS的多聚核苷酸有效连接，这样荧光蛋白可以方便地在原核生物和叶绿体中翻译。

[0150]表1示出了在藻类叶绿体基因中优选使用的密码子。这里的术语“叶绿体密码子使用”就是用来指这样的密码子，而且它在被使用时是相对于那些编码同样的氨基酸但是却很少在叶绿体基因中发现的简并密码子而言的。当术语“偏好”是参照叶绿体密码子使用来使用时，是指对多聚核苷酸进行操作，使它的一个或者多个密码子上的一个或者多个核苷酸发生改变，结果得到在叶绿体中优选使用的密码子。叶绿体密码子偏好在这里通过列在表1中的藻类叶绿体密码子偏好来说明。叶绿体密码子偏好可以但并不是必须基于将要在其中表达合成的多聚核苷酸的特定植物来选择。上述的操作可以是通过例如定点突变的方法来改变密码子，也就是利用与将要被改变的核苷酸错配的引物来进行PCR，使得扩增产物具有叶绿体密码子使用偏好性，上述的操作或者可以是从头合成多聚核苷酸序列，使这样的变化(或者偏好) 通过合成步骤导入到序列中。

[0151]除了利用叶绿体密码子偏好作为提供有效的多肽翻译的手段之外，需要注意的是，还有别的方法可以使多肽在叶绿体中的高效翻译，例如对叶绿体基因组(例如莱茵衣藻的叶绿体基因组)进行工程改造，使之表达正常情况下不由所述叶绿体基因组表达的tRNA。这样的工程化藻类表达一种或者多种异源tRNA分子，这就可以提供一个优点，可以避免对将要导入到叶绿体基因组中并由其表达的每一个多聚核苷酸进行修改；这样就可以提供具有遗传修饰的叶绿体基因组的藻类比如莱茵衣藻，并且可以根据本发明的方法将它用于多肽的有效翻译。高效表达的基因中的密码子使用与tRNA丰度之间的相关性已经为人熟知(Franklin等，Plant J.30：733-744，2002；Dong等，J.Mol.Biol. 260：649-663，1996；Duret，Trends Genet.16：287-289，2000；Goldman等，J. Mol.Biol.245：467-473，1995；Komar等，Biol.Chem.379：1295-1300， 1998，每篇文献都在此整入以供参考)。例如，在大肠杆菌中，使未充分利用的tRNA表达出来的菌株重新加工可以使利用这些密码子的基因增强表达(参见，Novy等，inNovations 12：1-3，2001，这篇文献在此整入以供参考)。利用外源tRNA基因时，可以应用定点突变来制备合成的tRNA基因，这样的tRNA基因可以被导入到叶绿体中以补充在叶绿体基因组比如莱茵衣藻叶绿体基因组中稀有或者不被使用的 tRNA基因。

[0152]编码本发明的荧光蛋白的一种或者多种密码子可以具有偏好性，例如在第三个位置上含有腺嘌呤或者胸腺嘧啶，这样有利于荧光蛋白在叶绿体中的翻译。如在此公开的，编码水母(Aequorea victoria) GFP的多聚核苷酸可以通过从头合成一段含有121个同义密码子变化的编码序列来使之具有偏向性，其中包括代表着朝向叶绿体密码子使用的适度改变的66个变化和导致不常用的密码子朝向叶绿体使用改变的54个变化(实施例1)。这样，如SEQ ID NO：1所示的编码修饰过的GFP(SEQ ID NO：2)的多聚核苷酸提供了本发明的多聚核苷酸的一个例子，编码SEQ ID NO：2但却具有更少的具有偏好性的密码子的多聚核苷酸则提供了额外的例子。本发明还提供具有如SEQ ID NO：2所示的氨基酸序列的修饰过的GFP。

[0153]GFP是一种在本领域所熟知的从西北太平洋水母，僧帽水母，海肾，Renilla reiniformis和Phialidium gregarium中分离出的蛋白(Ward 等，Photochem.Photobiol.35：803-808，1982，Levine等，Comp.Biochem. Physiol.72B：77-85，1982，每篇文献都在此整入以供参考)。类似地，红色荧光蛋白也是熟知的，可以从珊瑚虫Discosoma中分离出来(Matz 等，Nature Biotechnol.17：969-973，1999，这篇文献在此整入以供参考)。另外，通过对水母中自然发生的GFP的氨基酸序列进行修改，可以获得与水母GFP相关的各种荧光蛋白，它们具有有用的激发和发射谱(参见Prasher等，Gene 111：229-233，1992；Heim等，Proc.Natl.Acad.Sci.， USA 91：12501-12504，1994；美国专利号6,319,669；国际专利申请号 PCT/US95/14692，每篇文献都在此整入以供参考)。这样，需要注意的是，编码这样的荧光蛋白的核苷酸序列也可以使之具有叶绿体密码子使用偏好性，从而为本发明的荧光蛋白提供额外的例子。

[0154]试图通过下面的实施例来说明本发明，但并不是限制本发明。实施例1
为了在叶绿体中表达而进行编码序列的优化

[0155]这个实施例证明了具有叶绿体密码子偏好性的编码绿色荧光蛋白的核苷酸序列可以在藻类叶绿体中高效地表达(也可参见， Franklin等，Plant J.30：733-744，2002，这篇文献在此整入以供参考)。莱茵衣藻株系，转化和生长条件

[0156]所有的转化都是在莱茵衣藻株系137c(mt+)上进行的。细胞在含有40mM的5-氟脱氧尿苷的TAP培养基中培养至对数期晚期(大约7天)(Gorman和Levine，Proc.Natl.Acad.Sci.，USA 54：1665-1669， 1965，这篇文献在此整入以供参考)，培养条件是温度为23℃，光照恒定为450勒克斯(Lux)，在转速设定为100rpm的旋转摇床上培养。 4000×g，4℃离心5分钟之后得到50毫升的细胞。上清被去掉，然后将细胞重悬于4毫升的TAP培养基中，以便随后用颗粒轰击法(particle bombardment)进行叶绿体转化(Cohen等，如上，1998)。所有的转化都是在大观霉素(150μg/ml)的选择作用下进行，其中对大观霉素的抗性是通过共转化p228质粒上的大观霉素抗性核糖体基因来实现的 (Chlamydomonas Stock Center，Duke University)。

[0157]用于表达GFP的莱茵衣藻转化子的培养是在TAP培养基中进行的(Gorman和Levine，如上，1965)，培养条件是温度为23℃，光照恒定为5000勒克斯，在转速设定为100rpm的旋转摇床上培养，除非特别指明，否则都是这个培养条件。在细胞收集之前，培养物要在密度为1×107个细胞每毫升的情况下维持至少48小时。质粒构建

[0158]所有DNA和RNA操作都基本上按照Sambrook等，如上，1989 和Cohen等，如上，1998中所描述的进行。GFP基因的编码区通过PCR 从含有原始GFP序列(GFPncb)的质粒中扩增(Tsien，Ann.Rev.Biochem. 67：509-544，1998，这篇文献在此整入以供参考)。PCR引物的设计可以使得在所述编码区的外侧紧挨着一个5’端Nde I位点和一个3’端Xba I位点，这有助于接下来的克隆。针对GFPncb的5’端的序列为 5’-CATATGAGTAAAGGAGAAGAAC-3’(SEQ ID NO：17)；针对GFPct 的3’端引物序列为5’-TCTAGATTATTTGTATAGTTCATCC-3’(SEQ ID NO：18)。GFPct的编码区是按照Stemmer等，Gene 164：49-53，1995 (这篇文献已在此整入以供参考)中的描述，从每一个引物长度为40 个核苷酸的引物库中通过从头合成得到的。5’端和3’端的引物分别含有Nde I和Xba I限制性位点。

[0159]根据制造商提供的操作手册，将得到的717bp的含有GFPct 和GFPncb基因的PCR产物克隆到质粒pCR2.1 TOPO(Invitrogen公司)，分别得到质粒pCrGFPct和pCrGFPncb。rbcL的3’UTR是利用克隆到质粒pUC19中的莱茵衣藻叶绿体基因组DNA的1.6kb Hind III 片断作为模板，通过PCR反应得到的。对应于rbcL 3’UTR的5’端和 pUC19多克隆位点的一部分的PCR引物的序列为 5’-TCTAGAGTCGACCTGCAG-3’(SEQ ID NO：19)，其中包括Xba I 位点。对应于rbcL 3’UTR的3’端的PCR引物的序列为 5’-GGATCCGTCGACGTATG-3’(SEQ ID NO：20)，其中包括为了随后的克隆而设置的Bam HI限制性位点。将得到的433bp的产物克隆到质粒pCR2.1TOPO中，得到p3rbcL质粒。

[0160]rbcL的5’UTR是以莱茵衣藻基因组DNA为模板通过PCR得到的。与起始于相对于翻译起始位点的位置-189的rbcL基因5’端互补的PCR引物序列为 5’-GAATTCATATACCTAAAGGCCCTTTCTATGC-3’(SEQ ID NO：21)，其中包含Eco RI限制性位点。与rbcL基因的5’UTR的3’ 端互补的PCR引物从翻译起始位点开始，其序列为 5’-CATATGTATAAATAAATGTAACTTC-3’(SEQ ID NO：22)，其中包含Nde I限制性位点。将得到的24lbp的PCR产物克隆到质粒pCR2.1 TOPO中，获得p5rbcL质粒。

[0161]质粒p5rbcL被Bam HI和Nde I酶切，将得到的片断连接到同样经过Bam HI和Nde I酶切的pCrGFPct或者pCrGFPncb上分别产生质粒p5CrGFPct和p5CrGFPncb。最终，p5CrGFPct和p5CrGFPncb再被Bam HI和Xba I酶切，将得到的958bp的片断连接到同样用Bam HI 和Xba I酶切之后的p3rbcL上，获得p53rGFPct和p53rGFPncb。

[0162]p53rGFPct和p53rGFPncb都用Nde I和Bam HI酶切，将1.2kb 的片断连接到pET19b(Novagen)中，分别产生可以在大肠杆菌中表达的质粒pETGFPct和pETGFPncb。p53rGFPct和p53rGFPncb接着用 Bam HI酶切，将1.43kb的片断连接到莱茵衣藻叶绿体转化载体p322 (Chlamydomonas Genetics Center，Duke University)，形成pExGFPct 和pExGFPncb质粒。

[0163]p322载体是基于莱茵衣藻叶绿体基因组DNA的核苷酸序列构建的，这段序列是从位置143073开始的Eco(Eco RI)位点到位置 148561开始的Xho(Xho I)位点(参见万维网，URL “biology.duke.edu/chlamy_genome/chloro.html”，点击“以文本文件格式察看整个基因组”；也可参见“叶绿体基因组图谱”链接，然后再点击“140-150kb”链接，察看位置大约是143.1kb的Eco位点和位置大约是148.5kb的Xho位点)。这段Eco/Xho叶绿体基因组序列被插入到用Eco RI/Xho I酶切过的pBS质粒(Stratagene公司，拉霍亚，加利福尼亚州)。p322上的Bam HI位点对应于叶绿体基因组DNA序列上从146522位置开始的位点。Southern和Northern杂交

[0164]Southern杂交和DNA的32P标记是按照Sambrook等，如上， 1989中描述的方法进行的。在Southern杂交中用到的放射性探针包括 2.2kb的p322Bam HI/Pst I片断(探测5’p322)，2.0kb的p322 Bam HI/Xho I片断(探测3’p322)和来自于p53rGFPct(探测GFPct)和 p53rGFPncb(探测GFPncb)的717bp的Nde I/Xba I片断。后两个探针还用于在Northern杂交中检测GFPct和GFPncb的mRNA。在 Northern杂交分析中用到的其它放射性探针包括psbA和rbcL cDNA。 Southern和Northern杂交都是采用配备了OPTIQUANT 软件包的 Packard Cyclone Storage Phosphor System来观察。蛋白表达，蛋白质印迹和荧光凝胶

[0165]根据制造商的操作手册，将质粒pETGFPct和pETGFPncb转化到大肠杆菌株系BL21中，用IPTG诱导带6His标记的GFPct或 GFPncb蛋白的表达。His标记的蛋白的纯化通过镍-琼脂糖亲合层析 (Qiagen)进行。蛋白质印迹按照Cohen等(如上，1998)描述的方法，利用一种鼠抗GFP一抗(Clontech)和一种碱性磷酸酶标记的抗鼠二抗(Sigma)进行。荧光凝胶的操作与用于考马斯亮兰染色和蛋白质转膜的凝胶操作相同，但是蛋白质在上样之前不需煮沸。凝胶中的GFP 通过型号为LB 981的Berthold Night Owl CCD相机观察，该相机配备了485nm的激发滤镜和535nm的发射滤镜(Chroma公司)。图像通过WinLight软件生成。GFPct和GFPncb激发谱的形成

[0166]激发谱是利用亲合纯化的GFPct和GFPncb蛋白在型号为 LS50的Perkin Elmer荧光光度计上产生。重组蛋白在光度计上读数之前被稀释到50mM NaH2PO4，300mM NaCl，250mM咪唑，pH 8.0的溶液中。扫描波长从350到550nm，在510nm处记录发射强度，从而得到激发谱。从头合成具有莱茵衣藻叶绿体密码子偏好性的GFP基因

[0167]为了开发出可以在莱茵衣藻叶绿体中强烈表达的报告基因，合成了其密码子使用经过优化而能反映出莱茵衣藻叶绿体基因组的密码子使用的绿色荧光蛋白基因。针对原始GFP(GFPncb)编码区设计了两个氨基酸变化，以改善蛋白的荧光和表达特性。这些氨基酸改变中的第一个改变并不认为会影响到GFP的光谱性质，它是将在氨基酸位置2上的丝氨酸变成丙氨酸，这样可以使起始密码子处于一个更加合适的序列环境中。第二个改变是氨基酸位置65的丝氨酸变成苏氨酸，这个改变相对于原始GFP可以增强在485nm处的激发幅度(大约6倍)，同时降低395nm处的激发幅度(Heim等，Nature 373：663-664，1995，这篇文献在此整入以供参考)。这个改变被引入到GFPct编码序列中以改善使用可见光时的荧光检测。正如在图1中显示的，GFPncb基因与野生型GFP基因相比，还有一个氨基酸改变，Q80R。这个改变是在挑选克隆之前，原始GFP基因的PCR扩增过程中被导入的。这个Q80R 突变是一种在采用PCR扩增原始GFP编码序列时常见的改变(Tsien，如上，1998)，它对蛋白质的功能没有影响。这样，为了一致性，这个改变也被引入到GFPct基因中。大肠杆菌中表达的GFPct和GFPncb的表征

[0168]为了确定GFPct基因和GFPncb基因是否能够产生功能性的 GFP蛋白，由转化了pETGFPct或者pETGFPncb的细胞制备的大肠杆菌细胞裂解物被用来检验。大肠杆菌裂解物的镍亲合色谱得到了具有正确GFP分子量的蛋白。用SDS-PAGE分离大肠杆菌产生的蛋白，直接荧光分析显示这两种蛋白在蓝光照射下都会发出荧光，而且它们显示出的荧光性质的微小差异也与导入的氨基酸变化一致。GFPct中的 S65T变化导致蛋白在485nm处的荧光水平大大增强(相对于GFPncb 蛋白在检测中的用量，大肠杆菌中表达的GFPct蛋白的用量只有前者的1/5)，而且它在395nm激发时的荧光大大降低(参见图2)。利用抗原始GFP的鼠多克隆抗体进行的蛋白质印迹分析显示，GFPct和 GFPncb发出类似的信号。在GFPct蛋白的光谱性质相对于GFPncb蛋白被有意增强的情况下，这个结果显得非常的重要。这样，基于可见光下的激发(485nm)的荧光检测会更加有利于GFPct蛋白的检测，而同时免疫标记则没有区别，这就允许对GFPct蛋白和GFPncb蛋白在莱茵衣藻叶绿体中的积累进行直接比较。GFPct和GFPncb转化子的Southern和Northern杂交

[0169]证明了GFPct和GFPncb编码序列可以产生功能性的GFP蛋白之后，便用pExGFPct和pExGFPncb转化莱茵衣藻叶绿体。另外，这些细胞还用可以赋予大观霉素抗性的选择性标记质粒p228进行共转化。原代转化子通过PCR以及Southern杂交分析进行筛选，接着阳性的转化子再通过额外的数轮筛选分离出同质细胞系(homoplasmic lines)，在这样的细胞系中所有的叶绿体基因都含有导入的GFP基因。

[0170]两个同质GFPct转化子18.3和21.2以及两个GFPncb同质转化子5.8和12.1被挑选出来作进一步分析(参见图3A，显示的是标示有相关的限制性位点的GFPct和GFPncb构建物)。利用在基因图谱上标示出来的探针，确定质粒pExGFPct和pExGFPncb的7.1kb的 Eco/Xho区域已经正确地整合到叶绿体基因组中(图3B)。从野生型和GFPct转化子和GFPncb转化子中获得的基因组DNA经过Eco RI 和Xho I酶切，在琼脂凝胶上分离，接着进行Southern杂交分析。由于rbcL的5’UTR含有一个Eco RI限制性位点(图3A)，所以用Eco RI 和Xho I酶切转化子DNA与野生型DNA相比，应该会产生一段更小的与p322的5’端或者3’端探针杂交的片断。

[0171]莱茵衣藻叶绿体的GFPct和GFPncb转化子的Southern杂交分析证明了转基因细胞系是同质的。莱茵衣藻的DNA同时用Eco RI和 Xho I酶切，然后滤膜再与放射性探针杂交。5’p322的32P标记探针和 3’p322的32P标记探针分别和GFPct和GFPncb转化子中3.7kb和3.3kb 的Eco RI片断杂交。然而，正如被预料的，同样的这些探针是与没有转化的野生型莱茵衣藻株系中5.7kb的Eco RI/Xho I片断杂交。DNA 印迹被洗掉，然后重新用GFPct和GFPncb特异性的探针探测。用 GFPncb特异性的探针在转化子5.8和12.1中检测到3.3kb的Eco RI/Xho I片断(图4，中间板块)，而且类似大小的片断也在转化子18.3 和21.2中用GFPct特异性的探针检测到。而用这两种探针在野生型莱茵衣藻DNA中检测不到任何信号。GFP mRNA在转基因株系中的积累

[0172]总RNA的Northern杂交分析被用来确定GFPct和GFPncb基因是否在转基因莱茵衣藻的叶绿体中转录。10微克总RNA从野生型，转基因细胞系5.8，12.1，18.3，21.2中被分离出来，并且在变性琼脂凝胶上分离，然后印记到尼龙膜上。两份同样的滤膜与32P标记的psbA 或者rbcL cDNA探针杂交，每个株系中积累的psbA和rbcL mRNA 的水平都相似，这证明等量的RNA被上样到每一个泳道中，而且叶绿体转录和mRNA的积累在这些转基因株系中都是正常的。

[0173]这些滤膜被洗脱之后再重新用GFPct和GFPncb特异性探针探测。株系5.8和12.1积累GFPncb mRNA，而株系18.3和21.2则积累 GFPct mRNA。正如预测的一样，没有GFP信号在野生型细胞中被观察到。所有四种cDNA探针被标记成具有几乎相等的比活度，得到的 GFPct和GFPncb信号是相似的，而GFP探针探测的两种滤膜需要更长(大约是4倍)的曝光时间才能够达到和rbcL探针类似的信号。这些结果表明GFP mRNA的积累水平大约是内源rbcL mRNA的四分之一。分析GFP在转基因莱茵衣藻叶绿体中的积累

[0174]为了测定GFPct和GFPncb蛋白在转基因细胞系中的积累水平，通过荧光分析和蛋白质印迹分析来测定GFP。比较表达GFPct的莱茵衣藻转基因株系21.2和表达GFPncb的株系5.8和12.1中GFP的积累。细胞在连续光照下(5000勒克斯)生长到密度为1×107个细胞每毫升，这个生长条件是已知的可以最大限度的积累GFP的条件。对可溶性总蛋白进行SDS-PAGE分析，接着用抗GFP的抗血清进行蛋白质印迹分析。对于GFPncb转基因株系5.8和12.1，用20微克可溶性总蛋白上样，而对于GFPct转基因株系21.2，用250ng(1/80)到20 微克(1/1)的可溶性总蛋白上样。

[0175]6微克可溶性总蛋白(tsp)通过SDS-PAGE分离，得到的凝胶用于考马斯亮兰染色，荧光成像，或者蛋白质印迹分析。考马斯亮兰染色后的凝胶(从指定的莱茵衣藻株系中分离出来的6微克可溶性总蛋白被上样到12％的SDS-PAGE凝胶上)表明同等量的蛋白被上样到每个泳道中。荧光凝胶(蛋白制备与考马斯亮兰染色凝胶的情况类似，但是样本在上样之前不煮沸；蛋白通过SDS-PAGE分离)——激发波长设置在485nm，发射波长设置在535nm；485nm激发，535nm发射时成像——表明只有GFPct转化子18.3和21.2才有信号。当激发波长为366nm的时候，对于任何GFP转化子都没有荧光信号。表明GFPct 和GFPncb蛋白在转基因莱茵衣藻株系的叶绿体中表达。

[0176]对同样的样本进行的蛋白质印迹分析给出了和荧光分析类似的结果，在GFPncb转化子中没有检测到GFP，而在GFPct株系中有很好的信号(在蛋白质印迹分析中，叶绿体表达的GFP蛋白被转移到硝酸纤维素膜上，并用抗GFP抗血清检测)。进行滴定试验以更加准确地确认GFPct和GFPncb转化子之间GFP积累的不同。来自于 GFPncb转化子5.8和12.1的20微克tsp与来自于GFPct转化子21.2 的tsp一起被分离。对于GFPct株系，蛋白浓度从20微克变化到250ng。样本之间的比较表明，在转化子21.2中GFPct的积累水平大约是在任何一种GFPncb转化子中观察到的80倍左右。利用针对叶绿体优化的GFP作为叶绿体基因表达的报告子

[0177]研究了不同生长条件对转基因株系中GFPct的积累的影响，以便确认GFPct基因可以作为叶绿体基因表达的报告子。在收获细胞之前，莱茵衣藻的GFPct转基因株系21.2在恒定的光照条件下，维持在 1×106个细胞每毫升的密度，所述光照的强度是5000勒克斯(高光照) 或者450勒克斯(低光照)。对于每一份处理样本，取1微克tsp进行蛋白质印迹分析。研究了光强度对莱茵衣藻中GPFct的积累的影响。在收获之前，莱茵衣藻转基因株系21.2在指定光强的恒定光照下被维持在1×106个细胞每毫升或者1×107个细胞每毫升的浓度达48个小时。可溶性总蛋白(1微克)上样到12％SDS-PAGE上分离，用抗GFP 一抗来进行蛋白质印迹分析。

[0178]细胞在以5000勒克斯的恒定光照下维持于1×106个细胞每毫升的浓度时，积累的GFPct的量大约是在低光照下维持于1×106个细胞每毫升的浓度时细胞中的表达量的10％左右。将第三个摇瓶在5000 勒克斯的恒定光照条件下维持细胞浓度为1×107个细胞每毫升，GFP 可以再次积累至高水平，因为在培养物内高的细胞密度起到了降低光照强度的作用，实际上就是创造了低光照的环境。这些结果证明，GFPct 基因可以用于报告由于微小的环境变化所导致的蛋白合成的差异，证明了GFPct基因可以作为叶绿体基因表达的报告子。

[0179]已经有数种异源基因被用作莱茵衣藻中叶绿体基因表达的报告子，但是它们的实用性都由于低水平的蛋白表达而受到限制。这些异源蛋白在莱茵衣藻叶绿体中的低水平表达有几个可能的原因。例如，用来驱使这些基因转录的启动子可能导致了低水平的转录。或者，其中一些报告基因的mRNA先天不稳定，结果导致低水平的mRNA积累。另外一种可能是这些嵌合的mRNA缺乏翻译所需要的RNA元件。莱茵衣藻叶绿体基因强烈的密码子偏好也有可能阻碍异源mRNA的翻译。

[0180]虽然启动子的活性和mRNA的稳定性会在很大程度上影响基因在叶绿体中的表达，但是对转基因莱茵衣藻叶绿体的分析表明有足够的异源mRNA积累以支持高水平的蛋白质合成。另外，在绝大多数情况下，莱茵衣藻的5’UTR和3’UTR都会在嵌合基因的构建中被使用，这使得这些报告基因的mRNA不太可能缺乏关键的RNA元件。如在此公开的，更改密码子使用可以作为提高异源蛋白在莱茵衣藻叶绿体中的积累的一种手段。这种改变密码子使用的方法可以通过水母的绿色荧光蛋白(GFP)来说明。

[0181]GFP的GFP编码区被工程改造，以使蛋白编码序列的密码子使用与莱茵衣藻叶绿体基因组相配。将这种GFPct基因以及原始GFP 基因(GFPncb)的表达置于莱茵衣藻叶绿体rbcL的5’端非翻译区和3’ 端非翻译区的控制之下。GFPncb基因和GFPct基因都可以在莱茵衣藻叶绿体中转录，并且mRNA积累的水平相当。

[0182]表达GFPct的转基因株系中GFP的积累量大约是表达GFPncb 的株系中的80倍。在优化的生长条件下，产生GFPct的株系21.2中积累的GFP大约占可溶性总蛋白的0.5％左右。这个水平的蛋白表达使得可以通过细胞总蛋白的荧光检测来分析GFP的表达。以前有报道，在莱茵衣藻叶绿体中，uidA(GUS)在rbcL的5’UTR和3’UTR控制下的表达表现出低水平的蛋白表达，大约占可溶性蛋白的0.01％；这个水平的GUS积累与从使用了相同的rbcL控制元件的GFPncb基因获得的GFP积累水平相当(Ishikura等，如上，1999，这篇文献还报道了 rbcL-GUS mRNA的相对低水平积累)(类似于rbcL GFP mRNA的低水平，如在此公开的)。

[0183]与GFPncb基因相比，GFPct基因中一共有123个密码子变化，其中包括121个同义密码子变化和两个使氨基酸发生替换的密码子变化(参见上面内容)。这121个同义密码子变化中，有66个变化代表着向更加优化的密码子使用的温和转变。在剩下的密码子中，54个变化导致不常用的密码子被常用的密码子代替。这种密码子优化基本上平均分布于整个GFP基因中，其中有15个变化位于编码区域的前三分之一，20个变化位于中间三分之一和18个变化位于后三分之一。

[0184]对于以前报道的在莱茵衣藻叶绿体中表达的基因的分析，这些基因包括Renilla荧光素酶(Minko等，如上，1999)，uidA(Sakamoto 等，如上，1993)，aadA(Goldschmidt-Clermont，如上，1991)和aph A6 编码序列(Bateman和Purton，如上，2000)，表明在以上各基因中分别有61，252，121和65个非优选的密码子。如果这些非优选的密码子在这些报告基因中的数目以它们占总密码子数目的百分比来算的话，分别是20％，42％，46％和25％。这与GFPncb基因的情况可以相比，在GFPncb基因中有占密码子总数的23％的非优选密码子。这些结果表明这些其他报告子在莱茵衣藻叶绿体中的表达可以通过改变密码子使用而得到大大增强。

[0185]因为GFP序列的碱基组成已经被明显地改变了，所以针对 GFPct和GFPncb的mRNA研究了这些改变对于mRNA结构的影响。这个分析确定了GFPct mRNA的翻译的增强是由于密码子使用的不同，而不是mRNA二级结构可能阻碍GFPncb定位到核糖体上的的影响。GFPct和GFPncb的mRNA的前250个核苷酸用RNA折叠程序 mfold(Zucker等，在RNA Biochemistry and Biotechnology 11-43(ed. Barciszewski和Clark，NATO ASI Series，Kluwer Acad.Publ.1999； Matthews等，J.Mol.Biol.288：911-940，1999)来研究。在这两个基因之间没有预测到任何明显的二级结构差异，其中GFPct序列的最适结构的自由能为-42kcal，而GFPncb序列则是类似的-38kcal。

[0186]在此公开的结果证明优化密码子使用可以促进多肽的翻译和表达，比如优化的GFPct基因，它可以用作莱茵衣藻叶绿体基因表达的报告子。证明了密码子优化可以用于在莱茵衣藻中获得高水平的重组蛋白表达，这表明密码子优化一般可以提高其它异源多肽在植物叶绿体中的翻译效率。与内源性的rbcL mRNA相比相对低水平的GFP mRNA积累表明，优化GFPct的启动子活性和mRNA稳定性可能会提供一种将GFPct的信号增强到更高的或者更加需要的水平的方法。这样，GFPct基因提供了一个可以用于方便地优化GFP在植物叶绿体包括莱茵衣藻叶绿体中的转录、mRNA稳定性和翻译的工具。实施例2
植物叶绿体核糖体结合序列(RBS)的表征

[0187]本实施例说明了在叶绿体中指导翻译的核糖体结合序列的鉴定和表征。突变体的构建和表征

[0188]利用下面的寡聚核苷酸对psbA 5’UTR进行PCR扩增，产生位点特异性突变：5-GAAGCTTGAATTTATAAATTAAAATATTTTTACAATATTTTACC CAGAAATTAAAAC-3’(RBS-Alt；SEQ ID NO：23)；
5’-TGTCATATGTTAATTTTTTTAAAGTTTTTCTCCGTAAAATATTG -3’(RBS-23；SEQ ID NO：24)；
5’-TGTCATATGTTAATTTTTTTAAAGTCTCCGTAAAATATTG-3’ (RBS-19，SEQ ID NO：25)；
5’-TGTCATATGTTAATTTTTTTTCTCCGTAAAATATTG-3’(RBS-15； SEQ ID NO：26)；
5’-GTCATATGTTAATTTCTCCG-3’(RBS-11；SEQ ID NO：27)；和
5’-TGTCATATGTTAATCCTCCTAAAGTTTTAATTTCTCCG-3’ (RBS-Add；SEQ ID NO：28)。

[0189]质粒构建和莱茵衣藻的转化是按照Mayfield等(如上，1994) 的描述进行的。16S-1470/71和16S-1467/68突变体是采用 QUICK-CHANG突变试剂盒(Qiagen)构建的。突变体通过northern 杂交或者蛋白质印迹分析来表征。RNA提取，northern杂交分析，蛋白质分离，蛋白质印迹分析，以及体内条件下对蛋白用(14C)-乙酸盐进行的脉冲标记都是按照Cohen等(如上，1998)的描述进行的。

[0190]对于“脚趾印记(toeprinting)”分析，30S的核糖体亚基按照 Harris(Microbiol.Rev.58：700-754，1989，这篇文献在此整入以供参考) 描述的方法分离，作了一些小的改动。野生型莱茵衣藻细胞(2137a) 重悬于TKMD缓冲液(25mM Tris-HCl(pH 7.8)，25mM KCl，25mM MgOAc，5mM DTT)，然后通过一次高压细胞破碎仪(French press) 来破碎细胞，压力为5000psi。细胞渗出物再在Beckman JA-20转头中 40000×g，4℃离心30分钟。将200个A260单位的上清放入具有10-30％蔗糖线性梯度的TKMD缓冲液当中，缓冲液中还含有100mM KCl，以用于30S和50S的核糖体亚基的一步分离。所述梯度在Beckman SW28.1转头中22500rpm，2℃离心20小时。用可以读取260nm处吸光度值的光学扫描器和部分收集器处理所述梯度。30S和50S级分分别收集到一起，然后用含有800mM KCl的高盐TKMD以1∶1的比例稀释，然后再在Beckman TLA-100转头上200000×g，4℃离心20小时。再将这些沉淀在含有100mM KCl的TKMD缓冲液中重悬，然后在液氮中冷冻，存放在-70℃冷藏。30S和50S亚基之间的交叉污染的程度用RNA点杂交分析来检测(Cohen等，如上，1998)。

[0191]初始复合体的形成通过如Hartz等描述的延伸抑制(J.Mol.Biol. 218：83-97，1988，这篇文献在此整入以供参考)来分析，做了一些小的改动。在10微升的反应混合物有含有0.6pmol的5’端32P标记的寡聚核苷酸和0.2pmol的合成的psbA D1-HA转录物的退火混合物(参见实施例2)。延伸抑制从加入3.75mM dNTPs以及8×10-5到2×10-3μM 高盐洗脱过的30S核糖体亚基开始。反应在37℃温育5分钟之后，不带电的大肠杆菌tRNA(tRNAfmet；罗氏诊断试剂)加入到反应体系中，终浓度为5μM。再将AMV反转录酶(0.5个单位)加入，反应在37 ℃再温育15分钟。反应在8％的测序凝胶上分析。测序反应按照前面所描述的进行，使用的dNTPs的终浓度为200μM，而且没有核糖体或者tRNA存在。凝胶阻滞分析(gel shift assays)

[0192]大约1微克通过肝素琼脂糖纯化的蛋白(Cohen等，1998)和 0.4个单位的PRIME RNase抑制剂(5Prime→3Prime，Inc.)在总体积为8微升的透析缓冲液(20mM Tris-HCl(pH 7.5)，100mM KOAc，0.2 mM EDTA(pH 8.0)，2mM DTT，20％甘油，4mM MgCl2)中室温下温育 10分钟。加入0.04pmol的体外转录(32P)标记的psbA RNA，20微克小麦胚芽tRNA(Sigma)，以及3微克FuD7(缺少psbA mRNA的莱茵衣藻株系)总RNA之后，反应在室温下温育10分钟，所述的psbA RNA覆盖的区域是相对于翻译起始密码子-90到+171位置。在某些反应中，10pmol的没有标记的体外转录未标记的psbA RNA被加入到反应体系中作为竞争者。RNA/蛋白复合体在5％的非变性聚丙烯酰胺胶上分离。叶绿体30S核糖体亚基识别psbA 5’UTR中的Shine-Delgarno核糖体结合序列

[0193]为了鉴定叶绿体mRNA翻译所需要的RNA元件，5’UTR中含有位点特异性突变的psbA基因变异体被导入到psbA缺陷性莱茵衣藻株系的叶绿体中(Mayfield等，如上，1994)。psbA 5’UTR中可能的定位于起始密码子上游27个核苷酸的RBS基于它识别叶绿体16S rRNA上的反义SD序列的潜能被鉴定出来。这段序列的缺失(RBS-del) 导致psbA mRNA与核糖体结合的失败，从而导致完全不能合成相应的 D1蛋白(Mayfield等，如上，1994)。虽然这个结果表明这个元件可能起到RBS的功能，但是这个缺失也有可能会通过一系列另外的机制来影响核糖体的结合，包括直接或者间接破坏结合于所述RBS邻近的 5’UTR的反式作用因子的结合位点(Yohn等，Proc.Natl.Acad.Sci.，USA 95：2238-2243，1998a；Yohn等，J.Cell Biol.142：435-442，1998b；Danon 和Mayfield，EMBO J.10：3993-4001，1991，每篇文献都在此引入作为参考；也可参见，Fargo等，如上，1998)。

[0194]RBS元件中的SD序列通过与30S核糖体小亚基的16S rRNA 的3’端的互补序列(反SD序列)配对而促进原核转录子的翻译(Voorma，在Translational Control(ed.Hershey等，Cold Spring Harbor Laboratory Press 1996)，这篇文献在此引入作为参考)。这种相互作用已经在体外利用纯化的30S核糖体亚基加入到原核转录子中而被测到(Hartz等，如上，1991)。结合的30S亚基阻止了mRNA上的下游寡聚核苷酸引物的延伸，结果形成核糖体的“脚趾印记(toeprint)”。

[0195]为了确定30S的亚基是否可以识别psbA mRNA的5’端非翻译区中的RBS，30S的核糖体亚基从莱茵衣藻中提取出来。与psbA mRNA 起始密码子下游的区域互补的5’端(32P)标记的寡聚核苷酸引物和纯化的体外合成的psbA转录子退火。将32P标记的寡聚核苷酸/RNA复合物与浓度递增的纯化的莱茵衣藻30S核糖体亚基，以及大肠杆菌的 fMet tRNA(参见实施例2)温育。由于核糖体亚基的结合会导致引物延伸过程中出现停留位点(pause sites)。进行测序反应以确定结合的核糖体的位置。在含有30S核糖体的反应中，脚趾印记反应的停留发生在Shine-Delgamo序列3’端12个核苷酸(RBS停留)和起始密码子 3’端12个核苷酸(AUG停留)。当叶绿体30S核糖体亚基与对应于 psbA mRNA的5’端的RNA转录子温育时，观察到引物延伸脚趾印记。这些停留发生在假定的SD序列和起始密码子下游大约12个核苷酸，这个结果同30S核糖体亚基与这两个序列结合相一致。大肠杆菌30S 亚基可以结合到来自于大麦的psbA mRNA上，其结果也揭示了一个对应于潜在的SD序列的脚趾印记，该SD序列的位置类似于来自于莱茵衣藻的psbA mRNA的SD序列的位置(Kim和Mullet，Plant Mol.Biol. 25：437-448，1994，这篇文献在此引入以供参考)。这些结果表明假定的RBS元件具有一个功能性RBS元件的特性。因此，这些体外生化数据支持前期研究得到的体内遗传证据的解释，也就是psbA mRNA中的 RBS元件定位在起始密码子5’端(上游)27个碱基处(Mayfield等，如上，1994)。16S rRNA中反SD序列的突变抑制一系列叶绿体mRNA的翻译

[0196]为了证明叶绿体核糖体通过与SD序列相互作用来识别信息，构建了两个同质莱茵衣藻株系，其中叶绿体16S rRNA的反SD序列被突变。定位在16S rRNA的3’端的反SD序列中的核苷酸从CCUCC变成了GGUCC(16S rRNA的1467和1468核苷酸)或者从CCUCC变成了CCUGG(16S rRNA的1470和1471核苷酸，也可参见，SEQ ID NO：29)。这些突变体在可以支持没有光合成的生长的完全培养基中培养时都是存活的，而且不表现出任何明显的由于叶绿体能量合成上的变化而导致的形态缺陷。16S-1467/68突变体株系可以在最小培养基上以降低的生长速度生长，而16S-1470/71突变体株系则不可以在最小培养基上生长，这些表明这些突变体中光合成的功能分别降低和去除了。

[0197]这些株系中叶绿体编码的蛋白的积累是通过蛋白质印迹分析来检验的。从野生型(wt)莱茵衣藻株系或者突变型16S-1467/68和 16S-1470/71中制备出同等量的总蛋白(通过考马斯亮兰染色测定)，再通过SDS-PAGE分离，然后印迹到硝酸纤维素膜上，接着用特异性的针对D1，D2，ATPase，或者Lsu蛋白的兔多克隆抗血清处理。16S rRNA中的反SD序列的突变影响了某些叶绿体蛋白的积累。psbA编码的D1蛋白在16S-1470/71突变体中没有积累，而在16S-1467/68突变体中只有野生型中积累水平的20％。psbD编码的D2蛋白表现出类似的情况，在16S-1470/71突变体中的积累水平还不到野生型的10％，而在16S-1467/68突变体中大约有25％。叶绿体ATPase的积累在 16S-1470/71突变体中也被削弱(只有野生型积累水平的50％)，尽管在16S-1467/68突变体中积累的水平和野生型接近。相反地，叶绿体编码的可溶性的核酮糖双磷酸羧化酶(Lsu)大亚基在任何一种16S突变株系中的积累都基本不受到影响。

[0198]D1蛋白在突变株系中积累的失败表明假定的RBS元件和16S rRNA之间的Shine-Delgamo相互作用是优化翻译所需要的。这些株系中D2蛋白积累的失败可能是由于psbD mRNA的翻译需要和psbA mRNA同样的反SD序列，或者是由于D1亚基的丢失导致D2蛋白合成之后不稳定。例如，不能合成PSII的单个亚基的莱茵衣藻核突变体也不能够积累由叶绿体编码的PSII的其他核心多肽，尽管这些蛋白也以同野生型一样的速度在合成(Erickson等，EMBO J 5：1745-1754， 1986)。

[0199]为了检验单个叶绿体蛋白的翻译速度，野生型株系，带有突变的16S rRNA的株系，以及缺乏psbA基因的莱茵衣藻株系，都用(14C) -乙酸脉冲标记。结果16S-1470/71突变体中几乎所有的膜蛋白，包括 D1，D2，P5，和P6蛋白，都没有合成。同等量的膜相关总蛋白或者可溶性总蛋白(Cohen等，Meth.Enzymol.297：192-208，1998，这篇文献在此整入以供参考；也可参见实施例2)从被(14C)乙酸脉冲标记的野生型和突变型莱茵衣藻株系中制备出来，蛋白的量是用考马斯亮兰染色测定，然后再将所有蛋白在SDS-PAGE上分离。14C标记的蛋白通过放射自显影成像。16S rRNA的反SD序列的突变降低了数种叶绿体编码的蛋白的合成速率。这个结果表明D2蛋白积累的下降不是由于D1蛋白积累的缺乏而导致的，而是psbD基因的翻译是需要反SD序列。 ATPase的mRNA的翻译在这个株系中同样也是降低的，虽然降低的程度要小于其他膜蛋白。受影响程度稍小一些的影响在16S-1467/68突变体中观察到，这与观察到的蛋白积累水平一致。一些膜相关的蛋白在 16S-1470/71株系中以和野生型中一样的水平持续翻译。与膜蛋白截然相反的是，可溶性叶绿体蛋白的翻译在16S rRNA突变体中几乎没有变化。可溶性蛋白以野生型中的速度合成说明带有16S rRNA中反SD元件的改变的叶绿体核糖体依然是有功能的，可以支持翻译。这些结果表明叶绿体中可溶性蛋白和膜蛋白的表达调控可能是通过一种依赖于 RBS的机制被不同地调控的。psbA编码的D1蛋白的表达需要RBS中SD序列的存在以及特定的间隔要求

[0200]RBS在psbA mRNA的翻译中的作用进一步采用莱茵衣藻株系验证，其中RBS由GGAG改变为CCAG(RBS-Alt)。每一个株系都在连续的光照下生长在完全(TAP)培养基中(参见实施例2)，等量的膜蛋白(通过考马斯亮兰染色测定)通过SDS-PAGE分离，然后印迹到硝酸纤维素膜上，再用针对D1蛋白的兔多克隆抗血清处理。由于 D1蛋白的不完全变性，由结合的叶绿体产生多个条带。RBS-Alt突变破坏了在psbA mRNA和16S rRNA 3’端之间潜在的SD碱基配对，但是并没有破坏5’UTR内其他元件的相对位置(参见图4)。如前面显示的RBS-del的结果(Mayfield等，如上，1994)一样，D1蛋白在RBS-Alt 中也没有积累。这个结果证明GGAG序列对于psbA的表达是必需的，如同一个真正的RBS。

[0201]如果认为在RBS和起始密码子的间隔大于15个核苷酸时，30S 的核糖体亚基不能够同时与这两段序列接触的话(Chen等，Nucl.Acids Res.22：4953-4957，1994)，那么psbA mRNA中与psbA起始密码子相距27个核苷酸的假定的SD序列应该就不能指导翻译在正确的起始密码子处开始。为了检验psbA mRNA的RBS的相对位置是如何影响表达的，一系列缺失突变被导入到5’端非翻译区中使得RBS元件距离起始密码子的距离越来越近(图4)。随着RBS被逐渐地向起始密码子移近，D1蛋白在莱茵衣藻细胞中的积累开始下降。那些使得所述RBS 的位置接近于原核RBS元件的最佳位置的缺失(RBS-15，RBS-11)，导致莱茵衣藻的叶绿体中没有D1蛋白的积累。进一步，在野生型psbA 的RBS序列存在的条件下，在起始密码子上游7个核苷酸位置加入额外的原核RBS元件(SD-add)并没有促进D1的积累。D1蛋白在psbA突变株系中的积累失败并不是mRNA的稳定性丢失造成的

[0202]虽然在其psbA的5’UTR的假定SD序列中存在突变的株系不能积累D1可以用核糖体不能识别来解释，但是还有其他解释存在。比如，使转录子不稳定的突变常常降低mRNA积累的水平，这也可以导致翻译水平降低或者蛋白积累水平降低。psbA mRNA在含有影响RBS 序列的定点突变的莱茵衣藻株系中积累。来自于总RNA库中或者核糖体相关的RNA库中的psbA mRNA的水平通过特异性针对psbA或者 16S rRNA(保证同样的上样量)的放射性标记探针来检测。相对的psbA mRNA水平通过16S rRNA的差异来校正，然后再通过野生型进行归一化。

[0203]虽然psbA的5’端非翻译区中SD序列的突变导致积累的psbA mRNA的稳态水平降低，但是积累的mRNA的相对水平并不与观察到的D1蛋白的积累水平相一致。比如，RBS-23突变体中D1蛋白的积累水平就比较高，而psbA mRNA的水平下降了50％。RBS-15和RBS-11 株系不能够积累任何D1蛋白，或者是不能够在最低生长条件下生长，但是，即便如此，它们积累的psbA mRNA的水平却和RBS-19突变体的差不多，而后者却可以积累D1蛋白。事实上，积累相当于野生型 psbA mRNA水平的仅仅10％，比如在RBS-del和RBS-Alt突变体中观察到的情况，就足够可以在另外的psbA突变体中观察到野生型水平的 D1蛋白积累(Mayfield等，如上，1994)。这样，所观察到的由于那些突变而造成的影响并不能归咎于mRNA稳定性/积累的变化。

[0204]如果psbA的5’端非翻译区的突变/缺失导致结构改变而致使产生的转录子不能够被翻译，也可能发生D1蛋白积累的丢失。为了确定核糖体是否能够识别SD序列，纵使存在着改变SD序列和起始密码子的相对位置的突变，通过将细胞抽提物在蔗糖缓冲液中离心使来自于各种突变株的核糖体相关RNA与自由mRNA分开。在含有改变的或者缺失的RBS的株系中，与核糖体相关的psbA mRNA水平大大降低。然而，含有RBS元件的每个株系都有明显数量(大于野生型水平的 50％)的psbA mRNA与核糖体缔联，即使是在一些不能够积累D1蛋白的株系中。不能够积累D1蛋白表明，RBS-15和RBS-11突变株中核糖体相关RNA主要是由和单核糖体而不是多核糖体结合的RNA组成。

[0205]为了进一步证明使SD序列更加靠近起始密码子的突变并不是无意地阻止70S核糖体上的翻译，构建了嵌合基因，其中含有的细菌荧光素酶的编码区域被安放在野生型或者突变型psbA 5’UTR的后面。这些嵌合基因被转化到大肠杆菌中，荧光素酶mRNA的翻译是通过发光活性来检测的。在大肠杆菌中荧光素酶的表达模式与在莱茵衣藻中观察到的D1的表达模式相反。使psbA SD序列更加靠近起始密码子的突变重新促进细菌中的翻译。来自于哈氏弧菌(Vibrio harveyi)的细菌荧光素酶基因(lux AB)的编码区域融合到野生型(wt)或者突变型 psbA 5’UTR，再连接到含有野生型psbA启动子和3’UTR的质粒中。这些质粒再被转化到大肠杆菌BL21(DE3)株系中，然后在荧光素酶底物n-癸醛存在的条件下，应用摄像机通过光子计数来监测荧光素酶的翻译(Welsh和Kay，Curr.Opin.Biotech.5：617-622，1997，这篇文献在此引入作为参考)。每个株系相对于最佳表达(RBS-11)的百分比被测定出来。在细菌中由含有距离起始密码子上游11到15个核苷酸的RBS的构建物高效地翻译出荧光素酶，但是当RBS的定位距离起始密码子上游超过19个核苷酸时，翻译效率非常低。这个结果与关于莱茵衣藻的atpB mRNA的5’UTR的报道形成反差，后者被报道可以驱使在细菌或者叶绿体中进行相似水平的翻译(Fargo等，如上，1998)。

[0206]莱茵衣藻的psbA和psbD转录子的5’端非翻译区内的序列可能影响mRNA加工。psbA 5’UTR在体内在RBS序列上游4个核苷酸位置处被剪切，而这个成熟过程与核糖体结合相关联，而且依赖于RBS 序列的存在(Bruick和Mayfield，如上，1998)。对psbA 5’端的分析提供了额外的证据证实来自突变体的psbA RBS序列被参与核糖体早期组装的因子所识别。叶绿体psbA突变体的引物延伸分析证明psbA的5’ 端非翻译区在每一个含有RBS序列的株系中都经过加工过程，但在 RBS-Alt和RBS-del突变体中却没有观察到(参见图4；也可参见，Bruick， Graduate Thesis，Scipps研究所，1998)。这些结果表明RBS-15和RBS-11 株系中RBS元件被叶绿体中的核糖体亚基识别，但是这种识别，由于其本身的原因，不足以指导在起始密码子处的正确翻译起始。psbA 5’端非翻译区的缺失突变并不阻止核编码的反式作用翻译因子的结合

[0207]核编码的蛋白复合物特异性地识别psbA 5’端非翻译区，并且可以通过刺激翻译起始而极大地增强D1蛋白的合成(Danon和 Mayfield，如上，1991；Yohn等，如上，1998a；Yohn等，如上，1998b)。为了确定psbA 5’端非翻译区的突变是否会影响这个复合体结合mRNA 的能力，应用体外凝胶阻滞分析来测定各个突变体中RNA结合的亲和力。进行psbA特异性复合物与psbA 5’UTR的结合的凝胶阻滞分析。放射性标记的对应于野生型psbA的5’端的RNA片断在体外被转录出来，然后与用肝素琼脂糖纯化的蛋白在一起反应。RNA/蛋白相互作用导致RNA在非变性PAGE胶上阻滞。250倍逾量的非标记的竞争 RNA也被加到同样的反应中。对应于来自于各个突变体的psbA 5’UTR 的过量的未标记的RNA用于竞争蛋白复合物与对应于野生型psbA 5’UTR的标记RNA的结合。每个突变体的psbA的5’端非翻译区都在体外条件下被蛋白复合物识别，只有RBS-11的RNA没有能够完全竞争掉野生型RNA与蛋白复合物的结合。这个结果表明这些突变体中的大部分的翻译丢失不是由针对这些翻译激活蛋白的特定结合序列的丧失造成的。

[0208]起源于内共生的原核生物的叶绿体的转录和翻译机制通常类似于细菌。叶绿体启动子含有一些类似于细菌的元件，而且质体启动子可以驱动在大肠杆菌中的转录。叶绿体的核糖体明显地与细菌中的核糖体有同源关系，而且叶绿体的核糖体RNA和核糖体蛋白表现出与细菌中对应物高度的保守性(Harris等，如上，1994)。叶绿体mRNA 也和原核生物的mRNA一样，末端没有帽结构，一般也不多聚腺苷酸化，而且可以含有多顺反子信息。在叶绿体中的翻译装置保留它的一些原核生物特征的同时，经过时间的积累，许多调控特性已经开始受制与细胞核。叶绿体的类似原核生物的组分是如何与源自细胞核的反式作用调控因子整合的，至今仍然所知甚少。

[0209]由于叶绿体翻译装置的原核生物特性，Shine-Delgamo(SD) 相互作用在早期被认作是叶绿体翻译可能的调控子。然而，在大多数情况下可被鉴定的SD序列都定位在相对起始密码子上游太远的位置，以至都不认为是保守的RBS元件。结合变异研究，其中类似细菌的保守SD序列的突变并没有导致翻译的丧失，SD相互作用在叶绿体翻译中的重要性被解除了(Fargo等，1998；Koo和Spremulli，1994；Rochaix， 1996；Sakamoto等，1994)。

[0210]为了研究SD相互作用一般对于叶绿体翻译的影响，特别是对于psbA mRNA的翻译的影响，叶绿体16S rRNA中反SD序列被突变，从而破坏与假定的SD序列可能的碱基配对。结果这样的核糖体依然保持合成可溶性叶绿体蛋白的能力，这表明这些16S突变一般不抑制核糖体的活性或者功能。然而，绝大多数，但不是全部的膜相关叶绿体蛋白的合成由于16S rRNA中反SD区域的突变而受到了严重的影响。这些结果表明了反SD区域在叶绿体翻译中的重要性，并且表明这个元件可能是质体中翻译调控的一个组分。

[0211]为了从mRNA这一边来研究SD相互作用，一系列突变被导入到psbA mRNA中定位在起始密码子上游27个核苷酸位置的可能的SD 序列中，前期的研究工作暗示该可能的SD序列是psbA mRNA的加工和翻译过程中重要的元件(Bruick和Mayfield，如上，1999；Mayfield等，如上，1994)。如在此公开的，psbA的SD元件的突变破坏了mRNA/ 核糖体的联合，而且破环了psbA的翻译和D1蛋白的积累。综合16S 突变分析和脚趾印记分析，这些结果证明Shine-Delgarno相互作用对于 psbA mRNA的翻译是需要的，而且对于其他一系列叶绿体mRNA也是如此。

[0212]考虑到psbA mRNA中SD元件和起始密码子之间不寻常的间隔，叶绿体中位置效应对于SD功能的影响被研究。一系列使得psbA 的SD元件的定位更加接近与细菌中保守元件位置的缺失突变造成D1 在叶绿体中的翻译对应地降低，但是却可以促进这些转录子在细菌中的翻译。这个结果表明叶绿体和细菌在SD相互作用之后采用不同的机制来确定起始密码子。这些结果还证明了psbA mRNA中SD元件不在原核生物的SD元件的保守位置内，而且可以解释为什么其他质体 mRNA中在细菌保守位置处的可能的SD元件的缺失对于它们的翻译没有影响。

[0213]由于信息稳定性，核糖体缔合和翻译常常紧密地联系在一起，这样造成了鉴定mRNA的5’端非翻译区的突变的首要效应的困难性。已经表明psbD的5’端非翻译区中定位在起始密码子上游大约30个核苷酸位置的类RBS元件(AUGAG序列：PRB2)会作为一个信息稳定元件影响叶绿体中D2蛋白的合成(Nickelsen等，Plant Cell 11：957-970， 1999)。基于16S突变体中psbD翻译的丢失和PRB2元件与psbA的 SD元件的相对位置，PRB2元件很可能是psbD mRNA的SD元件。缺乏这个元件的突变体中psbD mRNA稳定性的降低，与那些观察到的影响psbA SD的各种突变一样，很有可能反映出核糖体不能缔合，而这种缔合原本可以保护mRNA免被降解(Wagner等，J.Bacteriol. 176：1683-1688.1994)。

[0214]16S突变体中膜蛋白和可溶性蛋白翻译的反差表明SD相互作用可能是叶绿体中翻译调控的一个造成差异的组分。对膜蛋白合成的研究表明至少两种膜相关蛋白在16S突变体中的翻译水平和野生型相当。两种16S突变体中膜蛋白的翻译差异表明叶绿体mRNA可能采用稍有不同的序列作为SD元件，而且暗示叶绿体中可能有两种类型的核糖体存在。

[0215]psbA mRNA中RBS元件的定位表明叶绿体中存在一种新的促使早期起始复合物从RBS迁移到起始密码子的机制。二级结构可以缩短某些原核信息中非典型定位的RBS元件之间的距离。然而，psbA的 RBS元件和起始密码子之间的核苷酸可以被明显地改变但psbA的翻译却不会丧失，预测这个区域相对来说对结构是无影响的。在真核生物的翻译起始过程中观察到的一种扫描(scanning)机制也被认为适用于叶绿体mRNA，但是需要ATP作为解旋酶活性的能量来源，这一特征还没有在叶绿体翻译中被描述。另外，叶绿体mRNA可能利用蛋白因子将在RBS处结合的30S亚基拉到起始密码子处与之作用。一种结合于psbA mRNA的5’端非翻译区的特异性蛋白因子同已知与翻译起始因子相互作用的真核蛋白具有同源性(Yohn等，如上，1998a)。这样的与真核蛋白类似的蛋白可能会将翻译起始复合物带到正确的起始密码子处，这样就可以作为叶绿体翻译调控子而发挥其功能。RBS元件和起始密码子之间额外的间隔可以为这些蛋白因子提供安放的位置，就像这里研究的绝大多数突变体都不会阻止这些因子的体外结合一样。类似的远距离SD序列还在高等植物的psbA的5’端非翻译区被鉴定到，这表明这样的SD元件是植物叶绿体mRNA的特征。实施例3
在叶绿体中表达抗体

[0216]本实施例证明了编码单链抗体的通过叶绿体密码子优化的多聚核苷酸在叶绿体中的表达，以及这种单链抗体组装成二聚体。

[0217]将编码可以特异性地结合单纯疱疹病毒(HSV)1型和2型的单链抗体(HSV8；SEQ ID NO：16)的多聚核苷酸(SEQ ID NO：15)通过pExGFP植物叶绿体载体转化到莱茵衣藻叶绿体中(参见实施例1)，不同的是用编码HSV8的多聚核苷酸(SEQ ID NO：15)代替GFP编码序列。来自于两个转化子(10.6和11.3)的可溶性总蛋白样本在有和没有还原剂二硫代苏糖醇(DTT)的情况下收集，然后在10％的 SDS-PAGE上采用Laemmli缓冲液系统进行分离，再转移到硝酸纤维素滤膜上(Cohen等，1998)用于蛋白质印迹分析。所述HSV8抗体包含一个有效连接的FLAG肽标记，可以采用抗FLAG肽标记抗体(M2 单克隆抗体；Sigma)和抗鼠碱性磷酸酶偶连的抗体(Sigma)来检测。

[0218]在所述两个不同的转化子中表达的HSV8单链抗体迁移到预料的分子量所在的位置(大约65kDa)。明显地，在没有DTT存在的条件下分离得到的HSV8抗体是作为一个二聚体进行迁移。这些结果证明蛋白复合物比如抗体二聚体可以在植物叶绿体中组装。同样，叶绿体密码子偏好的编码抗HSV抗体的单链Fv片断(SEQ ID NO：43) 的合成的多聚核苷酸(SEQ ID NO：42)被构建出来，并且在莱茵衣藻中表达，结果获得功能性的单链抗HSV Fv抗体。

[0219]当组合抗体文库解决了利用大量免疫谱的问题时，有效的生产这些复合分子依然是一个问题。这里，独特的大单链(lsc)抗体的有效表达在单细胞生物，绿藻，莱茵衣藻的叶绿体中实现。通过合成具有叶绿体密码子偏好性的lsc基因，并通过利用两套莱茵衣藻叶绿体启动子和5’端和3’端RNA元件中的一套来驱动嵌合基因的表达，从而实现高水平的蛋白积累。这种直接识别单纯疱疹病毒的糖蛋白D的lsc 抗体由藻以可溶性的形式产生，并且在体内条件下组装成更高级的复合体。除了通过二硫键的形成介导二聚化，所述抗体不经过任何可检测到的翻译后修饰。进一步，这些结果证明所述抗体的积累可以被用于培养所述藻的特定生长控制所调控，而且还可以通过选择用于驱动抗体基因表达的5’端和3’端元件来调控。这些结果证明藻类作为表达重组蛋白的一种平台的实用性，而且描述了一种新型的含有整个重链蛋白包括Fc结构域在内的单链抗体。

[0220]目前已经有大量异源蛋白表达系统可用于产生重组蛋白，而且每个系统都在蛋白质产量和操作的方便以及操作的费用上提供不同的优点(1)。单克隆抗体(mAbs)主要是通过在发酵设备中培养转基因哺乳动物细胞来生产的。由于高资金投入以及哺乳动物表达系统先天的复杂性，单克隆抗体的生产能力将会在未来5年内陷入供不应求的境地(2)。

[0221]由于通过哺乳动物细胞培养生产单克隆抗体具有缺陷，就需要建立另外的投入产出比高的生产单克隆抗体的方法以适应目前治疗蛋白的发展步伐。酵母和细菌表达系统虽然在培养基组分上来说更加经济，但是有好几个缺点，包括不能够有效地产生正确折叠的功能性分子，以及更加复杂的蛋白质的低产量。除了传统的发酵，已经有好几个研究组开始拓展陆生植物来生产单克隆抗体(3，4，5)。在这样的系统中，植物本身成了生物反应器，而抗体则沉积在叶或者种子组织中。虽然植物能够提供生物技术产业中前所未有的经济规模(比如，一个人可以种植几千英亩的玉米)，但是这种方法也有几个先天性的缺点。首先，从起始的转化事件到获得有用量(毫克到克)的重组蛋白所需要的时间长度可能会长达三年，比如对于玉米这样的物种。第二个考虑围绕着人类治疗药物在食用作物中的表达，这很可能由于(通过花粉)向周围作物的基因流(gene flow)而发生(6)，正如在表达苏云金杆菌杀虫蛋白的转基因玉米和本地长白猪之间发生的情况(7)。这些考虑使得控制机构可能会禁止表达人类治疗药物的转基因食用植物 (像玉米，水稻和大豆)的公开种植。

[0222]对叶绿体进行工程改造使之表达治疗用蛋白的尝试还是比较少的(8)，虽然在一些例子中重组蛋白相当高水平的表达已经在这种细胞器中实现了(9-12)。关于产生用于表达重组蛋白的转基因藻类的报道就更少了，尽管绿藻已经作为一种模式生物被用来了解从光调控和营养调控基因表达的机制到光合成装置的组装和功能的各个方面 (13)。如实施例1公开的，使GFP报告基因反映出莱茵衣藻叶绿体基因组的密码子偏好的密码子使用优化增加了GFP的积累大约80倍，占可溶性蛋白的0.5％(也可参见14)。

[0223]如在此公开的，人类单克隆抗体及其片断可以在转基因藻类的叶绿体中表达。大单链抗体基因被改造之后具有莱茵衣藻叶绿体密码子偏好性，并利用莱茵衣藻叶绿体atpA或者rbcL基因的启动子和5’ 端非翻译区来驱动表达。这种抗体直接识别单纯疱疹病毒糖蛋白D (15)，而且包含通过柔性连接肽融合在一起的轻链可变区和整个IgA 重链。这种lsc抗体在转基因叶绿体中作为可溶性蛋白积累，而且通过 ELISA分析确定其可以结合疱疹病毒蛋白。这种大单链抗体可以在体内组装成更高级的结构(二聚体)，而且不含有明显的翻译后修饰，除了与二聚化相关的二硫键。这些结果证明了藻类作为复杂重组蛋白的表达平台的实用性。方法
莱茵衣藻株系，转化和生长条件
[224]所有的转化都是按照如前所述(14)在莱茵衣藻株系137c(mt+) 上进行的。用于表达HSV8-LSC的莱茵衣藻转化子的培养在TAP培养基(19)中，培养温度为23℃，光照和细胞密度一定的条件下进行。
质粒构建

[0225]所有DNA和RNA操作都是基本上按照文献(20；21；也可参见，Mayfield等，Proc.Natl.Acad.Sci.，USA 100：438-442，2003，这篇文献在此引入以供参考)描述进行的。HSV8-lsc基因的编码区(SEQ ID NO：47)是根据文献(22)的方法和前面描述(14)的方法从头合成的。根据制造商的操作手册，将得到的1893bp的PCR产物克隆到质粒 pCR2.1 TOPO(Invitrogen公司)中。atpA和rbcL的启动子和5’端非翻译区，以及rbcL的3’端非翻译区是通过PCR生成的(14)。Southern和northern杂交分析

[0226]Southern杂交和用作探针的DNA的32P标记是按照文献描述 (20)的方法进行的。用在Southern杂交上的放射性标记探针包括2.2kb 的p322 Bam HI/Pst I片断(探测p322的5’端)，2.0kb的p322 Bam HI/Xho I片断(探测p322的3’端)和来自于HSV8-lsc的1926bp的 Nde I/Xba I片断。另外的用于northern杂交分析的放射性探针包括psbA cDNA。Southern杂交和northern杂交都是采用配备了Optiquant软件的 Packard Cyclone Storage Phosphor System来检测结果的。蛋白表达，蛋白质印迹和ELISA

[0227]为了进行蛋白质印迹分析，按照文献(14)描述的方法从莱茵衣藻中分离出蛋白。Flag亲合纯化的莱茵衣藻HSV8-lsc在含有完全蛋白酶抑制剂鸡尾酒剂片(complete protease inhibitor cocktail tablets， Roche，Inc.)和终浓度为1mM的苯甲基磺酰氟(PMSF)的TRIS缓冲盐溶液(TBS；25mM TRIS pH 7.4，150mM NaCl)中分离出来。根据制造商的操作手册，抽提物用抗Flag M2琼脂糖珠(Sigma)纯化。ELISA 分析是在96孔微滴定板(Costar)中进行的，100微升的体积用100 微升的HSV蛋白包被。

[0228]用于ELISA的样本用封闭缓冲液稀释，封闭缓冲液由磷酸盐缓冲液(PBS；137mM NaCl，2.7mM KCl，1.8mM K2PO4，10mM Na2HPO4，pH 7.4)和5％的脱脂无水牛奶组成。在4℃和摇晃的条件下温育8小时。然后用PBS和0.5％的Tween 20漂洗96孔板3次，然后再在4℃用抗Flag抗体温育8个小时。再次漂洗96孔板三次然后用碱性磷酸酶偶连的羊抗鼠抗体(Santa Cruz生物技术公司)在4℃温育8 个小时。再次用PBS和0.5％的Tween 20漂洗96孔板三次，然后用100 微升对硝基苯磷酸酯(pNPP，Sigma)显色。反应通过加入50微升3N 的NaOH终止。

[0229]蛋白浓度是利用BioRad蛋白分析试剂来测定的。蛋白质印迹是按照文献(23)描述的方法，利用鼠抗Flag一抗(Sigma)和碱性磷酸酶偶连的羊抗鼠二抗(Santa Cruz生物技术公司)进行的。结果
利用具有密码子偏好的多聚核苷酸在莱茵衣藻叶绿体中从头合成大单链抗体基因

[0230]为了实现重组抗体在在莱茵衣藻中的强烈表达，利用经优化而能反映出被大量翻译的莱茵衣藻叶绿体mRNA的偏好性的密码子来合成单链抗体基因。这种工程化的抗体是来自于展示在噬菌体上的人类抗体文库，而且通过与单纯疱疹病毒蛋白的作用被鉴定出来(15)。这种被称为HSV8的抗体以前被证明可以结合病毒表面抗原糖蛋白D (16)，而且这种抗体的Fab或者IgG1形式在体外和体内都可以作为有效的中和抗体(15，16)。

[0231]由于简单的scfv抗体可以在细菌或者酵母系统中合成，因此尝试在叶绿体中合成更加复杂的，但仍然可以由单个mRNA翻译的抗体。一条单链抗体经过设计含有通过柔性连接肽融合在一起的整个重链和轻链可变区。这种独特的大单链(lsc)蛋白的一级氨基酸序列如SEQ ID NO：48所示，这段序列由序列SEQ ID NO：47编码。构建嵌合的莱茵衣藻叶绿体大单链抗体基因

[0232]为了得到表达重组抗体的转基因叶绿体，合成一段嵌合基因，这段基因含有atpA或者rbcL启动子和5’端非翻译区，并融合到密码子优化的HSV8-lsc编码区上，接着还有rbcL的3’端非翻译区(分别是图5A和5B)。整合基因到叶绿体基因组中是通过同源重组完成的，这需要转化载体和叶绿体基因组之间的序列同源性(17)。莱茵衣藻叶绿体转化载体p322(14)被利用。正如图5B所展示的，所述嵌合抗体基因被连接到p322的Bam HI位点，从而产生质粒 p322/atpA-HSV8和p322/rbcL-HSV8。这些p322/HSV8构建物与质粒 p228通过颗粒轰击(17)被共转化到莱茵衣藻的叶绿体中，p228含有一段可以赋予大观霉素抗性的16S核糖体基因。HSV8-lsc转基因叶绿体的Southern杂交分析

[0233]初始转化子(primary transformants)在含有大观霉素的培养基上被挑选出来，并通过Southern杂交分析筛选出整合有HSV8基因的转化子。HSV8阳性转化子经过额外的数轮选择以分离出同质细胞系，其中所有叶绿体基因组的拷贝都含有导入的HSV8-lsc基因。两个同质转化体被挑选出来，一个是10-6-3，它含有控制HSV8-lsc的atpA启动子，而另外一个是20-4-4，它含有控制HSV8-lsc的rbcL启动子。从野生型和这两个HSV8-lsc转化子得到的基因组DNA用Eco RI和Xho I 酶切，然后在琼脂凝胶上分离，再进行Southern杂交分析。莱茵衣藻 DNA的制备方法按照实施例3中描述的方法进行，用Eco RI和Xho I 酶切，然后滤膜再与放射性探针杂交，探针的位置在图5C中用双箭头指示出来。

[0234]用32P标记的HSV8编码区域的Nde I/Xba I片断杂交在 atpA-HSV8和rbcL-HSV8转基因株系中都鉴定出6.0kb的条带，但在野生型所在的泳道中如期望的一样没有鉴定到任何可以检测到的条带。当同样的杂交膜与32P标记的p322的5’端的1.5kb的Eco RI到Pst I之间的片断杂交时，在野生型样本中有一条5.7kb的片断被显现出来，而在两个转基因株系中则稍稍大于6.0kb的片断被鉴定出来。用p322 的3’端的32P标记的Bam HI/Xho I片断杂交，则分别在10-6-3和20-4-4 鉴定到2.5kb和2.0kb的片断，而在野生型株系中则再次显现的是5.7kb 的条带。这些结果证明HSV8基因已经正确地整合到叶绿体基因组的 p322沉默位点，而且所有叶绿体基因组的拷贝都含有HSV8基因。 HSV8-lsc mRNA在转基因株系中的积累

[0235]在转基因莱茵衣藻株系中检测了叶绿体表达的HSV8-lsc mRNA。从没有转化的株系(wt)，atpA HSV8-lsc转化的株系(10-6-3) 和rbcL转化的株系(20-4-4)中分离的总RNA在变性琼脂糖凝胶上分离之后转移到尼龙膜上。这些膜用甲基蓝染色或者与psbA cDNA探针，或者与hsv8特异性的探针杂交。总RNA的northern杂交分析用来检测HSV8基因是否在转基因莱茵衣藻叶绿体中转录。来自野生型和两个转基因细胞系的10微克总RNA在变性琼脂糖胶上分离之后转移到尼龙膜上。双份同样的滤膜用甲基蓝染色和用32P标记的psbA cDNA 探针或者HSV8特异性的探针杂交。核糖体RNA和psbA mRNA在野生型和各种转基因株系中的积累水平相似，这证明上样的RNA的量是一样的，而且转基因的导入并没有改变内源mRNA的积累。用HSV8 特异性的探针进行杂交，显示10-6-3和20-4-4株系中积累了大小正确的HSV8-lsc mRNA，而且正如期望的一样，在野生型所在泳道没有检测到HSV8信号。分析HSV8-lsc蛋白在转基因莱茵衣藻叶绿体中的积累

[0236]利用抗flag抗体通过蛋白质印迹分析来测定HSV8-lsc抗体的水平，以确定HSV8-lsc蛋白是否在转基因细胞系中积累。20微克来自于从pET载体中表达HSV8-lsc的大肠杆菌株系的总蛋白，20微克来自于野生型和两个转基因莱茵株系的总蛋白，通过SDS-PAGE分离，然后用考马斯亮兰染色或者用抗Flag抗血清进行蛋白质印迹分析。为了在细菌中表达，密码子优化的HSV8-lsc基因的Nde I/Bam HI片断被连接到pET载体中，并通过加入IPTG诱导表达。考马斯染色的凝胶表明在每个泳道中上样的蛋白的量都是一样的，而且还表明转基因株系中总蛋白的积累也是正常的。利用抗Flag抗体对同样的样本进行蛋白质印迹分析，表明在HSV8-lsc转基因株系和大肠杆菌中有正确分子量的强烈信号，但是在莱茵衣藻野生型所在泳道如期望的一样没有信号。在大肠杆菌和叶绿体中表达的HSV8-lsc抗体的表征

[0237]为了确定在莱茵衣藻叶绿体中积累的HSV8-lsc是否具有功能，叶绿体表达的蛋白和细菌表达的HSV8-lsc蛋白一起被表征。HSV8-lsc 转基因的细菌和藻在TBS溶液中重悬，然后用超声破碎细胞。可溶性蛋白与不可溶性蛋白通过离心被分开。从可溶性组分和不可溶性组分中取出同样量的蛋白用SDS-PAGE分离，然后HSV8-lsc蛋白通过蛋白质印迹分析来显现。细菌中产生的HSV8-lsc蛋白的大约60％分布在不溶性组分中，而叶绿体中产生的蛋白几乎全部在可溶性组分中被发现。

[0238]为了确定叶绿体中表达的抗体是否含有翻译后修饰，这些抗体在还原性和非还原性凝胶上用SDS-PAGE和蛋白质印迹分析来检测。来自于莱茵衣藻转基因株系10.6.3的可溶性蛋白在用SDS-PAGE分离之前用B巯基乙醇(+Bme)处理或者不用还原性试剂(没有Bme) 处理。蛋白被转移到硝酸纤维素膜上，然后再用抗flag抗体检测。在非还原条件下，所述抗体的两条重链之间形成的任何二硫键都保持不变，而使抗体可以作为更大的分子迁徙。在非还原条件下叶绿体表达的HSV8-lsc在电泳中是以一个更大的蛋白迁移的，分子量大约是 140kDa，这个大小是一个二聚体所具有的。用Bme处理之后，二硫键被还原，结果使得叶绿体的HSV8-lsc蛋白在电泳中以预测的单体分子量——68kDa——迁移。

[0239]为了确定是否有其他翻译后修饰存在于叶绿体表达的蛋白中，细菌和叶绿体表达的蛋白通过质谱来表征。来自于大肠杆菌和叶绿体中表达的蛋白的肽段的质谱是几乎相同的谱型，这说明对于叶绿体蛋白是没有任何额外的修饰的。

[0240]叶绿体表达的HSV8-lsc结合HSV8蛋白的能力被检验以确认在转基因叶绿体中积累的HSV8-lsc是具有功能的。HSV8-lsc通过抗 flag亲合树脂从转基因叶绿体中纯化得到。如图6所示，在ELISA分析中，叶绿体产生的抗体以强劲的方式识别HSV8蛋白。HSV8-lsc在转基因藻中的积累的调节

[0241]不同生长条件对于抗体在两个转基因株系10-6-3和20-4-4中积累的影响被检测以确定HSV8-lsc在莱茵衣藻叶绿体中的表达是否可以受调控。每个株系的培养维持在106或者107个细胞每毫升，在12/12 光照-黑暗的循环(5000勒克斯)条件下生长，或者在连续光照(5000 勒克斯)光照条件下生长。细胞通过离心收集，然后20微克可溶性蛋白在SDS-PAGE中分离，然后HSV8-lsc用抗Flag抗体进行的蛋白质印迹来显现。

[0242]HSV8-lsc的积累明显地依赖于生长条件而变化。在株系20-4-4 中，rbcL启动子/5’UTR控制之下的蛋白表达在黑暗期的末期或者在刚刚进入光照期之后，表现出明显的抗体积累增长，而且与细胞密度无关。相比较而言，在株系10-6-3中，atpA启动子/5’UTR在106个细胞每毫升的细胞密度下在光照-黑暗循环中指导水平基本恒定的 HSV8-lsc蛋白表达，然而当细胞培养密度为107个细胞每毫升的时候，在进入光照期后会表现出lsc积累的明显增加。当生长在连续光照条件下时，两个株系在细胞浓度为106个细胞每毫升时的蛋白积累要高于细胞浓度为107个细胞每毫升时的蛋白积累。这些结果证明HSV8-lsc在莱茵衣藻叶绿体中的积累可以被优化，这依赖于用于培养细胞的光照条件，细胞收集时细胞所处的循环时期，以及用于驱动表达的启动子 /UTR。

[0243]一种人类单克隆抗体在绿藻叶绿体中被表达出来。高水平的重组蛋白的表达是通过优化抗体编码序列的密码子使用使之反映出大多数叶绿体蛋白的密码子使用，以及用叶绿体atpA或者rbcL的启动子和 5’UTR来驱动嵌合基因的表达来实现的。这种大单链(lsc)抗体含有通过一段柔性连接肽融合在一起的IgA整个重链和轻链可变区，而且在叶绿体中以完全可溶的蛋白形式积累。这种抗体用来识别单纯疱疹病毒的糖蛋白D，而这种由藻表达的抗体和疱疹蛋白之间的结合是通过ELISA测定的。这种lsc抗体含有重链的Fc部分，这个部分正常情况下涉及分子间二硫键的形成，从而导致抗体的二聚化。所述叶绿体表达的抗体组装成更高级的复合物，这种复合物对于由Bme介导的还原是敏感的，这表明叶绿体表达的抗体在体内形成二聚体。在叶绿体中表达的重组蛋白中二硫键的形成已经在烟草叶绿体表达的人体生长激素中被描述过(8)，由于藻类叶绿体中存在蛋白二硫键异构酶，因此叶绿体中表达的重组蛋白中形成二硫键也是在几分预料之中(18)。这种lsc抗体也含有假定的N连接糖基化位点。叶绿体编码的蛋白不被认为有糖基化的发生，而且实际上基于质谱分析，也没有任何证据表明叶绿体表达的抗体有糖基化作用。

[0244]产生的转基因株系表现出不同水平的抗体积累，这依赖于用于驱动蛋白表达的启动子，以及细胞密度和培养这些株系的光照条件。抗体积累的这些大范围波动的原因可能是由各种因素造成的，包括嵌合mRNA的稳定性和翻译能力，抗体蛋白的更新(turnover)。这些结果证明抗体的积累可以受到生长条件的正面影响，而且还表明高水平的抗体积累(超过可溶性蛋白的1％)可以在藻中实现，只要简单地通过优化适合于特定启动子和UTR组合的生长条件就可以实现。

[0245]重组蛋白可以在各种蛋白表达系统中生产。复杂的治疗用蛋白，比如单克隆抗体(mAbs)，主要是在培养的转基因哺乳动物细胞中生产。在培养的哺乳动物细胞中生产单克隆抗体的成本平均大约是 150美元每克原材料，而在植物系统中单克隆抗体生产的成本估计是 0.05美元每克原材料(1)。在藻类系统中生产单克隆抗体的成本被认为比在陆生植物中生产的成本更具有竞争优势，藻类的培养基的价格就相当合理(0.002美元每升)。另外，藻类可以连续培养而它们的生长培养基可以循环。

[0246]在藻中生产单克隆抗体除了无与伦比的成本优势之外，还有一系列的特殊优点使得藻类成为重组蛋白生产理想的候选。首先，转基因藻类可以很快地得到，从产生初始转化子到扩大规模至生产体积这个过程只需要几周。第二，藻类叶绿体基因组和核基因组都可以被遗传转化，这就为在一个物种中生产一系列不同的转基因蛋白提供了可能性，这在要生产多聚蛋白复合物比如分泌抗体时这是需要的。另外，藻类具有以非常经济的方式在各种规模上培养的能力，从几毫升到 500000升。这些优点以及绿藻被归入GRAS目录(通常被视为安全目录)的事实，使得莱茵衣藻成为一个特别引人注意的替代其它系统表达重组蛋白的选择。最后，虽然本实例特别强调在藻类中抗体的生产，但是这个系统实质上可以胜任任何重组蛋白的生产。引用文献
下面每篇文章都在此引入作为参考。
1.Dove，(2002)Nature Biotechnol.20，777-779
2.Motmans和Bouche，Antibodies：The Next Generation(2000)Report to Auerbach Grayson & Company，Inc.
3.Hiatt等，(1989)Nature 342，76-78
4.Ma等，(1994)Eur.J.Immunol.24，131-138
5.Ma等，(1995)Science 268，716-719
6.Ellstrand，(2001)Plant Physiol.125，1543-1545.
7.Quist和Chapela，(2001)Nature 414，541-543.
8.Staub等，(2000)Nature Biotechnol.18，333-338.
9.Kota等，(1999)Proc.Natl.Acad.Sci.USA 96，1840-1845.
10.Sidrov等，(1999)Plant J.19，209-216.
11.Ruf等，(2001)Nature Biotechnol.19，870-875.
12.Heifetz，(2000)Biochemie 82，655-666
13.Harris，(1989)The Chlamudomonas Sourcebook Academic Press， Inc.
14.Franklin等，(2002)Plant J.30，733-734.
15.Burioni等，(1994)Proc.Natl.Acad.Sci.USA.91，355-359.
16.De Logu等，(1998)J.Clin.Microbiol.36，3198-3204.
17.Boynton等，(1988)Science 240，1534-1538
18.Kim和Mayfield，(1997)Science 278，1954-1957
19.Gorman等，(1965)Proc.Natl.Acad.Sci.USA 54，1665-1669.
20.Sambrook等，(1989)Moecular Cloning.A Laboratory Manual Cold Spring Harbor Laboratory Press.
21.Cohen等，(1998).Meth.Enzymol.297，192-208.
22.Stemmer等，(1995)Gene 164，49-53.
实施例4
由具有叶绿体密码子偏好性的细菌luxAB基因表达荧光素酶融合蛋白

[0247]本实施例证实了由具有叶绿体密码子偏好性的合成的多聚核苷酸编码的荧光素酶融合蛋白在叶绿体中的强烈表达。

[0248]荧光素酶报告基因已经成功地在各种生物中用来检测活细胞中的基因表达，但是还没有在叶绿体中被成功应用过。如实施例1中所描述的，绿色荧光蛋白(gfp)已经从具有叶绿体密码子偏好性的多聚核苷酸中表达出来，而且可以用作叶绿体中基因表达的报告基因。由于gfp能够发出高强度的自发性荧光，并且在叶绿体中相对高水平的表达和gfp蛋白积累对于可视化是必需的，由具有叶绿体密码子偏好性的多聚核苷酸编码的荧光素酶报告蛋白，通过合成两个细菌荧光素酶亚基，luxAB，成为一个具有莱茵衣藻叶绿体密码子偏好性的融合蛋白，而被开发出来。如在此公开的，叶绿体荧光素酶基因，luxCt，在atpA 启动子和5’UTR和rbcL的3’UTR的控制下在莱茵衣藻的叶绿体中表达。该luxCt是叶绿体基因表达的一个敏感报告子，可以允许用CCD 相机在体内条件下测定荧光素酶的活性或者用光度计在体外条件下测量其活性。进一步，通过蛋白质印迹分析测量出的luxCt蛋白积累与体内和体外条件下测得的发光成正比。这些结果证明luxCt基因作为活体细胞中叶绿体基因表达的通用且灵敏的报告基因的实用性。

[0249]报告基因已经大大增强了在大量生物中监测基因表达的能力。在高等植物的叶绿体中，β-葡萄糖苷酸酶(uidA，Staub和Maliga， 1993)，新霉素磷酸转移酶(nptII，Carrer等，1993)，腺苷-3-腺嘌呤转移酶(aadA，Svab和Maliga，1993)，和来自水母的绿色荧光蛋白(Sidorov等，1999；Reed等，2001)都已经被用作报告基因(Heifetz， 2000)。数种报告基因也已经在真核绿藻，莱茵衣藻的叶绿体中表达，这些基因包括aadA(Goldschmidt-Clermont，1991；Zerges和Rochaix， 1994)，uidA(Sakamoto等，1993，Ishikura等，1999)，aphA6(Bateman 和Purton，2000)和海肾荧光素酶(Minko等，1999)。不幸的是，这些早期的报告基因表达盒生产的蛋白积累水平非常低，使它们不能够很好地作为定量分析基因表达的报告子。

[0250]正如在实施例1中公开的，高水平的报告基因的表达通过优化绿色荧光蛋白报告基因的密码子使用来获得(也可参见，Franklin等， 2002)。比较转化了非优化的gfp基因和优化的cgfp基因的株系中GFP 蛋白的积累，发现由莱茵衣藻叶绿体的cgfp基因而来的GFP蛋白的积累有80倍的增加。这些结果证明，以前报告基因在莱茵衣藻叶绿体中的表达不能够达到高水平的原因是由莱茵衣藻叶绿体基因的密码子使用偏好性导致的。

[0251]为了拓展用gfp获得的结果，以及为了获得一种可以在体内条件下被观察的报告子，具有莱茵衣藻叶绿体密码子偏好性的细菌荧光素酶基因被合成出来。该从头合成的lux基因是基于哈维氏弧菌(Vibrio harveyi)的细菌luxAB基因合成的(Baldwin等，1984，Johnson等，1986)。荧光素酶的编码序列被合成之后使得荧光素酶A和B亚基作为一个通过柔性连接肽将A和B亚基连接在一起的单个编码区域来表达 (Kirchener等，1989，Olsson等，1989，Almashanu等，1990)。这种就叶绿体而被优化的荧光素酶基因(luxCt)被放置在含有atpA启动子和5’ 端非翻译区以及rbcL的3’端非翻译区的表达盒中。含有所述luxCt基因的转基因细胞系中有luxCt mRNA和LUXCt蛋白积累，这是分别通过RNA杂交和蛋白质印迹分析来判断的(参见下面内容)。当细胞用细菌荧光素酶的底物癸醛处理时，表达luxCt的转基因细胞系的发光通过CCD相机很容易观测到，而在同样的试验中野生型细胞中则没有显示任何发光。通过蛋白质印迹分析测定的luxCt的表达和通过应用CCD 相机的发光分析以及应用体外光度计分析测定的luxCt的表达是成正比的。转基因株系中荧光素酶的活性可以在好几个数量级上被测量，这证明luxCt作为活体细胞叶绿体中基因表达的报告子具有灵敏性和实用性。方法
莱茵衣藻株系，转化和生长条件

[0252]转化是用莱茵衣藻株系137c(mt+)，或者psbA缺陷型株系 cc744(REF)进行的。细胞在含有40mM的5-氟脱氧尿苷的TAP培养基(Gorman和Levine，1965)中，在转速为100rpm的摇床上于23 ℃，4000勒克斯(高光)的恒定光照中生长到后对数期(大约7天)。经过4000×g，4℃离心5分钟之后收集到50毫升的细胞。上清被弃掉，细胞在4毫升TAP培养基中重悬，通过已述(Cohen等，1998)的颗粒轰击方法进行接下来的叶绿体转化。所有转化都是在大观霉素(150 μg/ml)选择下进行的，其中大观霉素抗性是通过共转化质粒p228的大观霉素抗性核糖体基因(Chlamydomonas Stock Center，杜克大学) 实现的。为了表达luxCt，莱茵衣藻转化子的培养是在TAP培养基 (Gorman和Levine，1965)中恒定光照于23℃进行的。质粒构建

[0253]DNA和RNA操作主要是按照Sambrook等(1989)和Cohen等 (1998)描述的方法来进行的。luxCt基因的编码区域是根据Stemmer等 (1995)的方法由一个每个长度都是40个核苷酸的引物库通过从头合成得到。在这样的组装中所使用的引物的5’和3’端分别含有Nde I和Xba I位点。根据制造商的操作手册，将得到的2094bp的含有luxCt基因的 PCR产物克隆到pCR2.1 TOPO质粒中(Invitrogen公司)，产生质粒 pluxCt。atpA的启动子和5’端非翻译区以及rbcL的3’端非翻译区是按照文献描述(Mayfield等，2002)的方法生成。叶绿体转化质粒p322 按照文献描述(Franklin等，2002)构建。Southern杂交和northern杂交分析

[0254]Southern杂交和作为探针使用的DNA的32P标记是按照文献 (Sambrook等，1989；和Cohen等，1998)描述的方法进行的。用于 Southern杂交的放射性探针包括luxCt编码区的2kb的Nde I/Xba I片断 (探测luxCt)，和p322的2.0kb的Bam HI/Xho I片断(探测p322的 3’端)。0.9kb的Eco RI/Xba I luxCt探针在northern杂交分析中用于检测luxCt mRNA。在northern杂交分析中使用的其它放射性探针包括 rbcL cDNA。Southern杂交和northern杂交是通过配备了Optiquant软件的Packard Cyclone Storage Phosphor System检测的。蛋白表达，蛋白质印迹分析和发光分析

[0255]质粒pluxAB和pluxCt被转化到大肠杆菌BL21株系中，细胞在液体培养基中过夜培养。为了进行蛋白质印迹分析，将蛋白从大肠杆菌或者莱茵衣藻中提取分离出来，采用的缓冲液含有750mM Tris·Cl， pH 8.0，15％蔗糖(wt/vol)，100mM Bme，1mM PMSF。样本于13000×g， 4℃离心30分钟，得到的上清用于蛋白质印迹分析。在体外发光分析中所用的莱茵衣藻蛋白是在50mM Na2HPO4，pH 7.0，50mM Bme，400 mM蔗糖的缓冲液中制备，然后粗裂解物于13000×g，4℃离心30分钟，得到的上清用于发光分析。96孔微量滴定板分析是从细菌荧光素酶方法(Langridge和Szalay，1994)修改得到。莱茵衣藻可溶性蛋白用荧光素酶提取缓冲液稀释到100微升每个样本，向其中加入125微升含有 500μM NADH的50mM Tris-Cl，pH 8.0的缓冲液，以及含有0.025U 心肌黄酶的50mM Na2HPO4，50mM Bme，1％牛血清白蛋白缓冲液。再往上面得到的混合物中加入130微升溶液，其中含有125微升含有 100μM FMN的200mM三(羟甲基)甲基甘氨酸，pH 7.0溶液和5微升含有超声10秒钟的0.1％癸醛的50mM Na2HPO4，pH 7.4溶液。以相对光单位(relative light units，rlu)为单位的光子测量是在FMN-/癸醛加入5 秒钟后开始的，测量是用配备了Criterion Host软件的LJL Biosystems Analyst AD光度计(荧光强度计)进行的。蛋白浓度是用BioRad蛋白分析试剂测定的。

[0256]蛋白印迹是按照Cohen等(1998)描述的方法，采用兔抗luxAB 一抗(REF)和碱性磷酸酶标记的羊抗兔二抗(Sigma)进行的。克隆发光是通过型号为LB 981的Berthold Night Owl CCD相机成像的，相机配备了700nm的发射滤镜以阻止叶绿体荧光(Chroma公司)。30 秒到5分钟的曝光时间足够可以在绝大多数情况下显现荧光素酶的发光。图像采用WinLight软件生成。结果
从头合成具有莱茵衣藻叶绿体密码子偏好性的luxAB基因

[0257]为了开发出一种监测叶绿体中基因表达的灵敏的报告子，利用经过优化而反映出莱茵衣藻叶绿体中大量表达的基因的密码子使用的密码子来合成荧光素酶基因(实施例1；Franklin等，2002)。这种荧光素酶基因，luxCt(图7)，是基于哈维氏弧菌的细菌荧光素酶AB基因设计的(luxAB；Baldwin等，1984)。为了在叶绿体中的表达，luxAB 的两个亚基被连接成一段单个编码序列，其中通过去除A亚基上的终止密码子使它在正确的阅读框架中与B亚基相连，A亚基和B亚基通过一段柔性肽序列生成单个融合蛋白(图7)。哈维氏弧菌luxAB序列是从GenBank数据库中获得的，基于该氨基酸序列设计出一系列寡聚核苷酸，但是改变了密码子使用以反映出那些在莱茵衣藻叶绿体中高度表达的基因的密码子使用。所述基因根据Stemmer等(1995)的方法组装。PCR产物被克隆到大肠杆菌质粒中，合成的基因被测序，一些序列错误通过点突变来校正。一个Nde I位点被设计在起始密码子的地方，而一个Xba I位点则被安放在紧跟着终止密码子下游的地方，这是为了接下来的克隆作准备的。得到的基因，luxCt，被克隆到大肠杆菌表达盒中，荧光素酶的表达通过利用CCD相机的发光成像来分析。令人惊奇的是，没有任何发光在含有luxCt基因的细菌中被检测到，虽然在转化了细菌luxAB基因的细菌中可以检测到高强度的发光(Kondo 等，1993)。

[0258]为了确认是否有突变在克隆到大肠杆菌载体的时候被无意地导入到luxCt基因中，在大肠杆菌表达质粒中含有的luxCt基因和细菌 luxAB基因都被测序。与所需的序列相比没有在luxCt基因中检测到错误，但是在来自用于在细菌中表达luxAB的质粒的luxAB序列(Kondo 等，1993)中鉴定到大量与GenBank数据库中报告的luxAB序列(Acc. No.E12410)的序列差异。来自于数个不同的细菌物种的luxAB蛋白与合成的luxCt蛋白之间的序列比对鉴定出氨基酸序列上的大量差异，但是这些差异中只有一个是在保守氨基酸上。因此，应用位点特异性突变恢复204氨基酸位置上的谷氨酸，以及相邻的205位置上的亮氨酸。没有其他的氨基酸序列被改变，因为这些其他的氨基酸中没有一个是在这一系列被考察的luxAB蛋白中保守的。luxCt融合蛋白基因在细菌中产生功能性的荧光素酶

[0259]为了确定合成的luxCt基因是否可以产生功能性的荧光素酶，在转化了含有luxAB或者luxCt基因的表达质粒的大肠杆菌细胞中测量发光。利用来自于表达luxAB基因或者luxCt基因的大肠杆菌细胞的粗裂解物进行蛋白质印迹分析；20微升被用于SDS-PAGE，然后转移到硝酸纤维素膜上。再用抗luxAB的一抗结合到这些膜上，然后再用偶连了碱性磷酸酶的抗兔二抗结合，接着蛋白通过碱性磷酸酶活性染色来显现。luxAB的alpha(A)和beta(B)亚基被鉴定到，luxCt的单个融合蛋白(FP)被鉴定到。另外，荧光素酶的表达在琼脂糖培养基上过夜培养并用癸醛蒸气处理的大肠杆菌中测定。没有转化的大肠杆菌细胞或者表达luxAB或luxCt基因的细胞用反射光来拍照(拍照)，或者通过利用CCD相机的发光成像来观测(发光)。当大肠杆菌细胞用癸醛处理并用CCD相机成像的时候，两个含有荧光素酶的株系都发光，而没有转化的大肠杆菌则如期望的一样没有光信号。蛋白质印迹分析是用识别原始luxAB蛋白的多克隆抗体来进行的，结果在luxAB 株系中显示有细菌荧光素酶蛋白的A和B亚基的信号，而在luxCt株系中，鉴定到的是对应于所述融合蛋白的单一条带。在细菌中luxAB 的A蛋白和B蛋白积累的水平要高于luxCt的单个融合蛋白，而这些蛋白的发光信号与荧光素酶蛋白的积累呈大致的正比关系，2份 luxAB1信号对应于1份luxCt信号。luxCt表达盒的构建和luxCt转化子的Southern杂交分析

[0260]证明了luxCt编码序列产生功能性的荧光素酶之后，用luxCt 表达盒转化莱茵衣藻的叶绿体。为了使荧光素酶在叶绿体中表达，按照图8所示的表达盒被构建出来。luxCt编码序列被连接到atpA启动子和5’端非翻译区的下游，rbcL的3’端非翻译区的上游(图8A)。这种嵌合的atpA/luxCt基因然后再被连接到叶绿体转化载体p322上独特的 Bam HI位点处，形成质粒p322-atpA/luxCt(图8B)。

[0261]用p322-atpA/luxCt质粒和选择性标记质粒p228转化野生型莱茵衣藻细胞，其中质粒p228可以使细胞具有大观霉素抗性。对初始转化子用CCD相机进行发光分析，以筛选出luxCt基因的存在，阳性的转化子通过Southern杂交分析被进一步验证。转化子再经过额外的数轮筛选，从中分离出同质细胞系，这样的细胞系中所有拷贝的叶绿体基因组都含有导入的luxCt基因。

[0262]两个同质luxCt转化子，10.6和11.5，被挑选出来进行进一步分析。图8显示的是luxCt构建物，相关的限制性位点被标记出来。质粒p322-atpA/luxCt的8.7kb Eco/Xho区域正确地整合到叶绿体基因组中是利用luxCt的Nde I-Xba I片断，或者质粒p322的Bam HI-Xho I 片断来确认的，这些片断都在图8中被标记出来。对luxCt的莱茵衣藻叶绿体转化子进行了Southern杂交分析。莱茵衣藻的DNA制备如实施例4所描述，然后同时用Eco RI和Xho I酶切，再进行Southern杂交分析。滤膜与如图8B所标示的放射性探针杂交。所述两个转化子都含有luxCt杂交条带，而野生型株系用luxCt编码区探针杂交的时候没有信号。在转基因细胞系中鉴定到两个条带，这是因为luxCt基因在其中间位置含有一个Eco RI位点。用来自于p322质粒的Bam HI-Xho I 片断进行杂交，在野生型中鉴定到单个条带，而在两个转化子中则鉴定到与之大小不同的条带，这些都与之前的预测结果吻合。野生型和转化子细胞系的每个条带的分子量大小都是所预测的正确大小。这些结果证明所述两个转基因株系是同质的。luxCt的mRNA在转基因株系中的积累

[0263]应用总RNA的northern杂交分析来确认luxCt基因在转基因莱茵衣藻叶绿体中的转录。分别从野生型和所述两个转基因株系中提取的10微克总RNA在变性琼脂糖凝胶上分离，然后转移到尼龙膜上。两份同样的滤膜用甲基蓝染色或者用32P标记的luxCt探针或rbcL cDNA探针杂交。每个株系中积累的rRNA(染色的条带)和rbcLmRNA 的水平都类似，这说明每个泳道上样的RNA是等量的，而且叶绿体转录和mRNA的积累在转基因细胞系中是正常的。滤膜与luxCt特异性探针的杂交表明两个转基因细胞系中都积累了预测大小的luxCt mRNA，而在野生型细胞中则如所期望的一样没有观察到luxCt信号。luxCt蛋白在转基因莱茵衣藻叶绿体中积累的分析

[0264]应用蛋白质印迹分析来确认luxCt蛋白是否在转基因细胞系中积累。来自于野生型和所述两个转基因细胞系的20微克可溶性总蛋白 (tsp)通过SDS-PAGE分离，然后或者用考马斯亮兰染色，或者进行蛋白质印迹分析。经过考马斯染色的凝胶表明每个泳道中上样的蛋白量是一样的，而且转基因细胞系中积累了一系列与野生型相类似的蛋白。同样的样本的蛋白质印迹分析在所述两个luxCt转基因泳道中鉴定到对应于所述融合蛋白的单一条带。在野生型莱茵衣藻泳道，正如期望的一样没有观察到信号。用luxCt作为活细胞中叶绿体基因表达的报告子

[0265]为了确定luxCt基因作为活体莱茵衣藻细胞中叶绿体基因表达的报告子的实用性，对在琼脂平板上生长的野生型和转基因细胞进行了荧光测量。细胞被涂在固体培养基上，维持在连续光照条件下(1000 勒克斯)7天。luxAB的底物癸醛被涂到皮氏平板的盖子上，然后平板放置在CCD相机下面。转基因细胞系在环境光照下与野生型细胞看起来很相似。经过5分钟的黑暗适应(adaptation)去除叶绿体荧光之后，用CCD相机成像，结果在所述两个转基因细胞系中表现出明亮的发光信号，而对于野生型株系则没有信号发生。来自于luxCt转基因细胞系的信号足以在体内条件下显现出即使是很小的单个克隆。

[0266]除了转化luxCt表达盒到野生型(137c)细胞中，所述表达盒还被转化到psbA缺陷型的莱茵衣藻株系中(cc744，Chlamydomonas Genetics Center，http://www.botany.duke.edu/chlamy/)。与前面的情况一样，初始转化体通过利用CCD相机进行的发光分析来筛选，阳性转基因细胞系再经过额外的数轮筛选之后获得同质细胞系。来自 cc744/luxCt株系的发光要远远高于137c/luxCt株系。为了确定这种增强的发光是否直接与增加的荧光素酶积累相关，测量了137c和cc744 转基因细胞系中luxCt蛋白的积累和荧光素酶活性。野生型和luxCt转基因细胞系luxCt137c和luxCtcc744在琼脂培养板上生长，然后用癸醛处理。细胞或者在反射光下照相(照片，photograph)，或者通过CCD 相机来显现(发光，luminescence)。蛋白从细胞中抽提出来，然后进行蛋白质印迹分析(用抗luxAB抗体)或者用光度计分析来定量(光度计)。当细胞在光照下生长在固体TAP培养基上的时候，蛋白质印迹分析揭示，相比于137c细胞系，cc744细胞系中大约有10倍多的 luxAB蛋白积累。CCD相机发光分析揭示，cc744细胞系相比于137c 细胞系有类似的信号增加。采用光度计进行的荧光素酶活性的定量揭示cc744-luxCt细胞系相比于137c-luxCt细胞系大约有11倍多的荧光素酶活性。这些结果证明luxCt基因是叶绿体基因表达的强劲报告子，而且体内条件下的lux活性测量与通过蛋白质印迹分析和体外发光分析测得的荧光素酶积累相一致。

[0267]数种异源基因已经被用作叶绿体基因表达的报告子，但是它们的实用性都由于灵敏性差或者无法在体内可视化而受到限制。荧光素酶已经在许多生物中被用作报告基因(Greer和Szalay，2002；Langeridge 等，1994；Kondo等，1993；Kay，1993)，这是由于荧光素酶高水平的灵敏性以及荧光素酶可以在活体细胞中方便地可视化，而且对于生物体只有很小的影响。本实施例展示了用于叶绿体表达的荧光素酶报告基因的构建，其中合成细菌荧光素酶luxAB的两个亚基作为单个的融合蛋白，而且通过优化这个合成的荧光素酶基因的密码子使用而使其反映出在莱茵衣藻叶绿体中高效表达的基因的密码子使用。

[0268]本实施例拓展了实施例1的结果，实施例1通过合成具有就叶绿体而被优化的密码子的gfp证明了密码子使用极大地影响异源蛋白在莱茵衣藻叶绿体中的表达(Franklin等，2002)。这种cgfp在转基因的叶绿体中积累到可溶性总蛋白的0.5％，而且可以通过叶绿体抽提物的荧光分析来显现。然而，即使相对高水平的GFP的积累也不足以在体内看到该报告基因。采用一种线粒体优化的gfp基因，Komine等报道了应用荧光显微镜观察转基因莱茵衣藻叶绿体中的gfp(Komine等， 2002)。尽管如此，对于这种转基因细胞系，GFP蛋白的积累水平依然是非常低，而且mGFP株系的荧光输出看上去并不高于没有转化的株系的背景荧光。

[0269]基于叶绿体优化的gfp在促进蛋白积累方面的成功，再加上即使是相对高水平的GFP依然不能够在体内条件下使之在叶绿体中可视化的事实，用叶绿体优化的密码子合成了一种荧光素酶基因，从而获得灵敏的有意义的报告子。这种密码子被优化的luxCt基因置于莱茵衣藻叶绿体atpA的5’启动子和UTR以及rbcL的3’UTR的控制之下，该基因的表达说明了luxCt的mRNA和蛋白在转基因莱茵衣藻叶绿体中的积累。进一步，表达luxCt的转基因株系积累了足够量的荧光素酶，使得它可以用CCD相机方便地在体内通过发光分析被可视化。通过蛋白质印迹分析测定的luxCt蛋白积累与通过CCD相机发光分析或者体外光度计分析测定的荧光素酶活性成正比关系。

[0270]莱茵衣藻被称为“绿色酵母”，这是一个实至名归的名称，这种生物极佳的遗传特性使得它可以用于揭示大量的细胞过程，最著名的就是鞭毛和光合成装置的生物发生。然而目前明显缺乏的就是一种分析基因表达，特别是在叶绿体中的基因表达的方便手段。本结果证明了所述的优化的luxCt基因作为体内条件下叶绿体基因表达的报告子的实用性。本结果还证明了luxCt作为一个灵敏的报告子可以监测甚至在很小的细胞克隆中的基因表达，使得luxCt成为叶绿体基因表达的任何高通量分析可以选择的报告子。

[0001]本发明部分是由政府资助进行，这些资助分别是：基金号 GM54659，由美国国立卫生院提供；基金号DE-FG03-93ER20116，由美国能源部提供；基金号NA06RG00142，由美国国立海洋与大气管理局的加尼福利亚海洋基金大学计划提供。美国政府可能对本发明享有一定权利。引用文献
下面的每篇文章都在此引入作为参考。
Almashanu等，J.Biolumin.Chemilumin.5：89-97，1990.
Bateman和Purton，Mol.Gen Genet.263：404-410，2000.
Baldwin等，Biochemistry 23：3663-7，1984.
Carrer等，Mol.Gen.Genet.241：49-56，1993.
Cohen等，Meth.Enzymol.297，192-208，1998.
Franklin等，Plant J.30：733-44，2002.
Goldschmidt-Clermont，Nucl.Acids Res.19：4083-4089，1991.
Greer和Szalay，Luminescence 17：43-47，2002.
Gorman和Levine，Proc.Natl.Acad.Sci.USA 54：1665-1669，1965.
Heifetz，Biochemie 82：655-666，2000.
Ishikura等，J.Biosci.Bioeng.87：307-314，1999.
Johnson等，J.Biol.Chem.261：4805-11，1986.
Kirchner等，Gene 81：349-54，1989.
Komine等，Proc.Natl.Acad.Sci.USA 19：4085-90，2000.
Kondo等，Proc.Natl.Acad.Sci.USA 90：5672-5676，1993.
Langridge等，J.Biolumin.Chemilumin.9：185-200，1994.
Minko等，Mol.Gen.Genet.262：421-425，1999.
Nakamura等，Nucl.Acids Res.27：292，1999.
Olsson等，Gene 81：335-47，1989.
Reed等，Plant J.27：257-265，2001.
Sambrook等，Molecular Cloning：A Laboratory Manual(Cold Spring Harbor Laboratory Press 1989).
Sakamoto等，Proc.Natl.Acad.Sci.USA 90：497-501，1993.
Sidrov等，Plant J.25：209-216，1999.
Staub和Maliga，EMBO J.12：601-606，1993.
Stemmer等，Gene.164：49-53，1995.
Svab和Maliga，Proc.Natl.Acad.Sci.USA 913-917，1993.
Zerges和Rochaix，Mol.Cell.Biol.14：5268-5277，1994.

[0271]虽然本发明已经参考上述实施例作了描述，但是需要理解的是，修改或者变化也都包括在本发明的精神和范围之内。因此，本发明只受权利要求的限制。                             序列表
<110>斯克里普斯研究所
<120>多肽在叶绿体中的表达以及用于表达多肽的组合物和方法
<130>CPUSZ42310
<150>US 60/375,129
<151>2002-04-23
<150>US 60/434,957
<151>2002-12-19
<160>48
<170>PatentIn version 3.1
<210>1
<211>717
<212>DNA
<213>人工序列
<220>
<223>叶绿体密码子优化的绿色荧光蛋白
<400>1
atggctaaag gtgaagaatt attcacaggt gttgtaccta ttttagtaga attagacggt     60
gatgtaaacg gtcacaaatt ttcagtttct ggtgaaggtg aaggtgacgc aacttatggt    120
aaattaacac ttaaattcat ttgtactaca ggtaaattac cagtaccttg gccaacttta    180
gttacaactt ttacatacgg tgtacaatgt ttcagtcgtt accctgatca catgaaacaa    240
catgactttt tcaaatctgc tatgccagaa ggttatgttc aagaacgtac tatttttttc    300
aaagatgacg gtaattataa aacacgtgct gaagtaaaat ttgaaggtga tactttagtt    360
aaccgtattg aattaaaagg tattgacttc aaagaagatg gtaatatttt aggtcacaaa    420
cttgaatata actacaattc acataacgta tatattatgg cagacaaaca aaaaaatggt    480
attaaagtaa actttaaaat tcgtcataat atcgaggatg gttctgtaca attagctgac    540
cactatcaac aaaacacacc aattggtgat ggtcctgttt tacttccaga caatcattat    600
ttaagtactc aatctgcttt atcaaaagat cctaacgaaa aacgtgacca catggtatta    660
cttgaatttg ttacagcagc tggtattact cacggtatgg atgaattata caaataa       717
<210>2
<211>238
<212>PRT
<213>人工序列
<220>
<223>叶绿体密码子优化的绿色荧光蛋白
<400>2
Met Ala Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1               5                   10                  15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
            20                  25                  30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
        35                  40                  45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe
    50                  55                  60
Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln
65                  70                  75                  80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
                85                  90                  95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
            100                 105                 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
        115                 120                 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
    130                 135                 140
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp lys Gln Lys Asn Gly
145                 150                 155                 160
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
                165                 170                 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
            180                 185                 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
        195                 200                 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
    210                 215                 220
Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
225                 230                 235
<210>3
<211>717
<212>DNA
<213>海洋水母(Aequorea victoria)
<400>3
atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt     60
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga    120
aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt    180
gtcactactt tctcttatgg tgttcaatgc ttttcaagat acccagatca tatgaaacgg    240
catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaaagaac tatatttttc    300
aaagatgacg ggaactacaa gacacgtgct gaagtcaagt ttgaaggtga tacccttgtt    360
aatagaatcg agttaaaagg tattgatttt aaagaagatg gaaacattct tggacacaaa    420
ttggaataca actataactc acacaatgta tacatcatgg cagacaaaca aaagaatgga    480
atcaaagtta acttcaaaat tagacacaac attgaagatg gaagcgttca actagcagac    540
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac    600
ctgtccacac aatctgccct ttcgaaagat cccaacgaaa agagagacca catggtcctt    660
cttgagtttg taacagctgc tgggattaca catggcatgg atgaactata caaataa       717
<210>4
<211>544
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>4
ggatcccatt tttataactg gtctcaaaat acctataaac ccattgttct tctcttttag     60
ctctaagaac aatcaattta taaatatatt tattattatg ctataatata aatactatat    120
aaatacattt acctttttat aaatacattt accttttttt taatttgcat gattttaatg    180
cttatgctat cttttttatt tagtccataa aacctttaaa ggaccttttc ttatgggata    240
tttatatttt cctaacaaag caatcggcgt cataaacttt agttgcttac gacgcctgtg    300
gacgtccccc ccttcccctt acgggcaagt aaacttaggg attttaatgc aataaataaa    360
tttgtcctct tcgggcaaat gaattttagt atttaaatat gacaagggtg aaccattact    420
tttgttaaca agtgatctta ccactcacta tttttgttga attttaaact tatttaaaat    480
tctcgagaaa gattttaaaa ataaactttt ttaatctttt atttattttt tcttttttca    540
tatg                                                                 544
<210>5
<211>241
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>5
ggatccacta gtaacggccg ccagtgtgct ggaattcggc ttccgaattc atatacctaa     60
aggccctttc tatgctcgac tgataagaca agtacataaa tttgctagtt tacattattt    120
tttatttcta aatatataat atatttaaat gtatttaaaa tttttcaaca atttttaaat    180
tatatttccg gacagattat tttaggatcg tcaaaagaag ttacatttat ttatacatat    240
g                                                                    241
<210>6
<211>468
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>6
ggatccctag taacggccgc cagtgtgctg gaatttgagt atatgaaatt aaatggatat     60
ttggtacatt taattccaca aaaatgtcca atacttaaaa tacaaaatta aaagtattag    120
ttgtaaactt gactaacatt ttaaatttta aattttttcc taattatata ttttacttgc    180
aaaatttata aaaattttat gcatttttat atcataataa taaaaccttt attcatggtt    240
tataatataa taattgtgat gactatgcac aaagcagttc tagtcccata tatataacta    300
tatataaccc gtttaaagat ttatttaaaa atatgtgtgt aaaaaatgct tatttttaat    360
tttattttat ataagttata atattaaata cacaatgatt aaaattaaat aataataaat    420
ttaacgtaac gatgagttgt ttttttattt tggagataca cgcatatg                 468
<210>7
<211>373
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>7
ggatccgtcg actggtaccg ccactgcctg cttcctcctt cggagtatgt aaaccccttc     60
gggcaactaa agtttatcgc agtatataaa tataggcagt tggcaggcaa ctgccactga    120
cgtcctattt taatactccg aaggaggcag ttggcaggca actgccactg acgtcccgta    180
agggtaaggg gacgtccact ggcgtcccgt aaggggaagg ggacgtaggt acataaatgt    240
gctaggtaac taacgtttga ttttttgtgg tataatatat gtaccatgct tttaatagaa    300
gcttgaattt ataaattaaa atatttttac aatattttac gagaaattaa aactttaaaa    360
aaattaacat atg                                                       373
<210>8
<211>223
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>8
ggatccgttg gcaggcaaca aatttattta ttgtcccgta aggggaaggg ggaaacaatt     60
attattttac tgcggagcag cttgttattg aagttttatt aaaaaaaaaa taaaaatttg    120
acaaaaaaaa taaaaaagtt aaattaaaaa cactgggaat gttctacatc ataaaaatca    180
aaagggttta aaatcccgac aaaatttaaa ctttaaacat atg                      223
<210>9
<211>397
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>9
tctagactta gcttcaacta actctagctc aaacaactaa ttttttttta aactaaaata     60
aatctggtta accatacctg gtttatttta gtttagttta tacacacttt tcatatatat    120
atacttaata gctaccatag gcagttggca ggacgtcccc ttacgggaca aatgtattta    180
ttgttgcctg ccaactgcct aatataaata ttagtggacg tccccttccc cttacgggca    240
agtaaactta gggattttaa tgctccgtta ggaggcaaat aaattttagt ggcagttgcc    300
tcgcctatcg gctaacaagt tccttcggag tatataaata tcctgccaac tgccgatatt    360
tatatactag gcagtggcgg taccactcga cggatcc                             397
<210>10
<211>434
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>10
ctagagtcga cctgcaggca tgcaagcttg tactcaagct cggaacgaag gtcgtgcctt     60
gctcggaagg tggcgacgta attcgttcag cttgtaaatg gtctcccaga acttgctgct    120
gcatgtgaag tttggaaaga aattaaattc gaatttgata ctattgacaa actttaattt    180
ttatttttca tgatgtttat gtgaatagca taaacatcgt ttttattttt atggtgttta    240
ggttaaatac ctaaacatca ttttacattt ttaaaattaa gttctaaagt tatcttttgt    300
ttaaatttgc ctgtctttat aaattacgat gtgccagaaa aataaaatct tagcttttta    360
ttatagaatt tatctttatg tattatattt tataagttat aataaaagaa atagtaacat    420
acgtcgacgg atcc                                                      434
<210>11
<211>411
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>11
tctagatttt aattaagtag gaactcggta tatgctcttt tggggtctta ttagctagta     60
ttagttaact aacaaaagat caatatttta gtttgtttta tatattttat tacttaagta    120
gtaaggattt gcatttagca atcttaaata cttaagtaat aatctataaa taaaatatat    180
tttcgcttta aaacttataa aaattatttg ctcgttataa gcctaaaaaa acgtaggatc    240
tctacgagat attacattgt ttttttcttt aattggcttt aatattactt tgtatatata    300
aaccaaagta cttgttaata gttattaaat tatattaact atacagtaca aagaaatttt    360
ttgctaaaaa aagtatgtta acattaaaaa tttttgttta tacagggatc c             411
<210>12
<211>266
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>12
tctagattat aatacattaa aattgtaacg cctttacaag acagtataaa atgggaatta     60
attaattagg agggtcactt tcagccactc gttttttaaa taggtaagta acctttttaa    120
gagaacgtaa gagattgtgg attacgttct caagagacat aactcaaaat actagtaggt    180
ttgagcttga cttcaagctt taacctccgt cagcgataaa acctattttg agcgcatttt    240
aatatatttg ggacgccagt ggatcc                                         266
<210>13
<211>792
<212>DNA
<213>人工序列
<220>
<223>叶绿体密码子优化的特异性地针对破伤风毒素的抗体
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>13
atg ctc gag cag tct ggg gct gag gtg aag aag cct ggg tcc tcg gtg       48
Met Leu Glu Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser Ser Val
1               5                   10                  15
aag gtc tcc tgc agg gct tct gga ggc acc ttc aac aat tat gcc atc       96
Lys Val Ser Cys Arg Ala Ser Gly Gly Thr Phe Asn Asn Tyr Ala Ile
            20                  25                  30
agc tgg gtg cga cag gcc cct gga caa ggg ctt gag tgg atg gga ggg      144
Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met Gly Gly
        35                  40                  45
atc ttc cct ttc cgt aat aca gca aag tac gca caa cac ttc cag ggc    192
Ile Phe Pro Phe Arg Asn Thr Ala Lys Tyr Ala Gln His Phe Gln Gly
    50                  55                  60
agg gtc acc att acc gcg gac gaa tcc acg ggc aca gcc tac atg gag    240
Arg Val Thr Ile Thr Ala Asp Glu Ser Thr Gly Thr Ala Tyr Met Glu
65                  70                  75                  80
ctg agc agc ctg aga tct gag gac acg gcc ata tat tat tgt gcg aga    288
Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Ile Tyr Tyr Cys Ala Arg
                85                  90                  95
ggg gat acg att ttt gga gtg acc atg gga tac tac gct atg gac gtc    336
Gly Asp Thr Ile Phe Gly Val Thr Met Gly Tyr Tyr Ala Met Asp Val
            100                 105                 110
tgg ggc caa ggg acc acc gtc acc gtc tcc tct ggt ggc ggt ggc tcg    384
Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly Ser
        115                 120                 125
ggc ggt ggt ggg tcg ggt ggc ggc gga tct gag ctc gtt ctc acg cag    432
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Leu Val Leu Thr Gln
    130                 135                 140
tct cca ggc acc ctg tct ttg tct cca ggg gaa aga gcc acc ctc tcc    480
Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser
145                 150                 155                 160
tgc agg gcc agt cac agt gtt agc agg gcc tac tta gcc tgg tac cag    528
Cys Arg Ala Ser His Ser Val Ser Arg Ala Tyr Leu Ala Trp Tyr Gln
                165                 170                 175
cag aaa cct ggc cag gct ccc agg ctc ctc atc tat ggt aca tcc agc    576
Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Thr Ser Ser
            180                 185                 190
agg gcc act ggc atc cca gac agg ttc agt ggc agt ggg tct ggg aca    624
Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr
        195                 200                 205
gac ttc act ctc acc atc agc aga ctg gag cct gaa gat ttt gca gtg    672
Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val
    210                 215                 220
tac tac tgt cag cag tat ggt ggc tca ccg tgg ttc ggc caa ggg acc    720
Tyr Tyr Cys Gln Gln Tyr Gly Gly Ser Pro Trp Phe Gly Gln Gly Thr
225                 230                 235                 240
aag gtg gaa ctc aaa cga act agt ggc cag gcc ggc cag tac ccg tac    768
Lys Val Glu Leu Lys Arg Thr Ser Gly Gln Ala Gly Gln Tyr Pro Tyr
                245                 250                 255
gac gtt ccg gac tac gct tct taa                                    792
Asp Val Pro Asp Tyr Ala Ser
            260
<210>14
<211>263
<212>PRT
<213>人工序列
<220>
<223>叶绿体密码子优化的特异性地针对破伤风毒素的抗体
<400>14
Met Leu Glu Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser Ser Val
1               5                   10                  15
Lys Val Ser Cys Arg Ala Ser Gly Gly Thr Phe Asn Asn Tyr Ala Ile
            20                  25                  30
Ser Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met Gly Gly
        35                  40                  45
Ile Phe Pro Phe Arg Asn Thr Ala Lys Tyr Ala Gln His Phe Gln Gly
    50                  55                  60
Arg Val Thr Ile Thr Ala Asp Glu Ser Thr Gly Thr Ala Tyr Met Glu
65                  70                  75                  80
Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Ile Tyr Tyr Cys Ala Arg
                85                  90                  95
Gly Asp Thr Ile Phe Gly Val Thr Met Gly Tyr Tyr Ala Met Asp Val
            100                 105                 110
Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly Ser
        115                 120                 125
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Leu Val Leu Thr Gln
    130                 135                 140
Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser
145                 150                 155                 160
Cys Arg Ala Ser His Ser Val Ser Arg Ala Tyr Leu Ala Trp Tyr Gln
                165                 170                 175
Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Thr Ser Ser
            180                 185                 190
Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr
        195                 200                 205
Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val
    210                 215                 220
Tyr Tyr Cys Gln Gln Tyr Gly Gly Ser Pro Trp Phe Gly Gln Gly Thr
225                 230                 235                 240
Lys Val Glu Leu Lys Arg Thr Ser Gly Gln Ala Gly Gln Tyr Pro Tyr
                245                 250                 255
Asp Val Pro Asp Tyr Ala Ser
            260
<210>15
<211>1926
<212>DNA
<213>人工序列
<220>
<223>叶绿体密码子优化的特异性地针对单纯疱疹病毒的抗体
<220>
<221>CDS
<222>(1)..(1917)
<223>
<400>15
cat atg gct gct cac cac cac cac cac cac gtt gct caa gct gct tca    48
His Met Ala Ala His His His His His His Val Ala Gln Ala Ala Ser
1               5                   10                  15
tca gaa tta acg caa tca cca ggt acc tta tca tta tca cca ggt gaa    96
Ser Glu Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
            20                  25                  30
cgt gct acc tta tca tgt cgt gct tca caa tca gtt tca tca gct tac   144
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ala Tyr
        35                  40                  45
tta gct tgg tac caa caa aaa cca ggt caa gct cca cgt tta tta att   192
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
    50                  55                  60
tac ggt gct tca tca cgt gct act ggt att cca gat cgt ttc tca ggt   240
Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
65                  70                  75                  80
tca ggt tca ggt aca gat ttc act tta acc att tca cgt tta gaa cca   288
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro
                85                  90                  95
gaa gat ttc gct gtt tac tac tgt caa caa tac ggt cgt tca cca act   336
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Pro Thr
            100                 105                 110
ttc ggt ggt ggt acc aaa gtt gaa att aaa cgt act tca tca ggt ggt   384
Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Ser Ser Gly Gly
        115                 120                 125
ggt ggt tca ggt ggt ggt ggt ggt ggt tca tca cgt tca tca tta gaa    432
Gly Gly Ser Gly Gly Gly Gly Gly Gly Ser Ser Arg Ser Ser Leu Glu
    130                 135                 140
caa tca ggt gct gaa gtt aaa aaa cca ggt tca tca gtt aaa gtt tca    480
Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser Ser Val Lys Val Ser
145                 150                 155                 160
tgt aaa gct tca ggt ggt tca ttc tca tca tac gct att aac tgg gtt    528
Cys Lys Ala Ser Gly Gly Ser Phe ger Ser Tyr Ala Ile Asn Trp Val
                165                 170                 175
cgt caa gct caa ggt caa ggt tta gaa tgg atg ggt ggt tta atg cca    576
Arg Gln Ala Gln Gly Gln Gly Leu Glu Trp Met Gly Gly Leu Met Pro
            180                 185                 190
att ttc ggt aca aca aac tac gct caa aaa ttc caa gat cgt tta acg    624
Ile Phe Gly Thr Thr Asn Tyr Ala Gln Lys Phe Gln Asp Arg Leu Thr
        195                 200                 205
att acc gct gat gtt tca acg tca aca gct tac atg caa tta tca ggt    672
Ile Thr Ala Asp Val Ser Thr Ser Thr Ala Tyr Met Gln Leu Ser Gly
    210                 215                 220
tta aca tac gaa gat acg gct atg tac tac tgt gct cgt gtt gct tac    720
Leu Thr Tyr Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg Val Ala Tyr
225                 230                 235                 240
atg tta gaa cca acc gtt act gct ggt ggt tta gat gtt tgg ggt aaa    768
Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu Asp Val Trp Gly Lys
                245                 250                 255
ggt acc acg gtt acc gtt tca cca gct tca cca acc tca cca aaa gtt    816
Gly Thr Thr Val Thr Val Ser Pro Ala Ser Pro Thr Ser Pro Lys Val
            260                 265                 270
ttc cca tta tca tta tgt tca acc caa cca gat ggt aac gtt gtt att    864
Phe Pro Leu Ser Leu Cys Ser Thr Gln Pro Asp Gly Asn Val Val Ile
        275                 280                 285
gct tgt tta gtt caa ggt ttc ttc cca caa gaa cca tta tca gtt acc    912
Ala Cys Leu Val Gln Gly Phe Phe Pro Gln Glu Pro Leu Ser Val Thr
    290                 295                 300
tgg tca gaa tca ggt caa ggt gtt acc gct cgt aac ttc cca cca tca    960
Trp Ser Glu Ser Gly Gln Gly Val Thr Ala Arg Asn Phe Pro Pro Ser
305                 310                 315                 320
caa gat gct tca ggt gat tta tac acc acg tca tca caa tta acc tta   1008
Gln Asp Ala Ser Gly Asp Leu Tyr Thr Thr Ser Ser Gln Leu Thr Leu
                325                 330                 335
cca gct aca caa tgt tta gct ggt aaa tca gtt aca tgt cac gtt aaa   1056
Pro Ala Thr Gln Cys Leu Ala Gly Lys Ser Val Thr Cys His Val Lys
            340                 345                 350
cac tac acg aac cca tca caa gat gtt act gtt cca tgt cca gtt cca   1104
His Tyr Thr Asn Pro Ser Gln Asp Val Thr Val Pro Cys Pro Val Pro
        355                 360                 365
tca act cca cca acc cca tca cca tca act cca cca acc cca tca cca   1152
Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser Pro
    370                 375                 380
tca tgt tgt cac cca cgt tta tca tta cac cgt cca gct tta gaa gat    1200
Ser Cys Cys His Pro Arg Leu Ser Leu His Arg Pro Ala Leu Glu Asp
385                 390                 395                 400
tta tta tta ggt tca gaa gct aac tta acg tgt aca tta acc ggt tta    1248
Leu Leu Leu Gly Ser Glu Ala Asn Leu Thr Cys Thr Leu Thr Gly Leu
                405                 410                 415
cgt gat gct tca ggt gtt acc ttc acc tgg acg cca tca tca ggt aaa    1296
Arg Asp Ala Ser Gly Val Thr Phe Thr Trp Thr Pro Ser Ser Gly Lys
            420                 425                 430
tca gct gtt caa ggt cca cca gaa cgt gat tta tgt ggt tgt tac tca    1344
Ser Ala Val Gln Gly Pro Pro Glu Arg Asp Leu Cys Gly Cys Tyr Ser
        435                 440                 445
gtt tca tca gtt tta cca ggt tgt gct gaa cca tgg aac cac ggt aaa    1392
Val Ser Ser Val Leu Pro Gly Cys Ala Glu Pro Trp Asn His Gly Lys
    450                 455                 460
acc ttc act tgt act gct gct tac cca gaa tca aaa acc cca tta acc    1440
Thr Phe Thr Cys Thr Ala Ala Tyr Pro Glu Ser Lys Thr Pro Leu Thr
465                 470                 475                 480
gct acc tta tca aaa tca ggt aac aca ttc cgt cca gaa gtt cac tta    1488
Ala Thr Leu Ser Lys Ser Gly Asn Thr Phe Arg Pro Glu Val His Leu
                485                 490                 495
tta cca cca cca tca gaa gaa tta gct tta aac gaa tta gtt acg tta    1536
Leu Pro Pro Pro Ser Glu Glu Leu Ala Leu Asn Glu Leu Val Thr Leu
            500                 505                 510
acg tgt tta gct cgt ggt ttc tca cca aaa gat gtt tta gtt cgt tgg    1584
Thr Cys Leu Ala Arg Gly Phe Ser Pro Lys Asp Val Leu Val Arg Trp
        515                 520                 525
tta caa ggt tca caa gaa tta cca cgt gaa aaa tac tta act tgg gct    1632
Leu Gln Gly Ser Gln Glu Leu Pro Arg Glu Lys Tyr Leu Thr Trp Ala
    530                 535                 540
tca cgt caa gaa cca tca caa ggt acc acc acc ttc gct gtt acc tca    1680
Ser Arg Gln Glu Pro Ser Gln Gly Thr Thr Thr Phe Ala Val Thr Ser
545                 550                 555                 560
att tta cgt gtt gct gct gaa gat tgg aaa aaa ggt gat acc ttc tca    1728
Ile Leu Arg Val Ala Ala Glu Asp Trp Lys Lys Gly Asp Thr Phe Ser
                565                 570                 575
tgt atg gtt ggt cac gaa gct tta cca tta gct ttc aca caa aaa acc    1776
Cys Met Val Gly His Glu Ala Leu Pro Leu Ala Phe Thr Gln Lys Thr
            580                 585                 590
att gat cgt tta gct ggt aaa cca acc cac gtt aac gtt tca gtt gtt    1824
Ile Asp Arg Leu Ala Gly Lys Pro Thr His Val Asn Val Ser Val Val
        595                 600                 605
atg gct gaa gtt gat ggt acc tgt tac gat tat aaa gat cac gat ggt    1872
Met Ala Glu Val Asp Gly Thr Cys Tyr Asp Tyr Lys Asp His Asp Gly
    610                 615                 620
gat tac aaa gat cac gat att gat tat aaa gat gat gat gat aaa    1917
Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys
625                 630                 635
taatctaga                                                      1926
<210>16
<211>639
<212>PRT
<213>人工序列
<220>
<223>叶绿体密码子优化的特异性地针对单纯疱疹病毒的抗体
<400>16
His Met Ala Ala His His His His His His Val Ala Gln Ala Ala Ser
1               5                   10                  15
Ser Glu Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly Glu
            20                  25                  30
Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Ala Tyr
        35                  40                  45
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile
    50                  55                  60
Tyr Gly Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser Gly
65                  70                  75                  80
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu Pro
                85                  90                  95
Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Arg Ser Pro Thr
            100                 105                 110
Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Ser Ser Gly Gly
        115                 120                 125
Gly Gly Ser Gly Gly Gly Gly Gly Gly Ser Ser Arg Ser Ser Leu Glu
    130                 135                 140
Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser Ser Val Lys Val Ser
145                 150                 155                 160
Cys Lys Ala Ser Gly Gly Ser Phe Ser Ser Tyr Ala Ile Asn Trp Val
                165                 170                 175
Arg Gln Ala Gln Gly Gln Gly Leu Glu Trp Met Gly Gly Leu Met Pro
            180                 185                 190
Ile Phe Gly Thr Thr Asn Tyr Ala Gln Lys Phe Gln Asp Arg Leu Thr
        195                 200                 205
Ile Thr Ala Asp Val Ser Thr Ser Thr Ala Tyr Met Gln Leu Ser Gly
    210                 215                 220
Leu Thr Tyr Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg Val Ala Tyr
225                 230                 235                 240
Met Leu Glu Pro Thr Val Thr Ala Gly Gly Leu Asp Val Trp Gly Lys
                245                 250                 255
Gly Thr Thr Val Thr Val Ser Pro Ala Ser Pro Thr Ser Pro Lys Val
            260                 265                 270
Phe Pro Leu Ser Leu Cys Ser Thr Gln Pro Asp Gly Asn Val Val Ile
        275                 280                 285
Ala Cys Leu Val Gln Gly Phe Phe Pro Gln Glu Pro Leu Ser Val Thr
    290                 295                 300
Trp Ser Glu Ser Gly Gln Gly Val Thr Ala Arg Asn Phe Pro Pro Ser
305                 310                 315                 320
Gln Asp Ala Ser Gly Asp Leu Tyr Thr Thr Ser Ser Gln Leu Thr Leu
                325                 330                 335
Pro Ala Thr Gln Cys Leu Ala Gly Lys Ser Val Thr Cys His Val Lys
            340                 345                 350
His Tyr Thr Asn Pro Ser Gln Asp Val Thr Val Pro Cys Pro Val Pro
        355                 360                 365
Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser Pro
    370                 375                 380
Ser Cys Cys His Pro Arg Leu Ser Leu His Arg Pro Ala Leu Glu Asp
385                 390                 395                 400
Leu Leu Leu Gly Ser Glu Ala Asn Leu Thr Cys Thr Leu Thr Gly Leu
                405                 410                 415
Arg Asp Ala Ser Gly Val Thr Phe Thr Trp Thr Pro Ser Ser Gly Lys
            420                 425                 430
Ser Ala Val Gln Gly Pro Pro Glu Arg Asp Leu Cys Gly Cys Tyr Ser
        435                 440                 445
Val Ser Ser Val Leu Pro Gly Cys Ala Glu Pro Trp Asn His Gly Lys
    450                 455                 460
Thr Phe Thr Cys Thr Ala Ala Tyr Pro Glu Ser Lys Thr Pro Leu Thr
465                 470                 475                 480
Ala Thr Leu Ser Lys Ser Gly Asn Thr Phe Arg Pro Glu Val His Leu
                485                 490                 495
Leu Pro Pro Pro Ser Glu Glu Leu Ala Leu Asn Glu Leu Val Thr Leu
            500                 505                 510
Thr Cys Leu Ala Arg Gly Phe Ser Pro Lys Asp Val Leu Val Arg Trp
        515                 520                 525
Leu Gln Gly Ser Gln Glu Leu Pro Arg Glu Lys Tyr Leu Thr Trp Ala
    530                 535                 540
Ser Arg Gln Glu Pro Ser Gln Gly Thr Thr Thr Phe Ala Val Thr Ser
545                 550                 555                 560
Ile Leu Arg Val Ala Ala Glu Asp Trp Lys Lys Gly Asp Thr Phe Ser
                565                 570                 575
Cys Met Val Gly His Glu Ala Leu Pro Leu Ala Phe Thr Gln Lys Thr
            580                 585                 590
Ile Asp Arg Leu Ala Gly Lys Pro Thr His Val Asn Val Ser Val Val
        595                 600                 605
Met Ala Glu Val Asp Gly Thr Cys Tyr Asp Tyr Lys Asp His Asp Gly
    610                 615                 620
Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys
625                 630                 635
<210>17
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>17
catatgagta aaggagaaga ac                                          22
<210>18
<211>25
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>18
tctagattat ttgtatagtt catcc                                       25
<210>19
<211>18
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>19
tctagagtcg acctgcag                                               18
<210>20
<211>17
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>20
ggatccgtcg acgtatg                                                17
<210>21
<211>31
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>21
gaattcatat acctaaaggc cctttctatg c                                31
<210>22
<211>25
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>22
catatgtata aataaatgta acttc                                       25
<210>23
<211>57
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>23
gaagcttgaa tttataaatt aaaatatttt tacaatattt tacccagaaa ttaaaac    57
<210>24
<211>44
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>24
tgtcatatgt taattttttt aaagtttttc tccgtaaaat attg                  44
<210>25
<211>40
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>25
tgtcatatgt taattttttt aaagtctccg taaaatattg                       40
<210>26
<211>36
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>26
tgtcatatgt taattttttt tctccgtaaa atattg                           36
<210>27
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>27
gtcatatgtt aatttctccg                                                 20
<210>28
<211>38
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>28
tgtcatatgt taatcctcct aaagttttaa tttctccg                             38
<210>29
<211>10
<212>RNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>29
caccuccuuc                                                            10
<210>30
<211>2000
<212>DNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<220>
<221>CDS
<222>(497)..(1552)
<223>
<400>30
cgtcatagta tatcaatatt gtaacagatt gacacccttt aagtaaacat tttttttgag     60
tcatatggag tcatatgaaa ttaaatggat atttggtaca tttaattcca caaaaatgtc    120
caatacttaa aatacaaaat taaaagtatt agttgtaaac ttgactaaca ttttaaattt    180
taaatttttt cctaattata tattttactt gcaaaattta taaaaatttt atgcattttt    240
atatcataat aataaaacct ttattcatgg tttataatat aataattgtg atgactatgc    300
acaaagcagt tctagtccca tatatataac tatatataac ccgtttaaag atttatttaa    360
aaatatgtgt gtaaaaaatg cttattttta attttatttt atataagtta taatattaaa    420
tacacaatga ttaaaattaa ataataataa atttaacgta acgatgagtt gtttttttat    480
tttggagata cacgca atg aca att gcg atc ggt aca tat caa gag aaa cgc    532
                  Met Thr Ile Ala Ile Gly Thr Tyr Gln Glu Lys Arg
                  1               5                   10
aca tgg ttc gat gac gct gat gac tgg ctt cgt caa gac cgt ttc gta      580
Thr Trp Phe Asp Asp Ala Asp Asp Trp Leu Arg Gln Asp Arg Phe Val
        15                  20                  25
ttc gta ggt tgg tca ggt tta tta cta ttc cct tgt gct tac ttt gca    628
Phe Val Gly Trp Ser Gly Leu Leu Leu Phe Pro Cys Ala Tyr Phe Ala
    30                  35                  40
tta ggt ggt tgg tta act ggt act act ttc gtt act tca tgg tat acg    676
Leu Gly Gly Trp Leu Thr Gly Thr Thr Phe Val Thr Ser Trp Tyr Thr
45                  50                  55                  60
cat ggt tta gct act tct tac tta gaa ggt tgt aac ttc tta aca gca    724
His Gly Leu Ala Thr Ser Tyr Leu Glu Gly Cys Asn Phe Leu Thr Ala
                65                  70                  75
gct gtt tct aca cct gct aac agt atg gct cac tct ctt cta ttt gtt    772
Ala Val Ser Thr Pro Ala Asn Ser Met Ala His Ser Leu Leu Phe Val
            80                  85                  90
tgg ggt cca gaa gct caa ggt gat ttc act cgt tgg tgt caa ctt ggt    820
Trp Gly Pro Glu Ala Gln Gly Asp Phe Thr Arg Trp Cys Gln Leu Gly
        95                  100                 105
ggt tta tgg gca ttc gtt gct tta cac ggt gca ttt ggt tta att ggt    868
Gly Leu Trp Ala Phe Val Ala Leu His Gly Ala Phe Gly Leu Ile Gly
    110                 115                 120
ttc atg ctt cgt cag ttt gaa att gct cgt tca gta aac tta cgt cca    916
Phe Met Leu Arg Gln Phe Glu Ile Ala Arg Ser Val Asn Leu Arg Pro
125                 130                 135                 140
tac aac gca att gct ttc tca gca cca att gct gta ttc gtt tca gta    964
Tyr Asn Ala Ile Ala Phe Ser Ala Pro Ile Ala Val Phe Val Ser Val
                145                 150                 155
ttc cta att tac cca tta ggt caa tca ggt tgg ttc ttt gca cct agt   1012
Phe Leu Ile Tyr Pro Leu Gly Gln Ser Gly Trp Phe Phe Ala Pro Ser
            160                 165                 170
ttc ggt gta gct gct atc ttc cgt ttc att tta ttc ttc caa ggt ttc   1060
Phe Gly Val Ala Ala Ile Phe Arg Phe Ile Leu Phe Phe Gln Gly Phe
        175                 180                 185
cac aac tgg aca ctt aac cca ttc cac atg atg ggt gtt gct ggt gtt   1108
His Asn Trp Thr Leu Asn Pro Phe His Met Met Gly Val Ala Gly Val
    190                 195                 200
tta ggt gct gct tta tta tgt gct att cac ggt gct act gtt gaa aac   1156
Leu Gly Ala Ala Leu Leu Cys Ala Ile His Gly Ala Thr Val Glu Asn
205                 210                 215                 220
aca tta ttc gaa gac ggt gac ggt gct aac aca ttc cgt gca ttc aac   1204
Thr Leu Phe Glu Asp Gly Asp Gly Ala Asn Thr Phe Arg Ala Phe Asn
                225                 230                 235
cct aca cag gct gaa gaa aca tac tct atg gtt act gct aac cgt ttc   1252
Pro Thr Gln Ala Glu Glu Thr Tyr Ser Met Val Thr Ala Asn Arg Phe
            240                 245                 250
tgg tca caa atc ttc ggt gtt gct ttc tct aac aaa cgt tgg ctt cac   1300
Trp Ser Gln Ile Phe Gly Val Ala Phe Ser Asn Lys Arg Trp Leu His
        255                 260                 265
ttc ttc atg tta tta gtt cca gta act ggt ctt tgg atg agt gct att    1348
Phe Phe Met Leu Leu Val Pro Val Thr Gly Leu Trp Met Ser Ala Ile
    270                 275                 280
ggt gtt gta ggt tta gct cta aac tta cgt gct tac gac ttc gta tca    1396
Gly Val Val Gly Leu Ala Leu Asn Leu Arg Ala Tyr Asp Phe Val Ser
285                 290                 295                 300
caa gag att cgt gct gct gaa gac cct gaa ttc gaa aca ttc tac act    1444
Gln Glu Ile Arg Ala Ala Glu Asp Pro Glu Phe Glu Thr Phe Tyr Thr
                305                 310                 315
aaa aac att ctt ctt aac gaa ggt att cgt gct tgg atg gct gct caa    1492
Lys Asn Ile Leu Leu Asn Glu Gly Ile Arg Ala Trp Met Ala Ala Gln
            320                 325                 330
gac caa cca cac gaa cgt tta gta ttc cct gaa gaa gta tta cca cgt    1540
Asp Gln Pro His Glu Arg Leu Val Phe Pro Glu Glu Val Leu Pro Arg
        335                 340                 345
ggt aac gct cta taatatattt ttatataaat taccaatact aattagtatt        1592
Gly Asn Ala Leu
    350
ggtaatttat attactttat tatttaaaag aaaatgcccc tttggggcta aaaatcacat  1652
gagtgcttga gccgtatgcg aaaaaactcg catgtacggt tctttaggag gatttaaaat  1712
attaaaaaat aaaaaaacaa atcctacctg actaaaccag gacatttttc acgtactctg  1772
tcaaaaggtc caaacacaac aacttggatt tggaaccttc acgcagatgc tcatgacttt  1832
gacagtcata caagtgatct agaagaaatt tctagaaaag tattcagtgc acactttggt  1892
caattaggta tcattttcat ttggttaagt gggtgcgaca cgaagacgta tatattttta  1952
tagtttaaaa agatactttt acactgtagt tgaaaagtat aagcactt               2000
<210>31
<211>352
<212>PRT
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>31
Met Thr Ile Ala Ile Gly Thr Tyr Gln Glu Lys Arg Thr Trp Phe Asp
1               5                   10                  15
Asp Ala Asp Asp Trp Leu Arg Gln Asp Arg Phe Val Phe Val Gly Trp
            20                  25                  30
Ser Gly Leu Leu Leu Phe Pro Cys Ala Tyr Phe Ala Leu Gly Gly Trp
        35                  40                  45
Leu Thr Gly Thr Thr Phe Val Thr Ser Trp Tyr Thr His Gly Leu Ala
    50                  55                  60
Thr Ser Tyr Leu Glu Gly Cys Asn Phe Leu Thr Ala Ala Val Ser Thr
65                  70                  75                  80
Pro Ala Asn Ser Met Ala His Ser Leu Leu Phe Val Trp Gly Pro Glu
                85                  90                  95
Ala Gln Gly Asp Phe Thr Arg Trp Cys Gln Leu Gly Gly Leu Trp Ala
            100                 105                 110
Phe Val Ala Leu His Gly Ala Phe Gly Leu Ile Gly Phe Met Leu Arg
        115                 120                 125
Gln Phe Glu Ile Ala Arg Ser Val Asn Leu Arg Pro Tyr Asn Ala Ile
    130                 135                 140
Ala Phe Ser Ala Pro Ile Ala Val Phe Val Ser Val Phe Leu Ile Tyr
145                 150                 155                 160
Pro Leu Gly Gln Ser Gly Trp Phe Phe Ala Pro Ser Phe Gly Val Ala
                165                 170                 175
Ala Ile Phe Arg Phe Ile Leu Phe Phe Gln Gly Phe His Asn Trp Thr
            180                 185                 190
Leu Asn Pro Phe His Met Met Gly Val Ala Gly Val Leu Gly Ala Ala
        195                 200                 205
Leu Leu Cys Ala Ile His Gly Ala Thr Val Glu Asn Thr Leu Phe Glu
    210                 215                 220
Asp Gly Asp Gly Ala Asn Thr Phe Arg Ala Phe Asn Pro Thr Gln Ala
225                 230                 235                 240
Glu Glu Thr Tyr Ser Met Val Thr Ala Asn Arg Phe Trp Ser Gln Ile
                245                 250                 255
Phe Gly Val Ala Phe Ser Asn Lys Arg Trp Leu His Phe Phe Met Leu
            260                 265                 270
Leu Val Pro Val Thr Gly Leu Trp Met Ser Ala Ile Gly Val Val Gly
        275                 280                 285
Leu Ala Leu Asn Leu Arg Ala Tyr Asp Phe Val Ser Gln Glu Ile Arg
    290                 295                 300
Ala Ala Glu Asp Pro Glu Phe Glu Thr Phe Tyr Thr Lys Asn Ile Leu
305                 310                 315                 320
Leu Asn Glu Gly Ile Arg Ala Trp Met Ala Ala Gln Asp Gln Pro His
                325                 330                 335
Glu Arg Leu Val Phe Pro Glu Glu Val Leu Pro Arg Gly Asn Ala Leu
            340                 345                 350
<210>32
<211>45
<212>RNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>32
caauauuuua cggagaaauu aaaacuuuaa aaaaauuaac auaug                      45
<210>33
<211>13
<212>RNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>33
gcucaccucc uuc                                                         13
<210>34
<211>38
<212>RNA
<213>莱茵衣藻(Chlamydomonas reinhardtii)
<400>34
uuacggagaa auuaaaacuu uaaaaaaauu aacauaug                              38
<210>35
<211>34
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>35
uuacaaauua aaacuuuaaa aaaauuaaca uaug                                  34
<210>36
<211>38
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>36
uuacccagaa auuaaaacuu uaaaaaaauu aacauaug                              38
<210>37
<211>34
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>37
uuacggagaa aaacuuuaaa aaaauuaaca uaug                                  34
<210>38
<211>30
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>38
uuacggagac uuuaaaaaaa uuaacauaug                                       30
<210>39
<211>26
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>39
uuacggagaa aaaaaauuaa cauaug                                           26
<210>40
<211>22
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>40
uuacggagaa auuaaacaua ug                                               22
<210>41
<211>38
<212>RNA
<213>人工序列
<220>
<223>SEQ ID NO：32的突变序列
<400>41
uuacggagaa auuaaaacuu uaggaggauu aacauaug                              38
<210>42
<211>840
<212>DNA
<213>人类(homo sapiens)
<400>42
catatggttg ctcaagctgc ttcatcagaa ttaacgcaat caccaggtac cttatcatta     60
tcaccaggtg aacgtgctac cttatcatgt cgtgcttcac aatcagtttc atcagcttac    120
ttagcttggt accaacaaaa accaggtcaa gctccacgtt tattaattta cggtgcttca    180
tcacgtgcta ctggtattcc agatcgtttc tcaggttcag gttcaggtac agatttcact    240
ttaaccattt cacgtttaga accagaagat ttcgctgttt actactgtca acaatacggt    300
cgttcaccaa ctttcggtgg tggtaccaaa gttgaaatta aacgtacttc atcaggtggt    360
ggtggttcag gtggtggtgg tggtggttca tcacgttcat cattagaaca atcaggtgct    420
gaagttaaaa aaccaggttc atcagttaaa gtttcatgta aagcttcagg tggttcattc    480
tcatcatacg ctattaactg ggttcgtcaa gctcaaggtc aaggtttaga atggatgggt    540
ggtttaatgc caattttcgg tacaacaaac tacgctcaaa aattccaaga tcgtttaacg    600
attaccgctg atgtttcaac gtcaacagct tacatgcaat tatcaggttt aacatacgaa    660
gatacggcta tgtactactg tgctcgtgtt gcttacatgt tagaaccaac cgttactgct    720
ggtggtttag atgtttgggg taaaggtacc acggttaccg tttcagatta taaagatcac    780
gatggtgatt acaaagatca cgatattgat tataaagatg atgatgataa ataatctaga    840
<210>43
<211>277
<212>PRT
<213>人类(homo sapiens)
<400>43
His Met Val Ala Gln Ala Ala Ser Ser Glu Leu Thr Gln Ser Pro Gly
1               5                   10                  15
Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala
            20                  25                  30
Ser Gln Ser Val Ser Ser Ala Tyr Leu Ala Trp Tyr Gln Gln Lys Pro
        35                  40                  45
Gly Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala Thr
    50                  55                  60
Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr
65                  70                  75                  80
Leu Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys
                85                  90                  95
Gln Gln Tyr Gly Arg Ser Pro Thr Phe Gly Gly Gly Thr Lys Val Glu
            100                 105                 110
Ile Lys Arg Thr Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
        115                 120                 125
Gly Ser Ser Arg Ser Ser Leu Glu Gln Ser Gly Ala Glu Val Lys Lys
    130                 135                 140
Pro Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe
145                 150                 155                 160
Ser Ser Tyr Ala Ile Asn Trp Val Arg Gln Ala Gln Gly Gln Gly Leu
                165                 170                 175
Glu Trp Met Gly Gly Leu Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala
            180                 185                 190
Gln Lys Phe Gln Asp Arg Leu Thr Ile Thr Ala Asp Val Ser Thr Ser
        195                 200                 205
Thr Ala Tyr Met Gln Leu Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met
    210                 215                 220
Tyr Tyr Cys Ala Arg Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala
225                 230                 235                 240
Gly Gly Leu Asp Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Asp
                245                 250                 255
Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys
            260                 265                 270
Asp Asp Asp Asp Lys
        275
<210>44
<211>681
<212>PRT
<213>哈维氏弧菌(Vibrio harveyi)
<400>44
Met Lys Phe Gly Asn Phe Leu Leu Thr Tyr Gln Pro Pro Glu Leu Ser
1               5                   10                  15
Gln Thr Glu Val Met Lys Arg Leu Val Asn Leu Gly Lys Ala Ser Glu
            20                  25                  30
Gly Cys Gly Phe Asp Thr Val Trp Leu Leu Glu His His Phe Thr Glu
        35                  40                  45
Phe Gly Leu Leu Gly Asn Pro Tyr Val Ala Ala Ala His Leu Leu Gly
    50                  55                  60
Thr Thr Glu Thr Leu Asn Val Gly Thr Ala Ala Ile Val Leu Pro Thr
65                  70                  75                  80
Ala His Pro Val Arg Gln Ala Glu Asp Val Asn Leu Leu Asp Gln Met
                85                  90                  95
Ser Lys Gly Arg Phe Arg Phe Gly Ile Cys Arg Gly Leu Tyr Asp Lys
            100                 105                 110
Asp Phe Arg Val Phe Gly Thr Asp Met Asp Asn Ser Arg Ala Leu Met
        115                 120                 125
Asp Cys Trp Tyr Asp Leu Met Lys Glu Gly Phe Asn Glu Gly Tyr Ile
    130                 135                 140
Ala Ala Asp Asn Glu His Ile Lys Phe Pro Lys Ile Gln Leu Asn Pro
145                 150                 155                 160
Ser Ala Tyr Thr Gln Gly Gly Ala Pro Val Tyr Val Val Ala Glu Ser
                165                 170                 175
Ala Ser Thr Thr Glu Trp Ala Ala Glu Arg Gly Leu Pro Met Ile Leu
            180                 185                 190
Ser Trp Ile Ile Asn Thr His Glu Lys Lys Ala Gln Leu Asp Leu Tyr
        195                 200                 205
Asn Glu Val Ala Thr Glu His Gly Tyr Asp Val Thr Lys Ile Asp His
    210                 215                 220
Cys Leu Ser Tyr Ile Thr Ser Val Asp His Asp Ser Asn Arg Ala Lys
225                 230                 235                 240
Asp Ile Cys Arg Asn Phe Leu Gly His Trp Tyr Asp Ser Tyr Val Asn
                245                 250                 255
Ala Thr Lys Ile Phe Asp Asp Ser Asp Gln Thr Lys Gly Tyr Asp Phe
            260                 265                 270
Asn Lys Gly Gln Trp Arg Asp Phe Val Leu Lys Gly His Lys Asp Thr
        275                 280                 285
Asn Arg Arg Ile Asp Tyr Ser Tyr Glu Ile Asn Pro Val Gly Thr Pro
    290                 295                 300
Glu Glu Cys Ile Ala Ile Ile Gln Gln Asp Ile Asp Ala Thr Gly Ile
305                 310                 315                 320
Asp Asn Ile Cys Cys Gly Phe Glu Ala Asn Gly Ser Glu Glu Glu Ile
                325                 330                 335
Ile Ala Ser Met Lys Leu Phe Gln Ser Asp Val Met Pro Tyr Leu Lys
            340                 345                 350
Glu Lys Gln Glx Met Lys Phe Gly Leu Phe Phe Leu Asn Phe Met Asn
        355                 360                 365
Ser Lys Arg Ser Ser Asp Gln Val Ile Glu Glu Ile Leu Asp Thr Ala
    370                 375                 380
His Tyr Val Asp Gln Leu Lys Phe Asp Thr Leu Ala Val Tyr Glu Asn
385                 390                 395                 400
His Phe Ser Asn Asn Gly Val Val Gly Ala Pro Leu Thr Val Ala Gly
                405                 410                 415
Phe Leu Leu Gly Met Thr Lys Asn Ala Lys Val Ala Ser Leu Asn His
            420                 425                 430
Val Ile Thr Thr His His Pro Val Arg Val Ala Glu Glu Ala Cys Leu
        435                 440                 445
Leu Asp Gln Met Ser Glu Gly Arg Phe Ala Phe Gly Phe Ser Asp Cys
    450                 455                 460
Glu Lys Ser Ala Asp Met Arg Phe Phe Asn Arg Pro Thr Asp Ser Gln
465                 470                 475                 480
Phe Gln Leu Phe Ser Glu Cys His Lys Ile Ile Asn Asp Ala Phe Thr
                485                 490                 495
Thr Gly Tyr Cys His Pro Asn Asn Asp Phe Tyr Ser Phe Pro Lys Ile
            500                 505                 510
Ser Val Asn Pro His Ala Phe Thr Glu Gly Gly Pro Ala Gln Phe Val
        515                 520                 525
Asn Ala Thr Ser Lys Glu Val Val Glu Trp Ala Ala Lys Leu Gly Leu
    530                 535                 540
Pro Leu Val Phe Arg Trp Asp Asp Ser Asn Ala Gln Arg Lys Glu Tyr
545                 550                 555                 560
Ala Gly Leu Tyr His Glu Val Ala Gln Ala His Gly Val Asp Val Ser
                565                 570                 575
Gln Val Arg His Lys Leu Thr Leu Leu Val Asn Gln Asn Val Asp Gly
            580                 585                 590
Glu Ala Ala Arg Ala Glu Ala Arg Val Tyr Leu Glu Glu Phe Val Arg
        595                 600                 605
Glu Ser Tyr Ser Asn Thr Asp Phe Glu Gln Lys Met Gly Glu Leu Leu
    610                 615                 620
Ser Glu Asn Ala Ile Gly Thr Tyr Glu Glu Ser Thr Gln Ala Ala Arg
625                 630                 635                 640
Val Ala Ile Glu Cys Cys Gly Ala Ala Asp Leu Leu Met Ser Phe Glu
                645                 650                 655
Ser Met Glu Asp Lys Ala Gln Gln Arg Ala Val Ile Asp Val Val Asn
            660                 665                 670
Ala Asn Ile Val Lys Tyr His Ser Glx
        675                 680
<210>45
<211>2094
<212>DNA
<213>人工序列
<220>
<223>使用叶绿体偏好的密码子的luxAB基因
<400>45
catatgaaat ttggtaactt ccttttaact tatcaaccac ctgaactatc tcaaacagaa     60
gttatgaaac gtttagttaa tttaggtaaa gcttctgaag gttgtggttt cgacacagtt     120
tggttattag aacatcactt tactgaattt ggtttattag gtaaccctta tgttgctgct     180
gcacatctat taggtgctac agaaaaatta aatgttggta ctgctgctat tgtattacct     240
actgctcacc ctgttcgtca agcagaagac gtaaatttat tagatcaaat gtcaaaagga     300
cgttttcgtt ttggtatttg tcgtggttta tacgacaaag atttccgtgt ttttggtaca     360
gacatggata atagtcgtgc tttaatggac tgttggtatg acttaatgaa agaaggtttt     420
aacgaaggtt atattgctgc agataatgaa catattaaat tccctaaaat tcaattaaat     480
ccatcagctt acacacaagg tggtgctcct gtttatgttg ttgctgaatc agcatcaaca     540
acagaatggg ctgctgaacg tggtttacca atgattctaa gttggattat taatactcac     600
gaaaaaaaag cacaacttga tctttataat gaagttgcta ctgaacacgg ttacgatgta     660
actaaaattg accattgttt atcttatatt acttcagttg atcacgattc aaacaaagct     720
aaagatattt gtcgtaattt tttaggtcat tggtatgact catacgtaaa tgctacaaaa     780
atttttgatg actctgatca aacaaaaggt tatgacttta ataaaggtca atggcgtgat     840
tttgttttaa aaggtcacaa agatactaac cgtcgtattg attatagtta cgaaattaat     900
ccagtaggta cacctgaaga atgtatcgca attattcaac aagatatcga tgctacaggt     960
attaataata tttgttgtgg ttttgaagct aacggttctg aagaagaaat tatcgcttct    1020
atgaaattat ttcaatctga tgtaatgcca tatcttaaag aaaaacaatc tggtggtgga    1080
ggttcttcag gtggtggagg cggtggttct tcaatgaaat ttggattatt tttccttaat    1140
tttatgaatt caaaacgttc ttctgatcaa gttattgaag aaatgttaga tactgcacat    1200
tatgtagatc aattaaaatt tgacacatta gctgtttacg aaaatcactt ttcaaacaat    1260
ggtgtagttg gtgctccatt aacagtagct ggttttttac ttggtatgac aaaaaacgct    1320
aaagtagctt cattaaatca tgttattact acacaccatc cagtacgtgt agctgaagaa    1380
gcatgtttac ttgatcaaat gagtgaaggt cgttttgttt ttggttttag tgattgtgaa    1440
aaaagtgctg atatgcgttt ttttaatcgt ccaacagatt ctcaatttca attattcagt    1500
gaatgtcaca aaattatcaa tgatgcattt actactggtt attgtcatcc aaataatgat    1560
ttttacagtt ttcctaaaat ttctgttaac ccacacgctt atactgaagg tggtcctgca    1620
caatttgtaa atgctacaag taaagaagta gttgaatggg cagctaaatt aggtcttcca    1680
cttgtattta aatgggacga ttcaaatgct caacgtaaag aatatgctgg tttataccat    1740
gaagttgctc aagcacacgg tgttgatgtt agtcaagttc gtcataaatt aacactatta    1800
gttaatcaaa acgtagatgg tgaagcagct cgtgcagaag ctcgtgttta tttagaagaa    1860
tttgttcgtg aatcttatcc taatactgac ttcgaacaaa aaatggtaga attattatca    1920
gaaaacgcta ttggtactta cgaagaaagt actcaagcag ctcgtgttgc aattgaatgt    1980
tgtggtgctg cagacttatt aatgtctttt gaatcaatgg aagataaagc tcacgaacgt    2040
gcagttattg atgtagtaaa tgctaacatt gttaaatatc attcataatc taga          2094
<210>46
<211>698
<212>PRT
<213>人工序列
<220>
<223>LuxAB融合蛋白
<400>46
His Met Lys Phe Gly Asn Phe Leu Leu Thr Tyr Gln Pro Pro Glu Leu
1               5                   10                  15
Ser Gln Thr Glu Val Met Lys Arg Leu Val Asn Leu Gly Lys Ala Ser
            20                  25                  30
Glu Gly Cys Gly Phe Asp Thr Val Trp Leu Leu Glu His His Phe Thr
        35                  40                  45
Glu Phe Gly Leu Leu Gly Asn Pro Tyr Val Ala Ala Ala His Leu Leu
    50                  55                  60
Gly Ala Thr Glu Lys Leu Asn Val Gly Thr Ala Ala Ile Val Leu Pro
65                  70                  75                  80
Thr Ala His Pro Val Arg Gln Ala Glu Asp Val Asn Leu Leu Asp Gln
                85                  90                  95
Met Ser Lys Gly Arg Phe Arg Phe Gly Ile Cys Arg Gly Leu Tyr Asp
            100                 105                 110
Lys Asp Phe Arg Val Phe Gly Thr Asp Met Asp Asn Ser Arg Ala Leu
        115                 120                 125
Met Asp Cys Trp Tyr Asp Leu Met Lys Glu Gly Phe Asn Glu Gly Tyr
    130                 135                 140
Ile Ala Ala Asp Asn Glu His Ile Lys Phe Pro Lys Ile Gln Leu Asn
145                 150                 155                 160
Pro Ser Ala Tyr Thr Gln Gly Gly Ala Pro Val Tyr Val Val Ala Glu
                165                 170                 175
Ser Ala Ser Thr Thr Glu Trp Ala Ala Glu Arg Gly Leu Pro Met Ile
            180                 185                 190
Leu Ser Trp Ile Ile Asn Thr His Glu Lys Lys Ala Gln Leu Asp Leu
        195                 200                 205
Tyr Asn Glu Val Ala Thr Glu His Gly Tyr Asp Val Thr Lys Ile Asp
    210                 215                 220
His Cys Leu Ser Tyr Ile Thr Ser Val Asp His Asp Ser Asn Lys Ala
225                 230                 235                 240
Lys Asp Ile Cys Arg Asn Phe Leu Gly His Trp Tyr Asp Ser Tyr Val
                245                 250                 255
Asn Ala Thr Lys Ile Phe Asp Asp Ser Asp Gln Thr Lys Gly Tyr Asp
            260                 265                 270
Phe Asn Lys Gly Gln Trp Arg Asp Phe Val Leu Lys Gly His Lys Asp
        275                 280                 285
Thr Asn Arg Arg Ile Asp Tyr Ser Tyr Glu Ile Asn Pro Val Gly Thr
    290                 295                 300
Pro Glu Glu Cys Ile Ala Ile Ile Gln Gln Asp Ile Asp Ala Thr Gly
305                 310                 315                 320
Ile Asn Asn Ile Cys Cys Gly Phe Glu Ala Asn Gly Ser Glu Glu Glu
                325                 330                 335
Ile Ile Ala Ser Met Lys Leu Phe Gln Ser Asp Val Met Pro Tyr Leu
            340                 345                 350
Lys Glu Lys Gln Ser Gly Gly Gly Gly Ser Ser Gly Gly Gly Gly Gly
        355                 360                 365
Gly Ser Ser Met Lys Phe Gly Leu Phe Phe Leu Asn Phe Met Asn Ser
    370                 375                 380
Lys Arg Ser Ser Asp Gln Val Ile Glu Glu Met Leu Asp Thr Ala His
385                 390                 395                 400
Tyr Val Asp Gln Leu Lys Phe Asp Thr Leu Ala Val Tyr Glu Asn His
                405                 410                 415
Phe Ser Asn Asn Gly Val Val Gly Ala Pro Leu Thr Val Ala Gly Phe
            420                 425                 430
Leu Leu Gly Met Thr Lys Asn Ala Lys Val Ala Ser Leu Asn His Val
        435                 440                 445
Ile Thr Thr His His Pro Val Arg Val Ala Glu Glu Ala Cys Leu Leu
    450                 455                 460
Asp Gln Met Ser Glu Gly Arg Phe Val Phe Gly Phe Ser Asp Cys Glu
465                 470                 475                 480
Lys Ser Ala Asp Met Arg Phe Phe Asn Arg Pro Thr Asp Ser Gln Phe
                485                 490                 495
Gln Leu Phe Ser Glu Cys His Lys Ile Ile Asn Asp Ala Phe Thr Thr
            500                 505                 510
Gly Tyr Cys His Pro Asn Asn Asp Phe Tyr Ser Phe Pro Lys Ile Ser
        515                 520                 525
Val Asn Pro His Ala Tyr Thr Glu Gly Gly Pro Ala Gln Phe Val Asn
    530                 535                 540
Ala Thr Ser Lys Glu Val Val Glu Trp Ala Ala Lys Leu Gly Leu Pro
545                 550                 555                 560
Leu Val Phe Lys Trp Asp Asp Ser Asn Ala Gln Arg Lys Glu Tyr Ala
                565                 570                 575
Gly Leu Tyr His Glu Val Ala Gln Ala His Gly Val Asp Val Ser Gln
            580                 585                 590
Val Arg His Lys Leu Thr Leu Leu Val Asn Gln Asn Val Asp Gly Glu
        595                 600                 605
Ala Ala Arg Ala Glu Ala Arg Val Tyr Leu Glu Glu Phe Val Arg Glu
    610                 615                 620
Ser Tyr Pro Asn Thr Asp Phe Glu Gln Lys Met Val Glu Leu Leu Ser
625                 630                 635                 640
Glu Asn Ala Ile Gly Thr Tyr Glu Glu Ser Thr Gln Ala Ala Arg Val
                645                 650                 655
Ala Ile Glu Cys Cys Gly Ala Ala Asp Leu Leu Met Ser Phe Glu Ser
            660                 665                 670
Met Glu Asp Lys Ala His Glu Arg Ala Val Ile Asp Val Val Asn Ala
        675                 680                 685
Asn Ile Val Lys Tyr His Ser Glx Ser Arg
    690                 695
<210>47
<211>1893
<212>DNA
<213>人工序列
<220>
<223>单链抗体
<400>47
atggttgctc aagctgcttc atcagaatta acgcaatcac caggtacctt atcattatca      60
ccaggtgaac gtgctacctt atcatgtcgt gcttcacaat cagtttcatc agcttactta     120
gcttggtacc aacaaaaacc aggtcaagct ccacgtttat taatttacgg tgcttcatca     180
cgtgctactg gtattccaga tcgtttctca ggttcaggtt caggtacaga tttcacttta     240
accatttcac gtttagaacc agaagatttc gctgtttact actgtcaaca atacggtcgt     300
tcaccaactt tcggtggtgg taccaaagtt gaaattaaac gtacttcatc aggtggtggt     360
ggttcaggtg gtggtggtgg tggttcatca cgttcatcat tagaacaatc aggtgctgaa     420
gttaaaaaac caggttcatc agttaaagtt tcatgtaaag cttcaggtgg ttcattctca     480
tcatacgcta ttaactgggt tcgtcaagct caaggtcaag gtttagaatg gatgggtggt     540
ttaatgccaa ttttcggtac aacaaactac gctcaaaaat tccaagatcg tttaacgatt     600
accgctgatg tttcaacgtc aacagcttac atgcaattat caggtttaac atacgaagat     660
acggctatgt actactgtgc tcgtgttgct tacatgttag aaccaaccgt tactgctggt     720
ggtttagatg tttggggtaa aggtaccacg gttaccgttt caccagcttc accaacctca     780
ccaaaagttt tcccattatc attatgttca acccaaccag atggtaacgt tgttattgct     840
tgtttagttc aaggtttctt cccacaagaa ccattatcag ttacctggtc agaatcaggt     900
caaggtgtta ccgctcgtaa cttcccacca tcacaagatg cttcaggtga tttatacacc     960
acgtcatcac aattaacctt accagctaca caatgtttag ctggtaaatc agttacatgt    1020
cacgttaaac actacacgaa cccatcacaa gatgttactg ttccatgtcc agttccatca    1080
actccaccaa ccccatcacc atcaactcca ccaaccccat caccatcatg ttgtcaccca    1140
cgtttatcat tacaccgtcc agctttagaa gatttattat taggttcaga agctaactta    1200
acgtgtacat taaccggttt acgtgatgct tcaggtgtta ccttcacctg gacgccatca    1260
tcaggtaaat cagctgttca aggtccacca gaacgtgatt tatgtggttg ttactcagtt    1320
tcatcagttt taccaggttg tgctgaacca tggaaccacg gtaaaacctt cacttgtact    1380
gctgcttacc cagaatcaaa aaccccatta accgctacct tatcaaaatc aggtaacaca    1440
ttccgtccag aagttcactt attaccacca ccatcagaag aattagcttt aaacgaatta    1500
gttacgttaa cgtgtttagc tcgtggtttc tcaccaaaag atgttttagt tcgttggtta    1560
caaggttcac aagaattacc acgtgaaaaa tacttaactt gggcttcacg tcaagaacca    1620
tcacaaggta ccaccacctt cgctgttacc tcaattttac gtgttgctgc tgaagattgg    1680
aaaaaaggtg ataccttctc atgtatggtt ggtcacgaag ctttaccatt agctttcaca    1740
caaaaaacca ttgatcgttt agctggtaaa ccaacccacg ttaacgtttc agttgttatg    1800
gctgaagttg atggtacctg ttacgattat aaagatcacg atggtgatta caaagatcac    1860
gatattgatt ataaagatga tgatgataaa taa                                 1893
<210>48
<211>630
<212>PRT
<213>人工序列
<220>
<223>单链抗体
<400>48
Met Val Ala Gln Ala Ala Ser Ser Glu Leu Thr Gln Ser Pro Gly Thr
1               5                   10                  15
Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser
            20                  25                  30
Gln Ser Val Ser Ser Ala Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly
        35                  40                  45
Gln Ala Pro Arg Leu Leu Ile Tyr Gly Ala Ser Ser Arg Ala Thr Gly
    50                  55                  60
Ile Pro Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu
65                  70                  75                  80
Thr Ile Ser Arg Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln
                85                  90                  95
Gln Tyr Gly Arg Ser Pro Thr Phe Gly Gly Gly Thr Lys Val Glu Ile
            100                 105                 110
Lys Arg Thr Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Gly
        115                 120                 125
Ser Ser Arg Ser Ser Leu Glu Gln Ser Gly Ala Glu Val Lys Lys Pro
    130                 135                 140
Gly Ser Ser Val Lys Val Ser Cys Lys Ala Ser Gly Gly Ser Phe Ser
145                 150                 155                 160
Ser Tyr Ala Ile Asn Trp Val Arg Gln Ala Gln Gly Gln Gly Leu Glu
                165                 170                 175
Trp Met Gly Gly Leu Met Pro Ile Phe Gly Thr Thr Asn Tyr Ala Gln
            180                 185                 190
Lys Phe Gln Asp Arg Leu Thr Ile Thr Ala Asp Val Ser Thr Ser Thr
        195                 200                 205
Ala Tyr Met Gln Leu Ser Gly Leu Thr Tyr Glu Asp Thr Ala Met Tyr
    210                 215                 220
Tyr Cys Ala Arg Val Ala Tyr Met Leu Glu Pro Thr Val Thr Ala Gly
225                 230                 235                 240
Gly Leu Asp Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Pro Ala
                245                 250                 255
Ser Pro Thr Ser Pro Lys Val Phe Pro Leu Ser Leu Cys Ser Thr Gln
            260                 265                 270
Pro Asp Gly Asn Val Val Ile Ala Cys Leu Val Gln Gly Phe Phe Pro
        275                 280                 285
Gln Glu Pro Leu Ser Val Thr Trp Ser Glu Ser Gly Gln Gly Val Thr
    290                 295                 300
Ala Arg Asn Phe Pro Pro Ser Gln Asp Ala Ser Gly Asp Leu Tyr Thr
305                 310                 315                 320
Thr Ser Ser Gln Leu Thr Leu Pro Ala Thr Gln Cys Leu Ala Gly Lys
                325                 330                 335
Ser Val Thr Cys His Val Lys His Tyr Thr Asn Pro Ser Gln Asp Val
            340                 345                 350
Thr Val Pro Cys Pro Val Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser
        355                 360                 365
Thr Pro Pro Thr Pro Ser Pro Ser Cys Cys His Pro Arg Leu Ser Leu
    370                 375                 380
His Arg Pro Ala Leu Glu Asp Leu Leu Leu Gly Ser Glu Ala Asn Leu
385                 390                 395                 400
Thr Cys Thr Leu Thr Gly Leu Arg Asp Ala Ser Gly Val Thr Phe Thr
                405                 410                 415
Trp Thr Pro Ser Ser Gly Lys Ser Ala Val Gln Gly Pro Pro Glu Arg
            420                 425                 430
Asp Leu Cys Gly Cys Tyr Ser Val Ser Ser Val Leu Pro Gly Cys Ala
        435                 440                 445
Glu Pro Trp Asn His Gly Lys Thr Phe Thr Cys Thr Ala Ala Tyr Pro
    450                 455                 460
Glu Ser Lys Thr Pro Leu Thr Ala Thr Leu Ser Lys Ser Gly Asn Thr
465                 470                 475                 480
Phe Arg Pro Glu Val His Leu Leu Pro Pro Pro Ser Glu Glu Leu Ala
                485                 490                 495
Leu Asn Glu Leu Val Thr Leu Thr Cys Leu Ala Arg Gly Phe Ser Pro
            500                 505                 510
Lys Asp Val Leu Val Arg Trp Leu Gln Gly Ser Gln Glu Leu Pro Arg
        515                 520                 525
Glu Lys Tyr Leu Thr Trp Ala Ser Arg Gln Glu Pro Ser Gln Gly Thr
    530                 535                 540
Thr Thr Phe Ala Val Thr Ser Ile Leu Arg Val Ala Ala Glu Asp Trp
545                 550                 555                 560
Lys Lys Gly Asp Thr Phe Ser Cys Met Val Gly His Glu Ala Leu Pro
                565                 570                 575
Leu Ala Phe Thr Gln Lys Thr Ile Asp Arg Leu Ala Gly Lys Pro Thr
            580                 585                 590
His Val Asn Val Ser Val Val Met Ala Glu Val Asp Gly Thr Cys Tyr
        595                 600                 605
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
    610                 615                 620
Lys Asp Asp Asp Asp Lys
625                 630

标题	发布/更新时间	阅读量
神经退行性疾病病理的光遗传学诱导	2020-05-15	465
一种快速检测长穗偃麦草高产基因的分子标记及应用	2020-05-25	847
用于靶细胞中的动作电位的光遗传学调节的装置、系统和方法	2020-05-19	462
相机组合件及用于安装相机组合件的系统	2020-05-22	247
一种改良的荧光原位杂交方法及其应用	2020-05-21	503
多通道光遗传学刺激和抑制	2020-05-13	960
光遗传学调控的动物行为学测试平台	2020-05-13	688
三级神经环路操纵组合物及动物三级神经环路操纵方法	2020-05-21	254
基于遗传学算法改进的RBF-BP神经网络的光伏发电输出功率追踪算法	2020-05-20	573
一种利用TRPV1启动子及光遗传学手段特异性抑制疼痛生成与传递的方法	2020-05-20	83

多肽在叶绿体中的表达以及用于表达多肽的组合物和方法

技术领域

背景技术

该功能需要专业版企业版VIP权限，您可以：