具有独特特异性的多个重组位点在重组克隆中的用途

申请号 CN00818077.6 申请日 2000-12-11 公开(公告)号 CN1468317A 公开(公告)日 2004-01-14
申请人 茵维特罗根公司; 发明人 D·柴奥; M·A·布拉什; G·F·坦普尔; J·L·哈特雷; D·R·N·比尔德;
摘要 本 发明 提供用于重组克隆的组合物和方法。该组合物包括含有具有独特特异性的多个重组位点的载体。该方法允许同时克隆两个或多个不同的核酸分子。在一些实施方案中,将这些分子融合在一起,而在其它实施方案中,将这些分子插入载体的不同位点。一般地,本发明还提供通过重组将许多可以相同或不同的分子和/或化合物(如化学化合物、药物、 蛋白质 或肽、脂、核酸、糖等)连接或接合起来的方法。根据本发明,这些分子和/或化合物或这些分子和/或化合物的组合还可以通过重组与多种结构或支持物结合。
权利要求

1.制备杂合核酸分子群的方法,包括:
(a)将至少第一群包含一或多个重组位点的核酸分子和至少一个 包含一或多个重组位点的靶核酸分子混合;和
(b)使该至少第一群的所有或一些核酸分子与所有或一些靶核酸 分子重组,由此形成杂合核酸分子群。
2.权利要求1的方法,其中通过将第一群核酸分子和靶核酸分子 与一或多个重组蛋白在利于重组的条件下混合,造成重组。
3.权利要求2的方法,其中重组蛋白包含一或多个选自下组的蛋 白质:
(a)Cre;
(b)Int;
(c)IHF;
(d)Xis;
(e)Fis;
(f)Hin;
(g)Gin;
(h)Cin;
(i)Tn3解离酶;
(j)TndX;
(k)XerC;和
(l)XerD。
4.权利要求1的方法,还包含将第一群核酸分子和靶核酸分子与 至少第二群包含一或多个重组位点的核酸分子混合。
5.权利要求1的方法,其中重组位点包含选自下组的一或多个重 组位点:
(a)lox位点;
(b)psi位点;
(c)dif位点;
(d)cer位点;
(e)frt位点;
(f)att位点;和
(g)(a)、(b)、(c)、(d)、(e)或(f)重组位点保留进行重组的能 的突变体、变体、和衍生物
6、权利要求1的方法,还包含选出杂合核酸分子群。
7.权利要求1的方法,还包含选出杂合核酸分子群并选择除去第 一群核酸分子和除去靶核酸分子。
8.权利要求7的方法,还包含选择除去共合体分子和副产物分子。
9.包含通过权利要求1的方法制备的杂合核酸分子群的组合物。
10.包含通过权利要求1的方法制备的杂合核酸分子群的重组宿 主细胞群。
11.制备重组宿主细胞群的方法,包括将通过权利要求1的方法 制备的杂合核酸分子群导入宿主细胞。
12.制备杂合核酸分子群的方法,包括:
(a)将至少第一群包含一或多个重组位点的核酸分子和至少第二 群包含一或多个重组位点的核酸分子混合;和
(b)使该至少第一群的一些或全部核酸分子与该至少第二群的全 部或一些核酸分子重组,由此形成杂合核酸分子群。
13.权利要求12的方法,其中通过将第一群核酸分子和第二群核 酸分子与一或多个重组蛋白在利于重组的条件下混合,造成该重组。
14.在核酸分子间实施同源重组的方法,包括:
(a)将至少第一包含一或多个重组位点的核酸分子和至少一个靶 核酸分子混合,其中该第一核酸分子和靶核酸分子具有一或多个同源 序列;和
(b)使该第一核酸分子和靶核酸分子通过同源重组进行重组。
15.权利要求14的方法,其中同源重组导致将第一核酸分子的全 部或部分转移至靶核酸分子中。
16.权利要求14的方法,其中该第一核酸分子包含两个或多个与 靶核酸分子序列同源的序列。
17.对靶基因或核苷酸序列进行打靶或突变的方法,包括:
(a)获得至少一个包含一或多个重组位点和一或多个选择标记的 第一核酸分子,其中该第一核酸分子包含一或多个与靶基因或核苷酸 序列同源的核苷酸序列;和
(b)在足以造成靶基因或核苷酸序列和第一核酸分子之间在一或 多个位点发生同源重组的条件下,使第一核酸分子和一或多个靶基因 或核苷酸序列接触,籍此造成第一核酸分子的全部或部分插入靶基因 或核苷酸序列中。
18.权利要求17的方法,其中靶基因或核苷酸序列被失活。
19.权利要求17的方法,还包括选出含有靶基因或核苷酸序列的 宿主细胞。
20.通过权利要求19的方法制备的重组宿主细胞。
21.克隆核酸分子的方法,包括:
(a)提供侧翼有第1和第2重组位点的第1核酸区段;
(b)提供侧翼有第3和第4重组位点的第2核酸区段,其中该第 1或第2重组位点能够和第3或第4重组位点重组;
(c)进行重组反应以致这两个核酸区段重组为单一的核酸分子; 和
(d)克隆该单一核酸分子。
22.克隆核酸分子的方法,包括:
(a)提供侧翼有第1和第2重组位点的第1核酸区段和侧翼有第 3和第4重组位点的第2核酸区段,其中位于第1和第2核酸区段侧 翼的所有重组位点均不能够和位于该第1和第2核酸区段侧翼的任何 其它位点重组;
(b)提供包含第5、6、7和8重组位点的载体,其中该第5、6、 7和8重组位点的每一个都能够与该第1、2、3或4重组位点中的一 个重组;和
(c)进行重组反应,以便这两个核酸区段重组进入该载体中,由 此克隆该第1和第2核酸区段。
23.克隆n个核酸区段的方法,其中n是大于1的整数,该方法 包括:
(a)提供n个核酸区段,每个区段的侧翼有两个不相互重组的重 组位点;
(b)提供包含2n个重组位点的载体,其中该2n个重组位点的每 一个均能够与位于一个核酸区段侧翼的重组位点之一重组;和
(c)进行重组反应,以便该n个核酸区段重组进入该载体中,由 此克隆该n个核酸区段。
24.权利要求23的方法,其中n个核酸区段和载体之间的重组反 应在存在一或多个重组蛋白时在利于该重组的条件下进行。
25.权利要求24的方法,其中重组蛋白包含一或多个选自下组的 蛋白质
(a)Cre;
(b)Int;
(c)IHF;
(d)Xis;
(e)Fis;
(f)Hin;
(g)Gin;
(h)Cin;
(i)Tn3解离酶;
(j)TndX;
(k)XerC;和
(l)XerD。
26.权利要求23的方法,其中核酸区段和载体的重组位点包含一 或多个选自下组的重组位点:
(a)lox位点;
(b)psi位点;
(c)dif位点;
(d)cer位点;
(e)frt位点;
(f)att位点;和
(g)(a)、(b)、(c)、(d)、(e)或(f)重组位点的保留进行重组的 能力的突变体、变体、和衍生物。
27.权利要求23的方法,其中n是2、3、4或5。
28.权利要求23的方法,其中这些核酸区段的至少一个与能够调 节转录的序列可操作地连接。
29.权利要求28的方法,其中能够调节转录的序列选自:
(a)启动子;
(b)增强子;和
(c)阻遏基因。
30.权利要求29的方法,其中启动子是诱导型启动子或组成型启 动子。
31.权利要求23的方法,其中从该克隆的核酸区段产生的RNA的 翻译导致产生融合蛋白。
32.权利要求23的方法,其中这些核酸区段的至少一个编码可读 框的全部或部分,而且这些核酸区段的至少一个含有能够调节转录的 序列。
33.权利要求23的方法,其中这些核酸区段的至少一个在转录后 产生有义RNA链,而且这些核酸区段的至少一个在转录后产生反义 RNA。
34.权利要求33的方法,其中有义RNA和反义RNA具有至少一个 互补区并能够彼此杂交。
35.权利要求23的方法,其中至少两个核酸区段的转录导致产生 单个RNA。
36.权利要求35的方法,其中至少一个核酸区段在转录后产生有 义RNA链,而且至少一个核酸区段在转录后产生反义RNA链。
37.权利要求36的方法,其中有义RNA和反义RNA具有至少一个 互补区并能够彼此杂交。
38.权利要求23的方法,其中这些核酸区段包含一或多个文库的 核酸分子。
39.权利要求38的方法,其中一或多个文库包含cDNA或基因组 DNA。
40.权利要求38的方法,其中一或多个文库包含编码抗体分子可 变区的核酸分子。
41.权利要求40的方法,其中一或多个文库包含编码抗体轻链和 重链可变区的核酸分子。
42.权利要求23的方法,还包括筛选以鉴定编码具有针对一或多 种抗原的结合特异性的蛋白质的核酸分子。
43.权利要求23的方法,还包括筛选以鉴定编码具有一或多种活 性的蛋白质的核酸分子。
44.权利要求43的方法,其中活性包含一或多个选自下组的活性:
(a)从细胞中分泌;
(b)亚细胞定位
(c)配体结合活性;和
(d)酶活性。
45.权利要求44的方法,其中蛋白质位于内质网、细胞核、线粒 体、叶绿体、或细胞膜。
46.权利要求44的方法,其中该蛋白质与选自下组的配体结合;
(a)核酸;
(b)细胞表面受体;
(c)可溶性蛋白质;和
(d)金属离子
47.克隆至少一个核酸分子的方法,包括:
(a)提供第1、第2和第3核酸区段,其中该第1核酸区段侧翼 有第1和第2重组位点,第2核酸区段的侧翼有第3和第4重组位点, 而第3核酸区段的侧翼有第5和第6重组位点,其中该第2重组位点 能够和第3重组位点重组,而该第1、4、5或6重组位点均不能够和 该第1至第6重组位点中的任一个重组;
(b)提供包含位于第1负选择标记侧翼的第7和第8重组位点并 包含位于第2负选择标记侧翼的第9和第10重组位点的载体,其中该 第7至第10重组位点均不能与该第7至第10重组位点中的任一个重 组;
(c)进行第1重组反应,使得该第2和第3重组位点重组;和
(d)进行第2重组反应,使得该第1和第4重组位点与第7和第 8重组位点重组,而第5和第6重组位点与第9和第10重组位点重组, 由此克隆该第1、2和3核酸区段。
48.克隆至少一个核酸分子的方法,包括:
(a)提供第1、2和3核酸区段,其中该第1核酸区段的侧翼有第 1和第2重组位点、第2核酸区段的侧翼有第3和第4重组位点,而 第3核酸区段的侧翼有第5和第6重组位点,其中该第2重组位点能 够和第3重组位点重组,而第4重组位点能够和第5重组位点重组;
(b)提供包含第7和第8重组位点的载体;和
(c)进行至少一个重组反应,使得该第2和第3重组位点重组, 而第4和第5重组位点重组,第1和第6重组位点分别与第7和第8 重组位点重组,由此克隆该第1、2和3核酸区段。
49.权利要求48的方法,其中该重组反应在存在一或多个重组蛋 白时在利于该重组的条件下进行。
50.克隆n个核酸片段的方法,其中n是大于2的整数,包括:
(a)提供第1至第n核酸区段,每个区段的侧翼有两个重组位点, 其中对这些重组位点进行选择以致位于第i区段ni侧翼的两个重组位 点之一与位于第ni-1区段侧翼的重组位点之一反应,而位于第i区段 侧翼的另一重组位点和位于第ni+1核酸区段侧翼的重组位点之一反应;
(b)提供含有至少两个重组位点的载体,其中载体上的两个重组 位点之一可与第1核酸区段上的位点之一反应,载体上的另一个位点 可与第n核酸区段上的重组位点反应;和
(c)进行至少一个重组反应使得所有的核酸片段都重组进入载体 中。
51.权利要求50的方法,其中重组反应在存在一或多个重组蛋白 时在有利于重组的条件下进行。
52.权利要求51的方法,其中重组蛋白包含选自下组的一或多个 蛋白质:
(a)Cre;
(b)Int;
(c)IHF;
(d)Xis;
(e)Fis;
(f)Hin;
(g)Gin;
(h)Cin;
(i)Tn3解离酶;
(j)TndX;
(k)XerC;和
(l)XerD。
53.权利要求50的方法,其中核酸区段和载体的重组位点包含一 或多个选自下组的重组位点:
(a)lox位点;
(b)psi位点;
(c)dif位点;
(d)cer位点;
(e)frt位点;
(f)att位点;和
(g)(a)、(b)、(c)、(d)、(e)或(f)重组位点的保留进行重组的 能力的突变体、变体、和衍生物。
54.权利要求53的方法,其中彼此重组的重组位点包含具有相同 7基对重叠区的att位点。
55.通过权利要求47的方法制备的核酸分子。
56.克隆至少一个核酸分子的方法,包括:
(a)提供第一群核酸分子,其中这些分子的全部或部分的侧翼有 第1和第2重组位点;
(b)提供至少一个侧翼有第3和第4重组位点的核酸区段,其中 该第1或第2重组位点能够与第3或第4重组位点重组;
(c)进行重组反应以致在该群体中所有或部分核酸分子与该区段 重组,形成第2群核酸分子;和
(d)克隆第2群核酸分子。
57.权利要求56的方法,其中第2群核酸分子编码融合蛋白。
58.权利要求56的方法,其中该核酸区段编码选自下组的多肽:
(a)免疫球蛋白的Fc部分;
(b)β-葡糖酸糖苷酶;
(c)荧光蛋白;
(d)纯化标签;
(e)和表位标签。
59.权利要求58的方法,其中该核酸区段编码选自下组的荧光蛋 白:
(a)绿色荧光蛋白;
(b)黄色荧光蛋白;
(c)红色荧光蛋白;和
(d)蓝色荧光蛋白。
60.权利要求58的方法,其中该核酸区段编码选自下组的纯化标 签:
(a)表位标签;
(b)麦芽糖结合蛋白;
(c)6组酸标签;和
(d)谷胱苷肽S转移酶。
61.通过权利要求56的方法制备的核酸分子。
62.克隆至少一个核酸分子的方法,包括:
(a)提供第一群核酸分子,其中这些分子中的所有或部分分子的 侧翼有至少第1和第2重组位点;
(b)提供第二群核酸分子,其中这些分子中的所有或部分分子的 侧翼有第3和第4重组位点,其中该第1或第2重组位点能够与第3 或第4重组位点重组;
(c)进行重组反应,使得第一群中的所有或部分分子与第二群的 一或多个分子重组,形成第三群核酸分子;和
(d)克隆该第三群核酸分子。
63.权利要求62的方法,其中该重组反应在存在一或多个重组蛋 白时在利于该重组的条件进行。
64.接合两个核酸区段的方法,包括:
(a)提供两个核酸区段,每个区段包含至少一个能够与另一区段 上存在的重组位点重组的重组位点;和
(b)在导致重组位点之间重组的条件下将这些区段和一或多个重 组蛋白接触,由此接合这些区段。
65.权利要求64的方法,还包括将该接合起来的核酸区段插入载 体中。
66.权利要求65的方法,其中这两个核酸区段中的一个是文库的 核酸分子。
67.权利要求65的方法,其中这两个核酸区段中的一个编码具有 一或多个可鉴定活性的表达产物。
68.权利要求64的方法,其中该表达产物是选择标记或酶。
69.权利要求64的方法,其中该表达产物是核酶。
70.权利要求64的方法,其中该两个核酸区段的一个含有全部或 部分可读框。
71.权利要求64的方法,其中这两个核酸区段的一个含有能够调 节转录的序列。
72.权利要求71的方法,其中能够调节转录的序列选自:
(a)启动子;
(b)增强子;和
(c)阻遏基因。
73.权利要求72的方法,其中启动子是诱导型启动子或组成型启 动子。
74.包含通过权利要求64的方法制备的接合起来的核酸区段的组 合物。
75.包含通过权利要求64的方法制备的接合起来的核酸区段的重 组宿主细胞群。
76.制备重组宿主细胞群的方法,包括将通过权利要求64的方法 制备的接合起来的核酸区段导入宿主细胞中。
77.使n个核酸区段相接合的方法,其中n是大于2的整数,该 方法包括:
(a)提供第1至第n核酸区段,每个区段的侧翼有两个重组位点, 其中这些重组位点经选择,以致位于第i区段ni侧翼的两个重组位点 之一与位于第ni-1区段侧翼的重组位点之一反应,而位于第i核酸区 段侧翼的另一重组位点与位于第ni+1区段侧翼的重组位点之一反应; 和
(b)在造成这些区段相接合的条件下使这些区段和一或多个重组 蛋白接触。
78.权利要求77的方法,其中该重组蛋白包含一或多个选自下组 的蛋白质:
(a)Cre;
(b)Int;
(c)IHF;
(d)Xis;
(e)Fis;
(f)Hin;
(g)Gin;
(h)Cin;
(i)Tn3解离酶;
(j)TndX;
(k)XerC;和
(l)XerD。
79.权利要求77的方法,其中彼此重组的重组位点包含具有相同 7碱基对重叠区的att位点。
80.权利要求79的方法,其中彼此重组的重组位点的7碱基对重 叠区头3个核苷酸包含选自下组的核苷酸序列:
(a)AAA;
(b)AAC;
(c)AAG;
(d)AAT;
(e)ACA;
(f)ACC;
(g)ACG;
(h)ACT;
(i)AGA;
(j)AGC;
(k)AGG;
(l)AGT;
(m)ATA;
(n)ATC;
(o)ATG;
(p)ATT。
81.权利要求79的方法,其中彼此重组的重组位点的7碱基对重 叠区头3个核苷酸包含选自下组的核苷酸序列:
(a)CAA;
(b)CAC;
(c)CAG;
(d)CAT;
(e)CCA;
(f)CCC;
(g)CCG;
(h)CCT;
(i)CGA;
(j)CGC;
(k)CGG;
(l)CGT;
(m)CTA;
(n)CTC;
(o)CTG;和
(p)CTT。
82.权利要求79的方法,其中彼此重组的重组位点的7碱基对重 叠区头3个核苷酸包含选自下组的核苷酸序列:
(a)GAA;
(b)GAC;
(c)GAG;
(d)GAT;
(e)GCA;
(f)GCC;
(g)GCG;
(h)GCT;
(i)GGA;
(j)GGC;
(k)GGG;
(l)GGT;
(m)GTA;
(n)GTC;
(o)GTG;和
(p)GTT。
83.权利要求79的方法,其中彼此重组的重组位点的7碱基对重 叠区头3个核苷酸包含选自下组的核苷酸序列:
(a)TAA;
(b)TAC;
(c)TAG;
(d)TAT;
(e)TCA;
(f)TCC;
(g)TCG;
(h)TCT;
(i)TGA;
(j)TGC;
(k)TGG;
(l)TGT;
(m)TTA;
(n)TTC;
(o)TTG;和
(p)TTT。
84.权利要求77的方法,还包括将步骤(b)中接合起来的核酸区 段插入载体中。
85.权利要求77的方法,其中该接合起来的核酸区段经历分子内 重组形成环状分子。
86.权利要求85的方法,其中经历重组以形成环状分子的重组位 点位于这些核酸区段的一或多个的5’和3’端。
87.权利要求77的方法,其中这些核酸区段中的一或多个编码选 择标记。
88.权利要求77的方法,其中这些核酸区段中的一或多个含有复 制起点。
89.权利要求77的方法,其中一些或全部核酸区段包含一或多个 文库的核酸分子。
90.权利要求77的方法,其中该一或多个文库包含编码抗体分子 可变区的多核苷酸。
91.权利要求90的方法,其中这些核酸区段的至少一个编码连接 抗体分子可变区的多肽接头。
92.权利要求91的方法,其中该一或多个文库包含编码抗体轻链 和重链可变区的多核苷酸。
93.权利要求77的方法,还包括筛选以鉴定编码具有一或多个可 鉴定活性的蛋白质的核酸分子。
94.权利要求93的方法,其中该一或多个可鉴定活性包含对一或 多种抗原的结合特异性。
95.权利要求93的方法,其中该一或多个可鉴定活性包含酶活性。
96.权利要求93的方法,其中该一或多个可鉴定活性包含与选择 标记相关的活性。
97.权利要求77的方法,其中这些核酸区段的至少两个编码参与 相同生物化学途径或生物学过程的表达产物。
98.权利要求97的方法,其中所述核酸区段编码多聚体酶复合物 的至少两个不同亚基。
99.权利要求77的方法,其中这些核酸区段编码参与相同生物化 学途径中的反应的至少两个不同酶。
100.权利要求77的方法,其中该生物化学途径导致产生抗生素 或糖。
101.包含通过权利要求77的方法接合起来的核酸区段的组合物。
102.包含通过权利要求77的方法接合起来的核酸区段的重组宿 主细胞群。
103.制备重组宿主细胞群的方法,包括将通过权利要求77的方 法接合起来的核酸区段导入宿主细胞中。
104.改变细胞性质的方法,包括将通过权利要求77的方法接合 起来的核酸区段导入该细胞中。
105.权利要求99的方法,其中该生物化学途径导致蛋白质的翻 译后修饰。
106.权利要求105的方法,其中该翻译后修饰是糖基化或唾液酸 化。
107.权利要求106的方法,其中该细胞是细菌细胞。
108.合成蛋白质的方法,包括:
(a)提供包含编码序列及随后的终止密码子的核酸分子,其中该 核酸分子的侧翼有至少一个重组位点;
(b)提供包含至少一个重组位点和编码序列的载体;
(c)进行重组,使得核酸分子被插入载体中,产生具有两个按读 框相连的编码序列的修饰载体;
(d)用该修饰载体转化表达抑制型tRNA的宿主细胞;和
(e)使这两个编码序列表达,以致产生由这两个编码序列的至少 一部分编码的融合蛋白,
其中该核酸分子或载体包含至少一个可抑制的终止密码子。
109.根据权利要求108的方法,其中该终止密码子选自琥珀、乳 白和赭石密码子。
110.根据权利要求108的方法,其中该载体包含编码至少一个抑 制型tRNA分子的基因。
111.根据权利要求108的方法,其中宿主细胞的染色体包含编码 至少一个抑制型tRNA分子的基因。
112.根据权利要求108的方法,还包括步骤:用包含编码至少一 个抑制型tRNA分子的核酸分子转化宿主细胞。
113.根据权利要求108的方法,其中该融合蛋白包含由载体的至 少一部分编码的N-或C-端标签。
114.根据权利要求113的方法,其中该标签选自:
(a)谷胱苷肽S转移酶;
(b)β-葡糖醛酸糖苷酶;
(c)绿色荧光蛋白;
(d)黄色荧光蛋白;
(e)红色荧光蛋白;
(f)蓝色荧光蛋白;
(g)麦芽糖结合蛋白;
(h)6组氨酸标签;和
(i)表位标签。
115.确定细胞或组织的基因表达谱的方法,包括:
(a)从获自该细胞或组织的RNA产生至少一群cDNA分子,其中该 群体的单个cDNA分子包含至少两个能够与相同或不同cDNA分子群单 个成员上存在的至少一个重组位点重组的重组位点;
(b)在造成这些核酸分子相接合的条件下,使(a)的核酸分子和一 或多个重组蛋白接触;和
(c)确定该接合起来的核酸分子的序列。
116.权利要求115的方法,其中将该接合起来的cDNA分子插入 在插入位点侧翼含有测序引物结合位点的载体中。
117.权利要求115的方法,其中该接合起来的cDNA分子被attB 重组位点分隔开。
118.权利要求117的方法,其中彼此重组的attB重组位点具有 一致的7碱基对重叠区。
119.权利要求115的方法,其中该接合起来的cDNA分子含有约 10至约30个与获自该细胞或组织的RNA相应的核苷酸。
120.制备和鉴定核酸分子的方法,其中该核酸分子含有两个或多 个编码参与相同生物学过程或生物学途径的基因产物的核酸区段,该 方法包括:
(a)提供第一群核酸分子,该核酸分子包含至少一个能够和第一 群体中其它核酸分子重组的重组位点;和
(b)使第一群核酸分子与一或多个重组蛋白在造成这些核酸分子 重组并产生第二群核酸分子的条件下接触;和
(c)筛选该第二群核酸分子以鉴定编码两个或更多参与相同过程 或途径的产物的核酸分子。
121.权利要求120的方法,其中编码参与相同过程或途径的两个 或更多个产物的核酸分子编码蛋白质或蛋白质复合物的两个不同域。
122.权利要求121的方法,其中该蛋白质是单链抗原结合蛋白。
123.权利要求122的方法,其中该蛋白复合物包含抗体分子或含 有至少两个单链抗原结合蛋白的多价抗原结合蛋白。
124.通过权利要求120的方法制备的核酸分子。
125.包含至少一个第一核酸分子的支持物,其中该第一核酸分子 包含一或多个重组位点或其部分。
126.权利要求125的支持物,还包含通过第一核酸分子上的重组 位点与支持物结合的至少一个第二核酸分子或至少一个肽或蛋白质分 子。
127.包含权利要求125的支持物和至少一个具有至少一个重组位 点或其部分的第二核酸分子或蛋白质或肽分子。
128.使一或多个核酸分子、蛋白质或肽分子、或其它化合物与支 持物附着或结合的方法,包括:
(a)获得至少一个包含至少一个重组位点的核酸分子、蛋白质或 肽分子、其它化合物、或这些分子或化合物的群体,并获得包含至少 一个重组位点的支持物;和
(b)使该至少一个核酸分子、蛋白质或肽分子、其它化合物、或 这些分子或化合物的群体上的一些或全部重组位点与支持物所包含的 全部或部分重组位点重组。
129.权利要求128的方法,其中彼此重组的重组位点包含具有一 致的7碱基对重叠区的att位点。
130.权利要求128的方法,包括将一或多个核酸分子与支持物附 着或结合。
131.权利要求128的方法,其中仅一个核酸分子直接地与支持物 连接。
132.权利要求131的方法,其中这些核酸分子形成微阵列。
133.权利要求132的方法,其中该微阵列形成DNA芯片。
134.通过权利要求128的方法制备的支持物。
135.权利要求134的支持物,其是固体的或半固体的。
136.使两个或多个目的分子或化合物连接或结合的方法,包括:
(a)提供至少第一和第二目的分子或化合物,第一和第二目的分 子或化合物每一个都包含至少一个重组位点;和
(b)使第一目的分子或化合物上的一些或全部重组位点与第二目 的分子或化合物上的一些或全部重组位点重组。
137.权利要求136的方法,还包括使包含重组位点的核酸与该第 一和第二目的分子或化合物附着。
138.权利要求136的方法,其中至少一个目的分子或化合物是选 自下组的分子或化合物:
(a)糖;
(b)类固醇;和
(c)脂质。
139.用于对核酸区段进行接合、缺失或置换的试剂盒,该试剂盒 包含(1)一或多个重组蛋白或包含一或多个重组蛋白的组合物,(2)至 少一个包含具有至少两种不同的重组特异性的一或多个重组位点的核 酸分子;和(3)选自下组的一或多个成分:
(a)包含额外重组位点的核酸分子;
(b)具有连接酶活性的一或多个酶;
(c)具有聚合酶活性的一或多个酶;
(d)具有逆转录酶活性的一或多个酶;
(e)具有限制性内切酶活性的一或多个酶;
(f)一或多个引物;
(g)一或多个核酸文库;
(h)一或多个支持物;
(i)一或多个缓冲液;
(j)一或多个去污剂或含有去污剂的溶液;
(k)一或多个核苷酸;
(l)一或多个终止剂;
(m)一或多个转染试剂;
(n)一或多个宿主细胞;和
(o)使用试剂盒成分的说明书
140.权利要求139的试剂盒,其中所述重组位点具有至少3个不 同的重组特异性,每一个都包含具有不同7碱基对重叠区的att位点。
141.权利要求139的试剂盒,其中包含一或多个重组蛋白的组合 物能够催化att位点间的重组。
142.权利要求139的试剂盒,其中包含一或多个重组蛋白的组合 物能够催化BP反应、LR反应、或BP及LR反应。

说明书全文

发明领域

本发明涉及生物技术和分子生物学领域。具体地,本发明涉及优 选通过使用具有独特特异性的重组位点,将多个含有重组位点的核酸 分子接合起来。本发明还涉及使用重组克隆方法克隆这些接合的核酸 分子。本发明还涉及通过使用重组位点将多个肽、和肽与核酸分子的 组合接合在一起。根据本发明,其它分子和化合物或分子和化合物的 组合也可以通过重组位点结合在一起。根据本发明,这些肽、核酸和 其它分子和/或化合物(或其组合)还可以通过重组与一或多个支持物 或结构接合或结合。

相关领域

位点特异性重组酶

位点特异性重组酶是许多生物(例如病毒和细菌)中存在的蛋白 质,其特征在于具有内切核酸酶和连接酶性质。这些重组酶(在某些情 况下与相关的蛋白质一起)识别核酸分子中的基特异序列并使位于 那些序列侧翼的核酸区段发生交换。重组酶和相关蛋白质共同被称作 “重组蛋白质”(见例如,Landy,A.,Current Opinion in Biotechnology 3:699-707(1993))。

不同生物的许多重组系统已有描述。见例如,Hoess等,Nucleic Acids Research 14(6):2287(1986);Abremski等,J.Biol.Chem. 261(1):391(1986);Campbell,J.Bacteriol.174(23):7495(1992); Qian等,J.Biol.Chem.267(11):7794(1992);Araki等,J.Mol. Biol.225(1):25(1992);Maeser和Kahnmann,Mol.Gen.Genet. 230:170-176(1991):Esposito等,Nucl.Acids Res.25(18):3605 (1997)。这些中的许多属于重组酶的整合酶家族(Argos等,EMBO J. 5:433-440(1986);Vaziyanov等,Nucl.Acids Res.27:930 (1990))。其中研究得最好的可能是λ噬菌体的整合酶/att系统(Landy, A.Current Opinions in Genetics and Devel.3:699-707(1993))、 P1噬菌体的Cre/loxP系统(Hoess和Abremski(1990),Nucleic Acids and Molecular Biology,第4卷,编:Eckstein和Lilley, Berlin-Heidelberg:Speringer-Verlag;第90-109页)、和酿酒酵 母(Saccaromyces cerevisiae)2μ环状质粒的FLP/FRT系统(Broach 等,Cell 29:227-234(1982))。

转座子

转座子是可动遗传因子。转座子在结构上是可变的,被描述为简 单型或复合型,但典型地编码一个转座催化酶,术语称作转座酶,两 侧为反向组织的DNA序列。对于转座子特性的更为完全的讨论,可以 参考Mobile Genetic Elements,D.J.Sherratt编,Oxford University出版(1995)和Mobile DNA,D.E.Berg和M.M.Howe编, American Soceity fot Microbiology(1989),Washington,DC,两 本书均特此并入本文作为参考。

转座子已被用于将DNA插入靶DNA序列中。作为一般原则,转座 子在靶DNA中的插入是随机事件。该原则的一个例外是转座子Tn7的 插入。作为生命周期的一个部分,转座子Tn7可以将自身整合到大肠 杆菌(E.coli)基因组的特异位点中(Stellwagen,A.E.和Craig,N.L. Trends in Biochemical Sciences 23,486-490,1998,特此并入本 文作为参考)。该位点特异性插入已被用于体内操作杆状病毒的基因组 (Lucklow等,J.Virol.67:4566-4579(1993),特此并入本文作为 参考)。对于其特点为向受体DNA分子中的随机位置移动的可转座元件 而言,Tn7的位点特异性是非典型的。为了本申请的目的,除非另行 指出,转座将用于指随机或半随机的移动,而重组将用于指位点特异 性重组事件。因此,Tn7在attTn7位点中的位点特异性插入将被称作 重组事件,而Tn7的随机插入将被称作转座事件。

York等(Nucleic Acids Research,26(8):1927-1933,(1998)) 公开了基于使用Tn5在质粒分子内的转座事件制备嵌套缺失的体外方 法。在存在纯化的转座酶蛋白质的情况下,体外孵育含有侧翼有两个 19碱基对的Tn5转座酶识别序列的卡那霉素抗性基因及靶DNA序列的 载体。在使用低DNA浓度的条件下,有利于分子内转座反应发生,该 反应被成功用于在靶DNA中制备一套嵌套缺失。这些作者提出,通过 将终止信号包括在识别序列相邻的所有三种阅读框中,该系统可以用 于在靶DNA编码的蛋白质中产生C端截短。此外,这些作者提出,将 His标签和激酶区域包含在内可以用于制备N端缺失蛋白质以便作进 一步分析。

Devine等(Nucleic Acids Research,22:3765-3772(1994)和美 国专利5,677,170和5,843,772,所有均特此并入本文作为参考)公开 了用于体外将DNA区段插入受体DNA分子中的人工转座子的构建。该 系统利用酵母YT1病毒样颗粒的插入催化酶作为转座酶活性的来源。 使用标准方法,将目的DNA区段克隆在转座子样元件TY1两末端之间。 当存在TY1插入催化酶时,所获元件将随机整合至第二靶DNA分子中。

另一类可动遗传因子是整合子。整合子一般由位于一个可变序列 侧翼的5’和3’保守序列组成。典型地,该5’保守序列含有整合酶蛋白 质的编码信息。该整合酶蛋白质可以催化在多种重组位点(包括attI、 attC)以及其它类型的位点处发生位点特异性重组(见Francia等,J. Bacteriology 181(2):6844-6849,1999,和其中的引用文献)。

重组位点

无论以上讨论的反应被称作重组、转座或整合以及它们是由重组 酶或整合酶催化的,它们均具有一个关键特征,即核酸分子上参与这 些反应的常被称作“重组位点”的特异识别序列。这些重组位点是参 加反应的核酸分子上被重组蛋白质在整合或重组的初期识别和结合的 核酸部分或区段。例如,Cre重组酶的重组位点是34个碱基对序列的 loxP,该序列由位于8碱基对核心序列侧翼的两个13碱基对反向重复 (充当重组酶结合位点)组成。见Sauer,B.,Curr.Opin.Biotech. 5:521-527(1994)的图1。识别序列的其它例子包括重组蛋白λInt 所识别的attB、attP、attL、和attR序列。attB为含有两个9碱基 对核心型Int结合位点和一个7碱基对重叠区的约25碱基对序列,而 attP为含有核心型Int结合位点和臂型Int结合位点以及辅助蛋白质 整合宿主因子(IHF)、FIS和外切酶(Xis)的位点的约240个碱基对序 列。见Landy,Curr.Opin.Biotech.3:699-707(1993)。

终止密码子和抑制型tRNA

真核和原核生物均使用三种密码子作为基因终止的信号。当转录 为mRNA后,这些密码子具有以下序列:UAG(琥珀)、UGA(乳白)和UAA(赭 石)。在大多数情况下,细胞不含有识别这些密码子的任何tRNA分子。 因此,当翻译mRNA的核糖体到达这些密码子之一时,核糖体停止并从 该RNA上落下,终止该mRNA的翻译。核糖体自mRNA上的释放是由特 异因子介导的(见S.Mottagui-Tabar,NAR 26(11),2789,1998)。 具有一个符合读框的终止密码子(TAA,TAG或TGA)的基因通常将编码 具有天然羧基端的蛋白质。然而,抑制型tRNA可以导致在终止密码子 后插入基酸和持续翻译。

识别通常的终止密码子的突变tRNA分子可以抑制mRNA分子的翻 译终止,并被称作抑制型tRNA。已经发现了许多这样的抑制型tRNA。 例子包括,但不限于,抑制琥珀终止密码子的翻译终止的supE、supP、 supD、supF和supZ抑制基因,抑制赭石终止密码子的功能的supB、 glT、supL、supN、supC和supM抑制基因,和抑制乳白终止密码子 的功能的glyT、trpT和Su-9。一般,抑制型tRNA在tRNA的反密码 子环中含有一或多个突变,这使得该tRNA可以和通常发挥终止密码子 功能的密码子发生碱基配对。该突变tRNA荷载其关联氨基酸残基,并 在遇到终止密码子时将该关联氨基酸残基插入正在翻译的多肽中。对 于抑制型tRNA的更为详细讨论,读者可以参考Eggertsson等(1988) Microbiological Review 52(3):354-374,和Engleerg-Kukla等, (1996),《Escherichia coli and Salmonella Cellular and Molecular Biology》,第60章,第909-921页,Neidhardt等(编),ASM Press, Washington,DC。

已经鉴定出增加终止抑制基因的效率的突变,即增强终止密码子 通读的突变。这些包括,但不限于,uar基因(又称作prfA基因)中的 突变,ups基因中的突变,sueA、sueB和sueC基因中的突变,rpsD(ramA) 和rpsE(spcA)基因中的突变,和rplL基因中的突变。

在普通情况下,如果终止密码子的抑制效率过高,预期宿主细胞 将是不健康的。这是由于基因组的数千或几万个基因中相当大部分天 然具有这三个密码子中的一个;这些密码子的完全通读将导致大量在 其羧基端含有额外氨基酸的异常蛋白质。如果存在一定平的抑制型 tRNA,则在氨基酸的掺入和核糖体的释放之间就存在一个竞争。尽管 其它因素例如密码子前后序列可以影响抑制的效率,但较高水平的 tRNA可以导致更多的通读。

生物体通常具有多个编码tRNA的基因。与遗传密码的冗余性(许 多氨基酸可以由多个密码子编码)组合,一个tRNA基因突变为抑制型 tRNA状态并不导致高水平的抑制。TAA终止密码子是最强的,也最难 于抑制。TGA是最弱的,并天然(在大肠杆菌中)造成3%程度的渗漏。 TAG(琥珀)密码子相对严紧,在无抑制时有约1%的通读。此外,天然 存在的抑制突变体可以以大约50%的效率抑制琥珀密码子。

抑制已在细菌和噬菌体中研究了数十年。此外,已知在酵母、蝇、 植物和其它真核细胞(包括哺乳动物细胞)中也存在抑制。例如,Capone 等(Molecular and Cellular Biology 6(9):3059-3067,1986)证明, 来源于哺乳动物tRNA的抑制型tRNA可以用于抑制哺乳动物细胞中的 终止密码子。将以终止密码子替代第27位丝氨酸密码子的大肠杆菌氯 霉素乙酰转移酶(cat)基因的拷贝、以及经突变形成琥珀、赭石、或乳 白抑制衍生物的编码人丝氨酸tRNA的基因,一起转染至哺乳动物细胞 中。观察到cat基因的成功表达。可诱导的哺乳动物琥珀抑制基因已 被用于抑制脊髓灰质炎病毒的复制酶基因中的突变,并且表达该抑制 基因的细胞系成功地被用于增殖此突变病毒(Sedivy等,(1987)Cell 50:379-389)。已经显示,与大肠杆菌相比,抑制型tRNA前后序列对 终止密码子抑制效率的影响在哺乳动物细胞中是不同的 (Philips-Jones等,(1995)Molecular and Cellular Biology 15(12):6593-6600;Martin等(1993)Biochemical Society Transactions 21:)。由于一些人类疾病是由必需基因中的无义突变引 起的,人们早已认识到抑制在基因治疗中的潜(见Temple等(1982) Nature 296(5857):537-40)。对导入白喉毒素A基因中的单个和两个 无义突变进行抑制,已被用作毒性基因治疗的二元系统的基础 (Robinson等(1995)Human Gene Therapy 6:137-143)。

常规核酸克隆

目前核酸区段的克隆是许多研究型实验室的日常工作并是许多遗 传分析的先决步骤。这些克隆的目的是多样的,然而,可以认为有两 个一般的目的:(1)从大DNA或RNA区段(染色体、YAC、PCR片段、mRNA 等)将核酸初始克隆至相对少数的已知载体如pUC、pGem、pBlueScript 中,和(2)将这些核酸区段亚克隆至用于功能分析的特化载体中。大量 的时间和努力被花在将核酸区段从初始的克隆载体上转移至更特化的 载体上。此转移被称作亚克隆。

克隆的基本方法已已知了许多年,而且在此期间几乎没有改变。 典型的克隆方案如下:

(1)用一或两种限制性酶消化目的核酸;

(2)当已知时,凝胶纯化目的核酸区段;

(3)适当地,通过用适当的限制性酶切割、用碱性磷酸酶处理、凝 胶纯化等,以预备载体;

(4)将核酸区段与载体连接,并使用适当的控制以消除由未切割的 和自连的载体构成的背景;

(5)将所获载体导入大肠杆菌宿主细胞中;

(6)挑取所选的菌落并过夜培养小量培养物;

(7)小量制备核酸;并

(8)在琼脂糖凝胶上(通常在诊断性限制性酶消化后)或通过PCR分 析此分离的质粒。

用于亚克隆核酸区段的特化载体在功能上是多样的。这些包括但 不限于:用于在各种生物体中表达核酸分子的载体;用于调节核酸分 子表达的载体;用于提供标签以帮助蛋白质纯化或以允许在细胞中跟 踪蛋白质的载体;用于修饰该克隆核酸区段(如产生缺失)的载体; 用于合成探针(例如核糖核酸探针)的载体;用于制备核酸测序模板的 载体;用于鉴定蛋白编码区域的载体;用于融合各种蛋白编码区的载 体;用于提供大量目的核酸的载体等。一般,一项特定的研究会涉及 到将目的核酸区段插入各种不同的特化载体中。

正如本领域已知的,简单的亚克隆可以在一天完成(例如核酸区 段不大而且限制性位点与亚克隆载体的限制性位点相容)。然而,许 多其它的亚克隆可能要花几周的时间,尤其是涉及到未知序列、长片 段、毒性基因、未适当放置的限制性位点、高背景、酶不纯等的那些 亚克隆。最繁琐和耗时的一种亚克隆类型涉及将几个核酸区段连续地 加入载体中以便构建期望克隆。此类克隆的一个例子是在构建基因靶 向载体中的克隆。基因靶向载体典型地包括两个核酸区段,它们每个 均与靶基因的一个部分一致,并位于选择标记的侧翼。为了构建这样 的载体,可能必需连续地克隆每个区段,即在载体中首先插入一个基 因片段、然后插入选择标记、再然后插入靶基因的第二个区段。对于 每个片段的克隆,这都可能要求多次的消化、纯化、连接和分离步骤。 因此亚克隆核酸片段常被看作应尽可能少做的繁琐之事。

几种促进核酸片段克隆的方法已有描述,例如以下文献中所述。

Ferguson,J.等,Gene 16:191(1981),公开了用于亚克隆酵母 核酸片段的一个载体家族。这些载体编码卡那霉素抗性。可以将较长 酵母核酸区段的克隆部分消化并连接入这些亚克隆载体中。如果最初 的克隆载体赋予了氨苄青霉素抗性,由于卡那霉素的选择,则在转化 前都没有必要进行纯化。

Hashimoto-Gotoh,T.等,Gene 41:125(1986),公开了在链霉素 敏感基因内具有独特克隆位点的亚克隆载体;在链霉素抗性宿主中, 只有在此显性敏感基因中具有插入或缺失的质粒才可在链霉素的选择 下存活。

尽管有这些方法提供的改进,但使用限制和连接酶系统进行传统 亚克隆仍是费时的而且相对不可靠。相当多的劳力被耗费,而且如果 两或多天后在这些候选质粒中不能发现期望的亚克隆,则必需尝试另 外的条件来重复整个过程。

重组克隆

利用在规定的重组位点处进行重组的克隆系统先前已在下列相关 申请中作过描述:1998年10月23日提交的美国申请09/177,387;2000 年3月2日提交的美国申请09/517,466;和美国专利5,888,732和 6,143,557,所有这些均特此并入本文作为参考。简而言之,本申请 和相关申请部分中提及的申请所描述的GATEWATTM克隆系统,利用含有 至少一个重组位点的载体在体内或体外克隆期望的核酸分子。更具体 地,该系统利用了含有从野生型位点(att0)突变而来的至少两个不同 位点特异性的重组位点(例如att1和att2)的载体,这些重组位点的 基础是λ噬菌体系统。每个突变位点对其关连伙伴(cognate partner) 的相同类型(例如attP1和attB1、或attR1和attL)att位点(即 其结合伙伴的重组位点)具有独特的特异性,并且不会与其它突变类 型的重组位点或与野生型att0位点有交叉反应。不同的位点特异性允 许定向克隆或连接期望分子,由此提供具有期望取向的克隆分子。使 用GATEWAYTM系统,通过替换受体质粒分子(有时称作目的载体 (Destination vector))上侧翼有att位点的选择标记(例如ccdB), 可以克隆和亚克隆侧翼有重组位点的核酸片段。然后通过转化ccdB敏 感宿主株和对受体分子上的标记作正筛选,选择期望的克隆。在其它 生物体中可以使用类似的策略进行负筛选(例如使用毒性基因),例如 在哺乳动物和昆虫中使用胸苷激酶(TK)。

对att位点核心区中的特定残基进行突变可以产生大量不同的 att位点。与GATEWAYTM中利用的att1和att2位点一样,每个额外的 突变均潜在地产生一个新的具有独特特异性的att位点,该位点将仅 与其携带相同突变的关连伙伴att位点重组,而不会与任何其它的突 变或野生型att位点发生交叉反应。2000年3月2日提交的先前专利 申请系列号09/517,466中描述了新的突变att位点(例如attB 1-10、 attP 1-10、attR 1-10、和attL 1-10),该文献特此并入本文作为参 考。具有独特特异性的其它重组位点(即,第一位点将与其相应位点重 组,并且不会或基本上不会与具有不同特异性的第二位点重组)可以用 于实施本发明。适当的重组位点的例子包括,但不限于,loxP位点; loxP位点突变体、变体或衍生物如loxP511(见美国专利5,851,808); frt位点;frt位点突变体、变体或衍生物;dif位点;dif位点突变 体、变体或衍生物;psi位点;psi位点突变体、变体或衍生物;cer 位点;和cer位点突变体、变体或衍生物。本发明提供使用这些重组 位点将多个核酸分子或区段接合或连接在一起的新方法,更具体的是 将该多个(例如2、3、4、5、7、10、12、15、20、30、50、75、100、 200等)区段克隆至含有一或多个(例如2、3、4、5、7、10、12、15、 20、30、50、75、100、200等)重组位点的一或多个载体(例如2、3、 4、5、7、10、12等)中,例如包括目的载体在内的任何GATEWAYTM载 体。

                      发明简述

一般地,本发明提供通过重组位点(每个分子或区段上存在至少 一个的重组位点)间的重组反应用于将两个或多个(例如2、3、4、5、 7、10、12、15、20、30、50、75、100、200等)核酸区段或分子接 合或联合在一起的材料和方法。根据本发明将多个核酸分子接合起来 的这些重组反应可以在体内(例如细胞、组织、器官或组织内)或在体 外(例如无细胞系统)中进行。因此,本发明涉及用于产生新的或独特 的核酸分子组合的方法、并涉及通过这些方法产生的核酸分子。本发 明还涉及包含本发明核酸分子的宿主和宿主细胞。本发明还涉及用于 实施本发明方法的试剂盒、和用于实施本发明方法的组合物、以及实 施本发明时产生的组合物。

通过本发明方法产生的核酸分子可以用于本领域技术人员已知的 任何目的。例如,本发明核酸分子可以用于表达该核酸分子所编码的 蛋白质或肽并可以通过表达本发明方法连接在一起的不同序列用于制 备新的融合蛋白。这些表达可以在细胞中或通过使用熟知的体外表达/ 翻译系统来实现。一方面,有待通过本发明方法接合在一起的核酸分 子或区段中的每个分子均可以包含多个重组位点(例如2、3、4、5、7、 10、12、15、20、30、50等),但其中的至少一个(优选两个或多个) 包含至少两个重组位点。这些重组位点(可以相同或不同)可以位于 每个核酸分子或区段的不同位置,而且本发明所用核酸可以具有不同 的大小和不同的形式包括环状、超螺旋、线性等。用于本发明中的核 酸分子还可以包含使得该分子可以在宿主细胞中发挥载体功能的一或 多个载体或一或多个序列(例如复制起点)。本发明核酸分子还可以 包含发挥结构功能或其它非表达功能的非编码区段(例如,内含的、 非翻译的、或其它区段)。

在一个优选方面,用于本发明中的核酸分子或区段是在核酸的至 少一个末端或近末端具有至少一个重组位点的线性分子,并优选在该 分子的两个末端或近末端包含至少一个重组位点。在另一优选方面, 当有多个重组位点位于目的核酸分子上时,这些位点基本上不或不在 该分子上发生相互重组。在该实施方案中,相应的结合配偶重组位点 优选位于有待通过本发明方法连接或接合的其它一个或多个核酸分子 上。例如,本发明所用第一核酸分子可以包含至少第一和第二重组位 点,而第二核酸分子可以包含至少第三和第四重组位点,其中该第一 和第二位点不能相互重组,而第三和第四位点不能相互重组,但该第 一和第三和/或该第二和第四位点可以重组。

可以使用有待通过本发明方法接合在一起的核酸分子(即“起始 分子”)制备一或多个(例如2、3、4、5、7、10、12、15、20、30、 50、75、100、200等)含有所有或部分起始分子的杂合分子(例如“核 酸分子产物”)。起始分子可以是来源于任何来源或通过任何方法产 生的任何核酸分子。这些分子可以来源于天然来源(例如细胞(如原核 细胞如细菌细胞、真核细胞如真菌细胞(如酵母细胞)、植物细胞、动 物细胞(如哺乳动物细胞如人类细胞)等)、病毒、组织、来源于任何动 物或非动物来源的器官、和生物体)或可以是非天然的(例如衍生的 核酸)或通过合成来源的。这些分子还可以包括原核和真核载体、质 粒、整合序列(例如转座子)、噬菌体或病毒载体、噬菌粒、粘粒等。 用于本发明中的区段或分子可以通过本领域技术人员已知的任何手段 来制备,这些手段包括但不限于,例如通过PCR扩增、从天然来源中 分离、化学合成、剪切或限制性消化较大的核酸分子(例如基因组或 cDNA)、转录、逆转录等,并可以本领域技术人员的任何手段向这些分 子添加重组位点,这些手段包括连接含有重组位点的衔接子、使用拓 扑异构酶与含有重组位点的衔接子附着、使用拓扑异构酶与含有重组 位点的衔接子引物附着、使用含有重组位点的引物扩增或合成核酸、 插入或整合含有重组位点的核酸分子(例如转座子或整合序列)等。 在一个优选方面,用于本发明中的核酸分子是分子群体例如核酸文库 或cDNA文库。

本发明所用的重组位点可以是核酸分子上参与由一或多个重组蛋 白介导或催化的重组反应的任何识别序列。在本发明利用一个以上(例 如2、3、4、5、7、10、12、15、20、30、50等)重组位点的实施方 案中,这些重组位点可以相同或不同,并可以彼此重组或不可以或基 本上不可以彼此重组。本发明所考虑的重组位点还包括野生型或天然 存在的重组位点的突变体、衍生物或变体。优选的重组位点修饰包括 增强重组的那些修饰,该增强基本上选自:(i)促进整合重组;(ii) 促进切除重组;(iii)降低对宿主因子的需要;(iv)增加共合体 (co-integrate)或产物形成的效率;和(v)增加共合体和/或产物形 成的特异性。

对重组位点的优选修饰包括可以增加重组特异性、去除一或多个 终止密码子、和/或避免发夹形成的修饰。还可以对重组位点进行期望 的修饰,以便当翻译或转录跨过该修饰的重组位点发生时,将期望的 氨基酸改变包括在转录或翻译产物(如mRNA或蛋白质)中。根据本发 明使用的优选重组位点包括att位点、frt位点、dif位点、psi位点、 cer位点、和lox位点、或它们的突变体、衍生物和变体(或它们的 组合)。本发明考虑的重组位点还包括这些重组位点的部分。根据所 用的重组位点的特异性,本发明允许定性连接核酸分子以便提供具有 期望取向的连接分子,或非定性连接以便产生具有随机取向的连接分 子。

在特定的实施方案中,本发明方法和组合物中所用的彼此重组的 重组位点包含具有一致的7碱基对重叠区的att位点。在本发明特定 实施方案中,这些7碱基对重叠区的头三个核苷酸包含选自以下组的 核苷酸序列:

AAA,AAC,AAG,AAT,ACA,ACC,ACG,ACT,AGA,AGC,AGG,AGT,

ATA,ATC,ATG;ATT,CAA,CAC,CAG,CAT,CCA,CCC,CCG,CCT,CGA,

CGC,CGG,CGT,CTA,CTC,CTG CTT,GAA,GAC,GAG,GAT,GCA,GCC,

GCG,GCT,GGA,GGC,GGG,GGT,GTA,GTC,GTG,GTT,TAA,TAC,

TAG,TAT,TCA,TCC,TCG,TCT,TGA,TGC,TGG,TGT,TTA,TTC,TTG,

和TTT.

除了一或多个重组位点(例如2、3、4、5、7、10、12、15、20、 30、50等),每个起始核酸分子均还可以包含各种序列(或它们的组 合),这些序列包括但限于,适于用作引物位点的序列(例如可以和 引物例如测序引物或扩增引物杂交以起始核酸合成、扩增或测序的序 列),转录或翻译信号或调节序列如启动子或增强子、核糖体结合位 点、Kozak序列、起始密码子、转录和/或翻译终止信号如终止密码子 (最适当的是可以被一或多个抑制型tRNA分子抑制的终止密码子), 复制起点,选择标记,和可以用于产生蛋白融合物(如N端或羧基端) 的基因或基因部分如S转移酶(GST)、β-葡糖酸糖苷酶(GUS)、组氨 酸标签(HIS6)、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、蓝色荧光 蛋白(cyan fluorescent protein)(CFP),可读框(ORF)序列,和任 何其它在各种分子生物学技术中可能期望的或使用的目的序列,包括 用于同源重组的序列(例如用于基因靶向)。

一方面,本发明提供制备杂合核酸分子群体的方法,包含(a)将至 少一个含有一或多个重组位点的第一核酸分子群体和至少一个含有一 或多个重组位点的靶核酸分子混合;和(b)使该至少第一群体的部分或 全部核酸分子和该靶核酸分子的部分或全部重组,籍此形成杂合核酸 分子群。在以上方法的某些具体实施方案中,通过将第一群核酸分子 和靶核酸分子与一或多个重组蛋白在利于重组产生杂合核酸分子的条 件下混合。在其它特定实施方案中,本发明方法还包含将该杂合核酸 分子和至少一个包含一或多个重组位点的第二群核酸分子混合,以产 生第二群产物核酸分子。或者,可以将第一群体、第二群体和靶核酸 分子混合在一起,以便通过重组形成杂合群体。在其它特定实施方案 中,本发明方法还包含选择通过上述方法产生的杂合核酸分子群。在 其它特定实施方案中,本发明方法还包含选出杂合核酸分子群并选择 除去第一核酸分子群、靶核酸分子和/或第二核酸分子群。

在相关实施方案中,本发明提供使含有第一重组位点的第一核酸 区段、含有第二和第三重组位点的第二核酸区段、和含有第四重组位 点的第三核酸区段重组的方法,其中该第一、第二、或第三核酸区段 可以是一致的核酸区段或核酸分子群,以便重组产生包含第一、第二 和第三核酸区段的线性或闭合环状产物。而且,可以使用含有或不含 有重组位点并与第一或第三核酸区段同源或简并的寡核苷酸,扩增这 些重组产物的成员。因此,例如,通过使用特异针对第一或第三核酸 区段的引物进行扩增,可以扩增包含第一-第二-第三杂合分子的产 物,而不会扩增其它不需要的分子(例如包含第一-第二杂合分子的 产物)。按此方式,可以使用扩增选出期望的产物并选择除去非期望 的产物。可以设计该扩增以便选出任何期望的产物或重组反应的中间 物。例如,可以将四个不同的分子(例如A、B、C、和D)接合起来, 并可以使用设计用于扩增期望产物的引物(例如当扩增A-B-C相应于 分子A和C的引物,而扩增A-B时相应于分子A和B的引物)选出各 种中间产物(例如A-B-C或A-B)。然后克隆所获扩增产物。在相关 实施方案中,可以使用两个或多个(例如2、3、4、5、6、7、8、9、 10、11、12、13、15等)核酸区段实施上述方法。

另一方面,本发明提供制备杂合核酸分子群的方法,其包含(a)将 至少一个包含一或多个重组位点的第一核酸分子群和至少一个包含一 或多个重组位点的第二核酸分子群混合;和(b)使该至少第一群体的全 部或部分核酸分子和该至少第二群体的全部或部分核酸分子重组,籍 此形成一或多个杂合核酸分子群。在上述方法的某些具体实施方案中, 通过将第一群核酸分子和第二群核酸分子与一或多个重组蛋白在利于 它们重组的条件下混合,以进行重组。在其它具体实施方案中,本发 明方法还包含将第一和第二群核酸分子与至少一个含有一或多个重组 位点的第三群核酸分子混合。在其它实施方案中,本发明方法还包括 选择杂合核酸分子群。在再其它具体实施方案中,本发明方法还包含 选出杂合核酸分子群并选择除去该第一、第二和/或第三群核酸分子。 其它实施方案中,本发明方法还包含选出或选择除去共合体分子和/ 或副产物分子。

本发明还包括通过以上方法制备杂合核酸分子群,和包含上述杂 合核酸分子群的重组宿主细胞群体。

在某些实施方案中,用于实施本发明的重组蛋白包含选自下组的 一或多个蛋白质:Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、Cin、 Tn3解离酶、TndX、XerC、XerD、和ΦC31。在具体实施方案中,重组 位点包含一或多个选自下组的重组位点:lox位点;psi位点;dif位 点;cer位点;fri位点;att位点;和这些重组位点的保留进行重组 的能力的突变体、变体和衍生物。

在一个特定的方面,本发明允许通过抑制一或多个终止密码子以 控制融合蛋白的表达。根据本发明,通过本发明接合起来的一或多个 起始分子(例如1、2、3、4、5、7、10、12等)可以包含一或多个终 止密码子,这些密码子可以被抑制以允许表达从第一起始分子通过邻 接的起始分子。例如,通过本发明接合起来的第一-第二-第三起始分 子(当该第一和第二分子均含有终止密码子时)可以通过抑制所有的 终止密码子而表达一个由该接合分子编码的三联体融合蛋白。而且, 通过改变对所选终止密码子的抑制,本发明允许选择或控制融合蛋白 表达。因此,通过抑制该第一-第二-第三分子的第一和第二分子间而 非第二和第三分子间的终止密码子,可以产生由第一和第二分子编码 的融合蛋白而不是三联融合物。因此,不同终止密码子的使用和抑制 的可变控制使得可以产生由接合起来的目的起始核酸分子的全部或不 同部分编码的各种融合蛋白或其部分。一方面,可以在起始核酸分子 或在起始分子所含的重组位点中的任何地方包括终止密码子。优选地, 这些终止密码子位于目的起始分子的末端或近末端,尽管这些终止密 码子可以包括在该分子内部。另一方面,一或多个起始核酸分子可以 包含目的靶基因或可读框的全部或部分编码序列,其中该编码序列之 后是终止密码子。然后该密码子后面可以跟随允许接合第二起始分子 的重组位点。在此类一些实施方案中,可以任选地通过抑制型tRNA分 子抑制终止密码子。编码抑制型tRNA分子的基因可以在包含目的靶基 因的相同载体上提供,或可以在不同载体上提供,或可以在包含该编 码序列的载体所要插入的宿主细胞的染色体中提供。在一些实施方案 中,可以提供一个以上拷贝(例如2、3、4、5、7、10、12、15、20、 30、50等个拷贝)的抑制型tRNA。在一些实施方案中,抑制型tRNA 的转录可以在可调节(例如诱导型或阻遏型)启动子的控制下进行。

因此,一方面,本发明涉及表达一或多个融合蛋白(例如1、2、3、 4、5、7、10、12、15、20、30、50等)的方法,包括:

(a)至少获得包含至少一个重组位点和至少一个终止密码子的第 一核酸分子(优选地该重组位点和/或终止密码子位于所述第一核酸分 子的一个或两个末端或近末端)、和包含至少一个重组位点的第二核 酸(优选地该重组位点位于所述第二核酸分子的一个或两个末端或近 末端);

(b)使所述第一和第二核酸分子通过所述重组位点的重组发生重 组,由此产生包含所述至少一个终止密码子和所述第一和第二分子的 全部或部分的第三核酸分子;和

(c)抑制所述至少一个终止密码子,表达由所述第三分子编码的 一或多个肽或蛋白质(例如2、3、4、5、7、10、12、15、20、30、 50等)。

而且,这里所述重组位点(例如具有各种重组特异性的重组位点) 可以在一、二或所有三种正向或反向读框中含有终止密码子。而且, 在适当的情况下,可以对这些重组位点进行设计以便消除一、二和/ 或所有三种正向或反向读框中的终止密码子。

另一方面,本发明提供合成蛋白质的方法,包含(a)提供包含后随 终止密码子的编码序列的至少第一核酸分子;(b)提供包含任选地后 随终止密码子的编码序列的至少第二核酸分子;(c)进行重组以便这 些核酸分子接合起来;(d)将所述接合的核酸分子插入载体中以产生 具有两个符合读框地连接的编码序列的修饰载体;(e)用该修饰载体 转化编码抑制型tRNA的宿主细胞;和(f)使此两个编码序列表达以便 产生由此两个编码序列的至少一个部分编码的融合蛋白,其中(a)和(b) 的核酸分子的侧翼均有至少一个重组位点。而且,该融合核酸分子或 该载体可以包含至少一个可抑制的终止密码子(例如琥珀、乳白和/ 或赭石密码子)。此外,该第一或第二核酸分子可以在上述方法实施 前就已经存在于该载体中。在本发明具体实施方案中,载体和/或宿主 细胞包含编码至少一个抑制型tRNA分子的基因。在其它具体实施方案 中,本发明方法还包括用包含编码至少一个抑制型tRNA分子的基因的 核酸分子转化该宿主细胞。在再一具体实施方案中,融合蛋白可以包 含由载体的至少一个部分编码的N-或C-标签(例如谷胱甘肽S转移酶、 β-葡糖醛酸糖苷酶、绿色荧光蛋白、黄色荧光蛋白、红色荧光蛋白、 蓝色荧光蛋白、麦芽糖结合蛋白、六组氨酸标签、表位标签等)。

本发明还涉及表达一或多个融合蛋白(例如1、2、3、4、5、7、 10、12、15、20、30、50等)的方法,包含:

(a)至少获得包含至少一个重组位点的第一核酸分子(优选地该 重组位点位于所述第一核酸分子的一个或两个末端或近末端)、和包 含至少一个重组位点的第二核酸(优选地该重组位点位于所述第二核 酸分子的一个或两个末端或近末端);

(b)使所述至少第一和第二核酸分子通过所述重组位点的重组发 生重组,由此产生包含所述至少第一和第二分子的全部或部分的第三 核酸分子;和

(c)表达由所述第三核酸分子编码的一或多个肽或蛋白质(例如2、 3、4、5、7、10、12、15、20、30、50等)。在某些此类实施方案中, 表达的融合蛋白的至少一个部分是由第三核酸分子编码的,且至少另 一部分是由第一和/或第二核酸分子的至少一个部分编码的。该融合蛋 白可以通过翻译相应于位于该第一和第二核酸分子间的重组位点的核 酸来产生。因此,可以通过“通读”相应于用于连接两个或多个核酸 区段的重组位点的mRNA,表达融合蛋白。本发明还包括通过本发明方 法产生的融合蛋白和编码该融合蛋白的mRNA。

正如以下更详细讨论的,以上讨论的方法可以用于制备由不同核 酸区段编码的蛋白质、以及编码这些融合蛋白质的核酸分子。因此, 在一个一般的方面,本发明提供通过连接两个或多个核酸区段而产生 的核酸分子的表达,制备融合蛋白的方法。在相关实施方案中,本发 明提供通过连接两个或多个核酸区段而产生的核酸分子的表达,产生 融合RNA的方法。这些RNA可以是mRNA或可以是所具有的活性非蛋白 编码功能的非翻译RNA。这些RNA的例子包括核酶和tRNA。本发明还 提供通过本发明方法产生的核酸分子、这些核酸分子的表达产物、用 于制备这些表达产物的方法、含有这些核酸分子的重组宿主细胞、和 制备这些宿主细胞的方法。正如以下详细讨论的,本发明还提供组合 文库,可以对此组合文库进行筛选,以鉴定具有特定功能或活性的核 酸分子和表达产物。

在一个具体方面,本发明提供用于将两个核酸分子或其部分接合 入一或多个产物核酸分子中的材料和方法,其中每个核酸分子均含有 至少一个重组位点,所述接合的方式是通过在使位于一个核酸分子上 的重组位点和位于另一核酸分子上的重组位点重组的条件下孵育这些 分子。重组位点优选位于起始核酸分子的末端或近末端。根据重组位 点在起始分子中的定位,由此产生的产物分子将含有通过重组位点(其 优选是一个新的重组位点)接合的第一和第二分子的全部或部分。例 如,attB1重组位点和attP1重组位点间的重组导致产生一个attL1 和/或attR1重组位点。

在另一具体方面,本发明提供用于将两个或多个核酸分子(例如2、 3、4、5、7、10、12、15、20、30、50等)接合入一或多个产物核酸 分子(例如1、2、3、4、5、7、10、12等)中的材料和方法,其中每 个起始核酸分子均具有至少一个重组位点,而且至少一个起始核酸分 子具有至少两个重组位点。这些重组位点优选位于起始核酸分子的一 个或两个末端或近末端。因此,本发明提供将至少两个核酸分子接合 起来的方法,其中至少第一核酸分子含有至少一个重组位点而至少第 二核酸分子含有两个或多个重组位点。在存在至少一种重组蛋白的情 况下,在足以将起始分子的全部或部分联合以形成一或多个产物分子 的条件下,孵育这些分子。由此产生的产物分子将含有通过重组位点 (优选是新的重组位点)接合起来的每个起始分子的所有或部分。

在另一具体方面,本发明提供将至少三个核酸分子(例如2、3、4、 5、7、10、12、15、20、30、50等)接合起来的方法,其中这些分子 具有至少一个重组位点并且至少一个起始核酸分子含有至少两个重组 位点。在存在至少一个重组蛋白的情况下孵育这些分子,可以提供一 或多个含有起始分子全部或部分的产物分子(例如1、2、3、4、5、7、 10、12、15、20、30、50等),其中所有分子均通过重组位点(优选 是新的重组位点)接合。

在另一具体实施方案中,本发明提供用于两个或多个核酸分子(例 如2、3、4、5、7、10、12、15、20、30、50等)接合起来的组合物 和方法,其中的至少两个分子(优选所有分子)具有两个或多个重组 位点。位于每个分子上的重组位点优选定位在起始核酸分子的末端或 近末端。根据本发明方法,两个或多个核酸分子或它们的部分通过重 组反应(例如在存在至少一个重组蛋白的情况下孵育这些分子)接合, 以形成包含通过重组位点(优选是新的重组位点)接合的每个起始分 子的全部或部分。

在另一具体方面,本发明提供将至少三个核酸分子接合起来的组 合物和方法,包括提供至少第一、第二和第三核酸分子,其中该第一 核酸分子包含至少第一重组位点,第二核酸分子包含至少第二和第三 重组位点、而第三核酸分子包含至少第四重组位点,其中该第一重组 位点能够与第二重组位点重组而第三重组位点能够和第四重组位点重 组,实施至少一个重组反应,以便该第一和第二重组位点重组而第三 和第四重组位点重组,籍此将这些分子的全部或部分联合起来以产生 一或多个产物分子。

因此,本发明一般涉及将n个核酸分子或区段联合起来的方法, 其中n为大于1的整数(例如2、3、4、5、7、10、12、15、20、30、 50等),该方法包括步骤:提供第1至第n个核酸分子或区段,从第 2至第n-1的每个分子具有至少两个重组位点,而第1和第n个分子 具有至少一个重组位点(优选具有至少两个重组位点);和在足以使 这些区段或分子的全部或部分重组以形成一或多个包含第1至第n每 个分子或区段的全部或部分的产物分子的条件下,使这些分子或区段 和一或多个重组蛋白(例如2、3、4等)接触。优选地,通过重组位 点使分子接合(例如使第一分子上的第一重组位点和第二分子上的第 二重组位点相互作用)将在这两个分子的接合处产生一个新的重组位 点,并可以在每个分子与下一个分子接合的每个接合处产生一个新的 重组位点。例如,当将各具有至少两个重组位点的许多分子(例如第 一或“x”分子、第二或“y”分子、和第三或“z”分子)接合起来时, 则x分子上的第一个重组位点与y分子上的第二重组位点相互作用, 而x分子上的第二个重组位点与z分子上的第一重组位点相互作用, 以产生包含通过重组位点接合的y∶x∶z的杂合核酸分子。当然,其它 重组事件也可以产生杂合分子,包含通过重组位点接合的例如x∶y∶z、 x∶z∶y、y∶z∶x、z∶x∶y和/或z∶y∶x或它们的片段。可以通过位于另一 分子上的至少一个重组位点和位于产物分子上的至少一个重组位点间 的重组(例如z分子上的第二重组位点和e分子上的第一重组位点相 互作用等,和/或y分子上的第一重组位点和f分子上的第二重组位点 相互作用等),在产物分子中加入其它分子。而且,包含y∶x∶z(或 以上提及的其它序列)的杂合核酸分子可以通过y和z的游离末端上 的重组位点的相互作用而环化。可以连续或同时地加入全部或部分的 起始分子。

在通过本发明方法接合的核酸区段含有一个或多个不具有重组位 点的末端的情况下,可以使用连接酶或拓扑异构酶(例如痘苗病毒的 拓扑异构酶,见美国专利5,766,891,整个公开并入本文作为参考), 将此末端或多个末端与相同核酸区段或另一核酸分子连接。

除了接合多个分子外,本发明还提供置换产物分子所包含的一或 多个分子(或它们的组合)的方法。例如,可以通过和包含一或多个 重组位点的一个不同分子(m)的全部或部分重组,置换或替代产物分子 包含的任何一个或多个n分子。因此,在一个例子中,通过m上的第 一重组位点和位于x侧翼的第一重组位点(例如y和x间的重组位点) 重组、而m上的第二重组位点和位于x侧翼的第二重组位点(例如x和 z间的重组位点)重组,m可以置换上述y∶x∶z分子中的x,产生y∶m∶z。 可以通过本发明分子上的一或多个重组位点和待替代的分子内或上的 一或多个重组位点重组,在本发明任何核酸分子内或之上进行多次的 替代或置换。而且,可以通过目的分子内的两个或多个重组位点的重 组产生缺失,以在本发明产物上造成一或多个不同大小的缺失(例如 2、3、4、5、7、10、12等)。例如,为了在上述y∶x∶z(或它的其它 排列)中造成缺失,位于x分子侧翼的重组位点的重组将产生缺失x的 新分子;即,该新分子将包含y∶z。因此,可以通过目的分子内的定 向重组,多次缺失、多次置换、及同时缺失和置换目的分子的不同部 分。

而且,本发明还提供在产物分子中插入一或多个分子(或其部分) 的方法。例如,使用上述y∶x∶z分子进行举例说明,包含一或多个重 组位点的分子w可以被插入y和x之间,形成新的分子y∶w∶x∶z。在 一个具体实施方案中,分子w侧翼有loxP位点,分子w的插入是由 Cre重组酶介导w分子上的loxP位点与y和x分子上的相应loxP位 点间的重组而实现的。本领域技术人员知道,可以对以上进行许多变 化,而且这些变化包括在本发明的范围内。例如,包含一或多个重组 位点的分子o可以被插入y和x间,根据起始分子形成新的分子(包 含y∶o∶x∶z或y∶o∶w∶x∶z)。本文所述方法实质上可以用于将任何数 量的分子插入其它分子中。而且,可以连续地使用这些方法,以便例 如制备具有多样结构的分子。

根据起始核酸分子或区段、重组位点在这些分子上的位置、和这 些位点的重组顺序,通过本发明方法产生的产物分子可以包含起始分 子(或它们的部分)的任何组合并可以是任何大小和任何形式(例如 环状、线性、超螺旋等)。

重要的是,本发明提供了方法,通过该方法可以将核酸分子群(已 知或未知的)和一或多个已知或未知的目的靶序列(例如2、3、4、5、 7、10、12、15、20、30、50个等)或和其它核酸分子群(已知或未 知的)组合,由此产生组合分子群(例如组合文库),从这些组合分 子群中可以获得独特的和/或新的分子(例如杂合分子)及这些分子编 码的蛋白质或肽,并对它们作进一步分析。

在一个优选方面,用于产生根据本发明的组合文库的核酸分子群 可以包含一群具有至少一个(优选两个或更多个)重组位点(例如2、 3、4、5、7、10、12、15等)的区段或分子。该分子群优选从经构建 含有这些重组位点的基因组或cDNA文库(或它们的部分)或随机核酸、 扩增产物(例如使用各种引物产生的PCR产物)和域(例如编码相同 或不同蛋白的不同蛋白域的核酸)获得。因此,根据本发明,包含重 组位点的第一群分子可以通过重组(定向和/或随机方向)随机地和包 含重组位点的至少一个目的靶序列或第二群分子接合或组合,以产生 第三群分子或杂合分子。

根据本发明,来自各种不同来源的多群分子可以多次组合以产生 一个所包含分子具有多种序列组合的新群体。例如,可以使第一群体、 第二群体和第三群体重组以产生包含一群随机三联分子的第四群体 (例如,该第四群体的一些或所有分子含有来自第一、第二和第三群 的所有或部分区段)。

在一个优选方面,可以优选地选择通过此组合方法获得的新产生 的分子群(例如第三群体),并由此将其与初始分子(例如靶分子、 和第一和第二群分子)及不需要的产物分子(例如共合体 (cointegrates)和/或副产物分子)分离或分开。此选择可以通过分 析或选择存在的期望核酸融合物(使用诊断性引物进行PCR)和/或存 在的由期望核酸融合物编码的蛋白的期望活性来实现。该选择还可以 通过正和/或负筛选来实现。根据本发明,在此负筛选方案中优选使用 一或多个毒性基因(例如2、3、4、5、7、10等)。

本发明还可以将对期望融合产物(核酸和/或蛋白)的选择与正和 /或负筛选作组合使用。因此,本发明提供方法,通过该方法可以选择 重组克隆产生的产物分子群(或甚至是一特殊类型产物分子或特殊产 物分子)并选择除去插入片段供体、载体供体和共合体群体或类似地 选出插入片段供体、载体供体、副产物和/或共合体并选择除去产物分 子群(见图1)。

参考图2,在本发明重组合文库(recombinatorial library)方法 中,本发明第一群分子(表示为区段A)可以作为插入片段供体分子 群提供,而第二群分子(表示为区段B)可以作为第二插入片段供体 分子群提供。当这些区段被描述为线性片段时,它们可以作为较大分 子内的区段,例如作为质粒中的区段,而提供。

本领域技术人员将明了,在此情况下,可以产生共合体分子(非 图1所显示的分子)。例如,可以形成包含区段A和区段B插入片段 供体的共合体。此外,还可以形成包含区段A和/或区段B插入片段供 体分子及载体供体分子的共合体。本发明的筛选方法允许选择除去插 入片段供体分子和选择除去各种共合体分子,并选出新产生的杂合分 子群,该杂合分子群可以被称作产物分子群。相反地,本发明筛选方 法也可以允许选择除产物并选出插入片段/载体供体、副产物和/或共 合体。

因此,本发明涉及产生杂合核酸分子群的方法,包括:

(a)将包含一或多个重组位点(例如2、3、4、5、7、10、12等) 的至少第一核酸分子群和至少一个包含一或多个重组位点(例如2、3、 4、5、7、10、12等)的目的靶核酸分子混合;

(b)使所述至少第一群体的部分或全部分子与所述目的靶分子的 所有或部分分子(优选随机地)重组,由此形成第三杂合分子群;和

(c)任选地特异地选出所述第三杂合分子群。

根据本发明,第三群体中含有的杂合分子优选包含获自第一群的 分子的全部或部分及靶分子的全部或部分。分子的接合可以根据需要 以定向或随机的方式取向。

在一个方面,用于产生所述第三群体的上述靶分子可以是DNA结 合域或转录激活域,以致该第三杂合分子群可以用于本领域熟知的双 杂种筛选方法中。

更具体地,本发明涉及产生组合分子群的方法,包括:

(a)获得包含一或多个重组位点(例如2、3、4、5、7、10、12 等)的至少第一核酸分子群、和包含至少一或多个重组位点(例如2、 3、4、5、7、10、12等)的至少第二核酸分子群;

(b)使至少所述第一群的一些或所有分子和至少所述第二群的一 些或所有分子(优选随机地)重组,由此产生第三群杂合分子;和

(c)任选地特异地选出所述第三杂合分子群。

根据本发明,第三群中包含的所有或许多杂合分子优选包含获自 第一群的分子的全部或部分及获自第二群的分子的全部或部分。分子 的接合可以根据需要以定向或随机方式取向。

根据本发明组合方法使用的核酸群可以包含合成的、基因组的或 cDNA文库(或其部分)的、随机合成的序列或简并核苷酸、域等。优 选地,所用核酸分子群包含一群随机分子,每个均具有至少两个重组 位点,这些重组位点优选彼此不相互重组并且优选位于每个分子的两 个末端或近末端。通过本发明方法对分子群作随机重组为产生具有显 著序列多样性的分子群提供了一项有力技术。例如,具有约106种序列 的第一文库和具有约106种序列的第二群体重组产生具有约1012种序 列的第三群体。

本发明还提供制备和筛选文库成员的核酸分子区段已经过改变的 组合文库的方法。这些改变包括核酸区段的突变、改组、插入和/或缺 失。具体地,本发明提供用于制备所含成员具有此突变的核酸文库的 方法和用于在现有文库中导入这些突变的方法。在一个相关方面,本 发明包括通过本发明方法产生的组合文库、用于筛选该文库以鉴定出 编码具有特定功能或活性的产物的成员的方法、以及这些文库的表达 产物(例如RNA、蛋白质等)。

而且,在与上述有关的方面,本发明为制备含有一或多个(例如1、 2、3、4、5、10、15)相同核酸区段和一或多个来源于一或多个核酸 分子群成员的核酸区段的核酸分子群提供了方法。制备这些核酸分子 的一个方法涉及使用含有两个重组位点的载体。将第一核酸区段(其 编码具有特定功能或活性(例如信号肽活性、DNA结合活性、对特定配 体的亲和力等)的蛋白质)插入第一个重组位点中,而将来源于核酸分 子群的第二核酸区段插入第二个重组位点。而且,任选地,可以将这 些核酸区段与调节转录的序列连接,籍此产生通过该融合序列产生的 融合肽和RNA分子。然后可以筛选所获的组合文库,以鉴定编码具有 特定功能或活性(例如转录激活活性;DNA结合活性;形成多聚体的 能力;在亚细胞区室如内质网、细胞核、线粒体、叶绿体、细胞膜等 的定位;等)的表达产物的核酸分子。当在诸如上述那些方法中使用 三个或更多个(例如3、4、5、6、8、10等)核酸区段时,一或多个 核酸区段可以保持不变而一或多个核酸区段可以来源于一或多个核酸 分子群的成员。例如,在构建一个四部分分子(表示为A-B-C-D)时, A和D可以是具有已知功能的已知分子(例如HIS6等标签、启动子、 转录或翻译信号、选择标记等),而B和C分子可以来源于一或多个 核酸分子群。

还可以在任何数量的标准分子生物学技术或这些技术的组合(体 外或体内)中,对本发明的所有产物分子作进一步操作、分析、或使 用。这些技术包括测序、扩增、核酸分子、制备RNA转录本(例如通 过使用RNA启动子如T7或SP6启动子转录产物分子)、表达蛋白质或 肽(例如,表达融合蛋白、表达抗体、表达激素等)、蛋白质-蛋白质 相互作用(双杂种或反向双杂种分析)、同源重组或基因打靶、和组 合文库分析和操作。本发明还涉及将本发明核酸分子(优选地通过重 组)克隆至一或多个载体(例如2、3、4、5、7、10、12、15、20、 30、50等)或通过加入某些功能性载体序列(如复制起点)将本发明 核酸分子转化成载体。在一个优选方面,重组在体外完成(例如在无 细胞系统中),而且直接在体外进行进一步操作或分析。因此,将本 发明分子导入宿主细胞和/或使其维持在宿主细胞中的能力并不构成 对进一步分析和操作的限制。因此,通过直接体外操作或分析本发明 分子,可以花费较少的时间并实现更大的处理量。或者,可以在宿主 细胞传代后进行体外分析或操作,或可以直接在体内进行分析或操作 (例如当在宿主细胞、组织、器官或生物体中时)。

根据本发明,核酸合成步骤可以包含:

(a)将目的核酸分子或模板和一或多个引物(例如1、2、3、4、5、 7、10、12、15、20、30、50等)及一或多个核苷酸(例如1、2、3 或4)混合,以形成混合物;和

(b)在足以合成与所述分子或模板的全部或部分互补的核酸分子 的条件下,孵育所述混合物。

然后可以将此合成的分子用作模板以进一步合成与此第一合成的 分子的全部或部分互补的核酸分子。由此,可以制备双链核酸分子(例 如DNA)。优选地,该第二合成步骤是在存在一或多个引物和一或个 核苷酸的情况下,并在足以合成与此第一核酸分子的全部或部分互补 的第二核酸分子的条件下进行的。典型地,一或多个核酸分子(例如 1、2、3、4、5、7、10、12、15、20、30、50等)的合成在存在一或 多种聚合酶(优选可以是热稳定的或中温的DNA聚合酶)的情况下进 行,但也可以在此合成反应中使用逆转录酶。因此,用作其它核酸分 子的合成模板的核酸分子可以是RNA、mRNA、DNA或非天然的或衍生的 核酸分子。根据本发明,可以通过使用含有引物位点的起始核酸分子, 在产物分子中掺入一或多个引物位点(例如2、3、4、5、7、10、12、 15、20、30、50等),以便于核酸的合成。因此,通过本发明方法, 可以根据引物位点在起始分子内的定位和起始分子加入产物分子中的 顺序,将引物位点添加在产物分子中的一或多个期望位置上。

根据本发明,测序步骤可以包括:

(a)将待测序的核酸分子和一或多个引物(例如1、2、3、4、5、 7、10、12、15、20、30、50等)、一或多个核苷酸(例如1、2、3 或4)及一或多个终止剂(例如1、2、3、4、或5)混合,以形成混 合物;

(b)在足以合成与待测序的所述分子的全部或部分互补的分子群 的条件下,孵育所述混合物;和

(c)分离所述群体以确定待测序的所述分子的全部或部分核苷酸 序列。

该测序步骤优选在存在一或多种聚合酶(例如DNA聚合酶和/或逆 转录酶)及一或多个引物的情况下进行。用于测序的优选终止剂包括 核苷酸衍生物例如双脱核苷酸(ddATP、ddTTP、ddGTP、ddCTP和它 们的衍生物)。根据本发明,可以通过使用含有引物位点的起始核酸 分子,将一或多个测序引物位点(例如1、2、3、4、5、7、10、12、 15、20、30、50等)掺入产物分子中,以便于核酸测序。因此,通过 本发明方法,可以根据起始分子中引物位点的位置和起始分子加入产 物分子中的顺序,将测序引物位点添加在产物分子中的一或多个期望 位置上。

根据本发明,蛋白质表达步骤可以包括:

(a)获得包含一或多个表达信号(例如1、2、3或4个)的待表 达核酸分子;和

(b)在所述表达信号的控制下表达该核酸分子的全部或部分,籍 此产生由所述分子或其部分编码的肽或蛋白质。

在本文中,表达信号可以说是与待表达的序列可操作连接的。所 表达的蛋白质或肽可以在宿主细胞中(体内)表达,但也可以使用本 领域熟知技术体外(例如在无细胞表达系统中)进行表达。一旦蛋白 质或肽表达后,可以任选地分离或纯化蛋白质或肽产物。而且,可以 将该表达的蛋白质或肽用于各种蛋白质分析技术中,包括双杂种相互 作用、蛋白质功能分析、和激动剂/拮抗剂-蛋白质相互作用(例如通 过药物、化合物或其它肽刺激或抑制蛋白质的功能)。而且,可以对 表达的蛋白质或肽进行筛选以鉴定出具有特定生物学活性的那些蛋白 质或肽。该活性的例子包括对核酸分子(例如DNA或RNA)、蛋白质 或肽的结合亲和力。具体地,可以筛选表达的蛋白质或肽,以鉴定对 其它蛋白质或其本身具有结合亲和力的那些蛋白质或肽。对其本身具 有结合亲和力的蛋白质或肽一般能够形成多聚体或聚积物。对其本身 和/或其它蛋白质具有结合亲和力的蛋白质或肽常能够形成或参与形 成多蛋白复合物例如抗体、剪接体、多亚基酶、核糖体等。上述表达 的蛋白质或肽、编码这些蛋白质或的核酸分子、用于制备这些核酸分 子的方法、用于产生含有这些核酸分子的重组宿主细胞的方法、通过 这些方法产生的重组宿主细胞、和用于产生这些表达的蛋白质或肽的 方法也包含在本发明范围内。

通过本发明制备的、尤其是从本发明组合分子的表达制备的、新 的独特杂合蛋白质或肽(例如融合蛋白)一般可以用于许多应用。更 具体地,正如本领域技术人员明了的,可以对本发明杂合蛋白质或肽 进行设计和选择,以便鉴定出实质上行使任何功能的那些蛋白质或肽。 可以使用这些蛋白质的应用的例子包括治疗、工业生产(例如微生物 合成氨基酸或糖)、小分子鉴定和纯化(例如通过亲和层析)、等。

根据本发明,可以通过使用含有一或多个转录或翻译信号(例如1、 2、3、4、5、7、10、12、15等)或调节序列、起始密码子、终止信号、 拼接供体/受体序列(例如内含子序列)等的起始分子,将这些序列掺 入产物分子中,以利于蛋白质的表达。因此,通过本发明的方法,可 以根据表达序列在起始分子中的定位和起始分子加入产物分子中的顺 序,将这些序列添加在产物分子中的一或多个期望位置上。

另一方面,本发明提供实现核酸分子间同源重组的方法,包括(a) 将包含一或多个重组位点的至少第一核酸分子和至少一个靶核酸分子 混合,其中该第一和靶核酸分子具有一或多个同源序列;和(b)通过 同源重组使该第一和靶核酸分子发生重组。在本发明的具体实施方案 中,本发明的同源重组方法导致将第一核酸分子的全部或部分转移至 靶核酸分子中。在本发明的某些具体实施方案中,该第一核酸分子包 含两个或更多个与靶核酸分子序列同源的序列。在其它具体实施方案 中,第一核酸分子的同源序列位于至少一个选择标记和/或一或多个重 组位点的侧翼。在再其它具体实施方案中,第一核酸分子的同源序列 位于侧翼有重组位点的至少一个选择标记的侧翼。在其它具体实施方 案中,第一核酸分子的同源序列位于调节转录的核酸区段的侧翼。

而且,根据本发明,同源重组可以包括:

(a)将包含一或多个重组位点(例如1、2、3、4、5、7、10、12、 15、20、30、50等)的本发明至少第一核酸分子(优选产物分子)和 至少一个靶核酸分子(例如1、2、3、4、5、7、10、12等)混合,其 中所述第一和靶分子具有一或多个同源序列(例如1、2、3、4、5、7 等);和

(b)通过同源重组使所述第一和靶核酸分子重组。

该同源重组可以体外(例如在无细胞系统中)发生,但优选在体 内(例如在宿主细胞中)进行。优选地,同源重组使得含有重组位点 的本发明核酸分子(第一核酸分子)的全部或部分转移至含有同源序 列的靶核酸分子的一或多个位点(例如1、2、3、4、5、7等)。可以 通过正或负选择(例如使用选择标记)促进该同源重组的选择,以便 选出期望的产物和/或选择除去不期望的产物。在一个优选方面,本发 明核酸分子包含至少一个选择标记和至少两个与靶分子同源的序列。 优选地,第一分子包含至少两个位于至少一个选择标记侧翼的同源序 列。

因此,本发明有利于构建基因靶向核酸分子或载体,这些核酸分 子或载体可以用于敲除或突变目的序列或基因(或改变现有序列,例 如将突变的序列转变为野生型序列),尤其是宿主或宿主细胞如动物 (包括人等动物)、植物、昆虫、细菌、酵母等中的基因或序列、或 这些宿主或宿主细胞中外来物如病毒的序列。该基因打靶(gene targeting)可以优选包含使序列靶向该宿主细胞的基因组。该基因打 靶可以体外(例如在无细胞系统中)或在体内(例如在宿主细胞中) 进行。因此,在一个优选方面,本发明涉及靶向或突变核苷酸序列或 基因的方法,包括:

(a)获得至少一个包含至少一或多个重组位点(及优选包含一或 多个选择标记)的本发明核酸分子,其中所述分子包含一或多个与感 兴趣的靶基因或核苷酸序列同源的核苷酸序列(所述一或多个同源序 列在本发明分子上优选位于一或多个选择标记(如1、2、3、4、5、7、 10等)的侧翼);和

(b)将所述分子和一或多个感兴趣的靶基因或核苷酸序列(例如 1、2、3、4、5、7、10、12、15、20、30、50等)在足以使所述感兴 趣的靶核苷酸序列或基因和所述本发明分子之间在一或多个位点(例 如1、2、3、4、5、7、10等)处发生同源重组的条件下接触,籍此将 本发明分子的全部或部分插入靶核苷酸序列或基因中。

此打靶方法可以造成靶核酸或基因的缺失、激活、失活、部分失 活、或部分激活,以致由该靶核酸或基因正常表达的表达产物(典型 的是蛋白质或肽)不再产生、或以较高或较低的水平产生、或在某种 程度上产生可以导致较高或较低活性或导致失活或部分失活的表达产 物的改变蛋白质序列。优选存在于本发明分子上的选择标记促进了对 其中同源重组事件成功的候选者(例如宿主细胞)的选择。因此,本 发明提供方法以制备含有通过本发明打靶方法产生的修饰核酸或基因 的宿主细胞、组织、器官和动物(例如转基因动物)。该修饰的核酸 或基因优选包含由本发明核酸分子提供的至少一个重组位点和/或至 少一个选择标记。

因此,更具体地,本发明涉及对核酸或基因进行打靶或突变的方 法,包括:

(a)获得包含侧翼有一或多个与目的靶核酸或基因同源的(例如 1、2、3、4、5、7、10等)序列的一或多个重组位点(例如1、2、3、 4、5、7、10、12、15、20、30、50等)及至少一个选择标记(例如1、 2、3、4、5、7、10等)的至少一个本发明核酸分子;

(b)将所述分子和一或多个目的靶核酸或基因(例如1、2、3、4、 5、7、10、12、15、20、30、50等)在足以使所述目的靶核酸或基因 和核酸分子之间在一或多个位点处发生同源重组的条件下接触,籍此 将本发明核酸分子的全部或部分插入(优选地,将至少一个选择标记 和/或至少一个重组位点插入)目的靶核酸或基因中;和

(c)任选地,选出包含本发明核酸分子的全部或部分的目的靶核 酸或基因,或选出含有其中包含了本发明核酸分子的全部或部分的靶 核酸或基因的宿主细胞。

优选地,用于上述方法中的选择标记是正选择标记(例如抗生素 抗性标记如氨苄青霉素、四环素、卡那霉素、新霉素、和G-418抗性 标记)。

在一个一般方面,本发明提供对靶基因或核苷酸序列进行打靶或 突变的方法,包括:(a)获得至少一个包含一或多个重组位点及一或 多个选择标记的第一核酸分子,其中该第一核酸分子包含一或多个与 靶基因或核苷酸序列同源的核苷酸序列;和(b)将该第一核酸分子和 一或多个靶基因或核苷酸序列在足以使该靶基因或核苷酸序列和该第 一核酸分子之间在一或多个位点处发生同源重组的条件下接触,由此 将该第一核酸分子的全部或部分插入靶基因或核苷酸序列中。在本发 明的某些具体实施方案中,该第一核酸分子包含至少一个侧翼有同源 序列的选择标记。在其它具体实施方案中,该选择标记的侧翼有同源 序列。在再其它实施方案中,靶基因或核苷酸序列由于同源重组而失 活。在再其它具体实施方案中,本发明方法还包括选出含有该靶基因 或核苷酸序列的宿主细胞。

在一些具体实施方案中,第一核酸分子中与靶基因或核苷酸序列 同源的一或多个核苷酸序列的一或多个与靶基因或核苷酸序列并不 100%一致。换言之,利于同源重组的核酸区段不必具有100%的序列 一致性。然而,一般地,这些核酸区段将在它们的同源区域中具有至 少70%一致性(例如至少70%、至少75%、至少80%、至少85%、 至少90%、至少95%、至少97%、至少98%、或至少99%)。

在许多情况下,使用与其发生重组的核酸(即靶基因或核苷酸序 列)不具有100%序列一致性的核酸区段来推动同源重组,可能是有 利的。这类情况的一个例子是当同源核酸相应于作为基因的靶核苷酸 序列的一部分时,而同源重组将导致在靶核苷酸序列中引入一或多个 的序列改变。在一个相关例子中,同源核酸可以相应于是完整基因的 靶核苷酸序列。因此,同源重组导致靶基因的置换。该情况的另一例 子是当需要对在待发生同源重组的位点上与第一核酸分子的一或多个 同源核苷酸序列相比具有不同核苷酸序列的生物体实行同源重组的时 候。例如,当待发生同源重组的生物体与从中获得第一核酸分子的同 源核苷酸序列的生物体是不同株或种时、或当该生物体在重组位点处 具有不同基因型时,可以导致这些序列的差异。

而且,利于重组的同源区域的长度可以在大小上改变,但一般长 至少1 5个核苷酸(例如至少20个核苷酸、至少50个核苷酸、至少 100个核苷酸、至少200个核苷酸、至少400个核苷酸、至少600个 核苷酸、至少800个核苷酸、至少1000个核苷酸、至少1500个核苷 酸、至少2000个核苷酸、至少2500个核苷酸、至少3000个核苷酸、 至少3500个核苷酸、至少4000个核苷酸、至少4500个核苷酸、至少 5000个核苷酸、至少5500个核苷酸、至少6000个核苷酸、至少6000 个核苷酸等)。

本发明还提供通过本文所述方法产生的重组宿主细胞,该宿主可 以是原核宿主(例如细菌)或真核宿主(例如真菌(如酵母)、植物、 或动物(如昆虫、哺乳动物包括人类、等)宿主)。

在本发明另一方面,可以使用根据本发明引入所靶向的核酸或基 因中的重组位点,切除、置换、或除去插在目的靶核酸或基因中的核 酸分子的全部或部分。因此,本发明允许体外或体内除去该核酸分子, 因此可以允许重新激活靶核酸或基因。在一些实施方案中,在鉴定和 分离了含有按上述引入的改变的核酸或基因后,可以除去本发明分子 中存在的选择标记。

本发明还提供将本发明起始或产物核酸分子克隆至一或多个载体 或将本发明产物分子转化为一或多个载体的方法。在一个方面,该起 始分子的重组导致产生一或多个产物分子,并将该产物分子克隆(优 选地通过重组)至一或多个载体中。在另一方面,将起始分子直接克 隆至一或多个载体中,以便在载体中将多个起始分子接合在一起,由 此产生含有本发明产物分子的载体。在另一方面,将起始分子直接克 隆至一或多个载体中,以便这些起始分子不在载体中接合在一起(即, 通过载体序列将起始分子分隔开)。在再另一方面,可以将产物分子 和起始分子的组合按任何顺序克隆至一或多个载体中,由此产生包含 由最初起始分子和产物分子组合形成的新产物分子的载体。

因此,本发明涉及克隆方法,包括:

(a)获得至少一个包含重组位点的本发明核酸分子(例如1、2、3、 4、5、7、10、12个等);和

(b)将所述分子的全部或部分转移至一或多个载体(例如1、2、3、 4、5、7、10、12、15个等)中。

优选地,该载体包含一或多个重组位点(例如1、2、3、4、5、7、 10、12、15、20、30、50等),而向载体中转移分子优选通过载体上 的一或多个位点(例如1、2、3、4、5、7、10等)和本发明分子上的 一或多个位点(例如1、2、3、4、5、7、10等)间的重组来完成。在 另一方面,可以通过将必需的载体序列(例如复制起点)包括在内, 将本发明产物分子转化为发挥载体功能的分子。因此,根据本发明, 可以通过使用含有该序列的起始分子,将这些载体序列掺入产物分子 中。可以根据这些载体序列在起始分子中的位置以及起始分子加入产 物分子中的顺序,将这些序列添加在产物分子的一或多个期望位置上。 因此,本发明使得可以通过将可能期望的任何数量的功能性元件(优 选地通过重组)并入载体中,常规构建期望载体。含有产物分子的载 体序列可以是线性的、或可以通过使产物分子内的重组位点重组或通 过本领域熟知的连接技术,被转化为环状或超螺旋形式的。优选地, 该产物分子的环化通过位于产物分子两个末端或近末端的重组位点的 重组来实现、或通过使产物分子的末端连接以环化该分子。正如已知 的,可以将线性或环状产物分子导入一或多个宿主或宿主细胞中作进 一步操作。

用于本发明的载体序列在使用时可以包含一或多个元件和/或功 能序列和/或位点(或它们的组合),包括一或多个测序或扩增引物位 点(例如1、2、3、4、5、7、10等)、一或多个赋予翻译终止抑制因 子活性的序列(例如1、2、3、4、5、7、10等)如编码抑制型tRNA 分子的序列、一或多个选择标记(例如1、2、3、4、5、7或10个毒 性基因、抗生素抗性基因等)、一或多个转录或翻译位点或信号(例 如1、2、3、4、5、7、10等)、一或多个转录或翻译终止位点(例如 1、2、3、4、5、7、10、12等)、一或多个允许切除例如相应于重组 位点或该位点翻译的蛋白质的RNA的拼接位点(例如1、2、3、4、5、 7、10等)、一或多个标签序列(例如HIS6、GST、GUS、GFP、YFP、 CFP、表位标签等)、一或多个限制性位点(例如1、2、3、4、5、7、 10等)、一或多个重组位点(或它们的部分)(例如1、2、3、4、5、 7、10、12、15、20、30、50等)、等。用于本发明的载体序列还可 以包含可按本文所述被抑制以允许表达期望融合蛋白的终止密码子。 因此,根据本发明,可以使用载体序列向本发明的任何核酸分子中导 入一或多个这样的元件、功能序列和/或位点,可以使用这些序列进一 步操作或分析该核酸分子。例如,载体提供的引物位点(优选位于克 隆在该载体中的插入片段两边)使得可以对克隆在该载体中的产物分 子的全部或部分进行测序或扩增。

此外,载体所包含的转录或调节序列使得由克隆在载体中的产物 分子的全部或部分编码的肽、多肽或蛋白质可以得以表达。同样,载 体所提供的基因、基因部分或序列标签(例如GUS、GST、GFP、YFP、 CFP、HIS标签、表位标签等)使得可以构建和克隆在载体中的产物分 子融合的基因融合物群体、或使得可以产生由载体提供的序列标签联 合克隆在该载体中的产物序列共同编码的许多肽、多肽或蛋白融合物。 这些基因、基因部分、或序列标签可以与任选地受抑制的终止密码子 组合使用,以便可以控制由克隆在载体中的目的序列和载体提供的基 因或标签序列编码的融合蛋白的表达。

在一个结构中,载体可以包含一或多个重组位点、一或多个终止 密码子和一或多个标签序列。在一些实施方案中,该标签序列可以与 重组位点相邻。任选地,可以将可抑制的终止密码子掺入标签的序列 中或掺入重组位点的序列中,以便使得可以控制标签序列向目的基因 的添加。在此类实施方案中,可以通过重组克隆将目的基因插入载体 中,以致标签和目的基因的编码序列在同一读框中。

可以与翻译起始信号(例如Shine-Delgarno序列、Kozak序列和/ 或IRES序列)一起提供目的基因,以便允许在终止密码子未受抑制时 表达具有天然N端的基因。而且,可以对位于编码融合蛋白成分的核 酸区段之间的重组位点进行设计,以便不编码终止密码子或在融合蛋 白读框中不编码终止密码子。还可以将目的基因和位于该编码序列3’ 末端的终止密码子(例如可抑制的终止密码子)一起提供。类似地, 当从多个核酸区段(例如3、4、5、6、8、10等个区段)产生融合蛋 白时,可以省去每个核酸区段之间编码终止密码子的核酸,并且,如 果期望的话,可以将编码终止密码子的核酸放置在融合蛋白编码区的 3’末端。

在一些实施方案中,可以在目的基因的N和C端提供标签序列。 任选地,位于N端的标签序列可以和终止密码子一起提供,目的基因 可以和终止密码子一起提供,C端标签可以和终止密码子一起提供。 这些终止密码子可以相同或不同。

在一些实施方案中,N端标签的终止密码子不同于目的基因的终止 密码子。在此类实施方案中,可以提供相应于终止密码子之一或两者 的抑制型tRNA。当提供两者时,每个抑制型tRNA均可以独立地在同 一载体上、不同载体上、或在宿主细胞的基因组中提供。抑制型tRNA 不必以相同方式提供,例如,一个可以在含有目的基因的载体上提供, 而另一个可以在宿主细胞基因组中提供。

根据表达信号(如启动子)的定位,表达期间终止密码子的抑制 使得可以产生在表达的蛋白质的N和/或C端具有标签序列的融合肽。 通过对终止密码子不加抑制,可以表达不具有N和/或C端标签序列的 目的序列。因此,本发明使得可以通过重组有效地构建含有目的基因 或序列(例如1、2、3、4、5、6、10或更多个ORF)的载体,以便根 据需要控制融合蛋白的表达。

优选地,根据本发明克隆或构建的本发明起始核酸分子或产物分 子包含至少一个可读框(ORF)(例如1、2、3、4、5、7、10、12、 或15个ORF)。这些起始或产物分子还可以包含功能序列(例如引物 位点、转录或翻译位点或信号、终止位点(例如可以任选地抑制的终止 密码子)、复制起点等),并优选地包含调节基因表达的序列(包括转 录调节序列)和发挥内部核糖体进入位点(IRES)作用的序列。优选地, 至少一个起始或产物分子和/或载体包含发挥启动子功能的序列。这些 起始或产物分子和/或载体还可以包含转录终止序列、选择标记、限制 性酶识别位点等。

在一些实施方案中,起始或产物分子和/或载体包含两个拷贝的相 同选择标记,每个拷贝的侧翼有两个重组位点。在其它实施方案中, 起始或产物分子和/或载体包含两个不同的选择标记,每个选择标记的 侧翼有两个重组位点。在一些实施方案中,该选择标记中的一或多个 可以是负选择标记(例如ccdB、kicB、单纯疱疹病毒胸苷激酶、胞嘧 啶脱氨酶等)。

在一方面,本发明提供克隆核酸分子的方法,包括(a)提供侧翼有 第一和第二重组位点的第一核酸区段;(b)提供侧翼有第三和第四重 组位点的第二核酸区段,其中该第一或第二重组位点能够和第三或第 四重组位点重组;(c)进行重组反应,以便这两个核酸区段重组为一 个单一的核酸分子;和(d)克隆此单一核酸分子。在这些方法的某些 具体实施方案中,第一重组位点不能与第二和第四重组位点重组,而 第二重组位点不能与第一和第三重组位点重组。

在一个具体方面,本发明提供克隆方法,包括提供包含至少第一 和第二重组位点的至少第一核酸分子和包含至少第三和第四重组位点 的至少第二核酸分子,其中该第一或第二重组位点能够与第三或第四 重组位点重组;和进行重组反应,以便这两个核酸分子重组为一或多 个产物核酸分子,并将此产物核酸分子克隆在一或多个载体中。优选 地,这些重组位点位于第一和/或第二核酸分子的侧翼。而且,该克隆 步骤优选通过重组反应将产物分子重组入包含一或多个重组位点的载 体中,但该克隆步骤也可以通过本领域熟知的标准连接反应来完成。 一方面,克隆步骤包括使产物核酸分子中在第一次重组反应中没有反 应的位点和具有能够和该未反应的位点发生重组的重组位点的载体之 间进行重组反应。

另一方面,本发明提供克隆核酸分子的方法,包括(a)提供侧翼 有至少第一和第二重组位点的第一核酸区段和侧翼有至少第三和第四 重组位点的第二核酸区段,其中位于该第一和第二核酸区段侧翼的每 个重组位点均不能和位于该第一和第二核酸分子区段侧翼的任何其它 位点重组;(b)提供包含至少第五、第六、第七和第八重组位点的载 体,其中该至少第五、第六、第七和第八重组位点的每一个均能够与 该至少第一、第二、第三和/或第四重组位点的一个重组;和(c)进行 重组反应,以便这两个核酸区段重组进入载体中,由此克隆该第一和 第二核酸区段。

在另一具体方面,本发明提供克隆方法,包括提供包含至少第一 和第二重组位点的至少第一核酸分子和包含至少第三和第四重组位点 的至少第二核酸分子,其中该第一、二、三或四重组位点均不能与其 它任何位点发生重组;提供包含至少第五、第六、第七和第八重组位 点的载体,其中该第五、第六、第七和第八重组位点每个均能够与该 第一、二、三或四重组位点中的一个重组;和进行重组反应,以便至 少所述第一和第二核酸分子重组进入所述载体中。在再一方面,该方 法可以允许克隆至少一个其它的核酸分子(例如,至少第三核酸分子), 其中所述分子的侧翼有第九和第10重组位点而其中该载体包含各能 够和该第九或第10重组位点重组的第11和第12重组位点。

特别地,本发明还提供克隆方法,包括提供第一、第二和第三核 酸分子,其中该第一核酸分子的侧翼有至少第1和第2重组位点,该 第二核酸分子的侧翼有至少第3和第4重组位点、而该第三核酸分子 的侧翼有至少第5和第6重组位点,其中该第2重组位点能够和第3 重组位点重组,而该第4重组位点能够和第5重组位点重组;提供具 有至少第7和第8重组位点的载体,其中该第7重组位点能够和第1 重组位点反应而该第8重组位点能够和第6重组位点反应;和实施至 少一次重组反应,以便该第2和第3重组位点重组、第4和第5重组 位点重组、第1和第7重组位点重组、第6和第8重组位点重组,由 此将该第一、二、三核酸区段克隆在所述载体中。

在另一具体方面,本发明提供克隆方法,包括提供至少第1、2、3 核酸分子,其中该第1核酸分子的侧翼有第1和2重组位点,该第2 核酸分子的侧翼有第3和4重组位点、而该第3核酸分子的侧翼有第 5和6重组位点,其中该第2重组位点能够和第3重组位点重组、而 第1、4、5或6重组位点没有一个能够和第1至第6重组位点中的任 一个重组;提供包含位于至少第一选择标记侧翼的第7和第8重组位 点、并包含位于至少第二选择标记侧翼的第9和第10重组位点的一或 多个载体,其中该第7至第10重组位点没有一个能够和该第7至第 10重组位点中的任一个重组;实施至少一次重组反应,以便该第2和 第3重组位点重组、第1和第4重组位点与第7和第8重组位点重组、 而第5和第6重组位点与第9和第10重组位点重组,由此克隆该第1、 2、3核酸区段。在一些实施方案中,这些选择标记可以相同或可以不 同。而且,该一或多个选择标记(例如2、3、4、5、7等)可以是负 选择标记。

本发明还提供克隆n个核酸区段的方法,其中n是大于1的整数, 该方法包括(a)提供n个核酸区段,每个区段的侧翼均有两个不能彼 此重组的重组位点;(b)提供包含2n个重组位点的载体,其中此2n 个重组位点中每个均能够与位于该核酸区段之一侧翼的其中一个重组 位点重组;和(c)实施重组反应,以便该n个核酸区段重组进入载体 中,由此克隆该n个核酸区段。在具体实施方案中,该n个核酸区段 和载体间的重组反应是在一或多个重组蛋白存在时在利于该重组发生 的条件下进行的。在其它具体实施方案中,n是2、3、4或5。

因此,一般地,本发明提供克隆n个核酸分子的方法,其中n是 大于1的整数,该方法包括步骤:提供n个核酸分子,每个分子包含 至少一个、优选两个重组位点(这两个重组位点优选位于n核酸分子 的侧翼);提供至少一个包含一或多个重组位点(优选2n个重组位点) 的载体,其中载体所含重组位点能够和此n个分子的重组位点重组; 和实施重组反应,以便将该n个核酸分子插入所述载体中,由此克隆 该n个核酸区段。这n个分子可以彼此相接地或毗邻地插入载体中和/ 或可以插入载体的不同位置中。用于根据本发明的克隆的载体优选包 含n个拷贝的相同或不同选择标记,每个拷贝的选择标记的侧翼有至 少两个重组位点。优选地,这些选择标记中的一或多个是负选择标记。

一般地,本发明还涉及克隆n个核酸分子的方法,其中n是大于1 的整数,该方法包括步骤:提供第1至第n个核酸分子,每个分子的 侧翼有至少两个重组位点,其中对这些重组位点进行选择以便位于第 i个区段,即ni,侧翼的两个重组位点中的一个与位于第ni-1区段侧翼 的重组位点中的一个反应,而位于第i区段,即ni,侧翼的另一重组 位点和位于第ni+1区段侧翼的一个重组位点反应;提供包含至少两个 重组位点的载体,其中载体上的这两个重组位点中的一个和第1核酸 区段上的一个位点反应,而载体上的另一位点和第n个核酸区段上的 一个重组位点反应。

根据需要并根据存在的功能元件,通过本发明方法克隆的核酸分 子/区段可以是不同类型的并可以具有不同的功能。一方面,根据本发 明克隆的至少一个核酸区段与能够调节转录的序列(例如启动子、增强 子、阻遏基因(repressor)等)可操作地连接。例如,至少一个核酸 区段可以可操作地和启动子连接,该启动子可以是诱导型启动子或组 成型启动子。在再其它具体实施方案中,从该克隆的核酸区段产生的 RNA的翻译导致产生融合蛋白或单个蛋白的全部或部分。在其它具体 实施方案中,至少一个核酸区段编码全部或部分的可读框,而至少一 个核酸区段含有能够调节转录的序列(例如启动子、增强子、阻遏基 因等)。在其它具体实施方案中,至少一个核酸区段在转录时产生有 义RNA链,而至少一个核酸区段在转录时产生反义RNA链。在相关实 施方案中,该有义RNA和反义RNA具有至少一个互补区域并能够相互 杂交。在其它具体实施方案中,至少两个核酸区段的转录导致产生一 个单一的RNA或两个单独的RNA。在各种具体实施方案中,这些核酸 区段可以彼此连接、或可以在同一核酸分子中在空间上隔离。在特定 实施方案中,该核酸区段包含一或多个文库中的核酸分子。而且,这 些文库可以包含cDNA、合成的DNA、或基因组DNA。此外,这些文库 的核酸分子可以编码抗体分子的可变区(例如,抗体轻链和重链的可 变区)。在特定实施方案中,本发明提供筛选方法,以鉴定编码对一 或多个抗原具有结合特异性的蛋白质和/或具有一或多个活性(例如从 细胞中分泌、亚细胞定位(如定位在内质网、细胞核、线粒体、叶绿体、 细胞膜等)、配体结合活性(如小分子、对核酸、细胞表面受体、可溶 性蛋白质、金属离子、结构元件、蛋白相互作用域等的结合活性)、酶 活性等)的蛋白质。而且,使用本发明方法克隆的核酸分子/区段具有 上述一或多个活性。

在另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a) 提供至少第1、2、和3核酸区段,其中该第1核酸区段的侧翼有至少 第1和2重组位点、第2核酸区段的侧翼有至少第3和4重组位点、 而第3核酸区段的侧翼有至少第5和6重组位点,其中该第2重组位 点能够和第3重组位点重组,而第1、4、5或6重组位点中没有一个 能够和该第1至第6重组位点中的任一个重组;(b)提供包含位于至 少第一负选择标记侧翼的第7和第8重组位点、并包含位于至少第二 负选择标记侧翼的第9和第10重组位点的载体,其中该第7至第10 重组位点中没有一个能够和该第7至第10重组位点中的任一个重组; (c)实施第一重组反应,以便该第2和第3重组位点重组;和(d)实 施第二重组反应,以便第1和第4重组位点与第7和第8重组位点重 组、而第5和第6重组位点与第9和第10重组位点重组,由此克隆该 第1、2、3核酸区段。在相关实施方案中,该第1和第2重组反应是 在一或多个重组蛋白存在时在利于该重组发生的条件下进行的。该第 1和第2重组反应可以同时或相继进行。

另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提 供第1、2、和3核酸区段,其中该第1核酸区段的侧翼有第1和2重 组位点、第2核酸区段的侧翼有第3和4重组位点、而第3核酸区段 的侧翼有第5和6重组位点,其中该第2重组位点能够和第3重组位 点重组,而第4重组位点能够和第5重组位点重组;(b)提供包含第 7和第8重组位点的载体;(c)实施至少一次重组反应,以便该第2 和第3重组位点重组,第4和第5重组位点重组,第1和第6重组位 点分别与第7和第8重组位点重组,由此克隆该第1、2、3核酸区段。 在相关实施方案中,这些重组反应是在一或多个重组蛋白存在时在利 于该重组发生的条件下进行的。在特定实施方案中,彼此发生重组的 重组位点包含具有一致7碱基对重叠区的att位点。

另一方面,本发明提供克隆n个核酸片段的方法,其中n是大于2 的整数,该方法包括(a)提供第1至第n个核酸区段,每个区段的侧 翼有至少两个重组位点,其中对这些重组位点进行选择以便位于第i 个区段,即ni,侧翼的两个重组位点中的一个与位于第ni-1区段侧翼 的重组位点中的一个反应,而位于第i区段侧翼的另一重组位点和位 于第ni+1区段侧翼的一个重组位点反应;(b)提供包含至少两个重组 位点的载体,其中载体上的这两个重组位点中的一个和第1核酸区段 上的一个位点反应,而载体上的另一位点和第n个核酸区段上的一个 重组位点反应;和(c)实施至少一次重组反应,以便将所有的核酸片 段重组至载体中。在具体实施方案中,该重组反应在存在一或多个重 组蛋白时在利于该重组发生的条件下进行。

在上述方法的具体实施方案中,将多个核酸区段插入另一核酸分 子中。尽管这些方法可以有多种变化,但在具体实施方案中,将含有 具有不同特异性的重组位点(例如attL1和attL2)的核酸区段插入 含有一组以上关连重组位点(例如attR1和attR2)的载体中,其中每 一组关连重组位点均位于负选择标记的侧翼。因此,可以使用在关连 位点的重组结果选出在一或多个重组位点经历了重组的核酸分子。插 入载体中的核酸区段可以相同或不同。而且,这些核酸区段可以编码 表达产物或可以是转录控制序列。当核酸区段编码表达产物时,可以 使用本发明载体扩增拷贝数或增加编码产物的表达。而且,当将核酸 区段以正向和反向插入时,可以使用本发明载体例如表达RNAi,见本 文其它地方的描述。当核酸区段编码调节转录的序列(例如启动子、增 强子等)时,可以使用本发明载体将多个调节元件可操作地与编码表达 产物的核酸连接。例如,此性质的载体可以通过提供多个与激活转录 的蛋白质结合的位点,用于增加表达产物的表达量。类似地,例如可 以通过提供多个与抑制转录的蛋白质结合的位点,使用此性质的载体 减少表达产物的表达量。例如,可以通过多个拷贝的编码参与转录调 节的因子的核酸分子的表达,使用此性质的载体增加或减少表达产物 的表达量。与上述相关的其它实施方案将是本领域技术人员明了的。

另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提 供第一群核酸分子,其中这些分子的全部或部分在侧翼有至少第一和 第二重组位点;(b)提供侧翼有至少第三和第四重组位点的至少一个 核酸区段,其中该第一或第二重组位点能够和第三或第四重组位点发 生重组;(c)进行重组反应,以便该群体中的所有或部分核酸分子与 该区段重组,以形成第二群核酸分子;和(d)克隆该第二群核酸分子。 在相关实施方案中,这些重组反应是在存在一或多个重组蛋白时在利 于该重组发生的条件下进行的。在具体实施方案中,该第二群核酸分 子编码融合蛋白。在相关实施方案中,该核酸区段编码的多肽包含编 码以下成员全部或部分的序列(优选地N端和/或C端标签序列):免疫 球蛋白的Fc部分、抗体、β-葡糖醛酸糖苷酶、荧光蛋白(例如绿色荧 光蛋白、黄色荧光蛋白、红色荧光蛋白、蓝色荧光蛋白等)、转录激活 域、参与翻译的蛋白质或域、蛋白质定位标签、蛋白质稳定或脱稳定 序列、蛋白质相互作用域、DNA的结合域、蛋白底物、纯化标签(例如 表位标签、麦芽糖结合蛋白、6组氨酸标签、谷胱苷肽S转移酶等)、 和表位标签。

另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提 供第一群核酸分子,其中这些分子的全部或部分在侧翼有至少第一和 第二重组位点;(b)提供第二群核酸分子,其中这些分子的全部或部 分在侧翼有第三和第四重组位点,其中该第一或第二重组位点能够和 第三或第四重组位点重组;(c)实施重组反应,以便第一群中的所有 或部分分子和第二群的一或多个分子重组,形成第三群核酸分子;和 (d)克隆第三群核酸分子。在相关实施方案中,该重组反应是在存在 一或多个重组蛋白时在利于该重组发生的条件下进行的。

因此,一般地,本发明提供将至少两个核酸区段接合起来(包括 将核酸分子群接合起来)的方法,该方法包括(a)提供至少两个核酸 区段(其中一个或两者可以来源于一群分子或文库分子),每个区段包 含至少一个能够和另一(或第二)区段上存在的重组位点发生重组的重 组位点;和(b)在使这些重组位点间发生重组的条件下将这些区段和 一或多个重组蛋白接触,由此使这些区段接合起来。本发明还提供包 含通过该方法制备的这些相接合的核酸区段(或区段群)的组合物、包 含这些相接合的核酸区段的宿主或宿主细胞(它们可以是宿主细胞群 或重组宿主细胞)、和制备这些宿主或宿主细胞的方法(例如通过用本 发明产物分子转化或转染这些细胞)。在具体实施方案中,本发明方法 还包含将该相接合的核酸区段插入一或多个载体中。本发明还涉及含 有这些载体的宿主或宿主细胞。在其它具体实施方案中,这两个核酸 区段的至少一个编码具有一或多种可鉴定活性的表达产物(例如选择 标记、酶、核酶等)。在再其它具体实施方案中,这两个核酸区段的至 少一个含有全部或部分的可读框(ORF)。在另一方面,这两个区段的至 少一个含有能够调节转录的序列(例如启动子、增强子、阻遏基因等)。 在一个具体方面,一个区段编码ORF而另一个编码能够调节转录和/ 或翻译的序列,而重组反应使得这些序列可操作地相连。在再其它具 体实施方案中,这些核酸区段中的一或多个编码选择标记或含有复制 起点。在其它具体实施方案中,这些核酸区段的一些或所有含有一或 多个文库的核酸分子。在某些具体实施方案中,该一或多个文库包含 编码抗体分子可变区的多核苷酸。在相关实施方案中,这些核酸区段 的至少一个编码用于连接抗体分子可变区的多肽接头和/或一或多个 文库包含编码抗体轻和重链可变区的多核苷酸。在具体实施方案中, 本发明方法还包含至少一个筛选步骤以鉴定编码具有一或多个可鉴定 活性(例如对一或多个抗原的结合特异性、酶活性、与选择标记相关的 活性等)的蛋白质的核酸分子。因此,可以使用本发明产生修饰的表达 产物(通过可变地连接不同区段和/或置换和/或缺失区段)和分析表达 产物的期望活性。根据本发明,可以连接基因的部分和/或许多基因, 以表达新蛋白质或新化合物并选出令人感兴趣的活性。正如本文所述, 还可以使用对这些连接分子的替换和/或缺失,产生改变的或修饰的蛋 白质或化合物用于测试。一方面,可以通过本发明方法修饰生物学途 径,以便例如在特定的途径中使用不同的酶或突变的酶(例如,连接在 相同生物学途径中参与反应的不同酶或突变酶)。根据本发明对生物学 途径的此修饰将导致(1)产生潜在的新化合物如抗生素或糖或(2)独 有的蛋白质翻译后修饰(例如糖基化、唾液酸化(sialation)等)。本 发明还使得可以通过操作或改变多聚体酶复合物的亚基产生新的酶。 在其它具体实施方案中,本发明还提供改变细胞性质的方法,包括将 上述方法制备的核酸区段导入细胞中。在某些具体实施方案中,通过 本发明方法改变或产生的细胞是真菌细胞或细菌细胞(例如大肠杆菌 (Escherichia coli))。

本发明还提供改变生物学途径和产生新的生物学途径的方法。例 如,可以使用本发明方法改变编码参与产生特定途径(例如导致抗生 素产生的途径)的产物的基因。这些改变包括缺失、置换和/或突变编 码参与该途径的产物的一或多个基因。此外,可以对基因的区域进行 缺失或交换,然后筛选鉴定出例如具有特定性质(例如特定甲基化方式) 的途径产物。而且,可以合并不同生物的行使相似但不同功能的基因 以产生新的产物。而且,可以通过对特异功能性质(例如抑制酶反应的 能力、对特定配体的结合亲和力、抗微生物活性、抗病毒活性等)的筛 选,鉴定出这些产物。因此,一方面,本发明提供筛选方法用于鉴定 本发明核酸分子的表达产物所产生的化合物。

而且,当编码参与特定生物学途径或过程的一或多个表达产物的 核酸区段被组装在一或多个核酸分子时,可以对这些分子的区域(例 如编码表达产物的区域)进行缺失或置换以产生,例如,表达其它表 达产物或改变的表达产物的核酸分子、或产生不表达参与该生物学途 径或过程的一或多个表达产物的核酸分子。而且,可以将编码一或多 个参与特定生物学途径或过程的表达产物的核酸区段作为一个单独的 单位进行缺失或插入。这些方法在产生和筛选新产物的过程中是有用 的。尤其是,本发明还包括通过此处描述的核酸分子的表达产物而产 生的新产物。

另一方面,本发明提供制备和鉴定含有两个或多个核酸区段的核 酸分子的方法,其中所述核酸区段编码参与相同生物学过程或生物学 途径、以及无关生物学过程或生物学途径的基因产物,该方法包括(a) 提供第一群核酸分子,该群核酸分子含有至少一个能够和该第一群中 其它分子重组的重组位点;(b)在使第一群的核酸分子重组并产生第 二群核酸分子的条件下,使这些核酸分子和一或多个重组蛋白接触; 和(c)筛选第二群核酸分子以鉴定编码两个或多个参与相同过程或途 径的产物的核酸分子。在本发明具体实施方案中,编码两个或多个参 与相同过程或途径的产物的核酸分子编码蛋白质或蛋白质复合物的两 个不同域。在其它具体实施方案中,该蛋白质是单链抗原结合蛋白。 在再其它具体实施方案中,该蛋白复合物包含含有至少两个单链抗原 结合蛋白的抗体分子或多价抗原结合蛋白。本发明还提供类似于上述 方法的方法,用于制备或鉴定含有两个或多个编码参与不同或无关生 物学过程或生物学途径的基因产物的核酸区段。

本发明方法还可以用于确定细胞和/或组织中的基因表达谱 (expression profile)。一个实施方案中,可以从细胞和/或组织中 获得RNA,并将其用于制备cDNA分子。然后可以将这些cDNA分子彼 此连接并对其进行测序以鉴定在细胞和/或组织中表达的基因、以及这 些细胞和/或组织中RNA种类的丰度。因此,一方面,本发明提供方法 用于鉴定在特定细胞和/或组织中表达的基因以及与其它RNA种类的 量相比这些细胞和/或组织中存在的特定RNA种类的相对量。正如以下 讨论的,这些方法可以用于多种应用中,包括诊断、发现基因、鉴定 特定细胞和/或组织类型中表达的基因、鉴定特定细胞(例如与病理情 况有关的细胞)中超量表达或表达不足的基因、筛选药剂以鉴定改变基 因表达的药剂(例如治疗剂)、等。而且,通过将使用本发明方法获得 的序列数据和公共数据库中录入的核酸序列比较,常常可以鉴定出可 转录产生特定RNA种类或区段的基因。一般地,为了鉴定出转录产生 RNA的基因,需要约10个核苷酸左右的序列数据。

因此,一个特定方面,本发明提供确定细胞或组织中基因表达谱 的方法,包括(a)从获自细胞或组织的RNA产生至少一群cDNA分子, 其中该群体中的各cDNA分子含有至少两个能够和相同或不同cDNA群 中单个成员上存在的至少一个重组位点发生重组的重组位点;(b)在 导致(a)的核酸分子接合的条件下使这些核酸分子和一或多个重组蛋 白接触;和(c)测定接合的核酸分子的序列。在本发明具体实施方案 中,将这些接合的核酸分子插入在插入位点侧翼含有测序引物结合位 点的载体中。在再其它具体实施方案中,这些接合的cDNA分子被attB 重组位点分开。在其它具体实施方案中,该接合的cDNA分子含有相应 于获自细胞或组织的RNA的约10至约30个核苷酸。

一旦确定了相应于RNA表达产物的cDNA序列后,可以将这些序列 和含有已知基因序列的数据库比较,以确定在该特定细胞和/或组织中 表达了哪些基因以及各基因的表达水平。而且,可以使用本发明方法 测定在特定的条件下基因的表达水平,以确定这些条件是否可以导致 一或多个基因的表达改变。这些条件的例子包括细胞基因表达产物的 活性降低、营养限制和/或缺乏、热休克、低温、与具有低或高离子强 度的溶液接触、暴露于化学剂(例如抗生素、化疗剂、金属离子、诱变 剂等)、电离辐射等。因此,本发明提供方法以鉴定由于特定刺激而表 现出表达改变的基因。

本发明还提供用于鉴定参与细胞代谢(如病理情况)的基因的方 法。例如,本发明方法可以用于确定特定株的细胞或表现出异常表型 的细胞的表达谱。将特定株的细胞或表现出异常表型的细胞的表达谱 与另一株的细胞或未表现出异常表型的细胞(在此称作“参照细胞”) 的表达谱作比较。通过比较特定株的细胞或表现出异常表型的细胞和 适当的参照细胞的基因表达谱,可以确定与该株或异常表型相关的表 达特性。因此,一个特定的方面,本发明提供诊断方法,其中将表现 出异常表型(如癌)的患者细胞的基因表达谱与未表现出异常表型的细 胞的基因表达谱(即参照细胞)进行比较。

另一具体方面,本发明提供筛选治疗剂(例如免疫刺激剂)的方法, 包括(a)将细胞(例如人类细胞)暴露于候选治疗剂,(b)确定该暴露 的细胞的基因表达谱,(c)对该基因表达谱和未暴露于该候选治疗剂 的细胞(即参照细胞)的基因表达谱作比较。本发明还包括通过上述方 法鉴定的治疗剂。

另一方面,本发明提供通过重组将分子和/或化合物或分子和/或 化合物群与其它分子、化合物和/或支持物(优选固体或半固体的)附着 或结合的方法。用于本发明的适当分子和化合物包括,但不限于,蛋 白质、多肽或肽、化学化合物、药物、脂、脂蛋白、糖、激素、类固 醇、抗体(或其部分)、抗原、酶(例如核酸酶、聚合酶等)、多糖、核 苷和其衍生物、核苷酸和其衍生物、氨基酸和其衍生物、脂肪酸、受 体、配体、半抗原、小分子(例如-COOH等活化基团)、结合分子(例如 生物素、亲和素、链霉亲和素、A蛋白、B蛋白等)、生长因子、金属 离子、细胞因子、核酶、或核酸分子(例如RNA、DNA、DNA/RNA杂合体、 cDNA或cDNA文库、双链核酸、单链核酸、线性核酸、环状核酸、超 螺旋核酸等)、和前述两种或多种的组合。在具体实施方案中,可以将 分子直接或间接地和支持物连接在一起。而且,可以通过共价或非共 价方式将分子和支持物连接在一起。为了举例说明的目的,核酸分子 和支持物的间接非共价连接的一个例子是将对核酸分子表现出高度结 合亲和力的蛋白质直接连接在支持物上。然后使含有该蛋白的支持物 和这些核酸分子在适当的条件下接触,从而导致这些核酸分子通过该 蛋白质非共价附着在支持物上。核酸分子/蛋白相互作用的关系可以是 序列特异的或非序列特异的。

另一方面,本发明提供包含(与支持物结合或未结合的)至少一个 第一核酸分子的支持物,其中该第一核酸分子包含一或多个重组位点 或其部分。在具体实施方案中,本发明支持物还包含通过第一核酸分 子上的重组位点而与支持物结合的至少一个第二核酸分子或至少一个 肽或蛋白质分子或其它化合物。

本发明还涉及包含(与支持物结合或未结合的)一或多个选自下组 的成分的本发明支持物:包含至少一个重组位点的一或多个核酸分子、 一或多个重组蛋白、和包含至少一个重组位点的一或多个肽或化合物。

另一方面,本发明提供使一或多个核酸分子、蛋白质或肽分子、 或其它化合物附着或结合支持物的方法,包括(a)获得至少一个包含 至少一个重组位点的核酸分子、蛋白质或肽分子、其它化合物、或这 些分子或化合物的群体,并获得包含至少一个重组位点的支持物;和 (b)使位于该至少一个核酸分子、蛋白质或肽分子、其它化合物、或 这些分子或化合物的群体上的一些或所有重组位点与支持物包含的全 部或部分重组位点发生重组。在本发明具体实施方案中,这些方法还 包括将一或多个核酸分子附着或结合在支持物上。在其它实施方案中, 仅一个核酸分子与支持物直接连接。在再其它具体实施方案中,这些 核酸分子形成微阵列。在甚至更具体的实施方案中,该微阵列形成DNA 芯片。本发明还提供通过上述方法制备的支持物。在具体实施方案中, 本发明支持物是固体或半固体。而且,正如以上讨论的,可以直接或 间接地使核酸分子和支持物连接。也正如以上讨论的,可以通过共价 或非共价方式使核酸分子和支持物连接。此外,可以通过与蛋白质或 小分子(例如具有活化基团如-COOH的分子)的键合,使核酸分子和支 持物连接。而且,可以通过不稳定的或稳定的键合,使核酸分子和支 持物连接。

另一方面,本发明提供将两个或多个目的分子或化合物连接或接 合在一起的方法,包括(a)提供至少第一和第二目的分子或化合物, 每个第一和第二目的分子或化合物均包含至少一个重组位点;(b)使 第一目的分子或化合物的一些或所有重组位点与第二目的分子或化合 物上的一些或所有重组位点发生重组。在本发明具体实施方案中,该 方法还包含将含有重组位点的核酸分子附着在第一和第二目的分子或 化合物。在其它具体实施方案中,至少一个目的分子或化合物包含蛋 白质或肽、核酸、糖、类固醇、或脂。

在一些实施方案中,一或多个本发明化合物和/或分子(例如2、3、 4、5、7、10、12、15、20、30、50等)可以包含一或两个重组位点(例 如2、3、4、5、7、10、12、15、20、30、50等)或其部分。这些分子 和/或化合物可以是未标记的或可以通过本领域熟知方法作可检测标 记。可检测标记包括,但不限于,放射性标记、质量标记(mass label)、 荧光标记、化学发光标记、生物发光标记、和酶标记。使用这些标记 可以允许对支持物上标记分子和/或化合物的存在或不存在进行检测。 因此,一般地,本发明涉及通过重组将任何数量的分子和/或化合物或 分子和/或化合物群附着在支持物上,以及通过此方法制备的支持物。 因此,这些化合物和/或分子可以通过含有重组位点或其部分的核酸接 头与支持物或结构连接。这些接头优选是小接头(例如,长5、20、30、 50、100、200、300、400或500个碱基对)。

因此,本发明包括包含一或多个根据本发明此方面可以使用的重 组位点(或其部分)的支持物。因此,通过重组反应可以使一或多个有 待添加、附着或结合在支持物上的、具有一或多个重组位点或其部分 的核酸分子、或蛋白质、肽和/或其它分子和/或化合物和含有重组位 点的支持物的重组,由此产生含有一或多个目的核酸分子、蛋白质、 肽和/或其它分子和/或化合物的支持物。使目的分子和/或化合物与支 持物结合的重组反应优选在足以造成目的分子和/或化合物上的至少 一个重组位点和支持物上存在的至少一个重组位点发生重组的条件下 通过支持物和目的分子和/或化合物与至少一个重组蛋白的接触而在 体外进行。本发明此方面对于在一或多个支持物(例如2、3、4、5、7、 10、12等)上构建核酸、或蛋白质和/或其它分子和/或化合物的阵列 是尤其有用的,因为通过重组这便于大量相同或不同的目的核酸、或 蛋白质和/或其它分子和/或化合物与支持物或支持物的不同部分的结 合。因此,本发明涉及将一或多个(例如2、3、4、5、7、10、12、15、 20、30、50等)核酸、或蛋白质分子和/或其它分子和/或化合物附着 或结合在支持物上的方法,该方法包括:

(a)获得包含至少一个重组位点的至少第一分子和/或化合物或 分子和/或化合物群(例如本发明起始核酸分子),并获得包含至少一个 重组位点的支持物(它也可以是本发明的起始分子);和

(b)使所述至少第一分子和/或化合物或分子和/或化合物群上的 一些或所有重组位点与支持物上的全部或部分重组位点发生重组。

一旦将分子和/或化合物添加至支持物上后,支持物上这些分子和 /或化合物的存在或不存在或位置都可以(例如通过使用可检测的标记) 得到确定。或者,可以进一步通过熟知技术操作与支持物结合的分子 和/或化合物。

除了根据本发明使一或多个分子和/或化合物与支持物接合外,本 发明还允许对支持物所含一或多个分子和/或化合物进行置换、插入或 缺失。正如本文所讨论的,通过在目的分子和/或化合物内的特异位点 造成重组,可以除去或用另一目的分子或化合物置换分子和/或化合物 的全部或部分。该过程还可以应用于附着在支持物上的具有重组位点 的分子和/或化合物。因此,除了向支持物添加全部或部分分子外,可 以使用重组从支持物上除去或置换目的分子和/或化合物的全部或部 分。

根据本发明,正如本文所述,还操作或分析添加在支持物上的或 从支持物上除去的分子和/或化合物。例如,对与支持物结合的或从支 持物上除去的分子和/或化合物的进一步分析或操作包括测序、杂交 (DNA、RNA等)、扩增、核酸合成、蛋白质或肽表达、蛋白质-DNA相互 作用(双杂种或反向双杂种分析)、与其它分子和/或化合物的相互作用 或结合研究、同源重组或基因打靶、和组合文库分析和操作。这些操 作可以在分子和/或化合物与支持物结合时或在分子和/或化合物自支 持物上被除去后进行。

根据本发明,可以使用任何固体或半固体支持物,而且可以通过 熟知技术添加含有重组位点(或其部分)的序列以便将核酸附着在支持 物上。而且,可以通过本领域熟知技术在目的核酸、蛋白质分子和/ 或其它分子和/或化合物上添加重组位点。而且,任何野生型或突变的 重组位点、或相同或不同的重组位点的组合都可以用来向支持物添加 或从支持物上除去目的分子和/或化合物。

本发明还涉及包含一或多个重组位点(例如2、3、4、5、7、10、 12、15、20、30、50等)或其部分的任何支持物、以及包含与所述支 持物结合的具有一或多个重组位点(或其部分)的核酸、蛋白质分子和/ 或其它分子和/或化合物的支持物。

本发明还涉及包含本发明支持物的组合物。这些组合物还可以包 含一或多个重组蛋白(优选位点特异性重组蛋白)、适当缓冲液(例如用 于进行重组的缓冲液)、核酸、蛋白质分子和/或其它分子和/或化合物 (优选地包含可以不与支持物结合的重组位点)、和任何其它用于使 根据本发明的重组位点(和它们的组合)发生重组的试剂。本发明还涉 及用于进一步操作或分析本发明支持物、或附着于其上的核酸或蛋白 质分子或其它分子和/或化合物的组合物。对这些核酸、蛋白质、和/ 或其它分子和/或化合物的进一步操作和分析可以在它们与支持物结 合时,或在它们自支持物上被除去后进行。这些组合物可以包含适当 的缓冲液和酶如限制性酶、聚合酶、连接酶、重组蛋白等。

另一方面,本发明提供使一或多个(例如2、3、4、5、7、10、12、 15、20、30、50等)分子和/或化合物或分子和/或化合物群与一或多 个相同或不同的分子和/或化合物或分子和/或化合物群附着或结合的 方法。因此,一般地,本发明涉及通过重组对任何数量的分子和/或化 合物或分子和/或化合物群进行连接。正如本文所述,这些连接的分子 和/或化合物可以是未标记的或是可检测标记的。而且,这些连接的分 子和/或化合物可以是通过共价或非共价方式连接的。适当的分子和/ 化合物包括,但不限于,本文描述的那些,如核酸、蛋白质或肽、化 学化合物、药物、脂、脂蛋白、激素等。一方面,可以通过重组,连 接相同分子和/或化合物、或相同类型的分子和/或化合物(例如蛋白质 -蛋白质、核酸-核酸等)。因此,一方面,可以将小分子和/或蛋白质 与重组位点连接起来,然后使它们以各种组合彼此连接。

另一方面,可以通过重组,连接不同的分子和/或化合物、或不同 类型的分子和/或化合物(例如蛋白质-核酸、核酸-配体、蛋白质-配体 等)。此外,还可以按本文所述通过重组将通过重组相连的分子和/或 化合物(例如蛋白质-蛋白质、蛋白质-配体等)附着在支持物或结构上。 由此,通过一或多个重组位点(或其部分)将产生的分子和/或化合物 (任选地与支持物连接的)连接起来。可以使用常规技术将这些重组位 点(或其部分)附着在分子如蛋白质、肽、糖、类固醇和/或脂或它们的 组合上,并可以使用本发明方法将含有重组位点的所获分子和/或化合 物连接起来。而且,所获的相连分子和/或化合物可以通过一或多个重 组位点与包含重组位点的其它分子和/或化合物结合。例如,可以使包 含重组位点的核酸附着于目的分子上,并可以将包含相容重组位点的 第二核酸附着于第二目的核酸上。这些位点间的重组导致这两个分子 通过小的核酸接头连接起来。该核酸接头可以根据需要是任何长度的, 但优选小的接头(例如长约5至约500bp)。使用该方法,可以将蛋白 质、肽、核酸、糖、类固醇和/或脂或它们的组合附着在蛋白质、肽、 核酸、糖、类固醇和/或脂或它们的组合上。因此,本发明提供连接两 个或多个分子和/或化合物的方法,包括步骤:

(a)获得至少第一和第二分子和/或化合物,所述分子和/或化合 物均包含至少一个重组位点(或其部分);和

(b)使所述第一分子和/或化合物上的一些或所有重组位点(或其 部分)与所述第二分子和/或化合物上的全部或部分重组位点(或其部 分)发生重组。

在一些优选实施方案中,可以使用常规偶联技术将重组位点附着 在目的分子上。例如,可以合成包含重组位点的寡核苷酸,以便将一 或多个可以相同或不同的反应性功能部分(例如2、3、4、5、7、10等) 包括在内。适当的反应性功能部分包括,但不限于,氨基、环氧基、 乙烯基、巯基等。包含一或多个反应性功能部分的寡核苷酸的合成对 于本领域是常规的。一旦合成后,包含一或多个反应性功能部分的寡 核苷酸可以被附着在目的分子或化合物上的一或多个(例如2、3、4、 5、7、10等)活性基团上。这些寡核苷酸可以通过一或多个反应性功 能部分与一或多个活性功能基团的反应直接地进行附着。在一些实施 方案中,可以使用能够与寡核苷酸上存在的一或多个反应性功能部分 及目的分子上存在的一或多个活性基团反应的适当连接基团,来实现 该附着。在其它实施方案中,既可以使用直接附着也可以使用通过连 接基团实现的附着。本领域技术人员将明了,寡核苷酸上的反应性功 能部分可以和目的分子和/或化合物上的反应性功能部分相同或不同。 用于将寡核苷酸和目的分子偶联在一起的适当试剂和技术可以参见 Hermanson,生物偶联技术(Bioconjugate Techniques),Academic Press Inc.,San Diego,CA,1996。

本发明还涉及用于实施本发明方法的试剂盒,尤其是用于制备本 发明产物核酸分子或本发明的其它连接分子和/或化合物(例如蛋白质 -蛋白质、核酸-蛋白质等),或制备包含这些产物核酸分子或连接的分 子和/或化合物的支持物的试剂盒。本发明还涉及用于向一或多个支持 物上、或从一或多个支持物上添加和/或除去和/或置换核酸、蛋白质 和/或其它分子和/或化合物的试剂盒、用于制备和使用本发明组合文 库的试剂盒、以及用于根据本发明方法实施同源重组(尤其是基因打靶) 的试剂盒。本发明试剂盒还可以包含用于进一步操作通过本发明方法 产生的含有重组位点的分子和/或化合物的其它成分。本发明试剂盒可 以包含一或多个本发明核酸分子(尤其是包含一或多个重组位点并任 选地包含一或多个反应性功能部分的起始分子)、一或多个本发明分子 和/或化合物、一或多个本发明支持物和/或一或多个本发明载体。这 些试剂盒可以任选地包含一或多个选自下组的其它成分:一或多个宿 主细胞(例如2、3、4、5等)、一或多个用于将分子或化合物(例如通 过转染或转化)引入一或多个宿主细胞中的试剂、一或多个核苷酸、一 或多个聚合酶和/或逆转录酶(例如2、3、4、5等)、一或多个适当的 缓冲液(例如2、3、4、5等)、一或多个引物(例如2、3、4、5、7、 10、12、15、20、30、50等)、一或多个终止剂(例如2、3、4、5、7、 10等)、一或多个用于构建组合文库的分子群(例如2、3、4、5、7、 10、12、15、20、30、50等)、和一或多个组合文库(例如2、3、4、5、 7、10、12、15、20、30、50等)。本发明试剂盒还可以含有实施本发 明的说明或方案。

另一方面,本发明提供用于对核酸区段进行连接、缺失或置换的 试剂盒,这些试剂盒包含至少一个选自下组的成分:(1)一或多个重 组蛋白或包含一或多个重组蛋白的组合物、和(2)至少一个包含一或 多个重组位点的核酸分子(优选具有至少两种不同重组特异性的载 体)。本发明试剂盒还可以包含一或多个选自下组的成分:(a)包含额 外的重组位点的其它核酸分子;(b)一或多个具有连接酶活性的酶; (c)一或多个具有聚合酶活性的酶;(d)一或多个具有逆转录酶活性 的酶;(e)一或多个具有限制性内切核酸酶活性的酶;(f)一或多个 引物;(g)一或多个核酸文库;(h)一或多个支持物;(i)一或多个 缓冲液;(j)一或多个去污剂或含有去污剂的溶液;(k)一或多个核 苷酸;(l)一或多个终止剂;(m)一或多个转染试剂;(n)一或多 个宿主细胞;和(o)使用这些试剂盒成分的说明书

而且,本发明试剂盒可以含有一或多个选自下组的重组蛋白:Cre、 Int、IHF、Xis、Flp、Fis、Hin、Gin、Cin、Tn3解离酶、ΦC31、TndX、 XerC和XerD。

此外,本发明试剂盒的重组位点一般具有不同重组特异性,每个 均包含具有不同的7个碱基对重叠区域的att位点。在本发明具体实 施方案中,这7碱基对重叠区域的头3个核苷酸包含选自下组的核苷 酸序列:AAA,AAC,AAG,

AAT,ACA,ACC,ACG,ACT,AGA,AGC,AGG,AGT,ATA,ATC,ATG;

ATT,CAA,CAC,CAG,CAT,CCA,CCC,CCG,CCT,CGA,CGC,CGG,CGT,

CTA,CTC,CTG CTT,GAA,GAC,GAG,GAT,GCA,GCC,GCG,GCT,GGA,

GGC,GGG,GGT,GTA,GTC,GTG,GTT,TAA,TAC,TAG,TAT,TCA,TCC,

TCG,TCT,TGA,TGC,TGG,TGT,TTA,TTC,TTG,和TTT.

在具体实施方案中,本发明试剂盒含有包含一或多个能够催化att 位点间发生重组的重组蛋白的组合物。在相关实施方案中,这些组合 物包含一或多个能够催化attB×attP(BP)反应、attL×attR(LR)反应、 或BP及LR反应的重组蛋白。

和本发明试剂盒一起提供的核酸文库可以包含cDNA或基因组 DNA。而且,这些文库可以包含编码抗体轻链和重链可变区的多核苷酸。

本发明还涉及用于实施本发明方法的组合物、和在实施本发明方 法时产生的组合物。尤其是,本发明包括通过本发明方法制备的核酸 分子、用于制备含有这些核酸分子的宿主细胞的方法、通过这些方法 制备的宿主细胞、和使用这些宿主细胞来产生这些核酸分子所编码的 产物(例如RNA、蛋白质等)的方法、这些核酸分子所编码的产物(例如 RNA、蛋白质等)。

本发明组合物、方法和试剂盒优选使用λ噬菌体位点特异性重组 系统、更优选使用可从Invitrogen公司,Life Technologies Division(Rockville,Maryland)获得的GATEWAYTM重组克隆系统, 来制备和实施。GATEWAYTM克隆技术说明手册(Invitrogen公司,Life Technologies Division)更详细地描述了这些系统,其完整地并入本 文作为参考。

根据本领域知识、以及根据本发明的以下附图和说明、及权利要 求,本领域普通技术人员将明了本发明的其它优选实施方案。

                      附图简述

图1是基本重组克隆反应的示意图。

图2是使用本发明通过LR重组反应克隆两个核酸区段的示意图。

图3示意了通过使用LR反应将两个核酸区段接合起来、并然后使 用BP重组反应将该接合的片段插入目的载体中,本发明在这些区段的 克隆中的应用。

图4示意了通过在BP反应后实施LR反应,本发明在克隆两个核 酸区段中的应用。

图5是克隆两个具有attB位点的核酸区段的示意图,方式是实施 第一BP反应以在一个区段上产生一个attL位点并在另一区段上产生 一个attR位点,之后通过LR反应将这些区段合并在一起。在该过程 的变体中,P1、P2和/或P3可以是寡核苷酸或线性核苷酸链。

图6是使用LR反应将两个核酸区段克隆在目的载体的两个不同位 点中的示意图。

图7是使用BP反应将两个核酸区段克隆在一个载体的两个不同位 点中的示意图。

图8是使用BR反应将三个核酸区段克隆在三个载体中、使用LR 反应将这三个区段克隆在单一一个载体中、并产生由attB位点分隔开 的区段的示意图。

图9是使用BR反应将三个核酸区段克隆在一个单一载体中并产生 被attR位点分隔开的区段的示意图。

图10是通过重组向支持物(带阴影的框)添加一或多个相同或不同 分子(核酸、蛋白质/肽、糖、和/或其它化合物)的示意图。空白框代 表重组位点。

图11是将多个分子和/或化合物(A和B)接合在一起的示意图。该 图中所用标记与图10中的相应。A和B的添加可以是同时的或是连续 的。

图12是从支持物上缺失掉一部分分子或化合物(A)的示意图。该 图所用标记与图10中的相应。

图13是使用第二分子或化合物(C)置换一部分分子或化合物(A)的 示意图。该图所用标记与图10中的相应。

图14A是质粒图谱,其显示了用于提供与目的基因的C端融合的 结构。supF编码抑制基因功能。因此,当supF表达时,产生GUS-GST 融合蛋白。在此方法的变体中,GUS可以使任何基因。

图14B是用于控制基因抑制和表达的方法的示意图。该T7 RNA聚 合酶基因含有一或多个(显示了两个)琥珀终止密码子(标记为“am”) 代替酪氨酸密码子。从诱导型启动子起始的渗漏(未诱导的)转录产生 的supF不足以导致产生活性T7 RNA聚合酶。诱导后,足量supF的产 生导致活性T7 RNA聚合酶的产生,这造成supF的表达增加,而这又 进一步造成T7 RNA聚合酶的表达增加。T7 RNA聚合酶进一步诱导基 因表达。而且,supF的表达通过抑制干扰性琥珀终止密码子,导致在 基因表达产物上加上了一个C端标签。

图15是质粒图谱,其显示了用于产生目的基因的N和/或C端融 合物的结构。带圆圈的数字代表琥珀、赭石或乳白终止密码子。这些 终止密码子的抑制导致融合标签在N端、C端或两端上的表达。在无 抑制的情况下,产生本来的蛋白质。

图16是使用LR反应将4个独立的DNA区段在一个步骤中插入目 的载体的示意图。具体地,将在5’末端具有attL1位点和在3’末端具 有attL3位点的第一DNA区段与在5’末端具有attR3位点和在3’末端 具有attL4位点的第二DNA区段连接。然后将该第二DNA区段与在5’ 末端具有attR4位点和在3’末端具有attL5位点的第三DNA区段连接。 然后将该第三DNA区段与在5’末端具有attR5位点和在3’末端具有 attL2位点的第四DNA区段连接。由此,通过与LR CLONASETM的反应, 将此第一、二、三和四DNA区段插入含有侧翼有attR1和attR2的ccdB 基因的目的载体中。这些插入的DNA区段通过attB1、attB3、attB4、 attB5和attB2位点彼此分开并与载体序列分开。

图17A和17B显示了构建根据以下在实施例18中陈述的方法制备 的lux操纵子的示意图。根据本发明,可以通过重组置换或缺失该操 纵子的一或多个基因,以构建一或多个修饰的操纵子,然后测试其活 性和/或对宿主细胞的影响。或者,可以在该操纵子的最初构建中使用 其它基因(包括变体和突变体)代替一或多个目的基因,由此产生一或 多个修饰的操纵子。

图18是使用一个两步骤、单载体程序将6个独立的DNA区段插入 载体中的示意图。具体地,将在5’末端具有attL1位点和在3’末端具 有attL3位点的第一DNA区段(DNA-A)与在5’末端具有attR3位点和 在3’末端具有attL4位点的第二DNA区段(DNA-B)连接。然后将该第 二DNA区段与在5’末端具有attR4位点和在3’末端具有attL5位点的 第三DNA区段(DNA-C)连接。将在5’末端具有attR1位点和在3’末端 具有attL3位点的第四DNA区段(DNA-D)与在5’末端具有attR3位点 和在3’末端具有attL4位点的第五DNA区段(DNA-E)连接。然后将该 第五DNA区段与在5’末端具有attR4位点和在3’末端具有attL2位点 的第六DNA区段(DNA-F)连接。然后将获得的两个分子(即 DNA-A-DNA-B-DNA-C和DNA-D-DNA-E-DNA-F)插入该插入载体中。以上 所有反应均由LR CLONASETM催化。并使用LR反应将该连接起来的DNA 区段插入含有侧翼有attR1和attR2位点的ccdB基因的目的载体中。 这些插入的DNA区段通过attB1、attB3、attB4、attB5和attB2位点 彼此分开并与载体序列分开。正如图6所示,例如,可以将该组装在 一起的区段插入连续的或非连续的位点中。

图19是使用两步骤、双载体程序将6个独立的DNA区段插入载体 中的示意图。具体地,将在5’末端具有attB1位点和在3’末端具有 attL3位点的第一DNA区段(DNA-A)与在5’末端具有attR3位点和在3’ 末端具有attL4位点的第二DNA区段(DNA-B)连接。然后将该第二DNA 区段与在5’末端具有attR4位点和在3’末端具有attB5位点的第三 DNA区段(DNA-C)连接。然后将此连接的DNA区段插入含有attP1和 attP5位点的载体中。而且,将在5’末端具有attB5位点和在3’末端 具有attL3位点的第四DNA区段(DNA-D)与在5’末端具有attR3位点 和在3’末端具有attL4位点的第五DNA区段(DNA-E)连接。然后将该 第五DNA区段与在5’末端具有attR4位点和在3’末端具有attB2位点 的第六DNA区段(DNA-F)连接。然后将此连接的DNA区段插入含有 attP1和attP2位点的载体中。

在构建了上述两个载体(每个载体均含有三个插入的DNA区段) 后,使这些质粒和LR CLONASETM反应,以产生含有侧翼有attB位点的 这6个DNA区段(即,B1-DNA-A-B3-DNA-B-B4-DNA-C-B5-DNA- D-B3-B1-DNA-E-B4-DNA-F-B2)的另一质粒。

图20A是含有两个不同DNA插入片段的本发明示例性载体的示意 图,其中这两个DNA插入片段由T7启动子按不同的方向驱动转录。根 据待产生的转录本的类型,DNA-A和/或DNA-B可以处于一定的方向, 以致导致产生有义或反义RNA。

图20B是含有一个DNA插入片段的本发明示例性载体的示意图, 其中所述DNA插入片段由T7启动子按两个不同的方向驱动转录。因此, 由一个启动子驱动转录产生的RNA将是有义RNA,而由另一启动子驱 动转录产生的RNA是反义RNA。

图20C是含有两个不同DNA插入片段的本发明示例性载体的示意 图,其中所述两个DNA插入片段具有相同的核苷酸序列(即DNA-A), 并由两个不同的T7启动子按不同方向驱动转录。在此实施例中,一个 启动子驱动转录而产生的RNA将是有义RNA,而另一启动子驱动转录 而产生的RNA将是反义RNA。

图20D是含有两个DNA插入片段的本发明示例性载体的示意图, 其中所述两个DNA插入片段以相反方向具有相同的核苷酸序列(即 DNA-A),并由一个T7启动子驱动转录。在这两个拷贝的DNA-A和DNA-A 插入片段之间不存在转录终止信号。一个区段的转录产生有义RNA, 而另一区段的转录产生反义RNA。从该载体产生的RNA将出现分子内 杂交,因此将形成具有发夹转的双链分子。

图20E是本发明两个示例性载体的示意图,这两个载体含有具有 相同核苷酸序列(即DNA-A)的DNA插入片段。这些插入片段的转录导 致产生有义和反义RNA,这些RNA然后可以杂交以形成双链RNA分子。

图21A是含有三个插入片段(标记为“启动子”、“编码序列”和 “Kan”)的本发明示例性载体的示意图。在此实施例中,插入的启动 子驱动编码序列的表达。而且插入的DNA区段赋予了含有该载体的宿 主以卡那霉素抗性。正如以下详细讨论的,相当大量的载体成分(例 如选择标记(如卡那霉素抗性基因)盒、ori盒、启动子盒、标签序列 盒等)均可以被插入或用于构建本发明载体。

图21B是含有4个插入片段(标记为“启动子1”、“编码序列1”、 “启动子2”、和“编码序列2”)的本发明示例性载体的示意图。在 此实施例中,启动子1驱动编码序列1表达、而启动子2驱动编码序 列2表达。

图21C是用于同源重组的本发明示例性载体的示意图。该载体含 有4个插入片段,标记为“5’同源区”、“NEO”、“DNA-A”、和“3’ 同源区”。在此实施例中,5’和3’同源区与选出将插入新霉素抗性标 记(“NEO”)和DNA区段(“DNA-A”)的染色体区域同源。可以对此 类靶向载体进行设计,以便对所靶向的核酸分子中存在的核酸进行插 入、缺失和/或置换。

图22A和22B示意了制备本发明靶向载体的方法。

图23显示了采用随机引发第一链逆转录、然后采用随机引发进行 PCR对mRNA的扩增。将这些扩增产物分成n个库,每个库用具有不同 attB位点对的随机引物扩增。“R”后缀显示一些attB位点可以是相 反方向。将具有标准或相反方向的attB位点用于不同的库,以产生以 标准方向或反向连接attB位点的扩增产物。当这些位点与反向attP 位点反应时,在进入克隆(Entry Clone)中形成attR位点而非attL 位点。因此,库与标准或反向attR的反应将产生侧翼有attR和attL 位点的分子的混合物。通过凝胶纯化依大小排列扩增产物,然后采用 GATEWAYTM BP反应对其进行克隆以制备进入克隆,所述进入克隆根据 所用的attB位点和attP位点的取向每个均含有侧翼有attL位点、 attR位点或attL和attR的小插入片段。当将进入克隆混合在一起时, 这些插入克隆形成能够被克隆在适当目的载体中的多联体,产生n个 各被attB位点分隔开的插入片段。对多个多联体进行测序,可以给出 最初样品中存在的mRNA分子的分布情况。

图24A-24C显示了大量适用于本发明方法和组合物的att位点的 序列(SEQ ID NO:1-36)。

图25A-25B显示了大量含有插入片段的进入克隆,所述插入片段 包括N端标签或序列(N-标签)、可读框(ORF)、C端标签或序列(C-标 签)、选择标记(amp)、质粒复制起点(ori)、和其它载体元件(例如loxP 位点)。每个进入克隆的载体元件插入片段的侧翼均有attL或attR 位点,以致这些载体元件可以在LR Clonase反应中连接在一起并形成 新的载体结构(显示在图25B中)。

图26A-26B显示了构建含有任何方向和特异性的attP位点的attP 供体质粒的过程。图26A显示了attP位点在attP供体质粒中的4种 排列,包括2个方向的直接重复和2个方向的反向重复attP位点。图 26A显示的4个attP供体质粒可以作为模板,和特异与attP位点核 心退火的PCR引物一起用于PCR反应,由此在PCR产物的末端产生具 有任何期望特异性的attL或attR位点。对于待构建的每个新attP 供体载体,可以制备两个这样的PCR产物,一个由质粒主链(ori-kan) 组成,而另一个由ccdB和cat基因组成。在LR Clonase反应中使这 些PCR产物一起反应,以产生带有具有任何att位点特异性的任何取 向的attP位点的新质粒。

图27A显示了连接两个核酸区段A和B的方法,将这些区段克隆 在两个相似结构的质粒中。每个区段的侧翼均有两个重组位点。每个 质粒上的其中一个重组位点能够和另一质粒上的它的关连伙伴反应, 而另两个重组位点与存在的任何其它位点均不反应。每个质粒带有一 个独特的复制起点,该复制起点可以是或不是条件型的。每个质粒还 带有正和负选择标记(分别是+smX和smY),使得能够选择除去和选出 与特定标记连接的元件。最后,每个质粒带有适当放置的第三重组位 点(在本例中是loxP),使得能够缺失除去不期望的元件并保留期望的 元件。在本例中,这两个质粒最初通过Gateway LxR反应在L2和R2 融合。这导致区段A和B通过B2重组位点并列,以及sm1和oriB通 过P2重组位点并列。第二个图中显示了主链中位于一系列质粒元件 侧翼的两个loxP位点。加入Cre蛋白将使单个大质粒解离为两个较小 的质粒。这些质粒中的一个将是带有连接的A和B区段以及目前与sm2 和+sm4连接的oriA的期望质粒。其它质粒带有一组非必需的和/或不 期望的元件。转化适当的宿主并随后进行适当的遗传选择,将导致除 去不期望的质粒并同时保留期望质粒。

图27B显示了连接两个嵌合核酸区段A-B和C-D(按以上图27A 中所示构建的)的方法。将这些区段克隆在两个相似结构的质粒中。 每个区段的侧翼均有两个重组位点。每个质粒上的其中一个重组位点 能够和另一质粒上的它的关连伙伴反应,而另两个重组位点与存在的 任何其它位点均不反应。在本例中,这两个质粒最初通过Gateway LxR 反应在L2和R2融合。这导致区段A和B通过B2重组位点并列,以及 sm1和oriB通过P2重组位点并列。第二个图块中显示了主链中位于 一系列质粒元件侧翼的两个loxP位点。加入Cre蛋白将使单个大质粒 解离为两个较小的质粒。这些质粒中的一个将是带有连接的A-B和C-D 区段以及目前与sm2和+sm4连接的oriA的期望质粒。其它质粒带有 一组非必需的和/或不期望的元件。转化适当的宿主并随后进行适当的 遗传选择,将导致除去不期望的质粒并同时保留期望质粒。

                       发明详述 定义

在以下说明中,广泛使用了重组核酸技术中的许多术语。为了清 晰和更为一致地理解说明书和权利要求,包括这些术语被给予的范围, 我们提供以下定义。

基因:本文所用术语“基因”是指含有表达多肽、蛋白质或非翻 译RNA(例如rRNA、tRNA、反义RNA)所必需的信息的核酸。当基因编 码蛋白质时,正如本领域技术人员清楚地知道的,它包括启动子和结 构基因可读框序列(ORF),产生基因产物所需的转录和反义机器不包括 在基因的定义内。当基因编码非翻译RNA时,它包括启动子和编码非 翻译RNA的核酸。

结构基因:本文所用词语“结构基因”是指该核酸可以转录产生 信使RNA,而该信使RNA随后可以翻译出特异多肽特征性的氨基酸序 列。

宿主:本文所用术语“宿主”是指任何可以成为复制型表达载体、 克隆载体、或任何核酸分子的受体的原核或真核生物。该核酸分子可 以含有,但不限于,结构基因、转录调节序列(例如启动子、增强子、 阻遏基因等)和/或复制起点。本文所用术语“宿主”、“宿主细胞”、 “重组宿主”和“重组宿主细胞”可以互换使用。对于这些宿主的例 子,见Maniatis等,分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),Cold Spring Harbor Laboratory,Cold Spring Harbor,纽约(1982)。

转录调节序列:本文所用词语“转录调节序列”是指核酸分子上 含有的任何构型或几何形状的功能性核苷酸链,其作用是调节(1)一或 多个结构基因(例如2、3、4、5、7、10等)转录为信使RNA或(2)一或 多个基因转录为非翻译RNA。转录调节序列的例子包括,但不限于, 启动子、增强子、阻遏基因等。

启动子:本文所用启动子是转录调节序列的一个例子,其明确地 是一般被描述为邻近起始密码子的基因5’区的核酸或编码非翻译RNA 的核酸。邻近核酸区段的转录是在启动子区域起始的。阻遏型启动子 的转录速率将响应阻遏剂而降低。诱导型启动子的转录速率将响应诱 导剂而增加。组成型启动子的转录速率明确地是不受调节的,但它可 以在一般代谢条件的影响下改变。

插入片段:本文所用术语“插入片段”是指作为较大核酸分子一 部分的期望核酸区段。在许多情况下,插入片段将被导入较大的核酸 分子中。例如,图2中标记为ccdB和DNA-A的核酸区段相对于该处所 示的较大核酸分子而言是核酸插入片段。在大多数情况下,插入片段 的侧翼有重组位点(例如每个末端至少一个重组位点)。然而,在某 些实施方案中,插入片段仅在一个末端上含有重组位点。

靶核酸分子:本文所用词语“靶核酸分子”是指目的核酸区段, 优选是有待使用本发明化合物和方法作用的核酸。这些靶核酸分子优 选含有一或多个基因(例如2、3、4、5、7、10、12、15、20、30、50 等)或基因的部分。

插入片段供体:本文所用词语“插入片段供体”是指带有插入片 段的本发明两个亲本核酸分子(例如RNA或DNA)之一(见图1)。插入 片段供体分子包含在两边侧翼有重组位点的插入片段。插入片段供体 可以是线性或环状的。在本发明一个实施方案中,插入片段供体使环 状核酸分子,任选地是超螺旋的,并还在重组信号外包括克隆载体序 列。当使用一群插入片段或一群核酸区段来制备插入片段供体时,获 得一群插入片段供体,并可以根据本发明使用它们。

产物:本文所用术语“术语”是指重组克隆程序中第二个重组事 件后产生的包含A和D序列的一个期望子代分子(见图1)。产物含 有有待克隆或或亚克隆的核酸。根据本发明,当使用一群插入片段供 体时,所获的产物分子群将含有该群插入片段供体的插入片段的全部 或部分,并优选含有插入片段供体的原始分子的代表群。

副产物:本文所用术语“副产物”是指缺少期望进行克隆或亚克 隆的区段的子代分子(重组克隆程序中第二个重组事件后产生的新克 隆)。

共合体(cointegrate):本文所用术语“共合体”是指至少一个 含有两个亲本(起始)分子的本发明重组中间核酸分子。共合体可以是 线性的或环状的。使用适当的宿主细胞株,例如大肠杆菌DB3.1(尤 其是大肠杆菌LIBRARY EFFICIENCYDB3.1TM感受态细胞),并对共合 体分子上存在的两个选择标记进行筛选,可以从共合体表达RNA和多 肽。

识别序列:本文所用词语“识别序列”是指蛋白质、化学化合物、 DNA或RNA分子(例如限制性内切酶、修饰性甲基化酶、或重组酶) 所识别和结合的一段特定序列。本发明中,识别序列通常是指重组位 点。例如,Cre重组酶的识别序列是loxP,它是包含位于一段8碱基 对核心序列两侧的两个13碱基对反向重复(充当重组酶结合位点)的 一段34个碱基对序列。(见Sauer,B.,Current Opinion in Biotechnology 5:521-527(1994)的图1)。识别序列的其它例子有 重组酶λ整合酶所识别的attB、attP、attL、和attR序列。attB是 含有两个9碱基对核心型Int结合位点和一个7碱基对重叠区的约25 碱基对的序列。attP是含有核心型Int结合位点和臂型Int结合位点 以及辅助蛋白质整合宿主因子(IHF)、FIS和切除酶(Xis)的位点的一 段约240个碱基对的序列。(见Landy,Current Opinion in Biotechnology 3:699-707(1993))。根据本发明还可以对这些位点 进行改造以增强本发明方法中产物的产量。当经改造的该位点缺少P1 或H1域以使得重组反应不可逆转(例如attR或attP)时,这些位点 可以被称作attR’或attP’以显示这些位点的这些域已通过某种方式而 被修饰。

重组蛋白(recombination protein):本文所用词语“重组蛋白” 包括切除性或整合性蛋白质、酶、辅因子、或参与涉及一或多个重组 位点(例如2、3、4、5、7、10、12、15、20、30、50等)的重组反 应的相关蛋白,重组蛋白可以是野生型蛋白质(见Landy,Current Opinion in Biotechnology 3:699-707(1993))、或其突变体、衍生 物(例如含有重组蛋白序列或其片段的融合蛋白)、片段和变体。重 组蛋白的例子包括Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、ΦC31、 Cin、Tn3解离酶、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCE1和 ParA。

重组位点:本文所用词语“重组位点”是指参与整合/重组反应的 核酸分子上重组蛋白质的识别序列。重组位点是该参与的核酸分子上 被位点特异性重组蛋白质在整合或重组初期识别和结合的不连续核酸 片段或区段。例如,Cre重组酶的重组位点是loxP,它是由位于一段 8碱基对核心序列两侧的两个13碱基对反向重复(充当重组酶结合位 点)组成的一段34个碱基对序列。见Sauer,B.,Current Opinion in Biotechnology 5:521-527(1994)的图1。识别序列的其它例子包括 此处所述attB、attP、attL、和attR序列,及它们的突变体、片段、 变体和衍生物,这些识别序列被重组蛋白λInt和被辅助蛋白质整合 宿主因子(IHF)、FIS和切除酶(Xis)所识别。见Landy,Current Opinion in Biotechnology 3:699-707(1993)。

可以通过任何多种已知方法向分子添加重组位点。例如,可以通 过平末端连接、使用完全或部分随机引物进行PCR、或使用侧翼有重 组位点的限制性位点将核酸分子插入载体中,从而将重组位点添加到 核酸分子上。

重组克隆:本文所用词语“重组克隆”是指例如描述于美国专利 5,888,732和6,143,557(其内容完整地并入本文作为参考)中的一种 方法,通过该方法核酸分子或这些分子群的区段可以在体外或体内被 交换、插入、置换、替代或修饰。优选地,该克隆方法是一种体外方 法。

阻遏盒:本文所用词语“阻遏盒”是指存在于亚克隆载体中含有 阻遏基因或选择标记的一段核酸区段。

选择标记:本文所用词语“选择标记”是指通常在特定条件下, 允许选出或选择除去含有其的分子(如复制子)或细胞的一段核酸区 段。这些标记可以编码一种活性,例如,但不限于,产生RNA、肽或 蛋白质;或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物 等的结合位点。选择标记的例子包括但不限于:(1)所编码产物提供 对抗毒性化合物(如抗生素)的抗性的核酸区段;(2)所编码产物为 受体细胞中否则将缺少的产物(例如tRNA基因、营养缺陷标记)的核 酸区段;(3)所编码产物抑制基因产物活性的核酸区段;(4)所编码 产物可以容易地得到鉴别(例如,表型标记如β-半乳糖苷酶、绿色荧 光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、蓝色荧光蛋 白(CFP)、和细胞表面蛋白)的核酸区段;(5)与否则将有害于细胞生 存和/或功能的产物结合的核酸区段;(6)抑制以上1-5号所述任何核 酸区段的活性的核酸区段(例如反义寡核苷酸);(7)与修饰底物的 产物(例如限制性内切酶)结合的核酸区段;(8)能够用于分离或鉴定 期望分子的核酸区段(例如特异蛋白质结合位点);(9)编码可能是非 功能性的特异核苷酸序列(例如,用于分子亚群的PCR扩增)的核酸区 段;(10)当缺少时,将直接或间接地赋予对特定化合物的抗性或敏感 性的核酸区段;和/或(11)所编码产物在受体细胞中具有毒性(例如白 喉毒素)或可将相对无毒化合物转化为毒性化合物(例如单纯疱疹病毒 胸苷激酶、胞嘧啶脱氨酶)的核酸区段;(12)抑制含有它们的核酸分 子的复制、分配或遗传力的核酸区段;和/或(13)编码条件型复制功 能,如在某些宿主或宿主细胞株中或在某些环境条件(如温度、营养条 件等)下复制,的核酸区段。

选择方案:本文所用词语“选择方案”是指允许选择、富集、或 鉴定期望核酸分子或接触它们(尤其是混合物中含有进入克隆或载体、 目的载体、供体载体、表达克隆或载体、任何中间物(例如共合体或复 制子)、和/或副产物的产物或多个产物)的宿主细胞的任何方法。一 方面,本发明选择方案依赖于一或多个选择标记。一个实施方案的选 择方案有至少两个在重组克隆过程中连接或未连接的成分。一个成分 是选择标记。另一成分控制该选择标记在体外或体内的表达、或含有 带选择标记的质粒的细胞(或核酸分子例如复制子)的存活。一般地, 此控制元件是选择标记的阻遏物或诱导物,但可以使用其它方式来控 制选择标记的表达或活性。正如本领域技术人员易于明了的,是使用 阻遏物还是激活物将取决于标记是正还是负选择、以及各种核酸区段 的确切排列。在一些优选实施方案中,该选择方案导致选出或富集仅 一或多个期望核酸分子(例如产物)。正如本文所定义的,核酸分子 的选择包括(a)选择或富集期望DNA分子的存在(称作“正选择方 案”),和(b)选择除去或减少非期望DNA分子的核酸分子的存在(称 作“负选择方案”)。

在一个实施方案中,选择方案(可以逆向进行)可以采取三种形 式中的一种,这将参照图1来进行讨论。此处以选择标记和针对它的 阻遏基因作为例子,第一种选出含有区段D和缺少区段C的分子。第 二种选择除去含有区段C的分子并选出含有区段D的分子。第二种形 式的可能实施方案是使核酸区段携带对于体外反应产物待导入的细胞 有毒性的基因。毒性基因可以是表达为毒性基因产物(毒性蛋白质或 RNA)的核酸,或可以是本身自然就具有毒性。(后一情况中,毒性基 因应理解为具有其“可遗传性状”的经典定义。)

这些毒性基因产物的例子是本领域熟知的,包括但不限于限制性 内切酶(如DpnI、Nla3等);细胞凋亡相关基因(如ASK1或bc1-2/ced-9 家族成员);逆转录病毒的基因,包括人免疫缺陷病毒(HIV)的那些基 因;防卫素如NP-1;反向重复或成对的回文DNA序列;噬菌体的裂解 基因如来自ΦX174或噬菌体T4的那些;抗生素敏感基因如rpsL;抗 微生物敏感基因如pheS;质粒致死基因(Killer gene);所产生的基 因产物对细菌有毒的真核转录载体基因如GATA-1;在缺少抑制功能时 杀死宿主的基因,如kicB、ccdB、fx174E(Liu,Q.等,Curr.Biol. 8:1300-1309(1998));及负面影响复制子稳定性和/或复制的其它基 因。或者,毒性基因可以是在体外可选择的,例如限制性位点。

可操作地与诱导型启动子连接的、编码限制性内切核酸酶的许多 基因是已知的,并可以用于本发明。(见,如美国专利4,960,707(DpnI 和DpnII);5,000,333、5,082,784和5,192,675(KpnI);5,147,800 (NgoAIII和NgoAI);5,179,015(FspI和HaeIII);5,200,333(HaeII 和TaqI);5,248,605(HpaII);5,312,746(ClaI);5,231,021和 5,304,480(XhoI和XhoII);5,334,526(AluI);5,470,740(NsiI); 5,534,428(SstI/SacI);5,202,248(NcoI);5,139,942(NdeI); 和5,098,839(PacI)。也参见Wilson,G.G.,Nucl.Acids Res. 19:2539-2566(1991);和Lunnen,K.D.等,Gene 74:25-32(1988)。)

在第二种形式中,区段D带有选择标记。该毒性基因将清除含有 该载体供体、共合体和副产物分子的转化体,同时该选择标记可以用 于选出含有产物的细胞和选择除去仅含有插入片段供体的细胞。

第三种形式选出在同一分子上顺式含有区段A和D的细胞,而非 在不同分子上反式含有这两个区段的细胞。这可以通过分成两个无活 性片段(各在区段A和D上)的选择标记来实现。

这些片段相对重组位点按一定方式排列,以致当这些区段被重组 事件带到一起时,它们可以重新构成一个功能性选择标记。例如,重 组事件可以将启动子和结构核酸分子(例如基因)连接在一起,可以 将一个结构核酸分子的两个片段连接在一起,或可以将编码存活所需 的异二聚体基因产物的核酸分子连接在一起,或可以将一个复制子的 各部分连接在一起。

位点特异性重组酶:本文所用词语“位点特异性重组酶”是指一 类典型至少具有以下4种活性(或其组合)的重组酶:(1)识别特异 核酸序列;(2)切割所述序列;(3)参与链交换的拓扑异构酶活性; 和(4)重新缝合切开的核酸链的连接酶活性。见Sauer,B.,Current Opinions in Biotechnology 5:521-527(1994)。保守性位点特异性 重组不同于同源重组和转座,因为它对于两个参加反应的分子具有高 度的序列特异性。链交换机制涉及在无DNA合成的情况下切割和重新 连接特异核酸序列(Landy,A.(1989)Ann.Rev.Biochem. 58:913-949)。

同源重组:本文所用词语“同源重组”是指核酸分子和相似核苷 酸序列联合并交换核苷酸链的过程。因此,在预定位置上有效地和第 二核酸分子进行同源重组的第一核酸分子的核苷酸序列将具有促进第 一核酸分子和第二核酸分子的预定位置之间交换核苷酸链的核苷酸序 列。因此,第一核酸分子一般将具有足以和第二核酸分子的一部分互 补的核苷酸序列,以便促进核苷酸碱基配对。

同源重组要求两个参与重组的核酸中有同源序列,但不要求任何 特异序列。按以上指出的,正如该词语在此处的使用,发生在例如att 位点等重组位点处的位点特异性重组不被认为是“同源重组”。

载体:本文所用术语“载体”是指为插入片段提供有用的生物学 或生物化学性质的核酸分子(优选DNA)。例子包括质粒、噬菌体、 自主复制序列(ARS)、着丝粒、和其它能够在体外或在宿主细胞中复 制或被复制、或将期望核酸区段递送至宿主细胞内的期望位置的序列。 载体可以具有一或多个限制性内切核酸酶识别位点(例如2、3、4、5、 7、10等),在此位点处可以按可确定的方式切开序列而不失去载体 的必需生物学功能,并且可以将核酸区段插入此位点中以便实现其复 制和克隆。载体还可以提供引物位点(例如用于PCR的引物位点)、 转录和/或翻译起始和/或调节位点、重组信号、复制子、选择标记等。 清楚地,也可以应用不要求使用重组、转座或限制性酶而插入期望核 酸片段的方法(例如,但不限于,PCR片段的尿嘧啶N糖基化酶(UDG) 克隆(美国专利5,334,575和5,888,795,两者均完整地并入本文作为 参考)、T:A克隆等),将片段克隆至克隆载体中以便根据本发明进行 使用。该克隆载体还可以含有一或多个适用于鉴定克隆载体所转化的 细胞的选择标记(例如2、3、4、5、7、10等)。

亚克隆载体:本文所用词语“亚克隆载体”是指优选包括适当复 制子的克隆载体,其包含环状或线性核酸分子。在本发明中,亚克隆 载体(图1的区段D)还可以含有期望并入终产物中以作用于克隆的核 酸插入片段或与之一起作用的功能性和/或调节性元件(图1的区段 A)。该亚克隆载体还可以含有选择标记(优选DNA)。

载体供体:本文所用词语“载体供体”是指本发明两个亲本核酸 分子(例如RNA或DNA)之一,其带有包含了将成为期望产物一部分的 核酸载体的核酸区段。载体供体包含亚克隆载体D(或如果插入片段 供体没有已经含有克隆载体,则可以将其称作克隆载体)和侧翼有重组 位点的区段C(见图1)。区段C和/或D可以含有按上述选择方案有助 于选择期望子代产物分子的元件。重组信号可以相同或不同,并可以 被相同或不同的重组酶作用。此外,载体供体可以是线性或环状的。

引物:本文所用术语“引物”是指可以在核酸分子(例如DNA分子) 的扩增或聚合过程通过共价键合核苷酸单体而被延伸的单链或双链寡 核苷酸。一方面,引物可以是测序引物(例如通用测序引物)。另一 方面,引物可以包含重组位点或其部分。

衔接子:本文所用术语“衔接子”是指包含一或多个重组位点(或 这些重组位点的部分)的寡核苷酸或核酸片段或区段(优选DNA),根 据本发明它们可以被添加在环状或线性插入片段供体分子以及本文所 述其它核酸分子上。当使用重组位点的部分时,缺失的部分可以由插 入片段供体分子提供。这些衔接子可以加在环状或线性分子内的任意 位置上,但优选将衔接子加在线性分子的一或两个末端或近末端。优 选地,将衔接子置于目的特定核酸分子的两边(侧翼)。根据本发明, 可以通过标准重组技术(例如限制性消化和连接),将衔接子添加在目 的核酸分子上。例如,可以通过以下方式将衔接子加在环状分子上: 首先用适当限制性酶消化该分子、将衔接子加在切割位点上并重新形 成在切割位点含有衔接子的环状分子。在其它方面,可以通过同源重 组、RNA分子的整合等来添加衔接子。或者,可以直接将衔接子和线 性分子的一或多个、优选两个末端连接,由此产生在一或两个末端具 有衔接子的线性分子。在本发明一方面,可以将衔接子添加在一群线 性分子(例如经过切割或消化的cDNA文库或基因组DNA)上,以形成在 所述群体的全部或相当大部分分子的一或优选两个末端含有衔接子的 线性分子群。

衔接子引物:本文所用词语“衔接子引物”是指包含一或多个重 组位点(或这些重组位点的部分)的引物分子,根据本发明可以将其添 加在本文所述环状或线性核酸分子上。当使用重组位点的部分时,缺 失的部分可以由本发明核酸分子(例如衔接子)提供。可以将这些衔接 子引物添加在环状或线性分子内的任何位置上,但优选将衔接子引物 添加在线性分子的一或两个末端或近末端。这些衔接子引物的例子以 及根据本发明方法它们的用途显示在本文实施例8中。可以使用这些 衔接子引物在各种情况下通过各种技术将一或多个重组位点或其部分 添加在环状或线性核酸分子上,所述技术包括但不限于扩增(例如 PCR)、连接(例如酶或化学/合成连接)、重组(例如同源或非同源(异常) 重组)等。

模板:本文所用术语“模板”是指待扩增、合成或测序的双链或 单链核酸分子。对于双链DNA分子,优选在可以对这些分子进行扩增、 合成或测序之前将其双链变性以形成第一和第二链,或可以直接使用 该双链分子作为模板。对于单链模板,在适合的条件下与和模板的至 少一部分互补的引物进行杂交,然后具有聚合酶活性的一或多种多肽 (例如2、3、4、5或7种DNA聚合酶和/或逆转录转录酶)可以合成与 该模板的全部或部分互补的分子。或者,对于双链模板,可以联合使 用一或多个转录调节序列(例如2、3、4、5、7或更多个启动子)和一 或多个聚合酶,以制备与模板的全部或部分互补的核酸分子。根据本 发明,新合成的分子可以和最初模板等长或比最初模板短。在新合成 分子的合成或延伸过程中错配掺入或链滑移(strand slippage)可以 导致一或多个错配碱基对。因此,合成的分子不一定完全和模板互补。 此外,可以在合成或扩增过程中使用一群核酸模板以产生一群典型地 代表了初始模板群的核酸分子。

掺入:本文所用术语“掺入”是指成为核酸(如DNA)分子或引物的 一个部分。

文库:本文所用术语“文库”是指核酸分子(环状或线性)的集合。 在一个实施方案中,文库可以包含大量(例如2、3、4、5、7、10、12、 15、20、30、50、100、200、500、1000、5000、或更多个)核酸分子, 这些核酸分子可以或可以不来自于共同的生物、器官、组织或细胞来 源。在另一实施方案中,文库代表生物核酸容量的全部或部分或一个 显著部分(“基因组”文库),或是代表细胞、组织、器官或生物中所 表达核酸分子的全部或部分或一个显著部分(来源于其中的cDNA文库 或区段)的一套核酸分子。文库还可以包含通过从头合成、诱变一或多 个核酸分子等制备的具有随机序列的核酸分子。这些文库可以或可以 不被包含在一或多个载体(例如2、3、4、5、7、10、12、15、20、 30、50等)中。

扩增:本文所用术语“扩增”是指借助一或多种具有聚合酶活性 的多肽(例如1、2、3、4或更多个核酸聚合酶或逆转录酶)、用于增 加核酸分子拷贝数的任何体外方法。核酸扩增导致核苷酸掺入DNA和/ 或RNA分子或引物中,籍此形成一个与模板互补的新核酸分子。所形 成的核酸分子和其模板可以用作模板以合成其它核酸分子。正如本文 所用,一个扩增反应可以由多个核酸复制循环组成。DNA扩增反应包 括例如聚合酶链式反应(PCR)。一个PCR反应可以由5-100个循环的 DNA分子变性及合成组成。

核苷酸:本文所用术语“核苷酸”是指碱基-糖-磷酸的组合。核 苷酸是核酸分子(DNA和RNA)的单体单位。术语核苷酸包括核糖核苷三 磷酸ATP、UTP、CTP、GTP及脱氧核糖核苷三磷酸如dATP、dCTP、dITP、 dUTP、dGTP、dTTP,或它们的衍生物。这些衍生物包括,例如,[αS]dATP、 7-脱氮dGTP和7-脱氮dATP。术语核苷酸在本文中还指双脱氧核糖核 苷三磷酸(ddNTP)和它们的衍生物。双脱氧核糖核苷三磷酸的举例说明 性例子包括,但不限于,ddATP、ddCTP、ddGTP、ddITP和ddTTP。根 据本发明,“核苷酸”可以是未标记的,或可以通过熟知技术作可检 测标记。可检测标记物包括,例如,放射性同位素、荧光标记物、化 学发光标记物、生物发光标记物和酶标记物。

核酸分子:本文所用词语“核酸分子”是指任何长度的连续核苷 酸(核糖NTP、dNTP或ddNTP、或它们的组合)序列,其可以编码全长 多肽或其任何长度的片段、或可以是非编码的。本文所用术语“核酸 分子”和“多核苷酸”可以互换使用并包括RNA和DNA。

寡核苷酸:本文所用术语“寡核苷酸”是指包含一段共价连接的 核苷酸序列的合成或天然分子,所述核苷酸通过一个核苷酸戊糖的3’ 位和相邻核苷酸戊糖的5’位之间的磷酸二酯键连接在一起。

多肽:本文所用术语“多肽”是指任何长度的连续氨基酸序列。 术语“肽”、“寡肽”、或蛋白质”在本文中可以和术语“多肽” 互换使用。

杂交:本文所用术语“杂交”和“进行杂交”是指两个互补单链 核酸分子(RNA和/或DNA)的碱基配对以给出双链分子。正如本文所用, 即使碱基配对并不完全互补,两个核酸分子也可以杂交。因此,只要 使用适当的条件(这是本领域熟知的),错配的碱基并不妨碍两个核 酸分子的杂交。一些方面,“杂交”是在“严紧条件”下进行。“严 紧条件”,该词在本文中用于指42℃在以下溶液中孵育过夜,该溶液 包含:50%甲酰胺、5×SSC(750mM NaCl,75mM柠檬酸三钠)、50mM磷 酸钠(pH 7.6)、5×Denhardt氏溶液、10%葡聚糖硫酸酯、和20μg/ml 经剪切的变性鲑精DNA,之后在0.1×SSC中于约65℃洗涤滤膜。

本文使用的其它重组核酸技术和分子细胞生物学领域术语一般可 以被适用领域的普通技术人员所理解。 概要

本发明涉及重组接合两个或多个区段或核酸分子或其它分子和/ 或化合物(或它们的组合)的方法、组合物和试剂盒。本发明还涉及优 选地通过重组位点或其部分,将该连接的核酸分子或其它分子和/或化 合物附着在一或多个支持物或结构上。因此,一般地,本发明涉及通 过包含一或多个重组位点(例如2、3、4、5、7、10、12、15、20、30、 50等)或其部分的核酸接头连接任何数量的核酸或其它分子和/或化合 物。

根据起始材料,通过本发明产生的连接产物可以包含任何数量的 相同或不同核酸或其它分子和/或化合物。该起始材料包括但不限于包 含一或多个重组位点或其部分的任何核酸(或其衍生物如肽核酸 (PNA))、化学化合物、可检测的标记分子(例如荧光分子和化学发光分 子)、药物、肽或蛋白、脂、糖和其它分子和/或化合物。根据本发明 通过这些重组位点的重组,可以连接任何数量的该起始分子和/或化合 物、或它们的组合,以产生本发明连接产物。此外,可以通过重组缺 失、置换本发明连接产物中的某些部分或成分。

在一些实施方案中,优选通过重组克隆方法以及通过同源重组, 可以将该接合的区段插入不同的核酸分子如载体中。因此,在一些实 施方案中,本发明涉及通过重组反应联合两个或更多个核酸区段(例如 2、3、4、5、7、10、12、15、20、30、50等)并通过重组克隆将该接 合的两个或多个区段插入载体中来构建核酸分子(RNA或DNA)。

在通过重组反应使该接合的核酸分子进一步与其它核酸分子联合 的实施方案中,两个重组事件(即,这些区段的接合和这些区段在载 体中的插入)的时间选择并不是关键的。也就是说,例如,是在插入 载体之前将两个或多个核酸区段接合在一起、还是首先使每个区段上 的一个重组位点与载体上的重组位点反应然后再使这些核酸区段上的 重组位点彼此反应以造成区段的接合,对于本发明不是关键的。而且, 可以将核酸区段克隆在载体的任何一或多个位置中,而且不必彼此相 邻地插入,但在一些实施方案中,优选两个或多个该区段在载体内接 合。

根据本发明,重组克隆允许有效地选择和鉴定含有联合的核酸区 段的分子(尤其是载体)。因此,可以将两个或多个目的核酸区段合并, 并任选地将其插入适于进一步操作该合并的核酸分子的单个载体中。

在一个基本实施方案中,将至少两个核酸区段(每个均包含至少 一个重组位点)和适当的重组蛋白接触,根据重组位点在分子中的位 置,以使这两个分子的全部或部分接合。每个单独的核酸区段可以包 含各种序列,包括但不限于适于用作引物位点的序列(例如可以与测 序引物或扩增引物等引物杂交以起始核酸合成、扩增或测序的序列)、 转录或翻译信号或调节序列如启动子和/或增强子、核糖体结合位点、 Kozak序列、起始密码子、终止信号如终止密码子、复制起点、重组 位点(或其部分)、选择标记、和用以产生(例如N端或C端)融合蛋白 的基因或基因部分如GST、GUS、GFP、YFP、CFP、麦芽糖结合蛋白、6 组氨酸(HIS6)、表位、半抗原等和它们的组合。用于克隆这些区段的 载体也可以包含这些功能序列(例如启动子、引物位点等)。在将包含 这些序列的区段联合起来并最佳地将这些序列克隆在一或多个载体 (例如2、3、4、5、7、10、12、15等)中后,可以以多种方式操作这 些分子,包括对靶核酸分子进行测序或扩增(即,通过使用整合序列所 引入的至少一个引物位点)、突变靶核酸分子(即,通过在靶核酸分子 中或上实施插入、缺失或替换)、通过同源重组插入另一分子中、转录 靶核酸分子、和从靶核酸分子或其部分表达蛋白质(即通过这些区段和 /或载体所含翻译和/或转录信号的表达)。

本发明还涉及使用本文公开的重组克隆方法制备组合文库。因此, 一或多个接合的核酸区段可以包含核酸文库。该文库可以包含例如相 应于编码肽、多肽或蛋白序列的序列排列(permutations)的核酸分 子。可以将这些排列与由单个序列组成的另一核酸区段相接合,或者, 该第二核酸分子也可以是相应于另一肽、多肽或蛋白质序列的排列的 文库,以便这两个区段的接合可以产生代表这两个肽、多肽、或蛋白 质序列的所有排列的所有可能组合的文库。这些核酸区段可以是连续 的或非连续的。组合文库的用途的许多例子是本领域已知的。(见例如 Waterhouse等,Nucleic Acids Res.,1993,第21卷第9期, 2265-2266;Tsurushita等,Gene,1996,第172卷第1期,59-63 页;Persson,Int.Rev.Immunol.1993,10:2-3 153-163;Chanock 等,Infect Agents Dis 1993年6月2:3 118-31;Burioni等,Res Virol 1997 3月-4月148:2 161-4;Leung,Thromb.Haemost.1995 年7月74:1 373-6;Sandhu,Crit.Rev.Biotechnol.1992,12:5-6 437-62和美国专利5,733,743、5,871,907和5,858,657,所有均特 此并入本文作为参考。)

当本发明方法和组合物中所用一或多个核酸区段是突变的时,这 些区段可以含有(1)指定数量的突变或(2)平均指定数量的突变。而 且,可以参考核酸区段本身或表达产物(例如这些核酸区段的多肽) 对这些突变进行记分。例如,可以突变文库的核酸分子,以产生平均 与最初文库的相应核酸分子有至少50%、至少55%、至少60%、至 少65%、至少70%、至少75%、至少80%、至少85%、至少90%、 至少95%、至少96%、至少97%、至少98%、或至少99%一致性的 核酸分子。类似地,可以突变文库的核酸分子,以产生所编码多肽与 最初文库的相应核酸分子所编码的多肽平均有至少50%、至少55%、 至少60%、至少65%、至少70%、至少75%、至少80%、至少85 %、至少90%、至少95%、至少96%、至少97%、至少98%、或至 少99%一致性的核酸分子。 重组位点

用于本发明的重组位点可以是能够充当重组反应底物的任何核 酸。这些重组位点可以是野生型或天然存在的重组位点、或是修饰的、 变异的、衍生的或突变的重组位点。本发明所用重组位点的例子包括, 但不限于,λ噬菌体的重组位点(如attP、attB、attL和attR及它们 的突变体或衍生物)和来自其它噬菌体如phi80、P22、P2、186、P4 和P1的重组位点(包括lox位点如loxP和loxP511)。在以下实施 例9和以前的专利申请(1999年5月28日提交的美国申请60/136,744 和2000年3月2日提交的美国申请09/517,466,特此并入并入作为 参考)中,描述了突变的att位点(例如attB 1-10、attP 1-10、attR 1-10 和attL 1-10)。具有独特特异性的其它重组位点(即,第一位点与其 相应位点重组并且不与具有不同特异性的第二位点重组)是本领域技 术人员已知的,并可以用于实施本发明。可以根据本发明和指定的重 组位点一起使用针对这些系统的相应重组蛋白。提供用于本发明的重 组位点和重组蛋白的其它系统包括酿酒酵母(Saccharomyces cerevisiae)的FLP/FRT系统、解离酶家族(例如γδ、TndX、TnpX、Tn3 解离酶、Hin、Hjc、Gin、SpCCE1、ParA和Cin)、和IS231和其它苏 金芽孢杆菌(Bacillus thuringiensis)的可转座因子。用于本发明 的其它适当重组系统包括大肠杆菌的XerC和XerD重组酶以及psi、 dif和cer重组位点。其它适当的重组位点可以参见颁发给Elledge 和Liu的美国专利5,851,808,特此并入本文作为参考。用于本发明 的优选重组蛋白、和突变的、修饰的、变异的或衍生的重组位点包括 描述于以下文献中的那些:美国专利5,888,732和6,143,557、以及 基于美国临时申请60/108,324(1998年11月13日提交)的美国申请 09/438,358(1999年11月12日提交)、以及基于美国临时申请 60/136,744(1999年5月28日提交的)的美国申请09/517,466(2000 年3月2日提交),以及与可从Invitrogen Corporation,Life Technologies Division(Rockville,MD)获得的GATEWAYTM克隆技 术有关的那些,所有这些文献均引入本文作为参考。

可以用于实施本发明的重组位点的代表性例子包括以上提及的 att位点。本发明人已确定,通过改变7碱基对重叠区域中或邻近的 核苷酸可以构建特异地与其它att位点重组的att位点。因此,适用 于本发明方法、组合物和载体的重组位点包括,但不限于,在15个碱 基对的核心区域(GCTTTTTTATACTAA(SEQ ID NO:37))中具有1、2、3、 4或更多个核苷酸碱基的插入、缺失或替代的那些重组位点,所述核 心区域在所有的4个野生型λatt位点(即attB、attP、attL和attR) 中是一致的(见1998年6月7日提交的美国申请08/663,002(目前是 美国专利5,888,732)和1998年10月23日提交的09/177,387,其更 为详细地描述了该核心区域,其公开完整地并入本文作为参考)。适 用于本发明方法、组合物、和载体的重组位点也包括在该15个碱基对 核心区域(GCTTTTTTATACTAA(SEQ ID NO:37))中具有1、2、3、4或 更多个核苷酸碱基的插入、缺失或替代、并与此15个碱基对核心区域 至少50%一致、至少55%一致、至少60%一致、至少65%一致、至 少70%一致、至少75%一致、至少80%一致、至少85%一致、至少 90%一致、或至少95%一致的那些重组位点。

类似地,attB1、attP1、attL1和attR1的核心区域彼此是一致 的,同样attB2、attP2、attL2和attR2的核心区域是一致的。适用 于本发明的核酸方法还包括那些在该15碱基对核心区域 (GCTTT TTTATACTAA(SEQ ID NO:37))的7个碱基对重叠区(TTTATAC, 其被定义为整合酶蛋白的切割位点并是链交换发生的区域)中包含1、 2、3、4或更多个核苷酸碱基的插入、缺失或替代的重组位点。这些 突变体、片段、变体和衍生物的例子包括,但不限于,以下核酸,该 核酸中(1)此7bp重叠区第1位的胸腺嘧啶缺失或被替代为嘌呤、 胞嘧啶、或腺嘌呤;(2)此7bp重叠区第2位的胸腺嘧啶缺失或被替 代为鸟嘌呤、胞嘧啶、或腺嘌呤;(3)此7bp重叠区第3位的胸腺嘧 啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(4)此7bp重叠区第 4位的腺嘌呤缺失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶;(5)此 7bp重叠区第5位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺 嘌呤;(6)此7bp重叠区第6位的腺嘌呤缺失或被替代为鸟嘌呤、胞 嘧啶、或胸腺嘧啶;(7)此7bp重叠区第7位的胞嘧啶缺失或被替代 为鸟嘌呤、胸腺嘧啶、或腺嘌呤;或此7bp重叠区中具有一或多个此 类缺失和/或替代的任何组合。下表1给出了上述7碱基对核心区域的 核苷酸序列。

正如以下实施例9-12中描述的,我们构建了改变的att位点, 这些位点说明(1)在此7碱基对重叠区的头3个位置内( TTTATAC)实行 替代强烈地影响重组的特异性、(2)在最后4个位置中(TTT ATAC)的替 代仅部分地改变重组特异性、和(3)在此7bp重叠区之外但在该15 个碱基对核心区域中进行的核苷酸替代不影响重组的特异性但影响重 组的效率。因此,本发明的核酸分子和方法包括那些包含或利用了1、 2、3、4、5、6、8、10或更多个重组特异性受到影响的重组位点、尤 其是包含或利用了一或多个(例如1、2、3、4、5、6、8、10、12、20、 30、40、50等)可以基本上相应于该15个碱基对核心区域的7碱基对 重叠区但具有一或多个影响重组特异性的突变的不同重组位点的核酸 分子和方法。尤其有利的此类分子可以包含一段共有序列例如 NNNATAC,其中“N”是指任何核苷酸(即,可以是A、G、T/U或C)。 优选地,如果该共有序列中头3个核苷酸的一个是T/U,那么该头3 个核苷酸的其它两个中的至少一个不是T/U。

可以将每个att位点(attB、attP、attL和attR)的核心序列分成 由整合酶结合位点、整合酶切割位点和决定特异性的序列组成的功能 单位。正如以下实施例12中讨论的,整合酶顶端链(top strand)切割 位点后的头3个位置被定义为特异性决定因子。在以下参考序列中用 下划线显示了这3个位置:CAACTTT TTTATACAAAGTTG(SEQ ID NO:38)。 表1显示了这3个位置的以下修饰(64种可能组合),该修饰可以用于 制备能够以高度特异性和其它在此7碱基对重叠区头3个核苷酸具有 相同序列的att位点重组的att位点。  表1.att位点7碱基对重叠区头3个核苷酸中改变重组特异                    性的修饰  AAA  AAC  AAG  AAT  ACA  ACC  ACG  ACT  AGA  AGC  AGG  AGT  ATA  ATC  ATG  ATT  CAA  CAC  CAG  CAT  CCA  CCC  CCG  CCT  CGA  CGC  CGG  CGT  CTA  CTC  CTG  CTT  GAA  GAC  GAG  GAT  GCA  GCC  GCG  GCT  GGA  GGC  GGG  GGT  GTA  GTC  GTG  GTT  TAA  TAC  TAG  TAT  TCA  TCC  TCG  TCT  TGA  TGC  TGG  TGT  TTA  TTC  TTG  TTT

表2显示了适用于本发明方法、组合物和载体的att位点7碱基 对重叠区的代表性例子。本发明还包括包含一或多个(例如1、2、3、 4、5、6、8、10、20、30、40、50等)表2所列核苷酸序列的核苷酸 分子。因此,例如,一方面,本发明提供包含核苷酸序列GAAATAC、 GATATAC、ACAATAC或TGCATAC的核酸分子。然而,在某些实施方案中, 本发明不包括包含了本文图24A-24C中或实施例9中所给att位点核 心区的核酸分子。  表2.适用于本发明的att位点7碱基对重叠区的代表性例子  AAAATAC  AACATAC  AAGATAC  AATATAC  ACAATAC  ACCATAC  ACGATAC  ACTATAC  AGAATAC  AGCATAC  AGGATAC  AGTATAC  ATAATAC  ATCATAC  ATGATAC  ATTATAC  CAAATAC  CACATAC  CAGATAC  CATATAC  CCAATAC  CCCATAC  CCGATAC  CCTATAC  CGAATAC  CGCATAC  CGGATAC  CGTATAC  CTAATAC  CTCATAC  CTGATAC  CTTATAC  GAAATAC  GACATAC  GAGATAC  GATATAC  GCAATAC  GCCATAC  GCGATAC  GCTATAC  GGAATAC  GGCATAC  GGGATAC  GGTATAC  GTAATAC  GTCATAC  GTGATAC  GTTATAC  TAAATAC  TACATAC  TAGATAC  TATATAC  TCAATAC  TCCATAC  TCGATAC  TCTATAC  TGAATAC  TGCATAC  TGGATAC  TGTATAC  TTAATAC  TTCATAC  TTGATAC  TTTATAC

正如以上提及的,改变位于上述3个碱基对区3’端的核苷酸也可 以影响重组特异性。例如,在该7碱基对重叠区的最后4个位置中进 行改变也可以影响重组特异性。

因此,本发明提供可以和关连伙伴重组的重组位点、以及含有这 些重组位点的分子和制备、鉴定和使用这些位点的方法。以下实施例 12中给出了可以用于鉴定这些位点的方法。这些重组位点的例子包括 含有与关连伙伴联合并重组的7碱基对重叠区的att位点。上表2中 给出了这些7碱基对重叠区的具体例子的核苷酸序列。

本发明其它实施方案包括分离的核酸分子,该分离的核酸分子包 含与上表2给出的7bp重叠区核苷酸序列或SEQ ID NO:37所示15 碱基对核心区至少50%一致、至少60%一致、至少70%一致、至少 75%一致、至少80%一致、至少85%一致、至少90%一致、或至少 95%一致的核苷酸序列,以及与任何这些核苷酸序列或其片段、变体、 突变体、和衍生物互补的核苷酸序列。

具有与编码特定重组位点或其部分的参考核苷酸序列例如至少95 %  “一致”的核苷酸序列的多核苷酸,是指除了该多核苷酸序列可以 在参考核苷酸序列的每100个核苷酸中包括至多5个点突变(例如插 入、替换或缺失)外,该多核苷酸的核苷酸序列与参考序列是一致的。 例如,为了获得具有与参考attB1核苷酸序列(SEQ ID NO:5)至少95 %一致的核苷酸序列的多核苷酸,可以在attB1参考序列中缺失或用 另一核苷酸替代至多5%的核苷酸,或可以在attB1参考序列中插入 高达attB1参考序列总核苷酸5%数量的核苷酸。该参考序列的这些 突变可以发生在参考核苷酸序列的5’或3’端位置上或那些末端位置之 间的任何位置上,或单个地散布在参考序列的核苷酸中或散布在参考 序列的一或多个连续组中。

实际上,可以使用已知计算机程序如DNAsis软件(Hitachi Software,San Bruno,California)进行初期序列比对并随后使用 ESEE 3.0版DNA/蛋白质序列软件(cabot@trog.mbb.sfu.ca)进行多 序列比对,常规地确定任何具体的核酸分子是否与例如给定的重组位 点核苷酸序列或其部分有至少50%、60%、70%、75%、80%、85%、 90%、95%、96%、97%、98%或99%一致性。或者,可以使用BESTFIT 程序(Wisconsin Sequence Analysis Package,Genetics Computer Group,University Research Park,575 Science Drive,Madison, WI 53711)来确定,其中该程序使用局部同源性算法(Smith和 Waterman,Advances in Applied Mathematics 2:482-489(1981)) 寻找两个序列之间的最佳同源区段。根据本发明,当使用DNAsis、 ESEE、BESTFIF或任何其它序列比对程序来确定特定序列是否与参考 序列有例如95%一致性时,设置参数以便就全长参考核苷酸序列计算 一致性百分数并允许在同源性中有达到参考序列核苷酸总数5%的空 缺区(gap)。

正如以上提及,一方面,本发明还提供构建和/或鉴定适合与本发 明核酸分子一起使用的重组位点方法,以及通过这些方法构建和/或鉴 定的重组位点。简而言之,本发明提供构建和/或鉴定能够和其它重组 位点重组的重组位点的方法。例如,本发明提供构建重组位点并鉴定 这些重组位点是否与其它重组位点重组的方法。针对重组活性或特异 性而筛选出的重组位点可以通过任何多种方法来构建,包括定点诱变 和随机核酸合成。

本发明还提供经历一次重组后以低频率(例如在随后的重组反应 中具有降低了至少5倍、至少10倍、至少50倍、至少100倍、或至 少1000倍的重组活性)发生重组或基本上不能发生重组的“单次使用” 重组位点。本发明还提供制备和使用含有该单次使用重组位点的核酸 分子的方法和含有这些位点的分子。以下给出了可以用于产生和确定 该单次使用重组位点的方法的例子。

att系统核心整合酶结合位点包含一个具有以下核苷酸序列的被 中断的7碱基对反向重复:

        ------>.......<------

         caactttnnnnnnnaaa gttg(SEQ ID NO:39), 以及其可包含完全或非完全重复的变体。

可以将此重复元件再分为两个由caac/gttg区段(下划线)(位于 中心未限定序列(用字母“n”表示的核苷酸)远侧)、和ttt/aaa区段 (位于中心未指定序列近侧)组成的远端和/或近端“域”。

改变中心未限定区一边或两边的远端和/或近端域的序列组成可 以影响重组反应的结果。影响的范围和程度是所产生的具体改变以及 特定重组事件(例如LR对BP反应)的函数。

例如,可以认为经改变而具有以下核苷酸序列的attB位点

   ------>.......<------

   caactttnnnnnnnaaacaag(SEQ ID NO:40), 可以和关连attP发生功能性相互作用,并产生attL和attR。然而, 后两个重组位点不论那一个获得了含有“caag”(位于以上所示序列的 左边)的区段都将在随后的重组事件中丧失功能。以上仅是能够在参与 单次重组事件后造成att位点失去功能的核心整合酶结合序列中多种 可能改变的一种。因此,可以通过改变毗邻att位点7碱基对重叠区 的7碱基对反向重复区的核苷酸,产生单次使用重组位点。该区域示 意如下:

CAAC TTT[7碱基对重叠区]AAA GTTG。

在构建单次使用重组位点时,可以完全地缺失或用其它核苷酸替 代序列CAACTTT或AAAGTTG(即7碱基对反向重复区)的1、2、3、4 或更多个核苷酸。这些7碱基对反向重复区相对于彼此而言是互补序 列。因此,可以在任一7碱基对反向区中作改变以便产生单次使用重 组位点。而且,当DNA是双链并存在一个7碱基对反向重复区时,在 另一链上也存在另一7碱基对反向重复区。

使用序列CAACTTT进行举例说明,可以形成单次使用重组位点的7 碱基对反向重组区的例子包括,但不限于如下核酸分子,该核酸分子 中(1)此7碱基对反向重复区第1位的胞嘧啶缺失或被替代为鸟嘌呤、 腺嘌呤、或胸腺嘧啶;(2)此7碱基对反向重复区第2位的腺嘌呤缺 失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶;(3)此7碱基对反向重 复区第3位的腺嘌呤缺失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶; (4)此7碱基对反向重复区第4位的胞嘧啶缺失或被替代为鸟嘌呤、 腺嘌呤、或胸腺嘧啶;(5)此7碱基对反向重复区第5位的胸腺嘧啶 缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(6)此7碱基对反向重 复区第6位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤; (7)此7碱基对反向重复区第7位的胸腺嘧啶缺失或被替代为鸟嘌呤、 胞嘧啶、或腺嘌呤;或此7碱基对反向重复区中具有1、2、3、4或更 多个此类缺失和/或替代的任何组合。下表3给出了上述7碱基对反向 区域的核苷酸序列的代表性例子。  表3  aagaaaa  ccgccac  ggtggga  ttctttg  aatacac  cctcgga  ggcgaaa  ttgtcac  acaagga  caccttg  gaggcac  tattgga  agaaaaa  cgcccac  gcgggga  tcttttg  ataacac  ctccaaa  gtgggga  tgttttg  aagagcg  ccgcctc  ggtgctc  ttctctc  aatagcg  cctcccg  ggcgccg  ttgtgcg  acaaccg  caccaga  gagggcg  tattaga  agaaaga  cgccctc  gcgggcg  tcttccg  ataactc  ctccgcg  gtggccg  tgttctc  aagagaa  ccgcaca  ggtgata  ttctgaa  aataaca  cctcaca  ggcggaa  ttgtaca  acaaata  caccgaa  gaggaca  tattaca  agaagaa  cgccaca  gcggata  tcttgaa  ataaaca  ctccata  gtgggaa  tgttaca  aagatat  ccgcttt  ggtgtat  ttctttt  aatatat  cctcttt  ggcgtat  ttgtttt  acaattt  cacctat  gaggttt  tatttat  agaattt  cgccttt  gcggtat  tcttttt  ataattt  ctcctat  gtggtat  tgttttt

形成单次使用重组位点的核苷酸序列的代表性例子也可以通过将 表4第1部分中给出了核苷酸序列与表4第2部分给出的核苷酸序列 进行组合来制备。也可以通过在这些区域内部插入一或多个(例如1、 2、3、4、5、6、7等)核苷酸,制备单次使用重组位点。  表4  第1部分(CAAG)  第2部分(TTT)  aaaa  cccc  gggg  tttt  aaac  ccca  ggga  ttta  aaag  ccct  gggc  tttc  aaat  cccg  gggt  tttg  aaca  ccac  ggag  ttat  aaga  ccgc  ggtg  ttct  aata  cctc  ggcg  ttgt  acaa  cacc  gagg  tatt  agaa  cgcc  gcgg  tctt  ataa  ctcc  gtgg  tgtt  caaa  accc  aggg  attt  gaaa  gccc  CGG   cttt  taaa  tccc  tggg  gttt  aaa   cca  ttc  aac   cac  ttg  aag   cgc  tat  aat   ctc  tct  aca   ggg  tgt  aga   gga  ata   ggc  caa   ggt  gaa   gag  taa   gcg  ccc   gtg  ccg   ttt  cct   tta

在对于特定核酸区段而言需要防止重组事件的大多数情况下,可 以将改变的序列定位在该核酸区段的近侧。使用以下简图进行举例说 明: =5’核酸区段3’=caac ttt[7碱基对重叠区]AAA GTTG,小写核苷 酸序列代表7碱基对反向重组序列(即caac ttt),当寻求防止在所示 核酸区段3’末端(即相对于该核苷酸区段的近侧末端)发生重组时,该 序列一般具有经插入、缺失和/或替代以形成单次使用重组位点的序 列。因此,例如,可以使用单次重组反应以将核酸区段整合在另一核 酸分子中,然后该重组位点将有效地丧失功能从而防止该位点参与其 它的重组反应。类似地,可以将单次重组位点放置在核酸区段的两个 末端以便可以将该核酸区段整合在另一核酸分子中、或环化,并且甚 至在重组酶存在时仍保持整合或环化。

可以使用多种方法就功能活性(如经过一次重组事件后不能再经 历随后的重组事件)筛选潜在的单次使用重组位点。例如,对于筛选重 组位点以鉴定在单次重组事件后丧失功能的那些重组位点而言,可以 进行第一重组反应以产生其中负选择标记与一或多个潜在缺陷性重组 位点连接的质粒。然后可以使该质粒和包含类似地连接重组位点的正 选择标记的另一核酸分子反应。因此,设计该选择系统以便重组的分 子对阴性筛选敏感并通过正选择选出不发生重组的分子。使用该系统, 然后可以直接地选出期望的单次使用核心位点突变体。

本领域技术人员将明了,可以设计多种筛选试验,以获得与上述 结果相同的结果。在许多情况下,可以对这些试验进行设计以便发生 初次重组事件、然后鉴定不能参与随后重组事件的重组位点或选出含 有这些重组位点的分子。相关筛选试验将导致选择除去参与第二重组 事件的核酸分子。而且,正如以上提及的,可以设计筛选试验,以便 选择除去参与随后重组事件的分子并选出不参与随后重组事件的那些 分子。

在使大量的核酸区段彼此附着或实施多个重组反应时,单次使用 的重组位点对于降低重组频率或防止重组是尤其有用的,因此,本发 明还包括含有单次使用的重组位点的核酸分子、以及使用这些位点实 施重组的方法。 本发明核酸分子的构建和用途

正如以下更详细讨论的,一方面,本发明提供了一个用于构建具 有特定功能或活性的核酸分子的模式系统。本发明还提供使核酸分子 群和一或多个已知或未知目的靶序列(例如2、3、4、5、7、10、12、 15、20、30、50个等)或和其它核酸分子群(已知或未知的)联合的方 法,由此产生组合分子群(例如组合文库),从该组合分子群中可以获 得独特的和/或新的分子(例如杂合分子)以及这些分子所编码的蛋白 质或肽,并可以对它们作进一步分析。

本发明还包括制备含有一个以上核酸插入片段(例如2、3、4、5、 6、8、10、12、15、20、30、40、50等个插入片段)的载体的方法。 本发明一个普通实施方案中,本发明载体是按以下方式制备的。获得 最终将插入目的载体中的核酸分子(例如购买、通过PCR产生或通过使 用逆转录酶制备cDNA来产生)。适当的重组位点或可以在合成过程中 掺入核酸分子的5’和3’末端、或可以在之后添加。在设法制备含有多 核酸插入片段的载体时,可以在一个反应混合物中或在一系列反应混 合物中将这些插入片段插入载体中。例如,正如图16所示,可以将多 个核酸区段末端对末端连接、并通过在例如单个反应混合物中进行的 反应将其插入载体中。可以对该反应混合物中的这些核酸区段进行设 计,以便5’和3’末端的重组位点可以导致这些核酸区段按特定的顺序 以及特定的5’至3’取向插入目标载体中。或者,可以设计核酸区段, 以便在不考虑顺序、取向(即5’至3’取向)、插入片段的数量、和/或插 入片段的数量和/或双重插入片段的数量的情况下将其插入目的载体 中。

而且,在某些情况下,一或多个此核酸区段将仅在一个末端具有 重组位点。而且,如果期望的话,此末端或这些末端可以通过使用例 如连接酶或拓扑异构酶与其它核酸区段相连接。作为例子,在5’端具 有attR1位点的线性核酸分子可以和含有侧翼有attL1位点和attL2 位点的ccdB基因的目的载体重组。在LR反应之前、期间或之后,可 以例如通过限制性酶在ccdB基因相反侧的attR2位点一边上切割目的 载体。因此,目的载体可以在切割和经历重组后成为线性的。而且, 核酸分子的attR1位点将与目的载体的attL1位点重组,产生含有该 核酸分子的线性载体。然后可以使用酶如连接酶或拓扑异构酶将所获 线性产物环化。

使用图16所示实施方案举例说明本发明的另一方面,5’末端具 有attL1位点而3’末端具有attL3位点的第一DNA片段通过重组与5’ 末端具有attR3位点而3’末端具有attL4位点的第二DNA片段附着。 5’末端具有attR4位点而3’末端具有attL5位点的第三DNA片段通过 重组与3’末端具有attL4位点的第二DNA片段附着。5’末端具有attR5 位点而3’末端具有attL2位点的第四DNA片段通过重组与3’末端具有 attL5位点的第三DNA片段附着。目的载体含有位于ccdB基因侧翼的 attR1位点和attR2位点。因此,当与LR CLONASETM反应时,可以将 第1、2、3和4DNA区段插入插入载体中,并以attB1、attB3、attB4、 attB5和attB2位点作为侧翼或被这些位点分开。图17A-17B显示了 组装lus操纵子所涉及到的相似程序,以下实施例18对此进行了描述。

本领域技术人员将明了,图16所示程序可以有多种变化。例如, 可以使用attB、attP、attL和attR位点、以及其它重组位点的各种 组合。类似地,可以使用各种选择标记、复制起点、启动子和其它遗 传元件。而且,可以在这些载体中加上允许整合在真核染色体中的区 域(例如可转座因子)。

图18显示了将多个DNA区段插入载体中的多反应方法的一个例 子。在此示例性实施方案中,三个DNA区段在两个不同的反应混合物 中彼此重组。然后在利于这两个反应混合物的产物之间发生重组并且 利于连接产物插入载体(例如目的载体)中的条件下,将这些混合物中 产生的产物混合在一起。该实施方案的优点是:(1)可以将DNA区段 直接插入目的载体中而不需要预先插入另一载体中;和(2)可以使用相 同的att位点以及其它重组位点制备各连接的DNA区段以便将其插入 载体。

本领域技术人员明了,本文所述方法可以有多种变体。例如,可 以使用单次重组位点连接各核酸区段。因此,消除或降低了与核酸区 段阵列参与不期望的重组反应有关的潜在问题。而且,可以使用上述 程序通过各种途径将大量核酸分子个体连接在一起。例如,可以随机 地、或按特定顺序,在考虑或不考虑区段的5’至3’方向的情况下,连 接核酸区段。

而且,可以将一或多个核酸区段的相同拷贝掺入另一核酸分子中。 因此,本发明还提供含有多拷贝的单个核酸区段的核酸分子。而且, 可以使用对位于这些区段5’和3’末端的重组位点的筛选,确定连接然 后插入例如载体中的相同核酸区段的确切数目。然后可以将这些载体 插入宿主细胞,在该宿主细胞中它们能够例如自主复制或整合在通常 位于宿主细胞内的一或多个核酸分子中(例如通过位点特异性重组或 同源重组整合)。

含有多拷贝核酸分子区段的核酸分子可以用于例如扩增特定基因 的拷贝数。因此,本发明还提供基因扩增方法,含有多拷贝核酸区段 的核酸分子、和含有本发明核酸分子的宿主细胞。

作为另一实例,可以使用本发明方法将两个不同的核酸区段连接 起来。例如,可以将重组位点放置在这些区段上,以便这些区段交替 连接(例如区段A+区段B+区段A+区段B,等)。当需要使用增加拷贝数 的核酸来增加产生的表达产物的量时,具有此结构的核酸分子是尤其 有用的。在此情况下,“区段A”可以例如是包含ORF的核酸分子。 因此,可以制备含有上述结构并且在缺少诱导信号时不表达实质量的 区段B产物但在诱导时产生高水平的该产物的细胞。当区段B表达产 物对细胞有毒性时,该系统尤其有用。因此,可以使用上述方法构建 并在不存在区段B表达产物导致的破坏性影响的情况下维持含有区段 B的细胞。而且,然后可以使用对位于区段B中的ORF的诱导表达, 以便例如瞬时产生高水平的区段B表达产物。

图19显示了将多个DNA区段插入载体的多步骤方法的另一实例。 在此实施方案中,在不同的重组反应中使三个DNA区段彼此连接,然 后使用LR和BP CLONASETM反应将它们插入不同的载体中。在构建了这 两个载体后,使用LR反应将插入的DNA区段转移至另一载体中。这就 导致所有的6个DNA区段插在单个目的载体中。本领域技术人员明了, 图19所示方法可以有多种变体并且这些变体包括在本发明范围内。

使用本发明方法可以在一个步骤中连接的基因数目一般被可以使 用的具有不同特异性的重组位点的数目所限制。而且,正如上述以及 图18和19所示意的,可以选择重组位点以便在一个反应中连接核酸 区段并且其在之后的反应中不参与重组。例如,再次使用图18所给方 法作为参考,可以使用attL和attR位点和LR ClonaseTM制备一系列 有序的核酸区段多联体。然后可以将这些多联体彼此连接,并任选地, 使用其它LR反应和其它核酸分子连接。该方法可以有多种变体。

类似地,可以使用单次使用的重组位点防止核酸区段(一旦掺入 另一核酸分子中后)参与随后的重组反应。单次重组位点的使用使得 可以从基本上无限数量的单个核酸区段制备产生核酸分子。

一方面,本发明还提供使在单个群体中的核酸分子彼此联合或与 其它分子或其它分子群联合,籍此产生组合分子的方法,从所述组合 分子还可以获得独特和/或新的分子(例如杂合分子)或这些分子编码 的蛋白质或肽。本发明还为筛选核酸分子群以鉴定具有特定活性或编 码具有特定活性的表达产物(例如RNA或多肽)的那些核酸分子提供了 方法。因此,本发明方法可以用于将编码功能域(例如SH3、域、抗体 结合位点、跨膜域、信号肽、酶活性位点)的核酸区段按各种组合彼此 联合起来并可以用于鉴定这些方法产生的具有特定活性的产物。

例如,可以通过以下方法鉴定含有转录调节序列的核酸区段。对 基因组DNA文库的核酸分子进行修饰以便在其5’和3’端含有重组位 点。然后将这些核酸分子插入目的载体中,以便它们位于选择标记的 5’。由此,当载体中选择标记与激活其转录的核酸分子可操作连接时, 选择标记将表达。因此,本发明还提供能够激活转录的分离的核酸分 子。在许多情况下,可以使用本发明的方法和/或组合物,鉴定激活转 录的这些核酸分子。

而且,由于一些转录调节序列以组织特异性方式激活基因表达, 因此可以使用本发明方法鉴定组织特异性转录调节序列。例如,当需 要鉴定在特定类型细胞或组织中激活转录的转录调节序列时,可以在 该类细胞或组织的细胞中实施上述筛选程序。类似地,当需要鉴定在 特定时间、特定发育阶段、或特定孵育条件(例如特定温度)下细胞中 激活转录的调节序列时,可以在适当时间、在特定发育阶段或在特定 孵育条件下在细胞中实施上述筛选程序。一旦使用该方法鉴定出激活 转录的序列后,可以测试该转录调节序列以确定其是否能够在其它细 胞类型或在非鉴定和/或选择其的条件下激活转录。因此,一个一般方 面,本发明提供构建和/或鉴定转录调节序列的方法、以及含有与编码 表达产物的核酸区段可操作连接的通过本发明方法鉴定的转录调节序 列的核酸分子、以及制备这些分子的方法。

也可以使用类似于上述方法的方法鉴定复制起点。因此,本发明 提供鉴定含有复制起点的核酸分子的方法、以及含有本发明方法鉴定 的复制起点的核酸分子、和制备这些分子的方法。

正如以下实施例1所述,因此,本发明尤其适合于构建组合文库。 例如,还可以使用本发明方法“改组”编码蛋白质域和区的核酸分子 以产生能够用于表达具有特定性质或活性的蛋白质的新核酸分子。在 此实施方案中,将编码蛋白质部分的核酸区段接合起来并然后就一或 多种性质或活性进行筛选。

这些组合文库中的核酸区段可以按多种方法来制备,包括逆转录 mRNA。可以使用诸如易错PCR等方法,产生这些文库的核酸区段的改 变形式。在许多应用中,可能期望这些文库中的核酸区段编码蛋白质 的亚部分。在此时,可以调整这些方法以产生其中大多数不含全长ORF 的核酸区段群。例如,这可以通过剪切cDNA文库然后分离剪切的分子 (例如使用聚丙烯酰胺或琼脂糖凝胶电泳)来实现。然后可以对长度在 例如300-600核苷酸的片段(潜在地编码100-200个氨基酸残基的片 段)进行重组并使之插入载体中与转录调节序列可操作地连接。然后 可以筛选该组合文库的各成员多肽表达产物,以鉴定具有特定性质或 活性的那些。

本发明还提供使用来源于基因组DNA的外显子核酸制备组合文库 的方法。外显子/内含子拼接边界是本领域已知的;因此,可以使用常 规、本领域已知的方法无需过度实验,即可鉴定出外显子在基因组DNA 中的定位。而且,可以使用相应于内含子/外显子拼接边界的引物产生 相应于外显子序列的核酸分子。而且,然后可以将这些核酸分子彼此 连接以产生包含相应于外显子序列的核酸分子的组合文库。例如,可 以使用相应于内含子/外显子拼接边界的引物,通过PCR产生相应于外 显子序列的核酸分子。然后可以使用连接酶或使用含有重组位点的引 物扩增这些序列,将重组位点添加在所获PCR产物的末端。然后可以 使用重组反应使这些PCR产物彼此连接并将其插入表达载体中。然后 可以对所获组合文库进行筛选以便鉴定出例如编码具有特定功能或活 性的多肽的核酸分子。而且,可以通过本文其它地方所述的方法通过 拼接除去组合文库核酸分子表达产物(例如RNA或蛋白质)中的重组位 点。

而且,用于产生组合文库的核酸分子、以及组合文库本身可以经 突变产生与相应原始核酸分子平均至少50%、至少55%、至少60%、 至少65%、至少70%、至少75%、至少80%、至少85%、至少90 %、至少95%、至少96%、至少97%、至少98%、或至少99%一致 的核酸分子。类似地,用于产生组合文库的核酸分子可以经突变产生 所编码多肽与相应原始核酸分子所编码多肽平均至少50%、至少55 %、至少60%、至少65%、至少70%、至少75%、至少80%、至少 85%、至少90%、至少95%、至少96%、至少97%、至少98%、或 至少99%一致的核酸分子。

一方面,本发明提供制备和鉴定生物学过程或生物学途径的显性/ 失活抑制基因(dominant/negative suppressors)的方法。例如, 可以就显性/失活活性(dominant/negative activity)筛选上述组合 文库。一般,显性/失活活性导致生物学过程或生物学途径受到抑制。 在大多数情况下,显性/失活抑制基因通过和细胞成分的相互作用表现 其作用。例如,许多显性/失活抑制基因含有具有和一或多种细胞蛋白 有关的结合活性的域但不具有和这些细胞蛋白相关的其它活性。尽管 不欲受理论的束缚,但一旦在细胞中表达后显性/失活抑制基因一般和 一或多个细胞配体相互作用并阻断由细胞蛋白造成的激活。因此,认 为显性/失活抑制基因干扰正常细胞过程的一个机制是隔绝配体。

显性/失活活性可以由野生型蛋白质中的突变,例如改变单个氨基 酸残基或缺失完整的蛋白区,来产生。例如,Qury等,J.Biol.Chem. 275:2261-22614(2000)描述了缺失单个氨基酸残基可导致显性/失 活活性的显性/失活受体。

蛋白质片段也可以具有显性/失活活性。例如,McNellis等,Plant Cell 8:1491-1503(1996),描述了组成型光形态发生蛋白1(COP1) 的N端片段在阿布属(Arabidopsis)幼苗中表达时具有显性/失活活 性。

可以使用多种试验来筛选显性/失活活性。例如,Maemura等,J. Biol.Chem.274:3156-31570(1999)描述了称作内皮PAS域蛋白质1 (EPAS1)的转录因子具有显性/失活活性的缺失突变。具体地,Maemura 等证明,此EPAS1突变在细胞中的表达抑制了对VEGF mRNA产生的诱 导(一种与野生型EPAS1有关的活性)。

本发明还提供鉴定编码具有特定功能或活性的多肽的核酸分子的 方法、以及通过这些方法产生的核酸分子、这些核酸分子的表达产物、 和含有这些核酸分子的宿主细胞。该功能或活性包括自细胞中分泌、 酶活性、配体结合活性(即对金属例子的结合亲和力、细胞表面受体、 核酸、可溶性蛋白质)、和使表达产物靶向亚细胞区室的能力(例如向 线粒体、叶绿体、内质网等的定位)。一般可以对鉴定这些核酸分子的 试验进行设计以便鉴定与该多肽有关的功能或活性。

本发明还提供方法,以鉴定编码具有与其它多肽相互作用的区域 的多肽的核酸分子。该方法的一个例子涉及使用双杂种分析。见例如 Fi elds等,美国专利5,667,973,整个公开并入本文作为参考。更具 体地,可以使用本发明方法制备编码融合蛋白的核酸分子,所述融合 蛋白是在当与另一多肽(例如Gal4的C端域)紧邻时表现出特定功能 的多肽(例如Gal4的N端域)和配体所寻找的蛋白质或蛋白质区域之间 构成的。然后制备编码前句中提及的其它多肽与组合文库所编码的蛋 白质区段之间构成的融合物的其它核酸分子。由此,可以通过对两个 多肽彼此紧邻所导致的相关活性进行筛选,鉴定组合文库中编码期望 配体的核酸区段。

也可以通过本发明方法产生噬菌体和细菌表面展示文库,以鉴定 具有特定功能活性(例如对于特定配体的结合活性)的域。例如,Kim 等,Appl.Environ.Microbiol.66:788-793(2000),描述了用于 选择性地筛选羧甲基纤维素酶(CMCase)的改良变体的细菌表面展示方 法。根据本发明,突变的CMCase基因文库可以通过DNA改组产生并与 晶核蛋白(Inp)基因融合,这就导致产生展示在细菌细胞表面的融合 蛋白。

因此,本发明提供鉴定编码与其它蛋白质相互作用或具有特定功 能活性的蛋白质或蛋白质区域的核酸区段的方法、以及通过这些方法 鉴定的核酸区段、和这些核酸区段的多肽表达产物。一方面,本发明 方法涉及制备组合文库和筛选这些文库以鉴定所编码表达产物与其它 蛋白质相互作用或具有特定活性的核酸区段。在许多情况下,上述组 合文库将编码融合蛋白。

因此,本发明方法可以用于制备和鉴定编码具有特定性质、功能 或活性的蛋白质和蛋白质变体的核酸分子。可易于测试的蛋白质性质 的一个例子是溶解度。在产生不溶性GFP融合蛋白时GFP产生的荧光 被淬灭。另外,当适当定位时,蛋白质相对少量氨基酸残基(如1、2、 3、4个等)的改变可改变该蛋白质的溶解度。因此,表达GFP融合蛋 白的组合文库可用于分离改变了溶解度的蛋白质或蛋白质变体。在一 个具体例子中,设计表达与单个不溶性多肽融合的GFP的组合文库可 用于分离编码该多肽可溶性变体的核酸分子。

本发明的方法可用于构建含有两个或多个核酸区段的核酸分子, 其中一个核酸区段的表达被其它核酸区段之一的表达产物所促进。例 如,可以将一个核酸区段可操作地与T7聚合酶启动子连接,而另一核 酸区段编码T7聚合酶。由此,与T7聚合酶启动子可操作连接的核酸 区段将在T7聚合酶表达时获得表达。该系统的许多变体都属于本发明 范围。例如,编码具有上述特定活性的成分的核酸可以位于插有一或 多个该核酸区段的载体中。

本发明方法还可以用于构建编码多亚基酶的一个以上亚基的核酸 分子。而且,该酶各亚基的表达均可以受到相同或不同启动子的调节。 当使用相同启动子驱动编码两个或多个蛋白质的核酸表达时,该mRNA 可以含有例如一或多个内部核糖体进入位点(IRES),这些位点使得可 以翻译位于5’大部分编码序列3’端的RNA所编码的蛋白质。

本发明方法可以用于构建含有多种特定插入片段的核酸分子和细 胞。因此,一方面,本发明方法可以用于制备含有多个编码特定产物 的基因的核酸分子和细胞。这些方法允许产生具有特定特征的核酸分 子和生物体。例如,正如以下实施例18的讨论,可以制备含有参与特 定生学途径的所用基因的核酸。这些基因可以各与不同转录调节序列 或一或多个拷贝的相同转录调节序列连接。此外,参与相同或不同生 物学途径或生物学过程的基因可以可操作地与在存在相同或不同诱导 剂时、在相同或不同的环境条件下(例如温度)、或在相同或不同细胞 类型中利于转录的转录调节序列连接。而且,当基因编码参与途径或 过程的多肽表达产物时,这些表达产物的一或多个可以表达为融合蛋 白。此外,可以使用本发明方法构建含有编码参与一个以上不同生物 学途径或生物学过程的基因产物的插入核酸区段的细胞。

例如,还可以使用本发明方法修饰使用多位点重组系统构建的多 核酸区段阵列中的一或多个特定核酸区段。使用图17B所示lux操纵 子结构进行举例说明,在该实例中每个基因的侧翼有具有不同重组特 异性的attB位点,该分子中一或多个特定核酸区段可以被另一核酸区 段替代。例如,图1 7B所示lux操纵子结构中第二个编码区域luxD 可以通过含有该操纵子的载体和适当的质粒(例如pDONR质粒)反应而 被置换,以致luxD被含有attRx-ccdB-cat-attRy的元件置换,以产 生其中luxD之前占据的座位成为具有attLx-基因-attLy构型的进入 克隆的受体位点的载体(即产出结构)。然后使此载体产物和attLx-基 因-attLy进入克隆反应,这将导致attRx-ccdB-cat-attRy盒被侧翼 有attBx和attBy的新基因置换。在相关实施方案中,具有attLx-基 因-attLy一般构型的进入克隆群可以和上述制备的产物载体反应,以 便产生产出结构群,并对于群体中任何指定结构而言含有 attRx-ccdB-cat-attRy的区段可以为侧翼有attBx和attBy的另一核 酸区段置换。因此,可以按平行方式排列指定核酸区段阵列的组成, 而操纵子结构中的其它基因基本上不受这些操作的影响。

而且,可以将编码参与一或多个特定生物学过程或途径的表达产 物的核酸区段重组在支持物上。例如,可以将具有带重组位点的游离 末端、并编码参与生物学途径或过程的三个酶之一的第一核酸分子附 着在支持物上。然后将在至少一个末端具有能够和附着在支持物上的 核酸分子重组的重组位点的核酸分子文库与支持物在利于重组的条件 下接触,导致第二核酸分子与第一核酸分子附着。可以使用相似程序 使第三核酸分子与第二核酸分子的游离末端附着。然后可以在生物学 活性测试之前将这些所获核酸产物从支持物上释放出来,或者可以在 核酸产物仍与支持物附着时进行这些分析。可以实施的分析的例子有 用于检测是否存在特定的核酸分子的杂交分析、针对连接的核酸分子 的多肽表达产物的测试、或针对连接的核酸分子的多肽表达产物所产 生的终产物(例如紫杉醇、氨基酸、糖等)的分析。

在以上相关的实施方案中,可以循环使核酸区段附着在上述支持 物上和离开上述支持物。因此,在第二核酸分子和第一核酸分子重组 后,可以例如使用第二重组反应释放该第二核酸分子。

因此,一方面,本发明提供用于在核酸分子间实现重组的方法, 其中该核酸分子中的至少一个与支持物结合。本发明还提供通过与支 持物(例如固体和半固体支持物)上的核酸分子重组,鉴定参与相同生 物学过程途径的核酸分子的方法,因此,本发明提供方法用于筛选核 酸文库以鉴定编码参与特定生物学过程或途径的表达产物的核酸分 子、并提供通过这些方法鉴定的核酸分子、从该核酸分子产生的表达 产物、和通过这些生物学过程或途径产生的产物。

词语“生物化学途径”和“生物学途径”是指生物体或细胞进行 的任何系列相关生物化学反应。这些途径可以包括但不限于生物合成 或生物降解途径、或能量产生或转化途径。

本发明核酸分子可以用于多种应用中。例如,本发明方法可以用 于制备含有操纵子的所有结构基因的末端载体。正如以下实施例18中 讨论的,使用获自生物发光细菌Vibrio fischert的编码luxCDABE 基因的核酸,我们已重新构建了lux操纵子。

而且,正如以上提及的,本发明核酸分子的表达产物,包括是相 同或不同生物学途径或过程的一部分的多蛋白,可以制成融合蛋白。 这些融合蛋白可以含有利于纯化(如6His标签)、使融合蛋白“靶向” 特定的细胞区室(如信号肽)、利于溶解(如麦芽糖结合蛋白)、和/或改 变克隆基因表达产物特性(例如抗体分子的Fc部分、绿色荧光蛋白 (GFP)、黄色荧光蛋白(YFP)或蓝色荧光蛋白(CFP))的氨基酸。

本发明方法还可以用于制备当表达时产生具有一种以上性质、功 能或活性的融合蛋白的核酸分子。该核酸分子的一个例子是编码含有 目的多肽(假单孢杆菌属(Pseudomonas)外毒素域II)和促进融合蛋 白与目的细胞类型结合的多肽的三成分融合蛋白的分子。假单孢杆菌 属外毒素域II常赋予融合蛋白跨细胞膜定位的能力。因此,可以对表 达产物进行设计,以便它定位在特定细胞类型中并跨越细胞膜。当例 如目的多肽有细胞毒性(例如诱导细胞凋亡)时,此类表达产物将尤其 有用。Pastan等在美国专利5,328,984中描述了编码类似于上述蛋白 质的蛋白的核酸分子。

而且,可以按一定方式产生表达产物以便促进其向细胞外的运输。 例如,可以将这些表达产物表达为含有可导致蛋白质向细胞外运输的 信号肽的融合蛋白。当待向外运输的蛋白质是与细胞外底物相互作用 的酶时,应用向细胞外运输可能是理想的。

一方面,本发明提供方法以制备编码参与相同或不同生物学途径 或过程的一或多个表达产物的核酸分子、并提供含有这些核酸分子的 细胞和这些生物途径或过程产生的产物。例如,本发明方法可以用于 构建输出参与相同或不同生物学过程的多个蛋白的细胞。因此,一方 面,本发明提供用于将多个核酸区段克隆在细胞中的系统,其中所述 细胞输出这些核酸区段表达产物中的一或多个基因产物(例如2、3、4、 5、7、10、12、15、20、30、50等)。而且,这些表达产物可以在细 胞外基质(例如培养基、土壤、盐沼等)中发挥功能(例如催化化学反 应)。

当使用本发明方法制备和/或表达核酸分子时,这些核酸分子可以 编码参与相同或不同过程(例如生物合成途径、降解途径)的表达产物。 正如以下解释的,当需要向生物体提供广泛功能特性时,核酸分子可 以编码赋予生物体相对无关性质的表达产物。

而且,使用本发明方法可以制备编码导致期望产物的生物合成途 径的所有或部分的核酸分子。而且,本发明方法可以用于产生编码具 有独特性质的表达产物的核酸分子。因此,本发明还提供制备新的生 物途径或过程终产物的方法。在此方面,本发明方法可以用于制备鉴 别性的新化合物,包括治疗剂。因此,一方面,本发明还提供药物发 现方法和通过这些方法鉴定的治疗剂。

可以通过经本发明方法重新构建和/或改变的生物学途径或过程 产生的终产物的例子包括化疗剂(例如抗生素、抗病毒剂、紫杉醇)、 糖、核苷酸、氨基酸、脂、核糖体、和膜包被细胞器、以及所有这些 的新形式。因此,本发明方法可以用于制备使细胞能够产生广泛多种 天然化合物以及这些化合物的修饰形式的核酸。这些化合物的例子包 括属于以下广泛类别的那些化合物:抗细菌治疗剂、抗病毒治疗剂、 抗寄生虫治疗剂、抗真菌治疗剂、抗疟疾治疗剂、杀阿米巴治疗剂、 和抗肿瘤治疗剂。

由于微生物快速出现抗生素抗性,由此极为需要开发新的抗生素。 而且,人们推测微生物对没有天然存在的等价物的新抗生素产生抗性 的速度会较慢。因此,一方面,本发明提供制备新抗生素的方法、以 及通过本发明方法产生的抗生素。

可以使用本发明方法制备的生物的一个例子是产生新抗生素药剂 的生物。Stassi等,Proc.Natl.Acad.Sci.USA 95:7305-7309(1998) 描述了由遗传工程红色糖多孢菌(Saccharopolyspora erythracea) 细胞产生的乙基被取代的红霉素衍生物新产物。因此,本发明方法可 以用于在细胞中插入编码产生新抗生素的蛋白质的遗传元件。本发明 还包括通过这些方法产生的细胞、和使用这些细胞产生抗生素的方法、 以及通过本发明方法制备的抗生素。

所编码产物参与多种治疗剂的生物合成途径的核酸分子是本领域 已知的。例如,Martin,Appl.Microbiol.Biotechnol.50(1):1-15 (1998)中描述了参与β-内酰胺抗生素生物合成的基因和酶。因此,在 特定方面,本发明包括制备这些抗生素和这些抗生素的改变形式的方 法、以及这些抗生素本身。

本发明还提供方法以制备抗细菌治疗剂、抗病毒治疗剂、抗寄生 虫治疗剂、抗真菌治疗剂、抗疟疾治疗剂、杀阿米巴治疗剂、和抗肿 瘤治疗剂和这些药剂的改变形式、并提供这些药剂本身。抗细菌治疗 剂的例子包括青霉素、氨苄青霉素、阿莫西林、环青霉素、依匹西林、 甲氧西林、夫西林、苯唑西林、氯唑西林、双氯西林、氟氯西林、 羧苄青霉素、头孢氨苄、cepharadine、头孢羟氨苄(cefadoxil)、头 孢克洛、头孢西丁、头孢噻肟、头孢唑肟(cefinenoxine)、头孢曲松、 拉氧头孢、亚胺培南、克拉维酸盐、替卡西林、舒巴坦、红霉素、新 霉素、庆大霉素、链霉素、灭滴灵、氯霉素、克林霉素、林可霉素、 喹诺、利福平、磺胺药物、杆菌肽、多粘菌素B、万古霉素、多西环 素、美他环素、米诺环素、四环素、两性霉素B、环丝氨酸、环丙沙星、 诺氟沙星、异烟肼、乙胺丁醇、和萘啶酸、以及所有这些化合物的衍 生物和改变形式。

抗病毒治疗剂的例子包括无环鸟苷、5-碘脱氧尿苷、三氮唑核苷、 曲氟尿苷、阿糖腺苷(vidirabine)、双脱氧胞苷、双脱氧肌苷、叠 氮胸苷和9-[1,3-二羟-2-丙氧甲基]鸟嘌呤、以及所有这些化合物的 衍生物和改变形式。

抗寄生虫治疗剂的例子包括硫氯酚、乙胺嗪柠檬酸盐、甲苯咪唑、 美曲膦酯、氯硝柳胺、硝咪唑、奥沙尼喹(和其它奎宁衍生物)、哌嗪 枸橼酸盐、吡喹酮、喹嘧啶双羟萘酸盐和噻苯哒唑、以及所有这些化 合物的衍生物和改变形式。

抗真菌治疗剂的例子包括两性霉素B、克霉唑、氯苯甲氧咪唑硝酸 盐、氟胞嘧啶、灰黄霉素、酮康唑和双氯苯咪唑、以及所有这些化合 物的衍生物和改变形式。抗真菌化合物也包括棘孢曲霉素A和 papulocandin B。(见例如Komiyama等,Biol.Pharm.Bull.(1998) 21(10):1013-1019)。)

抗疟疾治疗剂的例子包括盐酸氯喹、磷酸伯氨喹、息疟定、硫酸 奎宁、和盐酸奎纳克林、以及所有这些化合物的衍生物和改变形式。

抗阿米巴治疗剂的例子包括盐酸脱氢吐根碱、二氢氯化物、双碘 喹啉、和硫酸paramomycin、以及所有这些化合物的衍生物和改变形 式。

抗肿瘤治疗剂的例子包括氨鲁米特、咪唑硫嘌呤、硫酸争光霉素、 白消安、卡氮芥、苯丁酸氮芥、顺氯氨铂、环磷酰胺、环孢霉素、 cytarabidine、达卡巴嗪、放线菌素、柔红霉素、阿霉素、紫杉醇、 表鬼臼毒素吡喃葡糖苷、氟尿嘧啶、α干扰素、环己亚硝脲、巯基嘌 呤、甲氨蝶呤、米托坦、盐酸甲苄肼、硫鸟嘌呤、硫酸长春碱和硫酸 长春新碱、以及这些化合物的衍生物和改变形式。

其它抗微生物药剂包括肽。Hancock等,美国专利6,040,435和 Hancock等,Proc.Natl.Acad.Sci.USA 97:8856-8861(2000)中 公开了抗微生物肽的例子。

使用本发明方法还可以制备编码多蛋白复合物的一个以上亚基的 核酸分子。这些多蛋白复合物的例子包括剪接体、核糖体、人26S蛋 白酶体、和酵母RNA聚合酶III。(见例如Saito等,Gene 203(2):241-250(1997);Flores等,Proc.Natl.Acad.Sci.USA 96(14):7815-7820(1999)。)

本发明方法还可以用于部分合成非天然存在产物、以及这些产物 的变体(例如新的变体)。例如,可以提供表达催化特定反应的酶的微 生物和这些生物正常不产生的前体物。当这些前体充当微生物所表达 的酶的底物时,可以产生新的化合物。此类“饲喂”过程在过去已被 用于制备新抗生素。一方面,此类饲喂可以联合表达上述组合文库所 编码的酶的微生物一起使用。

本发明方法可以用于(1)向细胞引入新的途径或(2)改变现有细胞 途径,以便例如在产物合成过程中出现一或多个其它的催化步骤(例如 2、3、4、5、7、10等)。本发明此应用的一个例子涉及对细胞天然产 生的蛋白质进行修饰。在此实例中,将编码改变蛋白的一或多个催化 步骤(例如编码参与翻译后修饰反应的酶)的基因导入细胞中。例如, 可以将编码参与ADP-核糖基化、糖基化、唾液酸化、乙酰化、泛素化、 苏氨酸转化为D丙氨酸、生物素化、酰基化、酰胺化、甲酰化、羧化、 形成GPI锚、羟基化、甲基化、豆蔻酰化、氧化、蛋白水解加工、磷 酸化、异戊二烯化、外消旋作用、selenoylation、硫酸化、精氨酰化 的酶的基因插入细胞中。以下文献讨论了蛋白的翻译后修饰:蛋白质 结构和分子性质(Proteins-Structure and Molecular Propertied), 第2版,T.E.Creighton,W.H.Freeman and Compay,纽约,1993; Wold,F.,蛋白质翻译后修饰:观点和性质,《蛋白质的翻译后共价 修饰》(Post-translational Covalent Modification of Proteins) 第1-12页,B.C.Johnson编,Academic Press,纽约,1983;Seifter 等,“对蛋白质修饰和非蛋白质辅因子的分子”,Meth.Enzymol.(1990) 182:626-646;和Rattan等,“蛋白质合成:翻译后修饰和老化”,Ann. NY Acad.Sci.(1992)663:48-62。

本发明方法可以用于例如制备含有编码参与信号转导途径的蛋白 质的核酸分子的细胞。而且,这些细胞可以用于筛选调节细胞信号转 导的药剂。例如,可以使用本发明方法制备表达响应肿瘤坏死因子(TNF) 所必需的所有成分的细胞。然后可以使用这些细胞筛选诱导TNF介导 的反应(TNF激动剂)或阻断TNF介导的反应(TNF拮抗剂)的药剂。因此, 用于制备可以用于筛选细胞配体的激动剂和拮抗剂的细胞的方法、以 及通过这些方法产生的细胞,都包括在本发明范围内。使用本发明细 胞鉴定细胞配体的激动剂和拮抗剂的方法、以及通过本发明方法鉴定 的激动剂和拮抗剂也包括在本发明范围内。

正如以上提及的,本发明方法还可以用于制备产生养料如糖和氨 基酸的核酸和细胞。糖和氨基酸、以及其它源可以用于多种目的。 例如,糖和氨基酸可以制备用于培养微生物、哺乳动物细胞和植物细 胞的培养基的成分。而且,可以将这些化合物加入人和家畜的食品中。 糖和氨基酸用途的一个特殊例子是在配制婴儿营养配方中的使用。(见 例如,Highman等,美国专利6,120,814)。因此,本发明还提供使用 通过本发明方法产生的碳源制备的食品(例如婴儿营养配方)。

可以使用本发明所制备的细胞产生的碳源包括糖(例如葡萄糖、果 糖、乳糖、糖蜜、纤维素水解物、粗糖水解物、和淀粉水解物)、有机 酸(例如丙酮酸、乙酸、反丁烯二酸、苹果酸和乳酸)、醇(丙三醇、1,3- 丙二醇、和乙醇)、脂、脂肪酸、核苷酸、核苷、和氨基酸。(见例如 Skraly等,Appl.Environ.Microbiol.64:98-105(1998)。)

可以使用本发明制备的生物的一个例子是获得产生乙醇的能力的 生物。例如,Deng等,Appl.Environ.Microbiol.65:523-528(1999) 描述了经改造产生乙醇的蓝细菌。因此,本发明方法可以用于将编码 参与产生乙醇的蛋白质的遗传元件插入细胞中。本发明还包括通过这 些方法制备的细胞和使用这些细胞产生乙醇的方法。

可以使用本发明制备的生物的另一例子是获得产生聚(3-羟基链 烷羧酸酯)或增加量的聚(3-羟基链烷羧酸酯)能力的生物。聚(3-羟基 链烷羧酸酯)是当从细胞中提取出时具有塑胶样性质的化合物。(见例 如Madison等,Microbiol.Molec.Biol.Rev.63:21-53(1999)。) 因此,本发明方法可以用于将编码参与产生聚(3-羟基链烷羧酸酯)的 蛋白质的遗传元件插入细胞中。本发明还包括通过这些方法产生的细 胞和使用这些细胞制备聚(3-羟基链烷羧酸酯)的方法、以及聚(3-羟基 链烷羧酸酯)衍生物和从聚(3-羟基链烷羧酸酯)形成的化合物。

可以使用本发明方法所制备的细胞产生的氨基酸包括苯丙氨酸、 色氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸、谷氨酰胺、天冬酰 胺、精氨酸、赖氨酸、组氨酸、天冬氨酸、谷氨酸、丙氨酸、脯氨酸 丝氨酸、苏氨酸、甲硫氨酸、半胱氨酸、和甘氨酸。相当多生物的参 与氨基酸和氨基酸前体生物合成的基因和酶是本领域已知的。(见例 如G.N.Cohen,“赖氨酸、甲硫氨酸和苏氨酸的共同途径”,第147-171 页,《氨基酸:生物合成和遗传调节》(Amino Acids:Biosynthesis and Genetic Regulation),K.M.Herrmann和R.L.Somerville编, Addison-Welesley Publishing Co.,Inc.,Reading,Mass.(1983)。)

除了改变细胞以产生新化合物外,本发明方法还可以用于改造细 胞以便它们超量产生或减少产生细胞正常代谢的产物。例如,Donnelly 等,美国专利5,770,435描述了产生增加量的琥珀酸的大肠杆菌突变 株。例如,可以利用本发明方法构建编码琥珀酸生物合成途径中的酶 的核酸分子。而且,可以在转录水平上调节这些酶中一或多个的表达。 因此,将这些核酸分子导入上述大肠杆菌细胞中将有效地扩增琥珀酸 生物合成途径中的一或多个基因。而且,可以使这些基因中的一或多 个与诱导型启动子(例如lacI启动子)可操作地连接,以便琥珀酸仅在 存在诱导信号(例如IPTG)时才增加。

本发明方法还可以用于制备产生可用于制造过程的成分和前体的 核酸和细胞。这些成分的例子包括塑料、塑料样化合物(例如聚酮化合 物)、油皂、肥料、纸、合成橡胶、染料、油墨等。本发明还包括通过 本发明方法和细胞产生的成分和前体。

类似地,本发明方法制备的核酸分子还可以用于下调例如一或多 个内源性基因的表达。一个例子是使本发明方法所制备的核酸插入片 段转录产生反义RNA。再有,可以将编码反义RNA的核酸分子可操作 地与可调节启动子连接。

因此,本发明还包括用于制备可超量产生或减少产生细胞正常代 谢产物的细胞的方法,以及通过这些方法制备的细胞。

正如以上提及的,本发明方法制备的核酸分子可以用于改变生物 的生理特性,以便该生物具有特定的性质。例如,使用本发明载体可 以将缺少产生具有特定糖基化模式的重组或天然蛋白质所必需的特定 酶的细胞导入细胞中。蛋白质的糖基化模式在一定程度上是细胞类型 和种类特异的(见例如Jarvis等,Curr.Opin.Biotechnol. 9:528-533(1998)。)因此,一方面,本发明提供方法以制备表现出 改变的糖基化途径的细胞、并提供通过这些方法制备的细胞、和这些 细胞产生的糖基化化合物。该方法一般被称作“糖基化工程”。Stanley, Glycobiology 2:99-107(1992)。

例如,可以使用本发明方法修饰不能糖基化蛋白质的细菌细胞, 以产生可糖基化蛋白质的酶。这些酶的例子包括N-乙酰葡糖胺基转移 酶III和V、β-1,4-半乳糖基转移酶、α-2,6-唾液酸转移酶、α-2,3- 唾液酸转移酶、α-1,3-岩藻糖基转移酶III和VI、和α-1,2-甘露糖 基转移酶。

另一方面,本发明提供方法以制备表现出改变的代谢性质的细胞, 此改变的代谢性质将导致这些细胞合成的化合物的量增加,本发明还 提供通过这些方法制备的细胞和这些细胞所产生的产物。该方法的一 个例子是制备产生增加量的生物学途径前体的细胞。该方法在此被称 作代谢引导或漏过(metabolic channeling or funneling)。例如, 当需要制备产生增加量的丝氨酸的细胞时,可以将编码3-磷酸甘油酸 产生途径中的酶的核酸分子插入细胞中。任选地,还可以将编码参与 将3-磷酸甘油酸为丝氨酸的酶的核酸分子插入细胞中。在构建含有细 胞内含量增加的前体库化合物的细胞时,有用的考虑参数包括该特定 途径中设定的速度限制和途径通量。(见例如Kholodenko等, Biotechnol.Bioeng.59:239-247(1997)。)

聚酮化合物是通过一系列缩合和随后的修饰从2-碳单位合成的多 样化合物大家族。许多种生物,包括真菌和许多细菌,尤其是放射菌 类产生聚酮化合物。存在具有不同活性的多种聚酮化合物结构和包含 聚酮化合物的多种化合物。(见例如PCT公开文本WO 93/13663;WO 95/08548;WO 96/40968;97/02358;和98/27203;美国专利4,874,748; 5,063,155;5,098,837;5,149,639;5,672,491;和5,712,146;和 Fu等,1994,Biochemistry 33:9321-9326;McDaniel等,1993, Science 262:1546-1550;和Rohr,1995,Angew.Chem.Int.Ed.Engl. 34:881-888,所有均并入本文作为参考)。

聚酮合成酶(PKS)使用共同的机制策略组装各种结构的天然产物, 所述策略依赖于在构建最终反应产物的一系列脱羧化缩合反应中经半 胱氨酸残基锚定聚酮化合物。PKS一般在类似脂肪酸生物合成的生物 合成过程中催化从简单前体如丙酰CoA和甲基丙二酰CoA组装复杂的 天然产物。聚酮化合物的例子包括callystatin A、安三烯菌素A、放 线菌紫素、纳巴霉素、酒霉素、和苦霉素。

一方面,本发明提供制备编码一或多个PKS的核酸分子的方法、 以及含有这些核酸分子的细胞和所获的聚酮化合物产物。本发明还提 供使用组合文库制备新PKS的方法、和由这些新PKS产生的产物(例 如新的大环内酯抗生素),以及制备这些新PKS产物的方法。

本发明方法还可以用于构建对于降低各种化学剂毒性有用的微生 物株。这些化学剂包括基于石油的污染物(例如氯化和非氯化的脂肪 族化合物(例如C3-C36)、氯化或未氯化的芳香族化合物(例如 C9-C22)、原油、精炼油、燃油(例如2、4、6号燃油)、柴油、汽油、 液力油、油、苯、甲苯、乙苯、二甲苯、三甲基苯、萘、蒽、二氢 苊、苊、苯并(a)蒽、苯并(a)芘、苯并(b)荧蒽、苯并(g,h,i)北、苯 并(k)荧蒽、芘、二氯甲烷、1,1-二氯乙烷、氯仿、1,2-二氯丙烷、二 溴氯甲烷、1,1,2-三氯乙烷、2-氯乙基乙烯基醚、四氯乙烯(PCE)、氯 苯、1,2-二氯乙烷、1,1,1-三氯乙烷、溴二氯甲烷、反-1,3-二氯丙烯、 顺-1,3-二氯丙烯、溴仿、氯甲烷、溴甲烷、乙烯基氯、氯乙烷、1,1- 二氯乙烷、反-1,2-二氯乙烷、三氯乙烯(TCE)、二氯苯、顺-1,2-二氯 乙烷、二溴甲烷、1,4-二氯丁烷、1,2,3-三氯丙烷、溴氯甲烷、2,2- 二氯丙烷、1,2-二溴乙烷、1,3-二氯丙烷、溴苯、氯甲苯、三氯苯、 反-1,4-二氯-2-丁烯和丁基苯)。

可以使用本发明方法制备的生物的一个例子是降解甲苯的生物。 Panke等,Appl.Environ.Microbiol.64:748-751(1998)描述了将 甲苯以及几种甲苯衍生物转化为苯甲酸盐的恶臭假单孢菌 (Pseudomona putida)菌株。因此,本发明方法可以用于在细胞中插入 编码将甲苯及其衍生物转化为低毒性化合物的蛋白质的遗传元件。本 发明还包括通过这些方法制备的细胞和使用这些细胞将甲苯及几种甲 苯衍生物转化为低毒性化合物的方法。

本发明方法还可以用于制备适合中和非石油剂如重金属离子(如 汞、、镉、、金、亚碲酸盐、亚硒酸盐和)的毒性的生物。例如 可以中和汞毒性的方法包括还原汞离子以产生金属汞然后进行挥发。 细菌中参与脱毒的基因描述在Miller,“Hg(II)和有机汞制剂的细菌 脱毒”,Essays Biochem.34:17-30(1999)。

在类球红细菌(Rhodobacter sphaeroide)菌株中鉴定到重金属 离子脱毒系统的另一例子(见O’Gara等,Appl.Environ.Microbiol. 63(12):4713-4720(1997))。该菌株的亚碲酸盐抗性似乎是由两个座 位赋予的。第一个遗传座位含有4个基因;其中两个基因(即trgA和 trgB)当插入另一细菌时可赋予增强的亚碲酸盐抗性。该座位中另一 基因cysK(半胱氨酸合成酶)的破坏导致亚碲酸盐抗性降低。第二个遗 传座位含有telA基因。telA的失活导致与野生型菌株相比亚碲酸盐 抗性显著降低。

能够中和化学剂毒性的微生物描述在例如Perriello,美国专利 6,110,372中。适用于生物除污的微生物包括假单胞菌科 (Pseudomonadaceae)、放线菌纲(Actinomycetes)、微球菌科 (Micrococcaceae)、科(Vibrionaceae)、根瘤菌科(Rhizobiaceae)、 噬细胞菌科(Cytophagaceae)、和棒状杆菌科(Corynebacterium)。在 使用本发明方法进行修饰后适用于生物除污应用的微生物的具体例子 包括红苍白假单胞菌(Pseudomonas rubrisubalbicans)、铜绿假单 胞菌(Pseudomonas aeruginosa)、争论贪噬菌(Variovorax paradoxus)、星状诺卡氏菌(Nocardia asteroides)、耐放射异常球 菌(Deinococcus radiodurans)、限定诺卡氏菌(Nocardia restricata)、产吲哚金黄杆菌(Chryseobacterium indologenes)、 食酸丛毛单胞菌(Comamonas acidovorans)、德氏食酸菌(Acidovorax delafieldii)、胭脂红分枝杆菌(Rhodococcus rhodochrous)、红串 红球菌(Rhodococcus erytlropolis)、酯香金杆菌(Aureobacterium esteroaromaticum)、天金杆菌(Aureobacterium saperdae)、易变 微球菌(Micrococcus varians)、克氏微球菌(Micrococcus kristinae)、豚鼠气单胞菌(Aeromonas caviae)、嗜麦芽糖寡养单胞 菌(Stenotrophomonas maltophilia)、嗜温鞘氨醇杆菌 (Sphingobaterium thalpophium)、Clavibacter michiganense、木 糖氧化产碱菌(Alcaligenes xylosoxydans)、水生棒杆菌 B(Corynebacterium aquaticum B)和约氏噬纤维菌(Cytophaga johnsonae)。

适于生物除污的生物还包括植物。例如,Meagher等在美国专利 5,965,796中描述了表达金属离子抗性蛋白并减少金属离子如铜、汞、 金、镉、铅和银的离子的转基因植物。而且,可以将编码植物螯合肽 的基因导入植物中以增加植物螯合肽的合成。植物螯合肽是谷胱甘肽 衍生物,其通过隔离来中和金属离子的毒性。Corbett,“植物螯合肽 的生物合成及重金属脱毒功能”,Curr.Opin.Plant.biol. 3(3):211-216(2000)中讨论了许多植物种类中参与植物螯合肽合成 的基因。

在本发明方法修饰后适于生物除污应用的具体植物包括家独行菜 (Lepidium sativum)、芥菜(Brassica juncea)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、Acena sativa、普通小麦(Triticum aestivum)、向日葵(Helianthus annuus)、细纪翦股颖(Colonial bentgrass)、草地早熟禾、宿根黑麦草(Perennial ryegrass)、匍匐 翦股颖(Creeping bentgrass)、绊根草(Bermudagrass)、野牛草、蜈 蚣草、柳枝稷、结缕草、coastal panicgrass、菠菜、高粱烟草和 玉米。制备转基因植物的方法是本领域已知的,并正如以上提及的, 描述在例如Meagher等,美国专利5,96 5,796。

本发明方法还可以用于制备具有各种特性并含有相当大量的插入 基因的生物。正如以上提及的,本发明方法可以用于将几乎无限制数 量的核酸区段插入细胞中。例如,在一个具体实施方案中,本发明提 供用于制备表达杀虫蛋白(例如苏云金杆菌(Bacillus thurginiensis) 的杀虫蛋白)的细胞的方法。(见例如Schnepf等,Microbiol.Molec. Biol.Rev.62:775-806(1998)。)因此,本发明方法可以用于将编 码杀虫蛋白的遗传元件插入细胞中。本发明还包括通过这些方法制备 的细胞和使用这些细胞制备杀虫蛋白的方法。本发明还包括使用本发 明制备的细胞(例如细菌或植物细胞)和杀虫蛋白控制昆虫群体的方 法。在某些实施方案中,本发明方法制备的在本发明方法中使用的细 胞是植物细胞。

因此,一方面,本发明方法可以用于制备含有编码一或多个非蛋 白表达产物(例如功能性RNA如tRNA或核酶)的一或多个ORF和/或核 酸区段的核酸分子。在本发明大多数实施方案中,编码一或多个非蛋 白表达产物的ORF和/或核酸区段的数目一般在约1至约300之间变动 (例如1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、 45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、 140、150、160、170、180、190、200、225、250、275、300等)。含 有编码一或多个非蛋白表达产物的一或多个ORF和/或核酸区段的核 酸分子,对于改变生物使之具有例如以上所列举的特性是尤其有用的。

根据多种因素(包括存在的功能性区段数目),本发明核酸分子的 大小将在尺寸上有相当大的变化,但一般地,将在约0.5kb至约300kb 之间(例如约0.5kb、约1kb、约2kb、约3kb、约4kb、约5kb、 约7kb、约10kb、约12kb、约15kb、约20kb、约40kb、约60kb、约 80kb、约100kb、约200kb、约300kb等)。

在一个具体实施方案中,本发明还提供作为基因治疗方案的一部 分将本发明核酸分子导入动物(例如人)和动物细胞(例如人细胞)中的 方法。基因治疗是指通过给患者施用表达的或可表达的核酸分子进行 的治疗。在本发明许多实施方案中,本发明核酸分子将编码一或多个 介导至少一种治疗效果的蛋白质。因此,本发明提供用于基因治疗的 核酸分子和方法。

本发明核酸分子可以用于制备设计以替换位于细胞基因组中的基 因、缺失这些基因、或插入异源基因或基因群的基因治疗载体。当编 码核酸分子起到缺失或替换基因的功能时,被缺失或替换的基因或多 个基因可以导致“正常表型”或异常表型的表达。异常表型的一个例 子是囊性纤维化疾病。而且,可以将基因治疗载体稳定地维持(例如通 过同源重组整合在细胞核酸中)或非稳定地维持在细胞中。

而且,本发明核酸分子可以用于抑制“异常”表型、或弥补或补 充由于内源性基因表达导致的“正常”表型。设计用于抑制异常表型 的本发明核酸分子的一个例子是使该核酸分子的表达产物具有显性/ 失活活性。设计用于补充正常表型的本发明核酸分子的一个例子是该 核酸分子的导入有效地引起位于细胞中的基因的扩增。

而且,本发明核酸分子可以用于将所编码表达产物参与了特定生 物学途径(例如氨基酸如赖氨酸、苏氨酸的生物合成,等)的所有步骤、 或参与这些途径的一或多个步骤的核酸区段插入细胞中。事实上,可 以对这些核酸分子进行设计以扩增编码这些途径中的表达产物的基 因、将所编码表达产物参与细胞中正常不存在的途径的基因插入细胞 中、或替换参与细胞中特定生物学途径的一或多个步骤的一或多个基 因。因此,本发明基因治疗载体可以含有导致产生一或多个产物(例如 1、2、3、4、5、8、10、15等)的核酸分子。这些载体,尤其是导致 产生一个以上产物的那些载体,对于治疗由于一个以上基因的表达或 不表达造成的疾病和/或病症、或对于治疗一种以上的疾病和/或病症 将是尤其有用的。

因此,在相关方面,本发明提供表达一或多个表达产物(例如1或 多个融合蛋白)的基因治疗载体、制备这些载体的方法、使用本发明载 体进行基因治疗的方法、该载体的表达产物(例如编码的RNA和/或蛋 白质)、和含有本发明载体的宿主细胞。

对于基因治疗方法的一般综述,参见Goldspiel等1993,Clinical Pharmacy 12:488-505;Wu和Wu,1991,Biotherapy 3:87-95; Tolstoshev,1993,Ann.Rev.Pharmacol.Toxicol.32:573-596; Mulligan,1993,Science 260:926-932;和Morgan和Anderson,1993, Ann.Rev.Biochem.62:191-217;May,1993,TIBTECH 11(5):155-215)。可以使用的重组DNA技术领域的通常已知方法描述 于Ausubel等(编),1993,当代分子生物学实验方案(Current Protocols in Molecular Biology),John Wiley & Sons,NY;和 Kriegler,1990,基因转移和表达,实验室手册(Gene Transfer and Expression,A Laboratory Manual),Stockton press,NY。

将本发明核酸分子递送至患者体内可以是直接的,在此情况下患 者直接暴露于该核酸或携带核酸的载体,也可以是间接的,在此情况 下首先在体外用核酸转化细胞、然后将该细胞移植至患者体内。这两 种方法分别称作体内或离体基因治疗。

在一个具体实施方案中,当本发明核酸分子可以在体内表达产生 一或多个表达产物时,体内直接施用本发明核酸分子。这可以通过本 领域许多已知的方法来实现,例如通过构建表达载体并进行施用以便 它们进入细胞内(例如通过施用缺陷性或减毒逆转录病毒载体或其它 病毒载体进行感染(见美国专利4,980,286)、通过直接注射裸DNA、通 过用脂质或细胞受体或转染试剂包被、包在脂质体、微粒、或微囊中、 或通过将它们与已知进入细胞核的肽连接然后施用、通过将它们与可 经历受体介导的内吞作用的配体连接然后施用(见例如Wu和Wu,1987, J.Biol.Chem.262:4429-4432)(这可以用于靶向特异表达该受体 的细胞类型),等)。在另一实施方案中,可以通过靶向特异受体,使 本发明核酸分子体内定向于细胞特异的摄取和表达(见例如,日期为 1992年4月16目的PCT公开文本WO 92/06180(Wu等);日期为1992 年12月23日的WO 92/22635(Wilson等);日期为1992年11月26 日的WO 92/20316(Findeis等);日期为1993年6月22日的WO 93/14188(Clarke等);日期为1993年10月14日的WO 93/20221 (Young))。或者,可以通过同源重组,将本发明核酸分子导入细胞内 并整合在宿主细胞DNA中进行表达(Koller和Smithies,1989,Proc. Natl.Acad.Sci.USA 86:8932-8935;Zijlstra等,1989,Nature 342:435-438)。图21C和22B中显示了适于该应用的核酸结构的例子。

在另一具体实施方案中,使用含有编码抗体或本发明其它抗原结 合蛋白的核酸序列。例如,可以使用逆转录病毒载体(见Miller等, 1993,Meth.Enzymol.217;581-599)。这些逆转录病毒被用于缺失 对于病毒基因组的包装和向宿主细胞DNA的整合不必要的逆转录病毒 序列。将编码用于基因治疗的抗体的核酸序列克隆在有利于将基因递 送至患者体内的一或多个载体上。关于逆转录载体的更多细节可以参 见Boesen等,1994,Biotherapy 6:291-302,该文献描述了使用逆 转录病毒载体将mdrl基因递送至造血干细胞中以使这些干细胞对化 疗具有更大的抗性。描述逆转录病毒载体在基因治疗中的用途的其它 文献有:Clowes等,1994,J.Clin.Invest.93:644-651;Kiem等, 1994,Blood 83:1467-1473;Salmons和Gunzberg,1993,Human Gene Therapy 4:129-141;和Grossman和Wilson,1993,Curr.Opin.in Genetics and Devel.3:110-114。

腺病毒是能够用于基因治疗的其它病毒载体。腺病毒是尤其具有 吸引力的将基因递送至呼吸道上皮细胞的运载工具,该载体的用途包 括在本发明的范围内。腺病毒自然感染呼吸道上皮细胞,并在此引起 轻微的疾病。基于腺病毒的递送系统的其它靶标有肝、中枢神经系统、 内皮细胞、和肌肉。腺病毒的优点是能够感染非分裂细胞。Kozarsy 和Wilson,1993,当前遗传和发育观点(Current Opinion in Genetics and Development)3:499-503给出了基于腺病毒的基因治疗 的综述。Bout等,1994,Human Gene Therapy 5:3-10展示了腺病 毒载体在向恒河猴呼吸道上皮细胞转移基因中的用途。腺病毒在基因 治疗中的用途的其它例子可以参见Rosenfeld等,1991,Science 252:431-434;Rosenfeld等,1992,Cell 68:143-155;Mastrangeli 等,1993,J.Clin.Invest.91:225-234;PCT公开文本号WO 94/12649 和WO 96/17053;美国专利5,998,205;和Wang等,1995,Gene Therapy 2:775-783,所有这些的公开均完整地并入本文作为参考。在一个实施 方案中,使用腺病毒载体。

腺相关病毒(AAV)和疱疹病毒,以及从这些病毒制备的载体,也已 被提议用于基因治疗(Walsh等,1993,Proc.Soc.Exp.Biol.Med. 204:289-300;美国专利5,436,146;Wagstaff等,Gene Ther. 5:1566-70(1998))。疱疹病毒载体对于期望在神经细胞中进行基因表 达的应用是尤其有用的。

基因治疗的另一个方法涉及通过例如电穿孔、脂转染、磷酸介 导的转染、或病毒感染等方法在组织培养中将基因转移至细胞。通常, 转移方法包括向细胞转移选择标记。然后对细胞进行选择以分离摄取 并正在表达该转移的基因的细胞。然后将这些细胞递送给患者。

在此实施方案中,将核酸导入细胞中然后体内施用所获重组细胞。 该导入可以通过本领域已知的任何方法来进行,包括但不限于转染、 电穿孔、显微注射、含有核酸序列的病毒或噬菌体载体感染、细胞融 合、染色体介导的基因转移、微细胞介导的基因转移、原生质球融合, 等。用于将外源基因导入细胞中的许多技术是本领域已知的(见例如 Loeffler和Behr,1993,Meth.Enzymol.217:599-618;Cohen等, 1993,Meth.Enzymol.217:618-644;Cline,1985,Pharmac.Ther. 29:69-92),并可以根据本发明进行使用,只要不破坏受体细胞的必 要发育和生理功能即可。该技术应当可以使核酸稳定转移至细胞中, 以便核酸在细胞中是可表达的,并任选地可以被其子代细胞遗传和表 达。

可以通过本领域各种已知方法将所获重组细胞递送至患者体内。 一般可以静脉内施用重组血细胞(例如造血干细胞或祖先细胞)。预计 使用的细胞数量取决于期望的效果、患者的状态等,并可以由本领域 技术人员确定。

为了基因治疗目的可以导入核酸的细胞包括任何期望的可获得细 胞类型,并包括但不限于上皮细胞、内皮细胞、角质细胞、成纤维细 胞、肌细胞、肝细胞;血液细胞如T淋巴细胞、B淋巴细胞、单核细 胞、巨噬细胞、嗜中性粒细胞、嗜酸性粒细胞、巨核细胞、粒细胞; 各种干细胞或祖先细胞,尤其是造血干细胞或祖先细胞(例如从骨髓、 脐带血、外周血、胎儿肝脏获得的造血干细胞或祖先细胞)。

在某一实施方案中,用于基因治疗的细胞是患者的自体细胞。

在使用重组细胞进行基因治疗的实施方案中,将编码抗体或其它 抗原结合蛋白的核酸序列导入细胞中,以便它们可以被细胞或其后代 表达,然后体内施用该重组细胞以达到治疗效果。在一个具体实施方 案中,可以体外分离并维持的任何干细胞和/或祖先细胞都可以潜在地 用于根据本发明的实施方案中(见例如PCT公开文本WO 94/08598 (1994年4月28日);Stemple和Anderson,1992,Cell 71:973-985; Rheinwald,1980,Meth.Cell Biol.21A:229;和Pittelkow和Scott, 1986,Mayo Clinic Proc.61:771)。

在一个具体实施方案中,为了基因治疗目的导入的核酸分子包含 与编码区可操作连接的诱导启动子,以致可以通过控制适当转录诱导 物的存在或不存在,控制该核酸分子的表达。

本发明核酸分子还可以用于制备转基因生物(例如动物和植物)。 任何物种的动物,包括但不限于小鼠、大鼠、兔、仓鼠、豚鼠、猪、 微型猪(micropig)、山羊、绵羊、母牛和非人灵长类动物(例如狒狒、 猴、和黑猩猩),均可以用于制备转基因动物。而且,任何种类的植物, 包括但不限于家独行菜、芥菜、甘蓝、芜菁、Acena sativa、普通小 麦、向日葵、细纪翦股颖(Colonial bentgrass)、草地早熟禾、宿根 黑麦草(Perennial ryegrass)、匍匐翦股颖(Creeping bentgrass)、 绊根草(Bermudagrass)、野牛草、蜈蚣草、柳枝稷、结缕草、coastal panicgrass、菠菜、高粱、烟草和玉米,均可以用于制备转基因植物。

本领域已知的任何技术均可以用于将本发明核酸分子引入生物体 中以产生转基因生物的起始系。这些技术包括,但不限于,原核显微 注射(Paterson等,Appl.Microbiol.Biotechnol.40:691-698 (1994);Carver等,Biotechnology(NY)11:1263-1270(1993); Wright等,Biotechnology(NY)9:830-834(1991);和Hoppe等,美 国专利4,873,191(1981));逆转录病毒介导的向生殖细胞系(Van der Putten等,Proc.Natl.Acad.Sci.USA 82:6148-6152(1985))、 胚泡和胚胎的基因转移;向胚胎干细胞的基因打靶(Thompson等,Cell 56:313-321(1989));细胞或胚胎的电穿孔(Lo,Mol.Cell Biol. 3:1803-1814(1983));使用基因枪导入本发明多核苷酸(见例如Ulmer 等,Science 259:1745(1993);将核酸结构导入胚胎多能干细胞中 并将此干细胞转移回胚泡中;和精子介导的基因转移(Lavitran等, Cell 57:717-723(1989);等。对于这些技术的综述,见Gordon等, “转基因动物”,Intl.Rev.Cytol.115:171-229(1989),该文献完 整地并入本文作为参考。而且,本段落中引用的所有这些文献的内容 均完整地并入本文。也见美国专利5,464,764(Capecchi等,正-负筛 选方法和载体);美国专利5,631,153(Capecchi等,含有预先确定 的基因组修饰的细胞和非人生物以及制备它们的正-负筛选方法和载 体);美国专利4,736,866(Leder等,转基因非人动物);和美国专利 4,873,191(Wagner等,受精卵的遗传转化),所有这些均完整地并入 本文作为参考。

本领域已知的任何技术均可以用于制备含有本发明核酸分子的转 基因克隆,例如向去核卵细胞核转移来自经诱导静止的培养胚胎、胎 儿、或成年细胞的细胞核(Campell等,Nature 380:64-66(1996); Wilmut等,Nature 385:810-813 91997)),所有这些均完整地并入本 文作为参考。

本发明提供在其所有细胞中带有本发明核酸分子的转基因生物, 以及并非所有细胞均带有这些核酸分子的生物,即镶嵌生物体或嵌合 体。本发明核酸分子可以以单拷贝的形式、或以多拷贝如在多联体中 如头对头串联或头对尾串联的形式整合。也可以选择性地将本发明核 酸分子导入特定细胞类型中并在其中激活,方式参见例如以下Lasko 等的文献(Lasko等,Proc.Natl.Acad.Sci.USA 89:6232-6236 (1992))。该细胞类型特异性激活所必需的调节序列将取决于具体的目 的细胞类型,并是本领域技术人员明了的。当期望使本发明核酸分子 整合在内源性基因的染色体位点中时,这通常是通过基因打靶来实现 的。简而言之,当使用该技术时,设计含有与内源基因同源的一些核 苷酸序列的载体,以便通过与染色体序列的同源重组整合在该内源性 基因核苷酸序列中并破坏其功能。还可以选择性地将本发明核酸分子 导入特定细胞类型中,由此使仅在此类型细胞中的内源性基因失活, 方式见例如以下Gu等的文献(Gu等,Science 265:103-106(1994))。 该细胞类型特异性失活所必需的调节序列取决于具体的目的细胞类 型,并是本领域技术人员已知的。本段落引用的所有文献的内容均完 整地并入本文作为参考。

一旦产生了转基因生物后,可以利用标准技术分析重组基因的表 达。可以通过Southern印迹或PCR技术分析生物体的组织验证本发明 核酸分子是否整合来进行初步筛选。还可以使用以下技术评价本发明 核酸分子在转基因生物体的组织中的mRNA表达水平,这些技术包括但 不限于Northern印迹分析从生物体获得的组织样品、原位杂交分析、 和逆转录酶PCR(rt-PCR)。表达本发明核酸分子的组织样品也可以使 用特异针对这些核酸分子的表达产物的抗体来进行免疫细胞化学或免 疫组织化学评价。

一旦产生了起始生物后,可以对它们进行育种、近交、远交、或 杂交育种以产生特定生物群落。育种策略的例子包括,但不限于:对 具有一个以上整合位点的起始生物进行远交以建立分离系(separate line);对分离系进行近交以便产生由于每拷贝本发明核酸分子的额外 表达作用造成的较高水平表达本发明核酸分子的复合转基因生物;对 杂合转基因生物进行杂交以产生指定整合位点纯合的生物,以便提高 表达并消除通过DNA分析筛选生物的需要;对分离的纯合系进行杂交 以产生复合的杂合或纯合系;以及进行育种以将本发明核酸分子放置 在适合于目的实验模式的不同背景上。

本发明转基因和“敲除”生物的用途包括,但不限于,用于详细 阐明本发明核酸分子表达产物的生物学功能的模式系统(例如动物模 式系统)、研究与本发明核酸分子表达产物的异常表达有关的疾病和/ 或病症、以及筛选有效改善这些疾病和/或病症的化合物。

本领域技术人员将明了,在将本发明核酸分子导入后生动物的许 多情况中,可能期望将编码表达产物的序列与组织特异性转录调节序 列(例如组织特异性启动子)(此组织是期望表达产物在其中产生的组 织)可操作地连接。该启动子可以用于促进这些表达产物在期望组织 中的产量。相当大量的组织特异性启动子是本领域已知的。而且,本 文其它地方描述了鉴定组织特异性转录调节序列的方法。 宿主细胞

本发明还涉及包含本发明一或多个(如2、3、4、5、7、10、12、 15、20、30、50个等)核酸分子或载体,尤其是此处详细描述的那些 核酸分子和载体,的宿主细胞。根据本发明此方面可以使用的代表性 宿主细胞包括,但不限于,细菌细胞、酵母细胞、昆虫细胞、植物细 胞、和动物细胞。优选的细菌宿主细胞包括埃希氏菌属(Escherichia spp.)细胞(尤其是大肠杆菌(E.coli)细胞,最尤其是大肠杆菌菌株 DH10B、Stbl2、DH5α、DB3、DB3.1(优选大肠杆菌LIBRARY EFFICIENCY DB3.1TM感受态细胞;Invitrogen Corporation,Life Technologies Division,Rockville,MD)、DB4和DB5(参见2000年3月2日提交 的美国申请09/518,188和1999年3月2日提交的美国临时申请 60/122,392,其公开文本完整地并入本文作为参考)、芽孢杆菌属 (Bacillus spp.)细胞(尤其是枯草芽孢杆菌(B.subtilis)和巨大芽 孢杆菌(B.megaterium)细胞)、链霉菌属(Streptomyces spp.)细胞、 欧文氏杆菌属(Erwinia spp.)细胞、克雷白氏杆菌属(Klebsiella spp.)细胞、沙雷氏菌属(Serratia spp.)细胞(尤其是粘质沙雷氏菌 (S.marcessans)细胞)、假单胞菌属(Pseudomonas spp.)细胞(尤 其是铜绿假单胞菌(P.aeruginosa)细胞)、和沙门氏菌属(Salmonella spp.)细胞(尤其是鼠伤寒沙门氏菌(S.typhimurium)和伤寒沙门氏菌 (S.typhi)细胞)。优选的动物宿主细胞包括昆虫细胞(最尤其是 Drosophila melanogaster细胞、草地贪夜蛾(Spodoptera frugiperda) Sf9和Sf21细胞、及粉纹夜蛾(Trichoplusa)High-Five细胞)、线 虫细胞(尤其是C.elegans细胞)、鸟类细胞、两栖类动物细胞(尤其 是(Xenopus laevis)细胞)、爬行动物细胞、和哺乳动物细胞(最尤 其是NIH3T3、CHO、COS、VERO、BHK和人细胞)。优选的酵母细胞包 括酿酒酵母细胞和巴斯德毕赤氏酵母(Pichia pastoris)细胞。这些和 其它适合的宿主细胞均可以从商业途径获得,例如从Invitrogen Corporation,Life Technologies Division(Rockville,Mayland)、 美国典型培养物保藏中心(Manassas,Virginia)、和农业研究机构保 藏中心(NRRL;Peoria,Illinois)购买获得。

向此处所述宿主细胞中导入本发明的核酸分子和/或载体,以产生 包含本发明一或多个核酸分子和/或载体的方法是本领域普通技术人 员熟悉的。例如,可以使用感染、转导、转染和转化的熟知技术,向 宿主细胞中导入本发明核酸分子和/或载体。本发明核酸分子和/或载 体可以单独地或联合其它核酸分子和/或载体和/或蛋白质、肽或RNA 一起导入。或者,可以以沉淀的形式例如磷酸钙沉淀的形式,或和脂 形成复合物的形式,向宿主细胞中导入本发明核酸分子和/或载体。也 可以使用电穿孔将本发明核酸分子和/或载体导入宿主中。同样,可以 将此类分子导入化学感受态细胞例如大肠杆菌细胞中。如果载体是病 毒,则可以体外对其进行包装或将其导入包装细胞中,然后可以将包 装病毒转导至细胞中。因此,本发明核酸分子可以含有和/或编码一或 多个包装信号(例如指导包装病毒核酸分子的病毒包装信号)。因此, 根据本发明的此方面,适于将本发明核酸分子和/或载体导入细胞中的 广泛多种技术是本领域技术人员熟知的和常规的。在以下文献中对这 些技术作了充分的综述:Sambrook,J.等,分子克隆:实验室手册 (Molecular Cloning,A Laboratory Manual)第2版,Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press,第16.30-16.55 页(1989);Watson J.D.等,重组DNA(Recombinant DNA)第2版,纽 约:W.H.Freeman and Co.,第213-234页(1992);和Winnacker, E.-L.,从基因到克隆(From Genes to Clones),纽约:VCH Publishers (1987),这些是详细描述这些技术的许多实验室手册的例子,为了它 们的相关公开,将它们完整地并入本文作为参考。 聚合酶

本发明所用聚合酶包括但不限于聚合酶(DNA和RNA聚合酶)和逆 转录酶。DNA聚合酶包括,但不限于,嗜热栖热菌(Thermus thermophilus)(Tth)DNA聚合酶、水生栖热菌(Thermus aquaticus) (Taq)DNA聚合酶、那不勒斯栖热袍菌(Thermotoga neopolitana) (Tne)DNA聚合酶、海栖热袍菌(Thermotoga maritima)(Tma)DNA 聚合酶、(Thermococcus litoralis)(Tli或VENTTM)DNA聚合酶、 激烈火球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶、DEEPVENTTM DNA 聚合酶、Pyrococcus woosii(Pwo)DNA聚合酶、火球菌属物种 (Pyrococcus sp)KOD2(KOD)DNA聚合酶、嗜热脂肪芽孢杆菌 (Bacillus sterothermophilus)(Bst)DNA聚合酶、Bacillus caldophilus(Bca)DNA聚合酶、酸热硫化热菌(Sulfolobus acidoaldarius(Sac)DNA聚合酶、嗜酸热原体(Thermoplasma acidophilum)(Tac)DNA聚合酶、黄栖热菌(Thermus flavus) (Tfl/Tub)DNA聚合酶、红栖热菌(Thermus ruber)(Tru)DNA聚合 酶、Thermus brockianus(DYNAZYMETM)DNA聚合酶、热自养甲烷杆菌 (Methanobacterium thermoautotrophicum)(Mth)DNA聚合酶、分枝 杆菌属(mycobacterium)DNA聚合酶(Mtb,Mlep)、大肠杆菌pol I DNA 聚合酶、T5 DNA聚合酶、T7 DNA聚合酶、和一般的pol I型DNA聚合 酶和它们的突变体、变体和衍生物。RNA聚合酶例如T3、T5和SP6及 它们的突变体、变体和衍生物也均可以用于本发明。

本发明所用核酸聚合酶可以是中温的或嗜热的,优选嗜热的。优 选的中温DNA聚合酶包括可以从以下生物分离到的所有Pol I家族DNA 聚合酶(和它们的相应Klenow片段):如大肠杆菌、流感嗜血杆菌(H. influenzae)、D.radiodurans、H.pylori、C.auratiacus、R. prowazekii、T.pallidum、Synechocystis sp.、枯草芽孢杆菌(B. subtilis)、L.lactis、S.pneumoniae、M.tuberculosis、M.leprae、 M.smegmatis、噬菌体L5、phi-C31、T7、T3、T5、SP01、SP02、酿 酒酵母(S.cerevisiae)MIP-1、和真核生物C.elegans及D. melanogaster(Astatke,M.等,1998,J.Mol.Biol.278,147-165) 的线粒体;分离自任何来源的pol III型DNA聚合酶,以及它们的突 变体、衍生物或变体,等。可以在本发明方法和组合物中使用的优选 热稳定DNA聚合酶包括Taq、Tne、Tma、Pfu、KOD、Tfl、Tth、Stoffel 片段、VENTTM及DEEPVENTTMDNA聚合酶、和它们的突变体、变体和衍生 物(美国专利5,436,149;美国专利4,889,818;美国专利4,965,188; 美国专利5,079,352;美国专利5,614,365;美国专利5,374,553;美 国专利5,270,179;美国专利5,047,342;美国专利5,512,462;WO 92/06188;WO 92/06200;WO 96/10640;WO 97/09451;Barnes,W.M., Gene,112:29-35(1992);Lawyer,F.C.等,PCR Meth.Appl. 2:275-287(1993);Flaman,J.M.等,Nucl.Acids Res. 22(15):3259-3260(1994))。

用于本发明的逆转录酶包括任何具有逆转录酶活性的酶。这些酶 包括,但不限于,逆转录病毒的逆转录酶、逆转座子的逆转录酶、乙 型肝炎病毒的逆转录酶、花椰菜花叶病毒的逆转录酶、细菌的逆转录 酶、Tth DNA聚合酶、Taq DNA聚合酶(Saiki,R.K.等,Science 239:487-491(1988);美国专利4,889,818和4,965,188)、Tne DNA 聚合酶(WO 96/10640和WO 97/09451)、Tma DNA聚合酶(美国专利 5,374,553)和它们的突变体、变体或衍生物(参见例如WO 97/09451 和WO 98/47912)。用于本发明的优选酶包括降低、基本上降低或消 除了RNase H活性的那些酶。“基本上降低了RNase H活性”的酶是 指该酶具有少于约20%、更优选少于约15%、10%或5%、最优选少 于约2%的相应野生型或RNase H+酶(如野生型Moloney鼠白血病病 毒(M-MLV)、禽成髓细胞瘤病毒(AMV)或Rous肉瘤病毒(RSV)逆转录 酶)的RNase H活性。任何酶的RNase H活性均可以通过多种测试方 法来确定,这些方法例如描述于如美国专利5,244,797;Kotewicz,M.L. 等,Nucl.Acids.Res.16:265(1988);和Gerard,G.F.等,FOCUS 14(5):91(1992)中的那些,所有这些文献的公开文本均完整地并入本 文作为参考。用于本发明的尤其优选多肽包括,但不限于,M-MLV H- 逆转录酶、RSV H-逆转录酶、AMV H-逆转录酶、RAV(Rous相关病毒)H- 逆转录酶、MAV(成髓细胞瘤相关病毒)H-逆转录酶、HIV H-逆转录酶。 (参见美国专利5,244,797和WO 98/47912)。然而,本领域普通技 术人员将理解,能够从核糖核酸分子产生DNA分子(即具有逆转录酶 活性)的任何酶均可以同等地应用于本发明的组合物、方法和试剂盒 中。

用于本发明的具有聚合酶活性的酶可以从商业途径获得,例如从 Invitrogen Corporation,Life Technologies Division (Rockville,Maryland);Perkin-Elmer(Branchburg,New Jersey); New England Biolabs(Beverly,Massachusetts);或Boehringer Mannheim Biochemicals(Indianapolis,Indiana)获得。用于本发 明的具有逆转录酶活性的酶可以从商业途径获得,例如从Invitrogen Corporation,Life Technologies Division(Rockville,Maryland); Pharmacia(Piscataway,New Jersey);Sigma(Saint Louis, Missouri);或Boehringer Mannheim Biochemicals(Indianapolis, Indiana)获得。或者,可以根据本领域普通技术人员熟知的分离和纯 化天然蛋白质的标准程序(参见例如Houts,G.E.等,J.Virol. 29:517(1979)),从其天然病毒或细菌来源分离具有聚合酶活性的聚 合酶或逆转录酶。此外,这些聚合酶/逆转录酶可以通过本领域普通技 术人员熟悉的重组DNA技术来制备(参见例如Kotewicz,M.L.等,Nucl. Acids Res.16:265(1988);美国专利5,244,797;WO 98/47912; Soltis,D.A.和Skalka,A.M.,Proc.Natl.Acad.Sci.USA 85: 3372-3379(1988))。具有聚合酶活性和逆转录酶活性的酶的例子包 括本申请中描述的所有那些。 支持物和阵列

根据本发明方法使用的支持物可以是任何适于附着包含一或多个 重组位点或其部分的核酸分子的支持物或基质。可以通过本领域熟知 的任何技术或任何技术组合,将这些分子加载或结合(共价地或非共价 地)在支持物上。本发明支持物可以包含硝酸纤维素、重氮纤维素、玻 璃、聚苯乙烯(包括微量滴定板)、聚氯乙烯、聚丙烯、聚乙烯、聚偏 二氟乙烯(PVDF)、葡聚糖、Sepharose、琼脂、淀粉和尼龙。本发明支 持物可以是任何形式或构型,包括珠粒、滤器、膜、片、玻璃料、塞、 柱等。固体支持物还可以包括多孔管(例如微量滴定板)例如12孔板、 24孔板、48孔板、96孔板、和384孔板。优选的床是由玻璃、乳胶、 或磁性材料(磁性、顺磁性超顺磁性(superparamagnetic)珠粒)制成 的。

在一个优选方面,本发明方法可以用于制备蛋白质或核酸分子 (RNA或DNA)阵列或其它分子、化合物和/或物质的阵列。这些阵列可 以在微量板、载玻片、或标准的印迹膜上形成并可以根据阵列的格式 和设计称作微阵列或基因芯片。这些阵列的用途包括发现基因、给出 基因表达概貌、基因分型(SNP分析、药物基因组学、毒理遗传学)、 和制备钠米技术装置。

核酸阵列的合成和用途以及一般地核酸与支持物的附着已有描述 (见例如美国专利5,436,327;美国专利5,800,992;美国专利 5,445,9334;美国专利5,763,170;美国专利5,599,695和美国专利 5,837,832)。Pirrung等美国专利5,143,854和Barrett等美国专利 5,252,743中描述了将各种试剂附着在底物的位置确定的位点上的自 动程序。例如,二硫化物修饰的寡核苷酸可以使用二硫键与固体支持 物附着。(见Roger等,Anal.Biochem.266:23-30(1999)。)而 且,二硫化物修饰的寡核苷酸可以使用固相合成成为肽核酸(PNA)。由 此,可以将包含一或多个重组位点或其部分的核酸分子加载在一或多 个支持物上(或可以加入该支持物上的阵列中),并可以将核酸、蛋白 质或其它分子和/或化合物通过本发明重组方法加在该支持物上。核酸 和目的分子的偶联是本领域已知的,因此,本发明普通技术人员可以 根据本发明制备含有重组位点(或其部分)的分子和/或化合物以便和 支持物(阵列格式的或其它格式的)附着。

本质上,任何可以想到的支持物都可以用于本发明。该支持物可 以是生物的、非生物的、有机的、无机、或任何这些的组合,其存在 形式有颗粒、链、沉淀、凝胶、片、管、球、容器、毛细管、垫、薄 片、薄膜、板、载片、等。该支持物可以具有任何方便的形状,例如 盘形、方形、球形、圆形等。该支持物优选是扁平的但可以采取各种 其它表面构型。例如,该支持物可以含有可用于合成或其它反应的升 高的或降低的区域。该支持物和其表面优选形成刚性表面,以便本文 所述反应在其上进行。也可以对该支持物和其表面进行选择以便提供 适当的光吸收特性。例如,该支持物可以是聚合的Langmuir Blodgett 膜、官能化玻璃、Si、Ge、GaAs、GaP、SiO2、SIN4、修饰的、或广 泛多种凝胶或聚合物(如(聚)四氟乙烯、(聚)偏氟乙烯、聚苯乙烯、聚 碳酸酯)之任一种、或它们的组合。根据本公开的综述,本领域技术人 员将明了其它支持物材料。在一个优选实施方案中,该支持物是扁平 的玻璃或单晶硅

因此,本发明提供用于制备附着在支持物上的核酸分子阵列的方 法。在一些实施方案中,这些核酸分子在它们的一或多个末端(例如1、 2、3或4)具有重组位点。在一些其它实施方案中,直接将一个核酸分 子与支持物、或支持物的特定部分结合,而将一或多个其它核酸分子 通过与直接附着在支持物上的核酸分子的结合间接地附着在支持物 上。在此情况下,直接与支持物附着的核酸分子提供了成核位点,围 绕该位点可以构建核酸阵列。

本发明还提供用于将支持物彼此连接在一起和用于将结合在同一 支持物上的分子连接在一起的方法。使用图11非限制地举例说明该过 程的一个实施方案中,可以将命名为RS6的重组位点放置在该图下部分 所示附着在支持物上的A/B组合物的RS5位点末端。而且,还可以将一 个相同的组合物附着在相同或不同支持物的另一部分上。然后使用RS6 位点间的重组将这两个组合物连接起来,由此使附着在相同支持物上 的两个支持物之间或附着在不同支持物上的两个组合物之间键合。因 此,本发明提供了方法,使得可以通过使用重组位点将与支持物结合 的一或多个组合物连接起来,从而使附着在相同支持物上的化合物发 生交联。本发明还提供了方法,使得可以使用重组位点将与分开的支 持物结合的一或多个组合物连接起来,从而使分开的支持物发生交联。

一方面,本发明提供含有通过本发明方法制备的核酸分子的支持 物。在许多实施方案中,这些支持物上的核酸分子含有至少一个重组 位点。在一些实施方案中,该重组位点在核酸分子附着在支持物上之 前已进行了重组。这些结合的核酸分子可以用于例如鉴定其它核酸分 子(例如与该结合的核酸分子在严紧杂交条件下杂交的核酸分子)和对 该结合的核酸分子具有结合亲和力的蛋白质。还可以从这些结合的核 酸分子产生表达产物,而同时这些核酸分子仍保持与支持物结合。因 此,本发明组合物和方法可以用于鉴定表达产物和这些表达产物所产 生的产物。

在其它实施方案中,与支持物结合的核酸分子在核酸分子附着在 支持物上之后发生重组。正如已讨论的,因此,这些结合的核酸分子 可以用于鉴定所编码的表达产物参与一个或特定数量的生物学过程或 途径的核酸分子。

而且,可以从这些支持物上释放与支持物结合的核酸分子。释放 核酸分子的方法包括限制性消化、重组和改变条件(例如温度、盐浓度 等)以诱导与结合的核酸分子杂交的核酸分子发生解离。因此,本发明 方法包括使用结合核酸分子的支持物来分离核酸分子。

正如以上提及的,本发明提供了方法,使得可以筛选核酸文库以 鉴定所编码的表达产物参与相同生物学过程或途径的核酸分子。在具 体实施方案中,这些方法包括(1)将包含至少一个重组位点的核酸分 子附着在支持物上,(2)使该结合的核酸分子和核酸分子文库在利于该 结合的核酸分子和文库核酸分子之间发生重组的条件下接触,其中该 文库中各核酸分子均包含至少一个重组位点,和(3)筛选通过重组形成 的核酸分子的表达产物或这些核酸分子的表达产物所产生的产物。

通过核酸分子和支持物的结合可以形成的组合物的例子是“基因 芯片”,通常在本领域中称作“DNA微阵列”或“基因组芯片”(见 美国专利5,412,087和5,889,165;和PCT公开文本WO 97/02357、 WO 97/43450、WO 98/20967、WO 99/05574、WO 99/05591和WO 99/40105, 所有这些公开均完整地并入本文作为参考)。在本发明各种实施方案 中,这些基因芯片可以含有本文所述的两维或三维核酸阵列。

本发明核酸阵列的可寻址性(adressability)意味着可以将与特 定核苷酸序列结合的分子或化合物附着在阵列上。由此,可以将蛋白 质和其它核酸等成分附着在本发明核酸阵列的特定地点/位置。

因此,一方面,本发明提供亲和纯化方法,包括(1)提供与包含 至少一个重组位点的核酸分子结合的支持物,(2)使用重组反应使一 或多个其它核酸分子与支持物附着,(3)使该支持物与含有对结合在 支持物上的核酸分子具有结合亲和力的分子或化合物的组合物,在利 于这些分子或化合物与结合在支持上的核酸分子结合的条件下,进行 接触,(4)改变条件以促进结合的分子或化合物的释放,和(5)收集 释放的分子或化合物。 核酸合成、扩增和测序方法

本发明可以联合涉及核酸分子如DNA(包括cDNA)和RNA分子合成 的任何方法一起应用。这些方法包括,但不限于,核酸合成方法、核 酸扩增方法和核酸测序方法。可以使用这些方法制备本发明所用分子 (例如起始分子)或进一步操作本发明制备的分子或载体。

根据本发明的此方面,核酸合成方法可以包含一或多个(例如2、 3、4、5、7、10、12、15等)步骤。例如,本发明提供合成核酸分子 的方法,其包括(a)将核酸模板(例如,本发明核酸分子或载体)和一或 多个(例如2、3、4、5、7、10、12、15等)引物和一或多个(例如 2、3、4、5、7等)具有聚合酶或逆转录酶活性的酶混合,以形成混 合物;和(b)在足以产生和模板的全部或部分互补的第一核酸分子的条 件下,孵育该混合物。根据本发明的此方面,核酸模板可以是DNA分 子如cDNA分子或文库,或RNA分子如mRNA分子。足以允许合成发生 的条件如pH、温度、离子强度和孵育时间可以由本领域技术人员优化。 如果期望的话,可以在合成过程中或之后在该合成的分子上添加重组 位点(见例如基于1997年10月24日提交的美国临时专利申请 60/065,930于98年10月23日提交的美国专利09/177,387)。

根据本发明,可以从获自天然来源如各种细胞、组织、器官或生 物的核酸分子制备靶或模板核酸分子或文库。可以用作核酸分子来源 的细胞可以是原核细胞(细菌细胞,包括埃希氏杆菌属、芽孢杆菌属、 沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、葡萄球菌属 (Staphlococcus)、链球菌属(Streptococcus)、梭状芽胞杆菌属 (Clostridium)、衣原体(Chlamydia)、奈瑟氏球菌属(Neisseria)、 密螺旋体属(Treponema)、支原体(Mycoplasma)、疏螺旋体属 (Borrelia)、军团菌属(Legionella)、假单胞菌属(Pseudomonas)、 分支杆菌属(Mycobacterium)、螺杆菌属(Helicobacter)、欧文氏菌 属(Erwinia)、土壤杆菌属(Agrobacterium)、根瘤菌属(Rhizobium)、 和链霉菌属(Streptomyces)的种的细胞),或真核细胞(包括真菌(特 别是酵母的)、植物、原生动物及其它寄生物、和动物包括昆虫(尤其 是果蝇属细胞)、线虫(尤其是Caenorhabditis elegans的细胞)、和 哺乳动物(尤其是人细胞)的细胞)。

当然,可以有利地使用的其它核酸合成技术将是本领域普通技术 人员易于明了的。

在本发明其它方面,本发明可以联合扩增或测序核酸分子的方法 一起应用。根据本发明的此方面,核酸扩增方法可以包括将一或多个 具有逆转录酶活性的多肽用于本领域通常称作一步(例如一步RT-PCR) 或两步(例如两步RT-PCR)逆转录酶-扩增反应的方法中。对于长核酸 分子(即长度大于约3-5Kb)的扩增,可以使用DNA聚合酶的组合,参 见WO 98/06736和WO 95/16028。

根据本发明,扩增方法可以包含一或多个(例如2、3、4、5、7、 10)步骤。例如,本发明提供扩增核酸分子的方法,包含(a)将一或多 个(例如2、3、4、5、7、10等)具有聚合酶活性的酶与一或多个(例 如2、3、4、5、7、10、12、15、20、30、50、100等)核酸模板混合; 和(b)在足以允许具有聚合酶活性的酶扩增与模板的全部或部分互补 的一或多个核酸分子的条件下,孵育该混合物。本发明还提供通过这 些方法扩增的核酸分子。如果期望的话,可以在扩增过程中或之后在 该扩增的分子上添加重组位点(见例如基于1997年10月24日提交的 美国临时专利申请60/065,930于98年10月23日提交的美国专利 09/177,387)。

扩增和分析核酸分子或片段的一般方法是本领域普通技术人员熟 知的(参见例如美国专利4,683,195;4,683,202;和4,800,159; Innis,M.A.等编,PCR实验指南:方法和应用的指导(PCR Protocols: A Guide to Methods and Applications),San Diego,California: Academic Press,Inc.(1990);Griffin,H.G.和Griffin,A.M.编, PCR技术:当前的创新(PCR Technology:Current Innovations),Boca Raton,Florida;CRC Press(1994))。例如,根据本发明可以使用 的扩增方法包括PCR(美国专利4,683,195和4,683,292)、链置换扩 增(SDA;美国专利5,455,166;EP 0 684 315)、和基于核酸序列的扩 增(NASBA;美国专利5,409,818;EP 0329 822)。

典型地,这些扩增方法包括(a)将一或多个具有聚合酶活性的酶与 核酸样品在存在一或多个引物的情况下混合;和(b)优选通过PCR或等 价的自动扩增技术,扩增该核酸样品以产生大量扩增的核酸片段。

通过本发明方法进行扩增或合成后,可以分离扩增的或合成的核 酸片段作进一步使用或表征。该步骤通常可以通过借助大小或任何物 理或生物化学方法包括凝胶电泳、毛细管电泳、层析(包括分子筛、 亲和和免疫层析)、密度梯度离心和免疫吸附,分离扩增的或合成的 核酸片段来完成。尤其优选通过凝胶电泳分离核酸片段,因为它提供 了快速和高重复性地灵敏分离许多核酸片段的手段、并允许直接同时 地比较几个核酸样品中的这些片段。在另一优选实施方案中,可以扩 展该方法以分离和表征这些片段或任何通过本发明方法扩增或合成的 核酸片段。因此,本发明还指向通过本发明扩增或合成方法产生的分 离的核酸分子。

在该实施方案中,根据标准技术如电洗脱或物理切除,从用于鉴 定的凝胶(见上)上取下一或多个扩增的或合成的核酸片段。然后将这 些分离的独特核酸片段插入适于转染或转化多种原核(细菌)或真核 (酵母、植物或动物包括人和其它哺乳动物)细胞的标准载体包括表达 载体中。或者,还可以通过例如测序(即,确定核酸片段的核苷酸序列)、 通过以下描述的方法和本领域的其它标准方法(参见指向DNA测序方 法的美国专利4,962,022和5,498,523),表征本发明方法所制备的 核酸分子。

根据本发明,核酸测序方法可以包含一或多个步骤。例如,本发 明可以和用于测序核酸分子的方法联合应用,该方法包含(a)将具有 聚合酶活性的酶和待测序的核酸分子、一或多个引物、一或多个核苷 酸、及一或多个终止剂(例如双脱氧核苷酸)混合,以形成混合物;(b) 在足以合成和待测序分子的全部或部分互补的一群分子的条件下,孵 育该混合物;和(c)分离该群体以确定待测序分子的全部或部分核苷酸 序列。

可以使用的核酸测序技术包括例如描述于美国专利4,962,022和 5,498,523公开的那些双脱氧测序方法。 试剂盒

另一方面,本发明提供可以和本发明一起使用的试剂盒。根据本 发明此方面的试剂盒可以包含一或多个容器,这些容器可以含有选自 下组的一或多个成分:一或多个本发明的核酸分子或载体、本发明分 子和/或化合物、本发明支持物、一或多个聚合酶、一或多个逆转录酶、 一或多个重组蛋白(或其它实施本发明方法的酶)、一或多个缓冲液、 一或多个去污剂、一或多个限制性内切酶、一或多个核苷酸、一或多 个终止剂(例如ddNTP)、一或多个转染试剂、焦磷酸酶等。

多种本发明核酸分子或载体可以和本发明一起使用。而且,由于 本发明的模块性(modularity),这些核酸分子和载体可以以广泛多种 方式组合。可以在本发明试剂盒中提供的核酸分子的例子包括含有以 下序列的核酸分子:启动子、信号肽、增强子、阻遏基因(repressor)、 选择标记、转录信号、翻译信号、引物杂交位点(例如用于测序或PCR 的)、重组位点、限制性位点和多聚接头、在抑制型tRNA存在时抑制 翻译终止的位点、抑制型tRNA编码序列、编码用于制备融合蛋白的域 和/或区(例如6His标签)的序列、复制起点、端粒、着丝粒等。类似 地,可以在本发明试剂盒中提供文库。这些文库可以是可复制核酸分 子形式的,或它们可以包含与复制起点无关的核酸分子。正如本领域 技术人员明了的,与复制起点无关的文库核酸分子、以及其它核酸分 子,可以被插入含有复制起点的其它核酸分子中,或是一次性试剂盒 成分。

而且,在一些实施方案中,本发明试剂盒中提供的文库可以包含 两个成分:(1)这些文库的核酸分子和(2)5’和/或3’重组位点。在一 些实施方案中,当提供的文库核酸分子具有5’和/或3’重组位点时, 可以使用重组反应将这些分子插入载体中,这些载体也可以作为试剂 盒成分提供。在其它实施方案中,可以在使用前将重组位点附着在文 库核酸分子上(例如通过使用连接酶,该连接酶也可以和试剂盒一起提 供)。在此情况下,本试剂盒可以提供含有重组位点的核酸分子或可以 用于产生重组位点的引物。

本发明试剂盒提供的载体可以有极大的不同。在大多数情况下, 这些载体将含有复制起点,至少一个选择标记、和至少一个重组位点。 例如,本发明试剂盒中提供的载体可以具有允许在两个不同的位置处 插入核酸分子的4个不同的重组位点。图16示意显示了此类载体。本 文其它地方对本发明试剂盒提供的载体的其它属性进行了描述。

本发明试剂盒还可以与引物一起提供。这些引物一般设计与具有 特定核苷酸序列的分子退火。例如,这些引物可以设计用于PCR中扩 增特定的核酸分子。而且,本发明试剂盒提供的引物可以是设计与载 体序列杂交的测序引物。因此,该引物一般作为试剂盒的一部分提供 用于测定插入载体的核酸分子的序列。

本发明试剂盒中可以提供一或多个缓冲液(例如1、2、3、4、5、8、 10、15)。这些缓冲液可以按工作浓度提供,或可以按浓缩形式提供然 后稀释为工作浓度。这些缓冲液通常将含有盐、金属离子、辅因子、 金属离子螯合剂等,用于增强缓冲液本身或缓冲液中分子的稳定活性。 而且,可以以干燥形式或含水形式提供这些缓冲液。

适用于本发明的支持物(例如固体支持物、半固体支持物、珠粒、 多孔管等,以上作了更详细的描述)也可以和本发明试剂盒一起提供。 图10-13显示了支持物在本发明方法中的示例性用途。

本发明试剂盒实际上可以含有上述或本文其它地方描述的各种成 分的任何组合。本领域技术人员将明了,与本发明试剂盒一起提供的 成分根据试剂盒的预期用途将有不同。因此,可以对试剂盒进行设计 以发挥本申请所述的各种功能,而且这些试剂盒的成分将由此改变。

相关领域普通技术人员将明了,依据普通技术人员已知的知识从 本文所包含的本发明描述出发,本文所述方法和应用的其它适合修改 和改变将是十分明了的,而且可以进行实施而不偏离本发明范围或它 的任何实施方案。目前我们已详细描述了本发明,通过参考以下实施 例可以更清楚地理解本发明,这些实施例仅为了举例说明的目而被包 括在内,它们并不旨在限制本发明。

1995年6月7日提交的美国申请08/486,139(现已放弃)、1996 年6月7日提交的美国申请08/663,002(现在的美国专利 5,888,732)、1999年1月12日提交的美国申请09/233,492、2000年 11月7日颁布的美国专利6,143,557、1997年10月24日提交的美国 申请66/065,930、1998年10月23日提交的美国申请09/177,387、 1999年4月24日美国申请09/296,280、1999年4月24日提交的美 国申请09/296,281、1998年11月13日提交的美国申请66/108,324、 1999年11月12日提交的美国申请09/438,358、2000年10月25日 提交的美国申请09/695,065、1999年11月2日提交的美国申请 09/432,085、1999年3月2日提交的美国申请60/122,389、1999年 3月23日提交的美国申请60/126,049、1999年5月28日提交的美国 申请60/136,744、1999年3月2日提交的美国申请60/122,392、和 1999年10月25日提交的美国申请60/161,403,所有这些的完整公开 并入本文作为参考。

                      实施例 实施例1:使用LR反应同时克隆两个核酸区段

可以使用本发明方法在单个反应中克隆两个核酸区段。本发明方 法可以包含以下步骤:提供侧翼有第一和第二重组位点的第一核酸区 段、提供侧翼有第三和第四重组位点的第二核酸区段,其中该第一或 第二重组位点能够和第三或第四重组位点重组,实施重组反应反应以 便使这两个核酸区段重组为单个核酸分子,并克隆该单个核酸分子。

参考图2,可以提供侧翼有重组位点的两个核酸区段。本领域技术 人员将明了,这些核酸区段可以作为不连续的片段或作为大核酸分子 的一部分来提供,并可以是环状并任选地是超螺旋或线性。可以对这 些位点进行选择,以便一对反应性位点的一个成员位于这两个区段的 每个的侧翼。

“反应性位点对”是指在适当酶和辅因子存在时能够重组的两个 重组位点。例如,在一些优选实施方案中,一个核酸分子可以包含attR 位点,而另一个包含与attR位点反应的attL位点。由于LR反应的产 物是两个分子,其中一个包含attB位点而一个包含attP位点,因此 可以对起始attL和attR位点的取向进行安排,以便接合后这两个起 始核酸区段可以被包含attB位点或attP位点的核酸序列分隔开。

在一些优选实施方案中,可以对这些位点进行安排,以便在重组 反应后这两个起始核酸区段被attB位点分隔开。在其它优选实施方案 中,可以使用来自其它重组系统的重组位点。例如,在一起实施方案 中,一或多个重组位点可以是lox位点或衍生物。在一些优选实施方 案中,来自一个以上重组系统的重组位点可以用于相同的结构中。例 如,一或多个重组位点可以是att位点,而其它可以是lox位点。来 自不同重组系统的位点的各种组合是本领域技术人员已知的,并且这 些组合被认为是在本发明范围内。

正如图2所示,核酸区段A(DNA-A)的侧翼可以是具有独特特异性 的重组位点,例如attL1和attL3位点,而核酸区段B(DNA-B)的侧 翼可以是重组位点attR3和attL2。为了举例说明的目的,这些区段 标示为DNA。这不应理解为将用于实施本发明的核酸限制为DNA而排 除了其它核酸。此外,在此和之后的实施方案中,重组位点的设计仅 旨在使所用重组位点具有不同的特异性并不应理解为将本发明限制在 使用具体引用的位点上。本领域技术人员能够容易地将具体举例说明 的位点对替换为其它位点对。

attR3和attL3位点包含一个反应性位点对。可以使用其它独特重 组位点对放置在核酸区段侧翼。例如,可以使用lox位点作为一反应 对,而另一反应对可以是att位点,并将适当的重组蛋白包括在该反 应中。同样地,以上讨论的重组位点可以按各种组合进行使用。在此 实施方案中,关键性的性质只有位于各区段侧翼的重组位点的性质、 反应性位点对的一个成员(在此实施例中是LR对L3和R3)存在在一个 核酸区段上,而反应性对的另一成员存在于另一核酸区段上。可以将 这两个区段和适当的酶及目的载体接触。

目的载体包含侧翼有两个重组位点的适当选择标记。在一些实施 方案中,该选择标记可以是负选择标记(例如毒性基因如ccdB)。目的 载体中的一个位点将与这些核酸区段之一上存在的一个位点相容,而 目的载体中存在的另一位点的相容位点位于另一核酸区段上。

在这两个起始核酸区段之间不发生重组的情况下,起始核酸区段 均不具有与目的载体中两个位点相容的重组位点。因此,没有一个起 始核酸区段可以替换目的载体中存在的选择标记。

可以在约25℃孵育反应混合物约60分钟至约16小时。将反应混 合物的全部或部分用于转化感受态微生物并筛选存在期望产物的微生 物。

在一些实施方案中,目的载体包含负选择标记,而转化的微生物 对目的载体上存在的负选择标记是敏感的。在允许进行负选择的条件 下培养转化的微生物,以便除去未含有期望重组产物的微生物。

图2中,所获期望产物由被attB3位点分隔开的、克隆在目的载 体主链中的DNA-A和DNA-B组成。在本实施方案中,可以使用同类反 应(即LR反应)将两个片段组合起来并将组合在一起的片段插入目的 载体中。

在一些实施方案中,可能不必控制一或多个核酸区段的取向并且 可以将具有相同特异性的重组位点用在区段的两个末端。

参考图2,如果区段A相对区段B的取向不是关键的,则可以将 L1位点以反向重复的取向放置在区段A两个末端的侧翼,待与区段A 接合的区段B末端可以具有R1位点。在区段A和B之间形成组合文库 的过程中,这可能对于产生额外的复杂性是有用的。即,区段可以以 各种取向进行接合,而且如果接合的一或两个区段可以来源于一个文 库,则根据本发明可以构建包含随机取向的杂合分子的新群体或文库。

尽管,在本实施例中,两个起始区段间的重组显示发生在和目的 载体的重组反应前,但重组反应的次序并不重要。因此,在一些实施 方案中,可能期望在这些区段间实施重组反应并分离组合的区段。可 以直接地使用这些组合的区段,例如可以对其进行扩增、测序或将其 用作线性表达元件,参见Sykes等(Nature Biotechnology 17:355-359, 1999)。在一些实施方案中,可以按Tawfik等(Nature Biotechology 16:652-656,1998)所述方法包裹这些接合的区段,并随后测试了一或 多个期望性质。在一些实施方案中,可以将该组合的区段用于体外表 达RNA,例如将T7启动子或SP6启动子等启动子包括在其中一个区段 上。该体外表达的RNA可以任选地在体外翻译系统如兔网织红细胞裂 解物中翻译。

任选地,该接合区段可以进一步与目的载体反应,导致该组合区 段插入载体中。在一些情况下,可能期望分离包含其中一个区段和载 体的中间物。对于将这些区段插入载体中,将两个区段接合起来的重 组反应发生在区段和目的载体之间的重组反应之前或之后并不是实施 本发明所关键的。

根据本发明,优选进行所有三个重组反应(即,区段A和目的载体 之间的反应、区段B和目的载体之间的反应、以及区段A和区段B之 间的反应),以便产生在其中两个起始核酸区段现接合为一个单一分子 的核酸分子。在一些实施方案中,可以选择重组位点以便在插入载体 后位于接合区段侧翼的重组位点形成一对反应性位点而该接合区段可 以通过该侧翼位点和适当重组蛋白的反应从载体中切除。

参考图2,如果用L1位点按相对区段B相反的方面替代区段B上 的L2位点(即框的长段,指示重组位点与该区段不相邻)并用R1位点 按相反方向替代载体中的R2位点,则重组反应将在载体中产生attP1 位点。然后该attP1位点能够和接合区段另一末端上的attB1位点反 应。因此,可以使用适合于BP反应的重组蛋白切除该接合区段。

本发明此实施方案尤其适合于构建组合文库。在一些优选实施方 案中,图2的每个核酸区段都可以表示文库,每个文库都可以具有待 筛选的已知或未知核酸序列。在一些实施方案中,其中一或多个区段 可以具有编码指定肽、多肽或蛋白质氨基酸序列的一或多种排列的序 列。在一些实施方案中,每个区段都可以具有编码蛋白质域或编码代 表蛋白质域序列各种排列的文库的序列。例如,一个区段可以代表突 变形式抗体轻链可变区文库,而另一区段可以代表突变形式抗体重链 文库。因此,重组将产生一群分子(例如抗体、单链抗原结合蛋白等), 每个分子均潜在地含有独特的序列组合因此也具有独特的结合特异 性。

在其它优选实施方案中,其中一个区段可以代表单个核酸序列, 而另一个代表文库。重组结果是一群序列,其中所有序列均具有一个 共同部分而在另一部分是可变的。此类实施方案对于制备融合结构文 库是有用的。例如,DNA-A可以包含一个指导表达的调节序列(即启动 子)和一个编码纯化标签的序列。适当的纯化标签包括,但不限于,谷 胱苷肽S转移酶(GST)、麦芽糖结合蛋白(MBP)、表位、确定的氨基酸 序列如表位、半抗原、6组氨酸(HIS6)等。DNA-B可以包括目的蛋白突 变形式的文库。可以测定所获结构的期望特性如酶活性或配体结合。

或者,DNA-B可以包含所获融合分子的共同部分。在一个实施方案 中,上述方法可以用于促进启动子区或转录终止信号分别与结构基因 的5’末端或3’末端融合,产生例如通过在结构基因上添加组织特异性 启动子以设计用于在不同细胞背景中表达的表达盒。

在一些实施方案中,其中一或多个区段可以是编码随机肽文库成 员的序列。该方法可以用于例如制备一群具有某种期望特性的分子。 例如,一个区段可以含有编码DNA结合域的序列,而另一个区段代表 随机肽文库。可以就调节目的靶基因表达的能力对所获群体进行筛选。 在其它实施方案中,两个区段均可以是编码随机蛋白文库成员的序列, 并且可以测定所获合成蛋白(例如融合蛋白)是否具有任何期望特性, 例如与特定配体或受体结合或具有某种酶活性。

这些核酸区段不必编码氨基酸序列。例如,这两个区段均可以指 导不翻译成蛋白质的RNA分子的转录。这对于构建tRNA分子、核酶和 反义分子是有用的。或者,一个区段可以指导非翻译RNA分子的转录 而另一个编码蛋白质。例如,DNA-A可以指导增强蛋白质表达的非翻 译前导序列(例如脑心肌炎病毒前导序列(EMC前导序列))的转录,而 DNA-B编码目的肽、多肽或蛋白质。在一些实施方案中,包含前导序 列的区段还可以包含编码氨基酸序列的序列。例如,DNA-A可以具有 相应于EMC前导序列的核酸序列以及一个纯化标签,而DNA-B具有编 码目的肽、多肽或蛋白质的核酸序列。

上述方法对于制备单链抗原结合蛋白组合文库是尤其有用的。制 备单链抗原结合蛋白的方法是本领域已知的(见例如PCT公开文本WO 94/07921,该完整公开并入本文作为参考)。使用图6所示结构进行举 例说明,DNA-A可以编码例如突变形式的抗体轻链可变区,而DNA-B 可编码例如突变形式的抗体轻链可变区。另外,DNA-A和DNA-B之间 的间隔核酸可编码连接轻链和重链的肽接头。然后可以对表达单链抗 原结合蛋白的细胞进行筛选以鉴定可产生结合特定抗原的分子的细 胞。

上述方法可以有许多变体。例如,不使用图6所示结构,可以使 用如图2所示的结构,并将接头肽编码区嵌在重组位点内。这是上述 内含功能的重组位点的一个例子。

作为另一例子,也可以制备由两条抗体轻链和两条抗体重链组成 的单链抗原结合蛋白。可以对这些单链抗原结合蛋白进行设计以便相 连形成多价抗原结合复合物。再使用图2所示结构举例说明,DNA-A 和DNA-B均可以编码例如突变形式的抗体轻链可变区。在相似载体的 相同位点或在设计用于插入4个核酸插入片段的载体的另一位点上, DNA-A和DNA-B均可以编码例如突变形式的抗体重链可变区。然后可 以筛选表达两个单链抗原结合蛋白的细胞,以鉴定例如可产生具有针 对特定抗原的特异性的多价抗原结合复合物的细胞。

因此,本发明方法可以用于例如制备和筛选组合文库以鉴定产生 对特定表位具有特异性的抗原结合蛋白(例如抗体和/或包含重链可变 区或轻链可变区的抗体片段或抗体片段复合物)的细胞。本发明也包括 用于制备抗原结合蛋白的方法、和通过本发明方法制备的抗原结合蛋 白。 实施例2:使用LR反应同时克隆两个核酸片段以将这些区段接合起来 并使用BP反应将这些区段插入载体中

正如图3所示,侧翼有attB重组位点和attL重组位点的第一核 酸区段可以和侧翼有与第一核酸区段上的attL位点相容的attR重组 位点以及可以与第一区段上attB位点相同或不同的attB位点的第二 核酸区段接合。图3显示了两个attB位点不同的实施方案。这两个区 段可以在BP反应中和含有attP位点的载体接触。

随后的LR反应将产生由被attP位点或attB位点(LR反应的产物) 分开的DNA-A和DNA-B组成的、克隆在载体主链中的产物。在图3所 示实施方案中,attL和attR位点按一定方式排列以致重组后这两个 区段间产生一个attP位点。在优选实施方案中,重组后,这两个区段 可以被attB位点分开。

本领域技术人员无需繁琐实验即可以容易地优化用于实施上述反 应的条件。在一个典型反应中,可以将约50ng至约100ng载体和待克 隆的片段在适当反应条件下接触。每个片段可以以约25∶1至约1∶25 的载体∶片段摩尔比存在。在一些实施方案中,其中一或多个片段可以 以约10∶1至1∶10的载体∶片段摩尔比存在。在一个优选实施方案中, 每个片段可以以约1∶1的载体∶片段摩尔比存在。

典型地,可以将核酸溶解在水性缓冲液中然后加入反应混合物。 一组适当的条件是:4μl CLONASETM酶混合物(例如Invitrogen Corp., Life Technologies Division,Catl.Nos.11791-091和11789-013)、 4μl 5×反应缓冲液和核酸及水,至终体积20μl。这典型地导致在20μl BP反应中包括约200ng Int和约80ng IHF,而在20μl LR反应中包 括约150ng Int、约25ng IHF和30ng Xis。

在一些优选实施方案中,尤其是attL位点和attR位点重组的那 些实施方案中,终反应混合物可以包括约50mM Tris HCl(pH 7.5)、 约1mM EDTA、约1mg/ml BSA、约75mM NaCl和约7.5mM亚精胺以 及重组酶和待组合的核酸。在其它优选实施方案中,尤其是attB位点 和attP位点重组的那些实施方案中,终反应混合物可以包括约25mM Tris HCl(pH 7.5)、约5mM EDTA、约1mg/ml牛血清白蛋白(BSA)、 约22mM NaCl和约5mM亚精胺。

当期望进行BP和LR反应而在之间不进行核酸纯化时,首先可以 进行BP反应,然后通过加入LR CLONASETM酶和浓NaCl将反应条件调 节至约50mM NaCl、约3.8mM亚精胺、约3.4mM EDTA和约0.7mg/ml 牛血清白蛋白(BSA)。可以在适当的温度下例如22℃孵育反应溶液约 60分钟至16小时。重组反应后,该溶液可以用于转化感受态宿主细 胞并按上述筛选宿主细胞。

以下是“单管”反应实验方案的一个例子,该实验方案可以促进 PCR产物在一个单一试管内发生的两步骤反应中直接转移至表达克隆 上。该实验方案也可以用于将基因从一个表达克隆质粒主链转移至另 一个。首先在质粒主链内线性化该表达克隆,以便获得BP反应的最佳 拓扑结构并消除由于共转化导致的假阳性集落。

使用以下成分在1.5ml管中制备25μl BP反应混合物:

attB DNA(100-200ng)               1-12.5μl

attP DNA(pDONR201)150ng/μl       2.5μl

BP反应缓冲液                      5.0μl

TE                                至20μl

BP Clonase                        5.0μl

总体积                            25μl

混合试管中内容物并25℃孵育4小时、或更长。如果从含有 GATEWAYTM pDONR或pDEST载体上的选择标记(Kanr或ampr)的质粒模板 扩增PCR产物,则可以用限制性内切酶DpnI处理该PCR产物以降解该 质粒。这些质粒是转化GATEWAYTM反应物时假阳性菌落的潜在来源。而 且,当用于PCR的模板或起始表达克隆具有和终目的载体相同的选择 标记(例如ampr)时,铺在含有100μg/ml氨苄青霉素的LB平板上可 以测定延续至LR反应步骤的假阳性菌落数量。

将5μl反应混合物转移至加有0.5μl蛋白酶K溶液的不同管中。 然后37℃孵育该管10分钟。然后用1-2μl混合物转化100μl感受态 细胞,并铺在含有50μg/ml卡那霉素的LB平板上。这就产生可以用于 分离单个进入克隆和用于评价BP反应效率的菌落。

将以下成分加入上述剩余的20μl BP反应物中:

NaCl                  0.75M           1μl

目的载体              150ng/μl       3μl

LR Clonase                            6μl

总体积                                30μl

然后25℃孵育混合物2小时,之后加入3μl蛋白酶K溶液,37℃ 再孵育10分钟。然后使用1-2μl该混合物转化100μl感受态细胞, 然后将细胞铺在含有100μg/ml氨苄青霉素的LB平板上。 实施例3:通过在BP反应和随后的LR反应中将attB位点转变为一对 反应性位点attL和attR,使用片段克隆PCR产物

使用与实施例2所示相似的策略重组两个PCR产物然后同时将它 们克隆在载体主链中。由于attL和attR位点分别长100和125个碱 基对,而且因为attB位点长25个碱基对,因此可能期望将attB位点 掺入PCR引物中。根据attB相对于转移的核酸区段的取向,可以通过 BP反应将attB位点转变为attL或attR位点。因此,attB位点在attB PCR引物中的取向决定了attB位点是转变成attL还是attR。这就使 该GATEWAYTM系统和本发明方法可以极为灵活地使用多种具有独特特 异性的att位点。

正如图4所示,由侧翼有具有不同特异性的突变attB位点(例如 attB1和attB3)的区段A、和侧翼有具有不同特异性的突变attB位点 的区段B组成的两个区段(例如PCR产物),其中区段A上的一个attB 位点与区段B上的一个attB位点相同(例如区段B可以含有attB3和 attB2位点),可以将这两个区段接合起来并插入载体中。这些区段可 以单独地或一起和含有两个attP位点的载体在BP反应中发生反应。 或者,这些attP位点可以存在于线性区段上。一个载体含有与区段A 上存在的attB位点相容的attP位点(例如attP1和attP3位点)。另 一载体含有与区段B上存在的attB位点相容的attP位点(例如attP3 和attP2位点)。当使用线性区段提供attP位点时,每个attP位点均 可以在区段上提供。attB3和attP3位点有一定取向以致在DNA-B区 段的5’末端产生attR3位点,而在区段A的3’末端产生attL3位点。 将所获进入克隆与目的载体在随后的LR反应中混合以产生由被attB3 位点分开的DNA-A和DNA-B组成的、克隆在目的载体主链中的产物。

我们已使用此基本方案连接了两个区段,即与attR3-片段 B-attL2进入克隆反应的attL1片段-A-attL3进入克隆,并将该连接 的片段插入目的载体中。为了制备适当的进入克隆,我们构建了由 attP1-ccdB-attP3和attP3R-ccdB-attP2组成的两个attP供体载体, 以便它们能够和适当的attB PCR产物反应以将attB位点转化为attL 和attR位点。名称attP3R用于指attP3位点具有一定取向,以致与 具有关连attB位点的DNA区段反应可以导致在该区段上产生attR位 点。图4对此作了示意性表示,与区段A相比区段B上attB3的打点 部分和划线部分具有相反取向。在区段B上打点部分邻近区段,而区 段A上划线部分邻近区段。

通过构建以下DNA区段举例说明该方法,在该DNA区段中四环素 抗性基因(tet)与β半乳糖苷酶基因重组以致这两个基因在产物中被 attB位点分隔开。用5’-attB1和3’-attB3末端PCR扩增该tet基因。 用5’-attB3R和3’-attB3末端PCR扩增lacZ基因。用聚乙二醇(PEG) 沉淀这两个PCR产物。使用标准操作将B1-tet-B3 PCR产物和 attP1-ccdB-attP3供体载体混合并和BP CLONASETM反应,以产生 attL1-tet-attL3进入克隆。使用标准技术分离正确的tet进入克隆 并制备质粒DNA。按相似方式,将attB3R-lacZ-attB2 PCR产物和 attP3R-ccdB-attP2供体载体混合并与BP CLONASETM反应以产生 attR3-lacz-attL2进入克隆。

为了将这两个区段接合在单个载体中,在20μl反应体积中制备含 有以下成分的LR CLONASETM反应物:60ng(25fmoles)超螺旋tet 进入克隆;75ng(20fmoles)超螺旋lacZ进入克隆;150ng(35fmoles) 用NcoI线性化的pDEST6(描述在PCT公开文本WO 00/52027中,完 整的公开并入本文作为参考);4μl反应缓冲液和4μl LR CLONASETM。 终反应混合物含有51mM Tris·HCl、1mM EDTA、1mg/ml BSA、76mM NaCl、 7.5mM亚精胺、160ng Int、35ng IHF和35ng Xis。25℃孵育该反 应物过夜,用2μl蛋白酶K溶液(2mg/ml)终止反应。使用2μl试样转 化100μl大肠杆菌DH5α LE细胞并铺在含有氨苄青霉素和XGal的平 板上。在与细胞的转化混合物中产生约35,000个菌落,效率为1.6×108 cfu/μg pUC DNA。所有菌落均表现出蓝色,说明存在lacZ基因。在含 有四环素和XGal的平板上对24个菌落划线。测试的所有菌落,24/24, 均抵抗四环素。使用12个菌落接种2ml含有氨苄青霉素的LB培养液 用于小量制备。12/12小量制备物含有正确长度(7kb)的超螺旋质粒。

在一些实施方案中,正如图5所示,可以使两个区段和含有单一 重组位点的载体反应,以便将区段上的其中一个重组位点转变为不同 的重组位点。在一些实施方案中,含有attB位点的区段可以和具有 attP位点的靶载体反应。例如,区段A和B可以一起或单独地和具有 attP3位点的载体反应,以便将区段上的attB3位点分别转变为attL3 和attR3。这样,这两个区段间的随后LR反应就导致它们通过attB 位点相接合。可以使用含有attP位点的载体,在重组反应之前、同时 或之后将这些区段接合起来,以便转变这些位点以产生由侧翼有attL1 和attL3的DNA-A和侧翼有attR3和attL2的DNA-B组成的共合体分 子。随后的LR反应将产生由attB3分隔开的DNA-A和DNA-B组成的、 克隆在载体主链中的产物克隆。

在一些实施方案中,设计以便将用于连接这些区段的attB转变为 一对反应性位点attL和attR的attP位点可以以较短区段(例如限制 性片段、合成的寡核苷酸双链、或PCR片段)的形式提供。在BP反应 中包含线性片段的反应物可能要求较长的孵育时间,例如孵育过夜。

也可以单独通过PCR将attB位点转变为attL或attR位点。含有 attL或attR位点的PCR引物可以用于扩增在末端具有attB位点的区 段。由于attL和attR的序列含有attB位点序列的一部分,因此在此 情况下attB位点充当可以和attL或attR PCR引物退火的重叠区。退 火的attL或attR引物向PCR产物末端的延伸将产生融合模板,使用 与attL或attR位点末端退火的侧翼引物该模板可以用于PCR扩增全 长PCR产物。PCR反应的引物可以以单链寡核苷酸形式提供。在一些 优选实施方案中,这些引物以双链形式,例如作为PCR反应产物提供 以扩增attL或attR位点。 实施例4:将两个或更多个核酸片段克隆在同一载体的不同位置

可以同时将两个或更多个核酸片段克隆在具有多组重组位点的载 体的不同区域,每组重组位点位于一个选择标记侧翼。在一些实施方 案中,其中的一或多个选择标记可以是负选择标记。

正如图6所示,可以作为不连续片段或作为较大核酸分子如质粒 的一部分存在的两个核酸区段A和B,可以同时被克隆在同一目的载 体中。侧翼有彼此不相重组的重组位点(例如attL1和attL2)的核酸 区段A(DNA-A)、和侧翼有彼此不相重组并且不与区段A侧翼的位点重 组的重组位点(例如attL3和attL4)的核酸区段B(DNA-B),可以在一 个LR反应中和目的载体组合。该目的载体将含有两对重组位点,每一 对均经过选择以和位于其中一个区段侧翼的位点重组。作为一个例子, 图6显示了各位于ccdB负选择标记侧翼的两对attR位点 (attR1/attR2和attR3/attR4)。这三个核酸可以在一个单一的LR反 应中组合。所获产物将由克隆在目的载体不同区域的侧翼有attB位点 对的DNA-A和DNA-B组成。

正如图7所示,使用BP反应可以以类似方式将核酸区段插入载体 中。例如,侧翼有重组位点attB1和attB2的DNA-A可以和侧翼有重 组位点attB3和attB4的DNA-B及含有attP位点的载体在BP反应中 组合。所获产物将由克隆在载体不同区域的attL位点对之间的DNA-A 和DNA-B组成。在一些实施方案中,可能期望将区段连续地插入靶载 体中并分离包含仅其中一个区段的中间分子。

所有位点并不一定都来源于相同重组系统。例如,一个区段的侧 翼可以是lox位点,而另一区段的侧翼有att位点。一个区段可以在 一末端具有lox位点,而在另一末端具有att位点或在一个末端具有 frt位点。本领域技术人员可以设想出各种位点组合,这些组合均在 本发明范围内。

在一些实施方案中,正如图6和7所示,可能期望分离反应的中 间物。例如,可能期望分离具有仅其中一个插入区段的载体。该中间 物可以就如此使用或可以充当随后重组反应的底物以便插入第二个区 段。

在一些实施方案中,本发明是克隆n个核酸区段的方法,其中n 是大于1的整数,该方法包括步骤:提供n个核酸区段,每个区段的 侧翼有两个独特的重组位点;提供包含2n个重组位点的载体,其中 2n重组位点的每个均能够和其中一个核酸区段侧翼的其中一个重组位 点重组;实施重组反应,以便使该n个核酸区段重组入载体中,籍此 克隆此n个核酸区段。在其它实施方案中,该载体包含n个拷贝的选 择标记,每个拷贝的选择标记侧翼有两个重组位点。在其它实施方案 中,该载体包含两个或更多个不同的选择标记,每个选择标记的侧翼 有两个重组位点。在一些实施方案中,其中一或多个选择标记可以是 负选择标记。

在一些实施方案中,本发明提供克隆方法,包括步骤:提供第1、 2和3核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点, 该第2核酸区段的侧翼有第3和第4重组位点、而该第3核酸区段的 侧翼有第5和第6重组位点,其中该第2重组位点能够和第3重组位 点重组,而第1、4、5、6重组位点均不能和第1至第6重组位点中的 任一个重组;提供包含位于第一选择标记侧翼的第7和第8重组位点 以及位于第二选择标记侧翼的第9和第10重组位点的载体,其中该第 7至第10重组位点均不能与第7至第10重组位点中的任一个重组; 实施第一重组反应,以便第2和第3重组位点发生重组;实施第二重 组反应,以便第1和第4重组位点分别和第7和第8重组位点重组、 而第5和第6重组与第9和第10重组位点重组,由此克隆该第1、2 和3核酸区段。

在一些实施方案中,核酸区段可以包含发挥启动子作用的序列。 在一些实施方案中,该第1和第2核酸区段可以包含编码多肽的序列, 而重组将这两个多肽放置在同一阅读框中。在一些实施方案中,核酸 区段可以包含发挥转录终止序列功能的序列。

本发明为核酸和蛋白质的模块构建提供了极为多样的方法。插入 的核酸区段和载体均可以含有经过选择的序列,以致可以赋予产物分 子期望的特性。在以图6和7作为例子的那些实施方案中,除了插入 区段外,载体中与插入区段相邻的一或多个部分以及分隔插入区段的 载体部分可以含有一或多个经选择的序列。

在一些实施方案中,这些选择的序列可以编码核酶、表位标签、 结构域、选择标记、内部核糖体进入序列、启动子、增强子、重组位 点等。在一些优选实施方案中,分隔插入区段的载体部分可以包括一 或多个侧翼有一对反应性重组位点的选择标记,以及用于插入这些核 酸区段的重组位点。

该方法将尤其适合于构建基因靶向载体。例如,重组位点对之间 的载体区段可以编码一或多个选择标记例如新霉素抗性基因。区段A 和B可以含有经选择的核酸序列,以致它们与待破坏的基因靶标的一 部分一致或基本一致。在重组反应后,目的载体将含有位于正选择标 记侧翼的目的基因的两个部分。然后可以使用任何常规技术,例如转 染,将该载体插入细胞中,于是载体上的目的基因部分可以和该基因 的基因组拷贝的同源部分发生重组。含有该插入载体的细胞可以基于 选择标记所赋予的一或多种特性进行选择,例如,在选择标记是新霉 素抗性基因时,可以基于细胞对G-418的抗性进行选择。

在一些实施方案中,可以将一或多个负选择标记包括在不含靶基 因区段和正选择标记的目的载体载体中。一或多个负选择标记的存在 将允许选择除去基因组中插入了完整的目的载体的细胞、或选择除去 目的载体在其中以染色体外方式维持的细胞。

在一些优选实施方案中,可以在用于插入核酸区段的重组位点的 附近放置其它的重组位点。在可能期望在打靶后从所靶向的基因中除 去选择标记的基因打靶应用中,即所谓的“hit and run”技术,此类 分子是有用的。本领域技术人员将明了,含有同源序列的区段并不必 与基因序列相符。在一些情况下,可以对序列进行选择,以便其与基 因外的染色体位置同源。

该方法也十分适合于构建双顺反子表达载体。在一些实施方案中, 含有双顺反子表达元件的表达载体中,两个结构基因从一个启动子表 达并通过内部核糖体进入序列(IRES,见Encarnacion,Current Opinion in Biotechnology 10:458-464(1999),特此并入本文作为 参考)分开。可以使用这些载体从单一一个结构表达两个蛋白。

在一些实施方案中,可以不必控制其中一或多个核酸区段的取向, 而且可以在该区段的两个末端使用相同特异性的重组位点。参考图6, 如果区段A相对于区段B的取向并不关键,则L1位点可以位于区段A 侧翼的两个末端上,而载体装备两个R1位点。在形成区段A和B的组 合文库过程中,这可能对于产生额外的复杂性是有用的。 实施例5:将多个片段组合在载体的单个位点中

在一些实施方案中,本发明提供克隆n个核酸区段的方法,其中n 是大于1的整数,该方法包括步骤:提供第1至第n个核酸区段,每 个区段的侧翼有两个独特的重组位点,其中这些重组位点经选择以致 位于第i区段ni侧翼的两个重组位点之一和位于第ni-1区段侧翼的重 组位点之一反应,而位于第i区段侧翼的另一重组位点与位于第ni+1 区段侧翼的重组位点之一反应;提供包含至少两个重组位点的载体, 其中载体上这两个重组位点的一个与第1核酸区段上的一个位点反 应,而载体上的另一位点和第n核酸区段上的一个重组位点反应。本 发明的再一目的是提供克隆方法,该方法包括步骤:提供第1、2、3 核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点、第2 核酸区段的侧翼有第3和第4重组位点、而第3核酸区段的侧翼有第 5和第6重组位点,其中该第2重组位点能够和第3重组位点重组, 而第4重组位点能够和第5重组位点重组;提供具有至少第7和第8 重组位点的载体,以便该第7重组位点能够和第1重组位点反应而第 8重组位点能够和第6重组位点反应;实施至少一次重组反应,以便 第2和第3重组位点重组、第4和第5重组位点重组、第1和第7重 组位点重组,而第6和第8重组位点重组,由此克隆该第1、2、3核 酸区段。在一些实施方案中,至少一个核酸区段包含发挥启动子功能 的序列。

在一些实施方案中,至少两个核酸区段包含编码多肽的序列,而 重组将这两个多肽放入同一个阅读框中。在一些实施方案中,至少一 个核酸区段包含发挥转录终止序列功能的序列。在一些实施方案中, 至少一个片段包含复制起点。在一些实施方案中,至少一个片段包含 编码选择标记的序列。

此实施方案以图8和9作为例子进行说明,在此情况下n=3。在此 实施方案中,本发明提供克隆方法,该方法包括步骤:提供第1、2、 3核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点、第2 核酸区段的侧翼有第3和第4重组位点、而第3核酸区段的侧翼有第 5和第6重组位点,其中该第2重组位点能够和第3重组位点重组, 而第4重组位点能够和第5重组位点重组;提供包含第7和第8重组 位点的载体;并实施至少一次重组反应,以便第2和第3重组位点重 组、第4和第5重组位点重组、第1和第6重组位点分别和第7和第 8重组位点重组,由此克隆该第1、2、3核酸区段。

正如以上讨论的,当指定区段的取向不关键时,可以修饰本发明, 将具有相同特异性的重组位点放置在指定区段的两个末端,并相应地 调整邻近区段的重组位点和/或载体中的重组位点。

除了上述讨论的在单个载体中组合两个片段的用途外,此类实施 方案可以用于从含有各种功能的单个片段构建载体。因此,本发明提 供构建载体的模块方法。

在一些实施方案中,至少一个核酸区段包含发挥启动子功能的序 列。在一些实施方案中,至少两个核酸区段包含编码多肽的序列,而 重组将这两个多肽放入同一阅读框中。在一些实施方案中,至少一个 片段包含复制起点。在一些实施方案中,至少一个片段包含编码选择 标记的序列。在一些实施方案中,一个片段可以包含编码一个以上功 能的序列。在一些实施方案中,一个片段可以包含编码复制起点的序 列和编码选择标记的序列。

当使用本发明方法将多个核酸区段插入载体中时,这些区段的表 达可以由相同调节序列或不同调节序列驱动。图20A显示含有两个插 入DNA区段的载体的一个例子,其表达由不同的启动子驱动(即两个不 同T7启动子)。

本发明方法还可以用于制备允许在体内造成基因沉默的结构。一 个使基因沉默的方法涉及制备称作干扰RNA(RNA interference,RNAi) 的双链RNA。(见例如Mette等,EMBO J.,19:5194-5201(2000))。 本发明方法可以按多种方式用于制备RNAi等分子。因此,可以使用本 发明核酸分子的表达产物造成基因表达的沉默。

图20B显示了设计以产生RNAi的结构的一个例子。在此结构中, 将DNA区段插入载体中,以便相应于两条链的RNA可以作为两个不同 的转录本产生。图20C显示了设计以产生RNAi的结构的另一例子。在 此结构中,两个拷贝的DNA区段被插入载体中以致也产生相应于两条 链的RNA。图20D显示了设计以产生RNAi的结构的再一例子。在该结 构中,将两个拷贝的DNA区段插入载体中,以便相应于两条链的RNA 以单个转录本的形式产生。图20E显示的示例性载体系统包含两个载 体,每个载体含有相同DNA区段的多个拷贝。这些DNA区段之一的表 达导致产生有义RNA,而另一个的表达导致产生反义RNA。因此,从图 20B-20E给出的载体产生的RNA链将具有互补核苷酸序列,一般可以 在生理条件下彼此杂交或发生分子内杂交。

设计以产生RNAi的核酸区段,如图20B-20E所示载体,不一定与 全长基因或可读框相对应。例如,当核酸区段相应于ORF时,该区段 可以仅相应于该ORF的一部分(例如该ORF 5’和3’末端的50个核苷 酸)。而且,尽管图20B-20E显示了设计以产生RNAi的载体,但核酸 区段也可以以其它形式(例如插入宿主细胞的染色体中)发挥相同功 能。

例如,涉及使用RNAi和反义RNA等化合物的基因沉默方法,对于 鉴定基因功能尤其有用。例如,基因沉默方法可以用于减低或防止一 或多个基因在细胞或生物体中的表达。然后,可以使用与功能的选择 性抑制有关的表型表现,确定此“沉默”基因的作用。作为一个例子, Chuang等,Proc.Natl.Acad.Sci.(USA)97:4985-4990(2000) 证明,在鼠芥(Arbidopsis thaliana)中体内产生RNAi可以改变基 因活性。因此,本发明提供调节细胞和组织中核酸分子表达(包括RNAi 和反义RNA的表达)的方法。本发明还提供方法,以制备能够用于产 生相应于DNA分子一或两条链的RNA的核酸分子。

类似地,本发明涉及用于有核酶参与的基因沉默的化合物和方法。 尤其是,本发明提供反义RNA/核酶融合物,该融合物包含(1)相应于 靶基因的反义RNA和(2)切割RNA的一或多个核酶(例如,锤头核酶、 发夹核酶、δ核酶、四膜虫(Tetrahymena)L-21核酶等)。而且,本发 明提供了表达这些融合物的载体、制备这些载体的方法、和使用这些 载体抑制基因表达的方法。

在一个实施方案中,构建编码与ccdB基因相邻的核酶的目的载体, 其中该ccdB基因的侧翼有attR位点。使用LR反应,以便用当表达时 产生反义RNA分子的核酸分子替换该ccdB基因。由此,表达产物将导 致产生通过attB位点编码的间隔序列与核酶融合的反义序列。正如以 下实施例13所讨论的,如果期望的话,可以从该转录本中除去该attB 位点,或在某些情况下,可以将编码核酶的核酸嵌在该attB位点中。

例如,与核酶融合的反义分子的表达可以用于切割细胞中的特异 RNA分子。这正是因为转录本的反义RNA部分可以设计以便和特定的 mRNA分子杂交。而且,转录本的核酶部分可以设计以切割与它杂交的 RNA分子。例如,该核酶可以是切割双链RNA的核酶(例如四膜虫L-21 核酶)。 实施例6:使用抑制型tRNA产生融合蛋白

上述近来发展的重组克隆技术允许将靶核酸从一个载体背景中快 速移动到一或多个其它载体背景中。因为重组时间是位点特异性的, 所有可以相对载体控制靶核酸的取向和阅读框。这种控制使得构建靶 核酸序列和载体序列之间的融合成为一件简单的事。

一般地说,可以以四种形式表达基因:氨基和羧基端均是天然的, 在任一端经过修饰、或两端均经过修饰的形式。含有目的靶基因的结 构可以包括N端甲硫氨酸的ATG密码子和羧基端的终止密码子。常常 该基因结构包括可以位于ATG上游允许基因表达的翻译起始序列tis, 即tis-ATG-ORF-终止密码子。此结构允许基因表达成含有与天然未克 隆蛋白相同的氨基和羧基氨基酸的蛋白质。当此结构与氨基端蛋白标 签如GST按符合阅读框的方式融合时,此标签具有其自己的tis,因 此该结构是tis-ATG-标签-tis-ORF-终止密码子,而包含该ORF的tis 的碱基将翻译为标签和ORF之间的氨基酸。此外,在mRNA的内部(即 在ORF的ATG而非标签的ATG)可以预期一定水平的翻译起始,导致 一定量的天然蛋白质表达而污染期望蛋白质。

DNA(小写字母):tis1-atg-标签-tis2-atg-orf-终止密码子

RNA(小写字母,斜体):tis1-atg-标签-tis2-atg-orf-终止密码子

蛋白质(大写字母):ATG-标签-TIS2-ATG-ORF(tis1和终止密码 子不翻译)+污染的ATG-ORF(ORF自tis2开始翻译)。

使用重组克隆,构建含有临近重组位点的标签的载体,从而使标 签和目的ORF的C和/或N端按符合阅读框的方式融合,这对于本领域 技术人员而言是简单的。

如果能够在多种载体中快速构建大量克隆,则本领域需要使无需 操作基因结构本身而可以表达单个克隆基因的方式最大化。本发明使 用一或多个抑制型tRNA抑制翻译在终止密码子处的终止,通过提供控 制靶基因的C和/或N端融合表达的材料和方法满足了此需要。因此, 本发明提供了材料和方法,以制备侧翼有重组位点的基因结构。

优选地,在编码目的蛋白质的基因的C端使用编码终止密码子的 序列来制备该结构。在一些实施方案中,可以将终止密码子置于基因 临近位置,例如在位于基因侧翼的重组位点内。可以通过重组将靶基 因结构转移至能够向目的基因提供各种C端或N端标签(例如GFP、 GST、His标签、GUS等)的各种载体中。当终止密码子位于基因羧基端 时,在非抑制条件下(即当抑制型tRNA不表达时)将表达具有“天然” 羧基末端氨基酸序列的基因,而在抑制条件下基因将表达为羧基融合 蛋白。本发明使用琥珀抑制基因supF为例,该基因是经突变识别UAG 终止密码子的特定酪氨酸tRNA基因(tyrT)。本领域技术人员将明了, 可以使用其它抑制基因和其它终止密码子实施本发明。

本实施例中,我们将编码抑制型tRNA的基因掺入表达靶基因的载 体。在其它实施方案中,编码抑制型tRNA的基因可以存在于宿主细胞 的基因组中。在再其它实施方案中,编码抑制蛋白的基因可以位于不 同的载体上并反式提供抑制蛋白。在此类实施方案中,含有抑制蛋白 基因的载体可以具有经选择与含有基因结构的载体相容的复制起点。 该相容载体的选择和制备属于本领域普通技术。本领域技术人员将明 了,对用于反式提供抑制型tRNA的适当载体的选择可以包括选择适当 的抗生素抗性标记。例如,如果表达靶基因的载体含有针对一种抗生 素的抗生素抗性标记,则用于提供抑制型tRNA的载体可以编码对另一 抗生素的抗性。这就使得可以选出同时含有这两个载体的宿主细胞。

在一些优选实施方案中,可以在上述所有实施方案中提供一个以上 拷贝的抑制型tRNA。例如,可以提供含有多个拷贝编码抑制型tRNA的 基因的宿主细胞。或者,可以在与目的靶基因相同的载体背景中提供处 于相同或不同启动子下的多个抑制型tRNA基因拷贝。在一些实施方案 中,可以在与用于包含目的靶基因的载体不同的载体中提供多个拷贝的 抑制型tRNA。在其它实施方案中,可以在含有编码目的蛋白的基因的 载体上和/或在另一载体上和/或在宿主细胞的基因组中或以上的组合 中,提供一或多个拷贝的抑制型tRNA基因。当提供一个以上拷贝的抑 制型tRNA基因时,这些基因可以从相同或不同的启动子表达,而且这 些启动子可以和用于表达编码目的蛋白的基因的启动子相同或不同。

在一些实施方案中,可以提供两个或更多个不同的抑制型tRNA基 因。在此类实施方案中,可以以多拷贝提供一或多种单个抑制基因, 而且特定抑制型tRNA基因的拷贝数可以和另一抑制型tRNA基因的拷 贝数相同或不同。每个抑制型tRNA基因独立于任何其它抑制型tRNA 基因可以在用于表达目的基因的载体上和/或不同载体上和/或宿主细 胞的基因组中提供。在有些实施方案中,可以在一个以上的位置提供 指定tRNA基因。例如,可以在含有目的基因的载体上提供一个拷贝的 抑制型tRNA,而在另一载体上和/或在宿主细胞基因组中再提供一或 多个拷贝。当提供一个以上拷贝的抑制型tRNA基因时,可以从相同或 不同的启动子表达这些基因,而且这些启动子可以和用于表达编码目 的蛋白的基因的启动子相同或不同,并且可以和用于表达不同tRNA基 因的启动子相同或不同。

参考图14,按符合阅读框的方式克隆GUS基因与GST基因,两者 被TAG密码子分开。该质粒还含有编码抑制型tRNA的supF基因。将 该质粒导入宿主细胞中,在该细胞中大约60%的GUS基因表达为含有 GST标签的融合蛋白。在对照实施方案中,当从缺少supE基因的载体 表达时,含有相同GUS-终止密码子-GST结构的质粒不表达产生可检测 量的融合蛋白。在此实施例中,supF基因作为含有GUS-GST融合物的 mRNA的一部分表达。由于tRNA一般是从较大的RNA分子加工来的, 所以此类结构可以用于表达本发明抑制型tRNA。在其它实施方案中, 含有tRNA序列的RNA可以与含有目的基因的mRNA分开表达。

在本发明一些实施方案中,目的靶基因和表达抑制型tRNA的基因 可以由相同启动子控制。在其它实施方案中,目的靶基因可以从与抑 制型tRNA的启动子不同的启动子表达。本领域技术人员将明了,在某 些情况下,可能期望使用可调节的启动子控制抑制型tRNA和/或目的 靶基因的表达。例如,可以通过lac启动子或其衍生物如tac启动子 等启动子,控制目的靶基因和/或表达抑制型tRNA的基因。在所示实 施方案中,目的靶基因和抑制型tRNA基因均从T7 RNA聚合酶启动子 表达。T7 RNA聚合酶的诱导开启了目的基因(在本情况下是GUS)和将 抑制型tRNA表达为一个RNA分子的一部分的supF基因两者的表达。

在一些优选实施方案中,抑制型tRNA基因的表达可以处于与目的基 因的启动子不同的启动子的控制下。在一些实施方案中,可以在靶基因 表达前表达抑制基因。这就使得可以在需要抑制因子通过抑制终止密码 子来实现融合蛋白表达之前,将抑制因子的水平累积至一个高水平。例 如,在抑制基因受控于可用IPTG诱导的启动子的本发明实施方案中, 靶基因受控于T7 RNA聚合酶启动子,而T7 RNA聚合酶的表达又受到非 IPTG的诱导信号如NaCl所诱导的启动子的控制,这样就可以在诱导T7 RNA聚合酶基因以及随后表达目的基因之前,使用IPTG开启抑制型tRNA 的表达。在一些优选实施方案中,可以在诱导T7 RNA聚合酶基因之前 约15分钟至约1小时,诱导抑制型tRNA的表达。在一个优选实施方案 中,可以在诱导T7 RNA聚合酶基因之前约15分钟至约30分钟,诱导 抑制型tRNA的表达。在所示具体实施例中,T7 RNA聚合酶基因的表达 处于盐可诱导的启动子的控制下。具有在盐可诱导的启动子控制下的诱 导型T7 RNA聚合酶基因拷贝的细胞系可从Invitrogen Corp.,Life Technologies Division购买获得,产品名为BL21 SI株。

在一些优选实施方案中,可以按反馈环形式安排目的靶基因和抑 制型tRNA的表达。例如,可以将目的靶基因置于T7 RNA聚合酶启动 子的控制下,而将抑制基因置于T7启动子和lac启动子的控制下,T7 RNA聚合酶基因本身由T7启动子和lac启动子转录,而且T7 RNA聚 合酶基因具有一个琥珀终止密码子突变替代了正常的酪氨酸终止密码 子,例如(883个密码子中的)第28位密码子。在抑制因子的水平足够 高以能够给出显著抑制之前,不能产生活性T7 RNA聚合酶。然后,由 于T7聚合酶表达抑制基因以及其自身,该聚合酶的水平快速上升。在 其它优选实施方案中,仅抑制基因从T7 RNA聚合酶启动子表达。此类 实施方案无需产生过量T7 RNA聚合酶即可给出高水平的抑制因子。在 其它优选实施方案中,T7 RNA聚合酶基因具有一个以上的琥珀终止密 码子突变(见例如图14B)。这就要求在产生有效的T7 RNA聚合酶之前 有较高水平的抑制因子。

在本发明一些实施方案中,可能期望有一个以上可被一个以上抑 制型tRNA抑制的终止密码子。参考图15,构建载体以便允许从相同 结构中可调节地表达目的蛋白的N和/或C端融合物。图15中第一标 签序列TAG1是从图中箭头所指启动子表达。该标签序列包括与该标签 同一阅读框的终止密码子。终止密码子1可以位于标签序列的任何位 置,并优选位于标签序列的C端或近C端。该终止密码子还可以位于 重组位点RS1或内部核糖体进入序列(IRES)中。该结构还包括一个包 含终止密码子2的目的基因。该第一标签和目的基因优选位于同一阅 读框中,但将可造成移码致使第一标签与目的基因同一阅读框的序列 包括在内也属于本发明范围。终止密码子2与目的基因同一阅读框, 并优选位于该基因编码序列的末端或近末端。任选地,可以将终止密 码子2置于重组位点RS2内部。该结构还包括与目的基因在同一阅读框 中的第2标签序列,在图15中表示为TAG2,而且,该第二标签序列 可以任选地包括和该第2标签在同一阅读框中的终止密码子3。在该 结构中,可以在第二标签的编码序列后包括转录终止子(图15中未显 示)。终止密码子1、2和3可以相同或不同。在一些实施方案中,终 止密码子1、2和3是不同的。在1和2不同的实施方案中,可以使用 相同的结构,通过改变适当抑制型tRNA的表达,表达N端融合物、C 端融合物和天然蛋白质。例如,为了表达天然蛋白,则不表达抑制型 tRNA并由IRES控制蛋白的翻译。当期望表达N端融合物时,则表达 抑制终止密码子1的抑制型tRNA,而为了产生C端融合物,则表达抑 制终止密码子2的抑制型tRNA。在一些情况下,可能期望表达双重靶 向目的蛋白,在此时可以表达抑制终止密码子1和终止密码子2的抑 制型tRNA。

为了清楚地理解,本发明通过举例说明和实施例作了一定详细的 描述,本领域普通技术人员将明了,可以通过在一个宽的相当条件、 配方和其它参数范围内修饰或改变本发明以实施本发明,而不影响本 发明或其任何具体实施方案的范围,而且,这些修饰或改变均旨在包 括在所附权利要求的范围内。

实施例7:测试进入载体和目的载体的功能

作为本发明特定载体功能评价的一部分,重要的是功能性地测试 载体重组的能力。该评价可以通过实施重组克隆反应,然后转化大肠 杆菌并对菌落形成单位进行评分,来实现。然而,也可以进行另一测 试,通过琼脂糖凝胶电泳,允许更快速更简单地评价指定进入载体或 目的载体的功能。以下描述了此体外测试方法。

材料和方法:

使用质粒模板pEZC1301和pEZC1313(描述在PCT公开文本WO 00/52027中,其完整公开并入本文作为参考)(每个模板均含有一个 单一的野生型att位点),分别制备含有attL或attR位点的PCR产 物。用AlwNI使质粒模板线性化,酚抽提,乙醇沉淀并溶解在TE中至 1ng/μl浓度。

PCR引物(大写字母代表自野生型发生的碱基改变):

attL1       gggg agcct gcttttttGtacAaa gttggcatta taaaaaagca ttgc(SEQ ID

            NO:41)

attL2       gggg agcct gctttCttGtacAaa gttggcatta taaaaaagca ttgc(SEQ ID

            NO:42)

attL right  tgttgccggg aagctagagt aa(SEQ ID NO:43)

attR1       gggg Acaag ttTgtaCaaaaaagc tgaacgaga aacgtaaaat(SEQ ID

            NO:44)

attR2       gggg Acaag ttTgtaCaaGaaagc tgaacgaga aacgtaaaat(SEQ ID

            NO:45)

attR right  ca gacggcatga tgaacctgaa(SEQ ID NO:46)

将PCR引物溶解在TE中至500pmol/μl。制备由attL1+attL right 引物、由attL2+attL right引物、由attR1+attR right引物、以及 由attR2+attR right引物组成的引物混合物,每个混合物含有各引 物20pmol/μl。

PCR反应:

1μl质粒模板(1ng)

1μl引物对(各20pmol)

3μl H2O

45μl Platinum PCR SuperMix(Invitrogen Corp.,Life Technologies Division)

循环条件(在MJ热循环仪上进行):

95℃/2分钟

94℃/30秒

58℃/30秒和72/1.5分钟,25个循环,

72℃/5分钟

5℃/保持

所获attL PCR产物为1.5kb,而所获attR PCR产物为1.0kb.

PCR反应物通过加入150μl H2O和100μl 3X PEG/MgCl2溶液进行 PEG/MgCl2沉淀,之后离心。将PCR产物溶解在50μl TE中。通过凝胶 电泳1μl对PCR产物进行定量,估计为50-100ng/μl。

按下述实施含有attL或attR位点的PCR产物和GATEWAYTM质粒 的重组反应:

8μl H2O

2μl attL或attR PCR产物(100-200ng)

2μl GATEWAYTM质粒(100ng)

4μl 5X目的缓冲液

4μl GATEWAYTM LR ClonaseTM酶混合物

20μl总体积(可以在保持同样化学计量的同时,通过将成分的体 积调整为上述的约1/4,将反应物按比例下调为5μl的总体积)。

将Clonase反应物在25℃孵育2小时。然后在琼脂糖凝胶上电泳 10μl。通过attL1 PCR产物(1.0kb)和attR1 PCR产物(1.5kb)的反 应,并通过attL2 PCR产物和attR2 PCR产物的类似反应,作为阳性 对照反应,可以观察到较大(2.5kb)重组产物的形成。类似地,通过 attL1 PCR产物和attR2 PCR产物的反应以及反之或attL PCR产物和 attL质粒的反应,等,作为阴性对照。

在另一测试方法中,为了测试attB进入载体,我们使用了含有单 个attP位点的质粒。含有单个att位点的质粒也可以用作重组底物一 般地测试所有进入载体和目的载体(即,含有attL,attR、attB和 attP位点的那些载体)。这就消除了进行PCR反应的需要。

结果:

与不含attL或attR PCR产物的对照反应物相比,当与含有att 的适当PCR产物反应时,目的质粒和进入质粒形成能够容易地在琼脂 糖凝胶上观察到的线性重组分子。由此,可以例如通过进行上述线性 化分析确定根据本发明构建的目的载体和进入载体的功能。

实施例8:使用通用衔接子引物进行PCR克隆

如本文所述,使用GATEWAYTM PCR克隆系统(Invitrogen Corp., Life Technologies Division;Rockville,MD)克隆PCR产物,需要 在用于PCR反应的基因特异性引物的末端添加attB位点(attB1和 attB2)。现有数据提示,使用者在基因特异性引物上添加了29bp(含 有attB位点的25bp加上4个G残基)。使用通用attB衔接子引物 和与这些衔接子有指定重叠部分的较短基因特异性引物来产生含有 attB的PCR产物,对于大量GATEWAYTM PCR克隆系统的使用者而言是 有利的。以下实验使用通用attB衔接子引物和含有6bp至18bp各种 长度的重叠区的基因特异性引物证明了该策略的实用性。结果证明, 具有10bp至18b重叠区的基因特异性引物可以和通用attB衔接子引 物一起成功地用于PCR扩增产生全长PCR产物。然后,使用GATEWAYTM PCR克隆系统,可以按指定方向高度忠实地成功克隆这些PCR产物。

材料和结果:

为了阐明通用attB衔接子引物可以和含有部分attB位点的基因 特异性引物用于PCR反应中产生全长PCR产物,我们选择人血球蛋白 cDNA一个256bp的小区域作为靶标,以致可以通过琼脂糖凝胶电泳将 中间长度的产物与全长产物区分开。

使用以下寡核苷酸:

B1-Hgb:GGGG ACA AGT TTG TAC AAA AAA GCA GGC T-5′-Hgb*

(SEQ ID NO:47)

B2-Hgb:GGGG ACC ACT TTG TAC AAG AAA GCT GGG T-3′-Hgb**

(SEQ ID NO:48)

18B1-Hgb:             TG TAC AAA AAA GCA GGC T-5′-Hgb

(SEQ ID NO:49)

18B2-Hgb:             TG TAC AAG AAA GCT GGG T-3′-Hgb

(SEQ ID NO:50)

15B1-Hgb:                AC AAA AAA GCA GGC T-5′-Hgb

(SEQ ID NO:51)

15B2-Hgb:                AC AAG AAA GCT GGG T-3′-Hgb

(SEQ ID NO:52)

12B1-Hgb:                    AA AAA GCA GGC T-5′-Hgb

(SEQ ID NO:53)

12B2-Hgb:                    AG AAA GCT GGG T-3′-Hgb

(SEQ ID NO:54)

11B1-Hgb:                     A AAA GCA GGC T-5′-Hgb

(SEQ ID NO:55)

11B2-Hgb:                     G AAA GCT GGG T-3′-Hgb

(SEQ ID NO:56)

10B1-Hgb:                      AAA GCA GGC T-5′-Hgb

(SEQ ID NO:57)

10B2-Hgb:                       AAA GCT GGG T-3′-Hgb

(SEQ ID NO:58)

9B1-Hgb:                        AA GCA GGC T-5′-Hgb

9B2-Hgb:                        AA GCT GGG T-3′-Hgb

8B1-Hgb:                         A GCA GGC T-5′-Hgb

8B2-Hgb:                         A GCT GGG T-3′-Hgb

7B1-Hgb:                        GCA GGC T-5′-Hgb

7B2-Hgb:                        GCT GGG T-3′-Hgb

6B1-Hgb:                        CA GGC T-5′-Hgb

6B2-Hgb:                        CT GGG T-3′-Hgb

attB1衔接子:GGGG ACA AGT TTG TAC AAA AAA GCA GGC T

(SEQ ID NO:47)

attB2衔接子:GGGG ACC ACT TTG TAC AAG AAA GCT GGG T

(SEQ ID NO:48)

*-5′-Hgb=GTC ACT AGC CTG TGG AGC AAG A(SEQ ID

NO:59)

**-3′-Hgb=AGG ATG GCA GAG GGA GAC GAC A(SEQ ID

NO:60)

这些实验的目的在于开发一种简单而有效的通用衔接子PCR方法 以产生适用于GATEWAYTM PCR克隆系统的含有attB的PCR产物。该反 应混合物和热循环条件应简单而有效,以便该通用衔接子PCR方法可 以常规地适用于任何PCR产物克隆应用。

首先我们发现了使用含有18bp和15bp重叠的基因特异性引物和 通用attB引物能够成功地主要扩增全长PCR产物的PCR条件。这些条 件描述如下:

10pmol基因特异性引物

10pmol通用attB衔接子引物

1ng含有人血球蛋白cDNA的质粒

100ng人白细胞cDNA文库DNA

5μl 10X PLATINUM Taq HiFi反应缓冲液(Invitrogen Corp., Life Technologies Division)

2μl 50mM MgSO4

1μl 10mM dNTP

0.2μl PLATINUM Taq HiFi(1.0个单位)

加水至50μl总反应体积

循环条件:

为了评价该方法的效率,在3%琼脂糖-1000凝胶上电泳50μl PCR 反应物的2μl(1/25)。当重叠区为12bp或更少时,含有一个或不含 通用attB衔接子的较小中间产物在反应物中占优势。通过滴定基因特 异性引物和通用attB衔接子引物的量,对PCR反应条件作进一步优化。 出来所加引物的量不同外,按上述配制PCR反应物:

0、1、3或10pmol基因特异性引物

0、10、30或100pmol衔接子引物

循环条件:

使用限制量的基因特异性引物(3pmol)和过量的衔接子引物 (30pmol)减少了较小中间产物的量。使用这些反应条件,我们将为了 主要获得全长PCR产物所必需的重叠区减少至12bp。在以下PCR反应 中我们进一步对基因特异性引物和衔接子引物的量作了优化:

0、1、2或3pmol基因特异性引物;

0、30、40或50pmol衔接子引物

循环条件:

使用2pmol基因特异性引物和40pmol衔接子引物进一步减少了中 间产物的量并主要产生具有包含11bp重叠区的基因特异性引物的全 长PCR产物。在任何PCR应用中,可以通过无衔接子对照评价PCR反 应是否成功。当在标准琼脂糖凝胶上电泳1/25至1/10 PCR反应物时, 使用限制量的基因特异性引物应产生微弱的或几乎不可见的条带。加 入通用attB衔接子引物应产生强PCR反应,产物的整个产量要高得多。

使用CONCERT快速PCR纯化系统(大于500bp的PCR产物可以用 PEG沉淀),从使用具有18bp、15bp、12bp、11bp和10bp重叠区的 基因特异性引物进行的反应物中纯化PCR产物。随后使用GATEWAYTM PCR克隆系统(Invitrogen Corp.,Life Technologies Division; Rockville,MD)将该纯化的PCR产物克隆在含有attP的质粒载体中, 并转化大肠杆菌。在适当的抗生素培养基上选择菌落并计数,然后通 过PCR筛选具有正确插入片段和取向的菌落。

从具有部分人β珠蛋白(Hgb)基因的质粒克隆,利用attB衔接子 PCR产生的粗PCR产物(未纯化的),也用于GATEWAYTM PCR克隆系统 反应中。使用全长attB B1/B2-Hgb、12B1/B2、11B1/B2和10B1/B2 attB 重叠Hgb引物产生的PCR产物被成功地克隆在GATEWAYTM pENTR21 attP 载体(描述在PCT公开文本WO 00/52027中,其完整公开并入本文作为 参考)中。对于每个PCR产物测试了24个菌落(24×4=总共96),并通 过PCR验证了每个菌落均含有正确插入片段。以下显示了克隆效率, 表示为cfu/ml:   所用引物     cfu/ml   Hgb全长attB     8,700   Hgb 12bp重叠     21,000   Hgb 11bp重叠     20,500   Hgb 10bp重叠     13,500   GFP对照     1,300

有趣的是,重叠PCR产物的克隆效率比全长attB PCR产物的克隆 效率高,而且,可以推测,正如在琼脂糖凝胶上所观察到的,衔接子 PCR产物比全长attB PCR产物稍微清楚。菌落产生量的差异也可以反 映具有完整attB位点的PCR产物分子的比例。

使用attB衔接子PCR方法,用具有12bp attB重叠区的PCR引物 从白细胞cDNA文库和自Hela总RNA制备的第一链cDNA扩增不同大小 的cDNA(从1至4kb)。尽管通过该方法能够扩增此4种cDNA中的 三种,但也观察到非特异扩增产物,在某些条件下这些非特异产物将 干扰基因特异性扩增。此非特异产物是在仅含有attB衔接子引物且没 有任何基因特异性重叠引物存在的反应物中扩增产生的。我们通过增 加PCR反应的严紧性并降低attB衔接子PCR引物的浓度,减少了此非 特异产物。

这些结果说明,本实施例描述的衔接子引物PCR方法可以极好地 用于克隆基因。这些结果也证明我们开发了一种简单而有效的方法, 该方法允许使用与通用attB衔接子引物部分重叠的较短基因特异引 物来扩增与GATEWAYTM PCR克隆系统相容的PCR产物。在常规PCR克隆 应用中,推荐使用12bp的重叠区。因此,本实施例描述的方法可以减 少基因特异性引物的长度多达17个残基或更多,对于大量使用 GATEWAYTM PCR克隆系统而言,这就显著节约了寡核苷酸的费用。此外, 使用本实施例描述的方法和分析,普通技术人员可以使用仅常规实验, 设计和使用基于或含有其它重组位点或其片段(如attL、attR、attP、 lox、FRT等)的类似引物衔接子。

作为向PCR引物添加29个碱基的替代方法,可以使用含有添加在模 板特异性引物上的少至12个attB碱基的引物,以两步PCR方案产生 attB PCR产物。在第一步,使用含有attB的12个碱基的模板特异引物 在10个PCR循环中扩增靶基因。将该PCR反应物的一部分转移至含有 通用attB衔接子引物的第2 PCR反应物中以扩增整个attB PCR产物。

按以下所示,设计在5’末端具有attB1和attB2的12个碱基的模 板特异性引物:

12 attB1:AA AAA GCA GGC TNN(SEQ ID NO:139)--正向模板特 异性引物

12 attB2:A GAA AGC TGG GTN(SEQ ID NO:140)--反向模板特 异性引物

一般地,将这些引物的模板特异性部分设计为具有大于50的Tm。 最适退火温度由引物的模板特异性部分的Tm确定。

attB1衔接子引物:GGGGACAAGTTTGTACAAAAAAGCAGGCT(SEQ

ID NO:47)

attB2衔接子引物:GGGGACCACTTTGTACAAGAAAGCTGGGT(SEQ

ID NO:48)

制备50μl含有10pmol的各种模板特异性引物和适当量的模板 DNA的PCR反应物。将含有此PCR反应混合物的管子放置在热循环仪 并95度孵育2分钟。

按以下进行10个PCR循环:

变性     94℃15秒

50-60℃退火30秒

68℃延伸按每kb靶扩增子1分钟

将10μl PCR反应产物转移至含有attB1和attB2衔接子引物各 40pmol的40μl PCR反应混合物中。然后将含有该混合物的管子放置 在95度的热循环仪中并孵育1分钟。

按以下进行5个PCR循环:

变性     94℃15秒

45℃退火30秒

68℃延伸按每kb靶扩增子1分钟

然后按以下进行15至20个PCR循环:

变性     94℃15秒

55℃退火30秒

68℃延伸按每kb靶扩增子1分钟

然后通过琼脂糖凝胶电泳分析此扩增产物。

实施例9:突变分析λ噬菌体的attL和attR位点:位点特异性重 组中att位点特异性的决定因素

为了研究att位点特异性的决定因素,系统地诱变λ噬菌体的attL 和attR位点,并检测这些位点以精确地确定哪些突变造成att位点特 异性的独特改变。正如本文提及的,以前已将特异性的决定因子定位 在所有4种λatt位点(attB、attP、attL和attR)均一致的15bp核 心区(GCTTT TTTATACTAA(SEQ ID NO:37))中的7bp重叠区(TTTATAC, 该区域被定义整合酶蛋白的切割位点,并是发生链交换的区域)。

因此,为了检查att序列对位点特异性的影响,通过PCR产生突变 的attL和attR位点,并在体外位点特异性重组分析中测试这些位点。 以此方式,在核心att位点的7bp重叠区内制备所有可能的单碱基对变 化,并在此7bp重叠区之外但在此15bp核心att位点中制备其它5个改 变。在体外重组分析中使用各attR PCR底物测试所有的attL PCR底物。

方法

为了检测突变的attL和attR位点的重组效率和特异性,发展了 一种简单的体外位点特异性重组分析。由于attL和attR的核心区靠 近这些位点的末端,因此可以将期望的核苷酸改变掺入PCR引物中并 产生一系列含有突变的attL和attR位点的PCR产物。含有attL和 attR位点的PCR产物在使用GATEWAYTM LR CLONASETM酶混合物 (Invitrgen Corp.,Life Technologies Division,Rockville,MD) 的体外反应中用作底物。1.5kb attL PCR产物和1.0kb attR PCR 产物之间的重组导致产生一个2.5kb的重组分子,我们使用琼脂糖凝 胶电泳和溴化乙啶染色监测该重组分子。

质粒模板pEZC 1301和pEZC 1313(描述在PCT公开文本WO 00/52027中,其完整公开并入本文作为参考),每个模板分别含有一 个野生型attL或attR位点,使用这些质粒模板制备重组底物。以下 列出了在PCR反应中用于产生用作LR CLONASETM反应底物的attL PCR 产物的引物(大写字母代表不同于野生型序列的改变,而下划线是15bp 核心att位点中的7bp重叠区;使用类似的一组PCR引物制备含有匹 配突变的attR PCR产物):

GATEWAYTM点(注意:在GATEWAYTM质粒中attL2序列以“accca” 开头,而在本实施例中attL2位点以“agcct”开头,反映了核心区域 外的野生型attL。):

attL1:gggg agcct gcttt tttGtacAaa gttggcatta taaaaa-

       agca ttgc (SEQ ID NO:41)

attL2:gggg agcct gcttt CttGtacAaa gttggcatta taaaaa-

       agca ttgc(SEQ ID NO:42)

野生型:

attL0:gggg agcct gcttt tttatactaa gttggcatta taaaaa-

       agca ttgc(SEQ ID NO:61)

从野生型改变单碱基:

attLT1A:gggg agcct gcttt Attatactaa gttggcatta taaaaa-

         agca ttgc(SEQ ID NO:62)

attLT1C:gggg agcct gcttt Cttatactaa gttggcatta taaaaa-

         agca ttgc(SEQ ID NO:63)

attLT1G:gggg agcct gcttt Gttatactaa gttggcatta taaaaa-

         agca ttgc(SEQ ID NO:64)

attLT2A:gggg agcct gcttt tAtatactaa gttggcatta taaaaa-

     agca ttgc (SEQ ID NO:65) attLT2C:gggg agcct gcttt tCtatactaa gttggcatta taaaaa-

     agca ttgc(SEQ ID NO:66) attLT2G:gggg agcct gcttt tGtatactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:67) attLT3A:gggg agcct gcttt ttAatactaa gttggcatta taaaa-

     aagca ttgc (SEQ ID NO:68) attLT3C:gggg agcct gcttt ttCatactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:69) attLT3G:gggg agcct gcttt ttGatactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:70) attLA4C:gggg agcct gcttt tttCtactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:71) attLA4G:gggg agcct gcttt tttGtactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:72) attLA4T:gggg agcct gcttt tttTtactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:73) attLT5A:gggg agcct gcttt tttaAactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:74) attLT5C:gggg agcct gcttt tttaCactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:75) attLT5G:gggg agcct gcttt tttaGactaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:76) attLA6C:gggg agcct gcttt tttatCctaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:77) attLA6G:gggg agcct gcttt tttatGctaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:78) attLA6T:gggg agcct gcttt tttatTctaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:79) attLC7A:gggg agcct gcttt tttataAtaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:80) attLC7G:gggg agcct gcttt tttataGtaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:81) attLC7T:gggg agcct gcttt tttataTtaa gttggcatta taaaa-

     aagca ttgc(SEQ ID NO:82) 在7bp重叠外改变单碱基: attL8:gggg agcct Acttt tttatactaa gttggcatta taaaa-

   aagca ttgc(SEQ ID NO:83) attL9:gggg agcct gcCtt tttatactaa gttggcatta taaaaa-

   agca ttgc(SEQ ID NO:84) attL10:gggg agcct gcttC tttatactaa gttggcatta taaaaa-

    agca ttgc(SEQ ID NO:85) attL14:gggg agcct gcttt tttatacCaa gttggcatta taaaaa-

    agca ttgc(SEQ ID NO:86) attL15:gggg agcct gcttt tttatactaG gttggcatta taaaaa-

    agca ttgc(SEQ ID NO:87)

注意:其中头9个碱基是gggg agcca(即紧接15bp核心区之前 的位置腺苷替代了胸苷)的其它载体,可以或可以不含有上述单碱基 对替换(或缺失),这些载体也可以用于这些实验中。

按下述实施含有attL和attR的PCR产物的重组反应:

8μl H2O

2μl attL PCR产物(100ng)

2μl attR PCR产物(100ng)

4μl 5X缓冲液

4μl GATEWAYTM LR CLONASETM酶混合物

20μl总体积

将CLONASETM反应物25℃孵育2小时。

加入2μl 10X CLONASETM终止液(蛋白酶K,2mg/ml)以终止反应。

在1%琼脂糖凝胶上电泳10μl反应混合物。

结果

使用各attR PCR底物在体外重组分析中测试了每个attL PCR底 物。结果显示,7bp重叠区( TTTATAC)头3位中的改变强烈地改变了重 组的特异性。这些突变的att位点每个均与野生型一样发生重组,但 仅与它们的关连突变伙伴重组;没有检测到它们与任何其它att位点 突变体的重组。相反,最后4个位置中的改变仅部分改变特异性;这 些突变体与其关连突变体和野生型att重组,并且这些突变与除了在 7bp重叠区头3位中具有突变的那些突变att位点外的所有其它突变 att位点部分重组。发现7bp重叠区外的改变不影响重组的特异性, 但一些改变确实影响重组的效率。

基于这些结果,确定了以下att位点特异性的规则:

·仅7bp重叠区中的改变影响特异性。

·头3位中的改变强烈地影响特异性。

·最后4位中的改变微弱地影响特异性。

通过该方法,我们还评价了影响重组反应的整个效率的突变。在 这些实验中,我们观察到,当与其关连attR伙伴反应时,attL T1A 和attL C7T底物轻微地增加(少于2倍)重组效率。并观察到减低重组 效率(大约2-3倍)的突变,包括attLA6G、attL14和attL15。可以 推测,这些突变反映了可影响Int蛋白在核心att位点结合的改变。

这些实验的结果证明,7bp重叠区头3位( TTTATAC)中的改变强烈地 改变了重组特异性(即,在头3个胸苷中具有一或多个突变的att序列 仅与其关连伙伴重组,而不会与任何其它att位点突变体交叉反应)。 相反,最后4位(TTT ATAC)中的突变仅部分改变特异性(即,在最后4 位中具有一或多个突变的att位点将与野生型att位点及所有其它的 att位点(除了在7bp重叠区头3位的一或多个位置中具有突变的那些 att位点外)有部分的交叉反应)。没有发现7bp重叠区之外的突变影响 重组特异性,但发现一些影响重组效率(即造成重组效率降低)。

实施例10:发现增强GATEWAYTM克隆反应效率的att位点突变

在设计以了解att位点特异性的决定因子的实验中,我们在attL 的核心区中进行了点突变。然后在LR反应中使含有这些突变attL序 列的核酸分子和含有关连attR位点(即,含有相应于attL位点中突变 的那些突变的attR位点),并按上述确定重组效率。我们注意到位于 att位点核心区中的几个突变轻微地增加(少于2倍)或降低(2-4倍之 间)重组反应的效率(表5)。 表5.attL突变对重组反应的影响。   位点   序列     SEQ     ID   对重组的影响   attL0  agcctgcttttttatactaagttggcatta     88   N/A   attL5  agcctgctttAttatactaagttggcatta     89   轻微增加   attL6  agcctgcttttttataTtaagttggcatta     90   轻微增加   attL13  agcctgcttttttatGctaagttggcatta     91   减低   attL14  agcctgcttttttatacCaagttggcatta     92   减低   attL15  agcctgcttttttatactaGgttggcatta     93   减低   共有序列  CAACTTnnTnnnAnnAAGTTG     94   N/A

我们还注意到这些突变大概反映了分别增加或降低整合酶蛋白结 合核心att位点的相对亲和力的改变。文献中对整合酶核心结合位点 (CAACTTNNT)的共有序列作过推测,但并未对此进行直接测试(见例如, Ross和Landy,Cell 33:261-272(1983))。此共有核心整合酶结合序 列是通过比较attP和attB中发现的4个核心att位点每一个的序列 及与核心序列类似并且表现出与整合酶在体外结合的5个非att位点的 序列而确立的。这些实验提示,可以鉴定出许多增加整合酶与核心att 位点的结合并由此增加GATEWAYTM克隆反应的效率的att位点突变。

实施例11:核心区突变对重组效率的影响

为了直接地比较att位点核心区中突变的克隆效率,在 attB1-tet-attB2 PCR产物的attB2位点中制备单碱基改变。然后在 BP反应中,使含有这些突变attB2序列的核酸分子和含有非关连attP 位点(即野生型attP2)的核酸分子反应,并按上述确定重组效率。与 标准attB1-tet-attB2 PCR产物相比,这些含有突变attB2的PCR产 物的克隆效率显示在表6中。 表6.突变attB2位点重组的效率。 位点  序列   SEQ ID   NO.     突变     克隆效率 attB0  tcaagtta gtataaaaaagcaggct   95 attB1  ggggacaagttt gtacaaaaaagcaggct   47 attB2  ggggaccacttt gtacaagaaagctgggt   48     100% attB2.1  ggggaAcacttt gtacaagaaagctgggt   96     C→A     40% attB2.2  ggggacAacttt gtacaagaaagctgggt   97     C→A     131% attB2.3  ggggaccCcttt gtacaagaaagctgggt   98     A→C     4% attB2.4  ggggaccaAttt gtacaagaaagctgggt   99     C→A     11% attB2.5  ggggaccacGtt gtacaagaaagctgggt   100     T→G     4% attB2.6  ggggaccactGt gtacaagaaagctgggt   101     T→G     6% attB2.7  ggggaccacttG gtacaagaaagctgggt   102     T→G     1% attB2.8  ggggaccacttt Ttacaagaaagctgggt   103     G→T     0.5%

正如以上提及的,与attB1-tet-attB2 PCR产物相比,attB2.2 位点中的单碱基改变使attB1-tet-attB2.2 PCR产物的克隆效率增加 131%。有趣的是,该突变改变了整合酶的attB2核心结合位点,产生 与提出的共有序列更紧密匹配的序列。

进行其它实验,以直接地比较attB1-tet-attB2 PCR产物的克隆 效率和所含attB位点具有提出的整合酶核心结合位点共有序列的PCR 产物的克隆效率。使用以下attB位点扩增attB-tet PCR产物:

attB1    ggggacaagttt gtacaaaaaagcaggct(SEQ ID NO:47)

attB1.6  ggggacaaCttt gtacaaaaaagTTggct(SEQ ID NO:104)

attB2    ggggaccacttt gtacaagaaagctgggt(SEQ ID NO:48)

attB2.10 ggggacAacttt gtacaagaaagTtgggt(SEQ ID NO:105)

在300ng(100fmol)pDONR201(Ivitrogen Corp.,Life Technologies Division,Cat No.11798-014)和80ng(80fmol) attB-tet PCR产物之间20μl体积中通过25℃孵育1.5小时,进行BP 反应,产生pENTR201-tet进入克隆。表7显示了对上述attB位点在 BP反应中的克隆效率进行的比较。 表7.BP反应的克隆效率。     PCR产物     CFU/ml     增加倍数     B1-tet-B2     7,500     B1.6-tet-B2     12,000     1.6x     B1-tet-B2.10     20,900     2.8x     B1.6-tet-B2.10     30,100     4.0x

这些结果证明,含有优选与提出的整合酶核心结合位点的共有序 列匹配的序列的attB PCR产物能够以比标准GATEWAYTM attB1和attB2 PCR产物高4倍的效率产生进入克隆。

然后通过LR反应(300ng(64fmol)将以上制备的进入克隆转移 至pDEST20(Invitrogen Corp.,Life Technologies Division,Cat No.11807-013),方式是:使300ng(64fmole)pDEST20与50ng(77 fmol)各pENTR201-tet进入克隆在20μl体积中混合;孵育1小时(25 ℃孵育)。表8对这些反应的克隆效率进行了比较。 表8.LR反应的克隆效率   pENTR201-tet x pDEST20     CFU/ml     增加倍数   L1-tet-L2     5,800   L1.6-tet-L2     8,000     1.4   L1-tet-L2.10     10,000     1.7   L1.6-tet-L2.10     9,300     1.6

这些结果证明,引入attB1.6和attB2.10中随着基因转移至进入 克隆的突变轻微地增加LR反应的效率。因此,本发明不仅包括attB 位点中增加重组效率的突变,还包括导致通过BP反应产生的attL位 点的相应突变。

为了检验在一定PCR产物量范围内attB1.6-tet-attB2.10PCR产 物克隆效率的增加,进行与上述类似的实验,在这些实验中加入反应 混合物中的attB PCR产物量经过滴定。结果显示在表9中。 表9.attB PCR产物的滴定     attB PCR     产物的量(ng)   PCR产物   CFU/m   l     增加倍数     20   attB1-tet-attB2   3,500     6.1   attB1.6-tet-attB2.10   21,500     50   attB1-tet-attB2   9,800     5.0   attB1.6-tet-attB2.10   49,000     100   attB1-tet-attB2   18,800     2.8   attB1.6-tet-attB2.10   53,000     200   attB1-tet-attB2   19,000     2.5   attB1.6-tet-attB2.10   48,000

这些结果证明,在20ng量时使用attB1.6-tet-attB2.10PCR 产物与标准attB1-tet-attB2 PCR产物相比克隆效率增加6倍之多。

实施例12:测定最佳重组效率对attB序列的要求

为了检测对attB的序列要求并确定在简并attB位点群体中哪个 attB位点可以以最高的效率进行克隆,我们进行了一系列实验。设计 在attB位点的B臂中含有5个简并碱基的简并PCR引物。由此,这些 简并序列在BP反应中随基因转移至进入克隆,并随后在LR反应中随 着基因被转移至表达克隆中。因此,简并attB和attL位点群可以从 attB向attL往返地循环多个周期。通过改变每个转移步骤的反应条 件(例如,通过减少反应时间和/或降低DNA浓度),可以在每个周期逐 渐增加反应的严紧性,由此富集更为有效地进行反应的attB和attL 位点群。

使用以下简并PCR引物从pUC18扩增含有lacZα片段的500bp片 段(仅显示每个引物的attB部分):

attB1:

  GGGG ACAAGTTT GTACAAA AAAGC AGGCT(SEQ ID NO:47)

attB1n16-20:

  GGGG ACAAGTTT GTACAAA nnnnn AGGCT(SEQ ID NO:106)

attB1n21-25:

  GGGG ACAAGTTT GTACAAA AAAGC nnnnn(SEQ ID NO:107)

attB2:

  GGGG ACCACTTT GTACAAG AAAGC TGGGT(SEQ ID NO:48)

attB2n16-20:

  GGGG ACCACTTT GTACAAG nnnnn TGGGT(SEQ ID NO:108)

attB2n21-25:

  GGGG ACCACTTT GTACAAG AAAGC nnnnn(SEQ ID NO:109)

简并att位点的起始群体大小是45或1024个分子。通过两个BP 反应和两个LR反应转移4个不同的群体。使用每个反应物进行转化后, 通过在含有适当选择抗生素的液体培养基中培养,扩增转化体群体。 通过碱裂解小量制备法从克隆群体制备DNA,并用于以下反应。以下 显示了BP和LR克隆反应的结果。

BP-1,过夜反应:     cfu/ml     对照的百分比 attB1-lacZa-attB2     78,500     100% attB1n16-20-lacZa-attB2     1,140     1.5% attB1n21-25-lacZa-attB2     11,100     14% attB1-lacZa-attB2n16-20     710     0.9% attB1-lacZa-attB2n21-25     16,600     21%

LR-1,pENTR201-lacZa x pDEST20/EcoRI,1小时反应     cfu/ml     对照的百分比     attL1-lacZa-attL2     20,000     100%     attL1n16-20-lacZa-attL2     2,125     11%     attL1n21-25-lacZa-attL2     2,920     15%     attL1-lacZa-attL2n16-20     3,190     16%     attL1-lacZa-attL2n21-25     1,405     7%

BP-2,pEXP20-lacZa/ScaI x pDONR201,1小时反应     cfu/ml     对照的百分比 attB1-lacZa-attB2     48,600     100% attB1n16-20-lacZa-attB2     22,800     47% attB1n21-25-lacZa-attB2     31,500     65% attBl-lacZa-attB2n16-20     42,400     87% attBl-lacZa-attB2n21-25     34,500     71%

LR-2,pENTR201-lacZa x pDEST6/NcoI,1小时反应     cfu/ml     对照的百分比 attL1-lacZa-attL2     23,000     100% attL1n16-20-lacZa-attL2     49,000     213% attL1n21-25-lacZa-attL2     18,000     80% attL1-lacZa-attL2n16-20     37,000     160% attL1-lacZa-attL2n21-25     57,000     250%

这些结果证明,随着每次连续的转移,整个att位点群的克隆效 率都会增加,而且在attB位点的定义上有极大的灵活性。可以从上述 反应物中分离特定克隆,单个地测试重组效率,并进行测序。然后将 这些新特异性和已知实例进行比较,以指导设计具有新重组特异性的 新序列。此外,基于上述富集和筛选方案,普通技术人员可以容易地 确定和使用其它重组位点(例如其它att位点、lox、FRT等)中的序列, 导致使用含有这些序列的重组反应的特异性增加。

实施例13:将功能性成分嵌入重组位点中

用于本发明的重组位点还可以具有嵌入的功能或性质。嵌入的功 能是指由重组位点中不直接与重组效率或特异性有关的核苷酸序列所 赋予的功能或性质。例如,重组位点可以含有蛋白质编码序列(例如蛋 白内含子编码序列)、内含子/外显子拼接位点、复制起点、和/或终止 密码子。一般地,构成重组位点的核酸链越长,越易于向该位点掺入 嵌入功能或性质。相反,重组位点越长就越可能具有干扰期望功能或 性质的特征(例如终止密码子)。而且,还可以制备具有一个以上(例 如2、3、4、5等)嵌入功能或性质的重组位点。

正如以下解释的,一方面,本发明提供方法用于从RNA分子去除 重组位点编码的核苷酸序列。该方法的一个例子应用了内含子/外显子 拼接位点以从RNA转录本中除去重组位点编码的RNA。再有,正如以 下阐述的,编码这些内含子/外显子拼接位点的核苷酸序列可以完全地 或部分地嵌在所编码序列要从RNA分子中切除的重组位点中,或这些 内含子/外显子拼接位点可以由临近的核酸序列编码。类似地,一个外 显子/内含子拼接位点可以由重组位点编码,而另一个内含子/外显子 拼接位点可以由其它核苷酸序列(例如载体的核苷酸序列或目的核酸) 编码。核酸拼接讨论于以下出版物中:R.Reed,Curr.Opin.Genet. Devel.6:215-220(1996);S.Mount,Nucl.Acids.Res.10:459-472 (1982);P.Sharp.Cell 77:805-815(1994);K.Nelson和M.Green, Genes and Devel.23:319-329(1988);和T.Cooper和W.Mattox, Am.J.Hum.Genet.61:259-266(1997)。

在某些情况下,从RNA转录本中除去相应于重组位点的RNA,或除 去重组位点编码的氨基酸残基是有利的。可以有多种方式除去这些序 列,而且可以发生在RNA或蛋白质水平上。一种情况是,当核酸分子 的ORF按一定方向插入载体以旨在表达ORF编码的氨基酸残基和载体 编码的氨基酸残基(例如GFP)之间的融合蛋白(例如GFP)时,通常除 去由重组位点转录产生的RNA是有利的。在此情况下,ORF和载体编 码序列之间存在插入的重组位点可以导致重组位点(1)向mRNA提供 密码子以导致在表达产物中包括额外的氨基酸残基,(2)向mRNA提供 终止密码子以阻碍期望融合蛋白的产生,和/或(3)造成mRNA的阅读 框移动以致两个蛋白不“按符合阅读框”的方式融合。

从mRNA分子中除去重组位点的一个方法涉及使用内含子/外显子 拼接位点(即拼接供体和拼接受体位点)。可以将拼接位点适当地放置 在多个位置。使用设计以表达具有N端GFP融合物的插入ORF的目的 载体作为例子,可以由位于GFP编码序列3’的载体序列编码第1个拼 接位点,而第2个拼接位点可以部分地嵌在分隔GFP编码序列和ORF 编码序列的重组位点中。而且,该第2个拼接位点可以接近重组位点 的3’末端或可以位于距离重组位点3’短距离(例如2、4、8、10、20 个核苷酸)的位置。此外,根据重组位点的长度,第2个拼接位点可以 完全地嵌在重组位点中。

上述方法的修改涉及连接在表达时导致产生融合蛋白的多个核酸 区段。一个具体例子中,一个核酸区段编码GFP而另一核酸区段含有 目的ORF。每个这些区段的侧翼都有重组位点。此外,编码GFP的核 酸区段在近其3’端含有内含子/外显子拼接位点,而含有目的ORF的核 酸区段在近其5’端也含有内含子/外显子拼接位点。重组后,编码GFP 的核酸区段位于编码目的ORF的核酸区段的5’。而且,这些两个核酸 区段被位于内含子/外显子拼接位点侧翼的重组位点分开。由此在融合 mRNA转录后介入的重组位点被切除。因此,一方面,本发明指向从本 文所述核酸产生的转录本中除去重组位点转录产生的RNA的方法。

可以用于将内含子/外显子拼接位点导入核酸区段的一个方法是 借助PCR。例如,可以使用引物产生相应于目的ORF并含有重组位点 及内含子/外显子拼接位点的核酸区段。

当与另一核酸区段发生重组的核酸区段编码不按可翻译格式 (translatable format)产生的RNA时,还可以使用上述方法除去 相应于重组位点的RNA。该情况的一个例子是以一定方式将核酸区段 插入载体中,以致导致产生反义RNA。正如以下讨论的,该反义RNA 可以例如和编码核酶的RNA融合。因此,本发明还提供方法用于从这 些方法中除去相应于重组位点的RNA。

本发明还提供方法用于从蛋白表达产物中通过蛋白拼接除去重组 位点所编码的氨基酸序列。编码蛋白拼接位点的核苷酸序列可以完全 地或部分地嵌在所编码氨基酸序列将从蛋白质中切除的重组位点中, 或者可以由相邻核苷酸序列编码蛋白质拼接位点。类似地,一个蛋白 质拼接位点可以由重组位点编码,而另一蛋白质拼接位点可以由其它 核苷酸序列(例如,载体的核酸序列或目的核酸)编码。

已经显示,蛋白质拼接可以通过从蛋白质分子中切除蛋白内含子 并连接侧翼区段来进行(见例如Derbyshire等,Proc.Natl.Acad. Sci(USA)95:1356-1357(1998))。简而言之,蛋白内含子是翻译 后通过自催化拼接过程从蛋白质中切除的氨基酸区段。相当多的蛋白 质内含子共有序列已得到鉴定。(见例如,Perler,Nucleic Acid Res. 27:346-347(1999)。)

类似于内含子/外显子拼接,N和C端内含子基序显示出参与蛋白 质拼接。因此,本发明还提供组合物和方法,用于从蛋白表达产物中 通过蛋白质拼接除去重组位点编码的氨基酸残基。具体地,本发明此 方面涉及将编码蛋白内含子拼接位点的核酸序列放置在位于两个编码 区之间的重组位点的5’和3’末端。由此,当在适当条件下孵育蛋白质 表达产物时,即可切除这些重组位点编码的氨基酸残基。

可以使用蛋白质拼接除去重组位点编码的全部或部分氨基酸序 列。编码蛋白内含子的核苷酸序列可以全部地或部分地嵌在重组位点 中或可以位于这些位点邻近的位置。在某些情况下,可能期望在重组 位点编码的N和/或C末端氨基酸序列之外再除去相当数量的氨基酸残 基。在此情况下,可以将蛋白内含子的编码序列放置在距离重组位点 5’和/或3’一定距离的位置(例如30、50、75、100等个核苷酸)。

尽管适合切除蛋白内含子的条件可以随具体的蛋白内含子以及含有 此蛋白内含子的蛋白而变,但Chong等,Gene 192:271-281(1997)证 明修饰的酿酒酵母(Saccharomyces cerevisiae)蛋白内含子(称作Sce VMA蛋白内含子)可以被多种药剂诱导而发生自切割,所述药剂包括 1,4-二硫苏糖醇(DTT)、β-巯基乙醇和半胱氨酸。例如,可以通过在存 在30mM DTT时,于4℃孵育16小时,以诱导蛋白内含子的切除/拼接。

实施例14:在真核细胞中通过mRNA前体拼接从RNA转录本中除去 att位点

在后生动物细胞中通过mRNA前体转录本的拼接除去内含子所必需 的共有RNA序列通常含有以下3个元件:

1).内含子5’末端:外显子-AG| GTRAGT-内含子;此处|表示内含 子和外显子之间的边界,而R=嘌呤核苷酸。此元件本文中被称作(GT);

2).内含子3’末端:内含子-Yn-N-C AG|G-外显子;此处Yn=富含 嘧啶的10-12个核苷酸序列。此元件本文中被称作(Yn-AG);

3).内含子中的分支点,距离(Yn-AG)5’约20-40碱基的位置: YNR A*Y;此处Y是嘧啶核苷酸而A*是参与最初的转酯反应以形成RNA 套索的分支点腺苷。此元件在本文中称作(BP-A*)。

以上显示的带下划线序列是高度保守的序列,并且一般被认为是 拼接活性所必需的;共有序列中其它核苷酸的高度保守性较低。

1.attB拼接

可以将这些拼接元件和含有att位点的GATEWAYTM载体在至少以下 三个途径中进行组合以便通过RNA拼接除去attB1位点。

方法1:(GT)-(BP-A*)[attB1](Yn-AG)-ORF

此方面中,利用了attB核心序列侧翼5’核苷酸的灵活性,(BP-A*)元 件就位于attB1的5’末端,而(Yn-AG)共有序列与attB1序列的3’末端合 并。(GT)共有序列可以方便地位于(BP-A*)上游的10或更多个核苷酸处。

这种排列的优点是在attB1位点的3’末端和编码ORF的序列之间 需要加入最少的序列。使用此方法的一个潜在困难是(Yn-AG)中的富含 嘧啶的序列与相对富含嘌呤的attB1序列重叠。因此,在某些情况下, attB1位点中足够多以致允许有效拼接的核苷酸改变(至C或T)可能与 有效的BxP重组是不相容的。

在表达克隆中attB1中位于重组切割位点5’的序列是由目的载体 提供的,而且该位点的3’序列来源于attB-PCR产物(大多数情况中)。 如果拼接反应旨在将编码N端蛋白(由目的载体提供)的RNA与编码另 一ORF(由进入克隆提供)的RNA在RNA水平上融合,则(GT)和(Yn-AT) 的位置一般按一定方式定位,以便拼接产物维持期望的翻译阅读框。

方法2:(GT)-(BP-A*)[attB1](Yn-AG)-ORF

在此方法中,(Yn-AG)共有序列紧邻attB1位点;因此,(BP-A*) 元件中的分支点A*一般需要靠近attB1位点。因此,(Yn-AG)中与AG 的距离一般不多于约40个核苷酸。

可以将(Yn-AG)序列作为引物衔接子的一部分来添加,前提是使用 attB-PCR构建进入克隆。而且,可以使用利于有效拼接的共有(Yn-AG) 序列设计该引物。在一些情况下,(BP-A*)和(Yn-AG)之间的attB1序 列的存在可能会干扰拼接。如果这样的话,则可以对attB1序列进行 突变以提供更佳的拼接序列。

方法3:(GT)---[attB1]-(BP-A*)---(Yn-AG)-ORF

该方法使用的排列允许为包含(BP-A*)---(Yn-AG)的这些组合元 件选择最佳的拼接序列以及间隔序列。该组合的最小大小预期是约20 个核苷酸。因此,该序列通常作为约45-50个核苷酸的attB1-引物衔 接子添加至PCR产物上。

类似的考虑应用于设计允许从mRNA中通过拼接除去attB2位点的序 列。但由于在此情况下,(BP-A*)和(Yn-AG)可以由目的载体提供,所以 最有吸引力的选择是:ORF-(GT)[attB2]--(BP-A*)--(Yn-AG),此处(GT) 和attB2之间的序列最小,从而降低了attB2-PCR衔接子引物的大小。 适用于具体情况中的最小序列可以使用本文所述方法通过实验确定。

制备拼接attB位点的载体的另一方式是直接构建含有位于attB1 和attB2位点侧翼的拼接信号的载体。上述方法的主要区别是使用 attB引物衔接子添加的任何序列(如在B和C中)都可以预先安装在载 体本身中靠近位于attB位点之间的多克隆位点。

2.attL拼接

编码attL1和attL2位点的序列可以通过RNA拼接从转录本中除 去。然而,attL的100个核苷酸长度限制了对安排这些拼接序列元件 的方式的选择。一般将attL1放置在(BP-A*)和(Yn-AG)之间时该距离 过大。一个可以使用的选择方案是可以将这些元件的一个或两个嵌在 突变版本的attL1中。另一个方法是可以由attB-衔接子引物提供这 些元件(即,(BP-A*)和(Yn-AG)),而可以由attP供体质粒提供(GT)。 通过这些元件在BxP反应中的重组,可以产生用于拼接attB1的具有 拼接位点的进入克隆。

类似地,对于attL2的拼接,(GT)和(BP-A*)之间所能允许的序列 长度也没有实际的限制。因此,可以在attB2衔接子引物上提供(GT), 而由attP供体载体提供(BP-A*)和(Yn-AG)。对于此情况,attP供体载 体一般需要含有真核启动子而且一般需要除去rrnB转录终止序列。 (GT)和(BP-A*)之间attL2序列产生不利影响的可能性似乎是低的,但 可能需要逐个案例地确定。

从进入克隆转录本中拼接除去attL序列的潜在优点在于使用者可 以直接将PCR产物作为进入克隆来克隆和表达,而无需再亚克隆在目 的载体中。而且,在不减少LxR重组的情况下,我们的attL1序列中 终止密码子似乎是难于除去的,这些终止密码子的存在对于与N端肽 融合的ORF的翻译并不重要。

以上描述了RNA拼接在GATEWAYTM系统中的某些应用,目的是除去 ORF和N端序列之间的attB1和除去蛋白质融合物的ORF序列和C端 序列之间的attB2序列。其它应用是本领域技术人员所明了的。而且, 一个这样的应用是使用RNA拼接程序除去置于真核表达载体中编码多 个蛋白域的序列之间的att序列(作为基于GATEWAYTM重组的亚克隆反 应的结果),此处编码各个域的ORF被att位点序列分隔开。这些载 体可以容易地通过具有多种特异性的att位点(例如att1、att2、att3、 att4等)的GATEWAYTM重组来构建。尽管该方法允许快速构建蛋白融合 物以及对编码蛋白域的DNA序列进行改组,但典型地这些重组产物将 含有25bp attB位点(或100bp attL位点)插在这些域之间,而通常可 能期望除去这些位点。描述的RNA拼接机制是除去这些介入序列的一 个途径。使用拼接除去多个蛋白质域之间的att位点也使得使用attB 和attP位点之间的GATEWAYTM重组反应制备这些结构变得实际可行, 该反应将产生attL和attR位点。这是因为在适当设计的载体中通过 RNA拼接反应可以除去任何类型的att序列(attB或attL)。在其它情 况下,这将同样可以用于通过拼接除去attR和/或attP位点。

第二种应用解决了获得较大或稀少mRNA的拷贝的常见问题。一些 mRNA由于大尺寸和/或低丰度是难于进行整体逆转录(成cDNA)的。常 常是可以获得cDNA的一个或两个末端,但不能作为一个分子获得整个 序列。当可以获得一起组成整个mRNA序列的cDNA的两个或更多个不 同部分时,可以确定这些cDNA序列的序列并使用PCR引物进行合成。 然后使用attB-引物可以通过PCR扩增整个转录本的各非重叠部分。 然后可以使用GATEWAYTM重组按适当顺序组合这些扩增的序列。该重组 产物将按适当顺序包含各个序列,但这些序列之间间隔att位点。只 要有适当的转录启动子和终止信号,就可以使用这些结构体外制备RNA 以用于体外拼接反应中,或使用允许在细胞内经RNA拼接后发生转录 的适当结构转染后生动物的细胞。以此方式,然后可以制备真正的mRNA 转录本。一些mRNA转录本可以直接地用于研究该拼接转录本编码的蛋 白质的生物学功能。或者,由于使用该方法可以大量地产生这些转录 本,因此使得制备拼接RNA的cDNA拷贝更为可行。该cDNA缺少介入 的att序列,可以用于在缺少适当拼接机器的细胞(如大肠杆菌)中产 生编码的蛋白质。

该技术的第三种应用使得可以制备由于低丰度或缺少适当的组织 来源而难于获得的mRNA的复制物。大多数后生动物编码蛋白质的基因 由被内含子序列分开的外显子序列组成。无论何时可以通过生物信息 学算法精确地从基因组DNA序列预测基因的外显子-内含子边界,都可 以合成含有外显子序列的侧翼有att位点序列的PCR产物。一旦适当 设计了这些产物侧翼的att序列,即可使用GATEWAYTM重组按适当顺序 使它们彼此连接,并同时保持正确的翻译阅读框。通过将适当的转录 信号包括在内,这些结构可以充当模板合成含有均被att序列分开的 有序排列外显子序列的RNA转录本。如果在这些结构中包括适当的拼 接信号,则产生的转录本可以通过后生动物细胞的拼接反应加工而产 生相应于天然产生的mRNA序列的核酸。而且,按上述制备的通过拼接 转录本产生这些mRNA的细胞可以直接地用于研究生物学功能或作为 期望mRNA的来源以产生其cDNA。或者,可以使用具有适当组成的拼 接提取物体外拼接这些结构。

实施例15:确定细胞的基因表达谱

本发明还提供组合物和方法用于克隆和测序多个cDNA分子。一般 地,这些方法涉及制备cDNA分子多联体并对这些分子进行测序反应以 确定单个插入片段的核苷酸序列。这些方法对于确定特定细胞和/或组 织的基因表达谱(expression profile)是尤其有用的。图23中显示 了该方法的一个例子以及通过上述方法制备的载体。

图23所示载体含有一系列通过attB位点彼此连接的相对短cDNA 插入片段(例如长10、15、20、25、30、45或50个核苷酸)。图23所 示载体还含有邻近cDNA插入位点两边的测序引物位点。

作为细胞或组织中表达的基因的核酸分子可以通过各种方式被分 割成相对小的片段,包括机械剪切、用一个或组合的限制性酶(例如 NlaIII、Sau3A等)消化、或用几乎或完全不具有序列特异性的内切核 酸酶(例如微球菌(Micrococcal)核酸酶,DNAseI等)。一般对条件进 行调整以便产生指定平均大小的核酸片段。而且,如果需要的话,可 以在插入载体前分离具有特定大小的核酸片段。基于大小分离核酸分 子的方法是本领域已知的,包括柱层析和凝胶电泳(例如琼脂糖和聚丙 烯酰胺凝胶电泳)。

可以通过对本发明方法连接起来并使用本领域已知的标准方法将 其插入测序载体中的核酸进行测序以获得核苷酸序列数据。在大多数 情况下,测序载体中核酸插入片段的5’至3’方向和所测序的链均与确 定细胞或组织的基因表达谱无关。这是因为一般无论所测序的核酸区 段的方向或所测序的链是怎样的,都可以确定测序核酸所来源的mRNA。

因此,本发明提供方法以确定细胞和/或组织的基因表达谱。一方 面,本发明提供确定细胞和/或组织的基因表达谱的方法,包括(a)从 获自细胞和/或组织的RNA制备一或多群cDNA分子,其中这些群体中 的单个cDNA分子包含至少两个能够和位于相同或不同cDNA分子群的 单个成员上的至少一个重组位点发生重组的重组位点,(b)在造成(a) 的核酸分子接合的条件下将这些核酸分子和一或多个重组蛋白接触, 和(c)确定该接合的核酸分子的序列。

实施例16:使用GATEWAYTM系统克隆Tet和lacZ基因

将以下attB位点加在通过标准方法合成的PCR引物上。我们按标 准GATEWAYTM阅读框(见GATEWAYTM GATEWAYTM克隆技术说明手册 (Invitrogen Corp.,Life Technologies Division))显示attB1和 attB2位点并表示如下。可以按适当方式改变attB5的阅读框。可以 选择阅读框以便产生融合蛋白。 attB1(片段A的5’端): GGGG ACA ACT TT G TAC AAA AAA GTT GNN(SEQ ID NO:110) attb5(片段A的3’端): GGGG A CAA CTT T GT ATA ATA AAG TTG(SEQ ID NO:111) a ttB5R(片段B的5’端): GGGG A CAA CTT T AT TAT ACA AAG TTG(SEQ ID NO:112) attb2(片段B的3’端): GGG AC AAC TTT  GTA TAATAA AGT TGN(SEQ ID NO:113)

通过PCR扩增编码tet基因(用5’-attB1和3’-attB5引发的)和 lac基因(用5’-attB5R和3’-attB2引发的)核酸区段并按下述使用聚 乙二醇进行沉淀。在50μl PCR反应物中加入150μl TE,之后加入100μl 30%PEG8000、30mM MgCl2。然后混合该溶液并以约10,000xg室温离 心15分钟。然后除去PEG溶液并将沉淀溶解在TE中。

将该B1-tet-B5 PCR产物和attP1-ccdB-attP5供体载体 (pDONR-P1/P5)混合,并使用标准方案(见本文实施例3)与BP CLONASETM反应,以产生attL1-tet-attL5进入克隆。将B5R-lacZ-B2 PCR产物和attP5R-ccdB-attP2供体载体(pDONR-P5R/P2)混合,并与 BP CLONASETM反应产生attR5-lacZ-attL2进入克隆。

在25℃孵育1-4小时后,加入2μl蛋白酶K(2mg/ml)终止BP反 应。然后用LR载体(即进入克隆)转化DH5α细胞,并铺在LB-Kan平板 上。25℃孵育过夜。从单个DH5α菌落小量制备DNA,并通过琼脂糖凝 胶电泳定量。

在含有以下成分的20μl反应体积中预备LR CLONASETM反应物:

60ng(25fmol)的超螺旋tet进入克隆

75ng(20fmol)的超螺旋lacZ进入克隆

150ng(35fmol)用NcoI线性化的pDEST6(描述在PCT公开文

本WO 00/52027中,其完整公开本文作为参考)

4μl LR4反应缓冲液

4μl LR CLONASETM

反应物在25℃孵育过夜,并用2μl蛋白酶K溶液(2mg/ml)终止。 使用2μl转化100μl LE DH5α细胞并铺在含有XGal的LBamp平板上。 以1.6×108cfu/μg pUC DNA的效率,转化细胞的转化混合物产生约 35,000个菌落。将24个菌落挑取至含有四环素和XGal的平板上。24 菌落中24个都是四环素抗性的。使用15个菌落接种2ml LB amp培养 液用于小量制备。15/15个小量制备物含有正确长度(8.8kb)的超螺 旋质粒。用EcoRV消化小量制备的DNA。观察到的条带图与按正确方 向克隆的两个片段一致。

所获核酸产物由连接在一起并克隆在目的载体中的两个片段组 成。这两个片段的结构与插入目的载体中的一致,见下(箭头指示attB 位点相对重叠序列的方向):

attB1→tet←attB5-lacZ←attB2。

实施例17:使用GATEWAYTM系统克隆tet、lacZ和neo基因

将以下attB位点加入通过标准方法合成的PCR引物中。我们按标 准GATEWAYTM阅读框(见GATEWAYTM GATEWAYTM克隆技术说明手册 (Invitrogen Corp.,Life Technologies Division))显示attB1和 attB2位点并表示如下。可以由使用者指定attB5和attB21的阅读框。 attB1(片段A的5’端): GGGG ACA ACT TT G TAC AAA AAA GTT GNN(SEQ ID NO:114) attB5(片段A的3’端): GGGG A CAA CTT T GT ATA ATA AAG TTG(SEQ ID NO:111) attB5(片段A的3’端): GGGG A CAA CTT T GT ATA ATA AAG TTG(SEQ ID NO:111) attB5R(片段B的5’端): GGGG A CAA CTT T AT TAT ACA AAG TTG(SEQ ID NO:112) attB21R(片段B的3’端): GGG A CAA CTT T TT AAT ACA AAG TTG(SEQ ID NO:115) attB21(片段C的5’端): GGGG A CAA CTT T GT ATT AAA AAG TTG(SEQ ID NO:116) attB2(片段C的3’端): GGGG AC AAC TTT  GTA TAA TAA AGT TGN(SEQ ID NO:117)

通过PCR扩增编码tet基因(用5’-attB1和3’-attB5引发的)、Neo 基因(用5’-attB5R和3’-attB21R引发的)和lacZ基因(用5’-attB21 和3’-attB2引发的)核酸区段并使用聚乙二醇沉淀。

将该B1-tet-B5 PCR产物和attP1-ccdB-attP5供体载体 (pDONR-P1/P5)混合,并使用标准方案与BP CLONASETM反应,以产生 attL1-tet-attL3进入克隆。将B5R-Neo-B21R PCR产物和 attP5R-ccdB-attP21R供体载体(pDONR-P5R/P2)混合,并与BP CLONASETM反应产生attR5-Neo-attR21进入克隆。将B21-lacZ-B2 PCR 产物和attP21-ccdB-attP2供体载体(pDONR-P21/P2)混合并与BP CLONASETM反应以产生attL21-lacZ-attL2进入克隆。

在含有以下成分的20μl反应体积中预备LR CLONASETM反应物:

40ng(17fmol)的超螺旋tet进入克隆

50ng(19fmol)的超螺旋或线性(VspI消化的)Neo进入克隆

75ng(20fmol)的超螺旋lacZ进入克隆

150ng(35fmol)NcoI线性化的pDEST6

4μl LR4反应缓冲液(200mM Tris HCl(pH7.5)、4.75mM EDTA、 4.8mg/ml BSA、445mM NaCl、47.5mM亚精胺)

4μl LR CLONASETM

反应物在25℃孵育过夜,并用2μl蛋白酶K溶液(2mg/ml)终止。 使用2μl转化100μl DH5α LE细胞并铺在含有XGal的LBamp平板上。 在具有超螺旋进入克隆的转化混合物中产生约3,200个菌落。在使用 含VspI消化的Neo进入克隆的反应物进行的转化混合物中产生5,300 个菌落。感受态的效率为1.2×108cfu/μg pUC DNA。所有菌落均表现 出蓝色,指示存在lacZ基因。将9个菌落挑取至含有XGal的tet平 板上。9菌落中9个都是四环素抗性的。使用9个菌落接种2ml LB amp 培养液用于小量制备。9个小量制备物中9个含有正确长度(11kb)的 超螺旋质粒。用EcoRV消化9个小量制备的DNA。观察到的条带图与 按正确方向克隆的三个片段一致。

所获核酸产物由连接在一起并克隆在目的载体中的三个片段组成。这 三个片段的结构与插入目的载体中的一致,见下(箭头指示attB位点相对 重叠序列的方向):attB1→tet←attB5-Neo-attB21→lacZ←attB2。

实施例18:使用GATEWAYTM和具有不同特异性的多个att位点克隆 lux操纵子

使用紧接以下列出的引物,扩增费氏弧菌(Vibrio fischeria) 基因组DNA的lux操纵子基因(luxA、luxB、luxC、luxD和luxE), 以便在每个ORF的5’末端引入最佳的Shine-Delgarno和Kozak序列 (ggaggtatataccatg(SEQ ID NO:118))并在3’末端引入T7启动子和 终止密码子(gaagctatagtgagtcgtatta)。

表10.SD 5’和T7 3’lux引物。

SD 5′luxA ggaggtatataccatgAAGTTTGGAAATATTTGTTTTTC(SEQ

           ID NO:119)

T7 3′luxA gaagctatagtgagtcgtattaTTTAGGTTCTTTTAAGAAAG

           GAGCGAC(SEQ ID NO:120)

SD 5′luxB ggaggtatataccatgAAATTTGGATTATTTTTTCTAAAC

           (SEQ ID NO:121)

T7 3′luxB gaagctatagtgagtcgtattaTGGTAAATTCATTTCGATTT

           TTTGG(SEQ ID NO:122)

SD 5′luxC ggaggtatataccatgAATAAATGTATTCCAATGATAATTAA

           TGG(SEQ ID NO:123)

T7 3′luxC gaagctatagtgagtcgtattaTGGGACAAAAACTAAAAACT

           TATCTTCC(SEQ ID NO:124)

SD 5′luxD ggaggtatataccatgAAAGATGAAAGTGCTTTTTTTACGATTG

           (SEQ ID NO:125)

T7 3′luxD gaagctatagtgagtcgtattaAGCCAATTCTAATAATTCAT

           TTTC(SEQ ID NO:126)

SD 5′luxE ggaggtatataccatgACTGTCCATACTGAATATAAAAGAAATC

           (SEQ ID NO:127)

T7 3′luxE gaagctatagtgagtcgtattaAATCCTTGATATTCTTTTGT

           ATGACATTAGC(SEQ ID NO:128)

使用紧接以下列出的attB-SD和attB-T7衔接子引物,以 Shine-Delgarno和T7启动子序列作为引物位点进一步扩增PCR产物, 以便向PCR产物的末端添加attB位点。

表11:attB SD和T7衔接子引物。

B1.6 SD  GGGGACAACTTTGTACAAAAAAGTTGAAggaggtatataccatg

         (SEQ ID NO:129)

B5 T7    GGGGACAACTTTGTATAATAAAGTTGgaagctatagtgagtcgt

         (SEQ ID NO:130)

B5R SD   GGGGACAACTTTATTATACAAAGTTGAAggaggtatataccatg

         (SEQ ID NO:131)

B11 T7   GGGGACAACTTTGTATAGAAAAGTTGgaagctatagtgagtcgt

         (SEQ ID NO:132)

B11R SD  GGGGACAACTTTTCTATACAAAGTTGAAggaggtatataccatg

         (SEQ ID NO:133)

B17 T7   GGGGACAACTTTGTATACAAAAGTTGgaagctatagtgagtcgt

         (SEQ ID NO:134)

B17R SD  GGGGACAACTTTTGTATACAAAGTTGAAggaggtatataccatg

         (SEQ ID NO:135)

B21 T7   GGGGACAACTTTGTATTAAAAAGTTGgaagctatagtgagtcgt

         (SEQ ID NO:136)

B21R SD  GGGGACAACTTTTTAATACAAAGTTGAAggaggtatataccatg

         (SEQ ID NO:137)

B2.10 T7 GGGGACAACTTTGTACAAGAAAGTTGgaagctatagtgagtcgt

         (SEQ ID NO:138)

以此方式,产生以下attB PCR产物:

     attB1.6-SD-luxC-T7-attB5

     attB5R-SD-luxD-T7-attB11

     attB11R-SD-luxA-T7-attB17

     attB17R-SD-luxB-T7-attB21

     attB21R-SD-luxE-T7-attB2.10

每个attB PCR产物都用聚乙二醇沉淀并与适当的attP质粒反应 产生每个lux ORF的进入克隆。

表12.BP反应设置   1   2  3 4  5  6  7  8  9  10  TE   7μl   7μl  7μl 7μl  7μl  7μl  7μl  7μl  7μl  7μl  attB1-luxC-attB5  (10ng/μl)   2μl   2μl  attP1-attP5  (150ng/μl)   2μl   2μl  attB5R-luxD-attB11  (10ng/μl)  2μl 2μl  attP5R-attP11  (150ng/μl)  2μl 2μl  attB11R-luxA-attB17  (10ng/μl)  2μl  2μl  attP17R-attP17  (150ng/μl)  2μl  2μl  attB17R-luxB-attB21  (10ng/μl)  2μl  2μl  attP17R-attP21  (150ng/μl)  2μl  2μl  attB21R-luxE-attB2  (10ng/μl)  2μl  2μl  attP21R-attP2  (150ng/μl)  2μl  2μl  BP缓冲液   4μl   4μl  4μl 4μl  4μl  4μl  4μl  4μl  4μl  4μl  BP Clonase贮藏  缓冲液   4μl   ---  4μl ---  4μl  ---  4μl  ---  4μl  ---  BP Clonase   ---   4μl  --- 4μl  ---  4μl  ---  4μl  ---  4μl

25℃孵育反应物过夜。每个反应物通过加入2μl蛋白酶K(2mg/ml) 溶液终止并37℃孵育10分钟。使用每个反应物的2μl转化LEDH5α细 胞。将每个转化的100μl(1/10)铺在含有50μg/ml卡那霉素的LB琼 脂上。通过快速小量制备分析确定,以从每个反应物中分离适当的 pENTR-lux克隆。

用VspI消化luxA进入克隆(pENTR-luxA)以在该质粒骨架中线性 化该质粒。5个lux进入克隆每个取等量(40ng)与150ng pDEST14在 含有LR4缓冲液和LR Clonase的单个LR反应中混合。制备由无 Clonase反应和无pENTR/luxA反应组成的阴性对照反应。

表13.LR反应设置   1   2   3  TE   ---   4μl   ---  pENTRluxC(20ng/μl)   4μl   4μl   4μl  pENTRluxD(20ng/μl)   4μl   4μl   4μl  pENTRluxA/VspI cut(20ng/μl)   4μl   ---   4μl  pENTRluxB(20ng/μl)   4μl   4μl   4μl  pENTRluxE(20ng/μl)   4μl   4μl   4μl  pDEST14/NcoI(150ng/μl)   1μl   1μl   1μl  LR4缓冲液   8μl   8μl   8μl  LR Clonase贮藏缓冲液   8μl   ---   ---  LR Clonase   ---   8μl   8μl

25℃孵育反应物过夜。每个反应物通过加入4μl蛋白酶K(2mg/ml) 溶液终止并37℃孵育10分钟。使用每个反应物的2μl转化LEDH5α细胞。 将每个转化的100μl(1/10)铺在含有100μg/ml氨苄青霉素的LB琼脂上。

对于反应1(无clonase)转化没有产生菌落,对于反应2(无 pENTRluxA DNA)产生约200个菌落,对于反应3(完整的反应)产生约 2500个菌落。从反应3挑取10个菌落并通过小量制备分析进行检测。 基于超螺旋质粒DNA的大小(10.3kb)并通过诊断限制性消化,所有 10个克隆经测定均是正确的。将合成的lux操纵子结构转化至BL21SI 细胞中,并通过光度测定法监测萤光素酶的活性。证明4个独立的分 离物在BL21SI细胞中产生可滴定的盐诱导光。在含有pUC DNA的 BL21SI细胞中没有检测到光。由于在大肠杆菌细胞中产生和检测到光 辐射,由此证实了所有5个lux基因的功能性活性。

实施例19:产生pDONR载体

正如以上实施例(lux操纵子克隆),通过attB PCR克隆产生大量 载体元件进入克隆。对进入克隆进行设计,以便当一组4个载体元件 进入克隆一起反应时,每个载体元件连接在一起组成一个新载体(图 26A-26B)。在本实施例中,构建了两个新的attP DONOR载体。

制备下组attB PCR产物:

    attB21R-attP1-ccdB-cat-attP2-attB5

    attB5R-kan-attB11

    attB5R-amp-attB11

    attB11R-loxP-attB17

    attB17R-pUC ori-attB21

通过PEG沉淀纯化每个attB PCR产物,并使之与适当的attP质 粒反应以产生每个载体元件的进入克隆,见下:

表14:BP反应设置   1   2   3   4   5   6   7   8   9   10 TE   7μl   7μl   7μl   7μl   7μl   7μl   7μl   7μl   7μl   7μl attB21R-attP1-ccdB- cat-attP2-attB5(10 ng/μl)   2μl   2μl attP21R-attP5(150 ng/μl)   2μl   2μl attB5R-kan-attB11(10 ng/μl)   2μl   2μl attP5R-attP11(150 ng/μl)   2μl   2μl attB5R-amp-attB11(10 ng/μl)   2μl   2μl attP5R-attP11(150 ng/μl)   2μl   2μl attB11R-loxP-attB17 (10ng/μl)   2μl   2μl attP11R-attP17(150 ng/μl)   2μl   2μl attB17R-pUC ori- attB21(10ng/μl)   2μl   2μl attP17R-attP21(150 ng/μl)   2μl   2μl BP缓冲液   4μl   4μl   4μl   4μl   4μl   4μl   4μl   4μl   4μl   4μl BP Clonase贮藏缓冲液   4μl   ---   4μl   ---   4μl   ---   4μl   ---   4μl   --- BP Clonase   ---   4μl   ---   4μl   ---   4μl   ---   4μl   ---   4μl

25℃孵育反应物过夜。每个反应通过加入2μl蛋白酶K(2mg/ml) 溶液来终止,并在37℃孵育10分钟。每个反应物2μl用于转化LEDH5α 细胞。每个转化取100μl(1/10)铺在含有50μg/ml卡那霉素的LB琼 脂上。挑取菌落并通过快速小量制备分析用于分离以下pENTR克隆:

pENTR-attR21-attP1-ccdB-cat-attP2-attL5(分离自反应2)

pENTR-attR5-kan-attL11(分离自反应4)

pENTR-attR5-amp-attL11(分离自反应6)

pENTR-attR11-loxP-attL17(分离自反应8)

pENTR-attR17-ori-attL211(分离自反应10)

用VspI消化attR21-attP1-ccdB-cat-attP2-attL5进入克隆以便 在该质粒骨架中线性化该质粒。4个进入克隆各取等量(40ng)在含有 LR4缓冲液和LR Clonase的单个LR反应中混合。制备不含Clonase 的反应和不含pENTR-attR21-attP1-ccdB-cat-attP2-attL5 DNA的反 应,作为阴性对照。

表15.LR反应的设置 1  2 3 4  TE ---  4μl --- ---  pENTR-attR21-attP1-ccdB-cat-attP2-attL5 VspI  cut(20ng/μl) 4μl  --- 4μl 4μl  pENTR-attR5-kan-attL11(20ng/μl) 4μl  4μl 4μl ----  pENTR-attR5-amp-attL11(20ng/μl) ---  --- --- 4μl  pENTR-attR11-loxP-attL17(20ng/μl) 4μl  4μl 4μl 4μl  pENTR-attR17-ori-attL211(20ng/μl) 4μl  4μl 4μl 4μl  LR4缓冲液 8μl  8μl 8μl 8μl  LR Clonase贮藏缓冲液 8μl  --- --- ---  LR Clonase ---  8μl 8μl 8μl

25℃孵育反应物过夜。向每个反应加入4μl蛋白酶K(2mg/ml)并 使用2μl转化DB3.1细胞。将100μl(1/10)转化物铺在含有20μg/ml 氯霉素和50μg/ml卡那霉素(反应1、2和3)或20μg/ml氯霉素和 100μg/ml氨苄青霉素(反应物4)的LB琼脂上。

对于反应3和4,转化物分别产生约5000和10,000个菌落,而 相比之下,对于反应1(无clonase)构成的阴性对照产生约500个菌落, 而对于反应2(无pENTR-attR21-attP1-ccdB-cat-attP2-attL5 DNA) 构成的阴性对照产生80个菌落。从反应3和4的培养物中挑取6个菌 落并通过小量制备分析进行检测。基于超螺旋质粒DNA的大小和通过 诊断限制性消化,所有克隆经确定均正确。通过测试克隆attB PCR产 物的能力,该组装的载体表现出是具有功能的。

实施例20:构建用于Multisite Gateway的attP DONOR质粒

构建含有以下attP位点排列的4个attP DONOR质粒(图26A): attPx ccdB - cat attPy attPx ccdB - cat attPy attPx ccdB - cat attPy attPx ccdB - cat attPy

通过使用含有相容性限制性内切核酸酶位点的引物,PCR扩增attP 位点和attP DONOR载体,来构建这些质粒。每个PCR产物用适当限制 性酶消化。消化的attP DONOR载体PCR产物经脱磷酸化后与消化的 attP位点连接。连接产物由含有以两个方向克隆在pDONOR载体中的 attP位点的质粒组成。

上述attP质粒随后用作PCR反应模板(图26B)。使用特异地与 attP位点核心退火并由此在PCR产物末端产生具有任何期望特异性的 attL或attR位点的引物,进行PCR(见实施例9方法中使用的引物)。 对于每个新的attP DONOR载体,产生两个这样的PCR产物,一个由质 粒骨架(ori-kan)组成而另一个由ccdB和cat基因组成。制备这些PCR 产物并使其在LR Clonase反应中一起反应以产生含有具有任何取向和 特异性的attP位点的新质粒。

                      发明背景

本说明书中提及的所有出版物、专利、和专利申请均表现了本发 明所属领域的普通技术人员的水平,并在此并入作为参考,就如同将 每个单独的出版物、专利、或专利申请具体而单独地并入参考一样。

                      序列表 <110>Cheo,David

 Brasch,Michael A.

 Temple,Gary F.

 Hartley,James L.

 Byrd,Devon R.N. <120>具有独特特异性的多个重组位点在重组克隆中的用途 <130>0942.501PC02 <140>To Be Assigned <141>2000-12-11 <150>US 60/169,983 <151>1999-12-10 <150>US 60/188,020 <151>2000-03-09 <160>140 <170>PatentIn version 3.0 <210>1 <211>27 <212>DNA <213>attB0 <400>1 agcctgcttt tttatactaa cttgagc <210>2 <211>27 <212>DNA <213>attP0 <400>2 gttcagcttt tttatactaa gttggca                                                 27 <210>3 <211>27 <212>DNA <213>attL0 <400>3 agcctgcttt tttatactaa gttggca                                                 27 <210>4 <211>27 <212>DNA <213>attR0 <400>4 gttcagcttt tttatactaa cttgagc                                                 27 <210>5 <211>25 <212>DNA <213>attB1 <400>5 agcctgcttt tttgtacaaa cttgt                                                   25 <210>6 <211>27 <212>DNA <213>attP1 <400>6 gttcagcttt tttgtacaaa gttggca                                                 27 <210>7 <211>27 <212>DNA <213>attL1 <400>7 agcctgcttt tttgtacaaa gttggca                                                    27 <210>8 <211>25 <212>DNA <213>attR1 <400>8 gttcagcttt tttgtacaaa cttgt                                                      25 <210>9 <211>25 <212>DNA <213>attB2 <400>9 acccagcttt cttgtacaaa gtggt                                                      25 <210>10 <211>27 <212>DNA <213>attP2 <400>10 gttcagcttt cttgtacaaa gttggca                                                    27 <210>11 <211>27 <212>DNA <213>attL2 <400>11 acccagcttt cttgtacaaa gttggca                                                    27 <210>12 <211>25 <212>DNA <213>attR2 <400>12 gttcagcttt cttgtacaaa gtggt                                                       25 <210>13 <211>22 <212>DNA <213>attB5 <400>13 caactttatt atacaaagtt gt                                                          22 <210>14 <211>27 <212>DNA <213>attP5 <400>14 gttcaacttt attatacaaa gttggca                                                     27 <210>15 <211>24 <212>DNA <213>attL5 <400>15 caactttatt atacaaagtt ggca                                                        24 <210>16 <211>25 <212>DNA <213>attR5 <400>16 gttcaacttt attatacaaa gttgt                                                       25 <210>17 <211>22 <212>DNA <213>attB11 <400>17 caacttttct atacaaagtt gt                                                             22 <210>18 <211>27 <212>DNA <213>attP11 <400>18 gttcaacttt tctatacaaa gttggca                                                        27 <210>19 <211>24 <212>DNA <213>attL11 <400>19 caacttttct atacaaagtt ggca                                                           24 <210>20 <211>25 <212>DNA <213>attR11 <400>20 gttcaacttt tctatacaaa gttgt                                                          25 <210>21 <211>22 <212>DNA <213>attB17 <400>21 caacttttgt atacaaagtt gt                                                          22 <210>22 <211>27 <212>DNA <213>attP17 <400>22 gttcaacttt tgtatacaaa gttggca                                                     27 <210>23 <211>24 <212>DNA <213>attL17 <400>23 caacttttgt atacaaagtt ggca                                                        24 <210>24 <211>25 <212>DNA <213>attR17 <400>24 gttcaacttt tgtatacaaa gttgt                                                       25 <210>25 <211>22 <212>DNA <213>attB19 <400>25 caactttttc gtacaaagtt gt                                                          22 <210>26 <211>27 <212>DNA <213>attP19 <400>26 gttcaacttt ttcgtacaaa gttggca                                                    27 <210>27 <211>24 <212>DNA <213>attL19 <400>27 caactttttc gtacaaagtt ggca                                                       24 <210>28 <211>25 <212>DNA <213>attR19 <400>28 gttcaacttt ttcgtacaaa gttgt                                                      25 <210>29 <211>22 <212>DNA <213>attB20 <400>29 caactttttg gtacaaagtt gt                                                         22 <210>30 <211>27 <212>DNA <213>attP20 <400>30 gttcaacttt ttggtacaaa gttggca                                                    27 <210>31 <211>24 <212>DNA <213>attL20 <400>31 caactttttg gtacaaagtt ggca                                                           24 <210>32 <211>25 <212>DNA <213>attR20 <400>32 gttcaacttt ttggtacaaa gttgt                                                          25 <210>33 <211>22 <212>DNA <213>attB21 <400>33 caacttttta atacaaagtt gt                                                             22 <210>34 <211>27 <212>DNA <213>attP21 <400>34 gttcaacttt ttaatacaaa gttggca                                                        27 <210>35 <211>24 <212>DNA <213>attL21 <400>35 caacttttta atacaaagtt ggca                                                           24 <210>36 <211>25 <212>DNA <213>attR21 <400>36 gttcaacttt ttaatacaaa gttgt                                                   25 <210>37 <211>15 <212>DNA <213>15bp核心区 <400>37 gcttttttat actaa                                                              15 <210>38 <211>21 <212>DNA <213>参考序列 <400>38 caactttttt atacaaagtt g                                                       21 <210>39 <211>21 <212>DNA <213>att系统核心整合酶结合位点 <220> <221>misc_feature <222>(8)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(9)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(10)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(11)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(12)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(13)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(14)..() <223>n是任何核苷酸 <400>39 caactttnnn nnnnaaagtt g <210>40 <211>17 <212>DNA <213>attB的改变的位点 <220> <221>misc_feature <222>(8)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(9)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(10)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(11)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(12)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(13)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(14)..() <223>n是任何核苷酸 <400>40 caactttnnn nnnnaaa                                                            17 <210>41 <211>48 <212>DNA <213>attL1 PCR引物 <400>41 ggggagcctg cttttttgta caaagttggc attataaaaa agcattgc                          48 <210>42 <211>48 <212>DNA <213>attL2 PCR引物 <400>42 ggggagcctg ctttcttgta caaagttggc attataaaaa agcattgc                          48 <210>43 <211>22 <212>DNA <213>attL右PCR引物 <400>43 tgttgccggg aagctagagt aa                                                      22 <210>44 <211>43 <212>DNA <213>attR1 PCR引物 <400>44 ggggacaagt  ttgtacaaaa aagctgaacg agaaacgtaa aat                              43 <210>45 <211>43 <212>DNA <213>attR2 PCR引物 <400>45 ggggacaagt ttgtacaaga aagctgaacg agaaacgtaa aat                           43 <210>46 <211>22 <212>DNA <213>attR右PCR引物 <400>46 cagacggcat gatgaacctg aa                                                  22 <210>47 <211>29 <212>DNA <213>attB1/B1-Hgb <400>47 ggggacaagt  ttgtacaaaa aagcaggct                                          29 <210>48 <211>29 <212>DNA <213>attB2/B2-Hgb <400>48 ggggaccact ttgtacaaga aagctgggt                                           29 <210>49 <211>18 <212>DNA <213>18B1-Hgb <400>49 tgtacaaaaa agcaggct                                                             18 <210>50 <211>18 <212>DNA <213>18B2-Hgb <400>50 tgtacaagaa agctgggt                                                             18 <210>51 <211>15 <212>DNA <213>15B1-Hgb <400>51 acaaaaaagc aggct                                                                15 <210>52 <211>15 <212>DNA <213>15B2-Hgb <400>52 acaagaaagc tgggt                                                                15 <210>53 <211>12 <212>DNA <213>12B1-Hgb <400>53 aaaaagcagg ct                                                                   12 <210>54 <211>12 <212>DNA <213>12B2-Hgb <400>54 agaaagctgg gt                                                                        12 <210>55 <211>11 <212>DNA <213>11B1-Hgb <400>55 aaaagcaggc t                                                                         11 <210>56 <211>11 <212>DNA <213>11B2-Hgb <400>56 gaaagctggg t                                                                         11 <210>57 <211>10 <212>DNA <213>10B1-Hgb <400>57 aaagcaggct                                                                           10 <210>58 <211>10 <212>DNA <213>10B2-Hgb <400>58 aaagctgggt                                                                           10 <210>59 <211>22 <212>DNA <213>5′-Hgb <400>59 gtcactagcc  tgtggagcaa  ga                                                   22 <210>60 <211>22 <212>DNA <213>3′-Hgb <400>60 aggatggcag agggagacga  ca                                                    22 <210>61 <211>48 <212>DNA <213>PCR引物attL0 <400>61 ggggagcctg cttttttata ctaagttggc attataaaaa agcattgc                         48 <210>62 <211>48 <212>DNA <213>PCR引物attLT1A <400>62 ggggagcctg ctttattata ctaagttggc attataaaaa agcattgc                         48 <210>63 <211>48 <212>DNA <213>PCR引物attLT1C <400>63 ggggagcctg ctttcttata ctaagttggc attataaaaa agcattgc                         48 <210>64 <211>48 <212>DNA <213>PCR引物attLT1G <400>64 ggggagcctg ctttgttata ctaagttggc attataaaaa agcattgc                        48 <210>65 <211>48 <212>DNA <213>PCR引物attLT2A <400>65 ggggagcctg cttttatata ctaagttggc attataaaaa agcattgc                        48 <210>66 <211>48 <212>DNA <213>PCR引物attLT2C <400>66 ggggagcctg cttttctata ctaagttggc attataaaaa agcattgc                        48 <210>67 <211>48 <212>DNA <213>PCR引物attLT2G <400>67 ggggagcctg cttttgtata ctaagttggc attataaaaa agcattgc                        48 <210>68 <211>48 <212>DNA <213>PCR引物attLT3A <400>68 ggggagcctg ctttttaata ctaagttggc attataaaaa agcattgc                         48 <210>69 <211>48 <212>DNA <213>PCR引物attLT3C <400>69 ggggagcctg ctttttcata ctaagttggc attataaaaa agcattgc                         48 <210>70 <211>48 <212>DNA <213>PCR引物attLT3G <400>70 ggggagcctg ctttttgata ctaagttggc attataaaaa agcattgc                         48 <210>71 <211>48 <212>DNA <213>PCR引物attLA4C <400>71 ggggagcctg cttttttcta ctaagttggc attataaaaa agcattgc                         48 <210>72 <211>48 <212>DNA <213>PCR引物attLA4G <400>72 ggggagcctg cttttttgta ctaagttggc attataaaaa agcattgc                         48 <210>73 <211>48 <212>DNA <213>PCR引物attLA4T <400>73 ggggagcctg ctttttttta ctaagttggc attataaaaa agcattgc                         48 <210>74 <211>48 <212>DNA <213>PCR引物attLT5A <400>74 ggggagcctg cttttttaaa ctaagttggc attataaaaa agcattgc                         48 <210>75 <211>48 <212>DNA <213>PCR引物attLT5C <400>75 ggggagcctg cttttttaca ctaagttggc attataaaaa agcattgc                         48 <210>76 <211>48 <212>DNA <213>PCR引物attLT5G <400>76 ggggagcctg cttttttaga ctaagttggc attataaaaa agcattgc                         48 <210>77 <211>48 <212>DNA <213>PCR引物attLA6C <400>77 ggggagcctg cttttttatc ctaagttggc attataaaaa agcattgc                         48 <210>78 <211>48 <212>DNA <213>PCR引物attLA6G <400>78 ggggagcctg cttttttatg ctaagttggc attataaaaa agcattgc                         48 <210>79 <211>48 <212>DNA <213>PCR引物attLA6T <400>79 ggggagcctg cttttttatt ctaagttggc attataaaaa agcattgc                         48 <210>80 <211>48 <212>DNA <213>PCR引物attLC7A <400>80 ggggagcctg cttttttata ataagttggc attataaaaa agcattgc                         48 <210>81 <211>48 <212>DNA <213>PCR引物attLC7G <400>81 ggggagcctg cttttttata  gtaagttggc attataaaaa agcattgc                        48 <210>82 <211>48 <212>DNA <213>PCR引物attLC7T <400>82 ggggagcctg cttttttata ttaagttggc attataaaaa agcattgc                         48 <210>83 <211>48 <212>DNA <213>PCR引物attL8 <400>83 ggggagccta cttttttata ctaagttggc attataaaaa agcattgc                          48 <210>84 <211>48 <212>DNA <213>PCR引物attL9 <400>84 ggggagcctg cctttttata ctaagttggc attataaaaa agcattgc                          48 <210>85 <211>48 <212>DNA <213>PCR引物attL10 <400>85 ggggagcctg cttctttata ctaagttggc attataaaaa agcattgc                          48 <210>86 <211>48 <212>DNA <213>PCR引物attL14 <400>86 ggggagcctg cttttttata ccaagttggc attataaaaa agcattgc                          48 <210>87 <211>48 <212>DNA <213>PCR引物attL15 <400>87 ggggagcctg cttttttata ctaggttggc attataaaaa agcattgc                        48 <210>88 <211>30 <212>DNA <213>attL0 <400>88 agcctgcttt tttatactaa gttggcatta                                            30 <210>89 <211>30 <212>DNA <213>attL5 <400>89 agcctgcttt attatactaa gttggcatta                                            30 <210>90 <211>30 <212>DNA <213>attL6 <400>90 agcctgcttt tttatattaa gttggcatta                                            30 <210>91 <211>30 <212>DNA <213>attL13 <400>91 agcctgcttt tttatgctaa gttggcatta                                            30 <210>92 <211>30 <212>DNA <213>attL14 <400>92 agcctgcttt  tttataccaa gttggcatta                                           30 <210>93 <211>30 <212>DNA <213>attL15 <400>93 agcctgcttt tttatactag gttggcatta                                            30 <210>94 <211>21 <212>DNA <213>共有序列 <220> <221>misc_feature <222>(7)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(8)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(10)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(11)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(12)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(14)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(15)..() <223>n是任何核苷酸 <400>94 caacttnntn nnannaagtt g                                                              21 <210>95 <211>25 <212>DNA <213>attB0 <400>95 tcaagttagt ataaaaaagc aggct                                                          25 <210>96 <211>29 <212>DNA <213>attB2.1 <400>96 ggggaacact ttgtacaaga aagctgggt                                                      29 <210>97 <211>29 <212>DNA <213>attB2.2 <400>97 ggggacaact ttgtacaaga aagctgggt                                                    29 <210>98 <211>29 <212>DNA <213>attB2.3 <400>98 ggggacccct ttgtacaaga aagctgggt                                                    29 <210>99 <211>29 <212>DNA <213>attB2.4 <400>99 ggggaccaat ttgtacaaga aagctgggt                                                    29 <210>100 <211>29 <212>DNA <213>attB2.5 <400>100 ggggaccacg ttgtacaaga aagctgggt                                                    29 <210>101 <211>29 <212>DNA <213>attB2.6 <400>101 ggggaccact gtgtacaaga aagctgggt                                                 29 <210>102 <211>29 <212>DNA <213>attB2.7 <400>102 ggggaccact tggtacaaga aagctgggt                                                 29 <210>103 <211>29 <212>DNA <213>attB2.8 <400>103 ggggaccact ttttacaaga aagctgggt                                                 29 <210>104 <211>29 <212>DNA <213>attB1.6 <400>104 ggggacaact ttgtacaaaa aagttggct                                                 29 <210>105 <211>29 <212>DNA <213>attB2.10 <400>105 ggggacaact ttgtacaaga aagttgggt                                                 29 <210>106 <211>29 <212>DNA <213>attb1n16-20 <220> <221>misc_feature <222>(20)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(21)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(22)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(23)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(24)..() <223>n是任何核苷酸 <400>106 ggggacaagt  ttgtacaaan nnnnaggct                                              29 <210>107 <211>29 <212>DNA <213>attb1n21-25 <220> <221>misc_feature <222>(25)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(26)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(27)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(28)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(29)..() <223>n是任何核苷酸 <400>107 ggggacaagt ttgtacaaaa aagcnnnnn                                               29 <210>108 <211>29 <212>DNA <213>attb2n16-20 <220> <221>misc_feature <222>(20)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(21)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(22)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(23)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(24)..() <223>n是任何核苷酸 <400>108 ggggaccact ttgtacaagn nnnntgggt                                              29 <210>109 <211>29 <212>DNA <213>attb2n21-25 <220> <221>misc_feature <222>(25)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(26)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(27)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(28)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(29)..() <223>n是任何核苷酸 <400>109 ggggaccact ttgtacaaga aagcnnnnn                                                   29 <210>110 <211>28 <212>DNA <213>attb1(片段a的5′末端) <220> <221>misc_feature <222>(27)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(28)..() <223>n是任何核苷酸 <400>110 ggggacaact ttgtacaaaa aagttgnn                                               28 <210>111 <211>26 <212>DNA <213>attb5(片段a的3′末端) <400>111 ggggacaact ttgtataata aagttg                                                 26 <210>112 <211>26 <212>DNA <213>attb5r(片段b的5′末端) <400>112 ggggacaact ttattataca aagttg                                                 26 <210>113 <211>26 <212>DNA <213>attb2(片段b的3′末端) <220> <221>misc_feature <222>(26)..() <223>n是任何核苷酸 <400>113 gggacaactt tgtataataa agttgn                                                26 <210>114 <211>28 <212>DNA <213>attb1(片段a的5′末端) <220> <221>misc_feature <222>(27)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(28)..() <223>n是任何核苷酸 <400>114 ggggacaact ttgtacaaaa aagttgnn                                              28 <210>115 <211>25 <212>DNA <213>attb21R(片段b的3′末端) <400>115 gggacaactt tttaatacaa agttg                                                 25 <210>116 <211>26 <212>DNA <213>attb21(片段c的5′末端) <400>116 ggggacaact ttgtattaaa aagttg                                                26 <210>117 <211>27 <212>DNA <213>attb2(片段c的3′末端) <220> <221>misc_feature <222>(27)..() <223>n是任何核苷酸 <400>117 ggggacaact ttgtataata aagttgn                                               27 <210>118 <211>16 <212>DNA <213>最佳Shine-Delgarno和Kozak序列 <400>118 ggaggtatat accatg                                                           16 <210>119 <211>39 <212>DNA <213>SD 5′luxA <400>119 ggaggtatat accatgaagt ttggaaatat ttgtttttc                                  39 <210>120 <211>49 <212>DNA <213>T7 3′luxA <400>120 gaagctatag tgagtcgtat tatttaggtt cttttaagaa aggagcgac                       49 <210>121 <211>40 <212>DNA <213>SD 5′luxB <400>121 ggaggtatat accatgaaat ttggattatt ttttctaaac                                      40 <210>122 <211>47 <212>DNA <213>T7 3′luxB <400>122 gaagctatag tgagtcgtat tatggtaaat tcatttcgat tttttgg                              47 <210>123 <211>45 <212>DNA <213>SD 5′luxC <400>123 ggaggtatat accatgaata aatgtattcc aatgataatt aatgg                                45 <210>124 <211>50 <212>DNA <213>T7 3′luxC <400>124 gaagctatag tgagtcgtat tatgggacaa aaactaaaaa cttatcttcc                           50 <210>125 <211>44 <212>DNA <213>SD 5′luxD <400>125 ggaggtatat accatgaaag atgaaagtgc tttttttacg attg                           44 <210>126 <211>46 <212>DNA <213>T7 3′luxD <400>126 gaagctatag tgagtcgtat taagccaatt ctaataattc attttc                         46 <210>127 <211>44 <212>DNA <213>SD 5′luxE <400>127 ggaggtatat accatgactg tccatactga atataaaaga aatc                           44 <210>128 <211>53 <212>DNA <213>T7 3′luxE <400>128 gaagctatag tgagtcgtat taaatccttg atattctttt gtatgacatt agc                 53 <210>129 <211> 44 <212>DNA <213>B1.6 SD <400>129 ggggacaact ttgtacaaaa aagttgaagg aggtatatac catg                           44 <210>130 <211>44 <212>DNA <213>B5 T7 <400>130 ggggacaact ttgtataata aagttggaag ctatagtgag tcgt                             44 <210>131 <211>44 <212>DNA <213>B5R SD <400>131 ggggacaact ttattataca aagttgaagg aggtatatac catg                             44 <210>132 <211>44 <212>DNA <213>B11 T7 <400>132 ggggacaact ttgtatagaa aagttggaag ctatagtgag tcgt                             44 <210>133 <211>44 <212>DNA <213>B11R SD <400>133 ggggacaact tttctataca aagttgaagg aggtatatac catg                             44 <210>134 <211>44 <212>DNA <213>B17 T7 <400>134 ggggacaact ttgtatacaa aagttggaag ctatagtgag tcgt                             44 <210>135 <211>44 <212>DNA <213>B17R SD <400>135 ggggacaact tttgtataca aagttgaagg aggtatatac catg                                44 <210>136 <211>44 <212>DNA <213>B21 T7 <400>136 ggggacaact ttgtattaaa aagttggaag ctatagtgag tcgt                                44 <210>137 <211>44 <212>DNA <213>B21R SD <400>137 ggggacaact ttttaataca aagttgaagg aggtatatac catg                                44 <210>138 <211>44 <212>DNA <213>B2.10 T7 <400>138 ggggacaact ttgtacaaga aagttggaag ctatagtgag tcgt                                44 <210>139 <211>14 <212>DNA <213>12attB1正向的模板特异的引物 <220> <221>misc_feature <222>(13)..() <223>n是任何核苷酸 <220> <221>misc_feature <222>(14)..() <223>n是任何核苷酸 <400>139 aaaaagcagg ctnn                                                           14 <210>140 <211>13 <212>DNA <213>12attB2反向的模板特异的引物 <220> <221>misc_feature <222>(13)..() <223>n是任何核苷酸 <400>140 agaaagctgg gtn                                                            13

QQ群二维码
意见反馈