具有独特特异性的多个重组位点在重组克隆中的用途

申请号 CN200510103730.5 申请日 2000-12-11 公开(公告)号 CN1757724B 公开(公告)日 2014-06-11
申请人 茵维特罗根公司; 发明人 D·柴奥; M·A·布拉什; G·F·坦普尔; J·L·哈特雷; D·R·N·比尔德;
摘要 本 发明 提供用于重组克隆的组合物和方法。该组合物包括含有具有独特特异性的多个重组位点的载体。该方法允许同时克隆两个或多个不同的核酸分子。在一些实施方案中,将这些分子融合在一起,而在其它实施方案中,将这些分子插入载体的不同位点。一般地,本发明还提供通过重组将许多可以相同或不同的分子和/或化合物(如化学化合物、药物、 蛋白质 或肽、脂、核酸、糖等)连接或接合起来的方法。根据本发明,这些分子和/或化合物或这些分子和/或化合物的组合还可以通过重组与多种结构或支持物结合。
权利要求

1.克隆n个核酸区段的方法,其中n是大于1的整数,该方法包括:
(a)提供n个核酸区段,每个区段的侧翼有两个不相互重组的重组位点;
(b)提供包含2n个重组位点的载体,其中该2n个重组位点的每一个均能够与位于一个核酸区段侧翼的重组位点之一重组;和
(c)进行重组反应,以便该n个核酸区段重组进入该载体中,由此克隆该n个核酸区段,其中所述重组反应发生在体外,其中核酸区段和载体的重组位点是att位点且其中n是2、3、4或5。
2.权利要求1的方法,其中这些核酸区段的至少一个与能够调节转录的序列可操作地连接。
3.权利要求2的方法,其中能够调节转录的序列选自:
(a)启动子;
(b)增强子;和
(c)阻遏基因。
4.权利要求3的方法,其中启动子是诱导型启动子或组成型启动子。
5.权利要求1的方法,其中从该克隆的核酸区段产生的RNA的翻译导致产生融合蛋白。
6.权利要求1的方法,其中这些核酸区段的至少一个编码可读框的全部或部分,而且这些核酸区段的至少一个舍有能够调节转录的序列。
7.权利要求1的方法,其中这些核酸区段的至少一个在转录后产生有义RNA链,而且这些核酸区段的至少一个在转录后产生反义RNA。
8.权利要求7的方法,其中有义RNA和反义RNA具有至少一个互补区并能够彼此杂交。
9.权利要求1的方法,其中至少两个核酸区段的转录导致产生单个RNA。
10.权利要求9的方法,其中至少一个核酸区段在转录后产生有义RNA链,而且至少一个核酸区段在转录后产生反义RNA链。
11.权利要求10的方法,其中有义RNA和反义RNA具有至少一个互补区并能够彼此杂交。
12.权利要求1的方法,其中这些核酸区段包含一或多个文库的核酸分子。
13.权利要求12的方法,其中一或多个文库包含cDNA或基因组DNA。
14.权利要求12的方法,其中一或多个文库包含编码抗体分子可变区的核酸分子。
15.权利要求14的方法,其中一或多个文库包含编码抗体轻链和重链可变区的核酸分子。
16.权利要求1的方法,还包括筛选以鉴定编码具有针对一或多种抗原的结合特异性的蛋白质的核酸分子。
17.权利要求1的方法,还包括筛选以鉴定编码具有一或多种活性的蛋白质的核酸分子。
18.权利要求17的方法,其中活性包含一或多个选自下组的活性:
(a)从细胞中分泌;
(b)亚细胞定位
(c)配体结合活性;和
(d)酶活性。
19.权利要求18的方法,其中蛋白质位于内质网、细胞核、线粒体、叶绿体、或细胞膜。
20.权利要求18的方法,其中该蛋白质与选自下组的配体结合;
(a)核酸;
(b)细胞表面受体;
(c)可溶性蛋白质;和
(d)金属离子
21.克隆至少一个核酸分子的方法,包括:
(a)提供第1、第2和第3核酸区段,其中该第1核酸区段侧翼有第1和第2重组位点,第2核酸区段的侧翼有第3和第4重组位点,而笫3核酸区段的侧翼有笫5和笫6重组位点,其中该第2重组位点能够和第3重组位点重组,而该第1、4、5或6重组位点均不能够和该第1至第6重组位点中的任一个重组;
(b)提供包含位于第1负选择标记侧翼的第7和第8重组位点并包含位于第2负选择标记侧翼的第9和笫10重组位点的载体,其中该第7至第10重组位点均不能与该第7至第10重组位点中的任一个重组;
(c)进行第1重组反应,使得该第2和第3重组位点重组;和
(d)进行第2重组反应,使得该第1和笫4重组位点与第7和第8重组位点重组,而第
5和第6重组位点与第9和第10重组位点重组,由此克隆该第1、2和3核酸区段,其中所述第1和第2重组反应发生在体外,其中核酸区段和载体的重组位点是att位点。
22.克隆至少一个核酸分子的方法,包括:
(a)提供第1、2和3核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点,第
2核酸区段的侧翼有第3和第4重组位点,而第3核酸区段的侧翼有第5和第6重组位点,其中该第2重组位点能够和第3重组位点重组,而笫4重组位点能够和第5重组位点重组;
(b)提供包含第7和第8重组位点的载体;和
(c)进行至少一个重组反应,使得该第2和第3重组位点重组,而第4和第5重组位点重组,第1和第6重组位点分别与第7和第8重组位点重组,由此克隆该第1、2和3核酸区段,
其中所述至少一个重组反应发生在体外,其中核酸区段和载体的重组位点是att位点,
其中该重组反应在存在一或多个重组蛋白时在利于该重组的条件下进行。
23.克隆n个核酸片段的方法,其中n是大于2的整数,包括:
(a)提供第1至第n核酸区段,每个区段的侧翼有两个重组位点,其中对这些重组位点进行选择以致位于第i区段ni侧翼的两个重组位点之一与位于第ni-1区段侧翼的重组位点之一反应,而位于第i区段侧翼的另一重组位点和位于笫nH核酸区段侧翼的重组位点之一反应;
(b)提供含有至少两个重组位点的载体,其中载体上的两个重组位点之一可与第1核酸区段上的位点之一反应,载体上的另一个位点可与第n核酸区段上的重组位点反应;和(c)进行至少一个重组反应使得所有的核酸片段都重组进入载体中,
其中所述至少一个重组反应发生在体外,其中核酸区段和载体的重组位点是att位点,且其中n是2、3、4或5。
24.权利要求23的方法,其中彼此重组的重组位点包含具有相同7基对重叠区的att位点。
25.通过权利要求21的方法制备的核酸分子。
26.克隆至少一个核酸分子的方法,包括:
(a)提供第一群核酸分子,其中这些分子的全部或部分的侧翼有第1和第2重组位点;
(b)提供至少一个侧翼有第3和第4重组位点的核酸区段,其中该第1或第2重组位点能够与第3或第4重组位点重组;
(c)进行重组反应以致在该群体中所有或部分核酸分子与该区段重组,形成第2群核酸分子;和
(d)克隆笫2群核酸分子,
其中所述重组反应发生在体外。
27.权利要求26的方法,其中第2群核酸分子编码融合蛋白。
28.权利要求26的方法,其中该核酸区段编码选自下组的多肽:
(a)免疫球蛋白的Fc部分;
(b)β-葡糖酸糖苷酶;
(c)荧光蛋白;
(d)纯化标签;和
(e)表位标签。
29.权利要求28的方法,其中该核酸区段编码选自下组的荧光蛋白:
(a)绿色荧光蛋白;
(b)黄色荧光蛋白;
(c)红色荧光蛋白;和
(d)蓝色荧光蛋白。
30.权利要求28的方法,其中该核酸区段编码选自下组的纯化标签:
(a)表位标签;
(b)麦芽糖结合蛋白;
(c)6组酸标签;和
(d)谷胱甘肽S转移酶。
31.通过权利要求26的方法制备的核酸分子。
32.克隆至少一个核酸分子的方法,包括:
(a)提供第一群核酸分子,其中这些分子中的所有或部分分子的侧翼有至少第1和第2重组位点;
(b)提供第二群核酸分子,其中这些分子中的所有或部分分子的侧翼有第3和第4重组位点,其中该第1或第2重组位点能够与第3或第4重组位点重组;
(c)进行重组反应,使得第一群中的所有或部分分子与第二群的一或多个分子重组,形成第三群核酸分子;和
(d)克隆该第三群核酸分子,
其中所述重组反应发生在体外。
33.权利要求32的方法,其中该重组反应在存在一或多个重组蛋白时在利于该重组的条件进行。

说明书全文

具有独特特异性的多个重组位点在重组克隆中的用途

[0001] 发明背景
[0002] 发明领域
[0003] 本发明涉及生物技术和分子生物学领域。具体地,本发明涉及优选通过使用具有独特特异性的重组位点,将多个含有重组位点的核酸分子接合起来。本发明还涉及使用重组克隆方法克隆这些接合的核酸分子。本发明还涉及通过使用重组位点将多个肽、和肽与核酸分子的组合接合在一起。根据本发明,其它分子和化合物或分子和化合物的组合也可以通过重组位点结合在一起。根据本发明,这些肽、核酸和其它分子和/或化合物(或其组合)还可以通过重组与一或多个支持物或结构接合或结合。
[0004] 相关领域
[0005] 位点特异性重组酶
[0006] 位点特异性重组酶是许多生物(例如病毒和细菌)中存在的蛋白质,其特征在于具有内切核酸酶和连接酶性质。这些重组酶(在某些情况下与相关的蛋白质一起)识别核
酸分子中的基特异序列并使位于那些序列侧翼的核酸区段发生交换。重组酶和相关蛋白质共同被称作“重组蛋白质”(见例如,Landy,A.,Current Opinion inBiotechnology 3:
699-707(1993))。
[0007] 不同生物的许多重组系统已有描述。见例如,Hoess等,NucleicAcidsResearch 14(6):2287(1986);Abremski等,J.Biol.Chem.261(1):391(1986);Campbell,J.Bacteriol.174(23):7495(1992);Qian 等,J.Biol.Chem.267(11):7794(1992);
Araki 等,J.Mol.Biol.225(1):25(1992);Maeser 和 Kahnmann,Mol.Gen.Genet.230:
170-176(1991):Esposito等,Nucl.Acids Res.25(18):3605(1997)。这些中的许多属于重组酶的整合酶家族(Argos等,EMBO J.5:433-440(1986);Vaziyanov等,Nucl.Acids Res.27:930(1990))。其中研究得最好的可能是λ噬菌体的整合酶/att系统(Landy,
A.Current Opinions in Genetics and Devel.3:699-707(1993))、P1噬菌体的Cre/
loxP系统(Hoess和Abremski(1990),NucleicAcids and Molecular Biology,第4卷,
编:Eckstein和Lilley,Berl in-Heidelberg:Speringer-Verlag;第90-109页)、和酿酒酵母(Saccaromyces cerevisiae)2μ环状质粒的FLP/FRT系统(Broach等,Cell29:
227-234(1982))。
[0008] 转座子
[0009] 转座子是可动遗传因子。转座子在结构上是可变的,被描述为简单型或复合型,但典型地编码一个转座催化酶,术语称作转座酶,两侧为反向组织的DNA序列。对于转座子特性的更为完全的讨论,可以参考Mobile Genetic Elements,D.J.Sherratt编,OxfordUniversity出版(1995)和Mobile DNA,D.E.Berg和M.M.Howe编,American Soceity fot Microbiology(1989),Washington,DC,两本书均特此并入本文作为参考。
[0010] 转座子已被用于将DNA插入靶DNA序列中。作为一般原则,转座子在靶DNA中的插入是随机事件。该原则的一个例外是转座子Tn7的插入。作为生命周期的一个部分,转座子Tn7可以将自身整合到大肠杆菌(E.coli)基因组的特异位点中(Stellwagen,A.E.和
Craig,N.L.Trends in Biochemical Sciences23,486-490,1998,特此并入本文作为参考)。该位点特异性插入已被用于体内操作杆状病毒的基因组(Lucklow等,J.Virol.67:
4566-4579(1993),特此并入本文作为参考)。对于其特点为向受体DNA分子中的随机位置移动的可转座元件而言,Tn7的位点特异性是非典型的。为了本申请的目的,除非另行指出,转座将用于指随机或半随机的移动,而重组将用于指位点特异性重组事件。因此,Tn7在attTn7位点中的位点特异性插入将被称作重组事件,而Tn7的随机插入将被称作转座事件。
[0011] York等(Nucleic Acids Research,26(8):1927-1933,(1998))公开了基于使用Tn5在质粒分子内的转座事件制备嵌套缺失的体外方法。在存在纯化的转座酶蛋白质的情况下,体外孵育含有侧翼有两个19碱基对的Tn5转座酶识别序列的卡那霉素抗性基因及靶DNA序列的载体。在使用低DNA浓度的条件下,有利于分子内转座反应发生,该反应被成功用于在靶DNA中制备一套嵌套缺失。这些作者提出,通过将终止信号包括在识别序列相邻的所有三种阅读框中,该系统可以用于在靶DNA编码的蛋白质中产生C端截短。此外,这些作者提出,将His标签和激酶区域包含在内可以用于制备N端缺失蛋白质以便作进一步分析。
[0012] Devine 等 (Nucleic Acids Research,22:3765-3772(1994) 和 美 国 专 利5,677,170和5,843,772,所有均特此并入本文作为参考)公开了用于体外将DNA区段插入
受体DNA分子中的人工转座子的构建。该系统利用酵母YT1病毒样颗粒的插入催化酶作为
转座酶活性的来源。使用标准方法,将目的DNA区段克隆在转座子样元件TY1两末端之间。
当存在TY1插入催化酶时,所获元件将随机整合至第二靶DNA分子中。
[0013] 另一类可动遗传因子是整合子。整合子一般由位于一个可变序列侧翼的5’和3’保守序列组成。典型地,该5’保守序列含有整合酶蛋白质的编码信息。该整合酶蛋白质可以催化在多种重组位点(包括attI、attC)以及其它类型的位点处发生位点特异性重组(见Francia等,J.Bacteriology181(2):6844-6849,1999,和其中的引用文献)。
[0014] 重组位点
[0015] 无论以上讨论的反应被称作重组、转座或整合以及它们是由重组酶或整合酶催化的,它们均具有一个关键特征,即核酸分子上参与这些反应的常被称作“重组位点”的特异识别序列。这些重组位点是参加反应的核酸分子上被重组蛋白质在整合或重组的初期识别和结合的核酸部分或区段。例如,Cre重组酶的重组位点是34个碱基对序列的loxP,该序列由位于8碱基对核心序列侧翼的两个13碱基对反向重复(充当重组酶结合位点)组成。见Sauer,B.,Curr.Opin.Biotech.5:521-527(1994)的图1。识别序列的其它例子包括重组蛋白λ Int所识别的attB、attP、attL、和attR序列。attB为含有两个9碱基对核心
型Int结合位点和一个7碱基对重叠区的约25碱基对序列,而attP为含有核心型Int结
合位点和臂型Int结合位点以及辅助蛋白质整合宿主因子(IHF)、FIS和外切酶(Xis)的位
点的约240个碱基对序列。见Landy,Curr.Opin.Biotech.3:699-707(1993)。
[0016] 终止密码子和抑制型tRNA
[0017] 真核和原核生物均使用三种密码子作为基因终止的信号。当转录为mRNA后,这些密码子具有以下序列:UAG(琥珀)、UGA(乳白)和UAA(赭石)。在大多数情况下,细胞不含有识别这些密码子的任何tRNA分子。因此,当翻译mRNA的核糖体到达这些密码子之一时,核糖体停止并从该RNA上落下,终止该mRNA的翻译。核糖体自mRNA上的释放是由特异因子介导的(见S.Mottagui-Tabar,NAR26(11),2789,1998)。具有一个符合读框的终止密码子(TAA,TAG或TGA)的基因通常将编码具有天然羧基端的蛋白质。然而,抑制型tRNA可以导致在终止密码子后插入基酸和持续翻译。
[0018] 识别通常的终止密码子的突变tRNA分子可以抑制mRNA分子的翻译终止,并被称作抑制型tRNA。已经发现了许多这样的抑制型tRNA。例子包括,但不限于,抑制琥珀终止密码子的翻译终止的supE、supP、supD、supF和supZ抑制基因,抑制赭石终止密码子的功能的supB、glT、supL、supN、supC和supM抑制基因,和抑制乳白终止密码子的功能的glyT、trpT和Su-9。一般,抑制型tRNA在tRNA的反密码子环中含有一或多个突变,这使得该tRNA可
以和通常发挥终止密码子功能的密码子发生碱基配对。该突变tRNA荷载其关联氨基酸残
基,并在遇到终止密码子时将该关联氨基酸残基插入正在翻译的多肽中。对于抑制型tRNA的更为详细讨论,读者可以参考Eggertsson等(1988)Microbiological Review52(3):
354-374,和Engleerg-Kukla等,(1996),《Escherichia coli and Salmonella Cellular and MolecularBiology》,第 60章,第 909-921页,Neidhardt 等 ( 编 ),ASM Press,Washington,DC。
[0019] 已经鉴定出增加终止抑制基因的效率的突变,即增强终止密码子通读的突变。这些包括,但不限于,uar基因(又称作prfA基因)中的突变,ups基因中的突变,sueA、sueB和sueC基因中的突变,rpsD(ramA)和rpsE(spcA)基因中的突变,和rplL基因中的突变。
[0020] 在普通情况下,如果终止密码子的抑制效率过高,预期宿主细胞将是不健康的。这是由于基因组的数千或几万个基因中相当大部分天然具有这三个密码子中的一个;这些密码子的完全通读将导致大量在其羧基端含有额外氨基酸的异常蛋白质。如果存在一定平的抑制型tRNA,则在氨基酸的掺入和核糖体的释放之间就存在一个竞争。尽管其它因素例如密码子前后序列可以影响抑制的效率,但较高水平的tRNA可以导致更多的通读。
[0021] 生物体通常具有多个编码tRNA的基因。与遗传密码的冗余性(许多氨基酸可以由多个密码子编码)组合,一个tRNA基因突变为抑制型tRNA状态并不导致高水平的抑制。
TAA终止密码子是最强的,也最难于抑制。TGA是最弱的,并天然(在大肠杆菌中)造成3%程度的渗漏。TAG(琥珀)密码子相对严紧,在无抑制时有约1%的通读。此外,天然存在的抑制突变体可以以大约50%的效率抑制琥珀密码子。
[0022] 抑制已在细菌和噬菌体中研究了数十年。此外,已知在酵母、蝇、植物和其它真核细胞(包括哺乳动物细胞)中也存在抑制。例如,Capone等(Molecular and CellularBiology6(9):3059-3067,1986)证明,来源于哺乳动物tRNA的抑制型tRNA可以用于抑制哺乳动物细胞中的终止密码子。将以终止密码子替代第27位丝氨酸密码子的大肠杆菌氯
霉素乙酰转移酶(cat)基因的拷贝、以及经突变形成琥珀、赭石、或乳白抑制衍生物的编码人丝氨酸tRNA的基因,一起转染至哺乳动物细胞中。观察到cat基因的成功表达。可诱导的哺乳动物琥珀抑制基因已被用于抑制脊髓灰质炎病毒的复制酶基因中的突变,并且表达该抑制基因的细胞系成功地被用于增殖此突变病毒(Sedivy等,(1987)Cell50:379-389)。
已经显示,与大肠杆菌相比,抑制型tRNA前后序列对终止密码子抑制效率的影响在哺乳动物细胞中是不同的(Philips-Jones等,(1995)Molecular and Cellular Biology15(12):
6593-6600;Martin等(1993)Biochemical SocietyTransactions21:)。由于一些人类
疾病是由必需基因中的无义突变引起的,人们早已认识到抑制在基因治疗中的潜(见
Temple等(1982)Nature296(5857):537-40)。对导入白喉毒素A基因中的单个和两个无义突变进行抑制,已被用作毒性基因治疗的二元系统的基础(Robinson等(1995)Human Gene Therapy6:137-143)。
[0023] 常规核酸克隆
[0024] 目前核酸区段的克隆是许多研究型实验室的日常工作并是许多遗传分析的先决步骤。这些克隆的目的是多样的,然而,可以认为有两个一般的目的:(1)从大DNA或RNA区段(染色体、YAC、PCR片段、mRNA等)将核酸初始克隆至相对少数的已知载体如pUC、pGem、pBlueScript中,和(2)将这些核酸区段亚克隆至用于功能分析的特化载体中。大量的时间和努力被花在将核酸区段从初始的克隆载体上转移至更特化的载体上。此转移被称作亚克隆。
[0025] 克隆的基本方法已已知了许多年,而且在此期间几乎没有改变。典型的克隆方案如下:
[0026] (1)用一或两种限制性酶消化目的核酸;
[0027] (2)当已知时,凝胶纯化目的核酸区段;
[0028] (3)适当地,通过用适当的限制性酶切割、用碱性磷酸酶处理、凝胶纯化等,以预备载体;
[0029] (4)将核酸区段与载体连接,并使用适当的控制以消除由未切割的和自连的载体构成的背景;
[0030] (5)将所获载体导入大肠杆菌宿主细胞中;
[0031] (6)挑取所选的菌落并过夜培养小量培养物;
[0032] (7)小量制备核酸;并
[0033] (8)在琼脂糖凝胶上(通常在诊断性限制性酶消化后)或通过PCR分析此分离的质粒。
[0034] 用于亚克隆核酸区段的特化载体在功能上是多样的。这些包括但不限于:用于在各种生物体中表达核酸分子的载体;用于调节核酸分子表达的载体;用于提供标签以帮助蛋白质纯化或以允许在细胞中跟踪蛋白质的载体;用于修饰该克隆核酸区段(如产生缺失)的载体;用于合成探针(例如核糖核酸探针)的载体;用于制备核酸测序模板的载体;
用于鉴定蛋白编码区域的载体;用于融合各种蛋白编码区的载体;用于提供大量目的核酸的载体等。一般,一项特定的研究会涉及到将目的核酸区段插入各种不同的特化载体中。
[0035] 正如本领域已知的,简单的亚克隆可以在一天完成(例如核酸区段不大而且限制性位点与亚克隆载体的限制性位点相容)。然而,许多其它的亚克隆可能要花几周的时间,尤其是涉及到未知序列、长片段、毒性基因、未适当放置的限制性位点、高背景、酶不纯等的那些亚克隆。最繁琐和耗时的一种亚克隆类型涉及将几个核酸区段连续地加入载体中以便构建期望克隆。此类克隆的一个例子是在构建基因靶向载体中的克隆。基因靶向载体典型地包括两个核酸区段,它们每个均与靶基因的一个部分一致,并位于选择标记的侧翼。为了构建这样的载体,可能必需连续地克隆每个区段,即在载体中首先插入一个基因片段、然后插入选择标记、再然后插入靶基因的第二个区段。对于每个片段的克隆,这都可能要求多次的消化、纯化、连接和分离步骤。因此亚克隆核酸片段常被看作应尽可能少做的繁琐之事。
[0036] 几种促进核酸片段克隆的方法已有描述,例如以下文献中所述。
[0037] Ferguson,J.等,Gene16:191(1981),公开了用于亚克隆酵母核酸片段的一个载体家族。这些载体编码卡那霉素抗性。可以将较长酵母核酸区段的克隆部分消化并连接入这些亚克隆载体中。如果最初的克隆载体赋予了氨苄青霉素抗性,由于卡那霉素的选择,则在转化前都没有必要进行纯化。
[0038] Hashimoto-Gotoh,T.等,Gene41:125(1986),公开了在链霉素敏感基因内具有独特克隆位点的亚克隆载体;在链霉素抗性宿主中,只有在此显性敏感基因中具有插入或缺失的质粒才可在链霉素的选择下存活。
[0039] 尽管有这些方法提供的改进,但使用限制和连接酶系统进行传统亚克隆仍是费时的而且相对不可靠。相当多的劳力被耗费,而且如果两或多天后在这些候选质粒中不能发现期望的亚克隆,则必需尝试另外的条件来重复整个过程。
[0040] 重组克隆
[0041] 利用在规定的重组位点处进行重组的克隆系统先前已在下列相关申请中作过描述:1998年10月23日提交的美国申请09/177,387;2000年3月2日提交的美国申请
09/517,466;和美国专利5,888,732和6,143,557,所有这些均特此并入本文作为参考。
简而言之,本申请和相关申请部分中提及的申请所描述的GATEWATTM克隆系统,利用含有至少一个重组位点的载体在体内或体外克隆期望的核酸分子。更具体地,该系统利用了
含有从野生型位点(att0)突变而来的至少两个不同位点特异性的重组位点(例如att1
和att2)的载体,这些重组位点的基础是λ噬菌体系统。每个突变位点对其关连伙伴
(cognate partner)的相同类型(例如attP1和attB1、或attR1和attL)att位点(即其
结合伙伴的重组位点)具有独特的特异性,并且不会与其它突变类型的重组位点或与野生型att0位点有交叉反应。不同的位点特异性允许定向克隆或连接期望分子,由此提供具有TM
期望取向的克隆分子。使用GATEWAY 系统,通过替换受体质粒分子(有时称作目的载体
(Destination vector))上侧翼有att位点的选择标记(例如ccdB),可以克隆和亚克隆侧
翼有重组位点的核酸片段。然后通过转化ccdB敏感宿主株和对受体分子上的标记作正筛
选,选择期望的克隆。在其它生物体中可以使用类似的策略进行负筛选(例如使用毒性基因),例如在哺乳动物和昆虫中使用胸苷激酶(TK)。
[0042] 对att位点核心区中的特定残基进行突变可以产生大量不同的att位点。与TM
GATEWAY 中利用的att1和att2位点一样,每个额外的突变均潜在地产生一个新的具有独
特特异性的att位点,该位点将仅与其携带相同突变的关连伙伴att位点重组,而不会与
任何其它的突变或野生型att位点发生交叉反应。2000年3月2日提交的先前专利申请
系列号09/517,466中描述了新的突变att位点(例如attB1-10、attP1-10、attR1-10、和
attL1-10),该文献特此并入本文作为参考。具有独特特异性的其它重组位点(即,第一位点将与其相应位点重组,并且不会或基本上不会与具有不同特异性的第二位点重组)可以用于实施本发明。适当的重组位点的例子包括,但不限于,loxP位点;loxP位点突变体、变体或衍生物如loxP511(见美国专利5,851,808);frt位点;frt位点突变体、变体或衍生
物;dif位点;dif位点突变体、变体或衍生物;psi位点;psi位点突变体、变体或衍生物;
cer位点;和cer位点突变体、变体或衍生物。本发明提供使用这些重组位点将多个核酸分子或区段接合或连接在一起的新方法,更具体的是将该多个(例如2、3、4、5、7、10、12、15、
20、30、50、75、100、200等)区段克隆至含有一或多个(例如2、3、4、5、7、10、12、15、20、30、
50、75、100、200等)重组位点的一或多个载体(例如2、3、4、5、7、10、12等)中,例如包括目的载体在内的任何GATEWAYTM载体。
[0043] 发明简述
[0044] 一般地,本发明提供通过重组位点(每个分子或区段上存在至少一个的重组位点)间的重组反应用于将两个或多个(例如2、3、4、5、7、10、12、15、20、30、50、75、100、200等)核酸区段或分子接合或联合在一起的材料和方法。根据本发明将多个核酸分子接合起来的这些重组反应可以在体内(例如细胞、组织、器官或组织内)或在体外(例如无细胞系统)中进行。因此,本发明涉及用于产生新的或独特的核酸分子组合的方法、并涉及通过这些方法产生的核酸分子。本发明还涉及包含本发明核酸分子的宿主和宿主细胞。本发明还涉及用于实施本发明方法的试剂盒、和用于实施本发明方法的组合物、以及实施本发明时产生的组合物。
[0045] 通过本发明方法产生的核酸分子可以用于本领域技术人员已知的任何目的。例如,本发明核酸分子可以用于表达该核酸分子所编码的蛋白质或肽并可以通过表达本发明方法连接在一起的不同序列用于制备新的融合蛋白。这些表达可以在细胞中或通过使用熟知的体外表达/翻译系统来实现。一方面,有待通过本发明方法接合在一起的核酸分子或区段中的每个分子均可以包含多个重组位点(例如2、3、4、5、7、10、12、15、20、30、50等),但其中的至少一个(优选两个或多个)包含至少两个重组位点。这些重组位点(可以相同或
不同)可以位于每个核酸分子或区段的不同位置,而且本发明所用核酸可以具有不同的大小和不同的形式包括环状、超螺旋、线性等。用于本发明中的核酸分子还可以包含使得该分子可以在宿主细胞中发挥载体功能的一或多个载体或一或多个序列(例如复制起点)。本
发明核酸分子还可以包含发挥结构功能或其它非表达功能的非编码区段(例如,内含的、非翻译的、或其它区段)。
[0046] 在一个优选方面,用于本发明中的核酸分子或区段是在核酸的至少一个末端或近末端具有至少一个重组位点的线性分子,并优选在该分子的两个末端或近末端包含至少一个重组位点。在另一优选方面,当有多个重组位点位于目的核酸分子上时,这些位点基本上不或不在该分子上发生相互重组。在该实施方案中,相应的结合配偶重组位点优选位于有待通过本发明方法连接或接合的其它一个或多个核酸分子上。例如,本发明所用第一核酸分子可以包含至少第一和第二重组位点,而第二核酸分子可以包含至少第三和第四重组位点,其中该第一和第二位点不能相互重组,而第三和第四位点不能相互重组,但该第一和第三和/或该第二和第四位点可以重组。
[0047] 可以使用有待通过本发明方法接合在一起的核酸分子(即“起始分子”)制备一或多个(例如2、3、4、5、7、10、12、15、20、30、50、75、100、200等)含有所有或部分起始分子的杂合分子(例如“核酸分子产物”)。起始分子可以是来源于任何来源或通过任何方法产生的任何核酸分子。这些分子可以来源于天然来源(例如细胞(如原核细胞如细菌细胞、
真核细胞如真菌细胞(如酵母细胞)、植物细胞、动物细胞(如哺乳动物细胞如人类细胞)
等)、病毒、组织、来源于任何动物或非动物来源的器官、和生物体)或可以是非天然的(例如衍生的核酸)或通过合成来源的。这些分子还可以包括原核和真核载体、质粒、整合序列(例如转座子)、噬菌体或病毒载体、噬菌粒、粘粒等。用于本发明中的区段或分子可以通过本领域技术人员已知的任何手段来制备,这些手段包括但不限于,例如通过PCR扩增、从天然来源中分离、化学合成、剪切或限制性消化较大的核酸分子(例如基因组或cDNA)、转录、逆转录等,并可以本领域技术人员的任何手段向这些分子添加重组位点,这些手段包括连接含有重组位点的衔接子、使用拓扑异构酶与含有重组位点的衔接子附着、使用拓扑异构酶与含有重组位点的衔接子引物附着、使用含有重组位点的引物扩增或合成核酸、插入或整合含有重组位点的核酸分子(例如转座子或整合序列)等。在一个优选方面,用于本发
明中的核酸分子是分子群体例如核酸文库或cDNA文库。
[0048] 本发明所用的重组位点可以是核酸分子上参与由一或多个重组蛋白介导或催化的重组反应的任何识别序列。在本发明利用一个以上(例如2、3、4、5、7、10、12、15、20、30、
50等)重组位点的实施方案中,这些重组位点可以相同或不同,并可以彼此重组或不可以或基本上不可以彼此重组。本发明所考虑的重组位点还包括野生型或天然存在的重组位点的突变体、衍生物或变体。优选的重组位点修饰包括增强重组的那些修饰,该增强基本上选自:(i)促进整合重组;(ii)促进切除重组;(iii)降低对宿主因子的需要;(iv)增加共合体(co-integrate)或产物形成的效率;和(v)增加共合体和/或产物形成的特异性。
[0049] 对重组位点的优选修饰包括可以增加重组特异性、去除一或多个终止密码子、和/或避免发夹形成的修饰。还可以对重组位点进行期望的修饰,以便当翻译或转录跨过该修饰的重组位点发生时,将期望的氨基酸改变包括在转录或翻译产物(如mRNA或蛋白质)中。根据本发明使用的优选重组位点包括att位点、frt位点、dif位点、psi位点、cer位点、和lox位点、或它们的突变体、衍生物和变体(或它们的组合)。本发明考虑的重组位点还包括这些重组位点的部分。根据所用的重组位点的特异性,本发明允许定性连接核酸分子以便提供具有期望取向的连接分子,或非定性连接以便产生具有随机取向的连接分子。
[0050] 在特定的实施方案中,本发明方法和组合物中所用的彼此重组的重组位点包含具有一致的7碱基对重叠区的att位点。在本发明特定实施方案中,这些7碱基对重叠区的头三个核苷酸包含选自以下组的核苷酸序列:
[0051] AAA,AAC,AAG,AAT,ACA,ACC,ACG,ACT,AGA,AGC,AGG,AGT,
[0052] ATA,ATC,ATG;ATT,CAA,CAC,CAG,CAT,CCA,CCC,CCG,CCT,CGA,
[0053] CGC,CGG,CGT,CTA,CTC,CTGCTT,GAA,GAC,GAG,GAT,GCA,GCC,
[0054] GCG,GCT,GGA,GGC,GGG,GGT,GTA,GTC,GTG,GTT,TAA,TAC,
[0055] TAG,TAT,TCA,TCC,TCG,TCT,TGA,TGC,TGG,TGT,TTA,TTC,TTG,和TTT.[0056] 除了一或多个重组位点(例如2、3、4、5、7、10、12、15、20、30、50等),每个起始核酸分子均还可以包含各种序列(或它们的组合),这些序列包括但限于,适于用作引物位点的序列(例如可以和引物例如测序引物或扩增引物杂交以起始核酸合成、扩增或测序的序列),转录或翻译信号或调节序列如启动子或增强子、核糖体结合位点、Kozak序列、起始密码子、转录和/或翻译终止信号如终止密码子(最适当的是可以被一或多个抑制型tRNA分子抑制的终止密码子),复制起点,选择标记,和可以用于产生蛋白融合物(如N端或羧基端)的基因或基因部分如S转移酶(GST)、β-葡糖酸糖苷酶(GUS)、组氨酸标签(HIS6)、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、蓝色荧光蛋白(cyan fluorescent protein)
(CFP),可读框(ORF)序列,和任何其它在各种分子生物学技术中可能期望的或使用的目的序列,包括用于同源重组的序列(例如用于基因靶向)。
[0057] 一方面,本发明提供制备杂合核酸分子群体的方法,包含(a)将至少一个含有一或多个重组位点的第一核酸分子群体和至少一个含有一或多个重组位点的靶核酸分子混合;和(b)使该至少第一群体的部分或全部核酸分子和该靶核酸分子的部分或全部重组,籍此形成杂合核酸分子群。在以上方法的某些具体实施方案中,通过将第一群核酸分子和靶核酸分子与一或多个重组蛋白在利于重组产生杂合核酸分子的条件下混合。在其它特定实施方案中,本发明方法还包含将该杂合核酸分子和至少一个包含一或多个重组位点的第二群核酸分子混合,以产生第二群产物核酸分子。或者,可以将第一群体、第二群体和靶核酸分子混合在一起,以便通过重组形成杂合群体。在其它特定实施方案中,本发明方法还包含选择通过上述方法产生的杂合核酸分子群。在其它特定实施方案中,本发明方法还包含选出杂合核酸分子群并选择除去第一核酸分子群、靶核酸分子和/或第二核酸分子群。
[0058] 在相关实施方案中,本发明提供使含有第一重组位点的第一核酸区段、含有第二和第三重组位点的第二核酸区段、和含有第四重组位点的第三核酸区段重组的方法,其中该第一、第二、或第三核酸区段可以是一致的核酸区段或核酸分子群,以便重组产生包含第一、第二和第三核酸区段的线性或闭合环状产物。而且,可以使用含有或不含有重组位点并与第一或第三核酸区段同源或简并的寡核苷酸,扩增这些重组产物的成员。因此,例如,通过使用特异针对第一或第三核酸区段的引物进行扩增,可以扩增包含第一-第二-第三杂合分子的产物,而不会扩增其它不需要的分子(例如包含第一-第二杂合分子的产物)。
按此方式,可以使用扩增选出期望的产物并选择除去非期望的产物。可以设计该扩增以便选出任何期望的产物或重组反应的中间物。例如,可以将四个不同的分子(例如A、B、C、和D)接合起来,并可以使用设计用于扩增期望产物的引物(例如当扩增A-B-C相应于分子A
和C的引物,而扩增A-B时相应于分子A和B的引物)选出各种中间产物(例如A-B-C或
A-B)。然后克隆所获扩增产物。在相关实施方案中,可以使用两个或多个(例如2、3、4、5、
6、7、8、9、10、11、12、13、15等)核酸区段实施上述方法。
[0059] 另一方面,本发明提供制备杂合核酸分子群的方法,其包含(a)将至少一个包含一或多个重组位点的第一核酸分子群和至少一个包含一或多个重组位点的第二核酸分子群混合;和(b)使该至少第一群体的全部或部分核酸分子和该至少第二群体的全部或部分核酸分子重组,籍此形成一或多个杂合核酸分子群。在上述方法的某些具体实施方案中,通过将第一群核酸分子和第二群核酸分子与一或多个重组蛋白在利于它们重组的条件下混
合,以进行重组。在其它具体实施方案中,本发明方法还包含将第一和第二群核酸分子与至少一个含有一或多个重组位点的第三群核酸分子混合。在其它实施方案中,本发明方法还包括选择杂合核酸分子群。在再其它具体实施方案中,本发明方法还包含选出杂合核酸分子群并选择除去该第一、第二和/或第三群核酸分子。其它实施方案中,本发明方法还包含选出或选择除去共合体分子和/或副产物分子。
[0060] 本发明还包括通过以上方法制备杂合核酸分子群,和包含上述杂合核酸分子群的重组宿主细胞群体。
[0061] 在某些实施方案中,用于实施本发明的重组蛋白包含选自下组的一或多个蛋白质:Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、Cin、Tn3解离酶、TndX、XerC、XerD、和ΦC31。
在具体实施方案中,重组位点包含一或多个选自下组的重组位点:lox位点;psi位点;dif位点;cer位点;fri位点;att位点;和这些重组位点的保留进行重组的能力的突变体、变体和衍生物。
[0062] 在一个特定的方面,本发明允许通过抑制一或多个终止密码子以控制融合蛋白的表达。根据本发明,通过本发明接合起来的一或多个起始分子(例如1、2、3、4、5、7、10、12等)可以包含一或多个终止密码子,这些密码子可以被抑制以允许表达从第一起始分子通过邻接的起始分子。例如,通过本发明接合起来的第一-第二-第三起始分子(当该第一和第二分子均含有终止密码子时)可以通过抑制所有的终止密码子而表达一个由该接合分子编码的三联体融合蛋白。而且,通过改变对所选终止密码子的抑制,本发明允许选择或控制融合蛋白表达。因此,通过抑制该第一-第二-第三分子的第一和第二分子间而非第二
和第三分子间的终止密码子,可以产生由第一和第二分子编码的融合蛋白而不是三联融合物。因此,不同终止密码子的使用和抑制的可变控制使得可以产生由接合起来的目的起始核酸分子的全部或不同部分编码的各种融合蛋白或其部分。一方面,可以在起始核酸分子或在起始分子所含的重组位点中的任何地方包括终止密码子。优选地,这些终止密码子位于目的起始分子的末端或近末端,尽管这些终止密码子可以包括在该分子内部。另一方面,一或多个起始核酸分子可以包含目的靶基因或可读框的全部或部分编码序列,其中该编码序列之后是终止密码子。然后该密码子后面可以跟随允许接合第二起始分子的重组位点。
在此类一些实施方案中,可以任选地通过抑制型tRNA分子抑制终止密码子。编码抑制型
tRNA分子的基因可以在包含目的靶基因的相同载体上提供,或可以在不同载体上提供,或可以在包含该编码序列的载体所要插入的宿主细胞的染色体中提供。在一些实施方案中,可以提供一个以上拷贝(例如2、3、4、5、7、10、12、15、20、30、50等个拷贝)的抑制型tRNA。
在一些实施方案中,抑制型tRNA的转录可以在可调节(例如诱导型或阻遏型)启动子的控
制下进行。
[0063] 因此,一方面,本发明涉及表达一或多个融合蛋白(例如1、2、3、4、5、7、10、12、15、20、30、50等)的方法,包括:
[0064] (a)至少获得包含至少一个重组位点和至少一个终止密码子的第一核酸分子(优选地该重组位点和/或终止密码子位于所述第一核酸分子的一个或两个末端或近末端)、
和包含至少一个重组位点的第二核酸(优选地该重组位点位于所述第二核酸分子的一个
或两个末端或近末端);
[0065] (b)使所述第一和第二核酸分子通过所述重组位点的重组发生重组,由此产生包含所述至少一个终止密码子和所述第一和第二分子的全部或部分的第三核酸分子;和
[0066] (c)抑制所述至少一个终止密码子,表达由所述第三分子编码的一或多个肽或蛋白质(例如2、3、4、5、7、10、12、15、20、30、50等)。
[0067] 而且,这里所述重组位点(例如具有各种重组特异性的重组位点)可以在一、二或所有三种正向或反向读框中含有终止密码子。而且,在适当的情况下,可以对这些重组位点进行设计以便消除一、二和/或所有三种正向或反向读框中的终止密码子。
[0068] 另一方面,本发明提供合成蛋白质的方法,包含(a)提供包含后随终止密码子的编码序列的至少第一核酸分子;(b)提供包含任选地后随终止密码子的编码序列的至少第二核酸分子;(c)进行重组以便这些核酸分子接合起来;(d)将所述接合的核酸分子插入载体中以产生具有两个符合读框地连接的编码序列的修饰载体;(e)用该修饰载体转化编码抑制型tRNA的宿主细胞;和(f)使此两个编码序列表达以便产生由此两个编码序列的至少一个部分编码的融合蛋白,其中(a)和(b)的核酸分子的侧翼均有至少一个重组位点。而且,该融合核酸分子或该载体可以包含至少一个可抑制的终止密码子(例如琥珀、乳白和/或赭石密码子)。此外,该第一或第二核酸分子可以在上述方法实施前就已经存在于该载体中。在本发明具体实施方案中,载体和/或宿主细胞包含编码至少一个抑制型tRNA分子的基因。在其它具体实施方案中,本发明方法还包括用包含编码至少一个抑制型tRNA分子的基因的核酸分子转化该宿主细胞。在再一具体实施方案中,融合蛋白可以包含由载体的至少一个部分编码的N-或C-标签(例如谷胱甘肽S转移酶、β-葡糖醛酸糖苷酶、绿色荧光
蛋白、黄色荧光蛋白、红色荧光蛋白、蓝色荧光蛋白、麦芽糖结合蛋白、六组氨酸标签、表位标签等)。
[0069] 本发明还涉及表达一或多个融合蛋白(例如1、2、3、4、5、7、10、12、15、20、30、50等)的方法,包含:
[0070] (a)至少获得包含至少一个重组位点的第一核酸分子(优选地该重组位点位于所述第一核酸分子的一个或两个末端或近末端)、和包含至少一个重组位点的第二核酸(优
选地该重组位点位于所述第二核酸分子的一个或两个末端或近末端);
[0071] (b)使所述至少第一和第二核酸分子通过所述重组位点的重组发生重组,由此产生包含所述至少第一和第二分子的全部或部分的第三核酸分子;和
[0072] (c)表达由所述第三核酸分子编码的一或多个肽或蛋白质(例如2、3、4、5、7、10、12、15、20、30、50等)。在某些此类实施方案中,表达的融合蛋白的至少一个部分是由第三核酸分子编码的,且至少另一部分是由第一和/或第二核酸分子的至少一个部分编码的。
该融合蛋白可以通过翻译相应于位于该第一和第二核酸分子间的重组位点的核酸来产生。
因此,可以通过“通读”相应于用于连接两个或多个核酸区段的重组位点的mRNA,表达融合蛋白。本发明还包括通过本发明方法产生的融合蛋白和编码该融合蛋白的mRNA。
[0073] 正如以下更详细讨论的,以上讨论的方法可以用于制备由不同核酸区段编码的蛋白质、以及编码这些融合蛋白质的核酸分子。因此,在一个一般的方面,本发明提供通过连接两个或多个核酸区段而产生的核酸分子的表达,制备融合蛋白的方法。在相关实施方案中,本发明提供通过连接两个或多个核酸区段而产生的核酸分子的表达,产生融合RNA的方法。这些RNA可以是mRNA或可以是所具有的活性非蛋白编码功能的非翻译RNA。这些RNA的例子包括核酶和tRNA。本发明还提供通过本发明方法产生的核酸分子、这些核酸分子的表达产物、用于制备这些表达产物的方法、含有这些核酸分子的重组宿主细胞、和制备这些宿主细胞的方法。正如以下详细讨论的,本发明还提供组合文库,可以对此组合文库进行筛选,以鉴定具有特定功能或活性的核酸分子和表达产物。
[0074] 在一个具体方面,本发明提供用于将两个核酸分子或其部分接合入一或多个产物核酸分子中的材料和方法,其中每个核酸分子均含有至少一个重组位点,所述接合的方式是通过在使位于一个核酸分子上的重组位点和位于另一核酸分子上的重组位点重组的条件下孵育这些分子。重组位点优选位于起始核酸分子的末端或近末端。根据重组位点在
起始分子中的定位,由此产生的产物分子将含有通过重组位点(其优选是一个新的重组位点)接合的第一和第二分子的全部或部分。例如,attB1重组位点和attP1重组位点间的
重组导致产生一个attL1和/或attR1重组位点。
[0075] 在另一具体方面,本发明提供用于将两个或多个核酸分子(例如2、3、4、5、7、10、12、15、20、30、50等)接合入一或多个产物核酸分子(例如1、2、3、4、5、7、10、12等)中的材料和方法,其中每个起始核酸分子均具有至少一个重组位点,而且至少一个起始核酸分子具有至少两个重组位点。这些重组位点优选位于起始核酸分子的一个或两个末端或近末端。因此,本发明提供将至少两个核酸分子接合起来的方法,其中至少第一核酸分子含有至少一个重组位点而至少第二核酸分子含有两个或多个重组位点。在存在至少一种重组蛋白的情况下,在足以将起始分子的全部或部分联合以形成一或多个产物分子的条件下,孵育这些分子。由此产生的产物分子将含有通过重组位点(优选是新的重组位点)接合起来的
每个起始分子的所有或部分。
[0076] 在另一具体方面,本发明提供将至少三个核酸分子(例如2、3、4、5、7、10、12、15、20、30、50等)接合起来的方法,其中这些分子具有至少一个重组位点并且至少一个起始核酸分子含有至少两个重组位点。在存在至少一个重组蛋白的情况下孵育这些分子,可以提供一或多个含有起始分子全部或部分的产物分子(例如1、2、3、4、5、7、10、12、15、20、30、50等),其中所有分子均通过重组位点(优选是新的重组位点)接合。
[0077] 在另一具体实施方案中,本发明提供用于两个或多个核酸分子(例如2、3、4、5、7、10、12、15、20、30、50等)接合起来的组合物和方法,其中的至少两个分子(优选所有分子)具有两个或多个重组位点。位于每个分子上的重组位点优选定位在起始核酸分子的末端或近末端。根据本发明方法,两个或多个核酸分子或它们的部分通过重组反应(例如在存在至少一个重组蛋白的情况下孵育这些分子)接合,以形成包含通过重组位点(优选是新的
重组位点)接合的每个起始分子的全部或部分。
[0078] 在另一具体方面,本发明提供将至少三个核酸分子接合起来的组合物和方法,包括提供至少第一、第二和第三核酸分子,其中该第一核酸分子包含至少第一重组位点,第二核酸分子包含至少第二和第三重组位点、而第三核酸分子包含至少第四重组位点,其中该第一重组位点能够与第二重组位点重组而第三重组位点能够和第四重组位点重组,实施至少一个重组反应,以便该第一和第二重组位点重组而第三和第四重组位点重组,籍此将这些分子的全部或部分联合起来以产生一或多个产物分子。
[0079] 因此,本发明一般涉及将n个核酸分子或区段联合起来的方法,其中n为大于1的整数(例如2、3、4、5、7、10、12、15、20、30、50等),该方法包括步骤:提供第1至第n个核酸分子或区段,从第2至第n-1的每个分子具有至少两个重组位点,而第1和第n个分子具有至少一个重组位点(优选具有至少两个重组位点);和在足以使这些区段或分子的全部
或部分重组以形成一或多个包含第1至第n每个分子或区段的全部或部分的产物分子的条
件下,使这些分子或区段和一或多个重组蛋白(例如2、3、4等)接触。优选地,通过重组位点使分子接合(例如使第一分子上的第一重组位点和第二分子上的第二重组位点相互作
用)将在这两个分子的接合处产生一个新的重组位点,并可以在每个分子与下一个分子接合的每个接合处产生一个新的重组位点。例如,当将各具有至少两个重组位点的许多分子(例如第一或“x”分子、第二或“y”分子、和第三或“z”分子)接合起来时,则x分子上的第一个重组位点与y分子上的第二重组位点相互作用,而x分子上的第二个重组位点与z分
子上的第一重组位点相互作用,以产生包含通过重组位点接合的y∶x∶z的杂合核酸分
子。当然,其它重组事件也可以产生杂合分子,包含通过重组位点接合的例如x∶y∶z、x∶z∶y、y∶z∶x、z∶x∶y和/或z∶y∶x或它们的片段。可以通过位于另一
分子上的至少一个重组位点和位于产物分子上的至少一个重组位点间的重组(例如z分
子上的第二重组位点和e分子上的第一重组位点相互作用等,和/或y分子上的第一重组
位点和f分子上的第二重组位点相互作用等),在产物分子中加入其它分子。而且,包含
y∶x∶z(或以上提及的其它序列)的杂合核酸分子可以通过y和z的游离末端上的重组
位点的相互作用而环化。可以连续或同时地加入全部或部分的起始分子。
[0080] 在通过本发明方法接合的核酸区段含有一个或多个不具有重组位点的末端的情况下,可以使用连接酶或拓扑异构酶(例如痘苗病毒的拓扑异构酶,见美国专利
5,766,891,整个公开并入本文作为参考),将此末端或多个末端与相同核酸区段或另一核酸分子连接。
[0081] 除了接合多个分子外,本发明还提供置换产物分子所包含的一或多个分子(或它们的组合)的方法。例如,可以通过和包含一或多个重组位点的一个不同分子(m)的全部或部分重组,置换或替代产物分子包含的任何一个或多个n分子。因此,在一个例子中,通过m上的第一重组位点和位于x侧翼的第一重组位点(例如y和x间的重组位点)重组、
而m上的第二重组位点和位于x侧翼的第二重组位点(例如x和z间的重组位点)重组,
m可以置换上述y∶x∶z分子中的x,产生y∶m∶z。可以通过本发明分子上的一或多
个重组位点和待替代的分子内或上的一或多个重组位点重组,在本发明任何核酸分子内或之上进行多次的替代或置换。而且,可以通过目的分子内的两个或多个重组位点的重组产生缺失,以在本发明产物上造成一或多个不同大小的缺失(例如2、3、4、5、7、10、12等)。例如,为了在上述y∶x∶z(或它的其它排列)中造成缺失,位于x分子侧翼的重组位点的
重组将产生缺失x的新分子;即,该新分子将包含y∶z。因此,可以通过目的分子内的定向重组,多次缺失、多次置换、及同时缺失和置换目的分子的不同部分。
[0082] 而且,本发明还提供在产物分子中插入一或多个分子(或其部分)的方法。例如,使用上述y∶x∶z分子进行举例说明,包含一或多个重组位点的分子w可以被插入y和x之间,形成新的分子y∶w∶x∶z。在一个具体实施方案中,分子w侧翼有loxP位点,
分子w的插入是由Cre重组酶介导w分子上的loxP位点与y和x分子上的相应loxP位点
间的重组而实现的。本领域技术人员知道,可以对以上进行许多变化,而且这些变化包括在本发明的范围内。例如,包含一或多个重组位点的分子o可以被插入y和x间,根据起始分子形成新的分子(包含y∶o∶x∶z或y∶o∶w∶x∶z)。本文所述方法实质上可以
用于将任何数量的分子插入其它分子中。而且,可以连续地使用这些方法,以便例如制备具有多样结构的分子。
[0083] 根据起始核酸分子或区段、重组位点在这些分子上的位置、和这些位点的重组顺序,通过本发明方法产生的产物分子可以包含起始分子(或它们的部分)的任何组合并可以是任何大小和任何形式(例如环状、线性、超螺旋等)。
[0084] 重要的是,本发明提供了方法,通过该方法可以将核酸分子群(已知或未知的)和一或多个已知或未知的目的靶序列(例如2、3、4、5、7、10、12、15、20、30、50个等)或和其它核酸分子群(已知或未知的)组合,由此产生组合分子群(例如组合文库),从这些组合分子群中可以获得独特的和/或新的分子(例如杂合分子)及这些分子编码的蛋白质或肽,
并对它们作进一步分析。
[0085] 在一个优选方面,用于产生根据本发明的组合文库的核酸分子群可以包含一群具有至少一个(优选两个或更多个)重组位点(例如2、3、4、5、7、10、12、15等)的区段或分子。该分子群优选从经构建含有这些重组位点的基因组或cDNA文库(或它们的部分)或随机核酸、扩增产物(例如使用各种引物产生的PCR产物)和域(例如编码相同或不同蛋
白的不同蛋白域的核酸)获得。因此,根据本发明,包含重组位点的第一群分子可以通过重组(定向和/或随机方向)随机地和包含重组位点的至少一个目的靶序列或第二群分子接
合或组合,以产生第三群分子或杂合分子。
[0086] 根据本发明,来自各种不同来源的多群分子可以多次组合以产生一个所包含分子具有多种序列组合的新群体。例如,可以使第一群体、第二群体和第三群体重组以产生包含一群随机三联分子的第四群体(例如,该第四群体的一些或所有分子含有来自第一、第二和第三群的所有或部分区段)。
[0087] 在一个优选方面,可以优选地选择通过此组合方法获得的新产生的分子群(例如第三群体),并由此将其与初始分子(例如靶分子、和第一和第二群分子)及不需要的产物分子(例如共合体(cointegrates)和/或副产物分子)分离或分开。此选择可以通过分析或选择存在的期望核酸融合物(使用诊断性引物进行PCR)和/或存在的由期望核酸融
合物编码的蛋白的期望活性来实现。该选择还可以通过正和/或负筛选来实现。根据本发明,在此负筛选方案中优选使用一或多个毒性基因(例如2、3、4、5、7、10等)。
[0088] 本发明还可以将对期望融合产物(核酸和/或蛋白)的选择与正和/或负筛选作组合使用。因此,本发明提供方法,通过该方法可以选择重组克隆产生的产物分子群(或甚至是一特殊类型产物分子或特殊产物分子)并选择除去插入片段供体、载体供体和共合体群体或类似地选出插入片段供体、载体供体、副产物和/或共合体并选择除去产物分子群(见图1)。
[0089] 参考图2,在本发明重组合文库(recombinatorial library)方法中,本发明第一群分子(表示为区段A)可以作为插入片段供体分子群提供,而第二群分子(表示为区段B)可以作为第二插入片段供体分子群提供。当这些区段被描述为线性片段时,它们可以作为较大分子内的区段,例如作为质粒中的区段,而提供。
[0090] 本领域技术人员将明了,在此情况下,可以产生共合体分子(非图1所显示的分子)。例如,可以形成包含区段A和区段B插入片段供体的共合体。此外,还可以形成包含区段A和/或区段B插入片段供体分子及载体供体分子的共合体。本发明的筛选方法允许
选择除去插入片段供体分子和选择除去各种共合体分子,并选出新产生的杂合分子群,该杂合分子群可以被称作产物分子群。相反地,本发明筛选方法也可以允许选择除产物并选出插入片段/载体供体、副产物和/或共合体。
[0091] 因此,本发明涉及产生杂合核酸分子群的方法,包括:
[0092] (a)将包含一或多个重组位点(例如2、3、4、5、7、10、12等)的至少第一核酸分子群和至少一个包含一或多个重组位点(例如2、3、4、5、7、10、12等)的目的靶核酸分子混合;
[0093] (b)使所述至少第一群体的部分或全部分子与所述目的靶分子的所有或部分分子(优选随机地)重组,由此形成第三杂合分子群;和
[0094] (c)任选地特异地选出所述第三杂合分子群。
[0095] 根据本发明,第三群体中含有的杂合分子优选包含获自第一群的分子的全部或部分及靶分子的全部或部分。分子的接合可以根据需要以定向或随机的方式取向。
[0096] 在一个方面,用于产生所述第三群体的上述靶分子可以是DNA结合域或转录激活域,以致该第三杂合分子群可以用于本领域熟知的双杂种筛选方法中。
[0097] 更具体地,本发明涉及产生组合分子群的方法,包括:
[0098] (a)获得包含一或多个重组位点(例如2、3、4、5、7、10、12等)的至少第一核酸分子群、和包含至少一或多个重组位点(例如2、3、4、5、7、10、12等)的至少第二核酸分子群;
[0099] (b)使至少所述第一群的一些或所有分子和至少所述第二群的一些或所有分子(优选随机地)重组,由此产生第三群杂合分子;和
[0100] (c)任选地特异地选出所述第三杂合分子群。
[0101] 根据本发明,第三群中包含的所有或许多杂合分子优选包含获自第一群的分子的全部或部分及获自第二群的分子的全部或部分。分子的接合可以根据需要以定向或随机方式取向。
[0102] 根据本发明组合方法使用的核酸群可以包含合成的、基因组的或cDNA文库(或其部分)的、随机合成的序列或简并核苷酸、域等。优选地,所用核酸分子群包含一群随机分子,每个均具有至少两个重组位点,这些重组位点优选彼此不相互重组并且优选位于每个分子的两个末端或近末端。通过本发明方法对分子群作随机重组为产生具有显著序列多样6 6
性的分子群提供了一项有力技术。例如,具有约10 种序列的第一文库和具有约10 种序列
12
的第二群体重组产生具有约10 种序列的第三群体。
[0103] 本发明还提供制备和筛选文库成员的核酸分子区段已经过改变的组合文库的方法。这些改变包括核酸区段的突变、改组、插入和/或缺失。具体地,本发明提供用于制备所含成员具有此突变的核酸文库的方法和用于在现有文库中导入这些突变的方法。在一个相关方面,本发明包括通过本发明方法产生的组合文库、用于筛选该文库以鉴定出编码具有特定功能或活性的产物的成员的方法、以及这些文库的表达产物(例如RNA、蛋白质等)。
[0104] 而且,在与上述有关的方面,本发明为制备含有一或多个(例如1、2、3、4、5、10、15)相同核酸区段和一或多个来源于一或多个核酸分子群成员的核酸区段的核酸分子群提供了方法。制备这些核酸分子的一个方法涉及使用含有两个重组位点的载体。将第一核酸区段(其编码具有特定功能或活性(例如信号肽活性、DNA结合活性、对特定配体的亲和力等)的蛋白质)插入第一个重组位点中,而将来源于核酸分子群的第二核酸区段插入第二
个重组位点。而且,任选地,可以将这些核酸区段与调节转录的序列连接,籍此产生通过该融合序列产生的融合肽和RNA分子。然后可以筛选所获的组合文库,以鉴定编码具有特定功能或活性(例如转录激活活性;DNA结合活性;形成多聚体的能力;在亚细胞区室如内质网、细胞核、线粒体、叶绿体、细胞膜等的定位;等)的表达产物的核酸分子。当在诸如上述那些方法中使用三个或更多个(例如3、4、5、6、8、10等)核酸区段时,一或多个核酸区段可以保持不变而一或多个核酸区段可以来源于一或多个核酸分子群的成员。例如,在构建一个四部分分子(表示为A-B-C-D)时,A和D可以是具有已知功能的已知分子(例如HIS6等
标签、启动子、转录或翻译信号、选择标记等),而B和C分子可以来源于一或多个核酸分子群。
[0105] 还可以在任何数量的标准分子生物学技术或这些技术的组合(体外或体内)中,对本发明的所有产物分子作进一步操作、分析、或使用。这些技术包括测序、扩增、核酸分子、制备RNA转录本(例如通过使用RNA启动子如T7或SP6启动子转录产物分子)、表达蛋
白质或肽(例如,表达融合蛋白、表达抗体、表达激素等)、蛋白质-蛋白质相互作用(双杂种或反向双杂种分析)、同源重组或基因打靶、和组合文库分析和操作。本发明还涉及将本发明核酸分子(优选地通过重组)克隆至一或多个载体(例如2、3、4、5、7、10、12、15、20、
30、50等)或通过加入某些功能性载体序列(如复制起点)将本发明核酸分子转化成载体。
在一个优选方面,重组在体外完成(例如在无细胞系统中),而且直接在体外进行进一步操作或分析。因此,将本发明分子导入宿主细胞和/或使其维持在宿主细胞中的能力并不构成对进一步分析和操作的限制。因此,通过直接体外操作或分析本发明分子,可以花费较少的时间并实现更大的处理量。或者,可以在宿主细胞传代后进行体外分析或操作,或可以直接在体内进行分析或操作(例如当在宿主细胞、组织、器官或生物体中时)。
[0106] 根据本发明,核酸合成步骤可以包含:
[0107] (a)将目的核酸分子或模板和一或多个引物(例如1、2、3、4、5、7、10、12、15、20、30、50等)及一或多个核苷酸(例如1、2、3或4)混合,以形成混合物;和
[0108] (b)在足以合成与所述分子或模板的全部或部分互补的核酸分子的条件下,孵育所述混合物。
[0109] 然后可以将此合成的分子用作模板以进一步合成与此第一合成的分子的全部或部分互补的核酸分子。由此,可以制备双链核酸分子(例如DNA)。优选地,该第二合成步骤是在存在一或多个引物和一或个核苷酸的情况下,并在足以合成与此第一核酸分子的全部或部分互补的第二核酸分子的条件下进行的。典型地,一或多个核酸分子(例如1、2、3、4、
5、7、10、12、15、20、30、50等)的合成在存在一或多种聚合酶(优选可以是热稳定的或中温的DNA聚合酶)的情况下进行,但也可以在此合成反应中使用逆转录酶。因此,用作其它核酸分子的合成模板的核酸分子可以是RNA、mRNA、DNA或非天然的或衍生的核酸分子。根据本发明,可以通过使用含有引物位点的起始核酸分子,在产物分子中掺入一或多个引物位点(例如2、3、4、5、7、10、12、15、20、30、50等),以便于核酸的合成。因此,通过本发明方法,可以根据引物位点在起始分子内的定位和起始分子加入产物分子中的顺序,将引物位点添加在产物分子中的一或多个期望位置上。
[0110] 根据本发明,测序步骤可以包括:
[0111] (a)将待测序的核酸分子和一或多个引物(例如1、2、3、4、5、7、10、12、15、20、30、50等)、一或多个核苷酸(例如1、2、3或4)及一或多个终止剂(例如1、2、3、4、或5)混合,以形成混合物;
[0112] (b)在足以合成与待测序的所述分子的全部或部分互补的分子群的条件下,孵育所述混合物;和
[0113] (c)分离所述群体以确定待测序的所述分子的全部或部分核苷酸序列。
[0114] 该测序步骤优选在存在一或多种聚合酶(例如DNA聚合酶和/或逆转录酶)及一或多个引物的情况下进行。用于测序的优选终止剂包括核苷酸衍生物例如双脱核苷酸
(ddATP、ddTTP、ddGTP、ddCTP和它们的衍生物)。根据本发明,可以通过使用含有引物位点的起始核酸分子,将一或多个测序引物位点(例如1、2、3、4、5、7、10、12、15、20、30、50等)掺入产物分子中,以便于核酸测序。因此,通过本发明方法,可以根据起始分子中引物位点的位置和起始分子加入产物分子中的顺序,将测序引物位点添加在产物分子中的一或多个期望位置上。
[0115] 根据本发明,蛋白质表达步骤可以包括:
[0116] (a)获得包含一或多个表达信号(例如1、2、3或4个)的待表达核酸分子;和
[0117] (b)在所述表达信号的控制下表达该核酸分子的全部或部分,籍此产生由所述分子或其部分编码的肽或蛋白质。
[0118] 在本文中,表达信号可以说是与待表达的序列可操作连接的。所表达的蛋白质或肽可以在宿主细胞中(体内)表达,但也可以使用本领域熟知技术体外(例如在无细胞表达系统中)进行表达。一旦蛋白质或肽表达后,可以任选地分离或纯化蛋白质或肽产物。而且,可以将该表达的蛋白质或肽用于各种蛋白质分析技术中,包括双杂种相互作用、蛋白质功能分析、和激动剂/拮抗剂-蛋白质相互作用(例如通过药物、化合物或其它肽刺激或抑制蛋白质的功能)。而且,可以对表达的蛋白质或肽进行筛选以鉴定出具有特定生物学活性的那些蛋白质或肽。该活性的例子包括对核酸分子(例如DNA或RNA)、蛋白质或肽的结合
亲和力。具体地,可以筛选表达的蛋白质或肽,以鉴定对其它蛋白质或其本身具有结合亲和力的那些蛋白质或肽。对其本身具有结合亲和力的蛋白质或肽一般能够形成多聚体或聚积物。对其本身和/或其它蛋白质具有结合亲和力的蛋白质或肽常能够形成或参与形成多蛋白复合物例如抗体、剪接体、多亚基酶、核糖体等。上述表达的蛋白质或肽、编码这些蛋白质或的核酸分子、用于制备这些核酸分子的方法、用于产生含有这些核酸分子的重组宿主细胞的方法、通过这些方法产生的重组宿主细胞、和用于产生这些表达的蛋白质或肽的方法也包含在本发明范围内。
[0119] 通过本发明制备的、尤其是从本发明组合分子的表达制备的、新的独特杂合蛋白质或肽(例如融合蛋白)一般可以用于许多应用。更具体地,正如本领域技术人员明了的,可以对本发明杂合蛋白质或肽进行设计和选择,以便鉴定出实质上行使任何功能的那些蛋白质或肽。可以使用这些蛋白质的应用的例子包括治疗、工业生产(例如微生物合成氨基酸或糖)、小分子鉴定和纯化(例如通过亲和层析)、等。
[0120] 根据本发明,可以通过使用含有一或多个转录或翻译信号(例如1、2、3、4、5、7、10、12、15等)或调节序列、起始密码子、终止信号、拼接供体/受体序列(例如内含子序列)等的起始分子,将这些序列掺入产物分子中,以利于蛋白质的表达。因此,通过本发明的方法,可以根据表达序列在起始分子中的定位和起始分子加入产物分子中的顺序,将这些序列添加在产物分子中的一或多个期望位置上。
[0121] 另一方面,本发明提供实现核酸分子间同源重组的方法,包括(a)将包含一或多个重组位点的至少第一核酸分子和至少一个靶核酸分子混合,其中该第一和靶核酸分子具有一或多个同源序列;和(b)通过同源重组使该第一和靶核酸分子发生重组。在本发明的具体实施方案中,本发明的同源重组方法导致将第一核酸分子的全部或部分转移至靶核酸分子中。在本发明的某些具体实施方案中,该第一核酸分子包含两个或更多个与靶核酸分子序列同源的序列。在其它具体实施方案中,第一核酸分子的同源序列位于至少一个选择标记和/或一或多个重组位点的侧翼。在再其它具体实施方案中,第一核酸分子的同源序列位于侧翼有重组位点的至少一个选择标记的侧翼。在其它具体实施方案中,第一核酸分子的同源序列位于调节转录的核酸区段的侧翼。
[0122] 而且,根据本发明,同源重组可以包括:
[0123] (a)将包含一或多个重组位点(例如1、2、3、4、5、7、10、12、15、20、30、50等)的本发明至少第一核酸分子(优选产物分子)和至少一个靶核酸分子(例如1、2、3、4、5、7、10、12等)混合,其中所述第一和靶分子具有一或多个同源序列(例如1、2、3、4、5、7等);和[0124] (b)通过同源重组使所述第一和靶核酸分子重组。
[0125] 该同源重组可以体外(例如在无细胞系统中)发生,但优选在体内(例如在宿主细胞中)进行。优选地,同源重组使得含有重组位点的本发明核酸分子(第一核酸分子)
的全部或部分转移至含有同源序列的靶核酸分子的一或多个位点(例如1、2、3、4、5、7等)。
可以通过正或负选择(例如使用选择标记)促进该同源重组的选择,以便选出期望的产物
和/或选择除去不期望的产物。在一个优选方面,本发明核酸分子包含至少一个选择标记和至少两个与靶分子同源的序列。优选地,第一分子包含至少两个位于至少一个选择标记侧翼的同源序列。
[0126] 因此,本发明有利于构建基因靶向核酸分子或载体,这些核酸分子或载体可以用于敲除或突变目的序列或基因(或改变现有序列,例如将突变的序列转变为野生型序列),尤其是宿主或宿主细胞如动物(包括人等动物)、植物、昆虫、细菌、酵母等中的基因或序列、或这些宿主或宿主细胞中外来物如病毒的序列。该基因打靶(genetargeting)可以优选包含使序列靶向该宿主细胞的基因组。该基因打靶可以体外(例如在无细胞系统中)或在体内(例如在宿主细胞中)进行。因此,在一个优选方面,本发明涉及靶向或突变核苷酸序列或基因的方法,包括:
[0127] (a)获得至少一个包含至少一或多个重组位点(及优选包含一或多个选择标记)的本发明核酸分子,其中所述分子包含一或多个与感兴趣的靶基因或核苷酸序列同源的核苷酸序列(所述一或多个同源序列在本发明分子上优选位于一或多个选择标记(如1、2、3、
4、5、7、10等)的侧翼);和
[0128] (b)将所述分子和一或多个感兴趣的靶基因或核苷酸序列(例如1、2、3、4、5、7、10、12、15、20、30、50等)在足以使所述感兴趣的靶核苷酸序列或基因和所述本发明分子之间在一或多个位点(例如1、2、3、4、5、7、10等)处发生同源重组的条件下接触,籍此将本发明分子的全部或部分插入靶核苷酸序列或基因中。
[0129] 此打靶方法可以造成靶核酸或基因的缺失、激活、失活、部分失活、或部分激活,以致由该靶核酸或基因正常表达的表达产物(典型的是蛋白质或肽)不再产生、或以较高或较低的水平产生、或在某种程度上产生可以导致较高或较低活性或导致失活或部分失活的表达产物的改变蛋白质序列。优选存在于本发明分子上的选择标记促进了对其中同源重组事件成功的候选者(例如宿主细胞)的选择。因此,本发明提供方法以制备含有通过本发
明打靶方法产生的修饰核酸或基因的宿主细胞、组织、器官和动物(例如转基因动物)。该修饰的核酸或基因优选包含由本发明核酸分子提供的至少一个重组位点和/或至少一个
选择标记。
[0130] 因此,更具体地,本发明涉及对核酸或基因进行打靶或突变的方法,包括:
[0131] (a)获得包含侧翼有一或多个与目的靶核酸或基因同源的(例如1、2、3、4、5、7、10等)序列的一或多个重组位点(例如1、2、3、4、5、7、10、12、15、20、30、50等)及至少一个选择标记(例如1、2、3、4、5、7、10等)的至少一个本发明核酸分子;
[0132] (b)将所述分子和一或多个目的靶核酸或基因(例如1、2、3、4、5、7、10、12、15、20、30、50等)在足以使所述目的靶核酸或基因和核酸分子之间在一或多个位点处发生同源重组的条件下接触,籍此将本发明核酸分子的全部或部分插入(优选地,将至少一个选择标记和/或至少一个重组位点插入)目的靶核酸或基因中;和
[0133] (c)任选地,选出包含本发明核酸分子的全部或部分的目的靶核酸或基因,或选出含有其中包含了本发明核酸分子的全部或部分的靶核酸或基因的宿主细胞。
[0134] 优选地,用于上述方法中的选择标记是正选择标记(例如抗生素抗性标记如氨苄青霉素、四环素、卡那霉素、新霉素、和G-418抗性标记)。
[0135] 在一个一般方面,本发明提供对靶基因或核苷酸序列进行打靶或突变的方法,包括:(a)获得至少一个包含一或多个重组位点及一或多个选择标记的第一核酸分子,其中该第一核酸分子包含一或多个与靶基因或核苷酸序列同源的核苷酸序列;和(b)将该第一核酸分子和一或多个靶基因或核苷酸序列在足以使该靶基因或核苷酸序列和该第一核酸分子之间在一或多个位点处发生同源重组的条件下接触,由此将该第一核酸分子的全部或部分插入靶基因或核苷酸序列中。在本发明的某些具体实施方案中,该第一核酸分子包含至少一个侧翼有同源序列的选择标记。在其它具体实施方案中,该选择标记的侧翼有同源序列。在再其它实施方案中,靶基因或核苷酸序列由于同源重组而失活。在再其它具体实施方案中,本发明方法还包括选出含有该靶基因或核苷酸序列的宿主细胞。
[0136] 在一些具体实施方案中,第一核酸分子中与靶基因或核苷酸序列同源的一或多个核苷酸序列的一或多个与靶基因或核苷酸序列并不100%一致。换言之,利于同源重组的核酸区段不必具有100%的序列一致性。然而,一般地,这些核酸区段将在它们的同源区域中具有至少70%一致性(例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、或至少99%)。
[0137] 在许多情况下,使用与其发生重组的核酸(即靶基因或核苷酸序列)不具有100%序列一致性的核酸区段来推动同源重组,可能是有利的。这类情况的一个例子是当同源核酸相应于作为基因的靶核苷酸序列的一部分时,而同源重组将导致在靶核苷酸序列中引入一或多个的序列改变。在一个相关例子中,同源核酸可以相应于是完整基因的靶核苷酸序列。因此,同源重组导致靶基因的置换。该情况的另一例子是当需要对在待发生同源重组的位点上与第一核酸分子的一或多个同源核苷酸序列相比具有不同核苷酸序列的生物体实行同源重组的时候。例如,当待发生同源重组的生物体与从中获得第一核酸分子的同源核苷酸序列的生物体是不同株或种时、或当该生物体在重组位点处具有不同基因型时,可以导致这些序列的差异。
[0138] 而且,利于重组的同源区域的长度可以在大小上改变,但一般长至少15个核苷酸(例如至少20个核苷酸、至少50个核苷酸、至少100个核苷酸、至少200个核苷酸、至少400个核苷酸、至少600个核苷酸、至少800个核苷酸、至少1000个核苷酸、至少1500个核苷酸、至少2000个核苷酸、至少2500个核苷酸、至少3000个核苷酸、至少3500个核苷酸、至少4000个核苷酸、至少4500个核苷酸、至少5000个核苷酸、至少5500个核苷酸、至少6000个核苷酸、至少6000个核苷酸等)。
[0139] 本发明还提供通过本文所述方法产生的重组宿主细胞,该宿主可以是原核宿主(例如细菌)或真核宿主(例如真菌(如酵母)、植物、或动物(如昆虫、哺乳动物包括人类、等)宿主)。
[0140] 在本发明另一方面,可以使用根据本发明引入所靶向的核酸或基因中的重组位点,切除、置换、或除去插在目的靶核酸或基因中的核酸分子的全部或部分。因此,本发明允许体外或体内除去该核酸分子,因此可以允许重新激活靶核酸或基因。在一些实施方案中,在鉴定和分离了含有按上述引入的改变的核酸或基因后,可以除去本发明分子中存在的选择标记。
[0141] 本发明还提供将本发明起始或产物核酸分子克隆至一或多个载体或将本发明产物分子转化为一或多个载体的方法。在一个方面,该起始分子的重组导致产生一或多个产物分子,并将该产物分子克隆(优选地通过重组)至一或多个载体中。在另一方面,将起始分子直接克隆至一或多个载体中,以便在载体中将多个起始分子接合在一起,由此产生含有本发明产物分子的载体。在另一方面,将起始分子直接克隆至一或多个载体中,以便这些起始分子不在载体中接合在一起(即,通过载体序列将起始分子分隔开)。在再另一方面,可以将产物分子和起始分子的组合按任何顺序克隆至一或多个载体中,由此产生包含由最初起始分子和产物分子组合形成的新产物分子的载体。
[0142] 因此,本发明涉及克隆方法,包括:
[0143] (a)获得至少一个包含重组位点的本发明核酸分子(例如1、2、3、4、5、7、10、12个等);和
[0144] (b)将所述分子的全部或部分转移至一或多个载体(例如1、2、3、4、5、7、10、12、15个等)中。
[0145] 优选地,该载体包含一或多个重组位点(例如1、2、3、4、5、7、10、12、15、20、30、50等),而向载体中转移分子优选通过载体上的一或多个位点(例如1、2、3、4、5、7、10等)和本发明分子上的一或多个位点(例如1、2、3、4、5、7、10等)间的重组来完成。在另一方面,可以通过将必需的载体序列(例如复制起点)包括在内,将本发明产物分子转化为发挥载体功能的分子。因此,根据本发明,可以通过使用含有该序列的起始分子,将这些载体序列掺入产物分子中。可以根据这些载体序列在起始分子中的位置以及起始分子加入产物分子中的顺序,将这些序列添加在产物分子的一或多个期望位置上。因此,本发明使得可以通过将可能期望的任何数量的功能性元件(优选地通过重组)并入载体中,常规构建期望载体。
含有产物分子的载体序列可以是线性的、或可以通过使产物分子内的重组位点重组或通过本领域熟知的连接技术,被转化为环状或超螺旋形式的。优选地,该产物分子的环化通过位于产物分子两个末端或近末端的重组位点的重组来实现、或通过使产物分子的末端连接以环化该分子。正如已知的,可以将线性或环状产物分子导入一或多个宿主或宿主细胞中作进一步操作。
[0146] 用于本发明的载体序列在使用时可以包含一或多个元件和/或功能序列和/或位点(或它们的组合),包括一或多个测序或扩增引物位点(例如1、2、3、4、5、7、10等)、一或多个赋予翻译终止抑制因子活性的序列(例如1、2、3、4、5、7、10等)如编码抑制型tRNA分子的序列、一或多个选择标记(例如1、2、3、4、5、7或10个毒性基因、抗生素抗性基因等)、一或多个转录或翻译位点或信号(例如1、2、3、4、5、7、10等)、一或多个转录或翻译终止位点(例如1、2、3、4、5、7、10、12等)、一或多个允许切除例如相应于重组位点或该位点翻译的蛋白质的RNA的拼接位点(例如1、2、3、4、5、7、10等)、一或多个标签序列(例如HIS6、GST、GUS、GFP、YFP、CFP、表位标签等)、一或多个限制性位点(例如1、2、3、4、5、7、10等)、一或多个重组位点(或它们的部分)(例如1、2、3、4、5、7、10、12、15、20、30、50等)、等。用于本发明的载体序列还可以包含可按本文所述被抑制以允许表达期望融合蛋白的终止密
码子。因此,根据本发明,可以使用载体序列向本发明的任何核酸分子中导入一或多个这样的元件、功能序列和/或位点,可以使用这些序列进一步操作或分析该核酸分子。例如,载体提供的引物位点(优选位于克隆在该载体中的插入片段两边)使得可以对克隆在该载体
中的产物分子的全部或部分进行测序或扩增。
[0147] 此外,载体所包含的转录或调节序列使得由克隆在载体中的产物分子的全部或部分编码的肽、多肽或蛋白质可以得以表达。同样,载体所提供的基因、基因部分或序列标签(例如GUS、GST、GFP、YFP、CFP、HIS标签、表位标签等)使得可以构建和克隆在载体中的产物分子融合的基因融合物群体、或使得可以产生由载体提供的序列标签联合克隆在该载体中的产物序列共同编码的许多肽、多肽或蛋白融合物。这些基因、基因部分、或序列标签可以与任选地受抑制的终止密码子组合使用,以便可以控制由克隆在载体中的目的序列和载体提供的基因或标签序列编码的融合蛋白的表达。
[0148] 在一个结构中,载体可以包含一或多个重组位点、一或多个终止密码子和一或多个标签序列。在一些实施方案中,该标签序列可以与重组位点相邻。任选地,可以将可抑制的终止密码子掺入标签的序列中或掺入重组位点的序列中,以便使得可以控制标签序列向目的基因的添加。在此类实施方案中,可以通过重组克隆将目的基因插入载体中,以致标签和目的基因的编码序列在同一读框中。
[0149] 可以与翻译起始信号(例如Shine-Delgarno序列、Kozak序列和/或IRES序列)一起提供目的基因,以便允许在终止密码子未受抑制时表达具有天然N端的基因。而且,可以对位于编码融合蛋白成分的核酸区段之间的重组位点进行设计,以便不编码终止密码子或在融合蛋白读框中不编码终止密码子。还可以将目的基因和位于该编码序列3’末端的终止密码子(例如可抑制的终止密码子)一起提供。类似地,当从多个核酸区段(例如3、
4、5、6、8、10等个区段)产生融合蛋白时,可以省去每个核酸区段之间编码终止密码子的核酸,并且,如果期望的话,可以将编码终止密码子的核酸放置在融合蛋白编码区的3’末端。
[0150] 在一些实施方案中,可以在目的基因的N和C端提供标签序列。任选地,位于N端的标签序列可以和终止密码子一起提供,目的基因可以和终止密码子一起提供,C端标签可以和终止密码子一起提供。这些终止密码子可以相同或不同。
[0151] 在一些实施方案中,N端标签的终止密码子不同于目的基因的终止密码子。在此类实施方案中,可以提供相应于终止密码子之一或两者的抑制型tRNA。当提供两者时,每个抑制型tRNA均可以独立地在同一载体上、不同载体上、或在宿主细胞的基因组中提供。抑制型tRNA不必以相同方式提供,例如,一个可以在含有目的基因的载体上提供,而另一个可以在宿主细胞基因组中提供。
[0152] 根据表达信号(如启动子)的定位,表达期间终止密码子的抑制使得可以产生在表达的蛋白质的N和/或C端具有标签序列的融合肽。通过对终止密码子不加抑制,可以
表达不具有N和/或C端标签序列的目的序列。因此,本发明使得可以通过重组有效地构
建含有目的基因或序列(例如1、2、3、4、5、6、10或更多个ORF)的载体,以便根据需要控制融合蛋白的表达。
[0153] 优选地,根据本发明克隆或构建的本发明起始核酸分子或产物分子包含至少一个可读框(ORF)(例如1、2、3、4、5、7、10、12、或15个ORF)。这些起始或产物分子还可以包含功能序列(例如引物位点、转录或翻译位点或信号、终止位点(例如可以任选地抑制的终止密码子)、复制起点等),并优选地包含调节基因表达的序列(包括转录调节序列)和发挥内部核糖体进入位点(IRES)作用的序列。优选地,至少一个起始或产物分子和/或载体包含发挥启动子功能的序列。这些起始或产物分子和/或载体还可以包含转录终止序列、选择标记、限制性酶识别位点等。
[0154] 在一些实施方案中,起始或产物分子和/或载体包含两个拷贝的相同选择标记,每个拷贝的侧翼有两个重组位点。在其它实施方案中,起始或产物分子和/或载体包含两个不同的选择标记,每个选择标记的侧翼有两个重组位点。在一些实施方案中,该选择标记中的一或多个可以是负选择标记(例如ccdB、ki cB、单纯疱疹病毒胸苷激酶、胞嘧啶脱氨酶等)。
[0155] 在一方面,本发明提供克隆核酸分子的方法,包括(a)提供侧翼有第一和第二重组位点的第一核酸区段;(b)提供侧翼有第三和第四重组位点的第二核酸区段,其中该第一或第二重组位点能够和第三或第四重组位点重组;(c)进行重组反应,以便这两个核酸区段重组为一个单一的核酸分子;和(d)克隆此单一核酸分子。在这些方法的某些具体实施方案中,第一重组位点不能与第二和第四重组位点重组,而第二重组位点不能与第一和第三重组位点重组。
[0156] 在一个具体方面,本发明提供克隆方法,包括提供包含至少第一和第二重组位点的至少第一核酸分子和包含至少第三和第四重组位点的至少第二核酸分子,其中该第一或第二重组位点能够与第三或第四重组位点重组;和进行重组反应,以便这两个核酸分子重组为一或多个产物核酸分子,并将此产物核酸分子克隆在一或多个载体中。优选地,这些重组位点位于第一和/或第二核酸分子的侧翼。而且,该克隆步骤优选通过重组反应将产物分子重组入包含一或多个重组位点的载体中,但该克隆步骤也可以通过本领域熟知的标准连接反应来完成。一方面,克隆步骤包括使产物核酸分子中在第一次重组反应中没有反应的位点和具有能够和该未反应的位点发生重组的重组位点的载体之间进行重组反应。
[0157] 另一方面,本发明提供克隆核酸分子的方法,包括(a)提供侧翼有至少第一和第二重组位点的第一核酸区段和侧翼有至少第三和第四重组位点的第二核酸区段,其中位于该第一和第二核酸区段侧翼的每个重组位点均不能和位于该第一和第二核酸分子区段侧翼的任何其它位点重组;(b)提供包含至少第五、第六、第七和第八重组位点的载体,其中该至少第五、第六、第七和第八重组位点的每一个均能够与该至少第一、第二、第三和/或第四重组位点的一个重组;和(c)进行重组反应,以便这两个核酸区段重组进入载体中,由此克隆该第一和第二核酸区段。
[0158] 在另一具体方面,本发明提供克隆方法,包括提供包含至少第一和第二重组位点的至少第一核酸分子和包含至少第三和第四重组位点的至少第二核酸分子,其中该第一、二、三或四重组位点均不能与其它任何位点发生重组;提供包含至少第五、第六、第七和第八重组位点的载体,其中该第五、第六、第七和第八重组位点每个均能够与该第一、二、三或四重组位点中的一个重组;和进行重组反应,以便至少所述第一和第二核酸分子重组进入所述载体中。在再一方面,该方法可以允许克隆至少一个其它的核酸分子(例如,至少第三核酸分子),其中所述分子的侧翼有第九和第10重组位点而其中该载体包含各能够和该第九或第10重组位点重组的第11和第12重组位点。
[0159] 特别地,本发明还提供克隆方法,包括提供第一、第二和第三核酸分子,其中该第一核酸分子的侧翼有至少第1和第2重组位点,该第二核酸分子的侧翼有至少第3和第4重组位点、而该第三核酸分子的侧翼有至少第5和第6重组位点,其中该第2重组位点能够和第3重组位点重组,而该第4重组位点能够和第5重组位点重组;提供具有至少第7和第8
重组位点的载体,其中该第7重组位点能够和第1重组位点反应而该第8重组位点能够和
第6重组位点反应;和实施至少一次重组反应,以便该第2和第3重组位点重组、第4和第
5重组位点重组、第1和第7重组位点重组、第6和第8重组位点重组,由此将该第一、二、三核酸区段克隆在所述载体中。
[0160] 在另一具体方面,本发明提供克隆方法,包括提供至少第1、2、3核酸分子,其中该第1核酸分子的侧翼有第1和2重组位点,该第2核酸分子的侧翼有第3和4重组位点、而该第3核酸分子的侧翼有第5和6重组位点,其中该第2重组位点能够和第3重组位点重
组、而第1、4、5或6重组位点没有一个能够和第1至第6重组位点中的任一个重组;提供包含位于至少第一选择标记侧翼的第7和第8重组位点、并包含位于至少第二选择标记侧翼
的第9和第10重组位点的一或多个载体,其中该第7至第10重组位点没有一个能够和该
第7至第10重组位点中的任一个重组;实施至少一次重组反应,以便该第2和第3重组位
点重组、第1和第4重组位点与第7和第8重组位点重组、而第5和第6重组位点与第9和
第10重组位点重组,由此克隆该第1、2、3核酸区段。在一些实施方案中,这些选择标记可以相同或可以不同。而且,该一或多个选择标记(例如2、3、4、5、7等)可以是负选择标记。
[0161] 本发明还提供克隆n个核酸区段的方法,其中n是大于1的整数,该方法包括(a)提供n个核酸区段,每个区段的侧翼均有两个不能彼此重组的重组位点;(b)提供包含2n
个重组位点的载体,其中此2n个重组位点中每个均能够与位于该核酸区段之一侧翼的其
中一个重组位点重组;和(c)实施重组反应,以便该n个核酸区段重组进入载体中,由此克隆该n个核酸区段。在具体实施方案中,该n个核酸区段和载体间的重组反应是在一或多
个重组蛋白存在时在利于该重组发生的条件下进行的。在其它具体实施方案中,n是2、3、
4或5。
[0162] 因此,一般地,本发明提供克隆n个核酸分子的方法,其中n是大于1的整数,该方法包括步骤:提供n个核酸分子,每个分子包含至少一个、优选两个重组位点(这两个重组位点优选位于n核酸分子的侧翼);提供至少一个包含一或多个重组位点(优选2n个重组位点)的载体,其中载体所含重组位点能够和此n个分子的重组位点重组;和实施重组反
应,以便将该n个核酸分子插入所述载体中,由此克隆该n个核酸区段。这n个分子可以彼此相接地或毗邻地插入载体中和/或可以插入载体的不同位置中。用于根据本发明的克隆的载体优选包含n个拷贝的相同或不同选择标记,每个拷贝的选择标记的侧翼有至少两个重组位点。优选地,这些选择标记中的一或多个是负选择标记。
[0163] 一般地,本发明还涉及克隆n个核酸分子的方法,其中n是大于1的整数,该方法包括步骤:提供第1至第n个核酸分子,每个分子的侧翼有至少两个重组位点,其中对这些重组位点进行选择以便位于第i个区段,即ni,侧翼的两个重组位点中的一个与位于第ni-1区段侧翼的重组位点中的一个反应,而位于第i区段,即ni,侧翼的另一重组位点和位于第ni+1区段侧翼的一个重组位点反应;提供包含至少两个重组位点的载体,其中载体上的这两个重组位点中的一个和第1核酸区段上的一个位点反应,而载体上的另一位点和第n个核酸区段上的一个重组位点反应。
[0164] 根据需要并根据存在的功能元件,通过本发明方法克隆的核酸分子/区段可以是不同类型的并可以具有不同的功能。一方面,根据本发明克隆的至少一个核酸区段与能够调节转录的序列(例如启动子、增强子、阻遏基因(repressor)等)可操作地连接。例如,至少一个核酸区段可以可操作地和启动子连接,该启动子可以是诱导型启动子或组成型启动子。在再其它具体实施方案中,从该克隆的核酸区段产生的RNA的翻译导致产生融合蛋白或单个蛋白的全部或部分。在其它具体实施方案中,至少一个核酸区段编码全部或部分的可读框,而至少一个核酸区段含有能够调节转录的序列(例如启动子、增强子、阻遏基因等)。在其它具体实施方案中,至少一个核酸区段在转录时产生有义RNA链,而至少一个核酸区段在转录时产生反义RNA链。在相关实施方案中,该有义RNA和反义RNA具有至少一个互补区域并能够相互杂交。在其它具体实施方案中,至少两个核酸区段的转录导致产生一个单一的RNA或两个单独的RNA。在各种具体实施方案中,这些核酸区段可以彼此连接、或可以在同一核酸分子中在空间上隔离。在特定实施方案中,该核酸区段包含一或多个文库中的核酸分子。而且,这些文库可以包含cDNA、合成的DNA、或基因组DNA。此外,这些文库的核酸分子可以编码抗体分子的可变区(例如,抗体轻链和重链的可变区)。在特定实
施方案中,本发明提供筛选方法,以鉴定编码对一或多个抗原具有结合特异性的蛋白质和/或具有一或多个活性(例如从细胞中分泌、亚细胞定位(如定位在内质网、细胞核、线粒体、叶绿体、细胞膜等)、配体结合活性(如小分子、对核酸、细胞表面受体、可溶性蛋白质、金属离子、结构元件、蛋白相互作用域等的结合活性)、酶活性等)的蛋白质。而且,使用本发明方法克隆的核酸分子/区段具有上述一或多个活性。
[0165] 在另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提供至少第1、2、和3核酸区段,其中该第1核酸区段的侧翼有至少第1和2重组位点、第2核酸区段的侧
翼有至少第3和4重组位点、而第3核酸区段的侧翼有至少第5和6重组位点,其中该第2
重组位点能够和第3重组位点重组,而第1、4、5或6重组位点中没有一个能够和该第1至第
6重组位点中的任一个重组;(b)提供包含位于至少第一负选择标记侧翼的第7和第8重组
位点、并包含位于至少第二负选择标记侧翼的第9和第10重组位点的载体,其中该第7至
第10重组位点中没有一个能够和该第7至第10重组位点中的任一个重组;(c)实施第一
重组反应,以便该第2和第3重组位点重组;和(d)实施第二重组反应,以便第1和第4重
组位点与第7和第8重组位点重组、而第5和第6重组位点与第9和第10重组位点重组,
由此克隆该第1、2、3核酸区段。在相关实施方案中,该第1和第2重组反应是在一或多个重组蛋白存在时在利于该重组发生的条件下进行的。该第1和第2重组反应可以同时或相
继进行。
[0166] 另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提供第1、2、和3核酸区段,其中该第1核酸区段的侧翼有第1和2重组位点、第2核酸区段的侧翼有第3和4重组位点、而第3核酸区段的侧翼有第5和6重组位点,其中该第2重组位点能够和第3重
组位点重组,而第4重组位点能够和第5重组位点重组;(b)提供包含第7和第8重组位点
的载体;(c)实施至少一次重组反应,以便该第2和第3重组位点重组,第4和第5重组位
点重组,第1和第6重组位点分别与第7和第8重组位点重组,由此克隆该第1、2、3核酸区段。在相关实施方案中,这些重组反应是在一或多个重组蛋白存在时在利于该重组发生的条件下进行的。在特定实施方案中,彼此发生重组的重组位点包含具有一致7碱基对重叠区的att位点。
[0167] 另一方面,本发明提供克隆n个核酸片段的方法,其中n是大于2的整数,该方法包括(a)提供第1至第n个核酸区段,每个区段的侧翼有至少两个重组位点,其中对这些重组位点进行选择以便位于第i个区段,即ni,侧翼的两个重组位点中的一个与位于第ni-1区段侧翼的重组位点中的一个反应,而位于第i区段侧翼的另一重组位点和位于第ni+1区段侧翼的一个重组位点反应;(b)提供包含至少两个重组位点的载体,其中载体上的这两个重组位点中的一个和第1核酸区段上的一个位点反应,而载体上的另一位点和第n个核酸区段上的一个重组位点反应;和(c)实施至少一次重组反应,以便将所有的核酸片段重组至载体中。在具体实施方案中,该重组反应在存在一或多个重组蛋白时在利于该重组发生的条件下进行。
[0168] 在上述方法的具体实施方案中,将多个核酸区段插入另一核酸分子中。尽管这些方法可以有多种变化,但在具体实施方案中,将含有具有不同特异性的重组位点(例如attL1和attL2)的核酸区段插入含有一组以上关连重组位点(例如attR1和attR2)的载
体中,其中每一组关连重组位点均位于负选择标记的侧翼。因此,可以使用在关连位点的重组结果选出在一或多个重组位点经历了重组的核酸分子。插入载体中的核酸区段可以相同或不同。而且,这些核酸区段可以编码表达产物或可以是转录控制序列。当核酸区段编码表达产物时,可以使用本发明载体扩增拷贝数或增加编码产物的表达。而且,当将核酸区段以正向和反向插入时,可以使用本发明载体例如表达RNAi,见本文其它地方的描述。当核酸区段编码调节转录的序列(例如启动子、增强子等)时,可以使用本发明载体将多个调节元件可操作地与编码表达产物的核酸连接。例如,此性质的载体可以通过提供多个与激活转录的蛋白质结合的位点,用于增加表达产物的表达量。类似地,例如可以通过提供多个与抑制转录的蛋白质结合的位点,使用此性质的载体减少表达产物的表达量。例如,可以通过多个拷贝的编码参与转录调节的因子的核酸分子的表达,使用此性质的载体增加或减少表达产物的表达量。与上述相关的其它实施方案将是本领域技术人员明了的。
[0169] 另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提供第一群核酸分子,其中这些分子的全部或部分在侧翼有至少第一和第二重组位点;(b)提供侧翼有至少第三和第四重组位点的至少一个核酸区段,其中该第一或第二重组位点能够和第三或第四重组位点发生重组;(c)进行重组反应,以便该群体中的所有或部分核酸分子与该区段重组,以形成第二群核酸分子;和(d)克隆该第二群核酸分子。在相关实施方案中,这些重组反应是在存在一或多个重组蛋白时在利于该重组发生的条件下进行的。在具体实施方案中,该第二群核酸分子编码融合蛋白。在相关实施方案中,该核酸区段编码的多肽包含编码以下成员全部或部分的序列(优选地N端和/或C端标签序列):免疫球蛋白的Fc部分、抗体、β-葡糖醛酸糖苷酶、荧光蛋白(例如绿色荧光蛋白、黄色荧光蛋白、红色荧光蛋白、蓝色荧光蛋白等)、转录激活域、参与翻译的蛋白质或域、蛋白质定位标签、蛋白质稳定或脱稳定序列、蛋白质相互作用域、DNA的结合域、蛋白底物、纯化标签(例如表位标签、麦芽糖结合蛋白、6组氨酸标签、谷胱苷肽S转移酶等)、和表位标签。
[0170] 另一方面,本发明提供克隆至少一个核酸分子的方法,包括(a)提供第一群核酸分子,其中这些分子的全部或部分在侧翼有至少第一和第二重组位点;(b)提供第二群核酸分子,其中这些分子的全部或部分在侧翼有第三和第四重组位点,其中该第一或第二重组位点能够和第三或第四重组位点重组;(c)实施重组反应,以便第一群中的所有或部分分子和第二群的一或多个分子重组,形成第三群核酸分子;和(d)克隆第三群核酸分子。在相关实施方案中,该重组反应是在存在一或多个重组蛋白时在利于该重组发生的条件下进行的。
[0171] 因此,一般地,本发明提供将至少两个核酸区段接合起来(包括将核酸分子群接合起来)的方法,该方法包括(a)提供至少两个核酸区段(其中一个或两者可以来源于一群分子或文库分子),每个区段包含至少一个能够和另一(或第二)区段上存在的重组位
点发生重组的重组位点;和(b)在使这些重组位点间发生重组的条件下将这些区段和一或多个重组蛋白接触,由此使这些区段接合起来。本发明还提供包含通过该方法制备的这些相接合的核酸区段(或区段群)的组合物、包含这些相接合的核酸区段的宿主或宿主细胞
(它们可以是宿主细胞群或重组宿主细胞)、和制备这些宿主或宿主细胞的方法(例如通过用本发明产物分子转化或转染这些细胞)。在具体实施方案中,本发明方法还包含将该相接合的核酸区段插入一或多个载体中。本发明还涉及含有这些载体的宿主或宿主细胞。在其它具体实施方案中,这两个核酸区段的至少一个编码具有一或多种可鉴定活性的表达产物(例如选择标记、酶、核酶等)。在再其它具体实施方案中,这两个核酸区段的至少一个含有全部或部分的可读框(ORF)。在另一方面,这两个区段的至少一个含有能够调节转录的序列(例如启动子、增强子、阻遏基因等)。在一个具体方面,一个区段编码ORF而另一个编码能够调节转录和/或翻译的序列,而重组反应使得这些序列可操作地相连。在再其它具体实施方案中,这些核酸区段中的一或多个编码选择标记或含有复制起点。在其它具体实施方案中,这些核酸区段的一些或所有含有一或多个文库的核酸分子。在某些具体实施方案中,该一或多个文库包含编码抗体分子可变区的多核苷酸。在相关实施方案中,这些核酸区段的至少一个编码用于连接抗体分子可变区的多肽接头和/或一或多个文库包含编码
抗体轻和重链可变区的多核苷酸。在具体实施方案中,本发明方法还包含至少一个筛选步骤以鉴定编码具有一或多个可鉴定活性(例如对一或多个抗原的结合特异性、酶活性、与选择标记相关的活性等)的蛋白质的核酸分子。因此,可以使用本发明产生修饰的表达产物(通过可变地连接不同区段和/或置换和/或缺失区段)和分析表达产物的期望活性。
根据本发明,可以连接基因的部分和/或许多基因,以表达新蛋白质或新化合物并选出令人感兴趣的活性。正如本文所述,还可以使用对这些连接分子的替换和/或缺失,产生改变的或修饰的蛋白质或化合物用于测试。一方面,可以通过本发明方法修饰生物学途径,以便例如在特定的途径中使用不同的酶或突变的酶(例如,连接在相同生物学途径中参与反应的不同酶或突变酶)。根据本发明对生物学途径的此修饰将导致(1)产生潜在的新化合物
如抗生素或糖或(2)独有的蛋白质翻译后修饰(例如糖基化、唾液酸化(sialation)等)。
本发明还使得可以通过操作或改变多聚体酶复合物的亚基产生新的酶。在其它具体实施方案中,本发明还提供改变细胞性质的方法,包括将上述方法制备的核酸区段导入细胞中。在某些具体实施方案中,通过本发明方法改变或产生的细胞是真菌细胞或细菌细胞(例如大肠杆菌(Escherichia coli))。
[0172] 本发明还提供改变生物学途径和产生新的生物学途径的方法。例如,可以使用本发明方法改变编码参与产生特定途径(例如导致抗生素产生的途径)的产物的基因。这些改变包括缺失、置换和/或突变编码参与该途径的产物的一或多个基因。此外,可以对基因的区域进行缺失或交换,然后筛选鉴定出例如具有特定性质(例如特定甲基化方式)的途
径产物。而且,可以合并不同生物的行使相似但不同功能的基因以产生新的产物。而且,可以通过对特异功能性质(例如抑制酶反应的能力、对特定配体的结合亲和力、抗微生物活性、抗病毒活性等)的筛选,鉴定出这些产物。因此,一方面,本发明提供筛选方法用于鉴定本发明核酸分子的表达产物所产生的化合物。
[0173] 而且,当编码参与特定生物学途径或过程的一或多个表达产物的核酸区段被组装在一或多个核酸分子时,可以对这些分子的区域(例如编码表达产物的区域)进行缺失或置换以产生,例如,表达其它表达产物或改变的表达产物的核酸分子、或产生不表达参与该生物学途径或过程的一或多个表达产物的核酸分子。而且,可以将编码一或多个参与特定生物学途径或过程的表达产物的核酸区段作为一个单独的单位进行缺失或插入。这些方法在产生和筛选新产物的过程中是有用的。尤其是,本发明还包括通过此处描述的核酸分子的表达产物而产生的新产物。
[0174] 另一方面,本发明提供制备和鉴定含有两个或多个核酸区段的核酸分子的方法,其中所述核酸区段编码参与相同生物学过程或生物学途径、以及无关生物学过程或生物学途径的基因产物,该方法包括(a)提供第一群核酸分子,该群核酸分子含有至少一个能够和该第一群中其它分子重组的重组位点;(b)在使第一群的核酸分子重组并产生第二群核酸分子的条件下,使这些核酸分子和一或多个重组蛋白接触;和(c)筛选第二群核酸分子以鉴定编码两个或多个参与相同过程或途径的产物的核酸分子。在本发明具体实施方案中,编码两个或多个参与相同过程或途径的产物的核酸分子编码蛋白质或蛋白质复合物的两个不同域。在其它具体实施方案中,该蛋白质是单链抗原结合蛋白。在再其它具体实施方案中,该蛋白复合物包含含有至少两个单链抗原结合蛋白的抗体分子或多价抗原结合蛋白。本发明还提供类似于上述方法的方法,用于制备或鉴定含有两个或多个编码参与不同或无关生物学过程或生物学途径的基因产物的核酸区段。
[0175] 本发明方法还可以用于确定细胞和/或组织中的基因表达谱(expressionprofile)。一个实施方案中,可以从细胞和/或组织中获得RNA,并将其用于制备cDNA分
子。然后可以将这些cDNA分子彼此连接并对其进行测序以鉴定在细胞和/或组织中表达的基因、以及这些细胞和/或组织中RNA种类的丰度。因此,一方面,本发明提供方法用于鉴定在特定细胞和/或组织中表达的基因以及与其它RNA种类的量相比这些细胞和/或组织
中存在的特定RNA种类的相对量。正如以下讨论的,这些方法可以用于多种应用中,包括诊断、发现基因、鉴定特定细胞和/或组织类型中表达的基因、鉴定特定细胞(例如与病理情况有关的细胞)中超量表达或表达不足的基因、筛选药剂以鉴定改变基因表达的药剂(例
如治疗剂)、等。而且,通过将使用本发明方法获得的序列数据和公共数据库中录入的核酸序列比较,常常可以鉴定出可转录产生特定RNA种类或区段的基因。一般地,为了鉴定出转录产生RNA的基因,需要约10个核苷酸左右的序列数据。
[0176] 因此,一个特定方面,本发明提供确定细胞或组织中基因表达谱的方法,包括(a)从获自细胞或组织的RNA产生至少一群cDNA分子,其中该群体中的各cDNA分子含有至少两个能够和相同或不同cDNA群中单个成员上存在的至少一个重组位点发生重组的重组位
点;(b)在导致(a)的核酸分子接合的条件下使这些核酸分子和一或多个重组蛋白接触;和(c)测定接合的核酸分子的序列。在本发明具体实施方案中,将这些接合的核酸分子插入在插入位点侧翼含有测序引物结合位点的载体中。在再其它具体实施方案中,这些接合的cDNA分子被attB重组位点分开。在其它具体实施方案中,该接合的cDNA分子含有相应于
获自细胞或组织的RNA的约10至约30个核苷酸。
[0177] 一旦确定了相应于RNA表达产物的cDNA序列后,可以将这些序列和含有已知基因序列的数据库比较,以确定在该特定细胞和/或组织中表达了哪些基因以及各基因的表达水平。而且,可以使用本发明方法测定在特定的条件下基因的表达水平,以确定这些条件是否可以导致一或多个基因的表达改变。这些条件的例子包括细胞基因表达产物的活性降低、营养限制和/或缺乏、热休克、低温、与具有低或高离子强度的溶液接触、暴露于化学剂(例如抗生素、化疗剂、金属离子、诱变剂等)、电离辐射等。因此,本发明提供方法以鉴定由于特定刺激而表现出表达改变的基因。
[0178] 本发明还提供用于鉴定参与细胞代谢(如病理情况)的基因的方法。例如,本发明方法可以用于确定特定株的细胞或表现出异常表型的细胞的表达谱。将特定株的细胞或表现出异常表型的细胞的表达谱与另一株的细胞或未表现出异常表型的细胞(在此称作
“参照细胞”)的表达谱作比较。通过比较特定株的细胞或表现出异常表型的细胞和适当的参照细胞的基因表达谱,可以确定与该株或异常表型相关的表达特性。因此,一个特定的方面,本发明提供诊断方法,其中将表现出异常表型(如癌)的患者细胞的基因表达谱与未表现出异常表型的细胞的基因表达谱(即参照细胞)进行比较。
[0179] 另一具体方面,本发明提供筛选治疗剂(例如免疫刺激剂)的方法,包括(a)将细胞(例如人类细胞)暴露于候选治疗剂,(b)确定该暴露的细胞的基因表达谱,(c)对该基因表达谱和未暴露于该候选治疗剂的细胞(即参照细胞)的基因表达谱作比较。本发明还
包括通过上述方法鉴定的治疗剂。
[0180] 另一方面,本发明提供通过重组将分子和/或化合物或分子和/或化合物群与其它分子、化合物和/或支持物(优选固体或半固体的)附着或结合的方法。用于本发明的
适当分子和化合物包括,但不限于,蛋白质、多肽或肽、化学化合物、药物、脂、脂蛋白、糖、激素、类固醇、抗体(或其部分)、抗原、酶(例如核酸酶、聚合酶等)、多糖、核苷和其衍生物、核苷酸和其衍生物、氨基酸和其衍生物、脂肪酸、受体、配体、半抗原、小分子(例如-COOH等活化基团)、结合分子(例如生物素、亲和素、链霉亲和素、A蛋白、B蛋白等)、生长因子、金属离子、细胞因子、核酶、或核酸分子(例如RNA、DNA、DNA/RNA杂合体、cDNA或cDNA文库、双链核酸、单链核酸、线性核酸、环状核酸、超螺旋核酸等)、和前述两种或多种的组合。在具体实施方案中,可以将分子直接或间接地和支持物连接在一起。而且,可以通过共价或非共价方式将分子和支持物连接在一起。为了举例说明的目的,核酸分子和支持物的间接非共价连接的一个例子是将对核酸分子表现出高度结合亲和力的蛋白质直接连接在支持物上。
然后使含有该蛋白的支持物和这些核酸分子在适当的条件下接触,从而导致这些核酸分子通过该蛋白质非共价附着在支持物上。核酸分子/蛋白相互作用的关系可以是序列特异的或非序列特异的。
[0181] 另一方面,本发明提供包含(与支持物结合或未结合的)至少一个第一核酸分子的支持物,其中该第一核酸分子包含一或多个重组位点或其部分。在具体实施方案中,本发明支持物还包含通过第一核酸分子上的重组位点而与支持物结合的至少一个第二核酸分
子或至少一个肽或蛋白质分子或其它化合物。
[0182] 本发明还涉及包含(与支持物结合或未结合的)一或多个选自下组的成分的本发明支持物:包含至少一个重组位点的一或多个核酸分子、一或多个重组蛋白、和包含至少一个重组位点的一或多个肽或化合物。
[0183] 另一方面,本发明提供使一或多个核酸分子、蛋白质或肽分子、或其它化合物附着或结合支持物的方法,包括(a)获得至少一个包含至少一个重组位点的核酸分子、蛋白质或肽分子、其它化合物、或这些分子或化合物的群体,并获得包含至少一个重组位点的支持物;和(b)使位于该至少一个核酸分子、蛋白质或肽分子、其它化合物、或这些分子或化合物的群体上的一些或所有重组位点与支持物包含的全部或部分重组位点发生重组。在本发明具体实施方案中,这些方法还包括将一或多个核酸分子附着或结合在支持物上。在其它实施方案中,仅一个核酸分子与支持物直接连接。在再其它具体实施方案中,这些核酸分子形成微阵列。在甚至更具体的实施方案中,该微阵列形成DNA芯片。本发明还提供通过上述方法制备的支持物。在具体实施方案中,本发明支持物是固体或半固体。而且,正如以上讨论的,可以直接或间接地使核酸分子和支持物连接。也正如以上讨论的,可以通过共价或非共价方式使核酸分子和支持物连接。此外,可以通过与蛋白质或小分子(例如具有活化基团如-COOH的分子)的键合,使核酸分子和支持物连接。而且,可以通过不稳定的或稳定的键合,使核酸分子和支持物连接。
[0184] 另一方面,本发明提供将两个或多个目的分子或化合物连接或接合在一起的方法,包括(a)提供至少第一和第二目的分子或化合物,每个第一和第二目的分子或化合物均包含至少一个重组位点;(b)使第一目的分子或化合物的一些或所有重组位点与第二目的分子或化合物上的一些或所有重组位点发生重组。在本发明具体实施方案中,该方法还包含将含有重组位点的核酸分子附着在第一和第二目的分子或化合物。在其它具体实施方案中,至少一个目的分子或化合物包含蛋白质或肽、核酸、糖、类固醇、或脂。
[0185] 在一些实施方案中,一或多个本发明化合物和/或分子(例如2、3、4、5、7、10、12、15、20、30、50等)可以包含一或两个重组位点(例如2、3、4、5、7、10、12、15、20、30、50等)或其部分。这些分子和/或化合物可以是未标记的或可以通过本领域熟知方法作可检测标记。可检测标记包括,但不限于,放射性标记、质量标记(mass label)、荧光标记、化学发光标记、生物发光标记、和酶标记。使用这些标记可以允许对支持物上标记分子和/或化合物的存在或不存在进行检测。因此,一般地,本发明涉及通过重组将任何数量的分子和/或化合物或分子和/或化合物群附着在支持物上,以及通过此方法制备的支持物。因此,这些化合物和/或分子可以通过含有重组位点或其部分的核酸接头与支持物或结构连接。这些接头优选是小接头(例如,长5、20、30、50、100、200、300、400或500个碱基对)。
[0186] 因此,本发明包括包含一或多个根据本发明此方面可以使用的重组位点(或其部分)的支持物。因此,通过重组反应可以使一或多个有待添加、附着或结合在支持物上的、具有一或多个重组位点或其部分的核酸分子、或蛋白质、肽和/或其它分子和/或化合物和含有重组位点的支持物的重组,由此产生含有一或多个目的核酸分子、蛋白质、肽和/或其它分子和/或化合物的支持物。使目的分子和/或化合物与支持物结合的重组反应优选在足以造成目的分子和/或化合物上的至少一个重组位点和支持物上存在的至少一个重组
位点发生重组的条件下通过支持物和目的分子和/或化合物与至少一个重组蛋白的接触
而在体外进行。本发明此方面对于在一或多个支持物(例如2、3、4、5、7、10、12等)上构建核酸、或蛋白质和/或其它分子和/或化合物的阵列是尤其有用的,因为通过重组这便于大量相同或不同的目的核酸、或蛋白质和/或其它分子和/或化合物与支持物或支持物的不
同部分的结合。因此,本发明涉及将一或多个(例如2、3、4、5、7、10、12、15、20、30、50等)核酸、或蛋白质分子和/或其它分子和/或化合物附着或结合在支持物上的方法,该方法包括:
[0187] (a)获得包含至少一个重组位点的至少第一分子和/或化合物或分子和/或化合物群(例如本发明起始核酸分子),并获得包含至少一个重组位点的支持物(它也可以是本发明的起始分子);和
[0188] (b)使所述至少第一分子和/或化合物或分子和/或化合物群上的一些或所有重组位点与支持物上的全部或部分重组位点发生重组。
[0189] 一旦将分子和/或化合物添加至支持物上后,支持物上这些分子和/或化合物的存在或不存在或位置都可以(例如通过使用可检测的标记)得到确定。或者,可以进一步
通过熟知技术操作与支持物结合的分子和/或化合物。
[0190] 除了根据本发明使一或多个分子和/或化合物与支持物接合外,本发明还允许对支持物所含一或多个分子和/或化合物进行置换、插入或缺失。正如本文所讨论的,通过在目的分子和/或化合物内的特异位点造成重组,可以除去或用另一目的分子或化合物置换分子和/或化合物的全部或部分。该过程还可以应用于附着在支持物上的具有重组位点的分子和/或化合物。因此,除了向支持物添加全部或部分分子外,可以使用重组从支持物上除去或置换目的分子和/或化合物的全部或部分。
[0191] 根据本发明,正如本文所述,还操作或分析添加在支持物上的或从支持物上除去的分子和/或化合物。例如,对与支持物结合的或从支持物上除去的分子和/或化合物的进一步分析或操作包括测序、杂交(DNA、RNA等)、扩增、核酸合成、蛋白质或肽表达、蛋白质-DNA相互作用(双杂种或反向双杂种分析)、与其它分子和/或化合物的相互作用或结
合研究、同源重组或基因打靶、和组合文库分析和操作。这些操作可以在分子和/或化合物与支持物结合时或在分子和/或化合物自支持物上被除去后进行。
[0192] 根据本发明,可以使用任何固体或半固体支持物,而且可以通过熟知技术添加含有重组位点(或其部分)的序列以便将核酸附着在支持物上。而且,可以通过本领域熟知技术在目的核酸、蛋白质分子和/或其它分子和/或化合物上添加重组位点。而且,任何野生型或突变的重组位点、或相同或不同的重组位点的组合都可以用来向支持物添加或从支持物上除去目的分子和/或化合物。
[0193] 本发明还涉及包含一或多个重组位点(例如2、3、4、5、7、10、12、15、20、30、50等)或其部分的任何支持物、以及包含与所述支持物结合的具有一或多个重组位点(或其部分)的核酸、蛋白质分子和/或其它分子和/或化合物的支持物。
[0194] 本发明还涉及包含本发明支持物的组合物。这些组合物还可以包含一或多个重组蛋白(优选位点特异性重组蛋白)、适当缓冲液(例如用于进行重组的缓冲液)、核酸、蛋白质分子和/或其它分子和/或化合物(优选地包含可以不与支持物结合的重组位点)、和任何其它用于使根据本发明的重组位点(和它们的组合)发生重组的试剂。本发明还涉及用
于进一步操作或分析本发明支持物、或附着于其上的核酸或蛋白质分子或其它分子和/或化合物的组合物。对这些核酸、蛋白质、和/或其它分子和/或化合物的进一步操作和分析可以在它们与支持物结合时,或在它们自支持物上被除去后进行。这些组合物可以包含适当的缓冲液和酶如限制性酶、聚合酶、连接酶、重组蛋白等。
[0195] 另一方面,本发明提供使一或多个(例如2、3、4、5、7、10、12、15、20、30、50等)分子和/或化合物或分子和/或化合物群与一或多个相同或不同的分子和/或化合物或分子和/或化合物群附着或结合的方法。因此,一般地,本发明涉及通过重组对任何数量的分子和/或化合物或分子和/或化合物群进行连接。正如本文所述,这些连接的分子和/或化
合物可以是未标记的或是可检测标记的。而且,这些连接的分子和/或化合物可以是通过共价或非共价方式连接的。适当的分子和/化合物包括,但不限于,本文描述的那些,如核酸、蛋白质或肽、化学化合物、药物、脂、脂蛋白、激素等。一方面,可以通过重组,连接相同分子和/或化合物、或相同类型的分子和/或化合物(例如蛋白质-蛋白质、核酸-核酸等)。
因此,一方面,可以将小分子和/或蛋白质与重组位点连接起来,然后使它们以各种组合彼此连接。
[0196] 另一方面,可以通过重组,连接不同的分子和/或化合物、或不同类型的分子和/或化合物(例如蛋白质-核酸、核酸-配体、蛋白质-配体等)。此外,还可以按本文所述通过重组将通过重组相连的分子和/或化合物(例如蛋白质-蛋白质、蛋白质-配体等)
附着在支持物或结构上。由此,通过一或多个重组位点(或其部分)将产生的分子和/或
化合物(任选地与支持物连接的)连接起来。可以使用常规技术将这些重组位点(或其部
分)附着在分子如蛋白质、肽、糖、类固醇和/或脂或它们的组合上,并可以使用本发明方法将含有重组位点的所获分子和/或化合物连接起来。而且,所获的相连分子和/或化合物
可以通过一或多个重组位点与包含重组位点的其它分子和/或化合物结合。例如,可以使包含重组位点的核酸附着于目的分子上,并可以将包含相容重组位点的第二核酸附着于第二目的核酸上。这些位点间的重组导致这两个分子通过小的核酸接头连接起来。该核酸接头可以根据需要是任何长度的,但优选小的接头(例如长约5至约500bp)。使用该方法,可以将蛋白质、肽、核酸、糖、类固醇和/或脂或它们的组合附着在蛋白质、肽、核酸、糖、类固醇和/或脂或它们的组合上。因此,本发明提供连接两个或多个分子和/或化合物的方法,包括步骤:
[0197] (a)获得至少第一和第二分子和/或化合物,所述分子和/或化合物均包含至少一个重组位点(或其部分);和
[0198] (b)使所述第一分子和/或化合物上的一些或所有重组位点(或其部分)与所述第二分子和/或化合物上的全部或部分重组位点(或其部分)发生重组。
[0199] 在一些优选实施方案中,可以使用常规偶联技术将重组位点附着在目的分子上。例如,可以合成包含重组位点的寡核苷酸,以便将一或多个可以相同或不同的反应性功能部分(例如2、3、4、5、7、10等)包括在内。适当的反应性功能部分包括,但不限于,氨基、环氧基、乙烯基、巯基等。包含一或多个反应性功能部分的寡核苷酸的合成对于本领域是常规的。一旦合成后,包含一或多个反应性功能部分的寡核苷酸可以被附着在目的分子或化合物上的一或多个(例如2、3、4、5、7、10等)活性基团上。这些寡核苷酸可以通过一或多个反应性功能部分与一或多个活性功能基团的反应直接地进行附着。在一些实施方案中,可以使用能够与寡核苷酸上存在的一或多个反应性功能部分及目的分子上存在的一或多
个活性基团反应的适当连接基团,来实现该附着。在其它实施方案中,既可以使用直接附着也可以使用通过连接基团实现的附着。本领域技术人员将明了,寡核苷酸上的反应性功能部分可以和目的分子和/或化合物上的反应性功能部分相同或不同。用于将寡核苷酸和目的分子偶联在一起的适当试剂和技术可以参见Hermanson,生物偶联技术(Bioconjugate Techniques),AcademicPress Inc.,San Diego,CA,1996。
[0200] 本发明还涉及用于实施本发明方法的试剂盒,尤其是用于制备本发明产物核酸分子或本发明的其它连接分子和/或化合物(例如蛋白质-蛋白质、核酸-蛋白质等),或制备包含这些产物核酸分子或连接的分子和/或化合物的支持物的试剂盒。本发明还涉及用于向一或多个支持物上、或从一或多个支持物上添加和/或除去和/或置换核酸、蛋白质和/或其它分子和/或化合物的试剂盒、用于制备和使用本发明组合文库的试剂盒、以及用于根据本发明方法实施同源重组(尤其是基因打靶)的试剂盒。本发明试剂盒还可以包含用
于进一步操作通过本发明方法产生的含有重组位点的分子和/或化合物的其它成分。本发明试剂盒可以包含一或多个本发明核酸分子(尤其是包含一或多个重组位点并任选地包
含一或多个反应性功能部分的起始分子)、一或多个本发明分子和/或化合物、一或多个本发明支持物和/或一或多个本发明载体。这些试剂盒可以任选地包含一或多个选自下组的其它成分:一或多个宿主细胞(例如2、3、4、5等)、一或多个用于将分子或化合物(例如通过转染或转化)引入一或多个宿主细胞中的试剂、一或多个核苷酸、一或多个聚合酶和/或逆转录酶(例如2、3、4、5等)、一或多个适当的缓冲液(例如2、3、4、5等)、一或多个引物(例如2、3、4、5、7、10、12、15、20、30、50等)、一或多个终止剂(例如2、3、4、5、7、10等)、一或多个用于构建组合文库的分子群(例如2、3、4、5、7、10、12、15、20、30、50等)、和一或多个组合文库(例如2、3、4、5、7、10、12、15、20、30、50等)。本发明试剂盒还可以含有实施本发明的说明或方案。
[0201] 另一方面,本发明提供用于对核酸区段进行连接、缺失或置换的试剂盒,这些试剂盒包含至少一个选自下组的成分:(1)一或多个重组蛋白或包含一或多个重组蛋白的组合物、和(2)至少一个包含一或多个重组位点的核酸分子(优选具有至少两种不同重组特异性的载体)。本发明试剂盒还可以包含一或多个选自下组的成分:(a)包含额外的重组位点的其它核酸分子;(b)一或多个具有连接酶活性的酶;(c)一或多个具有聚合酶活性的酶;
(d)一或多个具有逆转录酶活性的酶;(e)一或多个具有限制性内切核酸酶活性的酶;(f)一或多个引物;(g)一或多个核酸文库;(h)一或多个支持物;(i)一或多个缓冲液;(j)一或多个去污剂或含有去污剂的溶液;(k)一或多个核苷酸;(1)一或多个终止剂;(m)一或多个转染试剂;(n)一或多个宿主细胞;和(o)使用这些试剂盒成分的说明书
[0202] 而且,本发明试剂盒可以含有一或多个选自下组的重组蛋白:Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、Cin、Tn3解离酶、ΦC31、TndX、XerC和XerD。
[0203] 此外,本发明试剂盒的重组位点一般具有不同重组特异性,每个均包含具有不同的7个碱基对重叠区域的att位点。在本发明具体实施方案中,这7碱基对重叠区域的头3个核苷酸包含选自下组的核苷酸序列:AAA,AAC,AAG,
[0204] AAT,ACA,ACC,ACG,ACT,AGA,AGC,AGG,AGT,ATA,ATC,ATG;
[0205] ATT,CAA,CAC,CAG,CAT,CCA,CCC,CCG,CCT,CGA,CGC,CGG,CGT,
[0206] CTA,CTC,CTGCTT,GAA,GAC,GAG,GAT,GCA,GCC,GCG,GCT,GGA,
[0207] GGC,GGG,GGT,GTA,GTC,GTG,GTT,TAA,TAC,TAG,TAT,TCA,TCC,
[0208] TCG,TCT,TGA,TGC,TGG,TGT,TTA,TTC,TTG,和TTT.
[0209] 在具体实施方案中,本发明试剂盒含有包含一或多个能够催化att位点间发生重组的重组蛋白的组合物。在相关实施方案中,这些组合物包含一或多个能够催化
attB×attP(BP)反应、attL×attR(LR)反应、或BP及LR反应的重组蛋白。
[0210] 和本发明试剂盒一起提供的核酸文库可以包含cDNA或基因组DNA。而且,这些文库可以包含编码抗体轻链和重链可变区的多核苷酸。
[0211] 本发明还涉及用于实施本发明方法的组合物、和在实施本发明方法时产生的组合物。尤其是,本发明包括通过本发明方法制备的核酸分子、用于制备含有这些核酸分子的宿主细胞的方法、通过这些方法制备的宿主细胞、和使用这些宿主细胞来产生这些核酸分子所编码的产物(例如RNA、蛋白质等)的方法、这些核酸分子所编码的产物(例如RNA、蛋白质等)。
[0212] 本发明组合物、方法和试剂盒优选使用λ噬菌体位点特异性重组系统、更优选使用可从Invitrogen公司,Life TechnologiesDivision(Rockville,Maryland)获得的
TM TM
GATEWAY 重组克隆系统,来制备和实施。GATEWAY 克隆技术说明手册(Invitrogen公司,LifeTechnologies Division)更详细地描述了这些系统,其完整地并入本文作为参考。
[0213] 根据本领域知识、以及根据本发明的以下附图和说明、及权利要求,本领域普通技术人员将明了本发明的其它优选实施方案。
[0214] 附图简述
[0215] 图1是基本重组克隆反应的示意图。
[0216] 图2是使用本发明通过LR重组反应克隆两个核酸区段的示意图。
[0217] 图3示意了通过使用LR反应将两个核酸区段接合起来、并然后使用BP重组反应将该接合的片段插入目的载体中,本发明在这些区段的克隆中的应用。
[0218] 图4示意了通过在BP反应后实施LR反应,本发明在克隆两个核酸区段中的应用。
[0219] 图5是克隆两个具有attB位点的核酸区段的示意图,方式是实施第一BP反应以在一个区段上产生一个attL位点并在另一区段上产生一个attR位点,之后通过LR反应将
这些区段合并在一起。在该过程的变体中,P1、P2和/或P3可以是寡核苷酸或线性核苷酸链。
[0220] 图6是使用LR反应将两个核酸区段克隆在目的载体的两个不同位点中的示意图。
[0221] 图7是使用BP反应将两个核酸区段克隆在一个载体的两个不同位点中的示意图。
[0222] 图8是使用BR反应将三个核酸区段克隆在三个载体中、使用LR反应将这三个区段克隆在单一一个载体中、并产生由attB位点分隔开的区段的示意图。
[0223] 图9是使用BR反应将三个核酸区段克隆在一个单一载体中并产生被attR位点分隔开的区段的示意图。
[0224] 图10是通过重组向支持物(带阴影的框)添加一或多个相同或不同分子(核酸、蛋白质/肽、糖、和/或其它化合物)的示意图。空白框代表重组位点。
[0225] 图11是将多个分子和/或化合物(A和B)接合在一起的示意图。该图中所用标记与图10中的相应。A和B的添加可以是同时的或是连续的。
[0226] 图12是从支持物上缺失掉一部分分子或化合物(A)的示意图。该图所用标记与图10中的相应。
[0227] 图13是使用第二分子或化合物(C)置换一部分分子或化合物(A)的示意图。该图所用标记与图10中的相应。
[0228] 图14A是质粒图谱,其显示了用于提供与目的基因的C端融合的结构。supF编码抑制基因功能。因此,当supF表达时,产生GUS-GST融合蛋白。在此方法的变体中,GUS可以使任何基因。
[0229] 图14B是用于控制基因抑制和表达的方法的示意图。该T7RNA聚合酶基因含有一或多个(显示了两个)琥珀终止密码子(标记为“am”)代替酪氨酸密码子。从诱导型启
动子起始的渗漏(未诱导的)转录产生的supF不足以导致产生活性T7 RNA聚合酶。诱导
后,足量supF的产生导致活性T7 RNA聚合酶的产生,这造成supF的表达增加,而这又进一步造成T7 RNA聚合酶的表达增加。T7 RNA聚合酶进一步诱导基因表达。而且,supF的表
达通过抑制干扰性琥珀终止密码子,导致在基因表达产物上加上了一个C端标签。
[0230] 图15是质粒图谱,其显示了用于产生目的基因的N和/或C端融合物的结构。带圆圈的数字代表琥珀、赭石或乳白终止密码子。这些终止密码子的抑制导致融合标签在N端、C端或两端上的表达。在无抑制的情况下,产生本来的蛋白质。
[0231] 图16是使用LR反应将4个独立的DNA区段在一个步骤中插入目的载体的示意图。具体地,将在5’末端具有attL1位点和在3’末端具有attL3位点的第一DNA区段与在5’
末端具有attR3位点和在3’末端具有attL4位点的第二DNA区段连接。然后将该第二DNA
区段与在5’末端具有attR4位点和在3’末端具有attL5位点的第三DNA区段连接。然后
将该第三DNA区段与在5’末端具有attR5位点和在3’末端具有attL2位点的第四DNA区
TM
段连接。由此,通过与LR CLONASE 的反应,将此第一、二、三和四DNA区段插入含有侧翼有attR1和attR2的ccdB基因的目的载体中。这些插入的DNA区段通过attB1、attB3、attB4、attB5和attB2位点彼此分开并与载体序列分开。
[0232] 图17A和17B显示了构建根据以下在实施例18中陈述的方法制备的lux操纵子的示意图。根据本发明,可以通过重组置换或缺失该操纵子的一或多个基因,以构建一或多个修饰的操纵子,然后测试其活性和/或对宿主细胞的影响。或者,可以在该操纵子的最初构建中使用其它基因(包括变体和突变体)代替一或多个目的基因,由此产生一或多个修
饰的操纵子。
[0233] 图18是使用一个两步骤、单载体程序将6个独立的DNA区段插入载体中的示意图。具体地,将在5’末端具有attL1位点和在3’末端具有attL3位点的第一DNA区段
(DNA-A)与在5’末端具有attR3位点和在3’末端具有attL4位点的第二DNA区段(DNA-B)
连接。然后将该第二DNA区段与在5’末端具有attR4位点和在3’末端具有attL5位点的
第三DNA区段(DNA-C)连接。将在5’末端具有attR1位点和在3’末端具有attL3位点的
第四DNA区段(DNA-D)与在5’末端具有attR3位点和在3’末端具有attL4位点的第五DNA
区段(DNA-E)连接。然后将该第五DNA区段与在5’末端具有attR4位点和在3’末端具有
attL2位点的第六DNA区段(DNA-F)连接。然后将获得的两个分子(即DNA-A-DNA-B-DNA-C
TM
和DNA-D-DNA-E-DNA-F)插入该插入载体中。以上所有反应均由LR CLONASE 催化。并使
用LR反应将该连接起来的DNA区段插入含有侧翼有attR1和attR2位点的ccdB基因的目
的载体中。这些插入的DNA区段通过attB1、attB3、attB4、attB5和attB2位点彼此分开
并与载体序列分开。正如图6所示,例如,可以将该组装在一起的区段插入连续的或非连续的位点中。
[0234] 图19是使用两步骤、双载体程序将6个独立的DNA区段插入载体中的示意图。具体地,将在5’末端具有attB1位点和在3’末端具有attL3位点的第一DNA区段(DNA-A)与
在5’末端具有attR3位点和在3’末端具有attL4位点的第二DNA区段(DNA-B)连接。然
后将该第二DNA区段与在5’末端具有attR4位点和在3’末端具有attB5位点的第三DNA
区段(DNA-C)连接。然后将此连接的DNA区段插入含有attP1和attP5位点的载体中。而
且,将在5’末端具有attB5位点和在3’末端具有attL3位点的第四DNA区段(DNA-D)与
在5’末端具有attR3位点和在3’末端具有attL4位点的第五DNA区段(DNA-E)连接。然
后将该第五DNA区段与在5’末端具有attR4位点和在3’末端具有attB2位点的第六DNA
区段(DNA-F)连接。然后将此连接的DNA区段插入含有attP1和attP2位点的载体中。
[0235] 在构建了上述两个载体(每个载体均含有三个插入的DNA区段)后,使这些质粒TM
和LR CLONASE 反应,以产生含有侧翼有attB位点的这6个DNA区段(即,B1-DNA-A-B3-
DNA-B-B4-DNA-C-B5-DNA-D-B3-B1-DNA-E-B4-DNA-F-B2)的另一质粒。
[0236] 图20A是含有两个不同DNA插入片段的本发明示例性载体的示意图,其中这两个DNA插入片段由T7启动子按不同的方向驱动转录。根据待产生的转录本的类型,DNA-A和
/或DNA-B可以处于一定的方向,以致导致产生有义或反义RNA。
[0237] 图20B是含有一个DNA插入片段的本发明示例性载体的示意图,其中所述DNA插入片段由T7启动子按两个不同的方向驱动转录。因此,由一个启动子驱动转录产生的RNA将是有义RNA,而由另一启动子驱动转录产生的RNA是反义RNA。
[0238] 图20C是含有两个不同DNA插入片段的本发明示例性载体的示意图,其中所述两个DNA插入片段具有相同的核苷酸序列(即DNA-A),并由两个不同的T7启动子按不同方向
驱动转录。在此实施例中,一个启动子驱动转录而产生的RNA将是有义RNA,而另一启动子驱动转录而产生的RNA将是反义RNA。
[0239] 图20D是含有两个DNA插入片段的本发明示例性载体的示意图,其中所述两个DNA插入片段以相反方向具有相同的核苷酸序列(即DNA-A),并由一个T7启动子驱动转录。在这两个拷贝的DNA-A和DNA-A插入片段之间不存在转录终止信号。一个区段的转录产生有义RNA,而另一区段的转录产生反义RNA。从该载体产生的RNA将出现分子内杂交,因此将形成具有发夹转的双链分子。
[0240] 图20E是本发明两个示例性载体的示意图,这两个载体含有具有相同核苷酸序列(即DNA-A)的DNA插入片段。这些插入片段的转录导致产生有义和反义RNA,这些RNA然后可以杂交以形成双链RNA分子。
[0241] 图21A是含有三个插入片段(标记为“启动子”、“编码序列”和“Kan”)的本发明示例性载体的示意图。在此实施例中,插入的启动子驱动编码序列的表达。而且插入的DNA区段赋予了含有该载体的宿主以卡那霉素抗性。正如以下详细讨论的,相当大量的载体成分(例如选择标记(如卡那霉素抗性基因)盒、ori盒、启动子盒、标签序列盒等)均可以被插入或用于构建本发明载体。
[0242] 图21B是含有4个插入片段(标记为“启动子1”、“编码序列1”、“启动子2”、和“编码序列2”)的本发明示例性载体的示意图。在此实施例中,启动子1驱动编码序列1表达、而启动子2驱动编码序列2表达。
[0243] 图21C是用于同源重组的本发明示例性载体的示意图。该载体含有4个插入片段,标记为“5’同源区”、“NEO”、“DNA-A”、和“3’同源区”。在此实施例中,5’和3’同源区与选出将插入新霉素抗性标记(“NEO”)和DNA区段(“DNA-A”)的染色体区域同源。可以对此类靶向载体进行设计,以便对所靶向的核酸分子中存在的核酸进行插入、缺失和/或置换。
[0244] 图22A和22B示意了制备本发明靶向载体的方法。
[0245] 图23显示了采用随机引发第一链逆转录、然后采用随机引发进行PCR对mRNA的扩增。将这些扩增产物分成n个库,每个库用具有不同attB位点对的随机引物扩增。“R”后缀显示一些attB位点可以是相反方向。将具有标准或相反方向的attB位点用于不同的
库,以产生以标准方向或反向连接attB位点的扩增产物。当这些位点与反向attP位点反
应时,在进入克隆(Entry Clone)中形成attR位点而非attL位点。因此,库与标准或反向attR的反应将产生侧翼有attR和attL位点的分子的混合物。通过凝胶纯化依大小排列
TM
扩增产物,然后采用GATEWAY BP反应对其进行克隆以制备进入克隆,所述进入克隆根据所用的attB位点和attP位点的取向每个均含有侧翼有attL位点、attR位点或attL和attR
的小插入片段。当将进入克隆混合在一起时,这些插入克隆形成能够被克隆在适当目的载体中的多联体,产生n个各被attB位点分隔开的插入片段。对多个多联体进行测序,可以给出最初样品中存在的mRNA分子的分布情况。
[0246] 图24A-24C显示了大量适用于本发明方法和组合物的att位点的序列(SEQ IDNO:1-36)。
[0247] 图25A-25B显示了大量含有插入片段的进入克隆,所述插入片段包括N端标签或序列(N-标签)、可读框(ORF)、C端标签或序列(C-标签)、选择标记(amp)、质粒复制起点(ori)、和其它载体元件(例如loxP位点)。每个进入克隆的载体元件插入片段的侧翼均有attL或attR位点,以致这些载体元件可以在LR Clonase反应中连接在一起并形成新的载
体结构(显示在图25B中)。
[0248] 图26A-26B显示了构建含有任何方向和特异性的attP位点的attP供体质粒的过程。图26A显示了attP位点在attP供体质粒中的4种排列,包括2个方向的直接重复
和2个方向的反向重复attP位点。图26A显示的4个attP供体质粒可以作为模板,和特
异与attP位点核心退火的PCR引物一起用于PCR反应,由此在PCR产物的末端产生具有任
何期望特异性的attL或attR位点。对于待构建的每个新attP供体载体,可以制备两个这
样的PCR产物,一个由质粒主链(ori-kan)组成,而另一个由ccdB和cat基因组成。在LR
Clonase反应中使这些PCR产物一起反应,以产生带有具有任何att位点特异性的任何取向的attP位点的新质粒。
[0249] 图27A显示了连接两个核酸区段A和B的方法,将这些区段克隆在两个相似结构的质粒中。每个区段的侧翼均有两个重组位点。每个质粒上的其中一个重组位点能够和另一质粒上的它的关连伙伴反应,而另两个重组位点与存在的任何其它位点均不反应。每个质粒带有一个独特的复制起点,该复制起点可以是或不是条件型的。每个质粒还带有正和负选择标记(分别是+smX和smY),使得能够选择除去和选出与特定标记连接的元件。最
后,每个质粒带有适当放置的第三重组位点(在本例中是loxP),使得能够缺失除去不期望的元件并保留期望的元件。在本例中,这两个质粒最初通过Gateway LxR反应在L2和R2
融合。这导致区段A和B通过B2重组位点并列,以及sm1和oriB通过P2重组位点并列。
第二个图中显示了主链中位于一系列质粒元件侧翼的两个loxP位点。加入Cre蛋白将
使单个大质粒解离为两个较小的质粒。这些质粒中的一个将是带有连接的A和B区段以及
目前与sm2和+sm4连接的oriA的期望质粒。其它质粒带有一组非必需的和/或不期望的
元件。转化适当的宿主并随后进行适当的遗传选择,将导致除去不期望的质粒并同时保留期望质粒。
[0250] 图27B显示了连接两个嵌合核酸区段A-B和C-D(按以上图27A中所示构建的)的方法。将这些区段克隆在两个相似结构的质粒中。每个区段的侧翼均有两个重组位点。每个质粒上的其中一个重组位点能够和另一质粒上的它的关连伙伴反应,而另两个重组位点与存在的任何其它位点均不反应。在本例中,这两个质粒最初通过Gateway LxR反应在L2和R2融合。这导致区段A和B通过B2重组位点并列,以及sm1和oriB通过P2重组位点并
列。第二个图块中显示了主链中位于一系列质粒元件侧翼的两个loxP位点。加入Cre蛋
白将使单个大质粒解离为两个较小的质粒。这些质粒中的一个将是带有连接的A-B和C-D
区段以及目前与sm2和+sm4连接的oriA的期望质粒。其它质粒带有一组非必需的和/或
不期望的元件。转化适当的宿主并随后进行适当的遗传选择,将导致除去不期望的质粒并同时保留期望质粒。
[0251] 发明详述
[0252] 定义
[0253] 在以下说明中,广泛使用了重组核酸技术中的许多术语。为了清晰和更为一致地理解说明书和权利要求,包括这些术语被给予的范围,我们提供以下定义。
[0254] 基因:本文所用术语“基因”是指含有表达多肽、蛋白质或非翻译RNA(例如rRNA、tRNA、反义RNA)所必需的信息的核酸。当基因编码蛋白质时,正如本领域技术人员清楚地知道的,它包括启动子和结构基因可读框序列(ORF),产生基因产物所需的转录和反义机器不包括在基因的定义内。当基因编码非翻译RNA时,它包括启动子和编码非翻译RNA的核酸。
[0255] 结构基因:本文所用词语“结构基因”是指该核酸可以转录产生信使RNA,而该信使RNA随后可以翻译出特异多肽特征性的氨基酸序列。
[0256] 宿主:本文所用术语“宿主”是指任何可以成为复制型表达载体、克隆载体、或任何核酸分子的受体的原核或真核生物。该核酸分子可以含有,但不限于,结构基因、转录调节序列(例如启动子、增强子、阻遏基因等)和/或复制起点。本文所用术语“宿主”、“宿主细胞”、“重组宿主”和“重组宿主细胞”可以互换使用。对于这些宿主的例子,见Maniatis等,分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual),Cold Spring Harbor Laboratory,Cold SpringHarbor,纽约(1982)。
[0257] 转录调节序列:本文所用词语“转录调节序列”是指核酸分子上含有的任何构型或几何形状的功能性核苷酸链,其作用是调节(1)一或多个结构基因(例如2、3、4、5、7、10等)转录为信使RNA或(2)一或多个基因转录为非翻译RNA。转录调节序列的例子包括,但不限于,启动子、增强子、阻遏基因等。
[0258] 启动子:本文所用启动子是转录调节序列的一个例子,其明确地是一般被描述为邻近起始密码子的基因5’区的核酸或编码非翻译RNA的核酸。邻近核酸区段的转录是在启动子区域起始的。阻遏型启动子的转录速率将响应阻遏剂而降低。诱导型启动子的转录速率将响应诱导剂而增加。组成型启动子的转录速率明确地是不受调节的,但它可以在一般代谢条件的影响下改变。
[0259] 插入片段:本文所用术语“插入片段”是指作为较大核酸分子一部分的期望核酸区段。在许多情况下,插入片段将被导入较大的核酸分子中。例如,图2中标记为ccdB和DNA-A的核酸区段相对于该处所示的较大核酸分子而言是核酸插入片段。在大多数情况下,插入片段的侧翼有重组位点(例如每个末端至少一个重组位点)。然而,在某些实施方案中,插入片段仅在一个末端上含有重组位点。
[0260] 靶核酸分子:本文所用词语“靶核酸分子”是指目的核酸区段,优选是有待使用本发明化合物和方法作用的核酸。这些靶核酸分子优选含有一或多个基因(例如2、3、4、5、7、10、12、15、20、30、50等)或基因的部分。
[0261] 插入片段供体:本文所用词语“插入片段供体”是指带有插入片段的本发明两个亲本核酸分子(例如RNA或DNA)之一(见图1)。插入片段供体分子包含在两边侧翼有重组位点的插入片段。插入片段供体可以是线性或环状的。在本发明一个实施方案中,插入片段供体使环状核酸分子,任选地是超螺旋的,并还在重组信号外包括克隆载体序列。当使用一群插入片段或一群核酸区段来制备插入片段供体时,获得一群插入片段供体,并可以根据本发明使用它们。
[0262] 产物:本文所用术语“术语”是指重组克隆程序中第二个重组事件后产生的包含A和D序列的一个期望子代分子(见图1)。产物含有有待克隆或或亚克隆的核酸。根据本发明,当使用一群插入片段供体时,所获的产物分子群将含有该群插入片段供体的插入片段的全部或部分,并优选含有插入片段供体的原始分子的代表群。
[0263] 副产物:本文所用术语“副产物”是指缺少期望进行克隆或亚克隆的区段的子代分子(重组克隆程序中第二个重组事件后产生的新克隆)。
[0264] 共合体(cointegrate):本文所用术语“共合体”是指至少一个含有两个亲本(起始)分子的本发明重组中间核酸分子。共合体可以是线性的或环状的。使用适当的宿主TM
细胞株,例如大肠杆菌DB3.1(尤其是大肠杆菌LIBRARY EFFICIENCY DB3.1 感受态细
胞),并对共合体分子上存在的两个选择标记进行筛选,可以从共合体表达RNA和多肽。
[0265] 识别序列:本文所用词语“识别序列”是指蛋白质、化学化合物、DNA或RNA分子(例如限制性内切酶、修饰性甲基化酶、或重组酶)所识别和结合的一段特定序列。本发明中,识别序列通常是指重组位点。例如,Cre重组酶的识别序列是loxP,它是包含位于一段8碱基对核心序列两侧的两个13碱基对反向重复(充当重组酶结合位点)的一段34个碱
基对序列。(见Sauer,B.,Current Opinion inBiotechnology5:521-527(1994)的图1)。
识别序列的其它例子有重组酶λ整合酶所识别的attB、attP、attL、和attR序列。attB是含有两个9碱基对核心型Int结合位点和一个7碱基对重叠区的约25碱基对的序列。attP
是含有核心型Int结合位点和臂型Int结合位点以及辅助蛋白质整合宿主因子(IHF)、
FIS和切除酶(Xis)的位点的一段约240个碱基对的序列。(见Landy,Current Opinion
inBiotechnology3:699-707(1993))。根据本发明还可以对这些位点进行改造以增强本发明方法中产物的产量。当经改造的该位点缺少P1或H1域以使得重组反应不可逆转(例如
attR或attP)时,这些位点可以被称作attR’或attP’以显示这些位点的这些域已通过某种方式而被修饰。
[0266] 重组蛋白(recombination protein):本文所用词语“重组蛋白”包括切除性或整合性蛋白质、酶、辅因子、或参与涉及一或多个重组位点(例如2、3、4、5、7、10、12、
15、20、30、50等)的重组反应的相关蛋白,重组蛋白可以是野生型蛋白质(见Landy,
CurrentOpinion in Biotechnology3:699-707(1993))、或其突变体、衍生物(例如含有重组蛋白序列或其片段的融合蛋白)、片段和变体。重组蛋白的例子包括Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、ΦC31、Cin、Tn3解离酶、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCE1和ParA。
[0267] 重组位点:本文所用词语“重组位点”是指参与整合/重组反应的核酸分子上重组蛋白质的识别序列。重组位点是该参与的核酸分子上被位点特异性重组蛋白质在整合或重组初期识别和结合的不连续核酸片段或区段。例如,Cre重组酶的重组位点是loxP,它是由位于一段8碱基对核心序列两侧的两个13碱基对反向重复(充当重组酶结合位点)组成的一段34个碱基对序列。见Sauer,B.,Current Opinion inBiotechnology5:521-527(1994)的图1。识别序列的其它例子包括此处所述attB、attP、attL、和attR序列,及它们的突变体、片段、变体和衍生物,这些识别序列被重组蛋白λInt和被辅助蛋白质整合宿主因子(IHF)、FIS和切除酶(Xis)所识别。见Landy,CurrentOpinion in Biotechnology3:
699-707(1993)。
[0268] 可以通过任何多种已知方法向分子添加重组位点。例如,可以通过平末端连接、使用完全或部分随机引物进行PCR、或使用侧翼有重组位点的限制性位点将核酸分子插入载体中,从而将重组位点添加到核酸分子上。
[0269] 重组克隆:本文所用词语“重组克隆”是指例如描述于美国专利5,888,732和6,143,557(其内容完整地并入本文作为参考)中的一种方法,通过该方法核酸分子或这些分子群的区段可以在体外或体内被交换、插入、置换、替代或修饰。优选地,该克隆方法是一种体外方法。
[0270] 阻遏盒:本文所用词语“阻遏盒”是指存在于亚克隆载体中含有阻遏基因或选择标记的一段核酸区段。
[0271] 选择标记:本文所用词语“选择标记”是指通常在特定条件下,允许选出或选择除去含有其的分子(如复制子)或细胞的一段核酸区段。这些标记可以编码一种活性,例如,但不限于,产生RNA、肽或蛋白质;或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。选择标记的例子包括但不限于:(1)所编码产物提供对抗毒性化合物(如抗生素)的抗性的核酸区段;(2)所编码产物为受体细胞中否则将缺少的产物(例如tRNA
基因、营养缺陷标记)的核酸区段;(3)所编码产物抑制基因产物活性的核酸区段;(4)所编码产物可以容易地得到鉴别(例如,表型标记如β-半乳糖苷酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、蓝色荧光蛋白(CFP)、和细胞表面蛋白)的核酸区段;(5)与否则将有害于细胞生存和/或功能的产物结合的核酸区段;(6)抑制以上1-5
号所述任何核酸区段的活性的核酸区段(例如反义寡核苷酸);(7)与修饰底物的产物(例
如限制性内切酶)结合的核酸区段;(8)能够用于分离或鉴定期望分子的核酸区段(例如
特异蛋白质结合位点);(9)编码可能是非功能性的特异核苷酸序列(例如,用于分子亚群的PCR扩增)的核酸区段;(10)当缺少时,将直接或间接地赋予对特定化合物的抗性或敏
感性的核酸区段;和/或(11)所编码产物在受体细胞中具有毒性(例如白喉毒素)或可将
相对无毒化合物转化为毒性化合物(例如单纯疱疹病毒胸苷激酶、胞嘧啶脱氨酶)的核酸
区段;(12)抑制含有它们的核酸分子的复制、分配或遗传力的核酸区段;和/或(13)编码条件型复制功能,如在某些宿主或宿主细胞株中或在某些环境条件(如温度、营养条件等)下复制,的核酸区段。
[0272] 选择方案:本文所用词语“选择方案”是指允许选择、富集、或鉴定期望核酸分子或接触它们(尤其是混合物中含有进入克隆或载体、目的载体、供体载体、表达克隆或载体、任何中间物(例如共合体或复制子)、和/或副产物的产物或多个产物)的宿主细胞的任何方法。一方面,本发明选择方案依赖于一或多个选择标记。一个实施方案的选择方案有至少两个在重组克隆过程中连接或未连接的成分。一个成分是选择标记。另一成分控制该选择标记在体外或体内的表达、或含有带选择标记的质粒的细胞(或核酸分子例如复制子)
的存活。一般地,此控制元件是选择标记的阻遏物或诱导物,但可以使用其它方式来控制选择标记的表达或活性。正如本领域技术人员易于明了的,是使用阻遏物还是激活物将取决于标记是正还是负选择、以及各种核酸区段的确切排列。在一些优选实施方案中,该选择方案导致选出或富集仅一或多个期望核酸分子(例如产物)。正如本文所定义的,核酸分子的选择包括(a)选择或富集期望DNA分子的存在(称作“正选择方案”),和(b)选择除去或
减少非期望DNA分子的核酸分子的存在(称作“负选择方案”)。
[0273] 在一个实施方案中,选择方案(可以逆向进行)可以采取三种形式中的一种,这将参照图1来进行讨论。此处以选择标记和针对它的阻遏基因作为例子,第一种选出含有区段D和缺少区段C的分子。第二种选择除去含有区段C的分子并选出含有区段D的分子。第二种形式的可能实施方案是使核酸区段携带对于体外反应产物待导入的细胞有毒性的
基因。毒性基因可以是表达为毒性基因产物(毒性蛋白质或RNA)的核酸,或可以是本身自然就具有毒性。(后一情况中,毒性基因应理解为具有其“可遗传性状”的经典定义。)
[0274] 这些毒性基因产物的例子是本领域熟知的,包括但不限于限制性内切酶(如DpnI、Nla3等);细胞凋亡相关基因(如ASK1或bc1-2/ced-9家族成员);逆转录病毒的基
因,包括人免疫缺陷病毒(HIV)的那些基因;防卫素如NP-1;反向重复或成对的回文DNA序列;噬菌体的裂解基因如来自ΦX174或噬菌体T4的那些;抗生素敏感基因如rpsL;抗微生物敏感基因如pheS;质粒致死基因(Killer gene);所产生的基因产物对细菌有毒的真核转录载体基因如GATA-1;在缺少抑制功能时杀死宿主的基因,如kicB、ccdB、fx174E(Liu,Q.等,Curr.Biol.8:1300-1309(1998));及负面影响复制子稳定性和/或复制的其它基因。
或者,毒性基因可以是在体外可选择的,例如限制性位点。
[0275] 可操作地与诱导型启动子连接的、编码限制性内切核酸酶的许多基因是已知的,并可以用于本发明。(见,如美国专利4,960,707(DpnI和DpnII);5,000,333、
5,082,784 和 5,192,675(KpnI);5,147,800(NgoAIII 和 NgoAI);5,179,015(FspI 和
HaeIII);5,200,333(HaeII和TaqI);5,248,605(HpaII);5,312,746(ClaI);5,231,021和
5,304,480(XhoI和XhoII);5,334,526(AluI);5,470,740(NsiI);5,534,428(SstI/SacI);
5,202,248(NcoI);5,139,942(NdeI);和5,098,839(PacI)。也参见Wilson,G.G.,Nucl.Acids Res.19:2539-2566(1991);和Lunnen,K.D.等,Gene74:25-32(1988)。)
[0276] 在第二种形式中,区段D带有选择标记。该毒性基因将清除含有该载体供体、共合体和副产物分子的转化体,同时该选择标记可以用于选出含有产物的细胞和选择除去仅含有插入片段供体的细胞。
[0277] 第三种形式选出在同一分子上顺式含有区段A和D的细胞,而非在不同分子上反式含有这两个区段的细胞。这可以通过分成两个无活性片段(各在区段A和D上)的选择
标记来实现。
[0278] 这些片段相对重组位点按一定方式排列,以致当这些区段被重组事件带到一起时,它们可以重新构成一个功能性选择标记。例如,重组事件可以将启动子和结构核酸分子(例如基因)连接在一起,可以将一个结构核酸分子的两个片段连接在一起,或可以将编码存活所需的异二聚体基因产物的核酸分子连接在一起,或可以将一个复制子的各部分连接在一起。
[0279] 位点特异性重组酶:本文所用词语“位点特异性重组酶”是指一类典型至少具有以下4种活性(或其组合)的重组酶:(1)识别特异核酸序列;(2)切割所述序列;(3)参与链交换的拓扑异构酶活性;和(4)重新缝合切开的核酸链的连接酶活性。见Sauer,
B.,CurrentOpinions in Biotechnology5:521-527(1994)。保守性位点特异性重组不同于同源重组和转座,因为它对于两个参加反应的分子具有高度的序列特异性。链交换机
制涉及在无DNA合成的情况下切割和重新连接特异核酸序列(Landy,A.(1989)Ann.Rev.
Biochem.58:913-949)。
[0280] 同源重组:本文所用词语“同源重组”是指核酸分子和相似核苷酸序列联合并交换核苷酸链的过程。因此,在预定位置上有效地和第二核酸分子进行同源重组的第一核酸分子的核苷酸序列将具有促进第一核酸分子和第二核酸分子的预定位置之间交换核苷酸链的核苷酸序列。因此,第一核酸分子一般将具有足以和第二核酸分子的一部分互补的核苷酸序列,以便促进核苷酸碱基配对。
[0281] 同源重组要求两个参与重组的核酸中有同源序列,但不要求任何特异序列。按以上指出的,正如该词语在此处的使用,发生在例如att位点等重组位点处的位点特异性重组不被认为是“同源重组”。
[0282] 载体:本文所用术语“载体”是指为插入片段提供有用的生物学或生物化学性质的核酸分子(优选DNA)。例子包括质粒、噬菌体、自主复制序列(ARS)、着丝粒、和其它能够在体外或在宿主细胞中复制或被复制、或将期望核酸区段递送至宿主细胞内的期望位置的序列。载体可以具有一或多个限制性内切核酸酶识别位点(例如2、3、4、5、7、10等),在此位点处可以按可确定的方式切开序列而不失去载体的必需生物学功能,并且可以将核酸区段插入此位点中以便实现其复制和克隆。载体还可以提供引物位点(例如用于PCR的引物位点)、转录和/或翻译起始和/或调节位点、重组信号、复制子、选择标记等。清楚地,也可以应用不要求使用重组、转座或限制性酶而插入期望核酸片段的方法(例如,但不限于,PCR片段的尿嘧啶N糖基化酶(UDG)克隆(美国专利5,334,575和5,888,795,两者均完整地并
入本文作为参考)、T:A克隆等),将片段克隆至克隆载体中以便根据本发明进行使用。该克隆载体还可以含有一或多个适用于鉴定克隆载体所转化的细胞的选择标记(例如2、3、
4、5、7、10等)。
[0283] 亚克隆载体:本文所用词语“亚克隆载体”是指优选包括适当复制子的克隆载体,其包含环状或线性核酸分子。在本发明中,亚克隆载体(图1的区段D)还可以含有期望并入终产物中以作用于克隆的核酸插入片段或与之一起作用的功能性和/或调节性元件(图
1的区段A)。该亚克隆载体还可以含有选择标记(优选DNA)。
[0284] 载体供体:本文所用词语“载体供体”是指本发明两个亲本核酸分子(例如RNA或DNA)之一,其带有包含了将成为期望产物一部分的核酸载体的核酸区段。载体供体包含亚克隆载体D(或如果插入片段供体没有已经含有克隆载体,则可以将其称作克隆载体)和侧翼有重组位点的区段C(见图1)。区段C和/或D可以含有按上述选择方案有助于选择期望子代产物分子的元件。重组信号可以相同或不同,并可以被相同或不同的重组酶作用。此外,载体供体可以是线性或环状的。
[0285] 引物:本文所用术语“引物”是指可以在核酸分子(例如DNA分子)的扩增或聚合过程通过共价键合核苷酸单体而被延伸的单链或双链寡核苷酸。一方面,引物可以是测序引物(例如通用测序引物)。另一方面,引物可以包含重组位点或其部分。
[0286] 衔接子:本文所用术语“衔接子”是指包含一或多个重组位点(或这些重组位点的部分)的寡核苷酸或核酸片段或区段(优选DNA),根据本发明它们可以被添加在环状或线性插入片段供体分子以及本文所述其它核酸分子上。当使用重组位点的部分时,缺失的部分可以由插入片段供体分子提供。这些衔接子可以加在环状或线性分子内的任意位置上,但优选将衔接子加在线性分子的一或两个末端或近末端。优选地,将衔接子置于目的特定核酸分子的两边(侧翼)。根据本发明,可以通过标准重组技术(例如限制性消化和连接),将衔接子添加在目的核酸分子上。例如,可以通过以下方式将衔接子加在环状分子上:首先用适当限制性酶消化该分子、将衔接子加在切割位点上并重新形成在切割位点含有衔接子的环状分子。在其它方面,可以通过同源重组、RNA分子的整合等来添加衔接子。或者,可以直接将衔接子和线性分子的一或多个、优选两个末端连接,由此产生在一或两个末端具有衔接子的线性分子。在本发明一方面,可以将衔接子添加在一群线性分子(例如经过切割或消化的cDNA文库或基因组DNA)上,以形成在所述群体的全部或相当大部分分子的一
或优选两个末端含有衔接子的线性分子群。
[0287] 衔接子引物:本文所用词语“衔接子引物”是指包含一或多个重组位点(或这些重组位点的部分)的引物分子,根据本发明可以将其添加在本文所述环状或线性核酸分子上。当使用重组位点的部分时,缺失的部分可以由本发明核酸分子(例如衔接子)提供。可以将这些衔接子引物添加在环状或线性分子内的任何位置上,但优选将衔接子引物添加在线性分子的一或两个末端或近末端。这些衔接子引物的例子以及根据本发明方法它们的用途显示在本文实施例8中。可以使用这些衔接子引物在各种情况下通过各种技术将一或多个重组位点或其部分添加在环状或线性核酸分子上,所述技术包括但不限于扩增(例如PCR)、连接(例如酶或化学/合成连接)、重组(例如同源或非同源(异常)重组)等。
[0288] 模板:本文所用术语“模板”是指待扩增、合成或测序的双链或单链核酸分子。对于双链DNA分子,优选在可以对这些分子进行扩增、合成或测序之前将其双链变性以形成第一和第二链,或可以直接使用该双链分子作为模板。对于单链模板,在适合的条件下与和模板的至少一部分互补的引物进行杂交,然后具有聚合酶活性的一或多种多肽(例如2、3、4、5或7种DNA聚合酶和/或逆转录转录酶)可以合成与该模板的全部或部分互补的分子。
或者,对于双链模板,可以联合使用一或多个转录调节序列(例如2、3、4、5、7或更多个启动子)和一或多个聚合酶,以制备与模板的全部或部分互补的核酸分子。根据本发明,新合成的分子可以和最初模板等长或比最初模板短。在新合成分子的合成或延伸过程中错配掺入或链滑移(strand slippage)可以导致一或多个错配碱基对。因此,合成的分子不一定完全和模板互补。此外,可以在合成或扩增过程中使用一群核酸模板以产生一群典型地代表了初始模板群的核酸分子。
[0289] 掺入:本文所用术语“掺入”是指成为核酸(如DNA)分子或引物的一个部分。
[0290] 文库:本文所用术语“文库”是指核酸分子(环状或线性)的集合。在一个实施方案中,文库可以包含大量(例如2、3、4、5、7、10、12、15、20、30、50、100、200、500、1000、5000、或更多个)核酸分子,这些核酸分子可以或可以不来自于共同的生物、器官、组织或细胞来源。在另一实施方案中,文库代表生物核酸容量的全部或部分或一个显著部分(“基因组”文库),或是代表细胞、组织、器官或生物中所表达核酸分子的全部或部分或一个显著部分(来源于其中的cDNA文库或区段)的一套核酸分子。文库还可以包含通过从头合成、诱变一或多个核酸分子等制备的具有随机序列的核酸分子。这些文库可以或可以不被包含在一或多个载体(例如2、3、4、5、7、10、12、15、20、30、50等)中。
[0291] 扩增:本文所用术语“扩增”是指借助一或多种具有聚合酶活性的多肽(例如1、2、3、4或更多个核酸聚合酶或逆转录酶)、用于增加核酸分子拷贝数的任何体外方法。核酸扩增导致核苷酸掺入DNA和/或RNA分子或引物中,籍此形成一个与模板互补的新核酸分子。
所形成的核酸分子和其模板可以用作模板以合成其它核酸分子。正如本文所用,一个扩增反应可以由多个核酸复制循环组成。DNA扩增反应包括例如聚合酶链式反应(PCR)。一个
PCR反应可以由5-100个循环的DNA分子变性及合成组成。
[0292] 核苷酸:本文所用术语“核苷酸”是指碱基-糖-磷酸的组合。核苷酸是核酸分子(DNA和RNA)的单体单位。术语核苷酸包括核糖核苷三磷酸ATP、UTP、CTP、GTP及脱氧核糖核苷三磷酸如dATP、dCTP、dITP、dUTP、dGTP、dTTP,或它们的衍生物。这些衍生物包括,例如,[αS]dATP、7-脱氮dGTP和7-脱氮dATP。术语核苷酸在本文中还指双脱氧核糖核苷三磷酸(ddNTP)和它们的衍生物。双脱氧核糖核苷三磷酸的举例说明性例子包括,但不限于,ddATP、ddCTP、ddGTP、ddITP和ddTTP。根据本发明,“核苷酸”可以是未标记的,或可以通过熟知技术作可检测标记。可检测标记物包括,例如,放射性同位素、荧光标记物、化学发光标记物、生物发光标记物和酶标记物。
[0293] 核酸分子:本文所用词语“核酸分子”是指任何长度的连续核苷酸(核糖NTP、dNTP或ddNTP、或它们的组合)序列,其可以编码全长多肽或其任何长度的片段、或可以是非编码的。本文所用术语“核酸分子”和“多核苷酸”可以互换使用并包括RNA和DNA。
[0294] 寡核苷酸:本文所用术语“寡核苷酸”是指包含一段共价连接的核苷酸序列的合成或天然分子,所述核苷酸通过一个核苷酸戊糖的3’位和相邻核苷酸戊糖的5’位之间的磷酸二酯键连接在一起。
[0295] 多肽:本文所用术语“多肽”是指任何长度的连续氨基酸序列。术语“肽”、“寡肽”、或“蛋白质”在本文中可以和术语“多肽”互换使用。
[0296] 杂交:本文所用术语“杂交”和“进行杂交”是指两个互补单链核酸分子(RNA和/或DNA)的碱基配对以给出双链分子。正如本文所用,即使碱基配对并不完全互补,两个核酸分子也可以杂交。因此,只要使用适当的条件(这是本领域熟知的),错配的碱基并不妨碍两个核酸分子的杂交。一些方面,“杂交”是在“严紧条件”下进行。“严紧条件”,该词在本文中用于指42℃在以下溶液中孵育过夜,该溶液包含:50%甲酰胺、5×SSC(750mM NaCl,75mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt氏溶液、10%葡聚糖硫酸酯、和20μg/ml经剪切的变性鲑精DNA,之后在0.1×SSC中于约65℃洗涤滤膜。
[0297] 本文使用的其它重组核酸技术和分子细胞生物学领域术语一般可以被适用领域的普通技术人员所理解。
[0298] 概要
[0299] 本发明涉及重组接合两个或多个区段或核酸分子或其它分子和/或化合物(或它们的组合)的方法、组合物和试剂盒。本发明还涉及优选地通过重组位点或其部分,将该连接的核酸分子或其它分子和/或化合物附着在一或多个支持物或结构上。因此,一般地,本发明涉及通过包含一或多个重组位点(例如2、3、4、5、7、10、12、15、20、30、50等)或其部分的核酸接头连接任何数量的核酸或其它分子和/或化合物。
[0300] 根据起始材料,通过本发明产生的连接产物可以包含任何数量的相同或不同核酸或其它分子和/或化合物。该起始材料包括但不限于包含一或多个重组位点或其部分的任何核酸(或其衍生物如肽核酸(PNA))、化学化合物、可检测的标记分子(例如荧光分子和化学发光分子)、药物、肽或蛋白、脂、糖和其它分子和/或化合物。根据本发明通过这些重组位点的重组,可以连接任何数量的该起始分子和/或化合物、或它们的组合,以产生本发明连接产物。此外,可以通过重组缺失、置换本发明连接产物中的某些部分或成分。
[0301] 在一些实施方案中,优选通过重组克隆方法以及通过同源重组,可以将该接合的区段插入不同的核酸分子如载体中。因此,在一些实施方案中,本发明涉及通过重组反应联合两个或更多个核酸区段(例如2、3、4、5、7、10、12、15、20、30、50等)并通过重组克隆将该接合的两个或多个区段插入载体中来构建核酸分子(RNA或DNA)。
[0302] 在通过重组反应使该接合的核酸分子进一步与其它核酸分子联合的实施方案中,两个重组事件(即,这些区段的接合和这些区段在载体中的插入)的时间选择并不是关键的。也就是说,例如,是在插入载体之前将两个或多个核酸区段接合在一起、还是首先使每个区段上的一个重组位点与载体上的重组位点反应然后再使这些核酸区段上的重组位点
彼此反应以造成区段的接合,对于本发明不是关键的。而且,可以将核酸区段克隆在载体的任何一或多个位置中,而且不必彼此相邻地插入,但在一些实施方案中,优选两个或多个该区段在载体内接合。
[0303] 根据本发明,重组克隆允许有效地选择和鉴定含有联合的核酸区段的分子(尤其是载体)。因此,可以将两个或多个目的核酸区段合并,并任选地将其插入适于进一步操作该合并的核酸分子的单个载体中。
[0304] 在一个基本实施方案中,将至少两个核酸区段(每个均包含至少一个重组位点)和适当的重组蛋白接触,根据重组位点在分子中的位置,以使这两个分子的全部或部分接合。每个单独的核酸区段可以包含各种序列,包括但不限于适于用作引物位点的序列(例如可以与测序引物或扩增引物等引物杂交以起始核酸合成、扩增或测序的序列)、转录或翻译信号或调节序列如启动子和/或增强子、核糖体结合位点、Kozak序列、起始密码子、终止信号如终止密码子、复制起点、重组位点(或其部分)、选择标记、和用以产生(例如N端或C端)融合蛋白的基因或基因部分如GST、GUS、GFP、YFP、CFP、麦芽糖结合蛋白、6组氨酸(HIS6)、表位、半抗原等和它们的组合。用于克隆这些区段的载体也可以包含这些功能序列(例如启动子、引物位点等)。在将包含这些序列的区段联合起来并最佳地将这些序列克隆在一或多个载体(例如2、3、4、5、7、10、12、15等)中后,可以以多种方式操作这些分子,包括对靶核酸分子进行测序或扩增(即,通过使用整合序列所引入的至少一个引物位点)、突变靶核酸分子(即,通过在靶核酸分子中或上实施插入、缺失或替换)、通过同源重组插入另一分子中、转录靶核酸分子、和从靶核酸分子或其部分表达蛋白质(即通过这些区段和/或载体所含翻译和/或转录信号的表达)。
[0305] 本发明还涉及使用本文公开的重组克隆方法制备组合文库。因此,一或多个接合的核酸区段可以包含核酸文库。该文库可以包含例如相应于编码肽、多肽或蛋白序列的序列排列(permutations)的核酸分子。可以将这些排列与由单个序列组成的另一核酸
区段相接合,或者,该第二核酸分子也可以是相应于另一肽、多肽或蛋白质序列的排列的文库,以便这两个区段的接合可以产生代表这两个肽、多肽、或蛋白质序列的所有排列的所有可能组合的文库。这些核酸区段可以是连续的或非连续的。组合文库的用途的许多
例子是本领域已知的。(见例如Waterhouse等,Nucleic Acids Res.,1993,第21卷第9
期,2265-2266;Tsurushita等,Gene,1996,第172卷第1期,59-63页;Persson,Int.Rev.Immunol.1993,10:2-3153-163;Chanock等,Infect Agents Di s1993年6月2:3118-31;
Burioni 等,ResVirol19973月 -4月 148:2161-4;Leung,Thromb.Haemost.1995年 7月
74:1373-6;Sandhu,Crit.Rev.Biotechnol.1992,12:5-6437-62和美国专利5,733,743、
5,871,907和5,858,657,所有均特此并入本文作为参考。)
[0306] 当本发明方法和组合物中所用一或多个核酸区段是突变的时,这些区段可以含有(1)指定数量的突变或(2)平均指定数量的突变。而且,可以参考核酸区段本身或表达产物(例如这些核酸区段的多肽)对这些突变进行记分。例如,可以突变文库的核酸分子,
以产生平均与最初文库的相应核酸分子有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%一致性的核酸分子。类似地,可以突变文库的核酸分子,以产生所编码多肽与最初文库的相应核酸分子所编码的多肽平均有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少
97%、至少98%、或至少99%一致性的核酸分子。
[0307] 重组位点
[0308] 用于本发明的重组位点可以是能够充当重组反应底物的任何核酸。这些重组位点可以是野生型或天然存在的重组位点、或是修饰的、变异的、衍生的或突变的重组位点。本发明所用重组位点的例子包括,但不限于,λ噬菌体的重组位点(如attP、attB、attL和attR及它们的突变体或衍生物)和来自其它噬菌体如phi80、P22、P2、186、P4和P1的重组位点(包括lox位点如loxP和loxP511)。在以下实施例9和以前的专利申请(1999年5月28日提交的美国申请60/136,744和2000年3月2日提交的美国申请09/517,466,特此
并入并入作为参考)中,描述了突变的att位点(例如attB1-10、attP1-10、attR1-10和
attL1-10)。具有独特特异性的其它重组位点(即,第一位点与其相应位点重组并且不与
具有不同特异性的第二位点重组)是本领域技术人员已知的,并可以用于实施本发明。可以根据本发明和指定的重组位点一起使用针对这些系统的相应重组蛋白。提供用于本发
明的重组位点和重组蛋白的其它系统包括酿酒酵母(Saccharomycescerevisiae)的FLP/
FRT系统、解离酶家族(例如γδ、TndX、TnpX、Tn3解离酶、Hin、Hjc、Gin、SpCCE1、ParA和Cin)、和IS231和其它苏金芽孢杆菌(Bacillus thuringiensis)的可转座因子。用
于本发明的其它适当重组系统包括大肠杆菌的XerC和XerD重组酶以及psi、dif和cer
重组位点。其它适当的重组位点可以参见颁发给Elledge和Liu的美国专利5,851,808,
特此并入本文作为参考。用于本发明的优选重组蛋白、和突变的、修饰的、变异的或衍生的重组位点包括描述于以下文献中的那些:美国专利5,888,732和6,143,557、以及基
于美国临时申请60/108,324(1998年11月13日提交)的美国申请09/438,358(1999
年11月12日提交)、以及基于美国临时申请60/136,744(1999年5月28日提交的)的
美国申请09/517,466(2000年3月2日提交),以及与可从Invitrogen Corporation,
TM
LifeTechnologies Division(Rockville,MD)获得的GATEWAY 克隆技术有关的那些,所有这些文献均引入本文作为参考。
[0309] 可以用于实施本发明的重组位点的代表性例子包括以上提及的att位点。本发明人已确定,通过改变7碱基对重叠区域中或邻近的核苷酸可以构建特异地与其它att位
点重组的att位点。因此,适用于本发明方法、组合物和载体的重组位点包括,但不限于,在15个碱基对的核心区域(GCTTTTTTATACTAA(SEQ ID NO:37))中具有1、2、3、4或更多个核苷酸碱基的插入、缺失或替代的那些重组位点,所述核心区域在所有的4个野生型λatt位点(即attB、attP、attL和attR)中是一致的(见1998年6月7日提交的美国申请
08/663,002(目前是美国专利5,888,732)和1998年10月23日提交的09/177,387,其更
为详细地描述了该核心区域,其公开完整地并入本文作为参考)。适用于本发明方法、组合物、和载体的重组位点也包括在该15个碱基对核心区域(GCTTTTTTATACTAA(SEQ ID NO:
37))中具有1、2、3、4或更多个核苷酸碱基的插入、缺失或替代、并与此15个碱基对核心区域至少50%一致、至少55%一致、至少60%一致、至少65%一致、至少70%一致、至少75%一致、至少80%一致、至少85%一致、至少90%一致、或至少95%一致的那些重组位点。
[0310] 类似地,attB1、attP1、attL1和attR1的核心区域彼此是一致的,同样attB2、attP2、attL2和attR2的核心区域是一致的。适用于本发明的核酸方法还包括那些在该15碱基对核心区域(GCTTTTTTATACTAA(SEQ ID NO:37))的7个碱基对重叠区(TTTATAC,其被定义为整合酶蛋白的切割位点并是链交换发生的区域)中包含1、2、3、4或更多个核苷酸碱基的插入、缺失或替代的重组位点。这些突变体、片段、变体和衍生物的例子包括,但不限于,以下核酸,该核酸中(1)此7bp重叠区第1位的胸腺嘧啶缺失或被替代为嘌呤、胞嘧啶、或腺嘌呤;(2)此7bp重叠区第2位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(3)此7bp重叠区第3位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(4)此7bp重叠区第4位的腺嘌呤缺失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶;(5)此7bp重叠区第5位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(6)此7bp重叠区第6位的
腺嘌呤缺失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶;(7)此7bp重叠区第7位的胞嘧啶缺失或被替代为鸟嘌呤、胸腺嘧啶、或腺嘌呤;或此7bp重叠区中具有一或多个此类缺失和/或替代的任何组合。下表1给出了上述7碱基对核心区域的核苷酸序列。
[0311] 正如以下实施例9-12中描述的,我们构建了改变的att位点,这些位点说明(1)在此7碱基对重叠区的头3个位置内(TTTATAC)实行替代强烈地影响重组的特异性、(2)
在最后4个位置中(TTTATAC)的替代仅部分地改变重组特异性、和(3)在此7bp重叠区之
外但在该15个碱基对核心区域中进行的核苷酸替代不影响重组的特异性但影响重组的效
率。因此,本发明的核酸分子和方法包括那些包含或利用了1、2、3、4、5、6、8、10或更多个重组特异性受到影响的重组位点、尤其是包含或利用了一或多个(例如1、2、3、4、5、6、8、10、
12、20、30、40、50等)可以基本上相应于该15个碱基对核心区域的7碱基对重叠区但具有一或多个影响重组特异性的突变的不同重组位点的核酸分子和方法。尤其有利的此类分子可以包含一段共有序列例如NNNATAC,其中“N”是指任何核苷酸(即,可以是A、G、T/U或C)。优选地,如果该共有序列中头3个核苷酸的一个是T/U,那么该头3个核苷酸的其它两个中的至少一个不是T/U。
[0312] 可以将每个att位点(attB、attP、attL和attR)的核心序列分成由整合酶结合位点、整合酶切割位点和决定特异性的序列组成的功能单位。正如以下实施例12中讨论的,整合酶顶端链(top strand)切割位点后的头3个位置被定义为特异性决定因子。在以下参考序列中用下划线显示了这3个位置:CAACTTTTTTATACAAAGTTG(SEQ ID NO:38)。表1显示了这3个位置的以下修饰(64种可能组合),该修饰可以用于制备能够以高度特异性和其它在此7碱基对重叠区头3个核苷酸具有相同序列的att位点重组的att位点。
[0313]AAA CAA GAA TAA
AAC CAC GAC TAC
AAG CAG GAG TAG
AAT CAT GAT TAT
ACA CCA GCA TCA
ACC CCC GCC TCC
ACG CCG GCG TCG
ACT CCT GCT TCT
AGA CGA GGA TGA
AGC CGC GGC TGC
AGG CGG GGG TGG
AGT CGT GGT TGT
ATA CTA GTA TTA
ATC CTC GTC TTC
ATG CTG GTG TTG
ATT CTT GTT TTT
[0314] 表2显示了适用于本发明方法、组合物和载体的att位点7碱基对重叠区的代表性例子。本发明还包括包含一或多个(例如1、2、3、4、5、6、8、10、20、30、40、50等)表2所列核苷酸序列的核苷酸分子。因此,例如,一方面,本发明提供包含核苷酸序列GAAATAC、GATATAC、ACAATAC或TGCATAC的核酸分子。然而,在某些实施方案中,本发明不包括包含了本文图24A-24C中或实施例9中所给att位点核心区的核酸分子。
[0315]AAAATAC CAAATAC GAAATAC TAAATAC

AACATAC CACATAC GACATAC TACATAC
AAGATAC CAGATAC GAGATAC TAGATAC
AATATAC CATATAC GATATAC TATATAC
ACAATAC CCAATAC GCAATAC TCAATAC
ACCATAC CCCATAC GCCATAC TCCATAC
ACGATAC CCGATAC GCGATAC TCGATAC
ACTATAC CCTATAC GCTATAC TCTATAC
AGAATAC CGAATAC GGAATAC TGAATAC
AGCATAC CGCATAC GGCATAC TGCATAC
AGGATAC CGGATAC GGGATAC TGGATAC
AGTATAC CGTATAC GGTATAC TGTATAC
ATAATAC CTAATAC GTAATAC TTAATAC
ATCATAC CTCATAC GTCATAC TTCATAC
ATGATAC CTGATAC GTGATAC TTGATAC
ATTATAC CTTATAC GTTATAC TTTATAC
[0316] 正如以上提及的,改变位于上述3个碱基对区3’端的核苷酸也可以影响重组特异性。例如,在该7碱基对重叠区的最后4个位置中进行改变也可以影响重组特异性。
[0317] 因此,本发明提供可以和关连伙伴重组的重组位点、以及含有这些重组位点的分子和制备、鉴定和使用这些位点的方法。以下实施例12中给出了可以用于鉴定这些位点的方法。这些重组位点的例子包括含有与关连伙伴联合并重组的7碱基对重叠区的att位点。上表2中给出了这些7碱基对重叠区的具体例子的核苷酸序列。
[0318] 本发明其它实施方案包括分离的核酸分子,该分离的核酸分子包含与上表2给出的7bp重叠区核苷酸序列或SEQ ID NO:37所示15碱基对核心区至少50%一致、至少60%一致、至少70%一致、至少75%一致、至少80%一致、至少85%一致、至少90%一致、或至少95%一致的核苷酸序列,以及与任何这些核苷酸序列或其片段、变体、突变体、和衍生物互补的核苷酸序列。
[0319] 具有与编码特定重组位点或其部分的参考核苷酸序列例如至少95%“一致”的核苷酸序列的多核苷酸,是指除了该多核苷酸序列可以在参考核苷酸序列的每100个核苷酸中包括至多5个点突变(例如插入、替换或缺失)外,该多核苷酸的核苷酸序列与参考序列是一致的。例如,为了获得具有与参考attB1核苷酸序列(SEQ ID NO:5)至少95%一致的核苷酸序列的多核苷酸,可以在attB1参考序列中缺失或用另一核苷酸替代至多5%的核苷酸,或可以在attB1参考序列中插入高达attB1参考序列总核苷酸5%数量的核苷酸。该参考序列的这些突变可以发生在参考核苷酸序列的5’或3’端位置上或那些末端位置之间的任何位置上,或单个地散布在参考序列的核苷酸中或散布在参考序列的一或多个连续组中。
[0320] 实际上,可以使用已知计算机程序如DNAsis软件(HitachiSoftware,San Bruno,California)进行初期序列比对并随后使用ESEE3.0版DNA/蛋白质序列软件(cabot@trog.mbb.sfu.ca)进行多序列比对,常规地确定任何具体的核酸分子是否与例如给定的重组位点核苷酸序列或其部分有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、
97%、98%或99%一致性。或者,可以使用BESTFIT程序(Wisconsin Sequence Analysis Package,Genetics ComputerGroup,University Research Park,575Science Drive,Madison,WI53711)来确定,其中该程序使用局部同源性算法(Smith和Waterman,Advances in Applied Mathematics2:482-489(1981))寻找两个序列之间的最佳同源区段。根据本发明,当使用DNAsis、ESEE、BESTFIF或任何其它序列比对程序来确定特定序列是否与参考序列有例如95%一致性时,设置参数以便就全长参考核苷酸序列计算一致性百分数并允许在同源性中有达到参考序列核苷酸总数5%的空缺区(gap)。
[0321] 正如以上提及,一方面,本发明还提供构建和/或鉴定适合与本发明核酸分子一起使用的重组位点方法,以及通过这些方法构建和/或鉴定的重组位点。简而言之,本发明提供构建和/或鉴定能够和其它重组位点重组的重组位点的方法。例如,本发明提供构建重组位点并鉴定这些重组位点是否与其它重组位点重组的方法。针对重组活性或特异性而筛选出的重组位点可以通过任何多种方法来构建,包括定点诱变和随机核酸合成。
[0322] 本发明还提供经历一次重组后以低频率(例如在随后的重组反应中具有降低了至少5倍、至少10倍、至少50倍、至少100倍、或至少1000倍的重组活性)发生重组或基
本上不能发生重组的“单次使用”重组位点。本发明还提供制备和使用含有该单次使用重组位点的核酸分子的方法和含有这些位点的分子。以下给出了可以用于产生和确定该单次使用重组位点的方法的例子。
[0323] att系统核心整合酶结合位点包含一个具有以下核苷酸序列的被中断的7碱基对反向重复:
[0324] ------>.......<------
[0325] caactttnnnnnnnaaagttg(SEQ ID NO:39),
[0326] 以及其可包含完全或非完全重复的变体。
[0327] 可以将此重复元件再分为两个由caac/gttg区段(下划线)(位于中心未限定序列(用字母“n”表示的核苷酸)远侧)、和ttt/aaa区段(位于中心未指定序列近侧)组成
的远端和/或近端“域”。
[0328] 改变中心未限定区一边或两边的远端和/或近端域的序列组成可以影响重组反应的结果。影响的范围和程度是所产生的具体改变以及特定重组事件(例如LR对BP反
应)的函数。
[0329] 例如,可以认为经改变而具有以下核苷酸序列的attB位点
[0330] ------>.......<------
[0331] caactttnnnnnnnaaacaag(SEQ ID NO:40),
[0332] 可以和关连attP发生功能性相互作用,并产生attL和attR。然而,后两个重组位点不论那一个获得了含有“caag”(位于以上所示序列的左边)的区段都将在随后的重组事件中丧失功能。以上仅是能够在参与单次重组事件后造成att位点失去功能的核心整合酶结合序列中多种可能改变的一种。因此,可以通过改变毗邻att位点7碱基对重叠区的
7碱基对反向重复区的核苷酸,产生单次使用重组位点。该区域示意如下:
[0333] CAAC TTT[7碱基对重叠区]AAA GTTG。
[0334] 在构建单次使用重组位点时,可以完全地缺失或用其它核苷酸替代序列CAACTTT或AAAGTTG(即7碱基对反向重复区)的1、2、3、4或更多个核苷酸。这些7碱基对反向重复区相对于彼此而言是互补序列。因此,可以在任一7碱基对反向区中作改变以便产生单次使用重组位点。而且,当DNA是双链并存在一个7碱基对反向重复区时,在另一链上也存在另一7碱基对反向重复区。
[0335] 使用序列CAACTTT进行举例说明,可以形成单次使用重组位点的7碱基对反向重组区的例子包括,但不限于如下核酸分子,该核酸分子中(1)此7碱基对反向重复区第1位的胞嘧啶缺失或被替代为鸟嘌呤、腺嘌呤、或胸腺嘧啶;(2)此7碱基对反向重复区第2位的腺嘌呤缺失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶;(3)此7碱基对反向重复区第3位的腺嘌呤缺失或被替代为鸟嘌呤、胞嘧啶、或胸腺嘧啶;(4)此7碱基对反向重复区第4位的胞嘧啶缺失或被替代为鸟嘌呤、腺嘌呤、或胸腺嘧啶;(5)此7碱基对反向重复区第5位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(6)此7碱基对反向重复区第6位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;(7)此7碱基对反向重复区第7位的胸腺嘧啶缺失或被替代为鸟嘌呤、胞嘧啶、或腺嘌呤;或此7碱基对反向重复区中具有1、
2、3、4或更多个此类缺失和/或替代的任何组合。下表3给出了上述7碱基对反向区域的
核苷酸序列的代表性例子。
[0336]
[0337] 形成单次使用重组位点的核苷酸序列的代表性例子也可以通过将表4第1部分中给出了核苷酸序列与表4第2部分给出的核苷酸序列进行组合来制备。也可以通过在这些
区域内部插入一或多个(例如1、2、3、4、5、6、7等)核苷酸,制备单次使用重组位点。
[0338]
[0339] 在对于特定核酸区段而言需要防止重组事件的大多数情况下,可以将改变的序列定位在该核酸区段的近侧。使用以下简图进行举例说明:=5’核酸区段3’=caac ttt[7碱基对重叠区]AAA GTTG,小写核苷酸序列代表7碱基对反向重组序列(即caac ttt),当寻求防止在所示核酸区段3’末端(即相对于该核苷酸区段的近侧末端)发生重组时,该序列一般具有经插入、缺失和/或替代以形成单次使用重组位点的序列。因此,例如,可以使用单次重组反应以将核酸区段整合在另一核酸分子中,然后该重组位点将有效地丧失功能从而防止该位点参与其它的重组反应。类似地,可以将单次重组位点放置在核酸区段的两个末端以便可以将该核酸区段整合在另一核酸分子中、或环化,并且甚至在重组酶存在时仍保持整合或环化。
[0340] 可以使用多种方法就功能活性(如经过一次重组事件后不能再经历随后的重组事件)筛选潜在的单次使用重组位点。例如,对于筛选重组位点以鉴定在单次重组事件后丧失功能的那些重组位点而言,可以进行第一重组反应以产生其中负选择标记与一或多个潜在缺陷性重组位点连接的质粒。然后可以使该质粒和包含类似地连接重组位点的正选择标记的另一核酸分子反应。因此,设计该选择系统以便重组的分子对阴性筛选敏感并通过正选择选出不发生重组的分子。使用该系统,然后可以直接地选出期望的单次使用核心位点突变体。
[0341] 本领域技术人员将明了,可以设计多种筛选试验,以获得与上述结果相同的结果。在许多情况下,可以对这些试验进行设计以便发生初次重组事件、然后鉴定不能参与随后重组事件的重组位点或选出含有这些重组位点的分子。相关筛选试验将导致选择除去参与第二重组事件的核酸分子。而且,正如以上提及的,可以设计筛选试验,以便选择除去参与随后重组事件的分子并选出不参与随后重组事件的那些分子。
[0342] 在使大量的核酸区段彼此附着或实施多个重组反应时,单次使用的重组位点对于降低重组频率或防止重组是尤其有用的,因此,本发明还包括含有单次使用的重组位点的核酸分子、以及使用这些位点实施重组的方法。
[0343] 本发明核酸分子的构建和用途
[0344] 正如以下更详细讨论的,一方面,本发明提供了一个用于构建具有特定功能或活性的核酸分子的模式系统。本发明还提供使核酸分子群和一或多个已知或未知目的靶序列(例如2、3、4、5、7、10、12、15、20、30、50个等)或和其它核酸分子群(已知或未知的)联合的方法,由此产生组合分子群(例如组合文库),从该组合分子群中可以获得独特的和/或新的分子(例如杂合分子)以及这些分子所编码的蛋白质或肽,并可以对它们作进一步分析。
[0345] 本发明还包括制备含有一个以上核酸插入片段(例如2、3、4、5、6、8、10、12、15、20、30、40、50等个插入片段)的载体的方法。本发明一个普通实施方案中,本发明载体是按以下方式制备的。获得最终将插入目的载体中的核酸分子(例如购买、通过PCR产生或通过使用逆转录酶制备cDNA来产生)。适当的重组位点或可以在合成过程中掺入核酸分子的5’和3’末端、或可以在之后添加。在设法制备含有多核酸插入片段的载体时,可以在一个反应混合物中或在一系列反应混合物中将这些插入片段插入载体中。例如,正如图16所示,可以将多个核酸区段末端对末端连接、并通过在例如单个反应混合物中进行的反应将其插入载体中。可以对该反应混合物中的这些核酸区段进行设计,以便5’和3’末端的重组位点可以导致这些核酸区段按特定的顺序以及特定的5’至3’取向插入目标载体中。或者,可以设计核酸区段,以便在不考虑顺序、取向(即5’至3’取向)、插入片段的数量、和/或插入片段的数量和/或双重插入片段的数量的情况下将其插入目的载体中。
[0346] 而且,在某些情况下,一或多个此核酸区段将仅在一个末端具有重组位点。而且,如果期望的话,此末端或这些末端可以通过使用例如连接酶或拓扑异构酶与其它核酸区段相连接。作为例子,在5’端具有attR1位点的线性核酸分子可以和含有侧翼有attL1位点和attL2位点的ccdB基因的目的载体重组。在LR反应之前、期间或之后,可以例如通过限制性酶在ccdB基因相反侧的attR2位点一边上切割目的载体。因此,目的载体可以在切割和经历重组后成为线性的。而且,核酸分子的attR1位点将与目的载体的attL1位点重组,产生含有该核酸分子的线性载体。然后可以使用酶如连接酶或拓扑异构酶将所获线性产物环化。
[0347] 使用图16所示实施方案举例说明本发明的另一方面,5’末端具有attL1位点而3’末端具有attL3位点的第一DNA片段通过重组与5’末端具有attR3位点而3’末端具有
attL4位点的第二DNA片段附着。5’末端具有attR4位点而3’末端具有attL5位点的第
三DNA片段通过重组与3’末端具有attL4位点的第二DNA片段附着。5’末端具有attR5
位点而3’末端具有attL2位点的第四DNA片段通过重组与3’末端具有attL5位点的第
三DNA片段附着。目的载体含有位于ccdB基因侧翼的attR1位点和attR2位点。因此,当
TM
与LR CLONASE 反应时,可以将第1、2、3和4DNA区段插入插入载体中,并以attB1、attB3、attB4、attB5和attB2位点作为侧翼或被这些位点分开。图17A-17B显示了组装lus操纵
子所涉及到的相似程序,以下实施例18对此进行了描述。
[0348] 本领域技术人员将明了,图16所示程序可以有多种变化。例如,可以使用attB、attP、attL和attR位点、以及其它重组位点的各种组合。类似地,可以使用各种选择标记、复制起点、启动子和其它遗传元件。而且,可以在这些载体中加上允许整合在真核染色体中的区域(例如可转座因子)。
[0349] 图18显示了将多个DNA区段插入载体中的多反应方法的一个例子。在此示例性实施方案中,三个DNA区段在两个不同的反应混合物中彼此重组。然后在利于这两个反应混合物的产物之间发生重组并且利于连接产物插入载体(例如目的载体)中的条件下,将
这些混合物中产生的产物混合在一起。该实施方案的优点是:(1)可以将DNA区段直接插
入目的载体中而不需要预先插入另一载体中;和(2)可以使用相同的att位点以及其它重
组位点制备各连接的DNA区段以便将其插入载体。
[0350] 本领域技术人员明了,本文所述方法可以有多种变体。例如,可以使用单次重组位点连接各核酸区段。因此,消除或降低了与核酸区段阵列参与不期望的重组反应有关的潜在问题。而且,可以使用上述程序通过各种途径将大量核酸分子个体连接在一起。例如,可以随机地、或按特定顺序,在考虑或不考虑区段的5’至3’方向的情况下,连接核酸区段。
[0351] 而且,可以将一或多个核酸区段的相同拷贝掺入另一核酸分子中。因此,本发明还提供含有多拷贝的单个核酸区段的核酸分子。而且,可以使用对位于这些区段5’和3’末端的重组位点的筛选,确定连接然后插入例如载体中的相同核酸区段的确切数目。然后可以将这些载体插入宿主细胞,在该宿主细胞中它们能够例如自主复制或整合在通常位于宿主细胞内的一或多个核酸分子中(例如通过位点特异性重组或同源重组整合)。
[0352] 含有多拷贝核酸分子区段的核酸分子可以用于例如扩增特定基因的拷贝数。因此,本发明还提供基因扩增方法,含有多拷贝核酸区段的核酸分子、和含有本发明核酸分子的宿主细胞。
[0353] 作为另一实例,可以使用本发明方法将两个不同的核酸区段连接起来。例如,可以将重组位点放置在这些区段上,以便这些区段交替连接(例如区段A+区段B+区段A+区段B,等)。当需要使用增加拷贝数的核酸来增加产生的表达产物的量时,具有此结构的核酸分子是尤其有用的。在此情况下,“区段A”可以例如是包含ORF的核酸分子。因此,可以制备含有上述结构并且在缺少诱导信号时不表达实质量的区段B产物但在诱导时产生高水
平的该产物的细胞。当区段B表达产物对细胞有毒性时,该系统尤其有用。因此,可以使用上述方法构建并在不存在区段B表达产物导致的破坏性影响的情况下维持含有区段B的细
胞。而且,然后可以使用对位于区段B中的ORF的诱导表达,以便例如瞬时产生高水平的区段B表达产物。
[0354] 图19显示了将多个DNA区段插入载体的多步骤方法的另一实例。在此实施方案TM
中,在不同的重组反应中使三个DNA区段彼此连接,然后使用LR和BP CLONASE 反应将它
们插入不同的载体中。在构建了这两个载体后,使用LR反应将插入的DNA区段转移至另一载体中。这就导致所有的6个DNA区段插在单个目的载体中。本领域技术人员明了,图19
所示方法可以有多种变体并且这些变体包括在本发明范围内。
[0355] 使用本发明方法可以在一个步骤中连接的基因数目一般被可以使用的具有不同特异性的重组位点的数目所限制。而且,正如上述以及图18和19所示意的,可以选择重组位点以便在一个反应中连接核酸区段并且其在之后的反应中不参与重组。例如,再次使用TM
图18所给方法作为参考,可以使用attL和attR位点和LR Clonase 制备一系列有序的核
酸区段多联体。然后可以将这些多联体彼此连接,并任选地,使用其它LR反应和其它核酸分子连接。该方法可以有多种变体。
[0356] 类似地,可以使用单次使用的重组位点防止核酸区段(一旦掺入另一核酸分子中后)参与随后的重组反应。单次重组位点的使用使得可以从基本上无限数量的单个核酸区段制备产生核酸分子。
[0357] 一方面,本发明还提供使在单个群体中的核酸分子彼此联合或与其它分子或其它分子群联合,籍此产生组合分子的方法,从所述组合分子还可以获得独特和/或新的分子(例如杂合分子)或这些分子编码的蛋白质或肽。本发明还为筛选核酸分子群以鉴定具有特定活性或编码具有特定活性的表达产物(例如RNA或多肽)的那些核酸分子提供了方
法。因此,本发明方法可以用于将编码功能域(例如SH3、域、抗体结合位点、跨膜域、信号肽、酶活性位点)的核酸区段按各种组合彼此联合起来并可以用于鉴定这些方法产生的具有特定活性的产物。
[0358] 例如,可以通过以下方法鉴定含有转录调节序列的核酸区段。对基因组DNA文库的核酸分子进行修饰以便在其5’和3’端含有重组位点。然后将这些核酸分子插入目的载体中,以便它们位于选择标记的5’。由此,当载体中选择标记与激活其转录的核酸分子可操作连接时,选择标记将表达。因此,本发明还提供能够激活转录的分离的核酸分子。在许多情况下,可以使用本发明的方法和/或组合物,鉴定激活转录的这些核酸分子。
[0359] 而且,由于一些转录调节序列以组织特异性方式激活基因表达,因此可以使用本发明方法鉴定组织特异性转录调节序列。例如,当需要鉴定在特定类型细胞或组织中激活转录的转录调节序列时,可以在该类细胞或组织的细胞中实施上述筛选程序。类似地,当需要鉴定在特定时间、特定发育阶段、或特定孵育条件(例如特定温度)下细胞中激活转录的调节序列时,可以在适当时间、在特定发育阶段或在特定孵育条件下在细胞中实施上述筛选程序。一旦使用该方法鉴定出激活转录的序列后,可以测试该转录调节序列以确定其是否能够在其它细胞类型或在非鉴定和/或选择其的条件下激活转录。因此,一个一般方面,本发明提供构建和/或鉴定转录调节序列的方法、以及含有与编码表达产物的核酸区段可操作连接的通过本发明方法鉴定的转录调节序列的核酸分子、以及制备这些分子的方法。
[0360] 也可以使用类似于上述方法的方法鉴定复制起点。因此,本发明提供鉴定含有复制起点的核酸分子的方法、以及含有本发明方法鉴定的复制起点的核酸分子、和制备这些分子的方法。
[0361] 正如以下实施例1所述,因此,本发明尤其适合于构建组合文库。例如,还可以使用本发明方法“改组”编码蛋白质域和区的核酸分子以产生能够用于表达具有特定性质或活性的蛋白质的新核酸分子。在此实施方案中,将编码蛋白质部分的核酸区段接合起来并然后就一或多种性质或活性进行筛选。
[0362] 这些组合文库中的核酸区段可以按多种方法来制备,包括逆转录mRNA。可以使用诸如易错PCR等方法,产生这些文库的核酸区段的改变形式。在许多应用中,可能期望这些文库中的核酸区段编码蛋白质的亚部分。在此时,可以调整这些方法以产生其中大多数不含全长ORF的核酸区段群。例如,这可以通过剪切cDNA文库然后分离剪切的分子(例如使用聚丙烯酰胺或琼脂糖凝胶电泳)来实现。然后可以对长度在例如300-600核苷酸的片段
(潜在地编码100-200个氨基酸残基的片段)进行重组并使之插入载体中与转录调节序列
可操作地连接。然后可以筛选该组合文库的各成员多肽表达产物,以鉴定具有特定性质或活性的那些。
[0363] 本发明还提供使用来源于基因组DNA的外显子核酸制备组合文库的方法。外显子/内含子拼接边界是本领域已知的;因此,可以使用常规、本领域已知的方法无需过度实验,即可鉴定出外显子在基因组DNA中的定位。而且,可以使用相应于内含子/外显子拼接边界的引物产生相应于外显子序列的核酸分子。而且,然后可以将这些核酸分子彼此连接以产生包含相应于外显子序列的核酸分子的组合文库。例如,可以使用相应于内含子/外显子拼接边界的引物,通过PCR产生相应于外显子序列的核酸分子。然后可以使用连接酶或使用含有重组位点的引物扩增这些序列,将重组位点添加在所获PCR产物的末端。然后可以使用重组反应使这些PCR产物彼此连接并将其插入表达载体中。然后可以对所获组合文库进行筛选以便鉴定出例如编码具有特定功能或活性的多肽的核酸分子。而且,可以通过本文其它地方所述的方法通过拼接除去组合文库核酸分子表达产物(例如RNA或蛋白
质)中的重组位点。
[0364] 而且,用于产生组合文库的核酸分子、以及组合文库本身可以经突变产生与相应原始核酸分子平均至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%一致的核酸分子。类似地,用于产生组合文库的核酸分子可以经突变产生所编码多肽与相应原始核酸分子所编码多肽平均至少50%、至少55%、至少60%、至少65%、至少70%、至少
75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少
99%一致的核酸分子。
[0365] 一方面,本发明提供制备和鉴定生物学过程或生物学途径的显性/失活抑制基因(dominant/negative suppressors)的方法。例如,可以就显性/失活活性(dominant/
negative activity)筛选上述组合文库。一般,显性/失活活性导致生物学过程或生物学途径受到抑制。在大多数情况下,显性/失活抑制基因通过和细胞成分的相互作用表现其作用。例如,许多显性/失活抑制基因含有具有和一或多种细胞蛋白有关的结合活性的域但不具有和这些细胞蛋白相关的其它活性。尽管不欲受理论的束缚,但一旦在细胞中表达后显性/失活抑制基因一般和一或多个细胞配体相互作用并阻断由细胞蛋白造成的激活。
因此,认为显性/失活抑制基因干扰正常细胞过程的一个机制是隔绝配体。
[0366] 显性/失活活性可以由野生型蛋白质中的突变,例如改变单个氨基酸残基或缺失完整的蛋白区,来产生。例如,Qury等,J.Biol.Chem.275:2261-22614(2000)描述了缺失单个氨基酸残基可导致显性/失活活性的显性/失活受体。
[0367] 蛋白质片段也可以具有显性/失活活性。例如,McNelli s等,PlantCell8:1491-1503(1996),描述了组成型光形态发生蛋白1(COP1)的N端片段在阿布属
(Arabidopsi s)幼苗中表达时具有显性/失活活性。
[0368] 可以使用多种试验来筛选显性/失活活性。例如,Maemura等,J.Biol.Chem.274:3156-31570(1999)描述了称作内皮PAS域蛋白质1(EPAS1)的转录因子具有显性/失活活
性的缺失突变。具体地,Maemura等证明,此EPAS1突变在细胞中的表达抑制了对VEGF mRNA产生的诱导(一种与野生型EPAS1有关的活性)。
[0369] 本发明还提供鉴定编码具有特定功能或活性的多肽的核酸分子的方法、以及通过这些方法产生的核酸分子、这些核酸分子的表达产物、和含有这些核酸分子的宿主细胞。该功能或活性包括自细胞中分泌、酶活性、配体结合活性(即对金属例子的结合亲和力、细胞表面受体、核酸、可溶性蛋白质)、和使表达产物靶向亚细胞区室的能力(例如向线粒体、叶绿体、内质网等的定位)。一般可以对鉴定这些核酸分子的试验进行设计以便鉴定与该多肽有关的功能或活性。
[0370] 本发明还提供方法,以鉴定编码具有与其它多肽相互作用的区域的多肽的核酸分子。该方法的一个例子涉及使用双杂种分析。见例如Fields等,美国专利5,667,973,整个公开并入本文作为参考。更具体地,可以使用本发明方法制备编码融合蛋白的核酸分子,所述融合蛋白是在当与另一多肽(例如Gal4的C端域)紧邻时表现出特定功能的多肽(例如Gal4的N端域)和配体所寻找的蛋白质或蛋白质区域之间构成的。然后制备编码前句中提
及的其它多肽与组合文库所编码的蛋白质区段之间构成的融合物的其它核酸分子。由此,可以通过对两个多肽彼此紧邻所导致的相关活性进行筛选,鉴定组合文库中编码期望配体的核酸区段。
[0371] 也可以通过本发明方法产生噬菌体和细菌表面展示文库,以鉴定具有特定功能活性(例如对于特定配体的结合活性)的域。例如,Kim等,Appl.Environ.Microbiol.66:788-793(2000),描述了用于选择性地筛选羧甲基纤维素酶(CMCase)的改良变体的细菌表面展示方法。根据本发明,突变的CMCase基因文库可以通过DNA改组产生并与晶核蛋白(Inp)基因融合,这就导致产生展示在细菌细胞表面的融合蛋白。
[0372] 因此,本发明提供鉴定编码与其它蛋白质相互作用或具有特定功能活性的蛋白质或蛋白质区域的核酸区段的方法、以及通过这些方法鉴定的核酸区段、和这些核酸区段的多肽表达产物。一方面,本发明方法涉及制备组合文库和筛选这些文库以鉴定所编码表达产物与其它蛋白质相互作用或具有特定活性的核酸区段。在许多情况下,上述组合文库将编码融合蛋白。
[0373] 因此,本发明方法可以用于制备和鉴定编码具有特定性质、功能或活性的蛋白质和蛋白质变体的核酸分子。可易于测试的蛋白质性质的一个例子是溶解度。在产生不溶性GFP融合蛋白时GFP产生的荧光被淬灭。另外,当适当定位时,蛋白质相对少量氨基酸残基(如1、2、3、4个等)的改变可改变该蛋白质的溶解度。因此,表达GFP融合蛋白的组合文库可用于分离改变了溶解度的蛋白质或蛋白质变体。在一个具体例子中,设计表达与单个不溶性多肽融合的GFP的组合文库可用于分离编码该多肽可溶性变体的核酸分子。
[0374] 本发明的方法可用于构建含有两个或多个核酸区段的核酸分子,其中一个核酸区段的表达被其它核酸区段之一的表达产物所促进。例如,可以将一个核酸区段可操作地与T7聚合酶启动子连接,而另一核酸区段编码T7聚合酶。由此,与T7聚合酶启动子可操作连接的核酸区段将在T7聚合酶表达时获得表达。该系统的许多变体都属于本发明范围。例如,编码具有上述特定活性的成分的核酸可以位于插有一或多个该核酸区段的载体中。
[0375] 本发明方法还可以用于构建编码多亚基酶的一个以上亚基的核酸分子。而且,该酶各亚基的表达均可以受到相同或不同启动子的调节。当使用相同启动子驱动编码两个或多个蛋白质的核酸表达时,该mRNA可以含有例如一或多个内部核糖体进入位点(IRES),这些位点使得可以翻译位于5’大部分编码序列3’端的RNA所编码的蛋白质。
[0376] 本发明方法可以用于构建含有多种特定插入片段的核酸分子和细胞。因此,一方面,本发明方法可以用于制备含有多个编码特定产物的基因的核酸分子和细胞。这些方法允许产生具有特定特征的核酸分子和生物体。例如,正如以下实施例18的讨论,可以制备含有参与特定生学途径的所用基因的核酸。这些基因可以各与不同转录调节序列或一或多个拷贝的相同转录调节序列连接。此外,参与相同或不同生物学途径或生物学过程的基因可以可操作地与在存在相同或不同诱导剂时、在相同或不同的环境条件下(例如温度)、或在相同或不同细胞类型中利于转录的转录调节序列连接。而且,当基因编码参与途径或过程的多肽表达产物时,这些表达产物的一或多个可以表达为融合蛋白。此外,可以使用本发明方法构建含有编码参与一个以上不同生物学途径或生物学过程的基因产物的插入核酸区段的细胞。
[0377] 例如,还可以使用本发明方法修饰使用多位点重组系统构建的多核酸区段阵列中的一或多个特定核酸区段。使用图17B所示lux操纵子结构进行举例说明,在该实例
中每个基因的侧翼有具有不同重组特异性的attB位点,该分子中一或多个特定核酸区段
可以被另一核酸区段替代。例如,图17B所示lux操纵子结构中第二个编码区域luxD可
以通过含有该操纵子的载体和适当的质粒(例如pDONR质粒)反应而被置换,以致luxD
被含有attRx-ccdB-cat-attRy的元件置换,以产生其中luxD之前占据的座位成为具有
attLx-基因-attLy构型的进入克隆的受体位点的载体(即产出结构)。然后使此载体产物
和attLx-基因-attLy进入克隆反应,这将导致attRx-ccdB-cat-attRy盒被侧翼有attBx
和attBy的新基因置换。在相关实施方案中,具有attLx-基因-attLy一般构型的进入克
隆群可以和上述制备的产物载体反应,以便产生产出结构群,并对于群体中任何指定结构而言含有attRx-ccdB-cat-attRy的区段可以为侧翼有attBx和attBy的另一核酸区段置
换。因此,可以按平行方式排列指定核酸区段阵列的组成,而操纵子结构中的其它基因基本上不受这些操作的影响。
[0378] 而且,可以将编码参与一或多个特定生物学过程或途径的表达产物的核酸区段重组在支持物上。例如,可以将具有带重组位点的游离末端、并编码参与生物学途径或过程的三个酶之一的第一核酸分子附着在支持物上。然后将在至少一个末端具有能够和附着在支持物上的核酸分子重组的重组位点的核酸分子文库与支持物在利于重组的条件下接触,导致第二核酸分子与第一核酸分子附着。可以使用相似程序使第三核酸分子与第二核酸分子的游离末端附着。然后可以在生物学活性测试之前将这些所获核酸产物从支持物上释放出来,或者可以在核酸产物仍与支持物附着时进行这些分析。可以实施的分析的例子有用于检测是否存在特定的核酸分子的杂交分析、针对连接的核酸分子的多肽表达产物的测试、或针对连接的核酸分子的多肽表达产物所产生的终产物(例如紫杉醇、氨基酸、糖等)的分析。
[0379] 在以上相关的实施方案中,可以循环使核酸区段附着在上述支持物上和离开上述支持物。因此,在第二核酸分子和第一核酸分子重组后,可以例如使用第二重组反应释放该第二核酸分子。
[0380] 因此,一方面,本发明提供用于在核酸分子间实现重组的方法,其中该核酸分子中的至少一个与支持物结合。本发明还提供通过与支持物(例如固体和半固体支持物)上的核酸分子重组,鉴定参与相同生物学过程途径的核酸分子的方法,因此,本发明提供方法用于筛选核酸文库以鉴定编码参与特定生物学过程或途径的表达产物的核酸分子、并提供通过这些方法鉴定的核酸分子、从该核酸分子产生的表达产物、和通过这些生物学过程或途径产生的产物。
[0381] 词语“生物化学途径”和“生物学途径”是指生物体或细胞进行的任何系列相关生物化学反应。这些途径可以包括但不限于生物合成或生物降解途径、或能量产生或转化途径。
[0382] 本发明核酸分子可以用于多种应用中。例如,本发明方法可以用于制备含有操纵子的所有结构基因的末端载体。正如以下实施例18中讨论的,使用获自生物发光细菌
Vibrio fischert的编码luxCDABE基因的核酸,我们已重新构建了lux操纵子。
[0383] 而且,正如以上提及的,本发明核酸分子的表达产物,包括是相同或不同生物学途径或过程的一部分的多蛋白,可以制成融合蛋白。这些融合蛋白可以含有利于纯化(如6His标签)、使融合蛋白“靶向”特定的细胞区室(如信号肽)、利于溶解(如麦芽糖结合蛋白)、和/或改变克隆基因表达产物特性(例如抗体分子的Fc部分、绿色荧光蛋白(GFP)、
黄色荧光蛋白(YFP)或蓝色荧光蛋白(CFP))的氨基酸。
[0384] 本发明方法还可以用于制备当表达时产生具有一种以上性质、功能或活性的融合蛋白的核酸分子。该核酸分子的一个例子是编码含有目的多肽(假单孢杆菌属
(Pseudomonas)外毒素域II)和促进融合蛋白与目的细胞类型结合的多肽的三成分融合蛋
白的分子。假单孢杆菌属外毒素域II常赋予融合蛋白跨细胞膜定位的能力。因此,可以对表达产物进行设计,以便它定位在特定细胞类型中并跨越细胞膜。当例如目的多肽有细胞毒性(例如诱导细胞凋亡)时,此类表达产物将尤其有用。Pastan等在美国专利5,328,984中描述了编码类似于上述蛋白质的蛋白的核酸分子。
[0385] 而且,可以按一定方式产生表达产物以便促进其向细胞外的运输。例如,可以将这些表达产物表达为含有可导致蛋白质向细胞外运输的信号肽的融合蛋白。当待向外运输的蛋白质是与细胞外底物相互作用的酶时,应用向细胞外运输可能是理想的。
[0386] 一方面,本发明提供方法以制备编码参与相同或不同生物学途径或过程的一或多个表达产物的核酸分子、并提供含有这些核酸分子的细胞和这些生物途径或过程产生的产物。例如,本发明方法可以用于构建输出参与相同或不同生物学过程的多个蛋白的细胞。因此,一方面,本发明提供用于将多个核酸区段克隆在细胞中的系统,其中所述细胞输出这些核酸区段表达产物中的一或多个基因产物(例如2、3、4、5、7、10、12、15、20、30、50等)。而且,这些表达产物可以在细胞外基质(例如培养基、土壤、盐沼等)中发挥功能(例如催化化学反应)。
[0387] 当使用本发明方法制备和/或表达核酸分子时,这些核酸分子可以编码参与相同或不同过程(例如生物合成途径、降解途径)的表达产物。正如以下解释的,当需要向生物体提供广泛功能特性时,核酸分子可以编码赋予生物体相对无关性质的表达产物。
[0388] 而且,使用本发明方法可以制备编码导致期望产物的生物合成途径的所有或部分的核酸分子。而且,本发明方法可以用于产生编码具有独特性质的表达产物的核酸分子。因此,本发明还提供制备新的生物途径或过程终产物的方法。在此方面,本发明方法可以用于制备鉴别性的新化合物,包括治疗剂。因此,一方面,本发明还提供药物发现方法和通过这些方法鉴定的治疗剂。
[0389] 可以通过经本发明方法重新构建和/或改变的生物学途径或过程产生的终产物的例子包括化疗剂(例如抗生素、抗病毒剂、紫杉醇)、糖、核苷酸、氨基酸、脂、核糖体、和膜包被细胞器、以及所有这些的新形式。因此,本发明方法可以用于制备使细胞能够产生广泛多种天然化合物以及这些化合物的修饰形式的核酸。这些化合物的例子包括属于以下广泛类别的那些化合物:抗细菌治疗剂、抗病毒治疗剂、抗寄生虫治疗剂、抗真菌治疗剂、抗疟疾治疗剂、杀阿米巴治疗剂、和抗肿瘤治疗剂。
[0390] 由于微生物快速出现抗生素抗性,由此极为需要开发新的抗生素。而且,人们推测微生物对没有天然存在的等价物的新抗生素产生抗性的速度会较慢。因此,一方面,本发明提供制备新抗生素的方法、以及通过本发明方法产生的抗生素。
[0391] 可以使用本发明方法制备的生物的一个例子是产生新抗生素药剂的生物。Stassi等,Proc.Natl.Acad.Sci.USA95:7305-7309(1998)描述了由遗传工程红色糖多孢菌(Saccharopolyspora erythracea)细胞产生的乙基被取代的红霉素衍生物新产物。因此,本发明方法可以用于在细胞中插入编码产生新抗生素的蛋白质的遗传元件。本发明还包括通过这些方法产生的细胞、和使用这些细胞产生抗生素的方法、以及通过本发明方法制备的抗生素。
[0392] 所编码产物参与多种治疗剂的生物合成途径的核酸分子是本领域已知的。例如,Martin,Appl.Microbiol.Biotechnol.50(1):1-15(1998)中描述了参与β-内酰胺抗生素生物合成的基因和酶。因此,在特定方面,本发明包括制备这些抗生素和这些抗生素的改变形式的方法、以及这些抗生素本身。
[0393] 本发明还提供方法以制备抗细菌治疗剂、抗病毒治疗剂、抗寄生虫治疗剂、抗真菌治疗剂、抗疟疾治疗剂、杀阿米巴治疗剂、和抗肿瘤治疗剂和这些药剂的改变形式、并提供这些药剂本身。抗细菌治疗剂的例子包括青霉素、氨苄青霉素、阿莫西林、环青霉素、依匹西林、甲氧西林、夫西林、苯唑西林、氯唑西林、双氯西林、氟氯西林、羧苄青霉素、头孢氨苄、cepharadine、头孢羟氨苄(cefadoxil)、头孢克洛、头孢西丁、头孢噻肟、头孢唑肟(cefinenoxine)、头孢曲松、拉氧头孢、亚胺培南、克拉维酸盐、替卡西林、舒巴坦、红霉素、新霉素、庆大霉素、链霉素、灭滴灵、氯霉素、克林霉素、林可霉素、喹诺、利福平、磺胺药物、杆菌肽、多粘菌素B、万古霉素、多西环素、美他环素、米诺环素、四环素、两性霉素B、环丝氨酸、环丙沙星、诺氟沙星、异烟肼、乙胺丁醇、和萘啶酸、以及所有这些化合物的衍生物和改变形式。
[0394] 抗病毒治疗剂的例子包括无环鸟苷、5-碘脱氧尿苷、三氮唑核苷、曲氟尿苷、阿糖腺苷(vidirabine)、双脱氧胞苷、双脱氧肌苷、叠氮胸苷和9-[1,3-二羟-2-丙氧甲基]鸟嘌呤、以及所有这些化合物的衍生物和改变形式。
[0395] 抗寄生虫治疗剂的例子包括硫氯酚、乙胺嗪柠檬酸盐、甲苯咪唑、美曲膦酯、氯硝柳胺、硝咪唑、奥沙尼喹(和其它奎宁衍生物)、哌嗪枸橼酸盐、吡喹酮、喹嘧啶双羟萘酸盐和噻苯哒唑、以及所有这些化合物的衍生物和改变形式。
[0396] 抗真菌治疗剂的例子包括两性霉素B、克霉唑、氯苯甲氧咪唑硝酸盐、氟胞嘧啶、灰黄霉素、酮康唑和双氯苯咪唑、以及所有这些化合物的衍生物和改变形式。抗真菌化合物也包括棘孢曲霉素A和papulocandin B。(见例如Komiyama等,Biol.Pharm.Bull.(1998)21(10):1013-1019)。)
[0397] 抗疟疾治疗剂的例子包括盐酸氯喹、磷酸伯氨喹、息疟定、硫酸奎宁、和盐酸奎纳克林、以及所有这些化合物的衍生物和改变形式。
[0398] 抗阿米巴治疗剂的例子包括盐酸脱氢吐根碱、二氢氯化物、双碘喹啉、和硫酸paramomycin、以及所有这些化合物的衍生物和改变形式。
[0399] 抗肿瘤治疗剂的例子包括氨鲁米特、咪唑硫嘌呤、硫酸争光霉素、白消安、卡氮芥、苯丁酸氮芥、顺氯氨铂、环磷酰胺、环孢霉素、cytarabidine、达卡巴嗪、放线菌素、柔红霉素、阿霉素、紫杉醇、表鬼臼毒素吡喃葡糖苷、氟尿嘧啶、α干扰素、环已亚硝脲、巯基嘌呤、甲氨蝶呤、米托坦、盐酸甲苄肼、硫鸟嘌呤、硫酸长春碱和硫酸长春新碱、以及这些化合物的衍生物和改变形式。
[0400] 其它抗微生物药剂包括肽。Hancock等,美国专利6,040,435和Hancock等,Proc.Natl.Acad.Sci.USA97:8856-8861(2000)中公开了抗微生物肽的例子。
[0401] 使用本发明方法还可以制备编码多蛋白复合物的一个以上亚基的核酸分子。这些多蛋白复合物的例子包括剪接体、核糖体、人26S蛋白酶体、和酵母RNA聚合酶III。(见例如Saito等,Gene203(2):241-250(1997);Flores等,Proc.Natl.Acad.Sci.USA96(14):
7815-7820(1999)。)
[0402] 本发明方法还可以用于部分合成非天然存在产物、以及这些产物的变体(例如新的变体)。例如,可以提供表达催化特定反应的酶的微生物和这些生物正常不产生的前体物。当这些前体充当微生物所表达的酶的底物时,可以产生新的化合物。此类“饲喂”过程在过去已被用于制备新抗生素。一方面,此类饲喂可以联合表达上述组合文库所编码的酶的微生物一起使用。
[0403] 本发明方法可以用于(1)向细胞引入新的途径或(2)改变现有细胞途径,以便例如在产物合成过程中出现一或多个其它的催化步骤(例如2、3、4、5、7、10等)。本发明此应用的一个例子涉及对细胞天然产生的蛋白质进行修饰。在此实例中,将编码改变
蛋白的一或多个催化步骤(例如编码参与翻译后修饰反应的酶)的基因导入细胞中。例
如,可以将编码参与ADP-核糖基化、糖基化、唾液酸化、乙酰化、泛素化、苏氨酸转化为D丙氨酸、生物素化、酰基化、酰胺化、甲酰化、羧化、形成GPI锚、羟基化、甲基化、豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊二烯化、外消旋作用、selenoylation、硫酸化、精氨酰化的酶的基因插入细胞中。以下文献讨论了蛋白的翻译后修饰:蛋白质结构和分子性质
(Proteins-Structure and Molecular Propertied),第2版,T.E.Creighton,W.H.Freeman and Compay,纽约,1993;Wold,F.,蛋白质翻译后修饰:观点和性质,《蛋白质的翻译后共价修饰》(Post-translational Covalent Modification of Proteins)第1-12页,
B.C.Johnson编,Academic Press,纽约,1983;Seifter等,“对蛋白质修饰和非蛋白质辅因子的分子”,Meth.Enzymol.(1990)182:626-646;和Rattan等,“蛋白质合成:翻译后修饰和老化”,Ann.NYAcad.Sci.(1992)663:48-62。
[0404] 本发明方法可以用于例如制备含有编码参与信号转导途径的蛋白质的核酸分子的细胞。而且,这些细胞可以用于筛选调节细胞信号转导的药剂。例如,可以使用本发明方法制备表达响应肿瘤坏死因子(TNF)所必需的所有成分的细胞。然后可以使用这些细胞筛选诱导TNF介导的反应(TNF激动剂)或阻断TNF介导的反应(TNF拮抗剂)的药剂。因此,
用于制备可以用于筛选细胞配体的激动剂和拮抗剂的细胞的方法、以及通过这些方法产生的细胞,都包括在本发明范围内。使用本发明细胞鉴定细胞配体的激动剂和拮抗剂的方法、以及通过本发明方法鉴定的激动剂和拮抗剂也包括在本发明范围内。
[0405] 正如以上提及的,本发明方法还可以用于制备产生养料如糖和氨基酸的核酸和细胞。糖和氨基酸、以及其它源可以用于多种目的。例如,糖和氨基酸可以制备用于培养微生物、哺乳动物细胞和植物细胞的培养基的成分。而且,可以将这些化合物加入人和家畜的食品中。糖和氨基酸用途的一个特殊例子是在配制婴儿营养配方中的使用。(见例如,Highman等,美国专利6,120,814)。因此,本发明还提供使用通过本发明方法产生的碳源制备的食品(例如婴儿营养配方)。
[0406] 可以使用本发明所制备的细胞产生的碳源包括糖(例如葡萄糖、果糖、乳糖、糖蜜、纤维素水解物、粗糖水解物、和淀粉水解物)、有机酸(例如丙酮酸、乙酸、反丁烯二酸、苹果酸和乳酸)、醇(丙三醇、1,3-丙二醇、和乙醇)、脂、脂肪酸、核苷酸、核苷、和氨基酸。(见例如Skraly等,Appl.Environ.Microbiol.64:98-105(1998)。)
[0407] 可以使用本发明制备的生物的一个例子是获得产生乙醇的能力的生物。例如,Deng等,Appl.Environ.Microbiol.65:523-528(1999)描述了经改造产生乙醇的蓝细菌。
因此,本发明方法可以用于将编码参与产生乙醇的蛋白质的遗传元件插入细胞中。本发明还包括通过这些方法制备的细胞和使用这些细胞产生乙醇的方法。
[0408] 可以使用本发明制备的生物的另一例子是获得产生聚(3-羟基链烷羧酸酯)或增加量的聚(3-羟基链烷羧酸酯)能力的生物。聚(3-羟基链烷羧酸酯)是当从细胞中提
取出时具有塑胶样性质的化合物。(见例如Madison等,Microbiol.Molec.Biol.Rev.63:
21-53(1999)。)因此,本发明方法可以用于将编码参与产生聚(3-羟基链烷羧酸酯)的蛋
白质的遗传元件插入细胞中。本发明还包括通过这些方法产生的细胞和使用这些细胞制备聚(3-羟基链烷羧酸酯)的方法、以及聚(3-羟基链烷羧酸酯)衍生物和从聚(3-羟基链
烷羧酸酯)形成的化合物。
[0409] 可以使用本发明方法所制备的细胞产生的氨基酸包括苯丙氨酸、色氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸、谷氨酰胺、天冬酰胺、精氨酸、赖氨酸、组氨酸、天冬氨酸、谷氨酸、丙氨酸、脯氨酸丝氨酸、苏氨酸、甲硫氨酸、半胱氨酸、和甘氨酸。相当多生物的参与氨基酸和氨基酸前体生物合成的基因和酶是本领域已知的。(见例如G.N.Cohen,“赖氨酸、甲硫氨酸和苏氨酸的共同途径”,第147-171页,《氨基酸:生物合成和遗传调节》(Amino Acids:Biosynthesis andGenetic Regulation),K.M.Herrmann 和 R.L.Somerville 编,Addison-Welesley Publishing Co.,Inc.,Reading,Mass.(1983)。)
[0410] 除了改变细胞以产生新化合物外,本发明方法还可以用于改造细胞以便它们超量产生或减少产生细胞正常代谢的产物。例如,Donnelly等,美国专利5,770,435描述了产生增加量的琥珀酸的大肠杆菌突变株。例如,可以利用本发明方法构建编码琥珀酸生物合成途径中的酶的核酸分子。而且,可以在转录水平上调节这些酶中一或多个的表达。因此,将这些核酸分子导入上述大肠杆菌细胞中将有效地扩增琥珀酸生物合成途径中的一或多个基因。而且,可以使这些基因中的一或多个与诱导型启动子(例如lacI启动子)可操作
地连接,以便琥珀酸仅在存在诱导信号(例如IPTG)时才增加。
[0411] 本发明方法还可以用于制备产生可用于制造过程的成分和前体的核酸和细胞。这些成分的例子包括塑料、塑料样化合物(例如聚酮化合物)、油皂、肥料、纸、合成橡胶、染料、油墨等。本发明还包括通过本发明方法和细胞产生的成分和前体。
[0412] 类似地,本发明方法制备的核酸分子还可以用于下调例如一或多个内源性基因的表达。一个例子是使本发明方法所制备的核酸插入片段转录产生反义RNA。再有,可以将编码反义RNA的核酸分子可操作地与可调节启动子连接。
[0413] 因此,本发明还包括用于制备可超量产生或减少产生细胞正常代谢产物的细胞的方法,以及通过这些方法制备的细胞。
[0414] 正如以上提及的,本发明方法制备的核酸分子可以用于改变生物的生理特性,以便该生物具有特定的性质。例如,使用本发明载体可以将缺少产生具有特定糖基化模式的重组或天然蛋白质所必需的特定酶的细胞导入细胞中。蛋白质的糖基化模式在一定程度上是细胞类型和种类特异的(见例如Jarvis等,Curr.Opin.Biotechnol.9:528-533(1998)。)因此,一方面,本发明提供方法以制备表现出改变的糖基化途径的细胞、并提供通过这些方法制备的细胞、和这些细胞产生的糖基化化合物。该方法一般被称作“糖基化工程”。Stanley,Glycobiology2:99-107(1992)。
[0415] 例如,可以使用本发明方法修饰不能糖基化蛋白质的细菌细胞,以产生可糖基化蛋白质的酶。这些酶的例子包括N-乙酰葡糖胺基转移酶III和V、β-1,4-半乳糖基转移酶、α-2,6-唾液酸转移酶、α-2,3-唾液酸转移酶、α-1,3-岩藻糖基转移酶III和VI、和α-1,2-甘露糖基转移酶。
[0416] 另一方面,本发明提供方法以制备表现出改变的代谢性质的细胞,此改变的代谢性质将导致这些细胞合成的化合物的量增加,本发明还提供通过这些方法制备的细胞和这些细胞所产生的产物。该方法的一个例子是制备产生增加量的生物学途径前体的细胞。该方法在此被称作代谢引导或漏过(metabolic channeling or funneling)。例如,当需要制备产生增加量的丝氨酸的细胞时,可以将编码3-磷酸甘油酸产生途径中的酶的核酸分子插入细胞中。任选地,还可以将编码参与将3-磷酸甘油酸为丝氨酸的酶的核酸分子插入细胞中。在构建含有细胞内含量增加的前体库化合物的细胞时,有用的考虑参数包括该特定途径中设定的速度限制和途径通量。(见例如Kholodenko等,Biotechnol.Bioeng.59:
239-247(1997)。)
[0417] 聚酮化合物是通过一系列缩合和随后的修饰从2-碳单位合成的多样化合物大家族。许多种生物,包括真菌和许多细菌,尤其是放射菌类产生聚酮化合物。存在
具有不同活性的多种聚酮化合物结构和包含聚酮化合物的多种化合物。(见例如PCT
公开 文本WO93/13663;WO95/08548;WO96/40968;97/02358;和98/27203;美 国专 利
4,874,748;5,063,155;5,098,837;5,149,639;5,672,491;和5,712,146;和Fu等,1994,Biochemistry33:9321-9326;McDaniel等,1993,Science262:1546-1550;和Rohr,1995,Angew.Chem.Int.Ed.Engl.34:881-888,所有均并入本文作为参考)。
[0418] 聚酮合成酶(PKS)使用共同的机制策略组装各种结构的天然产物,所述策略依赖于在构建最终反应产物的一系列脱羧化缩合反应中经半胱氨酸残基锚定聚酮化合物。PKS一般在类似脂肪酸生物合成的生物合成过程中催化从简单前体如丙酰CoA和甲基丙二酰CoA组装复杂的天然产物。聚酮化合物的例子包括callystatin A、安三烯菌素A、放线菌紫素、纳巴霉素、酒霉素、和苦霉素。
[0419] 一方面,本发明提供制备编码一或多个PKS的核酸分子的方法、以及含有这些核酸分子的细胞和所获的聚酮化合物产物。本发明还提供使用组合文库制备新PKS的方法、和由这些新PKS产生的产物(例如新的大环内酯抗生素),以及制备这些新PKS产物的方法。
[0420] 本发明方法还可以用于构建对于降低各种化学剂毒性有用的微生物株。这些化学剂包括基于石油的污染物(例如氯化和非氯化的脂肪族化合物(例如C3-C36)、氯化或未氯化的芳香族化合物(例如C9-C22)、原油、精炼油、燃油(例如2、4、6号燃油)、柴油、汽油、液力油、油、苯、甲苯、乙苯、二甲苯、三甲基苯、萘、蒽、二氢苊、苊、苯并(a)蒽、苯并(a)芘、苯并(b)荧蒽、苯并(g,h,i)北、苯并(k)荧蒽、芘、二氯甲烷、1,1-二氯乙烷、氯仿、1,2-二氯丙烷、二溴氯甲烷、1,1,2-三氯乙烷、2-氯乙基乙烯基醚、四氯乙烯(PCE)、氯苯、1,2-二氯乙烷、1,1,1-三氯乙烷、溴二氯甲烷、反-1,3-二氯丙烯、顺-1,3-二氯丙烯、溴仿、氯甲烷、溴甲烷、乙烯基氯、氯乙烷、1,1-二氯乙烷、反-1,2-二氯乙烷、三氯乙烯(TCE)、二氯苯、顺-1,2-二氯乙烷、二溴甲烷、1,4-二氯丁烷、1,2,3-三氯丙烷、溴氯甲烷、2,2-二氯丙烷、1,2-二溴乙烷、1,3-二氯丙烷、溴苯、氯甲苯、三氯苯、反-1,4-二氯-2-丁烯和丁基苯)。
[0421] 可以使用本发明方法制备的生物的一个例子是降解甲苯的生物。Panke等,Appl.Environ.Microbiol.64:748-751(1998)描述了将甲苯以及几种甲苯衍生物转化为苯甲酸盐的恶臭假单孢菌(Pseudomona putida)菌株。因此,本发明方法可以用于在细胞中插入编码将甲苯及其衍生物转化为低毒性化合物的蛋白质的遗传元件。本发明还包括通过这些方法制备的细胞和使用这些细胞将甲苯及几种甲苯衍生物转化为低毒性化合物的方法。
[0422] 本发明方法还可以用于制备适合中和非石油剂如重金属离子(如汞、、镉、、金、亚碲酸盐、亚硒酸盐和)的毒性的生物。例如可以中和汞毒性的方法包括还原汞离子以产生金属汞然后进行挥发。细菌中参与脱毒的基因描述在Miller,“Hg(II)和有机汞制剂的细菌脱毒”,Essays Biochem.34:17-30(1999)。
[0423] 在类球红细菌(Rhodobacter sphaeroide)菌株中鉴定到重金属离子脱毒系统的另一例子(见O’Gara等,Appl.Environ.Microbiol.63(12):4713-4720(1997))。该菌株的亚碲酸盐抗性似乎是由两个座位赋予的。第一个遗传座位含有4个基因;其中两个基因(即trgA和trgB)当插入另一细菌时可赋予增强的亚碲酸盐抗性。该座位中另一基因cysK(半
胱氨酸合成酶)的破坏导致亚碲酸盐抗性降低。第二个遗传座位含有telA基因。telA的
失活导致与野生型菌株相比亚碲酸盐抗性显著降低。
[0424] 能够中和化学剂毒性的微生物描述在例如Perriello,美国专利6,110,372中。适用于生物除污的微生物包括假单胞菌科(Pseudomonadaceae)、放线菌
纲(Actinomycetes)、微 球 菌科 (Micrococcaceae)、科(Vibrionaceae)、根 瘤 菌科
(Rhizobiaceae)、噬细胞菌科(Cytophagaceae)、和棒状杆菌科(Corynebacterium)。在
使用本发明方法进行修饰后适用于生物除污应用的微生物的具体例子包括红苍白假单胞
菌(Pseudomonas rubrisubalbicans)、铜绿假单胞菌(Pseudomonas aeruginosa)、争论
贪噬菌(Variovoraxparadoxus)、星状诺卡氏菌(Nocardia asteroides)、耐放射异常球
菌(Deinococcusradiodurans)、限定诺卡氏菌(Nocardiarestricata)、产吲哚金黄杆菌
(Chryseobacterium indologenes)、食酸丛毛单胞菌(Comamonas acidovorans)、德氏食酸菌(Acidovoraxdelafieldii)、胭脂红分枝杆菌(Rhodococcus rhodochrous)、红串红球菌(Rhodococcus erytlropolis)、酯香金杆菌(Aureobacteriumesteroaromaticum)、天
金杆菌(Aureobacterium saperdae)、易变微球菌(Micrococcus varians)、克氏微球
菌(Micrococcuskristinae)、豚鼠气单胞菌(Aeromonas caviae)、嗜麦芽糖寡养单胞菌
(Stenotrophomonas maltophilia)、嗜温鞘氨醇杆菌(Sphingobaterium thalpophium)、Clavibacter michiganense、木糖氧化产碱菌(Alcaligenes xylosoxydans)、水生棒杆菌B(Corynebacterium aquaticum B)和约氏噬纤维菌(Cytophagajohnsonae)。
[0425] 适于生物除污的生物还包括植物。例如,Meagher等在美国专利5,965,796中描述了表达金属离子抗性蛋白并减少金属离子如铜、汞、金、镉、铅和银的离子的转基因植物。
而且,可以将编码植物螯合肽的基因导入植物中以增加植物螯合肽的合成。植物螯合肽是谷胱甘肽衍生物,其通过隔离来中和金属离子的毒性。Corbett,“植物螯合肽的生物合成及重金属脱毒功能”,Curr.Opin.Plant.biol.3(3):211-216(2000)中讨论了许多植物种类中参与植物螯合肽合成的基因。
[0426] 在本发明方法修饰后适于生物除污应用的具体植物包括家独行菜(Lepidiumsativum)、芥菜(Brassica juncea)、甘蓝(Brassicaoleracea)、芜菁(Brassica rapa)、Acena sativa、普通小麦(Triticumaestivum)、向日葵(Helianthus annuus)、细纪翦股颖(Colonialbentgrass)、草地早熟禾、宿根黑麦草(Perennial ryegrass)、匍匐翦股颖(Creeping bentgrass)、绊根草(Bermudagrass)、野牛草、蜈蚣草、柳枝稷、结缕草、coastal panicgrass、菠菜、高粱烟草和玉米。制备转基因植物的方法是本领域已知的,并正如以上提及的,描述在例如Meagher等,美国专利5,965,796。
[0427] 本发明方法还可以用于制备具有各种特性并含有相当大量的插入基因的生物。正如以上提及的,本发明方法可以用于将几乎无限制数量的核酸区段插入细胞中。例如,在一个具体实施方案中,本发明提供用于制备表达杀虫蛋白(例如苏云金杆菌(Bacillus thurginiensis)的杀虫蛋白)的细胞的方法。(见例如Schnepf等,Microbiol.Molec.
Biol.Rev.62:775-806(1998)。)因此,本发明方法可以用于将编码杀虫蛋白的遗传元件插入细胞中。本发明还包括通过这些方法制备的细胞和使用这些细胞制备杀虫蛋白的方法。
本发明还包括使用本发明制备的细胞(例如细菌或植物细胞)和杀虫蛋白控制昆虫群体的
方法。在某些实施方案中,本发明方法制备的在本发明方法中使用的细胞是植物细胞。
[0428] 因此,一方面,本发明方法可以用于制备含有编码一或多个非蛋白表达产物(例如功能性RNA如tRNA或核酶)的一或多个ORF和/或核酸区段的核酸分子。在本发明大多数实施方案中,编码一或多个非蛋白表达产物的ORF和/或核酸区段的数目一般在约1
至约300之间变动(例如1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、
70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300等)。含有编码一或多个非蛋白表达产物的一或多个ORF和/或核酸区段的核酸分子,对于改变生物使之具有例如以上所列举的特性是尤其有用的。
[0429] 根据多种因素(包括存在的功能性区段数目),本发明核酸分子的大小将在尺寸上有相当大的变化,但一般地,将在约0.5kb至约300kb之间(例如约0.5kb、约1kb、约2kb、约3kb、约4kb、约5kb、约7kb、约10kb、约12kb、约15kb、约20kb、约40kb、约60kb、约80kb、约100kb、约200kb、约300kb等)。
[0430] 在一个具体实施方案中,本发明还提供作为基因治疗方案的一部分将本发明核酸分子导入动物(例如人)和动物细胞(例如人细胞)中的方法。基因治疗是指通过给患者施用表达的或可表达的核酸分子进行的治疗。在本发明许多实施方案中,本发明核酸分子将编码一或多个介导至少一种治疗效果的蛋白质。因此,本发明提供用于基因治疗的核酸分子和方法。
[0431] 本发明核酸分子可以用于制备设计以替换位于细胞基因组中的基因、缺失这些基因、或插入异源基因或基因群的基因治疗载体。当编码核酸分子起到缺失或替换基因的功能时,被缺失或替换的基因或多个基因可以导致“正常表型”或异常表型的表达。异常表型的一个例子是囊性纤维化疾病。而且,可以将基因治疗载体稳定地维持(例如通过同源重组整合在细胞核酸中)或非稳定地维持在细胞中。
[0432] 而且,本发明核酸分子可以用于抑制“异常”表型、或弥补或补充由于内源性基因表达导致的“正常”表型。设计用于抑制异常表型的本发明核酸分子的一个例子是使该核酸分子的表达产物具有显性/失活活性。设计用于补充正常表型的本发明核酸分子的一个例子是该核酸分子的导入有效地引起位于细胞中的基因的扩增。
[0433] 而且,本发明核酸分子可以用于将所编码表达产物参与了特定生物学途径(例如氨基酸如赖氨酸、苏氨酸的生物合成,等)的所有步骤、或参与这些途径的一或多个步骤的核酸区段插入细胞中。事实上,可以对这些核酸分子进行设计以扩增编码这些途径中的表达产物的基因、将所编码表达产物参与细胞中正常不存在的途径的基因插入细胞中、或替换参与细胞中特定生物学途径的一或多个步骤的一或多个基因。因此,本发明基因治疗载体可以含有导致产生一或多个产物(例如1、2、3、4、5、8、10、15等)的核酸分子。这些载体,尤其是导致产生一个以上产物的那些载体,对于治疗由于一个以上基因的表达或不表达造成的疾病和/或病症、或对于治疗一种以上的疾病和/或病症将是尤其有用的。
[0434] 因此,在相关方面,本发明提供表达一或多个表达产物(例如1或多个融合蛋白)的基因治疗载体、制备这些载体的方法、使用本发明载体进行基因治疗的方法、该载体的表达产物(例如编码的RNA和/或蛋白质)、和含有本发明载体的宿主细胞。
[0435] 对于基因治疗方法的一般综述,参见Goldspiel等1993,ClinicalPharmacy12:488-505;Wu 和 Wu,1991,Biotherapy3:87-95;Tolstoshev,1993,Ann.Rev.Pharmacol.Toxicol.32:573-596;Mulligan,1993,Science260:926-932; 和 Morgan 和 Anderson,
1993,Ann.Rev.Biochem.62:191-217;May,1993,TIBTECH11(5):155-215)。可以使用的重组DNA技术领域的通常已知方法描述于Ausubel等(编),1993,当代分子生物学实验方案
(CurrentProtocols in Molecular Biology),John Wiley&Sons,NY;和Kriegler,1990,基因转移和表达,实验室手册(Gene Transfer andExpression,A Laboratory Manual),Stockton press,NY。
[0436] 将本发明核酸分子递送至患者体内可以是直接的,在此情况下患者直接暴露于该核酸或携带核酸的载体,也可以是间接的,在此情况下首先在体外用核酸转化细胞、然后将该细胞移植至患者体内。这两种方法分别称作体内或离体基因治疗。
[0437] 在一个具体实施方案中,当本发明核酸分子可以在体内表达产生一或多个表达产物时,体内直接施用本发明核酸分子。这可以通过本领域许多已知的方法来实现,例如通过构建表达载体并进行施用以便它们进入细胞内(例如通过施用缺陷性或减毒逆转录病毒载体或其它病毒载体进行感染(见美国专利4,980,286)、通过直接注射裸DNA、通过用脂质或细胞受体或转染试剂包被、包在脂质体、微粒、或微囊中、或通过将它们与已知进入细胞核的肽连接然后施用、通过将它们与可经历受体介导的内吞作用的配体连接然后施用(见例如Wu和Wu,1987,J.Biol.Chem.262:4429-4432)(这可以用于靶向特异表达该受体的细胞类型),等)。在另一实施方案中,可以通过靶向特异受体,使本发明核酸分子体内定向于细胞特异的摄取和表达(见例如,日期为1992年4月16日的PCT公开文本WO92/06180(Wu
等);日期为1992年12月23日的WO92/22635(Wilson等);日期为1992年11月26日的
WO92/20316(Findeis等);日期为1993年6月22日的WO93/14188(Clarke等);日期为
1993年10月14日的WO93/20221(Young))。或者,可以通过同源重组,将本发明核酸分子导入细胞内并整合在宿主细胞DNA中进行表达(Koller和Smithies,1989,Proc.Natl.Acad.Sci.USA86:8932-8935;Zijlstra等,1989,Nature342:435-438)。图21C和22B中显示了适于该应用的核酸结构的例子。
[0438] 在另一具体实施方案中,使用含有编码抗体或本发明其它抗原结合蛋白的核酸序列。例如,可以使用逆转录病毒载体(见Miller等,1993,Meth.Enzymol.217;581-599)。这些逆转录病毒被用于缺失对于病毒基因组的包装和向宿主细胞DNA的整合不必要的逆转录病毒序列。将编码用于基因治疗的抗体的核酸序列克隆在有利于将基因递送至患者体内的一或多个载体上。关于逆转录载体的更多细节可以参见Boesen等,1994,Biotherapy6:
291-302,该文献描述了使用逆转录病毒载体将mdr1基因递送至造血干细胞中以使这些
干细胞对化疗具有更大的抗性。描述逆转录病毒载体在基因治疗中的用途的其它文献
有:Clowes 等,1994,J.Clin.Invest.93:644-651;Kiem 等,1994,Blood83:1467-1473;
Salmons和Gunzberg,1993,Human GeneTherapy4:129-141;和Grossman和Wilson,1993,Curr.Opin.inGenetics and Devel.3:110-114。
[0439] 腺病毒是能够用于基因治疗的其它病毒载体。腺病毒是尤其具有吸引力的将基因递送至呼吸道上皮细胞的运载工具,该载体的用途包括在本发明的范围内。腺病毒自然感染呼吸道上皮细胞,并在此引起轻微的疾病。基于腺病毒的递送系统的其它靶标有肝、中枢神经系统、内皮细胞、和肌肉。腺病毒的优点是能够感染非分裂细胞。Kozarsy和Wilson,1993,当前遗传和发育观点(Current Opinion inGenetics and Development)3:499-503给出了基于腺病毒的基因治疗的综述。Bout等,1994,Human Gene Therapy5:3-10展示了腺病毒载体在向恒河猴呼吸道上皮细胞转移基因中的用途。腺病毒在基因治疗中的用途的其它例子可以参见Rosenfeld等,1991,Science252:431-434;Rosenfeld等,1992,Cell68:
143-155;Mastrangeli等,1993,J.Clin.Invest.91:225-234;PCT公开文本号WO94/12649和WO96/17053;美国专利5,998,205;和Wang等,1995,Gene Therapy2:775-783,所有这些的公开均完整地并入本文作为参考。在一个实施方案中,使用腺病毒载体。
[0440] 腺相关病毒(AAV)和疱疹病毒,以及从这些病毒制备的载体,也已被提议用于基因治疗(Walsh等,1993,Proc.Soc.Exp.Biol.Med.204:289-300;美国专利5,436,146;Wagstaff等,Gene Ther.5:1566-70(1998))。疱疹病毒载体对于期望在神经细胞中进行基因表达的应用是尤其有用的。
[0441] 基因治疗的另一个方法涉及通过例如电穿孔、脂转染、磷酸介导的转染、或病毒感染等方法在组织培养中将基因转移至细胞。通常,转移方法包括向细胞转移选择标记。然后对细胞进行选择以分离摄取并正在表达该转移的基因的细胞。然后将这些细胞递送给患者。
[0442] 在此实施方案中,将核酸导入细胞中然后体内施用所获重组细胞。该导入可以通过本领域已知的任何方法来进行,包括但不限于转染、电穿孔、显微注射、含有核酸序列的病毒或噬菌体载体感染、细胞融合、染色体介导的基因转移、微细胞介导的基因转移、原生质球融合,等。用于将外源基因导入细胞中的许多技术是本领域已知的(见例如Loeffler和Behr,1993,Meth.Enzymol.217:599-618;Cohen等,1993,Meth.Enzymol.217:618-644;Cline,1985,Pharmac.Ther.29:69-92),并可以根据本发明进行使用,只要不破坏受体细胞的必要发育和生理功能即可。该技术应当可以使核酸稳定转移至细胞中,以便核酸在细胞中是可表达的,并任选地可以被其子代细胞遗传和表达。
[0443] 可以通过本领域各种已知方法将所获重组细胞递送至患者体内。一般可以静脉内施用重组血细胞(例如造血干细胞或祖先细胞)。预计使用的细胞数量取决于期望的效果、患者的状态等,并可以由本领域技术人员确定。
[0444] 为了基因治疗目的可以导入核酸的细胞包括任何期望的可获得细胞类型,并包括但不限于上皮细胞、内皮细胞、角质细胞、成纤维细胞、肌细胞、肝细胞;血液细胞如T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜酸性粒细胞、巨核细胞、粒细胞;各种干细胞或祖先细胞,尤其是造血干细胞或祖先细胞(例如从骨髓、脐带血、外周血、胎儿肝脏获得的造血干细胞或祖先细胞)。
[0445] 在某一实施方案中,用于基因治疗的细胞是患者的自体细胞。
[0446] 在使用重组细胞进行基因治疗的实施方案中,将编码抗体或其它抗原结合蛋白的核酸序列导入细胞中,以便它们可以被细胞或其后代表达,然后体内施用该重组细胞以达到治疗效果。在一个具体实施方案中,可以体外分离并维持的任何干细胞和/或祖先细胞都可以潜在地用于根据本发明的实施方案中(见例如PCT公开文本WO94/08598(1994年4 月28 日 );Stemple 和 Anderson,1992,Cell71:973-985;Rheinwald,1980,Meth.Cell Biol.21A:229;和Pittelkow和Scott,1986,Mayo Clinic Proc.61:771)。
[0447] 在一个具体实施方案中,为了基因治疗目的导入的核酸分子包含与编码区可操作连接的诱导启动子,以致可以通过控制适当转录诱导物的存在或不存在,控制该核酸分子的表达。
[0448] 本发明核酸分子还可以用于制备转基因生物(例如动物和植物)。任何物种的动物,包括但不限于小鼠、大鼠、兔、仓鼠、豚鼠、猪、微型猪(micropig)、山羊、绵羊、母牛和非人灵长类动物(例如狒狒、猴、和黑猩猩),均可以用于制备转基因动物。而且,任何种类的植物,包括但不限于家独行菜、芥菜、甘蓝、芜菁、Acena sativa、普通小麦、向日葵、细纪翦股颖(Colonial bentgrass)、草地早熟禾、宿根黑麦草(Perennial ryegrass)、匍匐翦股颖(Creeping bentgrass)、绊根草(Bermudagrass)、野牛草、蜈蚣草、柳枝稷、结缕草、coastalpanicgrass、菠菜、高粱、烟草和玉米,均可以用于制备转基因植物。
[0449] 本领域已知的任何技术均可以用于将本发明核酸分子引入生物体中以产生转基因生物的起始系。这些技术包括,但不限于,原核显微注射(Paterson等,Appl.
Microbiol.Biotechnol.40:691-698(1994);Carver 等,Biotechnology(NY)11:
1263-1270(1993);Wright等,Biotechnology(NY)9:830-834(1991);和Hoppe等,美国专利4,873,191(1981));逆转录病毒介导的向生殖细胞系(Vander Putten等,Proc.Natl.
Acad.Sci.USA82:6148-6152(1985))、胚泡和胚胎的基因转移;向胚胎干细胞的基因打靶(Thompson等,Cell56:313-321(1989));细胞或胚胎的电穿孔(Lo,Mol.Cell Biol.3:
1803-1814(1983));使用基因枪导入本发明多核苷酸(见例如Ulmer等,Science259:
1745(1993);将核酸结构导入胚胎多能干细胞中并将此干细胞转移回胚泡中;和精子介导的基因转移(Lavitran等,Cell57:717-723(1989);等。对于这些技术的综述,见Gordon等,“转基因动物”,Intl.Rev.Cytol.115:171-229(1989),该文献完整地并入本文作为参考。而且,本段落中引用的所有这些文献的内容均完整地并入本文。也见美国专利
5,464,764(Capecchi等,正-负筛选方法和载体);美国专利5,631,153(Capecchi等,含有预先确定的基因组修饰的细胞和非人生物以及制备它们的正-负筛选方法和载体);美国
专利4,736,866(Leder等,转基因非人动物);和美国专利4,873,191(Wagner等,受精卵的遗传转化),所有这些均完整地并入本文作为参考。
[0450] 本领域已知的任何技术均可以用于制备含有本发明核酸分子的转基因克隆,例如向去核卵细胞核转移来自经诱导静止的培养胚胎、胎儿、或成年细胞的细胞核(Campell等,Nature380:64-66(1996);Wilmut等,Nature385:810-81391997)),所有这些均完整地并入本文作为参考。
[0451] 本发明提供在其所有细胞中带有本发明核酸分子的转基因生物,以及并非所有细胞均带有这些核酸分子的生物,即镶嵌生物体或嵌合体。本发明核酸分子可以以单拷贝的形式、或以多拷贝如在多联体中如头对头串联或头对尾串联的形式整合。也可以选择性地将本发明核酸分子导入特定细胞类型中并在其中激活,方式参见例如以下Lasko等的文献(Lasko等,Proc.Natl.Acad.Sci.USA89:6232-6236(1992))。该细胞类型特异性激活所必需的调节序列将取决于具体的目的细胞类型,并是本领域技术人员明了的。当期望使本发明核酸分子整合在内源性基因的染色体位点中时,这通常是通过基因打靶来实现的。简而言之,当使用该技术时,设计含有与内源基因同源的一些核苷酸序列的载体,以便通过与染色体序列的同源重组整合在该内源性基因核苷酸序列中并破坏其功能。还可以选择性地将本发明核酸分子导入特定细胞类型中,由此使仅在此类型细胞中的内源性基因失活,方式见例如以下Gu等的文献(Gu等,Science265:103-106(1994))。该细胞类型特异性失活所必需的调节序列取决于具体的目的细胞类型,并是本领域技术人员已知的。本段落引用的所有文献的内容均完整地并入本文作为参考。
[0452] 一旦产生了转基因生物后,可以利用标准技术分析重组基因的表达。可以通过Southern印迹或PCR技术分析生物体的组织验证本发明核酸分子是否整合来进行初步筛
选。还可以使用以下技术评价本发明核酸分子在转基因生物体的组织中的mRNA表达水平,这些技术包括但不限于Northern印迹分析从生物体获得的组织样品、原位杂交分析、和逆转录酶PCR(rt-PCR)。表达本发明核酸分子的组织样品也可以使用特异针对这些核酸分子的表达产物的抗体来进行免疫细胞化学或免疫组织化学评价。
[0453] 一旦产生了起始生物后,可以对它们进行育种、近交、远交、或杂交育种以产生特定生物群落。育种策略的例子包括,但不限于:对具有一个以上整合位点的起始生物进行远交以建立分离系(separateline);对分离系进行近交以便产生由于每拷贝本发明核酸分子的额外表达作用造成的较高水平表达本发明核酸分子的复合转基因生物;对杂合转基因生物进行杂交以产生指定整合位点纯合的生物,以便提高表达并消除通过DNA分析筛选生物的需要;对分离的纯合系进行杂交以产生复合的杂合或纯合系;以及进行育种以将本发明核酸分子放置在适合于目的实验模式的不同背景上。
[0454] 本发明转基因和“敲除”生物的用途包括,但不限于,用于详细阐明本发明核酸分子表达产物的生物学功能的模式系统(例如动物模式系统)、研究与本发明核酸分子表达产物的异常表达有关的疾病和/或病症、以及筛选有效改善这些疾病和/或病症的化合物。
[0455] 本领域技术人员将明了,在将本发明核酸分子导入后生动物的许多情况中,可能期望将编码表达产物的序列与组织特异性转录调节序列(例如组织特异性启动子)(此组织是期望表达产物在其中产生的组织)可操作地连接。该启动子可以用于促进这些表达产物在期望组织中的产量。相当大量的组织特异性启动子是本领域已知的。而且,本文其它地方描述了鉴定组织特异性转录调节序列的方法。
[0456] 宿主细胞
[0457] 本发明还涉及包含本发明一或多个(如2、3、4、5、7、10、12、15、20、30、50个等)核酸分子或载体,尤其是此处详细描述的那些核酸分子和载体,的宿主细胞。根据本发明此方面可以使用的代表性宿主细胞包括,但不限于,细菌细胞、酵母细胞、昆虫细胞、植物细胞、和动物细胞。优选的细菌宿主细胞包括埃希氏菌属(Escherichiaspp.)细胞(尤其是大肠杆菌(E.coli)细胞,最尤其是大肠杆菌菌株DH10B、Stb12、DH5α、DB3、DB3.1(优选大肠杆菌LIBRARY EFFICIENCY DB3.1TM感受态细胞;Invitrogen Corporation,
Life TechnologiesDivision,Rockville,MD)、DB4和DB5(参见2000年3月2日提交的
美国申请09/518,188和1999年3月2日提交的美国临时申请60/122,392,其公开文本
完整地并入本文作为参考)、芽孢杆菌属(Bacillus spp.)细胞(尤其是枯草芽孢杆菌
(B.subtilis)和巨大芽孢杆菌(B.megaterium)细胞)、链霉菌属(Streptomyces spp.)
细胞、欧文氏杆菌属(Erwinia spp.)细胞、克雷白氏杆菌属(Klebsiellaspp.)细胞、沙
雷氏菌属(Serratia spp.)细胞(尤其是粘质沙雷氏菌(S.marcessans)细胞)、假单
胞菌属(Pseudomonas spp.)细胞(尤其是铜绿假单胞菌(P.aeruginosa)细胞)、和沙
门氏菌属(Salmonellaspp.)细胞(尤其是鼠伤寒沙门氏菌(S.typhimurium)和伤寒沙
门氏菌(S.typhi)细胞)。优选的动物宿主细胞包括昆虫细胞(最尤其是Drosophila
melanogaster细胞、草地贪夜蛾(Spodoptera frugiperda)Sf9和Sf21细胞、及粉纹夜蛾
(Trichoplusa)High-Five细胞)、线虫细胞(尤其是C.elegans细胞)、鸟类细胞、两栖类
动物细胞(尤其是(Xenopus laevis)细胞)、爬行动物细胞、和哺乳动物细胞(最尤其是
NIH3T3、CHO、COS、VERO、BHK和人细胞)。优选的酵母细胞包括酿酒酵母细胞和巴斯德毕赤氏酵母(Pichia pastoris)细胞。这些和其它适合的宿主细胞均可以从商业途径获得,例如从InvitrogenCorporation,Life Technologies Division(Rockville,Mayland)、美国典型培养物保藏中心(Manassas,Virginia)、和农业研究机构保藏中心(NRRL;Peoria,Illinois)购买获得。
[0458] 向此处所述宿主细胞中导入本发明的核酸分子和/或载体,以产生包含本发明一或多个核酸分子和/或载体的方法是本领域普通技术人员熟悉的。例如,可以使用感染、转导、转染和转化的熟知技术,向宿主细胞中导入本发明核酸分子和/或载体。本发明核酸分子和/或载体可以单独地或联合其它核酸分子和/或载体和/或蛋白质、肽或RNA一起导入。或者,可以以沉淀的形式例如磷酸钙沉淀的形式,或和脂形成复合物的形式,向宿主细胞中导入本发明核酸分子和/或载体。也可以使用电穿孔将本发明核酸分子和/或
载体导入宿主中。同样,可以将此类分子导入化学感受态细胞例如大肠杆菌细胞中。如果载体是病毒,则可以体外对其进行包装或将其导入包装细胞中,然后可以将包装病毒转导至细胞中。因此,本发明核酸分子可以含有和/或编码一或多个包装信号(例如指导包装
病毒核酸分子的病毒包装信号)。因此,根据本发明的此方面,适于将本发明核酸分子和/或载体导入细胞中的广泛多种技术是本领域技术人员熟知的和常规的。在以下文献中对
这些技术作了充分的综述:Sambrook,J.等,分子克隆:实验室手册(Molecular Cloning,A Laboratory Manual)第2版,Cold SpringHarbor,NY:Cold Spring Harbor Laboratory Press,第16.30-16.55页(1989);Watson J.D.等,重组DNA(Recombinant DNA)第2版,纽约:W.H.Freeman and Co.,第213-234页(1992);和Winnacker,E.-L.,从基因到克隆(From Genes to Clones),纽约:VCH Publishers(1987),这些是详细描述这些技术的许多实验室手册的例子,为了它们的相关公开,将它们完整地并入本文作为参考。
[0459] 聚合酶
[0460] 本发明所用聚合酶包括但不限于聚合酶(DNA和RNA聚合酶)和逆转录酶。DNA聚合酶包括,但不限于,嗜热栖热菌(Thermusthermophilus)(Tth)DNA聚合酶、水
生栖热菌(Thermus aquaticus)(Taq)DNA聚合酶、那不勒斯栖热袍菌(Thermotoga
neopolitana)(Tne)DNA聚合酶、海栖热袍菌(Thermotoga maritima)(Tma)DNA聚合
TM
酶、(Thermococcus litoralis)(Tli或VENT )DNA聚合酶、激烈火球菌(Pyrococcus
TM
furiosus)(Pfu)DNA 聚 合 酶、DEEPVENT DNA 聚 合 酶、Pyrococcus woosii (Pwo)
DNA聚合酶、火球菌属物种(Pyrococcus sp)KOD2(KOD)DNA聚合酶、嗜热脂肪芽孢杆
菌 (Bacillus sterothermophilus)(Bst)DNA 聚 合 酶、Bacilluscaldophilus(Bca)
DNA聚合酶、酸热硫化热菌(Sulfolobusacidoaldarius(Sac)DNA聚合酶、嗜酸热原体
(Thermoplasmaacidophilum)(Tac)DNA聚合酶、黄栖热菌(Thermus flavus)(Tfl/Tub)DNATM
聚合酶、红栖热菌(Thermus ruber)(Tru)DNA聚合酶、Thermus brockianus(DYNAZYME )DNA聚合酶、热自养甲烷杆菌(Methanobacterium thermoautotrophicum)(Mth)DNA聚合酶、分枝杆菌属(mycobacterium)DNA聚合酶(Mtb,Mlep)、大肠杆菌pol I DNA聚合酶、T5DNA聚合酶、T7DNA聚合酶、和一般的pol I型DNA聚合酶和它们的突变体、变体和衍生物。RNA聚合酶例如T3、T5和SP6及它们的突变体、变体和衍生物也均可以用于本发明。
[0461] 本发明所用核酸聚合酶可以是中温的或嗜热的,优选嗜热的。优选的中温DNA聚合酶包括可以从以下生物分离到的所有PolI家族DNA聚合酶(和它们的
相应Klenow片段):如大肠杆菌、流感嗜血杆菌(H.influenzae)、D.radiodurans、
H.pylori、C.auratiacus、R.prowazekii、T.pallidum、Synechocystis sp.、枯草芽孢杆菌 (B.subtilis)、L.lactis、S.pneumoniae、M.tuberculosis、M.leprae、M.smegmatis、噬菌体L5、phi-C31、T7、T3、T5、SP01、SP02、酿酒酵母(S.cerevisiae)MIP-1、和真核生物C.elegans及D.melanogaster(Astatke,M.等,1998,J.Mol.Biol.278,147-165)的线粒体;
分离自任何来源的pol III型DNA聚合酶,以及它们的突变体、衍生物或变体,等。可以在本发明方法和组合物中使用的优选热稳定DNA聚合酶包括Taq、Tne、Tma、Pfu、KOD、Tfl、TM TM
Tth、Stoffel片段、VENT 及DEEPVENT DNA聚合酶、和它们的突变体、变体和衍生物(美国专利5,436,149;美国专利4,889,818;美国专利4,965,188;美国专利5,079,352;美国专利5,614,365;美国专利5,374,553;美国专利5,270,179;美国专利5,047,342;美国专利
5,512,462;WO92/06188;WO92/06200;WO96/10640;WO97/09451;Barnes,W.M.,Gene,112:
29-35(1992);Lawyer,F.C.等,PCR Meth.Appl.2:275-287(1993);Flaman,J.M.等,Nucl.AcidsRes.22(15):3259-3260(1994))。
[0462] 用于本发明的逆转录酶包括任何具有逆转录酶活性的酶。这些酶包括,但不限于,逆转录病毒的逆转录酶、逆转座子的逆转录酶、乙型肝炎病毒的逆转录酶、花椰菜花叶病毒的逆转录酶、细菌的逆转录酶、Tth DNA聚合酶、Taq DNA聚合酶(Saiki,R.K.等,Science[0463] 239:487-491(1988);美 国专利4,889,818 和4,965,188)、Tne DNA聚合 酶(WO96/10640和WO97/09451)、Tma DNA聚合酶(美国专利5,374,553)和它们的突变体、变
体或衍生物(参见例如WO97/09451和WO98/47912)。用于本发明的优选酶包括降低、基本
上降低或消除了RNase H活性的那些酶。“基本上降低了RNase H活性”的酶是指该酶具有+
少于约20%、更优选少于约15%、10%或5%、最优选少于约2%的相应野生型或RNase H酶(如野生型Moloney鼠白血病病毒(M-MLV)、禽成髓细胞瘤病毒(AMV)或Rous肉瘤病毒
(RSV)逆转录酶)的RNase H活性。任何酶的RNase H活性均可以通过多种测试方法来确
定,这些方法例如描述于如美国专利5,244,797;Kotewicz,M.L.等,Nucl.Acids.Res.16:
265(1988);和Gerard,G.F.等,FOCUS14(5):91(1992)中的那些,所有这些文献的公开文-
本均完整地并入本文作为参考。用于本发明的尤其优选多肽包括,但不限于,M-MLV H 逆转- - -
录酶、RSV H 逆转录酶、AMV H 逆转录酶、RAV(Rous相关病毒)H 逆转录酶、MAV(成髓细胞- -
瘤相关病毒)H 逆转录酶、HIV H 逆转录酶。(参见美国专利5,244,797和WO98/47912)。
然而,本领域普通技术人员将理解,能够从核糖核酸分子产生DNA分子(即具有逆转录酶活性)的任何酶均可以同等地应用于本发明的组合物、方法和试剂盒中。
[0464] 用于本发明的具有聚合酶活性的酶可以从商业途径获得,例如从InvitrogenCorporation,Life Technologies Division(Rockville,Maryland);
Perkin-Elmer(Branchburg,New Jersey);New England Biolabs(Beverly,
Massachusetts); 或 BoehringerMannheim Biochemicals(Indianapolis,
Indiana)获得。用于本发明的具有逆转录酶活性的酶可以从商业途径获得,例如
从 InvitrogenCorporation,Life Technologies Division(Rockville,Maryland);
Pharmacia(Piscataway,New Jersey);Sigma(Saint Louis,Missouri);或 Boehringer Mannheim Biochemicals(Indianapolis,Indiana)获得。或者,可以根据本领域普通技术人员熟知的分离和纯化天然蛋白质的标准程序(参见例如Houts,G.E.等,J.Virol.29:
517(1979)),从其天然病毒或细菌来源分离具有聚合酶活性的聚合酶或逆转录酶。此外,这些聚合酶/逆转录酶可以通过本领域普通技术人员熟悉的重组DNA技术来制备(参见例
如Kotewicz,M.L.等,Nucl.Acids Res.16:265(1988);美国专利5,244,797;WO98/47912;
Soltis,D.A.和Skalka,A.M.,Proc.Natl.Acad.Sci.USA85:3372-3379(1988))。具有聚合酶活性和逆转录酶活性的酶的例子包括本申请中描述的所有那些。
[0465] 支持物和阵列
[0466] 根据本发明方法使用的支持物可以是任何适于附着包含一或多个重组位点或其部分的核酸分子的支持物或基质。可以通过本领域熟知的任何技术或任何技术组合,将这些分子加载或结合(共价地或非共价地)在支持物上。本发明支持物可以包含硝酸纤维素、重氮纤维素、玻璃、聚苯乙烯(包括微量滴定板)、聚氯乙烯、聚丙烯、聚乙烯、聚偏二氟乙烯(PVDF)、葡聚糖、Sepharose、琼脂、淀粉和尼龙。本发明支持物可以是任何形式或构型,包括珠粒、滤器、膜、片、玻璃料、塞、柱等。固体支持物还可以包括多孔管(例如微量滴定板)例如12孔板、24孔板、48孔板、96孔板、和384孔板。优选的床是由玻璃、乳胶、或磁性材料(磁性、顺磁性超顺磁性(superparamagnetic)珠粒)制成的。
[0467] 在一个优选方面,本发明方法可以用于制备蛋白质或核酸分子(RNA或DNA)阵列或其它分子、化合物和/或物质的阵列。这些阵列可以在微量板、载玻片、或标准的印迹膜上形成并可以根据阵列的格式和设计称作微阵列或基因芯片。这些阵列的用途包括发现基因、给出基因表达概貌、基因分型(SNP分析、药物基因组学、毒理遗传学)、和制备钠米技术装置。
[0468] 核酸阵列的合成和用途以及一般地核酸与支持物的附着已有描述(见例如美国专利5,436,327;美国专利5,800,992;美国专利5,445,9334;美国专利5,763,170;美国专利5,599,695和美国专利5,837,832)。Pirrung等美国专利5,143,854和Barrett等
美国专利5,252,743中描述了将各种试剂附着在底物的位置确定的位点上的自动程序。
例如,二硫化物修饰的寡核苷酸可以使用二硫键与固体支持物附着。(见Roger等,Anal.Biochem.266:23-30(1999)。)而且,二硫化物修饰的寡核苷酸可以使用固相合成成为肽核酸(PNA)。由此,可以将包含一或多个重组位点或其部分的核酸分子加载在一或多个支持物上(或可以加入该支持物上的阵列中),并可以将核酸、蛋白质或其它分子和/或化合物通过本发明重组方法加在该支持物上。核酸和目的分子的偶联是本领域已知的,因此,本发明普通技术人员可以根据本发明制备含有重组位点(或其部分)的分子和/或化合物以便和
支持物(阵列格式的或其它格式的)附着。
[0469] 本质上,任何可以想到的支持物都可以用于本发明。该支持物可以是生物的、非生物的、有机的、无机、或任何这些的组合,其存在形式有颗粒、链、沉淀、凝胶、片、管、球、容器、毛细管、垫、薄片、薄膜、板、载片、等。该支持物可以具有任何方便的形状,例如盘形、方形、球形、圆形等。该支持物优选是扁平的但可以采取各种其它表面构型。例如,该支持物可以含有可用于合成或其它反应的升高的或降低的区域。该支持物和其表面优选形成刚性表面,以便本文所述反应在其上进行。也可以对该支持物和其表面进行选择以便提供适当的光吸收特性。例如,该支持物可以是聚合的Langmuir Blodgett膜、官能化玻璃、Si、Ge、GaAs、GaP、SiO2、SIN4、修饰的、或广泛多种凝胶或聚合物(如(聚)四氟乙烯、(聚)偏氟乙烯、聚苯乙烯、聚碳酸酯)之任一种、或它们的组合。根据本公开的综述,本领域技术人员将明了其它支持物材料。在一个优选实施方案中,该支持物是扁平的玻璃或单晶硅
[0470] 因此,本发明提供用于制备附着在支持物上的核酸分子阵列的方法。在一些实施方案中,这些核酸分子在它们的一或多个末端(例如1、2、3或4)具有重组位点。在一些其它实施方案中,直接将一个核酸分子与支持物、或支持物的特定部分结合,而将一或多个其它核酸分子通过与直接附着在支持物上的核酸分子的结合间接地附着在支持物上。在此情况下,直接与支持物附着的核酸分子提供了成核位点,围绕该位点可以构建核酸阵列。
[0471] 本发明还提供用于将支持物彼此连接在一起和用于将结合在同一支持物上的分子连接在一起的方法。使用图11非限制地举例说明该过程的一个实施方案中,可以将命名为RS6的重组位点放置在该图下部分所示附着在支持物上的A/B组合物的RS5位点末端。
而且,还可以将一个相同的组合物附着在相同或不同支持物的另一部分上。然后使用RS6位点间的重组将这两个组合物连接起来,由此使附着在相同支持物上的两个支持物之间或附着在不同支持物上的两个组合物之间键合。因此,本发明提供了方法,使得可以通过使用重组位点将与支持物结合的一或多个组合物连接起来,从而使附着在相同支持物上的化合物发生交联。本发明还提供了方法,使得可以使用重组位点将与分开的支持物结合的一或多个组合物连接起来,从而使分开的支持物发生交联。
[0472] 一方面,本发明提供含有通过本发明方法制备的核酸分子的支持物。在许多实施方案中,这些支持物上的核酸分子含有至少一个重组位点。在一些实施方案中,该重组位点在核酸分子附着在支持物上之前已进行了重组。这些结合的核酸分子可以用于例如鉴定其它核酸分子(例如与该结合的核酸分子在严紧杂交条件下杂交的核酸分子)和对该结合的核酸分子具有结合亲和力的蛋白质。还可以从这些结合的核酸分子产生表达产物,而同时这些核酸分子仍保持与支持物结合。因此,本发明组合物和方法可以用于鉴定表达产物和这些表达产物所产生的产物。
[0473] 在其它实施方案中,与支持物结合的核酸分子在核酸分子附着在支持物上之后发生重组。正如已讨论的,因此,这些结合的核酸分子可以用于鉴定所编码的表达产物参与一个或特定数量的生物学过程或途径的核酸分子。
[0474] 而且,可以从这些支持物上释放与支持物结合的核酸分子。释放核酸分子的方法包括限制性消化、重组和改变条件(例如温度、盐浓度等)以诱导与结合的核酸分子杂交的核酸分子发生解离。因此,本发明方法包括使用结合核酸分子的支持物来分离核酸分子。
[0475] 正如以上提及的,本发明提供了方法,使得可以筛选核酸文库以鉴定所编码的表达产物参与相同生物学过程或途径的核酸分子。在具体实施方案中,这些方法包括(1)将包含至少一个重组位点的核酸分子附着在支持物上,(2)使该结合的核酸分子和核酸分子文库在利于该结合的核酸分子和文库核酸分子之间发生重组的条件下接触,其中该文库中各核酸分子均包含至少一个重组位点,和(3)筛选通过重组形成的核酸分子的表达产物或这些核酸分子的表达产物所产生的产物。
[0476] 通过核酸分子和支持物的结合可以形成的组合物的例子是“基因芯片”,通常在本领域中称作“DNA微阵列”或“基因组芯片”(见美国专利5,412,087和5,889,165;和PCT公开文本WO97/02357、WO97/43450、WO98/20967、WO99/05574、WO99/05591和WO99/40105,所有这些公开均完整地并入本文作为参考)。在本发明各种实施方案中,这些基因芯片可以含有本文所述的两维或三维核酸阵列。
[0477] 本发明核酸阵列的可寻址性(adressability)意味着可以将与特定核苷酸序列结合的分子或化合物附着在阵列上。由此,可以将蛋白质和其它核酸等成分附着在本发明核酸阵列的特定地点/位置。
[0478] 因此,一方面,本发明提供亲和纯化方法,包括(1)提供与包含至少一个重组位点的核酸分子结合的支持物,(2)使用重组反应使一或多个其它核酸分子与支持物附着,(3)使该支持物与含有对结合在支持物上的核酸分子具有结合亲和力的分子或化合物的组合物,在利于这些分子或化合物与结合在支持上的核酸分子结合的条件下,进行接触,(4)改变条件以促进结合的分子或化合物的释放,和(5)收集释放的分子或化合物。
[0479] 核酸合成、扩增和测序方法
[0480] 本发明可以联合涉及核酸分子如DNA(包括cDNA)和RNA分子合成的任何方法一起应用。这些方法包括,但不限于,核酸合成方法、核酸扩增方法和核酸测序方法。可以使用这些方法制备本发明所用分子(例如起始分子)或进一步操作本发明制备的分子或载体。
[0481] 根据本发明的此方面,核酸合成方法可以包含一或多个(例如2、3、4、5、7、10、12、15等)步骤。例如,本发明提供合成核酸分子的方法,其包括(a)将核酸模板(例如,本发明核酸分子或载体)和一或多个(例如2、3、4、5、7、10、12、15等)引物和一或多个(例如
2、3、4、5、7等)具有聚合酶或逆转录酶活性的酶混合,以形成混合物;和(b)在足以产生和模板的全部或部分互补的第一核酸分子的条件下,孵育该混合物。根据本发明的此方面,核酸模板可以是DNA分子如cDNA分子或文库,或RNA分子如mRNA分子。足以允许合成发生
的条件如pH、温度、离子强度和孵育时间可以由本领域技术人员优化。如果期望的话,可以在合成过程中或之后在该合成的分子上添加重组位点(见例如基于1997年10月24日提
交的美国临时专利申请60/065,930于98年10月23日提交的美国专利09/177,387)。
[0482] 根据本发明,可以从获自天然来源如各种细胞、组织、器官或生物的核酸分子制备靶或模板核酸分子或文库。可以用作核酸分子来源的细胞可以是原核细
胞(细菌细胞,包括埃希氏杆菌属、芽孢杆菌属、沙雷氏菌属(Serratia)、沙门氏菌属
(Salmonella)、葡萄球菌属(Staphlococcus)、链球菌属(Streptococcus)、梭状芽胞
杆菌属(Clostridium)、衣原体(Chlamydia)、奈瑟氏球菌属(Neisseria)、密螺旋体属
(Treponema)、支原体(Mycoplasma)、疏螺旋体属(Borrelia)、军团菌属(Legionella)、假单胞菌属(Pseudomonas)、分支杆菌属(Mycobacterium)、螺杆菌属(Helicobacter)、
欧文氏菌属(Erwinia)、土壤杆菌属(Agrobacterium)、根瘤菌属(Rhizobium)、和链霉菌属(Streptomyces)的种的细胞),或真核细胞(包括真菌(特别是酵母的)、植物、原生动
物及其它寄生物、和动物包括昆虫(尤其是果蝇属细胞)、线虫(尤其是Caenorhabditis
elegans的细胞)、和哺乳动物(尤其是人细胞)的细胞)。
[0483] 当然,可以有利地使用的其它核酸合成技术将是本领域普通技术人员易于明了的。
[0484] 在本发明其它方面,本发明可以联合扩增或测序核酸分子的方法一起应用。根据本发明的此方面,核酸扩增方法可以包括将一或多个具有逆转录酶活性的多肽用于本领域通常称作一步(例如一步RT-PCR)或两步(例如两步RT-PCR)逆转录酶-扩增反应的方法中。对于长核酸分子(即长度大于约3-5Kb)的扩增,可以使用DNA聚合酶的组合,参见
WO98/06736和WO95/16028。
[0485] 根据本发明,扩增方法可以包含一或多个(例如2、3、4、5、7、10)步骤。例如,本发明提供扩增核酸分子的方法,包含(a)将一或多个(例如2、3、4、5、7、10等)具有聚合酶活性的酶与一或多个(例如2、3、4、5、7、10、12、15、20、30、50、100等)核酸模板混合;和(b)在足以允许具有聚合酶活性的酶扩增与模板的全部或部分互补的一或多个核酸分子的条件下,孵育该混合物。本发明还提供通过这些方法扩增的核酸分子。如果期望的话,可以在扩增过程中或之后在该扩增的分子上添加重组位点(见例如基于1997年10月24日提交
的美国临时专利申请60/065,930于98年10月23日提交的美国专利09/177,387)。
[0486] 扩增和分析核酸分子或片段的一般方法是本领域普通技术人员熟知的(参见例如美国专利4,683,195;4,683,202;和4,800,159;Innis,M.A.等编,PCR实验指南:方法和应用的指导(PCR Protocols:A Guide to Methods and Applications),San Diego,California:Academic Press,Inc.(1990);Griffin,H.G. 和 Griffin,A.M. 编,PCR 技术:当前的 创新(PCR Technology:Current Innovations),BocaRaton,Florida;CRC Press(1994))。例如,根据本发明可以使用的扩增方法包括PCR(美国专利4,683,195和
4,683,292)、链置换扩增(SDA;美国专利5,455,166;EP 0 684 315)、和基于核酸序列的扩增(NASBA;美国专利5,409,818;EP 0329 822)。
[0487] 典型地,这些扩增方法包括(a)将一或多个具有聚合酶活性的酶与核酸样品在存在一或多个引物的情况下混合;和(b)优选通过PCR或等价的自动扩增技术,扩增该核酸样品以产生大量扩增的核酸片段。
[0488] 通过本发明方法进行扩增或合成后,可以分离扩增的或合成的核酸片段作进一步使用或表征。该步骤通常可以通过借助大小或任何物理或生物化学方法包括凝胶电泳、毛细管电泳、层析(包括分子筛、亲和和免疫层析)、密度梯度离心和免疫吸附,分离扩增的或合成的核酸片段来完成。尤其优选通过凝胶电泳分离核酸片段,因为它提供了快速和高重复性地灵敏分离许多核酸片段的手段、并允许直接同时地比较几个核酸样品中的这些片段。在另一优选实施方案中,可以扩展该方法以分离和表征这些片段或任何通过本发明方法扩增或合成的核酸片段。因此,本发明还指向通过本发明扩增或合成方法产生的分离的核酸分子。
[0489] 在该实施方案中,根据标准技术如电洗脱或物理切除,从用于鉴定的凝胶(见上)上取下一或多个扩增的或合成的核酸片段。然后将这些分离的独特核酸片段插入适于转染或转化多种原核(细菌)或真核(酵母、植物或动物包括人和其它哺乳动物)细胞的标准载体包括表达载体中。或者,还可以通过例如测序(即,确定核酸片段的核苷酸序列)、通过以下描述的方法和本领域的其它标准方法(参见指向DNA测序方法的美国专利4,962,022
和5,498,523),表征本发明方法所制备的核酸分子。
[0490] 根据本发明,核酸测序方法可以包含一或多个步骤。例如,本发明可以和用于测序核酸分子的方法联合应用,该方法包含(a)将具有聚合酶活性的酶和待测序的核酸分子、一或多个引物、一或多个核苷酸、及一或多个终止剂(例如双脱氧核苷酸)混合,以形成混合物;(b)在足以合成和待测序分子的全部或部分互补的一群分子的条件下,孵育该混合物;和(c)分离该群体以确定待测序分子的全部或部分核苷酸序列。
[0491] 可以使用的核酸测序技术包括例如描述于美国专利4,962,022和5,498,523公开的那些双脱氧测序方法。
[0492] 试剂盒
[0493] 另一方面,本发明提供可以和本发明一起使用的试剂盒。根据本发明此方面的试剂盒可以包含一或多个容器,这些容器可以含有选自下组的一或多个成分:一或多个本发明的核酸分子或载体、本发明分子和/或化合物、本发明支持物、一或多个聚合酶、一或多个逆转录酶、一或多个重组蛋白(或其它实施本发明方法的酶)、一或多个缓冲液、一或多个去污剂、一或多个限制性内切酶、一或多个核苷酸、一或多个终止剂(例如ddNTP)、一或多个转染试剂、焦磷酸酶等。
[0494] 多种本发明核酸分子或载体可以和本发明一起使用。而且,由于本发明的模块性(modularity),这些核酸分子和载体可以以广泛多种方式组合。可以在本发明试剂盒中提供的核酸分子的例子包括含有以下序列的核酸分子:启动子、信号肽、增强子、阻遏基因(repressor)、选择标记、转录信号、翻译信号、引物杂交位点(例如用于测序或PCR的)、重组位点、限制性位点和多聚接头、在抑制型tRNA存在时抑制翻译终止的位点、抑制型tRNA编码序列、编码用于制备融合蛋白的域和/或区(例如6His标签)的序列、复制起点、端粒、着丝粒等。类似地,可以在本发明试剂盒中提供文库。这些文库可以是可复制核酸分子形式的,或它们可以包含与复制起点无关的核酸分子。正如本领域技术人员明了的,与复制起点无关的文库核酸分子、以及其它核酸分子,可以被插入含有复制起点的其它核酸分子中,或是一次性试剂盒成分。
[0495] 而且,在一些实施方案中,本发明试剂盒中提供的文库可以包含两个成分:(1)这些文库的核酸分子和(2)5’和/或3’重组位点。在一些实施方案中,当提供的文库核酸分子具有5’和/或3’重组位点时,可以使用重组反应将这些分子插入载体中,这些载体也可以作为试剂盒成分提供。在其它实施方案中,可以在使用前将重组位点附着在文库核酸分子上(例如通过使用连接酶,该连接酶也可以和试剂盒一起提供)。在此情况下,本试剂盒可以提供含有重组位点的核酸分子或可以用于产生重组位点的引物。
[0496] 本发明试剂盒提供的载体可以有极大的不同。在大多数情况下,这些载体将含有复制起点,至少一个选择标记、和至少一个重组位点。例如,本发明试剂盒中提供的载体可以具有允许在两个不同的位置处插入核酸分子的4个不同的重组位点。图16示意显示了此类载体。本文其它地方对本发明试剂盒提供的载体的其它属性进行了描述。
[0497] 本发明试剂盒还可以与引物一起提供。这些引物一般设计与具有特定核苷酸序列的分子退火。例如,这些引物可以设计用于PCR中扩增特定的核酸分子。而且,本发明试剂盒提供的引物可以是设计与载体序列杂交的测序引物。因此,该引物一般作为试剂盒的一部分提供用于测定插入载体的核酸分子的序列。
[0498] 本发明试剂盒中可以提供一或多个缓冲液(例如1、2、3、4、5、8、10、15)。这些缓冲液可以按工作浓度提供,或可以按浓缩形式提供然后稀释为工作浓度。这些缓冲液通常将含有盐、金属离子、辅因子、金属离子螯合剂等,用于增强缓冲液本身或缓冲液中分子的稳定活性。而且,可以以干燥形式或含水形式提供这些缓冲液。
[0499] 适用于本发明的支持物(例如固体支持物、半固体支持物、珠粒、多孔管等,以上作了更详细的描述)也可以和本发明试剂盒一起提供。图10-13显示了支持物在本发明方法中的示例性用途。
[0500] 本发明试剂盒实际上可以含有上述或本文其它地方描述的各种成分的任何组合。本领域技术人员将明了,与本发明试剂盒一起提供的成分根据试剂盒的预期用途将有不
同。因此,可以对试剂盒进行设计以发挥本申请所述的各种功能,而且这些试剂盒的成分将由此改变。
[0501] 相关领域普通技术人员将明了,依据普通技术人员已知的知识从本文所包含的本发明描述出发,本文所述方法和应用的其它适合修改和改变将是十分明了的,而且可以进行实施而不偏离本发明范围或它的任何实施方案。目前我们已详细描述了本发明,通过参考以下实施例可以更清楚地理解本发明,这些实施例仅为了举例说明的目而被包括在内,它们并不旨在限制本发明。
[0502] 1995年6月7日提交的美国申请08/486,139(现已放弃)、1996年6月7日提交的美国申请08/663,002(现在的美国专利5,888,732)、1999年1月12日提交的美国申请
09/233,492、2000年11月7日颁布的美国专利6,143,557、1997年10月24日提交的美国
申请66/065,930、1998年10月23日提交的美国申请09/177,387、1999年4月24日美国
申请09/296,280、1999年4月24日提交的美国申请09/296,281、1998年11月13日提交
的美国申请66/108,324、1999年11月12日提交的美国申请09/438,358、2000年10月25
日提交的美国申请09/695,065、1999年11月2日提交的美国申请09/432,085、1999年3
月2日提交的美国申请60/122,389、1999年3月23日提交的美国申请60/126,049、1999
年5月28日提交的美国申请60/136,744、1999年3月2日提交的美国申请60/122,392、和
1999年10月25日提交的美国申请60/161,403,所有这些的完整公开并入本文作为参考。
[0503] 实施例
[0504] 实施例1:使用LR反应同时克隆两个核酸区段
[0505] 可以使用本发明方法在单个反应中克隆两个核酸区段。本发明方法可以包含以下步骤:提供侧翼有第一和第二重组位点的第一核酸区段、提供侧翼有第三和第四重组位点的第二核酸区段,其中该第一或第二重组位点能够和第三或第四重组位点重组,实施重组反应反应以便使这两个核酸区段重组为单个核酸分子,并克隆该单个核酸分子。
[0506] 参考图2,可以提供侧翼有重组位点的两个核酸区段。本领域技术人员将明了,这些核酸区段可以作为不连续的片段或作为大核酸分子的一部分来提供,并可以是环状并任选地是超螺旋或线性。可以对这些位点进行选择,以便一对反应性位点的一个成员位于这两个区段的每个的侧翼。
[0507] “反应性位点对”是指在适当酶和辅因子存在时能够重组的两个重组位点。例如,在一些优选实施方案中,一个核酸分子可以包含attR位点,而另一个包含与attR位点反应的attL位点。由于LR反应的产物是两个分子,其中一个包含attB位点而一个包含attP位点,因此可以对起始attL和attR位点的取向进行安排,以便接合后这两个起始核酸区段可以被包含attB位点或attP位点的核酸序列分隔开。
[0508] 在一些优选实施方案中,可以对这些位点进行安排,以便在重组反应后这两个起始核酸区段被attB位点分隔开。在其它优选实施方案中,可以使用来自其它重组系统的重组位点。例如,在一起实施方案中,一或多个重组位点可以是lox位点或衍生物。在一些优选实施方案中,来自一个以上重组系统的重组位点可以用于相同的结构中。例如,一或多个重组位点可以是att位点,而其它可以是lox位点。来自不同重组系统的位点的各种组合是本领域技术人员已知的,并且这些组合被认为是在本发明范围内。
[0509] 正如图2所示,核酸区段A(DNA-A)的侧翼可以是具有独特特异性的重组位点,例如attL1和attL3位点,而核酸区段B(DNA-B)的侧翼可以是重组位点attR3和attL2。为了举例说明的目的,这些区段标示为DNA。这不应理解为将用于实施本发明的核酸限制为DNA而排除了其它核酸。此外,在此和之后的实施方案中,重组位点的设计仅旨在使所用重组位点具有不同的特异性并不应理解为将本发明限制在使用具体引用的位点上。本领域技术人员能够容易地将具体举例说明的位点对替换为其它位点对。
[0510] attR3和attL3位点包含一个反应性位点对。可以使用其它独特重组位点对放置在核酸区段侧翼。例如,可以使用lox位点作为一反应对,而另一反应对可以是att位点,并将适当的重组蛋白包括在该反应中。同样地,以上讨论的重组位点可以按各种组合进行使用。在此实施方案中,关键性的性质只有位于各区段侧翼的重组位点的性质、反应性位点对的一个成员(在此实施例中是LR对L3和R3)存在在一个核酸区段上,而反应性对的另
一成员存在于另一核酸区段上。可以将这两个区段和适当的酶及目的载体接触。
[0511] 目的载体包含侧翼有两个重组位点的适当选择标记。在一些实施方案中,该选择标记可以是负选择标记(例如毒性基因如ccdB)。目的载体中的一个位点将与这些核酸区段之一上存在的一个位点相容,而目的载体中存在的另一位点的相容位点位于另一核酸区段上。
[0512] 在这两个起始核酸区段之间不发生重组的情况下,起始核酸区段均不具有与目的载体中两个位点相容的重组位点。因此,没有一个起始核酸区段可以替换目的载体中存在的选择标记。
[0513] 可以在约25℃孵育反应混合物约60分钟至约16小时。将反应混合物的全部或部分用于转化感受态微生物并筛选存在期望产物的微生物。
[0514] 在一些实施方案中,目的载体包含负选择标记,而转化的微生物对目的载体上存在的负选择标记是敏感的。在允许进行负选择的条件下培养转化的微生物,以便除去未含有期望重组产物的微生物。
[0515] 图2中,所获期望产物由被attB3位点分隔开的、克隆在目的载体主链中的DNA-A和DNA-B组成。在本实施方案中,可以使用同类反应(即LR反应)将两个片段组合起来并将组合在一起的片段插入目的载体中。
[0516] 在一些实施方案中,可能不必控制一或多个核酸区段的取向并且可以将具有相同特异性的重组位点用在区段的两个末端。
[0517] 参考图2,如果区段A相对区段B的取向不是关键的,则可以将L1位点以反向重复的取向放置在区段A两个末端的侧翼,待与区段A接合的区段B末端可以具有R1位点。在区段A和B之间形成组合文库的过程中,这可能对于产生额外的复杂性是有用的。即,区段可以以各种取向进行接合,而且如果接合的一或两个区段可以来源于一个文库,则根据本发明可以构建包含随机取向的杂合分子的新群体或文库。
[0518] 尽管,在本实施例中,两个起始区段间的重组显示发生在和目的载体的重组反应前,但重组反应的次序并不重要。因此,在一些实施方案中,可能期望在这些区段间实施重组反应并分离组合的区段。可以直接地使用这些组合的区段,例如可以对其进行扩增、测序或将其用作线性表达元件,参见Sykes等(Nature Biotechnology17:355-359,1999)。在一些实施方案中,可以按Tawfik等(Nature Biotechology16:652-656,1998)所述方法包裹这些接合的区段,并随后测试了一或多个期望性质。在一些实施方案中,可以将该组合的区段用于体外表达RNA,例如将T7启动子或SP6启动子等启动子包括在其中一个区段上。该体外表达的RNA可以任选地在体外翻译系统如兔网织红细胞裂解物中翻译。
[0519] 任选地,该接合区段可以进一步与目的载体反应,导致该组合区段插入载体中。在一些情况下,可能期望分离包含其中一个区段和载体的中间物。对于将这些区段插入载体中,将两个区段接合起来的重组反应发生在区段和目的载体之间的重组反应之前或之后并不是实施本发明所关键的。
[0520] 根据本发明,优选进行所有三个重组反应(即,区段A和目的载体之间的反应、区段B和目的载体之间的反应、以及区段A和区段B之间的反应),以便产生在其中两个起始核酸区段现接合为一个单一分子的核酸分子。在一些实施方案中,可以选择重组位点以便在插入载体后位于接合区段侧翼的重组位点形成一对反应性位点而该接合区段可以通过
该侧翼位点和适当重组蛋白的反应从载体中切除。
[0521] 参考图2,如果用L1位点按相对区段B相反的方面替代区段B上的L2位点(即框的长段,指示重组位点与该区段不相邻)并用R1位点按相反方向替代载体中的R2位点,则重组反应将在载体中产生attP1位点。然后该attP1位点能够和接合区段另一末端上的
attB1位点反应。因此,可以使用适合于BP反应的重组蛋白切除该接合区段。
[0522] 本发明此实施方案尤其适合于构建组合文库。在一些优选实施方案中,图2的每个核酸区段都可以表示文库,每个文库都可以具有待筛选的已知或未知核酸序列。在一些实施方案中,其中一或多个区段可以具有编码指定肽、多肽或蛋白质氨基酸序列的一或多种排列的序列。在一些实施方案中,每个区段都可以具有编码蛋白质域或编码代表蛋白质域序列各种排列的文库的序列。例如,一个区段可以代表突变形式抗体轻链可变区文库,而另一区段可以代表突变形式抗体重链文库。因此,重组将产生一群分子(例如抗体、单链抗原结合蛋白等),每个分子均潜在地含有独特的序列组合因此也具有独特的结合特异性。
[0523] 在其它优选实施方案中,其中一个区段可以代表单个核酸序列,而另一个代表文库。重组结果是一群序列,其中所有序列均具有一个共同部分而在另一部分是可变的。此类实施方案对于制备融合结构文库是有用的。例如,DNA-A可以包含一个指导表达的调节序列(即启动子)和一个编码纯化标签的序列。适当的纯化标签包括,但不限于,谷胱苷肽S转移酶(GST)、麦芽糖结合蛋白(MBP)、表位、确定的氨基酸序列如表位、半抗原、6组氨酸(HIS6)等。DNA-B可以包括目的蛋白突变形式的文库。可以测定所获结构的期望特性如酶活性或配体结合。
[0524] 或者,DNA-B可以包含所获融合分子的共同部分。在一个实施方案中,上述方法可以用于促进启动子区或转录终止信号分别与结构基因的5’末端或3’末端融合,产生例如通过在结构基因上添加组织特异性启动子以设计用于在不同细胞背景中表达的表达盒。
[0525] 在一些实施方案中,其中一或多个区段可以是编码随机肽文库成员的序列。该方法可以用于例如制备一群具有某种期望特性的分子。例如,一个区段可以含有编码DNA结合域的序列,而另一个区段代表随机肽文库。可以就调节目的靶基因表达的能力对所获群体进行筛选。在其它实施方案中,两个区段均可以是编码随机蛋白文库成员的序列,并且可以测定所获合成蛋白(例如融合蛋白)是否具有任何期望特性,例如与特定配体或受体结合或具有某种酶活性。
[0526] 这些核酸区段不必编码氨基酸序列。例如,这两个区段均可以指导不翻译成蛋白质的RNA分子的转录。这对于构建tRNA分子、核酶和反义分子是有用的。或者,一个区段可以指导非翻译RNA分子的转录而另一个编码蛋白质。例如,DNA-A可以指导增强蛋白质表达的非翻译前导序列(例如脑心肌炎病毒前导序列(EMC 前导序列))的转录,而DNA-B
编码目的肽、多肽或蛋白质。在一些实施方案中,包含前导序列的区段还可以包含编码氨基酸序列的序列。例如,DNA-A可以具有相应于EMC前导序列的核酸序列以及一个纯化标签,而DNA-B具有编码目的肽、多肽或蛋白质的核酸序列。
[0527] 上述方法对于制备单链抗原结合蛋白组合文库是尤其有用的。制备单链抗原结合蛋白的方法是本领域已知的(见例如PCT公开文本WO94/07921,该完整公开并入本文作为参考)。使用图6所示结构进行举例说明,DNA-A可以编码例如突变形式的抗体轻链可变
区,而DNA-B可编码例如突变形式的抗体轻链可变区。另外,DNA-A和DNA-B之间的间隔核酸可编码连接轻链和重链的肽接头。然后可以对表达单链抗原结合蛋白的细胞进行筛选以鉴定可产生结合特定抗原的分子的细胞。
[0528] 上述方法可以有许多变体。例如,不使用图6所示结构,可以使用如图2所示的结构,并将接头肽编码区嵌在重组位点内。这是上述内含功能的重组位点的一个例子。
[0529] 作为另一例子,也可以制备由两条抗体轻链和两条抗体重链组成的单链抗原结合蛋白。可以对这些单链抗原结合蛋白进行设计以便相连形成多价抗原结合复合物。再使用图2所示结构举例说明,DNA-A和DNA-B均可以编码例如突变形式的抗体轻链可变区。在相似载体的相同位点或在设计用于插入4个核酸插入片段的载体的另一位点上,DNA-A和
DNA-B均可以编码例如突变形式的抗体重链可变区。然后可以筛选表达两个单链抗原结
合蛋白的细胞,以鉴定例如可产生具有针对特定抗原的特异性的多价抗原结合复合物的细胞。
[0530] 因此,本发明方法可以用于例如制备和筛选组合文库以鉴定产生对特定表位具有特异性的抗原结合蛋白(例如抗体和/或包含重链可变区或轻链可变区的抗体片段或抗体片段复合物)的细胞。本发明也包括用于制备抗原结合蛋白的方法、和通过本发明方法制备的抗原结合蛋白。
[0531] 实施例2:使用LR反应同时克隆两个核酸片段以将这些区段接合起来并使用BP反应将这些区段插入载体中
[0532] 正如图3所示,侧翼有attB重组位点和attL重组位点的第一核酸区段可以和侧翼有与第一核酸区段上的attL位点相容的attR重组位点以及可以与第一区段上attB位
点相同或不同的attB位点的第二核酸区段接合。图3显示了两个attB位点不同的实施方
案。这两个区段可以在BP反应中和含有attP位点的载体接触。
[0533] 随后的LR反应将产生由被attP位点或attB位点(LR反应的产物)分开的DNA-A和DNA-B组成的、克隆在载体主链中的产物。在图3所示实施方案中,attL和attR位点按
一定方式排列以致重组后这两个区段间产生一个attP位点。在优选实施方案中,重组后,这两个区段可以被attB位点分开。
[0534] 本领域技术人员无需繁琐实验即可以容易地优化用于实施上述反应的条件。在一个典型反应中,可以将约50ng至约100ng载体和待克隆的片段在适当反应条件下接触。每个片段可以以约25∶1至约1∶25的载体∶片段摩尔比存在。在一些实施方案中,其中一或多个片段可以以约10∶1至1∶10的载体:片段摩尔比存在。在一个优选实施方案
中,每个片段可以以约1∶1的载体∶片段摩尔比存在。
[0535] 典型地,可以将核酸溶解在水性缓冲液中然后加入反应混合物。一组适当的条件TM是:4μl CLONASE 酶混合物(例如Invitrogen Corp.,Life Technologies Division,
Catl.Nos.11791-091和11789-013)、4μl 5×反应缓冲液和核酸及水,至终体积20μl。这典型地导致在20μl
[0536] BP反应中包括约200ng Int和约80ng IHF,而在20μl LR反应中包括约150 ngInt、约25ng IHF和30ng Xis。
[0537] 在一些优选实施方案中,尤其是attL位点和attR位点重组的那些实施方案中,终反应混合物可以包括约50mM Tris HCl(pH7.5)、约1mM EDTA、约1mg/ml BSA、约75mM NaCl和约7.5mM亚精胺以及重组酶和待组合的核酸。在其它优选实施方案中,尤其是attB位点和attP位点重组的那些实施方案中,终反应混合物可以包括约25mMTris HCl(pH7.5)、约5mM EDTA、约1mg/ml牛血清白蛋白(BSA)、约22mM NaCl和约5 mM亚精胺。
[0538] 当期望进行BP和LR反应而在之间不进行核酸纯化时,首先可以进行BP反应,然TM
后通过加入LR CLONASE 酶和浓NaCl将反应条件调节至约50mM NaCl、约3.8mM亚精胺、
约3.4mM EDTA和约0.7mg/ml牛血清白蛋白(BSA)。可以在适当的温度下例如22℃孵育反
应溶液约60分钟至16小时。重组反应后,该溶液可以用于转化感受态宿主细胞并按上述
筛选宿主细胞。
[0539] 以下是“单管”反应实验方案的一个例子,该实验方案可以促进PCR产物在一个单一试管内发生的两步骤反应中直接转移至表达克隆上。该实验方案也可以用于将基因从一个表达克隆质粒主链转移至另一个。首先在质粒主链内线性化该表达克隆,以便获得BP反应的最佳拓扑结构并消除由于共转化导致的假阳性集落。
[0540] 使用以下成分在1.5 ml管中制备25 μl BP反应混合物:
[0541]
[0542] 混合试管中内容物并25℃孵育4小时、或更长。如果从含有GATEWAYTMpDONR或r r
pDEST载体上的选择标记(Kan 或amp)的质粒模板扩增PCR产物,则可以用限制性内切酶
TM
DpnI处理该PCR产物以降解该质粒。这些质粒是转化GATEWAY 反应物时假阳性菌落的潜
在来源。而且,当用于PCR的模板或起始表达克隆具有和终目的载体相同的选择标记(例
r
如amp)时,铺在含有100μg/ml氨苄青霉素的LB平板上可以测定延续至LR反应步骤的
假阳性菌落数量。
[0543] 将5μl反应混合物转移至加有0.5μl蛋白酶K溶液的不同管中。然后37℃孵育该管10分钟。然后用1-2μl混合物转化100μl感受态细胞,并铺在含有50μg/ml卡那
霉素的LB平板上。这就产生可以用于分离单个进入克隆和用于评价BP反应效率的菌落。
[0544] 将以下成分加入上述剩余的20μl BP反应物中:
[0545]
[0546] 然后25℃孵育混合物2小时,之后加入3μl蛋白酶K溶液,37℃再孵育10分钟。然后使用1-2μl该混合物转化100μl感受态细胞,然后将细胞铺在含有100μg/ml氨苄
青霉素的LB平板上。
[0547] 实施例3:通过在BP反应和随后的LR反应中将attB位点转变为一对反应性位点attL和attR,使用片段克隆PCR产物
[0548] 使用与实施例2所示相似的策略重组两个PCR产物然后同时将它们克隆在载体主链中。由于attL和attR位点分别长100和125个碱基对,而且因为attB位点长25个碱
基对,因此可能期望将attB位点掺入PCR引物中。根据attB相对于转移的核酸区段的取
向,可以通过BP反应将attB位点转变为attL或attR位点。因此,attB位点在attBPCR引
TM
物中的取向决定了attB位点是转变成attL还是attR。这就使该GATEWAY 系统和本发明
方法可以极为灵活地使用多种具有独特特异性的att位点。
[0549] 正如图4所示,由侧翼有具有不同特异性的突变attB位点(例如attB1和attB3)的区段A、和侧翼有具有不同特异性的突变attB位点的区段B组成的两个区段(例如PCR
产物),其中区段A上的一个attB位点与区段B上的一个attB位点相同(例如区段B可
以含有attB3和attB2位点),可以将这两个区段接合起来并插入载体中。这些区段可以
单独地或一起和含有两个attP位点的载体在BP反应中发生反应。或者,这些attP位点可
以存在于线性区段上。一个载体含有与区段A上存在的attB位点相容的attP位点(例如
attP1和attP3位点)。另一载体含有与区段B上存在的attB位点相容的attP位点(例
如attP3和attP2位点)。当使用线性区段提供attP位点时,每个attP位点均可以在区段
上提供。attB3和attP3位点有一定取向以致在DNA-B区段的5’末端产生attR3位点,而
在区段A的3’末端产生attL3位点。将所获进入克隆与目的载体在随后的LR反应中混合
以产生由被attB3位点分开的DNA-A和DNA-B组成的、克隆在目的载体主链中的产物。
[0550] 我们已使用此基本方案连接了两个区段,即与attR3-片段B-attL2进入克隆反应的attL1片段-A-attL3进入克隆,并将该连接的片段插入目的载体中。为了制备适当的进入克隆,我们构建了由attP1-ccdB-attP3和attP3R-ccdB-attP2组成的两个attP供体载体,以便它们能够和适当的attB PCR产物反应以将attB位点转化为attL和attR位点。名
称attP3R用于指attP3位点具有一定取向,以致与具有关连attB位点的DNA区段反应可以
导致在该区段上产生attR位点。图4对此作了示意性表示,与区段A相比区段B上attB3
的打点部分和划线部分具有相反取向。在区段B上打点部分邻近区段,而区段A上划线部
分邻近区段。
[0551] 通过构建以下DNA区段举例说明该方法,在该DNA区段中四环素抗性基因(tet)与β半乳糖苷酶基因重组以致这两个基因在产物中被attB位点分隔开。用5’-attB1
和3’-attB3末端PCR扩增该tet基因。用5’-attB3R和3’-attB3末端PCR扩增lacZ
基因。用聚乙二醇(PEG)沉淀这两个PCR产物。使用标准操作将B1-tet-B3PCR产物
TM
和attP1-ccdB-attP3供体载体混合并和BP CLONASE 反应,以产生attL1-tet-attL3
进入克隆。使用标准技术分离正确的tet进入克隆并制备质粒DNA。按相似方式,将
TM
attB3R-lacZ-attB2 PCR产物和attP3R-ccdB-attP2供体载体混合并与BP CLONASE 反应
以产生attR3-lacz-attL2进入克隆。
[0552] 为了将这两个区段接合在单个载体中,在20μl反应体积中制备含有以下成分TM
的LR CLONASE 反应物:60ng(25 fmoles)超螺旋tet进入克隆;75ng(20 fmoles)超螺
旋lacZ进入克隆;150ng(35 fmoles)用NcoI线性化的pDEST6(描述在PCT公开文本WO
TM
00/52027中,完整的公开并入本文作为参考);4μl反应缓冲液和4μl LR CLONASE 。终反应混合物含有51mM Tris·HCl、1mM EDTA、1mg/ml BSA、76mM NaCl、7.5mM亚精胺、160 ng Int、35ng IHF和35ng Xis。25℃孵育该反应物过夜,用2μl蛋白酶K溶液(2mg/ml)终止
反应。使用2μl试样转化100μl大肠杆菌DH5αLE细胞并铺在含有氨苄青霉素和XGal
8
的平板上。在与细胞的转化混合物中产生约35,000个菌落,效率为1.6×10cfu/μg pUC
DNA。所有菌落均表现出蓝色,说明存在lacZ基因。在含有四环素和XGal的平板上对24
个菌落划线。测试的所有菌落,24/24,均抵抗四环素。使用12个菌落接种2ml含有氨苄青霉素的LB培养液用于小量制备。12/12小量制备物含有正确长度(7kb)的超螺旋质粒。
[0553] 在一些实施方案中,正如图5所示,可以使两个区段和含有单一重组位点的载体反应,以便将区段上的其中一个重组位点转变为不同的重组位点。在一些实施方案中,含有attB位点的区段可以和具有attP位点的靶载体反应。例如,区段A和B可以一起或单独地和具有attP3位点的载体反应,以便将区段上的attB3位点分别转变为attL3和attR3。
这样,这两个区段间的随后LR反应就导致它们通过attB位点相接合。可以使用含有attP
位点的载体,在重组反应之前、同时或之后将这些区段接合起来,以便转变这些位点以产生由侧翼有attL1和attL3的DNA-A和侧翼有attR3和attL2的DNA-B组成的共合体分子。
随后的LR反应将产生由attB3分隔开的DNA-A和DNA-B组成的、克隆在载体主链中的产物
克隆。
[0554] 在一些实施方案中,设计以便将用于连接这些区段的attB转变为一对反应性位点attL和attR的attP位点可以以较短区段(例如限制性片段、合成的寡核苷酸双链、或
PCR片段)的形式提供。在BP反应中包含线性片段的反应物可能要求较长的孵育时间,例
如孵育过夜。
[0555] 也可以单独通过PCR将attB位点转变为attL或attR位点。含有attL或attR位点的PCR引物可以用于扩增在末端具有attB位点的区段。由于attL和attR的序列含
有attB位点序列的一部分,因此在此情况下attB位点充当可以和attL或attR PCR引物
退火的重叠区。退火的attL或attR引物向PCR产物末端的延伸将产生融合模板,使用与
attL或attR位点末端退火的侧翼引物该模板可以用于PCR扩增全长PCR产物。PCR反应
的引物可以以单链寡核苷酸形式提供。在一些优选实施方案中,这些引物以双链形式,例如作为PCR反应产物提供以扩增attL或attR位点。
[0556] 实施例4:将两个或更多个核酸片段克隆在同一载体的不同位置
[0557] 可以同时将两个或更多个核酸片段克隆在具有多组重组位点的载体的不同区域,每组重组位点位于一个选择标记侧翼。在一些实施方案中,其中的一或多个选择标记可以是负选择标记。
[0558] 正如图6所示,可以作为不连续片段或作为较大核酸分子如质粒的一部分存在的两个核酸区段A和B,可以同时被克隆在同一目的载体中。侧翼有彼此不相重组的重组位点(例如attL1和attL2)的核酸区段A(DNA-A)、和侧翼有彼此不相重组并且不与区段A侧
翼的位点重组的重组位点(例如attL3和attL4)的核酸区段B(DNA-B),可以在一个LR反
应中和目的载体组合。该目的载体将含有两对重组位点,每一对均经过选择以和位于其中一个区段侧翼的位点重组。作为一个例子,图6显示了各位于ccdB负选择标记侧翼的两对attR位点(attR1/attR2和attR3/attR4)。这三个核酸可以在一个单一的LR反应中组合。
所获产物将由克隆在目的载体不同区域的侧翼有attB位点对的DNA-A和DNA-B组成。
[0559] 正如图7所示,使用BP反应可以以类似方式将核酸区段插入载体中。例如,侧翼有重组位点attB1和attB2的DNA-A可以和侧翼有重组位点attB3和attB4的DNA-B及含有attP位点的载体在BP反应中组合。所获产物将由克隆在载体不同区域的attL位点对
之间的DNA-A和DNA-B组成。在一些实施方案中,可能期望将区段连续地插入靶载体中并
分离包含仅其中一个区段的中间分子。
[0560] 所有位点并不一定都来源于相同重组系统。例如,一个区段的侧翼可以是lox位点,而另一区段的侧翼有att位点。一个区段可以在一末端具有lox位点,而在另一末端具有att位点或在一个末端具有frt位点。本领域技术人员可以设想出各种位点组合,这些组合均在本发明范围内。
[0561] 在一些实施方案中,正如图6和7所示,可能期望分离反应的中间物。例如,可能期望分离具有仅其中一个插入区段的载体。该中间物可以就如此使用或可以充当随后重组反应的底物以便插入第二个区段。
[0562] 在一些实施方案中,本发明是克隆n个核酸区段的方法,其中n是大于1的整数,该方法包括步骤:提供n个核酸区段,每个区段的侧翼有两个独特的重组位点;提供包含2n个重组位点的载体,其中2n重组位点的每个均能够和其中一个核酸区段侧翼的其中一个重组位点重组;实施重组反应,以便使该n个核酸区段重组入载体中,籍此克隆此n个核酸区段。在其它实施方案中,该载体包含n个拷贝的选择标记,每个拷贝的选择标记侧翼有两个重组位点。在其它实施方案中,该载体包含两个或更多个不同的选择标记,每个选择标记的侧翼有两个重组位点。在一些实施方案中,其中一或多个选择标记可以是负选择标记。
[0563] 在一些实施方案中,本发明提供克隆方法,包括步骤:提供第1、2和3核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点,该第2核酸区段的侧翼有第3和第4重组位点、而该第3核酸区段的侧翼有第5和第6重组位点,其中该第2重组位点能够和第3
重组位点重组,而第1、4、5、6重组位点均不能和第1至第6重组位点中的任一个重组;提供包含位于第一选择标记侧翼的第7和第8重组位点以及位于第二选择标记侧翼的第9和第
10重组位点的载体,其中该第7至第10重组位点均不能与第7至第10重组位点中的任一
个重组;实施第一重组反应,以便第2和第3重组位点发生重组;实施第二重组反应,以便第1和第4重组位点分别和第7和第8重组位点重组、而第5和第6重组与第9和第10重
组位点重组,由此克隆该第1、2和3核酸区段。
[0564] 在一些实施方案中,核酸区段可以包含发挥启动子作用的序列。在一些实施方案中,该第1和第2核酸区段可以包含编码多肽的序列,而重组将这两个多肽放置在同一阅读框中。在一些实施方案中,核酸区段可以包含发挥转录终止序列功能的序列。
[0565] 本发明为核酸和蛋白质的模块构建提供了极为多样的方法。插入的核酸区段和载体均可以含有经过选择的序列,以致可以赋予产物分子期望的特性。在以图6和7作为例子的那些实施方案中,除了插入区段外,载体中与插入区段相邻的一或多个部分以及分隔插入区段的载体部分可以含有一或多个经选择的序列。
[0566] 在一些实施方案中,这些选择的序列可以编码核酶、表位标签、结构域、选择标记、内部核糖体进入序列、启动子、增强子、重组位点等。在一些优选实施方案中,分隔插入区段的载体部分可以包括一或多个侧翼有一对反应性重组位点的选择标记,以及用于插入这些核酸区段的重组位点。
[0567] 该方法将尤其适合于构建基因靶向载体。例如,重组位点对之间的载体区段可以编码一或多个选择标记例如新霉素抗性基因。区段A和B可以含有经选择的核酸序列,以致它们与待破坏的基因靶标的一部分一致或基本一致。在重组反应后,目的载体将含有位于正选择标记侧翼的目的基因的两个部分。然后可以使用任何常规技术,例如转染,将该载体插入细胞中,于是载体上的目的基因部分可以和该基因的基因组拷贝的同源部分发生重组。含有该插入载体的细胞可以基于选择标记所赋予的一或多种特性进行选择,例如,在选择标记是新霉素抗性基因时,可以基于细胞对G-418的抗性进行选择。
[0568] 在一些实施方案中,可以将一或多个负选择标记包括在不含靶基因区段和正选择标记的目的载体载体中。一或多个负选择标记的存在将允许选择除去基因组中插入了完整的目的载体的细胞、或选择除去目的载体在其中以染色体外方式维持的细胞。
[0569] 在一些优选实施方案中,可以在用于插入核酸区段的重组位点的附近放置其它的重组位点。在可能期望在打靶后从所靶向的基因中除去选择标记的基因打靶应用中,即所谓的“hit and run”技术,此类分子是有用的。本领域技术人员将明了,含有同源序列的区段并不必与基因序列相符。在一些情况下,可以对序列进行选择,以便其与基因外的染色体位置同源。
[0570] 该方法也十分适合于构建双顺反子表达载体。在一些实施方案中,含有双顺反子表达元件的表达载体中,两个结构基因从一个启动子表达并通过内部核糖体进入序列
(IRES,见Encarnacion,CurrentOpinion in Biotechnology10:458-464(1999),特此并入本文作为参考)分开。可以使用这些载体从单一一个结构表达两个蛋白。
[0571] 在一些实施方案中,可以不必控制其中一或多个核酸区段的取向,而且可以在该区段的两个末端使用相同特异性的重组位点。参考图6,如果区段A相对于区段B的取向并不关键,则L1位点可以位于区段A侧翼的两个末端上,而载体装备两个R1位点。在形成区段A和B的组合文库过程中,这可能对于产生额外的复杂性是有用的。
[0572] 实施例5:将多个片段组合在载体的单个位点中
[0573] 在一些实施方案中,本发明提供克隆n个核酸区段的方法,其中n是大于1的整数,该方法包括步骤:提供第1至第n个核酸区段,每个区段的侧翼有两个独特的重组位点,其中这些重组位点经选择以致位于第i区段ni侧翼的两个重组位点之一和位于第ni-1区段侧翼的重组位点之一反应,而位于第i区段侧翼的另一重组位点与位于第ni+1区段侧翼的重组位点之一反应;提供包含至少两个重组位点的载体,其中载体上这两个重组位点的一个与第1核酸区段上的一个位点反应,而载体上的另一位点和第n核酸区段上的一个重组
位点反应。本发明的再一目的是提供克隆方法,该方法包括步骤:提供第1、2、3核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点、第2核酸区段的侧翼有第3和第4重
组位点、而第3核酸区段的侧翼有第5和第6重组位点,其中该第2重组位点能够和第3重
组位点重组,而第4重组位点能够和第5重组位点重组;提供具有至少第7和第8重组位点
的载体,以便该第7重组位点能够和第1重组位点反应而第8重组位点能够和第6重组位
点反应;实施至少一次重组反应,以便第2和第3重组位点重组、第4和第5重组位点重组、第1和第7重组位点重组,而第6和第8重组位点重组,由此克隆该第1、2、3核酸区段。在一些实施方案中,至少一个核酸区段包含发挥启动子功能的序列。
[0574] 在一些实施方案中,至少两个核酸区段包含编码多肽的序列,而重组将这两个多肽放入同一个阅读框中。在一些实施方案中,至少一个核酸区段包含发挥转录终止序列功能的序列。在一些实施方案中,至少一个片段包含复制起点。在一些实施方案中,至少一个片段包含编码选择标记的序列。
[0575] 此实施方案以图8和9作为例子进行说明,在此情况下n=3。在此实施方案中,本发明提供克隆方法,该方法包括步骤:提供第1、2、3核酸区段,其中该第1核酸区段的侧翼有第1和第2重组位点、第2核酸区段的侧翼有第3和第4重组位点、而第3核酸区段的
侧翼有第5和第6重组位点,其中该第2重组位点能够和第3重组位点重组,而第4重组位
点能够和第5重组位点重组;提供包含第7和第8重组位点的载体;并实施至少一次重组反应,以便第2和第3重组位点重组、第4和第5重组位点重组、第1和第6重组位点分别和
第7和第8重组位点重组,由此克隆该第1、2、3核酸区段。
[0576] 正如以上讨论的,当指定区段的取向不关键时,可以修饰本发明,将具有相同特异性的重组位点放置在指定区段的两个末端,并相应地调整邻近区段的重组位点和/或载体中的重组位点。
[0577] 除了上述讨论的在单个载体中组合两个片段的用途外,此类实施方案可以用于从含有各种功能的单个片段构建载体。因此,本发明提供构建载体的模块方法。
[0578] 在一些实施方案中,至少一个核酸区段包含发挥启动子功能的序列。在一些实施方案中,至少两个核酸区段包含编码多肽的序列,而重组将这两个多肽放入同一阅读框中。在一些实施方案中,至少一个片段包含复制起点。在一些实施方案中,至少一个片段包含编码选择标记的序列。在一些实施方案中,一个片段可以包含编码一个以上功能的序列。在一些实施方案中,一个片段可以包含编码复制起点的序列和编码选择标记的序列。
[0579] 当使用本发明方法将多个核酸区段插入载体中时,这些区段的表达可以由相同调节序列或不同调节序列驱动。图20A显示含有两个插入DNA区段的载体的一个例子,其表达由不同的启动子驱动(即两个不同T7启动子)。
[0580] 本发明方法还可以用于制备允许在体内造成基因沉默的结构。一个使基因沉默的方法涉及制备称作干扰RNA(RNA interference,RNAi)的双链RNA。(见例如Mette等,EMBO J.,19:5194-5201(2000))。本发明方法可以按多种方式用于制备RNAi等分子。因此,可以使用本发明核酸分子的表达产物造成基因表达的沉默。
[0581] 图20B显示了设计以产生RNAi的结构的一个例子。在此结构中,将DNA区段插入载体中,以便相应于两条链的RNA可以作为两个不同的转录本产生。图20C显示了设计以产生RNAi的结构的另一例子。在此结构中,两个拷贝的DNA区段被插入载体中以致也产生相应于两条链的RNA。图20D显示了设计以产生RNAi的结构的再一例子。在该结构中,将两
个拷贝的DNA区段插入载体中,以便相应于两条链的RNA以单个转录本的形式产生。图20E显示的示例性载体系统包含两个载体,每个载体含有相同DNA区段的多个拷贝。这些DNA
区段之一的表达导致产生有义RNA,而另一个的表达导致产生反义RNA。因此,从图20B-20E给出的载体产生的RNA链将具有互补核苷酸序列,一般可以在生理条件下彼此杂交或发生分子内杂交。
[0582] 设计以产生RNAi的核酸区段,如图20B-20E所示载体,不一定与全长基因或可读框相对应。例如,当核酸区段相应于ORF时,该区段可以仅相应于该ORF的一部分(例如该ORF5’和3’末端的50个核苷酸)。而且,尽管图20B-20E显示了设计以产生RNAi的载体,但核酸区段也可以以其它形式(例如插入宿主细胞的染色体中)发挥相同功能。
[0583] 例如,涉及使用RNAi和反义RNA等化合物的基因沉默方法,对于鉴定基因功能尤其有用。例如,基因沉默方法可以用于减低或防止一或多个基因在细胞或生物体中的表达。然后,可以使用与功能的选择性抑制有关的表型表现,确定此“沉默”基因的作用。作为一个例子,Chuang等,Proc.Natl.Acad.Sci.(USA)97:4985-4990(2000)证明,在鼠芥(Arbidopsis thaliana)中体内产生RNAi可以改变基因活性。因此,本发明提供调节细胞和组织中核酸分子表达(包括RNAi和反义RNA的表达)的方法。本发明还提供方法,以制
备能够用于产生相应于DNA分子一或两条链的RNA的核酸分子。
[0584] 类似地,本发明涉及用于有核酶参与的基因沉默的化合物和方法。尤其是,本发明提供反义RNA/核酶融合物,该融合物包含(1)相应于靶基因的反义RNA和(2)切割RNA的一或多个核酶(例如,锤头核酶、发夹核酶、δ核酶、四膜虫(Tetrahymena)L-21核酶等)。
而且,本发明提供了表达这些融合物的载体、制备这些载体的方法、和使用这些载体抑制基因表达的方法。
[0585] 在一个实施方案中,构建编码与ccdB基因相邻的核酶的目的载体,其中该ccdB基因的侧翼有attR位点。使用LR反应,以便用当表达时产生反义RNA分子的核酸分子替换该ccdB基因。由此,表达产物将导致产生通过attB位点编码的间隔序列与核酶融合的反义序列。正如以下实施例13所讨论的,如果期望的话,可以从该转录本中除去该attB位点,或在某些情况下,可以将编码核酶的核酸嵌在该attB位点中。
[0586] 例如,与核酶融合的反义分子的表达可以用于切割细胞中的特异RNA分子。这正是因为转录本的反义RNA部分可以设计以便和特定的mRNA分子杂交。而且,转录本的核酶部分可以设计以切割与它杂交的RNA分子。例如,该核酶可以是切割双链RNA的核酶(例如四膜虫L-21核酶)。
[0587] 实施例6:使用抑制型tRNA产生融合蛋白
[0588] 上述近来发展的重组克隆技术允许将靶核酸从一个载体背景中快速移动到一或多个其它载体背景中。因为重组时间是位点特异性的,所有可以相对载体控制靶核酸的取向和阅读框。这种控制使得构建靶核酸序列和载体序列之间的融合成为一件简单的事。
[0589] 一般地说,可以以四种形式表达基因:氨基和羧基端均是天然的,在任一端经过修饰、或两端均经过修饰的形式。含有目的靶基因的结构可以包括N端甲硫氨酸的ATG密码子和羧基端的终止密码子。常常该基因结构包括可以位于ATG上游允许基因表达的翻译起始序列tis,即tis-ATG-ORF-终止密码子。此结构允许基因表达成含有与天然未克隆蛋白相同的氨基和羧基氨基酸的蛋白质。当此结构与氨基端蛋白标签如GST按符合阅读框的方式融合时,此标签具有其自己的tis,因此该结构是tis-ATG-标签-tis-ORF-终止密码子,而包含该ORF的tis的碱基将翻译为标签和ORF之间的氨基酸。此外,在mRNA的内部(即
在ORF的ATG而非标签的ATG)可以预期一定水平的翻译起始,导致一定量的天然蛋白质表
达而污染期望蛋白质。
[0590] DNA(小写字母):tis1-atg-标签-tis2-atg-orf-终止密码子
[0591] RNA(小写字母,斜体):tis1-atg-标签-tis2-atg-orf-终止密码子
[0592] 蛋白质(大写字母):ATG-标签-TIS2-ATG-ORF(tis1和终止密码子不翻译)+污染的ATG-ORF(ORF自tis2开始翻译)。
[0593] 使用重组克隆,构建含有临近重组位点的标签的载体,从而使标签和目的ORF的C和/或N端按符合阅读框的方式融合,这对于本领域技术人员而言是简单的。
[0594] 如果能够在多种载体中快速构建大量克隆,则本领域需要使无需操作基因结构本身而可以表达单个克隆基因的方式最大化。本发明使用一或多个抑制型tRNA抑制翻译在终止密码子处的终止,通过提供控制靶基因的C和/或N端融合表达的材料和方法满足了
此需要。因此,本发明提供了材料和方法,以制备侧翼有重组位点的基因结构。
[0595] 优选地,在编码目的蛋白质的基因的C端使用编码终止密码子的序列来制备该结构。在一些实施方案中,可以将终止密码子置于基因临近位置,例如在位于基因侧翼的重组位点内。可以通过重组将靶基因结构转移至能够向目的基因提供各种C端或N端标签(例如GFP、GST、His标签、GUS等)的各种载体中。当终止密码子位于基因羧基端时,在非抑制条件下(即当抑制型tRNA不表达时)将表达具有“天然”羧基末端氨基酸序列的基因,而
在抑制条件下基因将表达为羧基融合蛋白。本发明使用琥珀抑制基因supF为例,该基因是经突变识别UAG终止密码子的特定酪氨酸tRNA基因(tyrT)。本领域技术人员将明了,可以使用其它抑制基因和其它终止密码子实施本发明。
[0596] 本实施例中,我们将编码抑制型tRNA的基因掺入表达靶基因的载体。在其它实施方案中,编码抑制型tRNA的基因可以存在于宿主细胞的基因组中。在再其它实施方案中,编码抑制蛋白的基因可以位于不同的载体上并反式提供抑制蛋白。在此类实施方案中,含有抑制蛋白基因的载体可以具有经选择与含有基因结构的载体相容的复制起点。该相容载体的选择和制备属于本领域普通技术。本领域技术人员将明了,对用于反式提供抑制型tRNA的适当载体的选择可以包括选择适当的抗生素抗性标记。例如,如果表达靶基因的载体含有针对一种抗生素的抗生素抗性标记,则用于提供抑制型tRNA的载体可以编码对另
一抗生素的抗性。这就使得可以选出同时含有这两个载体的宿主细胞。
[0597] 在一些优选实施方案中,可以在上述所有实施方案中提供一个以上拷贝的抑制型tRNA。例如,可以提供含有多个拷贝编码抑制型tRNA的基因的宿主细胞。或者,可以在与目的靶基因相同的载体背景中提供处于相同或不同启动子下的多个抑制型tRNA基因拷
贝。在一些实施方案中,可以在与用于包含目的靶基因的载体不同的载体中提供多个拷贝的抑制型tRNA。在其它实施方案中,可以在含有编码目的蛋白的基因的载体上和/或在另一载体上和/或在宿主细胞的基因组中或以上的组合中,提供一或多个拷贝的抑制型tRNA基因。当提供一个以上拷贝的抑制型tRNA基因时,这些基因可以从相同或不同的启动子表达,而且这些启动子可以和用于表达编码目的蛋白的基因的启动子相同或不同。
[0598] 在一些实施方案中,可以提供两个或更多个不同的抑制型tRNA基因。在此类实施方案中,可以以多拷贝提供一或多种单个抑制基因,而且特定抑制型tRNA基因的拷贝数可以和另一抑制型tRNA基因的拷贝数相同或不同。每个抑制型tRNA基因独立于任何其它抑制型tRNA基因可以在用于表达目的基因的载体上和/或不同载体上和/或宿主细胞的基
因组中提供。在有些实施方案中,可以在一个以上的位置提供指定tRNA基因。例如,可以在含有目的基因的载体上提供一个拷贝的抑制型tRNA,而在另一载体上和/或在宿主细胞基因组中再提供一或多个拷贝。当提供一个以上拷贝的抑制型tRNA基因时,可以从相同或不同的启动子表达这些基因,而且这些启动子可以和用于表达编码目的蛋白的基因的启动子相同或不同,并且可以和用于表达不同tRNA基因的启动子相同或不同。
[0599] 参考图14,按符合阅读框的方式克隆GUS基因与GST基因,两者被TAG密码子分开。该质粒还含有编码抑制型tRNA的supF基因。将该质粒导入宿主细胞中,在该细胞中
大约60%的GUS基因表达为含有GST标签的融合蛋白。在对照实施方案中,当从缺少supE
基因的载体表达时,含有相同GUS-终止密码子-GST结构的质粒不表达产生可检测量的融
合蛋白。在此实施例中,supF基因作为含有GUS-GST融合物的mRNA的一部分表达。由于
tRNA一般是从较大的RNA分子加工来的,所以此类结构可以用于表达本发明抑制型tRNA。
在其它实施方案中,含有tRNA序列的RNA可以与含有目的基因的mRNA分开表达。
[0600] 在本发明一些实施方案中,目的靶基因和表达抑制型tRNA的基因可以由相同启动子控制。在其它实施方案中,目的靶基因可以从与抑制型tRNA的启动子不同的启动子表达。本领域技术人员将明了,在某些情况下,可能期望使用可调节的启动子控制抑制型tRNA和/或目的靶基因的表达。例如,可以通过lac启动子或其衍生物如tac启动子等启动子,控制目的靶基因和/或表达抑制型tRNA的基因。在所示实施方案中,目的靶基因和抑制型tRNA基因均从T7RNA聚合酶启动子表达。T7RNA聚合酶的诱导开启了目的基因(在本情况
下是GUS)和将抑制型tRNA表达为一个RNA分子的一部分的supF基因两者的表达。
[0601] 在一些优选实施方案中,抑制型tRNA基因的表达可以处于与目的基因的启动子不同的启动子的控制下。在一些实施方案中,可以在靶基因表达前表达抑制基因。这就使得可以在需要抑制因子通过抑制终止密码子来实现融合蛋白表达之前,将抑制因子的水平累积至一个高水平。例如,在抑制基因受控于可用IPTG诱导的启动子的本发明实施方案中,靶基因受控于T7 RNA聚合酶启动子,而T7 RNA聚合酶的表达又受到非IPTG的诱导信号如
NaCl所诱导的启动子的控制,这样就可以在诱导T7RNA聚合酶基因以及随后表达目的基因之前,使用IPTG开启抑制型tRNA的表达。在一些优选实施方案中,可以在诱导T7 RNA聚
合酶基因之前约15分钟至约1小时,诱导抑制型tRNA的表达。在一个优选实施方案中,可以在诱导T7 RNA聚合酶基因之前约15分钟至约30分钟,诱导抑制型tRNA的表达。在所
示具体实施例中,T7 RNA聚合酶基因的表达处于盐可诱导的启动子的控制下。具有在盐可诱导的启动子控制下的诱导型T7 RNA聚合酶基因拷贝的细胞系可从Invitrogen Corp.,
LifeTechnologies Division购买获得,产品名为BL21SI株。
[0602] 在一些优选实施方案中,可以按反馈环形式安排目的靶基因和抑制型tRNA的表达。例如,可以将目的靶基因置于T7 RNA聚合酶启动子的控制下,而将抑制基因置于T7启动子和lac启动子的控制下,T7RNA聚合酶基因本身由T7启动子和lac启动子转录,而且T7 RNA聚合酶基因具有一个琥珀终止密码子突变替代了正常的酪氨酸终止密码子,例如(883个密码子中的)第28位密码子。在抑制因子的水平足够高以能够给出显著抑制之前,不能产生活性T7 RNA聚合酶。然后,由于T7聚合酶表达抑制基因以及其自身,该聚合酶的水平快速上升。在其它优选实施方案中,仅抑制基因从T7 RNA聚合酶启动子表达。此类实施方案无需产生过量T7 RNA聚合酶即可给出高水平的抑制因子。在其它优选实施方案中,T7 RNA聚合酶基因具有一个以上的琥珀终止密码子突变(见例如图14B)。这就要求在产生有
效的T7RNA聚合酶之前有较高水平的抑制因子。
[0603] 在本发明一些实施方案中,可能期望有一个以上可被一个以上抑制型tRNA抑制的终止密码子。参考图15,构建载体以便允许从相同结构中可调节地表达目的蛋白的N和/或C端融合物。图15中第一标签序列TAG1是从图中箭头所指启动子表达。该标签序列
包括与该标签同一阅读框的终止密码子。终止密码子1可以位于标签序列的任何位置,并优选位于标签序列的C端或近C端。该终止密码子还可以位于重组位点RS1或内部核糖体
进入序列(IRES)中。该结构还包括一个包含终止密码子2的目的基因。该第一标签和目
的基因优选位于同一阅读框中,但将可造成移码致使第一标签与目的基因同一阅读框的序列包括在内也属于本发明范围。终止密码子2与目的基因同一阅读框,并优选位于该基因编码序列的末端或近末端。任选地,可以将终止密码子2置于重组位点RS2内部。该结构
还包括与目的基因在同一阅读框中的第2标签序列,在图15中表示为TAG2,而且,该第二标签序列可以任选地包括和该第2标签在同一阅读框中的终止密码子3。在该结构中,可以在第二标签的编码序列后包括转录终止子(图15中未显示)。终止密码子1、2和3可以相同
或不同。在一些实施方案中,终止密码子1、2和3是不同的。在1和2不同的实施方案中,可以使用相同的结构,通过改变适当抑制型tRNA的表达,表达N端融合物、C端融合物和天然蛋白质。例如,为了表达天然蛋白,则不表达抑制型tRNA并由IRES控制蛋白的翻译。当期望表达N端融合物时,则表达抑制终止密码子1的抑制型tRNA,而为了产生C端融合物,则表达抑制终止密码子2的抑制型tRNA。在一些情况下,可能期望表达双重靶向目的蛋白,在此时可以表达抑制终止密码子1和终止密码子2的抑制型tRNA。
[0604] 为了清楚地理解,本发明通过举例说明和实施例作了一定详细的描述,本领域普通技术人员将明了,可以通过在一个宽的相当条件、配方和其它参数范围内修饰或改变本发明以实施本发明,而不影响本发明或其任何具体实施方案的范围,而且,这些修饰或改变均旨在包括在所附权利要求的范围内。
[0605] 实施例7:测试进入载体和目的载体的功能
[0606] 作为本发明特定载体功能评价的一部分,重要的是功能性地测试载体重组的能力。该评价可以通过实施重组克隆反应,然后转化大肠杆菌并对菌落形成单位进行评分,来实现。然而,也可以进行另一测试,通过琼脂糖凝胶电泳,允许更快速更简单地评价指定进入载体或目的载体的功能。以下描述了此体外测试方法。
[0607] 材料和方法:
[0608] 使用质粒模板pEZC1301和pEZC1313(描述在PCT公开文本WO00/52027中,其完整公开并入本文作为参考)(每个模板均含有一个单一的野生型att位点),分别制备含有
attL或attR位点的PCR产物。用AlwNI使质粒模板线性化,酚抽提,乙醇沉淀并溶解在TE
中至1ng/μl浓度。
[0609] PCR引物(大写字母代表自野生型发生的碱基改变):
[0610] attL1 gggg agcct gcttttttGtacAaa gttggcatta taaaaaagca ttgc(SEQ ID NO:41)
[0611] attL2 gggg agcct gctttCttGtacAaa gttggcatta taaaaaagca ttgc(SEQ ID NO:42)
[0612] attLright tgttgccggg aagctagagt aa(SEQ ID NO:43)
[0613] attR1 gggg Acaag ttTgtaCaaaaaagc tgaacgaga aacgtaaaat(SEQ IDNO:44)
[0614] attR2 gggg AcaagttTgtaCaaGaaagc tgaacgaga aacgtaaaat(SEQ IDNO:45)
[0615] attRright ca gacggcatga tgaacctgaa(SEQ ID NO:46)
[0616] 将PCR引物溶解在TE中至500pmol/μl。制备由attL1+attL right引物、由attL2+attL right引物、由attR1+attR right引物、以及由attR2+attR right引物组成的引物混合物,每个混合物含有各引物20pmol/μl。
[0617] PCR反应:
[0618] 1μl质粒模板(1ng)
[0619] 1μl引物对(各20pmol)
[0620] 3μl H2O
[0621] 45μl Platinum PCR SuperMix (Invitrogen Corp.,LifeTechnologiesDivision)
[0622] 循环条件(在MJ热循环仪上进行):
[0623] 95℃/2分钟
[0624] 94℃/30秒
[0625] 58℃/30秒和72/1.5分钟,25个循环,
[0626] 72℃/5分钟
[0627] 5℃/保持
[0628] 所获attL PCR产物为1.5kb,而所获attR PCR产物为1.0kb.
[0629] PCR反应物通过加入150μl H2O和100μl3X PEG/MgCl2溶液进行PEG/MgCl2沉淀,之后离心。将PCR产物溶解在50μl TE中。通过凝胶电泳1μl对PCR产物进行定量,
估计为50-100ng/μl。
[0630] 按下述实施含有attL或attR位点的PCR产物和GATEWAYTM质粒的重组反应:
[0631] 8μl H2O
[0632] 2μl attL或attR PCR产物(100-200ng)
[0633] 2μl GATEWAYTM质粒(100ng)
[0634] 4μl5X目的缓冲液
[0635] 4μl GATEWAYTM LR ClonaseTM酶混合物
[0636] 20μl总体积(可以在保持同样化学计量的同时,通过将成分的体积调整为上述的约1/4,将反应物按比例下调为5μl的总体积)。
[0637] 将Clonase反应物在25℃孵育2小时。然后在琼脂糖凝胶上电泳10μl。通过attL1 PCR产物(1.0kb)和attR1 PCR产物(1.5kb)的反应,并通过attL2 PCR产物和attR2 PCR产物的类似反应,作为阳性对照反应,可以观察到较大(2.5kb)重组产物的形成。类似地,通过attL1 PCR产物和attR2 PCR产物的反应以及反之或attL PCR产物和attL质粒
的反应,等,作为阴性对照。
[0638] 在另一测试方法中,为了测试attB进入载体,我们使用了含有单个attP位点的质粒。含有单个att位点的质粒也可以用作重组底物一般地测试所有进入载体和目的载体(即,含有attL,attR、attB和attP位点的那些载体)。这就消除了进行PCR反应的需要。
[0639] 结果:
[0640] 与不含attL或attR PCR产物的对照反应物相比,当与含有att的适当PCR产物反应时,目的质粒和进入质粒形成能够容易地在琼脂糖凝胶上观察到的线性重组分子。由此,可以例如通过进行上述线性化分析确定根据本发明构建的目的载体和进入载体的功能。
[0641] 实施例8:使用通用衔接子引物进行PCR克隆
[0642] 如 本 文 所 述,使 用 GATEWAYTM PCR克 隆 系 统 (Invitrogen Corp.,Life Technologies Division;Rockville,MD)克隆PCR产物,需要在用于PCR反应的基因特异性引物的末端添加attB位点(attB1和attB2)。现有数据提示,使用者在基因特异性引物上添加了29bp(含有attB位点的25bp加上4个G残基)。使用通用attB衔接子引物和与
这些衔接子有指定重叠部分的较短基因特异性引物来产生含有attB的PCR产物,对于大量TM
GATEWAY PCR克隆系统的使用者而言是有利的。以下实验使用通用attB衔接子引物和含
有6bp至18bp各种长度的重叠区的基因特异性引物证明了该策略的实用性。结果证明,具有10bp至18b重叠区的基因特异性引物可以和通用attB衔接子引物一起成功地用于PCR
TM
扩增产生全长PCR产物。然后,使用GATEWAY PCR克隆系统,可以按指定方向高度忠实地成功克隆这些PCR产物。
[0643] 材料和结果:
[0644] 为了阐明通用attB衔接子引物可以和含有部分attB位点的基因特异性引物用于PCR反应中产生全长PCR产物,我们选择人血球蛋白cDNA一个256bp的小区域作为靶标,以致可以通过琼脂糖凝胶电泳将中间长度的产物与全长产物区分开。
[0645] 使用以下寡核苷酸:
[0646] B1-Hgb:GGGG ACA AGT TTG TAC AAA AAA GCA GGC T-5′-Hgb*
[0647] (SEQ ID NO:47)
[0648] B2-Hgb:GGGG ACC ACT TTG TAC AAG AAA GCT GGG T-3′-Hgb**
[0649] (SEQ ID NO:48)
[0650] 18B1-Hgb: TG TAC AAA AAA GCA GGC T-5′-Hgb
[0651] (SEQ ID NO:49)
[0652] 18B2-Hgb: TG TAC AAG AAA GCT GGG T-3′-Hgb
[0653] (SEQ ID NO:50)
[0654] 15B1-Hgb: AC AAA AAA GCA GGC T-5′-Hgb
[0655] (SEQ ID NO:51)
[0656] 15B2-Hgb: AC AAG AAA GCT GGG T-3′-Hgb
[0657] (SEQ ID NO:52)
[0658] 12B1-Hgb: AA AAA GCA GGC T-5′-Hgb
[0659] (SEQ ID NO:53)
[0660] 12B2-Hgb: AG AAA GCT GGG T-3′-Hgb
[0661] (SEQ ID NO:54)
[0662] 11B1-Hgb: A AAA GCA GGC T-5′-Hgb
[0663] (SEQ ID NO:55)
[0664] 11B2-Hgb: G AAA GCT GGG T-3′-Hgb
[0665] (SEQ ID NO:56)
[0666] 10B1-Hgb: AAA GCA GGC T-5′-Hgb
[0667] (SEQ ID NO:57)
[0668] 10B2-Hgb: AAA GCT GGG T-3′-Hgb
[0669] (SEQ ID NO:58)
[0670] 9B1-Hgb: AA GCA GGC T-5′-Hgb
[0671] 9B2-Hgb: AA GCT GGG T-3′-Hgb
[0672] 8B1-Hgb: A GCA GGC T-5′-Hgb
[0673] 8B2-Hgb: A GCT GGG T-3′-Hgb
[0674] 7B1-Hgb: GCA GGC T-5′-Hgb
[0675] 7B2-Hgb: GCT GGG T-3′-Hgb
[0676] 6B1-Hgb: CA GGC T-5′-Hgb
[0677] 6B2-Hgb: CT GGG T-3′-Hgb
[0678] attB1衔接子:GGGG ACA AGT TTG TAC AAA AAA GCA GGC T
[0679] (SEQ ID NO:47)
[0680] attB2衔接子:GGGG ACC ACT TTG TAC AAG AAA GCT GGG T
[0681] (SEQ ID NO:48)
[0682] *-5′-Hgb=GTC ACT AGC CTG TGG AGC AAG A(SEQ IDNO:59)
[0683] **-3′-Hgb=AGG ATG GCA GAG GGA GAC GAC A(SEQ IDNO:60)
[0684] 这些实验的目的在于开发一种简单而有效的通用衔接子PCR方法以产生适用于TM
GATEWAY PCR克隆系统的含有attB的PCR产物。该反应混合物和热循环条件应简单而有
效,以便该通用衔接子PCR方法可以常规地适用于任何PCR产物克隆应用。
[0685] 首先我们发现了使用含有18bp和15bp重叠的基因特异性引物和通用attB引物能够成功地主要扩增全长PCR产物的PCR条件。这些条件描述如下:
[0686] 10pmol基因特异性引物
[0687] 10pmol通用attB衔接子引物
[0688] 1ng含有人血球蛋白cDNA的质粒
[0689] 100ng人白细胞cDNA文库DNA
[0690] 5μl 10X PLATINUM Taq HiFi 反 应 缓 冲 液 (Invitrogen Corp.,LifeTechnologies Division)
[0691] 2μl50mM MgSO4
[0692] 1μl10mM dNTP
[0693] 0.2μl PLATINUM Taq HiFi (1.0个单位)
[0694] 加水至50μl总反应体积
[0695] 循环条件:
[0696]
[0697] 为了评价该方法的效率,在3%琼脂糖-1000凝胶上电泳50μl PCR反应物的2μl(1/25)。当重叠区为12bp或更少时,含有一个或不含通用attB衔接子的较小中间产
物在反应物中占优势。通过滴定基因特异性引物和通用attB衔接子引物的量,对PCR反应条件作进一步优化。出来所加引物的量不同外,按上述配制PCR反应物:
[0698] 0、1、3或10pmol基因特异性引物
[0699] 0、10、30或100pmol衔接子引物
[0700] 循环条件:
[0701]
[0702] 使用限制量的基因特异性引物(3pmol)和过量的衔接子引物(30pmol)减少了较小中间产物的量。使用这些反应条件,我们将为了主要获得全长PCR产物所必需的重叠区减少至12bp。在以下PCR反应中我们进一步对基因特异性引物和衔接子引物的量作了优
化:
[0703] 0、1、2或3pmol基因特异性引物;
[0704] 0、30、40或50pmol衔接子引物
[0705] 循环条件:
[0706]
[0707] 使用2pmol基因特异性引物和40pmol衔接子引物进一步减少了中间产物的量并主要产生具有包含11bp重叠区的基因特异性引物的全长PCR产物。在任何PCR应用中,可
以通过无衔接子对照评价PCR反应是否成功。当在标准琼脂糖凝胶上电泳1/25至1/10PCR
反应物时,使用限制量的基因特异性引物应产生微弱的或几乎不可见的条带。加入通用
attB衔接子引物应产生强PCR反应,产物的整个产量要高得多。
[0708] 使用CONCERT 快速PCR纯化系统(大于500bp的PCR产物可以用PEG沉淀),从使用具有18bp、15bp、12bp、11bp和10bp重叠区的基因特异性引物进行的反应物中纯化PCRTM
产物。随后使用GATEWAY PCR克隆系统(Invitrogen Corp.,Life Technologies Division;
Rockville,MD)将该纯化的PCR产物克隆在含有attP的质粒载体中,并转化大肠杆菌。在适当的抗生素培养基上选择菌落并计数,然后通过PCR筛选具有正确插入片段和取向的菌落。
[0709] 从具有部分人β珠蛋白(Hgb)基因的质粒克隆,利用attB衔接子PCR产生的粗TM
PCR产物(未纯化的),也用于GATEWAY PCR克隆系统反应中。使用全长attB B1/B2-Hgb、TM
12B1/B2、11B1/B2和10B1/B2attB重叠Hgb引物产生的PCR产物被成功地克隆在GATEWAY
pENTR21 attP载体(描述在PCT公开文本WO00/52027中,其完整公开并入本文作为参考)
中。对于每个PCR产物测试了24个菌落(24X4=总共96),并通过PCR验证了每个菌落均
含有正确插入片段。以下显示了克隆效率,表示为cfu/ml:
[0710]所用引物 cfu/ml
Hgb全长attB 8,700
Hgb12bp重叠 21,000
Hgb11bp重叠 20,500
Hgb10bp重叠 13,500
GFP对照 1.300
[0711] 有趣的是,重叠PCR产物的克隆效率比全长attB PCR产物的克隆效率高,而且,可以推测,正如在琼脂糖凝胶上所观察到的,衔接子PCR产物比全长attB PCR产物稍微清楚。菌落产生量的差异也可以反映具有完整attB位点的PCR产物分子的比例。
[0712] 使用attB衔接子PCR方法,用具有12bp attB重叠区的PCR引物从白细胞cDNA文库和自Hela总RNA制备的第一链cDNA扩增不同大小的cDNA(从1至4kb)。尽管通过
该方法能够扩增此4种cDNA中的三种,但也观察到非特异扩增产物,在某些条件下这些非特异产物将干扰基因特异性扩增。此非特异产物是在仅含有attB衔接子引物且没有任何
基因特异性重叠引物存在的反应物中扩增产生的。我们通过增加PCR反应的严紧性并降低attB衔接子PCR引物的浓度,减少了此非特异产物。
[0713] 这些结果说明,本实施例描述的衔接子引物PCR方法可以极好地用于克隆基因。这些结果也证明我们开发了一种简单而有效的方法,该方法允许使用与通用attB衔接子
TM
引物部分重叠的较短基因特异引物来扩增与GATEWAY PCR克隆系统相容的PCR产物。在
常规PCR克隆应用中,推荐使用12bp的重叠区。因此,本实施例描述的方法可以减少基因TM
特异性引物的长度多达17个残基或更多,对于大量使用GATEWAY PCR克隆系统而言,这就显著节约了寡核苷酸的费用。此外,使用本实施例描述的方法和分析,普通技术人员可以使用仅常规实验,设计和使用基于或含有其它重组位点或其片段(如attL、attR、attP、lox、FRT等)的类似引物衔接子。
[0714] 作为向PCR引物添加29个碱基的替代方法,可以使用含有添加在模板特异性引物上的少至12个attB碱基的引物,以两步PCR方案产生attB PCR产物。在第一步,使用含有attB的12个碱基的模板特异引物在10个PCR循环中扩增靶基因。将该PCR反应物的
一部分转移至含有通用attB衔接子引物的第2PCR反应物中以扩增整个attB PCR产物。
[0715] 按以下所示,设计在5’末端具有attB1和attB2的12个碱基的模板特异性引物:
[0716] 12attB1:AA AAA GCA GGC TNN(SEQ ID NO:139)--正向模板特异性引物
[0717] 12attB2:A GAAAGC TGG GTN(SEQ ID NO:140)--反向模板特异性引物
[0718] 一般地,将这些引物的模板特异性部分设计为具有大于50的Tm。最适退火温度由引物的模板特异性部分的Tm确定。
[0719] attB1衔接子引物:GGGGACAAGTITGTACAAAAAAGCAGGCT(SEQID NO:47)
[0720] at tB2衔接子引物:GGGGACCACTTTGTACAAGAAAGCTGGGT(SEQID NO:48)
[0721] 制备50μl含有10pmol的各种模板特异性引物和适当量的模板DNA的PCR反应物。将含有此PCR反应混合物的管子放置在热循环仪并95度孵育2分钟。
[0722] 按以下进行10个PCR循环:
[0723] 变性 94℃15秒
[0724] 50-60℃退火30秒
[0725] 68℃延伸按每kb靶扩增子1分钟
[0726] 将10μl PCR反应产物转移至含有attB1和attB2衔接子引物各40pmol的40μlPCR反应混合物中。然后将含有该混合物的管子放置在95度的热循环仪中并孵育1分钟。
[0727] 按以下进行5个PCR循环:
[0728] 变性 94℃15秒
[0729] 45℃退火30秒
[0730] 68℃延伸按每kb靶扩增子1分钟
[0731] 然后按以下进行15至20个PCR循环:
[0732] 变性 94℃15秒
[0733] 55℃退火30秒
[0734] 68℃延伸按每kb靶扩增子1分钟
[0735] 然后通过琼脂糖凝胶电泳分析此扩增产物。
[0736] 实施例9:突变分析λ噬菌体的attL和attR位点:位点特异性重组中att位点特异性的决定因素
[0737] 为了研究att位点特异性的决定因素,系统地诱变λ噬菌体的attL和attR位点,并检测这些位点以精确地确定哪些突变造成att位点特异性的独特改变。正如本文提及的,以前已将特异性的决定因子定位在所有4种λ att位点(attB、attP、attL和attR)均一致的15bp核心区(GCTTTTTTATACTAA(SEQ ID NO:37))中的7bp重叠区(TTTATAC,该
区域被定义整合酶蛋白的切割位点,并是发生链交换的区域)。
[0738] 因此,为了检查att序列对位点特异性的影响,通过PCR产生突变的attL和attR位点,并在体外位点特异性重组分析中测试这些位点。以此方式,在核心att位点的7bp重叠区内制备所有可能的单碱基对变化,并在此7bp重叠区之外但在此15bp核心att位点中
制备其它5个改变。在体外重组分析中使用各attR PCR底物测试所有的attL PCR底物。
[0739] 方法
[0740] 为了检测突变的attL和attR位点的重组效率和特异性,发展了一种简单的体外位点特异性重组分析。由于attL和attR的核心区靠近这些位点的末端,因此可以将期望的核苷酸改变掺入PCR引物中并产生一系列含有突变的attL和attR位点的PCR产物。含有
TM TM
attL和attR位点的PCR产物在使用GATEWAY LR CLONASE 酶混合物(Invitrgen Corp.,
Life Technologies Division,Rockville,MD)的体外反应中用作底物。1.5kb attL PCR产物和1.0kb attR PCR产物之间的重组导致产生一个2.5kb的重组分子,我们使用琼脂糖凝胶电泳和溴化乙啶染色监测该重组分子。
[0741] 质粒模板pEZC1301和pEZC1313(描述在PCT公开文本WO00/52027中,其完整公开并入本文作为参考),每个模板分别含有一个野生型attL或attR位点,使用这些质粒模TM
板制备重组底物。以下列出了在PCR反应中用于产生用作LR CLONASE 反应底物的attL
PCR产物的引物(大写字母代表不同于野生型序列的改变,而下划线是15bp核心att位点
中的7bp重叠区;使用类似的一组PCR引物制备含有匹配突变的attR PCR产物):
[0742] GATEWAYTM位点(注意:在GATEWAYTM质粒中attL2序列以“accca”开头,而在本实施例中attL2位点以“agcct”开头,反映了核心区域外的野生型attL。):
[0743] attL1:gggg agcct gcttttttGtacAaa gttggcatta taaaaa-agca ttgc(SEQID NO:41)[0744] attL2:gggg agcct gctttCttGtacAaa gttggcatta taaaaa-agca ttgc(SEQID NO:42)[0745] 野生型:
[0746] attLO:gggg agcct gcttttttatactaa gttggcatta taaaaa-agcattgc(SEQID NO:61)[0747] 从野生型改变单碱基:
[0748] attLT1A:gggg agcct gctttAttatactaa gttggcatta taaaaa-agca ttgc(SEQID NO:62)[0749] attLT1C:gggg agcctgctttCttatactaa gttggcattataaaaa-agca ttgc(SEQ ID NO:63)[0750] attLT1G:gggg agcct gctttGttatactaa gttggcatta taaaaa-agca ttgc(SEQID NO:64)[0751] attLT2A:gggg agcctgcttttAtatactaa gttggcatta taaaaa-agca ttgc(SEQ ID NO:65)[0752] attLT2C:gggg agcct gcttttCtatactaa gttggcatta taaaaa-agcattgc(SEQID NO:66)[0753] attLT2G:gggg agcctgcttttGtatactaagttggcattataaaa-aagca ttgc(SEQID NO:67)[0754] attLT3A:gggg agcct gctttttAataCtaa gttggcattataaaa-aagca ttgc(SEQ ID NO:68)[0755] attLT3C:gggg agcct gctttttCatactaa gttggcattataaaa-aagca ttgc(SEQ ID NO:69)[0756] attLT3G:gggg agcctgctttttGatactaa gttggcattataaaa-aagca ttgc(SEQID NO:70)[0757] attLA4C:gggg agcct gcttttttCtactaa gttggcattataaaa-aagca ttgc(SEQID NO:71)[0758] attLA4G:gggg agcct gcttttttGtactaa gttggcattataaaa-aagca ttgc(SEQ ID NO:72)[0759] attLA4T:gggg agcctgcttttttTtactaa gttggcattataaaa-aagca ttgc(SEQ ID NO:73)[0760] attLT5A:gggg agcct gcttttttaAactaa gttggcatta taaaa-aagca ttgc(SEQ ID NO:74)[0761] attLT5C:gggg agcct gcttttttaCactaa gttggcatta taaaa-aagca ttgc(SEQ ID NO:75)[0762] attLT5G:gggg agcctgcttttttaGactaa gttggcatta taaaa-aagca ttgc(SEQID NO:76)[0763] attLA6C:gggg agcct gcttttttatCctaa gttggcattataaaa-aagcattgc(SEQ ID NO:77)[0764] attLA6G:gggg agcct gcttttttatGctaa gttggcattataaaa-aagca ttgc(SEQID NO:78)[0765] attLA6T:gggg agcct gcttttttatTctaa gttggcatta taaaa-aagca ttgc(SEQ ID NO:79)[0766] attLC7A:gggg agcct gcttttttataAtaa gttggcattataaaa-aagca ttgc(SEQ ID NO:80)[0767] attLC7G:gggg agcct gcttttttataGtaa gttggcatta taaaa-aagca ttgc(SEQ ID NO:81)[0768] attLC7T:gggg agcct gcttttttataTtaa gttggcattataaaa-aagca ttgc(SEQ ID NO:82)[0769] 在7bp重叠外改变单碱基:
[0770] attL8:gggg agcct Acttttttatactaa gt tggcattataaaa-aagca ttgc(SEQ ID NO:83)[0771] attL9:gggg agcct gcCtttttatactaa gttggcattataaaaa-agca ttgc(SEQ ID NO:84)[0772] attL10:gggg agcct gcttCtttatactaa gttggcatta taaaaa-agca ttgc(SEQID NO:85)[0773] attL14:gggg agcctgcttttttatacCaa gt tggcattataaaaa-agca ttgc(SEQID NO:86)[0774] attL15:gggg agcct gcttttttatactaG gttggcatta taaaaa-agcattgc(SEQID NO:87)[0775] 注意:其中头9个碱基是gggg agcca(即紧接15bp核心区之前的位置腺苷替代了胸苷)的其它载体,可以或可以不含有上述单碱基对替换(或缺失),这些载体也可以用于这些实验中。
[0776] 按下述实施含有attL和attR的PCR产物的重组反应:
[0777] 8μl H2O
[0778] 2μl attL PCR产物(100ng)
[0779] 2μl attR PCR产物(100ng)
[0780] 4μl 5X缓冲液
[0781] 4μl GATEWAYTM LR CLONASETM酶混合物
[0782] 20μl总体积
[0783] 将CLONASETM反应物25℃孵育2小时。
[0784] 加入2μl10X CLONASETM终止液(蛋白酶K,2mg/ml)以终止反应。
[0785] 在1%琼脂糖凝胶上电泳10μl反应混合物。
[0786] 结果
[0787] 使用各attR PCR底物在体外重组分析中测试了每个attL PCR底物。结果显示,7bp重叠区(TTTATAC)头3位中的改变强烈地改变了重组的特异性。这些突变的att位点
每个均与野生型一样发生重组,但仅与它们的关连突变伙伴重组;没有检测到它们与任何其它att位点突变体的重组。相反,最后4个位置中的改变仅部分改变特异性;这些突变体与其关连突变体和野生型att重组,并且这些突变与除了在7bp重叠区头3位中具有突变
的那些突变att位点外的所有其它突变att位点部分重组。发现7bp重叠区外的改变不影
响重组的特异性,但一些改变确实影响重组的效率。
[0788] 基于这些结果,确定了以下att位点特异性的规则:
[0789] ·仅7bp重叠区中的改变影响特异性。
[0790] ·头3位中的改变强烈地影响特异性。
[0791] ·最后4位中的改变微弱地影响特异性。
[0792] 通过该方法,我们还评价了影响重组反应的整个效率的突变。在这些实验中,我们观察到,当与其关连attR伙伴反应时,attL T1A和attL C7T底物轻微地增加(少于2倍)重组效率。并观察到减低重组效率(大约2-3倍)的突变,包括attLA6G、attL14和attL15。
可以推测,这些突变反映了可影响Int蛋白在核心att位点结合的改变。
[0793] 这些实验的结果证明,7bp重叠区头3位(TTTATAC)中的改变强烈地改变了重组特异性(即,在头3个胸苷中具有一或多个突变的att序列仅与其关连伙伴重组,而不会与任何其它att位点突变体交叉反应)。相反,最后4位(TTTATAC)中的突变仅部分改变特
异性(即,在最后4位中具有一或多个突变的att位点将与野生型att位点及所有其它的
att位点(除了在7bp重叠区头3位的一或多个位置中具有突变的那些att位点外)有部
分的交叉反应)。没有发现7bp重叠区之外的突变影响重组特异性,但发现一些影响重组效率(即造成重组效率降低)。
[0794] 实施例10:发现增强GATEWAYTM克隆反应效率的att位点突变
[0795] 在设计以了解att位点特异性的决定因子的实验中,我们在attL的核心区中进行了点突变。然后在LR反应中使含有这些突变attL序列的核酸分子和含有关连attR位点(即,含有相应于attL位点中突变的那些突变的attR位点),并按上述确定重组效率。我
们注意到位于att位点核心区中的几个突变轻微地增加(少于2倍)或降低(2-4倍之间)
重组反应的效率(表5)。
[0796]
[0797] 我们还注意到这些突变大概反映了分别增加或降低整合酶蛋白结合核心att位点的相对亲和力的改变。文献中对整合酶核心结合位点(CAACTTNNT)的共有序列作过推
测,但并未对此进行直接测试(见例如,Ross和Landy,Cell33:261-272(1983))。此共有核心整合酶结合序列是通过比较attP和attB中发现的4个核心att位点每一个的序列及
与核心序列类似并且表现出与整合酶在体外结合的5个非att位点的序列而确立的。这些
TM
实验提示,可以鉴定出许多增加整合酶与核心att位点的结合并由此增加GATEWAY 克隆反应的效率的att位点突变。
[0798] 实施例11:核心区突变对重组效率的影响
[0799] 为了直接地比较att位点核心区中突变的克隆效率,在attB1-tet-attB2PCR产物的attB2位点中制备单碱基改变。然后在BP反应中,使含有这些突变attB2序列的核酸分子和含有非关连attP位点(即野生型attP2)的核酸分子反应,并按上述确定重组效率。与标准attB1-tet-attB2PCR产物相比,这些含有突变attB2的PCR产物的克隆效率显示在表
6中。
[0800]
[0801] 正如以上提及的,与attB1-tet-attB2PCR产物相比,attB2.2位点中的单碱基改变使attB1-tet-attB2.2PCR产物的克隆效率增加131%。有趣的是,该突变改变了整合酶的attB2核心结合位点,产生与提出的共有序列更紧密匹配的序列。
[0802] 进行其它实验,以直接地比较attB1-tet-attB2PCR产物的克隆效率和所含attB位点具有提出的整合酶核心结合位点共有序列的PCR产物的克隆效率。使用以下attB位
点扩增attB-tet PCR产物:
[0803] attB1ggggacaagtttgtacaaaaaagc aggct(SEQ ID NO:47)
[0804] attB1.6ggggacaactttgtacaaaaaagTTggct(SEQ ID NO:104)
[0805] attB2ggggaccactttgtacaagaaagctgggt(SEQ ID NO:48)
[0806] attB2.10ggggacAactttgtacaagaaagTtgggt(SEQ ID NO:105)
[0807] 在 300 ng (100fmol)pDONR201(Ivitrogen Corp.,LifeTechnologiesDivision,Cat No.11798-014)和80ng(80fmol)attB-tet PCR产物之间20μl体积中通过
25℃孵育1.5小时,进行BP反应,产生pENTR201-tet进入克隆。表7显示了对上述attB
位点在BP反应中的克隆效率进行的比较。
[0808]
[0809] 这些结果证明,含有优选与提出的整合酶核心结合位点的共有序列匹配的序列的TMattB PCR产物能够以比标准GATEWAY attB1和attB2PCR产物高4倍的效率产生进入克隆。
[0810] 然后 通 过LR反 应(300ng(64fmol)将 以 上 制备 的 进 入克 隆 转 移至pDEST20(Invitrogen Corp.,Life Technologies Division,CatNo.11807-013),方式是:
使300ng(64fmole)pDEST20与50ng(77fmol)各pENTR201-tet进入克隆在20μl体积中混
合;孵育1小时(25℃孵育)。表8对这些反应的克隆效率进行了比较。
[0811]
[0812] 这些结果证明,引入attB1.6和attB2.10中随着基因转移至进入克隆的突变轻微地增加LR反应的效率。因此,本发明不仅包括attB位点中增加重组效率的突变,还包括导致通过BP反应产生的attL位点的相应突变。
[0813] 为了检验在一定PCR产物量范围内attB1.6-tet-attB2.10PCR产物克隆效率的增加,进行与上述类似的实验,在这些实验中加入反应混合物中的attB PCR产物量经过滴定。
结果显示在表9中。
[0814]
[0815] 这些结果证明,在20ng量时使用attB1.6-tet-attB2.10PCR产物与标准attB1-tet-attB2PCR产物相比克隆效率增加6倍之多。
[0816] 实施例12:测定最佳重组效率对attB序列的要求
[0817] 为了检测对attB的序列要求并确定在简并attB位点群体中哪个attB位点可以以最高的效率进行克隆,我们进行了一系列实验。设计在attB位点的B臂中含有5个简并
碱基的简并PCR引物。由此,这些简并序列在BP反应中随基因转移至进入克隆,并随后在LR反应中随着基因被转移至表达克隆中。因此,简并attB和attL位点群可以从attB向
attL往返地循环多个周期。通过改变每个转移步骤的反应条件(例如,通过减少反应时间和/或降低DNA浓度),可以在每个周期逐渐增加反应的严紧性,由此富集更为有效地进行反应的attB和attL位点群。
[0818] 使用以下简并PCR引物从pUC18扩增含有lacZα片段的500bp片段(仅显示每个引物的attB部分):
[0819] attB1:
[0820] GGGG ACAAGTTTGTACAAAAAAGC AGGCT(SEQ ID NO:47)attBln16-20:
[0821] GGGG ACAAGTTTGTACAAA nnnnn AGGCT(SEQ ID NO:106)attBln21-25:
[0822] GGGG ACAAGTTTGTACAAA AAAGC nnnnn(SEQ ID NO:107)attB2:
[0823] GGGG ACCACTTTGTACAAG AAAGC TGGGT(SEQ ID NO:48)attB2n16-20:
[0824] GGGG ACCACTTTGTACAAG nnnnn TGGGT(SEQ ID NO:108)attB2n21-25:
[0825] GGGG ACCACTTTGTACAAG AAAGC nnnnn(SEQ ID NO:109)
[0826] 简并att位点的起始群体大小是45或1024个分子。通过两个BP反应和两个LR反应转移4个不同的群体。使用每个反应物进行转化后,通过在含有适当选择抗生素的液体培养基中培养,扩增转化体群体。通过碱裂解小量制备法从克隆群体制备DNA,并用于以下反应。以下显示了BP和LR克隆反应的结果。
[0827] BP-1,过夜反应:
[0828]cfu/ml 对照的百分比
attB1-lacZa-attB2 78,500 100%
attBln16-20-lacZa-attB2 1,140 1.5%
attBln21-25-lacZa-attB2 11,100 14%
attB1-lacZa-attB2n16-20 710 0.9%
attB1-lacZa-attB2n21-25 16,600 21%
[0829] LR-1,pENTR201-lacZaxpDEST20/EcoRI,1小时反应
[0830]cfu/ml 对照的百分比
attL1-lacZa-attL2 20,000 100%
attL l n16-20-lacZa-attL2 2,125 11%
attL1n21-25-lacZa-attL2 2,920 15%
attL1-lacZa-attL2n16-20 3,190 16%
attL1-lacZa-attL2n21-25 1,405 7%
[0831] BP-2,pEXP20-lacZa/ScaI x pDONR201,1小时反应
[0832]cfu/ml 对照的百分比
attB1-lacZa-attB2 48,600 100%
attBln16-20-lacZa-attB2 22,800 47%
attBln21-25-lacZa-attB2 31,500 65%
attB1-lacZa-attB2n16-20 42,400 87%
attB1-lacZa-attB2n21-25 34,500 71%
[0833] LR-2,pENTR201-lacZa x pDEST6/NcoI,1小时反应
[0834]cfu/ml 对照的百分比
attL1-lacZa-attL2 23,000 100%
attL1n16-20-lacZa-attL2 49,000 213%
attL1n21-25-lacZa-attL2 18,000 80%
attL1-lacZa-attL2n16-20 37,000 160%
attL1-lacZa-attL2n21-25 57,000 250%
[0835] 这些结果证明,随着每次连续的转移,整个att位点群的克隆效率都会增加,而且在attB位点的定义上有极大的灵活性。可以从上述反应物中分离特定克隆,单个地测试重组效率,并进行测序。然后将这些新特异性和已知实例进行比较,以指导设计具有新重组特异性的新序列。此外,基于上述富集和筛选方案,普通技术人员可以容易地确定和使用其它重组位点(例如其它att位点、lox、FRT等)中的序列,导致使用含有这些序列的重组反应的特异性增加。
[0836] 实施例13:将功能性成分嵌入重组位点中
[0837] 用于本发明的重组位点还可以具有嵌入的功能或性质。嵌入的功能是指由重组位点中不直接与重组效率或特异性有关的核苷酸序列所赋予的功能或性质。例如,重组位点可以含有蛋白质编码序列(例如蛋白内含子编码序列)、内含子/外显子拼接位点、复制起点、和/或终止密码子。一般地,构成重组位点的核酸链越长,越易于向该位点掺入嵌入功能或性质。相反,重组位点越长就越可能具有干扰期望功能或性质的特征(例如终止密码子)。而且,还可以制备具有一个以上(例如2、3、4、5等)嵌入功能或性质的重组位点。
[0838] 正如以下解释的,一方面,本发明提供方法用于从RNA分子去除重组位点编码的核苷酸序列。该方法的一个例子应用了内含子/外显子拼接位点以从RNA转录本中除去重组位点编码的RNA。再有,正如以下阐述的,编码这些内含子/外显子拼接位点的核苷酸序列可以完全地或部分地嵌在所编码序列要从RNA分子中切除的重组位点中,或这些内含子/外显子拼接位点可以由临近的核酸序列编码。类似地,一个外显子/内含子拼接位点
可以由重组位点编码,而另一个内含子/外显子拼接位点可以由其它核苷酸序列(例如载
体的核苷酸序列或目的核酸)编码。核酸拼接讨论于以下出版物中:R.Reed,Curr.Opin.Genet.Devel.6:215-220(1996);S.Mount,Nucl.Acids.Res.10:459-472(1982);P.Sharp.Cell77:805-815(1994);K.Nelson和M.Green,Genes and Devel.23:319-329(1988);和T.Cooper和W.Mattox,Am.J.Hum.Genet.61:259-266(1997)。
[0839] 在某些情况下,从RNA转录本中除去相应于重组位点的RNA,或除去重组位点编码的氨基酸残基是有利的。可以有多种方式除去这些序列,而且可以发生在RNA或蛋白质水平上。一种情况是,当核酸分子的ORF按一定方向插入载体以旨在表达ORF编码的氨基酸残基和载体编码的氨基酸残基(例如GFP)之间的融合蛋白(例如GFP)时,通常除去由重
组位点转录产生的RNA是有利的。在此情况下,ORF和载体编码序列之间存在插入的重组
位点可以导致重组位点(1)向mRNA提供密码子以导致在表达产物中包括额外的氨基酸残
基,(2)向mRNA提供终止密码子以阻碍期望融合蛋白的产生,和/或(3)造成mRNA的阅读
框移动以致两个蛋白不按符合阅读框”的方式融合。
[0840] 从mRNA分子中除去重组位点的一个方法涉及使用内含子/外显子拼接位点(即拼接供体和拼接受体位点)。可以将拼接位点适当地放置在多个位置。使用设计以表达具有N端GFP融合物的插入ORF的目的载体作为例子,可以由位于GFP编码序列3’的载体序
列编码第1个拼接位点,而第2个拼接位点可以部分地嵌在分隔GFP编码序列和ORF编码
序列的重组位点中。而且,该第2个拼接位点可以接近重组位点的3’末端或可以位于距离重组位点3’短距离(例如2、4、8、10、20个核苷酸)的位置。此外,根据重组位点的长度,第2个拼接位点可以完全地嵌在重组位点中。
[0841] 上述方法的修改涉及连接在表达时导致产生融合蛋白的多个核酸区段。一个具体例子中,一个核酸区段编码GFP而另一核酸区段含有目的ORF。每个这些区段的侧翼都有重组位点。此外,编码GFP的核酸区段在近其3’端含有内含子/外显子拼接位点,而含有目的ORF的核酸区段在近其5’端也含有内含子/外显子拼接位点。重组后,编码GFP的核酸区段位于编码目的ORF的核酸区段的5’。而且,这些两个核酸区段被位于内含子/外显子拼接位点侧翼的重组位点分开。由此在融合mRNA转录后介入的重组位点被切除。因此,一方面,本发明指向从本文所述核酸产生的转录本中除去重组位点转录产生的RNA的方法。
[0842] 可以用于将内含子/外显子拼接位点导入核酸区段的一个方法是借助PCR。例如,可以使用引物产生相应于目的ORF并含有重组位点及内含子/外显子拼接位点的核酸区段。
[0843] 当与另一核酸区段发生重组的核酸区段编码不按可翻译格式(translatableformat)产生的RNA时,还可以使用上述方法除去相应于重组位点的RNA。该情况的一个例子是以一定方式将核酸区段插入载体中,以致导致产生反义RNA。正如以下讨论的,该反义RNA可以例如和编码核酶的RNA融合。因此,本发明还提供方法用于从这些方法中除去相应于重组位点的RNA。
[0844] 本发明还提供方法用于从蛋白表达产物中通过蛋白拼接除去重组位点所编码的氨基酸序列。编码蛋白拼接位点的核苷酸序列可以完全地或部分地嵌在所编码氨基酸序列将从蛋白质中切除的重组位点中,或者可以由相邻核苷酸序列编码蛋白质拼接位点。类似地,一个蛋白质拼接位点可以由重组位点编码,而另一蛋白质拼接位点可以由其它核苷酸序列(例如,载体的核酸序列或目的核酸)编码。
[0845] 已经显示,蛋白质拼接可以通过从蛋白质分子中切除蛋白内含子并连接侧翼区段来进行(见例如Derbyshire等,Proc.Natl.Acad.Sci(USA)95:1356-1357(1998))。简
而言之,蛋白内含子是翻译后通过自催化拼接过程从蛋白质中切除的氨基酸区段。相
当多的蛋白质内含子共有序列已得到鉴定。(见例如,Perler,Nucleic Acid Res.27:
346-347(1999)。)
[0846] 类似于内含子/外显子拼接,N和C端内含子基序显示出参与蛋白质拼接。因此,本发明还提供组合物和方法,用于从蛋白表达产物中通过蛋白质拼接除去重组位点编码的氨基酸残基。具体地,本发明此方面涉及将编码蛋白内含子拼接位点的核酸序列放置在位于两个编码区之间的重组位点的5’和3’末端。由此,当在适当条件下孵育蛋白质表达产物时,即可切除这些重组位点编码的氨基酸残基。
[0847] 可以使用蛋白质拼接除去重组位点编码的全部或部分氨基酸序列。编码蛋白内含子的核苷酸序列可以全部地或部分地嵌在重组位点中或可以位于这些位点邻近的位置。在某些情况下,可能期望在重组位点编码的N和/或C末端氨基酸序列之外再除去相当数量的氨基酸残基。在此情况下,可以将蛋白内含子的编码序列放置在距离重组位点5’和/或
3’一定距离的位置(例如30、50、75、100等个核苷酸)。
[0848] 尽管适合切除蛋白内含子的条件可以随具体的蛋白内含子以及含有此蛋白内含子的蛋白而变,但Chong等,Gene192:271-281(1997)证明修饰的酿酒酵母(Saccharomyces cerevisiae)蛋白内含子(称作SceVMA蛋白内含子)可以被多种药剂诱导而发生自切割,
所述药剂包括1,4-二硫苏糖醇(DTT)、β-巯基乙醇和半胱氨酸。例如,可以通过在存在
30mM DTT时,于4℃孵育16小时,以诱导蛋白内含子的切除/拼接。
[0849] 实施例14:在真核细胞中通过mRNA前体拼接从RNA转录本中除去att位点
[0850] 在后生动物细胞中通过mRNA前体转录本的拼接除去内含子所必需的共有RNA序列通常含有以下3个元件:
[0851] 1).内含子5’末端:外显子-AG|GTRAGT-内含子;此处|表示内含子和外显子之间的边界,而R=嘌呤核苷酸。此元件本文中被称作(GT);
[0852] 2).内含子3’末端:内含子-Yn-N-CAG|G-外显子;此处Yn=富含嘧啶的10-12个核苷酸序列。此元件本文中被称作(Yn-AG);
[0853] 3).内含子中的分支点,距离(Yn-AG)5’约20-40碱基的位置:YNRA*Y;此处Y是*嘧啶核苷酸而A 是参与最初的转酯反应以形成RNA套索的分支点腺苷。此元件在本文中
*
称作(BP-A)。
[0854] 以上显示的带下划线序列是高度保守的序列,并且一般被认为是拼接活性所必需的;共有序列中其它核苷酸的高度保守性较低。
[0855] 1.attB拼接
[0856] 可以将这些拼接元件和含有att位点的GATEWAYTM载体在至少以下三个途径中进行组合以便通过RNA拼接除去attB1位点。
[0857] 方法1:(GT)---(BP-A*)[attB1](Yn-AG)-ORF
[0858] 此方面中,利用了attB核心序列侧翼5’核苷酸的灵活性,(BP-A*)元件就位于attB1的5’末端,而(Yn-AG)共有序列与attB1序列的3’末端合并。(GT)共有序列可以
*
方便地位于(BP-A)上游的10或更多个核苷酸处。
[0859] 这种排列的优点是在attB1位点的3’末端和编码ORF的序列之间需要加入最少的序列。使用此方法的一个潜在困难是(Yn-AG)中的富含嘧啶的序列与相对富含嘌呤的
attB1序列重叠。因此,在某些情况下,attB1位点中足够多以致允许有效拼接的核苷酸改变(至C或T)可能与有效的BxP重组是不相容的。
[0860] 在表达克隆中attB1中位于重组切割位点5’的序列是由目的载体提供的,而且该位点的3’序列来源于attB-PCR产物(大多数情况中)。如果拼接反应旨在将编码N端蛋白(由目的载体提供)的RNA与编码另一ORF(由进入克隆提供)的RNA在RNA水平上融
合,则(GT)和(Yn-AT)的位置一般按一定方式定位,以便拼接产物维持期望的翻译阅读框。
[0861] 方法2:(GT)---(BP-A*)[attB1](Yn-AG)-ORF
[0862] 在此方法中,(Yn-AG)共有序列紧邻attB1位点;因此,(BP-A*)元件中的分支点A*一般需要靠近attB1位点。因此,(Yn-AG)中与AG的距离一般不多于约40个核苷酸。
[0863] 可以将(Yn-AG)序列作为引物衔接子的一部分来添加,前提是使用attB-PCR构建进入克隆。而且,可以使用利于有效拼接的共有(Yn-AG)序列设计该引物。在一些情况下,*(BP-A)和(Yn-AG)之间的attB1序列的存在可能会干扰拼接。如果这样的话,则可以对
attB1序列进行突变以提供更佳的拼接序列。
[0864] 方法3:(GT)---[attB1]-(BP-A*)---(Yn-AG)--ORF
[0865] 该方法使用的排列允许为包含(BP-A*)---(Yn-AG)的这些组合元件选择最佳的拼接序列以及间隔序列。该组合的最小大小预期是约20个核苷酸。因此,该序列通常作为约45-50个核苷酸的attB1-引物衔接子添加至PCR产物上。
[0866] 类似的考虑应用于设计允许从mRNA中通过拼接除去attB2位点的序列。但由于在*此情况下,(BP-A)和(Yn-AG)可以由目的载体提供,所以最有吸引力的选择是:ORF-(GT)*
[attB2]--(BP-A)--(Yn-AG),此处(GT)和attB2之间的序列最小,从而降低了attB2-PCR
衔接子引物的大小。适用于具体情况中的最小序列可以使用本文所述方法通过实验确定。
[0867] 制备拼接attB位点的载体的另一方式是直接构建含有位于attB1和attB2位点侧翼的拼接信号的载体。上述方法的主要区别是使用attB引物衔接子添加的任何序列(如在B和C中)都可以预先安装在载体本身中靠近位于attB位点之间的多克隆位点。
[0868] 2.attL拼接
[0869] 编码attL1和attL2位点的序列可以通过RNA拼接从转录本中除去。然而,attL的100个核苷酸长度限制了对安排这些拼接序列元件的方式的选择。一般将attL1放置在
*
(BP-A)和(Yn-AG)之间时该距离过大。一个可以使用的选择方案是可以将这些元件的一
个或两个嵌在突变版本的attL1中。另一个方法是可以由attB-衔接子引物提供这些元件
*
(即,(BP-A)和(Yn-AG)),而可以由attP供体质粒提供(GT)。通过这些元件在BxP反应
中的重组,可以产生用于拼接attB1的具有拼接位点的进入克隆。
[0870] 类似地,对于attL2的拼接,(GT)和(BP-A*)之间所能允许的序列长度也没有实际*的限制。因此,可以在attB2衔接子引物上提供(GT),而由attP供体载体提供(BP-A)和
(Yn-AG)。对于此情况,attP供体载体一般需要含有真核启动子而且一般需要除去rrnB转*
录终止序列。(GT)和(BP-A)之间attL2序列产生不利影响的可能性似乎是低的,但可能
需要逐个案例地确定。
[0871] 从进入克隆转录本中拼接除去attL序列的潜在优点在于使用者可以直接将PCR产物作为进入克隆来克隆和表达,而无需再亚克隆在目的载体中。而且,在不减少LxR重组的情况下,我们的attL1序列中终止密码子似乎是难于除去的,这些终止密码子的存在对于与N端肽融合的ORF的翻译并不重要。
[0872] 以上描述了RNA拼接在GATEWAYTM系统中的某些应用,目的是除去ORF和N端序列之间的attB1和除去蛋白质融合物的ORF序列和C端序列之间的attB2序列。其它应用是
本领域技术人员所明了的。而且,一个这样的应用是使用RNA拼接程序除去置于真核表达TM
载体中编码多个蛋白域的序列之间的att序列(作为基于GATEWAY 重组的亚克隆反应的
结果),此处编码各个域的ORF被att位点序列分隔开。这些载体可以容易地通过具有多种TM
特异性的att位点(例如att1、att2、att3、att4等)的GATEWAY 重组来构建。尽管该方
法允许快速构建蛋白融合物以及对编码蛋白域的DNA序列进行改组,但典型地这些重组产物将含有25bp attB位点(或100bp attL位点)插在这些域之间,而通常可能期望除去这
些位点。描述的RNA拼接机制是除去这些介入序列的一个途径。使用拼接除去多个蛋白质TM
域之间的att位点也使得使用attB和attP位点之间的GATEWAY 重组反应制备这些结构
变得实际可行,该反应将产生attL和attR位点。这是因为在适当设计的载体中通过RNA
拼接反应可以除去任何类型的att序列(attB或attL)。在其它情况下,这将同样可以用于通过拼接除去attR和/或attP位点。
[0873] 第二种应用解决了获得较大或稀少mRNA的拷贝的常见问题。一些mRNA由于大尺寸和/或低丰度是难于进行整体逆转录(成cDNA)的。常常是可以获得cDNA的一个或两
个末端,但不能作为一个分子获得整个序列。当可以获得一起组成整个mRNA序列的cDNA
的两个或更多个不同部分时,可以确定这些cDNA序列的序列并使用PCR引物进行合成。然TM
后使用attB-引物可以通过PCR扩增整个转录本的各非重叠部分。然后可以使用GATEWAY
重组按适当顺序组合这些扩增的序列。该重组产物将按适当顺序包含各个序列,但这些序列之间间隔att位点。只要有适当的转录启动子和终止信号,就可以使用这些结构体外制备RNA以用于体外拼接反应中,或使用允许在细胞内经RNA拼接后发生转录的适当结构转
染后生动物的细胞。以此方式,然后可以制备真正的mRNA转录本。一些mRNA转录本可以
直接地用于研究该拼接转录本编码的蛋白质的生物学功能。或者,由于使用该方法可以大量地产生这些转录本,因此使得制备拼接RNA的cDNA拷贝更为可行。该cDNA缺少介入的
att序列,可以用于在缺少适当拼接机器的细胞(如大肠杆菌)中产生编码的蛋白质。
[0874] 该技术的第三种应用使得可以制备由于低丰度或缺少适当的组织来源而难于获得的mRNA的复制物。大多数后生动物编码蛋白质的基因由被内含子序列分开的外显子
序列组成。无论何时可以通过生物信息学算法精确地从基因组DNA序列预测基因的外显
子-内含子边界,都可以合成含有外显子序列的侧翼有att位点序列的PCR产物。一旦适
TM
当设计了这些产物侧翼的att序列,即可使用GATEWAY 重组按适当顺序使它们彼此连接,并同时保持正确的翻译阅读框。通过将适当的转录信号包括在内,这些结构可以充当模板合成含有均被att序列分开的有序排列外显子序列的RNA转录本。如果在这些结构中包括
适当的拼接信号,则产生的转录本可以通过后生动物细胞的拼接反应加工而产生相应于天然产生的mRNA序列的核酸。而且,按上述制备的通过拼接转录本产生这些mRNA的细胞可
以直接地用于研究生物学功能或作为期望mRNA的来源以产生其cDNA。或者,可以使用具有适当组成的拼接提取物体外拼接这些结构。
[0875] 实施例15:确定细胞的基因表达谱
[0876] 本发明还提供组合物和方法用于克隆和测序多个cDNA分子。一般地,这些方法涉及制备cDNA分子多联体并对这些分子进行测序反应以确定单个插入片段的核苷酸序列。这些方法对于确定特定细胞和/或组织的基因表达谱(expression profile)是尤其有用
的。图23中显示了该方法的一个例子以及通过上述方法制备的载体。
[0877] 图23所示载体含有一系列通过attB位点彼此连接的相对短cDNA插入片段(例如长10、15、20、25、30、45或50个核苷酸)。图23所示载体还含有邻近cDNA插入位点两边的测序引物位点。
[0878] 作为细胞或组织中表达的基因的核酸分子可以通过各种方式被分割成相对小的片段,包括机械剪切、用一个或组合的限制性酶(例如NlaIII、Sau3A等)消化、或用几乎或完全不具有序列特异性的内切核酸酶(例如微球菌(Micrococcal)核酸酶,DNAseI等)。
一般对条件进行调整以便产生指定平均大小的核酸片段。而且,如果需要的话,可以在插入载体前分离具有特定大小的核酸片段。基于大小分离核酸分子的方法是本领域已知的,包括柱层析和凝胶电泳(例如琼脂糖和聚丙烯酰胺凝胶电泳)。
[0879] 可以通过对本发明方法连接起来并使用本领域已知的标准方法将其插入测序载体中的核酸进行测序以获得核苷酸序列数据。在大多数情况下,测序载体中核酸插入片段的5’至3’方向和所测序的链均与确定细胞或组织的基因表达谱无关。这是因为一般无论所测序的核酸区段的方向或所测序的链是怎样的,都可以确定测序核酸所来源的mRNA。
[0880] 因此,本发明提供方法以确定细胞和/或组织的基因表达谱。一方面,本发明提供确定细胞和/或组织的基因表达谱的方法,包括(a)从获自细胞和/或组织的RNA制备一或多群cDNA分子,其中这些群体中的单个cDNA分子包含至少两个能够和位于相同或不同
cDNA分子群的单个成员上的至少一个重组位点发生重组的重组位点,(b)在造成(a)的核
酸分子接合的条件下将这些核酸分子和一或多个重组蛋白接触,和(c)确定该接合的核酸分子的序列。
[0881] 实施例16:使用GATEWAYTM系统克隆Tet和lacZ基因
[0882] 将以下attB位点加在通过标准方法合成的PCR引物上。我们按标准GATEWAYTM阅TM TM
读框(见GATEWAY GATEWAY 克隆技术说明手册(Invitrogen Corp.,Life Technologies
Division))显示attB1和attB2位点并表示如下。可以按适当方式改变attB5的阅读框。
可以选择阅读框以便产生融合蛋白。
[0883]at tB1(片段A的5’端):
GGGG ACA ACT TTG TAC AAA AAA GTT GNN(SEQ ID NO:110)
attb5(片段A的3’端):
GGGG A CAA CTT TGT ATA ATA AAG TTG(SEQ ID NO:111)
attB5R(片段B的5’端):
GGGG A CAA CTT TAT TAT ACA AAG TTG(SEQ ID NO:112)
attb2(片段B的3’端):
GGG AC AAC TTT GTA TAATAA AGT TGN(SEQ ID NO:113)
[0884] 通过PCR扩增编码tet基因(用5’-attB1和3’-attB5引发的)和lac基因(用5’-attB5R和3’-attB2引发的)核酸区段并按下述使用聚乙二醇进行沉淀。在50μl PCR反应物中加入150μl TE,之后加入100μl30%PEG8000、30mM MgCl2。然后混合该溶液并以约10,000xg室温离心15分钟。然后除去PEG溶液并将沉淀溶解在TE中。
[0885] 将该B1-tet-B5PCR产物和attP1-ccdB-attP5供体载体(pDONR-P1/P5)混合,并使用标准方案(见本文实施例3)与BPCLONASETM反应,以产生attL1-tet-attL5进入克隆。
将B5R-lacZ-B2PCR产物和attP5R-ccdB-attP2供体载体(pDONR-P5R/P2)混合,并与BP
CLONASETM反应产生attR5-lacZ-attL2进入克隆。
[0886] 在25℃孵育1-4小时后,加入2μl蛋白酶K(2mg/ml)终止BP反应。然后用LR载体(即进入克隆)转化DH5α细胞,并铺在LB-Kan平板上。25℃孵育过夜。从单个DH5α
菌落小量制备DNA,并通过琼脂糖凝胶电泳定量。
[0887] 在含有以下成分的20μl反应体积中预备LR CLONASETM反应物:
[0888] 60ng(25fmol)的超螺旋tet进入克隆
[0889] 75ng(20fmol)的超螺旋lacZ进入克隆
[0890] 150ng(35fmol)用NcoI线性化的pDEST6(描述在PCT公开文
[0891] 本WO00/52027中,其完整公开本文作为参考)
[0892] 4μl LR4反应缓冲液
[0893] 4μl LR CLONASETM
[0894] 反应物在25℃孵育过夜,并用2μl蛋白酶K溶液(2mg/ml)终止。使用2μl转化100μl LE DH5α细胞并铺在含有XGal的LBamp平板上。以1.6x108cfu/μg pUC DNA
的效率,转化细胞的转化混合物产生约35,000个菌落。将24个菌落挑取至含有四环素和
XGal的平板上。24菌落中24个都是四环素抗性的。使用15个菌落接种2ml LB amp培养
液用于小量制备。15/15个小量制备物含有正确长度(8.8kb)的超螺旋质粒。用EcoRV消
化小量制备的DNA。观察到的条带图与按正确方向克隆的两个片段一致。
[0895] 所获核酸产物由连接在一起并克隆在目的载体中的两个片段组成。这两个片段的结构与插入目的载体中的一致,见下(箭头指示attB位点相对重叠序列的方向):
[0896] attB1→tet←attB5-lacZ←attB2。
[0897] 实施例17:使用GATEWAYTM系统克隆tet、lacZ和neo基因
[0898] 将以下attB位点加入通过标准方法合成的PCR引物中。我们按标准GATEWAYTM阅TM TM
读框(见GATEWAY GATEWAY 克隆技术说明手册(Invitrogen Corp.,Life Technologies Division))显示attB1和attB2位点并表示如下。可以由使用者指定attB5和attB21的
阅读框。
[0899]attB1(片段A的5’端):
GGGG ACA ACT TTG TAC AAA AAA GTT GNN(SEQ ID NO:114)
attB5(片段A的3’端):
GGGGA CAA CTT TGT ATA ATA AAG TTG(SEQ ID NO:111)
attB5(片段A的3’端):
GGGG A CAA CTT TGT ATA ATA AAG TTG(SEQ ID NO:111)
attB5R(片段B的5’端):
GGGG A CAA CTT TAT TAT ACA AAG TTG(SEQ ID NO:112)
attB21R(片段B的3’端):
GGG A CAA CTT TTT AAT ACA AAG TTG(SEQ ID NO:115)
attB21(片段C的5’端):
GGGG A CAA CTT TGT ATT AAA AAG TTG(SEQ IDNO:116)
attB2(片段c的3’端):
GGGG AC AAC TTT GTA TAA TAA AGT TGN(SEQ ID NO:117)
[0900] 通过PCR扩增编码tet基因(用5’-attB1和3’-attB5引发的)、Neo基因(用5’-attB5R和3’-attB21R引发的)和lacZ基因(用5’-attB21和3’-attB2引发的)核
酸区段并使用聚乙二醇沉淀。
[0901] 将该B1-tet-B5PCR产物和attP1-ccdB-attP5供体载体(pDONR-P1/P5)混合,并TM
使用标准方案与BP CLONASE 反应,以产生attL1-tet-attL3进入克隆。将B5R-Neo-B21R TM
PCR产物和attP5R-ccdB-attP21R供体载体(pDONR-P5R/P2)混合,并与BPCLONASE 反应
产生attR5-Neo-attR21进入克隆。将B21-lacZ-B2PCR产物和attP21-ccdB-attP2供体载
TM
体(pDONR-P21/P2)混合并与BPCLONASE 反应以产生attL21-lacZ-attL2进入克隆。
[0902] 在含有以下成分的20μl反应体积中预备LR CLONASETM反应物:
[0903] 40ng(17fmol)的超螺旋tet进入克隆
[0904] 50ng(19fmol)的超螺旋或线性(VspI消化的)Neo进入克隆
[0905] 75ng(20fmol)的超螺旋lacZ进入克隆
[0906] 150ng(35fmol)NcoI线性化的pDEST6
[0907] 4μl LR4反应缓冲液(200mM Tris HCl(pH7.5)、4.75mM EDTA、4.8mg/ml BSA、445mM NaCl、47.5mM亚精胺)
[0908] 4μl LR CLONASETM
[0909] 反应物在25℃孵育过夜,并用2μl蛋白酶K溶液(2mg/ml)终止。使用2μl转化100μl DH5αLE细胞并铺在含有XGal的LBamp平板上。在具有超螺旋进入克隆的转化混
合物中产生约3,200个菌落。在使用含VspI消化的Neo进入克隆的反应物进行的转化混
8
合物中产生5,300个菌落。感受态的效率为1.2x10cfu/μgpUC DNA。所有菌落均表现出
蓝色,指示存在lacZ基因。将9个菌落挑取至含有XGal的tet平板上。9菌落中9个都是
四环素抗性的。使用9个菌落接种2ml LB amp培养液用于小量制备。9个小量制备物中9
个含有正确长度(11kb)的超螺旋质粒。用EcoRV消化9个小量制备的DNA。观察到的条带
图与按正确方向克隆的三个片段一致。
[0910] 所获核酸产物由连接在一起并克隆在目的载体中的三个片段组成。这三个片段的结构与插入目的载体中的一致,见下(箭头指示attB位点相对重叠序列的方向):attB1→tet←attB5-Neo-attB21→lacZ←attB2。
[0911] 实施例18:使用GATEWAYTM和具有不同特异性的多个att位点克隆lux操纵子
[0912] 使用紧接以下列出的引物,扩增费氏弧菌(Vibrio fischeria)基因组DNA的lux操纵子基因(lux A、luxB、luxC、luxD和luxE),以便在每个ORF的5’末端引入最佳的
Shine-Delgarno和Kozak序列(ggaggtatataccatg(SEQ ID NO:118))并在3’末端引入T7
启动子和终止密码子(gaagctatagtgagtcgtatta)。
[0913] 表10.SD5’和T73’lux引物。
[0914] sD5′luxAggaggtatataccatgAAGTTTGGAAATATTTGTTTTTC(SEQIDNO:119)
[0915] T73′luxA gaagctatagtgagtcgtattaTTTAGGTTCTTTTAAGAAAGGAGCGAC(SEQ ID NO:120)[0916] SD5′luxB ggaggtatataccatgAAATTTGGATTATTTTTTCTAAAC(SEQ ID NO:121)
[0917] T73′luxB gaagctatagtgagtcgtattaTGGTAAATTCATTTCGATTTTTTGG(SEQ ID NO:122)[0918] SD5′luxC ggaggtatataccatgAATAAATGTATTCCAATGATAATTAATGG(SEQ ID NO:123)[0919] T73′l uxC gaagctatagtgagtcgtattaTGGGACAAAAACTAAAAACTTATCTTCC(SEQ ID NO:124)[0920] SD5′luxD ggaggtatataccatgAAAGATGAAAGTGCTTTTTTTACGATTG(SEQ ID NO:125)[0921] T73′luxD gaagctatagtgagtcgtattaAGCCAATTCTAATAATTCATTTTC(SEQ ID NO:126)[0922] SD5′luxE ggaggtatataccatgACTGTCCATACTGAATATAAAAGAAATC(SEQ ID NO:127)[0923] T73′luxE gaagctatagtgagtcgtattaAATCCTTGATATTCTTTTGTATGACATTAGC(SEQ ID NO:128)[0924] 使用紧接以下列出的attB-SD和attB-T7衔接子引物,以Shine-Delgarno和T7启动子序列作为引物位点进一步扩增PCR产物,以便向PCR产物的末端添加attB位点。
[0925] 表11:attB SD和T7衔接子引物。
[0926] B1.6SDGGGGACAACTTTGTACAAAAAAGTTGAAggaggtatataccatg(SEQ ID NO:129)
[0927] B5T7GGGGACAACTTTGTATAATAAAGTTGgaagctatagtgagtcgt(SEQ ID NO:130)
[0928] B5R SDGGGGACAACTTTATTATACAAAGTTGAAggaggtatataccatg(SEQ ID NO:131)
[0929] B11T7GGGGACAACTTTGTATAGAAAAGTTGgaagctatagtgagtcgt(SEQ ID NO:132)
[0930] B11R SDGGGGACAACTTTTCTATACAAAGTTGAAggaggtatataccatg(SEQ ID NO:133)
[0931] B17T7GGGGACAACTTTGTATACAAAAGTTGgaagctatagtgagtcgt(SEQ ID NO:134)
[0932] B17R S DGGGGACAACTTTTGTATACAAAGTTGAAggaggtatataccatg(SEQ ID NO:135)
[0933] B21T7GGGGACAACTTTGTATTAAAAAGTTGgaagctatagtgagtcgt(SEQ ID NO:136)
[0934] B21R S DGGGGACAACTTTTTAATACAAAGTTGAAggaggtatataccatg(SEQ ID NO:137)
[0935] B2.10T7GGGGACAACTTTGTACAAGAAAGTTGgaagctatagtgagtcgt(SEQ ID NO:138)
[0936] 以此方式,产生以下attB PCR产物:
[0937] attB1.6-SD-luxC-T7-attB5
[0938] attB5R-SD-luxD-T7-attB11
[0939] attB11R-SD-luxA-T7-attB17
[0940] attB17R-SD-luxB-T7-attB21
[0941] attB21R-SD-luxE-T7-attB2.10
[0942] 每个attB PCR产物都用聚乙二醇沉淀并与适当的attP质粒反应产生每个luxORF的进入克隆。
[0943] 表12.BP反应设置
[0944]1 2 3 4 5 6 7 8 9 10
TE 7μl 7μl 7μl 7μl 7ul 7μl 7μl 7μl 7μl 7μl
attB1-luxC-attB5 2μl 2μl
(10ng/μl)
attP1-attP5 2μl 2μl
(150ng/μl)
attB5R-luxD-attB11 2μl 2μl
(10ng/μl)
attP5R-attP11 2μl 2μl
(150ng/μl)
attB11R-luxA-attB17 2μl 2μl
(10ng/μl)
attP17R-attP17 2μl 2μl
(150ng/μl)
attB17R-luxB-attB21 2μl 2μl
(10ng/μl)
attP17R-attP21 2μl 2μl
(150ng/μl)
attB21R-luxE-attB2 2μl 2μl
(10ng/μl)
attP21R-attP2 2μl 2μl
(150ng/μl)
BP缓冲液 4μl 4μl 4μl 4μl 4μl 4μl 4μl 4μl 4μl 4μl
BP Clonase贮藏 4μl -- 4μl -- 4μl -- 4μl -- 4μl -
缓冲液
BP Clonase - 4μl - 4μl - 4μl -- 4μl -- 4μl
[0945] 25℃孵育反应物过夜。每个反应物通过加入2μl蛋白酶K(2mg/ml)溶液终止并37℃孵育10分钟。使用每个反应物的2μl转化LEDH5α细胞。将每个转化的100μl(1/10)铺在含有50μg/ml卡那霉素的LB琼脂上。通过快速小量制备分析确定,以从每个反应物
中分离适当的pENTR-lux克隆。
[0946] 用VspI消化luxA进入克隆(pENTR-luxA)以在该质粒骨架中线性化该质粒。5个lux进入克隆每个取等量(40ng)与150ng pDEST14在含有LR4缓冲液和LR Clonase的单
个LR反应中混合。制备由无Clonase反应和无pENTR/luxA反应组成的阴性对照反应。
[0947] 表13.LR反应设置
[0948]1 2 3
TE — 4μl —
pENTRluxC(20ng/μl) 4μl 4μl 4μl
pENTRluxD(20ng/ul) 4μl 4μl 4μl
pENTRluxA/VspI cut(20ng/μl) 4μl — 4μl
pENTRluxB(20ng/μl) 4μl 4μl 4μl
pENTRluxE(20ng/μl) 4μl 4μl 4μl
pDEST14/NcoI(150ng/μl) 1μl 1μl 1μl
LR4缓冲液 8μl 8μl 8μl
LR Clonase贮藏缓冲液 8μl — —
LR Clonase — 8μl 8μl
[0949] 25℃孵育反应物过夜。每个反应物通过加入4μl蛋白酶K(2mg/ml)溶液终止并37℃孵育10分钟。使用每个反应物的2μl转化LEDH5α细胞。将每个转化的100μl(1/10)铺在含有100μg/ml氨苄青霉素的LB琼脂上。
[0950] 对于反应1(无clonase)转化没有产生菌落,对于反应2(无pENTRluxA DNA)产生约200个菌落,对于反应3(完整的反应)产生约2500个菌落。从反应3挑取10个菌落
并通过小量制备分析进行检测。基于超螺旋质粒DNA的大小(10.3kb)并通过诊断限制性
消化,所有10个克隆经测定均是正确的。将合成的lux操纵子结构转化至BL21SI细胞中,并通过光度测定法监测萤光素酶的活性。证明4个独立的分离物在BL21SI细胞中产生可
滴定的盐诱导光。在含有pUC DNA的BL21SI细胞中没有检测到光。由于在大肠杆菌细胞
中产生和检测到光辐射,由此证实了所有5个lux基因的功能性活性。
[0951] 实施例19:产生pDONR载体
[0952] 正如以上实施例(lux操纵子克隆),通过attB PCR克隆产生大量载体元件进入克隆。对进入克隆进行设计,以便当一组4个载体元件进入克隆一起反应时,每个载体元件连接在一起组成一个新载体(图26A-26B)。在本实施例中,构建了两个新的attP DONOR载体。
[0953] 制备下组attB PCR产物:
[0954] attB21R-attP1-ccdB-cat-attP2-attB5
[0955] attB5R-kan-attB11
[0956] attB5R-amp-attB11
[0957] attB11R-loxP-attB17
[0958] attB17R-pUC ori-attB21
[0959] 通过PEG沉淀纯化每个attB PCR产物,并使之与适当的attP质粒反应以产生每个载体元件的进入克隆,见下:
[0960] 表14:BP反应设置
[0961]1 2 3 4 5 6 7 8 9 10
TE 7μl 7μl 7μl 7μl 7μl 7μl 7μl 7μl 7μl 7μl
attB21R-attP1-ccdB- 2μl 2μl
cat-attP2-attB5(10
ng/μl)
attP21R-attP5(150 2μl 2μl
ng/μl)
attB5R-kan-attB11(10 2μl 2μl
ng/μl)
attP5R-attP11(150 2μl 2μl
ng/μl)
attB5R-amp-attB11(10 2μl 2μl
ng/μl)
attP5R-attP11(150 2μl 2μl
ng/μl)
attB11R-loxP-attB17 2μl 2μl
(10ng/μl)
attP11R-attP17(150 2μl 2μl
ng/μl)
attB17R-pUC ori- 2μl 2μl
attB21(10ng/μl)
attP17R-attP21(150 2μl 2μl
ng/μl)
BP缓冲液 4μl 4μl 4μl 4μl 4μl 4μl 4μl 4μl 4μl 4μl
BP Clonase贮藏缓冲液 4μl — 4μl — 4μl — 4μl — 4μl —
BP Clonase — 4μl — 4μl — 4μl — 4μl — 4μl
[0962] 25℃孵育反应物过夜。每个反应通过加入2μl蛋白酶K(2mg/ml)溶液来终止,并在37℃孵育10分钟。每个反应物2μl用于转化LEDH5α细胞。每个转化取100μl(1/10)铺在含有50μg/ml卡那霉素的LB琼脂上。挑取菌落并通过快速小量制备分析用于分离以
下pENTR克隆:
[0963] pENTR-attR21-attP1-ccdB-cat-attP2-attL5(分离自反应2)
[0964] pENTR-attR5-kan-attL11(分离自反应4)
[0965] pENTR-attR5-amp-attL11(分离自反应6)
[0966] pENTR-attR11-loxP-attL17(分离自反应8)
[0967] pENTR-attR17-or i-attL211(分离自反应10)
[0968] 用VspI消化attR21-attP1-ccdB-cat-attP2-attL5进入克隆以便在该质粒骨架中线性化该质粒。4个进入克隆各取等量(40ng)在含有LR4缓冲液和LR Clonase的单个
LR反应中混合。制备不含Clonase的反应和不含pENTR-attR21-attP1-ccdB-cat-attP2-a
ttL5DNA的反应,作为阴性对照。
[0969] 表15.LR反应的设置
[0970]1 2 3 4
TE — 4μl — —
pENTR-attR21-attP1-ccdB-cat-attP2-attL5VspI 4μl 4μl 4μl
cut(20ng/μl) —
pENTR-attR5-kan-attL11(20ng/μl) 4μl 4μl 4μl
pENTR-attR5-amp-attL11(20ng/μl) — — — 4μl
pENTR-attR11-loxP-attL17(20ng/μl) 4μl 4μl 4μl 4μl
pENTR-attR17-ori-attL211(20ng/μl) 4μl 4μl 4μl 4μl
LR4缓冲液 8μl 8μl 8μl 8μl
LR Clonase Storage Bu 8μl — — —
LR Clonase — 8μl 8μl 8μl
[0971] 25℃孵育反应物过夜。向每个反应加入4μl蛋白酶K(2mg/ml)并使用2μl转化DB3.1细胞。将100μl(1/10)转化物铺在含有20μg/ml氯霉素和50μg/ml卡那霉素(反
应1、2和3)或20μg/ml氯霉素和100μg/ml氨苄青霉素(反应物4)的LB琼脂上。
[0972] 对于反应3和4,转化物分别产生约5000和10,000个菌落,而相比之下,对于反应1(无clonase)构成的阴性对照产生约500个菌落,而对于反应2(无pENTR-attR21-attP
1-ccdB-cat-attP2-attL5DNA)构成的阴性对照产生80个菌落。从反应3和4的培养物中
挑取6个菌落并通过小量制备分析进行检测。基于超螺旋质粒DNA的大小和通过诊断限制
性消化,所有克隆经确定均正确。通过测试克隆attB PCR产物的能力,该组装的载体表现出是具有功能的。
[0973] 实施例20:构建用于Multisite Gateway的attP DONOR质粒
[0974] 构建含有以下attP位点排列的4个attP DONOR质粒(图26A):
[0975] attPx→ccdB-cat←attPy
[0976] attPx←ccdB-cat→attPy
[0977] attPx→ccdB-cat→attPy
[0978] attPx←ccdB-cat←attPy
[0979] 通过使用含有相容性限制性内切核酸酶位点的引物,PCR扩增attP位点和attPDONOR载体,来构建这些质粒。每个PCR产物用适当限制性酶消化。消化的attP DONOR载体PCR产物经脱磷酸化后与消化的attP位点连接。连接产物由含有以两个方向克隆在pDONOR载体中的attP位点的质粒组成。
[0980] 上述attP质粒随后用作PCR反应模板(图26B)。使用特异地与attP位点核心退火并由此在PCR产物末端产生具有任何期望特异性的attL或attR位点的引物,进行PCR(见
实施例9方法中使用的引物)。对于每个新的attP DONOR载体,产生两个这样的PCR产物,一个由质粒骨架(ori-kan)组成而另一个由ccdB和cat基因组成。制备这些PCR产物并
使其在LR Clonase反应中一起反应以产生含有具有任何取向和特异性的attP位点的新质
粒。
[0981] 本说明书中提及的所有出版物、专利、和专利申请均表现了本发明所属领域的普通技术人员的水平,并在此并入作为参考,就如同将每个单独的出版物、专利、或专利申请具体而单独地并入参考一样。
[0982] 序列表
[0983] <110>Cheo,David
[0984] Brasch,Michael A.
[0985] Temple,Gary F.
[0986] Hartley,James L.
[0987] Byrd,Devon R.N.
[0988] <120>具有独特特异性的多个重组位点在重组克隆中的用途
[0989] <130>0942.501PC02
[0990] <140>To Be Assigned
[0991] <141>2000-12-11
[0992] <150>US60/169,983
[0993] <151>1999-12-10
[0994] <150>US60/188,020
[0995] <151>2000-03-09
[0996] <160>140
[0997] <170>PatentIn version3.0
[0998] <210>1
[0999] <211>27
[1000] <212>DNA
[1001] <213>attBO
[1002] <400>1
[1003]
[1004] <210>2
[1005] <211>27
[1006] <212>DNA
[1007] <213>attPO
[1008] <400>2
[1009]
[1010] <210>3
[1011] <211>27
[1012] <212>DNA
[1013] <213>attL0
[1014] <400>3
[1015]
[1016] <210>4
[1017] <211>27
[1018] <212>DNA
[1019] <213>attRO
[1020] <400>4
[1021]
[1022] <210>5
[1023] <211>25
[1024] <212>DNA
[1025] <213>attB1
[1026] <400>5
[1027]
[1028] <210>6
[1029] <211>27
[1030] <212>DNA
[1031] <213>attP1
[1032] <400>6
[1033]
[1034] <210>7
[1035] <211>27
[1036] <212>DNA
[1037] <213>attL1
[1038] <400>7
[1039]
[1040] <210>8
[1041] <211>25
[1042] <212>DNA
[1043] <213>attR1
[1044] <400>8
[1045]
[1046] <210>9
[1047] <211>25
[1048] <212>DNA
[1049] <213>attB2
[1050] <400>9
[1051]
[1052] <210>10
[1053] <211>27
[1054] <212>DNA
[1055] <213>attp2
[1056] <400>10
[1057]
[1058] <210>11
[1059] <211>27
[1060] <212>DNA
[1061] <213>attL2
[1062] <400>11
[1063]
[1064] <210>12
[1065] <211>25
[1066] <212>DNA
[1067] <213>attR2
[1068] <400>12
[1069]
[1070] <210>13
[1071] <211>22
[1072] <212>DNA
[1073] <213>attB5
[1074] <400>13
[1075]
[1076] <210>14
[1077] <211>27
[1078] <212>DNA
[1079] <213>attP5
[1080] <400>14
[1081]
[1082] <210>15
[1083] <211>24
[1084] <212>DNA
[1085] <213>attL5
[1086] <400>15
[1087]
[1088] <210>16
[1089] <211>25
[1090] <212>DNA
[1091] <213>attR5
[1092] <400>16
[1093]
[1094] <210>17
[1095] <211>22
[1096] <212>DNA
[1097] <213>attB11
[1098] <400>17
[1099]
[1100] <210>18
[1101] <211>27
[1102] <212>DNA
[1103] <213>attP11
[1104] <400>18
[1105]
[1106] <210>19
[1107] <211>24
[1108] <212>DNA
[1109] <213>attL11
[1110] <400>19
[1111]
[1112] <210>20
[1113] <211>25
[1114] <212>DNA
[1115] <213>attR11
[1116] <400>20
[1117]
[1118] <210>21
[1119] <211>22
[1120] <212>DNA
[1121] <213>attB17
[1122] <400>21
[1123]
[1124] <210>22
[1125] <211>27
[1126] <212>DNA
[1127] <213>attp17
[1128] <400>22
[1129]
[1130] <210>23
[1131] <211>24
[1132] <212>DNA
[1133] <213>attL17
[1134] <400>23
[1135]
[1136] <210>24
[1137] <211>25
[1138] <212>DNA
[1139] <213>attR17
[1140] <400>24
[1141]
[1142] <210>25
[1143] <211>22
[1144] <212>DNA
[1145] <213>attB19
[1146] <400>25
[1147]
[1148] <210>26
[1149] <211>27
[1150] <212>DNA
[1151] <213>attp19
[1152] <400>26
[1153]
[1154] <210>27
[1155] <211>24
[1156] <212>DNA
[1157] <213>attL19
[1158] <400>27
[1159]
[1160] <210>28
[1161] <211>25
[1162] <212>DNA
[1163] <213>attR19
[1164] <400>28
[1165]
[1166] <210>29
[1167] <211>22
[1168] <212>DNA
[1169] <213>attB20
[1170] <400>29
[1171]
[1172] <210>30
[1173] <211>27
[1174] <212>DNA
[1175] <213>attP20
[1176] <400>30
[1177]
[1178] <210>31
[1179] <211>24
[1180] <212>DNA
[1181] <213>attL20
[1182] <400>31
[1183]
[1184] <210>32
[1185] <211>25
[1186] <212>DNA
[1187] <213>attR20
[1188] <400>32
[1189]
[1190] <210>33
[1191] <211>22
[1192] <212>DNA
[1193] <213>attB21
[1194] <400>33
[1195]
[1196] <210>34
[1197] <211>27
[1198] <212>DNA
[1199] <213>attP21
[1200] <400>34
[1201]
[1202] <210>35
[1203] <211>24
[1204] <212>DNA
[1205] <213>attL21
[1206] <400>35
[1207]
[1208] <210>36
[1209] <211>25
[1210] <212>DNA
[1211] <213>attR21
[1212] <400>36
[1213]
[1214] <210>37
[1215] <211>15
[1216] <212>DNA
[1217] <213>15bp核心区
[1218] <400>37
[1219]
[1220] <210>38
[1221] <211>21
[1222] <212>DNA
[1223] <213>参考序列
[1224] <400>38
[1225]
[1226] <210>39
[1227] <211>21
[1228] <212>DNA
[1229] <213>att系统核心整合酶结合位点
[1230] <220>
[1231] <221>misc_feature
[1232] <222>(8)..()
[1233] <223>n是任何核苷酸
[1234] <220>
[1235] <221>misc_feature
[1236] <222>(9)..()
[1237] <223>n是任何核苷酸
[1238] <220>
[1239] <221>misc_feature
[1240] <222>(10)..()
[1241] <223>n是任何核苷酸
[1242] <220>
[1243] <221>misc_feature
[1244] <222>(11)..()
[1245] <223>n是任何核苷酸
[1246] <220>
[1247] <221>misc_feature
[1248] <222>(12)..()
[1249] <223>n是任何核苷酸
[1250] <220>
[1251] <221>misc_feature
[1252] <222>(13)..()
[1253] <223>n是任何核苷酸
[1254] <220>
[1255] <221>misc_featute
[1256] <222>(14)..()
[1257] <223>n是任何核苷酸
[1258] <400>39
[1259]
[1260] <210>40
[1261] <211>17
[1262] <212>DNA
[1263] <213>attB的改变的位点
[1264] <220>
[1265] <221>misc_feature
[1266] <222>(8)..()
[1267] <223>n是任何核苷酸
[1268] <220>
[1269] <221>misc_feature
[1270] <222>(9)..()
[1271] <223>n是任何核苷酸
[1272] <220>
[1273] <221>misc_feature
[1274] <222>(10)..()
[1275] <223>n是任何核苷酸
[1276] <220>
[1277] <221>misc_feature
[1278] <222>(11)..()
[1279] <223>n是任何核苷酸
[1280] <220>
[1281] <221>misc_feature
[1282] <222>(12)..()
[1283] <223>n是任何核苷酸
[1284] <220>
[1285] <221>misc_feature
[1286] <222>(13)..()
[1287] <223>n是任何核苷酸
[1288] <220>
[1289] <221>misc_feature
[1290] <222>(14)..()
[1291] <223>n是任何核苷酸
[1292] <400>40
[1293]
[1294] <210>41
[1295] <211>48
[1296] <212>DNA
[1297] <213>attL1pCR引物
[1298] <400>41
[1299]
[1300] <210>42
[1301] <211>48
[1302] <212>DNA
[1303] <213>attL2pCR引物
[1304] <400>42
[1305]
[1306] <210>43
[1307] <211>22
[1308] <212>DNA
[1309] <213>attL右PCR引物
[1310] <400>43
[1311]
[1312] <210>44
[1313] <211>43
[1314] <212>DNA
[1315] <213>attR1pCR引物
[1316] <400>44
[1317]
[1318] <210>45
[1319] <211>43
[1320] <212>DNA
[1321] <213>attR2PCR引物
[1322] <400>45
[1323]
[1324] <210>46
[1325] <211>22
[1326] <212>DNA
[1327] <213>attR右PCR引物
[1328] <400>46
[1329]
[1330] <210>47
[1331] <211>29
[1332] <212>DNA
[1333] <213>attB1/B1-Hgb
[1334] <400>47
[1335]
[1336] <210>48
[1337] <211>29
[1338] <212>DNA
[1339] <213>attB2/B2-Hgb
[1340] <400>48
[1341]
[1342] <210>49
[1343] <211>18
[1344] <212>DNA
[1345] <213>18B1-Hgb
[1346] <400>49
[1347]
[1348] <210>50
[1349] <211>18
[1350] <212>DNA
[1351] <213>18B2-Hgb
[1352] <400>50
[1353]
[1354] <210>51
[1355] <211>15
[1356] <212>DNA
[1357] <213>15B1-Hgb
[1358] <400>51
[1359]
[1360] <210>52
[1361] <211>15
[1362] <212>DNA
[1363] <213>15B2-Hgb
[1364] <400>52
[1365]
[1366] <210>53
[1367] <211>12
[1368] <212>DNA
[1369] <213>12B1-Hgb
[1370] <400>53
[1371]
[1372] <210>54
[1373] <211>12
[1374] <212>DNA
[1375] <213>12B2-Hgb
[1376] <400>54
[1377]
[1378] <210>55
[1379] <211>11
[1380] <212>DNA
[1381] <213>11B1-Hgb
[1382] <400>55
[1383]
[1384] <210>56
[1385] <211>11
[1386] <212>DNA
[1387] <213>11B2-Hgb
[1388] <400>56
[1389]
[1390] <210>57
[1391] <211>10
[1392] <212>DNA
[1393] <213>10B1-Hgb
[1394] <400>57
[1395]
[1396] <210>58
[1397] <211>10
[1398] <212>DNA
[1399] <213>10B2-Hgb
[1400] <400>58
[1401]
[1402] <210>59
[1403] <211>22
[1404] <212>DNA
[1405] <213>5′-Hgb
[1406] <400>59
[1407]
[1408] <210>60
[1409] <211>22
[1410] <212>DNA
[1411] <213>3′-Hgb
[1412] <400>60
[1413]
[1414] <210>61
[1415] <211>48
[1416] <212>DNA
[1417] <213>PCR引物attL0
[1418] <400>61
[1419]
[1420] <210>62
[1421] <211>48
[1422] <212>DNA
[1423] <213>PCR引物attLT1A
[1424] <400>62
[1425]
[1426] <210>63
[1427] <211>48
[1428] <212>DNA
[1429] <213>PCR引物attLT1C
[1430] <400>63
[1431]
[1432] <210>64
[1433] <211>48
[1434] <212>DNA
[1435] <213>PCR引物attLT1G
[1436] <400>64
[1437]
[1438] <210>65
[1439] <211>48
[1440] <212>DNA
[1441] <213>PCR引物attLT2A
[1442] <400>65
[1443]
[1444] <210>66
[1445] <211>48
[1446] <212>DNA
[1447] <213>pCR引物attLT2C
[1448] <400>66
[1449]
[1450] <210>67
[1451] <211>48
[1452] <212>DNA
[1453] <213>pCR引物attLT2G
[1454] <400>67
[1455]
[1456] <210>68
[1457] <211>48
[1458] <212>DNA
[1459] <213>pCR引物attLT3A
[1460] <400>68
[1461]
[1462] <210>69
[1463] <211>48
[1464] <212>DNA
[1465] <213>pCR引物attLT3C
[1466] <400>69
[1467]
[1468] <210>70
[1469] <211>48
[1470] <212>DNA
[1471] <213>PCR引物attLT3G
[1472] <400>70
[1473]
[1474] <210>71
[1475] <211>48
[1476] <212>DNA
[1477] <213>pCR引物attLA4C
[1478] <400>71
[1479]
[1480] <210>72
[1481] <211>48
[1482] <212>DNA
[1483] <213>PCR引物attLA4G
[1484] <400>72
[1485]
[1486] <210>73
[1487] <211>48
[1488] <212>DNA
[1489] <213>PCR引物attLA4T
[1490] <400>73
[1491]
[1492] <210>74
[1493] <211>48
[1494] <212>DNA
[1495] <213>pCR引物attLT5A
[1496] <400>74
[1497]
[1498] <210>75
[1499] <211>48
[1500] <212>DNA
[1501] <213>pCR引物attLT5C
[1502] <400>75
[1503]
[1504] <210>76
[1505] <211>48
[1506] <212>DNA
[1507] <213>PCR引物attLT5G
[1508] <400>76
[1509]
[1510] <210>77
[1511] <211>48
[1512] <212>DNA
[1513] <213>PCR引物attLA6C
[1514] <400>77
[1515]
[1516] <210>78
[1517] <211>48
[1518] <212>DNA
[1519] <213>PCR引物attLA6G
[1520] <400>78
[1521]
[1522] <210>79
[1523] <211>48
[1524] <212>DNA
[1525] <213>PCR引物attLA6T
[1526] <400>79
[1527]
[1528] <210>80
[1529] <211>48
[1530] <212>DNA
[1531] <213>pCR引物attLC7A
[1532] <400>80
[1533]
[1534] <210>81
[1535] <211>48
[1536] <212>DNA
[1537] <213>PCR引物attLC7G
[1538] <400>81
[1539]
[1540] <210>82
[1541] <211>48
[1542] <212>DNA
[1543] <213>pCR引物attLC7T
[1544] <400>82
[1545]
[1546] <210>83
[1547] <211>48
[1548] <212>DNA
[1549] <213>pCR引物attL8
[1550] <400>83
[1551]
[1552] <210>84
[1553] <211>48
[1554] <212>DNA
[1555] <213>PCR引物attL9
[1556] <400>84
[1557]
[1558] <210>85
[1559] <211>48
[1560] <212>DNA
[1561] <213>pCR引物attL10
[1562] <400>85
[1563]
[1564] <210>86
[1565] <211>48
[1566] <212>DNA
[1567] <213>PCR引物attL14
[1568] <400>86
[1569]
[1570] <210>87
[1571] <211>48
[1572] <212>DNA
[1573] <213>PCR引物attL15
[1574] <400>87
[1575]
[1576] <210>88
[1577] <211>30
[1578] <212>DNA
[1579] <213>attLO
[1580] <400>88
[1581]
[1582] <210>89
[1583] <211>30
[1584] <212>DNA
[1585] <213>attL5
[1586] <400>89
[1587]
[1588] <210>90
[1589] <211>30
[1590] <212>DNA
[1591] <213>attL6
[1592] <400>90
[1593]
[1594] <210>91
[1595] <211>30
[1596] <212>DNA
[1597] <213>attL13
[1598] <400>91
[1599]
[1600] <210>92
[1601] <211>30
[1602] <212>DNA
[1603] <213>attL14
[1604] <400>92
[1605]
[1606] <210>93
[1607] <211>30
[1608] <212>DNA
[1609] <213>attL15
[1610] <400>93
[1611]
[1612] <210>94
[1613] <211>21
[1614] <212>DNA
[1615] <213>共有序列
[1616] <220>
[1617] <221>misc_feature
[1618] <222>(7)..()
[1619] <223>n是任何核苷酸
[1620] <220>
[1621] <221>misc_feature
[1622] <222>(8)..()
[1623] <223>n是任何核苷酸
[1624] <220>
[1625] <221>misc_feature
[1626] <222>(10)..()
[1627] <223>n是任何核苷酸
[1628] <220>
[1629] <221>misc_feature
[1630] <222>(11)..()
[1631] <223>n是任何核苷酸
[1632] <220>
[1633] <221>misc_feature
[1634] <222>(12)..()
[1635] <223>n是任何核苷酸
[1636] <220>
[1637] <221>misc_feature
[1638] <222>(14)..()
[1639] <223>n是任何核苷酸
[1640] <220>
[1641] <221>misc_feature
[1642] <222>(15)..()
[1643] <223>n是任何核苷酸
[1644] <400>94
[1645]
[1646] <210>95
[1647] <211>25
[1648] <212>DNA
[1649] <213>attBO
[1650] <400>95
[1651]
[1652] <210>96
[1653] <211>29
[1654] <212>DNA
[1655] <213>attB2.1
[1656] <400>96
[1657]
[1658] <210>97
[1659] <211>29
[1660] <212>DNA
[1661] <213>attB2.2
[1662] <400>97
[1663]
[1664] <210>98
[1665] <211>29
[1666] <212>DNA
[1667] <213>attB2.3
[1668] <400>98
[1669]
[1670] <210>99
[1671] <211>29
[1672] <212>DNA
[1673] <213>attB2.4
[1674] <400>99
[1675]
[1676] <210>100
[1677] <211>29
[1678] <212>DNA
[1679] <213>attB2.5
[1680] <400>100
[1681]
[1682] <210>101
[1683] <211>29
[1684] <212>DNA
[1685] <213>attB2.6
[1686] <400>101
[1687]
[1688] <210>102
[1689] <211>29
[1690] <212>DNA
[1691] <213>attB2.7
[1692] <400>102
[1693]
[1694] <210>103
[1695] <211>29
[1696] <212>DNA
[1697] <213>attB2.8
[1698] <400>103
[1699]
[1700] <210>104
[1701] <211>29
[1702] <212>DNA
[1703] <213>attB1.6
[1704] <400>104
[1705]
[1706] <210>105
[1707] <211>29
[1708] <212>DNA
[1709] <213>attB2.10
[1710] <400>105
[1711]
[1712] <210>106
[1713] <211>29
[1714] <212>DNA
[1715] <213>attb1n16-20
[1716] <220>
[1717] <221>misc_feature
[1718] <222>(20)..()
[1719] <223>n是任何核苷酸
[1720] <220>
[1721] <221>misc_feature
[1722] <222>(21)..()
[1723] D<220>
[1724] <221>misc_feature
[1725] <222>(22)..()
[1726] <223>n是任何核苷酸
[1727] <220>
[1728] <221>misc_feature
[1729] <222>(23)..()
[1730] <223>n是任何核苷酸
[1731] <220>
[1732] <221>misc_feature
[1733] <222>(24)..()
[1734] <223>n是任何核苷酸
[1735] <400>106
[1736]
[1737] <210>107
[1738] <211>29
[1739] <212>DNA
[1740] <213>attb1n21-25
[1741] <220>
[1742] <221>misc_feature
[1743] <222>(25)..()
[1744] <223>n是任何核苷酸
[1745] <220>
[1746] <221>misc_feature
[1747] <222>(26)..()
[1748] <220>
[1749] <221>misc_feature
[1750] <222>(27)..()
[1751] <223>n是任何核苷酸
[1752] <220>
[1753] <221>misc_feature
[1754] <222>(28)..()
[1755] <223>n是任何核苷酸
[1756] <220>
[1757] <222>(29)..()
[1758] <223>n是任何核苷酸
[1759] <400>107
[1760]
[1761] <210>108
[1762] <211>29
[1763] <212>DNA
[1764] <213>attb2n16-20
[1765] <220>
[1766] <221>misC_feature
[1767] <222>(20)..()
[1768] <223>n是任何核苷酸
[1769] <220>
[1770] <221>misc_feature
[1771] <222>(21)..()
[1772] <223>n是任何核苷酸
[1773] <220>
[1774] <221>misc_feature
[1775] <222>(22)..()
[1776] <223>n是任何核苷酸
[1777] <220>
[1778] <221>misc_feature
[1779] <222>(23)..()
[1780] <223>n是任何核苷酸
[1781] <220>
[1782] <221>misc_feature
[1783] <222>(24)..()
[1784] <223>n是任何核苷酸
[1785] <400>108
[1786]
[1787] <210>109
[1788] <211>29
[1789] <212>DNA
[1790] <213>attb2n21-25
[1791] <220>
[1792] <221>misc_feature
[1793] <222>(25)..()
[1794] <223>n是任何核苷酸
[1795] <220>
[1796] <221>misC_feature
[1797] <222>(26)..()
[1798] <223>n是任何核苷酸
[1799] <220>
[1800] <221>misc_feature
[1801] <222>(27)..()
[1802] <223>n是任何核苷酸
[1803] <220>
[1804] <221>misc_feature
[1805] <222>(28)..()
[1806] <223>n是任何核苷酸
[1807] <220>
[1808] <221>misc_feature
[1809] <222>(29)..()
[1810] <223>n是任何核苷酸
[1811] <400>109
[1812]
[1813] <210>110
[1814] <211>28
[1815] <212>DNA
[1816] <213>attb1(片段a的5′末端)
[1817] <220>
[1818] <221>misc_feature
[1819] <222>(27)..()
[1820] <223>n是任何核苷酸
[1821] <220>
[1822] <221>misc_feature
[1823] <222>(28)..()
[1824] <223>n是任何核苷酸
[1825] <400>110
[1826]
[1827] <210>111
[1828] <211>26
[1829] <212>DNA
[1830] <213>attb5(片段a的3′末端)
[1831] <400>111
[1832]
[1833] <210>112
[1834] <211>26
[1835] <212>DNA
[1836] <213>attb5r(片段b的5′末端)
[1837] <400>112
[1838]
[1839] <210>113
[1840] <211>26
[1841] <212>DNA
[1842] <213>attb2(片段b的3′末端)
[1843] <220>
[1844] <221>misc_feature
[1845] <222>(26)..()
[1846] <223>n是任何核苷酸
[1847] <400>113
[1848]
[1849] <210>114
[1850] <211>28
[1851] <212>DNA
[1852] <213>attb1(片段a的5′末端)
[1853] <220>
[1854] <221>misc_feature
[1855] <222>(27)..()
[1856] <223>n是任何核苷酸
[1857] <220>
[1858] <221>misc_feature
[1859] <222>(28)..()
[1860] <223>n是任何核苷酸
[1861] <400>114
[1862]
[1863] <210>115
[1864] <211>25
[1865] <212>DNA
[1866] <213>attb21R(片段b的3′末端)
[1867] <400>115
[1868]
[1869] <210>116
[1870] <211>26
[1871] <212>DNA
[1872] <213>attb21(片段c的5′末端)
[1873] <400>116
[1874]
[1875] <210>117
[1876] <211>27
[1877] <212>DNA
[1878] <213>attb2(片段c的3′末端)
[1879] <220>
[1880] <221>misc_feature
[1881] <222>(27)..()
[1882] <223>n是任何核苷酸
[1883] <400>117
[1884]
[1885] <210>118
[1886] <211>16
[1887] <212>DNA
[1888] <213>最佳Shine-Delgarno和Kozak序列
[1889] <400>118
[1890]
[1891] <210>119
[1892] <211>39
[1893] <212>DNA
[1894] <213>SD5′luxA
[1895] <400>119
[1896]
[1897] <210>120
[1898] <211>49
[1899] <212>DNA
[1900] <213>T73′luxA
[1901] <400>120
[1902]
[1903] <210>121
[1904] <211>40
[1905] <212>DNA
[1906] <213>SD5′luxB
[1907] <400>121
[1908]
[1909] <210>122
[1910] <211>47
[1911] <212>DNA
[1912] <213>T73′luxB
[1913] <400>122
[1914]
[1915] <210>123
[1916] <211>45
[1917] <212>DNA
[1918] <213>SD5′luxC
[1919] <400>123
[1920]
[1921] <210>124
[1922] <211>50
[1923] <212>DNA
[1924] <213>T73′luxC
[1925] <400>124
[1926]
[1927] <210>125
[1928] <211>44
[1929] <212>DNA
[1930] <213>SD5′luxD
[1931] <400>125
[1932]
[1933] <210>126
[1934] <211>46
[1935] <212>DNA
[1936] <213>T73′luxD
[1937] <400>126
[1938]
[1939] <210>127
[1940] <211>44
[1941] <212>DNA
[1942] <213>SD5′luxE
[1943] <400>127
[1944]
[1945] <210>128
[1946] <211>53
[1947] <212>DNA
[1948] <213>T73′luxE
[1949] <400>128
[1950]
[1951] <210>129
[1952] <211>44
[1953] <212>DNA
[1954] <213>B1.6SD
[1955] <400>129
[1956]
[1957] <210>130
[1958] <211>44
[1959] <212>DNA
[1960] <213>B5T7
[1961] <400>130
[1962]
[1963] <210>131
[1964] <211>44
[1965] <212>DNA
[1966] <213>B5R SD
[1967] <400>131
[1968]
[1969] <210>132
[1970] <211>44
[1971] <212>DNA
[1972] <213>B11T7
[1973] <400>132
[1974]
[1975] <210>133
[1976] <211>44
[1977] <212>DNA
[1978] <213>B11R SD
[1979] <400>133
[1980]
[1981] <210>134
[1982] <211>44
[1983] <212>DNA
[1984] <213>B17T7
[1985] <400>134
[1986]
[1987] <210>135
[1988] <211>44
[1989] <212>DNA
[1990] <213>B17R SD
[1991] <400>135
[1992]
[1993] <210>136
[1994] <211>44
[1995] <212>DNA
[1996] <213>B21T7
[1997] <400>136
[1998]
[1999] <210>137
[2000] <211>44
[2001] <212>DNA
[2002] <213>B21R SD
[2003] <400>137
[2004]
[2005] <210>138
[2006] <211>44
[2007] <212>DNA
[2008] <213>B2.10T7
[2009] <400>138
[2010]
[2011] <210>139
[2012] <211>14
[2013] <212>DNA
[2014] <213>12attB1正向的模板特异的引物
[2015] <220>
[2016] <221>misc_feature
[2017] <222>(13)..()
[2018] <223>n是任何核苷酸
[2019] <220>
[2020] <221>misc_feature
[2021] <222>(14)..()
[2022] <223>n是任何核苷酸
[2023] <400>139
[2024]
[2025] <210>140
[2026] <211>13
[2027] <212>DNA
[2028] <213>12attB2反向的模板特异的引物
[2029] <220>
[2030] <221>misc_feature
[2031] <222>(13)..()
[2032] <223>n是任何核苷酸
[2033] <400>140
[2034]
QQ群二维码
意见反馈