首页 / 专利库 / 生物化学 / 次级代谢产物 / 用于进行同源重组的方法、宿主细胞和试剂盒

用于进行同源重组的方法、宿主细胞和试剂

阅读:23发布:2020-05-21

专利汇可以提供用于进行同源重组的方法、宿主细胞和试剂专利检索,专利查询,专利分析的服务。并且本 发明 涉及用于进行同源重组的方法、宿主细胞和 试剂 盒 ,一种用于在共享至少一段同源序列的第一核酸分子和第二核酸分子之间进行同源重组的方法,一种提高同源重组效率的方法。,下面是用于进行同源重组的方法、宿主细胞和试剂专利的具体信息内容。

1.一种用于在共享至少一段序列同源区域的第一核酸分子和第二核酸分子之间进行同源重组的方法,其中所述方法包括在5’到3’外切核酸酶和退火蛋白的存在下,将所述第一核酸分子与所述第二核酸分子接触
其中所述5’到3’外切核酸酶为RecE,其包含:
a)具有5’到3’外切核酸酶活性的区域,其中所述区域包含SEQ ID NO:1的第588-866位基酸或其变体或由SEQ ID NO:1的第588-866位氨基酸或其变体组成,所述变体包含与SEQ ID NO:1的第588-866位氨基酸在SEQ ID NO:1的第588-866位氨基酸的长度上具有至少70%的同一性的序列或由其组成;和
b)至少:
i)SEQ ID NO:1的第564-587位氨基酸;或
ii)与SEQ ID NO:1的第564-587位氨基酸在其24个氨基酸序列全长上具有至少70%同一性的24个氨基酸的序列,
其中(b)部分中的所述序列紧邻具有5’到3’外切核酸酶活性的区域的N-末端。
2.根据权利要求1所述的方法,其中所述RecE包含选自SEQ ID NO:1的第1-866、141-
866或564-866位氨基酸的序列或其变体或由选自SEQ ID NO:1的第1-866、141-866或564-
866位氨基酸的序列或其变体组成,其中所述变体与SEQ ID NO:1在其序列全长上具有至少
70%的序列同一性。
3.根据权利要求1或2所述的方法,其中所述RecE与SEQ ID NO:1中所提供的RecE具有至少75%、80%、85%、90%、95%、98%或99%的序列同一性。
4.根据前述权利要求中任一项所述的方法,其中所述RecE是全长RecE。
5.根据权利要求1-4中任一项所述的方法,其中所述退火蛋白是RecT。
6.根据前述权利要求中任一项所述的方法,其中所述第一和第二核酸分子是线性核酸分子。
7.根据前述权利要求中任一项所述的方法,其中所述同源重组在宿主细胞内进行。
8.根据权利要求7所述的方法,其中所述5’到3’外切核酸酶是由异源DNA表达的。
9.根据权利要求1-7中任一项所述的方法,其中所述5’到3’外切核酸酶是RecE并且是由整合的原噬菌体的RecE基因表达的,其中RecE的表达是由异源启动子驱动的。
10.根据权利要求8或9所述的方法,其中所述5’到3’外切核酸酶的表达是由诱导型启动子驱动的,所述诱导型启动子如阿拉伯糖诱导型启动子或鼠李糖诱导型启动子。
11.根据前述权利要求中任一项所述的方法,其中所述第二核酸分子是线性化的克隆载体,如线性化的BAC、线性化的基于p15A起始区的载体、线性化的基于pBR322起始区的载体、线性化的粘粒、线性化的基于pUC起始区的载体或线性化的基于ColE1起始区的载体。
12.根据权利要求1-10中任一项所述的方法,其中所述第一和第二核酸分子是线性的,并且所述方法进一步包括在所述5’到3’外切核酸酶和所述退火蛋白的存在下将第三核酸分子与所述第一和第二核酸分子接触,其中所述第一核酸分子与所述第二核酸分子共享一段同源区域并且与所述第三核酸分子共享一段不同的同源区域,其中所述第二核酸分子与所述第一核酸分子共享一段同源区域并且与所述第三核酸分子共享一段不同的同源区域,其中所述第三核酸分子与所述第二核酸分子共享一段同源区域并且与所述第一核酸分子共享一段不同的同源区域。
13.根据权利要求1-10中任一项所述的方法,其中所述第一和第二核酸分子是线性的,并且所述方法进一步包括在所述5’到3’外切核酸酶和所述噬菌体退火蛋白的存在下将第三核酸分子和第四核酸分子与所述第一和第二核酸分子接触,其中所述第一核酸分子与所述第二核酸分子共享一段同源区域并且与所述第四核酸分子共享一段不同的同源区域,其中所述第二核酸分子与所述第一核酸分子共享一段同源区域并且与所述第三核酸分子共享一段不同的同源区域,其中所述第三核酸分子与所述第二核酸分子共享一段同源区域并且与所述第四核酸分子共享不同的同源区域,其中所述第四核酸分子与所述第三核酸分子共享一段同源区域并且与所述第一核酸分子共享一段不同的同源区域。
14.根据权利要求13所述的方法,其中所述第一核酸分子包含感兴趣的序列,所述第二和第四核酸分子是短的寡核苷酸,所述第三核酸分子是克隆载体。
15.根据前述权利要求中任一项所述的方法,其中所述第一核酸分子包含长度为2kb或更长的感兴趣的序列。
16.根据前述权利要求中任一项所述的方法,其中所述第一核酸分子包含的感兴趣的序列是基因簇。
17.根据权利要求16所述的方法,其中所述基因簇编码次级代谢产物途径或脂肪酸合成途径。
18.根据前述权利要求中任一项所述的方法,其中所述第一核酸分子是基因组DNA的片段
19.根据前述权利要求中任一项所述的方法,其中所述第一核酸分子是线性化的BAC,所述方法用于将来自BAC的感兴趣的序列亚克隆至克隆载体中。
20.根据前述权利要求中任一项所述的方法,其中所述至少第一和第二核酸分子是线性的,并且所述方法进一步包括在Redα和Redβ或截短的RecE和RecT的存在下,将所述至少第一和第二核酸分子之间的线性到线性同源重组反应的产物用于在线性到环状同源重组的第二步中,其中所述截短的RecE选自SEQ ID NO:1的第588-866、595-866、602-866或606-
866位氨基酸。
21.根据权利要求20所述的方法,其中所述线性到线性同源重组在全长RecE和RecT的存在下在体外进行,其中所述方法进一步包括将所述线性到线性同源重组反应的产物与宿主细胞中的另外的核酸分子接触,并在Redα和Redβ以及优选还包括Redγ的存在下在体内进行线性到环状同源重组。
22.根据前述权利要求中任一项所述的方法,其中所述第一核酸分子是线性的并且在邻近它的5’端处包含硫代磷酸酯化以及在邻近它的3’端处包含硫代磷酸酯化。
23.根据权利要求22所述的方法,其中所述第二核酸分子是线性的并且在邻近它的3’端处包含硫代磷酸酯化但是在邻近它的5’端处不包含硫代磷酸酯化。
24.根据前述权利要求中任一项所述的方法,所述方法用于生成cDNA文库。
25.根据权利要求1-23中任一项所述的方法,其中所述第一和第二核酸分子是线性的,并且其中所述方法进一步包括在所述5’到3’外切核酸酶和退火蛋白的存在下将所述第一和第二核酸分子与一个或多个其它核酸分子接触以产生线性产物。
26.根据权利要求25所述的方法,其中所述线性产物是基因、操纵子、染色体或整个基因组。
27.表达如权利要求1-4中任一项所述的5’到3’外切核酸酶的宿主细胞。
28.根据权利要求27所述的宿主细胞,其中还包括编码Redα和Redβ的基因,其中所述5’到3’外切核酸酶在与Redα和Redβ不同的启动子的控制下。
29.一种包含在整合的原噬菌体上的recE基因的宿主细胞,其中所述recE基因在异源启动子的控制之下。
30.包含编码权利要求1-4中任一项所述的5’到3’外切核酸酶的核酸的试剂盒,所述试剂盒用于同源重组方法。
31.包含权利要求1-4中任一项所述的5’到3’外切核酸酶的试剂盒,所述试剂盒用于同源重组方法。
32.根据权利要求1-26中任一项所述的方法,其中在至少一个与经历同源重组的核酸分子没有序列同源性的单链寡核苷酸的存在下进行同源重组,其中所述同源重组的效率相对于当所述至少一个单链寡核苷酸分子不存在时进行的同源重组提高。
33.根据权利要求32所述的方法,其中所述至少一个单链寡核苷酸包含或由DNA组成。
34.根据权利要求32或33所述的方法,其中所述至少一个单链寡核苷酸的长度为10-
100个核苷酸。
35.根据权利要求34所述的方法,其中所述至少一个单链寡核苷酸的长度为约40个核苷酸。
36.根据权利要求32-35中任一项所述的方法,其中所述至少一个单链寡核苷酸在每次电穿孔中使用的浓度为1-200pmol。
37.根据权利要求30或31所述的试剂盒,所述试剂盒包含权利要求32-35中任一项所述的至少一个单链寡核苷酸。
38.根据权利要求30、31或37中任一项所述的试剂盒,其中所述试剂盒包括含有编码RecE的核酸的宿主细胞。
39.根据权利要求38所述的试剂盒,其中所述宿主细胞是如权利要求27-29中任一项所述的细胞。
40.根据权利要求37所述的试剂盒,其中所述试剂盒包括表达Redα和Redβ的宿主细胞。
41.根据权利要求38或39所述的试剂盒,其中所述宿主细胞还包括编码Redγ、RecA、Redα和Redβ中一个或多个的核酸序列。
42.根据权利要求30、31和37-41中任一项所述的试剂盒,其中所述试剂盒还包括一个或多个线性化的克隆载体。
43.根据权利要求1-26或32-36中任一项所述的方法,所述方法包括,在体内进行同源重组之前,使用稀有切割序列特异性DNA切割酶在体内线性化至少一个环状核酸分子以生成所述第一和/或第二核酸分子的步骤。
44.根据权利要求43所述的方法,其中所述稀有切割序列特异性DNA切割酶选自归巢内切核酸酶、锌指核酸酶(ZFN)或转录激活样效应因子核酸酶(TALEN)。
45.根据权利要求44所述的方法,其中所述归巢核酸内切酶选自I-SceI、I-CeuI、I-CreI、I-ChuI、I-CsmI、I-DmoI、I-PanI、I-SceII、I-SceIII、I-SceIV、F-SceI、F-SceII、PI-AaeI、PI-ApeI、PICeuI、PI-CirI、PI-CtrI、PI-DraI、PI-MavI、PI-MfII、PI-MgoI、PI-MjaI、PI-MkaI、PI-MIeI、PI-MtuI、PI-MtuHI、PI-PabIII、PI-PfuI、Pi-PhoI、PI-PkoI、PI-PspI、PI-RmaI、PI-SceI、PI-SspI、PI-TfuI、PI-TfuII、PI-TliI、PI-TliII.PI-TspI、PI-TspII、PI-BspI、PI-MchI、PI-MfaI、PI-MgaI、PI-MgaII、PI-MinI、PI-MmaI、Pi-MshI、PI-MsmII、PI-MthI、PI-TagI、PI-ThyII、I-NcrI、I-NcrII、I-PanII、I-TevI、I-PpoI、I-DirI、I-HmuI、I-HmuII、I-TevII、I-TevIII、F-SceI、F-SceII(HO)、F-SuvI、F-TevI和F-TevII。
46.根据权利要求43-45中任一项所述的方法,其中所述同源重组由RecE和RecT介导。
47.根据权利要求27-29中任一项所述的宿主细胞,还包括如权利要求44或45中所述的稀有切割序列特异性DNA切割酶。
48.根据权利要求30-31或37-42中任一项所述的试剂盒,还包括至少一个如权利要求
44或45中所述的稀有切割序列特异性DNA切割酶。
49.一种用于进行同源重组方法的试剂盒,所述试剂盒包括如权利要求47所述的宿主细胞。

说明书全文

用于进行同源重组的方法、宿主细胞和试剂

[0001] 本申请是2011年6月10日申请的PCT国际申请PCT/IB2011/052549于 2013年2月6日进入中国国家阶段的、申请号为201180038908.6且发明名称为“直接克隆”的发明专利申请的分案申请。
[0002] 从DNA混合物如基因组DNA或cDNA制备物中克隆DNA片段的标准程序包括从蛋白、脂质以及其它污染物中纯化DNA,通常在限制性酶切后将该DNA制备物连接到克隆载体上以制备文库。由于文库通常为克隆DNA片段的复杂混合物,因此回收特定的DNA片段需要采用几种费的方法之一来筛选文库。特定的DNA片段通常不是包含在单克隆中的,而是需要由两个或多个克隆重新构建或者伴随需要移除的不需要的侧翼序列(flanking sequence)。这些额外的亚克隆步骤使克隆的DNA文库方法更加费力。
[0003] 由于对人类疾病更加深入的了解,患者特定治疗方法的发展将变得更加普遍,包括患者特定基因修正方法的发展。理想地,患者特异基因修正可采用获得自患者的有问题的DNA区域,在实验室中修正并重新插入到患者体内。
[0004] 此外,下一代基因测序技术(例如454、Solexa或SOLiD4)的发展允许在不构建基因文库的情况下获得基因组序列数据。该方法称为“宏基因组学”,目前在没有伴随基因文库资源的情况下,已经了解了许多种类的大量的基因组序列数据,所述基因组序列数据在原核基因组的情况下可以是完整的。但是,功能研究需要获得并且操纵编码待研究的基因的克隆的D NA。因此需要一种新的技术以直接从基因组DNA池中将特定的DNA区域克隆到载体中,在本文中称为“直接克隆。”
[0005] 此外,在合成生物学中线性DNA片段组装的需求增加。这些线性D NA可以是ssDNA,优选寡核苷酸,或dsDNA。DNA片段的合成生物组装已用于产生基因、操纵子、染色体,并且最近用于产生整个基因组(参见参考文献42)。包括多于10个不同DNA分子的组装方法通常使用传统的DNA连接或由Red操纵子介导的同源重组或酿酒酵母(Saccharomyces cerevisiae)细胞的内源性机制。因此开发一种按照确定的顺序组装DNA 片段的新方法的需求增加。
[0006] 之前已描述过通过同源重组进行直接克隆和亚克隆,也称为“缺口修复克隆”或“线性到线性”(1-4)。术语“克隆”涉及一种通过连接于载体并在宿主细胞中增殖而从初始来源扩增DNA片段方法,所述宿主细胞通常为大肠杆菌(E.coli)或酵母。术语“亚克隆”涉及一种已经通过前述的克隆或PCR从初始来源扩增的DNA片段在宿主细胞中增殖的方法。除前述的直接克隆外,也描述了线性到线性同源重组的亚克隆应用(例如,参见克隆试剂盒PCR Cloning Kit http://www.genscript.com/cloneez_P CR_Cloning_kit.html;或Cold Fusion Cloning Kit http://www.systembio.co m/cold-fusion-cloning/)。目前通过同源重组进行亚克隆的方法不是很有效。但是,由于底物DNA片段在亚克隆之前基本上是纯的,因此并不需要高效。
[0007] 已经使用酵母实现了从基因组DNA制备物中直接克隆基因(8-12)。但是,该方法存在技术上的挑战,并且由于在酵母中重组不可控,因此克隆的DNA分子在基因方面通常不稳定。因此在酵母中进行直接克隆仅仅限制于实验室(V.Larionov-参见Selective isolation of mammalian gene s by TAR cloning.Kouprina N,Larionov V.Curr Protoc Hum Genet.2 006May;Chapter 5:Unit 5.17)。之前将该酵母技术商业化的尝试失败了(B iotech company"Caliper"in Boston于2002年关闭)。
[0008] 由于表达rac噬菌体蛋白RecE和RceT,大肠杆菌sbcA菌株在线性到环状同源重组(在此处称为“LCHR”)中非常有效(5-7)。由于RecE和Re cT与λ噬菌体蛋白中的Redα和Redβ同源,Redα和Redβ也显示可以介导非常有用和高效的同源重组。通过表达RecE/RecT或Redα/Redβ,线性到线性同源重组(在本文中称为“LLHR”)也大大增加。
[0009] 目前RecE/RecT介导的同源重组使用了截短形式的RecE。AJ Clark 最初发现的RecE为279个基酸的5’到3’外切酶(RecE588)(参见文献 5)。在5’端缺少14个氨基酸的较短形式(RecE602)也显示出LCHR和L LHR活性。该形式已经被结晶(Structure.2009May 13;17(5):690-702.C rystal structure of E.coli RecE protein reveals a toroidal tetramer for p rocessing double-stranded DNA breaks.),并且与相似大小的5’到3’核酸外切酶Redα相当。这些RecE类型是原始的866个氨基酸长的rac噬菌体基因的截短形式。RecE的较短形式(RecE602)对应于最后的约265个氨基酸。换言之,与截短的RecE602相比,全长的RecE在其N-末端具有额外的601个氨基酸,而与截短的RecE588相比,全长的RecE在其N- 末端具有额外的587个氨基酸。
[0010] 在大肠杆菌中,通过RecET介导的重组,DNA池中的基因可以通过一步反应克隆入线性载体中(7)。但是,该系统非常低效,不能常规的用于从基因组DNA制备物中直接克隆。特别的,它不能允许直接克隆随D NA池的复杂性而改变的超过一定大小的DNA片段。在复杂性较低的池中,如原核基因组DNA制备物,已有的技术允许直接克隆一些大于10kb 的DNA区域。在复杂性较高的池中,如哺乳动物基因组DNA制备物,已有的技术仅允许以非常低的效率直接克隆短DNA区域(2kb左右)。
[0011] 本发明的一个目的是改进克隆方法。特别的,本发明的一个目的是提供一种直接克隆的方法,所述方法可以用作从DNA池中钓出感兴趣基因的方法。
[0012] 本发明的另一目的是提供一种改进的亚克隆方法。
[0013] 本发明的另一目的是提供改进的用于复杂DNA工程任务的方法,如将多个DNA片段组装成精确的产物。
[0014] 发明概述
[0015] 在第一个方面中,本发明提供一种在共享至少一个序列同源性区域的第一核酸分子和第二核酸分子之间进行同源重组的方法,其中所述方法包括在5’到3’核酸外切酶和退火蛋白存在下,将第一核酸分子与第二核酸分子接触
[0016] 其中,所述5’到3’核酸外切酶包括具有5’到3’核酸外切酶活性的区域并且至少:
[0017] i)SEQ ID NO:1的氨基酸564-587;或
[0018] ii)24个氨基酸的序列,所述序列与SEQ ID NO:1的第564-587位氨基酸在其24个氨基酸序列全长上具有至少70%的同一性。
[0019] 在第二个方面中,提供了一种在至少一个与经受同源重组的核酸分子无序列同源性的单链寡核苷酸存在的情况下进行同源重组而提高同源重组效率的方法,其中,与当所述至少一个单链DNA寡核苷酸不存在时进行同源重组相比,同源重组的效率提高了。
[0020] 在第三个方面中,提供了一种在共享至少一段序列同源性区域的第一核酸分子和第二核酸分子之间进行同源重组的方法,包括在进行体内同源重组之前采用稀有切割序列特异性DNA切割酶对至少一个体内环状核酸分子进行线性化以生成所述第一和/或所述第二核酸分子的步骤。
[0021] 发明详述
[0022] 惊奇的发现可以采用RecE来介导同源重组,所述RecE含有不存在于现有同源重组技术中使用的截短型RecE中的内源性N-末端RecE序列的部分。此外,惊奇的发现采用这样的N末端延伸的RecE可以提高LLHR 的效率。使用全长RecE可以获得最高的LLHR效率,因此本发明优选地包括使用全长RecE介导LLHR。来自大肠杆菌K12的全长RecE的氨基酸序列如下所示(SEQ ID NO:1):
[0023]
[0024] 已有的RecE/RecT介导的同源重组技术中目前使用由RecE的C-末端构成的截短形式的RecE(SEQ ID NO:1的氨基酸588-866)。也描述了使用由SEQ ID NO:1的氨基酸602-866构成的截短形式的RecE(参见文献 7、13、14、16、17、18和36),也描述了由SEQ ID NO:1的氨基酸595 -866和SEQ ID NO:1的第602-866位氨基酸构成的RecE蛋白(参见文献14)。这些截短形式的RecE在本文称为“截短的RecE。”这些截短的RecE 蛋白已表明含有具有5'到3'核酸外切酶活性的区域(参见文献14)。
[0025] 本发明的第一方面的保护范围特别地排除了在已有的同源重组技术中的截短的RecE的使用。特别地,本发明的第一方面的保护范围特别地排除了由SEQ ID NO:1的氨基酸588-866、595-866、602-866或606-866 所示的序列构成的RecE的使用。
[0026] 因此,在第一个方面中,本发明提供了一种在共享至少一段序列同源性的第一核酸分子和第二核酸分子之间进行同源重组的方法,其中所述方法包括在5’到3’核酸外切酶和退火蛋白存在下,将所述第一核酸分子与所述第二核酸分子接触;
[0027] 其中所述5’到3’核酸外切酶包括一个具有5’到3’核酸外切酶活性的区域和至少:
[0028] i)SEQ ID NO:1的第564-587位氨基酸;或
[0029] ii)24个氨基酸的序列,所述序列与SEQ ID NO:1的第564-587位氨基酸在其24个氨基酸序列全长上具有至少70%的同一性(例如至少75%、 80%、85%、90%、95%、98%或99%)。
[0030] 本发明的第个一方面的方法中使用的5’到3’核酸外切酶包含具有5’到3’核酸外切酶活性的区域。优选的,该具有5’到3’核酸外切酶活性的区域源自RecE,但在一些实施方案中,该具有5’到3’核酸外切酶活性的区域源自Redα或任何其它的5’到3’核酸外切酶。
[0031] 在具有5’到3’核酸外切酶活性的区域源自RecE的实施方案中,所述的具有5’到3’核酸外切酶活性的区域包括或者由SEQ ID NO:1的第588- 866位氨基酸或其变体组成。优选的,所述具有5’到3’核酸外切酶活性的区域由SEQ ID NO:1的第588-866位氨基酸组成。在一些实施方案中,所述变体包括在SEQ ID NO:1的第588-866位氨基酸的全长内与SEQ I D NO:1的第588-866位氨基酸具有至少70%的同一性的序列(例如至少8 0%、至少85%、至少90%、至少95%、至少98%或至少99%)。在一些实施方案中,所述的包含5’到3’核酸外切酶活性的区域的变体包括在C-末端和/或N-末端截短或添加。例如,所述的RecE的包含5’到
3’核酸外切酶活性的区域在C末端和/或N末端包括1、2、3、4、5、少于10、少于 20、少于30、少于40或少于50个氨基酸的删除、添加或取代。优选在C -末端进行任何删除或添加。该删除或添加优选地不在N-末端,但是在某些情况下可进行该删除或添加。在添加的情况下,在一些实施方案中该添加序列不是来自SEQ ID NO:1的。在某些情况下,内部删除或添加也是有用的。
[0032] 已经发现,除之前使用的具有5’到3’核酸外切酶活性的区域外,可以通过还包含紧邻该区域的N末端的至少24个氨基酸,即SEQ ID NO:1 的第564-587位氨基酸的RecE介导同源重组。
[0033] 优选的,在本发明的第一个方面的方法中的其它序列i)和ii)紧邻所述具有5’到3’核酸外切酶活性区域的N末端。
[0034] 优选的,所述的5’到3’核酸外切酶是RecE。在一些实施方案中,所述RecE包括或者由SEQ ID NO:1的第564-866位氨基酸或其变体组成,所述变体包括或由与SEQ ID NO:1在其303个氨基酸序列全长上具有至少70%序列同一性(例如至少75%,80%,85%,90%,95%,98%或99%) 的长度为303个氨基酸的序列组成。在一些实施方案中,所述RecE还包括N末端的甲硫氨酸残基。
[0035] 更优选的,所述RecE包括其它RecE的内源N末端序列。例如,所述RecE包括紧邻所述包含5’到3’核酸外切酶活性区域的N末端的至少5 0、100、150、200、250、300、350、400、450、500、550、560、570,、5 80、581、582、583、584、585、586或587个氨基酸,其中这些其它的氨基酸相当于来自SEQ ID NO:1或与SEQ ID NO:1在整个序列长度上具有至少70%序列同一性(例如,至少75%、80%、85%、90%、95%、98%或 99%)的变体的相应氨基酸。
[0036] 在一些实施方案中,所述RecE包括或者由选自由SEQ ID NO:1的第 1-866、141-866、423-866或564-866位氨基酸组成的群组或来自该群组的序列的变体组成,其中所述变体与SEQ ID NO:1在整个序列长度上具有至少70%的序列同一性。在一些实施方案中,所述变体包括与所列举的序列的N-末端紧邻的额外的N-末端甲硫氨酸。
[0037] 在最优选的实施方案中,所述RecE是全长RecE。优选的,所述全长 RecE包含或者由SEQ ID NO:1的第1-866位氨基酸组成。在一些实施方案中,所述的全长RecE包含或者由SEQ ID NO:1的变体的第1-866位氨基酸组成,其中所述SEQ ID NO:1的变体与SEQ ID NO:1的在整个序列长度上具有至少70%的序列同一性(例如至少75%、80%、85%、90%、9 5%、98%或99%)。
[0038] 关于两个氨基酸序列之间的序列同一性百分比是指,当比对时,在比较两个序列时氨基酸的百分比是相同的。
[0039] 在一些实施方案中,所述RecE是如上所述的RecE,但是包括在N- 末端和/或C-末端的截短或添加。例如,所述RecE可包括在N-末端和/或 C-末端的1、2、3、4、5、少于10、少于20、少于30、少于40或少于5 0个氨基酸的删除或添加。在添加的情况下,在一些实施方案中额外的序列不是来自SEQ ID NO:1。在一些情况下可以使用内部的删除或添加。
[0040] 在一些实施方案中,所述的5’到3’核酸外切酶是Redα或任何其它连接有SEQ ID NO:1的第564-587位氨基酸或其变体的5’到3’核酸外切酶。
[0041] 所述5’到3’核酸外切酶与退火蛋白共同介导同源重组。在一些实施方案中,在本发明的第一个方面的方法中使用的退火蛋白是噬菌体退火蛋白。优选的,所述退火蛋白是RecT(源自rac噬菌体)。更优选的,所述退火蛋白是RecT并且所述5’到3’核酸外切酶是RecE(优选全长RecE)。 RecT基因的鉴定最初由Hall等报道(J.Bacteriol.175(1993),277-287)。但是,可以使用任何其它合适的退火蛋白,只要该退火蛋白与所使用的5’到3’核酸外切酶共同作用。其它合适的噬菌体退火蛋白的实例提供于WO 02/062988(Gene Bridges,GmbH)。惊奇的发现LLHR可以在缺乏RecT 表达的某些宿主细胞如大肠杆菌菌株GB2005中发生,可能是由于存在某些内源RecT-样活性。但是,由全长RecE介导的LLHR的效率在RecT的存在下显著升高。
[0042] 惊讶的发现,与使用仅由SEQ ID NO:1的第602-866位氨基酸组成的截短的RecE相比,对来自内源SEQ ID NO:1序列的截短的RecE进行 N-端添加可以增加LLHR的效率。因此,在本发明的第一方面的方法中使用的所述至少第一和第二核酸分子优选线性核酸分子。事实上,在本发明第一方面的方法中,特别优选使用全长RecE介导LLHR。
[0043] 但是,在一些实施方案中,第一核酸分子是线性核酸分子并且第二核酸分子是环状核酸分子。同样的,在一些实施方案中,第一核酸分子是环状核酸分子并且第二核酸分子是线性核酸分子。在一些实施方案中,所述环状核酸分子是克隆载体。在本发明第一方面的方法的各实施方案中使用的合适克隆载体的实例是基于p15A来源的载体(参见文献39)、基于pB R322来源的载体(参见文献40)、基于pUC来源的载体(参见文献41)、质粒,黏粒,λ克隆载体以及BAC(细菌人工染色体)。
[0044] 惊讶地,已发现LLHR和LCHR是非常不同的分子过程。这是在检测本发明中使用的RecE的性质时发现的。已发现全长RecE在介导LLHR 时比介导LCHR的效率高约一个数量级。也发现全长RecE/RecT在介导L LHR时比Redα/Redβ效率更高,反过来,所述Redα/Redβ在介导LC HR时比全长RecE/RecT的效率更高。全长RecE在介导LLHR时显著好于之前发表的截短的RecE。在优选的实施方案中,在介导LLHR时,全长RecE/RecT比截短型的RecE/RecT至少好
10倍,例如,至少好20倍,至少好50倍,优选至少好100倍(此处使用的由SEQ ID NO:1的第
602 -866位氨基酸组成的RecE的效率代表了由已有的同源重组技术中使用的其他截短的RecE蛋白介导的同源重组的效率)。但是,在介导LCHR时,全长RecE要差于之前发表的较短形式的RecE。
[0045] 直到现在还认为LCHR和LLHR由相同的蛋白介导。LLHR和LCHR 之间的意外差异以及Redα/Redβ在LCHR中的优势和RecE/RecT在LL HR中的优势确定了一种采用两种系统中正确的组合改进DNA克隆和DN A工程方法的方法。
[0046] 因此,在一些实施方案中,所述至少第一和第二核酸分子是线性的,并且所述方法进一步包括在Redα和Redβ存在下或在截短的RecE和R ecT存在下,将所述第一和第二核酸分子之间的LLHR的反应产物用于L CHR的第二步中。在一些实施方案中,LLHR的产物是线性的并且第二步包括将所述的线性产物与环状核酸分子接触。在一些实施方案中,LLHR 的产物是环状的并且第二步包括将所述的环状产物与线性核酸分子接触。在优选的实施方案中,所述第一和第二核酸分子是线性的并且与全长Rec E和RecT接触以介导LLHR,并且所述方法包括在Redα和Redβ和优选的Redγ的存在下进行LCHR的第二步骤。在一些实施方案中,所述第一和第二线性核酸分子之间的LLHR在体外进行。在优选的实施方案中,所述LCHR的第二步在宿主细胞体内进行。因此,在一些实施方案中,所述方法包括将所述线性的第一核酸分子与所述线性第二核酸分子在体外接触,优选在5’到3’核酸外切酶和退火蛋白(更优选RecE和RecT)存在下,然后将LLHR反应的产物转化到宿主细胞中,并在另外的核酸分子的存在下,优选在Redα和Redβ和优选的Redγ的存在下在体内进行LC HR。所述体外的步骤不需要Redγ的存在,但在一些实施方案中,Redγ是存在的。
[0047] 在一些实施方案中,所述方法包括将所述线性第一核酸分子与所述线性第二核酸分子在体外接触,优选在5’到3’核酸外切酶和退火蛋白(更优选RecE和RecT)的存在下,然后将获得的核酸分子转化入宿主细胞中并根据本发明所述方法在体内进行同源重组。该两步法通过增加所述第一和第二核酸分子在宿主细胞中的接触可能性来增加同源重组的效率。
[0048] 典型的,所述至少第一和第二核酸分子包括或由DNA组成。但是,在一些实施方案中,所述至少第一和/或第二核酸分子包括RNA或一个或多个修饰的核苷酸。
[0049] 已经发现通过在Redγ的存在下实施方法,采用本发明第一方面的方法的同源重组的效率会提高(参见文献26和30)。Redγ抑制大肠杆菌中的RecBCD外切酶。由于抑制RecBCD外切酶可以保护线性分子,因此在进行RecE/RecT或Redα和Redβ介导的同源重组时,抑制RecBCD是有利的。因此,在优选的实施方案中,在Redγ的存在下进行同源重组。特别优选在Redγ存在下在宿主细胞内进行同源重组。
[0050] 在一些实施方案中,在RecA的存在下实施本发明的方法(参见文献 27)。RecA是单链结合蛋白,是内源性大肠杆菌的对应于RecT/Redβ的部分。由于RecA可以改善电转化后宿主细胞的存活,因此DNA的转化在RecA的存在下比不存在RecA时更好。优选在Redγ和RecA存在下实施本发明的方法。
[0051] 惊奇的发现对于LCHR,起始的环状核酸分子需要复制以进行同源重组。因此,在使用基于R6Kγ来源的质粒和LCHR的方法的实施方案中,优选在Pir蛋白的存在下实施所述方法(参见文献33),例如,在pir+宿主细胞中。相反,对于LLHR,起始的线性核酸分子并不需要复制。因此,在方法用于介导LLHR的实施方案中,所述方法在Pir蛋白不存在的情况下进行,例如,在pir-宿主细胞中。
[0052] 本发明的方法在宿主细胞中可受到全部或部分的影响。合适的宿主细胞包括许多物种的细胞,包括寄生虫、原核生物和真核生物,但是细菌如革兰氏阴性细菌是优选的宿主。更优选的,宿主细胞是肠细菌细胞,如沙氏菌(Salmonella)、克雷伯氏菌(Klebsiella)、芽孢杆菌(Bacillus)、奈瑟氏菌(Neisseria)、发光杆菌(Photorhabdus)或大肠杆菌(Escherichi a coli)细胞(本发明的方法在已检测的所有大肠杆菌菌株中都起着有效的作用)。优选的宿主细胞是大肠杆菌K12。然而应当注意,本发明的方法同样适用于真核细胞或生物体中,如真菌植物或动物细胞。该系统已经证实在小鼠ES细胞中具有功能,并且没有理由推测在其他真核细胞细胞中没有功能。典型地,宿主细胞是分离的宿主细胞,但是同样可以使用未分离的宿主细胞。
[0053] 所述5’到3’核酸外切酶和/或退火蛋白可以由外源DNA在宿主细胞中表达,例如,由转化进宿主细胞的载体中表达。一个合适载体的实例是p SC101质粒(参见文献38),但是也可以使用其它合适的载体。相似的,如果需要,Redγ、RecA、Redα和/或Redβ中的一个或多个或全部都可以由宿主细胞中的外源DNA表达。任何合适的启动子都可以用来驱动这些蛋白的表达。但是,在表达RecE时,优选诱导型启动子,如阿拉伯糖诱导型启动子(例如Para-BAD,也称为“pBAD”)或鼠李糖诱导启动子(例如rhaS-prha)。在Redγ存在下进行本发明的方法并且5’到3’核酸外切酶是RecE的实施方案中,优选在鼠李糖诱导型启动子的控制下表达RecE。
[0054] 大肠杆菌K12宿主细胞的基因组中包括全长recE基因和recT基因的内源性拷贝。这些存在于已整合到宿主基因组中的rac噬菌体。但是,由于该基因是沉默的,因此全长RecE的表达并不能由该整合基因自然发生。因此,在5’到3’核酸外切酶由外源DNA表达的实施方案中,可在不存在内源性RecE活性情况下实施所述方法。
[0055] 还提供转化了编码如上所述的5’到3’核酸外切酶的核酸分子的宿主细胞。优选地,所述5’到3’核酸外切酶由所述核酸表达,因此本发明还提供了表达本发明的第一个方面的方法中列举的5’到3’核酸外切酶的宿主细胞。优选的,所述宿主细胞表达全长RecE。所述5’到3’核酸外切酶优选地在诱导性启动子的控制下表达,如鼠李糖诱导型启动子(例如rhaS-P rha)或阿拉伯糖诱导型启动子(如Para-BAD)。这些启动子都是本领域公知的。
[0056] 但是,作为在宿主细胞中由异源DNA表达5’到3’核酸外切酶(例如 RecE)的供选择的方式,在一些实施方案中,RecE由整合的前噬菌体的r ecE基因表达,其中RecE的表达由异源启动子驱动。例如,异源启动子可以插入到存在于原噬菌体上的recE基因的内源性拷贝的上游,使其可操作的连接于recE基因。可以使用任意的合适启动子。优选的,所述启动子是诱导型启动子,例如,阿拉伯糖诱导型启动子如Para-BAD。在一些实施方案中,使用鼠李糖诱导型启动子。在一些实施方案中,将hyg-araC-p PAB盒插入到recE基因的内源性拷贝的上游。
[0057] 因此,提供了一种包含源自整合的原噬菌体的recE基因的宿主细胞,其中recE基因在异源启动子的控制之下。所述启动子优选诱导型启动子,例如,阿拉伯糖诱导型启动子如Para-BAD或鼠李糖诱导型启动子(例如 rhaS-Prha)。宿主细胞优选大肠杆菌,更优选大肠杆菌K12。
[0058] 本发明中的宿主细胞还优选地包括编码退火蛋白(优选RecT)的核酸。所述宿主细胞还优选地包括编码Redγ的核酸。在一些实施方案中,所述宿主细胞还可以包括包含RecA和/或Redα和/或Redβ的核酸。优选地,所述宿主细胞表达RecE、RecT和Redγ、以及任选的RecA。在一些实施方案中,所述宿主细胞额外表达Redα和Redβ。
[0059] 在一个实施方案中,所述宿主细胞通过Para-BAD启动子表达RecE、 RecT、Redγ和RecA,任选的作为操纵子。在一些实施方案中,所述Rec E、RecT、Redγ和RecA由取代大肠杆菌宿主细胞染色体中的ybcC的Par a-BAD启动子表达。
[0060] 还设想在所述第一和第二核酸分子是线性的实施方案中,本发明的方法在体外受到全部或者部分的影响。例如,可以使用纯化的5’到3’核酸外切酶和退火蛋白(优选纯化的RecE和RecT蛋白),或者使用表达所述5’到3’核酸外切酶和退火蛋白的大肠杆菌细胞的提取物。当在体外实施该方法时,对所述第一和第二线性核酸分子进行预处理以暴露单链同源末端是有利的。
[0061] LCHR和LLHR都需要第一和第二核酸分子之间的共享同源性的区域,通过所述区域发生同源重组。。在LLHR的情况下,所述第一核酸分子必须与所述第二核酸分子共享至少一个序列同源区域。在一些实施方案中,所述第一核酸分子与所述第二核酸分子共享一个序列同源区域,以使第一和第二核酸分子之间的LLHR产生线性产物。在LLHR在所述第一和第二线性核酸和一个或多个额外的线性核酸之间发生以形成线性产物的实施方案中,每个线性核酸与在LLHR反应的线性产物中形成其邻近物的线性核酸共享一个序列同源区域。在LLHR在所述第一和第二线性核酸和一个或多个额外的线性核酸分子之间发生以形成环状产物的实施方案中,每个线性核酸与在LLHR反应的环状产物中形成其邻近物的线性核酸共享一个序列同源区域。在一些实施方案中,所述第一核酸分子和所述第二核酸分子共享两个序列同源区域,以使第一和第二核酸分子之间的LLHR形成环状分子。本领域技术人员知道如何设计同源区域以形成线性分子或环状分子。
[0062] 优选的,至少一个同源臂在每个线性片段的最末端。当同源臂在每个线性片段的最末端并且不同的同源臂在另一端时,这些序列同源区域或“同源臂”产生最佳构型,如此构造这些同源臂以使重组产生环。当同源臂不位于末端时可以发生LLHR,但是效率会降低。因此,在优选的实施方案中,所述同源的至少一个区域位于所述至少第一和第二核酸分子的一个或两个末端的最外端。在一些实施方案中,所述同源区域位于所述至少第一和/或第二核酸分子的内部。在一些实施方案中,所述同源区域位于接近所述至少第一和第二核酸分子的一个或者两个末端的位置,例如,所述的线性核酸分子的N-末端和C-末端分别距离同源臂的N-末端和C-末端少于 100核苷酸(如少于75、少于50、少于25、少于10、少于5个核苷酸)。
[0063] 已经发现LLHR和LCHR之间对于需要的同源臂的最小长度存在差异。在一定情况下,RecET介导的LLHR在第一和第二核酸分子之间仅需要6bp的同源,而λRed介导的LCHR需要至少20bp的同源来结合第一和第二核酸分子。因此,在包括LLHR的方法的实施方案中,所述的序列同源区域的长度为至少6、至少10、至少20或至少30个核苷酸。例如,在一些实施方案中,序列同源区域为6-6、6-9、6-30、6-100、10-20、20-29、 20-40、20-50、10-100、25-30、25-40、25-50、30-40或30-50个核苷酸。同源重组的效率通常会随着使用的同源臂的长度而增加,因此可以使用较长的同源臂。
[0064] 第一和第二核酸分子之间的“同源”是指当第一和第二核酸分子的序列进行比对时,有许多核苷酸残基在所述序列的相同位置上是相同的。同源的程度很容易计算出来(Computational Molecular Biology,Lesk,A.M., ed.,Oxford University Press,New York,1988;Biocomputing.Informati cs and Genome Projects,Smith,D.W.,ed.,Academic Press,New York, 1993;Computer Analysis of Sequence Data,Part 1,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysi s in Molecular Biology,von Heinje,G.,Academic Press,1987;and Seq uence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,New York,1991)。
[0065] 本发明第一方面的方法可用于介导三倍体重组(triple recombination) (三倍体同源重组在WO2009/104094中详细描述,将其内容引入本文作为参考)。因此,在一些实施方案中,所述第一和第二核酸分子是线性的并且所述方法进一步包括在5’到3’核酸外切酶和退火蛋白的存在下将第三核酸分子与所述第一和第二核酸分子接触,其中所述第一核酸分子与第二核酸分子共享一个同源区域并且与第三核酸分子共享不同的同源区域,其中所述第二核酸分子与第一核酸分子共享一个同源区域并且与所述第三核酸分子共享不同的同源区域,其中所述第三核酸分子与所述第二核酸分子共享一个同源区域并且与所述第一核酸分子共享不同的同源区域。在三倍体重组的一些实施方案中,所述第三核酸分子是线性的。在三倍体重组的优选实施方案中,第三核酸分子是环状的。在所述第三核酸分子是环状的实施方案中,假设本方法包括第一和第二核酸分子之间进行LLHR以形成线性产物的步骤以及所述线性产物和所述环状的第三核酸分子之间进行LCHR的步骤。已经发现全长RecE与RecT一起介导三倍体重组,但是当第三核酸分子为环状时具有较低的效率。在一些实施方案中,第一和第二核酸分子之间的重组构建了选择标志物,所述选择标志物可用于选择正确的重组体。在一些实施方案中,所述第一和第二核酸分子中的一个或者两个中包括选择标志物。如果在所述第一和第二核酸分子上都存在选择标志物,优选这些选择标志物是不同的。
[0066] 在三倍体重组的一些实施方案中,所述第一核酸分子和第二核酸分子具有对称的脱磷酸化末端。在三倍体重组的优选实施方案中,所述第一核酸分子和第二核酸分子具有不对称的硫代磷酸化末端。
[0067] 在一些实施方案中,本发明第一方面的方法可用于介导四倍体重组(q uadruple recombination)(参见WO2009/104094)。因此,在一些实施方案中,所述第一和第二核酸分子是线性的并且所述方法进一步包括在5’到3’核酸外切酶和噬菌体退火蛋白的存在下将第三核酸分子和第四核酸分子与所述第一和第二核酸分子接触,其中所述第一核酸分子与第二核酸分子共享一个同源区域并且与第四核酸分子共享不同的同源区域,其中所述第二核酸分子与第一核酸分子共享一个同源区域并且与所述第三核酸分子共享不同的同源区域,其中所述第三核酸分子与所述第二核酸分子共享一个同源区域并且与所述第四核酸分子共享不同的同源区域,其中所述第四核酸分子与所述第三核酸分子共享一个同源区域并且与所述第一核酸分子共享不同的同源区域。在四倍体重组的优选实施方案中,所述第三和第四核酸分子是线性的。在一些实施方案中,所述第三核酸分子是环状的并且所述第四核酸分子是线性的。
[0068] 四倍体重组在复杂DNA构建体的组装或者采用两个寡核苷酸将感兴趣的线性序列克隆到载体上具有特殊的用途,从而避免PCR扩增待克隆的序列的需要。有利地,四倍体重组可以用于将感兴趣的序列直接克隆到克隆载体如BAC上,所述感兴趣的序列为长DNA片段序列如基因组DNA 片段。所述第一核酸分子优选地包含感兴趣的序列。所述感兴趣的序列可以是任意长度,例如,一段少于150个核苷酸的短合成寡核苷酸,但是优选长2kb或者更长(更优选2.5kb或更长、3kb或更长、5kb或更长、7kb 或更长、10kb或更长、15kb或更长、16kb或更长、20kb或更长、25kb或更长、30kb或更长、40kb或更长)。例如,在一些实施方案中,所述感兴趣的序列长2-100kb(例如,长2-75kb、4-50kb、4-25kb,、5-15kb、7-10k b、15-100kb、15-75kb、20-75kb、25-50kb、40-100kb、40-75kb)。
[0069] 在四倍体重组的优选实施方案中,所述第三核酸分子是线性化的克隆载体,例如,可以是线性BAC。在其他实施方案中,所述第三核酸分子是环状核酸分子。在四倍体重组的一些实施方案中,所述第二和第四核酸分子是短的寡核苷酸(例如,长度为150个核苷酸或更少、120个核苷酸或更少、100个核苷酸或更少、80个核苷酸或更少、60个核苷酸或更少、或者50个核苷酸或更少)。在四倍体重组的一个优选实施方案中,所述第一核酸分子包括感兴趣的序列,所述第二和第四核酸分子是短的寡核苷酸,所述第三核酸分子是克隆载体,更优选线性化的克隆载体。
[0070] 三倍体和四倍体重组可以有利地由全长RecE介导。在一些实施方案中,在不存在Redα和Redβ时,由全长RecE介导三倍体或四倍体重组。
[0071] 当第三核酸分子是环状的时,如上所述的三倍体或四倍体重组的方法可以有利地在含有RecE/RecT蛋白和Redα/Redβ蛋白的宿主细胞中进行。本发明提供了这样的宿主细胞。在优选的实施方案中,RecE基因受到来自Redα/Redβ基因的不同启动子的控制以使不同的基因可以独立的暂时表达。例如,在一些实施方案中,提供宿主细胞,其中所述宿主细胞包含受第一诱导型启动子(例如,阿拉伯糖诱导型启动子如Para-BAD)控制的R edα、Redβ以及任选的Redγ,和受第二诱导型启动子(例如,鼠李糖诱导型启动子如rhaS-Prha)控制的RecE以及任选的Redγ,所述RecE优选噬菌体退火蛋白(最优选RecT)。在一些实施方案中,RecA也由一个或两个启动子表达。有利地,所述宿主细胞源自GB2005大肠杆菌宿主细胞 (参见文献25),由于该宿主细胞在大肠杆菌染色体上包含由Para-BAD 启动子控制的Redα、Redβ和Redγ。优选的,这些宿主细胞表达的RecE 是全长RecE。在使用LLHR步骤和LCHR步骤的方法中,使用这样的宿主细胞是有利的。有利的是,这样的宿主细胞可以用于克隆大片段的细菌基因组,例如用于生产次级代谢产物的操纵子。
[0072] 在一些实施方案中,三倍体重组或四倍体重组方法可以为两步法,其中在本文描述的5’到3’核酸外切酶和合适的退火蛋白(优选RecE和Rec T)存在下,在三倍体重组中的第一和第二核酸分子之间的LLHR或者在四倍体重组中的第四、第一和第二核酸分子之间的LLHR在体外进行,并且在Redα和Redβ存在下,在宿主细胞中进行将LLHR的产物和所述的环状的第三核酸分子接触的步骤以介导LCHR。
[0073] 在一些实施方案中,本发明的方法包括将多个线性分子连在一起形成环状分子,例如环状质粒。例如,所述方法可以进一步包括在5’到3’核酸外切酶和退火蛋白存在下将至少一个(例如,1、2、3、4、5、6、7、8、 9、10或多于10个)其它线性分子与所述第一和第二核酸分子接触,其中每个核酸分子与在所产生的环状产物中形成邻近物的核酸分子共享一段同源区域,并按照本发明的方法进行LLHR。
[0074] 在一些实施方案中,根据本发明第一方面的方法用于将DNA序列插入或整合到环状靶标上。在一些实施方案中,根据本发明第一方面的方法用于从环状靶标上亚克隆DNA序列。在一些实施方案中,根据本发明第一方面的方法用于从线性靶标上克隆DNA序列。在一些实施方案中,根据本发明第一方面的方法用于寡片段修复。
[0075] 在本发明第一方面的一些实施方案中,所述第一核酸分子和/或第二核酸分子是单链线性核酸分子。例如,在所述第一和第二核酸分子是线性的 (因此所述方法用于介导LLHR)一些实施方案中,所述第一和/或第二核酸分子是单链的。所述单链核酸分子优选地被合成为长度小于180个核苷酸的寡核苷酸(例如,150个核苷酸或更少、130个核苷酸或更少、110个核苷酸或更少、100个核苷酸或更少、80个核苷酸或更少、60个核苷酸或更少或55个核苷酸或更少)。该实施方案可用于向第二核酸分子的序列中引入突变(例如,点突变,如取代、插入或删除)。所述单链核酸分子优选包括后随链的序列。在其他实施方案中,所述单链核酸分子包括前导链的序列。所述的链根据在靶分子(代表性的是第二核酸分子)中的复制方向定义为前导链或后随链。在一些实施方案中,所述第一和/或第二核酸分子是双链。
[0076] 有利的是,根据本发明第一方面的方法进行的LLHR可用于生成cDN A文库。该方法部分使用本领域公知的“PlugOligo”方法(参见文献37)。所述生成cDNA文库的方法优选包括通过如下方式生成第一核酸分子:
[0077] i)将含有多个T核苷酸的3’寡核苷酸与一个或多个感兴趣的mRNA 序列接触以使所述3’寡核苷酸退火至polyA尾;其中所述3’寡核苷酸包括 3’到多个T核苷酸的序列,所述序列与克隆载体共享同源区域以用于产生文库;
[0078] ii)从mRNA反转录互补cDNA;
[0079] iii)将具有多个G核苷酸的5’寡核苷酸(所述的“PlugOligo”)与ii) 的产物接触以使所述的多个G核苷酸退火至添加在所述cDNA序列末端的多个C核苷酸,其中所述5’寡核苷酸提供5’到多个G的模板序列用于第一链合成的延伸,其中所述序列与克隆载体共享一段同源区域以用于生成文库以及3’磷酸末端,其中所述i)中的同源区域和iii)中的同源区域是不同的,和
[0080] iv)除去所述PlugOligo,并且从所述第二同源区域的5’端合成第二链以产生在每个末端具有两个同源区域的双链cDNA。
[0081] 所述第一核酸分子(iv)中的双链cDNA)与所述的根据本发明第一方面的实施方案的第二核酸分子(优选线性化的克隆载体)接触。因此,在本实施方案的方法的一个优选实施方案中,所述iv)中的双链cDNA和所述线性化的克隆载体分别是本发明第一方面方法中描述的第一和第二核酸分子。
[0082] 有利的是,本发明的LLHR方法可用于亚克隆来自BAC的感兴趣的序列。优选的,在这些实施方案中,所述第一核酸分子是包括感兴趣序列的线性化的BAC,所述第二核酸分子是线性化的克隆载体。所述BAC优选(例如,采用限制性内切酶)进行线性化以使感兴趣的序列保持完整。本发明基本解决了从复杂的混合物中直接克隆DNA所涉及的非常困难的问题,因此也描述了一种改进的方法以使亚克隆工作更加简单。
[0083] 在一些实施方案中,所述第一核酸分子是线性的并且在靠近5’端处包含硫代磷酸酯化并且在靠近3’端处包含硫代磷酸酯化。“靠近”是指在核酸分子的末端或者接近末端,例如在5’端的200nt、100nt、50nt或25nt内。在一些实施方案中,所述5’硫代磷酸酯化是在所述第一核苷酸分子的同源区域之后,而所述3’硫代磷酸酯化是在所述第一核苷酸分子的同源区域之前。在一些实施方案中,所述5’硫代磷酸酯化是在所述第一核酸序列的5’端的第51个核苷酸处,而所述3’硫代磷酸酯化是在所述第一核酸序列的3’端的第51个核苷酸处。在一些实施方案中,两个或多个线性核酸分子具有不对称的硫代磷酸酯化末端。在WO2009/104094中详细描述了使用硫代磷酸酯化产生不对称的线性核酸分子,将其全部内容引入本文作为参考。有利的是,当所述第一核酸分子进行了如上所述的硫代磷酸酯化时,所述第二核酸分子是线性的并且在靠近3’端处包含硫代磷酸酯化。
[0084] 在一些实施方案中,至少一个核酸分子包含选择标志物以允许选择正确的重组体。在一些实施方案中,重组导致了选择标志物的重建。本发明中可以使用任意合适的选择标志物。在一些实施方案中,选择标志物是抗生素抗性基因,例如,选自卡那霉素抗性,氯霉素抗性,氨苄青霉素抗性和杀稻瘟菌素抗性的抗生素抗性基因。
[0085] 在一些实施方案中,可以使用反向选择标志物。例如,当实施根据本发明的方法进行直接克隆时,使用ccdB反向选择标志物可以用于降低背景重组。在一些实施方案中,使用反向选择标志物以使错误重组体(例如,所述第一或第二核酸分子的自环化)导致反向选择基因的表达,而正确的重组体阻止反向选择基因的表达。表达产物对宿主细胞具有毒性的基因可以用作反向选择标志物。该类基因的一个实施例是ccdB。
[0086] 在一些实施方案中,本发明的一个方法中使用反向选择标志物和选择标志物。
[0087] 所述至少第一和第二核酸分子可以源自任意合适的来源。例如,所述至少第一和第二核酸分子可以包括来自真核生物或原核生物的核酸序列。在一些实施方案中,所述第一和/或第二核酸分子是基因组DNA。典型的,所述基因组DNA是基因组DNA的片段。所述基因组DNA优选包括感兴趣的序列。在一些实施方案中,基因组DNA片段可以通过剪切或消化基因组DNA(例如使用限制性内切酶)获得以使感兴趣的序列保持完整。在一些实施方案中,所述第一和/或第二核酸分子是cDNA文库中的成员。在一些实施方案中,所述第一和/或第二核酸分子获得自BAC。在一些实施方案中,所述第一和/或第二核酸分子(例如,基因组DNA片段、cDN A文库成员或源自BAC的片段)包括长为2kb或更长(例如,2.5kb或更长、4kb或更长、5kb或更长、7.5kb或更长、10kb或更长、15kb或更长、 20kb或更长、25kb或更长、40kb或更长、50kb或更长、75kb或更长或1 00kb或更长)的感兴趣的序列。在一些实施方案中,所述第一和/或第二核酸分子(例如,基因组DNA片段、cDNA文库成员或源自BAC的片段) 包含或由长为2-150kb的感兴趣的序列组成(例如,长为5-100kb、7.5-75 kb、10-50kb、15-25kb、15-
75kb、40-100kb或40-75kb)。优选的,感兴趣的基因是在第一和/或第二核酸分子的任一端的同源臂之间的全部区域。例如,所述第一和/或第二核酸分子可包括感兴趣的序列,所述感兴趣的序列包含或由基因簇组成,所述基因簇如编码次级代谢产物途径或脂肪酸合成途径的基因簇。在所述第一核酸分子是基因组DNA片段的实施方案中,所述第二核酸分子优选线性化的克隆载体,如线性化的BAC。
[0088] 在所述第一核酸分子是基因组DNA片段的实施方案中,所述方法包括通过消化或剪切基因组DNA来生成第一核酸分子以获得包含感兴趣的序列的线性基因组DNA片段(优选第一核酸分子),接着将线性基因组D NA片段(优选第一核酸分子)与线性克隆载体(优选第二核酸分子)共电穿孔至宿主细胞中,从而将第一核酸分子与第二核酸分子接触。所述第二核酸分子优选包含选择标志物。为了增加获得的正确重组体的数量,在一些实施方案中所述方法可以有利地进一步包括使用选择标志物选择正确的重组体,以及使用另外的编码第二选择基因的线性DNA对抗性菌落进行电穿孔,所述第二选择基因的两侧连接了与打算克隆的区域部分相对应的同源臂,接着在选择第二选择标志物后选择生长的正确的菌落。
[0089] 优选的,所述第一核酸分子是线性的并且包含感兴趣的序列,所述第二核酸分子是克隆载体。在一些实施方案中,所述克隆载体是环状的。在优选的实施方案中,所述克隆载体已经线性化。
[0090] 在一些实施方案中,本发明第一方面的方法可用于从人类或者非人类动物中直接克隆DNA区域,例如,用于健康研究或通过基因打靶进行修正的再生治疗。例如,在一些实施方案中,所述第一核酸分子包括或由来自人或非人类动物的基因组DNA片段组成。所述基因组DNA片段可以包括感兴趣的序列,如包含突变的基因,其中该突变导致疾病或者病症并且将该突变修正为野生型序列可以治疗或预防该疾病或病症。在一些实施方案中,所述基因组DNA片段可包括野生型基因序列。在一些实施方案中,所述第一核酸分子包含基因组DNA片段,所述基因组DNA片段包含野生型基因序列,所述第二核酸分子是宿主细胞染色体。该方法可以有利地用于通过基因打靶来治疗或预防疾病或病症。但是,在一些实施方案中,本发明的范围中特别排除了通过了手术或治疗(therapy)对人或动物体进行治疗的方法。有利的是,根据本发明的这个实施方案提供了第一核酸分子以用于通过基因打靶来治疗或预防疾病或病症的方法中,其中所述与第一核酸分子进行同源重组的所述第二核酸分子是宿主细胞染色体。
[0091] 提供了用于本发明第一个方面的方法中的试剂盒。在一些实施方案中,所述试剂盒包括编码本文描述的5’到3’外切酶的核酸。在一些实施方案中,所述试剂盒包括在此处描述的5’到3’外切酶。优选的,所述5’到3’外切酶是RecE,更优选的,所述RecE是全长RecE。更优选的,所述试剂盒包括本文描述的宿主细胞。例如,在一些实施方案中,试剂盒中的宿主细胞包括在异源启动子和退火蛋白的控制下编码本文所述的RecE的核酸,优选RecT。在一些实施方案中,所述宿主细胞还包括编码Redγ的核酸。在一些实施方案中,所述宿主细胞表达RecE、RecT以及优选的Re dγ。所述试剂盒还可包括一个或多个预先制备的线性载体。
[0092] 本发明第一方面的方法的另一优选应用涉及合成生物学中的线性核酸分子的组装,所述线性核酸分子优选线性DNA。因此,在一些实施方案中,所述第一和第二核酸分子是线性的并且所述方法进一步包括在5’到3’核酸外切酶和退火蛋白的存在下将所述第一和第二核酸分子与一个或多个其它线性核酸分子(例如,1、2、3、4、5、6、7、8、9、至少10、至少25、至少50个其它核酸分子)接触以产生线性产物。在一些实施方案中,一个或者多个或者全部的线性核酸分子是单链的。优选的,一个或多个或全部的核酸分子是寡核苷酸或双链DNA。在优选的实施方案中,第一和第二核酸分子以及一个或多个其它核酸分子之间的同源重组导致基因、操纵子、染色体或整个基因组的产生。DNA核酸的合成生物学组装已经用来产生基因、操纵子、染色体,或在最近用来产生整个基因组(参见文献42)。现在使用的组装方法采用常规的DNA连接或由Red操纵子介导的同源重组或在酿酒酵母细胞中的内源性机制。此处基于RecE定义的改善的性能将成为商业上和研究中合成生物学DNA组装的一种优选方法。
[0093] 惊奇的发现在反应混合物中加入至少一个与参与重组的核酸序列未共享序列同源性的单链DNA寡核苷酸可以使RecE和RecT介导的LLHR 的效率提高。与在没有单链DNA寡核苷酸的情况下进行的LLHR相比,该单链DNA寡核苷酸的加入提高了在已有的LLHR技术中使用的截短的 RecE以及在本发明第一方面中使用的N末端延长的RecE介导的LLHR 的效率。该提高的分子学基础仍然是未知的。尽管如此,惊奇地发现添加单链寡核苷酸拟表型产生另外的由上述N末端延伸的RecE形式表达出的 LLHR的效率。
[0094] 因此,在第二个方面中,提供了一种通过在至少一个单链寡核苷酸的存在下进行同源重组来提高同源重组效率的方法,所述至少一个单链寡核苷酸与经历同源重组的核酸分子没有序列同源性,其中,相对于当至少一个单链寡核苷酸不存在时进行的同源重组,所述同源重组的效率是提高的。
[0095] “没有序列同源性”是指序列同源性的平低于影响两个核酸序列之间的同源重组所需要的水平。因此,所述单链寡核苷酸并不包括与经历同源重组的长度大于6个核苷酸的核酸分子相同的任何序列区域。
[0096] 典型的,所述至少一个单链寡核苷酸包括或者由DNA组成。然而,在一些实施方案中,所述至少一个单链寡核苷酸包括RNA或一个或多个修饰的核苷酸。
[0097] 在一些实施方案中,所述至少一个单链寡核苷酸的长度为10-100个核苷酸。例如,在一些实施方案中,所述至少一个单链寡核苷酸的长度为1 0-80、10-70、20-70、20-60、30-60、30-50、35-45、38-42或39-41个核苷酸。优选的,所述至少一个单链寡核苷酸的长度为40个核苷酸。
[0098] 通常,存在所述至少一个单链寡核苷酸的多拷贝。在一些实施方案中,使用两个或多个(例如3、4、5、10、15、20个或更多)不同的单链寡核苷酸。这些两个或多个不同的单链寡核苷酸在序列和/或长度上是不同的。
[0099] 根据本发明的第二方面的同源重组的方法可以在宿主细胞内或在体外进行。宿主细胞的选择与本发明的第一方面的方法的考虑相似。优选的宿主细胞的实例是大肠杆菌K12,例如GB2005。
[0100] 可以使用所述至少一个单链寡核苷酸的任意合适的浓度。在宿主细胞内发生同源重组并且通过电转化转入宿主细胞中的实施方案中,在每次电转化中所述至少一个单链寡核苷酸的浓度为1-200pmol(例如,20-150pmo l、75-150pmol、85-120pmol、95-105pmol、98-102pmol、99-101pmol)。优选每次电转化使用100pmol。在优选的实施方案中,所述至少一个单链寡核苷酸的长度为40个核苷酸并且电转化的浓度为100pmol。
[0101] 本发明第二方面的方法中进行的同源重组可由宿主细胞的内源机制介导,例如,GB2005中的内源机制。例如,惊奇地发现,与在所述至少一个单链寡核苷酸不存在时将第一和第二核酸分子共转化至宿主细胞中相比,在RecE和RecT或Redα和Redβ的表达不存在时,将所述至少一个单链寡核苷酸与共享两个序列同源区域的第一和第二核酸分子共转化至GB2005宿主细胞中可以使LLHR的效率提高10倍。
[0102] 在优选的实施方案中,本发明第二方面的方法可由任意合适的5’到3’核酸外切酶和退火蛋白介导。在本发明第二方面的方法的一些实施方案中,所述同源重组由RecE和噬菌体退火蛋白介导。所述噬菌体退火蛋白优选为RecT。在一些实施方案中,RecE是现有同源重组方法中使用的截短型的RecE。例如,在一些实施方案中,本发明第二方面的方法中使用的RecE包括RecE的5’到3’核酸外切酶活性但是不包括SEQ ID NO:1的第1-587位氨基酸的N末端序列。例如,在一些实施方案中,本发明第二方面的方法中使用的RecE选自由SEQ ID NO:1的第588-866、595-866、 597-866、602-866或606-866位组成的RecE。
[0103] 在一些实施方案中,本发明的第二方面进行的同源重组方法是本发明的第一方面描述的同源重组的方法。所有在本发明的第一方面中描述的实施方案都可以应用于本发明的第二方面。因此,在一些实施方案中,本发明第二方面的方法中使用的RecE是本发明的第一方面的方法中使用的Re cE。特别优选使用包括或者由SEQ ID NO:1的第564-866位组成的RecE。在一些实施方案中,使用全长的RecE。
[0104] 在其他实施方案中,本发明的第二方面的方法中进行的同源重组由R edα和Redβ介导。但是,已经发现由加入至少一个单链寡核苷酸使得由全长RecE和RecT介导的同源重组的效率的提高远大于由Redα和Redβ介导的同源重组的效率的提高。
[0105] 在本发明的第二方面的方法的优选实施方案中,所述方法包括在全长 RecE、RecT、Redγ、RecA和与经历同源重组的核酸分子没有序列同源性的所述至少一个单链寡核苷酸的存在的情况下实施同源重组。在该实施方案中,RecE的表达优选在鼠李糖诱导型启动子的控制下。还提供了用于实施该方法的宿主细胞。
[0106] 在一些实施方案中,本发明第二方面的方法用于介导LLHR。在一些实施方案中,本发明第二方面的方法用于介导LCHR。在一些实施方案中,本发明第二方面的方法用于介导LLHR和LCHR。
[0107] 提供了用于实施根据本发明的第二方面方法的同源重组的试剂盒。实施本发明的第二方面的方法的试剂盒包括如上所述的至少一个单链寡核苷酸。优选的,所述试剂盒包括一个或多个编码RecE、RecT以及任选的 Redγ的核酸分子。在一些实施方案中,所述试剂盒还包括一个或多个编码 Redα和Redβ的核酸分子。在一些实施方案中,所述核酸分子为适于转化至宿主细胞中的表达载体的形式。在其他实施方案中,所述试剂盒包括包含这些核酸分子的宿主细胞。在一些实施方案中,所述试剂盒包括表达R ecE、RecT以及任选的Redγ和/或表达Redα和Redβ的宿主细胞。在一些实施方案中,所述试剂盒是还包括如上所述的至少一个单链寡核苷酸的 PCR克隆试剂盒(http://www.genscript.com/cloneez_PCR_Clonin g_kit.html)或Cold  Fusion克隆试剂盒(http://
www.systembio.com/cold-fu sion-cloning/)。在一些实施方案中,用于实施同源重组方法的试剂盒是如上所述的用于本发明第一方面的方法的试剂盒,其中还包括所述至少一个单链寡核苷酸。
[0108] 惊奇地发现,可能通过在体内生成线性核酸分子然后在体内进行同源重组(即,在生成线性核酸分子的宿主细胞中)从而提高同源重组的效率。如上详细描述的,已经观察到在一些条件下进行LLHR的效率要高于LC HR。在同源重组的一些实例中,例如离体同源重组,可以通过在5’到3’核酸外切酶和退火蛋白的存在下提供线性核酸分子而简单地进行LLHR。该方法也可以用于体内的同源重组方法,但是这需要将线性核酸分子转化入宿主细胞,其中同源重组在宿主细胞内发生。因此所述方法受到线性分子的转化效率通常比相应的环状分子的效率低104倍的事实的限制。
[0109] 为了克服阻止该体内这种同源重组形式的优势完全开发的的线性分子的转化效率的限制,发明者开发了一种使用稀有切割序列特异性DNA 切割酶在体内产生线性核酸分子的方法,然后将其用于体内的同源重组方法。因此在体内生成线性核酸分子的这个步骤十分有利,这是由于它避免了线性片段向宿主细胞中低效率转化的效率丧失,同时允许开发由涉及线性片段的重组产生的高频同源重组。
[0110] 因此,在第三个方面中,提供了一种在共享至少一段序列同源区域的至少第一核酸分子和第二核酸分子之间进行同源重组的方法,包括,在进行体内同源重组之前,采用稀有切割序列特异性DNA切割酶线性化至少一个环状核酸分子以生成所述第一和/或第二核酸分子的步骤。
[0111] 在第三方面的一些实施方案中,所述采用稀有切割序列特异性DNA 切割酶在体内线性化至少一个环状核酸分子的步骤用于生成所述第一核酸分子而不是第二核酸分子。在一些实施方案中,采用稀有切割序列特异性DNA切割酶在体内线性化至少一个环状核酸分子的所述步骤用于生成所述第二核酸分子而不是第一核酸分子。
[0112] 在第三个方面的优选实施方案中,提供了提高共享至少一个序列同源区域的第一核酸分子和第二核酸分子之间的同源重组效率的方法,包括,在进行体内同源重组之前,采用稀有切割序列特异性DNA切割酶在体内线性化至少一个环状核酸分子以生成所述第一和/或第二核酸分子的步骤,其中同源重组的效率相对于在没有采用稀有切割序列特异性DNA切割酶在体内线性化至少一个环状核酸分子的步骤的情况下实施的体内同源重组是提高的。在第三方面的一些实施方案中,同源重组的效率相对于采用线性的第一核酸分子和环状的第二核酸分子在体内进行的同源重组是提高的。在第三方面的一些实施方案中,同源重组的效率相对于采用环状的第一核酸分子和线性的第二核酸分子在体内进行的同源重组是提高的。在第三方面的一些实施方案中,同源重组的效率相对于采用线性的第一核酸分子和线性的第二核酸分子在体内进行的同源重组是提高的,其中所述宿主细胞转化了至少线性化形式的线性第二核酸分子。在第三方面的一些实施方案中,同源重组的效率相对于采用线性的第一核酸分子和线性的第二核酸分子在体内进行的同源重组是提高的,其中所述宿主细胞转化了至少线性化形式的线性第一核酸分子。
[0113] 使用本发明第三方面的方法产生的同源重组效率的提高是由于不同的机制,而不是由于本发明的第一和第二方面的方法产生的同源重组效率的提高。因此,本发明的第三方面的方法可以采用(i)其自身,(ii)与本发明的第一方面或本发明的第二方面组合,或者(iii)与本发明的第一和第二方面组合。
[0114] 由本发明第三方面的方法提供的重组频率的提高在用于克隆,如生成文库,例如在与17ff页详细描述的方法的组合中是非常有利的。在这些方法中,所述第一核酸分子是需要克隆的核酸(例如,基因组DNA片段,或第18页的步骤iv)中列举的双链cDNA),所述第二核酸分子是线性的克隆载体。因此本发明的第三方面的方法可以用于在同源重组发生之前在体内对环状克隆载体(其中所述克隆载体设计为包含一个或多个针对宿主细胞表达的稀有切割序列特异性DNA切割酶的识别位点)进行线性化。在这些例子中,通常所述同源重组发生的宿主细胞中转化了环状克隆载体,然后培养该转化的宿主细胞,以及如此诱导稀有切割序列特异性DN A切割酶以使其用于线性化环状载体。在一些实施方案中,所述宿主细胞制备成感受态并且转化需要克隆的核酸。在转化后,所述线性化的克隆载体可以和所述需要克隆的核酸在体内进行同源重组。在一些实施方案中,所述第一核酸分子对宿主细胞是内源的,例如,基因组DNA或基因组D NA的片段,例如所述宿主细胞染色体的片段,以及简单诱导稀有切割序列特异性DNA切割酶的表达和剪切或消化所述基因组DNA(例如,采用限制型内切酶)以使感兴趣的序列保持完整,使克隆能够进行。
[0115] 在被线性化的核酸分子是克隆载体的例子中,与为了影响LLHR而向宿主细胞中转化线性载体相比,在体内生成所述线性核酸分子增加了发生同源重组的任何给定宿主细胞包含线性化的克隆载体的可能性。因此,线性克隆载体出现的概率的增加提高了同源重组发生的可能性(因为线性核酸分子比环状核酸分子更容易发生重组),并相应的提高了宿主细胞包含克隆的片段的可能性。由于为了获得成功的结果而需要少量的试剂(宿主细胞,需要克隆的核酸,克隆载体等),因此重组频率的升高导致克隆文库,以及特定DNA片段的克隆效率的提高。当待克隆的所需序列仅以低频率存在于其所克隆出来的核酸混合物中时,该优势最为明显,例如,当所述第一核酸为基因组DNA或基因组DNA片段时。例如,在所述第一核酸分子的长度为50kb的实施方案中,与原核基因组中的DNA的百分比相比,在真核基因组中50kbp的片段包含的DNA的百分比要低得多-在原核基因组中50kbp的靶片段与其它DNA序列的比例为至少1:100,而在哺乳动物基因组中为1:50000。因此本发明中的该实施方案在从真核基因组中克隆片段是非常有用的,这是由于与从原核基因组中克隆片段相比,他们具有明显更大的尺寸以及非常低的克隆效率(每单位的试剂)。
[0116] 根据本发明第三方面的同源重组的方法在宿主细胞中进行。宿主的选择与本发明第一方面或本发明第二方面的方法的考虑相似,但是在本发明第三方面的方法中,细胞还进一步包括稀有切割序列特异性DNA切割酶。因此本发明的第三方面提供了根据本发明的第一方面或本发明的第二方面的宿主细胞,但是其中该细胞进一步包括稀有切割序列特异性DNA切割酶。本发明第三方面的宿主细胞的一个实例是包含在阿拉伯糖诱导型启动子Para-BAD启动子控制下的全长RecE、RecT、redγ和recA的大肠杆菌宿主细胞,其中该构建体替换了染色体中的ybcC基因,并且其中宿主细胞进一步包括稀有切割序列特异性DNA切割酶。例如,本发明第三方面的宿主细胞的一个实施例是进一步包括稀有切割序列特异性DNA切割酶的大肠杆菌菌株GB2005-dir。
[0117] 可以如此选择所述稀有切割序列特异性DNA切割酶以使其不能识别并剪切宿主细胞的染色体中存在的序列。本领域技术人员可根据本文的教导选择合适的稀有切割序列特异性DNA切割酶。由于需要确保当表达D NA切割酶时,只剪切质粒上的序列而不剪切宿主细胞的染色体(或多个染色体)(对宿主细胞是非常有害的并且可能通过在其内部剪切而破坏需要克隆的序列),因此稀有切割序列特异性DNA切割酶(即,识别序列大于10bp,例如大于12bp、大于14bp、大于16bp或大于18bp的酶)的使用非常重要。因此,优选的,所述稀有切割序列特异性DNA切割酶不能识别宿主细胞染色体中的序列。
[0118] 本发明第三方面中使用的稀有切割序列特异性DNA切割酶可以是归巢核酸内切酶、锌指核酸酶(ZFN)或转录激活样效应因子核酸酶(TAL EN)或任意其它合适的稀有切割序列特异性DNA切割酶。优选地,所述归巢核酸内切酶选自I-SceI、I-CeuI、I-CreI、I-ChuI、I-CsmI、I-DmoI、I- PanI、I-SceII、I-SceIII、1-SceIV、F-SceI、F-SceII、PI-AaeI、PI-ApeI、PI CeuI、PI-CirI、Pi-CtrI、PI-DraI、PI-MavI、PI-MfII、PI-MgoI、PI-jaI、PI -MkaI、PI-MIeI、PI-MtuI、PI-MtuHI、PI-PabIII、PI-PfuI、Pi-PhoI、PI-Pk oI、PI-PspI、PI-RmaI、PI-SceI、PI-SspI、PI-TfuI、PI-TfuII、PI-TIiI、PI- TIiII.PI-TspI、PI-TspII、PI-BspI、PI-MchI、PI-MfaI、PI-MgaI、PI-MgaII、 PI-MinI、PI-MmaI、Pi-MshI、PI-MsmII、PI-MthI、PI-TagI、PI-ThyII、I- NcrI、I-NcrII、I-PanII、I-TevI、I-PpoI、I-DirI、I-HmuI、I-HmuII、I-TevI I、I-TevIII、F-SceI、F-SceII(HO)、F-SuvI、F-TevI和F-TevII。
[0119] 在优选的实施方案中,本发明第三方面的方法可由任意合适的5'到3' 核酸外切酶和退火蛋白介导。在本发明第三方面的方法的一些实施方案中,由RecE和噬菌体退火蛋白介导同源重组。所述噬菌体退火蛋白优选RecT。在一些实施方案中,RecE是已有同源重组方法中使用的截短型的R ecE。例如,在一些实施方案中,本发明第三方面的方法中使用的所述Re cE包括RecE的5'到3'核酸外切酶活性但是不包含SEQ ID NO:1的第1- 587位氨基酸的任意的N-末端序列。例如,在一些实施方案中,本发明第三方面的方法中使用的所述RecE选自由SEQ ID NO:1的第588-866、59 5-866、597-866、602-866或606-866位氨基酸组成的RecE。
[0120] 在一些实施方案中,本发明第三方面的方法中实施的同源重组方法是本发明第一方面或本发明第二方面中描述的同源重组方法。所有在本发明的第一方面或本发明的第二方面中描述的实施方案都可以用于本发明的第三方面。因此,在一些实施方案中,本发明第三方面的方法中使用的所述RecE是本发明第一方面或本发明第二方面的方法中使用的RecE。特别优选使用包含或由SEQ ID NO:1的第564-886位组成的RecE。在一些实施方案中,使用全长RecE。
[0121] 在本发明第三方面的方法的一个实施方案中,所述方法包括在全长R ecE、RecT、Redγ、RecA以及与经历同源重组的核酸分子没有序列同源性的至少一个单链寡核苷酸的存在下实施同源重组,然后采用稀有切割序列特异性DNA切割酶在体内生成线性核酸分子。在该实施方案中,优选在鼠李糖诱导型启动子的控制下表达RecE。也提供了实施该方法的宿主细胞。
[0122] 所述稀有切割序列特异性DNA切割酶通常在可诱导型启动子的控制下表达(如上所讨论的用于表达核酸外切酶和/或退火蛋白)。在一些实施方案中,用于表达稀有切割序列特异性DNA切割酶的启动子与用于表达核酸外切酶和/或退火蛋白的启动子相同。例如,如果RecE在Para-BAD 启动子的控制下表达,则DNA切割酶也在Para-BAD启动子的控制下表达。在一些实施方案中,用于表达稀有切割序列特异性DNA切割酶的启动子与用于表达核酸外切酶和/或退火蛋白的启动子不同。例如,如果RecE在 Para-BAD启动子的控制下表达,则稀有切割序列特异性DNA切割酶可在 Plac启动子的控制下表达,或者如果RecE在鼠李糖诱导型启动子的控制下表达,则DNA稀有切割序列特异性DNA切割酶可在Para-BAD启动子的控制下表达。
[0123] 所述稀有切割序列特异性DNA切割酶可由导入宿主细胞中的附加体表达,其中在所述宿主细胞中发生体内LLHR。如果稀有切割序列特异性DNA切割酶由载体表达,则应当如此选择载体上的起始区和任意选择标志物,以使其能与细胞中存在的其它载体相容,例如待线性化的克隆载体,如果存在的话。本领域技术人员可以使用他们的公知常识以及本文的教导选择合适的起始区和选择标志物。例如,在一些实施方案中,所述稀有切割序列特异性DNA切割酶由基于R6K起始区的质粒表达,所述质粒与基于BAC、p15A或pBR322起始区的质粒相容。在供选择的方式中,所述稀有切割序列特异性DNA切割酶可由宿主细胞的染色体表达。
[0124] 在一些实施方案中,所述线性化的克隆载体是多拷贝的质粒、BAC、 YAC或宿主的染色体。
[0125] 提供用于实施根据本发明的第三方面的同源重组方法的试剂盒。用于实施本发明第三方面的方法的试剂盒包括至少一个编码如上所述的稀有切割序列特异性DNA切割酶的核酸。优选的,所述试剂盒还包括一个或多个编码RecE、RecT以及任选的Redγ的核酸分子。在一些实施方案中,所述试剂盒还包括一个或多个编码Redα和Redβ的核酸分子。在一些实施方案中,所述核酸分子为适于转化入宿主细胞的表达载体的形式。在其他实施方案中,所述试剂盒包括包含这些核酸分子的宿主细胞。在一些实施方案中,所述试剂盒包括表达RecE、RecT以及任选的Redγ和/或表达Re dα和Redβ,以及稀有切割序列特异性DNA切割酶的宿主细胞。在一些实施方案中,所述试剂盒是还包括编码如上所述的稀有切割序列特异性DN A切割酶的至少一个核酸的 PCR克隆试剂盒(http://www.gens 
cript.com/cloneez_PCR_Cloning_kit.html)或Cold Fusion克隆试剂盒(htt p://www.systembio.com/cold-fusion-cloning/)。在一些实施方案中,实施同源重组方法的试剂盒是如上所述的用于本发明第一方面或第二方面的方法的试剂盒,并且还包括所述的编码稀有切割序列特异性DNA切割酶的至少一个核酸。
[0126] 缩写
[0127] LLHR-线性到线性同源重组
[0128] LCHR-线性到环状同源重组
[0129] 构建体中的gba=Redγ、-Redβ、-Redα操纵子
[0130] 构建体中的gbaA=Redγ-Redβ-Redα操纵子和来自大肠杆菌K12的 recA
[0131] Red-gba=Redγ,Redβ和Redα
[0132] 构建体中的ETg=RecE-RecT操纵子和Redγ(全长RecE)
[0133] 构建体中的ETgA=RecE-RecT操纵子和Redγ和RecA
[0134] nt-核苷酸
[0135] bp-基对
[0136] kbp-千碱基对
[0137] ng-纳克
[0138] 实例中提到的RecE是指全长RecE,除非同时提到RecE的氨基酸残基数目。
[0139] 附图的简要说明
[0140] 图1.Red和RecET的体内生物活性差别。(A)线性到环状同源重组 (LCHR)试验的示意图。(B)线性到线性同源重组(LLHR)试验的示意图。(C)通过Cm和Kan抗性菌落数比较不同蛋白介导的LCHR的效率。(D)通过Cm和Kan抗性菌落数比较不同蛋白介导的LLHR的效率。
[0141] 图2.截短型RecE在LCHR和LLHR中的效率。(A)在GB2005中表达全长和截短型的RecETg后的LCHR效率的比较。(B)与(A)相同,只是使用LLHR试验。(C)使用RecE抗体通过免疫印迹检测RecE的表达。(D)通过相同蛋白提取物的免疫印迹检测RecT。
[0142] 图3.为提高LLHR必须完整地表达全长RecE。(A)使用实施例1 中的LLHR试验来检测由具有RecT和Redγ的pSC101-BAD表达的包含氨基酸1至氨基酸601的C末端截短形式的RecE的表达的诱导对LLHR 效率的影响。(B)在HS996-BAD-E602E中表达pSC101-BAD E(1-601) Tg(右栏)与Redγ表达载体pSC101-BAD-gam-tet的表达(左栏)的LL HR的比较。(C)在大肠杆菌菌株GB2005中在没有RecT表达的情况下使用质粒pSC101-BAD-Eg-tet表达全长RecE和Redγ,但是没有RecT(Eg) 的LLHR的效率与仅由pSC101-BAD-gam-tet(gam)表达Redγ的LLHR 效率的比较。
[0143] 图4.重组需要的最短同源序列。(A)由pSC101-BAD-gba-tet表达的 Red-gba介导的LCHR。(B)由pSC101-BAD-ETg-tet表达的RecETg介导的LLHR。所使用的同源臂长度的差异显示于x-轴。
[0144] 图5.由于转化效率的提高,RecA的共表达提高LLHR的成功。(A) 在GB2005中分别由pSC101-BAD-ET-tet、pSC101-BAD-ETg-tet和pSC10 1-BAD-ETgA-tet表达的全长recE外加单独的RecT(ET),或外加Redγ(E Tg)或RecA(ETgA)介导的LLHR的重组效率。(B)在基因组中整合了 araC-Para-BAD-ETgA操纵子的大肠杆菌菌株GB2005-dir中与基因组中具有在组成型启动子控制下表达的recET操纵子的大肠杆菌菌株YZ2005中 LLHR的重组效率的比较。由重组体(在Cm和Kan选择平板上的菌落) 和存活菌落(没有任何抗生素的LB平板上的菌落)的比值来表示效率。 (C)由重组体(在Amp选择平板上的菌落)和存活菌落(没有任何抗生素的LB平板上的菌落)的比值检测的大肠杆菌菌株GB2005-dir和YZ20 05的转化效率。
[0145] 图6.(A,B)加入非同源的ssDNA提高了LLHR。(A)添加单链D NA寡核苷酸对背景LLHR的影响。(B)除外源蛋白由pSC101BAD通过阿拉伯糖诱导表达外,其它与(A)中实验相同(gba-Redγ、β、α;ETg–全长RecE、RecT和Redγ;E564Tg–由第564位氨基酸开始的RecE的C 末端,RecT和Redγ;E602Tg-由第602位氨基酸开始的RecE的C末端部分,RecT和Redγ)。
[0146] 图6.(C,D)使用不同诱导启动子表达噬菌体蛋白对LCHR和LLH R的评估。(C)由阿拉伯糖诱导型BAD启动子(Para-BAD)表达的Red -gba介导的LCHR的效率;鼠李糖诱导型Prha启动子(rhaS-Prha)和四环素诱导型tetO启动子(tetR-tetO)。(D)由相同启动子以及另外的温度诱导型pL启动子(c1578-pL)表达的RecET介导的LCHR的效率。全部启动子克隆至pSC101质粒中。
[0147] 图7.当一种底物是ssDNA寡核苷酸时对LLHR的评价。(A)LLHR 的寡核苷酸分析的示意图。(B)使用ssDNA寡核苷酸和BAC进行LCHR 分析的示意图。(C)LLHR分析评估的不同蛋白组合的表达。所述ssDNA 寡核苷酸是单链(前导链),或它的互补链(后随链),或来自两个互补寡核苷酸的退火的双链DNA(对照)。通过氯霉素抗性菌落计数评估重组。 (D)与(C)中实验相同,只是采用了(B)中的LCHR分析。
[0148] 图8.整合入大肠杆菌K12基因组的RecET操纵子可以通过插入表达全长RecE的BAD启动子激活。(A)在三个大肠杆菌菌株中在诱导或不诱导Redγ的情况下LLHR的效率。(B)在HS996中recE上游表达盒hy g-araC-Para-BAD的示意图。(C)在表达或不表达Redγ以及在阿拉伯糖诱导内源RecET表达之前或之后HS996-BAD-ET中LLHR的效率。
[0149] 图9.Red或RecET介导的三倍体重组。(A)三倍体重组实施例的示意图。(B)使用具有对称脱磷酸末端(OO)或不对称硫代磷酸酯化末端 (OS+SO)的线性产物由Red和RecET介导的三倍体重组的效率。
[0150] 图10.由Red或RecET介导的四倍体重组。(A)通过两个寡核苷酸将一个线性DNA分子整合入靶载体的四倍体重组的示意图。(B)将线性 DNA和寡核苷酸电转化到含有靶载体的GB2005中后,通过卡那霉素抗性菌落测量Red或RecET介导的四倍体重组的效率。
[0151] 图11.多个线性DNA重组。(A)采用多个线性DNA重组生成环状质粒的示意图。每个PCR产物与其相邻的产物具有序列相同的重叠区域,如虚线箭头所示。(B)在质粒内部阐述的4个PCR产物产生的pUBC-ne o质粒的详细图谱。
[0152] 图12.采用LLHR生成cDNA文库。(A)cDNA合成的示意图。i) 由5’末端的同源臂(HA;灰线)以及3’末端的一段T组成的3’寡核苷酸将退火至mRNA的多聚A尾并由基于MMLV的RT反转录酶引发第一链 cDNA合成,ii)在mRNA的5’末端,RT在新合成的cDNA第一链的3’末端继续添加非模板化的核苷酸,主要为脱胞嘧啶(dC)。iii),由5’端的同源臂(灰线所示)和3’端的一段G及3’磷酸组成的第二寡核苷酸 (称为“PlugOligo”)与退火至C区段并引发第二链的合成。最终的双链 cDNA具有与克隆载体进行重组的同源臂(HAs)。(B)采用线性和线性重组克隆cDNA的示意图。i)cDNA克隆载体的图解。ii)在限制性位点R 线性化克隆载体使HAs暴露。iii)将双链cDNA和线性化的克隆载体转化至表达RecETgA的GB2005-dir中以进行线性到线性重组。iv)最终的cD NA文库。
[0153] 图13.使用全长RecET介导的LLHR进行亚克隆。(A)使用LLHR 从BAC进行亚克隆的示意图。(B)总结了成功亚克隆的4个基因的表格。
[0154] 图14.优化直接克隆的方法。(A)用于降低分子内重组频率的两个质粒。(B)用于提高正确产物的确定的双重组“钓鱼”策略的示意图。
[0155] 图15.发光杆菌(Photorhabdus luminescens)DSM15139中确定的与次级代谢途径相关的基因簇。通过紧邻每个基因簇右侧的数目表示基因簇的大小。克隆的区域的大小通过最右边的数目表示。
[0156] 图16.LLHR和LCHR关于对DNA复制的依赖在机制上是不同的。(A)检测启动LCHR是否需要DNA复制的重组分析的示意图。(B)在菌株GB205-pir中,由Redγ、β、α(gba)介导的LCHR是高效的,而Re cETg介导的则效率较低。在GB2005(pir-)中,没有发生重组。(C)与在pir基因中线性化R6K质粒而建立的(A)中所示的等价的LLHR分析的示意图。(D)不论已存在的Pir蛋白存在与否,在GB2005和GB2005- pir中均发生LLHR。
[0157] 图17.具有不同末端的PCR产物对LCHR和LLHR的影响。由pS C101-BAD表达的RecETg或Red gba进行的LLHR(A;C)和LCHR(B; D)分析。所述PCR产物具有对称的或非对称的末端。由(O)表示5’羟基;5’磷酸(P),具有5’羟基的5’末端的两个连续的5’硫代磷酸酯键(S);具有5’磷酸的5’末端的两个连续的5’硫代磷酸酯键(pS);连接5’末端的 50个核苷酸的两个连续的5’硫代磷酸酯键(iS)。对于线性和线性重组,给出了两个线性DNA的状态,而对于线性和环状重组,只给出了单一线性DNA的状态。
[0158] 图18.I-SceI酶的表达构建体。pR6K-dir-BAD-ISceI的质粒图谱。该质粒具有在PBAD启动子下游的一个合成的I-SceI编码序列,所述启动子由阿拉伯糖调控。
[0159] 图19.直接克隆的受体载体和它在体内的剪切。(A)包含I-SceI剪切位点的克隆载体。p15A-amp SceI位点-km的质粒图谱。该质粒包含一个两侧含有两个I-SceI识别位点的卡那霉素抗性标记物。(B)在阿拉伯糖诱导存在或不存在时由I-SceI表达质粒和受体质粒共存的细胞制备的质粒D NA的琼脂糖凝胶电泳图像。泳道1-2是由未诱导细胞制备的DNA,泳道 3-4是由诱导1小时后的细胞制备的DNA。质粒DNA未经进一步消化而直接在琼脂糖凝胶上上样。
[0160] 图20.I-SceI体内切割以及同源重组克隆的途径。通过I-SceI在体内线性化所述克隆载体。所述线性化的载体随后通过cm PCR产物末端的同源臂在RecET的介导下与cm(氯霉素)PCR产物进行重组形成重组体。
[0161] 图21.体内的线性和线性重组。该图显示了在体内表达或不表达I-Sc eI的情况下的重组效率(每列表示4个独立的电穿孔)。I-SceI质粒不表达时,环状受体质粒在RecET介导下与cm PCR产物重组,以较低效率产生编码氯霉素抗性蛋白的重组质粒(758)。I-SceI质粒表达时,一些受体质粒被线性化并且以较高的效率在RecET介导下与cm PCR产物重组,产生比I-SceI不表达时高约10倍的氯霉素抗性菌落(6890)。实施例
[0162] 实施例1-RecET比Redβ和Redα更有效的介导LLHR
[0163] 对不同蛋白质介导LCHR和LLHR的能力进行分析。LCHR和LLHR 分别按照图1A和图1B所述进行。对于LCHR,Kan PCR产物(通过PC R扩增卡那霉素抗性基因)在携带氯霉素(Cm)抗性的p-15A-cm质粒的任意一端具有50bp同源臂。将质粒和PCR产物共同电穿孔至高效重组的大肠杆菌细胞中(这里指GB2005),成功的LCHR导致氯霉素(Cm)以及卡那霉素抗性质粒p15A-cm-kan的形成。相似的,在LLHR实验中,Kan P CR产物具有与线性的p15A-cm PCR产物同源的两个50bp的同源臂。此外,将两个PCR产物共同电穿孔至高效重组的大肠杆菌细胞中,成功的L LHR导致Cm和卡那霉素抗性的质粒p15A-cm-kan的形成。
[0164] 为了研究在LCHR和LLHR中RecET和Red系统的功能,在阿拉伯糖诱导型启动子的控制下将重组的基因克隆到基于温度敏感来源的质粒中,以生成一系列表达载体。GB2005菌株用于进行重组实验,所述GB2 005菌株是染色体中的RecET操纵子被去除的HS996的衍生物(16,17)衍生而来的。在研究中使用的大部分的E.coli菌株,包括GB2005,都是R ecBCD整合体。为了防止线性DNA分子被RecBCD降解,Red-γ蛋白在 GB2005中短暂表达以灭活大肠杆菌中的RecBCD(26)。200ng的每种D NA分子通过电穿孔而转化。
[0165] 通过阿拉伯糖诱导操纵子来由pSC101BAD表达蛋白,所述操纵子含有ba-Redβ、Redα;gba-Redγ、Redβ、Redα;ET-全长RecE、RecT;E Tg–全长RecE、RecT、Redγ。通过Cm和Kan抗性菌落的数目来测量成功的重组和转化。如图1C所示,通过λRed系统和Redα、β和γ的表达可以最有效的介导LCHR。相反地,如图1D所示,RecET系统比λRed系统更有效的介导LLHR,产生约多60倍的菌落。
[0166] 同样重要的是要注意由具有RecET的LLHR产生的菌落的数目比具有 Redβ和Redα的LCHR产生的菌落高一个数量级,在两个系统中,Re dγ的额外表达提高了效率。
[0167] 实施例2-有效的LLHR需要全长RecE和RecT
[0168] 众所周知,LCHR仅需要RecE的C-末端区域并且截短的RecE可以增加LCHR的效率(13,14)。这里分析了截短的RecE和全长的RecE介导LLHR的能力。LCHR(图2A)和LLHR(图2B)的实验与实施例1 中所描述的相同。
[0169] 所有蛋白质都是由pSC101BAD质粒在阿拉伯糖诱导后所表达的。R ecT、Redγ和不同的RecE构建体被表达。使用实施例1的分析方法并且计数卡那霉素抗性菌落。RecE构建体的数量代表截短的RecE起始的残基 (E=全长RecE,E141=从141位残基起始的截短的RecE,并且包括N-末端的蛋氨酸,等等)。全长RecE介导LLHR的能力要强于任何的截短的构建体(图2B)。这与LCHR的情况完全相反,其中全长RecE是效率最低的,截短RecE的构建体的效率随截短的增加而升高。
[0170] 图2C和2D展示了使用兔抗RecE602(图2C)和抗-recT的抗血清(图 2D)通过免疫印迹技术检测RecE和RecT。非诱导(-)和阿拉伯糖诱导(+) 的蛋白质提取物在SDS PAGE上进行电泳分析。所有的RecE形式都包括最后的264个氨基酸。全长RecE、RecE141(即,最初的140个氨基酸被删除,并以N-末端蛋氨酸代替)、RecE282、RecE423、RecE564和RecE6 02的分子量分别是96.4、80.8、65.6、50.1、34.6和30.4kDa。RecT的分子量是29.7kDa。可以看出RecE和RecT仅在L-阿拉伯糖诱导后表达。这些数据证实了L-阿拉伯糖诱导型BAD启动子是被严格调控的。另外,这些数据表明,全长RecE引起的LLHR效率的提高并不是由于表达的变化所引起的,也并不是由于截短的RecE引起的蛋白质或者RecT的不稳定性引起的。
[0171] 已经确定全长RecE比C-末端片段对LLHR更有效,研究了RecE的 N-末端片段是否具有活性或者同时表达的N-末端和C-末端片段是否具有活性。在GB2005中,使用实施例1的LLHR实验,由pSC101-BAD以及 RecT和Redγ表达包含第1到第601位氨基酸的RecE的C-末端的截短形式。实验几乎没有观察到重组体,蛋白质的诱导和非诱导的表达并没有显著的差别(图3A)。重组体是由背景重组产生的。因此,单独的N-末端R ecE(从aa1-aa601)并不具有LLHR活性。为了研究RecE的N-末端和C- 末端片段是否可以相互互补,将BAD启动子插入HS996染色体的recET 操纵子的recE602的前面,以便激活从第602位氨基酸起始的RecE的C- 末端和来自染色体的RecT的表达(24)。这个菌株是HS996-recE602T。如图3(A)所示相同的表达质粒pSC101-BAD E(1-601)Tg用于HS996-B AD-E602T菌株中。将LLHR与使用Redγ表达载体pSC101-BAD-gam-tet 的水平进行比较。RecE 1-601并没有显示出显著的效果。
[0172] 诱导后该菌株表达RecT和C-末端RecE。除此之外,从质粒pSC101 中表达了Red Gam(图3B左栏)或者RecE(aa1-601)Tg(图3B,右栏)。这些数据表明,N-末端RecE和C-末端RecE的互补表达并不能介导LL HR(图3B)。RecE必须要表达为一个多肽。
[0173] 最后,图3C比较了在没有RecT的条件下,在大肠杆菌菌株GB2005 中由全长RecE和Redγ表达(左栏,pSC101-BAD-Eg-tet)介导的LLHR 和单独由Redγ表达(右栏,pSC101-BAD-Eg-tet)介导的LLHR。这些数据表明,一些LLHR的发生可能是由于一些内源性的RecT样的活性存在。然而,没有RecT的表达,全长RecE不能介导高效的LLHR。
[0174] 实施例3-同源长度对LLHR效率的影响
[0175] 为了研究同源臂的长度对LCHR和LLHR效率的影响,利用一系列在两端具有不同长度的同源臂的线性分子按照实施例1的描述进行实验。增加同源臂的长度即可以增加Red重组酶介导的LCHR(由pSC101-BAD-gba -tet表达的Red-gba,图4A)和RecET介导的LLHR(由pSC101-BAD-ETg -tet表达的RecETg,图4B)的效率。在LLHR和LCHR之间,同源臂的最小长度是有差异的。RecET介导的LLHR在两个分子间仅需要20bp的同源臂。λRed介导的LCHR至少需要30bp的同源臂以结合两个分子。然而,这些最小的需求都是相似的,LCHR和LLHR都显示出效率和同源臂长度之间的线性关系。
[0176] 实施例4-在recA缺失的大肠杆菌菌株中瞬时表达RecA可以提高LL HR
[0177] 先前已有研究报道,JC8679(recBC sbcA)(参见参考文献5和13) 在进行LLHR时比JC9604(recA recBC sbcA)(参见参考文献5和13) 更有效率,在recA缺失的宿主中瞬时表达RecA对于Red/ET重组或者L CHR没有影响(13,15,22),但是通过增加转化效率可以提高LCHR(2 7)。为了检测瞬时表达RecA对LLHR的影响,使用实施例1中的LLHR 实验,比较表达RecE和RecT(ET)的LLHR效率和表达RecE、RecT(E T)和Redγ(ETg)的LLHR效率和表达RecE、RecT(ET)、Redγ(ETg)、 Redγ和RecA(ETgA)的LLHR效率(图5A)。分别使用pSC101-BAD-E T-tet、pSC101-BAD-ETg-tet和pSC101-BAD-ETgA-tet表达蛋白。RecA表达提高LLHR的效率并且导致菌落数增加3倍。
[0178] YZ2005构成性地表达RecA、RecE和RecT。我们已经观察到,过表达RecET可以减少转化效率并且会导致大肠杆菌细胞生长缓慢和死亡。另外,构成性地表达重组酶会导致具有重复序列的DNA分子重排。为了生成一个LLHR的合适的宿主,在BAD启动子下的ETgA整合到GB2005 的染色体上以取代ybcC,所述ETgA编码一种公认的与Redα相似的核酸外切酶。新的宿主GB2005-dir在经过阿拉伯糖诱导表达ETgA后很适合进行LLHR。当检测LLHR时,GB2005-dir显示出比YZ2005更高的LLHR 效率(图5B)。由于GB2005-dir和YZ2005在电击后生长率和存活率都不相同,因此通过电穿孔后再恢复一个小时后重组体与活细胞的比率来确定图5B中LLHR的效率。两个宿主的转化效率通过转化5ng的pUC19质粒来测定。如图5B,转化效率通过转化株与存活细胞的比值确定。这些数据表明GB2005-dir在诱导后比YZ2005的转化效率更高(图5C)。这个实验表明RecA提高转化效率而不是重组效率。
[0179] 实施例5-非同源的单链DNA(ssDNA)寡核苷酸增强LLHR
[0180] 很惊奇的检测到非同源单链DNA寡核苷酸提高LLHR的效率。在不表达其它重组酶而依赖在GB2005中的低效率重组背景水平(图6A),以及在表达Red和RecET系统(图6B)的情况下均证实了这一点。
[0181] 如图3A左栏和图6A左栏所示,在野生型的大肠杆菌K12菌株中发生的LLHR的效率较低(1-3)。实施例1中阐述的LLHR实验用于评价增加单链DNA寡核苷酸的影响(与任何线性DNA底物没有序列同源性的1 00pmol 40nt的寡核苷酸;有寡核苷酸)。结果与不添加任何ssDNA的寡核苷酸(无寡核苷酸)相比。未表达其它重组酶,并且此处观察到的在G B2005中非常低效率的重组水平是由未知的内源性机理介导的(图6A)。共同转化非同源的DNA寡核苷酸片段与两个线性分子可以使没有RecET 和Red表达的GB2005中的LLHR效率提高10倍(图6A)。使用的40nt 的ssDNA(40聚体寡核苷酸)与进行LLRH的两个线性分子或者宿主的染色体DNA没有同源性。
[0182] 在重组酶存在的条件下,非同源的ssDNA也可以提高LLHR。Red系统(Redα、Redβ和Redγ,gba)和RecET系统(RecE(全长,E;或者截短的,E564,E602)RecT和Redγ,ETg)在GB2005中表达。将非同源的寡核苷酸与进行LLHR的两个线性分子共同电穿孔可以比E564Tg 的效率提高至少45倍,比ETg的效率提高约5倍(图6B)。当使用Red 系统或者RecE E602时,LLHR的效率是很低的,但是,当使用非同源的 ssDNA时,可以发现效率提高(图6B)。已经确定长度为40个核苷酸的非同源的寡核苷酸在每次电穿孔100pmol的浓度下使用可以获得最好的结果。
[0183] 实施例6-用于重组酶表达的诱导型启动子的比较
[0184] 四个诱导型启动子(Para-BAD启动子-阿拉伯糖诱导型,rhaS-Prha启动子-鼠李糖诱导型,tetR-tetO启动子-四环素诱导型,和cl578-pL启动子- 温度诱导型)通常被用于大肠杆菌中。这些不同的诱导型启动子被用于驱动Red和RecET系统的表达,以评价这些启动子驱动的重组效率。所有的启动子被克隆到pSC101质粒上。用于LCHR和LLHR的这个模型与实施例1中描述的相同。
[0185] 如图6C所示,BAD启动子驱动的gba最适于LCHR(图6C)。对于 LLHR,阿拉伯糖和鼠李糖诱导型启动子是最适合的(图6D)。tetR-tetO 四环素诱导型启动子对于LCHR和LLHR是效率最低的(图6C和图6D)。这也许是由于tetR-tetO启动子在大肠杆菌中是较弱的启动子,或者是因为诱导物四环素对于大肠杆菌是有毒的。
[0186] 实施例7-寡核苷酸(或者ssDNA)到线性的同源重组(OLHR)
[0187] Red/ET重组技术有3个主要的应用:a)将DNA序列插入或者整合到环形靶标中(13,15);b)从环形靶标亚克隆DNA序列或者从线性靶标克隆DNA序列(7);和c)寡核苷酸修复(22,23)。图1-6的数据表明,在LLHR和LCHR中,RecET系统和Red系统的性能具有显著差异。
所述的差异也可以用于寡核苷酸修复。寡核苷酸修复分为两个步骤:将寡核苷酸重组入线性化的载体中使载体重新环化(OLHR,图7A)以及将寡核苷酸重组整合入环状载体中(图
7B)。合成的寡核苷酸可以是亲代双链DN A的上链(upper strand)或者下链(lower strand)。在此我们根据在靶分子中复制的方向将所述寡核苷酸分为前导链或后随链。在图
7C所示的实验中使用来自两个互补寡核苷酸的退火的双链DNA作为对照。
[0188] 在第一个试验中(图7A和C,线性和寡核苷酸),使用BamH1将质粒线性化,并且具有与所述线性化质粒同源的同源臂的寡核苷酸用于重新环化质粒并且引入EcoR1位点。使用BamH I线性化所述p15A-cm质粒并且与所述ssDNA寡核苷酸共电穿孔至GB2005中。所述寡核苷酸长度为 106nt并且包括与p15A-cm的BamH1位点以及在正中的EcoRI位点(6nt) 的每侧相同的两个50nt的序列区域(同源臂)。重组后,新p15A-cm质粒具有取代BamH I位点的EcoR I位点。如图7C所示,所述RecT系统介导该重组是最高效的。瞬时表达RecA同样可以提高效率。
[0189] 在第二个试验中(如7B和D,环状和寡核苷酸),使用了BAC,所述BAC是一个包括移码引起的突变的卡那霉素抗性基因(neo*)的环状附加体BAC-MIT1-neo*。所述长100nt的寡核苷酸可以修正该突变并且重新获得卡那霉素抗性。成功的掺入该寡核苷酸可以重新获得卡那霉素抗性。如图7D所示,所述Red系统可以最有效的介导该重组。瞬时表达Re cA同样可以提高效率。在两个系统中,使用后随链比使用前导链更能提高效率(图7C和D)。这些结果巩固了从实施例1、2和5的试验中得出的结论,并且将其扩展到包括当线性底物是ssDNA而不是dsDNA的情况。
[0190] 实施例8-大肠杆菌K12菌株中存在RecET操纵子但是只有在具有sb cA背景的菌株中才能表达
[0191] 所述大肠杆菌K12基因组含有整合的、失活的具有RecET操纵子的r ac原噬菌体的部分拷贝(28,29)。RecT由该操纵子表达但是大肠杆菌K 12不表达RecE。该实验证实大肠杆菌K12不表达RecE并且表明通过激活整合入大肠杆菌基因组的RecE来介导LLHR是可行的。
[0192] 使用了源于大肠杆菌K12的三个菌株,GB2005、HS996和DH10B。 GB2005通过删除HS996基因组中的recET操纵子而获得。除去RecET操纵子对残留的LLHR没有影响并且在GB2005和HS996之间没有差异(非诱导数据点)。由于LLHR可能被RecBCD阻断,因此我们也通过导入pS C101-BAD-gam-tet并使用阿拉伯糖诱导Redγ的表达来评价在RecBCD 抑制剂,Redγ存在下的LLHR(诱导)。此外,在RecET删除的菌株GB 2005和它的亲本菌株HS996之间具有非常小的差异。这证明整合入大肠杆菌基因组的RecE没有活性并且观察到的背景LLHR并不是由RecET通路介导的。
[0193] 为激活HS996中的RecET操纵子,将BAD阿拉伯糖诱导型启动子插入到HS996的recE基因上游作为表达盒(hyg-araC-Para-BAD,图8B)的一部分而产生HS996-BAD-ET。按照实施例1中分析方法检测到LLHR在阿拉伯糖诱导后增加,表明整合的RecE介导了RecET LLHR(图8C,左条)。Redγ的表达进一步提高了效率(图8D,右栏)。
[0194] 实施例9-三倍体重组-两个线性分子重组到一个环状载体中
[0195] Red/ET重组工程技术已广泛用于改造一系列的DNA分子。主要应用是将具有选择标志物(sm)基因的表达盒插入或整合到靶分子中。在许多情况下,表达盒并不具备选择标志物。最常用的生成具有sm的表达盒的方法是使用Red/ET重组工程将非-sm和sm构建体组合到一起以形成一个大分子或使用叠加PCR产生非-sm加sm的大分子。为了简化该流程,本文提供了一种称为三倍体重组的策略(图9A)。三倍体重组利用Red/ET 系统和全长RecE的有效性,使用存在于3个分子中的短同源序列而在体内将三个分子组合在一起,例如一个环状靶标加上两个线性分子(非-sm 和sm)。在本实施例中,如图9A所描述的,两个线性DNA分子具有50b p的重叠区域并且每个都携带靶载体的同源臂。通常线性分子中的一个是选择标志物基因。重组工程后,两个线性分子将整合到靶载体中。
[0196] 在比较Red操纵子(Redγ、β、α;gba)和全长RecET介导三倍体重组的能力的该实验中,卡那霉素抗性基因通过PCR扩增分为两部分,所述两部分在中间有50bp的相同序列重叠。在每个PCR产物的另一端引入 50bp的与质粒同源的同源臂。将这两个PCR产物电穿孔到已经含有靶质粒Para-BAD24和pSC101–BAD质粒的GB2005中,其中Red gba或Rec ET由该质粒表达。所述PCR产物具有对称的脱磷酸化末端(OO)或非对称的硫代磷酸酯化末端(OS或SO)以便于受保护的链可以退火。
[0197] 图9B的数据表明,使用具有硫代磷酸酯化的PCR产物的三倍体重组效率要远高于使用没有硫代磷酸酯化的PCR产物。由全长RecE、RecT和 Redγ(ETg)介导的三倍体重组与由Redα、Redβ和Redγ组成的Red系统介导的三倍体重组效率相当。值得注意的是,它表明在需要一定量的LC HR的应用中,全长的RecE是有用的。最佳的,协同应用Red和RecET 系统可以获得更好的结果。
[0198] 实施例10-四倍体重组-两个寡核苷酸和一个大片段重组入环状载体中
[0199] PCR不能处理大的表达盒并且能引入突变,由于PCR的限制,大表达盒的整合是有问题的。在此提供的方法使用双同源重组策略首先生成两侧具有同源区域的表达盒,然后重组到靶载体中(31)。
[0200] 为了节省重组工程中的一个步骤,通过使用两个寡核苷酸桥接所述的大线性分子和所述靶载体而开发了四倍体重组(图10A)。所述寡核苷酸包括与所述线性分子同源的区域和与靶载体同源的区域。合成的100nt寡核苷酸在所述线性分子的每个末端以及所述载体中的靶区域中包含同源臂。因此除了没有基于PCR的突变发生的问题外,线性分子不需要进行P CR扩增并且可以较长(此处的8kb IRES-lacZ-neo-PGK-BSD盒)。
[0201] 携带功能性表达盒的大线性分子可以从已有的质粒中释放出来,理想地如基于不能在常规大肠杆菌菌株中复制的质粒的R6K起始区。在将这三个分子共转化至包含靶载体并且具有Red/ET的细胞(GB2005)后,所述大线性分子将通过所述寡核苷酸桥重组入所述载体中(图10A)。在此,使用该技术将一个约8kb的用于小鼠基因组工程的基因捕获表达盒用于插入到小鼠基因组克隆中。在四倍体重组中,全长RecE(RecETg)比Red- gba更有效(图10B)。
[0202] 实施例11-多元重组-两个或多个线性分子重组入线性载体中
[0203] 通过RecET系统和全长RecE介导的同源重组(LLHR)可以高效的将线性分子和线性载体重组。所述RecET系统也可以用于多个线性分子与线性载体的重组,例如,用于生成多融合基因或操纵子(由单个核糖体结合位点分隔的多个基因)。图11A是该策略的一个图解,图11B是生成哺乳动物表达构建体的典型试验。每个PCR产物与其邻近的分子具有如虚线箭头所示的相互重叠的序列同一性区域。最后的重组产物应当包含质粒的起始区和可选择的基因。由PCR产生一个线性载体(R6K-cm,1680bp) 和三个大小不同的功能表达盒(1358bp、961bp和602bp)并在阿拉伯糖诱导RecET后共转化入GB2005-pir+pSC101-BAD-ETgA中。所述的4个线性分子通过在每个分子末端的短同源臂并在RecTE介导下在体内重组。由3次电穿孔选择卡那霉素平板上的34个菌落。32个菌落通过限制性分析证实。
[0204] 实施例12-使用RecET系统构建cDNA文库
[0205] 通常cDNA文库的构建依赖于将双链DNA与线性载体连接。在Rec ET系统下,LLHR具有每个电穿孔3x106个菌落的绝对效率(图6B)。基于该如此高的效率,提供了使用LLHR构建cDNA文库的策略(图12A 和12B)。如图12A中所示,i)由5’末端的同源臂(HA;灰线所示)以及 3’末端的一段T组成的3’寡核苷酸将退火至mRNA的多聚A尾并由基于 MMLV的RT反转录酶引发第一链cDNA的合成;ii)在mRNA的5’末端, RT在新合成的第一链cDNA的3’末端继续添加非模板的核苷酸,主要为脱氧胞嘧啶(dC);iii)由5’端的同源臂(灰线所示)和3’端的一段G及其3’磷酸组成的第二个寡核苷酸(称为“PlugOligo”)退火至所述的C区段并引发第二链的合成。最终的双链cDNA具有用于与克隆载体进行重组的同源臂(HAs)。最终产品是用于cDNA文库构建的cDNA池。如果在步骤iv中使用特异性引物,该过程可以很容易用来生成基因特异性的cD NA。
[0206] 切割所述包含ccdB基因的靶载体以释放出线性载体并且使两端的同源序列暴露出来。CcdB是一个反向选择基因并且用于降低来自未酶切的或者重新连接的载体的背景。此处所述载体可以是一系列的表达载体或者简单的克隆载体。所述的双链cDNA和线性化的克隆载体转化到表达Rec ETgA的GB2005-dir中用于线性到线性重组。所需克隆的筛选可以采用常规的技术或者通过使用随后在实施例14和14中描述的Red/ET重组技术进行。形成cDNA池后,在不需要构建文库的情况下即可使用如图12B中所示的线性载体将特定的cDNA克隆钓出来,但是需要与所述特定cDNA 同源的特定同源序列。采用LLHR成功的克隆了大于
5kb的cDNA克隆。而从常规的cDNA文库中并不能完成该克隆。
[0207] 实施例13-克隆线性片段中的靶序列
[0208] 本实施例提供了一种不需要依赖限制性酶切位点的克隆靶序列的方法。在一些不必需靠近靶区域的许多限制性酶切位点切割(例如)BAC或基因组cDNA池。所述靶区域仍然保持完整。使用具有与需要亚克隆的区域同源的同源臂的线性载体。BAC DNA和载体共电穿孔到表达全长Rec E并且能够进行LLHR的大肠杆菌菌株中。这导致重组并生成了包含感兴趣DNA的环状载体,例如,线性载体中的选择标志物。
[0209] 采用如上的策略,在该示例性的实验中由不同BACs克隆了许多靶序列。如图13A所示,采用限制性内切酶切割携带亚克隆区域(黑色部分) 的BAC以使用于亚克隆的区域仍然保持完整。使用合成的寡核苷酸PCR 扩增包含p15A起始区和抗生素抗性基因(氨苄青霉素)的载体,其中所述合成的寡核苷酸包含与需要亚克隆区域的两端序列相同的两个区域。将 BAC DNA和PCR产物共同电穿孔至(此处由pSC101-BAD ETg)表达全长RecE、RecT和Redγ的大肠杆菌菌株(此处为GB2005)中,然后通过氨苄青霉素耐药性进行选择。
[0210] 图13B概述了所述试验的结果。采用LLHR亚克隆了4个哺乳动物基因(小鼠Swap70、Tmem56、Xist和人MeCP2)。根据最近的限制性酶切位点到BAC中同源臂的距离,指定了用于切割携带这些基因的BACs的限制性内切酶。例如,对于Swap70,使用BstZ171切割BAC DNA并且待亚克隆的区域在5’端距离最近的BstZ171位点2778bps,在3’端距离25 54bps。每个插入进行两次独立的试验。例如,对于Swap70,两次试验的平板中分别生长了53和95个氨苄青霉素抗性菌落,其中18个通过限制性酶切图谱检测并发现12个是正确的。限制性内切分析证实了除了Tme m56克隆,大部分的克隆是正确的。这可能是由于它在两端具有较长的异源序列。发现所有不正确的产物都是没有任何插入序列的再环化的载体。因此,分子内重组是主要的竞争反应以及背景的主要来源。
[0211] 实施例14-从基因组DNA池中直接克隆基因或基因簇
[0212] 小的基因组片段可以很容易的采用PCR克隆。但是从基因组DNA中克隆大片段(超过15kb)是具有高度挑战性并且耗时的。需要许多不同的步骤,包括:制备基因组DNA,酶切,连接到载体中,转化到宿主细胞中,选择单克隆,文库筛选以及亚克隆。为了简化步骤并且提高克隆效率,在此提供了如图14B所示的基于LLHR的直接克隆策略。如实施例13B 中所示,LLHR中的不正确产物是再环化的载体,约80%的再环化载体是通过短重复序列(小于5bp)重组或线性载体外部序列的50个核苷酸内的非同源末端连接形成的。
[0213] 为解决这个问题,生成了两个直接克隆载体(图14A)。一个是基于自杀毒性基因ccdB。15A-amp-ccdB质粒在gyrA246宿主中复制并且用作 PCR产物的模板。ccdB对普通大肠杆菌菌株是致死的但是在携带gyrA24 6突变或者表达其伴侣ccdA的菌株中是允许的。如果两个末端重新连接, ccdB由amp启动子驱动并且在具有野生型旋转酶的GB2005-dir中细胞不能存活。当一个由基因组DNA克隆的基因或基因簇重组到ccdB上游时,将没有启动子驱动ccdB的表达,正确的克隆在GB2005-dir中能够存活。该载体将降低80%的自环化质粒背景。但是,可能存在来自克隆序列的隐含的启动子活性激活ccdB并且杀死成功的克隆的险。
一种供选择的解决上述问题的方法是使用双选择的载体(p15A-amp-BSD)(图14A中下部所示)。该载体在载体的最末端具有两个抗生素抗性基因。大部分的分子内重组事件将删除这两个基因中的一个的部分从而导致对相应抗生素敏感的分子内背景。因此自环化背景将会降低。
[0214] 图14B中提供了另外一种正确产物的确定策略。该策略使用LLHR和 LCHR。该策略对于在重组效率较低的情况下直接克隆大片段(超过40kb) 尤其有用。酶切或剪切所述DNA(此处称作基因组DNA)并且与具有选择标志物和与所靶向的区域同源的同源臂的线性载体(例如,图14A中的载体之一)共电穿孔至包含全长RecE和RecT的LLHR感受态宿主细胞中。选择例如氨苄青霉素或者氨苄青霉素和杀稻瘟菌素抗性后,所述抗性菌落作为基因池并且使用编码选择基因的线性DNA分子电穿孔,其中所述线性DNA分子两侧具有与打算克隆的区域的部分相对应的同源臂。正确的菌落在采用最后的选择基因筛选后能够生长。
[0215] 为了促进该策略,即实质上是在LLHR步骤后进行LCHR的步骤,开发了一种组合的宿主细胞。该宿主GB2005-red中具有整合到染色体中的B AD-Red gbaRecA操纵子以便于阿拉伯糖诱导Red gabA的表达。也引入了质粒pSC101-Rha-ETgA-tet,其中RecE、RecT、Red-g和RecA可在鼠李糖诱导后表达。因此所描述的第一LLHR步骤在鼠李糖诱导后进行并且第二LCHR步骤在阿拉伯糖诱导后进行。该宿主细胞的建立也可以用于如实施例9和10中所阐述的三倍体和四倍体重组试验以提高效率。
[0216] 能够通过表达RecET和Red系统进行LLHR和LCHR的该宿主在克隆细菌基因组大片段中尤其有用,例如用于产生次级代谢产物的操纵子。
[0217] 已经证实采用该策略从发光杆菌DSM15139中直接克隆了大片段基因簇。该菌种是昆虫病原线虫嗜菌异小杆线虫(Heterorhabditis bacterioph ora)共生的一种昆虫寄生菌,用于昆虫的生物控制。发光杆菌DSM1513 9的基因组已经被测序并且约为5.7mb。染色体上存在多于30个蛋白毒素基因,包括10个沉默或者未知的PKS/NRPS基因簇。该次级代谢产物基因簇是ET重组和全长RecE介导的直接克隆的合适靶点。图15A和15B 提供了10个在发光杆菌DSM15139中确定的基因簇。基因簇的大小由紧邻每个基因簇右侧的数目表示。克隆区域的大小由最右侧的数目表示。
[0218] 采用ET重组,通过一轮ET重组成功的直接克隆了图15A和15B中所示的10个基因簇中的9个。寡核苷酸对用于生成携带同源臂的线性载体。使用不同的限制性内切酶线性化基因组DNA。在YZ2005中进行LL HR并且每个电穿孔中的12个菌落置于96孔深孔板中用于验证。
[0219] 采用该半高通量策略,有一个基因簇没有克隆成功。该基因簇是plu3 263并且是细菌基因组中发现的最大的基因之一(图15B中的第一个基因簇)。它由15个非核糖体肽合成酶模组成。为了直接克隆该大片段区域,使用了如上以及图14A中所述的载体和策略。
[0220] 表1a显示了成功地利用上述的载体和策略从发光杆菌中直接克隆大片段原核DNA簇。当ATG存在或不存在时,所述靶标如第一行所示为5 2616bp或50485bp。第一行显示的是使用了如图14A中描述的哪一个线性载体。第二行显示了用于电穿孔的基因组DNA的量,第三行显示了电穿孔持续的时间。所述策略中LLHR步骤进行了8次(1-8栏)。对于8个初始制备物中的7个,所述策略中LCHR步骤进行了5次(A-E行)。15个克隆具有插入物,通过限制酶切分析证实其中12个是正确的。
[0221] 表1b显示了成功地利用上述的载体和策略直接克隆真核DNA,即小鼠基因hprt。采用图14A中描述的载体进行第一LLHR步骤,使用表的下半部分的ccdB载体以及表上半部分的BSD载体。对每个制备物,该方案中的LCHR步骤进行5次(A-E行)。在4个克隆中成功地生成了正确的插入物。
[0222] 表1A-plu3263的克隆
[0223]
[0224] 8线性和线性电穿孔+35个线性和环状电穿孔
[0225] 菌落:308
[0226] 具有插入的克隆:15/42
[0227] 正确克隆:12/42
[0228] 表1B-hprt的克隆
[0229]
[0230] 实施例15-LLHR不依赖于复制但是LCHR依赖于复制
[0231] 表达Red-gba或RecETg的大肠杆菌细胞的转化的线性分子将被核酸外切酶Red-α或RecE从5’端到3’端进行切割从而暴露3’端的单链末端。尽管在LCHR和LLHR中供体是线性分子,但是在LCHR中受体是环状可复制载体,在LLHR中是线性载体。两种情况之间存在根本的不同。在 LCHR中环状分子是完整的,而被Red-α或RecE加工的线性分子将侵入到同源序列暴露的复制成员(folk)中。在LLHR中,两种线性分子都将被Red-α或RecE加工并且在该反应后将暴露出单链同源序列。两种分子的在体内的退火都被RecET促进。这在LCHR和LLHR之间的差异使发明人推测LCHR依赖于复制而LLHR不依赖于复制。
[0232] 为证实该推测,使用R6K复制起始区设计了两个试验。需要pir基因的蛋白产物启动R6K的复制(pir的33ref)。R6K起始区和pir基因可以分开并且任意单独携带R6K起始区的质粒都可以在表达pir基因的菌株中增殖。通过将pir基因插入到GB2005的染色体中而生成GB2005-pir菌株。 GB2005中没有pir,因此不能复制具有R6K起始区的质粒。图16A是检测LCHR是否能够不依赖复制发生的试验的示意图。质粒pR6K-pir*-cm- hyg只含有pir基因的5’端部分。该质粒不能在pir-菌株GB2005中复制。 pir*-amp的PCR产物具有pir基因的3’端部分。pir基因的两个部分之间具有同源性以允许重组。通过PCR产物和质粒的重组,所产生的具有全部的 pir基因的质粒pR6K-pir-amp-hyg可以在pir-菌株GB2005和pir+菌株GB2 
005-pir中复制。如图16B所示,在pir-菌株GB2005中没有发生重组。但是,在发生了复制的pir+菌株GB2005-pir中发生了重组。这表明为使LC HR发生,质粒的复制是必须要发生的。
由于这是LCHR,表达gba的细胞介导的重组比RecETg更有效。
[0233] 如图16C中描述的等效的试验用于研究LLHR是否需要复制的发生。相同的线性分子pir*-amp用于LLHR,但是受体为使用pR6K-pir*-cm-hyg 作为模板通过PCR生成的线性载体R6K-hyg-pir*(图16C)。R6K-hyg-pir *-PCR只含有pir基因的5’端部分以及R6K复制起始区。pir*-amp的PCR 产物具有pir基因的3’端部分。两个PCR产物的LLHR可以产生在pir-菌株GB2005和pir+菌株GB2005-pir中都能复制的质粒pR6k-pir-amp-hyg(图 16C)。当使用LLHR时,在表达Red-gba和RecETg的GB2005和GB200 5-pir都能发生重组(图16D)。因此,LLHR不依赖于复制并且可以在没有pir和复制(在菌株GB2005中)的情况下发生。在ETg系统中使用全长RecE是效率最高的(图16D),表明全长的RecE是最适合介导该重组的。
[0234] 实施例16-重组受线性分子末端修饰的影响
[0235] 外切核酸酶Red-a和RecE作用于双链断裂的5’端。RecE从5’端到3’端降解一条链且不需要5’端的磷酸化,但是Red-a需要5’端的磷酸化进行所述的降解(34ref-Red-a和RecE)。没有5’端磷酸化的线性DNA分子(例如,使用没有修饰的寡核苷酸产生的PCR产物)需要首先在体内5’端磷酸化才能被Red-a处理。由于分子末端的修饰可以影响外切酶的活性,因此研究了线性分子的修饰对LLHR和LCHR的影响。在试验中使用了具有不同5’末端的5种寡核苷酸:没有修饰(O);磷酸化(P);硫代磷酸酯化 (S);5’末端没有修饰但是在第51位的同源末端的核苷酸上具有内部的硫代磷酸酯化(iS);以及5’端具有磷酸化同时在第51位核苷酸也具有内部的硫代磷酸酯化(pS)。在如实施例1中描述的模型实验中,使用这些寡核苷酸生成了具有对称末端或非对称末端的PCR产物,并且PCR产物中的同源序列为50bp。在线性双链PCR产物中,没有5’端修饰的链可以在体内直接被RecE切割或者经磷酸化后可以被Red-a切割;具有5’端磷酸化的链可以直接被Red-a和RecE切割;具有5’端硫代磷酸酯化的链不能被Red-a和RecE切割;5’端没有修饰但是在第51位核苷酸(51nt)具有内部硫代磷酸酯化的链在第50个碱基精确暴露于另一链的同源区后才能被RecE切割;具有5’端磷酸化并且在第51位核苷酸具有内部的硫代磷酸酯化的链在碱基50精确暴露于另一链的同源区后可以直接被Red-a和R ecE切割。在表达Red-gba(图17C和17D)或RecETg(图17A和17B) 的GB2005中检测使用这些PCR产物的LCHR(图17A和17C)和LLHR (图17B和17D)。
[0236] 在LCHR中,线性双链分子具有末端不同的两条链的25种可能的组合并且检测其中的9种。由于在LLHR中两个分子都是线性的,因此可以生成625种组合但是在此只检测其中的13种。在表达RecETg的LCHR 中(图17B),具有iSSi的PCR产物具有最高的效率但是其它修饰与没有修饰的OO产物之间只有一点差异。在表达RecETg的LLHR中(图17A),具有iSSi+iSSi的两个线性PCR产物的组合具有最好的效率。pSSp+pSSp 和OS+OS与OO+OO(没有修饰)具有相似的效率但是其他所有的组合都具有较低的效率。在LCHR和LLHR两者中,在51位核苷酸的硫代磷酸酯化具有最高的效率或者至少没有降低效率。这可以通过如下事实解释,如果所述线性分子通过内部的硫代磷酸酯化保护并且同源序列暴露于3’末端,这可以促进重组。所有在一个末端包含硫代磷酸酯化的组合(所述组合经recE切割后产生单链DNA)都具有较低的LLHR的效率(除了O S+OS)(图17A)。
[0237] 在表达Red-gba的LLHR中,PP+PP组合的效率最高(图17C)。包含5’末端的内部硫代磷酸酯化的组合(iSSi+iSSi和pSSp+pSSp)比没有修饰的组合(OO+OO)的效果更好(图17C)。所有其它的组合具有比OO+ OO组合更低或相似的效率(图17C)。在表达Red-gba的LCHR中,结果与LLHR相反(图17D)。具有pSSp的线性分子具有最低的效率。具有i SSi的线性分子比OO的效率要低(图17D)。其它组合具有与没有修饰的 OO组合相当或更低的效率(图17D)。
[0238] 实施例17-使用在体内线性化的载体可以提高重组频率
[0239] 在阿拉伯糖诱导型启动子的控制下将合成的I-SceI基因插入到载体中。该表达质粒是基于R6K起始区的质粒并且与基于BAC、p15A或pBR 322起始区的质粒相容(图18)。I-SceI的识别位点是30bp的序列:5'A GTTACGCTAGGGATAACAGGGTAATATAG 3'。
[0240] 用于直接克隆实验的受体质粒是图19A中所示的基于直接克隆受体p 15A起始区的质粒。在该质粒中,采用两个I-SceI识别位点置于卡那霉素抗性基因两侧。氨苄青霉素和杀稻瘟菌素抗性基因也存在于骨架上。
[0241] 当I-SceI表达质粒和受体质粒转化至GB2005-dir细胞中时,L-阿拉伯糖诱导I-SceI表达后产生两个线性片段(图19B)。第一线性片段代表两侧添加两个I-SceI识别位点的卡那霉素抗性基因。第二线性片段代表切除编码卡那霉素抗性基因的片段后保留的载体骨架。由于低于10%的受体质粒被线性化,所以I-SceI在体内的活性较低。但是,该实验显示I-SceI在体内确实线性化了受体质粒。
[0242] GB2005-dir是在Para-BAD启动子控制下在染色上携带了ETgA(rec E、recT、redγ和recA)操纵子的大肠杆菌菌株。该菌株转化了I-SceI归巢内切核酸酶表达载体和受体载体。当向GB2005-dir培养物中加入L-阿拉伯糖时,重组蛋白(ETgA)和I-SceI都进行表达。然后I-SceI在体内线性化受体质粒。诱导1小时后,制备电感受态细胞并采用标准技术转化c m(氯霉素抗性基因)PCR产物。cm PCR产物在与受体载体具有同源性的两端均包括氯霉素抗性基因和同源臂(即,在氯霉素抗性基因两侧)。转化后,所述cm PCR产物和所述线性化受体载体之间发生LLHR。图2 1显示了含有和不含I-SceI表达质粒的重组率(通过添加氯霉素的琼脂平板上的菌落数来测定)。数据表明在体内线性化受体载体后重组效率显著改善(~10倍)。
[0243] 该实验是通过在体内线性化受体载体来改善直接克隆的主要证明。
[0244] 本发明仅通过实施例进行了如上说明并且应当理解可以进行落入权利要求保护范围内的进一步的改变。将所有引用文献的全部内容引入本文作为参考。
[0245] 表2-质粒和菌株的清单
[0246]
[0247]
[0248] *YZ2000基因型:thr-1 leu-6thi-1 lacY1 galK2 ara-14 xyl-5mtl-1 proA2 his-4 argE3 str-31 tsx-33 supE44 recB21,recC22,sbcA23,rpsL31,tsx-33,supE44, his-328,mcrA,mcrBC,mrr,hsdMRS
[0249] **DH10B基因型:F-mcrAΔ(mmr-hsdRMS-mcrBC)φ80dlacZΔM15 ΔlacX74 endA1 recA1 deoRΔ(ara,leu)7697 araD139 galU galK nupG rpsLλ-
[0250] 表3-药物选择标记
[0251]
[0252] 参考文献:
[0253] 1.Bubeck,P.,Winkler,M.&Bautsch,W.Rapid cloning by homologous recombination in vivo.Nucleic Acids Res.21,3601-3602(1993).
[0254] 2.Oliner,J.D.,Kinzler,K.W.&Vogelstein,B.In vivo cloning of PCR products in E..coli. Nucleic Acids Res.21,5192-5197(1993).
[0255] 3.Degryse,E.In vivo intermolecular recombination in Escherichia coli:application to plasmid constructions.Gene 170,45-50(1996).
[0256] 4.Chartier,C.et al.Efficient generation of recombinant adenovirus vectors by homologous recombination in Escherichia coli.J.Virol.70,4805-4810(1996),
[0257] 5.Clark,A.J.et al.Genes  of the  RecE and RecF  pathways of conjugational  recombination  in  Escherichia  coli.Cold  Spring 
Harb.Symp.Quant.Biol.49,453-462(1984).
[0258] 6.Hall,S.D.,Kane,M.F.&Kolodner,R.D.ldentification  and characterization of the Escherichia coli RecT protein,a protein encoded by the recE region that promotes renaturation of homologous single-stranded DNA.J.Bacteriol.175,277-287(1993).
[0259] 7.Zhang,Y.,J.P.P.Muyrers,G.Testa,and A.F.Stewart.2000.DNA cloning by homologous recombination in Escherichia coli.Nat.Biotechnol.18:1314-1317.[0260] 8.Bhargava,J.et al.Direct cloning of genomic DNA by recombinogenic targeting method using a yeast-bacterial shuttle vector,pClasper.Genomics 62,285-288(1999).
[0261] 9.Bradshaw,M.S.,Bollekens,J.A.&Ruddle,F.H.A  new  vector for recombinationbased cloning of large DNA fragments from yeast artificial chromosomes.Nucleic Acids Res. 23,4850-4856(1995).
[0262] 10.Bhargava,J.et al.Direct cloning of genomic DNA by recombinogenic targeting method using a yeast-bacterial shuttle vector,pClasper.Genomics 62,285-288(1999).
[0263] 11.Shashikant,C.S.,Carr,J.L.,Bhargava,J.,Bentley,K.L.&Ruddle,F.H.Recombinogenic targeting:a new approach to genomic analysis-a review.Gene 223,9-20(1998).
[0264] 12.Larionov,V.Direct isolation of specific chromosomal regions and entire genes by TAR cloning.Gene t.Eng.21,37-55(1999).
[0265] 13.Zhang Y,Buchholz F,Muyrers JP and Stewart AF.A new logic for DNA engineering using recombination in Escherichia coli.Nature Genetics.20(2):123-8,1998.
[0266] 14.Muyrers JP,Zhang Y,Buchholz F,Stewart AF.RecE/RecT and Redα/Redβ initiate double stranded break repair by specifically interacting with their respective partners. Genes&Dev.14:1971-1982,2000.
[0267] 15.Yu,D.,Ellis,H.M.,Lee,E.C.,Jenkins,N.A.,Copeland,N.G.,and Court,D.L.(2000) An efficient recombination system for chromosome engineering in Escherichia coli. Proc.Natl.Acad.Sci.USA 97,5978-5983.
[0268] 16.Muyrers JP,Zhang Y,Testa G,Stewart AF.Rapid modification of bacterial artificial chromosomes by ET-recombination.Nucleic Acids Res.27(6):1555-1557,1999.
[0269] 17.Muyrers JP,Zhang Y,Benes V,Testa G,Ansorge W,Stewart AF.Point mutation of Bacterial Artificial Chromosome by ET recombination.EMBO reports.1:239-243,2000.
[0270] 18.Angrand PO,Daigle N,van der  Hoeven  F, HR,Stewart AF.Simplified  generation  of  targeting  constructs  using  ET 
recombination.Nucleic Acids Res.1999Sep 1;27(17):e16.
[0271] 19.K Narayanan,R Williamson,Y Zhang,AF Stewart&PA loannou.Efficient and precise engineering of a 200kb-globin human/bacterial artificial chromosome in E. coli DH10B using an inducible homologous recombiration system.Gene Threrapy. 6(3):442-447,1999.
[0272] 20.Murphy,K.C,Campellone,K.G.,and Poteete,A.R.(2000)PCR-mediated gene replacement in Escherichia coli.Gene 246,321-330.
[0273] 21.Datsenko,K.A.and Wanner,B.L.(2000)One-step inactivation of chromosomal  genes  in  Escherichia  coli  K-12using  PCR products.Proc.Natl.Acad.Sci. USA 97,6640-6645.
[0274] 22.Zhang Y,Muyrers JP,Rientjes J and Stewart AF.Phage annealing proteins promote oligonucleotide-directed mutagenesis in Escherichia coli and mouse ES cells.BMC Molecular Biology.4(1):1-14,2003.
[0275] 23.Ellis,H.M.,Yu,D.,DiTizio,T.,and Court,D.L.(2001)High efficiency mutagenesis, repair,and engineering of chromosomal DNA using single-strsnded oligonucleotides. Proc.Natl.Acad.Sci.USA 98,6742-6746.
[0276] 24.see 16and 17.
[0277] 25.Fu J,Wenzel SC,Perlovao,Wang J,Gross F,Tang Z,Yin Y,Stewart AF,Müller R,and Zhang Y(2008).Efficient transfer of two large secondary metabolite pathway gene clusters into heterologous hosts by transposition.Nucleic Acids Res.36:e113.
[0278] 26.Murphy,K.C.(1991)Lambda Gam protein inhibits the helicase and chi-stimulated  recombination  activities  of Escherichia coli  RecBCD enzyme.J.Bacteriol.173,5808- 5821.
[0279] 27.Junping Wang,Mihail Sarov,Jeanette Rientjes,Jun Fu,Heike Hollak,Harald Kranz,Wei Xie,A.Francis Stewart and Youming Zhang.An improved recombineering approach by adding RecA to Iambda Red recombination.Molecular Biotechnology.32(1):43-54, 2006.
[0280] 28.Clark,A.J.et al.Genes  of  the RecE and RecF pathways of conjugational  recombination  in  Escherichia  coliCold  Spring 
Harb.Symp.Quant.Biol.49,453-462(1984).
[0281] 29.Hall,S.D.,Kane,M.F.&Kolodner,R.D.Identification  and characterization of the Escherichia coli RecT protein,a protein encoded by the recE region that promotes renaturation of homologous single-stranded DNA.J.Bacteriol.175,277-287(1993).
[0282] 30.Kulkarni SK.Stahl FW.Interaction between the sbcC gene of Escherichia coli and the gam gene of phage lambda.Genetics.1989Oct;123(2):
249-53.
[0283] 31.Rivero-Müller,A.et al.“Assisted large fragment insertion by Red/ET-recombination (ALFIRE)-an alternative and enhanced method for large fragment recombineering”, Nuc.Acids.Res.2007,35(1):e78;
[0284] 32.Schmidt W.M.,Mueller M.W.1999.CapSelect:a highly sensitive method for 5′CAP- dependent enrichment of full length cDNA in PCRmediated analysis of mRNAs.Nucleic Acids Res.27(21):e31.
[0285] 33.Penfold,R.J.&Pemberton,J.M.An improved suicide vector for construction of chromosomal insertion mutations in bacteria.Gene 118,145-146(1992).
[0286] 34.Kovall  R,Matthews  BW.Toroidal  structure  of  lambda-exonuclease.Science.1997Sep 19;277(5333):1824-7.
[0287] 35.Zhang J,Xing X,Herr AB,Bell CE.Crystal structure of E.coli RecE protein reveals a toroidal tetramer for processing double-stranded DNA breaks.Structure.2009May 13;17(5):690-702.
[0288] 36.Willis,D.K.et al.,“Mutation-dependent suppression of recB21and recC22 by a region cloned from the Rac progphage of Escherichia coli K-12”,J.Bacteriol.162,1166-1172.
[0289] 37.Schmidt,W.M.and Mueller,M.W.,1999,“CapSelect:A highly sensitive method for 5’ CAP-dependent enrichment of full length cDNA in PCR mediated analysis of mRNAs”, Nuc.Acids.Res.27(21):e31.
[0290] 38.Hashimoto-Gotoh,T.and Sekiguchi,M.,1977,“Mutations of temperature sensitivity in R plasmid pSC101”,J.Bacteriol.131,405-412.
[0291] 39.Chang AC,Cohen SN.Construction and characterization of amplifiable multicopy DNA cloning vehicles derived from the P15A cryptic miniplasmid.J Bacteriol.1978; 134(3):1141-56.
[0292] 40.Bolivar F,Rodriguez RL,Greene PJ,Betlach MC,Heyneker HL,Boyer HW,Crosa JH, Falkow S.Construction and characterization of new cloning vehicles.II.A multipurpose cloning system.Gene.1977;2(2):95-113.
[0293] 41.Yanisch-Perron C,Vieira J,Messing J.Improved M13phage cloning vectors and  host strains:nucleotide sequences of the M13mp18and pUC19vectors.Gene.1985; 33(1):103-19.
[0294] 42.Gibson DG,et al.Science.2010May 20Creation of a Bacterial Cell Controlled by a Chemically Synthesized Genome.
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈