一种DNA编码分子库的合成方法及DNA模板

申请号 CN201610882475.7 申请日 2016-10-08 公开(公告)号 CN107130300A 公开(公告)日 2017-09-05
申请人 深圳劲宇生物科技有限公司; 发明人 李笑宇;
摘要 本 发明 公开了一种DNA编码分子库的合成方法及DNA模板,该方法包含以下步骤:(1)DNA编码;(2)构建DNA模板,其包含依次连接的发卡形的PCR结合区PBS‑1、与N个结构单元对应结合的N个反应区t及PCR引物结合区PBS‑2;在反应区中,具有非经典的inosine 碱 基;(3)DNA偶合;(4)酶连;(5)化学反应;(6)光照,实现对结构基团R1化学反应的编码;(7)对剩余的结构单元依次重复步骤(3)至(6),重复N‑1次,实现对N个结构基团R之间化学反应的编码;即完成DNA编码分子库的合成;其中,N≥2。本方法实现以一个T模板指引整个分子库的合成,而和具体的n,m,o数值无关,与分子库中的化合物数量无关。
权利要求

1.一种DNA编码分子库的合成方法,其包含以下步骤:
(1)DNA编码:通过N个DNA标签r对N个结构基团R进行编码,得N个结构单元RD;DNA标签r通过光切断连接基团与结构基团R连接;
(2)构建DNA模板,其包含依次连接的发卡形的PCR结合区PBS-1、与N个结构单元对应结合的N个反应区t及PCR引物结合区PBS-2;在反应区中,具有非经典的inosine基;
(3)DNA偶合:结构单元RD1的DNA标签r1结合在DNA模板的反应区t1上;
(4)酶连:加入连接酶将DNA标签r1与DNA模板起始端相连接;
(5)化学反应:结构单元RD1的结构基团R1与DNA模板末端进行化学反应,即R1与DNA模板末端相连接;
(6)光照:通过光照切断结构基团R1与DNA标签r1之间的连接,恢复DNA模板的线形结构,实现对结构基团R1化学反应的编码;
(7)对剩余的结构单元依次重复步骤(3)至(6),重复N-1次,实现对N个结构基团R之间化学反应的编码;即完成DNA编码分子库的合成;其中,N≥2。
2.根据权利要求1所述的DNA编码分子库的合成方法,其特征在于,所述光照为紫外光照。
3.根据权利要求1所述的DNA编码分子库的合成方法,其特征在于,N=3。
4.根据权利要求1或3所述的DNA编码分子库的合成方法,其特征在于,所述步骤(4)、(5)和(6)之间的顺序可任意排列。
5.根据权利要求4所述的DNA编码分子库的合成方法,其特征在于,
(1)DNA编码:通过3个DNA标签r对3个结构基团R进行编码,得3个结构单元RD;DNA标签r通过光切断连接基团与结构基团R连接;
(2)构建DNA模板,其包含依次连接的发卡形的PCR结合区PBS-1、与3个结构单元对应结合的3个反应区t及PCR引物结合区PBS-2;在反应区中,具有非经典的inosine碱基;
(3)DNA偶合:结构单元RD1的DNA标签r1结合在反应区t1上;
(4)酶连:加入连接酶将DNA标签r1与PCR结合区PBS-1相连接;
(5)化学反应:结构单元RD1的结构基团R1与PCR引物结合区PBS-2进行化学反应,即R1与PBS-2相连接;
(6)光照:通过光照切断结构基团R1与DNA标签r1之间的连接,恢复DNA模板的线形结构,实现对结构基团R1化学反应的编码;
(7)DNA偶合:结构单元RD2的DNA标签r2结合在反应区t2上;
(8)酶连:加入连接酶将DNA标签r2与DNA标签r1相连接;
(9)化学反应:结构单元RD2的结构基团R2与结构基团R1进行化学反应,即R2与R1相连接;
(10)光照:通过光照切断结构基团R2与DNA标签r2之间的连接,恢复DNA模板的线形结构,实现对结构基团R1、R2之间化学反应的编码;
(11)DNA偶合:结构单元RD3的DNA标签r3结合在反应区t3上;
(12)酶连:加入连接酶将DNA标签r3与DNA标签r2相连接;
(13)化学反应:结构单元RD3的结构基团R3与结构基团R2进行化学反应;
(14)光照:通过光照切断结构基团R3与DNA标签r3之间的连接,恢复DNA模板的线形结构,实现对结构基团R1、R2和R3之间化学反应的编码;即完成DNA编码分子库的合成。
6.一种DNA编码分子库合成用的DNA模板,其特征在于,所述DNA模板包含依次连接的发卡形的PCR结合区PBS-1、与N个结构单元对应结合的N个反应区t及PCR引物结合区PBS-2;在反应区中,具有非经典的inosine碱基。

说明书全文

一种DNA编码分子库的合成方法及DNA模板

技术领域

[0001] 本发明涉及了DNA编码技术领域,特别是涉及了一种DNA编码分子库的合成方法及DNA模板。

背景技术

[0002] 当代药物研发中,针对疾病的药物靶点,通过构建大型的候选药物分子库,进行高通量、大规模筛选是新药研发中不可或缺的手段。当今世界上主要的制药公司均拥有大型的分子库和大规模的筛选平台用于新药研发。然而,传统的分子库和筛选平台成本高昂、技术槛高、管理运行复杂,成为高通量筛选发展和应用中的严重制约。近5年来,DNA编码分子库技术逐渐发展起来,成为药物研发中的新兴筛选方法。在DNA编码分子库中,每一个化合物与一个特异性的DNA链相连接,成为一个特异的条形码,实现对化合物的特异性编码。DNA编码分子库能够在极小的体系中,实现千万乃至上亿级的高通量筛选。筛选结果可以通过PCR扩增和DNA测序进行解码分析,已获得先导化合物用于进一步药物研发。近年来,DNA编码分子库已经得到新药研发领域中的广泛认可和应用,成为新药研发中的一种重要支撑技术。
[0003] 在DNA编码分子库中,一个关键的技术环节即为如何对存在于同一个溶液体系中的多种化合物进行特异性的编码;即如何有效、准确地在每一个不同化合物上连接不同的DNA条形码。本领域的发展中,出现了多种编码的方法;包括组合化学中传统的“split-pool-split”方法、DNA 模板控制合成、DNA routing、DNA双链连接等多种方法。本专利描述了一种新型的模板控制分子库合成方法,能够仅以一个DNA模板,合成整个DNA编码分子库。

发明内容

[0004] 为了解决上述现有技术的不足,本发明提供了一种DNA编码分子库的合成方法及DNA模板。
[0005] 本发明所要解决的技术问题通过以下技术方案予以实现:
[0006] 一种DNA编码分子库的合成方法,其包含以下步骤:
[0007] (1)DNA编码:通过N个DNA标签r对N个结构基团R进行编码,得N个结构单元RD;DNA标签r通过光切断连接基团与结构基团R连接;
[0008] (2)构建DNA模板,其包含依次连接的发卡形的PCR结合区PBS-1、与N个结构单元对应结合的N个反应区t及PCR引物结合区PBS-2;在反应区中,具有非经典的inosine基;
[0009] (3)DNA偶合:结构单元RD1的DNA标签r1结合在DNA模板的反应区t1上;
[0010] (4)酶连:加入连接酶将DNA标签r1与DNA模板起始端相连接;
[0011] (5)化学反应:结构单元RD1的结构基团R1与DNA模板末端进行化学反应,即R1与DNA模板末端相连接;
[0012] (6)光照:通过光照切断结构基团R1与DNA标签r1之间的连接,恢复DNA模板的线形结构,实现对结构基团R1化学反应的编码;
[0013] (7)对剩余的结构单元依次重复步骤(3)至(6),重复N-1次,实现对N个结构基团R之间化学反应的编码;即完成DNA编码分子库的合成;其中,N≥2。
[0014] 其中,所述光照为紫外光照;所述步骤(4)、(5)和(6)之间的顺序可任意排列。
[0015] 优选地,N=3。则DNA编码分子库的合成方法,其具体包括以下步骤:
[0016] (1)DNA编码:通过3个DNA标签r对3个结构基团R进行编码,得3个结构单元RD;DNA标签r通过光切断连接基团与结构基团R连接;
[0017] (2)构建DNA模板,其包含依次连接的发卡形的PCR结合区PBS-1、与3个结构单元对应结合的3个反应区t及PCR引物结合区PBS-2;在反应区中,具有非经典的inosine碱基;
[0018] (3)DNA偶合:结构单元RD1的DNA标签r1结合在反应区t1上;
[0019] (4)酶连:加入连接酶将DNA标签r1与PCR结合区PBS-1相连接;
[0020] (5)化学反应:结构单元RD1的结构基团R1与PCR引物结合区PBS-2进行化学反应,即R1与PBS-2相连接;
[0021] (6)光照:通过光照切断结构基团R1与DNA标签r1之间的连接,恢复DNA模板的线形结构,实现对结构基团R1化学反应的编码;
[0022] (7)DNA偶合:结构单元RD2的DNA标签r2结合在反应区t2上;
[0023] (8)酶连:加入连接酶将DNA标签r2与DNA标签r1相连接;
[0024] (9)化学反应:结构单元RD2的结构基团R2与结构基团R1进行化学反应,即R2与R1相连接;
[0025] (10)光照:通过光照切断结构基团R2与DNA标签r2之间的连接,恢复DNA模板的线形结构,实现对结构基团R1、R2之间化学反应的编码;
[0026] (11)DNA偶合:结构单元RD3的DNA标签r3结合在反应区t3上;
[0027] (12)酶连:加入连接酶将DNA标签r3与DNA标签r2相连接;
[0028] (13)化学反应:结构单元RD3的结构基团R3与结构基团R2进行化学反应;
[0029] (14)光照:通过光照切断结构基团R3与DNA标签r3之间的连接,恢复DNA模板的线形结构,实现对结构基团R1、R2和R3之间化学反应的编码;即完成DNA编码分子库的合成。
[0030] 本发明还提供了一种DNA编码分子库合成用的DNA模板,所述DNA模板包含依次连接的发卡形的PCR结合区PBS-1、与N个结构单元对应结合的N个反应区t及PCR引物结合区PBS-2;在反应区中,具有非经典的inosine碱基。
[0031] 本发明具有如下有益效果:本方法不再采取其它DNA编码分子库中严格遵循经典的碱基互补配对原则,反而是采用不具有选择性的特殊DNA模板,来实现以一个T模板(DNA模板)指引整个分子库的合成,而和具体的n,m,o数值无关,与分子库中的化合物数量无关。用本方法进行DNA编码分子库的合成,不再需要进行分子库序列设计,本发明所设计的T模板(即DNA模板),可以应用于任何分子库。
附图说明
[0032] 图1a为合成DNA编码分子库的原理示意图;
[0033] 图1b为本发明合成DNA编码分子库所用的DNA模板;
[0034] 图1c为本发明DNA模板的一个具体碱基系列;
[0035] 图2为本发明DNA编码分子库的合成方法的流程示意图;
[0036] 图3a为本发明验证该合成方法所用的DNA模板的具体碱基系列;
[0037] 图3b为本发明合成与DNA模板相应的三个结构单元RD1、RD2、RD3;
[0038] 图3c为本发明使用DNA模板进行的多步反应;
[0039] 图4a为本发明多步反应的产物的凝胶电泳检测数据;
[0040] 图4b为本发明多步反应中的中间体的化学结构;
[0041] 图4c为本发明多步反应中每一步的产物的质谱鉴别图谱和质谱数据;
[0042] 图5a为本发明合成与DNA模板相应的三个结构单元RD4、RD5、RD6;
[0043] 图5b为本发明利用DNA模板合成分子库、筛选、扩增及测序的过程及结果数据。

具体实施方式

[0044] 下面结合附图和实施例对本发明进行详细的说明。为了便于说明,下面以N=3作为实施例对本发明做进一步说明。
[0045] 如图1a所示,对于一个具有三组结构单元的分子库(RD1,RD2,RD3),每组分别有n,m,o个不同的结构基团(R1,R2,R3)。在分子库合成之前,这三组结构单元分别以n,m,o个不同的DNA标签(r1,r2,r3)对结构单元进行直接编码。从理论上,它们之间排列组合的化学反应,从而形成一个包含有(n×m×o)个化合物的分子库。然而对于DNA编码分子库来说,关键即在R1,R2,R3反应的时候,能够同时对它们所携带的编码DNA标签r1,r2,r3进行排列组合,即将r1,r2,r3的DNA序列进行连接,以将R1+R2+R3之间的化学反应转化为r1+r2+r3的DNA序列信息。此外,r1+r2+r3需要仍然具有天然DNA的化学结构,以与进一步基于PCR扩增和DNA测序的解码过程相匹配。
[0046] 基于此,本发明人提出使用如图1b所示的DNA模板(T模板)来实现这一点。T模板具有如下几个序列区域:位于起始端的发卡形的PCR结合区(PBS-1),能与r1,r2,r3分别结合的三个反应区域(t1,t2,t3),以及位于末端的PCR引物结合区(PBS-2)。在t区域中,均具有非经典的inosine碱基,图1c显示了一个T模板的具体碱基序列,其中inosine碱基以大写字母“I”来表示;该inosine碱基是一种大多存在于RNA,在自然界中丰度较低的碱基;其具有一个特殊性质:能够与ATCG四种碱基均形成稳定的碱基对,不具有序列选择性。因此,以inosine为序列的t区域,能够与对应的r区域中的任意DNA序列相结合。
[0047] 基于该T模板的设计,其将以以下的几个步骤来实现对R1,R2,R3之间化学反应的编码,如图2所示:
[0048] (1)DNA偶合:结构单元RD1的DNA标签r1结合在反应区t1上;
[0049] (2)化学反应:结构单元RD1的结构基团R1与T模板末端的PCR引物结合区PBS-2进行化学反应,即R1与PBS-2相连接;
[0050] (3)光照:在结构基团R1和DNA标签r1的DNA之间设计了具有能够被紫外光照(320nm)切断的连接基团,因此对体系进行紫外光照,通过光照切断结构基团R1与DNA标签r1之间的连接,恢复DNA模板的线形结构;
[0051] (4)酶连:加入连接酶将DNA标签r1与PCR结合区PBS-1相连接;实现对结构基团R1化学反应的编码;
[0052] 采用同样的DNA偶合、酶连、化学反应及光照步骤对结构基团R2、R3化学反应的编码,具体如下:
[0053] (5)DNA偶合:结构单元RD2的DNA标签r2结合在反应区t2上;
[0054] (6)化学反应:结构单元RD2的结构基团R2与结构基团R1进行化学反应,即R2与R1相连接;
[0055] (7)光照:通过光照切断结构基团R2与DNA标签r2之间的连接,恢复DNA模板的线形结构,
[0056] (8)酶连:加入连接酶将DNA标签r2与DNA标签r1相连接;实现对结构基团R1、R2之间化学反应的编码;
[0057] (9)DNA偶合:结构单元RD3的DNA标签r3结合在反应区t3上;
[0058] (10)化学反应:结构单元RD3的结构基团R3与结构基团R2进行化学反应;
[0059] (11)光照:通过光照切断结构基团R3与DNA标签r3之间的连接,恢复DNA模板的线形结构;
[0060] (12)酶连:加入连接酶将DNA标签r3与DNA标签r2相连接;实现对结构基团R1、R2和R3之间化学反应的编码;即完成DNA编码分子库的合成。
[0061] 需要说明的是,本发明所用的连接酶优选但不限定为T4DNA连接酶。
[0062] 本方法不再采取其它DNA编码分子库中严格遵循经典的碱基互补配对原则,反而是采用不具有选择性的特殊DNA模板,来实现以一个T模板指引整个分子库的合成,而和具体的n,m,o数值无关,与分子库中的化合物数量无关。用本方法进行DNA编码分子库的合成,不再需要进行分子库序列设计,本发明所设计的T模板(即DNA模板),可以应用于任何分子库。
[0063] 该方法在实验上已经得到验证,被用于合成一系列多种类型的DNA编码分子库,并进行了针对蛋白质靶点的筛选。验证过程如下:
[0064] 图3a显示了一个含有inosine碱基,具有三个反应区,用于三步化学反应的DNA模板,其中inosine碱基以大写字母“I”来表示。与DNA模板相应的,本发明人合成了三个与DNA模板反应的DNA结构单元:RD1,RD2,RD3(图3b),这三个DNA结构单元分别带有一个基酸,作为分子库结构基团的代表;此外它们也均具有光切断连接基团,从而能够在化学反应之后,方便通过光照,切断这些连接基团从而为下一步反应做准备。图3c中,显示了一个使用该DAN模板进行的多步反应。每一步反应均遵循了:DNA偶合、酶连、化学反应、光照的四个步骤,此四个步骤没有严格的顺序限制。这些步骤完成后,DNA模板上的磷酸根和胺基重新生成,可以直接进入下一步的反应。在三步反应之后,最后的产物vi即可生成。整个反应过程中,不需要对中间产物进行分离,但是可以通过凝胶电泳进行检测(图4a、4b)。最终产物vi则是从凝胶电泳中切出条带,萃取,进行质谱鉴定。图4c则显示了对第一、二,以及最终产物的质谱鉴别图谱和质谱数据。
[0065] 本发明人进一步进行了分子库的合成与筛选。如图5a中所示,首先合成了RD4,RD5,RD6三组与DNA模板反应的分子库结构单元,分别具有64、27、64种不同的DNA序列,之间的排列组合共能够生成含有:64×27×64=110,592不同序列的分子库。其中有一个特殊的“CCC”编码,用于对分子库中唯一含有生物素基团的结构单元进行编码。我们在利用DNA模板合成该分子库之后,进行了对streptavidin蛋白质靶点的筛选,并通过PCR扩增和DNA测序进行了解码。数据(图5b)明确显示,在筛选之前,生物素的编码区域(codon 2)为乱码,表明为混合序列,和预期一致;但是在筛选完成之后,codon 2的序列清晰的显出GGG的序列被富集。由于测序数据显示的是分子库中DNA的反义序列,因此表明了生物素的编码CCC被富集。以上数据充分证明了本发明的DNA模板技术,能够以一个特殊DNA模板,实现整个分子库的合成、表征,以及针对于蛋白质靶点的筛选和解码。
[0066] 以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制,但凡采用等同替换或等效变换的形式所获得的技术方案,均应落在本发明的保护范围之内。
QQ群二维码
意见反馈