首页 / 专利库 / 生物工程 / 生物材料 / 细胞支架 / 模控分子和使用这种分子的方法

模控分子和使用这种分子的方法

阅读:477发布:2023-01-25

专利汇可以提供模控分子和使用这种分子的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种合成模控分子的方法。在本发明的一个方面,模控分子被连接到模控其合成的模板上。本发明允许产生能够用于筛选例如 治疗 活性的文库。,下面是模控分子和使用这种分子的方法专利的具体信息内容。

1.合成含有多个官能团的模控分子的方法,所说的方法包括步 骤:
i)提供至少一个含有n个编码元件之序列的模板,
其中每个编码元件含有至少一个能够识别预定互补元件的识别基 团,且
其中n是大于1的整数,
ii)提供多个构件,其中每个构件包括
a)至少一个含有至少一个能够识别预定编码元件的识别基团的 互补元件,
b)至少一个含有至少一个官能团和至少一个反应基团的功能实 体,和
c)至少一个将所述至少一个功能实体和所述至少一个互补元件 分隔开的接头,
iii)使每个所述编码元件和能够识别所述编码元件的互补元件 相接触
iv)任选地,获得互补模板,并且
v)通过借助于涉及反应基团的反应将至少一个功能实体的官能 团连接到另一个功能实体的官能团上,获得含有共价连接的官能团的 模控分子,
其中模控分子能够通过接头与模控合成所述模控分子的模板或者 互补模板连接,并且
其中模控分子的合成不涉及由核糖体介导的核酸翻译。
2.权利要求1的方法,其中模控分子通过单个接头与模控所述模 控分子合成的模板或者互补模板连接。
3.权利要求1的方法,其中重复步骤iii)到v)。
4.权利要求1的方法,其中含有n个编码元件的模板是编码元件 的线性序列。
5.权利要求1的方法,其中含有n个编码元件的模板是支化的。
6.权利要求1的方法,其中n优选具有2-200,例如2-100, 比如2-80,例如2-60,比如2-40,例如2-30,比如2-20,例 如2-15,比如2-10,比如2-8,例如2-6,比如2-4,例如2, 比如3-100,例如3-80,比如3-60,比如3-40,例如3-30,比 如3-20,比如3-15,例如3-15,比如3-10,比如3-8,例如3 -6,比如3-4,例如3,比如4-100,例如4-80,比如4-60,比 如4-40,例如4-30,比如4-20,比如4-15,例如4-10,比如4 -8,比如4-6,例如4,例如5-100,比如5-80,例如5-60,比 如5-40,例如5-30,比如5-20,例如5-15,比如5-10,比如5 -8,例如5-6,例如5,比如6-100,例如6-80,比如6-60,比 如6-40,例如6-30,比如6-20,比如6-15,例如6-10,比如6 -8,比如6,例如7-100,比如7-80,例如7-60,比如7-40, 例如7-30,比如7-20,例如7-15,比如7-10,例如7-8,例如 7,例如8-100,比如8-80,例如8-60,比如8-40,例如8-30, 比如8-20,例如8-15,比如8-10,比如8,例如9,例如10-100, 比如10-80,例如10-60,比如10-40,例如10-30,比如10-20, 例如10-15,比如10-12,比如10,例如12-100,比如12-80, 例如12-60,比如12-40,例如12-30,比如12-20,例如12-15, 比如14-100,比如14-80,例如14-60,比如14-40,例如14- 30,比如14-20,例如14-16,比如16-100,比如16-80,例如 16-60,比如16-40,例如16-30,比如16-20,比如18-100,比 如18-80,例如18-60,比如18-40,例如18-30,比如18-20, 例如20-100,比如20-80,例如20-60,比如20-40,例如20- 30,比如20-25,例如22-100,比如22-80,例如22-60,比如 22-40,例如22-30,比如22-25,例如25-100,比如25-80,例 如25-60,比如25-40,例如25-30,比如30-100,例如30-80, 比如30-60,例如30-40,比如30-35,例如35-100,比如35- 80,例如35-60,比如35-40,例如40-100,比如40-80,例如 40-60,比如40-50,例如40-45,比如45-100,例如45-80,比 如45-60,例如45-50,比如50-100,例如50-80,比如50-60, 例如50-55,比如60-100,例如60-80,比如60-70,例如70- 100,比如70-90,例如70-80,比如80-100,例如80-90,比如 90-100的值。
7.权利要求1的方法,其中模板连附在固体或者半固体载体上。
8.权利要求1的方法,其中模板包括或者基本上由核苷酸组成, 所述核苷酸选自脱核糖核酸(DNA),核糖核酸(RNA),肽核酸(PNA), 封闭核酸(LNA),以及morpholinos序列,包括它们的任何类似物或者 衍生物
9.权利要求1的方法,其中模板包括或者基本上由核苷酸组成, 所述核苷酸选自DNA,RNA,PNA,LNA以及morpholinos序列,包括 其任何类似物或者衍生物,且其中互补元件包括或者基本上由核苷酸 组成,所述核苷酸选自DNA,RNA,PNA,LNA以及morpholinos序列, 包括它们的任何类似物或者衍生物。
10.权利要求1的方法,其中模板是可扩增的。
11.权利要求1的方法,其中模板包含编码元件的单链。
12.权利要求11的方法,其中编码元件的单链能通过与包含互补 元件的单链的互补模板杂交形成双螺旋。
13.权利要求1-12任一项的方法,其中模板含有引发位点。
14.权利要求13的方法,其中引发位点位于编码元件的上游,并 且能够结合用于引发构件的掺入和/或模板编码元件的扩增的引物。
15.权利要求13的方法,其中引发位点位于编码元件的下游,并 且能够结合寡核苷酸。
16.权利要求15的方法,其中寡核苷酸含有能结合模控分子的锚 定点。
17.权利要求15的方法,其中寡核苷酸能够停止构件的进一步掺 入。
18.权利要求15的方法,其中引发位点能够结合反向引物。
19.权利要求1的方法,其中每个编码元件通过共价化学键与相 邻的编码元件连接。
20.权利要求1的方法,其中每个编码元件通过共价化学键与每 个相邻的编码元件连接。
21.权利要求14和15任一项的方法,其中所说的共价化学键从 由磷酸二酯键,硫代磷酸酯键和肽键组成的共价键组中选择。
22.权利要求14和15任一项的方法,其中所述的共价化学键从 由磷酸二酯键和硫代磷酸酯键组成的共价键组中选择。
23.权利要求1的方法,其中至少一个编码元件连附在固体或者 半固体载体上。
24.权利要求1的方法,其中编码元件从由核苷酸,包括其任何 类似物或衍生物,基酸、抗体抗原组成的组中选择。
25.权利要求19的方法,其中编码元件从由核苷酸、核苷酸衍生 物、和核苷酸类似物,包括其任何组合,组成的组中选择。
26.权利要求20的方法,其中编码元件是从由核苷酸组成的组中 选择。
27.权利要求21的方法,其中核苷酸是包含从腺嘌呤(A),胸腺 嘧啶(T),嘌呤(G),和胞嘧啶(C)中选择的基的脱氧核糖核酸。
28.权利要求21的方法,其中核苷酸是包含从腺嘌呤(A),尿嘧 啶(U),鸟嘌呤(G),和胞嘧啶(C)中选择的碱基的核糖核酸。
29.权利要求21的方法,其中每个核苷酸通过共价键与相邻的核 苷酸连接。
30.权利要求21的方法,其中每个核苷酸通过共价键与每个相邻 的核苷酸连接。
31.权利要求24和25任一项的方法,其中所述的共价键是磷酸 二酯键或者硫代磷酸酯键。
32.权利要求21的方法,其中编码元件是从由脱氧核糖核酸组成 的组中选择的天然和非天然的核苷酸。
33.权利要求21的方法,其中编码元件是从由核糖核酸组成的组 中选择的天然和非天然的核苷酸。
34.权利要求19的方法,其中编码元件选自核苷酸,核苷酸衍生 物和核苷酸类似物,其中一个或者多个碱基部分和/或磷酸酯部分和 /或核糖或者脱氧核糖部分已被替换分子实体所替代。
35.权利要求29的方法,其中能与所述的编码元件相互作用的互 补元件包括或者基本上由从由DNA,RNA,PNA,LNA以及morpholinos 序列,包括其任何类似物或者衍生物,组成的组中选择的核苷酸组成。
36.权利要求27到30任一项的方法,其中每个核苷酸通过共价 化学键与相邻的核苷酸连接。
37.权利要求27到30任一项的方法,其中每个核苷酸通过共价 化学键与每个相邻的核苷酸连接。
38.权利要求31和32任一项的方法,其中所述的共价化学键从 由磷酸二酯键和肽键组成的共价键组中选择。
39.权利要求1的方法,其中编码元件优选包括或者基本上由1 -100个亚单位,比如1-80个亚单位,例如1-60个亚单位,比如1 -40个亚单位,例如1-20个亚单位,比如1-18个亚单位,例如1 -16个亚单位,比如1-14个亚单位,例如1-12个亚单位,比如1 -10个亚单位,例如1-9个亚单位,比如1-8个亚单位,例如1-7 个亚单位,比如1-6个亚单位,例如1-5个亚单位,比如1-4个亚 单位,例如1-3个亚单位,比如1-2个亚单位,例如1个亚单位, 比如2-100个亚单位,比如2-80个亚单位,例如2-60个亚单位, 比如2-40个亚单位,例如2-20个亚单位,比如2-18个亚单位, 例如2-16个亚单位,比如2-14个亚单位,例如2-12个亚单位, 比如2-10个亚单位,例如2-9个亚单位,比如2-8个亚单位,例 如2-7个亚单位,比如2-6个亚单位,例如2-5个亚单位,比如2 -4个亚单位,例如2-3个亚单位,比如2个亚单位,比如3-100 个亚单位,比如3-80个亚单位,例如3-60个亚单位,比如3-40 个亚单位,例如3-20个亚单位,比如3-18个亚单位,例如3-16 个亚单位,比如3-14个亚单位,例如3-12个亚单位,比如3-10 个亚单位,例如3-9个亚单位,比如3-8个亚单位,例如3-7个亚 单位,比如3-6个亚单位,例如3-5个亚单位,比如3-4个亚单位, 例如3个亚单位,例如4-100个亚单位,比如4-80个亚单位,例如 4-60个亚单位,比如4-40个亚单位,例如4-20个亚单位,比如4 -18个亚单位,例如4-16个亚单位,比如4-14个亚单位,例如4 -12个亚单位,比如4-10个亚单位,例如4-9个亚单位,比如4 -8个亚单位,例如4-7个亚单位,比如4-6个亚单位,例如4-5 个亚单位,例如4个亚单位,比如5-100个亚单位,比如5-80个亚 单位,例如5-60个亚单位,比如5-40个亚单位,例如5-20个亚 单位,比如5-18个亚单位,例如5-16个亚单位,比如5-14个亚 单位,例如5-12个亚单位,比如5-10个亚单位,例如5-9个亚单 位,比如5-8个亚单位,例如5-7个亚单位,比如5-6个亚单位, 比如5个亚单位,例如6-100个亚单位,比如6-80个亚单位,例 如6-60个亚单位,比如6-40个亚单位,例如6-20个亚单位,比 如6-18个亚单位,例如6-16个亚单位,比如6-14个亚单位,例 如6-12个亚单位,比如6-10个亚单位,例如6-9个亚单位,比如 6-8个亚单位,例如6-7个亚单位,比6个亚单位,比如7-100个 亚单位,比如7-80个亚单位,例如7-60个亚单位,比如7-40个 亚单位,例如7-20个亚单位,比如7-18个亚单位,例如7-16个 亚单位,比如7-14个亚单位,例如7-12个亚单位,比如7-10个 亚单位,例如7-9个亚单位,比如7-8个亚单位,比如7个亚单位, 例如8-100个亚单位,比如8-80个亚单位,例如8-60个亚单位, 比如8-40个亚单位,例如8-20个亚单位,比如8-18个亚单位, 例如8-16个亚单位,比如8-14个亚单位,例如8-12个亚单位, 比如8-10个亚单位,例如8-9个亚单位,例如8个亚单位,比如9 -100个亚单位,比如9-80个亚单位,例如9-60个亚单位,比如9 -40个亚单位,例如9-20个亚单位,比如9-18个亚单位,例如9 -16个亚单位,比如9-14个亚单位,例如9-12个亚单位,比如9 -10个亚单位,比如9个亚单位,例如10-100个亚单位,比如10 -80个亚单位,例如10-60个亚单位,比如10-40个亚单位,例如 10-20个亚单位,比如10-18个亚单位,例如10-16个亚单位,比 如10-14个亚单位,例如10-12个亚单位,比如10个亚单位,比如 11-100个亚单位,比如11-80个亚单位,例如11-60个亚单位, 比如11-40个亚单位,例如11-20个亚单位,比如11-18个亚单位, 例如11-16个亚单位,比如11-14个亚单位,例如11-12个亚单位, 比如12-100个亚单位,比如12-80个亚单位,例如12-60个亚单 位,比如12-40个亚单位,例如12-20个亚单位,比如12-18个亚 单位,例如12-16个亚单位,比如12-14个亚单位,例如13-100 个亚单位,比如13-80个亚单位,例如13-60个亚单位,比如13- 40个亚单位,例如13-20个亚单位,比如13-18个亚单位,例如13 -16个亚单位,比如13-14个亚单位,例如14-100个亚单位,比 如14-80个亚单位,例如14-60个亚单位,比如14-40个亚单位, 例如14-20个亚单位,比如14-18个亚单位,例如14-16个亚单位, 比如15-100个亚单位,比如15-80个亚单位,例如15-60个亚单 位,比如15-40个亚单位,例如15-20个亚单位,比如15-18个亚 单位,例如15-16个亚单位,比如16-100个亚单位,比如16-80 个亚单位,例如16-60个亚单位,比如16-40个亚单位,例如16- 20个亚单位,比如16-18个亚单位,例如17-100个亚单位,比如 17-80个亚单位,例如17-60个亚单位,比如17-40个亚单位,例 如17-20个亚单位,比如17-18个亚单位,例如18-100个亚单位, 比如18-80个亚单位,例如18-60个亚单位,比如18-40个亚单位, 例如18-20个亚单位,比如19-100个亚单位,比如19-80个亚单 位,例如19-60个亚单位,比如19-40个亚单位,例如19-30个亚 单位,比如19-25个亚单位,例如20-100个亚单位,比如20-80 个亚单位,例如20-60个亚单位,比如20-40个亚单位,例如20- 30个亚单位,比如20-25亚单位组成。
40.权利要求39的方法,其中每个亚单位包括或者基本上由核苷 酸或核苷酸类似物组成。
41.权利要求40的方法,其中每个亚单位包括或者基本上由核苷 酸组成。
42.权利要求41的方法,其中核苷酸是包含从腺嘌呤(A),胸腺 嘧啶(T),鸟嘌呤(G),和胞嘧啶(C)中选择的碱基的脱氧核糖核酸。
43.权利要求41的方法,其中核苷酸是包含从腺嘌呤(A),尿嘧 啶(U),鸟嘌呤(G),和胞嘧啶(C)中选择的碱基的核糖核酸。
44.权利要求41的方法,其中每个核苷酸通过共价键与相邻的核 苷酸,或者核苷酸类似物连接。
45.权利要求41的方法,其中每个核苷酸通过共价键与每个相邻 的核苷酸,或者核苷酸类似物连接。
46.权利要求44和45任一项的方法,其中所述的共价键从由磷 酸二酯键,硫代磷酸酯键和肽键组成的组中选择。
47.权利要求40的方法,其中至少一些所述的核苷酸从由核苷酸 衍生物组成的组中选择。
48.权利要求47的方法,其中核苷酸衍生物从由脱氧核糖核酸衍 生物和核糖核酸衍生物组成的组中选择。
49.权利要求39的方法,其中编码元件亚单位选自核苷酸,核苷 酸衍生物和核苷酸类似物,其中一个或者多个碱基部分和/或磷酸酯 部分和/或核糖部分和/或脱氧核糖部分已被替换分子实体所替代。
50.权利要求49的方法,其中能与所述编码元件亚单位相互作用 的互补元件亚单位包括或者基本上由从由DNA,RNA,PNA,LNA以及 morpholinos序列,包括其任何类似物或者衍生物,组成的组中选择 的核苷酸组成。
51.权利要求47的方法,其中每个核苷酸衍生物通过共价化学键 与相邻的核苷酸,或者核苷酸类似物连接。
52.权利要求47的方法,其中每个核苷酸衍生物通过共价化学键 与每个相邻的核苷酸,或者核苷酸类似物连接。
53.权利要求51和52任一项的方法,其中所述的共价化学键从 由磷酸二酯键,硫代磷酸酯键和肽键组成的组中选择。
54.根据权利要求1的方法,其中通过借助于使每个所述的编码 元件与能够识别所述编码元件的互补元件接触来互补多个预定编码元 件,获得互补模板。
55.权利要求1的方法,其中含有n个互补元件的互补模板是编 码元件的线性序列。
56.权利要求1的方法,其中含有n个互补元件的互补模板是支 化的。
57.权利要求55和56任一项的方法,其中n优选具有2-200, 例如2-100,比如2-80,例如2-60,比如2-40,例如2-30, 比如2-20,例如2-15,比如2-10,比如2-8,例如2-6,比 如2-4,比如2,比如3-100,例如3-80,比如3-60,比如3 -40,例如3-30,比如3-20,比如3-15,例如3-15,比如3 -10,比如3-8,例如3-6,比如3-4,例如3,比如4-100, 例如4-80,比如4-60,比如4-40,例如4-30,比如4-20, 比如4-15,例如4-10,比如4-8,比如4-6,比如4,例如5 -100,比如5-80,例如5-60,比如5-40,例如5-30,比如5 -20,例如5-15,比如5-10,比如5-8,例如5-6,例如5, 比如6-100,例如6-80,比如6-60,比如6-40,例如6-30, 比如6-20,比如6-15,例如6-10,比如6-8,比如6,例如7 -100,比如7-80,例如7-60,比如7-40,例如7-30,比如7 -20,例如7-15,比如7-10,比如7-8,比如7,例如8-100, 比如8-80,例如8-60,比如8-40,例如8-30,比如8-20, 例如8-15,比如8-10,例如8,比如9,例如10-100,比如10 -80,例如10-60,比如10-40,例如10-30,比如10-20,例 如10-15,比如10-12,比如10,例如12-100,比如12-80, 例如12-60,比如12-40,例如12-30,比如12-20,例如12 -15,比如14-100,比如14-80,例如14-60,比如14-40, 例如14-30,比如14-20,例如14-16,比如16-100,比如16 -80,例如16-60,比如16-40,例如16-30,比如16-20,比 如18-100,比如18-80,例如18-60,比如18-40,例如18- 30,比如18-20,例如20-100,比如20-80,例如20-60,比 如20-40,例如20-30,比如20-25,例如22-100,比如22- 80,例如22-60,比如22-40,例如22-30,比如22-25,例如 25-100,比如25-80,例如25-60,比如25-40,例如25-30, 比如30-100,例如30-80,比如30-60,例如30-40,比如30 -35,例如35-100,比如35-80,例如35-60,比如35-40, 例如40-100,比如40-80,例如40-60,比如40-50,例如40 -45,比如45-100,例如45-80,比如45-60,例如45-50, 比如50-100,例如50-80,比如50-60,例如50-55,比如60 -100,例如60-80,比如60-70,例如70-100,比如70-90, 例如70-80,比如80-100,例如80-90,比如90-100的值。
58.权利要求1的方法,其中互补模板连附在固体或者半固体载 体上。
59.权利要求1的方法,其中互补模板包括或者基本上由从由脱 氧核糖核酸(DNA),核糖核酸(RNA),肽核酸(PNA),封闭核酸(LNA), 以及morpholinos序列,包括其任何类似物或者衍生物,组成的组中 选择的核苷酸组成。
60.权利要求1的方法,其中互补模板包括或者基本上由从由DNA, RNA,PNA,LNA以及morpholinos序列,包括其任何类似物或者衍生 物,组成的组中选择的核苷酸组成,而且其中模板的相应编码元件包 括或者基本上由从由DNA,RNA,PNA,LNA以及morpholinos序列, 包括其任何类似物或者衍生物,组成的组中选择的核苷酸组成。
61.权利要求1的方法,其中互补模板是可扩增的。
62.权利要求1的方法,其中互补模板包含互补元件的单链。
63.权利要求55和56的方法,其中互补元件的单链能通过与包 含编码元件的单链的模板杂交形成双螺旋。
64.权利要求1-57任一项的方法,其中互补模板含有引发位点。
65.权利要求1的方法,其中每个互补元件通过共价化学键与相 邻的互补元件连接。
66.权利要求1的方法,其中每个互补元件通过共价化学键与每 个相邻的互补元件连接。
67.权利要求59和60任一项的方法,其中所述的共价化学键从 由磷酸二酯键,硫代磷酸酯键和肽键组成的共价键组中选择。
68.根据权利要求65-67任一项的方法,其中磷酸二酯键是通过 I型反应基团之间的反应形成的,其中一个I型反应基团是羟基,而 另一个是磷酸咪唑基。
69.权利要求59和60任一项的方法,其中所述的共价化学键从 由磷酸二酯键和硫代磷酸酯键组成的共价键组中选择。
70.权利要求1的方法,其中至少有一个互补元件连附在固体或 者半固体载体上。
71.权利要求1的方法,其中互补元件从由核苷酸,包括其任何 类似物或衍生物,氨基酸、抗体和抗原组成的组中选择。
72.权利要求64的方法,其中互补元件从由核苷酸、核苷酸衍生 物、和核苷酸类似物,包括其任何组合,组成的组中选择。
73.根据权利要求72的方法,其中为了增加多样性,核苷酸衍生 物既包括天然衍生物又包括非天然衍生物。
74.权利要求73的方法,其中互补元件从由核苷酸组成的组中选 择。
75.权利要求74的方法,其中核苷酸是包含从腺嘌呤(A),胸腺 嘧啶(T),鸟嘌呤(G),和胞嘧啶(C),7-脱氮-鸟嘌呤,7-脱氮-腺 嘌呤中选择的碱基的脱氧核糖核酸。
76.权利要求74的方法,其中核苷酸是包含从腺嘌呤(A),尿嘧 啶(U),鸟嘌呤(G),和胞嘧啶(C)中选择的碱基的核糖核酸。
77.权利要求74的方法,其中每个核苷酸通过共价键与相邻的核 苷酸,或者核苷酸类似物连接。
78.权利要求74的方法,其中每个核苷酸通过共价键与每个相邻 的核苷酸,或者核苷酸类似物连接。
79.权利要求77和78任一项的方法,其中所述的共价键是磷酸 二酯键或者硫代磷酸酯键。
80.权利要求72的方法,其中互补元件是从由脱氧核糖核酸组成 的组中选择的天然或者非天然的核苷酸。
81.权利要求72的方法,其中互补元件是从由核糖核酸组成的组 中选择的天然或非天然的核苷酸。
82.权利要求72的方法,其中互补元件选自核苷酸,核苷酸衍生 物和核苷酸类似物,其中一个或者多个碱基部分和/或磷酸酯部分和 /或核糖和/或脱氧核糖部分已被替换分子实体所替代。
83.权利要求82的方法,其中能与所述的互补元件相互作用的编 码元件包括或者基本上由从由DNA,RNA,PNA,LNA以及morpholinos 序列,包括其任何类似物或者衍生物,组成的组中选择的核苷酸组成。
84.权利要求82和83任一项的方法,其中每个核苷酸通过共价 化学键与相邻的核苷酸,或者核苷酸类似物连接。
85.权利要求82和83任一项的方法,其中每个核苷酸通过共价 化学键与每个相邻的核苷酸,或者核苷酸类似物连接。
86.权利要求84和85任一项的方法,其中所说的共价化学键从 由磷酸二酯键、硫代磷酸酯键和肽键组成的共价键组中选择。
87.权利要求1的方法,其中编码元件与另一个编码元件非共价 地偶联。
88.根据权利要求87的方法,其中所述的非共价偶联包括氢键。
89.权利要求1的方法,其中互补元件优选包括或者基本上由1 -100个亚单位,比如1-80个亚单位,例如1-60个亚单位,比 如1-40个亚单位,例如1-20个亚单位,比如1-18个亚单位, 例如1-16个亚单位,比如1-14个亚单位,例如1-12个亚单 位,比如1-10个亚单位,例如1-9个亚单位,比如1-8个亚 单位,例如1-7个亚单位,比如1-6个亚单位,例如1-5个亚 单位,比如1-4个亚单位,例如1-3个亚单位,比如1-2个亚 单位,例如1个亚单位,比如2-100个亚单位,比如2-80个亚 单位,例如2-60个亚单位,比如2-40个亚单位,例如2-20个 亚单位,比如2-18个亚单位,例如2-16个亚单位,比如2-14 个亚单位,例如2-12个亚单位,比如2-10个亚单位,例如2-9 个亚单位,比如2-8个亚单位,例如2-7个亚单位,比如2-6个 亚单位,例如2-5个亚单位,比如2-4个亚单位,例如2-3个 亚单位,比如2个亚单位,比如3-100个亚单位,比如3-80个 亚单位,例如3-60个亚单位,比如3-40个亚单位,例如3-20 个亚单位,比如3-18个亚单位,例如3-16个亚单位,比如3- 14个亚单位,例如3-12个亚单位,比如3-10个亚单位,例如3 -9个亚单位,比如3-8个亚单位,例如3-7个亚单位,比如3 -6个亚单位,例如3-5个亚单位,比如3-4个亚单位,例如3 个亚单位,例如4-100个亚单位,比如4-80个亚单位,例如4 -60个亚单位,比如4-40个亚单位,例如4-20个亚单位,比如 4-18个亚单位,例如4-16个亚单位,比如4-14个亚单位,例 如4-12个亚单位,比如4-10个亚单位,例如4-9个亚单位, 比如4-8个亚单位,例如4-7个亚单位,比如4-6个亚单位, 例如4-5个亚单位,例如4个亚单位,比如5-100个亚单位, 比如5-80个亚单位,例如5-60个亚单位,比如5-40个亚单 位,例如5-20个亚单位,比如5-18个亚单位,例如5-16个 亚单位,比如5-14个亚单位,例如5-12个亚单位,比如5-10 个亚单位,例如5-9个亚单位,比如5-8个亚单位,例如5-7个 亚单位,比如5-6个亚单位,比如5个亚单位,例如6-100个 亚单位,比如6-80个亚单位,例如6-60个亚单位,比如6-40 个亚单位,例如6-20个亚单位,比如6-18个亚单位,例如6- 16个亚单位,比如6-14个亚单位,例如6-12个亚单位,比如6 -10个亚单位,例如6-9个亚单位,比如6-8个亚单位,例如6 -7个亚单位,比如6个亚单位,比如7-100个亚单位,比如7 -80个亚单位,例如7-60个亚单位,比如7-40个亚单位,例如 7-20个亚单位,比如7-18个亚单位,例如7-16个亚单位,比 如7-14个亚单位,例如7-12个亚单位,比如7-10个亚单位, 例如7-9个亚单位,比如7-8个亚单位,比如7个亚单位,例如 8-100个亚单位,比如8-80个亚单位,例如8-60个亚单位, 比如8-40个亚单位,例如8-20个亚单位,比如8-18个亚单 位,例如8-16个亚单位,比如8-14个亚单位,例如8-12个 亚单位,比如8-10个亚单位,例如8-9个亚单位,例如8个亚 单位,比如9-100个亚单位,比如9-80个亚单位,例如9-60个 亚单位,比如9-40个亚单位,例如9-20个亚单位,比如9-18 个亚单位,例如9-16个亚单位,比如9-14个亚单位,例如9- 12个亚单位,比如9-10个亚单位,比如9个亚单位,例如10- 100个亚单位,比如10-80个亚单位,例如10-60个亚单位,比 如10-40个亚单位,例如10-20个亚单位,比如10-18个亚单 位,例如10-16个亚单位,比如10-14个亚单位,例如10-12个 亚单位,比如10个亚单位,比如11-100个亚单位,比如11-80 个亚单位,例如11-60个亚单位,比如11-40个亚单位,例如11 -20个亚单位,比如11-18个亚单位,例如11-16个亚单位, 比如11-14个亚单位,例如11-12个亚单位,比如12-100个 亚单位,比如12-80个亚单位,例如12-60个亚单位,比如12 -40个亚单位,例如12-20个亚单位,比如12-18个亚单位, 例如12-16个亚单位,比如12-14个亚单位,例如13-100个 亚单位,比如13-80个亚单位,例如13-60个亚单位,比如13 -40个亚单位,例如13-20个亚单位,比如13-18个亚单位, 例如13-16个亚单位,比如13-14个亚单位,例如14-100个 亚单位,比如14-80个亚单位,例如14-60个亚单位,比如14 -40个亚单位,例如14-20个亚单位,比如14-18个亚单位, 例如14-16个亚单位,比如15-100个亚单位,比如15-80个 亚单位,例如15-60个亚单位,比如15-40个亚单位,例如15 -20个亚单位,比如15-18个亚单位,例如15-16个亚单位, 比如16-100个亚单位,比如16-80个亚单位,例如16-60个 亚单位,比如16-40个亚单位,例如16-20个亚单位,比如16 -18个亚单位,例如17-100个亚单位,比如17-80个亚单位, 例如17-60个亚单位,比如17-40个亚单位,例如17-20个亚 单位,比如17-18个亚单位,例如18-100个亚单位,比如18- 80个亚单位,例如18-60个亚单位,比如18-40个亚单位,例 如18-20个亚单位,比如19-100个亚单位,比如19-80个亚 单位,例如19-60个亚单位,比如19-40个亚单位,例如19- 30个亚单位,比如19-25个亚单位,例如20-100个亚单位,比 如20-80个亚单位,例如20-60个亚单位,比如20-40个亚单 位,例如20-30个亚单位,比如20-25个亚单位组成。
90.权利要求89的方法,其中每个亚单位包括或者基本上由核苷 酸或者核苷酸类似物组成。
91.权利要求90的方法,其中每个亚单位包括或者基本上由核苷 酸组成。
92.权利要求91的方法,其中核苷酸是包含从腺嘌呤(A),胸腺 嘧啶(T),鸟嘌呤(G),和胞嘧啶(C)中选择的碱基的脱氧核糖核酸。
93.权利要求91的方法,其中核苷酸是包含从腺嘌呤(A),尿嘧 啶(U),鸟嘌呤(G),和胞嘧啶(C)中选择的碱基的核糖核酸。
94.权利要求91的方法,其中每个核苷酸通过共价键与相邻的核 苷酸,或者核苷酸类似物连接。
95.权利要求91的方法,其中每个核苷酸通过共价键与每个相邻 的核苷酸,或者核苷酸类似物连接。
96.权利要求94的方法,其中所述的共价键从由磷酸二酯键,硫 代磷酸酯键和肽键组成的组中选择。
97.权利要求90的方法,其中至少一些所述的核苷酸从由核苷酸 衍生物组成的组中选择。
98.权利要求97的方法,其中核苷酸衍生物从由脱氧核糖核酸衍 生物和核糖核酸衍生物组成的组中选择。
99.权利要求90的方法,其中互补元件亚单位选自核苷酸,核苷 酸衍生物和核苷酸类似物,其中一个或者多个碱基部分和/或磷酸酯 部分和/或核糖部分和/或脱氧核糖部分已被替换分子实体所替代。
100.权利要求99的方法,其中能与所述互补元件亚单位相互作 用的编码元件亚单位包括或者基本上由从由DNA,RNA,PNA,LNA以及 morpholinos序列,包括其任何类似物或者衍生物,组成的组中选择 的核苷酸组成。
101.权利要求93的方法,其中每个核苷酸衍生物通过共价化学 键与相邻的核苷酸,或者核苷酸类似物连接。
102.权利要求93的方法,其中每个核苷酸衍生物通过共价化学 键与每个相邻的核苷酸,或者核苷酸类似物连接。
103.权利要求97和98任一项的方法,其中所述的共价化学键从 由磷酸二酯键,硫代磷酸酯键和肽键组成的共价键组中选择。
104.权利要求1的方法,其中互补元件从核苷酸中选择,并且互 补元件通过酶促反应连接。
105.根据权利要求100的方法,其中酶选自依赖模板的DNA聚合 酶和RNA聚合酶,包括逆转录酶,DNA-连接酶和RNA-连接酶,核酶 和脱氧核酶,包括HIV-1逆转录酶,AMV逆转录酶,T7 RNA聚合酶, T7 RNA聚合酶突变体Y639F,测序酶,Taq DNA聚合酶,Klenow片 断(DNA聚合酶I的大片段),DNA-连接酶,T7 DNA聚合酶,T4 DNA 聚合酶,T4 DNA连接酶,大肠杆菌RNA聚合酶,rTh DNA聚合酶, Vent DNA聚合酶,Pfu DNA聚合酶,Tte DNA聚合酶,修复聚合酶, 和有连接酶或者复制酶活性的核酶。
106.权利要求105的方法,其中酶选自HIV-1逆转录酶,AMV 逆转录酶,T7 RNA聚合酶,T7 RNA聚合酶突变体Y639F,测序酶, Taq DNA聚合酶,Klenow片断(DNA聚合酶I的大片段),DNA连接 酶,T7 DNA聚合酶,T4 DNA聚合酶和T4 DNA连接酶。
107.权利要求104-106任一项的方法,其中核苷酸在掺入后形 成互补模板。
108.根据权利要求104-107任一项的方法,其中引物退火至模 板上的引发位点,并且通过掺入构件,适当的聚合酶或者转录酶使引 物延伸以获得互补模板。
109.根据权利要求108的方法,其中构件是单核苷酸、双核苷酸、 或者寡核苷酸的衍生物。
110.根据权利要求109的方法,其中构件是单核苷酸的衍生物。
111.根据权利要求109-110任一项的方法,其中功能实体通过 接头连附在核酸碱基部分上。
112.根据权利要求107的方法,其中接头包括三键。
113.根据权利要求108-112任一项的方法,其中设计构件以便 当其掺入至互补模板中时,功能实体可突进核酸螺旋的大沟。
114.根据权利要求104-106任一项的方法,其中互补元件从寡 核苷酸中选择,并且互补元件用连接酶通过酶促反应连接。
115.根据权利要求114的方法,其中每个互补元件寡核苷酸包括 三个或者更多的核酸单体
116.根据权利要求115的方法,其中互补元件是包括4-100个 核酸单体的寡核苷酸。
117.根据权利要求1的方法,其中互补元件与编码元件退火,而 不与另一互补元件偶联。
118.根据权利要求117的方法,其中互补元件包括有6-100个 核苷酸单体的寡核苷酸。
119.根据权利要求119的方法,其中寡核苷酸包括10-50个核 苷酸单体。
120.根据权利要求114-119任一项的方法,其中长度至少是互 补元件长度的一半。
121.根据权利要求114-120任一项的方法,其中接头包括寡核 苷酸。
122.根据权利要求118-121任一项的方法,其中寡核苷酸互补 元件和寡核苷酸接头是连续的寡核苷酸。
123.根据权利要求121-122任一项的方法,其中不同构件的两 个接头各包括分子对的一部分,而所述分子对能够可逆地相互作用。
124.根据权利要求123的方法,其中分子对包括在接头上形成二 聚化区域的核酸双链序列。
125.根据权利要求123或124的方法,其中接头的二聚化区域部 分处于功能实体近侧。
126.根据权利要求124或125的方法,其中形成分子对一部分的 核酸单体的序列与功能实体之间间隔2、1或0个核酸单体。
127.根据权利要求126的方法,其中功能实体直接连附在二聚化 区域上。
128.根据权利要求123-127任一项的方法,其中核酸单体的序 列包括3-20个单核酸(mononuleic acids)。
129.根据权利要求128的方法,其中的序列包括3-15个核酸单 体。
130.根据权利要求129的方法,其中的序列包括4-12个核酸单 体。
131.根据权利要求114-130任一项的方法,其中功能实体连附 在寡核苷酸接头的核酸碱基上。
132.根据权利要求131的方法,其中功能实体连附在接头的末端 核苷酸上。
133.权利要求1的方法,其中互补元件从核苷酸中选择,并且互 补元件通过使用化学试剂,pH值变化,光,催化剂,辐射,比如电磁 辐射而连接,或者当彼此发生反应性接触时通过自发偶联而连接。
134.根据权利要求133的方法,其中化学试剂包括 phosphoimidazolid基团。
135.根据权利要求133和134的方法,其中phosphoimidazolid基 团连附在构件的5’末端,并且构件在其3’羟基处和新生互补模板相连。
136.权利要求1的方法,其中至少有一个所述多个构件的亚组优 选包括一个互补元件和/或一个功能实体和/或一个接头。
137.权利要求1的方法,其中所述多个构件的一个亚组包括将功 能实体和互补元件分隔的选择性可断裂接头,其中在导致将不属于含 有选择性可断裂接头的构件亚组的构件的功能实体和互补元件分隔的 可断裂接头断裂的条件下,所述选择性可断裂接头不会断裂。
138.根据权利要求102的方法,其中功能实体通过断裂可断裂接 头得以释放,使得功能实体上没有接头的痕迹。
139.权利要求137或138的方法,其中可断裂接头被断裂,至少 一个选择性可断裂接头没有被断裂,并且模控分子通过所述的至少一 个选择性可断裂接头与模板和/或互补元件连接。
140.权利要求138-139的方法,其中接头被酸、碱、化学试剂、 光、电磁辐射、酶、或者催化剂断裂。
141.根据权利要求140的方法,其中被光断裂的接头含有硝基苯 基部分。
142.权利要求1的方法,其中接头或者选择性可断裂接头的长度 范围是从约0.8_至约70_,比如从0.8_至约60_,例如从0.8_ 至约50_,比如从0.8_至约40_,例如从0.8_至约30_,比如 从0.8_至约25_,例如从0.8_至约20_,比如从0.8_至约18_, 例如从0.8_至约16_,比如从0.8_至约14_,例如从0.8_至 约12_,比如从0.8_至约10_,例如从0.8_至约8_,比如从 0.8_至约7_,例如从0.8_至约6_,比如从0.8_至约5_,例 如从0.8_至约4_,比如从0.8_至约3.5_,例如从0.8_至约 3.0_,比如从0.8_至约2.5_,例如从0.8_至约2.0_,比如从 0.8_至约1.5_,例如从0.8_至约1.0_。
143.权利要求1的方法,其中接头或者选择性可断裂接头的长度 范围是从约1_至约60_,比如从1_至约40_,例如从1_至约 30_,比如从1_至约25_,例如从1_至约20_,比如从1_至约 18_,例如从1_至约16_,比如从1_至约14_,例如从1_至约 12_,比如从1_至约10_,例如从1_至约8_,比如从1_至约 7_,例如从1_至约6_,比如从1_至约5_,例如从1_至约4_, 比如从1.0_至约3.5_,例如从1.0_至约3.0_,比如从1.0_ 至约2.5_,例如从1.0_至约2.0_,比如从1.0_至约1.5_,例 如从1.0_至约1.2_。
144.权利要求1的方法,其中接头或者选择性可断裂接头的长度 范围是从约2_至约40_,比如从2_至约30_,比如从2_至约 25_,例如从2_至约20_,比如从2_至约18_,例如从2_至约 16_,比如从2_至约14_,例如从2_至约12_,比如从2_至约 10_,例如从2_至约8_,比如从2_至约7_,例如从2_至约6 _,比如从2_至约5_,例如从2_至约4_,比如从2.0_至约3.5_, 例如从2.0_至约3.0_,比如从2.0_至约2.5_,例如从2.0_ 至约2.2_。
145.权利要求1的方法,其中接头或者选择性可断裂接头的长度 范围是从约4_至约40_,比如从4_至约30_,比如从4_至约 25_,例如从4_至约20_,比如从4_至约18_,例如从4_至约 16_,比如从4_至约14_,例如从4_至约12_,比如从4_至约 10_,例如从4_至约8_,比如从4_至约7_,例如从4_至约6 _,比如从4_至约5_。
146.权利要求1的方法,其中接头或者选择性可断裂接头的长度 范围是从约6_至约40_,比如从6_至约30_,比如从6_至约 25_,例如从6_至约20_,比如从6_至约18_,例如从6_至约 16_,比如从6_至约14_,例如从6_至约12_,比如从6_至约 10_,例如从6_至约8_,比如从6_至约7_。
147.权利要求1的方法,其中接头或者选择性可断裂接头的长度 范围是从约8_至约40_,比如从8_至约30_,比如从8_至约 25_,例如从8_至约20_,比如从8_至约18_,例如从8_至约 16_,比如从8_至约14_,例如从8_至约12_,比如从8_至约 10_。
148.根据权利要求1的方法,其中获得的模控分子含有共价连接 的官能团的序列,通过涉及反应基团的反应,将至少一个功能实体的 官能团和相邻功能实体的官能团连接。
149.根据权利要求1-148任一项的方法,其中模控分子是官能 团的线性序列。
150.根据权利要求1-148任一项的方法,其中模控分子是官能 团的支化的序列。
151.根据权利要求1-148任一项的方法,其中模控分子是官能 团的环状序列。
152.权利要求1的方法,其中模控分子是含有至少一个重复官能 团序列的寡聚体或者多聚体。
153.权利要求152的方法,其中至少三个官能团的序列在模控分 子中被重复至少两次。
154.权利要求152的方法,其中任何至少三个官能团的序列在模 控分子中只出现一次。
155.权利要求1的方法,其中模控分子包括或者基本上由从由α -氨基酸,β-氨基酸,γ-氨基酸,ω-氨基酸组成的组中选择的氨基 酸组成。
156.权利要求1的方法,其中模控分子包括或者基本上由天然氨 基酸残基组成。
157.权利要求1的方法,其中模控分子包括或者基本上由α-氨 基酸组成。
158.权利要求1的方法,其中模控分子包括或者基本上由单取代 的α-氨基酸组成。
159.权利要求1的方法,其中模控分子包括或者基本上由双取代 的α-氨基酸组成。
160.权利要求1的方法,其中模控分子包括或者基本上由单取代 的β-氨基酸组成。
161.权利要求1的方法,其中模控分子包括或者基本上由双取代 的β-氨基酸组成。
162.权利要求1的方法,其中模控分子包括或者基本上由三取代 的β-氨基酸组成。
163.权利要求1的方法,其中模控分子包括或者基本上是由四取 代的β-氨基酸组成。
164.权利要求115-118任一项的方法,其中所述的β-氨基酸的 主链结构包括或者基本上由环己烷-主链和/或环戊烷-主链组成。
165.权利要求1的方法,其中模控分子包括或者基本上是由γ- 氨基酸组成。
166.权利要求1的方法,其中模控分子包括或者基本上是由ω- 氨基酸组成。
167.权利要求1的方法,其中模控分子包括或者基本上是由插烯 氨基酸组成。
168.权利要求1的方法,其中模控分子包括或者基本上是由N- 取代的甘氨酸组成。
169.权利要求1的方法,其中模控分子包括或者基本上由分子或 分子实体组成,所述分子或分子实体选自α-肽,β-肽,γ-肽,ω -肽,单-、双-、和三-取代的α-肽,β-肽,γ-肽,ω-肽, 其中的氨基酸残基是L型或者D型的肽,插烯多肽,糖多肽,聚酰胺, 插烯氨磺酰肽,聚磺酰胺,含有例如辅基的缀合肽,聚酯,多糖,聚 氨基甲酸酯类,聚酸酯,聚脲,聚肽基膦酸酯,聚氨酯,azatides, 寡聚N-取代的甘氨酸,聚醚,乙氧基甲缩寡聚体,聚硫醚,聚乙 二醇(PEG),聚烯类,聚二硫化物,聚亚芳基硫醚,多核苷酸,PNAs, LNAs,morpholinos,寡聚吡咯啉,聚肟,聚亚胺,聚乙烯亚胺类, 聚酰亚胺,聚缩醛,聚醋酸酯,聚苯乙烯类,聚乙烯,脂类,磷脂, 糖脂,包括例如脂族或芳族环的多环化合物,包括多杂环化合物,蛋 白聚糖,和聚氧烷,包括它们的任何组合。
170.权利要求1的方法,其中模控分子的相邻残基通过化学键连 接,所述化学键选自肽键,磺酰胺键,酯键,糖键,氨基甲酸酯键, 碳酸酯键,脲键,膦酸酯键,氨基甲酸乙酯键,azatide键,peptoid 键,醚键,乙氧基键,硫醚键,单碳键,双重碳键,三重碳键,二硫 键,硫键,磷酸二酯键,肟键,亚胺键,酰亚胺键,包括它们的任何 组合。
171.根据权利要求170的方法,其中连接两个或者更多构件的功 能实体的化学键是通过第一功能实体的亲核基团与另一功能实体的酯 或硫酯之间的反应而形成。
172.根据权利要求171的方法,其中带有硫酯基团的构件的接头 在键形成的同时发生断裂,导致官能团转移到亲核构件上。
173.根据权利要求171和172的方法,其中亲核基团从-NH2、 H2NHN-、HOHN-、H2N-C(O)-NH-中选择。
174.权利要求1的方法,其中所述摸控分子的主链结构包括或者 基本由从-NHN(R)CO-;-NHB(R)CO-;-NHC(RR’)CO-;-NHC(=CHR)CO-; -NHC6H4CO-;-NHCH2CHRCO-;-NHCHRCH2CO-;-COCH2-;-COS-; -CONR-;-COO-;-CSNH-;-CH2NH-;-CH2CH2-;-CH2S-; -CH2SO-;-CH2SO2-;-CH(CH3)S-;-CH=CH-;-NHCO-;-NHCONH-; -CONHO-;-C(=CH2)CH2-;-PO2-NH-;-PO2-CH2-;-PO2-CH2N+-; -SO2NH--;和内酰胺中选择的分子基团组成。
175.权利要求1的方法,其中功能实体是从由α-氨基酸前体,β -氨基酸前体,γ-氨基酸前体和ω-氨基酸前体组成的前体组中选择。
176.权利要求175的方法,其中β-氨基酸前体是N-羧酸酐环结 构衍生物。
177.权利要求171的方法,其中β-氨基酸前体是硫代羧酸酐 (NTA)环结构衍生物。
178.根据权利要求1的方法,其中至少一个功能实体的官能团通 过桥接分子和另一功能实体连接。
179.根据权利要求178的方法,其中所述功能实体是相邻的。
180.权利要求1的方法,其中模控分子包括或者基本上是由至少 2个不同的官能团,比如至少3个不同的官能团,例如至少4个不同 的官能团,比如至少5个不同的官能团,例如至少6个不同的官能团, 比如至少7个不同的官能团,例如至少8个不同的官能团,比如至少 9个不同的官能团,例如至少10个不同的官能团,比如多于10个不 同的官能团组成。
181.权利要求180的方法,其中官能团是相同的。
182.权利要求1的方法,其中每个构件包括至少一个I型反应基 团。
183.根据权利要求1的方法,其中每个构件包括至少一个II型 反应基团。
184.权利要求182的方法,其中每个构件包括两个I型反应基团。
185.权利要求183的方法,其中每个构件包括两个II型反应基 团。
186.根据权利要求185的方法,其中至少一个构件包括三个或更 多,比如四个或更多个II型反应基团。
187.根据权利要求185或186的方法,其中II型反应基团是相 似的。
188.根据权利要求185或186的方法,其中II型反应基团是反 应配偶体。
189.根据权利要求187或188的方法,其中II型反应基团能够 通过桥接分子在官能团之间形成连键。
190.根据权利要求189的方法,其中桥接分子是双官能化合物, 它带有的反应基团是功能实体的II型反应基团的反应配偶体。
191.根据权利要求185的方法,其中II型反应基团是不相似的。
192.根据权利要求191的方法,其中不相似的II型反应基团是 反应配偶体。
193.根据权利要求191或192的方法,其中II型反应基团能够 通过桥接分子在官能团之间形成连键。
194.根据权利要求191的方法,其中桥接分子是双官能化合物, 它带有的反应基团是功能实体的II型反应基团的反应配偶体。
195.权利要求182-194任一项的方法,其中功能实体的至少一 个II型反应基团从由N-羧酸酐(NCA),N-硫代羧酸酐(NTA), 香豆素,胺,羧酸,酮,醛,羟基,硫醇,酯,硫酯,链烯基,任何 双键共轭体系,肼,N-羟基琥珀酰亚胺酯,和环氧化物组成的组中选 择。
196.权利要求178到190的方法,其中II型反应基团是亲电子 试剂。
197.根据权利要求191的方法,其中II型反应基团是从由 -X-C(O)-R,-X-C(O)-CHR-C(O)-R,-X-C(O)-CR=CH-R,和 -X-C(O)-CHR-NHR组成的组中选择的亲电子试剂,其中X是S或O,而 R独立地是官能团。
198.权利要求183到195的方法,其中II型反应基团是亲核试 剂。
199.根据权利要求198的方法,其中II型反应基团是从由-NH2, H2NHN-,HOHN-,和H2N-C(O,S)-NH-组成的组中选择的亲核试剂。
200.权利要求183-195的方法,其中II型反应基团是自由基。
201.根据前述权利要求任一项的方法,其中功能实体包括与接头 连附的II型反应基团。
202.根据权利要求201的方法,其中所述功能实体进一步包括至 少一个另外的II型反应基团。
203.根据权利要求202的方法,其中所述包括至少一个另外的II 型反应基团的功能实体能够与第二功能实体通过涉及所述的另一功能 实体上II型反应基团的反应形成连接,其中第二个功能实体具有插入 在该功能实体和接头之间的II型反应基团。
204.根据权利要求203的方法,其中第二功能实体和接头间的连 接被断裂,导致第二功能实体的官能团移位到第一功能实体上。
205.根据权利要求201-204任一项的方法,其中第一功能实体 和第二功能实体间的连键是通过各自的II型反应基团的直接反应形 成的。
206.根据权利要求201-204任一项的方法,其中第一功能实体 和第二功能实体间的连键是通过桥接分子形成的。
207.根据前述权利要求任一项的方法,其中多个官能团是通过涉 及多个构件的反应级联而连接。
208.根据权利要求201-207任一项的方法,其中多个官能团通 过涉及多个构件的反应级联而连接,其中每个所述构件包括含有与接 头连接的第一II型反应基团的功能实体,该功能实体包括至少一个另 外的II型反应基团。
209.根据前述权利要求任一项的方法,其中所述功能实体就旋转 而言是受限的,以便在与其它功能实体形成连键的过程中获得优选的 定向。
210.根据权利要求209的方法,其中连接功能实体和互补元件的 一个或更多的键就旋转而言是固定的。
211.根据权利要求209-210任一项的方法,其中优选的定向通 过将功能实体与核苷酸构件的碱基及(脱氧)核糖部分偶联而获得。
212.根据权利要求209-211任一项的方法,其中功能实体和双 核苷酸的两个碱基偶联。
213.根据前述权利要求任一项的方法,其中模控分子的形成涉及 能够通过阴离子、阳离子、或自由基聚合而形成多聚体的II型反应基 团。
214.根据前述权利要求任一项的方法,包括含有一个或多个II 型反应基团的支架结构功能实体,所说的支架结构功能实体是用于通 过来自多个构件的官能团的加入而形成模控分子的基本化学结构。
215.根据权利要求2014的方法,其中支架结构功能实体包括两 个或者更多的II型反应基团。
216.根据权利要求214或215的方法,其中支架结构功能实体与 模板共价连接。
217.根据权利要求214至215任一项的方法,其中支架结构功能 实体与能够识别模板编码元件的互补元件连接。
218.根据权利要求214-217任一项的方法,其中连附在模板上 的构件包含携带有能与支架结构功能实体形成连接的II型反应基团 的功能实体。
219.根据权利要求214-218任一项的方法,其中官能团与支架 结构功能实体连接的混乱是通过使支架结构功能实体上带有与所述多 个构件的功能实体上的II型反应基团数目不同数目的II型反应基团 获得的。
220.根据权利要求214-219任一项的方法,其中支架结构上的 II型反应基团与构件上的相应II型反应基团之间的反应导致了在官 能团与支架结构功能实体连接的同时,连接功能实体与互补元件的接 头发生断裂。
221.根据前述权利要求任一项的方法,其中使用了多个具有不同 编码元件和/或不同编码元件次序的模板。
222.根据权利要求221的方法,其中使用了两个或更多的不同模 板。
223.根据权利要求221或222的方法,其中用到四个或更多的不 同模板,比如多于103,105,107,109,1011,1013,1015,1017个不同 的模板。
224.根据权利要求221的方法,其中所述多个不同模板产生了不 同模控分子的文库,而每个所述模控分子与模控合成了该分子的特异 的模板或者互补模板相连接。
225.根据前述权利要求的任一项的方法,进一步包括从模控分子 中释放模板或互补模板,并获得不与模控该模控分子合成的互补模板 或模板连接的模控分子的步骤。
226.可根据权利要求1-225任一项获得的模控分子,多个共价 连接的各自含有残基的官能团,其中共价连接的残基能够产生多聚体, 该多聚体独有地、或者与附加部分结合起来,包括至少一个从由α-肽, β-肽,γ-肽,ω-肽,单-、双-、和三-取代的α-肽,β-肽,γ -肽,ω-肽,其中的氨基酸残基是L型或者D型的肽,插烯多肽, 糖多肽,聚酰胺,插烯氨磺酰肽,聚磺酰胺,含有例如辅基的缀合肽, 聚酯,多糖,聚氨基甲酸酯,聚碳酸酯,聚脲,聚肽基膦酸酯,聚氨 酯,azatides,寡聚N-取代的甘氨酸,聚醚,乙氧基甲缩醛寡聚体, 聚硫醚,聚乙二醇(PEG),聚烯烃类,聚二硫化物,聚亚芳基硫醚,多 核苷酸,PNAs,LNAs,morpholinos,寡聚吡咯啉酮,聚肟,聚亚胺, 聚乙烯亚胺类,聚酰亚胺,聚缩醛,聚醋酸酯,聚苯乙烯类,聚乙烯, 脂类,磷脂,糖脂,包括例如脂族或芳族环的多环化合物,包括多杂 环化合物,蛋白聚糖,和聚硅氧烷组成的多聚体部分的组中选择的部 分,其中所述多个残基优选是2-200个,例如2-100个,比如2- 80个,例如2-60个,比如2-40个,例如2-30个,比如2-20个, 例如2-15个,比如2-10个,比如2-8个,例如2-6个,比如2 -4个,例如2个,比如3-100个,例如3-80个,比如3-60个, 比如3-40个,例如3-30个,比如3-20个,比如3-15个,例如 3-15个,比如3-10个,比如3-8个,例如3-6个,比如3-4个, 例如3个,比如4-100个,例如4-80个,比如4-60个,比如4 -40个,例如4-30个,比如4-20个,比如4-15个,例如4-10 个,比如4-8个,比如4-6个,例如4个,例如5-100个,比如5 -80个,例如5-60个,比如5-40个,例如5-30个,比如5-20 个,例如5-15个,比如5-10个,比如5-8个,例如5-6个,例 如5个,比如6-100个,例如6-80个,比如6-60个,比如6-40 个,例如6-30个,比如6-20个,比如6-15个,例如6-10个, 比如6-8个,比如6个,例如7-100个,比如7-80个,例如7- 60个,比如7-40个,例如7-30个,比如7-20个,例如7-15个, 比如7-10个,比如7-8个,例如7个,例如8-100个,比如8- 80个,例如8-60个,比如8-40个,例如8-30个,比如8-20个, 例如8-15个,比如8-10个,比如8个,例如9个,例如10-100 个,比如10-80个,例如10-60个,比如10-40个,例如10-30 个,比如10-20个,例如10-15个,比如10-12个,比如10个, 例如12-100个,比如12-80个,例如12-60个,比如12-40个, 例如12-30个,比如12-20个,例如12-15个,比如14-100个, 比如14-80个,例如14-60个,比如14-40个,例如14-30个, 比如14-20个,例如14-16个,比如16-100个,比如16-80个, 例如16-60个,比如16-40个,例如16-30个,比如16-20个, 比如18-100个,比如18-80个,例如18-60个,比如18-40个, 例如18-30个,比如18-20个,例如20-100个,比如20-80个, 例如20-60个,比如20-40个,例如20-30个,比如20-25个, 例如22-100个,比如22-80个,例如22-60个,比如22-40个, 例如22-30个,比如22-25个,例如25-100个,比如25-80个, 例如25-60个,比如25-40个,例如25-30个,比如30-100个, 例如30-80个,比如30-60个,例如30-40个,比如30-35个, 例如35-100个,比如35-80个,例如35-60个,比如35-40个, 例如40-100个,比如40-80个,例如40-60个,比如40-50个, 例如40-45个,比如45-100个,例如45-80个,比如45-60个, 例如45-50个,比如50-100个,例如50-80个,比如50-60个, 例如50-55个,比如60-100个,例如60-80个,比如60-70个, 例如70-100个,比如70-90个,例如70-80个,比如80-100个, 例如80-90个,比如90-100个。
227.根据权利要求226的模控分子,其中该模控分子是多聚体。
228.根据权利要求227的模控分子,其中多聚体是线性的。
229.根据权利要求227的模控分子,其中多聚体是支化的。
230.根据权利要求226或229的模控分子,其中共价连接的残基 能够产生多聚体,该多聚体独有地、或者与选自该组的附加部分结合 地包括至少一个从由α-肽,β-肽,γ-肽,ω-肽,单-、双-、 和三-取代的α-肽,β-肽,γ-肽,ω-肽,其氨基酸残基是L型 或者D型的多肽,和插烯多肽组成的多聚体部分的组中选择的部分。
231.根据权利要求226-230的模控分子,其中共价连接的残基 能够形成多糖。
232.根据权利要求226-231任一项的模控分子,包括官能团序 列,其中相邻的官能团通过非天然与所述官能团相联的分子部分连接。
233.包括共价连接的官能团的序列的模控分子,其中模控分子不 包括或不由α-肽或核苷酸组成。
234.包括共价连接的官能团的序列的模控分子,其中模控分子不 包括或不由单取代的α-肽或核苷酸组成。
235.包括共价连接的官能团的序列的模控分子,其中模控分子不 包括或不由肽或核苷酸组成。
236.根据权利要求221-224任一项制备的模控分子的组合物, 其中所述组合物包括多于或约103个的多个不同的模控分子,比如多 于或约104个不同的模控分子,例如多于或约105个不同的模控分 子,比如多于或约106个不同的模控分子,例如多于或约107个不同 的模控分子,比如多于或约108个不同的模控分子,例如多于或约109 个不同的模控分子,比如多于或约1010个不同的模控分子,例如多于 或约1011个不同的模控分子,比如多于或约1012个不同的模控分子, 例如多于或约1013个不同的模控分子,比如多于或约1014个不同 的模控分子,例如多于或约1015个不同的模控分子,比如多于或约 1016个不同的模控分子,例如多于或约1017个不同的模控分子,比如 多于或约1018个不同的模控分子。
237.根据权利要求236的组合物,其中所述多个模控分子从权利 要求226-235任一项所限定的模控分子中选择。
238.根据权利要求236和237任一项的组合物,其中所述的组合 物进一步包括能够模控合成每个模控分子或其亚组的模板。
239.根据权利要求238的组合物,其中模控分子和能模控合成该 模控分子的模板连接。
240.根据权利要求239的组合物,其中模控分子与模板共价连接。
241.根据权利要求239的组合物,其中模控分子与模板非共价连 接。
242.根据权利要求241的组合物,其中非共价连接涉及一个或多 个从由氢键,范德华键,和离子键组成的组中选择的键。
243.包含模控分子及模控了该模控分子合成的模板组成的复合 物。
244.根据权利要求236-242任一项的组合物,其中当模控分子 是α-肽时,模板不是天然的核苷酸。
245.根据权利要求236-242任一项的组合物,其中模控分子不 是天然存在的α-肽。
246.根据权利要求236-242任一项的组合物,其中模控分子不 是α-肽。
247.根据权利要求236-242的组合物,其中当模控分子是仅包 含单取代的α-氨基酸的肽时,模板不完全由天然核苷酸组成。
248.根据权利要求236-242的组合物,其中当模控分子是天然 的α-肽时,模板不是天然的核苷酸。
249.根据权利要求236-242的组合物,其中当模控分子是天然 的α-肽时,模板不是核苷酸。
250.根据权利要求236-242的组合物,其中当模控分子是单取 代的α-肽时,模板不是核苷酸。
251.根据权利要求236-242的组合物,其中当模控分子是α-肽 时,模板不是核苷酸。
252.根据权利要求236-242的组合物,其中当模控分子是肽时, 模板不是天然的核苷酸。
253.根据权利要求236-242的组合物,其中当模控分子是肽时, 模板不是核苷酸。
254.包括共价连接官能团的序列的模控分子,其中模控分子通过 接头与模控该模控分子合成的模板或者互补模板相连接,其中模控分 子不包括或者不由α-肽组成。
255.包括共价连接官能团的序列的模控分子,其中模控分子通过 接头与模控该模控分子合成的模板或者互补模板相连接,其中模控分 子不包括单取代的α-肽。
256.包括共价连接官能团的序列的模控分子,其中模控分子通过 接头与模控该模控分子合成的模板或者互补模板相连接,其中模控分 子不包括或者不由α-肽或核苷酸组成。
257.包括共价连接官能团的序列的模控分子,其中模控分子通过 接头与模控该模控分子合成的模板或者互补模板相连接,其中当模控 分子是α-肽时,模板不是天然的核苷酸。
258.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或者互补模板相连接,其中当模 控分子是仅包含单取代的α-氨基酸的肽时,模板不完全由天然核苷酸 组成。
259.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或者互补模板相连接,其中当模 控分子是天然的α-肽时,模板不是天然的核苷酸。
260.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或互补模板相连接,其中当模控 分子是天然的α-肽时,模板不是核苷酸。
261.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或者互补模板相连接,其中当模 控分子是单取代的α-肽时,模板不是核苷酸。
262.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或者互补模板相连接,其中当模 控分子是α-肽时,模板不是核苷酸。
263.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或者互补模板相连接,其中当模 控分子是肽时,模板不是天然的核苷酸。
264.包括共价连接的官能团的序列的模控分子,其中模控分子通 过接头与模控该模控分子合成的模板或者互补模板相连接,其中当模 控分子是肽时,模板不是核苷酸。
265.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子是包括至少一个重复的官能团序列的寡聚体和多聚体。
266.根据权利要求226-235和254-264任一项的模控分子,其 中在模控分子中至少三个官能团的序列重复了至少两次。
267.根据权利要求226-235和254-264任一项的模控分子,其 中在模控分子中至少三个官能团的任何序列只出现一次。
268.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子中包括或者基本上是由从由α-氨基酸、β-氨基酸、γ-氨 基酸、ω-氨基酸组成的组中选择的氨基酸组成。
269.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由天然的氨基酸残基组成。
270.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由α-氨基酸组成。
271.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由单取代的α-氨基酸组成。
272.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由双取代的α-氨基酸组成。
273.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由单取代的β-氨基酸组成。
274.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由双取代的β-氨基酸组成。
275.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由三取代的β-氨基酸组成。
276.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由四取代的β-氨基酸组成。
277.权利要求273-276任一项的模控分子,其中所述的β-氨基 酸的主链结构包括或者基本上由环己烷主链和/或环戊烷主链组成。
278.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由γ-氨基酸组成。
279.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由ω-氨基酸组成。
280.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由插烯氨基酸组成。
281.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上是由N-取代的甘氨酸组成。
282.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子包括或者基本上由分子或分子实体组成,所述分子或分子 实体选自α-肽,β-肽,γ-肽,ω-肽,单-、双-、和三-取代 的α-肽,β-肽,γ-肽,ω-肽,其氨基酸残基是L型或者D型的 肽,插烯多肽,糖多肽,聚酰胺,插烯氨磺酰肽,聚磺酰胺,含有例 如辅基的缀合肽,聚酯,多糖,聚氨基甲酸酯,聚碳酸酯,聚脲,聚 肽基膦酸酯,聚氨酯,azatides,寡聚N-取代的甘氨酸,聚醚,乙 氧基甲缩醛寡聚体,聚硫醚,聚乙二醇(PEG),聚烯烃类,聚二硫化物, 聚亚芳基硫醚,多核苷酸,PNAs,LNAs,morpholinos,寡聚吡咯啉酮, 聚肟,聚亚胺,聚乙烯亚胺类,聚酰亚胺,聚缩醛,聚醋酸酯,聚苯 乙烯类,聚乙烯,脂类,磷脂,糖脂,包括例如脂族或芳族环的多环 化合物,包括多杂环化合物,蛋白聚糖,和聚硅氧烷,包括它们的任 何组合。
283.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子的相邻残基通过化学键连接,所述化学键选自肽键,磺酰 胺键,酯键,糖键,氨基甲酸酯键,碳酸酯键,脲键,膦酸酯键,氨 基甲酸乙酯键,azatide键,peptoid键,醚键,乙氧基键,硫醚键, 单碳键,双重碳键,三重碳键,二硫键,硫键,磷酸二酯键,肟键, 亚胺键,酰亚胺键,胺,酰胺,包括它们的任何组合。
284.根据权利要求283的模控分子,其中模控分子不是α-肽。
285.根据权利要求226-235和254-264任一项的模控分子,其 中所述模控分子的主链结构包括或者基本上由分子基团组成,所述分 子基团选自-NHN(R)CO-;-NHB(R)CO-;-NHC(RR’)CO-; -NHC(=CHR)CO-;-NHC6 H4CO-;-NHCH2CHRCO-;-NHCHRCH2CO-; -COCH2-;-COS-;-CONR-;-COO-;-CSNH-;-CH2NH-;-CH2CH2-; -CH2S-;-CH2SO-;-CH2SO2-;-CH(CH3)S-;-CH=CH-;-NHCO-; -NHCONH-;-CONHO-;-C(=CH2)CH2-;-PO2-NH-;-PO2-CH2-; -PO2-CH2N+-;-SO2NH--;和内酰胺,包括其任何组合。
286.根据权利要求226-235和254-264任一项的模控分子,其 中前体是从由α-氨基酸前体,β-氨基酸前体,γ-氨基酸前体和ω- 氨基酸前体组成的前体组中选择。
287.根据权利要求219-226和240-250任一项的模控分子,其 中模控分子包括或者基本上是由至少2个不同的官能团,比如至少3 个不同的官能团,例如至少4个不同的官能团,比如至少5个不同的 官能团,例如至少6个不同的官能团,比如至少7个不同的官能团, 例如至少8个不同的官能团,比如至少9个不同的官能团,例如至少 10个不同的官能团,比如多于10个不同的官能团组成。
288.根据权利要求287的模控分子,其中官能团是相同的。
289.根据权利要求226-235和254-264任一项的模控分子,其 中模控分子可通过根据权利要求1-218任一项的方法获得。
290.包括共价连接的构件的序列的分子,其中共价连接的构件的 序列包括互补元件序列,所述互补元件形成能够和模控该模控分子合 成的模板互补的互补模板,其中模控分子和模控其合成的模板或互补 模板连接。
291.根据前述权利要求任一项的模控分子,其中模控分子包括含 有至少一个官能团和任选的至少一个II型反应基团的功能实体的序 列,并且其中每个功能实体和互补元件或模控该模控分子合成的模板 连接。
292.根据权利要求226-291的组合物,其中模控分子按照权利 要求1-225的方法制备,其中所说的模控分子与从由DNA,RNA,抗 体,肽,或蛋白,或它们的衍生物组成的组中选择的其它分子结合。
293.筛选可能具有预定活性的模控分子的方法,所述方法包括提 供靶分子或靶体,包括表面,并且获得对所述靶分子或靶体有亲和 或有作用的模控分子的步骤。
294.分析可能与模控分子相关的活性的方法,所述方法包括提供 靶分子或靶体,包括表面,并且获得对所述靶分子或靶体有亲和力或 有作用的模控分子,以及确定该模控分子的活性的步骤。
295.筛选有预定活性的复合物或模控分子的方法,所述方法包括 进行选择操作,并以预定的选择标准为基础选择模控分子的步骤。
296.筛选有预定活性的分子的组合物的方法,包括:
i)建立模控分子的第一组合物,所述分子如权利要求226-235和254 -290任一项所限定,或者由权利要求1-225任一项所限定的方法产 生,
ii)将第一组合物暴露于使所述第一组合物富集带有所述预定活性的 模控分子的条件下,并且
iii)任选地扩增所述富集的组合物的模控分子,获得第二组合物,
iv)进一步任选地重复步骤ii)-iii),并且
v)进一步获得具有更高比率的有特定预定活性的模控分子的组合物。
297.权利要求296的方法,进一步包括突变模控分子的步骤,其 中所述突变可发生在进行步骤iii)之前、同时或者之后。
298.权利要求297的方法,其中突变由随机突变或者定点突变实 现。
299.权利要求296的方法,其中步骤iii)包括101-1015倍扩增。
300.权利要求296的方法,其中步骤ii)和iii)被重复至少2, 3,5次,比如至少10次,比如至少15次。
301.权利要求296的方法,进一步包括鉴定有预定活性的模控分 子的步骤。
302.权利要求296的方法,其中鉴定通过分析与该分子物理地或 以其它方式结合的模板和/或互补模板而进行。
303.权利要求296的方法,其中所述富集组合物的条件包括提供 对所述有预定活性的模控分子的结合配偶体,所说的结合配偶体被直 接或间接地固定在载体上。
304.权利要求296的方法,其中富集组合物的条件涉及电泳分离, 凝胶过滤,免疫沉淀,等电聚焦,离心和固定中的任何一个或者多个。
305.权利要求296的方法,其中预定活性是酶活性或者催化活性。
306.权利要求296的方法,其中富集组合物的条件包括提供能够 使模控分子内在化、或者能与有预定活性的模控分子进行相互作用的 细胞。
307.扩增模控具有或潜在地具有预定活性的模控分子合成的模 板或者互补模板的方法,所述方法包括使该模板同扩增工具相接触, 并且扩增该模板的步骤。
308.扩增模控具有或潜在地具有预定活性的模控分子合成的模 板或者互补模板的方法,所述方法包括步骤i)使模板同扩增工具相接 触,并且扩增模板,和ii)获得至少增加两倍的量的模控分子。
309.改变模控分子序列的方法,包括产生含有官能团的新序列或 改变序列的模控分子,其中所述方法优选包括步骤:
i)提供能模控合成第一模控分子的第一模板或第一互补模板, 或多个这样的能模控合成多个第一模控分子的第一模板或第一互补模 板,
ii)对第一互补模板或第一模板,或多个第一互补模板或第一模 板的序列进行突变或修饰,并产生第二模板或第二互补模板,或多个 第二模板或第二互补模板,
其中所述第二模板或互补模板能够模控合成第二模控分子或多个 第二模控分子,
其中所述第二模控分子包括和第一模控分子的官能团序列不相同 的共价连接的官能团的序列,且任选地
iii)通过所说的第二模板或互补模板模控合成第二模控分子、或 多个这样的第二模控分子。
310.改变模控分子序列的方法,包括产生含有官能团的新序列或 改变序列的模控分子,其中所述方法优选包括步骤:
i)提供多个能模控合成多个第一模控分子的第一模板或第一互 补模板,
ii)将所述多个第一互补模板或第一模板的序列进行重组,并产 生第二模板或第二互补模板,或多个第二模板或第二互补模板,
其中所述第二模板或互补模板能够模控合成第二模控分子或多个
第二模控分子,
其中所述第二模控分子包括和第一模控分子的官能团序列不相同 的共价连接的官能团的序列,且任选地
iii)通过所述第二模板或互补模板模控合成第二模控分子或多个 这样的第二模控分子。
311.权利要求309和310任一项的方法,还包括扩增模控该模控 分子合成的模板或互补模板的步骤,其中所述扩增步骤发生在突变或 重组步骤之前、同时或者之后。
312.权利要求309-310的方法,其中突变通过定向突变、盒式 突变、化学突变、独特点消除(USE)、易错PCR、易错PCR改组完成。
313.权利要求309-310的方法,其中突变通过DNA改组或者包 括体内或体外的同源重组的任何一种重组形式完成。
314.一种构件,其包括
i)能够特异识别具有识别基团的编码元件的互补元件,其中所 述互补元件从核苷酸、氨基酸、抗体、抗原、蛋白、肽、和有识别核 苷酸能力的分子中选择,
ii)至少一个功能实体,其选自α-肽,β-肽,γ-肽,ω-肽, 单-、双-、和三-取代的α-肽,β-肽,γ-肽,ω-肽,其氨基 酸残基是L型或者D型的肽,插烯多肽,糖多肽,聚酰胺,插烯氨磺 酰肽,聚磺酰胺,含有例如辅基的缀合肽,聚酯,多糖,聚氨基甲酸 酯,聚碳酸酯,聚脲,聚肽基膦酸酯,聚氨酯,azatides,寡聚N- 取代的甘氨酸,聚醚,乙氧基甲缩醛寡聚体,聚硫醚,聚乙二醇(PEG), 聚烯烃类,聚二硫化物,聚亚芳基硫醚,多核苷酸,PNAs,LNAs, morpholinos,寡聚吡咯啉酮,聚肟,聚亚胺,聚乙烯亚胺类,聚酰亚 胺,聚缩醛,聚醋酸酯,聚苯乙烯类,聚乙烯,脂类,磷脂,糖脂, 包括例如脂族或芳族环的多环化合物,包括多杂环化合物,蛋白聚糖, 和聚硅氧烷的前体,和
iii)将功能实体和互补元件分隔的接头。
315.根据权利要求314的构件,其中互补元件选自核苷酸序列, 比如1-4个核苷酸,比如1-3个核苷酸,比如2个核苷酸或3个核 苷酸的序列。
316.根据权利要求314的构件,其中功能实体从氨基酸的前体中 选择,所述氨基酸选自α-氨基酸、β-氨基酸、γ-氨基酸、双取代氨 基酸、多取代氨基酸、插烯氨基酸、N-取代甘氨酸衍生物和其它修饰 的氨基酸。

说明书全文

发明的技术领域

生物系统允许模板指导合成α-肽。本发明的一种系统允许进行其它 种类的多聚体以及α-肽的模板指导的合成。本发明涉及模控分子 (templated molecule)和连接到预定模板的模控分子。模控分子包括 连接在一起的官能团的序列。每个官能团最初被连接到一个能与模板上 预定的编码元件互补的元件上。在一个编码元件互补或多个编码元件互 补后,附加的官能团得以连接,并且模控分子得以形成。

背景

生物学的中心法则描述了信息流是一种从DNA到RNA再到多肽的单向 过程。因此,DNA被RNA聚合酶转录成mRNA,接着mRNA随后被核糖体和 tRNA翻译成蛋白质

DNA和蛋白质之间的直接联系,即三连体密码子的序列限定了多肽中 α-基酸残基的序列的事实,使大量分子生物学方法得以发展,其中 实验人员操纵DNA(诱变、重组、缺失、插入等),然后利用体内系统(例 如微生物)或者体外系统(例如Zubay体外表达系统)将发生的改变从 DNA平传递到模控多肽(templated polypeptide)水平,即使多肽发 生突变、重组、缺失、插入等。

已经发明了几种允许信息从多肽流向DNA的系统。这些系统是噬菌体 展示、核糖体/多核糖体展示、质粒表面肽展示以及其它系统。这些系 统在模板(例如DNA)和模控分子(多肽)之间引入一种物理连接。结果, 有可能从连接在作为该分子合成模板的模板上的模控分子的群体,首先 对有预期特性的模控分子进行富集(例如将模控分子结合到亲和柱上), 接着通过扩增它的模板(DNA或RNA)扩增富集的模控分子群,随后翻译 扩增的模板。这些方法已被用于从由百万到大约1015个多肽所构成的文 库中鉴定具有新的和/或改良特性的多肽。

现有技术中系统的关键特性是模控分子通过扩增其模板的可扩增性。 因此,在富集具有预期特性分子的选择步骤之后,富集的分子群体可以 被扩增,接着被带到下一个选择步骤,等等,这种选择和扩增的过程可 以被重复许多次。在这种方式中,经过几轮选择和扩增,选择试验的“噪 音”被均化了,并且即使单次选择步骤仅仅富集了例如10倍,经过12 次的选择和扩增,理论上能够富集到1012倍。如果这些分子是不可以扩 增的,相同的富集将不得不在单个筛选步骤中完成,这意味着在这一个 步骤中富集必须是1012,而且该试验将仍要具有相同总体严谨性(精确 性)。这实际上用现有技术是不可能的。

在化学领域,发展了一种不同的组合方法。这种方法包括在阵列(其 中每个位置限定一种特异性化合物)中或珠子上(其中每个珠子上携带 多拷贝的相同化合物)平行合成数以百万计的相关化合物。这群化合物 接着用于筛选预期的特性。重要地是,这种类型的组合文库无法扩增, 正如上面所述,因此需要使用非常严谨的筛选方法。最近,例如在药物 化学领域,已经因而倾向于使用变化更少但表征更佳的文库。

也已经发展了标记化学文库的原则。例如,如本文下面举例说明的, 已经发展了使用DNA寡核苷酸标记分子文库的系统。这种标签被用作为 鉴定手段,但不能被用来作为该标记分子合成的模板。因此,尽管具有 这种标签,这些系统仍然需要非常有效的筛选方法。

下面列举的参考文献举例说明了上面提到的本发明领域中现有技术 方法的一些缺点。

EP 0 604 552 B1涉及合成各种各样寡聚体集合的方法。该发明涉及 利用标识标签鉴定寡聚体中的单体序列。这种标识标签便于随后反应的 鉴定,通过这个反应不同合成化合物的文库成员以一个组分接着一个组 分的方式得以合成。

EP 0 643 778 B1涉及编码的组合化学文库。多肽集合中的每种多肽 用附加的“遗传”标签作标记,标签本身通过化学合成构建,用以提供 一种说明每种多肽的“反向遗传学的”方法。

EP 0 773 227 A1涉及制备新的药剂学药物或诊断试剂的方法,其包 括对配体或受体筛选以一个组分接着一个组分的方式合成得到的不同合 成化合物文库的步骤。

US 4,863,857涉及测定与原始肽或蛋白质至少一部分互补的多肽的 氨基酸序列的方法。一方面这种方法包括:(a)测定第一个核酸的第一个 核苷酸序列,其中核酸编码生物合成原始肽或蛋白质的至少一部分;(b) 确定第二个核酸的第二个核苷酸序列,其中核酸与第一个核酸的第一个 核苷酸序列配对,第一个和第二个核酸在反平行方向上配对;和(c) 当与第一个核苷酸以相同的阅读框读码时,通过第二个核苷酸序列决定 互补多肽的氨基酸序列。

US 5,162,218涉及多肽组合物,其具有特定靶配体的特异性结合位 点,并进而具有邻近结合位点的活性官能度(functionality)。活性官 能度可以是报告分子,在这种情况下多肽组合物可用于进行靶配体的分 析。也公开了制备具有邻近其结合位点的活性官能度的多肽的方法,所 说的方法包括将对靶配体特异性的多肽与连附有反应基团的亲和标记结 合的步骤。反应基团接着共价连附到邻近结合位点的氨基酸侧链上,并 且从底物中断裂。底物随后被洗脱,留下共价连附到多肽上的反应基团 部分。活性官能度可以接着被连附到这部分上。

US 5,270,170涉及通过用重组载体集合转化宿主细胞而构建的随机 肽文库,其中重组载体编码由DNA结合蛋白和随机肽组成的融合蛋白, 并且还编码该DNA结合蛋白的结合位点。融合蛋白能够用于筛选配体。 筛选方法导致形成由通过随机肽配体结合到受体的融合蛋白以及通过 DNA结合蛋白结合到重组DNA载体的融合蛋白组成的复合物。

US 5,539,082涉及新型化合物,称为结合互补ssDNA和RNA链能够 比结合相应DNA更强烈的肽核酸。肽核酸通常包括配体,如天然存在的 通过适当的接头连附到肽主链上的DNA碱基。

US 5,574,141涉及用于同时合成和直接标记作为模板依赖性酶促核 酸合成引物的寡核苷酸的功能化的载体材料。聚合载体加载有依次含有 标记基团或其前体的核酸构件。以这种方式加载的聚合载体作为固或液 相用于装配寡核苷酸,该寡核苷酸能够在例如序列分析或在聚合酶链式 反应(PCR)中被用作模板依赖性酶促核酸合成的引物。

US 5,573,905涉及编码的组合化学文库,文库包括大量具有化学多 聚体和限定该化学多聚体结构的标识寡核苷酸序列的双官能分子。也描 述了文库中的双官能分子和使用文库鉴定文库中化学结构的方法,其中 化学结构以预先选择的结合相互作用结合生物活性分子。

US 5,597,697涉及RNA和DNA依赖性核酸聚合酶抑制剂和激动剂的 筛选分析。该发明提供用于鉴定和发现是RNA和DNA依赖核酸聚合酶的 抑制剂和激动剂的试剂的方法。该发明的本质特性是将功能性聚合酶结 合位点序列(PBS)掺入进核酸分子中,选择该核酸分子以便能够通过其序 列特异性活性赋予可辨别的性质,这样PBS的掺入使得核酸分子成为预 定RNA或DNA模板指导的核酸聚合酶的功能性模板。在聚合酶、合适的 引物分子和任何必须辅助分子存在时,发生与模板互补的核酸链的催化 延伸,由于互补链的反义效应或其它聚合酶介导的效应,导致所述的报 告-模板分子赋予其特征的活性部分或全部消失(或者增加)。

US 5,639,603涉及利用合成化合物的常规随机方法,合成和筛选分 子多样性的方法。这种方法能够用于生产大量标记化合物的集合,标记 化合物集合能够被筛选用于鉴定和分离带有有用特性的化合物。

US 5,698,685涉及吗啉-亚单位组合文库以及生产能够与挑选的大 分子配体特异性相互作用的化合物的方法。这种方法包括将配体与寡聚 体的组合文库接触,其中寡聚体由具有多种核酸碱基(nucleobase)和 非核酸碱基侧链的吗啉亚单位组成。分离特异性结合到受体上的寡聚体 分子并且测定它们的碱基部分的序列。也公开了在该方法中有用的寡聚 体组合文库以及新的吗啉-亚单位多聚体组合物。

US 5,708,153涉及利用在颗粒上合成随机寡聚体的常规随机的方法, 合成各种各样标记化合物集合的方法。该发明另一方面涉及在颗粒上使 用鉴定标签以便于鉴定寡聚体中单体的序列。

US 5,719,262涉及新型化合物,称为肽核酸,其结合互补DNA和RNA 链比结合相应的DNA或RNA链更强烈,并且表现出增强的序列特异性和 溶解性。肽核酸包含从由连附到聚酰胺主链上的天然存在的核酸碱基和 非天然存在的核酸碱基构成的组中选择的配体,而且含有烷基胺侧链。

US 5,721,099涉及用标签编码的编码组合化学文库。提供了编码的 组合化学文库,由此记录了使用有机分子顺序合成的方案,该方案详细 说明了反应物的选择和反应阶段,以及一些相同或不同的信息。在这种 多阶段合成中能够产生多种产物,例如寡聚体和合成的非重复的有机分 子。特别地,大量标识物可以被用于提供二元或更高元密码,以仅仅用 少量可分开的标签而限定大量选择。颗粒可以用于筛选一种感兴趣特性, 特别是结合亲和,其中产物可以被从颗粒上分离或者被保留在颗粒上。 阳性特征的颗粒的反应历史可通过释放标签并分析阐释颗粒的反应历史 来测定。

US 5,723,598涉及包括大量具有化学多聚体和限定化学多聚体结构 的标识寡核苷酸序列的双官能分子的编码组合化学文库。也描述了文库 的双官能分子和使用文库鉴定文库中化学结构的方法,其中化学结构以 预选的结合相互作用结合到生物活性分子上。

US 5,770,358涉及加标签的合成寡聚体文库和常规随机合成随机寡 聚体的方法。这种方法能够用于合成筛选预期特性的化合物。使用寡聚 体上的鉴定标签便于鉴定具有预期特性的寡聚体。

US 5,786,461涉及具有氨基酸侧链的肽核酸。一种新型化合物,称 为肽核酸,结合互补DNA和RNA链比结合相应的DNA或RNA链更强烈, 而且显示出增强的序列特异性和溶解性。肽核酸包含从由连附到聚酰胺 主链上的天然存在的核酸碱基和非天然存在的核酸碱基组成的组中选取 的配体,而且含有烷基胺侧链。

US 5,789,162涉及合成各种各样寡聚体集合的方法。公开了在颗粒 上常规随机合成随机寡聚体的方法。发明另一方面涉及使用颗粒上的鉴 定标签以便于鉴定多聚体中单体的序列。

US 5,840,485涉及拓扑隔离的编码的固相文库。合成的试验化合物 的文库被连附到分相合成支持物上,支持物也含有编码合成的试验化合 物结构的编码分子。这种分子可以是多聚体或者多种非多聚体分子。合 成的试验化合物可具有带如下键的主链结构,所述键例如酰胺、尿素、 氨基甲酸酯(即,氨基甲酸乙酯)、酯、氨基、硫化物、二硫化物、或者 -碳、如烷和烯烃,或者其中的任何组合。合成的试验化合物也能 够是分子支架结构,或其它能够作为支架起作用的结构。该发明也涉及 合成这类文库的方法,以及使用这类文库从合成的试验化合物文库中鉴 定和描述兴趣分子特性的方法。

US 5,843,701涉及通过反转录的系统多肽进化以及制备靶分子多肽 配体的方法,其中将包含核糖体复合物或mRNA:多肽共聚物的候选混合物 相对于它们对靶分子的亲和力加以区分,并且扩增产生新的在具有靶分 子亲和力的核糖体复合物或mRNA:多肽共聚物中富集的候选混合物。

US 5,846,839涉及牢固加标签的编码的合成文库的方法。公开了通 过使用特异性胺标签测定在固体支持物上原位形成的化合物结构的化学 编码方法,在化合物合成之后,胺标签能够被解密以提供在支持物上发 现的化合物的结构。

US 5,922,545涉及用于鉴定结合到预定受体或表位的肽和单链抗体 的方法及组合物。这种肽和抗体通过展示新生肽的多核糖体的亲和筛选 方法鉴定。

US 5,958,703涉及从复合物文库筛选具有预期特性,例如能够结合 到细胞受体的化合物的方法。这种文库中的复合物包含受试化合物、在 化合物合成中记录至少一个步骤的标签、以及易受报告分子修饰的系链。 系链的修饰用于表示复合物中含有具有预期特性的化合物。标签能够被 解码以展示这种化合物合成中的至少一个步骤。

US 5,986,053涉及两条肽核酸链和一条核酸链的肽核酸复合物。肽 核酸和肽核酸的类似物用于形成双链体、三链体和具有核酸的其它结构, 并用于修饰核酸。肽核酸和其类似物也通过例如转录阻抑、转录起始、 以及核酸位点特异性断裂用于调节蛋白活性。

US 5,998,140涉及在细胞内dsDNA与杂环寡聚体、脂肪族氨基酸、 特别是Ω-氨基酸,以及极性末端基团之间形成复合物的方法和组合物。 通过适当选择靶序列和寡聚体组合物,得到具有低解离常数的复合物。

US 6,060,596涉及包括大量具有化学多聚体和决定化学多聚体结构 的标记寡核苷酸序列的双官能分子的编码的组合化学文库。也描述了文 库中的双官能分子和使用文库鉴定文库中化学结构的方法,化学结构以 预选的结合相互作用结合到生物活性分子上。

US 6,080,826涉及模板指导的功能化双烯的闭环易位和开环易位聚 合。公开了功能化环状烯烃及其制备方法。方法包括模板指导的功能化 无环双烯的闭环易位(“RCM”)和模板指导的拥有有规律间隔的不饱和 位点的功能化多聚体的解聚合作用。尽管模板种类可能是任何阴离子、 阳离子、或者极性化合物,但阳离子类,特别是碱金属是优选的。也公 开了具有有规律间隔的不饱和位点的功能化多聚体及其制备方法。合成 这些多聚体的一种方法是通过功能化环状烯烃的开环易位聚合 (“ROMP”)。

US 6,127,154涉及与预期分子具有互补结构的化合物,例如生物分 子,特别提供了可用于体内或体外诊断和治疗试剂的多聚体或者寡聚体 化合物。也提供了生产这些化合物的各种方法。

US 6,140,493涉及合成各种各样寡聚体集合的方法。公开了一般性 随机合成随机寡聚体的方法而且这种方法能够用于合成筛选预期特性的 化合物。寡聚体上的鉴定标签便于鉴定具有预期特性的寡聚体。

US 6,140,496涉及用于制备携带非标准核酸碱基的寡核苷酸的构件, 非标准核酸碱基能与互补的非标准核酸碱基配对以符合Watson-Crick几 何学。产生的碱基对加入到与融合的双环杂环系统配对的单环六元环上, 所说的系统包括与六元环稠合的五元环,杂环彼此之间以及杂环相对于 主链的方向类似于在DNA和RNA中所发现的方向,但是将碱基对约束在 一起的氢键型式不同于在AT和GC碱基对中发现的型式(“非标准碱基 对”)。

US 6,143,497涉及利用常规随机方法在颗粒上合成随机寡聚体各种 各样集合的方法。也公开了定位于颗粒上并可用以方便地鉴定寡聚体中 单体序列的鉴定标签。

US 6,165,717涉及在颗粒上合成随机寡聚体的常规随机方法。也公 开了定位于颗粒上以便于鉴定寡聚体中单体序列的鉴定标签。

US 6,175,001涉及功能化的嘧啶核苷和核苷酸以及掺入了它们的 DNA。修饰的嘧啶核苷酸在C5处衍生化,含有模拟天然存在氨基酸残基 特性的官能团。也提供了含有修饰核苷酸的DNA分子。

US 6,194,550 B1涉及通过反转录的系统多肽进化,特别是制备靶分 子的多肽配体的方法,其中将包含核糖体复合物或mRNA:多肽共聚物的候 选混合物相对于它们对靶分子的亲和力加以区分,并且扩增产生新的在 具有靶分子亲和力的核糖体复合物或mRNA:多肽共聚物中富集的候选混 合物。

US 6,207,446 B1涉及利用RNA-蛋白质融合物选择蛋白质分子的方 法和试剂。

US 6,214,553 B1涉及利用RNA-蛋白质融合物选择蛋白质分子的方 法和试剂。

WO 91/05058涉及新基因和多肽的无细胞合成和分离的方法。构建其 上连附有半随机核苷酸序列的表达单位。半随机核苷酸首先被转录产生 RNA,接着在产生多核糖体的条件下被翻译。结合到感兴趣物质上的多核 糖体接着被分离和解体;并回收释放的mRNA。mRNA用于构建表达产生新 多肽的cDNA。

WO 92/02536涉及制备靶分子多肽配体的方法,其中将包含核糖体复 合物或mRNA:多肽共聚物的候选混合物相对于它们对靶分子的亲和力加 以区分,并且扩增产生新的在具有靶分子亲和力的核糖体复合物或mRNA: 多肽共聚物中富集的侯选混合物。

WO 93/03172涉及制备靶分子多肽配体的方法,其中将包含核糖体复 合物或mRNA:多肽共聚物的候选混合物相对于它们对靶分子的亲和力加 以区分,并且扩增产生新的在具有靶分子亲和力的核糖体复合物或mRNA: 多肽共聚物中富集的侯选混合物。

WO 93/06121涉及在颗粒上合成随机寡聚体的常规随机方法。也公开 了定位于颗粒上以便于鉴定寡聚体中单体序列的鉴定标签。

WO 00/47775涉及包括高盐翻译后步骤的产生RNA-蛋白质融合物的 方法。

本发明其它相关的参考文献包括Bain等Nature,vol.356,1992, 537-539;Barbas等Chem.Int.Ed.vol.37,1998.2872-2875; Benner综述;Blanco等Analytical Biochemistry vol.163,1987, 537-545;Brenner等Proc.Natl.Acad.Sci.Vol.89,1992, 5381-5383;Bresler等Biochimica et Biophysica Acta vol.155,1968, 465-475;Dewey等J.Am.Chem.Soc.Vol.117,1995,8474-8475; Dietz等Photochemistry and photobiology vol.49,1989,121-129; Gryaznov等J.Am.Chem.Soc.vol.115,1993,3808-3809;Gryaznov 等Nucleic Acids Research vol.21,1993,1403-1408;Elmar Gocke Mutation Research vol.248,1991,135-143;Haeuptle等Nucleic Acids Research,14,1986,1427-1448;Hamburger等Biochimica et Biophysica Acta,213,1970,115-123;Hamza A.El-Dorry Biochimica et Biophysica Acta vol.867,1986,252-255;Herrera-Estrella 等The EMBO Journal,7,1988,4055-4062;Heywood等Biochemistry vol.57,1967,1002-1009;Heywood等J.Biol.Chem.Vol.7,1968, 3289-3296;Hooper等Eur.J.Clin.Microbiol.Infect.Dis.Vol. 10,1991,223-231;Houdebine等Eur.J.Biochem.,63,1976,9-14; Johnson等Biochemistry vol.25,1986,5518-5525;Kinoshita等 Nucleic Acids Symposium Series vol.34,1995,201-202;Leon等 Biochemistry vol.26,1987,7113-7121;Maclean等Proc.Natl. Acad.Sci.USA vol.94,1997,2805-2810;Mattheakis等Proc.Natl. Acad.Sci.USA vol.91,1994,9022-9026;Menninger等 Antimicrobial Agents and Chemotherapy,21,1982,811-818; Menninger.Biochimica et Biophysica Acta,240,1971,237-243; Mirzabekov Methods in Enzymology vol.170,1989,386-408; Nikolaev等Nucleic Acids Research vol.16,1988,519-535;Noren 等Science vol.24,1989,182-188;Pashev等TIBS vol.16,1991, 323-326;Pargellis等The Journal of Biologicai Chemistry,263, 1988,7678-7685;Pansegrau等The journal of biological chemistry vol.265,1990,10637-10644;Peeters等FEBS Lett.vol.36,1973, 217-221;Roberts等Proc.Natl.Acad.Sci.USA vol.94,1997, 12297-12302;Schmidt等Nucleic Acids Research vol.25,1997, 4797-4802;Schutz等Nucleic Acids Research,4,1977,71-84; Solomon等Proc.Natl.Acad.Sci USA vol.82,1985,6470-6474; Sugino等Nucleic Acids Research,8,1980,3865-3874;Tarasow等 Nucleic Acids Sciences vol.48,1998,29-37;Wiegand等 Chemistry and Biology vol.4,1997,675-683;以及Wower等Proc. Natl.Acad.Sci.USA.,86,1989,5232-5236.

发明概述

本发明以一般性的方式解决上面提到的问题和现有技术的不足。本发 明涉及用于模控合成(templating)一般分子,例如多聚体的系统,以 及该模板能够模控多聚体合成,在优选的实施例中允许多聚体的扩增。 该系统因此具有与天然系统(信息从模板流向模控分子(templated molecule))相同的总体特性,也具有与最近发明的核糖体介导的系统(例 如,噬菌体展示)相同的特性,也就是模板与模控分子之间的物理联系。 然而,本发明不涉及核糖体或tRNA,并因此允许大量不同多聚体的模控 合成,包括不能在以核糖体介导的核酸翻译为基础的天然系统中合成的 多聚体。

本发明的模控合成方法显著优于现有技术。由于回收分子(即,它们 的模板)的扩增能够通过平行过程完成,其中所有回收的模板存在于同 一个区室内(例如,试剂管或微量滴定板孔),并且其中分子被按比例扩 增,因此无需人为干预例如单个分子测序。这是一种极大的优势,因为 当起始材料是例如1016个分子的文库时,在第一轮筛选后,典型的回收 涉及例如1010个不同的分子。当操作如此庞大数量的分子时,通过一次 复制一个分子来“扩增”1010个分子,即在系列过程中“扩增”分子,实 际上是不可能的。

本发明总的来说涉及模控分子和包括连接到模板上的这种分子的复 合物,其中模板已指导模控分子在模板指导下合成。一方面,根据本发 明的方法能够获得模控分子和复合物。

本发明也公开了合成这些模控分子和/或复合物的方法、将这些模控 分子和/或复合物靶向靶物质的方法。模控分子优选从包括功能性实体的 构件(或称结构单元)中合成,功能实体包括能够共价连接官能团并形 成模控分子的反应基团和官能团。构件的功能性实体通过可断裂的接头 或可选择性断裂的接头与互补元件分开。互补元件能够与模板的预定编 码元件互补,从而确保编码元件或互补元件,和功能实体或官能团之间 的一一对应关系。

也公开了鉴定模控分子官能团序列的方法以及利用根据本发明的模 控分子治疗和诊断的方法。

本发明的方法不包括核糖体介导的核糖核酸的转录。而且当模控分子 是i)仅包含α-氨基酸,或者ii)基本上仅包含单独天然存在的氨基酸, 如至少80%,例如90%,如95%天然存在的氨基酸的肽时,模板不包含 核糖核酸或不基本上由核糖核酸构成。

模板表示编码元件的序列,其中每个编码元件被连接到相邻编码元件 上。互补模板表示互补元件的序列,其中每个互补元件被连接到相邻互 补元件上。

在编码元件被互补元件互补或者多个编码元件被多个互补元件互补 之后,每个互补元件将限定能够被连接到由相邻互补元件所决定的相邻 官能团上的附加官能团,该官能团本身不形成互补模板的一部分。因此, 在一个优选的实施方式中,官能团不参与编码元件的互补,以至于在编 码元件和官能团之间不发生直接反应或杂交。术语“反应”意思是任何 导致官能团和编码元件之间形成共价或非共价相互作用的反应性接触。 在另一个实施方式中,模控分子的官能团形成互补模板的一部分。

由于每个互补元件能够识别模板的预定编码元件,而且由于每个编码 元件又限定预定的官能团,因此模板的编码元件序列将作为包括共价连 接的官能团的预定序列的模控分子合成的模板。

根据本发明的优选实施方式,有可能

i)将包括多个官能团的模控分子连接到用作该模控分子合成模板的 模板上,

ii)在相邻编码元件与限定所述官能团的互补元件互补的同时连接 相邻官能团,

iii)在相邻编码元件与限定所述官能团的互补元件互补之后连接相 邻官能团。

iv)在互补模板形成的同时连接相邻官能团,

v)在互补模板形成之后连接相邻官能团,

vi)断裂互补模板的互补元件之间的一个或多个连键,而不断裂模控 分子官能团之间的连键,并且反之亦然,和

vii)断裂至少一个将构件的至少一个功能实体与至少一个互补元件 隔开的接头,而不断裂互补模板。

viii)断裂至少一个将构件的至少一个功能实体与至少一个互补元 件隔开的接头,而不断裂模控分子官能团之间的连键,和

ix)断裂至少一个将构件的至少一个功能实体与至少一个互补元件 隔开的接头,而不断裂互补模板,并且不断裂模控分子官能团之间的连 键。

假如实现了相邻编码元件的互补,那么不管互补模板是否形成,模控 分子的相邻官能团能够被连接。而且有可能连接相邻官能团,并且随后 断裂该将功能实体与限定所述功能实体的互补元件隔开的可断裂接头, 而不断裂模控分子相邻官能团之间的连键。可断裂接头在选择性可断裂 接头不能断裂的条件下是可断裂的。因此,有可能断裂连接互补元件和 模控分子中官能团之间的可断裂接头,而同时不断裂连接同一模控分子 中互补元件和官能团子集的选择性可断裂接头。因而有可能获得包括模 控分子和指导了模板介导的模控分子合成的模板的复合物,其中模板和 模控分子通过一个或更多,优选一个,选择性可断裂接头连接。

额外的模控分子能够通过模板指导产生,而不需要任何测序或其它任 何形式的表征。使用现有技术通过一步接着一步的合成产生的“标签” 这是不可能的。因此,本发明的包括连接到模板上的模控分子的复合物 使得迅速地挑选和扩增预期的模控分子成为可能。

在第一个方面,本发明提供合成包括多个官能团的模控分子的方法, 所述的方法包括步骤

i)提供至少一个包括n个编码元件的序列的模板,

其中每个编码元件包括至少一个能够识别预定互补元件的识别基团, 且

其中n是大于1的整数,

ii)提供多个构件,其中每个构件包括

a)至少一个包括至少一个能够识别预定编码元件的识别基团的互补 元件

b)至少一个包括至少一个官能团和至少一个反应基团的功能实体,和

c)至少一个将所述至少一个功能实体与所述至少一个互补元件隔开 的接头,

iii)将每个所述的编码元件与能够识别所述编码元件的互补元件进 行接触,

iv)任选地,获得互补元件,和

v)通过经由涉及反应基团的反应,将至少一个功能实体的官能团连接 到另一个功能实体的官能团上,获得包括共价连接的官能团的模控分子,

其中模控分子能够通过接头被连接到互补模板或模控合成该模控分 子的模板上,且

其中模控分子的合成不包括核糖体介导的核酸翻译。

另一个方面,本发明涉及模控分子,多个相同或不同的模控分子,其 中优选每个模控分子是可通过根据本发明的合成模控分子的方法获得 的。

由于模控分子和模板是能够通过单个接头连接的分离的实体,发明也 涉及包括连接到模控合成模控分子的模板上的模控分子的复合物。能够 模控合成模控分子的模板包括编码元件序列,或者互补元件序列,在这 种情况下模板是互补模板。因此,有可能断裂模控分子官能团之间的连 键而不断裂模控合成模控分子的模板或互补模板。

另一方面,提供合成包括连接到模控合成模控分子的模板上的模控分 子的复合物的方法,其中模控分子和包括连接到模控合成模控分子的模 板上的模控分子的复合物是可通过根据本发明合成它们的方法获得的。

本发明另一方面提供包括多个模控分子的组合物,其中每个或至少 一些模控分子被连接到模控合成该模控分子的模板上,在这种情况下提 供多个各自包括连接到模控合成该模控分子的模板上的模控分子的复合 物。组合物还可以包括模控分子和未连接至其上的模控合成模控分子的 模板。

文库模控分子的可扩增性提供了带有独特特征的文库。该独特特征包 括例如,能够在平行的过程中将文库通过重复的选择和扩增过程筛选巨 大量的模控分子,其中分子文库作为一个整体处理,而且其中在各选择 和扩增轮次之间无需表征单个分子(或者甚至分子群)。

根据本发明的多种优选实施例,有可能筛选例如多于或大约103个不 同的模控分子,如多于或大约104不同的模控分子,例如多于或大约105 不同的模控分子,如多于或大约106不同的模控分子,例如多于或大约 107不同的模控分子,如多于或大约108不同的模控分子,例如多于或大 约109不同的模控分子,如多于或大约1010不同的模控分子,例如多于 或大约1011不同的模控分子,如多于或大约1012不同的模控分子,例如 多于或大约1013不同的模控分子,如多于或大约1014不同的模控分子, 例如多于或大约1015不同的模控分子,如多于或大约1015个不同的模控 分子,例如多于或大约1017不同的模控分子,如多于或大约1018个不同 的模控分子。

由于可以进行许多轮重复的平行选择和平行扩增过程,有可能在每一 轮中仅仅富集例如100倍,而仍然可能获得非常有效的、例如经过许多 轮选择和扩增后1014倍的富集(每一轮富集100倍,经过7轮后理论上 可以富集1014倍)。使用非可扩增文库获得相似的1014倍的富集,将需要 在“一轮”中允许1014倍富集的筛选条件,而这使用现有技术的筛选技 术实际上是不可能的。模控分子和/或模板可以进一步被结合到固体或半 固体支持物上。

在更进一步的方面,本发明的方法,单独地或联合地,涉及

筛选潜在地具有预定活性的复合物或模控分子的组合物的方法,

分析潜在地与复合物或模控分子关联的预定活性的方法,

选择具有预定活性的复合物或模控分子的方法,

扩增模控合成具有或潜在地具有预定活性的模控分子的模板的方法, 和

扩增模控合成具有或潜在地具有预定活性的模控分子的模板的方法, 所说的方法包括进一步以至少2倍增加的量获得模控分子的步骤。

而在另一个方面,提供改变模控分子序列的方法,包括产生包含新的 或改变的官能团序列的模控分子,其中方法包括使模控合成原始模控分 子的模板发生突变的步骤。该方法优选包括步骤

i)提供能够模控第一模控分子的第一模板,或多个能够模控多个第一 模控分子的这类模板,

ii)修饰第一模板或多个第一模板的序列,并产生第二模板或多个第 二模板,

其中所述的第二模板能够模控合成第二模控分子,或多个第二模控分 子,

其中所述的第二模控分子包括与第一模控分子官能团序列不同的共 价连接的官能团的序列,以及任选地,

iii)通过所述的第二模板模控合成第二模控分子,或多个这样的第二 模控分子。

上面提到的方法阐明,在一个实施方式中模控合成(图1)包括单链、 可修饰的模板形式的中间体。在这种模板包括含有脱核糖核苷酸或核 糖核苷酸的核苷酸链的情况下,大多数分子生物学方法能够用于修饰模 板,并因此修饰模控多聚体。

下面列表中提到的能够用于本发明的模控多聚体的分子生物学方法 是远远不够全面的,而仅仅用于举例说明几乎任何相关的分子生物学方 法都能够用于作为本发明结果的模控多聚体。

在具有非天然碱基的核苷酸是模板的一部分的情况下,一些分子生物 学方法可能不适用。这将主要依赖于所涉及酶(例如,PCR反应中的Taq DNA聚合酶;USE方案中的限制性酶,等等)的底物特异性。还有,包括 体内步骤(例如,用于质粒DNA扩增的大肠杆菌的转化)的方法可能对 这些核苷酸仅仅具有有限的可行性。不过,几个具有非天然碱基的核苷 酸已知可通过几种野生型和突变聚合酶掺入到寡核苷酸中的,因此,具 有非天然碱基的核苷酸的使用不会严重限制能够用于模控分子的体外分 子生物学方法的数量。

表1.能够用于本发明的模控多聚体的分子生物学

·体内和体外扩增、重组和诱变

·Kunkel定点诱变,利用一个或多个(例如50)低于饱和 浓度的不同诱变寡核苷酸,即产生组合文库

·USE(独特定点消除(Unique Site-directed Elimination)),利用一个或多个(例如50个)低于饱和浓度的 不同诱变寡核苷酸,即产生组合文库

·PCR(聚合酶链式反应)

·LCR(连接酶链式反应)

·PCR改组,包括家族改组(改组含有特定同源区段的序列), 以及定向改组,其中寡核苷酸被插到反应中,以沿某一方向指导 改组过程

·其它类型的改组,例如,酵母中的同源重组;如Phylos、 Energy Biosystems、Diversa公司以及由Frances Arnold所开 发的改组方案

·盒式诱变

·其它基于聚合酶或PCR的方法,例如重叠延伸、基因合成、 以及易错聚合酶链式反应

·化学或紫外线诱导突变

·野生型或变体模板的合成及其到模控多聚体的翻译(野生 型在这里意思是模控合成已知的(“野生型”)多聚体的模板序列; 变体在这里意思是模控合成该已知多聚体变体的部分随机化或 掺入的模板序列)

·限制性酶的特异性断裂

·DNA或RNA连接酶的连接;“基因剪接”

·亲和选择(使用模板-模控多聚体复合物)

·测序

·通过使用模板作为结合DNA阵列的标签,在“DNA芯片” 上排列多聚体

可能希望将分子生物学方法或者用于模板-互补模板双螺旋或者用 于衍生的互补模板而不是分离(非衍生的)模板链。衍生的模板就这点 而言可以含有非多聚化的功能实体、多聚化的功能实体、或断裂连接功 能实体和互补元件的接头之后留下的痕迹。已知许多聚合酶和其它酶接 受高度衍生化的DNA或RNA模板。因此,许多包括聚合酶和其它酶的体 外方法使用(衍生的)互补模板作为起点可能是切实可行的。对于正在 讨论的分子生物学方法,使用衍生的互补模板作为起点是否可行,将主 要依赖于所涉及酶的底物或模板特异性。在这方面,熟练技术人员将能 够评价各种实际方法的可行性。

本发明也涉及用于合成模控分子的构件和包括这种构件的复合物。在 另一方面,提供了构件用以合成根据本发明的模控分子的用途。在这个 方面的一个优选实施方式中,模控分子包括或基本上由能够结合到靶分 子实体或结合配偶体形式的另一个分子实体上的分子实体构成。

模控分子优选是药物,这种药物能够在药物组合物中以药学有效量给 予个体并且治疗所述需要这种治疗的个体的临床疾病

在本发明的另一方面,提供农药组合物、杀虫组合物、杀细菌组合物、 和杀真菌组合物,以及制备这些组合物的方法和它们的用途,其中每种 所说组合物包括实现预期效果有效量的根据发明的模控分子。

在更进一步的方面,提供鉴定药学试剂或诊断试剂的方法,其中所说 的方法包括用至少一种预定的模控分子筛选多种药物靶,并鉴定能够与 所说的药物靶相互作用的候选模控分子形式的药学试剂或诊断试剂的步 骤。

而在另一个方面,提供鉴定靶(包括药物靶在内)的方法,其中所说 的方法包括用至少一个预定的模控分子,筛选多种配体或受体部分,以 及鉴定能够与所说的模控分子相互作用的配体或受体部分形式的药物靶 的步骤。

本发明还涉及任何分离或纯化的对预定靶,包括药物靶有亲和力的模 控分子,也涉及包括药物靶在内的,以对预定模控分子有亲和力的配体、 受体部分、酶、细胞表面、固体或半固体表面、以及任何其它物理或分 子实体或表面形式存在的靶。

在本发明更进一步的方面,提供治疗有此需要的个体的方法,所说的 方法包括给予个体药学上有效量的通过本发明方法鉴定的并对包括药物 靶在内的预定靶具有亲和力的分子的步骤。

而在另一个方面,进一步提供治疗有此需要的个体的方法,所说的方 法包括给予个体药学上有效量的分离或纯化的对根据本发明的预定模控 分子具有亲和力的配体或受体部分的步骤。分离或纯化的配体或受体部 分优选通过上面提到的本发明的鉴定方法鉴定。

本发明可以依照许多实施方式进行。在第一个实施方式中将互补元件 与编码元件接触的步骤涉及一个或更多聚合酶或转录酶。因此,依照这 个实施方式,构件是核苷酸衍生物。在该第一个实施方式的一个方面, 构件是单核苷酸,不过构件可以是二核苷酸或寡核苷酸。尽管单核苷酸 是聚合酶和转录酶的天然底物,依照WO 01/16366的方法,寡核苷酸也 是能够掺入的。单核苷酸或寡核苷酸衍生物作为互补元件起作用。一个 或多个接头一端被连附到单核苷酸或寡核苷酸衍生物上而另一端被连附 到功能实体上。特别是,在互补元件是单核苷酸衍生物的情况下,优选 接头被连附导致功能实体突进双链螺旋的大沟,允许相邻的功能实体彼 此之间形成连键。

在本发明的第二个实施方式中,包括作为互补元件的单核苷酸或寡核 苷酸的构件用化学方法连接在一起。用于化学连接的几种方法在本技术 领域中是已知的,例如5’-磷酸咪唑(5’-phosphoimidazolid)方法 (Visscher,J.;Schwartz,A.W.Journal of Molecular Evolution 1988, 28,3-6.和Zhao,Y.;Thorson,J.S.J.Org.Chem.1998,63, 7568-7572)或3’-硫代磷酸酯(3’-phosphothioate)方法(Alvarez 等J.Org.Chem.(1999),64,6319-28 Pirrung等J.Org.Chem. (1998),63,241-46)。

在本发明的第三个实施方式中,包括作为互补元件的寡核苷酸的构件 使用连接酶连接在一起。

在本发明的第四个实施方式中,构件包括作为互补元件的寡核苷酸, 所说的寡核苷酸长度足以粘附到模板上,不需要连接到引物或其它互补 元件上。

构件通常适合用于将互补元件与模板接触的方法以及模控分子的生 产。作为举例,当使用单核苷酸衍生物时,接头可能相对较短,而当寡 核苷酸用作构件时,接头则必须是相当长。

                    附图的简要说明

在下面附图中使用的下列符号是用于表示该系统的一般特性:在图1、 7C、8C、11、11例1、12、13、14、14例1-2、15、15例1-7、17、 17例1、17、17例1-2、19、19例1-3、20、21及22A中,长水平 线代表模板、互补模板或模板与互补模板的复合物。为清楚起见,在一 些图中仅仅包括了聚合步骤,没有包括活化步骤。Rx表示官能团。

图1模控分子的化学展示-原理

模控分子化学展示的方案可被分成6个步骤,i)掺入,ii)聚合, iii)活化,iv)选择/筛选,v)扩增,和vi)表征。掺入包括构件掺入到 互补模板内,该顺序是由模板决定的。

掺入可通过酶如聚合酶或连接酶介导。模板在一端或两端包括引物 结合位点(允许模板扩增)。模板的剩余部分可以是随机的,部分随机 的或预定的序列。互补元件优选包括功能实体、互补元件以及连接功能 实体和互补元件的接头。所选择的互补元件、它们的掺入、聚合以及活 化的详细例子在(图7和8)中显示。

聚合包括掺入的构件之间的反应,由此除已经存在于互补元件之间 的功能键外形成功能实体之间的共价键。

活化包括断裂几个,除一个以外的全部,或者所有将功能实体序列 连接到模板或互补模板上的接头,其中模板或互补模板模控包括功能实 体的模控分子。活化还可以包括不断裂连接功能实体和互补模板的接 头,而分离模板和互补模板。

选择或筛选包括富集具有期望特性的模板-模控分子对群体。

扩增包括通过模板或互补模板的扩增生产更多的模板-模控分子 对,以及生产更多的模板-模控分子对用于下一轮的选择/筛选,或用 于测序或其它表征。

克隆和测序包括分离的模板或互补模板的克隆,继之以表征。在一 些情况下,可能期望将分离的模板或互补模板群进行测序,因此不需要 单个序列的克隆。

图2A和2B扩展的碱基对集合

该图公开了遵守Watson-Crick氢键合原则的天然和非天然碱基对集 合。该碱基对在美国专利US 6,037,120中公开,这里并入作为参考。

图3单体构件

构件包括或基本上由通过选择性可断裂接头连接到互补元件上的功 能实体组成。每个互补元件有两个可以与两个其它互补元件反应的反应 基团(I型)。互补元件含有与互补编码元件(没有显示编码元件)相互 作用的识别基团。在这个例子中功能实体包括或基本上由两个可以与其 它功能实体的反应基团发生反应的反应基团(II型)和也被称之为官能 度(functionality)的官能团组成。II型反应基团和连接它们的分子 部分在得到的编码多聚体中将成为主链(一部分)。

图4仅具有一个II型反应基团的单体构件

构件包括或基本上由功能实体组成,功能实体通过选择性可断裂接头 连接到互补元件上。每个互补元件有两个可以与其它互补元件反应的反 应基团(I型)。互补元件含有与互补的编码元件(没有显示编码元件) 相互作用的识别基团。在这个例子中功能实体包括或基本上由可以与其 它功能实体的反应基团反应的II型反应基团和也被称之为官能度的官能 团组成。II型反应基团在得到的编码多聚体中将成为主链(一部分)。

图5构件和因模板指导的构件掺入而产生的多聚体以及它们的聚合 和活化

图3公开了单个构件特征的详细描述。显示了三个不同的互补元件, 各自连接到特定的功能实体上。图的右半部分包括通过互补碱基配对指 导构件掺入的模板。

A)互补元件的I型反应基团反应,由此丢失反应基团一部分(例如, 在核苷三磷酸的掺入中丢失PPi)。在显示的例子中,II型反应基团的聚 合也导致反应基团一部分的丢失。所得多聚体的主链包括或基本上由原 始II型反应基团一部分和连接反应基团的分子实体组成。部分接头仍连 附到功能实体上。

B)I型反应基团象在(A)中一样反应。II型反应基团不直接反应, 反而加入“桥接分子”。一旦与这种桥接分子反应,反应基团一部分就丢 失。在本例中使用的可断裂的接头是所谓的“无痕接头”,因此释放的功 能实体没有接头分子的痕迹。

C)本例中的掺入不包括单个互补元件的偶联,即不导致I型反应基团 的反应。II型反应基团象在(B)中一样与桥接分子反应。

D)功能实体仅仅含有一个II型反应基团。该II型反应基团与桥接 分子反应。

图6作为构件的衍生核苷酸

核苷酸构件包括或者基本上由通过选择性可断裂的接头(这里是二硫 化合物)连接的互补元件(核苷酸)和功能实体(在本例中是二羧酸) 组成。如图中所示,核苷酸的I型反应基团是三磷酸和羟基。核苷酸的 识别基团是碱基。功能实体包括或基本上由官能团(羟基)、两个II型 反应基团(羧酸)和连接两个反应基团的主链结构(芳香环)组成。最 后,接头(二硫化合物)可被例如DTT断裂。

作为构件的衍生二核苷酸

互补元件是包括识别基团的经修饰的dA-dU二核苷酸,在本例中是腺 嘌呤和尿嘧啶碱基。它通过可断裂的炔丙基酯(propargylester)连键 连接于功能实体(这里是氨基酸)。碱性断裂之后,接头释放官能团羧酸。 二核苷酸的I型反应基团是羟基和磷酸(2-甲基)咪唑 (phophoro(2-methyl)imidazolide)。II型反应基团是如图所示的氨基 酸的氨基和羧酸。

作为构件的衍生寡核苷酸

互补元件是所示的寡核苷酸的最后20个碱基。互补元件通过包含40 个碱基的包括胞嘧啶脱氧核糖核苷酸的寡核苷酸连接到功能实体N-Boc β氨基酸上(B是使用商业上可以获得的亚磷酰胺(10-1953-95,来自 Glen research)掺入的内在生物素,其中胞嘧啶脱氧核糖核苷酸在5’ -磷酸基团处已经用连接到N-羟琥珀酰亚胺部分的巯基己烷间隔臂修 饰。II型的反应基团是连接到N-羟琥珀酰亚胺部分的氧原子上的羧酸。 它很容易受到例如胺的亲核攻击。

图7β-二肽的C-端附着(tagging)-掺入、聚合和活化

A)引物和两个单体构件的结构。引发剂(initiator)分子被连附到 引物3’-端dU的5号位上。引发剂是Fmoc保护的胺。dUTP衍生物带 有光保护的(photoprotected)羟基。羟基被偶联到N-硫代羧酸酐 (N-thiocarboxyanhydride,NTA)环结构上。dATP衍生物在7号位上被 修饰。光保护胺被偶联到NTA上。

B)引物(被退火到模板上,图中没有显示)通过聚合酶掺入dUTP和 dATP从其3’-端延伸。接着引发剂被哌啶激活,释放伯胺。伯胺攻击 相邻的NTA,打开NTA的环结构,释放CSO,结果产生伯胺。这个伯胺现 在攻击阵列中的下一个NTA单元。结果,形成了通过其官能团(OH和NH2) 连附到DNA链上的多聚体。最后,连接DNA链和NTA单元的接头被断裂。 在这个例子中得到的多聚体是由DNA序列dUdA编码的携带有OH和NH2官能团的β-肽。在显示的例子中,与5’到3’RNA以N端到C端方向编 码α-肽的天然编码系统相反,序列5’-dUdA-3’以C端到N端方向编 码β-肽。β-肽通过它的C-末端被连附到编码DNA上。

C)掺入、聚合以及活化的图示。编码的多聚体通过引发剂分子被连 附到编码分子(DNA)上。

图8β-二肽的N-端附着-掺入、聚合和活化

(A)引物、两个单体构件和寡核苷酸(oligo)的结构。引发剂分子 被连附到引物3’-端U的5号位上。引物与模板的上游部分互补。引发 剂是Fmoc-保护的胺。UTP衍生物携带有光保护的羟基。该羟基被连附到 N-硫代羧酸酐(N-thiocarboxyanhydride)(NTA)环结构上。ATP衍生 物在7号位上被修饰。光保护的胺被连附到NTA上。寡核苷酸与模板的 下游序列互补。寡核苷酸带有被连附到寡核苷酸5’端U上的活性硫酯。 硫酯在水中的稳定性能够根据需要通过改变硫酯成分的结构被修饰(在 本例中,硫醇成分是苯硫酚)。

(B)引物(被退火到模板上,图中没有显示)通过聚合酶掺入UTP和 ATP从3’-端延伸。接着引发剂被哌啶激活,释放伯胺。伯胺攻击相邻 的NTA,打开NTA的环结构,释放CSO,结果产生伯胺。这个伯胺现在攻 击阵列中的下一个NTA单位。结果,形成了通过其官能团(OH和NH2) 连附到RNA链上的多聚体。最后,连接RNA链和NTA单位的接头被断裂。 得到的多聚体是核糖核酸序列UA编码的带有-OH和-NH2官能团的β-肽。 与天然编码α-肽的方式相似,序列5’-UA-3’在N端到C端方向上编 码β-二肽。β-肽通过它的N-末端被连附到编码RNA上。

C)掺入、聚合以及活化的图示。断裂接头亚集合之后,编码的多聚 体被连附到下游的寡核苷酸上。

图9已知通过DNA或RNA多聚酶被掺入进RNA或DNA链的核苷酸衍 生物

顶部:核苷酸、四个碱基和分子部分(R)的连附位点。

中间:被聚合酶接受作为底物的具有附属物(R)的核苷酸

底部:可以被本发明使用的具有附属物(R)的核苷酸。化合物(a) 将在例如填充实验中使用(见图15)。化合物(b)将在例如拉链式聚合 反应中使用(见图14和图14,例1)。化合物(c)将在开环聚合反应 中使用(见图18和图18,例1)

图10可断裂接头和保护基团

可断裂接头和保护基团,可用于断裂它们的试剂以及断裂产物。

图11通过相邻II型反应基团之间反应的聚合

为了清楚起见,在图中仅仅显示了聚合反应(没有显示活化反应)。X 代表功能实体的II型反应基团。在本例中两个II型反应基团是相同的。

聚合(X与X反应,形成XX)或者在单体构件被掺入时自然发生,或 者通过条件(例如pH)的改变或添加诱导因素(例如,化学的或紫外线 暴露)诱导发生。

图11例1基于香豆素的聚合

香豆素单位的光诱导反应和随后的活化(接头的断裂)导致形成芳香 族和脂肪族环结构的多聚体主链。显示了官能团(磷酸酯,羧酸和苯胺) 的例子。

图12

相邻不相同II型反应基团之间的聚合

在这个例子中,X可与Y,而不与另一个X反应。同样地,Y不与Y 反应。聚合能够或者在构件掺入期间(如图中所示),或者在几个构件的 掺入之后发生。

图13缺乏定向聚合时的簇形成(cluster formation)

当掺入的单体就环绕将功能实体连接到互补元件上的键的旋转而言 不固定时,可以导致如在图中显示的簇形成。

这对较长多聚体是重要问题。这个问题可能通过以下方法解决:(i) 在优选方向上固定掺入的单体,不允许X和Y(II型反应基团)交换阵 列中的位置(例如,将功能实体和互补元件通过双键或两个键偶联,例 如将功能实体偶联到核苷酸上的碱基和核糖上,或偶联到二核苷酸的两 个碱基上),(ii)使用定向聚合(“拉链式”,例如见图17),或(iii) 建立保证单体在掺入进互补模板的期间或之后立即反应的条件,即在下 个单体掺入以前,每个单体与先前掺入的单体反应(例如参见图14,连 同例子)。

图14拉链式聚合(zipping-polymerization)和同时发生的活化

聚合导致多聚体的活化。在本例中X和Y之间反应的几何学与所有参 与聚合的单体是相同的。

图14,例1

同时发生的掺入、聚合和活化——肽的形成

(A)掺入附加有氨基酸硫酯(thioester)的核苷酸衍生物。在核苷 酸衍生物的掺入期间或之后,胺攻击(先前掺入的)相邻核苷酸的羰基。 这导致形成酰胺键,延伸了一个肽单位。当下一个单体被掺入时,其可 以攻击硫酯羰基,导致二肽从核苷酸上断裂形成三肽。该过程进一步在 互补模板下游继续,直到核苷酸衍生物的掺入停止。重要地是,亲核攻 击的几何学保持不变。由于在模板上的亲核胺的局部浓度远比溶液中高, 溶液中的反应预期不会显著影响正确编码多聚体的形成。此外,可以在 几个方面调整胺与酯的反应性。影响其反应性的参数包括:(i)pH和温 度,(ii)长度,连附到核苷酸上的点,以及连接酯和核苷酸的接头的特 性(电荷、刚性、疏水性、结构),(iii)酯的性质(硫酯、磷酸酯或羟 基酯),(iv)硫上取代基的种类(见下面的(B))。另外,正确多聚体形 成的效率也受到掺入速率和一旦掺入后的反应速率的影响。掺入速率通 过kcat和Km确定。kcat和Km值可以通过改变条件(pH、核苷酸的 浓度、盐、模板和酶)、通过酶的选择、或通过经蛋白质工程改变酶的特 性来调整。核苷酸衍生物的性质和大小可能也影响它的掺入速率。

这个包括掺入、聚合和在构件掺入的期间或之后立即活化的一般方 案,能够应用于绝大多数亲核聚合反应,包括使用相似的结构,形成各 种类型的肽、酰胺、和酰胺样的多聚体(例如,单取代、二取代、三取 代和四取代的α-,β-,γ-,和Ω-肽、聚酯、聚碳酸酯、聚氨基甲酸酯 (polycarbarmate)、聚脲)。

(B)具有不同取代因此对亲核体具有不同反应性的四个不同硫酯。

图14,例2同时发生的掺入、聚合和活化——多胺的形成

该图显示了“滚环聚合反应”,其中包含亲核中心的链攻击连附到DNA 部分上的亲电子试剂,利用这个DNA部分作为离去基团。

图15“填充”聚合(″fill-in″polymerization)(对称的XX单体)

通过II型反应基团(在图中为“X”)和桥接分子(图中是(Y-Y)) 之间反应的填充聚合。

为了清楚起见,在附图中仅仅显示了聚合反应(没有显示活化反应)。 粗线代表双链或单链核酸或核酸类似物。X代表功能实体的II型反应基 团。在这个例子中两个II型反应基团是相同的。在单体构件掺入以前、 掺入期间或之后,向混合物中加入(Y-Y)。同样地,X和Y之间的有效 反应可以在单体掺入期间或之后发生。

图15,例1,通过填充聚合形成聚亚胺(poly-imine)

向掺入的二胺中过量加入二。结果形成聚亚胺。在这个例子中,多 聚体携带有下列官能团的序列:环戊双烯基、羟基和羧酸。

图15例2

聚酰胺的形成

在附带了二胺的核苷酸掺入之后,使用标准偶联条件向寡核苷酸上的 伯胺过量加入EDC(1-乙基-3-(3-二甲基氨基丙基)碳二亚胺)和 二羧酸。作为选择地,可以在pH7-10的条件下过量加入二-(N-羟基 -琥珀酰胺酯)。结果,在两个相邻核苷酸附带物之间形成了两个酰胺键。 这种聚合之后,附带物从寡核苷酸主链上被分离(活化),留下一个完整 的接头,并且将被保护的官能团去保护暴露官能团。最终的结果是DNA 标记的聚酰胺。

得到聚酰胺的另一个可选路线是掺入附带有二羧酸的核苷酸,接着加 入二胺和EDC,在寡核苷酸的单个核苷酸之间形成酰胺键。作为选择地, 核苷酸衍生物可含有N-羟基-琥珀酰亚胺基(NHS)酯,其将与加入的 胺反应而不需加入EDC。最初,在掺入是通过聚合酶介导的情况下,认为 这后一种方法是有疑问的,因为NHS-酯可能会与聚合酶上的胺反应,潜 在地抑制聚合酶的活性。然而,实际的实验已经证明掺入NHS-衍生化的 核苷酸是可能的。

(A)得到的多聚体的主链包括或基本上由酰胺键接的芳香环组成。 这个例子中的取代基是被保护的伯胺、支链戊基、叔胺和嘧啶基。保护 伯胺是为了避免它与二羧酸反应。合适的保护基团将是例如,Boc-、Fmoc、 苄氧羰基(Z,cbz)、三氟乙酰、邻苯二甲酰,或例如在(T.W.Green and Peter G.M.Wuts(1991),Protective Groups in Organic Synthesis) 中描述的其它氨基保护基团。

(B)主链包括或基本上由通过酰胺键连接的芳香环组成。取代基是 茚满基(indanyl)、二苯基氧膦基、酰胺基乙基和胍基丙基,后两个分 别代表天冬酰胺侧链和精氨酸侧链。由于胍基官能团比标准胺的反应性 更强,因而被保护起来。合适的保护基团将是Mtr(4-甲氧基-2,3,6-三 甲基苯磺酰基),Mts(_-2-磺酰基)或Pbf(2,2,4,6,7-五甲基二氢- 苯并呋喃-5-磺酰基)。

图15,例3

聚脲形成

掺入的核苷酸衍生物与光气或光气等价物,如CDI反应形成聚脲。断 裂接头并且将被保护的羟基去保护。

合适的离去基团(Lv)是氯化物、咪唑、硝基三唑、或其它有机合成 中常用的易于离去基团。

图15,例4

手性和非手性聚脲主链的形成

在这个例子中,官能团Rx用作可断裂接头,一经活化之后它就产生 期望的官能团。在(A)和(B)中都形成聚脲。

在(A)中,官能团通过手性碳被连附到主链上。这个碳上的氢被画 出来以示突出。在聚合之前,连接手性碳和官能团的键可以自由旋转。 当II型反应基团(胺)与光气等价物(例如,羰基二咪唑)反应形成多 聚体时,构件可能在两个方向(如通过氢原子的位置所示的,左或右) 的任何一个方向上被插入。结果,多聚体的每个残基有两个可能的手性 形式。因此,虽然给定的编码分子将编码具有特异残基序列的多聚体, 但是5个或15个残基的编码多聚体将分别有25=32或215=32768个立 体异构体。在某些情况下,在文库(例如当多聚体相对短时)中掺入这 样额外的结构多样性可能是有利的。在其它情况下,是不希望这样额外 的多样性的,因为筛选效率可能被打折扣,或者因为对在筛选过程中与 由同一个编码分子编码的其它立体异构体一起分离的多聚体的结构进行 去卷积(deconvolute)变得太困难(例如当多聚体长时)。

在(B)中,(A)的手性碳被氮替代。结果,得到的多聚体主链是非 手性的,并且编码分子编码一种特异性的结构。

图15,例5

聚磷酸二酯的形成。

掺入的核苷酸衍生物与活化的磷酸二酯反应形成聚磷酸二酯。接着断 裂接头,产生通过接头连附到编码分子上的聚磷酸二酯

合适的离去基团(Lv)的例子是咪唑。

图15,实例6

在每个单体构件中具有一个II型反应基团的聚磷酸二酯的形成

每个掺入的核苷酸含有活化的磷酸二酯。加入二羟基化的化合物,如 1,3-二羟基吡啶之后,官能化的聚磷酸二酯就形成了。最后,通过断 裂保护基团/将它们连接到寡核苷酸上的可断裂接头,从互补模板中释放 官能团Rx。

图15,例7

周环“填充式”聚合

核苷酸衍生物掺入之后,过量加入1,4-苯醌导致形成多环化合物。 最后,除了一个完整保留的(不可断裂的)接头以外,通过断裂将多聚 体连接到核苷酸上的接头活化多聚体结构。

图16

被编码的“填充”

通过所描述的方法进行编码填充。被编码的填充部分是第二构件的 Y-Rx-Y。使用这种方法,有可能通过预定的功能实体Y-Rx-Y连接两个功 能实体X-Rx-X。在一些实施方式中,因为被编码的填充功能实体Y-Rx-Y 不必象图15所示方法的情况那样在整个分子中都相同,因此这种方法可 能是有利的。

图17

“填充式”聚合(非对称的XS单体)

通过II型反应基团(图中“X”和“S”)和桥接分子(图中(T-Y)) 之间的反应的填充聚合。

为了清楚起见,仅仅显示了聚合反应(没有显示活化反应)。粗线代 表双链或单链核酸或核酸类似物。X和S代表功能实体的II型反应基团。 在这例子中,两个II型反应基团是不同的。在单体构件的掺入之前、掺 入期间或掺入之后,向混合物中加入(T-Y)。同样地,X和Y之间、S 和T之间的有效反应可以在单体掺入期间或之后发生。

图17,例1

通过修饰的Staudinger连接和-酰肼反应填充聚合

构件的反应基团(II型)X和S是叠氮化合物和酰肼。加入的填充构 件之间间隙的分子携带有酮和膦部分。酮和酰肼之间的反应、以及叠氮 化合物和膦之间的反应是化学选择很高的。因此,大多数官能团Rx不需 要保护就能够在聚合反应期间使用。分子部分R、R1、X和Y的例子可以 在(Mahal等(1997),Science 276,pp.1125-1128;Saxon等(2000), Organic Letters 2,pp.2141-2143)中找到。

图18

“拉链式”聚合

引发剂分子(典型地位于新生多聚体的一端)通过例如去保护或改变 pH而被活化。引发剂分子接着与相邻单体的反应基团X反应。这活化了 用于攻击相邻X的反应基团Y。聚合接着以“拉链”的方式行进到分子的 另一端,直到所有的期望单体被连接。引发剂分子(和反应基团Y)的活 化可用于其对相邻反应基团的攻击,或者它的活化用于受相邻反应基团 的攻击。

图18,例1

自由基聚合

碘化物引发剂分子是通过加入自由基引发剂,例如过硫酸铵、AIBN (偶氮二异丁腈)或其它自由基链反应引发剂被活化的。自由基攻击相 邻的单体,形成新的自由基和头两个单体之间的键。最后形成整个多聚 体,并且多聚体可被活化,同时产生官能团Rx。

图18,例2

阳离子聚合

通过将阵列暴露于强路易斯酸产生阳离子。相邻单体的双键与这个阳 离子反应,由此正电荷转移到相邻的单体。最后形成整个多聚体,并且 最后被活化。

图19

通过开环的拉链式聚合

引发剂与环结构的反应基团X反应,这可打开环,由此同一个功能实 体中的反应基团Y被活化与相邻功能实体中的反应基团X反应。

图19,例1

N-硫代羧酸酐的“拉链式”聚合,形成β-肽

构件掺入之后,引发剂去保护。伯胺接着攻击相邻N-硫代羧酸酐 (N-thiocarboxyanhydride,NTA)单位的羰基。结果,释放CSO,并且 产生伯胺。这种胺现在将与阵列中的下一个NTA单位反应,而且最后所 有的NTA单位都将反应,形成b-肽。最后寡聚体被活化。

可以设想对该设置的许多改变。例如,人们可使用羧酸酐代替硫代羧 酸酐。引发剂可用碱或光不稳定的基团保护。如果选择碱不稳定的保护 基团,则必须要考虑羧酸酐的稳定性。在较高的pH时,使用羧酸酐比硫 代羧酸酐更有利。最后,引发剂可以无保护,例如被偶联到引物上。在 这种情况下,溶液中引发剂的浓度将非常低(典型地从纳摩尔到微摩尔), 因此仅仅是极小量的引发剂将与羧酸酐反应。在构件掺入之后或掺入期 间引发剂和羧酸酐的局部浓度将非常高,从而导致有效的聚合。

使用相似的环结构,能够制备其它类型的肽和肽样多聚体(例如,单 取代,二取代,三取代和四取代的α-、β-、γ-、和Ω-肽、聚酯、聚碳酸 酯、聚氨基甲酸酯、聚脲)。例如,通过五元羧酸酐环的聚合可以制备α- 肽。

图19,例2 2,2-diphenylthiazinanone单位的“拉链式”聚合形 成β-肽

去保护的亲核试剂伯胺,攻击相邻硫酯的羰基,因此形成酰胺键。释 放的硫醇重组形成硫酮。结果产生了游离伯胺,其攻击相邻硫酯的羰基, 等等。最后形成了通过其C末端连接的α-取代的β-肽。伯胺与酯的反应 性可以例如通过酯(硫酯或常规酯)的选择、聚合反应期间的pH以及芳 香环上取代基的选择来修饰。环部分包含的仲胺以及环打开后释放的伯 胺的相对活性可以通过仲胺和硫酯之间碳处的体积(bulk)来调整。例 如用一个芳香环替代两个芳香环将降低仲胺周围的体积,使它更具有亲 核性,而开环之后形成的伯胺的亲核性不受这个位置上体积的影响。其 它的肽和酰胺样多聚体可以通过这个原理形成。例如,γ-肽可以通过7 元thiazinanone环的聚合形成。

图19,例3

开环聚合形成聚醚

引发剂通过例如碱或酸去保护。形成的阴离子接着攻击相邻单体的环 氧化物,形成醚键。结果,在相邻单位形成阴离子。这攻击阵列中的下 一个单体,最后形成了全长的聚醚。依赖于反应条件,攻击将至多或至 少(分别在酸性或碱性条件)被环氧化物的碳阻碍。

在最后的步骤中,编码的聚醚被活化。在这种情况下,多聚体完全地 从编码分子中释放出来。对相关特性(例如,基于细胞的分析中的效果 或酶的活性)的筛选可以在微量滴定板孔内或微团中完成,每个区室含 有一特定的模板分子和多拷贝的模控合成的聚醚。这样,模板和模控分 子物理结合(通过区室的边界),并且因此编码具有感兴趣特性聚醚的模 板可以从这些区室收集、合并、扩增和“翻译”成更多个聚醚拷贝,这 些聚酯接着可以用于新一轮的筛选。

图20

通过重排的拉链式聚合和活化

引发剂被活化受Y攻击。引发剂和Y的反应导致引发剂从互补元件中 释放。与起始分子反应之后,构件分子发生重排,导致X活化与Y发生 反应。许多反应和重排之后形成了多聚体。

图21

通过开环的拉链式聚合和活化

起始分子与环结构中的X反应打开环,导致Y的活化。现在Y能够与 相邻功能实体中的X反应。作为开环的结果,功能实体被从互补元件中 释放出来。

图22

使用固定的功能单位的定向多聚体形成

(A)构件的功能实体可以通过两个接头被连附到互补元件上。这可 能将功能实体在相对于互补模板的指定方向上固定。结果,围绕连接功 能实体和互补元件(如在图13中描述的)的接头旋转是不可能的,因而 也不太可能形成簇。

(B)两个接头将二核苷酸衍生物的两个碱基与功能单位连接,功能 单位在本例中是二肽。这种二核苷酸衍生物掺入到双螺旋结构中,将胺 (上面(A)中的X)置于接近酯(上面(A)中的Y)的位置。这种酯可 被活化为,例如N-羟琥珀酰亚胺酯。胺和酯反应之后,形成多肽。这 种多肽将是具有N到C末端方向的定向多聚体。在本例中,聚合反应会 将酯从它连接的碱基上断裂下来。因此,所形成的多聚体的活化仅仅需 要断裂将二核苷酸的3’端的碱基与功能实体的氨基端连接的接头。

功能实体相对互补元件的旋转固定可以通过其它方式完成。例如, 功能实体可以通过双键被偶联到互补元件上,或者可以通过两个键分别 被连附到核苷酸的碱基和核糖部分上,或者可以被偶联到核糖或碱基上 的不同位置上。最后,也可连接到磷酸酯部分,特别是二核苷酸的磷酸 酯部分。

图23显示四个通过单个接头将双官能FE连附到亲代核苷酸(左侧) 上,或者用额外的接头使用第二连附点(右侧)连附双官能FE的实例。 第二连附能够发生在相邻核苷酸(A)、亲代核苷酸的糖基部分(B,通过 酯官能度或C,游离酯官能度,和D,也游离酯官能度)上的任何位置, 第二连附可以是亲代核苷苷酸(没有显示)的另一个碱基位置,或者FE 可以被连接到磷酸酯主链上(没有显示)。

图24显示具有以不同方式连附的接头-FE 1A的DNA双螺旋(上链 5’-GCTTTTTTAG-3’)。DNA主链用箭头显示,糖和碱基用环显示。接头 -FE原子用棍棒表示法来描述,并且原子被着色。A.具有单连附FE的构 象的例子。B.A的最可能的产物。C.导致成簇和因而导致不完全产物D 的单连附FE的构型的实例。E.具有双连附FE的最小能量构象以及唯一 可能的产物F。G.棍棒代表从F中释放的产物。H.棍棒代表从B中释放 的产物。I.棍棒代表从D中释放的产物。

图25显示具有以不同方式连附的接头-FE 1B的DNA双螺旋(上链 5’-GCTTTTTTAG-3’)。DNA主链用箭头显示,糖和碱基用环显示。接头 -FE原子用棍棒表示法来描述,并且原子被着色。A具有单连附FEs的 最小能量构象。B.A最可能的产物。C.导致成簇和因而导致不完全产物 D的单连附FE构型的例子。E.具有双连附FEs的最小能量构象以及唯一 可能的产物F。G.棍棒代表从B和F中释放的产物,H.棍棒代表从D 中释放的产物。

图26分子的模控合成(templating)—-原理和变式

在图26-27、29-31、33-35、37-49、和53中,模板、互补模板、 模板和互补模板两者、或者互补元件是用水平线(粗体)表示。在图26-28、 35-37、和39中,圆圈用来表示功能实体。

A本图中所使用单体构件。黑点表示可断裂接头。

B一般原则

步骤1——掺入。通过(模板的)编码元件和(单体构件的)互补 元件之间的特异性相互作用,单体构件特异性掺入到互补模板中。

步骤2——反应。通过II型反应基团的反应,诱导单个单体构件的 功能实体(FE)的偶联反应。

步骤3——活化。断裂一些或所有将FE单位与互补元件连接的接头, 因此部分或完全释放模控分子。

步骤4(在图中没有显示)——筛选、扩增和修饰。模板-模控分子 复合物可以通过从库中富集具有期望特性的复合物的筛选过程获得。接 着被富集库的模板可以通过例如诱变PCR被扩增和修饰,并通过实施步 骤1-3再生模控分子。

C

直链、分支和环状模板的模控合成

直链、支化和环状的模板可以产生直链、支化和环状的模控分子。在 显示的例子中,可以通过将修饰的核苷酸(例如,带有硫醇)掺入寡核 苷酸中,接着通过与含有硫醇反应性成分(例如,一端是来酰亚胺单 位)的寡核苷酸反应而产生支化模板。环状模板同样可以是寡核苷酸, 在末端携带有可以反应以共价关闭环的反应基团(例如,在寡核苷酸的 两端的硫醇能形成二硫键)。除一个以外所有连接FE和互补元件的接头 被断裂之后,就形成了在一点连附到模板上的环状模控分子。

D通过直链模板模控合成直链、支化、环状和混乱直链分子

(a)在单体构件掺入之后,但在反应以前获得的具有相同FE序列的 直链模控分子。(b)具有混乱序列(Scrambled Sequence)的直链模控 分子,即模控分子中的FE序列与刚好在掺入之后,但在FE反应之前获 得的FE序列不相符。(c)通过下述FE相互之间成对反应获得的环状模 控分子:FE1/FE2、FE2/FE3、FE3/FE5、FE5/FE4、FE4/FE1。(d)通过下 述功能实体相互之间成对反应获得的支化模控分子:FE1/FE2、FE2/FE3、 FE2/FE4以及FE4/FE5。(e)通过下述功能实体相互之间成对反应获得 的支化分子:FE1/FE2、FE2/FE4、FE2/FE5、FE2/FE3。

图27反应基团(X)和(Y)的数量不相等。反应基团(X)的数量 可高于,等于或低于反应基团(Y)的数量。当(X)和(Y)的数量不同 时,导致混乱(Scrambling)。在图中支架结构(单体构件的官能团被连 附的分子部分)被直接连附到模板上。支架结构也可以是单体构件的一 部分(即,单体构件的功能实体包括支架结构部分,包括II型反应基团 (Y)在内。

(A)每个模板中编码的反应基团X的数量等于锚定点(也称为支架 结构)上反应基团(Y)的数量。

(B)每个模板编码的反应基团X的数量少于支架结构上可编码的取 代基位置Y的数量。就支架结构(锚定点)上的哪些反应基团(Y)将与 单体构件上的(X)反应而言,这导致混乱。

(C)每个模板中编码的反应基团X的数量大于支架结构上的反应基 团的数量。就支架结构(锚定点)上的哪些反应基团(Y)将与单体构件 上的反应基团(X)反应而言,这导致混乱。

图28单体构件

(A)具有一个连接官能团(Rx)和互补元件的II型反应基团(X)的 单体构件。这种类型的单体构件可以被用于同时发生的反应和活化方案 (图14)。

(B)具有两个连接互补元件和官能团(Rx)的II型反应基团(X和Y) 的单体构件。

(C)具有一个II型反应基团(X)的单体构件。反应基团(X)不连 接官能团(Rx)和互补元件,因此活化步骤需要接头(L)(以便将功能实 体从互补元件中释放)。

(D)具有四个II型反应基团(Y)的单体构件。四个反应基团和官 能团Rx可以作为支架结构,取代基团(由与相同模板互补的单体编码) 通过这些单体构件上的反应基团(X)与这个单体构件上的反应基团(Y) 的反应,被偶联到支架结构上。在这个例子中没有显示可断裂接头。因 此,在模控合成反应之后,模控分子可以通过这个单体构件的接头被连 附到模板上。

图29

包括同时发生的反应和活化的模控合成

使用4个各自具有一个II型反应基团(X)的单体构件和带有4个反 应基团(Y)的锚定点的模控合成。X和Y的反应包括同时发生的活化(断 裂),将X从互补元件中释放出来。

(A)II型反应基团(X)是相似类型的基团。

(B)II型反应基团(X1、X2、X3、X4)是不同种类的反应基团,即反 应X1/Y1、X2/Y2、X3/Y3和X4/Y4之间的成对反应是正交或部分正交 的。例如,X1优选与Y1反应,不与Y2、Y3或Y4反应。锚定点可以直接 被连附到模板上,或被连附到互补模板上。假使锚定点被连附到互补元 件上,总体上它被认为是单体构件。

图30

允许同时发生反应和活化的反应类型

显示了介导官能团从一个单体构件向另一个或向锚定点移位的不同 类型的反应。反应分成三个不同的类型:亲核取代、加成-消除反应和 过渡金属催化的反应。这些反应是与同时发生的反应和活化(如在图14 中概括地描述的)相容的。

(A)亲核试剂和羰基的反应。作为亲核取代的结果,官能团R被移 位到最初带有亲核试剂的单体构件上。

(B)胺对硫酯的亲核攻击导致形成酰胺键,有效地将硫酯的官能团 R移位到另一单体构件上。

(C)肼和β-酮酯之间的反应导致形成吡唑啉酮,有效地将官能团R 和R’移位到另一单体构件上。

(D)羟胺和β-酮酯之间的反应导致形成异噁唑酮,由此将R和R’ 基团移位到另一单体构件上。

(E)硫脲和β-酮酯之间的反应导致形成嘧啶,由此将R和R’基团 移位到另一单体构件上。

(F)尿素和丙二酸酯的反应导致形成嘧啶,由此将R基团移位到另 一单体构件上。

(G)取决于Z=O或Z=NH,Heck反应和随后的亲核取代导致形成 香豆素或喹啉酮(quinolinon),由此将R和R’基团移位到另一单体构 件上。

(H)肼和邻苯二甲酰亚胺的反应导致形成邻苯二甲酰肼,由此将R 和R’基团移位到另一单体构件上。

(I)氨基酸酯的反应导致形成二酮哌嗪,由此将R基团移位到另一 单体构件上。

(J)尿素和α-取代酯的反应导致形成乙内酰脲,并且R和R’基团 移位到另一单体构件上。

(K)可以通过各种亲核试剂与磺酸酯的反应实现烷化。这将官能团 R和R’基团移位到另一单体构件上。

(L)含有吸电子和离去基团的双活化烯烃的反应,由此烯烃被移位 到亲核试剂上。

(M)二硫化物与硫醇(mercaptane)的反应导致形成二硫化物,由 此将R’基团移位到另一单体构件上。

(N)氨基酸酯和氨基酮的反应导致形成benzodiazepinone,由此将 R基团移位到另一单体构件上。

(O)膦酸酯和醛或酮的反应导致形成取代的烯烃,由此将R”基 团移位到另一单体构件上。

(P)酸酯(boronate)与芳基或杂芳基的反应导致将芳基转移到 另一单体构件上(形成联芳基)。

(Q)磺酸芳基酯与硼酸酯的反应导致芳基的转移。

(R)硼酸酯与烯(或炔)的反应导致将芳基转移到另一单体构件上 形成乙烯基芳烃(vinylarene)(或炔基芳烃(alkynylarene))。

(S)脂肪族硼酸酯和芳基卤之间的反应,因此烷基基团被移位产生 烷基芳烃。

(T)过渡金属催化的通过烯醇醚和芳基卤之间的反应的α-烷化,因 此导致将芳香族部分移位。

(U)在例如烯胺或烯醇醚与醛之间的缩合导致形成α-羟基羰基或 α,β-不饱和羰基。这个反应将亲核部分移位。

(V)芳基卤通过例如,烯胺或烯醇醚的烷化。这个反应将亲核部分 移位。

(W)[2+4]环加成,将双烯烃部分移位。

(X)[2+4]环加成,将烯烃部分移位。

(Y)叠氮化物和烯烃之间的[3+2]环加成,通过烯烃部分的移位导致 形成三唑。

(Z)次氮氧化物(nitriloxides)和烯烃之间的[3+2]环加成,通 过烯烃部分的移位导致形成异噁唑。

图31包括非同时发生的反应和活化的模控合成:反应基团(II型) 反应,随后断裂连接功能实体与互补元件的接头

使用4个各自具有一个II型反应基团(X)的单体构件和带有4个反 应基团(Y)的锚定点的模控合成。X和Y的反应不包括同时发生的活化 (断裂),因此在X和Y的反应之后断裂接头,将官能团Rx从互补元件 中释放。

(A)II型反应基团(X)是相似类型的基团,即它们可以与相同 类型的反应基团(Y)反应。(B)II型反应基团(X1,X2,X3,X4)是不 同种类的反应基团,即X1/Y1、X2/Y2、X3/Y3和X4/Y4之间的反应是正 交(orthogonal)或部分正交的。例如,X1优选与Y1反应,不与Y2、 Y3或Y4反应。锚定点可以直接被连附到模板上,或被连附到互补模板上。 假使锚定点被连附到互补元件上,总体上它被认为是单体构件。

图32

反应基团(X)和(Y)对,以及产生的键(XY)

显示了可以被用于模控合成的反应基团的集合,同时显示了它们反应 之后形成的键。反应后,可能需要活化(断裂)(见图31)。

图33

模控分子的锚定部位

模控分子可以通过以下方式被连附到编码它的模板上:(A)通过在模 板末端附近直接连接到模板上的接头,或(B)通过在模板的更中心的位 置直接连接到模板上的接头,或(C)通过携带有锚定点(成为与模控分 子之连键的反应基团)的单体构件方式。

图34混乱(scrambling)

当功能实体在单体构件掺入之后反应时,模控分子上的官能团的位置 或序列可能不总是由模板序列唯一确定。

(1)官能团R1,R2,R3,和R4可能占据支架结构分子上四个位置 中的任意一个位置(即,单体构件的反应基团X可能与锚定点上的任意 反应基团Y反应。

(2)这个支化分子的一个臂上的序列可以是例如R5-R3-R2(如图所 示),或者R5-R2-R3(没有显示),或R5-R4-R3(没有显示),或者是其 它许多可能序列的任意一种。偶联到例如分子的左侧的官能团可能是R1, R2,R3,或R4中的任何一个。

(3)同(2)中一样,除了显示的序列R1-R2-R5-R4-R3外,可能存 在大量可能的官能团序列。

(4)这里显示了非混乱的模控分子,其中当掺入时功能实体的序列 与模控分子的序列(R1-R2-R3-R4-R5)对应。当需要时,可通过定向编码 或在接头中使用例如拉链盒(见图40,44-47),部分地或完全地避免杂 乱。

(5)同在(2)和(3)一样,可能存在功能实体的大量可能序列和 位置。

图35

单体构件——接头设计的例子

显示了在各种模控合成方案中使用的单体构件的不同设计。

互补元件可以通过寡核苷酸来代表,其上连附有携带功能实体的接 头。接头就互补元件而言可以占据内部位置或者作为选择地占据端点的 位置。互补元件和接头都可能由寡核苷酸(DNA,RNA,LNA,PNA,其它 能与单体构件的接头杂交的寡聚体及其混合物)组成。水平部分代表互 补元件,垂直部分代表接头。

标有“a”的接头部分可以存在或不存在。“a”区代表互作区,在 一个优选的实施方式中其是核苷酸序列。为了使接头更具刚性,“a”区 可能被退火到互补的单链核苷酸序列“a’”上。作为选择地,“a”区 可被用来与其它单体构件(即,拉链盒,见图42)相互作用,这样使得 两个单体构件的功能实体将靠得很近,这将增加这两个功能实体之间反 应的机率。这些区域的其它用处包括不同单体构件之间的相互作用,由 此可实现定向编码。

“Nu”是可以与亲电子试剂“E”反应的亲核试剂。

显示了在各种模控合成方案中使用的单体构件的不同设计。

(A)互补元件可以是寡核苷酸,携带功能实体的接头被连附到该寡 核苷酸的中心部分。标有“a”的接头部分可以代表核苷酸序列,为了 使接头更具刚性,单链核苷酸可能被退火到其上。

(B)互补元件和接头都可以由寡核苷酸构成。这里水平部分代表互 补元件,垂直部分代表接头。接头可含有功能是作为拉链盒的序列“a” (见图42)。

(C)(C)的单体构件是可以用作启动编码过程的引发剂或锚定点。

图36功能实体制备至基于寡核苷酸的单体构件上

显示了可以用于将功能实体偶联到修饰的寡核苷酸(用硫醇,羧酸, 卤化物,或胺修饰)的反应和试剂,而不发生与寡核苷酸的未修饰部分 显著的反应,或者作为选择地,用于连接接头和互补元件的连接反应。 商业上可以得到用于生产具有提到的修饰的起始寡核苷酸的单核苷酸。

图37

基于寡核苷酸的单体构件。接头以及功能实体(FE)设计和合成的 例子

显示了单体构件的互补元件包括例如长度是8-20核苷酸的寡核苷 酸(寡核苷酸是用粗黑线画出)的例子。部分或全部寡核苷酸可组成互 补元件。在仅有部分寡核苷酸代表互补元件的情况下,寡核苷酸的剩余 部分可构成接头。在本例中,接头被连附到寡核苷酸的3’或5’端的碱 基上。这种接头可以被连附在寡核苷酸序列中的任何核苷酸上,而且, 只要不破坏互补元件与模板的特异性相互作用,接头可以被连附到寡核 苷酸上的任何分子部分上。

(A)单体构件,其中的接头(L)连接末端核苷酸的碱基和功能实体。

(B)单体构件,其中的一个到二十个乙二醇单位之间的聚乙二醇(PEG) 接头连接互补元件和包含亲核试剂(伯胺)的功能实体。

(C)单体构件,其中的接头(L)连接含有亲电子试剂(酯或硫酯) 的功能实体。

(D)单体构件,其包括Boc-保护的胺(可以用温和的酸去保护) 和酯。去保护的胺可以与另一个单体构件的酯反应形成酰胺键。

图38基于寡核苷酸的单体构件。允许高度单体多样性的编码和互 补元件设计的例子。

(A)带有6个编码元件(BOX 1-6)的模板,各编码元件含有部分 随机序列(X表示C或G)以及在该组中对所有序列都相同的恒定序列(例 如,所有BOX 1序列带有中心ATATTT序列)。通过仅仅使用C和G(或者 作为选择地,仅用A和T),单个序列(例如,属于BOX 1序列组的序列) 具有几乎相同的退火温度,因此错退火可以忽略。在本例中,BOX 2和 BOX 3是相同的,因此BOX 2和BOX 3可能编码相同类型的功能实体(包 括相同类型的II型反应基团)。图中没有说明连接互补元件和功能实体 的接头的连附点。理想地,为了避免在退火过程中的偏差,接头被连附 到恒定区中的核苷酸上。

(B)编码元件序列的例子。显示了例子BOX 1和BOX 6序列。例子 BOX 1序列代表特异性退火到相应BOX 1互补元件上的1024种不同序列 中的一种特定序列;例子BOX 6序列代表退火到相应BOX 6互补元件上 的128种不同序列中的一种特定序列。

(C)使用六个单体模控合成。使用五类编码元件(BOX 2和3是相 同类型的编码元件,即,这种类型相应的互补元件都可以退火到BOX 2 和3)。II型反应基团X和Y反应;S和T反应;A和B反应;并且C和D 反应。在本例中,X/Y对对于S/T是正交对A/B是正交对C/D是正交的。 X和Y的反应导致R1从互补元件和断裂下来并且移位到R4。S和T反应, 随后断裂接头L导致将R2和R3移位到R4上。A与B及C与D的反应将 R5和R6移位到R4。在这个例子中,结合到BOX 4的单体的功能实体作 为“支架(scaffold)”,其上可以添加各种取代基团。

图39:一种用于模控分子筛选的典型淘选方案

通过DNA编码技术产生呈现多种小分子变体的模板。这些模控分子与 固定的靶分子温育。对靶有低亲和力的模控分子被洗去。保留的模控分 子被洗脱并且用PCR扩增模板。富集的模板接着准备用作下一个循环的 编码链。

图40:模控分子的阵列

图中显示了模控分子芯片。DNA文库以阵列的方式点在适当的表面。 模控分子文库(单链模板DNA)被加入并且允许与互补DNA链杂交。这将 允许模控分子的位点特异性的固定。含有靶分子的生物样品被加入,非 结合的材料被洗去。最后的步骤是每个单点中被结合材料的检测。

图41

使用刚性或部分刚性接头提高掺入的单体构件功能实体之间反应的 机率

(A)通过使用包括一个或多个柔性区(“铰链”)和一个或多个刚性 区的接头,可以增加两个功能实体进行反应性接触的机率。

(B)用于具有刚性部分和两个柔性铰链的单体构件的符号。

(C)具有(B)中所描述特性的单体构件:单体构件含有作为互补元 件(水平线)的寡核苷酸,和作为连接功能实体(FE)与互补元件的接 头的寡核苷酸。互补序列退火到接头的中心部分致使形成刚性双螺旋; 在接头的任何一端保留一单链区,构成两个柔性铰链。

图42

使用拉链盒增强掺入的单体构件功能实体之间反应的机率

(A)在这个实例中接头带有互补的拉链盒(a)或(a’)。通过在允 许(a)和(a’)瞬时相互反应的温度操作,使反应基团X和Y在多个退 火事件期间靠得很近,与以其它方式可实现的效果相比,这具有保持使X 和Y在较大部分的时间内靠得很近的效果。作为选择地,人们也可以使 温度在低温(拉链盒成对地稳定地相互作用)和较高温度(拉链盒分离, 但是互补元件仍然稳定地连附到模板的编码元件上)之间循环。通过高 温和低温之间循环几次,给定的反应基团X暴露于若干反应基团Y,并最 终反应形成XY键。

(B)两个基于寡核苷酸的单体构件的序列。指出了构成互补元件区, 接头和拉链盒的区域。

图43

有机化合物的模控合成——例子

(A)使用三个单体构件。每个单体构件包括活化的酯(II性反应基 团,(X)),其中酯部分携带有官能团Rx。酯和在支架(支架可被连附到 模板上)上的胺之间反应之后,就形成了酰胺键,并且Rx基团现在通过 酰胺键偶联到支架上。因此,这是同时发生反应(形成酰胺)和活化(从 互补元件中释放Rx部分)的例子,见图29。

(B)类似(A),三个胺与三个酯反应形成三个酰胺键,由此将官 能团Rx偶联到支架部分。不过,与(A)相反,支架在这里由模板编码。

(C)使用三个单体构件。最右边的亲核胺(锚定点的一部分)攻击 第三个单体的酯羰基;第三个单体的胺攻击第二个单体的硫酯,并且在 碱性条件下第一个单体的Horner-Wittig Emmans试剂与第三个单体的醛 反应。这形成了模控分子。双键可通过模控合成后氢化修饰形成饱和键, 或者作为选择地,经受迈克尔加成。

(D)支架结构的硫醇与单体1的吡啶-二硫化物反应。支架结构的 胺与第二个单体的酯反应。在存在碱时,双腈活化的α-位通过单体3’ 的硫酯酰化。芳基碘经历与单体4的芳基硼酸酯的Suzuki偶联产生联芳 基部分。

(E)单体1酰化伯胺。芳基碘经历与单体2的Suzuki偶联并且苄基 胺被单体3酰化。

肼酰化后紧接着环化导致形成羟基吡唑。芳基溴经历与单体1的芳基 硼酸酯的Suzuki偶联,最后与单体4的Horner-Wittig-Emmons试剂的 醛反应产生α,β-不饱和酰胺,其可进一步通过用H2/Pd-C还原或者经 历用亲核试剂的迈克尔加成官能化。

图44

α-和β-肽、肼肽(hydrazino peptides)和类肽(peptoids)。使 用基于寡核苷酸单体构件编码

显示了模控合成(templated synthesis)如何可以被用来生产α-和 β-肽,肼肽和类肽。

图45

通过使用环酐模控合成α-、β-、γ-、和ω-肽。

显示了如何通过使用环酐利用模控合成产生α-、β-、γ-、和ω-肽。

图46

反应基团X和Y反应之后,产生新反应基团

在X和Y反应致使形成新反应基团Z的情况下,这可以通过掺入携带 与Z反应的反应基团Q的单体构件,用于增加模控分子的多样性。

(A)X和Y反应形成Z,反应本身不导致其从互补元件中释放。Z和 Q反应之后,就断裂将Z连接到互补元件上的接头,形成模控分子。

(B)在这例子中,X和Y反应形成Z,同时断裂将X连接到互补元件 上的接头。Z和Q反应之后,就形成了模控分子。

图46,例1

通过产生新反应基团的模控合成

头三个单体构件的功能实体的反应导致形成两个双键,双键可以与两 个在第二个步骤中加入的单体构件携带的羟胺反应,并且导致形成酯, 酯可以与在第二个步骤中加入的单体携带的羟胺反应。最后,接头被断 裂,产生模控分子。

图47

可断裂接头

显示了可断裂接头,它们断裂的条件,以及所产生的产物。

图48

模控分子的模控合成后修饰

在实施模控合成过程之后,模控分子可被修饰而引进新特性。这个 列表描述了这些模控合成后修饰的一部分

图49显示了实施例64的结果。

图50显示了实施例65的结果。

图51显示了实施例66的结果。

图52显示了实施例67的结果。

图53显示了实施例68的结果。

图54显示了实施例72的结果。

图55显示了连接于互补模板的模控分子的展示。

图56显示了实施例99的结果。

图57A和B显示了实施例99的结果。

图58A和B显示了实施例99的结果。

图59显示了实施例99的结果。

图60显示了实施例102的结果。

图61显示了实施例104的结果。

图62显示了实施例105的结果。

图63显示了实施例106的结果。

图64显示了实施例112的结果。

定义

α-肽:包括或基本上由至少两个通过包括肽键的接头彼此连接的α- 氨基酸组成的肽。

氨基酸:包括由中间部分隔开的氨基末端部分(NH2)和羧基末端部分 (COOH)的实体,中心部分包括碳原子或碳原子链,包括至少一个侧链或 官能团。NH2指存在于氨基酸或肽氨基末端的氨基基团,而COOH指存在 于氨基酸或肽羧基末端的羧基基团。通称氨基酸包括天然和非天然氨基 酸两者。如在J.Biol.Chem.,243:3552-59(1969)中所列的、并且在 37 C.F.R.,section 1.822(b)(2)中被采用的标准命名法的天然氨基酸 属于本文下面表2中所列出的氨基酸组。非天然氨基酸是那些在表2中 未列出的氨基酸。非天然氨基酸的例子是那些在37 C.F.R.section 1.822(b)(4)中所列出的,其全部并入本文作为参考。非天然氨基酸进一 步的例子在本文下面列出。本文所述的氨基酸残基可以是“D”或“L” 异构型。

    符号     氨基酸     1-字母     3-字母     Y     Tyr     酪氨酸     G     Gly     甘氨酸     F     Phe     苯丙氨酸     M     Met     甲硫氨酸     A     Ala     丙氨酸     S     Ser     丝氨酸     I     Ile     异亮氨酸     L     Leu     亮氨酸     T     Thr     苏氨酸     V     Val     缬氨酸     P     Pro     脯氨酸     K     Lys     赖氨酸     H     His     组氨酸     Q     Gln     谷氨酰胺     E     Glu     谷氨酰     W     Trp     色氨酸     R     Arg     精氨酸     D     Asp     天冬氨酸     N     Asn     天冬酰胺     C     Cys     半胱氨酸

表2.天然氨基酸及它们各自的代码。

氨基酸前体:能够在前体掺入到肽中之后产生氨基酸残基的部分。

扩增:增加模控分子拷贝数的任何加工或加工步骤的组合。模控分子 可通过现有技术的任何方法进行扩增,所述方法包括但不限于,由聚合 酶链式反应增加每个模板的拷贝数,和通过该模板对模控分子的模控合 成,利用该模板合成包括官能团序列的模控分子的另外的拷贝。任何本 领域已知的扩增反应或这种反应的组合都可以被本领域熟练技术人员容 易地识别并适当地利用。因此,模控分子可通过利用聚合酶链式反应 (PCR)、连接酶链式反应(LCR)、体内扩增克隆的DNA等加以扩增。扩增 方法应当优选导致扩增后混合物的比例基本上代表扩增前混合物中不同 序列的模板的比例。

碱基:包括可供选择的糖或磷酸酯部分的天然或非天然核苷酸、或者 是这种核苷酸的衍生物的含氮碱基部分。碱基部分包括有别于天然存在 部分,并且能够与双螺旋中相对的核苷酸链中的一个或多个碱基互补的 任何部分。

构件:包括a)至少一个互补元件,互补元件包含至少一个能够识别 预定编码元件的识别基团,b)至少一个包含官能团和反应基团的功能实 体,以及c)至少一个将至少一个功能实体与至少一个互补元件分隔开的 接头的物质,其中构件不包括核糖体。优选的构件能够掺入至核苷酸链 中和/或能够通过涉及本文所述的I型和/或II型反应基团的反应连接。

可断裂接头:能够在预定条件下被断裂的残基或键。

断裂:打断化学键。该化学键可以是共价或非共价键。

编码元件:包括识别基团、并能够识别预定的构件互补元件的模板元 件。这种识别可能起因于能够彼此相互作用的编码元件和互补元件相应 对之间共价键或非共价键的形成。

编码元件互补:将编码元件与能够识别所说的编码元件的预定互补元 件进行接触。

互补:使编码元件与能够识别所说的编码元件的预定互补元件进行反 应性接触的过程。当编码元件和互补元件包含含有碱基部分的天然核苷 酸时,预定的核苷酸组能够通过碱基部分之间形成的氢键彼此互补。

互补元件:构件的元件。通过接头连接于至少一个功能实体。参见编 码元件。

互补模板:互补元件的序列,其中每个互补元件与相邻的互补元件共 价连接。互补元件能够识别预定的编码元件。互补模板可以是直链或支 化的。

复合物:连接于曾模控该模控分子合成的模板上的模控分子。模板可 以是如本文所限定的互补模板,其任选地与被连接的编码元件的相应模 板杂交或者以其它方式连附。

接触:使例如相应的反应基团或相应的结合配偶体或杂交配偶体彼此 进行反应性接触。反应性接触可由配偶体之间的反应或键的形成或杂交 证明。

相应的结合配偶体:能够彼此反应的结合配偶体。

相应的反应基团:能够彼此反应的反应基团。

功能实体:构成构件一部分的实体。功能实体包括官能团和能够连接 相邻官能团的反应基团。

官能团:构成模控分子一部分的基团。模控分子的官能团序列起因于 模板模控该模控分子合成的能力。

相互作用:可与接触互换使用。使物质,例如对应的结合配偶体,例 如编码元件和互补元件的形式的结合配偶体彼此进行反应性接触。反应 可以由形成相应的结合配偶体的识别基团通过共价或非共价键介导。这 种相互作用可以作为混合包括多个编码元件的模板和多个构件的结果而 发生。

配体:在本文用于描述能够靶向靶分子的模控分子。在候选模板分子 群中,配体能够以比该群体大多数大的亲和力结合。在候选混合物中可 以存在给定靶的不止一个配体。这些配体对靶分子的结合亲和力彼此之 间可以不同。

接头:将至少两种物质隔开的残基或化学键。这些物质可以保持在基 本固定的距离,或者接头是柔性的,并允许这些物质彼此之间有一定的 运动自由度。连接可以是共价键或非共价键。连接的物质包括例如构件 的相应的互补元件和功能实体、模板相邻的编码元件、互补模板相邻的 互补元件、以及模控分子相邻的官能团。

天然核苷酸:四种脱氧核糖核苷酸dA、dG、dT和dC(DNA的组分)以 及四种核糖核苷酸A、G、U和C(RNA的组分)中的任何一种,都是天然 核苷酸。每个天然核苷酸包括或基本上由糖部分(核糖或脱氧核糖)、磷 酸酯部分、以及天然/标准碱基部分组成。天然核苷酸按照公知的碱基配 对原则(Watson和Crick)与互补核苷酸结合,其中腺嘌呤(A)与胸腺嘧啶 (T)或尿嘧啶(U)配对;并且其中嘌呤(G)与胞嘧啶(C)配对,其中相应 的碱基对是互补反平行核苷酸链的一部分。碱基配对导致预定和互补核 苷酸之间的特异性杂交。碱基配对是酶能够催化与模板寡核苷酸互补的 寡核苷酸合成的基础。在这种合成中,构件(通常是A,T,U,C或G的 核糖或者脱氧核糖衍生物的三磷酸酯)由模板寡核苷酸指导形成具有正 确互补序列的互补寡核苷酸。互补序列对寡核苷酸序列的识别是通过相 应和相互作用的碱基形成碱基对介导的。在本质上,导致碱基配对的特 异性相互作用是由碱基大小以及碱基氢键供体和受体的类型决定的。大 的嘌呤碱基(A或G)与小的嘧啶碱基(T,U或C)配对。此外,碱基间碱基 对的识别受到碱基间形成的氢键的影响。在Watson-Crick碱基对几何学 中,六元环(天然寡核苷酸的嘧啶)与由稠合的六元环和五元环组成的环 系统(天然寡核苷酸的嘌呤)并列,中间的氢键连接两环原子,并且每侧 的氢键都与各个环上附加的官能团连接,供体基团与受体基团配对。

相邻:在序列中的定位是一个紧接着另一个的元件、基团、实体或残 基被表述为是相邻的。如果两个各自连接于功能实体的互补元件,通过 一个(或多个)不与功能实体连接的互补元件彼此相连,则前述的互补 元件被表述为是相邻的,并且所说的两个互补元件限定了能够彼此或者 是直接地或者是通过一个(或多个)编码元件连接的相邻编码元件和相 邻功能实体。

非天然氨基酸:不包括在本文上面表2中的任何氨基酸。非天然氨基 酸包括但不限于,修饰的氨基酸、L-氨基酸、以及D-氨基酸的立体异构 体。

非天然碱基配对:非天然核苷酸之间的、或者天然核苷酸与非天然核 苷酸之间的碱基配对。例子在US 6,037,120中有描述,其中描述了8个 非标准核苷酸,并且其中天然碱基被非天然碱基替换。如同天然核苷酸 中的情况一样,非天然碱基对包括单环六元环与由五元环与六元环稠合 的稠合双环杂环环系的配对。不过,用于碱基配对的氢键模式与天然AT、 AU和GC碱基对中所发现的氢键模式不同。在这种遵守Watson-Crick氢 键合原则的扩展的碱基对集合中,A与T(或U)配对,G与C配对,iso-C 与iso-G配对,而K与X配对,H与J配对,并且M与N配对(图2)。能 够进行碱基配对而不遵守Watson-Crick氢键合原则的核酸碱基也已经被 描述过(Berger等,2000,Nucleic Acids Research,28,pp. 2911-2914)。

非天然核苷酸:不属于天然核苷酸的定义内的任何核苷酸。

核苷酸:核苷酸在本文用于指能够以模板指导的方式被掺入寡核苷酸 中的天然核苷酸和非天然核苷酸,优选通过包括DNA或RNA依赖性DNA 或RNA聚合酶活性的酶,包括天然或重组DNA或RNA聚合酶的变体和功 能等价物进行掺入。包括的核苷酸部分以编码元件和互补元件形式的相 应结合配偶体能够通过氢键彼此相互作用。这种相互作用被通称为“碱 基配对”。核苷酸可以通过具有不同的磷酸酯部分、糖部分和/或碱基部 分而与天然核苷酸不同。核苷酸可以相应地通过天然键以磷酸二酯键的 形式,或者以非天然键的形式,例如PNA(肽核酸)中的肽键,与模板或 互补模板中各自的相邻物结合。

核苷酸类似物:能够与另一个核苷酸配对,但不能够被酶促掺入模板 或互补模板中的核苷酸。核苷酸类似物通常包括含有非天然碱基或非天 然主链结构的单体或寡聚体,不便于以模板指导的方式掺入到寡核苷酸 中。不过,与其他单体和/或寡聚体通过特异性碱基配对相互作用是可能 的。能够特异性碱基配对、但不能作为酶例如DNA聚合酶和RNA聚合酶、 或者其突变体或功能等价物的底物的可供选择的寡聚体,在本文被定义 为核苷酸类似物。寡核苷酸类似物包括例如天然寡核苷酸的磷酸二酯-糖 主链被替换为可供选择的包括肽核酸(PNA)、封闭核酸(LNA)、以及 morpholinos的主链的核苷酸。

核苷酸衍生物:进一步包括附加的分子实体的核苷酸或核苷酸类似 物。通常,衍生的构件(附加有分子实体的核苷酸)可利用该衍生核苷 的三磷酸酯作为底物,通过RNA或DNA聚合酶被酶促掺入寡核苷酸中。 在许多情况下,这种衍生核苷酸以高度特异性被掺入生长的寡核苷酸链 中,意味着该衍生物与模板的预定核苷酸相对插入。这种掺入将被理解 为特异性掺入。核苷酸可在碱基、核糖/脱氧核糖单位、或磷酸酯上衍生。 优选的碱基衍生位点包括腺嘌呤的8-位、尿嘧啶的5-位、胞嘧啶的5- 或6-位、以及鸟嘌呤的7-位。下面描述的核苷酸类似物可以在相应的位 置衍生(Benner,美国专利6,037,120)。可以利用其它的衍生位点,只 要这种衍生不破坏碱基配对的特异性。核糖或脱氧核糖优选的衍生位点 是5’、4’或2’位。在某些情况下,可能期望使核酸对降解稳定,并 且利用2’-修饰的核苷酸可能是有利的(US专利5,958,691)。再次地, 可使用其它位点,只要碱基配对的特异性不被破坏。最后,磷酸酯可被 衍生化。优选的衍生是硫代磷酸酯。核苷酸类似物(如下文所述)可与 核苷酸类似地衍生。显然上文提及的各种不同类型的修饰,包括i)衍生 和ii)分别用非天然碱基和可供选择的非天然主链结构替代天然碱基或 天然主链结构,可以在同一个分子中应用一次或不止一次。

寡核苷酸:在本文可与多核苷酸互换使用。术语寡核苷酸包含天然和 /或非天然核苷酸的寡核苷酸,包括其任何组合。天然和/或非天然核苷 酸可通过天然磷酸二酯键或非天然键连接。寡核苷酸与多核苷酸可互换 使用。

寡聚体(oligomer):包括多个相同、相同类型、或不同的单体的分 子。为了描述任何包括多于两个单体的分子,寡聚体与多聚体同义使用。 寡聚体可以是包括多个相同单体的同型寡聚体、包括相同类型的不同单 体的寡聚体、或者包括不同类型单体的杂寡聚体,其中每一类型的单体 可以相同或不同。

分配(partitioning):模控分子、或包括与模板连接的这种分子的 复合物优先与靶分子结合,并与对这种靶分子不具备亲和力并因此不与 之结合的模控分子、或包括与模板连接的这种分子的复合物分离的过程。 分配可通过各种本领域已知的方法完成。唯一的要求是分离结合于靶分 子的目标模控分子和不与靶分子结合的模控分子。分配方法的选择将取 决于靶分子和模控分子的性质,并且可以根据本领域普通技术人员已知 的原理和性质进行。

肽:限定序列并由酰胺键连接的多个共价连接的氨基酸残基。该术语 与寡肽和多肽类似地使用。氨基酸可以是天然氨基酸和非天然氨基酸, 包括其任何组合。天然和/或非天然氨基酸可通过肽键或非肽键连接。术 语肽还包含通过化学的或酶催化的反应引入的翻译后修饰,正如本领域 所公知的。如果需要,这种翻译后修饰可在分配之前引入。这里说明的 氨基酸将优选是L-立体异构形式的。可以使用氨基酸类似物代替20个天 然存在的氨基酸。已知许多这样的类似物,包括氟苯丙氨酸、正亮氨酸、 铃兰氨酸、S-氨基乙基半胱氨酸、4-甲基色氨酸等等。

多个:至少两个。

多聚体(polymer):以共价连接的分别包含官能团(包括H)的残基 的序列为特征的模控分子。根据本发明的多聚体包括至少两个残基。

多核苷酸:参见寡核苷酸。

前体:包括残基并能够在模板指导的模控分子合成期间发生反应的部 分,其中前体的残基部分构成为模控分子的组成部分。

反应基团:被造成相互反应性接触的相应反应基团,能形成连接例如 编码元件和它的互补元件的化学键,或者偶联模控分子的官能团。

识别基团:编码元件的一部分,并参与能够识别编码元件的互补元件 的识别。优选的识别基团是天然或非天然核苷酸的天然和非天然含氮碱 基。

重组:通过如下方法重组两个或多个序列的重组过程,所述方法的产 物是包括来自两个或多个序列中每一个的序列的序列。当涉及核苷酸时, 重组涉及两个或多个核苷酸分子之间在相同核苷酸序列的位点、或者在 不相同核苷酸序列的位点的核苷酸序列的交换,在这种情况下,重组可 随机发生。核苷酸序列中的一类重组在本领域被称之为基因改组。

重复序列:在分子中出现不止一次的至少两个元件、基团、或残基的 序列。

残基:多聚体包括共价连接的残基的序列,其中每个残基包含官能团。

核糖衍生物:构成能够酶促掺入模板或互补模板中的核苷一部分的核 糖部分。例子包括例如使核糖衍生物有别于天然核糖核苷,包括腺苷(A)、 鸟苷(G)、尿苷(U)和胞苷(C)的核糖的衍生物。更多的核糖衍生物的例 子描述于如US 5,786,461中。该术语涵盖脱氧核糖衍生物,并且与上述 的公开类似,这种情况下的衍生物使该脱氧核糖衍生物有别于天然脱氧 核糖核苷,包括脱氧腺苷(dA)、脱氧鸟苷(dG)、脱氧胸苷(dT)和脱氧胞 苷(dC)的脱氧核糖。

选择性可断裂接头:选择性可断裂接头在可断裂接头断裂的条件下不 可断裂。因此,有可能断裂连接模控分子官能团和互补元件的可断裂接 头,而同时不会断裂在同一个模控分子中连接一个亚组的互补元件和官 能团的选择性可断裂接头。从而可以获得包含模控分子和指导了模控分 子的模板介导的合成的模板的复合物,其中模板和模控分子通过一个或 多个,优选一个,选择性可断裂接头连接。

特异性识别:例如编码元件与优选一个预定互补元件的相互作用。当 编码元件识别基团对互补基团的亲和力导致形成最突出地只一种类型的 相应结合配偶体时,则发生了特异性识别。简单的错配掺入不排除相应 结合配偶体的特异性识别。特异性识别是以个案为基础定义的术语。在 预定的结合配偶体,例如模控分子和靶分子之间给定的相互作用的背景 下,观察到模控分子和靶分子之间的结合相互作用的亲和力比靶分子和 候选模板分子混合物之间所测得的亲和力更高。为了比较结合亲和力, 两个结合反应的条件必须在本质上相似并优选相同,并且该条件应当与 目的用途的条件相当。为了最精确的比较,可进行反映整个模控分子和 整个靶之间相互作用的测量。本发明的模控分子可或者通过建立要求必 需的特异性的筛选条件,或者通过改造或修饰模控分子按需筛选特异性。

亚单位:包括至少一个这种亚单位的编码元件的单体。

支持物:例如编码元件在与构件的至少一个互补元件相互作用期间可 以被连附其上的固体或半固体膜。功能分子或靶分子在靶向期间也可以 被连附到固体支持物上。支持物的例子包括平表面,包括片和珠子。

标签:能够鉴定它相联的化合物的实体。

靶分子:需要配体形式的模控分子的任何感兴趣的化合物。靶分子可 以是蛋白、融合蛋白、肽、酶、核酸、核酸结合蛋白、碳水化合物、多 糖、糖蛋白、激素、受体、受体配体、细胞膜组份、抗原、抗体、病毒、 病毒组份、底物、代谢物、过渡态类似物、辅因子、抑制剂、药物、可 控物质、染料、营养物、生长因子、毒素、脂质、糖脂等,不一而足。

模板:除非另外指明,模板既指编码元件的模板,又指互补元件的(互 补)模板。当指编码元件的模板时,每个编码元件与相邻的编码元件共 价连接。每个编码元件能够识别预定的互补元件。模板可以是直链或支 化的。编码元件的模板活泼地参与模控分子的合成,并且模控合成的活 性包括形成以编码元件:互补元件杂交物形式的特异性配对配偶体,其 中互补元件构成了还包括构成模控分子一部分的官能团的构件的一部 分。模板优选是核苷酸或核苷酸类似物串。当模板包括核苷酸串时,核 苷酸可以是天然或非天然的,并且可以通过例如硫代磷酸酯键或天然的 磷酸二酯键连接。核苷酸类似物可以例如通过酰胺键、肽键、或任何能 够连接核苷酸类似物的等价方法连接,以便允许该核苷酸类似物串特异 性地与另一核苷酸或核苷酸类似物串杂交。核苷酸或核苷酸类似物的糖 部分可以是核糖或脱氧核糖、核糖衍生物、或者任何其它允许模板或互 补模板特异性地与另一核苷酸或核苷酸类似物串杂交的分子部分。

模板指导的合成:与模板指导的掺入和模控合成同义使用。模板指导 的合成是一个过程,其中包括共价连接的官能团的序列的模控分子的形 成涉及编码元件串与特定互补元件的接触。该过程因此在编码元件和官 能团之间限定了一对一的关系,并且接触的模板编码元件指导官能团掺 入到包括共价连接官能团的序列的模控分子中。因此,在模控分子的官 能团序列和模控合成该模控分子的模板的编码元件序列之间存在预定一 对一的关系。因此,在模控分子模控合成期间,官能团最初通过接头部 分和/或互补元件或者以其它方式与能够将该特定官能团模控合成到该 模控分子中的编码元件进行接触。当模板包括或基本上由核苷酸组成时, 模板指导的寡核苷酸的合成是建立在每个核苷酸与模板中其配对配偶体 之间以一个碱基对一个碱基的方式相互作用的基础上的。这种相互作用 规定了互补核苷酸与模板中它们的碱基配对配偶体相对的掺入。因此, 当形成特异性碱基对时,来自每个寡核苷酸链的一个碱基(包括杂环碱 基)互相作用。这种碱基配对特异性可通过碱基之间的Watson-Crick氢 键相互作用实现,其中碱基可以是天然的(即A,T,G,C,U),和/或 非天然碱基例如US 6,037,120中所公开的,该文献并入本文作为参考。 更多非天然碱基的例子是如PNA(肽核酸)、LNA(封闭核酸)以及 morpholinos。含有非标准碱基对的寡核苷酸的碱基配对可通过除氢键之 外的方法实现(例如带“互补”结构的疏水核酸碱基之间的相互作用; Berger等,2000,Nucleic Acids Research,28,pp.2911-2914)。相 互作用的寡核苷酸链以及个体核苷酸被称为是互补的。寡聚体间相互作 用的特异性起因于核苷酸与其它核苷酸或预定核苷酸亚组的特异性碱基 配对,例如A碱基与U配对,而C碱基与G配对。

模控的(templated):包括连接于模控分子的模板的复合物中模控分 子的特性,其中模控分子可利用该模板通过模板指导的合成获得。因此, 该复合物中一个组份(模板)能够模控合成另一个组份(模控分子)。该 术语还用于描述包括将官能团掺入模控分子的模控分子的合成,其中每 个官能团的掺入包括使编码元件与特定的官能团、或者与包括所说的官 能团的构件进行接触,其中接触的模板编码元件指导官能团掺入到与以 这种方式模控合成该模控分子的模板连接的模控分子中。因此,在模控 分子的模控合成期间,官能团最初或者直接地或者通过接头部分和/或互 补元件与能够将该特定官能团模控合成到该模控分子中的编码元件进行 接触。

模控分子(templated molecule):包括共价连接的官能团的序列的 分子,其中该模控分子可利用该模板通过模板指导的合成获得。因此, 复合物中一个组份(模板)能够模控合成另一个组份(模控分子)。当模 板包括或基本上由核苷酸组成时,该模板能够被扩增,其中所说的模板 扩增产生多个模控分子,其中每个模控分子利用该模板通过模板指导的 合成产生。在扩增模板、或互补模板之后,模控分子可利用编码元件的 模板、或者互补元件的互补模板作为该模控分子模板指导合成的模板, 通过模板指导的合成产生。

模控合成(templating):产生模控分子的过程。

变体:分别表现出与预定的模板或模控分子一定程度的同一性或同源 性的模板或模控分子。

发明的详细描述

在本发明一个优选的实施方式中,提供了能够使巨大量的“模控多聚 体”(例如,如本文别处所描述的从大约103到大约1018或更多)得以产 生的“模控分子的化学展示”,其中每个模控分子单个地与“模板”连接, 该模板被用来鉴定该个体多聚体(它的残基序列),并且作为扩增工具 (多拷贝的该分子可通过复制该模板的步骤来制备)。本发明优选的实施 方式公开在图1中,其图解了本发明方法的各种步骤。

步骤1.合成

合成不同的单体构件。构件包括通过可断裂接头连接的功能实体和互 补元件(图3和4)。优选的构件包含通过可断裂接头附加了功能实体的核 苷酸,并且其中的功能实体包括或基本上由“可活化的”多聚体单位组 成(图6)。

步骤2.掺入

构件在模板依赖性多聚体合成中被用来作为底物。在一个实施方式 中,构件为核苷酸衍生物,并且优选利用聚合酶按着寡核苷酸模板的指 令将该核苷酸衍生物掺入到寡核苷酸链中。结果,互补模板(掺入的构 件串)得以形成,功能实体从其中突出来。该功能实体的序列是由模板 的编码元件,例如核苷酸的序列决定的。

图1描述了携带选择性可断裂接头的构件的应用,该接头在聚合及活 化后,能够将模控多聚体连接到其模板上。可供选择地,该选择性可断 裂接头可由能够在模板的多聚体编码部分的上游或下游退火的寡聚体组 成(参见图7或8),或者连接可以是直接地连接到模板上。

构件可以优选通过酶掺入,例如DNA聚合酶、RNA聚合酶、反转录酶、 DNA连接酶、RNA聚合酶、Taq DNA聚合酶、HIV-1反转录酶、Klenow片 断或者任何其它催化互补元件例如单、双或多核苷酸掺入的酶。在其中 一些情况下,引物是必需的(例如DNA聚合酶)。在其它情况下,不需要 引物(例如RNA聚合酶)。

步骤3.聚合

每个功能实体优选在形成互补模板期间或之后与相邻的功能实体反 应以形成多聚体。条件的变化、例如光解作用,温度的变化、或者pH的 变化,可在互补模板形成期间或之后引发聚合反应。

步骤4.活化

除了在一个或多个预定位点,包括单个位点,其中的接头在导致其余 接头断裂的条件下不可断裂,形成的多聚体优选通过至少一个接头、或 者多个可断裂接头的断裂从互补元件中释放。结果产生在一个或多个位 点、优选仅在一个位点与编码它的模板连接的模控多聚体。

步骤5.筛选和扩增

随后可进行筛选步骤,其中巨大量的、各自连接于指导它合成的模板 的不同模控分子,用分子或物理靶(例如生物受体或表面受体)攻击,或 者经受某些筛选。通过首先扩增模板,然后利用该模板进行新一轮的模 控多聚体的合成,具有预期特征(例如与受体结合)的模控分子被回收并 扩增。该筛选和扩增过程可重复多次,直到分离出具有合适特征(例如对 受体的高亲和力)的多聚体。

典型的筛选方案包括将模板-模控分子复合物群(文库)添加到亲和 柱上,该柱固定有某一分子靶(例如受体)。在洗涤柱子后,洗脱结合物。 洗脱液由富集的、对固定的靶分子具有亲和力的模板-模控分子复合物群 组成。该富集的群体可拿来进行扩增循环,然后经受另一轮筛选,其中 条件可选地可以更严谨。在许多轮这样的筛选-和-扩增之后,获得了富 集的高亲和结合物群。

当筛选模控分子在细胞中的内在化能力时,筛选步骤可以包括模板- 模控分子复合物群和细胞的简单混合。温育后(使模板-模控分子复合物 的内在化得以进行),洗涤细胞,而内在化的模板-模控分子复合物可通 过裂解细胞回收。如前所述,该模板-模控分子复合物可予以扩增并拿来 进行更多轮的筛选-和-扩增。在许多轮筛选-和-扩增之后,获得了富集 的具有内在化能力的模控分子群。

构件-分子设计

构件(也被称之为“单体”)优选是如图3和4所示常规设计的。在 一个实施方式中,单体包括下列元件:互补元件-接头-包括II型反应基 团的主链-官能团,其中互补元件包括或基本上由识别基团和I型反应基 团组成。在这种情况下,接头优选是“无痕迹的接头”,也就是在功能实 体上不留下任何(不需要的)分子实体的接头。具有这种组成的构件被 用于例如(图15,例7)中。

可供选择的,单体可具有互补元件-接头-官能团-含有II型反应基团 的主链的组成,在该情况下,希望的官能团作为接头断裂的结果而产生。 具有这种组成的构件被用于例如(图17,例1)中。

官能团必须与希望的互补元件掺入、它们聚合和活化的方法相适配。 显然,在这些步骤中保持模板和模控分子的完整性是很重要的。

与掺入、聚合或活化的条件不适配的官能团必须在这些步骤中加以保 护,或者作为选择的,官能团必须在这些步骤发生之后引入。后者是通 过模控合成与掺入、聚合和活化适配、并且可与活化后加入的双官能分 子(例如与希望的官能团Rx连接的硫醇)特异性反应的官能团(例如活化 的二硫化物)而实现的。作为选择的,可在活化之后通过对掺入的功能实 体进行氧化或任何其他形式的处理而引入官能度。以这种方式,用其他 方法难于操作的官能度例如天然效应分子或合成药物的组分,可被掺入。

在如本文所述的本发明方法的一些实施方式中,无需可断裂接头,因 为聚合反应包括对接头的断裂(图14和图14例1)。

当互补元件为核苷酸时,其可以含有一个、两个或若干核苷酸或核苷 酸类似物。二、三或更长的寡核苷酸的应用提供了许多优势。首先,可 以通过该模板编码更高的单体多样性。第二,功能实体与互补元件连接 部位的需求变得更为放松。第三,在形成的多核苷酸中每个单核苷酸容 积(bulk)会更少,潜在地导致更高的展示效率。第四,它允许展示具 有更长的残基-单元-长度的多聚体。并且,它允许展示更大的官能团。

假如使用聚合酶掺入含有核苷酸的构件,优选该核苷酸是以允许其特 异性并且有效地掺入到增长链中的方式而衍生的。

100种以上不同的核苷衍生物及核苷酸衍生物是商业上可得到的,或 者可利用简单的技术制备(Eaton,Current Opinion in Chemical Biology,1997,1:10-16)。此外,许多其碱基或核糖被修饰的核苷酸 衍生物,可通过各种聚合酶有效地和特异性地掺入,尤其是T7 RNA聚合 酶和反转录酶(图9)。添加物高达300Da的核苷酸已经被特异性地和有 效地掺入(Wiegand等,Chemistry and Biology,1997,4:675-683; Fenn和Herman,Analytical Chemistry,1990,190:78-83;Tarasow 和Eaton,Biopolymers,1998,48:29-37)。除了四种天然碱基对(AT 或AU、TA或UA、CG、GC),至少8种碱基对已知可特异性地杂交,其中 一些通过聚合酶以模板-依赖性的方式被掺入到寡核苷酸中。

互补元件的掺入可通过化学或生物学催化剂催化。当构件是核苷酸 时,特别相关的催化剂是模板-依赖性DNA-和RNA-聚合酶,包括反转录 酶,以及DNA-和RNA-连接酶,核酶以及脱氧核酶(deoxyribozymes)。 具体的例子包括HIV-1反转录酶、AMV反转录酶、T7 RNA聚合酶和T7 RNA 聚合酶突变体Y639F、测序酶、Taq DNA聚合酶、Klenow片段(DNA聚合 酶I的大片段)、DNA-连接酶、T7 DNA聚合酶、T4 DNA聚合酶、T4 DNA 连接酶、大肠杆菌(E.coli)RNA聚合酶、rTh DNA聚合酶、Vent DNA 聚合酶、Pfu DNA聚合酶、Tte DNA聚合酶、具有连接酶或复制酶活性的 核酶、例如在(Johnston等,Science,May 18,2001,pp.1319-1325) 中所描述的,以及其它接受核苷酸和/或寡核苷酸作为底物的酶。具有改 善的特征,举例来说,拓宽的核苷酸底物特异性的突变或工程聚合酶, 以及校对功能被消除的突变体(例如通过删除核酸酶活性),尤其相关。 聚合酶可利用单或双链核苷酸作为模板,并产生单或双链核苷酸产物。

已经表明可被聚合酶接受的修饰部位包括以下未详尽的例子列表(也 参见图9):

核苷酸             修饰部位

dATP              3-位

dATP              7-位

dATP              8-位

dATP              2’(脱氧核糖部分)

dTTP              4’(脱氧核糖部分)

dGTP              7-位

dCTP              2’(脱氧核糖部分)

dUTP              2’(脱氧核糖)

UTP               5-位

ATP               8-位

末端转移酶、RNA连接酶、多核苷酸激酶以及其它接受核苷酸和/或 寡核苷酸作为底物的模板依赖性酶,包括工程或突变变体,可用于本发 明所述的一些应用和方法的变式中。

有可能将功能实体连接到核苷酸的其它部位,而不会消除杂交或掺入 特异性。特别是在使用二-、三-、或多核苷酸互补元件的时候,有可能 将功能实体连接到这些可供选择的部位,而不会抑制特异性掺入。

可断裂及不可断裂接头

可断裂接头和保护基团、以及断裂它们的制剂,图示于(图10)。在 本发明的一个方面,接头可从以下列表中选择:碳氢化物 (Carbohydrides)和取代的碳氢化物;乙烯基(Vinyl)、聚乙烯 (polyvinyl)以及取代的聚乙烯;乙炔(Acetylene)、聚乙炔 (polyacetylene);芳基/杂芳基(Aryl/hetaryl)、多芳基/杂芳基 (polyaryl/hetaryl)以及取代的多芳基/多杂芳基;醚类、聚醚类例 如聚乙二醇(polyethylenglycol)以及取代的聚醚;胺、聚胺以及取代 的聚胺;双链、单链或部分双链的天然和非天然多核苷酸以及取代的双 链、单链或部分双链的天然和非天然多核苷酸;聚酰胺(Polyamides) 以及天然和非天然多肽以及取代的聚酰胺以及天然和非天然多肽。

在本发明的一个方面,优选接头不与处于同一个单体或其它单体中的 其它接头、互补元件或功能实体反应。并且,在本文主张的一些方案中, 希望接头不被聚合条件断裂。最后,优选接头的断裂条件不影响模板、 互补模板或功能实体的完整性。

接头可在预定条件下用许多方式中任何方式断裂。接头可以,例如用 酸、碱、光解、升高的温度、添加的制剂、酶、核酶或其它催化剂断裂。 可断裂接头及其相应保护基团的例子,连同接头断裂的条件、以及断裂 产物显示于(图10)。

为维持模板和模控分子间的物理连接,至少一个不可断裂的接头是必 需的。这个不可断裂的接头优选是可弯曲的,使其能够以最佳的方式暴 露模控分子。

官能团

功能实体上出现的一个或多个官能团可从许多种化学基团中选择,这 些基团赋予模控分子所需的性能或者用于其它的有益目的,象用于回收 目的的更高的亲脂性。官能团非限制性的选择显示如下:羟基;烷氧基、 氢;伯、仲、叔胺;羧酸;羧酸酯;磷酸酯(盐)、膦酸盐(酯);磺酸 盐(酯)、磺酰胺类(sulfonamides);酰胺;氨基甲酸酯类;碳酸盐(酯); 尿素类;烃、烯、炔;酐;酮;醛;Nitatrates、亚硝酸盐(酯);亚胺; 苯基和其它芳香基;吡啶类、嘧啶类、嘌呤类、吲哚、咪唑、以及杂环 碱基;杂环类;多环类(polycycles);黄素类(Flavins);卤化物;金 属;螯合物;基于机理的抑制剂;小分子催化剂;糊精类、糖;萤光素、 罗丹明以及其它荧光团;聚酮类、肽、各种多聚体;酶和核酶以及其它 生物学催化剂;用于聚合后/活化后官能团偶联的官能团;药物,例如紫 杉醇部分、阿昔洛韦部分、“天然产物”,超分子结构,例如纳米簇 (nanoclusters);脂质;以及寡核苷酸、寡核苷酸类似物(例如PNA、 LNA、morpholinos)。

II型反应基团

许多种II型反应基团可用于该模控合成中。反应基团的例子包括, 但不限于N-羧酸酐(N-carboxyanhydrides)(NCA)、N-硫代羧酸酐 (N-thiocarboxyanhydrides)(NTA)、胺类、羧酸、酮、醛、羟基、硫 醇、酯、硫酯、双键共轭体系、烷基卤、肼类、N-羟基琥珀酰亚胺酯 (N-hydroxysuccinimide esters)、环氧化物、卤代乙酰基 (Haloacetyls)、UDP-活化的糖类(saccharides)、硫化物、氰酸盐、 羰基咪唑、Thiazinanones、膦、羟胺、磺酸盐(酯)、活化的核苷酸、乙 烯基氯、链烯、以及奎宁类。

聚合

导致多聚体形成的反应称之为聚合反应。主要的反应类别是阴离子聚 合、阳离子聚合、自由基聚合以及周环聚合。

虽然溶液中的聚合反应通过现有技术的方法可以实现,与如本文所述 的阵列连接的功能实体的聚合不构成标准类型的反应。迄今为止,仅有 很少的聚合反应是以阵列的形式进行的,而且与本发明的方法无关联。 因此,它是一个功能实体和它们的接头及在互补元件上的连接点(例如连 接于核苷酸的碱基、核糖或磷酸酯)的分子设计问题,以及优化聚合条 件的问题,以便在提高或最大化阵列上正确的模板-指导的聚合的同时, 更优选地将溶液中发生的任何不需要的反应降低最小化甚至消除。

本发明在一个实施方式中,使用的聚合反应原则上就其常规地被用于 溶液合成方案而言是现有技术已知的。然而,在本发明中,反应物(反应 基团)通过它们与互补模板元件的连接而保持非常接近。这显著增加了 局部浓度。典型的溶液中合成方案利用1μM-1mM浓度的反应物。当 按照如本文所公开的排列时,局部浓度典型地将高成千倍到成百万倍。 因此,反应原则上更有效得多。不过,反应优选是以避免发生不需要的 副反应的这种方式设计。根据本发明的分子设计和聚合条件反应这个事 实,并且可由熟练技术人员进一步优化,寻找相对于溶液聚合的最大化 模板指导的聚合的聚合条件和分子设计。

视引发剂和反应基团的类型而定,聚合可通过pH和/或温度的改变、 反应物或催化剂、酶或核酶、或者光、UV或其他电磁辐射的添加等而引 发和/或催化。特别恰当的酶包括蛋白酶、蛋白连接酶(例如 subtiligase)、UDP-糖原合成酶、CGT酶以及聚酮化合物合酶。如果条 件和分子设计已经被精细地加以调节,从而当排列在互补模板上时,可 以允许反应物有效地聚合,但在溶液中时反应不显著,则聚合无需引发。 阵列中升高的局部浓度简单地驱动聚合。

在单体构件的掺入是通过酶掺入的情况下,人们可以将该酶与上文提 及的酶(例如,UDP-糖原合成酶)中的一个融合。这可以允许该融合蛋白 首先通过它的I型反应基团的反应掺入单体,并且就在这之后(当刚刚掺 入的单体从该酶的活性位点暴露出来时),该融合蛋白的另一半(例如, UDP-糖原合成酶)可将所述单体的功能实体与互补模板中先前单体的功 能实体连接起来。

官能团(或主链结构)可能必需保护,以便在掺入、聚合及活化期间不 与该系统中其它组分或反应基团反应。这可利用标准的保护基团实现, 其中一些在(图10)中论及。

本文下面描述的聚合反应被分成两大组,由功能实体是否相对于互补 模板被保持在固定的方向而定。

组1:功能实体可相对于互补元件旋转(并且因而可以相对于互补模 板旋转)

反应基团的直接键接:一个单体的II型反应基团直接与另一个单体 的II型反应基团反应

a).在一个实施例中,功能实体携带同一类别的两个反应基团X1和 X2。“同一类别”在这方面是指给定的X1既可以与相同的X1又可以与不 相同的X2反应。在(图11)中X1和X2是相同的,为此它们都用符号X 表示。X可与另一个X反应形成XX(图11)。作为例子,X可以是硫醇(-SH) 并且产生的产物是二硫化物(-SS-)。作为另一个例子,X可以是香豆素部 分,其在光诱导的条件下与相邻单体的香豆素部分反应(图11例1)。

在大多数情况下,X与X的反应导致原子或分子部分的丧失;在硫醇 的情况下,举例来说,在二硫化物形成时丧失两个质子。XX(两个II型 反应基团间反应的结果)并不含有X加X的全部组分的事实显示在(图5, A)中,其中事实上,两种类型的反应基团(类型I和II)在反应后形成的 分子体与反应基团稍有差别(在图中用重叠的圆圈表示)。

b).两个II型反应基团可以是不同类别的。“不同类别”这里是指他 们与不同类型的分子反应。举例来说,X和Y可以分别为亲核试剂及亲电 试剂。X和Y反应形成XY(图12)。对于较长的模控分子,功能实体相对 于互补模板的自由旋转构成潜在的问题,如果直到许多单体被掺入后功 能实体依然不反应的话。在这种情况下,可能造成簇形成(图13),这会 降低全长模控多聚体的量。不过,该问题仅对于较长的多聚体显著;根 据α-肽生物学展示,例如噬菌体展示和多核糖体展示的经验,可知低至 1%的展示效率足以分离对给定靶具有高结合亲和力的肽。

在某些情况下,掺入的单体在它们被掺入到互补模板中后立即反应 (这时互补模板中的下一个单体尚未被掺入)。因此,最后掺入的单体将 与倒数第二掺入的、已经成为互补模板一部分的单体反应。所以,在这 种情况下簇形成不是很重要的问题。

X和Y可以是胺和羧酸。在存在碳二亚胺的条件下,X和Y会反应形 成酰胺XY。

另一种形式的这类聚合包括同时发生的多聚体的聚合和活化(图 14)。单体不含分隔的接头部分;相反地,聚合体导致活化(从互补模板 中释放功能实体)。在这种策略中,每个单体被掺入,并与先前掺入的单 体反应,导致先前掺入的单体在下一个单体被掺入之前从互补模板中释 放。(图14,例1)显示了利用这个原理来形成聚酰胺,在本例中是β-肽。 该方法可以明显地同样用于其它肽,以及任何种类的聚酰胺。

通过适当地设计单体,人们可以由亲核取代反应产生其他类型的多聚 体键,包括酰胺、酯、氨基甲酸酯、碳酸酯、磷酸酯、磷酸二酯、磺酰 胺、脲、carbopeptide、糖蛋白、糖、酰肼、二硫化物以及类肽键(peptoid bond)。

在(图14,例2)中,同一原理被用于不同类型的反应,“滚环聚合反 应”,这里磺酸烷基酯被用作有效的离去基团,驱动仲胺的形成。产物是 官能化的聚胺,一端连附于指导其合成的模板上。用类似的方法,人们 可以利用相似的分子设计产生聚醚和聚硫醚。可通过利用(图14和14, 例1和2)中描述的原理产生的多聚体包括寡聚脱氧核糖核苷酸、寡聚核 糖核苷酸、嵌合寡核苷酸、寡核苷酸类似物(例如PNA、LNA)、类肽、多 肽和β-肽。

“填充”聚合:另外的分子介导相邻单体的II型反应基团之间的 键接

a).官能团携带一个或两个相同类型的反应基团X1和X2,其中X1 不与另外的X1或X2反应。举例来说,X1和X2可以分别是伯胺和仲胺。 为了聚合,加入Y1-接头-Y2型的化合物,其中Y1和Y2是相同类型的。 Y能与X反应,但与另外的Y的反应在空间上或化学上被排斥。结果,形 成了X-Y-Y-X(图15)。作为例子,X可以是胺,而Y是活化的酯。反应 后,这将在两个功能实体之间形成酯-酯键(X-Y-Y-X)。

优选一个单体的两个X不以任何显著的程度与同一个Y-接头-Y分子 反应。这可通过例如对分子施以空间限制来防止,例如Y-接头-Y分子中 的Y比单体中的X分开得更远。

(图15,例2)提供了两个聚酰胺“填充”聚合的例子。在(图15,例2, A和B)中,II型反应基团是胺,而Y-接头-Y分子是二羧酸或活化的二酯。 在任何一种情况下,所得到的产物是二酰胺多聚体。显然,X和Y的种类 可以互换,使得在本例中,X是羧酸而Y是胺。其它X和Y的组合,以及 它们所产生的键,在图25中给出,该图总结了一些可以通过本发明描述 的各种聚合原理产生的多聚体的种类。

对于某些反应,连接分子只需要含有一个反应基团X。一个例子显示 于(图15,例3A)中,其中功能实体含有两个II型反应基团(胺),并且 添加的分子是光气化等价物例如1,1’-羰基二咪唑。所产生的键为脲键。 在(图15,例5)中,单体含有两个羟基,向其加入活化的磷酸二酯或活化 的膦衍生物,例如由四唑活化并由叔丁基氢过氧化物氧化后的二氨基膦。 产物为磷酸二酯键。

在一些例子中功能实体可仅含有一个II型反应基团。一个例子显示 于(图15,例6)中,其中活化的磷酸二酯键构成了该单体仅有的一个II 型反应基团。与二羟基反应后,形成了磷酸二酯键。

而在另一个填充聚合的例子中,(图15,例7)显示了双烯(功能实体) 与烯(连接分子)反应形成多环化合物的周环反应。

利用填充聚合原理的一个总的考虑,是同一模板模控合成的立体异构 体的数目。例如,在(图15,例4,A)中,功能实体含有两个伯胺。功能 实体通过手性碳连接于互补模板。功能实体可以绕连接手性碳和互补模 板的键自由旋转。所以,胺(X)与连接分子(活化的羰基,(Y))的反应导 致形成2n个不同的异构体,其中n是多聚体残基的数目。

异构体代表了多样性的显著增加。例如,对于10个单元的多聚体, 手性代表增加1024倍的多样性。这可能在某些情况下具有优势,例如如 果单体多样性低,或者如果期望是制备短多聚体。不过,这种遗传密码 的“混乱”(即,一个模板编码不同的多聚体结构)同样降低了选择过程 的严谨性。因此,在某些情况下,混乱是不期望的。则人们可以选择用 非手性原子连接功能实体和互补元件。在(图15,例4,B)中,显示了非 手性原子(氮)连接功能实体和互补模板的例子。混乱可包括一个互补 元件指定不同异构体的情况(如上所述),而且混乱还可以包括互补元件 指定稍微不同或完全不同的功能实体的情况。

b).功能实体携带两个不同的II型反应基团X和S(图16)。X不与 X或S反应,反之亦然。在掺入单体支前、其间或之后,添加T-接头-Y 形式的分子。X可与Y反应,而S可与T反应,导致在功能实体之间形 成X-S-T-Y的连键。重要的是确保一个功能实体中的X和S不与一个连 接分子中的T和Y反应。这可通过适当地设计功能实体和连接分子的结 构来确保。(图16,例1)提供了带有不同的II型反应基团(在本例中是 叠氮化物和肼(X和S))的功能实体以及带有不同反应基团(在本例中是 膦和酮)(T-接头-Y)的连接分子的例子。

对于较长的模控分子,如果功能实体直到掺入许多单体之前不反应, 则功能实体相对于互补模板的自由旋转构成了一个潜在的问题。在这种 情况下,可导致簇形成(图13),这降低了全长模控多聚体的量。不过, 如上面所阐释的,这个问题仅对于较长的多具体来说是显著的。如果在 互补元件掺入期间存在连接分子,掺入的单体可在它们掺入后立即,或 者在酶介导掺入的情况下,在它们刚从酶的活性部位出现时就与连接分 子反应。在这些情况下,簇形成将不再是显著的问题。

“拉链式”聚合:聚合反应从模板的一端行进到另一端

在这种途径中,聚合反应是定向的,即反应级联起始于互补模板的一 端,并且反应向互补模板的另一端移动,由此形成模控多聚体。

a).一般原理(图18)。在掺入一些或全部单体构件之后,聚合反应 从模板的一端引发,并沿着模板行进。例如,引发剂可与第一个或最末 一个待掺入的互补元件偶联,或者它可以与DNA聚合酶介导的核苷酸衍 生物掺入中所用的引物偶联。在任何一种方式中,引发剂将与相邻单体 的II型反应基团反应,这诱导该单体功能实体的改变,允许这个单体与 该链中的下一个单体反应,等等。最终,所有的单体反应,并形成多聚 体。

可能期望保护引发剂,使其免于与相邻单体反应直到掺入完成,随后 引发剂去保护。这允许试验人员在活化引发剂之前,除去所有未掺入的 引发剂和互补模板,这消除了溶液中引发剂与互补模板之间的反应。

引发剂可通过pH或温度的改变、暴露于电磁辐射、或者添加试剂(除 去保护基团,或者在特定位置引入引发剂,或者连接或配位天然的引发 剂,使其成为更强有力的引发剂)去保护。试剂可以是化学催化剂或酶, 例如酯酶或肽酶。

b).通过自由基聚合的拉链(图18,例1)。引发剂是烷基碘,而功能 实体含有双键。在加入自由基引发剂,例如过硫酸铵,AIBN(偶氮二-异 丁腈)或其它自由基链式引发剂后,自由基链式反应被引发,由此烯反应 形成延伸的官能化的烷。最终,多聚体得以制备,并且它被活化(从互 补模板上断裂下来,除了一个点之外)。残留在多聚体一端的自由基可通 过自由基终止反应淬灭。

c).通过阳离子聚合的拉链(图18,例2)。引发剂是路易斯酸。用酸 或其它引发试剂去保护后,产生阳离子。碳正离子攻击相邻单体的双键, 结果在这个单体中产生碳正离子。最终形成全长多聚体,并且多聚体被 活化。

d).通过亲核(阴离子)聚合的拉链(图18,例3)。在这个例子中, 引发剂是保护的羟基阴离子。功能实体携带过氧化物。引发剂去保护之 后形成羟基阴离子(例如通过碱去保护)。在碱性条件下,引发剂攻击相 邻环氧化物环中位阻最小的碳。这反过来形成了羟基阴离子,其攻击相 邻的环氧化物。最终形成全长多聚体,并且该聚醚可以被活化。在这个 例子中,所有连接聚醚和互补模板的接头都被断裂。

这类聚合也是一个开环聚合的例子。

e).通过开环的拉链聚合(图19)。显示了开环聚合的一般原理。引 发剂攻击相邻单体的反应基团X,X是环结构的一部分,并且作为引发剂 和X之间反应的结果,环打开,由此该单体的另一个反应基团被活化, 攻击阵列中的下一个单体。聚合反应沿着链行进,并且最终形成全长的 多聚体。

f).通过羧酸酐(carboxyanhydrides)的开环聚合形成β-肽(图19, 例1)。去保护的引发剂,亲核胺,攻击N-硫代羧酸酐最亲电子的羰基, 已形成下酰胺。CSO得以释放,产生伯胺,其接着攻击阵列中的下一个单 体。最终完成聚合,并且多聚体可以被活化,产生通过它的C-末端连接 在互补模板或模板的β-肽。该原理可用于形成其它类型的肽,例如D-和 L-型单取代和双取代的α-肽、β-肽、γ-肽、carbopeptides以及类肽(聚 N-取代的甘氨酸),以及其它类型的聚酰胺。同样,可使用该原理产生其 它类型的多聚体,如聚酯、聚脲、聚氨基甲酸酯。

g).通过thiazinanone单元的开环聚合形成β-肽(图19,例2)。去 保护的引发剂攻击环状硫酯,形成酰胺。结果,环断开释放游离硫酮。 这产生胺,其现在可以攻击阵列中的下一个单体的硫酯。当聚合行进到 模板的另一端时,它被活化,产生通过它的C-末端连附于模板的β-肽。

该原理可用于形成其它类型的肽,例如D-和L-型单取代和双取代的 α-肽、β-肽、γ-肽、carbopeptides以及类肽(peptoids)(聚N-取代 的甘氨酸),以及其它类型的聚酰胺。同样,可使用该原理产生其它类型 的多聚体,如聚酯、聚脲、聚氨基甲酸酯。

h)通过重排的拉链聚合(图20)。引发剂,其在本例中是亲电子试剂, 被活化后,相邻单体的II型反应基团攻击引发剂,结果从互补元件中释 放引发剂。在攻击的单体中,Y与引发剂的反应导致单体的重排,这导致 X(该单体的另一个II型反应基团)的活化(例如,重排产生亲核试剂)。 接着,阵列中的下一个单体攻击该亲核试剂。最终形成全长的多聚体, 其一端连附在指导它合成的模板上。

i).在一个步骤中的拉链和活化(图21)。通过适当地设计用于开环 聚合的功能实体,活化可作为聚合反应的直接结果实现。通过简单地将 功能实体倒置,即将不掺入到最终多聚体中的环部分连附互补模板,可 节省试验人员的活化步骤(比较图21和图19)。作为具体的例子,通过一 个苯基将(图19,例2)的2,2-diphenylthiazinanone环结构连附到互补 元件上可以导致作为聚合反应结果的活化。

组2:功能实体不能相对于互补元件自由旋转

在这种实施方式中,II型反应基团X和Y相对于互补模板被保持在 预期的方向上(图22,A)。X和Y因此可以反应,或与连接分子反应,而 没有引起簇形成的险(与图13相比)。

功能实体可以通过双键、或者通过与互补元件中不同的原子键合保持 在固定的方向上。(图22,B)提供了一个例子,其中功能实体与二核苷酸 的两个碱基共价偶联(互补元件是二核苷酸,功能实体含有二肽,而反 应基团分别是胺和酯部分)。

可通过这种方法制备的多聚体包括上文提及的非拉链聚合中的所有 多聚体,例如肽、酰胺、酯、氨基甲酸酯类、肟、磷酸二酯、仲胺、醚 等。

图23到25涉及可以如何通过共价束缚避免簇形成。

由于围绕接头-核苷酸键的潜在自由旋转而产生使用双官能功能实体 (FE)的特殊情况。双官能FE带有两个不同的反应基团‘X’和‘Y’, 例如既有亲核试剂又有亲电子试剂,其中一个FE上的‘X’将与相邻FE 上的‘Y’或者直接地或者通过交联剂进行反应。如果所有的接头-FE 单位就亲本核苷酸而言一致地取向,则发生定向聚合,并形成完整的比 方说5个单元的产物(‘图13顶部’)。然而,围绕一些但并非所有的 接头-FE实体的接头-键的旋转,以至于两个官能度的相对取向相反,导 致簇形成,其中反应基团被如此安排从而使得反应可在两个不同的方向 上发生(‘图13底部’)。这种不利情况可以通过利用固定的功能实体, 由此防止围绕核苷酸-接头键旋转加以避免。FEs的固定可通过利用不是 一个而是两个共价键即两个接头将FE连附到核苷酸上获得。这一附加键 可由一个官能度直接形成,或者两个反应基团可连附于固定的主链上的 分隔的“臂”上。在第一种情况下,附加键可在反应期间断裂,而后者 的附加键应当如此构建从而该键在反应后可断裂,以释放终产物。

接头-FE单位的第一连附点典型地是在核苷酸碱基内,优选T/U和C 的C5位,或者脱氮A和脱氮G的C7位。为了构成接头-键旋转的有效抑 制,第二键应当优选与该连附点多少有一定距离。也就是说,第二连附 可以在相邻核苷酸的任何位置,优选在碱基或糖部分,它可以是同一个 碱基的第二原子,优选是T/U和C的C6位或者(脱氮)A或(脱氮)G 的C8或N6位,或者它可以是糖部分的原子,优选C2或C3位。清楚的 例子在图23中给出。

应当注意带有这些双连附接头的核苷酸可能有必要通过其它方式而 不是利用聚合酶掺入。聚合酶掺入的一个替代方法是本文它处描述的咪 唑法。

为了证明共价束缚FE对确保定向聚合的效果,对图23A和23B中所 示的两个例子进行了一系列计算机计算。目的在于分析每个接头-FE构建 物的各种攻击模式,估计最可能的反应,并由此估计最可能的产物。所 以,需要估计接头-FE单位所覆盖的构象空间和反应基团所占据的区域 (zones)。

特定的接头-FE系统的构象空间,即FE的范围,可通过进行构象查 找(conformation search)进行估计。构象查找可通过使用各种不同的 软件、并且在这些程序内利用不同的查找方法以及本领域的标准知识进 行。对于本文提及的大小的系统,不可能进行汇聚性的构象查找,也就 是说,不可能确保采取足够的步骤,以至于覆盖完整的势能表面,从而 定位的最小能量构象真正地是该分子全局的最小量。不过,这些计算的 目的在于获得允许被接头-FE单位覆盖的空间的图像,并由此估计两个 FEs之间最为可能的攻击途径,以及反应基团进入反应距离之内的几率。 有效的构象查找方法使用相当有限数目的步骤实现这个目的。

“构象”在这里是指各个结构取向,其在简单的围绕单键的旋转方面 不同。不同的构象可以额外引起不同的总体构型,这是指引起一种反应 特异性定向的所有修饰核苷酸上的两个反应基团的总体排列。也就是说, 所有“X’s”照向一个方向的四个接头-FE单位的排列对应于一种特异性 构型(configuration),而四个接头-FE单位的排列,例如两个‘X’s’ 指向一个方向,而另外两个指向相反方向,相应于另外一种特异性构型。 在一种构型中,可以有许多不同的构象,但所有这些导致同一种“最可 能的”产物,因为反应基团的总体取向(方向)是被维持的。

本研究中进行的计算是使用来自Schr_dinger Inc(MMOD72)的 MacroModel7.2软件进行的。在这种软件包中,存在一系列不同的查找方 案,包括Mixed Monte Carlo Multiple Minimum/Low Mode’法 (MCMM/LM),被证明在定位大的复杂系统的位能最小量方面非常有效。

计算细节

具有碱基序列5’-GCTTTTTTAG-3’(上链)(例子显示于图24)或 5’-GCTTTTAG-3’(上链)(例子显示于图25)的双链DNA利用来自 HyperCube Inc的HyperChem7以最常见的B-构象构造。接头-FE单位利 用来自ChemOffice的ChemDraw Ultra 6.0和Chem3D Ultra 6.0构造。 接头-FE单位和DNA被输入MMOD72。接头随即利用MMOD72中的内建部件 与相应的核苷酸融合,融合T核苷酸的甲基碳原子与合适的接头原子, 以起到创建修饰的U核苷酸的效果。在所有的运算中,所有的DNA原子 维持冻结,也就是说,不允许运动,以便降低系统的大小并避免DNA链 内部的扭曲。使用MMOD72中供应的OPLS_AA力场使总系统的能量最小化 (保持DNA原子的冻结)。有必要限制桥接核苷酸和接头的双面夹,即 N1,C6,C5和第一个接头原子的双面夹角设置成180.0度,并施加100 到1000之间的力常数。没有限制的话,没有任何一个MMOD72力场保持 这种平面,这可能是由于这种特定双面夹角的面外力常数太弱。

利用MCMM/LM方法运行2000个步骤进行构象分析,能量截断值为50 kJ/mol,并且运动最快速的原子的最小和最大行进距离分别为3和8_。 取决于系统的特定大小,允许11-19个扭力矩变化,并且最后,每个构 象异构体通过500-1000个PR Conjugate Gradient步骤最小化(这导致 大多数构象异构体最小化至0.05kJ/mol的收敛值之内)。手性原子的 手性在运算期间是保留的。此外,对于带有共价束缚接头的系统,在每 个环中选择一个闭环键(或者是形成的酰胺键或者是碱基-S键)。

结果

创建第二连附点的一种方式是通过可断裂的键连接功能实体和相邻 的核苷酸。实际上,这意味着使用的是二核苷酸而不是单核苷酸,并且 同时FE的长度增加了。利用这种途径,存在一系列有效的连附点;图23A 是一个连附到相邻碱基的同一个位置上的例子。接头1A由β-二肽构建, 氨基末端通过易于还原性断裂的二硫键连接于5’碱基,而羧基末端连接 于3’碱基。当反应发生时,来自一个二核苷酸-接头-FE单位的氨基将 会切断前一个二核苷酸-接头-FE的酯键。使用没有第二连附点的相同接 头-FE单位相当于在一个核苷酸间隔的单核苷酸上使用二肽。这样的接头 -FE在分开的臂上带有两个反应基团,并且围绕核苷酸-接头键自由旋转, 并因此是假设缺乏定向聚合则带有簇形成风险的双官能接头-FE的例子。 对单连附接头运行2000个构象查找步骤,产生“全局”最小化定位1次 的490种独特构象(500个最少步骤之后是849种构象,额外500个步骤 之后是490种)。产生完整产物的最低能量的构象列第8位,并显示于图 24A中,而所得的最可能的产物(仍然连附在DNA主链上)显示于图24B 中。可以看出,反应基团以所有的氨基朝上而所有的羧基朝下的方式安 排,并且给出完整产物所需的两个反应是正向的。释放的完整产物显示 于图24H中。不过,到目前为止,大多数构象,包括“全局”最小化的, 不具有该总体构型。图24C显示了位居第二的构象,并且最为可能的产 物图示于图24D中。可以看出,反应基团的这种安排导致形成不完全的 产物。3’端的两个接头-FE单位形成了酰胺键,而5’接头-FE单位具 有相反的总体取向,产生两个羧基(一个来自于5’接头-FE单位而一个 来自于合并的3’接头-FE单位)为两个接近的反应基团,因此不可能 反应。所以该产物的释放形成二聚体(和单体);二聚体图示于图22中。 在定位的最小值10kJ/mol范围内的364种独特的构象中,大约330种导 致形成各种不完全产物。

对双连附接头运行2000个构象查找步骤,产生“全局”最小化定位 9次的125种独特构象。这种最小能量的构象显示于图24E中,其中可看 到所有的FEs是以氨基朝下而羧基朝上的方式安排的。显然,这种总体 结构对于双连附接头是唯一可能的,产生只有一种如24F所示的可能产 物(仍连附在DNA主链上)。该产物的释放给出完整的3个单元的产物, 图24G。

因此,这个例子首先证明围绕核苷酸-接头键旋转确实导致(许多) 不能够形成完整产物的构象。不过,另一个重要的议题是形成的完整产 物的差别。这里例子中使用的FEs是由未取代的β-氨基酸构建的,所以 在图24G和H中所示的完整产物之间没有差别。但是,利用单连附的FEs, 形成的产物的极性可以改变(即来自3’连附的FE的自由氨基或者来自 5’连附的FE的自由氨基),由此可以潜在地形成非常不同的产物。通过 使用固定的功能实体,仅有一种总体构型是可能的,并且仅有一个具有 一种特定极性的产物能够形成。

连附点的另一种可能性是亲本核苷酸的糖,如图23B、C和D中所例 示的。这种选择如上文所提及的,允许使用单核苷酸替代连接的二核苷 酸。C2的两个氢原子都可以被接头原子替代,不过,对于较短的环结构, 优选利用与碱基朝向同一平面的氢原子。糖部分的碳3与磷酸基团形成 连键,但是仍然留有一个可用于接头固定目的的连附可能性。相同的情 况对C1成立,不过,这种取代可能性周围的空间有限。糖部分的碳4和 5原子与碱基连附点相当远,因此对于这个目的需要使用大的环系统。

接头-FE 1B由通过易于还原性断裂的二硫键连附T/U C5位的γ-氨基 酸构建。所以接头-FE单位1B是核苷酸-接头键能够旋转、由于缺乏定向 聚合而带有簇形成风险的双官能接头-FE系统的另一个有代表性的例子。 这种FE的固定显示于例1B(右)中,并且利用了与碱基在平面同一侧的 C2位。现在FE含有通过羧基由可水解的酯键与糖连接、并且在氨基端通 过易于氧化的二硫键与T/U的C5位连接的γ-氨基酸。所以双连附的接头 -FE单位1B是一种一个反应基团游离、而另一个提供第二连附的双官能 接头-FE。例1C中显示了利用几乎相同的接头-FE单位,但是通过引入第 二酯基作为可水解接头,令羧基端游离。接头-FEs 1B和1C的计算分析 产生相似的结论,并且下文的结果指的是接头1B。

两个不同策略的构象查找清楚地揭示了通过附加的共价连附防止接 头键旋转的功效。对单连附接头-FE运行2000个构象查找步骤,产生“全 局”最小化定位1次的445种独特构象。这种构象显示于图25A中,并 且产生的最为可能的产物(仍连附在DNA主链上)显示于图25B中。可以 看出,该产物是完整产物,也就是说,所有的四个单位通过酰胺键连接 在一起。释放的完整产物如图25G所示。不过,许多其它总体构型对于 该系统是可能的,图25C中显示了一个例子。由3C构型产生的最为可能 的产物图示于图25D中,并且可以看出,反应基团的这种安排导致形成 不完整的产物,也就是说,接头-FE单位是两个两个一起地连接,没有合 并反应(merging reaction)的可能性。产物的释放形成两个二聚体, 图示于图25H中。在定位的最小值10kJ/mol的范围内334种独特的构象 中,大约215种导致形成各种不完全产物。

对双连附接头FE运行2000个构象查找步骤,产生“全局”最小化定 位2次的386种独特构象。这种构象显示于图25E中,并且产生的最为 可能的产物(仍连附在DNA主链上)显示于图25F中。不过,由于不存在 反应基团互换的可能性,构象仅在双面夹角具有微小变化的区别(例如 CH2NH2基团的旋转)。显然,对于双连附的FE,仅有一种总体构型是可能 的,仅产生一个可能的产物,完整的4个单位的产物(图25G)。

因此,计算研究清楚地证明在核苷酸-接头键周围存在广泛的旋转, 并且这种柔性将导致显著比例的形成产物不完整。运算还证明利用共价 固定的功能实体是防止接头旋转的一种方式,由此有效地保证单向聚合。 此外,确实由未受限制的FEs产生的完整产物构成了具有多样性的一组, 因为有不止一种可能性可以安排反应基团以允许在所有单元之间的反应 都发生。自然地,如这些例子中所应用的,利用多于3个到4个的接头 -FE单元,这些趋势将会更加突出。

能够转移功能实体的构件

下列部分描述了能够将功能实体从一个单体构件转移到另一个单体 构件的单体构件的形成和应用,即两个单体构件的两个功能实体反应, 藉此一个功能实体在施加的条件下从它的单体构件上断裂下来。

总则部分

马来酰亚胺衍生物的保护和去保护:

马来酰亚胺衍生物(例如R=H,烷基,芳基,烷氧基等)可以在下 列任何步骤中,以已被保护的形式存在。保护通过与呋喃反应实现。去 保护可通过热分解作用实现,如Masayasu等所述,J.Chem.Soc.,Perkin Trans.1(1980)2122。

A.酰化反应

形成酰化单体构件的一般路线以及这些单体构件的应用:

N-羟基马来酰亚胺(1)可以利用酰氯,例如乙酰氯酰化,或者可供选 择地,例如在THF中通过利用二环己基碳二亚胺或二异丙基碳二亚胺以 及酸例如乙酸酰化。中间产物可通过利用过量的1,3-丙二硫醇经过 Michael加成,接着与4,4’-二吡啶基二硫醚或2,2’-二吡啶基二硫醚 反应。这些中间物(3)可以被加载到携带硫醇柄的寡核苷酸上,以产生单 体构件(4)。这个单体构件与携带胺的单体构件的反应进行如下:

模板寡核苷酸(1nmol)与加载有构件,例如(4)(1nmol)的含硫寡 核苷酸(thio oligonucleotide),以及氨基寡核苷酸(1nmol),在hepes- 缓冲液(20μL的100mM hepes和1M NaCl溶液,pH=7.5)和水(39uL) 中混合。通过加热到50℃并冷却(2℃/秒)到30℃,寡核苷酸与模 板退火。然后将混合物o/n置于摆动的温度(10℃1秒,然后35℃1 秒)下,以产生结合(5)的模板。

B.烷基化和C.乙烯化反应

形成烷化/乙烯化单体构件的一般路线以及这些单体构件的应用: 烷化单体构件可以具有如下的一般结构:

R1=H,Me,Et,iPr,Cl,NO2

R2=H,Me,Et,iPr,Cl,NO2

R1和R2可用于调整硫酸酯的反应性以允许适当的反应性。氯和硝基 取代可以提高反应性。烷基会降低反应性。硫酸酯的邻位取代基会由于 空间原因指导进入的亲核试剂选择性地攻击R-基团并避免攻击硫。例如

3-氨基苯酚(6)用马来酸酐处理,接着用酸,例如H2SO4或P2O5处理, 并加热产生马来酰亚胺(7)。当利用酸稳定的O-保护基团时,马来酰亚胺 的环闭合还可以通过用Ac2O加热或不加热处理,接着O-去保护实现。作 为选择地,在Ac2O中回流,接着在热水/二氧杂环乙烷中O-去乙酰化以 产生(7)。进一步用有或没有在二氯甲烷或更高沸点的溶剂中的三乙胺或 碳酸的SO2Cl2处理(7),将会产生中间物(8),其可以被分离,或者直 接地通过合适的醇(在本例中是MeOH)淬灭,进一步被转化成硫酸芳基 烷基酯,由此可形成(9)。有机构件(9)可以如下连接于寡核苷酸。

在缓冲液50mM MOPS或hepes或磷酸盐pH 7.5中的携带硫醇的寡 核苷酸用1-100mM、并且优选7.5mM的在DMSO或可供选择的DMF中的 有机构件(9)的溶液处理,从而DMSO/DMF的浓度为5-50%,并且优选10%。 混合物在25℃放置1-16小时并且优选2-4小时。以便提供烷化的、在 本例中是甲基化的单体构件(10)。

烷化单体构件(10)与携带胺的单体构件的反应可进行如下:

模板寡核苷酸(1nmol)与加载有构件(1nmol)(10)的含硫寡核苷酸, 以及氨基寡核苷酸(1nmol),在hepes-缓冲液(20μL的100mM hepes 和1M NaCl溶液,pH=7.5)和水(39uL)中混合。通过加热到50℃并 冷却(2℃/秒)到30℃,寡核苷酸与模板退火。然后将混合物o/n置于 摆动的温度(10℃1秒,然后35℃1秒)下,以产生结合甲胺(11) 的模板。

乙烯化单体构件可以与上文所述的烷化单体构件类似地制备和应用。 虽然不用醇与氯磺酸酯(上文8)反应,中间产物氯硫酸酯被分离,并用烯 醇化物或O-三烷基甲硅烷基烯醇化物在氟化物存在或否的条件下处理。 例如

形成乙烯化单体构件(13):

在缓冲液50mM MOPS或hepes或磷酸盐pH 7.5中的携带硫醇的寡 核苷酸用1-100mM、并且优选7.5mM的在DMSO或作为选择的DMF中的 有机构件(12)的溶液处理,从而DMSO/DMF的浓度为5-50%,并且优选10%。 混合物在25℃放置1-16小时并且优选2-4小时。以便提供乙烯化的单 体构件(13)。

磺酰基烯醇化物(Sulfonylenolate)(13)可用于与携带胺的单体构 件反应形成烯胺(14a和/或14b)或者例如与负碳离子反应产生(15a和/ 或15b)。例如

乙烯化单体构件(13)和携带胺或者硝基烷基的单体构件的反应可进 行如下:

模板寡核苷酸(1nmol)与加载有构件(1nmol)(13)的含硫寡核苷酸, 以及氨基寡核苷酸(1nmol)或硝基烷基-寡核苷酸(1nmol),在0.1M TAPS、磷酸盐或hepes-缓冲液和300mM NaCl溶液,pH=7.5-8.5并且优 选pH=8.5中混合。通过加热到50℃并冷却(2℃/秒)到30℃,寡 核苷酸与模板退火。然后将混合物o/n置于摆动的温度(10℃1秒,然 后35℃1秒)下,以产生结合(14a/b或15a/b)的模板。作为上文所述 的硫酸烷基和乙烯基酯的替代物,同等地有效的磺酸酯例如下文所述的 (31)(不过R”更换为烷基或乙烯基)可以由(28,苯基被烷基替代)和 (29)制备,并且作为烷化剂和乙烯化试剂。

D.链烯基化反应

形成Wittig和HWE单体构件的一般路线以及这些单体构件的应用:

商业上可获得的构件(16)可以通过标准手段,即DCC或DIC偶联被转 化成NHS酯(17)。

在缓冲液50mM MOPS或hepes或磷酸盐pH 7.5中的携带胺的寡核 苷酸用1-100mM、并且优选7.5mM的在DMSO或作为选择的DMF中的有 机构件的溶液处理,从而DMSO/DMF的浓度为5-50%,并且优选10%。混 合物在25℃放置1-16小时并且优选2-4小时。以便提供膦结合的单体 构件(18)。这个单体构件通过加入适当烷基卤,例如N,N-二甲基-2-碘 代乙酰胺在DMSO或DMF中作为1-100mM并且优选7.5mM的溶液从而 DMSO/DMF的浓度为5-50%,并且优选10%,而进一步被转化。混合物在 25℃放置1-16小时并且优选2-4小时。以便提供单体构件(19)。作为 选择,有机构件(17)可以用烷基卤被P-烷基化,然后偶联到携带胺的寡 核苷酸上产生(19)。

醛结合的单体构件(20),例如利用与上文所述的那些相似的条件,通 过4-甲酰基苯甲酸的NHS酯与携带胺的寡核苷酸之间的反应形成的那 些,将会与(19)在微碱性条件下反应产生链烯(21)。

单体构件(19)和(20)的反应可如下进行:

模板寡核苷酸(1nmol)与单体构件(19)(1nmol)和(20)(1nmol) 在0.1M TAPS、磷酸盐或hepes-缓冲液和1M NaCl溶液,pH=7.5-8.5 并且优选pH=8.0中混合。然后将反应混合物置于35-65℃优选58℃ 过夜,以产生结合(21)的模板。

作为(17)的一种替代选择,可以用膦酸酯(24)替代。它们可以通过氯 亚磷酸二乙基酯(22)和适当的携带羧基的醇之间的反应制备。然后羧酸 被转移到NHS酯(24)中,并且上文所述的过程和可供选择的方法可以应 用。尽管代替了简单的P-烷化,亚磷酸酯可以进行ArbUzov’s反应并产 生膦酸酯。单体构件(25)得益于它比它的鏻对应物(19)反应性更强的事 实。

E.过渡金属催化的芳基化、杂芳基化(hetaylation)以及乙烯化反 应

能够转移芳基、杂芳基(hetaryl)或乙烯基官能度的亲电子单体构 件(31)可以由有机构件(28)和(29)通过上文所述的将马来酰亚胺衍生 物偶联到携带SH的寡核苷酸上的程序制备。作为马来酰亚胺的替代选择, 由例如羧基苯基磺酸衍生物制备的NHS-酯衍生物可以通过偶联这样的物 质到携带胺的寡核苷酸上加以利用。(28)和(29)的R-基团被用来调整磺 酸酯的反应性以产生适当的反应性。

过渡金属催化的交叉偶联可进行如下:

向在0.5M NaOAc缓冲液pH=5和75mM NaCl中的模板寡核苷酸(1 nmol)与单体构件(30)和(31)(均为1nmol)的混合物中添加放置了15 分钟的水中1.4mM Na2PdCl4和2.8mM P(p-SO3C6H4)3的预混合物(最终 [Pd]=0.3mM)。然后将混合物o/n置于35-65℃优选58℃,以产生 结合(32)的模板。

R″=芳基、杂芳基或乙烯基

相应的能够转移芳基、杂芳基或乙烯官能度的亲核单体构件可以由有 机构件类型(35)制备。这可通过二醇例如(33)对硼酸的酯化,接着转化 为NHS-酯衍生物获得。然后NHS-酯衍生物可以偶联到寡核苷酸上,通过 利用上文所述的将NHS-酯衍生物偶联到携带胺的寡核苷酸上的偶联程 序,以产生单体构件类型(37)。作为选择地,马来酰亚胺衍生物可如上 文所述制备,并加载到携带SH-的寡核苷酸上。

过渡金属催化的交叉偶联可进行如下:

向在0.5M NaOAc缓冲液pH=5和75mM NaCl中的模板寡核苷酸(1 nmol)与单体构件(36)和(37)(均为1nmol)的混合物中添加放置了15 分钟的1.4mM Na2PdCl4和2.8mM P(p-SO3C6H4)3的水中预混合物(最终 [Pd]=0.3mM)。然后将混合物o/n置于35-65℃优选58℃,以产生 结合(38)的模板。

R=芳基、杂芳基或乙烯基

F.烯胺和烯醇醚单体构件的反应

加载烯胺和烯醇醚的单体构件可如下制备:

对于Z=NHR(R=H,烷基,芳基,杂芳基),2-巯基乙胺可以与二吡啶 基二硫醚反应产生活化的二硫醚(40),然后在脱水条件下,它可以缩合 为酮或醛,以产生烯胺(41)。

对于Z=OH,2-巯基乙醇与二吡啶基二硫醚反应,接着是O-甲苯磺酰 化(Z=OTs)。然后甲苯磺酸酯(40)可以直接与烯醇化物或者在氟化物存在 的条件下与O-三烷基甲硅烷基烯醇化物反应,以产生烯醇化物(41)。

然后烯胺或烯醇化物(41)可以如上文所述偶联到携带SH的寡核苷酸 上,得到单体构件(42)。

单体构件(42)可以与携带羰基的象(44)的寡核苷酸、或者作为选择的 与象(43)的携带烷基卤的寡核苷酸如下反应:

模板寡核苷酸(1nmol)与单体构件(42)(1nmol)和(43)(1nmol) 在50mM MOPS、磷酸盐或hepes-缓冲液和250mM NaCl溶液,pH=7.5-8.5 并且优选pH=7.5中混合。然后将混合物置于35-65℃优选58℃过 夜,或者作为选择地,置于摆动的温度(10℃1秒,然后35℃1秒) 下,以产生结合(46)的模板,其中Z=O或NR。对于Z=NR的化合物,可以 应用微酸条件以产生具有Z=O的产物(46)。

模板寡核苷酸(1nmol)与单体构件(42)(1nmol)和(44)(1nmol) 在0.1M TAPS、磷酸盐或hepes-缓冲液和300mM NaCl溶液,pH=7.5-8.5 并且优选pH=8.0中混合。然后将混合物置于35-65℃优选58℃过 夜,或者作为选择地,置于摆动的温度(10℃1秒,然后35℃1秒) 下,以产生结合(45)的模板,其中Z=O或NR。对于Z=NR的化合物,可以 应用微酸条件以产生具有Z=O的产物(45)。

烯醇醚类型(13)可在有或无催化作用的条件下进行环式加成反应。类 似地,可以制备和利用双烯醇醚。例如通过(8)与α,β-不饱和酮或醛的烯 醇化物或三烷基甲硅烷基烯醇化物(存在氟化物时)反应产生(47),其可 以被加载到携带SH的寡核苷酸上,产生单体构件(48)。

双烯(49)、烯(50)以及1,3-偶极(1,3-dipole)(51)可通过携带氨基 的寡核苷酸与相应的有机构件的NHS-酯之间的简单反应形成。(13)或者 可供选择的(31,R”=乙烯基)与双烯,例如(49)反应产生(52)或者与例 如1,3-偶极(51)反应产生(53),以及(48)或(31,R”=双烯基)与烯例如 (50)反应产生(54)可如下进行:

模板寡核苷酸(1nmol)与单体构件(13)或(48)(1nmol)以及(49)或 (50)或(51)(1nmol)在50mM MOPS、磷酸盐或hepes-缓冲液和2.8M NaCl溶液,pH=7.5-8.5并且优选pH=7.5中混合。然后将混合物置于35-65℃ 优选58℃过夜,或者作为选择地,置于摆动的温度(10℃1秒,然 后35℃1秒)下,以产生结合(52)、(53)或(54)的模板。

接头断裂

活化(断裂一些或所有连接互补元件与功能实体的接头)可以通过改 变pH和/或温度、添加反应物或催化剂、酶或核酶、或者光、UV或其它 电磁辐射等进行。特别相关的酶包括蛋白酶、酯酶和核酸酶。可断裂街 头和断裂条件的列表显示在(图10)中。

其它可断裂接头包括由酸断裂的4-羟甲基苯氧乙酸部分、用氟化物 可断裂的2-[(叔丁基二苯基甲硅烷氧基)甲基]苯甲酸部分、以及2-羟甲 基苯甲酸部分,其提供了通过联合碱性磷酸酶处理接着用温和碱处理可 断裂的接头。

在大多数情况下,期望具有至少两个不同类型的接头连接互补元件和 功能实体。以这种方式,有可能选择性地断裂互补元件和功能实体之间 的除了一个之外的所有接头,由此获得通过仅仅一个接头与模控它合成 的模板物理地连接的多聚体。这个完整的接头应当尽可能小地影响所连 附的多聚体的活性,但除此之外,接头的性质不认为是本发明的必要特 征。就模板和模控多聚体之间的长度而言的接头的大小可以变化广泛, 但为了本发明的目的,优选该长度在从只有1个键到大约20个原子的链 长度的范围内。

模控分子的选择和筛选

具有期望活性的模控分子的选择或筛选(例如结合特定靶、催化活 性、或活性分析中的特定功效)可按照任何标准方案进行。例如,可根 据噬菌体展示、多核糖体展示或mRNA-蛋白融合展示肽所用的原理进行亲 和选择。催化活性的选择可通过在过渡态类似物亲和柱上的亲和选择 (Baca等,Proc.Natl.Acad.Sci USA.1997;94(19):10063-8),或 者通过基于功能的选择策略(Pedersen等,Proc.Natl.Acad.Sci.USA. 1998,95(18):10523-8)进行。期望特征的筛选可根据以标准微量滴定板 为基础的分析、或由FACS-分选分析进行。

模控分子文库的用途

选择与已知靶结合的模板展示分子

本发明还涉及允许选择能够与不同靶结合的小分子的方法。模板展示 分子技术含有用于定向选择和扩增的内在功能。所选分子的结合应当是 选择性的,原因在于它们仅与特定的靶配位,并由此预防或诱导特异性 的生物学效应。最后,这些结合分子应当可能用为例如治疗剂、或者作 为诊断剂

模板展示分子文库可以容易地与筛选、选择、或评估分子配体的结合 对靶功能的影响相结合。在一个更具体的实施方式中,模板展示方法提 供了分离和鉴定与超分子的、超高分子的、高分子的以及低分子的结构 (例如核酸和蛋白,包括酶、受体、抗体和糖蛋白);信号分子(例如cAMP、 肌醇三磷酸、肽、前列腺素);以及表面(例如金属、塑料、组合物、玻 璃、陶器、橡胶皮肤、组织)结合的分子配体的快速手段。

具体地,本文中的选择或分配(partitioning)是指结合靶分子的模 板展示分子复合物,即复合物-靶对,能够藉以与未结合靶分子的模板展 示分子分开的任何方法。选择可通过本领域公知的各种方法实现。

可实施选择策略,从而允许针对几乎任何靶的选择。重要的是,这种 选择策略没有任何步骤需要任何关于靶或文库分子的详细结构信息。整 个过程由与文库中分子与给定靶的特异性识别/配位(coordination) 有关的结合亲和力推动。不过,在一些应用中,如果需要,还可以包括 官能度,类似于利用噬菌体展示选择催化活性(Soumillion等(1994)J. Mol.Biol.237:415-22;Pedersen等(1998)PNAS.18:10523-10528)。 各种选择程序的例子描述于下文。

此内在的模板展示分子选择过程非常适于优化,其中系列选择步骤的 进行起始于结合分子的选择,并终止于最优化的结合分子。每个步骤中 的单个程序可以利用各种机器人系统自动化操作。这是因为存在事件的 连续流程,并且其中每个事件可以分开进行。在最优选的设置中,向完 全自动化系统提供合适的模板展示分子文库和靶分子,其最终产生最优 化的结合分子。甚至更优选地,该过程的运转应当在整个程序中无需机 器人系统之外的任何外部工作。

模板展示分子文库将含有能够潜在地与任何已知或未知的靶配位的 分子。靶的结合区域可以进入酶的催化部位、受体的结合口袋(例如 GPCR)、蛋白-蛋白相互作用所涉及的蛋白表面区域(尤其是热点区)、以 及DNA的特异性部位(例如大沟)。模板展示分子技术将主要地鉴定与靶 分子配位的分子。靶的天然功能可以或者被刺激(激动)或者被降低(拮 抗)或者不受模板展示分子结合的影响。这将取决于确切的结合方式以 及模板展示分子占据的靶的特定结合位点。不过,已知不同蛋白的功能 部位(如蛋白-蛋白相互作用或催化部位)比蛋白质上的其它更中性表面 区域更倾向于结合分子。此外,这些功能部位通常含有较小的似乎主要 负责结合能的区域,即所谓的热点区(Wells,等,(1993)Recent Prog. Hormone Res.48;253-262)。这一现象将增加直接选择能够影响某一靶 标的生物学功能的小分子的几率。

本发明的模板展示分子技术将允许与其它展示方法例如噬菌体展示 类似的选择操作(Smith(1985)Science 228:1315-1317)。噬菌体展示 选择已经成功地应用于肽(Wells和Lowman.(1992)Curr.Op.Struct. Biol.2,597-604)、蛋白(Marks等(1992)J.Biol.Chem.267: 16007-16010)以及抗体(Winter等(1994)Annu.Rev.Immunol.12: 433-455)。相似的选择操作还在其它类型的展示系统,例如核糖体展示 (Mattheakis等(1994)Proc.Natl.Acad.Sci.91:9022-9026)以 及mRNA展示(Roberts等(1997)Proc.Natl.Acad.Sci.94:12297-302) 中使用。不过,本发明的模板展示分子技术,第一次不依赖于核糖体复 合物上的翻译过程而允许直接选择靶特异性小非肽分子。本发明所包括 的必要步骤是模板的扩增和单体构件的掺入及反应。扩增和掺入以及掺 入和反应或者在同一步骤中、或者在顺序过程中进行。

模控分子(展示的分子)和DNA复制单位(编码模板)之间的连键允许 利用各种选择策略快速鉴定结合分子。本发明在鉴定针对任何已知靶的 结合分子中允许广泛的策略。此外,该技术通过分离针对未知抗原(表位) 的结合分子、并利用这些结合分子鉴定和证实(参见“靶的鉴定和证 实”部分),还可允许发现新的未知靶。

正如大家将会理解的,从模板展示分子文库中选择结合分子可通过任 何形式进行,以鉴定最佳的结合分子。针对纯化的靶标的典型的选择程 序将包括下列主要步骤:产生模板展示分子文库;利用合适的固定方法 固定靶分子;添加文库以允许模板展示分子的结合;除去未结合的模板 展示分子;洗脱结合于固定靶的模板展示分子;扩增富集的模板展示分 子,通过序列分析鉴定,或者输入下一轮的选择。一般步骤示意在图39 中。

在优选的实施方式中,利用模板展示分子文库的标准选择方案是利用 生物淘选方法。在这个技术中,靶(例如蛋白或肽缀合物)被固定到固体 支持物上,并且潜在地与靶配位的模板展示分子是被选择并富集的那些。 不过,选择程序要求结合的模板展示分子能够与未结合的那些,即溶液 中的那些分开。有许多如本领域普通技术人员所公知的方法可以实现这 点。

亲和富集循环的第一步(如图1所述的一轮)是洗掉对固定的靶具 有低亲和力的模板展示分子,留下连附于靶的强烈结合的模板展示分子。 接着用例如酸、离液盐、加热、用已知的配体竞争性洗脱、或者蛋白水 解释放靶/模板分子洗脱富集的在严谨洗涤后仍然与靶结合的群体。洗脱 的模板展示分子适用于PCR,导致许多数量级的扩增,即在第一轮选择中 富集的每个单个模板展示分子以大为增加的拷贝数参与更多轮的选择。 在有代表性的3到10轮富集后,获得了与靶最强烈结合的模板展示分子 大为富集的分子群。这之后定量分析仍然结合于固定靶的模板展示分子 的比例。然后单个地对变体模板序列进行测序。

将靶(肽、蛋白、DNA或其它抗原)固定在珠子上可用于怀疑靶会吸附 于试管(例如洗脱自SDS-PAGE凝胶的非折叠靶)的情况。衍生化的珠子接 着可简单地通过将珠子在bench离心机中沉淀,用于在模板展示分子中 的选择。作为选择,珠子可用于制备亲和柱,并将模板展示文库悬浮液 通过柱子再循环。存在许多用于固定靶分子的反应性基质,包括例如连 附于-NH2基团和-SH基团。磁珠本质上是上述珠子的变体;靶被连附到磁 珠上,其接着被用于选择。活化的珠子存在-NH2或-COOH基团的连附位点 (其可用于偶联)。靶还可以点样到硝酸纤维素膜或PVDF上。当利用点样 策略时,重要的是保证所用的斑点条在靶固定之后要封闭(例如用BSA 或相似蛋白)。

在另一个优选的实施方式中,选择或分配的进行还可以利用例如但不 限于:免疫沉淀或间接免疫沉淀,其中靶分子与模板展示结合分子一起 捕获;亲和柱层析,其中靶被固定在柱子上,并且模板展示文库流经以 捕获靶结合的分子;凝胶移位(琼脂糖或聚丙烯酰胺),其中所选的模板 展示分子与靶一起在凝胶中迁移;FACS分选以确定与模板展示分子配位 的细胞;CsCl梯度离心以一起分离靶分子和模板展示结合分子;质谱分 析以鉴定用模板展示分子标记的靶分子等等。一般而言,模板展示分子/ 靶复合物能够和不与靶结合的模板展示分子分开的任何方法都是有用 的。

表2:利用模板展示技术可能用来鉴定结合分子的选择方法的例子

   靶类型                           优选的方法

 可溶性受体         直接固定、免疫沉淀、亲和柱、FACS分选、MS

细胞表面受体      细胞表面消减选择(Subtraction selection)、FACS

                                   分选、亲和柱

  酶抑制剂           直接固定、免疫沉淀、亲和柱、FACS分选、MS

  表面表位        细胞表面消减选择、在体选择、FACS分选、亲和柱

模板展示分子的洗脱可用不同的方式进行。结合分子可通过变性、酸、 或离液盐从靶分子中释放,并接着转移到另一瓶中用于扩增。作为选择 地,洗脱可以更具特异性以降低背景。洗脱可利用蛋白水解断裂靶和固 定表面之间的、或者展示分子与模板之间的接头实现。同样,洗脱可通 过用已知的配体竞争实现。作为选择地,可在选择反应的终了在洗涤孔 中直接进行PCR反应。

本发明的一个可能的特性是结合分子可无需从靶上洗脱而可被选择 的事实,因为仅仅需要编码模板DNA用于进一步的扩增或克隆,而不是 结合分子本身。已知有些选择程序可如此紧密地结合最需要的配体,以 致于非常难以洗脱。不过本发明的方法能够被成功地实施,以产生所需 要的配体,甚至是共价结合的配体。

可供选择的选择方案包括作为每个文库展示分子的片段的已知配体。 该已知配体将通过与靶分子确定部分的配位(coordinate)来指导选择, 并将选择聚焦在结合同一区域的分子上。这对于提高具有期望的生物学 功能但是效力太低的配体的亲和力尤为有用。

本发明进一步的方面涉及提高单个所选结合分子或所选结合分子的 混合物的多样性或复杂度的方法。在最初的选择后,富集的分子可被改 变以进一步提高展示分子的化学多样性或复杂度。这可利用本领域公知 的各种方法进行。例如,利用合成随机寡核苷酸、插入寡核苷酸或随机 突变。随机化可被集中,以允许优选的密码子,或者定位于模板核苷酸 序列的预定部分或亚序列。其它优选的方法是重组编码结合分子的模板, 其方式与DNA改组用于蛋白的同源基因的方式相似(Stemmer(1994) Nature 370:389-91)。这种方法可用于重组初始的文库或更优选地重组 富集的编码模板。

在本发明的另一个实施方式中,当需要针对仅有可能在细胞表面表达 的特定抗原,例如离子通道或跨膜受体的结合分子时,细胞颗粒本身可 用作为选择剂。在这类方法中,缺乏特定靶的细胞应当用于进行一轮或 更多轮的负选择,或者极大过量地存在于选择过程中。这里,不相关的 模板展示分子被除去。例如,对于针对表达于全细胞上的受体的正选择, 负选择应当针对未转化的细胞。这种方法还被称之为消减选择,并且已 经被成功地用于抗体文库的噬菌体展示(Hoogenboom等(1998) Immunotech.4:1-20).

选择程序的具体例子可包括针对可由膜上内在化的细胞表面受体的 选择,从而受体连同所选择的结合分子可进入细胞质或细胞核。取决于 具体选择的结合分子的解离速率常数,这些分子在摄入后主要存留于细 胞质或核中。

本领域熟练技术人员将会理解该选择方法可在靶用作为模板展示分 子可以与之配位的诱饵的任何设置中进行。

本发明的选择方法可联合次级选择或者筛选以鉴定能够在结合后修 饰靶分子功能的分子配体。因此,本文描述的方法可被用来分离或制备 结合并修饰任何蛋白或核酸的功能的结合分子。设想本发明的方法可被 用于鉴定、分离或制备结合分子,所述结合分子可影响靶酶的催化活性, 即抑制催化或修饰底物结合,影响蛋白受体的功能性,即抑制结合受体 或修饰结合受体的特异性;影响蛋白多聚体形成,即破坏蛋白亚基的四 级结构;以及修饰蛋白的运输性能,即破坏蛋白质对小分子或离子的运 输。

本发明还在进一步的方面涉及在选择过程中允许还可以包括功能性 的方法。例如,当进行针对某一靶的富集产生许多不同的目标样时,接 着可以直接地测试这些目标样的功能性(例如细胞信号传导)。这可以例 如利用荧光激活细胞分选术进行(FACS)。

改变的基因型可由广范围的各种方法检测。一般地,改变的基因型利 用例如:细胞形态的显微镜分析;标准细胞存活分析,包括增加的细胞 死亡和增加的细胞存活;标准标记分析,例如荧光指示剂分析特定细胞 或分子水平的存在,包括FACS或其它染料染色技术;在杀死细胞之后生 化检测靶化合物的表达等等进行检测。在一些情况下,可利用各种报告 基因构建物探测特异性的信号传导路径。

可与模板展示分子技术联合的次级选择方法尤其包括酶抑制、改变或 底物结合、功能性丧失、结构解体等的选择或筛选。本领域普通技术人 员能够在各种可供选择的选择或筛选方法中选择与本文所述方法适配的 方法。

还可以选择本发明的结合分子除了结合之外的其它特性,例如在选择 期间,终产物对所需工作环境的某些条件的稳定性可以包括在选择标准 之内。如果需要在某一蛋白酶存在条件下稳定的结合分子,该蛋白酶可 以是选择期间所用的缓冲介质的一部分。相似地,选择还可以在血清或 细胞提取物或任何类型的介质中进行。人们将会理解,当利用这种模板 展示方法时,破坏或降解模板的条件应予避免以允许扩增。其它期望的 特性可以直接地被掺入到展示分子中,正如本领域熟练技术人员所理解 的。例如,通过使用高疏水性的构件,膜亲和力可以作为一个特性被包 括在内。

通过模板展示分子技术选择的分子可通过各种合成方法制备。化学合 成可以实现,因为选择的结合分子的结构可容易地获自于编码模板的核 酸序列。所选分子的化学合成也是可能的,因为除了将它们组装在一起 的化学反应之外,组成结合分子的构件也是已知的。

在优选的实施方式中,选择的结合分子被合成并在各种合适的体外和 体内测试中测试,以验证所选的侯选分子的生物学效应和效力。这可以 多种方式进行,如本领域技术人员所理解的,并可以取决于生物活性分 子的组成。

靶的鉴定和证实

在另一方面,本发明提供了鉴定或分离参与病理过程或其它生物学事 件的靶的方法。在这方面,靶分子再次地优选是蛋白和核酸,但是还可 以包括,除其它的之外,碳水化合物和各种可以实现特异性分子配体结 合的分子。原则上,模板展示分子技术可用于选择发现于细胞、组织或 体内的抗原的特异性表位。这些表位可以属于参与重要生物学事件的靶。 此外,这些表位还可以参与靶的生物学功能。

噬菌体展示抗体和肽文库已经被无数次成功地用来鉴定新的细胞抗 原(例如Pasqualini等(1996)Nature 380:364-366;Pasqualini等 (2000)Cancer Res.60:722-727;Scheffer等(2002)Br J Cancer 86: 954-962;Kupsch等(1999)Clin Cancer Res.5:925-931;Tseng-Law 等(1999)Exp.Hematol.27:936-945;Gevorkian等(1998)Clin. Immunol.Immunopathol.86:305-309)。尤其有效的是直接在怀疑表达 细胞特异性抗原的细胞上进行的选择。重要地,当选择细胞表面抗原时, 模板分子可以被保持在细胞外面。这会增加模板分子在自细胞表面释放 后完整的几率。

体内选择模板展示分子具有巨大的潜力。通过在体内从模板展示分子 文库中选择,可以分离能够特异性地寻靶到正常组织及其它病理组织(例 如肿瘤)的分子。该原理已经利用肽文库噬菌体展示阐释了(Pasqualini 和Ruoslathi(1996)Nature 280:364-366)。该系统还被用于人类鉴 定定位于不同器官中的肽基序(Arap等(2002)Nat.Med.2:121-127)。 相似的选择操作可被用于模板展示文库。噬菌体展示中的编码DNA通过 允许体内选择的噬菌体颗粒被有效地保护。因此,模板体内的稳定性对 于扩增和鉴定很重要。模板可利用各种核苷酸衍生物以与用来稳定体内 用途的适体(aptamers)相似的方式加以稳定(Nolte(1996)Nature Biotechnol.14:1116-1121;Pagratis等(1997)Nature Biotechnol. 15:68-72)。不过,有理由相信模板结构会由于用于编码展示分子的修 饰碱基而抗降解从而被稳定化。利用各种方法使模板分子屏蔽溶液的其 它类型的保护也是可能的。这可以包括例如脂质体、PEG化、结合蛋白或 其它类型的保护。模板分子还可以整合到另外设计的保护模板免受外部 操作的结构上。例如,可以设计接头掺入到小囊泡中,将模板置于小囊 泡中,并将展示分子置于外侧。这种安排可以保护模板分子免受外部操 作,并且同时允许暴露展示分子以容许选择。

大多数抗体具有较大的凹陷结合区域,这一定程度上需要突出的抗原 表位。同样,抗体分子是大的大分子(150KDa),这会从空间上减少许多 不同抗原(例如在细胞表面上的)的接近。模板展示技术应当能够接近并 识别难于接近抗体的表位。小的结合分子将能够结合进活性部位、沟及 抗原的其它区域。编码模板元件也比抗体小,这将增加模板-结合分子对 的物理接近。此外,模板展示分子文库的多样性和复杂度将比肽文库大 得多。这将增加找到能够与因为不适当的化学而难于接近肽的表位配位 的分子的几率。总而言之,模板展示分子技术具有鉴定不可能用抗体或 肽鉴定的新抗原的潜力。本领域普通技术人员将会理解各种类型的细胞 能够被用于该选择操作。还会理解新抗原的选择可通过利用如前所述的 消减法进行。

本发明的另一方面涉及证实该鉴定的靶的方法。如果它们改变靶的生 物学反应,则鉴定的结合分子可以直接应用。这可以或者通过在体外利 用任何直接的或基于细胞的分析,或者间接地在体内研究任何表型反应 进行。这种方法的实力在于相同的分子既用于鉴定又用于证实各种靶。 最为优选地,结合分子还可以直接地用作为治疗剂。

在另一个优选的实施方式中,模板展示分子被用来拉出靶分子。这可 以例如通过对在细菌噬菌体上表达的cDNA文库进行选择来实现(文库对 文库)。通过混合模板展示分子文库和cDNA文库,有可能找到模板展示 分子文库中的小分子与来自cDNA文库的蛋白之间的结合对。一种可能性 是混合噬菌体展示文库和模板展示文库,并进行噬菌体或模板文库的选 择。选择的文库接着涂板以确定噬菌体克隆和编码噬菌体的DNA,并且模 板展示分子可以接着用PCR鉴定。也可以利用除cDNA之外的其它类型的 文库,例如核酸、碳水化合物、合成多聚体。

在本发明的另外的实施方式中,模板展示分子技术可被用来解释体内 和体外药物代谢。这可以包括I期(活化)和II期(解毒)反应。主要 的反应类型是氧化、还原及水解。其它酶催化缀合。这些酶可以在选择 过程中被用作为靶,以消除倾向于与这些酶配位的展示分子。与这些展 示分子对应的模板可以随后在制备模板展示分子文库时,被用于竞争或 消除这些分子。这些获得的文库则不再含具有结合I-II期所涉及的酶倾 向的分子,并且可能更快消除。例如,可以在细胞色素P450酶、黄素加 单氧酶、单胺氧化酶、酯酶、酰胺酶、水解酶、还原酶、脱氢酶、氧化 酶UDP-葡糖醛酰基转移酶、谷胱甘肽S-转移酶、以及其它相关的酶中每 个单独的酶或者其任何组合上进行选择,以鉴定这些倾向于与这些代谢 酶配位的结合分子。抑制剂由于它们的结合亲和力而可被容易地选择, 但是底物需要至少微摩尔的亲和力以用于鉴定。

本发明另一个感兴趣的实施方式是直接选择被动地或主动地被跨上 皮细胞质膜或其它膜运输的分子的可能性。一个可能的选择分析是利用 CaCO-2细胞,一种人类结肠上皮细胞系,其一般被接受为一个好的胃肠 道上皮屏障的模型。CaCO-2分析包括在组织培养孔插入物中培养人类结 肠上皮细胞系,从而所得的单层顶点和基底侧的区室之间形成生物学 屏障。模板展示分子文库被置于细胞单层的任何一侧,并且收集和扩增 能够渗透细胞单层的分子。这个过程可以重复直到活性分子被鉴定出。 其它细胞系或这种分析的其它设置也是可能的,并且对本领域技术人员 是明显的。

本发明更进一步的方面涉及选择所选择的分子的稳定性的方法。这可 以通过将富集的结合分子库置于有可能降解或改变该结合分子的结构的 环境中进行。各种条件可以是某些蛋白酶或者蛋白酶混合物、细胞提取 物、以及各种来自例如胃肠道的液体。其它条件可以是各种盐或酸环境 或者升高的温度。另一种可能是产生已知配体的文库,并使该文库经过 稳定性测试和选择以鉴定在某些如上所述的条件下的稳定分子。

治疗应用

本发明潜在的治疗应用巨大。例如,本发明的模板展示分子技术可用 于封闭或刺激各种靶。治疗相关靶是已知或怀疑参与发生了故障并因此 导致疾病状态的调节过程的物质。这种过程的例子是受体-配体相互作 用、转录本-DNA相互作用、以及涉及粘附分子的细胞-细胞相互作用、 辅因子-酶相互作用、以及胞内信号传导中蛋白-蛋白相互作用。靶分子 是指任何感兴趣的需要其分子配体的化合物。因此,靶可以,例如包括 化学化合物、化学化合物的混合物、空间定位化合物的阵列、生物大分 子、例如DNA或mRNA,细菌噬菌体肽展示文库、核糖体肽展示文库、来 自生物材料例如细菌、植物、真菌、或动物(如哺乳动物)细胞或组织 的提取物、蛋白、融合蛋白、肽、酶、受体、受体配体、激素、抗原、 抗体、药物、染料、生长因子、脂肪、底物、毒素、病毒等等,但不局 限于此。其它靶的例子包括,例如,整个细胞、整个组织、相关或不相 关蛋白的混合物、病毒或细菌菌株的混合物等,但不局限于此。

治疗药物靶可以根据功能分成不同的类别:受体、酶、激素、转录因 子、离子通道、核受体、DNA(Drews,J.(2000)Science 287:1960-1964)。 其中,受体、核受体、以及代谢酶压倒性地构成了已知的现有药物靶的 绝大多数。尤其是,G蛋白偶联受体(GPCR)连同蛋白酶一起构成了药学干 预的最为重要的药物靶类别之一。尽管上文的例子集中于最相关的靶, 对于本领域熟练技术人员来说,任何其它治疗靶可能很重要是不证自明 的。

使用模板展示分子技术的本发明可用于鉴定所有这些类别的药物靶 的激动剂或拮抗剂,取决于每个靶所持有的特定性质。大多数靶可以获 得纯化的形式以直接用于筛选操作。其它靶不得不在它们的天然环境中 使用,例如包埋的细胞表面受体。在那些情况下,利用模板展示分子文 库的选择可利用先前所述的消减选择进行。

本发明的模板展示分子技术的一个特定应用是产生能够作为拮抗剂 起作用的分子,其中该分子封闭受体和一个或多个配体之间的相互作用。 另一个应用包括细胞靶向。例如,所产生的识别特定表面蛋白或受体的 分子将能够结合某些细胞类型。这样的分子可以额外携带另外的治疗剂, 以提高效力并降低副作用(例如癌症治疗)。还包括涉及抗病毒剂的应用。 例如,所产生的强烈结合病毒颗粒上的表位的分子,可用作为抗病毒剂。

本发明的模板展示分子技术的另一个特定应用是产生能够作为激动 剂起作用的分子,其中该分子刺激或活化受体,以引发细胞信号传导途 径。

模板展示分子阵列

本发明还在进一步的方面涉及检测样品中靶分子存在与否,和/或测 量其量的方法,该方法使用能够由本发明的方法分离的分子配体来进行。 这些分子配体可被分开使用,或者用于多种测定的阵列系统。

有关蛋白结构、蛋白与蛋白的相互作用、途径以及蛋白如何影响疾病 的起源的理解是至关重要的。核酸微阵列已经使得研究人员能够通过基 因分型(genotyping)寻找新的生物标记(biomarker)。不过,主要的 障碍是在mRNA水平的基因表达与细胞内表达的相应蛋白的量之间缺乏相 关性(Andersson等(1997)Electrophiresis 18:533-537)。与DNA 和RNA分析相反,利用生物芯片进行类似的蛋白功能分析要困难得多。 与以线性序列的偶联或相互作用为基础的杂交反应不同,蛋白相互作用 涉及起因于3D折叠的氨基酸序列的多肽表面。制备3D折叠蛋白的需要 充分地使蛋白微阵列的构造复杂化。蛋白微阵列将会对热处理和苛刻的 化学制品的应用非常敏感,并且容易被其降解。此外,折叠蛋白的相互 作用对于序列的依赖性与用于DNA/RNA生物芯片的杂交反应相比要强烈 得多。蛋白相互作用的序列依赖性进一步使得反应动力学复杂化。

本文所描述的发明提供了一种制备能够在蛋白水平上测量不同的量、 而又无需利用蛋白或肽作为检测分子的阵列的可能的解决方案。模板展 示分子技术可被用来鉴定许多靶的小结合分子。这些结合分子接着可以 被排列在特定的位置上,并作为检测分子工作,以检测各种生物标记的 量。例如,针对已知参与特定途径的细胞因子或酶的结合分子能够用所 述的技术产生。这些结合分子可以接着以阵列的形式点斑,用以测量每 种细胞因子或酶的绝对或相对量。

该系统的一个主要优势在于,用于DNA阵列的点斑(spotting)技术 可以同等地应用于该系统。模板展示分子可以直接地施加到点斑的DNA 上。另一种可能性是合成能够直接在预涂敷的模板上利用聚合酶和核苷 酸类似物进行。用这种技术制备可寻址的微阵列将会导致高通量地将数 以千计的不同功能分子沉积在芯片的不同位置上。总的原则显示于图40。

模板展示分子技术在化学方面不局限于20种天然存在的氨基酸。这 将会容许在模板上合成更坚固和稳定的能与各种靶结合的分子。这些更 稳定的分子将会更加适合于被固定在表面上,和暴露于任何苛刻的条件 例如加热、低或高pH的各种清洁剂。此外,这种阵列的保存限期将会比 由蛋白制备的阵列长得多。

分子生物学工具

聚合酶链式反应(PCR)是扩增核酸的一个示例性方法。PCR方法的描 述可见于(Saiki等(1985)Science 230:1350-1354;Scharf等(1986) Science 233:1076-1078;U.S专利4,683,202(Mullis等))。可供选 择的扩增方法,除了别的以外包括将所选的DNAs克隆到合适的载体中, 并将该载体引入到宿主生物体中,在那里载体和克隆的DNAs复制并因此 得以扩增(Guatelli等(1990)Proc.Natl.Acad,Sci.87: 1874-1878)。一般而言,任何允许忠实、有效地扩增所选核酸序列的手 段都可以在本发明的方法中使用。唯一的必要条件是扩增后序列的成比 例表现应当反映扩增前混合物中序列的相对比例。

本发明的模板变体可以通过任何本领域已知的方法制备。这样的方法 包括通过化学合成或者化学合成与重组DNA技术的结合构建核苷酸序列。

编码本发明的模板变体的核苷酸序列可通过分离或合成编码合适的 展示分子的核苷酸序列,然后改变该核苷酸序列,从而实现引入(即插入 或取代)或去除(即缺失或取代)相关的展示分子的功能实体来构建。

与模板分子相应的核苷酸序列可根据常规方法由定点诱变方便地加 以修饰。作为选择地,核苷酸序列通过化学合成,例如通过利用寡核苷 酸合成仪制备,其中以期望模板的序列为基础设计寡核苷酸。例如,编 码部分期望模板的小寡核苷酸可被合成,并通过PCR、连接、或连接链式 反应(LCR)组装(Barany,PNAS 88:189-193,1991)。单个的寡核苷酸典 型地含有用于互补组装的5’或3’突出端。

存在制备用于高通量筛选或选择的模板变体的可供选择的核苷酸序 列修饰方法。举例来说,例如在US 5,093,257中公开的包括同源交换的 方法,以及包括基因改组的方法,即在两个或多个同源核苷酸序列之间 重组产生与起始核苷酸序列相比具有许多核苷酸改变的新的核苷酸序 列。基因改组(也公知为DNA改组)包括一个或多个循环的随机片断化和 核苷酸序列的重新组装,继之以选择,以选择编码具有期望特性的变体 展示分子的核苷酸模板序列。

合适的体外基因改组方法的例子公开于Stemmer等(1994),Proc. Natl.Acad.Sci.USA;vol.91,pp.10747-10751;Stemmer(1994), Nature,vol.370,pp.389-391;Smith(1994),Nature vol.370,pp. 324-325;Zhao等,Nat.Biotechnol.1998,Mar;16(3):258-61;Zhao H.和Arnold,FB,Nucleic Acids Research,1997,Vol.25.No.6 pp. 1307-1308;Shao等,Nucleic Acids Research 1998,Jan 15;26(2): pp.681-83;以及WO 95/17413。

人工合成改组(synthetic shuffling)包括提供基于例如侧翼序列 的重叠合成寡核苷酸文库。重组人工产生的寡核苷酸,并筛选所得的重 组核酸序列,并且如果需要可用于进一步的改组循环。

重组可以从理论上计算,这可利用计算机系统进行或模拟,由此部分 或完全地避免物理操作核酸的需要。

一旦组装(通过合成、定点突变、DNA改组或另外的方法),编码模板 的核苷酸序列被用于产生模板展示文库。

本发明还在另一方面涉及包括本发明的缀合物或变体的药学组合物, 以及制备和应用本发明的缀合物或变体的方法。

术语“亲和力”在本文作为量化术语描述分子-靶之间的相互作用。 亲和力的量化量度通过结合常数(KA)表示。结合常数和解离常数以方程式 KD=1/KA彼此相关。显然,高亲和力对应于较低的解离常数。术语“与 特定的靶结合”是指用模板展示分子技术获得的结合分子与所选择的靶 结合,以致当在合适的结合或功能分析中测试时获得可测量的反应。在 本文中,术语“治疗剂”用于指任何生物学或药学上的活性物质或者包 括抗原的物质;该术语包括在治疗或预防影响动物和人类的疾病或紊乱 方面、或者在调节任何动物或人类生理状况方面有效用的物质,并且它 还包括任何当以有效量给药时,对活细胞或生物体有功效的生物活性化 合物或组合物。

在构建模板展示文库之后,带期望配体的模板展示分子可利用下述方 案捕获。用TBS缓冲液中的大约1μg链霉抗生物素包被两个平底微量滴 定板的两个孔。在4℃过夜温育。除去链霉抗生物素溶液,并且用TBS 洗涤孔至少6次。立即加入2%BSA以封闭孔,并在37℃温育大约30 分钟。板用TBS缓冲液洗涤至少3次。向其中一个孔(利用另一个作为背 景对照)加入大约0.1μg生物素标记的靶分子(生物素标记可按文献所 述进行),并在20℃温育大约30分钟,然后用TBS缓冲液洗涤至少6 次除去过量物质。用1mM生物素封闭游离的链霉抗生物素分子5分钟, 并用TBS缓冲液洗涤至少6次除去过量物质。然后向两个孔中加入模板 展示分子文库,并在20℃温育大约1小时使之结合。用TBS缓冲液洗 涤至少6次以除去不与固定的靶分子配位的模板展示分子。利用除去结 合分子的条件洗脱配位的模板展示分子。在稍后的选择循环中,比较有 或没有靶分子的孔之间的洗脱分子的数目,以确认在有靶的孔中有更多 洗脱的模板展示分子。这将保证在选择步骤中的特异性富集。其它类型 和各种变化的选择程序可见于文献(例如“Phage display:A laboratory manual”(2001)Barbas等,Eds.Cold Spring Harbor Laboratory Press,New York)。

上述捕获可供选择的方案是,在构建模板展示文库之后,利用下述方 案捕获带有期望配体的模板展示分子。模板展示分子的选择可利用磁活 化的细胞分选术进行(Siegel等(1997)J.Immunol.Methods 206: 73-85)。阳性细胞(具有感兴趣抗原的细胞)用sulfo-NHS-LC-生物素 (Pierce)在细胞表面被生物素标记。向10μl链霉抗生物素包被的顺磁 性微珠(Dynal)中添加大约106生物素标记的细胞并使之结合。添加大约 108阴性细胞(没有感兴趣抗原的细胞)。阴性细胞作为非特异性模板展示 分子的吸收剂,而靶细胞捕获特异性的模板展示分子。沉淀细胞混合物, 弃去上清,并悬浮于模板展示文库悬浮液中。在回转装置上于37℃温 育大约2小时,以使细胞保持悬浮。将细胞/模板展示文库溶液上样到磁 柱上,以通过洗掉所有的阴性细胞回收阳性细胞。最后通过撤走磁场洗 脱阳性细胞,并利用PCR扩增洗脱的模板。如果需要,这一选择流程可 重复多次。

能够模控合成模控分子的模板的扩增

在一个方面本发明涉及扩增可以与或不与靶结合的模控分子的方法。 扩增方法的选择有赖于编码或互补元件的选择。天然寡核苷酸可通过任 何现有技术的方法扩增。这些方法包括,但不限于聚合酶链式反应(PCR); 以及例如以核酸序列为基础的扩增(如Compton,Nature 350,91-92 (1991)),扩展的反义RNA(如van Gelder等,PNAS 85:77652-77656 (1988));自持性序列复制系统(如Gnatelli等,PNAS 87:1874-1878 (1990));由例如Schmidt等,NAR 25:4797-4802(1997)等描述的聚合 酶依赖性扩增,以及体内扩增携带克隆的DNA片段的质粒。还可以利用 连接酶介导的扩增方法,例如LCR(连接酶链式反应)。

对于非天然核苷酸,有效扩增程序的选择较少。由于非天然核苷酸本 身根据定义通过某些酶(包括聚合酶)可以被掺入,可能通过在每个延 伸循环中添加聚合酶进行人工聚合酶链式反应。

对于含有核苷酸类似物的寡核苷酸,存在较少的扩增方法。人们可以 利用非酶介导的扩增方案(Schmidt等,NAR 25:4797-4802(1997))。 对于主链修饰的寡核苷酸类似物例如PNA和LNA,可利用这种扩增方法。 在扩增之前或期间,模板或互补模板可以被突变或重组,以为下一轮选 择或筛选创造更大的多样性。

通过选择或筛选分析分离的多聚体的表征

在最后一轮筛选过后,通常期望对单个模板进行序列分析,以便测定 单个模控多聚体的序列。如果模板含有天然核苷酸,则标准程序是任选 地PCR扩增分离的模板(如果模板是RNA分子,有必要在PCR扩增之前 利用逆转录酶制备cDNA),然后将该DNA片段克隆到例如质粒中,转化这 些质粒并接着对含有一个或多个串联的DNA序列的单个质粒克隆进行序 列分析。在本例中,在模板中央的随机或部分随机序列的两个侧翼序列 中(即在引物结合位点)设计限制性位点是可行的。这允许容易地克隆 分离的核苷酸。序列分析可通过标准双脱氧链终止法进行,或者通过更 经典的的方法,例如Maxam-Gilbert测序法进行。

如果模板含有非天然核苷酸,则通过微生物宿主转化而克隆个别序列 是不可行的。不过,利用每个珠子携带一个寡核苷酸序列的珠子群,有 可能在体外克隆,随后所有连附在特定珠子上的核苷酸可以任选地被扩 增并接着测序(Brenner等,2000,Proc.Natl.Acad.Sci.USA 97, 1665-1670)。作为选择地,人们可以充分地稀释分离物群,并接着在微 量滴定板中等分成小份,从而孔中平均含有例如0.1个模板。通过由例 如PCR扩增单个模板,现在有可能利用标准方法进行测序。当然,这要 求非天然核苷酸是PCR中所用的热稳定聚合酶的底物。

如果利用可供选择的、需要较短寡核苷酸的方法,可能期望对起始模 板分子加以设计,以便该模板的编码/模控合成区的每一侧含有限制性位 点。由此,在最终一轮选择过后,模板可以被限制性酶切,以获得编码 模控多聚体的短寡核苷酸,然后这些短寡聚体(oligos)可应用于各种 分析操作。

还可以通过利用具有随机但是预定的序列的寡聚体的DNA阵列对分 离物进行序列分析。

还可能期望对分离物群作为库(pool)进行测序,例如如果希望序列 能对齐,例如由于初始文库是由基于具有已知的(相对高)期望活性的 多聚体序列的简并序列组成的。从而,期望在选择前所有的分离物具有 与模板初始序列相似的序列。因此,分离物群可以作为整体被测序,以 获得该群体就整体而言的共有序列。

模控分子(templated molecules)

可通过本发明所描述的各种原理模控合成的非详尽的并且是非限制 性的寡聚体列表列于下文:

α-、β-、γ-和ω-肽

单-、双-和三-取代的肽

L-和D-型肽

环己烷-和环戊烷-主链修饰的β-肽

插烯多肽(vinylogous polypeptides)

糖多肽

聚酰胺类

插烯氨磺酰肽(vinylogous sulfonamide peptide)

聚磺酰胺(polysulfonamide)

缀合肽(即具有辅基)

聚酯

多糖

聚氨基甲酸酯类

聚碳酸酯类

聚脲类

聚肽基膦酸酯类(poly-peptidylphosphonates)

Azatides

类肽(peptoids)(寡聚N-取代的甘氨酸)

聚醚类

乙氧基甲缩醛寡聚体(ethoxyformacetal oligomers)

聚硫醚类

聚乙二醇类(PEG)

聚烯烃(polyethylenes)

聚二硫化物(polydisulfides)

聚亚芳基硫醚(polyarylene sulfides)

多核苷酸

PNAs

LNAs

morpholinos

寡聚吡咯啉酮(oligo pyrrolinone)

聚肟类(polyoximes)

聚亚胺类(polyimines)

聚乙烯亚胺

醋酸酯类(polyacetates)

聚苯乙烯类

聚乙炔

聚乙烯(polyvinyl)

脂类

磷脂

糖脂

多环化合物(polycycles)(脂肪族)

多环化合物(芳族)

多杂环化合物(polyheterocycles)

蛋白多糖

聚硅氧烷类

聚异氰化物类(polycyanides)

聚异氰酸酯类

聚甲基丙烯酸酯类

单官能、双官能、三官能及低官能的开链碳氢化合物

单官能、双官能、三官能及低官能的非芳香族碳环

单环、双环、三环及多环碳氢化合物

桥连的多环碳氢化合物

单官能、双官能、三官能及低官能的非芳香族杂环.

单环、双环、三环及多环的杂环

桥连的多环的杂环

单官能、双官能、三官能及低官能的芳族碳环

单环、双环、三环及多环的芳族碳环

单官能、双官能、三官能及低官能的芳族杂环

单环、双环、三环及多环的杂环

螯合物

Fullerenes

上述的任何组合。

该列表涉及含有一个或多个所列主链结构和/或含有数个相同类型的 键(例如酰胺键)的任何直链、支化或环状结构。杂聚物(不同多聚体类 型的杂合物)也可以通过本发明模控合成。

下面提供的表阐述了根据本发明可制备的多聚体以及制备它们所需 的功能实体/反应基团。请参照相关附图:

多聚体 功能实体 (反应基团) 连接分子 催化剂/试剂 总图 具体的图 多环化合物 双香豆素 光 图11 图11例1 聚酯 乙醇、羧酸 碳二亚胺 图12 图21 聚酯 羟基、硫酯 图14 聚脲 二胺 羰基二咪唑 图15 图15例3 聚醋酸酯 卤素、羧酸 碱 图12 图22 聚醋酸酯 醇、羧酸 EDC或其它 碳二亚胺 图12 图22 聚氨基甲酸酯 醇、异氰酸酯 图12 图22 聚碳酸酯 二醇 羰基二咪唑 图15 类肽 仲胺、α-卤代乙酰 图12 图22 伯胺、α-卤代乙酰 烷基化剂 图12 图22 糖原 UDP-葡萄糖 糖原合成酶 图12 图22 多糖 UDP-活化的糖 多糖合成酶 图12 图22 多糖 葡糖基硫化物硫醚 (glucosyl sulphide)/亚 砜活化系统(Kahne 葡糖基化) Kahne条件 图12 图22 聚酰胺 胺、N-羟基琥珀酰亚 胺酯 图12 图22 聚酰胺 胺、羧酸 碳二亚胺 图12 图22

多聚体 功能实体 (反应基团) 连接分子 催化剂/试剂 总图 具体的图 聚酰胺 二胺 二羧酸 碳二亚胺 图15 图15例2 聚酰胺 二羧酸 二胺 碳二亚胺 图15 聚酰胺 胺、羧酸 胺、羧酸 碳二亚胺 图17 α-多肽 羧酸酐(5元环) 图19 β-多肽 羧酸酐(6元环) 图19 图19例1 γ-多肽 羧酸酐(7元环) 图19 α-多肽 2,2- diphenylthiazinan one(5元环) 图19 β-多肽 2,2- diphenylthiazinan one(6元环) 图19 图19例2 γ-多肽 2,2- diphenylthiazinan one(7元环) 图19 α-多肽 胺、硫酯 图14 β-多肽 胺、硫酯 图14 图14例1 γ-多肽 胺、硫酯 图14 ω-多肽 胺、硫酯 图14 聚磺酰胺 胺、磺酸 碳二亚胺 图12 图22 聚膦酸酯 二醇 活化的膦酸酯 图15 聚膦酸酯 二醇 活化的烷基膦 氧化剂 如叔丁基氢过氧 化物 图15 聚磷酸酯 二醇 二氨基烷氧基膦 氧化剂 如叔丁基氢过氧 化物 图15 聚磷酸二酯 二醇 二氨基膦 氧化剂(ButOOH) 图15 图15例5 聚磷酸二酯 二氨基膦 二醇 氧化剂(ButOOH) 图15 图15例6

多聚体 功能实体 (反应基团) 连接分子 催化剂/试剂 总图 具体的图 聚氨酯 二胺 二异氰酸酯 图15 聚醚 环氧化物 图19 图18例3 聚硫醚 硫代环氧化物 (thioepoxide) 图19 聚二硫化物 硫醇、硫醇 氧化剂 图11 聚肟 醛、羟胺 图12 图22 聚亚胺 醛、羟胺 图15 图15例l 聚亚胺 醛、胺 图12 图22 多核苷酸 核苷-5’磷酸-2’-   甲基imidazolides (nucleoside-5’-ph  osphoro-2-methyli  midazolides) 图12 图22 聚胺 胺、磺酸烷基酯 图14 图14例2 链烷 链烯 图18 图18例1 链烷 链烯 图18 图18例2 聚环烷 双二烯 二烯(苯醌) 图15 图15例7 聚乙烯 (polyvinyl) 乙烯基氯单位 图18 聚苯乙烯 苯乙烯单位 自由基引发剂, AIBN 图18 聚乙烯 (polyethylene) 乙烯单位 图18 图18例1

模板

在一个实施方式中,模控分子通过单个接头连接于模控合成该模控分 子的互补模板或者模板。在另一个实施方式中,模控合成模控分子的方 法进一步包括释放模控合成该模控分子的模板或互补模板,并获得不与 模控合成该模控分子的互补模板或者模板连接的模控分子的步骤。

模板优选包括n个线性序列形式的编码元件。包括n个编码元件的模 板也可以是支化的。n优选是2-200的数值,例如2-100,比如2-80, 例如2-60,比如2-40,例如2-30,比如2-20,例如2-15,比如2 -10,比如2-8,例如2-6,比如2-4,例如2,比如3-100,例如3 -80,比如3-60,比如3-40,例如3-30,比如3-20,比如3-15, 例如3-15,比如3-10,比如3-8,例如3-6,比如3-4,例如3, 比如4-100,例如4-80,比如4-60,比如4-40,例如4-30,比如 4-20,比如4-15,例如4-10,比如4-8,比如4-6,例如4,例如 5-100,比如5-80,例如5-60,比如5-40,例如5-30,比如5- 20,例如5-15,比如5-10,比如5-8,例如5-6,例如5,比如6- 100,例如6-80,比如6-60,比如6-40,例如6-30,比如6-20, 比如6-15,例如6-10,比如6-8,比如6,例如7-100,比如7-80, 例如7-60,比如7-40,例如7-30,比如7-20,例如7-15,比如7 -10,例如7-8,例如7,例如8-100,比如8-80,例如8-60,比如 8-40,例如8-30,比如8-20,例如8-15,比如8-10,比如8,例 如9,例如10-100,比如10-80,例如10-60,比如10-40,例如10 -30,比如10-20,例如10-15,比如10-12,比如10,例如12-100, 比如12-80,例如12-60,比如12-40,例如12-30,比如12-20, 例如12-15,比如14-100,比如14-80,例如14-60,比如14-40, 例如14-30,比如14-20,例如14-16,比如16-100,比如16-80, 例如16-60,比如16-40,例如16-30,比如16-20,比如18-100, 比如18-80,例如18-60,比如18-40,例如18-30,比如18-20, 例如20-100,比如20-80,例如20-60,比如20-40,例如20-30, 比如20-25,例如22-100,比如22-80,例如22-60,比如22-40, 例如22-30,比如22-25,例如25-100,比如25-80,例如25-60, 比如25-40,例如25-30,比如30-100,例如30-80,比如30-60, 例如30-40,比如30-35,例如35-100,比如35-80,例如35-60, 比如35-40,例如40-100,比如40-80,例如40-60,比如40-50, 例如40-45,比如45-100,例如45-80,比如45-60,例如45-50, 比如50-100,例如50-80,比如50-60,例如50-55,比如60-100, 例如60-80,比如60-70,例如70-100,比如70-90,例如70-80, 比如80-100,例如80-90,比如90-100的值。

在本发明的一些实施方式中,优选模板连附在固体或者半固体载体 上。

在一个实施方式中的模板优选包括或者基本上是由从由脱氧核糖核 酸(DNA)、核糖核酸(RNA)、肽核酸(PNA)、封闭核酸(locked nucleic acids)(LNA)、以及morpholinos序列(morpholinos sequences)组成 的组中选择的核苷酸(包括其任何类似物或衍生物)组成。

在另一个实施方式中,编码元件的模板优选包括或者基本上是由从由 DNA、RNA、PNA、LNA以及morpholinos序列组成的组中选择的核苷酸(包 括其任何类似物或者衍生物)组成,而且互补元件优选包括或者基本上 是由从由DNA、RNA、PNA、LNA以及morpholinos序列,包括其任何类似 物或者衍生物,组成的组中选择的核苷酸组成。

在本发明的各种实施方式中,优选模板具有如下一个或多个特征:i) 模板是可扩增的,ii)模板包括编码元件单链,优选能与包括互补元件 单链的互补模板杂交形成双螺旋的编码元件单链,以及iii)模板包括引 发位点(priming site)。

编码元件

每个编码元件优选通过共价化学键与相邻的编码元件连接。每个编码 元件还可以通过共价化学键与每个相邻的编码元件连接。共价化学键优 选从由磷酸二酯键、硫代磷酸酯(phosphorothioate)键和肽键组成的 共价键组中选择。更优选地,共价化学键是从由磷酸二酯键和硫代磷酸 酯键组成的共价键组中选择。

在优选的实施方式中,至少一个编码元件连附在固体或者半固体载体 上。

在本发明的一个实施方式中,编码元件是从由核苷酸、包括其任何类 似物或衍生物,氨基酸、抗体和抗原组成的组中选择,并且优选是从由 核苷酸、核苷酸衍生物、和核苷酸类似物,包括其任何组合,组成的组 中选择。在另一个实施方式中,编码元件是从由核苷酸组成的组中选择, 包括核苷酸,例如包括从腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶 (C)中选择的碱基的脱氧核糖核酸,以及包括从腺嘌呤(A)、尿嘧啶(U)、 鸟嘌呤(G)和胞嘧啶(C)中选择的碱基的核糖核酸。同时在这种情况下, 每个核苷酸可以通过共价键与相邻的核苷酸连接,或者通过共价键与每 个相邻的核苷酸连接。共价键优选是磷酸二酯键和硫代磷酸酯键。

在另一个实施方式中,编码元件是从由脱氧核糖核酸和核糖核酸组成 的组中选择的天然和非天然核苷酸。

编码元件和相应的互补元件

当编码元件优选地选自核苷酸、核苷酸衍生物和核苷酸类似物(其中 一个或者多个碱基部分和/或磷酸酯部分和/或核糖或者脱氧核糖部分 已被可供选择的分子实体所取代)时,相应的互补元件能够与所说的编 码元件相互作用,并且优选包括选自如下的核苷酸或者基本上由选自如 下的核苷酸组成:DNA,RNA,PNA,LNA以及morpholinos序列,包括其 任何类似物或者衍生物。每个核苷酸通过共价化学键与相邻的核苷酸连 接,或者通过共价化学键与每一个相邻的核苷酸连接。共价化学键优选 选自由磷酸二酯键和肽键组成的共价键组。

编码元件亚单位

在一个实施方式中,编码元件优选包括或者基本上由1-100个亚单 位,比如1-80个亚单位,例如1-60个亚单位,比如1-40个亚单位, 例如1-20个亚单位,比如1-18个亚单位,例如1-16个亚单位,比 如1-14个亚单位,例如1-12个亚单位,比如1-10个亚单位,例如1 -9个亚单位,比如1-8个亚单位,例如1-7个亚单位,比如1-6个 亚单位,例如1-5个亚单位,比如1-4个亚单位,例如1-3个亚单位, 比如1-2个亚单位,例如1个亚单位,比如2-100个亚单位,比如2 -80个亚单位,例如2-60个亚单位,比如2-40个亚单位,例如2- 20个亚单位,比如2-18个亚单位,例如2-16个亚单位,比如2-14 个亚单位,例如2-12个亚单位,比如2-10个亚单位,例如2-9个亚 单位,比如2-8个亚单位,例如2-7个亚单位,比如2-6个亚单位, 例如2-5个亚单位,比如2-4个亚单位,例如2-3个亚单位,比如2 个亚单位,比如3-100个亚单位,比如3-80个亚单位,例如3-60个 亚单位,比如3-40个亚单位,例如3-20个亚单位,比如3-18个亚 单位,例如3-16个亚单位,比如3-14个亚单位,例如3-12个亚单 位,比如3-10个亚单位,例如3-9个亚单位,比如3-8个亚单位, 例如3-7个亚单位,比如3-6个亚单位,例如3-5个亚单位,比如3 -4个亚单位,例如3个亚单位,例如4-100个亚单位,比如4-80个 亚单位,例如4-60个亚单位,比如4-40个亚单位,例如4-20个亚 单位,比如4-18个亚单位,例如4-16个亚单位,比如4-14个亚单 位,例如4-12个亚单位,比如4-10个亚单位,例如4-9个亚单位, 比如4-8个亚单位,例如4-7个亚单位,比如4-6个亚单位,例如4 -5个亚单位,例如4个亚单位,比如5-100个亚单位,比如5-80个 亚单位,例如5-60个亚单位,比如5-40个亚单位,例如5-20个亚 单位,比如5-18个亚单位,例如5-16个亚单位,比如5-14个亚单 位,例如5-12个亚单位,比如5-10个亚单位,例如5-9个亚单位, 比如5-8个亚单位,例如5-7个亚单位,比如5-6个亚单位,比如5 个亚单位,例如6-100个亚单位,比如6-80个亚单位,例如6-60个 亚单位,比如6-40个亚单位,例如6-20个亚单位,比如6-18个亚 单位,例如6-16个亚单位,比如6-14个亚单位,例如6-12个亚单 位,比如6-10个亚单位,例如6-9个亚单位,比如6-8个亚单位, 例如6-7个亚单位,比6个亚单位,比如7-100个亚单位,比如7-80 个亚单位,例如7-60个亚单位,比如7-40个亚单位,例如7-20个 亚单位,比如7-18个亚单位,例如7-16个亚单位,比如7-14个亚 单位,例如7-12个亚单位,比如7-10个亚单位,例如7-9个亚单位, 比如7-8个亚单位,比如7个亚单位,例如8-100个亚单位,比如8 -80个亚单位,例如8-60个亚单位,比如8-40个亚单位,例如8- 20个亚单位,比如8-18个亚单位,例如8-16个亚单位,比如8-14 个亚单位,例如8-12个亚单位,比如8-10个亚单位,例如8-9个亚 单位,例如8个亚单位,比如9-100个亚单位,比如9-80个亚单位, 例如9-60个亚单位,比如9-40个亚单位,例如9-20个亚单位,比 如9-18个亚单位,例如9-16个亚单位,比如9-14个亚单位,例如9 -12个亚单位,比如9-10个亚单位,比如9个亚单位,例如10-100 个亚单位,比如10-80个亚单位,例如10-60个亚单位,比如10-40 个亚单位,例如10-20个亚单位,比如10-18个亚单位,例如10-16 个亚单位,比如10-14个亚单位,例如10-12个亚单位,比如10个亚 单位,比如11-100个亚单位,比如11-80个亚单位,例如11-60个 亚单位,比如11-40个亚单位,例如11-20个亚单位,比如11-18个 亚单位,例如11-16个亚单位,比如11-14个亚单位,例如11-12个 亚单位,比如12-100个亚单位,比如12-80个亚单位,例如12-60 个亚单位,比如12-40个亚单位,例如12-20个亚单位,比如12-18 个亚单位,例如12-16个亚单位,比如12-14个亚单位,例如13-100 个亚单位,比如13-80个亚单位,例如13-60个亚单位,比如13-40 个亚单位,例如13-20个亚单位,比如13-18个亚单位,例如13-16 个亚单位,比如13-14个亚单位,例如14-100个亚单位,比如14-80 个亚单位,例如14-60个亚单位,比如14-40个亚单位,例如14-20 个亚单位,比如14-18个亚单位,例如14-16个亚单位,比如15-100 个亚单位,比如15-80个亚单位,例如15-60个亚单位,比如15-40 个亚单位,例如15-20个亚单位,比如15-18个亚单位,例如15-16 个亚单位,比如16-100个亚单位,比如16-80个亚单位,例如16-60 个亚单位,比如16-40个亚单位,例如16-20个亚单位,比如16-18 个亚单位,例如17-100个亚单位,比如17-80个亚单位,例如17-60 个亚单位,比如17-40个亚单位,例如17-20个亚单位,比如17-18 个亚单位,例如18-100个亚单位,比如18-80个亚单位,例如18-60 个亚单位,比如18-40个亚单位,例如18-20个亚单位,比如19-100 个亚单位,比如19-80个亚单位,例如19-60个亚单位,比如19-40 个亚单位,例如19-30个亚单位,比如19-25个亚单位,例如20-100 个亚单位,比如20-80个亚单位,例如20-60个亚单位,比如20-40 个亚单位,例如20-30个亚单位,比如20-25亚单位组成。

在优选的实施方式中,每个编码元件亚单位包含或者基本上是由核苷 酸或核苷酸类似物组成。核苷酸可以是包含选自腺嘌呤(A)、胸腺嘧啶 (T)、鸟嘌呤(G)和胞嘧啶(C)的碱基的脱氧核糖核酸,或者它可以是包含 选自腺嘌呤(A)、尿嘧啶(U)、鸟嘌呤(G)和胞嘧啶(C)的碱基的核糖核酸。 每个核苷酸通过共价键与相邻的核苷酸、或者核苷酸类似物连接,或者 通过共价键与每个相邻的核苷酸、或者核苷酸类似物连接,所述共价键 包括选自磷酸二酯键、硫代磷酸酯键和肽键的共价键。

在一个实施方式中,优选至少一些所说的核苷酸选自核苷酸衍生物, 包括脱氧核糖核酸衍生物和核糖核酸衍生物。

编码元件亚单位和相应的互补元件亚单位

编码元件亚单位优选选自核苷酸、核苷酸衍生物和核苷酸类似物(其 中一个或者多个碱基部分和/或磷酸酯部分和/或核糖部分和/或脱氧 核糖部分已被可供选择的分子实体所取代),而能够与所说的编码元件亚 单位相互作用的相应互补元件亚单位包含或者基本上由选自DNA、RNA、 PNA、LNA以及morpholinos序列的核苷酸(包括其任何类似物或者衍生 物)组成。

每个核苷酸衍生物可以通过共价化学键与相邻的核苷酸、或者核苷酸 类似物连接,或者可以通过共价化学键与每个相邻的核苷酸、或者核苷 酸类似物连接。共价化学键优选选自由磷酸二酯键、硫代磷酸酯键和肽 键组成的共价键组。

互补元件

在一个实施方式中,互补模板优选在线性序列或支化序列中包含n个 互补元件。n优选是2-200的数值,例如2-100,比如2-80,例如2 -60,比如2-40,例如2-30,比如2-20,例如2-15,比如2-10, 比如2-8,例如2-6,比如2-4,例如2,比如3-100,例如3-80, 比如3-60,比如3-40,例如3-30,比如3-20,比如3-15,例如3 -15,比如3-10,比如3-8,例如3-6,比如3-4,例如3,比如4 -100,例如4-80,比如4-60,比如4-40,例如4-30,比如4-20, 比如4-15,例如4-10,比如4-8,比如4-6,例如4,例如5-100, 比如5-80,例如5-60,比如5-40,例如5-30,比如5-20,例如5 -15,比如5-10,比如5-8,例如5-6,例如5,比如6-100,例如 6-80,比如6-60,比如6-40,例如6-30,比如6-20,比如6-15, 例如6-10,比如6-8,比如6,例如7-100,比如7-80,例如7-60, 比如7-40,例如7-30,比如7-20,例如7-15,比如7-10,例如7 -8,例如7,例如8-100,比如8-80,例如8-60,比如8-40,例如 8-30,比如8-20,例如8-15,比如8-10,比如8,例如9,例如10 -100,比如10-80,例如10-60,比如10-40,例如10-30,比如 10-20,例如10-15,比如10-12,比如10,例如12-100,比如12 -80,例如12-60,比如12-40,例如12-30,比如12-20,例如12 -15,比如14-100,比如14-80,例如14-60,比如14-40,例如 14-30,比如14-20,例如14-16,比如16-100,比如16-80,例如 16-60,比如16-40,例如16-30,比如16-20,比如18-100,比如 18-80,例如18-60,比如18-40,例如18-30,比如18-20,例如 20-100,比如20-80,例如20-60,比如20-40,例如20-30,比如 20-25,例如22-100,比如22-80,例如22-60,比如22-40,例如 22-30,比如22-25,例如25-100,比如25-80,例如25-60,比如 25-40,例如25-30,比如30-100,例如30-80,比如30-60,例如 30-40,比如30-35,例如35-100,比如35-80,例如35-60,比如 35-40,例如40-100,比如40-80,例如40-60,比如40-50,例如 40-45,比如45-100,例如45-80,比如45-60,例如45-50,比如 50-100,例如50-80,比如50-60,例如50-55,比如60-100,例 如60-80,比如60-70,例如70-100,比如70-90,例如70-80, 比如80-100,例如80-90,比如90-100的值。

在一些实施方式中,互补模板连附在固体或半固体支持物上。

在一个实施方式中,互补模板包含或者基本上是由选自脱氧核糖核酸 (DNA)、核糖核酸(RNA)、肽核酸(PNA)、封闭核酸(Locked nucleic acid, LNA),以及morpholinos序列(morpholinos sequence)的核苷酸(包 括其任何类似物或者衍生物)组成。

在其他实施方式中,提供了包含或者基本上是由选自DNA、RNA、PNA、 LNA以及morpholinos序列的核苷酸(包括其任何类似物或者衍生物)组 成的互补模板,其中该模板的相应编码元件包含或者基本上是由选自 DNA、RNA、PNA、LNA以及morpholinos序列的核苷酸(包括其任何类似 物或者衍生物)组成。

互补模板优选是可扩增的和/或包含单链的互补元件和/或包含单链 的、能与包含单链编码元件的模板杂交形成双螺旋的互补元件和/或包含 引发位点(priming site)。

每个互补元件优选通过共价化学键与相邻的互补元件连接,或者通过 共价化学键与每个相邻的互补元件连接。在一个实施方式中,共价化学 键选自磷酸二酯键、硫代磷酸酯键和肽键组成的共价键组。在其它实施 方式中,共价键组是由磷酸二酯键和硫代磷酸酯键组成的。

至少一个互补元件可连附在固体或半固体支持物上。

互补元件可以选自核苷酸(包括其任何类似物或衍生物)、氨基酸、 抗体和抗原,并且优选选自核苷酸、核苷酸衍生物、和核苷酸类似物, 包括其任何组合。在一个实施方式中,优选互补元件选自核苷酸,包括 脱氧核糖核酸(其包含选自腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧 啶(C)的碱基),以及核糖核酸(其包含选自腺嘌呤(A)、尿嘧啶(U)、鸟 嘌呤(G)和胞嘧啶(C)的碱基)。

每个核苷酸可通过共价键与相邻的核苷酸、或核苷酸类似物连接,或 者可通过共价键与每个相邻的核苷酸、或核苷酸类似物连接。共价键可 以是磷酸二酯键或硫代磷酸酯键。

在另一个实施方式中,互补元件是从由脱氧核糖核酸和核糖核酸组成 的组中选择的天然或非天然核苷酸。

互补元件和相应的编码元件

当互补元件选自核苷酸、核苷酸衍生物和核苷酸类似物(其中一个或 者多个碱基部分和/或磷酸酯部分和/或核糖和/或脱氧核糖部分已被 可供选择的分子实体所取代)时,能够与所说的互补元件相互作用的编 码元件包含或者基本上由选自DNA、RNA、PNA、LNA以及morpholinos序 列的核苷酸(包括其任何类似物或者衍生物)组成。

每个核苷酸可通过共价化学键与相邻的核苷酸、或核苷酸类似物连 接,或者可通过共价化学键与每个相邻的核苷酸、或核苷酸类似物连接。 共价化学键优选从由磷酸二酯键、硫代磷酸酯键和肽键组成的共价键组 中选择。

在一个实施方式中,互补元件选自于核苷酸,并且在一个优选的实施 方式中,互补元件可利用从由模板依赖性DNA聚合酶和RNA聚合酶组成 的组中选择的酶酶促连接,其中所述酶包括逆转录酶,DNA-连接酶和RNA -连接酶,核酶和脱氧核酶,包括HIV-1逆转录酶,AMV逆转录酶,T7 RNA 聚合酶,T7 RNA聚合酶突变体Y639F,测序酶,Taq DNA聚合酶,Klenow 片断(DNA聚合酶I的大片段),DNA-连接酶,T7 DNA聚合酶,T4 DNA 聚合酶,T4 DNA连接酶,大肠杆菌RNA聚合酶,rTh DNA聚合酶,Vent DNA聚合酶,Pfu DNA聚合酶,Tte DNA聚合酶,以及有连接酶或者复 制酶活性的核酶。

更优选地,所述酶从由HIV-1逆转录酶,AMV逆转录酶,T7 RNA聚 合酶,T7 RNA聚合酶突变体Y639F,测序酶,Taq DNA聚合酶,Klenow 片断(DNA聚合酶I的大片段),DNA-连接酶,T7 DNA聚合酶,T4 DNA 聚合酶和T4 DNA连接酶组成的组中选择。核苷酸优选在掺入后形成模板 或互补模板。

在另一个实施方式中,互补元件可以选自于核苷酸,并且通过使用化 学试剂,pH值变化,光,催化剂,辐射,比如电磁辐射连接,或者当彼 此发生反应性接触时通过自发偶联连接。

互补元件亚单位

互补元件优选包含或者基本上由1-100个亚单位,比如1-80个亚 单位,例如1-60个亚单位,比如1-40个亚单位,例如1-20个亚单 位,比如1-18个亚单位,例如1-16个亚单位,比如1-14个亚单位, 例如1-12个亚单位,比如1-10个亚单位,例如1-9个亚单位,比如 1-8个亚单位,例如1-7个亚单位,比如1-6个亚单位,例如1-5 个亚单位,比如1-4个亚单位,例如1-3个亚单位,比如1-2个亚单 位,例如1个亚单位,比如2-100个亚单位,比如2-80个亚单位,例 如2-60个亚单位,比如2-40个亚单位,例如2-20个亚单位,比如2 -18个亚单位,例如2-16个亚单位,比如2-14个亚单位,例如2- 12个亚单位,比如2-10个亚单位,例如2-9个亚单位,比如2-8个 亚单位,例如2-7个亚单位,比如2-6个亚单位,例如2-5个亚单位, 比如2-4个亚单位,例如2-3个亚单位,比如2个亚单位,比如3-100 个亚单位,比如3-80个亚单位,例如3-60个亚单位,比如3-40个 亚单位,例如3-20个亚单位,比如3-18个亚单位,例如3-16个亚 单位,比如3-14个亚单位,例如3-12个亚单位,比如3-10个亚单 位,例如3-9个亚单位,比如3-8个亚单位,例如3-7个亚单位,比 如3-6个亚单位,例如3-5个亚单位,比如3-4个亚单位,例如3个 亚单位,例如4-100个亚单位,比如4-80个亚单位,例如4-60个亚 单位,比如4-40个亚单位,例如4-20个亚单位,比如4-18个亚单 位,例如4-16个亚单位,比如4-14个亚单位,例如4-12个亚单位, 比如4-10个亚单位,例如4-9个亚单位,比如4-8个亚单位,例如4 -7个亚单位,比如4-6个亚单位,例如4-5个亚单位,例如4个亚单 位,比如5-100个亚单位,比如5-80个亚单位,例如5-60个亚单位, 比如5-40个亚单位,例如5-20个亚单位,比如5-18个亚单位,例 如5-16个亚单位,比如5-14个亚单位,例如5-12个亚单位,比如5 -10个亚单位,例如5-9个亚单位,比如5-8个亚单位,例如5-7 个亚单位,比如5-6个亚单位,比如5个亚单位,例如6-100个亚单 位,比如6-80个亚单位,例如6-60个亚单位,比如6-40个亚单位, 例如6-20个亚单位,比如6-18个亚单位,例如6-16个亚单位,比 如6-14个亚单位,例如6-12个亚单位,比如6-10个亚单位,例如6 -9个亚单位,比如6-8个亚单位,例如6-7个亚单位,比6个亚单位, 比如7-100个亚单位,比如7-80个亚单位,例如7-60个亚单位,比 如7-40个亚单位,例如7-20个亚单位,比如7-18个亚单位,例如7 -16个亚单位,比如7-14个亚单位,例如7-12个亚单位,比如7- 10个亚单位,例如7-9个亚单位,比如7-8个亚单位,比如7个亚单 位,例如8-100个亚单位,比如8-80个亚单位,例如8-60个亚单位, 比如8-40个亚单位,例如8-20个亚单位,比如8-18个亚单位,例 如8-16个亚单位,比如8-14个亚单位,例如8-12个亚单位,比如8 -10个亚单位,例如8-9个亚单位,例如8个亚单位,比如9-100个 亚单位,比如9-80个亚单位,例如9-60个亚单位,比如9-40个亚 单位,例如9-20个亚单位,比如9-18个亚单位,例如9-16个亚单 位,比如9-14个亚单位,例如9-12个亚单位,比如9-10个亚单位, 比如9个亚单位,例如10-100个亚单位,比如1 0-80个亚单位,例如 10-60个亚单位,比如10-40个亚单位,例如10-20个亚单位,比如 10-18个亚单位,例如10-16个亚单位,比如10-14个亚单位,例如 10-12个亚单位,比如10个亚单位,比如11-100个亚单位,比如11 -80个亚单位,例如11-60个亚单位,比如11-40个亚单位,例如11 -20个亚单位,比如11-18个亚单位,例如11-16个亚单位,比如11 -14个亚单位,例如11-12个亚单位,比如12-100个亚单位,比如 12-80个亚单位,例如12-60个亚单位,比如12-40个亚单位,例如 12-20个亚单位,比如12-18个亚单位,例如12-16个亚单位,比如 12-14个亚单位,例如13-100个亚单位,比如13-80个亚单位,例如 13-60个亚单位,比如13-40个亚单位,例如13-20个亚单位,比如 13-18个亚单位,例如13-16个亚单位,比如13-14个亚单位,例如 14-100个亚单位,比如14-80个亚单位,例如14-60个亚单位,比如 14-40个亚单位,例如14-20个亚单位,比如14-18个亚单位,例如 14-16个亚单位,比如15-100个亚单位,比如15-80个亚单位,例如 15-60个亚单位,比如15-40个亚单位,例如15-20个亚单位,比如 15-18个亚单位,例如15-16个亚单位,比如16-100个亚单位,比如 16-80个亚单位,例如16-60个亚单位,比如16-40个亚单位,例如 16-20个亚单位,比如16-18个亚单位,例如17-100个亚单位,比如 17-80个亚单位,例如17-60个亚单位,比如17-40个亚单位,例如 17-20个亚单位,比如17-18个亚单位,例如18-100个亚单位,比如 18-80个亚单位,例如18-60个亚单位,比如18-40个亚单位,例如 18-20个亚单位,比如19-100个亚单位,比如19-80个亚单位,例如 19-60个亚单位,比如19-40个亚单位,例如19-30个亚单位,比如 19-25个亚单位,例如20-100个亚单位,比如20-80个亚单位,例如 20-60个亚单位,比如20-40个亚单位,例如20-30个亚单位,比如 20-25亚单位组成。

在优选的实施方式中,每个亚单位包括或者基本上是由核苷酸或核苷 酸类似物组成。核苷酸可以是包括从腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤 (G)和胞嘧啶(C)中选择的碱基的脱氧核糖核酸,或者是包括从腺嘌呤 (A)、尿嘧啶(U)、鸟嘌呤(G)和胞嘧啶(C)中选择的碱基的核糖核酸。

每个所说的核苷酸可通过共价键与相邻的核苷酸、或核苷酸类似物连 接,或者通过共价键与每个相邻的核苷酸、或核苷酸类似物连接。共价 键优选从磷酸二酯键、硫代磷酸酯键和肽键组成的组中选择。

在一个实施方式中,优选至少一些所说的核苷酸选自由核苷酸衍生物 组成的组,包括从脱氧核糖核酸衍生物和核糖核酸衍生物组成的组中选 择的核苷酸衍生物。

互补元件亚单位和相应的编码元件亚单位

当互补元件亚单位选自核苷酸、核苷酸衍生物和核苷酸类似物组成 (其中一个或者多个碱基部分和/或磷酸酯部分和/或核糖部分和/或 者脱氧核糖部分已被可供选择的分子实体所取代)时,能够与所说的互 补元件亚单位相互作用的编码元件亚单位优选包括或者基本上由选自 DNA、RNA、PNA、LNA以及morpholinos序列的核苷酸(包括其任何类似 物或者衍生物)组成。

优选每个核苷酸衍生物通过共价化学键与相邻的核苷酸、或核苷酸类 似物连接,或者通过共价化学键与每个相邻的核苷酸、或核苷酸类似物 连接。共价化学键可以从磷酸二酯键、硫代磷酸酯键和肽键组成的共价 键组中选择。

构件、可断裂接头及选择性可断裂接头

本发明一方面提供了一种构件,其包括

i)能够特异性识别带识别基团的编码元件的互补元件,所说的互补 元件是从核苷酸、氨基酸、抗体、抗原、蛋白、肽、和有核苷酸识别能 力的分子中选择,

ii)至少一个功能实体,其选自α-肽,β-肽,γ-肽,ω-肽,单 -、双-、和三-取代的α-肽,β-肽,γ-肽,ω-肽,其氨基酸残基 是L型或者D型的肽,插烯多肽(vinylogous polypeptides),糖多肽, 聚酰胺类,插烯氨磺酰肽,聚磺酰胺类,含有例如辅基的缀合肽,聚酯 类,多糖,聚氨基甲酸酯类,聚碳酸酯类,聚脲类,聚肽基膦酸酯(poly peptidylphosphonate),聚氨酯类,azatides,寡聚N-取代的甘氨酸, 聚醚类,乙氧基甲缩醛寡聚体,聚硫醚类,聚乙二醇(PEG)类,聚烯烃类 (polyethylenes),聚二硫化物(polydisulfides),聚亚芳基硫醚类, 多核苷酸,PNA,LNA,morpholinos,寡聚吡咯啉酮(oligo pyrrolinone), 聚肟类,聚亚胺类,聚乙烯亚胺类,聚酰亚胺类,聚缩醛类,聚乙酸酯 类,聚苯乙烯类,聚乙烯类,脂类,磷脂,糖脂,包括例如脂肪族或芳 族环的多环化合物,包括多杂环化合物,蛋白聚糖,和聚硅氧烷的前体, 和

iii)将功能实体和互补元件分隔开的接头或选择性可断裂接头。

构件的互补元件优选选自核苷酸序列,比如具有1-8个核苷酸,如 1-6个核苷酸,如1-4个核苷酸,比如1-3个核苷酸,比如2个核苷 酸或者例如3个核苷酸的序列。

功能实体可以从选自α-氨基酸、β-氨基酸、γ-氨基酸、双取代氨 基酸、多取代氨基酸、插烯氨基酸(vinylogous amino acids)、N-取 代甘氨酸衍生物和其它修饰氨基酸的氨基酸的前体中选择。

本发明还提供了如本文所定义的构件的组合物,其中该组合物中至少 两个构件是不同的。

这多个构件的至少一个亚组优选包含一个互补元件和一个功能实体 及一个接头。

在一个实施方式中,每个构件包含至少一个I型反应基团和/或至少 一个II型反应基团,包括一个I型反应基团、两个I型反应基团、一个 II型反应基团、以及两个II型反应基团。

功能实体的至少一个所说的II型反应基团优选从由N-羧酸酐 (NCA),N-硫代羧酸酐(NTA),胺,羧酸,酮,醛,羟基,硫醇,酯, 硫酯,任何双键共轭体系,肼,N-羟基琥珀酰亚胺酯,和环氧化物组成 的组中选择。

在一些实施方式中,II型反应基团是亲电子基团、亲核基团、或自 由基。

所说的多个构件的至少一个亚组包括选择性可断裂接头,该接头将功 能实体和互补元件分隔,其中在导致将功能实体和不属于含有选择性可 断裂接头的构件亚组的构件的互补元件分开的可断裂接头断裂的条件 下,所说的选择性可断裂接头不被断裂。在这些构件的可断裂接头发生 断裂时,至少一个将模控分子与互补模板或互补元件连接或者将所说的 模控分子与作为模板的元件或模控合成该模控分子的模板连接的选择性 可断裂接头不被断裂。

接头和选择性可断裂接头可被例如酸、碱、化学试剂、光、电磁辐射、 酶、或者催化剂断裂,前提是可断裂接头的断裂导致选择性可断裂接头 的断裂,除非希望这样。

在一个实施方式中,接头或选择性可断裂接头的长度范围是从约 0.8_至约70_,比如从0.8_至约60_,例如从0.8_至约50_,比 如从0.8_至约40_,例如从0.8_至约30_,比如从0.8_至约25_, 例如从0.8_至约20_,比如从0.8_至约18_,例如从0.8_至约 16_,比如从0.8_至约14_,例如从0.8_至约12_,比如从0.8_ 至约10_,例如从0.8_至约8_,比如从0.8_至约7_,例如从0.8 _至约6_,比如从0.8_至约5_,例如从0.8_至约4_,比如从0.8_ 至约3.5_,例如从0.8_至约3.0_,比如从0.8_至约2.5_,例如 从0.8_至约2.0_,比如从0.8_至约1.5_,例如从0.8_至约1.0 _。

在另一个实施方式中,接头或者选择性可断裂接头的长度范围是从约 1_至约60_,比如从1_至约40_,例如从1_至约30_,比如从1_ 至约25_,例如从1_至约20_,比如从1_至约18_,例如从1_ 至约16_,比如从1_至约14_,例如从1_至约12_,比如从1_ 至约10_,例如从1_至约8_,比如从1_至约7_,例如从1_至 约6_,比如从1_至约5_,例如从1_至约4_,比如从1.0_至约 3.5_,例如从1.0_至约3.0_,比如从1.0_至约2.5_,例如从1.0 _至约2.0_,比如从1.0_至约1.5_,例如从1.0_至约1.2_。

而在另一个实施方式中,接头或者选择性可断裂接头的长度范围是从 约2_至约40_,比如从2_至约30_,比如从2_至约25_,例如 从2_至约20_,比如从2_至约18_,例如从2_至约16_,比如 从2_至约14_,例如从2_至约12_,比如从2_至约10_,例如 从2_至约8_,比如从2_至约7_,例如从2_至约6_,比如从2_ 至约5_,例如从2_至约4_,比如从2.0_至约3.5_,例如从2.0_ 至约3.0_,比如从2.0_至约2.5_,例如从2.0_至约2.2_。

在进一步的实施方式中,接头或者选择性可断裂接头的长度范围是从 约4_至约40_,比如从4_至约30_,比如从4_至约25_,例如 从4_至约20_,比如从4_至约18_,例如从4_至约16_,比如 从4_至约14_,例如从4_至约12_,比如从4_至约10_,例如 从4_至约8_,比如从4_至约7_,例如从4_至约6_,比如从4_ 至约5_。

在更进一步的实施方式中,接头或者选择性可断裂接头的长度范围是 从约6_至约40_,比如从6_至约30_,比如从6_至约25_,例 如从6_至约20_,比如从6_至约18_,例如从6_至约16_,比 如从6_至约14_,例如从6_至约12_,比如从6_至约10_,例 如从6_至约8_,比如从6_至约7_。

而在另一个实施方式中,接头或者选择性可断裂接头的长度范围是从 约8_至约40_,比如从8_至约30_,比如从8_至约25_,例如 从8_至约20_,比如从8_至约18_,例如从8_至约16_,比如 从8_至约14_,例如从8_至约12_,比如从8_至约10_。

模控分子    

模控分子可以与或不与模控合成该模控分子的模板连接。

在一个实施方式中,本发明涉及包括或者基本上是由选自α-氨基酸, β-氨基酸,γ-氨基酸,ω-氨基酸的氨基酸组成的模控分子。

在各种优选的实施方式中,模控分子包括或者基本上由一个或多个天 然氨基酸残基,α-氨基酸,单取代的α-氨基酸,双取代的α-氨基酸, 单取代的β-氨基酸,双取代的β-氨基酸,或三取代的β-氨基酸,四取 代的β-氨基酸,γ-氨基酸,ω-氨基酸,插烯氨基酸,以及N-取代的 甘氨酸组成。

上述包括β-氨基酸的模控分子优选具有包括或基本上由环己烷主链 和/或环戊烷主链组成的主链结构。

在其它实施方式中,模控分子包括或基本上由选自α-肽,  β-肽, γ-肽,ω-肽,单-、双-、和三-取代的α-肽,β-肽,γ-肽,ω- 肽,其氨基酸残基是L型或者D型的肽,插烯多肽,糖多肽,聚酰胺, 插烯氨磺酰肽,聚磺酰胺,含有例如辅基的缀合肽,聚酯,多糖,聚氨 基甲酸酯,聚碳酸酯,聚脲,聚肽基膦酸酯,聚氨酯,azatides,寡聚N -取代的甘氨酸,聚醚,乙氧基甲缩醛寡聚体,聚硫醚,聚乙二醇(PEG), 聚烯烃,聚二硫化物,聚亚芳基硫醚,多核苷酸,PNA,LNA,morpholinos, 寡聚吡咯啉酮,聚肟,聚亚胺,聚乙烯亚胺,聚酰亚胺,聚缩醛,聚乙 酸酯,聚苯乙烯,聚乙烯,脂类,磷脂,糖脂,包括例如脂肪族或芳族 环的多环化合物,包括多杂环化合物,蛋白聚糖,和聚硅氧烷(包括其 任何组合)的分子或分子实体组成。

根据本发明的模控分子的相邻残基可通过从由肽键,磺酰胺键,酯键, 糖键,氨基甲酸酯键,碳酸酯键,脲键,膦酸酯键,氨基甲酸乙酯键, azatide键,类肽键(peptoid bond),醚键,乙氧基键,硫醚键,单碳 键,双重碳键,三重碳键,二硫键,硫键(sulfide bond),磷酸二酯键, 肟键,亚胺键,酰亚胺键(包括其任何组合)组成的组中选择的化学键 连接。

此外,在一方面根据本发明的模控分子的主链结构可以包括或者基本 上由选自-NHN(R)CO-;-NHB(R)CO-;-NHC(RR’)CO-;-NHC(=CHR)CO-; -NHC6H4CO-;-NHCH2CHRCO-;-NHCHRCH2CO-;-COCH2-;-COS-;-CONR-; -COO-;-CSNH-;-CH2NH-;-CH2CH2-;-CH2S-;-CH2SO-;-CH2SO2-; -CH(CH3)S-;-CH=CH-;-NHCO-;-NHCONH-;-CONHO-;-C(=CH2)CH2-; -PO2-NH-;-PO2-CH2-;-PO2-CH2N+-;-SO2NH--;和内酰胺(包括其任何 组合)的分子基团组成。

在本发明的其它实施方式中,模控分子不是聚合体性质的。

在一个实施方式中,前体优选从由α-氨基酸前体,β-氨基酸前体, γ-氨基酸前体和ω-氨基酸前体组成的前体组中选择。

在一些实施方式中,模控分子是包括至少一个重复的官能团序列的寡 聚体或者多聚体,例如至少三个官能团在模控分子中至少重复两次。模 控分子还包括其中具有至少三个官能团的任何序列只出现一次的分子。

一些优选的模控分子优选包括或者基本上由至少2个不同的官能团, 比如至少3个不同的官能团,例如至少4个不同的官能团,比如至少5 个不同的官能团,例如至少6个不同的官能团,比如至少7个不同的官 能团,例如至少8个不同的官能团,比如至少9个不同的官能团,例如 至少10个不同的官能团,比如多于10个不同的官能团组成。官能团还 可以是相同的。

在本发明的一个优选的方面,提供了包括多聚体的模控分子,所述多 聚体包括多个共价连接的、分别含有至少一个残基的官能团,其中所述 多个残基的个数优选是2-200,例如2-100,比如2-80,例如2-60, 比如2-40,例如2-30,比如2-20,例如2-15,比如2-10,比 如2-8,例如2-6,比如2-4,比如2,比如3-100,例如3-80, 比如3-60,比如3-40,例如3-30,比如3-20,比如3-15,例 如3-15,比如3-10,比如3-8,例如3-6,比如3-4,例如3, 比如4-100,例如4-80,比如4-60,比如4-40,例如4-30,比 如4-20,比如4-15,例如4-10,比如4-8,比如4-6,比如4, 例如5-100,比如5-80,例如5-60,比如5-40,例如5-30,比 如5-20,例如5-15,比如5-10,比如5-8,例如5-6,例如5, 比如6-100,例如6-80,比如6-60,比如6-40,例如6-30,比 如6-20,比如6-15,例如6-10,比如6-8,比如6,例如7-100, 比如7-80,例如7-60,比如7-40,例如7-30,比如7-20,例 如7-15,比如7-10,比如7-8,比如7,例如8-100,比如8- 80,例如8-60,比如8-40,例如8-30,比如8-20,例如8-15, 比如8-10,例如8,比如9,例如10-100,比如10-80,例如10 -60,比如10-40,例如10-30,比如10-20,例如10-15,比如10 -12,比如10,例如12-100,比如12-80,例如12-60,比如12 -40,例如12-30,比如12-20,例如12-15,比如14-100,比如 14-80,例如14-60,比如14-40,例如14-30,比如14-20,例 如14-16,比如16-100,比如16-80,例如16-60,比如16-40, 例如16-30,比如16-20,比如18-100,比如18-80,例如18- 60,比如18-40,例如18-30,比如18-20,例如20-100,比如20 -80,例如20-60,比如20-40,例如20-30,比如20-25,例如22 -100,比如22-80,例如22-60,比如22-40,例如22-30,比如 22-25,例如25-100,比如25-80,例如25-60,比如25-40,例 如25-30,比如30-100,例如30-80,比如30-60,例如30-40, 比如30-35,例如35-100,比如35-80,例如35-60,比如35- 40,例如40-100,比如40-80,例如40-60,比如40-50,例如40 -45,比如45-100,例如45-80,比如45-60,例如45-50,比如 50-100,例如50-80,比如50-60,例如50-55,比如60-100, 例如60-80,比如60-70,例如70-100,比如70-90,例如70- 80,比如80-100,例如80-90,比如90-100个。

在本发明的另一个优选的方面,提供了包括多聚体的模控分子,所述 多聚体包括多个共价连接的、分别含有残基的官能团,其中所述共价连 接的残基能够产生多聚体,该多聚体单独地或者与其它部分组合地包含 至少一个选自如下多聚体部分的部分:α-肽,β-肽,γ-肽,ω-肽, 单-、双-、和三-取代的α-肽,β-肽,γ-肽,ω-肽,其氨基酸残 基是L型或者D型的肽,插烯多肽,糖多肽,聚酰胺,插烯氨磺酰肽,聚 磺酰胺,含有例如辅基的缀合肽,聚酯,多糖,聚氨基甲酸酯,聚碳酸 酯,聚脲,聚肽基膦酸酯,聚氨基甲酸酯,azatides,寡聚N-取代的 甘氨酸,聚醚,乙氧基甲缩醛寡聚体,聚硫醚,聚乙二醇(PEG),聚烯烃, 聚二硫化物,聚亚芳基硫醚,多核苷酸,PNA,LNA,morpholinos,寡聚 吡咯啉酮,聚肟,聚亚胺,聚乙烯亚胺,聚酰亚胺,聚缩醛,聚乙酸酯, 聚苯乙烯,聚乙烯,脂类,磷脂,糖脂,包括例如脂肪族或芳族环的多 环化合物,包括多杂环化合物,蛋白聚糖,和聚硅氧烷,并且其中所述 多个残基优选是2-200个,例如2-100个,比如2-80个,例如2-60 个,比如2-40个,例如2-30个,比如2-20个,例如2-15个,比 如2-10个,比如2-8个,例如2-6个,比如2-4个,例如2个,比 如3-100个,例如3-80个,比如3-60个,比如3-40个,例如3- 30个,比如3-20个,比如3-15个,例如3-15个,比如3-10个, 比如3-8个,例如3-6个,比如3-4个,例如3个,比如4-100个, 例如4-80个,比如4-60个,比如4-40个,例如4-30个,比如4 -20个,比如4-15个,例如4-10个,比如4-8个,比如4-6个, 例如4个,例如5-100个,比如5-80个,例如5-60个,比如5-40 个,例如5-30个,比如5-20个,例如5-15个,比如5-10个,比 如5-8个,例如5-6个,例如5个,比如6-100个,例如6-80个, 比如6-60个,比如6-40个,例如6-30个,比如6-20个,比如6 -15个,例如6-10个,比如6-8个,比如6个,例如7-100个,比 如7-80个,例如7-60个,比如7-40个,例如7-30个,比如7-20 个,例如7-15个,比如7-10个,比如7-8个,例如7个,例如8- 100个,比如8-80个,例如8-60个,比如8-40个,例如8-30个, 比如8-20个,例如8-15个,比如8-10个,比如8个,例如9个, 例如10-100个,比如10-80个,例如10-60个,比如10-40个,例 如10-30个,比如10-20个,例如10-15个,比如10-12个,比如10 个,例如12-100个,比如12-80个,例如12-60个,比如12-40个, 例如12-30个,比如12-20个,例如12-15个,比如14-100个,比 如14-80个,例如14-60个,比如14-40个,例如14-30个,比如 14-20个,例如14-16个,比如16-100个,比如16-80个,例如16 -60个,比如16-40个,例如16-30个,比如16-20个,比如18- 100个,比如18-80个,例如18-60个,比如18-40个,例如18-30 个,比如18-20个,例如20-100个,比如20-80个,例如20-60个, 比如20-40个,例如20-30个,比如20-25个,例如22-100个,比 如22-80个,例如22-60个,比如22-40个,例如22-30个,比如 22-25个,例如25-100个,比如25-80个,例如25-60个,比如25 -40个,例如25-30个,比如30-100个,例如30-80个,比如30 -60个,例如30-40个,比如30-35个,例如35-100个,比如35 -80个,例如35-60个,比如35-40个,例如40-100个,比如40 -80个,例如40-60个,比如40-50个,例如40-45个,比如45- 100个,例如45-80个,比如45-60个,例如45-50个,比如50-100 个,例如50-80个,比如50-60个,例如50-55个,比如60-100个, 例如60-80个,比如60-70个,例如70-100个,比如70-90个,例 如70-80个,比如80-100个,例如80-90个,比如90-100个。

在一个实施方式中,模控分子优选是这样的模控分子,其中共价连接 的残基能够产生多聚体,该多聚体独有地、或者与选自该组的附加部分 结合地包括至少一个从由α-肽,β-肽,γ-肽,ω-肽,单-、双-、 和三-取代的α-肽,β-肽,γ-肽,ω-肽,其氨基酸残基是L型或者 D型的肽,和插烯多肽组成的多聚体部分组中选择的部分。

在一个特别的实施方式中,模控分子是其中共价连接的残基能够产生 多糖的分子。

在另一个方面,提供了包括官能团序列的模控分子,其中相邻的官能 团通过与所述官能团非天然相联的分子部分连接。

本发明另外的方面涉及i)包括共价连接的官能团的序列的模控分 子,其中模控分子不包括或不由α-肽或核苷酸组成,ii)包括共价连接 的官能团的序列的模控分子,其中模控分子不包括或不由单取代的α-肽 或核苷酸组成,以及iii)包括共价连接的官能团的序列的模控分子,其 中模控分子不包括或不由肽或核苷酸组成。

模控分子组合物

根据本发明的模控分子,包括就在上文所提到的那些,可存在于模控 分子组合物中,其中所说的组合物包括多于或约103个的多个不同模控 分子,比如多于或约104个不同的模控分子,例如多于或约105个不同 的模控分子,比如多于或约106个不同的模控分子,例如多于或约107 个不同的模控分子,比如多于或约108个不同的模控分子,例如多于或 约109个不同的模控分子,比如多于或约1010个不同的模控分子,例如 多于或约1011个不同的模控分子,比如多于或约1012个不同的模控分 子,例如多于或约1013个不同的模控分子,  比如多于或约1014个不同 的模控分子,例如多于或约1015个不同的模控分子,比如多于或约1016 个不同的模控分子,例如多于或约1017个不同的模控分子,比如多于或 约1018个不同的模控分子。

在一些实施方式中,该组合物优选进一步包括能够模控合成每个模控 分子或其亚组的模板。因此,在本发明一个优选的方面,提供了i)包括 模控分子和能够模控合成该模控分子的模板的组合物,或者ii)包括模 控分子和模控合成了该模控分子的模板的组合物。

或者i)与能够模控合成模控分子的模板连接的、或者ii)存在于进 一步包括能够模控合成所述模控分子的模板的组合物中的模控分子的各 种优选的特性就列在下文。

当存在于这种组合物中时,优选i)当模控分子是仅包含单取代的α -氨基酸的肽时,模板不完全由天然核苷酸组成,ii)当模控分子是天 然α-肽时,模板不是天然核苷酸,iii)当模控分子是天然α-肽时,模 板不是核苷酸,iv)当模控分子是单取代的α-肽时,模板不是核苷酸, v)当模控分子是α-肽时,模板不是核苷酸,vi)当模控分子是肽时, 模板不是天然的核苷酸,以及vii)当模控分子是肽时,模板不是核苷酸。

连接于模控合成了该模控分子的模板的模控分子

在本发明的一个优选的方面,提供了包括共价连接的官能团的序列的 模控分子,其中模控分子通过接头与互补模板或者模控合成了该模控分 子的模板相连接,其中模控分子不包括或者不由α-肽组成。

在本发明的另一个优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中模控分子不包括或者不由单取代的α-肽组成。

而在本发明的另一个优选的方面,提供了包括共价连接的官能团的序 列的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分 子合成的模板相连接,其中模控分子不包括或者不由α-肽或核苷酸组 成。

在本发明更进一步的方面,提供了包括共价连接的官能团的序列的模 控分子,其中模控分子通过接头与互补模板或者模控了该模控分子合成 的模板相连接,其中当模控分子是α-肽时,模板不是天然核苷酸。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是仅包含单取代的α-氨基酸的肽 时,模板不完全由天然核苷酸组成。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是天然的α-肽时,模板不是天然核 苷酸。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是天然的α-肽时,模板不是核苷酸。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是单取代的α-肽时,模板不是核苷 酸。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是α-肽时,模板不是核苷酸。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是肽时,模板不是天然核苷酸。

在本发明更进一步优选的方面,提供了包括共价连接的官能团的序列 的模控分子,其中模控分子通过接头与互补模板或者模控了该模控分子 合成的模板相连接,其中当模控分子是肽时,模板不是核苷酸。

模控分子可根据本文上面所描述的方法获得。

本发明在更进一步的方面提供了

i)包括共价连接的构件的序列的模控分子;

ii)包括共价连接的构件的序列的模控分子,其中共价连接的构件 的序列包括互补元件序列,互补元件序列形成能够和模控合成该模控分 子的模板互补的互补模板,并且其中模控分子与互补模板或模控其合成 的模板连接;以及

iii)根据前述权利要求任一项的模控分子,其中模控分子包括含有 至少一个官能团和任选的至少一个II型反应基团的功能实体的序列,并 且其中每个功能实体与互补模板或模控合成该模控分子的模板连接。

模控分子的用途

根据本发明的模控分子可用于各种不同的商业目的。

在一个方面,本发明提供了筛选潜在地具有预定活性的模控分子的方 法,所说的方法包括提供靶分子或靶体,包括表面,并且获得对所述靶 分子或靶体有亲和力或有作用的模控分子的步骤。

本发明另一方面涉及分析潜在地与模控分子相关的活性的方法,所说 的方法包括提供靶分子或靶体,包括表面,并且获得对所述靶分子或靶 体有亲和力或有作用的模控分子,以及测定模控分子的活性的步骤。

而本发明另一方面提供了选择有预定活性的复合物或模控分子的方 法,所说的方法包括进行选择操作,并以预定的选择标准为基础选择模 控分子的步骤。

本发明还提供了筛选有预定活性的分子的组合物的方法,包括:

i)建立如本文所述的、或者由用于制备模控分子的任何方法如本 文所限定而制备的模控分子的第一组合物,

ii)将第一组合物置于使所述第一组合物富集带有预定活性的模控 分子的条件下,并且

iii)任选地扩增所述富集组合物的模控分子,获得第二组合物,

iv)进一步任选地重复步骤ii)-iii),并且

v)进一步获得含有更高比率的有特定预定活性的模控分子的组合 物。

在一个实施方式中,该方法进一步包括突变模控分子的步骤,其中所 述突变可发生在实施步骤iii)之前、同时或者之后。突变可由随机或者 定点突变实现。

该方法的步骤iii)优选包括101-1015倍的扩增。并且可以重复步骤 ii)和iii),例如至少2次、3次、5次、或者至少10次,例如至少15 次。

该方法可进一步包括鉴定有预定活性的模控分子的步骤,并且所说的 鉴定可通过例如分析与该分子物理地或以其它方式相连的模板和/或互 补模板而进行。

富集第一组合物的条件可以包括进一步向所述有预定活性的模控分 子提供结合配偶体,其中所说的结合配偶体被直接或间接地固定在支持 物上。

富集组合物的条件可以包括任何现有技术的方法,包括电泳分离,凝 胶过滤,免疫沉淀,等电聚焦,离心和固定中的任何一个或者多个。富 集组合物的条件还可以包括进一步提供能够内在化模控分子、或者能与 有预定活性的模控分子进行相互作用的细胞的步骤。

模控分子的预定活性优选是酶活性或者催化活性。

在另一个方面,本发明提供了扩增互补模板或者模控合成具有或潜在 地具有预定活性的模控分子的模板的方法,所述方法包括使模板同扩增 工具(amplification means)相接触,并且扩增模板的步骤。扩增互补 模板或者模控合成具有或潜在地具有预定活性的模控分子的模板的方 法,优选包括包括步骤i)使模板同扩增工具相接触,并且扩增模板,和 ii)获得至少增加两倍的量的模控分子。

在另一个方面,本发明提供了改变模控分子序列的方法,包括产生含 有官能团的新序列或改变序列的模控分子,其中所述方法优选包括步骤:

i)提供能模控合成第一模控分子的第一模板或第一互补模板,或多 个这样的能模控合成多个第一模控分子的第一模板或第一互补模板,

ii)对第一互补模板或第一模板,或所述多个第一互补模板或第一模 板的序列进行突变或修饰,并产生第二模板或第二互补模板,或多个第 二模板或第二互补模板,

其中所述第二模板或互补模板能够模控合成第二模控分子或多个第 二模控分子,

其中所述第二模控分子包括和第一模控分子的官能团序列不相同的 共价连接的官能团的序列,且任选地

iii)通过所述第二模板或互补模板模控合成第二模控分子、或多个这 样的第二模控分子。

而在另一方面,本发明提供了改变模控分子序列的方法,包括产生含 有官能团的新序列或改变序列的模控分子,其中所述方法优选包括步骤:

i)提供多个能模控合成多个第一模控分子的第一模板或第一互补 模板,

ii)将所述多个第一互补模板或第一模板的序列进行重组,并产生第 二模板或第二互补模板,或多个第二模板或第二互补模板,

其中所说的第二模板或互补模板能够模控合成第二模控分子或多个 第二模控分子,

其中所述第二模控分子包括和第一模控分子的官能团序列不相同的 共价连接的官能团的序列,且任选地

iii)通过所述第二模板或互补模板模控合成第二模控分子或多个这 样的第二模控分子。

该方法可以优选包括进一步扩增模控合成该模控分子的模板或互补 模板的步骤,其中所述扩增步骤发生在突变或重组步骤的之前、同时或 者之后。

当应用突变时,其可作为定向突变、盒式突变、化学突变、独特点消 除(unique site-elimination,USE)、易错PCR、易错DNA改组中的任 一个应用。突变优选包括DNA改组和/或包括体内或体外同源重组在内的 任何形式的重组。

模控分子的变体和功能等价物

本发明还涉及模控分子的任何变体和功能等价物。这种变体和功能等 价物可通过任何本领域现有技术中修饰以多聚体(包括肽)形式存在的 模控分子的方法获得。

在本发明的模控分子的背景下,如果它们含有相似的主链结构和/或 相似的官能团,则分子被称为是同源的。官能团、或官能团的分子实体, 被分成三个同源性组(homology groups):带电官能团、疏水基团、以 及亲水基团。当官能团包括两个或三个属于不同的同源性组的分子实体 时,该官能团被称为属于两个或三个不同的同源性组。

同源性以百分比(%)度量。作为例子,序列AABBCACAAA和BBAACACBBB (其中A、B和C分别代表属于同源性组A、B和C的官能团)是30%同源的。

实施例

实施例1-7:单核苷酸结构单元(或称构件)(I)的制备

可以根据下面给出的一般方案制备结构单元I:

实施例1:3-叔丁氧羰基氨基-丙酸(N-Boc-β-丙氨酸)(1a)的制 备

向NaHCO3水溶液(25mL)中的β-丙氨酸(2.25g,25mmol)溶液中 加入二碳酸二叔丁酯(di-tert-butyl dicarbonate)(4.36g,20mmol) 和乙腈(25mL)。反应混合物在室温下搅拌18小时。加入EtOAc(100 mL)并且通过加入NaH2PO4而将pH调节至4-5。将产物萃取到EtOAc(3 ×50mL)中,干燥(Na2SO4),并且真空蒸发至干得到3.71g(98%)。

1H NMR(CDCl3)δ11(1H,br s,COOH),5,07(1H,br s,NH),3,40 (2H,m),2,58(2H,m),1,44(9H,s,tBu)。

实施例2:N-Boc-β-丙氨酸炔丙酯(1b)的制备

将N-Boc-β-丙氨酸(1.91g,10.1mmol)和炔丙基醇(0.675g,12 mmol)溶解于EtOAc(25mL)中。向该溶液加入二环己基碳二亚胺(DCC, 2.06g,10mmol),室温下搅拌16小时之后,过滤反应混合物并且真 空下蒸发至干。得到粗产物。

实施例3:5-碘-2’-脱氧尿苷3’,5’-二-叔丁基二甲基甲硅烷 基醚(1c)的制备

5-碘-2’-脱氧尿苷(Aldrich,2.39g,6.7mmol)和咪唑(2.025 g,29.7mmol)溶解于无水DMF(10mL)。加入叔丁基二甲基甲硅烷基 氯(2.24g,14.9mmol)的无水DMF(5mL)溶液,并且将得到的混合 物在室温下搅拌16小时。

将反应混合物倒入EtOAc(400mL),用NH4Cl(50%饱和水溶液,80 mL)洗涤之后用水(80mL)洗涤。用Na2SO4干燥之后,减压去除 EtOAc,得到无色油状物,放置则固化。用正己烷(14mL)重结晶,得 到2.64g,80%。

1H NMR(CDCl3)δ8.18(1H,br s,NH);8.10(1H,s);6,23(1H, dd);4,40(1H,dt);4.05(1H,dd);3.92(1H,dd);3.78(1H,dd); 2,32(1H,ddd);2.05(1H,ddd);0.95(9H,s,tBu);0.90(9H,s, tBu);0.15(3H,s,CH3);0.13(3H,s,CH3);0.08(3H,s,CH3); 0.07(3H,s,CH3)。

实施例4:化合物(1d)的制备

化合物(1d)

室温下,将碘代甲硅烷基醚(1c)(1.62g,2.7mmol),N-Boc-β- 丙氨酸(1a)(2.03g,8.9mmol)和三乙胺(0.585g,5.8mmol)在10 mL无水DMF中的溶液搅拌。向溶液通入N2 20分钟。加入四(三苯基 膦)钯(O)(269mg,0.2mmol)和碘化(I)(90mg,0.4mmol),并 且在室温下搅拌反应混合物32小时。

将EtOAc(100mL)倒入反应混合物,接着洗涤(NaHCO3水溶液(50 mL);盐水(50mL)),干燥(Na2SO4),并且真空蒸发去除溶剂。

通过二氧化硅柱色谱法纯化粗产物(2.4g),用EtOAc∶庚烷梯度 (1∶2)-(5∶3)(v/v)洗脱。产物产率1.15g,60%。

1H NMR(CDCl3)δ8.45(1H,s),8.05(1H,s,6-H),7.35(1H, bs,NH),6.25(1H,dd,1’-H),4.82(2H,s,CH2O),4,39(1H, m,3’-H),3.97(1H,m,4’-H),3.80(2H,dd,5’,5”-H),3.40 (2H,m,CH2N),2.58(2H,t,CH2),2,2(1H,m,2’-H),2.0(1H, m,2”-H),1.45(9H,s,tBu),0.93(9H,s,tBu),0.89(9H,s, tBu),0.15(3H,s,CH3),0.13(3H,s,CH3),0.08(3H,s,CH3), 0.07(3H,s,CH3)。

实施例5:化合物(1e)的制备

化合物(1e)

室温下,将N-Boc-β-丙氨酸甲硅烷基醚(1d)(100mg,0.15mmol), 醋酸(75mg,1.25mmol)和氟化四丁基铵三水合物(TBAF)(189mg, 0.6mmol)在2mL无水THF中的溶液搅拌3天。

将反应混合物蒸发并且通过二氧化硅柱色谱法纯化,用二氯甲烷 (DCM)∶甲醇(MeOH)梯度(95∶5)-(88∶12)(v/v)洗脱。产物产率26mg, 38%。

1H NMR(CD3OD)δ8.35(1H,s,6-H),6.15(1H,t,1’-H),4.80 (2H,s,CH2O),4,32(1H,dt,3’-H),3.86(1H,q,4’-H),3.70 (2H,dd,5’,5”-H),3.24(2H,m,CH2N),2.47(2H,t,CH2), 2,28-2.10(1H,m,2’,2”-H),1.44(9H,s,tBu)。

实施例6:化合物(1f)的制备

化合物1f

将N-Boc-β-丙氨酸核苷(1e)(26mg,57μmol)溶解于200μL无水 磷酸三甲酯。冷却至0℃之后,加入磷酰氯(POCl3)的无水磷酸三甲酯 溶液(100μL贮备溶液(104mg/mL),68μmol)。0℃下将反应混合物 搅拌2小时。

接着0℃下加入三丁基铵焦磷酸盐(Sigma P-8533)(67.8mg, 143μmol,于300μL无水DMF中)和三丁基胺(26.9mg,145μmol,于 150μL无水DMF中)的溶液。室温下将反应搅拌3分钟之后通过加入1 mL 1.0M碳酸氢三乙基铵终止反应。

实施例7:化合物I的制备

化合物I

N-Boc保护基团的去除

酸化之后,使用HCl将50μl的磷酸化反应混合物调节至pH=1 并且室温下保温30分钟。在TLC上纯化之前使用等摩尔NaOH和乙酸 钠(pH 5.5)将混合物调节至pH 5.5。

利用薄层色谱法(TLC)纯化核苷酸衍生物

从粗混合物,将20个2μl样品加样到Kieselgel 60 F254 TLC (Merck)上。使用100%甲醇作为流动溶液,从核苷酸衍生物中分离出 有机溶剂和没有磷酸化的核苷。接着,空气风干TLC板,并且通过UV- 投影鉴定核苷酸衍生物。分离含有核苷酸衍生物的Kiesel并且使用 10mM乙酸钠(pH=5.5)为溶剂提取两次。通过离心去除Kieselgel, 并且真空干燥上清液。核苷酸衍生物再次悬浮于50-100μl H2O中, 达到1-3mM的最终浓度。在聚合酶延伸反应中使用之前通过UV-吸收 评价每一种核苷酸衍生物的浓度。

实施例8-13:单核苷酸结构单元(II)的制备

可以根据下面给出的一般方案制备结构单元II:

实施例8:N-Boc-3-苯基-β-丙氨酸(2a)的制备

化合物2a

向3-氨基-3-苯基丙酸(3.30g,20mmol)的NaHCO3(50%饱和水 溶液,25mL)溶液中加入二碳酸二叔丁酯(4.36g,20mmol)和乙腈 (30mL)。反应混合物在室温下搅拌18小时。加入二碳酸二叔丁酯(4,36 g,20mmol)。反应混合物在室温下搅拌18小时。

加入EtOAc(100mL)并且通过加入NaH2PO4而将pH调节至4-5。 将产物萃取到EtOAc(3×100mL)中,干燥(Na2SO4),并且真空下蒸 发至干得到粗产物5.6g(105%)。

实施例9:5-(3-羟基丙炔-1-基)-2’-脱氧尿苷3’,5’-二-叔 丁基二甲基甲硅烷基醚(2b)的制备

化合物2b

用N2将碘代甲硅烷基醚(3)(1.30g,2.2mmol),炔丙醇(0.386g, 6.9mmol)和三乙胺(0.438g,4.3mmol)在7mL无水DMF中的溶液脱气。 加入四(三苯基膦)钯(O)(228mg,0.2mmol)和碘化铜(I)(120mg,0.4 mmol),并且在室温下搅拌反应混合物32小时。

将EtOAc(100mL)倒入反应混合物,接着洗涤(NaHCO3水溶液(50 mL);盐水(50mL)),干燥(Na2SO4),并且真空蒸发去除溶剂。

通过二氧化硅柱色谱法纯化粗产物(1.73g),用EtOAc∶庚烷梯度 (2∶3)-(3∶2)(v/v)洗脱。产物产率0.713g,63%。

1H NMR(CDCl3)δ8.47(1H,s),8.05(1H,s,6-H),6.29(1H, dd,1’-H),4,42(2H,s,CH2),4,39(1H,m,3’-H),3.98(1H, m,4’-H),3.83(2H,dd,5’,5”-H),2,32(1H,m,2’-H),2.02 (1H,m,2”-H),0.93(9H,s,tBu),0.89(9H,s,tBu),0.15(3H, s,CH3),0.13(3H,s,CH3),0.08(3H,s,CH3),0.07(3H,s,CH3)。

实施例10:化合物(2c)的制备

化合物2c

将N-Boc-3-苯基-β-丙氨酸(8)(265mg,1.0mmol)和化合物(2b) (255mg,0.5mmol)溶解于THF(15mL)中。向溶液中加入二异丙基 碳二亚胺(DIC,126mg,1mmol)和4-二甲基氨基吡啶(DMAP,10mg), 室温下搅拌16小时之后将反应混合物倒入EtOAc(100mL),用NaHCO3(50%饱和水溶液,50mL)洗涤,干燥(Na2SO4),过滤并且真空蒸发。

通过二氧化硅柱色谱法纯化粗产物,用EtOAc∶庚烷梯度 (1∶2)-(2∶3)(v/v)洗脱。产物产率335mg,88%。

1H NMR(CDCl3)δ8.49(1H,s),8.04(1H,s,6-H),7.29(5H, m,Ph),6.27(1H,dd,1’-H),5.5(1H,bd),5.09(1H,m),4,80 (2H,s,CH2),4,39(1H,m,3’-H),3.98(1H,m,4’-H),3.82(2H, dd,5’,5”-H),2,87(2H,d),2.29(1H,m,2’-H),2.01(1H, m,2”-H),1.41(9H,s,tBu),0.91(9H,s,tBu),0.89(9H, s,tBu),0.15(3H,s,CH3),0.13(3H,s,CH3),0.08(3H,s,CH3), 0.07(3H,s,CH3).

实施例11:化合物2d的制备

化合物2d

室温下,将化合物(2c)(334mg,440μmol),冰醋酸(190mg,3.15 mmol)和氟化四丁基铵三水合物(TBAF)(500mg,1.58mmol)在6mL 无水THF中的溶液搅拌18小时。

将反应混合物蒸发并且通过二氧化硅柱色谱法纯化,用 (DCM)∶(MeOH)梯度(95∶5)-(9∶1)(v/v)洗脱。产物产率122mg,52%。

1H NMR(CDCl3)δ10.1(1H,s),8.24(1H,s,6-H),7.3(5H,m, Ph),6.37(1H,dd,1’-H),5.6(1H,bs),5.09(1H,m),4,79(2H, s,CH2),4,52(1H,m,3’-H),4.0(1H,m,4’-H),3.85(2H,dd, 5’,5”-H),2,87(2H,d),2.4(1H,m,2’-H),2.25(1H,m, 2”-H),1.4(9H,s,tBu)。

实施例12:化合物(2e)的制备:

化合物2e

将化合物(2d)(122mg,230μmol)溶解于400μL无水磷酸三甲酯。 冷却至0℃之后,加入磷酰氯(POCl3)的无水磷酸三甲酯溶液(400μL 贮备溶液(105mg/mL),276μmol)。0℃下将反应混合物搅拌2小时。

接着0℃下加入三丁基铵焦磷酸盐(273mg,576μmol,于1.2mL 无水DMF中)和三丁基胺(109mg,587μmol,于600μL无水DMF中)的 溶液。室温下将反应搅拌10分钟之后通过加入1.0M碳酸氢三乙基铵 (1mL)终止反应。

实施例13:化合物II的制备

化合物II

N-Boc保护基团的去除

磷酸化之后,使用HCl将50μl的磷酸化反应混合物调节至pH=1 并且室温下保温30分钟。在TLC上纯化之前使用等摩尔NaOH和乙酸 钠(pH 5.5)将混合物调节至pH 5.5。

利用薄层色谱法(TLC)纯化核苷酸衍生物

从粗混合物,将20个2μl样品加样到Kieselgel 60 F254TLC (Merck)上。使用100%甲醇作为流动溶液,从核苷酸衍生物分离出有 机溶剂和没有磷酸化的核苷。接着,空气风干TLC板,并且通过UV-投 影鉴定核苷酸衍生物。分离含有核苷酸衍生物的Kiesel并且使用10 mM乙酸钠(pH=5.5)为溶剂提取两次。通过离心去除Kieselgel,并 且真空干燥上清液。核苷酸衍生物再次悬浮于50-100μl H2O中,达 到1-3mM的最终浓度。在聚合酶延伸反应中使用之前通过UV-吸收评 价每一种核苷酸衍生物的浓度。

实施例14-18:单核苷酸结构单元(III)的制备

可以根据下面给出的一般方案制备结构单元III:

实施例14:N-Boc-β-丙氨酸炔丙基酰胺(3a)

化合物2a

将N-Boc-β-丙氨酸(1a)(1.05g,5.5mmol)和炔丙基胺(0.90g, 16.5mmol)溶解于THF(10mL)中。加入二异丙基碳二亚胺(DIC,695 g,5.5mmol),并且在室温下将反应混合物搅拌16小时。

加入水(20mL)并且将产物萃取到EtOAc(3×30mL)中。将合并的 EtOAc干燥(Na2SO4)并蒸发。通过二氧化硅柱色谱法纯化粗产物,用 EtOAc∶庚烷梯度(2∶3)-(3∶2.5)(v/v)洗脱。产物产率0.925g,74%。

1H NMR(CDCl3)δ6.69(1H,bs,NH),5,32(1H,bs,NH),4.04(2H, bs),3,41(2H,dd),2,45(2H,t),2.24(1H,s),1,44(9H,s, tBu)。

实施例15:化合物(3b)的制备

化合物3b

室温下将5-碘-2’-脱氧胞苷(176mg,0.5mmol),N-Boc-β-丙 氨酸炔丙基酰胺(14)和三乙胺(100mg,1.0mmol)在无水DMF(5 mL)中的溶液搅拌。向溶液中通入N220分钟。加入四(三苯基膦)钯(O) (66.5mg,0.057mmol)和碘化铜(I)(20.7mg,0.108mmol),并 且将反应混合物在室温下搅拌5天。

加入咪唑(112mg,1.6mmol)。加入叔丁基二甲基甲硅烷基氯(234 mg,1.5mmol)的无水DMF(1mL)溶液,并且在室温下将得到的混合 物搅拌16小时。

将反应混合物蒸发并且加入EtOAc(25mL)。得到的混合物过滤并 且通过真空蒸发去除溶剂。

通过二氧化硅柱色谱法纯化粗产物,用DCM∶MeOH(92.5-7.5)(v/v) 洗脱,产物产率84mg,25%。

1H NMR(CDCl3)δ8.13(H,s),6.21(1H,dd,1’-H),4.66(1H, m),4,16(2H,s,CH2),4,04-3.85(4H,m),3.35-3.31(2H,m), 2,43-2.36(2H,m),2.12-1.99(1H,m),1.44(9H,s,tBu),0.95 (9H,s,tBu),0.92(9H,s,tBu),0.17(3H,s,CH3),0.15(3H, s,CH3),0.13(3H,s,CH3),0.12(3H,s,CH3)。

实施例16:化合物(3c)的制备

化合物3c

室温下将化合物(3b)(84mg,0.12mmol)和氟化四丁基铵三水合 物(TBAF)(155mg,0.45mmol)的2mL无水THF溶液搅拌4天。

将反应混合物蒸发并且通过二氧化硅柱色谱法纯化,用DCM∶MeOH 梯度(9∶1)-(8∶2)(v/v)洗脱。产物产率27mg,48%。

1H NMR(CDCl3)δ8.32(1H,s),6.20(1H,dd,1’-H),4.35(1H, dt),4,15(2H,s,CH2),3.95(1H,q),3.83(1H,dd),3.72(1H, dd),3,36-3.30(3H,m),2.42-2.36(3H,m),2.13(1H,dt),1.40 (9H,s,tBu)。

实施例17:化合物(3d)的制备

化合物3d

将化合物(3c)(27mg,60μmol)溶解于100μL无水磷酸三甲酯。 冷却至0℃之后,加入磷酰氯(POCl3)的无水磷酸三甲酯溶液(100μL 贮备溶液(110mg/mL),72μmol)。0℃下将反应混合物搅拌2小时。

接着0℃下加入三丁基铵焦磷酸盐(71mg,150μmol,于300μL 无水DMF中)和三丁基胺(28.3mg,153μmol,于150μL无水DMF 中)的溶液。室温下将反应搅拌3分钟之后通过加入1.0M碳酸氢三 乙基铵(1mL)终止反应。

实施例18:化合物III的制备

化合物III

N-Boc保护基团的去除

磷酸化之后,使用HCl将50μL的磷酸化反应混合物调节至pH=1 并且室温下保温30分钟。在TLC上纯化之前使用等摩尔NaOH和乙酸 钠(pH 5.5)将混合物调节至pH 5.5。

利用薄层色谱法(TLC)纯化核苷酸衍生物

从粗混合物,将20个2μl样品加样到Kieselgel 60 F254TLC (Merck)上。使用100%甲醇作为流动溶液,从核苷酸衍生物分离出有 机溶剂和没有磷酸化的核苷。接着,空气风干TLC板,并且通过UV-投 影鉴定核苷酸衍生物。分离含有核苷酸衍生物的Kiesel并且使用10 mM乙酸钠(pH=5.5)为溶剂提取两次。通过离心去除Kieselgel,并 且真空干燥上清液。核苷酸衍生物再次悬浮于50-100μl H2O中,达 到1-3mM的最终浓度。在聚合酶延伸反应中使用之前通过UV-吸收评 价每一种核苷酸衍生物的浓度。

实施例19-22:单核苷酸结构单元(IV)的制备

可以根据下面给出的一般方案制备结构单元IV:

实施例19:N-乙酰基-β-丙氨酸(4a)的制备

化合物4a

向β-丙氨酸(2.25g,25mmol)在NaHCO3水溶液(15mL)中的溶 液中加入乙腈(15mL)和乙酸酐(2.55g,25mmol)。将反应混合物在 室温下搅拌3小时。加入乙酸酐(2.55g,25mmol),2小时之后通 过加入NaH2PO4而将pH调节至4-5。

将产物萃取到EtOAc(3×50mL)中,干燥(Na2SO4),并且真空蒸 发至干,得到1.96g(60%)。

实施例20:N-乙酰基-β-丙氨酸炔丙酯(4b)的制备.

化合物4b

向N-乙酰基-β-丙氨酸(4a)的THF溶液(20mL)中加入炔丙醇(840 mg,15mmol),1-(3-二甲基氨基丙基)-3-乙基碳二亚胺盐酸盐(EDC) (1.035g,5.39mmol),三乙胺(540mg,5.4mmol)和4-二甲基氨基 吡啶(5mg)。将反应混合物在室温下搅拌2天。

将反应混合物倒入EtOAc(100mL),用NaH2PO4(50%饱和水溶液, 2×50mL)接着用NaHCO3(50%饱和水溶液,50mL)洗涤。干燥(Na2SO4) 之后,减压去除EtOAc,得到无色油状物,其静置时固化。产物产率 536mg,59%。

实施例21:化合物(4c)的制备

化合物4c

室温下将5-碘-2’-脱氧胞苷(200mg,0.56mmol),三乙胺(100 mg,1.0mmol)和化合物(4b)(190mg,1.13mmol)在无水DMF(7mL) 中的溶液搅拌。向溶液中通入N220分钟。

加入四(三苯基膦)钯(O)(70mg,0.06mmol)和碘化铜(I)(22mg, 0.12mmol),并且将反应混合物在室温下搅拌4天。

将反应混合物蒸发并且通过二氧化硅柱色谱法纯化,使用 DCM∶MeOH梯度(9∶1)-(8∶2)(v/v)洗脱。产物产率141mg,63%。

1H NMR(CD3OD)δ8.41(1H,s),6.20(1H,dd,1’-H),4.97(2H, s),4.38(1H,dt),3.97(1H,q),3.85(1H,dd),3.75(1H,dd), 3,46(2H,t),2.61(2H,t),2.39(1H,m),2.18(1H,m)。

实施例22:化合物IV的制备:

化合物IV

将化合物(4c)(140mg,355μmol)溶解于600μL无水磷酸三甲 酯。冷却至0℃之后,加入磷酰氯(POCl3)的无水磷酸三甲酯溶液(600 μL贮备溶液(108mg/mL),420μmol)。0℃下将反应混合物搅拌2 小时。

接着0℃下加入三丁基铵焦磷酸盐(422mg,890μmol,于1.8 mL无水DMF中)和三丁基胺(168mg,900μmol,于0.9mL无水DMF 中)的溶液。室温下将反应搅拌3分钟之后通过加入1.0M碳酸氢三 乙基铵(1mL)终止反应。

从粗混合物,将20个2μL样品加样到Kieselgel 60 F254TLC (Merck)上。使用100%甲醇作为流动溶液,从核苷酸衍生物中分离出 有机溶剂和没有磷酸化的核苷。接着,空气风干TLC板,并且通过UV- 投影鉴定核苷酸衍生物。分离含有核苷酸衍生物的Kiesel并且使用 10mM乙酸钠(pH=5.5)为溶剂提取两次。通过离心去除Kieselgel, 并且真空干燥上清液。核苷酸衍生物再次悬浮于50-100μl H2O中, 达到1-3mM的最终浓度。在聚合酶延伸反应中使用之前通过UV-吸收 评价每一种核苷酸衍生物的浓度。

实施例23-27:单核苷酸结构单元(V)的制备

可以根据下面给出的一般方案制备结构单元V:

实施例23:2-氨基氧基-乙酸乙酯(5a)的制备

化合物5a

向无水乙醇(50mL)中加入乙酰氯(5mL),并且将溶液冷却至室 温。加入2-氨基氧基-乙酸,盐酸盐(2∶1)(1.10g,10mmol),并 且将反应混合物在室温下搅拌16小时。

将反应混合物蒸发,加入K2CO3水溶液(2M)(10mL),并且将产物 萃取到二乙醚中(5×20mL),干燥(Na2SO4),并且冷式蒸发,得到 1.007g,84%。

1H NMR(CDCl3)δ4.24(2H,s),4.22(2H,q),1.30(3H,t)。

实施例24:戊-4-炔酰基氨基氧基-乙酸乙酯(5b)的制备

化合物5b

向2-氨基氧基-乙酸乙酯(573mg,4.8mmol)和4-戊炔酸(441mg, 4.5mmol)在15mL EtOAc中的溶液中加入二环己基碳二亚胺(928mg, 4.5mmol),并且将得到的反应混合物在室温下搅拌16小时。

将反应混合物过滤,滤液用EtOAc(2×5mL)洗涤。用NaH2PO4水溶 液和NaHCO3水溶液洗涤合并的EtOAc,之后干燥(Na2SO4),并且蒸发, 得到950mg粗产物。

通过二氧化硅柱色谱纯化粗产物,用EtOAc∶庚烷梯度(1∶3)-(1∶1) (v/v)洗脱。产物产率700mg,78%。

1H NMR(CDCl3)δ4.41(2H,s),4.18(2H,q),2.77(1H,t),2.34 (2H,dt),2.17(2H,bt),1.40(3H,t)。

实施例25:化合物5c的制备

化合物5c

室温下搅拌7-去氮杂-7-碘-2’-脱氧腺苷(125mg,0.33 mmol)(根据Seela,F.;Synthesis 1996,726-730所述制备),三乙 胺(67mg,0.66mmol)和化合物(5b)(305mg,1.53mmol)在无水 DMF(7mL)中的溶液。向溶液中通入N220分钟。

加入四(三苯基膦)钯(O)(75mg,0.065mmol)和碘化铜(I)(24mg, 0.33mmol),并且在室温下搅拌反应混合物16小时。

将反应混合物蒸发并且通过二氧化硅柱色谱法纯化,使用 DCM∶MeOH(9∶1)(v/v)洗脱。产物产率129mg,86%。

1H NMR(d6DMSO)δ11.6(1H,s),8.09(1H,s),7.63(1H,s), 6.47(1H,dd),5.26(1H,d),5.08(1H,t),4.42(2H,s),4.32 (1H,m),4.08(2H,q),3.81(1H,m),3.54(2H,m),2.66(1H, t),2.46(1H,m),2.30(2H,t),2.15(2H,ddd),1.15(3H,t)。

实施例26:化合物5d的制备:

化合物5d

将化合物(5c)(117mg,260μmo1)溶解于500μL无水磷酸三甲 酯。冷却至0℃之后,加入磷酰氯(POCl3)的无水磷酸三甲酯溶液(400 μL贮备溶液(120mg/mL),310μmol)。0℃下将反应混合物搅拌2 小时。

接着0℃下加入三丁基铵焦磷酸盐(200mg,420μmol,于1.00mL 无水DMF中)和三丁基胺(123.6mg,670μmol,于500μL无水DMF 中)的溶液。室温下将反应搅拌3分钟之后通过加入1mL 1.0M碳酸 氢三乙基铵终止反应。

实施例27:化合物V的制备:

化合物V

用水(6.0mL)稀释化合物(5d)(2.0mL)的反应混合物,并且使用 NaOH(2M,水溶液)调节至pH 13。在5℃下保温64小时之后,用EtOAc (5×5mL)萃取反应混合物,用HCl(2M,水溶液)调节至pH7.0,蒸发 并且用乙酸三乙铵缓冲液(500μL,0.1M水溶液)稀释。

通过在Waters Xterra MS C18柱子上进行HPLC来纯化三磷酸酯粗 产物,使用下面的缓冲液体系:(A)乙酸三乙胺水溶液(0.1M,pH 7) 和(B)含有乙酸三乙胺(0.1M)的乙腈∶水(80∶20)。有8次记录的梯 度时间表如下:

    时间     A%     B%     0.00     98     2     1.00     98     2     10.00     90     10     16.00     85     15     18.00     65     35     20.00     0     100     25.00     0     100     25.10     100     0

通过在260nm监测UV吸光度进行测量,化合物V和化合物5d 的保留时间分别是4.82分钟和7.29分钟。合并含有纯产物的级分并 且从水(3mL)中冻干两次。

实施例28-30:单核苷酸结构单元(VI)的制备

实施例28:戊-4-炔酸4-氧代-4H-苯并[d][1,2,3]三嗪-3-基酯 (6a)

将戊炔酸(200mg,2.04mmol)溶解于THF(4mL)。在盐水-冰水 浴中冷却溶液。加入二环己基碳二亚胺(421mg,2.04mmol)的THF(2 mL)溶液。5分钟之后加入3-羟基-1,2,3-苯并三嗪-4(3H)-酮(333mg, 2.04mmol)。-10℃下将反应混合物搅拌1h后在室温下搅拌2h小时。 TLC表明3-羟基-1,2,3-苯并三嗪-4(3H)-酮完全转化(洗脱液:乙酸 乙酯)。滤出沉淀的盐。真空浓缩滤液并且用己烷(4mL)结晶。滤出结 晶并干燥。产率:450mg,93%。RF=0.8(乙酸乙酯)。

实施例29:2-戊-4-炔酰基氨基-琥珀酸1-叔丁酯4-异丙酯(6b) 的制备

将L-天冬氨酸α,β-二叔丁酯盐酸盐(Novabiochem 04-12-5066, 200mg,0.71mmol)溶解于THF(5mL)。加入活化酯6a(173mg,0.71 mmol)和二异丙基乙胺(0.15mL,0.86mmol)。将混合物搅拌过夜。 加入二氯甲烷(10mL)。用柠檬酸(2×10mL),饱和NaHCO3(水溶液, 10mL),盐水(10mL)洗涤有机相,干燥(Na2SO4)并且浓缩成浆状物。 NMR谱表明该浆状物足够纯用于进一步的合成。1H-NMR(CDCl3):δ 6.6(1H,NH),4.6(1H,CH),2.8(2H,CH2),2.4(4H,2×CH2), 1.9(1H,CH),1.2(18H,6×CH3)。

实施例30:2-{5-[1-(4-羟基-5-(O-三磷酸-羟基甲基)-四氢呋 喃-2-基)-2,4-二氧代-1,2,3,4-四氢-嘧啶-5-基]-戊-4-炔酰基氨 基}-琥珀酸二叔丁酯(VI)的制备

核苷酸(20mg,0.022mmol)溶解于水-乙醇(1∶1,2mL)。将溶 液脱气并且保存在氩气下。加入根据A.L.Casalnuovo等,J.Am.Chem. Soc.1990,112,4324-4330制备的催化剂Pd(PPh2(m-C6H5SO3Na+))4(20 mg,0.016mmol),三乙胺(0.02mL,0.1mmol)和炔(化合物6b)(20 mg,0.061mmol)。加入少许CuI晶体。将反应混合物搅拌6小时。通 过RP-HPLC纯化之后得到LH8037的三乙基铵盐(洗脱液:100mM乙酸 三乙铵→100mM乙酸三乙铵中的20%乙腈)。1H-NMR(D2O):δ8.1 (1H,CH),6.2(1H,CH),4.8(1H,CH),4.6(1H,CH),4.1(3H, CH,CH2),2.8(2H,CH2),2.7(2H,CH2),2.5(2H,CH2),2.3(2H, CH2),1.4(18H,6×CH3)。

结合之前或结合之后,可以即刻裂解掉二叔丁酯保护基团,获得相 应的自由羧酸。

实施例31-32:单核苷酸结构单元(VII)的制备

实施例31:2-{5-[4-氨基-1-(4-羟基-5-羟基甲基-四氢呋喃-2- 基)-2-氧代-1,2-二氢-嘧啶-5-基]-戊-4-炔酰基氨基}-琥珀酸二叔丁 酯(7a)的制备

应用对于化合物VI的合成所描述的方法从化合物(6b)(140mg, 0.43mmol)和5-碘-2-脱氧胞苷(100mg,0.28mmol)获得化合物(7a) (30mg,19%)。1H-NMR(MeOD-D3):δ8.3(1H,CH),6.2(1H,CH), 4.8(1H,CH),4.6(1H,CH),4.4(1H,CH),4.0(1H,CH),3.8(2H, CH2),2.8(4H,2×CH2),2.7(2H,CH2),2.4(1H,CH2),2.2(1H, CH2),1.4(18H,6×CH3)。

实施例32:2-{5-[4-氨基-1-(4-羟基-5-(0-三磷酸-羟基甲基)- 四氢呋喃-2-基)-2-氧代-1,2-二氢-嘧啶-5-基]-戊-4-炔酰基氨基}- 琥珀酸二叔丁酯(化合物VII)的制备

向7a(30mg,0.054mmol)在磷酸三甲酯(1mL)中的冷却(0℃) 溶液中加入磷酰氯(Phosphoroxy chloride)(6.0μl,0.059mmol)。 将混合物搅拌1小时。加入双-正-三丁基铵焦磷酸盐(77mg,0.16mmol) 在DMF(1mL)和三丁基胺(40μl,0.16mmol)中的溶液。加入水(2 mL)。测量溶液pH为中性。将溶液在室温下搅拌3小时并且在5℃下 搅拌过夜。通过RP-HPLC(洗脱液:100mM乙酸三乙铵→100mM乙酸 三乙铵中的20%乙腈)纯化获得少量化合物VII(几毫克)。回收7a(18 mg)。

结合之前或结合之后,可以即刻裂解掉二叔丁酯保护基团,获得相 应的自由羧酸。

实施例33和34:单核苷酸结构单元(VIII)的制备

实施例33:2-戊-4-炔酰基氨基-6-(2,2,2-三氟-乙酰基氨基)- 己酸,(8a)的制备

向N-ε-三氟乙酰-L-赖氨酸(Novabiochem,04-12-5245)(250mg, 1.0mmol)的DMF(3mL)溶液中加入化合物6a(250mg,1.0mmol)。 加入乙基二异丙基胺(0.2mL,1.2mmol)。室温下将溶液搅拌过夜并 且通过RP-HPLC(洗脱液:水→甲醇)进行后处理。产率:50mg,15%。

1H-NMR(D2O):δ4.4(1H,CH),3.4(2H,CH2),2.5(4H,2×CH2), 2.3(1H,CH),1.9(1H,CH2),1.8(1H,CH2)1.6(2H,CH2),1.5 (2H,CH2)。

实施例34:2-{5-[1-(4-羟基-5-(O-三磷酸-羟甲基)-四氢呋喃 -2-基)-2,4-二氧代-1,2,3,4-四氢-嘧啶-5-基]-戊-4-炔酰基氨 基}-6-(2,2,2-三氟-乙酰基氨基)-己酸(化合物VIII)的制备

应用对于化合物VI的合成所描述的方法,从化合物8a(50mg, 0.15mmol)和5-碘-2-脱氧尿嘧啶(50mg,0.06mmol)制备化合物VIII 的三乙铵盐(11mg)。

实施例35-39:单核苷酸结构单元(IX)的制备

实施例35:二-Boc-赖氨酸-炔丙基酰胺(化合物9a)C19 H33 N3 O5  Mw 383.48的制备

Boc-Lys-(Boc)-OSu(Novabiochem 04-12-0017,0.887g,2mmol) 溶解于THF(10ml)。加入炔丙基胺(0.412ml,6mmol)并且将溶液 搅拌2小时。TLC(乙酸乙酯∶庚烷1∶1)显示只有一种产物。加入二 氯甲烷(20ml),并且依次用柠檬酸(1M,10ml)和饱和的碳酸氢钠 (10ml)洗涤混合物。用硫酸镁干燥有机相,过滤并且蒸发,得到化合 物9a(0.730g),为无色浆状物。

1H-NMR:_6.55(1H,NH),5.15(1H,NH),4.6(1H,CH-NH),4.05 (2H,CH-C-CH2-N),3.75(1H,NH),3.1(2H,CH2-NH)2.25(1H, CH-C-CH2),1.9-1.3(6H,3×CH2),1.4(18H,6×CH3)。

实施例36:5-碘-3’-O-乙酰基-5’-O-TBDMS-2’-脱氧尿苷(化 合物9b)C17 H27 IN2 O6 Si Mw 510.40的制备

5-碘-2’-脱氧尿苷(Sigma I-7125,2.50g,7.06mmol)和咪唑 (0.961g,14.12mmol)溶解于DMF(10ml)。冷却至0℃,并且 用20分钟运行TBDMSCl(叔丁基-二甲基-氯,1.12g,7.41mmol) 的二氯甲烷(5.0ml)溶液。室温下继续搅拌18小时,蒸发混合物。 粗产物单甲硅烷基化核苷溶解于吡啶(40ml)并且冷却至0℃。用 30分钟加入乙酸酐(4.0ml,42.3mmol)并且在室温下继续搅拌18小 时。蒸发反应混合物并且溶解于二氯甲烷(20ml)中,加入柠檬酸(2M, 20ml)。用二氯甲烷(2×20ml)反萃取水相。合并的有机相用饱和碳 酸氢钠(20ml)洗涤,硫酸钠干燥并且蒸发(5.85g)。从乙酸乙酯 /EtOH中重结晶得到9b(2.54,g)化合物,用合成TLC(乙酸乙酯) 纯化。进一步重结晶得到分析纯样品。mp.172.4-173.1℃。

实施例37:5-碘-3’-O-乙酰基-2’-脱氧尿苷(化合物9c) C11 H13 IN2 O6  Mw 396.14的制备

5-碘-3’-O-乙酰基-5’-O-TBDMS-2’-脱氧尿苷(化合物9b) (2.54g,4.98mmol)溶解于THF(25ml),加入氟化四丁基铵三水合 物(TBAF,3.2g,10.1mmol)并且在室温下搅拌18小时。将反应混 合物加入水(25ml),搅拌1小时。然后加入离子交换树脂IR-120 H+ (26ml)并且继续搅拌1小时。将溶液过滤并且真空浓缩至大约10ml。 收集晶体并且真空干燥(1.296g)。

实施例38:5-碘-5’-三磷酸-2’-脱氧尿苷,三乙铵盐(化合物 9d)C9 H14 IN2 O14 P3 +n·N(CH2 CH3 )3  Mw 897.61,n=3的制备

5-碘-3’-O-乙酰基-2’-脱氧尿苷(化合物9c)(2.54g,4.98 mmol)溶解于吡啶(3.2ml)和二噁烷(10ml)中。搅拌下加入2-氯 -4H-1,3,2-苯并二氧杂磷杂环己烷-4-酮的二噁烷溶液(3.60ml,1M, 3.60mmol)。室温下将反应混合物搅拌10分钟,接着同时加入双(三 正丁基铵)焦磷酸盐的DMF(9.81ml,0.5M,4.91mmol)溶液和三正 丁基胺(3.12ml,13.1mmol)。继续搅拌10分钟,并且通过加入碘溶 液(90ml,1%w/v于吡啶/水(98/2,v/v)中)氧化中间体,直到碘颜 色不变。将反应混合物静置15分钟,然后用硫代硫酸钠(5%水溶液, w/v)脱色。将反应混合物蒸发,得到黄色油状物。将油在水中(20ml) 搅拌30分钟并且加入浓氨水(100ml,25%)。将该混合物在室温下搅 拌1.5小时后蒸发,得到粗产物三磷酸酯油状物。使用DEAE Sephadex A25柱(大约100ml)纯化粗产物,洗脱使用0.05M至1.0M碳酸 氢三乙铵[TEAB](pH大约7.0-7.5)线性梯度;流速8毫升/级分/15 分钟。通过RP18 HPLC,使用10mM TEAA(乙酸三乙铵)水溶液至乙 腈中10mM TEAA 20%水的梯度洗脱,鉴定阳性级分。合并合适的级 分并且蒸发。产率大约1042mg。

实施例39:5-(赖氨酸-炔丙基酰胺)-5’-三磷酸-2’-脱氧胞苷, 三乙铵盐(化合物IX)C18 H30 N5 O15 P3 +n·N(CH2 CH3 )3  Mw 952.95,n=3 的制备

5-碘-3’-O-乙酰基-5’-三磷酸-2’-脱氧尿苷,三乙铵盐(化合 物9d)(0.0087g,9.7μmol)溶解于水(100μl)。小心用氩气置换空 气。以给定顺序加入溶解于二噁烷(100μl)中的二-Boc-赖氨酸-炔 丙基酰胺(化合物9a)(18.6mg,48.5μmol),三乙胺(2.7μl,19.4 μl),Pd((PPh2)(m-C6H4SO3Na+)·(H2O))4(化合物9d)(5mg,4.4μmol) 和碘化铜(I)(0.4μl,2.1μmol)。惰性气氛下室温下将反应混合 物搅拌18小时然后蒸发。30℃下用盐酸水溶液(0.2M,1ml)将粗 产物处理15分钟。通过HPLC C18柱子,使用10mM TEAA(乙酸三乙 铵)水溶液至乙腈中10mM TEAA 20%水的梯度获得(化合物IX)。利用 凝胶过滤(pharmacia G-10,0.7ml)将合适的级分脱盐。

实施例40-45:单核苷酸结构单元(X)的制备

实施例40:Boc-Lys-(Boc)-0H(化合物10a)C16 H30 N2 O6  Mw 346.42 的制备

赖氨酸(Novabiochem 04-10-0024;3.65g,20mmol)溶解于氢氧 化钠(2M,40ml),按顺序加入二噁烷(60ml)和二碳酸二叔丁酯 (8.73g,40mmol)。60℃下将混合物搅拌1.75小时。加入水(50ml) 并且用二氯甲烷(4×25ml)洗涤溶液。用冰将水相冷却到0℃之 后用2M HCl(pH=3)酸化并且用二氯甲烷(4×25ml)萃取。用硫 酸镁干燥有机相。蒸发得到(化合物10a)6.8g,为无色油状物。

1H-NMR:_9.5(1H,COOH),5.3(1H,CH),4.7(1H,NH),4.3 (1H,NH),3.1(2H,CH2-NH),1.8(2H,CH2-CH),1.5(6H,3×CH2), 1.45(18H,6×CH3)。

实施例41:二-Boc-赖氨酸-炔丙酯(化合物10b)C19 H32 N2 O6  Mw 384.47的制备

Boc-Lys-(Boc)-OH(化合物10a)(3.46g,10mmol)溶解于THF (25ml)。0℃下以给定顺序加入二环己基碳二亚胺(2.02g,10mmol) 的THF(25ml)溶液和三乙胺(1.39ml)。使混和物温热至室温并 且搅拌18小时。将得到的悬浮液过滤并蒸发。通过柱色谱法使用庚烷∶ 乙酸乙酯3∶1将5.45g油状物预先纯化。

通过HPLC-C18 10%MeOH:90%H2O→100%MeOH得到纯的10b。

1H-NMR:_5.1(1H,NH),4.75(2H,CH-C-CH2-O),4.6(1H,NH), 4.35(1H,CH-NH),3.1(2H,CH2-NH)2.5(1H,CH-C-CH2),1.9-1.4 (6H,3×CH2),1.5(18H,6×CH3)。

实施例42:5-碘-3’,5’-二-O-TBDMS-2’-脱氧胞苷(化合物 10c)C21 H40 IN3 O4 Si2  Mw 581.64的制备

5-碘-2’-脱氧-胞苷(Sigma I-7000,0.353g,1mmol)溶解于 DMF(4ml),加入叔丁基二甲基甲硅烷基氯(TBDMS-Cl,0.332g,2.2 mmol)和咪唑(0.204g,3mmol)。将溶液在50℃下搅拌15小时之 后蒸发。向干燥混合物加入二氯甲烷(25ml)和柠檬酸(2M,10ml)。 使用二氯甲烷(2×10ml)反萃取水相。合并的有机相用饱和的碳酸氢 钠(15ml)洗涤,用硫酸钠干燥并且蒸发。通过从EtOH/乙酸乙酯重结 晶获得化合物10c(0.405g)。

1H-NMR:_8.1(1H,H-6),6.25(1H,H-1’),4.35(1H,H-4’), 4.0(1H,H-4’),3.9(1H,H-5’),3.75(1H,H-5’),2.5(1H, H-2’),1.95(1H,H-2’),1.85(2H,NH),0.95(9H,3×CH3),0.9 (9H,3×CH3),0.15(6H,2×CH3),0.1(6H,2×CH3)。

5-(二-Boc-赖氨酸-炔丙酯)-3’,5’-二-O-TBDMS-2’-脱氧胞苷 (化合物10d)C40 H71 IN5 O10 Si2  Mw 838.19的制备

化合物10c(0.116g,0.2mmol)溶解于二氯甲烷(10ml)。小心 用氩气置换空气。按给定顺序加入二-Boc-赖氨酸-炔丙酯(化合物10b) (0.232,0.6mmol),三乙胺(0.083ml,0.6mmol),二-氯-双-三苯 基膦-钯II(0.0074g,0.01mmol)和碘化铜(I)(0.0038g,0.02 mmol)。惰性气氛下室温下将反应混合物搅拌15小时。将反应混合物 蒸发,再溶解于MeOH/H2O 1∶1 1ml,并且使用HPLC-C18 45%H2O∶55% MeCN→100%MeCN纯化。

1H-NMR:_1H-NMR:_8.2(1H,H-6),6.25(1H,H-1’),5.15(1H, NH),4.9(2H,C-CH2-O),4.6(1H,NH),4.4(1H,H-4’),4.3(1H, CH-NH),4.0(1H,H-4’),3.9(1H,H-5’),3.75(1H,H-5’),2.5 (1H,H-2’),3.1(2H,CH2-NH),1.95(1H,H-2’),1.9-1.4(6H, 3×CH2),1.85(2H,NH),1.5(18H,6×CH3),0.95(9H,3×CH3),

0.9(9H,3×CH3),0.15(6H,2×CH3),0.1(6H,2×CH3)。

实施例44:5-(二-Boc-赖氨酸-炔丙酯)-2’-脱氧胞苷(化合物 10e)C28 H43 IN5 O10 Mw 609.67的制备

化合物10d(0.0246g,0.029mmol)溶解于THF(1ml)并且依 次加入乙酸(0.0165ml,0.288mmo1)和氟化四正丁基铵三水合物 (0.0454g,0.144mmol)。室温下将反应混合物搅拌18小时后蒸发。 重溶解于二氯甲烷并且在二氧化硅(1×18cm)上纯化。二氯甲烷/MeOH 8∶2.将在TLC上给出UV吸收的级分合并并且蒸发,得到(0.0128 g),为无色油状物。

实施例45:5-(赖氨酸-炔丙酯)-5’-三磷酸-2’-脱氧胞苷 C18 H30 N5 O15 P3  Mw 649.38的制备

化合物10e(0.0128g,0.021mmol)溶解于磷酸三甲酯(0.150ml) 并且冷却至0℃。为了使温度不升高,缓慢加入磷酰氯的磷酸三甲 酯溶液(1M,0.0246ml)。0℃下继续搅拌2小时并且使温度升至室 温。同时加入焦磷酸盐的DMF溶液(0.5M,0.1025ml,0.051mmol) 和三正丁基胺的DMF溶液(1M,0.0122ml,0.051mmol)。室温下继 续搅拌15分钟,并且加入TEAB(碳酸氢三乙铵,1M,pH=7.3, 0.50ml)。继续搅拌3小时之后蒸发。

实施例46:化合物X的制备

30℃下用盐酸水溶液(0.2M,1ml)将粗产物处理15分钟。通 过HPLC C18 10mM TEAA(乙酸三乙铵)的水溶液至乙腈中10mM TEAA 20%水获得化合物X。利用凝胶过滤(pharmacia G-10,0.7ml)将合 适的级分脱盐。

实施例47-51:单核苷酸结构单元(XI)的制备

实施例47:3’-O-乙酰基-5’-O-二甲氧基三苯甲基-5-碘-2’-脱 氧尿苷(化合物11a).C32 H31  IN2 O8 .Mw 698.51g/mol的制备(类似于 ″Oligonucleotide Synthesis-a practical approach”(1984)Gait, M.J.(编著),IRL Press,Oxford.)

通过与吡啶(25ml,3次)共同蒸发来干燥5-碘-2’-脱氧尿苷(3.54 g,10mmol)。加入吡啶(100ml)并且短时间蒸发,减小体积(80ml)。 加入4,4’-二甲氧基三苯甲基氯(DMT-Cl,3.38g,10mmol),并且将 反应混合物在室温下搅拌。20小时之后,加入另外的DMT-Cl(0.68g, 2mmol)并且将反应混合物又搅拌4小时。用甲醇(5ml,搅拌10分 钟)淬灭过量的DHT-Cl,并且将反应混合物蒸发至干。将油状物溶解 于二氯甲烷(100ml)并且用饱和的NaHCO3水溶液(100ml)萃取。用 二氯甲烷反萃取水相并且用无水MgSO4干燥合并的二氯甲烷级分,过 滤并蒸发。油状粗产物溶解于二氯甲烷(75ml),并且用戊烷(250ml) 研制。蒸发之后通过将粗油状产物溶解于乙酸乙酯(75ml)并且加入 戊烷(250ml)再次研制,得到微红色泡沫状物质。粗产物5’-O-二甲 氧基三苯甲基-5-碘-2’-脱氧尿苷的产率是5.84g。在二氧化硅(Merck Kieselgel 60,230-400目ASTM,art.9385)上在二氯甲烷中通过柱 色谱,用甲醇梯度洗脱(0-5%甲醇的二氯甲烷溶液),获得纯的5’-O- 二甲氧基三苯甲基-5-碘-2’-脱氧尿苷。纯化的5’-O-二甲氧基三苯甲 基-5-碘-2’-脱氧尿苷的产率是4.26g(6.5mmol,65%)。

通过与吡啶(10ml,两次)共蒸馏干燥5’-O-二甲氧基三苯甲基 -5-碘-2’-脱氧尿苷(6.0g,9.1mmol)。加入吡啶(50ml)之后加入 乙酸酐(5ml)和二甲基氨基吡啶(DMAP,催化量)。室温下将反应混合 物搅拌过夜。用甲醇(10ml,搅拌15分钟)淬灭过量的乙酸酐并且将 反应混合物蒸发至干。将油状物溶解于二氯甲烷(150ml)并且用饱和 的NaHCO3水溶液(50ml)萃取。用二氯甲烷反萃取水相并且用无水 MgSO4干燥合并的二氯甲烷级分,过滤并蒸发。在二氧化硅(Merck Kieselgel 60,230-400目ASTM,art.9385)上在二氯甲烷/甲醇(98/2, v/v)中通过柱色谱法,用甲醇梯度(2-6%甲醇的二氯甲烷溶液)洗脱, 获得纯的3’-O-乙酰基-5’-O-二甲氧基三苯甲基-5-碘-2’-脱氧尿苷。 产率是5.75g(8.2mmol)。在二氯甲烷/戊烷(80/20,v/v)中再次进 行色谱,用甲醇梯度(2-6’)洗脱,得到期望的纯化的3’-O-乙酰基 -5’-O-二甲氧基三苯甲基-5-碘-2’-脱氧尿苷(4.18g,6.0mmol, 60%)。

实施例48:N-三氟乙酰基-3-酰胺丙炔(化合物11b).C5 H4 F3 NO.Mw. 151.09g/mol的合成(参考:Cruickshank等(1988)Tetrahedron Lett.29,5221-5224)。

炔丙基胺(7.0ml,5.88g,0.11mol)溶解于100ml冰冷却的 甲醇中,并且在冰上搅拌下缓慢加入三氟乙酸乙酯(18ml,19.2g, 0.135mol)。去除冰浴,并且使反应混合物升至室温,继续搅拌过夜。 24小时后,TLC分析(二氧化硅,二氯甲烷/甲醇,9/1,v/v)表明炔 丙基胺完全转化(根据阳性颜色消失所观察的--在茚三酮试验中的 反应,110℃)。将反应混合物蒸发,再次溶解于二氯甲烷(100ml)并 且用碳酸氢钠水溶液萃取。用二氯甲烷(25ml)反萃取水相,并且用水 (100ml)萃取合并的二氯甲烷相。用二氯甲烷(25ml)反萃取水相并且 用硫酸镁干燥合并的二氯甲烷相,过滤并蒸发,得到黄色油状物。通过 蒸馏法纯化油状物,于38-39℃/1mmHg收集纯化的产物。产率11.0 g(73mmol,66%)。

实施例49:3’-O-乙酰基-5’-O-二甲氧基三苯甲基-5-(N-三氟-乙 酰基-3-酰胺-丙炔基)-2’-脱氧尿苷(化合物11c).C35 H35 N3 O8 ,Mw 625.67g/mol的制备

3’-O-乙酰基-5’-O-二甲氧基三苯甲基-5-碘-2’-脱氧尿苷(4.15g, 6.0mmol)溶解于乙酸乙酯(240ml),并且以给定顺序加入N-三氟乙 酰基-3-氨基丙炔(1.81g,12mmol),三乙胺(3.09g,4.23ml,30.5 mmol),双(三苯基膦)-钯(II)氯化物(0.091g,0.13mmol)和碘化铜 (I)(0.091g,0.48mmol)。将反应混合物用氮气吹洗,塞上塞子并 且在室温下搅拌。接着对反应进行TLC分析(二氧化硅,CH2Cl2/MEOH, 95/5,v/v),24小时之后当所有的起始物被消耗之后终止反应。反应 混合物用EDTA水溶液(5%v/v,300ml)萃取两次,用硫代硫酸钠水 溶液萃取一次(5%v/v,300ml)。用乙酸乙酯反萃取水相并且干燥合 并的乙酸乙酯级分(无水MgSO4),过滤并蒸发。在二氯甲烷/戊烷 (80/20,v/v)中进行柱色谱,用甲醇梯度(0-5%)洗脱,得到粗产物 3’-O-乙酰基-5’-O-二甲氧基三苯甲基-5-(N-三氟乙酰基-3-酰胺-丙 炔基)-2’-脱氧尿苷(4.2g),为呈棕色的油状物。在乙酸乙酯/戊烷 (50/50至60/40,v/v)中再次进行色谱,得到期望的纯化的产物(1.99 g,3.2mmol)。

实施例50:3’-O-乙酰基-5-(N-三氟乙酰基-3-酰胺丙炔基)-2’- 脱氧尿苷.C16 H16 F3 N3 O7 ,Mw 419.31g/mol的制备

3’-O-乙酰基-5’-O-二甲氧基三苯甲基-5-(N-三氟乙酰基-3-酰胺 丙炔基)-2’-脱氧尿苷(1.99g,2.8mmol)溶解于二氯甲烷(133ml) 并且冷却到0℃。缓慢加入三氯乙酸的二氯甲烷溶液(3%w/v),并 且在0℃下将反应混合物搅拌15分钟。TLC分析(二氧化硅, CH2Cl2/MeOH,95/5 v/v)证明完全去三苯甲基化,之后通过加入2-丙 醇(10ml)终止反应,通过橙色变为无色的颜色变化观察DMT+的淬灭。 继续搅拌2分钟,将反应混合物倒入饱和的NaHCO3水溶液(100ml) 并且用二氯甲烷萃取两次。用二氯甲烷反萃取水相并且干燥合并的二 氯甲烷级分(无水MgSO4),过滤并且蒸发。将泡沫状物质溶解于二氯甲 烷(50ml)并且用戊烷(200ml)研制。反复研制,之后将沉淀物再次溶 解和蒸发,首先用甲醇,然后用氯仿进行,得到黄色泡沫状物质。通过 在二氯甲烷/甲醇(梯度:95/5至89/11,v/v)中的硅胶柱色谱法得到 纯化的3’-O-乙酰基-5-(N-三氟乙酰基-3-酰胺丙炔基)-2’-脱氧尿苷, 再次色谱,用二氯甲烷/甲醇梯度(98/2至95/5,v/v)洗脱之后的产 率是0.37g。

实施例51:5-(3-氨基丙炔基)-5’-三磷酸-2’-脱氧尿苷,三乙 铵盐(化合物XI).C12 H18 N3 O14 P3 +n·N(CH2 CH3 )3 .Mw 824.78g/mol, n=3的制备(Ludwig,J.和Eckstein,F.(1989)J.Org.Chem. 54.631-635)。

3’-O-乙酰基-5-(N-三氟乙酰基-3-酰胺丙炔基)-2’-脱氧尿苷 (42.5mg,0.10mmol)溶解于无水吡啶(2ml)并且蒸发。油状物溶 解于无水吡啶(100μl)和无水二噁烷(300μl)。搅拌下加入2-氯 -4H-1,3,2-苯并二氧杂磷杂环己烷-4-酮的二噁烷溶液(110μl,1M, 0.11mmol),30秒之后观察到盐酸吡啶鎓沉淀。室温下将反应混合物 搅拌10分钟,接着同时加入双(三正丁基铵)焦磷酸盐的DMF溶液(300 μl,0.5M)和三正丁基胺(100μl)。继续搅拌10分钟,并且通过加 入碘溶液(3ml,1%w/v,于吡啶/水(98/2,v/v)中)氧化中间体, 直到碘颜色不变。将反应混合物静置15分钟后用硫代硫酸钠脱色(4 滴,5%水溶液,w/v)。用水将反应混合物转移到圆底烧瓶(50ml)中, 蒸发,得到黄色油状物。在水(10ml)中将油状物搅拌30分钟,并且 加入浓氨水(20ml,32%)。室温下将该混合物搅拌1小时,然后蒸发 得到油状三磷酸酯粗产物。利用DEAE Sephadex A25柱(大约100ml) 纯化粗产物,用0.05M至1.0M(pH大约7.5-8.0)的碳酸氢三乙 铵[TEAB]线性梯度洗脱;流速8毫升/级分/15分钟。通过RP18 HPLC,用从10mM TEAA(乙酸三乙铵)水溶液至乙腈中10mM TEAA 20% 水的梯度洗脱,鉴定阳性级分。合并合适的级分并且蒸发。产率大约 90mg。

实施例52-54:单核苷酸结构单元(XII)的制备

实施例52:琥珀酸单-(3-叔丁氧羰基氨基-丙基)酯(化合物 12a)

向3-氨基丙醇(1.0g,26.6mmol)的甲醇(10mL)溶液中加入三 乙胺(5.0mL,36mmol)和二碳酸二叔丁酯(7.0g,32mmol)。室温 下将溶液搅拌2小时。将甲醇蒸除,残余物溶解于水(50mL)并且用二 氯甲烷(50mL)萃取。干燥有机相(Na2SO4)并且真空浓缩。粗产物溶解 于二氯甲烷(20mL)和DMF(4mL)。向溶液中分批加入三乙胺(5.0mL, 36mmol)和琥珀酸酐(3.0g,30mmol)(放热反应)。将反应混合物搅 拌2小时,然后浓缩并且通过RP-HPLC(洗脱液:水→甲醇)后处理。 产率6.0g,82%。1H-NMR(CDCl3):δ4.2(2H,CH2),3.2(2H,CH2), 2.7(4H,2×CH2),1.8(2H,CH2),1.4(9H,3×CH3)。

9-[4-(异丙基-二甲基-硅烷基氧基)-5-(异丙基-二甲基-硅烷基 氧基甲基)-四氢-呋喃-2-基]-9H-嘌呤-6-基胺(化合物12b)的制备

向脱氧腺苷一水合物(1.33,4.94mmol)的DMF(10mL)溶液中加 入咪唑(2.0g,29.4mmol)和叔丁基二甲基甲硅烷基氯(3.0g,19.9 mmol)。溶液在60℃下搅拌过夜。混合物真空浓缩成固体。急骤层析 法后处理,得到结晶化合物12b,产率2.1g,94%。1H-NMR(CDCl3): δ8.3(1H,HC=),8.1(1H,HC=),6.4(1H,CH),6.0(2H,2×OH), 4.6(1H,CH),4.1(1H,CH),3.9(1H,CH),3.8(1H,CH),2.6(1H, CH2),2.4(1H,CH2),0.9(18H,6×CH3),0.0(12H,4×CH3)。

实施例53:N-[9-(4-羟基-5-羟甲基-四氢呋喃-2-基)-9H-嘌呤 -6-基]-琥珀酰胺酸3-叔丁氧羰基氨基-丙基酯(化合物12d)的制备

向冰水冷却的12a(488mg,1.78mmol)的THF(10mL)溶液中加 入二环己基碳二亚胺(366mg,1.78mmol)的乙酸乙酯溶液(15mL)。 加入少许4-二甲基氨基吡啶晶体和12b(850mg,1.78mmol)。将反 应温度缓慢升至室温并且将混合物搅拌过夜。过滤出沉淀的盐。有机 相用饱和的NaHCO3(20mL)洗涤,之后干燥(Na2SO4)并且浓缩至固体。 急骤层析之后分离到大约20mg的12c,并且回收了510mg起始物 12b。12c(20mg)溶解于THF(2mL)。加入氟化四丁基铵三水合物 (100mg)和乙酸(0.2mL)。将混合物搅拌1天,然后真空浓缩并且通 过柱色谱法后处理。产率10mg。化合物12c。1H-NMR(CDCl3):δ8.4 (1H,HC=),8.2(1H,HC=),6.4(1H,CH),5.8(2H,2×OH),4.6 (1H,CH),4.2(2H,CH2),4.1(1H,CH),3.8(1H,CH),3.7(2H, CH2),3.0(4H,2×CH2),2.7(3H,2×CH2),2.4(1H,CH2),1.8 (2H,CH2),1.4(9H,3×CH3),0.9(18H,6×CH3),0.0(12H,4 ×CH3).对于12d的选择的NMR数据:1H-NMR(MeOD-D3):δ4.6(1H, CH),4.1(2H,CH2),3.8(1H,CH),3.7(1H,CH),3.6(2H,CH2), 3.2(2H,CH2),3.0(2H,CH2),2.8(3H,2×CH2),2.5(1H,CH2), 1.8(2H,CH2),1.4(9H,3×CH3)。

实施例54:N-[9-(4-羟基-5-羟基甲基-四氢呋喃-2-基)-9H-嘌呤 -6-基]-琥珀酰胺酸3-叔丁氧羰基氨基-丙酯(化合物XII)的制备

利用对于化合物VII的合成描述的方法将LH8075b(10mg)转化 成相应的三磷酸酯LH8075c。TLC指示化合物12d完全转化。

临在结合之前,可以将叔丁氧基水解以释放自由羧酸。或者,可以 在模控分子形成之后裂解叔丁氧基。

实施例55:N-[9-(4-羟基-5-(O-三磷酸-羟基甲基)-四氢呋喃 -2-基)-9H-嘌呤-6-基]-琥珀酰胺酸(化合物XIII)的制备

dATP(5μmol)悬浮于DMF(4×1mL)并且四次真空浓缩成固体。 固体悬浮于DMF(1mL)。-20℃下加入琥珀酸酐(5mg,0.05mmol)。 将混合物搅拌3小时,之后浓缩成固体并且通过RP-HPLC纯化(洗脱液: 0.1%HCOOH水溶液→10%甲醇,0.1%HCOOH水溶液)。将纯化的物 质溶解于氨水(25%,1mL)并且搅拌3小时。真空浓缩混合物并且通过 RP-HPLC后处理(洗脱液:0.1%HCOOH水溶液→10%甲醇,0.1% HCOOH水溶液)。与起始物的比较表明比起始物晚40秒从柱子上洗脱 出来产物。

实施例56和57:单核苷酸结构单元(XIV)的制备

实施例56:苄基氧基-乙炔基-二异丙基-硅烷(化合物14a)的制 备

向冷却的二异丙基乙胺(1mL)、二氯二异丙基硅烷(0.3mL,1.62 mmol)的THF(4mL)溶液中滴加苯甲醇(0.1mL,1.0mmol)的THF (0.5mL)溶液。将溶液搅拌3h(-78→-20℃)。混合物冷却至-78℃ 并且加入炔化锂-乙二胺络合物(lithiumacetylid-ethylendiamin -complex)(250mg,2.71mmol)。将反应混合物搅拌5h(-78→20℃)。 加入水(4mL)。用二氨甲烷(20mL)萃取混合物。干燥有机相(Na2SO4) 并且浓缩。急骤层析之后获得化合物14a(100mg,41%)。1H-NMR (CDCl3):δ7.4(5H,5×HC=),5.0(2H,CH2),2.6(1H,CH),1.0 (14H,2×CH,2×CH3)。

实施例57:5-{[二异丙基-(2-亚甲基-戊-3-烯基氧基)-硅烷基]- 乙炔基}-1-(4-羟基-5-(O-三磷酸羟甲基)-四氢呋喃-2-基)-1H-嘧啶 -2,4-二酮(化合物XIV)的制备

5-碘-dUTP(200mg,0.56mmol),二异丙基乙胺(0.1mL)和14a (100mg,0.41mmol)溶解于DMF(2mL)。向溶液中通入氩气5分钟。 加入Tetrakispalladium(57mg,0.49mmol)和CuI(19mg,0.1mmol), 并且在50℃下搅拌反应混合物5小时。蒸发去除溶剂,并且通过急骤 层析纯化14b。NMR谱表明浆状物含有66%。应用对于化合物VII的 合成描述的方法将浆状物(40mg)转化成相应的三磷酸酯(化合物 XIV)。TLC表明14b完全转化。对于LH8061a的选择NMR数据:1H-NMR (MeOD-D3):δ:8.3(1H,HC=),7.3(5h,HC=),6.2(1H,CH),5.0 (2H,CH2),4.3(1H,CH),3.8-3.2(3H,CH2,CH),2.3(1H,CH2), 2.2(1H,CH2),1.0(14H,2×CH,4×CH3)。

实施例58-63:单核苷酸结构单元(XV)的制备

根据如下所示一般方案可以制备结构单元XV:

实施例58:化合物15a的制备

化合物15a

向3-氨基-丁酸(2.06g,20mmol)的NaHCO3(50%饱和水溶液,25 mL)的溶液中加入二碳酸二叔丁酯(4.36g,20mmol)和乙腈(30mL)。 在室温下将反应混合物搅拌18小时。加入二碳酸二叔丁酯(4.36g,20 mmol),并且在室温下将反应混合物搅拌18小时。

加入EtOAc(100mL),并且通过加入NaH2PO4将pH调节至4-5。 将产物萃取到EtOAc(3×100mL)中,干燥(Na2SO4),并且真空下蒸 发至干,得到粗产物4.6g(113%)。

实施例59:化合物15b的制备

化合物15b

化合物28(1.023g,5.0mmol),3-乙炔基-苯酚(Lancaster, 0.675g,12mmol)和4-二甲基氨基-吡啶(DMAP,300mg,2.5mmol) 溶解于EtOAc(10mL)。向溶液中加入二环己基碳二亚胺(DCC,2.06 g,10mmol),在室温下搅拌16小时之后,将反应混合物过滤并且 真空下蒸发至干。通过二氧化硅柱色谱法用EtOAc∶庚烷梯度 (1∶3)-(1∶2)(v/v)洗脱来纯化粗产物。产物产率720mg,73%。

1H NMR(CDCl3)δ7.36-7.09(4H,m,Ph),4.89(1H,bs,NH),4.22 (1H,bm,CH),3.10(1H,s),2.77(2H,d),1.40(3H,t),1.32(3H, d)。

实施例60:化合物15c的制备

化合物15c

室温下将5-碘-2’-脱氧尿苷3’,5’-二叔丁基二甲基甲硅烷基 醚(730mg,1.25mmol),三乙胺(250mg,2.5mmol)和化合物(15b) (456mg,1.5mmol)的无水DMF(3mL)溶液搅拌。向溶液通入N220 分钟。

加入四(三苯基膦)钯(O)(109mg,0.094mmol)和碘化铜(I)(36 mg,0.188mmol)并且在室温下将反应混合物搅拌3天。

将反应混合物蒸发并且通过二氧化硅柱色谱法用EtOAc∶庚烷梯 度(1∶3)-(1∶2)(v/v)洗脱来纯化。产物产率807mg,85%。

1H NMR(CDCl3)δ8.38(1H,s),8.08(1H,s,6-H),7.39-7.1(4H, m,Ph),6.33(1H,dd,1’-H),4.9(1H,bs),4.45(1H,dt),4,80 (2H,s,CH2),4,2(1H,m),4.02(1H,m,4’-H),3.95(1H,dd, 5’-H),3.79(1H,dd,5”-H),2,78(2H,d),2.36(1H,m,2’-H), 2.07(1H,m,2”-H),1.46(9H,s,tBu),0.93(9H,s,tBu), 0.91(9H,s,tBu),0.15(3H,s,CH3),0.13(3H,s,CH3),0.11 (3H,s,CH3),0.09(3H,s,CH3)。

实施例61:化合物15d的制备

化合物15d

室温下将化合物(15c)(807mg,1.06mmol),冰醋酸(1.0g,16 mmol)和氟化四丁基铵三水合物(TBAF)(2.36g,7.5mmol)的20mL 无水THF溶液搅拌3天。

将反应混合物蒸发并且通过二氧化硅柱色谱法用(DCM)∶(MeOH) (9∶1)(v/v)洗脱来纯化。产物产率408mg,72%。

1H NMR(CD3OD)δ8.46(1H,s,6-H),7.39(2H,m,Ph),7.28 (1H,m,Ph),7.12(1H,m,Ph),6.75(1H,bd),6.27(1H,dd,1’-H), 4.44(1H,dt,4’-H),3.96(1H,t,3’-H),3.86(1H,dd,5’-H), 3.77(1H,dd,5”-H),2,72(2H,d),2.35-2.27(2H,m,2’, 2”-H),1.46(9H,s,tBu),1.27(3H,d)。

实施例62:化合物15e的制备

化合物15e

将化合物(15d)(138.5mg,260μmol)溶解于500μL无水磷酸三 甲酯。冷却至0℃之后,加入磷酰氯(POCl3)的无水磷酸三甲酯溶液 (400μL贮备溶液(120mg/mL),310μmol)。0℃下将反应混合物 搅拌2小时。

接着0℃下加入三丁基铵焦磷酸盐(200mg,420μmol,于1.00 mL无水DMF中)和三丁基胺(123mg,670μmol,于500μL无水 DMF中)的溶液。室温下将反应搅拌3分钟,然后通过加入1mL 1.0M 碳酸氢三乙基铵来终止。

实施例63:化合物XV的制备

化合物XV

N-Boc保护基团的去除

磷酸化之后,使用HCl将50μl的磷酸化反应混合物调节至pH=1 并且室温下保温30分钟。在TLC上纯化之前使用等摩尔NaOH和乙酸 钠(pH 5.5)将混合物调节至pH 5.5。

利用薄层色谱法(TLC)纯化核苷酸衍生物

从粗混合物,将20个2μl样品加样到Kieselgel 60 F254TLC (Merck)上。使用100%甲醇作为流动溶液,从核苷酸衍生物中分离出 有机溶剂和没有磷酸化的核苷。接着,空气干燥TLC板,并且通过UV- 投影鉴定核苷酸衍生物。分离含有核苷酸衍生物的Kiesel并且使用 10mM乙酸钠(pH=5.5)为溶剂提取两次。通过离心去除Kieselgel, 并且真空干燥上清液。核苷酸衍生物再次悬浮于50-100μl H2O中, 达到1-3mM的最终浓度。在聚合酶延伸反应中使用之前通过UV-吸收 评价每一种核苷酸衍生物的浓度。

实施例64:不同核苷酸衍生物的聚合酶掺入

应用标准方法(Promega,cat# 4103)使用T4多核苷酸激酶用32P 5’-标记不同的延伸引物。在延伸反应缓冲液(20mM Hepes,40mM KCl, 8mM MgCl2,pH 7.4,10mM DTT)中通过加热至80℃反应2分钟, 然后缓慢冷却至大约20℃,将这些延伸引物退火到模板引物上, 用量分别是0.1和3pmol。然后加入野生型核苷酸或核苷酸衍生物(大 约100μM),并且在30℃下使用5单位的AMV逆转录酶(Promega, part# 9PIM510)进行掺入1小时。将样品与甲酰胺染料混合并且进行 10%脲聚丙烯酰胺凝胶电泳。利用放射自显影法(Kodak,BioMax胶卷) 使凝胶显影。通过核苷酸衍生物与野生型核苷酸相比较不同的迁移率 变动能鉴定掺入。图49说明各种核苷酸衍生物的掺入。在1-5道中, 延伸引物5’-GCT ACT GGC ATC GGT-3’与模板引物5’-GCT GTC TGC AAG TGA TAA CCG ATG CCA GTA GC-3’一起使用,在6-11道中,延 伸引物5’-GCT ACT GGC ATC GGT-3’与模板引物5’-GCT GTC TGC AAG TGA TGA CCG ATG CCA GTA GC-3’一起使用,在12-15道中,延 伸引物5’-GCT ACT GGC ATC GGT-3’与模板引物5’-GCT GTC TGC AAG TGA CGT AAC CGA TGC CAG TAG C-3’一起使用。1道,dATP;2 道,化合物XI;3道,化合物IX;4道,化合物I;5道,化合物II; 6道,没有核苷酸;7道,dCTP;8道,化合物VII;9道,化合物X; 10道,化合物IV;11道,化合物III;12道,没有核苷酸;13道, dTTP;14道,dTTP和dATP;15道,dTTP和化合物X。这些结果表明 使用不同的接头和功能实体掺入各种dATP,dTTP和dCTP核苷酸衍生 物的可能性。其他聚合酶例如Taq,M-MLV和HIV经试验都是阳性结 果。

实施例65:带有可裂解酯接头的核苷酸衍生物的聚合酶掺入和 水解

应用标准方法(Promega,cat# 4103)使用T4多核苷酸激酶用32P 5’-标记延伸引物(5’-GCT ACT GGC ATC GGT-3’)。在延伸反应缓冲 液(20mM Hepes,40mM KCl,8mM MgCl2,pH 7.4,10mM DTT)中 通过加热至80℃反应2分钟,然后缓慢冷却至大约20℃,将这 种延伸引物与模板引物(5’-TAA GAC CGA TGC CAG TAG C-3’)退火, 用量分别是0.1和3pmol。然后加入野生型核苷酸或核苷酸衍生物(大 约100μM),并且在30℃下使用5单位的AMV逆转录酶(Promega, part# 9PIM510)进行掺入1小时。50℃下用0.1M NaOH将水解的 样品处理大约15分钟,然后用等摩尔HCl和NaOAc(pH 6.5)研制, 并且通过微离心凝胶过滤(BioRad)纯化。将样品与甲酰胺染料混合并 且进行10%脲聚丙烯酰胺凝胶电泳。利用放射自显影法(Kodak,BioMax 胶卷)使凝胶显影。通过核苷酸衍生物与野生型核苷酸相比较不同的迁 移率变动能鉴定掺八。图50说明各种核苷酸衍生物的掺入。1道,化 合物III和化合物II;2道,化合物III和两种化合物II;3道,化 合物II和化合物III的水解;4道,化合物III和两种化合物II的 水解。结果表明这些核苷酸衍生物能通过聚合酶以这种特定顺序掺入。 还表明一种或两种掺入的带有酯接头的化合物II核苷酸衍生物能在 DNA模板上特异性水解,而不带酯接头的掺入的化合物III核苷酸 衍生物是完整的。这举例说明了能掺入不同的核苷酸衍生物,其中一 个核苷酸衍生物能作为连接点(不可断裂接头)发挥功能并且同时从 DNA模板释放(可断裂接头)其他掺入的核苷酸衍生物,产生展示分 子(displaying molecule)。另外,该实验数据表明通过聚合酶能插 入带有包含可裂解酯的接头的核苷酸衍生物而不与聚合酶活性位点的 胺反应或者在掺入过程中被水解。

实施例66:核苷酸衍生物的聚合酶掺入和交联

应用标准方法(Promega,cat# 4103)使用T4多核苷酸激酶用32P 5’-标记延伸引物(5’-GCT ACT GGC ATC GGT-3’)。在延伸反应缓冲 液(20mM Hepes,40mM KCl,8mM MgCl2,pH 7.4,10mM DTT)中 通过加热至80℃反应2分钟,然后缓慢冷却至大约20℃,将这 种延伸引物与模板引物(5’-TAG ACC GAT GCC AGT AGC)退火,用量 分别是0.1和3pmol。然后加入核苷酸衍生物(大约100μM),并且 在30℃下使用5单位的AMV逆转录酶(Promega,part#9PIM510) 进行掺入1小时。然后通过微量离心凝胶过滤(BioRad)纯化寡核苷酸。 30℃下使用10mM BS3[双(磺酰基琥珀酰亚胺)辛二酸酯](Pierce, cat# 21580)进行交联大约1小时。将样品与甲酰胺染料混合并且进 行10%脲聚丙烯酰胺凝胶电泳。利用放射自显影法(Kodak,BioMax胶 卷)使凝胶显影。图51A和51B说明各种核苷酸衍生物的掺入和交联 (CL)。图51A:1道,化合物III和化合物II;2道,交联的化合物 III和化合物II。图51B:1道,化合物III和化合物I;2道,交 联的化合物III和化合物I。结果表明这些核苷酸衍生物通过聚合酶 能以这种特定顺序掺入。还表明化合物III,化合物II和化合物I被 交联剂BS3修饰(迁移率变动),从而允许DNA模板介导的核苷酸衍生 物化合物III-化合物II和化合物III-化合物I上反应基团之间交联 (CL)。重要的是,大沟中核苷酸衍生物的酰胺基团可选择性地接受修 饰,这促进DNA模板上不同的掺入的核苷酸衍生物之间的交联。

实施例67:不同核苷酸衍生物的聚合酶掺入

应用标准方法(Promega,cat# 4103)使用T4多核苷酸激酶用32P 5’-标记延伸引物(5’-TCC GCT ACT GGC ATC GGT-3’)。在延伸反 应缓冲液(20mM Hepes,40mM KCl,8mM MgCl2,pH 7.4,10mM DTT) 中通过加热至80℃反应2分钟,然后缓慢冷却至大约20℃,将 模板引物(5’-TGA ACC GAT GCC AGT AGC-5’)与该延伸引物退火, 延伸引物和模板引物用量分别是0.1和3pmol。该模板引物被3’生 物素-C6-标记以防止延伸。然后加入核苷酸衍生物(大约100μM),并 且在30℃下使用5单位的AMV逆转录酶(Promega,part#9PIM510) 掺入1小时。将样品与甲酰胺染料混合并且进行10%脲聚丙烯酰胺凝 胶电泳。利用放射自显影法(Kodak,BioMax胶卷)使凝胶显影。图52 说明不同核苷酸衍生物的掺入。1道,野生型dTTP,dCTP和dATP;2 道,化合物XI;3道;化合物XI和化合物III;4道,化合物XI,化 合物III和dATP;5道,化合物XI,化合物III和化合物XIII。结 果表明使用聚合酶各自之后能掺入至少三种不同的核苷酸衍生物。结 果,聚合酶允许活性位点同时存在各种不同的核苷酸衍生物而不显著 降低催化活性。

实施例68:不同核苷酸衍生物的聚合酶掺入

应用标准方法(Promega,cat# 4103)使用T4多核苷酸激酶用32P 5’-标记延伸引物(5’-TCC GCT ACT GGC ATC GGT-3’)。在延伸反 应缓冲液(20mM Hepes,40mM KCl,8mM MgCl2,pH 7.4,10mM DTT) 中通过加热至80℃反应2分钟,然后缓慢冷却至大约20℃,用 模板引物(5’-TGA ACC GAT GCC AGT AGC-3’)与该延伸引物退火, 延伸引物和模板引物用量分别是0.1和3pmol。该模板引物被3’生 物素-C6-标记以防止延伸。然后加入核苷酸衍生物(大约l00μM),并 且在30℃下使用5单位的AMV逆转录酶(Promega,part#9PIM510) 掺入l小时。将样品与甲酰胺染料混合并且进行10%脲聚丙烯酰胺凝 胶电泳。利用放射自显影法(Kodak,BioMax胶卷)使凝胶显影。图53 说明与野生型核苷酸相比较的各种核苷酸衍生物的掺入。1道,野生 型dCTP,dTTP和dATP;2道,化合物II,化合物III和化合物XIII。 结果表明各自使用聚合酶之后能掺入至少三种不同的核苷酸衍生物。 结果,聚合酶允许活性位点同时存在各种不同的核苷酸衍生物而不显 著降低催化活性。

实施例69-74:聚合酶介导的模板分子的制备

实施例69通过脲键形成使编码的氨基基团交联

使用T4多核苷酸激酶应用标准方法(Promega,cat#4103)用32P 5’-标记引物(5’-TCC GCT ACT GGT ATC GGX-3’),其中X表示脱 氧-胸苷-C6-NH2,(Glen research,cat #10-1039-90),然后通过微 量离心凝胶过滤纯化。通过在杂交缓冲液(20mM Hepes,200mM NaCl, pH7.5)中加热至80℃反应2分钟,然后缓慢冷却至大约20℃, 让这种引物(0.1pmol)和2pmol第二引物(5’XCA CTT GCA GAC AGC- 3’)与1pmol模板引物(5’-GCT GTC TGC AAG TGA CCG ATG CCA GTA GC-3’)共退火。接着,加入10mM的N’,N’-羰基二咪唑 (Sigma-Aldrich)并且将样品在30℃温育2小时。将样品与甲酰胺染 料混合并且进行10%尿素聚丙烯酰胺凝胶电泳。利用放射自显影法 (Kodak,BioMax胶片)使凝胶显影。下面给出该实验的图示说明:

通过形成脲键的交联

结果表明通过与CDI反应,相邻的NH2-基团能形成共价脲键。没 有模板序列存在时观察不到反应,这表明该反应取决于模板序列引导 的NH2-基团的紧密接近。当使用0.5%甲醛作为交联剂时也发现脲键形 成(没有给出数据)。

实施例70:使用二氨基接头通过“填充式”反应使酰胺键形成

在该实验中,DNA-编码的羧酸通过1,4-二氨基丁烷交联。使用 T4多核苷酸激酶应用标准方法(Promega,cat# 4103)用32P 5’-标记 引物(5’-TCC GCT ACT GGT ATC GGY-3’),其中Y表示脱氧-胸苷 -C2-COOH(Glen research,cat #10-1035-90),之后通过微量离心 凝胶过滤纯化。通过在杂交缓冲液(20mM Hepes,200mM NaCl,pH7.5) 中加热至80℃反应2分钟,然后缓慢冷却至大约20℃,让这种 引物(0.1pmol)和2pmol第二引物(5’YCA CTT GCA GAC AGC-3’) 与1pmol模板引物(5’-GCT GTC TGC AAG TGA CCG ATG CCA GTA GC-3’) 共退火。接着,加入100mM EDC(Sigma-Aldrich),10mM N-羟基琥 珀酰亚胺(NHS,Sigma-Aldrich)和10mM 1,4-二氨基丁烷(Merck), 并且将样品在30℃温育2小时。将样品与甲酰胺染料混合并且进行 10%尿素聚丙烯酰胺凝胶电泳。利用放射自显影法(Kodak,BioMax胶 片)使凝胶显影。下面给出该实验的图示说明:

通过“填充式”反应的交联

结果表明,编码的COOH-基团能通过双官能接头形成酰胺键而共价 偶联。没有模板序列存在下没有观察到反应,这表明反应受模板序列 造成的COOH-基团的接近的支配。当使用其他二氨基接头例如1,6- 二氨基己烷,精胺和亚精胺时获得类似结果(没有给出数据)。

实施例71:核苷酸衍生物的聚合酶掺入和与模控锚点交联

使用T4多核苷酸激酶应用标准方法(Promega,cat# 4103)用32P 5’-标记延伸引物(5’-GCT ACT GGC ATC GGT-3’)。通过在延伸 缓冲液(20mM Hepes,40mM KCl,8mM MgCl2,pH7.4,10mM DTT) 中加热至80℃反应2分钟,然后缓慢冷却至大约20℃,让这种 延伸引物与模板引物(5’-GCT GTC TGC AAG TGA TAA CCG ATG CCA GTA GC-3’)退火,其中引物和模板分别使用0.1和3pmol。然后加入核 苷酸衍生物(大约100μM),并且使用5单位的AMV逆转录酶(Promega, part# 9PIM510)在30℃下反应1小时以实现掺入。然后应用微量 离心凝胶过滤(BioRad)来纯化寡核苷酸复合体。使其中Y代表锚点反 应基团脱氧胸苷-C2-COOH的第二引物(5’-YCA CTT GCA GAC AGC-3’) 与延伸复合体退火。将缓冲液组成调节至20mM HEPES-KOH,200mM NaCl,pH=7.5。30℃下使用100mM EDC和10mM N-羟基琥珀酰亚 胺进行交联大约2小时。对相关样品进行碱性水解(0.1M NaOH,50℃, 15分钟)。将样品与甲酰胺染料混合并且进行变性10%尿素聚丙烯酰胺 凝胶电泳。利用放射自显影法(Kodak,BioMax胶片)使凝胶显影。下 面给出该实验的图示说明:

通过直接偶联进行连接和β-氨基酸的移位

结果表明,通过“填充式”反应形成酰胺键,来自借助聚合酶掺 入的核苷酸衍生物的反应基团能与锚点反应基团交联。此外,核苷酸 衍生物的酯接头可以被特异性断裂,这使得模控功能实体转移到模控 第二功能实体(锚点)上。

实施例72:核苷酸衍生物的聚合酶掺入和通过“填充式”反应 与模控锚点交联

使用T4多核苷酸激酶应用标准方法(Promega,cat# 4103)用32P 5’-标记延伸引物(5’-GCT ACT GGC ATC GGT-3’)。通过在延伸 缓冲液(20mM Hepes,40mM KCl,8mM MgCl2,pH7.4,10mM DTT) 中加热至80℃反应2分钟,然后缓慢冷却至大约20℃,让这种 延伸引物与模板引物(5’-GCT GTC TGC AAG TGA TAA CCG ATG CCA GTA GC-3’)退火,其中所述延伸引物和模板引物分别使用0.1和3pmol。 然后加入化合物II(核苷酸衍生物,大约100μM),并且使用5单位的 AMV逆转录酶(Promega,part# 9PIM510)在30℃下反应1小时以 实现掺入。然后应用微量离心凝胶过滤(BioRad)来纯化寡核苷酸复合 体。使其中X代表锚点反应基团脱氧胸苷-C6-NH2的第二引物(5-XCA CTT GCA GAC AGC-3’)与延伸复合体退火。30℃下使用10mM BS3[双 (磺酰基琥珀酰亚胺)辛二酸盐](Pierce,cat# 21580)进行交联大约 2小时。对相关样品进行碱性水解(0.1M NaOH,50℃,15分钟)。 将样品与甲酰胺染料混合并且进行变性10%尿素聚丙烯酰胺凝胶电泳。 利用放射自显影法(Kodak,BioMax胶片)使凝胶显影。下面给出该实 验的图示说明:

“填充式”连接和β-氨基酸移位

图54显示凝胶拷贝。1道:没有核苷酸,2道:dTTP,3道:化合 物I,4道:dTTP接着碱性水解,5道:化合物I接着碱性水解,6 道:dTTP接着BS3交联,7道:化合物I接着BS3交联,8道:dTTP 接着BS3交联和碱性水解,和9道:化合物I接着BS3交联和碱性水 解。结果表明,通过“填充式”反应形成酰胺键,来自借助聚合酶掺 入的核苷酸衍生物的反应基团能与锚点反应基团交联。此外,核苷酸 衍生物的酯接头可被特异性断裂,这使得模控功能实体转移到第二模 控功能实体(锚点)上。

实施例73:两种核苷酸衍生物的聚合酶掺入和3个编码的实体之间 的交联

使用T4多核苷酸激酶应用标准方法(Promega,cat# 4103)用32P 5’-标记延伸引物(5’-GCT ACT GGC ATC GGT-3’)。通过在延伸缓冲 液(20mM Hepes,40mM KCl,8mM MgCl2,pH7.4,10mM DTT)中 加热至80℃反应2分钟,然后缓慢冷却至大约20℃,让0.1pmol 这种延伸引物与3pmol模板引物(5’-GCT GTC TGC AAG TGA GTA CCG ATG CCA GTA GC-3’)退火。然后加入核苷酸衍生物V和X(大约100 μM),并且使用5单位的AMV逆转录酶(Promega,part# 9PIM510)在 30℃下反应1小时实现掺入。然后应用微量离心凝胶过滤(BioRad) 来纯化寡核苷酸复合体。使其中Y代表锚点反应基团脱氧胸苷 -C2-COOH的第二引物(5’-YCA CTT GCA GAC AGC-3’)与延伸复合体 退火。将缓冲液组成调节至20mM HEPES-KOH,200mM NaCl,pH=7.5, 然后加入100mM EDC和10mM N-羟基琥珀酰亚胺。这导致MG91的NH2-基团和V的COOH基团及第二引物的COOH交联。对合适的样品进行碱 性水解(0.1M NaOH,50℃,15分钟)。向样品中加入甲酰胺染料, 然后加载到10%尿素聚丙烯酰胺凝胶上。利用放射自显影法(Kodak, BioMax胶片)使凝胶显影。下面给出该实验的图示说明:

3种编码的功能实体的连接

结果表明三个编码的功能实体能被交联。此外,特定的接头能被选 择性裂解。

实施例74:聚合酶掺入和β-氨基酸移位(“拉拉链 (zipping)”)。

使用T4多核苷酸激酶应用标准方法(Promega,cat# 4103)用32P 5’-标记延伸引物(5’-GCT ACT GGC ATC GGT-3’)。通过在延伸缓冲 液(20mM Hepes,40mM KCl,8mM MgCl2,pH7.4,10mM DTT)中 加热至80℃反应2分钟,然后缓慢冷却至大约20℃,使这种延 伸引物与模板引物(5’-TAG ACC GAT GCC AGT AGC)退火,其中所述 延伸引物和模板引物分别使用0.1和3pmol。然后加入核苷酸衍生物 II和III(大约100μM),并且使用5单位的AMV逆转录酶(Promega, part# 9PIM510)在30℃下反应1小时实现掺入。然后应用微量离 心凝胶过滤(BioRad)来纯化寡核苷酸之后冻干。将寡核苷酸复合体溶 解于吡啶,并且加入三氟甲磺酸钪(催化剂)的吡啶溶液达到10mM 的最终浓度,并且将反应混合物在50℃下保温1小时。对相关样品 进行碱性水解,使用0.1M NaOH在50℃进行15分钟。向样品中加 入甲酰胺染料,然后加载到10%尿素聚丙烯酰胺凝胶上。利用放射自 显影法(Kodak,BioMax胶片)使凝胶显影。下面给出该实验的图示说 明:

拉拉链和β-氨基酸移位

结果表明,一个功能实体的反应基团能与其它功能实体的反应基 团反应,形成酰胺键。反应导致功能实体移位到第二功能实体上,同 时断裂连接第一功能实体和编码所述功能实体的核苷酸衍生物的接 头。在该项实验设置中,产生包含两个β-氨基酸的二肽。因此,包含作 为功能实体的β-氨基酸的几个(三个或多个)核苷酸衍生物在DNA 模板上的掺入将允许多个移位事件发生,产生包括三个或多个β-氨基 酸的β-肽酸。在该实施例中,在非水性环境下发生功能实体反应基团 之间的反应。在优选的方面,功能实体反应基团之间的反应通过“拉 链式”反应在包含所述功能实体的核苷酸衍生物掺入后直接发生。这 可以通过引入各种化学实体,例如硫酯,酚酯,硫代酚酯,二-,三-或 四-氟-活化酚酯或硫代酚酯或N-羟基琥珀酰亚胺酯提高酯键的反应性 来完成。

实施例75:in silico实验  利用聚合酶掺入核苷酸衍生物产生的 模板展示分子(template-displayed molecule)的结构描述

本发明的一个方面使用合适的聚合酶将核苷酸酸衍生物特异掺入 以结合到DNA模板上。使用包含编码元件的模板完成这种掺入。通过 聚合酶利用该模板将核苷酸衍生物基于这些编码元件以特定顺序掺入 (图55)。该过程由于核苷酸衍生物中的识别基团而是特异性的。

在特定位置修饰不同的核苷酸(例如图9),以允许通过聚合酶掺 入,并同时使连接的功能实体暴露于接触溶剂的DNA链大沟之中或之 外,如图55A所示。通过聚合酶连续掺入核苷酸衍生物,使得连接的 功能实体之间可以发生各种反应。这些反应由各功能实体中整合的反 应基团的类型确定(图11-21所示实例)。另外,根据DNA模板的螺旋结 构,DNA模板将以特定几何学安排功能实体。这种几何学可以例如通 过不同类型的连接功能实体和互补元件的接头来控制。因此,设计接 头,以有利于核苷酸衍生物上反应基团之间的反应。接头设计根据功 能实体中安排的反应基团的类型以及安排方式而不同。也可以设计接 头来指导反应基团之间的反应按特定方向进行。也可以使用各种反应 基团来指导反应基团之间的反应。核苷酸衍生物的紧密接近和优化的 几何学将大大提高不同功能实体中的反应基团之间的反应速度。与如 果在溶液中自由扩散相比,在DNA模板分子上掺入的核苷酸衍生物具 有高局部浓度,这使得反应基团之间的反应速度很快。

图55A显示了一个实例,其中核苷酸衍生物化合物II,化合物X 和化合物V相继通过聚合酶结合到相同的DNA模板上而掺入。上文详 细描述了这些核苷酸衍生物的合成。实施例64给出了说明这些核苷酸 衍生物的AMV逆转录酶掺入的实验数据。通过连接互补元件和功能实 体的接头,这些掺入的核苷酸衍生物被有组织地排列起来,从而促进 各核苷酸衍生物上反应基团之间的反应。化合物II中的胺和长侧链中 化合物X胺之间的计算距离在3.1_至17.5_之间,化合物II中的 胺和短侧链中的化合物X胺之间的计算距离在3.0_至14.6_之间, 这取决于DNA模板上接头和功能实体的精确取向。核苷酸衍生物化合 物V中的羰基碳和核苷酸衍生物化合物X中的长侧链胺之间的距离 在4.2_至19.8_之间,而与化合物X短侧链胺的计算距离在3.7_ 至16.5_之间,这也取决于所述精确取向。DNA模板上核苷酸衍生物 化合物II,化合物X和1973的紧密接近会促进这些核苷酸衍生物中 反应基团的化学键合。

使用不同的化学试剂能将这三种核苷酸衍生物通过它们的反应基 团连接在一起。使用的一种可能的试剂是BS3[双(磺酰基琥珀酰亚胺) 辛二酸盐](Pierce,cat# 21580)。典型地,对于这种类似物使用大 约0.25-10mM的浓度。这种试剂将交联核苷酸衍生物化合物II 和化合物X之间的两个胺。这种特殊的试剂将在反应基团之间插入8 个碳原子的间隔基团并且能以伸展的构象桥接11.2_的距离。因此, BS3接头能连接化合物II的胺和化合物X的任一个胺。可以使用其他 试剂(更长或更短)来获得几乎任何类型的反应胺基团之间的间隔基 团。使用例如1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟 基琥珀酰亚胺(NHS),能将核苷酸衍生物化合物V上的羧酸和核苷酸 衍生物化合物X上的一个胺连接在一起。该反应使核苷酸衍生物化合 物X和化合物V上的反应基团直接连接。这两个反应产生由这些核苷 酸衍生物通过偶联剂彼此共价连接构成的新的分子(图55B)。应用填 充(BS3)和直接偶联(EDC/NHS)化学均可以制备这种特定DNA模板-介 导的分子。上面给出掺入的核苷酸衍生物之间的交联的实施例。可以 应用的其他类型偶联方法通过移位或开环而形成拉链。这些偶联策略 需要其他类型的根据本发明所述的接头设计。

在这个阶段,所有的功能实体通过连接此功能实体和互补元件的 接头而仍然与DNA模板结合。整合在核苷酸衍生物化合物II和化合物 X的接头中的酯成分能被特异水解(实验详细描述参见实施例65),以 从DNA模板上释放出这两种核苷酸衍生物的功能实体。该水解反应产 生仅通过化合物V核苷酸衍生物中的接头与DNA模板结合的新的分子 (图55C)。该分子然后可从DNA模板上伸出到溶液中并且变得易于接 近(展示出来)用于和溶液中其他分子相互作用。

该模板分子为具有很多不同的模控分子的库的一部分,其最后能 在筛选步骤中使用来鉴定与不同靶物结合的分子。本说明书其他部分 详细描述了筛选步骤。

实施例(模型)76:PNA合成——碱基连接

PNA单体通过与各PNA单体的碱基部分结合的可裂解苄基-或苄氧 羰基部分与互补元件连接。羧酸被用作此寡核苷酸复合体的锚点。使 各结构单元退火到寡核苷酸模板上(没有显示)。

步骤A:聚合

向寡核苷酸复合体(0.1-100μM,优选0.5-10μM)的缓冲水溶液 (10μL,1M NaCl,100-500mM缓冲液,pH6-10,优选7-9)中加入于 合适的溶剂(1μL)中的肽偶联剂(0.1mM-100mM,优选1-10mM)—— 举例来说,但不限于EDC,DCC,DIC,HATU,HBTU,PyBoP,PyBroP 或N-甲基-2-氯代吡啶鎓四氟硼酸盐,和肽偶联修饰剂(0.1mM-1μM, 优选1-10mM)——例如但不限于NHS,磺基-NHS,HOBt,HOAt或 DhbtOH,所述溶剂是例如水,甲醇,乙醇,二甲基甲酰胺,二甲亚砜, 乙二醇,乙腈或者这些的混合物。反应在-20℃和60℃之间的温 度下进行。反应时间是1小时至一周,优选1小时-24小时。

上述方法举例说明11μL规模的聚合作用,但是可以使用1.1μL至 1.1L的任何其他反应体积。

步骤B:接头裂解和去保护

Cbz-和苄基保护基可以通过各种方法被去除[Greene;1999;]。 由于其温和性,催化还原经常是选择的方法。使不溶性氢化催化剂例如 Pd/Al2O3,Pd/CaCO3,Pd/C,PtO2,或者可溶性氢化催化剂例如 Wilkinsons催化剂和合适的溶剂中的氢源(举例来说但是不限于H2, 甲酸铵,甲酸,1,4-环己二烯,和环己烯)与寡核苷酸复合体混合以 去除Cbz-和苄基保护基团,所述合适的溶剂为如水,甲醇,乙醇,二 甲基甲酰胺,二甲亚砜,乙二醇,乙腈,乙酸或者这些的混合物。

代表10-20个核苷酸的序列。Link是在一个末端被修饰 的寡核苷酸(例如40mer),所述修饰使得可以与PNA单元上的碱基连 接。

下面是结构单元合成的方案:

步骤A,B:

向在冰/水浴上冷却的氯甲酸4-硝基苯酚酯(5mmol)的DCM溶液 (20mL)中滴加溶解于DCM(20mL)中的(4-乙炔基苯基)甲醇(5 mmol)。1小时之后移开冰浴。通过TLC监测反应。反应完全时,加 入(6-氨基嘌呤-9-基)-乙酸乙酯(5mmol)的吡啶(20mL)溶液并且在 室温下反应16小时。真空去除挥发物质并且通过色谱法纯化残余物。

步骤C,D:

步骤C[Hyrup;1996;Bioorganic & medicinal chemistry;5-23] 和D[Schmidt;1997;Nucleic Acids Research;4792-4796,B_hler; 1995;Nature;]参见文献。

步骤E

向保护的碘取代的核苷(0.34mmol),炔(0.69mmol,2当量), DIEA(0.25mL)的DMF溶液(2mL)通入5分钟Ar。加入四三苯基膦钯 (0.03mmol,0.1当量)和CuI(0.07mmol,0.2当量)并且将混合物 加热至50℃保持20小时。蒸发挥发性物质之后经色谱法得到期望 的修饰的核苷,其被转化为相应的亚磷酰胺并且被掺入到寡核苷酸中。

实施例(模型)77:PNA合成——氮连接

PNA单体通过与各个PNA单体的碱基部分结合的可裂解苄基部分 而与互补元件连接。胺被用作此寡核苷酸复合体的锚点。使各个结构 单元退火到寡核苷酸模板上(没有显示)。

代表修饰的核苷酸之间的价键。

步骤A:聚合

向寡核苷酸复合体(0.1-100μM,优选0.5-10μM)的缓冲水溶液 (10μL,1M NaCl,100-500mM缓冲液,pH6-10,优选7-9)加入合适 的溶剂(1μL)中的肽偶联剂(0.1mM-100mM,优选1-10mM)(举 例来说,不限于EDC,DCC,DIC,HATU,HBTU,PyBoP,PyBroP或N- 甲基-2-氯代吡啶鎓四氟硼酸盐)和肽偶联修饰剂(0.1mM-1μM,优选 1-10mM))例如但不限于NHS,磺基-NHS,HOBt,HOAt,或DhbtOH), 所述溶剂是例如水,甲醇,乙醇,二甲基甲酰胺,二甲亚砜,乙二醇, 乙腈或者这些的混合物。反应在-20℃和60℃之间的温度下进行。 反应时间是1小时至一周,优选1小时-24小时。

上述方法举例说明11μL规模的聚合作用,但是可以使用1.1μL至 1.1L的任何其他反应体积。

步骤B:

Cbz-和苄基保护基可以通过各种方法被去除[Greene和 Wuts;1999;]。由于其温和性,催化还原经常是所选择的方法。使不 溶性氢化催化剂例如Pd/Al2O3,Pd/CaCO3,Pd/C,PtO2,或者可溶性氢 化催化剂例如Wilkinsons催化剂和在合适的溶剂(象水,甲醇,乙 醇,二甲基甲酰胺,二甲亚砜,乙二醇,乙腈,乙酸或者这些的混合物) 中的氢源(举例来说但是不限于H2,甲酸铵,甲酸,1,4-环己二烯, 和环己烯),合适的溶剂与寡核苷酸复合体混合,从而去除Cbz-和苄 基保护基团。

实施例78(模型):多糖

多糖合成的一般方案

步骤A

将用羧酸修饰的(例如Glen Research羧基-dT cat.No. 10-1035-)、已与2-氨基-糖结合的引物序列退火到模板上(没有显示) 并且用带有己糖单元的修饰的核苷酸延伸。Pg是保护基 [Seeberger;2000;Chem.Rev;4349-4393,Seeberger;2001;], 例如但不限于Ac,Bz,Lev,Piv,Silanes(SiR3,其中R是低级烷 基),Lg是一般用于碳氢化合物化学的离去基团,例如但不限于卤素, 三氯乙酰胺(trichloroacetamidato),硫醇,苯酚,磷酸酯和用于酶 促碳水化合物合成的糖核苷磷酸或糖磷酸[Wong;1994;Tetrahedron Organic Chemistry Series;]。使用烯糖(glycal)也可以合成多 糖。

步骤B:接头活化

在合适的溶剂中,例如水,甲醇,乙醇,二甲基甲酰胺,二甲亚 砜,乙二醇,乙腈或者这些的混合物,在pH9-12,室温下,用氢氧 化物水溶液将酯键裂解16小时。如果Pg是Ac或其他碱不稳定保护 基团,也被去除。

碳水化合物有几个OH-官能团,使得可以与互补元件连接。该实施 例给出一个1-6偶联的三聚体,但是可以使用结构单元的任何组合。

碳水化合物单元与模板连接可以减小这些单元折叠成二级结构的 倾向,从而有利于多糖的合成。

实施例(模型)79:丙烯酰胺

聚丙烯酰胺合成的一般方案:

带有碘原子的末端修饰的引物序列退火到寡核苷酸模板上(没有 显示)并且用带有N-取代的丙烯酰胺单元的修饰的核苷酸延伸。

步骤A:聚合

通过自由基引发剂去除碘原子形成基于碳原子的自由基而起始在 级联自由基反应中聚合丙烯酰胺。

向带有N-取代的丙烯酰胺单元的寡核苷酸复合体(0.1-100μM, 优选0.5-10μM)的缓冲水溶液(10μL,1M NaCl,100-500mM缓冲 液pH6-10,优选7-9)加入合适的溶剂(1μL)例如水,甲醇,乙醇, 二甲基甲酰胺,二甲亚砜,乙二醇,乙腈或者这些的混合物中的自由基 引发剂(0.1mM-100mM,优选1-10mM),例如但不限于过氧一硫酸盐, AIBN,二叔丁基过氧化物,叔丁基过氧化物,过氧化氢或乙酸铅,并 任选地使用UV-光,超声或微波。反应在-20℃和100℃之间的温 度下进行,优选0℃至60℃之间。反应时间是1小时至一周,优 选1小时-24小时。

上述方法举例说明11μL规模的聚合作用,但是可以使用1.1μL至 1.1L的任何其他反应体积。

步骤B:活化

通过使用氢化作用催化剂和合适的氢源或者在某些金属盐的存在 下进行还原,N-O键容易被裂解。

向寡核苷酸复合体(0.1-100μM,优选0.5-10μM)的缓冲水溶液 (10μL,1M NaCl,100-500mM缓冲液pH4-10,优选4-7)加入合适 的溶剂(1μL)例如水,甲醇,乙醇,二甲基甲酰胺,二甲亚砜,乙二 醇,乙腈,或者这些的混合物中的还原剂(0.1mM-100mM,优选1-10 mM),例如但不限于碘化钐(II),氯化(II)或氯化锰(III)。反 应在-20℃和100℃之间的温度下进行,优选0℃至60℃ 之间。反应时间是1小时至一周,优选1小时-24小时。

上述方法举例说明11μL规模的聚合作用,但是可以使用1.1μL至 1.1L的任何其他反应体积。

结构单元合成:

步骤A:

向保护的碘取代的核苷(3.4mmol),炔(6.9mmol,2当量, Aldrich P51338),DIEA(2.5mL)的DMF溶液(20mL)通入5分钟Ar。 加入四三苯基膦钯(0.3mmol,0.1当量)和CuI(0.7mmol,0.2当 量)并且将混合物加热至50℃保持20小时。冷却后,将混合物加入 700mL二乙醚。有机相用氯化铵(饱和的水溶液,250mL)和水(250mL) 洗涤。蒸发挥发物质之后用甲苯(400mL)反萃取,得到期望的修饰的 核苷,通过柱色谱法(硅胶,庚烷/乙酸乙酯洗脱剂)纯化。

步骤B:

向步骤A获得的修饰的核苷(2mmol)的乙醇(30mL)溶液加入水 合肼(400mg,8mmol,4等量),并且将混合物在20℃下搅拌。通 过TLC监测反应。完成反应后真空去除挥发成分并通过色谱法纯化残 余物。

步骤C:

向步骤B得到的胺(0.5mmol)加入DMF(10mL),苯甲醛(0.6mmol, 1.2当量),乙酸(100μL,1%)和氰基硼氢化钠(0.6mmol)。20℃下 反应16小时并且用NaHCO3(水溶液,10mL,5%)终止,用乙酸乙酯 萃取(3×100mL)。合并的有机相用NH4Cl(饱和水溶液,50mL)和水 (50mL)洗涤,用Na2SO4干燥。蒸发乙酸乙酯之后,可以通过色谱法纯 化残余物。

步骤D:

步骤C中获得的产物(0.1mmoL)在2,6-二叔丁基吡啶(0.4mmol) 存在下溶解于二氯甲烷并且冷却到0℃,此时滴加丙烯酰氯(0.15 mmol)的二氯甲烷(2mL)溶液。0℃下反应1小时之后使温度升至 20℃,1小时之后用NaHCO3(水溶液,3mL,5%)终止反应。分离各 相并且真空浓缩有机相。残余物溶解于乙酸乙酯并且用HCl(水溶液) (0.1M,3mL),NaHCO3(水溶液,3mL,5%)和水(3mL)洗涤。蒸发 乙酸乙酯之后,产物用甲苯(2×20mL)反萃取,通过色谱法纯化并且转 化成期望的结构单元类型,例如5’-三磷酸酯。

实施例(模型)80:β-肽的合成

β-肽合成的一般方案:

步骤A

胺前体可以是带有保护基团的胺[Greene和Wuts;1999;],例如 但不限于氨基甲酸苄酯,氨基甲酸对甲氧基苄酯,氨基甲酸2-三甲 基甲硅烷基乙酯,氨基甲酸2,2,2-三氯乙酯。分别通过氢解,温和的 酸处理,氟化物处理和用Zn粉处理可以将这些保护基团去除。或者, 胺前体可以是硝基或叠氮化物。通过还原作用,两者均可转化为胺。 也可以在温和条件下使用膦还原后者。

步骤B

步骤A中制备的自由胺对相邻的NTA单元进行攻击,从而起始级 联反应。

步骤C

对寡核苷酸复合体缓冲溶液(pH5-10)进行UV照射(250-500nm) 进行接头裂解,以部分释放β-肽。

实施例(模型)81:β-类肽(β-peptoid)合成

β-类肽合成的一般示意图

步骤A

胺前体可以是带有保护基团的胺[Greene和Wuts;1999;],例如 但不限于氨基甲酸苄酯,氨基甲酸对甲氧基苄酯,氨基甲酸2-三甲 基甲硅烷基乙酯,氨基甲酸2,2,2-三氯乙酯。这些保护基团分别可以 通过氢解,温和的酸处理,氟化物处理和用Zn粉处理而去除。或者, 胺前体可以是硝基或叠氮化物。通过还原作用,两者均可以转化为胺。 也可以在温和条件下使用膦还原后者。

步骤B

步骤A中制备的自由胺攻击相邻的[1,3]氧杂氮杂环己烷-6-酮 ([1,3]oxazinan-6-one)单元,最初由于开环而形成不稳定缩醛胺。这 分解生成醛,释放仲胺,它现在能继续级联反应,在这种情况下产生 β类肽。

结构单元合成

实施例(模型)82:聚酰胺合成

掺入X-X和Y-Y型交替单体结构单元(原理如图16所示),接着进 行聚合步骤,导致相邻单体上X和Y之间形成键。

结构单元合成

步骤A:2+2环加成

20℃下2-烯丙基-丙二酸二甲酯(1mmol)和氯磺酰基异氰酸酯 (1mmol)在THF中混合并且反应7天。粗产物不用纯化即可使用。

步骤B:二-胺保护

0℃下1,3-二氨基-丙-2-醇(1mmol)和三氟乙酸酐(2mmol)在 二乙醚中混合并且在该温度下反应4小时。反应混合物用1M HCl, NaHCO3(水溶液)和水萃取。通过蒸发有机相获得产物。

步骤C:氨基甲酸酯的生成

步骤B中获得的2,2,2-三氟-N-[2-羟基-3-(2,2,2-三氟-乙酰基 氨基)-丙基]-乙酰胺(1.5mmol)和氯磺酰基异氰酸酯(1.5mmol)一起 溶解于THF,并且在20℃下反应16小时。粗产物不用纯化即可使 用。

步骤D:还原胺化作用

醛(5mmol)溶解于最少量MeOH并且加入胺(6mmol),氰基硼氢 化钠(6mmol)和乙酸。搅拌过夜之后去除挥发性物质,通过结晶或 色谱法纯化产物。

步骤E:磺酰胺生成

在碱的存在下,向步骤D中获得的胺在水/THF混合物中的溶液加 入来自步骤A或步骤C的粗产物的THF溶液,并且在20℃下反应4 小时。然后混合物回流过夜。冷却之后,去除溶剂并且通过色谱法纯 化残余物。

寡聚结构单元的制备

在缓冲水溶液(pH5-8,优选6-7)中使用EDC和NHS,使保护的二 胺和二酸与带有伯氨基官能团的修饰的寡核苷酸进行连接。在缓冲水 溶液(pH10-12)中去除保护基团(甲酯和三氟乙酰胺两者)。或者,保 护基团保留在结构单元上,在退火到寡核苷酸模板上之后去除。

库制备

聚合作用:

向带有二胺和二羧酸的寡核苷酸复合体(0.1-100μM,优选 0.5-10μM)的缓冲水溶液(10μL,1M NaCl,100-500mM缓冲液,pH6-10, 优选7-9)加入于合适的溶剂(1μL)中的肽偶联剂(0.1mM-100mM, 优选1-10mM)(举例来说,不限于EDC,DCC,DIC,HATU,HBTU,PyBoP, PyBroP或N-甲基-2-氯代吡啶鎓四氟硼酸盐)和肽偶联修饰剂(0.1 mM-100mM,优选1-10mM)(例如但不限于NHS,磺基-NHS,HOBt,HOAt, 或DhbtOH),所述溶剂是例如水,甲醇,乙醇,二甲基甲酰胺,二甲亚 砜,乙二醇,乙腈或者这些的混合物。反应在-20℃和60℃之间 的温度下进行。反应时间是1小时至一周,优选1小时-24小时。

上述方法举例说明11μL规模的聚合作用,但是可以使用1.1μL至 1.1L的任何其他反应体积。

活化(接头裂解):

通过在0-40℃下用pH0-5的酸处理10分钟-10小时断裂接头。

参考文献

(1)Greene,T.W.;Wuts,P.G.M.有机合成中的保护基 (Protective Groups in Organic Synthesis);第三版.;John Wiley & Sons:New York,1999。

(2)Hyrup,B.;Nielsen,P.E.Bioorganic & medicinal chemistry 1996,4,5-23.

(3)Schmidt,J.G.;Christensen,L.;Nielsen,P.E.;Orgel, L.E.Nucleic Acids Research 1997,25,4792-4796.

(4)B_hler,C.;Nielsen,P.E.;Orgel,L.E.Nature 1995, 376.

(5)Seeberger,P.H.;Haase,W.C.Chem.Rev.2000,100, 4349-4393.

(6)固相载体寡糖合成和组合糖文库(Solid Support Oligosaccharide Synthesis and Combinatorial Carbohydrate Libraries);Seeberger,P.H.,Ed.;Wiley-Interscience:New York, 2001.

(7)Wong,C.-H.;Whitesides,G.M.合成有机化学中的酶 (Enzymes in Synthetic Organic Chemistry);Pergamon:Oxford, 1994.

实施例(模型)83.从模控α-肽库分离谷胱甘肽S-转移酶(GST) 的α-肽配体

A)核苷酸衍生物合成

下面图示说明三种核苷酸衍生物的合成策略,并详细描述了此合 成。其他合成的α-氨基酸核苷酸衍生物的例子参见文献(例如Ito等 (1980)J.Amer.Chem.Soc.102:7535-7541;Norris等(1996)J. Amer.Chem.Soc.118:5769-5803;Celewicz等(1998)Pol.J.Chem. 72:725-734)。

LH1,LH7的合成:EDC(3.2mmol)加入冰水冷却的或者N-(叔丁 氧羰基)-叔丁氧基谷氨酸(3.0mmol)或N-(叔丁氧羰基)-甘氨酸(3.0 mmol)的二氯甲烷(10mL)溶液。加入4-二甲基氨基吡啶(0.3mmol) 和5-己炔醇(4.6mmol)的二氯甲烷(1mL)溶液。混合物在0℃下搅 拌1小时,然后在室温下搅拌过夜。蒸发溶剂,残余物溶解于二乙醚。 浆状物用HCl(0.1M,25mL),饱和NaHCO3(25mL)和盐水(25mL) 洗涤,然后浓缩成油状物。通过急骤层析纯化产物。

LH4的合成:6-碘代己炔(6mmol)和K2CO3(6mmol)加入N-(叔丁 氧羰基)-半胱氨酸(3mmol)在甲醇(5mL)和DMF(5mL)中的溶液。反 应混合物在40℃下搅拌1天,然后浓缩并且通过柱色谱法后处理。

LH2,LH5和LH8的合成:向脱气的碘代核苷(1mmol),炔(2mmol) 和乙基二异丙基胺(2mmol)的DMF或乙醇(4mL)溶液加四(三苯基膦) 钯(0.6mmol)和CuI(0.2mmol)。反应混合物在氩气下搅拌。通过 TLC跟踪反应。如果在室温下不发生反应则在50℃下搅拌反应混合物。 将反应混合物浓缩成浆液并且通过RP-HPLC后处理(洗脱液:水→甲 醇)。当在反应过程中酰化伯羟基时,使用相应的叔丁基二甲基甲硅烷 基保护的碘代核苷代替没有保护的核苷。Sonogashira偶联之后通过 在乙醇和乙酸(8当量)的溶液中用氟化四丁基铵(4当量)处理化合物 一天而裂解甲硅烷基醚,然后浓缩并且通过RP-HPLC后处理(洗脱液: 水→甲醇)。

LH3,LH6和LH9的合成:向冰水冷却的核苷(0.1mmol)的磷酸三 甲酯(1mL)溶液加入磷酰氯(0.11mmol)。0℃下氩气下将反应混合 物搅拌1小时。然后加入双-正-三丁基铵焦磷酸盐(0.2mmol)的DMF(1 mL)溶液和正-三丁基胺(0.3mmol)。将反应混合物搅拌10分钟之后 加入水(1mL)。用三乙胺中和混合物并且在室温下搅拌6小时,然后 真空浓缩并且通过离子对交换RP HPLC后处理(洗脱剂100mM乙酸 三乙铵→80%乙腈中100mM乙酸三乙铵)。通过向混合物中加入水(100 μl),然后在0.1mmHg下将浆液浓缩几次后凝胶过滤(洗脱液:水), 从核苷中去除缓冲液盐。

B)库设计和核苷酸衍生物掺入

通过与模板引物退火的引物的延伸能制备模控库。模板引物编码 这个库并且能应用标准程序制备,例如通过使用亚磷酰胺的有机合成 方法制备。为了制备各种类型的寡核苷酸库,人们能例如利用丰余序 列,混合的亚磷酰胺或者掺杂物来合成寡核苷酸。这些寡核苷酸库可以 从制备消费者规定的寡核苷酸的供应商处购得(例如DNA Technology A/S,Denmark或TAG Copenhagen A/S,丹麦)。

这里,延伸引物(5’-GCT ACT GGC ATC GGT-3’)和模板引物 (5’-GTA ATT GGA GTG AGC C DD DAC CGA TGC CAG TAG C-3’)一起 使用,其中D(下划线,应用International Union of Biochemistry 的模糊定义)是A,G或T。如下所示,延伸引物与模板引物互补。延 伸期间,根据各个模板的序列,引物延伸通过DDD-序列,导致在那个 位置插入T-,C-,或A-核苷酸衍生物。在α-氨基和与核苷酸连接的 前体发生聚合作用,连接氨基和核苷酸的接头裂解之后,产生一个库, 其理论多样性为具有至少33=27种不同的肽。

库设计

延伸引物

GCT ACT GGC ATC

CGA TGA CCG TAG CCA DDD CCG AGT GAG GTT

模板引物

                  ↓核苷酸-衍生物的延伸

GCT ACT GGC ATC GGT

CGA TGA CCG TAG CCA DDD CCG AGT GAG GTT

                  ↓野生型核苷酸的延伸

                                             D=A,G或T

                                             H=T,C或A

GCT ACT GGC ATC GGT HHH GGC TCA CAC CAA TTA

CGA TGA CCG TAG CCA DDD CCG AGT GAG GTT

在延伸缓冲液(20mM Hepes,40mM KCl,8mM MgCl2,pH7.4,10 mM DTT)中,通过加热至80℃反应2分钟,然后缓慢冷却至大约20 ℃,使延伸引物与模板引物退火,每种引物使用大约3pmol。然后 加入核苷酸衍生物至各自大约200μM的浓度,使用5单位的AMV逆 转录酶(Promega,part# 9PIM510)在30℃下反应1小时实现掺入。 使用自旋柱(BioRad)去除没有掺入的核苷酸衍生物。应用对于核苷酸 衍生物描述的相同的条件通过加入野生型dNTP可以进行进一步的延 伸。或者,在延伸之前加入可以与DDD序列的下游序列退火的寡核苷 酸。使用自旋柱(BioRad)将双链产物纯化并且转移到另一种缓冲液 (100mM磷酸钠缓冲液,pH8.0)中。

C)聚合和接头裂解

使用1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)和N-羟基琥 珀酰亚胺(NHS)将掺入的核苷酸衍生物的反应基团连接在一起。这是用 于胺和羧基共价偶联的常规方法。文献中描述了偶联条件的例子(例如 NHS偶联试剂盒,IAsys,code#NHS-2005)。

分别以大约100mM和10mM的合适终浓度向纯化的双链延伸产物 加入EDC和NHS。该反应在30℃下保温2-16小时。使用自旋柱 去除过量的连接试剂。通过pH11(例如0.2M NaOH)下在50℃下 将样品保温15分钟实现可水解接头的水解。

D)选择

当使用核苷酸衍生物LH3,LH6和LH9时,这个特定库中可能的模 控分子之一是谷胱甘肽(Glu-Cys-Gly)。下面示意图说明掺入、反应基 团之间的反应和接头的裂解,从而在DNA模板上产生谷胱甘肽。已知 谷胱甘肽与谷胱甘肽S-转移酶(GST)特异结合并且具有高亲和性,并 通常用于GST-融合蛋白(Amersham Pharmacia Biotech)的纯化。还已 知能通过硫原子将谷胱甘肽固定化而不干扰与GST的结合。结果,通 过相对于作为靶分子的GST进行筛选,有可能从库中其他展示分子中 富集模板展示的谷胱甘肽。GST可以如文献所述以重组方式制备(例 如Jemth等(1997)Arch.Biochem.Biophys.348:247-54)或者从 各供应商处获得(例如Sigma,product#,G5524)。或者,抗谷胱甘 肽抗体(例如Abcam,产品名ab64447或Virogen,product#101-A) 可以用作靶分子。

模板介导的谷胱甘肽的形成

4℃下在TBS缓冲液(50mM Tris-HCl,pH7.5,150mM NaCl) 中用大约1μg链霉抗生物素蛋白包被微量滴定板过夜。去除链霉抗生 物素蛋白溶液,并且用TBS缓冲液将孔洗涤至少六次。37℃下用 TBS缓冲液中2%BSA(可以使用的封闭剂的其他例子是酪蛋白,明胶, 聚乙烯吡咯烷酮或者干燥脱脂奶)将孔封闭大约30分钟。用TBS缓冲 液将板洗涤至少三次。向孔中加入0.1μg生物素化GST,并且在20 ℃下温育大约30分钟。通过用TBS缓冲液洗涤至少六次去除没有 结合的生物素化GST。根据文献所述(例如Ellis等(1998)Biochem. J.335;277-284),使用磺基-NHS-LC-生物素进行GST的生物素化。 用1mM生物素将游离链霉抗生物素蛋白分子封闭5分钟,并且通过用 TBS缓冲液洗涤至少六次去除过量的生物素。然后向孔中加入模控分 子库,并且通过在20℃下温育大约1小时使之与固定化GST结合。 为了去除没有与固定化GST结合的模控分子,用TBS缓冲液洗涤孔至 少六次。通过与20mM还原的谷胱甘肽温育大约10-60分钟洗脱出与 GST结合的模控分子,然后将样品从孔中转移到新的试管。

利用标准PCR方法(例如5pmol的各种引物,0.2mM的dNTP,2 mM MgCl2,和2.5U热稳定Taq聚合酶),使用两种扩增引物(正向,5’ 生物素-GCT ACT GGC ATC GGT-3’;反向,5’-GTA ATT GGA GTG AGC-3’),扩增洗脱的(选择的)模板。进行PCR,开始在94℃变性 5分钟,之后94℃变性30秒、50℃退火30秒、72℃延伸30 秒共35个循环,最后在72℃延伸10分钟。使用正向引物中5’生 物素去除有义链。这通过使PCR产物与链霉抗生物素蛋白-包被的磁珠 (Dynabeads;Dynal Biotech,Norway)温育来进行,并且根据供应商 所述纯化单链模板。纯化的反义链最终作为模板引物和如上所述的延 伸引物一起用于产生进行另一轮筛选的模控分子富集库。

反复进行筛选和扩增步骤,直到获得适当的富集。富集之后可以 对回收的模板序列进行表征(测序)。使用标准测序步骤和DNA测序仪 (例如MegaBase,Amersham Pharmacia Biotech)获得模板的核苷酸 序列。当筛选步骤之后库中编码谷胱甘肽的序列(模板引物的D-D-D 区中C-A-T或T-A-C)数目相对其他序列有所增加时就获得富集。

该方法描述了三种不同的单核苷酸衍生物的掺入。但是,在如上所 述的模控分子库构建中可以使用所有的单核苷酸(包括dGTP)。还有, 这将不同的核苷酸衍生物的数目限制到4,这样将库大小的边界定为 4N(其中N是模控分子中亚单元的数目)。但是,为了将库的大小增大 至16N,人们可以使用例如二核苷酸衍生物作为结构单元。先前有人 描述过通过聚合酶掺入二-核苷酸(WO01/16366A2)。利用三-核苷酸 或四-核苷酸掺入可以进一步提高库的多样性。

实施例84-99:用于寡核苷酸结构单元合成的中间体化合物的 制备

一般实验方法

方法1.氨基酸的N-三氟乙酰基保护的一般方法

0℃下向搅拌的氨基酸(20mmol)的CF3COOH(10mL)溶液缓 慢加入(CF3CO)2O(24mmol)。让反应混合物缓慢温热至室温并且搅拌 过夜。将反应混合物蒸发至干。固体性质的粗产物从EtOAc/庚烷重结 晶。通过急骤柱色谱法纯化液体性质的粗产物(CH2Cl2/MeOH=10∶1或 EtOAc/庚烷=2∶1)。产率一般高于85%。

方法2.氨基酸的N-苄基氧基羰基和N-乙烯基氧基羰基保护的一 般方法

向氨基酸(7.6mmol)在饱和的NaHCO3(10mL)中的搅拌的溶液或 轻微悬浮液中加入2M NaOH(水溶液,3mL)之后加入氯甲酸苄酯或 氯甲酸乙烯基酯(vinyloxychloroformate)(8.4mmol)的CH3CN(10mL) 溶液。室温下将反应混合物搅拌过夜。当TLC表明完全转化之后,向 反应混合物加入H2O(90mL)并且使用2M NaOH(水溶液)将pH调节 至10。反应混合物用Et2O(3×50mL)洗涤并且使用1M HCl(水溶 液)将pH调节至2-3,然后用Et2O或CH2Cl2(3×100mL)提取。将合 并的提取液干燥(MgSO4),过滤并且蒸发至干,得到固体产物,其不用 进一步纯化即使用。产率一般高于70%。

方法3.氨基酸的N-叔丁氧羰基保护的一般方法

向氨基酸(15mmol)在水(5mL)和二噁烷(5mL)中的微悬浮液加 入2M NaOH(水溶液,6mL)。将混合物冷却并且在0℃(冰浴)下搅拌, 加入二碳酸二叔丁酯。再加入2M NaOH(4mL)水溶液。将混合物缓 慢加热至RT(超过5小时),在RT下搅拌过夜。向反应混合物加入二 乙醚(20mL),使用2M HCl(水溶液)调节pH(自~10至~3)。 使用二乙基醚(3×20mL)萃取水相。将合并的萃取液干燥(MgSO4),过 滤并且蒸发至干,得到白色固体产物,其不用进一步纯化即使用。产 率一般是60-75%。

方法4.N-保护的氨基酸的NHM酯的生成的一般方法

0℃下N2下向搅拌的N-保护的氨基酸(0.5mmol)和N-羟基马来 酰亚胺(0.62mmol)的无水THF(5mL)溶液加入二异丙基碳二亚胺 (DIC)(0.64mmol),并且使溶液温度缓慢升至RT并且搅拌过夜。将反 应混合物过滤并且用小体积的EtOAc/庚烷=2/1洗涤沉淀物。蒸发滤液 几乎至干,用最少量CH2Cl2稀释并且进行急骤柱色谱(EtOAc/庚烷 =2/1),得到白色固体产物,一般是60-70%。

方法5.从羧酸酰氯形成NHM酯的一般方法

0℃下向搅拌的N-羟基马来酰亚胺(4mmol)的CH2Cl2(16mL)溶 液缓慢加入羧酸酰氯(4mmol)。使反应混合物缓慢升至RT并且搅拌过 夜。用CH2Cl2(16mL)稀释反应混合物并且用10%柠檬酸(水溶液,3× 25mL),饱和NaHCO3(水溶液,2×25mL)和饱和NaCl(水溶液,1×25 mL)洗涤。将有机相干燥(MgSO4),过滤,并且蒸发至干,得到蜡状或液 体产物,产率40-60%。该产物不需要进一步纯化即使用。

方法6.硫醇的S-三苯甲基化一般方法

RT下向硫醇(20mmol)和吡啶(40mmol)的CH2Cl2(75mL)溶液 加入三苯甲基氯(22mmol)并且将反应搅拌过夜。将反应混合物体积最 小化后进行急骤层析(在柱填充之前用吡啶预处理SiO2)(洗脱液: CH2Cl2/MeOH=10/0.5)。分离产物,是油状物,或者在某些情况下是粘 性蜡状物。

方法7.4-羟基苯甲醛的O-酰化的一般方法

0℃下向搅拌的羟基苯甲醛(20mmol)的无水DMF(10mL)溶液 缓慢加入酰基氯(25mmol)的二乙醚(20mL)溶液。反应混合物在0℃ 下搅拌15分钟,在室温下搅拌1小时。加入水(20ml),并且用乙醚 (3×10mL)萃取反应混合物。合并的有机相用水(2×10mL)洗涤,用MgSO4干燥并且真空去除溶剂。粗产物再次溶解于二氯甲烷(5mL)并且通过 二氧化硅垫过滤。真空去除溶剂。产率一般高于75%。

方法8.二氨基聚乙二醇生成的一般方法

将根据Baker等,J.Org.Chem.(1999),64,6870-6873所述 获得的相应的聚乙二醇-二醇(0.8mmol)溶解于无水THF(10mL)。加 入甲苯磺酰氯(2.44mmol)并且在冰上冷却反应混合物。滴加溶解于 水(2mL)的NaOH(5.5mmol),室温下搅拌反应混合物o/n。反应混 合物用二乙醚(3×5mL)萃取,合并的有机相用NaCl(饱和,3×3mL) 洗涤并且用MgSO4干燥。粗产物再次溶解于无水乙腈(3mL),并且用 NaN3(2.8mmol)处理。将反应混合物加热至75℃o/n。滤出白色固 体并且用乙腈萃取(2×2mL)。向合并的有机相加入三苯基膦(2.8 mmol)和水(2mL),搅拌反应混合物o/n。加入IRA-120 H+(1g)并 且将反应混合物搅拌1小时。滤出小球,用二氯甲烷(10×3mL)洗涤并 且用6M HCl(水溶液,10×3mL)洗脱最终化合物。真空蒸发溶液,得 到二氨基聚乙二醇,产率40-50%。

实施例84:3-苯基-3-叔丁氧羰基氨基-丙酸2,5-二氧代-2,5-二 氢-吡咯-1-基酯(XVI)的制备

                    化合物XVI

利用方法3接着利用方法4,从商业上可得的DL-3-氨基-3-苯基 丙酸两步制备化合物。

1H-NMR(CDCl3):7.28-7.42(m,5H(ar));6.74(s,2H);5.1-5.3 (m,2H(NH+CH));3.24(dd,1H);3.13(dd,1H);1.46(s,9H)。

实施例85:3-叔丁氧羰基氨基-丁酸2,5-二氧代-2,5-二氢-吡咯 -1-基酯的制备

                     化合物XVII

通过方法3接着通过方法4,从商业上可得的DL-3-氨基丁酸两步 制备化合物。

1H-NMR(CDCl3):6.80(s,2H);4.83(brs,1H(NH)),4.05-4.15 (m,1H);2.8-2.95(m,2H);1.46(s,9H);2.56(d,3H)。

实施例86:3-叔丁氧羰基氨基-丙酸2,5-二氧代-2,5-二氢-吡咯 -1-基酯的制备

                     化合物XVIII

通过方法3接着通过方法4,从商业上可得的β-丙氨酸两步制备 化合物。

1H-NMR(CDCl3):6.80(s,2H);5.09(brs,1H(NH));3.48-3.54 (m,2H);2.84(t,2H);1.45(s,9H)。

实施例87:3-苄氧羰基氨基-3-苯基-丙酸2,5-二氧代-2,5-二氢 -吡咯-1-基酯的制备

                     化合物XIX

通过方法2接着通过方法4,从商业上可得的DL-3-氨基-3-苯基 丙酸两步制备化合物。

1H-NMR(CDCl3):7.55-7.20(m,10H);6.75(s,2H);5.55(br., 1H);5.35-5.25(m,1H);5.15(s,2H);3.35-3.10(m,2H)。

实施例88:3-苯基-3-乙烯基氧羰基氨基-丙酸2,5-二氧代-2,5- 二氢-吡咯-1-基酯的制备

                         化合物XX

通过利用方法2接着通过方法4,从商业上可得的DL-3-氨基-3- 苯基丙酸两步制备化合物。

1H-NMR(CDCl3):7.45-7.30(m,5H);7.20(dd,1H);6.75(s, 2H);5.75-5.60(br.,1H);5.30(q,1H);4.70(d,1H);4.50(d, 1H);3.30-3.15(m,2H)。

实施例89:三苯甲基硫基-乙酸2,5-二氧代-2,5-二氢-吡咯-1-基 酯的制备

                         化合物XXI

通过利用方法6接着通过方法4,从商业上可得的2-巯基乙酸两 步制备化合物。

1H-NMR(CDCl3):7.45-7.20(m,15H);6.75(s,2H);3.20(s, 2H)。

实施例90:(R)-2-(2,2,2-三氟-乙酰基氨基)-3-三苯甲基硫基丙 酸2,5-二氧代-2,5-二氢-吡咯-1-基酯(XXII)的制备

                       化合物XXII

利用方法1接着通过方法6和方法4,从商业上可得的L-半胱氨 酸三步制备化合物。

实施例91:乙酸2,5-二氧代-2,5-二氢-吡咯-1-基酯的制备

                       化合物XXIII

通过利用方法5,从商业上可得的乙酰氯和N-羟基马来酰亚胺一 步制备化合物。

1H-NMR(CDCl3):6.75(s,2H);2.35(s,3H)。

实施例92:丙酸2,5-二氧代-2,5-二氢-吡咯-1-基酯的制备

                       化合物XXIV

通过利用方法5,从商业上可得的丙酰氯和N-羟基马来酰亚胺一 步制备化合物。

1H-NMR(CDCl3):6.75(s,2H);2.65(q,2H);1.80(t,3H)。

实施例93:丁酸2,5-二氧代-2,5-二氢-吡咯-1-基酯的制备

                       化合物XXV

通过利用方法5,从商业上可得的丁酰氯和N-羟基马来酰亚胺一 步制备化合物。

1H-NMR(CDCl3):6.75(s,2H);2.60(t,2H);1.80(sxt,2H); 1.05(t,3H)。

实施例94:S-三苯甲基-4-巯基苯甲酸2,5-二氧代-2,5-二氢-吡 咯-1-基酯的制备

                       化合物XXVI

根据方法6进行S-三苯甲基化接着根据方法4进行酯化作用,从 商业上可获得的4-巯基苯甲酸两步制备化合物。

1H-NMR(CDCl3):8.75(d,J=8.8Hz,2H),7.45-7.20(m,15H), 7.05(d,J=8.8Hz,2H),6.80(s,2H)。

实施例95:四(氨基甲基)甲烷四盐酸盐的制备

                     化合物XXVII

通过与Fleischer等,J.Org.Chem.(1971),36,3042-44相 比较稍作改变的方法制备四(氨基甲基)甲烷四盐酸盐。

季戊四醇(2.01g;14.76mmol)与甲苯磺酰氯(14.07g;73.81 mol)在无水吡啶(50mL)中混合。搅拌混合物o/n。将粗反应混合物移 到水(100mL)中。加入MeOH(200mL)和浓HCl(80mL),滤出白色 沉淀并且用水(100mL)和MeOH(200mL)洗涤。LC-MS证明四甲苯磺 酸季戊四醇酯。四甲苯磺酸季戊四醇酯(4.0g,5.31mmol)溶解于无 水DMF(50mL)并且加入NaN3(3.45g;53.1mmol)。将反应混合物 加热至100℃ o/n。加入水(100mL),用二乙醚(3×100mL)萃取反 应混合物。加入THF(300mL)并且真空去除二乙基醚。向THF溶液 加入三苯基膦(6.95g,26.5mmol)和浓NH3(25mL),室温下搅拌 反应混合物o/n。真空去除溶剂,再次溶解于二氯甲烷(500mL)并且用 2M HCL(2×150mL)萃取。用二氯甲烷(3×100mL)洗涤水相并且真空 蒸发。加入MeOH(20mL),滤出白色固体并且用MeOH(2×10mL)洗 涤。产率1.12g(76%)。

1H-NMR(D2O):3.28(s)。

实施例96:丙酸4-甲酰基-苯酯的制备

                    化合物XXVIII

使用商业上购得的4-羟基苯甲醛,根据方法7制备化合物。

1H-NMR(CDCl3):10.00(s,1H),7.90(d,J=6.7Hz,2H),7.31 (d,J=6.7Hz,2H),2.65(q,J=7.6Hz,2H),1.32(d,J=7.5 Hz,3H)。

实施例97:丁酸4-甲酰基-苯酯的制备

                       化合物XXIX

使用商业上购得的4-羟基苯甲醛,根据方法7制备化合物。

1H-NMR(CDCl3):9.95(s,1H),7.94(d,J=6.7Hz,2H),7.28 (d,J=6.7Hz,2H),2.55(t,J=7.6Hz,2H),1.80(q,J=7.6 Hz,2H),1.00(d,J=7.5Hz,3H)。

实施例98:3,6,9,12,15,18,21,24,27,30,33-十一氧杂三十五 烷-1,35-二胺的制备

                     化合物XXX

根据方法8制备,产率48%。MS-H+=545.2(预期的MS-H+= 544.6)。

实施例99:3,6,9,12,15,18,21,24,27,30,33,36,39-十三氧杂四 十一烷-1,41-二胺的制备

                       化合物XXXI

(05028)根据方法8制备,产率40%。MS-H+=633.3(预期的MS-H+ =632.8)。

实施例100:带有拉链盒的寡核苷酸接头的设计和试验。

为了测验拉链盒的不同设计的效率进行实验100-1至100-4。下面 即是获得的数据,之后为对数据的讨论。

材料

缓冲液

缓冲液A(100mM Hepes pH=7.5,1M NaCl)

缓冲液B:(100mM NaPO4 pH=6,1M NaCl)

缓冲液C:(100mM硼酸钠pH=9,1M NaCl)

缓冲液D:(100mM硼酸钠pH=10,1M NaCl)

缓冲液E:(500mM NaPO4 pH=7,1M NaCl)

缓冲液F:(500mM NaPO4 pH=8,1M NaCl)

DNA寡核苷酸的退火

在相应缓冲液中混合寡聚体并且在80℃下加热,然后冷却至 28℃(-2℃/30sek)。

用32 P进行5’-标记

混合200pmol寡核苷酸,2μl 10x磷酸化作用缓冲液(Promega cat#4103),1μl T4多核苷酸激酶(Promega cat#4103),1μlγ-32P ATP,H2O(加至20μl)。37℃下保温10-30分钟。

PAGE(聚丙烯酰胺凝胶电泳)。

样品与甲酰胺染料1∶1(98%甲酰胺,10mM EDTA,pH8,0.025 %二甲苯腈蓝,0.025%溴酚蓝)混合,80℃下保温2分钟,进行变 性10%聚丙烯酰胺凝胶电泳。使用放射自显影法(Kodak,BioMax胶 片)使凝胶显影。

寡核苷酸构件

AH36:5’-

CGACCTCTGGATTGCATCGGTCATGGCTGACTGTCCGTCGAATGT GTCCAGTTACX

AH37:5’-

Z GTAACTGGACTGTAAGCTGCCTGTCAGTCGGTACTGACCTGTCGAGCATCCAGCT

AH51:5’-

Z GTAACACCTGTGTAAGCTGCCTGTCAGTCGGTACTGACCTGTCGAGCATCCAGCT

AH38:5’-AGCTGGATGCTCGACAGGTCCCGATGCAATCCAGAGGTCG

AH67:5’-   ZCATTGACCTGTGTAAGCTGCCTGTCAGTCGGTACTGACCTGTCGAG-

CATCCAGCT

AH69:5’- AGZAACACCTGTGTAAGCTGCCTGTCAGTCGGTACTGACCTGTCGAG-

CATCCAGCT

AH66:5’-

ZTT GTAACTGGACTGTAAGCTGCCTGTCAGTCGGTACTGACCTGTCGAGCATCCAGCT

AH65:5’-

CGACCTCTGGATTGCATCGGTCATGGCTGACTGTCCGTCGAATGT GTCCAGTTACTTX

拉链盒序列是下划线的。

实验100-1(图56):

混合2μl缓冲液B,5μl Ah36(0.4pmol/ul),1μl Ah37(2 pmol/ul),1μl Ah38(2pmol/ul),1μl H2O。

混合2μl缓冲液B,5μl Ah36(0.4pmol/ul),1μl Ah37(2 pmol/ul),2μl H2O。

通过加热至80℃,然后冷却至44℃退火(-2℃/30sek)。

加入1μl 100mM NHS和1μl 1M EDC。在指定温度下(见下文) 温育45分钟,然后加入2μl缓冲液D。温育大约2小时,然后用 10%尿素聚丙烯酰胺凝胶电泳进行分析。

温育温度:

45℃,48.2℃,53.0℃,58.5℃,63.1℃,65.6℃

实验100-2(图57,A和B):

混合2μl缓冲液B,1μl Ah36(2pmol/μl),1μl Ah51(2 pmol/μl),1μl Ah38(2pmol/μl),5μl H2O。

混合2μl缓冲液B,1μl Ah36(2pmol/μl),1μl Ah51(2 pmol/μl),6μl H2O。

(对于温度1-6)通过加热至80℃,然后冷却至35℃ (-2℃/30sek)来退火,或者(对于温度7-12)通过加热至80℃, 然后冷却至15℃(-2℃/30sek)来退火。

加入1μl 100mM NHS和1μl 1M EDC。在指定温度下(见下文), 温育1小时,然后加入2μl缓冲液D。温育1小时,然后如上所述,用 10%尿素聚丙烯酰胺凝胶电泳进行分析。

温育温度:

1)34.9℃,2)36.3℃,3)40.3℃,4)45.7℃,5)51.0℃, 6)55.77,7)14.9℃,8)17.8℃,9)22.7℃,10)28.3℃,11) 31.0℃,12)36℃

混合2μl缓冲液B,0.5μl Ah36(2pmol/μl),1μl Ah51(2 pmol/μl),1μl Ah38(2pmol/μl),5.5μl H2O,

混合2μl缓冲液B,0.5μl Ah36(2pmol/μl),1μl Ah51(2 pmol/μl),6.5μl H2O,

通过在80℃下加热然后冷却至5℃(-2℃/30sek)退火。

加入1μl 100mM NHS和1μl 1M EDC。在不同温度下(见下文) 温育1小时,然后加入2μl缓冲液D。温育1小时,然后用10%尿素聚 丙烯酰胺凝胶电泳进行分析。

温育温度:

1)5.9℃,2)9.9℃,3)12.6℃,4)18.3℃,5)23.3℃, 6)27.9℃7)35.6℃,8)45.9℃

实验100-3(图58,A和B).

混合2μl缓冲液A,1μl相应寡聚体1(2pmol/μl),1μl 相应寡聚体2(10pmol/μl),1μl相应寡聚体3(10pmol/μl),5μl H2O(参见下面的表)。如上所述退火。

加入1μl 100mM NHS和1μl 1M EDC。在不同温度下温育1)7.7℃, 2)15.4℃,3)21.0℃4)26.2℃,温育大约2小时,和5)10℃ 温育1秒,然后35℃温育1秒——重复99次。用10%尿素聚丙烯 酰胺凝胶电泳进行分析。  实验 寡聚体1(32P) 寡聚体2 寡聚体3  100-3-1  Ah36  没有  Ah38  100-3-2  Ah36  没有  没有  100-3-3  Ah36  Ah51  Ah38  100-3-4  Ah36  Ah51  没有  100-3-5  Ah36  Ah67  Ah38  100-3-6  Ah36  Ah67  没有  100-3-7  Ah36  Ah69  Ah38  100-3-8  Ah36  Ah69  没有

实验100-4(图59).

混合2.5μl缓冲液A,1μl相应寡聚体1(2pmol/μl),1μl相 应寡聚体2(10pmol/μl),1μl相应寡聚体3(10pmol/μl),4.5μl H2O(见下表)。通过加热至80℃然后冷却到30℃或55℃退火。 加入1μl 100mM NHS和1μl 1M EDC。在30℃或55℃下温育。 然后用10%尿素聚丙烯酰胺凝胶电泳进行分析。  实验  寡聚体1(32P-标记) 寡聚体2 寡聚体3  100-4-1  Ah36  Ah37  Ah38  100-4-2  Ah36  Ah37  没有  100-4-3  Ah65  Ah66  Ah38  100-4-4  Ah65  Ah66  没有  100-4-5  Ah36  Ah66  Ah38  100-4-6  Ah36  Ah66  没有  100-4-7  Ah65  Ah37  Ah38  100-4-8  Ah65  Ah37  没有

结果的讨论

检验了使用带有反应基团(胺或羧酸)(其中接头连接反应基团 并且退火区大约25个核苷酸)的寡聚体的交联效率。

在实验中使用寡核苷酸Ah36(带有羧酸)和Ah67(带有胺)。使 用的模板(Ah38)与两个寡核苷酸退火,使这两个寡核苷酸紧邻,即零 碱基对间隔。实验条件下,观察到小于5%的交联效率,而且只是在最 高的试验温度下(图58,A和B,5道)。

为了提高交联效率,我们分别在寡聚体Ah67和Ah36的5’-和 3’-端引入,即带有反应基团的相同的末端称之为拉链盒的序列。拉 链盒是互补序列,因此可以使两个寡聚体的反应基团更密切接近。试验 了两个不同长度的拉链盒,称作10’mer拉链盒(Ah37/Ah36,形成10 个碱基对的DNA双螺旋)和5’mer拉链盒(Ah36/51,形成5个碱基对 的DNA双螺旋)。参见下图

此外,试验了不同设计的拉链盒,例如其中反应基团与拉链盒紧 邻结合(Ah36,Ah37和Ah36/Ah51),或者位于拉链盒上游的两个核苷 酸处(Ah65/Ah66),或者位于拉链盒中间(Ah67)的寡聚体。

我们首先检验了5’mer拉链盒对交联效率的影响。如所见到的, 5’mer拉链盒大大提高了交联效率(图58,A和B,比较3道和5道)。 注意在所有的试验温度下交联绝对需要模板。当温度在10℃和35℃ 之间上下进行99次循环时获得最高交联效率(图58B)。当温度在21℃ 或26℃保持恒定时也获得高效率(图58A和B,3道)。在高于26℃ 的温度下交联效率不再提高(图57,A和B)。

我们接着测试了10’mer拉链盒形式中的交联效率。寡聚体Ah36 和Ah37退火到模板Ah38上,在不同的温度下检查交联效率。没有模 板情况下发现令人惊奇的高度交联(图55,45℃和48.2℃)。但是, 高于58.5℃的温度下,不存在模板下没有发现交联。

接着,试验反应基团相对于拉链盒的不同位置。如图58,A和B,7 道所示,当两个反应基团中的一个位于拉链盒中间时(即,反应基团连 接在参与DNA双螺旋形成的核苷酸上;Ah67),大大降低交联效率。

对10’mer拉链盒也分析了反应基团相对于拉链盒的位置。在这 种情况下,当由两个核苷酸将两个反应基团与拉链盒分开(Ah65, Ah66)时,交联效率稍微有所降低(图59,比较1道和3道)。当分析 Ah65,Ah66,Ah36和Ah37的不同组合时(即,当反应基团紧邻拉链盒 或者位于拉链盒上游两个核苷酸处时),交联效率变化不大。注意在 10’mer拉链盒情况下在所有的温度下不是绝对需要模板。在较低温 度下这种模板-独立性特别显著(例如,图59,30℃)。

实施例101-104:寡核苷酸结构单元制备的一般方法

实施例101:包括羧酸的寡核苷酸转化为氨基或氨基甲基封端的 接头的步骤

应用常规亚磷酰胺方法合成包含带有羧酸部分的修饰的核酸碱基 的下面寡核物:

A:5’-GCT ACT GGC XTC GGT

B:5’-TCA CTX GCA GAC AGC

C:5’-CGA CCT CTG GAT TGC ATC GGT CAT GGC TGA CTG TCC GTC GAA

TGT G TC CAG TTA CX

D:5’-CTG GTA ACG CGG ATC GAC CTT CAT GGC TGA CTG TCC GTC GAA

TGT G TC CAG TTA CX

E:5’-ACG ACT ACG TTC AGG CAA GAT CAT GGC TGA CTG TCC GTC GAA

TGT G TC CAG TTA CX

使用商业上可得的羧基-dT亚磷酰胺(10-1035-90,来自Glen research)掺入X。下划线处核酸碱基代表拉链区。

转化示意图

寡聚体(20pmol)与二氨基化合物(20μl的0.1M溶液),磷酸钠 缓冲液(15μl的100mM溶液,pH=6),NHS(5μl的100mM溶液)和 EDC(5μl新鲜制备的1M溶液)混合。混合物在30℃下放置45分 钟并且用硼酸钠处理(20μl的100mM溶液,pH=10)并且在30℃下 又放置45分钟。通过常规EtOH沉淀法纯化寡聚体。用32P末端标记 产物并且通过PAGE分析纯度。在所有的情况下没有检测到起始寡聚 体,而出现一个新的带,它在凝胶上迁移较慢。

使用的二氨基化合物的例子:XXX,XXXI和商业上可得的N,N’- 二甲基乙二胺(D15,780-5,购自Sigma-Aldrich)。

实施例102:包含羧酸的寡核苷酸转化为三胺支架结构单元的方 法

应用常规亚磷酰胺方法合成包含带有羧酸部分的修饰的核酸碱基 的下面寡核苷酸:

F:5’-GAC CTG TCG AGC ATC CAG CTG TCC A CA ATG X

G:5’-GAC CTG TCG AGC ATC CAG CTT CAT GGG AAT TCC TCG TCC A CA

ATG X

H:5’-GAC CTG TCG AGC ATC CAG CTT CAT GGG AAT TCC TCG TCC A CA

ATG XT

I:5’-X GT AAC TGG AGG GTA AGC TCA TCC GAA TTC GGT ACT GAC CTG TCG

AGC ATC CAG CT

使用商业上可得的羧基-dT亚磷酰胺(10-1035-90,来自Glen research)掺入X。下划线处核酸碱基代表拉链区。

反应示意图:

含有一个带羧酸部分的修饰的核酸碱基的寡聚体(1nmol)与水 (100μL),hepes缓冲液(40μL,200mM,pH=7.5),NHS(20μL的 100mM溶液),EDC(20μL新鲜制备的1M溶液)和四胺(XXVII)(20 μL的100mM溶液)混合。反应混合物在室温下放置o/n。通过真空 蒸发将体积减少至60μL。通过加入浓NH3(20μL)接着HPLC纯化, 获得纯寡聚体。利用下面的梯度能在大约6分钟之后分离一个峰:0-3 分钟100%A之后3-10分钟15%A和85%B之后10-15分钟100%B 之后15-20分钟100%A。A=2%乙腈的10mM TEAA溶液和B=80%乙 腈的10mM TEAA溶液。

HPLC纯化之后用32P末端标记2-3pmol并且通过PAGE凝胶分析 纯度(参见图60)。PAGE凝胶表明四胺(XXVI)与含有带羧酸部分的修饰 的核酸碱基的寡聚体连接。

1道:参照寡聚体F。

2道:HPLC纯化的寡聚体F的三胺产物。

3道:参照寡聚体G。

4道:HPLC纯化的寡聚体G的三胺产物。

5道:参照寡聚体H。

6道:HPLC纯化的寡聚体H的三胺产物。

实施例103:功能实体与巯基寡聚体(thio oligo)连接的一般步 骤

利用常规亚磷酰胺途径合成带有S-三苯基甲基保护的巯基部分的 包含修饰的核酸碱基的下面的寡聚体:

J:5’-W CA TTG ACC TGT GTA AGC BTG CCT GTC AGT CGG TAC TCG ACC

TCT GGA TTG CAT CGG

K:5’-WC A TTG ACC TGT CTG CCB TGT CAG TCG GTA CTG TGG TAA CGC

GGA TCG ACC T

L:5’-W CA TTG ACC TGA ACC ATG BTA AGC TGC CTG TCA GTC GGT ACT

ACG ACT ACG TTC AGG CAA GA

M:5’-W CA TTG ACC TGA ACC ATG TBA AGC TGC CTG TCA GTC GGT ACT

TCA AGG ATC CAC GTG ACC AG

使用商业上可购得的硫醇修饰剂(thiol modifier)亚磷酰胺(购 自Glen research的10-1926-90)掺入W。B是使用商业上可购得的 亚磷酰胺(购自Glen research的10-1953-95)掺入的内部生物素。 下划线和斜体核酸碱基指示拉链区。

将S-三苯基甲基保护的巯基寡聚体(10nmol)真空蒸发并且再次 悬浮于TEAA缓冲液(200μL的0.1M溶液,pH=6.4)。加入AgNO3(30 μL的1M溶液),并且混合物在室温下反应1-2小时。加入DTT(46 μL的1M溶液)并且反应5-10分钟。将反应混合物离心(20.000G离 心20分钟)并且收集上清液。用另外的TEAA缓冲液(100μL的0.1M 溶液,pH=6.4)提取固体。通过常规EtOH-沉淀法获得纯化的巯基寡 聚体。

反应示意图:

将巯基寡聚体(1nmol)真空干燥并且用带有功能实体的结构单元 (05087)的二甲基甲酰胺(50μl的0.1M溶液)溶液处理并且室温下 反应o/n。将巯基寡聚体离心(20.000G离心10分钟)并且取出上清 液。加入二甲基甲酰胺(1mL)并且将加载的巯基寡聚体离心(20.000G 离心10分钟)。去除二甲基甲酰胺并且将加载的巯基寡聚体再次悬浮 于TEAA缓冲液(25μL的0.1M溶液,pH=6.4)并且通过HPLC分析。

使用的结构单元的例子:XXVI,XVI,XVII,XVIII,XXIII,XXIV, XXV。

实施例104:功能实体与带氨基或氨基甲基末端的寡聚体连接的 一般步骤

利用常规亚磷酰胺途径合成包含修饰的带有氨基的核酸碱基的下 面的寡聚体:

N:5’-ZGT AAC ACC TGT GTA AGC TGC CTG TCA GTC GGT ACT GAC CTG

TCG AGC ATC CAG CT

使用商业上可购得的氨基修饰剂(amino-modifier)C6 dT亚磷酰 胺(购自Glen research的10-1926-90)掺入包含带有氨基的修饰的 核酸碱基的Z。

此外,如上文所述将寡聚体C-E转化成相应的带氨基甲基末端的 寡聚体。

在下面示意图中表示的实验中使用寡聚体:

氨基或氨基甲基寡聚体(3pmol)与磷酸盐缓冲液(3μL的0.1M溶 液,pH=6)和NaBH3CN(3μL的1M MeOH溶液)混合。加入具有功能 实体的结构单元(3μL的1M MeOH溶液),混合物在室温下反应o/n。 通过PAGE凝胶分析产物生成(参见图61)。

使用的结构单元的例子:XXVIII,XXIX,和商业上可获得的4-乙 酰氧基苯甲醛(购自Sigma-Aldrich的24,260-8)。

图60给出包含带有氨基的修饰的核酸碱基的寡聚体(化合物XXIV) 加载的PAGE分析。

1道显示参照氨基寡聚体(N)。

2道显示包含功能实体的结构单元加载之后的氨基寡聚体(N)。

3道显示2道中连接的功能实体通过用pH=11处理1小时的去除。

实施例105:有机化合物的模控合成的一般步骤,其中支架和取代 基由模板编码:

在hepes-缓冲液(20μL的100mM HEPES和1M NaCl溶液,pH=7.5) 和水(加至100μL的终体积)中模板寡聚体(1nmol)与带有功能实体 (XXIII或XVII,分别是1nmol)的疏基寡聚体(L或M)和氨基寡聚体O 混合。通过加热至50℃之后冷却到(-2℃/30秒)30℃使寡聚 体与模板退火。以波动温度(10℃反应1秒之后35℃反应1秒) 让混合物反应o/n。通过加入链霉抗生物素蛋白小珠(100μL,用2×1 mL 100mM hepes缓冲液和1M NaCl,pH=7.5预先洗涤)使寡聚体复 合体与链霉抗生物素蛋白结合。用hepes缓冲液(1mL)洗涤小珠。通过 加入水(200μL)接着加热至70℃1分钟从链霉抗生物素蛋白结合 复合体分离氨基寡聚体。移出水并且真空蒸发,再次悬浮于TEAA缓 冲液(45μL的0.1M溶液)并且通过HPLC分析产物生成(参见图 62)。

图62说明功能实体转移到包含带有氨基的修饰的核酸碱基的寡 聚体上。

A)上色谱图显示参照氨基寡聚体O:5’-GAC CTG TCG AGC ATC CAG CTT CAT GGC TGA GTC CAC AAT GZ。Z包含带有氨基的修饰的核酸碱 基,其使用商业上可获得的氨基修饰剂C6 dT亚磷酰胺(购自Glen research的10-1039-90)掺入。

B)中间色谱图说明部分转移功能实体(XXIII)之后链霉抗生物素 蛋白纯化的氨基寡聚体O。

C)下面色谱图说明完全转移亲脂性更强的功能实体(XVII)之后 链霉抗生物素蛋白纯化的氨基寡聚体O。使用下面的梯度:0-3分钟 100%A之后3-10分钟15%A和85%B。

没有模板寡聚体的实验表明没有非模控产物生成。结果表明模控 合成的效率是80-100%。效率小于100%的原因可能是功能实体的水解 裂解。

实施例106:基于支架的分子(scaffolded molecule)的模控合 成的一般步骤,其中支架和两个相同的取代基由模板编码

在hepes-缓冲液(20μL的100mM HEPES和1M NaCl溶液,pH=7.5) 和水(加至100μL的终体积)中模板寡聚体(1nmol)与带有相同功能 实体(XXVI,1nmol)的两种疏基寡聚体(K和L)和三胺寡聚体H(1nmol) 混合。通过加热至50℃并且冷却到(-2℃/30秒)30℃使寡聚 体与模板退火。以波动温度(10℃反应1秒之后35℃反应1秒) 让混合物反应o/n。通过加入链霉抗生物素蛋白小球(100μL,用2×1 mL 100mM hepes缓冲液和1M NaCl,pH=7.5预先洗涤)使寡聚体复 合体与链霉抗生物素蛋白连接。用hepes缓冲液(1mL)洗涤小球。通过 加入水(200μL)接着加热至70℃从链霉抗生物素蛋白结合复合体分 离三胺支架寡聚体H。移出水并且真空蒸发,再次悬浮于TEAA缓冲 液(45μL的0.1M溶液)并且通过HPLC分析产物生成(参见图63)。

HPLC色谱图表明两个功能实体转移给带有三个氨基的支架寡聚 体。

A)上色谱图说明参照支架寡聚体G。

B)下色谱图说明部分转移一个(7.94分钟的峰)和两个(10.76分 钟的峰)相同的功能实体(XXVI)之后链霉抗生物素蛋白纯化的支架寡 聚体G。使用下面的梯度:0-3分钟100%A之后3-10分钟15%A和 85%B之后10-15分钟的100%B。A=2%乙腈的10mM TEAA溶液和 B=80%乙腈的10mM TEAA溶液。

由于功能实体的亲脂性,在HPLC色谱图中,观察到与带有一个功能 实体的支架分子相比较带有两个功能实体的支架分子有更长的滞留时 间。带有两个相同的功能实体(XXVI)的基于支架的分子的模控合成效 率大约是25%(图63中10.76分钟峰)。

实施例107:基于支架的分子的模控合成的步骤,其中支架和三 个取代基由模板编码

步骤A(5-mer拉链盒):在hepes-缓冲液(20μL的100mM HEPES 和1M NaCl溶液,pH=7.5)和水(加至100μL的终体积)中模板寡聚 体(1nmol)与带有三种不同功能实体(XVI,XVII和XVIII,分别是 1nmol)的三种疏基寡聚体(J-L)和三胺支架寡聚体H(1nmol)混合。 通过加热至50℃后冷却到(-2℃/30秒)30℃使寡聚体与模板 退火。以波动温度(10℃反应1秒之后35℃反应1秒)让混合物 反应o/n。通过加入链霉抗生物素蛋白小球(100μL,用2×1mL 100mM hepes缓冲液和1M NaCl,pH=7.5预先洗涤)使寡聚体复合体与链霉 抗生物素蛋白连接。用hepes缓冲液(1mL)洗涤小球。通过加入水 (200μL)接着加热至70℃从链霉抗生物素蛋白结合复合体分离三胺 支架寡聚体。移出水并且真空蒸发,再次悬浮于TEAA缓冲液(45μL 的0.1M溶液)并且通过HPLC鉴定编码的分子的生成。

步骤B(9-mer拉链盒):在hepes-缓冲液(6.5μL的100mM HEPES 和1M NaCl溶液,pH=7.5)中,模板寡聚体(15pmol)与三种带有三 种不同的功能实体(XXVII,XXIX和4-乙酰氧基苯甲醛,分别为20 pmol)的甲基氨基寡聚体(C-E)和P32末端标记的三胺支架寡聚体I(15 pmol)混合。将混合物加热至58.5℃并且在58.5℃反应5天。

通过PAGE鉴定编码的分子的生成。

实施例108(模型):3-merβ-氨基酸库的制备描述

A)β-氨基酸结构单元的合成

N-末端保护:根据下述方法使用Nvoc基团1(3,6-二甲氧基-6-硝 基苄基氧羰基)作为光可裂解N-保护基团并且引入到β-氨基酸上:

3-氨基-丁酸(147mg,1.43mmol)与水(10mL),二噁烷(10mL) 和2M NaOH(10mL)混合。将混合物冷却至0℃并且用Nvoc-Cl(1.58 mmol)处理。75分钟之内一小部分一小部分(8×1.25mL)加入2M NaOH。去除冷却浴,反应混合物在室温下放置o/n。加入水(30mL)并 且过滤混合物。使用2M HCl(水溶液)将水相调节至pH=4并且用 二乙醚(3×50mL)萃取。固体溶解于水(50mL)和二乙醚(50mL)。合 并的有机相用MgSO4干燥并且真空蒸发,得到176mg(36%)纯3-(4,5- 二甲氧基-2-硝基-苄基氧羰基氨基)-丁酸。1H-NMR(CDCl3):7.72(s, 1H),7.02(s,1H),5.51(s,2H),5.40-5.30(brs,1H),4.15(m, 1H),3.96(s,3H),3.92(s,3H),2.60(d,2H),1.31(d,3H)。

                            

1Burgess等J.Org.Chem.(1997),62,5165-68,Alvarez等J.Org.Chem.(1999),64,6319-28和Pedersen等 Proc.Natl.Acad.Sci(1998),95,10523-28

β-丙氨酸,顺-2-氨基-1-环己烷羧酸,反-2-氨基-1-环己烷羧酸, 顺-2-氨基-1-环戊烷羧酸,顺-2-氨基-4-环己烯-1-羧酸,反-2-氨 基-4-环己烯-1-羧酸,3-氨基-4,4,4-三氟丁酸,3-氨基-4-甲基戊酸, DL-3-氨基异丁酸一水合物,3-氨基-3-苯基丙酸,2-氟-3-氨基丙酸盐 酸盐类似地被保护。

C-末端活化:举例来说,使用3-(4,5-二甲氧基-2-硝基-苄基氧基 羰基氨基)-3-苯基-丙酸,根据下面的方法使用和制备N-Nvoc保护的 β-氨基酸的NHM(N-羟基马来酰亚胺)酯:

3-(4,5-二甲氧基-2-硝基-苄基氧基羰基氨基)-丁酸(418mg, 1.22mmol)溶解于THF(10mL),加入N-羟基马来酰亚胺(1.22mmol) 并且将混合物冷却至0℃。加入二环己基碳二亚胺(1.22mmol)并且 反应混合物在室温下放置o/n。真空蒸发去除溶剂,通过二氧化硅柱 纯化法使用EtOAc-庚烷(1∶4之后1∶2之后1∶1)作为洗脱剂,分离产 物。纯3-(4,5-二甲氧基-2-硝基-苄基氧基羰基氨基)-丁酸2,5-二氧 代-2,5-二氢-吡咯-1-基酯产率是219mg(42%)。1H-NMR(CDCl3): 7.73(s,1H),7.03(s,1H),6.81(s,2H),5.55(dd,2H), 5.30-5.20(brs,1H),4.25(m,1H),3.98(s,3H),3.97(s,3H), 2.86(m,2H),1.39(d,3H)。

β-丙氨酸,顺-2-氨基-1-环己烷羧酸,反-2-氨基-1-环己烷羧酸, 顺-2-氨基-1-环戊烷羧酸,顺-2-氨基-4-环己烯-1-羧酸,反-2-氨 基-4-环己烯-1-羧酸,3-氨基-4,4,4-三氟丁酸,3-氨基-4-甲基戊酸, DL-3-氨基异丁酸一水合物,3-氨基-3-苯基丙酸,2-氟-3-氨基丙酸盐 酸盐的N-Nvoc保护的类似物类似地被活化。

B)结构单元寡聚体的制备:

用3-(4,5-二甲氧基-2-硝基-苄基氧基羰基氨基)-3-苯基-丙酸 2,5-二氧代-2,5-二氢-吡咯-1-基酯(50μL的0.1M DMF溶液)处理 疏基寡聚体(1nmol)。混合物在室温下放置o/n。将结构单元寡聚 体离心(20,000G离心15分钟)并且去除DMF。加入DMF(1mL),将 结构单元寡聚体离心(20,000G离心15分钟)并且去除DMF。

类似地,在11种不同的疏基寡聚体上加载β-丙氨酸,顺-2-氨基 -1-环己烷羧酸,反-2-氨基-1-环己烷羧酸,顺-2-氨基-1-环戊烷羧 酸,顺-2-氨基-4-环己烯-1-羧酸,反-2-氨基-4-环己烯-1-羧酸,3- 氨基-4,4,4-三氟丁酸,3-氨基-4-甲基戊酸,DL-3-氨基异丁酸一水合 物,DL-β-氨基丁酸,2-氟-3-氨基丙酸盐酸盐的N-Nvoc保护的C-末端 NHM活化的类似物。

下面选择制备的结构单元寡聚体中的任意四种并且用于库的制 备。

C)64个成员(43)的3-merβ-肽库的制备:

结构单元寡聚体的序列如下所示。粗体核苷酸构成互补元件,下 划线处是5-mer拉链盒。FE1-4是连接的功能实体(4种不同的N-Nvoc 保护的β-氨基酸),B是内部生物素。

1)5’-FE1- CAT TGT TTT TTT TTT TBT TTT TTT TTT TGC ATA CAA CTA TGT A

2)5’-FE2- CAT TGT TTT TTT TTT TBT TTT TTT TTT TGC ATA CGG CTA TGT A

3)5’-FE3- CAT TGT TTT TTT TTT TBT TTT TTT TTT TGC ATA CGA CTA TGT A

4)5’-FE4- CAT TGT TTT TTT TTT TTT TTT TTT TTT TGC ATA CAG CTA TGT A

5)3’-FE1- GTA ACT TTT TTT TTT TBT TTT TTT TTT TAT GCG TAA AGC CAT G

6)3’-FE2- GTA ACT TTT TTT TTT TBT TTT TTT TTT TAT GCG TGG AGC CAT G

7)3’-FE3- GTA ACT TTT TTT TTT TBT TTT TTT TTT TAT GCG TGA AGC CAT G

8)3’-FE4- GTA ACT TTT TTT TTT TTT TTT TTT TTT TAT GCG TAG AGC CAT G

由三个编码区构成的64种模板寡聚体(每种2pmol)与四种不同 的结构单元寡聚体(1-4,每种200pmol)和hepes缓冲液(20μL,100 mM hepes缓冲液和1M NaCl,pH=7.5)混合。加入水至1000μL终 体积。通过加热至50℃后冷却至(-2℃/30秒)20℃使寡聚体 与模板退火。用Ar充分脱气,接着用汞灯照射(450W HPLC汞灯, pyrex过滤器,截断值<300nm)1-2小时去除Nvoc-保护基团。以波 动温度(10℃反应1秒之后35℃反应1秒)让混合物反应o/n。

在两个分开的实验中说明库制备中的编码分子形成,每个实验中 只使用一种模板。第一模板(3’-CGT ATG TTG ATA CAT AAT AAC GTA TGT TGA TAC ATA ATA ACG TAT GTT GAT ACA T)编码β-丙氨酸的3-merβ- 肽的生成,另-个模板(3-CGT ATG CCG ATA CAT AAT AAC GTA TGC CGA TAC ATA ATA ACG TAT GCC GAT ACA T)编码3-氨基-4,4,4-三氟丁酸 的3-merβ-肽的生成。

由三个编码区构成的模板寡聚体(2pmol)与四种不同的结构单元 寡聚体(1-4,每种200pmol)和hepes缓冲液(20μL,100mM hepes缓 冲液和1M NaCl,pH=7.5)混合。加入水至100μL终体积。通过加 热至50℃后冷却至(-2℃/30秒)20℃使寡聚体与模板退火。 用Ar充分脱气,接着用汞灯照射(450W HPLC汞灯,pyrex过滤器, 截断值<300nm)1-2小时去除Nvoc-保护基团。以波动温度(10℃ 反应1秒之后35℃反应1秒)让混合物反应o/n。通过加入链霉抗 生物素蛋白小球(100μL,用2×1mL 100mM hepes缓冲液和1M NaCl, pH=7.5预先洗涤)使寡聚体复合体与链霉抗生物素蛋白连接。用hepes 缓冲液(1mL)洗涤小球。通过加入水(200μL)接着加热至70℃从链 霉抗生物素蛋白结合复合体分离包含编码产物的结构单元寡聚体。移 出水并且通过MS分析证实产物的生成。

实施例109(模型):3-mer β-氨基酸库的制备描述

A)β-氨基酸结构单元的合成

N-末端保护:根据上述方法,使用Nvoc基团(3,6-二甲氧基-6-硝 基苄基氧基羰基)作为光可裂解N-保护基团并且将之引入到β-氨基 酸上。

C-末端活化:根据下面的方法,使用已知的1-(4-羟基-苯基)-吡 咯-2,5-二酮(Choi等,Mol.Cryst.Liq.Cryst.Sci.Technol.Sect.A (1996),280,17-26)活化N-Nvoc保护的β-氨基酸:

1-(4-羟基-苯基)-吡咯-2,5-二酮(1mmol),NHS(1.0mmol)和 3-(4,5-二甲氧基-2-硝基-苄基氧基羰基氨基)-丁酸(1mmol)溶解于 THF(3mL)。将溶液冷却到0℃并且滴加DIC(1.2mmol)处理。1 小时之后移开冷却浴,反应混合物在室温下放置o/n。真空蒸发溶剂, 通过二氧化硅柱纯化法使用EtOAc-庚烷(1∶4之后1∶2之后1∶1)作为 洗脱剂,分离纯产物3-(4,5-二甲氧基-2-硝基-苄基氧基羰基氨基)- 丁酸4-(2,5-二氧代-2,5-二氢-吡咯-1-基)苯酯。

β-丙氨酸,顺-2-氨基-1-环己烷羧酸,反-2-氨基-1-环己烷羧酸, 顺-2-氨基-1-环戊烷羧酸,顺-2-氨基-4-环己烯-1-羧酸,反-2-氨 基-4-环己烯-1-羧酸,3-氨基-4,4,4-三氟丁酸,3-氨基-4-甲基戊酸, DL-3-氨基异丁酸一水合物,DL-β-氨基丁酸,2-氟-3-氨基丙酸盐酸 盐的N-Nvoc保护的类似物类似地进行C末端活化。

B)结构单元寡聚体的制备:

用3-(4,5-二甲氧基-2-硝基-苄基氧基羰基氨基)-丁酸4-(2,5-二 氧代-2,5-二氢-吡咯-1-基)苯酯(25μL的10mM甲醇溶液)处理水 (25ml)中的巯基寡聚体(2nmol)。混合物在室温下放置o/n。通过 常规EtOH-沉淀法纯化结构单元寡聚体。用二氯甲烷(3×300μL)洗 涤沉淀物并且真空干燥。

类似地,在11种不同的巯基寡聚体上加载β-丙氨酸,顺-2-氨基 -1-环己烷羧酸,反-2-氨基-1-环己烷羧酸,顺-2-氨基-1-环戊烷羧 酸,顺-2-氨基-4-环己烯-1-羧酸,反-2-氨基-4-环己烯-1-羧酸,3- 氨基-4,4,4-三氟丁酸,3-氨基-4-甲基戊酸,DL-3-氨基异丁酸一水合 物,DL-β-氨基丁酸,2-氟-3-氨基丙酸盐酸盐的N-Nvoc保护的C-末端 活化的类似物。

如上所述选择制备的结构单元寡聚体中的任意四种并且用于库的 制备。

实施例110(模型):下面描述以核苷酸模板和5’-磷酸咪唑 (5’-phosphoimidazolid)核苷结构单元为基础的库制备方法。

结构单元的制备

步骤A

步骤A:带有末端炔的酯接头的制备

酸衍生物(10.37mmol)溶解于DCM(20mL)并且在冰浴上冷却至 0℃。加入EDC(12.44mmol,1.2当量)接着加入DMAP(1.04mmol, 0.1当量)和醇(15.55mmol,1.5当量)的DCM(5mL)溶液。在冰浴 上1小时反应之后,让混合物升至20℃反应16小时。去除挥发性 物质并且将残余物溶解于二乙醚(150mL)和HCl(水溶液,0.1M,75 mL)。分离各相,首先用NaHCO3(饱和,35mL)和水(35mL)的混合物 洗涤有机相,然后用水(75mL)洗涤。蒸发二乙醚,使用甲苯(2×120mL) 将产物共沸干燥,得到期望的酯,如果需要,可以通过色谱法纯化。

步骤B:在碘取代的核苷上引入保护基团。

在DMF(20mL)中混合核苷(5.65mmol,1当量),TBDMS-Cl(2.04g, 13.56mmol,2.4当量)和咪唑(1.85g,27.11mmol,4.8当量),并 且在25℃下搅拌过夜。加入EtOAc(400mL),有机相用NH4Cl(水 溶液)(饱和,40mL)+H2O(40mL)的混合物洗涤接着用H2O(80mL) 洗涤。反萃取(strip)有机相并且将残余物溶解于甲苯,过滤并且反 萃取,留下期望的保护的核苷。可以通过重结晶进一步纯化化合物。

步骤C:保护的碘取代的核苷和末端炔的Sonogashira偶联

向保护的碘取代的核苷(3.4mmol),炔(6.9mmol,2当量),DIEA (2.5mL)的DMF溶液(20mL)通入Ar 5分钟。加入四三苯基膦钯(0.3 mmol,0.1当量)和CuI(0.7mmol,0.2当量),将混合物加热至50℃ 并且保持20小时。冷却后,向混合物加入700mL二乙醚。有机相用 氯化铵(饱和,水溶液,250mL)和水(250mL)洗涤。蒸发挥发性物质 之后用甲苯(400mL)反萃取,得到期望的修饰的核苷,通过柱色谱法 将其纯化(硅胶,庚烷/乙酸乙酯洗脱液)。

步骤D:去除OH保护基团

向上一步产物的THF溶液(1.8mmol,30mL)加入乙酸(0.8mL, 14.1mmol,8当量)和氟化四丁基铵(7mmol,4当量)。在20℃下 搅拌20小时,真空去除挥发性物质并且通过柱色谱法纯化残余物(硅 胶,DCM/甲醇洗脱液)。

步骤E:单磷酸酯合成

将步骤D中获得的修饰的核苷(1.65mmol)在磷酸三甲酯(5mL)中 的浆液冷却至0℃并且加入磷酰三氯(190μL,307mg,2mmol,1.2 当量)。反应在0℃下保持2小时。加入三丁基胺(1mL)并且让反应 达到20℃。加入另一部分三丁基胺(1.3ml)提高pH,接着加入水。 真空去除挥发性物质,并且可以利用离子交换色谱法(Sephadex A25, 溴化四乙基铵缓冲液0.05-1.0M,pH7)纯化残余物。

步骤F:磷酸咪唑合成

0℃及pH6.5下,向上面的单磷酸酯衍生物的溶液(0.1M)加 入2-甲基咪唑(0.5M)和EDC(0.5M)。保持0℃温度将反应搅拌2 小时。在库合成中可以直接使用该混合物[Visscher;1988;Journal of Molecular Evolution;3-6]。

或者,用羰基二咪唑处理磷酸酯也得到磷酸咪唑[Zhao;1998;J. Org.Chem.;7568-7572]。

一组结构单元

在下面的方案中给出可以用于库合成的多种结构单元。所有的结 构单元的功能实体通过羧酸酯与识别元件连接,并且这些结构单元可 以如上所述合成。

库制备

下面的方案举例说明了利用如上所述的寡核苷酸模板和磷酸咪唑 结构单元制备聚酰胺库的方法。具有带有(任选地)保护的胺的序列 修饰物(例如Glen Research氨基修饰剂C2 dT,cat no 10-1019-)的 寡核苷酸引物与库中使用的模板退火。此外,另一个寡核苷酸序列作为 终止序列退火,由此只暴露编码结构单元掺入的模板部分。为了清楚 起见,用大写粗体字母代码代替磷酸咪唑结构单元的碱基。

掺入

模板上结构单元的寡聚作用的一般条件是0.05M模板,0.1-0.2M 结构单元,在0.2M 2,6-二甲基吡啶HCl缓冲液中,所述缓冲液被调 节成含有1.0M氯化钠0.2M氯化镁的pH=7.2缓冲液。温度在0℃ 下保持1-21天[Inoue;1984;Journal of Molecular Biology; 669-676]。可以利用微量离心凝胶过滤(BioRad)纯化寡核苷酸复合体。

胺去保护

可以通过各种各样的方法去除Cbz保护基团[Greene;1999;]。 由于其温和性,催化还原常常是选择的方法。在合适的溶剂,象水,甲 醇,乙醇,二甲基甲酰胺,二甲亚砜,乙二醇,乙腈,乙酸或者这些的 混合物中,混合不溶性氢化作用催化剂,例如Pd/Al2O3,Pd/CaCO3,Pd/C, PtO2,或者可溶性氢化催化剂,例如Wilkinsons催化剂和氢源,例如 但不限于H2,甲酸铵,甲酸,1,4-环己二烯,和环己烯,以及寡聚体 核苷酸复合体,以去除Cbz保护基团。

聚合作用

在合适的溶剂,象水,甲醇,乙醇,二甲基甲酰胺,二甲亚砜,乙 二醇,乙腈,或者这些的混合物中,任选地在肽偶联修饰剂的存在下 使用二元羧酸(即,肽偶联剂),将二-胺连接在一起。向带有自由二 胺的寡核苷酸复合体(0.1-100μM,优选0.5-10μM)的含水缓冲溶液 (10μL,1M NaCl,100-500mM缓冲液pH6-10,优选7-9)加入在合适 的溶剂(1μl)(象水,甲醇,乙醇,二甲基甲酰胺,二甲亚砜,乙二 醇,乙腈,或者这些的混合物)中与肽偶联剂(0.1mM-100mM,优 选1-10mM)和肽偶联修饰剂(0.1mM-100mM,优选1-10mM)混合的二 元羧酸(0.1mM-100mM,优选1-10mM),例如但不限于草酸,丙二酸, 琥珀酸,戊二酸己二酸,邻苯二甲酸,间苯二甲酸,对苯二甲酸, N-保护的谷氨酸或N-保护的天冬氨酸,所述肽偶联剂例如但不限于 EDC,DCC,DIC,HATU,HBTU,PyBoP,PyBroP或N-甲基-2-氯代吡啶 鎓四氟硼酸盐,其中所述肽偶联修饰剂例如但不限于NHS,磺基-NHS, HOBt,HOAt,DhbtOH。反应在-20℃和100℃之间的温度下进 行,优选0℃至60℃。反应时间是1小时至一周,优选1小时至 24小时。

上述方法举例说明11μL规模的聚合作用,但是可以使用1.1μL至 1.1L的任何其他反应体积。

接头裂解(断裂)

在合适的溶剂,象水,甲醇,乙醇,二甲基甲酰胺,二甲亚砜,乙 二醇,乙腈,或者这些的混合物中,室温下使用pH9-12的氢氧化物 水溶液将酯键裂解16小时。

MS-分析

可以用质谱分析库成员。

在上面的序列中,二胺带有Cbz保护基团并且在寡核苷酸上去保 护。其他保护方案亦可适用于胺的保护[Greene and Wuts;1999;]。 在某些情况下,用胺上不带有保护基团的结构单元反应可能足以产生 序列,因此消除了胺去保护步骤。对于模控库合成所描述的方法也可以 应用修饰的二-和三-核苷酸以及修饰的核酸类似物,象morpholinos, LNA和PNA。后一种情况下,掺入时的反应条件应该加以改变以适应肽 偶联反应[Schmidt;1997;Nucleic Acids Research;4792-4796]。 这样的供选择的结构单元的例子如下面示意图所示。与一般PNA单元 相比,修饰的PNA单元的合成只是在修饰的碱基的使用方面不同。

此外,代替使用5’-磷酸咪唑-核苷,在库制备中可以使用二 -3’,5’-磷酸咪唑-核苷[Visscher and Schwartz;1988;Journal of Molecular Evolution;3-6]和核苷的混合物,如下所述。各结构单 元类型的交替掺入是必须的,但是由于识别步骤的可逆性和如果例如 两个双-3’,5’-磷酸咪唑-核苷彼此相连则不发生反应的事实,所需 要的仅是在混合物中存在两种结构单元类型。

参考文献

(1)Visscher,J.;Schwartz,A.W.Journal of Molecular Evolution 1988,28,3-6.

(2)Zhao,Y.;Thorson,J.S.J.Org.Chem.1998,63, 7568-7572.

(3)Inoue,T.;Joyce,G.F.;Grzeskowiak,K.;Orgel,L.E.; Brown,J.M.;Reese,C.B.Journal of Molecular Biology 1984, 178,669-676.

(4)Greene,T.W.;Wuts,P.G.M.Protective Groups in Organic Synthesis;第三版;John Wiley & Sons:New York,1999.

(5)Schmidt,J.G.;Christensen,L.;Nielsen,P.E.;Orgel, L.E.Nucleic Acids Research 1997,25,4792-4796.

实施例111(模型):通过包含功能实体的二核苷酸的非酶促连接 合成模控分子库

已经开发出几套系统使核苷酸和寡核苷酸在核酸或PNA模板上非 酶促化学连接(Xu等,2001,Nat Biotechnol 19,148-152;2000,J Am Chem Soc,122,9040-41)。一个方案描述3’-硫代磷酸酯和包含 碘离去基团的5’部分的自动连接,如下所示:

非酶促连接方案能用于分子库的模控合成。这里,通过下文描述 的改进的亚磷酰胺核苷酸化学合成各含有独特功能实体的一套二核苷 酸。合成具有序列dUdNp的4个二核苷酸结构单元。每个二核苷酸含 有能与相邻反应基团形成共价键的5’-碘-和3’-硫代磷酸酯基团。

在DNA模板上掺入二核苷酸:

各1pmol的延伸引物A(5’-GCTACTGGCATCGXG-3’-硫代磷酸酯, 其中X表示脱氧胸苷-C6-NH2,Glen Research Cat#:10-1035-90)和 B(5’-碘-GCACTTGCAGACAGC-3’)在结合缓冲液中与模板寡聚体 (5’GCTGTCTGCAAGTGCNANACACGATGCCAGTAGC-3’)退火:50mM HEPES-KOH,pH=7.5,5mM MgCl2,100mM,KCl,并且在80℃温育 2分钟,之后缓慢冷却至20℃。引物A和B与模板结合形成带有中心 4核苷酸单链片段的双链DNA复合体,如下所示。加入10pmol的二 核苷酸,反应混合物在4℃温育30分钟,接着短暂加热至25℃反 应30秒。反应混合物经历连续温度摆动循环24小时。该步骤促使正 确退火的二核苷酸与引物A和B之间化学连接。

模板互补作用和化学连接之后,通过微量离心凝胶过滤(Biorad) 去除二核苷酸和缓冲液。

功能实体的交联和模控分子的活化

在缓冲液20mM HEPES-KOH pH=7.5,100mM KCl中温育包含 功能实体的DNA复合体。加入5mM双[磺基琥珀酰亚胺基]辛二酸酯 (BS3,Pierce),样品在30℃温育2-8小时。通过微量离心凝胶过 滤(Biorad)去除缓冲液和过量BS3。50℃下使用0.2M NaOH将酯键 裂解15分钟接着加入等摩尔HCl将模控分子活化。通过透析将样品 转移到合适的缓冲液中。

该方案使得合成具有16种不同分子的小库,每一种不同分子与它 们的模板连接,可用于选择/扩增实验。使用含有功能实体的三-,四 -,或其他寡核苷酸和/或通过增加待在DNA模板上非酶促连接而偶联 的结构单元数目,能合成较大的库。

结构单元的合成:

带有连接的功能实体的5’-碘-3’-硫代磷酸酯二聚体的合成

a)常规亚磷酰胺偶联;b)吡啶中S8;c)亚磷酰胺偶联引入 5-I-dU;d)CF3COOH然后I2/吡啶/水;e)THF-Et3N中FE-间隔基团 和Pd(O);f)DMF中Ph3P和I2;g)光解>300nm。

B等于用光不稳定性保护基团Nvoc2适当保护的A,T,G或C。 接头等于光不稳定性CPG固相载体3。R等于光不稳定性磷酸酯保护

                                  

2Alvarez et al.J.Org Chem.(1999),64,6319-28

3Pirrung et al.J.Org.Chem.(1998),63,241-46 基团4。

核酸碱基上接头的结合点(箭头所指)的例子。

接头(虚线环所指)和功能实体的例子

实施例112: 中心核苷酸处衍生化的DNA寡核苷酸的连接

为了检验各种DNA寡聚-衍生物用于T4 DNA连接酶的底物效率, 寡聚-衍生物Ah17和Ah19分别与模板Ah18和Ah20退火。每一种模板

                                      

4Givens and Kueper Chem.Rev.(1991),93,55 包含两个用于合适的寡聚体的退火位点。寡聚-衍生物在中央核苷酸位 置包含修饰的核苷酸(见下图)。

可以如下所述图解说明反应:

X=氨基-修饰剂C6 dT

Ah 17:5’-CACXGAA

Ah 18:5’-TCGGATTCAGTGTTCAGTGCGTAG

Ah 19:5’-TGCACXGAAGC

Ah20:5’-TCGGAGCTTCAGTGCAGCTTCAGTGCACGTAG

混合0.5μl缓冲液A,0.μl Ah18或Ah20(1pmol/μl),和2 μl Ah17或Ah18(32P-标记)(1pmol/μl)。通过加热至80℃然后冷 却至10℃退火。加入3μl T4-DNA连接酶(TAKARA,code #6022)。 在4,7℃下温育大约48小时。然后通过10%尿素聚丙烯酰胺凝胶电 泳进行分析。

如图64所示,DNA连接酶能有效连接试验的两种寡聚-衍生物,即 即使对于长度是7个核苷酸并且在位置4具有修饰的最短的寡聚体 (Ah17),连接完成大约50%。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈