用标示物编码的多元组合化学库

申请号 CN200310120719.0 申请日 1994-04-13 公开(公告)号 CN1525171A 公开(公告)日 2004-09-01
申请人 纽约市哥伦比亚大学理事; 冷泉港实验室; 发明人 W·C·施蒂尔; M·H·韦格勒; M·H·J·奥尔迈耶; L·W·迪拉德; J·C·里德;
摘要 本文提供了编码组合化学,其中用有机分子记录连续合成方法,这些有机分子作为相同或不同的信息量子确定反应物和阶段的选择。各种产物可在多步合成方法中产生,如低聚物和合成的非重复性有机分子。有多族化合物可用作识别剂,其中取代基的数量和/或 位置 可确定该选择。另外,可使用可测定的官能团,如 放射性 同位素、 荧光 、卤素等,其中两个不同基团的存在和比例可用于确定阶段或选择。特别是,可用多种识别剂以提供二进制或高级代码,以便仅用少数可分离标示物就可确定多种选择。可筛选颗粒的所需特性,特别是结合亲合 力 ,其中产物可与颗粒分离或留在颗粒上。可通过释放标示物和分析确定颗粒的反应历程来测量定具有所述特性的颗粒的反应历程。
权利要求

1.一种包括多种不同的分离的有机化合物的子库,每种化合物 的特征在于具有可辨别的成分,可编码至少一个可用物理测定方法 测定的不同信息的二进制数,和共用至少一个普通官能团。
2.根据权利要求1的子库,其中所述官能有机化合物是化学式 如下的化合物:
F1-F2- C-E- C′
其中F1-F2是可连接到固体颗粒上和可与固体颗粒分离的连接体;
C-E- C′是可用物理测定方法测定的标示物。
3.一种含有至少6个不同组分的成分,所述组分在子库或普通 介质中相联系,每个组分具有可辨别部分,这些组分特征在于:
每个可辨别部分基本是化学惰性的,具有不同分子量,并且具 有一个除光发射以外的不同于其他每个可辨别部分的可识别特征;
通过各自可分离的固体表面的连接单元,每个部分接连到具有 可形成共价键的活性官能团的连接基上,或每个部分连接到在少于1 毫微摩尔下可测定出的基团上,
但须当所述可辨部分连接到所述连接基上时,所述的组分可物 理分离。
4.根据权利要求3的成分,其中固体载体是小球。
5.根据权利要求3的成分,其中每个组分包括连接到各自可分 离的固体表面上的不同化合物的分子,其中可辨别部分编码用于在 固体表面合成所述分子的合成方案。
6.根据权利要求3的成分,其中可辨别部分确定中心分子上的 同系列和/或一系列取代基。
7.一种包括至少6个不同标记的成分,这些标记在一个化合物 子库或普通介质中相互关联,每个标记带有一个本质上化学惰性的 可区分部分,彼此之间分子量不同,所述标记的结构式如下:
(1)∧-{Δ-(T)α或(T)α-Δ或Δ1-(T)α-Δ2} 其中∧是连接基团,该连接基团带有与固体载体相连接的功能团和 用于与固体载体相分离的功能团,用于分离的功能团可以包括在连 接固体载体的功能团之中;
Δ是区分基团,该基团使得每一个标记通过其物理性质以及通 过除荧光以外的方法与其他标记相区分,从而提供能够编码多步骤 合成方法的一套标记;该区分基团包括分割后的剩余功能团,该功 能团已事先与连接基团相连接;
Δ1和Δ2是区分基团部分,它们一起限定了区分基团;它们连 接在一起时就落入Δ的定义之中;
T是可检测基团,当其与区分基团连接时使得能够检测到低含 量的标记,这里可检测基团可以存在在子库中的标记上或后来被加 到区分基团上,并且如果连到连接基团上,可检测基团包括分离后 剩下的任何功能团,这些功能团事先与连接基团相连接;
以及α是0或1,表示可检测基团存在或不存在;
(2)SS-(∧′-{Δ-(T)α或(T)α-Δ或Δ1-(T)α-2})β 其中所有的符号同前述定义,但下面的定义除外:SS是固体载体; Δ′是以共价键形式与SS相连的连接基团;以及β对每个固体载体 来说都是整数,该整数至少为6并通常不大于约30;
(3)∧″-{Δ″-(T)α或(T″)α-Δ或Δ′1-(T)α-Δ2} 其中所有的符号同前述定义,但下面的定义除外:Δ”是氢或经过导 致与固体载体分开的光解裂解、消去或其他化学反应后的连接基团 的残基;Δ″和Δ′1,作为标记与固体载体分开的结果,分别是Δ或 Δ1或改性的Δ或Δ1;作为标记与固体载体分开的结果,T″是T或 改性的T;
(4)Tα-∧-{Δ″-(T)α或(T″)α-Δ或Δ′1-(T)α-Δ2} 其中所有的标记同前述定义,并且∧是单键或与T连接后连接基 团的剩余部分;但有一个附加条件是,只能有一个α是1。
8.根据权利要求7的成分,其中标记是具有结构式(1)的标 记。
9.根据权利要求7的成分,其中标记是具有结构式(2)的标 记。
10.根据权利要求7的成分,其中标记是具有结构式(3)的标 记。
11.根据权利要求7的成分,其中标记是具有结构式(4)的标 记。
12.根据权利要求7的成分,其中Δ连接到∧上。
13.一种包括至少100个独特固体载体的化合物库,其特征在 于:
每个固体载体具有(1)一个连接到所述固体载体上的单一化合 物,该化合物作为连接到载体上的主要化合物;以及
(2)多种非序列标记,该标记是一些单独分子,这些分子在物 理分离中可物理辨别,具有不同的分子量并可用除荧光以外的方法 辨别,该标记可被取代,从而在小于约1毫微摩尔下可检测出或具 有连接到在小于约1毫微摩尔下可检测的取代物上的官能基团。
14.根据权利要求13的化合物库,其中每个固体载体具有至少 约6个标记。
15.根据权利要求13的化合物库,其中所述标记确定一个编码 用于在固体载体上合成所述化合物的合成方案的二进制或高级代 码。
16.一种固体载体,其特征在于具有连接到该固体载体上的配 位体和具有连接到固体载体上的组合识别剂。
17.根据权利要求16的固体载体,其中所述配位体是低聚物, 该低聚物是低聚肽、低聚核苷酸、低聚糖、聚类脂类、聚酯、聚酰 胺、聚尿烷、聚脲、聚醚、聚(磷衍生物),该聚(磷衍生物)是 磷酸酯、膦酸酯、磷酰胺、膦酰胺、亚磷酸酯或亚磷酰胺,聚(硫 衍生物),该聚(硫衍生物)是砜、磺酸酯、亚硫酸酯、磺酰胺 或亚磺酰胺,其中对磷和硫衍生物来说,示出的杂原子多半结合到C、 H、N、O或S上,和它们的组合。
18.根据权利要求16的固体载体,其中所述配位体是非低聚物, 该非低聚物是杂环族、芳族、脂环族或脂族化合物,和它们的组合。
19.根据权利要求18的固体载体,其中非低聚物是二氮杂双环 化合物、氮杂三环化合物或支链酰胺化合物。
20.根据权利要求16的固体载体,其中配位体通过非易变键连 接到载体上。
21.根据权利要求16的固体载体,其中配位体通过可裂解键连 接到载体上。
22.根据权利要求16的固体载体,其中识别剂包括标示物,该 标示物是放射性同位素,或带有卤代烷基或卤代芳基烯丙基的化合 物。
23.根据权利要求16的固体载体,该固体载体是直径为约10-2000 μm的小球,其中识别剂包括标示物组分,该标示物组分与小球裂 解后可用气相色谱和/或液相色谱法分离,可用电子俘获、质谱、荧 光或原子发射技术检测。
24.一种包括权利要求19的多种固体载体的化合物库。
25.根据权利要求24的库,其中最终产物已与固体载体分裂开。
26.根据权利要求25的库,其中最终产物是二氮杂双环化合物、 氮杂三环化合物或支链酰胺化合物。
27.一种识别具有所需特性的化合物的方法,包括筛选权利要 求24的库。
28.根据权利要求27的方法,其中化合物已与固体表面分裂开。
29.根据权利要求28的方法,其中化合物是二氮杂双环化合物、 氮杂三环化合物或支链酰胺化合物。
30.一种制备配位体的方法,包括一个反应系列,该方法使用 一种对在多种独特固体载体的每种固体载体上的反应系列的反应历 程进行记录的方法,其中所述反应系列包括至少两个阶段,这些阶 段需要不同试剂和/或反应条件,对多种所述独特固体载体产物不同 的改变、在不同的独特固体载体上产生多种不同的最终产物,使用 组合识别剂记录所述反应历程,所述识别剂的特征在于确定试剂或 反应条件的选择和反应系列中的阶段,并且对该选择和阶段来说识 别剂可被分析,所述的方法包括:
在反应系列的第一或中间阶段,不同试剂或在使用不同反应条 件下与每组固体载体和组合识别剂反应,其中该独特固体载体组包 括至少一种所述的独特固体载体,对每组独特固体载体,组合识别 剂确定试剂的选择和反应系列中的阶段,每个识别剂各自直接连接 到独特固体载体上或通过不同于在前识别剂的识别剂连接到独特固 体载体上;
将所述的独特固体载体组混合在一起,然后将这些混合在一起 的独特固体载体分成许多组以用于第二中间或最后阶段;
重复该反应至少一次以提供多种配位体,在不同的各个独特固 体表面上具有不同的产物;
以及用所述组合识别剂识别至少一个选择的独特固体表面的反 应历程。
31.一种制备配位体的方法,包括一个反应系列,该方法使用 一种对在多种独特固体表面的每种固体表面上的反应系列的反应历 程进行记录的方法,其中所述反应系列包括至少两个阶段,这些阶 段需要不同试剂和/或反应条件,对每种所述独特固体表面产生不同 改变,在不同的独特固体表面上产生多种不同的配位体,使用组合 识别剂记录所述反应历程,所述组合识别剂的特征在于确定试剂和/ 或反应条件的选择和反应系列中的阶段,并且对该选择和阶段来说 识别剂可被分析,所述的方法包括:
在反应系列的第一或中间阶段,不同试剂和/或在使用不同反应 条件下与每组固体表面和组合识别剂反应,其中该独特固体表面组 包括至少一种所述的独特固体表面,对于每组独特固体表面,组合 识别剂确定试剂的选择和反应系列中的阶段,每个识别剂通过不同 于在前识别剂的识别剂和通过可分裂键各自连接到独特固体表面 上;
将所述的独特固体表面组混合在一起,然后将所述的多种独特 固体表面分成用于第二个中间或最后阶段的许多组;
重复该反应,以提供在不同的单个独特固体表面上具有不同配 位体的许多配位体;
筛选由多种特固体表面得到的配位体的所需特性;以及通过将 标示物部分与独特固体表面分离和用不同的特性识别所标示物部分 来识别具有所需特性的配位体的至少一种选择的独特固体表面的反 应历程。
32.一种式I化合物
F1-F2- C-E- C′    I
其中F1-F2是可连接到载体上和与载体分离的连接体;
C-E- C′是可分析的标示物;
E是可检测,或通过不同取代可检测和提供分离的标示物组分;
C和 C′是各自可检测的标示物组分;
F2是可选择性地分裂以释放标示物组分的连接组分;以及
F1是使该化合物易于连接到合成载体上的官能基团。
33.根据权利要求32的化合物,具有下列结构式:
F1-F2-( C-(E- C′)a)b
其中
F1是CO2H,CH2X,NR1R1,C(O)R1,OH,CHN2,SH,C(O)CHN2, S(O2)Cl,S(O2)CHN2,N3,NO2,NO,S(O2)N3,OC(O)X, C(O)X,NCO,或NCS;
F2是 -Si(R1)2A-,-Si(R1)2--OSi(R1)2-, -NC(O)O-,-CR1=CR1-(CR12)2-,-CR1=CR1-C(R1)2-, -C(R1)2-CR1=CR1-, -C(R1)2A-,-O-C(R1)2A-, -Si(CH3)2-(CR12)2-A-,-R3-(CR12)2A-, -CR1=CR1-C(R1)2-A-,
-S-C(R1)2A-,-C(X)R1-C(R1)2A-,
-C(OH)R1-C(R1)2A-,-C(OH)R1-C(CH2X)R1-,
-C(OH)R1-C(R1)2-C(X)R1-,-C(OH)(CH2CH2X)-,


但须当F2是单键时,F1是OH或COOH;
A是-O、-OC(O)O-、-OC(O)-或-NHC(O)-;
C是单键、被1-40个F、Cl、Br、C1-C6烷基、NR4R4、OR4或NR4任意取代的C1-C20亚烷基、或者-[(C(R4)2)m-Y-Z-Y-(C(R4)2)nY-Z-Y]p-;
但须 C+ C′中的最大原子数是20;
C′是H;F;Cl;被1-40个F、Cl、Br、C1-C6烷氧基、NR4R4、OR4或NR4任意取代的C1-C20亚烷基,或者-[(C(R4)2)m-Y-Z-Y-(C(R4)2)nY-Z-Y]p-;
但须 C+ C′中的最大碳原子数20;
E是被1-20个F、Cl或Br取代的C1-C10烷在;或者Q-芳基,其中 芳基被1-7个F、Cl、NO2、SO2R5或取代苯基取代,其中苯基的取 代基是1-5个F、Cl、NO2或SO2R5;
E- C′可以是-H、-OH或氨基;
R1是H或C1-C6烷基;
R3是C=O、C(O)O、C(O)NR1、S、SO或SO2;
R4是H或C1-C6烷基;
R5是C1-C6烷基;
a是1-5;
b是1-3;
m和n各自是0-20;
P是1-7;
Q是单键、O、S、NR4、C=O、-C(O)NR5、-NR5C(O)-、-C(O)O-或-OC(O)-;
x是诸如Br、Cl、三氟甲磺酰基、甲磺酰基、甲苯磺酰基或 OC(O)OR5的离去基团;
Y是单键、O、S或NR4;
Z是单键;被1-4个F、Cl、Br、C1-C6烷基、C1-C6烷氧基、1-13个 F、Cl取代的C1-C6烷基或1-13个F、Cl或Br取代的C1-C6烷氧基 任意取代的苯基;(C(R4)2)1-20;或(CF2)1-20;但须,当Z是单 键时,与Z相邻的一个Y也是单键;以及芳基是含有不多于10个碳 原子和不多于2个选自O、S和N的杂原子的单环或双环芳环。
34.根据权利要求33的化合物,其中:
F1是
CO2H,OH,CHN2,C(O)CHN2,C(O)X,NCS.或CH2X:
F2是

或.
C和 C′各独立地是未取代的或被1-40个F或Cl取代的C1-C20亚烷 基,或[O-(CH2)2-3]p;
E是被1-20个F或Cl取代的C1-C10烷基;Q-芳基,其中芳基是被1- 7个F或Cl取代的双环芳环;或被1-5个F、Cl、NO2或SO2R5取代 的Q-苯基;以及
Q是单键、O、-NR5C(O)-或-OC(O)-。
35.根据权利要求33的化合物,其具有下列结构式:


其中Ar是五氟苯基、五氯苯基或五溴苯基、2,3,5,6-四氟-4(2, 3,4,5,6-五氟苯基)苯基、2,4,6-三氯苯基、2,4,5-三氯苯 基、2,6-二氯-4-氟苯基或2,3,5,6-四氟苯基。
36.根据权利要求33的化合物,其中:E-C′是H、OH或NH2。
37.一种具有下列结构式的成分
S-F1’-F2- C-E- C′
其中:
S是可溶的或固体的载体;
C-E- C′是能够分析的标示物,其中E是标示物组分,该标示物 组分(a)可测定,例如用气相色谱法或质谱法可分析出的电泳基团 或(b)通过不同取代可测定和分离;
C和 C′是标示物组分,该组分可从所有其他标示物中识别出一 个标示物,通常可通过改变取代基长度或取代部位而分离,例如, 改变色谱保留时间或质谱比例Z/e;
F2是能够选择分裂以释放标示物的连接组分;
F1′是提供连接到载体上的官能基团。
38.根据权利要求37的成分,其中:
S是毛细管、空心纤维、针状物、固体纤维、纤维素小球、多孔 玻璃小球、胶、与二乙烯基苯任意交联的聚苯乙烯小球、接枝共 聚小球、聚丙烯酰胺小球、胶乳小球、与N,N′-二-丙烯酰乙二胺任 意交联的二甲基丙烯酰胺小球、涂有疏聚合物的玻璃颗粒,或低 分子量非交联聚苯乙烯;以及
F1′-F2- C-E- C′是连接到S上的式I的残基。
39.根据权利要求1的方法,还包括将标示物部分与所述独特 固体表面分离。
40.根据权利要求39的方法,其中标示物部分是用光化学、氧 化、水解热解或还原法分离。
41.根据权利要求1的方法,还包括非低聚物配位体与所述独 特固体表面用光化学法分离。
42.一种结构式如下的化合物

其中:
P是聚苯乙烯脂;
IXa-f是结构式如下的多种残基

其中:n是1-6;
R是CH3、CH(CH3)2、CH2CO2H、(CH2)4NH2、CH2-C6H4-OH或CH2C6H5;以及
R1是H、CH3、C2H5、CH2CH=CH2或CH2C6H5。
43.一种为了使化合物结构容易确定的合成化合物的方法,该 方法包括在下述条件下在固体载体的表面合成化合物,所述条件是 在化合物的合成完成时使多种识别剂已连接到该固体载体上,该识 别剂可编码与化合物合成相关联的反应阶段。
44.一种为了使库中每个化合物结构容易确定的合成化合物库 的方法,该方法包括在下述条件下在独特固体载体的表面合成每个 化合物,所述条件是在化合物库的合成完成时使多种识别剂已连接 到每个这样的独特载体上,该识别剂可编码与在这种固体载体上合 成的化合物的合成有关联的反应阶段。
45.一种确定化合物结构的方法,该方法包括用权利要求43或 44的方法合成化合物,分离在其上合成化合物的固体载体,处理如 此分离的固体载体,以便释放连接到固体载体上的每个识别剂的标 示物组分,测定如此释放的每个标示物组分的存在或数量或存在和 数量,以及从所有这些标记物组分的存在或数量或存在和数量推导 出化合物的结构。
46.一种识别具有所需特性的化合物,该方法包括用权利要求44 的方法合成化合物库,在一种测定法中分别测定所形成的库中的每 个化合物,该测定法可识别具有所需特性的化合物以便识别存在于 该库中的具有所需特性的任何化合物。
47.根据权利要求46的方法,还包括确定如此识别的化合物的 结构。
48.一种化合物库,该库中的每个化合物连接到独特固体载体 上,并且多种识别剂已连接到每个这样的固体载体上,该识别剂可 编码与连接到该固体载体上的化合物的合成有关联的反应阶段。
49.根据权利要求48的库,其中该库中的化合物是二氮杂双环 化合物。
50.根据权利要求48的库,其中该库中的化合物是氮杂三环化 合物。
51.根据权利要求48的库,其中该库中的化合物是支链酰胺化 合物。
52.根据权利要求48的库,其中该库中的化合物是肽。
53.一种识别具有所需特性的化合物的方法,该方法包括在一 种测定方法中测定权利要求46的化合物库,该测定方法可识别具有 所需特性的化合物以便识别存在于该库中的具有所需特性的任何化 合物。
54.根据权利要求53的方法,还包括确定如此识别的化合物的 结构。
55.一种用权利要求53的方法识别的化合物。
56.根据权利要求53的方法,其中所需特性是对人的神经激肽 1/舒缓激肽受体的拮抗作用,并且该化合物库包括氮杂三环化合物。
57.根据权利要求53的方法,其中所需特性用于肌肉松驰剂、 安神药或镇静剂,并且化合物库包括苯并二吖庚因。
58.根据权利要求53的方法,其中所需特性用于治疗高血压或 雷诺综合症,并且化合物库包括支链酰胺。

说明书全文

技术领域

发明涉及用标示物编码的多元组合化学库。

申请是1993年11月30日申请的序列号为08/159,861的美国 专利申请的部分连续申请,美国专利申请08/159,861是1993年10 月1日申请的序列号为08/130,271的美国专利申请的部分连续申 请。因此,这两个专利申请的内容作为参考引入到本申请中。

背景技术

人们对大量性质不同的化合物的合成方法感兴趣,这些化合物 可根据各种可能的生理活性或其他活性进行筛选。已经研究出一 些方法,在这些方法中,人们顺序地加入各个单元作为化学合成的 一部分,以制备所有的或大部分可能的化合物,这些化合物可在合 成的每个连续步骤中可能存在的不同选择得到。对于这些将要成 功的技术,必须要有适合测定这些化合物的方法,通过这些方法人 们可以测定如此制备的化合物的结构。例如,Brenner和Lerner Proc.Natl.Acad.Sci.USA(1992) 81,5381-5383和WO 93/ 20242描述了一种合成方法,其中同时产生了低聚核苷酸,并且该低 聚核苷酸作为遗传标示物化学连接到低聚肽上成为所需的化合物。 WO 93/06121介绍了一些无规低聚物的粒基合成方法,其中颗粒 上的识别标示物用来帮助识别合成的低聚物序列。可分开的标记 体系描述于Ohlmeyer等人,Proc.Natl.Acad.Sci.USA(1993) 90,10922-10926中。

发明内容

这些方法和组合物提供了对组合化学的编码,从而在合成的每 个阶段,唯一地标记一种载体,例如在其上合成化合物的一种颗粒, 以确定与在该载体上合成化合物有关的特殊事件,通常是指化学行 为。标记是用识别剂分子进行,这些识别剂分子标出了连续事件, 在合成过程中载体颗粒暴露于这些连续事件中,这样就提供了在该 载体上生成化合物的反应历程。
每种识别剂分子具有如下特征:在所用的合成条件下是稳定的、 在合成阶段中保持与载体相联系、在合成过程中唯一地确定了一 种特殊事件,该特殊事件反映了在给定的合成阶段下特殊的反应选 择、可与在测定过程中存在的其他组分区别开、可分开用方便分 析技术可辨别出的标示物组分。
本发明的识别剂可与另一种识别剂结合使用以形成二进制或 更高级的编码体系,这样使用较小数目的识别剂就可编码相当大数 目的反应产物。例如,当使用二进制编码时,N个识别剂,就可独特 地编码出高达2N个不同的化合物。
此外,本发明的识别剂不需通过在先的识别剂连续地连接到基 质上,而是直接地或通过合成的产物单独地连接到基质上。这些识 别剂可以是不连续的。而且,这些识别剂含有可分开的成分或部分, 这些成分或部分可使容易分析出的标示组分分离。
便利的是,该组合合成法使用可确定的固体载体,在该固体载 体上进行反应,并且识别剂结合在该固体载体上。对于感兴趣的特 征可以筛选出带有最终产物化合物的单独的固体载体或基质,并且 通过分析相关的识别剂标示物来测定反应历程。
附图说明
图1说明了通过质谱分析所得到的标示物4的分析结果。可看 到有两个相应于标示物4的信号
图2说明了用质谱分析所得到的标示物11的分析结果。可看到 有两个相应于标示物11的信号。
图3说明了用质谱分析所得到的标示物13的分析结果。可看到 有两个相应于标示物13的信号。
图4说明了当大约相同量的每种标示物混合在一起时,用正化 学离子质谱(PCIMS)分析所得到的标示物4,11和13的分析结果。可 容易地区别出相应于每种分开标示物的两个信号。

具体实施方式

本申请中所用的术语“标示物”或“T”是指具有两种性质的 化学部分。第一,它可区别于所有的其他化学部分;第二,当它以 10-18至10-9摩尔量存在时可检测出。这两种性质在单一的化学结构 中可体现出来。另外,这些性质在连接在一起的分开的化学结构中 可体现出来。在后一种情况下,这些化学结构中的一个化学结构( 可表示为 C(或在多于一种这种结构 C, C′等情况下))提供了使该标 示物可区别于其他标示物的性质,而另一个化学结构E提供了使该 标示物可检测的性质,并且可选择性地提供使该标示物可与其他标 示物分离的性质。
本申请中所用的术语“连接体”或“L”是指具有三种性质的 化学部分。第一,它可连接到固体载体上,第二,它可连接到标示物 上;第三,当它连接到固体载体和标示物上时,它可分裂开以便标示 物可与固体载体分离开。这三个性质可在单一的化学结构中体现 出来。另外,这些性质可在三个连接在一起的化学结构中体现出来。 在后一种情况下,这些化学结构中的一个化学结构(可表示为F1)提 供了使连接体可连接到固体载体上的性质;第二个化学结构(可表 示为V)提供了使连接体可分裂的性质;第三个化学结构(可表示为 A′)提供了使连接体可连接到标示物上的性质。所希望的是,化学 结构V和A′是一个和相同的化学结构,其中V-A′化学结构可表示为 F2。
本申请中所用的术语“识别剂”是指包括标示物和连接体的 化学个体。因此,在广义上,识别剂可由式L-T表示,而识别剂的具 体含义由式F′-V-A′-T;F1-V-A′-C-E(或F1-V-A′-E- C); L- C-E(或 L-E- C)和L-C-E- C′表示。
本文中所用的术语“选择”是指组合合成中给定阶段的交替 变量,例如,反应物、试剂、反应条件及其组合。术语“阶段”是 相应于化合物或配位体的连续合成中的步骤;该化合物或配位体是 组合合成的最终产物。
术语“烷基”包括直链、支链和环状结构及其组合。因此,该 术语包括甲基、乙基、丙基、异丙基、丁基、仲和叔丁基、环丙 基、环丁基、环戊基、2-甲基环丙基等。低级烷基是C1-C6烷基。 低级链烯基是直链、支链或环状构型及其组合的C2-C6链烯基。
除非另有说明,在特定分子中任何取代基(例如R1,R2,Z等)的 定义与其在该分子中其他地方的定义是无关的。因此,NR4R4代表 NHH、NHCH3、NHCH2 CH3、N(CH3)2等。
本文所述化合物中的某些化合物含有一个或多个不对称中心, 因此,可产生对映体、非对映异构体和其他立体异构形式。本发明 包括所有这些可能的立体异构体以及它们的外消旋和旋光纯形式。 旋光活性(R)和(S)异构体可用手性合成纤维、手性试剂来制备,或 用常规技术拆分。当本文所述的化合物含有烯双键时,则这些化 合物包括E和Z几何异构体。
在其上进行本发明组合合成的物质在本文中可互换地称作小 球、固体表面、(固体)基质、颗粒、载体等。这些术语将包括:
a)固体载体,例如小球、丸、园环、毛细管、空心纤维、针状 物、固体纤维、纤维素小球、多孔玻璃小球、胶、与二乙烯基 苯任意交联的聚苯乙烯小球、接枝共聚小球、聚丙烯酰胺小球、 胶乳小球、与N,N′-二-丙烯酰乙二胺任意交联的二甲基丙烯酰胺 小球、涂有疏聚合物的玻璃颗粒等,即,具有刚性或半刚性表面 的物质;
b)可溶载体,例如低分子量非交联聚苯乙烯。
这些物质必须含有官能团或必须能被官能化以便识别剂或产 物中间物能够连接到这些物质上。
另外,下列缩写词具有指定的含义:
AcOH=乙酸
BSA=二(三甲基甲硅烷基)乙酰胺
CAN=硝酸铈(iv)铵
DEAD=偶氮二甲酸二乙酯
DCM=二氯甲烷
DIC=二异丙基化二亚胺
DMF=N,N-二甲基甲酰胺
Fmoc=9-芴基甲基羰基
HOBT=1-羟基苯并三唑
PhMe=甲苯
r.t.=室温
TFA=三氟乙酸
THF=四氢呋喃
本发明涉及产物,即化合物库的制备,其中存在于这些库中的 各个产物或化合物可以相互物理分开,并且可以对或者在固体载体 上或者与固体载体分开的感兴趣的特性进行筛选。通过连续合成, 其中在合成的每个阶段每个单独的中间体用各种方法处理,产生了 很多个产物,每种产物的少量存在,常少于100微微摩尔,更常少于 10毫微摩尔。因为如此产生的最终产物或化合物的量很少,所以通 过分离和结构上阐明产物来识别这些产物通常是不可行的。而且, 在涉及到加入非类似单元的连续合成中,如果使用一般可得到的产 物的量进行分析不是不可能的话,那么这样的分析也将是很困难的。 然而,通过将连续合成的每个选择或组合选择(例如,“加试剂A” 或“加试剂A,然后加试剂B,并加热至100℃2小时”)与可确定变量 (例如反应物、试剂、反应条件、或这些变量的组合)的组合识别 剂相联系,人们就可使用识别剂来确定每个可确定的和可分离的基 质的反应历程。通过对与识别剂分开的标示物的分析可在微微摩 尔或更低浓度,例如毫微微或更低浓度下容易的识别反应历程。根 据与产物相联系的标示物,人们可用各种筛选技术来测定合成产物 的特性,一般是化学特性或生物特性,然后识别反应历程,从而确定 产物的结构,该产物具有所需要的性质。
重要的是,本发明方法使用可与合成的配位体或化合物分离的 标示物,这也是为了消除编码。这种可分离性也使标示物在多于一 个依据的情况下可辨别出。特别是,这些标示物可分离(例如,根据 色谱保留时间),然后可以分析(例如,第二个依据是光谱性质如质 谱分析m/e,或电泳性(electrophoricity))。由于具有多个区别 依据,所以可用少数标示物来编码大量信息。
因此,本发明提供了用于编码组合合成的方法和组合物,从而 在合成的每个阶段提供一种或多种识别剂,这些识别剂可对与在载 体或颗粒上进行化合物合成中的颗粒阶段相关的事件编码。该事 件包括在反应的那个阶段选择反应物和/或反应条件,其中每个这 样的阶段可涉及一种或多种反应物,这些反应物在相同的或不同的 条件,例如部分反应、多步加入、加入速度、试剂的不同组合等 件下是相同的或不同的。另外,颗粒的基团可与其他的颗粒的基 团螯合,并在连续合成过程中的任何时间经受一系列不同事件。
通过提供N个识别剂,并且每个识别剂具有M个可辨别状态,就 可独特地确定MN个不同的合成。在M=2的情况下,这时这两个状态 可以是有识别剂存在或没有识别剂存在,这样该合成将用基数2或 二进制代码确定。在M=3的情况下,这时这三个状态可以是在两个 可辨别浓度下存在识别剂或不存在识别剂,则该合成将用基数3代 码确定。在本文中,这种M>2的基数M代码称作高级代码。与二进 制代码相比高级代码的优点是可用较少的识别剂来编码相同量的 关于合成的信息。所产生的产物将被定义为是由一系列合成所产 生的。在合成的每个阶段,存在许多反应物和/或试剂和/或条件, 它们产生了与可识别的和通常可分离的本体如标示物有关的产物 的特性。关于反应物和试剂,意图是指反应物能多数引入到产物中, 例如基酸、核苷酸、亲核试剂、亲电子试剂、二烯、烷基化剂 或酰化剂、二胺或任何其它合成纤维等,而试剂则可以或不可以引 入到产物中,例如、酸、热量、氧化剂或还原剂,但反应物和试 剂均包括在术语“试剂”中。该合成方法中可涉及到可引入到产 物中的单个反应物。另外,阶段可包括一个或多个使反应中间体改 变的反应。在许多情况下,将包括这些可能性的组合。
使用基数2或二进制代码(M=2)和三个识别剂(N=3),则在合成 中的一个给定阶段中编码8(23)个试剂。如果三个识别剂表示为 T1、T2、和T3,每个识别剂在存在时或不存在时分别表示为“0” 或“1”,那么8个不同试剂可用二进制代码表示如下:     试剂1     试剂2     试剂3     试剂4   T1,T2,T3     0,0,0     1,0,0     0,1,0     1,1,0     试剂5     试剂6     试剂7     试剂8   T1,T2,T3     0,0,1     1,0,1     0,1,1     1,1,1
同样,用更多的识别剂可以编码更多的关于合成的信息。例如, 9个识别剂(N=9)和基数2代码(M=2)可编码高达29或512个不同的试 剂选择。使用基数3代码(M=3)和三个识别剂(N=3),可编码27个(33 )试剂选择。如果这三个识别剂表示为T1,T2和T3,不存在识别剂时 表示为“0”,识别剂以~0.5微微摩尔/小球量存在时表示为“1”, 识别剂以~1.0微微摩尔/小球量存在时表示为“2”,那么,这27 个不同试剂可用三个识别剂的基数3代码表示如下:     试剂1     试剂2     试剂3     试剂4    T1,T2,T3     0,0,0     1,0,0     2,0,0     0,1,0     试剂5     试剂6     ……     试剂27    T1,T2,T3     1,1,0     2,1,0     ……     2,2,2
为了使这种高级编码图切实可行,应将一种给定量的(例如-1.0 微微摩尔/小球)附加识别剂加入到该库的所有成员中以便提供一 个标准,与这个标准对照可测定出所有识别剂的量。用各种检测方 法经气相色谱或HPLC可测定出这些识别剂的量。在HPLC情况下,如 果识别剂用不同量的放射性核素如氚(3H)进行放射性示踪,那么通 过闪烁计数可方便地测定出这些识别剂的量。通过测定3H与14C之 比可特别容易地进行定量,因此,使用14C作为标准。在这种方法中, 可辨别出10个3H的量,从而得到了基数10或十进制代码(M=10),用 为数很少的识别剂该代码可编码大量信息。
产物和合成方法
本发明方法的产物多半是有机化合物,在此该连续合成将包括 加入或除去化学单元,反应包括改变或引入一个或多个官能团,开 环作用,闭环作用等。化学单元可呈许多形式,可以是天然形成的 和合成的,例如亲核试剂、亲电子试剂、二烯、烷基化剂或酰化剂、 二胺、核苷酸、氨基酸、糖、类脂类、或它们的衍生物、有机单体、 合成纤维,和它们的混合物。另外,反应可包括产生烷基化、酰化、 硝化、卤化、氧化、还原、水解、取代、消去、加成等作用的反 应。该方法可产生极少量的非低聚物、低聚物或它们的混合物,其 中反应历程和在适当情况下的成分可由存在的标示物确定。非低 聚物包括各种各样的有机分子,例如杂环、芳族、脂环族、脂族分 子及其组合分子,包括类固醇、抗菌素、酶抑制剂、配位体、激素、 药、生物碱、类鸦片、萜烯、卟啉、毒素、催化剂,以及它们的混 合物。低聚物包括低聚肽、低聚核苷酸、低聚糖、聚类脂类、聚 酯、聚酰胺、聚尿烷、聚脲、聚醚、聚(磷衍生物)例如磷酸酯、 膦酸酯、磷酰胺、膦酰胺、亚磷酸酯、亚磷酰胺等、聚(硫衍生物) 例如砜、磺酸酯、亚硫酸酯、氨磺酰、亚磺酰胺等,其中对磷和 硫衍生物来说,指出的杂原子多半将结合到C、H、N、O或S上,和它 们的混合物。
反应可包括在中心核分子结构的各种任意位置上的变型或在 特定位置上的变型。例如,人们可以溴化一种多环化合物,其中溴 化作用可在许多位置上发生,或者使用溴化剂,该溴化剂对特殊位 置具有专属性,例如N一溴琥珀酰亚胺。这些反应多半将涉及单一 位置或等价位置,例如,乙二醇的两个羟基中的一个羟基。
本发明的合成反应大部分具有至少两个阶段,其中除了双官能 化合物外,化合物是用相同的连接官能团连接,例如氨基酸和酰胺 键、核苷酸和磷酯键、或它们的类似化合物,例如氨基异氰酸酯和 脲键。
本发明的方法允许在每个阶段的反应有所变化,这取决于所选 择的试剂和所用的条件。合成方法将随人们希望制备的产物的性 质而变化,因此,该方法必须考虑分段改变产物性质的能,同时能 够保持前面阶段的结果,并预先考虑到以后阶段的需要。
在研究合成方法中,人们可以进行少数化合物的分批合成,这 些化合物将在组合合成过程中制备。通过一些极限实例,人们可优 选条件以提高化合物的产率,这些化合物用其他方法不能形成或只 以低产率形成。人们可使用分批合成法,这些方法提供了比组合完 成法更高浓度的特产物,以开发一些说明化合物活性的检测法。
载体:连接和分离
合成方案要求人们提供许多不同的反应,这些反应涉及在合成 的每个阶段产生许多不同中间体的不同反应物。尽管其他技术也 是适用的,这可通过使用可确定的小固体基质而很容易地实现,例 如市售的小球,这些小球可容易混合,分离,并可用作连续合成的固 体基质。这些固体基质可以是固体的、多孔的、可变形的或坚硬 的,并且具有任何适合的结构和形状。在某些情况下,磁性小球或 荧光小球也是适用的。这些小球的直径通常为至少10-2000μm,优 选至少20-500μm,更优选至少50-250μm。
任何适合的成分均可用于颗粒或小球中,该小球成分应具有下 述特性:在各种加工阶段保持其机械牢固性,可被官能化,具有官能 基或可与活性物反应,可以连续合成以及连接识别剂,可容易地混 合和分离,并且能够容易地与标示物和产物分离。可使用的小球包 括纤维素小球、微孔玻璃小球、硅胶、聚苯乙烯小球、接枝共聚 物小球如聚乙二醇/聚苯乙烯、聚丙烯酰胺小球、胶乳小球、二 甲基丙烯酰胺小球;特别是与N,N′-二-丙烯酰乙二胺交联的物质, 包括N-叔丁氧基羰基-β-丙氨酰-N′-丙烯酰六亚甲基二胺、复合 物,例如涂有疏水聚合物如交联的聚苯乙烯或接枝线性聚苯乙烯的 氟化乙烯聚合物的玻璃颗粒等。
根据合成过程或最终产物的检测方法的特性,各种各样的小球 大体上是合乎要求的。尽管小球是特别适合的,其他的固体载体也 可使用,例如毛细管、空心丝、针状体、固体纤维等,这时固体载 体的大小在反应过程中可根据需要而变化。
根据合成方法的特性,这些小球可用各种方法官能化以便能够 连接初始反应物。这些反应物可通过非易变键连接,例如酯键、酰 胺键、胺健、醚键,或通过硫、硅或碳原子连接,这取决于人们是 否希望从小球上能够除去产物。适合的是,连到小球上的键可以是 永久性的,但在小球和产物之间可提供一个连接体,该连接体是可 裂开的,如表1所列举的连接体。可使用两个或多个不同的键以便 可有区别地释放标示物和/或产物。
根据连接到颗粒上的连接基的性质,小球上的活性官能团可以 不是必须的,在此连接的方式应便于引入单键或双键,例如可用碳 烯和氮烯或其他高活性物来实现。在这种情况下,将可裂开的键提 供于连接基,该连接基将产物或标示物连接到小球上。
希望的是,当产物是永久性地连接时,与小球连接的键将是持 久的,以便在筛选过程中,小球在空间上不与产物的连接相干扰。 可使用各种键,特别是亲水键,例如聚乙烯氧基、糖类、多元醇、 酯、酰胺、它们的组合等。
存在于小球上的官能团可包括羧基、羟基、偕卤代亚胺、氨 基、硫代、活性卤素(Cl或Br)或假卤素(例如-CF3、-CN等)、羰基、 甲硅烷基、甲苯磺酰基、甲磺酰基、对溴苯磺酰基、三氟甲磺酰 基等。在选择官能团中,应考虑到识别剂通常也将连接到小球上。 这些考虑将包括相同的或不同的官能团是否应与产物和识别剂相 联系,以及这两个官能团是否与适合的产物或识别剂的连接和标示 物的分离阶段相适应。不同的连接基可用于产物,以便可选择释放 出特定量的产物。在某些情况下,颗粒可具有保护的官能团,这些 官能团可在每个阶段之前部分或完全脱保护,在完全脱保护的情况 下可以再保扩。例如,在多肽合成中氨基可用苄酯基保护,羟基用 苄醚保扩等。
在需要产物分离时,可使用许多官能团和反应物。适合的是, 可使用醚,其中取代的苄醚或其衍生物,例如二苯甲基醚、2,3-二 氢化茚基醚等,可用酸性或温和的还原条件分裂。另外,人们可使 用β消去反应,其中可用弱碱来释放出产物。可使用乙缩,包括 其硫代类似物,其中弱酸是适合的,特别是在俘获羰基化合物存在 下。通过将甲醛、HCl和醇部分混合,形成了α-氯代醚,然后在小球 上与羟基官能团偶联形成了乙缩醛。可使用对光敏感的键合,例如 7-硝基2,3-二氢化茚基、2-硝基二苯甲基醚或酯等。酯或酰胺可 用作连接体,其中特别是与环酐反应,接着在使用偶合剂如碳化二 亚胺的情况下通过与小球上的羟基或氨基官能团反应,形成了半酸 性酯或酰胺。可使用肽作为连接体,其中该序列经过了酶催化水解, 特别是其中酶识别了一个特殊的序列。可用碳酸衍生物,如光气、 羰基二味唑等和弱碱制备碳酸酯和氨基甲酸酯。特别是对碳酸酯 来说,该键合可用酸、碱成强还原剂(如LiAlH4)分裂。可分裂键的 一览表参见,例如,Greene和Wuts,《有机合成中的保护基》,第二 版,Wiley,1991。已经开发出的各种体系的多方面的适应性可使产 物和识别剂的连接和产物和标示物的不同分离的条件在较宽范围 内随意变化。
下表给出了各种示例性的连接单元(即式I中的F2)和它们可 分裂的方式:
表1.各种示例性的连接单元和它们可分裂的方式     连接基     分裂试剂     甲硅烷基     氟化物或酸  A  hv  B  Ce(NH4)2(NO3)6  -NCO2(L)*  OH-,H+,或LiAlH4  C  O3,OsO4/IO4-,或KMnO4  D  1)O2或Br2,MeOH  2)H3O+  -Si-(L)  氧化作用等H+,Br2,Cl2,  E  H3O+  F  H3O+  G  F-或H+  H X=、酯、酰胺、       NO2、硫化物、       亚砜、砜、和相       关的吸电子基   碱  OH-  I   H3O+或还原作用(例如   Li/NH3)  J   (φ3P)3RhCl(H)  K   Li,Mg,或BuLi  M   Hg+2  N  X=卤素或假卤素   Zn或Mg  O   氧化作用(例如Pb(OAc)4   或H5IO6)  P  X=吸电子基   碱
(L)表示标示物或产物的连接点。







L是或者直接连接到指示原子或通过连接基如C(O)O间接连接到指 示原子上的标示物或产物,该连接基可提供适合的官能团。
R是H或低级烷基。
连接体
对配位体来说连接体的选择将是合成方法的一部分,因为该连 接基在产物上可产生剩余官能团。产物与小球分离后对其进一步 改性通常是困难的,但也是有可能的。在设计合成方法中,可用保 留在产物中的一个官能团作为连接基的连接点。另外,当产物的性 质允许时,人们可采用分裂或分离方法除去连接官能团,例如,用金 属氢化物或酸来除去芳硫基醚或甲硅烷基。因为在许多情况下,该 合成方法可包括一个用于连接的官能化部位,在选择连接基时,该 官能团优先使用。在某些情况下,要求在产物与载体的连接部位具 有不同的官能团,这需要使用不同的连接方式,这些连接方式必须 适应相同的分离方法或不同的分离方法,这些方法可同时进行或连 续进行,例如用光照射和酸性水解。
用于将识别剂与颗粒连接的特别有意义的连接基是碳烯和氮 烯,该碳烯和氮烯可插入到碳和氢原子之间形成共价键,或插入到 烯烃键中形成环丙烷(在碳烯情况下)或氮丙啶(在氮烯情况下)。
各种取代的苯可与碳烯成氮烯连接基一起使用,其中苯被一个 可提供碳烯的基团:CHN2、COCHN2、SO2CHN2;或可提供氮烯的基团: N3、NO2、NO、SO2N3所取代。碳烯可由重氮基烷烃衍生物通过光 解、热解,或用低价过渡金属化合物如Rh(OAc)2处理而产生。氮烯 可由叠氮化物通过光解或热解而产生,和由硝基、亚硝基和叠氮化 物通过使用三价磷化合物或低价过渡金属而产生。
特别有意义的一类连接体部分(F1-F2-)包括2-硝基-4-羧基苄 氧基、2-硝基-4-重氮乙酰基苄氧基、4或5叠氮基甲基羰基-2-甲 氧基苯氧基、和2-甲氧基-4,或5-羧基苯氧基部分。
其中T代表标识物,Z代表碳烯或氮烯前体或羧基,R是H或低级 烷基的示例性化合物如下:对于光化学标示物分离(例如用约350nm 紫外光):T3-Z-2-硝基苄醚、T4-Z-2-硝基苄醚、T5-Z-2-硝基苄醚、 T6-Z-2-硝基苄醚、T2-Z-4-硝基苄醚、T3-Z-4-硝基苄醚、T3- Z-2硝基苄基碳酸酯、T5-Z-2-硝基苄基碳酸酯、T6-Z-2-硝基苄基 碳酸酯、T2-Z-4-硝基苄基碳酸酯和T3-Z-4-硝基苄基碳酸酯。对 于氧化分离(例如用硝酸高铈铵):1-OT-2-OR-3-Z-苯、1-OT-2-OR -4-Z-苯、1-OT-2-OR-5-Z-苯、1-OT-2-OR-6-Z-苯、1-OT-4-OR-2 -Z-苯和1-OT-4-OR-3-Z-苯。对于还原或烷基化分离(例如用锂/ 氨或甲基碘):T(2-Z-苯基)硫醚、T(3-Z-苯基)硫醚、和T(4-Z-苯 基)硫醚。对于脱甲硅基分离(例如用氟化四丁基铵或酸):T二烷基 -(2-Z-苯基)甲硅烷基醚、T二烷基-(3-Z-苯基)甲硅烷基醚、T二烷 基-(4-Z-苯基)甲硅烷基醚、T-二烷基-(2-Z-苯基)硅烷、T-二烷 基-(3-Z-苯基)硅烷和T-二烷基-(4-Z-苯基)硅烷。
组合合成
该合成方法通常包括具有至少2个选择的阶段,可包括10个选 择或更多选择。通常,每个阶段的选择数量将不超过约100,更优选 不超过约50。阶段的数量通常至少为约3个,并不多于约30个。
这些选择和阶段的数量通常使得至少一些化合物可具有足够 的变形,以提供至少一种化合物具有所需特性的适合的可能性。通 常这意味着有至少20种化合物,但可以有106或更多化合物。
反应过程
在进行合成反应时,人们可先从许多小球开始,通常有至少103 个小球。根据第一阶段中选择的数量,将这些颗粒分开相应地装 入许多容器中。人们可使用微量滴定井板、分隔容器、柱、凝胶、 Terasaki板、烧瓶、Merrifield合成容器等。这些颗粒通常被分 成几个组,每个组有至少一个颗粒,一般有许多颗粒,通常有1000或 更多个颗粒。
然后将适合的试剂加入到分隔容器的每个容器中,在阶段中对 试剂进行处理,并加入编码试剂和阶段的识别剂。每个阶段将提供 所需的反应。一旦反应完成,可洗涤小球,使其不带任何试剂,接着 将所有的小球合并在一起,然后根据下个阶段选择的数量将这些小 球分开。重复进行分开小球、接着标记和合成阶段(或反之亦然)、 然后再合并小球这个过程,直到组合合成完成。
在某些情况下,可在2个或多个容器中进行相同的反应,以便提 高与其他选择相比在特殊阶段下进行特殊反应的产物的比例。在 其他情况下,一个或多个阶段可包括一部分被搁在边上而未经过反 应的小球,以便提高与最终产物相关的变化性。在其他情况下,批 料可沿不同的合成路线进行。
为了标出或编码在每个阶段小球上的合成历程,用其特有的识 别剂组合来标记与每个选择和阶段有关的小球。另外,人们可使用 单个标示物来标出或编码该合成历程。根据所涉及的化学性质,可 在包括每个选择的反应之前、之后或同时进行标记。此外,作为对 比,可在任何阶段选出样品小球,分解出一部分小球的标示物并解 码以验证连接在样品小球上的标示物的正确性。
如上所述,在某些情况下,将部分颗粒分成小部分,然后将每部 分颗粒进行不同的反应系列。任何时候都可将这些部分的颗粒再 合并成单一的混合物以用于以后的反应。
产物的合成完成之后,或者在从小球分离配位体之后或者在仍 然连接的时候,对产物筛选所需的特性。
在合成过程不包括阶段地加入相同单元或反应副产物形成的 情况下,有可能出现下列情况,即在单一小球上有许多化合物或活 性化合物的结构从其反应历程不可得知。根据本发明,由于知道合 成历程,人们可在批量地重复合成过程,得到足够量的产物,以便分 离出产物和在结构上识别活性化合物。
可制备各种各样的药物类似物,例如下列药剂的类似物:抗高 血压剂,例如埃那拉普利尔;β-阻滞剂,例如心安;抗溃疡药(H2 -受体拮抗药)例如甲腈咪胍和呋喃硝胺;抗真菌剂(胆固醇脱甲基 酶(demethylase)抑制剂)例如异康唑;抗焦虑药,例如安定;止痛药, 例如阿司匹林、苯乙酰胺和芬太尼;抗生类,例如万古雷素、毒雷 素和先锋雷素;消炎药,例如可的松;避孕药,例如孕激素;堕胎药, 例如RU-456;抗组胺药,例如扑尔敏;镇咳药,例如可待因;镇静药, 例如巴比妥等。
识别剂
本发明的识别剂可用式I表示:
F1-F2- C-E- C′         I
其中F1-F2是能够连接到载体上和从载体上分离标示物的连接体;
C-E- C′是能够测定和识别的标示物;
E是标示物组分,该标示物组分(a)可测定,例如用气相色谱法 或质谱法可分析出的电泳基团或(b)可测定和分离;
C和 C′是标示组分,该组分可从所有其他标示物中个别地识别 出一个标示物,通常可通过改变取代基长度或取代部位而分离,例 如,改变色谱保留时间或质谱比例m/e;
F2是能够选择分裂以释放标示组分的连接组分;
F1是提供连接到载体上的官能基;或
当F1是可分裂基团,例如OH或羧基时,F2是单键。
虽然在组合合成过程中一般是在每个适当的阶段和选择加入 式I的识别剂,但是,部分E可在从基质分裂(优选光化学分裂或氧 化分裂)之前或之后在合成结束时加入。具体地说在 C含有OH、 NHR4或SH时,E可在分裂之前连接到 C上。另外,如E是在分裂之后连 接,那么在 C上的连接点可以是F2的连接点。这在下页的合成路线 中举例说明。

其中S=基质,并且
n=1-40。
可用下式表示识别剂与基质的连接:
F1-F2- C-E- C′+S→S-F1′-F2- C-E- C′其中F1′-F2- C-E- C′表示 与基质相连的识别剂残基。例如,当小球以氨甲基进行功能化并且 F1是CO2H时,那么F1′是-C(O)-;当小球含有不饱和键并且F1是 N2CH-C(O)-时,那么F1′是=CH-C(O)-或-CH2-C(O)-。
用作识别剂的特别重要的化合物是结构式Ia的式I化合物:
F1-F2-( C(E- C′)a)b       Ia
其中:
F1是CO2H,CH2X,NR1R1,C(O)R1,OH,CHN2,SH,C(O)CHN2, S(O2)Cl,S(O2)CHN2,N3,NO2,NO,S(O2)N3,OC(O)X,C(O)X, NCO,或NCS;
F2是 -Si(R1)2A-,-Si(R1)2-, -OSi(R1)2-, -NC(O)O-,-CR1=CR1-(CR12)2-,-CR1=CR1-C(R1)2-, -C(R1)2-CR1=CR1-, -C(R1)2A-,-O-C(R1)2A-, -Si(CH3)2-(CR12)2-A-,-R3-(CR12)2A-, -CR1=CR1-C(R1)2-A-,
-S-C(R1)2A-,  -C(X)R1-C(R1)2A-,
-C(OH)R4-C(R1)2A-,-C(OH)R1-C(CH2X)R2-,
-C(OH)R1-C(R1)2-C(X)R1-,-C(OH)(CH2CH2X)-,


A是-O、-OC(O)O-、-OC(O)-或-NHC(O)-;
C是单键、被1-40个F、Cl、Br、C1-C6烷氧基、NR4R4、OR4或NR4作意取代的C1-C20亚烷基、或者-[(C(R4)2)m-Y-Z-Y-(C(R4)2)nY-Z-Y]p-;但须 C+ C′中的最大碳原子数优选为20;
C′是H;F;Cl;被1-40个F、Cl、Br、C1-C6烷氧基、NR4R4、OR4或NR4任意取代的C1-C20亚烷基,或者-[(C(R4)2)m-Y-Z-Y-(C(R4)2)nY-Z-Y]p-;E是被1-20个F、Cl或Br取代的C1-C10烷基;或者Q-芳基, 其中芳基被1-7个F、Cl、NO2、SO2R5或取代苯基取代,其中苯基的 取代基是1-5个F、Cl、NO2或SO2R5;
E-C′可以是-H、-OH或氨基;
R1是H或C1-C6烷基;
R3是C=O、C(O)O、C(O)NR1、S、SO或SO2;
R4是H或C1-C6烷基;
R5是C1-C6烷基;
a是1-5;
b是1-3;
m和n各自是0-20;
p是1-7;
Q是单键、O、S、NR4、C=O、-C(O)NR5、-NR5C(O)-、-C(O)O-
或-OC(O)-;
X是诸如Br、Cl、三氟甲磺酰基、甲磺酰基、甲苯磺酰基或 OC(O)OR5的离去基团;
Y是单键、O、S、或NR4;
Z是单键;被1-4个F、Cl、Br、C1-C6烷基、C1-C6烷氧基、C1-C6取 代烷基[取代基是1-13个F、Cl或C1-C6取代烷氧基(取代基是1 -13F、Cl或Br)]任意取代的亚苯基;(C(R4)2)1-20;或(CF2)1-20;但 须,当Z是单键时,与Z相邻的一个Y也是单键;以及
芳基是含有不多于10个碳原子和不多于2个选自O、S和N的杂原子 的单环或双环芳环。
在式Ia中的F2的定义中,所示出的左边的键与F1相连。
式Ia′的化合物也可用作识别剂:
F1-( C(E- C′)a)b           Ia′
其中
F1是OH或COOH;并且其余基团的定义与式Ia相同。
优选的式Ia化合物是下面这些化合物,其中:
F1是
CO2H,OH,CHN2,C(O)CHN2,C(O)X,NCS,或CH2X:
F2是


C和C′各自独立地是未取代的或被1-40个F或Cl取代的C1-C20亚烷 基,或者[O-(CH2)2-3]p;E是被1-20个F或Cl取代的C1-C10烷基;Q 芳基,其中芳基是被1-7个F或Cl取代的双环芳环;或被1-5个F、Cl、 NO2或SO2R5取代的Q-苯基;以及
Q是单键、O、-NR5C(O)-或-OC(O)-。
优选的式Ia化合物是其中- C(E- C′)a代表-(CH2)3-15-(CF2)1-15F、-(CH2)3-15-(CCl2)1-15Cl、-(CH2CH2-O)1-5-Ar、 -(CH2CH2CH2O)1-5-Ar或-(CH2)1-12-O-Ar的那些化合物;
其中Ar是五氟、五氯或五溴苯基;2,3,5,6-四氟-4(2,3,4,5,6-五 氟苯基)苯基,2,4,6-三氯苯基,2,4,5-三氯苯基,2,6-二氯-4-氟苯 基或2,3,5,6-四氟苯基。
其他优选的式Ia化合物由下列结构式代表:


其中Ar是五氟、五氯或五溴苯基;2,3,5,6-四氟-4(2,3,4,5,6-五 氟苯基)苯基,2,4,6-三氯苯基,2,4,5-三氯苯基,2,6-二氯-4-氟苯 基,或2,3,5,6-四氟苯基。
其他优选的式Ia化合物是那些其中E- C′是H、OH或NH2的化合 物。这些化合物用来在组合合成的最后与E反应特别有用,用来与 通过荧光或电子捕获识别的E反应更是如此,如丹磺酰氯或多卤代 苯甲酰卤化物。
式I化合物可根据下列示例性的合成路线或其他本领域技术 人员已知的方法制备。
                     合成路线1
              氧化裂解连接体的识别剂


    合成路线2 另一氧化分离连接体的识别剂


      合成路线4
光解裂解连接体的识别剂

      合成路线5
氧化裂解连接体的识别剂


识别剂可以含有一个或多个相同的标示物。识别剂将是单个 的化合物,这些化合物可以从其他化合物中区分出来并将独一无二 地识别出不同的选择和阶段。照这样,就可以用相对少量的识别剂, 通常少于50个标示物,制备很大的组合库。在每阶段都将加入一组 识别剂,该组识别剂就决定了所述的阶段和选择。每个识别剂将以 共价键的形式或非共价键的形式与小球或产物连结在一起,但通常 是与小球连结在一起。识别剂的组合在每阶段用于提供二进制代 码或其他代码,借此代码就决定了选择和阶段。该组识别剂可包括 零个或仅仅一个识别剂。
标示物
至于标示物( C-E- C′),被使用的标示物具有下列特征:通过取 决于F2的方法,优选光解或氧化,可从小球上除去;可被单独稍稍分 开,通常是分开着的;在合成条件下是稳定的;可编码阶段或选择, 这样可在合成的每一阶段独一无二地确定使用试剂的选择;最好具 有识别各种标示物的简便方法,该方法使用不需复杂技术水平即可 操作的易得设备;这些设备应相对便宜并能基于少量的分子提供较 强的信号;并且标示物应提供足够的敏感性,从而使得标示物能从 其他在标示物测定时存在的成分中区分开来。
标示物在结构上可以是有联系的或无联系的,如可以是同系物 系列、重复的官能团、周期表中的有关元素、不同的同位素、上 述情形的组合等。标示物可用作二进制代码的单元,这样一个标示 物可决定两种选择,两个标示物可决定四种选择,三个标示物可决 定八种选择,五个标示物可决定三十二种选择,等等。因此,在合成 的每个阶段,相对少量的标示物可指明大量数目的选择。对每一阶 段来说,包括识别剂的标示物与其他阶段可以有关也可以无关。对 于任何组合合成,每个标示物都必须使其能够从其他标识物中区别 开来。
每个小球通常具有至少0.01毫微微摩尔、更经常地是具有0. 001-50微微摩尔的每种标示物。产物的数量也可至少在相同的范 围以及多达至少104或更多。取决于小球的数目、阶段的数目以及 每阶段选择的数目,产生的产物数目通常超过102,更经常超过103, 并可超过1010。
标示物大部分是有机分子。每个标示物除氢外含有的原子数 通常少于约100、更经常是少于约80、一般少于约60;这不包括连 接部分的原子数,连接部分在从小球上分离标示物时将不被保留。 连接部分可以是任意大小,通常除氢外包括的原子数少于约30,更 经常是少于约20。连接部分的大小不是关键性的,但应以方便为宜。 标示物可形成一类化合物,此时所有的化合物都具有类似的性质; 标示物也可以是不同类化合物的组合,此时化合物可以是脂族、脂 环族、芳香族、杂环化合物或这些化合物的组合。区别特征可以 是若干个重复单元,如烷基部分中的亚甲基,聚亚烷基氧部分中的 亚烷基氧基,多卤化合物中的卤素,α-和/或β-取代的乙烯类化 合物,其中取代基可包括烷基、氧基、羧基、氨基、卤素等;同位 素等。
标示物分析
依据基团F2的性质,可采用还原、氧化、热解、水解或光解条 件从小球上除去标示物。
可借助于物理性质的差别区分标示物,如借助于标示物的分子 量,或者气相或液相色谱的色谱保留时间。位置异构体可具有不同 的保留时间。如果位置异构体或立体异构体不适于物理分离,那么 为了得到所需要的分离,人们可以使用与不同数目的单元如亚甲基 或亚乙基氧基相连的可变数目的取代基,例如卤素(如氟)、甲基、 氧基或其他侧链。也可使用放射性同位素比例,例如14C和3H,这里 放射性同位素可提供有差别的辐射。物理性质的差别,如质量数, 可提供有关选择和阶段的信息。
除了使用14C/3H比例外,人们还可使用一定组合的非放射性 同位素,例如-CHmDn,其中m是0~3并且n是3-m。例如,应用质谱检 测至多四个不同甲基的可变数量,人们可确定很大数目的选择。
当E是单键并且C′是H时,从载体上释放得到的标示物具有与标 记试剂反应的活性官能团,该标记试剂引入了可检测的标示物成分 E。为方便起见,官能团可以是双键,尤其是活化的双键,羟基,硫代 基、氨基、羧基等。然后,标示物再与过量的标记试剂反应,从而 提供用于分析的产物(E- C)。这样,作为识别系统的一部分,可以使 用各种各样的标记试剂,而这些标记试剂可以不与所需产物的合成 策略相匹配。可用于检测的标记试剂包括卤代芳烃(例如全氟苄基 溴)、荧光物质(例如丹磺酰氯)、放射性同位素、化学发光物质等。
尽管已经给出了示例性的标示物和反应,但应当理解,许多其 他的组合也可以使用。
依据标示物的化学和物理性质,应当选择适宜的分离方法,理 想的分离方法选自各种色谱法,包括气相色谱(GC),液相色谱(LC), 特别是高效液相色谱(HPLC),薄层色谱(TLC),电泳等。除了色谱法, 还可通过质量数用质谱来分离。标示物包括:
对于GC:具有不同分子量的化学惰性有机分子,包括烷烃、烯 烃、芳烃、卤化碳、醚、醇、硅烷、硫醚等,尤其是卤代化合物, 这些化合物带或不带其他官能团,可用电子捕获检测或质谱检测( MS)与毛细管GC分离相结合进行分离,以及用原子发射检测与毛细 管GC分离相结合进行分离的带有有机化学中非常见元素(例如Sn, Ge)的化合物;
对于LC、HPLC或TLC:见上述对于GC的化合物,可方便分离的化 合物是直链醚或烃,这些化合物带有用于分离后经放射性检测的放 射性同位素取代基或放射性同位素组合取代基,或者这些化合物带 有用于分离后经荧光检测的适宜取代基;
对于电泳:见上述,特别是官能团带电分子,例如阳离子或阴离 子、尤其是有机或无机酸基,这里的分子可通过带有在电泳中检测 的可检测放射性同位素或荧光性物质而进一步改性;
对于质谱:见上述,特别是由于下列因素引起的不同质数:不同 的同位素,相同官能团或不同官能团的不同数目,同系列的不同数 目,或这些因素的组合。
标示物彼此之间的分离可涉及到单一的技术或组合的技术,例 如色谱和电泳;气相色谱和质谱等。
本发明的标示物具有使其在很低含量的情况下可被检测的性质, 检测到的含量通常不大于毫微摩尔,优选不大于微微摩尔或更少, 更优选不大于毫微微摩尔或更少,检测是在很高含量的其他化合物 存在下进行的。为此,可能用到特殊的原子取代,用以提供易被检 测的标记。这些取代包括:
(a)被电负性元素如氟或氟取代,检测时用电子捕获检测与毛 细管GC或负离子质谱检测相结合;
(b)被非常用元素(不包括C、H和O)取代,检测时用原子发射检 测与毛细管GC相结合;
(c)被几个非常用元素取代,用原子发射检测以确定元素间的 比例;
(d)被放射性元素如3H取代,用放射自显影法或闪烁计数法与 LC、TLC或电泳相结合检测;
(e)被具有不同发射频率的若干个放射性元素如3H和14C取代, 用放射自显影法或闪烁计数法确定不同放射性元素间的比例。
对于单元素取代(上述a.,6.,d),A个标示物(可检测出其存在 与否)的可分离的混合物能够编码出多达2A个不同的合成方式。对 于多元素取代(见上述c和e),A个标示物(各自具有B个可区分的状 态,例如不同的3H/14C比例,不同的Si/Sn比例)的可分离的混合 物能够编码出多达BA个不同的合成方式。
存在有许许多多的同位素,这里同位素的存在或比例可提供关 于阶段和选择的信息。同位素可以是放射性的或非放射性的。特 别有意义的同位素包括氘、氚、14C、32P 、131I等。
通过使用同位素改性化合物的混合物,人们能够极大地拓宽从 单个标示化合物获得的信息,而区别该标示化合物的唯一依据是同 位素的存在。例如,人们可制备一定比例的氢与氘的混合物,其中 各种比例的区别可小到10%。通过用另一种原子,例如氟,取代氢,人 们可得到氢、氘和氟的不同变化的混合物,从而提供很大数目的不 同的可区别标示物。
其他可能涉及到的基因可以是芳环,该芳环可在不同的位置用 不同的官能团取代。因此,通过取代的苯环,这里取代的位置和取 代的性质可被确定,人们可获得可被区分的许多分子以及阶段和选 择方面的信息。例如,如果 C保持不变,当E是多卤代芳环时,人们可 通过E上的取代类型进行检测和区分。
也存在使用荧光标示物的可能性。尽管单独的荧光标示物用 很大数目的选择不能足以确定很大数目阶段,但参考上面所述,通 过基于 C或 C′中的变化提供分离荧光标示分子的方法,人们通过标 示物的荧光可分别检测到标示物。
与具体小球相连接的标示物混合物可被分割开,并可进行初步 分离,此处需要分别检测每个标示物。一旦该组标示物被分离开, 就可依据标示物的具体官能团和与众不同的性质分析每个标示物。 可以使用的检测具体标示物的各种技术包括放射自显影法或闪烁 计数法、电子捕获检测、负离子或正离子质谱、红外光谱、紫外 光谱、顺磁共振光谱、荧光等。
另一个成分可具有至少6个不同的标记,这些标记在一个化合 物子库(kit)或普通介质中相互关联,每个标记带有一个本质上化 学惰性的可区分部分,彼此之间分子量不同。所述标记的结构式如 下:
(1)Λ-{Δ-(T)α或(T)α-ΔorΔ1-(T)α-Δ2} 其中Λ是连接基团,该连接基团带有与固体载体相连接的官能团和 用于与固体载体相分离的官能团,用于分离的官能团可以包括在连 接固体载体的官能团之中;
Δ是区分基团,该基团使得每一个标记通过其物理性质以及通 过除荧光以外的方法与其他标记相区分,从而提供能够编码多步骤 合成方法的一套标记;该区分基团包括分割后的剩余官能团,该官 能团已事先与连接基团相连接;
Δ1和Δ2是区分基团部分,它们一起限定了区分基团;它们连 接在一起时就落入Δ的定义之中;
T是可检测基团,当其与区分基团连接时使得能够检测到低含 量的标记,这里可检测基团可以存在在子库中的标记上或后来被加 到区分基团上,并且如果连到连接基团上,可检测基团包括分离后 剩下的任何官能团,这些官能团事先与连接基团相连接;
以及α是0或1,表示可检测基团存在或不存在;
(2)ss-(Λ′-{Δ-(T)α或(T)α-Δ或Δ1-(T)α-Δ2})β 其中所有的符号同前述定义,但下面的定义除外:SS是固体载体;Δ′ 是以共价键形式与SS相连的连接基团;以及β对每个固体载体来说 者是整数,该整数至少为6并通常不大于约30;
(3)Λ″-{Δ″-(T)α或(T″)α-Δ或Δ′1-(T)α-Δ2} 其中所有的符号同前述定义,但下面的定义除外:Δ″是氢或经过 导致与固体载体分开的光解裂解、消去或其他化学反应后的连接 基团的残基;Δ″或Δ″,作为标记与固体载体分开的结果,分别是 Δ或Δ1或改性的Δ或Δ1;作为标记与固体载体分开的结果,T″是 T或改性的T;
(4)Tα-Λ-{Δ″-(T)α或(T″)α-ΔorΔ′1-(T)α-Δ2} 其中所有的标记同前述定义,并且Λ是单键或与T连接后连接基 团的剩余部分;但有一个附加条件是,只能有一个α是1。
鉴定
为了确定产物的所需性质,使用了许多鉴定手段和技术。
在筛选小球时,人们经常地或者使用单一的小球或者使用小球 混合物,确定小球或混合物是否是显示活性。于是混合物可包括 10、100、1000个或更多的小球。这样可迅速将一大类化合物筛分 成较小类的化合物。
有一个技术是人们在连接具体的双原子分子如受体时所感兴 趣的。在这种情况下,人们可进行两步筛选,从而人们首先使用连 接作为初次筛选,接着再通过具有生命力细胞的生物活性进行第二 次筛选。
鉴定可以使用单一颗粒或几类颗粒或其组合分步进行。例如, 进行组合合成后,约50至10,000个颗粒的组可在分立的容器中细分。 在每个容器中,对于每个颗粒,与颗粒相连的产物的一部分被释放 出来。分级释放可能是产物与颗粒不同连接的结果或是使用有限 量的试剂、条件等的结果,这样每个颗粒释放出的产物分子的平均 数目要少于每个颗粒的产物分子的总数目。那么人们在一个较小 体积中可得到产物混合物。该混合物可用于连接鉴定,这里,连接 可以抑制已知的连接配位体与受体的连接、活化或抑制细胞的新 陈代谢过程等。检测连接活性可以使用各种各样的鉴定条件,这在 下文将给以描述。一旦一个实验组显示出活性,就可以通过相同或 不同的鉴定筛选单个颗粒。当然,人们也可采用三步或四步法,这 里将大组分成较小的组等等,最后筛选出单一颗粒。在每种情况下, 颗粒上的部分产物将会释放出来,而得到的混合物将用于适宜的鉴 定中。鉴定可以是相同的也可以是不同的,在以后的步骤或最后步 骤中会用到更复杂和更耗时的鉴定。
人们也可提供空间排列,其中将颗粒分布在多孔盘中,多孔盘 的每个孔中具有0或1个颗粒。
可以使用科目分类法找到具有催化性质的化学物质,催化性质 的实例有水解活性,例如酯酶活性。为此目的,人们可将小球置入 被扩散性实验基质包围的半固体基体中。如果催化活性可以通过 不干扰基体的方法在局部测定,例如通过改变光的吸收或检测裂解 基质的荧光测定,那么在催化活性区的小球可被分离出来,它们的 标记也可以消除掉。
除了催化活性外,还可开发出带有抑制活性或活化活性的化合 物。可以找到这样的化合物,它们抑制或活化酶或者阻止连接反应。 为检测到抑制酶的小球,该小球具有带此所需性质的连接产物,有 利的是可从小球中释放产物,使该产物扩散到半固体基体中或滤料 上,而在基体中或滤料上可现察到抑制、活化或阻止作用。构成可 见的或换句话说可检测到的抑制、活化或阻止区域的小球,可被挑 选出来,并且标示物可以去掉编码。在这种情况下,合成产物的一 部分必须通过可裂解的连接、优选对光不稳定的连接与小球相连, 而标示物的一部分仍与小球相连,挑选出来后可通过与以前不同的 方法释放。
可以使用渗析膜,其中小球层与放射性标记配位体/受体对层 分开。小球层可用紫外光照射,从小球中释放出的产物将扩散到配 位体/受体对层,这里,放射性标记配位体将与化合物对受体的亲 合性成比例地释放出来。放射性标记配位体会反过来扩散到小球 层中。由于放射性标记与小球最接近,就可以分析与放射性发射有 关的小球。
寻找到具有生物活性的产物具有特别重要的意义。在某些应 用中,需要寻找到对存活细胞产生作用的产物,例如,能够抑制细菌 生长,抑制病毒生长,抑制基因表达或活化基因表达。在小球上筛 选化合物可以很容易地实现,例如,通过将小球嵌入到半固体介质 中,从小球释放出的产物分子库(而小球被保留)使得化合物向周围 的介质扩散。可以观察到某些效果,例如,细菌带产生了菌斑。还 可观察到生长抑制区域、生长活化区域或对基因表达产生作用的 区域,并且在区域中心的小球可以挑选出并加以分析。
一个鉴定方案涉及到凝胶,其中被作用的分子或体系例如细胞 被基本上均一地置入凝胶中。可以使用各种各样的凝胶试剂,例如 聚丙烯酰胺、琼脂糖、明胶等。然后将颗粒分布在凝胶中,以便颗 粒之间获得足够的分离,从而进行单独检测。如果所需产物具有水 解活性,凝胶中存在有能够提供荧光产物的基质。于是,人们为荧 光筛选凝胶,并机械地选择与荧光信号有关的颗粒。
人们可在凝胶中置入细胞,其作用是产生细胞带。如上所述, 可将颗粒分布开。当然,人们也可在凝胶中放置网格,限定有一个 颗粒或没有颗粒的区域。如果细胞毒性是鉴定标准,人们可释放出 产物,培育足够长的时间,接着将活体染剂分布在凝胶中。然后就 可区分出吸收染剂的细胞或没有吸收染剂的细胞。
如上所述,对细胞可进行遗传工程,以便在转换信号时能有所 显示。存在许多其基因已知的受体,这些基因的表达可被活化。通 过将外生基因嵌入某一部位,而在该部位的基因受到对该受体敏感 的促进剂的转录控制,可产生提供检测信号如荧光信号的酶。接着 就可分析与荧光细胞有关颗粒的反应历程。
化合物库和子库
为方便起见,提供了化合物库和/或子库。化合物库包括向其 中加入产物和标示物库的颗粒,从而可筛选连接小球的产物;或者 包括从小球中除去并且为了筛选被单独分组或以10-100-1000个化 合物为一组的产物。子库提供在进行化合物库合成时用作标示物 的各种试剂。子库通常具有至少4个、经常是至少5个、更经常是 至少10个在分立容器中的不同化合物,并可包括至少102个不同的 彼此分开的有机化合物,通常不多于约102个、更经常是不多于约 36个不同的化合物。对于二进制测定,检测方式通常为化合物分析 所共有,因此要有一个共有的生色团、一个共有的被检测原子等。 当予先制备每个识别剂时,每个识别剂的特征在于具有一个可区分 成分,该成分为能够被物理测量确定的选择和阶段编码,并包括共 有至少一个普通官能团的基团或全部化合物。
另一方面,子库可以提供这样的试剂,它们相互组合可提供各 种各样的识别剂。在这种情况下,子库包括若干个分开的第一类官 能团、经常是双官能团、通常是四个或更多个官能团的有机化合 物,一般是一个官能团为合成中的每个步骤服务,其中带官能团的 有机化合物共有一个相同的官能团,并能为至少一个测定性质所区 分。而且,人们还要有至少一个、通常是至少两个第二类有机化合 物,该类有机化合物能够与官能有机化合物的官能团反应,并能依 据每个所述第二类有机化合物的量形成可被区分的混合物。例如, 人们可使用二元醇、氨基酸或乙醇酸,其中各个双官能团化合物可 根据存在的氟或氯原子数目区分,从而确定阶段;人们也可以使用 碘甲烷,其中一类碘甲烷没有放射性同位素,另一类具有14C,还有 一类具有一个或多个3H。通过使用两类或更多类的碘甲烷,人们可 提供能够被其放射同位素发射所测定的各种混合物。另外,人们可 以使用一些能够用于二进制代码的第二类有机化合物。
如前所述,人们可使释放后的标示物与能够被检测的分子反应。 在这种情况下,标示物可以相当简单,具有与连接颗粒和连接检测 部分相同的官能团。例如,通过与羟基羧基连接,释放出了羟基,该 羟基可用能够被检测的分子酯化或醚化。再如,通过在二进制代码 中使用氟代烷基和氯代烷基的组合,氟和/或氯基团的数目可以确 定选择,而碳原子的数目表示阶段。
具有重要意义的化合物的基团包括与下列基团连接在一起的 连接体:取代的邻硝基苄氧基、2,3-二氢化茚氧基或芴氧基,或其 他能够进行光解或其他选择性解离的基团。连接基团可以是2-20 个碳原子的亚烷基,聚亚烷氧基、特别是2-3个碳原子的亚烷氧基, 4-8个碳原子的环烷基,卤代烷基、特别是2-20个碳原子的氟代烷 基,一个或多个芳环等等,其中连接体通过带有不同数目的单元和 /或取代基提供各种基团之间的差异。
可以商业产品形式提供单一的颗粒或若干种颗粒,尤其是当颗 粒显示出令人感兴趣的性质时更是这样。基于有关的标示物,可以 去除反应历程的编码。这样就可以大规模合成产物。当反应历程 能够明确地决定结构时,就可运用相同或类似的反应系列大批量地 生产产物。当反应历程不能明确地决定结构时,人们就要大批量地 重复反应历程;并用得到的产物进行结构分析。在一些情况下,可 能发现组合化学的反应系列不是大量生产产物的优选途径。
因此,本发明的实施方案是包括若干个相互分离的有机化合物 的子库,每个化合物的特征在于其具有可区分的成分,该成分能够 编码出可被物理测量测定的至少一个不同信息量子,并共有至少一 个普通官能团。一个优选方案是包括至少4个不同的官能有机化合 物的子库。
更优选的是其中所述官能有机化合物具有结构式为
F1-F2- C-E- C′        I 的子库,其中F1-F2是使其与固体颗粒连接并从固体颗粒上除去的 连接体; C-E- C′是能为物理测量测定的标示物,尤其是,其中所述官 能有机化合物的不同之处在于含有的亚甲基和/或卤素、氮或硫 的数目不同。
下面的子库也是优选的:其中 C-E- C′部分是经光化学除去的子 库,或者其中 C-E- C′部分是由氧化、水解、热解或还原除去的子库。
在一个实施方案中,本发明是包括至少6个不同组分的成分,每 个组分带有可区分的部分。组分的特征在于,每个部分在本质上都 是化学稳定的或惰性的,并带有与每个其他部分不同的可识别性质。 每个部分都与连接基团相连,连接基团具有能够在连接基团和单个 分立的固体表面之间形成共价键的活性官能团,或者每个部分与在 低于1毫微摩尔能够被检测的基团相连,但附加条件是,当各个部分与 连接基团相连时,组分在物理上是彼此分立的。优选地,固体载体 是小球。在一个实施方案中,每个组分包括与单个分立固体表面相 连的不同化合物分子,其中分子在固体表面上。优选地,本发明的 这些部分确定分子核上的同系列和/或取代系列。
本发明还是关于包括至少100个独特固体载体的化合物库。在 该化合物库中,每种固体载体都具有(1)与固体载体连接的单个化 合物,其作为与载体相连的主要化合物;和(2)许多标示物,例如不 能程序化的标示物,其中标示物是单个标示物分子,该种分子由于 物理上可分开因此是物理上可区分的,并且是取代的,从而在低于 约1毫微摩尔时可被检测出来,或者带有与取代基相连的官能基,该 取代基可在低于1毫微摩尔时被检测出来。优选地,在该化合物库 中,每种固体载体带有至少6个标示物。在另一个实施方案中,标示 物在化合物库中确定二进制代码,而二进制代码为用于合成固体载 体上化合物的合成计划编码。
本发明还提供决定合成计划和确定二进制代码的方法,其中合 成计划是由彼此分离的一系列物理上不同的标示物编码的。在该 方法中,为确定合成计划的每个阶段至少使用两个标示物,这样至 少有六个标示物。该方法的步骤包括借助于标示物的物理差别分 离标示物,并检测标示物。合成计划由不同标示物的二进制代码确 定。
本发明的化合物可用作镇痛药和/或用于治疗炎症,特别是在 氮杂三环的情况下,氮杂三环起到神经激肽1/舒缓激肽受体拮抗 剂的作用。苯并二吖庚因库的化合物可用作肌肉松驰剂和/或镇定 剂和/或镇静剂。23.5百万混合酰胺库(实施例3)的化合物能够起 到内皮激肽拮抗剂的作用,可用于治疗高血压或Raynaud综合症。
                    实施例1
                放射性标记的标示物
使用的标示物是直链烷基-α,ω-二醇的单甲基醚。该二醇带 有N+2个碳原子,而N表示阶段。甲基可以是放射性标记试剂,该试 剂各种比例为1/1-m/1的3H/14C,其中m是选择数。双重放射性 标记能够精确测定标示物中存在的氚。由10个不同的亚烷基和10 个不同的放射性标记比例,就能得到1010个独特的十元组标示物。为 了连接上标示物,先使标示物与活化剂反应,如与光气反应形成氯 甲酸酯,接着再与F1-F2组分反应。在这种情况下,F1-F2是以叔丁 基酯保护的邻硝基对羧基苄醇。在合成阶段进行时,随时直接向小 球加入去酯的识别剂,其中小球具有共价键结合的氨或羟基,与酸 形成酰胺或酯,其中酸用常规的化学法活化,如用碳化二亚胺偶合 法活化。在序列合成结束时,用各种受体或酶筛选小球以确定具体 特性。接着分离出显示某种特性的小球,用HPLC分割和分离标示物 得到一系列二醇单甲基醚,对该醚用常规的放射性同位素识别法分 析放射性。例如,如果从HPLC柱流出的第一个和第二个标示物分别 具有5∶1和7∶1的3H/14C比例,那么显示活性的产物是用阶段1的5 号试剂和阶段2的7号试剂合成的。
                      实施2
                   苯并二吖庚因库
组合的苯并二吖庚因库包括30个结构式VIII的化合物:

其中:
R是CH3,CH(CH3)2,CH2CO2H,(CH2)4NH2,CH2C6H4OH,或CH2C6H5和
R1是H,CH3,C2H5,CH2CH=CH2,或CH2C6H5 该苯并二吖庚因库是通过下列合成路线制备的。




按照类似于Bunin和Ellman(JACS, 114,10997-10998[1992])的 方法,在聚苯乙烯小球上制备苯并二吖庚因VIII,但是要在小球和 苯并二吖庚因之间引入易光解的连接体(见步骤A、B和C),这样就 可以在步骤G不通过水解而是用紫外光照射(在DMF中,350nm,10分钟 -12小时)除去苯并二吖庚因。而且,在步骤D和E引入二进制代码, 从而精确限定用于引入每个6R′S和5R″S的反应顺序。在根据步骤H 除去标示物并接着GC分离用电子捕获检测分析后,就可确定单个R 和R1基团的性质。
步骤D.E和F基本上按照Bunin和Ellman的方法进行,但还包括 在步骤D引入识别剂IXa-C和在步骤E引入IXd-f。识别剂者用结构式 IX代表:

其中:
IXa  表示  n=6 ;
IXb  表示  n=5;
IXc  表示  n=4;
IXd  表示  n=3;  
IXt  表示  n=2;  和
IXf  表示  n=1。
每个R和R1的代码如下:
          表2-1     IX     R     a     CH3     b     CH(CH3)2     a,b     CH2CO2H     C     (CH2)4NH2     a,C     CH7-C6H4-4-OH     b,c     CH2C6H5     IX     R1     d     H     e     CH3     d,e     C2H5     f     CH2CH=CH2     d,f     CH2C6H5
步骤A
向I(1当量)的甲苯溶液(浓度=0.5M)中加入Fmoc保护的2-氨 基-5-氯-4′-羟基二苯酮(1.3当量)和氮杂二羧酸二乙酯(1.3当量) 以及三苯基膦(1.3当量)。混合物在室温下搅拌24小时。减压除 去溶剂,剩余物用乙醚研制并过滤,再减压除去溶剂。得到的产物 II用硅胶色谱纯化。
步骤B
向在室温下搅拌的II在DCM的溶液(0.2M)中加入TFA(3当量), 并搅拌溶液12小时。减压将溶液蒸发至干,剩余物溶于DCM,用盐水 洗涤一次,并干燥(Na2SO4)。过滤和蒸发溶剂得到III。
步骤C
在肽反应容器(Merrifield容器)中,将带有氨甲基官能团( 1.1mEq/g)的1%DVB(二乙烯基苯)交联的聚苯乙烯小球(50μ)悬浮 在DMF中。加入在DMF中的III(2当量)和HOBt(3当量),摇动容器10分 钟。加入DIC(3当量),摇动容器,直至阴性水合茚三酮实验表明12 小时后反应进行完全。
除去DMF,树脂真空干燥前另用DMF(X5)和DCM(X5)洗涤。
步骤D
将干燥树脂分装在6个反应容器中,并用DCM悬浮。将适宜组合 的识别剂IXa-c(见表2-1)加到烧瓶中,搅动1小时。Rh(TFA)2催化 剂(1mol%)加到每个烧瓶中,再摇动2小时。将烧瓶中液体排干,用 DCM(X5)洗涤树脂。接着用TFA的DCM溶液(0.01M)处理树脂,摇动30 分钟,再用DCM(X3)接着用DMF(X2)洗涤。用20%的哌啶DMF溶液处理 树脂,摇动30分钟,然后用DMF(X3)和DCM(X3)洗涤。
向每只烧瓶中加入适宜的Fmoc保护的氨基酰基氟(3当量)(当 需要时,侧链官能基团可以叔丁基酯(Asp)、叔丁基醚(Tyr)或叔丁 氧基羰基(Lys)形式保护)和2,6-二叔丁基-4-甲基吡啶(10当量), 烧瓶搅动夜或直至得到阴性的水合茚三酮实验结果。树脂用DCM洗 涤一次,然后将六份混合,真空干燥前再次洗涤(DCM×5)。
步骤E
干燥树脂分装在5个反应容器中,用DCM悬浮。将适宜组合的识 别剂IXd-f(见表2-1)加到烧瓶中,摇动1小时。向每个烧瓶中加入 Rh(TFA)2催化剂(1mol%),再摇动2小时。将烧瓶中的液体沥干,树 脂用DCM(X5)洗涤。接着树脂用TFA的DCM溶液(0.01M)处理,摇动30 分钟,然后用DMF(X3)和DCM(X3)洗涤。
向每只烧瓶中加入5%的乙酸DMF溶液,混合物加热至60℃并摇 动过夜。沥干溶剂,然后树脂用DMF(X5)洗涤。
步骤F
将每批树脂都悬浮在THF中,烧瓶冷却至-78℃。向每只烧瓶加 入锂化5-(苯甲基)-2-噁唑烷酮(2当量)的THF溶液,混合物在-78℃ 下摇动1小时。再向每只反应瓶加入适宜的烷基化试剂(表2-2)(4 当量),接着加入催化量的DMF。将容器温热至室温,并在此温度下 摇动5小时。过滤除去溶剂,树脂用THF(X1)洗涤,再真空干燥。将 每份树脂合并,用THF(X2)和DCM(X2)洗涤,合并后树脂再用TFA∶水∶ 二甲基硫的95∶5∶10混合物处理2小时,从而除去侧链保护基。
           表2-2     识别剂     烷基化试剂     e     H3CI     d,e     C2H5Br     f     BrCH2-CH=CH2     d,f     BrCH2C6H3
步骤G
通过将小球悬浮在DMF中并用U.V.(350nm)照射12小时,将得到 的苯并二吖庚因从聚苯乙烯小球上剥离下来。
步骤H
将感兴趣的小球装入玻璃毛细管中,用注射器向毛细管注入1 μl1M硝酸铵铈(1V)(CAN)水溶液、1μl乙腈和2μl己烷。用火焰 密封毛细管,然后离心以保证小球被试剂浸没。将毛细管放在超声 器中,用声波处理1-10小时,优选处理2-6小时。
使毛细管破损开口,取出 上部己烷层与 双(三 甲基甲硅烷基)乙酰胺(BSA)混合,而后注入GC,并象下列路线示例 的那样,用电子捕获检测确定每个标示物。


                    实施例3
               23,540,625混合酰胺库
通过制备包括肽和其他酰胺化合物的由23,540,625个成员组 成的组合库来进一步实验编码技术。
在5个步骤中使用15种不同的试剂并在第六步中使用31种不同 的试剂进行上述合成。使用4个识别剂为共有15种试剂的五个步骤 的每个步骤编码,使用5个识别剂为共有31种试剂的最后步编码。 因此制备了包括25个识别剂的识别组。使用了2-硝基-4-羧基苄基、 0-芳基取代的ω-羟基烷基碳酸酯识别剂,其中标示物组分由3-12 个碳原子的烷基部分组成,芳基部分是(A)五氯苯基,(B)2,4,5-三 氯苯基。(C)2,4,6-三氯苯基,或(D)2,6-二氯-4-氟苯基。使用适 宜长度的烷基链和A、B、C或D制备一组为25个的标示物,用0.2mM ×25M聚甲基硅氧烷GC柱分离。标示物T1~T25(其中T1代表保留时 间最长的标示物,T25代表保留时间最短的标示物)的化学组成总结 如下:   T1     10A   T6      10C   T11     7B   T16     5C   T21     2B   T2     9A   T7      9B   T12     7C   T17     4B   T22     2C   T3     8A   T8      9C   T13     6B   T18     4C   T23     1B   T4     7A   T9      8B   T14     6C   T19     3B   T24     1C   T5     10B   T10     8C   T15     5B   T20     3C   T25     2D
标示物以NAr表示,其中N是亚甲基的数目减去2,Ar是芳基。因 此,标示物2A具有通过氧与五氯苯基相连的亚丁基。
在开始五个阶段中使用的15种试剂以及识别它们的代码表示 如下,其中1代表有标示物存在,0代表没有标示物存在。     试  剂      代码     L-丝氨酸     (0001)     D-丝氨酸     (0010)     L-谷氨酸     (0011)     D-谷氨酸     (0100)     L-谷氨酰胺     (0101)     D-谷氨酰胺     (0110)     L-赖氨酸     (0111)     D-赖氨酸     (1000)     L-脯氨酸     (1001)     D-脯氨酸     (1010)     L-苯丙氨酸     (1011)     D-苯丙氨酸     (1100)     3-氨基苯甲酸     (1101)     4-氨基苯乙酸     (1110)     3,5-二氨基苯甲酸     (1111) 第六阶段中的31种试剂以及代表它们的代码表示如下:     试剂     代码     L-丝氨酸   (00001)     D-丝氨酸   (00010)     L-谷氨酸   (00011)     D-谷氨酸   (00100)     L-谷氨酰胺   (00101)     D-谷氨酰胺   (00110)     L-赖氨酸   (00111)     D-赖氨酸   (01000)     L-脯氨酸   (01001)     D-脯氨酸   (01010)     L-苯丙氨酸   (01011)     D-苯丙氨酸   (01100)     3-氨基苯甲酸   (01101)     4-氨基苯乙酸   (01110)     3,5-二氨基苯甲酸   (01111)     琥珀酸酐   (10000)     惕各酸   (10001)     2-吡嗪羧酸   (10010)     (±)硫辛酸   (10011)     1-哌啶丙酸   (10100)     胡椒基酸   (10101)     6-甲基烟酸   (10110)     3-(2-噻吩基)丙烯酸   (10111)     甲基碘   (11000)     甲苯碘酰氯   (11001)     异氰酸对甲苯磺酰酯   (11010)     3-氰基苯甲酸   (11011)     邻苯二甲酸酐   (11100)     乙酸酐   (11101)     氯甲酸乙酯   (11110)     甲磺酰氯   (11111)
用普通方法在小球上制备含有六个甘氨酸单元的间隔基团。 采用丁基侧链保护制备可变区域,并且以Fmoc衍生物的形式保护氨 基。用DIC和HOBt活化羧酸来形成酰胺键。
                     实施例4
                 杂-Diels-Alder库
组合的杂Diels-Alder库包括如下结构式的42个化合物:

其中:
R1是H,CH3O,F3C,F3CO,H5C6O,或C6H11;
R2是H,CH3,或CH3O;
R3是H(当n=2时),或CH3(当n=1时);和 R=H或Cl或
该化合物库按照下列合成路线制备:




在聚苯乙烯小球上制备氮杂三环产物(VI),产物与小球之间通 过光离解的连接体连接,这样,用紫外光(350nm,在DMF中)照射即可 从小球上除去氮杂三环(VII)。在步骤C、D和E中引入的二进制代 码独一无二地确定了用于引入ArR、R1、R2和R3的反应顺序。按照 步骤G除去编码的标示物,并在GC分离后用电子捕获得检测对其进 行分析。
在该合成路线中使用的识别剂用结构式X表示:

其中:
Xa    表示  n=10
Xb    表示  n=9
Xc    表示  n=8
Xd    表示  n=7
Xe    表示  n=6
Xr    表示  n=5
Xg    表示  n=4
每个R、R1、R2、R3的代码如下:
                     表4-1
R=H
R=Cl

c           R1=H         R2=H
d           R1=H         R2=CH3
d,c        R1=OCH3     R2=OCH3
e           R1=CF3      R2=H
e,c        R1=C6H5O   R2=H
e,d        R1=F3CO     R2=H
e,d,c     R1=C6H11   R2=H
f           R3=CH3      n=1
g           R3=H         n=2
步骤A
在30分钟内,向在0°下搅拌的I(2.03g,8mmol)、4-羟基苯甲 醛(1.17g,9.6mmol)和三苯基膦(2.73g,10.4mmol)在甲苯(20ml)的 溶液中加入偶氮二羧酸二乙酯。使溶液温热,在达到室温后搅拌1小 时。通过在减压下除去大约一半的溶剂浓缩溶液,然后用乙醚研磨。 接着过滤混合物,剩余物用乙醚彻底洗涤。减压除去溶剂,剩余物 用硅胶色谱(乙酸乙酯占己烷的15%)纯化,得到1.3g醚IIa(产率47%)。
按类似的方式使2-氯-4-羟基苯甲醛和2-羟基-1-萘甲醛与I 偶合,分别以91%和67%的产率得到醚IIb和C。
步骤B
向在室温下搅拌的醚IIa(0.407g,1.14mmol)的DCM(20ml)溶液 中加入TFA(8ml)。搅拌该溶液6小时。减压将溶液蒸发至干得到 0.343g酸IIIa(产率100%)。类似地,使醚IIb和IIc脱去保护基,分别 以产率92%和100%得到酸IIIb和C。
步骤C
向肽反应容器(Merrifield容器)中称量加入带有氨甲基官能 团(1.1meq/g)的1%DVB(二乙烯基苯)交联的聚苯乙烯小球(50 -80μ)(200mg树脂)。用DMF(2ml)悬浮树脂,并搅动20分钟。加入酸 IIIa(38mg,2当量)、1-羟基苯并三唑(40mg,2当量)和二异丙基碳化 二亚胺(38mg,2当量),搅动混合物直至获得阴性的水合茚三酮实验 结果(22小时)。过滤除去溶液,并用DCM(8×10ml)洗涤树脂。
将树脂再次悬浮到DCM(5ml)中,加入识别剂Xa(15mg),摇动烧 瓶1小时。加入Rh(TFA)2催化剂(1mol%),摇动烧瓶2小时。过滤除 去溶剂,将树脂再悬浮到DCM(5ml)中,加入三氟乙酸(1滴),摇动容 器20分钟。过滤除去溶剂,并用DCM(8×10ml)洗涤树脂。
以类似的方式使酸IIIb和IIIc连接到树脂上,并用适宜的识别剂 编码,例如,用Xb对酸IIIb编码,用Xa和Xb对酸IIIc编码。将三批树脂 合并、混合、洗涤并干燥。
步骤D
将干燥树脂分成相等的7份(每份87mg),分别投入7个肽反应容 器(Merrifield容器)中,容器用加热带包封。在每个容器中,用甲 苯(10ml)悬浮树脂,摇动20分钟。然后向每只烧瓶加入适量的苯胺 (见表4-2)。
                表4-2 烧瓶          苯胺   加入量   1   苯胺     3ml   2   3,5-二甲基苯胺     3ml   3   3,4,5-三甲氧基苯胺     2g   4   4-三氟甲基苯胺     3ml   5   4-苯氧基苯胺     2g   6   4-三氟甲氧基苯胺     3ml   7   4-环己基苯胺     2g
接上加热带电源,反应混合物在70℃摇动18小时。断开加热带 电源,过滤除去溶剂,每份树脂都用干燥DCM(4×10ml)、乙醚(10ml)、 甲苯(10ml)和DCM(2×10ml)洗涤。再用DCM(5ml)分别悬浮每份树 脂,向每只烧瓶中加入适宜的识别剂或识别剂的组合(Xc-e)(15mg) (见表4-1)。摇动烧瓶1小时,然后向每只烧瓶中加入Rh(TFA)2 (1mol%),并继续搅2拌小时。
除去溶剂,每份树脂都悬浮在DCM(5ml)中,并加入TFA(1滴)。 混合物摇动20分钟,然后过滤除去溶剂。洗涤每份树脂(DCM,1× 10ml)并将其合并,再用DCM(3×10ml)洗涤,然后在真空下彻底干燥。
步骤E
干燥树脂分成相等的两份(每份0.3g),每份都放入肽反应器中。 每份树脂都用DCM(2×10ml)洗涤,然后悬浮在DCM(5ml)中。向一只 烧瓶中加入识别剂Xf(15mg),向另一只烧瓶中加入Xg(15mg)。摇动 烧瓶1小时,然后加入Rh(TFA)2催化剂(1mol%)。摇动烧瓶2小时,然 后过滤除去溶剂。每份树脂都用DCM(3×10ml)洗涤,然后每份树脂 再悬浮在DCM(5ml)中。
向烧瓶中加入适宜的烯醇醚(1ml)(见表4-1),搅动容器30分钟。 向每只烧瓶中加入BF3.OEt2溶液(0.5ml在DCM中的5%溶液),摇动烧 瓶24小时。过滤除去溶剂,然后树脂用DCM(10ml)洗涤,再将树脂合 并。小球再用DCM(5×10ml)、DMF(2×10ml)、甲醇(2×10ml)和 DCM(2×10ml)进一步洗涤。接着树脂在真空下彻底干燥。
步骤F
为了确认在杂-Diels-Alder库中制备的产物,在投料量很大的 基础上完成了一个实施例,从而可通过光谱手段确认产物的结构。 采用的方法基本上与制备组合库时所述的方法相同。在步骤A,4- 羟基苯甲醛与易光解基团相偶合。在步骤D,苯胺与醛缩合。在步 骤E,用4,5-二氢-2-甲基呋喃生成了烯醇醚。
化合物的光解(步骤F)按照下述的方法进行:将100mg小球悬浮 在DMF(0.3ml)中,用UVP“Black Ray”UVL56型手动366nm灯照射小 球16小时。用吸液管将DMF移至一侧,再用一些DMF(2×3ml)漂洗小 球。合并原始溶液和洗涤溶液,减压除去溶剂。通过与真实样品比 较,NMR对反应混合物的分析表明,反应混合物中含有需要的氮杂三 环。
步骤G
将待实验小球装入一端封闭的派热克斯玻璃毛细管中,用注射 器注入1M硝酸铵铈(IV)水溶液和乙腈(1∶1)(1μl),离心毛细管,这 样小球停留在毛细管底部并被试剂溶液完成全浸没。用注射器注 入己烷(2μl),毛细管再次离心。用火焰密封毛细管的开口端,并 将毛细管放在超声器中达4小时。然后,将毛细管倒置在离心机中 旋转,这样迫使水层穿过己烷层至毛细管底部。该萃取方法重复3 或4次,然后使毛细管开封,用注射器移去己烷层(1.5μl),放入另 一个含有BSA(0.2μl)的毛细管中。密封该毛细管并离心,直至里 面的试剂彻底混合。为了分离和解释标示物分子,取出一部分溶液 (约1μl)注入带有电子捕获检测器的气相色谱仪,气相色谱仪的色 谱柱是25M×0.2mM聚甲基硅氧烷熔成的硅胶柱。
在200℃和25psi的载气(He2)压力下,将样品注入GC柱。1分钟 后,以20℃/分的速率升温至320℃,并以2pis/分的速率升压至 40psi。这些条件示于下图中:

由4个随机选择的小球得到了下列结果:
                          小球1                    检出的标示物     Xf     Xe    Xd    Xc     Xb    Xa     Ar     2-羟基萘基     R1     C6H11     R2     H     R3     CH3(n=1)
                               小球2                       检出的标示物     Xg     Xe    Xd    Xc           xb     Ar     2-氯-4-羟基苯基     R1     C6H11     R2     H     R3     H(n=2)
                      小球3               检出的标示物     Xg     Xe    Xd     Xb    Xa     Ar    2-羟基萘基     R1     F3CO     R2     H     R3     H(n=2)
                         小球4                  检出的标示物     Xf     Xe  Xd           Xb     Ar     2-氯-4-羟基苯基     R1     F3CO     R2     H     R3     CH3(n=1)
                   实施例5
                 苯并二吖庚因库
按照实施例2的方法,制备了结构式X的组合库,

其中
R是天然存在的D或L氨基酸基团;
R1是H、C1-C6烷基、低级链烯基、C1-C6烷基氨基、羧基C1- C6烷基或苯基C1-C6烷基,其中苯基可被低级烷基、F、Cl、Br、OH、 NH2、CO2H或O-低级烷基任意取代;
R2是H或CO2H;
R3是H或OH;
R4是H或Cl;
但须,当R3是OH时,R2是H,并且当R2是羧基时,R3是H。
该化合物库由许多结构式如下的编码小球释放得到,

其中
IXn是许多结构式Ia的识别剂,其中所述的“许多”代表编码 的合成路线;
S是基质;
F1′-F2是结构式Ia的连接体残基;以及R、R1、R2和R4同结构 式X中的定义。
                     实施例6
                  典型识别剂的制备
通过形成卡宾连到树脂上的重氮化合物识别剂的制备示例如 下。
下列通式的化合物制备如下。

其中
n是0-10,以及
Ar是五氯苯酚、2,4,6-三氯苯酚、2,4,5-三氯苯酚或2,6-二 氯-4-氟苯酚。
向1-羟基-4-(2,6-二氯-4-氟苯氧基)丁烷(0.38g,1.5mmol)、 异香草酸甲酯(0.228g,1.5mmol)和三苯基膦(0.393g,1.5mmol)在 THF(8ml)的溶液中加入偶氮二羧酸二乙酯(0.287g,1.7mmol)。在 室温下搅拌上述溶液36小时。减压除去溶剂,剩余物用硅胶色谱( 用20%乙酸乙酯和80%石油醚的混合物洗脱)纯化,得到0.45g醛(产 率为77%)。
将上述醛(100mg,0.26mmol)溶于丙酮(8ml)中,并用KMnO4(61mg,0.39mmol)在丙酮(4ml)和水(4ml)中的溶液处理。反应液在 室温下搅拌13小时。反应混合物用乙酸乙酯(100ml)和水(50ml)稀 释,使有机层和水层分开。再用乙酸乙酯(2×100ml)萃取水层。合 并有机层,用水(50ml)洗涤并干燥(MgSO4)。除去溶剂得到109mg苯 甲酸(产率93%)。
用草酰氯(36mg,0.28mmol)和催化量的DMF处理上述酸(76mg, 0.188mmol)的二氯甲烷(2ml)溶液。在室温下搅拌10分钟后,观察 到缓慢而稳定的气体放出。继续搅抖2小时,然后反应液用DCM (15ml)稀释,并用饱和碳酸氢钠水溶液(5ml)洗涤。分层,有机层用 Na2SO4干燥,挥发除去溶剂得到浅黄色晶体状的苯甲酰氯。
将苯甲酰氯溶于二氯甲烷(5ml),并在-78℃下加到搅拌的重氮 甲烷的乙醚溶液中。使冷浴温热,反应混合物在室温下搅拌5小时。 减压除去溶剂和过量的重氮甲烷,剩余物用硅胶色谱纯化,采用梯 度洗脱法洗脱,其中乙酸乙酯在己烷中的浓度范围是10%-40%,得到 48mg重氮化合物(产率60%)。
下列通式的化合物按下述方法制备:

其中
n是0-10,以及
Ar是五氯苯酚、2,4,6-三氯苯酚、2,4,5-三氯苯酚或2,6-二 氯-4-氟苯酚。
在氩气氛下,将香草酸甲酯(0.729g,4.0mmol)、1-羟基-9-(2, 3,4,5,6-五氯苯氧基)壬烷(1.634g,4.0mmol)和三苯基膦(1.259g, 4.8mmol)溶于20ml干燥甲苯中,滴加DEAD(0.76ml,0.836g, 4.8mmol),混合物在25℃下搅拌1小时。反应液浓缩至一半,用快速 色谱纯化,以DCM洗脱得到1.0g(1.7mmol,43%)产物,为白色结晶固 体。
上述甲基酯(1.0g,1.7mmol)溶于50ml THF,加入2ml水,接着加 入氢氧化锂(1.2g,50mmol)。混合物在25℃下搅拌1小时,再回流5小 时。冷却至25℃后,将混合物倾入乙酸乙酯(200ml)中,所得溶液先 用1M HCl(50ml×3)洗涤,再用饱和NaCl水溶液(1×50ml)洗涤,然 后用硫酸钠干燥。除去溶剂,粗产物酸用甲苯共沸一次。
上述粗产物溶于100ml甲苯,加入10ml(1.63g,14mmol)亚硫酰 氯,混合物回流90分钟。通过蒸馏将溶液体积降至约30ml,然后蒸 发除去剩余甲苯。在氩气下,将粗酰基氯溶于20ml干燥DCM,并冷却 至-78℃,加入约10mmol重氮甲烷在50ml无水乙醚中的溶液。混合 物温热至室温,搅拌90分钟。用氩气通过溶液鼓泡10分钟,然后挥 发除去溶剂,粗产物用快速色谱纯化,用10-20%乙酸乙酯/己烷洗 脱,得到浅黄色固体状的重氮酮(0.85g,1.4mmol,三步的收率为 82%)。
按照上述方法制备了下列识别剂:
氧化裂解类型I
制备了如下结构式的7个
如下

其中:
Ar  是

以及n is 4,5,6,7,8,9,和10。
氧化裂解类型II
制备了如下列结构式的13个识别剂:

其中:
Ar  是

以及n  is  1,2,3,4,5,6,7,8,9,10;
并且其中:
Ar是

以及n是0,3,和9。
                  实施例7
            用可被质谱识别的标示物
                  编码组合库
标示物4、11和13(合成路线7)结构相同,但由于不同数目的氘 取代其分子量不同,它们可分别被合成出来(合成路线8和9)并可通 过质谱(MS)分别加以分析。在MS技术中,正化学电离质谱(PCIMS) 可给出最小的标示物片段,这样只有分子离子([M+NH4]+)和另一个 片段,([MH-H2O]+)可给出信号(图1、2和3)。这实际上就可通过观 察两个信号来确定标示物的存在与否,从而消除了分析较复杂结构 时任何可能出现的混淆。随后混合了大约相等数量的三个标示物, 并用PCIMS分析(图5)。同样,可以容易地辨认出相应于每个单独标 示物的两个信号。
现在将标示物4转变成重氮酮前体8(合成路线8),然后与 Tentagel树脂相连得到9(合成路线11)。接着除去9的一个小球,并 用硝酸高铈铵氧化释放出4。PCIMS分析再次清楚地显示出标示物4 的存在。
总之,合成出了一组结构相同但分子量不同的标示物4、11和 13。所有标示物可同时在混合物中被PCIMS容易地检测到。PCIMS 可以检测到从单个Tentagel树脂小球(在组合库合成中使用)释放 出的少量4。MS是有效而又灵敏的标示物检测方法,并可用作编码 合成组合库的基本手段。
用PCIMS分析4、11和13的结果是通过使用1%NH3/CH4的试剂 气体混合物获得的。
(2).在0℃和Ar气氛下,向11.1ml(125mmol,5.00当量)1,4-丁 二醇(1)、6.97ml(50.0mmol,2.00当量)Et3N和0.153g(1.25mmol, 0.05当量)4-二甲氨基吡啶在干燥CH2Cl2(100ml)中的溶液加入 3.88g(25.0mmol,1.00当量)97%叔丁基二甲基甲硅烷基氯。得到的 溶液在0℃下搅拌15分钟,而后在25℃下搅拌16小时。接着反应液用 CH2Cl2(250ml)稀释,用1M Hcl(100ml)、饱和NaHCO3水溶液(100 ml)和水(100ml)洗涤,然后干燥(MgSO4)。减压除去挥发性物质得到 油状的粗产物2。
(3).在0℃和Ar气氛下,向~10.0mmol粗醇  2、1.93g(10. 5mmol,1.05当量)五氟苯酚和2.89g(11.0mmol,1.10当量)三苯基膦 在干燥CH2Cl2(40ml)中的溶液加入1.73ml(11.0mmlo,1.10当量)偶 氮二羧酸二乙酯。得到的桔黄色溶液在0℃下搅拌5分钟,再在25℃ 下搅拌15小时。接着反应液用CH2Cl2(250ml)稀释,并用饱和Na2CO3水溶液(100ml)、饱和NH4Cl水溶液(100ml)和水(100ml)洗涤,然 后干燥(MgSO4)。减压除去挥发性物质并用快速色谱法纯化(0-20% EtOAc/己烷)得到油状产物3。
(4).在25℃下,向1.85g(5.00mmol,1.00当量)甲硅烷基保护的 醇3在THF(20ml)中的溶液加入10.0ml(10.0mmol,2.00当量)1.0M氟 化四丁基铵的THF溶液。得到的桔黄色溶液在25℃下搅拌4小时。 减压除去挥发性物质并用快速色谱法纯化(20-40%EtOAc/己烷)得 到1.10g(86%)油状产物4。
(5).在0℃和Ar气氛下。向0.800g(3.125mmol,1.00当量)醇4、 0.569g(3.125mmol,1.00当量)香草酸甲酯和0.984g(3.75mmol, 1.20当量)三苯基膦在干燥CH2Cl2(20ml)中的溶液加入0.591ml (3.75mmol,1.20当量)偶氮二羧酸二乙酯。得到的浅黄色溶液在0℃ 下搅拌5分钟,再在25℃下搅拌19小时。接着反应液用CH2Cl2(100ml)稀释,并用1MNaOH(50ml)、饱和NH4Cl水溶液(50ml)和水 (50ml)洗涤,然后干燥(MgSO4)。减压除去挥发性物质,并用快速色 谱法纯化(20%EtOAc/己烷)得到油状产物5。
(6).向3.125mmol酯5的THF(12ml)溶液中加入1.31g(31.3mmol, 10.0当量)氢氧化锂一水合物。向得到的悬浮液中加入MeOH (24ml),使其形成溶液,该溶液在25℃搅拌1小时,再回流1天。减压 除去挥发性物质,加入1MHCl直至溶液的PH值达到~1。收集形成的 白色沉液产物,干燥得到0.968g(76%-2步)6。
(7).在Ar气氛下向0.968g(2.38mmol,1.00当量)羧酸6中加入 2.43ml亚硫酰氯。得到的悬浮液回流1.5小时,然后形成了黄色溶 液。减压除去挥去性物质,得到的剩余物用甲苯共沸三次,得到无 色晶体状的产物7。
(8).在0℃和Ar气氛下,向2.38mmol酰基氯7的1∶1THF∶MeCN (20ml)溶液中加入1.16ml(8.33mmol,3.50当量)Et3N,然后加入 3.57ml(7.14mmol,3.00当量)2.0M(三甲基甲硅烷基)重氮甲烷的己 烷溶液。得到的黄色溶液在0℃搅拌1小时,再在25℃搅拌1天。反 应液用EtOAc(150ml)稀释,并用饱和NaHCO3水溶液(2×75ml)和饱 和NaCl水溶液(2×75ml)洗涤,然后干燥(MgSO4)。减压除去挥发性 物质得到油状粗产物8。
(11).用市场上可购到的1,4-丁二醇-2,2,3,3-d4(10)代替1, 按照类似于将1转变为4时所述的方法,分三步以41%收率得到了11。
用市上可购到的1,4-丁二醇-2,2,3,3,4,4-d8(10)代替1,按照 类似于将1转变为4时所述方法,分三步以42%收率得到了13。
按照基本上与实施例4(杂Diels-Alder库)所给方法的相同方 法,用5-50%(w/wvs.树脂)前体重氮酮8将标示物4引至固体载体 上得到9。随后按照基本上与实施例4步骤G相同的方法从9中除去 标示物4。
使用相应于标示物11和13的重氮酮将这些标示物引至固体载 体上,这样与8一起,得到了二进制编码组的成员。
                    合成路线7

M.W.=256

M.W.=260

M.W.=264
                                 合成路线8

              合成路线9


从上面的叙述可以清楚地看出,本发明提供了多用而又简单的 识别化合物的方法,其中化合物的存在量不能保证其反应历程的精 确测定。该方法可以生产很大数目的不同化合物,这些化合物可用 于各种筛选技术中,从而确定生物活性或其他有意义的活性。在操 作条件下呈化学惰性的标示物的使用,使得由各种合成技术(这些 技术用于生产所需产物)产生的各种各样的环境呈现出很大的多样 性。标示物可以很容易地合成并可进行精确的分析,从而可以精确 地确定成分的性质。
说明书中引用的所有出版物和专利申请都引作本文的参考 文献,就好象是每份单独的出版物或专利申请都分别而又明确地指 明作为本文的参考文献一样。
尽管为了清楚理解的目的,上述发明已通过图表和实施例给予 了详细说明,但本领域的普通技术人员在受到本发明的启示后可以 很容易地做出某些变化和改进,但这些变化和改进都不会背离所附 权利要求的精神或范围。
本申请是申请号为CN94105555.8母案的分案申请。该母案的 申请日为1994年4月13日;发明名称为“用标示物编码的多元 组合化学库”。
QQ群二维码
意见反馈