测定核酸分子序列的方法和组合物

申请号 CN97192557.7 申请日 1997-01-23 公开(公告)号 CN1163619C 公开(公告)日 2004-08-25
申请人 佳根基因组学公司; 发明人 J·范尼斯; J·C·特邦; J·J·豪伯特; J·T·默利甘;
摘要 提供测定核酸分子序列的方法和化合物,包括由之产生的组合物。该方法允许同时检测多个核酸序列。使用化合物作为标记以产生与选择的靶核酸分子互补的标记核酸 片段 。每个标记都与特定的核苷酸相互关联,并且在一优选实施方案中,其可用质谱法检测。在按序列长度分离标记片段后,从标记片段上裂解标记物。在一优选实施方案中,以质谱法检测标记物,并从而确定核酸分子的序列。可以自动化方式使用本方法的个别步骤,如整合在系统内。
权利要求

1.一种测定核酸分子序列的方法,其包括:
(a)产生与选择的靶核酸分子互补的标记的核酸片段,其中标记物是 与特定核苷酸相关联的有机基团,并且是可用光谱测定法和电位测定法检 测的;
(b)按顺序长度分离标记的片段;
(c)从标记的片段上切掉标记物;以及
(d)用光谱测定法或电位测定法检测标记物,从而确定核酸分子的序 列。
2.根据权利要求1的方法,其中用质谱法、红外光谱法、紫外光谱法和 恒压电流测定法检测标记。
3.根据权利要求1或2的方法,其中步骤(b)中用选自凝胶电泳、毛 细管电泳、微通道电泳和HPLC的方法分离标记的片段。
4.根据权利要求1或2的方法,其中步骤(c)中使用选自化、还原、 酸敏感性、敏感性、酶促、电化学、热、巯基交换及光敏感性方法裂解 标记的片段。
5.根据权利要求2的方法,其中标记是用飞行时间质谱法、四极质谱法、 磁扇形场质谱法或电扇形场质谱法检测的。
6.根据权利要求2的方法,其中标记是库仑检测器或电流计检测器检测 的。
7.根据权利要求1或2的方法,其中步骤(a)中标记的核酸片段是从 5′末端到3′末端产生的。
8.根据权利要求1或2的方法,其中步骤(a)产生4个以上的标记的 核酸片段,且每个标记对核酸片酸都是独有的。
9.根据权利要求1或2的方法,其中步骤(b)、(c)和(d)是以连 续方式进行的。
10.根据权利要求1或2的方法,其中步骤(b)、(c)和(d)是在一 系统中以连续方式完成的。
11.根据权利要求1或2的方法,其中一个或多个步骤是自动化的。
12.根据权利要求1或2的方法,其中标记的片段是寡核苷酸引物以引 物的3′末端以外的位置连接标记而产生的。
13.根据权利要求1或2的方法,其中标记的片段是从标记的双脱氧核 苷酸终止子产生的。
14.根据权利要求1的方法,其中标记物的检测是用非荧光光谱测定法或 电位测定法。
15.下列通式的化合物:
                       Tms-L-X
其中Tms是可用质谱法检测的有机基团,包含,氢和氟中至少一种, 并可包括选自氧、氮、硫、磷及碘的原子
L是可使含Tms的部分与化合物的其余部分裂解开的有机基团,其中 含Tms的部分包括当化合物经受质谱检测时支持单一离子化带电状态的 功能团,并且选自叔胺、季胺和有机酸
X是核酸片段;
条件是该化合物不通过X连接到固相载体上,其质量不小于250道 尔顿。
16.根据权利要求15的化合物,其中Tms具有15至10,000道尔顿的质 量,以及C1-500N0-100O0-100S0-10P0-10HαFβIδ的分子式,其中α、β和δ 的总和足以饱和C、N、O、P和S原子的可能未饱和的价。
17.根据权利要求15的化合物,其中Tms和L是通过选自酰胺、酯、醚、 胺、硫化物、硫代酯、二硫化物、硫醚、脲、硫脲、甲酸酯、硫代氨 基甲酸酯、西夫碱、还原型西夫碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷 酰胺、膦酰胺、磺酸酯、氨磺酰或碳-碳键的功能团结合的。
18.根据权利要求17的化合物,其中将Tms和L连接在一起的功能团选 自酰胺、酯、胺、脲和氨基甲酸酯。
19.根据权利要求15的化合物,其中L选自Lhv、Lacid、Lbase、L[O]、L[R]、 Lenz、Lelc、LΔ和Lss,其中光化照射、酸、碱、氧化、还原、酶、电化学、 热和巯基交换分别引起含Tms部分从分子的其余部分上裂解下来。
20.根据权利要求19的化合物,其中Lhv具有结构式L1-L2-L3,其中L2 是吸收光化幅射以促使Tms与X裂解开的分子片段,且L1和L3各自是直 接键或有机残基,其L1将L2与Tms分开,L3将L2与X分开,且当L2 吸收光化幅射时L1和L3均不受键裂解。
21.根据权利要求20的化合物,其中-L2-L3具有下列通式:

其中位置a、b、c、d或e上的一个碳原子被-L3-X取代,并且位置b、 c、d或e中的一个或多个原子可以任意地被烷基、烷氧基、氟、氯、羟 基、羧酸或酰胺取代;R1则是氢或基。
22.根据权利要求21的化合物,其中-L3-X位于a位。
23.根据权利要求20的化合物,其中L3选自直接键、亚烃基、-O-亚烃 基和亚烃基-(O-亚烃基)n-H,n是从1至10的整数。
24.根据权利要求15的化合物,其中-L-X具有下列通式:

其中位置b、c、d或e中一个或多个位置有氢、烷基、烷氧基、氟、 氯、羟基、羧酸或酰胺取代;R1是氢或烃基;R2是核酸片段。
25.根据权利要求15的化合物,其中Tms具有通式:
                T2-(J-T3-)n-
其中T2是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具 有15至500道尔顿的质量范围的有机残基;
T3是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具有50 至1000道尔顿的质量范围的有机残基;
J是直接键,或选自酰胺、酯、胺、硫醚、醚、硫代酯、二硫化物、 硫代醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、西夫碱、还原态西夫 碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、氨磺酰 或碳-碳键的功能团;
n是1至50的整数,当n大于1时,每个T3和J都是独立选择的。
26.根据权利要求25的化合物,其中T2选自烃基、烃基-O-亚烃基、 烃基-S-亚烃基、烃基-NH-亚烃基、烃基-酰胺-亚烃基、N-(烃 基)亚烃基、N,N-二(烃基)亚烃基、烃基酰基-亚烃基、杂环基烃基,其 中杂原子选自氧、氮、硫和磷,取代的杂环基烃基,其中杂原子选自氧、 氮、硫和磷,且取代基选自烃基、烃基-O-亚烃基、烃基-NH-亚烃 基、烃基-S-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基以及烃 基酰基-亚烃基,以及前述任何基团的一个或多个氢被等数目的氟取代的 衍生物
27.根据权利要求25的化合物,其中T3具有式-G(R2)-,G是具有 单一R2取代基的C1-6亚烷基,并且并且R2选自烷基、链烯基、炔基、环 烷基、芳基缩合的环烷基、环烯基、芳基、芳烷基、芳基取代的链烯基或 炔基、环烷基取代的烷基、环烯基取代的环烷基、联芳基、烷氧基、链烯 氧基、炔氧基、芳烷氧基、芳基取代的链烯氧基或炔氧基、烷氨基、链烯 氨基或炔氨基、芳基取代的烷氨基、芳基取代的链烯氨基或炔基氨基、芳 氧基、芳氨基、N-烷基脲取代的烷基、N-芳基脲取代的烷基、烷基羰 基氨基取代的烷基、氨基羰基取代的烷基、杂环基、杂环基取代的烷基、 杂环基取代的氨基、羧烷基取代的芳烷基、氧代碳环缩合的芳基和杂环基 烷基;环烯基、芳基取代的烷基和芳烷基、羟基取代的烷基、烷氧基取代 的烷基、芳烷氧基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、 氨基取代的烷基、(芳基取代的烷氧基羰基氨基)取代的烷基、硫羟取代的 烷基、烷基磺酰取代的烷基、(羟基取代的烷硫基)取代的烷基、硫代烷 氧基取代的烷基、烃基酰基氨基取代的烷基、杂环酰基氨基取代的烷基、 烃基取代的杂环基酰基氨基取代的烷基、烷基磺酰氨基取代的烷基、芳基 磺酰氨基取代的烷基、吗啉代烷基、硫代吗啉代烷基、吗啉代羰基取代的 烷基、硫代吗啉代羰基取代的烷基、(N-(烷基、链烯基或炔基)-或N,N -[二烷基、二链烯基、二炔基或(烷基、链烯基)-氨基]羰基取代的烷基、 杂环基氨基羰基、杂环基亚烷基氨基羰基、杂环基氨基羰基取代的烷基、 杂环基亚烷基氨基羰基取代的烷基、N,N-[二烷基]亚烷基氨基羰基、N,N -[二烷基]亚烷基羰基取代的烷基、烷基取代的杂环基羰基、烷基取代的 杂环基羰基-烷基、羧基取代的烷基、二烷基氨基取代的酰基氨基烷基, 以及选自精氨酸、天冬酰胺、谷氨酰胺、S-甲基半胱氨酸、蛋氨酸和其 相应的亚砜和砜衍生物、甘氨酸、亮氨酸、异亮氨酸、别异亮氨酸、叔亮 氨酸、正亮氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸、丙氨酸、氨酸、 组氨酸、谷氨酸、缬氨酸、苏氨酸、丝氨酸、天冬氨酸、β-氰基丙氨酸 及别苏氨酸的氨基酸侧链;炔基和杂环基羰基、氨基羰基、酰氨基、一或 二烷基氨基羰基、一或二芳基氨基羰基、烷基芳基氨基羰基、二芳基氨基 羰基、一或二酰基氨基羰基、芳族或脂族酰基、被选自氨基、羧基、羟基、 巯基、一或二烷基氨基、一或二芳基氨基、烷基芳基氨基、二酰基氨基、 一或二芳基氨基、烷氧基、链烯氧基、芳氧基、硫代烷氧基、硫代链烯氧 基、硫代炔氧基、硫代芳氧基和杂环基的取代基任意取代的烷基。
28.根据权利要求25的化合物,其具有下列通式:

其中 G是(CH2)1-6,其中各个G的1个并且仅仅1个CH2基团上的氢被      - (CH2)c-酰胺-T4取代;
T2和T4是式C1-25N0-9O0-9S0-3P0-3HαFβIδ的有机残基,其中α、β和 δ的总和足以饱和C、N、O、S和P原子的可能未饱和的价。
酰胺是 或
R1是氢或C1-10烷基;
c是从0到4的整数;
X是如权利要求1所定义;并且
n是从1到50的整数,当n大于1时,G、c、酰胺、R1和T4均独 立地选择。
29.根据权利要求28的化合物,其具有下列通式:

其中T5是式C1-25N0-9O0-9S0-3P0-3HαFβIδ的有机残基,其中α、β和 δ的总和是以饱和C、N、O、S和P原子的可能未饱和的价,且T5包括 叔胺或季胺或有机酸;并且m是0-49的整数。
30.根据权利要求28的化合物,其具有下列通式:

其中T5是式C1-25N0-9O0-9S0-3P0-3HαFβIδ的有机残基,其中α、β和 δ的总和是以饱和C、N、O、S和P原子的可能未饱和的价,且T5包括 叔胺或季胺或有机酸;并且m是0-49的整数。
31.根据权利要求29和30中任一项的化合物,其中-酰胺-T5选自:


32.根据权利要求29和30中任一项的化合物,其中-酰胺-T5选自:



33.根据权利要求25-29中任一项的化合物,其中T2具有当下列有机酸 之一与胺基团缩合以形式T2-(C=O)-N(R1)-时所得到的结构:甲酸、 乙酸、丙酸、丙炔酸、氟乙酸、2-丁炔酸、环丙烷羧酸、丁酸、甲氧乙 酸、二氟己酸、4-戊炔酸、环丁烷羧酸、3,3-二甲基丙烯酸、戊酸、N,N -二甲基甘氨酸、N-甲酰-Gly-OH、乙氧基乙酸、(甲硫基)乙酸、吡 咯-2-羰酸、3-糠酸、异噁唑-5-羧酸、反式-3-己烯酸、三氟乙 酸、己酸、Ac-Gly-OH、2-羟-2-甲基丁酸、苯甲酸、烟酸、2-吡 嗪羧酸、1-甲基-2-吡咯羧酸、2-环戊烯-1-乙酸、环戊烷乙酸、(S) -(-)-2-吡咯烷-5-羧酸、N-甲基-L-脯氨酸、庚酸、Ac-b -Ala-OH、2-乙基-2-羟丁酸、2-(2-甲氧基乙氧基)乙酸、对甲苯 甲酸、6-甲基烟酸、5-甲基-2-吡嗪羧酸、2,5-二甲基吡咯-3-羧 酸、4-氟苯甲酸、3,5-二甲基异噁唑-4-羧酸、3-环戊基丙酸、辛 酸、N,N-二甲基琥珀氨酸、苯基丙炔酸、肉桂酸、4-乙基苯甲酸、对 甲氧基苯甲酸、1,2,5-三甲基吡咯-3-羧酸、3-氟-4-甲基苯甲酸、 Ac-DL-炔丙基甘氨酸、3-(三氟甲基)丁酸、1-哌啶丙酸、N  乙酰脯 氨酸、3,5-二氟苯甲酸、Ac-L-Val-OH、吲哚-2-羧酸、2-苯并呋 喃羧酸、苯并三唑-5-羧酸、4-正丙基苯甲酸、3-二甲基氨基苯甲酸、 4-乙氧基苯甲酸、4-(甲硫基)苯甲酸、N-(2-糠酰)甘氨酸、2-(甲硫 基)烟酸、3-氟-4-甲氧基苯甲酸、Tfa-Gly-OH、2-甲酸、喹哪 啶酸、Ac-I-Ile-OH、3-甲基吲哚烯-2-羧酸、2-喹喔啉羧酸、1 -甲基吲哚-2-羧酸、2,3,6-三氟苯甲酸、N-甲酰-L-Met-OH、2 -[2-(2-甲氧基乙氧基)乙氧基]乙酸、4-正丁基苯甲酸、N-苯甲酰甘 氨酸、5-氟吲哚-2-羧酸、4-正丙氧基苯甲酸、4-乙酰-3,5-二甲 基-2-吡咯羧酸、3,5-二甲氧基苯甲酸、2,6-二甲氧基烟酸、环己烷 戊酸、2-萘基乙酸、4-(1H-吡咯-1-基)苯甲酸、吲哚-3-丙酸、间 三氟甲基苯甲酸、5-甲氧基吲哚-2-羧酸、4-戊基苯甲酸、Bz-b- Ala-OH、4-二乙基氨基苯甲酸、4-正丁氧基苯甲酸、3-甲基-5- CF3-异噁唑-4-羧酸、(3,4-二甲氧基苯基)乙酸、4-联苯基羧酸、新 戊酰-Pro-OH、辛酰基-Gly-OH、(2-萘氧基)乙酸、吲哚-3-丁酸、 4-(三氟甲基)苯基乙酸、5-甲氧基吲哚-3-乙酸、4-(三氟甲氧基)苯 甲酸、Ac-L-Phe-OH、4戊氧基苯甲酸、Z-Gly-OH、4-羧基-N -(呋喃-2-基甲基)吡咯烷-2-酮、3,4-二甲氧基苯甲酸、2,4-二甲 基-5-CO2Et-吡咯-3-羧酸、N-(2-氟苯基)琥珀酰胺酸、3,4,5-三 甲氧基苯甲酸、N-苯基邻氨基苯甲酸、3-苯氧基苯甲酸、壬酰-Gly -OH、2-苯氧基吡啶-3-羧酸、2,5-二甲基-1-苯基吡咯-3-羧酸、 反式-4-(三氟甲基)肉桂酸、5-(甲基-2-苯基噁唑-4-基)乙酸、 4-(2-环己烯氧基)苯甲酸、5-甲氧基-2-甲基吲哚-3-乙酸、反式 -4-可塔宁羧酸、Bz-5-氨基戊酸、4-己氧基苯甲酸、N-(3-甲氧 基苯基)琥珀酰胺酸、Z-Sar-OH、4-(3,4-二甲氧基苯基)丁酸、Ac- O-氟-DL-Phe-OH、N-(4-氟苯基)戊酰胺酸、4′-乙基-4-联苯 基羧酸、1,2,3,4-四氢吖啶羧酸、3-苯氧基苯基乙酸、N-(2,4-二氟苯 基)琥珀酰胺酸、N-癸酰基-Gly-OH、(+)-6-甲氧基-a-甲基-2 -萘乙酸、3-(三氟甲氧基)肉桂酸、N-甲酰-DL-Trp-OH,(R)-(+) -a-甲氧基-a-(三氟甲基)苯乙酸、Bz-DL-Leu-OH、4-(三氟甲 氧基)苯氧基乙酸、4-庚氧基苯甲酸、2,3,4-三甲氧基肉桂酸、2,6-二 甲氧基苯甲酰基-Gly-OH、3-(3,4,5-三甲氧基苯基)丙酸、2,3,4,5,6 -五氟苯氧基乙酸、N-(2,4-二氟苯基)戊酰胺酸、N-十一酰基-Gly -OH、2-(4-氟苯甲酰基)苯甲酸、5-三氟甲氧基吲哚-2-羧酸、N -(2,4-二氟苯基)二甘醇氨酸、Ac-L-Trp-OH、Tfa-L-苯基甘氨 酸-OH、3-碘代苯甲酸、3-(4-正戊基苯甲酰基)丙酸、2-苯基-4 -喹啉羧酸、4-辛氧基苯甲酸、Bz-L-Met-OH、3,4,5-三乙氧基苯 甲酸、N-月桂酰-Gly-OH、3,5-双(三氟甲基)苯甲酸、Ac-5-甲基 -DL-Trp-OH、2-碘苯基乙酸、3-碘-4-甲基苯甲酸、3-(4-正 己基苯甲酰基)丙酸、N-己酰-L-Phe-OH、4-壬氧基苯甲酸、4′-(三 氟甲基)-2-联苯基羧酸、Bz-L-Phe-OH、N-三癸酰基-Gly-OH、 3,5-双(三氟甲基)苯基乙酸、3-(4-正庚基苯甲酰基)丙酸、N-庚酰- L-Phe-OH、4-癸氧基苯甲酸、N-(α,α,α-三氟-间甲苯基)邻氨基 苯甲酸、2-[3-(三氟甲基)苯胺基]盐酸、4-(2-羟基六氟异丙基)苯 甲酸、N-肉豆蔻酰-Gly-OH、3-(4-正辛基苯甲酰基)丙酸、N-辛 酰基-L-Phe-OH、4-十一烷氧基苯甲酸、3-(3,4,5-三甲氧基苯基) 丙酰-Gly-OH、8-碘代萘酸、N-十五酰-Gly-OH、4-十二烷氧 基苯甲酸、N-棕榈酰-Gly-OH和N-硬脂酰-Gly-OH。
34.包括权利要求15-33中任一项的多个化合物的组合物,其中没有两 种化合物有同样的Tms或同样的X。
35.根据权利要求34的组合物,其中多个是大于2个。
36.根据权利要求34的组合物,其中多个是大于4个。
37.根据权利要求34的组合物,其中核酸片段具有互补于载体之一部分 的序列,其中该片段能够引导核苷酸合成。
38.根据权利要求34的组合物,其中多个化合物中各成员的Tms基团至 少相差2amu。
39.根据权利要求34的组合物,其中多个化合物中各成员的Tms基团至 少相差4amu。
40.包括和权利要求15-33中任一项的化合物的组合物。
41.根据权利要求要求40的组合物,其进一步包括pH大约为5至9的 缓冲液。
42.根据权利要求要求40的组合物,其进一步包括酶和dATP、dGTP、 dCTP和dTTP之一。
43.根据权利要求要求40的组合物,其进一步包括酶和ddATP、ddGTP、 ddCTP和ddTTP之一。
44.包括多组权利要求15-33中任一项的化合物的组合物,其中
在一组内,所有成员均具有同样的Tms基团,并且核酸片段具有以选 自ddAMP、ddGMP、ddCMP和ddTMP的同样二脱氧寡核苷酸终止的 可变长度;并且
其中各组之间Tms基团至少差2amu。
45.根据权利要求44的组合物,其中多个是至少3个。
46.根据权利要求44的组合物,其中多个是至少5个。
47.包括权利要求44的第一多组化合物,和权利要求15-33中任一项 的第二多组化合物的组合物;
其中第二多组内的所有成员都具有以选自ddAMP、ddGMP、ddCMP 和ddTMP的同样二脱氧核苷酸终止的核酸序列;条件是存在于第一多组 化合物中的二脱氧核苷酸不是存在于第二多组化合物中的同样的二脱氧 核苷酸。
48.一种DNA测序分析测试盒,其包括多组容器,每组容器都至少包括 5个容器,其中第一容器含有载体,第二、第三、第四和第五个容器含有 权利要求15-33中任一项的化合物;及
第二、第三、第四和第五个容器的核酸片段是相同的,并互补于该 组容器内载体的一部分,并且每组容器内的Tms基团不同于试剂盒中的其 他Tms基团。
49.根据权利要求48的试剂盒,其中多个是至少3个。
50.根据权利要求48的试剂盒,其中多个是至少5个。
51.一种适用于权利要求1的方法的系统,其包括分离标记核酸片段的 分离装置,从标记核酸片段上裂解与特定核苷酸相互关联的并可用电化学 检测法检测之标记的装置,以及进行恒电势电流测定的装置。
52.根据权利要求1或2的方法,其中至少一个标记的核酸片段是权利 要求15至33中任何一项的化合物。
53.权利要求52的方法,其中标记物的检测是用非荧光光谱测定法或电 位测定法。

说明书全文

发明总地涉及测定核酸分子序列的方法和组合物,特别是涉及允许 同时测定多个核酸序列的方法和组合物。

核糖核苷酸(DNA)测序是生物学的基本技术。其在分子生物学中 起到核心作用,并且在生物学的其他方面起到迅速扩展的作用。人类基因 组计划是旨在读出整个人类基因组密码的一项多国参予的工作。其为生物 学中进行的最大项目,并已开始对医学产生了重要影响。发展成本低廉而 快速的测序技术将会确保这一计划的成功。确实,NIH和人类基因组项 目的DOE分支机构已资助了旨在改良测序技术的实质性工作,但没有对 目前的实践产生实质性影响(Sulston和Waterston,自然(Nature) 376:175,1995)。

在过去的二十年里,检测和分析核酸序列已形成了生物学研究的组成 部分之一。这种方法与其他新的研究工具及方法学一起使科学家得以研究 基因及基因产物,从而更好地了解这些基因的功能,以及发展新的治疗和 诊断方法。

1977年建立了两种不同的DNA测序方法学,并且如今仍在使用。简 单地说,Sanger(Proc.Natl.Acad.Sci(USA)74:5463,1977)描述的利用二 脱氧终止子的酶学方法包括借助于DNA聚合酶从单股模板合成DNA 链。Sanger测序方法依赖于这样的事实,即该二脱氧核苷酸(ddNTP)以 某种方式作为正常脱氧核苷酸(即使以低效率)掺入到生长链中。然而, ddNTP不同于正常脱氧核苷酸(dNTP)在于它们缺乏链延伸所必需的 3’-OH基团。当ddNTP掺入到DNA链中时,3′-羟基基团缺乏阻止了 新的磷酸二酯键形成,并且DNA片段因ddNTP与模板DNA中的基互 补而终止。Maxam和Gilbert方法(Maxam和Gilbert,Proc.Natl.Acad. Sci.(USA),74:560,1977)则是利用原DNA的化学降解方法(两种情况下 DNA都必须是克隆的)。两种方法都产生从待测序之DNA片段中的特定 的点开始并在每个碱基处终止的片段群体。每个片段的终止都取决于原始 DNA片段内特定碱基的定位。用聚丙烯酰胺凝胶电泳法分离DNA片段 并从凝胶的放射自显影图上读出DNA碱基(腺嘌呤、胞嘧啶、胸腺嘧啶、 嘌呤;也分别称为A、C、T、G)的次序。

大量DNA集合测序策略(Church和Kieffer-Higgins,科学 (Science)24:185,1988)是新近出现的DNA测序方法之一。集合测序 策略包括合并许多DNA模板(样品)并加工作为集合体的样品。为了在加 工结束时分离序列信息,开始时将感兴趣的DNA分子连接到一组寡核苷 酸“标记”上。合并标记的DNA分子、扩增并在96孔板中化学断裂。 电泳分离合并的样品后,将DNA转移到固相载体上并与一系列特异性标 记的寡核苷酸杂交。然后按原始集合体中有的标记数目,对这些膜进行相 同数目次数的探查,在各组探查中产生与标准DNA测序方法相似的放射 自显影图谱。因此每个反应和凝胶产生相当于从常规反应和凝胶所得数据 量乘以所使用的探针数目的数据量。如果使用碱性磷酸酶作为报导酶,则 可使用在化学发光检测程式中检测的1,2-二氧杂丁环底物。但这种集合 策略的主要缺点是只能通过Southern转印测序凝胶并且对集合体中的每 个克隆在该膜上进行一次杂交读出序列。

除了测序方法学的发展外,由于自动DNA测序工具的出现也加快了 测序速度。简单地说,这些方法是使用荧光素标记的引物以代替其中使用 放射标记成分的方法。荧光素染料被连接到测序引物或ddNTP终止子 上。自动操作方法现已利用聚合酶链反应(PCR)技术,并导致线性扩增策 略的发展。目前的商品测序工具允许在单一泳道上进行所有4个双脱氧 终止子反应。每个双脱氧终止子反应由独特的荧光引物代表(每种类型的 碱基一个荧光团:A,T,C,G)。每个泳道只代表一个模板DNA(即DNA样 品)。目前的凝胶允许在64个分立的泳道中电泳分离多达64个样品。用 光照射凝胶泳道,然后检测从荧光团发射的光,从而检测不同的ddNTP 终止的片段。每个电泳步骤长约4-6小时。每次电泳分离分辨约400 -600个核苷酸(nt),因此每个测序仪每小时可测定6000nt序列。

还报道了使用质谱法研究核酸单体成分(Hignite,摘自《质谱的生物 化学应用》,Waller和Darmer(编),Wiley-Interscience,第16章, pp.527,1972)。简单地说,对于较大的寡聚体,等离子体吸收检测长达14 个碱基的被保护的合成寡核苷酸,以及长达4个碱基的未保护的寡核苷 酸已取得了显著的早期成功。如检测蛋白质一样,已证明ESIMS也适用 于寡核苷酸(Covey等,Rapid Comm.in Mass Spec.2:249-256,1988)。 这些分子在溶液中是离子化的,在酸性桥接磷酸二酯和/或末端磷酸部分 带有电荷,并且除钠加合物外,可在气相中产生多个带电的分子阴离子。

用普通的ddNTP技术测定小于100个碱基的DNA序列比测定较大 的DNA模板更为复杂,因而有时要利用化学降解法。然而,化学分解方 法需要大约50pmol放射活性32P末端标记的材料、6个化学步骤、电泳 分离以及膜曝光。对于小的寡核苷酸(<14nt),联合使用电喷射离子化法 (ESI)和傅立叶转化(FT)质谱法(MS)速度快得多,而且更敏感。以高(105) 分辨率检测的带多个电荷之离子的解离产物代表连续断裂,借以在1分 钟内提供亚皮摩尔量样品的全序列(Little等,J.Am.Chem.Soc.116:4893, 1994)。为进行分子量检测,ESI/MS技术已扩展到检测更大的片段 (Potier等,Nuc.Acids Res.22:3895,1994)。ESI/FTMS技术似乎是传统 测序方法和检测长100mer的核酸中定点突变的有价值的补充。最近已使 用更敏感的ESI源获得了上样量为3×10-13摩尔的50mer序列的光谱数 据。

以质谱技术检测DNA序列的其他手段是,其中用某元素的个别同位 素标记,并在电泳分离混合物中不同大小的DNA后以质谱法分析不同的 同位素(上述的其他方法是利用质谱的分辨率分离并检测不同长度的 DNA寡核苷酸,故充其量也只是一种难以应用的建议)。下述所有方法均 利用Sanger方法将测序引物转变成一系列多出1个核苷酸的不同长度的 DNA片段。每个酶促合成的DNA分子都含有原始引物、目的DNA一部 分的复制序列,以及二脱氧终止子。这就是说,产生的一组DNA分子都 含有引物和彼此差一个残基的不同长度。

Bremen等人(生物质谱,New York,Elsevier,p.219,1990)描述了使 用硫的4种稳定同位素作为DNA标记的方法,使人们能检测已用毛细管 电泳法分离的DNA片段。使用ddNTP的α-硫代类似物,将单个硫同 位素掺入到各个DNA片段中。因此可按照末端核苷酸独特地标记4种类 型的DNA片段(以ddTTP、ddATP、ddGTP、ddCTP为末端的);例 如,32S标记以A为末端的片段,33S标记G,34S标记C,36S标记T, 并且混合在一起上样至电泳柱,由改良的喷墨指印机头得到几个皮升的层 析级分,然后在燃烧炉中完全燃烧。该方法将被标记的DNA的硫代磷酸 氧化成SO2,然后可在四极质谱或磁扇形场质谱仪中分析之。SO2的质 量单位呈现在A结尾的片段为64,G为65,C为66,T为68。当DNA 片段从柱中出现时,保持DNA片段的分辨率要取决于得到足够小的级 分。因为质谱仪是直接与毛细管凝胶柱偶联的,所以分析的速率是由电泳 速率决定的。不幸的是该方法花费很高、释放放射性气体,并且没有商品 化。该方法还存在另外两个基本限制条件:(a)不能耐受质量为64、65、 66或68的其他成分(同量异序污染物),并且(b)硫同位素的百分天然丰 度(32S为95.0,33S为0.75,34S为4.2,36S为0.11)控制着灵敏度和 成本。因为32S是95%天然富有的,所以其他同位素必须富集到>99%才 能除去污染的32S。天然丰度<1%的同位素要达到99%富集率费用是相 当高的;即使36S被纯化100倍,其仍含有如36S的或多或少的34S。

Gilbert描述了由寡聚体合成仪、膜上的阵列、检测杂交的检测器及 中央计算机组成的自动DNA测序装置(EPA 92108678.2)。合成仪合成并 标记有任意推测之序列的多个寡聚体。使用寡聚体探测膜上固定的 DNA。检测器识别杂交模式并将那些模式送入中央计算机,其构成一个 序列并推测下一个寡聚体合成周期的序列。通过重复过程,可以自动方式 获得DNA序列。

Brennen描述了基于寡聚体连接检测核酸序列的方法(美国专利 No.5,403,708)。描述了形成与核酸模板杂交之连接产物的方法和组合物。 引物与DNA模板杂交,然后寡核苷酸的随机延伸集合物也于连接酶存在 下与引导模板杂交。连接酶将杂交的寡聚体共价连接到引物上。修饰后可 以检测以N个核苷酸相间隔的核酸模板中第一组靶核苷酸残基之一个或 多个成员的序列。在该方法中,形成标记的连接产物,其中掺入到连接产 物中的标记的位置和类型可提供有关核酸模板中核苷酸残基的信息,标记 的核苷酸残基与之碱基配对

Koster描述了在用核酸外切酶降解DNA后以质谱仪测定DNA序列 的方法(PCT/US94/02938)。所述的方法是一种直接检测DNA序列的简单 方法(不使用Sanger反应)。将DNA克隆到标准载体中,固定5′末端,然 后通过核酸外切酶在3′端顺序地降解,并以质谱法检测酶解产物(核苷 酸)。

Weiss等人描述了用于荧光倍增DNA测序的自动杂交/影象装置 (PCT/US94/11918)。该方法是基于酶联探针与含有由典型Sanger反应产 生的按大小分离DNA片段的膜杂交这一思想而建立的。

目前对测序信息的客观需求大于由已有测序仪器如AB1377和 Phormacia ALF所能提供的信息。现有技术的根本限制之一是可使用目 前的标记系统分辨的标记的数目较小。上文讨论的Church集合系统使用 更多的标记,但这些标记的使用和检测是很费时费的。

本发明公开了可用于以比上述方法有更快的速度和更高的敏感性,并 进一步提供其他相关优点的测定核酸分子序列的新的组合物及方法。

简单地说,本发明提供了测定核酸分子序列的方法、化合物、组合物、 试剂盒及检测系统。本发明的一个方面是提供测定核酸分子序列的方法。 该方法包括以下步骤:(a)产生与选择的靶核酸分子互补的标记的核酸片 段,其中标记物是与特定核苷酸相关联的,并且是可用非荧光光谱测定法 和电位测定法检测的;(b)按顺序长度分离标记的片段;(c)从标记的片 段上切掉标记物;以及(d)用非荧光光谱测定法或电位测定法检测标记 物,从而确定核酸分子的序列。在优选实施方案中,用质谱法、红外光谱 法、紫外光谱法及稳压电流分析法测定标记物。

另一个方面,本发明提供下列结构式的化合物:

            Tms-L-X

其中Tms是可用质谱法检测的有机基团,包含,氢和氟中至少一种,并 可包括选自氧、氮、硫、磷及碘的原子;L是可使含Tms的部分与化合物 的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱 检测时支持单一离子化带电状态的功能团,并且选自叔胺、季胺和有机 酸;X是选自羟基、基、巯基、羧酸、卤代烷基的功能团,或活化或 抑制该功能团与其他部分偶联之活性的衍生物,或者是核酸片段,其中在 核酸片段3′末端以外的位置连接到L上;条件是该化合物不通过X连接 到固相载体上,其质量不小于250道尔顿。

另一方面,本发明提供了包括多个式Tms-L-MOI之化合物的组 合物,其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一 种,以及可包含选自氧、氮、硫、磷及碘的原子;L是允许含Tms的部分 与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物 经受质谱检测时支持单一离子化荷电状态的功能团,并选自叔胺、季胺和 有机酸;MOI是核酸片段,其中L在MOI的3′末端以外的位置被结合 到MOI上;并且其中没有两个化合物有同样的Tms或同样的MOI。

另一个方面,本发明提供含有和式Tms-L-MOI之化合物的组 合物,式中Tms是可用质谱法检测的有机基团,包括碳,氢和氟中至少一 种,以及还可含有选自氧、氮、硫、磷及碘的原子;L是允许含Tms的部 分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合 物经受质谱检测时支持单一离子化荷电状态的功能团并选自叔胺、季胺和 有机酸;且MOI是核酸片段,其中L在MOI的3′末端以外的位置被结 合到MOI上。

另一个方面,本发明提供包括多组化合物的组合物,每组化合物都具 有结构式                     Tms-L-MOI, 其中Tms是可用质谱法检测的有机基团,包括碳,氢和氟中至少一种,并 可包括选自氧、氮、硫、磷及碘的原子;L是可使含Tms的部分与化合物 的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱 检测时支持单一离子化带电状态的功能团,并且选自叔胺、季胺和有机 酸;且MOI是核酸片段,其中L在MOI的3′末端以外的位置被结合到 MOI上;其中在一组内,所有成员都具有相同的Tms基团,并且MOI片 段具有可变长度,并以选自ddAMP、ddGMP、ddCMP和ddTMP的 相同二脱氧核苷酸终止;并且其中各组之间,Tms基团相差至少2个原子 质量单位(amu)。

另一方面,本发明提供包括如上文中所描述第一多组化合物,并与第 二多组具有式Tms-L-MOI的化合物组合的组合物,式中Tms是可用 质谱法检测的有机基团,包括碳,氢和氟中至少一种,以及还可含有选自 氧、氮、硫、磷及碘的原子;L是允许含Tms的部分与化合物的其余部分 裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持 单一离子化带电状态的功能团并选自叔胺、季胺和有机酸;且MOI是核 酸片段,其中L在MOI的3′末端以外的位置被结合到MOI上;并且其 中第二多组内的所有成员都具有以选自ddAMP、ddGMP、ddCMP和 ddTMP的同样二脱氧核苷酸终止的MOI序列;条件是存在于第一多组 化合物中的二脱氧核苷酸与存在于第二多组化合物中的不是同样的二脱 氧核苷酸。

在另一方面,本发明提供用于DNA测序分析的试剂盒。该试剂盒包 括多个容器组,每个容器组包括至少5个容器,其中第一容器含有一种 载体,第二、三、四和五个容器含有式Tms-L-MOI的化合物,其中 Tms是可用质谱法检测的有机基团,包括碳,氢和氟中的至少一种,并可 包括选自氧、氮、硫、磷及碘的原子;L是可使含Tms的部分与化合物的 其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检 测时支持单一离子化带电状态的功能团,并且选自叔胺、季胺和有机酸; 且MOI是核酸片段,其中L在MOI的3′末端以外的位置被结合到MOI 上;这样第二、第三、第四和第五容器的MOI是完全相同的并互补于该 组容器内载体的一个部分,每个容器内Tms基团不同于试剂盒中的其他 Tms基团。

在另一个方面,本发明提供用于测定核酸分子序列的系统。该系统包 括分离标记的核酸片段的分离装置、从标记的核酸片段上裂解与特定核苷 酸相关联的并可用电化学检测法检测的标记物的装置,以及稳压电流分析 法的装置。

在本发明的其他实施方案中,在给定的反应内可同时利用4、5、 10、15、20、25、30、35、40、50、60、70、80、90、100、 200、250、300、350、400、450或多于500个不同的且独特的标记 的分子,其中每个标记对于选择的核酸片段、探针或第一式第二成员都是 独特的,并且是可以分别鉴定的。

在参见下列详细描述和附图后可进一步理解本发明的这些和其他方 面。此外,下文所列的参考文献中都更详细地描述了某些方法或物质(如 质粒等),因此均以其全文引入本文作为参考。

图1显示合成可化学裂解的质谱检测标记物的五氟苯基酯(以释放出 带羧基酰胺末端的标记)的流程。

图2显示合成可化学裂解的质谱检测标记物的五氟苯基酯(以释放带 羧酸末端之标记)的流程。

图3-6和8显示合成一组36个光化学可裂解之质谱标记的四氟苯 基酯的流程。

图7显示合成一组36个末端为胺的光化学可裂解之质谱标记物的流 程。

图9显示从相应的一组36个光化学可裂解之质谱标记酸的四氟苯基 酯制得的36个光化学可裂解的质谱标记的寡核苷酸的合成反应步骤。

图10显示从一组36个末端为胺的光化学可裂解之质谱标记物制得 的36个光化学可裂解的质谱标记寡核苷酸的合成反应流程。

图11举例显示用质谱法同时检测多个标记。

图12显示单独α-氰基基体的质谱图。

图13显示模式构建的标记的核酸片段。

简单地说,本发明的一个方面提供其中感兴趣的分子或其前体通过不 稳定键与标记物连接的化合物。因此,本发明的化合物可用下列结构通式 表示:

                T-L-X

其中T是标记部分,L是作为或含有不稳定键的接头部分,X是感兴趣 的分子(MOI)部分或可供以使MOI结合到T-L上的功能团部分 (Lh)。因此本发明的化合物可由下列更特异的通式代表:

      T-L-MOI和T-L-Lh

出于如下详细描述的原因,可特意使几组T-L-MOI经受使不稳 定键断裂的条件,而从化合物的其余部分上释放出标记部分。然后用一种 或多种分析技术鉴定标记部分的特征,从而提供有关标记部分结构的直接 信息以及(更重要的)相应的MOI鉴定的间接信息。

作为本发明有代表性的其中L为直接键的化合物的一个简单实例, 可参见下列结构(i):

在结构(i)中,T是连接到羰基基团上的合氮多环芳族残基,X是MOI (更具体地讲为以胺基团为末端的核酸片段),并且L是形成酰胺基团 的键。相对于T中的键来说,如本领域所知,酰胺键是不稳定的,酰胺 键可受到不影响标记部分内键的酸或碱性条件的化学裂解(断裂)。因此, 可按下示方式释放出标记部分(即含有T的裂解产物):

然而,接头L可能不只是如上实例中所示的直接键,在此可参见本 发明的另一个具有下示结构(ii)的代表性化合物:

已知具有邻位硝基苄胺残基(见结构(ii)内加方框的部分)是光 解不稳定的,在这些化合物暴露于特定波长的光化幅射时将引起苄胺键的 选择性裂解(参见结构(ii)中标有加重线的键)。因此,结构(ii) 具有与结构(i)相同的T和MOI基团,但接头基团含有多个原子和键, 其中有一特殊的不稳定键。因此如下所示,结构(ii)的光解可从化合物的 其余部分释放出标记部分(含T部分)。

因此本发明提供这样的化合物,即在其遇有适当的裂解条件后经受裂 解反应,从而从化合物的余留部分释放出标记部分。可用标记部分、MOI (或其前体,Ln)以及将两个基团连接在一起的不稳定键来描述本发明 的化合物。或者,可用形成化合物的各个组分来描述本发明的化合物。因 此可将本发明的化合物描述为如下所述的标记反应物、接头反应物和 MOI反应物。

标记反应物由化学柄(Th)和可变部分(Tvc)组成,因而标记反 应物可视为具有下列通式结构:

                Tvc-Th

为了举例说明这一通式,可参见结构(iii),其显示可用于制备结构(ii) 化合物的标记反应物。如下所示,具有结构(iii)的标记反应物含有标 记可变部分和标记柄:

在结构(iii)中,标记柄(-C(=O)-A)简单地提供一个 使标记反应物与接头反应物反应形成T-L部分的通路。结构(iii)中 的基团“A”表示羧基基团处于化学活性状态,所以其很容易与其他柄 偶联。例如“A”可以是羟基或五氟苯氧基和许多其它基团。如下文详 述的,本发明提供很多可与标记可变部分结合的可能的标记柄。因此标记 可变部分是式T-L-X中“T”的一部分,并且也将是从裂解L的反 应所形成的标记部分的一部分。

也如下文详细讨论的,因为在按照本发明制备各组化合物中,期望每 组的成员有独特的可变部分,所以如此命名标记可变部分,从而得以用分 析技术将个个成员彼此区分开。作为一个例子,结构(iii)的标记可变部 分可以是可根据紫外或质谱区分开的下列一组中的成员:

同样,接头反应物可用其侧翼连接有接头不稳定组分的化学柄(至少 需要两个,每个都称为Lh)来描述,其中接头不稳定组分由要求的不稳 定部分(L2)和可能存在的不稳定部分(L1和L3)组成,此时可能存在的不稳 定部分可有效地用于将L2与柄Lh分开,并且必要的不稳定部分则用于在 接头不稳定组分内提供不稳定键。因此,接头反应物可视为具有下列通 式:

                Lh-L1-L2-L3-Lh

可就结构(iv)来举例说明用于描述接头反应物的通式,结构(iv)也 是从结构(ii)的化合物得出的:

如在结构(iv)中示例的那样,原子可以起到一种以上的功能作用。因 此在结构(iv)中,苄基氮在允许接头反应物通过酰胺形成反应连接到标记 反应物上的过程中发挥化学柄的功能,并且在继后还可作为不稳定部分 L2的必要结构部分,其中苄基碳-氮键对光裂解是特别敏感的。结构(iv) 也说明接头反应物虽没有L1基团,但可能有L3基团(此处为亚甲基)。同 样,接头反应是可以有L1基团但没有L3基团,或者可以有L1和L3基团, 或者可以没有L1也没有L3基团。在结构(iv)中,存在靠近羰基基团的基 团“P”,表明羰基基团是受到保护不参予反应的。给定这一构型,标 记反应物(iii)的活化的羰基基团即可彻底地与接头反应物(iv)的胺基团反 应,以形酰胺键并得到式T-L-Lh的化合物。

MOI反应物是感兴趣分子的适当反应活性形式。其中感兴趣的分子 是核酸片段,适当的MOI反应物是通过其5′羟基基团结合到磷酸二酯基 团上,然后结合到以氨基基团终止的亚烷基链上的核酸片段。然后该氨基 基团与结构(iv)的羰基基团反应(当然是在使羰基去保护之后,并且最好是 在继后活化羰基基团以有利于与胺基团反应之后),从而使MOI连接到接 头上。

当以时间先后次序考虑时,本发明可看作是用标记反应物(具有化学 标记柄和标记可变部分)、接头反应物(具有两个化学接头柄、要求的不稳 定部分及0-2个可能存在的不稳定部分)以及MOI反应物(具有感兴趣 的分子组分和感兴趣分子的化学柄)形成T-L-MOI。因此,为了形 成T-L-MOI,首先使标记反应物和接头反应物一起反应以提供T -L-Lh,然后使MOI反应物与T-L-Lh反应以提供T-L- MOI,或者(较不优选)首先使接头反应物和MOI反应物一起反应以提供 Lh-L-MOI,然后使Lh-L-MOI与标记反应物反应以提供T- L-MOI。为方便起见,从可用于形成这类化合物的标记反应物、接头 反应物及MOI反应物的度来描述式T-L-MOI的化合物。当然, 也可用其他(通常是更麻烦的)方法来制备式T-L-MOI的同样化合 物,并落入本发明T-L-MOI化合物的范围之内。

在任何情况下,本发明都使T-L-MOI化合物在经受裂解条件时 从化合物其余部分中释放出标记部分。标记部分将至少包括标记可变部 分,并且典型地还包括来自标记柄的某些或所有原子,来自被用于将标记 反应物连接到接头反应物上的接头柄的某些或所有原子,任选的不稳定部 分L1(如果该基团存在于T-L-MOI中时),并将可能含有取决于L2 之精确结构和裂解化学性质的必要不稳定部分L2的某些部分。为方便起 见,标记部分可称为含T部分,因为T一般将构成标记部分的主要部分(按 质量计)。

在给出关于本发明一个方面的导论后,下文将详细描述T、L和X 各组分。这一描述是以某些术语的下述定义开始的,这些定义将在下文中 用于描述T、L和X。

本文所用的术语“核酸片段”是指与选择的核酸分子互补的(即互补 于其全部或部分),并可衍生于天然或合成或重组产生的分子,包括非天 然存在的分子,有时可以是双链或单链形式的;并包括寡核苷酸(如DNA 或RNA)、引物、核酸类似物(如PNA)、借助聚合酶以5′至3′方向延伸的 寡核苷酸、化学或酶促裂解的核酸、以二脱氧终止子终止的或在3′或5′ 末端带帽以防止在5′或3′末端聚合的核酸,以及这些形式的组合。核酸 片段与选择的靶核酸分子互补一般是指在整个片段长度上表现有至少约 70%特异碱基配对。核酸片段较好表现有至少约80%特异性碱基配对; 最好至少约90%。确定百分错配(从而百分特异碱基配对)的方法是本 领域已知的,并且是基于参照全碱基配对时作为Tm函数的百分错配。

本文所使用的术语“烷基”,无论单独或联合的,均指含有1-10, 较好1-6个,最好1-4个碳原子的饱和直链或支链残基。这类残 基的例子包括但不只限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、 仲丁基、叔丁基、戊基、异戊基、己基、癸基等。术语“亚烷基”是指饱 和的含有1-10个,较好1-6个,最好1-4个碳原子的直链或支链 烃二基。这样的残基的例子包括但不只限于亚甲基、亚乙基 (-CH2-CH2-)、亚丙基等。

术语“链烯基”(单独或结合的)是指在总共2-10个,较好2- 6个,最好2-4个碳原子链中至少有1个碳-碳双链的直链或支链烃基。 这样的基团的例子包括但不只限于乙烯基、E和Z-丙烯基、异丙烯基、 E-和Z-丁烯基、E-和Z-异丁烯基、E-和Z-戊烯基、癸烯基 等。术语“亚链烯基”是指在总共2-10个,较好2-6个,最好2- 4个碳原子链中至少有1个碳-碳双键的直链或支链烃双基。这样的双基 的例子包括但不只限于次甲基(=CH2),亚乙烯基(-CH=C-)、亚丙烯 基(-CH2-CH=CH-)等。

术语“炔基”,无论单独或组合使用,均指在总共2-10个,较好 2-6个,最好2-4个碳原子链中至少有1个碳-碳三键的直链或支链 烃残基。这样的残基的例子包括但不只限于乙炔基、丙炔基(炔丙基)、 丁炔基、己炔基、癸炔基等。术语“亚炔基”单独或联合使用均指总共有 2-10个,较好2-6个,最好2-4个碳原子的链中至少有1个碳一 碳三键的直链或分支链烃双基。这样的双基的例子包括但不只限于亚乙炔 基(-C≡C-)、亚丙炔基(-CH2-C≡C-)等。

术语“环烷基”(单独或组合的)是指含3至8个,较好3至6个 碳原子的饱和的环形的碳原子排列。这样的环烷基残基的例子包括但不只 限于环丙基、环丁基、环戊基、环己基等。术语“环亚烷基”是指环烷基 的双基形式。

术语“芳基”是指(整个由碳和氢组成)选自苯基、基、茚基、2,3 -二氢化茚基、薁基、芴基和蒽基的碳环芳香基团;或选自呋喃基、噻吩 基、吡啶基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、2-吡唑啉 基、吡唑烷基、异噁唑基、异噻唑基、1,2,3-噁二唑基、1,2,3-三唑 基、1,3,4-噻二唑基、哒嗪基、嘧啶基、吡嗪基、1,3,5-三嗪基、1,3,5 -三噻烷基、中氮茚基、吲哚基、异吲哚基、3H-吲哚基、二氢吲哚基、 苯并[b]呋喃基、2,3-二氢苯并呋喃基、苯并[b]噻吩基、1H-吲唑基、 苯并咪唑基、苯并噻唑基、嘌呤基、4H-喹嗪基、喹啉基、异喹啉基、 噌啉基、2,3-二氮杂萘基、喹唑啉基、喹喔啉基、1,8-二氮杂萘基、 喋啶基、咔唑基、吖啶基、吩嗪基、吩噻嗪基和吩噁嗪基的杂环芳香基 团。

申请中限定的“芳基”基团可独自含有1至4个取代基,其独立 地选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链 烯基、炔基、氰基、羧基、烷氧羰基、1,2-二氧亚乙基、烷氧基、链烯 氧基或炔氧基、烷基氨基、链烯基氨基、炔基氨基、脂族或芳族酰基、烷 氧羰基氨基、烷基磺酰氨基、吗啉代羰基氨基、硫代吗啉代羰基氨基、N -烷基胍基、芳烷氨基磺酰基;芳烷氧基烷基;N-芳烷氧基脲;N- 羟基脲;N-链烯基脲;N,N-(烃基,羟基)脲;杂环基;硫代芳氧基 取代的芳基;N,N-(芳基、烷基)肼基;Ar′取代的磺酰基杂环基;芳烷 基取代的杂环基;环烷基和环烯基取代的杂环基;环烷基缩合的芳基;芳 氧基取代的烷基;杂环基氨基;脂族或芳族酰基氨基羰基;脂族或芳族酰 基取代的链烯基;Ar′取代的氨基羰基氧基;Ar′,Ar′-二取代的芳基; 脂族或芳族酰基取代的酰基;环烷基羰基烷基;环烷基取代的氨基;芳氧 基羰基烷基;二氨基磷酸或酯。

“Ar”是具有1至3个取代基的如上文定义的碳环或杂环芳基,所 述取代取选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷 基、链烯基、炔基、1,2-二氧亚甲基、1,2-二氧亚乙基、烷氧基、链 烯氧基、炔氧基、烷氨基、链烯基氨基或炔基氨基、烷基羰氧基、脂族或 芳族酰基、烷基羰基氨基、烷氧基羰基氨基、烷基磺酰氨基、N-烷基 或N,N-二烷基脲。

术语“烷氧基”单独或联合均指烷基醚残基,其中术语“烷基”定义 同上。适当的烷基醚残基的例子包括但不只限于甲氧基、乙氧基、正丙氧 基、异丙氧基、正丁氧基、异丁氧基、仲丁氧基、叔丁氧基等。

术语“链烯氧基”单独或联合均指式:链烯基-O-的残基,其中 术语“链烯基”定义同上,但条件是该残基不是烯醇醚。适当的链烯氧基 残基的例子包括但不只限于烯丙氧基、E-和Z-3-甲基-2-丙烯 氧基等。

术语“炔氧基”单独或合用均指式:炔基-O-的残基,其中术语 “炔基”定义同上,但条件是该残基不是炔醇醚。适当的炔氧基残基的例 子包括但不只限于炔丙氧基、2-丁炔氧基等。

术语“硫代烷氧基”是指式:烷基-S-的硫醚残基,其中烷基定 义同上。

术语“烷基氨基”单独或联合使用均指单一或二烷基取代的氨基残基 (即式烷基-NH-或(烷基)2-N-的残基),其中术语“烷基”定义同 上。适当的烷基氨基残基的例子包括但不只限于甲氨基、乙氨基、丙氨基、 异丙氨基、叔丁氨基、N,N-二乙氨基等。

术语“链烯氨基”单独或联合均使用均指式:链烯基-NH-或(链 烯基)2N-的残基,其中术语“链烯基”定义同上,但条件是该残基不是 烯胺。这样的链烯基氨基残基的例子是烯丙氨基残基。

术语“炔氨基”单独或联合使用均指式:炔基-NH-或(炔基)2N- 的残基,其中术语“炔基”定义同上,但条件是该残基不是炔胺。这样的 炔氨基残基的例子是炔丙氨基残基。

术语“酰胺”是指-N(R1)-C(=O)-或-C(=O)-N(R1)-,其中 R1定义为包括氢及其他基团。术语“取代的酰胺”是指其中R1不是氢的 状态,而术语“未取代的胺”是指其中R1是氢的状态。

术语“芳氧基”单独或联合使用均指式:芳基-O-的残基,其中 芳基定义同前。芳氧基残基的例子包括但不只限于苯氧基、萘氧基、吡啶 氧基等。

术语“芳氨基”单独或联合使用均指式:芳基-NH-的残基,其 中芳基的定义同上所述。芳氨基的例子包括但不只限于苯氨基(苯胺基)、 萘氨基、2-,3-和4-吡啶氨基等。

术语“芳基缩合的环烷基”单独或联合使用均指与芳基残基分享两个 相邻原子的环烷基残基,其中术语“环烷基”和“芳基”定义同上。芳基 缩合的环烷基残基的例子是与苯缩合的环丁基残基。

术语“烷基羰基氨基”单独或联合使用均指式:烷基-CONH的残 基,其中术语“烷基”定义同上。

术语“烷氧基羰基氨基”单独或联合使用均指式:烷基-OCONH -的残基,其中术语“烷基”定义同上。

术语“烷基磺酰氨基”单独或联合使用均指式:烷基-SO2NH-的 残基,其中术语“烷基”定义同上。

术语“芳磺酰氨基”单独或联合使用均指式:芳基-SO2-NH-的 残基,其中术语“芳基”的定义同上所述。

术语“N-烷基脲”单独或联合使用均指式:烷基-NH-CO- NH-的残基,其中术语“烷基”定义如上。

术语“N-芳基脲”单独或联合使用均指式:芳基-NH-CO- NH-的残基,其中术语“芳基”定义同上。

术语“卤素”单独或结合使用是指氟、氯、溴和碘。

术语“烃残基”是指只需要一个氢原子就可以成为独立的稳定分子的 碳和氢的排布。因此,烃残基在一个碳原子上有一个开放化合价位点,通 过该位点烃残基可结合到其他原子上。烃基的例子有烷基、链烯基、炔基、 环烷基等。

术语“烃双基”是指只需要两个氢原子就可以成为独立的稳定分子 的碳和氢的排布。因此,烃双残基在一个或两个碳原子上有两个开放化合 价位点,通过该位点烃残基可结合到其他原子上。烃双基的例子有亚烷 基、亚链烯基、亚炔基、亚环烷基等。

术语“烃基”是指具有单一价位点整个由碳和氢组成的任何稳定排 布,借助价位点其结合到另一个部分上,因此包括烷基、链烯基、炔基、 环烷基、环链烯基、芳基(没有杂原子掺入芳环中)、芳烷基、烷芳基等。 烃残基也称为烃基。

术语“亚烃基”是指具有两个价位点整个由碳和氢组成的任何稳定的 排布,借助价位点使之结合到其他部分上的,因此该术语包括亚烷基、亚 链烯基、亚炔基、亚环烷基、亚环链烯基、亚芳基(没有杂原子掺入到亚 芳环中)、芳基亚烷基、烷基亚芳基等。烃双基也称为亚烃基。

术语“烃基-O-亚烃基”是指结合到氧原子上的烃基基团,其中 氧原子同样也在两个使亚烃基基团结合到其他部分上的价位点之一处结 合到亚烃基基团上。术语“烃基-S-亚烃基”、“烃基-NH-亚烃 基”和“烃基-酰胺-亚烃基”具有等同的含义,只所说的氧分别代之以 硫、-NH-或酰胺基团。

术语“N-(烃基)亚烃基”是指其中两个价位点之一结合到氮原子 上,并且氮原子同时结合到氢和烃基基团上的亚烃基基团。术语“N,N -二(烃基)亚烃基”是指其中两个价位点之一结合到氮原子上,并且氮原 子同时结合到两个烃基基团上的亚烃基基团。

术语“烃酰基-亚烃基”是指通过酰基(-C(=O)-)基团结合到亚烃 基基团的两个价位点之一上的烃基基团。

术语“杂环烃基”和“杂环基”是指包括碳原子和多达4个的选自 氧、氮、磷和硫和原子(称为杂原子)的稳定的环形排布。环排布可以是3 -7个原子的单环形式的,或者是8-11个原子的双环形式的。环可以 是饱和或未饱和的(包括芳香环),并且可以是或不是苯缩合的。环中的氮 和硫原子可以是任何氧化形式的,包括季铵化形式的氮。杂环烃基可以在 任何内环碳或杂原子处连接从而产生稳定的结构。优选的杂环烃基包括含 有1或2个氮杂原子的5-7元单环杂环。

取代的杂环烃基是指上文限定的杂环烃基,其中至少其一个环原子结 合到伸出环的指定的取代基上。

就烃基和亚烃基基团而言,术语“任何其中一个或多个氢被相等数目 的氟取代的前述基团的衍生物”是指含有碳、氢和氟子,但不含其他原子 的分子。

术语“活化的酯”是含有可很容易被亲核试剂如胺、醇或硫醇亲核试 剂取代的“离去基团”的酯。这样的离去基团是已知的,并包括而不限于 N-羟基琥珀酰亚胺、N-羟基苯并三唑、卤素(卤离子)、包括四氟苯氧 基在内的烷氧基、硫代烷氧基等。术语“被保护的酯”是指被蔽避的或以 其它方法致无反应性的酯基(如参见Greene,“有机合成中的保护基 团”)。

考虑到上述定义,本领域技术人员可很容易地理解本申请全文中所使 用的其他化学术语。这些术语可以单独使用或以其任何组合方式使用。残 基的优选的或更优选的链长度适用于所有这些组合。

A.标记的核酸片段的产生

如上文提到的,本发明的一个方面提供用于DNA测序的一般方案, 其允许在每个泳道中使用16个以上的标记;进行连续检测,可以检测标 记并且如基于荧光的常规测序一样,在按大小分离时读出序列。该方案可 适用于基于标记分子的大小分离的任何DNA技术。以下更详细地讨论用 于本发明的适当标记和接头,以及测定核酸序列的方法。

1.标记

本文使用的术语“标记”一般是指用于专鉴定“感兴趣的分子”的 化学部分,特别是指标记可变部分以及标记反应物、标记组分和标记部分 的可能与之紧密结合的部分。

可用于本发明的标记具有以下几个特性:

1)其能够与所有其他标记分开。与其他化学部分的这种区别可能是 基于标记的色谱行为(特别是在裂解反应之后)、其光谱或电势性质或其某 些组合。可用于区分标记的光谱方法包括质谱(MS)、红外(IR)、紫外(UV) 及荧光,其中优选的是MS、IR和UV,并且MS是最优选的光谱法。 电势电流法是优选的电势检测法。

2)当以10-22至10-6摩尔存在时即可检测标记。

3)标记具有化学柄,通过该柄其可连接到MOI上,借以专门地鉴定 之。连接可以是直接连到MOI上,或通过“接头”基团连接到MOI上。

4)标记对于所有其经受的操作,包括与MOI连接或与之裂解开,以 及对其所连接的MOI的任何操作都是化学上稳定的。

5)标记对于其所连接的MOI上进行的操作无明显干扰。例如,如果 标记是连接到寡核苷酸上,标记必须是对涉及寡核苷酸的任何杂交或酶促 反应(例如PCR测序反应)都没有明显干扰的。同样,如果标记是连接到 抗体上,则它必须对该抗体的抗原识别没有明显的干扰。

欲用某些光谱或电势测定法检测的标记部分应具有提高该方法之检 测敏感性和特异性的性质。典型地,标记部分将具有那些性质,因为这些 性质已被设计到标记可变部分中,其一般将构成标记部分的主要部分。在 下面的讨论中,使用“标记”一词一般是指标记部分(即含有标记可变部 分的裂解产物),但也可以为是指标记可变部分本身,因为其为负责提供 标记部分中特异可检测性质的那部分。在式T-L-X的化合物中, “T”部分将含有标记可变部分。标记可变部分已被设计成可用例如质 谱法鉴定的成分,这样T-L-X的“T”部分便可称为Tms。同样, 含有T的T-L-X的裂解则可称为含Tms的部分。可用下述质谱和电 势测定法鉴定含Tms部分的性质。

a.MS标记的特征

当标记可用质谱法分析时(即为MS可读的标记,本文也称之为MS 标记或“含Tms部分”),标记的基本特征是其能够被离子化。因此在设 计MS可读标记中,于其中掺入可在MS中的离子化条件下携带正电荷 或负电荷的化学功能团是一个优选要素。这一特征是提供改善的离子形成 效率以及检测的更大总体灵敏度,特别是在电喷射离子化过程中。支持离 子化电荷的化学功能团可来自Tms或L或这两者。例如Sunner,J.等人 (Anal.Chem,60:1300-1307(1988))描述了可提高质谱法检测分析物的 相对灵敏度的因素。

有利于携带负电荷的优选的功能团是有机酸,如酚式羟基、羧酸、膦 酸、磷酸、三唑、磺酰脲、全氟醇和磺酸。

有利于在离子化条件下带正电荷的优选的功能团是脂族或芳香胺。赋 予MS标记以提高的可检测性的胺功能团包括季铵类(即具有4个键,每 个都连到碳原子上的胺,参见Aebersold,美国专利No.5,240,859)和叔胺 (即有各自连到碳原子上的3个键的胺,其包括例如存在于吡啶中的 C=N-C基团,参见Hess等人,Anal.Biochem,224:373,1995;Bures等人, Anal.Biochem.224:364,1995)。特别优选的是位阻季胺。叔胺和季铵可以 是烷基或芳基胺。含Tms部分必须带有至少一个可离子化基团,但也可具 有一个以上的可离子化基团。优选的电荷状态是每个标记都是单一离子化 的。因此,最好是每个含Tms部分(及每个标记可变部分)都只含有单一的 位阻胺或有机酸基团。

可形成含Tms部分之一部分的适当的胺残基包括下示基团:

用质谱法鉴定标记较好是基于其分子质量对电荷的比例(m/z)。MS 标记的优选分子质量范围是从大约100至2000道尔顿,含Tms部分较好 有至少约250道尔顿的质量,更好至少约300道尔顿,最好至少约350 道尔顿。质谱法一般难于区分具有低于约200-250道尔顿之母离子的 残片(取决于精密设备),因此本发明的含Tms部分最好有大于上述范围的 质量。

如上面解释的,含Tms部分可含有存在于标记可变部分中的原子以外 的原子,并确实不存在可Tms本身中的原子。因此,Tms本身的质量可小 于约250道尔顿,只要含Tms部分具有至少约250道尔顿的质量即可。因 此,Tms的质量范围可为15(即甲基)至约10,000道尔顿,较好是100 至大约5,000道尔顿,最好是大约200至大约1,000道尔顿。

当标记掺入有一种以上具明显丰度之同位素的原子时,用质谱法分辨 这些标记就比较困难。因此,欲进行质谱鉴定的优选T基团(Tms基团)含 有碳,氢和氟中至少一种,以及可能有的选自氧、氮、硫、磷和碘的原子。 虽然Tms中可存在其他原子,但它们的存在有时会使质谱数据更难以分 析。Tms基团中除氢和/或氟外,最好只有碳、氮和氧原子。

氟在Tms基团中是可能有的甚至优选的原子。与氢相比,当然氟要重 得多。因此,氟而不是氢原子的存在使Tms基团有更高的质量,从而使T 上SM基团达到并超过如上文所述的预期的大于250道尔顿的质量。此 外,用氟取代氢可使含Tms部分有更大的挥发性,并且当使用质谱法作为 检测方法时分析物有更大的挥发性可提高检测的灵敏度。

Tms的分子式落入C1-500 N0-100O0-100 S0-10P0-10HαFβIδ的范 围之内,式中α、β和δ的总和足以饱和C、N、O、S和P原子的未 饱和价。C1-500 N0-100 O0-100 S0-10 P0-10HαFβIδ是指Tms含有至少 一个,并可含有从1至500任何数目的碳原子,此外还可任意地含有多 至100个氮原子(“N0-”是Tms不需含有任何氮原子)、多至100个氧原 子,以及多至10个硫原子和多至10个磷原子。符号α、β和δ代表Tms 中氢、氟和碘原子的数目,这些数目中的任何两个都可能是0,并且这 些数目的总和等于C、N、O、S和P原子的总的未饱和的价数。Tms 优选具有落入C1-50 N0-10 O0-10 HαF β范围内的分子式,其中α和β的 总和分别等于存在于该部分中的氢和氟原子的数目。

b.IR标记的特征

有机化学基团的IR检测有两种基本形式:随机扫描IR和吸收IR。 随机扫描IR光谱和吸收IR光谱是互补的光谱法。一般说来,喇曼激发 取决于键极性改变,而IR吸收则取决于键偶极性改变。弱IR吸收线变 成强喇曼线,且反之亦然。波数是IR光谱的特征性单位。IR标记有3 个不同应用的光谱区:在12500至4000cm-1处的近IR,4000至600cm-1 处的中IR,600至30cm-1处的远IR。为了本文所述的以化合物作为鉴 定MOI、探针或引物的标记的应用,应优选中红外光谱区。例如,羧酸、 羧酸酯和酰胺、碳酸烷基和芳基酯、氨基甲酸酯和应检测羰基伸缩(1850 至1750cm-1)。N-H弯曲(1750至160cm-1)将用于鉴定胺、铵离子和酰 胺。在1400至1250cm-1,检测R-OH弯曲以及酰胺中的C-N伸缩。 在900至690cm-1检测芳族取代方式(ArNH2的C-H弯曲,N-H弯 曲)。饱和的C-H、烯烃、芳环、双和三键、酯、缩、缩酮、铵盐、 N-O化合物和肟、硝基、N-氧化物和硝酸酯、偶氮、腙、苯醌、羧 酸、酰胺,以及内酰胺都具有振动红外相关性数据(参见Pretsch et al.,有 机化合物结构测定的光谱数据,Springer-Verlag,New York,1989)。 优选的化合物应包括在2230至2210cm-1表现出很强的伸缩振动的芳族 腈。其他有用类型的化合物是具有在2140和2100cm-1之间产生尖锐吸收 带之强伸缩振动的芳族炔。第三种类型的化合物是在2160至2120cm-1 区表现有强吸收带的芳族叠氮化物。硫氰酸酯是在2275至2263cm-1有强 吸收的有代表性的化合物。

c.UV标记的特征

Scott在其著作(天然产物紫外光谱的解析,Permagon Press,New York,1962)中给出了有机发色团类型和它们各自的紫外可见光特征的汇 编。发色团是负责特定光吸收的原子或原子群或电子群。对共轭系统中的 π至π*最大吸收存在经验规则(参见Pretsch等,有机化合物结构测定的 光谱数据,p.B65和B70,Springer-Verlag,New York,1989)。优选的 化合物(用共轭系统)应具有n至π*和π至π*转换。这样的化合物的例子 是酸性紫T、吖啶橙、吖啶黄G、亮兰G、刚果红、结晶紫、孔雀绿草 酸盐、间胺黄、亚甲蓝、甲基橙、甲基紫B、萘酚绿B、油蓝N、油红 O、4-苯偶氮酚、藏红、溶剂绿3和苏丹橙G,所有这些化合物都是 可以市场上得到的(Aldrich,Milwaukee,WI)。例如Jane,I.等,J.Chrom. 323:191-225(1985)中列出了其他一些适用的化合物。

d.荧光标记的特征

荧光探针大多直接根据吸收度和荧光发射波长及强度鉴定和定量分 析。发射光谱(荧光和磷光)比吸收光谱更加敏感,并得以更特异的检测。 其他光物理学特征如受激状态半寿期和荧光各向异性则使用不那么广 泛。通常最有用的强度参数是吸收的摩尔消光系数(ε)和荧光的量子产率 (QY)。在单一被长处ε的值是特定的(通常是探针吸收最大值),而QY则 是通过整个荧光光谱分布图的总光电发射的度量。荧光激发(通过吸收) 通常使用窄的光学带宽(<20nm),而荧光检测带宽的可变度大得多,其最 大灵敏度范围从全谱带到最大分辨率的窄谱带(~20nm)。每种探针分子 的荧光强度是与δ和QY的乘积成正比的。在同前有实际应用重要性的 荧光团中,这些参数的范围是δ约为10,000至100,000cm-1M-1,QY为 0.1至1.0。可用作荧光标记的化合物是:荧光素、若丹明、λ蓝470、 λ绿、λ红664、λ红665、吖啶橙和碘化Propidium,这些化合物均可 从Lambda Fluorescence Co.(Pleasant Gap.PA)购得。荧光化合物例如尼 罗红、德克萨斯红、丽丝胺TM、BODIPYTM则可从Molecular Probe(Eugene,OR)购得。

e.电势标记的特征

电化学检测(ECD)的原理是基于在某些外加电压下化合物氧化或还 原,供出或接受电子而产生可被检测的电流。当某些化合物经受电位差 时,分子在工作电极表面经受到分子重排,丢失(氧化)或获得(还原)电子, 这样的化合物可以说是电活性的并经受电化学反应。在HPLC洗脱液通 过电极流动时,EC检测器在电极表面施加电压。从柱上洗脱的电活性化 合物供出电子(氧化)或获得电子(还原)同时产生电流峰。重要的是,所产 生的电流量取决于分析物的浓度和所施加的电压,每种化合物均具有其开 始氧化或还原所需特异性电压。目前最通用的电化学检测器是电流检测 器,其中电势保持恒定并在其后检测由电化学反应产生的电流。这种类型 的光谱测定法目前称为“恒电位电流测法”。市售安培计可得自ESA, Inc.,Chelmford,MA。

当检测效率为100%时,特异化检测器称为“库仑检测器”。就选择 性和灵敏度来说,库仑检测器具有许多实践优点,从而使此类检测器特别 适用于一个阵列中。在库仑检测器中,对于给定的分析物浓度,将信号电 流作为对工作电极外加电势(电压)的函数作图。所得到的S形曲线图称为 电流-电压曲线或流体动力电压电流图(HDV)。HDV允许最好地选择对 工作电极施加的电势,以使所观察到的信息达到最大。ECD的主要优点 是其固有的灵敏度,检测的电流水平在亚非摩尔(10-15摩尔)范围。

包括许多生物化学品、药物及杀虫剂在内的大量化学物质及化合物都 是有电化学活性的。即使它们的半波电势(最大信号半数值时的电势)只有 30-60mV的差异,仍可有效地分辨层析共洗脱的化合物。

最近发展的库仑传感器当在基于液相层析的分离中用作检测器时,可 选择性地鉴定和分辨共洗脱化合物。因此这些阵列化的检测器还可补加在 检测器本身中完成的另一组分离。目前的仪器具有原则上只受获得数据的 速率限制的16个波道。可在EC阵列上分辨的化合物的数目是受层析限 制的(即受板数限制)。然而,如果层析共洗脱的两种或多种化合物的半波 电位差为30-60mV,则该阵列即能够区分之。化合物成为电化学活性 化合物的能力有赖于其具有EC活性基团(即-OH、-O、-N、-S)。

已使用库仑检测器成功地检测的化合物包括5-羟基色胺、3-甲 氧基-4-羟苯基乙二醇、尿黑酸、多巴胺、变肾上腺素、3-羟犬尿 氨酸、乙酰米诺芬(acetominophen)、3-羟色醇、5-羟吲哚基乙酸、 苯酚、邻甲酚、焦培酚、2-硝基苯酚、4-硝基苯酚、2,4-二硝基苯 酚、4,6-二硝基甲酚、3-甲基-2-硝基苯酚、2,4-二氯苯酚、2,6 -二氯苯酚、2,4,5-三氯苯酚、4-氯-3-甲基苯酚、5-甲基苯 酚、4-甲基-2-硝基苯酚、2-羟苯胺、4-羟苯胺、1,2-苯二 胺、苯并儿茶素、巴特隆、chlortholuron、敌草隆、isoproturon、利 谷隆、methohromuron、麦多隆、绿谷隆、monuron、蛋氨酸、色氨 酸、酪氨酸、4-氨基苯甲酸、4-羟苯甲酸、4-羟香豆酸、7-甲 氧基香豆素、5,7,4′-三羟黄酮、黄岑苷元、咖啡酸、儿茶素、矢车菊苷、 绿原酸、大豆黄素、野麻根素、洋芜荽黄素、表儿茶素没食子酸盐、表加 兰儿茶素、表加蓝儿茶素没食子酸盐、丁子香酚、半齿泽兰素、阿魏酸、 非瑟酮、高良姜精、没食子酸、桅子宁、染料木黄酮、龙胆酸、桔皮苷、 鸢尾配基、莰非醇、无色花青素、藤黄菌素、楝子素、桑色素、杨梅黄酮、 柚皮苷、柚皮素-7-芸香糖苷、花葵素、甲基花青素、根皮素、红车 轴草异丙酮、原儿茶酸、鼠李黄素、槲皮素、樱花素、黄芩配基、莨菪亭、 丁香醛、丁香酸、柑桔黄酮、troxerutin、伞形酮、香草酸、1,3-二甲 基四氢异喹啉、6-羟多巴胺、r-猪毛菜醇、N-甲基-猪毛菜醇、 四氢异喹啉、阿米替林、阿林吗啡、辣椒辣素、氯氮单、氯丙嗪、道诺红 菌素、地昔帕明、多塞平、氟西汀、氟西泮(氟安定)、米帕明、异丙基肾 上腺素、甲氧明、吗啡、吗啡-3-葡糖苷酸、去甲替林、奥沙西泮(去 甲羟安定)、苯福林(去氧肾上腺素)、曲米帕明、抗坏血酸、N-乙酰-5 -羟色胺、3,4-二羟苄胺、3,4-二羟扁桃酸(DOMA)、3,4-二羟苯 乙酸(DOPAC)、3,4-二羟苯丙氨酸(L-DOPA)、3,4-二羟苯基乙二 醇(DHPG)、3-羟基氨茴酸、2-羟基苯乙酸(2HPAC)、4-羟苯甲酸 (4HBAC)、5-羟吲哚-3-乙酸(5HIAA)、3-羟犬尿氨酸、3-羟偏 桃酸、3-羟-4-甲氧基苯乙胺、4-羟苯乙酸(4HPAC)、4-羟苯 基乳酸(4HPLA)、5-羟色氨酸(5HTP)、5-羟色醇(5HTOL)、5-羟 色胺(5HT)、5-羟色胺硫酸盐、3-甲氧基-4-羟苯基乙二醇 (MHPG)、5-甲氧基色胺、5-甲氧基色氨酸、5-甲氧基色醇、3- 甲氧基酪胺(3MT)、3-甲氧基酪氨酸(3-OM-DOPA)、5-甲基半 胱氨酸、3-甲基鸟嘌呤、蟾毒色胺、多巴胺、多巴胺-3-葡糖苷酸、 巴多胺-3-硫酸酯、多巴胺-4-硫酸酯、肾上腺素、麻黄宁、叶酸、 谷胱苷肽(还原态)、鸟嘌呤、鸟苷、尿黑酸(HGA)、高香草酸(HVA)、高 香草醇(HVOL)、高藜芦酸、硫酸hva、次黄嘌呤、吲哚、吲哚-3-乙 酸、吲哚-3-乳酸、犬尿氨酸、褪黑素、变肾上腺素、N-甲基色胺、 N-甲基酪胺、N,N-二甲基色胺、N,N-二甲基酪胺、去甲肾上腺肾、 去甲变肾上腺素、章鱼胺、吡哆醛、磷酸吡哆醛、吡哆胺、脱氧肾上腺素、 色醇、色胺、酪胺、尿酸、香草扁桃酸(vma)、黄嘌呤及黄苷。其他化合 物如可参见Jane,I.等,J.Chrom.323:191-225(1985)和Musch,G.等,J. Chrom.348:99-110(1985)。可用本领域已知的方法将这些化合物掺入 到式T-L-X的化合物中。例如,具有羧酸基团的化合物可与胺、羟 基等反应以形成酰胺、酯及T和L间的其他键合。

除上述性质外,无论打算使用什么检测方法,标记都最好具有模式化 学结构。这将有助于使用组合化学技术构建大数目的结构上相关的标记。 例如,希望Tms有几种性质。期望当以质谱法检测含Tms部分时,其含有 支持单一离子化带电状态的功能团(更简单地称为“质谱灵敏度增强”基 团,或简称为MSSE)。另外,希望以其作为含Tms部分的家族中的一个 成员,该家族的每个成员都有不同的质量/电荷比例,而在质谱检测中又 有差不多同样的灵敏度。因此,希望该家族的成员有同样的MSSE。为 了得以产生化合物的家族,已发现可通模式合成路线方便地产生标记反 应物,因而可将标记成分本身看作是含有模式的。

对于Tms基团的结构,一个优选的模式是Tms具有下列通式:

                T2-(J-T3)n- 其中T2是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具有15 至500道尔顿的质量范围的有机残基;T3是从碳和一个或多个氢、氟、 碘、氧、氮、硫和磷形成的具有50至1000道尔顿的质量范围的有机残 基;J是直接键,或诸如酰胺、酯、胺、硫醚、醚、硫代酯、二硫化物、 硫代醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、西夫碱、还原态西夫 碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、氨磺酰 或碳-碳键的功能团;n是1至50的整数,这样当n大于1时,每个T3 和J都是独立选择的。

模式结构T2-(J-T3)n-提供了进入T-L-X化合物家族的方 便途径,其中家族的每个成员都有不同的T基团。例如,当T是Tms, 并且每个家族成员都期望有同样的MSSE时,T3基团之一即可提供这种 MSSE结构。为了就Tms的质量而言提供家族成员间的可变性,家族成员 间的T2基团可以是变化的。例如,一个家族成员可以有T2=甲基,而另 一个有T2=乙基,再一个则有T2=丙基等。

为了提供质量的大跳跃,可以设计T3基团以向T-L-X上加入相 当大的(如1百至几百个)质量单位。这样的T3基团可称为分子量范围调 整基团(“WRA”)。如果用一组具有超出限制范围的质量的T2基团工 作,WRA是相当有用的。可使用单一组T2基团,仅仅通过在Tms中掺 入一个或多个WRA T3基团来产生有宽质量范围的Tms基团。因此,举一 个简单的例子,如果一组T2基团为Tms提供250-340道尔顿的质量范 围,加入例如作为T3基团的100个道尔顿的WRA,则使用同一组T2基 团,就可提供350-440道尔顿的质量范围。同样,加入两个100道尔顿 MWA基团(各自作为T3基团)便提供接近450-540道尔顿的质量范围, 可继续这种WRA基团的递增加入,以为Tms基团提供很大的质量范围。 优选的式T2-(J-T3)n-L-X的化合物具有通式RVWC-(RWRA)W- RMSSE-L-X,其中VWC是“T2”基团,WRA和MSSE中的每一 个都是“T3”基团。图13中举例说明了这一结构,并代表了制备Tms的 一种模式方法。

在通式T2-(J-T3-)n-中,T2和T3较好是选自烃基、烃基-O -亚烃基、烃基-S-亚烃基、烃基-NH-亚烃基、烃基-酰胺-亚 烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基、烃基酰基-亚烃基、 杂环基烃基,其中杂原子选自氧、氮、硫和磷,取代的杂环基烃基,其中 杂原子选自氧、氮、硫和磷,且取代基选自烃基、烃基-O-亚烃基、 烃基-NH-亚烃基、烃基-S-亚烃基、N-(烃基)亚烃基、N,N- 二(烃基)亚烃基以及烃基酰基-亚烃基。此外,T2和/或T3可以是前面列 出的潜在T2/T3基团中任何一个的衍生物,即一个或多个氢原子被氟原子 取代。

还就通式T2-(J-T3)n-来说,优选的T3具有式-G(R2)-,其中 G是具有单一R2取代基的C1-6亚烷基链。因此,如果G是亚乙基 (-CH2-CH2-),则两个亚乙基碳中的任一个可具有R2取代基,并且R2 选自烷基、链烯基、炔基、环烷基、芳基缩合的环烷基、环烯基、芳基、 芳烷基、芳基取代的链烯基或炔基、环烷基取代的烷基、环烯基取代的环 烷基、联芳基、烷氧基、链烯氧基、炔氧基、芳烷氧基、芳基取代的链烯 氧基或炔氧基、烷氨基、链烯氨基或炔氨基、芳基取代的烷氨基、芳基取 代的链烯氨基或炔基氨基、芳氧基、芳氨基、N-烷基脲取代的烷基、 N-芳基脲取代的烷基、烷基羰基氨基取代的烷基、氨基羰基取代的烷 基、杂环基、杂环基取代的烷基、杂环基取代的氨基、羧烷基取代的芳烷 基、氧代碳环缩合的芳基和杂环基烷基;环烯基、芳基取代的烷基和芳烷 基、羟基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、烷氧基 取代的烷基、芳烷氧基取代的烷基、氨基取代的烷基、(芳基取代的烷氧 基羰基氨基)取代的烷基、硫羟取代的烷基、烷基磺酰取代的烷基、(羟 基取代的烷硫基)取代的烷基、硫代烷氧基取代的烷基、烃基酰基氨基取 代的烷基、杂环酰基氨基取代的烷基、烃基取代的杂环基酰基氨基取代的 烷基、烷基磺酰氨基取代的烷基、芳基磺酰氨基取代的烷基、吗啉代烷基、 硫代吗啉代烷基、吗啉代羰基取代的烷基、硫代吗啉代羰基取代的烷基、 (N-(烷基、链烯基或炔基)-或N,N-[二烷基、二链烯基、二炔基或(烷 基、链烯基)-氨基]羰基取代的烷基、杂环基氨基羰基、杂环基亚烷基氨 基羰基、杂环基氨基羰基取代的烷基、杂环基亚烷基氨基羰基取代的烷 基、N,N-[二烷基]亚烷基氨基羰基、N,N-[二烷基]亚烷基羰基取代的 烷基、烷基取代的杂环基羰基、烷基取代的杂环基羰基-烷基、羧基取代 的烷基、二烷基氨基取代的酰基氨基烷基,以及选自精氨酸、天冬酰胺、 谷氨酰胺、S-甲基半胱氨酸、蛋氨酸和其相应的亚砜和砜衍生物、甘 氨酸、亮氨酸、异亮氨酸、别异亮氨酸、叔亮氨酸、正亮氨酸、苯丙氨酸、 酪氨酸、色氨酸、脯氨酸、丙氨酸、鸟氨酸、组氨酸、谷氨酸、缬氨酸、 苏氨酸、丝氨酸、天冬氨酸、β-氰基丙氨酸及别苏氨酸的氨基酸侧链; 炔基和杂环基羰基、氨基羰基、酰氨基、一或二烷基氨基羰基、一或二芳 基氨基羰基、烷基芳基氨基羰基、二芳基氨基羰基、一或二酰基氨基羰基、 芳族或脂族酰基、被选自氨基、羧基、羟基、巯基、一或二烷基氨基、一 或二芳基氨基、烷基芳基氨基、二酰基氨基、一或二芳基氨基、烷氧基、 链烯氧基、芳氧基、硫代烷氧基、硫代链烯氧基、硫代炔氧基、硫代芳氧 基和杂环基任意取代的烷基。

优选的式T2-(J-T3-)n-L-X的化合物具有下示结构:

其中G是(CH2)1-6,其中由单一“G”代表的CH2基团中一个并且只有 一个上的氢原子被-(CH2)c-酰胺-T4所取代,T2和T4是式 C1-25N0-9HαFβ的有机残基,其中α和β的总和足以饱和C、N和O原子可 能未饱和的价;酰胺是

R1是氢或C1-10烷基;C是0至4的整数,n是1至50的整数,其中当 n大于1时,G、c、酰胺、R1和T4是独立地选择的。

在另一个优选实施方案中,式T2-(J-T3-)n-L-X的化合物 具有下示结构:

其中T5是式C1-25 N0-9 O0-9 HαFβ的有机残基,其中α和β的和足以 饱和C、N和C原子的可能未饱和的价;T5包括叔或季胺或有机酸; m是0-49的整数,且T2、T4、R1、L和X是如前定义的基团。

另一个具有式T2-(J-T3-)n-L-X的优选化合物则有以下具 体结构:

其中T5是式C1-25 N0-9 O0-9 HαFβ的有机残基,其中α和β的总和足 以饱和C、N和O原子的可能未饱和的价;T5包括叔或季胺或有机酸; m是0-49的整数,且T2、T4、c、R1、“酰胺”、L和X已在前 面给出了定义。

在上面的具有T5基团的结构中,-酰胺-T5较好是使有机酸与从 “G”延伸的游离氨基基因反应而方便地制得的下列基团之一:

当上述化合物具有T5基团,并且“G”基团具有游离羧基基团(或其 反应性等同物)时,则优选的-酰胺-T5基团是如下所示的,可使适当的 有机胺与从“G”基团延伸的游离羧基基团反应而方便地制得的基团:

在本发明的三个优选实施方案中,T-L-MOI具有下示结构:

其中T2和T4是式C1-25 N0-9 O0-9 S0-3P0-3HαFβIδ的有机残基,其 中α、β和δ的总和足以饱和C、N、O、S和P原子可能未饱和的价; G是(CH2)1-6,其中由每个G代表的CH2基团上的一个并且只有一个氢 被-(CH2)c-酰胺-T4取代;酰胺是

R1是氢或C1-10烷基;c是从0至4的整数;“C2-C10”代表具有2 至10个碳原子的亚烃基基团,“ODN-3′-OH”代表有末端3′羟基 基团的核酸片段(即在核酸片段的3′末端以外的位置连接到(C1-C10)); n是从1至50的整数,这样当n大于1时,独立地选择G、c、酰胺、 R1和T4。最好没有三个杂原子结合到同一个碳原子上。其中T2和T4是 式C1-25 N0-9 O0-9HαFβ的有机残基,其中α和β的总和足以饱和C、 N和O原子的可能未饱和的价;G是(CH2)1-6,其中由各个G代表的 CH2基团上的一个并且只是一个氢被-(CH2)c-酰胺-T4所取代;酰胺 是

R1是氢或C1-10烷基;c是从0到4的整数;“ODN-3′-OH”代表 具有末端3′羟基基团的核酸片段;n是从1到50的整数,当n大于1时, 酰胺、R1各T4是独立选择的。

在上面列出的含有T2-C(=0)-N(R1)-基团的结构中,该基团可由 式HN(R1)-的胺与选自下面例子中的有机酸反应而生成,下面所列出的 只是某些实例,但并没有无遗漏地列出所有可能的有机酸。所说有机酸的 例子包括:甲酸、乙酸、丙酸、丙炔酸、氟乙酸、2-丁炔酸、环丙烷 羧酸、丁酸、甲氧乙酸、二氟己酸、4-戊炔酸、环丁烷羧酸、3,3-二 甲基丙烯酸、戊酸、N,N-二甲基甘氨酸、N-甲酰-Gly-OH、乙 氧基乙酸、(甲硫基)乙酸、吡咯-2-羰酸、3-糠酸、异噁唑-5- 羧酸、反式-3-己烯酸、三氟乙酸、己酸、Ac-Gly-OH、2-羟 -2-甲基丁酸、苯甲酸、烟酸、2-吡嗪羧酸、1-甲基-2-吡咯 羧酸、2-环戊烯-1-乙酸、环戊烷乙酸、(S)-(-)-2-吡咯烷酮- 5-羧酸、N-甲基-L-脯氨酸、庚酸、Ac-b-Ala-OH、2 -乙基-2-羟丁酸、2-(2-甲氧基乙氧基)乙酸、对甲苯甲酸、6- 甲基烟酸、5-甲基-2-吡嗪羧酸、2,5-二甲基吡咯-3-羧酸、4 -氟苯甲酸、3,5-二甲基异噁唑-4-羧酸、3-环戊基丙酸、辛酸、 N,N-二甲基琥珀氨酸、苯基丙炔酸、肉桂酸、4-乙基苯甲酸、对甲氧 基苯甲酸、1,2,5-三甲基吡咯-3-羧酸、3-氟-4-甲基苯甲酸、 Ac-DL-炔丙基甘氨酸、3-(三氟甲基)丁酸、1-哌啶丙酸、N- 乙酰脯氨酸、3,5-二氟苯甲酸、Ac-L-Va-OH、吲哚-2-羧 酸、2-苯并呋喃羧酸、苯并三唑-5-羧酸、4-正丙基苯甲酸、3 -二甲基氨基苯甲酸、4-乙氧基苯甲酸、4-(甲硫基)苯甲酸、N-(2 -糠酰)甘氨酸、2-(甲硫基)烟酸、3-氟-4-甲氧基苯甲酸、Tfa -Gly-OH、2-萘甲酸、喹哪啶酸、Ac-L-Ile-OH、3-甲 基吲哚烯-2-羧酸、2-喹喔啉羧酸、1-甲基吲哚-2-羧酸、2,3,6 -三氟苯甲酸、N-甲酰-L-Met-OH、2-[2-(2-甲氧基乙氧 基)乙氧基]乙酸、4-正丁基苯甲酸、N-苯甲酰甘氨酸、5-氟吲哚- 2-羧酸、4-正丙氧基苯甲酸、4-乙酰-3,5-二甲基-2-吡咯羧 酸、3,5-二甲氧基苯甲酸、2,6-二甲氧基烟酸、环己烷戊酸、2-萘 基乙酸、4-(1H-吡咯-1-基)苯甲酸、吲哚-3-丙酸、间三氟甲 基苯甲酸、5-甲氧基吲哚-2-羧酸、4-戊基苯甲酸、Bz-b- Ala-OH、4-二乙基氨基苯甲酸、4-正丁氧基苯甲酸、3-甲基- 5-CF3-异噁唑-4-羧酸、(3,4-二甲氧基苯基)乙酸、4-联苯基 羧酸、新戊酰-Pro-OH、辛酰基-Gly-OH、(2-萘氧基)乙酸、 吲哚-3-丁酸、4-(三氟甲基)苯基乙酸、5-甲氧基吲哚-3-乙 酸、4-(三氟甲氧基)苯甲酸、Ac-L-Phe-OH、4戊氧基苯甲酸、 Z-Gly-OH、4-羧基-N-(呋喃-2-基甲基)吡咯烷-2-酮、 3,4-二甲氧基苯甲酸、2,4-二甲基-5-CO2Et-吡咯-3-羧酸、 N-(2-氟苯基)琥珀酰胺酸、3,4,5-三甲氧基苯甲酸、N-苯基邻氨 基苯甲酸、3-苯氧基苯甲酸、壬酰-Gly-OH、2-苯氧基吡啶-3 -羧酸、2,5-二甲基-1-苯基吡咯-3-羧酸、反式-4-(三氟甲 基)肉桂酸、5-(甲基-2-苯基噁唑-4-基)乙酸、4-(2-环己 烯氧基)苯甲酸、5-甲氧基-2-甲基吲哚-3-乙酸、反式-4-可 塔宁羧酸、Bz-5-氨基戊酸、4-己氧基苯甲酸、N-(3-甲氧基苯 基)琥珀酰胺酸、Z-Sar-OH、4-(3,4-二甲氧基苯基)丁酸、Ac -O-氟-DL-Phe-OH、N-(4-氟苯基)戊酰胺酸、4′-乙基 -4-联苯基羧酸、1,2,3,4-四氢吖啶羧酸、3-苯氧基苯基乙酸、N -(2,4-二氟苯基)琥珀酰胺酸、N-癸酰基-Gly-OH、(+)-6-甲 氧基-a-甲基-2-萘乙酸、3-(三氟甲氧基)肉桂酸、N-甲酰- DL-Trp-OH,(R)-(+)-a-甲氧基-a-(三氟甲基)苯乙酸、Bz -DL-Leu-OH、4-(三氟甲氧基)苯氧基乙酸、4-庚氧基苯甲 酸、2,3,4-三甲氧基肉桂酸、2,6-二甲氧基苯甲酰基-Gly-OH、 3-(3,4,5-三甲氧基苯基)丙酸、2,3,4,5,6-五氟苯氧基乙酸、N-(2,4 -二氟苯基)戊酰胺酸、N-十一酰基-Gly-OH、2-(4-氟苯甲酰 基)苯甲酸、5-三氟甲氧基吲哚-2-羧酸、N-(2,4-二氟苯基)二甘 醇氨酸、Ac-L-Trp-OH、Tfa-L-苯基甘氨酸-OH、3- 碘代苯甲酸、3-(4-正戊基苯甲酰基)丙酸、2-苯基-4-喹啉羧 酸、4-辛氧基苯甲酸、Bz-L-Met-OH、3,4,5-三乙氧基苯甲 酸、N-月桂酰-Gly-OH、3,5-双(三氟甲基)苯甲酸、Ac-5- 甲基-DL-Trp-OH、2-碘苯基乙酸、3-碘-4-甲基苯甲酸、 3-(4-正己基苯甲酰基)丙酸、N-己酰-L-Phe-OH、4-壬氧 基苯甲酸、4′-(三氟甲基)-2-联苯基羧酸、Bz-L-Phe-OH、 N-三癸酰基-Gly-OH、3,5-双(三氟甲基)苯基乙酸、3-(4-正 庚基苯甲酰基)丙酸、N-庚酰-L-Phe-OH、4-癸氧基苯甲酸、 N-(α,α,α-三氟-间甲苯基)邻氨基苯甲酸、2-[3-(三氟甲基)苯 胺基]盐酸、4-(2-羟基六氟异丙基)苯甲酸、N-肉豆蔻酰-Gly- OH、3-(4-正辛基苯甲酰基)丙酸、N-辛酰基-L-Phe-OH、 4-十一烷氧基苯甲酸、3-(3,4,5-三甲氧基苯基)丙酰-Gly-OH、 8-碘代萘酸、N-十五酰-Gly-OH、4-十二烷氧基苯甲酸、N -棕榈酰-Gly-OH和N-硬脂酰-Gly-OH。可从下列公司购得 这些有机酸:Aclvanced Chem Tech,Louisville,KY;Bachem Bioscience Inc.,Torrance,CA;Caliochem-Novabiochem Corp.,San Diego,CA; Farchan Laboratories Inc.,Gainesville FL;Lancaster Synthesis, Windham NH;以及MayBridge Chemical Company(c/o Ryan Scientific), Columbia,SC。这些公司的产品目录中使用上述识别这些酸的缩写字。

f.作为制备标记的手段的组合化学技术

组合化学是导致生产大的化学文库的一类合成策略(例如参见PCT 申请公开号WO94/08051)。可使用这些组合文库作为鉴定感兴趣分子 (MOI)的标记。组合化学可定义为一组彼此有不同结构的不同“结构单 元”的系统的和重复的共价连接,借以产生一大组互异的分子。结构单元 可以采取天然产生和合成的许多形式,例如可以是亲核试剂、亲电子试 剂、二烯类、烷化剂或酰化剂、二胺、核苷酸、氨基酸、糖、脂、有机单 体、合成纤维及其组合。用于连接结构单元的化学反应包括烷基化、酰化、 氧化、还原、水解、取代、消除、加成、环化、缩合等。该方法可产生化 合物文库,如寡聚合的、非寡核合的或其组合。如果是寡聚合的,化合物 可以是分支的,不分支的或环化的。可用组合化学方法制备的寡聚结构的 例子包括寡肽、寡核苷酸、寡糖、聚脂质、聚酯、聚酰胺、聚氨酯、聚脲、 聚醚、聚(磷衍生物),例如磷酸酯、膦酸酯、磷酰胺、膦酰胺、亚磷酸酯、 phorsphinamide等,以及聚(硫衍生物),如砜、磺酸酯、亚硫酸酯、氨 磺酰、亚磺酰胺等。

一个通用类型的寡聚物组合文库是肽组合文库。当前肽化学和分子生 物学的技术创新已使人们能够制备并使用由数千万到数亿个不同的肽序 列组成的文库。可将这样的文库分成三大类。一类文库包括化学合成可溶 性非载体结合的肽文库(如参见Houghten等,自然354:84,1991)。第二类 包括化学合成呈现在塑料针、树脂球或布上的与支持物结合的肽文库 (Geysen等,Mol.Immunol.23:709,1986;Lam等,自然354:82,1991; Eichler和Houghten,生物化学(Biochemistry)32:11035,1993)。在 前两类中,结构单元一般是L-氨基酸、D-氨基酸、非天然氨基酸或 其某些混合物或组合。第三类是使用分子生物学方法在丝状噬菌体或质粒 表面上制备肽或蛋白质(Scott和Craig,Curr.Opinion Biotech.5:40, 1994)。可溶性的非载体组和的肽文库似乎适合于包括用作标记在内的许 多应用。可以用例如全甲基化步骤扩展肽文库中可利用的化学多样性 (Ostresh等,Proc.Natl.Acad.Sci.,USA 91:11138,1994)。

可以制得肽组合文库的大量变体,例如其中可修饰肽骨架,和/或用 模拟基团取代酰胺键。可以使用的酰胺模拟基团包括脲、氨基甲酸酯(尿 烷)及羰基亚甲基等。重新构建骨架,以从每个氨基酸的酰胺氮而不是α 碳发出侧链,从而得到称为类肽的化合物文库(Simon等,Proc.Natl.Acad. Sci.,USA 89:9367,1992)。 另一个常见类型的寡聚物组和文库是寡核苷酸组合文库,其中结构单 元是某种形式的天然存在的或非天然的核苷酸或多糖衍生物,包括其中 各种有机和无机基团可取代磷酸酯键,并且氮和硫可取代醚键中的氧 (Schneider等,生物化学34:9599,1995;Freier等,J.Med.Chem.38:344, 1995;Frank,生物技术杂志(J.Biotechnology)41:259,1995; Schneider等,已公开的PCT WO942052,Ecker等,核酸研究(Nucleic Acids Res.)21:1853,1993)。

最近已描述了组和生产非寡聚的小分子化合物集群的方法(DeWitt 等,Proc.Natl.Acad.Sci.USA 90:690,1993;Bunin等,Proc.Natl.Acad. Sci.USA 91:4708,1994)。适于制成小分子文库的结构包括各种有机分 子,例如杂环、芳族、无环、脂族化合物、类固醇、抗生素、酶抑制剂、 配体、激素、药物、生物碱、阿片样物质、萜类、卟啉、毒素、催化剂以 及其组合。

g.组合合成标记的特异性方法

以下概述制备和使用不同组的含胺MS标记的两种方法。在两种方 法中,利用固相合成可使人们得以用组合化学的技术同时平行地合成很大 数目的标记的接头。在第一种方法中,最后从寡核苷酸上裂解掉标记后得 以释放出羧酰胺。在第二种方法中,切掉标记后产生羧酸。用于这些方法 中的化学成分和连接元件的缩写符号如下:

R                       =树脂

FMOC                    =芴基甲氧基羰基保护基团

All                     =烯丙基保护基团

CO2H                 =羧酸基团

CONH2                 =羧酰胺基团

NH2                   =氨基基团

OH                    =羟基基团

CONH                  =酰胺键

COO                   =酯链

NH2-Rink-CO2H      =4-[(α-氨基)-2,4-二甲氧基苄基]-苯氧基

苯丁酸(Rink接头)

OH-1MeO-CO2H         =(4-羟甲基)苯氧基丁酸

OH-2MeO-CO2H         =(4-羟甲基)-3-甲氧基)苯氧基乙酸

NH2-A-COOH         =侧链中有脂族或芳族胺功能团的氨基酸

X1…Xn-COOH            =具独特分子量的一组n个不同的羧酸

oligo1…oligo(n)       =一组n个寡核苷酸

HBTU                   =O-苯并三唑-1-基-N,N,N′,N′-四甲 基脲六氟磷酸盐

方法1中各步骤的顺序如下: OH-2MeO-CONH-R

↓    FMOC-NH-Rink-CO2H;偶联(如HBTU) FMOC-NH-Rink-COO-2MeO-CONH-R

↓    哌啶(除去FMOC) NH2-Rink-COO-2MeO-CONH-R

↓    FMOC-NH-A-COOH;偶联(例如HBTU) FMOC-NH-A-CONH-Rink-COO-2MeO-CONH-R

↓    哌啶(除去FMOC) NH2-A-CONH-Rink-COO-2MeO-CONH-R

↓    分为n等份   ↓↓↓↓↓  偶联到n种不同的酸X1……Xn-COOH上 X1……Xn-CONH-A-CONH-Rink-COO-2MeO-CONH-R   ↓↓↓↓↓  用1%TFA从树脂上切下标记的接头 X1……Xn-CONH-A-CONH-Rink-COOH   ↓↓↓↓↓偶联到n个寡聚体上(oligo1.....oligo(n))(例如通过Pfp 酯) X1……Xn-CONH-A-CONH-Rink-CONH-oligo1…oligo(n)

↓  合并标记的寡聚体

↓  完成测序反应

↓  从测序反应中分离不同长度的片段(例如通过HPLC或CE)

↓  用25%-100%TFA从接头上切下标记

X1……Xn-CONH-A-CONH

用质谱分析

方法2中各步骤的顺序如下:

OH-1MeO-CO2-All

↓    FMOC-NH-A-CO2H;偶联(例如,HBTU)

FMOC-NH-A-COO-1MeO-CO2-All

↓    钯(除去烯丙基)

FMOC-NH-A-COO-1MeO-CO2H

↓    OH-2MeO-CONH-R;偶联(例如,HBTU)

FMOC-NH-A-COO-1MeO-COO-2MeO-CONH-R

↓    哌啶(除去FMOC)

NH2-A-COO-1MeO-COO-2MeO-CONH-R

↓            分成n个等份

↓↓↓↓↓    偶联到n个不同的酸X1……Xn-CO2H上

X1……Xn-CONH-A-COO-1MeO-COO-2MeO-CONH-R

↓↓↓↓↓    用1%TFA从树脂上切掉标记的接头

X1……Xn-CONH-A-COO-1MeO-CO2H

↓ ↓ ↓↓↓偶联到n个寡聚体上(oligo1...oligo(n))(例如,通过Pfp酯)

X1……Xn-CONH-A-COO-1MeO-CONH-oligo1…olgo(n)

↓    合并标记的寡聚体

↓    完成测序反应

↓    从测序反应中分离不同长度的片段(例如通过HPLC或CE)

↓    用25-100%TFA从接头上切掉标记

 X1……Xn-CONH-A-CO2H

用质谱法分析

2.接头

本文中所说的“接头”成分(或L)是指用于通过共价化学键将“标记” (或T)接合到“感兴趣分子”(或MOI)上的直接共价键或有机化学基团。 此外,直接键本身或接头成分内的一个或多个键可在允许从T-L-X 化合物的其余部分(包括MOI成分)中释放出(或者说是裂解掉)T的条件 下裂解。存在于T内的标记可变部分应是对裂解条件稳定的。最好尽快 完成裂解,例如在几分钟内,特别是在15秒钟或更短时间内。

一般来说,使用接头使每一大组标记连接到一相似的大组MOI上。 典型的是将单个标记-接头组合连接到各个MOI上(得到各种各样的T -L-MOI),但在某些情况下,可在每个MOI上连接一个以上的标记 -接头组合(得到各种(T-L)n-MOI)。在本发明的另一个实施方案中, 通过接头上的多个独立的位点将两个或多个标记结合到单一接头上,然后 将此多标记-接头组合连接到单个MOI上(得到各种(T)n-L-MOI)。

在对这组标记的MOI进行了各种操作后,使用特异的化学和/或物理 条件裂解接头中的一个或多个共价键,结果从MOI上释出标记。该可裂 解的键可以是或不是某些当标记、接头和MOI连接在一起时所形成的同 样键。接头的设计将在很大程度上决定完成裂解所需的条件。因此,可根 据它们特别敏感的裂解条件来指称接头。当接头对光不稳定时(即倾向于 通过与光化照射接触而裂解),则接头可称为Lhv。同样,可用Lacid、Lbase、 L|O|、Lenz、Lelc、LΔ和Lss来命名分别对酸、碱、化学氧化、化学还原、 酶的催化活性(更简单地说是对“酶”)、电化学氧化或还原、升高的温度 (“热”)及硫醇交换特别敏感的接头。

某些类型的接头对每一类型的裂解条件不稳定,而其他一些接头则对 几种类型的裂解不稳定。此外,在能够结合多个标记的接头(得到(T)n-L -MOI型结构)中,各个标记结合位点可以是对不同的裂解条件不稳定 的。例如,在其上结合有两个标记的接头中,其中一个标记可以是只对碱 不稳定,另一个则只对光解作用不稳定。

可用于本发明的一种接头具有几个特征:

1)接头具有化学柄(Lh),通过该柄使接头连接到MOI上。

2)接头具有第二个分立的化学柄(Lh),通过该柄使标记连接到接头 上。如果多个标记连接到单一接头上((T)n-L-MOI型结构),则对每 个标记存在一个分立的柄。

3)除了允许裂解,以使含T的部分从包括MOI在内的化合物其余 部分上释放下来的条件外,接头对其所经受的所有操作都是稳定的。因 此,接头在标记连接到接头上、接头连接到MOI上,以及在对MOI进 行的使标记和接头(T-L)与之连接的任何操作期间都是稳定的。

4)接头在T-L连接到MOI上时并不明显地干扰对MOI进行的操 作。如果T-L连接到寡核苷酸上,T-L一定不能对寡核苷酸所参于 的任何杂交和酶促反进(如PCR)造成以确切干扰。同样,如果T-L连 接到抗体上,则其一定不能对该抗体的抗原识别有明显的干扰。

5)使用对标记的可检测性没有不利影响的物理或化学方法,以高度 控制的方法将标记从化合物上裂解下来。

对于任何给定的接头,最好是接头能够连接到宽范围的各种MOI 上,而且各种标记可以连接到接头上。这样的灵活性是有利的,因为这样 可使T-L连接物的文库一旦制备之后,即可与几种不同的MOI一起使 用。

如上文解释的,一种优选的接头具有下列通式:

     Lh-L1-L2-L3-Lh 其中每个Lh都是一个能用于将接头连接到标记反应物上和感兴趣的分子 反应物上的反应活性柄。L2是接头的基本部分,因为L2赋予接头以不稳 定性。L1和L3是可任意存在的基团,其可有效地用于使L2与柄Lh分离 开。

L1(按照定义,其比L3更接近于T)可用于使T与必要的不稳定部分 L2分离开。如果裂解反应产生可使含T部分的结构发生随机改变的特殊 反应性基团(如游离基)时,则这种分离可能是有用的。当裂解位点进一步 与含T部分分离开时,在此裂解位点形成的反应性基团就不太可能破坏 含T部分的结构。另外,因为L1中的原子一般存在与含T部分,这些 L1原子可赋予含T部分以有利的性质。例如,当含T部分是含Tms部分 时,希望作为含Tms部分之结构的一部分(例如作为MSSE)存在位阻胺, 该位阻胺可能存在于L1不稳定部分中。

在其他例子中,接头成分中可能只存在L1和/或L3,这是因为接头的 供应商选择出售具这种L1和/或L3基团形式的接头。在这些情况下,使 用具有L1和/或L3基团的接头,即使对掺入它们的化合物没有带来任何 特殊的性能优点,但也没有什么损害(只要这些基因并不抑制裂解反应即 可)。因此,本发明允许在接头成分中存在L1和/或L3基团。

L1和/或L3基团可以是直接键(在这种情况下,实际不存在该基团)、 亚烃基基团(例如亚烷基、亚芳基、亚环烷基等)、-O-亚烃基(例如 -O-CH2-、O-CH2CH(CH3)4-等)或亚烃基-(O-亚烃基)w-, 其中w是1到10的整数(例如-CH2-O-Ar-,-CH2-(O-CH2CH2)4-等)。

随着固相合成的出现,已发表了大量关于对特异性反应条件不稳定的 接头的文章。在典型的固相合成中,固相载体通过不稳定的接头结合反应 性位点,并且在反应性位点产生待合成的分子。当该分子被完全合成之 后,使固相载体-接头-分子构建体受从固相载体上放出所说的分子的裂 解条件。已发展的用于这一目的(或可能用于这一目的)的不稳定性接头也 可很容易于用作本发明的接头反应物。

Lloyd-Williams,P等人(“会聚性固相肽合成”),四面体报告 (Tetrahedron Report)No.347,49(48):11065-11133(1993))深入地 讨论了对光化性照射(即光解)、酸、碱及其他裂解条件不稳定的接头。有 关敏感性接头的其他信息来源是本领域已知。

如上文所讨论的,不同的接头设计将赋予在不同的特异性物理或化学 条件下的可裂解性。用于裂解各种不同设计的接头的条件包括酸、碱、氧 化、还原、氟化物、巯基交换、光解及酶促条件。

满足上文列出的接头一般标准的可裂解的接头是本领域技术人员已 知的,并包括Pierce(Rockford,IL)提供的目录中的那些。例子包括:

·  双(琥珀酰亚氨基琥珀酸)乙二醇酯(EGS),为可被羟胺裂解

    (1M,37℃,3-6小时)的胺反应性交联剂;

·  酒石酸二琥珀酰亚氨酯(DST)和磺基-DST,其为可被0.015M

    过碘酸钠裂解的胺反应性交联剂;

·  双[2-(琥珀酰亚氨氧基羰基氧基)乙基]砜(BSOCOES)和磺基

    -BSOCOES,其为可被碱(pH11.6)裂解的胺反应性交联剂;

·  1,4-二-[3′-(2′-吡啶二硫基(丙酰胺基)丁烷(DPDPB),

    可经硫羟交换或还原作用裂解的吡啶二硫醇交联剂;

·  N-[4-(对叠氮基水杨酰胺基)-丁基]-3′-(2′-吡啶

    二硫基)丙酰胺(APDP),为可经硫羟交换或还原裂解的吡啶

    二硫醇交联剂;

·  双-[β-4-(叠氮基水杨酰胺基)乙基]-二硫化物,为可

    经硫羟交换或还原作用裂解的光反应性交联剂;

·  N-琥珀酰亚氨基-(4-叠氮苯基)-1,3′-二硫基丙酸酯

    (SADP),可经硫羟交换或还原反应裂解的光反应性交联剂;

·  硫代琥珀酰亚氨基-2-(7-叠氮基-4-甲基香豆素-3

    乙酰胺)乙基-1,3′-二硫丙酸酯(SAED),可经硫羟交换或

    还原反应裂解的光反应性交联剂;

·  磺基琥珀酰亚氨基-2-(间叠氮基-邻硝基苯甲酰氨基)-

    乙基-1,3′-二硫丙酸酯(SAND),可经硫羟交换或还原反应

    裂解的光反应性交联剂。

可裂解接头的其他例子和可用于释放标记的裂解条件如下所述。可被 氟化物或在酸性条件下裂解的甲烷基连接基团。可被光源裂解(光解) 的3-,4-,5-,或6-取代的-2-硝基苄氧基或2-,3-,5-,或6- 取代的-4-硝基苄氧基连接基团。可被Ce(NH4)2(NO3)6裂解(氧化)的3 -,4-,5-或6-取代的-2-烷氧基苯氧基或2-,3-,5-,或6- 取代的-4-烷氧基苯氧基连接基团。可被氢氧化物(碱)、酸或LiAlH4(还 原)裂解的NCO2(尿烷)接头。可被O3、OsO4/IO4-或KMnO4(氧化)裂解 的3-戊烯基、2-丁烯基或1-丁烯基连接基团。可被O2、Br2、 MeOH或酸裂解的2-[3-,4-,或5-取代的-呋喃基]氧基连接基团。

裂解其他不稳定连接基团的条件包括:可用酸裂解叔烷氧基连接基 团;可用H3O+裂解的甲基(二烷基)甲氧基或4-取代的-2-烷基-1,3 -二氧戊环-2-基连接基团;可用氟化物或酸裂解的2-甲硅烷基乙 氧基连接基团;可在碱性条件下裂解的2-(X)-乙氧基(其中X=酮、酯、 酰胺、氰基、NO2、硫醚、亚砜、砜)连接基团;可用酸或在还原条件下 裂解的2-,3-,4-,5-,或6-取代的苄氧基连接基团;可用 (Ph3P)3RhCl(H)裂解的2-丁烯氧基连接基团;可用Li、Mg或BuLi裂解的3-,4-,5-或6-取代的-2-溴苯氧基连接基团;可用Hg2+裂解的甲基硫代甲氧基连接基团;可用Zn或Mg裂解的2-(X)-乙氧 基(其中X=卤素)连接基团;可经氧化(例如用Pb(OAc)4)裂解的2-羟基 乙氧基连接基团。

优选的接头是被酸或光解作用裂解的接头。在已为固相肽合成而发展 的酸敏感性接头中,有几种可用于将标记连接到MOI上。在Lloyd- Williams等人的综述(四面体49:11065-11133,1993)描述了其中的某些 接头。一类有用的接头是基于对烷氧基苄基醇,其中两种接头:4-羟 基甲基苯氧基乙酸和4-(4-羟甲基-3-甲氧基苯氧基)丁酸可购自 Advanced ChemTech(Louisville,KY)。这两个接头可通过连接到苄醇上的 酯键连接到标记上,并且通过连到羧酸上的酰胺键连接到含胺MOI上。 用不同浓度的三氟乙酸从MOI裂解掉由这些分子连接的标记。裂解这些 接头导致标记上的羧酸的释放。酸裂解通过相关接头如2,4-二甲氧基- 4′-(羧甲氧基)-二苯甲基胺(可以FMOC保护的形式购自Advanced Chem Tech公司)连接的标记,导致被释出的标记上的羧酰胺的释放。

已为固相肽合成而发展的大部分光敏感性接头也可用于本申请(参见 Lloyd-Williams的综述)。这些接头通常是基于2-硝基苄酯或2-硝基 苄酰胺。最近文献中报导过的光敏感接头的两个例子是4-(4-(1- Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基)丁酸(Holmes和 Jones,J.Org.Chem.60:2318-2319,1995)和3-(Fmoc-氨基)-3- (2-硝基苯基)丙酸(Brown等,Molecular Diversity 1:4-12,1995)。两 接头均可通过羧酸连接到MOI的胺上。通过在标记上的羧酸和接头上的 胺之间形成酰胺而使标记接到接头上。通常用350nm波长的紫外光以本 领域已知的强度和时间完成对光敏感接头的裂解。裂解接头导致标记上伯 酰胺的释放。光可裂解的接头的例子包括硝基苯基甘氨酸酯,内-和外-2 -苯并降片烷基氯和甲磺酸,以及3-氨基-3(2-硝基苯基)丙酸。 酶促裂解的例子包括可裂解酯键的酯酶、裂解磷酸二酯键的核酸酶、裂解 肽键的蛋白酶等。

优选的接头成分具有如下所示的邻硝基苄基结构: 其中位置a、b、c、d或e上的一个碳原子被-L3-X取代,L1(其较 好是直接键)在上述结构中存在于

N(R1)的左边。这样的接头成分对选择 性光诱导的对标有“a的碳和N(R1)之间的键裂解是敏感的。R1对裂解 反应并不重要,但最好选自氢和烃基。本发明指出上述结构中-N(R1)-可被-O-替换。另外,在上示结构中,位置b、c、d或e中的一 个或多个位置可被烷基、烷氧基、氟、氯、羟基、羟酸酯或酰胺取代,其 中这些取代基在各种情形中被独立地选择。

另一个带有化学柄Lh的优选接头成分具有下示结构:

其中位置b、c、d或e中的一个或多个位置由氢、烷基、烷氧基、氟、 氯、羟基羧酸酯或酰胺取代,R1是氢或烃基,且R2是

-OH或保护或活 化羧酸以利于与另一个部分偶联的基团。氟碳和氢氟碳基团是活化羧酸以 利与另一个部分偶联的优选基团。

3.感兴趣的分子(MOI)

MOI的例子包括核酸或核酸类似物(如PNA)、核酸的片段(即核酸片 段)、合成的核酸或片段、寡核苷酸(如DNA或RNA)、蛋白质、肽、抗 体或抗体片段、受体、受体配基、配体对的成员、细胞因子、激素、寡糖、 合成的有机分子、药物及其组合。

优选的MOI包括核酸片段。优选的核酸片段是与存在于用来碱基测 序的载体中的序列互补的引物序列。核酸片段较好是在片段的3′末端以 外,并且最好是在片段的5′末端直接或间接连接到标记上。可以从商业 来源(例如Promega,Madison,WI)买到或基于基因数据库(例如Dib等, 自然380:152-154,1996和GEPH Genotype Database,http://www, cephb.fr)制得。

本文使用的术语MOI包括MOI的衍生物,其含有使MOI连接到T -L-Lh上的功能团。例如,在5′末端有磷酸二酯并且该磷酸二酯也结 合到亚烷基胺上的核酸片段即是MOI。美国专利4,762,779中描述了这 样一种MOI。作了内部修饰的核酸片段也是MOI。对核酸片段的内部 修饰的一个例子是将已经过修饰的碱基(例如A、G、C、T、U) 加到反应性功能基团上。可从例如Glen Research,Herndon,VA购得这 种经过内部修饰的核酸片段。对核酸片段进行内部修饰的另一个例子是使 用无碱基亚磷酸酰胺合成修饰的磷酸二酯,将后者放在核酸片段的糖和磷 酸基团之间。该无碱基亚磷酸酰胺含有一反应性基团,所说的基团允许含 有该亚磷酸酰胺衍生部分的核酸片段连接到另一个部分如T-L-Lh 化合物上。例如可从Clonetech Laboratories,Inc.,Palo Alto,CA购得这 样的无碱基亚磷酸酰胺。

4.化学柄(Lh)

化学柄是作为第一分子的一部分存在的同稳定而具反应性的原子排 布,该柄可进行与作为第二分子的一部分存在的互补化学柄的化学反应, 从而形成两分子间的共价结合。例如,化学柄可以是羟基基团,而互补化 学柄则可以是羧酸基团(或其活化的衍生物,例如氢氟芳基酯),经反应后 这两个柄之间形成将两分子连接在一起的共价键(特别是酯基团)。

化学柄可用于许许多多共价键形成反应中,通过这些反应使标记连接 到接头上,并使接头连接到MOI上。这样的反应包括烷基化(例如形成 醚,硫醚)、酰化(如形成酯、酰胺、氨基甲酸酯、脲、硫脲)、磷酸化(如 形成磷酸酯、膦酸酯、磷酰胺、膦酰胺)、磺酰化(如形成磺酸酯、氨磺酰)、 缩合(如形成亚胺、肟、腙)、甲硅烷基化、二硫化物形成,以及经光解作 用生成反应性中间体(如氮烯或碳烯)。一般说来,适于将标记连接到接头 上的柄和键形成反应也适于使接头接到MOI上,反之亦然。在某些情况 下,MOI可能预先进行修饰的衍生作用,以提供连接接头所需的柄。

一种类型的特别适用于将接头连接到MOI上的键是二硫键。其形成 需要在接头上存在巯基基团(“柄”),并且在MOI上存在另一个巯基基 团。然后中度氧化条件即足以使两个巯基结合成二硫化物。也可使用过量 的适当二硫化物交换试剂例如二硫化吡啶来诱导二硫键形式。因为二硫化 物的形成是很容易逆转的,所以必要时可使用二硫键作为释放标记的可 裂解键。一般可在相似的温和条件下,使用过量的适当巯基交换剂如二硫 苏糖醇来完成反应。

为使标记(或连有接头的标记)连接到寡核苷酸上,特别有利的是形成 酰胺键。可用亚磷酰胺酯例如6-单甲氧基三苯甲基己基氰乙基-N,N -二异丙基亚磷酰胺酯(可购于Glenn Research,Sterling,VA)很容易的 将伯脂族胺柄导入到合成的寡核苷酸上。与被导入的伯胺相比,见于天然 核苷酸中的胺例如腺苷和鸟苷实际上是无反应性的。反应性的这种差异构 成与被导入的伯胺而不是核苷胺选择性地形成酰胺及相关结合基团(如 脲、硫脲、氨磺酰)之能力的基础

如在分子探针供货目录(Molecular Probes catalog)(Eugene,OR) 中所列出的,胺反应性功能基团的部分细目包括活化的羧酸酯、异氰酸 酯、异硫氰酸酯、磺酰卤和二氯三氮烯。活性酯是对胺修饰的极好试剂,因 为所形成的酰胺产物是很稳定的。另外,这些试剂与脂族胺有很好的反应 性,而与寡核苷酸的核苷酸胺则是低反应性的。活性酯的例子包括N- 羟基琥珀酰亚胺酯、五氟苯基酯、四氟苯基酯及对硝基苯基酯。因为活性 酯可由实际上任何含有羧酸的分子制得,所以它们是很有用的。 Bodansky(肽化学的原理(第二版),Springer Verlag,London,1993)列出 了制造活性酯的方法。

5.接头连接

一般使用单一类型的接头将特定组或家族的标记连接到特定组或家 族的MOI上。在本发明的优选实施方案中,可按一种统一的方法创造所 有的各种T-L-MOI结构。如果一组T-L-MOI结构的数目多, 这样做是特别有利的,因为它得以使用组合化学或其他平行的加工技术制 备这一组结构。以相似的方式,使用单一类型的接头可以利用某种统一的 方法裂解所有的各种T-L-MOI结构。另外,这对于一大组T-L -MOI结构是有利的,因为这样可以按平行的重复的和/或自动化的方式 处理该组结构。

但也有本发明的其他实施方案,其中使用两种或多种类型的接头将不 同亚组的标记连接到相应亚组的MOI上。在这种情况下,可使用选择性 裂解条件独立地裂解各个接头,而不裂解存在于其他亚组MOI上的接 头。

有许多共价键形成反应适于将标记连接到接头上,并将接头连接到 MOI上。这样的反应包括烷基化(例如形成醚,硫醚)、酰化(如形成酯、 酰胺、氨基甲酸酯、脲、硫脲)、磷酸化(如形成磷酸酯、膦酸酯、磷酰胺、 膦酰胺)、磺酰化(如形成磺酸酯、氨磺酰)、缩合(如形成亚胺、肟、腙)、 甲硅烷基化、二硫化物形成,以及经光解作用生成反应性中间体(如氮烯 或碳烯)。一般说来,适于将标记连接到接头上的柄和键形成反应也适于 使接头接到MOI上,反之亦然。在某些情况下,MOI可能预先进行修 饰或衍生作用,以提供连接接头所需的柄。

一种类型的特别适用于将接头连接到MOI上的键是二硫键。其形成 需要在接头上存在巯基基团(“柄”),并且在MOI上存在另一个巯基基 团。然后中度氧化条件即足以使两个巯基结合成二硫化物。也可使用过量 的适当二硫化物交换试剂例如二硫化吡啶来诱导二硫键形式。因为二硫化 物形成是很容易逆转的,所以必要时可使用二硫键作为释放标记的可裂 解键。一般可在相似的温和条件下,使用过量的适当巯基交换剂如二硫苏 糖醇来完成反应。

为使标记连接到寡核苷酸上,特别有利的是形成酰胺键。可用亚磷酰 胺酯例如6-单甲氧基三苯甲基己基氰乙基-N,N-二异丙基亚磷酰胺 酯(可购于Glenn Research,Sterling,VA)很容易的将伯脂族胺柄导入到 合成的寡核苷酸上。与被导入的伯胺相比,见于天然核苷酸中的胺例如腺 苷和鸟苷实际上是无反应性的。反应性的这种差异构成与被导入的伯胺而 不是核苷胺选择性地形成酰胺及相关结合基团(如脲、硫脲、氨磺酰)之能 力的基础。

如在分子探针供货目录(Molecular Probes catalog)(Eugene,OR) 中所列出的,胺反应性功能基团的部分细目包括活化的羧酸酯、异氰酸 酯、异硫氰酸酯、磺酰卤和二氯三氮烯。活性酯是对胺修饰的极好试剂,因 为所形成的酰胺产物是很稳定的。另外,这些试剂与脂族胺有很好的反应 性,而与寡核苷酸的核苷酸胺则是低反应性的。活性酯的例子包括N- 羟基琥珀酰亚胺酯、五氟苯基酯、四氟苯基酯及对硝基苯基酯。因为活性 酯可由实际上任何含有羧酸的分子制得,所以它们是很有用的。 Bodansky(肽化学的原理(第二版),Springer Verlag,London,1993)列出 了制造活性酯的方法。

有许多可作为接头的商品交联剂(如参见Pierce Cross-linkers, Pierce Chemical Co.,Rockford,IL)。其中同双官能胺反应性交联剂的例 子是同双官能亚氨酸酯和N-羟基琥珀酰亚氨(NHS)酯。还存在具有两个 或多个不同反应性基团的异双官能交联剂,其允许进行系列反应。亚氨酸 酯在碱性pH条件下与胺迅速反应。当NHS酯与伯或仲胺反应时产生稳 定的产物。来酰亚胺、烷基卤和芳基卤、α-卤酰基和吡啶二硫化物是 巯基反应性的。在pH6.5-7.5范围内马来酰亚胺是对巯基(硫氢基)基团 特异的,并在碱性pH可变成胺反应性的。在生理条件下硫醚键是稳定 的。α-卤乙酰基交联剂含有碘乙酰基团并且是对巯基有反应性的。咪唑 可与碘乙酰基团反应,但反应非常缓慢。吡啶二硫化物与巯基基团反应形 成二硫键。碳二亚胺将羧基化合物偶联到酰肼的伯胺上以形成酰基-肼 键。芳基叠氮化物是在接触紫外或可见光之前呈化学惰性的光亲和试剂。 当这样的化合物在250-460nm光解时,形成反应性芳基氮烯。反应性 芳基氮是烯相对非特异的。乙二醛对精氨酸的胍基部分有反应性。

在本发明的一个典型实施方案中,首先使标记结合到接头上,然后再 使标记和接头的组合体结合到MOI上,以产生结构T-L-MOI。或 者,可首先使接头结合到MOI,然后再使接头和MOI的组合体结合到 标记上。一个例子是其中MOI为DNA引物或寡核苷酸。在这种情况下, 典型的是首先使标记与接头结合,然后再使T-L结合到DNA引物或 寡核苷酸上,所得组合体即可用于测序反应。

一种有用的形式是其中使标记通过化学敏感性接头可逆性地连接到 MOI(如寡核苷酸或DNA测序引物)上。接头的一种优选设计使接头接触 到挥发性有机酸例如三氟乙酸(TFA)时被裂解。特别是TFA适于与包括 电喷射法在内的大多数MS离子化方法配合使用。

如下文详细讨论的,本发明提供一种测定核酸分子的序列的方法。可 按本发明的方法形成的组合物包括下列通式的多种化合物:

            Tms-L-MOI

其中Tms是可用质谱法检测的有机基团。Tms含有碳,氢和氟中至少 一种,并可任意地含有选自氧、氮、硫、磷和碘的原子。在通式中,L 是在化合物暴露于裂解条件之后允许含Tms部分与化合物的其余部分裂 解开的有机基团。被裂解的含Tms部分包括当多种化合物中的每一种经受 质谱检测时支持单一离子化带电状态的功能团。功能团可以是叔胺、季胺 或有机酸。在该式中,MOI是通过MOI的5′末端与L偶联的核酸片段。 术语“偶联的的”是指L和MOI中间可能有化学基团,例如磷酸二酯基 团和/或亚烷基基团。核酸片段可能有互补于载体的一部分的序列,其中 该片段能够引发核苷酸合成。

在组合物中,没有两种化合物有同样的Tms或相同的MOI。换句话 说,该组合物包括多种化合物。其中每种化合物都有独特的Tms和独特的 核酸片段(即其具有独特的碱基序列)。此外,组合物可描述为有多种化合 物,其中每种化合物都限定为具有独特的Tms,其中Tms是独特的,即在 其他化合物中没有提供由质谱测得的同样信号的Tms。因此组合物含有多 种化合物,每种化合物都有独特分子量的Tms。组合物也可以描述为具有 多种化合物,其每种化合物都限定为具有独特的核苷酸序列。这些核酸序 列都是独特的,这样当组合物与载体合并用于核酸测序时,每种化合物都 将起到只适于一种载体的引物的作用。具有独特Tms基团的一组化合物是 具有独特核酸序列的同组化合物。

优选地,Tms基团是独特,即在任何两种不同化合物之间至少有 2amu,更好至少有3amu,最好至少有4amu的质量差。在组合物中, 至少有两种不同的化合物,较好是有两种以上不同的化合物,且最好有4 种以上不同的化合物。组合物可包含100种或更多种不同的化合物,每 种化合物都有独特的Tms和特有的核酸序列。

另一种在例如测定核酸分子的序列中有用的组合物包括水和式Tms -L-MOI的化合物,其Tms是可用质谱法检测的有机基团。Tms含有 碳,氢和氟中的至少一种,并可含有包括氧、氮、硫、磷和碘的任选原子。 该式中,L是在化合物接触到裂解条件之后可使含Tms部分与化合物的 其余部分分割开的有机基团。被裂解的含Tms部分包括当多种化合物中的 每一种经受质谱检测时支持单一离子化带电状态的功能团。该功能团可以 是叔胺、季胺或有机酸。在该式中,MOI是以其5′末端连接的核酸片段。

除了水外,该组合物可含有缓冲液,以维持含水组合物的pH,其中 pH范围大约为5至9。再者,组合物可含有酶、盐(如MgCl2和NaCl) 及dATP、dGTP、dCTP和dTTP中的一种。优选的组合物含有水、 Tms-L-MOI和ddATP、ddGTP、ccCTP和ddTTP中的一种(并且 只是一种)。这样的组合物适用于二脱氧测序方法。

本发明还提供含有多组化合物的组合物,其中各组化合物都有通式:

                  Tms-L-MOI

其中Tms是可用质谱法检测的有机基团,含有碳,氢和氟中的至少一种, 以及选自氧、氮、硫、磷和碘的任选原子。L是允许含Tms部分与化合物 的其余部分分割开的有机基团,其中含Tms部分包括当化合物经受质谱分 析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸。 MOI是其中L在MOI的5′末端与MOI接合的核酸片段。

在一组内,所有成员都有同样的Tms基团,并且MOI片段具有以选 自ddAMP、ddGMP、ddCMP和ddTMP的同样二脱氧核苷酸终止的 不同长度;并且在各组之间,Tms基团相差至少2amu,较好差至少 3amu。组的数目至少为5并可为100或更多。

在一包括如上所述的第一复数组的优选组合物中,另外还存在第二复 数组的具有下列通式的化合物:

              Tms-L-MOI

其中Tms是可用质谱法检测的有机基团,含有碳,氢和氟化物中的至少一 种,以及选自氧、氮、硫、磷和碘的任意原子。L是允许含Tms部分与化 合物的其余部分分割开的有机基团,其中含Tms部分包括当化合物经受质 谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机 酸。MOI是其中L在MOI的5′末端与MOI接合的核酸片段。第二复 数组内的所有成员都有以选自ddAMP、ddGMP、ddCMP和ddTMP 的同样二脱氧核苷酸终止的MOI序列;条件是存在于第一复数组化合物 中的二脱氧核苷酸不是存在于第二复数组化合物中的同样二脱氧核苷 酸。

本发明还提供用于DNA测序分析的试剂盒。该试剂盒包括多个容器 组,每个容器组包括至少5个容器。第一个容器含有载体。第二、第三、 第四和第五个容器含有下列通式的化合物:

              Tms-L-MOI

其中Tms是可用质谱法检测的有机基团,含有碳,氢和氟化物中的至少一 种,以及选自氧、氮、硫、磷和碘的任选原子。L是允许含Tms部分与化 合物的其余部分分割开的有机基团,其中含Tms部分包括当化合物经受质 谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机 酸。MOI是其中L在MOI的5′末端与MOI接合的核酸片段。第二、 第三、第四和第五个容器的MOI是相同的并且互补于该组容器内载体的 一部分,每个容器内Tms基团则不同于试剂盒中的其他Tms基团。

在试剂盒内,组的数目较好是至少3,即至少有3组容器,最好至 少有5组容器。

如上文指出的,本发明提供用于测定核酸分子的序列的组合物和方 法。简单地说,这样的方法一般包括以下步骤:(a)产生互补于选择的 核酸分子的标记核酸片段(例如标记片段从核酸分子的第一末端到第二末 端),其中标记是与特定的或选择的核苷酸相互关联的,并且可用各种方 法中的任何一种方法检测,(b)根据序列长度分离标记的片段,(c)从标 记的片段上切割标记,(d)检测该标记,并因而确定核酸分子的序列。下 文将更详细地讨论每个方面。

B.测序方法和策略

如上文所指出的,本发明提供测定核酸分子序列的方法。简单地说, 首先制备标记的核酸片段。该核酸片段互补于选择的靶核酸分子。在一优 选实施方案中,从核酸分子的第一末端到第二末端,并最好是从5′末端 到3′末端产生核酸片段。在其他优选实施方案中,从5′标记的寡核苷酸 引物或标记的双脱氧核苷酸终止子产生标记的片段。标记的核酸片段的标 记是与特定的核苷酸相互关联的并且是可用光谱法(包括荧光,但最好是 除荧光光谱以外的光谱法)或电位测定法检测的。在一优选实施方案中, 至少产生5个标记的核酸片段,并且每个标记对于核酸片段都是特有的。 更具体地说,标记的片段的数目一般约为5至2000个。可从包括上文列 出的化合物在内的各种化合物产生标记的核酸片段。本领域技术人员将很 清楚,本发明的方法不只限于使用本文讨论的有代表性的化合物和组合 物。

在产生标记的核酸片段之后,根据序列长度分离标记的片段。可使用 多种技术完成这种分离。在一优选实施方案中,用液相层析法(LC),特 别是HPLC法进行分离。然后从标记的片段上切掉标记。裂解结合键以 释出标记的特定方法是基于键对裂解的特异类型的敏感性而选择的。例 如,可暴露于光来裂解光敏感性键。以光谱检测法或电位测定法检测所释 出的标记。优选的检测手段是质谱法、红外光谱法、紫外光谱法和恒势电 流测定法(例如用电流检测器或库仑检测器)。

本领域技术人员会理解到,例如可使用某种仪器实现一个或多个步骤 的自动化。另外,分离、裂解和检测步骤可以以连续方式完成(例如标记 的片段通过分离到裂解到标记检测的连续流动/连续液体通路)。例如,可 将各种不同的步骤并入一个系统中,从而以连续方式完成这些步骤。这样 的系统通常在一种仪器或组合的仪器中。例如可使被分离(例如经HPLC) 的标记的核酸流入裂解装置(如光反应器)中,然后流入标记检测器(例如 质谱仪或库仑或电流检测器)中。优选裂解装置是可调的,从而可选择裂 解反应的最佳波长。

本领域技术人员可以看出,可为各种目的完成本发明的核酸测序方 法。例如,本发明方法的应用包括病毒、细菌、原核和真核(如哺乳动物) 核酸分子的一级序列确定、突变测定、诊断、法医学、身份鉴定以及多态 性检测。

1.测序方法

如上文指出的,可将包括本发明化合物的各种化合物用于各种测序方 法,包括酶促和化学降解方法。简单地说,由Sanger(Proc.Natl.Acad.Sci. (USA)74:5463,1977)所描述的利用双脱氧终止子的酶促方法包括用 DNA聚合酶从单链模板合成DNA链。Sanger测序方法是依据这样的事 实,即所说的双脱氧核苷酸(ddNTP)以与正常脱氧核苷酸同样的方式掺入 到生长链中(尽管以低效率)。然而,ddNTP不同于正常脱氧核苷酸(dNTP) 在于,它们缺少链延长所需的3′-OH基团。当ddNTP掺入到DNA链 中时,没有3′-羟基基团就阻止了新的磷酸二酯键的形成,并且DNA片 段以互补于模板DNA中碱基的ddNTP终止。Maxam和Gilbert方法 (Maxam和Gilbert,Proc.Natl.Acad.Sci.(USA)74:560,1977)利用原始 DNA化学降解方法(在这两种情况下,DNA都必须是克隆的)。两种方法 产生从待测序DNA片段中的特定点开始,并终止于每个碱基的片段群 体。每个片段的终止取决于原DNA片段内特定碱基的定位。以聚丙烯酰 胺凝胶电泳法分离DNA片段并从凝胶的放射自显影图上读出DNA碱基 (A、C、T、G)的次序。

2.核酸外切酶DNA测序

Labeit等人(S.Labeit,H.Lehrach & R.S.Goody,DNA 5:173-7, 1986)报导了使用脱氧核苷酸α-硫代三磷酸测定DNA核苷酸序列的新 方法。在该方法的第一个步骤中,使用DNA聚合酶催化的模板定向聚合 法制备4条DNA,每条各自用不同的硫代磷酸脱氧核苷取代,以替换相 应的单磷酸。在第二个步骤中,对这些DNA进行严格核酸外切酶III处 理,从而只产生以硫代磷酸核苷酸键合而终止的片段。然后可用标准的凝 胶电泳技术分离这些片段,并可按目前使用的测序方法直接读出序列。 Porter等人(K.W.Porter,J.Tomasz,F.Huang,A.Sood & B.R.Shaw,生 物化学34:11963-11969,1995;N7-氰基甲烷-2′-脱氧鸟苷5′ -三磷酸是DNA聚合酶的良好底物)描述了一组新的硼取代的核苷酸类 似物,其也是核酸外切酶抗性的,并且是许多聚合酶的良好底物:这些碱 基也适合于核酸外切酶DNA测序。

3. 测定大数目全长度cDNA序列的简化策略

有人提议以cDNA测序作为得出完整的人基因组序列的替代方法, 已尝试了两种方法。第一种涉及通过在各cDNA克隆一个末端的单一 DNA序列测定产生表达的序列标记(EST)。该方法已对被表达序列的类 型分布作了深入了解并已揭示了偶尔有用的与基因组片段的同源性,但由 于得自各个克隆的数据不是,所以总体上对我们已有知识没有多少增加。 第二种方法是产生可表明cDNA之可能功能的完整cDNA序列。不幸的 是大多数cDNA的大小范围为1-4千碱基,其防碍了全长度序列测定 的自动化。目前用于大规模、高通过量序列生产的最有效方法是来自对载 体/引物位点的序列测定,其一般从每个侧翼得到少于500个碱基的序 列。合成长度15-18碱基的新的寡核苷酸引物用以“引物步移”可得 以揭示每个序列。全长度DNA测序的另一个可代用策略是产生适于用通 用引物测序的经修饰的模板,但提供分子的交叠覆盖

可从每个cDNA克隆制备分立的文库,应用鸟枪测序法进行cDNA 测序研究。这些方法并没有被广泛地用于分析1.5-4.0千碱基片段,因 为在最初克隆阶段工作量很大。代之以普遍将这些方法用于分析例如在λ 或粘粒插入段中的15-40千碱基的靶序列。

4. cDNA与基因组测序的相似性

虽然cDNA测序中待分析的个个克隆常有不同大小,但与大批量基 因组DNA测序的要求是有相似性的。除每个碱基的成本低和高通过量 外,全长度cDNA测序的理想策略还应具有高的准确度。目前受欢迎的 基因组DNA测序方法学包括从粘粒制备鸟枪测序文库,然后使用ABI 荧光DNA测序装置随机测序,并通过定向尝试终结(完成)。大体上同意, 就效率和准确性来说,荧光鸟枪法优于目前的其他可用方法。最初的鸟枪 文库质量是序列组合的难易程度与质量的关键性决定因素。高质量的鸟枪 文库方法的出现促成了生产含较小cDNA克隆之混合物的复合鸟枪文 库。这里待测序的个个克隆在文库构成前混合,然后在计算机分析阶段按 随机测序法进行鉴定。在用PCR或通过鉴定载体臂序列在生产文库期间 标记个个克隆间的接点。

可用微生物方法或PCR方法制备克隆。当使用PCR时,每个克隆 使用3个反应以尽可能地减少错误。

一过性测序(one pass sequencing)是一种为加速鉴定基因组DNA 新区域内的重要序列而设计的新技术。简单地说,制备高质量鸟枪文库, 然后进行序列采样以得到80-95%覆盖度。对于粘粒一般为200份样 品。使用序列相似性(BLAST)或外显子结构(GRAIL2)筛选,该样品中基 本上所有基因都可能至少有一个被检测的外显子。

已将“撇取”(“skimming”)成功地应用于粘粒和P1。一过性测 序可能是定位克隆项目中发现基因的最快和花费最少的方法。结果实际上 是确实的。大多数研究人员目前都在发展用于外显子捕获及相关技术的粘 粒重叠群。粘粒完全适于序列“撇取”。P1和其他BAC可能是相当便 宜的,因为省去了鸟枪文库构建和使重叠区达到最小。

5. 鸟枪测序

鸟枪DNA测序以靶DNA的随机片段化开始。然后使用随机测序法 产生大部分数据。然后在定向期填满缺口、确保各条链在两个方向上的覆 盖率。鸟枪测序提供以相对低成本达到高准确率的优点。该方法最适于分 析相对大的片段,并且是大规模基因组DNA测序可选用的方法。

为使鸟枪测序准确且经济有效,有几个因素是很重要的。主要的考虑 是所产生的鸟枪文库的质量,因为任何没有插入片段或有嵌合插入片段的 克隆都将导致继后的测序低效。另一个考虑是小心平衡随机和定向测序阶 段,从而获得高准确度,并使因不必要测序造成的效率损失减至最小。

6. 测序化学:标记的终止子化学

目前可利用的有两种类型的荧光测序化学:染料引物(其中引物是荧 光标记的)和染料终止子(其中二脱氧终止子是标记的)。其中每种化学 方法均可与Taq DNA聚合酶或测序酶一起使用。测序酶似乎易于读出富 G-C区域、回文序列、简单重复区及其他难读序列。测序酶对于测定 混合群体的序列也很适宜。测序酶测序需要5μg模板、一次延伸和多步 骤纯化(cleanup)过程。标记引物测序需要经4次分立的反应,A、C、 G和T各1次,然后是费力的纯化过程。Taq终止子循环测序化学是最 坚实的测序方法。这种方法可使用任何测序引物。所需要的模板量相对较 小,并且从组装到纯化的整个反应过程都比测序酶和染料引物化学更容 易。只需要1.5μg DNA模板和4pm引物。向其中加入准备好的反应混合 物。该混合物由缓冲液、酶、dNTP和标记的双脱氧核苷酸组成。该反 应可在一个试管中进行,因为4种双脱氧核苷酸中的每一种都是用不同 的荧光颜料标记的。这些标记的终止子过量存在于该混合物中,因为它们 在延伸期间难以掺入。用不洁的DNA可抑制这些高分子量二脱氧核苷酸 的掺入。预混合物包括减小带压缩的dITP。使用Taq作为DNA聚合酶 可使反应在高温度下进行,从而减少二级结构问题及非特异性引物结合。 整个混合物在热循环仪进行25次变性、退火和延伸循环,反应混合物旋 转通过Sephadex G50(Pharmacia,Piscataway,NJ)柱并在真空水提取器 中处理5分钟后上凝胶。

7. 设计引物

当设计引物时,应使用设计PCR引物的同样标准.具体地说,引物 最好是18-20核苷酸长,并且3′末端碱基应是G或C。引物还应具有 大于50℃的Tm。虽然短于18核苷酸的引物也可使用,但不推荐使用。 引物越短,其在一个以上位点与模板DNA结合的可能性越大,而且其 Tm较低。序列应与模板100%匹配。任何错配,特别是3′末端的错配将 大大降低测序能力。但只要在结合的3′末端有18碱基长,也可使用带5′ 尾部的引物。如果根据序列层析谱设计引物,则必须使用有高置信度的区 域。当一个序列在标准层析谱上向外移出超过350-400碱基时,峰加 宽并且碱基信号不那么准确。如本文所讨论的,引物可具有一个5′柄, 通过该柄可连接上接头或接头标记。

8. 核酸模板制备

标记引物的DNA测序中最重要的因素是模板的质量。简单地说,一 个常见的错误认识是,如果模板在手工测序中适用,它也应在自动测序中 适用。事实上,如果反应在手工测序中可行,它可能也在自动测序中可行, 但自动测序要敏感得多,当利用荧光测序方法时质量差的模板可能很少或 不产生数据。在包括RNA在内的模板制备期间所不适当提取的高盐浓度 及其他细胞材料可能同样阻碍获得准确序列信息的能力。许多小量和大量 制备方法产生足以进行手工测序或PCR,但不适于自动(标记引物)测序 的DNA。另外不推荐使用苯酚,因为苯酚能混入螺旋结构中。使用100% 氯仿是足够的。有许多DNA制备方法是用于本文提供的标记引物测序方 法所特别优选的。具体地说,可优选其中利用氯化铯制剂的大制备柱或 Qiagen(Chatsworth,CA)大制备柱(小心不要过载)。就小量制备来说,可 利用Promega公司的Magic Mini制备柱(Madison,WI)。当测定DNA片 段如PCR片段或限制性酶切片段时,一般最好是从低熔点琼脂糖凝胶上 切下所需的片段,然后用例如GeneClean(La Jolla,CA)产品进行纯化。 很重要的是要确保只从凝胶上切下一个带。对于PCR片段,可使用PCR 引物或内部引物,以确保测定适当片段的序列。为从序列分析软件得到最 佳性能,片段应大于200碱基。可用该方法测定双链或单链DNA的序列。

当制备测序的DNA时,一般要考虑的另一个因素是宿主菌株的选 择。出售测序装置和试剂的公司,例如ABI(Foster City,CA)和 Qiagen(Chatsworth,CA)都推荐了优选的宿主菌株。还有以前已推荐的菌 株例如DH5 α、HB101、XL-1 Blue、JM109、MV1190。既使 DNA制剂很干净时,还会有一些可能使之难以测得序列的其他固有因 素。富含G-C的模板总是难以使序列通过,并且还可能引起二级结构 问题。过长重复序列的测序常常证明难以进行。例如当Taq沿poly T段 移动时,该酶常常脱离模板并跳过一个T,回过来重新进行。这样就使 延伸引物的poly T段中有X个T,并且产生在polyT段中有X-1、X -2等个T的片段。如此净效果是在每个位置中出现一个以上碱基,而 不可能读出序列。

9. 分子水平上不同的克隆载体的使用

也可利用通用克隆载体(M13)和互补测序引物完成序列测定。简单地 说,就目前的克隆载体可使用同样的引物序列并只利用4个标记(每个标 记都是一个代表不同的终止子(ddNTP)的不同的荧光团,每个扩增过程都 必须发生在不同的容器中(每个容器内一种DNA样品))。这就是说不可能 在同一扩增过程中混合两种或不同的DNA样品。只有4个标记,每个凝 胶泳道只可加一种DNA样品。没有方便的方法使只用4个标记的一种以 上DNA样品的序列去旋绕(就这一点来说,本领域技术人员在使用目前 的技术时要特别小心混合或污染不同的DNA样品)。

当每个凝胶泳道或各分离过程可运行多组4个标记时可得到实质性 优点。具体地说,利用本发明的标记,可在单一扩增反应或容器中处理一 个以上的DNA样品。当有多组4个标记可供使用时,每组标记可被指定 于待扩增的特定DNA样品。一个标记组由一系列4种不同的标记组成, 每种都具有独特的性质。指定每个标记代表不同的双脱氧终止子,即 ddATP、ddGTP、ddCTP或ddTTP。为了利用这一优点,必须产生 一系列其中插入了独特引导位点的载体。独特引导位点是在因载体不同的 一段简单的18核苷酸序列。其余核苷酸序列在载体与载体之间是保守 的。制备(合成)相应于每个独特载体的测序引物。用独特的标记组衍生化 (或标记)每个独特的引物。

掌握这些有关的分子生物学工具,本发明中有可能在单一容器内处理 多个样品。首先,将待测序的DNA样品克隆到多数载体中。例如,如果 可利用100个独特的载体,即可完成100个连接反应、铺板步骤和噬斑 挑选。其次,合并来自每种载体类型的一种样品可制得含有100个独特 DNA片段或样品的100个独特载体的集合体。从而确定一给定的DNA 样品并自动指定一系列结合有标记组的引物组。向反应容器内加入各自的 引物、缓冲液、聚合酶、ddNTP、dNTP和辅助因子并完成扩增过程。 然后使反应混合物经受分离步骤并根据标记出现的时间确定序列。合并多 个DNA样品的能力具有实质性的优点。典型PCR反应的试剂成分约为 每份样品2美元。用本文描述的方法,可使每份样品的扩增成本降低至 少100倍。样品处理步骤可能至少减少100倍,并可降低材料花费。不 必使用大规模扩增自动装置。

10. 用于可裂解质谱标记的测序载体

使用本发明的可裂解质谱标记(CMST)可以独立地随分离进行的 同时读出各个个测序反应的结果。在CMST测序中,各个克隆载体都使 用不同的引物:当每份集合体使用20个克隆时,每个反应具20种不同 的引物。每个引物都相应于其中的一种载体,并且每个引物都用独特的 CMST分子标记。对每份合并的DNA样品进行4个反应(每种碱基一个 反应),所以每种载体都有4种寡核苷酸引物,每个引物在序列上都是 相同的,但又都是带有不同的CMS标记的。合并4次不同的测序反应混 合物并一起电泳。当合并20份样品时,使用80个标记(每个样品4种 碱基乘上20份样品),当凝胶分离时同时检测所有80个标记。

为了完成载体构建,可将随机20mer序列克隆到限制性位点的任一 侧。测定所得克隆的序列并选择若干个克隆用作载体。为每个选择的载体 制备两个寡核苷酸,与限制性位点每一侧上的序列同源,并使每个的朝向 为3′末端朝向限制性位点。制备每个引物的4种标记的产物,测序反应 中每个碱基使用一种产物,并且每一个都是用独特的CMS标记物标记 的。

11. 使用可逆标记进行测序的优点

当在测序和相关技术中使用可裂解标记时具有实质性优点。首先,灵 敏度增加将有助于读出更长的序列长度,并且能够在检测之前一特定时间 里收集标记。使用可裂解标记得以发展在整个凝胶范围内(例如1-500核 苷酸(nt))调整带宽度的系统。这将对获得大于450nt的读出长度的 能力带来很大影响。

使用可裂解的多标记(MW标志)也具有可在第一凝胶泳道上或分 离过程中鉴定多个DNA样品的优点。例如,有可能使用本文公开的方法 学在单一泳道和按大小分离片段的过程中组合至少96份样品和4个测序 反应(A、G、T、C)。如果利用具有独特引导位点的多个载体,则 每个凝胶泳道至少可组合384个样品(用该方案不能一起扩增不同的终 止子反应)。当利用可裂解标记的能力与使用多载体的能力联合在一起 时,可使DMA测序通过量表观上增加10,000倍。另外,在本文描述的 方案中,试剂用量减少,一次性使用器具减少;同时操作中的消耗费用减 少。

本文所述的整个方法学中处理内部对照物的能力也提供了另外的优 点。对于任何样品组,都可将内部对照核酸放在样品中。使用目前配置不 可能作到这一点。这一优点得以控制扩增过程、分离过程、标记检测系统 及序列组装。这是目前的系统所不具备的一个很大优点,在目前的系统中 对照品总是与样品分开的。

本文描述的组合物及方法还具有这样一些优点,即它在性质上是模式 的,并可配合任何类型的分离工艺或方法,此外,也可配合任何类型的检 测系统,作为对各自技术类型的改进。例如,本文描述的方法学可与“成 束的”CE阵列或能够分离DNA片段的微装配式装置相偶合。

C.DNA片段的分离

需要分析的样品常常是在复杂基质中的许多成分的混合物。对于含有 未知成分的样品,必须将各成分彼此分离开,从而可用其他分析方法鉴定 每种个别成份。在恒定条件下混合物中各成份的分离性质是恒定的,一旦 检定后即可利用这些分离性质去鉴定和定量每种成份。这样的方法在层析 和电泳分析性分离中是很典型的。

1.高效液相层析(HPLC)

高效液相层析(HPLC)是分离溶解于溶液中之化合物的层析分离 技术。HPLC装置由流动相储存器、、注样器、分离柱和检测器组成。 向柱内注射等分的样品混合物以分离化合物。混合物中不同成份由于它们 在流动液相和固定相之间的分配行为不同,而以不同的速率通过柱。

最近,已显示在带有化学结合的烷基链的非多孔PS/DVB颗粒上 进行IP-RO-HLPC在分析双和单链核酸中可替代毛细管电泳,提供迅速 分离和相似程度的分辨率(Huber 等,1993,Anal.Biochem.,212,p351;Huber等,1993,核酸研 究,21,p1061;Huber等,1993,生物技术(Biotechniques),16,p898)。与 离子交换层析相反,其并不总是以链长度的函数保留双链DNA(因为 AT碱基对与带正电荷的固定相相互作用比GC碱基对更强),IP-RP- HPLC能够严格地依据大小进行分离。

已发展了使用乙酸三乙铵作为离子配对试剂的方法,可借助高效液相 层析法在烷基化非多孔2.3μM聚(苯乙烯-二乙烯基苯)颗粒上成功地分 离磷酸二酯寡核苷酸(Oefner等,1994,And.Biochem,223,p39)。所描述 的技术允许分离大小范围为50到200核苷酸的长度上只差4至8个碱基 对的PCR产物。

2. 电泳

电泳是基于离子(或如本文所述的DNA)在电场中迁移率的分离技 术。带负电荷的DNA迁移向正电极,而带正电荷的离子则向负电极泳动。 为安全起见,一个电极通常是接地的,另一个则正或负向偏置的。带电的 离子或DNA依赖它们的总电荷、大小和形状不同而有不同的迁移率,并 因此可被分离开。电极装置由高电压能源、电极、缓冲液和缓冲液的载体 如聚丙烯酰胺凝胶,或毛细管组成。开口毛细管用于许多类型的样品,其 他凝胶载体则通常用于蛋白质混合物或DNA片段等生物学样品。

3. 毛细管电泳(CE)

毛细管电泳(CE)正在以其各种表现形式(游离溶液、等速电泳、 等电聚焦、聚丙烯酰胺凝胶、胶束电动“层析”)发展为一种以高分辨率 迅速分离很小样品体积的复杂混合物的方法。与MS的固有灵敏度和选 择性结合,CE-MS是生物分析的潜在高效率技术。在本文公开的新的应 用中,将这两种方法相对接将产生其速率超过目前的测序方法几个数量级 的优越DNA测序方法。

CE和电喷射离子化(ESI)流速之间的一致性,以及两者都因(而 且主要是用于)溶液中的离子种类而得以简化这一事实提供了极具吸引力 的组合基础。已描述了毛细管在区带电泳(CZE)和毛细管等速电泳与 建立在ESI基础上的四极质谱仪的组合(Olivares等,Anal.Chem. 59:1230,1987;Smith等,Anal.Chem.60:436,1988;Loo等,Anal.Chem.179: 404,1989;Edmonds等,J.Chroma.474:21,1989;Loo等,J.Microcolumn Sep.1:223,1989;Lee等,J.Chromatog.458:313,1988;Smith等, J.Chromatog.480:211,1989;Grese等, J.Am.Chem.Soc.111:2835,1989)。小肽很容易以高敏感性(飞摩尔)经 受CZE分析。

DNA片段的最有力的分离方法是聚丙烯酰胺凝胶电泳(PAGE), 通常是板凝胶格式。但当前技术的主要限制是完成对测序反应中产生的 DNA片段的凝胶电泳需要相当长的时间。使用毛细管电泳(其利用超薄 凝胶)可实现数量级增加。在游离溶液中,当加入碱时所有DNA均以同 样迁移率迁移到第一点的值,从而导致质量和电荷的补偿。在聚丙烯酰胺 凝胶中,DNA片段作为长度的函数筛分并迁移,并且该方法现已被应用 于CE。用交联聚丙烯酰胺现已达到每米有很大的塔板数(每米107塔 板,Cohen等,Proc.Natl.Acad.Sci.,USA 85:9660,1988)。如所描述的这样 CE柱也应用于DNA测序。在标准测序仪中,CE的方法原理上比板凝 胶电泳快25倍。例如,每小时可读出300个碱基。板凝胶电泳中分离速 度受到可在不产生过多热产生情况下施加给凝胶的电场大小限制。因此, 所达到的CE速度越大使用的电场强度越高(CE中的300V/cm对板 凝胶电泳中的10V/cm)。毛细管方法降低了电流量并因而降低了电 能和热量生成。

Smith等人(Smith等,核酸研究18:4417,1990)已提出平行使用多 个毛细管以增加通过量。同样Mathies和Huang(Mathies和Huang, 自然359:167,1992)已引入了在平行阵列的毛细管上完成分离并证明有 高测序通过量的毛细管电泳(Huang等,Anal.Chem.64:967,1992;Huang 等,Anal.Chem.64:2149,1992)。毛细管电泳的主要缺点是可装在毛细管 上的样品数量有限。在毛细管电泳开始时,分离前浓缩大量样品可增加负 载能力,而检测水可降低几个数量级。在CE中最通用的预浓缩方法是样 品堆积。最近已详述了样品堆积(Chien和 Burgi,Anal.Chem.64:489A,1992)。样品堆积依赖于样品缓冲液和毛细 管缓冲液之间的基质差异(pH,离子强度),这样通过样品带的电场就 比毛细管区域中的电场大。在样品堆积中,导入在低浓度缓冲液中的大体 积样品在毛细管柱的顶部预浓缩。毛细管内充入同样成分但有较高浓度的 缓冲液。当样品离子达到毛细管缓冲液和较低的电场时,它们就堆积到浓 缩带中。样品堆积增加可检测性1-3个数量级。

预浓缩的另一种方法是在对分析物进行游离区带CE分离之前应用 等速电泳(ITP)。ITP是允许在毛细管上装入微升体积样品的电泳技 术。该技术依赖于在分别比分析物有较高和较低迁移率的两种缓冲液(前 导和收尾电解质)之间插入样品。该技术本来就是一种浓缩技术,其中分 析物浓缩在以同样速度迁移的区带中。该技术目前不象上述的堆积方法那 么通用,这是因为它需几次选择前导和收尾电解质,并且在分离进行期间 只能分离阳离子或阴离子分析物。

DNA测序方法的要点是显著地选择性电泳分离DNA或寡核苷酸片 段。该方法有显著的选择性是因为每个片段都只根据核苷酸的差并被分辨 出来。已实现分离多达1000个片段(1000bp)。用可裂解的标记进行 测序的其他优点如下所述。当在利用可裂解的标记以聚丙烯酰胺凝胶电泳 法分离DNA片段时,不需要使用板凝胶格式。因为合并大量的样品(4 到2000个),所以不必象使用现有的染料-引物或染料-终止方法(即 AB1373测序仪)那样平行地分离样品。因为没有理由进行平行电泳,也 就没有理由使用板凝胶。因此,可在电泳分离方法中利用管凝胶格式。 Grossman(Grrossman等,Genet.Anal.Tech.Appl.9:9,1992)已证明, 当使用管凝胶格式代替板凝胶格式时可得到相当大的优点。这是由于与板 凝胶相比,在管格式中散失Joule热的能力更大。从而导致电泳速度更快 (快50%),而对高分子量DNA片段(大于1000nt)有更高的分辨率。 在基因组测序中读出长序列是很关键的。因此,在测序中使用可裂解标 记,还具有允许使用者利用最有效和敏感并具有最高分辨率的DNA分离 方法的优点。

4. 微装配式装置

毛细管电泳(CE)是DNA测序、法医分析、PCR产物分析及限 制性片段大小分离的高效率方法。因为毛细管凝胶可施加高得多的势场, 所以CE远比传统的板PAGE快得多。但CE具有每个凝胶只能处理一 个样品的缺点。本方法结合了CE的更快的分离速度和平行分离多份样品 的能力。使用微装置式装置的基本原理是通过使泳道大小微型化至约100 微米,从而能增加电泳中的信息密度。电子工业常规使用微装配技术制造 有小于1微米特征的电路板。目前毛细管排列的密度限于毛细管的外径。 通道的微装配产生高密度的排列。微装配也允许进行用玻璃纤维不可能实 现的物理装配,并使通道直接连接到电路片的其他装置上。以前很少在微 电路片上构建过用于分离技术的装置。已在硅芯片上装配了气相层析仪 (Terry等,IEEE Trans.Electron Device,ED-26:1880,1979)和液相层析 仪(Manz等,Sens.Actuators B1:249,1990),但这些装置未被广泛使用。 几个研究小组报导了在微装配装置上分离荧光染料和氨基酸(Manz 等,J.Chromatography 593:253,1992;Effenhauser等,Anal.Chem, 65:2637,1993)。最近Woolley和Mathies(Woolley和Mathies, Proc.Natl.Acad.Sci.91:11348,1994)已证明,可用光刻蚀法和化学刻蚀 法在玻璃基质上制造大量的分离通道。通道内充入羟乙基纤维素 (HEC)分离基质。已显示可在短短两分钟内分离DNA限制性片段。

D. 标记的裂解

如上文所讨论的,不同的接头设计可在不同的特异性物理或化学条件 下提供可裂解性(“敏感性”)。用于裂解各种接头设计的条件包括酸、 碱、氧化、还原、氟化物、琉基交换、光解及酶促条件。

可满足上文列出的接头的一般性标准的可裂解接头是本领域技术人 员已知的,并包括见于Pierce(Rockord,IL)的商品目录中的那些接 头。例子包括:

·  双(琥珀酰亚氨基琥珀酸)乙二醇酯(EGS),为可被羟胺裂解

    (1M,37℃,3-6小时)的胺反应性交联剂;

·  酒石酸二琥珀酰亚氨酯(DST)和磺基-DST,其为可被0.015M

    过碘酸钠裂解的胺反应性交联剂;

·  双[2-(琥珀酰亚氨氧基羰基氧基)乙基]砜(BSOCOES)和磺基

    -BSOCOES,其为可被碱(pH11.6)裂解的胺反应性交联剂;

·  1,4-二-[3′-(2′-吡啶二硫基(丙酰胺基)丁烷(DPDPB),

    可经硫羟交换或还原作用裂解的吡啶二硫醇交联剂;

·  N-[4-(对叠氮基水杨酰胺基)-丁基]-3′-(2′-吡啶

    二硫基)丙酰胺(APDP),为可经硫羟交换或还原裂解的吡啶

    二硫醇交联剂;

·  双-[β-4-(叠氮基水杨酰胺基)乙基]-二硫化物,为可

    经硫羟交换或还原作用裂解的光反应性交联剂;

·  N-琥珀酰亚氨基-(4-叠氮苯基)-1,3′-二硫基丙酸酯

    (SADP),可经硫羟交换或还原反应裂解的光反应性交联剂;

·  硫代琥珀酰亚氨基-2-(7-叠氮基-4-甲基香豆素-3

    乙酰胺)乙基-1,3′-二硫丙酸酯(SAED),可经硫羟交换或

    还原反应裂解的光反应性交联剂;

·  磺基琥珀酰亚氨基-2-(间叠氮基-邻硝基苯甲酰氨基)-

    乙基-1,3′-二硫丙酸酯(SAND),可经硫羟交换或还原反应

    裂解的光反应性交联剂。

可裂解接头的其他例子和可用于释放标记的裂解条件如下所述。可被 氟化物或在酸性条件下裂解的甲硅烷基连接基团。可被光源裂解(光解) 的3-,4-,5-,或6-取代的-2-硝基苄氧基或2-,3-,5-,或6- 取代的-4-硝基苄氧基连接基团。可被Ce(NH4)2(NO3)6裂解(氧化)的3 -,4-,5-或6-取代的-2-烷氧基苯氧基或2-,3-,5-,或6- 取代的-4-烷氧基苯氧基连接基团。可被氢氧化物(碱)、酸或LiAlH4(还 原)裂解的NCO2(尿烷)接头。可被O3、OsO4/IO4-或KMnO4(氧化)裂解 的3-戊烯基、2-丁烯基或1-丁烯基连接基团。可被O2、Br2、 MeOH或酸裂解的2-[3-,4-,或5-取代的-呋喃基]氧基连接基团。

裂解其他不稳定连接基团的条件包括:可用酸裂解叔烷氧基连接基 团;可用H3O+裂解的甲基(二烷基)甲氧基或4-取代的-2-烷基-1,3 -二氧戊环-2-基连接基团;可用氟化物或酸裂解的2-甲硅烷基乙 氧基连接基团;可在碱性条件下裂解的2-(X)-乙氧基(其中X=酮、酯、 酰胺、氰基、NO2、硫醚、亚砜、砜)连接基团;可用酸或在还原条件下 裂解的2-,3-,4-,5-,或6-取代的苄氧基连接基团;可用 (Ph3P)3RhCl(H)裂解的2-丁烯氧基连接基团;可用Li、Mg或BuLi裂解的3-,4-,5-或6-取代的-2-溴苯氧基连接基团;可用Hg2+裂解的甲基硫代甲氧基连接基团;可用Zn或Mg裂解的2-(X)-乙氧 基(其中X=卤素)连接基团;可经氧化(例如用Pb(OAc)4)裂解的2-羟基 乙氧基连接基团。

优选的接头是被酸或光解作用裂解的接头。在已为固相肽合成而发展 的酸敏感性接头中,有几种可用于将标记连接到MOI上。在Lloyd- Williams等人的综述(四面体49:11065-11133,1993)描述了其中的某些 接头。一类有用的接头是基于对烷氧基苄基醇,其中两种接头:4-羟 基甲基苯氧基乙酸和4-(4-羟甲基-3-甲氧基苯氧基)丁酸可购自 Advanced ChemTech(Louisville,KY)。这两个接头可通过连接到苄醇上的 酯键连接到标记上,并且通过连到羧酸上的酰胺键连接到含胺MOI上。 用不同浓度的三氟乙酸从MOI裂解掉由这些分子连接的标记。裂解这些 接头导致标记上的羧酸的释放。酸裂解通过相关接头如2,4-二甲氧基- 4′-(羧甲氧基)-二苯甲基胺(可以FMOC保护的形式购自Advanced Chem Tech公司)连接的标记,导致被释出的标记上的羧酰胺的释放。

已为固相肽合成而发展的大部分光敏感性接头也可用于本申请(参见 Lloyd-Williams的综述)。这些接头通常是基于2-硝基苄酯或2-硝基 苄酰胺。最近文献中报导过的光敏感接头的两个例子是4-(4-(1- Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基)丁酸(Holmes和 Jones,J.Org.Chem.60:2318-2319,1995)和3-(Fmoc-氨基)-3- (2-硝基苯基)丙酸(Brown等,Molecular Diversity 1:4-12,1995)。两 接头均可通过羧酸连接到MOI的胺上。通过在标记上的羧酸和接头上的 胺之间形成酰胺而使标记接到接头上。通常用350nm波长的紫外光以本 领域已知的强度和时间完成对光敏感接头的裂解。光化学裂解装置的商品 来源是Aura Industries Inc.(Staten Island,NY)和Agrenetics (Wilmington,MA)。裂解接头导致标记上伯酰胺的释放。光可裂解 的接头的例子包括硝基苯基甘氨酸酯,内-和外-2-苯并降冰片烷基氯 和甲磺酸,以及3-氨基-3(2-硝基苯基)丙酸。酶促裂解的例子包括 可裂解酯键的酯酶、裂解磷酸二酯键的核酸酶、裂解肽键的蛋白酶等。

E. 标记的检测

检测方法一般依赖于某些类型光谱场中的吸收和发射。当原子或分子 吸收光时,进入的能量将量化结构激发到较高能量水平。激发的类型取决 于光的波长。电子被紫外或可见光激发到较高轨道,红外光激发分子振 动,并且微波激发旋转。吸收光谱是作为波长函数的光吸收。原子或分子 的光谱依赖于其能量水平结构。吸光光谱可用于鉴定化合物。具体的吸收 光谱方法包括原子吸收光谱法(AA)、红外光谱法(IR)和紫外可见 光谱法(UV-Vis)。

被激到高能水平的原子或分子因发出幅射而衰变到较低水平。如果跃 迁是在同一自旋状态间进行该光称为荧光,如果跃迁发生在不同自旋状态 之间则是磷光。分析物的发射强度与浓度成线性关系(在低浓度下),并 用于定量发光物质。具体的发射光谱方法包括原子发射光谱法(AES)、 原子荧光光谱法(AFS)、分子激光诱导的荧光法(LIF)和X射线荧 光法(XRF)。

当电磁幅射通过物质时,大部分幅射以其原来的方向继续前进,但小 部分向其他方向散射。以入射光的同样波长散射的光称为雷利散射。在透 光固体中由于振动散射的光称为布里渊散射。布里渊散射典型的是从入射 光偏移0.1到1个波数。不透明固体中由于分子中振动或光声子散射的光 称为喇曼散射。喇曼散射光从入射光偏移多达4000个波数。特异性散射 光谱方法包括喇曼光谱法。

IR光谱法是检测被样品吸光的中红外光的波长和强度。中红外光 (2.5-50μm,4000-200cm-1)是足以激发分子振动到较高能量水平的光。 IR吸收带的波长是特异类型的化学键所特有的,并且IR光谱一般最适于 鉴定有机和有机金属分子。

近红外吸收光谱(NIR)是检测被样品吸收的近红外光的波长和强 度。近红外光跨越800nm-2.5μm(12,500-4000cm-1)范围并且是足以激 泛音和分子振动组合达到较高能量水平的光。NIR典型地被用于定量检 测有机官能基团,特别是O-H、N-H和C=O。NIR仪的组成和设计相 似于UV-VIS吸收光谱仪。光源通常是钨灯,检测器通常是PbS固态检 测器。样品容器可以是玻璃或石英的,并且典型的溶剂是CCl4和CS2。 NIR光谱的方便装置使之适于联机监测和过程控制。

紫外和可见光吸收光谱是测量由样品吸收的近紫外和可见光的波长 和强度。真空中UV吸收发生在100-100nm(105-50,000cm-1);石英 UV在200-350nm(50,000-28,570cm-1),可见光在350-800(28,570- 12,500cm-1),并且符合Beer-Lambert-Bouguet定律。紫外和可见光是 足以加速外围电子到较高能量水平的光。UV-Vis光谱通常可应用于溶液 中的分子和无机离子或复合物。US-Vis光谱受到光谱宽度特征的限制。 光源通常是氘灯(用于UV检测)和钨灯(用于可见光检测)。用波长分 离器如棱镜或光栅单色仪选择这些连续光源的波长。经扫描波长分离器得 到光谱,并可根据光谱或在单一波长处进行定量检测。

质谱是利用离子化原子或分子的质量对电荷比例的不同将它们彼此 分离开。因此质谱可用于原子或分子的定量,并且还用于确定分子的化学 和结构信息。分子具有不同的片段化特征,从而为鉴定化合物提供结构信 息。质谱仪的一般操作如下。造成气相离子,基于它们的质量对电荷比例 在空间或时间上分离离子,并检测各个质荷比离子的量。质谱仪的离子分 离能力是由分辨率描述的,其定义为R=m/Δm,其中m是离子质量, Δm是质谱中两个可分辨峰之间的质量差异。例如分辨率为1000的质谱 仪可分辨开m/z为100.0的离子与m/z为100.1的离子。

一般说来,质谱仪由离子源、质量选择分析器和离子检测器组成。磁 扇形场、四极和飞行时间设计也需要抽提和加速离子以将离子从来源区域 转移到质量分析器中。下面讨论几种质量分析器设计(磁扇形场质谱、四 极质谱或飞行时间质谱)的详细内容。磁扇形场质谱的单聚焦分析器利用 180、90或60度的颗粒束路径。影响颗粒的各种力分离有不同质量/电 荷比例的离子。用双聚焦分析器,在这种类型的仪器中加入静电分析器, 以分离有不同动能的颗粒。

用于四极质谱的四极质量滤器由平行排列的4个金属棒组成。施加 的电压影响在4个棒之间中心部分向下飞行之离子的轨迹。对于给定的 DC和AC电压,只有某些质量/电荷比例的离子通过四极滤器,而所有 其他的离子则被抛出它们原来的路径。当改变棒上的电压时监测通过四级 滤器的离子,以得到质谱。

飞行时间质谱利用通过“漂移区”的过渡时间的差异分离不同质量的 离子。其以脉冲发射模式运行,所以离子必须在脉冲中产生和/或被提 取。发射脉冲的电场将所有离子以qV的动能加速到无场漂移区,其中q 是离子电荷,V是施加的电压。因为离子动能是0.5mV2,所以较轻的离 子比较重离子有更高的速度,并较快地到达漂移区末端的检测器。离子检 测器的输出作为时间的函数展示在示波器上,以得到质谱。

离子形成过程是质谱分析的起始点。化学电离是一种利用试剂离子与 分析物分子(标记)反应以通过质子或氢负离子转移形成离子的方法。试 剂离子是向电子碰撞(EI)离子源内导入过量(相对于标记)甲烷而产 生的。电子碰撞产生CH4+和CH3+,它们进一步与甲烷反应形成CH5+和 C2H5+。电离标记的另一种方法是通过等离子体和辉光放电。等离子体是 有效地激发并电离原子的热的部分电离的气体。辉先放电是保持在两个电 极之间的低压等离子体。电子碰撞电离利用电子束,通常是由钨丝产生的 电子束电离气相原子或分子。来自电子束的电子撞掉分析物原子或分子的 电子以产生离子。电子喷射电离(ESI)利用很细的针和一系列分离器 (Skimner)。样品溶液被喷射到离子源小室中以形成小滴。当排出毛 细管时小滴携带电荷并且当溶剂蒸发时小滴消失,留下高带电分析物分 子。ESI特别适用于难以蒸发或电离的生物大分子。快速原子轰击 (FAB)利用冲击固体样品的中性原子和Xe或Ar的高能束以引起解吸 附和电离。其用于难以进入气相的生物大分子。FAB很少引起片段化并 通常给出大的分子离子峰,使之适用于分子量测定。经加速从离子源通过 电荷交换室的离子产生原子束。离子在与中性原子碰撞中吸收电子形成高 能原子束。激光电离是一种激光脉冲剥落样品表面的材料并产生微等离子 体的方法,后者电离某些样品成分。基质辅助的激光解吸电离 (MACDI)是蒸发和电离大生物分子如蛋白质或DNA片段的LIMS方 法。将生物分子分散于固体基质如烟酸上。UV激光脉冲将携带某些大分 子的基质以离子化形式剥落到气相中,以使它们可被提取到质谱仪内。等 离子体解吸电离(PD)利用252Cf的衰变,产生两个以相反方向迁移的 碎片。一个碎片冲击样品激发出1-10个分析物离子。另一个碎片冲击检 测器并引发开始采集数据。该电离方法特别适用于大的生物分子。共振电 离是其中将一个或多个激光束调至使气相原子和分子共振跃迁的频率,使 之以分步方式加速到其离子化电势以上,以产生离子。次级电离 (SIMS)利用离子束例如3He+、16O+或40Ar+聚焦在样品表面上并使材 料溅蚀到气相中。火花源是一种穿过两电极发出电流脉冲以电离固体样品 中分析物的方法。

标记在从所连接的分子上裂解之前、期间或之后,可能变成带电的。 基于离子“解吸”的电离方法,从固体或液体表面直接形成或发射离子, 得以增加电离方法的应用至非挥发性和热敏感性化合物。这些方法不要求 在电离前中性分子挥发,并且总地大大减少了分子的热降解。这些方法包 括场解吸(Becky,场电离和场解吸质谱的原理, Pergamon,Oxford,1977)、等离子体解吸(Sundqvist和Macfarlane, Mass Spectrom.Rev.)、激光解吸(Karas和Hillenkange,Anal.Clem. 60:2299,1998;Karas等,Angew.Chem.101:805,1989)、快粒子轰击(如 快原子轰击、FAB和次级离子质谱、SIMS;Barber等,Anal.Chem. 54:645A,1982)及热喷射(TS)电离(Vestal,Mass Spectrom.Rev. 2:447,1983)。热喷射广泛应用于与液相层析联机组合。也已显示连续流 动FAB方法(Caprioli等,Anal.Chem.58:2949,1986)有重要的应用潜 力。更完全的电离/质谱法组合包括:离子捕获质谱、电喷射电离质谱、 离子喷射质谱、液体电离质谱、大气压电离质谱、电子电离质谱、亚稳定 原子轰击电离质谱、快原子轰击电离质谱、MALDI质谱、光化电离飞行 时间质谱、激光小滴质谱、MALDI-TOF质谱、APCI质谱、纳米喷射 质谱、雾化喷射电离质谱、化学电离质谱、共振电离质谱、次级离子质谱、 热喷射质谱。

这些电离方法适合于非挥发性生物化合物具有交迭实用范围。电离效 率主要取决基质组合物和化合物类型。目前可得到的结果表明,TS分子 量上限约为8000道尔顿(Jones和Krolik,质谱快讯,1:67,1987)。因为 TS实践主要是用四极质谱仪,所以在较高质量/电荷比例(m/z)下 敏感性一般都不成比例。飞行时间(TOF)质谱仪是可从市场上购得的, 并具有m/z范围只受检测器效率限制的优点。最近,已引入了另外两 种电离方法。这两种方法现在称为基质辅助的激光解吸(MALDI,Karas 和Hilenkamp,Anal.Chem.60:2299,1988;Karas等,Angew.Chem. 101:805,1989)和电喷射电离(ESI)。这两种方法都有很高的电离效 率(即很高的[产生的分子离子]/[消耗的分子]比例)。限定技术最 终潜力的灵敏度取决于样品大小、离子的量、流速、检测效率及实际电离 效率。

电喷射质谱是建立在60年代首先提出的理论(Dole 等,J.Chem.Phys.49:2240,1968)基础上的。电喷射电离(ESI)是一种 产生用质谱法分析的带电分子的手段。简单地说,电喷射电离在强静电场 中由雾化液体产生高带电小滴。一般在干浴气体中于大气压下形成高带电 小滴,经中性溶剂蒸发而收缩,直到电荷排斥力克服内聚力,导致“库仑 爆炸”。电离的准确机制尚有争论并且已有几个研究小组提出了假设 (Blades等,Anal.Chem.63:2109-14,1991;Kebarle等,Anal.Chem. 65:A972-86,1993;Fenn,J.Am.Soc.Mass.Spectram.4:524-35,1993)。不 管离子形成的基本过程如何,ESI总是于温和条件下从溶液中产生带电 荷分子。

用小量有机分子获得有用质谱数据的能力有赖于离子的有效产生。 ESI的电离效率与分子的正电荷量有关。实验性改善电离作用通常包括使 用酸性条件。改善电离的另一种方法是在可能时使用季胺(参见Aekersold 等,蛋白科学(Protein Science)1:494-503,1992;Smith等,Anal.Chem. 60:436-41,1988)。

以下进一步详细描述电喷射电离。电喷射离子的产生需要两个步骤: 在接近大气压下分散高带电小滴,然后在诱导蒸发条件下处理。使分析物 分子的溶液通过保持在高电势下的针。在针的尖端,溶液分散到含分析物 分子的带高电荷小滴的气雾中。小滴迅速地蒸发并通过一个场解吸或残留 蒸发的过程,质子化的蛋白质分子被释放到气相中。电喷射一般是通过对 来自毛细管的小的液体流(一般为1-10μL/分钟)施加高电场而产生的。 一般在毛细管和位置相距0.2-2cm的反电极之间施加3-6kV的电势差(其 中依据去溶剂化的程度,可通过小孔由MS提取电子、带电团、甚至带 电小滴样品)。电场导致电荷在毛细管末端液体表面上积聚;因此液体流 速、比电阻和表示张力是小滴形成中的重要因素。高电场导致液体表面的 破坏和高带电液体小滴的形成。根据毛细管偏压可产生带正电荷或负电荷 小滴。负离子型需要在电子清除剂例如氧的存在以抑制放电。

可将各种液体静电喷射到真空中,或者可借助喷雾剂喷射。只使用喷 雾电场导致对液体导电率和介电常数的某些实际限制。室温下以相当于< 10-4M的含水电解质溶液的有用液体流速进行稳定电喷射需要小于10-5 欧姆的溶液导电率。发现该模式对ESI-MS是最有用的,适当的液体流速 导致液体作为细雾分散。离毛细管的距离非常短,小滴直径常常相当均匀 并且约为1μm。特别重要的是,对于较高液体流速,总电喷射离子电流 只稍有增加。有证据表明加热对于操纵电喷射是有用的。例如,稍微加热 可使含水溶液很容易电喷射,推测是由于降低了粘度和表面张力。热辅助 和气体雾化辅助电喷射允许使用较高的液体流速,但增加小滴带电的程 度。分子离子的形成需要有影响初始小滴群体蒸发的条件。为此,可在较 高压力下借助于中度温度(<60℃)的干气体流,在通过界面运输期间 加热,并且(特别是在使用离子俘获法的情况下)经在相对低的压力下高 能碰撞而实现之。

虽然构成ESI之基础的详细过程尚不确定,但经ESI产生的很小小 滴似乎允许溶液中的几乎所有各种带电颗粒在蒸发残留溶剂后被转移到 气相中。然后质谱检测需要离子在去溶剂化后具有可检测的m/z范围 (四极装置要求<4000道尔赖),并且能以足够的效率产生和传输。已 发现很宽范围的溶剂都适合于ESI-MS,而且电离效率基本上不依赖于分 子量,提示其为一种高度无区别的和广泛适用的电离方法。

电喷射离子“源”在接近大气压条件下起作用。电喷射“源”一般是 金属或玻璃毛细管,加上一种相对可反电极电偏离液体溶液的方法。溶 液,典型的是含有分析物并常含有其他添加剂如乙酸的水-甲醇混合物, 流向毛细管末端。已描述了一种ESI源(Smith 等,Anal.Chem.62:885,1990),其可容纳基本上任何溶剂系统。ESL的 典型流速为1-10μL/分钟。对ESI-MS界面的基本要求是尽可能有效地 从高压区向MS加样并输送离子。

ESI的效率可以是很高的,从而为本发明有用的极敏感的装置提供了 基础。对于单一带电荷的检测对象来说,目前的装置性能可提供在检测器 中的总离子电流为2×10-12A或约107计数/秒。在该装置性能的基础 上,如果分析物完全被电离,浓度低到10-10M或大约10-18mol/秒的单 一种带电粒子将产生可检测的离子流(大约10个计数/秒)。例如,使 用与毛细管区带电泳的ESI界面,已得到了季铵离子的10-18摩尔检测下 限(Smith等,Anal.Chem.59:1230,1988)。对于分子量为1000的化合 物,电荷平均数为1,电荷状态近似数为1,峰宽度(m/z)为1, 并且最大强度强度(离子/秒)是1×1012。

在得到ESI质谱中实际消耗相当少的样品(Smith 等,Anal.Chem.60:1948,1988)。使用扇页装置的阵列检测器(其允许同 时检测光谱的各部分)也可获得实质性效益。因为目前只检测由ESI形 成的约10-5的所有离子,所以关注限制装置性能的因素可以为改善灵敏度 提供基础。本领域技术人员可以理解到,本发明包括并容纳对电离和检测 方法的改进。

界面最好是放在分离装置(使用凝胶)和检测器(例如质谱)之间。 界面最好有下列特征:(1)能够以不连续的时间间隔收集DNA片段, (2)浓缩DNA片段,(3)从电泳缓冲液和介质中除去DNA片段, (4)从DNA片段上切掉标记,(5)将标记与DNA片段分离开,(6) 处理DNA片段,(7)将标记放在挥发性溶液中,(8)挥发并电离标 记,(9)将标记放置或运送到喷射装置,由此将标记导入质谱仪。

当DNA片段从凝胶的底部洗脱时,界面也有“收集”DNA片段的 能力。凝胶可以包括板凝胶、管状凝胶、毛细管凝胶等。可用几种方法收 集DNA片段。第一种方法是使用电场,其中DNA片段被收集到电极上 或接近电极处。第二种方法是其中使液体流流过凝胶底部以收集DNA片 段。可以接合两种方法的特征,其中可将DNA收集到流动的液体流中, 其后利用电场浓缩。最终结果是从完成分离方法的介质中除去DNA片 段。这就是说,可以使用电场将DNA片段从一类溶液“拖拉”到另一类 溶液中。

一旦DNA片段处在适当的溶液(与电喷射和质谱相容的)中,标记 即可从DNA片段上裂解下来。然后可利用电场将DNA片段与标记分离 开(该标记最好带有与DNA标记相反的电荷)。然后再使用电场或流动 液体将标记导入电喷射装置内。

根据它们的吸收和荧光发射波长及强度最直接地鉴定并定量荧光标 记。

虽然常规荧光分光光度计是适应性极强的,其可提供连续范围的激发 和发射波长(lEx、lS1、lS2),但例如流式细胞计数仪和激光扫描显微 镜等更专业化的装置则需要可在单一的固定波长激发的探针。在现代装置 中,这通常是氩激光的488nm光谱线。

每个探针分子的荧光强度都与ε和QY的乘积成正比例。在目前实 践中有重要性的荧光团中,这些参数的范围为ε大约10000至100,000cm -1M-1,QY为0.1至1.1。当高强度光照将吸收驱向饱和时,限制荧光 可检测性的因素是被激发的荧光团的不可逆性破坏(光漂白)。光漂白的 实际影响取决于所用的荧光检测技术。

本领域技术人员可以看出,装置(界面)可被安排在分离和检测步骤 之间,以便使大小分离和标记检测(在时间上)连续进行。这样就将分离 方法和装置与检测方法和装置联合起来,构成单一装置。例如,将界面置 于分离技术操作和以质谱法或电势电流测定法进行的检测之间。

界面的功能主要是从分析物中释放出(如质谱)标记。有几种有代表 性的界面装置。界面的设计依据于对可裂解接头的选择。就可光裂解的接 头来说,需要能量或光源。对于热不稳性接头、碱敏感性接头或二硫化物 接头,需在界面内加入试剂。对于热敏感性接头,需要能量或热源。对于 酶敏感性接头(例如特异性蛋白酶)和肽接头、核酸酶及DNA或RNA 接头、糖基化酶、HRP或磷酸酶及裂解后不稳定的接头(例如相似于化 学发光底物)则需要加入酶。界面的其他特征包括最小带加宽,在注入质 谱仪内之前将DNA与标记分离开。分离技术包括基于电泳方法的技术和 亲和技术、按大小保留(透析)技术、过滤等。

也有可能以俘获电泳法浓缩标记(或核酸-接头-标记构建体),然 后释放到与所选用的特定类型的电离方法相匹配的替代试剂流中。界面也 能够将标记(或核酸-接头-标记构建体)俘获到微球上,将微球射入小室 内之后进行激光解吸/蒸发。也可能提取到替代缓冲液中(例如从毛细管 电泳缓冲液穿过可通透膜进入疏水缓冲液中)。在某些应用中也可能期望 将标记间歇性地传送到质谱仪中,这可能包括界面另外的功能。界面的另 一个功能是将标记从多个柱送入对每个柱都有一旋转时间狭缝的质谱仪 中。另外,有可能将标记从单个柱传送到按时间分开的多个质谱检测仪 中,在数毫秒时间里收集每组标记,然后送入质谱仪。

下面列出的是可用于本发明的分离和检测技术设备的代表性销售 商。Hoefer Scientific Instruments(San Francisco,CA)生产用于 测序的电泳装置(Two StepTM,Poker FaceTMII)。Pharmacia Biotech (Piscataway,NJ)生产用于DNA分离和测序的电泳装置 (PhastSystem用于PCR-SSCP分析,MacroPhor System用于DNA测 序)。Rerkin Elmer/Applied Biosystems Division(ABI,Foster City,CA)生产基于荧光素染料的半自动测序仪(ABI373和 ABI377)。Analytical Spectral Devices(Boulder,CO)生产UV分光 光度计。Hitachi Instruments(日本东京)生产原子吸收光谱仪、荧光 光谱仪、LC和GC质谱仪、NMR光谱仪及UV-Vis光谱仪。PreSeptive Biosystems(Framingham,MA)生产质谱仪(VoyagerTM Elite)。 Bruker Instruments Inc.(Manning ParK,MA)生产FTIR光谱仪 (Vector22)、FF喇变光谱仪、飞行时间质谱仪(Reflex IITM)、离子 俘获质谱仪(EsquireTM)和Maldi质谱仪。Analytical Technology Inc. (ATI,Boston,MA)制造毛细管凝胶电泳装置、UV检测器和二极 管阵列检测仪。Teledyne Electronic Technologies(Mountain View, CA)制造离子俘获质谱仪(3DQ DiscoveryTM和3DQ ApogeeTM)。 Perkin Elmer/Applied Biosystems Division(Foster city,CA)制造 可与电喷射匹配的Sciex质谱仪(三联四极LC/MS/MS,API 100 /300)。Hewlett-Packard(Santa Clara,CA)生产质量选择性检 测器(HP5972A)、MALDI-TOF质谱仪(HP G2025A)、二极管阵 列检测器、CE装置、HPLC装置(HP1090)及UV光谱仪。Finnigan Corporation(San Jose,CA)制造质谱仪(磁扇形场(MAT95STM)、 四极光谱仪(MAT95SQTM)和四种其他的相关质谱仪)。Rainin (Emevyville,CA)制造HPLC装置。

本文描述的方法和组合使得可以使用裂解的标记确定样品类型和核 酸鉴定的图谱。在每个测序方法开始时,为每个特定的(选择的)引物指 定一个特殊的独特标记。标记指示不同的样品类型、双脱氧终止子类型(就 Sanger测序反应而言)或优选两者。具体地说,标记指示引物类型,引 物类型又指示载体类型,载体类型又指示样品身份。标记也可能指示双脱 氧终止子类型(ddTTP、ddCTP、ddGTP、ddATP),其中参考放 有标记引物的双脱氧核苷酸反应。然后完成测序反应并及时按大小依次分 离所得到的片段。

在时间框架中从片段上切下标记并在时间框架内检测和记录之。将标 记图谱与时间框架相比较以构成序列。即,在按大小分离之后及时记录所 有标记的鉴定数据并且在数据框架中变成相互关联的。按大小分离步骤可 分离开按一个核苷酸递增的核酸片段,因此按一个核苷酸的增量分离了相 关的标记。由于予知双脱氧终止子或核苷酸图谱和样品类型,很容易以线 性方式推断出序列。

下列实施例是按举例说明方式,而不是以限制的方法提供的。

除另外指出者外,用于实施例中的化学品均可从Aldrich Chemical Company,Milwaukee,WI得到。本文使用具有所指出的含义的下列 缩写词:

ANP=3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸

NBA=4-(Fmoc-氨基乙基)-3-硝基苯甲酸

HATU=O-7-氮杂苯并三唑-1-基-N,N,N′,N′-四甲基脲六氟磷酸盐

DIEA=二异丙基乙胺

MCT=一氯三嗪

NMN=4-甲基吗啡啉

MNP=N-甲基吡咯烷酮

ACT357=ACT357肽合成仪,购目Advanced ChomTech,Inc.Louisville KY

ACT=Advanced Chem Tech,Inc.,Louisvile,KY

NovaBiochem=CalBiochem-NovaBiochem International,San diego, CA

TFA=三氟乙酸

Tfa=三氟乙酰

iNIP=N-甲基异哌啶甲酸

Tfp=四氟苯基

DIAEA=2-(二异丙基氨基)乙胺

MCT=一氯三氮烯

5’-AH-ODN=有5′-氨基己基尾的寡脱氧核苷酸。

                          实施例

                           实施例1

用于可裂解分子鉴定剂测序中的酸敏感性接头的制备 A可化学裂解的质谱标记五氟苯基酯的合成,以释放带羧酰胺末端的标记

图1显示反应流程。

步骤A.在ACTA357肽合成仪(ACT)的收集容器中用DMF悬浮 TentaGel SAC树脂(化合物II;得自ACT;1当量)。加入溶于DMF 的化合物I(3当量)、HATU(3当量)和DIEA(7.5当量)并将 收集容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和 DMF(2X)洗树酯。将I偶联到树脂上并重复洗涤步骤,得到化合物 III。

步骤B.将树脂(化合物III)与DMF中的25%哌啶混合并振荡10分钟。 除去溶剂,用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂, 并直接用于步骤C。

步骤C.将步骤B的去保护的树脂悬浮于DMF中并向其中加DMF中 的FMOC保护的在其侧链中含有胺官能团的氨基酸(化合物IV,如α -N-FMOC-3-(3-吡啶基)-丙氨酸,可购自Synthetech,Albany,OR; 3当量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。 除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树酯。

将IV偶联到树脂上并重复洗涤步骤,以得到化合物V。

步骤D.按步骤B中所述用哌啶处理树脂(化合物V)以除去FMOC基 团。然后用ACT357将收集容器中的去保护的树脂等分到16个反应容器 中。

步骤E.将得自步骤D的16等份的去保护树脂悬浮于DMF中。向各反 应容器中加入溶于DMF中的适当的羧酸VI1-16(R1-16CO2H3,3当 量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。 除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗各等 份的树脂。将VI1-16偶联到各等份的树脂上并重复洗涤步骤,得到化合物 VII1-16。

步骤F.用CH2CI2(3X)洗各等份的树脂(化合物VII1-16)。向各反应 容器内加入在CH2CH2中的1%TFA并将容器振荡30分钟。将溶剂从反 应容器过滤到各个试管中。用CH2CI2(2X)和MeOH(2X)洗各等 份的树脂并将滤液合并到各个试管中。真空中蒸发各个试管。得到化合物 VIII1-16。

步骤G.将每份游离羧酸VIII1-16溶解于DMF中。向各溶液内加入吡啶 (1.05当量),然后再加入三氟乙酸五氟苯酯(1.1当量)。室温下将 混合物搅拌45分钟。用EtOAc稀释该溶液,用1M柠檬酸水溶液(3X) 和5%NaHCO3水溶液(3X)洗,在Na2SO4上干燥,过滤并真空蒸发, 得到化合物IX1-16。

B.可化学裂解的质谱标记五氟苯基酯的合成,以释放带羧酸末端的 标记

图2显示反应流程。

步骤A.将4-(羟甲基)苯氧基丁酸(化合物I;1当量)与DIEA(2.1 当量)和烯丙基溴(2.1当量)合并在CHCl3中并加热回流2小时。用 EtOAc稀释混合物,用1N HCl(2X)、pH9.5碳酸盐缓冲液(2X) 及盐水(1X)洗,在Na2SO4上干燥,并真空蒸发得到化合物I的烯丙 酯。

步骤B.将步骤A中的化合物I的烯丙酯(1.75当量)与FMOC保护的 在其侧链中含有胺官能团的氨基酸(化合物II,如α-N-FMOC-3-(3- 吡啶基)-丙氨酸,可购自Synthetech,Albany,OR;1当量)、N- 甲基吗啉(2.5当量)和HATU(1.1当量)合并到CH2Cl2中,并室温 搅拌4小时。用CH2Cl2稀释混合物,用1M柠檬酸水溶液(2X)、水 (1X)和5%NaHCl3水溶液(2X)洗,在Na2SO4上干燥并真空蒸发。 经快速层析( CH2Cl2→EtOAc )分离化合物III。

步骤C.将化合物III溶解于CH2Cl2中,加入Pd(PPh3)4(0.07当量)和 N-甲基苯胺(2当量),并将混合物室温搅拌4小时。用CH2Cl2稀释混 合物,用1M柠檬酸水溶液(2X)和水(1×)洗,在NaSO4上干燥并真空 蒸发。经快速层析( CH2Cl2→EtOAc )分离化合物IV。

步骤D.在ACT357肽合成仪(Advanced ChemTech Inc(ACT), Louisvile,KY)的收集容器内用DMF悬浮TentaGel S AC树脂(化 合物V;1当量),加入溶于DMF中化合物IV(3当量)、HATU(3 当量)和DIEA(7.5当量)并将收集容器振荡1小时。除去溶剂并用 NMP(2X)、MeOH(2X)和DMF(2X)洗树脂。将IV偶联到树 脂上并重复洗涤步骤,得到化合物VI。

步骤E.将树酯(化合物VI)与DMF中的25%哌啶混合并振荡5分钟。 过滤树脂,然后与DMF中的25%哌啶混合并振荡1小时。除去溶剂并 用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂。然后用ACT357 将去保护的树脂从收集容器中等分到16个反应容器中。

步骤F.将步骤E的16等份去保护的树脂悬浮于DMF中。向各反应容 器内加入溶于DMF的适当的羧酸VII1-16(R1-16CO2H;3当量)、HATU (3当量)和DIEA(7.5当量)。将容器振荡1小时。除去溶剂并用 NMP(2X)、MeOH(2X)和DMF(2X)洗各等份树脂。将VII1-16 偶联到树脂上并重复洗涤步骤,得到化合物VIII1-16。

步骤G.用CH2Cl2(3X)洗各等份树脂(化合物VIII1-16)。向各反应容 器内加入在CH2Cl2中的1%TFA并将容器振荡30分钟。从反应容器中 将溶剂过滤到各个试管内。用CH2Cl2(2X)和MeOH(2X)洗各等 份的树脂,并将滤液合并到各个试管内。真空蒸发各个试管,得到化合物 IX1-16。

步骤H.将各游离羧酸IX1-16溶解于DMF中。向各溶液内加入吡啶(1.05 当量),然后再加入三氟乙酸五氟苯酯(1.1当量)。将混合物室温搅拌 45分钟。用EtOAc稀释溶液,用1M拧檬酸水溶液(3X)和5%NaHCO3溶液(3X)洗,在Na2SO4上干燥,过滤并真空蒸发,得到化合物X1-16。

                     实施例2

证明T-L-X的光裂解

室温下用近紫外光照射实施例13中制备的T-L-X化合物7分钟。使 用在350mm处有发射峰的Rayonett荧光紫外灯(Southern New England Ultraviolet Co.,Middletown,CT)作为紫外光源。将灯放 在离含样品平皿15cm距离处。SDS凝胶电泳显示在这些条件下85%以 上的混合物被裂解。

                         实施例3

制备荧光标记的引物和证明荧光团的裂解 寡核苷酸的合成和纯化

使用制造商提供的标准亚磷酰胺化学,或H-膦酸酯化学(Glenn Research Sterling,VA)在自动DNA合成仪上制备寡核苷酸(ODN)。 适当封闭的dA、dG、dC和T亚磷酰胺是以这些形式从市场上购得 的,并且可很容易地将合成的寡核苷转化成这种适当的形式。使用由制造 商提供的标准亚磷酰胺,或H-膦酸酯化学制备寡核苷酸。使用标准方法 寡核苷酸。使用12μm 300#Rainin(Emeryville,CA)Dynamax C-8 4.2×250反相柱以HPLC对带5′三苯甲基的寡核苷酸进行层析,使用 0.1N Et3NH+OAc-(pH7.0)中的15%至55%MeCN梯度洗脱20分钟。 当完成脱三苯甲基化时,进一步用凝胶排阻层析法纯化寡核苷酸。在碱性 pH条件下用PRP柱(Alltech,Deerfield,IL)并用PAGE法分析检 查寡核苷酸的质量。

2,4,6-三氯三嗪衍生的寡核苷酸的制备:使10至1000μg 5′-末 端胺连接的寡核苷酸与过量重结晶的氰尿酰氯在溶于碱性(最好pH8.3 至8.5)缓冲液内的10%N-甲基吡咯烷酮中于19℃至25℃下反应30 至120分钟。终反应混合物由0.15M硼酸钠(pH8.3)、2mg/ml重 结晶的氰尿酰氯和500μg/ml各寡核苷酸组成。在G50 Sephedex(Pharmacia,Piscataway,NJ)柱上经排阻层析除去未反应的氰尿 酰氯。

然后使经过活化的如上纯化的寡核苷酸在室温下于0.15M硼酸钠 (pH8.3)中与100倍过量的半胱胺反应1小时。在G50 Sephadex柱上 经大小排阻层析除去未反应的半胱胺。然后使衍生的ODN与胺反应性荧 光颜料反应。将所得到的ODN制备物分成3份,每份各与(a)20倍 摩尔过量的德克萨斯红磺酰氯(Molecular Probes,Eugene,OR)、 与(b)20倍摩尔过量的丽斯胺磺酰氯(Molecular Probes,Eugene,OR),(c)20倍摩尔过量的荧光素异硫氰酸酯反应。 终反应条件是在0.15M硼酸钠(pH8.3)中于室温下反应1小时。在G50 Sephadex柱上经大小排阻层析除去未反应的荧光颜料。

为了从寡核苷酸上裂解荧光颜料,将ODN调整到1×10-5摩尔,然 后在TF(TF是0.01M Tris,pH7.0,5mM EDTA)中稀释(12,3 倍稀释)。向100μl体积的ODN中加入25μl 0.01M二硫苏糖醇(DTT)。 一组相同的对照物中不加DDT。将混合物室温下保温15分钟。在黑色 微滴定板中检测荧光。从保温管中除去溶液(150μl)并放在黑色微滴定 板(Dynatek Laboratories,Chantilly,VA)中。使用Fluoroskan II荧光计(Flow Laboratories,McLean,VA)直接读平板,其中使 用495nm激光波长并监测520nm发射波来检测荧光素,使用591nm激 发波长并监测612nm的发射波以检测德克萨斯红,并使用570nm激发波 长并监测590nm发射波以检测丽丝胺。

荧光团的摩尔数        未裂解的      裂解的      游离的

                        RFU           RFU         RFU

1.0×105M             6.4           1200        1345

3.3×106M             2.4           451         456

1.1×106M             0.9           135         130

3.7×107M             0.3           44          48

1.2×107M             0.12          15.3        16.0

4.1×107M             0.14          4.9         5.1

1.4×108M             0.13          2.5         2.8

4.5×109M             0.12          0.8         0.9

数据表明,当荧光团从ODN上裂解下来时,相对荧光约增加200倍。

                        实施例4

制备标记的M13序列引物并证明标记的裂解

制备2,4,6-三氯三嗪衍生的寡核苷酸:1000μg 5′末端胺连接的 寡核苷酸(5′-己胺-TGTAAAACGACGGCCAGT-3′)(Seq.ID No.1) 与过量重结晶的氰尿酰氯在10%N-甲基吡咯烷酮碱性(较好pH8.3至 8.5)缓冲液中19至25℃下反应30至120分钟。终反应条件由0.15M 硼酸钠(pH8.3)、2mg/ml重结晶的氰尿酰氯和500μg/ml每种寡 核苷酸构成。在G50 Sephadex柱上经大小排阻层析除去未反应的氰尿酰 氯。

然后使活化的纯化的寡核苷酸与100倍过量的半胱胺在0.15M硼酸 钠(ph8.3)中室温反应1小时。在G50 Sephadex柱上经大小排阻层析 除去未反应的半胱胺。然后使衍生的ODN与各种酰胺反应。将所得的 ODN制品分成12份,每份与(25摩尔过量)下列酸的五氟苯酯反应(1) 4-甲氧基苯甲酸,(2)4-氟苯甲酸,(3)甲苯甲酸,(4)苯甲酸, (5)吲哚-3-乙酸,(6)2,6-二氟苯甲酸,(7)烟酸N-氧化物, (8)2-硝基苯甲酸,(9)5-乙酰水杨酸,(10)4-乙氧基苯甲酸, (11)肉桂酸,(12)3-氨基烟酸。反应在0.2M硼酸钠(pH8.3)中 37℃进行2小时。在G50 Sephadex上经凝胶排阻层析纯化衍生的ODN。

为了从寡核苷酸上裂解掉标记,将ODN调整到1×10-5摩尔然后在 TE(TE是0.01MTris,ph7.0,5mM EDTA)中用50%EtOH(VV) 进行稀释(12,3倍稀释)。向100μl体积ODN中加入25μl 1M二硫 苏糖醇(DTT)。一组同样的对照物中则不加DTT。室温下保温30分 钟。然后加NaCl至0.1M并加入2体积EtOH以沉淀ODN。以14,000g 于4℃下离心15分钟以除去溶液中的ODN。保留上清液,彻底干燥。 然后将沉淀物溶解于25μl MeOH。以质谱检测法检测沉淀物中标记的存 在。

用于本研究的质谱仪是外部离子源傅里叶变换质谱仪(FTMS)。 使为MALDI分析所制备的样品沉积到直接探子的尖端并插入到离子源 中。当激光脉冲照射样品时离子从该源中被抽提出来并通入长的四极离子 导槽中,由此将它们聚焦并输送到位于超导磁中心孔内的FTMS分析 仪小室中。

光谱产生如下信息。在下列分子量处强度从25到100相对强度单位 变化的峰:(1)指示4-甲氧基苯甲酸衍生物的212.1amu,(2)指 示4-氟苯甲酸衍生物的200.1amu,(3)指示甲苯酸衍生物的 196.1amu,(4)指示苯甲酸衍生物的182.1amu,(5)指示吲哚-3- 乙酸衍生物的235.2amu,(6)指示2,6-二氟苯甲酸衍生物的 218.1amu,(7)指示烟酸N-氧化物的199.1amu,(8)指示2-硝基 苯甲酰胺的227.1amu,(9)指示5-乙酰水杨酸衍生物的179.18amu, (10)指示4-乙氧基苯甲酸衍生物的226.1amu,(11)指示肉桂酸衍 生物的209.1amu,(12)指示3-氨基烟酸衍生物的198.1amu。

结果表明分子量(MW)鉴定剂从引物上被裂解下来并可用质谱法 检测。

                      实施例5

演示使用HPLC分离方、收集、裂解MW鉴定物、确定MW鉴定 物的质量(从而鉴定之)然后推断序列的测序过程

按实施例4中所述方法制备下示寡核苷酸:

DMO 767:′5-己胺 -TGTAAAACGACGGCCAGT-3′(Seq.ID No.1)

DMO 768:′5-己胺 -TGTAAAACGACGGCCAGTA-3′(Seq.ID No.2)

DMO 769:′5-己胺 -TGTAAAACGACGGCCAGTAT-3′(Seq.ID No.3)

DMO 770:′5-己胺 -TGTAAAACGACGGCCAGTATG-3′(Seq.ID No.4)

DMO 771:′5-己胺 -TGTAAAACGACGGCCAGTATGC-3′(Seq.ID No.5)

DMO 772:′5-己胺 -TGTAAA CGACGGCCAGTATGCA-3′(Seq.ID No.6)

DMO 773:′5-己胺 -TGTAAAACGACGGCCAGTATGCAT-3′(Seq.ID No.7)

DMO 774:′5-己胺 -TGTAAAACGACGGCCAGTATGCATG-3′(Seq.ID No.8)

各100μg 5′末端胺连接的上述寡核苷酸与过量的重结晶氰尿酰氯在 10%N-甲基吡咯烷酮碱性(最好pH8.3至8.5)缓冲液中于19℃至25 ℃反应30至120分钟。终反应条件由0.15M硼酸钠(pH8.3)、2mg /ml重结晶的氰尿酰氯和500μg/ml各种寡核苷酸构成。在G50 Sephadex柱上经大小排阻层析除去未反应的氰尿酰氯。

然后使活化了的纯化寡核苷酸与100倍过量的半胱胺在0.15M硼酸 钠(pH8.3)中室温反应1小时。在G50 Sephadex柱上经大小排阻层析 除去未反应的半胱胺。然后使衍生的ODN与下列的特定五氟苯基酯反 应:(1)DMO767与4-甲氧基苯甲酸,(2)DMO768与4-氟苯 甲酸,(3)甲苯酸,(4)DMO769与苯甲酸,(5)DMO770与吲 哚-3-乙酸,(6)DMO771与2,6-二氟苯甲酸,(7)DMO772与 烟酸N-氧化物,(8)DMO773与2-硝基苯甲酸。

将10ng八种衍生的ODN混合在一起并用HPLC按大小分离。将混 合物放在25μl蒸馏水中。将整个样品注射到下列柱上。使用LiChrospher 4000 DMAE,50-10mm柱(EM Separations,Wakefield,RI)。 洗脱液A是20mM Na2HPO4溶于20%ACN(pH7.4)中;洗脱液B是 洗脱液A+1M NaCl,pH7.4。流速是1ml/分钟,检测器是UV 280nm。 洗脱梯度如下:0分钟100%A+0%B,3分钟100%A+0%B,15分钟 80%A+20%B,60分钟0%A+100%B,63分钟0%A+100%B,65分 钟100%A+0%B,70分钟100%A+0%B。以0.5分钟间隔收集各洗脱 部分。

为了从寡核苷酸上裂解掉标记,向各洗脱部分(管)内加入100μl 0.05M二硫苏糖醇(DTT)。温室保温30分钟。然后加入NaCl至0.1M 并加入2体积EtOH以沉淀ODN。以14,000g 4℃离心15分钟以从溶液 中除去ODN,保留上清液,在真空下离心干燥完全。然后将沉淀饼溶解 于25μl MeOH中。以质谱法试验沉淀饼中MW鉴定剂的存在。利用如 实施例4中所述的同样MALDI技术。作为时间的函数在质谱中观察到下 列MW(标记):

管号#       时间        MWs        管号         时间      MWs

1          0.5         无          31          15.5     212.1

2          1.0         无          32          16       212.1

3          1.5         无          33          16.5     212.1

4          2.0         无          34          17       212.1;200.1

5          2.5         无          35          17.5     200.1

6          3.0         无          36          18       200.1

7          3.5         无          37          18.5     200.1

8          4.0         无          38          19       200.1;196.1

9          4.5         无          39          19.5     200.1;196.1

10         5.0         无          40          20       196.1

11         5.5         无          41          20.5     196.1

12         6.0         无          42          21       196.1;182.1

13         6.5         无          43          21.5     182.1

14         7.0         无          44          22       182.1

15         7.5         无          45          22.5     182.1;235.2

16         8.0         无          46          23       235.2

17         8.5         无          47          23.5     235.2

18         9.0         无          48          24       235.2;21 8.1

19         9.5         无          49          24.5     218.1

20         10.0        无          50          25       218.1

21         10.5        无          51          25.5     218.1;199.1

22         11          无          52          26       199.1

23         11.5        无          53          26.5     199.1;227.1

24         12          无          54          27       227.1

25         12.5        无          55          27.5     227.1

26         13          无          56          28       无

27         13.5        无          57          28.5     无

28         14          无          58          29       无

29         14.5        无          59          29.5     无

30         15          无          60          30       无

因此标记出现的时间顺序是212.1、200.1、196.1、181.1、 235.2、218.1、199.1、227.1。因为212.1amu指示4-甲氧基苯甲酸衍 生物,200.1指示4-氟苯甲酸衍生物、196.1amu指示甲苯酸衍生物, 182.1amu指示苯甲酸衍生物,235.2amu指示吲哚-3-乙酸衍生物, 218.1amu指示2,6-二氟苯甲酸衍生物,199.1amu指示烟酸N-氧化物衍 生物,227.1amu指示2-硝基苯甲酰胺,所以序列可推测为5′- ATGCATG-3′。

                       实施例6

演示以单一HPLC分离方法测定两个DNA样品的序列

本实施例中,以单一分离方法对两个DNA样品测序。

按实施例1中所述方法制备下列寡核苷酸:

DMO 767:′5-己胺    -TGTAAAACGACGGCCAGT-3′(Seq.ID No.1)

DMO 768:′5 己胺    -TGTAAAACGACGGCCAGTA-3′(Seq.ID No.2)

DMO 769:′5-己胺    -TGTAAAACGACGGCCAGTAT-3′(Seq.ID No.3)

DMO 770:′5-己胺    -TGTAAAACGACGGCCAGTATG-3′(Seq.ID No.4)

DMO 771:′5-己胺    -TGTAAAACGACGGCCAGTATGC-3′(Seq.ID No.5)

DMO 772:′5-己胺    -TGTAAAACGACGGCCAGTATGCA-3′(Seq.ID No.6)

DMO 775:′5-己胺    -TGTAAAACGACGGCCAGC-3′(Seq.ID No.9)

DMO 776:′5-己胺    -TGTAAAACGACGGCCAGCG-3′(Seq.ID No.10)

DMO 777:′5-己胺    -TGTAAAACGACGGCCAGCGT-3′(Seq.ID No.11)

DMO 778:′5-己胺    -TGTAAAACGACGGCCAGCGTA-3′(Seq.ID No.12).

DMO 779:′5-己胺    -TGTAAAACGACGGCCAGCGTAC-3′(Seq.ID No.13)

DMO 780:′5-己胺    -TGTAAAACGACGGCCAGCGTACC-3′(Seq.ID No.14)

各100μg 5′末端胺连接的上述寡核苷酸与过量的重结晶氰尿酰氯在 10%N-甲基吡咯烷酮碱性(最好pH8.3至8.5)缓冲液中于19℃至25 ℃反应30至120分钟。终反应条件由0.15M硼酸钠(pH8.3)、2mg /ml重结晶的氰尿酰氯和500μg/ml各种寡核苷酸构成。在G50 Sephadex柱上经大小排阻层析除去未反应的氰尿酰氯。

然后使活化了的纯化寡核苷酸与100倍过量的半胱胺在0.15M硼酸 钠(pH8.3)中室温反应1小时。在G50 Sephadex柱上经大小排阻层析 除去未反应的半胱胺。然后使衍生的ODN与下列的特定五氟苯基酯反 应:(1)DMO767与4-甲氧基苯甲酸和DMO773与烟酸N-氧化物, (2)DMO768与4-氟苯甲酸和DMO774与2-硝基苯甲酸,(3) 甲苯酸和DMO775与乙酰水杨酸,(4)DMO769与苯甲酸和DM776 与4-乙氧基苯甲酸,(5)DMO770与吲哚-3-乙酸和DM777与肉桂酸, (6)DMO771与2,6-二氟苯甲酸和DMO778与3-氨基烟酸。因此, 每组ODN有一个标记。

将10ng 120种衍生的ODN混合在一起并用HPLC按大小分离。将 混合物放在25μl蒸馏水中。将整个样品注射到下列柱上。使用 LiChrospher 4000 DMAE,50-10mm柱(EM Separations, Wakefield,RI)。洗脱液A是20mM Na2HPO4溶于20%ACN (pH7.4)中;洗脱液B是洗脱液A+1M NaCl,pH7.4。流速是1ml /分钟,检测器是UV 280nm。酰脱梯度如下:0分钟100%A+0%B, 3分钟100%A+0%B,15分钟80%A+20%B,60分钟0%A+100%B, 63分钟0%A+100%B,65分钟100%A+0%B,70分钟 100%A+0%B。以0.5分钟间隔收集各洗脱部分。

为了从寡核苷酸上裂解掉标记,向各洗脱部分(管)内加入100μl 0.05M二硫苏糖醇(DTT)。温室保温30分钟。然后加入NaCl至0.1M 并加入2体积EtOH以沉淀ODN。以14,000g 4℃离心15分钟以从溶液 中除去ODN,保留上清液,在真空下离心干燥完全。然后将沉淀饼溶解 于25μl MeOH中。以质谱法检测沉淀饼中MW鉴定剂的存在。利用如 实施例4中所述的同样MALDI技术。作为时间的函数在质谱中观察到下 列MW(标记):

管号##        时间      MWs          管号         时间     MWs

1            0.5       无           31           15.5     212.1,199.1

2            1.0       无           32           16       212.1,199.1

3            1.5       无           33           16.5     212.1,199.1

4            2.0       无           34           17       212.1;200.1,199.1,

                                                          227.1

5            2.5       无           35           17.5     200.1,199.1,227.1

6            3.0       无           36           18       200.1,227.1

7            3.5       无           37           18.5     200.1,227.1,179.18

8            4.0       无           38           19       200.1;196.1,179.18

9            4.5       无           39           19.5     200.1;196.1,179.18

10           5.0       无           40           20       196.1,179.18,226.1

11           5.5       无           41           20.5     196.1,226.1

12           6.0       无           42           21       196.1;182.1,226.1

13           6.5       无           43           21.5     182.1,226.1,209.1

14           7.0       无           44           22       182.1,209.1

15           7.5       无           45           22.5     182.1;235.2,209.1,

                                                          198.1

16           8.0       无           46           23       235.2,198.1

17           8.5       无           47           23.5     235.2,198.1

18           9.0       无           48           24       235.2;,198.1,218.1

19           9.5       无           49           24.5     218.1

20           10.0      无           50           25       218.1

21           10.5      无           51           25.5     无

22           11        无           52           26       无

23           11.5      无           53           26.5     无

24           12        无           54           27       无

25           12.5      无           55           27.5     无

26           13        无           56           28       无

27           13.5      无           57           28.5     无

28           14        无           58           29       无

29           14.5      无           59           29.5     无

30        15  无        60       30     无

组#1标记出现的时间顺序是212.1、200.1、296.1、182.1、 235.2、218.1、199.1、227.1,组#2标记出现时间顺序的是199.1、 227.1、179.1、226.1、209.1、198.1。因为212.1amu指示4-甲氧基 苯甲酸衍生物,200.1amu指示4-氟苯甲酸衍生物、196.1amu指示甲苯 酸衍生物,182.1amu指示苯甲酸衍生物,235.2amu指示吲哚-3-乙酸衍 生物,218.1amu指示2,6-二氟苯甲酸衍生物,199.1amu指示烟酸N-氧 化物衍生物,227.1amu指示2-硝基苯甲酰胺,179.18amu指示5-乙酰 水杨酸衍生物,226.1amu指示4-乙氧基苯甲酸衍生物,109.1amu指示 肉桂酸衍生物,且198.1amu指示3-氨基烟酸,所以第一个序列可推断为 -5′-TATGCA-3′-,且第二个序列可推断为-5′-CGTACC-3′。因此,有可 能每个分离步骤能测出一个以上DNA样品的序列。

                        实施例7

一组式R1-36-Lys(ε-1NIP)-ANP-Tfp化合物的制备

图3举例说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh 是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh 和L2的亚甲基基团,T具有其中赖氨酸的羧酸基团已连接到L2苄胺基团 的氮原子上形成酰胺键的模式结构,且分子量可变成分R1-36(其中这些 R基团相当于如本文定义的T2,并可通过本文所列出的任何一种特异性 羧酸被导入)通过赖氨酸的α-氨基基团连接,而质谱灵敏度增强子基团 (通过N-个基异哌啶甲酸导入的)则通过赖氨酸的ε-氨基基团结合。

参见图3:

步骤A.在ACT357的收集容器内用DMF悬浮NovaSyn HMP树脂(可 购自NovaBiochem;1当量)。加入溶于DMF的化合物I(得自ACT 的ANP;3当量)、HATU(3当量)和NMM(7.5当量)并将收集 容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF (2X)洗树酯。将I偶联到树脂上并重复洗涤步骤,得到化合物II。

步骤B.将树脂(化合物II)与DMF中的25%哌啶混合并振荡5分钟, 过滤树脂与DMF中的25%哌啶混合并振荡10分钟。除去溶剂,用NMP (2X)、MeOH(2X)和DMF(2X)洗树脂,并直接用于步骤C。

步骤C.将步骤B的去保护的树脂悬浮于DMF中并向其中加入DMF中 的FMOC保护的在其侧链中含有被保护官能团的氨基酸(Fmoc-赖氨酸 (Aloc)-OH,购自BeSeptive Biosystems;3当量)、HATU(3当 量)和NMM(7.5当量)。将容器振荡1小时。除去溶剂并用NMP (2X)、MeOH(2X)和DMF(2X)洗树酯。将Fmoc-Lys(Aloc) -OH偶联到树脂上并重复洗涤步骤,以得到化合物IV。

步骤D.用CH2Cl2(2X)洗树脂(化合物IV),然后悬浮在(PPh3)4Pd(0) (0.3当量)和PhSiH3(10当量)在CH2Cl2中的溶液中。将混合物振 荡1小时。除去溶剂并用CH2Cl2(2X)洗树脂。重复钯处理步骤。除 去溶剂并用CH2Cl2(2X)、溶于DMF中的N,N-二异丙基乙铵二乙 基二硫代氨基甲酸酯(2X)、DMF(2X)洗树酯,得到化合物V。

步骤E.将步骤D得到的去保护的树脂与步骤C中所述的N-甲基异哌啶 甲酸偶联,得到化合物VI。

步骤F.用ACT357收集容器中的Fmoc保护的树脂VI等分到36个反应 容器中,得到化合物VI1-36。

步骤G.按步骤B中所述使树脂(化合物VI1-36)与哌啶反应,以除去 FMOC基团。

步骤H.将步骤G的36等份去保护的树脂悬浮于DMF中。向各反应容 器中加入溶于DMF的适当的羧酸(R1-36CO2H;3当量)、HATU(3 当量)和NMM(7.5当量)。将容器振荡1小时。除去溶剂并用NMP (2X)、MeOH(2X)和DMF(2X)洗各等份的树酯。将R1-36CO2H偶联到树脂上并重复洗涤步骤,以得到化合物VIII1-36。

步骤I.用CH2Cl2(3X)洗各等份的树脂(化合物VIII1-36)。向各反应容器 内加入90∶5∶5的TFA∶H2O∶CH2Cl2并将容器振荡120分钟。将容剂从反 应容器过滤到各个试管中。用CH2Cl2(2X)和MeOH(2X)洗等分 的树脂并将滤液合并到各个试管内。在真空中蒸发各个试管,得到化合物 IX1-36。

步骤J.将各游离羧酸IX1-36溶解于DMF。向各溶液内加入吡啶(1.05 当量),然后加入三氟乙酸四氟苯基酯(1.1当量)。室温下将混合物搅 拌45分钟。用EtOAc稀释溶液,用5%NaHCO3水溶液(3X)洗,在 Na2SO4上干燥,过滤和真空蒸发,得到化合物X1-36。

                      实施例8

一组式R1-36-Lys(ε-1NIP)-NBA-Tfp化合物的制备

图4举例说明平行地合成一组36种T-L-X化合物(X=Lh),其中 Lh是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接 Lh和L2之间的直接键,其中Lh直接连接到L2基团的芳环上。T具有其 中赖氨酸的羧酸基团已被连接到L2苄胺基团氮原子上形成酰胺键的模式 结构,且分子量可变的成分R1-36(其中这些R基团相当于如本文定义的 T2,并可通过本文所列的任何一种特异性羧酸被导入)是通过赖氨酸的 α氨基基团被结合的,而质谱增强子基团(通过N-甲基异哌啶甲酸被导 入)则是通过赖氨酸的ε氨基基团结合的。

参见图4:

步骤A.按照实施例7的步骤A中所述的方法将NovaSyn HMP树脂偶联 到化合物I(按照Brown等,Molecular Diversity,1,4(1995))的 方法制备的NBA)上,得到化合物II。

步骤B-J.按照实施例7的步骤B-J所述处理树脂(化合物II),得到化 合物X1-36。

                        实施例9

一组式1INP-LYs(ε-R1-36)-ANP-Tfp化合物的制备

图5图解说明平行地合成一组36种T-L-X化合物(X=Lh),其中Lh 是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh 和L2的亚甲基基团,T具有其中赖氨酸的羧酸基团已被连接到L2苄胺基 团之氮原子上形成酰胺键的模式结构,且分子量可变的成分R1-36(其中 这些R基团相当于如本文定义的T2,并可通过本文所列的任何一种特异 性羧酸被导入)是通过赖氨酸的α氨基基团结合的,而质谱增强子基团(通 过N-甲基异哌啶甲酸被导入)则是通过赖氨酸的ε氨基基团结合的。

参见图5:

步骤A-C.同实施例7。

步骤D.按实施例7的步骤B中所述用哌啶处理树脂(化合物IV),以除 去FMOC基团。

步骤E.步骤D中树脂上保护的α-胺与实施例7步骤C中描述的N- 甲基异哌啶甲酸偶联,得到化合物V。

步骤F.同实施例7

步骤G.按实施例7步骤D所述用钯处理树脂(化合物VI1-36),以除 去Aloc基团。

步骤H-J.按实施例7中所述的同样方法制备化合物X1-36。

                       实施例10

一组式R1-36-Glu(γ-DIAEA)-ANP-Tfp化合物的制备

6图解说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh是 活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh和 L2的亚甲基基团,T具有其中谷氨酸的羧酸基团已被连接到L2苄胺基团 氮原子上形成酰胺键的模式结构,且分子量可变的成分R1-36(其中这些 R基团相当于如本文定义的T2,并可通过本文所列的任何一种特异性羧 酸被导入)是通过谷氨酸的α氨基基团被结合的,而质谱增强子基团(通 过2-(二异丙氨基)乙胺导入的)则是通过谷氨酸的γ-羧酸结合的。

参见图6:

步骤A-B.同实施例7。

步骤C.按实施例7的步骤C中所述的偶联方法使去保护的树脂(化合物 III)偶联到Fmoc-Glu-(OAl)-OH上,得到化合物IV。

步骤D.用CH2Cl2(2X)洗树脂(化合物IV)上的烯丙基酯并与 (PPh3)4Pd(O)(0.3当量)和N-甲基苯胺(3当量)在CH2Cl2中的溶液 混合。将混合物振荡1小时。除去溶剂并用CH2Cl2(2X)洗树脂。重 复钯处理步骤。除去溶剂并用CH2Cl2(2X)、溶于DMF中的N,N- 二异丙基乙铵二乙基二硫代氨基甲酸酯(2X)、DMF(2X)洗树酯, 得到化合物V。

步骤E.将得自步骤D的去保护的树脂悬浮在DMF中并经混合HATU (3当量)和NMM(7.5当量)而活化。将容器振荡15分钟。除去溶 剂并用NMP(1X)洗树脂。将树脂与2-(二异丙基氨基)乙胺(3当 量)和NMM(7.5当量)混合。将容器振荡1小时。将2-(二异丙基氨 基)乙胺偶联到树脂上并重复洗涤步骤,得到化合物VI。

步骤F-J.同实施例7。

                         实施例11

一组式R1-36-Lys(ε-1NIP)-ANP-Lys(ε-NH2)-NH2化合物的制备

图7图解显示平行地合成一组36种T-L-X化合物(X=Lh),其中 Lh是胺(特别是赖氨酸衍生残基的ε氨基基团),L2是邻硝基苄胺基团, L3是连接Lh和L2的氨甲酰取代的亚烷基氨基酰基亚烷基基团,T具有 其中赖氨酸的羧酸基团已被连接到L2苄胺基团氮原子上形成酰胺键的模 式结构,且分子量可变的成分R1-36(其中这些R基团相当于如本文定义 的T2,并可通过本文所列的任何一种特异性羧酸被导入)是通过赖氨酸 的α氨基基团结合的,而质谱增强子基团(通过N-甲基异哌啶甲酸被导 入)则是通过赖氨酸的ε氨基基团结合的。

参见图7:

步骤A.将Fmoc-Lys(Boc)-SRAM树脂(可得自ACT;化合物I) 与溶于DMF的25%哌啶混合并振荡5分钟。过滤树脂,然后与溶于DMF 的25%哌啶混合并振荡10分钟。除去溶剂,用NMP(2X)、MeOH (2X)和DMF(2X)洗树脂,并直接用于步骤B中。

步骤B.加入DMF中的树脂(化合物II)、ANP(可购自ACT;3当 量)、HATU(3当量)和NMM(7.5当量)并将收集容器振荡1小 时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗 树脂。将I偶联到树脂上并重复洗涤步骤,得到化合物III。

步骤C-J.按实施例7步骤B-I所述方法处理树脂(化合物III),得到化 合物X1-36。

                        实施例12

一组式R1-36-Lys(ε-Tfa)-Lys(ε-IINP)-ANP-Tfp化合物的制 备

图8图解显示平行地合成一组36个T-L-X化合物(X=Lh),其中 Lh是活化的酯(特别是四氟苯酯),L2是邻硝基苄胺基团且L3是连接 Lh和L2的亚甲基,T具有其中第一个赖氨酸的羧酸基团已连接到L2苄 胺基团氮原子上以形成酰胺键的模式结构,质谱灵敏度增强子基团(通过 N-甲基异哌啶甲酸导入的)通过第一个赖氨酸的ε-氨基基团结合,第二 个赖氨酸分子已通过第一个赖氨酸的α氨基基团被连接到第一个赖氨酸 上,分子量调整基团(具有三氟乙酰结构)则是通过第二个赖氨酸的ε氨 基基团结合的,并且分子量可变成分R1-36(这些R基团相当于本文定义 的T2,并且可通过本文所示出的任何特异性羧酸被导入)通过第二个赖 氨酸的α氨基基团被结合。

参见图8:

步骤A-E.这些步骤与实施例7的步骤A-E完全相同。

步骤F.按实施例7中步骤B所述方法用哌啶处理树脂(化合物VI), 以除去FMOC基团。

步骤G.使用实施例7的步骤C中所述的偶联方法将去保护的树脂(化 合物VII)偶联到Fmoc-Lys(Tfa)-OH上,得到化合物VIII。

步骤H-K.按实施例7步骤F-J所述处理树脂(化合物VIII),得到化合物 IX1-36。

                       实施例13

一组式R1-36-Lys(ε-1NIP)-ANP-5′-AH-ODN化合物的制备

图9举例显示了平行地合成一组36个T-L-X化合物(X=MOI, MOI是核酸片段,ODN),该组化合物衍生于实施例7的酯(其中X 是活化酯的其他T-L-X化合物可使用同样方法)。MOI通过磷酸二酯- 亚烷基胺基团借MOI的5′端连接到T-L上。

参见图9:

步骤A.按照Van Ness等,核酸研究,19,3345(1991)中所述的改良 的生物素化方法制备化合物XII1-36。向其中一种5′氨己基寡核苷酸(化 合物XI1-36,1mg)在200mM硼酸钠(pH8.3,250ml)中的溶液内 加入一种四氟苯基酯(得自实施例7的化合物X1-36,在250ml NMP中 100倍摩尔过量)。在室温下保温反应过夜。经Sephadex G50层析从化合 物XII1-36中除去未反应的和水解的四氟苯基酯。

                        实施例14

一组式R1-36-Lys(ε-1NIP)-ANP-Lys(ε-(MCT-5′-AH-ODN)) -NH2化合物的制备

图10举例显示平行地合成一组衍生于实施例11胺的36种T-L-X化 合物(X=MOI,MOI是核酸片段,ODN)(可使用同样方法制备其 X是胺的其他T-L-X化合物)。MOI通过磷酸二酯-亚烷基胺基团借MOI 的5′端连接到T-L上。

参见图10:

步骤A.按Van Ness等,核酸研究,19,3345(1991)中描述的方法制备 5′-[6-(4,6-二氯-1,3,5-三嗪-2-基氨基)己基]寡核苷酸XII1-36。

步骤B.向5′-[6-(4,6-二氯-1,3,5-三嗪-2-基氨基)己基]寡核 苷酸(化合物XII1-36)在100mM硼酸钠(pH8.3)中的1mg/ml浓 度溶液加入100倍摩尔过量的选自R1-36-Lys(ε-iNIP)-ANP-Lys(ε -NH2)NH2的伯胺(实施例11中的化合物X1-36)。室温下将溶液混合 过夜。使用H2O作为洗涤溶液(3X)通过300MW截留值的膜 (Amicon,Beverly,MA)超滤除去未反应的胺使体积减少到100ml 以分离化合物XIII1-36。

                       实施例15

演示使用CE分离方法、收集、裂解标记、测定标记的质量(进而鉴 定之)并推断序列的测序过程

本实施例中以单一分离方法测定两个DNA样品。 CE装置

CE装置是市售Applied Biosystem.Inc.(Foster City,CA)装置 的变体。其由封闭两个缓冲液小室的Plexiglas盒组成,其可用热控制单 位保持在恒定温度下。电泳所需的电压由高电压能源单元(Gamma High Voltage Researoh,Ormond Beach,FL)提供,其带有电磁安全联 装置,及改变外加电势的控制装置。使用手动真空泵产生通过毛细管的压 力差以完成对开口毛细管的样品注射(真空注射)。对于充填了凝胶的毛 细管,应用电场使样品电泳到管内(动电注射)。

充填凝胶的毛细管的制备

分离中使用在25cm有检测窗(已从毛细管上去除了聚酰亚胺涂层) 的50厘米熔合的二氧化硅毛细管(375mm o.d.,50mm i.d.,Polymicro Technologies,Phoenix,AZ)。毛细管的内表面是用(甲基丙烯酰氧基丙 基)三甲氧基甲硅烷(MAPS)(Sigma,St.Louis,MO)衍生化 的,以允许凝胶共价附着在毛细管壁上(Nashabeh等,Anal.Chem. 63:2148,1994)。简单地说,经用三氟乙酸、去离子水和丙酮连续流洗 以清洗毛细管。用丙酮洗后,使加在50/50水/乙醇溶液中的 0.2%MAPS溶液通过毛细管并在室温下放置30分钟。抽吸除去溶液并在 红外加热灯下将管干燥30分种。

按照改进的Huang等人(J.Chromatography 600:289,1992)的 方法在高压力下制造充凝胶的毛细管。这里所报告的所有研究中均使用 4%聚(丙烯酰胺)凝胶以及5%交联剂和8.3尿素。将3.8g丙烯酰胺、 0.20g N,N′-亚甲基双(丙烯酰胺)和50g尿素溶解在100ml TBE缓冲 液(90mM硼酸Tris,pH8.3,0.2mM EDTA)。用10ml N,N,N′,N′- 四甲基乙二胺(TEMED)和250ml 10%过硫酸铵溶液引发交联。使聚 合溶液快速通过衍生化的柱。然后将充填的毛细管放在装有水的1×m×1 /8in.i.d.×1/4in.o.d.试管中,使用HPLC泵使压力升高到400bar 并在此压力下保持过夜。逐渐释放压力并去出毛细管。使用前从柱的各末 端去除一短段毛细管。

DNA片段的分离和检测

在ABI370A DNA序列仪上分析以常规电泳法分离的DNA测序反应 物。该装置使用按制造高提供的说明制备的0.4mm厚的板变性尿素聚(丙 烯酰胺)凝胶板,从样品孔到检测区距离为26cm。按制造商所述方法利 用Tag聚合酶(Promega Corp.,Madison,WI)制备测序反应混合 物,并在按标准方法制备的M13mp19单链DNA模板上完成DNA测序 反应。将测序反应混合物贮存于-20℃暗处,并于上样之前在甲酰胺中90 ℃加热3分钟。按照制造商提供的说明用自动吸移器将其上载到370A 上,并在10,000V下10秒钟经动电注射加样到CE上。取出底部电极处 的所有液体并换以新的电解质,在电泳期间每10μl一份进行收集。

为了从寡核苷酸上裂解掉标记,向各管内加入100μl的0.05M二硫 苏糖醇(DTT)。室温下保温30分钟。加入NaCl至0.1M,并加入2 体积EtOH以沉淀ODN。以14,000g 4℃离心15分钟以从溶液中除去 ODN。保留上清液,真空下离心彻底干燥。然后将沉淀物溶解于25μl MeOH中。以质谱法检验沉淀物中标记的存在。利用实施例4中所述的 同样的MALDI技术。作为时间的函数观察质谱中所显示的下列分子量 (MW)(标记):

管号#      时间   MWs      管号       时间   MWs

1          1     无        31         31    212.1,

2          2     无        32         32    212.1,199.1

3          3     无        33         33    212.1,199.1

4         4     无        34        34  212.1;200.1,199.1,

                                        227.1

5         5     无        35        35  200.1,199.1,227.1

6         6     无        36        36  200.1,227.1

7         7     无        37        37  200.1,227.1,179.18

8         8     无        38        38  200.1;196.1,179.18

9         9     无        39        39  200.1;196.1,179.18

10        10    无        40        40  196.1,179.18,226.1

11        11    无        41        41  196.1,226.1

12        12    无        42        42  196.1;182.1,226.1

13        13    无        43        43  182.1,226.1,209.1

14        14    无        44        44  182.1,209.1

15        15    无        45        45  182.1;235.2,209.1,

                                        198.1

16        16    无        46        46  235.2,198.1

17        17    无        47        47  235.2,198.1

18        18    无        48        48  235.2;,198.1,218.1

19        19    无        49        49  218.1

20        20    无        50        50  218.1

21        21    无        51        51  无

22        22    无        52        52  无

23        23    无        53        53  无

24        24    无        54        54  无

25        25    无        55        55  无

26        26    无        56        56  无

27        27    无        57        57  无

28        28    无        58        58  无

29        29    212.1     59        59  无

30        30    212.1     60        60  无

组#1中标记出现的顺序是212.1、200.1、296.1、196.1、182.1、 235.2、218.1、199.1、227.1,组#2标记出现的顺序是199.1、227.1、 179.1、226.1、209.1、198.1。因为212.1amu指示4-甲氧基苯甲酸衍 生物,200.1amu指示4-氟苯甲酸衍生物、196.1amu指示甲苯酸衍生 物,182.1amu指示苯甲酸衍生物,235.2amu指示吲哚-3-乙酸衍生物, 218.1amu指示2,6-二氟苯甲酸衍生物,199.1amu指示烟酸N-氧化物衍 生物,227.1amu指示2-硝基苯甲酰胺,179.18amu指示5-乙酰水核酸 衍生物,226.1amu指示4-乙氧基苯甲酸衍生物,209.1amu指示肉桂酸 衍生物,且198.1amu指示3-氨基烟酸,所以第一个序列可推断为-5′- TATGCA-3′,且第二个序列可推断为-5′-CGTACC-3′。因此,有可能 每个分离步骤测出一个以上DNA样品的序列。

                         实施例16

              演示用质谱法同时检测多个标记

本实施例描述质谱检测法同时检测多个化合物(标记)的能力。在该 特定实施例中,将31种化合物与基质混合,沉积在固相载体上并干燥之, 然后用激光解吸。将所得到的离子导入质谱仪中。

等摩量混合下列化合物(购自Aldrich,Milwaukee,WI)以达到 0.002M的终浓度(每种化合物):苯甲酰胺(121.14)、烟酰胺(122.13)、 吡嗪酰胺(123.12)、3-氨基-4-吡唑羧酸(127.10)、2-噻酚羧酰胺 (127.17)、4-氨基苯甲酰胺(135.15)、甲苯酰胺(135.17)、6- 甲基烟酰胺(136.15)、3-氨基烟酰胺(137.14)、烟酰胺N-氧化物 (138.12)、3-羟吡啶酰胺(138.13)、4-氟苯甲酰胺(139.13)、 肉桂酰胺(147.18)、4-甲氧基苯甲酰胺(151.17)、2,6-二氟苯甲酰 胺(157.12)、4-氨基-5-咪唑羧酰胺(162.58)、3,4-吡啶二羧酰胺 (165.16)、4-乙氧基苯甲酰胺(165.19)、2,3-吡嗪二羧酰胺 (166.14)、2-硝基苯甲酰胺(166.14),3-氟-4-甲氧基苯甲酸 (170.4)、吲哚-3-乙酰胺(174.2)、5-乙酰水杨酰胺(179.18)、3, 5-二甲氧基苯甲酰胺(181.19)、1-萘乙酰胺(185.23)、8-氯-3,5- 二氨基-2-吡嗪羧酰胺(187.59)、4-三氟甲基苯甲酰胺(189.00)、5- 氨基-5-苯基-4-吡唑-羧酰胺(202.22)、1-甲基-2-苄基-丙二酸酯 (207.33)、4-氨基-2,3,5,6-四氟基甲酰胺(208.11)、2,3-萘二羧酸 (212.22)。将这些化合物以上述浓度放在DMSO中。然后将1μl材料 与α-氰基-4-羟基肉桂酸基质(1∶10,000稀释之后)混合并沉积到固体不 锈钢载体上。

然后使用Protein TOF质谱仪(Bruker,Manning Park MA)用 激光照射以使材料解吸,并以线性和反射操作模式检测所得离子。观察到 下列m/z值(图11):

121.1-->苯甲酰胺(121.14)

122.1-->烟酰胺(122.13)

123.1-->吡嗪酰胺(123.12)

124.1

125.2

127.3-->3-氨基-4-吡唑羧酸(127.10)

127.2-->2-噻吩羧酰胺(127.17)

135.1-->4-氨基苯甲酰胺(135.15)

135.1-->甲苯酰胺(135.17)

136.2-->6-甲基烟酰胺(136.15)

137.1-->3-氨基烟酰胺(137.14)

138.2-->烟酰胺N-氧化物(138.12)

138.2-->3-羟吡啶酰胺(138.13)

139.2-->4-氟苯甲酰胺(139.13)

140.2

147.3-->肉桂酰胺(147.18)

148.2

149.2

         4-甲氧基苯甲酰胺(151.17)

152.2

         2,6-二氟苯甲酰胺(157.12)

158.3

         4-氨基-5-咪唑-羧酰胺(162.58)

163.3

165.2-->3,4-吡啶-二羧酰胺(165.16)

165.2-->4-乙氧基苯甲酰胺(165.19)

166.2-->2,3-吡嗪二羧酰胺(166.14)

166.2-->2-硝基苯甲酰胺(166.14)

         3-氟-4-甲氧苯甲酸(170.4)

171.1

172.2

173.4

         吲哚-3-乙酰胺(174.2)

178.3

179.3-->5-乙酰水杨酰胺(179.18)

181.2-->3,5-二甲氧萘苯甲酰胺(181.19)

182.2-->

         1-萘乙酰胺(185.23)

186.2

         8-氯-3,5-二氨基-2-吡嗪羧酰胺(187.59)

188.2

189.2-->4-三氟甲基-苯甲酰胺(189.00)

190.2

191.2

192.3

         5-氨基-5-苯基-4-吡啶-羧酰胺(202.22)

2032

203.4

         1-甲基-2-苯基-丙二酸酯(207.33)

         4-氨基-2,3,5,6-四氟苯甲酰胺(208.11)

212.2-->2,3-萘二羧酸(212.22)

219.3

221.2

228.2

234.2

237.4

241.4

数据表明31种化合物中有21种出现在预期质量的范围中,31化合 物中有9种出现在超出预期质量范围有n+H质量(1个原子质量单位, amu)的范围中。后一种现象可能是由于化合物内胺的质子化作用。因 此31种化合物均可用MALDI质谱法检测。更重要的是,该实施例证明 可用质谱法同时检测多个标记。

单独α-氰基基质(图12)在146.2、164.1、172.1、173.1、189.1、 190.1、191.1、192.1、212.1、224.1、228.0、234.3处产生峰。光 谱中其他已鉴定的质量是由于所购买的化合物中因没有进一步纯化这些 化合物而带的污染物。

                       实施例17

用MW鉴定剂标记的引物、放射标记的引物、MW鉴定剂标记的双 脱氧终止子、荧光引物及荧光双脱氧终止子测序的方法

A. 测序凝胶的制备和电泳

实验方法如下所述。准备8M尿素和聚丙烯酰胺,根据下列配方 (100ml)制备4%、6%、或8%的聚丙烯酰胺凝胶。

                       4%          5%        6%

    脲                 48g          48         48g

    40%               10ml         12.5ml     15ml    丙烯酰胺/双丙烯酰胺

    10X MTBE           10ml         10ml       10ml

    ddH2O             42ml         39.5ml     37ml

    15%APS            500μl       500μl     500μl

    TEMED              50μl        50μl      50μl

尿素(550UA)得自Gibco/BRL(Gaithersburg,MD),所 有其他材料均得自Fisher(Fais Lawn,NJ)。简单地说,合并尿素、 MTBE缓冲液和水,于55℃保温5分钟,并搅拌以溶解尿素。迅速冷却 混合物,加入丙烯酰胺/双丙烯酰胺溶液并混合之,真空下将整个混合物 脱气5分钟。搅拌下加入APS和TEMED聚合剂。将完全的凝胶混合物 立即倒入有0.15mm间隔的粘有胶带的玻璃板之间。首先用 ALCONOXTM(New York,NY)去污剂和热水清洗,再用蒸馏水冲洗, 并干燥以制备平板。一般可用硅烷化剂处理并用双蒸水淋洗有凹槽的玻璃 平板。倒入之后,立即水平辅开凝胶,插入成孔梳,夹持固定,并使凝胶 至少聚合30分钟。在上样之前,除去凝胶底部周围的胶带和成孔梳。上 和下缓冲液小室夹到凝胶板上,并向小室内加入1 X MTBE电泳缓冲液 以组装垂直电泳装置。用含有电泳缓冲液的注射器充洗样品孔,并就在每 份样品上样之前,使用凝胶上样尖头向孔中充入电泳缓冲液以除去尿素。 使用带有凝胶上样尖头的自动吸移器(Rainin,Emeryville,CA)在 每个孔内装入1至2微升样品,然后按下列指示进行电泳(电泳期间用 扇冷却凝胶):

          终止反应聚丙烯酰胺凝胶          电泳条件

短        5%,0.15mm×50cm×20cm       22mA 2.25小时

长        4%,0.15mm×70cm×20cm       15mA 8.9小时

长        4%,0.15mm×70cm×20cm       15mA 20-24小时

将每个碱基特异性测序反应终止(短终止)混合物加样于0.15mm× 50cm×20cm变性5%聚丙烯酰胺凝胶上,以长终止混合物终止的反应 物一般分为两半并加样于两个0.15mm×70cm×20cm变性4%聚丙烯 酰胺凝胶上。

电泳后,从孔内除去缓冲液,除去胶带,分离凝胶平板。将凝胶转移 到一张40cm×20cm的3MM Whatwan纸上,盖以塑料包装纸,在Heefer (San Francisco,CA)凝胶干燥器上80℃干燥25分钟。使干燥的凝 胶对Kodak(New Hanen,CT)XRP-1胶片曝光。根据信号强度和 放射标记是32P或35S的不同,曝光时间从4小时到几天不等。曝光后, 在显影剂和固定剂溶液中处理使胶片显影,淋洗并风干。然后将放射显影 图放在光盒上手工读出序列,并将数据打入计算机。

使用标记的引物进行Tag聚合酶催化的循环测序。每次碱基特异性 循环测序反应一般都包括大约100或200ng分别用于A和C或G和T 反应的分离的单股DNA。双链循环测序反应相似地含有大约200或400ng 使用标准碱裂解法或硅藻土修饰的碱裂解法分离的质粒DNA。对预先等 分的-20℃储存的贮备溶液预混合,在一个吸移步骤中加入除模板DNA 外的所有试剂。将反应缓冲液与碱基特异性核苷酸混合物合并以制备反应 预混合液。使用前,融解碱基特异性反应预混液并与稀释的Taq DNA聚 合酶和个个末端标记的通用引物合并以产生终反应混合物。一旦制得了上 述混合物,将4等份单或双链DNA吸移到各相当于A、C、G和T反 应的0.2ml薄壁反应管的底部,然后向各管的旁侧管加入各个反应混合物 的等分样品。这些管是微量滴定板格式中一组96管/定位器托盘的一部 分,其可配合于Perkin Elmer Cetus循环仪9600(Foster City,CA)。 将带状帽封闭在管/定位器上并简单地离心平板。然后将平板放在加热 已预热到90℃的循环仪中,并立即开始循环程序。循环方案由15-30次:95 ℃变性,55℃退火;72℃延伸;95℃变性;72℃延伸;95℃变性及 72℃延伸步骤组成。最后是4℃浸泡。

在此阶段,可冷冻反应混合物并于-20℃贮存多达几天。在合并和沉 淀之前,简单地离心平板以复原凝集。将引物和碱基特异性反应混合物合 并到乙醇中,离心收集沉淀的DNA并干燥之。这些测序反应混合物可于 -20℃贮存几天。

测序反应的方案如下。对于A和C反应及G和T反应分别向0.2ml 薄壁反应试管的底部吸移1μl和2μl各DNA样品(M13模板为100ng /μl,pUC模板为200ng/μl)。AmpliTaq聚合酶(N801-0060)得 自Perkin-Elmer Cetus(Foster city,CA)。

制备用于24个克隆的30μl AmpliTaq(5U/μl)、30μl 5×Taq 反应缓冲液、130μl ddH2O和190μl稀释Taq的混合物。

向各碱基特异性核苷酸/缓冲液预混合液中加入碱基特异性引物和 稀释的Taq,以制备A、C、G和T碱基特异性混合物。

A,C/G,T

60/120μl              5X Taq循环测序混合物

30/60μl                 稀释的Taq聚合酶

30/60μl               各种荧光末端标记的引物

120/240μl

B. 使用MW鉴定剂标记的终止子反应进行Taq聚合酶催化的循环测序

DNA循环测序中的一个问题是,当使用引物时反应条件要使得重叠 片段分布高度依赖于反应混合物中的模板浓度。最近已观察到,使用标记 终止子的DNA循环测序反应的重叠片段分布对DNA浓度的敏感性,这 比用上述的标记引物反应所获得的敏感性低。另外,终止子反应每个引物 只需要一个反应管,而标记引物反应则四种终止子中每种都需要一个反应 管。下面描述的方案很容易与在本文中描述的96孔模板分离和96孔反 应纯化方法相对接。

在0.2ml PCR试管中放入0.5μg单链或1μg双链DNA。向各管内加 入1μl(单链模板)或4μl(双链模板)0.8μM引物和9.5μl ABI提供的 预混合液,并用ddH2O将终体积调到20μl。简单离心,并使用制造商所 述的终止子程序进行常规热循环(即96℃预热,然后进行25次96℃, 15秒;50℃,1秒;60℃,4分钟的循环,然后在4℃保持。下文描 述使用Centri-Sep柱(Amicon,Beverly,MA)或G50微量滴定 板方法开始进行的离心柱纯化。

C. 通过Centri-Sep柱进行终止子反应纯化

轻轻敲打柱使凝胶材料沉淀到柱的底部。去掉柱塞并加入0.75ml dH2O。塞住柱并倒转几次以混合之。在室温下使凝胶至少水合30分钟。 柱子可在4℃下贮存几天。使用前将已贮存于4℃下的柱升温至室温。 倒转柱以除去任何气泡并使凝胶沉积。先去掉上端帽,再去掉下端帽。借 助重力使柱渗水完全(注意:如不能立即开始流动,则用吸球对柱轻轻 施加压力)。将柱插入所提供的洗涤管中。在变速微量离心管中以1300g 离心2分钟以除去液体。从洗涤管中移出柱并将其插入到样品收集管内。 小心移出反应混合物(20μl)并加样于凝胶柱的顶上。如果样品在需覆 盖油的循环装置中保温,则要小心从油的下面移出反应混合物。要避免样 品上附着油,尽管样品中带有少量油(<1μl)也不影响结果。可使吸管 尖端小心触及清洁的表面(例如反应试管),以除去含有样品的吸管尖端 上的油。每个柱只使用一次。用固定的角转子在可变速度微量离心管中离 心,其间将柱按第一次离心时的同样方向放置。在真空离心管中干燥样 品。不要加热或过于干燥。必要时,可用乙醇沉淀反应混合物。

D. 通过Sephadex G50充填的微量滴定格式滤板进行终止子反应纯化

Sephadex(Pharmacia,Piscataway,NJ)会沉积;因此,必须 在加入到板上之前以及在充填8-10个孔之后重新悬浮之。向微量滴定滤 板的各孔内加入400μl混合的Sephadex G50。将微量滴定滤板放在微量 滴定板的顶上以收集水并用胶带在旁侧固定以使它们在离心期间不会飞 离。以1500rpm离心2分钟。弃去已收集到微量滴定板中的水。将微量 滴定滤板放在微量滴定板的顶上以收集水并用胶带在旁侧固定以使它们 在离心期间不会飞离。另外再加入100-200μl Sephadex G50以充填微量 滴定板孔。以1500rpm离心2分钟。弃去已收集在微量滴定板中的水。 将微量滴定滤板放在微量滴定板的管的顶上以收集水并侧加胶带以使它 们在离心期间不会飞离。向含Sephadex G50的各孔内加入20μl终止子 反应混合物。以1500rpm离心2分钟。将收集的流出液放在Speed-Vac 中保持约1-2小时。

用标记的终止子进行测序酶(SequenaseTM,UBS,Cleveland OH) 催化的测序反应。单链终止子反应需要大约2μg苯酚提取的M13模板 DNA。使DNA变性并于65℃保温DNA、引物和缓冲液以使引物退火。 将反应冷却到室后,加入α-硫代-脱氧核苷酸、标记的终止子及稀释的 Sequenase TM DNA聚合酶并将混合物于37℃保温。加入乙酸铵和乙醇以 终止反应,沉淀DNA片段并干燥之。为除去未掺入的终止子,用乙醇将 DNA沉淀物淋洗两次。干燥的测序反应混合物可在-20℃下贮存几天。

双链终止子反应需要大约5μg硅藻土修饰的碱裂解微量制备纯化的 质粒DNA。在氢氧化钠中65℃保温DNA以使双链DNA变性,保温后 加入引物并加入酸缓冲液中和反应混合物。然后加入反应缓冲液、α-硫 代-脱氧核苷酸、标记的染料-终止子和稀释的SequenaseTMDNA聚合酶 并在37℃下保温反应。加入乙酸铵以终止反应并沉淀DNA片段、淋洗、 干燥并贮存之。

对于单链反应:

向1.5ml微量离心管中加入下列成分:

   4μl                         ss DNA(2μg)

   4μl                          0.8μM引物

   2μl                        10×MOPS缓冲液

   2μl                     10×Mn2+/异柠檬酸盐缓冲液

   12μl

为使DNA变性并使引物退火,将反应混合物于65℃-70℃保温5分 钟。使反应冷却至室温并保持15分钟。然后简单离心以回复凝聚。向各 反应中加入下列试剂并于37℃保温10分钟。

     7μl         ABI终止子混合物(产品目录No.401489)

     2μl            稀释的Sequenase TM(3.25U/μl)

     1μl                    2mMα-S dNTP

     22μl

未稀释的SequenaseTM(产品目录N0.7735,United States Biochemicals,Cleveland,OH)是13U/μl,并在使用前用USB稀 释缓冲液稀释1∶4。加入20μl 9.5M乙酸铵和100μl 95%乙醇以终止反应 并混合之。

在冰水浴中经10分钟沉淀DNA。在微量离心管中4℃下以1,000g 离心15分钟。小心倾析上清,并加入300μl 70-80%乙醇淋洗沉淀物。混 合并再次离心15分钟,然后小心倾析上清。

重复淋洗步骤以确保有效地除去未掺入的终止子。在Speed-Vac中 将DNA干燥5-10分钟(或直到干燥),并将干燥后的反应混合物贮存 于-20℃下。

对于双链反应:

向1.5ml微量离心管中加入下列试剂:

    5μl                         ds DNA(5μg)

    4μl                           1N NaOH

    3μl                            ddH2O

将反应混合物于65℃-70℃保温5分钟,然后简单离心以回复凝聚。 向各反应中加入下列试剂,混合并简单离心:

    3μl                           8μM引物

    9μl                             ddH2O

    4μl                          MOPS酸缓冲液

向各反应中加入下列试剂并于37℃保温10分钟。

     4μl              10×Mn2+/异柠檬酸盐缓冲液

     6μl                     ABI终止子mi

     2μl            稀释的Sequenase TM(3.25U/μl)

     1μl                    2mM[α]-S-dNTP

     22μl

未稀释的SequenaseTM(united States Biochemicals)为13U/μl, 应在使用前用UBS按1∶4稀释。加入60μl 8M乙酸铵和300μl 95%乙醇 以终止反应并旋转混合之。在冰水浴中放置10分钟以沉淀DNA。在微 量离心管中以10,000g 4℃离心15分钟。小心倾析上清并加入300μl 80% 乙醇淋洗沉淀。混合样品并再次离心15分钟,然后小心倾析上清。重复 淋洗步骤以确保有效地去除未掺入的终止子。在Speed-Vac中将DNA干 燥5-10分钟(或直到干燥)。

E. 测序凝胶制备、预电泳、上样、电泳、数据收集及在ABI 373A DNA 测序仪上分析

按上述方法制备用于DNA测序的聚丙烯酰胺凝胶,不同的是在聚合 前过滤凝胶混合物。用热水、蒸馏水和乙醇小心清洗玻璃板以在加胶带前 除去可能存在的荧光污染物。将6%变性聚丙烯酰胺凝胶倾入0.3mm× 89cm×520cm加胶带的平板中并配以36孔梳。聚合后,去凝胶上的胶 带和梳并用热水清洗玻璃平板的外表面,并用蒸馏水和乙醇淋洗,将凝胶 装到ABI测序仪中,并经激光扫描检查之。如果在ABI相联的Macintosh 计算机显示器上观察到基线改变,则再次清洗平板。然后,接上缓冲液孔, 加入电泳缓冲液,并以30W将凝胶预电泳10-30分钟。上样前,经旋转 将合并并干燥的反应产物悬浮于甲酰胺/EDTA加样缓冲液中并于90℃ 加热。在Maclntosh计算机上的ABI数据收集软件内产生样品数据记录 纸,其标明上样样品的数目和用于序列数据处理的荧光标记的迁移率信 息。在用注射器清洁样品孔后,用配有偏平尖端凝胶上样端头的微量移液 器在各孔内加入奇数编号的测序反应混合物。将凝胶电泳5分钟,然后 再次清洁各孔并上样偶数编号的样品。用于染料引物和染料-终止子的滤 轮是ABI 373A CPU上标明的。一般电泳和数据收集是在配有热分布 板的ABI 373A上以30W进行10小时。数据收集之后,由ABI软件(其 将检测的荧光信号与相应的扫描数联系起来)产生影象信息。然后软件确 定基于信号强度的样品泳道位置。在示踪泳道后,提取并经基线减除、迁 移率计算、谱线去叠合和时间校正,处理各条泳道之数据的横截面。处理 后,使用NFS Share将序列数据资料转变至SPARCstation 2。

方案:使用36孔梳按上述方法制备8M尿素、4.75%聚丙烯酰凝胶。 在上样前,清洁平板的外表面。将凝胶平板组装到ABI 373A DNA测序 仪(Foster City,CA)上,以使低扫描线(通常为兰色)相当于如展 示在计算机数据收集窗上的800-1000强度值。如果四色扫描的基线不 平,则要重新清洗玻璃板。附加上铝热分布板。预电泳10-30分钟。制备 上样样品。向各管底部加入3μl FE,旋转混合,于90℃加热3分钟。并 离心以回复凝聚。使用注射器用电泳缓冲液冲洗样品孔。使用带偏平尖头 的凝胶上样吸管尖头上样每个奇数编号的样品。将凝胶至少预电泳5分 钟,再冲洗小孔,然后上样每个偶数编号的样品。开始电泳(30W,10 小时)。收集数据,ABI软件将自动打开数据分析软件,其将产生影象 凝胶档案,提取每个样品泳道的数据并加工数据。

F. 使用锚定poly(dT)引物对含长poly(A)尾cDNA克隆的双链测序

含有长poly(A)段cDNA的双链模板难以用退火poly(A)尾 下游的载体引物进行序列分析。用这些引物测序产生长poly(T)序列 梯,接者是可能难以读出的序列。为了防止这一问题的发生,设计三个在 3′末端含有(dT)17和(dA)或(dC)或(dG)的引物以“锚定”引物 并允许测定直接在poly(A)区上游区域的序列。使用这一方案,可得 到300bp以上的可读序列。使用poly(A)区上游的插入片段特异性引 物检测这些cDNA之相反链的序列。直接获得cDNA poly(A)尾紧上 游区序列的能力,对于大批量产生cDNA的序列标记位点(STS)是特 别重要的。

该方案如下所述。在DNA合成仪上合成3′端带有(dA)或(dC)或 (dG)锚的锚定poly(dT)17,并在寡核苷酸纯化柱(Amicon, Beverly,MA)上纯化后使用。为测定锚定引物的序列,于65℃保温 10分钟以使总体积50μl含有0.2M氢氧化钠和0.16mM EDTA的5-10μg 质粒DNA变性。加入三种poly(dT)锚定引物(各2pmol)并将混合 物立即放在冰上。加入5ml 5M乙酸铵(pH7.0)以中和该溶液。

加入150μl冷的95%乙醇沉淀DNA,并用冷的70%乙醇将沉淀物 洗两次。将沉淀物干燥5分钟后悬浮于MOPS缓冲液中。将溶液于65 ℃加热2分钟,然后经15-30分钟缓慢冷却至室温以使引物退火。按照上 述程序,使用修饰的T7 DNA聚合酶和α-[32P]dATP(>1000Ci /mmol)完成测序反应。

G. 基于PCR和随机鸟枪法克隆的cDNA测序

以下是基于PCR扩增、随机鸟枪法克隆和自动荧光测序的测定克隆 cDNA序列的方法。这种基于PCR的方法使用在通常的“通用”正向和 反向引导位点和Stratagene Bluescript载体之多克隆位点间的引物对。可 使用这两个PCR引物,即正向的5′-TCGAGGTCGACGGTATCG-3′ (Seq.ID No.15)或-16bs引物,和反向的5′-GCCGCTCTAGAACTAG TG-3′(Seq.ID No.16)或+19bs引物扩增在1.2至3.4kb大小范围的足 够量cDNA插入片段,从而可完成下述的随机鸟枪检测序方法。

以下是实验方案。保温在0.5ml带扣合帽试管中各含有约100ng质粒 DNA、各100皮摩尔引物、50mM KCl、10mM Tris-HCl pH8.5、 1.5mM MgCl2、各0.2mM dNTP及5单位PE-Cetus AmpliTaq的4份 100μl PCR反应混合物中,在PE-Cetus 48管DNA热循环仪中进行95 ℃1分钟、55℃1分钟和72℃2分钟的25次扩增循环。合并4份反应 混合物后,将含有PCR产物的含水溶液放在喷雾器中,加入约0.5至1.0ml 甘油将其体积调整到2.0ml,并将其在异丙醇/干冰或饱和NaCl水溶液 /干冰浴中放置10分钟,于-20℃平衡。经施加25-30psi氮气压(2.5 分钟)使样品于-20℃雾化。然后经乙醇沉淀以浓缩剪切的PCR产物, 将片段切成头平并与大肠杆菌DNA聚合酶的Klenow片段和T4多核苷 酸激酶按前述方法保温以使之磷酸化。从低熔点琼脂糖凝胶上洗脱得到长 度在0.4至0.7kb范围的片段。

从前述内容可以理解到,虽然本文为举例说明目的描述了本发明的特 定实施方案,但可在不背离本发明精神和范围的前提下作出各种改动。因 此,本发明不受所附权利要求以外的任何限制。

                     序列表

(1)一般信息:

   (i)申请人:Van Ness,Jeffrey

          Tabone,John C.

          Howbert.J.Jeffry

          Mulligan,John T.

   (ii)发明名称:测定核酸分子序列的方法和组合物

   (iii)序列数:16

   (iv)通信地址:

  (A)收信人:SEED和BERRY

  (B)街道:6300 Columbia Center,701 Fifth Avenue

  (C)城市:Seattle

  (D)州:Washington

  (E)国家:USA

  (F)邮编:98104-7092

(v)计算机可读形式:

  (A)介质类型:软盘

  (B)计算机:IBM PC兼容机

  (C)操作系统:PC-DOS/MS-DOS

  (D)软件:PatentIn Release#1.0.Version#1.30

(vi)当前申请数据:

  (A)申请号:

  (B)申请日:22-JAN-1997

   (C)分类号:

(viii)律师/代理人信息:

   (A)姓名:McMasters,David D.

   (B)登记号:33.963

   (C)参考/登录号:240052.416

 (ix)电讯信息:

   (A)电话:(206)622-4900

   (B)传真:(206)682-603 1

(2)SEQ ID NO:1的信息:

 (i)序列特征:

    (A)长度:18碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

 (xi)序列描述:SEQ ID NO:1

 TGTAAAACGA CGGCCAGT       18

(2)SEQ ID NO:2的信息:

  (i)序列特征:

    (A)长度:19碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:2

TGTAAAACGA CGGCCAGTA       19

(2)SEQ ID NO:3的信息:

 (i)序列特征:

   (A)长度:20碱基对

   (B)类型:核酸

   (C)链型:单链

   (D)拓扑结构:线性

 (xi)序列描述:SEQ ID NO:3

TGTAAAACGA CGGCCAGTAT      20

(2)SEQ ID NO:4的信息:

  (i)序列特征:

    (A)长度:21碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

 (xi)序列描述:SEQ ID NO:4

TGTAAAACGA CGGCCAGTAT G      21

(2)SEQ ID NO:5的信息:

  (i)序列特征:

    (A)长度:22碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

 (xi)序列描述:SEQ ID NO:5

TGTAAAACGA CGGCCAGTAT GC  22

(2)SEQ ID NO:6的信息:

  (i)序列特征:

    (A)长度:23碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

   (xi)序列描述:SEQ ID NO:6

 TGTAAAACGA CGGCCAGTAT GCA      23

 (2)SEQ ID NO:7的信息:

   (i)序列特征:

     (A)长度:24碱基对

     (B)类型:核酸

     (C)链型:单链

     (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:7

TGTAAAACGA CGGCCAGTAT GCAT    24

(2)SEQ ID NO:8的信息:

   (i)序列特征:

     (A)长度:25碱基对

     (B)类型:核酸

     (C)链型:单链

     (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:8

TGTAAAACGA CGGCCAGTAT GCATG   25

(2)SEQ ID NO:9的信息:

   (i)序列特征:

     (A)长度:18碱基对

     (B)类型:核酸

     (C)链型:单链

      (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:9

TGTAAAACGA CGGCCACG             18

(2)SEQ ID NO:10的信息:

   (i)序列特征:

      (A)长度:19碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:10

TGTAAAACGA CGGCCAGCG            19

(2)SEQ ID NO:11的信息:

  (i)序列特征:

     (A)长度:20碱基对

     (B)类型:核酸

     (C)链型:单链

     (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:11

TGTAAAACGA CGGCCAGCGT           20

(2)SEQ ID NO:12的信息:

  (i)序列特征:

    (A)长度:21碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

   (xi)序列描述:SEQ ID NO:12

 TGTAAAACGA CGGCCAGCGT A           21

 (2)SEQ ID NO:13的信息:

   (i)序列特征:

     (A)长度:22碱基对

     (B)类型:核酸

     (C)链型:单链

     (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:13

TGTAAAACGA CGGCCAGCGT AC          22

(2)SEQ ID NO:14的信息:

   (i)序列特征:

     (A)长度:23碱基对

     (B)类型:核酸

     (C)链型:单链

     (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:14

TGTAAAACGA CGGCCAGCGT ACC         23

(2)SEQ ID NO:15的信息:

  (i)序列特征:

     (A)长度:18碱基对

     (B)类型:核酸

     (C)链型:单链

     (D)拓扑结构:线性

  (xi)序列描述:SEQ ID NO:15

TCGAGGTCGA CGGTATCG               18

 (2)SEQ ID NO:16的信息:

   (i)序列特征:

      (A)长度:18碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

   (xi)序列描述:SEQ ID NO:16

  GCCGCTCTAG AACTAGTG               18

QQ群二维码
意见反馈