首页 / 专利库 / 诊断设备和程序 / 多重检测 / 检索和确定表达信使RNAs的相对浓度的方法

检索和确定表达信使RNAs的相对浓度的方法

阅读:173发布:2023-02-09

专利汇可以提供检索和确定表达信使RNAs的相对浓度的方法专利检索,专利查询,专利分析的服务。并且在一个mRNA库中进行同步序列特异的mRNAs鉴定的一个改进方法,该方法允许通过一个组织表达的几乎每个mRNA在一个凝胶上作为一个明显条带是可见的,该条带的强度大致和mRNA的浓度相对应。总的说来,该方法包括用锚定引物固定3’-末端点的cDNA的形成,从克隆插入产生克隆插入 片段 ,制备cRNA,从cRNA转录cDNA,而且进行两个cDNA的序列特异的PCR的扩增。在一个优先可取的具体体现中,本方法包括比较PCR产物的长度和至少核苷酸序列的一部分和来源于核苷酸序列 数据库 所确定的期望的数值。本方法能鉴定mRNA表达的变化同药物的配给或生理学或病理学的情况的联系。对于改进方法的应用有用的载体和引物也被提供了。,下面是检索和确定表达信使RNAs的相对浓度的方法专利的具体信息内容。

1.一种在一个mRNA库中进行mRNAs的同步序列特异的鉴定的改进方 法,其包括以下的步骤:
(a)用一个混合的锚定引物从一个mRNA库中制备一个双链cDNA库, 每一个锚定引物含有一个5’末端和一个3’末端,且其包括(i)7-40T 残基的一段序列;(ii)识别6个以上基的第一个限制性内切酶切割的 位点,该切割位点朝向5’末端定位是和T残基的序列相关的;(iii) 从4到40个核苷酸的第一个填充片段,该第一个填充片段被定位朝向于 与被第一个限制性内切酶切割位点相关的5’-末端;(iv)第二个填充片 段,其插入识别6个以上碱基被第一个限制性内切酶切割位点和T残基的 序列之间;和(v)从由-V、-V-N和-V-N-N组成的小组中选择的每个锚 定引物相变残基被定位在3’-末端,其中V是从由A、C和G组成小组中 筛选的脱核糖核苷酸;N是从由A、C、G和T组成的小组中筛选的脱氧 核糖核苷酸,包含有锚定引物的混合物含有所有的V和N的可能;
(b)用第一个限性内切酶和第二个限制性内切酶切下双链cDNA库,该 第二个限制性内切酶识别一个4-核苷酸序列,形成了一个分别有第一和 第二个末端的双链cDNA分子库;
(c)来源于步骤(b)的每个双链cDNA分子在一个方向被插入进一个 载体,其对于噬菌体特异的启动子是反意义的,在载体中形成了含有插入 cDNA分子的构建库,因此分别确定邻接插入cDNA有意义链的5’末端和 有意义链的3’末端的5’、3’侧翼载体的序列,而且所述的有一个3’ 侧翼载体序列的构建至少在所述的第一个限制性内切酶位点和限定的在 所述启动子中转录起始位点间有15个核苷酸长度;
(d)用被切割的cDNA插入载体转化的宿主细胞,以产生含有克隆插 入的载体;
(e)用至少一种或不能识别插入的cDNA分子,或不能识别噬菌体特 异的启动子序列,但能识别载体上序列的限制性内切酶消化在步骤(c) 中产生的构建库,这样就产生了含有插入的cDNA分子的线性片断,这样 产生的线性片段有一个至少在载体5’到双链cDNA分子第二个末端的15 个核苷酸的5’侧翼载体序列;
(f)通过温育线性片段和一个具有起始从噬菌体特异的启动子转录 能的噬菌体特异的RNA聚合酶,产生了反义cRNA转录的一个cRNA的 制备;
(g)用一个反转录酶,和一个15-30个核苷酸长且包括由和5’侧 翼体序列互补的核苷酸序列的5’反转录引物,通过转录cRNA产生第一 链cDNA;
(h)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物,第一次聚合酶链式 反应用第一个3’PCR引物是15-30核苷酸长,它和在第一个限制性内的 切酶位点和通过噬菌体特异的启动子确定转录起始位点之间的3’侧翼载 体序列互补,第一个5’PCR引物被限定有-N1组成的3’-末端,其中“N” 是四种脱氧核糖核苷酸A、C、G或T中的一个,第一个5’PCR引物是15-30 个核苷酸长,且和5’侧翼的载体序互补,同时,第一个5’PCR引物的 互补延伸进cRNA的特异插入核苷酸中的一个核苷酸,在此第一个5’PCR 引物的一个不同引物被用在四个不同亚库中的每一个中;
(i)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物,在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它与在第一个限制性内切酶位点和通过噬菌体特异的 启动子确定转录起始位点之间的3’侧翼载体序列互补,第二个5’PCR 引物被限定有一个由-N1-Nx组成的3’-末端,在此N1和用在第一次聚合 酶链式反应中对于那个亚库的N1是一样的,“N”象在步骤(h)中一样, “x”是从1到5的整数,这个引物长度是15-30个核苷酸长,而且和5’ 侧翼载体序列互补,同时引物互补延伸以核苷酸数量相当于“x”+1插入 cRNA的特异插入核苷酸,在此,第二5’PCR引物中每个不同引物被用在 第二系列亚库的不同的亚库中,而且在第一套亚库中每一个亚库在第二系 列中有4x亚库;
(j)分析第二套PCR产物产生了一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示。
2、根据权利要求1的方法,其中一个生物素部分被共轭连到锚定引 物上。
3、根据权利要求2的方法,其中所述生物素部分被共轭连到锚定引 物5’末端。
4、根据权利要求2的方法,其中所述第一个限制性的cDNA是从通过 用一个包被抗生蛋白的底物接触第一个限制性的cDNA在权利要求1中的 步骤b中cDNA的剩余部分分离的。
5、根据权利要求1的方法,其中所述在第一个5’PCR引物的3’末 端的3核苷酸通过硫代磷酸酯连接。
6、根据权利要求1的方法,其中所述在第二个5’PCR引物的3’末 端的3核苷酸通过硫代磷酸酯连接。
7、根据权利要求1的方法,其中所述在第一个和第二个5’PCR引物 的3’末端的3核苷酸通过硫代磷酸酯连接的。
8、根据权利要求1的方法,其中所述第二个PCR反应的引物被共轭 连上一个荧光标签。
9、根据权利要求8的方法,其中所述荧光标签是从下面小组的组成 中选择的:
螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,6-羧酸,3’,6’ -二羟基-6-羧基荧光素;
螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,5-羧酸,3’,6’ -二羟基-5-羧基荧光素;
螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,3’,6’-二羟 基荧光素;
9-(2,5-二羧基苯基)-3,6-二(二甲苯基)-呫吨鎓-6-羧基四甲 基若丹明;
3,6-二氨基-9-(2-羧基苯就基)-呫吨鎓;
螺旋[异苯并呋喃-1(3H),9’-呫吨]-6-羧酸,5’-二氯-3’,6’- 二羟基-2’,7’-二甲氧基-3-氧代-;
1H,5H,11H,15H-呫吨o[2,3,4-ij:5,6,7-i’j’]二喹嗪-8- 鎓,-(2,4-二硫苯基)-2,3,6,7,12,13,16,17-八氢,内盐;
6-((4-4-二氟-5,7-二甲基-4--3a,4a-二氮-s-indacene-3-丙酰) 氨基)己酸;
6-((4,4-二氟-1,3-二甲基-5-(4-甲氧基苯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酰)氨基)-己酸;
6-(((4-(4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮 -s-indacene-3-基)苯氧)乙酰)氨基)-己酸;
4,4-二氟-4-硼-3a,4a-二氮-s-indacene-3-戊酸;
4,4-二氟-5,7-二甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酸;
4,4-二氟-5-苯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸;
4,4-二氟-5(4-苯基-1,3-丁二烯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酸;
4,4-二氟-5-苯乙烯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸;
6-(((4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸;
6-(((4,4-二氟-5-(2-吡咯基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸;
9-(2,4(或2,5)-二羧基苯基)-3,6-二(二甲氨基)-呫吨鎓,内 盐;以及
4,7,2’,4’,5’,7’六氯-6-羧基荧光素和4,7,2’,7’四氯-6-羧 基荧光素。
10、根据权利要求1的方法,其中所述宿主细胞是大肠杆菌细胞。
11、根据权利要求1的方法,其中所述在步骤(a)中的相变残基是 -V-N-N。
12、根据权利要求1的方法,其中所述在步骤(a)中的相变残基是 -V-N。
13、根据权利要求1的方法,其中所述在步骤(a)中的相变残基是 -V。
14、根据权利要求1的方法,其中所述在步骤(i)中的“x”是3。
15、根据权利要求1的方法,其中所述在步骤(i)中的“x”是1。
16、根据权利要求1的方法,其中所述在步骤(a)中的相变残基是 -V-N-N,而且在步骤(i)中的“x”是3。
17、根据权利要求1的方法,其中所述在步骤(a)中的相变残基是 -V,而且在步骤(i)中的“x”是2。
18、根据权利要求1的方法,其中所述每个锚定引物在T残基区有 18个T残基。
19、根据权利要求1的方法,其中所述锚定引物的第一个填充片段长 度是14个残基。
20、根据权利要求1的方法,其中所述第一个填充片段的序列是 G-A-A-T-T-C-A-A-C-T-G-G-A-A(SEQ ID NO:2)。
21、根据权利要求1的方法,其中所述噬菌体特异的启动子是从由 T3启动子、T7启动子、和SP6启动子组成的小组中筛选的。
22、根据权利要求1的方法,其中所述噬菌体特异的启动子是T3启 动子。
23、根据权利要求1的方法,其中所述从cRNA的cDNA的转录设计的 引物序列是A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G(SEQ ID NO:14)。
24、根据权利要求1的方法,其中所述载体是用ClaI和NotI切割的 质粒pBC SK+,在步骤(h)和(i)中3’PCR引物是 G-A-G-C-T-C-C-A-C-C-G-C-G-T(SEQ ID NO:47)。
25、根据权利要求1的方法,其中所述载体是用ClaI和NotI切割的 质粒粒pBC SK+,在步骤(h)和(i)中3’PCR引物是 G-A-G-C-T-C-G-T-T-T-T-C-C-C-A-G(SEQ ID NO:48)。
26、根据权利要求1的方法,其中所述识别一个4-核苷酸序列的第 二个限制性内切酶是MspI。
27、根据权利要求1的方法,其中所述识别一个4-核苷酸序列的第 二个限制性内切酶是从由MboI、DpnII、Sau3AI、Tsp509I、HpaII、BfaI、 Csp6I、MseI、HhaI、NlaIII、TaqI、MspI、MaeII、Sau3AI、Bg1II和 HinP1I所组成的小组中筛选的。
28、根据权利要求1的方法,其中所述识别6个以上碱基的第一个限 制性内切酶是从由AscI、BaeI、FseI、NotI、PacI、PmeI、PpuMI、RsrII、 SapI、SexAI、SfiI、SgfI、SgrAI、SrfI、Sse8387I和SwaI所组成的小 组中筛选的。
29、根据权利要求1的方法,其中所述识别6个以上碱基的第一个限 制性内切酶是NotI。
30、根据权利要求1的方法,其中所述用在步骤(e)中的限制性内 切酶有一个含有用在步骤(b)中的第二个限制性内切酶的4-核苷酸序列 的一个核苷酸序列的识别。
31、根据权利要求30的方法,其中所述第二个限制性内切酶是MspI, 且用在步骤(e)中的限制性内切酶是SmaI。
32、根据权利要求30的方法,其中所述第二个限制性内切酶是TaqI, 且用在步骤(e)中的限制性内切酶是XhoI。
33、根据权利要求30的方法,其中所述第二个限制性内切酶是 HinP1I,且用在步骤(e)中的限制性内切酶是NarI。
34、根据权利要求30的方法,其中所述第二个限制性内切酶是MaeII, 且用在步骤(e)中的限制性内切酶是AatII。
35、根据权利要求30的方法,其中所述第二个限制性内切酶是 Sau3AI,且用在步骤(e)中的限制性内切酶是Bg1II。
36、根据权利要求30的方法,其中所述第二个限制性内切酶是 NlaIII,且用在步骤(e)中的限制性内切酶是NcoI。
37、合适于权利要求1所述方法应用的一个载体,其中步骤(c)的 载体是一个环形DNA分子形式,其具有在载体填充序列侧翼的第一和第二 载体限制性内切酶位点,而且进一步包括在第一和第二载体限制性内切酶 位点用限制性内切酶切割载体的消化载体的步骤。
38、根据权利要求37的载体,其中所述填充序列包含有在第一和第 二载体限制性内切酶位点之间的一个内部载体填充限制性内切酶位点。
39、根据权利要求38的载体,其中所述步骤(e)包括用一个限制性 内切酶在内部载体填充限制性内切酶位点切割载体的载体消化。
40、一种载体,其是从由质粒pBC SK+/DGT1、pBS SK+/DGT2、pBS SK+/DGT3、pBC SK+/DGT4和pBS SK+/DGT5组成的小组中筛选的
41、一种载体,其含有一个多克隆位点的从由SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13组成的小组 中筛选的。
42、根据权利要求1的方法,其中所述对于多聚腺苷mRNA物种,mRNA 库被丰富了。
43、根据权利要求1的方法,其中所述扩增片段在步骤(j)的分离 分析是通过电泳显示产物进行的。
44、根据权利要求43的方法,其中所述在电泳后显示的产物的强度 几乎和在原始混合物中产物相应的mRNAs的丰度呈比例。
45、根据权利要求43的方法,其进一步包括在电泳后,从产物相对 应于mRNA的强度确定在原始混合物中每个mRNA相对丰度的步骤。
46、根据权利要求43的方法,其中所述通过电泳分离分析聚合酶链 式反应扩增产物片段的步骤,包括在至少两个凝胶上的片段的电泳。
47、根据权利要求40的方法,其进一步包括以下步骤:
(k)洗脱至少一个与来源于电泳图谱中的mRNAs相对应的cDNA,其中 代表出现在样品中的3’-末端的mRNAs的条带被显示;
(l)在一个聚合酶链式反应中扩增洗脱的cDNA;
(m)克隆扩增的cDNA进入一个质粒中;
(n)生产来源于质粒的同克隆的DNA相对应的DNA;
(o)测序克隆cDNA。
48、包括以下步骤的在一个mRNA库中进行同步序列特异的mRNAs鉴 定的改进方法:
(a)分离一个mRNA库;
(b)用一个混合的锚定引物从mRNA库中制备一个双链cDNA库,其中 每个锚定引物有一个5’末端和一个3’末端,以及包括(i)一个从7至 40T残基的序列;(ii)被识别8个碱基的第一个限制性内切酶切割的位 点,该切割位点朝向5’-末端定位是和T残基的序列相关的;(iii)从 4到40个核苷酸的第一个填充片段,该第一个填充片段被定位朝向于与 被第一个限制性内切酶切割位点相关的5’-末端;(iv)第二个填充片段 插入识别6个以上碱基被第一个限制性内切酶切割位点和T残基的序列之 间;和(v)由被定位在每个锚定引物的3’末端的-V、-V-N或-V-N-N之 一限定的相变残基,其中V是从由A、C和G组成的小组中筛选的脱氧核 糖核苷酸;N是从由A、C、G和T组成的小组中筛选的脱氧核糖核苷酸, 包含有锚定引物的混合物含有所有的V和N的可能;
(c)用第一个限性内切酶和第二个限制性内切酶切下双链cDNA库,第 二个限制性内切酶识别一个4-核苷酸序列,形成了一个分别具有第一和 第二个末端的双链cDNA分子库;
(d)来源于步骤(b)的每个双链cDNA分子在一个方向上被插入进一 个载体,其对于一个T3启动子是反意义的,在载体中形成了含有插入cDNA 分子的构建库,因此分别确定邻接插入cDNA有意义链的5’末端和有意 义链的3’末端的5’、3’侧翼载体的序列,而且所述有一个3’侧翼载 体序列的构建在所述第一个限制性内切酶位点和限定的在所述启动子中 转录起始位点之间至少有15个核苷酸长度;
(e)用被切割的cDNA插入载体转化的大肠杆菌以产生含有克隆插入 的载体;
(f)用至少一种或不能识别插入的cDNA分子中的序列,或不能识别 T3启动子中的序列的限制性内切酶消化在步骤(c)中产生的构建库,这 样就产生了含有插入的cDNA分子的线性片断。
(g)通过温育线性片段和一个具有起始从T3启动子转录能力的T3 RNA聚合酶,产生了反义cRNA转录的一个cRNA的制备;
(h)用一个反转录酶,和一个15-30个核苷酸长且由和5’侧翼载 体序列互补的核苷酸序列组成的5’反转录引物,通过转录cRNA产生第 一链cDNA;
(i)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物,第一次聚合酶链式 反应用第一个3’PCR引物是15-30核苷酸长,它和位于第一个限制性内 切酶位点和限定由T3特异性启动子转录起始的位点之间的3’侧翼载体 序列互补,第一个5’PCR引物被限定有-N1组成的3’末端,其中“N” 是四种脱氧核糖核苷酸A、C、G或T中的一个,该第一个5’PCR引物是 15-30个核苷酸长,且和5’侧翼的载体序互补,同时,第一个5’PCR 引物的互补延伸进cRNA的特异插入核苷酸中的一个核苷酸,在此第一个 5’PCR引物的一个不同引物被用在四个不同亚库中的每一个中;
(j)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物,在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它和位于第一个限制性内切酶位点和限定由T3特异 性启动子转录起始的位点之间的3’侧翼载体序列互补,第二个5’PCR 引物被限定有一个由-N1-Nx组成的3’-末端,在此N1和用在第一次聚合 酶链式反应中对于那个亚库的N1是一样的,“N”象在步骤(i)中一样, x是由3和4组成的小组中选择的,这个引物长度是15-30个核苷酸,而 且和5’侧翼载体序列互补,同时引物互补延伸以核苷酸数量相当于“x” +1的插入cRNA的特异插入核苷酸,在此,第二5’PCR引物中每个不同 引物被用在第二系列亚库的不同的亚库中,而且对每一个亚库,在第二系 列亚库中有4x亚库;
(k)分析第二套PCR产物产生了一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示。
49、根据权利要求48的方法,其中所述48个锚定引物的混合物具有 A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(SEO ID NO:5)的序列。
50、根据权利要求48的方法,其中所述48个锚定引物的混合物具有 G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(SEQ ID NO:8)的序列。
51、根据权利要求48的方法,其中所述12个锚定引物的混合物具有 A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID NO:4)的序列。
52、根据权利要求48的方法,其中所述12个锚定引物的混合物具有 G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID No:7)的序列。
53、根据权利要求的48方法,其中所述3个锚定引物的混合物具有 A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO:3)的序列。
54、根据权利要求48的方法,其中所述3个锚定引物的混合物具有 G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO:6)的序列。
55、根据权利要求48的方法,其中所述第一个限制性内切酶是MspI, 第二个限制性内切酶是NcotI。
56、根据权利要求48的方法,其中所述第一个5’PCR引物是 G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N(SEQ ID NO:22)。
57、根据权利要求48的方法,其中所述第一个3’PCR引物和第二个 3’PCR引物是G-A-G-C-T-C-C-A-C-C-G-C-G-T(SEQ ID NO:47)。
58、根据权利要求48的方法,其中所述步骤(j)中的“x”是3。
59、根据权利要求48的方法,其中所述步骤(j)中的“x”是4。
60、一种检测在组织中mRNA表达模式的变化和生理学或病理学变化 的关系的方法,其包括以下步骤:
(a)获得没有受到生理学或病理学变化的一个组织的第一个样品;
(b)从第一个样品中分离一个mRNA库;
(c)通过进行权利要求1的(a)-(j)步骤产生代表在第一个样品中出 现的mRNAs的3’-末端的第一个特异序列产物的显示,确定在组织的第 一个样品中mRNA表达的模式;
(d)获得受到生理学或病理学变化的一个组织的第二个样品;
(e)从第二个样品中分离一个mRNA库;
(f)通过进行权利要求1的(a)-(j)步骤产生代表在第二个样品中出 现的mRNAs的3’-末端的第二个特异序列产物的显示,确定在组织的第 二个样品中mRNA表达的模式;
(g)比较第一和第二个显示以确定生理学或病理学上变化对组织中 mRNA表达模式的影响。
61、根据权利要求60的方法,其中所述生理学或病理学上的变化是 从通过转录因子、细胞内第二信使、激素、神经递质、生长因子和神经调 质、细胞-细胞接触、细胞-底物接触、细胞-胞外基础接触、及在细胞膜 和细胞骨架之间接触所介导的过程中筛选的。
62、根据权利要求60的方法,其中所述组织来源于一个中枢神经系 统。
63、根据权利要求62的方法,其中所述生理学或病理学上的变化是 从由老年痴呆症、帕金森神经功能障碍、局部缺血、嗜酒、吸毒成瘾、精 神分裂症、肌萎缩性侧索硬化、多重硬化、抑郁症、双极躁狂抑郁障碍所 组成的小组中筛选的。
64、根据权利要求62的方法,其中所述生理学或病理学上的变化和 学习、记忆、情绪、谷氨酸脱氢酶神经中毒、进食行为、嗅觉、视觉和活 动障碍、病毒感染电休克疗法、或药物的配给和药物的毒副作用有关。
65、根据权利要求60的方法,其中所述生理学或病理学上的变化是 从由生理节奏变化、老化及长期强化所组成的小组中选择的。
66、根据权利要求60的方法,其中所述组织是从由视网膜、小脑皮 层、嗅觉泡、丘脑、下丘脑、前垂体、后垂体、海、伏隔核、扁桃体、 纹状体、小脑、脑干、交叉上核和脊柱索组成的小组中筛选的中枢神经系 统中的一个结构衍生而来的。
67、根据权利要求60的方法,其中所述组织是正常的或瘤形成的组 织,其是从由心血管系统、系统、消化系统、末梢神经系统、肝、肾、 骨骼肌和生殖系统组成的小组中的筛选的一个器官或器官组织。
68、根据权利要求60的方法,其中所述组织是由细胞组成的正常的 或瘤形成的组织,其是从由心血管系统、淋巴系统、呼吸系统、消化系统、 末梢神经系统、中枢神经系统、肠的神经系统、内分泌系统、体被(包括 皮肤、头发和指甲)、骨骼系统(包括骨骼和肌肉)、泌尿系统和生殖系 统组成的小组中的筛选的一个器官或器官组织提取或衍生的。
69、根据权利要求60的方法,其中所述组织是由细胞组成的正常的 或瘤形成的组织,其是从由上皮、内皮、粘膜、腺体、血液、淋巴、连接 组织、软骨、骨、平滑肌、骨骼肌、心肌、神经元、神经胶质细胞、脾、胸 腺、垂体、甲状腺、甲状旁腺、肾上腺皮质、肾上腺髓质、松果体、皮肤、 头发、指甲、牙齿、肝、胰腺肺、肾、膀胱、输尿管、乳腺、卵巢、子宫、 阴道、Testes、前列腺、阴茎、眼和朵组成的小组中筛选的一个器官 或器官组织提取或衍生的。
70、一种检测一个筛选的药物和一个已知化合物作用不同的方法,其 包括以下步骤:
(a)从用已知生理学功能的化合物处理的有机体获得组织的第一份 样品;
(b)从第一份样品中分离一个mRNA库;
(c)通过进行权利要求1的(a)-(j)步骤产生代表在第一份样品 中出现的mRNAs的3’-末端的第一个序列特异的产物的显示,确定在第 一个样品组织中mRNA表达的模式;
(d)从用被筛选的药物处理的有机体中获得第二份样品,确定筛选 的药物和一个已知化合物作用的不同;
(e)从第一份样品中分离一个mRNA库;
(f)通过进行权利要求1的(a)-(j)步骤产生代表在第二份样品 中出现的mRNAs的3’-末端的第二个序列特异的产物的显示,确定在第 二个样品组织中mRNA表达的模式;
(g)比较第一个和第二个的显示,以便检测mRNA物种的存在,mRNA 的表达不受已知化合物的影响,而是受被筛选的药物的影响,因此,表明 筛选的药物和已知化合物作用的差异。
71、根据权利要求70的方法,其中所述被筛选的药物是从由抗抑郁 药、精神抑制药、安定药、抗惊厥药、单胺氧化酶抑制剂、兴奋剂组成的 组中选择的。
72、根据权利要求70的方法,其中所述被筛选的药物是从由抗帕金 森剂、骨骼肌弛缓药、止痛药、局部麻醉、胆碱能药、抗病毒剂、抗痉挛、 类固醇和非类固醇类抗发炎药物组成的小组中筛选的。
73、一个数据库,其包括由通过权利要求1的序列特异产品的显示的 定量产生的数据。
74、权利要求1的数据库,其进一步包括含有涉及到序列相关性、基 因图谱和细胞分配的数据。
75、一种识别在一个样品中出现的mRNA分子的3’-末端序列和一个 序列数据库之间的序列身份和相似性的方法,其包括如下步骤:
(a)用一个混合的锚定引物从一个mRNA库中制备一个双链cDNA库, 每一个锚定引物含有一个5’末端和一个3’末端,而且包括:(i)7-40  T残基的一段序列;(ii)识别6个以上碱基的第一个限制性内切酶切割 的位点,该切割位点朝向5’-末端定位是和T残基的序列相关;(iii) 从4到40个核苷酸的第一个填充片段,该第一个填充片段被定位朝向于 与被第一个限制性内切酶切割位点相关的5’-末端;(iv)第二个填充片 段插入识别6个以上碱基被第一个限制性内切酶切割位点和T残基序列之 间;和(v)相变残基被定位在从由-V、-V-N、和-V-N-N组成的小组中选 择的每个锚定引物的3’-末端,其中V是从由A、C和G组成小组中筛选 的脱氧核糖核苷酸;N是从由A、C、G和T组成的小组中筛选的脱氧核糖 核苷酸,包含有锚定引物的混合物含有所有的V和N的可能;
(b)用第一个限性内切酶和第二个限制性内切酶切下双链cDNA库,第 二个限制性内切酶识别一个4-核苷酸序列,形成了一个分别有第一和第 二个末端的双链cDNA分子库。
(c)来源于步骤(b)的每个双链cDNA分子于一个方向被插入进一个 载体,其对于噬菌体特异的启动子是反意义的,在载体中形成了含有插入 cDNA分子的构建库,因此分别确定邻接插入cDNA有意义链5’末端和有 意义链3’末端的5’、3’侧翼载体的序列,而且所述有一个3’侧翼载 体序列的构建至少在所述第一个限制性内切酶位点和限定的在所述启动 子中转录起始位点之间有15个核苷酸长度;
(d)用被切割的cDNA插入载体转化的宿主细胞,以产生含有克隆插 入的载体;
(e)用至少一种或不能识别插入的cDNA分子中的序列,或不能识别 噬菌体特异的启动子中的序列,但能识别载体上序列的限制性内切酶消化 在步骤(c)中产生的构建库,这样就产生了含有插入的cDNA分子的线 性片断,这样产生的线性片段具有一个在载体5’端到双链cDNA分子第 二个末端的至少15个核苷酸的5’侧翼载体序列;
(f)通过温育线性片段和一个具有起始从噬菌体特异的启动子转录 能力的噬菌体特异的RNA聚合酶,产生了反义cRNA转录的一个cRNA的 制备;
(g)用一个反转录酶,和一个15-30个核苷酸长且由和5’侧翼载 体序列互补的核苷酸序列组成的5’反转录引物,通过转录cRNA产生第 一链cDNA;
(h)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物,第一次聚合酶链式 反应用第一个3’PCR引物是15-30核苷酸长,它和在第一个限制性内切 酶位点和通过噬菌体特异的启动子确定转录起始位点之间的3’侧翼载体 序列互补,第一个5’PCR引物被限定有-N1组成的3’-末端,其中“N” 是四种脱氧核糖核酸A、C、G或T中一个,第一个5’PCR引物是15-30 个核苷酸长,且和5’侧翼的载体序互补,同时,第一个5’PCR引物的 互补延伸进cRNA的特异插入核苷酸中的一个核苷酸,在此第一个5’PCR 引物的一个不同引物被用在四个不同亚库中的每一个中;
(i)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物,在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它与在第一个限制性内切酶位点和通过噬菌体特异的 启动子确定转录起始位点之间的3’侧翼载体序列互补,第二个5’PCR 引物被限定有一个由-N1-Nx组成的3’-末端,在此N1和用在第一次聚合 酶链式反应中对于那个亚库的N1是一样的,“N”象在步骤(h)中一样, x是从1到5的整数,这个引物长度是15-30个核苷酸,而且和5’侧翼 载体序列互补,同时引物互补延伸以核苷酸数量相当于“x”+1的插入cRNA 的特异插入核苷酸,在此,第二5’PCR引物中每个不同引物被用在第二 系列亚库的不同的亚库中,而且对于第一套亚库中每一个亚库在第二系列 亚库中有4x亚库;
(j)分析第二套PCR产物产生了一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示;
(k)洗脱至少一个与来源于电泳图谱中的mRNAs相对应的cDNA,其中 代表出现在样品中的3’-末端的mRNAs的条带被显示;
(l)在一个聚合酶链式反应中扩增洗脱的cDNA;
(m)克隆扩增cDNA进入一个质粒中;
(n)生产同来源于质粒的克隆的DNA相对应的DNA;
(o)确定克隆的cDNA的序列;
(p)从一个核苷酸数据库确定相应的核苷酸序列,这里所述相应的 核苷酸序列是被第二个限制性内切酶最末端的识别位点和Poly(A)尾巴 开始之间所界定的序列;
(q)比较克隆cDNA序列和相应的核苷酸序列,因此可以识别出现在 一个样品mRNA的3’-末端序列和一个数据库序列的身份及相似性。
76、根据权利要求76的方法,其进一步包括如下步骤:
(r)在一个二维图谱显示中比较PCR产物的长度和数量。
77、根据权利要求76的方法,其进一步包括如下步骤:
(s)确定相应的核苷酸的预测长度,这个长度和从数据库中确定的大 量的相应核苷酸产物的长度相同,确定可以和载体杂交的5’PCR序列的 长度,确定剩余的锚定引物载体序列的介入部分的长度以及和载体可杂交 的3’PCR序列的长度;
(t)比较PCR产物长度和已确定的预测的相应核苷酸序列的长度,在 此相应的核苷酸序列的预测的长度是通过一个图解标记或文字符在一个 二维图谱显示中被证明的。
78、一种识别与在一个样品出现的一个mRNA分子相对应的一个cDNA 片段序列与一个序列数据库之间的身份和相似性的方法,其包括以下的步 骤:
洗脱和在一个样品中出现的一个mRNA分子相对应的一个cDNA片段;
在聚合酶链式反应中扩增洗脱的cDNA片段产生一个扩增的cDNA片 段;
克隆扩增的cDNA片段进入一个质粒;
产生一个和cDNA片段对应的一个DNA分子;
测序那个产生的DNA分子,因此确定了洗脱的cDNA片段的序列;及,
比较洗脱的cDNA片段的序列和数据库中序列,因此识别序列的身份 和相似性。
79、根据权利要求78的方法,其中所述比较洗脱的cDNA片段的序列 和数据库中序列的步骤是用计算机进行的。
80、根据权利要求78的方法,其包括用图解显示比较结果的附加步 骤。
81、一种识别与在一个样品中出现一个mRNA分子对应的cDNA片段的 序列与一个数据库序列之间的序列身份和相似性的方法,其包括如下步 骤:
洗脱与在一个样品中出现的一个mRNA分对应的cDNA片段,这里cDNA 片段有一个由一个限制性内切酶位点与那个mRNA分子的一个Poly(A) 尾巴的位置确定的长度;
用和那个限制性内切酶位点对应的一个5’PCR引物,通过聚合酶链 式反应确定cDNA片段的部分序列;而且
比较洗脱cDNA片段确定的部分序列和cDNA片段对于在数据库中序列 的长度,来识别序列的身份和相似性。
82、一种产生一个转化多核苷酸序列数据库登记的方法,其包括以下 步骤:
从一个多核苷酸序列数据库登记中选择一个源序列;
在源序列中定位一个poly(A)尾巴序列;
在源序列中定位一个和第一个限制性内切酶最靠近的限制性内切酶 识别位点序列;
确定和上述限制性内切酶位点邻接的大约由2-6个核苷酸组成的一 个索引序列;
在源序列中,确定一个相关的序列,所述相关序列包括被poly(A) 尾巴和限制性内切酶识别位点所界定的序列,且至少包括限制性内切酶识 别位点的一部分;
确定相关序列的长度;和
存储关于poly(A)尾巴的位置和序列、限制性内切酶识别位点位置 和序列、和源序列相关的相关序列的长度的信息,因此可以产生一个转化 的数据库登记。
83、根据权利要求82的方法,其进一步包括如下的步骤:
图示显示和索引序列相关的相关序列的长度。
84、根据权利要求83的方法,其中所述限制性内切酶位点是从由 MspI、TaqI,HinP1I组成的小组中选择的。
85、一种通过减小由于非靶cDNAs扩增的背景而改进PCR产物的长度 和数量的分辨率的方法,其包括如下步骤:
筛选一个cDNAs库的样品,在这里每一个cDNA分子包含有插入序列 和来源于载体的序列;
用一个可以和来源于载体的序列杂交的反转录引物进行反转录,延伸 大约5-6个核苷酸进入插入序列产生一个cDNA反转录的产物;
再一次分离cDNA反转录的产物;
用一个可以和来源于载体的序列杂交的一个3’引物和一个5’引物 和再一次分离cDNA反转录的产物进行至少一次聚合酶链式反应,延伸大 约7-9个核苷酸进入插入序列产生一个PCR产物,因此减小由于非靶 cDNAs扩增的背景。
86、根据权利要求85的方法,其中有16个库的反转录反应和16个 不同的反转录引物。
87、根据权利要求85的方法,其中有4x亚库的聚合酶链式反应,在 此,5’PCR引物延伸进入插入序列的核苷酸的数量同反转录引物延伸进 入插入序列的核苷酸的数量是不同的。

说明书全文

发明涉及不同表达的mRNAs的同步鉴定的方法和它们相对浓度的 测量方法。

组成有机体蛋白质分子的完整的特性,对于例如改进药物设计、个 体患者优化治疗的选择、及更多合适的生物物质的研究开发是有用的。表 达蛋白的这样的一个特性将包括它们的识别、顺序确定、它们表达的解剖 学位点的证明,它们生物活性的阐明以及对这些活性如何决定有机体生理 的理解。对于医药的应用,应当包括每种蛋白质浓度的改变如何对药用或 毒性的药剂做出反应的信息。

需要我们考虑的关于这个问题的范围包括:共有多少基因?在哺乳动 物中有多少基因被表达的问题,在研究至少20年后仍没有解决。很少有 致于在不同组织中基因表达模式的直接研究。突变负荷研究 (J.O.Bishop,“基因数量策略”,细胞2:81-86(1974); T.Ohta.&.M.Kimura,“作为分子进化的一个产物的基因物质的功能组 织,”自然,223:118-119(1971))已表明有3×104至105之间的必 需基因。

在cDNA克隆技术以前,基因表达的信息来源于RNA复杂性的研究: 其基于对丰富的具有不同特异性的RNA分子的混合库的观察基础上的相 似性测量(成批测量)。对于意料外的范围,早期相似复杂性研究被事实 上隐藏的复杂性所歪曲,这个事实就是在每个组织中组成它们mRNA质量 的大多数的分子仅占其总复杂度的一小部分。后来,cDNA克隆允许数字 测量的应用(例如,基于个体物种的特异的序列测量);因此,更现代的 关于mRNA表达的概念是基于对个体的RNA物种的实际观察的基础上的。

大脑、肝、肾通过相似RNA复杂性测量曾被极其广泛研究的哺乳动物 的组织。复杂性的最低估测是Hastie and Bishop(N.D.Hastie& J.B.Bishop,“三类丰富信使RNA在鼠的组织中的表达,”细胞9:761- 774(1976)),他们指出3×109基对啮齿目的基因组中有26×106核苷 酸在大脑中被表达,23×106在肝中被表达,22×106在肾中被表达,同时 在RNA sets中几乎完全重叠。这表明了有一个非常小数量的组织特异性 的mRNAs。然而,实验表明这些数目很显然被低估了,因为那些有可能在 这个早期研究的检测限下丰富的许多mRNA分子已被证明在大脑中表达, 但在肝及肾中不能被检测。许多其它的研究人员(J.A.Bantle和W.E.Hahn, “在鼠的大脑中多聚腺苷酸RNA的复杂性和特性”细胞.8:139-150 (1976);D.M.Chikaraishi,“细胞质多聚腺苷酸和无腺苷酸鼠脑中核 糖核酸的复杂性”生物化学18:3249-3256(1979))已测量了在大脑 中100-200×106的核苷酸的相似复杂性,其比在肝和肾估测的数值低 2-3倍。对于大脑的mRNAs,50-65%在肝和肾中是不可检测到的。这些 数值得到数字克隆研究的支持(R.J.Milner和J.G.Sutsliffe,“在鼠 脑中基因的表达”核酸研究,11:5497-5520(1983))。

大量mRNA的相似性测量表明平均mRNA长度在1400-1900核苷酸之 间。在通过诺慎印迹杂交(Milner和Sutcliffe,supra)用200个随机 选择的脑cDNAs测量RNA长度的一个系统数字分析中,发现当mRNA长度 数据以RNA的优势衡量时,平均长度是1790个核苷酸,这同相似测量所 确定的数值是一样的。然而,组成大脑mRNA复杂度的大多数mRNAs有一 个5000个核苷酸的平均长度。不仅大脑RNAs越长越稀少,而且它也倾 向大脑特异性,同时越有优势的大脑mRNAs越普遍表达且在平均长度上 越短。

这些关于mRNA长度的概念已被最近的来源于序列已被确定的大脑 mRNA的长度而进一步确认(J.G Sutcliffe,“在哺乳动物中枢神经系统 的mRNA”神经科学的年度回顾11:157-198(1988))。因此,1-2× 108核苷酸复杂度及5000个核苷酸平均mRNA长度和估计的在大脑中表达 的30,000mRNAs是相适应的,这些在大脑中表达的mRNA约2/3在肝和肾 中检测不到。很明显大脑占据了哺乳动物组织特异性基因一个相当大的部 分。大多数大脑mRNAs是以低浓度表达的。没有总的哺乳动物mRNA复杂 性的测量,是否5000个核苷酸对于非神经组织是一个合适的mRNA长度 的估测也是不知道的。对于总的基因数量的合理的估测值可能在50,000 到100,000之间。

通过生理学功能上的一个化学理解,最需要去推进发展的是通过基因 组加上的在各种细胞类型中每个基因组被表达的细胞类型所编码的一系 列蛋白质序列。因为在基因组序列中有干扰序列存在(内含子),所以目 前仅从cDNA而不从基因就很容易推测蛋白质序列。即使一个哺乳动物基 因组完整的核苷酸序列也不能代表它的表达序列的特征。因此,需要一个 收集转录序列及证明它们表达位点的系统的策略方法。这样的策略方法在 确定大脑中序列差异表达中是特别有用的。这样的研究取得结果是一个必 然的最终的目的,也就是,去识别确认所有的mRNAs。因为各种mRNAs和 大量的被许多独特组织表达的独特的mRNA具有不同的优势,所以去得到 这样的结果可能是困难的。为获得这样的结果所作的努力使得人们取得了 一个进步的更可靠的基因空间三维的描述。

在Craig Venter实验室中进行的研究(M.D,Adams等,“互补DNA测 序:表达序列标签和人类基因组计划,”科学252:1651-1656 (1991));M.D.Adamse等。“2,375人类大脑基因的序列鉴定”自然355: 632-634(1992))已引起了人的大脑mRNAs的随机选择的cDNA克隆的 分离、它们的3’-末端的短的大约为300个碱基对的单通道 (single-pass)序列的确定、以及这些中2500个汇辑做为一个“表达 序列的标签(EST)”数据库。这些数据库尽管是有用的,却不能提供差 异表达的任何信息。因此,基于在大脑区域和其它组织中它们的全面表达 模式,及基于对例如各种生理学上或病理学上的状态或药物治疗的影响的 各种示例作出反应,去识别这些基因是重要的,而不是在一个单一组织中 它们的表达,

其它的工作主要集中在利用聚合酶链式反应(PCR)建立一个数据库。 Williams等(J.G.K.William等,“通过随机引物DNA多态性扩增做为 遗传标记是有用的”核酸研究.18:6531-6535(1990)和 Welsh&McClelland(J.Welsh和McCelland,“用随机引物PCR和引物的一 个Matrix of Pairwise联合的基因组印迹法”核酸研 究.18:7213-7218(1990))表明随机选择序列单一的10-聚体(mer)的 引物,例如任何10-mer的shelf引物,当用在与如人、植物酵母或 细菌基因组DNA的复杂DNA模板进行PCR时,产生一个PCR产物的排列。 这样引物事实被证明涉及到在引物和模板DNA之间不完全互补。可以假 设,部分错配引物结合位点,在基因组中是随机分布的。偶尔,这两个位 点是在相反的方向,彼此距离足够近,以至于能够产生PCR产物带。平均 共有8-10个产物,其大小在约O.4-4kb之间变化,而且对每个引物有 一个不同的变动性。PCR产物排列在同一物种的个体中显示了差异。这些 作者提出将单一任意引物能够产物限制性片段长度多态性(RFCP)样的 信息用于基因组研究。其它人也应用了此技术(S.R.Woodward等,“随 机序列寡聚核苷酸引物检测在近亲繁殖的鼠系中隔离的多态性DNA产 物”,哺乳动物遗传3:73-78(1992);J.H.Nadeau等,“对鼠基因组分 析的多位点标记:基于任意核苷酸序列的单引物基础上的PCR扩增”,哺 乳动物遗传3:55-64(1992))。

两个研究组(J.Welsh等,“RNA的任意引物的PCR印迹”,核酸研 究,20:4965-4970(1992);P.Liang和A.B.Pardee,“通过聚合酶链式反 应方法差异显示真核生物的信使RNA”,科学257:967-971(1992)) 修改了那种方法以比较mRNA库。在Liang和Pardee的研究中,这种方 法被称作mRNA差异显示,其被用于通过两个相关的细胞类型,正常的和 癌基因鼠A31细胞,以比较表达的mRNAs库。对于每一个实验,他们用 一个任意10-mer作为5’一引物和一个与一亚套poly A(多聚A)的尾 巴互补的寡聚核苷酸作为3’-锚定引物,在从两个细胞类型制备的cDNA 上,及35S-dNTPs存在的条件下进行PCR扩增。产物在测序凝胶上被分 析,范围在100-500个核苷酸的50-100个条带被观察到。这些条带推 测来源于cDNAs扩增,它们和含有3’一锚定引物互补的mRNAs的3’- 末端和一个部分错配5’-引物位点相对应,这如同在基因组DNA模板中 被观察到的一样。对于每个引物对,从两个cDNAs扩增的条带的模式是 相似的,条带中有大约80%的分布密度是不可区分的。在一个或其它的PCR 样品的模板上,有一些条带是更密集的;两个样品仅有一个中,有很少的 几条条带是可检测的。

进一步的研究(P.Liang等,“通过差异显示方法真核mRNAs的分布 和克隆:提纯和优化,”核酸研究.21:3269-3275(1993))已证明程序对 低浓度输入RNA的起作用(尽管对比较希有物种它不是定量的),而且特 异性的残基主要存在于3’一锚定引物的最后的核苷酸中,至少被确认识 别的差异检测PCR产物中的1/3和差异表达RNAs相对应,同时有至少25% 的假阳性率。

如果所有的哺乳动物的50,000-100,000mRNAs都适用于这种任意引 物PCR的方法,那么需要大约80-95个5’任意引物和12个3’锚定引 物在大约1000 PCR小组和凝胶中以得出一个可能性,通过泊松分布计算, 这些mRNAs中有大约2/3将被鉴定。

因为下面的原因,所有的mRNAs都适合采用这种方法进行检测是不可 能的。在这样的一个检测中要求一个mRNA呈现在表面,它必须有足够的 优势在放射自显影上产生信号,而且包含有一个在它的3’-末端作为一 个错配引物结合和引物设计位点起作用的500个核苷酸的序列。一个单独 的mRNAs越占有优势,它越有可能产生一个产物。因此,用大量不同任 意引物优势物种可能产生带。因为基于任意引物选择的基础上后者的属性 含有一个不可预测的机会要素,通过任意引物方法取得结果可能是困难 的。而且,因为信息可以从一个实验室传到另一个实验室,可靠的错配引 物在不同的实验条件和用不同的PCR仪的条件下必须要有高度可重复性, 同时在反应条件下,结果有稍微的变动。作为错配引物设计的基础是很少 被理解的,这是通过Liang&Pardee差异显示方法获得数据建立一个数 据库的弊端。

美国专利号5,459,037(’037)和5,807,680(’680)描述了一个 改进的mRNA物种差异显示的方法,这个方法减少了5’-末端产生的不 确定方面,而且允许数据在不同的组中完全可重复的。该方法不依靠于潜 在的不可重复的错配引物,减少了进行完整检查所需的PCR组和凝胶的数 量,而且使得双链序列数据迅速地被积累。而且,该改进的方法也减少了 从同一物种mRNA获得的同时出现的信号的数量。’037和’680专利在 此文中被引作参考而作为公开的一部分。

在’037专利中公开的方法仍存在进一步改进的需要。例如,通过减 少在互补DNA分子合成和PCR反应期间的错误引物设计,这个方法的特异 性有可能被提高。而且,该技术能被进一步优化,以便于它更具有重复性、 更敏感、更容易应用。更优越之处在于,该技术将提供利用从形成数据库 获得的序列、浏览例如GenBank的核苷酸数据碱基、用例如BLASTN和 BLASTX这样的计算机软件来识别序列身份及相似性的能力。

我们已开发研制出一种在一个mRNA库中进行mRNAs的同步的序列特 异的识别鉴定的改进方法。该改进的方法在通过1)一个a+b长的部分核 苷酸的序列,其中a是在限制性内切酶识别位点的碱基的长度,b是简并 碱基的数,在这里6≥b≥3,和2)部分序列距poly(A)尾巴的距离,来 确定的身份和地址的基础上对mRNAs进行分类。具有代表性的身份和地 址是被一个部分序列决定的,该部分序列包含限制性内切酶的一个四碱基 识别位点和四个简并碱基。在一个优选的实施例中,该限制性内切酶的识 别位点是MspI,而且部分序列是C-C-G-G-N1-N2-N3-N4。因为这个方法取 决于一个mRNA的核苷酸序列,而不是它在一个特定的组织中的优势,所 以这个方法可以用于解释所有的在检测阈值以上浓度出现的mRNAs。同差 异显示和RAP-PCR方法相比,对于5’-末端的产生没有不确定的方面。

根据本发明的方法的一个优选的实施例(图1),从每个mRNA样品中产 生的cDNA文库中含有,在起始的RNA样品中几乎所有的poly(A)+mRNAs的 从最远侧的MspI位点到poly(A)尾巴开始处的3’-最远末端的拷贝, 其和起始的mRNAs的相对浓度几乎是相对应的。因为每个物种插入序列 两个末端都是被mRNAs自身的序列所精确的限定的,所以对于每一个物 种来说,片段的长度是一致的,这使得它们在凝胶上有一个具体的可见的 条带。不管mRNA的组织来源如何,这些长度都是不变的,这是这个方法 的一个重要的基本概念。缺乏MspI识别序列的信使RNAs没被描述,它 们相对来说是稀有的。这些mRNAs通过应用可以识别一个不同四碱基识 别序列的不同限制性内切酶的方法而被捕获。

本发明的这样的一个实施例的另一个方面是应用和3’-限制性内切 酶位点临近的序列,在一个优选实施例中,一个MspI位点,在至少两个 连续的PCR步骤中对cDNAs进行分类。第一个PCR步骤是利用一个引物 和来源于例如载体pBC SK+的序列退火,但通过不再生MspI位点的CGG 去包括插入序列的第一个邻接核苷酸(N1)进行延伸。这一步将开始的 mRNAs库分离成为4个亚库。在第二个PCR步骤中,通过第一个PCR步骤 产生的4个亚库中的每一个进一步被分成64份,通过用更多的可侵入的 插入引物(N1N2N3N4)分成256个亚亚库。在最后的PCR步骤中通过用荧 光标记3’PCR引物,通过激光器诱导荧光,使一个荧光标签结合进产物 进行检测。

在一个优选的实施例中,例如电泳这样的分离技术被用于分析标记的 PCR产物分子成为有可测量强度及和可测量的长度相对应的可以区分的 条带。合适的分离技术包括凝胶电泳、毛细管电泳,HPLC、MALDI质谱分 析和这一领域所共知的其它的合适的分离技术,这些技术在50-500碱基 范围内具有单个碱基分辨率的能力是本发明所包括的。

在一个优选的实施例中,每一个最后的PCR反应产物因此被指定一个 身份和地址,这是基于含有四碱基限制性内切酶位点和四个简约碱基(例 如C-C-G-G-N1-N2-N3-N4)的一个8-核苷酸序列及在信使末端与在mRNA的 3’末端的polyA尾巴的第一个A之间从结合处开始那个序列的距离的基 础上的。当实验确定的,或通过一个数据库序列确定的PCR产物片段的核 苷酸序列是已知时,这个片段被参考作为一个数字序列标签(DST):也 就是说,通过本发明方法衍生而来一个3’-末端EST(表达序列标签)。 用一个合适的方法检测被分离的标记PCR产物片段的条带的强度,优选的 是激光诱导的荧光(但放射性磁性标记和检测可能被用到)被定量,而 且用为PCR产物片段指定的地址在一个数据库中储存每个PCR产物片段。 被分离的标记PCR产物片段的强度和同PCR产物片段相对应的起始的 mRNA的量成比例。

总的说来,本发明的方法包括:

(a)用一个混合的锚定引物从一个mRNA库中制备一个双链cDNA库, 每一个锚定引物含有一个5’末端和一个3’末端,而且包括(i)7-40 T 残基的一段序列;(ii)识别6个以上碱基的被第一个限制性内切酶切割 的位点,该位点朝向5’末端定位是和T残基的序列相关的;(iii)从4 到40个核苷酸的第一个填充片段,第一个填充片段被定位朝向于被第一 个限制性内切酶切割位点相关的5’-末端;(iv)第二个填充片段插入用 于识别6个以上碱基的被第一个限制性内切酶切割位点和T残基序列之 间;和(v)从由-V,-V-N,和-V-N-N组成的小组中选择的每个锚定引物 的相变残基被定位在3’-末端,其中V是从由A、C和G组成小组中筛选 的脱核糖核苷酸,N是从由A,C,G和T组成的小组中筛选的脱氧核糖 核苷酸,该混合物包括含有所有的V和N的可能的锚定引物。

(b)用第一个限制性内切酶和第二个限制性内切酶切下双链cDNA库, 该第二个限制性内切酶识别一个4-核苷酸序列,形成了一个分别有第一 和第二个末端的双链cDNA分子库。

(c)来源于步骤(b),每个双链cDNA分子被插入进一个载体,在方 向上对于噬菌体特异的启动子是反意义的,在载体中形成了含有插入 cDNA分子的构建库,因此分别确定邻接插入cDNA有意义的链5’-末端 和有意义链3’-末端的5’和3’侧翼载体的序列,而且所说的有一个3’ 侧翼序列的构建至少在所说的第一个限制性内切酶位点和限定的在所述 的启动子中转录起始位点间有15个核苷酸长度。

(d)用被切割的cDNA插入载体转化宿主细胞产生含有克隆插入的载 体。

(e)用至少一种或不能识别插入的cDNA分子,或不能识别噬菌体特 异的启动子序列,但能识别载体上序列的限制性内切酶消化在步骤(c) 中产生的构建库,这样就产生了含有插入的cDNA分子的线性片断,这样 产生的线性片段有一个至少在载体5’端到双链cDNA分子第二个末端的 15个核苷酸。

(f)通过温育线性片段和一个具有起始从噬菌体特异的启动子转录 能力的噬菌体特异的RNA聚合酶,产生了反义cRNA转录的一个cRNA的 制备。

(g)用一个反转录酶和一个15-30个核苷酸长,且由和5’侧翼体 序列互补的核苷酸序列组成的5’反转录引物(RT),通过转录cRNA产 生第一链cDNA。

(h)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物。第一次聚合酶链式 反应用第一个3’PCR引物是15-30核苷酸长,它和在第一个限制性内切 酶位点和通过噬菌体特异的启动子确定转录起始位点间的3’侧翼载体序 列互补,第一个5’PCR引物被限定有-N1组成的3’末端,其中“N”是 四种脱氧核糖核苷酸A、C、G或T中一个,第一个5’PCR引物是15-30 个核苷酸长,且和5’侧翼的载体序列互补,同时,第一个5’PCR引物 的互补延伸进cRNA的特异插入核苷酸中的一个核苷酸,在此第一个5’ PCR引物的一个不同引物被用在四个不同亚库中的每一个。

(i)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物。在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它与在第一个限制性内切酶位点和通过噬菌体特异的 启动子确定转录起始位点间的3’侧翼载体序列互补,第二个5’PCR引 物被限定有一个由-N1-Nx组成的3’-末端,在此N1和用在第一次聚合酶 链式反应中对于那个亚库的N1是一样的,“N”如在步骤(h)中一样,x 是从1到5的整数,这个引物长度是15-30个核苷酸,而且和5’侧翼载 体序列互补,同时引物互补延伸以核苷酸数量相当于“x”+1插入cRNA 的特异插入核苷酸,在此,第二5’PCR引物中每个不同引物被用在第二 系列亚库的不同的亚库中,而且对于第一套亚库中每一个亚库在第二系列 中有4x个亚库。

(j)分析第二套PCR产物以产生一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示。

在一个优选实施例中,一个生物素部分被共轭接合到锚定引物上,优 选的是接合到锚定引物的5’-末端。在这样一个实施例中,通过第一个 限定的cDNA和一个链霉抗生物素蛋白包被的底物接触,第一个限定cDNA 被从步骤(b)中的cDNA的剩余物中分离出来。合适的链霉抗生物素蛋 白包被的底物包括微量滴定板、PCR管、聚苯乙烯球、顺磁聚合物珠和顺 磁多孔玻璃微粒。一个优用的链霉抗生物素蛋白包被的底物是顺磁聚合物 珠的悬浮液(Dynal,Inc.,Lake Success,NY)。

在一个实施例中,第一个5’PCR引物在3’末端的3个核苷酸通过 抗性磷酸二酯酶键合连接,优选的是硫代磷酸酯键合连接。在另外的一个 实施例中,第二个5’PCR引物在3’末端的3个核苷酸通过抗性磷酸二 酯酶键合连接,优选的是第一个和第二个两个5’PCR引物的3’末端的3 个核苷酸通过硫代磷酸酯连接。

有代表性地,第二个PCR反应引物中的一个是被共轭接合上一个荧光 标签。一个合适的荧光标签是从由下面物质组成的小组中选择的,

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨(xanthen)-3-一,6- 羧酸,3’,6’-二羟基-6-羧基荧光素(6-FAM,ABI);

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,5-羧酸,3’,6’ -二羟基-5-羧基荧光素(5-FAM,分子探针);

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,3’,6’-二 羟基荧光素(FAM,分子探针);

9-(2,5-二羧基苯基)-3,6-二(二甲基)-呫吨鎓(xanthylium) (6-羧基四甲基若丹明(6-TAMRA),分子探针);

3,6一二氨基-9-(2-羧基苯基)-呫吨鎓(若丹明绿TM,分子探针);

螺旋[异苯并呋喃-1(3H),9’-呫吨]-6-羧酸,5’-二氯-3’,6’- 二羟基-2’,7’-二甲氧基-3-氧代-(JOE,分子探针);

1H,5H,11H,15H-呫吨并(xantheno)[2,3,4-ij:5,6,7-i’j’]二喹 嗪-8-鎓,-(2,4-二硫苯基)-2,3,6,7,12,13,16,17-八氢一,内盐(Texas Red,分子探针);

6-((4-4-二氟-5,7-二甲基-4--3a,4a-二氮-s-indacene-3-丙 酰基)氨基)己酸(BODIPY FL-X,分子探针);

6-((4,4-二氟-1,3-二甲基-5-(4-甲基苯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酰基)氨基)己酸(BODIPY TMR-X,分子探针);

6-(((4-(4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮 -s-indacene-3-基)苯氧基)乙酰基)氨基)-己酸(BODIPY TR-X,分子探 针);

4,4-二氟-4-硼-3a,4a-二氮-s-indacene-3-戊酸(BODIPY FL-C5,分 子探针);

4,4-二氟-5,7-二甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酸 (BODIPY FL,分子探针);

4,4-二氟-5-苯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸(BODIPY 581/591,分子探针);

4,4-二氟-5(4-苯基-1,3-丁二烯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酸(BODIPY 564/570,分子探针);

4,4-二氟-5-苯乙烯基(styryl)-4-硼-3a,4a-二氮-s-indacene-3- 丙酸;

6-(((4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧(styryloxy))乙酰基)氨基己酸(BODIPY 630/650,分子 探针);

6-(((4,4-二氟-5-(2-吡咯基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸(BODIPY 650/665,分子探针);

9-(2,4(或2、5)-二羧基苯基)-3,6-二(二甲氨基)-呫吨鎓, 内盐(TAMRA,分子探针)。

其它可适用的荧光标记,包括4,7,2’,4’,5’,7’六氯-6-羧基荧 光素(“HEX”,ABI),“NED”(ABI)和4,7,2’,7’四氯-6-羧基荧 光素(“TET”,ABI)是这个领域公知的。

具有代表性的是,在步骤(a)中的相变残基有一个-V-N-N的3’末 端,在另一个实施例中,在步骤(a)中的相变残基有一个-V或-V-N的3’ 末端。

在一个优选的实施例中,在步骤(i)中“x”是3,更可取的是,在 步骤(a)中的相变残基是-V-N-N,在步骤(i)中“x”是3。

具有代表性的是,每个锚定引物在T残基序列中有8-18个T残基。 在一个优选的实施例中,每个锚定引物在T残基序列中有18个T残基。 在其它的实施例中,在T残基序列中,每个锚定引物有8-18个T残基, 优选8-16个T残基,更优选8-14个T残基,最优选8-12个T残基。在 另一个优选实施例中,在T残基序列中,每个锚定引物有12个T残基。

具有代表性的是,第一个锚定引物填充片段是14个残基长。在一个 实施例中,第一个填充片段具有A-A-C-T-G-G-A-A-G-A-A-T-T-C(SEQ ID NO:1)核苷酸序列。在另一个优选的实施例中,第一个填充片段具有 G-A-A-T-T-C-A-A-C-T-G-G-A-A(SEQ ID NO:2)核苷酸序列。

具有代表性的是,噬菌体特异的启动子是从由T3启动子、T7启动子、 和SP6启动子组成的小组中筛选的。优选的是,噬菌体特异的启动子是 T3启动子。

在一个实施例中,从cRNA的cDNA的转录设计的引物序列是 A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G(SEQ ID NO:14)。在另一个实施例 中,从cRNA的cDNA的转录设计的引物序列是 A-G-C-T-C-T-G-T-G-G-T-G-A-G-G-A-T-C(SEQ ID NO:28)。在又一实 施例中,从cRNA的cDNA的转录设计的引物序列是 T-C-G-A-C-T-G-T-G-G-T-G-A-G-C-A-T-G(SEQ ID NO:35)。

在一个实施例中,载体是用ClaI和NotI切割的质粒pBC SK+,在 步骤(h)和(i)中的3’PCR引物是G-A-G-C-T-C-C-A-C-C-G-C-G-T(SEQ ID NO:47)。在另一个实施例中,载体是用ClaI和NotI切割的质粒pBC SK+,在步骤(h)和(i)中的3’PCR引物是G-A-G-C-T-C-G-T-T-T- T-C-C-C-C-A-G(SEQ ID NO:48)。

具有代表性的是,识别6个以上碱基的第一个限制性内切酶是从由 AscI,BaeI,FseI,NotI,PacI,PmeI,PpuMI,RsrII,SapI,SexAI,SfiI,SgfI, SgrAI,SrfI,Sse8387I和SwaI所组成的小组中筛选的。识别6个以上碱基 的一个优选的第一个限制性内切酶是NotI。

具有代表性的是,识别一个4-核苷酸序列的第二个限制性内切酶是从由 MboI,DpnII,Sau3AI,Tsp509I,HpaII,BfaI,Csp6I,MseI,HhaI,NlaIII, TaqI,MspI,MaeII和HinP1I所组成的小组中筛选的。识别一个4-核苷酸 序列的一个优选的第二个限制性内切酶是MspI,Sau3AI和NlaIII。

具有代表性的是,用在步骤(e)中的限制性内切酶具有一个含有用 在步骤(b)中的第二个限制性内切酶的4-核苷酸序列的一个核苷酸序列 的识别。在一个实施例中,该第二个限制性内切酶是MspI,用在步骤(e) 中的限制性内切酶是SmalI。在另一个实施例中,该第二个限制性内切酶 是TaqI,用在步骤(e)中的限制性内切酶是XhoI。在另一个实施例中, 该第二个限制性内切酶是MaeII,用在步骤(e)中的限制性内切酶是 AatII。

具有代表性的是,步骤(c)的载体是一个环形DNA分子形式,其具 有在载体填充序列侧翼的第一和第二载体限制性内切酶位点,而且其进一 步包括在第一和第二载体限制性内切酶位点用内切酶切割载体的消化载 体的步骤。优选的是,该载体的填充序列包含有在第一和第二载体限制性 内切酶位点之间的一个内部载体填充限制性内切酶位点。

一个合适的宿主细胞是大肠杆菌。

具有代表性的是,步骤(e)包括用一个限制性内切酶在内部载体填 充限制性内切酶位点切割载体的载体消化。

具有代表性的是,用在步骤(e)中的限制性内切酶也切割在内部载 体填充限制性内切酶位点的载体。

对于其它的限制性内切酶,在不具备含有一个内部四碱基识别位点的 一个六碱基识别位点的合适的限制性内切酶的情况下,线性化一个pSK 载体采用的总的策略包括如下步骤:(i)分开含有插入片段的质粒成两 部分,第一部分用限制性内切酶XhoI切割,第二部分用限制性内切酶SalI 切割;(ii)在切割后重组第一和第二部分;(iii)分开重组的部分成 三份,用限制性内切酶HindIII切割三份中的第一份,用限制性内切酶 BamHI切割三份中第二份,第三份用限制性内切酶EcoRI切割;(iv)消 化后重组该三份,以便产生一个线性化片段的库,在这个库中大约有总数 1/6同用每一种可能组合酶切割的产物是相对应的。

具有代表性的是,对于多聚腺苷mRNA物种的mRNA库被丰富了。

具有代表性的是,在步骤(j)中扩增片段的分离分析是通过电泳显 示产物进行的。优选的是,在电泳后显示的产物的强度几乎和在初始混合 物中产物相应的mRNAs的丰度呈比例的。在一个优选的实施例中,本方 法进一步包括在电泳后,从产物相对应于mRNA的强度确定在初始混合物 中每个mRNA相对丰度的一个步骤。

具有代表性的是,用电泳分离分析聚合酶链式反应扩增产物片段的步 骤,包括在多个凝胶上的片段的电泳。

在本发明的一个实施例中,本方法进一步包括如下步骤:

(k)洗脱至少一个与来源于电泳图谱中的mRNA相对应的cDNA,其中 在样品中出现的代表mRNAs的3’-末端的条带被显示;

(l)在一个聚合酶链式反应中扩增分离的PCR产物;

(m)克隆扩增分离的PCR产物进入一个质粒中;

(n)生产来源于质粒同克隆分离的PCR产物相对应的DNA;

(o)测序克隆分离的PCR产物。

本发明的另一个实施例包含如下步骤:

(a)分离一个mRNA库;

(b)用一个混合的锚定引物,从mRNA库制备一个双链cDNA库,每个 锚定引物具有一个5’-末端和一个3’-末端且包括:(i)从7-40T的残 基序列;(ii)识别6个以上碱基的第一个限制性内切酶切割的位点,该 切割位点朝向5’末端定位是和T残基的序列相关的;(iii)从4到40 个核苷酸的第一个填充片段,该第一个填充片段被定位朝向于被第一个限 制性内切酶切割的位点相关的5’-末端;(iv)第二个填充片段插入识别 6个以上碱基被第一个限制酶内切切割位点和T残基的序列之间;和(V) 相变残基-V-N-N被定位在每个锚定引物的3’-末端,其中V是从由A、C 和G组成的小组中筛选的脱氧核糖核苷酸,N是从由A、C、G和T组成的 小组中筛选的脱氧核糖核苷酸,包含有锚定引物的混合物含有所有的V 和N的可能。

(c)用第一个限性内切酶和第二个限制性内切酶切下双链cDNA库,第 二个限制性内切酶识别一个4-核苷酸序列,形成了一个分别有第一和第 二个末端的双链cDNA分子库。

(d)来源于步骤(b)每个双链cDNA分子被从一个方向插入进一个载 体,对于一个T3启动子是有意义的,其在载体中形成了含有插入cDNA 分子的构建库,因此分别确定邻接插入cDNA有意义链5’-末端和有意义 链3’-末端的5’、3’侧翼载体的序列,而且所说的有一个5’侧翼序 列的构建至少在所说的第一个限制性内切酶位点和限定的在所述启动子 中转录起始位点间有15个核苷酸长度。

(e)用被切割的cDNA插入载体转化大肠杆菌产生含有克隆插入的载 体。

(f)用不能识别或在插入的cDNA分子、或在T3启动子中的序列的 至少一种限制性内切酶消化在步骤(c)中产生的构建库,这样就产生了 含有插入的cDNA分子的线性片断。

(g)通过温育线性片段和一个具有起始从T3启动子转录能力的T3 RNA聚合酶,产生了有意义的cRNA转录的一个cRNA的制备。

(h)用一个反转录酶和一个15-30个核苷酸长,且由和3’侧翼体 序列互补的核苷酸序列组成的3’反转录引物(RT),通过转录cRNA产 生第一链cDNA。

(i)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物。第一次聚合酶链式 反应用第一个3’-PCR引物是15-30核苷酸长,它和靠近第一个限制性 内的切酶位点3’的3’侧翼载体序列互补,第一个5’PCR引物被限定有 -N1组成的3’末端,其中“N”是四种脱氧核糖核酸A、C、G或T中一个, 第一个5’PCR引物是15-30个核苷酸长,且和5’侧翼的载体序互补, 同时,第一个5’-PCR引物的互补延伸进cRNA的特异插入核苷酸中的一 个核苷酸,在此第一个5’PCR引物的一个不同引物被用在四个不同亚库 中的每一个中。

(j)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物。在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它和靠近第一个限制性内的切酶位点3’的3’侧翼 载体序列互补,第二个5’PCR引物被限定有一个由-N1-Nx组成的3’- 末端,在此N1和用在第一次聚合酶链式反应中对于那个亚库的N1是一样 的,“N”象在步骤(i)中一样,x是从由3和4组成的小组中选择的, 这个引物长度是15-30个核苷酸,而且和5’侧翼载体序列互补,同时引 物互补延伸进入以核苷酸数量为“x”=1的cRNA的特异插入核苷酸,在 此,第二5’PCR引物中每个不同引物被用在第二系列亚库的不同的亚库 中,而且在第二系列亚库中有4x亚库。

(k)分析第二套PCR产物产生了一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示。

典型地,48个锚定引物的混合物具有A-A-C-T-G-G-A-A-G-A-A-T-T-C- G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(S EQ ID NO:5)的序列。在一个优选的实施例中,48个锚定引物的混合物具有 G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(SEQ ID NO:8)的序列。

具有代表性的是,12个锚定引物的混合物具有 A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID NO:4)的序列。在一个优选 实施例中,12个锚定引物的混合物具有G-A-A-T-T-C-A-A-C-T- G-G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T- T-T-T-T-T-V-N(SEQ ID No:7)的序列。

具有代表性的是,3个锚定引物的混合物具有 A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ IDNO:3)的序列。在一个优选的 实施例中,3个锚定引物的混合物具有G-A-A-T-T-C-A-A-C-T-G-G- A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T- T-T-T-V(SEQ ID NO:6)的序列。

在一个优选的实施例中,第一个限制性内切酶是MspI,第二个限制 性内切酶是NotI。

具有代表性的是,第一个5’PCR-引物是G-G-T-C-G-A-C-G-G- T-A-T-C-G-G-N(SEQ ID NO:22)。

在一个优选的实施例中,3’PCR引物在第二个聚合酶链式反应中是 SEQ ID NO:47的核苷酸序列共轭连接一个荧光标签,更优选的是SEQ ID NO:47的核苷酸序列和6-FAM共轭相连。

在步骤(i)中合适的值是从1-5的整数,更优选的是,在步骤(i)中 “x”是3。

具有代表性的是,检测在一个组织中mRNA表达模式的变化和生理学 或病理学上变化的联系的方法包括以下几步:

(a)获得一个没有生理学或病理学改变的正常的或瘤形成的第一个样 品;

(b)从第一个样品中分离一个mRNA库;

(c)通过进行总方法中的(a)-(j)步骤确定在组织的第一个样品中 mRNA表达的模式,产生代表在第一个样品中出现的mRNAs的3’-末端的 第一个特异序列产物的显示;

(d)获得有生理学或病理学变化组织的第二个样品;

(e)从第二个样品中分离一个mRNA库;

(f)通过进行总方法中的(a)-(j)步骤确定在组织的第二个样品中 mRNA表达的模式,产生代表在第二个样品中出现的mRNAs的3’-末端的 第一个特异序列产物的显示;

(g)比较多个显示以确定生理学或病理学变化对在组织中mRNA表达 模式的影响;

比较具有代表性的两个以上的样品,优选的具体样品是3个,更优选 的至少是4个样品,样品多次被提取和比较。

具有代表性的是,生理学或病理学上的变化是从由老年性痴呆症、帕 金森神经功能障碍、局部缺血、嗜酒、吸毒成瘾、精神分裂症肌萎缩性 侧索硬化、多重硬化、抑郁症、双极躁狂抑郁障碍所组成的小组中筛选的。

具有代表性的是,生理学或病理学上的变化与学习或记忆、情绪、谷 氨酸脱氢酶神经中毒,进食行为、嗅觉、视觉、活动障碍、病毒感染、电 休克疗法、药物的配给或药物的毒副作用有关。

具有代表性的是,生理学或病理学上的变化是从由生理节奏变化、老 化、及长期强化所组成的小组中选择的。总的来说,生理学或病理学上的 变化是从通过转录因子、细胞内第二信使、激素、神经递质、生长因子和 神经调质所介导的过程中筛选的。可供选择的是,生理学的或病理学的变 化是从通过细胞-细胞接触、细胞-底物接触、细胞-胞外基础接触、及在 细胞膜和细胞骨架之间接触介导的过程筛选的。

优选的是,由细胞组成的正常的或瘤形成的组织是从由心血管系统、 淋巴系统、呼吸系统、消化系统、末梢神经系统、中枢神经系统、肠的神 经系统、内分泌系统、体被(包括皮肤、头发和指甲),骨骼系统(包括 骨骼和肌肉)、泌尿系统和生殖系统组成的小组中的筛选的一个器官或器 官组织提取或衍生的。

在优选实施例中,由细胞组成的正常的或瘤形成的组织是从由上皮、 内皮、粘膜、腺体、血液、淋巴、连接组织、软骨、骨、平滑肌、骨骼肌、 心肌、神经元、神经胶质细胞、脾、胸腺、垂体、甲状腺、甲状旁腺、肾 上腺皮质、肾上腺髓质、松果体、皮肤、头发、指甲、牙齿、肝、胰腺、 、肾、膀胱、输尿管、乳腺、卵巢、子宫、阴道、睾丸、前列腺、阴茎、 眼和朵组成的小组中筛选的一个器官或器官组织提取或衍生的。

具有代表性的,正常或瘤形成的组织是从由视网膜、小脑皮层、嗅觉 泡、丘脑、下丘脑、前垂体、后垂体、海、伏隔核、扁桃体、纹状体、 小脑、脑干、交叉上核和脊柱索组成的小组中筛选的中枢神经系统中的一 个结构衍生而来的。

具有代表性的,检测一个筛选的药物和一个已知化合物作用的不同的 方法由以下步骤组成:

(a)从用已知生理学功能的化合物处理的有机体获得组织的第一份 样品;

(b)从第一份样品中分离一个mRNA库;

(c)通过进行总方法中的(a)-(j)步骤产生代表在第一份样品中 出现的mRNAs的3’-末端的第一个序列特异的产物的显示,确定在第一 个样品组织中mRNA表达的模式。

(d)从用被筛选的药物处理的有机体中获得第二份样品,确定筛选 的药物和一个已知化合物作用的不同;

(e)从第一份样品中分离一个mRNA库;

(f)通过进行总方法中的(a)-(j)步骤产生代表在第二份样品中 出现的mRNAs的3’-末端的第二个序列特异的产物的显示,确定在第二 个样品组织中mRNA表达的模式;

(g)比较第一个和第二个的显示,以便于在mRNA物种出现的情况下, mRNA的表达不受已知化合物的影响,而是受被筛选的药物的影响,因此, 可以表明筛选的药物和已知化合物作用的差异。

具有代表性的是,被筛选的药物是从由抗抑郁药、精神抑制药、安定 药、抗惊厥药、单胺氧化酶抑制剂、兴奋剂、抗帕金森剂、骨骼肌弛缓药、 止痛药、局部麻醉药、胆碱能药、抗病毒剂、抗痉挛药、类固醇和非类固 醇类抗发炎药物组成的小组中筛选的。

更普通的是,专业术语“被筛选的药物”和“被检测的药物”在此是 指有用的化学和治疗剂的一个广泛范围,其包括生理活性的类固醇、抗生 素、抗真菌剂、抗细菌剂、抗瘤剂、止痛药和止痛化合物、减食欲剂、驱 肠虫药、抗关节炎药、antiasthia剂、抗惊厥药、抗抑郁药、抗糖尿病 药、止泻药、抗组胺药、抗发炎剂、抗偏头痛制剂、抗多动病制剂 (animotion sickness preparation)、防晕药、抗帕金森药、止痒药、 精神抑制药、解热药、镇痉药,包括肠胃的和泌尿的;抗胆碱能药、拟交 感神经药、黄嘌呤衍生物,心血管的制剂包括通道阻滞剂、-受体阻 滞药、抗心律失常药、抗高血压利尿药、血管输张药包括全身的、冠状的 末梢和脑的;中枢神经系统兴奋剂、咳嗽和感冒剂、减充血剂、激素、安 眠药、免疫抑制剂、肌肉驰缓药、抗副交感神经药、抗拟交感神经药、精 神兴奋剂、镇静药、安定药、过敏原、抗组胺药、抗发炎药、生理活性的 肽和蛋白蛋、紫外筛选的药剂、香料、昆虫驱除药、染发剂等等诸如此类。 描述那些可考虑的试剂在这里用专业技术“生理活性”应从广泛意义上理 解,不仅指对宿生有一个直接药理学作用的药剂,也指那些在医药领域有 用的对间接或可观察到作用的药剂,例如,为诊断目的着色或不透光组织 及从组织中紫外放射性的筛选等等。

例如,典型的抑真菌和杀真菌剂包括噻苯达唑、二氯羟喹、两性霉素、 杀念菌素、真菌霉素、制霉菌素、氯登妥因、克霉唑、硝酸依托南、咪康 唑硝酸盐、吡咯尼群、杨酸、苯噻硫、氟苯异噻酮、托奈酯、三酯汀、 锌、和巯氧吡啶和巯氧吡啶钠。

类固醇包括可的松、去氧可的松、氟丙酮化合物、氟氢可的松、二乙 酸二氟松、氟氢缩松丙酮化合物、甲羟松、安西法尔、安西非特、倍他米 松及其酯、氯泼尼松龙、clorcortelone、21-去氧去炎松、地标德、地 塞米松、二氯松、二氟泼尼酯、氟氯奈德、氟米松、氟尼缩松、氟轻松醋 酸酯、氟可龙、氟米龙、氟培龙、氟泼尼龙、甲泼尼松、甲基甲泼尼松、 帕拉米松、泼尼松龙、泼尼松。

抗细菌的试剂包括磺胺、青霉素、先锋霉素、青霉素酶、红霉素、林 可霉素、万古霉素、四环素、氯霉素、链霉素等等。抗菌的特导的例子包 括红霉素、酸乙基红霉素、丙酸酯十二烷基红霉素、葡庚糖酸盐红霉素、 乙基丁二酸红霉素、乳糖酸红霉素、林可霉素、克林霉素、四环霉素、 氯四环素、地美环素、强力霉素、美他环素、氧化四环素、米诺环素等等。

肽和蛋白质包括,尤其指比平均长度小的肽,例如胰岛素、加压素、 催产素、生长因子、细胞素,还有一些大的蛋白质,例如人生长激素。

其它试剂,包括各种治疗剂,例如黄嘌,氨苯蝶啶,茶碱,肿瘤剂, 5-氟尿嘧啶核苷脱氧核糖,6-巯基嘌呤脱氧核糖,阿糖腺苷,麻醉止痛 药,氢吗啡酮,环吖嗪,镇痛辛,bupomorphine,含有有机阴离子、肝 素、前列腺素、前列腺素类似化合物的化合物,色苷酸钠,甘珀酸,多聚 羟基化合物,多巴胺,多马酚丁胺,1-多马,a-甲基多巴,血管紧张素 拮抗药,例如缓激肽、胰岛素、促肾上腺皮质激素(ACTH),脑啡吠、 内啡肽、生长抑素、分泌物这样的多肽和例如四环素、溴麦环肽、利多 卡因、西咪替丁或任何相关化合物的各种混合化合物。

其它试剂包括碘化脱氧尿嘧啶、鬼臼树脂、茶碱、异丙肾上腺素、曲 安奈德磷酸、氢化可的松,吲哚美辛、二苯丁唑酮、对氨苯甲酸和青霉胺。

前述所列绝未囊括所用,而且任何生理活性试剂均可用本发明方法检测。

典型地,构建的数据库由通过序列特异PCR产物的显示的定量产生的 数据组成的。典型地,这个数据库进一步含有涉及到序列相关性、基因图 谱和细胞分配的数据。

在一个实施例中,本发明提供了识别在一个样品中出现的mRNA分子3’- 末端和序列数据库中的序列的身份和相似性的方法。其包括如下步骤:

(a)用一个锚定引物的混合物从一个mRNA库中制备一个双链cDNA 库,每一个锚定引物含有一个5’末端和一个3’末端,而且包括(i)7-40 T残基的一段序列;(ii)识别6个以上碱基的第一个限制性内切酶切割 的位点,该切割位点朝向5’末端定位是和T残基的序列相关的;(iii) 从4到40个核苷酸的第一个填充片段,第一个填充片段被定位朝向于被 第一个限制性内切酶切割位点相关的5’-末端;(iv)第二个填充片段插 入识别6个以上碱基被第一个限制性内切酶切割的位点和T残基的序列之 间;和(v)从由-V、-V-N和-V-N-N组成的小组中选择的每个锚定引物 相变残基被定位在3’-末端,其中V是从由A、C和G组成小组中筛选的 脱氧核糖核苷酸;N是从由A、C、G和T组成的小组中筛选的脱氧核糖核 苷酸,包含有锚定引物的混合物含有所有的V和N的可能;

(b)用第一个限性内切酶和第二个限制性内切酶切下双链cDNA库,第 二个限制性内切酶识别一个4-核苷酸序列,形成了一个分别具有第一和 第二个末端的双链cDNA分子库;

(c)来源于步骤(b)的每个双链cDNA分子在一个方向上被插入进一 个载体,其对于噬菌体特异的启动子是反意义的,在载体中形成了含有插 入cDNA分子的构建库,因此分别确定邻接插入cDNA有意义链5’-末端 和有意义链3’-末端的5’、3’侧翼载体的序列,而且所说的有一个3’ 侧翼序列的构建至少在所说的第一个限制性内切酶位点和限定的在所述 的启动子中转录起始位点间有15个核苷酸长度;

(d)用被切割的cDNA插入载体转化宿主细胞,以产生含有克隆插入 的载体;

(e)用至少一种或不能识别插入的cDNA分子,或不能识别噬菌体特 异的启动子序列,但能识别载体上序列的限制性内切酶消化在步骤(c) 中产生的构建库,这样就产生了含有插入的cDNA分子的线性片断,这样 产生的线性片段具有一个在载体5’端到双链cDNA分子第二个末端的至 少15个核苷酸的5’侧翼载体;

(f)通过温育线性片段和一个具有起始从噬菌体特异的启动子转录 能力的噬菌体特异的RNA聚合酶,产生了反义cRNA转录的一个cRNA的 制备;

(g)用一个反转录酶和一个15-30个核苷酸长,且由和5’侧翼体 序列互补的核苷酸序列组成的5’反转录引物(RT),通过转录cRNA产 生第一链cDNA;

(h)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物。第一次聚合酶链式 反应用第一个3’-PCR引物是15-30个核苷酸长,它和在第一个限制性 内切酶位点和通过噬菌体特异的启动子确定转录起始位点间的3’侧翼载 体序列互补,第一个5’PCR引物被限定具有-N1组成的3’末端,其中“N” 是四种脱氧核糖核酸A、C、G或T中的一个,第一个5’PCR引物是15-30 个核苷酸长,且和5’侧翼载体序互补,同时,第一个5’-PCR引物的互 补延伸进cRNA的特异插入核苷酸中的一个核苷酸,在此第一个5’PCR 引物的一个不同引物被用于四个不同亚库中的每一个中;

(i)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物。在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它与在第一个限制性内切酶位点和通过噬菌体特异的 启动子确定转录起始位点间的3’侧翼载体序列互补,第二个5’PCR引 物被限定有一个由-N1-Nx组成的3’-末端,在此N1和用在第一次聚合酶 链式反应中对于那个亚库的N1是一样的,“N”象在步骤(h)中一样,x 是从1到5的整数,这个引物长度是15-30个核苷酸,而且和5’侧翼载 体序列互补,同时引物互补延伸以核苷酸数量相当于“x”+1插入cRNA 的特异插入核苷酸,在此,第二5’PCR引物中每个不同引物被用在第二 系列亚库的不同的亚库中,而且对于第一套亚库中每一个亚库在第二系列 中有4x亚库;

(j)分析第二套PCR产物产生了一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示;

(k)洗脱与来源于电泳图谱中的mRNA相对应的至少一个cDNA,其中 在样品中出现的代表mRNAs的3’-末端的条带被显示;

(l)在一个聚合酶链式反应中扩增洗脱的PCR产物;

(m)克隆扩增分离的PCR产物进入一个质粒中;

(n)生产同来源于质粒克隆的DNA相对应的DNA;

(o)确定克隆的cDNA的序列;

(p)从一个核苷酸数据库确定相应的核苷酸序列,这里所说的相应的 核苷酸序列是被第二个限制性的内切酶最末端的识别位点和Poly(A)尾 巴开始处所界定的序列;以及

(q)比较克隆cDNA序列和相应的核苷酸序列,因此可以识别出现在 一个样品中的mRNA的3’-末端序列和一个数据库序列的身份及相似性。

典型地,这个方法进一步包括如下步骤:

(r)在一个二维图谱显示中比较PCR产物的长度和数量;

总地说来,本方法也包括如下几步:

(s)确定相应的核苷酸的预测长度(其和从数据库中确定的相应核苷 酸序列的长度的总和相等)、可以和载体序列杂交的5’PCR序列的长度、 剩余的锚定引物序列的长度、载体序列介入部分的长度以及与载体序列可 杂交的3’PCR序列的长度;和

(t)比较PCR产物长度和已确定的预测的相应核苷酸序列的长度,在 此相应的核苷酸序列的预测的长度是通过一个图解标记或文字符在一个 二维图谱的显示中被证明了的。合适的图解标记包括垂直和水平线、例如 十字形或“X”形的交叉短线部分、和包括圆形和多边形的几何图形。

在另一实施例中,本发明提供了识别在一个样品出现的一个mRNA分 子相对应的一个cDNA片段序列与一个序列数据库间身份和相似性的方 法,其包括如下步骤:

洗脱与在一个样品中出现的一个mRNA分子相对应的一个cDNA片段;

在聚合酶链式反应中扩增洗脱的cDNA片段产生一个扩增的cDNA片段;

克隆扩增的cDNA片段进入一个质粒;

产生一个和cDNA片段对应的一个DNA分子;

测序产生的DNA分子,因此确定了洗脱的cDNA片段的序列;以及,

比较洗脱的cDNA片段的序列和数据库中序列,因此可以识别序列的 身份和相似性。

典型地,比较洗脱的cDNA片段的序列和数据库中序列的步骤是用计 算机进行的,典型地,本方法也包括用图解显示比较结果的附加步骤。

总而言之,在一个样品中出现一个mRNA分子对应的cDNA片段的序列 与一个数据库序列之间的序列身份和相似性是通过一个包括如下步骤的 方法进行的:

洗脱与在一个样品中出现的一个mRNA相对应的cDNA片段,这里cDNA 片段有一个由一个限制性内切酶位点与该mRNA分子的一个Poly(A)尾 巴的位置确定的长度;

用和该限制性内切酶位点对应的一个5’PCR引物,通过聚合酶链式 反应确定cDNA片段的部分序列;以及,

比较洗脱cDNA片段的确定的部分序列和在数据库中的序列的cDNA 片段的长度,来识别序列的身份和相似性。

在另一个实施例中,本发明提供了产生一个转化多核苷酸序列数据库 登记的一个方法,其包括以下步骤:

从一个多核苷酸序列数据库登记中选择一个源序列;

在该源序列中定位一个poly(A)尾巴序列;

在源序列中定位一个和第一个识别位点最靠近的限制性内切酶识别 位点序列;

确定和上述限制性内切酶位点邻接的大约由2-6个核苷酸组成的一 个索引序列;

在源序列中,确定一个相关的序列,所说的相关序列包括被poly(A) 尾巴和限制性内切酶识别位点所界定的序列,且包括限制性内切酶识别位 点的至少一部分;

确定相关序列的长度;和

存储关于poly(A)尾巴位置和序列、限制性内切酶识别位点位置和 序列、和源序列相关的相关序列的长度的信息,因此可以产生一个转化的 数据库登记。典型地,本方法包括图示显示和索引序列相关的相关序列的 长度。可优选的限制性内切酶位点是从由MspI,TaqI和HinP1I组成的 小组中选择的。

本发明也提供了通过减小由于非靶cDNAs扩增的背景而改进PCR产物 的长度和数量的分辨率的一种方法,其包括如下的步骤:

筛选一个cDNAs库的一个样品,在这里每一个cDNA分子包含有插入 序列和来源于载体的序列;

用一个可以和来源于载体的序列杂交的反转录引物进行反转录,延伸 大约5-6个核苷酸进入插入序列,以产生一个cDNA反转录的产物;

再一次分离cDNA反转录的产物;

用一个可以和来源于载体的序列杂交的一个3’引物和一个5’引物 与再一次分离cDNA反转录的产物进行至少一次聚合酶链式反应,延伸大 约7-9个核苷酸进入插入序列产生一个PCR产物,因此减小由于非靶 cDNAs扩增的背景。

典型的有16个库的反转录反应和16个不同的反转录引物。总共有 4x亚库的聚合酶链式反应,在这里,5’PCR引物延伸进入插入序列的核 苷酸的数量同反转录引物延伸进入插入序列的核苷酸的数量是不同的。

本发明的这些和其它的特征、方面及优点参考下面的描述、所附权利 要求及同时提供的附图将会变得更容易理解:

图1是本发明改进方法的一个图解描述,其表明引物设计、切割、克 隆、反意RNA转录和扩增的各个阶段,而且也图示地表明了锚定和其它引 物的序列——完整的序列参看文字部分;

图2是用带有包被抗生蛋白链霉素的底物的生物素酰化的锚定引物 的改进方法的一个实施例的一个图解描述,而且显示了引物设计、切割、 克隆、反意RNA转录和扩增的各个阶段,而且也图示地表明了锚定和其它 引物的序列——完整的序列参看文字部分;

图3是用一个荧光检测系统标记PCR产物的相对丰度对在碱基对中产 物长度的关系的图表,其表明了对用一个5’PCR引物 C-G-A-C-G-G-T-A-T-C-G-G-G-G-T-G(SEQ ID NO:42)获得的PCR产物 的分析,从饥饿血清(serun-starved)(A)和添加血清(serun-added) (B)的人MG63细胞中的mRNA的样品开始,用软件比较在两个样品之间 的相对的表达水平,从(A)和(B)得到的数据在序列的末端是重叠的

图4是对于用两个PCR步骤的方法和仅用一个PCR步骤的方法,使用 一个荧光检测系统比较标记PCR产物的相对的丰度对产物在碱基对中长 度的一个图表,其表明用或一个PCR步骤(A-D)或两个PCR步骤(E-H) 对从饥饿血清(serun-starved)(A)和添加血清(serun-added)(B) 的MG63骨肉瘤细胞中提取的mRNA分析获得的结果,显示了来源于5’PCR 引物109T(C-G-A-C-G-G-T-A-T-C-G-G-T-G-C-A,SEO ID NO:43)和45A (C-G-A-C-G-G-T-A-T-C-G-G-A-G-C-A,SEO ID NO:44)的数据,其仅 在N1位置(用黑体表示)不同,对饥饿血清(serun-starved)(os-) 和添加血清(serun-added)(os+)的样品,表明用109T和45A产生的 PCR产物看起来几乎和从用一个PCR步骤方法(A-D)产生的模板是一样 的,而来源于用两个PCR步骤的方法产生的模板进行下一步的PCR所检测 的产物是完全不同的(E-H);

图5是为了比较用在图1中所描述的标准方法和在图2中所描述的磁 珠实施例所获得的结果,使用一个荧光检测系统比较标记PCR产物的相对 的丰度对产物在碱基对中长度的一个图表,其表明来源于磁珠的实施例的 数据和来源于标准的方法的实施例的数据比较,在所有样品的复制性方面 有一个显著的增加(产生片段的相似性和强度数值的一致性);

图6是表示对于几个不同组织产生的PCR产物的峰度和cDNA浓度之 间的线形关系的图;

图7表明了核苷酸序列和多克隆位点质粒pBC SK+/DGT1、 pBC SK+/DGT2、pBC SK+/DGT3、pBC SK+/DGT4和pBC SK+/DGT5 的限制性的图谱;

图8是用带有包被抗生蛋白链霉素的底物的生物素酰化的锚定引物 的改进方法的一个实施例的图解描述,其表明了引物设计、切割、克隆、 反意RNA转录和扩增的各个阶段,而且也图示地表明了锚定和其它引物的 序列——完整的序列参看文字部分。

我们已研究开发了对于在一个mRNA库中同步的序列特异mRNAs的鉴 定和显示的改进方法,该方法在确定药物作用的机制、药物的筛选、及生 理学和病理学情况的研究、基因图谱方面有大量的应用。如下是对该改进 的方法及其应用的讨论。

I.mRNAs同步序列特异的鉴定

基于聚合酶链式反应(PCR)技术,根据本发明的方法提供了被正常 或瘤形成的真核细胞或组织表达的几乎每个mRNA在凝胶上都有一个明显 条带的可见的方法,且条带的强度和mRNA的浓度大致相对应。本方法是 基于对含有3’poly(A)尾巴,但不依赖于结合尾巴的引物的特异性的 几乎所有的mRNAs的观察的基础上的。

改进的方法如在图1、图2及图8三个实施例中被图示证明了。总的 说来,改进的方法包括如下几步:

a)用一个锚定引物的混合物从一个mRNA库中制备一个双链cDNA库, 每一个锚定引物含有一个5’末端和一个3’末端,而且包括(i)7-40T 残基的一段序列;(ii)识别6个以上碱基的第一个限制性内切酶切割的 位点,该切割位点朝向5’末端定位是和T残基的序列相关的;(iii) 从4到40个核苷酸的第一个填充片段,该第一个填充片段被定位朝向于 被第一个限制性内切酶切割位点相关的5’-末端;(iv)第二个填充片段 插入识别6个以上碱基被第一个限制酶内切切割位点和T残基的序列之 间;和(v)从由-V、-V-N和-V-N-N组成的小组中选择的每个锚定引物 相变残基被定位在3’-末端,优选-V-N-N,其中V是从由A、C和G组成 小组中筛选的脱氧核糖核苷酸;N是从由A、C、G和T组成的小组中筛选 的脱氧核糖核苷酸,包含有锚定引物的混合物含有所有的V和N的可能;

(b)用第一个限性内切酶和第二个限制性内切酶切下双链cDNA库,该 第二个限制性内切酶识别一个4-核苷酸序列,以形成一个分别具有第一 和第二个末端的双链cDNA分子库;

(c)来源于步骤(b)的每个双链cDNA分子被插入进一个载体,在方 向上对于噬菌体特异的启动子是反意义的,在载体中形成了含有插入 cDNA分子的构建库,因此分别确定邻接插入cDNA有意义链5’-末端和 有意义链3’-末端的5’、3’侧翼载体的序列,而且所说的有一个3’ 侧翼序列的构建至少在所说的第一个限制性内切酶位点和限定的在所述 的启动子中转录起始位点之间有15个核苷酸长度;

(d)用被切割的cDNA插入载体转化宿主细胞产生含有克隆插入的载体;

(e)用至少一种或不能识别插入的cDNA分子,或不能识别噬菌体特 异的启动子序列,但能识别载体上序列的限制性内切酶消化在步骤(c) 中产生的构建库,这样就产生了含有插入的cDNA分子的线性片断,这样 产生的线性片段具有一个在载体5’端到双链cDNA分子第二个末端的至 少15个核苷酸的5’侧翼载体序列;

(f)通过温育线性片段和一个具有起始从噬菌体特异的启动子转录 能力的噬菌体特异的RNA聚合酶,产生了反义cRNA转录的一个cRNA的 制备;

(g)用一个反转录酶和一个15-30个核苷酸长,且由和5’侧翼体 序列互补的核苷酸序列组成的5’反转录引物(RT),通过转录cRNA产 生第一链cDNA:

(h)通过分离第一链cDNA形成第一系列亚库和用第一链cDNA作为 模板进行第一次聚合酶链式反应产生第一套PCR产物,该第一次聚合酶链 式反应用第一个3’-PCR引物是15-30个核苷酸长,它和在第一个限制 性内切酶位点和通过噬菌体特异的启动子确定转录起始位点间的3’侧翼 载体序列互补,第一个5’PCR引物被限定有-N1组成的3’末端,其中“N” 是四种脱氧核糖核酸A、C、G或T中一个,第一个5’PCR引物是15-30 个核苷酸长,且和5’侧翼的载体序互补,同时,第一个5’-PCR引物的 互补延伸进cRNA的特异插入核苷酸中的一个核苷酸,在此第一个5’PCR 引物的一个不同引物被用在四个不同亚库中的每一个;

(i)通过进一步分离第一系列亚库每一个中的第一套PCR产物成为第 二系列亚库和用第一套PCR产物作模板进行第二次聚合酶链式反应产生 第二套PCR产物。在第二次聚合酶链式反应用的第二个3’PCR引物是 15-30个核苷酸长,它与在第一个限制性内切酶位点和通过噬菌体特异的 启动子确定转录起始位点间的3’侧翼载体序列互补,第二个5’PCR引 物被限定有一个由-N1-Nx组成的3’-末端,在此N1和用在第一次聚合酶 链式反应中对于那个亚库的N1是一样的,“N”象在步骤(h)中一样,x 是从1到5的整数,这个引物长度是15-30个核苷酸,而且和5’侧翼载 体序列互补,同时引物互补延伸以核苷酸数量相当于“x”+1插入cRNA 的特异插入核苷酸,在此,第二5’PCR引物中每个不同引物被用在第二 系列亚库的不同的亚库中,而且对于第一套亚库中每一个亚库在第二系列 中有4x亚库;

(j)分析第二套PCR产物产生了一个代表在mRNA库中出现的mRNAs 的3’-末端的特异序列的展示。

在一个可选的实施例中,上述步骤(c)包括插入来源于步骤(b)的 每一个双链cDNA分子进入载体,且它的插入的方向对载体中噬菌体特异 的启动子来说是有意义的,这样就形成了一个含有插入cDNA分子的构建 库(图8)。

A.双链cDNA的制备

在本方法中的第一步要求一个mRNA库。提取mRNA的方法对于这个领 域是公知和被描述的。例如,在J.Samrook等,“分子克隆:实验指南” (Cold Spring Harbor Laboratory Press,Cold Spring Habor,New York,1989),vol.1,ch.7,“从真核细胞中提取、纯化和分析信使RNA”, 在此被引作参考。其它的分离和提取方法也是公知的。普遍地,分离是在 象氯化胍或硫氰酸胍离液剂存在的情况下进行的,尽管其它的去污剂和提 取剂也是可选用的。

通常,mRNA是通过寡聚dT-纤维素色谱或其它的有能力结合mRNA分 子的多聚腺苷酸化的3’-部分的色谱介质从总的提取RNA中分离出来的。 可以选择的是,总的RNA是可用的,但不是最优选的。但是,总的来说提 取poly(A)+RNA是更可取的。

用一个锚定引物的混合物起始引发从mRNA库的反转录,这样就制备 出了双链cDNAs。每一个锚定引物含有一个5’末端和一个3’末端,而 且包括(i)7-40T残基的一段序列;(ii)识别6个以上碱基的第一个 限制性内切酶切割的位点,该切割位点朝向5’末端定位是和T残基的序 列相关的;(iii)从4到40个核苷酸的第一个填充片段,该第一个填充 片段被定位朝向于被第一个限制性内切酶切割位点相关的5’-末端;(iv) 第二个填充片段插入识别6个以上碱基被第一个限制性内切酶切割位点 和T残基的序列之间;和(v)从由-V、-V-N和-V-N-N组成的小组中选 择的每个锚定引物相变残基被定位在3’-末端,其中V是从由A、C和G 组成小组中筛选的脱氧核糖核苷酸;N是从由A、C、G和T组成的小组中 筛选的脱氧核糖核苷酸,包含有锚定引物的混合物含有所有的V和N的可 能。在这里混合物中的相变残基被-V、-V-N或-V-N-N中的一个所限定。 锚定引物在这里有一个-V的相变残基,混合物包括3个锚定引物的混合。 锚定引物在这里有一个-V-N的相变残基,混合物包括12个锚定引物的混 合。锚定引物在这里有一个-V-N-N的相变残基,混合物包括48个锚定引 物的混合。

典型的是,每个锚定引物在T残基序列区域有18个T残基,在-V-N-N 末端有14个残基长的第一个填充片段,第一个填充片段的优选序列是从 由A-A-C-T-G-G-A-A-G-A-A-T-T-C(SEQ ID NO:1)和G-A-A-T-T-C-A-A-C- T-G-G-A-A(SEQ IDNO:2)组成的小组中筛选的。具有代表性的是,识别6 个以上碱基的限制性内切酶的切割位点是NotI切割位点。

3个可优选的一套锚定引物是具有A-A-C-T-G-G-A-A-G-A-A-T-T- C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T- T-V(SEQ IDNO:3)序列的。12个可优选的一套锚定引物是具有 A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(S EQ ID NO:4)序列的。48个可优 选的一套锚定引物是具有A-A-C-T-G-G-A-A-G-A-A-T-T-C-G- C-G-G-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V- N-N(S EQ ID NO:5)序列的。

在一个优选的实施例中,那套3个锚定引物具有 G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T- T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO:6)的序列。在另一个优 选的实施例中,那套12个锚定引物具有G-A-A-T-T-C-A-A-C-T-G- G-A-A-G-C-G-G-C-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T- T-T-T-T-V-N(SEQ ID NO:7)的序列。在另一个特别优选的实施例中, 那套48个锚定引物具有G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G- G-C-C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N- N(SEQ ID NO:8)的序列。

所述锚定引物混合物的一个成员起始引发在样品中每个mRNA物种的 所有拷贝的在3’末端的一个固定位置的合成,因此限定了每个物种的一 个3’末端点。

这个反应是在从mRNA进行双链cDNA制备的条件下进行的,这对于本 领域的人是公知的。例如这样的技术在J.Samrook等,“分子克隆:实验 指南”第2卷中,标题“cDNA文库的构建和分析”中被描述了。合适的 反转录酶包括来源于禽类成髓细胞血症病毒(AMV)和莫洛尼鼠的白血病 病毒(MMLV)的反转录酶。一个可优选的反转录酶是MMLV反转录酶。

在本发明的一个优选实施例中,磁珠用于改进cDNA库的制备(图2 和图8)。具有代表性的是,生物素的一部分是共轭连接到锚定引物的5’ 末端,而且通过用包被抗生蛋白链霉素的底物接触第一个限制性的cDNA, 第一个限制性的cDNA被从其余的cDNA中分离出来,如同包被抗生蛋白 链霉素磁珠的数量。

B.用限制性内切酶切割cDNA样品

cDNA样品用两种限制性内切酶切割。第一个限制性内切酶识别具有6 个以上碱基的位点,同时在锚定引物混合物的每一个成员中单一位点处切 割。第二个限制性内切酶是一个可以识别一个4-核苷酸序列的内切酶。 这样的内切酶普遍在大多数的cDNAs的多位点切割。具有代表性的是, 第一个限制性内切酶是NotI,第二个限制性内切酶是MspI。在大多数 cDNAs中NotI不能切割。这正是我们所希望的,其减少了由于在除了在 锚定位置外位置的cDNAs的切割引起的克隆插入的损失。

第二个限制性内切酶位点可在TaqI,MaeII,或HinP1I中选择。用 上述的三个限制性内切酶能检测不能被MspI切割的稀有mRNAs。第二个 限制性内切酶产生一个5’-突出,就象下面所描述的一样,它同克隆的 期望载体是相配的。这个克隆,对于载体是从由pBC SK+、pBS SK+、pBC SK+/DGT1、pBS SK+/DGT2和pBS SK+/DGT3组成的小组中筛选的,克隆进 入ClaI位点,就象如下所讨论的。

第二个限制性内切酶可以选择Sau3AI。用这个个限制性内切酶能检 测不能被MspI切割的稀有mRNAs。第二个限制性内切酶产生一个5’-突 出,就象下面所讨论的一样,它同克隆的期望载体是相配的。这个克隆载 体是pBS SK+/DGT4,克隆进入BamHI位点,就象下面所讨论的一样。

第二个限制性内切酶可以选择NlaIII。用这个个限制性内切酶能检 测不能被MspI切割的稀有mRNAs。第二个限制性内切酶产生一个5’-突 出,就象下面所讨论的一样,它同克隆的期望载体是相配的。这个克隆载 体是pBS SK+/DGT5,克隆进入SphI位点,就象下面所讨论的一样。

能被用于检测不能被上述的限制性内切酶切割的cDNAs的其它的适 合的限制性内切酶是可以选择的。适合可以识别一个4-核苷酸序列的限 制性内切酶是MboI、DpnII、Sau3AI、Tsp509I、HpaII、BfaI、Csp6I、 MseI、HhaI、NlaIII、TaqI、MspI、MaeII和HinP1I。

识别6个以上碱基的适合的第一个限制性内切酶是AscI、BaeI、FseI、 NotI、PacI、PmeI、PpuMI、RsrII、SapI、SexAI、SfiI、SgfI、SgrAI、 SrgfI、Sse8387I和SwaI。

消化cDNA的条件,在这个领域是公知的,例如在J.Samrook等,“分 子克隆:实验指南”第1卷第5章中,“用在分子克隆中的酶”中被描述 了。

C.切割的cDNA插进一个载体中

接着,第一个限制性内切酶和第二个限制性内切酶切割的cDNA样品 插进一个载体中,概括说,合适的载体含有一个NotI限制性内切酶位点 的多克隆位点。用限制性内切酶ClaI和NotI切割的质粒pBC SK+是一个 合适的载体。该载体含有噬菌体特异的启动子。具有代表性的是,启动子 是一个T3、SP6或T7启动子。一个优选的启动子是噬菌体T3的启动子。 切割的cDNA被插进在相对于噬菌体特异的启动子是反意义的方向上的启 动子中(图1和图2)。在另一个实施例中,切割的cDNA被插进在相对 于噬菌体特异的启动子是有意义的方向上的启动子中(图8)。在一个优 选的实施例中,含有一个多克隆位点的载体有一个从由SEQ ID NO:9、 SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13组成 的小组中筛选的一个核苷酸序列。

基于质粒载体pBluescript(pBS或pBC)SK+(Stratagene)的载体 是优选的,这个质粒载体在从656到764位置的核苷酸序列部分被删除, 用一个包含有一个NotI限制性内切酶位点的至少110个核苷酸序列取 代。这个被指定为多克隆位点(MCS)的区域跨越了从SacI位点到KpnI 位点的核苷酸序列部分。

一个合适的质粒载体,例如pBC SK+或pBS SK+(Stratagene),用 合适的限制性内切酶消化以删除多克隆位点的至少100个核苷酸。对于 pBS SK+来说,删除多克隆位点的适合的限制性内切酶是SacI和KpnI。 由一个新的多克隆位点组成的、含有在用第一和第二个限制性内切酶消化 后可以和NotI和ClaI匹配的末端的一个cDNA部分克隆进这个载体形成 一个合适质粒载体。由一个新的多克隆位点组成的可优选的cDNA部分含 有在SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11中描述的部分。 通过用一个可以识别包含第二个限制性内切酶位点的4-核苷酸序列在内 的具有6个碱基以上的一个序列的单限制性内切酶消化,cDNA克隆被线 形化。

一个可优选的质粒载体,在这里指的是pBC SK+/DGT1,其包括SEQ ID NO:9的多克隆位点(MCS)。第二个限制性内切酶和线形化限制性内切 酶对(步骤E,下面)分别是:MspI和SmaI;HinP1I和NarI;TaqI和XhoI; MaeI1和AatII。

一个可优选的质粒载体,在这里指的是pBS SK+/DGT2,其包括SEQ ID NO:10的多克隆位点(MCS)。而且如上述的pBC SK+/DGT1一样制备。 这个多克隆位点不接受用MaeI1产生的cDNA插入。因此,对于pBS SK+/DGT2,第二个限制性内切酶和线形化限制性内切酶对(步骤E,下面) 分别是:MspI和SmaI;HinP1I和NarI;TaqI和XhoI。

另一个优选的质粒载体,在这里指的是pBS SK+/DGT3,其包括SEQ ID NO:11的多克隆位点(MCS)。第二个限制性内切酶和线形化限制性内切 酶对(步骤E,下面)分别是:MspI和SmaI;HinP1I和NarI;TaqI和XhoI; MaeI1和AatII。

另一个可优选的质粒载体,在这里指的是pBC SK+/DGT4,其包括SEQ ID NO:12的多克隆位点(MCS)。适合用于这个载体的第二个限制性内 切酶和线形化限制性内切酶对(步骤E,下面),分别是Sau3AI和BglII。

另一个可优选的质粒载体,在这里指的是pBS SK+/DGT5,其包括SEQ ID NO:13的多克隆位点(MCS)。适合用于这个载体的第二个限制性内切酶和 线形化限制性内切酶对(步骤E,下面),分别NlaIII和NcoI。

在一个优选实施例中,载体含有一个载体填充序列,这个载体填充序 列包括一个在第一个和第二个载体限制性内切酶位点间的一个内部载体 填充限制性内切酶位点。在这样的一个实施例中,线形化步骤包括用一个 在内部载体填充限制性内切酶位点可以切割载体的限制性内切酶对载体 进行消化。在另一个实施例中,用在线形化步骤中的限制性内切酶也可切 割在内部载体填充限制性内切酶位点的载体。

D.一个合适的宿主细胞的转化

切割的DNA已插入的载体接着被用于转化一个适合的宿主细胞,这个 宿主细胞通过含有插入片段的载体被高效转化或转染。对于克隆合适的宿 主细胞,就象Samrook等,“分子克隆:实验指南”,最有代表性的宿主 细胞是原核的。一个特别适合的宿主细胞是一个大肠杆菌的株系。一个适 合的大肠杆菌的株系是MC1061。更优选的是,一小等份被用于转化大肠 杆菌的XL1-Blue株系,以便于通过在X-gal平板上蓝白斑的相对百分数 来确定插入克隆的百分率。只有文库有超过5x105重组才被普遍接受。

E线形化片段的产生

接着从每个cDNA文库中制备质粒。通过至少一种限制性内切酶消化 产生线形化片段。

在一个实施例中,载体是质粒pBC SK+,而且NspI既被用于第二个限 制性内切酶又被用于线形化限制性内切酶。

在另一个实施例中,载体是质粒pBC SK+,第二个限制性内切酶是从 由:MspI、MaeII、TaqI和Hin1P组成的小组中筛选的。线形化是通过用 SmaI的第一消化,以及随后的用KpnI及ApaI混合物的第二消化来完成 的。

在另一个实施例中载体是从由pBC SK+/DGT1、pBS SK+/DGT2、pBS SK+/DGT3、pBC SK+/DGT4和pBS SK+/DGT5组成的小组中选择的。在这个 实施例中,提供了一个适合的酶的组合,在此第二个限制性内切酶是 MspI,用在线形化中的酶是SmaI。另一个提供的适合的酶的组合是第二 个限制性内切酶是TaqI,用在线形化中的酶是XhoI。进一步提供的适合 的酶的组合是第二个限制性内切酶是HinP1I,用在线形化中的酶是NarI。 另一个提供的适合的酶的组合是第二个限制性内切酶是MaeII,用在线形 化中的酶是AatII。如果载体是pBC SK+/DGT4,提供的适合的酶的组合是 第二个限制性内切酶是Sau3AI,用在线形化步骤中的限制性内切酶是 Bg1II。如果载体是pBS SK+/DGT5,提供的适合的酶的组合是第二个限 制性内切酶是NlaIII,用在线形化步骤中的限制性内切酶是NcoI。

概括的说,在下面F部分详细描述的线形化步骤中,任何缺乏一个 cDNA插入的质粒载体都在一个6-核苷酸的识别位点处(在图7A的下划 线处)被切割,对于SmaI、NarI、XhoI、或AatII发现是在NotI和ClaI 位点之间,而且对于SmaI、NarI、XhoI或AatII的具有6个碱基以上识 别位点发现3’靠近ClaI位点。相对照发现含有插入序列的质粒载体对 于SmaI、NarI,XhoI,或AatIII位点有6个核苷酸序列识别位点的3’ 靠近ClaI位点。

F.cRNA的产生

下一步是反义cRNA转录的一个cRNA制备的产生,这是通过温育线性 化的片段和一个具有起始来源于噬菌体特异的启动子转录的一个RNA聚 合酶进行的。具有代表性地,就如上面所讨论的,启动子是一个T3启动 子,因此聚合酶是T3RNA聚合酶。在适合合成条件下(Ambion,Austin,TX), 聚合酶和线性化片段和4三磷酸核糖核酸温育。

G.第一链cDNA的转录:

用莫洛尼鼠的白血病病每(MMLV)所转录酶(生命技术, Gaithersburg,MD)转录第一链cDNA。这个反转录酶在42℃下退火,转 录反应在42℃下进行。该反应使用一个15-30个核苷酸长度的引物,且 这个引物和5’侧翼载体序列互补。

在另一个实施例中,用一个热稳定的反转录酶转录cRNA,而且引物 如下所描述,一个优选的反转录酶是禽类的重组反转录酶,其被称为热稳 定转录的反转录酶(ThermoScript RT),根据生命技术(Gaithersburg MD)记述是可适用的。

这提高了在引物和cRNA间之间高度忠实的互补性。该引物至少15 个核苷酸长度,且和噬菌体特异的启动子3’-末端的序列相对应。

另一个适合的反转录酶是来源于栖热菌属嗜热菌的重组反转录酶,其 被称为rTh,根据Perkin-Elmer(Norwalk,CT)报道是可用的。

在这里噬菌体特异的启动子是T3启动子,引物典型地有具 A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G(SEQ ID NO:14)或G-A-G-C-T-C -C-A-C-C-G-C-G-G-T(SEQ ID NO:47)的序列。

H.产生第一个PCR产物

下一步是用转录的产物作为模板,用如下所描述的第一套引物进行聚 合酶链式反应产生聚合酶链式反应的扩增的片段。

概括地说,第一链cDNA转录的产物被用作模板,用一个第一套的3’ PCR引物和5’PCR引物进行聚合酶链式反应,产生聚合酶链式反应的扩 增片段。第一个3’PCR引物典型地是15-30个核苷酸长,且同在第一个 限制性内切酶位点和被噬菌体特异的启动子限定的位点间的3’侧翼载体 序列互补。第一个5’PCR引物具有一个由N1组的一个3’末端,这里N1 是4个脱氧核糖核苷酸A、C、G或T中的一个,且这个引物是15-30个核 苷酸长,其和5’侧翼载体序列互补,由于引物的互补性,它延伸进入cRNA 的特异插入的核苷酸中的一个核苷酸。在4个不同的亚库中的每一个中使 用了第一个5’PCR引物中的一个不同的引物。

当载体是用ClaI和NotI切割的质粒pBC SK+时,一个适合的3’PCR 引物是从由G-A-G-C-T-C-C-A-C-C-G-C-G-G-T(SEQ ID NO:47)和 G-A-G-C-T-C-G-T-T-T-T-C-C-C-A-G(SEQ ID NO:48)组成的小组中选 择的。在这里噬菌体特异的启动子是T3启动子,一个适合的5’-PCR引 物具有G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N(SEQ ID NO:22)的序列, 其中在一个给定的反应中N中是A、G、C或T。

典型地,用一个PCR程序,PCR是在94℃变性15秒,50℃-65℃退火 15秒,72℃合成30秒条件下,在一个适合的例如PTC-200(MJ Research) 或Pekin-Elmer 9600(Pekin-Elmer Cetus,Norwalk,CT)这样的热循环 仪上进行的。对于引物的特异核苷酸序列退火温度被优化了,其所用原理 对这一领域是公知的。高温退火步骤通过在它的3’末端的第一个5’-PCR 引物能使人为错配最小化,同时可以促进高度忠实的复制。

I.产生第二个PCR产物

下一步是用第一个PCR反应的产物作模板,用如下所描述的一个第二套引 物进行第二次聚合酶链式反应,产生第二套聚合酶链式反应的扩增片段。

概括地说,用第一个PCR反应产物作为模板,利用一个第二个3’PCR 引物和第二个5’PCR引物进行聚合酶链式反应,产生聚合酶链式反应扩 增片段。典型地,该第二个3’PCR引物是15-30个核苷酸长,它与在第 一个限制性内切酶位点和通过噬菌体特异的启动子确定转录起始位点间 的3’侧翼载体序列互补,该第二个5’PCR引物被限定有一个由-N1-Nx 组成的3’-末端,在此N1和用在第一次聚合酶链式反应中对于那个亚库 的N1是一样的,“N”象在步骤(h)中一样,x是从1到5的整数,这个 引物长度是15-30个核苷酸,而且和5’侧翼载体序列互补,同时引物互 补延伸以核苷酸数量相当于“x”+1插入cRNA的特异插入核苷酸,在此, 第二5’PCR引物中每个不同引物被用在第二系列亚库的不同的亚库中, 而且对于第一套亚库中每一个亚库在第二系列中有4x亚库。

在另一实施例中,所用的引物是:(a)同在载体中邻接在载体中的 cDNA样品的插入位点的一个序列在序列上对应的一个第二个3’PCR引物; (b)从由(i)用在第一个PCR反应中进行亚库扩增的第一个5’PCR引物; (ii)来源于第一链cDNA被用于通过一个附加的-N残基在亚库的3’末 端延伸的第一个5’PCR引物;(iii)通过两个附加的-N-N残基被用于 在亚库3’-末端延伸的第一个5’PCR引物;(iv)通过三个附加的-N-N-N 残基被用于在亚库3’末端延伸的第一个5’PCR引物;(v)通过四个附 加的-N-N-N-N残基被用于在亚库3’末端延伸的第一个5’PCR引物,组 成的小组中选择的,在此N可以是A、C、G或T中任一个。

适合的3’PCR引物是从由G-A-G-C-T-C-C-A-C-C-G-C-G-G-T(SEQ ID NO:47)和G-A-G-C-T-C-G-T-T-T-T-C-C-C-A-G(SEQ ID NO:48)组成 的小组中筛选的。

在这里噬菌体特异的启动子是T3启动子,一个合适的5’-PCR引物 是从由下面序列组成的小组中选择的:

A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N(SEQ ID NO:16);

A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N(SEQ ID NO:17);

A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N(SEQ ID NO:18);

G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N(SEQ ID NO:22);

G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N(SEQ ID NO:23);

T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N(SEQ ID NO:24);

C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N(SEQ ID NO:25);

G-A-C-G-G-T-A-T-C-G-G-N-N-N-N-N(SEQ ID NO:26);

A-C-G-G-T-A-T-C-G-G-N-N-N-N-N-N(SEQ ID NO:16);

A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N-N(SEQ ID NO:19); 及

A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N-N-N(SEQ ID NO:20)。

典型地,用一个PCR程序,PCR是在94℃变性15秒,50℃-65℃退火 15秒,72℃合成30秒条件下,在一个适合的例如PTC-200(MJ Research) 或Pekin-Elmer 9600(Pekin-Elmer Cetus,Norwalk,CT)这样的热循环 仪上进行的。对于引物的特异核苷酸序列退火温度被优化了,所用原理对 这一领域是公知的。高温度退火步骤通过在它的3’末端的第一个5’-PCR 引物能使人为错配最小化,同时促进高度忠实的复制。

利用非放射性标记的可优选的实施例的检测方法是可用的。对于非放 射性检测方法,优选对于第二个PCR反应的引物之一被共轭结合一个荧光 标记。一个合适的荧光标记是从由下面组成的小组中选择的。

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,6-羧酸,3’,6’ -二羟基-6-羧基荧光素(6-FAM,ABI);

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,5-羧酸,3’,6’ -二羟基-5-羧基荧光素(5-FAM,分子探针);

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,3’,6’-二羟 基荧光素(FAM,分子探针);

9-(2,5-二羧基苯基)-3,6-二(二甲基氨基)-呫吨鎓(6-羧基四甲 基若丹明(6-TAMRA),分子探针);

3,6-二氨基-9-(2-羧基苯基)-呫吨鎓(若丹明绿TM,分子探针);

螺旋[异苯并呋喃-1(3H),9’-呫吨]-6-羧酸,5’-二氯-3’,6’- 二羟基-2’,7’-二甲氧基-3-氧代-(JOE,分子探针);

1H,5H,11H,15H-呫吨o[2,3,4-ij:5,6,7-i’j’]二喹嗪-8- 鎓,-(2,4-二硫苯)-2,3,6,7,12,13,16,17-八氢一,内盐(Texas Red,分 子探针);

6-((4-4-二氟-5,7-二甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酰) 氨基)己酸(BODIPY FL-X,分子探针);

6-((4,4-二氟-1,3-二甲基-5-(4-甲氧基苯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酰)氨基)-己酸(BODIPY TMR-X,分子探针);

6-(((4-(4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮 -s-indacene-3-基)苯氧)乙酰)氨基)-己酸(BODIPY TR-X,分子探针);

4,4-二氟-4-硼-3a,4a-二氮-s-indacene-3-戊酸(BODIPY FL-C5,分 子探针);

4,4-二氟-5,7-二甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酸 (BODIPY FL,分子探针);

4,4-二氟-5-苯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸(BODIPY 581/591,分子探针);

4,4-二氟-5(4-苯基-1,3-丁二烯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酸(BODIPY 564/570,分子探针);

4,4-二氟-5-苯乙烯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸;

6-(((4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸(BODIPY 630/650,分子探针);

6-(((4,4-二氟-5-(2-吡咯基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸(BODIPY 650/665,分子探针);

9-(2,4(或2,5)-二羧基苯基)-3,6-二(二甲氨基)-呫吨鎓,内盐 (TAMRA,分子探针);

其它可适用的荧光标记,包括4,7,2’,4’,5’,7’六氯-6-羧基荧 光素(“HEX”,ABI),和4,7,2’,7’四氯-6-羧基荧光素(“TET”, ABI)和“NED”(ABI),其是这个领域公知的。

一个可优选的PCR标记是螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨) -3-一,6-羧酸,3’,6’-二羟基-6-羧基荧光素(6-FAM)。

在一个可选的实施例中,可用反射自显影的检测方法。在一个实施例 中,PCR是在35S-dATP存在下进行的。可选择地,PCR扩增可在一个放射 性核素标记的脱氧核糖核苷三磷酸,例如[32P]dCTP或[33P]dCTP存在下进 行。然而,为了得到最大的分辨率,放射性自显影检测通常优选用一个35S- 标记的脱氧核糖核苷三磷酸。

在一个可选的实施例中,用磁粒标记的寡聚核苷酸检测方法就如同在 美国专利号:5,656,429中所描述的一样是可被应用和检测的,这个方法 在此被引作参考。

在一个优选的实施例中,在第一个或第二个5’PCR引物的3’末端 的3个核苷酸通过硫代磷酸酯连接酶连接。参看Mullins,J.I.,de. Noronha,C.M,用3’-末端的硫代磷酸酯连接酶扩增引物抗火山口聚合酶 的降解,且可减少Taq聚合酶误引导。PCR方法应用1992 2(2):131-136; Ott,J.和Eckstein,F,保护寡聚核苷酸引物抗DNA聚合酶I降解。生物 化学1987 26(25):8237-8241;Uhlmann,E.,Ryte,A.,和Peyman,A.部 分硫代磷酸酯寡聚核苷酸抗核溶解降解的稳定性机制研究。反意义核酸药 物进展,1997 7(4):345-350;Schreiber,G.K,Koch,E.M.,和Neubert,W.J. 通过硫代磷酸酯类似物的结合,体外合成的cDNA抗核酸酶的选择性保护, 核酸研究1985 13(21):7663-7672。

J.电泳

聚合酶链式反应扩增的片段接着通过例如电泳的分离方法去显示代 表出现在样品中的mRNAs的3’-末端的条带,可被分辩出来。

分辨分析PCR扩增片段的电泳技术在这个领域已被透彻地理解,在这 里没有必要进一步详细叙述。相对应的PCR产物在变性DNA测序凝胶上被 分辩分析,且通过诱导荧光的激光器是可见的。可选地,相对应的PCR 产物可用毛细管电泳分辩分析,且通过诱导荧光的激光器是可见的。

在一个优选的实施例中,第二个PCR反应的引物中有一个被共轭连上 一个荧光标记。一个合适的荧光标记是从由下面组成小组中选择的:

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,6-羧酸,3’,6’ -二羟基-6-羧基荧光素(6-FAM,ABI);

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,5-羧酸,3’,6’ -二羟基-5-羧基荧光素(5-FAM,分子探针);

螺旋(异苯并呋喃-1(3H),9’-(9H)-呫吨)-3-一,3’,6’-二羟 基荧光素(FAM,分子探针);

9-(2,5-二羧基苯)-3,6-二(二甲氨基)-呫吨鎓(6-羧基四甲基若 丹明(6-TAMRA),分子探针);

3,6-二氨基-9-(2-羧基苯)-呫吨鎓(若丹明绿TM,分子探针);

螺旋[异苯并呋喃-1(3H),9’-呫吨]-6-羧酸,5’-二氯-3’,6’- 二羟基-2’,7’-二甲氧基-3-氧代-(JOE,分子探针);

1H,5H,11H,15H-呫吨o[2,3,4-ij:5,6,7-i’j’]二喹嗪-8- 鎓,-(2,4-二硫苯)-2.3,6,7,12,13,16,17-八氢,内盐(Texas Red,分子 探针);

6-((4-4-二氟-5,7---甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酰) 氨基)己酸(BODIPX FL-X,分子探针);

6-((4,4-二氟-1,3-二甲基-5-(4-甲氧基苯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酰)氨基)-己酸(BODIPY TMR-X,分子探针);

6-(((4-(4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮 -s-indacene-3-基)苯氧)乙酰)氨基)-己酸(BODIPY TR-X,分子探针);

4,4-二氟-4-硼-3a,4a-二氮-s-indacene-3-戊酸(BODIPY FL-C5,分 子探针);

4,4-二氟-5,7-二甲基-4-硼-3a,4a-二氮-s-indacene-3-丙酸 (BODIPY FL,分子探针);

4,4-二氟-5-苯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸(BODIPY 581/591,分子探针);

4,4-二氟-5(4-苯基-1,3-丁二烯基)-4-硼-3a,4a-二氮 -s-indacene-3-丙酸(BODIPY 564/570,分子探针);

4,4-二氟-5-苯乙烯基-4-硼-3a,4a-二氮-s-indacene-3-丙酸;

6-(((4,4-二氟-5-(2-噻吩基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸(BODIPY 630/650,分子探针);

6-(((4,4-二氟-5-(2-吡咯基)-4-硼-3a,4a-二氮-s-indacene-3- 基)苯乙烯基氧)乙酰基)氨基己酸(BODIPY 650/665,分子探针);

9-(2,4(或2,5)-二羧基苯)-3,6-二(二甲氨基)-呫吨鎓,内盐 (TAMRA,分子探针)。

其它可适用的荧光标记,包括4,7,2’,4’,5’,7’六氯-6-羧基荧 光素(“HEX”,ABI),“NED”(ABI)和4,7,2’,7’四氯-6-羧基荧 光素(“TET”,ABI),其是这个领域公知的。

典型地,荧光被用于检测可分辨分析的cDNA物种。然而,其它的检 测方法象磷光体成像或放射自显影或磁检测也是可用的。

根据方案,从每个mRNA样品中产生的cDNA文库中含有,在起始的RNA 样品中几乎所有的poly(A)+mRNAs的从最远侧的MspI位点到poly(A) 尾巴开始的3’-最远末端拷贝,它和起始的mRNAs的相对浓度几乎是相 对应的。因为每个物种插入序列两个末端都是被序列所精确的限定,所以 对于每一个物种来说,它们的长度是一致的,这使得它们在凝胶上有一个 具体的可见的条带,而不管mRNA的组织来源如何。

典型地,电泳后显示的产物强度大约同相对应于原始混合物中的产物 的mRNAs的丰度成比例。

典型地,本方法进一步包括电泳后通过产物相对应于mRNA的强度确 定在原始混合物中每个mRNA的相对丰度的一个步骤。

II.本方法对mRNA显示的应用

模式

上述描述的本方法通过凝胶电泳进行组织中mRNA表达模式的检测及 这些模式的分析有大量的应用。这些应用中的一个是检测在组织中mRNA 表达模式的变化和生理学或病理学变化的关系的应用。

概括说,本方法包括:

(1)获得没有受到生理学或病理学变化一个第一个组织的样品;

(2)如上所述,通过进行和代表一个mRNAs库的3’-末端的一个反 意义cRNA库的成员相对应的mRMAs的同步序列特异鉴定的方法,确定在 组织的第一个样品中mRNA表达模式,产生代表出现在第一个样品中mRNA 的3’-末端的第一个条带的显示;

(3)获得受到生理学或病理学变化的一个第二个组织的样品;

(4)如上所述,通过进行和代表一个mRNAs库的3-末端的一个反意 义cRNA库的成员相对应的mRMAs的同步序列特异鉴定的方法确定在组织 的第二个样品中mRNA表达模式,产生代表出现在第二个样品中mRNA的3’ -末端的第一个条带的显示;

(5)比较第一和第二个显示,确定生理学或病理学上变化对组织中 mRNA表达模式的影响。

典型地,比较是在一个单一凝胶的邻接的泳道中进行的。

典型地,包括通过序列特异产物的显示的定量产生数据组成的数据 库,用一个适合的计算机软、硬件构建和维持。更优选地,这样的数据库 进一步包括关于序列相关、基因图谱和细胞分布的数据。在一个优选实施 例中,长度和至少PCR产物的核苷酸序列的部分同来源于核苷酸序列的一 个数据库确定的预测的数值相比较。

组织可以是来源于中枢神经系统,尤其,它可以来源于中枢神经系统, 其是视网膜、小脑皮层、嗅觉泡、丘脑、下丘脑、前垂体、后垂体、海马 (hippocampus)、伏隔核、扁桃体、纹状体、小脑、脑干、交叉上核或 脊柱索。当组织来源于中枢神经系统,生理学或病理学的变化可以是下列 老年性痴呆、帕金森神经功能障碍、局部缺血、嗜酒、吸毒成瘾、精神分 裂症、肌萎缩性侧索硬化、多重硬化、抑郁症、双极躁狂抑郁障碍中的任 一个。可选地,本发明的方法可被用于研究生理节奏变化、老化及长期强 化,后者影响同海马。可选地,尤其是与出现在中枢神经系统内特定结构 有关的mRNA物种,本方法能被用于研究己知的参与复杂行为的大脑区域, 例如学习、记忆、情绪、吸毒成瘾、谷氨酸脱氢酶神经中毒,进食行为、 嗅觉、病毒感染、视觉和活动障碍。

本方法通过比较药物或毒素配给前后一个组织中mRNA模式可以被用 于研究药物和/或毒素配给的结果。电休克治疗法的结果也能被研究。

可选择地,组织来源于一个组织或器官的系统包括心血管系统、肺系 统、消化系统、末梢神经系统、肝、肾或骨骼肌和生殖系统或来源于身体 的任何其它器官或器官系统。例如,mRNA模式能被用于研究来源于肝、 心、肾或骨骼肌。此外,对于任何组织,样品能在各个时间提取以便发现 mRNA表达的生理节奏的影响。这样,本方法可归因于特定的mRNA物种参 与了特定的功能或功能障碍模式。

更优选地,正常或瘤形成的组织包括从由心血管系统、淋巴系统、呼 吸系统、消化系统、末梢神经系统、中枢神经系统、肠的神经系统、内分 泌系统、体被(包括皮肤、头发和指甲)、骨骼系统(包括骨骼和肌肉)、 泌尿系统和生殖系统组成的小组中的筛选的一个器官或器官组织提取或 衍生的细胞。

在一个优选的实施例中,由细胞组成的正常的或瘤形成的组织包括由 从上皮、内皮、粘膜、腺体、血液、淋巴、连接组织、软骨、骨、平滑肌、 骨骼肌、心肌、神经元、神经胶质细胞、脾、胸腺、垂体、甲状腺、甲状 旁腺、肾上腺皮质、肾上腺髓质、松果体、皮肤、头发、指甲、牙齿、肝、 胰腺肺、肾、膀胱、输尿管、乳腺、卵巢、子宫、阴道、睾丸、前列腺、 阴茎、眼和耳朵组成的小组中筛选的一个器官或器官组织提取或衍生的细 胞。

相似地,本发明的mRNA分析方法能被用做筛选药物副作用方法的一 部分,总的来说,这样方法包括:

(1)从用已知生理学功能的化合物处理的有机体获得组织的第一份 样品;

(2)如上所述,通过进行和代表一个mRNAs库的3’-末端的一个反 意义cRNA库的成员相对应的mRMAs的同步序列特异鉴定的方法确定在组 织的第一个样品中mRNA表达模式,产生代表出现在第一个样品中mRNA 的3’-末端的第一个条带的显示;

(3)从用被筛选副作用的药物处理的有机体获得组织的第二份样品;

(4)如上所述,通过进行和代表一个mRNAs库3’-末端的一个反意 义cRNA库的成员相对应的mRMAs的同步序列特异鉴定的方法确定在组织 的第二个样品中mRNA表达模式,产生代表出现在第二个样品中mRNA的3’ -末端的第二个条带的显示;

(5)比较第一个和第二个显示,以便检测mRNA物种的存在,mRNA 的表达不受已知化合物的影响,而是受被筛选的药物的影响,因此,表明 筛选的药物和已知化合物的作用的差别,因而有副作用。

尤其是,本方法能被用于影响中枢神经系统的药物,例如由抗抑郁药、 精神抑制药、安定药、抗惊厥药、单胺氧化酶抑制剂、兴奋剂。然而,这 个方法在实际中可以被用于影响在一个特定的组织中mRNA表达的任一药 物的筛选。例如可以研究抗帕金森剂、骨骼肌弛缓药、止痛药、局部麻醉、 胆碱能药、抗痉挛、类固醇和非类固醇类抗发炎药物、抗病毒剂、或任何 其它具有影响mRNA表达的药物对mRNA表达的影响,且确定在一个特定 组织或结构中的影响。

本发明方法的进一步应用是获得被显示的mRNA物种的3’-末端的序 列。概括说,获得序列的方法包括以下步骤:

(1)从电泳图谱中洗脱至少一个和一个mRNA对应的cDNA,在该电 泳图谱中代表出现在样品中的mRNA的3’-末端的条带被显示;

(2)在一个聚合酶链式反应中,扩增被洗脱的cDNA;

(3)克隆扩增的cDNA进入一个质粒;

(4)从质粒中产生和克隆的DNA对应的DNA;以及

(5)测序克隆的cDNA。

用前面用在第二个PCR步骤中的引物扩增已被剪切的cDNA。该cDNA 接着通过TA克隆和连接进入载体而被克隆进pCRII(Invitrogen,San Diego,CA)。接着从亚克隆中用标准技术小量制备DNA,而且部分被变 性和分成两个等份,通过Sanger的双脱氧链末端方法进行自动测序。可 用例如ABI测序仪这样已商品化的适用的测序仪进行测序。这将允许长度 范围在50-500bp的研究的大多数cDNA互补序列的测定。接着用合适的 计算机配置,这些部分序列可被用于扫描例如GenBank的核苷酸数据碱 基,用例如BLASTN和BLASTX这样的比较和分析程序识别序列的身份和 相似性。因为这个方法产生仅来源于mRNA的3’末端的序列,期望开放 阅读框架(ORFs)仅偶而被遇到。例如,脑的3’-未翻译区平均长度长 于1300个核苷酸(J.G.Sutcliffe,1988,supra)。通过标签蛋白基序 (signature protein motif),潜在的开放阅读框架(ORFs)能被检测 到。

获得的cDNA序列接着被设计引物对进行半定量PCR以确认组织表达 模式。被选择的产物能被用于分离全长cDNA克隆以便进行进一步分析。 引物对能被用于基因组DNA的SSCP-PCR(单链形成多态性-PCR)扩增。 例如,通过一组内部特异回交的鼠确定每一个PCR产物和已连接的标记的 连接。这可以产生新的基因的图谱及可以作为鉴定已有图谱的鼠的突变位 点和同源的人的疾病基因的资源。SSCP-PCR用合成的寡聚核苷酸引物, 通过PCR扩增一个小的片段(100-200bp)(M.Orita等,“通过凝胶电 泳作为单链形成多样性的人DNA多态性的检测”, Proc.Natl.Acad.Sci.USA 86:2766-2770(1989);(M.Orita等,“用聚 合酶链式反应快速和灵敏地进行在DNA多态性点突变的检测”,Genomics 5:874-879(1989))。

被剪切的cDNA片段可以用这个领域公知的技术进行放射性标记,以 便于用探针进行一个诺慎(northern)印迹或原位杂交(in situ)来证 实mRNA分布和了解相对应于全长mRNA的尺寸和优势。探针能被用于筛 选一个cDNA文库以分离克隆进行更可靠和更完整的序列的确定。被标记 的探针也能被用于任何其它的目的,例如研究在体外的表达。

III.专的小组和简并引物混合物

本发明的另一方面是适合本发明实际应用的专门小组的引物和简并 引物混合物,这些包括:

(1)含有序列A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N(SEQ ID NO: 16)16个引物的一专门小组的引物,在此N是4个脱氧核糖核苷酸A、C、 G或T中的一个;

(2)含有序列A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N(SEQ ID NO:17)64个引物的一专门小组的引物;

(3)含有序列A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N(SEQ ID NO:18)256个引物的一专门小组的引物;

(4)含有序列A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N-N(SEQ ID NO:19)1024个引物的一专门小组的引物;

(5)含有序列 A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N-N-N (SEQ ID NO:20)4096个引物的一专门小组的引物;

(6)含有序列A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C- G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO: 3)3个引物的一专门小组的引物;

(7)含有序列A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C-A- G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID NO:4) 12个引物的一专门小组的引物,在此V是从A、C和G组成的小组中选择 的1个脱氧核糖核苷酸;

(8)含有序列A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G-C- A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(SEQ ID NO: 5)48个引物的一专门小组的引物;

(9)含有序列G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C -A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO:6) 3个引物的一专门小组的引物;

(10)含有序列G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G-C -A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID NO: 7)12个引物的一专门小组的引物;

(11)含有序列G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C-C-C-G- C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(SEQ ID NO:8)48个引物的一专门小组的引物;

(12)含有4个不同的寡聚核苷酸,每个有序列 G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N(SEQ ID NO:22)的一专门小组的 引物;

(13)含有16个不同的寡聚核苷酸,每个有序列 G-T-C-G-A-C-G-G-T-A-T-C-G-G-N-N(SEQ ID NO:23)的一专门小组的 引物;

(14)含有64个不同的寡聚核苷酸,每个有序列 T-C-G-A-C-G-G-T-A-T-C-G-G-N-N-N(SEQ ID NO:24)的一专门小组的 引物;

(15)含有256个不同的寡聚核苷酸,每个有序列 C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N(SEQ ID NO:25)的一专门小组的 引物;

(16)含有1024个不同的寡聚核苷酸,每个有序列 G-A-C-G-G-T-A-T-C-G-G-N-N-N-N-N(SEQ ID NO:26)的一专门小组的 引物;

(17)含有4096个不同的寡聚核苷酸,每个有序列 A-C-G-G-T-A-T-C-G-G-N-N-N-N-N-N(SEQ ID NO:27)的一专门小组的 引物;

(18)包含具有序列A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C-G --C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO: 2)的3个引物的混合物的一简并引物混合物,3个引物中的每一个以等 摩尔的量出现;

(19)包含具有序列A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G-C-C -G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID NO:4)的12个引物的混合物的一简并引物混合物,12个引物中的每一 个以等摩尔的量出现;

(20)包含具有序列A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G- C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N (SEQ ID NO:5)的48个引物的混合物的一简并引物混合物,48个引物 中的每一个以等摩尔的量出现;

(21)包含具有序列G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C- C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V(SEQ ID NO:6)的3个引物的混合物的一简并引物混合物,3个引物中的每一个 以等摩尔的量出现;

(22)包含具有序列G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C- C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N(SEQ ID NO:7)的12个引物的混合物的一简并引物混合物,12个引物中的每 一个以等摩尔的量出现;

(23)包含具有序列G-A-A-T-T-C-A-A-C-T-G-G-A-A-G-C-G-G-C- C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N (SEQ ID NO:8)的48个引物混合物的一简并引物混合物,48个引物中 的每一个以等摩尔的量出现。

IV.优越性具体体现的特定的实施例子

实施例1:改进方法的应用

本发明的改进方法是基于几乎所有含有poly(A)尾巴的真核生物 mRNAs的观察的基础上的,但不同于差异显示(Liang,P和A.B. Pardee(1992),通过聚合酶链式反应方法真核生物信使RNA的差异显示, Science 257:967-971),本发明的方法用引物仅结合尾巴的特异性在每 一个mRNA上固定一个位点,不必再把mRNAs分成亚库。改进的方法在图 1、图2和图8的三个实施例中被证明了。

概括说,双链cDNA是从丰富poly(A)细胞质mRNA中产生的,而mRNA 是用一套起始反转录的所有的48个5’-生物素的锚定引物一个等摩尔的 混合物,从目的组织的样品提取的(Gubler,U.和B.Hoffman(1983)一 个简单但非常有效的产生cDNA文库的方法,Gene 25:263-269) (Schibler,K.,M.Tosi,A.C.Pittet,L.Fabiani和P.K.Wellauer(1980) 鼠的淀粉酶基因的组织特异性的表达,J.Mol.Biol.142:93-116)。这样 适合的一套引物是A-A-C-T-G-G-A-A-G-A-A-T-T-C-G-C-G-G- C-C-G-C-A-G-G-A-A-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-T-V-N-N(SE Q ID NO:5),在这里V是A、C或G,N是A、C、G或T。这48个锚定引物 混合物的一个成员起始在样品中每个mRNA物种所有拷贝的在3’末端一 个固定的位置的合成,因此,界定每一个物种的3’末端的点,产生了生 物素双链cDNA。

用能识别序列CCGG限制性内切酶MspI切割每个生物素(酰基)双链 cDNA样品。接着在抗生蛋白链霉素包被的底物上,通过生物素(酰基) cDNA的捕获来分离cDNA的3’片段。合适的包被抗生蛋白链霉素的底物 包括微量滴定板、PCR管、聚苯乙烯珠、顺磁的聚合物珠和顺磁的多孔玻 璃颗粒。一个优选的包被抗生蛋白链霉素底物是顺磁聚合物珠的悬浮液 (Dynal,Inc,Lake Success,NY)。

洗涤包被抗生蛋白链霉素的底物和捕获生物素(酰基)的cDNA片段 后,通过NotI消化释放cDNA片段产物,NotI在锚定引物中的一个8-核 苷酸序列处切割,但很少在cDNAs的来源于mRNA部分切割。3’MspI-NotI 片段对于每个mRNA物种具有一致长度,以相对于载体T3启动子反意义方 向直接被连接进入用ClaI-、NotI-切割的质粒pBC SK+(Stratagene,La Jolla,CA),且产物被用于转化大肠杆菌(E.coli)SURE细胞 (Stratagene)。连接反应再生NotI位点,但没有MspI位点。含有超 过5×105重组体,确保所有mRNAs的3’末端有0.001%或更多的可能性 的每个文库,被多次描述。从每个样品的cDNA文库中进行质粒的制备正 在研究中。

用MspI消化每个文库的一等份,MspI通过在亲本载体内几个位点切 割并同时留下完整的3’cDNA插入序列和它的侧翼序列,包括T3启动子, 来实现线性化。产物和T3 RNA聚合酶(MEGAscript Kit,Ambion)温育 产生含有公知的载体序列,但删除了来源于原始cDNAs的MspI和NotI 位点的克隆插入片段的反意义cRNA转录。

这一步避免来源于无插入质粒转录的不同程度的污染,因为对引物的 不同竞争,无插入质粒将导致不同样品以后的PCRs的效率的变化。然而, 亲本载体的多连接区域ClaI和NotI位点间有一个MspI位点,因此,MspI 消化步骤排除了来源于无插入质粒的转录cRNAs的5’标签,使得它们在 下述的产物扩增步骤中插入。通过和无DNase的RNase温育,质粒DNA 从反意cRNA转录混合物中被除去。

在这个阶段,每一个cRNA的制备以一个三步方式进行。在第一步, 用5’RT引物(在图1、2和8中的5PPIMER) A-G-G-T-C-G-A-C-G-G-T-A-T-C-G-G(SEQ ID NO:14)将250ng的cRNA 转换成第一链cDNA。在第二步400pg的cDNA产物用做PCR模板,用 G-G-T-C-G-A-C-G-G-T-A-T-C-G-G-N(SEQ ID NO:22)形式的4个5’PCR 引物中每一个和一个通用的3’PCR引物G-A-G-C-T-C-C-A-C-C-G-C-G-G-T (SEQ ID NO:47)配对,在四个分离的反应中,用如下程序:

94℃、15秒;

65℃、15秒;

72℃、60秒

20个循环。

在第三步中,每个亚库的产物进一步被分成64个亚亚库(20μl中 2ng),用100ng荧光标记的“通用”3’PCR引物,寡聚核酸 G-A-G-C-T-C-C-A-C-C-G-C-G-G-T(SEQ ID NO:47)被共轭连接到6-FAM 和合适形式为C-G-A-C-G-G-T-A-T-C-G-G-N-N-N-N(SEQ ID NO:25)的 5’-PCR引物上,进行第二次PCR反应。用如下程序:

94℃、15秒;

X℃、15秒;

72℃、30秒

30个循环。

这包括退火步骤,它的温度X稍高于每个5’PCR引物的Tm,使人为 错配引物最小化,同时提高高度忠实性复制。每个聚合酶链式反应步骤是 在TaqStart抗体(Clonetech)存在下进行的。

对于每个组织样品中来源于最后聚合酶链式反应步骤的产物,用自动 ABI Prizm 377测序仪在一系列变性DNA测序凝胶上分析。用基因扫描软 件包(ABI)收集数据和标准化振幅和迁移。对于N15’PCR引物建立的4 个亚库中的每一个进行这一系列完整反应产生64个产物亚库,对于完全 的N45’PCR引物组进行这一系列完整反应产生总共256个产物亚库。

概括说,在这个改进方法的实施例中(图2),用5PRIMER(SEQ ID NO: 14)形式的非简约引物5’RT引物,利用反转录酶从cRNA中产生一个cDNA 亚库,用5’PCR引物5PRIMERN1(SEQ ID NO:11)作为5’-PCR引物和 3’-PCR引物(SEQ ID NO:47),利用Taq DNA聚合酶在PCR中(20个 循环)产生双链的cDNA亚库。最后一个PCR用2ng DNA模板和每个 5PRIMER3N1N2N3N4引物(SEQ ID NO:25)和共轭连到6-FAM上的3’PCR 引物各100ng进行30个循环。

分析来源于饥饿血清(Serum-starved)(图3,专门小组A)和添加血 清(图3,专门小组B)人的MG63骨肉瘤病细胞的2个mRNA样品。用一 个5’-PCR引物(C-G-A-C-G-G-T-A-T-C-G-G-G-G-T-G,SEQ ID NO:42) 和在5’-末端标记有6-羧基荧光素(6FAM,ABI)的“通用”3’引物(SEQ ID NO:47)配对产生了显示的数据。在4.5%丙烯酰胺凝胶上的凝胶电泳 PCR产物被分析分离,而且在ABI377自动测序仪上获得荧光数据。用基 因扫描软件包(Perkin-Elmer)分析数据。在上面所显示的3个专门小 组中,标记PCR产物的相对丰度对产物碱基长度被绘成图(Y-轴=相对荧 光素单位)。本方法的高度重复性被显示在下面专门小组中,它表明用基 因扫描软件包在样品之间进行相对表达水平的比较来源于重叠专门小组 (A)和(B)的数据。

本发明的主要应用是比较两个或多个组织样品mRNA表达轮廓。我们 比较了对于产生产物的专门小组血清饥饿/添加实验的影响。来源于共移 动样品对的产物大多数具有可比较的幅度。产物不到10%有通过两个或更 多个因子差异的幅度,而且这些在通过添加血清诱导的物种和那些被添加 阻遏的物种之间几乎是同等分布的。

许多产物,它们中一些在两个专门小组中被不同地代表,在位置上的 移动和基于从GenBank中提取的预测的DSTs相吻合,这样就产生了一个 候选的身份。为了检测这些候选的身份,合成和5PRIMER3N1N2N3N4(SEQ ID NO:25)对应的寡聚核苷酸,用来源于在GenBank序列中邻接末端MspI 位点的序列的14个附加的核苷酸在3’末端延伸。用N1cDNA作底物,这 些和荧光的3PRIMER(SEQ ID NO:47)在PCRs中配对。

实施例2用一个PCR步骤或两个PCR步骤:PCR产物分析,在本方 法具体体现中简约的特异性

包括两个PCR步骤的基本方法的具体体现的优点利用饥饿血清和添 加血清MG63细胞被证明了。对于基本方法(图1,图2)的两个PCR步骤 的变异来说,用一个非简约的形式为5PRIMER的引物(SEQ ID NO:14), 利用反转录酶从cRNA中产生一个cDNA库;用5PRIMER1(SEQ ID NO:22) 作为5’-引物和3’引物(SEQ ID NO:47),在PCR中利用Taq DNA聚 合酶产生双链cDNA亚库。在第一个PCR步骤的修改中,用形式为 5PRIMERN1(SEQ ID NO:22)的4个N1引物中的一个通过起始转录,利 用反转录酶从cRNA产生4个cDNA亚库。在两个方法中,最后PCR用2ng DNA模板,5,PCR引物(SEQ ID NO:25)和标记6-FAM的3’PCR引物 (SEQ ID NO:47)各100ng进行30个循环。

标记的PCR片段在自动DNA测序仪(ABI377)上通过电泳方法用基因 扫描软件包进行分析。结果如图4所示。来源于引物109T (C-G-A-C-G-G-T-A-T-C-G-G-T-G-C-A,SEO ID NO:43)和45A (C-G-A-C-G-G-T-A-T-C-G-G-A-G-C-A,SEO ID NO:44)的数据仅在N1 位置(粗体)不同,已被饥饿血清(图4A、4C、4E和4G)和添加血清的 样品(图4B、4D、4F和4H)所证明。

用109T的和45A产生的PCR产物看起来几乎同一个PCR步骤的修改 产生的模板是相同的(比较图4A和图4C,图4B和图4D)。相对照,来 源于用两个PCR步骤方法产生的模板的后继PCR检测的产物是完全不同 的(比较图4E和图4G,图4F和图4H),因此,本方法体现的两个PCR 步骤对于以前适用的方法提供了实质性改进。

实施例3:用一个PCR步骤或两个PCR步骤在本方法具体体现中简约 的特异性:克隆和测序数据。

本发明的方法用或一个PCR步骤(表I)或两个PCR步骤(表II)的 具体体现在饥饿血清和处理血清MG63细胞上进行。在表I所显示的实验 中,用那套4个N1 5’PCR引物(SEQ ID NO:22)的一个,通过起始转 录,利用反转录酶产生来源于cRNA的4个cDNA亚库。对于表II,用一 个非简约性的5’RT引物(SEQ ID NO:14)用反转录酶产生来源于一个 cRNA亚库的一个cDNA。用5’PCR引物(SEQ ID NO:22)和3’PCR引 物(SEQ ID NO:47),利用Taq DNA聚合酶在PCR(20个循环)中产生 双链cDNA亚库。最后PCR在表I和表II中,用2ng输入cDNA模板,全 部的256 5’-PCR(SEQ ID NO:25)引物系列和6FAM标记的3’-PCR引 物(SEQ ID NO:47)配对,同样被进行。从PCR反应显示中,不同地被 调节的分子为了克隆和测序的目的被鉴定和分离。

在随后的数据搜索中用BLAST算法确定克隆和基因鉴定,获得DNA 序列数据。在表中,通过基因名字和GenBank位置身份,列出了发现和 已知的人类基因精确匹配的克隆。通过把在N1位置相对于GenBank序列 克隆匹配的序列制成表评估在反转录(表I)或PCR反应(表II)中用 5PRIMERN1(SEQ ID NO:22)简约步骤的忠实性。在两步方法中,5/22 克隆在N1位置(实际上是随机的)上正确匹配,而在三步程序中,所有 的克隆被发现和相对应GenBank序列的数据正确匹配。

表I:一个PCR步骤的简约特异性(P65)

基因名字    GenBank位置身份    N1位置匹配

Nma

CDE1结合蛋白

层粘连蛋白受体同系物

U1 snRNP-特异的C蛋白

泛素

MAD-3

α-微管蛋白

Id1

NNMT

BFGF

SC35

核糖体蛋白S14

核糖体蛋白L30

Na/K ATPase B3

核糖体蛋白L37A

IRF-2

SRp20

乙二醛酶II

pim-1癌基因

内皮素-1

金属硫蛋白II

CRP3同系物

表II:两个PCR步骤的简约特异性(P66)

基因名字    GenBank位置身份    N1位置匹配

MAD-3

Id1

Na/K ATPase B3

pim-1癌基因

内皮素-1

核糖体蛋白S20

核糖体蛋白S10

GADD45

AP-2

β-2-微球蛋白

RDC-1

56K自动抗原

NFKB1

Lon蛋白酶样蛋白

核苷酸结合蛋白

胰岛瘤基因

组蛋白2A.2

注意用黑体突出显示的5个基因产物,MAD-3、Idl、Na/KATPase B3、 Pim-1癌基因和内皮素-1在两个实险中被分离,而且两个PCR步骤方法 的每一种情况在N1位置产生了一个匹配,而一个PCR步骤方法没有这样 匹配。因此两个PCR步骤对于以前适用的方法提供了一个实质性改进。

实施例4用一生物素(酰基化)锚定引物获得的改进结果

如上面所提到的,在一个优选的实施例中,锚定引物在5’末端(比 较图1和图2)被生物素(酰基)化。生物素(酰基化)的cDNA片段可 以用一个包被抗生蛋白链霉素底物捕获,优选的是包被抗生蛋白链霉素的 顺磁珠(Dynal)。图5比较了用标准方法获得的结果和用磁珠锚定引物 标记获得的方法。

用标准的技术(如图1所示)和磁珠的可选择的实施例(见图2), 在一系列的时间间隔(0、0.75、7小时、10和14天)提取来源于氟哌 啶醇处理过的鼠,纹状体的5个分离样品的2gmRNA等分部分,构建cDNA 文库。结果如图5A-E(标准)和5F-J(磁珠)所示。来源于5’PCR引 物170G(C-G-A-C-G-G-T-A-T-C-G-G-G-G-T,SEQ ID NO:45)和标记6-FAM 的3’PCR引物(SEQ ID NO:47)的两种情况进行比较的结果被显示。 标记PCR产物的相对的丰度对PCR产物的长度(碱基对)被绘图(Y轴 是任意的荧光单位)。来源于磁珠文库(图5F-J)的数据和来源于标准 文库(图5A-E)的数据比较,在一系列的时间间隔下(都有片段的相似 性和强度数值的一致性)及在样品间,具有更大复制性和少的明显的假的 短(100-125)片段。

实施例5在三步方法中线性的证明:PCR产物的峰高和输入的cDNA 浓度的相关性

为了确定线性扩增的范围,一个单一的cRNA物种被分成4个独立的 cRNA亚库,而且用本发明的如图2所示方法进行处理。结果如图6所示。 相对应合成的RNA的峰高(以相对的荧光单位)测量,同时对输入的4 个样品的浓度进行绘图。显示的数据是每个样品3次重复的平均值。错误 杠表示±一个标准平均值的错误。

一个SalI-NotI cDNA片段(SEQ ID NO:51)被克隆进载体pBC SK+, 通过从T3启动子转录产生cRNA和线性化、合成的cRNA被构建产生一个 在PCR中已知长度(492bp)的峰。用N0引物(SEQ ID NO:14)在反转 录前,改变cRNA的量(0,25,100或250pg)被引入一个250ng的cDNA 库中。用400pg的cDNA作为模板,分别用5’PCR引物(SEQ ID NO:22) 和3’PCR引物(SEQ ID NO:47)进行PCR反应。用5’PCR引物221C (C-G-A-C-G-G-T-A-T-C-G-G-C-T-C-A,SEQ ID NO:46)和3’PCR引物 (SEQ ID NO:47)在最后的一个PCR反应中用2ng等份的cDNA。在图6 所描述的结果证明了对于一个给定的组织类型,PCR产物的峰高和是和输 入的RNA浓度成比例的。

前述意在图解例证本发明,但不受此限制。在不和本发明的真正的精 神和范围背离的情况下,本发明的大量的变化和修改可能是有效的。

        序列表 <110>Hasel,Karl W.

 Hilbush,Brian S. <120>Method For Indexing And Determining

 The Relative Concentration of Expressed Messenger RNA <130>98,429-A <140> <141>1999-10-14 <150>US09/186,869 <151>1998-11-04 <160>51 <170>PatentIn Vet. 2.0 <210>1 <211>14 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>1 aactggaaga attc                                                               14 <210>2 <211>14 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>2 gaattcaact ggaa                                                               14 <210>3 <211>46 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>3 aactggaaga attcgcggcc gcaggaattt tttttttttt tttttv                            46 <210>4 <211>47 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>4 aactggaaga attcgcggcc gcaggaattt tttttttttt tttttvn                  47 <210>5 <211>48 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>5 aactggaaga attcgcggcc gcaggaattt tttttttttt tttttvnn                 48 <210>6 <211>47 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>6 gaattcaact ggaagcggcc cgcaggaatt tttttttttt ttttttv                  47 <210>7 <211>48 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>7 gaattcaact ggaagcggcc cgcaggaatt tttttttttt ttttttvn                 48 <210>8 <211>49 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>8 gaattcaact ggaagcggcc cgcaggaatt tttttttttt ttttttvnn                49 <210>9 <211>116 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:multiple cloning site <400>9 gagctccacc gcggtgtcac gactatctgc ggccgcatgc ccgggaatgg cgcctcgaga    60 cgtctttatc gataccgtcg acctcgaact cgagacgtcc cgggcgccta ggtacc      116 <210>10 <211>113 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:multiple cloning site <400>10 gagctcgttt tcccagtcac gactatctgc ggccgcatgc ccgggaatgg cgcctcgaga  60 cgttatcgat tagcctgact gaagactcga gacgtcccgg gcgcctaggt acc         113 <210>11 <211>113 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:multiple cloning site <400>11 gagctcgttt tcccagtcac gactatctgc ggccgcatgc ccgggaatgg cgcctcgaga  60 cgtctatatc gattagcctg actgaagact cgagacgtcc cgggctaggt acc         113 <210>12 <211>62 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:multiple cloning site <400>12 gcggccgcat agatctgata tcggatcctc accacagagc tcagtgagag agatctctcg  60 ag                                                                 62 <210>13 <211>62 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:multiple cloning site <400>13 gcggccgcat ccatgggata tcgcatgctc accacagtcg acagtgagag ccatggctcg  60 ag                                                                 62 <210>14 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>14 aggtcgacgg tatcgg                                                  16 <210>15 <211>17 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>15 aggtcgacgg tatcggn                                                         17 <210>16 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>16 aggtcgacgg tatcggnn                                                        18 <210>17 <211>19 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>17 aggtcgacgg tatcggnnn                                                       19 <210>18 <211>20 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>18 aggtcgacgg tatcggnnnn                                                      20 <210>19 <211>21 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>19 aggtcgacgg tatcggnnnn n                                                    21 <210>20 <211>22 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>20 aggtcgacgg tatcggnnnn nn                                               22 <210>21 <211>15 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>21 ggtcgacggt atcgg                                                       15 <210>22 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>22 ggtcgacggt atcggn                                                      16 <210>23 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>23 gtcgacggta tcggnn                                                      16 <210>24 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>24 tcgacggtat cggnnn                                                      16 <210>25 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>25 cgacggtatc ggnnnn                                                      16 <210>26 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>26 gacggtatcg gnnnnn                                                        16 <210>27 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>27 acggtatcgg nnnnnn                                                         16 <210>28 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>28 agctctgtgg tgaggatc                                                      18 <210>29 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>29 gctctgtggt gaggatcn                                                      18 <210>30 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>30 ctctgtggtg aggatcnn                                                      18 <210>31 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>31 tctgtggtga ggatcnnn                                                       18 <210>32 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>32 ctgtggtgag gatcnnnn                                                       18 <210>33 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>33 tgtggtgagg atcnnnnn                                                       18 <210>34 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>34 gtggtgagga tcnnnnnn                                                       18 <210>35 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>35 tcgactgtgg tgagcatg                                                       18 <210>36 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>36 cgactgtggt gagcatgn                                                     18 <210>37 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>37 gactgtggtg agcatgnn                                                     18 <210>38 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>38 actgtggtga gcatgnnn                                                     18 <210>39 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>39 ctgtggtgag catgnnnn                                                     18 <210>40 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>40 tgtggtgagc atgnnnnn                                                     18 <210>41 <211>18 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>41 gtggtgagca tgnnnnnn                                                     18 <210>42 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>42 cgacggtatc ggggtg                                                        16 <210>43 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>43 cgacggtatc ggtgca                                                        16 <210>44 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>44 cgacggtatc ggagca                                                        16 <210>45 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>45 cgacggtatc gggggt                                                        16 <210>46 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>46 cgacggtatc ggctca                                                        16 <210>47 <211>15 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>47 gagctccacc gcggt                                                   15 <210>48 <211>16 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>48 gagctcgttt tcccag                                                  16 <210>49 <211>22 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>49 gtcttcagtc aggctaatcg  gn                                          22 <210>50 <211>22 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>50 cctcgaggtc gacggtatcg gn                                           22 <210>51 <211>481 <212>DNA <213>Artificial Sequence <220> <223>Description of Artificial Sequence:synthetic

 primer <400>51 gtcgacggta tcggctcaag tgactgactg tctagaactt taccattacg gagagatgat  60 gatcagtaac caagattatc ttggactatc tttaggttct ttaaaaaaac tgcttattac 120 caacctttgt agctgaccta agatctttgt gcctgttatg taaaaagttt ggaatgtatt 180 gttaaactta gccaacgact ggcttttcag cagtgctcaa aagaagagta tcatcagctg 240 gagattttcc tgctatgctg tagcctacct ccccgatgtc ctttccgcta tatttggcaa 300 atgtattgat ttatggtctt ttgttctatg gctataagac tgcgtgtaaa cctctttcac 360 agtagaacat gtaattctgg gaaacccgaa tctctgttac taagcactat tcactcaaag 420 ttgcctcaga ataaactttc tttgggtttt aaaaaaaaaa aaaaaaaatt cctgcggccg 480 c                                                                 481

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈