首页 / 专利库 / 病理 / 结直肠癌 / 结直肠癌的预后

结直肠癌预后

阅读:153发布:2020-05-11

专利汇可以提供结直肠癌预后专利检索,专利查询,专利分析的服务。并且一种通过分析一组基因的表达从而提供 结直肠癌 预后 的方法。多种介质如微阵列中的基因表达模式也包括在内,如含有它们的 试剂 盒 。,下面是结直肠癌预后专利的具体信息内容。

1、一种评估结直肠癌状况的方法,包括鉴定选自Seq ID No.1,Seq ID No.2, Seq ID No.3和Seq ID No.4的基因的组合中每个基因(相对于正常群体中相同 基因的表达)的差异调节。
2、权利要求1所述的方法,其中基因的组合为Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4。
3、权利要求1所述的方法,其中基因的组合为Seq ID No 2,Seq ID No.3和 Seq ID No.4。
4、权利要求1所述的方法,其中受调节基因的表达至少存在2倍差异。
5、权利要求1所述的方法,其中表示差异调节的p值小于0.05。
6、权利要求1所述的方法,进一步包括不基于遗传的结直肠癌诊断。
7、一种诊断文库,包括从选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4的基因的组合的分离核酸序列,它们的互补序列,或其部分。
8、权利要求7所述的文库,其中基因的组合为Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4。
9、权利要求7所述的文库,其中基因的组合为Seq ID No.2,Seq ID No.3和 Seq ID No.4。
10、权利要求7所述的文库,位于适用于鉴定其中所含的基因的差异表达 的基质中。
11、权利要求10所述的文库,其中所述的基质用于微阵列中。
12、权利要求11所述的文库,其中所述的微阵列是cDNA微阵列。
13、权利要求11所述的文库,其中所述的微阵列是寡核苷酸微阵列。
14、一种用于确定结直肠癌患者的预后试剂盒,包括用于检测选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4的基因的组合的分离核酸序列, 它们的互补序列,或其部分的物质。
15、权利要求14的试剂盒,其中所述的基因为Seq ID No.2,Seq ID No.3和 Seq ID No.4。
16、权利要求14的试剂盒,其中所述的基因为Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4。
17、权利要求14的试剂盒,包括进行微阵列分析的试剂。
18、权利要求14的试剂盒,进一步包括所述的核苷酸序列,它们的互补 序列,或其部分通过其进行分析的介质。
19、一种评估对结直肠癌治疗的反应的方法,包括在选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4的基因的组合中鉴定每个基因(相对于正 常群体中相同基因的表达)的差异调节。
20、用于评估结直肠癌状况的制品,包括用于鉴定选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4的基因的组合的核酸序列,它们的互补序列, 或其部分的物质。
21、用于评估结直肠癌状况的制品,包括选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4的基因的组合的分离核酸序列,它们的互补序列,或其 部分的表示物。

说明书全文

技术领域

发明涉及一种基于生物样品基因表达模式的结直肠癌预后方法。

背景技术

结直肠癌是一种起源复杂的异源疾病。一旦患者接受结直肠癌治疗,复发 的可能性与肿瘤穿透肠壁的程度和淋巴结累及的存在或缺乏有关。这些特征构 成了目前杜克分类定义的分期系统的基础,杜克A类疾病被定义为结肠或直肠 的黏膜下层。杜克B类肿瘤通过固有肌层侵入,而且能穿透结肠或直肠壁。 杜克C类疾病包括具有区域淋巴结转移而致的任何程度的肠壁侵入。
外科切除术对早期的结直肠癌是很有效的,它对杜克A类患者和B类患 者分别能提供95%和75%的治愈率。在杜克C类患者中存在阳性淋巴结预计 在5年内复发的可能性为60%。手术后阶段对杜克C类患者进行化疗,可把 复发率降至40%-50%,它是现阶段治疗杜克C类患者的标准治疗方法。由于 相对低的复发率,手术后的化疗在杜克B类患者中的益处很难检测,而且还存 有争议。但是,杜克B分类并不完善,因为大约有20-30%的杜克B类患者其 表现更类似于杜克C类患者,而且在5年时间内复发。很显然有必要确定比淋 巴结累及更好的预后因子,来指导筛选杜克B类患者中可能复发和将存活的 人。

发明内容

本发明涉及一种评估在诊断患有结直肠癌或对结直肠癌进行治疗的患者中 结直肠癌复发的可能性的方法。该方法涉及基因表达模式(profile)的分析。
在本发明的一个方面,所述的基因的表达模式包括至少三个基因。
在本发明的另一个方面,所述的基因表达描述包括至少四个基因。
用于实施本发明的方法的制品也是本发明的一个方面。这些制品包括固定 于机器可读介质如计算机可读介质上的基因表达模式,或基因表达模式的表示 物(representations)。
用于鉴定基因表达模式的制品,也包括用于捕获和/或显示基因表达的存 在,缺乏或程度的基体或表面,如微阵列。
本发明的另一个方面为一种试剂盒,其包括进行结直肠癌复发预后的基因 表达分析的试剂。
附图说明
图1是患者样品(x-轴)中人脂肪酸结合蛋白基因1强度的测量值(y-轴) 的图示。强度越大,表明基因表达越强,该图说明在复发患者中这些基因被下 调。
图2是患者样品(x-轴)中人肠肽相关转运基因强度的测量值(y-轴)的 图示。强度越大,表明基因表达越强,该图说明在复发患者中这些基因被下调。
图3a是患者样品(x-轴)中MHC II类抗原(HLA-DRB1)基因强度的 测量值(y-轴)的图示。强度越大,表明基因表达越强,该图说明在复发患者 中这些基因被下调。
图3b是患者样品(x-轴)中免疫球蛋白样转录蛋白5基因强度的测量值 (y-轴)的图示。强度越大,表明基因表达越强,该图说明在复发患者中这些 基因被下调。
图4是根据实施例中描述的训练组的患者资料构建的标准Kaplan-Meier 图。
图5是根据实施例中描述的测试组的患者资料构建的标准Kaplan-Meier 图。
图6是根据实施例中描述的所有的患者资料构建的标准Kaplan-Meier 图。
图7是标准的ROC曲线。

具体实施方式

组织样品中,仅仅是特定核苷酸序列的存在或缺乏很少被认为具有诊断或 预后的价值。另一方面,各种蛋白质,肽或mRNA表达的信息正越来越受到 重视。仅仅基因组内具有表达蛋白质,肽或mRNA潜能的核酸序列(这种序 列被称为“基因”)的存在,本身不能确定蛋白质,肽或mRNA是否在特定细 胞中表达。能表达蛋白质,肽或mRNA的一个特定基因是否表达蛋白质,肽 或mRNA以及如果表达,这种表达发生的程度,由多种复杂因素决定。不考 虑理解和评估这些因素的困难,测定基因表达能为如肿瘤发生,转移,细胞凋 亡及其它临床相关现象等重要事件的出现提供有用信息。在基因表达模式中可 以发现基因激活或失活程度的相对指标。本发明的基因表达模式用于为结直肠 癌提供预后和治疗。
样品制备需要收集患者样品。本发明方法中使用的患者样品是那些被怀疑 含有患病细胞,如从结肠样品或手术野边缘得到的上皮细胞的样品。一种获得 被怀疑样品的有用的技术是激光捕获显微切割法(LCM)。LCM技术提供了一 种筛选要研究的细胞的方法,并最小化了由细胞类型的不均一导致的变异。因 此,正常细胞和癌症细胞间基因表达的中度或细小的差异都可以被容易地检测 到。在一种优选的方法中,所述样品包括从外周血中提取的循环表皮细胞。这 些样品可以根据多种方法获得,但是最优选的方法为磁分离技术,该技术描述 于Imunivest公司的美国专利6136182中,该专利在此引入作为参考。一旦获 得了含有感兴趣细胞的样品,就可以提取RNA并进行扩增,获得处于合适的 文库(portfolios)中的基因的基因表达模式,优选的是通过微阵列获得。
建立基因表达模式的优选的方法,包括确定编码蛋白质或肽的基因产生的 RNA的量。这可通过逆转录酶PCR(RT-PCR),竞争性RT-PCR,实时RT-PCR, 差异展示RT-PCR,Northern印迹分析和其它的相关实验来完成。尽管可能使 用各个PCR反应完成这些技术,最好扩增mRNA产生的互补DNA(cDNA) 或互补RNA(cRNA),并通过微阵列法进行分析。各种不同的阵列构型和生 产方法,对于本领域的普通技术人员来说是已知的,并描述于美国专利,如 5445934;5532128;5556752;5242974;5384261;5405783;5412087;5424186; 5429807;5436327;5472672;5527681;5529756;5545531;5554501;5561071; 5571639;5593839;5559695;5624711;5658734;和5700637;在此引入它们 的公开内容作为参考。
微阵列技术可以同时测量成千的基因的处于稳态mRNA平,由此为确 定如失控的细胞增殖的启动,阻止,或调节的作用提供了一个强有的工具。 目前广泛使用的为两种微阵列技术。第一种是cDNA阵列,第二种是寡核苷酸 阵列。虽然这些芯片存在构造差异,但是基本上所有的下游数据分析和输出是 相同的。这些分析的结果,典型地是从用于检测与微阵列中已知位置的核苷酸 序列杂交的样品中的cDNA序列的标记探针接收的信号强度的测量值。典型 地,信号强度与在样品细胞中表达的cDNA以及的mRNA的量成比例。大量 的这种技术是可以获得和有用的。确定基因表达的优选的方法参见,Linsley等 的美国专利6271002;Friend等的美国专利6218122;Peck等的美国专利 6218114;Wang等的美国专利6004755,在此引入它们的公开内容作为参考。
可以通过比较所述强度来分析表达水平。最好建立一个测试样品与对照样 品中基因表达强度的比值矩阵。例如,可以把患病组织的基因表达强度,与从 相同类型的正常组织中得到的表达强度进行比较(例如,患病的结肠组织样品 与正常结肠组织样品)。这些表达强度的比值显示了测试样品与对照样品之间 在基因表达方面的成倍改变。
基因表达模式也可用很多方式显示。最常用的方法是将原始荧光强度或比 值矩阵排列为树状图,其中的列表示测试样品,行表示基因。这样排列数据以 便具有相似表达模式的基因能彼此接近。每个基因的表达比用一种颜色显示。 例如,小于1的比值(表示下调)可以用图谱的蓝色部分表示,而大于1的比 例(表示上调)可用图谱的红色部分来表示。商业化的计算机软件程序可用于 显示这种数据,这些软件包括来自Silicon Genetics公司的“GENESPRINT”, 以及来自Partek公司的“DISCOVERY”和“INFER”软件。
实施例中描述了本发明的方法中使用的受调节基因。差异表达的基因在结 直肠癌复发的患者中相对于那些无复发的患者是上调或下调的。上调和下调是 相对的术语,其含义为在相对于特定基线的基因表达量中的可检测到差异(超 出检测系统的噪音影响)。在这种情况下,基线是非复发患者的测量的基因表 达量。用同样方法测量,患病细胞(来自复发患者)中感兴趣的基因,相对于 基线水平是上调或者下调的。在上下文中,患病的,是指机体状态发生改变, 从而打断或干扰,或者可能干扰机体功能的正常表现,并伴随有细胞的不受孔 增殖现象的出现。当某人的基因型或表型的某个方面和某种疾病存在一致的时 候,他就被诊断为患了该病。但是,进行诊断或预后的行为包括疾病/状况问题 的测定,如测定复发的可能性和治疗的监测。在治疗监测中,通过比较随时间 的基因表达,来确定基因表达模式是否已经改变了,或者正在改变到和正常组 织更一致的模式来考虑一个确定疗程的效果,从而作出临床判断。
更优选地,可以根据杂交微阵列探针的强度测量值的成倍改变来辨别上调 和下调的水平。一个2.0倍差异或p值小于0.5优选用于作出这种区分。也就 是说,当一个基因被认为在患病/复发细胞中相对正常/非复发细胞中差异表达 前,患病细胞中应产生比正常细胞至少多2倍,或少2倍的强度。倍数差异越 大,越优选用该基因作为诊断或预后的工具。本发明的基因表达模式中选用的 基因具有能产生可以区别于正常或未调节基因的信号的表达水平,其表达量超 过了临床试验仪器的背景。
统计值可信赖地用于将受调节的基因与未调节基因和噪音区分开。统计试 验发现在不同组样品之间基因差异显著。斯氏t检验是可用于发现两组之间有 显著差异的有效统计检验的一个例子。P值越低,就越能说明不同组之间基因 的差异。不过,由于微阵列能一次测量多个基因,那么就需要同时进行数万个 统计检验。因此,不可能仅由于偶然看到小的p值,为了进行校正,可以使用 Sidak校正和随机化/置换实验。通过t检验得到的p值小于0.05表明基因存在 显著差异。在进行Sidak校正后p值小于0.05是更强有力的证据。对于每组中 具有大量的样品来说,在随机化/置换实验后p值小于0.05是差异显著的最强 有力的证据。
可以用于选择产生比未调节基因或噪音更强的信号的基因的另一个参数为 绝对信号差异测量值。优选地,受调节基因表达产生的信号,与正常的或未调 节基因(以绝对值为基础)相比至少有20%差异。更优选的是,这种基因的表 达模式与正常的或未调节基因的表达模式相比至少有30%的差异。
将基因分组,以便获得的关于关于组中的一系列基因的信息可以为临床相 关判断,如诊断,预后,或治疗选择等提供可靠的基础。这些基因系列构成了 本发明的文库。在此,由这些文库支持的判断涉及结直肠癌。对于大多数的诊 断标记来说,常常希望用最少的标记就足以作出一个正确的医学判断。这就防 止了需要进一步的分析导致的治疗延误以及时间和资源的不合理使用。
更优选地,建立文库,从而文库中的这些基因组合,显示出比单个基因或 随机选择的基因组合具有更好的灵敏度和特异性。在本发明中,文库的灵敏度 可以由基因在患病状态相对于正常状态的表达中显示的成倍变化反应出来。特 异性可以基因表达信号与感兴趣条件的相关性的统计学测量值反应出来。例 如,标准差可用作这种测量值。在考虑到包括在一个文库中的一组基因时,表 达测量值中标准差越小其特异性越大。其它变量的测量值如相关系数在这里也 可使用。
建立基因表达文库的一个优选的方法是通过使用最优化算法,如广泛用于 建立股票投资组合的平均方差算法。这种方法的详细描述见Tim Jatkoe等,2003 年3月21日提交的名为“文库选择”(“Portfolio Selection”)的专利申请。实 质上,这种方法要求建立一系列输入值(金融应用中的股票,这里指通过强度 检测的表达),该输入值将优化使用其接受的返回值(例如形成的信号),同时 使返回值的变异最小。很多商业软件程序可以用来进行这种操作。在整个说明 书中称为“Wagner软件”的“Wagner联合均值—方差优化应用程序”是优选 的。这个软件使用“Wagner联合均值—方差优化库”的功能来测定有效的边 界,同时在Markowitz意义上的优化文库是优选。
使用这种类型的软件要求转换微阵列数据,以便当该软件用于金融分析目 的时,数据能以使用股票返回值和险测量值的方式作为输入值而处理。例如, 当Wagner软件与微阵列强度测量值联合使用时,使用下面的数据转换方法。
首先通过确定那些至少显示出有细微表达水平差异的基因而对基因进行预 选。优选的预选过程如下。选择基线类(baseline class)。典型地,它包括来自一 个不具有感兴趣条件的群体的基因。例如,如果要选择用于对复发性结直肠癌 进行预后的基因文库,来自没有复发的患者的样品可用于构成基线类。一旦选 择了基线类,就要计算出算术平均值和标准差,作为基线类样品每个基因的基 因表达的指标。该指标典型的是微阵列读数的荧光强度。然后用计算出的统计 数据计算每个基因的基线值(X*标准差+平均值)。这是基因的基线读数,所有 其它样品可以和它比较。X是一个人为选择的严格变量,用以组成文库。高的 X值比低的X值更严格。优选地,X值的范围为0.5到3,更优选的是2到3, 最优选的为3。
然后计算每个试验样品(显示了感兴趣的条件)与基线读数的比值。为了 易于软件进行数据处理,这些比值被转换为底数为10的对数值。这可使基因 下调以显示负数值,它对使用Wagner软件根据Markman平均方差算法进行最 优化是必须的。
当用于金融分析目的时,将包含这些转换比值的预处理数据作为输入值, 从而替代在Wagner软件中通常使用的资产返回值。
一旦确定出了一个有效的边界,选择对一个给定的输入值(返回值)或对 应于边界上某个点的方差的最优化文库。这些输入值或方差是建文库的人预先 设定的标准。换句话说,寻找最优化文库的人确定一个可接受的输入水平(表 明敏感度)或一个给定水平的方差(表明特异性),并选择沿着与该输入水平 或方差相应的有效边界的基因。当选择了输入水平或方差时,Wagner软件就 能选择出这些基因。Wagner软件可以像对股票组合中每个股票所做的那样, 分配基因库中每个基因的权重。
将患者样品的文库中的基因表达,与用于建立该文库的差异表达基因的计 算值相比较,就可以确定该样品是否具有该文库所诊断的状况。优选地,首先 通过将文库中每个基因的强度值与文库选择过程中该基因分配的权重的乘积求 和而产生文库值。然后可以通过(Y*标准差+基线组文库值的平均值)来计算 边界值,其中Y是和上述的X有相同含义的严格性值。一个样品具有的文库 值大于基线类的文库值时,此样品就被归为具有该状况。如果需要,为了提高 置信水平,可以依照已知的统计方法来重复该过程。
任选的,可以重复这个过程直到获得最佳的预测准确性。
文库选择的过程和未知量的鉴定概述如下:
1.选择基线类
2.计算基线组样品中的每个基因的平均值和标准差
3.计算每个基因的(X*标准差+平均值)。这是基线读数,所有其它的样 品将和它进行比较。X是一个严格性变量,高的X值比低的X值更严格。
4.计算每个试验样品与在步骤3中计算的基线读数的比值。
5.转换比值,使比值小于1的为负数(如使用底数为10的对数)(下调基 因校正为具有MV优化所必须的负值)。
6.这些转换的比值用作输入值,来替代软件应用中通常使用的资产返回 值。
7.该软件将标绘出有效的边界,并沿着该有效边界的任何点返回优化的文 库。
8.在有效边界上选择理想的返回值或方差。
9.通过对每个基因的强度与文库选择算法产生的权重的乘积求和,计算每 个样品的文库值。
10.将基线组的平均文库值加上Y与基线组的文库值的标准差的乘积计算 得到边界值。比该边界值大的比值将被划分到试验组。
11.任选的,可以重复该过程直到获得最佳的预测准确性。
可选择地,可以通过确定那些有细小表达差异的基因来预先选择基因。在 这种可选择的方法中,预选过程优选的是基于 1 | ( μ t - μ n ) ( σ t + σ n ) | 给定的阈值,其中μt 是已知有疾病或状况的子集的平均值,μn是正常样品的子集的平均值,σt+σ n代表联合的标准差。在根据如 0.5 | ( μ t - MAX n ) ( σ t + σ n ) | 所述的关系来预选数据过程中, 也可以使用信噪比截止值。这保证基于差异调节预选的基因具有临床上的显著 差异。也就是,超过了适于测定各种诊断参数的仪器产生的噪音水平。对根据 这些标准预选的每一个标记,构建了一个矩阵,其中列代表样品,行代表标记, 而且每个元件都是根据 对该标记的表达进行标准化后所得到的强度测量 值,其中I是强度测量值。
也能设置附加的边界条件来限定最优文库。例如,文库大小可以限定到一 个固定范围或数量的标记。这可以通过制定更严格的数据预选标准(如以 0.8 | ( μ t - MAX n ) ( σ t + σ n ) | 代替 0.5 | ( μ t - MAX n ) ( σ t + σ n ) | ) , 或通过使用编程特征如限制文库大小来实 现。例如,可以设置边界条件,仅从最优的10个基因中选择有效的边界。也 可以使用所有的预选基因来确定有效边界,然后限定选择的基因的数量(例如, 不超过10)。
选择文库的过程也包括启发式规则的应用。优选地,这些规则是基于生物 学和用于得到临床结果的技术的理解而制定的。更优选地,它们也可用于从优 化的方法中输出数据。例如,文库选择的平均方差方法能用于结直肠癌患者中 大量差异表达基因的微阵列数据。从该方法中得到的输出值将是一系列优化的 基因,其包括一些既在外周血液中也在患病组织中表达的基因。如果用于测试 方法中的样品是获自外周血液,而且在乳癌中差异表达的某些基因也能在外周 血中差异表达,那么就可以应用启发式规则,其中从排除了那些在外周血液中 差异表达的基因的有效边界选择文库。当然,通过例如在数据预选中运用该规 则,可以在形成有效边界前运用该规则。
也可以运用与所讨论的生物学问题没有必然联系的其它启发式规则。例 如,可以运用只有特定百分比的文库能被特定的一种或多种基因所代表的规 则。商业化的软件,如Wagner软件,也容易提供这些类型的启发式规则。这 也是有用的,例如,当准确度和精确度以外的因素(如预期的许可费),对包 括一个或多个基因的需要性有影响时。
本发明的一种方法包括比较多种基因(或文库)的基因表达模式来进行预 后。组成文库的每个基因的基因表达模式被固定于如计算机可读介质等的介质 上。这可以采取多种形式。例如,可以建立一个表格,从而将指示疾病的信号 (例如,强度测量值)范围输入其中。比较实际患者的数据和表格中的数值, 从而确定患者样品是正常还是患病的。在一个更精确的实施方案中,表达信号 的模式(如荧光强度)以数字或图形方式记录。再将与患者样品相结合的基因 文库的基因表达模式与上述表达模式比较。模式比较软件可用于确定患者样品 是否具有指示疾病复发的模式。当然,这些比较也可用于确定患者是否可能经 历疾病复发。然后将样品表达模式与对照细胞文库相比较。如果样品表达模式 与结直肠癌复发的表达模式一致(无相反的医学考虑),那么该患者将以一个 复发患者对待。如果样品表达模式与正常/对照细胞的表达模式一致,那么该患 者被诊断为结直肠癌阴性。
许多公知的模式识别方法都可采用。下面的文献可以提供一些实例:
加权投票(Weighted Voting):
Golub,TR.,Sclonim,DK.,Tamaya,P.,Huard,C.,Gaasenbeek,M.,Mesirov,JP.,Coller, H.,Loh,L.,Downing,JR.,Caligiuri,MA.,Bloomfield,CD.,Lander,ES.癌症的分子分 类:利用基因表达监视的类型发现和类型预测。科学(Science)286:531-537, 1999
支持矢量机器(Support Vector Machines):
Su,AI.,Welsh,JB.,Sapinoso,LM.,Kem,SG.,Dimitrov,P.,Lapp,H.,Schultz,PG., Powell,SM.,Moskaluk,CA.,Frierson,HF.Jr.,Hampton,GM.利用基因表达标志的人类 癌症的分子分类。癌症研究(Cancer Researrch)61:7388-93,2001
Ramaswamy,S.,Tamayo,P.,Rifkin,R.,Mukherjee,S.,Yeang,GH.,Angelo,M.,Ladd, C.,Reich,M.,Latulippe,E.,Mesirov,JP.,Poggio,T.,Gerald,W.,Loda,M.,Lander,ES.,Gould, TR.利用肿瘤基因表达标志的多种癌症诊断。美国国家科学院院刊(Proceedings of the National Academy ofSciences ofthe USA)98:15149-15154,2001
K-最邻近值(K-nearest Neighbors):
Ramaswamy,S.,Tamayo,P.,Rifkin,R.,Mukherjee,S.,Yeang,GH.,Angelo,M.,Ladd, C.,Reich,M.,Latulippe,E.,Mesirov,JP.,Poggio,T.,Gerald,W.,Loda,M.,Lander,ES.,Gould, TR.利用肿瘤基因表达信号的多种类癌症诊断。美国国家科学院院刊(Proceedings ofthe National Academy of Sciences of the USA)98:15149-15154,2001
校正系数(Correlation Coefficients):
van’t Veer LJ,Dai H,van de Vijver MJ,He YD,Hart AA,Mao M,Peterse HL,van der Kooy K,Marton MJ,Witteveen AT,Sehreiber GJ,Kerkhoven RM,Roberts C,Linsley PS,Bernards R,Friend SH.基因表达模式预测乳腺癌的临床结果。自然 (Nature)2002 Jan 31:415(6871):530-6。
本发明的基因表达模式也可以与在癌症诊断,预后,或治疗监视中使用 的其它非遗传诊断方法联合使用。例如,在一些情况下,把上述的基于基因表 达诊断能力的方法,与来自传统的标记,如血清蛋白标记物(如癌胚抗原)的 数据结合起来是有益的。这种存在的标记范围包括分析物如CEA。在这样的一 个方法中,从治疗的患者中定期采血,然后对上述的血清标记之一进行酶免疫 测定。当标记物的浓度显示肿瘤复发或治疗失败时,可对样品源进行基因表达 分析。对于存在疑似的肿的部位,可以进行细针吸取采样,然后用上述方法 对从肿块采集的细胞进行基因表达模式分析。可选择地,可以从与先前肿瘤切 除的组织相邻的区域采集组织样品。当其它测试结果不明确时,这种方法是特 别有效的。
本发明的制品包括在治疗,诊断,预后和评估疾病中使用的基因表达模 式的表示物。这些模式表示物压缩至一种可被机器自动读取的介质,如计算机 可读介质(磁性的,光学的及类似的)。制品也可包括在这种介质中评估基因 表达模式的说明。例如,制品也可包括CD ROM,它具有比较上述基因文库的 基因表达模式的计算机说明。制品也可包括数字化记录在其中的基因表达模 式,以便用于与患者样品的基因表达数据进行比较。可选择地,模式可以不同 的表示形式记录。图形记录就是这样一种格式。上面提到的Partek公司的 “DISCOVERY”和“INFER”软件中整合的聚类算法,能最好的协助这些数 据可视化
本发明的制品的不同类型,是用于揭示基因表达模式的介质或格式化的 测定。这些可以包括,例如,微阵列,其中序列互补物或探针固定于基质上, 指示感兴趣基因的序列与之结合产生一种确定其存在的可读判定。可选择地, 本发明的制品可被制作成试剂盒,用于进行杂交,扩增,和产生表示检测结直 肠癌的感兴趣基因表达水平的信号。
根据本发明制备的试剂盒,包括确定基因表达模式的格式化测定。这些 也包括进行测定所需的所有的或部分的物质,如试剂和说明。
本发明进一步地通过下面的非限制性实施例进行说明。
实施例:根据本发明进行分析的基因,典型地与编码蛋白质或肽产物的 全长核酸序列相关。本领域的普通技术人员公认,全长序列的鉴定从分析的 度来说不是必需的。也就是,可以根据熟知的为评估相关基因表达而设计探针 的原理进行部分序列或ESTs选择。
实施例1-样品处理和LCM
收集接受结直肠肿瘤外科手术患者的新鲜冷冻组织样品。使用的样品来自 根据标准的临床诊断和病理学分期为杜克B类的63个患者。患者的临床结局 已知。36个患者已经超过3年没有患病,27个患者在3年内肿瘤复发。
组织在获得后20-30分钟内于液氮中快速冷冻,然后在-80℃下储存。为 了激光捕获,将样品切片(6μm),并将一切片封固于载玻片上,另一切片封 固于已被固定于玻璃载玻片(Micro Slides Colorfrost,VWR Scientific,Media,PA) 上的膜(P.A.L.M.)上。封固于玻璃载片上的切片随后在冷的丙中固定,并 用Mayer’s苏木精(Sigma,St.Louis,MO)染色。病理学家将该为样品用于诊断 和分期而进行分析。根据外科病理学分析和验证杜克分类体系的临床报告来评 价其临床阶段。封固于膜上的切片随后在100%乙醇中固定5分钟,在曙红/100% 乙醇(100μg曙红溶于100ml脱水乙醇)中负染1分钟,快速在100%乙醇中 浸泡一次以除去游离的染料,并空气中干燥10分钟。
在LCM使用前,膜(LPC-MEMBERANE PEN FOIL 1.35μm No.8100,P.A.LM.GmbH Mikrolaser Technologie,Bemried,Germany)和载玻片经 过预处理以除去RNA酶,并且增强组织样品在膜上的附着。简要的,载玻片 用DEP H2O洗涤,膜用RNA酶AWAY(Moleclar Bioproducts,Inc.,San Diego,CA)洗涤并用DEP H2O冲洗。膜附着到载玻片上后,载玻片于+120℃ 烘烤8小时,用TI-SAD(Diagnostic Products Corporation,Los Angeles,CA,以1∶50 溶于DEP H2O,用脱脂过滤)处理,+37℃孵育30分钟。使用前,立即将10 μl RNA酶抑制剂溶液等分物(RNA酶蛋白质抑制剂2500U=33U/μl N211A,Promega GmbH,Mannheim,Germany,0.5μl溶于400μl冷的含有0.15mol NaCl,10mmol Tris pH8.0,0.25mmol二硫苏糖醇的溶液)铺展到膜上,在此封 固组织样品。
封固于膜上的组织切片用于LCM。利用连接于Zeiss Axiovert 135显微镜 (Carl Zeiss Jena GmbH,Jena,Germany)的PALM Robot微光束技术(P.A.L.M. Microlaser Technologie,Carl Zeiss,Inc.,Thomwood,NY)可捕获约2000个上皮 细胞/样品。正常粘膜周围的基质和癌症样品中偶然的干扰基质成分都包括在 内。捕获到的细胞置于100%乙醇的小管中于-80℃保存。
实施例2-RNA提取和扩增
利用Zymo-Spin柱(Zymo Research,Orange,CA92867)从LCM捕获的样 品中提取总RNA。将约2ng的总RNA重悬于10μl水并且利用T7 RNA聚合 酶进行两轮扩增产生约为50μg的扩增的RNA。
实施例3-cDNA微阵列杂交和定量
用从Affymetrix公司获得并商业化的人U133a芯片,利用包括约23,000 个人的cDNA克隆的一套cDNA微阵列来检测样品。获得总RNA并用上述的 制备方法制备,将其应用于芯片并根据制造商的使用说明采用Agilent BioAnalyzer进行分析。所有的63个样品均通过质量控制标准检测,并将数据 用于标记物选择。
芯片强度数据通过Affymetrix公司商业化的5.0版本的MAS软件(“MAS 5.0”)进行分析。如下所述,进行无监督分析用于确定区别复发患者和不复发 患者的两个基因。采用上述方法获得的芯片强度数据,作为输入值输入商业化 的PARTEK5.1版软件的无监督聚类软件中。这种无监督聚类算法确定了一组 高频率复发的20个患者(13个复发者和7个存活者)。从最初的23,000个基 因中,t-检验分析选择了在这些患者中显著差异表达的276个基因。从该组中, 选择了能最好区别复发患者和不复发患者的两种基因:人肠肽相关转运蛋白 (Seq ID No.3)和人脂肪酸结合蛋白1(Seq ID No.1)。在该患者组中,这两种 基因在复发患者中下调(实际上,它们被关闭或不表达)。该结果示于图1和 图2中,其中信号强度(y-轴)对患者样品数(x-轴)作图。
监督分析用于更进一步区别剩下的43个患者中的复发患者和不复发患 者。这组患者数据分为如下的组:27个患者被分配至训练组,16个患者被分 配至测试组。这确保了同样的数据不用于先确定标记,然后再验证它们的用途。
对训练组进行不等方差t检验。从有显著相关p值的一列28个基因中, 选择MHC II-DR-B。这些基因在复发者中是下调的。MHC II-DR-B(Seq ID No.2)也有最小的p值(图3a)。
在另一轮附加的监督分析中,采用上述的Partek 5.0版本软件来实现用于 线性辨别分析的变量选择程序,从而在训练组中区别复发者和存活者。该搜索 方法为正向选择。经最低后误差选择的变量为免疫球蛋白样转录蛋白5(Seq ID No.4)(图3b)。然后用Cox比例危险模型(用nsightful公司的“S Plus”软件) 进行基因选择,用于证实上述基因选择的存活时间。在全部27个循环的每个循 环中,训练组中27个患者中的每一个都进行该步骤,剩下的26个患者采用单 变量Cox回归模型来评估基因表达与患者存活时间相关性的强度。这种相关性 的强度,由相应的估计的标准化参数估计值和从Cox模型回归返回的P值来评 价。0.01的P值为用作从留一法(leave-one-out)基因选择的每个循环中选择 最高基因的域值。然后比较那些从每个循环中选择的最高基因,以便从全部27 个留一法(leave-one-out)基因选择循环中选择出至少有26次显示上调的那 些基因。总共选择出了70个基因,MHC II-DR-B和免疫球蛋白样转录蛋白 5也在其中(再一次,显示下调)。
多基因预测标准的构建:通过线性辨别分析,用两个基因,MHC II-DR-B 和免疫球蛋白样转录蛋白5,产生预测标准。投票分数被定义为复发的后验概 率。如果患者的分数高于0.5,患者被划分到复发者一类。如果患者的分数低 于0.5,患者被划分到存活者一类。在训练组中测验该预测标准(表1)。对预 测的复发者和存活者构建Kaplan-Meier曲线(图4)。
交叉证实和预测标准评估:预测标准应该基于一个独立数据组来确定,因 为大多数分类方法在用于它们的建立的实例中都很有效。16个患者的测试组被 用于评估预测的准确性。分类的截止值通过使用ROC曲线(图5)来确定。 根据选择的截止值,确定并概括了测试组中复发和存活患者的正确预测数目(表 2)。根据预测的复发者和存活者构建了Kaplan-Meier曲线(图6)。
总体预测:63个杜克B结直肠癌患者的基因表达模式确定了在这些患者中 差异表达(下调或关闭)的4个基因。这些基因是Seq ID No.1,Seq ID No.2,Seq ID No.3,和Seq ID No.4。这些患者中有36个已经超过3年无病,而27个患者 在3年内肿瘤复发。用Seq ID No.2,Seq ID No.3,和Seq ID No.4这3个基因 标记物文库,正确地确定了27个复发患者中的22个和36个无病患者中的27 个。结果显示了该方法具有82%的灵敏度和75%的特异性。阳性预测值是71 %,阴性预测值是84%(表3)。根据预测的复发者和存活者构建了Kaplan-Meier 曲线(图6)。
包括本发明模式的基因在下文中描述。 人脂肪酸结合蛋白1(FABP1):
人的肝脂肪酸结合蛋白(L-FABP)基因首先由Smith LC等在 Bio.Chem.260(5),2629-2632(1985)中从肝脏cDNA文库中鉴定出。L-FABP 包含127个基酸残基。脂肪酸结合蛋白是一个能结合长链脂肪酸和其它的疏 水配体的小而高度保守的细胞质蛋白质家族。研究认为,FABPs的功能包括脂 肪酸摄取,转运和代谢。它们也可能负责调节细胞的生长和增殖。L-FABP与 在结肠组织中特异性表达的I-FABP有显著的同源性。
人肠肽相关转运蛋白HPT-1mRNA:
来自Eli Lilly公司的一组科学家鉴定了这个基因。论文发表于Science,1994 年4月15日,264(5157):430-3。这个基因编码一个大约92kda的膜蛋白, 它的氨基酸序列表明,这个转运相关蛋白与依赖性,细胞—细胞粘附蛋白的 钙粘着蛋白超家族共有几个保守结构元件。
人MHC II类抗原(HLA-DRB1)mRNA:
这个基因于1997年在一个西班牙婴儿中首次发现,并发表于组织抗原 (Tissue Antigens),1997年1月,49(6):658-61。正如其名称表示的那样, 它属于MHC II类抗原超家族。这个基因编码267个氨基酸的蛋白质。
人克隆6的免疫球蛋白样转录蛋白5的mRNA:
该基因编码一个不仅由NK和T细胞的亚型表达,也由B细胞,单核细 胞,巨噬细胞和树突细胞表达的免疫球蛋白超家族的抑制性MHC I类受体的 蛋白产物。该分子包含194个氨基酸。序列发表在J Exp Med,1997年12月1 日,186(11):1809-18上。该受体结合了MHC I类分子,并递送抑制NK和 T细胞导致的杀伤,以及抑制B细胞抗原受体和人组织相容性白细胞抗原 (HLA)-DR引发的B细胞和骨髓单核细胞中的Ca2+动员的负信号。
人羟甲基胆色烷合成酶(也可称为胆色素原脱氨基酶-PBGD):
该基因作为对照基因。这是实体瘤和正常组织间的一个最少变异的基因。 其序列首次发表于Nucleic Acids Res,14(15),5955-5968(1986)。
表1.在训练组中采用2基因预测标准的预测准确度 研究    样品数  正确预测 复发       6        5 存活者    21       21 灵敏度    83% 特异性   100%
表2.在测试组中采用2基因预测标准的预测准确度 研究    样品数  正确预测 复发      8        4 存活者    8        7 灵敏度    50% 特异性    88%
表3.对全部患者采用3基因预测标准(Seq ID 2,Seq ID 3,Seq ID 4)的预测准 确度 研究    样品数  正确预测 复发      27       22 存活者    36       28 灵敏度    82% 特异性    75%
                                   序列表
<110>Y.王
<120>结直肠癌的预后
<130>CDS5005
<140>tbd
<141>2003-03-31
<160>5
<170>PatentIn version 3.1
<210>1
<211>489
<212>DNA
<213>人
<400>1
agagccgcag gtcagtcgtg aagagggagc tctattgcca ccatgagttt ctccggcaag     60
taccaactgc agagccagga aaactttgaa gccttcatga aggcaatcgg tctgccggaa    120
gagctcatcc agaaggggaa ggatatcaag ggggtgtcgg aaatcgtgca gaatgggaag    180
cacttcaagt tcaccatcac cgctgggtcc aaagtgatcc aaaacgaatt cacggtgggg    240
gaggaatgtg agctggagac aatgacaggg gagaaagtca agacagtggt tcagttggaa    300
ggtgacaata aactggtgac aactttcaaa aacatcaagt ctgtgaccga actcaacggc    360
gacataatca ccaataccat gacattgggt gacattgtct tcaagagaat cagcaagaga    420
atttaaacaa gtctgcattt catattattt tagtgtgtaa aattaatgta ataaagtgaa    480
ctttgtttt                                                            489
<210>2
<211>853
<212>DNA
<213>人
<400>2
gcctgctgct ctggcccctg gtcctgtcct gttctccagc atggtgtgtc tgaggctccc     60
tggaggctcc tgcatggcag ttctgacagt gacactgatg gtgctgagct ccccactggc    120
tttggctggg gacaccagac cacgtttctt ggagtactct acgtctgagt gtcatttctt    180
caatgggacg gagcgggtgc ggtacctgga cagatacttc cataaccagg aggagaacgt    240
gcgcttcgac agcgacgtgg gggagttccg ggcggtgacg gagctggggc ggcctgctgc    300
ggagcactgg aacagccaga aggacctcct ggagcagaag cggggccggg tggacaacta    360
ctgcagacac aactacgggg ttgtggagag cttcacagtg cagcggcgag tccatcctaa    420
ggtgactgtg tatccttcaa agacccagcc cctgcagcac cataacctcc tggtctgttc    480
tgtgagtggt ttctatccag gcagcattga agtcaggtgg ttccggaatg gccaggaaga    540
gaagactggg gtggtgtcca caggcctgat ccacaatgga gactggacct tccagaccct    600
ggtgatgctg gaaacagttc ctcggagtgg agaggtttac acctgccaag tggagcaccc    660
aagcgtgaca agccctctca cagtggaatg gagagcacgg tctgaatctg cacagagcaa    720
gatgctgagt ggagtcgggg gctttgtgct gggcctgctc ttccttgggg ccgggctgtt    780
catctacttc aggaatcaga aaggacactc tggacttcag ccaagaggat tcctgagctg    840
aagtgcagat gac                                                       853
<210>3
<211>3345
<212>DNA
<213>人
<400>3
gaattccgtc tcgaccactg aatggaagaa aaggactttt aaccaccatt ttgtgactta     60
cagaaaggaa tttgaataaa gaaaactatg atacttcagg cccatcttca ctccctgtgt    120
cttcttatgc tttatttggc aactggatat ggccaagagg ggaagtttag tggacccctg    180
aaacccatga cattttctat ttatgaaggc caagaaccga gtcaaattat attccagttt    240
aaggccaatc ctcctgctgt gacttttgaa ctaactgggg agacagacaa catatttgtg    300
atagaacggg agggacttct gtattacaac agagccttgg acagggaaac aagatctact    360
cacaatctcc aggttgcagc cctggacgct aatggaatta tagtggaggg tccagtccct    420
atcaccatag aagtgaagga catcaacgac aatcgaccca cgtttctcca gtcaaagtac     480
gaaggctcag taaggcagaa ctctcgccca ggaaagccct tcttgtatgt caatgccaca     540
gacctggatg atccggccac tcccaatggc cagctttatt accagattgt catccagctt     600
cccatgatca acaatgtcat gtactttcag atcaacaaca aaacgggagc catctctctt     660
acccgagagg gatctcagga attgaatcct gctaagaatc cttcctataa tctggtgatc     720
tcagtgaagg acatgggagg ccagagtgag aattccttca gtgataccac atctgtggat     780
atcatagtga cagagaatat ttggaaagca ccaaaacctg tggagatggt ggaaaactca     840
actgatcctc accccatcaa aatcactcag gtgcggtgga atgatcccgg tgcacaatat     900
tccttagttg acaaagagaa gctgccaaga ttcccatttt caattgacca ggaaggagat     960
atttacgtga ctcagccctt ggaccgagaa gaaaaggatg catatgtttt ttatgcagtt    1020
gcaaaggatg agtacggaaa accactttca tatccgctgg aaattcatgt aaaagttaaa    1080
gatattaatg ataatccacc tacatgtccg tcaccagtaa ccgtatttga ggtccaggag    1140
aatgaacgac tgggtaacag tatcgggacc cttactgcac atgacaggga tgaagaaaat    1200
actgccaaca gttttctaaa ctacaggatt gtggagcaaa ctcccaaact tcccatggat    1260
ggactcttcc taatccaaac ctatgctgga atgttacagt tagctaaaca gtccttgaag    1320
aagcaagata ctcctcagta caacttaacg atagaggtgt ctgacaaaga tttcaagacc    1380
ctttgttttg tgcaaatcaa cgttattgat atcaatgatc agatccccat ctttgaaaaa    1440
tcagattatg gaaacctgac tcttgctgaa gacacaaaca ttgggtccac catcttaacc    1500
atccaggcca ctgatgctga tgagccattt actgggagtt ctaaaattct gtatcatatc    1560
ataaagggag acagtgaggg acgcctgggg gttgacacag atccccatac caacaccgga    1620
tatgtcataa ttaaaaagcc tcttgatttt gaaacagcag ctgtttccaa cattgtgttc    1680
aaagcagaaa atcctgagcc tctagtgttt ggtgtgaagt acaatgcaag ttcttttgcc    1740
aagttcacgc ttattgtgac agatgtgaat gaagcacctc aattttccca acacgtattc    1800
caagcgaaag tcagtgagga tgtagctata ggcactaaag tgggcaatgt gactgccaag    1860
gatccagaag gtctggacat aagctattca ctgaggggag acacaagagg ttggcttaaa    1920
attgaccacg tgactggtga gatctttagt gtggctccat tggacagaga agccggaagt    1980
ccatatcggg tacaagtggt ggccacagaa gtaggggggt cttccttaag ctctgtgtca    2040
gagttccacc tgatccttat ggatgtgaat gacaaccctc ccaggctagc caaggactac    2100
acgggcttgt tcttctgcca tcccctcagt gcacctggaa gtctcatttt cgaggctact    2160
gatgatgatc agcacttatt tcggggtccc cattttacat tttccctcgg cagtggaagc    2220
ttacaaaacg actgggaagt ttccaaaatc aatggtactc atgcccgact gtctaccagg    2280
cacacagact ttgaggagag ggcgtatgtc gtcttgatcc gcatcaatga tgggggtcgg    2340
ccacccttgg aaggcattgt ttctttacca gttacattct gcagttgtgt ggaaggaagt    2400
tgtttccggc cagcaggtca ccagactggg atacccactg tgggcatggc agttggtata    2460
ctgctgacca cccttctggt gattggtata attttagcag ttgtgtttat ccgcataaag    2520
aaggataaag gcaaagataa tgttgaaagt gctcaagcat ctgaagtcaa acctctgaga    2580
agctgaattt gaaaaggaat gtttgaattt atatagcaag tgctatttca gcaacaacca    2640
tctcatccta ttacttttca tctaacgtgc attataattt tttaaacaga tattccctct    2700
tgtcctttaa tatttgctaa atatttcttt tttgaggtgg agtcttgctc tgtcgcccag    2760
gctggagtac agtggtgtga tcccagctca ctgcaacctc cgcctcctgg gttcacatga    2820
ttctcctgcc tcagcttcct aagtagctgg gtttacaggc acccaccacc atgcccagct    2880
aatttttgta tttttaatag agacggggtt tcgccatttg gccaggctgg tcttgaactc    2940
ctgacgtcaa gtgatctgcc tgccttggtc tcccaataca ggcatgaacc actgcaccca    3000
cctacttaga tatttcatgt gctatagaca ttagagagat ttttcatttt tccatgacat    3060
ttttcctctc tgcaaatggc ttagctactt gtgtttttcc cttttggggc aagacagact    3120
cattaaatat tctgtacatt ttttctttat caaggagata tatcagtgtt gtctcataga    3180
actgcctgga ttccatttat gttttttctg attccatcct gtgtcccctt catccttgac    3240
tcctttggta tttcactgaa tttcaaacat ttgtcagaga agaaaaaagt gaggactcag    3300
gaaaaataaa taaataaaag aacagccttt tgcggccgcg aattc                    3345
<210>4
<211>1924
<212>DNA
<213>人
<400>4
ccatgacgcc cgccctcaca gccctgctct gccttgggct gagtctgggc cccaggaccc      60
gcatgcaggc agggcccttc cccaaaccca ccctctgggc tgagccaggc tctgtgatca     120
gctgggggag ccccgtgacc atctggtgtc aggggagcct ggaggcccag gagtaccaac     180
tggataaaga gggaagccca gagccctggg acagaaataa cccactggaa cccaagaaca     240
aggccagatt ctccatccca tccatgacac agcaccatgc agggagatac cgctgccact     300
attacagctc tgcaggctgg tcagagccca gcgaccccct ggagctggtg atgacaggat     360
tctacaacaa acccaccctc tcagccctgc ccagccctgt ggtggcctca ggggggaata     420
tgaccctccg atgtggctca cagaagggat atcaccattt tgttctgatg aaggaaggag     480
aacaccagct cccccggacc ctggactcac agcagctcca cagtgggggg ttccaggccc     540
tgttccctgt gggccccgtg acccccagcc acaggcgtgt ctaggaagcc ctccctcctg     600
accctgcagg gccctgtcct ggcccctggg cagagcctga ccctccagtg tggctctgat     660
gtcggctacg acagatttgt tctgtataag gagggggaac gtgacttcct ccagcgccct     720
ggccagcagc cccaggctgg gctctcccag gccaacttca ccctgggccc tgtgagccgc     780
tcctacgggg gccagtacag gtgctatggt gcacacaacc tctcctccga gtggtcggcc     840
cccagtgacc ccctggacat cctgatcaca ggacagatct atgacaccgt ctccctgtca     900
gcacagccgg gccccacagt ggcctcagga gagaacatga ccctgctgtg tcagtcacgg     960
gggtattttg acactttcct tctgaccaaa gaaggggcag cccatccccc actgcgtctg    1020
agatcaatgt acggagctca taagtaccag gctgaattcc ccatgagtcc tgtgacctca    1080
gcccacgcgg ggacctacag gtgctacggc tcacgcagct ccaaccccca cctgctgtct    1140
ttccccagtg agcccctgga actcatggtc tcaggacact ctggaggctc cagcctccca    1200
cccacagggc cgccctccac acctggtctg ggaagatacc tggaggtttt gattggggtc    1260
tcggtggcct tcgtcctgct gctcttcctc ctcctcttcc tcctcctccg acgtcagcgt    1320
cacagcaaac acaggacatc tgaccagaga aagactgatt tccagcgtcc tgcaggggct    1380
gcggagacag agcccaagga caggggcctg ctgaggaggt ccagcccagc tgctgacgtc    1440
caggaagaaa acctctagcc cacacgatga agacccccag gcagtgacgt atgccccggt    1500
gaaacactcc agtcctagga gagaaatggc ctctcctccc tcctcactgt ctggggaatt    1560
cctggacaca aaggacagac aggtggaaga ggacaggcag atggacactg aggctgctgc    1620
atctgaagcc tcccaggatg tgacctacgc ccagctgcac agcttgaccc ttagacggaa    1680
ggcaactgag cctcctccat cccaggaagg ggaacctcca gctgagccca gcatctacgc    1740
cactctggcc atccactagc ccggggggta cgcagacccc acactcagca gaaggagact    1800
caggactgct gaaggcacgg gagctgcccc cagtggacac cagtgaaccc cagtcagcct    1860
ggacccctaa cacagaccat gaggagacgc tgggaacttg tgggactcac ctgactcaaa    1920
gatg                                                                 1924
<210>5
<211>1536
<212>DNA
<213>人
<400>5
gtgacgcgag gctctgcgga gaccaggagt cagactgtag gacgacctcg ggtcccacgt      60
gtccccggta ctcgccggcc ggagcccccg gcttcccggg gccgggggac cttagcggca     120
cccacacaca gcctactttc caagcggagc catgtctggt aacggcaatg cggctgcaac     180
ggcggaagaa aacagcccaa agatgagagt gattcgcgtg ggtacccgca agagccagct     240
tgctcgcata cagacggaca gtgtggtggc aacattgaaa gcctcgtacc ctggcctgca     300
gtttgaaatc attgctatgt ccaccacagg ggacaagatt cttgatactg cactctctaa     360
gattggagag aaaagcctgt ttaccaagga gcttgaacat gccctggaga agaatgaagt     420
ggacctggtt gttcactcct tgaaggacct gcccactgtg cttcctcctg gcttcaccat     480
cggagccatc tgcaagcggg aaaaccctca tgatgctgtt gtctttcacc caaaatttgt     540
tgggaagacc ctagaaaccc tgccagagaa gagtgtggtg ggaaccagct ccctgcgaag     600
agcagcccag ctgcagagaa agttcccgca tctggagttc aggagtattc ggggaaacct     660
caacacccgg cttcggaagc tggacgagca gcaggagttc agtgccatca tcctggcaac     720
agctggcctg cagcgcatgg gctggcacaa ccgggtgggg cagatcctgc accctgagga     780
atgcatgtat gctgtgggcc agggggcctt gggcgtggaa gtgcgagcca aggaccagga     840
catcttggat ctggtgggtg tgctgcacga tcccgagact ctgcttcgct gcatcgctga     900
aagggccttc ctgaggcacc tggaaggagg ctgcagtgtg ccagtagccg tgcatacagc     960
tatgaaggat gggcaactgt acctgactgg aggagtctgg agtctagacg gctcagatag    1020
catacaagag accatgcagg ctaccatcca tgtccctgcc cagcatgaag atggccctga    1080
ggatgaccca cagttggtag gcatcactgc tcgtaacatt ccacgagggc cccagttggc    1140
tgcccagaac ttgggcatca gcctggccaa cttgttgctg agcaaaggag ccaaaaacat    1200
cctggatgtt gcacggcagc ttaacgatgc ccattaactg gtttgtgggg cacagatgcc    1260
tgggttgctg ctgtccagtg cctacatccc gggcctcagt gccccattct cactgctatc    1320
tggggagtga ttaccccggg agactgaact gcagggttca agccttccag ggatttgcct    1380
caccttgggg ccttgatgac tgccttgcct cctcagtatg tgggggcttc atctctttag    1440
agaagtccaa gcaacagcct ttgaatgtaa ccaatcctac taataaacca gttctgaagg    1500
taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa                              1536
1
7
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈