首页 / 专利库 / 病理 / 结直肠癌 / 一种结直肠癌预后早期预警的诊断试剂盒及其应用

一种结直肠癌预后早期预警的诊断试剂盒及其应用

阅读:1019发布:2020-06-13

专利汇可以提供一种结直肠癌预后早期预警的诊断试剂盒及其应用专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 结直肠癌 预后 早期预警的 诊断 试剂 盒 及其应用。本发明利用Spearman转移模型发现如下13个与结直肠癌预后相关的免疫相关基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因,并通过实验验证上述13个免疫相关基因与结直肠癌预后相关,可以作为标志物用于辅助预测结直肠癌患者的术后生存时间。,下面是一种结直肠癌预后早期预警的诊断试剂盒及其应用专利的具体信息内容。

1.检测13个基因表达平的物质在制备结直肠癌患者预后的产品中的应用;
或检测13个基因表达水平的物质在结直肠癌患者预后中的应用;
所述13个基因为AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。
2.检测13个基因表达水平的物质在制备辅助预测结直肠癌患者术后生存时间的产品中的应用;
或检测13个基因表达水平的物质在辅助预测结直肠癌患者术后生存时间中的应用;
所述13个基因为AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。
3.根据权利要求1或2所述的应用,其特征在于:所述检测13个基因表达水平的物质为检测所述13个基因表达水平所需的试剂和/或仪器。
4.一种产品,为检测13个基因表达水平的物质;
所述13个基因为AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。
5.根据权利要求4所述的产品,其特征在于:所述检测13个基因表达水平的物质为检测所述13个基因表达水平所需的试剂和/或仪器。
6.根据权利要求4或5所述的产品,其特征在于:所述产品为试剂盒
7.权利要求4-6所述的产品在制备结直肠癌患者预后的产品中的应用;
或权利要求4-6所述的产品在结直肠癌患者预后中的应用;
或权利要求4-6所述的产品在制备辅助预测结直肠癌患者术后生存时间的产品中的应用;
或权利要求4-6所述的产品在辅助预测结直肠癌患者术后生存时间中的应用。
8.如下13个基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因作为标志物在制备结直肠癌患者预后的产品中的应用;
或如下13个基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因作为标志物在结直肠癌患者预后中的应用。
9.如下13个基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因作为标志物在制备辅助预测结直肠癌患者术后生存时间的产品中的应用;
或如下13个基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因作为标志物在辅助预测结直肠癌患者术后生存时间中的应用。

说明书全文

一种结直肠癌预后早期预警的诊断试剂盒及其应用

技术领域

[0001] 本发明属于生物技术领域,具体涉及一种结直肠癌预后早期预警的诊断试剂盒及其应用。

背景技术

[0002] 结直肠癌(Colorectal cancer,CRC)在世界范围内的男性中是第三大高发肿瘤(746,000新发病例,占所有肿瘤的10.0%),女性中为第二大高发肿瘤(614,000新发病例,占所有肿瘤的9.2%)。即使近年来在结直肠癌分子机制上取得了很大的进步,结直肠癌在所有癌种中仍然具有很高的致死率。研究发现结直肠癌以及其他癌种中均存在着惊人的肿瘤异质性。在不同的细胞微环境或者不同临床处理中,基因组不稳定所引起的细胞亚克隆形成是肿瘤的异质性的根本来源。因此一种与肿瘤在细胞行为学和分子特征上相似的,但没有大量异质性的模型来研究肿瘤,才能克服肿瘤异质性的干扰。
[0003] 早在150多年前Rudolf Virchow首次提出肿瘤的发生发展遵循着与胚胎发育相同的法则。胚胎发育与肿瘤之间的密切联系的报道最近有很多。很多在胚胎发育中起到重要作用的基因在癌进展过程中都扮演着重要的色。基于胚胎发育的动物模型,科学家们发现了很多新的肿瘤相关的分子、通路和标志物。胚胎发育和肿瘤进展在细胞行为上也有很多的相似性,比如上皮-间质转化(epithelial-to-mesenchymal transition,EMT)、间质-上皮转化(mesenchymal-to-epithelial transition,MET)以及免疫逃逸。这些发现提供了十分重要的线索,那就是可以把肿瘤看作是一种在胚胎发育过程中累积许多打击(基因突变,自由基损伤,外界因素等)而异变的器官。从这个角度来说,那些让器官脱离正常轨道的分子,很可能是促成肿瘤发生发展的元凶。
[0004] 正如之前所说,由于肿瘤存在明显的异质性(体现在基因突变、亚克隆组成、生物学行为、时间、空间、结构、功能、甚至患者心理状态等),仅仅通过为肿瘤本身进行传统研究很难排除肿瘤异质性的干扰,因此无法获得反映肿瘤内在规律的诊断、分期、分型标准。

发明内容

[0005] 本发明的一个目的是提供检测13个基因表达平的物质的新用途;
[0006] 所述13个基因为AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。
[0007] 本发明提供了检测上述13个基因表达水平的物质在制备结直肠癌患者预后的产品中的应用。
[0008] 本发明还提供了检测上述13个基因表达水平的物质在结直肠癌患者预后中的应用。
[0009] 本发明还提供了检测上述13个基因表达水平的物质在制备辅助预测结直肠癌患者术后生存时间的产品中的应用。
[0010] 本发明还提供了检测上述13个基因表达水平的物质在辅助预测结直肠癌患者术后生存时间中的应用。
[0011] 上述应用中,所述检测13个基因表达水平的物质为检测所述13个基因表达水平所需的试剂和/或仪器。
[0012] 本发明的另一个目的是提供一种产品。
[0013] 本发明提供的产品为检测13个基因表达水平的物质;
[0014] 所述13个基因为AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。
[0015] 上述产品中,所述检测13个基因表达水平的物质为检测所述13个基因表达水平所需的试剂和/或仪器。
[0016] 上述产品或应用中,所述试剂和/或仪器可为利用现有技术中的方法检测所述13个基因表达水平所需的试剂和/或仪器,如利用高通量测序检测所述13个基因表达水平所需的试剂和/或仪器,或利用定量PCR检测所述13个基因表达水平所需的试剂和/或仪器,或利用northern杂交技术检测所述13个基因表达水平所需的试剂和/或仪器,或利用基因芯片检测所述13个基因表达水平所需的试剂和/或仪器。
[0017] 上述应用中,所述基因芯片可利用美国Agilent公司Gene Expression Hybridization kit(5188-5242)芯片进行。
[0018] 上述应用中,所述检测13个基因表达水平的物质还可包括数据处理系统,所述数据处理系统用来分析现有技术中的方法直接得到的结果,确定所述13个基因的表达水平。所述数据处理系统可为软件和/或模
[0019] 上述产品中,所述产品为试剂盒。
[0020] 本发明还有一个目的是提供上述产品的新用途。
[0021] 本发明提供了上述产品在制备结直肠癌患者预后的产品中的应用。
[0022] 本发明还提供了上述产品在结直肠癌患者预后中的应用。
[0023] 本发明还提供了上述产品在制备辅助预测结直肠癌患者术后生存时间的产品中的应用。
[0024] 本发明还提供了上述产品在辅助预测结直肠癌患者术后生存时间中的应用。
[0025] 本发明的最后一个目的是提供如下13个基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因作为标志物的新用途。
[0026] 本发明提供了上述13个基因作为标志物在制备结直肠癌患者预后的产品中的应用。
[0027] 本发明还提供了上述13个基因作为标志物在结直肠癌患者预后中的应用。
[0028] 本发明还提供了上述13个基因作为标志物在制备辅助预测结直肠癌患者术后生存时间的产品中的应用。
[0029] 本发明还提供了上述13个基因作为标志物在辅助预测结直肠癌患者术后生存时间中的应用。
[0030] 在实际应用中,可通过比较这13个免疫基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因在待测患者和正常样本血液中的表达量来判断待测结直肠癌患者的术后生存时间。具体判断标准可为如下1)或2):
[0031] 1)AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量均为正值,且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量均为负值的待测对象的术后生存时间长于AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量不均为正值,或MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量不均为负值的待测对象,即AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量均为正值,且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量均为负值的结直肠癌患者的术后生存时间更长;
[0032] 2)AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的表达量均高于正常样本,且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的表达量均低于正常样本的待测对象的术后生存时间长于AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的表达量均高于正常样本,或MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的表达量均低于正常样本的待测对象,即AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的表达量均高于正常样本,且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的表达量均低于正常样本的结直肠癌患者的术后生存时间更长。
[0033] 2)中,所述表达量高于正常样本体现为相对表达量为正值;所述表达量低于正常样本体现为相对表达量为负值;所述相对表达量为用美国Agilent公司Gene Expression Hybridization kit(5188-5242)芯片检测得到。
[0034] 上述应用或产品中,所述预后为术后生存时间的预后。
[0035] 本发明利用Spearman转移模型发现如下13个与结直肠癌预后相关的免疫相关基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。并通过实验验证13个与结直肠癌预后相关的免疫相关基因与结直肠癌患者术后生存时间相关,这13个免疫基因可以作为标志物用于结直肠癌预后。附图说明
[0036] 图1为利用Spearman转移模型寻找结直肠癌预后相关的免疫相关基因的生物信息学流程。
[0037] 图2为在三个阶段中665个DVIGs的Pearson相关性热图及密度曲线。
[0038] 图3为Spearman相关模型及AUC-RF算法寻找最优集合。
[0039] 图4为Kaplan-Meier生存分析检测13个免疫基因对结直肠癌预后的预测作用。
[0040] 图5为利用随机抽样的方式检验方法的可信性。

具体实施方式

[0041] 下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
[0042] 下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0043] 下述实施例中的定量试验,均设置三次重复实验,结果取平均值。
[0044] 下述实施例中的13个基因的信息如表5所示:
[0045] 表5、13个基因的信息
[0046]
[0047]
[0048] 实施例1、与结直肠癌预后相关的免疫相关基因的获得
[0049] 本实施例利用Spearman转移模型发现与结直肠癌预后相关的免疫相关基因AXL(序列1)、BCL3(序列2)、ABR(序列3)、MAP3K1(序列4)、CASP8(序列5)、RPS6KA1(序列6)、VASP(序列7)、SIRT1(序列8)、BCL2L1(序列9)、AKIRIN2(序列10)、PIN1(序列11)、MEF2A(序列12)和PCBP2(序列13),利用Spearman转移模型发现与结直肠癌预后相关的免疫相关基因的生物信息学流程如图1所示。具体步骤如下:
[0050] 一、实验材料
[0051] 1、人类结直肠胚胎发育组织标本及分类
[0052] 本发明的20例人类结直肠胚胎发育样本为2007-2009年取自北京市海淀区妇幼保健医院处理的人工流产术,所有流产孕妇均签署知情同意书,并剔除孕妇合并有遗传性疾病或其他疾病如糖尿病或自身免疫病的样本。
[0053] 结直肠胚胎发育样本包括6例排卵期后3-5周的完整胚胎(whole embryo或者bud)、6例排卵期后8-10周的早期胚肠(early embryonic colons,EarlyColon)和8例排卵期后14-22周的中期胚肠(middle embryonic colons,MiddleColon)。人类胚胎发育学研究表明,排卵后第7周的人胚胎结肠组织未形成肠腔,只有胚胎间质包围的未分化细胞;第9周可以观察到肠腔,细胞呈现柱状上皮的特征;第12周时肠腔完全形成,肠上皮分化完全,可见杯状细胞、成熟的纤维细胞和肌肉组织。据此,将8-10周的胎肠样本划分为早期胎肠组,即还未形成肠腔和分化完全的上皮细胞;将14-22周的胎肠样本划分为中期胎肠组,即己形成完整的肠腔和成熟的肠上皮。样本收集过程规范,未发生明显的RNA降解(RNA完整性经Agilent 2100Bioanalyzer系统鉴定评分大于等于5分)。
[0054] 2、人类结直肠正常粘膜样本、癌进展腔镜组织和带有生存信息的结直肠癌手术样本
[0055] 本发明的12例正常结直肠粘膜样本为2009-2010年取自北京世纪坛医院肛肠外科接收痔疮手术的患者。
[0056] 癌进展腔镜组织样本包括2008-2011年在中国医学科学院肿瘤医院腔镜科接受检查或治疗的58例结直肠腺瘤和47例结直肠腺癌患者的肿瘤组织标本。样本入组标准:患者行内镜检查或治疗前未接受过放射治疗和/或化学药物治疗;活检组织经资深病理科医师诊断证实为腺瘤(管状、绒毛状或管状绒毛状)或腺癌;根据结直肠肿瘤的维也纳分类标准(修订版)将肿瘤样本分为低级别腺瘤组、高级别腺瘤组和侵袭性腺癌。52例带有总生存信息的结直肠癌手术切除样本取自浙江大学医学院临床样本。收集的临床样本各项临床资料完整,且样本收集过程规范,未发生明显的RNA降解(RNA完整性经Agilent 2100Bioanalyzer系统鉴定评分大于等于5分)。上述所有患者本人均签署知情同意书,并剔除合并有遗传性疾病或其他疾病如糖尿病或自身免疫病的样本。
[0057] 3、公共数据库结直肠癌数据收集整理
[0058] 在GEO数据库中搜索到5套具有生存数据的结直肠癌mRNA分子表达谱数据。为了消除不同平台之间的系统误差,分子表达谱的数据均源自Affymetrix HG-U133A Plus2(GPL570)平台。下载的5套Affymetrix平台表达谱芯片数据的原始信号值(raw data),一共包含有1094例样本,52475个探针的相对表达量。利用Bioconductor的“affy”软件包RMA算法(robust multi-array average)和分位数法(quantile normalization)进行信号值的提取和归一化,然后用ComBat算法对批次效应(batch effect)进行校正。在这5套数据中,GSE17536、GSE17537和GSE39582既含有总生存信息(overall survival,OS)又含有无病生存信息(disease-free survival,DFS);GSE39084仅含有总生存信息,而GSE14333仅含有无病生存信息。如果多个探针对应一个基因,那么这些探针表达值的中位值被定义为这个基因的相对表达量,最后得到20184个基因的相对表达值。整理的结直肠癌具有生存信息的GEO样本如表1所示:
[0059] 表1、为评价所得基因集合预后预测能所收集的Affymetrix芯片数据
[0060]
[0061] 缩写:NR,没有报道。注意:GSE39582含有566例样本,其中有明确总生存信息的562例,而557例样本含有明确的无病生存信息。
[0062] 二、结直肠癌差异表达的免疫基因
[0063] 1、结直肠癌差异表达的基因显著富集在“免疫系统通路”
[0064] 利用SAM算法寻找正常结直肠粘膜和结直肠癌组织中差异表达基因(Differentially expressed genes,DEGs),包括3,226显著在结直肠癌中上调的基因和2,
538个显著下调的基因(FDR<1e-07)。然后利用DAVID生物信息学资源库6.7(http://david.abcc.ncifcrf.gov/)对这些差异基因进行Reactome富集(Reactome enrichment analysis),富集结果如表2所示,富集结果发现这些差异基因显著富集于“免疫系统通路”这个Reactome term下(Bonferroni-adjusted p value=0.004),暗示着癌变进展与免疫相关基因的紧密联系。
[0065] 表2、结直肠癌差异表达基因的Reactome富集结果
[0066]
[0067]
[0068] 2、人肠发育与结直肠癌变基因表达谱分析
[0069] 将所有的结直肠胚胎发育及癌变过程样本均进行mRNA芯片表达谱的杂交,其中60例样本进行了miRNA分子表达谱的杂交,这60例样本包括两例全胚样本、6例早期胚肠样本、8例中期胚肠样本、11例正常成人结直肠粘膜样本、9例腺瘤样本和24例结直肠癌样本。
[0070] 将Feature Extraction软件提取的mRNA芯片和miRNA芯片原始数据用GeneSpring GX 11.5进行数据归一化(Normalization)处理。对于mRNA芯片来说,筛选在至少一个时间点的全部样品中有表达信号的探针进行后续分析。其中,若存在不同探针对应一个基因的情况,这些探针信号的中位值定义为这个基因的相对表达量。对于miRNA芯片来说,纳入分析的miRNA必须在每类样本中有50%以上的样本中有可以被检测到的信号值,最终得到了96个miRNA表达值的miRNA分子表达谱。芯片的原始数据和标准化后的数据都已上传到美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)基因表达数据库(Gene Expression Omnibus,GEO)中,Accession number分别是GSE71187(mRNA data)和GSE71130(miRNA data)。
[0071] 首先在Gene Ontology数据库(http://www.geneontology.org)找到GO:0006955term(免疫相关基因)下的1028个基因,其中972个基因在miRNA分子表达谱数据中。
通过ANOVA方法找到人类结直肠不同的发育阶段:全胚(WE或者Bud)、早期胚肠
(EarlyColon)、中期胚肠(MiddleColon)和正常成人胚肠(Normal)过程中差异表达的665个免疫相关基因(development-varying immune-related genes,DVIGs)(FDR<0.0001)。
[0072] 三、建立Spearman转移模型
[0073] 结直肠的胚胎发育阶段(WE、EarlyColon、MiddleColon和Normal)、癌前阶段(adenoma)和癌阶段(adenocarcinoma)的基因分子表达谱囊括了人类结直肠从生到死的各个阶段。胚胎发育是一个非常规则的生物学进程,免疫基因和免疫基因之间保持着高度协同一致,从而确保整个胚胎发育过程安全顺利。但是在癌进展阶段(癌前阶段和癌阶段),这种高度的协同一致性可能被打破,也就是协同性失调。因此本发明提出Spearman转移模型去寻找在癌变过程中导致免疫基因协同性失调的“元凶基因”,具体步骤如下:
[0074] (1)建立665个DVIGs在结直肠三个阶段的Pearson相关系数热图
[0075] 在结直肠胚胎发育阶段(n=32)、癌前阶段(n=58)和癌阶段(n=47)的分子表达谱中分别计算665个发育阶段变化的免疫相关基因(development varying immune related genes,DVIGs)两两之间的Pearson相关系数,建成了结直肠胚胎发育、癌前进展和癌阶段665x 665的Pearson相关系数的热图(图2),并且对不同数据集的样本数进行了校正(Coradjusted=E(Cor)=Cor*(1-p)),从而消除不同样本数所带来的偏倚。如果两个基因A和B的相关性系数为1或者-1,那么这两个基因的表达模式高度的协同一致;但如果相关性系数接近0,这表示这两个基因的表达量看起来更像是随机事件,没有相互的联系,那么A和B生物学相关的概率可能不大。在整个胚胎发育阶段,根据Pearson热图来看,665个DVIGs可以被很明显的聚成三类,但是在癌前阶段和癌阶段,这种DVIGs的明显聚类消失了。建立三个阶段Pearson相关性系数的密度曲线,结果显示在胚胎发育阶段,密度曲线呈双峰分布,然后在癌前阶段和癌阶段均呈单峰分布,并且癌阶段的密度曲线明显比癌前阶段的曲线形状高瘦,暗示在胚胎发育阶段,免疫基因的表达高度协同一致,而在癌变过程中,这种协同一致性逐步紊乱。
[0076] (2)建立Spearman转移模型
[0077] 首先在每一个阶段的热图中,利用非监督聚类算法(unsupervised clustering algorithm,UCA)对DVIGs进行聚类,从而得到三个对称的热图。然后在癌前阶段和癌阶段热图中的基因按照胚胎发育阶段进行重排。这样所有的DVIGs在三个阶段中排列的顺序一致。那么对于每一个DVIG来说,在任何一个热图中,它与所有DVIGs(包括该基因自己)的相关性可以组成一个665长度的向量。因此每一个基因在三个阶段中会对应着三个向量:依次定义为发育阶段免疫基因内向量(development intra-immune vector,DIV)、癌前阶段免疫内向量(progression intra-immune vector,PIV)以及癌阶段免疫内向量(cancer intra-immune vector,CIV)。在每一个免疫基因所属的免疫内向量中,相对于自己的相关性值(correlation=1,对于Spearman转移模型没有意义)作为缺失值处理,并用相邻两个值的均值插值。例如,一个免疫内向量为X1,X2,……,Xk-1,Xk,Xk+1,……X664,X665。如果Xk=1(相对于自身的相关性值),那么Xk=(Xk-1+Xk+1)/2.如果X1=1,则X1=X2;如果X665=1,则X665=X664。对于每一个DVIG来说,其免疫内向量代表基因与其他免疫基因的生物相关性。因此,在从胚胎发育到癌前到癌阶段的转化中,如果一个DVIG的相关性排秩发生了剧烈的变化(出现协同性失调),则这些DVIGs可能在癌启动和进展中起到非常重要的作用。
[0078] 因此,为了寻找导致协同性失调的免疫基因而设计的Spearman转移模型包括两部分从胚胎发育到癌前阶段的Spearman转移(Spearman transition between development and progression,STD-P)和癌前到癌阶段的Spearman转移(Spearman transition between progression and cancer,STP-C)。其中,从胚胎发育到癌前阶段的Spearman转移(STD-P)是指DIV和PIV的Spearman相关性系数,而癌前到癌阶段的Spearman转移(STP-C)是指PIV和CIV的Spearman相关性系数。STD-P的数值表示某DVIG从胚胎发育到癌前阶段相关性模式的扰动,而STP-C表示在癌前到癌阶段的转化中相关性模式的扰动。如果DVIG A的STD-P(A的DIV和PIV的Spearman correlation)接近1,表示在发育阶段到癌前阶段的转化中,A和其他DVIGs的生物相关性的排秩没有发生变化;如果STD-P接近-1,则代表A和其他DVIGs的生物相关性的排秩发生了倒置;如果STD-P接近0,则代表A和其他DVIGs的生物相关性排秩被随机打乱了。同理,A基因的STP-C则表示癌前到癌阶段转化过程中这种生物相关性排秩的改变情况。因此,将DVIGs在癌前阶段和癌阶段的Pearson热图的基因排序按照胚胎发育阶段进行排列,把665个DVIGs中每一个的DVIG的STD-P(x轴)和STP-C(y轴)投射到一个直角坐标系中,那么每个DVIG在坐标系的不同位置表示了该基因在从正常生长发育到癌前到癌阶段生物相关性排秩发生紊乱的程度。点(1,1)被定义为理想稳定点(theoretically stable point,TSP)。如果一个基因在Spearman转移坐标系中的位置为(1,1),则在整个转化过程中该基因于其他基因的生物相关性排秩是绝对稳定的。那么这
665个DVIGs离TSP越近,则该基因在整个癌进展过程中的免疫基因内协同性越稳定。将距离TSP小于1的DVIG定义为“乖巧基因”(obedient genes),其对协同性失调的贡献相对较少,可能所包含的结直肠癌预后信息较少;将距离TSP大于1的DVIG定义为“歧途基因”(diversion genes),其对协同性失调的贡献相对较多,可能所包含的结直肠癌预后信息较多。在665个DVIGs中,385个DVIGs与TPS的距离小于1,被定义为“乖巧基因”,剩下280个DVIGs被定义为“歧路基因”。280个歧路基因作为接下来基因筛选的基因集合。
[0079] 四、建立miRNA-mRNA调控网络筛选有miRNA调节的歧路基因
[0080] 本发明通过miRNA-mRNA序列预测算法(miRanda,TargetScan,PicTar)和miRNA及mRNA芯片数据(60例活检样本既有miRNA数据又有mRNA数据)建立miRNA-mRNA调控网络。一个miRNA-mRNA关系对必须满足两个以上预测算法,并且该miRNA和mRNA的表达值显著的负相关(FDR<0.01)。从而筛选出具有miRNA调控的歧路基因。结果显示有37个miRNA调控59个歧路基因。那么这59个有miRNA调控的歧路基因作为接下来基因筛选的基因集合。
[0081] 五、利用AUC-RF算法进行基因集优化
[0082] 在52例手术切除的结直肠癌样本中,选取19例生存期长于5年和22例生存期短于5年的样本去训练随机森林机器算法模型。利用mean decrease Gini(MDG)评分对基因进行排序,排位越靠前,对该模型分类的准确性贡献越大。利用留一法(leave one out cross validation,LOOCV)评估受检样本的差预后投票率(Poor voting),然后用受试者工作特征曲线(receiver operating characteristic,ROC)进行检验。基因从之前MDG排列的底部开始递归的去除,直到ROC曲线下面积(area under ROC curve,AUC)最大,此时的基因集被认为是区分生存的最优基因集合。该方法在之前的研究中被为AUC-RF算法。
[0083] 为了从59个歧路基因中选出具有最好的预后预测能力的基因集,利用随机森林算法基于每个歧路基因对于区分结直肠癌总生存的贡献值对这59个基因进行排序。逐步从基因集中去除最不重要的基因(每次一个),直到ROC曲线下面积得到最大值(AUC=0.904,95%CI:0.799-1.000),此刻剩下的基因集便是最终算法优化的基因集(图3B)。最终得到13个具有miRNA调控的歧路基因,它们分别是AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因。ROC曲线的结果显示这13个基因的灵敏度为81.8%(95%置信区间:0.636-
0.955),特异度为89.5%(95%置信区间:0.737-1.000),具有很好的区分结直肠癌总生存的能力(图3C)。
[0084] 五、Kaplan-Meier生存分析
[0085] 在4套GEO数据库下载的Affymetrix数据集中通过Kaplan-Meier生存分析来验证这13个基因对结直肠癌生存的区分能力。
[0086] Log-rank检验证实了13个基因AXL、BCL3、ABR、MAP3K1、CASP8、RPS6KA1、VASP、SIRT1、BCL2L1、AKIRIN2、PIN1、MEF2A、PCBP2的表达量与4套数据的总生存有显著的联系(GSE17536,n=177,p=0.0054;GSE17537,n=55,p=0.0039;GSE39582,n=562,p=0.13;GSE39084,n=70,p=0.11,图4A)。
[0087] 此外,这13个免疫基因的表达量也与4套数据的无病生存显著相关(GSE17536,n=177,p=0.0018;GSE17537,n=55,p=0.016;GSE39582,n=557,p=4.4e-05;GSE14333,n=
226,p=0.032,图4B)。
[0088] 六、Cox回归分析
[0089] Cox回归检验证实这13个免疫基因集合是预测结直肠癌总生存(危害比:1.759,95%置信区间:1.126-2.746,p=0.013)和无病生存(危害比:2.116;95%置信区间:1.324-
3.380:p=0.002)的独立预后因素。
[0090] 表3、213例结直肠癌患者的单因素和多因素Cox回归分析
[0091]
[0092]
[0093] *按照13个基因集合第一主成分(PC1)的排秩将患者分为两组。P值显著的加粗显示(p<0.05)。
[0094] 七、利用随机抽取的方式证实本研究方法的可信性
[0095] 为了证实本研究方法的可信性,分别在972个免疫相关基因、665个DVIGs、280个歧路基因和59个miRNA调控的歧路基因中随机抽取13个基因2000次,然后同时区分结直肠癌生存数据集(GSE17536和GSE17537中的总生存和无病生存,GSE39582和GSE14333中的无病生存)。
[0096] 随机抽取的13个基因集合同时区分上述数据集的次数依次是0、0、9和33(图5)。这充分证明了每一次将免疫基因集进行筛选,确实都是在逐步富集结直肠癌的预后信息。
[0097] 实施例2、免疫相关基因在结直肠癌患者预后中的应用
[0098] 1、供试样品
[0099] 供试样品包括10例带有总生存信息的结直肠癌手术切除样本和2例正常成人结直肠粘膜样本。收集的临床样本取自浙江大学医学院临床样本,各项临床资料完整,且样本收集过程规范,未发生明显的RNA降解(RNA完整性经Agilent 2100Bioanalyzer系统鉴定评分大于等于5分)。上述所有样本均取得了患者的知情同意书,并且剔除了合并有遗传性疾病或其他疾病如糖尿病或自身免疫病的样本。10例样本术后生存时间分别为患者1(7.32年)、患者2(7.15年)、患者3(6.82年)、患者4(7.23年)、患者5(6.16年)、患者6(8.19年)、患者7(5.1年)、患者8(5.67年)、患者9(0.66年)、患者10(1.73年)。
[0100] 2、相对表达量的检测
[0101] 分别对步骤1中的10例结直肠癌患者的待测样本进行mRNA芯片表达谱(美国Agilent公司Gene Expression Hybridization kit(5188-5242)芯片)的杂交,并利用Feature Extraction软件提取mRNA芯片原始数据用GeneSpring GX 11.5进行数据归一化(Normalization)处理,得到实施例1获得的13个与结直肠癌预后相关的免疫相关基因AXL、BCL3、ABR、MAP3K1、CASP8、RPS6KA1、VASP、SIRT1、BCL2L1、AKIRIN2、PIN1、MEF2A和PCBP2的相对表达水平(如某一供试样本的某一免疫基因的相对表达量为正值,则表明该结直肠癌患者样本的该免疫基因的表达量高于正常样本;如某一供试样本的某一免疫基因的相对表达量为负值,则表明该结直肠癌患者样本的该免疫基因的表达量低于正常样本)。
[0102] 检测结果如表4所示。表4中列出了10例结直肠患者中13个与结直肠癌预后相关的免疫相关基因的相对表达量。从表中可以看出:AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量均为正值(高于正常样本),且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量均为负值(低于正常样本)的结直肠癌患者的术后生存时间长于AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量不均为正值(高于正常样本),或MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量不均为负值(低于正常样本)的结直肠癌患者。因此本发明的13个与结直肠癌预后相关的免疫相关基因AXL、BCL3、ABR、MAP3K1、CASP8、RPS6KA1、VASP、SIRT1、BCL2L1、AKIRIN2、PIN1、MEF2A和PCBP2可用于结直肠癌患者术后生存时间的预后。
[0103] 表4、13个与结直肠癌预后相关的免疫相关基因的表达量
[0104]
[0105] 注:表5中列出了13个免疫基因的相对表达水平。
[0106] 在实际应用中,可通过分析这13个免疫基因:AXL基因、BCL3基因、ABR基因、MAP3K1基因、CASP8基因、RPS6KA1基因、VASP基因、SIRT1基因、BCL2L1基因、AKIRIN2基因、PIN1基因、MEF2A基因和PCBP2基因在待测患者血液中的表达量来判断待测结直肠癌患者的术后生存时间。具体判断标准如下:在以结直肠癌患者为待测对象时,AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量均为正值(高于正常样本),且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量均为负值(低于正常样本)的待测对象的术后生存时间长于AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量不均为正值(高于正常样本),或MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量不均为负值(低于正常样本)的待测对象,即AXL基因、BCL3基因、ABR基因、CASP8基因、RPS6KA1基因、VASP基因、PIN1基因、MEF2A基因和PCBP2基因的相对表达量均为正值(高于正常样本),且MAP3K1基因、SIRT1基因、BCL2L1基因和AKIRIN2基因的相对表达量均为负值(低于正常样本)的结直肠癌患者的术后生存时间更长。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈