首页 / 专利库 / 生物学 / 预后指标 / C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法

C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法

阅读:838发布:2020-05-24

专利汇可以提供C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法专利检索,专利查询,专利分析的服务。并且本 发明 属于明涉及基因技术和医学领域,具体涉及C9orf139和MIR600HG作为胰腺癌 预后 标志物及其确立方法。所述的胰腺癌预后标志物,包括C9orf139和MIR600HG。通过探索胰腺癌的差异表达mRNA、lncRNA和miRNA,构建了ceRNA网络,以寻找可用于胰腺癌的新分子筛选 生物 标志物,为lncRNAs、miRNAs和胰腺癌mRNA提供新的分析机制和分子机制。本发明确定了两种新的生物标志物作为潜在的胰腺癌 预后指标 ,从而改善胰腺癌 疾病 的预后,提高早期诊断胰腺癌的准确性。,下面是C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法专利的具体信息内容。

1.一种作为胰腺癌预后标志物,其特征在于,包括C9orf139和MIR600HG。
2.C9orf139和MIR600HG作为胰腺癌预后标志物的确立方法,其特征在于,具体包括以下步骤:
1)检索数据并处理RNA序列数据:TCGA-https://gdc-portal.nci.nih.gov/获得了182例胰腺癌患者的相关数据,包括lncRNA,mRNA和miRNA表达谱, 在这182个胰腺癌样品中,从
4个受试者获得接近的的非肿瘤组织;通过RNASeqV2后处理管道的RNA测序原始读数产生lncRNA和mRNA表达谱,并且证明为RSEM通过期望 - 最大化的RNA-Seq标准化计数数据, 并且利用Illumina HiSeq 2000 miRNA测序平台进行miRNA表达谱,并证明为每百万miRNA映射数据的读数,由于mRNA、lncRNA和miRNA表达谱已经通过TCGA标准化,因此不对这些数据进行进一步的标准化;
2)差异表达分析和聚类分析:高通量测序是对生物学障碍后遗传变化的评估,即差异基,因此与正常组织相比,提取胰腺癌组织中的差异表达基因, 并且在logFC绝对值> 2和FDR调整后的P值<0.01之后使用R 3.4.3;使用Bioconductor包中的limma包进行基因差异表达分析,可在线获得:http://www.bioconductor.org/;然后在火山和热图图中描绘差异表达的mRNA、lncRNA、miRNA数据,为探究胰腺癌中差异表达的lncRNA、miRNA和mRNA如何被调节,进行无监督的层次聚类分析,并探索这些差异表达基因在胰腺癌样本和正常样本之间的表达模式;
3)预测miRNA靶向的lncRNA:在提取差异lncRNA和miRNA后,基于miRcode -http://www.mircode.org/和starBase v2.0-http://starbase.sysu.edu.cn/ 预测miRNA和lncRNA的关系,starBase数据库将探索来自Argonaute CLIP-Seq和Degradome-Seq数据的miRNA-mRNA关系图;
4)预测mRNA靶向的miRNA:通过使用数据库starBase、差异miRNA和mRNA提取差异miRNA加3p或5p锚,并在miRNA靶基因中匹配相应的miRNA-mRNA关系对,包括miRDB http://mirdb.org,miRTarBase http://mirtarbase.mbc.nctu.edu.tw/index.html和TargetScanhttp://www.targetscan.org/,因此得到与胰腺癌相关的miRNA-mRNA靶基因的关系;
5)构建ceRNA网络:通过使用Cytoscape v 3.6,基于ceRNA网络理论,logFC绝对值> 1和P值> 0.05构建并可视化网络graghic,作为最流行的开源软件工具之一,用于视觉探索由基因,蛋白质和其他类型的相互作用组成的生物医学网络,Cytoscape的功能是为研究人员提供一个多功能和交互式的视觉界面,用于探测复杂的生物互连,不同的注释和实验数据;
6)KEGG途径富集分析和临床特征分析:将差异表达的lncRNA输入到用于KEEG途径富集分析的注释,可视化和综合发现数据库DAVID中,为进一步分析lncRNAs与临床特征之间的特定关系,进行了临床特征分析,包括性别、种族肿瘤分级、AJCC肿瘤分期、AJCC TNM分期系统、新肿瘤事件、肿瘤状态和诊断年龄;
7)生存分析:为评估潜在生物标志物在胰腺癌中的预后表现,在之前的研究发现的
1165个mRNA,102个lncRNA和27个与胰腺癌相关的miRNA,它们在正常样本和胰腺癌样本之间差异表达,选择它们来进行总体生存曲线,通过生存包和qvalue包使用Kaplan-Meier方法与存活时间相关的基因,更重要的是P值<0.05被认为是合理的和统计的;充分利用临床信息制作单变量Cox比例险比模型,如果某些患者无法获得参数,则认为他们失踪,并且根据0.05的截止值筛选出显着的参数,所有差异表达的lncRNA适合于单变量Cox模型,基于lncRNA表达数据进行FDR调整,并且根据0.05的截止值选择显着的lncRNA,p值按升序排序,选择p <0.05的lncRNA进行多变量生存分析,通过使用R语言“存活”功能coxph()来显示利用选择的lncRNA构建风险评分分期模型,并获得相关系数,用R封装“ROCR”描绘了接收器操作特征曲线;为了探索更重要的基因,使用互动工具-http://bioinfogp.cnb.csic.es/tools/venny/index.html制作维恩图,结合总体生存和多变量生存分析;
8)统计分析:数据显示为平均值±SD,通过双样本t检验评估组间差异,并且P值小于
0.05被认为是符合统计学规律的,使用BRB-ArrayTools或R语言进行统计分析。

说明书全文

C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法

技术领域

[0001] 本发明涉及基因技术和医学领域,具体涉及C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法。

背景技术

[0002] 自1991年以来癌症死亡率下降了23%,但胰腺癌死亡率仍在上升。在美国,胰腺癌已成为癌症患者死亡的第四大原因。胰腺癌患者通常在晚期诊断,发生年死亡率几乎等于发病率。然而,传统的可识别的临床和病理症状在胰腺癌的早期诊断中存在缺陷。为了延长胰腺癌患者的总体存活率,需要寻找发病机制的新方法。越来越多的证据表明,分子生物标志物可以作为识别早期疾病患者的有前途的临床工具。因此,早期诊断的特异性和敏感性生物标志物的发现受到了极大的关注。
[0003] 在最近的研究中,由lncRNA,miRNA和mRNA组成的ceRNA网络被确认为胰腺癌的必需成分,ceRNA网络的失调代表了异常致癌基因表达的新机制。,ceRNA网络受许多因素调节,如RNA编辑、RNA二级结构、RNA结合蛋白、miRNA的结合亲和、ceRNA组分的丰度和亚细胞定位。例如最近的一项研究证实,hsa-mir-195、SF3B4、JQ1和I-BET762可以抑制胰腺癌细胞的增殖和侵袭。因此,这些基因可能成为胰腺癌的新治疗靶点。然而ceRNA网络的功能很复杂,需要进一步探索。因此,进一步的研究需要阐明ceRNA网络在胰腺癌中的作用。
[0004] LncRNA(≥200核苷酸)是指在许多生物途径中起重要作用的所有非蛋白质编码转录物。LncRNA通过结合靶RNA下调基因表达并诱导其降解或抑制其翻译。并且lncRNA在信号,诱饵,支架和引导能力中起作用。已经阐明了lncRNAs可以通过与DNA,信号传导,染色质,调节蛋白和一种细胞RNA物种的相互作用来引发功能性结果。越来越多的实验证据表明lncRNA可能调节ceRNA活性。并且ceRNA网络中的异常lncRNA将通过miRNA介导的lncRNA-mRNA ceRNA串扰相互作用促成基因表达变异。到目前为止,lncRNAs可能作为肝细胞癌,前列腺癌结直肠癌等的生物标志物。例如,肝细胞癌中的lncRNA已被证实为显着上调的转录本肝癌ENST00000434223已被证明可抑制癌细胞的增殖和迁移。

发明内容

[0005] 鉴于现有技术缺乏足够的生物标志物以便在早期阶段进行诊断并做出预后决定,并且大多数早期诊断为胰腺癌的患者患有的时不可切除和耐药的肿瘤。本发明提供C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法。通过探索胰腺癌的差异表达mRNA、lncRNA和miRNA,构建了ceRNA网络,以寻找可用于胰腺癌的新分子筛选生物标志物,为lncRNAs,miRNAs,胰腺癌mRNA提供新的分析机制和分子机制。本发明确定了两种新的生物标志物作为潜在的胰腺癌预后指标,从而改善胰腺癌疾病的预后,提高早期诊断胰腺癌的准确性。
[0006] 为了实现上述目的,本发明采用以下技术方案。
[0007] 一种作为胰腺癌预后标志物,包括C9orf139和MIR600HG。
[0008] C9orf139和MIR600HG作为胰腺癌预后标志物的确立方法,具体包括以下步骤。
[0009] 1.检索数据并处理RNA序列数据。
[0010] 从TCGA(https://gdc-portal.nci.nih.gov/)获得了182例胰腺癌患者的相关数据,包括lncRNA,mRNA和miRNA表达谱。在这182个胰腺癌样品中,从4个受试者获得接近的的非肿瘤组织。通过RNASeqV2后处理管道的RNA测序原始读数产生lncRNA和mRNA表达谱,并且证明为RSEM(通过期望-最大化的RNA-Seq)标准化计数数据。并且利用Illumina HiSeq 2000 miRNA测序平台(Illumina Inc,USA)进行miRNA表达谱,并证明为每百万miRNA(RPM)映射数据的读数。由于mRNA,lncRNA和miRNA表达谱已经通过TCGA标准化,因此不对这些数据进行进一步的标准化。
[0011] 2.差异表达分析和聚类分析
[0012] 高通量测序是对生物学障碍后遗传变化的评估,即差异基。因此与正常组织相比,提取了胰腺癌组织中的差异表达基因,并且在logFC绝对值>2和FDR(调整后的P值)<0.01之后使用R 3.4.3。使用Bioconductor包中的limma包进行基因差异表达分析(可在线获得:http://www.bioconductor.org/)。然后在火山和热图图中描绘差异表达的mRNA,lncRNA,miRNA数据。为了探究胰腺癌中差异表达的lncRNA,miRNA和mRNA如何被调节,进行了无监督的层次聚类分析,并探索了这些差异表达基因在胰腺癌样本和正常样本之间的表达模式。
[0013] 3.预测miRNA靶向的lncRNA。
[0014] 在提取差异lncRNA和miRNA后,基于miRcode(http://www.mircode.org/)和starBase v2.0(http://starbase.sysu.edu.cn/)预测miRNA和lncRNA的关系。starBase数据库将探索来自Argonaute CLIP-Seq和Degradome-Seq数据的miRNA-mRNA关系图。它提供了一体化,互动,多功能的显示,全面的注释和显示。
[0015] 4.预测mRNA靶向的miRNA。
[0016] 通过使用数据库starBase,差异miRNA和mRNA提取差异miRNA加3p或5p锚,并在miRNA靶基因中匹配相应的miRNA-mRNA关系对,包括miRDB(http://mirdb.org),miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/index.html)和TargetScan(http://www.targetscan.org/)。因此得到了与胰腺癌相关的miRNA-mRNA靶基因的关系。
[0017] 5.构建ceRNA网络。
[0018] 通过使用Cytoscape v 3.6,基于ceRNA网络理论(logFC绝对值>1和P值>0.05)构建并可视化网络graghic。作为最流行的开源软件工具之一,用于视觉探索由基因,蛋白质和其他类型的相互作用组成的生物医学网络。Cytoscape的功能是为研究人员提供一个多功能和交互式的视觉界面,用于探测复杂的生物互连,不同的注释和实验数据。
[0019] 6.KEGG途径富集分析和临床特征分析。
[0020] 将差异表达的lncRNA输入到用于KEEG途径富集分析的注释,可视化和综合发现数据库(DAVID)中。为进一步分析lncRNAs与临床特征之间的特定关系,进行了临床特征分析,包括性别、种族肿瘤分级、AJCC肿瘤分期、AJCC TNM分期系统、新肿瘤事件、肿瘤状态和诊断年龄。
[0021] 7.生存分析。
[0022] 为评估潜在生物标志物在胰腺癌中的预后表现,在之前的研究发现了1165个mRNA,102个lncRNA和27个与胰腺癌相关的miRNA,它们在正常样本和胰腺癌样本之间差异表达,选择它们来进行总体生存曲线。通过生存包和qvalue包使用Kaplan-Meier方法与存活时间相关的基因。更重要的是,P值<0.05被认为是合理的和统计的。
[0023] 充分利用临床信息制作单变量Cox比例险比模型。如果某些患者无法获得参数,则认为他们失踪了。并且根据0.05的截止值筛选出显着的参数。所有差异表达的lncRNA适合于单变量Cox模型。基于lncRNA表达数据进行FDR调整。并且根据0.05的截止值选择显着的lncRNA。p值按升序排序,选择p<0.05的lncRNA进行多变量生存分析。通过使用R语言“存活”功能coxph()来显示利用选择的lncRNA构建风险评分分期模型。并获得相关系数,用R封装“ROCR”描绘了接收器操作特征(ROC)曲线。
[0024] 为探索更重要的基因,使用互动工具(http://bioinfogp.cnb.csic.es/tools/venny/index.html)制作维恩图,结合总体生存和多变量生存分析。
[0025] 8.统计分析。
[0026] 数据显示为平均值±SD。通过双样本t检验评估组间差异。并且P值小于0.05被认为是符合统计学规律的。使用BRB-ArrayTools或R语言进行统计分析。
[0027] 与现有技术相比,本发明具有以下有益效果。
[0028] 新型生物标志物的探索对于胰腺癌的治疗靶点至关重要。在本发明中,发现在胰腺癌的肿瘤的不同分级中,与G1+G2相比,M3600HG在G3+G4中下调。对于AJCC TNM分期,与I+II相比,III+IV中lncRNA下调。随着新的肿瘤事件的发生,C9orf139和MIR600HG的表达平下调。与无肿瘤相比,C9orf139的表达下调。因此,C9orf139和MIR600HG的表达可以在胰腺癌中被抑制。随着病情恶化,MIR600HG的抑制程度增加。并且推断C9orf139和MIR600HG可以影响患者的预后。总体生存分析显示,如果C9orf139和MIR600HG的表达水平低,则患者的总生存时间缩短。3年总生存时间的RUC为0.712,表明上述两个基因具有更高的灵敏度和准确性。因此,C9orf139和MIR600HG可能成为胰腺癌的预后生物标志物。在ceRNA网络中,C9orf139可以与hsa-mir-206结合。据报道,过表达的hsa-mir-206可抑制胰腺癌的增殖,迁移,侵袭和淋巴管生成。因此C9orf139-hsa-mir-206可能在胰腺癌中起关键作用。至于MIR600HG是hsa-mir-424的靶基因。并且已经研究了上调的miR-424-5p促进胰腺癌细胞的增殖,迁移和侵袭,同时抑制细胞凋亡。因此,有必要深入分析MIR600HG与hsa-mir-424在胰腺癌中的关系。总体生存分析表明hsa-mir-424与总体存活率呈负相关。因此,预测MIR600HG-hsa-mir-424的关系对在胰腺癌中可能是至关重要的。附图说明
[0029] 图1是胰腺癌差异表达的mRNA,lncRNA和miRNA的火山图和差异表达的mRNA,lncRNA和miRNA的层次聚类热图。其中A、C、E是胰腺癌差异表达的mRNA、lncRNA和miRNA的火山图;图B、D、F是差异表达的mRNA、lncRNA和miRNA的层次聚类热图。(在热图中,正常样本和胰腺癌样本中差异表达的mRNA、lncRNA和miRNA的表达.X轴代表样品,Y轴分别代表mRNA、lncRNA和miRNA,绿色代表下调,红色代表红色代表向上法规。)图2是胰腺癌样品和正常样品之间的lncRNA(A)、miRNA(B)和mRNA(C)的差异表达模式(红色代表上行规则和绿色代表下调)。
[0030] 图3是胰腺癌中的ceRNA网络,其中红色表示上调基因,蓝色表示下调基因,矩形代表miRNA,椭圆代表lncRNA,而trianagles代表mRNA。
[0031] 图4是参与胰腺癌的差异表达基因的KEGG途径富集分析。
[0032] 图5是与胰腺癌相关的6种lncRNA的存活分析(其中水平轴:总生存时间:年,纵轴:生存函数)。
[0033] 图6是风险评分模型的ROC曲线。
[0034] 图7是显着的lncRNA的文本图。

具体实施方式

[0035] C9orf139和MIR600HG作为胰腺癌预后标志物的确立方法,具体包括以下步骤。
[0036] 1.差异表达分析。
[0037] 提取胰腺癌组织中的差异表达基因,并且在logFC绝对值>2和FDR(调整后的P值)<0.01之后使用R3.4.3。使用Bioconductor包中的limma包进行基因差异表达分析(可在线获得:http://www.bioconductor.org/)。然后在火山和热图图中描绘差异表达的mRNA,lncRNA,miRNA数据。发现1165个mRNA在相邻的非肿瘤组织和胰腺癌组织之间差异表达,其中324个基因上调,841个基因下调。同时根据lncRNA的差异分析,结果显示上调基因为25个,下调基因为77个。作为相同的方法,分析差异表达的miRNA。共有27个差异表达基因,其中13个是上调基因,14个是下调基因。在火山和热图中描绘了差异表达的mRNA、lncRNA、miRNA,见图1。
[0038] 2.分层聚类分析。
[0039] 为探究胰腺癌中差异表达的lncRNA、miRNA和mRNA如何被调节,本发明完成了无监督的层次聚类分析,并发现这些基因的表达模式在胰腺癌样本和正常样本之间得到显着区分,如图2所示。
[0040] 3.使用miRcode和starBase通过miRNA对靶向lncRNA的预测。
[0041] 在提取差异lncRNA和miRNA后,基于miRcode(http://www.mircode.org/)和starBase v2.0(http://starbase.sysu.edu.cn/)预测miRNA和lncRNA的关系。发现17种差异表达的miRNA与胰腺癌相关,其中3种miRNA上调,14种相反。更加关注miRNA的靶向lncRNA。通过miRcode和starBase搜索了潜在的miRNA反应元件。结果表明,hsa-mir-424的靶基因为AC127496.1、AC020907.1、LY86-AS1、ABCA9-AS1、IDI2-AS1、MIR600HG,hsa-mir-206的靶基因是C9orf139、TM4SF19-AS1、ZBTB20-AS1,GLYCTK-AS1是hsa-mir-144的靶基因,见表1。
表1.可能靶向与胰腺癌相关的特定lncRNA的推定miRNA
[0042] 4.使用miRDB、miRTarBase和TargetScan通过miRNA预测靶mRNA。
[0043] 为获得与胰腺癌相关的miRNA靶mRNA、miRNA-mRNA关系对在数据库miRDB、miRTarBase和TargetScan中匹配。TargetScan可有效降低假阳性率,提高mRNA相互作用的准确性。至于miRDB(http://mirdb.org),它可以预测miRNA靶标并进行功能注释,并允许用户研究任何自定义miRNA或靶基因。miRTarBase(http://miRTarBase.mbc.nctu.edu.tw/)已成为最全面注释,经实验验证的miRNA-靶标相互作用数据库之一。最后,获得hsa-mir-144-3p、hsa-mir-206和hsa-mir-424-5p的靶基因,见表2。
表2.可能靶向与胰腺癌相关的特定mRNA的推定miRNA
[0044] 5.构建ceRNA网络。
[0045] 通过使用Cytoscape v 3.6,基于ceRNA网络理论(logFC绝对值>1和P值>0.05)构建并可视化网络graghic。为得到更精确的结论,基于TCGA数据集中的lncRNA,miRNA和mRNA的表达水平(MIC>0.15和MIC-p2>0.15),利用最大信息系数(MIC)算法进行筛选双关系。根据各自验证的miRNA确认了潜在的ceRNA关系。最后,在ceRNA网络中有15个lncRNA,8个miRNA和2个mRNA如图3所示。表3中列出了ceRNA网络中的15个lncRNA(6个上调,9个下调),表3在ceRNA网络构建中的15种与胰腺癌特异性相关的lncRNA,该表显示了15种用于ceRNA网络构建的特异性lncRNA,绝对倍数变化≥1.0,P值<0.05。表3.ceRNA网络中的15个lncRNA
[0046] 6.KEGG途径富集分析和临床特征分析。
[0047] 为深入分析胰腺癌相关差异表达基因的信号通路,制备了KEGG富集途径。最后,通过R包构建了前10个最重要的通路如图4所示,如细胞因子-细胞因子受体相互作用,自然杀伤细胞介导的细胞毒性,趋化因子信号通路,造血细胞谱系,B细胞受体信号通路,Th1和Th2细胞分化。
[0048] 为进一步分析lncRNAs与临床特征之间的特定关系,进行临床特征分析,包括性别、种族、肿瘤分级、AJCC肿瘤分期、AJCC TNM分期系统、新肿瘤事件、肿瘤状态和诊断年龄,见表4,该表描述了在临床特征比较中差异表达的癌症特异性lncRNA,结果显示107个特异性lncRNA在临床特征比较中差异表达。为探索具有预后特征的潜在生物标志物,使用单变量Cox比例风险回归模型对TCGA数据中的102个lncRNA进行了分析。最后,发现ceRNA网络中的6个lncRNA与总体存活率显着相关(P<0.05)。在6种lncRNA中,包括AC079015.1、AP003086.1、C9orf139、MIR600HG在内的4种lncRNA与总体存活率呈正相关。同时两个lncRNA(AL137789.1、DNAH17-AS1)与总体存活率呈负相关(如图5所示)。这些结果表明,六种lncRNA可以预测和早期诊断PDDA患者。除了lncRNA之外,还发现66个mRNA和2个miRNA与总体存活率相关,见表5。表4.癌症特异性lncRNA与临床特征之间的关系
表5.胰腺癌的mRNA,lncRNA和miRNA的总体存活分析
[0049] 在进一步的单变量存活分析后,鉴定了10个显着的lncRNA(p<0.05),见表6。然后根据从多变量COX回归分析中选择的10个lncRNA构建风险评分模型。风险评分计算如下:风险评分=(-0.5518)*Expr MIR600HG+(-0.2533)*Expr C9orf139+0.1481*Expr AL121772.1。并且对于3个显着的lncRNA,似然比检验=28.92,并且p=2e-06。并且总体上3次的ROC曲线描绘了曲线下面积(AUC)为0.712,这表明三种lncRNA与图6中的存活相关。表6.单变量存活分析中的10个显着的lncRNA
[0050] 如图7所示,MIR600HG和C9orf139是总体存活分析和多变量存活分析中常见的重要lncRNA,因此这两种lncRNAs可能与患者的生存密切相关。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈