首页 / 专利库 / 信号处理 / 信号 / 肿瘤患者生存期预测系统

肿瘤患者生存期预测系统

阅读:396发布:2023-03-20

专利汇可以提供肿瘤患者生存期预测系统专利检索,专利查询,专利分析的服务。并且本公开涉及一种 肿瘤 患者生存期预测系统,该系统包括:计算装置、用于输入肿瘤患者个体的肿瘤 预后 相关基因对相对表达量的 风 险分值的输入装置和用于输出肿瘤患者的生存期生存概率的输出装置;其中,所述肿瘤预后相关基因对为基因对中两个基因的表达量的相对大小与肿瘤患者生存期相关的基因对;所述计算装置包括 存储器 和处理器;所述存储器中存储有 计算机程序 ,以实现建模 算法 和判别函数的算法;所述建模算法为最小偏二乘算法。该肿瘤患者生存期预测系统将临床上易获得的变量综合起来,可快速、准确地获得肿瘤患者生存期的预测结果,节约了使用者的时间和精 力 。,下面是肿瘤患者生存期预测系统专利的具体信息内容。

1.一种肿瘤患者生存期预测系统,其特征在于,该系统包括计算装置、用于输入肿瘤患者个体的肿瘤预后相关基因对相对表达量的险分值的输入装置和用于输出肿瘤患者的生存期生存概率的输出装置;
其中,所述肿瘤预后相关基因对为基因对中两个基因的表达量的相对大小与肿瘤患者生存期相关的基因对;
所述计算装置包括存储器和处理器;所述存储器中存储有计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;所述建模算法为最小偏二乘算法;
F(x,y)=f(x1)·f(y)  式(1),
其中,x1表示每对所述肿瘤预后相关基因对相对表达量的风险分值,y表示所述肿瘤患者生存期,f(x1)表示所述肿瘤预后相关基因对相对表达量的总风险分值,f(y)表示生存期为y年的生存率曲线函数,F(x,y)表示所述肿瘤患者的生存期为y年的概率。
2.根据权利要求1所述的肿瘤患者生存期预测系统,其特征在于,所述肿瘤预后相关基因对相对表达量的风险分值的计算方法如下:
在任一所述肿瘤预后相关基因对中,若第一基因的表达量大于第二基因的表达量,则该基因对的相对表达量风险分值x1i为第一相对表达量风险分值;若第一基因的表达量小于或者等于第二基因的表达量,则该基因对的相对表达量风险分值x1i为第二相对表达量风险分值;其中,x1i是指第i对所述肿瘤预后相关基因对的相对表达量的风险分值。
3.根据权利要求2所述的肿瘤患者生存期预测系统,其特征在于,所述第一相对表达量风险分值的取值大于0,所述第二相对表达量风险分值的取值小于等于0。
4.根据权利要求1所述的肿瘤患者生存期预测系统,其特征在于,所述输入装置还用于输入肿瘤患者个体的1p19q状态风险分值和病理级别风险分值;
所述计算装置还用于实现如式(2)所示的判别函数的算法,
F(x,y)=[f(x1)+f(x2)+f(x3)]·f(y)  式(2),
其中,x1表示每对所述肿瘤预后相关基因对相对表达量的风险分值,x2表示所述1p19q状态风险分值,x3表示所述病理级别风险分值,y表示所述肿瘤患者生存期,f(x1)+f(x2)+f(x3)表示总风险分值,f(y)表示生存期为y年的生存率曲线函数,F(x,y)表示所述肿瘤患者的生存期为y年的概率。
5.根据权利要求4所述的肿瘤患者生存期预测系统,其特征在于,所述1p19q状态风险分值的计算方法包括:
在1p19q染色体为缺失状态时,所述1p19q状态风险分值x2为第一1p19q状态风险分值;
在1p19q染色体为完整状态时,所述1p19q状态风险分值x2为第二1p19q状态风险分值;
所述病理级别风险分值的计算方法包括:
在病理级别为WHO II级时,所述病理级别风险分值x3为第一病理级别风险分值;在病理级别为WHO III级时,所述病理级别风险分值x3为第二病理级别风险分值。
6.根据权利要求5所述的肿瘤患者生存期预测系统,其特征在于,所述第一1p19q状态风险分值的取值大于0,所述第二1p19q状态风险分值的取值小于等于0;
所述第一病理级别风险分值的取值小于等于0,所述第二病理级别风险分值的取值大于0。
7.根据权利要求4所述的肿瘤患者生存期预测系统,其特征在于,
其中,ai表示第i对所述肿瘤预后相关基因对的相对表达量的风险分
值系数,n为大于等于1的正整数;
f(x2)=bx2,其中,b表示1p19q状态风险分值系数;
f(x3)=cx3,其中,c表示病理级别风险分值系数。
8.根据权利要求1所述的肿瘤患者生存期预测系统,其特征在于,所述肿瘤患者包括胶质瘤患者、胰腺癌、前列腺癌、鼻咽癌、子宫内膜癌、甲状腺癌、肝癌、乳腺癌、结直肠肿瘤、膀胱癌、胃癌、癌、黑色素瘤、肾透明细胞瘤和肾上腺皮质癌中的至少一种。
9.根据权利要求4所述的肿瘤患者生存期预测系统,其特征在于,所述计算装置能够基于所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值,建立生存概率列线图并计算总风险分值,所述总风险分值为所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值的累加和,根据所述总风险分值计算肿瘤患者生存期预测值;
其中,基于所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值建立生存概率列线图的方法为应用R语言RMS运算包完成Cox回归模型的列线图可视化
10.根据权利要求1-9中任意一项所述的肿瘤患者生存期预测系统,其特征在于,该系统还包括所述肿瘤预后相关基因对相对表达量的检测装置,所述检测装置包括所述肿瘤预后相关基因对相对表达量的检测芯片和芯片信号读取器。

说明书全文

肿瘤患者生存期预测系统

技术领域

[0001] 本公开涉及计算机应用技术,具体地,涉及一种肿瘤患者生存期预测系统。

背景技术

[0002] 准确预测病人的生存期具有重要的临床、科研及社会价值。在临床工作中,准确的生存期预测可指导医生针对高险病人制定个性化的检查及治疗方案,帮助医生制定合理的复查及随访计划,进而提高医疗服务的质量。在科研中,准确的预测病人风险层级,可以为研发针对高风险病人的有效治疗方案提供重要依据,并且可以成为检验新型治疗效果的重要参考。从社会度来说,准确预测病患生存期,可为病患及家属提供科学的生存预期,指引病人依从治疗计划,避免过度医疗,减轻家庭经济压,有助于改善医患关系。
[0003] 目前,现有的肿瘤患者生存期预测方法主要依赖于分子标记物和基因表达量。然而,分子标记物普遍存在过度拟合、发现组病例数过小和缺乏外部验证等问题,无法运用到临床实践中;利用基因表达量预测患者生存时间也存在数据集之间的异质性和跨平台检测技术偏差等问题,难以实现临床应用。因此,亟需一种简单可靠、准确性高的肿瘤患者生存期的预测系统。发明内容
[0004] 本公开的目的是提供一种肿瘤患者生存期预测系统,利用该预测系统能够简单可靠、准确地预测肿瘤患者的生存期。
[0005] 为了实现上述目的,本公开提供一种肿瘤患者生存期预测系统,该系统包括计算装置、用于输入肿瘤患者个体的肿瘤预后相关基因对相对表达量的风险分值的输入装置和用于输出肿瘤患者的生存期生存概率的输出装置;
[0006] 其中,所述肿瘤预后相关基因对为基因对中两个基因的表达量的相对大小与肿瘤患者生存期相关的基因对;
[0007] 所述计算装置包括存储器和处理器;所述存储器中存储有计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;所述建模算法为最小偏二乘算法;
[0008] F(x,y)=f(x1)·f(y)  式(1),
[0009] 其中,x1表示每对所述肿瘤预后相关基因对相对表达量的风险分值,y表示所述肿瘤患者生存期,f(x1)表示所述肿瘤预后相关基因对相对表达量的总风险分值,f(y)表示生存期为y年的生存率曲线函数,F(x,y)表示所述肿瘤患者的生存期为y年的概率。
[0010] 可选地,所述肿瘤预后相关基因对相对表达量的风险分值的计算方法如下:
[0011] 在任一所述肿瘤预后相关基因对中,若第一基因的表达量大于第二基因的表达量,则该基因对的相对表达量风险分值x1i为第一相对表达量风险分值;若第一基因的表达量小于或者等于第二基因的表达量时,则该基因对的相对表达量风险分值x1i为第二相对表达量风险分值;其中,x1i是指第i对所述肿瘤预后相关基因对的相对表达量的风险分值。
[0012] 可选地,所述第一相对表达量风险分值的取值大于0,所述第二相对表达量风险分值的取值小于等于0。
[0013] 可选地,所述输入装置还用于输入肿瘤患者个体的1p19q状态风险分值和病理级别风险分值;
[0014] 所述计算装置还用于实现如式(2)所示的判别函数的算法,
[0015] F(x,y)=[f(x1)+f(x2)+f(x3)]·f(y)  式(2),
[0016] 其中,x1表示每对所述肿瘤预后相关基因对相对表达量的风险分值,x2表示所述1p19q状态风险分值,x3表示所述病理级别风险分值,y表示所述肿瘤患者生存期,f(x1)+f(x2)+f(x3)表示总风险分值,f(y)表示生存期为y年的生存率曲线函数,F(x,y)表示所述肿瘤患者的生存期为y年的概率。
[0017] 可选地,所述1p19q状态风险分值的计算方法包括:
[0018] 在1p19q染色体为缺失状态时,所述1p19q状态风险分值x2为第一1p19q状态风险分值;在1p19q染色体为完整状态时,所述1p19q状态风险分值x2为第二1p19q状态风险分值;
[0019] 所述病理级别风险分值的计算方法包括:
[0020] 在病理级别为WHO II级时,所述病理级别风险分值x3为第一病理级别风险分值;在病理级别为WHO III级时,所述病理级别风险分值x3为第二病理级别风险分值。
[0021] 可选地,所述第一1p19q状态风险分值的取值大于0,所述第二1p19q状态风险分值的取值小于等于0;
[0022] 所述第一病理级别风险分值的取值小于等于0,所述第二病理级别风险分值的取值大于0。
[0023] 可选地, 其中,ai表示第i对所述肿瘤预后相关基因对的相对表达量的风险分值系数,n为大于等于1的正整数;
[0024] f(x2)=bx2,其中,b表示1p19q状态风险分值系数;
[0025] f(x3)=cx3,其中,c表示病理级别风险分值系数。
[0026] 可选地,所述肿瘤患者包括胶质瘤患者、胰腺癌、前列腺癌、鼻咽癌、子宫内膜癌、甲状腺癌、肝癌、乳腺癌、结直肠肿瘤、膀胱癌、胃癌、癌、黑色素瘤、肾透明细胞瘤和肾上腺皮质癌中的至少一种。
[0027] 可选地,所述计算装置能够基于所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值,建立生存概率列线图并计算总风险分值,所述总风险分值为所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值的累加和,根据所述总风险分值计算肿瘤患者生存期预测值;
[0028] 其中,基于所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值建立生存概率列线图的方法为应用R语言RMS运算包完成Cox回归模型的列线图可视化
[0029] 可选地,该系统还包括所述肿瘤预后相关基因对相对表达量的检测装置,所述检测装置包括所述肿瘤预后相关基因对相对表达量的检测芯片和芯片信号读取器。
[0030] 通过上述技术方案,本公开所提供的肿瘤患者生存期预测系统基于肿瘤患者个体的肿瘤预后相关基因对的相对表达量来预测肿瘤患者的生存期,该变量在临床上易于获得,且利用该变量可快速、准确地获得肿瘤患者生存期的预测结果,节约了使用者的时间和精力。
[0031] 本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明
[0032] 附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
[0033] 图1是本公开实施例提供的肿瘤患者生存期预测系统的示意图。
[0034] 图2是本公开实施例提供的较低级别胶质瘤患者生存概率列线图。

具体实施方式

[0035] 以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
[0036] 本公开的第一方面提供了一种肿瘤患者生存期预测系统,如图1所示,该系统包括计算装置、用于输入肿瘤患者个体的肿瘤预后相关基因对相对表达量的风险分值的输入装置和用于输出肿瘤患者的生存期生存概率的输出装置;其中,所述肿瘤预后相关基因对为基因对中两个基因的表达量的相对大小与肿瘤患者生存期相关的基因对;所述计算装置包括存储器和处理器;所述存储器中存储有计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;所述建模算法为最小偏二乘算法;
[0037] F(x,y)=f(x1)·f(y)  式(1),
[0038] 其中,x1表示每对所述肿瘤预后相关基因对相对表达量的风险分值,y表示所述肿瘤患者生存期,f(x1)表示所述肿瘤预后相关基因对相对表达量的总风险分值,f(y)表示生存期为y年的生存率曲线函数,F(x,y)表示所述肿瘤患者的生存期为y年的概率。
[0039] 本公开所提供的肿瘤患者生存期预测系统基于肿瘤患者个体的肿瘤预后相关基因对的相对表达量来预测肿瘤患者的生存期,该变量在临床上易于获得,且利用该变量可快速、准确地获得肿瘤患者生存期的预测结果,节约了使用者的时间和精力。
[0040] 根据本公开,可以采用如下方法计算所述肿瘤预后相关基因对相对表达量的风险分值:
[0041] 在任一所述肿瘤预后相关基因对中,若第一基因的表达量大于第二基因的表达量,则该基因对的相对表达量风险分值x1i为第一相对表达量风险分值;若第一基因的表达量小于或者等于第二基因的表达量,则该基因对的相对表达量风险分值x1i为第二相对表达量风险分值;其中,x1i是指第i对所述肿瘤预后相关基因对的相对表达量的风险分值。其中,可以通过领域内的常规方法获取任一所述肿瘤预后相关基因对的组成基因的表达量的相对高低情况,例如,可以通过二代测序、基因芯片或者PCR方法等获取任一所述肿瘤预后相关基因对的组成基因的表达量的高低情况。
[0042] 其中,第一相对表达量风险分值和第二相对表达量风险分值的取值可以在较大的范围内变化,可根据各基因对的组成基因的表达产物对患者生存期的影响来设置第一相对表达量风险分值和第二相对表达量风险分值的取值。例如,所述第一相对表达量风险分值的取值可以大于0,所述第二相对表达量风险分值的取值可以小于等于0。作为本公开的一种优选情况,第一相对表达量风险分值的取值可以为1,第二相对表达量风险分值的取值可以为0。
[0043] 根据本公开,为了增加对肿瘤患者生存期限的预测结果的准确性,优选情况下,如图2所示,所述输入装置还可以用于输入肿瘤患者个体的1p19q状态风险分值和病理级别风险分值;
[0044] 所述计算装置还用于实现如式(2)所示的判别函数的算法,
[0045] F(x,y)=[f(x1)+f(x2)+f(x3)]·f(y)  式(2),
[0046] 其中,x1表示每对所述肿瘤预后相关基因对相对表达量的风险分值,x2表示所述1p19q状态风险分值,x3表示所述病理级别风险分值,y表示所述肿瘤患者生存期,f(x1)+f(x2)+f(x3)表示总风险分值,f(y)表示生存期为y年的生存率曲线函数,F(x,y)表示所述肿瘤患者的生存期为y年的概率。
[0047] 通过上述技术方案,本公开所提供的肿瘤患者生存期预测系统将临床上易获得的变量综合起来,输入变量即可快速、准确地获得较低级别胶质瘤患者生存期的预测结果。
[0048] 根据本公开,可以通过如下方法计算所述1p19q状态风险分值:
[0049] 在1p19q染色体为缺失状态时,所述1p19q状态风险分值x2为第一1p19q状态风险分值;在1p19q染色体为完整状态时,所述1p19q状态风险分值x2为第二1p19q状态风险分值。获得所述1p19q染色体联合缺失状态的方法可以是本领域内的常规方法,本公开不作限制,例如,可以利用荧光原位杂交方法检测所述1p19q染色体联合缺失状态。
[0050] 其中,第一1p19q状态风险分值和第二1p19q状态风险分值的取值可以在较大的范围内变化,可根据1p19q状态对患者生存期的影响来设置第一1p19q状态风险分值和第二1p19q状态风险分值的取值。例如,所述第一1p19q状态风险分值的取值可以大于0,所述第二1p19q状态风险分值的取值可以小于等于0。作为本公开的一种优选情况,第一1p19q状态风险分值的取值可以为1,第二1p19q状态风险分值的取值可以为0。
[0051] 根据本公开,可以通过如下方法计算所述病理级别风险分值:
[0052] 在病理级别为WHO II级时,所述病理级别风险分值x3为第一病理级别风险分值;在病理级别为WHO III级时,所述病理级别风险分值x3为第二病理级别风险分值。其中,所述病理级别为根据世界卫生组织(WHO)分级系统确定的胶质瘤病理级别。
[0053] 其中,第一病理级别风险分值和第二病理级别风险分值的取值可以在较大的范围内变化,可根据病理级别对患者生存期的影响来进行具体设计。例如,所述第一病理级别风险分值的取值可以小于等于0,所述第二病理级别风险分值的取值可以大于0。作为本公开的一种优选情况,第一病理级别风险分值的取值可以为0,第二病理级别风险分值的取值可以为1。
[0054] 具体地,在上述技术方案中,风险分值大于0表示对患者生存期有影响,风险分值小于等于0表示对患者生存期没有影响或者有助于延长患者生存期。
[0055] 根据本公开,计算肿瘤预后相关基因对相对表达量、1p19q状态和病理级别分别对应的风险分值的累加和得到总风险分值的方法可以是领域内的常规方法。例如,可以将肿瘤预后相关基因对相对表达量、1p19q状态和病理级别分别对应的风险分值直接相加,得到总风险分值;也可以将肿瘤预后相关基因对相对表达量、1p19q状态和病理级别分别对应的风险分值先进行加权处理后再相加,得到总风险分值。
[0056] 优选情况下, 其中,ai表示第i对所述肿瘤预后相关基因对的相对表达量的风险分值系数,n为大于等于1的正整数;
[0057] f(x2)=bx2,其中,b表示1p19q状态风险分值系数;
[0058] f(x3)=cx3,其中,c表示病理级别风险分值系数。在上述优选情况下,风险分值系数能反映每个变量对患者生存期的影响程度,可以提高本公开预测系统的预测准确性。可以通过LASSO回归计算确定个变量对患者生存期的影响程度,从而确定上述a、b和c的取值大小,LASSO回归分析是领域内的常规技术手段,本公开在此不再赘述。
[0059] 根据本公开,所述肿瘤患者可以在较宽的范围内选择,例如,所述肿瘤患者包括胶质瘤患者、胰腺癌、前列腺癌、鼻咽癌、子宫内膜癌、甲状腺癌、肝癌、乳腺癌、结直肠肿瘤、膀胱癌、胃癌、肺癌、黑色素瘤、肾透明细胞瘤和肾上腺皮质癌中的至少一种。
[0060] 示例性地,所述肿瘤患者可以为较低级别胶质瘤患者,世界卫生组织(WHO)分级系统根据组织学特征将胶质瘤分为Ⅰ级至Ⅳ级,最近的研究将Ⅱ级和Ⅲ级胶质瘤描述为较低级别胶质瘤。在该示例性实施例中,所述肿瘤预后相关基因对可以包括CRH-IFNB1、HOXA9-PRG3、IL10-IL9、IL9-PTH2、IL9-RETNLB、NKX2-5-PRLH、NKX3-2-UCN3、NR2C1-PTX3、PRLHR-REG1A和PRLHR-TRIM31。
[0061] 其中,CRH基因在NCBI数据库中的参考编号为1392;IFNB1基因在NCBI数据库中的参考编号为3456;HOXA9基因在NCBI数据库中的参考编号为3205;PRG3基因在NCBI数据库中的参考编号为10394;IL10基因在NCBI数据库中的参考编号为3586;IL9基因在NCBI数据库中的参考编号为3578;RETNLB基因在NCBI数据库中的参考编号为84666;NKX2-5基因在NCBI数据库中的参考编号为1482;PRLH基因在NCBI数据库中的参考编号为51052;NKX3-2基因在NCBI数据库中的参考编号为579;UCN3基因在NCBI数据库中的参考编号为114131;NR2C1基因在NCBI数据库中的参考编号为7181;PTX3基因在NCBI数据库中的参考编号为5806;PRLHR基因在NCBI数据库中的参考编号为2834;REG1A基因在NCBI数据库中的参考编号为5967;TRIM31基因在NCBI数据库中的参考编号为11074。上述基因对均为免疫基因对,通过免疫基因对的表达产物,可以评估患者的免疫状态,免疫状态是胶质瘤恶性发展的重要原因,准确评估免疫反应状态有助于提高患者生存期预测的准确性。
[0062] 其中,上述较低级别胶质瘤预后相关免疫基因对相对表达量的计算方法包括:
[0063] 若所述CRH基因的表达量大于所述IFNB1基因的表达量,则所述CRH-IFNB1基因对的第一相对表达量风险分值x11为1;若所述CRH基因的表达量小于或者等于所述IFNB1基因的表达量,则所述CRH-IFNB1基因对的第二相对表达量风险分值x11为0;
[0064] 若所述HOXA9基因的表达量大于所述PRG3基因的表达量,则所述HOXA9-PRG3基因对的第一相对表达量风险分值x12为1;若所述HOXA9基因的表达量小于或者等于所述PRG3基因的表达量,则所述HOXA9-PRG3基因对的第二相对表达量风险分值x12为0;
[0065] 若所述IL10基因的表达量大于所述IL9基因的表达量,则所述IL10-IL9基因对的第一相对表达量风险分值x13为1;若所述IL10基因的表达量小于或者等于所述IL9基因的表达量,则所述IL10-IL9基因对的第二相对表达量风险分值x13为0;
[0066] 若所述IL9基因的表达量大于所述PTH2基因的表达量,则所述IL9-PTH2基因对的第一相对表达量风险分值x14为1;若所述IL9基因的表达量小于或者等于所述PTH2基因的表达量,则所述IL9-PTH2基因对的第二相对表达量风险分值x14为0;
[0067] 若所述IL9基因的表达量大于所述RETNLB基因的表达量,则所述IL9-RETNLB基因对的第一相对表达量风险分值x15为1;若所述IL9基因的表达量小于或者等于所述RETNLB基因的表达量,则所述IL9-RETNLB基因对的第二相对表达量风险分值x15为0;
[0068] 若所述NKX2-5基因的表达量大于所述PRLH基因的表达量,则所述NKX2-5-PRLH基因对的第一相对表达量风险分值x16为1;若所述NKX2-5基因的表达量小于或者等于所述PRLH基因的表达量,则所述NKX2-5-PRLH基因对的第二相对表达量风险分值x16为0;
[0069] 若所述NKX3-2基因的表达量大于所述UCN3基因的表达量,则所述NKX3-2-UCN3基因对的第一相对表达量风险分值x17为1;若所述NKX3-2基因的表达量小于或者等于所述UCN3基因的表达量,则所述NKX3-2-UCN3基因对的第二相对表达量风险分值x17为0;
[0070] 若所述NR2C1基因的表达量大于所述PTX3基因的表达量,则所述NR2C1-PTX3基因对的第一相对表达量风险分值x18为1;若所述NR2C1基因的表达量小于或者等于所述PTX3基因的表达量,则所述NR2C1-PTX3基因对的第二相对表达量风险分值x18为0;
[0071] 若所述PRLHR基因的表达量大于所述REG1A基因的表达量,则所述PRLHR-REG1A基因对的第一相对表达量风险分值x19为1;若所述PRLHR基因的表达量小于或者等于所述REG1A基因的表达量,则所述PRLHR-REG1A基因对的第二相对表达量风险分值x19为0;
[0072] 若所述PRLHR基因的表达量大于所述TRIM31基因的表达量,则所述PRLHR-TRIM31基因对的第一相对表达量风险分值x110为1;若所述PRLHR基因的表达量小于或者等于所述TRIM31基因的表达量,则所述PRLHR-TRIM31基因对的第二相对表达量风险分值x110为0。
[0073] 其中,基因对CRH-IFNB1的相对表达量风险分值系数a1为-0.00332、基因对HOXA9-PRG3的相对表达量风险分值系数a2为0.124745、基因对IL10-IL9的相对表达量风险分值系数a3为0.205056、基因对IL9-PTH2的相对表达量风险分值系数a4为-0.11688、基因对IL9-RETNLB的相对表达量风险分值系数a5为-0.30775、基因对NKX2-5-PRLH的相对表达量风险分值系数a6为0.035793、基因对NKX3-2-UCN3的相对表达量风险分值系数a7为0.086457、基因对NR2C1-PTX3的相对表达量风险分值系数a8为-0.49552、基因对PRLHR-REG1A的相对表达量风险分值系数a9为-0.24355、基因对PRLHR-TRIM31的相对表达量风险分值系数a10为-0.33529;
[0074] 1p19q状态风险分值系数b为-1.1591;
[0075] 病理级别风险分值系数c为1.0261。
[0076] 在上述示例性实施例中,风险分值系数的绝对值大小表示每个变量对患者生存期的影响程度,绝对值越大,影响程度也就越大;而风险分值系数为正数或者负数,则表示每个变量对患者生存期的影响方式,当风险分值系数为正数时,表示该变量是破坏因素,会缩短患者生存期,当风险分值系数为负数时,表示该变量是保护因素,有助于延长患者生存期。通过该优选方式,使本公开的预测系统的预测结果更加准确。
[0077] 作为本申请的另一个示例性实施例,所述肿瘤患者可以为胰腺癌患者,在该示例性实施例中,所述肿瘤预后相关基因对可以包括:LEMD2-MYD88、DNMT3A-MECOM、AXIN1-RRAS2、BRCA1-GPS2、CCND1-KEAP1、NOTCH2-TBX3、MET-SPTAN1。上述基因对中涉及的基因均为国际公认的肿瘤起始基因。
[0078] 其中,LEMD2基因在NCBI数据库中的参考编号为221496;MYD88基因在NCBI数据库中的参考编号为4615;DNMT3A基因在NCBI数据库中的参考编号为1788;MECOM基因在NCBI数据库中的参考编号为2122;AXIN1基因在NCBI数据库中的参考编号为8312;RRAS2基因在NCBI数据库中的参考编号为22800;BRCA1基因在NCBI数据库中的参考编号为672;GPS2基因在NCBI数据库中的参考编号为2874;CCND1基因在NCBI数据库中的参考编号为595;KEAP1基因在NCBI数据库中的参考编号为9817;NOTCH2基因在NCBI数据库中的参考编号为4853;TBX3基因在NCBI数据库中的参考编号为6926;MET基因在NCBI数据库中的参考编号为4233;
SPTAN1基因在NCBI数据库中的参考编号为6709。
[0079] 其中,上述胰腺癌预后相关基因对相对表达量的计算方法包括:
[0080] 若所述LEMD2基因的表达量大于所述MYD88基因的表达量,则所述LEMD2-MYD88基因对的第一相对表达量风险分值x11为1;若所述LEMD2基因的表达量小于或者等于所述MYD88基因的表达量,则所述LEMD2-MYD88基因对的第二相对表达量风险分值x11为0;
[0081] 若所述DNMT3A基因的表达量大于所述MECOM基因的表达量,则所述DNMT3A-MECOM基因对的第一相对表达量风险分值x12为1;若所述DNMT3A基因的表达量小于或者等于所述MECOM基因的表达量,则所述DNMT3A-MECOM基因对的第二相对表达量风险分值x12为0;
[0082] 若所述AXIN1基因的表达量大于所述RRAS2基因的表达量,则所述AXIN1-RRAS2基因对的第一相对表达量风险分值x13为1;若所述AXIN1基因的表达量小于或者等于所述RRAS2基因的表达量,则所述AXIN1-RRAS2基因对的第二相对表达量风险分值x13为0;
[0083] 若所述BRCA1基因的表达量大于所述GPS2基因的表达量,则所述BRCA1-GPS2基因对的第一相对表达量风险分值x14为1;若所述BRCA1基因的表达量小于或者等于所述GPS2基因的表达量,则所述BRCA1-GPS2基因对的第二相对表达量风险分值x14为0;
[0084] 若所述CCND1基因的表达量大于所述KEAP1基因的表达量,则所述CCND1-KEAP1基因对的第一相对表达量风险分值x15为1;若所述CCND1基因的表达量小于或者等于所述KEAP1基因的表达量,则所述CCND1-KEAP1基因对的第二相对表达量风险分值x15为0;
[0085] 若所述NOTCH2基因的表达量大于所述TBX3基因的表达量,则所述NOTCH2-TBX3基因对的第一相对表达量风险分值x16为1;若所述NOTCH2基因的表达量小于或者等于所述TBX3基因的表达量,则所述NOTCH2-TBX3基因对的第二相对表达量风险分值x16为0;
[0086] 若所述MET基因的表达量大于所述SPTAN1基因的表达量,则所述MET-SPTAN1基因对的第一相对表达量风险分值x17为1;若所述MET基因的表达量小于或者等于所述SPTAN1基因的表达量,则所述MET-SPTAN1基因对的第二相对表达量风险分值x17为0。
[0087] 其中,基因对LEMD2-MYD88的相对表达量风险分值系数a1为-0.2385、基因对DNMT3A-MECOM的相对表达量风险分值系数a2为-0.0308、基因对AXIN1-RRAS2的相对表达量风险分值系数a3为-0.02498、基因对BRCA1-GPS2的相对表达量风险分值系数a4为0.009342、基因对CCND1-KEAP1的相对表达量风险分值系数a5为0.189372、基因对NOTCH2-TBX3的相对表达量风险分值系数a6为0.194922、基因对MET-SPTAN1的相对表达量风险分值系数a7为0.390684。
[0088] 根据本公开,所述计算装置能够基于所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值,建立生存概率列线图并计算总风险分值,所述总风险分值为所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值的累加和,根据所述总风险分值计算肿瘤患者生存期预测值;
[0089] 其中,基于所述输入装置输入的所述肿瘤预后相关基因对相对表达量的风险分值、所述1p19q状态风险分值和所述病理级别风险分值建立生存概率列线图的方法为应用R语言RMS运算包完成Cox回归模型的列线图可视化。
[0090] 图2为本公开实施例提供的较低级别胶质瘤患者生存概率列线图。如图2所示,在所述生存概率列线图中,肿瘤预后相关基因相对表达量、1p19q状态和病理级别分别对应不同的风险分值范围。计算上述3项变量所对应的风险分值的累加和为总风险分值,并在所述生存概率列线图中经过总风险分值的位置画患者1年生存率线的垂直线,该垂直线与患者1年生存率线的交点,即为患者存活期为1年的概率;利用同样的方法可以得到患者存活期为2年、3年或者5年的概率。不同的总风险分值对应不同的患者存活期为1年、2年、3年和5年的概率。
[0091] 根据本公开,该系统还可以包括所述肿瘤预后相关基因对相对表达量的检测装置,所述检测装置包括所述肿瘤预后相关基因对相对表达量的检测芯片和芯片信号读取器。
[0092] 根据本公开,所述输入装置和所述计算装置之间可以通过有线方式和/或无线方式连接;所述计算装置和/或所述输出装置之间可以通过有线和/或无线方式连接。其中,无线连接方式可以为无线局域网、蓝牙、红外线等;有线连接方式可以为USB、固话网络等。采用前述连接方式可以大大方便使用者对预测系统的使用,同时可以借助日益发展的信息技术和日益普及的网络资源为肿瘤患者的生存期作出准确预测。
[0093] 根据本公开,所述输入装置可以为键盘鼠标触摸屏等装置;所述输出装置可以为显示器、打印机或音频输出装置;所述计算装置可以为电脑主机、中央处理器或网络服务器
[0094] 下面通过实施例来进一步说明本公开,但是本公开并不因此而受到任何限制。
[0095] 实施例1
[0096] 本实施例以较低级别胶质瘤为例,用于说明本公开的肿瘤患者生存期预测系统模型的建立方法
[0097] 收集一组来自中国的172例较低级别胶质瘤患者转录组表达谱数据作为发现组,从发现组数据中筛选出2214个与较低级别胶质瘤相关免疫基因,并对这些免疫基因的表达量进行两两比较而建立一个含有2449791个免疫基因对的数据库。假定i基因和j基因是该数据库中的一个基因对,在一个患者中,如果i基因的表达量大于j基因的表达量,则将该基因对记为1,若果i基因的表达量小于等于j基因的表达量,则将该基因对记为0。如果某基因对在95%以上的患者中的表达结果均被记为1或0,则从数据库中删除该基因对,最终,该数据库中有15957个基因对被保留并进入后续分析。
[0098] 通过log-rank检验,得知发现组、内部验证组和外部验证组中分别有4464、4911和3557个免疫基因对具有显著的预后价值,对以上三组免疫基因对取交集后得到402个具有普遍预后价值的免疫基因对。
[0099] 对上述402个具有普遍预后价值的免疫基因对进行LASSO回归分析,确定出10对具有显著预后价值的基因对,如下:CRH-IFNB1、HOXA9-PRG3、IL10-IL9、IL9-PTH2、IL9-RETNLB、NKX2-5-PRLH、NKX3-2-UCN3、NR2C1-PTX3、PRLHR-REG1A和PRLHR-TRIM31,获取该10个具有显著预后价值的基因对在患者体内的表达产物的相对表达量。
[0100] 通过COX回归模型,将上述预后相关基因对相对表达量与年龄、病理级别、1p19q状态和IDH突变装填等临床常用分子特征进行联合分析,并最终确定上述预后相关基因对相对表达量、1p19q状态和病理级别独立地与患者生存时间相关。基于上述预后相关基因对相对表达量、1p19q状态和病理级别建立较低级别胶质瘤患者Cox回归模型,并进行列线图的可视化转化,建立较低级别胶质瘤患者的生存概率列线图,如图2所示。建立较低级别胶质瘤患者的生存概率列线图的具体过程为应用R语言RMS运算包,将所得到的Cox回归模型转化为可视化的生存概率列线图。其中,具体命令如下:
[0101] nom<-nomogram(COX回归模型,
[0102] fun=list(function(x)surv(12,x),
[0103] function(x)surv(24,x),
[0104] function(x)surv(36,x),
[0105] function(x)surv(60,x)),
[0106] lp=F,
[0107] funlabel=c("1-year survival",
[0108] 2-year survival",
[0109] "3-year survival",
[0110] "5-year survival"),
[0111] fun.at=seq(0.9,0,by=-0.1))
[0112] plot(nom,cex.axis=1,fontsize1=0.5)。
[0113] 经过上述步骤可以得到如图2所示的较低级别胶质瘤患者的生存概率列线图,在该生存概率列线图中,预后相关基因对相对表达量、1p19q状态和病理级别分别对应不同的风险分值范围。计算上述3项变量所对应的风险分值的累加和为总风险分值,并在所述生存概率列线图中经过总风险分值的位置画患者1年生存率线的垂直线,该垂直线与患者1年生存率线的交点,即为患者存活期为1年的概率;利用同样的方法可以得到患者存活期为2年、3年或者5年的概率。不同的总风险分值对应不同的患者存活期为1年、2年、3年和5年的概率。
[0114] 实施例2
[0115] 本实施例用于验证实施例1的较低级别胶质瘤患者生存期预测系统的预测准确性[0116] 收集一组来自中国的171例较低级别胶质瘤患者转录组表达谱数据作为内部验证组;一组来自美国的415例较低级别胶质瘤患者转录组表达谱数据作为外部验证组。
[0117] 利用实施例1提供的较低级别胶质瘤患者生存期预测系统进行生存期预测,并比较预测结果与患者实际生存时间的一致性。
[0118] 结果显示,实施例1的较低级别胶质瘤患者生存期预测系统对内部验证组中患者的生存期预测结果与患者实际生存时间的一致性为0.79;实施例1的较低级别胶质瘤患者生存期预测系统对外部验证组中患者的生存期预测结果与患者实际生存时间的一致性为0.79。可知,利用实施例1提供的较低级别胶质瘤患者生存期预测系统预测的患者生存时间,与患者实际的生存时间一致性较高,可见,实施例1提供的较低级别胶质瘤患者生存期预测系统对较低级别胶质瘤患者生存期的预测结果准确性较高。
[0119] 实施例3
[0120] 利用PCR技术验证实施例1提供的较低级别胶质瘤患者生存期预测系统对36例较低级别胶质瘤患者生存期的预测结果准确性
[0121] 通过定量PCR技术检测上述CRH-IFNB1、HOXA9-PRG3、IL10-IL9、IL9-PTH2、IL9-RETNLB、NKX2-5-PRLH、NKX3-2-UCN3、NR2C1-PTX3、PRLHR-REG1A和PRLHR-TRIM31等10个免疫基因对构成基因的相对表达值;通过病理科获得患者病理级别和1p19q状态,应用nomogram模型计算病人生存期概率,作为对照数据。
[0122] 利用实施例1提供的较低级别胶质瘤患者生存期预测系统进行生存期预测,并比较预测结果与对照数据的一致性。
[0123] 结果表明,实施例1的较低级别胶质瘤患者生存期预测系统对上述36里患者的生存期预测结果与对照数据的一致性为0.75,进一步说明了实施例1提供的较低级别胶质瘤患者生存期预测系统对较低级别胶质瘤患者生存期的预测结果准确性较高。
[0124] 综上可知,本公开所提供的肿瘤患者生存期预测系统基于肿瘤患者个体的肿瘤预后相关基因对的相对表达量来预测肿瘤患者的生存期,该变量在临床上易于获得,且利用该变量可快速、准确地获得肿瘤患者生存期的预测结果,节约了使用者的时间和精力,特别是在搭配了临床上其它相关指标后,能进一步提高预测的准确性。
[0125] 以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,例如肿瘤还可以是除较低级别胶质瘤外的其它任意一种肿瘤,肿瘤预后相关基因也可以是除面以及因之外的其它种类的基因,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
[0126] 另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
[0127] 此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈