首页 / 专利库 / 疗法 / 癌症治疗 / 放化疗 / 一种影像组学分析模型构建方法及分析方法

一种影像组学分析模型构建方法及分析方法

阅读:749发布:2021-02-17

专利汇可以提供一种影像组学分析模型构建方法及分析方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种本发明公开了一种影像组学分析模型构建方法,包括:获取不同类型的患者在 治疗 前和治疗后的影像数据;从影像数据中划分感兴趣区域;分别针对治疗前和治疗后的影像数据中的感兴趣区域进行影像特征提取;基于提取的影像特征建立影像组学分析模型。本发明通过无创的方式纳入预处理和后处理的CT数据开发的影像组学模型,易于使用的列线图可以个性化预测非小细胞 肺 癌患者不同临床治疗方式的获益程度,从而为临床决策提供了一个有效的工具。,下面是一种影像组学分析模型构建方法及分析方法专利的具体信息内容。

1.一种影像组学分析模型构建方法,其特征在于,包括如下步骤:
S1、获取不同类型的患者在治疗前和治疗后的影像数据;
S2、从影像数据中划分感兴趣区域;
S3、分别针对治疗前和治疗后的影像数据中的感兴趣区域进行影像特征提取;
S4、基于提取的影像特征建立影像组学分析模型。
2.根据权利要求1所述的影像组学分析模型构建方法,其特征在于,所述治疗包括放疗和/或化疗。
3.根据权利要求2所述的影像组学分析模型构建方法,其特征在于,所述影像数据包括CT影像。
4.根据权利要求3所述的影像组学分析模型构建方法,其特征在于,所述感兴趣区域为肿瘤区域。
5.根据权利要求4所述的影像组学分析模型构建方法,其特征在于,所述影像特征提取包括:
使用两个样本T检验和最小绝对收缩和选择算子回归算法提取影像特征。
6.根据权利要求1-5之一所述的影像组学分析模型构建方法,其特征在于,所述使用两个样本T检验,并采用最小绝对收缩算法和选择算子回归算法提取影像特征包括如下步骤:
首先,选择主要队列中完全病理缓解组和非完全病理缓解组之间基于单变量统计检验的最佳特征;
其次,采用最小绝对收缩算法提取影像特征,将具有最小绝对收缩和选择算子惩罚的正则多变量logistic回归应用于主要队列的数据,其中将所选特征的线性组合加权各自的系数,设置一个模型被用来估计基于放射学特征的放化疗结果,其中该模型按照以下方式被定义:
其中,模型y的值为1时表示病人处于完全病理缓解组,模型y的值为0时表示病人处于非完全病理缓解组;d表示用在该模型中的变量总数;xj(j=1,2……d)表示变量;βj(j=0,
1,2……d)表示模型参数,ε表示误差项,
再次,采用选择算子回归算法提取影像特征,用正则化回归估测模型的参数、特征选择,并通过赋予许多参数以零值可以同时进行:
其中γi表示病人i的结果;N表示病人数量;S是Sigmoid函数;xij代表第i个病人的第j个特征;λ表示正则化参数,其中Sigmoid函数定义为:
应用具有选择算子LASSO惩罚的 通过设置一些参数βj为0来引导稀疏模型,然后选择对模型贡献较大的特征来使用。
7.根据权利要求6所述的影像组学分析模型构建方法,所述基于提取的影像特征建立影像组学分析模型包括:
使用多因素Logistic分析建立影像组学分析模型。
8.一种影像组学分析方法,其特征在于,包括:
获取患者治疗前的影像数据;
从所述影像数据中划分感兴趣区域;
针对所述感兴趣区域进行影像特征提取;
基于提取的影像特征和按照权利要求1-7之一所述的影像组学分析模型构建方法构建的影像组学分析模型,对患者进行分类。

说明书全文

一种影像组学分析模型构建方法及分析方法

技术领域

[0001] 本申请涉及生物医学工程技术领域,具体地,涉及一种影像组学分析模型构建方法及分析方法。

背景技术

[0002] 先进行新辅助放化疗再行根治性手术等综合治疗方案是一种基本的治疗策略,但是对于不同类型的患者,该策略的效果是存在很大差异的。以非小细胞癌(non-small cell lung cancer,NSCLC)为例,研究证实,在中位无进展生存期方面,术前放化疗有明显优势,且远处转移率也低于单独手术组;对于无纵隔淋巴结转移的I期-II期(N0-1)患者,术前放化疗的生存获益更明显;而对于IIIa期(N2)患者,并没有明显优势。
[0003] 然而,目前并没有相关方法在治疗之前识别不同类型的患者。发明内容
[0004] 为了解决上述技术问题,本发明的目的在于提供一种影像组学分析模型的构建方法以及影像组学分析方法,能够在治疗前识别出不同类型的患者。
[0005] 根据本发明的第一方面,提出如下的技术方案:
[0006] 根据本发明所述的一种影像组学分析模型构建方法,其特征在于,包括:
[0007] S1、获取不同类型的患者在治疗前和治疗后的影像数据;
[0008] S2、从影像数据中划分感兴趣区域;
[0009] S3、分别针对治疗前和治疗后的影像数据中的感兴趣区域进行影像特征提取;
[0010] S4、基于提取的影像特征建立影像组学分析模型。
[0011] 进一步地,根据本发明所述的影像组学分析模型构建方法,其特征在于,进一步包括:
[0012] 所述治疗包括放疗和/或化疗。
[0013] 进一步地,根据本发明所述的影像组学分析模型构建方法,所述影像数据包括CT影像。
[0014] 根据本发明所述的影像组学分析模型构建方法,所述感兴趣区域为肿瘤区域。
[0015] 进一步地,根据本发明所述的影像组学分析模型构建方法,所述影像特征提取包括:
[0016] 使用两个样本T检验,并采用最小绝对收缩算法和选择算子回归算法提取影像特征。
[0017] 进一步地,根据本发明所述的影像组学分析模型构建方法,包括如下步骤:
[0018] 首先,选择主要队列中完全病理缓解组和非完全病理缓解组之间基于单变量统计检验的最佳特征;
[0019] 其次,采用最小绝对收缩算法提取影像特征,将具有最小绝对收缩和选择算子惩罚的正则多变量logistic回归应用于主要队列的数据,其中将所选特征的线性组合加权各自的系数,设置一个模型被用来估计基于放射学特征的放化疗结果,其中该模型按照以下方式被定义:
[0020]
[0021] 其中,模型y的值为1时表示病人处于完全病理缓解组,模型y的值为0时表示病人处于非完全病理缓解组;d表示用在该模型中的变量总数;xj(j=1,2……d)表示变量;βj(j=0,1,2……d)表示模型参数,ε表示误差项,
[0022] 再次,采用算子回归算法提取影像特征,具体为,用正则化回归估测模型的参数、特征选择,并通过赋予许多参数以零值可以同时进行:
[0023]
[0024] 其中γi表示病人i的结果;N表示病人数量;S是Sigmoid函数;xij代表第i个病人的第j个特征;λ表示正则化参数,其中Sigmoid函数定义为:
[0025]
[0026] 应用具有选择算子LASSO惩罚的 通过设置一些参数βj为0来引导稀疏模型,然后选择对模型贡献较大的特征来使用。
[0027] 进一步地,根据本发明所述的影像组学分析模型构建方法,所述基于提取的影像特征建立影像组学分析模型包括:
[0028] 使用多因素Logistic分析建立影像组学分析模型。
[0029] 根据本发发明所述的一种影像组学分析方法,其特征在于,包括:
[0030] 获取患者治疗前的影像数据;
[0031] 从所述影像数据中划分感兴趣区域;
[0032] 针对所述感兴趣区域进行影像特征提取;
[0033] 基于提取的影像特征和按照上述的影像组学分析模型构建方法构建的影像组学分析模型,对患者进行分类。
[0034] 本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0035] 基于大数据思想建立影像组学分析模型,能够在治疗前对不同患者进行分类。在对主要队列的上述临床参数进行多因素Logistic分析的基础上,用筛选出的样本构建PCR检测的影像组学模型,为临床提供定量工具。
[0036] 此外,根据本发明所提出的影像组学模型来检测pCR显示出比所有患者都被假定为实现无患者的方案更大的优势。通过无创的方式纳入预处理和后处理的CT数据开发的影像组学模型,易于使用的列线图可以个性化预测非小细胞肺癌患者不同临床治疗方式的获益程度,从而为临床决策提供了一个有效的工具。附图说明
[0037] 图1为本发明的影像组学分析模型构建方法示意图;
[0038] 图2为本发明影像组学特征与影像组学模型的性能对比图。

具体实施方式

[0039] 下面为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0040] 在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
[0041] 图1示出了本发明的影像组学分析模型构建方法,包括:
[0042] S1、获取不同类型的患者在治疗前和治疗后的影像数据;
[0043] 优选地,所述治疗包括放疗和/或化疗,所述影像数据包括CT影像数据。
[0044] S2、从影像数据中划分感兴趣区域;
[0045] 针对不同类型的患者治疗前后的影像数据,选择感兴趣区域ROI,所述感兴趣区域例如为肿瘤区域。
[0046] S3、分别针对治疗前和治疗后的影像数据中的感兴趣区域进行影像特征提取;
[0047] 所述影像特征提取包括:
[0048] 使用两个样本T检验,并使用最小绝对收缩算法和选择算子回归算法提取影像特征,目的在于为了减少过度拟合或任何类型的偏差。
[0049] 具体地,所述使用两个样本T检验采用最小绝对收缩算法和选择算子回归算法提取影像特征,具体步骤包括:
[0050] (1)首先,选择主要队列中pCR(完全病理缓解)组和非pCR(非完全病理缓解)组之间基于单变量统计检验(双样本t检验)的最佳特征;
[0051] (2)其次,采用最小绝对收缩算法提取影像特征,具体为,将具有最小绝对收缩和选择算子(LASSO)惩罚的正则多变量logistic回归应用于主要队列的数据,其中将所选特征的线性组合加权各自的系数,设置一个模型被用来估计基于放射学特征的放化疗结果,其中该模型按照以下方式被定义:
[0052]
[0053] 其中,模型y的值为1时表示病人处于pCR组,模型y的值为0时表示病人处于非pCR组;d表示用在该模型中的变量总数;xj(j=1,2……d)表示变量;βj(j=0,1,2……d)表示模型参数,ε表示误差项。
[0054] (3)再次,采用选择算子回归算法提取影像特征,具体为,用正则化回归(regularized regression)估测模型的参数、特征选择(通过赋予许多参数以零值)可以同时进行。这种方法的目的是最小化成本函数:
[0055]
[0056] 其中γi表示病人i的结果;N表示病人数量;S是Sigmoid函数;xij代表第i个病人的第j个特征;λ表示正则化参数,其中Sigmoid函数定义为:
[0057]
[0058] 具有选择算子LASSO惩罚的 被应用,通过设置一些参数βj为0来引导稀疏模型,然后选择对模型贡献较大的特征来使用。
[0059] 其中,步骤S13所述的样本T检验,亦称Student T检验(Student's T test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。
[0060] S4、基于提取的影像特征建立影像组学分析模型。
[0061] 所述基于提取的影像特征建立影像组学分析模型包括:使用多因素Logistic分析建立影像组学分析模型。
[0062] 进一步地,在影像组学分析模型建立之后,对影像组学分析模型进行评估。所述评估包括:观察者内和观察者间重复性评估和/或Hosmer-Clemeshow检验。
[0063] 进一步地,本发明的一种影像组学分析方法具体包括如下步骤:
[0064] S21、获取患者治疗前的影像数据;
[0065] S22、基于提取的影像特征和按照上述的方法构建的影像组学分析模型,对患者进行分类。
[0066] 根据本发明的一个实施例,仍以非小细胞肺癌(non-small cell lung cancer,NSCLC)为例,将患者分为两种类型:一种是在治疗后达到pCR(完全病理缓解),称为PCR组,另一种是在治疗后未达到pCR,称为非pCR组。建立影像组学分析模型的实施例如下:
[0067] 获取不同类型的患者放化疗前和放化疗后的CT影像。患者每次做CT的CT影像都会存储在数据库中,根据治疗后的效果从中选取第一数量的pCR组的患者CT影像和第二数量的非pCR组的患者CT影像。第一数量和第二数量可以相同也可以不同,数量越多,最终形成的模型在判别时的准确性越高。在该实施例中,优选地所述第一数量和第二数量都大于或等于100。
[0068] 对每个CT影像创建感兴趣区域(the regions of interest,ROI)。感兴趣区域使用强化成像和非强化成像数据,包括整个肿瘤并排除肺叶。放化疗前,沿强化成像数据显示的肿瘤轮廓绘制ROI,包含周围的弦和毛刺。感兴趣区置于每个CT切面上的非强化成像区域。如果放化疗后强化成像仍出现高度可疑肿瘤信号,ROI勾画标准与放化疗前相同。如果在强化成像数据上在瘤床中检测到低、混杂强度或任何其他非正常的肺叶信号(异常信号),则用异常信号区域的轮廓绘制ROI。在强化成像数据未发现异常信号的情况下,将ROI置于放化疗前强化成像数据确定的原发瘤床区域。如果在非强化成像数据上注意到高度可疑的肿瘤信号(高信号),则将ROI置于高信号区域上方。在非强化成像数据与正常肺叶相比未检测到高信号的情况下,将ROI置于放化疗前非强化成像数据确定的原发瘤床区域。如果放化疗后强化成像数据未见肿瘤信号,则根据预处理图像在相应的瘤床区域勾画非强化成像数据的ROI。
[0069] 对每个CT影像用Z值归一化,以获得图像强度的标准正态分布。为了减少过度拟合或任何类型的偏差在我们的Radiomics模型中,使用了两个特征选择步骤。首先,选择主要队列中pCR(完全病理缓解)组和非pCR组之间基于单变量统计检验(双样本t检验)的最佳特征。其次,将具有最小绝对收缩和选择算子(LASSO)惩罚的正则多变量logistic回归应用于主要队列的数据。
[0070] 从标准化的治疗前和治疗后CT影像的强化数据和非强化数据中提取3组成像特征,并分割ROI:(i)4个统计特征,(ii)43个体素强度计算特征,和(iii)516个小波特征。第1组由量化的肿瘤强度特征组成,一阶统计量由所有肿瘤强度的直方图计算。第2组包含基于肿瘤内异质性量化的纹理特征(即,在肿瘤体积内观察到的纹理差异);这些特征均使用二维分析计算,并对三维肿瘤体积内的所有切片取平均值。第3组从原始图像的小波分解中合并计算出的纹理特征,从而聚焦于肿瘤体积内的各种频率尺度和不同的特征取向。最后一组包括每个MRI扫描的每种模态(强化和非强化)的563个特征,每个患者总共有2252个放射学特征。
[0071] 在本发明的实施例中,采用以下临床信息进行多因素logistic回归分析:年龄,性别,治疗后CEA,治疗后CA19-9,组织学分级,治疗前和治疗后肿瘤长度,治疗前和治疗后肿瘤厚度,治疗前和治疗后侵犯距离超过脏层胸膜,治疗前和治疗后脏层胸膜和肿瘤扩展外缘之间最短距离,检测的治疗前和治疗后淋巴结总数(NLN),最大淋巴结的治疗前和治疗后短轴长度(MALLLN),以及放射组学特征。采用似然比检验,以Akaike信息准则作为停止规则,应用向后逐步选择。在对主要队列的上述临床参数进行多因素Logistic分析的基础上,用筛选出的样本构建PCR检测的影像组学模型。
[0072] 进一步地,为了验证模型的效果,应用观察者内和观察者间重复性评估和/或Hosmer-Clemeshow检验。如果验证效果不能满足需求,则继续执行以上步骤,增加更多的患者数据来构建影像组学模型,直至达到标准。
[0073] 在其中的试验数据中,根据本发明方法所显示的,影像组学特征性能的详细信息如图2(影像组学特征与影像组学模型的性能对比)所示。在图2中,在验证队列中,放射组学特征产生的AUC为0.9744[95%可信区间(CI),0.9642-0.9756],分类准确率为94.08%(95%可信区间,93.19-94.79%);在验证队列中产生的AUC为0.9799(95%可信区间,0.9780-0.9840),分类准确率为94.29%(95%可信区间,94.21-95.61%)。更重要的是,放射组学特征在主要队列中实现了86.96%的PPV(95%可信区间,84.84-90.40%),在验证队列中实现了90.00%的PPV(95%可信区间,89.60-99.40%)。由图2可以发现,原发性队列中pCR与非pCR患者的影像组学评分差异有统计学意义(P<0.01);验证队列也是如此(P<
0.01),完全可以满足验证要求,即验证记过在主要队列中表现出良好的一致性。
[0074] 在本申请中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何一个或多个实施例或示例中以合适的方式结合。
[0075] 以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈