技术领域
[0001] 本
发明涉及一种使用长短期记忆(LSTM)
算法来估计和监测乳腺肿瘤大小的预测系统。
背景技术
[0002] 据报道,美国白人女性
乳腺癌的发病率约为13.1%,而亚洲女性乳腺癌的发病率约为4%~7%。美国乳腺癌的平均5年生存率为90%,中国仅为73.1%,虽然欧美国家的乳腺癌发病率很高,但死亡率却很低。造成这种差异的主要原因一方面是由于许多发达国家的医疗
水平较高。另一方面是由于绝大多数病例中,乳腺癌患者在早期阶段被诊断出来。由于乳腺癌的可
预防性,通过频繁监测进行诊断可以提高癌症患者的存活率。目前使用
X射线乳房摄影术的乳腺癌筛查存在一些缺点,例如
电离辐射、压迫乳房、成本高以及在我们的日常家庭保健中实施该技术的困难。
[0003] 微波系统为乳腺癌筛查的现有X射线乳腺摄影标准提供了互补模式的可能性。微波系统不仅具有无痛非电离扫描的优势,而且还能够为越来越多的女性提供价格合理的检查。另外,由于微波检测系统的小型化和便利性,它有利于乳腺肿瘤的日常监测。
[0004] 在微波乳腺肿瘤检测系统中,不同大小的发育中的肿瘤可以产生不同但相关的微波传输
信号。特别地,在特定持续时间内特定患者的不同时间步长中的肿瘤信号之间存在更大的时间相关性。传统方法中使用单个状态信号来分类或检测肿瘤忽略了时间序列信号的相关性。在LSTM
递归神经网络中,输出不仅取决于输入,还取决于先前的输入。
发明内容
[0005] 本发明目的是:利用超宽带微波检测系统在基于长短时记忆(LSTM)算法
基础上实现乳腺肿瘤大小预测。
[0006] 为了达到上述目的,本发明的技术方案是提供了一种基于长短时记忆的超宽带微波乳腺肿瘤大小预测系统,其特征在于,包括:
[0007] 根据乳房中的正常组成部分及肿瘤之间的电磁特性搭建的超宽带微波乳腺肿瘤信号采集系统,由超宽带微波乳腺肿瘤信号采集系统根据肿瘤的生长过程收集不同时间的肿瘤微波反射信号数据;
[0008] 数据预处理模
块,用于对超宽带微波乳腺肿瘤信号采集系统采集的肿瘤微波反射信号数据进行预处理以提取特征信息;
[0009] LSTM肿瘤
预测模型,LSTM肿瘤预测模型使用从过去时间肿瘤大小获得的微波信息作为先验信息,并使用先验信息和当前时间肿瘤大小的数据的组合作为输入,然后组合数据线性连接到
隐藏层网络,
迭代计算输出向量序列,最后,通过激活函数计算来自
输出层的输出矢量,并获得输出矢量序列Y;
[0010] 肿瘤生长趋势预测模块,肿瘤生长趋势预测模块将通过数据预处理模块得到的实时特征信息输入LSTM肿瘤预测模型,由LSTM肿瘤预测模型根据得到的肿瘤的微
波数据信息,检测出肿瘤的大小,预测肿瘤的生长趋势。
[0011] 优选地,搭建所述超宽带微波乳腺肿瘤信号采集系统时,首先分析乳房中各组织的电磁特性,然后根据乳房各组织的电磁特性构建乳房模型,在乳房模型中,乳房是一个半径为8厘米的半球,根据乳房不同组织的电磁特性,将检测系统乳房模型分成4层,建立具有肿瘤的人乳房的完整3D模型,搭建所述超宽带微波乳腺肿瘤信号采集系统。
[0012] 优选地,所述超宽带微波乳腺肿瘤信号采集系统分析Gompertz肿瘤生长模型中肿瘤细胞随时间的变化过程,基于Gompertz肿瘤生长模型中肿瘤大小与时间的关系,模拟肿瘤的生长过程,收集肿瘤生长的一系列连续微波信号,即所述肿瘤微波反射信号数据。
[0013] 优选地,所述数据预处理模块首先对采集的时间序列肿瘤微波反射信号数据进行数据规范化,由于检索到的特征在数量上不同。在训练阶段,即使错误来自其他人,网络的权重调整也会被更大的输入量所压倒。为了确保较大的输入不会成为主导,肿瘤时间序列反向散射信号首先被标准化。随后使用主成分分析PCA从标准化数据中提取所述特征信息。
[0014] 优选地,所述LSTM肿瘤预测模型引入一个滑动
时间窗来捕获序列上的时间周期,窗口的长度是k,沿着初始序列移动滑动窗口,生成一个新的时间向量序列S,则对所述LSTM肿瘤预测模型进行训练时,将经过所述数据预处理模块处理后的数据样本放入所述LSTM肿瘤预测模型中进行训练,训练时,将第一组k个数据S1馈送到所述LSTM肿瘤预测模型中,并且y(k+1)作为用于
监督学习的目标值,学习所述LSTM肿瘤预测模型的参数以最小化预测值和目标值之间的误差,此外,在一个数据上移动,随后的k个数据S2被馈送到所述LSTM肿瘤预测模型中并且很快给出y(k+1)作为目标值,完成训练后,将第一个k测试数据输入训练好的所述LSTM肿瘤预测模型,基于训练的权重,计算下一次肿瘤大小的预测值。
[0015] 优选地,检测所述LSTM肿瘤预测模型准确度和合理性时,将需要进行测试的数据写入程序,对已经训练好的所述LSTM肿瘤预测模型进行测试,使用预测值和实际值的比率来显示预测的准确性。
[0016] 本发明通过建立超宽带微波检测系统并收集乳腺组织的微波散射信号序列,使用长短期记忆(LSTM)算法来估计和监测乳腺肿瘤大小。超宽带微波检测乳腺肿瘤使用宽频带的
电磁波对乳房进行扫描检查,然后用接收天线接收从乳房内部的反射信号,这些反射信号包含着乳房内部组织结构对微波的一些信息。然后使用LSTM递归神经网络来处理肿瘤的微波信号数据并预测肿瘤的大小和生长趋势,实现对乳腺肿瘤的监测。
[0017] 本发明的实用性在于,可以通过利用一个基于LSTM递归神经网络的肿瘤大小预测
框架,考虑连续采集信号之间的关系来估计肿瘤的大小和生长趋势。利用微波检测,实现对乳腺癌肿瘤在不同时间的大小的监测。
[0018] 由于采用了上述的技术方案,本发明与
现有技术相比,具有以下的优点和积极效果:传统方法使用单个状态信号来分类或检测肿瘤并忽略时间序列信号的相关性。特别地,在特定持续时间内特定患者的不同时间步长中的肿瘤信号之间存在更大的时间相关性。在LSTM递归神经网络中,输出不仅取决于输入,还取决于先前的输入。因此,本发明提出的基于LSTM递归神经网络的肿瘤大小预测系统考虑了连续采集信号之间的关系来估计肿瘤的大小和生长趋势。在基于LSTM的肿瘤大小数据预测中,不仅可以捕获肿瘤之间的依赖性,而且可以学习肿瘤生长的长期行为,并且可以实现对乳腺肿瘤的监测。
附图说明
[0019] 图1是本发明中的具有肿瘤的人乳房的完整3D模型图;
[0020] 图2是本发明中使用的LSTM结构图;
[0021] 图3是本发明中使用基于LSTM的乳腺肿瘤生长微波监测系统的框架图具体实施方式
[0022] 下面结合具体
实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或
修改,这些等价形式同样落于本
申请所附
权利要求书所限定的范围。
[0023] 本发明提出了一种基于LSTM递归神经网络的肿瘤大小预测框架,以考虑连续采集信号之间的关系来估计肿瘤的大小和生长趋势。在基于LSTM的肿瘤大小数据预测中,不仅可以捕获肿瘤之间的依赖性,而且可以学习肿瘤生长的长期行为,并且可以实现对乳腺肿瘤的监测。
[0024] 本发明的实施方式涉及利用超宽带微波检测系统基于长短时记忆(LSTM)算法基础上实现乳腺肿瘤大小预测,包括以下步骤:首先根据乳房中的正常组成部分(诸如腺体,脂肪等组织)及肿瘤之间的电磁特性,搭建超宽带微波信号采集系统。然后根据肿瘤的生长模型,收集不同时间的微波肿瘤序列信号数据。再对数据样本进行预处理;然后选取合适的LSTM训练参数,建立LSTM肿瘤预测模型;之后将处理后的数据样本放入LSTM模型中进行训练;最后选取测试样本,对测试样本进行预处理后输入训练好的LSTM肿瘤模型中,根据得到的肿瘤的微波数据信息,检测出肿瘤的大小,预测肿瘤的生长趋势。
[0025] (1)首先分析乳房中各组织的电磁特性,根据乳房各组织的电磁特性构建乳房模型。在模型中,乳房是一个半径为8厘米的半球。根据不同组织的电磁特性,将检测系统乳房模型分成4层,建立具有肿瘤的人乳房的完整3D模型。然后选择微波信号发射器和接收器,搭建超宽带微波信号采集系统。
[0026] (2)根据乳腺肿瘤的生长过程,收集不同时间的肿瘤序列数据,分肿瘤生长模型中肿瘤细胞随时间的变化过程,基于该模型中肿瘤大小与时间的关系,收集肿瘤生长的一系列连续微波信号数据。
[0027] (3)对数据样本进行预处理,在数据预处理部分,它主要由数据规范化和特征提取两部分组成。由于检索到的特征在数量上不同。在训练阶段,即使错误来自其他人,网络的权重调整也会被更大的输入量所压倒。为了确保较大的输入不会成为主导,肿瘤时间序列反向散射信号首先被标准化。我们使用以下等式对原始数据集进行归一化,并在每个数据点获得归一化值Xnorm
[0028]
[0029] 从标准化数据中提取特征以减少其维数。为了降低LSTM模型的计算复杂性,使用主成分分析(PCA)完成特征提取。
[0030] (4)选取合适的LSTM训练参数,建立LSTM肿瘤预测模型。该模型使用从过去时间肿瘤大小获得的微波信息作为先验信息,并使用先验信息和当前时间肿瘤大小的数据的组合作为LSTM模型的输入。然后,组合数据线性连接到隐藏层网络。迭代计算输出向量序列。最后,通过激活函数计算来自输出层的输出矢量,并获得输出矢量序列Y.LSTM是一种特殊类型的RNN。LSTM改进了RNN算法以存储先验信息。它提出了一种
门机制来确定信息的积累,以避免长期依赖性问题。门机制是传达信息选择的一种方式。LSTM由输入门,忘记门和输出门组成。作为基本逻辑单元,这些门通过权重和激活功能匹配数据,并通过门控制整个网络的输入,输出和遗忘部分。
[0031] it=σ(Wixt+Uiht-1+bi)
[0032]
[0033] ft=σ(Wfxt+Ufht-1+bf)
[0034]
[0035] ot=σ(Woxt+Uoht-1+bo)
[0036] ht=σt×tanh(ct)
[0037] 首先,输入门层决定应更新哪些信息。it指的是由S形门生成的时间步长的更新信息。是指通过tanh计算的时间步长的保留信息。遗忘门用于决定摆脱细胞状态的信息。它由S形激活函数,权重矩阵Wf和偏置矩阵bf组成。xt是指当前时间步的输入信息。ht-1指的是时间步的相应输出。Wi指的是输入门的参数矩阵。Ui指的是输入门中循环层的参数矩阵。bi指的是输入门的偏置矩阵。σ指的是激活函数,通常使用sigmoid函数。
[0038]
[0039] 指的是连接层的输入的参数矩阵。 指的是连接层的输入的循环层的参数矩阵。 指的是连接层的输入的循环层的偏置矩阵。ft指的是遗忘门的输出,由于sigmoid的输出ft在[0,1]之间,因此ft代表遗忘上一层隐藏细胞状态的概率。ot指的是输出门的输出。Wo指的是输出门的参数矩阵。Uo指的是输出门中循环层的参数矩阵。bo指的是输出门的偏置矩阵。更新的层是将旧的单元状态ct-1更新为新的单元状态ct。输出门是神经元部分的输出。该层有两部分:一个S形层作为输出门,首先过滤单元状态。然后,通过tanh并将其乘以输出ot以计算所需信息。
[0040] (5)将处理后的的数据样本放入LSTM模型中进行训练,微波肿瘤的时间初始序列可以表示为xi=(s1,s2,s3,…,sn,yi)i=1,2,3,....t,其中n是
采样点,s代表s11微波信号在不同
频率下的特征.yi表示i时的肿瘤大小。引入一个滑动时间窗来捕获序列上的时间周期。窗口的长度是k。沿着初始序列移动滑动窗口,生成一个新的时间向量序列S.当训练网络时,将第k个数据S1馈送到网络中,并且第yk+1作为用于监督学习的目标值。学习网络的参数以最小化预测值和目标值之间的误差。此外,在一个数据上移动,随后的k个数据S2被馈送到网络中并且很快给出yk+2作为目标值。完成培训后,我们将第一个k测试数据输入训练好的网络。基于训练的权重,计算下一次肿瘤大小的预测值。
[0041] (6)选取测试样本,对测试样本进行预处理后输入训练好的LSTM肿瘤模型中,根据得到的肿瘤的微波数据信息,检测出肿瘤的大小,预测肿瘤的生长趋势。检测模型准确度和合理性时,将需要进行测试的数据写入程序,对已经训练好的模型进行测试,使用预测值和实际值的比率来显示预测的准确性。