首页 / 专利库 / 心理学与精神病学 / 神经心理学 / 基于双向LSTM的阿尔茨海默症病情发展预测系统

基于双向LSTM的阿尔茨海默症病情发展预测系统

阅读:655发布:2020-05-13

专利汇可以提供基于双向LSTM的阿尔茨海默症病情发展预测系统专利检索,专利查询,专利分析的服务。并且本 发明 提出了一种基于双向LSTM的阿尔茨海默症病情发展预测系统,其特征在于,包括:预处理单元及基于 深度学习 的双向LSTM结合Attention机 制模 型。本发明主要从已获取到的神经 心理学 数据出发,分析数据的时间可利用性,参考深度学习中时间序列问题,把时间这一个关键的属性应用到模型上去。这样就可以降低由于单个时间点做预测而出现的性能问题。同时利用了深度学习中特有的给不同属性附加权重的方法,使得属性值有了各自的权重。,下面是基于双向LSTM的阿尔茨海默症病情发展预测系统专利的具体信息内容。

1.一种基于双向LSTM的阿尔茨海默症病情发展预测系统,其特征在于,包括:
预处理单元,用于对原始数据进行清洗,然后对清洗后的数据进行归一化处理,得到最终的训练集合,训练集合包含患者3次量表指标数据,每一次有7个指标;
基于深度学习的双向LSTM结合Attention机制模型,利用预处理单元获得的训练集合对双向LSTM结合Attention机制模型进行训练,双向LSTM结合Attention机制模型包括一个输入层、一个隐藏层及一个输出层,隐藏层包括BI-LSTM层及Attention处理机制,Attention处理机制包括用于进行permute计算的permute_1层、用来进行过渡的dense层及Attention_mul层,在输入层及输出层中,分别在输入input_layer后和输出output_layer前有两层dropout层,其中:
输入层输入数据的初始矩阵形状为(3,7),3代表的是模型时间维度,分别对应患者第一个月、第六个月和第十二个月的诊断数据,而7对应了通过预处理单元筛选出来的7个属性;当输入input_layer获取了输入数据之后,在保持数据形状不改变的情况下发送给了dropout层,dropout层的输出作为BI-LSTM层的输入;
在隐藏层中,BI-LSTM层的输出矩阵形状是(3,512),BI-LSTM层输出的矩阵一方面被用产生向量attention_vec,另一方面传递给Attention_mul层备用;BI-LSTM层输出的矩阵在permute_1层根据permute计算再次被进行转置,经过dense层过渡后得到了一个(3,512)的矩阵,这个矩阵就是模型所需要的向量attention_vec,最后attention_mul层使用BI-LSTM层的输出和向量attention_vec的输出作为输入,得到一个(3,512)的矩阵给位于输出层的dropout层;
在输出层中,dropout层的输出,将作为输出output_layer的输入,然后通过输出output_layer的计算得到一个三维向量,对应one-hot编码的病情,one-hot编码了患者的病情被使用,并且将模型的输出改为了3维。
2.如权利要求1所述的一种基于双向LSTM的阿尔茨海默症病情发展预测系统,其特征在于,所述预处理单元包括预处理模及属性筛选模块
预处理模块使用numpy的第三方库函数进行数据变形操作,同时使用库函数提供给使用者的大量接口,提升模型运行速度,方便双向LSTM结合Attention机制模型中神经网络的学习;
属性筛选模块首先对量表数据进行除空值、去重复值,随后使用数据分析常用的属性筛选器进行属性筛选,属性筛选器包括属性子集评估器和搜索方法,属性子集评估器选取属性的一个子集,并且返回一个指导搜索的度量数值,搜索方法根据搜索好的子集,通过选定的子集评估器来评估子集的质量

说明书全文

基于双向LSTM的阿尔茨海默症病情发展预测系统

技术领域

[0001] 本发明涉及一种基于双向LSTM的阿尔茨海默症病情发展预测系统,属于智能医疗领域。

背景技术

[0002] 阿尔茨海默症(Alzheimer disease,AD),亦称老年性痴呆(senile dementia),是一种发病缓慢且不易察觉的慢性神经系统退行性疾病。AD高发于老年人中,患者通常伴有记忆障碍、语言障碍、行为和精神等障碍。轻度认知障碍损害(MCI)为发生在阿尔茨海默症(AD)临床前期的一种综合症,是正常老化和早期AD之间的一种过渡状态,可能也是AD发病的早期信号。由于AD严重影响着人类生活,并且难以治愈,所以如果能提早预测MCI病情的出现以及发展趋势,就有希望发现和筛选出AD的高危人群,为AD的治疗提供最佳时间窗预防或推迟AD的发生。
[0003] 在医学上,已经建立了临床/认知功能度量表(clinical/cognitive measures)用于评估患者的认知状态,并参照这些量表做为临床诊断可能患有阿尔茨海默症的重要标准,比如简明精神状态检查量表(mini mental state examination,MMSE)和阿尔茨海默症评估量表认知量表(Alzheimer's disease assessment scale-cognitive subscale,ADAS-Cog)。
[0004] 随着数据收集技术的提高以及复杂度的增加,在很多应用中都需要处理异构数据源。对于阿尔茨海默症的预测也不例外,需要从多个异构的数据源中采集不同度量类型的数据进行分析,如磁共振图像(MRI)、电子发射断层扫描(PET)、基因[表情]白表达数据、基因资料等。另外,在采集过程中,经常会遇到有些条目缺失的情况,导致不完整的患者记录。目前对方法大多存在以下三个方面的缺陷
[0005] 1)数据方面,大多数的AD分类预测模型使用的原始数据是图像。而研究发现,病患在早期阶段可能会自认为只是因高龄而发生的认知改变及一些良性的原因而引起的认知改变,很少会去医院做脑部检查,所以对于AD的潜在病人和MCI无法做到早筛。
[0006] 2)模型特征方面,时间序列性并未充分被使用。AD病患的确诊并不是医生的一次诊疗就可以确定的,而是多次的神经心理学评估和核磁共振影像表现观察得出的。国内外对于病人早期的时序性数据应用并为进行深入的研究。
[0007] 3)属性特征方面,大多文章并未提及属性权重的问题。AD病患的数据中有太多空值和重复值,对于这样的数据,如果能筛选出属性权重高的特征值,能大幅度提高模型预测准确度。

发明内容

[0008] 本发明的目的是:对阿尔茨海默症的病情发展进行辅助诊断预测。
[0009] 为了达到上述目的,本发明的技术方案是提供了一种基于双向LSTM的阿尔茨海默症病情发展预测系统,其特征在于,包括:
[0010] 预处理单元,用于对原始数据进行清洗,然后对清洗后的数据进行归一化处理,得到最终的训练集合,训练集合包含患者3次量表指标数据,每一次有7个指标;
[0011] 基于深度学习的双向LSTM结合Attention机制模型,利用预处理单元获得的训练集合对双向LSTM结合Attention机制模型进行训练,双向LSTM结合Attention机制模型包括一个输入层、一个隐藏层及一个输出层,隐藏层包括BI-LSTM层及Attention处理机制,Attention处理机制包括用于进行permute计算的permute_1层、用来进行过渡的dense层及Attention_mul层,在输入层及输出层中,分别在输入input_layer后和输出output_layer前有两层dropout层,其中:
[0012] 输入层输入数据的初始矩阵形状为(3,7),3代表的是模型时间维度,分别对应患者第一个月、第六个月和第十二个月的诊断数据,而7对应了通过预处理单元筛选出来的7个属性;当输入input_layer获取了输入数据之后,在保持数据形状不改变的情况下发送给了dropout层,dropout层的输出作为BI-LSTM层的输入;
[0013] 在隐藏层中,BI-LSTM层的输出矩阵形状是(3,512),BI-LSTM层输出的矩阵一方面被用产生向量attention_vec,另一方面传递给Attention_mul层备用;BI-LSTM层输出的矩阵在permute_1层根据permute计算再次被进行转置,经过dense层过渡后得到了一个(3,512)的矩阵,这个矩阵就是模型所需要的向量attention_vec,最后attention_mul层使用BI-LSTM层的输出和向量attention_vec的输出作为输入,得到一个(3,512)的矩阵给位于输出层的dropout层;
[0014] 在输出层中,dropout层的输出,将作为输出output_layer的输入,然后通过输出output_layer的计算得到一个三维向量,对应one-hot编码的病情,one-hot编码了患者的病情被使用,并且将模型的输出改为了3维。
[0015] 优选地,所述预处理单元包括预处理模及属性筛选模块
[0016] 预处理模块使用numpy的第三方库函数进行数据变形操作,同时使用库函数提供给使用者的大量接口,提升模型运行速度,方便双向LSTM结合Attention机制模型中神经网络的学习;
[0017] 属性筛选模块首先对量表数据进行除空值、去重复值,随后使用数据分析常用的属性筛选器进行属性筛选,属性筛选器包括属性子集评估器和搜索方法,属性子集评估器选取属性的一个子集,并且返回一个指导搜索的度量数值,搜索方法根据搜索好的子集,通过选定的子集评估器来评估子集的质量
[0018] 本发明主要从已获取到的神经心理学数据出发,分析数据的时间可利用性,参考深度学习中时间序列问题,把时间这一个关键的属性应用到模型上去。这样就可以降低由于单个时间点做预测而出现的性能问题。同时利用了深度学习中特有的给不同属性附加权重的方法,使得属性值有了各自的权重。
[0019] 本发明具有如下优点:
[0020] (1)基于双向LSTM的阿尔茨海默症病情预测方法使用的模型是双向长短期记忆神经网络,双向长短期记忆神经网络可以对时间序列有很强的把握,处理时序相关的患者数据有明显的优势。
[0021] (2)模型方法在双向长短期记忆输出之后没有上进行求解,而是使用Attention机制进行了权重上计算,增加输入属性中与病情最相关的属性的权重,使得模型准确度能够得到进一步的提升。最终得到了一个良好性能的模型。附图说明
[0022] 图1为基于双向LSTM的阿尔茨海默症发展预测方法总体框架图;
[0023] 图2为双向LSTM和Attention机制的模型总体架构图。

具体实施方式

[0024] 下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0025] 本发明提供的一种基于双向LSTM的阿尔茨海默症病情发展预测系统包括预处理单元及基于深度学习的双向LSTM结合Attention机制模型。
[0026] 预处理单元,用于对原始数据进行清洗,然后对清洗后的数据进行归一化处理,得到最终的训练集合,训练集合包含患者3次量表指标数据,每一次有7个指标。
[0027] 本发明的预处理单元包括预处理模块及属性筛选模块。
[0028] 对于预处理模块,本发明的所有训练数据均来源于ADNI数据集提供的公共数据,而该方法的公共数据是带有时序的数据集。目前大多数的数据预测阿尔兹海默病是往往是使用机器学习相关算法进行分类或者回归预测,然而阿尔兹海默症是一种慢性疾病,仅仅使用患者的一次诊断数据,结果可能无法很好的代表患者近期的病情表现。除此之外,机器学习算法多是进行问题回归分析,当面临影响因素较多的情况是可能会有所欠缺。有一部分学者已经使用神经网络进行阿尔兹海默症的患者数据分析,但是大部分学者使用的是患者的核磁共振图像,而且已经取得了一定的成果,量表方面相关的研究还没有得到很好的发展。针对阿尔滋海默症的发病缓慢,影响阿尔兹海默症的外界因素众多以及自身生活方式复杂的原因,基于时间变化的数据更具有代表性。量表采集和分析能够大大地减少患者的时间成本和治疗。量表数据涵盖了多种不同的量表,并且这些量表也是世界上诊断阿尔兹海默症的评定标准。为了模型处理数据的速度更加快捷,并且提升编程效率,本发明的预处理模块使用numpy的第三方库函数进行数据变形操作,同时使用库函数提供给使用者的大量接口,提升模型运行速度,方便模型预测分析模块中神经网络的学习。
[0029] 公共数据集中往往采集的数据存在大量空值、重复值。为了提高模型的准确率,属性筛选模块对量表数据进行了人工除空值、去重复值。但是这样仅仅是在主观上面进行了简单的数据降噪,为了得到具备完整基向量的数据,属性筛选模块使用了数据分析常用的筛选器进行属性筛选。完整的属性筛选器包括属性子集评估器和搜索方法,属性子集评估器选取属性的一个子集,并且返回一个指导搜索的度量数值。搜索方法则是根据搜索好的子集,通过选定的子集评估器来评估子集的质量。使用的属性子集评估器是CfsSubsetEval(CFS),搜索方法用的是最佳优先搜索(Best First,BF)。的数据集通过CFS和BF筛选器之后得到了一个具有七个属性的子集,即在算法上和病情最相关的子集,具体方法是:
[0030] 原始ADNI数据集的数据除了存在大量空值和重复值之外,在模型预测时仍会存在大量的噪音,不利于提高模型预测准确度。为了找到预测效果最好的属性集合,属性筛选模块会搜索ADNI数据中所有可能的属性组合。而人工进行属性筛选不仅繁琐,还容易出错。CfsSubsetEval(CFS)评估器逐一评估每个属性的预测能和它们之间的重复程度,然后挑选出那些与病情高度关联但是相互之间关联程度低的属性。搜索方法是BestFirst(BF)通过进行贪心式爬山搜索,可以从一个空的属性集正向搜索,或从一个满集反向搜索,或从中间的一个点开始(由一列属性索引指定)并向前后两个方向,考虑到所有单个属性的加入及删除。已经评估过的子集将保存在高速缓冲存储器中,以提高效率,而缓冲器的大小只是一个参数。
[0031] 本发明以ADNI公共数据集提供的时序性神经心理学指标数据为训练数据基础,提出了基于深度学习的双向LSTM结合Attention机制模型,为患者提供更智能的AD诊断,为医生预测AD发展提供更好的辅助。
[0032] 基于深度学习的双向LSTM结合Attention机制模型,利用预处理单元获得的训练集合对双向LSTM结合Attention机制模型进行训练,双向LSTM结合Attention机制模型包括一个输入层、一个隐藏层及一个输出层,隐藏层包括BI-LSTM层及Attention处理机制,Attention处理机制包括用于进行permute计算的permute_1层、用来进行过渡的dense层(为了不让数据在模型计算中出现混乱和内存占用的状况)及Attention_mul层,为了防止发生过拟合的现象出现,在输入层及输出层中,分别在输入input_layer后和输出output_layer前有两层dropout层,其中:
[0033] 输入层输入数据的初始矩阵形状为(3,7),3代表的是模型时间维度,分别对应患者第一个月、第六个月和第十二个月的诊断数据,而7对应了通过预处理单元筛选出来的7个属性;当输入input_layer获取了输入数据之后,在保持数据形状不改变的情况下发送给了dropout层,dropout层的输出作为BI-LSTM层的输入。
[0034] 在设定隐藏层节点大小的时候,两点要素被考虑:第一,节点数量要足够,才能充分发挥数据的特征;第二,节点必须要在内存所能接受的范围内定义。所以综上两个原因,LSTM的cell size被定义为256,而在keras中cellsize又决定了节点数目,也就是图1中隐藏层部分和输出层部分的512个节点。在隐藏层中,为了增强图形的可读性,BI-LSTM在总体结构图中被简化了。在隐藏层中,BI-LSTM层的输出矩阵形状是(3,512),BI-LSTM层输出的矩阵一方面被用产生向量attention_vec,另一方面传递给Attention_mul层备用;BI-LSTM层输出的矩阵在permute_1层根据permute计算再次被进行转置,经过dense层过渡后得到了一个(3,512)的矩阵,这个矩阵就是模型所需要的向量attention_vec,最后attention_mul层使用BI-LSTM层的输出和向量attention_vec的输出作为输入,得到一个(3,512)的矩阵给位于输出层的dropout层;
[0035] 在输出层中,dropout层的输出,将作为输出output_layer的输入,然后通过输出output_layer的计算得到一个三维向量,对应one-hot编码的病情。同时对于输出数据,考虑到如果只进行一维的输出,一定会对实验结果造成较大的误差,为了降低模型的损失,one-hot编码了患者的病情被使用,并且将模型的输出改为了3维。一维病情的分类:正常(NL)对应0、轻度认知障碍(MCI)对应1、阿尔茨海默症(AD)对应2。One-hot编码NL,MCI,AD对应为[0,0,1],[0,1,0],[1,0,0]。。
[0036] 双向LSTM结合Attention机制模型的主要工作具体如下:
[0037] 提出基于双向LSTM的阿尔茨海默症病情预测方法,该方法使用公开数据集中的量表指标数据作为原始数据,通过人工和算法挑选出相应有效属性。筛选之后得到的数据将会被用来作为模型的训练集。训练集数据包含了患者时间序列上面的变化,通过掌握时间变化来预测患者病情的方法更为准确。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈