首页 / 专利库 / 人工智能 / 因果图 / 一种基于对抗生成网络的人脑效应连接识别方法

一种基于对抗生成网络的人脑效应连接识别方法

阅读:248发布:2020-05-12

专利汇可以提供一种基于对抗生成网络的人脑效应连接识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于对抗生成网络的人脑效应连接识别方法,通过GANs生成与真实fMRI数据相似的数据,从而学习数据集中的先验知识,然后再通过模型驱动方法(SEM模型)进行人脑效应连接识别。当SEM模型学习到的效应连接接近真实标准效应连接时,生成的模拟数据也将与真实数据一致。同样的,当生成的模拟数据逐渐向真实数据分布靠近时,效应连接也将能真实反映脑区间的因果关系。与传统的模型驱动方法相比,本发明在不需要先验知识的情况下,更加准确有效地识别人脑效应连接,具有良好的使用效果和广阔的应用前景。,下面是一种基于对抗生成网络的人脑效应连接识别方法专利的具体信息内容。

1.一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:包括以下步骤,步骤1获取真实fMRI时间序列数据;为了将本方法与现有的脑效应连接网络识别方法进行对比,使用一组具有经验标准网络的真实fMRI数据集;由于fMRI数据集中的数据具有高维的特点,直接使用全脑时间序列数据,数据量很大;因此,在使用fMRI数据时,需要对图像进行降维;使用感兴趣区域体素时间序列平均的方法获取每个ROI上的具有代表性的体素时间序列,以此对数据降维;
步骤2设计基于对抗生成网络的脑效应连接识别模型,包括生成器设计、判别器设计和损失函数设计;
步骤3模型预训练;生成器和判别器均由全连接神经网络组成,因此在使用前,需确定神经网络的层数,每层网络的神经元个数、激活函数、学习率、稀疏化系数和每个脑区最大父母节点个数;训练使用具有标准网络的公开仿真fMRI数据或使用公开数据生成工具箱生成仿真数据;当EC-GANs模型在仿真数据中得到最优解时,即效应连接与标准效应连接结果高度一致时,保留当前模型参数,作为EC-GANs模型初始参数;
步骤4 EC-GANs模型训练;EC-GANs模型训练包含两个过程,一方面训练判别器使其能有效判别真实数据和生成的模拟数据,另一方面训练生成器生成与真实fMRI数据高度相似的模拟数据;其中,生成器由n个效应连接生成器组成,n为脑区个数;生成器将n-1个脑区体素时间序列,因果参数和高斯噪声作为输入,生成相应脑区的体素时间序列;当生成的体素时间序列与该脑区真实的体素时间序列相一致时,因果参数即反映该脑区与其他脑区之间的因果关系;因此用该因果参数进行人脑效应连接的识别;
步骤5人脑效应连接识别;通过EC-GANs模型的因果参数进行人脑效应连接的识别,首先,获取全部脑区的因果参数矩阵A∈Rn×n,若矩阵中的元素Aij>给定阈值m,则认为存在一个效应连接从脑区j到脑区i,反之则不存在效应连接;
步骤6结果对比分析。
2.根据权利要求1所述的一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:fMRI体素时间序列数据获取;数据集使用真实任务态fMRI数据,数据通过3T扫描仪获取,重复时间为2s,每名被试的时间点个数为160,被试数量为9名;感兴趣区域的选择为8个常规脑区加一个外部输入,共9个。
3.根据权利要求1所述的一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:基于对抗生成网络的脑效应连接识别模型即EC-GANs模型;输入为fMRI真实数据,输出为生成的fMRI数据和效应连接;EC-GANs模型由生成器和判别器组成;生成器包含若干个效应连接生成器,每个效应连接生成器由一个结构方程模型SEM组成;假设有n个脑区Xi(i=
1,...,n),使用SEM模型则将每个脑区表示为:
Xi=fi(PA(Xi),εi),for i=1,...,n,        (1)
其中,PA(Xi)表示脑区Xi的父母节点集合,fi(·)是一个映射函数即每个脑区Xi和其父母节点的因果关系;εi是每个脑区Xi的随机高斯噪声;若用fij(·)表示脑区Xj对于脑区Xi的效应连接,则公式(1)写为:
其中,fij(·),j∈PA(Xi)表示脑区Xi与其父母节点的因果关系,若存在一条脑效应连接从脑区Xj到脑区Xi,即Xj->Xi,则fij(·)≠0;因此,给定数据集D,识别全部n个脑区的脑效应连接,简化为计算全部脑区和其父母节点的因果关系:
θD=(f12,f13,...,f1n,f21,...,f2n,...,fn1,...,fn(n-1))     (3)
其中D为fMRI体素时间序列数据,表示为:
给定因果关系推断方法,引入到效应连接生成器中,则针对每个效应连接生成器,生成脑区Xi体素时间序列的过程计算为:
其中Aij为脑区Xi与其他脑区之间的因果参数,Aij=0表示脑区i与脑区j之间不存在效应连接,当i=j时,设Aij=0,即不考虑脑区和自身的效应连接。
4.根据权利要求1所述的一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:在损失函数上增加了一个L1正则项,使得效应连接参数矩阵Aij产生稀疏解;稀疏惩罚函数为:
其中,t为fMRI时间序列数据长度,λ为稀疏化超参数;最后,模型整体损失函数为:
其中Lp为稀疏罚,D(X)表示fMRI数据X来自真实fMRI数据集而不是生成fMRI数据集的概率,Gi(·)为脑区Xi的生成函数,由多层感知器表示的可微函数,是生成器i生成的脑区Xi的体素时间序列数据, 为不包含脑区Xi的其他脑区体素时间序列数据; 为期望,PD(X)为真实fMRI数据分布, 假设空间的分布;损失函数的作用是使得效应连接生成器能够生成稀疏解,并避免过拟合问题。
5.根据权利要求1所述的一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:基于对抗生成网络的脑效应连接识别模型由生成器和判别器组成,生成器包含n个效应连接生成器,每个生成器均由一个包含m个神经元,每个神经元使用Tanh激活函数,x个隐藏层的全连接神经网络组成;判别器则是由一个包含m个神经元,每个神经元使用Sigmod激活函数,y个隐藏层的全连接神经网络组成,并在全连接层之后使用批量归一化操作;为了选择模型超参数,即神经元个数m和隐藏层个数x,y,学习率α,稀疏化系数λ和最大父母节点个数MaxP;训练使用具有标准网络的公开仿真fMRI数据,当EC-GANs模型在仿真数据中得到最优解时,即效应连接与标准效应连接结果高度一致时,保留当前模型参数,作为模型初始参数。
6.根据权利要求1所述的一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:使用EC-GANs模型识别脑效应连接;模型识别效应连接包含两个过程,一方面训练判别器使其能有效判别真实数据和生成的模拟数据,另一方面训练生成器生成与真实fMRI数据高度相似的模拟数据;其中,生成器将n-1个脑区体素时间序列,因果参数和高斯噪声作为输入,生成相应脑区的体素时间序列;当生成的体素时间序列与该脑区真是的体素时间序列相一致时,因果参数A∈Rn×n即真是反映了该脑区与其他脑区之间的关系。
7.根据权利要求1所述的一种基于对抗生成网络的人脑效应连接识别方法,其特征在于:人脑效应连接识别;通过模型因果参数进行人脑效应连接的识别,首先,获取全部脑区的因果参数矩阵A∈Rn×n,若矩阵中的元素Aij>给定阈值m,则认为存在一个效应连接从脑区j到脑区i,反之则不存在效应连接;为避免阈值选取不当和人为操作带来的影响,阈值m的取值由最大父母节点个数MaxP决定。

说明书全文

一种基于对抗生成网络的人脑效应连接识别方法

技术领域

[0001] 本发明涉及人脑效应网络识别方法,特别是一种基于对抗生成网络(Generative Adversarial Networks,GANs)的识别方法。

背景技术

[0002] 从神经影像数据中识别人脑效应连接是人脑连接组研究中一项重要的研究课题,并且已成为评价正常脑功能及其与神经退化疾病相关损伤的一种有效手段。因此准确地识别人脑效应连接,对于了解人脑网络中脑区间的因果效应,理解脑疾病的发病机理,进行脑疾病的早期诊断以及病理的研究具有重要的意义。具体来说,人脑效应连接网络是一种由节点和有向边构成的图模型,其中节点表示脑区,有向边即效应连接,它刻画了一个脑区施加于另一个脑区神经活动的因果效应。
[0003] 常用的脑影像数据包含但不限于功能磁共振成像(functional  magnetic resonance imaging,fMRI),脑电波(Electroencephalogram,EEG)等。其中,功能磁共振成像技术是一种基于磁共振成像的、非介入的、无创伤且非常有效的脑功能成像技术。由于它具有可靠的理论基础、良好的时空分辨率等诸多特性,为认知神经科学的实验研究提供了有利条件,同时又在病理学研究方面具有很重要的临床意义,拥有着广泛的应用前景和重要科学价值。特别是通过使用fMRI数据识别人脑效应连接,可以帮助了解复杂的人类大脑的运作,并为理解精神病和神经性疾病,如早老性痴呆和帕金森病精神分裂症,上瘾,和抑郁症等提供帮助。
[0004] 现有的脑效应连接识别方法大体可以分为两类,一类是基于模型驱动的识别方法,一类是基于数据驱动的识别方法。1)基于模型驱动的方法是一种验证性方法,它基于一个先验的连接模型来对脑效应连接进行有效性检验,代表性方法包括结构方程模型(structural equation modeling,SEM)、动态因果模型(dynamic causal modeling,DCM)等方法。研究表明,这类方法在任务态fMRI数据和脑区规模较小时表现较好,而不适用于静息态fMRI数据的分析或缺乏先验模型的情况。2)基于数据驱动的方法不需要先验知识和假设,能够直接从数据中提取脑区间的因果关系。该类方法包括格兰杰因果模型(Granger causality,GC)、线性非高斯无环模型(Linear Non-Gaussian Acyclic causal Models,LiNGAM)、广义线性同步模型(Generalized synchronization,GS)、贝叶斯网(Bayesian network,BN)等方法。数据驱动方法虽然不依赖先验知识,可以直接从数据中识别效应连接。但是这些方法也存在对数据噪声敏感、识别准确率不高、计算复杂度高、对数据分布有一定限制等缺陷
[0005] 近年来,对抗生成网络(Generative Adversarial Networks,GANs)在监督学习任务中表现出了非常卓越的性能,并在很多应用领域取得了成功,如图像生成,图像合成,图像转换,数据补全,因果推理等领域。具体地,GANs由两个部分组成,分别为生成器(Generator)和判别器(Discriminator)。生成器是用来学习到真实的数据分布,判别器则是用于判断数据是生成的还是真实的。GANs在生成器与判别器的对抗学习过程中不,生成与真实世界样本高度相似的模拟数据,特别是在数据噪声高,样本少的情况下,与其他传统的生成方法相比具有明显的优势。
[0006] 本发明通过GANs生成与真实fMRI数据相似的数据,从而学习数据集中的先验知识,然后再通过模型驱动方法(SEM模型)进行人脑效应连接识别。当SEM模型学习到的效应连接接近真实标准效应连接时,生成的模拟数据也将与真实数据一致。同样的,当生成的模拟数据逐渐向真实数据分布靠近时,效应连接也将能真实反映脑区间的因果关系。
[0007] 与传统的模型驱动方法相比,本发明提出的方法可以在不需要先验知识的情况下,更加准确有效地识别人脑效应连接,具有良好的使用效果和广阔的应用前景。

发明内容

[0008] 针对当前人脑效应识别方法的不足,本发明提出一种基于对抗生成网络的人脑效应连接识别方法(EC-GANs)。该方法充分利用了对抗生成网络的优势,在生成数据的过程中,自动地学习了结构方程模型(SEM)所需要的先验知识和模型参数,从而有效地识别效应连接,克服了传统模型驱动方法需要先验知识的缺陷。实验结果表明本发明的方法能够识别出更合理、更可靠的人脑效应连接而不需要人为干预。
[0009] 实现本发明的主要思路是:本发明以fMRI数据为例进行说明。首先,获取真实fMRI时间序列数据(非图像数据);然后,使用有标准网络的仿真fMRI数据对本发明提出的方法EC-GANs进行预训练,确定网络结构及超参数;接着,将真实fMRI数据作为输入,使用生成器(Generator)生成与真实数据相似的数据,使用判别器(Discriminator)进行判断;训练判别器的区分能,使其能够区分真实fMRI数据和生成fMRI数据;训练生成器的生成能力,使其能够生成逼近真实fMRI数据的模拟fMRI数据,从而使判别器无法正确区分;最后,当对抗训练结束时,即生成的fMRI数据与真实fMRI数据非常接近时,提取当前生成器中结构方程模型的因果参数,使用该因果参数进行人脑效应连接识别;在真实的经验标准网络数据中,将所提方法与其他方法进行对比,验证方法有效性。
[0010] 本发明采用的技术方案为一种基于对抗生成网络的人脑效应连接识别方法(EC-GANs)包括以下步骤:
[0011] 步骤1获取真实fMRI时间序列数据;为了将本方法与现有的脑效应连接网络识别方法进行对比,使用一组具有经验标准网络的真实fMRI数据集。由于fMRI数据集中的数据具有高维的特点,直接使用全脑时间序列数据,数据量很大。因此,在使用fMRI数据时,需要对图像进行降维。使用感兴趣区域体素时间序列平均的方法获取每个ROI上的具有代表性的体素时间序列,以此达到对数据降维的目的。
[0012] 步骤2设计基于对抗生成网络的脑效应连接识别方法(EC-GANs模型),包括生成器设计、判别器设计和损失函数设计。
[0013] 步骤3模型预训练;生成器和判别器均由全连接神经网络组成,因此在使用前,需确定神经网络的层数,每层网络的神经元个数、激活函数、学习率、稀疏化系数和每个脑区最大父母节点个数。训练使用具有标准网络的公开仿真fMRI数据或使用公开数据生成工具箱生成仿真数据。当EC-GANs模型在仿真数据中得到最优解时,即效应连接与标准效应连接结果高度一致时,保留当前模型参数,作为EC-GANs模型初始参数。
[0014] 步骤4EC-GANs模型训练;EC-GANs模型训练包含两个过程,一方面训练判别器使其能有效判别真实数据和生成的模拟数据,另一方面训练生成器生成与真实fMRI数据高度相似的模拟数据。其中,生成器由n个效应连接生成器组成,n为脑区个数。生成器将n-1个脑区体素时间序列(不含当前脑区),因果参数和高斯噪声作为输入,生成相应脑区的体素时间序列。当生成的体素时间序列与该脑区真实的体素时间序列相一致时,因果参数即反映该脑区与其他脑区之间的因果关系。因此用该因果参数进行人脑效应连接的识别。
[0015] 步骤5人脑效应连接识别;通过EC-GANs模型的因果参数进行人脑效应连接的识别,首先,获取全部脑区的因果参数矩阵A∈Rn×n,若矩阵中的元素Aij>给定阈值m,则认为存在一个效应连接从脑区j到脑区i,反之则不存在效应连接。
[0016] 步骤6结果对比分析;将本方法提出的算法与其他经典算法在真实数据集上进行对比实验,观察所提方法识别的效应连接是否与真实数据一致,探究新方法的优劣。
[0017] 与现有技术相比,本发明具有以下明显的优势和有益效果;
[0018] (1)本发明继承了传统模型驱动方法的优点而不需要先验知识,是一种有效的无监督人脑效应连接识别方法。
[0019] (2)本发明是第一个将传统模型驱动方法与对抗生成网络进行结合而提出的新型方法,相较其他方法,模型可以获得更真实、可靠的人脑效应连接网络。
[0020] (3)本发明与大部分传统的效应连接识别方法相比,不存在环约束和单向约束,可以识别环结构和双向效应连接。附图说明
[0021] 图1为本发明所涉及方法的流程图
[0022] 图2算法结构框架
[0023] 图3五个脑区的效应连接生成器的具体实现机制。
[0024] 图4真实fMRI数据网络构建结果。

具体实施方式

[0025] 下面通过仿真fMRI数据集和真实fMRI数据集两部分来阐述本发明的具体实施方式和详细步骤:
[0026] 步骤(1)fMRI体素时间序列数据获取。数据集使用真实任务态fMRI数据,数据通过3T扫描仪获取,重复时间(TR)为2s,每名被试的时间点个数为160,被试数量为9名。感兴趣区域的选择为8个常规脑区加一个外部输入,共9个。每个感兴趣区域的体素时间序列由该脑区内全部体素时间序列的均值表示。本发明所使用的感兴趣区域如表1所示。
[0027]
[0028]
[0029] 特别地,由于真实fMRI数据没有标准结果,因此一种有效的方法就是引入输入变量,然后观察输入变量所引起的变化,以此来检测不同算法在任务状态下对于脑效应连接的识别效果。
[0030] (步骤2)基于对抗生成网络的脑效应连接识别方法(EC-GANs模型)。模型整体框架图,如图2所示。输入为fMRI真实数据,输出为生成的fMRI数据和效应连接(因果参数)。EC-GANs模型由生成器和判别器组成。具体地,生成器包含若干个效应连接生成器(数量等于脑区个数),每个效应连接生成器由一个结构方程模型(SEM)组成。假设有n个脑区Xi(i=1,...,n),使用SEM模型则将每个脑区表示为:
[0031] Xi=fi(PA(Xi),εi),for i=1,...,n,   (1)
[0032] 其中,PA(Xi)表示脑区Xi的父母节点集合,fi(·)是一个映射函数即每个脑区Xi和其父母节点的因果关系。εi是每个脑区Xi的随机高斯噪声。若用fij(·)表示脑区Xj对于脑区Xi的效应连接,则公式(1)可以写为:
[0033]
[0034] 其中,fij(·),j∈PA(Xi)表示脑区Xi与其父母节点的因果关系,若存在一条脑效应连接从脑区Xj到脑区Xi,即Xj->Xi,则fij(·)≠0。因此,给定数据集D,识别全部n个脑区的脑效应连接,简化为计算全部脑区和其父母节点的因果关系:
[0035] θD=(f12,f13,...,f1n,f21,...,f2n,...,fn1,...,fn(n-1))   (3)[0036] 其中D为fMRI体素时间序列数据,可以表示为:
[0037]
[0038] 给定上述因果关系(效应连接)推断方法,将上述方法引入到效应连接生成器中,则针对每个效应连接生成器,生成(估计)脑区Xi体素时间序列的过程可以计算为:
[0039]
[0040] 其中Aij为脑区Xi与其他脑区之间的因果参数,Aij=0表示脑区i与脑区j之间不存在效应连接,特别地,当i=j时,我们设Aij=0,即不考虑脑区和自身的效应连接。图3以五个脑区为例,给出了效应连接生成器生成脑区体素时间序列的具体机制。最后,将效应连接生成器设定为在公式5的估计模型基础上加上一个具有多层全连接神经网络和than激活函数的生成网络。判别器为两层前馈全连接神经网络,并使用Sigmod函数作为激活函数。生成器通过将真实fMRI数据,噪声作为输入,生成与真实fMRI数据相似的模拟数据,然后判别器对两种数据进行区分,给出数据属于真实、生成两种情况的概率值。
[0041] 由于通常人脑效应连接是稀疏的,因此我们在损失函数上增加了一个L1正则项,使得效应连接参数矩阵Aij产生稀疏解。稀疏惩罚函数为:
[0042]
[0043] 其中,t为fMRI时间序列数据长度,λ为稀疏化超参数。最后,模型整体损失函数为:
[0044]
[0045] 其中Lp为稀疏罚,D(X)表示fMRI数据X来自真实fMRI数据集而不是生成fMRI数据集的概率(函数),Gi(·)为脑区Xi的生成函数(由多层感知器表示的可微函数,是生成器i生成的脑区Xi的体素时间序列数据), 为不包含脑区Xi的其他脑区体素时间序列数据。为期望,PD(X)为真实fMRI数据分布, 假设空间(生成fMRI数据空间)的分布。损失函数的作用是使得效应连接生成器能够生成稀疏解,并避免过拟合问题。
[0046] (步骤3)模型预训练;模型由生成器和判别器组成,生成器包含n个效应连接生成器(n为脑区个数),每个生成器均由一个包含m个神经元,每个神经元使用Tanh激活函数,x个隐藏层的全连接神经网络组成。判别器则是由一个包含m个神经元,每个神经元使用Sigmod激活函数,y个隐藏层的全连接神经网络组成,并在全连接层之后使用批量归一化(batchnormalization)操作。为了选择模型超参数,即神经元个数m和隐藏层个数x,y,学习率α,稀疏化系数λ和最大父母节点个数MaxP。训练使用具有标准网络的公开仿真fMRI数据,当EC-GANs模型在仿真数据中得到最优解时,即效应连接与标准效应连接结果高度一致时,保留当前模型参数,作为模型初始参数。最终用于真实fMRI数据的网络模型参数为:n=10,m=100,x=1,y=2,α=0.1,λ=5,MaxP=5.
[0047] (步骤4)使用EC-GANs模型识别脑效应连接;模型识别效应连接包含两个过程,一方面训练判别器使其能有效判别真实数据和生成的模拟数据,另一方面训练生成器可以生成与真实fMRI数据高度相似的模拟数据。其中,生成器将n-1个脑区体素时间序列(不含当前脑区),因果参数和高斯噪声作为输入,生成相应脑区的体素时间序列。当生成的体素时间序列与该脑区真是的体素时间序列相一致时,因果参数A∈Rn×n即真是反映了该脑区与其他脑区之间的关系。因此接下来可以用该因果参数进行人脑效应连接的识别。
[0048] (步骤5)人脑效应连接识别;通过模型因果参数进行人脑效应连接的识别,首先,获取全部脑区的因果参数矩阵(A∈Rn×n),若矩阵中的元素Aij>给定阈值m,则认为存在一个效应连接从脑区j到脑区i,反之则不存在效应连接。为了避免阈值选取不当和人为操作带来的影响,阈值m的取值由最大父母节点个数MaxP决定。
[0049] (步骤6)结果对比分析;将本发明提出的算法与其他经典算法在真实数据集上进行对比实验,观察所提方法识别的效应连接是否与真实数据一致,探究新方法的优劣。对比算法包括:
[0050] ①线性非高斯无环模型(Linear Non-Gaussian Acyclic causal Models,LiNGAM)
[0051] ②GES(Greedy Equivalence Search,基于贪婪等价类搜索的贝叶斯网方法);
[0052] 图4中可看出,本发明提出的方法可以正确地识别出输入变量和脑区的关系,即Input->LOCC和Input->LACC这两条效应连接,而其他两种对比算法均未能识别出这两效应连接。这一结果表明,本发明提出的方法可以准确地识别出脑连接的方向,合理地找出脑区之间的因果关系。此外,本发明的方法可以识别出双向效应连接,如LACCS与RACC,LIFG与RIFG之间的效应连接。在真实任务态fMRI数据上的结果显示,本发明的方法可以有效识别脑区之间的因果关系,准确地识别出人脑效应连接,具有良好的使用效果和广阔的应用前景。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈