首页 / 专利库 / 物理 / 运动冗余 / 基于重构模型的人体运动意向检测方法

基于重构模型的人体运动意向检测方法

阅读:737发布:2020-05-11

专利汇可以提供基于重构模型的人体运动意向检测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于重构模型的人体运动意向检测方法,按照如下步骤进行:训练阶段,利用执行特定的人工处理意图任务的脑电 信号 训练重构模型,包括特征提取步骤和分类步骤;特征提取步骤采用组合 算法 波器组FBCSP进行特征提取;分类步骤通过分类器,分类识别用户是否正在执行某个运动意图任务;检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差;重构误差越小,在检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差,重构误差越小,该观察周期存在某个运动意图任务的可能性越大;本发明利用重构模型来表示运动意图的高层次抽象,并利用重构误差来确定是否存在运动意图;对任何复杂的现实情况具有理论上的灵活性和可靠性。,下面是基于重构模型的人体运动意向检测方法专利的具体信息内容。

1.一种基于重构模型的人体运动意向检测方法,其特征在于:
步骤1、训练阶段,利用执行特定的人工处理意图任务的脑电信号训练重构模型,包括特征提取步骤和分类步骤;特征提取步骤采用组合算法波器组FBCSP进行特征提取;分类步骤通过分类器,分类识别用户是否正在执行某个运动意图任务;
步骤2、检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差;重构误差越小,在检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差,重构误差越小,该观察周期存在某个运动意图任务的可能性越大;
步骤2.1、采用子空间投影,对重构模型进行训练,将重构误差较大的样本视为异常值,重构模型也可用作分类器,对重构模型进行分类训练,并将每个样本分类到最适合重构模型的类别;
步骤2.2、自动编码器,对重构模型进行训练,根据三种用于运动意图检测的查询策略,即尝试式、记录式和分段式应用了两种类型的自动编码器:全连接自动编码器和CNN自动编码器;
步骤2.3稀疏字典学习作为实现RID方案的重构模型,通过字典学习输入数据的稀疏表示,导致了冗余原子,允许单个样本有多个表示,特别是包括在内的研究稀疏字典学习以提高表示的稀疏性和灵活性的著作;普通片段数据的数量大于执行意图的片段数据的数量、多种多样的,并且可能与执行意图的片段数据有一些关联;潜在表示是由几个原子和一个稀疏代码组成的字典组成的,在重构过程中,利用所述的稀疏编码,以及原子本身和原子的线性组合,逼近原始输入。
2.根据权利要求1所述的基于重构模型的人体运动意向检测方法,其特征在于步骤2.1采用子空间投影,定义一组m维向量,这些向量映射属于Rd的样本x到属于Rm(m≤d)的样本并且主成分是通过具有三个性质的m变量得到的,性质如下:
1)主要成分是正交的;
2)第一个主成分的方差最大,每个后续成分的方差逐渐减小;
3)所有主要成分的变化之和等于原始变量的变化之和;
假设 是由d变量v1,v2...vd的目标重构训练集计算出的相关矩阵,从R中计算d个特征值特征向量对,并按特征值排序,得到(λ1,e1),(λ2,e2),...,(λd,ed),其中λ1≥λ2≥...λd;且 样本第i次的主成分x=(x1,x2,...xd)T可计算为:
选择第一个m特征值特征向量对(λ1,e1),(λ2,e2),...,(λm,em),得到投影矩阵P为:
P=(e1,e2...em)T        (3)
其中 所以任何观测值x都可以转换为:
y=Px           (4)
其中 由于特征向量的特性,重构过程很简单:
应该注意的是,只有当m=d,P-1=PT时,重构才是完美的;否则,由于压缩,和x是不相同的,设置m<d,
考虑到过于完美的重构可能会限制从重构损失中识别数据模式的有效性;
因此,基于子空间投影的重构模型可以定义为:
其中 可以通过获取PCA的投影矩阵来计算;训练后,脑电图查询片段q的重构误差可计算为:
3.根据权利要求1所述的基于重构模型的人体运动意向检测方法,其特征在于步骤
2.2、将自动编码器作为重构模型,根据三种用于运动意图检测的查询策略,即尝试式、记录式和分段式应用了两种类型的自动编码器:全连接自动编码器和CNN自动编码器,具体如下:
步骤2.2.1、完全连接自动编码器
全连接自编码器由一个编码器Φ: m是隐层的维数和一个解码器Ψ:
每一层都由相应的权重W,偏见b和激活功能:
Φ=fΦ(WΦx+bΦ)        (7)
Ψ=fΨ(WΨx+bΨ)        (8)
其中 和 fΦ和fΨ分别表示编码激活函数和解码
激活函数,重构模型定义为:
参数θ可以通过最小化得到:
训练后,脑电图查询片段q的重构误差可计算为:
应该注意的是,使用线性激活函数,自动编码器可以生成与PCA相同的子空间;因此,将非线性校正线性单元作为激活函数;
步骤2.2.2、CNN自动编码器
由于脑电图信号是在每个时间点具有多个通道读数的时间序列数据,因此自动编码器的输入数据可以是二维(2D)格式;所以,我们应用CNN自动编码器作为重构模型来处理二维脑电图数据;与完全连接的自动编码器类似,CNN自动编码器也有一个编码器部分和一个解码器部分;主要区别在于编码器和解码器部分主要是用卷积神经网络构建的;
具体地说,在编码器阶段有三个2D-CNN层,每个层后接一个最大池化层,在解码器层有三个向上采样层和卷积层对;为了使二维卷积运算形式化,L层的第k层特征图中位置(x,y)处神经元的值由下式给出:
其中relu(x)=max(0,x)是激活函数;在这个方程中,bkl是lth层中kth特征映射的偏差,是连接到这个特征映射的内核的(p,q)处的权重,覆盖上一层中的特征映射,Pk和Ql表示内核的大小;
在每个卷积层之后,应用了一个步幅为[2×2]的最大池化操作,使数据维度减少一半,因此,在译码器阶段,需要在每个译码器层中扩展两次数据维度;扩展译码器相位数据维数的方法有两种:转置卷积运算和上采样插值,将最近邻上采样内插法与卷积层作为译码器相位的基本组成部分;在CNN解码器之后,用一个最终的输出层来重构输入数据;最终输出层是一个卷积层,输出数据大小与输入数据大小相同;
使用Adam更新规则的随机梯度下降来最小化损失函数:
其中ζj是神经网络的参数集,网络参数以10-4的学习率进行优化;
步骤2.3、通过字典学习输入数据的稀疏表示,导致了冗余原子,允许单个样本有多个表示,特别是包括在内的研究稀疏字典学习以提高表示的稀疏性和灵活性的著作;普通片段数据的数量大于执行意图的片段数据的数量、多种多样的,并且可能与执行意图的片段数据有一些关联。
4.根据权利要求3所述的基于重构模型的人体运动意向检测方法,其特征在于步骤3、稀疏字典学习作为实现RID方案的重构模型
潜在表示是由几个原子和一个稀疏代码组成的字典组成的,在重构过程中,利用所述的稀疏编码,以及原子本身和原子的线性组合,逼近原始输入;形式上,重构模型定义为:
其中θi=[d1,d2,...,dm]是包含m个原子的字典, 是输入向量 的稀疏代码,大部分的系数为零或接近零,以构造一个过度完成的字典,字典维数m被设置为大于输入维数d;
超复杂字典不要求原子是正交的,因此允许用更灵活的字典和更丰富的数据表示;字典θi和稀疏代码ci可以在训练阶段通过解决以下优化问题来学习:
服从||dk||2=1代表所有1≤k≤m;第一个项是数据拟合项,第二个项是稀疏诱导正则化;这个极小化问题是一个NP-hard的问题,因为有 并且可以通过将 替
换为它的凸松弛,即用 来近似求解;对于θi和ci来说,一个是固定的,那么这个问题就变成了一个凸问题;我们得到一个近似的结果,因为它不是共同凸(θi,ci);可通过交替更新方案,得到最优稀疏码和字典:
1)稀疏码近似:通过求解方程(15)更新稀疏码ci,并使用上一次迭代修正的字典;
2)字典精化:通过求解方程(15)更新字典θi,并使用上一次迭代中固定的稀疏代码;
在检测阶段,给定一个查询片段q,其稀疏代码可以计算为ci(q),重构表示为θici(q);
因此重构误差为
在获得重构错误之后,需要应用一个特定于意图的阈值来确定查询片段是意图执行片段还是普通片段。
5.根据权利要求1所述的基于重构模型的人体运动意向检测方法,其特征在于给定的观测周期可分为一系列短片段,意图检测任务可以看作是确定一个主体在一个短片段中是否正在执行某一特定的意图,并且研究目标从可能同时具有意图执行部分和非意图执行部分的长时期转变为具有或不具有特定意图的短片段意图-演示片段为一个主体在演示一个特定意图任务期间的时间片段;普通片段为一个主体没有执行某个意图任务的时间片段;
查询片段为确定主题是否执行某项任务的时间片段;训练片段为用来训练重构模型的时间片段,它必须是一个执行意图的片段;
给定一个脑电图记录q的查询片段,确定受试者在该片段中是否在执行某种意图任务Ti;形式上,给定一组N脑电图碎片 在每段时期对应于相同的目的任务Ti,重构模型表示为 d在哪里输入重构模型的维度和θi是重构模型的参数,可以通过训练阶段通过最小化损失函数:
在建立重构模型后,对每个脑电图查询片段q,计算重构误差 作为相似度度量,确定脑电图查询片段与心理意图的相关性;重构误差 越小,脑电图查询片段q与心理意图Ti的相关性越大。
6.根据权利要求1所述的基于重构模型的人体运动意向检测方法,其特征在于:在执行是或否的运动意向检测中,子空间投影、自动编码器和稀疏字典学习实现的RID方案的性能,通过划分执行查询的意图片段的平均重构错误来标准化相对平均错误;
标准化相对平均误差(NRME)φrelative定义为:
φo和φi分别是执行查询片段的普通和意向的平均重构误差。
7.根据权利要求1所述的基于重构模型的人体运动意向检测方法,其特征在于:归一化相对重构误差的计算方法如下:
其中ek是第k次实例的重构误差, 是执行查询片段的意图的平均重构误差。

说明书全文

基于重构模型的人体运动意向检测方法

技术领域

[0001] 本发明涉及一种人体运动意向检测,特别是涉及一种基于重构的人的意图检测(RID)方法及其应用。

背景技术

[0002] 脑电图(EEG)信号是从用户头皮不同部位采集的电压,用来测量大脑活动。脑电图由于其零临床险,并拥有便携式采集设备,已广泛应用于脑-机接口(BCI) 系统。BCI系统为正常以及残疾用户提供了一个从大脑到外围设备的潜在桥梁。通过这种BCI技术,大脑活动的信号(如运动意图)可以用作控制命令。这种系统的一个经典应用是BCI辅助性卒中康复。由于其潜在的医学和工业应用前景,对于脑电图信号的研究越来越受到研究者的关注。
[0003] 自BCI系统实现范式转变以来,机器学习已被公认为脑电图分析的关键工具。尽管先前的研究已经证明了DE15编码脑信号的有效性,但仍然存在着一些众所周知的挑战,阻止了基于脑电图的BCI系统的广泛应用。其中一个关键的障碍是,大多数的脑电图解码研究都集中在回答诸如“哪只手是一个受试者想象的运动,左还是右?”这类问题可以建模为一个分类问题,并通过有监督的学习方法来解决。然而,这样一个问题必然会出现在上述问题之前:“一个主体是否在想象移动一只手?”在回答“哪个”问题之前,如果不回答“是否”问题, BCI系统可能会进行一些不确定的操作。例如,基于BCI技术的轮椅,通过几个由运动意图控制的雏形,它已经被证明是有前途的了。假设系统的核心算法是一个四级分类模型,控制轮椅向四个方向运动,受试者应保持的固定且准确的运动意图以准确地控制轮椅运动的方向。然而,现实世界中的情况更为复杂和出人意料,因为用户的真实意图通常是30个发生在不同和不经常发生的地方。例如,如果用户被一个事件(如电话呼叫)打断,或者用户的思想刚刚离开,那么当前的解决方案无法处理这种情况,但此时它仍要判断将大脑信号分类到四个类中的哪个类中,然后将轮椅控制到相应的方向。因而,其实这种系统既不可靠也不实用,还可能会导致严重的事故。除了不确定性,收集意图数据可能会很麻烦,因为它要求受试者集中注意,这对于儿童等有特殊需要的人(例如,BCI帮助自闭症治疗),老年人或残疾人来说是特别不现实的。意图发生的稀缺性和获得准确的运动意图的困难性导致了通过训练所获得数据的不足。
[0004] 如果意向检测方法能够首先确定用户是否在执行运动意图,然后确定用户希望移动的方向,就更为理想了。因此,整个系统将更加强大,便可以更好地应对复杂的情况。因此,在本研究中,本发明旨在回答这样一个“是否”的问题,这个问题可以通过脑电图信号抽象为一个意图检测问题。其目的是准确地确定在观察期内受试者是否存在某种运动意图。
[0005] 然而,由于以下原因,挑战仍然存在。一个原因在于脑电图信号本身,它在不同的受试者之间表现出很强的可变性,即使在同一实验中记录中,同一用户的脑电图信号不同片段之间也有很大的差异。另一个关键的挑战是,尽管这个问题似乎是一个二进制分类问题,但本发明不知道“否”类。与以前的脑电图分析研究不同,在脑电图分析研究中,受试者被引导执行某些精神任务,如想象左手或右手的移动,本发明不能通过排除他没有执行某个精神任务来定义一个用户的心理状态。用户心理状态的可能性是无限的,除了某些意图,比如想象一部电影、一种食物,甚至是一些他自己不认识的东西。因此,在机器学习领域传统的监督分类方法不能解决这一问题。

发明内容

[0006] 1、本发明的目的
[0007] 脑-机接口(BCI)使人类能够通过脑信号与外部设备进行通信并直观地控制外部设备。运动意图的成功检测为开发BCI应用程序铺平了道路。目前的研究主要集中在回答诸如“一个受试者的哪只手在想象中移动,是右手还是左手?”。在回答“一个受试者是否在想象移动一只手”这样的问题时,因为本发明不能在使用脑电波检测设备期间持续地执行意图检测任务,而间隔期间(不执行某个运动意图检测)可能会导致意外操作,导致BCI系统故障。然而,这种意图检测任务更加困难,因为对于一个“是否”问题,很难知道“否”的情况是什么样的,从而获取“否”情况的训练样本。此外,实际上某些很少发生的运动意图或者意外情况,使得意图检测任务更加困难。为了解决这个问题,提出了一个基于重构模型的人体运动意向检测方法。
[0008] 2、本发明所采用的技术方案
[0009] 本发明公开了一种基于重构模型的人体运动意向检测方法,按照如下步骤进行:
[0010] 步骤1、训练阶段,利用执行特定的人工处理意图任务的脑电信号训练重构模型,包括特征提取步骤和分类步骤;特征提取步骤采用组合算法波器组 FBCSP进行特征提取;分类步骤通过分类器,分类识别用户是否正在执行某个运动意图任务;
[0011] 步骤2、检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差;重构误差越小,在检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差,重构误差越小,该观察周期存在某个运动意图任务的可能性越大;
[0012] 步骤2.1、采用子空间投影,对重构模型进行训练,将重构误差较大的样本视为异常值,重构模型也可用作分类器,对重构模型进行分类训练,并将每个样本分类到最适合重构模型的类别;
[0013] 步骤2.2、自动编码器,对重构模型进行训练,根据三种用于运动意图检测的查询策略,即尝试式、记录式和分段式应用了两种类型的自动编码器:全连接自动编码器和CNN自动编码器;
[0014] 步骤2.3稀疏字典学习作为实现RID方案的重构模型,通过字典学习输入数据的稀疏表示,导致了冗余原子,允许单个样本有多个表示,特别是包括在内的研究稀疏字典学习以提高表示的稀疏性和灵活性的著作;普通片段数据的数量大于执行意图的片段数据的数量、多种多样的,并且可能与执行意图的片段数据有一些关联;潜在表示是由几个原子和一个稀疏代码组成的字典组成的,在重构过程中,利用所述的稀疏编码,以及原子本身和原子的线性组合,逼近原始输入。
[0015] 更进一步,步骤2.1采用子空间投影,定义一组m维向量,这些向量映射属于Rd的样本x到属于Rm(m≤d)的样本 并且主成分是通过具有三个性质的 m变量得到的,性质如下:
[0016] 1)主要成分是正交的;
[0017] 2)第一个主成分的方差最大,每个后续成分的方差逐渐减小;
[0018] 3)所有主要成分的变化之和等于原始变量的变化之和;
[0019] 假设 是由d变量v1,v2...vd的目标重构训练集计算出的相关矩阵,从R 中计算d个特征值特征向量对,并按特征值排序,得到(λ1,e1),(λ2,e2),...,(λd,ed),其中λ1≥λ2≥...λd;且 样本第i次的主成分x=(x1,x2,...xd)T可计算为:
[0020]
[0021] 选择第一个m特征值特征向量对(λ1,e1),(λ2,e2),...,(λm,em),得到投影矩阵P 为:
[0022] P=(e1,e2...em)T   (3)
[0023] 其中 所以任何观测值x都可以转换为:
[0024] y=Px   (4)
[0025] 其中 由于特征向量的特性,重构过程很简单:
[0026]
[0027] 应该注意的是,只有当m=d,P-1=PT时,重构才是完美的;否则,由于压缩,和x是不相同的,设置m<d,
[0028] 考虑到过于完美的重构可能会限制从重构损失中识别数据模式的有效性;
[0029] 因此,基于子空间投影的重构模型可以定义为:
[0030]
[0031] 其中 可以通过获取PCA的投影矩阵来计算;训练后,脑电图查询片段q的重构误差可计算为:
[0032] 更进一步,步骤2.2、将自动编码器作为重构模型,根据三种用于运动意图检测的查询策略,即尝试式、记录式和分段式应用了两种类型的自动编码器:全连接自动编码器和CNN自动编码器,具体如下:
[0033] 步骤2.2.1、完全连接自动编码器
[0034] 全连接自编码器由一个编码器 m是隐层的维数和一个解码器每一层都由相应的权重W,偏见b和激活功能:
[0035] Φ=fΦ(WΦx+bΦ)   (7)
[0036] Ψ=fΨ(WΨx+bΨ)   (8)
[0037] 其中 和 fΦ和fΨ分别表示编码激活函数和解码激活函数,重构模型定义为:
[0038]
[0039] 参数θ可以通过最小化得到:
[0040]
[0041] 训练后,脑电图查询片段q的重构误差可计算为:
[0042]
[0043] 应该注意的是,使用线性激活函数,自动编码器可以生成与PCA相同的子空间;因此,将非线性校正线性单元作为激活函数;
[0044] 步骤2.2.2、CNN自动编码器
[0045] 由于脑电图信号是在每个时间点具有多个通道读数的时间序列数据,因此自动编码器的输入数据可以是二维(2D)格式;所以,我们应用CNN自动编码器作为重构模型来处理二维脑电图数据;与完全连接的自动编码器类似,CNN 自动编码器也有一个编码器部分和一个解码器部分;主要区别在于编码器和解码器部分主要是用卷积神经网络构建的;
[0046] 具体地说,在编码器阶段有三个2D-CNN层,每个层后接一个最大池化层,在解码器层有三个向上采样层和卷积层对;为了使二维卷积运算形式化,L层的第k层特征图中位置(x,y)处神经元的值由下式给出:
[0047]
[0048] 其中relu(x)=max(0,x)是激活函数;在这个方程中,bkl是lth层中kth特征映射的偏差, 是连接到这个特征映射的内核的(p,q)处的权重,覆盖上一层中的特征映射,Pk和Ql表示内核的大小;
[0049] 在每个卷积层之后,应用了一个步幅为[2×2]的最大池化操作,使数据维度减少一半,因此,在译码器阶段,需要在每个译码器层中扩展两次数据维度;扩展译码器相位数据维数的方法有两种:转置卷积运算和上采样插值,将最近邻上采样内插法与卷积层作为译码器相位的基本组成部分;在CNN解码器之后,用一个最终的输出层来重构输入数据;最终输出层是一个卷积层,输出数据大小与输入数据大小相同;
[0050] 使用Adam更新规则的随机梯度下降来最小化损失函数:
[0051]
[0052] 其中ζj是神经网络的参数集,网络参数以10-4的学习率进行优化;
[0053] 步骤2.3、通过字典学习输入数据的稀疏表示,导致了冗余原子,允许单个样本有多个表示,特别是包括在内的研究稀疏字典学习以提高表示的稀疏性和灵活性的著作;普通片段数据的数量大于执行意图的片段数据的数量、多种多样的,并且可能与执行意图的片段数据有一些关联。
[0054] 更进一步,步骤3、稀疏字典学习作为实现RID方案的重构模型
[0055] 潜在表示是由几个原子和一个稀疏代码组成的字典组成的,在重构过程中,利用所述的稀疏编码,以及原子本身和原子的线性组合,逼近原始输入;形式上,重构模型定义为:
[0056]
[0057] 其中θi=[d1,d2,...,dm]是包含m个原子的字典, 是输入向量 的稀疏代码,大部分的系数为零或接近零,以构造一个过度完成的字典,字典维数 m被设置为大于输入维数d;超复杂字典不要求原子是正交的,因此允许用更灵活的字典和更丰富的数据表示;字典θi和稀疏代码ci可以在训练阶段通过解决以下优化问题来学习:
[0058]
[0059] 服从||dk||2=1代表所有1≤k≤m;第一个项是数据拟合项,第二个项是稀疏诱导正则化;这个极小化问题是一个NP-hard的问题,因为有 并且可以通过将替换为它的凸松弛,即用 来近似求解;对于θi和ci来说,一个是固定的,
那么这个问题就变成了一个凸问题;我们得到一个近似的结果,因为它不是共同凸(θi,ci);
可通过交替更新方案,得到最优稀疏码和字典:
[0060] 1)稀疏码近似:通过求解方程(15)更新稀疏码ci,并使用上一次迭代修正的字典;
[0061] 2)字典精化:通过求解方程(15)更新字典θi,并使用上一次迭代中固定的稀疏代码;
[0062] 在检测阶段,给定一个查询片段q,其稀疏代码可以计算为ci(q),重构表示为θici(q);因此重构误差为
[0063] 在获得重构错误之后,需要应用一个特定于意图的阈值来确定查询片段是意图执行片段还是普通片段。
[0064] 更进一步,给定的观测周期可分为一系列短片段,意图检测任务可以看作是确定一个主体在一个短片段中是否正在执行某一特定的意图,并且研究目标从可能同时具有意图执行部分和非意图执行部分的长时期转变为具有或不具有特定意图的短片段意图-演示片段为一个主体在演示一个特定意图任务期间的时间片段;普通片段为一个主体没有执行某个意图任务的时间片段;查询片段为确定主题是否执行某项任务的时间片段;训练片段为用来训练重构模型的时间片段,它必须是一个执行意图的片段;
[0065] 给定一个脑电图记录q的查询片段,确定受试者在该片段中是否在执行某种意图任务Ti;形式上,给定一组N脑电图碎片 在每段时期对应于相同的目的任务Ti,重构模型表示为 d在哪里输入重构模型的维度和θi是重构模型的参
数,可以通过训练阶段通过最小化损失函数:
[0066]
[0067] 在建立重构模型后,对每个脑电图查询片段q,计算重构误差 作为相似度度量,确定脑电图查询片段与心理意图的相关性;重构误差 越小,脑电图查询片段q与心理意图Ti的相关性越大。
[0068] 更进一步,在执行是或否的运动意向检测中,子空间投影、自动编码器和稀疏字典学习实现的RID方案的性能,通过划分执行查询的意图片段的平均重构错误来标准化相对平均错误;
[0069] 标准化相对平均误差(NRME)φrelative定义为:
[0070]
[0071]
[0072] φo和φi分别是执行查询片段的普通和意向的平均重构误差。
[0073] 更进一步,归一化相对重构误差的计算方法如下:
[0074]
[0075] 其中ek是第k次实例的重构误差, 是执行查询片段的意图的平均重构误差。
[0076] 3、本发明所采用的有益效果
[0077] (1)本发明利用重构模型来表示运动意图的高层次抽象,并利用重构误差来确定是否存在运动意图。
[0078] (2)本发明利用了不同的重构模型对两个运动意图任务进行了综合检测实验,证明了所提出的RID方案性能良好。不仅对任何复杂的现实情况具有理论上的灵活性和可靠性,而且不需要人工处理和过深的专业知识。
[0079] (3)本发明在综合查询片段上表现出了良好的性能,在获取意图执行任务数据时,甚至在获取基线数据的环境中也能获得“基线”查询片段,从而获得具有竞争力的结果。
[0080] (4)本发明探讨了三种用于运动意图检测的查询策略,即尝试式、记录式和分段式,并且构建了三种不同的重构模型来实现该方案,以显示其对各种重构模型的灵活性。此外,本发明的方案不需要任何人工处理和过深的专业知识。附图说明
[0081] 图1是基于重构的意向检测方案。
[0082] 图2是基于重构的意向检测的流程图
[0083] 图3是左拳:不同查询策略和不同重构模型的归一化相对重构误差分布。(查询相关是指执行意图的查询片段)。
[0084] 图4是左拳:不同查询策略和不同重构模型在不同阈值上的平均精度和召回率。(查询相关是指执行意图的查询片段)。
[0085] 图5是右拳:不同查询策略和不同重构模型的归一化相对重构误差分布。(查询相关是指执行意图的查询片段)。
[0086] 图6是右拳:不同查询策略和不同重构模型下不同阈值的平均精度和召回率。 (相关查询是指执行查询片段的意图)。
[0087] 图7是具有不同查询策略和重构模型的最优确定阈值的运动意图检测F1分数。
[0088] 图8是综合查询片段的意图检测和左拳运动意图片段:F1得分基于阈值。图9是综合查询片段的意图检测和右拳运动意图片段:F1得分基于阈值。

具体实施方式

[0089] 下面结合本发明实例中的附图,对本发明实例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域技术人员在没有做创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
[0090] 下面将结合附图对本发明实例作进一步地详细描述。
[0091] 本发明公开了一个基于重构的人的意图检测(RID)方法,该方法能够识别一个受试者在给定的观察期内是否确定执行某个运动意图。我们利用重构误差作为识别意图执行的标准。在训练阶段,利用执行特定的人工处理意图任务的脑电信号训练重构模型,在检测阶段,将待确定的脑电周期输入重构模型,计算其重构误差。重构误差越小,该观察周期存在某个运动意图任务的可能性越大。所提出的方案在任何现实场景中都具有可扩展性,而不需要预先了解不打算执行的场景是什么样的。此外,该方案不需要人工处理和过深的专业知识,而人工处理在传统的脑电图分析社区中通常是很重要的。而对具有两个运动意图任务的大型脑电图的数据集进行系统的实验旨在研究RID方案的有效性。研究中所建立的三种不同的重构模型,即自动编码器、子空间投影和稀疏字典学习,实现了RID 方案。此外,还研究了三种利用脑电信号进行意向检测的策略。实验结果表明,本文提出的RID方案在检测左、右拳运动意图方面具有良好的效果。本方案为开发更可靠、更实用的BCI系统奠定了基础
[0092] 基于重构的人的意图检测(RID)方法,按照如下步骤进行:
[0093] 步骤1、在脑电分析领域,本发明提出了一个人的意图检测方案。与传统的意图识别方案相比,我们的目标是确定用户是否在执行意图,这对于构建一个可靠、灵活的BCI系统更为关键。脑电信号作为记录人脑电活动最常用的监测方法之一,在精神控制轮椅和疾病诊断等领域有着潜在的应用前景。
[0094] 大多数现有的脑电图分析工作都集中在通过识别任务将一个实例归类到预定义类。常用的方法包括两个部分:特征提取和分类。
[0095] 步骤1.1、传统的脑电特征提取包括频率带通滤波和空间滤波,频率带通滤波保留了有源频带中的显著信息,并对可能存在噪声的非有源频带进行滤波。空间滤波通常采用公共空间模式及其变化,此外,该方案还开发了组合算法,即滤波器组CSP(FBCSP),展示了其竞争性。
[0096] 步骤1.2、在分类器的组成部分方面,许多机器学习方法,如线性判别分析 (lda),支持向量机(svm)和随机森林(rf),已经在基于脑电的运动图像分类中得到应用。最近,一些研究调查了脑电图分析的深度学习方法。最常用的深层模型是卷积神经网络(CNN)和循环神经网络(RNN)。然而,这些深层模型只考虑了在目标意图任务中收集的数据,忽略了用户不执行特定意图时产生的脑电图信号的影响和基于脑电图的BCI系统的实际应用。因此,在本方案中,我们的目标是识别用户是否正在执行某个运动意图任务,而不是对用户正在执行哪个运动意图任务进行分类。
[0097] 步骤2、提出了一种基于重构的脑电信号意图检测方案。该方案与分类机器学习方法完全不同,它针对的是检测任务,而不是传统的识别任务。我们的方案理论上能够处理任何真实的场景,并且不需要领域知识和作为常用于脑电图分析领域中常用方法的需要人工处理这一特性。重构模型已广泛应用于数据挖掘的各个领域,尤其是计算机视觉中的异常值的检测或去除。对重构模型进行训练,将重构误差较大的样本视为异常值。此外,重构模型也可用作分类器。作者对重构模型进行分类训练,并将每个样本分类到最适合重构模型的类别。这些方法可以概括为三大类。
[0098] 步骤2.1、第一类是子空间投影。一组可能相关变量的观测值被转换成一组线性不相关变量的值时,其中最具代表性的方法之一是主成分分析(PCA),通过正交变换得到主子空间。采用PCA、核PCA、鲁棒PCA和鲁棒核PCA对训练集进行重构,它们选择或删除产生高重构损失的异常值。
[0099] 我们采用了子空间投影作为本方案的重构方法。我们的目标是定义一组m 维向量,这些向量映射属于Rd的样本x到属于Rm(m≤d)的样本 并且主成分是通过具有三个性质的m变量得到的,性质如下:
[0100] 1)主要成分是正交的。
[0101] 2)第一个主成分的方差最大,每个后续成分的方差逐渐减小。
[0102] 3)所有主要成分的变化之和等于原始变量的变化之和。
[0103] 假设 是由d变量v1,v2...vd的目标重构训练集计算出的相关矩阵。从R 中计算d个特征值特征向量对,并按特征值排序,得到(λ1,e1),(λ2,e2),...,(λd,ed),其中λ1≥λ2≥...λd。且 样本第i次的主成分x=(x1,x2,...xd)T可计算为:
[0104]
[0105] 一般来说,选择第一个m特征值特征向量对(λ1,e1),(λ2,e2),...,(λm,em),得到投影矩阵P为:
[0106] P=(e1,e2...em)T   (3)
[0107] 其中 所以任何观测值x都可以转换为:
[0108] y=Px   (4)
[0109] 其中 由于特征向量的特性,重构过程很简单:
[0110]
[0111] 应该注意的是,只有当m=d,P-1=PT时,重构才是完美的;否则,由于压缩,和x是不相同的。因此,我们设置m<d,考虑到过于完美的重构可能会限制从重构损失中识别数据模式的有效性。
[0112] 因此,基于子空间投影的重构模型可以定义为:
[0113]
[0114] 其中 可以通过获取PCA的投影矩阵来计算。训练后,脑电图查询片段q的重构误差可计算为:
[0115] 步骤2.2、第二类是学习一种紧凑的编码来表示总结训练样本。例如,现有的工作利用自动编码器,将观测结果从一个特征空间转换为一个新的特征空间,其中数据分离了变化因素。我们将自动编码器部署为方案中的另一个重构模型。自动编码器是一种基于神经网络的重构模型,在去噪和降维问题上具有良好的性能。根据三种用于运动意图检测的查询策略,即尝试式、记录式和分段式(不同的EEG数据组织策略,用于输入不同的重构模型),我们应用了两种类型的自动编码器:全连接自动编码器和CNN自动编码器。具体如下:
[0116] 步骤2.2.1、完全连接自动编码器
[0117] 与多层感知器(MLP)类似,全连接自编码器是一种前馈人工神经网络。自动编码器由一个编码器 m是隐层的维数和一个解码器 每一层都由相应的权重W,偏见b和激活功能:
[0118] Φ=fΦ(WΦx+bΦ)   (7)
[0119] Ψ=fΨ(WΨx+bΨ)   (8)
[0120] 其中 和 fΦ和fΨ分别表示编码激活函数和解码激活函数。因此,在我们的案例中,重构模型定义为:
[0121]
[0122] 参数θ可以通过最小化得到:
[0123]
[0124] 训练后,脑电图查询片段q的重构误差可计算为:
[0125]
[0126] 应该注意的是,使用线性激活函数,自动编码器可以生成与PCA相同的子空间。因此,我们将非线性校正线性单元(relu)作为激活函数。
[0127] 步骤2.2.2、CNN自动编码器
[0128] 由于脑电图信号是在每个时间点具有多个通道读数的时间序列数据,因此自动编码器的输入数据可以是二维(2D)格式。所以,我们应用CNN自动编码器作为重构模型来处理二维脑电图数据。与完全连接的自动编码器类似,CNN 自动编码器也有一个编码器部分和一个解码器部分。主要区别在于编码器和解码器部分主要是用卷积神经网络构建的。
[0129] 具体地说,在编码器阶段有三个2D-CNN层,每个层后接一个最大池化层,在解码器层有三个向上采样层和卷积层对。为了使二维卷积运算形式化,L层的第k层特征图中位置(x,y)处神经元的值由下式给出:
[0130]
[0131] 其中relu(x)=max(0,x)是激活函数。在这个方程中,bkl是lth层中kth特征映射的偏差, 是连接到这个特征映射的内核的(p,q)处的权重,覆盖上一层中的特征映射,Pk和Ql表示内核的大小。
[0132] 在每个卷积层之后,应用了一个步幅为[2×2]的最大池化操作,使数据维度减少一半。因此,在译码器阶段,我们需要在每个译码器层中扩展两次数据维度。扩展译码器相位数据维数的方法有两种:转置卷积运算和上采样插值。转置卷积运算的工作原理与卷积运算几乎完全相同,但反过来:输入层中的一个单元在转置卷积层中的数据维度将被扩展得更大。然而,一些研究人员声称,后接卷积层的插值层比转置卷积层性能更好,最近邻的上采样插值对上采样效果最好。因此,在本研究中,我们将最近邻上采样内插法与卷积层作为译码器相位的基本组成部分。在CNN解码器之后,用一个最终的输出层来重构输入数据。最终输出层是一个卷积层,输出数据大小与输入数据大小相同。
[0133] 三个卷积编码层在器相位的特征映射数分别为16、8和8,相反,在解码器相位最终输出卷积为1。编码器和解码器阶段的每个卷积操作的内核大小都保持为 [3×3],步幅保持为[1×1]。最大池化内核大小设置为[2×2]。应用批处理规范化以获得更好的性能。
[0134] 使用Adam更新规则的随机梯度下降来最小化损失函数:
[0135]
[0136] 其中ζj是神经网络的参数集。网络参数以10-4的学习率进行优化。
[0137] 步骤2.3、第三类通过字典学习输入数据的稀疏表示。它导致了冗余原子,允许单个样本有多个表示。特别是包括在内的研究稀疏字典学习以提高表示的稀疏性和灵活性的著作。然而,现有的研究大多仍遵循着“少数且不同”的离群值基本假设。由于人类意图的复杂性,相比之下,我们面临的问题比异常值检测更为复杂。第一个困难是“普通片段”数据的数量大于执行意图的片段数据的数量。此外,与异常值不同的是,“普通片段”数据通常是多种多样的,并且可能与执行意图的片段数据有一些关联。
[0138] 步骤3、对是和否两个基于脑电图的运动意向检测任务进行评价,并对不同类型的脑电重构模型和各种脑电数据组织策略进行了系统的研究和分析。
[0139] 根据步骤2.3通过字典学习输入数据的稀疏表示,我们还研究了稀疏字典学习作为实现RID方案的重构模型。稀疏字典学习是一种针对输入数据构造紧凑表示的学习方法。潜在表示是由几个原子和一个稀疏代码组成的字典组成的。在重构过程中,利用稀疏编码,以及原子本身和原子的线性组合,可以很好地逼近原始输入。形式上,重构模型定义为:
[0140]
[0141] 其中θi=[d1,d2,...,dm]是包含m个原子的字典, 是输入向量 的稀疏代码,大部分的系数为零或接近零。以构造一个过度完成的字典,字典维数m被设置为大于输入维数d。超复杂字典不要求原子是正交的,因此允许用更灵活的字典和更丰富的数据表示。字典θi和稀疏代码ci可以在训练阶段通过解决以下优化问题来学习:
[0142]
[0143] 服从||dk||2=1代表所有1≤k≤m。第一个项是数据拟合项,第二个项是稀疏诱导正则化。这个极小化问题是一个NP-hard的问题,因为有 并且可以通过将替换为它的凸松弛,即用 来近似求解。对于θi和ci来说,一个是固定的,那么这个问题就变成了一个凸问题。我们得到一个近似的结果,因为它不是共同凸(θi,ci)。可通过交替更新方案,得到最优稀疏码和字典:
[0144] 1)稀疏码近似:通过求解方程(15)更新稀疏码ci,并使用上一次迭代修正的字典;
[0145] 2)字典精化:通过求解方程(15)更新字典θi,并使用上一次迭代中固定的稀疏代码。
[0146] 在检测阶段,给定一个查询片段q,其稀疏代码可以计算为ci(q),重构表示为θici(q)。因此重构误差为
[0147] 在获得重构错误之后,需要应用一个特定于意图的阈值来确定查询片段是意图执行片段还是普通片段,如图1的最后阶段所示。
[0148] 3.根据步骤1所述的一种基于重构的意图检测(RID)方案,其中,基于脑电图的意图检测的目的是通过分析相应时间段的脑电图记录来确定受试者在给定观察期内是否有过某种意图。在不丧失一般性和实用性的情况下,我们假定意图的执行(如果有的话)可以持续几秒钟。因此,给定的观测周期可分为一系列短片段。意图检测任务可以看作是确定一个主体在一个短片段中是否正在执行某一特定的意图,并且研究目标从可能同时具有意图执行部分和非意图执行部分的长时期转变为具有或不具有特定意图的短片段。
[0149] 为了清楚地描述,我们解释了本文其余部分使用的几个术语:
[0150] 1)意图-演示片段:一个主体在演示一个特定意图任务期间的时间片段;
[0151] 2)普通片段:一个主体没有执行某个意图任务的时间片段;
[0152] 3)查询片段:确定主题是否执行某项任务的时间片段;
[0153] 4)训练片段:用来训练重构模型的时间片段,它必须是一个执行意图的片段。给定一个脑电图记录q的查询片段,我们的目标是确定受试者在该片段中是否在执行某种意图任务Ti。为了实现这个目标,如图1所示,我们的基于重构的意图检测(RID)方案由两个阶段组成:训练阶段和检测阶段。在训练阶段,在执行一定意图任务时所获得的几组脑电图记录被用来训练类特定的重构模型;在检测阶段,将查询到的脑电图片段输入重构模型,并根据其重构误差确定是否执行了某个运动意图。如图1的训练阶段所示,每个候选意向在训练阶段都需要自己的重构模型。重构模型是从候选意向活动的脑电图记录中提取的高层次表示。它是紧凑的,不需要人工处理和过深的专业知识。
[0154] 形式上,给定一组N脑电图碎片 在每段时期对应于相同的目的任务T,重构模型表示为 d在哪里输入重构模型的维度和θi是重构模型的参数,可以通过训练阶段通过最小化损失函数:
[0155]
[0156] 在建立重构模型后,对每个脑电图查询片段q,计算重构误差 作为相似度度量,确定脑电图查询片段与心理意图的相关性。重构误差 越小,脑电图查询片段q与心理意图Ti的相关性越大。
[0157] 实施例
[0158] 本发明描述了一个新的研究问题,“是否”执行运动意图任务,并提出了一个基于重构的意图检测(RID)方案,该方案展示了解决这类问题的潜在能力。在传统的人类意向分析领域,大多数作品都是试图在回答“哪个是主体想要动的”这样的问题。然而,在实际应用程序中,这可能会导致错误的操作。例如,BCI 系统控制用大脑意图打开或关闭一扇。如果一个算法只时针对识别一个人想打开或关闭一扇门,当一个用户想打开或关闭门时,他必须佩戴一个脑电图机,门打开或关闭后将耳机取下,如果他一直佩戴着耳机,那么之后门的打开或关闭是不确定的。为了解决这样一个实际问题,一个关于用户“是否”在试图控制一扇门的问题,也就是这种“A或否”问题比传统的“A或B”问题要困难得多,因为本发明不能像通常定义“A或B”问题那样定义“否”情况。
[0159] 针对这种“A或否”问题,本发明提出了一种基于重构的意图检测方案,该方案利用重构模型来表示“A”状态,并利用重构误差来确定查询与“A”状态之间的相关性,而不是定义“否”状态。在一个包含55名受试者的大型脑电图数据集上进行了系统的实验,这些受试者想象自己的拳头向左或向右移动。以可能的最大和最小脑电图读数之间的随机值合成数据、眼睛睁开基线任务和眼睛闭上基线任务作为三种“不”情况作为查询片段,验证了所提出的RID方案的可行性。本发明在综合查询片段上表现出了良好的性能,在获取意图执行任务数据时,甚至在获取基线数据的环境中也能获得“基线”查询片段,从而获得具有竞争力的结果。本发明探讨了三种用于运动意图检测的查询策略,即尝试式、记录式和分段式,并且构建了三种不同的重构模型来实现该方案,以显示其对各种重构模型的灵活性。此外,本发明的方案不需要任何人工处理和过深的专业知识。
[0160] 对于这样一个“是否”问题,有许多未来的研究方向。一种是建立两阶段的算法:第一阶段负责回答“是否”试图移动拳头;第二阶段负责回答“哪”试图移动拳头。另一个方向是实现一个真实的意图检测BCI系统,以评估该方案在真实场景中的有效性。
[0161] 1.本发明评估了RID方案在大规模脑电图运动意向数据集上的有效性,该数据集包含55名受试者执行左/右拳打开和关闭运动意向任务的情况,以及两个基线任务(眼睛打开和眼睛关闭)的情况。脑电图数据采用BCI2000仪器采集,具有64个电极通道和160Hz采样率。每名受试者进行大约45次试验(连续的脑电图记录时间段,其中只有一个特定的心理任务被执行),左右拳运动意图的平衡率大致相同。有2347次试验,左拳1179次,右拳1168次。每次试验持续4秒左右,从提示(指示受试者执行某项任务)出现后1秒开始选取数据,直至试验结束,每次试验共完成497个时间步,基线试验期间,受试者眼睛保持睁开或闭上1分钟,无需执行任何心理任务。
[0162] 为了评估意图检测方案,应该使用两种查询片段:
[0163] 1)意向执行查询片段:主体实际执行某一意向任务的查询片段;
[0164] 2)普通的查询片段:一个对象实际上有任何可能的心理状态,但不包括特定的意图的查询片段。
[0165] 然而,建模这样一个“是否”问题最困难的部分是,普通的查询片段可能是许多不同的形式,甚至没有任何关系。此外,人类活动如行走或面部运动对脑电图读数有显著影响。因此,不可能有一组普通的查询片段详尽地定义和建模所有“普通”的心理状态。考虑到上述情况以及脑电图信号由于电性的原因一直存在噪声,本发明建立了综合数据来模拟执行某个运动意图情况中“否”的脑电图读数。利用可能的最大和最小脑电图读数之间的随机值构建合成数据。同时,为了评估建议的RID方案的有效性,数据集中的两个基线任务,即眼睛睁开和眼睛闭上,被用作“否”的特殊状态来执行某种运动意向。因此,本发明测试了三种常见的查询片段和一种执行查询片段的意图:
[0166] 1)综合查询片段:通过随机选择可能的最大和最小脑电图读数之间的值来建立的查询片段;
[0167] 2)睁眼查询片段:使用数据集中的睁眼任务生成的查询片段;
[0168] 3)闭眼查询片段:使用数据集中的闭眼任务生成的查询片段。
[0169] 4)意向执行查询片段:意向执行片段用作查询片段。
[0170] 2.本发明评估了RID方案检测两种运动意图任务:想象左拳和右拳的移动。因此,在训练阶段采用左拳动作意向片段和右拳动作意向片段构建了两种RID方案。一个试图回答“是否想象移动左拳”,另一个试图回答“是否想象移动右拳”。左拳动作意向片段和右拳动作意向片段分别分为两部分:一部分作为训练片段,另一部分作为查询片段。
[0171] 由于一个单独的脑电图试验是一个包含多个脑电图记录/时间步骤的长周期试验,本发明采用三种脑电图数据组织策略(查询策略)来评估RID方案,即试验策略、记录策略和切片策略。
[0172] 1)试验策略
[0173] 本发明使用单独的脑电图试验,每个试验的形状(高度=64,长度=497)作为实例来训练重构模型。高度64对应于64个脑电图通道,而长度是单个脑电图试验中记录时间点的数量。在检测阶段,查询片段也是单独的脑电图试验,形状与用于训练的相同。对于每个评估任务,随机选择90%的意图执行片段测试来训练重构模型,其余10%的测试用作查询片段来评估RID方案。基线任务的记录被切割成相同形状的碎片(高度=64,长度=497),使用滑动窗口方法进行单独试验,无任何重叠。本发明有相同数量的合成片段,包含了意图执行的查询片段。在此策略中,CNN自动编码器被用作自动编码器重构模型。
[0174] 2)记录式策略
[0175] 由于有许多记录,每个记录都是在一个时间点上记录的,所以本发明使用单个记录作为重构模型的输入。因此,将一个脑电图试验分成若干记录向量,每个记录向量有64个元素,对应于64个脑电图通道。考虑到一个脑电图试验可能存在影响评估过程的潜在相似性,同一脑电图试验的记录都被用作训练片段或查询片段。本发明仍然使用90%的随机选择试验进行训练,其余10%的试验进行评估。普通查询片段的处理与训练实例一致。完全连接的自动编码器用作特定的自动编码器重构模型。
[0176] 3)切片式策略
[0177] 与记录策略类似,脑电图试验被分成几个时间片作为感兴趣的时段。具体地说,一个形状(高度=64,长度=497)的脑电图试验被裁剪成18片形状(高度=64,长度=320),使用滑动窗口技术,窗口大小为320,滑动步进为10。本发明仍然在训练阶段或检测阶段使用同一试验的所有切片,以避免相同的试验相似性。基线脑电图记录也使用相同设置的滑动窗口法进行处理。与试验策略相似, CNN自动编码器被用作自动编码器重构模型。
[0178] 表一:左拳:在不同的目的任务、查询策略和重构模型上,普通查询片段对意向执行查询片段的归一化相对平均重构误差。
[0179]
[0180] 表二:右拳:在不同的目的任务、查询策略和重构模型上,普通查询片段对意向执行查询片段的归一化相对平均重构误差。
[0181]
[0182] 3.在两种基于脑电图的运动意向检测中,本发明评估了由子空间投影、自动编码器和稀疏字典学习实现的RID方案的性能。本发明对55名受试者的脑电图数据进行了三种查询策略的系统实验。由于假设值越小,重构误差越大,查询片段与目的的相关性越大,因此本发明使用从普通查询片段到意向执行查询片段的相对平均重构误差来评估所提出方案的检测能力。本发明通过划分执行查询的意图片段的平均重构错误来标准化相对平均错误。
[0183] 标准化相对平均误差(NRME)φrelative定义为:
[0184]
[0185]
[0186] φ°和φi分别是执行查询片段的普通和意向的平均重构误差。总体结果见表1 和表2。结果表明,在所有的查询策略和重构模型下,对于这两个意图任务,三类普通查询片段的平均重构误差总是大于它们对应的意图执行片段的平均重构误差。这表明基于重构的方案具有识别意图执行或普通查询片段的潜在能力,从而可以检测人类意图。合成查询片段的重构误差大约是执行查询片段的意图的15到35倍,这意味着本发明的RID方案在处理噪音大的普通查询片段方面非常强大。与合成查询片段相比,基线查询片段(眼睛闭着或眼睛睁着)与执行查询片段的意图之间的重构误差差异相对较小。这一结果的原因是,意向执行任务和基线任务的脑电图采集情况相似:要求受试者坐在计算机前,在同一时间段内同时执行意向和基线任务,并且不做不必要的身体运动。此外,想象拳头运动主要影响三个脑电图通道“c3、c4和cz”,而其他通道可能与基线任务以类似方式波动。即使有了这种特殊的查询条件,本发明的RID方案仍能够实现30%左右的重构误差的差异。
[0187] 对于左、右拳意图任务,子空间投影重构模型采用分片查询策略,得到了最佳的平均结果。在详细分析时,采用记录式查询策略的子空间投影方法在大多数情况下获得最佳结果,而在其他情况下获得的结果略低于最佳结果。记录式查询策略的实例输入维数较小,为64,而三轴或切片式查询策略的实例维数分别为 64×497和64×320,远大于记录式查询策略的实例维数。这增加了建立一个稳健重构模型的难度。此外,与其他策略相比,记录式策略具有更多的训练实例,也有助于训练更好泛化的重构模型。
[0188] 图3-6描述了两个意图检测任务的详细统计实验结果。归一化相对重构误差的计算方法如下:
[0189]
[0190] 其中ek是第k次实例的重构误差, 是执行查询片段的意图的平均重构误差。
[0191] 如表1和表2所示,合成查询片段的重构误差比执行查询片段的意图的重构误差大一个数量级,所以本发明不将其添加到重构误差分布图中(图3和图5)。
[0192] 结果表明,在所有查询策略和所有重构模型下,相对重构误差分布的最左边部分只出现执行查询的意图片段。这意味着重构模型成功地揭示了训练脑电图信号的基础模式。然而,睁眼和闭眼查询片段在意图执行的查询片段的重构误差分布中获得了很大的重叠部分。这在很大程度上是由于在实施实验以获得不同任务的脑电图数据时的相似情况,导致只有几个脑电图通道以不同的方式工作。在一般情况下,脑电图读数可能是任何可能的值(合成查询片段),表1和表2表明其相对重构误差比执行查询片段的意图的重构误差要大得多。
[0193] 为了作出最终裁定,本发明必须使用一个阈值,来使重构误差小于这个阈值时的查询片段可以被划分为执行某个意图任务,而重构误差大于这个阈值时的查询片段被确定为不执行某个意图任务。本发明使用精确度和召回率来描述本发明在不同阈值下的性能。精确度可以解释为“当脑电图周期被确定为是否执行了某种意图时,它是多么精确”。精确度的值越高,系统的不确定操作就越少,因此系统的可靠性就越高。召回率可以解释为“执行了多个意图,并且可以识别出多少意图”。召回率的值越高,系统就越敏感。因此,准确度和召回率对于构建一个有效、高效的系统都是非常重要的。图4和图6分别显示了左拳和右拳意图任务的平均精确度恢复阈值曲线。结果表明,所有策略和重构模型的精确度都能在较低的阈值下达到100%左右,然后随阈值的增大而下降到随机值的50%。召回率的峰值出现在精确度峰值的右侧。召回率的波动范围很小,从50%到65%不等。
[0194] F1得分是一种既考虑精确度又考虑召回率的评估方法,图7显示了不同查询策略和不同重构模型下具有最优判定阈值的F1得分。结果表明,在精确度和召回率之间进行权衡时,切片式查询策略的结果最好,记录式查询策略的F1得分明显低于其他两种策略。在大多数情况下,基于子空间投影的重构模型提供了最佳的F1分数,而在其他情况下,它也能有较强的竞争性。左拳运动意向检测的最佳F1分数为66.64%,使用子空间投影重构模型和分片查询策略,最佳F1 分数为R。采用子空间投影重构模型,结合试算查询策略,对右拳运动意图检测率为66.38%。在一般情况下,如图8和图9所示,通过任意选择可能的脑电图值,所提出的RID方案在一定的阈值范围内达到了完美的表现。综上所述,子空间投影模型为完美的性能检测提供了更宽的阈值范围。
[0195] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈